0

1
0

文字

分享

0
1
0

在電腦時代,學會當「人」更重要——《打開演算法黑箱》書評

臉譜出版_96
・2019/05/07 ・2549字 ・閱讀時間約 5 分鐘 ・SR值 527 ・七年級

國小高年級科普文,素養閱讀就從今天就開始!!

  • 文/張智皓

「在演算法的年代,人類從未如此刻這般的重要。」——弗萊(Hannah Fry)

圖靈(Alan Turing)在 1936 年提出圖靈機(Turing Machine)的基本構想,人類文明揭開了電腦時代的序幕,並在很短時間內為人類生活帶來了劇烈的變化。上一次有這樣的景況,大概是 17 世紀末蒸汽機的發明,帶領人類文明進入工業時代。

進入工業時代,給人帶來便利同時製造難題。圖/pixabay

這兩個時代有類似之處。蒸汽機讓人開始擔心自己被機械取代:生產模式改變,人力不再重要,生產機器和失業人口大量出現。然而,這種困境並沒有維持太久。新技術讓人失業,也拓展了人的想像力,讓各種新興行業與技術應運而生。這些行業和技術促進產業轉型,反而提高了人力需求,讓人類文明變得更加繁盛。此時,我們知道人類變得比以前更重要。

電腦,或者我們說,演算法,就像是現代的蒸氣機,同樣大幅地改變人類生活模式。在本書中,倫敦大學學院(UCL)先進空間分析中心(CASA)的數學家漢娜弗萊從權力、資料、司法、醫療、車輛、犯罪與藝術這七個面向出發,告訴我們演算法已經如何深入我們日常生活中,為我們帶來前所未見的巨大貢獻,並展現出取代人類的企圖心。

科技帶來便利,但人類始終更了解人類。圖/pixabay

更重要的是,弗萊也透過她細膩的觀察,提醒我們:就如同蒸汽機時代的人類沒有被取代一樣,在演算法時代,人類也只會比以前更重要。

人機合作,讓人類的棋藝再創高峰

讓我們從書中一個輕鬆的例子開始。弗萊告訴我們,在 1997 年,西洋棋世界冠軍卡斯帕洛夫(Gary Kasporov)被 IBM 設計的「深藍」擊敗後,他並沒有因此排斥電腦,反之,他創辦了人類與電腦合作的棋賽。卡斯帕洛夫相信,有了電腦的輔助,人類不再需要花時間在棋盤細節的計算上,而是將心思放在整體戰略上,人機合作,能讓人類的棋藝再創高峰。

這樣的劇情非常類似於 DeepMind 的圍棋軟體 AlphaGo 在 2016 年的創舉。在 AlphaGo 相繼打敗世界冠軍李世乭以及柯潔後,AlphaGo 以及其繼任 AlphaGo Zero 的棋譜變成職業選手們爭相學習的目標。DeepMind 甚至推出 AlphaGo 圍棋教學工具,讓大家學習它的佈局,並進而開發出新的佈局形式。AlphaGo 沒有取代人類棋手,反之,它為圍棋世界注入了新的生命。

兩方交流為圍棋注入新的氛圍。圖/pixabay

演算法無法回答的問題:隱私與安全該如何平衡

接著讓我們談談一個較嚴肅的例子。在本書「犯罪」這一章節中,弗萊提到「臉孔辨識系統」如何對人類產生顯而易見的貢獻。在 2015 年,紐約警察局透過臉孔辨識系統「成功指認了 1700 名嫌犯,並且發動了 900 次逮捕行動。」另外,她也提到從 2010 年以來,紐約州「僅僅針對詐欺和身分盜用就發動了超過四千次逮捕行動。」有了臉孔辨識系統,各大交通運輸管道也可藉恐怖份子資料庫來預防恐怖襲擊(而事實證明這很有用)。

你想要偏向安全,還是隱私?圖/pixabay

作為預防手段,臉孔辨識系統可以有效增進人們生命與財產之安全。但這些好處有其代價。弗萊指出,就連目前全世界最先進的臉孔辨識系統(來自於中國的「騰訊優圖實驗室」),在一百萬張臉孔資料庫的測試中,也只有 83.29% 的辨識率。這在技術上已經令人佩服,但在現實中卻可能釀成大禍。

比方說,2014 年,一位住在丹佛的居民被錯誤辨識為銀行搶匪,並在警察的逮捕過程中「遭受神經損傷、血栓及陰莖折斷。」或許有人會主張,只要技術更好,辨識率更高,問題就解決了。但情況可能沒這麼簡單,辨識率提高的代價是隱私度的下降。試問,我們願意讓「老大哥」看著大家嗎?

臉孔辨識系統有其好處,有其代價。我們願意讓此系統做到甚麼程度?為了安全,我們願意犧牲多大的隱私?而為了隱私,我們又願意犧牲多少安全?這些問題是演算法無法回答的,只有人類可以,因此,人類只會更重要。

演算法兩難:自駕車該拯救駕駛還是行人?

另外一個嚴肅例子,我想談談「車輛」這一章節中的自動駕駛技術。一旦自動駕駛技術普及,將可以大幅減少人為車禍的發生。而我們知道,現代大多數車禍都源於人為。然而,將駕駛工作交給演算法,也意味著將決策的任務交給演算法。當失控的自駕車面臨的選項是「拯救駕駛,還是拯救行人」時,演算法應該如何行動?

當自動駕駛遭遇電車難題,我們又希望它做出什麼選擇?圖/WIKI

弗萊提到,在 2016 年發表於《科學》期刊(Science)的一篇文章指出,多數人主張應該盡可能的拯救更多人命。然而,當詢問他們自身較願意購買哪一款自駕車時,我們可以從賓士汽車發言人胡苟(Christoph von Hugo)的回應(當被問到賓士車會如何設計時),理解他們的猶豫:「保護駕駛。」

這衝突看起來不可調和,我們一方面希望盡可能拯救人命,另一方面又希望可以保障駕駛的安全(否則我幹嘛買它呢?)。在這樣的衝突中,弗萊指出另外一個可能選項:放棄全自動駕駛,將演算法的目標放在輔佐駕駛人上(比方說,現在已有的「自動緊急煞車」或「自動與前車保持距離」等設計)。換言之,演算法不扮演「司機」,而是扮演「守護者」。我們該做的,是讓演算法配合人類,主動性依然在人類手上,因此,人類只會更重要。

自動駕駛的衝突難題。圖/pixabay

在《打開演算法黑箱》中,弗萊透過大量有趣的案例,說明演算法如何深入日常的同時,也提醒我們人類的重要性,這是我認為本書最大的優點。新技術的提出值得受到肯定,然而,在肯定其貢獻的同時,背後所付出代價卻往往會被忽略。本書在闡述新技術的同時,也很平衡地展示這些技術背後的代價。

就如同作者一再強調的,她肯定技術所帶來的好處,但我們必須思考如何在新技術所帶來的進步中,保有人類的主動性,或者說,如何在機器年代中當個人。

 

《打開演算法黑箱》書封

本文為《打開演算法黑箱:反噬的AI、走鐘的運算,當演算法出了錯,人類還能控制它嗎?》書評

文章難易度
臉譜出版_96
64 篇文章 ・ 244 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

1
0

文字

分享

0
1
0
計算機先驅:巴貝奇與他的小型差分計算機——《資訊大歷史》
azothbooks_96
・2022/07/01 ・3045字 ・閱讀時間約 6 分鐘

國小高年級科普文,素養閱讀就從今天就開始!!

查爾斯.巴貝奇

查爾斯.巴貝奇(Charles Babbage),1792 至 1871 年。

1843 年,一位英國數學家提出了分析機原理,這個構思將在一百零三年後由後人付諸實踐,並有了一個為大家熟知的名字——計算機(今日俗稱電腦)。很遺憾,查理斯.巴貝奇終其一生也沒能實現造出分析機的願望,但他依舊是當之無愧的計算機先驅。

直到今天,許多計算機書籍扉頁裡仍然刊載著他的照片,以表紀念。

巴貝奇發明小型差分計算機

一七九二年,巴貝奇出生於倫敦一個富有的銀行家家庭,十八歲進入著名的劍橋大學三一學院,成為牛頓的校友。後來他擔任了牛頓擔任過的「盧卡斯數學教授」職務。在進入大學之前,他就展現出極高的數學天分。

進入大學後,巴貝奇發現,當時英國人普遍接受的牛頓建立在運動基礎之上的微積分,不如萊布尼茨基於符號處理的微積分那樣便於理解和傳播。為了推廣已被歐洲大陸普遍接受的萊布尼茨的微積分,他和其他人一同創辦了英國的(數學)分析學會。

不過巴貝奇並不是一個安分的學生,他一方面顯現出超凡的智力,另一方面又不按照要求完成學業,為此他不得不轉了一個學院,才能繼續學業。在學校裡,他還對很多超自然的現象感興趣。

延伸閱讀:巴貝奇誕辰|科學史上的今天:12/26

如果不是趕上工業革命,巴貝奇或許會尋找某個傳統的數學領域或者自然哲學領域做一輩子研究,並且留下一個巴貝奇定律或者巴貝奇定理。但是,工業革命的大背景,讓他把畢生精力和金錢都投入研究一種能夠處理資訊的機械中。

這也不奇怪,因為工業革命為資訊處理提供了思想上的依據、技術上的條件和廣闊的市場。工業革命是人類歷史上最偉大的事件。它不僅第一次讓人類從此進入可持續發展的時代,也改變了人們的思想。人類從相信神,到今天開始變得自信起來,相信這個世界是確定的、有規律的,而自己能夠發現世界上所有的規律。

早在牛頓時代,著名物理學家玻意耳(Robert Boyle)在總結牛頓等人的科學成就之後,就提出了「機械論」,也被稱為「機械思維」。

提出「機械論」的玻意耳(Robert Boyle)。圖/Wikipedia

玻意耳等人(包括牛頓、哈雷等)認為,世間萬物的規律都可以用機械運動的規律來描述,包括蒸汽機和火車在內的工業革命中那些最重要的發明,都受益於機械思維。人們熱衷於用機械的方法解決問題,從精密的航海導航,到能夠奏樂的音樂盒,再到能織出各種圖案的紡織機。

既然能想到的所有規律都可以用運動規律來描述,那麼就很容易想到讓具有特殊結構的齒輪組運動來完成計算,這便是設計機械計算機的思想基礎。

其實,這種想法早在十七世紀就有人嘗試過。法國數學家帕斯卡(Blaise Pascal)發明了一種手搖計算器——雖然有時人們將它稱為最早的機械計算機,但實際上它和我們今天理解的電腦概念沒有太多相似之處,稱之為「計算器」更為恰當。

帕斯卡計算器從外觀上看有上下兩排旋鈕,每個旋鈕上都刻著○至九這十個數字。在做加減法時,只要將參加運算的兩個數字分別撥到相應的位置,然後轉動手柄,計算器裡的一組組齒輪就會轉動,完成計算。

帕斯卡計算器。圖/Wikipedia

帕斯卡計算器最初只能做加法,後來經過改良, 可以做減法和乘法, 但做不了除法。在帕斯卡之後,萊布尼茨改良了計算器。他發明了一種以他名字命名的轉輪「萊布尼茨輪」,方便實現四則運算中的進位和借位。

到了十九世紀初,經過近兩個世紀的改進,機械計算器已經能夠完成四則運算,但是計算速度很慢,精度也不夠高,而且設備造價昂貴。不過,這種計算器更大的缺陷在於,對於複雜的運算(比如對數運算和三角函數運算)都做不到。

十九世紀機械工業的發展需要進行大量的複雜計算,比如三角函數的計算、指數和對數的計算等。在微積分出現之前,完成這些函數的計算是幾乎不可能的事。

十八世紀之後,歐洲數學家用微積分找到了很多計算上述函數的近似方法,不過這些方法的計算量極大,需要很長的時間,而且當時除了數學家,一般人是完成不了那些計算的。為了便於工程師在工程中和設計時完成各種計算,數學家設計了數學用表,如此一來工程師就可以從表中直接查出計算的結果。

不過,那個時代的數學用表錯誤百出,為生產和科學研究帶來了很多麻煩。而這個問題很難避免,因為手算很難保證完全不出錯。如果很多數學家分別獨立計算,還可以比對結果發現錯誤。但是巴貝奇發現,那些不同版本的數學用表都是抄來抄去,而犯的錯也都一樣。

因此,巴貝奇想設計一種機械來完成微積分的計算,然後用它來計算各種函數值,得到一份可靠的數學用表。當時他只有二十二歲。

延伸閱讀:兩艘軍艦換不到兩噸重的計算機?巴貝奇與差分機|《電腦簡史》 齒輪時代(十八)

在隨後的十年裡,巴貝奇造出來一台有六位精度(巴貝奇最初的目標是達到八位精度)的小型差分計算機。隨後巴貝奇用它算出了好幾種函數表,用於解決航海、機械和天文方面的計算問題。

值得指出的是,巴貝奇的這次成功受益於工業革命的成就——當時機械加工的精度比瓦特時代已經高出了很多,這讓巴貝奇能夠加工出各種尺寸獨特的齒輪。

但是,當時並沒有二十世紀的精密加工技術,製造小批量特製齒輪和機械部件的成本高、難度大,這給巴貝奇後來的工作帶來了諸多不便。

巴貝奇小型差分計算機的部分模組。圖/Wikipedia

不過,首次成功還是讓巴貝奇獲得了英國政府的資助,用以打造一台精度高達二十位的計算機。

幾年後,他又獲得了劍橋大學盧卡斯數學教授的職位,讓他有了穩定的收入。在此之前,他一直在花自己繼承的十萬英鎊遺產。勝利女神似乎正向他招手,但接下來的時日,他在計算機研究方面一籌莫展。

從表面上看,巴貝奇遇到的困難是因為那台差分機太複雜了,裡面有包括上萬個齒輪的二點五萬個零件,當時的加工水準根本無法製造。但更本質的原因是,巴貝奇並不真正理解計算的原理。他不懂得對於複雜的計算來說,不是要把機器做得更複雜,而是要用簡單的計算單元來實現複雜的計算。

當然,在那個年代沒有人瞭解這些。作為現代計算機基礎理論的布林代數要再等十幾年才會被提出來,而且要再過近一個世紀,才會被應用到計算技術中。

後人根據巴貝奇的設計打造而成的差分機。圖/Wikipedia

——本文摘自《資訊大歷史:人類如何消除對未知的不確定》,2022 年 6 月,漫遊者文化,未經同意請勿轉載。

azothbooks_96
38 篇文章 ・ 12 位粉絲
漫遊也許有原因,卻沒有目的。 漫遊者的原因就是自由。文學、人文、藝術、商業、學習、生活雜學,以及問題解決的實用學,這些都是「漫遊者」的範疇,「漫遊者」希望在其中找到未來的閱讀形式,尋找新的面貌,為出版文化找尋新風景。

2

2
1

文字

分享

2
2
1
如何選擇「基因交友軟體」?——影集《真愛基因》的現實
胡中行_96
・2022/06/27 ・4916字 ・閱讀時間約 10 分鐘

「身為交友軟體公司的執行長,用自家服務找對象並不道德,可是我偶爾會做市場調查,所以手機裡下載了 20 個同行的產品。當我打開其一,便收到一個月前,某位友善男士的來訊。內容實在迷人,可惜他整頭紅髮……」幸好見面之後,一拍即合。她徵求對方的同意,採集其口腔的 DNA 樣本,進而得知他們擁有最頂尖 10% 的相容性。「我從不想要紅髮伴侶,認為自己不會喜歡,但其實我超愛。……,這都在你的 DNA 裡。」[1]

  

影集《真愛基因》中的基因配對廣告:「接受檢測,找到真愛」。圖/IMDB

  

Netflix 影集《真愛基因》

Netflix 影集《真愛基因》(The One)講述科學家發現有一種 DNA 檢測,可以找到完美伴侶,於是數百萬人踴躍嘗試。以此營利的媒合公司執行長,卻在事業愛情兩得意之際,捲入一場謀殺案……。[2][3]

話說回來,本文第一段引述的並不是影集劇情,而是美國交友網站 Pheramor 的共同創辦人兼執行長,接受德州醫療中心(Texas Medical Center)專訪時的自白。[1]

  

您的手機裡,裝有哪些交友軟體?圖/Pratik Gupta

  

真實的基因配對業者

影集《真愛基因》於 2021 年上映,然而在更早之前,就已經有業者開始提供類似的服務。以下是幾個知名的例子:

DNA Romance 的口腔 DNA 採集套件。圖/參考資料 11

  

基因配對的原理與目的

在考慮註冊一般交友軟體或網站的帳號之前,我們由最基本的動機,例如:純交友、約砲、短期約會、長期戀愛,甚至是以婚姻為前提交往等,搜尋適合的平台。選擇基因配對服務時,想清楚使用的目的,同樣也是首要之務。同時,最好瞭解這些檢測的功能,是否符合您的需求。有鑑於業界廣告的項目繁多,單一基因觸及的層面也相當複雜,以下只簡單說明其中一小部份:

  • 人類白血球抗原(human leukocyte antigens,HLA),即人類的主要組織相容性複合體(major histocompatibility complex,MHC):[15]1995 年瑞士 Claus Wedekind 教授等人,發現動物身上的MHC,會影響體現免疫特質的體味。排除避孕藥干擾的情形下,女人喜愛的味道,通常屬於與自己 HLA 差異較大的男人。[16]2016 年的德國研究,認為 HLA 相異者的結合,能帶來令人滿意的關係和性愛,以及強健的子代[15]不過,2020 年另一群德國科學家檢視 3,691 對情侶後,覺得 HLA 對人類求偶的實際作用甚微。[17]
  • 血清素轉運體(serotonin transporter,SERT基因:編寫蛋白質 SERT 的基因變異體 5-HTTLPR,[18]是調節神經系統中血清素濃度的關鍵,與情緒控管有關[19]
  • 催產素受體基因(oxytocin receptor gene):這種基因有幾個不同的類型,2019 年的美國研究指出,GG 基因型的人合群、有同情心,且情緒穩定。他們或他們的伴侶,比 AA 或 AG 基因型婚姻滿意度高[20]
  • 多巴胺受體基因(dopamine receptor gene)DRD4:多巴胺帶給人愉悅感,但相應受體遲鈍的 DRD4 7R+ 基因型,必須要更大的刺激,才能達到相同效果。[21] 2010 年美國研究 DRD4 的論文指出,相較於 7R-,屬於 7R+ 者,傾向從事一夜情、出軌等高風險的行為,因而有旺盛的繁殖力,且容易繁衍多元的子代。[22]
  • 兒茶酚-O-甲基轉移酶基因COMT gene):COMT 基因若異常,會提高某些精神疾病的風險。[23]2019 年的德國研究顯示 COMT 基因的不同類型,會導致情緒辨識表現的差別。與 Val/Val 相比,有 Met/Met 和 Met/Val 基因型的人,能更準確的辨識負面情緒。因此,遇到負面的社交經驗時,也更輕易地陷入焦慮或憂傷的情緒。[24]
  • 單核苷酸多態性(single-nucleotide polymorphism,SNP):SNP 是指 DNA 序列中的變異,可以用來尋找致病基因和療法、做親子鑑定,或是瞭解族群的演化等。目前科學界已知約 400 萬個 SNP,[25]如果交友網站沒說要驗哪些,其實算是過度籠統。

值得注意的是,許多現有的相關研究均以順性別異性戀為主,所以對性少數的族群而言,未必有參考價值。Instant Chemistry 為此展開大型研究,正在招募後者參加。[6]

  

《真愛基因》劇照:如果已經有伴侶了,您還會想做基因檢測嗎?圖/參考資料 3

  

基因在戀愛中的角色

除了正在尋覓另一半的單身人士,Instant Chemistry 更鼓勵情侶們購買雙人檢驗套組,說是有助於解決兩人對關係的不滿。[6]影集《真愛基因》的原著小說《命定之人》(The One)裡,就有這麼一個經典的橋段:「如果我們的 DNA 結果不合,怎麼辦?」「那就要留心,或許我們得為戀情更加把勁。就像約翰.藍儂說的,『你只需要愛』。」「對,可是他也說過『我是海象』,所以咱們還是別太相信他智慧的箴言。」[26][註1]

想去驗基因的伴侶,是不是早就對感情缺乏信心?若是心中的芥蒂被科學驗證了,又該如何面對?

換個角度來說,這可能要看兩人不合的基因,是關乎哪個面向。比方,美劇《宅男行不行》(The Big Bang Theory)裡,不用驗也知道大難臨頭的 Amy,以反諷的口吻抱怨:「噢,當然,因為 Sheldon 跟我的 DNA 加起來,會等於一個曉得怎麼交朋友的孩子。成熟點!」[27]憂慮子代基因無法適應社會的心情,擺在生育意願超低的臺灣,不僅很難激起觀眾共鳴,應該也不太會動搖已經成形的交往關係。

但,要是基因檢測,還有其他風險呢?

  

Michael Connelly 的小說《Fair Warning》,點出基因檢測的風險。圖/參考資料 28

  

基因資訊的隱私疑慮

「你知道今年五角大廈叫所有軍人,不准使用 DNA 試劑,因為那會造成國安問題嗎?」曾任記者的知名美國作家 Michael Connelly,在 2020 年出版的虛構小說《合理警告》(Fair Warning;暫譯)裡,[註2]描述真實世界可能上演的基因隱私危機。「骯髒四號。有些遺傳學家這麼稱呼 DRD4。」故事中,有心人士從盜用的基因資料,斷定哪些女性水性楊花,然後跟蹤並殺害她們。[28]當原本屬於隱私的個人資訊被交予私人企業,以獲取服務,消費者究竟能得到多少法律的保障?

根據 Michael Connelly 的調查,目前美國食品藥物管理局(Food and Drug Administration,FDA)尚且無法有效規範基因資料的蒐集與運用。[28][29]DNA Romance 強調他們遵守美國《健康保險攜帶和責任法案》(Health Insurance Portability and Accountability Act,HIPAA)的隱私準則,而且不會把使用者個資賣給第三方。[11]

可是美國國家人類基因組研究所(National Human Genome Research Institute)坦承:「雖然很多公司設有健全的隱私及知情同意政策,但沒有聯邦法律能禁止他們將個人的基因資訊提供給第三方。[30]

  

臺灣的基因隱私保障

科技部 2021 年的《科技魅癮》數位季刊,曾探討臺灣與美國在基因法規方面的異同。[31]比起美國允許某些科學研究不經當事人同意,就能使用去識別化的基因資訊;[30][31]臺灣的規範較為嚴謹,卻也因阻礙科技發展而為人詬病。[31]基因檢測等相關科技,是一個仍在不斷演進的領域。

我們一來不能光看基因就認識一個人的特質,畢竟後天環境也是造就人格和生理條件的重要因素;二來在研究還未成熟的階段,對檢測的解讀必有其侷限。另外,還得注意檢測單位是否遵循當地法規,以保障消費者權益。萬一不小心,資料外洩或是驗出個本來不曉得的基因缺陷,當事人受到的打擊,說不定會比失戀還嚴峻。

總之,基因檢測是潘朵拉的盒子。一旦勇敢嘗試,便如同 Michael Connelly 書中所言:「你的 DNA 可以開啟任何事物,從此秘密再也不是秘密了。[28]

  

備註

  1. 影集《真愛基因》和原著小說《命定之人》的原文名稱都叫做「The One」。本文引述的段落是由筆者自行翻譯,所以可能與目前通行的繁體中文版用字略有出入。
  2. Michael Connelly 小說改編的作品中,較為臺灣人所知的,大概是電影《下流正義》(The Lincoln Lawyer)和影集《絕命警探》(Bosch)。至於《Fair Warning》,目前好像沒有中文譯本。

參考資料

  1. Dating app taps genetics and social media (Texas Medical Center, 2019)
  2. The One (Netflix, 2021)
  3. The One (IMDB, 2021)
  4. GenePartner (2022)
  5. Instant Chemistry (LinkedIn, 2022)
  6. Instant Chemistry (2022)
  7. SingldOut (Crunchbase, 2022)
  8. This Online Dating Site Thinks It Can Match You Based On Your DNA (Business Insider, 2014)
  9. How Identity Evolves in the Age of Genetic Imperialism (Scientific American, 2015)
  10. DNA Romance (LinkedIn, 2022)
  11. DNA Romance (2022)
  12. Nozze (2022)
  13. The Illusion of Genetic Romance (Scientific American, 2020)
  14. Pheramor (Facebook, 2019)
  15. Kromer J, Hummel T, Pietrowski D, Giani AS, et al. (2016) ‘Influence of HLA on human partnership and sexual satisfaction’ Scientific Reports, 6: 32550.
  16. Wedekind C, Seebeck T, Bettens F, and Paepke AJ. (1995) ‘MHC-dependent mate preferences in humans’ Biological Sciences, 260: 1359, pp. 245 -249.
  17. Croy I, Ritschel G, Kreßner-Kiel D, Schäfer L, et al. (2020) ‘Marriage does not relate to major histocompatibility complex: a genetic analysis based on 3691 couples’. Biological Sciences, 287: 1936.
  18. serotonin transporter (SERT) (APA Dictionary of Psychiatry, 2022)
  19. Cao H, Harneit A, Walter H, et al. (2018) ‘The 5-HTTLPR Polymorphism Affects Network-Based Functional Connectivity in the Visual-Limbic System in Healthy Adults’. Neuropsychopharmacology, 43, pp. 406–414.
  20. Monin JK, Goktas SO, Kershaw T, DeWan A. (2019) ‘Associations between spouses’ oxytocin receptor gene polymorphism, attachment security, and marital satisfaction’. PLOS One, 14 (2): e0213083.
  21. Muda R, Kicia M, Michalak-Wojnowska M, Ginszt M, et al. (2018) ‘The Dopamine Receptor D4 Gene (DRD4) and Financial Risk-Taking: Stimulating and Instrumental Risk-Taking Propensity and Motivation to Engage in Investment Activity’. Behavioral Neuroscience, 12: 34.
  22. Garcia JR, MacKillop J, Aller EL, et al. (2010) ‘Associations between Dopamine D4 Receptor Gene Variation with Both Infidelity and Sexual Promiscuity’. PLOS One, 5(11): e14162.
  23. COMT gene (APA Dictionary of Psychiatry, 2022)
  24. Lischke A, Pahnke R, König J, Homuth G, et al. (2019) ‘COMTVal158Met Genotype Affects Complex Emotion Recognition in Healthy Men and Women’. Frontiers in Neuroscience, 12:1007.
  25. single_nucleotide_polymorphism_snp (國立中正大學生物資訊實驗室,2014)
  26. John Marrs. (2020) Chapter 9. ‘The One: Now a major Netflix series!’ USA: Random House.
  27. Big Bang Theory Quote 11016 (The Big Bang Theory)
  28. Michael Connelly. (2020) ‘Fair Warning‘. USA: Little Brown and Company.
  29. Beautiful Places to Die (The New York Times, 2020)
  30. Privacy in Genomics (National Human Genome Research Institute, 2021)
  31. 【個人vs.社會】基因檢測如打開潘朵拉盒子?隱私權成為重要問題!(科技魅癮,2021)
所有討論 2
胡中行_96
48 篇文章 ・ 16 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

4
3

文字

分享

0
4
3
從「工人智慧」到「人工智慧」——《普林斯頓最熱門的電腦通識課》
商業周刊
・2022/03/13 ・3569字 ・閱讀時間約 7 分鐘

國小高年級科普文,素養閱讀就從今天就開始!!

  • 作者/ 布萊恩·柯尼罕( Brian W. Kernighan)
  • 譯者/ 李芳齡

人工智慧的開端

在電腦發展之初的二十世紀中期,人們開始思考可以如何用電腦來執行通常只有人類才能做到的事情,一個明顯的目標是玩西洋跳棋和西洋棋之類的棋盤遊戲,因為這領域有個優點,那就是有完全明確的規則,並有一大群感興趣且有資格稱為專家的人。

另一個目標是把一種語言翻譯成另一種語言,這顯然困難得多,但更為重要,例如,在冷戰時期,從俄文到英文的機器翻譯是很要緊的事。其他的應用包括語音辨識與生成,數學與邏輯推理,做決策,及學習過程。

這些主題的研究很容易取得資助,通常是來自美國國防部之類的政府機構。我們已經在前文中看到,美國國防部對早期網路研究的資助有多珍貴,它引領出網際網路的發展。人工智慧的研究也同樣受到激勵及慷慨資助。

我認為,把 1950 年代及 1960 年代的人工智慧研究形容為「天真的樂觀」,應該是公允的。當時的科學家覺得突破就快到來,再過個五或十年,電腦就能正確地翻譯語言,在西洋棋比賽中擊敗最優的人類棋手。

我當時只是個大學生,但我著迷於這個領域和潛在成果,大四時的畢業論文就以人工智慧為主題。可惜,那篇論文早已被我搞丟了,我也想不起當年的我是否也抱持相同於當時普遍的樂觀態度。

但是,事實證明,幾乎每個人工智慧的應用領域都遠比設想的要困難得多,「再過個五或十年」總是一次又一次被端出來。成果很貧乏,資金用罄了,這領域休耕了一、二十年,那段期間被稱為「人工智慧之冬」。

網際網路發展成未來趨勢。圖/Pexels

把專家的判斷規則,直接寫成一堆判斷式的「工人智慧」階段

到了 1980 年代和1990年代,這個領域開始用一種不同的方法復耕了,這方法名為專家系統(expert systems)或規則式系統(rule-based systems)。

專家系統是由領域專家寫出很多規則,程式設計師把這些規則轉化為程式,讓電腦應用它們來執行某個工作。醫療診斷系統就是一個著名的應用領域,醫生制定研判一名病患有何問題的規則,讓程式去執行診斷、支援、補充,或理論上甚至取代醫生。

MYCIN 系統是早期的一個例子,用於診斷血液感染,它使用約 600 條規則,成效至少跟一般醫生一樣好。這系統是由專家系統先驅愛德華.費根鮑姆(Edward Feigenbaum)發展出來的,他因為在人工智慧領域的貢獻,於 1994 年獲頒圖靈獎。

專家系統有一些實質性的成功,包括顧客支援系統、機械維修系統以及其他焦點領域,但最終看來也有重大限制。

實務上,難以彙集一套完整的規則,而且有太多例外情況。這種方法未順利擴大應用於大量主題或新問題領域,需要隨著情況變化或了解的改進,更新規則,舉例而言,想想看,在 2020 年遇上一名體溫升高、喉嚨痛、劇烈咳嗽的病患時,診斷規則該如何改變?這些原本是一般感冒的症狀,或許有輕微的併發症,但很可能是新冠肺炎,具有高傳染性,且對病患本身及醫療人員都非常危險。

擺脫「工人智慧」,讓電腦能自學——機器學習的基本概念

機器學習的基本概念是對一種演算法給予大量的例子,讓它自行學習,不給它一套規則,也不明確地編程讓它去解決特定問題。

最簡單的形式是,我們為程式提供一個標記了正確值的訓練集(training set),例如,我們不試圖建立如何辨識手寫數字的規則,而是用一個大樣本的手寫數字去訓練一套學習演算法,我們對每個訓練資料標記其數值,這演算法使用它在辨識訓練資料時的成功及失敗來學習如何結合這些訓練資料的特徵,得出最佳辨識結果。

當然,所謂的「最佳」,並不是確定的:機器學習演算法盡力去提高得出好結果的機率,但不保證完美。訓練之後,演算法根據它從訓練集學到的,對新的資料進行分類,或是預測它們的值。

監督式學習——人類教電腦看見特徵,由演算法來算出規則

使用有標記的資料(labeled data/tagged data)來學習,此稱為監督式學習(supervised learning)。大多數監督式學習演算法有一個共通的架構,它們處理大量標記了正確類別(正確值)的例子,例如,這文本是不是垃圾郵件,或者,這照片中的動物是哪種動物,或者,一棟房子的可能價格。演算法根據這個訓練集,研判能讓它得出最佳分類或做出最佳預測的參數值;其實就是讓它學習如何從例子做出推斷。

我們仍然得告訴演算法,哪些「特徵」能幫助做出正確研判,但我們不對這些特徵給予權值或把它們結合起來。舉例而言,若我們試圖訓練演算法去過濾郵件,我們需要與垃圾郵件內容有關的特徵,例如類似郵件用詞(「免費!」)、已知的垃圾郵件主題、怪異字符、拼字錯誤、不正確的文法等等。

這些特徵單獨來看,並不能研判一份郵件就是垃圾郵件,但給予足夠的標記資料,演算法就能開始區別垃圾郵件與非垃圾郵件——至少,在濫發垃圾郵件者做出進一步調整之前,這演算法具有此過濾成效。

手寫數字辨識是一個眾所周知的問題,美國國家標準與技術研究院(National Institute of Standards and Technology,NIST)提供一公開測試組,有 60,000 個訓練圖像集和 10,000 個測試圖像集,<圖表>是其中一個小樣本。機器學習系統對此資料的辨識成效很好,在公開競賽中,錯誤率低於 0.25%,亦即平均 400 個字符中只有一個錯誤。

機器學習演算法可能因種種因素而失敗,例如,「過度擬合」(over-fitting),演算法對其訓練資料的表現很好,但對新資料的表現遠遠較差。或者,我們可能沒有足夠的訓練資料,或是我們提供了錯誤的特徵集,或者,演算法產生的結果可能確證了訓練集內含偏誤。

這在刑事司法應用系統(例如判刑或預測再犯)中是特別敏感的問題,但在使用演算法來對人們做出研判的任何情況,也會造成問題,例如信用評等、房貸申請、履歷表篩選。

垃圾郵件偵測及數位辨識系統是分類型演算法(classification algorithms)的例子:對資料項做出正確分類。

預測型演算法(prediction algorithms)則是試圖預測一數值,例如房子價格、運動比賽得分、股市趨勢。

舉例而言,我們可能試圖根據位置、年齡、客廳面積與房間數等主要特徵來預測房子價格,更複雜的模型——例如 Zillow 使用的模型——會加入其他特徵,例如相似房屋之前的售價、社區特色、房地產稅、當地學校素質。

非監督式學習——讓電腦自己找出特徵與規則

不同於監視式學習,非監督式學習(unsupervised learning)使用未加入標記的訓練資料,亦即沒有對資料加上任何標記或標籤。非監督式學習演算法試圖在資料中找出型態或結構,根據資料項的特徵,把它們分組。有一種盛行的演算法名為「k 群集分析」(k-means clustering),演算法盡力把資料分成 k 群,讓每一群中的資料項相似性最大化,並且各群之間的相似性最小化。

舉例而言,為研判文件的作者,我們可能假設有兩名作者,我們選擇可能的關聯性特徵,例如句子的長度、詞彙量、標點符號風格等等,然後讓分群演算法(clustering algorithm)盡它所能地把文件區分成兩群。

非監督式學習也適用於在一群資料項中辨識離群項(outliers),若大多數資料項以某種明顯方式群集,但有一些資料項不能如此群集,可能代表必須進一步檢視這些資料項。

舉例而言,設若<圖表>中的人工資料代表信用卡使用情形的某個層面,多數資料點分別群集於兩大群之一,但有一些資料點無法群集於這兩群中的任何一群,或許,這些資料點沒什麼問題——群集分析不需要做到完美,但它們也可能是詐欺或錯誤的情況。

群集分析以辨識異常值。圖/普林斯頓最熱門的電腦通識課

非監督式學習的優點是不需要做可能滿花錢的訓練資料標記工作,但它不能應用於所有情況。使用非監督式學習,必須思考出與各群集相關的一些可用的特徵,當然,對於可能有多少個分群,也需有一個起碼的概念。

我曾經做過一個實驗,使用一個標準的 k 群集分析演算法來把約 5,000 個臉孔影像區分為兩群,我天真地期望這演算法或許能區分出性別。結果是,它的正確率約 90%,我不知道它是根據什麼來下結論的,我也無法從那些錯誤的情況中看出什麼明顯型態。

——摘自《普林斯頓最熱門的電腦通識課》,2022 年 2 月,商業周刊

商業周刊
9 篇文章 ・ 3 位粉絲