1

0
0

文字

分享

1
0
0

書到底會不會暢銷?靠電腦來「占卜」一下—《暢銷書密碼》

PanSci_96
・2016/12/06 ・3659字 ・閱讀時間約 7 分鐘 ・SR值 518 ・六年級

-----廣告,請繼續往下閱讀-----

電腦當然不會閱讀,至少和你閱讀本書的方式很不一樣。不過電腦可以用處理程式語言的方法讀書,它們先「看書」(也就是先接收資料),再把資料區分為人類所謂的意義單元,像是字母、標點、字詞、句子和章節等。所以電腦的確能模仿人類閱讀,而且訓練過程愈嚴謹,理解程度就愈擬真。而人類讀者和機器讀者的差別在於,人類知道他們閱讀的內容有意義。話雖如此,電腦的閱讀方法卻能讓我們更接近小說描繪的細節,就連閱書無數的文評也甘拜下風。那是因為電腦擅長辨識模式,而且可以大規模處理模式和細節,但人類卻沒有辦法做到。

4902216441_a1aa1f7af7_z
電腦可以用處理程式語言的方法讀書,也就是先接收資料,再把資料區分為人類所謂的意義單元。圖 / By Katy Tresedder @ flickr, CC BY-NC-ND 2.0

大家想想我們的研究初衷:暢銷書到底能不能預測?想做預測,就要先剖析過去重複發生的模式。除非你會占卜,否則預測未來靠的是熟悉歷史。一般來說,在字裡行間尋找有意義的模式是文評或學者的工作。著有《千面英雄》的神話學者坎伯,傾其一生研讀世界各地的故事,還刻意訓練他的眼睛去辨識這些故事的相似之處。他可是辨認模式的大師,但儘管如此,一個人一輩子能做的終究有限,不論是閱讀的數量或觀察的細膩程度。辨認模式既要看微觀的細節,也要看宏觀的趨勢,而人類在這兩個面向都有規模上的限制。

我們也很佩服克里斯多福.布可的毅力。他花費三十年、閱讀數百本書,就是為了發展他的理論:所有文學作品和故事都脫不了七種基本情節。或許他花了四十年、讀了一千本書,又或許他比我們都還會記憶書中內容。但幾部經過訓練的電腦,可以在一天之內就讀完數千本小說,消化完數千筆資料,而且絲毫不放過人類可能會忽略或習以為常的各種細節。

舉個例子吧。我們在閱讀的時候,尤其是受過訓練、擅長捕捉細節的讀者,都會注意到作者使用了哪些形容詞。但我們大概不會注意到名詞和形容詞之間的比例,這個比例代表了作者有多常使用形容詞去描述一個名詞。電腦可以輕易找出這種資訊,讓我們更清楚作者的敘事方式與風格。電腦不僅可以縝密搜索,還可以比較這本書和另外上千本書的差異。如果電腦發現暢銷書裡形容詞與名詞的比例偏高或偏低,那這個寫作特徵就很重要了。

-----廣告,請繼續往下閱讀-----

下次你找書來看的時候,不妨做個實驗,別管朋友的推薦也不要執著於熟悉的作者和類型,試著連續一週都只看《紐約時報》暢銷榜上的書。如果你讀得夠仔細,你就會變得有點像我們的電腦,不論是文學作品或大眾讀物、男性書籍或女性書籍、明星作家的小說或普立茲獎得獎作品,你都能開始看出各種書籍之間意外的共同模式。

有些模式可能會讓你很驚訝,譬如說,你會納悶為什麼女主角通常都是二十八歲。這重要嗎?你可能會問自己:如果一本小說長達 400 頁,作者是不是刻意把第一場床戲安排在第 200 頁?如果全書只有 220 頁,那第一場床戲則會落在第 110 頁。如果真是這樣,為什麼?你可能會和朋友討論,小說若有一個吸引人的開頭卻沒有一個讓人滿意的結局,銷量會不會受到影響?搞不好你還會覺得這些分屬不同類型的暢銷書有太多潛在的共同點了,根本可以自成一派。

有趣的是,讀者在不知不覺中對這些模式很有感覺。「文學神經科學」是一門新興的研究領域,學者利用核磁共振來掃描測試對象在閱讀時的腦部活動。這項認知心理學的研究是為了瞭解讀者閱讀的時候都在注意什麼。儘管這和我們的方法差很多,但兩種方法都認為,人類對讀物的反應來自於哪些字、用哪種方式排列、出現在哪些句子裡。是字句的組合觸發了讀者的反應。

因此,讓電腦閱讀小說的技術一點也不反傳統,並沒有違背我們慣用的文評方法。事實上,電腦可以「觀察入微」,對各種寫作特徵進行擷取分析,這和傳統研究所使用的方法大同小異。只不過,電腦讓我們有機會從文本當中挖掘出前所未見的深入洞見。

-----廣告,請繼續往下閱讀-----

教電腦閱讀與擷取資訊的方法很多。我們寫了各種程式和演算法,可以從書裡擷取詳細資訊,包括每一本書的風格、主題、人物、情緒起伏、場景設定,還有各式各樣看似無關緊要又難以歸類的語言資訊。

寫作書和小說課都經常到小說的幾個重要元素,如主題、情節、寫作風格等,若要從這些面向來分析暢銷書,電腦就需要數百種原始資料,比方說,作者用了多少次的「a」、「the」、「in」和「she」?句號和驚嘆號出現的頻率為何?作者多常用到副詞,使用得是否準確?這些微小細節其實對讀者影響頗大。想想夏綠蒂.勃朗特在《簡愛》裡的這句話,就可以看出代名詞有多重要:

讀者,我嫁給他了。

電腦偵測到「他」這個字,也注意到「他」和敘事者「我」在句子裡靠得很近。此外,電腦也發現「我」和「他」在愈來愈多句子裡同時出現,而且彼此間的距離愈來愈近。當然,讀者也會注意到這件事。許多故事的重點不就是要讓「我」和「他」在一起嗎?要把兩者連在一起的最佳動詞不就是「嫁給」嗎?往往,這就是讓我們一頁又一頁不停讀下去的理由。

9300068725_043a5771e5_z
夏綠蒂.勃朗特在《簡愛》。圖 / By Berenice @ flickr, CC BY-NC 2.0

問號和驚嘆號也提供我們很多資訊。但你可能記得高中老師教過,驚嘆號用得愈少愈好。如果每個句子都在尖叫(我的天!),或每句對話都是命令(不准動!),或嘶喊(啊!),或一直發現夜裡不寧靜(砰!),那你的讀者可能會心臟無力。驚嘆號的使用可以讓我們看出一本小說的聳動程度以及作者的寫作功力。同樣道理,出現問號常常表示有對話發生,如果一連串的敘述文字好幾頁都沒有出現問號,會讓讀者閱讀的速度和興致都降下來。而這些屬於作者個人風格的微妙寫作習慣,都會在第四章討論到。

-----廣告,請繼續往下閱讀-----

我們剛開始研究的時候,擷取了超過 20,000 種寫作特徵,驚嘆號和「他」只是其中的兩個。我們每一種都認真研究,有些特徵讓我們看出風格,有些讓我們更理解情節和故事設定,還有一些讓我們瞭解小說的題材。但並非所有特徵都可以用來判斷小說的暢銷指數;有的小說甫上市即銷售一空,有的小說即便寫得很好,卻銷售平平,到底差異何在?

我們發現,數字的使用不太會影響銷售成績,例如 911、1984、867-5309、$1,000,000。作者在小說裡有沒有用到數字,或使用數字的頻率高低,都不會造成影響。同樣地,我們花了很多時間,訓練電腦準確判斷《穿著 Prada 的惡魔》場景設在紐約,《控制》則是從紐約開始,最後到了密蘇里。但其實地理場景設定對銷量的影響也不大(除了少數例外),以紐約為背景的冷門書和暢銷書一樣多。當然,有很多超級暢銷書都是以紐約為背景,隨便舉幾個例子就包括了希維雅.黛的《謎情柯洛斯 I:坦誠》、湯姆.沃爾夫的《走夜路的男人》、詹姆斯.派特森的《匆忙》以及薩佛蘭.佛爾的《心靈鑰匙》,但這些都只是剛好,寫紐約不見得真的會大賣。

到最後,我們去蕪存菁,從 20,000 種寫作特徵中篩選出 2,800 種,這些特徵對於小說暢銷程度有較顯著的影響。我們在訓練電腦閱讀並擷取寫作特徵之後,又用另一套電腦程式來分析暢銷小說潛在的共通模式。我們在分析階段所使用的方法稱做「機器學習」。在文字探勘的領域裡,我們往往利用文本之間的相似處來做分類。舉例來說,我們想分辨垃圾郵件和一般郵件,而通常垃圾郵件都有些共同點,像錯別字、商品名稱不斷出現等,我們便可依此寫出一套程式來檢測一封電子郵件是不是垃圾信。

15274871357_e048126b58_z
垃圾郵件都有些共同點,像錯別字、商品名稱不斷出現等,我們便可依此寫出一套程式來檢測一封電子郵件是不是垃圾信。圖 / By Judith E. Bell @ flickr, CC BY-SA 2.0

我們將小說分類的方法其實和過濾電子郵件很類似。假設我們想預測一本沒有看過的新書會不會暢銷,而我們已經握有很多暢銷書(非垃圾郵件)和冷門書(垃圾郵件),我們就可以把這些書都匯入電腦,並訓練電腦根據顯著的寫作特徵去辨識這兩種書籍。我們在做的就是這些事。我們用了三種不同的分類方法,最後把結果平均起來,發現電腦不但可以預測一本新書能否暢銷,準確度還高達八成。

-----廣告,請繼續往下閱讀-----

1124-%e6%9a%a2%e9%8a%b7%e6%9b%b8%e5%af%86%e7%a2%bc-%e6%ad%a3%e5%b0%81300

 

本文摘自《暢銷書密碼:人工智慧帶我們重新理解小說創作》,雲夢千里出版。

文章難易度
所有討論 1
PanSci_96
1219 篇文章 ・ 2184 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

5
2

文字

分享

0
5
2
植物口渴就喊:「啵、啵、啵~」
胡中行_96
・2023/04/06 ・2954字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

久旱不雨,植物悲鳴,[1, 2]類似教育部《臺灣閩南語常用詞辭典》所謂「因飢餓而吵鬧」的「哭枵」(khàu-iau)。[3]別問為何沒聽過,也不怪天地寡情,人類無義,從來漠不關心。植物叫那種超音波,傳至咱們耳裡就只剩寧靜。幸好靠著以色列科學家幫忙,轉換到常人的聽覺範圍,並分享於 2023 年 3 月底的《細胞》(Cell)期刊,才廣為周知。[1]

轉換到人類聽力範圍的番茄「叫聲」。音/參考資料 1,Audio S1(CC BY 4.0)

傾聽植物的聲音

面臨乾旱或草食動物的威脅,植物會做出多種反應,例如:改變外貌,或是以揮發性有機化合物影響鄰居等。[1]過去的文獻指出,缺水引發空蝕現象(cavitation),使植物負責輸送水份的木質部,因氣泡形成、擴張和破裂而震動。[1, 4]現在科學家想知道,這是否也會產生在特定距離內,能被其他物種聽見的聲音。[1]

受試的對象是番茄菸草,分別拆成乾旱、修剪和對照 3 組。對照組又有常態生長的一般對照、有土卻無植物的盆器,以及每株植物實驗前的自體對照 3 種。實驗大致有幾個階段:首先,在隔音箱裡,距離每個受試對象 10 公分處,各立 2 支麥克風收音。將聲音的紀錄分類後,拿去進行機器學習。接著移駕溫室,讓訓練好的模型,分辨雜音和不同情況下植物的聲音。再來,觀察乾旱程度與植物發聲的關係。最後,也測試其他的植物和狀態。[1]

麥克風對著乾旱、修剪和對照組的植物收音。圖/參考資料 1,Graphical Abstract局部(CC BY 4.0)

植物錄音與機器學習

隔音箱裡常態生長的植物,每小時平均發聲少於一次;而沒植物的盆器當然完全無聲。相對地,遭受乾旱或修剪壓力的實驗組植物,反應則十分劇烈:[1]

-----廣告,請繼續往下閱讀-----
 平均值(單位)番茄菸草
乾旱發聲頻率(次/小時)35.4 ± 6.111.0 ± 1.4
 音量(聲壓分貝;dBSPL)61.6 ± 0.165.6 ± 0.4
 聲波頻率(千赫茲;kHz)49.6 ± 0.454.8 ± 1.1
修剪發聲頻率(次/小時)25.2 ± 3.215.2 ± 2.6
 音量(聲壓分貝;dBSPL)65.6 ± 0.263.3 ± 0.2
 聲波頻率(千赫茲;kHz)57.3 ± 0.757.8 ± 0.7

隔音箱中實驗組的錄音,被依照植物品種以及所受的待遇,歸納為 4 個組別,各組別再彼此配對比較,例如:乾旱的番茄對修剪的番茄等。以此資料訓練出來的機器學習模型,判別配對中各組別的準確率為 70%。第二階段在溫室中進行,自然較隔音箱嘈雜。科學家拿空蕩溫室的環境錄音,來教模型分辨並過濾雜訊。訓練後,令其區別乾旱與對照組番茄的聲音,結果 84% 正確。[1]既然能聽得出基本的差別,下一步就是了解水量對番茄發聲的影響。

體積含水量

為了操縱體積含水量(volumetric water content,縮寫VWC),即水份與泥土體積的比值或百分比,[1, 5]科學家狠下心,連續幾天都不給溫室裡的番茄植栽喝水。一邊觀察 VWC 的變化;一邊錄下它們的聲音。起先水份充足,番茄不太吵鬧;4、5 天下來,發聲的次數逐漸增加至高峰;然後應該是快渴死了,有氣無力,所以次數又開始減少。此外,番茄通常都在早上 8 點(圖表較像 7 點)到中午 12 點,以及下午 4 點至晚上 7 點,這兩個時段出聲。[1]科學家覺得這般作息,可能與規律的氣孔導度(stomatal conductance),也就是跟光合作用的換氣以及蒸散作用的水份蒸發,兩個透過氣孔進行的動作有關。[1, 6]

大部份的聲音都是在 VWC < 0.05 時出現;當 VWC > 0.1,水份還足夠,就幾乎無聲。科學家將比較的條件進一步分成 VWC < 0.01 與 VWC > 0.05、VWC < 0.05 跟 VWC > 0.05,以及 VWC < 0.01、VWC > 0.05 和淨空溫室的聲音。機器學習模型分辨起來,都有七、八成的準確率。[1]

縱軸為每日發聲次數;橫軸為缺乏灌溉的天數。圖/參考資料 1,Figure 3A(CC BY 4.0)
乾旱狀態下,番茄發聲的時段。縱軸為每小時發聲次數;橫軸為 24 小時制的時間。圖/參考資料 1,Figure 3B(CC BY 4.0)

植物發聲的原理

實驗觀察所得,都將植物發聲的機制,指向木質部導管中氣體的運動,也就是科學家先前預期的空蝕現象[1]下面為支持這項推論的理由:

-----廣告,請繼續往下閱讀-----
  1. 木質部導管的口徑,與植物被錄到的聲波頻率相關:寬的低;而窄的高。[1]
  2. 乾旱與修剪所造成的聲音不同:在木質部導管中,前者氣泡形成緩慢,發聲時數較長;而後者則相當迅速,時數較短。[1]
  3. 聲音是由植物的莖,向四面八方傳播。[1]
  4. 空蝕現象造成的震動,跟記錄到的超音波,部份頻率重疊;而沒有重疊的,其實已經超出其他物種的聽力以及麥克風收音的範圍。[1]
葡萄、菸草和番茄木質部導管的水平橫截面。圖/參考資料 1,Figure S4B(CC BY 4.0)
葡萄(綠色)、菸草(灰色)和番茄(橙色)的差異:縱軸為聲波頻率;橫軸是木質部導管的平均口徑。圖/參考資料 1,Figure S4A(CC BY 4.0)

問誰未發聲

觀察完番茄和菸草之後,科學家不禁好奇,別的植物是否也會為自己的處境發聲?還是它們都默默受苦,無聲地承擔?研究團隊拿小麥玉米卡本內蘇維濃葡萄(Cabernet Sauvignon grapevine)、奇隆丸仙人掌(Mammillaria spinosissima)與寶蓋草(henbit)來測試,發現它們果然有聲音。不過,像杏仁樹之類的木本植物,還有木質化的葡萄藤就沒有了。另外,科學家又監聽感染菸草嵌紋病毒(tobacco mosaic virus)的番茄,並錄到它們的病中呻吟。[1]

你敢有聽著咱的歌

之前有研究指出,海邊月見草(Oenothera drummondii)暴露於蜜蜂的聲音時,會產出較甜的花蜜。[2]若將角色對調過來:植物在乾旱、修剪或感染等壓力下釋出的超音波,頻率約在 20 至 100 kHz 之間,理論上 3 到 5 公尺內的某些哺乳動物或昆蟲,例如:蝙蝠、老鼠和飛蛾,應該聽得到。[1, 2]以色列科學家認為幼蟲會寄住在番茄或菸草上的飛蛾,或許能辨識植物的聲波,並做出某些反應。同理,人類可以用機器學習模型,分辨農作物的聲音,再給予相應的照顧。如此不僅節省水源,精準培育,還能預防氣候變遷所導致的糧食危機。[1]

  

備註

本文最後兩個子標題,借用音樂劇《Les Misérables》歌曲〈Do You Hear the People Sing?〉的粵語和臺語版曲名。[7]

-----廣告,請繼續往下閱讀-----

參考資料

  1. Khait I, Lewin-Epstein O, Sharon R. (2023) ‘Sounds emitted by plants under stress are airborne and informative’. Cell, 106(7): 1328-1336.
  2. Marris E. (30 MAR 2023) ‘Stressed plants ‘cry’ — and some animals can probably hear them’. Nature.
  3. 教育部「哭枵」臺灣閩南語常用詞辭典(Accessed on 01 APR 2023)
  4. McElrone A J, Choat B, Gambetta GA, et al. (2013) ‘Water Uptake and Transport in Vascular Plants’. Nature Education Knowledge, 4(5):6.
  5. Datta S, Taghvaeian S, Stivers J. (AUG 2018) ‘Understanding Soil Water Content and Thresholds for Irrigation Management’. OSU Extension of Oklahoma State University.
  6. Murray M, Soh WK, Yiotis C, et al. (2020) ‘Consistent Relationship between Field-Measured Stomatal Conductance and Theoretical Maximum Stomatal Conductance in C3 Woody Angiosperms in Four Major Biomes’. International Journal of Plant Sciences, 181, 1.
  7. FireRock Music.(16 JUN 2019)「【問誰未發聲】歌詞 Mix全民超長版 粵+國+台+英 口琴+小童+學生+市民 Do you hear the people sing?」YouTube.
胡中行_96
169 篇文章 ・ 65 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

1
0

文字

分享

0
1
0
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告,請繼續往下閱讀-----

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

-----廣告,請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

-----廣告,請繼續往下閱讀-----

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

-----廣告,請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

2

2
1

文字

分享

2
2
1
你覺得 AI 會思考嗎?從圖靈測驗到 AlphaGo ,持續進步的人工智慧——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/26 ・2373字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

原本人類就對機器有些好奇:機器會思考嗎?機器有智力嗎?機器會有智力嗎?

這些問題本來還不急著回答,但是當研究人員在一九四三年創造出第一台現代電腦,也就是電子、數位、可編寫程式的機器之後,這些問題就顯得急迫了。

這些問題看來格外費解,因為智力的本質一直都沒有答案。

機器有智力嗎?會思考嗎?圖/Pexels

機器人有智力嗎?圖靈測試出現

數學家與解碼專家亞倫.圖靈(Alan Turing)在一九五○年提出解決方案,他的文章標題相當謙和,他在〈計算機器與智力〉一文中建議完全擱置機器智力的問題。圖靈認為真正重要的不是機制,而是智力的展現;他解釋說,因為其他生物的內在生命仍不可知,所以我們衡量智力的唯一方法就是觀察外部行為。圖靈用這個觀點避開長達數世紀的哲學辯論,不去討論智力的本質。

-----廣告,請繼續往下閱讀-----

他所推出的「模仿遊戲」就是讓一台機器操作熟練到觀察者無法區別機器和人類的行為,屆時,這台機器就可以貼上「擁有智力」的標籤。

圖靈測試就出現了。

很多人望文生義,從字面解釋圖靈測試,想像著機器人符合條件的話就會和人一樣(如果真有其事的話)。實際應用上,在遊戲或競賽等定義明確、狀況設定清楚的活動中,圖靈測試可有效衡量「有智力的」機器表現如何。圖靈測試並不要求機器做到和人類完全無法區分的地步,而是要判斷機器的表現是不是像人;在這過程中,圖靈測試著重於表現,而非過程。

這樣的產生器算人工智慧,倒不是因為的模型細節符合什麼標準,而是因為他們寫出來的訊息很接近人類寫出來的訊息,能通過測試是因為這模型經過訓練,運用大量線上資訊。

-----廣告,請繼續往下閱讀-----
電影《模仿遊戲》改編 自圖靈於二戰期間,幫助破譯納粹軍事密碼的真實故事。圖/IMDb

人工智慧怎麼「學習」?

一九五六年,科學家約翰.麥卡錫(John McCarthy)進一步定義了人工智慧:

若機器可執行「需要人類智力才能進行的工作」,即具備人工智慧。

圖靈和麥卡錫對人工智慧的評估自此形成基準,將我們的焦點從智力的定義轉移到表現(看似有智的行為)的評估上,不再聚焦於人工智慧這個詞在更深奧的哲學、認知與神經科學層面。

過去的半個世紀以來,機器幾乎都無法呈現這種智力,這條死路好像已經走到底了。電腦在精確定義的程式基礎上運作數十年,但因為電腦既靜態且僵化,所以電腦分析也受到局限;傳統的程式可以組織大量資料,執行複雜的計算,可是卻無法辨識類似物品的圖片,或適應不準確的輸入項目。

人類思想不精確又模糊,確實是人工智慧發展過程中難以排除的障礙。然而,過去的十年內,創新的運算方式已經創造出新的人工智慧,模稜兩可的程度可和人類相提並論。人工智慧也不精確、恆動、隨機應變,並且能夠「學習」。

-----廣告,請繼續往下閱讀-----

人工智慧「學習」的方式就是先消化資料,然後從資料中觀察,得出結論。

過去的系統需要精確地輸入和輸出項目,不精確的功能人工智慧就不需要。人工智慧在翻譯的時候,不會把每個字都替換掉,而是會找出模式和慣用語,因此翻出來的譯文也會一直變化,因為人工智慧會隨著環境變遷而進化,還能辨識出對人類很新奇的解決方案。在機器領域裡,這四種特質都具有革命性。

以前需仰賴專業棋士,將棋路編寫為程式。圖/Pexels

以阿爾法元在西洋棋世界的突破來說,以前的西洋棋程式要倚賴人類的專業,把人類的棋路編寫為程式;但阿爾法元的技巧是自己和自己對戰數百萬場後磨練出來的,軟體從對戰過程中自己發現了模式。

飛快進步的演算法

這些「學習」技巧的基石是演算法,而演算法就是一連串的步驟,把輸入項目(例如遊戲規則或棋子的走法)翻譯成可重複的輸出項目(例如獲勝)。經典演算法例如長除法等計算,必須精準、可預測,機器學習演算法則不用;經典演算法有許多步驟,分別產出精準的結果,機器學習演算法則一步一步改善不精準的結果。

-----廣告,請繼續往下閱讀-----

這些技巧目前進步飛快,以航空來說,很快地,人工智慧就能成為各種飛行器的正駕駛或副駕駛了。在美國國防部高等研究計劃署(DARPA)的專案「阿爾法纏鬥」(Alpha Dogfight)中,人工智慧戰機飛行員在模擬戰鬥中的表現超越了人類飛行員;不管是要操縱噴射機參戰或操縱無人機送貨,人工智慧都會劇烈影響軍事與民用航空。

人工智慧能成為各種飛行器的駕駛。圖/Pexels

儘管我們現在看到的創新還只是開端,但這些變化已經微妙地改變了人類體驗的紋理,在接下來的數十年內,這趨勢只會愈來愈快。

驅動人工智慧轉型的科技概念很複雜也很重要,所以本章會特別解釋機器學習的演化、現況與應用,說明儘管機器學習強大到讓人害怕,但也有自身的限制。

我們必須先簡介機器學習的架構、能力和限制,才能理解機器學習將帶來的社會、文化和政治變化。

-----廣告,請繼續往下閱讀-----

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

所有討論 2
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。