1

9
1

文字

分享

1
9
1

是臉書決定動態牆內容,還是我們自己?——《科學月刊》

科學月刊_96
・2015/09/29 ・2659字 ・閱讀時間約 5 分鐘 ・SR值 619 ・十年級

-----廣告,請繼續往下閱讀-----

作者/鄭宇君(玄奘大學大眾傳播學系助理教授,國立政治大學新聞系博士。研究興趣:社交媒體研究、科學傳播、風險與危機傳播、科技文化研究)

究竟是個人的交友選擇或是臉書的演算法,造成臉書用戶看到同質化內容的影響較大呢?

Science期刊五月份登出一篇臉書研究的論文,主要目的是探討用戶曝露在同質或異質意識型態內容之情況,進而比較前述兩者的效應。這是少數能刊登在Science上的社會科學研究結果,特別是使用了一般研究者難以取得的臉書大數據(big data),因而引起許多人關注與討論。本文主要是說明這類研究的困難與研究發現之價值。

13048344414_e5986044dc_o
source: flickr

社群媒體大數據研究的價值

對人文社會學者而言,進行社群媒體大數據的研究,最困難的是研究者不容易取得大量的資料,因這些資料皆由Facebook、Twitter、Google等大公司所擁有, 即便這些公司透過應用程式介面(API)釋出部分資料給開發者及學術研究者利用,但能取得的數據仍是有限、不完整的資料。相較之下,本篇論文第一作者任職於臉書公司,可取得臉書的大量使用者資料及用戶行為記錄(user log),包括用戶塗鴉牆上出現的動態消息,哪幾則消息用戶會實際點閱,哪些不會等等。這些用戶行為記錄是一般研究者無法透過臉書API獲取的資料,只有臉書公司本身擁有這些記錄,這是本研究的價值所在。

-----廣告,請繼續往下閱讀-----

本篇論文作者主要透過臉書的大數據驗證「迴聲室」(echo chambers)與「過濾泡泡」(filter bubbles)這二個概念,何者在臉書的用戶行為中較具影響力。用淺白的話來說,「迴聲室效應」的重點在於用戶的個人選擇,個體會選擇與自己立場相近的人成為好友,所以看到的朋友分享訊息跟自己立場相近;或是反過來,個體從臉書朋友中看到的立場來決定自己的立場。無論是哪一種,當個人從臉書好友分享訊息中所見的都是相似立場,他便以為社會上的主流意見皆是如此。

另一個重要概念「過濾泡泡」,則意指臉書演算法如何影響用戶所觀看到的訊息。臉書經由演算法先篩選出他們認為用戶「想看」的動態消息,接著這些訊息才會出現在用戶的動態消息上。演算法計算基礎來自於用戶先前的行為,包括用戶訂閱專頁、友人互動的頻率(按讚、分享、留言)及是否點閱內容觀看。

無論是迴聲室效應或過濾泡泡,儘管成因不同,但造成的共同結果是——用戶沉浸在一個同質性非常高的內容群體中,甚至誤認為這就是社會上的主流意見。這是批評者經常抨擊社交媒體的負面效應,這篇論文想要證明的就是迴聲室效應(個人選擇)或過濾泡泡(演算法過濾),何者該負起較大責任?

2381281647_605ca90079_o
是誰決定你所看到的? source: flickr

資料的分析與測量

本篇論文使用的資料集來自於 1010 萬名美國臉書的活躍用戶,這些用戶在個人檔案中自我揭露其意識型態傾向,以及在資料收集的六個月內(2014年7月7日~2015年1月7日)被這些用戶所分享的700萬筆的網頁超連結(URL)。研究者透過機器學習區分大量超連結內容為硬性內容(如:全國新聞、政治、世界大事)或軟性內容(如:娛樂、運動、旅遊)。結果發現,700萬筆超連結中有13%為硬性內容,研究者進一步將資料集限縮於其中被20個以上有標明意識型態傾向的用戶所分享的22.6萬筆硬性新聞,並對這些內容進行校準測量。

-----廣告,請繼續往下閱讀-----

換言之,研究者所收集的臉書用戶資料,是那些在個人檔案中強烈表態政治傾向的用戶,至於立場模糊或中立的用戶行為就不納入研究範圍;研究者將這些用戶的意識型態傾向分為保守派vs.自由派,各為正負1分,當一則硬性新聞被20個以上的用戶所分享,則將此新聞的所有分享人數之分數平均計算(保守派為+1分、自由派為-1分,加總起來除以分享人數),就得到該則新聞之意識型態平均分數。

研究者透過這種方式給予22.6萬則硬性新聞評分,進行內容校準(content alignment)的測量,重點不在於測量新聞媒體的傾斜程度,而是捕捉一群人所分享的內容差異。測量的結果發現:福斯電視網偏向保守派(+0.8)、哈芬登郵報(Huffington Post,美國大型新聞網站)傾向自由派(-0.65)。研究者觀察到用戶分享的硬性內容裡有極化現象(polarization),最多被分享的連結來自大部分的保守派或自由派,也就是中立很少。

者進一步申論,臉書與政治部落格的連結很不相同,臉書是以友誼建立的人際網路,雖然很多友誼會被政治意識型態打斷,但朋友當中還是有保守及自由派。在個人檔案中標示自己是自由派的,朋友中約有20%是保守派;反之,標示自己為保守派者,朋友約有18%是自由派。因此,透過朋友分享內容,理論上用戶應該有接近20%機會看到相反陣營的內容,但研究者計算用戶實際點閱的超連結後發現,保守派用戶對於相對立場文章的點擊率只有17%,而自由派則是6%。然而,作者坦承這分析的其中一個限制在於曝露(訊息出現在用戶動態消息)與消費(用戶點進該則消息瀏覽)的概念區分並不完美,個體也許已經在動態消息中看到內容摘要,儘管他沒點進去,也已曝露在某些內容下。

歸咎於個人選擇?

某些批評者認為,這篇論文把用戶看到同質性高的內容歸因為個人選擇而非臉書演算法,是為臉書卸責。但細讀本文的資料分析及推論,作者並沒有這樣宣稱,研究計算了個人選擇及演算法都會影響用戶閱讀內容,前者影響略高於後者,但測量時並無法排除另一個因素的影響。筆者認為本研究結果可能更受到取樣的用戶資料集之偏頗影響,由於這些用戶皆為明確表態個人政治傾向,他們在閱讀時可能較一般中立用戶更傾向排拒與自己立場相異的內容,因而這樣的研究結果並無法推論到多數未表態政治傾向的用戶。

-----廣告,請繼續往下閱讀-----

另一方面,這也反映了社群媒體巨量資料研究之困難所在,即便像本研究作者有機會使用臉書的用戶行為資料。但人類的社交行為十分複雜,如何把研究問題轉化為可操作化測量的指標是個難題,本研究作者選擇以政治立場明確的保守派vs.自由派用戶出發,作為測量計分的依據,這種作法必然在過程中省略了用戶分享內容的差異性,這部分也有待後續研究者尋找更有效的分類或計算指標。

1234〈本文選自《科學月刊》2015年8月號〉

延伸閱讀:
一種網羅?
網路科普教學的虛與實

什麼?!你還不知道《科學月刊》,我們46歲囉!
入不惑之年還是可以
當個科青

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度
科學月刊_96
249 篇文章 ・ 3708 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。

0

4
1

文字

分享

0
4
1
即便不認同群體意見,我們也不敢提出異議?「共識陷阱」創造了沉默的同意——《集體錯覺》
平安文化_96
・2023/01/14 ・2432字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

有些時候,沉默就是背叛。
——馬丁.路德.金(Martin Luther King Jr.)

「幫臉蛋打分數」實驗

想像一下,你是二○○○年代末的荷蘭大學生,有一天在上課的路上穿過社會科學院,看到一張召募受試者的海報,名字叫〈看見美麗〉,是一群社會心理學家在研究人類如何認知臉蛋的吸引力。平常就愛翻時尚雜誌的你,覺得自己實在不去不行,而且該實驗還在法國與義大利同步進行,實在太酷了,所以你立刻報了名。

受試內容非常簡單,一邊接受腦部掃描,一邊幫臉蛋打分數。圖/Envato Elements

幾天之後,研究團隊請你填一份健康調查,例如有沒有幽閉恐懼症之類,並安排實驗時間;實驗似乎非常簡單:一邊接受腦部掃描,一邊幫一大堆女生臉蛋的照片打分數。「這根本只是花一個小時滑社交軟體 Tinder 嘛。」你想著,這樣就能為科學做出貢獻,實在太好了。

實驗當天,一名穿著白袍的助手帶你進入房間,房裡有一張小小的床。床的旁邊是一個巨大的白色塑膠甜甜圈,洞的大小剛好可以塞進那張床。「這叫作功能性磁振造影,」助手表示,她請你躺在床上,遞給你兩個控制器,每個控制器上各有四個按鈕,上面分別寫著 1 到 8。

「接下來我們會放出許多照片,請你告訴我們每張照片有多吸引人,」她指著控制器上的按鈕,「毫無吸引力就打 1 分,非常吸引人就打 8 分;每張照片有三到五秒的時間回答。」她說完之後給你戴上耳機,在你頭上敲了幾下把耳機固定。你看了一下那個塑膠甜甜圈,裡面好像有個小螢幕。

-----廣告,請繼續往下閱讀-----

「感覺如何?」耳機傳來助手的聲音。

「OK 啦,」你說,雖然你其實有點緊張,而且有點冷。

助手請你盡量保持安靜,然後整張床緩緩滑入了那個白色甜甜圈。

實驗在磁振造影機裡進行,令人感到有點緊張及不適。圖/Envato Elements

一分鐘後,甜甜圈裡的小螢幕亮了起來,出現一張女生的臉蛋照片,畫著濃妝面帶微笑,頭髮看起來油膩膩的;照片消失之後,你給照片打了六分,幾秒鐘後數字「8」亮了起來,旁邊寫著「+2」。看來「米蘭和巴黎的女性受試者」對這張臉的評價,平均比你高兩分。

-----廣告,請繼續往下閱讀-----

「喔?」你皺起眉頭,「這樣啊?是我漏看什麼嗎?」

螢幕上出現第二張功能性磁振造影照片,你努力無視磁振造影機器的嗡嗡聲,繼續打分數。在那之後,照片一張又一張出現,就這樣經過了五十分鐘。

實驗完成之後你來到休息室,另一個助理突然走了進來,說要拜託你在沒有磁振造影機的情況下,把每張照片再打一次分數;他把你帶到另一個房間,確認你覺得舒服之後,以不同的順序給你看之前那些照片。

不過這次,那些「歐洲受試者給出的平均分數」消失了,而且沒有時間限制,每張照片你愛看多久就看多久。結束之後助手問你感覺如何,並感謝你的參與,你也很高興對科學做出貢獻。

-----廣告,請繼續往下閱讀-----

大腦認為錯的意見

不過你做出貢獻的方式,其實跟你想的不太一樣。實驗結束之後你才知道,其實整個設定都是騙你的,這個實驗的真正目的,是研究你對臉蛋的評價會如何因為其他人的評價而改變。

實驗根本就沒有「歐洲各地同步進行」,那些「其他國家」或者什麼「米蘭和巴黎受試者的平均評分」全都是事先寫好規則的極端值,只是刻意為了跟你唱反調而已。但有趣的是,這個虛構設定的實驗,卻告訴了我們很多真實的事情。

實驗中的極端值只是刻意為了跟你唱反調而已。圖/Envato Elements

功能性磁振造影的掃描結果顯示,當我們發現自己偏離了主流意見,大腦就會在神經層次上,產生一種跟事與願違時相同的反應。

當事情的走向出乎預期,我們通常會認為是自己搞錯,這時大腦會把錯誤記錄下來,讓我們下一次不要再犯。這種機制在我們學習開車跟滑雪的時候很有用,卻會在社會之中造成麻煩:大腦會把與眾不同的意見當成錯誤的意見,讓我們下意識服從群體的共識。

-----廣告,請繼續往下閱讀-----

因此,當我們重新幫同一疊照片評分,我們給出的分數就變得跟「歐洲各地的平均分數」更近,請注意這個設定的真正意義。這些「歐洲各地的受試者」並不是我們的內團體,「巴黎跟米蘭的女性受試者」遠在天邊,我們根本就不認識,即使意見不同也不用擔心被他們排擠,可是我們還是被影響了。

這表示即使「其他人」不在現場、不知道打哪來的、甚至根本就不存在,他們的意見還是能夠讓我們服從。

即使「其他人」不在現場、甚至根本不存在,他們的意見還是能讓人服從。圖/Envato Elements

這個實驗告訴我們,即使眼前是一群自己未必重視的群體,即使「主流意見」可能只是我們的錯覺,我們也會在意自己是否偏離。在社交場合,我們的大腦不會仔細檢查眼前的表象是否為真,只會照著本能做事。這種情況我稱之為「共識陷阱」(consensus trap)。

它會創造出另一種集體錯覺:不是奠基於謊言,而是奠基於沉默,讓我們為了保持沉默,最後搞到彼此誤解。這種沉默的共識很可怕,它讓我們搞不清楚自己做錯了什麼,畢竟我們既沒有盲從他人,也沒有假意迎合,只是保持沉默而已。

-----廣告,請繼續往下閱讀-----

——本文摘自《集體錯覺:真相,不一定跟多數人站在同一邊!》,2022 年 12 月,平安文化出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。

1

3
0

文字

分享

1
3
0
數據塑造生活與社會,讓人既放心但又不安?——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/28 ・2760字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

數位世界已經改變了我們日常生活的體驗,一個人從早到晚都會接受到大量數據,受益於大量數據,也貢獻大量數據。這些數據龐大的程度,和消化資訊的方式已經太過繁多,人類心智根本無法處理。

與數位科技建立夥伴關係

所以人會本能地或潛意識地倚賴軟體來處理、組織、篩選出必要或有用的資訊,也就是根據用戶過去的偏好或目前的流行,來挑選要瀏覽的新項目、要看的電影、要播放的音樂。自動策劃的體驗很輕鬆容易,又能讓人滿足,人們只會在沒有自動化服務,例如閱讀別人臉書塗鴉牆上的貼文,或是用別人的網飛帳號看電影時,才會注意到這服務的存在。

有人工智慧協助的網路平臺加速整合,並加深了個人與數位科技間的連結。人工智慧經過設計和訓練,能直覺地解決人類的問題、掌握人類的目標,原本只有人類心智才能管理的各種選擇,現在能由網路平臺來引導、詮釋和記錄(儘管效率比較差)。

日常生活中很少察覺到對自動策劃的依賴。圖/Pexels

網路平臺收集資訊和體驗來完成這些任務,任何一個人的大腦在壽命期限內都不可能容納如此大量的資訊和體驗,所以網路平臺能產出看起來非常恰當的答案和建議。例如,採購員不管再怎麼投入工作,在挑選冬季長靴的時候,也不可能從全國成千上萬的類似商品、近期天氣預測、季節因素、回顧過去的搜尋記錄、調查物流模式之後,才決定最佳的採購項目,但人工智慧可以完整評估上述所有因素。

-----廣告,請繼續往下閱讀-----

因此,由人工智慧驅動的網路平臺經常和我們每個人互動,但我們在歷史上從未和其他產品、服務或機器這樣互動過。當我們個人在和人工智慧互動的時候,人工智慧會適應個人用戶的偏好(網際網路瀏覽記錄、搜尋記錄、旅遊史、收入水準、社交連結),開始形成一種隱形的夥伴關係。

個人用戶逐漸依賴這樣的平臺來完成一串功能,但這些功能過去可能由郵政、百貨公司,或是接待禮賓、懺悔自白的人和朋友,或是企業、政府或其他人類一起來完成。

網路平臺和用戶之間是既親密又遠距的聯繫。圖/Envato Elements

個人、網路平臺和平臺用戶之間的關係,是一種親密關係與遠距聯繫的新穎組合。人工智慧網路平臺審查大量的用戶數據,其中大部分是個人數據(如位置、聯絡資訊、朋友圈、同事圈、金融與健康資訊);網路會把人工智慧當成嚮導,或讓人工智慧來安排個人化體驗。

人工智慧如此精準、正確,是因為人工智慧有能力可以根據數億段類似的關係,以及上兆次空間(用戶群的地理範圍)與時間(集合了過去的使用)的互動來回顧和反應。網路平臺用戶與人工智慧形成了緊密的互動,並互相學習。

-----廣告,請繼續往下閱讀-----

網路平臺的人工智慧使用邏輯,在很多方面對人類來說都難以理解。例如,運用人工智慧的網路平臺在評估圖片、貼文或搜尋時,人類可能無法明確地理解人工智慧會在特定情境下如何運作。谷歌的工程師知道他們的搜尋功能若有人工智慧,就會有清楚的搜尋結果;若沒有人工智慧,搜尋結果就不會那麼清楚,但工程師沒辦法解釋為什麼某些結果的排序比較高。

要評鑑人工智慧的優劣,看的是結果實用不實用,不是看過程。這代表我們的輕重緩急已經和早期不一樣了,以前每個機械的步驟或思考的過程都會由人類來體驗(想法、對話、管理流程),或讓人類可以暫停、檢查、重複。

人工智慧陪伴現代人的生活

例如,在許多工業化地區,旅行的過程已經不需要「找方向」了。以前這過程需要人力,要先打電話給我們要拜訪的對象,查看紙本地圖,然後常常在加油站或便利商店停下來,確認我們的方向對不對。現在,透過手機應用程式,旅行的過程可以更有效率。

透過導航,為旅途帶來不少便利。圖/Pexels

這些應用程式不但可以根據他們「所知」的交通記錄來評估可能的路線與每條路線所花費的時間,還可以考量到當天的交通事故、可能造成延誤的特殊狀況(駕駛過程中的延誤)和其他跡象(其他用戶的搜尋),來避免和別人走同一條路。

-----廣告,請繼續往下閱讀-----

從看地圖到線上導航,這轉變如此方便,很少人會停下來想想這種變化有多大的革命性意義,又會帶來什麼後果。個人用戶、社會與網路平臺和營運商建立了新關係,並信任網路平臺與演算法可以產生準確的結果,獲得了便利,成為數據集的一部分,而這數據集又在持續進化(至少會在大家使用應用程式的時候追蹤個人的位置)。

在某種意義上,使用這種服務的人並不是獨自駕駛,而是系統的一部分。在系統內,人類和機器智慧一起協作,引導一群人透過各自的路線聚集在一起。

持續陪伴型的人工智慧會愈來愈普及,醫療保健、物流、零售、金融、通訊、媒體、運輸和娛樂等產業持續發展,我們的日常生活體驗透過網路平臺一直在變化。

網路平台協助我們完成各種事項。圖/Pexels

當用戶找人工智慧網路平臺來協助他們完成任務的時候,因為網路平臺可以收集、提煉資訊,所以用戶得到了益處,上個世代完全沒有這種經驗。這種平臺追求新穎模式的規模、力量、功能,讓個人用戶獲得前所未有的便利和能力;同時,這些用戶進入一種前所未有的人機對話中。

-----廣告,請繼續往下閱讀-----

運用人工智慧的網路平臺有能力可以用我們無法清楚理解,甚至無法明確定義或表示的方式來形塑人類的活動,這裡有一個很重要的問題:這種人工智慧的目標功能是什麼?由誰設計?在哪些監管參數範圍裡?

類似問題的答案會繼續塑造未來的生活與未來的社會:誰在操作?誰在定義這些流程的限制?這些人對於社會規範和制度會有什麼影響?有人可以存取人工智慧的感知嗎?有的話,這人是誰?

如果沒有人類可以完全理解或查看數據,或檢視每個步驟,也就是說假設人類的角色只負責設計、監控和設定人工智慧的參數,那麼對人工智慧的限制應該要讓我們放心?還是讓我們不安?還是既放心又不安?

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
所有討論 1
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

0

1
0

文字

分享

0
1
0
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告,請繼續往下閱讀-----

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

-----廣告,請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

-----廣告,請繼續往下閱讀-----

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

-----廣告,請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。