0

0
0

文字

分享

0
0
0

是誰讓外送員飆車:「評價系統」會如何影響人們的行為?

人機共生你我它_96
・2019/11/26 ・5990字 ・閱讀時間約 12 分鐘 ・SR值 522 ・七年級

根據社會地位的高低或個人價值的差異,來決定誰能過富裕舒適的生活、誰該活在貧窮與困苦之中,這種社會制度一點道理也沒有。

— 《收入不平等》Richard Wilkinson, Kate Pickett

圖/Vishal Shah@Pexels

前一陣子不幸發生食物平台外送員在外送期間發生車禍的意外,再次讓大眾注意到外送員勞動權益的問題。

今天我們不討論僱傭跟承攬之間的界線以及後續該怎麼處理,這篇文章想從評價系統如何影響我們行為的層面來跟大家討論:使用外送平台、Uber 服務、Airbnb 這類共享經濟平台的各方使用者如何被評價?而平台的評價機制會怎麼影響被評價者在不同環節中所做的決定,進而造成某些後果。

意識到這個評價系統對我們每個人的影響之後,就能夠知道如何改變或對抗評價系統,並降低意外發生的可能性。

根據台灣地區外送員在部落格的分享1,每週跑單 5~6 天,在沒有促銷活動的情況下,一個月大概 18K 左右,而外送平台的對外送員的獎勵機制會受訂單的每週接案率、訂單取消率、運送服務範圍、顧客評價、單位時間內達到的運送趟數、尖峰與離峰時間的訂單量而影響2、3、4、5

在這樣的評價系統底下,背後的目的是為了要求外送員做到——把餐點在最快的時間內、以最好的餐點狀態以及好的服務態度送到客戶手上。這時候身為要賺生活費的外送員,為了達到能讓自己獲利的趟數目標,很合理的行為就是:騎車要「有效率」。

要怎麼有效率?就是多工,騎車的時候需要分配注意力在找最近的路線、密切注意餐點狀況、送達的時間、訂單狀況、如何安排自己的路線以及送單的優先順序,同時又要注意交通狀況。

在這樣緊湊又高壓的情況下,很難避免意外發生。

在這樣緊湊又高壓的情況下,很難避免意外發生。圖/Daria Sannikova@Pexels

看出評價系統對我們行為的影響了嗎?

當我們所賺的錢是取決於我們多有效率完成任務,我們就會想辦法讓自己盡可能地快。在外送的情境下可能的後果就是交通意外;在工廠、辦公室裡過度追求單位時間內產量的這個評量指標,帶來影響的就是加班過勞;在學術圈裡過度追求發表量的評量指標,所產生的影響就是不健康的師徒制,以教學之名行壓榨之實。

共享經濟服務帶來的好處是讓閒置資源得以有效率運用,但盈利企業為了確保服務品質所設計的評價機制對不同環節使用者潛藏著什麼風險?

接下來我想透過共享經濟平台 (Uber, Uber Eats, Airbnb, Foodpanda 等)的設計,帶大家來看評價系統對人類行為的影響,接著一起思考我們可以如何改變。

當每次服務開始都被評價:演算法造成哪些影響?

一個負評就有可能丟了工作

客戶評分是所有共享經濟平台上會用來評價服務提供者常用的指標,在 Airbnb 上,房客可以為房東評分、Uber 乘客可以為司機評分、在食物外送平台上,餐廳跟點餐的客戶可以為外送員評分。

評價別人很容易,但是我們在評價別人之前,有沒有想過我們給的分數對眼前這個人會有多大的影響?

在美國的 Uber 與 Lyft(另一家載客服務)司機就曾經因為評價系統而吃虧,太多乘客們對於分數的認定跟平台系統評斷司機優劣的方式不完全相同,乘客給予 4 分很有可能就會讓他們失去後續接單的機會,因為「只」得到 4 分的司機在演算法的排序下很有可能完全接不到單,有司機向媒體分享,如果他分數在 4.6 分以下,那他真的得擔心自己未來要怎麼辦3

評價別人很容易,但是我們在評價別人之前,有沒有想過我們給的分數對眼前這個人會有多大的影響?圖/Johannes Rapprich@Pexels

由於司機們覺得乘客在評分的時候,根本沒有意識到他們輕易給的一個分數會對司機的職涯有重大影響,於是司機們索性就在椅背上貼著一張紙,向乘客說明他們給的分數在評價系統代表的意義:

  • 五分 = 這趟旅程很棒、還算可以,在路途中司機可能沒有注意到一些社交線索或是說了冷笑話,但至少他載我到我的目的地。
  • 四分 = 這個司機很差勁,慢慢的開除他吧。(四分並不表示這趟旅程是普通或是平均程度,當得到太多四分的時候,我的下場就是流落街頭。)
  • 三分 = 這個司機差勁到極點,我這輩子都不要再見到他。(三分完全不等於「普通」。)
司機們索性就在椅背上貼著一張紙,向乘客說明他們給的分數在評價系統代表的意義。圖/BuzzFeed News

這個問題也不是在美國才有,前一陣子我訪談台灣 Uber 司機,也有司機提到他必須很努力讓分數維持在 4.9 分以上,否則搶不到單;除此之外,今年也有 Uber Eats 的外送員表示如果他接收到一個負評,就需要靠多接很多訂單才能洗白,評分如果掉到 90 分以下也會被警告2

當演算法介入評價系統,如果沒有讓所有利益關係人(司機與乘客)都知道背後運作的機制,帶來的不只是司機工作權益的問題,這些心理壓力連帶也會影響司機與乘客之間的關係。像是司機以為乘客帶有惡意在評價自己,對乘客有過高的警戒心等等。

捉摸不定的演算法帶來焦慮

另一方面,讓人捉摸不定的評價系統也會對使用者帶來焦慮。這裡以 Airbnb 的例子來說明。

Airbnb 也是實現共享經濟的一個提供住房服務的平台,他們的研究員為了了解自己公司設計的演算法對於屋主的影響,在 2017 年訪談了 15 位使用他們平台提供住房服務的屋主6,發現房東們需要經常煩惱兩件事情,一個是如何吸引顧客,另一個是如何符合 Airbnb 演算法的期待。

房東們需要經常煩惱兩件事情,一個是如何吸引顧客,另一個是如何符合Airbnb演算法的期待。圖/取自Airbnb網站

屋主們經常擔心自己做了什麼事或沒做什麼事會被平台背後的演算法判定是「不好的」,進而影響自己的獲利。舉例來說,在 Airbnb 上面,旅客可以依序瀏覽符合搜尋條件的住處,但是誰的房子會先被看到是怎麼決定的呢?

由於屋主們不清楚演算法根據什麼來讓自己的房間被放在選單最上面,於是他們就定期更新房屋的照片、儘可能快速的回覆房客提問、或甚至是把房屋內各種設施都寫在標題,嘗試影響演算法排序的結果,想辦法在他們可以調整的範圍內讓自己的房間被房客瀏覽到。

對抗不透明評價系統:守規矩+逆向工程

面對這難懂的評價系統該怎麼辦?這個研究的另一個發現是屋主們會用一些方法來讓自己接受這個難以捉摸的評價系統,像是告訴自己演算法應該會是「公平的」,只要乖乖照著 Airbnb 的指示做,演算法就會讓他們更容易被房客搜尋到。

舉例來說,只要把自己的客戶評價都維持得很好,他們就確信 Airbnb 的演算法會讓自己的房屋被放在搜尋頁面上。

此外,研究者也發現另一招屋主會使用的方式是自己當工程師實測看看,透過逆向工程的方式,和網站上其他房東提供的房子的比較、自己嘗試改變網頁上的資料、根據附近的房價彈性調整自己房屋的價錢,或是去網路上爬各種房東的分享文來看,用盡各種方式來推測系統評價他們的方式。

共享經濟的評價系統可以如何改善?

Airbnb 對自家的服務做了深入的研究,透過這個研究,他們其實也發現了另一個難題:系統演算法到底應該設計得多透明?

對於公司利益來說,保持演算法有一定程度的模糊地帶是為了避免房東鑽漏洞,但是設計得太難捉摸又會使得房東無所適從,因此,他們提出了幾個共享經濟的平台可以改善的這種方案:

  1. 當房東嘗試在平台上做出會讓平台演算法判斷為「不好」的行為的時候,這時系統可以自動偵測並提醒他,幫助房東判斷哪些行為是對演算法的輸出有影響的,而哪些因素是演算法根本不會納入考量的。像是當房東延遲回覆太多次,背後的演算法就會把這個行為判斷為不好,這時候系統可以提醒房東,回覆速度的快慢會影響他的房間曝光度;但是如果房東經常更動標題,把不同關鍵字放在標題中,系統就可以提醒他做這些事可能大部分只是徒勞無功XD
  2. 這類型服務平台演算法在評價房東的時候,可以盡量只參考房東可以控制或改變的參數,像是他們的回覆態度、回覆頻率、顧客評價等,而盡量避開一些他們無法自己決定的因素,像是房子所處的地理位置或是擔任房東多久這些先天就決定好也難以做出什麼改變的因素。
    補充:這裡的房東評價指的是房客會看到的分數,例如一個房東得 7 分(假使總分 10 分),不是因為納入了他的房子地理位置,而是因為他回覆太慢或態度不夠好這種他自己可以決定的因素,而不是一個他努力也改變不了的因素。
    如同我們平常在被評價一樣,不能因為我是「女生」或我是「亞洲人」就認為我是一個比誰好或比誰不好的人,因為性別跟種族不是我們能控制的。
  3. 該怎麼在平台本身 (Airbnb)、服務提供者(房東)、服務使用者(房客)三個利益關係人之間取得平衡?目前可能的一種解法就是平台透過一些設計來促進房東跟房客之間的關係,像是想辦法透過系統設計來讓房東更同理房客的需求,另一方面讓房客也看見房東的努力,藉由提升雙方關係來達到三贏的局面
透過一些設計來提升雙方關係,來達到三贏的局面。圖/Pixabay@Pexels

其實不只 Uber、Airbnb,透過社群媒體行銷或是推出創作內容的人,也會面臨類似的焦慮。當 YouTuber 不知道 YouTube 是根據什麼機制來推薦自己生產的內容給觀眾時、藝術作品放在 IG 上不知道會被誰觸及、文章分享在 FB 或 Medium 上卻不了解平台背後演算法是如何影響觀眾觸及創作內容時,這些都會對內容或服務提供者帶來很多不可控制感以及焦慮。

辨識自己周圍的評價系統

一個適當的評價系統可以塑造出「好」的行為,就像 Airbnb 的優良房東機制就能鼓勵房東們帶給房客信任感以及良好的溝通,但是一個不適切的評價系統,就像是自己建立了一個不適當的牢籠來綑綁自己,引導人做出不適切的行為。

這篇文章並不是要傳達我們得完全摒除評價系統,畢竟有這些評價系統我們才有線索知道自己多會玩人生這場遊戲,這篇文章想讓大家意識到的是:

我們每個人所處的社會位置,其實都有不同的評價系統在影響我們的行為。

從小到大的我們的行為都被被各種不同的評價系統所形塑著,大學招生的時候會評量一個學生主科好不好,所以我們就想盡辦法在這些會被評量的層面上花很多時間,然後壓縮自己做其他休閒的時間(想想你是不是也經歷過類似從小開始學鋼琴、舞蹈、畫畫但是升上國高中後因為要「專心讀書」就中斷XD)。

大學的時候如果出席分數佔很多,我們就想辦法點名的時候一定要到;公司績效評鑑的時候要看我們業績多好,拉了多少客戶、提出多少可執行的企劃案,我們就用各種不同的方式達到帳面上可以交代的數字;學校計畫需要成果展示,當初規劃的經費有沒有用完是評量計畫成果的指標,我們就在計畫截止前趕快把錢花完;不勝枚舉。

我們每個人所處的社會位置,其實都有不同的評價系統在影響我們的行為。圖/schach100@Pexels

許多時候衝突與傷害就來自於我們跟合作夥伴在不同的評價系統標準下互動,當兩個站在不同位置的人需要合作或互動的時候,他們各自所處的評價系統就會影響他們決定做什麼事以及決定怎麼做的優先順序。

舉例來說,當某些教授被評價的方式是研究發表量,而某些研究生被評價的方式是就業能力時,兩個不同的評價系統就會造成兩方目標不一致,然後形成衝突,一方覺得做研究比較重要,另一方覺得找工作重要。

在工作場合,設計師部門被評價的方式可能是讓使用者有好的體驗,但假使工程部門被評價的方式是有效率的做完手邊的案子,兩方合作就會因為目標不一致導致溝通受阻。

產業界被評價的方式是銷售量、可執行性,學術界被評價的方式是研究的創新與前瞻性,來自兩個不同評價系統中的人一旦需要對話,就容易因為沒看到各自其實是在追求不同目標而互相看不起。

看清自己處在什麼評價系統之中

談了這麼多並不是要得到一個「人生好難」的結論,而是希望大家在看完之後,去想想現在自己的社會角色(學生、員工、伴侶、晚輩、管理者、領導人等)是受什麼評價系統影響、這個評價系統衡量的價值是跟你在意的價值一致嗎?

一致的話,恭喜你!你能在這個角色上盡情發揮、如魚得水;但如果發現目前的評價系統不適合自己的話,可以想想這個評價系統評量你的方式真能夠衡量到某個價值嗎(創作品質、教學品質、設計品質、產量等等)?不適合的話,要不要考慮換到一個評價系統適合自己的地方?或是能如何改變這個評價系統?

記住,評價系統是人類自己建立的,人類需要仰賴評價系統來確認自己的價值跟位置。這個系統的存廢與內涵也只有我們自己能改變。

延伸了解更多:

  1. 【 志祺七七 】Uber 該不該禁?政府又在針對 Uber 修法了嗎?《政策翻譯蒟蒻》EP.007
  2. [談理解] 不懂智慧裝置怎麼用的問題出在哪? — 智慧系統的解釋機制

參考資料

  1. Uber Eats桃園-市場分析,到底適不適合全職做呢?(2019/07/01更新) @ 大小人
  2. 自由時報 (2019, July 24).
    易遭惡意洗負評? Uber Eats評分機制引外送員不滿
  3. O’Donovan, C. (2017, April 11)
    Nobody Knows What Five Star Ratings Mean. That’s Bad For Gig Workers.
  4. 【心得】台中UBEREATS外送員心得<更新如何增加接單率攻略>
  5. Uber機車UberEATS 台北獎勵方案(含最新嘉義雲林宜蘭花蓮) @Uber司機安安(10/14已更新) @ Uber司機安安租賃靠行包車旅遊一條龍服務
  6. Jhaver, S., Karpfen, Y., & Antin, J. (2018, April). Algorithmic anxiety and coping strategies of Airbnb hosts. In Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems (p. 421). ACM.
  7. 【心得】台中UBEREATS外送員心得<更新如何增加接單率攻略>
  8. Lee, M. K., Kusbit, D., Metsky, E., & Dabbish, L. (2015, April). Working with machines: The impact of algorithmic and data-driven management on human workers. In Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems (pp. 1603–1612). ACM.
  9. Uber Eats桃園-當日達標獎勵與新人推薦獎勵的迷思(2019/07/01更新) @ 大小人 
  10. 數位時代—王郁倫 (2019, October 15)
    5萬外送員是雇傭還承攬?Uber Eats、foodpanda現身說:讓我們有下一個七年!

本文轉載自人機共生你我它,原文為〈[談評價系統與行為] 不適切的評價系統如何影響食物平台外送員?以及你、我?

文章難易度
人機共生你我它_96
12 篇文章 ・ 3 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。

0

1
0

文字

分享

0
1
0
用這劑補好新冠預防保護力!免疫功能低下病患防疫新解方—長效型單株抗體適用於「免疫低下族群預防」及「高風險族群輕症治療」
鳥苷三磷酸 (PanSci Promo)_96
・2023/01/19 ・2882字 ・閱讀時間約 6 分鐘

本文由 台灣感染症醫學會 合作,泛科學企劃執行。

  • 審稿醫生/ 台灣感染症醫學會理事長 王復德

「好想飛出國~」這句話在長達近 3 年的「鎖國」後終於實現,然而隨著各國陸續解封、確診消息頻傳,讓民眾再度興起可能染疫的恐慌,特別是一群本身自體免疫力就比正常人差的病友。

全球約有 2% 的免疫功能低下病友,包括血癌、接受化放療、器官移植、接受免疫抑制劑治療、HIV 及先天性免疫不全的患者…等,由於自身免疫問題,即便施打新冠疫苗,所產生的抗體和保護力仍比一般人低。即使施打疫苗,這群病人一旦確診,因免疫力低難清除病毒,重症與死亡風險較高,加護病房 (ICU) 使用率是 1.5 倍,死亡率則是 2 倍。

進一步來看,部分免疫低下病患因服用免疫抑制劑,使得免疫功能與疫苗保護力下降,這些藥物包括高劑量類固醇、特定免疫抑制之生物製劑,或器官移植後預防免疫排斥的藥物。國外臨床研究顯示,部分病友打完疫苗後的抗體生成情況遠低於常人,以器官移植病患來說,僅有31%能產生抗體反應。

疫苗保護力較一般人低,靠「被動免疫」補充抗新冠保護力

為什麼免疫低下族群打疫苗無法產生足夠的抗體?主因為疫苗抗體產生的機轉,是仰賴身體正常免疫功能、自行激化主動產生抗體,這即為「主動免疫」,一般民眾接種新冠疫苗即屬於此。相比之下,免疫低下病患因自身免疫功能不足,難以經由疫苗主動激化免疫功能來保護自身,因此可採「被動免疫」方式,藉由外界輔助直接投以免疫低下病患抗體,給予保護力。

外力介入能達到「被動免疫」的有長效型單株抗體,可改善免疫低下病患因原有治療而無法接種疫苗,或接種疫苗後保護力較差的困境,有效降低確診後的重症風險,保護力可持續長達 6 個月。另須注意,單株抗體不可取代疫苗接種,完成單株抗體注射後仍需維持其他防疫措施。

長效型單株抗體緊急授權予免疫低下患者使用 有望降低感染與重症風險

2022 年美、法、英、澳及歐盟等多國緊急使用授權用於 COVID-19 免疫低下族群暴露前預防,台灣也在去年 9 月通過緊急授權,免疫低下患者專用的單株抗體,在接種疫苗以外多一層保護,能降低感染、重症與死亡風險。

從臨床數據來看,長效型單株抗體對免疫功能嚴重不足的族群,接種後六個月內可降低 83% 感染風險,效力與安全性已通過臨床試驗證實,證據也顯示該藥品針對 Omicron、BA.4、BA.5 等變異株具療效。

六大類人可公費施打 醫界呼籲民眾積極防禦

台灣提供對 COVID-19 疫苗接種反應不佳之免疫功能低下者以降低其染疫風險,根據 2022 年 11 月疾管署公布的最新領用方案,符合施打的條件包含:

一、成人或 ≥ 12 歲且體重 ≥ 40 公斤,且;
二、六個月內無感染 SARS-CoV-2,且;
三、一周內與 SARS-CoV-2 感染者無已知的接觸史,且;
四、且符合下列條件任一者:

(一)曾在一年內接受實體器官或血液幹細胞移植
(二)接受實體器官或血液幹細胞移植後任何時間有急性排斥現象
(三)曾在一年內接受 CAR-T 治療或 B 細胞清除治療 (B cell depletion therapy)
(四)具有效重大傷病卡之嚴重先天性免疫不全病患
(五)具有效重大傷病卡之血液腫瘤病患(淋巴肉瘤、何杰金氏、淋巴及組織其他惡性瘤、白血病)
(六)感染HIV且最近一次 CD4 < 200 cells/mm3 者 。

符合上述條件之病友,可主動諮詢醫師。多數病友施打後沒有特別的不適感,少數病友會有些微噁心或疲倦感,為即時處理發生率極低的過敏性休克或輸注反應,需於輸注時持續監測並於輸注後於醫療單位觀察至少 1 小時。

目前藥品存放醫療院所部分如下,完整名單請見公費COVID-19複合式單株抗體領用方案

  • 北部

台大醫院(含台大癌症醫院)、台北榮總、三軍總醫院、振興醫院、馬偕醫院、萬芳醫院、雙和醫院、和信治癌醫院、亞東醫院、台北慈濟醫院、耕莘醫院、陽明交通大學附設醫院、林口長庚醫院、新竹馬偕醫院

  • 中部

         大千醫院、中國醫藥大學附設醫院、台中榮總、彰化基督教醫療財團法人彰化基督教醫院

  • 南部/東部

台大雲林醫院、成功大學附設醫院、奇美醫院、高雄長庚醫院、高雄榮總、義大醫院、高雄醫學大學附設醫院、花蓮慈濟

除了預防 也可用於治療確診者

長效型單株抗體不但可以增加免疫低下者的保護力,還可以用來治療「具重症風險因子且不需用氧」的輕症病患。根據臨床數據顯示,只要在出現症狀後的 5 天內投藥,可有效降低近七成 (67%) 的住院或死亡風險;如果是3天內投藥,則可大幅減少到近九成 (88%) 的住院或死亡風險,所以把握黃金時間盡早治療是關鍵。

  • 新冠治療藥物比較表:
藥名Evusheld
長效型單株抗體
Molnupiravir
莫納皮拉韋
Paxlovid
帕克斯洛維德
Remdesivir
瑞德西韋
作用原理結合至病毒的棘蛋白受體結合區域,抑制病毒進入人體細胞干擾病毒的基因序列,導致複製錯亂突變蛋白酵素抑制劑,阻斷病毒繁殖抑制病毒複製所需之酵素的活性,從而抑制病毒增生
治療方式單次肌肉注射(施打後留觀1小時)口服5天口服5天靜脈注射3天
適用對象發病5天內、具有重症風險因子、未使用氧氣之成人與兒童(12歲以上且體重至少40公斤)的輕症病患。發病5天內、具有重症風險因子、未使用氧氣之成人與兒童(12歲以上且體重至少40公斤)的輕症病患。發病5天內、具有重症風險因子、未使用氧氣之成人(18歲以上)的輕症病患。發病7天內、具有重症風險因子、未使用氧氣之成人與孩童(年齡大於28天且體重3公斤以上)的輕症病患。
*Remdesivir用於重症之適用條件和使用天數有所不同
注意事項病毒變異株藥物交互作用孕婦哺乳禁用輸注反應

免疫低下病友需有更多重的防疫保護,除了戴口罩、保持社交距離、勤洗手、減少到公共場所等非藥物性防護措施外,按時接種COVID-19疫苗,仍是最具效益之傳染病預防介入措施。若有符合施打長效型單株抗體資格的病患,應主動諮詢醫師,經醫師評估用藥效益與施打必要性。

文章難易度

0

1
0

文字

分享

0
1
0
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

國民法官生存指南:用足夠的智識面對法庭裡的一切。

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

聯經出版_96
27 篇文章 ・ 16 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

1

2
0

文字

分享

1
2
0
你覺得 AI 會思考嗎?從圖靈測驗到 AlphaGo ,持續進步的人工智慧——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/26 ・2373字 ・閱讀時間約 4 分鐘

原本人類就對機器有些好奇:機器會思考嗎?機器有智力嗎?機器會有智力嗎?

這些問題本來還不急著回答,但是當研究人員在一九四三年創造出第一台現代電腦,也就是電子、數位、可編寫程式的機器之後,這些問題就顯得急迫了。

這些問題看來格外費解,因為智力的本質一直都沒有答案。

機器有智力嗎?會思考嗎?圖/Pexels

機器人有智力嗎?圖靈測試出現

數學家與解碼專家亞倫.圖靈(Alan Turing)在一九五○年提出解決方案,他的文章標題相當謙和,他在〈計算機器與智力〉一文中建議完全擱置機器智力的問題。圖靈認為真正重要的不是機制,而是智力的展現;他解釋說,因為其他生物的內在生命仍不可知,所以我們衡量智力的唯一方法就是觀察外部行為。圖靈用這個觀點避開長達數世紀的哲學辯論,不去討論智力的本質。

他所推出的「模仿遊戲」就是讓一台機器操作熟練到觀察者無法區別機器和人類的行為,屆時,這台機器就可以貼上「擁有智力」的標籤。

圖靈測試就出現了。

很多人望文生義,從字面解釋圖靈測試,想像著機器人符合條件的話就會和人一樣(如果真有其事的話)。實際應用上,在遊戲或競賽等定義明確、狀況設定清楚的活動中,圖靈測試可有效衡量「有智力的」機器表現如何。圖靈測試並不要求機器做到和人類完全無法區分的地步,而是要判斷機器的表現是不是像人;在這過程中,圖靈測試著重於表現,而非過程。

這樣的產生器算人工智慧,倒不是因為的模型細節符合什麼標準,而是因為他們寫出來的訊息很接近人類寫出來的訊息,能通過測試是因為這模型經過訓練,運用大量線上資訊。

電影《模仿遊戲》改編 自圖靈於二戰期間,幫助破譯納粹軍事密碼的真實故事。圖/IMDb

人工智慧怎麼「學習」?

一九五六年,科學家約翰.麥卡錫(John McCarthy)進一步定義了人工智慧:

若機器可執行「需要人類智力才能進行的工作」,即具備人工智慧。

圖靈和麥卡錫對人工智慧的評估自此形成基準,將我們的焦點從智力的定義轉移到表現(看似有智的行為)的評估上,不再聚焦於人工智慧這個詞在更深奧的哲學、認知與神經科學層面。

過去的半個世紀以來,機器幾乎都無法呈現這種智力,這條死路好像已經走到底了。電腦在精確定義的程式基礎上運作數十年,但因為電腦既靜態且僵化,所以電腦分析也受到局限;傳統的程式可以組織大量資料,執行複雜的計算,可是卻無法辨識類似物品的圖片,或適應不準確的輸入項目。

人類思想不精確又模糊,確實是人工智慧發展過程中難以排除的障礙。然而,過去的十年內,創新的運算方式已經創造出新的人工智慧,模稜兩可的程度可和人類相提並論。人工智慧也不精確、恆動、隨機應變,並且能夠「學習」。

人工智慧「學習」的方式就是先消化資料,然後從資料中觀察,得出結論。

過去的系統需要精確地輸入和輸出項目,不精確的功能人工智慧就不需要。人工智慧在翻譯的時候,不會把每個字都替換掉,而是會找出模式和慣用語,因此翻出來的譯文也會一直變化,因為人工智慧會隨著環境變遷而進化,還能辨識出對人類很新奇的解決方案。在機器領域裡,這四種特質都具有革命性。

以前需仰賴專業棋士,將棋路編寫為程式。圖/Pexels

以阿爾法元在西洋棋世界的突破來說,以前的西洋棋程式要倚賴人類的專業,把人類的棋路編寫為程式;但阿爾法元的技巧是自己和自己對戰數百萬場後磨練出來的,軟體從對戰過程中自己發現了模式。

飛快進步的演算法

這些「學習」技巧的基石是演算法,而演算法就是一連串的步驟,把輸入項目(例如遊戲規則或棋子的走法)翻譯成可重複的輸出項目(例如獲勝)。經典演算法例如長除法等計算,必須精準、可預測,機器學習演算法則不用;經典演算法有許多步驟,分別產出精準的結果,機器學習演算法則一步一步改善不精準的結果。

這些技巧目前進步飛快,以航空來說,很快地,人工智慧就能成為各種飛行器的正駕駛或副駕駛了。在美國國防部高等研究計劃署(DARPA)的專案「阿爾法纏鬥」(Alpha Dogfight)中,人工智慧戰機飛行員在模擬戰鬥中的表現超越了人類飛行員;不管是要操縱噴射機參戰或操縱無人機送貨,人工智慧都會劇烈影響軍事與民用航空。

人工智慧能成為各種飛行器的駕駛。圖/Pexels

儘管我們現在看到的創新還只是開端,但這些變化已經微妙地改變了人類體驗的紋理,在接下來的數十年內,這趨勢只會愈來愈快。

驅動人工智慧轉型的科技概念很複雜也很重要,所以本章會特別解釋機器學習的演化、現況與應用,說明儘管機器學習強大到讓人害怕,但也有自身的限制。

我們必須先簡介機器學習的架構、能力和限制,才能理解機器學習將帶來的社會、文化和政治變化。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

所有討論 1
聯經出版_96
27 篇文章 ・ 16 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。