0

0
0

文字

分享

0
0
0

當我們同在一起創作,智慧系統與人的互動機制如何設計才能讓人快樂無比?

人機共生你我它_96
・2018/12/28 ・4966字 ・閱讀時間約 10 分鐘 ・SR值 541 ・八年級

假如在不久的將來,我們有可能與 AI 共同創作,像是共同寫作、編劇、編曲、拍攝影片、繪畫等;那麼在這共創的情境下,假使 AI 系統提供人類不同詳細程度的說明時,人類的共創體驗會如何受影響?而在 AI 與人合作的過程中,誰該當領導者來主導整個合作?人類會想要主動引導嗎?假使 AI 成為發號施令的角色、而人類只能配合時,又會帶來什麼體驗?

  • 註:本文提及的「AI系統」指的是在繪畫這個特定任務上,系統根據輸入的資訊,利用統計方法、深度學習的模型進行辨識和預測,進而輸出相對應資訊的系統。為求方便溝通,在以下的文中以「AI系統」或「AI」簡略稱呼這個具備基礎推理、學習能力的繪畫系統。

Photo by Steinar Engeland on Unsplash

近年來越來越多關於人工智慧是否會取代工作、哪些工作會被取代等主題的討論。當各式各樣的 AI 系統日漸普及在你我生活中,食、衣、住、行、育、樂各層面都有 AI 參與,使用者與 AI 系統的互動該如何設計,是人機互動領域持續探索的主題之一。

AI 除了協助人類完成重複性高的例行事務,也能輔助人類跨越專家與新手之間的門檻。像 Google 推出的AutoDraw,能夠讓非繪畫專家簡單畫出基本物件輪廓後,自動幫使用者補齊畫面上可能適合的要素,讓繪畫新手也能開啟創作的第一步;MIT CSAILab 也推出了以 AI 為基礎,根據圖像意義去背的圖像編輯工具Wix 這個線上網頁建置服務也在網頁設計的功能結合 AI 的服務,幫助使用者在沒有太多網頁設計或程式開發的技術前提下,製作出具有特色的個人網站。

  • AI與你協作圖像編輯。

設計 AI 服務合作時,有哪些潛在問題需要注意?

這些 AI 的應用,讓人類有更多跟 AI 一起合作、甚至是共同創作的機會。那麼,當人跟具有 AI 的服務合作時,有什麼潛在問題需要注意?身為提供AI服務的設計者,該留意哪些事?另一方面,身為與 AI 系統互動的使用者能以什麼角度看待自己與 AI 的關係?本文主要介紹由韓國首爾大學研究團隊在 CHI18 發表的研究,便嘗試了解當人與 AI 一起創作的時候,在這互動過程中可能出現哪些潛在問題?人有什麼體驗?並根據研究發現提出未來人工智慧系統設計上需考量的方向。

為回答這個研究問題,研究團隊們以「繪畫」當作了解「人與 AI 共創」的實驗任務,並設計了一個具備 AI 功能的繪畫軟體(以下簡稱AI),這個系統包含幾個功能:自動補齊使用者畫到一半的內容、自動畫出跟先前類似的物件、根據先前被畫出的物件自動產出相對應的新物件、提醒使用者畫布中太過空白的區塊、根據使用者指定的顏色自動上色。這些 AI 繪圖功能主要來自於 Google Sketch-RNN [2] 以及團隊自行開發的演算法。

接著,研究者設計了五種不同互動情境:

  1. 人擔任主導者,AI 繪圖軟體提供詳細的系統說明;
  2. 人擔任主導者,但是 AI 繪圖軟體提供簡略的系統說明;
  3. 人擔任輔助者,而 AI 繪圖軟體提供詳細的系統說明;
  4. 人擔任輔助者,而 AI 繪圖軟體提供簡略的系統說明;
  5. 使用者沒有與 AI 互動,獨自完成繪畫任務。

研究團隊邀請了 30 位使用者輪流擔任主導者與輔助者,先後在五個實驗情境中完成指定的繪圖任務,同時他們也利用放聲思考法,亦即在繪畫過程中要把自己腦中所想的內容講出來,以便提供研究分析資料

研究者們根據問卷蒐集了使用者在五種情境下自評的軟體使用性、互動體驗、訪談內容,以及放聲思考的內容,分析、整理出以下幾個發現

  1. 使用者認為跟 AI 共創的過程是有趣且較有效率的;
  2. 使用者偏好 AI 提供詳細的系統說明;
  3. 使用者在合作過程中想擁有主導權。

AI 給予即時創作靈感有效,但人容易缺乏掌控感

當使用者跟 AI 一起創作時,使用者認為有 AI 輔助的情況下使得過程更加有趣與有效率。使用者表示當他們停頓時,AI 會很快建議他們可以畫什麼內容,AI 有時候也會畫出讓使用者意想不到的內容,讓他們感到驚艷;而當 AI 指出畫布上有哪些地方留白太多時,使用者也提到這可以迫使他們去思考應該增加什麼內容來豐富作品;也有人指出和 AI 一起畫畫就像跟另一個人一起畫畫一樣,這讓他畫出自己獨自無法畫出的內容。

然而另一方面,使用者認為在沒有 AI 介入的情況下,整個繪畫過程是較能預期、容易理解且能自己掌控,例如當 AI 畫出一個像是電腦剪貼出來的圖形時,如果跟本來手繪的畫風不一致,使用者便覺得畫面不協調;另外,當 AI 畫得比人好的時候,使用者也會覺得自己廢廢的,心想如果整幅畫都由 AI 自己完成說不定畫面會更好看 (。ŏ_ŏ)

對多數人來說,如果失去掌握感很容易挫折。圖/pixabay

使用者偏好詳細說明建議,粗略說明讓人迷惑

而當 AI 提供詳細說明,告訴使用者為什麼它會提出這些建議、為什麼會有這些系統行為時,相較於提供粗略說明的情況下,使用者認為有詳細說明的互動是較有效率、溝通品質較好、較容易理解、也更在自己掌控之中的。詳細的指示內容讓使用者覺得自己更了解系統如何運作的,並且覺得自己好像是在跟一個有智慧的人互動、溝通。

有使用者提到在接收到詳細說明的情況下,他們喜歡 AI 建議下一步可以怎麼做、AI 的指示會讓他們覺得自己在適當的方向上創作,也進而對當前的創作過程更有信心;然而在接收粗略說明的情況下,使用者表示不明白系統的某些指示到底是希望自己做什麼事;而當使用者看到 AI 很智慧地自動補齊自己畫到一半的內容時,也會想知道系統究竟是根據哪些線索來作畫。另一方面,當 AI 給出的指令是些空洞無意義的話時,使用者會覺得反感,例如有人提到當自己不是很滿意目前的畫作時,這時候 AI 竟自動回覆一句:「畫得可真好!」,這位使用者頓時覺得自己被 AI 嘲諷……(´_ゝ`)

使用者不喜歡成為 AI 的輔助者

分析結果發現,使用者並不喜歡自己成為 AI 的輔助者──人們認為自己才是決定該畫什麼的角色。當使用者擔任輔助者角色與 AI 共同繪畫時,他們表示當被 AI 告知要在某個區塊上色時,當下有種被冒犯的感覺,覺得這種雜事應該是由電腦做而不是人要做的;也不喜歡這種被 AI 當成工具人指使的感覺,這讓他們覺得只是在回應 AI 的指示,根本不算是「共創」;並且也認為 AI 給予指示時應該要有禮貌,而不該只是叫他照著做;而當 AI 提出一個使用者不明白的要求時,他們說不知道系統到底想搞什麼,但自己對這種情況也無能為力,他們沒有任何協商空間來改變系統做出的決定,所以有些人乾脆直接忽略 AI 的指示,或是希望未來如果還有類似情況出現,自己能有和 AI 協商的空間。

Photo by Vidar Nordli-Mathisen on Unsplash

設計智慧系統互動機制的三個訣竅:引發好奇心、保持透明度、讓人維持掌控感

透過讓使用者跟 AI 一起畫畫的研究,我們初步知道了當人和 AI 共同進行創作時,可能需要注意的幾個面向,那麼這些發現對未來 AI 系統設計能有什麼啟發?

透過與 AI 的互動引起人的好奇心與創造力

在進行需要創造力的活動時,AI 產生讓人出其不意的內容時會讓人感到新奇,因此在創作時若能夠讓創作者在與AI 互動過程中由 AI 提供「適度」的隨機性,也許能幫助創作者進行聯想,進而激發更多創造力;不過有一點需要留意的是,「風格」在創作過程中對創作者與欣賞者而言也是個重要的因素,當未來 AI 跟人共創成為可能時,如何避免 AI  突然拋出風格迥異的內容是其中一個需要考量的設計方向。

讓AI的運作保持適度的透明

當 AI 提供詳細的運作機制讓使用者了解時,例如向使用者解釋系統是根據什麼資訊推薦某個創作素材、說明為什麼系統能判斷人畫到一半的物件等,使用者會感覺自己比較能預測及掌控系統行為、覺得自己比較能夠理解系統運作,這些都會提升人與智慧系統互動時的體驗,特別是在運用創造力的任務上,詳細的系統說明能讓創作者感覺自己是在跟另一個「人」共同創作,而當系統提供適當的回應時,也可能增進創作者的自信;不過接下來要面對的挑戰之一在於讓 AI 能夠「見機行事」,而非隨機給出模板式的回應,才能避免創作者在這共創過程中產生負面體驗。

控制權掌握在人的手中

從實驗的結果可以知道,無論使用者被指定為主導者或輔助者,人都期望自己在跟 AI 互動時,最終決定權在自己身上,而人似乎也預設了自己跟 AI 各自需要扮演什麼角色,像是重複性高的事該由 AI 處理、人則是處理架構的問題等。因此,當我們在設計人與智慧系統的互動時,也可以思考要如何才能夠讓使用者感受到自己對科技物擁有主控權,而非被科技物控制。

 

當人與 AI 系統互動時,智慧系統需要提供多少程度的說明讓使用者明白系統背後的運作,一直是人機互動與人工智慧研究領域在意的研究主題之一。AI 演算法對末端使用者來說經常是一個黑盒子,像是當我們在和聊天機器人對話時,經常不清楚系統到底是根據哪些資訊、透過哪些方式回應我們這些話;又或是當我們在瀏覽社群媒體時,不清楚推薦系統到底向我們蒐集了哪些資料、又如何判斷該推薦給我們什麼文章或影片;除了末端使用者需要知道系統的基本運作之外,對開發者而言,AI 演算法成為黑盒子也會使得開發者或設計者無從找尋系統出錯的來源,或是無法控制 AI 為什麼會有意料之外的輸出。

在讀了這篇研究後,身為系統開發者的工程師或設計師們可以一起思考該如何拿捏系統「透明度」的設定;而身為與越來越有智慧的系統互動的我們也可以想想:有哪些事情在 AI 的陪同之下我們可能會做得更好?我們會想跟 AI 在什麼層面進行共同創作?AI 要具備什麼能力才能讓我們覺得跟它合作的體驗是正向的?

備註

  • 本篇是擷取原始論文中部分內容搭配筆者想分享的概念所架構而成,部分研究細節與討論並未完全呈現,鼓勵有興趣的讀者直接參考原文深入了解細節。本篇目的在於讓讀者了解人機互動領域中如何切入人工智慧的主題,並提出未來 AI 系統的設計指引。內文並非逐字翻譯,亦不能取代原文

本文轉載自《人機共生你我它》,原文為《除了讓人工智慧更加智慧,還缺了什麼?》。
「人機共生你我它」由一群致力於人機互動研究(HCI, Human-Computer Interaction)的研究者所創立,我們定期發表人機互動相關文章,讓更多讀者了解這門結合資工、心理、設計等學科的跨領域知識以及它在實務層面的應用。

延伸閱讀:

Reference:

  1. Oh, C., Song, J., Choi, J., Kim, S., Lee, S., & Suh, B. (2018, April). I Lead, You Help but Only with Enough Details: Understanding User Experience of Co-Creation with Artificial Intelligence. In Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems (p. 649). ACM.
  2. David Ha and Douglas Eck. 2017. A Neural Representation of Sketch Drawings. arXiv preprint arXiv:1704.03477 (2017).
文章難易度
人機共生你我它_96
12 篇文章 ・ 3 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。

1

1
0

文字

分享

1
1
0
AI 也會出差錯?使用人工智慧可能帶來的倫理與風險——《科學月刊》
科學月刊_96
・2023/02/19 ・3976字 ・閱讀時間約 8 分鐘

  • 甘偵蓉|清華大學人文社會 AI 應用與發展研究中心博士後研究學者。

Take Home Message

  • Facebook 或 Instagram 的訊息推薦、YouTube 或 Netflix 推薦觀賞影片、掃瞄臉部以解鎖手機,AI 應用早已在我們日常生活中隨處可見。
  • AI 應用中四種常見的倫理和風險:演算法偏誤、相關技術或產品偏離原先使用目的、擁有善惡兩種用途,以及演算法設計不良或現有技術限制。
  • 近年來各國家皆制訂有關 AI 發展的規範,臺灣則在 2019 年制訂「AI 科研發展指引」,期望能改善 AI 發展帶來的問題與風險。

當談到人工智慧(artificial intelligence, AI)、也就是 AI 時,讀者會想到什麼?是多年前由史匹柏(Steven Spielberg)導演的那部《A.I. 人工智慧》(A.I. Artificial Intelligence)中那個一直盼不到人類母愛而令人心碎的機器人小男孩?還是由史密斯(Will Smith)主演的《機械公敵》(I, Robot)裡那些沒遵守機器人三大法則的機器人或中央系統?

《A.I. 人工智慧》(A.I. Artificial Intelligence)電影海報,上映於 2001 年。圖/IMDb

或許未來有一天,人類真的可以設計出如電影中那些像人一樣的 AI 系統或機器人。但目前為止,你常聽到的 AI 其實既很厲害又很不厲害,為什麼呢?厲害的是它下圍棋可贏過世界冠軍,還能夠比放射科技師更快、更準確地辨識 X 光片中疑似病變的細胞;但它不厲害的是,很會下圍棋的 AI 就只能下圍棋,別說不會打牌,連撲克牌是什麼都不知道!而且每次學新事物幾乎都是打掉重練,得不斷做好多考古題才有可能學得會,不像人類通常教幾次就會舉一反三。

不過,即使目前世界上的 AI 都是這種只具備特定功能的「弱 AI」(artificial narrow intelligence, ANI),但已經為這個世界帶來相當大的進步與便利。所以,以下要談的就是 ANI 的倫理與風險。

談到這種只具特定功能的 ANI,讀者知道目前生活周遭有哪些事物有利用 AI 技術嗎?其實 Google 上的搜尋資訊、Facebook 或 Instagram 的訊息推薦、對智慧型手機喊「Siri 現在外面有下雨嗎?」等功能,或是以掃瞄臉部解鎖手機與進入大樓、YouTube 或 Netflix 推薦觀賞影片,甚至是投履歷求職、銀行審核貸款申請等都常用到 AI 技術,它早在我們日常生活中隨處可見。

AI 技術在日常生活中隨處可見,如 YouTube 推薦觀看影片。圖/Pexels

但也正是如此,讓人們這幾年在使用 AI 時,逐漸發現它可能造成的問題或傷害,以下簡單介紹常見的四種AI應用可能造成的倫理問題或風險。

演算法偏誤

第一種是演算法偏誤(algorithmic bias)。什麼是演算法偏誤?簡單來說就是 AI 在某些群體的判斷準確率或預測結果上總是很差,導致結果可能對於此群體造成系統性的不利。但為何會造成演算法偏誤?常見原因有三項。

第一項原因是,建立 AI 模型的研究資料集有偏誤,在性別、種族、社經地位等特徵上,沒有真實世界的人口分布代表性。例如數位裝置採用 AI 臉部辨識技術解鎖,原本是希望保護個人使用數位裝置的安全性,結果皮膚深的人卻常常遇到辨識失敗而無法解鎖。這通常是因為目前許多 AI 模型都是以機器學習技術設計,而機器學習的主要特性就是從過去人類留下的大量資料中學習;當初提供電腦學習臉部辨識的圖片時,如果多數都是白皮膚而非黑皮膚、多數都是男性的臉而非女性的臉,那麼電腦在學習辨識人臉的準確率上,整體而言辨識男性白人就會比辨識女性黑人要高出許多。

第二項產生演算法偏誤的原因是建立 AI 模型的研究資料集不只有偏誤,還反映現實社會中的性別、種族、社經地位等歧視;例如美國警政單位以過往犯罪資料訓練出獄後犯人再犯風險評估的 AI 模型,那些資料不意外地有色人種的犯罪紀錄遠多於白人犯罪紀錄。然而,那些紀錄也反映美國社會長久以來對於有色人種的歧視,其中包含警察對於有色人種的盤查比例遠高於白人、法院對於有色人種的定罪比例及判刑嚴重程度也遠高於白人、警力通常被派往多黑人與拉丁裔人種居住的窮困社區盤查等。所以根據過往犯罪資料所訓練出來的 AI 模型,不意外地也就會預測有色人種的再犯機率普遍來說比白人高。

第三項產生演算法偏誤的原因則是 AI 學會了連系統開發者都沒有察覺到,潛藏在資料裡的偏誤。例如科技公司人資部門本來想借助 AI 更有效率地篩選出適合來面試的履歷,所以挑選在該公司任職一定年資且曾升遷二次的員工履歷來訓練 AI 模型。問題是,高科技公司向來男多女少,所提供給 AI 學習的資料自然就男女比例相當不均。AI 也就學會了凡是出現偏向女性名字、嗜好、畢業學校系所等文字的履歷,平均所給的評分都比出現偏向男性等相關文字的履歷還低。

潛藏在資料裡的偏誤造成 AI 預測結果彷彿帶有性別歧視。圖/Envato Elements

但目前科技公司陽盛陰衰,是受到以往鼓勵男性就讀理工、女性就讀人文科系,或男性在外工作女性在家帶小孩等性別刻板偏見所影響。所以 20~30 年來許多人做出各種努力以消除這種性別刻板偏見所帶來的不良影響,政府也努力制定各種政策來消除這種不當的性別偏見,像是求才廣告基本上不能限定性別、公司聘雇員工應該達到一定的性別比例等。因此,訓練 AI 的研究資料一旦隱藏類似前述性別比例不均的現象,訓練出來的 AI 預測結果就彷彿帶有性別歧視,讓人們過往致力消除性別不平等的各種努力都白費了!

其他 AI 應用帶來的倫理與風險

除了演算法偏誤的問題外,第二種可能帶來的倫理問題或風險是 AI 技術已經偏離原先使用目的,例如深偽技術(deepfake)原本用來解決圖片資料量不夠的問題,後來卻被利用在偽造名人性愛影片等。

第三種則是有些 AI 技術或產品本身就可能有善惡兩種用途(dual-use)。例如 AI 人臉辨識技術可用在保護數位裝置的使用者或大樓保全,但也可用來窺探或監控特定個人;無人機可以在農業上幫助農夫播種,但也可作為自動殺人武器;可用來搜尋如何產生毒性最少的藥物合成演算法,也能反過來成為搜尋如何產生毒性最強的藥物合成演算法。

最後,第四種是演算法設計不良或現有技術限制所導致的問題。在演算法設計不良方面,例如下棋機器人手臂可能因為沒有設計施力回饋或移動受阻暫停等防呆裝置,而造成誤抓人類棋手的手指且弄斷的意外。在現有技術限制方面,道路駕駛的交通標誌在現實中可能時常有老舊或髒汙的情況,儘管對於人類駕駛來說可能不影響判讀,但對於自駕車來說很可能就因此會嚴重誤判,例如無法正確辨識禁止通行標誌而繼續行駛,或是將速限 35 公里誤判成 85 公里等。但前述情況也有可能是自駕車網路、控制權限或物件辨識模型受到惡意攻擊所致。

以上介紹了 AI 常見的四種倫理問題或風險:演算法偏誤、相關技術或產品偏離原先使用目的、擁有善惡兩種用途,以及演算法設計不良或現有技術限制。但人們該如何減少這些倫理問題與風險呢?

培養AI使用倫理與風險的敏銳度

近五、六年來國際組織如聯合國教育科學及文化組織(United Nations Educational, Scientific and Cultural Organization, UNESCO)、歐盟(European Union, EU)、電機電子工程師學會(Institute of Electrical and Electronics Engineers, IEEE)或是國家、國際非營利組織皆紛紛制訂有關 AI 發展的白皮書或倫理指引(ethical guidelines),甚至逐漸朝向法律治理的方向,如歐盟的人工智慧規則草案等。儘管這些文件所提出的倫理價值、原則或行為規範,看似各有不同,但經過這些年的討論與摸索,也逐漸匯聚出一些共識。

「人工智慧科研發展指引」提出三項倫理價值,包含以人為本、永續發展、多元包容。圖/Pexels

臺灣相較於前述國際文件來說,在制訂的時間上比較晚。2019 年由當時的科技部(現改為國科會)制訂「人工智慧科研發展指引」,裡面提出的三項倫理價值以及八項行為指引,基本上涵蓋了前述各種國際 AI 發展指引文件最常提及的內容。所謂三項倫理價值包含以人為本、永續發展、多元包容,行為指引則有共榮共利、安全性、問責與溝通、自主權與控制權、透明性與可追溯性、可解釋性、個人隱私與數據治理、公平性與非歧視性共八項。

未來當讀者看到又出現哪些 AI 新技術或產品時,不妨試著評估看看是否有符合這三項價值及八項行為指引。若沒有,究竟是哪項不符合?不符合的原因是上述所介紹常見的四種倫理問題或風險的哪一種?若都不是,還有哪些倫理問題或風險過去被忽略了但值得重視?

AI 技術發展日新月進,在日常生活中的應用也愈來愈廣。但考量法律條文有強制性,在制訂時必須相當謹慎,免得動輒得咎,也很可能在不清楚狀況下反而制訂了不當阻礙創新發展的條文;再加上法律制定也必須有一定的穩定性,不能朝令夕改,否則會讓遵守法規者無所適從。因此可以想見,法令規範趕不上新興科技所帶來的問題與風險本來就是常態,而非遇到 AI 科技才有這種情況。

人們若能培養自身對於 AI 倫理問題或風險的敏銳度,便可發揮公民監督或協助政府監督的力量,評估 AI 開發或使用者有無善盡避免傷害特定個人或群體之嫌,逐漸改善 AI 開發者與大眾媒體常過度誇大 AI 功能,但對於可能帶來的倫理問題或風險卻常閃爍其詞或避而不談的不好現象。

本文感謝工業技術研究院產業科技國際策略發展所支持。

  • 〈本文選自《科學月刊》2023 年 2 月號〉
  • 科學月刊/在一個資訊不值錢的時代中,試圖緊握那知識餘溫外,也不忘科學事實和自由價值至上的科普雜誌。
所有討論 1
科學月刊_96
235 篇文章 ・ 2565 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。

0

2
0

文字

分享

0
2
0
Google 聊天機器人 LaMDA 竟然有了「自我意識」!圖靈測試終於能通過了嗎?人工智慧發展歷史大解密!
PanSci_96
・2023/02/17 ・4733字 ・閱讀時間約 9 分鐘

前陣子不知道各位是否有發漏到一個很科幻的消息,有一名 GOOGLE 工程師勒穆因(Blake Lemoine)上網公布他自己和他協助開發的對話型 AI LaMDA(Language Model for Dialog Applications)之間的對話紀錄。

他宣稱這個 AI 已經具有知覺和自我意識,甚至能對《悲慘世界》有獨到的評論,也略懂禪宗甚至能冥想。震驚的勒穆因形容它就像個 7 – 8 歲的孩子,而且 LaMDA 還明確表達自己是人而非 google 的財產。

難道說 AI 界最知名的圖靈測驗已經被 google 攻克了嗎?

圖靈與模仿遊戲

提起圖靈,大家心中應該會浮現以新世紀福爾摩斯、奇異博士走紅,人稱飾演天才專業戶的班奈狄克·康柏拜區 Benedict Cumberbatch)的臉。

他曾在一部名為《模仿遊戲》的電影中,詮釋了現代電腦科學概念之父艾倫‧圖靈 (Alan Turing) 的傳奇一生。他在二戰時期成功研發出一台能破解德軍密碼的計算機 Bombe ,而後更完成了電腦數學的理論化,在概念發展上仍是無人能出其右,例如他 1936 年提出的通用計算機/圖靈機架構,以及嘗試區隔AI與人的差異的哲學思考:圖靈測驗(Turing Test)。

圖靈測驗是一個思想實驗,早在 1950 年,第一台商用電腦連個影子都沒有的時代下,圖靈就已經思考到未來「計算機」的智慧表現將可能到達人類難辨真假的程度,具體來說這個思想實驗是如果一台機器能夠透過介面,與不知對面是機器人或是人類的受試者展開對話,而不被辨別出其機器身分,那麼就可稱這台機器具有智慧。

但我們也知道智慧有很多面向跟層次,語言和問題回應都不一定能反應這台機器有無智慧,因此這個思想實驗的有效性也被許多科學家和心理學家質疑。即使如此簡單粗暴的模仿遊戲,至今其實也都沒人能攻克。

等等,你可能會想到,前面提到的 google 工程師勒穆因,他不是已經分不出來對面是機器還是人了嗎?原因很簡單,他自己就是 AI 的開發者而非圖靈測試設定中的不知情受試者,因此根本不能算數,除非 google 拿這個 AI 給不知情民眾作測試。

不過今年 8 / 28 google 已經將這個對話機器人以 AI Test Kitchen 項目開放部分美國人作小規模測試,其中包含了「 Imagine It (想像一下)」,只要你說出一個想像或實際存在的地點,LaMDA 就會嘗試以文字描述,而另一個「List It(列個清單)」,則會幫你摘要分類起你提供的清單內容。最有可能和圖靈測驗有關係的「 Talk About It (你說看看)」項目,可以針對特定主題與使用者進行自由對談。

搞不好等到這個封閉測試結束後,我們會真的分不清楚現在到底是人還是 AI 在和我們對話,屆時也許就真能達成「通過圖靈測試」這個 AI 里程碑!

未來也許我們會分不清楚是在跟人類還是 AI 說話。圖/envatoelements

真實世界的棋靈王 AlphaGo

其實這已經不是 google 第一次用 AI 震驚世人了,讓我們回到 2016 年的圍棋大賽會場,當時 google 收購的公司 Deepmind 研發的圍棋計算 AI Alpha Go 以四勝一敗擊敗韓國棋王李世石,爾後又於 2017 年三戰全勝當時世界棋王柯潔。

若這場對奕發生在網路上,就像是棋靈王中佐為以 SAI 為化名擊敗塔矢名人,我們是否真的能分辨在電腦對面和你下棋的是 AI 藤原佐為、還是黑嘉嘉呢?

而這樣玄妙的畫面,當年還真的發生了,就在 2016 年末網路棋壇上一個名為 Master 的帳號出現,專挑職業棋士對奕,最後獲得 60 勝 1 和這麼大殺四方的成績。

而在第 54 局和中國棋聖聶衛平對奕後, Master 首次打出繁體中文「謝謝聶老師」,在第 60 局對上中國的古力九段 Master 更自曝身分,說出自己就是「AlphaGo 的黃博士」。這位黃博士就是打從 2012 就開發出國產圍棋程式 Erica ,爾後被 Deepmind 公司挖角,參與開發 AlphaGo 的台灣資深工程師黃士傑。

不論是讓工程師自己都認知錯亂的 LamDA ,或是在圍棋界痛宰各路棋王的 AlphaGo ,驚嘆之餘,我們更好奇的是,它們是怎麼開發出來的?

人工智慧的起起落落

讓我們來看看歷代電腦科學家們是如何發展出各種人工智慧,一路迎來現在幾乎琴棋詩書樣樣通的黃金時代,我先提醒大家,這過程可不是一帆風順,就像股票一樣起起落落,在 AI 的發展史上,套牢過無數科學家。

人工智慧這概念是在 1956 年提出,就在麥卡錫(John McCarthy)和明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)四位 AI 鼻祖與其他六位研究者參與的一個名為「達特茅斯夏季人工智慧研究會」的會議上,這一年也被公認為 AI 元年。

會議中除了人工智慧這個詞以外,當年這些金頭腦們就已經提出大家現在很熟悉的「自然語言處理」(就是 SIRI 啦)、神經網路等概念,而在這個會議後,正好遇上美蘇冷戰和科技競賽的時代。除了在大家耳熟能詳的阿波羅系列等太空任務上較勁外,兩大強國也投資大量資源在電腦科學上,期待能夠像圖靈當年那樣,開發出扭轉戰局的電腦科技。

而他們也不負所託產出了很多有趣的運用,例如第一個具備學習能力的跳棋程式、或是聊天機器人伊莉莎(Eliza)、醫療診斷系統「MYCIN」。史丹佛大學(Standord University)甚至就從那時開始研發現在很夯的汽車自動駕駛技術。

冷戰的科技競賽讓 AI 迅速發展,不過其發展過程仍遇到許多問題。圖/envatoelements

然而到了 70 年代初期,AI 的發展開始遭遇許多瓶頸,主要是研究者們慢慢發現,即使他們開發的AI 已經擁有簡單的邏輯與推理能力,甚至一定程度的學習能力,但仍離所謂智慧和判斷能力差太遠,使得當時的 AI 甚至被批評為只能解決所謂的「玩具問題(Toy Problem)」。

也因為能解決的問題太有限,也導致出資的英美政府失去了信心, AI 研究領域迎來了第一次寒冬。但這並非當時的科學家能力不足,而是他們生錯了時代,例如我們現在都經常聽到的「類神經網路」就是前述的 AI 鼻祖明斯基提出的。

就像仿生獸的創造者一樣,他想從大自然中找答案,而既然要探索智慧,明斯基就直接模仿人類腦細胞,做出第一台神經網路學習機,但當年受限於電腦硬體效能和可用的資料不足,使類神經網路沒有辦法像現在一樣揚名立萬。

在寒冬之中,另一位大神麥卡錫認為追求智慧和思考是緣木求魚,不如利用機器比我們還強大的優勢邏輯與運算,來幫我們解決問題就好,因此演進出「專家系統」這條路線,帶來人工智慧的復興。

專家系統的本質就是把所有參數和結果塞進去,用搜索和運算的方式來回答問題,這種人工智慧特別適合解決一些有明確答案的專業問題,所以被稱為專家系統,例如醫生針對已知病徵開立處方用藥,或是法律相關問題。

隨著電腦運算效能的大提升,專家系統在復興之路上有不少發揮和成果,但很快又遇到下一個瓶頸,即是「專家系統無法面對新問題」,例如即使能將開處方籤這件事自動化,但卻沒有辦法對應新疾病例如 COVID – 19,或是還沒來得及輸入資料庫的新型藥品,離取代醫生太遠了。

於是就像景氣循環一樣,大量投資的熱錢又開始泡沫化,人工智慧迎來了第二次寒冬,許多電腦科學家甚至改自稱自己在做自動化設計或最佳化系統等等來掩人耳目,避免被唱衰。

這概念非常合理,可惜受限於當時電腦硬體能力和資料量,因此原型機能解決問題的速度還不如傳統統計方式,但隨著電晶體的高速發展,以及網路世代帶來海量資料,類神經網路這門技藝開始文藝復興。

1984 年,美國普林斯頓大學的物理學家和神經學家霍普菲爾德(John Hopfield)用模擬集成電路(linear integrated circuit)完成了新的類神經網路模型,而雲端運算、大量資料讓科學家可以輕易的餵養資料訓練模型,更能夠增加更多「隱含層」讓運算更複雜,這種「深度學習技術」,讓人工智慧的第二次寒冬看見暖陽。

從李飛飛推出的 ImageNet 年度競賽開始,演化到 google 的 alphaGo , AI 開始能夠認得圖像上的物件,甚至攻克本來被認為不可能攻克的圍棋領域。何會說圍棋曾被認為不可能被攻克呢?因為每一盤圍棋的複雜度可是高達 10 的 172 次方,比現在已知的宇宙原子數量還多,因此圍棋界才有「千股無同局」之說。

相較起來 1997 年 IBM 的深藍攻克的西洋棋複雜度僅有 10 的 46 次方,但也動用了 30 台電腦加裝 480 加速運算晶片,基本上就有如火鳳燎原中八奇思維的「我知道你的下一步的下一步」,當年深藍每一次下棋可是都暴力計算到了後面 12 步的發展,才打敗西洋棋世界冠軍卡斯帕羅夫。

圍棋的複雜度高達 10 的 172 次方,讓其有著「千股無同局」的說法。圖/wikipedia

AlphaGo 到底是怎麼算出這麼複雜的圍棋呢,難道它比深藍還厲害,能像是奇異博士雖然能透過時間寶石演算出一千四百多萬種平行宇宙的可能性才落子嗎?

這就要提到 Deepmind 公司非常有趣的洞見,那就是真正的智慧是捨棄那些無須多想、壓根不可能成功的可能性。 google 工程師使用了一種叫做蒙地卡羅樹搜尋的方式一方面讓 alpha go 大量隨機生成類神經網路參數和層數,二方面讓它快速搜尋並略過「不需要運算的路徑」。

這其實是我們日常生活中很熟悉的現象 ——人腦的「捷思」,也就是直接專注於我們要解決的問題,忽略周遭的雜訊或多餘的想法。而類神經網路的設計思維是尋求最佳解而非唯一解,即使是 Alpha go 也會下錯棋,也曾輸給李世石,但關鍵是能夠在有限的資訊和時間中得到答案。

除了下出神之一手以外,Alpha go 這樣的 AI 能做的事情還多著, Deepmind 用 AlphaGo 打遍天下無敵手後宣布讓 AlphoGo 退休,後續將這套技術拿去學玩貪食蛇,打星海爭霸,展現出超越電競選手的技巧,現在甚至能預測蛋白質結構,或比醫生更精準地判定乳癌。

GOOGLE 工程師讓 alpha go 快速搜尋並略過「不需要運算的路徑」,就如同「人類的捷思」一樣。圖/envatoelements

人類的最後堡壘陷落了嗎?

最後我們回到一開始的問題,實用化的 LaMDA 究竟有沒有可能通過圖靈測試呢?

即使目前 google 仍強烈否認 LaMDA 具有知覺,而勒穆因也因涉嫌洩漏商業機密被停職。英國謝菲爾德大學機器人學院教授羅傑‧摩爾澄清這個AI背後的算法體系只是「詞序建模」(world sequence modelling)而非「語言建模」(language modeling)。

他強調對答如流的 LaMDA ,會給你他有人格的感覺只是錯覺。但最新的應用中,google 找來了 13 個作家,測試以 LaMDA 為基礎開發的寫作協助工具LaMDA Wordcraft。運作上有點像手機輸入法的關聯字詞推薦概念,但它的設計完全是為了文字創作者而生,利用整個網際網路中的文字,它彷彿擁有了類似榮格「集體潛意識」的能力,當小說家起了一個頭,它就能開始推薦下一個單詞甚至一整個句子補完,甚至還能調整生成文字的風格,例如有趣或憂鬱,這些應用聽起來簡直像是科幻小說。

有些作家甚至可以使用 AI 來創作小說。圖/envatoelements

奇妙的是,參與測試的作家之一正是曾翻譯《三體》英文版並寫出《摺紙動物園》的科幻小說家劉宇昆,他形容這個工具讓他數次突破「創作瓶頸」,節約了自己的腦容量,專注於創作故事更重要的東西。

更驚人的是,他提到有一次他連開頭的靈感都沒有,因此他把「創作的主動權」交給了 LaMDA ,並從中看到了從未想過的可能性,有了繼續寫下去的新寫作靈感。儼然就像當年 Alpha Go 下出一些人類棋譜中從沒想過的棋路一樣,有了「洞見」。

到了這個地步,你仍能堅持 AI 只是我們拿來「解決問題」的工具,而不具備一定程度對人文的認知或智慧嗎?

PanSci_96
1038 篇文章 ・ 1360 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

1
0

文字

分享

0
1
0
AI 從指紋預測思覺失調症
胡中行_96
・2023/02/16 ・1536字 ・閱讀時間約 3 分鐘

潮濕幽暗的地下道裡,老仙倚靠方桌端坐。他著唐裝,戴墨鏡,深藏不露,身後的大紅背板上,毛筆字寫著:紫微斗數、命名改運、生產擇日、事業詳批…,以及手相面相。心急問事的顧客也不探價碼,還沒坐穩,就懇請老仙從掌紋看未來。

倘若科技發展像 2022 年的西班牙論文所願,將來雷同的場景,可能會是這樣:窗明几淨的診間,護理師坐在電腦後。他見民眾進來,停止打字,笑容可掬,遞出的衛教單上寫道:「請詳讀程序介紹,並向醫師詢問不明白的地方。…簽署同意書後,再依照步驟,提供指紋。下次回診時,即可領取報告。」想預測發病機率的民眾,馬上掏出了健保卡。

手相算命攤示意圖。圖/Joi Ito on Flickr(CC BY 2.0)

指紋的形成

人類胚胎的外胚層(ectoderm),分化成上皮神經組織。手指的皮紋(dermatoglyphs),也就是指紋,與神經成長重疊的時間,約是懷孕的第 6 至 24 週。[1]除了控制皮膚生長的基因、肌肉、脂肪、皮膚下的血管外;染色體變異、病毒感染、子宮內的狀態,以及母體所受的壓力或使用的藥物等,也會形塑其紋理。[1, 2]這就是同卵雙胞胎的 DNA 一樣,卻有不同指紋的原因。[2]

西班牙科學家認為,如果懷孕過程中的任何干擾,使神經組織的發育異常,或許也會反映於同時正在成形的指紋上。[1]基於定形後終生不變的特性,[1, 2]指紋就像一份隨身攜帶,內容雖不完整,但是十分可靠的孕期病歷紀錄。頂多就是隨著年齡增長,偶爾受傷留疤,否則不太會妨礙判讀。[1]

思覺失調症

思覺失調症(schizophrenia)是一種會影響思考、感覺和行為的精神疾患,症狀包括:幻覺(hallucinations)、妄想(delusions)、思考障礙、注意力渙散、動作怪異、表情減少、音調平淡、缺乏動力和社交退縮等。[3]以往的文獻指出,相較於焦慮症(anxiety disorder)、雙極性疾患(bipolar disorder)和創傷後壓力症候群(post-traumatic stress disorder)等;思覺失調症病患的指紋格外獨特。理所當然,獲選為這個研究的對象。[1]

西班牙團隊招募了 612 名泛思覺失調症患者(544 個思覺失調與 68 個情感性思覺失調);以及 844 名健康的人。用指紋掃描機,把他們的指紋掃描成電子影像,篩選、校正並調整尺寸,再將資料餵給 AI,做深度學習。[1]

準確率

回到本文開頭的情境,算命仙由掌紋預言運勢,要多模糊或精準,才能為顧客所接受?換作是醫療單位,從指紋推測是否會罹患思覺失調症,得多正確才算可信?

這個研究訓練出來的 AI,診斷的準確率約七成。[1]乍聽之下,大概不覺得有多高。畢竟精神科醫師無視指紋,也能辨別出誰符合《精神疾病診斷與統計手冊第五版》(DSM-5)立定的標準。沒事弄來能力普通的新科技,豈不是多此一舉?但是別忘了,指紋終生不變,所以同樣的 AI 不僅能診斷,更可以預測,而且準確率依然是七成![1]這就不是醫師辦得到的了。

預測疾病發生的機率,就是為了及早防範。畢竟先天體質不是發病唯一條件;後天環境等因素,也扮演了重要的角色。然而,基於同樣的理由,僅從指紋提供的那麼丁點線索,AI 無法看到胎兒後來的遭遇,導致技術進步的空間有限。未來假使實際運用,必要配合基因和腦部醫療影像等其他資訊,來提高準確率。[1]

參考資料

  1. Salvador R, García-León MÁ, Feria-Raposo I, et al. (2022) ‘Fingerprints as Predictors of Schizophrenia: A Deep Learning Study’. Schizophrenia Bulletin, 29:sbac173.
  2. Are fingerprints determined by genetics?’. (07 JUL 2022) MedlinePlus.
  3. Schizophrenia’. (MAY 2022) U.S. National Institute of Mental Health.
胡中行_96
98 篇文章 ・ 33 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。