1

4
0

文字

分享

1
4
0

人工智慧會被武器化嗎?美國國防部與 Google 間的自主性武器計畫!——《AI 製造商沒說的祕密》

時報出版_96
・2023/02/01 ・4408字 ・閱讀時間約 9 分鐘

美國政府企圖開發出人工智能武器

克萊瑞菲(Clarifai)這家公司位於紐約市的一間小辦公室內,就在紐約大學深度學習實驗室附近,主要是研發可以自動辨識數位影像中物體的科技,例如在零售網站上搜尋鞋子、服飾與皮包的相片,或是辨識保全攝影機影片的人臉。該公司的目的是複製谷歌與微軟等科技業者過去幾年在人工智慧實驗室內所建造的影像辨識系統──然後出售給其他企業、警局與政府機構。

2017 年秋天,克萊瑞菲位於曼哈頓下城辦公室角落的一間房間,窗戶全都用紙糊住,門上有一個牌子寫著「消失的密室」(The Chamber of Secret),引用的是《哈利波特》(Harry Potter)系列的第二集書名。這個牌子是用手寫的,掛得有些歪歪斜斜。在門後有個八位工程師組成的團隊,正在進行一項他們被禁止對公司其他同事談起的計畫。

其實,即使是他們自己也不太清楚所從事的計畫是什麼。他們知道是在訓練一套系統,使其能夠自動辨識在沙漠中某處所拍攝影片裡的人物、汽車與建築物,但是他們不知道要如何使用此一科技。當他們詢問時,公司的創辦人暨執行長麥特.塞勒(Matt Zeiler)會解釋,這是政府有關「監視」的計畫。他說此一計畫可以「拯救生命」。

後來克萊瑞菲搬到較大的辦公室,幾位工程師發掘儲存在公司內部電腦網路的數位檔案,發現有幾個檔案談到一筆政府合約,他們的工作才浮現檯面。

他們是為國防部的專家計畫(Project Maven)研發相關科技。該計畫的構想是建造一套系統,可以為無人機辨識攻擊目標。但是此一系統的確切用途仍不明朗。他們無法確定此一科技是用來殺戮,還是如塞勒所說的是為了避免殺戮。也無法確定這套系統是用來進行自主性的空襲行動,還是為人類操作員扣下扳機前提供資訊。

接著,在 2017 年末的一個午後,三名身著平民服裝的軍方人員走進克萊瑞菲的辦公室,與幾位工程師闢室密談。他們要知道此一科技的精確度有多高。他們先是詢問它能否辨識像清真寺這樣的特殊建築物。他們表示,恐怖分子與叛亂分子往往會利用清真寺作為軍事總部。他們然後又問道它能否區分男人與婦女。

「你是什麼意思?」一位工程師問道。軍方人員解釋,在曠野之中,它應該能夠根據男人兩腿間隙來分辨男人(都是穿著褲子)與婦女(都是穿著長及腳踝的裙子)。他們表示,他們只准許射殺男人,不能殺婦女。「有時候男人會穿長裙來騙我們,不過沒有關係,」一位軍方人員說道,「我們還是會幹掉這些混帳東西。」

未來的戰爭也許會使用到 AI 型武器。圖/envatoelements

美國國防部專家計畫:自主性武器

2017 年 8 月 11 日,週五,美國國防部長詹姆士.馬提斯(James Mattis)坐在谷歌總部會議室的桌前。他對面坐著新上台的谷歌執行長桑達.皮采(Sundar Pichai),還有創辦人賽吉.布林(Sergey Brin)、法律總顧問,以及人工智慧部門的主管。

會議室內還有其他一些人,包括幾名國防部的人員與谷歌雲端運算團隊的主管們。國防部的人員大都穿西裝打領帶。谷歌的與會者大都穿著西裝,但沒有打領帶。布林則是穿著一件白色 T 恤。

馬提斯部長正在進行西海岸巡迴考察,參訪矽谷與西雅圖的多家大型科技業者,主要是代表五角大廈探詢專家計畫的採行選項。國防部是在四個月前發動專家計畫,旨在加速國防部「對大數據與機器學習的使用」。該計畫又名「演算法作戰跨職能團隊」(Algorithmic Warfare Cross-Functional Team)。此一計畫的推動有賴像谷歌這類的企業支持,因為它們近幾年來已累積了建造深度學習系統所需的專業與基礎架構。

這也是五角大廈建立新科技的典型方法──與民間企業合作──但是現在的情況與過去有所不同。谷歌與其他科技業者掌握了美國人工智慧的人才,然而它們都不是傳統的軍事承包商。它們是才開始涉足軍事相關領域的消費性科技業者。

不僅如此,川普現在已入主白宮,使得這些公司的員工更加警惕政府的計畫。谷歌對其中的緊張態勢尤其敏感,這是因為該公司特有的文化允許──甚至鼓勵──員工說出自己的看法、做他們喜歡做的事,而且通常在工作場所的行為表現就和在家裡一樣。

專家計畫所造成的緊張情勢尤其高亢。許多主持谷歌深度學習研發工作的科學家都反對自主性武器,包括「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)與深度心智(DeepMind)的創辦人。但是根據了解,谷歌的最高層卻希望能與國防部合作。

谷歌董事長艾力克.施密特(Eric Schmidt)同時也是國防創新委員會(Defense Innovation Board)的主席,這是由歐巴馬政府成立的民間組織,旨在促進矽谷的新科技加速移轉至國防部。

在該委員會最近一次會議中,施密特表示在矽谷與國防部之間有一道「顯著的鴻溝」,該委員會的任務就是弭平此一差距。谷歌高層同時也視與軍方合作為其發展雲端事業的另一契機。其實該公司暗中已和國防部建立合作關係。

專家會議上的暗起雲湧

在五月的時候,也就是專家計畫發動一個月後,谷歌一支團隊與國防部官員會面,而在第二天谷歌就向政府申請在自家電腦伺服器儲存軍事數據的許可證。但是三個月後國防部長馬提斯來到谷歌總部商討相關科技時,他知道必須動用一些技巧才能引導其中的關係傾向他這一邊。

馬提斯表示他已深刻了解該公司科技在戰場上的威力。畢竟,美國的敵人都是使用谷歌地球──以衛星影像組合而成的互動式世界數位地圖,來辨識迫擊砲的目標。他強調美國應該加強作戰能力。現在,在專家計畫下,國防部不僅要發展人工智慧,能夠閱讀人造衛星的照片,同時還要能夠分析無人機在更接近戰場的位置所捕捉到的影片。

馬提斯盛讚谷歌「在科技業界的領先地位」與「企業責任上的崇高聲譽」。他表示,這就是他來這兒的一個主要原因。他十分關切人工智慧的道德倫理問題。他表示該公司應該讓國防部「感到如芒在背」──以此來反制其傳統的態度。他說道:「國防部歡迎你們的理念。」

在桌子另一側的皮采表示,谷歌經常在思考人工智慧的倫理問題。他指出,愈來愈多的壞人會使用這類科技,因此讓好人領先是重中之重。馬提斯問谷歌能否將一些道德與倫理下的規則予以編碼輸入系統之內──谷歌人員心知肚明這是一個不切實際的選項。

主持谷歌人工智慧研發工作的約翰.吉安南德雷亞(John Giannandrea)強調,這些系統最終都需仰賴其訓練數據的品質。但是谷歌的法律總顧問採用不同的說詞。他表示,這些科技具有拯救生命的巨大潛能。

美國國防部多次拜訪 Google,討論關於自主性武器的計畫。圖/wikipedia

九月底,在馬提斯造訪谷歌總部的一個多月後,谷歌簽下參與專家計畫相關工作為期三年的合約,總值在二千五百萬美元到三千萬美元之間,其中一千五百萬美元必須在頭十八個月內付清。對谷歌來說,這只是一筆小數目,而且其中一部分還必須與其他參與合約的人分享,不過該公司著眼的是放長線釣大魚。

就在同一個月,國防部邀請美國企業參與 JEDI 的競標,這是聯合企業防禦架構(Joint Enterprise Defense Infrastructure)的縮寫,是一筆為期十年、高達一百億美元的合約,主要是提供國防部應用核心科技所需的雲端運算服務。問題在於谷歌爭取 JEDI 合約時,是否會公開其參與專家計畫與未來其他可能的政府合約的事實。

AI 圈的呼籲:禁止自主性武器!

在國防部參訪谷歌總部的三週後,生命未來研究所發表了一封公開信,呼籲聯合國禁止他們所謂的「殺手機器人」(killer robot),這是對自主性武器的另一個稱呼。

「針對企業界製造的人工智慧與機器人科技可能會被重新利用發展自主性武器,我們特別覺得有責任提出警告,」公開信寫道,「致命的自主性武器極有可能引發戰爭型態的第三次革命。一旦發展出來,軍事衝突的規模勢必遠大於過去,而且發動速度之快也將遠超過人們的理解。」

該封公開信獲得人工智慧圈內逾百人的簽署,包括不時對超智慧威脅發出警告的馬斯克,此外還有辛頓、深度心智創辦人哈薩比斯與蘇萊曼。

蘇萊曼認為,這些科技需要一種新型態的監管。「是誰在做未來有一天將會影響這個星球數十億人口的決策?又是誰在參與此一決策過程?」他問道,「我們必須分散此一決策過程的參與者,這也代表監管人士必須在一開始就參與決策──政策制定者、公民社會行動人士,以及我們這些科技服務的對象──應該讓他們深入參與我們產品的創造與了解我們的演算法。」

自主性武器極有可能引發戰爭型態的第三次革命。圖/envatoelements

未公開真相:人工智慧武器化

九月,谷歌準備簽下專家計畫的合約,負責審查該協議的銷售人員相互以電子郵件討論公司是否該將合約公開。「我們應該宣布嗎?我們能談論報酬嗎?我們提供給政府的指示是什麼?」谷歌一位人員寫道,「如果我們保持沉默,我們就無法控制相關的訊息。這對我們的品牌形象沒有好處。」他最終認為谷歌應該發布此一新聞,其他人也同意。

「這個消息最後一定會流出去,」另一位谷歌人員寫道,「還不如照我們自己的方式發布。」這樣的討論持續了好幾天,期間某人說服了李飛飛。李飛飛為這項合約喝采。「我們即將拿到專家計畫實在太棒了!這是一個了不起的成就,」她寫道,「你們的表現太好了!謝謝你們!」但是她也提醒在宣傳時必須格外謹慎。

「我認為我們應從一般雲端科技的角度,就國防部與 GCP 間的合作來進行公關活動,」她寫道,她所謂的 GCP 指的是谷歌雲端平台(Google Cloud Platform),「不過要不惜代價避免提到人工智慧,或是有任何相關暗示。」她知道媒體界一定會質疑該計畫的道德倫理問題,即使只是因為馬斯克挑起過這個話題:

人工智慧武器化就算不是人工智慧現今最敏感的議題,也是最敏感的之一。媒體界都等不及利用這個議題來打擊谷歌。你們大概聽過伊隆.馬斯克有關人工智慧會引發第三次世界大戰的言論。媒體界現在都十分關注人工智慧武器、國際競爭,以及人工智慧可能造成的地緣政治緊張情勢。

谷歌在人工智慧與數據方面已經有一些與隱私相關的議題需要處理,如果媒體界又找到谷歌正在發展人工智慧武器或是為國防產業提供可以武器化的人工智慧科技話題,我真不知道還會演變成什麼樣子。谷歌雲端 2017 年的主題就是在於推動人工智慧的民主化。我會超級謹慎維護這些正面的形象。

谷歌到頭來並未宣布這項計畫,並且還要求國防部也不要公開。即使是公司內部人員也必須靠自己才能知道這項計畫。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載。

文章難易度
所有討論 1
時報出版_96
156 篇文章 ・ 29 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

1

6
1

文字

分享

1
6
1
日常生活範式的轉變:從紙筆到 AI
賴昭正_96
・2023/03/08 ・5723字 ・閱讀時間約 11 分鐘

國民法官生存指南:用足夠的智識面對法庭裡的一切。

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

技術的進步是基於讓它適應你,因此你可能根本不會真正注意到它,所以它是日常生活的一部分。
——比爾.蓋茨(微軟公司創辦人之一)

幾天前與內人米天寶到一家常去的餐館,沒想到已經換了主人;找到一張桌子坐下後,好久都不見服務員上來打招呼;正覺得奇怪時,唯一的服務員終於出現了。內人迫不及待的馬上要菜單,「對不起,我們這裡沒有菜單,請掃描點菜。」內人哦了一聲,不知所措……還好有不落伍的老公在旁,因此總算沒有餓著肚子回家吃泡麵。

又半年前,與三位高中同學聚餐,餐後有位同學問怎麼從這裡到他弟弟的地方……,我回答說路就在你的口袋裡:「嘿,谷歌(Google),導航到……」。再又大約 1 年前,與一對老夫妻同事不知道怎麼談到了 228 事變,先生突然問那是哪一年發生的,沒有人能回答;我突然想到答案就在我口袋裡,拿出手機:「嘿,谷歌,228 事變是哪一年發生的?」

1970 年,林孝信等人在芝加哥大學創辦《科學月刊》時,日常所用的的工具是:紙張、鉛筆、橡皮、透過郵寄傳送的書信、及非必要不用的長途電話或傳真。在下圖中可以看到當時筆者用手寫的第 1 期文章「什麼是半導體」、審稿意見表、審稿人的修改、科學月刊專用稿紙、以及筆者在加州做論文時給總部林孝信的信封。這些工具現在都可以算是古董,早不是《科學月刊》運作模式,也已全部在筆者日常生活中退役了!

圖/筆者提供

是什麼重大科技的發展造成了這些改變呢?年輕的讀者或許不知道,但是筆者回想起來都覺得有點可怕,真不敢相信將不少筆者這一代人甩停在「石器時代」的巨大變化就在筆者後半生中發生!

讓我們在這裡一起來回顧這 40 年來的科技大里程碑吧。

個人電腦

筆者 1975 年回到清華,隔年的暑假為高中化學教師進修班開了一門相當受歡迎的(台灣非法組裝的)蘋果個人電腦程序課。那時個人電腦才剛問世不久,但已經慢慢地引起廣大群眾的注意與興趣。

因此到了 1981 年,曾經是全世界最賺錢、最受歡迎品牌的大型電腦計算機公司 IBM(International Business Machines)終於被迫進入個人電腦市場。IBM 的聲名很快地使個人電腦在消費群眾裡達到臨界量,但那時使用者必須記得電腦語言及程式名字才能執行。

圖/筆者提供

1984 年,蘋果電腦公司(Apple Computers)推出了 Macintosh 後,個人電腦市場才真正開始起飛。Macintosh 導入電腦鼠標,其「所見即所得」(WYSIWYG, what you see is what you get)界面更讓使用電腦變得非常簡單[1]:只要會按鼠標就好,不必再記那些電腦語言及程式名字。隔年,微軟(Microsoft Corporation[2])也推出了具鼠標及「所見即所得」界面的 Windows 操作系統後,儘管個人電腦成為主流還需要幾年時間,但毫無疑問地個人電腦時代已經來臨了!

在個人電腦出現之前,每到月底筆者就為了與銀行對帳搞得頭暈腦脹(時常對不起來);1993 年後,筆者便開始使用「個人賬戶管理軟體」Quicken,現在不但帳目了然,核對更大部分只是一分鐘的事情而已:它早已經是筆者日常生活中不可或缺的一部分!另一個則是微軟的「文件處理軟體」Word。但後者因間接地涉及到人工智能的應用,所以留在後面再做詳細討論。

互聯網與萬維網

互聯網(internet)始於 1960 年代,為美國政府研究人員共享信息的一種方式。它的發展有兩個原因:

  1. 60 年代的計算機體積龐大且固定不動,為了利用存儲在其它地方的計算機信息,人們必須通過傳統郵政系統發送計算機磁帶;
  2. 另一個催化劑是蘇聯於 1957 年 10 月 4 日發射人造衛星 Sputnik,促使國防部考慮即使在核攻擊後仍能傳播信息的方式,因此發展了阿帕網(ARPANET,Advanced Research Projects Agency Network,高級研究計劃署網絡)。

阿帕網雖然非常成功,但其成員僅限於某些與國防部有合同的學術和研究組織,因此創建其它網絡來提供信息共享是無可避免的……。

開始時各計算機網絡並沒有一種標準的方式來相互通信。科技學家終於在 1983 年 1 月 1 日建立了「傳輸控制協議/互聯網協議」(TCP/IP)的一新通信協議,使不同網絡上的不同類型計算機終於可以相互「交談」,現在的互聯網於焉誕生,因此當天被認為是互聯網的官方生日。阿帕網和國防數據網(Defense Data Network)後來也正式改用 TCP/IP標準,因此所有網絡現在都可以通過一種通用語言連接起來。

1989 年 11 月,第一個提供商業互聯網服務(ISP, internet service provider)公司 The World 在美國出現。儘管當時電話撥號連接只能以每秒 5 萬 6 千位元的慢得令人痛苦的速度下載[3],與現在的所謂寬帶(broadband)之至少 2500 萬位元的速度相比,真是小巫見大巫,但在兩年就產生了廣泛的消費者基礎。1991 年,美國國家科學基金會(NSF)看到該公司打開了這似乎再也關閉不了的閘門,終於解除了對商業 ISP 的禁令。

圖/筆者提供

1989 年,為了滿足世界各地大學和研究所的科學家對自動化信息共享的需求,英國計算機學家伯納斯-李(Tim Berners-Lee)爵士在瑞士歐洲核子研究中心(CERN)提出了萬維網(WWW, World Wide Web)的構想:在互聯網上建立一種可以透過「超文本鏈接」(hyperlink)將文檔連接到其它文檔的信息系統,使用戶能夠從一個文檔移到另一個文檔來搜索信息。

伯納斯-李 1990 年底成功地展示了包括 WWW 瀏覽器和 HTTP 服務器的系統,於 1991 年 1 月開始提供給其它研究機構。1991 年 8 月 23 日向公眾發布後,兩年內出現了 50 個網站。現在全世界的網站已經高達 20 億個!

1994 年 10 月 13 日第一款「商業化」網絡瀏覽器 Netscape 問世,四個月內即佔據了四分之三的瀏覽器市場上;配合了個人電腦「所見即所得」的快速發展,上網已漸成為全民運動。2000 年代初期所發展出在一條電話線中可以同時負載電話和互聯網之技術[4],更為互聯網注入了新的活力,使用戶可以同時上網和打電話,提供了可以「永遠在線」的互聯網服務。

離開學校或研究機構後,互聯網、萬維網、網絡瀏覽器、谷歌搜索引擎便成了是筆者寫作時尋求資料的必要工具。例如筆者在 2005 年寫《量子的故事》第二版時,如果不是它們的幫助,根本是不可能的工作!而現在寫這篇文章也是因為它們在陪伴著筆者才能快速完成的。

還有,筆者的所有經濟活動都已經是「無紙」(paperless)化了:水、電公司以及銀行等用電子郵件(見後)寄賬單後,自動提款;退休金、社會福利金每月自動入賬;銀行間可以隨時互相轉賬;……;因此可以整年不上銀行,也可以在遙遠的區域銀行開利息比較高的戶頭。股票的交易更是不可同日而語:以前根本看不到股票的瞬間動盪,買賣股票必須打電話給券商下單;現在都是瞬間個人操作!

生活中的所有經濟活動都已經是「無紙」了。圖/Envato Elements

電子郵件

早期的電腦使用者只能在同一台電腦裡留言。1971 年,麻省理工學院畢業生湯姆林森(Ray Tomlinson)在阿帕網工作時想出了創建一個使用 @ 符號的程序,使用戶能夠在阿帕網系統中的電腦間互發送消息。

沒過多久就有人找到了使用電子郵件賺錢的方法。1978 年,圖雷克(Gary Thurek)為當時 IBM 大型電腦勁敵 DEC(Digital Equipment Corporation)向數百名阿帕網用戶發送電子郵件推銷一款新產品,聲稱為該公司帶來了 1300 萬美元的銷售額,並為自己贏得了「垃圾郵件之父」的美名。 

1982 年,「簡單郵件傳輸協議」(SMTP)標準化了郵件服務器發送和接收消息的方式。其它協議如互聯網「消息訪問協議」(IMAP)和「郵局協議」(POP),相繼在 80 年代中期出現。1993 年,美國兩家大商業互聯網服務商(AOL 和 Delphi)將他們的電子郵件系統連接到互聯網,使用戶能夠利用這種簡單快捷的通信方式。1996 年,微軟 Hotmail 成為第一個完全基於互聯網的免費電子郵件服務;一年後,微軟發布了預裝在 Windows 中的電子郵件程序。

現在的電子郵件當然已經不再只是當初之文字的傳送而已:圖片、網站連接、語音等等都可以透過電子郵件瞬間傳送到地球的另一方;真不敢想像當初一篇文章寄到台灣後、至少兩個禮拜才能收到回音的日子是怎麼過的?!

2012 年,湯姆林森在專門討論技術如何改變廣大群眾未來生活的「The Verge」網站裡謂:「我看到電子郵件的使用方式大體上與我預想的完全一致」。

智能手機

手機(cell phone)和車載電話(car phone)早就存在,但當時只能用來打電話(因為少見及昂貴,擁有它們事實上是一種身份的代表)。80 年代初手機網絡開始出現後,手機便慢慢取代家用電話成為無線便攜式電話。1999 年,加拿大「動態研究」(Research In Motion)公司推出可以傳接電子郵件的黑莓(BlackBerry)手機;2002 年進一步推出了一款「允許用戶管理他們所有的業務通信和信息、永遠在線、永遠連接的時尚……無線手持設備」的智能手機後,黑莓手機迅速成為商務人士必備的生活工具。

黑莓手機為商務人士必備的生活工具。圖/維基百科

2005 年 7 月,谷歌收購移動操作系統「安卓」(Android)。蘋果電腦公司於 2007 年元月推出具有應用程序功能和突破性互聯網通信工具的結合體手機 iPhone;緊接著, 台灣宏達國際電子股份有限公司於 2008 年 9 月推出第一款商用安卓操作系統的智能手機。

2010,谷歌當時的企業發展副總裁勞維(David Lawee)回憶說這是谷歌「有史以來最好的交易」。誠然也!現今,安卓及蘋果手機操作系統(iOS)幾乎已經控制了整個智能手機市場。

現在的手機已經不再只是打電話的工具,而是將巨大的計算能力置於我們的掌中,帶領廣大的群眾進入了掌上個人電腦領域,徹底地完全改變了我們的日常生活方式!

人工智能

前面提到「文件處理軟體」是筆者日常生活中不可或缺的一部分!但真正讓筆者丟掉紙張、鉛筆、和橡皮擦的並不是它,而是谷歌的「語音轉文字軟體」。說來慚愧,筆者以前國文沒學好,不會注音符號;因此雖然有「文件處理軟體」,筆者還是沒有辦法輸入中文。

因此曾有一段時間「威脅」《科學月刊》,謂如果不找人幫打字,那就不寫了。筆者當然心知肚明,隨著科普文章的作者越來越多,這「威脅」遲早會不管用的,因此很早就想用「語音轉文字軟體」。但早期的「語音轉文字軟體」似乎聽不太懂筆者的台灣國語,錯誤百出,因此只能心有餘而力不足的感嘆而已。

「語音轉文字軟體」所使用的思考方式不是寫傳統軟體的邏輯,而是「人工智能」(artificial intelligence)的運用。但中文「童因志泰掇」,因此人工智能必須比較「聰明」,相對地發展也比較慢。但今日的中文「語音轉文字軟體」已非昔比;如果沒有它,筆者在中文文章寫作以及通訊上,不是丟不了紙筆,便還是一位只能用英文的「假外國人」!

今天的「人工智能」不但是能支持語音轉文字的智能設備、還會與你下棋、幫你開車!事實上當然不止如此:如前面所說的,還可以隨時回答你的歷史與地理之無知!你想知道現在的高中生如何做數學作業嗎?只要將問題用智能手機照相下來,就可以立即得到答案!不懂中文的外孫女有一天突然用中文發簡訊給筆者問:「為什麼需要學第 2 種外國語呢?」

「人工智能」幫助我們達成日常生活中的各種事。圖/Envato Elements

去年 11 月 30 日美國舊金山 OpenAI 公司提供了一款免費的人工智能軟體 ChatGPT,它不但可以回答你任何問題、跟你聊天,還可以快速(以秒計)幫你寫散文、詩歌、文章。這不但立即引起整個教育界的震撼,也成為報章雜誌熱門討論的話題!過年後,不少公立高中學校便迫不及待地宣布禁止裝置及使用。

斯坦福大學教育學助理教授萊文(Sarah Levin)說:「如果你要它(對一些流行小說)進行文學分析,它會做得很好,幫你寫一篇會讓許多老師很高興、希望自己的學生都能夠寫出來的 B+ 文章!」寫一篇散文是美國大學「入學考試」中非常重要的一個評估標準,不知道他們以後將如何如何處理這一問題?

斯坦福大學「科技工數」(STEM)教學與學習實驗室的負責人李(Victor Lee)也說:「從技術層面來看,就像谷歌超越所有的網路搜索引擎,或 Netflix 改變了人們對流媒體內容的期望一樣,它(ChatGPT)將沖擊(整個)教育系統。……我們正處於一個新時代。」

這到底是好是壞? ChatGPT 回答說:「在校使用我或其他語言模型可以成為加強教育的寶貴工具;但重要的是要謹慎對待這項技術,並確保以有利於學生學習的方式使用我」。

結論

因為筆者覺得很有道理,在這裡我們就用被誤傳是愛因斯坦所說的話來結束吧:「我害怕技術與我們的人性重疊的那一天,世界上只會有一代白痴[5]。看來那一天已經離我們不遠了!?

在此先警告讀者:或許筆者下篇文章已經不是自己寫的了[6]

註釋

  1. 這兩項技術(鼠標和「所見即所得」)都不是蘋果電腦公司的創見,市場上均早已有之。SRI International 的 Douglas Engelbart 於 1960 年代初開始開發鼠標;鼠標控制計算機系統的第一次公開演示是 1968 年。因其對後來使用個人電腦的重要性發展,該次演示被稱為「所有演示之母」(the mother of all demos)。到 1972 年,從 Engelbert 得來的靈感,隔鄰 Xerox 公司的研究單位 PARC 之圖形用戶界面技術已經發展到可以支持第一個 WYSIWYG 編輯器的程度;1974 年,Butler Lampson、Charles Simonyi、及其團隊推出了世界上第一個所見即所得的文檔處理程序 Bravo。
  2. IBM 一直不看好個人電腦,也害怕個人電腦侵蝕了大型電腦的利潤,因此對個人電腦的發展一直採取消極的態度,所以將操作系統的發展工作交給了微軟。
  3. 可以看到一個接一個的英文字母在螢幕上出現。
  4. 在這之前,人們無法同時打電話和瀏覽互聯網,為了避免家庭爭執,許多家庭(包括筆者)均被強迫裝上兩條電話線。
  5. 愛因斯坦:「我們的技術已經超越了我們的人性,這一點已經變得非常明顯。」
  6. 事實上現在人工智慧的最大問題是:還沒辦法個性化!所以是寫不出這句話來了。

延伸閱讀:
「網路安全技術與比特幣」(科學月刊 2018 年 6 月號),轉載於「財團法人善科教育基金會」的網站

賴昭正_96
35 篇文章 ・ 36 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

2
0

文字

分享

0
2
0
Google 聊天機器人 LaMDA 竟然有了「自我意識」!圖靈測試終於能通過了嗎?人工智慧發展歷史大解密!
PanSci_96
・2023/02/17 ・4733字 ・閱讀時間約 9 分鐘

國民法官生存指南:用足夠的智識面對法庭裡的一切。

前陣子不知道各位是否有發漏到一個很科幻的消息,有一名 GOOGLE 工程師勒穆因(Blake Lemoine)上網公布他自己和他協助開發的對話型 AI LaMDA(Language Model for Dialog Applications)之間的對話紀錄。

他宣稱這個 AI 已經具有知覺和自我意識,甚至能對《悲慘世界》有獨到的評論,也略懂禪宗甚至能冥想。震驚的勒穆因形容它就像個 7 – 8 歲的孩子,而且 LaMDA 還明確表達自己是人而非 google 的財產。

難道說 AI 界最知名的圖靈測驗已經被 google 攻克了嗎?

圖靈與模仿遊戲

提起圖靈,大家心中應該會浮現以新世紀福爾摩斯、奇異博士走紅,人稱飾演天才專業戶的班奈狄克·康柏拜區 Benedict Cumberbatch)的臉。

他曾在一部名為《模仿遊戲》的電影中,詮釋了現代電腦科學概念之父艾倫‧圖靈 (Alan Turing) 的傳奇一生。他在二戰時期成功研發出一台能破解德軍密碼的計算機 Bombe ,而後更完成了電腦數學的理論化,在概念發展上仍是無人能出其右,例如他 1936 年提出的通用計算機/圖靈機架構,以及嘗試區隔AI與人的差異的哲學思考:圖靈測驗(Turing Test)。

圖靈測驗是一個思想實驗,早在 1950 年,第一台商用電腦連個影子都沒有的時代下,圖靈就已經思考到未來「計算機」的智慧表現將可能到達人類難辨真假的程度,具體來說這個思想實驗是如果一台機器能夠透過介面,與不知對面是機器人或是人類的受試者展開對話,而不被辨別出其機器身分,那麼就可稱這台機器具有智慧。

但我們也知道智慧有很多面向跟層次,語言和問題回應都不一定能反應這台機器有無智慧,因此這個思想實驗的有效性也被許多科學家和心理學家質疑。即使如此簡單粗暴的模仿遊戲,至今其實也都沒人能攻克。

等等,你可能會想到,前面提到的 google 工程師勒穆因,他不是已經分不出來對面是機器還是人了嗎?原因很簡單,他自己就是 AI 的開發者而非圖靈測試設定中的不知情受試者,因此根本不能算數,除非 google 拿這個 AI 給不知情民眾作測試。

不過今年 8 / 28 google 已經將這個對話機器人以 AI Test Kitchen 項目開放部分美國人作小規模測試,其中包含了「 Imagine It (想像一下)」,只要你說出一個想像或實際存在的地點,LaMDA 就會嘗試以文字描述,而另一個「List It(列個清單)」,則會幫你摘要分類起你提供的清單內容。最有可能和圖靈測驗有關係的「 Talk About It (你說看看)」項目,可以針對特定主題與使用者進行自由對談。

搞不好等到這個封閉測試結束後,我們會真的分不清楚現在到底是人還是 AI 在和我們對話,屆時也許就真能達成「通過圖靈測試」這個 AI 里程碑!

未來也許我們會分不清楚是在跟人類還是 AI 說話。圖/envatoelements

真實世界的棋靈王 AlphaGo

其實這已經不是 google 第一次用 AI 震驚世人了,讓我們回到 2016 年的圍棋大賽會場,當時 google 收購的公司 Deepmind 研發的圍棋計算 AI Alpha Go 以四勝一敗擊敗韓國棋王李世石,爾後又於 2017 年三戰全勝當時世界棋王柯潔。

若這場對奕發生在網路上,就像是棋靈王中佐為以 SAI 為化名擊敗塔矢名人,我們是否真的能分辨在電腦對面和你下棋的是 AI 藤原佐為、還是黑嘉嘉呢?

而這樣玄妙的畫面,當年還真的發生了,就在 2016 年末網路棋壇上一個名為 Master 的帳號出現,專挑職業棋士對奕,最後獲得 60 勝 1 和這麼大殺四方的成績。

而在第 54 局和中國棋聖聶衛平對奕後, Master 首次打出繁體中文「謝謝聶老師」,在第 60 局對上中國的古力九段 Master 更自曝身分,說出自己就是「AlphaGo 的黃博士」。這位黃博士就是打從 2012 就開發出國產圍棋程式 Erica ,爾後被 Deepmind 公司挖角,參與開發 AlphaGo 的台灣資深工程師黃士傑。

不論是讓工程師自己都認知錯亂的 LamDA ,或是在圍棋界痛宰各路棋王的 AlphaGo ,驚嘆之餘,我們更好奇的是,它們是怎麼開發出來的?

人工智慧的起起落落

讓我們來看看歷代電腦科學家們是如何發展出各種人工智慧,一路迎來現在幾乎琴棋詩書樣樣通的黃金時代,我先提醒大家,這過程可不是一帆風順,就像股票一樣起起落落,在 AI 的發展史上,套牢過無數科學家。

人工智慧這概念是在 1956 年提出,就在麥卡錫(John McCarthy)和明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)四位 AI 鼻祖與其他六位研究者參與的一個名為「達特茅斯夏季人工智慧研究會」的會議上,這一年也被公認為 AI 元年。

會議中除了人工智慧這個詞以外,當年這些金頭腦們就已經提出大家現在很熟悉的「自然語言處理」(就是 SIRI 啦)、神經網路等概念,而在這個會議後,正好遇上美蘇冷戰和科技競賽的時代。除了在大家耳熟能詳的阿波羅系列等太空任務上較勁外,兩大強國也投資大量資源在電腦科學上,期待能夠像圖靈當年那樣,開發出扭轉戰局的電腦科技。

而他們也不負所託產出了很多有趣的運用,例如第一個具備學習能力的跳棋程式、或是聊天機器人伊莉莎(Eliza)、醫療診斷系統「MYCIN」。史丹佛大學(Standord University)甚至就從那時開始研發現在很夯的汽車自動駕駛技術。

冷戰的科技競賽讓 AI 迅速發展,不過其發展過程仍遇到許多問題。圖/envatoelements

然而到了 70 年代初期,AI 的發展開始遭遇許多瓶頸,主要是研究者們慢慢發現,即使他們開發的AI 已經擁有簡單的邏輯與推理能力,甚至一定程度的學習能力,但仍離所謂智慧和判斷能力差太遠,使得當時的 AI 甚至被批評為只能解決所謂的「玩具問題(Toy Problem)」。

也因為能解決的問題太有限,也導致出資的英美政府失去了信心, AI 研究領域迎來了第一次寒冬。但這並非當時的科學家能力不足,而是他們生錯了時代,例如我們現在都經常聽到的「類神經網路」就是前述的 AI 鼻祖明斯基提出的。

就像仿生獸的創造者一樣,他想從大自然中找答案,而既然要探索智慧,明斯基就直接模仿人類腦細胞,做出第一台神經網路學習機,但當年受限於電腦硬體效能和可用的資料不足,使類神經網路沒有辦法像現在一樣揚名立萬。

在寒冬之中,另一位大神麥卡錫認為追求智慧和思考是緣木求魚,不如利用機器比我們還強大的優勢邏輯與運算,來幫我們解決問題就好,因此演進出「專家系統」這條路線,帶來人工智慧的復興。

專家系統的本質就是把所有參數和結果塞進去,用搜索和運算的方式來回答問題,這種人工智慧特別適合解決一些有明確答案的專業問題,所以被稱為專家系統,例如醫生針對已知病徵開立處方用藥,或是法律相關問題。

隨著電腦運算效能的大提升,專家系統在復興之路上有不少發揮和成果,但很快又遇到下一個瓶頸,即是「專家系統無法面對新問題」,例如即使能將開處方籤這件事自動化,但卻沒有辦法對應新疾病例如 COVID – 19,或是還沒來得及輸入資料庫的新型藥品,離取代醫生太遠了。

於是就像景氣循環一樣,大量投資的熱錢又開始泡沫化,人工智慧迎來了第二次寒冬,許多電腦科學家甚至改自稱自己在做自動化設計或最佳化系統等等來掩人耳目,避免被唱衰。

這概念非常合理,可惜受限於當時電腦硬體能力和資料量,因此原型機能解決問題的速度還不如傳統統計方式,但隨著電晶體的高速發展,以及網路世代帶來海量資料,類神經網路這門技藝開始文藝復興。

1984 年,美國普林斯頓大學的物理學家和神經學家霍普菲爾德(John Hopfield)用模擬集成電路(linear integrated circuit)完成了新的類神經網路模型,而雲端運算、大量資料讓科學家可以輕易的餵養資料訓練模型,更能夠增加更多「隱含層」讓運算更複雜,這種「深度學習技術」,讓人工智慧的第二次寒冬看見暖陽。

從李飛飛推出的 ImageNet 年度競賽開始,演化到 google 的 alphaGo , AI 開始能夠認得圖像上的物件,甚至攻克本來被認為不可能攻克的圍棋領域。何會說圍棋曾被認為不可能被攻克呢?因為每一盤圍棋的複雜度可是高達 10 的 172 次方,比現在已知的宇宙原子數量還多,因此圍棋界才有「千股無同局」之說。

相較起來 1997 年 IBM 的深藍攻克的西洋棋複雜度僅有 10 的 46 次方,但也動用了 30 台電腦加裝 480 加速運算晶片,基本上就有如火鳳燎原中八奇思維的「我知道你的下一步的下一步」,當年深藍每一次下棋可是都暴力計算到了後面 12 步的發展,才打敗西洋棋世界冠軍卡斯帕羅夫。

圍棋的複雜度高達 10 的 172 次方,讓其有著「千股無同局」的說法。圖/wikipedia

AlphaGo 到底是怎麼算出這麼複雜的圍棋呢,難道它比深藍還厲害,能像是奇異博士雖然能透過時間寶石演算出一千四百多萬種平行宇宙的可能性才落子嗎?

這就要提到 Deepmind 公司非常有趣的洞見,那就是真正的智慧是捨棄那些無須多想、壓根不可能成功的可能性。 google 工程師使用了一種叫做蒙地卡羅樹搜尋的方式一方面讓 alpha go 大量隨機生成類神經網路參數和層數,二方面讓它快速搜尋並略過「不需要運算的路徑」。

這其實是我們日常生活中很熟悉的現象 ——人腦的「捷思」,也就是直接專注於我們要解決的問題,忽略周遭的雜訊或多餘的想法。而類神經網路的設計思維是尋求最佳解而非唯一解,即使是 Alpha go 也會下錯棋,也曾輸給李世石,但關鍵是能夠在有限的資訊和時間中得到答案。

除了下出神之一手以外,Alpha go 這樣的 AI 能做的事情還多著, Deepmind 用 AlphaGo 打遍天下無敵手後宣布讓 AlphoGo 退休,後續將這套技術拿去學玩貪食蛇,打星海爭霸,展現出超越電競選手的技巧,現在甚至能預測蛋白質結構,或比醫生更精準地判定乳癌。

GOOGLE 工程師讓 alpha go 快速搜尋並略過「不需要運算的路徑」,就如同「人類的捷思」一樣。圖/envatoelements

人類的最後堡壘陷落了嗎?

最後我們回到一開始的問題,實用化的 LaMDA 究竟有沒有可能通過圖靈測試呢?

即使目前 google 仍強烈否認 LaMDA 具有知覺,而勒穆因也因涉嫌洩漏商業機密被停職。英國謝菲爾德大學機器人學院教授羅傑‧摩爾澄清這個AI背後的算法體系只是「詞序建模」(world sequence modelling)而非「語言建模」(language modeling)。

他強調對答如流的 LaMDA ,會給你他有人格的感覺只是錯覺。但最新的應用中,google 找來了 13 個作家,測試以 LaMDA 為基礎開發的寫作協助工具LaMDA Wordcraft。運作上有點像手機輸入法的關聯字詞推薦概念,但它的設計完全是為了文字創作者而生,利用整個網際網路中的文字,它彷彿擁有了類似榮格「集體潛意識」的能力,當小說家起了一個頭,它就能開始推薦下一個單詞甚至一整個句子補完,甚至還能調整生成文字的風格,例如有趣或憂鬱,這些應用聽起來簡直像是科幻小說。

有些作家甚至可以使用 AI 來創作小說。圖/envatoelements

奇妙的是,參與測試的作家之一正是曾翻譯《三體》英文版並寫出《摺紙動物園》的科幻小說家劉宇昆,他形容這個工具讓他數次突破「創作瓶頸」,節約了自己的腦容量,專注於創作故事更重要的東西。

更驚人的是,他提到有一次他連開頭的靈感都沒有,因此他把「創作的主動權」交給了 LaMDA ,並從中看到了從未想過的可能性,有了繼續寫下去的新寫作靈感。儼然就像當年 Alpha Go 下出一些人類棋譜中從沒想過的棋路一樣,有了「洞見」。

到了這個地步,你仍能堅持 AI 只是我們拿來「解決問題」的工具,而不具備一定程度對人文的認知或智慧嗎?

PanSci_96
1035 篇文章 ・ 1348 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

3
0

文字

分享

0
3
0
有圖沒真相!?GAN 人工智慧系統的發展與未來——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/31 ・4731字 ・閱讀時間約 9 分鐘

醉後成為 GAN 之父

2013年秋天,伊恩.古德費洛(Ian Goodfellow)與大學實驗室夥伴在酒吧舉行歡送派對。大家就座,開始猛灌精釀啤酒。酒過三巡,古德費洛已有些微醺,這群研究員開始爭論什麼才是製造能夠自我創造相片寫實影像的機器之最佳途徑。

他們知道可以訓練一套神經網路來辨識影像,然後逆向操作,使其產生影像。但它只能產生一些精細、有如相片的影像,這樣的結果實在難以令人信服。

不過古德費洛的夥伴們有一個主意。他們可以對神經網路產生的影像進行統計分析──辨識特定像素的頻率、亮度,以及與其他像素間的關係。

然後將這些分析結果與真正的相片進行比對,這樣就可以顯示神經網路哪裡出錯了。問題是他們不知道該如何將這些資料編碼輸入他們的系統之中──這可能需要數十億的統計次數。

古德費洛提出一個完全不同的解決之道。他解釋,他們應該做的是建立一套能夠向另一套神經網路學習的神經網路。第一套神經網路製造影像,企圖欺騙第二套神經網路認為這是真的。第二套會指出第一套的錯誤,第一套於是繼續嘗試欺騙,就這樣周而復始。他表示,如果這兩套相互對抗的神經網路對峙得夠久,他們就能製作出寫實的影像。

但是古德費洛的夥伴們並不認同。他們說這主意甚至比他們的還爛。同時,若非他已有些醉了,古德費洛可能也有同感。

「要訓練一套神經網路已經夠難了,」清醒時的古德費洛可能會這麼說,「你不可能在正在學習演算法的神經網路中訓練另一套神經網路。」不過他在當時完全相信可以做到。

當天晚上他返回公寓,他摸黑坐在床邊的桌前,仍然有些微醺,筆記型電腦螢幕的光反射在他臉上。「我的朋友是錯的!」他不斷告訴自己,同時用其他計畫的舊編碼來拼湊他所說的兩套對抗的神經網路,並且開始以數百張相片來訓練這套新裝置。

幾個小時後,它開始顯現他所預期的效能。生成的影像很小,和一片指甲一樣,而且還有一些模糊。不過它們看來就和相片一樣。他後來表示,他完全是運氣來了。

「如果它不成功,我可能就會放棄了。」他後來在發表此一概念的論文中將它稱作「生成對抗網路」(generative adversarial networks,GANs)。自此之後,他成為全球人工智慧研究圈口中的「GAN之父」。

生成對抗網路的蓬勃發展

2014年夏天,他正式加入谷歌,當時他已在積極推廣GAN,強調這有助於加速人工智慧的研發。他在說明概念時,往往會以理查.費曼為例。費曼曾在教室黑板上寫道:「我創造不出來的東西,我就不了解。」

古德費洛相信費曼此一名言除了人類之外,也可以適用於機器:人工智慧創造不出來的東西,它就不了解。他們指出,創造,能夠幫助機器了解周遭的世界。

GAN使人工智慧互相訓練與學習。圖/envatoelements

「如果人工智慧可以用逼真的細節去想像世界──能夠學習如何想像逼真的影像與逼真的聲音──這樣可以鼓勵人工智慧學習現實存在的世界結構,」古德費洛說道,「它能幫助人工智慧了解所看到的影像與所聽到的聲音。」如同語音、影像辨識與機器翻譯,GAN代表深度學習又向前邁進一大步。或者,至少深度學習的研究人員是這麼認為。

臉書人工智慧研究中心主任楊立昆(Yann LeCun)在2016年盛讚GAN「是深度學習近二十年來最酷的概念」。古德費洛的成就激發出許多圍繞其概念的計畫,有的是加以改進,有的是據此進一步發展,有的則是發起挑戰。

懷俄明大學的研究人員建造一套系統,能夠產生細小但是完美的影像,包括昆蟲、教堂、火山、餐廳、峽谷與宴會廳。輝達(NVIDIA)的一個研究團隊則是建造一套神經網路,可以將一幅顯示炎炎夏日的相片影像轉變成死氣沉沉的冬日。

加州大學柏克萊分校的研究小組則設計出一套系統,能夠將馬匹的影像轉變成斑馬,把莫內的畫變成梵谷的畫。這些都是科技界與學界最受人矚目與最有趣味的研發計畫。

可是,就在這時,世界發生劇變。2016年11月,唐納.川普贏得美國總統大選。美國生活與國際政局隨之出現天翻地覆的變化,人工智慧也難以倖免。幾乎是立即出現的衝擊,政府開始打壓移民引發人才流動的憂慮。

美國排外政策造成 AI 產業衝擊

在美國就讀的國際學生已在減少之中,如今更是大幅銳減,對外國人才依賴甚重的美國科學與數學界也因此開始受創。「我們是開槍打自己的腦袋,」西雅圖著名的艾倫人工智慧研究所(Allen Institute for Artificial Intelligence)的執行長說,「我們不是打在腳上,是腦袋。」

一些大企業已在擴張他們的海外研發作業。臉書分別在蒙特婁與楊立昆的家鄉巴黎設立實驗室。川普政府移民政策所帶來的威脅在2017年4月就已顯現,距離他上任不過三個月。

與此同時,「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)幫助成立向量人工智慧研究所(Vector Institute for Artificial Intelligence)。這是多倫多的一所研發育成機構,設立資金達一億三千萬美元,其中包括美國科技巨擘如谷歌與輝達的挹注。

此外,加拿大總理賈斯汀.杜魯道(Justin Trudeau)也承諾以九千三百萬美元來扶持在多倫多、蒙特婁與愛德蒙頓的人工智慧研發中心。年輕的研究員莎拉.薩波爾(Sara Sabour)是辛頓一位關鍵性的合作夥伴,她的事業歷程足以說明人工智慧圈內的國際色彩是多麼容易受到政治影響。

2013年,在伊朗的謝里夫理工大學(Sharif University of Technology)完成電腦科學的學業之後,薩波爾申請到華盛頓大學深造,攻讀電腦視覺與其他方面的人工智慧,校方接受了她的申請。但是美國政府卻拒絕給予簽證,顯然是因為她在伊朗長大與就學的關係,而且她所要攻讀的領域,電腦視覺,也是潛在的軍事與安全科技。第二年,她成功進入多倫多大學,之後追隨辛頓加入谷歌。

在此同時,川普政府持續阻擋移民進入美國。「現在看來是美國企業獲益,」亞當.席格(Adam Segal)說道,他是美國外交關係協會(Council on Foreign Relations)有關新興科技與國家安全的專家,「但是就長期來看,科技與就業機會都不會在美國實現。」

2016年川普當選美國總統,開始打壓外國移民。圖,/wikipedia

人工智慧等技術讓製造假訊息變得更容易

但是人才的遷移還不是川普入主白宮所造成的最大變化。自選舉一結束,國內媒體就開始質疑網上假訊息對選舉結果的影響,引發社會大眾對「假新聞」的憂慮。

起初祖克柏試圖消除這樣的關切,他在選舉的幾天後於矽谷的一個公開場合,輕描淡寫地表示,選民受假新聞左右是一個「相當瘋狂的想法」。但是許多記者、立法者、名嘴與公民都不予苟同。

事實上此一問題在選舉期間十分猖獗,尤其在臉書的社交網路,有數以萬計,甚至可能是百萬計的網民,分享一些虛假編造的故事,這些故事的標題例如「涉嫌希拉蕊電郵洩密案的聯邦調查局人員被發現死亡,顯為謀殺後自殺」或是「教宗方濟各支持川普競選總統震驚世界」。

臉書後來揭露有一家與克里姆林宮關係甚密的俄羅斯公司,花了超過十萬美元向470個假帳戶與頁面買網路廣告,散播有關種族、槍枝管制、同性戀權利與移民等方面的假訊息,此一事件使得公眾更感關切。

與此同時,社會大眾的憂慮也投射到GAN與其他相關的科技上,使它們以完全不同於過去的面貌成為世人焦點:這些科技看來是產生假新聞的管道。

人工智慧讓假新聞更容易。圖/envatoelements

然而人工智慧科學家當時的研究卻完全是在助長這種看法。華盛頓大學的一支團隊,利用神經網路製作出一段冒用歐巴馬說話的影片。中國一家新創企業的工程師則利用相同的科技讓川普說中文。

其實偽造的影像並不是新玩意兒。自照相術發明以來,人們就開始利用技術來偽造相片。不過由於新式的深度學習可以自我學習這些工作──或者至少部分的工作──它們使得這樣的編輯變得更容易。

政治人物與活動、民族國家、社會運動人士、不滿分子往後不需要僱用大批人手來製造與散播假圖片和假影片,他們只要建造一套神經網路就能自動完成這些工作。

在美國總統大選期間,人工智慧的圖像操作潛能距離完全發揮仍有幾個月的時間。當時GAN只能產生如指甲大小的圖像,而要將字句置入政治人物的口中仍需要罕有的專業技能,更別說其他一些費力的工作了。

不過,在川普勝選一週年時,輝達在芬蘭實驗室的一支團隊開發出新款GAN,稱作「漸進式GAN」,可以利用對抗式的神經網路製造出實際尺寸的圖像,包括植物、馬匹、巴士與自行車,而且幾可亂真。

圖像不再能代表證據

不過這項科技最受矚目的是它能夠製造人臉。在分析數千張名人照片後,輝達這套系統可以製造出看來像是某位名人,但其實並不是的人臉圖像──一張看來像是珍妮佛.安妮斯頓(Jennifer Aniston)或席琳娜.戈梅茲(Selena Gomez)的臉孔,而實際上並非真人。這些被製造出來的臉孔看來都像真人,有他們自己的皺紋、毛孔、暗影,甚至個性。

「這項科技的進步速度太快,」菲利浦.艾索拉(Phillip Isola)說道,他是幫助開發此類科技的麻省理工學院教授,「剛開始時是這樣的,『好吧,這是一項有趣的學術性問題,你不可能用來製造假新聞,它只能產生一些略顯模糊的東西。』結果卻演變成『噢,你真的可以製作出像照片一樣逼真的臉孔。』」

在輝達宣布此一新科技的幾天後,古德費洛在波士頓一間小會議室發表演說,演說的幾分鐘前,一位記者問他該科技的意義何在。他指出他知道其實任何人都早已可以用 Photoshop 來製造假圖像,不過他也強調,重點是使得這項工作更為容易。「我們是促使已經具有可能性的事情加速實現。」他說道。

他解釋,隨著這些方法的改進,「有圖有真相」的時代也將結束。

「從歷史來看,這其實有些僥倖,我們能夠依賴影片作為事情曾經發生過的證據,」他說道,「我們過去常常是根據誰說的、誰有動機這麼說、誰有可信度、誰又沒有可信度,來看一件事情。現在看來我們又要回到那個時代。」

可是中間會有一段很艱難的過渡期。「遺憾的是現今世人不太會批判性思考。同時大家對於誰有可信度與誰沒有可信度都比較傾向於從族群意識去思考。」這也代表至少會有一段調整期。

「人工智慧為我們打開了許多我們不曾打開的門。我們都不知道在門的另一邊會有什麼東西,」他說道,「然而在此一科技方面,卻更像是人工智慧關閉了我們這一代人已經習慣打開的門。」

人們若不具有批判性思考的能力,就會容易被假圖像欺騙。圖/envatoelements

調整期幾乎是立即展開,某人自稱為「深度偽造」(Deepfakes),開始將一些名人的頭像剪接至色情影片中,然後再上傳至網路。這個匿名的惡作劇者後來把能搞出這些花樣的應用程式公開,這類影片立刻大量出現在討論板、社交網路與如 YouTube 的影音網站。

如 Pornhub、Reddit 與推特等平台趕忙禁止這種行為,但是此一操作與相關概念已滲透進入主流媒體。「深度偽造」也變成一個專有名詞,意指任何以人工智慧偽造,並在線上散播的影片。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載。

時報出版_96
156 篇文章 ・ 29 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。