0

0
0

文字

分享

0
0
0

從無知到無敵:AlphaGo Zero 是怎麼辦到的?

果殼網_96
・2017/11/13 ・2402字 ・閱讀時間約 5 分鐘 ・SR值 530 ・七年級

  • 作者/開明|Nature 市場專員,喜歡可愛的動物、美味的咖啡,和深度的旅行。

人工智慧棋手 AlphaGo 先後戰勝了兩位頂尖圍棋高手李世乭和柯潔。在這場猛烈風暴席捲了世界後,AlphaGo 宣布不再和人下棋。但它的製造者並没有因此停下腳步,AlphaGo 還在成長,今天 Deepmind 又在《自然》期刊上發表了關於 AlphaGo 的新論文。

圍棋中有超過 10 的 170 次方種變化,這比已知宇宙中所有的原子數量加在一起還要多,圖/by DeepMind

這篇論文中的 AlphaGo 是全新的、它不是戰勝柯潔的那個最强的 Master,但卻是它的孿生兄弟。它的名字叫 AlphaGo Zero,是AlphaGo 的最新版本。

和以前的 AlphaGo 相比,它:

  • 從零開始學習,不需要任何人類的經驗
  • 使用更少的算力得到了更好的结果
  • 發現了新的圍棋定式
  • 將策略網路和值網路合併
  • 使用了深度殘差網路
  • 白板理論(Tabula rasa)

哲學上有種觀點認為,嬰兒生下來是白板一塊,通過不斷訓練、成長獲得知識和智力。

-----廣告,請繼續往下閱讀-----

作為 AI 領域的先驅,圖靈使用了這個想法。在提出了著名的「圖靈測試」的論文中,他從嬰兒是一塊白板出發,認為只要能用機器製造一個類似小孩的 AI,然後加以訓練,就能得到一個近似成人智力,甚至超越人類智力的 AI。

現代科學了解到的事實並不是這樣,嬰兒生下來就有先天的一些能力,他們偏愛高熱量的食物,餓了就會哭鬧希望得到注意。這是 DNA 在億萬年的演化中學来的。

監督和無監督學習

計算機則完全不同,它沒有億萬年的演化,因此也没有這些先天的知識,是真正的「白板一塊」。監督學習和無監督學習(Supervised & Unsupervised Learning)是鏡子的兩面,兩者都想解决同一個問題——如何讓機器從零開始獲得智慧?

監督學習認為人要把自己的經驗教给機器。拿分辨猫猫和狗狗的 AI 來說,你需要準備幾千張照片,然後手把手教機器——哪張照片是猫,哪張照片是狗。機器會從中學習到分辨猫狗的细節,從毛髮到眼睛到耳朵,然後舉一反三得去判斷一張它從沒見過的照片是猫猫還是狗狗。

-----廣告,請繼續往下閱讀-----

而無監督學習認為機器要去自己摸索,自己發現規律。人的經驗或許能幫助機器掌握智慧,但或許人的經驗是有缺陷的,不如讓機器自己發現新的,更好的規律。人的經驗就放一邊吧。

這展示的是包含 20 個神經網路模塊的 AlphaGo Zero 版本,在訓練的不同階段進行的 3 盤左右互搏棋局的前 80 步,動畫在,圖/by DeepMind。

從無知到無敵

就像這篇新論文中講述的那樣。AlphaGo Zero 是無監督學習的產物,而它的雙胞胎兄弟 Master 則用了監督學習的方法。在訓練了 72 小時後 AlphaGo Zero 就能打敗戰勝李世乭的 AlphaGo Lee,相比較 AlphaGo Lee 訓練了幾個月。而 40 天後,它能以 89:11 的成積,將戰勝了所有人類高手的 Master 甩在後面。

圖靈的白板假設雖然無法用在人身上,但是 AlphaGo Zero 證明了,一個白板 AI 能夠被訓練成超越人類的圍棋高手。

强化學習

强化學習(Reinforcement Learning)是一種模仿人類學習方式的模型,它的基本方法是:要是機器得到了好的结果就能得到獎勵,要是得到差的结果就得到懲罰。AlphaGo Zero 並没有像之前的兄弟姐妹一樣被教育了人類的圍棋知識。它只是和不同版本的自己下棋,然後用勝者的思路来訓練新的版本,如此不斷重複。

-----廣告,請繼續往下閱讀-----
這個圖片展示的是包含 40 個神經網路模塊的 AlphaGo Zero 版本自學成才的過程。3 天超過打敗李世乭的 AlphaGO Lee,21 天超過打敗柯潔的 AlphaGo Master。自學 40 天之後就超過了所有其他的 AlphaGo 版本,動畫在這裡。圖/by DeepMind。

通過這一方法,AlphaGo Zero 完全自己摸索出了開局,收官,定式等以前人類已知的圍棋知識,也摸索出了新的定势。

算法和性能

如何高效合理得利用計算資源?這是算法要解决的一個重要問题。AlphaGo Lee 使用了 48 個 TPU,更早版本的 AlphaGo Fan 使用了 176 個 GPU,而 Master 和 AlphaGo Zero 僅僅用了 4 個 TPU,也就是說一台電腦足夠!

AlphaGo Zero 在 72小時内就能超越 AlphaGo Lee 也表明,優秀的算法不僅僅能降低能耗,也能極大提高效率。另外這也說明,圍棋問題的複雜度並不需要動用大規模的計算能力,那只是浪費。


憑借硬件性能的不斷升级和算法的不斷優化,AlphaGo 後期版本的運算效率明顯優於最初的版本,圖/by DeepMind

AlphaGo Zero 的算法有兩處核心優化:將策略網路(計算下子的概率)和值網路(計算勝率)這兩個神經網路结合,其實在第一篇 AlphaGo 的論文中,這兩種網路已經使用了類似的架構。另外,引入了深度殘差網路(DeepResidual Network),比起之前的多層神經網路效果更好。

-----廣告,請繼續往下閱讀-----

Deepmind 的歷程

DeepMind 創始人之一,德米斯・哈薩比斯(Demis Hassabis),圖/果壳网提供。

這不是 Deepmind 第一次在《自然》期刊上投稿,他們還發表過《利用深度神經網路和搜索樹的圍棋 AI》和《AI 電腦遊戲大師》等幾篇論文。

我們可以從中一窺 Deepmind 的思路,他們尋找人類還没有理解原理的遊戲,遊戲比起現實世界的問題要簡單很多。然後他們選擇了兩條路,一條道路是優化算法,另外一條道路是讓機器不受人類先入為主經驗的影響。

這兩條路交匯的终點,是那個超人的 AI。

DeepMind創始人之一,大衛・席爾瓦(David Silver),圖/果壳网提供。

結語

這是 AlphaGo 的终曲,也是一個全新的開始,相關技術將被用於造福人類,幫助科學家認識蛋白質折疊,製造出治療疑難雜症的藥物,開發新材料,以製造以出更好的產品。(編輯:明天)

-----廣告,請繼續往下閱讀-----

本文版權屬於果殼網(微信公眾號:Guokr42),原文為〈零開始,全憑自學,它用 40 天完虐 AlphaGo!〉,禁止轉載。如有需要,請聯繫sns@guokr.com

文章難易度
果殼網_96
108 篇文章 ・ 8 位粉絲
果殼傳媒是一家致力於面向公眾倡導科技理念、傳播科技內容的企業。2010年11月,公司推出果殼網(Guokr.com) 。在創始人兼CEO姬十三帶領的專業團隊努力下,果殼傳媒已成為中國領先的科技傳媒機構,還致力於為企業量身打造面向公眾的科技品牌傳播方案。

0

8
2

文字

分享

0
8
2
快!還要更快!讓國家級地震警報更好用的「都會區強震預警精進計畫」
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/21 ・2584字 ・閱讀時間約 5 分鐘

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

從地震儀感應到地震的震動,到我們的手機響起國家級警報,大約需要多少時間?

臺灣從 1991 年開始大量增建地震測站;1999 年臺灣爆發了 921 大地震,當時的地震速報系統約在震後 102 秒完成地震定位;2014 年正式對公眾推播強震即時警報;到了 2020 年 4 月,隨著技術不斷革新,當時交通部中央氣象局地震測報中心(以下簡稱為地震中心)僅需 10 秒,就可以發出地震預警訊息!

然而,地震中心並未因此而自滿,而是持續擴建地震觀測網,開發新技術。近年來,地震中心執行前瞻基礎建設 2.0「都會區強震預警精進計畫」,預計讓臺灣的地震預警系統邁入下一個新紀元!

-----廣告,請繼續往下閱讀-----

連上網路吧!用建設與技術,換取獲得地震資料的時間

「都會區強震預警精進計畫」起源於「民生公共物聯網數據應用及產業開展計畫」,該計畫致力於跨部會、跨單位合作,由 11 個執行單位共同策畫,致力於優化我國環境與防災治理,並建置資料開放平台。

看到這裡,或許你還沒反應過來地震預警系統跟物聯網(Internet of Things,IoT)有什麼關係,嘿嘿,那可大有關係啦!

當我們將各種實體物品透過網路連結起來,建立彼此與裝置的通訊後,成為了所謂的物聯網。在我國的地震預警系統中,即是透過將地震儀的資料即時傳輸到聯網系統,並進行運算,實現了對地震活動的即時監測和預警。

地震中心在臺灣架設了 700 多個強震監測站,但能夠和地震中心即時連線的,只有其中 500 個,藉由這項計畫,地震中心將致力增加可連線的強震監測站數量,並優化原有強震監測站的聯網品質。

-----廣告,請繼續往下閱讀-----

在地震中心的評估中,可以連線的強震監測站大約可在 113 年時,從原有的 500 個增加至 600 個,並且更新現有監測站的軟體與硬體設備,藉此提升地震預警系統的效能。

由此可知,倘若地震儀沒有了聯網的功能,我們也形同完全失去了地震預警系統的一切。

把地震儀放到井下後,有什麼好處?

除了加強地震儀的聯網功能外,把地震儀「放到地下」,也是提升地震預警系統效能的關鍵做法。

為什麼要把地震儀放到地底下?用日常生活來比喻的話,就像是買屋子時,要選擇鬧中取靜的社區,才不會讓吵雜的環境影響自己在房間聆聽優美的音樂;看星星時,要選擇光害比較不嚴重的山區,才能看清楚一閃又一閃的美麗星空。

-----廣告,請繼續往下閱讀-----

地表有太多、太多的環境雜訊了,因此當地震儀被安裝在地表時,想要從混亂的「噪音」之中找出關鍵的地震波,就像是在搖滾演唱會裡聽電話一樣困難,無論是電腦或研究人員,都需要花費比較多的時間,才能判讀來自地震的波形。

這些環境雜訊都是從哪裡來的?基本上,只要是你想得到的人為震動,對地震儀來說,都有可能是「噪音」!

當地震儀靠近工地或馬路時,一輛輛大卡車框啷、框啷地經過測站,是噪音;大稻埕夏日節放起絢麗的煙火,隨著煙花在天空上一個一個的炸開,也是噪音;台北捷運行經軌道的摩擦與震動,那也是噪音;有好奇的路人經過測站,推了推踢了下測站時,那也是不可忽視的噪音。

因此,井下地震儀(Borehole seismometer)的主要目的,就是盡量讓地震儀「遠離塵囂」,記錄到更清楚、雜訊更少的地震波!​無論是微震、強震,還是來自遠方的地震,井下地震儀都能提供遠比地表地震儀更高品質的訊號。

-----廣告,請繼續往下閱讀-----

地震中心於 2008 年展開建置井下地震儀觀測站的行動,根據不同測站底下的地質條件,​將井下地震儀放置在深達 30~500 公尺的乾井深處。​除了地震儀外,站房內也會備有資料收錄器、網路傳輸設備、不斷電設備與電池,讓測站可以儲存、傳送資料。

既然井下地震儀這麼強大,為什麼無法大規模建造測站呢?簡單來說,這一切可以歸咎於技術和成本問題。

安裝井下地震儀需要鑽井,然而鑽井的深度、難度均會提高時間、技術與金錢成本,因此,即使井下地震儀的訊號再好,若非有國家建設計畫的支援,也難以大量建置。

人口聚集,震災好嚴重?建立「客製化」的地震預警系統!

臺灣人口主要聚集於西半部,然而此區的震源深度較淺,再加上密集的人口與建築,容易造成相當重大的災害。

-----廣告,請繼續往下閱讀-----

許多都會區的建築老舊且密集,當屋齡超過 50 歲時,它很有可能是在沒有耐震規範的背景下建造而成的的,若是超過 25 年左右的房屋,也有可能不符合最新的耐震規範,並未具備現今標準下足夠的耐震能力。 

延伸閱讀:

在地震界有句名言「地震不會殺人,但建築物會」,因此,若建築物的結構不符合地震規範,地震發生時,在同一面積下越密集的老屋,有可能造成越多的傷亡。

因此,對於發生在都會區的直下型地震,預警時間的要求更高,需求也更迫切。

-----廣告,請繼續往下閱讀-----

地震中心著手於人口密集之都會區開發「客製化」的強震預警系統,目標針對都會區直下型淺層地震,可以在「震後 7 秒內」發布地震警報,將地震預警盲區縮小為 25 公里。

111 年起,地震中心已先後完成大臺北地區、桃園市客製化作業模組,並開始上線測試,當前正致力於臺南市的模組,未來的目標為高雄市與臺中市。

永不停歇的防災宣導行動、地震預警技術研發

地震預警系統僅能在地震來臨時警示民眾避難,無法主動保護民眾的生命安全,若人民沒有搭配正確的防震防災觀念,即使地震警報再快,也無法達到有效的防災效果。

因此除了不斷革新地震預警系統的技術,地震中心也積極投入於地震的宣導活動和教育管道,經營 Facebook 粉絲專頁「報地震 – 中央氣象署」、跨部會舉辦《地震島大冒險》特展、《震守家園 — 民生公共物聯網主題展》,讓民眾了解正確的避難行為與應變作為,充分發揮地震警報的效果。

-----廣告,請繼續往下閱讀-----

此外,雖然地震中心預計於 114 年將都會區的預警費時縮減為 7 秒,研發新技術的腳步不會停止;未來,他們將應用 AI 技術,持續強化地震預警系統的效能,降低地震對臺灣人民的威脅程度,保障你我生命財產安全。

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
196 篇文章 ・ 300 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

2
0

文字

分享

1
2
0
平民登月計劃?核融合真的來了?——2023 最值得關注十大科學事件(下)
PanSci_96
・2023/01/31 ・3226字 ・閱讀時間約 6 分鐘

在上一篇中,我們介紹了將在 2023 年發生的五個醫藥健康大事件。

延伸閱讀:
用迷幻藥治憂鬱?基因編輯療法將通過批准?——2023 最值得關注十大科學事件(上)

這次我們轉向能源、宇宙與科技領域,從首趟平民月球之旅、物理學的標準模型新發現,再到第一個核廢料永久儲存設施正式營運!

No. 5 氣候與能源衝擊

世界各國能否聽從科學家的警告,採取實際行動,朝淨零之路前進嗎?看起來不行。由於疫情與俄烏戰爭,去年 11 月在埃及舉辦的「聯合國氣候變化會議 COP27」幾乎是原地踏步。

不過還是有一個重要的決議,那就是建立氣候損失和損害基金。根據協議,排放量較高的富裕國家將在經濟上補償受氣候變化影響最大的貧窮國家。「過渡委員會」將於 2023 年 3 月底前舉行會議,提出資金運用的建議,並在 11 月的 COP28 會議上提交給世界各地的代表。

-----廣告,請繼續往下閱讀-----

至於核能的部分,新型核分裂發電與核融合發電,都會在 2023 年有所進展。

另外,世界上第一個核廢料儲存設施,今年將在芬蘭西南海岸外的奧爾基洛托島正式啟用。這個由芬蘭政府於 2015 年批准建造的地下處置庫,將負責封存超過 6500 噸有放射性的鈾;這些鈾會被裝在銅罐中,再用厚厚的粘土覆蓋,最後埋在地下 400 公尺深的花崗岩隧道內,預期將被密封數十萬年,直到輻射水平達到完全無害的程度。

另一個好消息是,今年 1 月 1 日就任的巴西總統——魯拉(Luiz Inácio Lula da Silva),將推翻前任總統開放的雨林開發,保護生態與文化。

然而深海則有新危機。若 2023 年 7 月前,聯合國的國際海床管理局(ISA)沒能讓各國對深海採礦管理準則達成共識,那海底的礦產資源可能會被某些政府和企業盯上,不受限制地開挖,海洋生態將迎來浩劫……。

-----廣告,請繼續往下閱讀-----

許多關於能源的抉擇包含了科學和政治,能源短缺也激勵了綠能跟潔淨能源的投資力道及採用意願;至於今年還會不會發生更棘手的麻煩?使能源轉型更加舉步維艱。

巴西新任總統推翻雨林開發,保護生態與文化。圖/Envato Elements

No. 4 超越標準模型

2022 年 4 月,美國費米國家加速器實驗室的物理學家,公佈了渺子 g-2 實驗的首批結果;這項實驗研究了被稱為「渺子的短命粒子在磁場中的行為」。

過去 50 年來,標準模型(Standard Model)[註]的理論預測通過了所有測試,但其實物理學家普遍認為標準模型肯定還不完備,並且認為可以從渺子身上找到破綻;如果今年再次公佈更精確的數據,顯示渺子的磁矩比理論預測來得大,那就代表還有新粒子等待被發現,而標準模型就得修正。

位於中國廣東的江門地下的微中子實驗觀測站,也將在今年展開尋找超越標準模型的物理學之旅;利用位於地下七百公尺的探測器,來準確測量微中子的振盪。

-----廣告,請繼續往下閱讀-----

註:標準模型為能描述強核力、弱核力、電磁力這三種基本力,以及所有物質基本粒子的理論。

另外,物理學家們在今年會有升級的新設備。第一個是 LCLS-II 直線加速器相干光源 2 代(Linac Coherent Light Source-II),它將創造終極 X 射線機器,看到分子內原子的運動!另一個則是新的重力波獵人—— Matter-Wave Laser Interferometric Gravitation Antenna(物質波雷射干涉重力天線);這個設施把銣原子冷卻成「物質波」,能夠梳理黑洞和其他超大質量天體碰撞產生的時空漣漪,揪出現有重力波設施錯放的事件,甚至可以幫我們尋找暗物質!

而在瑞典隆德附近、由歐洲 17 國攜手成立的歐洲散裂中子源(ESS),將使用史上最強大的線性質子加速器產生強中子束,來研究材料的結構;雖然預計 2025 年才會完工,但於今年迎來第一批研究人員,開始實驗。

No.3 就是要抬頭看天空

許多人心中 2022 年科學事件第一名,正是韋伯太空望遠鏡傳回的驚人照片;沒有意外的話,韋伯在 2023 年會繼續大顯身手,揭露星系演變的真相,與遙遠系外行星的生命印記,找尋地球之外的生命。

今年還會有更多驚喜!來自於新的太空望遠鏡,如:由歐洲太空總署開發的歐幾里得太空望遠鏡,今年發射後將繞行太陽六年,拍攝宇宙的 3D 圖;日本宇宙航空研究開發機構 JAXA 的 X 射線成像、光譜任務 XRISM,則是繞地球軌道運行的太空望遠鏡,將探測來自遙遠恆星和星系的 X 射線,預計在今年 4 月升空。

-----廣告,請繼續往下閱讀-----

在地球上,位於智利的薇拉魯賓天文台(Vera C. Rubin Observatory)將於今年 7 月啟用;其望遠鏡採用特殊的三鏡面設計,相機包含超過 30 億像素的固態探測器,每三個夜晚就能掃描整個南天,也是監測可能危害地球小行星的守護者之一。而世界上最大的可動望遠鏡——新疆奇台射電望遠鏡(QTT)也將在今年完工;其口徑達 110 公尺,能夠觀測天空中 75% 的星星。

詹姆斯.韋伯太空望遠鏡(James Webb Space Telescope,JWST)去年發布的圖片——史蒂芬五重星系。圖/維基百科

No. 2 好多月球任務,還有一個鐵小行星

2022/12/11 這天,包括阿拉伯聯合大公國的拉希德漫遊者月球車、NASA 的月球手電筒立方衛星、以及日本的白兔 HAKUTO-R M1 登陸器,共同搭乘 SpaceX 的獵鷹九號發射升空;HAKUTO-R 如今正緩緩帶著拉希德前往月球,預計在今年 4 月著陸。

而印度太空研究組織 ISRO 的第三次探月任務月球飛船 Chandrayaan-3,預計今年年中發射,並於月球的南極著陸。

還有首次民間人士的月球之旅 dearMoon。SpaceX 的 Starship 將載著 11 位平民上太空,包含創業家、明星跟 YouTuber;如果 Starship 成功發射,將會成為史上最大的火箭。Blue Origin 的 New Glenn 也預計在今年首度發射。若兩者都成功,將推動太空科學與商業進入新時代,讓進入太空的成本大幅下降。

-----廣告,請繼續往下閱讀-----

歐洲太空總署的木星冰月探測器 JUICE 也將在今年 4 月升空,並於 2031 年抵達木星系統;目標是研究木星以及三顆衛星:木衛二三四的環境,了解他們有沒有可能支持生命存在。

NASA 將於今年 10 月後發射延遲了一年的 Psyche 靈神星小行星軌道飛行器,其研究對象為 16 Psyche 靈神星小行星;科學家認為它可能不是一般的小行星,而是一顆年輕行星裸露的鐵核心。如果今年順利發射,將在 2029 年到達。 

看來對太空迷來說,2023 又將是幸福熱鬧的一年。

由超大型望遠鏡(Very Large Telescope,VLT)拍攝的靈神星。圖/維基百科

No.1 GPT-4 跟 AlphaFold 的衝擊波襲來

借過借過,AI 已預約登上 2023 年最大科學事件!

-----廣告,請繼續往下閱讀-----

如果 GPT-3.5 開發的 ChatGPT 還沒有嚇到你,那 GPT-4 就要來了!

而在科學領域,DeepMind 的 AlphaFold 帶來的衝擊不亞於 ChatGPT;它能夠根據蛋白質的一維氨基酸序列,準確預測折疊後的三維形狀,對生物與醫療研究影響非常大。 AlphaFold 2 於 2021 年發布了另外 2 億多種蛋白質的結構,幾個月來,來自 190 個國家/地區、超過 50 萬名研究人員,使用 AlphaFold 研究了 200 萬種不同的蛋白質結構。另外,Meta 的 ESMFold 的速度甚至又比 AlphaFold 快 60 倍,預測的蛋白質超過 6 億種!

基於 AlphaFold 跟 ESMFold 的研究量將大大增加,這些龐大新知識也將開始應用於各學科,包括新疫苗和塑膠開發。

法規管制總是比科技進步緩慢,隨著 AI 越來越強大、滲透到社會的方方面面,各國政府必須回應。歐盟在今年將通過人工智慧法案,為使用人工智慧制定標準,其他國家和科技巨頭將密切關注,跟進與調適。

-----廣告,請繼續往下閱讀-----
圖/GIPHY

以上就是「2023 最值得關注十大科學事件」,你最期待的是哪一個?哪個是你心中的 No.1?又有哪些我們漏掉了,但你覺得該列入的呢?歡迎留言討論!

歡迎訂閱 Pansci Youtube 頻道 鎖定 2023 年的每一個科學大事件!

所有討論 1
PanSci_96
1217 篇文章 ・ 2147 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

1

38
1

文字

分享

1
38
1
回到 AlphaGo 打敗棋王的那一天,看 AI 如何顛覆世界——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/30 ・4915字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

谷歌收購深度心智(DeepMind)幾週後,深度心智創辦人德米斯.哈薩比斯(Demis Hassabis)與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。

幕後推手——德米斯.哈薩比斯

會議結束後,哈薩比斯和谷歌創辦人賽吉.布林(Sergey Brin)聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和賴利.佩吉(Larry Page)建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。

哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

深度心智創辦人、英國人工智慧研究者——德米斯.哈薩比斯(Demis Hassabis)。圖/維基百科

「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。

-----廣告,請繼續往下閱讀-----

他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓),辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

揭開比賽序幕

深度心智的研究員們在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。

IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國——更別提日本與中國——圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

圍棋在中、日、韓具民族性,AlphaGo 與李世乭的對弈備受矚目。圖/維基百科

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感,雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。

-----廣告,請繼續往下閱讀-----

第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。

「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。

他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋,自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的——其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局;AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

在四季飯店頂樓的賽前餐敘,谷歌董事長艾力克.施密特(Eric Schmidt)坐在哈薩比斯的對面,以他一貫冷峻的態度闡述深度學習的優點。一度有人稱他為工程師,他糾正他們,「我不是工程師,」他說道,「我是電腦科學家。」

-----廣告,請繼續往下閱讀-----
艾力克.施密特(Eric Schmidt)2001~2011 年間在 Google 擔任 CEO。圖/維基百科

他回憶他在 1970 年代研讀電腦科學時,人工智慧看來前景一片大好,但是隨著 1980 年代過去,進入 1990 年代,這樣的美景從未實現。如今,終於實現了。「這一科技,」他說道,「力量強大,引人入勝。」他表示,人工智慧不只是辨識照片的戲法,同時也代表谷歌 750 億美元的網際網路事業與其他無數的產業,包括保健產業。

機器與人類高手對決

在第一局,哈薩比斯是在私人觀賞室與走廊另一頭的 AlphaGo 控制室之間來回兩頭跑。控制室滿是個人電腦、筆記型電腦與平面顯示幕,這些設備全都與遠在太平洋彼端的谷歌數據中心內部數百台電腦相連。一支谷歌團隊在比賽前一週就已架設一條專屬的超高速光纖電纜直達控制室,以確保網際網路暢通無阻。

不過結果卻顯示控制室根本不需要進行多少操控:幾過多月的訓練之後,AlphaGo 已能完全獨力作業,不需要人為的幫助。同時,就算哈薩比斯與團隊想幫忙,也無用武之地。他們沒有一人的圍棋棋力達到大師級的水準,他們只能觀看棋局。

「我無法形容有多緊張,」深度心智研究員說道,「我們不知道該聽誰的。一邊是評論員的看法,你同時也看到 AlphaGo 的評估。所有的評論員都有不同的意見。」

-----廣告,請繼續往下閱讀-----

在第一天的棋賽,深度心智團隊與谷歌的重要人物都親眼目睹 AlphaGo 獲勝。

賽後記者會上,李世乭面對來自東、西方數百名記者與攝影師表示他感到震驚。這位 33 歲的棋士透過口譯員說道:「我沒想到 AlphaGo 下棋竟能夠如此完美。」經過逾四小時的對弈,AlphaGo 證明自己的棋力可與全球最厲害的高手匹敵,李世乭表示他被 AlphaGo 殺了個措手不及,他在第二局會改變策略。

左為代替 AlphaGo 移動棋子的深度心智台灣研究員黃士傑,右則為李世乭。圖/YouTube

神來一筆的第三十七手

第二局對弈進行一小時後,李世乭起身離開賽場,走到露台抽菸。坐在李世乭對面,代替 AlphaGo 移動棋子的是來自台灣的深度心智研究員黃士傑,他將一枚黑子落在棋盤右邊一大塊空地上單獨一枚白子的側邊下方,這是該局的第三十七手。

在角落的評論室內,西方唯一的圍棋最高段九段棋手邁克.雷蒙(Michael Redmond)忍不住多看了一眼確認,然後他告訴在線上觀看棋賽的兩百多萬英語觀眾:「我真的不知道這是高招還是爛招。」他的共同評論員克里斯.戈拉克(Chris Garlock)則表示:「我認為下錯了。」他是一本網路圍棋雜誌的資深編輯,同時也是美國圍棋協會的副會長。

-----廣告,請繼續往下閱讀-----

李世乭在幾分鐘後返回座椅,然後又緊盯著棋盤幾分鐘。他總共花了 15 分鐘才做出回應,在棋局的第一階段他有兩小時的時間,而這一手占用了他不少時間——而且此後他再也沒有找回節奏。在經過逾四小時的對弈後,他投子認輸,他連輸兩局了。

第三十七手也讓樊麾大感詫異,他在幾個月前遭到 AlphaGo 徹底擊敗,自此之後他就加入深度心智,在 AlphaGo 與李世乭對弈前擔任它的陪訓員。他從來沒有擊敗過這部人工智慧機器,但是他與 AlphaGo 的對弈也讓他對棋路的變化大開眼界。事實上,他在遭 AlphaGo 擊敗後的幾週內,與(人類)高手對弈連贏六場,他的世界排名也升至新高。

現在,他站在四季飯店七樓的評論室外面,在第三十七手落子幾分鐘後,他看出了此一怪招的威力。「這不是人類會下的棋路,我從來沒有看過有人這麼下,」他說道,「太美了。」他不斷地重複說道,太美了、太美了、太美了。

第二天上午,深度心智的研究員大衛.席瓦爾溜進控制室,他想知道 AlphaGo 如何做出第三十七手的選擇。AlphaGo 在每一局對弈中都會根據它所受過數千萬種人類落子變化的訓練,來計算人類做出此一選擇的機率,而在第三十七手,它算出的機率是萬分之一。

-----廣告,請繼續往下閱讀-----
AlphaGo 在對弈中會根據千萬種落子變化,計算出人類下此一步棋的機率。圖/YouTube

AlphaGo 知道這不是專業棋手會選擇的路數,然而它根據與自己對弈的數百萬次經驗——沒有人類參與的棋局——它仍是這麼做了;它已了解儘管人類不會選擇這一步,這一步棋仍是正確的選擇。「這是它自己發現的,」席瓦爾說道,「透過它的內省。」

這是一個既甜美又苦澀的時刻,儘管樊麾大讚此一步棋是神來之筆,但是一股鬱悶之情席捲四季飯店,甚至整個韓國。一位中國記者表示,儘管他為 AlphaGo 贏得第一局感到高興,可是現在他深感沮喪。

第二天,一位在首爾彼端經營一家新創企業育成中心的韓國人權五亨表示他也感到悲傷,這並非因為李世乭是一位韓國人,而是因為他是人類,「這是全人類的轉捩點,」權五亨說道,他的幾位同事點頭表示同意,「它讓我們了解人工智慧真的已在我們眼前——也讓我們了解到其中的危險。」

在那個週末,此一鬱悶的情緒只增不減。李世乭第三局也輸了,等於輸掉整個棋賽。坐在賽後記者會的桌子後面,李世乭懺悔之情溢於言表。「我不知道今天要說什麼,但是我首先要表達我的歉意,」他說道,「我應該拿出更好的成績,更好的結局,更好的比賽。」但是坐在李世乭身邊的哈薩比斯卻發現,自己衷心期盼這位韓國棋手在接下來的兩局中至少能贏一局。

-----廣告,請繼續往下閱讀-----

AlphaGo 認輸的那一局

在第四局的七十七手,李世乭再度陷入長考,就和第二局的情況一樣,但是這一回他考慮的時間更久。棋盤中間有一堆棋子,黑白相間,他有近二十分鐘只是緊盯著這些棋子,抓著後頸前後擺動。最後,他將他的白子落在棋盤中央的兩枚黑子之間,將棋勢一分為二,AlphaGo 方寸大亂。

在每一場對弈中,AlphaGo 都會不斷重新計算勝率,並且顯示在控制室的一台平面顯示幕上。

在李世乭落子後——第七十八手——這部機器的反擊很差,在顯示幕上的勝率立刻大降。「AlphaGo 累積到那一步之前的所有戰略都算是報銷了,」哈薩比斯說道,「它必須重新再來。」就在此刻,李世乭抬頭看著對面的黃士傑,彷彿他擊敗的是這人,不是機器。自此之後,AlphaGo 的勝率一路下跌,在近五個小時後,它投子認輸。

DeepMind 製作的 AlphaGo 與李世乭對弈紀綠片。/YouTube

兩天後,哈薩比斯穿過四季飯店的大廳,解釋 AlphaGo 為什麼會輸。AlphaGo 當時是假設沒有人類會這樣下第七十八手,它計算出來的機率是萬分之一——這是一個它熟悉的數字。

就像 AlphaGo 一樣,李世乭的棋力也達到一個新境界,他在棋賽最後一天的私人聚會場合中這樣告訴哈薩比斯。他說與機器對弈不僅讓他重燃對圍棋的熱情,同時也讓他茅塞頓開,使他有了新想法。「我已經進步了。」他告訴哈薩比斯,一如幾天前的樊麾,李世乭之後與人類高手對弈,連贏九場。

AlphaGo 與李世乭的對弈,使得人工智慧在世人眼前大爆發,它不僅是屬於人工智慧領域與科技公司,同時也是屬於市井小民的里程碑。在美國如此,在韓國與中國更是如此,因為這些國家視圍棋為人類智慧結晶的巔峰。這場棋賽彰顯出科技的力量與其終將超越人類的恐懼,同時也帶來樂觀的前景,此一科技往往會以出人意表的方式推動人類更上層樓。儘管馬斯克等人警告其中的危險性,但是這段時期人工智慧的前景一片光明。

裘蒂.英賽恩(Jordi Ensign)是佛羅里達州一位四十五歲的程式設計師,她在讀完棋賽報導後出去在身上紋了兩幅刺青,她在右臂內側紋了 AlphaGo 的第三十七手——左臂紋了李世乭的第七十八手。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載

所有討論 1
時報出版_96
174 篇文章 ・ 34 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。