Loading [MathJax]/extensions/tex2jax.js

1

0
0

文字

分享

1
0
0

從無知到無敵:AlphaGo Zero 是怎麼辦到的?

果殼網_96
・2017/11/13 ・2402字 ・閱讀時間約 5 分鐘 ・SR值 530 ・七年級

-----廣告,請繼續往下閱讀-----

  • 作者/開明|Nature 市場專員,喜歡可愛的動物、美味的咖啡,和深度的旅行。

人工智慧棋手 AlphaGo 先後戰勝了兩位頂尖圍棋高手李世乭和柯潔。在這場猛烈風暴席捲了世界後,AlphaGo 宣布不再和人下棋。但它的製造者並没有因此停下腳步,AlphaGo 還在成長,今天 Deepmind 又在《自然》期刊上發表了關於 AlphaGo 的新論文。

圍棋中有超過 10 的 170 次方種變化,這比已知宇宙中所有的原子數量加在一起還要多,圖/by DeepMind

這篇論文中的 AlphaGo 是全新的、它不是戰勝柯潔的那個最强的 Master,但卻是它的孿生兄弟。它的名字叫 AlphaGo Zero,是AlphaGo 的最新版本。

和以前的 AlphaGo 相比,它:

  • 從零開始學習,不需要任何人類的經驗
  • 使用更少的算力得到了更好的结果
  • 發現了新的圍棋定式
  • 將策略網路和值網路合併
  • 使用了深度殘差網路
  • 白板理論(Tabula rasa)

哲學上有種觀點認為,嬰兒生下來是白板一塊,通過不斷訓練、成長獲得知識和智力。

-----廣告,請繼續往下閱讀-----

作為 AI 領域的先驅,圖靈使用了這個想法。在提出了著名的「圖靈測試」的論文中,他從嬰兒是一塊白板出發,認為只要能用機器製造一個類似小孩的 AI,然後加以訓練,就能得到一個近似成人智力,甚至超越人類智力的 AI。

現代科學了解到的事實並不是這樣,嬰兒生下來就有先天的一些能力,他們偏愛高熱量的食物,餓了就會哭鬧希望得到注意。這是 DNA 在億萬年的演化中學来的。

監督和無監督學習

計算機則完全不同,它沒有億萬年的演化,因此也没有這些先天的知識,是真正的「白板一塊」。監督學習和無監督學習(Supervised & Unsupervised Learning)是鏡子的兩面,兩者都想解决同一個問題——如何讓機器從零開始獲得智慧?

監督學習認為人要把自己的經驗教给機器。拿分辨猫猫和狗狗的 AI 來說,你需要準備幾千張照片,然後手把手教機器——哪張照片是猫,哪張照片是狗。機器會從中學習到分辨猫狗的细節,從毛髮到眼睛到耳朵,然後舉一反三得去判斷一張它從沒見過的照片是猫猫還是狗狗。

-----廣告,請繼續往下閱讀-----

而無監督學習認為機器要去自己摸索,自己發現規律。人的經驗或許能幫助機器掌握智慧,但或許人的經驗是有缺陷的,不如讓機器自己發現新的,更好的規律。人的經驗就放一邊吧。

這展示的是包含 20 個神經網路模塊的 AlphaGo Zero 版本,在訓練的不同階段進行的 3 盤左右互搏棋局的前 80 步,動畫在,圖/by DeepMind。

從無知到無敵

就像這篇新論文中講述的那樣。AlphaGo Zero 是無監督學習的產物,而它的雙胞胎兄弟 Master 則用了監督學習的方法。在訓練了 72 小時後 AlphaGo Zero 就能打敗戰勝李世乭的 AlphaGo Lee,相比較 AlphaGo Lee 訓練了幾個月。而 40 天後,它能以 89:11 的成積,將戰勝了所有人類高手的 Master 甩在後面。

圖靈的白板假設雖然無法用在人身上,但是 AlphaGo Zero 證明了,一個白板 AI 能夠被訓練成超越人類的圍棋高手。

强化學習

强化學習(Reinforcement Learning)是一種模仿人類學習方式的模型,它的基本方法是:要是機器得到了好的结果就能得到獎勵,要是得到差的结果就得到懲罰。AlphaGo Zero 並没有像之前的兄弟姐妹一樣被教育了人類的圍棋知識。它只是和不同版本的自己下棋,然後用勝者的思路来訓練新的版本,如此不斷重複。

-----廣告,請繼續往下閱讀-----
這個圖片展示的是包含 40 個神經網路模塊的 AlphaGo Zero 版本自學成才的過程。3 天超過打敗李世乭的 AlphaGO Lee,21 天超過打敗柯潔的 AlphaGo Master。自學 40 天之後就超過了所有其他的 AlphaGo 版本,動畫在這裡。圖/by DeepMind。

通過這一方法,AlphaGo Zero 完全自己摸索出了開局,收官,定式等以前人類已知的圍棋知識,也摸索出了新的定势。

算法和性能

如何高效合理得利用計算資源?這是算法要解决的一個重要問题。AlphaGo Lee 使用了 48 個 TPU,更早版本的 AlphaGo Fan 使用了 176 個 GPU,而 Master 和 AlphaGo Zero 僅僅用了 4 個 TPU,也就是說一台電腦足夠!

AlphaGo Zero 在 72小時内就能超越 AlphaGo Lee 也表明,優秀的算法不僅僅能降低能耗,也能極大提高效率。另外這也說明,圍棋問題的複雜度並不需要動用大規模的計算能力,那只是浪費。


憑借硬件性能的不斷升级和算法的不斷優化,AlphaGo 後期版本的運算效率明顯優於最初的版本,圖/by DeepMind

AlphaGo Zero 的算法有兩處核心優化:將策略網路(計算下子的概率)和值網路(計算勝率)這兩個神經網路结合,其實在第一篇 AlphaGo 的論文中,這兩種網路已經使用了類似的架構。另外,引入了深度殘差網路(DeepResidual Network),比起之前的多層神經網路效果更好。

-----廣告,請繼續往下閱讀-----

Deepmind 的歷程

DeepMind 創始人之一,德米斯・哈薩比斯(Demis Hassabis),圖/果壳网提供。

這不是 Deepmind 第一次在《自然》期刊上投稿,他們還發表過《利用深度神經網路和搜索樹的圍棋 AI》和《AI 電腦遊戲大師》等幾篇論文。

我們可以從中一窺 Deepmind 的思路,他們尋找人類還没有理解原理的遊戲,遊戲比起現實世界的問題要簡單很多。然後他們選擇了兩條路,一條道路是優化算法,另外一條道路是讓機器不受人類先入為主經驗的影響。

這兩條路交匯的终點,是那個超人的 AI。

DeepMind創始人之一,大衛・席爾瓦(David Silver),圖/果壳网提供。

結語

這是 AlphaGo 的终曲,也是一個全新的開始,相關技術將被用於造福人類,幫助科學家認識蛋白質折疊,製造出治療疑難雜症的藥物,開發新材料,以製造以出更好的產品。(編輯:明天)

-----廣告,請繼續往下閱讀-----

本文版權屬於果殼網(微信公眾號:Guokr42),原文為〈零開始,全憑自學,它用 40 天完虐 AlphaGo!〉,禁止轉載。如有需要,請聯繫sns@guokr.com

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 1
果殼網_96
108 篇文章 ・ 9 位粉絲
果殼傳媒是一家致力於面向公眾倡導科技理念、傳播科技內容的企業。2010年11月,公司推出果殼網(Guokr.com) 。在創始人兼CEO姬十三帶領的專業團隊努力下,果殼傳媒已成為中國領先的科技傳媒機構,還致力於為企業量身打造面向公眾的科技品牌傳播方案。

0

1
1

文字

分享

0
1
1
伺服器過熱危機!液冷與 3D VC 技術如何拯救高效運算?
鳥苷三磷酸 (PanSci Promo)_96
・2025/04/11 ・3194字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 高柏科技 合作,泛科學企劃執行。

當我們談論能擊敗輝達(NVIDIA)、Google、微軟,甚至是 Meta 的存在,究竟是什麼?答案或許並非更強大的 AI,也不是更高速的晶片,而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

 2024 年底至 2025 年初,搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機,傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題,但這場「科技 vs. 熱」的對決,才剛剛開始。 

不僅僅是輝達,微軟甚至嘗試將伺服器完全埋入海水中,希望藉由洋流降溫;而更激進的做法,則是直接將伺服器浸泡在冷卻液中,來一場「浸沒式冷卻」的實驗。

-----廣告,請繼續往下閱讀-----

但這些方法真的有效嗎?安全嗎?從大型數據中心到你手上的手機,散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技,一同看看如何用科學破解這場高溫危機!

運算=發熱?為何電腦必然會發熱?

為什麼電腦在運算時溫度會升高呢? 圖/unsplash

這並非新問題,1961年物理學家蘭道爾在任職於IBM時,就提出了「蘭道爾原理」(Landauer Principle),他根據熱力學提出,當進行計算或訊息處理時,即便是理論上最有效率的電腦,還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失,系統的熵就會上升,而隨著熵的增加,也會產生熱能。

換句話說,當計算是不可逆的時候,就像產品無法回收再利用,而是進到垃圾場燒掉一樣,會產生許多廢熱。

要解決問題,得用科學方法。在一個系統中,我們通常以「熱設計功耗」(TDP,Thermal Design Power)來衡量電子元件在正常運行條件下產生的熱量。一般來說,TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量,通常以瓦特(W)為單位。也就是說,TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP,例如AMD的CPU 9950X,TDP是170W,GeForce RTX 5090則高達575W,伺服器用的晶片,則可能動輒千瓦以上。

-----廣告,請繼續往下閱讀-----

散熱不僅是AI伺服器的問題,電動車、儲能設備、甚至低軌衛星,都需要高效散熱技術,這正是高柏科技的專長。

「導熱介面材料(TIM)」:提升散熱效率的關鍵角色

在電腦世界裡,散熱的關鍵就是把熱量「交給」導熱效率高的材料,而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中,晶片表面和散熱片之間並不會完美貼合,表面多少會有細微間隙,而這些縫隙如果藏了空氣,就會變成「隔熱層」,阻礙熱傳導。

為了解決這個問題,需要一種關鍵材料,導熱介面材料(TIM,Thermal Interface Material)。它的任務就是填補這些縫隙,讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」,即使主線有再多車道,如果匝道堵住了,車流還是無法順利進入高速公路。同樣地,如果 TIM 的導熱效果不好,熱量就會卡在晶片與散熱片之間,導致散熱效率下降。

-----廣告,請繼續往下閱讀-----

那麼,要怎麼提升 TIM 的效能呢?很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁,若要更高效的散熱材料,則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成:高導熱粉末(如金屬或陶瓷粉末)與聚合物基質。大部分散熱膏的特點是流動性好,盡可能地貼合表面、填補縫隙。但也因為太「軟」了,受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸,高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後,會出現乾裂或表面變硬。

為了解決這個問題,高柏科技推出了凝膠狀的「導熱凝膠」,說是凝膠,但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄,比較不會熱裂解、壽命也比較長。

OK,到這裡,「匝道」的問題解決了,接下來的問題是:這條散熱高速公路該怎麼設計?你會選擇氣冷、水冷,還是更先進的浸沒式散熱呢?

-----廣告,請繼續往下閱讀-----

液冷與 3D VC 散熱技術:未來高效散熱方案解析

除了風扇之外,目前還有哪些方法可以幫助電腦快速散熱呢?圖/unsplash

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量,也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限,因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷,熱量在經過 TIM 後進入水冷頭,水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好,且增加的體積不大。唯一需要注意的是,萬一元件損壞,可能會因為漏液而損害其他元件,且系統的成本較高。如果你對成本有顧慮,可以考慮另一種方案,「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義,就是把均溫板層層疊起來,變成3D結構。雖然均溫板長得也像是一塊金屬板,原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」,直接翻譯是「蒸氣腔室」。

在均溫板中,會放入容易汽化的工作流體,當流體在熱源處吸收熱量後就會汽化,當熱量被帶走,汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法,最大的特點是:導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻,不會有熱都聚集在入口(熱源處)的情況,能更有效降溫。

-----廣告,請繼續往下閱讀-----

整個 3DVC 的設計,是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯,能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC,就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是,工作流體移動的過程經過設計,因此不用插電,成本僅有水冷的十分之一。但相對的,因為是被動式散熱,其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC,高柏科技一直致力於不斷創新,並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積,高柏科技開發了6項專利技術,涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後,均溫板不僅保有高導熱性,還增強了結構強度,顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步,有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術,將主機板和零件完全泡在不導電的特殊液體中,許多冷卻液會選擇沸點較低的物質,因此就像均溫板一樣,可以透過汽化來吸收掉大量的熱,形成泡泡向上浮,達到快速散熱的效果。

然而,因為水會導電,因此替代方案之一是氟化物。雖然效率差了一些,但至少可以用。然而氟化物的生產或廢棄時,很容易產生全氟/多氟烷基物質 PFAS,這是一種永久污染物,會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液,例如礦物油、其他油品,又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告,請繼續往下閱讀-----

另外,把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等,都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證,相信很快就能推出更強大的散熱模組。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
223 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

3
0

文字

分享

1
3
0
平民登月計劃?核融合真的來了?——2023 最值得關注十大科學事件(下)
PanSci_96
・2023/01/31 ・3226字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

在上一篇中,我們介紹了將在 2023 年發生的五個醫藥健康大事件。

延伸閱讀:
用迷幻藥治憂鬱?基因編輯療法將通過批准?——2023 最值得關注十大科學事件(上)

這次我們轉向能源、宇宙與科技領域,從首趟平民月球之旅、物理學的標準模型新發現,再到第一個核廢料永久儲存設施正式營運!

No. 5 氣候與能源衝擊

世界各國能否聽從科學家的警告,採取實際行動,朝淨零之路前進嗎?看起來不行。由於疫情與俄烏戰爭,去年 11 月在埃及舉辦的「聯合國氣候變化會議 COP27」幾乎是原地踏步。

不過還是有一個重要的決議,那就是建立氣候損失和損害基金。根據協議,排放量較高的富裕國家將在經濟上補償受氣候變化影響最大的貧窮國家。「過渡委員會」將於 2023 年 3 月底前舉行會議,提出資金運用的建議,並在 11 月的 COP28 會議上提交給世界各地的代表。

-----廣告,請繼續往下閱讀-----

至於核能的部分,新型核分裂發電與核融合發電,都會在 2023 年有所進展。

另外,世界上第一個核廢料儲存設施,今年將在芬蘭西南海岸外的奧爾基洛托島正式啟用。這個由芬蘭政府於 2015 年批准建造的地下處置庫,將負責封存超過 6500 噸有放射性的鈾;這些鈾會被裝在銅罐中,再用厚厚的粘土覆蓋,最後埋在地下 400 公尺深的花崗岩隧道內,預期將被密封數十萬年,直到輻射水平達到完全無害的程度。

另一個好消息是,今年 1 月 1 日就任的巴西總統——魯拉(Luiz Inácio Lula da Silva),將推翻前任總統開放的雨林開發,保護生態與文化。

然而深海則有新危機。若 2023 年 7 月前,聯合國的國際海床管理局(ISA)沒能讓各國對深海採礦管理準則達成共識,那海底的礦產資源可能會被某些政府和企業盯上,不受限制地開挖,海洋生態將迎來浩劫……。

-----廣告,請繼續往下閱讀-----

許多關於能源的抉擇包含了科學和政治,能源短缺也激勵了綠能跟潔淨能源的投資力道及採用意願;至於今年還會不會發生更棘手的麻煩?使能源轉型更加舉步維艱。

巴西新任總統推翻雨林開發,保護生態與文化。圖/Envato Elements

No. 4 超越標準模型

2022 年 4 月,美國費米國家加速器實驗室的物理學家,公佈了渺子 g-2 實驗的首批結果;這項實驗研究了被稱為「渺子的短命粒子在磁場中的行為」。

過去 50 年來,標準模型(Standard Model)[註]的理論預測通過了所有測試,但其實物理學家普遍認為標準模型肯定還不完備,並且認為可以從渺子身上找到破綻;如果今年再次公佈更精確的數據,顯示渺子的磁矩比理論預測來得大,那就代表還有新粒子等待被發現,而標準模型就得修正。

位於中國廣東的江門地下的微中子實驗觀測站,也將在今年展開尋找超越標準模型的物理學之旅;利用位於地下七百公尺的探測器,來準確測量微中子的振盪。

-----廣告,請繼續往下閱讀-----

註:標準模型為能描述強核力、弱核力、電磁力這三種基本力,以及所有物質基本粒子的理論。

另外,物理學家們在今年會有升級的新設備。第一個是 LCLS-II 直線加速器相干光源 2 代(Linac Coherent Light Source-II),它將創造終極 X 射線機器,看到分子內原子的運動!另一個則是新的重力波獵人—— Matter-Wave Laser Interferometric Gravitation Antenna(物質波雷射干涉重力天線);這個設施把銣原子冷卻成「物質波」,能夠梳理黑洞和其他超大質量天體碰撞產生的時空漣漪,揪出現有重力波設施錯放的事件,甚至可以幫我們尋找暗物質!

而在瑞典隆德附近、由歐洲 17 國攜手成立的歐洲散裂中子源(ESS),將使用史上最強大的線性質子加速器產生強中子束,來研究材料的結構;雖然預計 2025 年才會完工,但於今年迎來第一批研究人員,開始實驗。

No.3 就是要抬頭看天空

許多人心中 2022 年科學事件第一名,正是韋伯太空望遠鏡傳回的驚人照片;沒有意外的話,韋伯在 2023 年會繼續大顯身手,揭露星系演變的真相,與遙遠系外行星的生命印記,找尋地球之外的生命。

今年還會有更多驚喜!來自於新的太空望遠鏡,如:由歐洲太空總署開發的歐幾里得太空望遠鏡,今年發射後將繞行太陽六年,拍攝宇宙的 3D 圖;日本宇宙航空研究開發機構 JAXA 的 X 射線成像、光譜任務 XRISM,則是繞地球軌道運行的太空望遠鏡,將探測來自遙遠恆星和星系的 X 射線,預計在今年 4 月升空。

-----廣告,請繼續往下閱讀-----

在地球上,位於智利的薇拉魯賓天文台(Vera C. Rubin Observatory)將於今年 7 月啟用;其望遠鏡採用特殊的三鏡面設計,相機包含超過 30 億像素的固態探測器,每三個夜晚就能掃描整個南天,也是監測可能危害地球小行星的守護者之一。而世界上最大的可動望遠鏡——新疆奇台射電望遠鏡(QTT)也將在今年完工;其口徑達 110 公尺,能夠觀測天空中 75% 的星星。

詹姆斯.韋伯太空望遠鏡(James Webb Space Telescope,JWST)去年發布的圖片——史蒂芬五重星系。圖/維基百科

No. 2 好多月球任務,還有一個鐵小行星

2022/12/11 這天,包括阿拉伯聯合大公國的拉希德漫遊者月球車、NASA 的月球手電筒立方衛星、以及日本的白兔 HAKUTO-R M1 登陸器,共同搭乘 SpaceX 的獵鷹九號發射升空;HAKUTO-R 如今正緩緩帶著拉希德前往月球,預計在今年 4 月著陸。

而印度太空研究組織 ISRO 的第三次探月任務月球飛船 Chandrayaan-3,預計今年年中發射,並於月球的南極著陸。

還有首次民間人士的月球之旅 dearMoon。SpaceX 的 Starship 將載著 11 位平民上太空,包含創業家、明星跟 YouTuber;如果 Starship 成功發射,將會成為史上最大的火箭。Blue Origin 的 New Glenn 也預計在今年首度發射。若兩者都成功,將推動太空科學與商業進入新時代,讓進入太空的成本大幅下降。

-----廣告,請繼續往下閱讀-----

歐洲太空總署的木星冰月探測器 JUICE 也將在今年 4 月升空,並於 2031 年抵達木星系統;目標是研究木星以及三顆衛星:木衛二三四的環境,了解他們有沒有可能支持生命存在。

NASA 將於今年 10 月後發射延遲了一年的 Psyche 靈神星小行星軌道飛行器,其研究對象為 16 Psyche 靈神星小行星;科學家認為它可能不是一般的小行星,而是一顆年輕行星裸露的鐵核心。如果今年順利發射,將在 2029 年到達。 

看來對太空迷來說,2023 又將是幸福熱鬧的一年。

由超大型望遠鏡(Very Large Telescope,VLT)拍攝的靈神星。圖/維基百科

No.1 GPT-4 跟 AlphaFold 的衝擊波襲來

借過借過,AI 已預約登上 2023 年最大科學事件!

-----廣告,請繼續往下閱讀-----

如果 GPT-3.5 開發的 ChatGPT 還沒有嚇到你,那 GPT-4 就要來了!

而在科學領域,DeepMind 的 AlphaFold 帶來的衝擊不亞於 ChatGPT;它能夠根據蛋白質的一維氨基酸序列,準確預測折疊後的三維形狀,對生物與醫療研究影響非常大。 AlphaFold 2 於 2021 年發布了另外 2 億多種蛋白質的結構,幾個月來,來自 190 個國家/地區、超過 50 萬名研究人員,使用 AlphaFold 研究了 200 萬種不同的蛋白質結構。另外,Meta 的 ESMFold 的速度甚至又比 AlphaFold 快 60 倍,預測的蛋白質超過 6 億種!

基於 AlphaFold 跟 ESMFold 的研究量將大大增加,這些龐大新知識也將開始應用於各學科,包括新疫苗和塑膠開發。

法規管制總是比科技進步緩慢,隨著 AI 越來越強大、滲透到社會的方方面面,各國政府必須回應。歐盟在今年將通過人工智慧法案,為使用人工智慧制定標準,其他國家和科技巨頭將密切關注,跟進與調適。

-----廣告,請繼續往下閱讀-----
圖/GIPHY

以上就是「2023 最值得關注十大科學事件」,你最期待的是哪一個?哪個是你心中的 No.1?又有哪些我們漏掉了,但你覺得該列入的呢?歡迎留言討論!

歡迎訂閱 Pansci Youtube 頻道 鎖定 2023 年的每一個科學大事件!

-----廣告,請繼續往下閱讀-----
所有討論 1
PanSci_96
1262 篇文章 ・ 2408 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

1

38
1

文字

分享

1
38
1
回到 AlphaGo 打敗棋王的那一天,看 AI 如何顛覆世界——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/30 ・4915字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

谷歌收購深度心智(DeepMind)幾週後,深度心智創辦人德米斯.哈薩比斯(Demis Hassabis)與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。

幕後推手——德米斯.哈薩比斯

會議結束後,哈薩比斯和谷歌創辦人賽吉.布林(Sergey Brin)聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和賴利.佩吉(Larry Page)建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。

哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

深度心智創辦人、英國人工智慧研究者——德米斯.哈薩比斯(Demis Hassabis)。圖/維基百科

「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。

-----廣告,請繼續往下閱讀-----

他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓),辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

揭開比賽序幕

深度心智的研究員們在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。

IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國——更別提日本與中國——圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

圍棋在中、日、韓具民族性,AlphaGo 與李世乭的對弈備受矚目。圖/維基百科

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感,雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。

-----廣告,請繼續往下閱讀-----

第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。

「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。

他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋,自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的——其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局;AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

在四季飯店頂樓的賽前餐敘,谷歌董事長艾力克.施密特(Eric Schmidt)坐在哈薩比斯的對面,以他一貫冷峻的態度闡述深度學習的優點。一度有人稱他為工程師,他糾正他們,「我不是工程師,」他說道,「我是電腦科學家。」

-----廣告,請繼續往下閱讀-----
艾力克.施密特(Eric Schmidt)2001~2011 年間在 Google 擔任 CEO。圖/維基百科

他回憶他在 1970 年代研讀電腦科學時,人工智慧看來前景一片大好,但是隨著 1980 年代過去,進入 1990 年代,這樣的美景從未實現。如今,終於實現了。「這一科技,」他說道,「力量強大,引人入勝。」他表示,人工智慧不只是辨識照片的戲法,同時也代表谷歌 750 億美元的網際網路事業與其他無數的產業,包括保健產業。

機器與人類高手對決

在第一局,哈薩比斯是在私人觀賞室與走廊另一頭的 AlphaGo 控制室之間來回兩頭跑。控制室滿是個人電腦、筆記型電腦與平面顯示幕,這些設備全都與遠在太平洋彼端的谷歌數據中心內部數百台電腦相連。一支谷歌團隊在比賽前一週就已架設一條專屬的超高速光纖電纜直達控制室,以確保網際網路暢通無阻。

不過結果卻顯示控制室根本不需要進行多少操控:幾過多月的訓練之後,AlphaGo 已能完全獨力作業,不需要人為的幫助。同時,就算哈薩比斯與團隊想幫忙,也無用武之地。他們沒有一人的圍棋棋力達到大師級的水準,他們只能觀看棋局。

「我無法形容有多緊張,」深度心智研究員說道,「我們不知道該聽誰的。一邊是評論員的看法,你同時也看到 AlphaGo 的評估。所有的評論員都有不同的意見。」

-----廣告,請繼續往下閱讀-----

在第一天的棋賽,深度心智團隊與谷歌的重要人物都親眼目睹 AlphaGo 獲勝。

賽後記者會上,李世乭面對來自東、西方數百名記者與攝影師表示他感到震驚。這位 33 歲的棋士透過口譯員說道:「我沒想到 AlphaGo 下棋竟能夠如此完美。」經過逾四小時的對弈,AlphaGo 證明自己的棋力可與全球最厲害的高手匹敵,李世乭表示他被 AlphaGo 殺了個措手不及,他在第二局會改變策略。

左為代替 AlphaGo 移動棋子的深度心智台灣研究員黃士傑,右則為李世乭。圖/YouTube

神來一筆的第三十七手

第二局對弈進行一小時後,李世乭起身離開賽場,走到露台抽菸。坐在李世乭對面,代替 AlphaGo 移動棋子的是來自台灣的深度心智研究員黃士傑,他將一枚黑子落在棋盤右邊一大塊空地上單獨一枚白子的側邊下方,這是該局的第三十七手。

在角落的評論室內,西方唯一的圍棋最高段九段棋手邁克.雷蒙(Michael Redmond)忍不住多看了一眼確認,然後他告訴在線上觀看棋賽的兩百多萬英語觀眾:「我真的不知道這是高招還是爛招。」他的共同評論員克里斯.戈拉克(Chris Garlock)則表示:「我認為下錯了。」他是一本網路圍棋雜誌的資深編輯,同時也是美國圍棋協會的副會長。

-----廣告,請繼續往下閱讀-----

李世乭在幾分鐘後返回座椅,然後又緊盯著棋盤幾分鐘。他總共花了 15 分鐘才做出回應,在棋局的第一階段他有兩小時的時間,而這一手占用了他不少時間——而且此後他再也沒有找回節奏。在經過逾四小時的對弈後,他投子認輸,他連輸兩局了。

第三十七手也讓樊麾大感詫異,他在幾個月前遭到 AlphaGo 徹底擊敗,自此之後他就加入深度心智,在 AlphaGo 與李世乭對弈前擔任它的陪訓員。他從來沒有擊敗過這部人工智慧機器,但是他與 AlphaGo 的對弈也讓他對棋路的變化大開眼界。事實上,他在遭 AlphaGo 擊敗後的幾週內,與(人類)高手對弈連贏六場,他的世界排名也升至新高。

現在,他站在四季飯店七樓的評論室外面,在第三十七手落子幾分鐘後,他看出了此一怪招的威力。「這不是人類會下的棋路,我從來沒有看過有人這麼下,」他說道,「太美了。」他不斷地重複說道,太美了、太美了、太美了。

第二天上午,深度心智的研究員大衛.席瓦爾溜進控制室,他想知道 AlphaGo 如何做出第三十七手的選擇。AlphaGo 在每一局對弈中都會根據它所受過數千萬種人類落子變化的訓練,來計算人類做出此一選擇的機率,而在第三十七手,它算出的機率是萬分之一。

-----廣告,請繼續往下閱讀-----
AlphaGo 在對弈中會根據千萬種落子變化,計算出人類下此一步棋的機率。圖/YouTube

AlphaGo 知道這不是專業棋手會選擇的路數,然而它根據與自己對弈的數百萬次經驗——沒有人類參與的棋局——它仍是這麼做了;它已了解儘管人類不會選擇這一步,這一步棋仍是正確的選擇。「這是它自己發現的,」席瓦爾說道,「透過它的內省。」

這是一個既甜美又苦澀的時刻,儘管樊麾大讚此一步棋是神來之筆,但是一股鬱悶之情席捲四季飯店,甚至整個韓國。一位中國記者表示,儘管他為 AlphaGo 贏得第一局感到高興,可是現在他深感沮喪。

第二天,一位在首爾彼端經營一家新創企業育成中心的韓國人權五亨表示他也感到悲傷,這並非因為李世乭是一位韓國人,而是因為他是人類,「這是全人類的轉捩點,」權五亨說道,他的幾位同事點頭表示同意,「它讓我們了解人工智慧真的已在我們眼前——也讓我們了解到其中的危險。」

在那個週末,此一鬱悶的情緒只增不減。李世乭第三局也輸了,等於輸掉整個棋賽。坐在賽後記者會的桌子後面,李世乭懺悔之情溢於言表。「我不知道今天要說什麼,但是我首先要表達我的歉意,」他說道,「我應該拿出更好的成績,更好的結局,更好的比賽。」但是坐在李世乭身邊的哈薩比斯卻發現,自己衷心期盼這位韓國棋手在接下來的兩局中至少能贏一局。

-----廣告,請繼續往下閱讀-----

AlphaGo 認輸的那一局

在第四局的七十七手,李世乭再度陷入長考,就和第二局的情況一樣,但是這一回他考慮的時間更久。棋盤中間有一堆棋子,黑白相間,他有近二十分鐘只是緊盯著這些棋子,抓著後頸前後擺動。最後,他將他的白子落在棋盤中央的兩枚黑子之間,將棋勢一分為二,AlphaGo 方寸大亂。

在每一場對弈中,AlphaGo 都會不斷重新計算勝率,並且顯示在控制室的一台平面顯示幕上。

在李世乭落子後——第七十八手——這部機器的反擊很差,在顯示幕上的勝率立刻大降。「AlphaGo 累積到那一步之前的所有戰略都算是報銷了,」哈薩比斯說道,「它必須重新再來。」就在此刻,李世乭抬頭看著對面的黃士傑,彷彿他擊敗的是這人,不是機器。自此之後,AlphaGo 的勝率一路下跌,在近五個小時後,它投子認輸。

DeepMind 製作的 AlphaGo 與李世乭對弈紀綠片。/YouTube

兩天後,哈薩比斯穿過四季飯店的大廳,解釋 AlphaGo 為什麼會輸。AlphaGo 當時是假設沒有人類會這樣下第七十八手,它計算出來的機率是萬分之一——這是一個它熟悉的數字。

就像 AlphaGo 一樣,李世乭的棋力也達到一個新境界,他在棋賽最後一天的私人聚會場合中這樣告訴哈薩比斯。他說與機器對弈不僅讓他重燃對圍棋的熱情,同時也讓他茅塞頓開,使他有了新想法。「我已經進步了。」他告訴哈薩比斯,一如幾天前的樊麾,李世乭之後與人類高手對弈,連贏九場。

AlphaGo 與李世乭的對弈,使得人工智慧在世人眼前大爆發,它不僅是屬於人工智慧領域與科技公司,同時也是屬於市井小民的里程碑。在美國如此,在韓國與中國更是如此,因為這些國家視圍棋為人類智慧結晶的巔峰。這場棋賽彰顯出科技的力量與其終將超越人類的恐懼,同時也帶來樂觀的前景,此一科技往往會以出人意表的方式推動人類更上層樓。儘管馬斯克等人警告其中的危險性,但是這段時期人工智慧的前景一片光明。

裘蒂.英賽恩(Jordi Ensign)是佛羅里達州一位四十五歲的程式設計師,她在讀完棋賽報導後出去在身上紋了兩幅刺青,她在右臂內側紋了 AlphaGo 的第三十七手——左臂紋了李世乭的第七十八手。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載

-----廣告,請繼續往下閱讀-----
所有討論 1
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。