0

0
0

文字

分享

0
0
0

「最快的超級電腦」大競賽

昱夫
・2014/06/27 ・772字 ・閱讀時間約 1 分鐘 ・SR值 554 ・八年級

天河二號

世界上最快的超級電腦在哪裡勒?

本月23日公佈的全球超級電腦500強榜單上,中國國防科技大學的「天河二號」第三度獲得冠軍殊榮,它擁有33.86個PFLOPS(petaflops, 表示每秒一千兆(=1015)次的浮點運算)計算能力,比起第二名−美國橡樹嶺國家實驗室的「泰坦」快了將近兩倍的速度。該排行榜是根據各家電腦運算LINPACK benchmark(計算大型系統的線性方程問題)的浮點運算能力來做排名 。

超級電腦的發展在各領域應用日益蓬勃,越來越多科學需要仰賴巨量資料分析與快速的計算能力,伴隨著科技發展與需求增加,當然會預期超級電腦的運算能力也是逐年上升的,要觀察這點,我們可以將排行榜上的500台超級電腦運算能力做加總,一共可以貢獻274個PFLOPS,比起去年的250 PFLOPS的確有所成長,不過從歷年的成長趨勢來看,目前成長的速率卻有趨緩的現象;儘管如此,Top 500仍預期在2020年之前,超級電腦的能力可以衝破EFLOPS的大關(PFLOPS的1000倍)。

目前,許多單位對於超級電腦的開發都十分重視:日本獨立行政法人理化學研究所(Riken)(目前Top 500上的第4名)預計在2020年之前發展出獨立的EFLOPS等級超級電腦;歐盟的Mont-Blanc集團則致力於利用智慧型手機的CPU來建構內低耗能高效率的EFLOPS等級超級電腦。

-----廣告,請繼續往下閱讀-----

一旦更高效能的超級電腦問世,眾多科學、科技研究者都將因此受惠。我們將能夠處理更龐大的數據資料,例如應用在電波望遠鏡上,就可以更有效儲存並處理觀測宇宙的資訊,同時更強的計算能力也有助於各種物理模型的建立,提高對地球氣候、人體結構(如大腦運作的模擬)等等的了解。

當然,次世代的超級電腦也會遇到許多無法回避的困難,像是過度的能源消耗和平行計算間的資料交換等等。即便如此,這場超級電腦的大競賽是不會停止的,不斷加速,不斷加速,跑到無法想像的明天。

 

資料來源:Beyond Tianhe-2 IEEE Spectrum [June 24, 2014]

文章難易度
昱夫
57 篇文章 ・ 2 位粉絲
PanSci實習編輯~目前就讀台大化學所,研究電子與質子傳遞機制。微~蚊氫,在宅宅的實驗室生活中偶爾打點桌球,有時會在走廊上唱歌,最愛929。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

1

38
1

文字

分享

1
38
1
回到 AlphaGo 打敗棋王的那一天,看 AI 如何顛覆世界——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/30 ・4915字 ・閱讀時間約 10 分鐘

谷歌收購深度心智(DeepMind)幾週後,深度心智創辦人德米斯.哈薩比斯(Demis Hassabis)與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。

幕後推手——德米斯.哈薩比斯

會議結束後,哈薩比斯和谷歌創辦人賽吉.布林(Sergey Brin)聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和賴利.佩吉(Larry Page)建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。

哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

深度心智創辦人、英國人工智慧研究者——德米斯.哈薩比斯(Demis Hassabis)。圖/維基百科

「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。

-----廣告,請繼續往下閱讀-----

他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓),辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

揭開比賽序幕

深度心智的研究員們在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。

IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國——更別提日本與中國——圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

圍棋在中、日、韓具民族性,AlphaGo 與李世乭的對弈備受矚目。圖/維基百科

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感,雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。

-----廣告,請繼續往下閱讀-----

第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。

「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。

他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋,自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的——其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局;AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

在四季飯店頂樓的賽前餐敘,谷歌董事長艾力克.施密特(Eric Schmidt)坐在哈薩比斯的對面,以他一貫冷峻的態度闡述深度學習的優點。一度有人稱他為工程師,他糾正他們,「我不是工程師,」他說道,「我是電腦科學家。」

-----廣告,請繼續往下閱讀-----
艾力克.施密特(Eric Schmidt)2001~2011 年間在 Google 擔任 CEO。圖/維基百科

他回憶他在 1970 年代研讀電腦科學時,人工智慧看來前景一片大好,但是隨著 1980 年代過去,進入 1990 年代,這樣的美景從未實現。如今,終於實現了。「這一科技,」他說道,「力量強大,引人入勝。」他表示,人工智慧不只是辨識照片的戲法,同時也代表谷歌 750 億美元的網際網路事業與其他無數的產業,包括保健產業。

機器與人類高手對決

在第一局,哈薩比斯是在私人觀賞室與走廊另一頭的 AlphaGo 控制室之間來回兩頭跑。控制室滿是個人電腦、筆記型電腦與平面顯示幕,這些設備全都與遠在太平洋彼端的谷歌數據中心內部數百台電腦相連。一支谷歌團隊在比賽前一週就已架設一條專屬的超高速光纖電纜直達控制室,以確保網際網路暢通無阻。

不過結果卻顯示控制室根本不需要進行多少操控:幾過多月的訓練之後,AlphaGo 已能完全獨力作業,不需要人為的幫助。同時,就算哈薩比斯與團隊想幫忙,也無用武之地。他們沒有一人的圍棋棋力達到大師級的水準,他們只能觀看棋局。

「我無法形容有多緊張,」深度心智研究員說道,「我們不知道該聽誰的。一邊是評論員的看法,你同時也看到 AlphaGo 的評估。所有的評論員都有不同的意見。」

-----廣告,請繼續往下閱讀-----

在第一天的棋賽,深度心智團隊與谷歌的重要人物都親眼目睹 AlphaGo 獲勝。

賽後記者會上,李世乭面對來自東、西方數百名記者與攝影師表示他感到震驚。這位 33 歲的棋士透過口譯員說道:「我沒想到 AlphaGo 下棋竟能夠如此完美。」經過逾四小時的對弈,AlphaGo 證明自己的棋力可與全球最厲害的高手匹敵,李世乭表示他被 AlphaGo 殺了個措手不及,他在第二局會改變策略。

左為代替 AlphaGo 移動棋子的深度心智台灣研究員黃士傑,右則為李世乭。圖/YouTube

神來一筆的第三十七手

第二局對弈進行一小時後,李世乭起身離開賽場,走到露台抽菸。坐在李世乭對面,代替 AlphaGo 移動棋子的是來自台灣的深度心智研究員黃士傑,他將一枚黑子落在棋盤右邊一大塊空地上單獨一枚白子的側邊下方,這是該局的第三十七手。

在角落的評論室內,西方唯一的圍棋最高段九段棋手邁克.雷蒙(Michael Redmond)忍不住多看了一眼確認,然後他告訴在線上觀看棋賽的兩百多萬英語觀眾:「我真的不知道這是高招還是爛招。」他的共同評論員克里斯.戈拉克(Chris Garlock)則表示:「我認為下錯了。」他是一本網路圍棋雜誌的資深編輯,同時也是美國圍棋協會的副會長。

-----廣告,請繼續往下閱讀-----

李世乭在幾分鐘後返回座椅,然後又緊盯著棋盤幾分鐘。他總共花了 15 分鐘才做出回應,在棋局的第一階段他有兩小時的時間,而這一手占用了他不少時間——而且此後他再也沒有找回節奏。在經過逾四小時的對弈後,他投子認輸,他連輸兩局了。

第三十七手也讓樊麾大感詫異,他在幾個月前遭到 AlphaGo 徹底擊敗,自此之後他就加入深度心智,在 AlphaGo 與李世乭對弈前擔任它的陪訓員。他從來沒有擊敗過這部人工智慧機器,但是他與 AlphaGo 的對弈也讓他對棋路的變化大開眼界。事實上,他在遭 AlphaGo 擊敗後的幾週內,與(人類)高手對弈連贏六場,他的世界排名也升至新高。

現在,他站在四季飯店七樓的評論室外面,在第三十七手落子幾分鐘後,他看出了此一怪招的威力。「這不是人類會下的棋路,我從來沒有看過有人這麼下,」他說道,「太美了。」他不斷地重複說道,太美了、太美了、太美了。

第二天上午,深度心智的研究員大衛.席瓦爾溜進控制室,他想知道 AlphaGo 如何做出第三十七手的選擇。AlphaGo 在每一局對弈中都會根據它所受過數千萬種人類落子變化的訓練,來計算人類做出此一選擇的機率,而在第三十七手,它算出的機率是萬分之一。

-----廣告,請繼續往下閱讀-----
AlphaGo 在對弈中會根據千萬種落子變化,計算出人類下此一步棋的機率。圖/YouTube

AlphaGo 知道這不是專業棋手會選擇的路數,然而它根據與自己對弈的數百萬次經驗——沒有人類參與的棋局——它仍是這麼做了;它已了解儘管人類不會選擇這一步,這一步棋仍是正確的選擇。「這是它自己發現的,」席瓦爾說道,「透過它的內省。」

這是一個既甜美又苦澀的時刻,儘管樊麾大讚此一步棋是神來之筆,但是一股鬱悶之情席捲四季飯店,甚至整個韓國。一位中國記者表示,儘管他為 AlphaGo 贏得第一局感到高興,可是現在他深感沮喪。

第二天,一位在首爾彼端經營一家新創企業育成中心的韓國人權五亨表示他也感到悲傷,這並非因為李世乭是一位韓國人,而是因為他是人類,「這是全人類的轉捩點,」權五亨說道,他的幾位同事點頭表示同意,「它讓我們了解人工智慧真的已在我們眼前——也讓我們了解到其中的危險。」

在那個週末,此一鬱悶的情緒只增不減。李世乭第三局也輸了,等於輸掉整個棋賽。坐在賽後記者會的桌子後面,李世乭懺悔之情溢於言表。「我不知道今天要說什麼,但是我首先要表達我的歉意,」他說道,「我應該拿出更好的成績,更好的結局,更好的比賽。」但是坐在李世乭身邊的哈薩比斯卻發現,自己衷心期盼這位韓國棋手在接下來的兩局中至少能贏一局。

-----廣告,請繼續往下閱讀-----

AlphaGo 認輸的那一局

在第四局的七十七手,李世乭再度陷入長考,就和第二局的情況一樣,但是這一回他考慮的時間更久。棋盤中間有一堆棋子,黑白相間,他有近二十分鐘只是緊盯著這些棋子,抓著後頸前後擺動。最後,他將他的白子落在棋盤中央的兩枚黑子之間,將棋勢一分為二,AlphaGo 方寸大亂。

在每一場對弈中,AlphaGo 都會不斷重新計算勝率,並且顯示在控制室的一台平面顯示幕上。

在李世乭落子後——第七十八手——這部機器的反擊很差,在顯示幕上的勝率立刻大降。「AlphaGo 累積到那一步之前的所有戰略都算是報銷了,」哈薩比斯說道,「它必須重新再來。」就在此刻,李世乭抬頭看著對面的黃士傑,彷彿他擊敗的是這人,不是機器。自此之後,AlphaGo 的勝率一路下跌,在近五個小時後,它投子認輸。

DeepMind 製作的 AlphaGo 與李世乭對弈紀綠片。/YouTube

兩天後,哈薩比斯穿過四季飯店的大廳,解釋 AlphaGo 為什麼會輸。AlphaGo 當時是假設沒有人類會這樣下第七十八手,它計算出來的機率是萬分之一——這是一個它熟悉的數字。

就像 AlphaGo 一樣,李世乭的棋力也達到一個新境界,他在棋賽最後一天的私人聚會場合中這樣告訴哈薩比斯。他說與機器對弈不僅讓他重燃對圍棋的熱情,同時也讓他茅塞頓開,使他有了新想法。「我已經進步了。」他告訴哈薩比斯,一如幾天前的樊麾,李世乭之後與人類高手對弈,連贏九場。

AlphaGo 與李世乭的對弈,使得人工智慧在世人眼前大爆發,它不僅是屬於人工智慧領域與科技公司,同時也是屬於市井小民的里程碑。在美國如此,在韓國與中國更是如此,因為這些國家視圍棋為人類智慧結晶的巔峰。這場棋賽彰顯出科技的力量與其終將超越人類的恐懼,同時也帶來樂觀的前景,此一科技往往會以出人意表的方式推動人類更上層樓。儘管馬斯克等人警告其中的危險性,但是這段時期人工智慧的前景一片光明。

裘蒂.英賽恩(Jordi Ensign)是佛羅里達州一位四十五歲的程式設計師,她在讀完棋賽報導後出去在身上紋了兩幅刺青,她在右臂內側紋了 AlphaGo 的第三十七手——左臂紋了李世乭的第七十八手。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載

所有討論 1
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

7
4

文字

分享

0
7
4
超級電腦爭霸戰的新一頁開始了:Exascale(10 的 18 次方)之戰
Y.-S. Lu
・2022/09/10 ・5230字 ・閱讀時間約 10 分鐘

2023 即將上線的超級電腦(Supercomputer)

歐洲最大的超級電腦(Supercomputer),將要在 2023 年上線啦!今年六月中時,德國于利希研究中心(Forschungszentrum Jülich GmbH)的超級計算中心(Jülich Supercomputing Centre, JSC)發佈新聞稿[1],表示歐盟的歐洲超級電腦中心聯合承辦組織(EuroHPC Joint Undertaking)選定該研究中心的超級計算中心,做為歐洲第一個設立 Exascale 超級電腦 Jupiter 的地點[2],歐盟出資一半,而另一半的資金將由德國教育部(BMBF)以及北萊茵威斯特法倫州(Nordrhein-Westfalen)文化部共同出資,其意昧著這台超級電腦也將優先提供給德國的科學家,以及北威州的研究單位使用[註一]。表示現今的超級電腦軍備競賽,已打到了 Exascale 了,Jupiter 將是繼美國設立世界第一台 Exascale[註二]的超級電腦 Frontier 後[3],即將出現的次世代超級電腦(如果德國的施工期有好好的踩點)

位於阿貢國家實驗室的 IBM Blue Gene/P 超級計算機。圖/wikipedia

Exascale 的超級電腦具有「每秒百億億次(1018)」(也就是 100 京)的每秒浮點運算(FLOP)能力,實際規模也將具有國家高速運算中心台灣杉二號[4]的 111 倍以上的運算能力,也就是要建立超過百台規模的台灣杉二號才具有 Exascale 的規模,但也同時考驗硬體的處理能力、主機間節點的連線架構、資料讀寫能力,更甚者,則是軟體是否具有 Exascale 的使用能力,也就是硬體與軟體都必須要能夠良好的契合才行。

什麼是超級電腦?可以幫助都市成為超級都市嗎?

「這些顯示器太舊了」雷迪亞茲說。

「但它們後面是世界最強大的電腦,每秒可以進行五百萬億次浮點運算。」

~ 劉欣慈《三體:黑暗森林》

劉欣慈《三體:黑暗森林》(2007)提到人類「當時」最強的電腦,為五百萬億的運算能力「而已」,沒想到 15 年後的今天,地表最強的超級電腦 Frontier 是出現在美國的橡樹嶺國家實驗室(Oak Ridge National Laboratory),而不是小說裡說的,在洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory),而且 Frontier 的效能還是小說裡超級電腦的五千多倍,可說是現實終於有超過小說的時候了(但我們依就沒有飛天滑板可以借東京都的死神小學生)

超級電腦是科學家進行高速/高效計算(High Performance Computing)的主要設備。超級電腦的架構,可以說是非常的簡單:用網路線連結各台主機,讓主機間互相溝通,才能夠進行平行運算。

-----廣告,請繼續往下閱讀-----

一般超級電腦的架構大致上如下:一機板上可能會有一個到數個 CPU,而一個或是數個機板會組成一個節點(Node),有時數個結點會組成一個機櫃(Rack/Cabinet)。節點與節點間的連結,就是依靠網路線在進行 CPU 之間的溝通,因此網路變成非常重要的元件。

節點與節點間的連結,就是依靠網路線在進行 CPU 之間的溝通,因此網路變成非常重要的元件。圖/pixabay

在此架構下,如何讓結點間有效溝通,也是一門學問了[5]。這些 CPU 可以想象是每個拿著工程計算機的研究生,正等著教授指派任務給他們算,而一個節點就是一個房間,在同一個房間內的溝通一定是比較快的,當不同房間需要溝通時,就會需要走出房間去給資料,如果所有的人一起拿資料回報給教授,那這教授可能就會崩潰,所以如何讓研究生(CPU)互相溝通,又不至於塞車,就是電腦工程專家們的專業了。

現在超級電腦的架構也與過往的超級電腦不同了。除了採用巨量 Arm 晶片的日本富岳(具 158,976 節點)、自主研發晶片的中國神威太湖之光(具 40,960 節點)外,前十大超級電腦[3]都是採用 CPU 加上 GPU 的混合架構(如在機板上插上 GPU 增加運算效率),才達到 100 Peta-Flop(1Peta = 1015) 以上的計算量,也意味著未來要在超級電腦上進行高效計算,GPU 運算也成為很重要的應用,因此也有許多計畫正在將軟體朝 GPU 運算的方向前進與推動。

軟體是否能配合平行化,也是非常是否能進行高效運算的重點之一。所謂的高效計算,也是利用許許多多的運算元件(CPU 或是 GPU),採平行運算的方法,將一個問題切成許多碎片,以螞蟻雄兵的方法一一解決,所以不要再怪為什麼你家的電腦 CPU 無論幾核心都只用了一核心,那是因為你的軟體沒有進行平行處理。早期土木界在進行坡面的圓弧破壞面計算時,據說就是用人力一人算一片圓弧的切片,也算是(人力)平行運算的先驅之一了。一般電腦中使用平行運算最多的,應該就是你手上那張 GPU 顯卡,在 GPU 的加持下,電腦螢幕中每個點、每個邊、每個平面上的顏色與光影,才能完美的呈現在使用者的眼前,所以與其用顯卡挖礦,還不如投身虛幻而真實的遊戲世界

-----廣告,請繼續往下閱讀-----

不過有了地表最強的超級電腦,並不代表我們今天就能夠像小說形容的一樣,能幾秒內預測核子彈的破壞能力,或是在一天內算出地球百年後的氣候狀況,因為平行計算加快了計算的速度,但有其極限。

有了地表最強的超級電腦,並不代表我們能夠像小說一樣,在一天內算出地球百年後的氣候狀況,因為平行計算加快了計算的速度,但有其極限。圖/pixabay

資料的讀入或是寫出,也是瓶頸之一,電路板與網路速度,以及資料存取方式都會造成資料讀寫的延遲,更不用說,若是打算模擬地球,其將耗盡 80 exabyte 等級的儲存空間,其為 CERN 的 ATLAS 與 CMS 計畫所產生的資料量的十倍[6]

為什麼氣候模擬要用到 Exascale?

Exascale 的超級電腦除了可以提供更多的運算能力,給更多的使用者進行模擬與計算外,也是挑戰超大型計算的開始。不過為什麼要 Exascale?到底為什麼一個模擬要用到上千甚至是上萬顆的 CPU 在運算?氣象氣候模擬已經將 Exascale 喻為下一階段應使用的救星[7],在氣象上除了要能做到一小時內達成氣象預測外,也希望能夠進行叢集式運算(像是利用隨機方法產生上百個因亂度而有不同結果的預測),進而進行機率式預測分析,或是提高水平距離至 2.5 公里以下的網格精度,此精度也為可進行對流模擬 (Convection-Permit)[8] 的精度。氣候模擬也需要高效能的運算,除了高精度的全球模型外,也需要進行長程的氣候模擬,幾十年到幾百萬年的模擬時間,也將需要 Exascale 等級的超級電腦來加速模擬,縮短實驗時間。越多的計算核心以及有效的平行運算,才能讓最真實的模擬結果讓人類使用,畢竟,誰都希望出遊不要遇上下大雨,也會希望能夠提前幾天知道颱風的路徑。

地球系統模擬中,其中一個挑戰便是進行模擬時程:挑戰一日(24 小時)的超級電腦計算可以得到多少年的模擬結果(simulated years per wall-clock day, SYPD)[6]還真的是「度日如年」,而此地球系統的精度為水平方向僅一公里的超高解析度,用來進行最終極的地球系統模擬:數位攣生(Digital Twins)[9]。數位攣生計畫主要是要建立地球的複製體,以方便人們對地球進行各種「實驗」,了解到經濟或政策面對地球生態或是氣候的影響,因此要達成此目的,強大具 Exascale 能力的電腦,便成為了目標。

目前已經有部份超級電腦都在進行 SYPD 的挑戰,如中國的神威太湖之光,其已完成了每日 3.4 年的地球系統模擬[10],只不過其地面僅有 25 公里的水平精度,海面僅 10 公里的水平精度,還有非常多的進步空間。只可惜,這個實驗並沒有進行進行資料輸出,無法得到正確的效能結果(資料的寫入與輸出也是非常費時的),以及真正的運算結果:因為沒有資料,就沒有辦法分析。

從高速電腦看量子電腦:量子電腦會是傳統的救星嗎?

量子電腦目前也成為了熱門名詞,從 2019 年開始,IBM 與 MIT 共同開始了量子計算課程,各學術單位也在搶攻量子電腦領域,但對地球模擬領域而言,量子電腦還太遙遠,對「傳統物理」的地球科學來說,我們解偏微分、解多項式,用的是傳統的數值方法,跟量子電腦界在進行的運算,也差了十萬八千里。

-----廣告,請繼續往下閱讀-----

編按:這邊所說的數值方法,簡單講就是「暴力解」。例如要求圓周率,就先設定一個半徑為 1 的圓面積公式,然後問電腦答案是多少,電腦的第一步會把所有正整數代入公式中從一個初始數字(Initial State)開始,先找到答案會在 3 到 4 之間,之後又把 3 到 4 之間的所有數,帶回一開始的公式,得知答案在 3.1 到 3.2 之間,之後又將這個區間的所有數帶回一開始的公式,如此重複很多次後,就會得到相對接近的正確答案。

量子電腦就比較詭異了,量子態的平行運算與邏輯閘,使得兩者的運算邏輯完全不同,以上面的圓周率問題為例,量子電腦會直接給出在 3.1415925 至 3.1415927 之間,存在正確答案的可能性是最高的,但是這個範圍也有可能是錯的,而且就算是錯的,以我們現在的能力也很難說明它錯在哪裡。

從表面上來看,傳統電腦用暴力解,以排除錯誤答案的方式逼近正確答案,而量子電腦不排除錯誤答案,直接找到最有可能的答案會在哪個區域,但不保證運算過程中的正確性。

因為這個區別,若將現在成熟的模擬方法直接導入量子電腦中,最有可能出現的就是不知道怎麼解讀得到的數據,這包含了答案的正確程度,以及改動特定變數後所產生的答案變動是從何而來?

IBM 與 GOOGLE 正在爭奪追逐量子霸權(Quantum Supremacy)的同時[11],(不過 Google 號稱的量子霸權,也就是一萬倍的計算速度,在 2021 年被中國科學院理論物理所的 Feng 等人用了 15 個 NVIDIA V100 GPU 給追上[12][註五]),其離傳統電腦計算的距離,也有十萬八千里遠,離應用於地球科學計算上還有一定的距離,但只要哪一天能夠應用在普通的大氣循環模式(GCM),就可以算是第一步吧。但是在量子力學進入大氣科學前,我們氣候與氣象模擬還是只能使用傳統的電腦主機,靠著 2 位元的方法進行大氣模擬,所以目前傳統超級電腦還沒有被取代的機會。

結語:超大主機與超大計算

依摩爾定律,每十八個月,CPU 晶片的製成就會進步一倍,同時,超級電腦中心卻是一直受益於摩爾定律帶來的好處,也就是 CPU 的能力越來越強,而價格也越來越親民,也讓氣候氣象模擬的空間精度也隨之升高。

Neumann 等人也預計在 2030 年代後,進行 1 公里等級的超高精度計算也將不是夢想[7],而在 Exascale 主機降臨前的這個年代,有些超級計算中心已經以節點(Node)做為計算資源耗費的單位(Node per hour),而非 CPU per hour,顯示出大型主機對計算資源消耗的想法以從 CPU 規模上升到了 Node 規模。

一方面使用者受益於更多的 CPU 資源,但同時這些主機也要求更新更大量的計算能力,如瑞士的 Piz Daint 與瑞典的 LUMI,皆要求使用者的計算必須是含有 GPU 運算能力,而純粹靠 CPU 運算的軟體,將無法享受到同等的巨量資源。

-----廣告,請繼續往下閱讀-----
IBM為橡樹嶺國家實驗室開發的Summit超級計算機(或 OLCF-4)。圖/flickr

而相應的挑戰也隨之而生,除了硬體將進入 Exascale 的時代,軟體也將一同進入這場大戰,才能享受同等的資源。另外一個挑戰則是綠色挑戰,1 公里精度的氣象模擬,每一模擬年將耗盡 191.7 百萬瓦時[6],相當於台灣一個家庭可以用上 43 年的電量[註三],也可以讓特斯拉的 Model 3LR 從地球開到月球來回開 1.5 次[註四],其耗能之巨,也是我們計算或是模擬界科學家應該要注意到的問題,也是為何除了 HPC Top500 外,亦有 Green 500[13]的原因吧,而具有超高效能的 Frontier,也同時奪下了 Green 500 之冠,也算是 Exascale 的好處吧。

註解與文獻

  • [註一] 若需使用 JSC 的超級電腦,必須透過不同的計畫項目進行申請,其計畫主持人(PI)為歐洲或是德國的研究者[14]
  • [註二] 日本的富岳其實也可以進行到 Exscale 的運算,只是要超頻而已,想當然爾是非常規設定。
  • [註三] 根據台電 2021 年新聞稿中,家庭離峰平均用電為 339 度以及 6-9 月為 434 度推估。
  • [註四] 根據 Tesla M3 LR 為 25kWh per 100 Miles,月球至地球為 384400 公里推估
  • [註五] Feng 也公開了他的程式碼
  • [1] Forschungszentrum Jülich 新聞稿
  • [2] EUROPE HPC 新聞稿
  • [3] 2022 年六月 HPC Top 500 名單
  • [4] 國家高速網路中心台灣杉二號介紹
  • [5] 司徒加特超級電腦中心:HAWK 主機之連線架構
  • [6] T. C. Schulthess, P. Bauer, N. Wedi, O. Fuhrer, T. Hoefler and C. Schär, “Reflecting on the Goal and Baseline for Exascale Computing: A Roadmap Based on Weather and Climate Simulations,” in Computing in Science & Engineering, vol. 21, no. 1, pp. 30-41, 1 Jan.-Feb. 2019, doi: 10.1109/MCSE.2018.2888788.
  • [7] Neumann P et al. 2019, Assessing the scales in numerical weather and climate predictions: will exascale be the rescue?. Phil. Trans. R. Soc. A 377: 20180148. http://dx.doi.org/10.1098/rsta.2018.0148
  • [8] Kendon, E. J., Ban, N., Roberts, N. M., Fowler, H. J., Roberts, M. J., Chan, S. C., Evans, J. P., Fosser, G., & Wilkinson, J. M. (2017). Do Convection-Permitting Regional Climate Models Improve Projections of Future Precipitation Change?, Bulletin of the American Meteorological Society, 98(1), 79-93
  • [9] Bauer, P., Dueben, P.D., Hoefler, T. et al. The digital revolution of Earth-system science. Nat Comput Sci 1, 104–113 (2021). https://doi.org/10.1038/s43588-021-00023-0
  • [10] Zhang, S., Fu, H., Wu, L., Li, Y., Wang, H., Zeng, Y., Duan, X., Wan, W., Wang, L., Zhuang, Y., Meng, H., Xu, K., Xu, P., Gan, L., Liu, Z., Wu, S., Chen, Y., Yu, H., Shi, S., Wang, L., Xu, S., Xue, W., Liu, W., Guo, Q., Zhang, J., Zhu, G., Tu, Y., Edwards, J., Baker, A., Yong, J., Yuan, M., Yu, Y., Zhang, Q., Liu, Z., Li, M., Jia, D., Yang, G., Wei, Z., Pan, J., Chang, P., Danabasoglu, G., Yeager, S., Rosenbloom, N., and Guo, Y.: Optimizing high-resolution Community Earth System Model on a heterogeneous many-core supercomputing platform, Geosci. Model Dev., 13, 4809–4829, https://doi.org/10.5194/gmd-13-4809-2020, 2020. https://gmd.copernicus.org/articles/13/4809/2020/
  • [11] 「嗨量子世界!」~ Nature Newsletter
  • [12] Feng Pan, Keyang Chen, and Pan Zhang, Solving the sampling problem of the Sycamore quantum circuits, accepted by Phys. Rev. Lett.
  • [13] 2022 年六月 HPC Green 500 名單
  • [14] JSC 系統申請辦法

Y.-S. Lu
4 篇文章 ・ 6 位粉絲
自從來到學界後,便展開了一段從土木人到氣象人的水文之旅。主要專業是地球系統數值模擬,地下水與地表模式的耦合系統,以及大氣氣象模擬。目前是于利希研究中心(Forschungszentrum Jülich GmbH)超級電腦中心的博士後研究員。