0

0
0

文字

分享

0
0
0

DARPA 研發新一代超級電腦,預期2018年開始運作。

科景_96
・2011/02/10 ・606字 ・閱讀時間約 1 分鐘 ・SR值 573 ・九年級
相關標籤: 超級電腦 (15)

Original publish date:Aug 15, 2010

編輯 HCC 報導

美國國防先進研究計劃局(DARPA)計劃發展每秒鐘可以執行10的18次方運算速度的超級電腦,DARPA於八月初宣佈將啟動普及高性能運算(Ubiquitous High Performance Computing, UHPC)計畫,以設計創新、革命性的新一代超級電腦系統,期能超越目前的電腦晶片進化設計途徑限制。

依據全球500大超級電腦排行(詳見BBC News, In graphics: Supercomputing superpowers),目前全世界運算速度最快的超級電腦為美國OAK Ridge National Laboratory的Cray XT(Jaguar)超級電腦,運算速度為1.795 peta FLOPS(peta Flop, 每秒10的15次方浮點運算速度);次為中國深圳「國家超級計算中心」的「星雲」,運算速度為1.271 peta Flops;第三名為美國DOE/NNSA/LANL 的超級電腦,運算速度為1.042 peta Flops;第四名位在美國田納西大學,運算速度為831.7 tera FLOPS(tara Flop, 每秒10的12次方浮點運算速度), 第一名與第四名的運算速度差距達2倍多。

-----廣告,請繼續往下閱讀-----

DARPA計畫的exascale computers,預期計算速度為每秒quintillion次運算(1000 peta Flops),約為Jaguar超級電腦運算速度的五百倍以上。與現有超級電腦運算速度相較,新一代超級電腦必須超越摩爾定律的限制,設計的晶片必須以更少的功率進行運算。

參予研發DARPA UHPC 原型系統的廠商包括Intel Corp., NVIDIA Corp. , MIT Computer Science and Artificial Intelligence Laboratory, Sandia National Laboratories。

NVIDIA很快的公佈其研發夥伴,包含Cray、Oak Ridge National Labs 以及六所頂尖美國大學。Sandia的夥伴則包含Micron Technology Inc. 與LexisNexis Special Services Inc.,合作學校方面有 Louisiana State University, University of Illinois at Urbana-Champaign, University of Notre Dame與University of Southern California。

Georgia Institute of Technology 則被要求建立上述研發結果的應用與效能基準指標評估團隊。

-----廣告,請繼續往下閱讀-----

參考來源:

相關連結:

文章難易度
科景_96
426 篇文章 ・ 7 位粉絲
Sciscape成立於1999年4月,為一非營利的專業科學新聞網站。

0

0
0

文字

分享

0
0
0
Intel® Core™ Ultra AI 處理器:下一代晶片的革命性進展
鳥苷三磷酸 (PanSci Promo)_96
・2024/05/21 ・2364字 ・閱讀時間約 4 分鐘

本文由 Intel 委託,泛科學企劃執行。 

在當今快節奏的數位時代,對於處理器性能的需求已經不再僅僅停留在日常應用上。從遊戲到學術,從設計到內容創作,各行各業都需要更快速、更高效的運算能力,而人工智慧(AI)的蓬勃發展更是推動了這一需求的急劇增長。在這樣的背景下,Intel 推出了一款極具潛力的處理器—— Intel® Core™ Ultra,該處理器不僅滿足了對於高性能的追求,更為使用者提供了運行 AI 模型的全新體驗。

先進製程:效能飛躍提升

現在的晶片已不是單純的 CPU 或是 GPU,而是混合在一起。為了延續摩爾定律,也就是讓相同面積的晶片每過 18 個月,效能就提升一倍的目標,整個半導體產業正朝兩個不同方向努力。

其中之一是追求更先進的技術,發展出更小奈米的製程節點,做出體積更小的電晶體。常見的方法包含:引進極紫外光 ( EUV ) 曝光機,來刻出更小的電晶體。又或是從材料結構下手,發展不同構造的電晶體,例如鰭式場效電晶體 ( FinFET )、環繞式閘極 ( GAAFET ) 電晶體及互補式場效電晶體 ( CFET ),讓電晶體可以更小、更快。這種持續挑戰物理極限的方式稱為深度摩爾定律——More Moore。

-----廣告,請繼續往下閱讀-----

另一種則是將含有數億個電晶體的密集晶片重新排列。就像人口密集的都會區都逐漸轉向「垂直城市」的發展模式。對晶片來說,雖然每個電晶體的大小還是一樣大,但是重新排列以後,不僅單位面積上可以堆疊更多的半導體電路,還能縮短這些區塊間資訊傳遞的時間,提升晶片的效能。這種透過晶片設計提高效能的方法,則稱為超越摩爾定律——More than Moore。

而 Intel® Core™ Ultra 處理器便是具備兩者優點的結晶。

圖/PanSci

Tile 架構:釋放多核心潛能

在超越摩爾定律方面,Intel® Core™ Ultra 處理器以其獨特的 Tile 架構而聞名,將 CPU、GPU、以及 AI 加速器(NPU)等不同單元分開,使得這些單元可以根據需求靈活啟用、停用,從而提高了能源效率。這一設計使得處理器可以更好地應對多任務處理,從日常應用到專業任務,都能夠以更高效的方式運行。

CPU Tile 採用了 Intel 最新的 4 奈米製程和 EUV 曝光技術,將鰭式電晶體 FinFET 中的像是魚鰭般阻擋漏電流的鰭片構造減少至三片,降低延遲與功耗,使效能提升了 20%,讓使用者可以更加流暢地執行各種應用程序,提高工作效率。

-----廣告,請繼續往下閱讀-----
鰭式電晶體 FinFET。圖/Intel

Foveros 3D 封裝技術:高效數據傳輸

2017 年,Intel 開發出了新的封裝技術 EMIB 嵌入式多晶片互聯橋,這種封裝技術在各個 Tile 的裸晶之間,搭建了一座「矽橋 ( Silicon Bridge ) 」,達成晶片的橫向連接。

圖/Intel

而 Foveros 3D 封裝技術是基於 EMIB 更進一步改良的封裝技術,它能將處理器、記憶體、IO 單元上下堆疊,垂直方向利用導線串聯,橫向則使用 EMIB 連接,提供高頻寬低延遲的數據傳輸。這種創新的封裝技術不僅使得處理器的整體尺寸更小,更提高了散熱效能,使得處理器可以長期高效運行。

運行 AI 模型的專用筆電——MSI Stealth 16 AI Studio

除了傳統的 CPU 和 GPU 之外,Intel® Core™ Ultra 處理器還整合了多種專用單元,專門用於在本機端高效運行 AI 模型。這使得使用者可以在不連接雲端的情況下,依然可以快速準確地運行各種複雜的 AI 算法,保護了數據隱私,同時節省了連接雲端算力的成本。

MSI 最新推出的筆電 Stealth 16 AI Studio ,搭載了最新的 Intel Core™ Ultra 9 處理器,是一款極具魅力的產品。不僅適合遊戲娛樂,其外觀設計結合了落質感外型與卓越效能,使得使用者在使用時能感受到高品質的工藝。鎂鋁合金質感的沉穩機身設計,僅重 1.99kg,厚度僅有 19.95mm,輕薄便攜,適合需要每天通勤的上班族,與在咖啡廳尋找靈感的創作者。

-----廣告,請繼續往下閱讀-----

除了外觀設計之外, Stealth 16 AI Studio 也擁有出色的散熱性能。搭載了 Cooler Boost 5 強效散熱技術,能夠有效排除廢熱,保持長時間穩定高效能表現。良好的散熱表現不僅能夠確保處理器的效能得到充分發揮,還能幫助使用者在長時間使用下的保持舒適性和穩定性。

Stealth 16 AI Studio 的 Intel Core™ Ultra 處理器,其性能更是一大亮點。除了傳統的 CPU 和 GPU 之外,Intel Core™ Ultra 處理器還整合了多種專用單元,專門針對在本機端高效運行 AI 模型的需求。內建專為加速AI應用而設計的 NPU,更提供強大的效能表現,有助於提升效率並保持長時間的續航力。讓使用者可以在不連接雲端的情況下,依然可以快速準確地運行各種複雜的 AI 算法,保護了數據隱私,同時也節省了連接雲端算力的成本。

軟體方面,Intel 與眾多軟體開發商合作,針對 Intel 架構做了特別最佳化。與 Adobe 等軟體的合作使得使用者在處理影像、圖像等多媒體內容時,能夠以更高效的方式運行 AI 算法,大幅提高創作效率。獨家微星AI 智慧引擎能針對使用情境並自動調整硬體設定,以實現最佳效能表現。再加上獨家 AI Artist,更進一步提升使用者體驗,直接輕鬆生成豐富圖像,實現了更便捷的內容創作。

此外 Intel 也與眾多軟體開發商合作,針對 Intel 架構做了特別最佳化,讓 Intel® Core™ Ultra處理器將AI加速能力充分發揮。例如,與 Adobe 等軟體使得使用者可以在處理影像、圖像等多媒體內容時,能夠以更高效的方式運行 AI 算法,大幅提高創作效率。為各行專業人士提供了更加多元、便捷的工具,成為工作中的一大助力。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
199 篇文章 ・ 305 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

38
1

文字

分享

1
38
1
回到 AlphaGo 打敗棋王的那一天,看 AI 如何顛覆世界——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/30 ・4915字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

谷歌收購深度心智(DeepMind)幾週後,深度心智創辦人德米斯.哈薩比斯(Demis Hassabis)與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。

幕後推手——德米斯.哈薩比斯

會議結束後,哈薩比斯和谷歌創辦人賽吉.布林(Sergey Brin)聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和賴利.佩吉(Larry Page)建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。

哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

深度心智創辦人、英國人工智慧研究者——德米斯.哈薩比斯(Demis Hassabis)。圖/維基百科

「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。

-----廣告,請繼續往下閱讀-----

他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓),辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

揭開比賽序幕

深度心智的研究員們在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。

IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國——更別提日本與中國——圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

圍棋在中、日、韓具民族性,AlphaGo 與李世乭的對弈備受矚目。圖/維基百科

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感,雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。

-----廣告,請繼續往下閱讀-----

第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。

「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。

他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋,自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的——其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局;AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

在四季飯店頂樓的賽前餐敘,谷歌董事長艾力克.施密特(Eric Schmidt)坐在哈薩比斯的對面,以他一貫冷峻的態度闡述深度學習的優點。一度有人稱他為工程師,他糾正他們,「我不是工程師,」他說道,「我是電腦科學家。」

-----廣告,請繼續往下閱讀-----
艾力克.施密特(Eric Schmidt)2001~2011 年間在 Google 擔任 CEO。圖/維基百科

他回憶他在 1970 年代研讀電腦科學時,人工智慧看來前景一片大好,但是隨著 1980 年代過去,進入 1990 年代,這樣的美景從未實現。如今,終於實現了。「這一科技,」他說道,「力量強大,引人入勝。」他表示,人工智慧不只是辨識照片的戲法,同時也代表谷歌 750 億美元的網際網路事業與其他無數的產業,包括保健產業。

機器與人類高手對決

在第一局,哈薩比斯是在私人觀賞室與走廊另一頭的 AlphaGo 控制室之間來回兩頭跑。控制室滿是個人電腦、筆記型電腦與平面顯示幕,這些設備全都與遠在太平洋彼端的谷歌數據中心內部數百台電腦相連。一支谷歌團隊在比賽前一週就已架設一條專屬的超高速光纖電纜直達控制室,以確保網際網路暢通無阻。

不過結果卻顯示控制室根本不需要進行多少操控:幾過多月的訓練之後,AlphaGo 已能完全獨力作業,不需要人為的幫助。同時,就算哈薩比斯與團隊想幫忙,也無用武之地。他們沒有一人的圍棋棋力達到大師級的水準,他們只能觀看棋局。

「我無法形容有多緊張,」深度心智研究員說道,「我們不知道該聽誰的。一邊是評論員的看法,你同時也看到 AlphaGo 的評估。所有的評論員都有不同的意見。」

-----廣告,請繼續往下閱讀-----

在第一天的棋賽,深度心智團隊與谷歌的重要人物都親眼目睹 AlphaGo 獲勝。

賽後記者會上,李世乭面對來自東、西方數百名記者與攝影師表示他感到震驚。這位 33 歲的棋士透過口譯員說道:「我沒想到 AlphaGo 下棋竟能夠如此完美。」經過逾四小時的對弈,AlphaGo 證明自己的棋力可與全球最厲害的高手匹敵,李世乭表示他被 AlphaGo 殺了個措手不及,他在第二局會改變策略。

左為代替 AlphaGo 移動棋子的深度心智台灣研究員黃士傑,右則為李世乭。圖/YouTube

神來一筆的第三十七手

第二局對弈進行一小時後,李世乭起身離開賽場,走到露台抽菸。坐在李世乭對面,代替 AlphaGo 移動棋子的是來自台灣的深度心智研究員黃士傑,他將一枚黑子落在棋盤右邊一大塊空地上單獨一枚白子的側邊下方,這是該局的第三十七手。

在角落的評論室內,西方唯一的圍棋最高段九段棋手邁克.雷蒙(Michael Redmond)忍不住多看了一眼確認,然後他告訴在線上觀看棋賽的兩百多萬英語觀眾:「我真的不知道這是高招還是爛招。」他的共同評論員克里斯.戈拉克(Chris Garlock)則表示:「我認為下錯了。」他是一本網路圍棋雜誌的資深編輯,同時也是美國圍棋協會的副會長。

-----廣告,請繼續往下閱讀-----

李世乭在幾分鐘後返回座椅,然後又緊盯著棋盤幾分鐘。他總共花了 15 分鐘才做出回應,在棋局的第一階段他有兩小時的時間,而這一手占用了他不少時間——而且此後他再也沒有找回節奏。在經過逾四小時的對弈後,他投子認輸,他連輸兩局了。

第三十七手也讓樊麾大感詫異,他在幾個月前遭到 AlphaGo 徹底擊敗,自此之後他就加入深度心智,在 AlphaGo 與李世乭對弈前擔任它的陪訓員。他從來沒有擊敗過這部人工智慧機器,但是他與 AlphaGo 的對弈也讓他對棋路的變化大開眼界。事實上,他在遭 AlphaGo 擊敗後的幾週內,與(人類)高手對弈連贏六場,他的世界排名也升至新高。

現在,他站在四季飯店七樓的評論室外面,在第三十七手落子幾分鐘後,他看出了此一怪招的威力。「這不是人類會下的棋路,我從來沒有看過有人這麼下,」他說道,「太美了。」他不斷地重複說道,太美了、太美了、太美了。

第二天上午,深度心智的研究員大衛.席瓦爾溜進控制室,他想知道 AlphaGo 如何做出第三十七手的選擇。AlphaGo 在每一局對弈中都會根據它所受過數千萬種人類落子變化的訓練,來計算人類做出此一選擇的機率,而在第三十七手,它算出的機率是萬分之一。

-----廣告,請繼續往下閱讀-----
AlphaGo 在對弈中會根據千萬種落子變化,計算出人類下此一步棋的機率。圖/YouTube

AlphaGo 知道這不是專業棋手會選擇的路數,然而它根據與自己對弈的數百萬次經驗——沒有人類參與的棋局——它仍是這麼做了;它已了解儘管人類不會選擇這一步,這一步棋仍是正確的選擇。「這是它自己發現的,」席瓦爾說道,「透過它的內省。」

這是一個既甜美又苦澀的時刻,儘管樊麾大讚此一步棋是神來之筆,但是一股鬱悶之情席捲四季飯店,甚至整個韓國。一位中國記者表示,儘管他為 AlphaGo 贏得第一局感到高興,可是現在他深感沮喪。

第二天,一位在首爾彼端經營一家新創企業育成中心的韓國人權五亨表示他也感到悲傷,這並非因為李世乭是一位韓國人,而是因為他是人類,「這是全人類的轉捩點,」權五亨說道,他的幾位同事點頭表示同意,「它讓我們了解人工智慧真的已在我們眼前——也讓我們了解到其中的危險。」

在那個週末,此一鬱悶的情緒只增不減。李世乭第三局也輸了,等於輸掉整個棋賽。坐在賽後記者會的桌子後面,李世乭懺悔之情溢於言表。「我不知道今天要說什麼,但是我首先要表達我的歉意,」他說道,「我應該拿出更好的成績,更好的結局,更好的比賽。」但是坐在李世乭身邊的哈薩比斯卻發現,自己衷心期盼這位韓國棋手在接下來的兩局中至少能贏一局。

-----廣告,請繼續往下閱讀-----

AlphaGo 認輸的那一局

在第四局的七十七手,李世乭再度陷入長考,就和第二局的情況一樣,但是這一回他考慮的時間更久。棋盤中間有一堆棋子,黑白相間,他有近二十分鐘只是緊盯著這些棋子,抓著後頸前後擺動。最後,他將他的白子落在棋盤中央的兩枚黑子之間,將棋勢一分為二,AlphaGo 方寸大亂。

在每一場對弈中,AlphaGo 都會不斷重新計算勝率,並且顯示在控制室的一台平面顯示幕上。

在李世乭落子後——第七十八手——這部機器的反擊很差,在顯示幕上的勝率立刻大降。「AlphaGo 累積到那一步之前的所有戰略都算是報銷了,」哈薩比斯說道,「它必須重新再來。」就在此刻,李世乭抬頭看著對面的黃士傑,彷彿他擊敗的是這人,不是機器。自此之後,AlphaGo 的勝率一路下跌,在近五個小時後,它投子認輸。

DeepMind 製作的 AlphaGo 與李世乭對弈紀綠片。/YouTube

兩天後,哈薩比斯穿過四季飯店的大廳,解釋 AlphaGo 為什麼會輸。AlphaGo 當時是假設沒有人類會這樣下第七十八手,它計算出來的機率是萬分之一——這是一個它熟悉的數字。

就像 AlphaGo 一樣,李世乭的棋力也達到一個新境界,他在棋賽最後一天的私人聚會場合中這樣告訴哈薩比斯。他說與機器對弈不僅讓他重燃對圍棋的熱情,同時也讓他茅塞頓開,使他有了新想法。「我已經進步了。」他告訴哈薩比斯,一如幾天前的樊麾,李世乭之後與人類高手對弈,連贏九場。

AlphaGo 與李世乭的對弈,使得人工智慧在世人眼前大爆發,它不僅是屬於人工智慧領域與科技公司,同時也是屬於市井小民的里程碑。在美國如此,在韓國與中國更是如此,因為這些國家視圍棋為人類智慧結晶的巔峰。這場棋賽彰顯出科技的力量與其終將超越人類的恐懼,同時也帶來樂觀的前景,此一科技往往會以出人意表的方式推動人類更上層樓。儘管馬斯克等人警告其中的危險性,但是這段時期人工智慧的前景一片光明。

裘蒂.英賽恩(Jordi Ensign)是佛羅里達州一位四十五歲的程式設計師,她在讀完棋賽報導後出去在身上紋了兩幅刺青,她在右臂內側紋了 AlphaGo 的第三十七手——左臂紋了李世乭的第七十八手。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載

所有討論 1
時報出版_96
174 篇文章 ・ 34 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

7
4

文字

分享

0
7
4
超級電腦爭霸戰的新一頁開始了:Exascale(10 的 18 次方)之戰
Y.-S. Lu
・2022/09/10 ・5230字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

2023 即將上線的超級電腦(Supercomputer)

歐洲最大的超級電腦(Supercomputer),將要在 2023 年上線啦!今年六月中時,德國于利希研究中心(Forschungszentrum Jülich GmbH)的超級計算中心(Jülich Supercomputing Centre, JSC)發佈新聞稿[1],表示歐盟的歐洲超級電腦中心聯合承辦組織(EuroHPC Joint Undertaking)選定該研究中心的超級計算中心,做為歐洲第一個設立 Exascale 超級電腦 Jupiter 的地點[2],歐盟出資一半,而另一半的資金將由德國教育部(BMBF)以及北萊茵威斯特法倫州(Nordrhein-Westfalen)文化部共同出資,其意昧著這台超級電腦也將優先提供給德國的科學家,以及北威州的研究單位使用[註一]。表示現今的超級電腦軍備競賽,已打到了 Exascale 了,Jupiter 將是繼美國設立世界第一台 Exascale[註二]的超級電腦 Frontier 後[3],即將出現的次世代超級電腦(如果德國的施工期有好好的踩點)

位於阿貢國家實驗室的 IBM Blue Gene/P 超級計算機。圖/wikipedia

Exascale 的超級電腦具有「每秒百億億次(1018)」(也就是 100 京)的每秒浮點運算(FLOP)能力,實際規模也將具有國家高速運算中心台灣杉二號[4]的 111 倍以上的運算能力,也就是要建立超過百台規模的台灣杉二號才具有 Exascale 的規模,但也同時考驗硬體的處理能力、主機間節點的連線架構、資料讀寫能力,更甚者,則是軟體是否具有 Exascale 的使用能力,也就是硬體與軟體都必須要能夠良好的契合才行。

什麼是超級電腦?可以幫助都市成為超級都市嗎?

「這些顯示器太舊了」雷迪亞茲說。

「但它們後面是世界最強大的電腦,每秒可以進行五百萬億次浮點運算。」

~ 劉欣慈《三體:黑暗森林》

劉欣慈《三體:黑暗森林》(2007)提到人類「當時」最強的電腦,為五百萬億的運算能力「而已」,沒想到 15 年後的今天,地表最強的超級電腦 Frontier 是出現在美國的橡樹嶺國家實驗室(Oak Ridge National Laboratory),而不是小說裡說的,在洛斯阿拉莫斯國家實驗室(Los Alamos National Laboratory),而且 Frontier 的效能還是小說裡超級電腦的五千多倍,可說是現實終於有超過小說的時候了(但我們依就沒有飛天滑板可以借東京都的死神小學生)

超級電腦是科學家進行高速/高效計算(High Performance Computing)的主要設備。超級電腦的架構,可以說是非常的簡單:用網路線連結各台主機,讓主機間互相溝通,才能夠進行平行運算。

-----廣告,請繼續往下閱讀-----

一般超級電腦的架構大致上如下:一機板上可能會有一個到數個 CPU,而一個或是數個機板會組成一個節點(Node),有時數個結點會組成一個機櫃(Rack/Cabinet)。節點與節點間的連結,就是依靠網路線在進行 CPU 之間的溝通,因此網路變成非常重要的元件。

節點與節點間的連結,就是依靠網路線在進行 CPU 之間的溝通,因此網路變成非常重要的元件。圖/pixabay

在此架構下,如何讓結點間有效溝通,也是一門學問了[5]。這些 CPU 可以想象是每個拿著工程計算機的研究生,正等著教授指派任務給他們算,而一個節點就是一個房間,在同一個房間內的溝通一定是比較快的,當不同房間需要溝通時,就會需要走出房間去給資料,如果所有的人一起拿資料回報給教授,那這教授可能就會崩潰,所以如何讓研究生(CPU)互相溝通,又不至於塞車,就是電腦工程專家們的專業了。

現在超級電腦的架構也與過往的超級電腦不同了。除了採用巨量 Arm 晶片的日本富岳(具 158,976 節點)、自主研發晶片的中國神威太湖之光(具 40,960 節點)外,前十大超級電腦[3]都是採用 CPU 加上 GPU 的混合架構(如在機板上插上 GPU 增加運算效率),才達到 100 Peta-Flop(1Peta = 1015) 以上的計算量,也意味著未來要在超級電腦上進行高效計算,GPU 運算也成為很重要的應用,因此也有許多計畫正在將軟體朝 GPU 運算的方向前進與推動。

軟體是否能配合平行化,也是非常是否能進行高效運算的重點之一。所謂的高效計算,也是利用許許多多的運算元件(CPU 或是 GPU),採平行運算的方法,將一個問題切成許多碎片,以螞蟻雄兵的方法一一解決,所以不要再怪為什麼你家的電腦 CPU 無論幾核心都只用了一核心,那是因為你的軟體沒有進行平行處理。早期土木界在進行坡面的圓弧破壞面計算時,據說就是用人力一人算一片圓弧的切片,也算是(人力)平行運算的先驅之一了。一般電腦中使用平行運算最多的,應該就是你手上那張 GPU 顯卡,在 GPU 的加持下,電腦螢幕中每個點、每個邊、每個平面上的顏色與光影,才能完美的呈現在使用者的眼前,所以與其用顯卡挖礦,還不如投身虛幻而真實的遊戲世界

-----廣告,請繼續往下閱讀-----

不過有了地表最強的超級電腦,並不代表我們今天就能夠像小說形容的一樣,能幾秒內預測核子彈的破壞能力,或是在一天內算出地球百年後的氣候狀況,因為平行計算加快了計算的速度,但有其極限。

有了地表最強的超級電腦,並不代表我們能夠像小說一樣,在一天內算出地球百年後的氣候狀況,因為平行計算加快了計算的速度,但有其極限。圖/pixabay

資料的讀入或是寫出,也是瓶頸之一,電路板與網路速度,以及資料存取方式都會造成資料讀寫的延遲,更不用說,若是打算模擬地球,其將耗盡 80 exabyte 等級的儲存空間,其為 CERN 的 ATLAS 與 CMS 計畫所產生的資料量的十倍[6]

為什麼氣候模擬要用到 Exascale?

Exascale 的超級電腦除了可以提供更多的運算能力,給更多的使用者進行模擬與計算外,也是挑戰超大型計算的開始。不過為什麼要 Exascale?到底為什麼一個模擬要用到上千甚至是上萬顆的 CPU 在運算?氣象氣候模擬已經將 Exascale 喻為下一階段應使用的救星[7],在氣象上除了要能做到一小時內達成氣象預測外,也希望能夠進行叢集式運算(像是利用隨機方法產生上百個因亂度而有不同結果的預測),進而進行機率式預測分析,或是提高水平距離至 2.5 公里以下的網格精度,此精度也為可進行對流模擬 (Convection-Permit)[8] 的精度。氣候模擬也需要高效能的運算,除了高精度的全球模型外,也需要進行長程的氣候模擬,幾十年到幾百萬年的模擬時間,也將需要 Exascale 等級的超級電腦來加速模擬,縮短實驗時間。越多的計算核心以及有效的平行運算,才能讓最真實的模擬結果讓人類使用,畢竟,誰都希望出遊不要遇上下大雨,也會希望能夠提前幾天知道颱風的路徑。

地球系統模擬中,其中一個挑戰便是進行模擬時程:挑戰一日(24 小時)的超級電腦計算可以得到多少年的模擬結果(simulated years per wall-clock day, SYPD)[6]還真的是「度日如年」,而此地球系統的精度為水平方向僅一公里的超高解析度,用來進行最終極的地球系統模擬:數位攣生(Digital Twins)[9]。數位攣生計畫主要是要建立地球的複製體,以方便人們對地球進行各種「實驗」,了解到經濟或政策面對地球生態或是氣候的影響,因此要達成此目的,強大具 Exascale 能力的電腦,便成為了目標。

目前已經有部份超級電腦都在進行 SYPD 的挑戰,如中國的神威太湖之光,其已完成了每日 3.4 年的地球系統模擬[10],只不過其地面僅有 25 公里的水平精度,海面僅 10 公里的水平精度,還有非常多的進步空間。只可惜,這個實驗並沒有進行進行資料輸出,無法得到正確的效能結果(資料的寫入與輸出也是非常費時的),以及真正的運算結果:因為沒有資料,就沒有辦法分析。

從高速電腦看量子電腦:量子電腦會是傳統的救星嗎?

量子電腦目前也成為了熱門名詞,從 2019 年開始,IBM 與 MIT 共同開始了量子計算課程,各學術單位也在搶攻量子電腦領域,但對地球模擬領域而言,量子電腦還太遙遠,對「傳統物理」的地球科學來說,我們解偏微分、解多項式,用的是傳統的數值方法,跟量子電腦界在進行的運算,也差了十萬八千里。

-----廣告,請繼續往下閱讀-----

編按:這邊所說的數值方法,簡單講就是「暴力解」。例如要求圓周率,就先設定一個半徑為 1 的圓面積公式,然後問電腦答案是多少,電腦的第一步會把所有正整數代入公式中從一個初始數字(Initial State)開始,先找到答案會在 3 到 4 之間,之後又把 3 到 4 之間的所有數,帶回一開始的公式,得知答案在 3.1 到 3.2 之間,之後又將這個區間的所有數帶回一開始的公式,如此重複很多次後,就會得到相對接近的正確答案。

量子電腦就比較詭異了,量子態的平行運算與邏輯閘,使得兩者的運算邏輯完全不同,以上面的圓周率問題為例,量子電腦會直接給出在 3.1415925 至 3.1415927 之間,存在正確答案的可能性是最高的,但是這個範圍也有可能是錯的,而且就算是錯的,以我們現在的能力也很難說明它錯在哪裡。

從表面上來看,傳統電腦用暴力解,以排除錯誤答案的方式逼近正確答案,而量子電腦不排除錯誤答案,直接找到最有可能的答案會在哪個區域,但不保證運算過程中的正確性。

因為這個區別,若將現在成熟的模擬方法直接導入量子電腦中,最有可能出現的就是不知道怎麼解讀得到的數據,這包含了答案的正確程度,以及改動特定變數後所產生的答案變動是從何而來?

IBM 與 GOOGLE 正在爭奪追逐量子霸權(Quantum Supremacy)的同時[11],(不過 Google 號稱的量子霸權,也就是一萬倍的計算速度,在 2021 年被中國科學院理論物理所的 Feng 等人用了 15 個 NVIDIA V100 GPU 給追上[12][註五]),其離傳統電腦計算的距離,也有十萬八千里遠,離應用於地球科學計算上還有一定的距離,但只要哪一天能夠應用在普通的大氣循環模式(GCM),就可以算是第一步吧。但是在量子力學進入大氣科學前,我們氣候與氣象模擬還是只能使用傳統的電腦主機,靠著 2 位元的方法進行大氣模擬,所以目前傳統超級電腦還沒有被取代的機會。

結語:超大主機與超大計算

依摩爾定律,每十八個月,CPU 晶片的製成就會進步一倍,同時,超級電腦中心卻是一直受益於摩爾定律帶來的好處,也就是 CPU 的能力越來越強,而價格也越來越親民,也讓氣候氣象模擬的空間精度也隨之升高。

Neumann 等人也預計在 2030 年代後,進行 1 公里等級的超高精度計算也將不是夢想[7],而在 Exascale 主機降臨前的這個年代,有些超級計算中心已經以節點(Node)做為計算資源耗費的單位(Node per hour),而非 CPU per hour,顯示出大型主機對計算資源消耗的想法以從 CPU 規模上升到了 Node 規模。

一方面使用者受益於更多的 CPU 資源,但同時這些主機也要求更新更大量的計算能力,如瑞士的 Piz Daint 與瑞典的 LUMI,皆要求使用者的計算必須是含有 GPU 運算能力,而純粹靠 CPU 運算的軟體,將無法享受到同等的巨量資源。

-----廣告,請繼續往下閱讀-----
IBM為橡樹嶺國家實驗室開發的Summit超級計算機(或 OLCF-4)。圖/flickr

而相應的挑戰也隨之而生,除了硬體將進入 Exascale 的時代,軟體也將一同進入這場大戰,才能享受同等的資源。另外一個挑戰則是綠色挑戰,1 公里精度的氣象模擬,每一模擬年將耗盡 191.7 百萬瓦時[6],相當於台灣一個家庭可以用上 43 年的電量[註三],也可以讓特斯拉的 Model 3LR 從地球開到月球來回開 1.5 次[註四],其耗能之巨,也是我們計算或是模擬界科學家應該要注意到的問題,也是為何除了 HPC Top500 外,亦有 Green 500[13]的原因吧,而具有超高效能的 Frontier,也同時奪下了 Green 500 之冠,也算是 Exascale 的好處吧。

註解與文獻

  • [註一] 若需使用 JSC 的超級電腦,必須透過不同的計畫項目進行申請,其計畫主持人(PI)為歐洲或是德國的研究者[14]
  • [註二] 日本的富岳其實也可以進行到 Exscale 的運算,只是要超頻而已,想當然爾是非常規設定。
  • [註三] 根據台電 2021 年新聞稿中,家庭離峰平均用電為 339 度以及 6-9 月為 434 度推估。
  • [註四] 根據 Tesla M3 LR 為 25kWh per 100 Miles,月球至地球為 384400 公里推估
  • [註五] Feng 也公開了他的程式碼
  • [1] Forschungszentrum Jülich 新聞稿
  • [2] EUROPE HPC 新聞稿
  • [3] 2022 年六月 HPC Top 500 名單
  • [4] 國家高速網路中心台灣杉二號介紹
  • [5] 司徒加特超級電腦中心:HAWK 主機之連線架構
  • [6] T. C. Schulthess, P. Bauer, N. Wedi, O. Fuhrer, T. Hoefler and C. Schär, “Reflecting on the Goal and Baseline for Exascale Computing: A Roadmap Based on Weather and Climate Simulations,” in Computing in Science & Engineering, vol. 21, no. 1, pp. 30-41, 1 Jan.-Feb. 2019, doi: 10.1109/MCSE.2018.2888788.
  • [7] Neumann P et al. 2019, Assessing the scales in numerical weather and climate predictions: will exascale be the rescue?. Phil. Trans. R. Soc. A 377: 20180148. http://dx.doi.org/10.1098/rsta.2018.0148
  • [8] Kendon, E. J., Ban, N., Roberts, N. M., Fowler, H. J., Roberts, M. J., Chan, S. C., Evans, J. P., Fosser, G., & Wilkinson, J. M. (2017). Do Convection-Permitting Regional Climate Models Improve Projections of Future Precipitation Change?, Bulletin of the American Meteorological Society, 98(1), 79-93
  • [9] Bauer, P., Dueben, P.D., Hoefler, T. et al. The digital revolution of Earth-system science. Nat Comput Sci 1, 104–113 (2021). https://doi.org/10.1038/s43588-021-00023-0
  • [10] Zhang, S., Fu, H., Wu, L., Li, Y., Wang, H., Zeng, Y., Duan, X., Wan, W., Wang, L., Zhuang, Y., Meng, H., Xu, K., Xu, P., Gan, L., Liu, Z., Wu, S., Chen, Y., Yu, H., Shi, S., Wang, L., Xu, S., Xue, W., Liu, W., Guo, Q., Zhang, J., Zhu, G., Tu, Y., Edwards, J., Baker, A., Yong, J., Yuan, M., Yu, Y., Zhang, Q., Liu, Z., Li, M., Jia, D., Yang, G., Wei, Z., Pan, J., Chang, P., Danabasoglu, G., Yeager, S., Rosenbloom, N., and Guo, Y.: Optimizing high-resolution Community Earth System Model on a heterogeneous many-core supercomputing platform, Geosci. Model Dev., 13, 4809–4829, https://doi.org/10.5194/gmd-13-4809-2020, 2020. https://gmd.copernicus.org/articles/13/4809/2020/
  • [11] 「嗨量子世界!」~ Nature Newsletter
  • [12] Feng Pan, Keyang Chen, and Pan Zhang, Solving the sampling problem of the Sycamore quantum circuits, accepted by Phys. Rev. Lett.
  • [13] 2022 年六月 HPC Green 500 名單
  • [14] JSC 系統申請辦法

Y.-S. Lu
4 篇文章 ・ 6 位粉絲
自從來到學界後,便展開了一段從土木人到氣象人的水文之旅。主要專業是地球系統數值模擬,地下水與地表模式的耦合系統,以及大氣氣象模擬。目前是于利希研究中心(Forschungszentrum Jülich GmbH)超級電腦中心的博士後研究員。