Loading [MathJax]/extensions/tex2jax.js

0

2
0

文字

分享

0
2
0

加速變奏曲—探索基本粒子的大強子對撞機

科學月刊_96
・2012/06/05 ・6887字 ・閱讀時間約 14 分鐘 ・SR值 590 ・九年級

-----廣告,請繼續往下閱讀-----

夸克組成質子與中子,質子、中子和電子組成原子,原子組成分子,分子組成你我所知的世界。一句話道盡了50 年來粒子物理學家探尋的答案。

余欣珊

對於現在的年輕人而言,網路已經成為生活中不可或缺的一部分:交友、蒐集資訊、玩遊戲……;虛擬世界中的一切,似乎比日常生活中的人事物還要更真實。在這樣環境下長大的妳或你,是否曾經問過:自然世界是由什麼組成的?

探索自然世界的組成

在西元前600 年的古希臘時代,「自然世界是由什麼組成」是一個熱門的議題。古希臘哲學家們企圖在神話之外,用理性的思維去了解肉眼所觀察到的自然界中的循環和變化,譬如:水為何會變成冰,空氣凝結為何會變成水等等。在米力特斯(Miletus,古希臘城市,位於今土耳其的西半部)有三位哲學家:泰利斯(Thales, 624~546 BC)、 安奈克西曼德(Anaximander,610~546 BC)、安那西梅斯(Anaximenes, 585~528 BC),認為自然界的一切事物雖然看似變化萬千,但必定是由一種基本物質所組成。三人持有不同觀點,分別認為這個單一的基本物質是水、無界限者或空氣。

-----廣告,請繼續往下閱讀-----

100 年後,德模克里特(Democritus,460~370 BC)提出了唯物論:每一種事物都是由一種微小且不可分割的積木所組成;他稱這些積木為原子(atom)。因為沒有一件事物會來自虛無,所以大自然的積木必須是永恆的。所有的原子都是堅硬結實的,但卻非完全一樣,而大自然是由無數形狀各異的原子所組成。德模克里特不相信有任何力量或靈魂介入大自然的變化過程,大自然每件事情的發生都是相當機械化的,萬事萬物都遵守必要的法則。

雖然這些希臘哲學家的想法非常簡潔漂亮,但是他們並沒有實驗的根據。兩千多年後,俄國科學家門德列夫(Mendeleev,1834~1907)首創化學元素週期表〔註一〕,把當時所發現到的原子依其原子量大小做了排列,而且觀察到這些原子的化學特性都可以被簡化和分組,暗示了原子是由更小的基本粒子所組成。經過了五十多年實驗和理論的相互激盪,物理學家建立了今天的粒子物理標準模型(standard model)。

粒子物理標準模型

在標準模型裡,基本粒子包含夸克(quarks)、輕子(leptons)、和作用子(forcecarriers),如圖一。有六種夸克和六種輕子以及它們的反粒子:上夸克(up,u)、下夸克(down,d)、魅夸克(charm,c)、奇夸克(strange,s)、頂夸克(top,t)、底夸克(bottom,b)、電子(electron,e)、渺子(muon,μ)、濤子(tau,τ)、電子微中子(electron neutrino,ve)、渺子微中子(muonneutrino,vμ)、濤子微中子(tau neutrino,vτ)。四種作用子負責傳遞基本交互作用力:光子(photon,γ)負責電磁力、膠子(gluon,g)負責強作用力、而Z玻色子和W玻色子負責弱作用力。

圖一: 現今粒子物理標準模型裡的基本粒子: 夸克 (quarks)、輕子(leptons)、和作用子(force carriers)。

夸克之間或輕子之間並不直接交流,而是透過像郵差一樣的作用子來傳遞訊息而產生交互作用,所傳遞的訊息強度大小決定於粒子所帶的「電荷」大小以及作用力常數。夸克因為帶有電磁電荷、色電荷和弱電荷,可以「接收」到這四種作用子的訊息。輕子不帶色電荷,所以接收不到膠子的訊息(不參與強作用力)。特別一提的是:微中子只帶有弱電荷,只能感受到弱作用力,被暱稱為「鬼粒子」(ghost particle)。

-----廣告,請繼續往下閱讀-----

在電磁力、強作用力和弱作用力之中,無疑地,大家最容易感受到也最熟悉的是電磁力。帶正電的原子核和帶負電的電子,藉由光子而相吸引並鍵結成原子,雖然原子呈電中性,兩個非常靠近的原子,就像兩個電偶極一樣相互吸引,這吸引力便是所謂的凡得瓦力,原子群藉由凡得瓦力鍵結而組合成了分子。電磁力決定了原子和分子的化學性質。同理地,帶有色電荷的夸克(或反夸克)藉著膠子而鍵結成色中性的介子或重子〔註二〕;你所熟悉的質子和中子,便是眾多上夸克和下夸克的排列組合中最輕和最穩定的重子。而質子和中子就像「色偶極」一樣,相互吸引而組成了原子核。弱作用力雖然強度比強作用力和電磁力小了4~6個數量級,但它其實是地球生命的起源:弱作用力讓太陽中的氫在一連串的反應後轉換為氦,並釋放出光和熱,而放射性衰變的產物,更被拿來應用在癌症治療等醫學用途上。

注意!當一個粒子被稱為基本粒子時,代表我們認為這個粒子無法再被分割,沒有內部構造。但是,有別於大家對於「基本粒子是永遠不變」的直覺,雖然它們無法被分割,卻可以透過電磁力或弱作用力,衰變到其它較輕的基本粒子。在標準模型裡,只有第一代粒子組成了穩定的物質,其他粒子所組成的物質(重子或介子)生命期較短,最終都會衰變到第一代粒子或是作用子。

粒子物理學界當前課題

對於「自然世界是由什麼組成」這個問題,粒子物理標準模型雖然給了我們一個最接近真實世界的答案,但並不是一個最理想和最完整的答案。還有許多問題尚未找到解答,以下提出幾個例子。

現今的物理學家和希臘哲學家有同樣的信念,相信自然界可以由少量的法則來決定;但標準模型的基本粒子數目,似乎還是多了些。是否代表夸克和輕子並不是基本粒子,兩者只是一個更基本的粒子在低能量時所展現的一體兩面?又或者基本粒子數目不少,而我們尚未找到所有的夸克和輕子?細心的讀者應該也發現標準模型尚未把重力納入,是否還有一個重力作用子?另外,這些基本粒子的質量範圍甚廣:有比電子輕的微中子,也有重達184倍質子質量的頂夸克,兩者質量差了11個數量級,為什麼這些基本粒子會擁有質量?在作用子中,光子和膠子沒有質量,但是為什麼W 和Z 玻色子卻是質子質量的86和97倍?是因為它們和希格斯粒子的交互作用?那為什麼我們還沒有找到希格斯粒子?在宇宙大爆炸時,估計有相等數量的正粒子和反粒子,為什麼現在自然界中的穩定物質是由正粒子所組成的,而我們只能在實驗室的產物中看到反粒子?

-----廣告,請繼續往下閱讀-----

為了找到這些問題的解答,物理學家設計了各種實驗來了解這些基本粒子的性質。在標準模型中,大部分的粒子無法穩定存在,但是物理學家可以在較單純的實驗室環境裡製造,然後用像照相機一樣的偵測器,把這些粒子或是它們衰變之後產物的軌跡記錄下來,再用電腦分析這些數據。

若要製造質量較輕的粒子或是它們的反粒子,可以拿高速的電子或質子去撞一個金屬靶,然後再過濾掉不想要的產物,這就是所謂的定靶實驗;魅夸克和底夸克便是在美國布魯克海文實驗室(Brookhaven National Laboratory)、史丹佛直線加速器中心(SLAC National Accelerator Laboratory)以及費米高能實驗室(Fermi National Accelerator Laboratory, FNAL)裡的定靶實驗發現的。但是粒子物理學家除了想了解基本粒子的性質,更想找到希格斯粒子和發現標準模型以外的新粒子;尚未發現到的新粒子質量多半極高,可能是質子質量的數百倍甚至千倍。而定靶實驗有個缺點——無法將整個系統的能量百分之百地都轉換成質量以產生粒子。既然所有的撞擊都必須維持動量守恆,定靶實驗裡的發射物撞擊金屬靶之後,系統能量有一部分必須貢獻到產物的動能上,使得撞擊後產物的總動量等於撞擊前發射物的動量。定靶實驗的質心系能量為√2mtargetEbeam。

相反地,對撞機實驗對撞兩個有相同能量但相反動量的質子或電子,高質量的新粒子可在靜止狀態下被產生,也就是說,所有對撞物的能量都被拿來轉換成質量;其質心系能量為2Ebeam。而具有高質量的W玻色子、Z玻色子以及頂夸克,便是在歐洲核子物理研究中心及美國費米高能實驗室裡的質子–反質子對撞機實驗裡發現的。

現今能量最高的對撞機,位於瑞士日內瓦近郊的歐洲核子物理研究中心(European Organization for Nuclear Research,CERN),也就是大家之前常在新聞報導裡看到的大強子對撞機(Large Hadron Collider, LHC)。

-----廣告,請繼續往下閱讀-----

大強子對撞機

大強子對撞機(LHC)是一個圓形加速器,位於地下約100 公尺,周長有26.7 公里,主要由一連串的共振腔(提供以無線電頻率變換極性的電場)、1232個偶極超導磁鐵、392個四極磁鐵所構成(一共有9593個磁鐵!)電場的功用是加速帶電粒子,而磁場的功用是彎曲和聚焦這些帶電粒子,並讓它們在四個對撞點對撞。在四個對撞點各自設有一個偵測器,量測因對撞而產生的粒子的性質。整個加速器橫跨瑞士和法國兩個國家,是世界上最貴(建造花費為5億瑞士法郎)、最大也是能量最高的強子加速器。所使用的強子大部分時間是質子,每一年有一個月的時間會進行鉛離子的對撞。以下文章將針對質子對撞做介紹。

圖二:位於瑞士日內瓦近郊的大強子對撞機。

大強子對撞機整個實驗配置包含LHC加速器、前級加速器、以及4個對撞點上的偵測器:ATLAS、LHCb、CMS 、ALICE 。首先,氫原子裡的質子和電子被解離,質子在直線加速器裡(Linac2)被加速到5000萬電子伏特(50 MeV)。接下來,質子被送到半徑越來越大的圓形前級加速器——質子同步加速器的推進器(Proton Synchrotron Booster,PS Booster)、質子同步加速器(Proton Synchrontron,PS)、超質子同步加速器(Super Proton Synchrontron, SPS),而達到4500億電子伏特(450 GeV)的動能。為了增加物理反應和產生有趣粒子的機率,有超過1011個質子被壓縮在一個半徑約30~45 微米(μm)、長度約10 公分的圓柱空間。至於每一階段的加速器,除了加速質子群以外,也不斷地在冷卻、聚焦質子群,以達到高密度的質子束(proton bunch)。最後,兩個質子束各自沿著順時鐘和逆時鐘的方向,在LHC 軌道裡運行約20 分鐘後,達到最高動能(設計最大值是7 兆電子伏特, 7 TeV)。

質子在加速器裡的能量與速度

讓我們再回顧一下帶電粒子在垂直其運動平面的磁場中如何運行:其軌跡的曲率半徑和磁場大小成反比,和粒子的動量成正比;也就是說,如果要讓粒子維持在同一個圓形加速器軌道(固定的曲率半徑),磁場大小必須隨著動量而改變。LHC 磁場強度的最高值8.33 特斯拉(Tesla)和軌道的半徑26.7 公里,決定了質子可以擁有的最高能量——7兆電子伏特,也就是說,質子–質子對撞時質心系能量最高可達到14 兆電子伏特。在2010和2011年,LHC先以7 兆電子伏特的質心系能量來運行(每個質子能量為3.5 兆電子伏特),也就是最高能量的一半。2012 年的運行,則把質心系能量提升到8 兆電子伏特。1 兆電子伏特的能量,相當於1.6 爾格(1.6 × 10-7 焦耳),其實也不過是一隻蚊子做全速飛行所需要的能量,甚至遠小於一個100 公克蘋果落下1 公尺所獲得的動能(1 焦耳)。

圖三:大強子對撞機(LHC)整個實驗配置:前級加速器(PS Booster 、PS 、SPS 、Linac 2)、和四個 對撞點上的偵測器(ATLAS 、LHCb 、CMS 、ALICE)。

「加速器」這個名稱以及牛頓力學裡的動能K =1/2mv²,可能讓你認為「粒子在加速器裡運行時,其速度和動能不斷地在增加」。但事實上,任何一個有質量的粒子,其速度都無法超過光速。經過狹義相對論的修正後,粒子的動能應該是K =(γ-1 )mc²,其中γ和粒子的速度有關:γ=1/(√(1-v²/c²))

-----廣告,請繼續往下閱讀-----
圖四:經過狹義相對論修正後粒子的能量和速度之 間的關係。虛線代表的是當粒子在靜止狀態時的總 能量mc 2,其中m是粒子的靜止質量而c 是光速。 粗的實線代表的是粒子在速度不等於零時所帶有的 總能量;粗實線和虛線之間的差異便是粒子的動 能:K =(γ- 1)mc 2 。細實線代表的是靜止能量 (mc 2)和牛頓力學動能K =1/ 2 mv 2 的總和。

當粒子速度遠小於光速時(v<<c),γ近似於1 + 1/2(v²/c²),又回到了牛頓力學裡的動能。當粒子速度接近光速時,粒子速度增加的比率卻遠比粒子動能增加的比率緩慢,見圖四;而表一所列的是質子在每一階段的加速器所達到的最大動能和速度。

大強子對撞機研究團隊

在LHC 對撞點上的每一個偵測器都有一個實驗團隊負責,分別是ATLAS(A Toroidal LHC ApparatuS ,超導環場探測器)、CMS(The Compact Muon SolenoidExperiment ,緊湊渺子線圈)、ALICE(A Large Ion Collider Experiment,大型離子對撞機)、和LHCb(LHC Beauty,LHC底夸克偵測器)。其中,ALTAS和CMS的實驗團隊多達3000 人,偵測器有多功能並且包含的角度區域遠大於ALICE 和LHCb ,主要是為了尋找希格斯粒子,並且探測標準模型以外的新物質。在這兩個大型實驗團隊裡,中央研究院物理所隸屬於ATLAS 實驗,而台灣大學和中央大學物理系則隸屬於CMS 實驗。

相對於ATLAS 和CMS ,ALICE 和LHCb 團隊較為嬌小,但是也有600~1000 人。ALICE,顧名思義,專攻於研究鉛離子對撞而產生的夸克–膠子電漿(quark-gluon plasma)狀態,以了解宇宙的形成。LHCb則專攻於研究底夸克的性質,以幫助了解正粒子和反粒子的不對稱緣由。

在這4 個偵測器中, ATLAS 偵測器體積最為龐大:長46公尺,寬25公尺,高25公尺,相當於10 層樓高和3 個籃球場地大小。而CMS偵測器則最重,有1 萬2500 公噸,相當於65 隻藍鯨的體重(現今地球上最重的動物)。除了在4個對撞點上的偵測器, 還有2 個小型偵測器, LHCf和TOTEM,分別位於ATLAS和CMS偵測器的前端和後端。這2 個小型實驗探測在ATLAS和CMS對撞點所產生的粒子,可以補足2個大型偵測器無法包含的區域,也可以量測質子束的亮度。

-----廣告,請繼續往下閱讀-----

對撞點上的偵測器通常包含著一層又一層的子偵測器,見圖五。在最內層、最靠近對撞點的是帶電粒子軌跡偵測器(tracker),再外面一層有電磁和強子量能器(electromagnetic calorimeter andhadron calorimeter),而最外面一層有渺子偵測器(muon detector)。各個實驗在不同區域有大小不一的磁場。為什麼要這樣安排子偵測器的位置?

圖五:粒子在CMS 偵測器裡以及在磁場影響下的行進軌跡。所顯示的是CMS 偵測器垂直於質子束方向的30 °截角剖面圖。 粒子包含有:渺子、電子、帶電強子(如:π介子)、中性強子(如:中子),以及光子。

偵測粒子的軌跡

想要徹底了解粒子的性質,我們必須要知道粒子被產生時的動量大小、方向、和能量大小,也就是所謂的四維動量(four-momentum)。帶電荷粒子的動量大小和方向,可以從它們在tracker裡所留下的訊號而算出——動量大小正比於粒子在磁場中運動軌跡的曲率半徑;而質子–質子對撞點,也就是粒子產生點,和tracker有訊號的位置,兩點的連線方向便是動量方向。

常見的tracker 具備有矽晶軌跡追跡系統和氣體漂移室。不管tracker的材料為何,其物質密度都不能過高,如此一來,當帶電粒子經過tracker時,只會損失非常微小的能量(KeV),而所量測到的動量便不會偏離帶電粒子進入tracker之前原有的動量。如果粒子本身是不帶電荷的,但是會衰變到帶正電和帶負電的粒子,我們可以從這些衰變產物來推導出原來粒子的動量。

粒子的能量,可以由電磁和強子量能器裡的訊號來得到。量能器是一種「破壞性」偵測器,本身可以誘發簇射,所以必須放在tracker外圍,才不會干擾動量的量測。簇射產物中,起初只有少數高能量的次級粒子,這些次級粒子進一步被引發二次簇射、三次簇射……,使得次級粒子的數目逐漸增加,而能量逐漸降低。一旦所產生的次級粒子能量夠低並且帶有電荷,這些次級粒子便會被量能器記錄下來。起始粒子的能量越高,可以產生的次級粒子數目越多,量能器裡的信號也越強。

-----廣告,請繼續往下閱讀-----

那麼,既然渺子帶有電荷,我們可以用tracker量測到它的動量,為何在量能器外圍,還需要裝一個渺子偵測器?原因是,在標準模型裡帶電荷的粒子中(輕子、W玻色子、或是帶電荷的強子),只有渺子可以在損失極小能量的情況下,穿越量能器,而在渺子偵測器被偵測到。其他粒子不是早就衰變,便是已經損失所有的能量在量能器裡,例如電子或正子在電磁量能器中損失所有能量。雖然渺子最終還是會衰變,不過它的生命期是2.2微秒,平均來說,對於一般對撞機所產生的渺子,至少要行進6000公尺才會衰變,這距離顯然遠大於一般偵測器的大小。渺子偵測器的基本作用原理,事實上和靠近對撞點的tracker一樣,所使用的種類大多是氣體漂移室。

如同前面所提到的,微中子不會和對撞機偵測器產生電磁交互作用或強交互作用,所以無法被直接偵測到。判別微中子的方法,只有看每個對撞事件裡,是否有「迷失動量」(missing momentum)?

在同一個質子–質子對撞事件裡,所有的粒子的總動量必須等於零,如果有粒子沒有被偵測到,其他被偵測到的粒子的總動量便會不等於零,也就是說,這個對撞事件有迷失動量。迷失動量是所有偵測到的物理量裡,最難校正的一項,偵測器要是有一個區域無法正常運行,或是被偵測到的粒子能量有誤差,對撞事件便會產生一個「偽迷失動量」。雖然困難,但是許多粒子物理學家還是努力研究「迷失動量」,因為除了微中子之外,尚未發現到的重力作用子、超對稱粒子、或其他新粒子,都有可能逃離偵測器而留下迷失動量。

粒子物理學的戰國時代

西元2011年無疑是粒子物理界裡的戰國時代。有造成不少騷動但後來證實是曇花一現的:微中子超越光速、在W玻色子事件中的未知粒子(雙噴射流激態, di-jetresonance)、以及疑似希格斯粒子衰變到雙光子的事件。也有超越前人的:縮小希格斯粒子的質量範圍和超對稱理論的參數值空間、在重離子對撞中看到反氦原子核、噴射流在夸克–膠子電漿裡的能量衰減、和許多檢驗標準模型的測量。以上對於粒子物理實驗,作了一個很基本的介紹,期待吸引有興趣的學生加入我們的行列,一起向未知的世界挑戰。

註一:直到西元2012年為止,元素週期表已經有118種原子。
註二:一旦夸克被產生,便無法單獨存在。一個夸克必須和一個反夸克鍵結成一個介子,或是和兩個夸克鍵結成一個重子,以達到色中性的狀態。

余欣珊:任教中央大學物理系
原文發表於《科學月刊》第四十三卷第五期

-----廣告,請繼續往下閱讀-----
文章難易度
科學月刊_96
249 篇文章 ・ 3742 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

2
0

文字

分享

0
2
0
探索自然知識的先行者:古希臘哲學家如何看待萬物的基本組成?——《世界史是由化學寫成的》
圓神出版‧書是活的_96
・2023/05/15 ・1970字 ・閱讀時間約 4 分鐘

古希臘哲學家中,不乏能精準測量天體位置的人,還有能運用幾何學知識來丈量土地的人。儘管他們尚未發展出「實驗」這項科學方法,但相對的,他們非常仔細觀察自然界發生的變化,並思考形形色色的問題,成為自然界和社會的知識探索者。

萬物皆由水組成

古希臘最早深入探索「萬物根源」的人是泰利斯(Thales)。他是個生意做很大的貿易商,曾搭船經由地中海,到埃及推銷橄欖油,是個見多識廣的人。

某天,泰利斯開始萌生疑惑:

世界上有數之不盡的萬象事物,都是由物質所構成的,而且物質的變化方式多得令人驚奇。雖說物質會不斷變化,卻並非無中生有,存在的東西也不可能完全消失;由此可知,物質是不生不滅的。無數物質不斷變化,但為什麼大家都是不生不滅的?

古希臘哲學家泰利斯(Thales of Miletus)。圖/wikipedia

泰利斯認為,所有物質必然是由唯一的「本原」所組成的,而他得到的答案就是水:

-----廣告,請繼續往下閱讀-----

水遇冷後凝結成冰,加溫之後就會恢復原狀;溫度繼續升高的水會成為水蒸氣,再冷卻後又會形成水滴。河川、海洋和地表的水,都會變成水蒸氣上升到空中、形成雲朵,雲又會降水成為雨和雪。水能如此千變萬化,不論怎麼變也不會消失殆盡。話說回來,金屬的變化、生物形體的變化,不也都和水一樣嗎?

泰利斯推論,這些物質的型態和外形不論再怎麼變化,也不會完全消失,應該是因為所有物質都是由某個「本原」所組成的——不論構成的是金屬或生物。

後來泰利斯便把構成所有物質的「本原」命名為「水」。

值得注意的是,泰利斯所說的「水」,並不是指現代科學做為研究對象、做為物質的水,而是將變化不歇、變換型態後生成其他物質,並能再度回歸原初型態的萬物本原稱為「水」而已。這種思考的背景,可能來自於他曾到東方旅行,聽聞流傳在美索不達米亞的世界起源傳說、得知其故事中心就是「水」,才深受影響。

泰利斯的「水」,促使眾多學者開始思考萬物的「本原」(元素)為何。有人認為本原是「空氣」,經過壓縮和稀釋,分別形成水、土和火,進一步創造了自然界;也有人認為本原就是「火」,並將自然界比喻為「燃起、消失,無時無刻都在活動的火」。

-----廣告,請繼續往下閱讀-----

微粒組成萬物

對於「萬物根源」是什麼的問題,德謨克利特(Democritus)提出了名為「原子論」的主張。

和泰利斯一樣,德謨克利特曾周遊地中海沿岸,徒步觀察風土、歷史和文化迥異的各個國家裡,有什麼樣的自然環境與人民,並學習各國的學問和技術。他認為,創造萬物的「本原」存在於無數微粒中,而且這一顆顆粒子永遠不會毀滅。他將這些無法再分解得更小的微粒,以希臘語中意指「不可分割之物」「atomos」(原子)來命名。

德謨克利特還思考了另一項觀點,也就是「虛空」(什麼都沒有的空間),若改用現代科學的用語來說,就是「真空」。因為原子會占據空間、四處活動,所以必須要有提供給原子活動的「虛空」。

簡單來說,德謨克利特的原子論就是「萬物是由原子和真空所構成的,除此之外別無其他」。

-----廣告,請繼續往下閱讀-----
古希臘哲學家德謨克利特(Democritus)。圖/wikipedia

德謨克利特認為,無數原子在除了原子以外什麼都沒有的空間裡,激烈且毫不停歇地四處活動,互相撞擊、形成漩渦。有的原子雖然會和其他原子相連成一團,但這團東西總有一天會分解,恢復成原本四散的原子。只要改變原子的排列方式和組合,就能製造出不同種類的物質。萬物是藉由原子的組合而形成,就連火、氣、水、土也不例外。

據說德謨克利特寫了一系列共七十多部鉅著,但沒有一本流傳下來。由於他大膽主張,人類的靈魂也是由輕盈、活潑好動的原子組成,不會遵從神的指示,而是跟隨控制原子運動的自然定律;只要構成人類肉體的原子瓦解分散,人類的靈魂就會消失。也就是說,神並不存在。他因此遭到統治階層指控「試圖抹滅神的存在」,並飽受攻擊,與他有關的書籍全數遭到銷毀。我們之所以能認識德謨克利特的事蹟,主要是由於反對原子論的哲學家們,將他的思想記錄在自己的著作之故。

——本文摘自《世界史是化學寫成的:從玻璃到手機,從肥料到炸藥,保證有趣的化學入門》,2022 年 2 月,究竟出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
圓神出版‧書是活的_96
13 篇文章 ・ 3 位粉絲
書是活的,他走來溫柔地貼近你,他不在意你在背後談論他,也不在意你劈腿好幾本。 這是一種愛吧。 圓神書活網 www.booklife.com.tw

0

4
1

文字

分享

0
4
1
微擾理論:我們有沒有可能遮蔽了新的物理?——《撞出上帝的粒子》
貓頭鷹出版社_96
・2023/01/27 ・2632字 ・閱讀時間約 5 分鐘

對撞機能夠給出什麼答案?

物理學家想用大型強子對撞機來解答的重要問題,可以總結如下:在大型強子對撞機的能量級下,粒子物理的標準模型是否有效?「對撞機能量級」是個大大的躍進,因為其能量大小超越了電弱對稱破缺尺度;在這個尺度之上,兩種基本作用力相互統一,而 W 和 Z 玻色子、甚至所有其他基本粒子的質量,也許都是起源於此。

從空中鳥瞰大型強子對撞機的地理環境。圖/wikipedia

如果標準模型可以成功描述新能量範疇的現象,希格斯粒子應該就會存在,但看來不會有什麼其他的新發現;反之,如果標準模型失效,也許就沒有希格斯粒子了,不過背後一定會藏著稀奇古怪的事物。其實有個不易察覺的問題會左右這件事:我們究竟有多了解標準模型在此能量級下預測的現象?這並不容易回答。

一般而言我們並沒有能耐百分之百準確地解出標準模型。所有人都是用近似法。而絕大多數的近似方法之所以可行,是因為基本作用力的「耦合」,也就是強度,沒有很大。「耦合」就是在物理過程對應的費曼圖中,每個作用頂點帶有的值。(參見【科學解釋 8】)

微擾理論的應用

作用力的強度可以用一個數值來表示。如果說這個數值是 0.1,那麼兩個粒子交互作用的機率就會和 0.1 乘上 0.1,也就是 0.01 成正比。要是有三個粒子,機率就變成 0.1 的三次方,0.001,四個粒子的話就是 0.0001,如此這般。由此可知,如果耦合值很小,你就可以忽略比方說四個粒子以上的粒子交互作用―超過這個臨界值的項對於主要結果都只是極小的微擾罷了,因為前面至少會乘上 0.1 的五次方,也就是 0.00001。

-----廣告,請繼續往下閱讀-----

可見更多粒子的反應項只會些微改變原本的結果而已。這就是「微擾理論」的例子,微擾理論廣泛運用於解決物理界和化學界中許多的問題。只要耦合值很小、也就是作用力很弱,這個理論就十分準確。

然而,這種近似法並不是永遠有效。微擾理論失效的地方大多涉及強核力、也就是量子色動力學。這就是為何大家要把這種作用力稱為強核力。我們不是故意要混淆視聽的,強核力的確和它的名字一樣難以應付。

舉例來說,在我們對撞質子,想一探其內部夸克及膠子的種類分布時,某些方面的資訊其實無法從先前所提的原則計算得到(參見 4.5 節)。除此之外,我們也無法算出夸克和膠子最後是如何結合成新的強子的。雖然大家手上有量子色動力學的限制條件,也有一些基本的能量守恆、及動量守恆定律,以及不少從其他地方得到的數據,卻無法用微擾理論。

由二個上夸克及一個下夸克所構成的質子。圖/wikipedia

原因在於強核力的耦合值非常接近一,不論幾次方都還是一。因此,不管你計算的對象是幾個粒子,得到的結果都不會收斂到某個可信的值。最終我們只好依據自己的經驗來猜測結果、或建立模型。而這樣的結論一直都有調整空間。

-----廣告,請繼續往下閱讀-----

因此我們要嚴肅看待一個問題:大家在調整模型的時候,實際上可能會遮蔽了令人興奮的新物理。要避免這個問題,你得拿自己熟悉、以微擾理論計算的結果,連結上自己還不太明白、有調整空間的模型。我想像出一個比較毛骨悚然的情景來譬喻這件事――一具以精準預測架構的骨架,嵌在以最佳猜想組成的濕軟肉體內。

肉體的形狀可以改變。你可以重搥它的肚子,或捏它的臉頰(相對來說比較不痛);但是它有兩隻手兩隻腳,如果你打斷了某根骨頭,自己一定會知道。

用既有的知識探索未知

無論如何,大家利用電腦程式來把可塑的模型、與不易動搖的微擾理論整合在一起,而且絕大部分的工作都已經完成了;這種程式就是蒙地卡羅事件產生器(Monte Carlo event generator)。程式不但能編譯大部分我們擁有的粒子對撞現象的相關知識,同時也是個珍貴的工具,能協助物理學家設計新的實驗,並釐清既有的實驗對不同模擬數據會如何反應與解讀。「蒙地卡羅」這個名字有其典故,因為就和俄羅斯輪盤賭注一樣,這種事件產生器用上了很多隨機的數字。

這一切其實都牽涉到一點有趣的科學社會學。身為一位理論學家,有時你會因為投入某類蒙地卡羅事件產生器相關的研究而吃虧。你的一篇論文可能已經被引用了數千次,大家還是會說:「不過是電腦軟體罷了。」或是「這只是蒙地卡羅那類的玩意兒。」反之,要是你是發表一篇弦論的論文,又被引用這麼多次的話,你就能像個巨人般橫行全世界了。但說到底,弦論努力想預測的現象距離實證還是很遙遠,蒙地卡羅事件產生器卻可以實際解釋數據。

-----廣告,請繼續往下閱讀-----

蒙地卡羅事件產生器雖然不是唯一的辦法,大致上仍是物理學家在理解標準模型的意義、與儘量試著利用模型精確預測現象時,所付出的一份心血。

粒子物理標準模型。圖/wikipedia

雖然和大型強子對撞機的學界相比,蒙地卡羅事件產生器的研究社群規模較小,但相對來說,這個領域的成員盡的心力甚至不會比大家建造對撞機的付出還要少。美國物理學會也許是考量到了這一點,將 2011 年的櫻井獎(J.J. Sakurai Prize)頒給在這個領域工作的三位理論學家,分別是韋伯(Bryan Webber)、阿塔瑞利(Guido Altarelli)、斯舍斯特蘭(Torbjörn Sjöstrand)。頒獎典禮的引言如下:

因為三位物理學家的洞見,我們得以縝密驗證粒子物理的標準模型,實現高能物理實驗的目標、並從中學習量子色動力學、電弱交互作用、與可能的新物理的確切知識。

我很開心他們獲獎,因為其中兩位是我很親近的朋友,也更是因為三人所寫的計算方法及程式對大型強子對撞機幾乎所有的研究都十分重要,像是確保大家不會在不知情的情況下遮蔽任何新的物理。當前,我們正在嘗試確認希格斯粒子搜尋實驗的不定變數大小,並縮減其數量;人人都在尋找關鍵的三標準差證據、甚至是五標準差的大發現。為了這個目標,許多人夜以繼日持續比對新的數據和蒙地卡羅事件產生器的結果。

——本文摘自《撞出上帝的粒子:深入史上最大實驗現場》,2022 年 12 月,貓頭鷹出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
貓頭鷹出版社_96
65 篇文章 ・ 26 位粉絲
貓頭鷹自 1992 年創立,初期以單卷式主題工具書為出版重心,逐步成為各類知識的展演舞台,尤其著力於科學科技、歷史人文與整理台灣物種等非虛構主題。以下分四項簡介:一、引介國際知名經典作品如西蒙.德.波娃《第二性》(法文譯家邱瑞鑾全文翻譯)、達爾文傳世經典《物種源始》、國際科技趨勢大師KK凱文.凱利《科技想要什麼》《必然》與《釋控》、法國史學大師巴森《從黎明到衰頹》、瑞典漢學家林西莉《漢字的故事》等。二、開發優秀中文創作品如腦科學家謝伯讓《大腦簡史》、羅一鈞《心之谷》、張隆志組織新生代未來史家撰寫《跨越世紀的信號》大系、婦運先驅顧燕翎《女性主義經典選讀》、翁佳音暨曹銘宗合著《吃的台灣史》等。三、也售出版權及翻譯稿至全世界。四、同時長期投入資源整理台灣物種,並以圖鑑形式陸續出版,如《台灣原生植物全圖鑑》計八卷九巨冊、《台灣蛇類圖鑑》、《台灣行道樹圖鑑》等,叫好又叫座。冀望讀者在愉悅中閱讀並感受知識的美好是貓頭鷹永續經營的宗旨。