Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

諾貝爾獎幕後:重力波的百年追尋,和為此困惑的愛因斯坦

歐柏昇
・2017/11/15 ・5425字 ・閱讀時間約 11 分鐘 ・SR值 541 ・八年級

最近,雷射干涉重力波天文台(Laser Interferometer Gravitational-Wave Observatory;簡稱 LIGO)真是好事成雙。先是在 2017 年 10 月 3 日,萊納‧魏斯(Rainer Weiss)、基普‧索恩(Kip Thorne)及巴里‧巴利許(Barry Barish)三位團隊成員獲頒諾貝爾獎。接著在10月16日,宣布了重大發現——首度看到重力波來源發出的光線,也是首度以重力波偵測到兩個中子星合併。

2017年諾貝爾物理學獎得主,由左至右依序為萊納‧魏斯(Rainer Weiss)、巴里‧巴利許(Barry Barish)及基普‧索恩(Kip Thorne),圖/作者提供。

經過整整 100 年才證實的大預言

觀測到重力波,有什麼了不起呢?我們要先從愛因斯坦開始講起。

2015 年,全世界都在紀念愛因斯坦的廣義相對論提出 100 週年。然而,那時候人們心中有一點小小的缺憾——廣義相對論的一項重要預言尚未直接證實,那就是重力波。也許愛因斯坦冥冥之中神來一筆,非常巧合地,正好在愛因斯坦提出廣義相對論的 100 年後,科學家終於證實了重力波的存在。就在 2015 年 9 月 14 日,LIGO 首度偵測到重力波的訊號,2016 年 2 月 11 日將結果揭櫫於世。

1921年的愛因斯坦,圖/作者提供。

天才愛因斯坦也有搞不懂的問題

重力波的預言,在百年之間經過十分顛簸的路。我們每次說到愛因斯坦,總是將他當作神來看待,其實他對於宇宙的法則也曾有深深的困惑。

-----廣告,請繼續往下閱讀-----

早在 1905 年,亨利‧龐加萊(Henri Poincaré)就提出重力波的說法——就像是電磁場可以造成光波(電磁波),重力場可以造成重力波。 1915 年,愛因斯坦發表廣義相對論,利用「時空曲率」的新觀念來解釋重力,並且預言了重力波存在。不過,許多方面都會讓人覺得不太對勁。例如,產生電磁波的一個簡單的方式,是透過震盪的成對正負電荷(電偶極)。然而,質量沒有負的,無法形成正負成對的偶極。

到底能不能形成重力波?連愛因斯坦也開始不太確定了。

愛因斯坦著手進行更深入的理論研究。不久之後,他發現只要選取了特定的座標系統,就可以從他的重力場方程式,找出一個能產生三種重力波的解。不過,這個說法很快就受到挑戰。

1922 年,愛丁頓發表了一篇文章,說明其中兩種重力波的形式都是座標選取的問題,且算出來的波速可為任意值,不一定是光速,而是依據選擇的座標系而定。他發覺,愛因斯坦選了一個本身就在波動的座標系,難怪會誤以為有波產生。也就是說,那是人工的數學操作造成的,並不是真正的波。但是話又說回來,愛因斯坦解出的第三種重力波就不一樣了,愛丁頓證明它不管在哪個座標系都以光速行進,所以沒有排除這真的是重力波的可能。

根據廣義相對論,兩個中子星或黑洞互繞,可以產生重力波,圖/by R. Hurt/Caltech-JPL。

後來,愛因斯坦自己也認為世界上不存在重力波了。1936 年,已經來到普林斯頓的愛因斯坦,投稿一篇文章到《物理評論》、準備要說明重力波並不存在。期刊編輯將文章拿給哈沃德‧羅伯森(Howard Roberson)審閱,並將其反駁的意見寄送給愛因斯坦。愛因斯坦立刻翻臉:怎麼可以未經作者同意,在出版前把文章內容拿給其他學者閱讀?

-----廣告,請繼續往下閱讀-----

然而不久之後,羅伯森的意見徹底動搖了愛因斯坦。這是由於愛因斯坦正好換了新的研究助理,助理和羅伯森針對重力波的問題討論了一陣子,並將意見轉知愛因斯坦。這時愛因斯坦已經在普林斯頓排好一場演講,題目就是「重力波不存在」,這下事情大條了!

愛因斯坦承認自己犯下錯誤,卻來不及取消演講,於是在演講上這樣說:

「如果你問我有沒有重力波,我必須回答:『我不知道!』」

真是驚天一語,二十世紀最偉大的物理學家之一,終究對重力波的問題困惑不解。

開始尋找重力波的蹤跡

愛因斯坦的時代過去了,但是他留下的神祕預言,仍然困惑著物理學家。

-----廣告,請繼續往下閱讀-----

直到 1956 年,菲立克斯‧皮拉尼(Felix A. E. Pirani)提出了一套數學形式,可避開愛因斯坦煩惱甚久的座標系轉換問題,說明重力波的存在。1957 年則是重力波理論的關鍵時刻,史上第一次針對重力波的會議——教堂山會議(Chapel Hill Conference)召開了。會議上,理查‧費曼(Richard Feynman)提出了「黏串珠」假想實驗,說服了許多物理學家,相信重力波真的存在。

馬里蘭大學教授約瑟夫‧韋伯(Joseph Weber)也出席了教堂山會議。會後,他決定開始動身尋找重力波。1966 年,他設計出一種尋找重力波的儀器,在相隔一千公里的兩個真空室裡各懸掛一個大鋁管,測量鋁管的震動。幾年後,他號稱收到了重力波的訊號。不過很快地,其他科學家證實他的實驗結果是錯誤的。

約瑟夫‧韋伯是第一位動身製作重力波探測儀器的科學家。 圖/by Special Collections and University Archives, University of Maryland Libraries。

直接探測重力波踢到鐵板,不如旁敲側擊吧!1974 年,拉塞爾‧赫爾斯(Russel Hulse)和約瑟夫‧泰勒(Joseph Taylor)首度發現「雙中子星」系統。這個天體名稱為 PSR B1913+16,是兩個大約都是 1.4 倍太陽質量的中子星,互相繞轉而構成。他們發現,兩個中子星互繞的週期越來越短,也就是它們彼此越靠越近、越轉越快!

為什麼兩個中子星越靠越近呢?顯然是有能量釋放出去了。把愛因斯坦的廣義相對論搬出來一算,雙中子星系統釋放能量的功率,竟然與重力波釋放能量的功率一致!這就表示,雙中子星互繞,很可能是透過重力波釋放能量,於是越靠越近。這項發現間接證實了重力波存在,也讓赫爾斯與泰勒在 1993 年奪得了諾貝爾物理學獎。

-----廣告,請繼續往下閱讀-----
1993年諾貝爾物理學獎得主,左為拉塞爾‧赫爾斯(Russel Hulse),右為約瑟夫‧泰勒(Joseph Taylor),圖/作者提供。

雷射光干涉儀技術——尋找重力波的一道曙光

你以為得了一次諾貝爾獎,尋找重力波的故事就結束了嗎?科學家可不是這樣就罷休了。

這個故事又說來話長。在約瑟夫‧韋伯的實驗之後,有一些科學家試著改進韋伯的儀器,另外有些科學家考慮利用一個新方法,來直接偵測重力波,那就是「雷射光干涉儀」。

干涉儀是什麼玩意兒呢?利用分光鏡,可將一道光線分成兩束,其中一束光往北邊走,另一束光往東邊走。如果我們在兩道光束行走的路上,分別放個鏡子,那這兩束光就都可以「浪子回頭」,回來相遇、重逢。因為光線有「波」的性質,兩束光相遇的時候,它們的振幅可以相加,結合成一道光,這稱為「干涉」現象。

干涉儀基本構造,圖/LIGO 網站圖片重製。

科學家要仔細校準儀器,讓兩道光束行經的距離相同,於是回來相遇那一刻,我的波峰就會正好對上你的波谷,兩道光束恰好抵銷,偵測不到任何光。但是如果某一方向光束行經的距離被拉長,那打回來的光線,波峰沒辦法剛好對上波谷了,「干涉」後的光線就會被偵測到。這就好比兩塊相鄰的拼圖,位置恰好對了就可以拼上,但是位置稍微偏掉一點,就拼不上了。如果利用偵測器,測量干涉後的光線的變化,就能得知光束行經距離如何被拉長。

-----廣告,請繼續往下閱讀-----
  • 影片說明:如果空間被重力波扭曲,干涉儀可以偵測到訊號。

假使沒有人為操縱,在什麼情況下,兩道光束行經距離會變得不一致呢?重力波可以辦到這件事。重力波通過時,會反覆讓空間變形,例如先把南北方向空間拉長,東西方向空間縮短;接著把東西方向空間拉長,南北方向空間縮短。這些變化實在太微弱,一般來說,讓空間伸縮的比例大約只有 10 的負 21 次方。但是如果能把光束行經的距離拉到夠長,同樣伸縮比例相應的實際長度變化就夠大,那就有機會測出重力波的訊號。

科學家發覺,利用雷射光干涉儀,有望做出高靈敏度的偵測儀器。

索恩沒訂到旅館,反而促成偉大計畫誕生

事實上,韋伯也有考慮過干涉儀的方法,不過沒有親自實行。第一個付諸實行的是羅伯特‧福沃德(Robert Forward),他在 1971 年設計出第一個用來偵測重力波的雷射干涉儀。福沃德的論文中提到,他受到萊納‧魏斯的幫助。

萊納‧魏斯就是 2017 年諾貝爾獎得主之一。在 1970 年代,他就積極研究建造探測重力波的雷射干涉儀。起初,他在麻省理工學院可利用軍事經費建造儀器。然而,不久之後,美國嚴格限制軍事經費的運用範圍,魏斯也就沒錢建造儀器了。經過幾番波折,魏斯才得到研究經費,繼續研究重力波的偵測儀。

魏斯還做出一項重要的貢獻,他在一個巧合的機緣下,將基普‧索恩「推坑」成功。沒錯,這位索恩教授,就是催生電影《星際效應》的那位索恩教授。他不但因為電影一炮而紅,現在還成了諾貝爾獎得主。

-----廣告,請繼續往下閱讀-----
基普‧索恩是《星際效應》的科學顧問,如今還成了諾貝爾獎得主,圖/作者提供。

1975 年,在華盛頓特區有一個學術會議,由於遊客太多,索恩沒有訂到旅館,魏斯就讓索恩跟他合住一房。那個晚上,他們兩人徹夜未眠、暢談宇宙。經過這一晚,索恩便決定在加州理工學院展開雷射光干涉儀的重力波探測。

索恩是理論科學家,他需要實驗科學家的幫忙,才能夠把儀器建造起來。於是,索恩找了朗納‧德瑞福(Ronald Drever)到加州理工學院。附帶一提,德瑞福 2016 年和魏斯、索恩共同獲得天文學極高的榮譽「邵逸夫獎」,但可惜在 2017 年 3 月,諾貝爾獎頒發給魏斯等人的幾個月之前,德瑞福已經離開人世。

1980 年前後,魏斯的團隊,以及索恩、德瑞福的團隊,分別獨立進行雷射光干涉儀的研究,都發展出能夠提高靈敏度的技術。不過,真正要建造能夠派上用場的大型儀器,需要大量的經費,美國政府不可能同時批准兩個團隊的研究計畫。於是,兩個團隊開始磨合,最後整合為「加州理工——麻省理工」合作計畫,計畫名稱就定為 LIGO。

LIGO 計畫開始之初,進展並不是很順利。魏斯與德瑞福經常意見不合,由索恩從中調停。到了 1992 年,德瑞福黯然離開 LIGO 團隊。1994 年,同樣在今年獲得諾貝爾獎的巴里‧巴利許,取代羅克斯‧沃格特(Rochus Vogt),出任計畫主持人。他是一個富有行政經驗的人物,於是重新將 LIGO 計畫整頓,並且爭取到不少經費。

-----廣告,請繼續往下閱讀-----

巴利許的計畫分成兩個階段。第一階段是「初始」的計畫「iLIGO」,試驗儀器,並一點機會偵測到重力波;第二階段是「進階」計畫「aLIGO」,這時候的儀器就很有機會偵測到重力波。第一階段計畫從 2002 年運作到 2010 年,並沒有偵測到任何一次重力波事件。2010 年,設備開始升級,耗費了 5 年的工程。

LIGO 在華盛頓的觀測站。圖/by Caltech/MIT/LIGO Lab。

大事總在意想不到的時間來臨

2015 年 2 月,進階版本「aLIGO」終於測試階段,預計 9 月 18 日正式啟用。沒想到,人算不如天算,就在正式啟用前四天,9 月 14 日,大事發生了!

那時候,LIGO 團隊成員忙著做最後的測試,忙到凌晨 4 點才回家。就在當地時間凌晨 4 點 50 分,重力波的訊號悄悄通過 LIGO 的偵測器。

發生在正式啟用前四天,這個時間實在太巧了!科學家們一開始直覺認為,這顯然是團隊中有人設定的測試訊號。因為在 LIGO 團隊中,少數人士有權力暗中放入人工訊號,來測試大家收到訊號時反應。既然團隊準備正式上工了,放個逼真的測試訊號,誰也不覺得奇怪吧?

但是 LIGO 團隊的科學家知道,人工的測試訊號一定會在數據中露出馬尾。經過一整天的分析、討論,確認找不到任何人為操作的蹤跡,他們終於開始相信,那可能真的是重力波的訊號,也就是失落的聖杯,終於找到了!

不過,他們決定讓改裝好的 LIGO,正式運作一個月,再來綜合分析觀測到的資料。在研究成果發表之前,團隊要對這個重大消息保密。索恩說,那天他意識到,自己 40 年的夢想成真了,但是晚上回家,他唯一的慶祝方式,是對著自己微笑——因為這項機密消息,那時連自己的老婆都不能說。

百年追尋,終於證實重力波存在

2016 年 2 月 11 日, LIGO 終於宣布重大消息——愛因斯坦廣義相對論預言的重力波,他們真的找到了!

2016 年 2 月 11 日,LIGO 正式宣布找到重力波,魏斯與索恩擁抱慶祝。圖/by Kathy Svitil/Caltech。

首次發現的重力波事件,依照日期命名為「GW150914」。LIGO 在路易斯安那與華盛頓的兩個觀測站,都接收到此事件,並且經過嚴格的科學檢驗,證實不是其他因素造成的訊號。科學家分析這些訊號,發現和愛因斯坦的理論預測完全吻合!

LIGO 的兩個觀測站,皆偵測到 GW150914 的訊號。圖/LIGO。

經過推算,這次重力波事件,應來自兩個黑洞相撞。兩個分別為 36 和 29 倍太陽質量的黑洞,越靠越近,最後相撞、合併在一起。黑洞的合併過程,扭曲附近的時空,放出重力波。這道重力波在宇宙中行走了 13 億年,終於被地球人捕捉到。

重力波天文學的故事正要開始

有關重力波的第二次諾貝爾獎到手,故事結束了嗎?沒有,而且這只是故事的開端。

現在,重力波成為科學家研究宇宙的有用工具。隨著 LIGO 的成功發展,「重力波天文學」誕生了。偵測到重力波,不僅是驗證愛因斯坦的偉大預言,還揭露了意想不到的現象:怎麼會出現這麼大的黑洞?怎麼會有兩個黑洞這麼麻吉,硬要繞著彼此轉,變成「雙黑洞」系統?

  • 影片說明:電腦模擬兩個黑洞的合併。

LIGO 至今已經偵測到五次重力波事件。2017 年 10 月 16 日公布的 GW170817,是首度找到的雙中子星對撞的重力波事件。而且,這起重力波事件,與 1.7 秒後發生的「伽瑪射線爆」GRB170817A,應該是來自同一事件。

重力波與光線,可以看到同一起雙中子星對撞事件的不同面向,圖/作者提供。

GW170817 的重大意義,是人們首度接收到重力波事件相對應的光線。這意味著我們「看」到了重力波的來源,眼見為憑,它「是真的」!此外,科學家研究這次事件,證實中子星合併可以產生貴金屬,而這種「千倍新星(kilonova)」事件,很可能就是宇宙中的煉金術師,「係金ㄟ」!

我們相信,重力波的觀測還會造就更多勁爆的消息,故事才剛開始而已,下集待續。

參考資料

  1. Castelvecchi, D. “Gravitational waves: How LIGO forged the path to victory.” Nature 2016, 530, 261-62.
  2. Castelvecchi, D.; Witze, A. “Einstein’s gravitational waves found at last.” Nature News. doi:10.1038/nature.2016.19361. Retrieved 20 October 2017.
  3. Cervantes-Cota, J.; Galindo-Uribarri, S.; Smoot, G. “A Brief History of Gravitational Waves.” Universe 2016, 2, 22.

 

-----廣告,請繼續往下閱讀-----
文章難易度
歐柏昇
13 篇文章 ・ 6 位粉絲
台大物理與歷史系雙主修畢業,台大物理碩士。現為台大物理系、中研院天文所博士生,全國大學天文社聯盟理事長。盼望從天文與人文之間追尋更清澈的世界觀,在浩瀚宇宙中思考文明,讓科學走向人群。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

0
0

文字

分享

0
0
0
缺席的普拉修,2008 年諾貝爾化學獎第 4 位得主 (3)
顯微觀點_96
・2025/03/13 ・3195字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自顯微觀點

圖/顯微觀點

科學:一場每天進行的淘汰賽

在以錦標賽理論(tournament theory)運作的專門領域中,贏家獲得的獎勵將遠超出輸家,即使兩者的實際表現、累積貢獻僅有毫釐之差。就像奧運百米賽跑,0.005 秒決定了金牌與銀牌,只慢了 0.01 秒的第四名沒有資格出現在頒獎台。

諾貝爾獎、終身職制度、學術獎金、研究計畫的經費審核,也依照近乎贏者全拿的錦標賽理論運作。錦標賽制度在運動賽事中可以促進選手與隊伍不斷提高表現水準,但在科學領域呢?

諾貝爾獎作為額外的最高榮譽,嚴格維持其傳統限制(獎項最多由 3 人共享、僅頒發給在世者),許多傑出科學家成為遺珠,但這不阻礙他們在專業領域得到足以安心的資源,作出重要貢獻。

-----廣告,請繼續往下閱讀-----
2008nobel Prize Group Photo 2
2008 年,諾貝爾獎得主合照。左一為錢永健,左二為下村脩,左四為查菲。普拉修曾想像自己置身其中,並得到更光明的學術前途。Courtesy of Nobel Prize website.

但是,目標包含鼓勵尖端學術研究、探索重要問題的學術終身職制度與計畫審查系統,它們的錦標賽特質卻在普拉修身上呈現負面效果。

若說錦標賽模式的獎勵機制可以鼓勵科學家投入潛力豐厚的研究題材,以及努力實踐靈感的能力。那麼普拉修和查菲一樣,及早意識到能夠獨立發光的 GFP 是生物學研究的金礦,可以用來追蹤活體細胞中的基因與蛋白質表現。而且普拉修更早著手研究,優先踏上 GFP 基因轉殖的跑道。

「要是我們在普拉修完成 GFP 序列後馬上展開合作,他應該不需要離開伍茲霍爾。」
說起自己與普拉修在 1989 年到 1992 年之間的失聯,查菲如此猜測

查菲和錢永健之所以能夠找到普拉修,搶先實現 GFP 應用(當時有其他競爭團隊在研發細胞內的螢光標記),是因為當時網路快速發展,使美國國家醫學圖書館(NLM)的線上文獻查詢系統 Medline 在 1992 年進入大學圖書資訊系統,他們才能起身實踐靈感,唾手找到普拉修的最新研究。

就普拉修的運氣來說,網路卻發展得不夠快。在 1990 年代中期開始流行的電子郵件若早個幾年普及化,普拉修更可能維繫與查菲的合作,及時得到經費與GFP轉殖成果,並晉升終身職。

-----廣告,請繼續往下閱讀-----

當年普拉修的電話留言渺無回音,他以為查菲退出學術圈(查菲年輕時確實曾刻意遠離科學)。而查菲則猜測普拉修挫敗於GFP基因選殖,連個通知都沒有。在網路、電子郵件還不普及的 1990 年,要維持與合作者的聯繫需要付出更多心力與時間。通訊的困難與少許不足的人際積極性,導致兩年的延遲發表,讓普拉修耗盡研究經費與終身職的機會。

查菲的gfp線索筆記
查菲的 GFP 線索筆記,普拉修出現在右下區,線索的末端。他的前雇主科米爾、GFP 純化者下村脩(Shimomura)也出現在上方。查菲在回憶錄中說,這些線索引導他實現後來的成就。Courtesy of M. Chalfie

查菲團隊實現 GFP 基因轉殖的時候,實驗室裡甚至連一台螢光顯微鏡都還沒添購,他們必須和其他學者借用、排隊等候系所共用的共軛焦顯微鏡,才能觀察大腸桿菌與線蟲體內新生的螢光。後來,查菲多次要求顯微鏡供應商帶螢光顯微鏡來提供「試用」,團隊才得以更便利地檢驗轉殖成果。

GFP 的應用需求,大力刺激光學顯微技術的進展。它最早期的轉殖實驗成果,竟是由免費試用的螢光顯微鏡呈現。這聽起來是令人莞爾的科學史軼聞,但能夠靈活周轉的人脈、儀器,也是孤立的普拉修和著名大學教授查菲的學術資本落差之一。

透過改變訓練技巧與累積訓練量、最大化優勢、競賽當下的意志與觀察力,運動員偶有逆轉資本落差的機會,以黑馬之姿獲勝。但是在學術領域,研究題材的重要性與個人的才華、執行能力卻不像跑道上的衝刺秒數一樣清晰。

-----廣告,請繼續往下閱讀-----

「他們大可以把我從諾貝爾獎名單去掉,換上普拉修。」
查菲總是對媒體表示,普拉修的貢獻不可忽視

在科學這個由同儕評價定勝負的錦標賽中,多數科學家難以逆轉經費、人脈等資本差距,也很難讓不同領域的專家了解自己的研究重要性,只能努力支撐、累積資本,期待自己贏得經費與知名度的時刻。等待運氣與環境好轉的餘裕,得以截長補短的經濟與社會資本,卻正是學術領域錦標賽中多數年輕科學家所缺乏的。

落敗的運動員至少獲得在競賽中表現的機會,以及某個程度的肯定。論文發表日期稍微落後競爭對手的科學家,則連努力被看見的機會都非常稀少。

普拉修與諾貝爾化學獎失之交臂、鬱鬱不得志的職涯是段引人喟嘆的個人史,並非科學體系的挫敗。他只是科學錦標賽持續依照慣例淘汰的諸多優秀人才中,有幸被贏家們提及的一位。

比普拉修年輕一歲,學術晉升之路卻順暢許多的錢永健曾說,「下村脩和普拉修對 GFP 研究的貢獻是無可取代的。」而且在普拉修 1992 年發表 GFP 基因的純化與定序,並且樂意對任何人分享之後,

-----廣告,請繼續往下閱讀-----

「後面那些以研發 GFP 獲得榮譽的人,與其他人的不同可能只有些微的進度落差。」

錢永健在 2004 年至 2008 年之間,積極地建議諾貝爾獎委員會頒獎給下村脩與普拉修,但結果並非如此。

生命中的萬花筒 陳樂融
源自錢永健開發的多種螢光蛋白,形成 brainbow 技術。作品名:生命中的萬花筒,作者:陳樂融 Courtesy of Taiwan顯微攝影競賽

後續發展

普拉修從斯德哥爾摩回到亨茨維之後,受到包括國家公共廣播電台(National Public Radio)、《科學》期刊、亨茨維時報等美國媒體關注。但在訪談與報導的熱潮過後,普拉修依然坐困時薪 8.5 美元的豐田接駁車裏頭。

從諾貝爾頒獎典禮的輝煌榮譽,回到乏味、有時不受尊重的駕駛座上,失落的普拉修不敢相信自己依然找不到科學研發相關的工作。他喪氣地想,「經歷了這一切,我竟然還是沒有辦法回到科學領域。這中間一定出了什麼錯。」

在最憂鬱的那天,普拉修一度把接駁車停在路邊,撥號向亨茨維自殺防治熱線求助。過不多時,他在 2010 年找到科技研發的職位,2012 年他接受錢永健的提議,進入他的實驗團隊擔任研究員。重新在一個充滿支持與資源的環境投入科學研究,讓普拉修再度感到生活的動力與快樂。

-----廣告,請繼續往下閱讀-----

2016 年錢永健逝世,實驗團隊解散,而普拉修在前一年就已離開 UCSD,從此沒有留下任何公開痕跡。曾被自殺防治熱線的機械式留言激怒到啞然失笑,決定繼續活下去的普拉修今年已經 73 歲,科學錦標賽的勝負再也不能困擾他,但科學思考帶給他的樂趣或許能夠不斷更新。

Prasher In Ucsd
普拉修在錢永健實驗室的照片。讓他對人生更加滿意的不是體面的加州大學聖地牙哥分校制服,而是可以實現對科學的好奇與想像,並得到周遭的支持。Courtesy of San Diego Union Tribune

延伸閱讀:

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

顯微觀點_96
28 篇文章 ・ 5 位粉絲
從細微的事物出發,關注微觀世界的一切,對肉眼所不能見的事物充滿好奇,發掘蘊藏在微觀影像之下的故事。

0

0
0

文字

分享

0
0
0
缺席的普拉修,2008 年諾貝爾化學獎第 4 位得主 (2)
顯微觀點_96
・2025/03/06 ・2645字 ・閱讀時間約 5 分鐘

本文轉載自顯微觀點

圖/顯微觀點

科學遠見的現實基礎

儘管 GFP 基因定序研究在 1992 年受到查菲和錢永健重視,普拉修卻已經決定轉換跑道,停止在伍茲霍爾海洋研究所的苦悶掙扎。他向所內評審委員會提出中止審核,放棄晉升,並將在一年內離職。

延伸閱讀:缺席的普拉修,2008年諾貝爾化學獎第4位得主(1)

當普拉修把查菲和錢永健要求的 GFP 基因樣本送到,他一面感到終結的哀傷,一面認知到「不問報酬地把 GFP 基因交棒給其他人,是當下最合理的選擇。」尤其是像自己這樣使用公共經費進行研究的學者。

除了對社會的責任感,普拉修也意識到學術現實面,研究資源充沛的成功學者,更有機會實現GFP的潛力。在知名大學任教的查菲和錢永健已在各自領域中奠定名聲,更容易申請經費。而且他們可以用既有經費支應 GFP 轉殖實驗的開銷,不需要特意申請高門檻的 GFP 獨立經費,更不會落到像普拉修一樣,經費耗盡還慘澹經營 GFP 基因選殖一整年。

-----廣告,請繼續往下閱讀-----

此外,查菲和錢永健還有研究生和博士後研究員的充沛學術勞動力,而普拉修則總是獨力進行所有研究勞動。孤立、勞累而缺乏成就感,普拉修沒能成功以綠色螢光照亮細胞生理,也無法驅散他自己周遭的職業陰霾。

查菲能在 1992 年重新連繫上普拉修,是因為查菲向研究生尤斯克亨(Ghia Euskirchen)感嘆,普拉修從未回報 GFP 的基因選殖成果,或許是個難以成功的任務。

查菲與完成第一個線蟲螢光基因轉殖的四人團隊 1
查菲回憶錄中列出為 GFP 基因轉殖技術做出巨大貢獻的四人團隊,左上為普拉修,右上為尤斯克亨,下方兩位是接替尤斯克亨進行 GFP 轉殖實驗的技術人員。Courtesy of M. Chalfie

尤斯克亨當下便和查菲一起打開實驗室電腦,用剛安裝的線上論文資料庫 Medline 搜尋相關文獻。他們不可置信地在搜尋結果第一位看見普拉修的 GFP 基因選殖論文,接著飛奔到圖書館尋找實體期刊,在上面找到普拉修的電話,重新建立聯繫。

在查菲的指導下,尤斯克亨只花一個月就完成了大腸桿菌的 GFP 轉殖,成為第一個螢光轉殖生物的拍攝者。接著,查菲團隊順利地讓線蟲的神經細胞表現綠色螢光,證明 GFP 可以在不同生物體內獨立發光,無須其他來自水母的分子。微觀生物學的未來一片光明。

-----廣告,請繼續往下閱讀-----
199210.14 第一張螢光大腸桿菌照片
1992 年 10 月 14 日,尤斯克亨拍下第一張螢光大腸桿菌照片。當時查菲還沒準備好觀察成功轉殖的螢光樣本,尤斯克亨只好到以前待過的實驗室借用螢光顯微鏡。Courtesy of M. Chalfie

錢永健則是透過與同儕的討論,知道生命科學仍然缺乏合適的螢光標記蛋白,進而在 UCSD(加州大學聖地牙哥分校)新安裝的 Medline 資料庫上搜尋「綠色螢光蛋白」,驚訝地發現普拉修的論文摘要。和查菲一樣,錢永健衝進圖書館影印實體論文,並馬上連繫普拉修,比查菲更早確保 GFP 基因序列的樣本。

查菲團隊轉殖 GFP 的同時,錢永健團隊建構出多種 GFP 變異體,人類開始以不同螢光蛋白觀察細胞內部運作。兩個團隊的成果啟動了學術界和生技產業洪流般的關注與需求,錢永健團隊甚至設立了自動化的樣本供應網頁,只要填寫線上申請書,錢永健實驗室就會無償將螢光蛋白基因載體寄送到府。

值得一份晚餐,或是更多

接下來的十多年,GFP 相關蛋白照亮細胞內的奧秘,成為「生化研究的領航星」,並帶領研發者邁向諾貝爾化學獎。而捨棄 GFP 研究的普拉修,則像是失去指引一般,不僅沒能獲獎,更經歷了顛簸困頓的人生苦旅。

離開伍茲霍爾海洋研究所,普拉修在美國農業部轄下獲得分子生物學技師職位。在政府機構經歷職場摩擦、調職搬遷,使緊繃難熬的氣氛瀰漫普拉修全家之後,他前往亨茨維應徵 NASA 承包商的工程師職缺。在火箭城研發太空診斷器是讓普拉修覺得相對有趣的任務,經費短缺卻再次扼殺了他的期待。

-----廣告,請繼續往下閱讀-----

NASA 在 2006 年裁減生命科學研究經費,普拉修因此被裁員,轉而成為接駁車司機。他在駕駛座上友善健談,意外發現自己其實喜歡工作中和陌生人互動的部分。但是 8.5 美元的時薪讓他入不敷出,連他和查菲共享的 GFP 專利金都在幾年內消耗殆盡。

1994 F Science Gfpcover
1994 年 2 月 11 日發行的《科學》採用查菲團隊的 GFP 線蟲做為期刊封面,象徵螢光蛋白普照分子生物學的光明時代開端。此圖片也收錄在查菲的 GFP 回憶錄《點亮生命》(Lightung Up Life)中。相反的是,普拉修的生涯似乎始終不被綠色螢光照耀。Courtesy of M. Chalfie

儘管事業成果的對比相當符合美國媒體對「不公平」題材的嗜好,普拉修不曾在訪談間表現對查菲和錢永健的嫉妒。

2008 年 10 月 8 號早餐之前,普拉修聽到三位科學家因為 GFP 獲得諾貝爾化學獎,他若無其事地換上灰色制服前往公司開車。不過,上班前他打了通電話到當地電台,糾正他們對錢永健姓氏的發音。

查菲和錢永健在諾貝爾獎致詞與回憶錄中,不約而同地感謝普拉修的研究貢獻,錢永健更經常提供普拉修回到學術領域的工作機會。不願接受研究職位作為恩惠、從斯德哥爾摩回到亨茨維開接駁車的普拉修則笑說「如果他們來到亨茨維,該請我吃頓晚餐。」

-----廣告,請繼續往下閱讀-----

「他們總是有提到我的功勞,而且他們有傑出的科學事業,完成重大貢獻之後,繼續發展他們傑出的科學事業。」普拉修一向對媒體表示,查菲和錢永健是更值得諾貝爾獎的人選,而非中輟離開科學領域的自己。

Imagej=1.53t
發源於 GFP,透過多種螢光蛋白混雜表現而成的 brainbow 技術,是研究生物修復傷口、更新組織時的重要工具。作者: Marco de Leon from Taiwan 顯微攝影競賽

但是,普拉修並非真正「離開」科學領域。他結束 GFP 研究後,不論在政府機構或私人企業,依然從事超過十年的科學相關工作,並作出實際貢獻。相對於逃離科學,他其實是被不理解 GFP 潛力的終身職審查委員會給排除,被迫離開「高賭注的尖端學術領域」(high-stakes academic science)。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

顯微觀點_96
28 篇文章 ・ 5 位粉絲
從細微的事物出發,關注微觀世界的一切,對肉眼所不能見的事物充滿好奇,發掘蘊藏在微觀影像之下的故事。