Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

幾何學難題大突破!高維等角直線叢研究備受矚目

UniMath_96
・2017/07/25 ・5048字 ・閱讀時間約 10 分鐘 ・SR值 563 ・九年級

文/陳宏賓|UniMath 主編、逢甲大學應用數學系助理教授

圖/UniMath 提供

大約七十年前開始,有個和直線有關的離散幾何問題吸引了數學家的目光。你可能心底想,直線不就那樣,還能有什麼神祕嗎?嗯,有的。今天要和各位讀者分享的直線們有一些特別之處,那就是:

1. 全部都通過原點

2. 任意選取其中兩條直線,它們的夾角都是一樣的。

這樣一堆直線的集合就稱為「等角直線叢」(Equal-Angle Lines or Equiangular Lines)。

舉最簡單的例子(如下圖)來說,二維平面上正六邊形的 3 條對角線, 它們兩兩夾角都是 60度(或 120 度)。二維平面上,3 條線是最多的等角直線叢嗎?答案挺顯然的,Yes!

-----廣告,請繼續往下閱讀-----
二維平面上正六邊形的 3 條對角線, 它們兩兩夾角都是 60度(或 120 度)。二維平面上,3 條線是最多的等角直線叢。圖/UniMath 提供

不過,三維的情況就沒有那麼容易想像。數學家已經證明三維空間最多就是 6 條,它們是正二十面體的十二個頂點所構成的 6 條對角線。這 6 條對角線恰巧形成等角直線叢,夾角是 arccos (1/√5),大約是 63 度左右,請見下方影片。

視訊播放器
視訊播放器

超越想像極限的更高維度,就交給幾何學吧!

很自然地,人類的好奇心會驅使我們去探索未知的四維、五維空間,甚至去想像更高維度的情況究竟是如何呢?這就是離散幾何領域經典的等角直線叢問題。

不幸的是,高維度的情況無法用視覺化的方式呈現出來,某些程度阻礙了數學家透過空間感去想像其可能的分佈型態。不過,這並不足以令數學家退縮。

數感敏銳的讀者可能也已經隱約感覺到,形成最多的等角直線叢可能有以下兩項性質:

-----廣告,請繼續往下閱讀-----

1. 高度對稱性結構

因為要找最多,直覺上有規律地適當安排在整個空間中應該比較有機會。這個特質除了滿足幾何學家對於美的追求、以及出於數學的純粹好奇心之外,這些具有對稱性且同時通過原點的直線們,恰好也會在一個球體表面穿插出一些兩兩距離相等的點,對應到應用數學領域和資訊領域裡一個重要的研究主題--《球形碼 Spherical Codes》,讓這道古典離散幾何問題的重要性被凸顯出來。

2. 維度越高數量越多

直覺上我們會認為數量必定會隨著維度(嚴格地)增加;然而,事實卻並非如此。早在 1948 年數學家 Haantjes1就證明了三維與四維最多的等角直線叢都是 6 條。換句話說,維度增加並不一定會增加等角直線叢的最大數量。

後來,范林(Van Lint)與西德爾(Seidel)2證明了五維到七維的結果。稍後,1973 年雷蒙斯(Lemmens)與西德爾3開創性地引入《線性規劃 Linear Programming》的手法,一口氣把戰線推進到 23 維以內,他們當年的結果整理如下表:

舉例來說,十四維已經有 28 條等角直線叢的構造,但不知道 29 條是不是可以達到,意即,數學證明 30 條以上是不可能的。所以,我們說十四維空間的等角直線叢數量最多介於 28 到 29 之間。

-----廣告,請繼續往下閱讀-----

一個有趣的地方是,三維及四維都是最多 6 條,七維到十三維,都是最多 28 條。一般來說,維度越高越有更多機會造成更多條等角直線叢,但七到十三的維度變化不算少,最大值 28 卻聞風不動。專家們認為,這樣的現象在更高維度也會發生。

雷蒙斯與西德爾的文章裡,提到另一位數學家葛松(Gerzon)發現:等角直線叢的最大數量會受限於維度。他用《線性代數》裡大家一般熟悉的方法計算得出了一個通用的上界:

任意維度 n,等角直線叢的最大數量不超過 n(n+1)/2 。

例如 n = 7 和 23 的時候,最大值分別是 28 和 276,恰好達到這個上界。

年輕台灣博士與美國教授合作,突破四十年障礙

然而二十四維以上的進展,卻沉寂了將近 40 年之久。直到 2014 年,一位來自台灣的年輕數學博士俞韋亘(Wei-Hsuan Yu)和他的合作者巴格教授(也是他的博士班指導教授 Alexander Barg)4對這道難題有了新的進展。

-----廣告,請繼續往下閱讀-----

俞韋亘目前於美國的密西根州立大學從事博士後研究工作。大學就讀新竹清華大學數學系的他,畢業後前往臺灣師範大學攻讀碩士,得到碩士班指導教授林延輯以及許多老師在數學研究上的啟發和鼓勵,後來前往美國馬里蘭大學繼續攻讀博士學位,邁入更高的學術殿堂。

俞韋亘博士與 Alexander Barg 教授合影。圖/UniMath 提供

解決問題需要有好的工具,2014 年這篇文章也不例外。他們首度引入運籌學領域的一種高端工具「半正定規劃」(Semidefinite Programming, 簡稱 SDP),藉此證明了二十三維到四十一維最多都是 276 條,印證了雷蒙斯與西德爾在 1973 年的想法。

一般來說,數學證明等號有兩個方向需要努力,也就是所謂上界(upper bound)和下界(lower bound):
當維度 n 固定,構造出等角直線叢就會得到一個下界,內含直線的數量越多,得到的下界就越好。例如,在二十三維空間中,數學家從 276 個點的強正則圖(strongly regular graph)獲得啟發,找到構造 276 條直線的等角直線叢的方法,提供了 276 是二十三維等角直線叢最大數量的下界。

另外一個方向是,當維度 n 給定,用數學證明等角直線叢數量有其上限,不能再更高了。這就是所謂的上界。

-----廣告,請繼續往下閱讀-----

俞博士和巴格教授4的突破就是利用 SDP 證明了二十四維到四十一維的上界恰好是 276 條。由於二十三維空間中已經有 276 條線的構造法,上下界碰在一起,於是就證明了從二十四維到四十一維,276 條等角直線叢就是最多的了。

證明等角直線叢的唯一性

坂內(E. Bannai)與斯隆(N. Sloane)在 1981 年5證明二十三維最大數量的 276 條等角直線叢具有唯一性。也就是說,這 276 條的長相只有一種。既然前面提到 23 維到 41 維也都是 276 條,一個很自然的問題就是,那 24 維到 41 維的 276 條有沒有其他異於二十三維的構造法呢?俞博士和另一合作者葛雷茲林 (A. Glazyrin )在半年前得到了一個令人驚奇的結論6

二十三維到四十一維的 276 條都是同一種構造。

同時,他們也證明了七維到十一維的 28 條,都是同一種構造。
至於十二維與十三維到底有沒有另外一種不等價的 28 條等角直線叢,目前仍是待解決的問題。

當角度不隨著維度變動

事實上,俞博士和葛雷茲林的論文中也探討了另一個觀點上的等角直線叢。

-----廣告,請繼續往下閱讀-----

上述的最大數量規模可以達到 n2 的等級,不過達到這個數量規模的等角直線叢所夾的角度也會跟維度 n 有關(arccos (1/√n))。因此,就很自然會去思考固定角度(與 n 無關)之下,在 n 維歐氏空間的等角直線叢的最大數量規模是否會小於 n2 ?

1973 年雷蒙斯和西德爾的論文裡,首度給出這個方向的結果;對於夾角 arccos(1/3),等角直線叢的最大數量就是 2n-2 條。[補充:正四面體的四個頂點與中心點的連線那四條線是等角直線叢,夾角正是arccos(1/3)。學化學的人可以想像甲烷 CH4  的分子結構,四個氫原子鍵結碳的兩兩夾角也是arccos(1/3)]

甲烷(CH4)的立體模型,為正四面體。圖/Wikimedia Commons

又再隔 16 年,紐邁爾(A. Neumaier)證明:如果角度是 arccos (1/5),則最大數量規模是 1.5 n 條,前提是維度 n 要足夠大(sufficiently large)。

對於其他角度,多年來人們知道的很少,數學家一直苦無對策突破。直到去年 2016 年六月,任職於瑞士理工大學的知名組合數學家蘇可達夫(Benny Sudakov,Noga Alon 的學生) 以及英國牛津大學數學系教授齊瓦胥(Peter Keevash,Sudakov 的學生)為首的研究團隊,開創性地引入「機率」、「圖論」、「拉姆西理論」、「代數」等多種數學分支的工具,摻在一起得到一個極具指標性的重量級突破。先說結論,他們的主要結果是:

-----廣告,請繼續往下閱讀-----

對任意給定角度,當維數 n 足夠大,最多就是 2n-2 條等角直線叢;而且,能達到 2n-2 條的,只有當年雷蒙斯和西德爾所證明的 arccos(1/3) 這個角度。

蘇可達夫教授受訪時提到,自己是 2015 年聽卡內基美濃大學數學系的巴克(Boris Bukh)教授演講時,受到他的啟發才開始接觸這個問題。巴克在台上講述他在等角直線叢問題上的新進展時,提到自己用了一個「很醜陋」的方法來讓整個證明過得去,感覺就不是一個解決等角直線叢問題的好招式。

峰迴路轉,柳暗花明

蘇可達夫與齊瓦胥教授的研究團隊,依其利用數學分支工具的相關闡述如下:

圖論:點與邊之間關係的理論

最令人驚奇的創意在於蘇可達夫他們將等角直線叢這個幾何問題,轉換成圖論的語言,將空間中直線所對應的向量看成圖論裡的一個頂點。向量與向量的內積若是正的,給紅色邊;否則給藍色邊。這個轉換把高維空間中具有距離關係的幾何元素變成跟距離無關的圖論裡一個邊上塗兩種顏色的圖,提供數學家另一種完全不同的觀點來思考原始問題。

拉姆西理論

特別的是,經過轉換後,他們藉用圖論裡一個重要的研究主題--拉姆西理論( Ramsey Theory)來幫助規範紅色邊和藍色邊。拉姆西理論核心概念就是說,這樣塗滿兩種顏色的圖裡,總是會包含一定數量的頂點,彼此之間邊的顏色全部相同。打個比方,假設兩人之間關係只有「喜歡」和「不喜歡」兩種,在一個 50 人的團體裡,無論如何總是會找到 5 個人彼此互相喜歡或者彼此互相不喜歡。這麼一來,頂點的數量理論上就可以藉由拉姆西理論的概念來限制住。

矩陣

最後,他們將這樣子的一個圖再轉換成一種特別的矩陣來表示,矩陣中(i, j)位置填入的是第 i 個向量和第 j 個向量的內積值,然後就可以在上面玩一些矩陣的代數運算,也有相當豐富的矩陣理論可以派上用場。

研究等角直線叢問題多年的傑德瓦(Jonathan Jedwab)教授發表他對這項發現的看法時表示,我得知時的反應不是「懊悔為何自己沒有想到這個方法」,而是「老天爺啊!這群人擁有的數學工具也太多了吧。我認為他們最了不起的工作就是把這一卡車數學工具,一個接一個用在適當的地方。」

這個重要結果7引起國際上許多關注,國外知名媒體 Quanta Magazine 也寫了篇專題報導《 A New Path to Equal-Angle Lines 》,有興趣的讀者可以參考。

圖中為蘇可達夫。圖/Wikipedia

隔幾個月後,俞和他的合作者葛雷茲林教授6證明:當角度是 arccos (1/a),在 n 維歐氏空間中,等角直線叢的數量上界約是 0.66an。這是首度對於任意維數與任意角度的等角直線叢給出上界的結果。蘇可達夫團隊發表的論文裡的一般上界雖然只有 1.92 n,但前提是 n 必須要足夠大才會正確。至於 n 要多大?目前仍是未知!

俞與其合作者在等角直線叢發展出來的這套數學方法,同時也可以用來處理離散幾何領域「最大球面二距離集」問題。什麼是二距離集(two-distance sets) 呢?空間中的一些點,如果所有的點兩兩之間彼此的距離收集起來只有兩個不同值,那麼這些點我們就稱為二距離集。將這些點限制在單位球(unit ball)上,稱之為球面二距離集 (spherical two-distance sets)。「最大球面二距離集問題」即是在尋找最大的球面二距離集的相關研究。

俞韋亘受訪時說:「我近期最開心的工作,就是利用這套方法改進了無窮多維的等角直線叢上界,並用之解決了拓樸學家 Oleg Musin 教授一個關於球面二距離集的重要猜想 Musin Conjecture」。

還好奇到底哪裡找來這麼多數學問題給數學家研究嗎?解決一個問題的同時,就會產生新的問題。這就是數學。

後記:今年暑假俞韋亘博士將會短暫回到台灣,到位於台大公館校區的國家理論科學研究中心(簡稱理論中心)及中央研究院數學研究所進行學術交流,排定於 7/24 及 25 兩日演講等角直線叢與最大球面二距離集的相關問題,歡迎報名參加。上述演講由理論中心支持補助。演講資訊請參考理論中心官網

資料來源

  • 《A New Path to Equal-Angle Lines》,Quanta Magazine.

參考文獻

  1. J. Haantjes, Equilateral point-sets in elliptic two and three-dimensional spaces, Nieuw Arch. Wisk., 22 (1948) 355-362.
  2. J. H. van Lint and J.J. Seidel, Equilateral point sets in elliptic geometry Proc. Nedert. Akad. Wetensh. Series 69 (1966), 335–348.
  3. P. W. H. Lemmens and J. J. Seidel, Equiangular lines, Journal of Algebra 24 (1973), 494–512.
  4. A. Barg, W-H. Yu, New bounds for equiangular lines. Discrete Geometry and Algebraic Combinatorics, A. Barg and O. Musin, Editors, AMS Series: Contemporary Mathematics, vol. 625, 2014, 111-121.
  5. E. Bannai and N. J.A. Sloane, Uniqueness of Certain spherical codes, Can. J. Math., Vol. XXXIII, No. 2, 1981, pp. 437-449.
  6. A. Glazyrin, W.-H. Yu, Upper bounds for s-distance sets and equiangular lines, Arxiv: 1611.09479.
  7. I. Balla, F. Dr¨axler, P. Keevash, B. Sudakov, Equiangular Lines and Spherical Codes in Euclidean Space. Arxiv: 1606.06620.

本文轉載自 UniMath,《[離散幾何學突破]組合學大師與新秀分別出招,等角直線叢研究大躍進

作者簡介:陳宏賓 - UniMath 主編、逢甲大學應用數學系助理教授。
數學既深且廣,我懂得不多,最喜愛組合數學相關領域,主要研究興趣是群試理論、圖論及最優化分解。2013 年出版「Partitions: Optimality and Clustering, Volume II: Multi-Parameter」一書(與 Uriel Rothblum 和 Frank K. Hwang 教授合著)。對於數學和教育有強烈的熱忱和使命感,積極創立 UniMath 電子數學媒體,致力於推廣數學文化。

關於 UniMath:UniMath (You Need Math)是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。歡迎加入 Facebook 粉絲團知道第一手訊息!

-----廣告,請繼續往下閱讀-----
文章難易度
UniMath_96
9 篇文章 ・ 209 位粉絲
UniMath (You Need Math) 是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
225 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

30
1

文字

分享

0
30
1
民眾黨是未來台灣政治的樞紐?
林澤民_96
・2024/01/30 ・3382字 ・閱讀時間約 7 分鐘

一、前言

選後的立法院三黨不過半,但民眾黨有八席不分區立委,足以與民進黨或國民黨結成多數聯盟,勢將在國會居於樞紐地位。無獨有偶的是:民眾黨主席柯文哲在總統大選得到 26.5% 的選票,屈居第三,但因其獲得部分藍、綠選民的支持,在選民偏好順序組態的基礎上,它卻也同樣地居於樞紐地位。這個地位,將足以讓柯文哲及民眾黨在選後的台灣政壇持續激盪。

二、柯文哲是「孔多塞贏家」?

這次總統大選,誰能脫穎而出並不是一個特別令人殷盼的問題,更值得關心的問題是藍白綠「三跤㧣」在選民偏好順序組態中的消長。台灣總統大選採多數決選制,多數決選制英文叫 first-past-the-post(FPTP),簡單來講就是票多的贏,票少的輸。在 10 月中藍白合破局之後,賴蕭配會贏已經沒有懸念,但這只是選制定規之下的結果,換了另一個選制,同樣的選情可能就會險象環生。

從另一個角度想:選制是人為的,而選情反映的是社會現實。政治學者都知道天下沒有十全十美的選制;既定的選制推出了一位總統,並不代表選情的張力就會成為過眼雲煙。當三股社會勢力在制度的帷幕後繼續激盪,台灣政治將無法因新總統的誕生而趨於穩定。

圖/作者自製

如果在「三跤㧣」選舉之下,選情的激盪從候選人的得票多少看不出來,那要從哪裡看?政治學提供的一個方法是把候選人配對 PK,看是否有一位候選人能在所有的 PK 中取勝。這樣的候選人並不一定存在,如果不存在,那代表有 A 與 B 配對 A 勝,B 與 C 配對 B 勝,C 與 A 配對 C 勝的 A>B>C>A 的情形。這種情形,一般叫做「循環多數」(cyclical majorities),是 18 世紀法國學者孔多塞(Nicolas de Condorcet)首先提出。循環多數的存在意涵選舉結果隱藏了政治動盪。

-----廣告,請繼續往下閱讀-----

另一方面,如果有一位候選人能在配對 PK 時擊敗所有的其他候選人,這樣的候選人稱作「孔多塞贏家」(Condorcet winner),而在配對 PK 時均被擊敗的候選人則稱作「孔多塞輸家」(Condorcet loser)。三角嘟的選舉若無循環多數,則一定會有孔多塞贏家和孔多塞輸家,然而孔多塞贏家不一定即是多數決選制中贏得選舉的候選人,而多數決選制中贏得選舉的候選人卻可能是孔多塞輸家。

如果多數決選制中贏得選舉的候選人不是孔多塞贏家,那與循環多數一樣,意涵選後政治將不會穩定。

那麼,台灣這次總統大選,有沒有孔多塞贏家?如果有,是多數決選制之下當選的賴清德嗎?我根據戴立安先生調查規劃的《美麗島電子報》追蹤民調第 109 波(1 月 11 日至 12 日),也是選前最後民調的估計,得到的結果令人驚訝:得票墊後的柯文哲很可能是孔多塞贏家,而得票最多的賴清德很可能是孔多塞輸家。果然如此,那白色力量將會持續地激盪台灣政治!

我之前根據美麗島封關前第 101 波估計,侯友宜可能是孔多塞贏家,而賴清德是孔多塞輸家。現在得到不同的結果,顯示了封關期間的三股政治力量的消長。本來藍營期望的棄保不但沒有發生,而且柯文哲選前之夜在凱道浩大的造勢活動,還震驚了藍綠陣營。民調樣本估計出的孔多塞贏家本來就不準確,但短期內的改變,很可能反映了選情的激盪,甚至可能反映了循環多數的存在。

-----廣告,請繼續往下閱讀-----

三、如何從民調樣本估計孔多塞贏家

根據這波民調,總樣本 N=1001 位受訪者中,如果當時投票,會支持賴清德的受訪者共 355 人,佔 35.4%;支持侯友宜的受訪者共 247 人,佔 24.7%。支持柯文哲的受訪者共 200 人,佔 19.9%。

美麗島民調續問「最不希望誰當總統,也絕對不會投給他的候選人」,在會投票給三組候選人的 802 位支持者中,一共有 572 位對這個問題給予了明確的回答。《美麗島電子報》在其網站提供了交叉表如圖:

根據這個交叉表,我們可以估計每一位明確回答了續問的受訪者對三組候選人的偏好順序,然後再依這 572 人的偏好順序組態來判定在兩兩 PK 的情形下,候選人之間的輸贏如何。我得到的結果是:

  • 柯文哲 PK 賴清德:311 > 261(54.4% v. 45.6%)
  • 柯文哲 PK 侯友宜:287 > 285(50.2% v. 49.8%)
  • 侯友宜 PK 賴清德:293 > 279(51.2% v. 48.8%)

所以柯文哲是孔多塞贏家,賴清德是孔多塞輸家。當然我們如果考慮抽樣誤差(4.1%),除了柯文哲勝出賴清德具有統計顯著性之外,其他兩組配對可說難分難解。但在這 N=572 的小樣本中,三位候選人的得票率分別是:賴清德 40%,侯友宜 33%,柯文哲 27%,與選舉實際結果幾乎一模一樣。至少在這個反映了選舉結果的樣本中,柯文哲是孔多塞贏家。依多數決選制,孔多塞輸家賴清德當選。

-----廣告,請繼續往下閱讀-----

不過以上的分析有一個問題:各陣營的支持者中,有不少人無法明確回答「最不希望看到誰當總統,也絕對不會投給他做總統」的候選人。最嚴重的是賴清德的支持者,其「無反應率」(nonresponse rate)高達 34.5%。相對而言,侯友宜、柯文哲的支持者則分別只有 24.1%、23.8% 無法明確回答。為什麼賴的支持者有較多人無法指認最討厭的候選人?一個假設是因為藍、白性質相近,對許多綠營選民而言,其候選人的討厭程度可能難分軒輊。反過來說,藍、白陣營的選民大多數會最討厭綠營候選人,因此指認較無困難。無論如何,把無法明確回答偏好順序的受訪者歸為「遺失值」(missing value)而棄置不用總不是很恰當的做法,在這裡尤其可能會造成賴清德支持者數目的低估。

補救的辦法之一是在「無法明確回答等於無法區別」的假設下,把「遺失值」平分給投票對象之外的其他兩位候選人,也就是假設他們各有 1/2 的機會是無反應受訪者最討厭的候選人。這樣處理的結果,得到

  • 柯文哲 PK 賴清德:389 > 413(48.5% v. 51.5%)
  • 柯文哲 PK 侯友宜:396 > 406(49.4% v. 50.6%)
  • 侯友宜 PK 賴清德:376 > 426(46.9% v. 53.1%)

此時賴清德是孔多塞贏家,而柯文哲是孔多塞輸家。在這 N=802 的樣本中,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%。雖然依多數決選制,孔多塞贏家賴清德當選,但賴的得票率超過實際選舉結果(40%)。用無實證的假設來填補遺失值,反而造成賴清德支持者數目的高估。

如果擔心「無法明確回答等於無法區別」的假設太勉強,補救的辦法之二是把「遺失值」依有反應受訪者選擇最討厭對象的同樣比例,分給投票對象之外的其他兩位候選人。這樣處理的結果,得到

-----廣告,請繼續往下閱讀-----
  • 柯文哲 PK 賴清德:409 > 393(51.0% v. 49.0%)
  • 柯文哲 PK 侯友宜:407 > 395(50.8% v. 49.2%)
  • 侯友宜 PK 賴清德:417 > 385(52.0% v. 48.0%)

此時柯文哲又是孔多塞贏家,而賴清德又是孔多塞輸家了。這個樣本也是 N=802,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%,與上面的結果一樣。

以上三種無反應處理方法都不盡完美。第一種把無反應直接當遺失值丟棄,看似最不可取。然而縮小的樣本裡,三位候選人的支持度與實際選舉結果幾乎完全一致。後兩種以不同的假設補足了遺失值,但卻過度膨脹了賴清德的支持度。如果以樣本中候選人支持度與實際結果的比較來判斷遺失值處理方法的效度,我們不能排斥第一種方法及其結果。

無論如何,在缺乏完全資訊的情況下,我們發現的確有可能多數決輸家柯文哲是孔多塞贏家,而多數決贏家賴清德是孔多塞輸家。因為配對 PK 結果缺乏統計顯著性,我們甚至不能排除循環多數的存在。此後四年,多數決選制產生的總統能否在三角嘟力量的激盪下有效維持政治穩定,值得我們持續觀察。

四、結語

柯文哲之所以可以是孔多塞贏家,是因為藍綠選民傾向於最不希望對方的候選人當總統。而白營的中間偏藍位置,讓柯文哲與賴清德 PK 時,能夠得到大多數藍營選民的奧援而勝出。同樣的,當他與侯友宜 PK 時,他也能夠得到一部份綠營選民的奧援。只要他的支持者足夠,他也能夠勝出。反過來看,當賴清德與侯友宜 PK 時,除非他的基本盤夠大,否則從白營得到的奧援不一定足夠讓他勝出。民調 N=572 的樣本中,賴清德得 40%,侯友宜得 33%,柯文哲得 27%。由於柯的支持者討厭賴清德(52.5%)遠遠超過討厭侯友宜(23.7%),賴雖然基本盤較大,能夠從白營得到的奧援卻不多。而侯雖基本盤較小,卻有足夠的奧援。柯文哲之所以成為孔多塞贏家,賴清德之所以成為孔多塞輸家,都是這些因素的數學結果。

-----廣告,請繼續往下閱讀-----

資料來源

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
2

文字

分享

0
2
2
數學無聊是誰的錯?數學家其實很幽默?——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/08 ・2441字 ・閱讀時間約 5 分鐘

雖然很少有學生小學畢業後還不懂乘法表,但有很多人確實不會算,如果一個人開車的速度是每小時 56 公里,開了 4 小時之後,他就開了 224 公里。要是每公克花生賣 40 美分,而 1 袋花生賣 2.2 美元,那麼,這袋花生裡就有 5.5 公克花生。假如全世界人口中有 1/4 是中國人,其餘的 1/5 是印度人,那麼,印度人在全世界的人口中就占了 3/20,或說是 15%。當然,要理解這些問題,並不像學會算 35×4=140、(2.2)/(0.4)=5.5、1/5×(1–1/4)=3/20=0.15=15% 這麼簡單。對很多小學生來說,這不是自然而然就會的東西,要靠做很多很實用、或是純屬想像的問題,才能進一步學會。

至於估計,學校裡除了教一些四捨五入之外,通常也沒有別的了。四捨五入和合理的估計與真實人生大有關係,但課堂上很少串起這樣的連結。學校不會帶著小學生估計學校砌一面牆要用掉多少塊磚、班上跑最快的人速度多快、班上同學爸爸是禿頭的比例多高、一個人的頭圍與身高之比是多少、要堆出一座高度和帝國大廈等高的塔需要幾枚 5 美分硬幣,還有他們的教室能否容納這些 5 美分硬幣。

幾乎也沒人教歸納推理,也不會用猜測相關性質和規則的角度,來研究數學現象。在小學數學課裡談到非形式邏輯(informal logic)的機率,就跟講到冰島傳說一樣高。當然,也不會有人提到難題、遊戲和謎語。我相信,這是因為很多時候,聰明的 10 歲小孩輕輕鬆鬆就能打敗老師。

數學科普作家葛登能最不遺餘力探索數學和這些遊戲之間的密切關係。他寫了很多極有吸引力的書,也在《科學美國人》撰寫專欄,而這些都是會讓高中生或大學生感到很刺激的課外讀物(前提是有人指定他們去讀的話)。此外,數學家喬治.波利亞(George Polya)的《怎樣解題》(How to Solve It)和《數學與合情判讀》(Mathematics and Plausible Reasoning),或許也屬於這一類。有一本帶有這些人的文風、但屬於較初階的有趣好書,是瑪瑞琳.伯恩斯(Marilyn Burns)所寫的《我恨數學》(The I Hate Mathematics! Book),書裡有很多啟發性的提示,帶領讀者解題與發想各種奇思異想,是小學數學課本裡罕見的內容。

-----廣告,請繼續往下閱讀-----
圖/envato

有太多教科書仍列出太多人名和術語,就算有說明解析,也很少。比方說,教科書上會說加法是一種結合律運算(associative operation),因為(a + b)+ c=a +(b + c)。但很少人會提到非結合律運算,因此,充其量來說,結合律運算的定義是畫蛇添足。不管是結合律或非結合律,你知道了這些資訊之後要怎麼應用?書上還會介紹到其他術語,但除了用粗體字印在書頁中間的小框框裡,看起來很了不起之外,也沒什麼值得提的理由。這些術語滿足了很多人認為,知識就好比一門普通植物學,每種學問都可以在體系中,找到自己的類別和位置。相比之下,把數學當成有用的工具、思維方式或是獲得樂趣的途徑,在多數小學教育課綱中都是很陌生的概念(即使教科書內容不錯也一樣)。

或許有人會認為,在小學階段,可以用電腦軟體,來幫助學生掌握基本的算數原理及相關應用(應用題、估計等等)。可惜的是,目前可用的程式通常是從教科書上擷取無趣的例行練習,轉化成電腦螢幕版本而已。我不知道有任何軟體可用整合、一致且有效的方法,來教算術與解題應用。

小學階段的數學教學品質普遍不佳,最終必會有人怪罪於老師能力不足,而且對數學沒什麼興趣、或不懂欣賞數學。我認為,這當中有一部分又要歸咎於大專院校的師資培養課程中,很少或根本不強調數學。以我自己的教學經驗來說,我教過的學生中,表現最差的是中學生,而不是大學主修數學的學生。準小學老師的數學背景也很糟,很多時候甚至根本沒有相關的數學教學經歷。

而每所小學聘用一、兩位數學專才,在學校裡每天分別到不同班級輔導(或教授)數學,或許可以解決部分問題。有時我認為,如果大學數學教授和小學老師每年可以交換個幾星期,會是個好方法。同樣的,把主修數學的大學生和研究生交到小學老師手裡,不會造成傷害(事實上,後者或許能從前者身上學到一些東西)。而三、四、五年級的小學生則可以在完全適任的老師教導下,接觸到數學謎題與遊戲,將可大大獲益。

-----廣告,請繼續往下閱讀-----
圖/envato

稍微打個岔,謎題與數學之間很有關係,而且相關性會一直延續到大學與研究階段的數學。當然,把謎題換成幽默也通。我在《數學與幽默》(Mathematics and Humor)書中試著說明,數學和幽默都是某種益智遊戲,與猜謎、解題、遊戲和悖論多有共通之處。

數學和幽默都是把概念組合、拆開再拼回來,然後從中得到樂趣。慣用的手法包括並列、歸納、迭代和倒向(比方說「aixelsyd」就是把「dyslexia」﹝閱讀障礙﹞的字序倒過來)。那麼,如果我放寬這個條件,但緊縮另一個條件會怎樣?某一個領域的概念(像是綁辮子),和另一個看來完全不同領域的概念(如某些幾何圖形的對稱性)有什麼共通點?當然,即便不是數盲,可能也不熟悉數學這個面向,因為你必須要先具備一定程度的數學概念,才可以拿來耍弄。其他像獨創性、不協調感以及精簡的表達,對於數學和幽默來說也都同樣重要。

可能有人說過,因為所受訓練之故,數學家有一種特殊的幽默感。他們往往會接受字面意義,但字面上的解讀又常和標準用法的意義不同,因此很好笑。比方說,哪種運動比賽時要蓋臉?答案是,冰上曲棍球以及痲瘋病人拳擊(按:原文「Which two sports have face-offs」,「face-off」其中一個字面意義為「蓋臉」,而這也是冰上曲棍球常用的術語,意指「爭奪球權」)。他們也很沉溺於歸謬法(reductio ad absurdum),或設定極端前提條件然後做邏輯演練,以及各式各樣的字組遊戲。

如果可以透過小學、中學或大學階段的正式數學教育,或是非正式的數學科普書籍,傳達數學有趣的面向。我認為,數盲就不會像現在這麼普遍。

-----廣告,請繼續往下閱讀-----

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。