Processing math: 100%

0

2
1

文字

分享

0
2
1

亂灑一地的針其實有意義!布豐實驗與蒙地卡羅方法——《數學的故事》

時報出版_96
・2019/10/07 ・4325字 ・閱讀時間約 9 分鐘 ・SR值 548 ・八年級

-----廣告,請繼續往下閱讀-----

文/蔡天新,本文摘錄自《數學的故事》,2019年時報出版

風格即人。
寫作能力包括思想、感覺和表達,內心的明晰,味覺和靈魂。

——布豐

投擲小針的實驗

十八世紀某日,法國博物學家布豐(Comte de Buffon)邀請了許多朋友來家中做客,席間一起做了個實驗。布豐先在桌上鋪好一張大白紙,白紙上畫滿了等距離的平行線,再拿出很多等長的小針,小針的長度剛好是相鄰平行線間距的一半。布豐說:「請大家隨意把這些小針往白紙上扔!」客人們紛紛照他所說的做。

用火柴重複布豐實驗 。圖/wikimedia

他們總共投擲了二千二百一十二枚小針。統計結果表明,與紙上平行線相交的有七百零四枚,2210÷704≈3.142。布豐說:「這是 π 的近似值。每次實驗都會得到圓周率的近似值,而且投擲次數愈多,求出的圓周率近似值就愈精確。」這就是著名的「布豐實驗」。

布豐發現,如果選用的小針長度固定,那麼有利扔出(扔出的針與平行線相交)與不利扔出(扔出的針與平行線不相交)的次數之比,就是一個包含 π 的運算式。特別的是,如果小針的長度是平行線距離的一半,那麼有利扔出的概率恰好為 1/π。

-----廣告,請繼續往下閱讀-----

布豐投針問題的實驗數據

下面是利用這個公式,用概率法獲得圓周率近似值的歷史資料。

布豐實驗的歷史資料表。圖/時報出版提供

其中,義大利人拉澤里尼在一九○一年投針三千四百零八次後,得出的圓周率近似值為 3.1415929,精確到小數點後六位。只不過他的實驗資料遭到了美國猶他州韋伯州立大學的巴傑教授的質疑。但無論如何,透過幾何、概率、微積分等不同領域和多種管道均可求取 π 的值,這仍然令人驚訝。

布豐投針實驗是第一個用幾何方式來表達概率問題的例子,也是首次利用隨機實驗來處理確定性的數學問題,它推動和促進了概率論的發展。

布豐投針問題的證明

找一根鐵絲做成圓圈,使其直徑恰好等於兩條平行線的間距 d。不難想像,對於這樣的圓圈來說,不管怎麼扔,都會與平行線有兩個交點。這兩個交點可能在一條平行線上,也可能在兩條平行線上。因此,如果投擲圓圈的次數為 n,那麼交點總數必為 2n。

-----廣告,請繼續往下閱讀-----

現在把圓圈打開,變成一根長度為 πd 的鐵絲。顯然,這根鐵絲投擲後與平行線相交的情形要比圓圈複雜,共有五種情況:四個交點,三個交點,兩個交點,一個交點,無交點。

一個圓圈的直徑等於平行線之間是 d,不論怎麼仍都會與平行線有兩個交點。圖/wikimedia

由於圓圈和直線的長度同為 πd,根據機會均等原理,當投擲較多次且投擲次數相等時,兩者與平行線交點的總期望值應該是一樣的。也就是說,當長度為 πd 的鐵絲被投擲 n 次時,與平行線的交點總數也應該約為 2n。

現在來討論鐵絲長度為 l 的情形。隨著投擲次數 n 的增加,鐵絲與平行線的交點總數 m 應當與長度 l 成正比,因而有 m=kl,其中 k 是比例係數。

為了求出 k,考慮到當 l=πd 時的特殊情形,有 m=2n。由此可得

-----廣告,請繼續往下閱讀-----

 k= \frac{2n}{\pi d} 

代入上式 (m=kl),有

 \frac{m}{n}= \frac{2l}{\pi d} 

特別地,取 l=d/2,便可得到布豐的結果,即 m/n=1/π。這個證明多多少少比較直觀,若學了高等數學,還可以用概率論和微積分的方法提出更嚴格的證明。

布豐,身兼多職的皇家植物園園長

有趣的是,布豐的名字與義大利尤文圖斯守門員兼義大利足球隊隊長布馮的名字拼法相同,均為 Buffon,只不過前者是法國人,後者是義大利人;前者生活在十八世紀,後者則與我們同年代。

布豐出生於盛產美酒的勃艮第小官吏之家,母親頗有人文修養。他十六歲時前往第戎的學院讀書,雖然喜歡數學,卻不得不遵從父命學習法律。此番經歷與他的同齡人、瑞士數學家歐拉相似,那會兒歐拉在離第戎不遠的巴塞爾大學,聽從父親之意攻讀神學和希伯來語。

原因在於,對於非顯貴家庭出身的年輕人來說,牧師、醫生和律師不失為安身立命的三個好職業,歐拉卻偏偏對數學情有獨鍾。

-----廣告,請繼續往下閱讀-----

歐拉二十歲時隻身前往俄國的聖彼得堡科學院,先在醫學部,後來轉到數理學部,憑藉自己的鑽研和努力,成為十七世紀最偉大的數學家,也被譽為歷史上最偉大的四位數學家之一。布豐同樣是在二十一歲時,轉往法國西部的昂熱大學攻讀醫學、植物學和數學,並結識了一位在歐洲大陸旅行的英國公爵,陪他去了不少地方,也多次隨他前往英國,後來還成為英國皇家學會會員。

法國博物學家布豐。 圖/wikimedia

二十五歲時,布豐的母親去世,他回到故鄉經營自家農場。他經常去巴黎,是文學和哲學沙龍的常客,並結識了伏爾泰等知識分子,自己也著作等身。他認為,寫作能力包括思想、感覺和表達,內心的明晰,味覺和靈魂。布豐在四十六歲那年當選為法蘭西學院院士,就像二十世紀的數學天才龐加萊(Henri Poincaré),同時站在科學與人文兩大領域的頂峰。

布豐三十二歲時被任命為巴黎皇家植物園園長,直到去世都擔任此職。他致力於把植物園辦成學術和研究中心,從世界各地購買或獲取新的植物和動物標本。布豐翻譯過英國植物學家黑爾斯(Stephen Hales,第一個測量血壓的人)的《植物志》(Vegetable Staticks)和牛頓的《流數法與無窮級數》(Methodus Fluxionum et Serierum Infinitarum),並探索了牛頓和萊布尼茨發現微積分的歷史過程。布豐還主編巨著《自然史》,原計畫出五十卷,在他去世前出了三十六卷。

布豐生前以博物學家的身分和自然史方面的著作聞名,並以「風格即人」的理念為人稱道和傳世。這就像北宋的政治家沈括,因為寫了《夢溪筆談》而被公認是偉大的博物學家,在數學、物理學、地質學等方面同樣卓有成就。布豐的興趣也非常廣泛,且在多個領域均有重要建樹。

-----廣告,請繼續往下閱讀-----

布豐是最早提出要將地質史按照時期劃分,並發表太陽與彗星碰撞產生行星此一理論的人。他還率先提出物種絕跡說,促進了古生物學的研究。不過,他說新世界(指美洲)的物種之所以不如歐亞大陸,缺乏大型和強大物種,男子氣概的人也少於歐洲,是因為美洲大陸沼澤的氣味和茂密的森林,大大激怒了湯瑪斯.傑佛遜(Thomas Jefferson),派出二十個士兵去新罕布夏州森林尋找公鹿,好向布豐展示「美國四足動物的雄壯和威嚴」。

布豐四十五歲時娶了一位來自故鄉沒落貴族世家的小姐,他們的第二個孩子倖免夭折,五年後卻面臨母喪,布豐又在他八歲時病重,幸好隔年病情就好轉,從此父子平安無事。布豐後來活到八十一歲,晚年當選為美國藝術與科學學院的外籍院士。

蒙地卡羅方法是什麼?

如同前文提到的布豐投針試驗,透過概率實驗的方法來估計某一個隨機變數的期望值,這樣的方法被稱為蒙地卡羅方法

蒙地卡羅全景。圖/wikimedia

蒙地卡羅是全球馳名的賭城,位於法國國界內離義大利不遠的摩納哥,傍依地中海海濱,屬於風景如畫的「蔚藍海岸」一部分。奧斯卡電影《蝴蝶夢》曾在這裡取景,一級方程式賽車在這裡也設有一站。我年輕時遊歷此地,發現它與美國的拉斯維加斯和大西洋城不同,要求客人西裝革履,穿短褲或拖鞋者謝絕入內。

-----廣告,請繼續往下閱讀-----

蒙地卡羅方法是美國在二戰期間執行研製原子彈的「曼哈頓計畫」時提出來的,主要歸功於波蘭人烏拉姆(Stanislaw Ulam)和匈牙利人馮.諾依曼這兩位猶太籍數學家。馮.諾依曼以賭城蒙地卡羅之名為此方法命名,也為它罩上了一層神祕面紗。其實在此之前,蒙地卡羅方法就已存在,比如布豐實驗。

如今,蒙地卡羅方法在原子物理學、固態物理學、化學、生態學、社會學與經濟行為學等領域均獲得廣泛應用。下面,我們再舉兩個例子。

例一:把布豐實驗做個推廣,利用鈍角三角形的邊長計算圓周率。

三角形~圖/GIPHY

任意給三個正數,以它們為邊長,可以圍成一個鈍角三角形的概率 P 也與 π有關,這個概率為(π–2)/4。證明如下:

設這三個正數為 xyz,而且 xyz。對於每一個確定的 z,考慮到一個三角形任意一邊的長度小於另外兩邊的長度之和,故滿足

-----廣告,請繼續往下閱讀-----

x+y>z, x2+y2<z2

後一個不等式成立是因為鈍角三角形和畢氏定理。我們很容易證明,這兩個不等式即為以這三個正數為邊長可圍成鈍角三角形的充分必要條件。

因此,滿足假設條件的(x, y)的可行區域為直線x+y=z 與圓 x2+y2<z所圍成的小弓形,而(x, y)的總可行區域為一個邊長為 z 的正方形。這樣一來,以三個正數為邊長可以圍成一個鈍角三角形的概率為

由此可見,這個概率與 z 的選取無關。因此,對於任意正數 xyz,均有 P=(π–2)/4,命題得證。

為了估算 π 的值,我們得透過實驗來估計其概率,過程可交由電腦程式設計來實現。事實上,x+y>zx2+y2<z2等價於(x+yz)(x2+y2z2)<0,因此只需檢驗後一個不等式是否成立即可。

若進行了 m 次隨機實驗,有 次滿足該不等式,那麼當 m 夠大時,n/m 會趨近於 (π–2)/4。而若令 n/m=(π–2)/4,可求得 π=4n/m+2,由此即能估計出 π 的近似值。

例二:利用蒙地卡羅方法,求任意曲邊梯形的池塘面積。

蒙地卡羅方法的基本概念是:先建立一個概率模型,使所求問題的解正好是該模型的參數或其他相關的特徵量。再透過模擬某個統計實驗,即多次隨機抽樣實驗(確定 m n),統計出該事件發生的百分比。只要實驗次數夠多,該百分比便近似於事件發生的概率,這其實就是概率的統計學定義。

可以說,蒙地卡羅方法屬於實驗數學的一種。它的適用範圍很廣泛,既能求解確定性的問題,也能求解隨機性的問題,甚至可以探索科學研究中的理論問題。

例二告訴我們,如何利用蒙地卡羅方法近似計算定積分,這屬於數值積分問題。那麼,任意曲邊梯形形狀的池塘面積,應該怎樣測算呢?

設計方案是:如下圖所示,假定池塘位於一塊面積已知的矩形農田中央,隨機朝農田扔泥巴,泥巴可能會濺起水花(落在池塘內),也可能不會(落在池塘外)。估計「濺起水花」的泥巴數占總泥巴數的百分比,便可根據該比例和農田面積近似算出池塘的面積。

用蒙地卡羅方法計算曲邊梯形的池塘面積。圖/時報出版提供

——本文摘自《數學的故事》,2019 年 5 月,時報出版

-----廣告,請繼續往下閱讀-----
文章難易度
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

30
1

文字

分享

0
30
1
民眾黨是未來台灣政治的樞紐?
林澤民_96
・2024/01/30 ・3382字 ・閱讀時間約 7 分鐘

一、前言

選後的立法院三黨不過半,但民眾黨有八席不分區立委,足以與民進黨或國民黨結成多數聯盟,勢將在國會居於樞紐地位。無獨有偶的是:民眾黨主席柯文哲在總統大選得到 26.5% 的選票,屈居第三,但因其獲得部分藍、綠選民的支持,在選民偏好順序組態的基礎上,它卻也同樣地居於樞紐地位。這個地位,將足以讓柯文哲及民眾黨在選後的台灣政壇持續激盪。

二、柯文哲是「孔多塞贏家」?

這次總統大選,誰能脫穎而出並不是一個特別令人殷盼的問題,更值得關心的問題是藍白綠「三跤㧣」在選民偏好順序組態中的消長。台灣總統大選採多數決選制,多數決選制英文叫 first-past-the-post(FPTP),簡單來講就是票多的贏,票少的輸。在 10 月中藍白合破局之後,賴蕭配會贏已經沒有懸念,但這只是選制定規之下的結果,換了另一個選制,同樣的選情可能就會險象環生。

從另一個角度想:選制是人為的,而選情反映的是社會現實。政治學者都知道天下沒有十全十美的選制;既定的選制推出了一位總統,並不代表選情的張力就會成為過眼雲煙。當三股社會勢力在制度的帷幕後繼續激盪,台灣政治將無法因新總統的誕生而趨於穩定。

圖/作者自製

如果在「三跤㧣」選舉之下,選情的激盪從候選人的得票多少看不出來,那要從哪裡看?政治學提供的一個方法是把候選人配對 PK,看是否有一位候選人能在所有的 PK 中取勝。這樣的候選人並不一定存在,如果不存在,那代表有 A 與 B 配對 A 勝,B 與 C 配對 B 勝,C 與 A 配對 C 勝的 A>B>C>A 的情形。這種情形,一般叫做「循環多數」(cyclical majorities),是 18 世紀法國學者孔多塞(Nicolas de Condorcet)首先提出。循環多數的存在意涵選舉結果隱藏了政治動盪。

-----廣告,請繼續往下閱讀-----

另一方面,如果有一位候選人能在配對 PK 時擊敗所有的其他候選人,這樣的候選人稱作「孔多塞贏家」(Condorcet winner),而在配對 PK 時均被擊敗的候選人則稱作「孔多塞輸家」(Condorcet loser)。三角嘟的選舉若無循環多數,則一定會有孔多塞贏家和孔多塞輸家,然而孔多塞贏家不一定即是多數決選制中贏得選舉的候選人,而多數決選制中贏得選舉的候選人卻可能是孔多塞輸家。

如果多數決選制中贏得選舉的候選人不是孔多塞贏家,那與循環多數一樣,意涵選後政治將不會穩定。

那麼,台灣這次總統大選,有沒有孔多塞贏家?如果有,是多數決選制之下當選的賴清德嗎?我根據戴立安先生調查規劃的《美麗島電子報》追蹤民調第 109 波(1 月 11 日至 12 日),也是選前最後民調的估計,得到的結果令人驚訝:得票墊後的柯文哲很可能是孔多塞贏家,而得票最多的賴清德很可能是孔多塞輸家。果然如此,那白色力量將會持續地激盪台灣政治!

我之前根據美麗島封關前第 101 波估計,侯友宜可能是孔多塞贏家,而賴清德是孔多塞輸家。現在得到不同的結果,顯示了封關期間的三股政治力量的消長。本來藍營期望的棄保不但沒有發生,而且柯文哲選前之夜在凱道浩大的造勢活動,還震驚了藍綠陣營。民調樣本估計出的孔多塞贏家本來就不準確,但短期內的改變,很可能反映了選情的激盪,甚至可能反映了循環多數的存在。

-----廣告,請繼續往下閱讀-----

三、如何從民調樣本估計孔多塞贏家

根據這波民調,總樣本 N=1001 位受訪者中,如果當時投票,會支持賴清德的受訪者共 355 人,佔 35.4%;支持侯友宜的受訪者共 247 人,佔 24.7%。支持柯文哲的受訪者共 200 人,佔 19.9%。

美麗島民調續問「最不希望誰當總統,也絕對不會投給他的候選人」,在會投票給三組候選人的 802 位支持者中,一共有 572 位對這個問題給予了明確的回答。《美麗島電子報》在其網站提供了交叉表如圖:

根據這個交叉表,我們可以估計每一位明確回答了續問的受訪者對三組候選人的偏好順序,然後再依這 572 人的偏好順序組態來判定在兩兩 PK 的情形下,候選人之間的輸贏如何。我得到的結果是:

  • 柯文哲 PK 賴清德:311 > 261(54.4% v. 45.6%)
  • 柯文哲 PK 侯友宜:287 > 285(50.2% v. 49.8%)
  • 侯友宜 PK 賴清德:293 > 279(51.2% v. 48.8%)

所以柯文哲是孔多塞贏家,賴清德是孔多塞輸家。當然我們如果考慮抽樣誤差(4.1%),除了柯文哲勝出賴清德具有統計顯著性之外,其他兩組配對可說難分難解。但在這 N=572 的小樣本中,三位候選人的得票率分別是:賴清德 40%,侯友宜 33%,柯文哲 27%,與選舉實際結果幾乎一模一樣。至少在這個反映了選舉結果的樣本中,柯文哲是孔多塞贏家。依多數決選制,孔多塞輸家賴清德當選。

-----廣告,請繼續往下閱讀-----

不過以上的分析有一個問題:各陣營的支持者中,有不少人無法明確回答「最不希望看到誰當總統,也絕對不會投給他做總統」的候選人。最嚴重的是賴清德的支持者,其「無反應率」(nonresponse rate)高達 34.5%。相對而言,侯友宜、柯文哲的支持者則分別只有 24.1%、23.8% 無法明確回答。為什麼賴的支持者有較多人無法指認最討厭的候選人?一個假設是因為藍、白性質相近,對許多綠營選民而言,其候選人的討厭程度可能難分軒輊。反過來說,藍、白陣營的選民大多數會最討厭綠營候選人,因此指認較無困難。無論如何,把無法明確回答偏好順序的受訪者歸為「遺失值」(missing value)而棄置不用總不是很恰當的做法,在這裡尤其可能會造成賴清德支持者數目的低估。

補救的辦法之一是在「無法明確回答等於無法區別」的假設下,把「遺失值」平分給投票對象之外的其他兩位候選人,也就是假設他們各有 1/2 的機會是無反應受訪者最討厭的候選人。這樣處理的結果,得到

  • 柯文哲 PK 賴清德:389 > 413(48.5% v. 51.5%)
  • 柯文哲 PK 侯友宜:396 > 406(49.4% v. 50.6%)
  • 侯友宜 PK 賴清德:376 > 426(46.9% v. 53.1%)

此時賴清德是孔多塞贏家,而柯文哲是孔多塞輸家。在這 N=802 的樣本中,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%。雖然依多數決選制,孔多塞贏家賴清德當選,但賴的得票率超過實際選舉結果(40%)。用無實證的假設來填補遺失值,反而造成賴清德支持者數目的高估。

如果擔心「無法明確回答等於無法區別」的假設太勉強,補救的辦法之二是把「遺失值」依有反應受訪者選擇最討厭對象的同樣比例,分給投票對象之外的其他兩位候選人。這樣處理的結果,得到

-----廣告,請繼續往下閱讀-----
  • 柯文哲 PK 賴清德:409 > 393(51.0% v. 49.0%)
  • 柯文哲 PK 侯友宜:407 > 395(50.8% v. 49.2%)
  • 侯友宜 PK 賴清德:417 > 385(52.0% v. 48.0%)

此時柯文哲又是孔多塞贏家,而賴清德又是孔多塞輸家了。這個樣本也是 N=802,三位候選人的得票率分別是:賴清德 44%,侯友宜 31%,柯文哲 25%,與上面的結果一樣。

以上三種無反應處理方法都不盡完美。第一種把無反應直接當遺失值丟棄,看似最不可取。然而縮小的樣本裡,三位候選人的支持度與實際選舉結果幾乎完全一致。後兩種以不同的假設補足了遺失值,但卻過度膨脹了賴清德的支持度。如果以樣本中候選人支持度與實際結果的比較來判斷遺失值處理方法的效度,我們不能排斥第一種方法及其結果。

無論如何,在缺乏完全資訊的情況下,我們發現的確有可能多數決輸家柯文哲是孔多塞贏家,而多數決贏家賴清德是孔多塞輸家。因為配對 PK 結果缺乏統計顯著性,我們甚至不能排除循環多數的存在。此後四年,多數決選制產生的總統能否在三角嘟力量的激盪下有效維持政治穩定,值得我們持續觀察。

四、結語

柯文哲之所以可以是孔多塞贏家,是因為藍綠選民傾向於最不希望對方的候選人當總統。而白營的中間偏藍位置,讓柯文哲與賴清德 PK 時,能夠得到大多數藍營選民的奧援而勝出。同樣的,當他與侯友宜 PK 時,他也能夠得到一部份綠營選民的奧援。只要他的支持者足夠,他也能夠勝出。反過來看,當賴清德與侯友宜 PK 時,除非他的基本盤夠大,否則從白營得到的奧援不一定足夠讓他勝出。民調 N=572 的樣本中,賴清德得 40%,侯友宜得 33%,柯文哲得 27%。由於柯的支持者討厭賴清德(52.5%)遠遠超過討厭侯友宜(23.7%),賴雖然基本盤較大,能夠從白營得到的奧援卻不多。而侯雖基本盤較小,卻有足夠的奧援。柯文哲之所以成為孔多塞贏家,賴清德之所以成為孔多塞輸家,都是這些因素的數學結果。

-----廣告,請繼續往下閱讀-----

資料來源

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
2

文字

分享

0
2
2
數學無聊是誰的錯?數學家其實很幽默?——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/08 ・2441字 ・閱讀時間約 5 分鐘

雖然很少有學生小學畢業後還不懂乘法表,但有很多人確實不會算,如果一個人開車的速度是每小時 56 公里,開了 4 小時之後,他就開了 224 公里。要是每公克花生賣 40 美分,而 1 袋花生賣 2.2 美元,那麼,這袋花生裡就有 5.5 公克花生。假如全世界人口中有 1/4 是中國人,其餘的 1/5 是印度人,那麼,印度人在全世界的人口中就占了 3/20,或說是 15%。當然,要理解這些問題,並不像學會算 35×4=140、(2.2)/(0.4)=5.5、1/5×(1–1/4)=3/20=0.15=15% 這麼簡單。對很多小學生來說,這不是自然而然就會的東西,要靠做很多很實用、或是純屬想像的問題,才能進一步學會。

至於估計,學校裡除了教一些四捨五入之外,通常也沒有別的了。四捨五入和合理的估計與真實人生大有關係,但課堂上很少串起這樣的連結。學校不會帶著小學生估計學校砌一面牆要用掉多少塊磚、班上跑最快的人速度多快、班上同學爸爸是禿頭的比例多高、一個人的頭圍與身高之比是多少、要堆出一座高度和帝國大廈等高的塔需要幾枚 5 美分硬幣,還有他們的教室能否容納這些 5 美分硬幣。

幾乎也沒人教歸納推理,也不會用猜測相關性質和規則的角度,來研究數學現象。在小學數學課裡談到非形式邏輯(informal logic)的機率,就跟講到冰島傳說一樣高。當然,也不會有人提到難題、遊戲和謎語。我相信,這是因為很多時候,聰明的 10 歲小孩輕輕鬆鬆就能打敗老師。

數學科普作家葛登能最不遺餘力探索數學和這些遊戲之間的密切關係。他寫了很多極有吸引力的書,也在《科學美國人》撰寫專欄,而這些都是會讓高中生或大學生感到很刺激的課外讀物(前提是有人指定他們去讀的話)。此外,數學家喬治.波利亞(George Polya)的《怎樣解題》(How to Solve It)和《數學與合情判讀》(Mathematics and Plausible Reasoning),或許也屬於這一類。有一本帶有這些人的文風、但屬於較初階的有趣好書,是瑪瑞琳.伯恩斯(Marilyn Burns)所寫的《我恨數學》(The I Hate Mathematics! Book),書裡有很多啟發性的提示,帶領讀者解題與發想各種奇思異想,是小學數學課本裡罕見的內容。

-----廣告,請繼續往下閱讀-----
圖/envato

有太多教科書仍列出太多人名和術語,就算有說明解析,也很少。比方說,教科書上會說加法是一種結合律運算(associative operation),因為(a + b)+ c=a +(b + c)。但很少人會提到非結合律運算,因此,充其量來說,結合律運算的定義是畫蛇添足。不管是結合律或非結合律,你知道了這些資訊之後要怎麼應用?書上還會介紹到其他術語,但除了用粗體字印在書頁中間的小框框裡,看起來很了不起之外,也沒什麼值得提的理由。這些術語滿足了很多人認為,知識就好比一門普通植物學,每種學問都可以在體系中,找到自己的類別和位置。相比之下,把數學當成有用的工具、思維方式或是獲得樂趣的途徑,在多數小學教育課綱中都是很陌生的概念(即使教科書內容不錯也一樣)。

或許有人會認為,在小學階段,可以用電腦軟體,來幫助學生掌握基本的算數原理及相關應用(應用題、估計等等)。可惜的是,目前可用的程式通常是從教科書上擷取無趣的例行練習,轉化成電腦螢幕版本而已。我不知道有任何軟體可用整合、一致且有效的方法,來教算術與解題應用。

小學階段的數學教學品質普遍不佳,最終必會有人怪罪於老師能力不足,而且對數學沒什麼興趣、或不懂欣賞數學。我認為,這當中有一部分又要歸咎於大專院校的師資培養課程中,很少或根本不強調數學。以我自己的教學經驗來說,我教過的學生中,表現最差的是中學生,而不是大學主修數學的學生。準小學老師的數學背景也很糟,很多時候甚至根本沒有相關的數學教學經歷。

而每所小學聘用一、兩位數學專才,在學校裡每天分別到不同班級輔導(或教授)數學,或許可以解決部分問題。有時我認為,如果大學數學教授和小學老師每年可以交換個幾星期,會是個好方法。同樣的,把主修數學的大學生和研究生交到小學老師手裡,不會造成傷害(事實上,後者或許能從前者身上學到一些東西)。而三、四、五年級的小學生則可以在完全適任的老師教導下,接觸到數學謎題與遊戲,將可大大獲益。

-----廣告,請繼續往下閱讀-----
圖/envato

稍微打個岔,謎題與數學之間很有關係,而且相關性會一直延續到大學與研究階段的數學。當然,把謎題換成幽默也通。我在《數學與幽默》(Mathematics and Humor)書中試著說明,數學和幽默都是某種益智遊戲,與猜謎、解題、遊戲和悖論多有共通之處。

數學和幽默都是把概念組合、拆開再拼回來,然後從中得到樂趣。慣用的手法包括並列、歸納、迭代和倒向(比方說「aixelsyd」就是把「dyslexia」﹝閱讀障礙﹞的字序倒過來)。那麼,如果我放寬這個條件,但緊縮另一個條件會怎樣?某一個領域的概念(像是綁辮子),和另一個看來完全不同領域的概念(如某些幾何圖形的對稱性)有什麼共通點?當然,即便不是數盲,可能也不熟悉數學這個面向,因為你必須要先具備一定程度的數學概念,才可以拿來耍弄。其他像獨創性、不協調感以及精簡的表達,對於數學和幽默來說也都同樣重要。

可能有人說過,因為所受訓練之故,數學家有一種特殊的幽默感。他們往往會接受字面意義,但字面上的解讀又常和標準用法的意義不同,因此很好笑。比方說,哪種運動比賽時要蓋臉?答案是,冰上曲棍球以及痲瘋病人拳擊(按:原文「Which two sports have face-offs」,「face-off」其中一個字面意義為「蓋臉」,而這也是冰上曲棍球常用的術語,意指「爭奪球權」)。他們也很沉溺於歸謬法(reductio ad absurdum),或設定極端前提條件然後做邏輯演練,以及各式各樣的字組遊戲。

如果可以透過小學、中學或大學階段的正式數學教育,或是非正式的數學科普書籍,傳達數學有趣的面向。我認為,數盲就不會像現在這麼普遍。

-----廣告,請繼續往下閱讀-----

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。