Loading [MathJax]/extensions/MathMenu.js

0

0
0

文字

分享

0
0
0

解開高斯相關性猜想,退休統計學家的靈光一閃

UniMath_96
・2017/04/09 ・3326字 ・閱讀時間約 6 分鐘 ・SR值 513 ・六年級

-----廣告,請繼續往下閱讀-----

文/陳宏賓|UniMath 主編、逢甲大學應用數學系助理教授

一道靈光射進了羅炎的腦袋,困擾數十年的高斯相關性猜想終於攻破了大門!圖/By edfungus @ pixabay, CC0 Public Domain

2014 年夏天的某一個清晨,陽光如往常一樣穿透白色窗簾照了進來,羅炎起身前往浴室盥洗,一邊刷著牙一邊回想昨晚入睡前那個證明。突然間,一道靈光射進了羅炎的腦袋,困擾數十年的高斯相關性猜想(Gaussian Correlation Inequality Conjecture)終於攻破了大門!

連結機率、統計與幾何的猜想 

高斯相關性不等式(GCI)有許多不同的版本,其中最著名的是 1972 年連結機率、統計以及幾何三大領域的版本:

想像一個射飛鏢遊戲,以正中紅心為目標射許多次,飛鏢落點會以紅心為中心呈現類似鐘形的高斯分佈(或者稱常態分佈),如果以紅心為中心點同時畫一個圓和一個方形,高斯相關性不等式即是說飛鏢落在圓和方形的交集的機率會大於或者等於落在圓形的機率乘以落在方形的機率。

-----廣告,請繼續往下閱讀-----

P(圓 ∩ 方)≥ P(圓)× P(方)

這裡不同於下面這種大家比較熟知的獨立事件機率,若 A 跟 B 是統計獨立的兩事件,則我們會有這個等式:

P(A ∩ B)= P(A)× P(B)

直觀來說,由於圓形和方形有重疊部分區域,射中其中一個的情況下,同時也射中另一個的機率會因此提高。

-----廣告,請繼續往下閱讀-----

事實上,GCI 猜測是針對任意維度 d 都成立,且兩個同中心的形狀只要是具有對稱性的凸集(symmetrical convex set)即可。

高斯相關性不等式(GCI)有許多不同的版本,其中最著名的是 1972 年連結機率、統計以及幾何三大領域的版本,來想像一下丟飛鏢。圖/By 15299 @ pixabay, CC0 Public Domain

GCI 猜想的原始型態是統計學中關於信賴區間的估算,由美國統計學家奧利佛.丹(Olive Dunn)在 1959 年首次提出。

想像我們要針對一群人(已知平均身高是 170 公分,平均體重是 65 公斤),給出一個身高和體重的範圍,使身高體重同時落在此範圍內的人數佔全部的 90% 以上。 這任務可不太容易,因為人的身高和體重是彼此相關,並非獨立的。假設身高和體重分別都呈現高斯分佈(常態分佈)的情況下,依據[68-95-99.7 法則]我們知道

P(平均加減兩個標準差)≥ 95%

-----廣告,請繼續往下閱讀-----

也就是說,如果身高和體重標準差分別是 7 和 8,我們會知道

P(身高介於 156 到 184 的人數)≥ 95%
P(體重介於 49 到 81 的人數)≥ 95%

再由高斯相關性不等式可以推得

P(身高介於 156 到 184 公分且體重介於 49 到 81 公斤的人數)≥ 0.95 × 0.95 = 0.9025

-----廣告,請繼續往下閱讀-----

維度 d=2 的情況早在 1977 年就被維吉尼亞大學的羅倫.彼特(Loren Pitt)教授證明出來。受訪時,羅倫緩緩地閉起眼睛,說起 1973 年某次和同事吃午餐時聽到這道「簡單」的數學問題時的回憶:

「嘿~羅倫,你知道有個有趣的數學問題 GCI 嗎? 就是想像一個射飛鏢遊戲,然後……」
「聽起來蠻有意思的,老墨~不過,你說這個還沒有人解出來?!」語氣顯得有點疑惑。
「恩!還沒有。」
「不太可能吧! 看起來不太難啊,應該很快就可以知道答案了。」我心裡當時這麼想。
「於是,我把自己關進一間房間,打算當我再次走出房門時就已經證明  GCI  是正確的或者錯了。」

說到這裡,羅倫張開眼睛望向窗外不發一語。而時間一轉眼已經過了將近四十年……

湯瑪斯.羅炎

故事回到解開謎底的湯瑪斯.羅炎(Thomas Royen)身上,今年已經 70 歲的他是德國一位退休統計學家,在這次事件之前可能沒甚麼人聽過他,這點倒是和前幾年華裔數學家張益唐有點像,某天突然靈光一現洞悉真理的故事在數學界也不算少數,不過這次倒是有幾點值得特別一提的趣事。

-----廣告,請繼續往下閱讀-----

要解決一道難題不妨先把它變得更難

首先,數學界有件事情是外界的人難以想像的。「經常發生一種情況是,解決一道看起來很困難不會解的問題的方法是把這個問題推廣成一個更難的問題,然後解決它。

聽起來有點荒謬,打個比方,就好像是一個屢次練習中連 10K 都跑不完的跑者,居然去挑戰極地超馬想藉此證明自己可以跑完 10K。羅炎的證明就是走這個套路,把猜想中高斯分佈這個條件推廣到更複雜、更一般的情況。神奇的是,問題居然就這樣解了,證明還只用了 3 頁!!!
(不過,有人覺得羅炎的版本太神了,可能不太好體會其奧妙之處,因此寫了個簡易 GCI 版的。)

在數學界經常發生一種情況是,解決一道看起來很困難不會解的問題的方法是把這個問題推廣成一個更難的問題,然後解決它。圖/By skeeze @ pixabay, CC0 Public Domain

差點沉沒的寶石

第二,這個影響重大的論文羅炎居然把它投稿到一個名不見經傳的印度期刊,因此使得他的論文 2014 年發表之後又過了兩年 才漸漸引起學術界的注意。一顆璀璨的鑽石差點就沉沒汪洋大海之中。一個學術上極重要的成果發表兩年後才傳播開來,在這個通訊發達的年代,幾乎是怎麼想都不太可能發生的事情。

而不太可能發生的事情終究還是發生了。

-----廣告,請繼續往下閱讀-----

峰迴路轉

羅炎不會用數學界編輯論文常用的 LaTeX 軟體,論文初稿是用 word 打的,完成後一份丟上 arXiv,一份寄給一年半以前曾指出他在一篇嘗試證明 GCI 的論文中所犯之錯誤的賓州州立大學丹諾.理查德斯(Donald Richards)教授,當理查德斯收到信件時,一眼他就知道「Bingo!就是你了!」

事後回想起來,理查德斯有幾分懊惱,這個精簡的證明居然自己三十幾年來都沒有想到。這種心情搞數學的人一生中或多或少都會遇上個幾次吧。

不過,他也慶幸能在有生之年看到 GCI 的美妙證明問世。理查德斯興奮之餘還不忘將這個重大發現通知幾個同事,也熱心的幫忙把論文重新用 LaTeX 編輯,讓它看起來專業一點,符合頂尖期刊的水平。

可惜的是,投稿出去還是撞牆,原因是過去數十年來聲稱證明 GCI 猜想的論文每年都有一籮筐,期刊的審稿委員看都看膩了,通常一下子就能指出關鍵性的錯誤所在,要是碰上像羅炎這樣沒沒無聞的傢伙,通常也不會太認真對待。

-----廣告,請繼續往下閱讀-----

羅炎的論文因此被草率忽略了!
羅炎的論文因此被草率忽略了!!
羅炎的論文因此被草率忽略了!!!

雖然有人曾建議羅炎投到最頂尖的期刊,像是統計年鑑(Annals of Statistics),這樣子一來消息很快就會傳到全世界,不過羅炎考量後還是決定投到很快就可以發表的印度期刊 Far East Journal of Theoretical Statistics,這種期刊的壞處就是即使刊出之後也不太有人知道這件事。一直到 2015 年底 Rafał Latała 和他的學生 Dariusz Matlak 重新寫了一個簡易 GCI 版本的論文,2017 年 3 月 28 日知名雜誌 Quanta Magazine 刊出一篇專欄報導,整個事件才得以散播出來。

最後,羅炎教授受訪時表示,他希望這個意外簡單的證明能夠鼓勵年輕的學生,善用自己的創意去尋找新的數學定理,畢竟那並不總是需要具備非常高深的理論基礎才辦得到。

“the surprisingly simple proof … might encourage young students to use their own creativity to find new mathematical theorems, since a very high theoretical level is not always required.”

本文轉載自UniMath,原文為[統計學突破]解開高斯相關性猜想,退休統計學家湯瑪斯羅炎的神來一筆

作者簡介:陳宏賓 - UniMath 主編、逢甲大學應用數學系助理教授。
數學既深且廣,我懂得不多,最喜愛組合數學相關領域,主要研究興趣是群試理論、圖論及最優化分解。2013 年出版「Partitions: Optimality and Clustering, Volume II: Multi-Parameter」一書(與 Uriel Rothblum 和 Frank K. Hwang 教授合著)。對於數學和教育有強烈的熱忱和使命感,積極創立 UniMath 電子數學媒體,致力於推廣數學文化。

關於UniMath:UniMath (You Need Math)是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。歡迎加入 Facebook 粉絲團知道第一手訊息!

參考文獻:

  1. L. D. Pitt, A Gaussian correlation inequality for symmetric convex sets, Ann. Probab. 5 (1977), 470– 474.
  2. T. Royen, A simple proof of the Gaussian correlation conjecture extended to multivariate gamma distributions, Far East J. Theor. Stat. 48 (2014), 139–145.
  3. R. Latala and D. Matlak. Royen’s proof of the Gaussian correlation inequality. ArXiv http://arxiv.org/abs/1512.08776, 2015.
  4. A Long-Sought Proof, Found and Almost Lost, Quanta Magazine, 2017/03/28.
-----廣告,請繼續往下閱讀-----
文章難易度
UniMath_96
9 篇文章 ・ 209 位粉絲
UniMath (You Need Math) 是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。

0

1
1

文字

分享

0
1
1
伺服器過熱危機!液冷與 3D VC 技術如何拯救高效運算?
鳥苷三磷酸 (PanSci Promo)_96
・2025/04/11 ・3194字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 高柏科技 合作,泛科學企劃執行。

當我們談論能擊敗輝達(NVIDIA)、Google、微軟,甚至是 Meta 的存在,究竟是什麼?答案或許並非更強大的 AI,也不是更高速的晶片,而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

 2024 年底至 2025 年初,搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機,傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題,但這場「科技 vs. 熱」的對決,才剛剛開始。 

不僅僅是輝達,微軟甚至嘗試將伺服器完全埋入海水中,希望藉由洋流降溫;而更激進的做法,則是直接將伺服器浸泡在冷卻液中,來一場「浸沒式冷卻」的實驗。

-----廣告,請繼續往下閱讀-----

但這些方法真的有效嗎?安全嗎?從大型數據中心到你手上的手機,散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技,一同看看如何用科學破解這場高溫危機!

運算=發熱?為何電腦必然會發熱?

為什麼電腦在運算時溫度會升高呢? 圖/unsplash

這並非新問題,1961年物理學家蘭道爾在任職於IBM時,就提出了「蘭道爾原理」(Landauer Principle),他根據熱力學提出,當進行計算或訊息處理時,即便是理論上最有效率的電腦,還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失,系統的熵就會上升,而隨著熵的增加,也會產生熱能。

換句話說,當計算是不可逆的時候,就像產品無法回收再利用,而是進到垃圾場燒掉一樣,會產生許多廢熱。

要解決問題,得用科學方法。在一個系統中,我們通常以「熱設計功耗」(TDP,Thermal Design Power)來衡量電子元件在正常運行條件下產生的熱量。一般來說,TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量,通常以瓦特(W)為單位。也就是說,TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP,例如AMD的CPU 9950X,TDP是170W,GeForce RTX 5090則高達575W,伺服器用的晶片,則可能動輒千瓦以上。

-----廣告,請繼續往下閱讀-----

散熱不僅是AI伺服器的問題,電動車、儲能設備、甚至低軌衛星,都需要高效散熱技術,這正是高柏科技的專長。

「導熱介面材料(TIM)」:提升散熱效率的關鍵角色

在電腦世界裡,散熱的關鍵就是把熱量「交給」導熱效率高的材料,而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中,晶片表面和散熱片之間並不會完美貼合,表面多少會有細微間隙,而這些縫隙如果藏了空氣,就會變成「隔熱層」,阻礙熱傳導。

為了解決這個問題,需要一種關鍵材料,導熱介面材料(TIM,Thermal Interface Material)。它的任務就是填補這些縫隙,讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」,即使主線有再多車道,如果匝道堵住了,車流還是無法順利進入高速公路。同樣地,如果 TIM 的導熱效果不好,熱量就會卡在晶片與散熱片之間,導致散熱效率下降。

-----廣告,請繼續往下閱讀-----

那麼,要怎麼提升 TIM 的效能呢?很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁,若要更高效的散熱材料,則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成:高導熱粉末(如金屬或陶瓷粉末)與聚合物基質。大部分散熱膏的特點是流動性好,盡可能地貼合表面、填補縫隙。但也因為太「軟」了,受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸,高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後,會出現乾裂或表面變硬。

為了解決這個問題,高柏科技推出了凝膠狀的「導熱凝膠」,說是凝膠,但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄,比較不會熱裂解、壽命也比較長。

OK,到這裡,「匝道」的問題解決了,接下來的問題是:這條散熱高速公路該怎麼設計?你會選擇氣冷、水冷,還是更先進的浸沒式散熱呢?

-----廣告,請繼續往下閱讀-----

液冷與 3D VC 散熱技術:未來高效散熱方案解析

除了風扇之外,目前還有哪些方法可以幫助電腦快速散熱呢?圖/unsplash

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量,也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限,因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷,熱量在經過 TIM 後進入水冷頭,水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好,且增加的體積不大。唯一需要注意的是,萬一元件損壞,可能會因為漏液而損害其他元件,且系統的成本較高。如果你對成本有顧慮,可以考慮另一種方案,「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義,就是把均溫板層層疊起來,變成3D結構。雖然均溫板長得也像是一塊金屬板,原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」,直接翻譯是「蒸氣腔室」。

在均溫板中,會放入容易汽化的工作流體,當流體在熱源處吸收熱量後就會汽化,當熱量被帶走,汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法,最大的特點是:導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻,不會有熱都聚集在入口(熱源處)的情況,能更有效降溫。

-----廣告,請繼續往下閱讀-----

整個 3DVC 的設計,是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯,能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC,就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是,工作流體移動的過程經過設計,因此不用插電,成本僅有水冷的十分之一。但相對的,因為是被動式散熱,其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC,高柏科技一直致力於不斷創新,並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積,高柏科技開發了6項專利技術,涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後,均溫板不僅保有高導熱性,還增強了結構強度,顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步,有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術,將主機板和零件完全泡在不導電的特殊液體中,許多冷卻液會選擇沸點較低的物質,因此就像均溫板一樣,可以透過汽化來吸收掉大量的熱,形成泡泡向上浮,達到快速散熱的效果。

然而,因為水會導電,因此替代方案之一是氟化物。雖然效率差了一些,但至少可以用。然而氟化物的生產或廢棄時,很容易產生全氟/多氟烷基物質 PFAS,這是一種永久污染物,會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液,例如礦物油、其他油品,又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告,請繼續往下閱讀-----

另外,把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等,都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證,相信很快就能推出更強大的散熱模組。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
224 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

0
0

文字

分享

1
0
0
小透鏡們的魔術- 由模糊而生的清晰 ! Engraved panel casts image on walls
Scimage
・2011/05/31 ・515字 ・閱讀時間約 1 分鐘 ・SR值 498 ・六年級

-----廣告,請繼續往下閱讀-----

家裡有方格玻璃門的朋友都知道,光通過那種玻璃門會變成像是光斑,如果再離遠一點就變成均勻的光。這樣的設計是為要讓光被打亂,所以外面的人看不到裡面,可是光又進的去。不過這樣的模糊特性不是絕對的,經由數學計算,其實清晰的影像可以從這樣的光斑來產生。

影片中的小板子上有很多非等向性的小透鏡,打上光之後,如果離螢幕很近,就只會產生光斑,不過把這小板子慢慢拿遠以後,照出來的光斑慢慢變成聚合成的美女跟愛因斯坦的影像了( 做影像展示的好像很喜歡用愛因斯坦,像之前介紹過的用細菌照相也是!)。

這樣的技術是透過把影像的深淺強度用橢圓的高斯分布來展開,用很多可控制位置的模糊影像來合成清晰影像,最後將可對應造成光斑的小透鏡做成表面的起伏就完成了。以往這樣的系統常常是在傅立葉轉換平面,利用控制光的波前相位分布來達成,不過那樣的技術需要特殊的調變元件,也會損失光強(發光強度)。這影片提出的方式比較直觀跟容易設計,也有可能大規模利用塑膠材質來達成,或許可以用在一些特定的照明場合上~!

學術文獻

-----廣告,請繼續往下閱讀-----

本文原發表於科學影像Scimage[2011-05-30]

-----廣告,請繼續往下閱讀-----
所有討論 1
Scimage
113 篇文章 ・ 4 位粉絲
每日介紹科學新知, 科普知識與實際實驗影片-歡迎每一顆好奇的心 @_@!