0

0
0

文字

分享

0
0
0

解開高斯相關性猜想,退休統計學家的靈光一閃

UniMath_96
・2017/04/09 ・3326字 ・閱讀時間約 6 分鐘 ・SR值 513 ・六年級

文/陳宏賓|UniMath 主編、逢甲大學應用數學系助理教授

一道靈光射進了羅炎的腦袋,困擾數十年的高斯相關性猜想終於攻破了大門!圖/By edfungus @ pixabay, CC0 Public Domain

2014 年夏天的某一個清晨,陽光如往常一樣穿透白色窗簾照了進來,羅炎起身前往浴室盥洗,一邊刷著牙一邊回想昨晚入睡前那個證明。突然間,一道靈光射進了羅炎的腦袋,困擾數十年的高斯相關性猜想(Gaussian Correlation Inequality Conjecture)終於攻破了大門!

連結機率、統計與幾何的猜想 

高斯相關性不等式(GCI)有許多不同的版本,其中最著名的是 1972 年連結機率、統計以及幾何三大領域的版本:

想像一個射飛鏢遊戲,以正中紅心為目標射許多次,飛鏢落點會以紅心為中心呈現類似鐘形的高斯分佈(或者稱常態分佈),如果以紅心為中心點同時畫一個圓和一個方形,高斯相關性不等式即是說飛鏢落在圓和方形的交集的機率會大於或者等於落在圓形的機率乘以落在方形的機率。

P(圓 ∩ 方)≥ P(圓)× P(方)

這裡不同於下面這種大家比較熟知的獨立事件機率,若 A 跟 B 是統計獨立的兩事件,則我們會有這個等式:

P(A ∩ B)= P(A)× P(B)

直觀來說,由於圓形和方形有重疊部分區域,射中其中一個的情況下,同時也射中另一個的機率會因此提高。

事實上,GCI 猜測是針對任意維度 d 都成立,且兩個同中心的形狀只要是具有對稱性的凸集(symmetrical convex set)即可。

高斯相關性不等式(GCI)有許多不同的版本,其中最著名的是 1972 年連結機率、統計以及幾何三大領域的版本,來想像一下丟飛鏢。圖/By 15299 @ pixabay, CC0 Public Domain

GCI 猜想的原始型態是統計學中關於信賴區間的估算,由美國統計學家奧利佛.丹(Olive Dunn)在 1959 年首次提出。

想像我們要針對一群人(已知平均身高是 170 公分,平均體重是 65 公斤),給出一個身高和體重的範圍,使身高體重同時落在此範圍內的人數佔全部的 90% 以上。 這任務可不太容易,因為人的身高和體重是彼此相關,並非獨立的。假設身高和體重分別都呈現高斯分佈(常態分佈)的情況下,依據[68-95-99.7 法則]我們知道

P(平均加減兩個標準差)≥ 95%

也就是說,如果身高和體重標準差分別是 7 和 8,我們會知道

P(身高介於 156 到 184 的人數)≥ 95%
P(體重介於 49 到 81 的人數)≥ 95%

再由高斯相關性不等式可以推得

P(身高介於 156 到 184 公分且體重介於 49 到 81 公斤的人數)≥ 0.95 × 0.95 = 0.9025

維度 d=2 的情況早在 1977 年就被維吉尼亞大學的羅倫.彼特(Loren Pitt)教授證明出來。受訪時,羅倫緩緩地閉起眼睛,說起 1973 年某次和同事吃午餐時聽到這道「簡單」的數學問題時的回憶:

「嘿~羅倫,你知道有個有趣的數學問題 GCI 嗎? 就是想像一個射飛鏢遊戲,然後……」
「聽起來蠻有意思的,老墨~不過,你說這個還沒有人解出來?!」語氣顯得有點疑惑。
「恩!還沒有。」
「不太可能吧! 看起來不太難啊,應該很快就可以知道答案了。」我心裡當時這麼想。
「於是,我把自己關進一間房間,打算當我再次走出房門時就已經證明  GCI  是正確的或者錯了。」

說到這裡,羅倫張開眼睛望向窗外不發一語。而時間一轉眼已經過了將近四十年……

湯瑪斯.羅炎

故事回到解開謎底的湯瑪斯.羅炎(Thomas Royen)身上,今年已經 70 歲的他是德國一位退休統計學家,在這次事件之前可能沒甚麼人聽過他,這點倒是和前幾年華裔數學家張益唐有點像,某天突然靈光一現洞悉真理的故事在數學界也不算少數,不過這次倒是有幾點值得特別一提的趣事。

要解決一道難題不妨先把它變得更難

首先,數學界有件事情是外界的人難以想像的。「經常發生一種情況是,解決一道看起來很困難不會解的問題的方法是把這個問題推廣成一個更難的問題,然後解決它。

聽起來有點荒謬,打個比方,就好像是一個屢次練習中連 10K 都跑不完的跑者,居然去挑戰極地超馬想藉此證明自己可以跑完 10K。羅炎的證明就是走這個套路,把猜想中高斯分佈這個條件推廣到更複雜、更一般的情況。神奇的是,問題居然就這樣解了,證明還只用了 3 頁!!!
(不過,有人覺得羅炎的版本太神了,可能不太好體會其奧妙之處,因此寫了個簡易 GCI 版的。)

在數學界經常發生一種情況是,解決一道看起來很困難不會解的問題的方法是把這個問題推廣成一個更難的問題,然後解決它。圖/By skeeze @ pixabay, CC0 Public Domain

差點沉沒的寶石

第二,這個影響重大的論文羅炎居然把它投稿到一個名不見經傳的印度期刊,因此使得他的論文 2014 年發表之後又過了兩年 才漸漸引起學術界的注意。一顆璀璨的鑽石差點就沉沒汪洋大海之中。一個學術上極重要的成果發表兩年後才傳播開來,在這個通訊發達的年代,幾乎是怎麼想都不太可能發生的事情。

而不太可能發生的事情終究還是發生了。

峰迴路轉

羅炎不會用數學界編輯論文常用的 LaTeX 軟體,論文初稿是用 word 打的,完成後一份丟上 arXiv,一份寄給一年半以前曾指出他在一篇嘗試證明 GCI 的論文中所犯之錯誤的賓州州立大學丹諾.理查德斯(Donald Richards)教授,當理查德斯收到信件時,一眼他就知道「Bingo!就是你了!」

事後回想起來,理查德斯有幾分懊惱,這個精簡的證明居然自己三十幾年來都沒有想到。這種心情搞數學的人一生中或多或少都會遇上個幾次吧。

不過,他也慶幸能在有生之年看到 GCI 的美妙證明問世。理查德斯興奮之餘還不忘將這個重大發現通知幾個同事,也熱心的幫忙把論文重新用 LaTeX 編輯,讓它看起來專業一點,符合頂尖期刊的水平。

可惜的是,投稿出去還是撞牆,原因是過去數十年來聲稱證明 GCI 猜想的論文每年都有一籮筐,期刊的審稿委員看都看膩了,通常一下子就能指出關鍵性的錯誤所在,要是碰上像羅炎這樣沒沒無聞的傢伙,通常也不會太認真對待。

羅炎的論文因此被草率忽略了!
羅炎的論文因此被草率忽略了!!
羅炎的論文因此被草率忽略了!!!

雖然有人曾建議羅炎投到最頂尖的期刊,像是統計年鑑(Annals of Statistics),這樣子一來消息很快就會傳到全世界,不過羅炎考量後還是決定投到很快就可以發表的印度期刊 Far East Journal of Theoretical Statistics,這種期刊的壞處就是即使刊出之後也不太有人知道這件事。一直到 2015 年底 Rafał Latała 和他的學生 Dariusz Matlak 重新寫了一個簡易 GCI 版本的論文,2017 年 3 月 28 日知名雜誌 Quanta Magazine 刊出一篇專欄報導,整個事件才得以散播出來。

最後,羅炎教授受訪時表示,他希望這個意外簡單的證明能夠鼓勵年輕的學生,善用自己的創意去尋找新的數學定理,畢竟那並不總是需要具備非常高深的理論基礎才辦得到。

“the surprisingly simple proof … might encourage young students to use their own creativity to find new mathematical theorems, since a very high theoretical level is not always required.”

本文轉載自UniMath,原文為[統計學突破]解開高斯相關性猜想,退休統計學家湯瑪斯羅炎的神來一筆

作者簡介:陳宏賓 - UniMath 主編、逢甲大學應用數學系助理教授。
數學既深且廣,我懂得不多,最喜愛組合數學相關領域,主要研究興趣是群試理論、圖論及最優化分解。2013 年出版「Partitions: Optimality and Clustering, Volume II: Multi-Parameter」一書(與 Uriel Rothblum 和 Frank K. Hwang 教授合著)。對於數學和教育有強烈的熱忱和使命感,積極創立 UniMath 電子數學媒體,致力於推廣數學文化。

關於UniMath:UniMath (You Need Math)是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。歡迎加入 Facebook 粉絲團知道第一手訊息!

參考文獻:

  1. L. D. Pitt, A Gaussian correlation inequality for symmetric convex sets, Ann. Probab. 5 (1977), 470– 474.
  2. T. Royen, A simple proof of the Gaussian correlation conjecture extended to multivariate gamma distributions, Far East J. Theor. Stat. 48 (2014), 139–145.
  3. R. Latala and D. Matlak. Royen’s proof of the Gaussian correlation inequality. ArXiv http://arxiv.org/abs/1512.08776, 2015.
  4. A Long-Sought Proof, Found and Almost Lost, Quanta Magazine, 2017/03/28.

數感宇宙探索課程,現正募資中!

文章難易度
UniMath_96
9 篇文章 ・ 208 位粉絲
UniMath (You Need Math) 是一個 Online 數學媒體,我們的目的是成為一個線上平台,發表數學相關的科普文章及影音,使數學用更柔軟的姿態走入群眾,提升數學素養。


0

0
0

文字

分享

0
0
0

遲來報到的質數——《數學,這樣看才精采》

天下文化_96
・2022/05/20 ・2868字 ・閱讀時間約 5 分鐘

2013 年國際數學界最轟動的新聞,應屬中國留美學者張益唐在孿生質數問題上所作出的突破。他個人的經歷更增加了整件事的傳奇性。

數學家張益唐。圖/VOA, 公有領域

張益唐雖然是北大數學系的高材生,但是 37 歲從美國普渡大學拿到博士學位之後,因與指導教授意趣不合,一時在學界無法發展,多年靠打工餬口。1999 年才好不容易至新罕布夏大學數學系任講師。在張益唐長期不得意的歲月裡,他雖然沒有發表什麼數學論文,但是也不曾喪失志氣,還是堅持研究自己喜歡的數學問題。

張益唐在 58 歲暴得大名,各種獎項與頭銜接踵而來,在最是少年逞英豪的數學世界裡,真成為一個異數。英國數學家哈代在他著名的小冊子《一個數學家的辯白》裡曾說:「我不知道有任何一項數學的主要進展,是由超過五十歲的人所啟動。」張益唐正好給哈代的偏見一個反例。

張益唐研究的是關於質數的性質。

一個自然數 p 是質數(也稱為素數)的條件有二:其一,p 大於 1;其二,除了 1 與 p 自己之外,沒有別的自然數能整除 p。全體質數可以從小到大排成一個數列 2, 3, 5, 7, 11, 13, …,通常把排在第 n 個位置的質數記作 pn。如果 pn 與 pn+1 相差為2,則稱質數對 (pn, pn+1) 為一對孿生質數,例如 3 與 5,5 與 7,11 與 13。

圖/envato elements

「孿生質數猜想」就說這樣的質數對有無窮多組。因為古希臘的歐幾里得在他的巨著《原本》裡,曾經證明質數有無窮多個,所以有人以為也是歐幾里得最先提出孿生質數猜想。其實不然,目前從文獻中所見, 1879 年英國數學家格萊舍(James Whitbread Lee Glaisher)在《數學信使》(Messenger of Mathematics)雜誌上的一篇文章,才是第一次將孿生質數猜想見諸文字。

張益唐的大突破是證明有無窮多組質數對 (pn, pn+1) 使得 pn 與 pn+1 相距不超過 7 千萬。

為什麼這是一個大突破呢?因為在張益唐之前,不管給出什麼固定數 m,完全不知道相差在 m 之內的質數對,到底是有限多個還是無窮多個。自從 2013 年 5 月他的成就在國際媒體上廣為流傳之後,世界上很多數學家努力要把 7千萬的差距往下壓縮,目前已經改善到 246 之內。但是距離孿生質數猜想所需的 2,還有巨大而艱困的鴻溝。

一般人從媒體得知張益唐對數學做出了重大貢獻,可能會好奇問他的結果有什麼用?這裡「用」當然是指實際的應用。其實,他的成果目前還只有純學術價值,與國計民生毫不相干。自從古希臘人辨識出質數,在兩千多年的時間裡,除了數學家關心質數外,質數一直缺乏任何應用價值。二十世紀電腦發達之後,才利用因數分解成質數的超級困難特性,產生了某些幾乎無法有效破解的密碼系統,廣泛的應用到金融、通信、資料保密上。

圖/envato elements

在中國古算裡缺席?

一個基本的數學概念,經歷了兩千多年的滄桑,才顯現出它的實用價值,這不是一件平凡的成就。因此,我們不得不佩服希臘人研究質數的真知灼見,並且感嘆十八世紀前的中國傳統數學裡卻不見質數的蹤跡。質數為什麼會在中國遲來報到?實在是一個令人費解的現象。

歐幾里得的《原本》約在西元前 300 年左右成書,是古希臘數學集大成之作。第七卷討論數的性質,是使用幾何的觀點來理解數。也就是從「單位」的概念出發,以度量直線段的方式引入「數」。第七卷定義 2 說「一個數是由許多單位合成的。」因此,1 代表單位而不算作「數」。定義 11 說「質數是只能為一個單位所量盡者。」定義 16 說「兩數相乘得出的數稱為面,其兩邊就是相乘的數。」所以質數只能是線,而不能稱為面。

歐幾里德畫像。圖/wiki, 公有領域

從這些定義可看出來,古希臘人所謂的「數」是依附在幾何的體系裡而得以操作。中國古代缺乏像《原本》這種按照邏輯次序鋪陳結果的數學書,通常是以解決實際問題的風貌來書寫,因此不太可能探討與闡述「數」的純粹性質。

例如,以《九章算術》為代表的中國古算裡,數字是與矩形、直角三角形的面積緊密相連結,但卻沒有像希臘人那樣分辨,有些數是可以表現為面,而有些數卻不可以。

也許古代中國缺乏一項歐幾里得所擁有的知識背景,因而造成了雙方關注問題的差異。古希臘有一位重要的哲人德謨克利特(Democritus),他主張萬物皆由不可分割的「原子」所構成。在「原子論」的知識背景下,數目 1 就不會與其他數目等量齊觀了,1 是「單位」,是數的「原子」。

圖/envato elements

中國古代沒有明確的「原子論」,《墨子.經說下》所說:「非半,進前取也。前,則中無為半,猶端也。」其中切得不能再切的「端」在《墨子.經說上》解釋為「端,體之無序而最前者也。」也只是類似「原子」的概念,並未發展到德謨克利特的思想程度。「原子論」思想的欠缺,或許是質數在中國古算裡缺席的因素之一。

難以望其項背

康熙敕編的《御製數理精蘊》(簡稱《數理精蘊》)是融合中西數學的百科全書,其中將質數譯為「數根」,並且在附表〈對數闡微〉中列有質數表。雖然質數已經在中國現身,但是數學家並沒有感到相見恨晚而深入探討。

晚清數學名家李善蘭在翻譯歐幾里得《原本》後九卷時,第一卷第一界說為:「數根者唯一能度而他數不能度」,也把質數翻譯成「數根」。

數學家李善蘭。圖/傅任敢 《中華教育界》 1936 -1937年, 公有領域

李善蘭很可能受《數理精蘊》的影響,而去研究判別給定數是否為質數的方法。英國傳教師偉烈亞力(Alexander Wylie)將其中一法,以給編輯的信公布在香港一家英文雜誌上,其敘述為「以 2 的對數乘給定的數,求出其真數,以 2 減同數,以給定數除餘數,若能除盡,則給定數為質數;若不能除盡,則不是質數。」

此命題常被稱為「中國定理」,其實是歐洲早已知道的「費馬小定理」的逆命題,該定理斷言若 p 為質數,則 2p − 2 ≣ 0 (mod p)。

其實李善蘭的方法並不永遠正確,例如:2341 − 2 是 341 的整倍數,但是 341 = 11 × 31 並不是一個質數。1872 年李善蘭在《中西聞見錄》報刊發表了〈考數根法〉一文,成為清末關於質數研究的重要成果,但是他並沒有收錄「中國定理」,應該是他已經知道命題並不為真。

要知道李善蘭與高斯的生命是有重疊的時期,因此當西方以質數為基礎所建立的數論,已經繁複深刻美不勝收之時,也許連李善蘭都不曾完全清楚中國落後的程度是多麼巨大!


數感宇宙探索課程,現正募資中!

天下文化_96
9 篇文章 ・ 7 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。