0

7
1

文字

分享

0
7
1

從統計來看香港動物溝通師的傳心「槓龜」事件

活躍星系核_96
・2017/09/06 ・2667字 ・閱讀時間約 5 分鐘 ・SR值 518 ・六年級
  • 文/Ryan Tang
    出生香港的80後,在東京大學成為核子物理博士。現在於日本理化學研究所工作。經常要向親朋好友解釋核子物理不是關於核電廠而煩惱。

y編按:你聽過「動物溝通師」嗎?他們也被稱為「傳心師」,可以透過照片等遠距離的方式跟在地球各處的動物溝通,有些溝通師會解釋其原理與物質不滅、腦電波隔空傳送、甚或是量子力學等等有關。但他們真的能傳心嗎?

香港《有線電視》的節目《新聞刺針》做了一個「動物傳心」的測試,他們用了一隻假的塑膠龜的照片說是記者走失的烏龜「布歐」,並詢問五位溝通師們布歐為何會「離家出走」。溝通師們的答案五花八門,有的說牠是一隻有理想有抱負想去大自然的龜龜,有的說牠一直躲在黑暗和潮濕的地方

當然知道布歐是塑膠龜之後溝通師們各有不同的反應有的溝通師說他是和其他隻同名的烏龜有連結),先不論有沒有可能利用「量子糾纏」來「傳心」,先讓我們用機率來看這件事情有沒有可能呢?

走失的塑膠龜「布歐」。source:有線新聞影片截圖

之前有《新聞刺針》用塑膠龜測試「動物傳心」的真偽,發現 5 位動物溝通師都未能「感知」布歐是隻塑膠烏龜,《新聞刺針》便因此以「動物傳心為假」作結。但動物溝通師仍聲稱這是基於量子力學,由於量子力學是不能作出確定性(deterministic)的預測,只能給出機率;那麼,我猜「溝通師能傳心」也應該是由機率決定吧!

所以 5 次測試都未能給出正確答案就否定動物傳心,以統計的角度好像太武斷。在此不論膠龜有沒有思想,也不探究傳心和量子力學的關係,純粹由統計角度看問題。

走失的塑膠龜「布歐」。source:有線新聞影片截圖

箱子裡的球球是什麼顏色?先驗機率與條件機率

抽一次得到紅球,那麼可以說箱子裏所有都是紅球嗎?source:public domain pictures

假設有一個箱,箱子裏有很多球。抽一次得到了紅球,就可以說箱子裏所有的球都是紅球嗎?顯然是不可以的。再抽五次,得五個紅球,那麼可以說箱子裏全都是紅球嗎?假如箱子有五個紅球跟五個非紅球,也有機會連續抽到五個紅球啊。如果抽了 100 次,每一次都是紅球,感覺紅球應該佔很大比例,也就是說其機率很高。在這些例子中,如何用數學理解這個「直覺」呢?

一般學校教的機率,是假定事件的先驗機率(prior probability),然後去計相關的機率。例如,已知箱子裏有 5 個紅球,5 個綠球,求抽到 2 個紅球跟 3 個綠球的機率。又例如假定雨天的機率是 30%,求未來 3 天會下雨的機率。但現實是先驗機率是很抽象的,所有機率都應該是實驗得來。想知道箱子有什麼球,就要把所有球檢查一次。想知錢幣是否公正,理論上我們要擲無限次,然後看看公和字出現的頻率是否相同,我們才能得出一個近似的先驗機率。

但現實上,我們只能擲的次數是有限的。而如果是說下雨的機率,難道天文台能把明天「重覆」幾次,然後得出先驗的下雨機率嗎?天文台可以模擬明天幾遍,而得出一個模擬機率,但這機率跟真實的「先驗」機率性質還是不同。所以先驗機率其實同假設沒兩樣。

基於先驗機率的不可知,數學家想出機率應該只能跟據手上的資訊來決定。當有新的資料,這個機率就會更新。情況就像,過去下雨的機率是 30%,當今天過去而沒有下雨,那麼明天下雨機率就會下降。 這個不斷更新的機率,比較容易定義,也容易操作,而且反映出觀察者對事件的「信心」。

那麼現在說明如何操作了。假設抽 n 次出 r 個紅球。跟據二項分佈(Binomial distribution),其機率是

P (n, r|x) = C rn x(1-x)n-r

這裏用了條件機率(conditional probability),意即是如果抽紅球的機率是 x ,那麼抽 n 次出 r 個紅球的機率是這麼多。這個機率也可以想像成似然函數(Likelihood),即是如果抽 n 次出 r 個紅球,那麼「紅球的機率」是 x 的機會是多少。似然函數跟機率的關係是這樣

L (x|n, r) = P (n, r|x)

這時候根據 x 的不同會得出似然函數。下圖畫出一些例子。

似然函數的一些例子。圖/作者提供

可見如果抽 10 次只有 1 個紅球(藍線),那麼似然函數會隨 x 而有所變化。而最似然函數最大時相應的機率是 0.1 ,即「紅球的機率」最有可能是 0.1。這結果完全是附合傳統的機率理論,抽 10 次只有 1 個紅球,那「紅球的機率」就是 0.1 啊!但是,我們看到藍線在 0.1 附近是有個寛度,而這寛度代表不確定性。如果抽 10 次有 5 個紅球(橙線),紅球的機率最有可能就是 0.5。 當抽 500 次有 250 次紅球(紅線),紅球的機率最可能也是 0.5。但是分布變窄了,也就是說 0.5 的「誤差」會隨著抽越多次而變得越小!

要注意,似然函數是觀察者因資訊而得出。似然函數最大值時相應的機率,跟先驗機率(或真正的機率)還可能有差別。例如就算真正的機率為 0.2,抽 10 次只有 1 個紅球的機率為 27 %,也是相當有可能的。所以在上圖中藍線在 x=0.2 那裏還有一定機率。但基於實驗結果最有可能的機率是 0.1。

5位動物溝通師都「槓龜」以後,動物溝通仍然不是夢?

好。那麼 5 位動物溝通師都沒有正確。那麼傳心最有可能的機率是 0;但不能因為這樣而完全否定傳心的可能。看看下圖當 n =5,r = 0 的情況。

當 n =5,r = 0 的似然函數。圖/作者提供。

會發現在 x 不等於 0 的情況下其實還是有不少機率的:例如在x 等於 0.2,還有大約 30% 的機率,即「傳心有可能是20%的機率」還有0.3。由於似然函數的峰值在0,所以顯然還是有誤差的,因此習慣上會用半峰全寬(Full width at half maximum)所對應的x來定義其誤差;由上圖中所見誤差為13%, 所以傳心有可能為真的機率上限還有 13 %。我們也可以想像,當測試的數量不是5次,而是50次,那半峰全寛就會很窄,而傳心可能為真的機率上限就會很接近零。

利用似然函數,我們不但得出跟一般機率理論一樣的結果(5次失敗,成功率是零),更可以得出誤差(雖成功率是零,但還有是13%誤差)。而誤差是多少,往往反映出數字的可靠性。誤差越大,數字本身的意義就越少。而誤差越小、數字就越精確,也更具參考價值。例如在運動場上,選手們會打好幾場賽事來分出高下,因為那樣得出的結果誤差會變小,這比較可以反映選手的真正實力。最後,以似然函數來看世界,統計數字的背後往往還是有誤差。所以少數幾次失敗也不要放棄,失敗為成功之母啊!抓住那誤差外的87 %吧,布歐!


數感宇宙探索課程,現正募資中!

文章難易度
活躍星系核_96
755 篇文章 ・ 90 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia


0

0
0

文字

分享

0
0
0

遲來報到的質數——《數學,這樣看才精采》

天下文化_96
・2022/05/20 ・2868字 ・閱讀時間約 5 分鐘

2013 年國際數學界最轟動的新聞,應屬中國留美學者張益唐在孿生質數問題上所作出的突破。他個人的經歷更增加了整件事的傳奇性。

數學家張益唐。圖/VOA, 公有領域

張益唐雖然是北大數學系的高材生,但是 37 歲從美國普渡大學拿到博士學位之後,因與指導教授意趣不合,一時在學界無法發展,多年靠打工餬口。1999 年才好不容易至新罕布夏大學數學系任講師。在張益唐長期不得意的歲月裡,他雖然沒有發表什麼數學論文,但是也不曾喪失志氣,還是堅持研究自己喜歡的數學問題。

張益唐在 58 歲暴得大名,各種獎項與頭銜接踵而來,在最是少年逞英豪的數學世界裡,真成為一個異數。英國數學家哈代在他著名的小冊子《一個數學家的辯白》裡曾說:「我不知道有任何一項數學的主要進展,是由超過五十歲的人所啟動。」張益唐正好給哈代的偏見一個反例。

張益唐研究的是關於質數的性質。

一個自然數 p 是質數(也稱為素數)的條件有二:其一,p 大於 1;其二,除了 1 與 p 自己之外,沒有別的自然數能整除 p。全體質數可以從小到大排成一個數列 2, 3, 5, 7, 11, 13, …,通常把排在第 n 個位置的質數記作 pn。如果 pn 與 pn+1 相差為2,則稱質數對 (pn, pn+1) 為一對孿生質數,例如 3 與 5,5 與 7,11 與 13。

圖/envato elements

「孿生質數猜想」就說這樣的質數對有無窮多組。因為古希臘的歐幾里得在他的巨著《原本》裡,曾經證明質數有無窮多個,所以有人以為也是歐幾里得最先提出孿生質數猜想。其實不然,目前從文獻中所見, 1879 年英國數學家格萊舍(James Whitbread Lee Glaisher)在《數學信使》(Messenger of Mathematics)雜誌上的一篇文章,才是第一次將孿生質數猜想見諸文字。

張益唐的大突破是證明有無窮多組質數對 (pn, pn+1) 使得 pn 與 pn+1 相距不超過 7 千萬。

為什麼這是一個大突破呢?因為在張益唐之前,不管給出什麼固定數 m,完全不知道相差在 m 之內的質數對,到底是有限多個還是無窮多個。自從 2013 年 5 月他的成就在國際媒體上廣為流傳之後,世界上很多數學家努力要把 7千萬的差距往下壓縮,目前已經改善到 246 之內。但是距離孿生質數猜想所需的 2,還有巨大而艱困的鴻溝。

一般人從媒體得知張益唐對數學做出了重大貢獻,可能會好奇問他的結果有什麼用?這裡「用」當然是指實際的應用。其實,他的成果目前還只有純學術價值,與國計民生毫不相干。自從古希臘人辨識出質數,在兩千多年的時間裡,除了數學家關心質數外,質數一直缺乏任何應用價值。二十世紀電腦發達之後,才利用因數分解成質數的超級困難特性,產生了某些幾乎無法有效破解的密碼系統,廣泛的應用到金融、通信、資料保密上。

圖/envato elements

在中國古算裡缺席?

一個基本的數學概念,經歷了兩千多年的滄桑,才顯現出它的實用價值,這不是一件平凡的成就。因此,我們不得不佩服希臘人研究質數的真知灼見,並且感嘆十八世紀前的中國傳統數學裡卻不見質數的蹤跡。質數為什麼會在中國遲來報到?實在是一個令人費解的現象。

歐幾里得的《原本》約在西元前 300 年左右成書,是古希臘數學集大成之作。第七卷討論數的性質,是使用幾何的觀點來理解數。也就是從「單位」的概念出發,以度量直線段的方式引入「數」。第七卷定義 2 說「一個數是由許多單位合成的。」因此,1 代表單位而不算作「數」。定義 11 說「質數是只能為一個單位所量盡者。」定義 16 說「兩數相乘得出的數稱為面,其兩邊就是相乘的數。」所以質數只能是線,而不能稱為面。

歐幾里德畫像。圖/wiki, 公有領域

從這些定義可看出來,古希臘人所謂的「數」是依附在幾何的體系裡而得以操作。中國古代缺乏像《原本》這種按照邏輯次序鋪陳結果的數學書,通常是以解決實際問題的風貌來書寫,因此不太可能探討與闡述「數」的純粹性質。

例如,以《九章算術》為代表的中國古算裡,數字是與矩形、直角三角形的面積緊密相連結,但卻沒有像希臘人那樣分辨,有些數是可以表現為面,而有些數卻不可以。

也許古代中國缺乏一項歐幾里得所擁有的知識背景,因而造成了雙方關注問題的差異。古希臘有一位重要的哲人德謨克利特(Democritus),他主張萬物皆由不可分割的「原子」所構成。在「原子論」的知識背景下,數目 1 就不會與其他數目等量齊觀了,1 是「單位」,是數的「原子」。

圖/envato elements

中國古代沒有明確的「原子論」,《墨子.經說下》所說:「非半,進前取也。前,則中無為半,猶端也。」其中切得不能再切的「端」在《墨子.經說上》解釋為「端,體之無序而最前者也。」也只是類似「原子」的概念,並未發展到德謨克利特的思想程度。「原子論」思想的欠缺,或許是質數在中國古算裡缺席的因素之一。

難以望其項背

康熙敕編的《御製數理精蘊》(簡稱《數理精蘊》)是融合中西數學的百科全書,其中將質數譯為「數根」,並且在附表〈對數闡微〉中列有質數表。雖然質數已經在中國現身,但是數學家並沒有感到相見恨晚而深入探討。

晚清數學名家李善蘭在翻譯歐幾里得《原本》後九卷時,第一卷第一界說為:「數根者唯一能度而他數不能度」,也把質數翻譯成「數根」。

數學家李善蘭。圖/傅任敢 《中華教育界》 1936 -1937年, 公有領域

李善蘭很可能受《數理精蘊》的影響,而去研究判別給定數是否為質數的方法。英國傳教師偉烈亞力(Alexander Wylie)將其中一法,以給編輯的信公布在香港一家英文雜誌上,其敘述為「以 2 的對數乘給定的數,求出其真數,以 2 減同數,以給定數除餘數,若能除盡,則給定數為質數;若不能除盡,則不是質數。」

此命題常被稱為「中國定理」,其實是歐洲早已知道的「費馬小定理」的逆命題,該定理斷言若 p 為質數,則 2p − 2 ≣ 0 (mod p)。

其實李善蘭的方法並不永遠正確,例如:2341 − 2 是 341 的整倍數,但是 341 = 11 × 31 並不是一個質數。1872 年李善蘭在《中西聞見錄》報刊發表了〈考數根法〉一文,成為清末關於質數研究的重要成果,但是他並沒有收錄「中國定理」,應該是他已經知道命題並不為真。

要知道李善蘭與高斯的生命是有重疊的時期,因此當西方以質數為基礎所建立的數論,已經繁複深刻美不勝收之時,也許連李善蘭都不曾完全清楚中國落後的程度是多麼巨大!


數感宇宙探索課程,現正募資中!

天下文化_96
9 篇文章 ・ 7 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。