編按:在前沿天文學中,所有觀測的結果都會是數字,而所有的數字解讀都需倚仗統計學。《重力的幽靈》第五章探討了統計檢測的隱藏歷史。
在物理學中,是要使用貝葉斯統計 (Bayesian Methods) 還是頻率論 (Frequentist probability) ,長期以來有著爭論。
兩者究竟差在哪?該選哪邊站?
事實上,這種爭論是如此長期地存在,並存在著如此熱情,使雙方有時會開玩笑地把他們喜好的偏好當成是統計的「信仰」。有幾個原因值得讓我們看一下這個信仰。
首先,檢視信仰之間的爭論是一個方法,得以顯示出統計數據的解釋總是主觀的,無論它看起來是如何的客觀。
其二,如我將在本章所論證的,貝葉斯方法可以用來正當化涉及弱宣稱 (weakclaim) 的發表策略。
這兩個統計信仰之間關鍵的區別似乎是在於:
貝葉斯統計相信,所有基於統計學聲稱核心的不可能性敘述,必須考慮到你已經相信的世界,也就是聲稱的「先驗概率」(priorprobability),是真實的。
頻率論則認為先驗概率過於主觀,不能出現在統計計算中;那樣只是產生了一個數字,而這個數字只反應了你所計算的可能性為何,並非計算可信與否。
很明顯地,在貝葉斯統計和頻率論對不可能性的評估中,先驗可信度扮演了一定的角色。如果頻率論正在尋找一個恆星,而計算暗示望遠鏡發現了天空中有頭噴火的巨龍,他們也不大可能進行舉報。
在一封電子郵件中,我的受訪者是一位堅定的貝葉斯主義者,關於尋找重力波,他是這樣看的:
我覺得首次偵測的評斷標準多半是社會學的。要說服人,需要的是證據與團隊信譽的水準,我們看到的東西完全超出他們的經驗(重力源),並非全是他們所經驗過的東西(偵測器雜訊、飛機等等)。這個水準主要取決於我們希望說服的人所持的態度,以及他們對於將數據解釋為重力波的先驗傾向 (priorpredisposition) 。一旦我們做到了這一點,重力波就會很神奇地進入他們的經驗之中。一切都變得更容易,我們就可以自由自在地,像個正常的天體物理學家。(即,瘋狂臆測並亂搞,而不會受到責備!)
先驗預期以更為不起眼的方式,扮演著它的角色。例如,在相隔遙遠的兩個偵測器上偵測到的信號有時間巧合,而背景中僅有極為少數的時間巧合,這樣的聲稱有賴於重力波的先驗模型,也就是重力波是來自於一個侷限的天區,並且是以光速傳遞。我們知道在這樣的速度下,相隔兩千英里的兩個偵測器之間的「時間巧合」,發出兩個信號的時間間隔不能超過 1/100 秒。
這意味著,如果試圖找出可能只由雜訊所引起時間巧合的背景信號,可以忽略所有時間間隔超過 1/100 秒的事件——那些並非「時間巧合」。
取決於光速?還是音速?
如果重力波是以音速傳遞,就必須要考慮包含兩個事件的間隔是三個小時(或更短)的「時間巧合」。而人們只好將兩個產生作用相隔三個小時以上的事件,當成背景並予以排除。就我們所知,在這種情況下是不可能進行重力波探測的。
然而,卻也從來沒有實驗或觀測「證明」,重力波是以光速傳播——而它卻正是目前章節中所描述的科學重點的一部分。
更具體地說,相同的迴圈也適用於所有試圖憑藉著模板的偵測,像在連續波與隨機背景的情況中,甚至是有賴於發射源的粗糙模型。頻率論中的等效先驗模型,也就是韋伯和羅馬集團的陽性宣稱受到批評的核心。
貝葉斯主義者只不過是說,在完成計算之前,所有的這些先驗預期應該是計算的一個明確部分,而且應該透過一個數字來表示。頻率論傾向「在事件發生後」否認不太可能出現的結果。在大多數的情況下,頻率論者和貝葉斯主義者會在計算結束時得到相同的結論,但並不總是如此。但這個「不總是」可能會是重要的。在這個故事中的確十分重要。
一場關於「信仰」的戰爭
信仰的戰爭仍在繼續,因為貝葉斯主義者相信,頻率論丟棄或歪曲有價值的信息並(或)掩飾其運用,或者將其作為事後的決策機制。
另一方面,頻率論者指出了一個事實,要正確地將一個數字賦予某些事的「先驗機率」,是非常困難的;將先驗資訊給予數字的形式,是試圖將「主觀」的猜測偽裝成「客觀」的資訊。
貝葉斯主義者說,這也許是個猜測,但至少每個人都可以看到猜的是什麼,如果有人想要,他可以批評,也可以提出自己的猜測。貝葉斯主義者說,每個人都同意奇蹟(意想不到的效應)需要額外的證據,如果要證明的話,他們的做法是讓這項要求成為明確程序的一部分,而頻率論者只是頷首微笑同意,有些東西真是令人難以置信,然後默默接受。
本文為《重力的幽靈:關於實驗室、觀測,以及統計數據在21世紀的科學探險》推薦序,2018 年 10 月,左岸文化出版。