0

0
1

文字

分享

0
0
1

《精準預測 The Signal and the Noise》-貝氏定理的單純數學

PanSci_96
・2013/09/30 ・3433字 ・閱讀時間約 7 分鐘 ・SR值 529 ・七年級

-----廣告,請繼續往下閱讀-----

精準預測-立體書封-大如果貝氏定理的哲學基礎豐富得出人意料,那定理的數學則是單純得令人震驚。定理最基本的形式只是一組代數表達式,有三個已知的變項,一個未知的變項。但這個單純的公式可以導出非常有預測力的洞見。

貝氏定理與條件機率(conditional probability)有關。也就是說,這個定理會告訴我們如果某些事件發生之後,某個理論或假設為真的機率有多少。

假設你跟一位伴侶同居,你出差回來的時候,發現你衣櫃的抽屜裡有件陌生的內衣。你或許會問自己:你的伴侶出軌的機率有多少?條件是你發現了內衣;你有興趣評估的假設是你被背叛的機率有多少。信不信由你,貝氏定理就能給你這類問題的答案—前提是你知道(或願意評估)三個數量:

  • 首先,你必須以內衣的出現作為假設為真—也就是說,你被背叛了—的條件,評估這樣的機率是多少。為了處理這個問題,讓我們假設你是女性,而你的伴侶是男性,我們討論中的內衣是一件內褲。如果他背叛了你,當然很容易想像內褲是怎麼來的。反之,就算(而且或許尤其是)他真的背叛了你,你或許也會希望他更小心一點。我們假設以他背叛你為條件,內褲出現的機率是百分之五十。
  • 第二,你必須以內衣出現作為假設為偽的條件。如果他沒有不忠,那內褲的出現有沒有什麼合理的解釋?當然,不是所有的解釋都能讓人滿意(那可能是他的內褲)。可能是他的行李被搞亂了。可能是他一位純友誼的女性朋友,是你也信任的人,來過了夜。內褲可能是要給你的禮物,他忘了包起來。這些理論沒有一個是完全站不住腳的,不過有些跟「狗把我的作業吃掉了」這樣的藉口差不多。整體來說,你給這些理論的機率放在百分之五。
  • 第三,也是最重要的,你需要貝氏學派所說的「先驗機率」(prior probability,或單純稱為先驗,prior)。你在找到內衣之前,你認為他背叛你的機率有多高?當然,既然內褲已經出現了,對這點就很難完全客觀了。(理想上來說,你在開始檢視證據之前就要建立你的先驗機率了。)但有時候是有可能從經驗上來評估像這樣的數字的。例如,研究發現在特定的任何一年,大約有百分之四已婚的伴侶會對配偶不忠,所以我們就以這個為我們的先驗機率。

如果我們估計過這些數值,那麼就可以運用貝氏定理來建立後驗機率(posterior possibility)。這就是我們有興趣的數字:根據我們找到的內衣,我們被背叛的機率有多高?計算結果(以及產生結果的單純代數表達式)。

-----廣告,請繼續往下閱讀-----

先驗機率:
他背叛你的可能性初始估計:x = 4%

新事件發生:找到神秘內衣
以他背叛為條件,出現內衣的機率:y = 50%
以他沒有背叛為條件,出現內衣的機率:z = 5%

後驗機率:
已知你找到內衣,修正後他背叛你的可能估計:xy / [xy + z ( 1 – x )] = 29%

結果發現這個機率還是相當低:百分之二十九。這樣似乎還是違反直覺—這些內衣不就很能顯示他有罪了嗎?但是這個數字主要來自於你指派給他背叛的先驗機率很低。雖然無辜的男人不像有罪的男人那樣,對出現內褲有那麼多花言巧語的解釋,但是你一開始就認為他是個無辜的男人,所以在等式裡就佔了很大的比重。

-----廣告,請繼續往下閱讀-----

先驗機率高的時候,儘管有新證據出現,還是會強韌得令人訝異。這個狀況典型的例子之一就是四十多歲的女性出現乳癌的狀況。女性在四十多歲時得到乳癌的機會很幸運的相當低—大約百分之一‧四。但是如果乳房攝影檢查結果是陽性,那機率又是多少?

研究顯示,如果女性沒有罹患癌症,而乳房攝影錯誤斷言說她有癌症的機率大約只有百分之十。另一方面,如果她確實有癌症,有百分之七十五的機會會偵測出來。你看到這些統計數字的時候,陽性的乳房攝影結果似乎的確是非常糟糕的消息。但要是你把貝氏定理用到這些數字上,你就會得到不同的結論:假定四十歲的女性乳房攝影為陽性,她得乳癌的機率還是只有大約百分之十。這些假陽性的結果會比這個等式看起來地位更高,是因為年輕女性本來就很少會有乳癌。因為這個理由,所以許多醫生建議,女性要到五十歲以後再開始做定期乳房攝影,那時得乳癌的先驗機率要高得多。

像這樣的問題無疑挑戰極大。最近有份研究,用調查來了解美國民眾對統計的認識程度,就讓民眾看了這個乳癌的例子,發現只有百分之三的民眾提出的機率估計是正確的。有時候,慢下腳步用視覺看看問題(如圖8-4),可以檢查我們不正確的趨近法是否合乎事實。這樣的方式讓人比較容易看到更大的層面—由於乳癌在年輕女性身上非常稀少,所以陽性的乳房攝影結果這件事並不是那麼有效。

然而,我們通常會專注在最新、最直接可得的資訊,而看不到更大的層面。像鮑勃‧伏加瑞斯這樣的聰明賭徒已經學會如何利用我們思考的這種缺陷。他下注湖人隊大有賺頭,一部分是因為莊家太過看重湖人隊的前面幾場比賽,把他們贏得冠軍的機率從四分之一降到六‧五分之一,即使以一支有位明星球員受傷的球隊來說,他們這樣的表現已經算不錯了。貝氏定理需要我們更謹慎地去考量這些問題,在我們憑感覺得到的趨近法實在太過於粗糙的時候,可以靠這個定理來檢測,它非常有用。

-----廣告,請繼續往下閱讀-----

圖8-4

然而,這不表示我們的先驗機率永遠都比新證據地位更高。或是說貝氏定理本來就會產出違反直覺的結果。有時候新的證據非常有力,可以推倒其他一切,而某件事我們可以從原來指派近乎零的機率,立刻就改為幾乎必然發生。

想一想這個令人難過的例子:九一一恐怖攻擊。那天早上起床的時候,我們多數人幾乎都不會指派任何機率給恐怖分子用飛機撞進曼哈頓的大樓這樣的事件。但是第一架飛機一撞上世界貿易中心,我們就承認了恐怖攻擊是種明顯的可能。第二棟大樓一被撞上,我們被攻擊這件事就無庸置疑了。貝氏定理可以複製這個結果。

例如,假設在第一架飛機撞上之前,我們估計曼哈頓的高樓遭受恐怖攻擊的可能性只有大約兩萬分之一,或是百分之○‧○○五。然而,我們指派給飛機因為意外而撞上世界貿易中心的機率也非常低。這些數字是真的可以用經驗估計出來的:九一一事件之前的兩萬五千天之中,曼哈頓上空的航空狀況出現過兩次這樣的意外,一次是一九四五年的帝國大廈,另一次是一九四六年在華爾街四十號。這樣在任何特定的一天,這種意外發生的機率就是一萬兩千五百分之一。如果你用貝氏定理來運算這些數,第一架飛機撞上的那一刻,我們分派給恐怖攻擊的機率就會從百分之○‧○○五增加到百分之三十八。

然而,貝氏定理背後的概念不是要我們只要更新一次機率的估計就好。而是說,隨著我們看到新的證據出現,我們就應該不斷地這樣做。因此,在第一架飛機撞上之後,我們恐怖攻擊的後驗機率:百分之三十八,在第二架飛機撞上之前,就變成了我們的先驗機率。而要是你再次計算這個算式,來考慮第二架飛機撞上世貿中心的狀況,那我們遭受攻擊的機率就變成了幾乎確定—百分之九十九‧九九。

-----廣告,請繼續往下閱讀-----

先驗機率:
恐怖份子會用飛機撞上曼哈頓的摩天大樓,其可能性的初始估計:x = 0.005%

新事件發生:第一架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖分子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率:z = 0.008%

後驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 38%


先驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:x = 38%

-----廣告,請繼續往下閱讀-----

新事件發生:第二架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖份子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率(也就是意外):z = 0.008%

後驗機率:
已知第二架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 99.99%

我們都會驚恐的推論,在豔陽高照的紐約發生一次意外已經夠不可能了,第二次幾乎是真的完全不可能。

我故意挑了些有挑戰性的例子—恐怖攻擊、癌症、被背叛—是因為我想演示貝氏推理法所能處理問題的廣度。貝氏定理不是什麼神奇公式—在我們使用過的單純形式中,裡面包含的不過是加減乘除。我們必須要提供它資訊,尤其是我們對先驗機率的估計,它才能產生有用的結果。

-----廣告,請繼續往下閱讀-----

然而,貝氏定理確實要求我要用機率來看待這個世界,就算是談到我們不願意認為是機率問題的事情也一樣。這定理沒有要求我們採取立場,去認為這個世界本質上、形而上是不確定的—拉普拉斯認為從星球的軌道到最小分子的行為,一切都是受一絲不苟的牛頓定律所支配,然而他在貝氏定理的發展上大有助益。說得更確切些,貝氏定理處理的是認識論上(epistemological)的不確定—我們知識的限制。

摘自《精準預測:如何從巨量雜訊中,看出重要的訊息?》,由三采文化出版。

文章難易度
PanSci_96
1219 篇文章 ・ 2192 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

0
0

文字

分享

0
0
0
賭博與愛情公式:用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/06 ・2486字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

理解期望值,有助於分析賭場裡的大部分賭局,以及美國中西部和英國的嘉年華會中,常有人玩、但一般人比較不熟悉的賭法:骰子擲好運(chuck-a-luck)。

招攬人來玩「骰子擲好運」的說詞極具說服力:你從 1 到 6 挑一個號碼,莊家一次擲三顆骰子,如果三個骰子都擲出你挑的號碼,莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼,莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼,莊家付你 1 美元。如果你挑的號碼一個也沒有出現,那你要付莊家 1 美元。賽局用三個不同的骰子,你有三次機會贏,而且,有時候你還不只贏 1 美元,最多也不過輸 1 美元。

我們可以套用名主持人瓊安.李維絲(Joan Rivers)的名言(按:她的名言是:「我們能聊一聊嗎?」),問一句:「我們能算一算嗎?」(如果你寧願不算,可以跳過這一節。)不管你選哪個號碼,贏的機率顯然都一樣。不過,為了讓計算更明確易懂,假設你永遠都選 4。骰子是獨立的,三個骰子都出現 4 點的機率是 1/6×1/6×1/6=1/216,你約有 1/216 的機率會贏得 3 美元。

-----廣告,請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率,會難算一點。但你可以使用第 1 章提到的二項機率分布,我會在這裡再導一遍。三個骰子中出現兩個 4,有三種彼此互斥的情況:X44、4X4 或 44X,其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6=5/216,第二種和第三種的結果也是這樣。三者相加,可得出三個骰子裡出現兩個 4 點的機率為 15/216,你有這樣的機率會贏得 2 美元。

圖/envato

同樣的,要算出三個骰子裡只出現一個 4 點的機率,也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6=25/216,得到 X4X 和 XX4 的機率亦同,三者相加,得出 75/216。這是三個骰子裡僅出現一個 4 點的機率,因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率,我們只要算出剩下的機率是多少即可。算法是用 1(或是100%)減去(1/216 +15/216 + 75/216),得出的答案是 125/216。所以,平均而言,你每玩 216 次骰子擲好運,就有 125 次要輸 1 美元。

這樣一來,就可以算出你贏的期望值($3×1/216)+($2×15/216)+($1×75/216)+(–$1×125/216)=$(–17/216)=–$0.08。平均來說,你每玩一次這個看起來很有吸引力的賭局,大概就要輸掉 8 美分。

-----廣告,請繼續往下閱讀-----

尋找愛情,有公式?

面對愛情,有人從感性出發,有人以理性去愛。兩種單獨運作時顯然效果都不太好,但加起來⋯⋯也不是很妙。不過,如果善用兩者,成功的機率可能還是大一些。回想舊愛,憑感性去愛的人很可能悲嘆錯失的良緣,並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人,很可能會對以下的機率結果感興趣。

在我們的模型中,假設女主角——就叫她香桃吧(按:在希臘神話中,香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物,象徵愛與美)有理由相信,在她的「約會生涯」中,會遇到 N 個可能成為配偶的人。對某些女性來說,N 可能等於 2;對另一些人來說,N 也許是 200。香桃思考的問題是:到了什麼時候我就應該接受X先生,不管在他之後可能有某些追求者比他「更好」?我們也假設她是一次遇見一個人,有能力判斷她遇到的人是否適合她,以及,一旦她拒絕了某個人之後,此人就永遠出局。

為了便於說明,假設香桃到目前為止已經見過 6 位男士,她對這些人的排序如下:3—5—1—6—2—4。這是指,在她約過會的這 6 人中,她對見到的第一人的喜歡程度排第 3 名,對第二人的喜歡程度排第 5 名,最喜歡第三個人,以此類推。如果她見了第七個人,她對此人的喜歡程度超過其他人,但第三人仍穩居寶座,那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人,她就更新追求者的相對排序。她在想,到底要用什麼樣的規則擇偶,才能讓她最有機會從預估的 N 位追求者中,選出最好的。

圖/envato

要得出最好的策略,要善用條件機率(我們會在下一章介紹條件機率)和一點微積分,但策略本身講起來很簡單。如果有某個人比過去的對象都好,且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面,她大概需要拒絕前面的 37%,之後真命天子出現時(如果有的話),就接受。

-----廣告,請繼續往下閱讀-----

舉例來說,假設香桃不是太有魅力,她很可能只會遇見 4 個合格的追求者。我們進一步假設,這 4 個人與她相見的順序,是 24 種可能性中的任何一種(24=4×3×2×1)。

由於 N=4,37% 策略在這個例子中不夠清楚(無法對應到整數),而 37% 介於 25% 與 50% 之間,因此有兩套對應的最佳策略如下:

(A)拒絕第一個對象(4×25%=1),接受後來最佳的對象。

(B)拒絕前兩名追求者(4×50%=2),接受後來最好的求愛者。

如果採取A策略,香桃會在 24 種可能性中的 11 種,選到最好的追求者。採取 B 策略的話,會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列,如同前述,1 代表香桃最偏好的追求者,2 代表她的次佳選擇,以此類推。因此,3—2—1—4 代表她先遇見第三選擇,再來遇見第二選擇,第三次遇到最佳選擇,最後則遇到下下之選。序列後面標示的 A 或 B,代表在這些情況下,採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告,請繼續往下閱讀-----

1234;1243;1324;1342;1423;1432;2134(A);2143(A);2314(A, B);2341(A, B);2413(A, B);2431(A, B);3124(A);3142(A);3214(B);3241(B);3412(A, B);3421;4123(A);4132(A);4213(B);4231(B);4312(B);4321

如果香桃很有魅力,預期可以遇見 25 位追求者,那她的策略是要拒絕前 9 位追求者(25 的 37% 約為 9),接受之後出現的最好對象。我們也可以用類似的表來驗證,但是這個表會變得很龐雜,因此,最好的策略就是接受通用證明。(不用多說,如果要找伴的人是男士而非女士,同樣的分析也成立。)如果 N 的數值很大,那麼,香桃遵循這套 37% 法則擇偶的成功率也約略是 37%。接下來的部分就比較難了:要如何和真命天子相伴相守。話說回來,這個 37% 法則數學模型也衍生出許多版本,其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。

0

10
2

文字

分享

0
10
2
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

-----廣告,請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

-----廣告,請繼續往下閱讀-----
Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
胡中行_96
169 篇文章 ・ 65 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

4
3

文字

分享

0
4
3
你能想像棒球穿牆嗎?突破物理世界的常識:量子穿隧——《阿宅聯盟:量子危機》
未來親子學習平台
・2023/01/20 ・1226字 ・閱讀時間約 2 分鐘

-----廣告,請繼續往下閱讀-----

想像一個全壘打王,面對前方的來球,大棒一揮,球越過了全壘打牆,到了牆的另外一邊。

Home~~~Run!圖/GIPHY

但假如,那個全壘打牆變成了兩層樓高呢?也許,他更大力地擊球(給球更多的能量),那顆球還是能夠飛越過全壘打牆,到牆的另外一邊。但如果,那全壘打牆變成了三十層樓高呢?我想會認為,除非靠機器,否則再厲害的全壘打王,不管用了多少力氣,他應該都無法讓球飛過三十層樓那麼高。

上述的例子,正顯示了我們日常生活中的物理原則:只要物體(球)的能量不足以跨越障礙物(牆),那麼它永遠不可能到達障礙物的另一側——但是,在量子的世界,卻不是這樣。

粒子是怎麼跨越各種障礙的?

量子力學裡,一個粒子具備的能量即使不足以跨越障礙,它仍然有小機率會出現在障礙的另一邊;而且,若粒子的能量跟跨越障礙所需要的能量愈接近、或是說只少一點,那麼這個粒子出現在障礙另一邊的機率就愈大。

-----廣告,請繼續往下閱讀-----

這樣神奇的現象,彷彿就像是粒子挖了隧道穿過障礙一般(儘管並沒有真的隧道),所以稱為「量子穿隧」效應。

不過,在丟球的例子裡,我們可以想像,若是牆愈高或愈厚,那麼球就愈難飛過牆壁。同樣地,在量子力學的情形下,雖然粒子有可能在能量不足的狀況下穿過障礙,但要是障礙無限高或無限厚的話,那麼粒子就還是過不去的

儘管在量子力學的情況下,障礙無限高或無限厚,粒子還是過不去的。圖/Envato Elements

事實上,量子穿隧效應跟我們先前提到的「物質具有波的特性」非常有關係。想像水池中間有一顆大石頭,池中的水波在遇到石頭這個障礙物時,會從旁邊繞道而過;但如果是一般物質,一旦遇到障礙物就直接被擋住了,沒辦法繞道而行。

就是因為在量子世界,物質也具有波的特性,我們才會看到粒子的穿隧效應。儘管量子效應感覺很奇特,但它在很多方面都有實際的影響。

-----廣告,請繼續往下閱讀-----

例如,我們知道太陽核心是依賴核融合反應來產生能量;在過程中,會將兩個氫原子核,融合成更重的原子核。但因為氫原子核都帶正電,要抵抗正電荷間的排斥力,將它們融合在一起,其實非常困難。也幸虧有量子穿隧效應,太陽內部的氫原子核才能克服電荷排斥力的阻礙,順利融合在一起,並製造能量。

所以,在地球的我們,能夠享受到太陽的光和熱,說起來也要感謝量子穿隧效應呢!

——本文摘自《阿宅聯盟:量子危機》,2022 年 11 月,未來出版,未經同意請勿轉載

未來親子學習平台
3 篇文章 ・ 3 位粉絲

0

0
1

文字

分享

0
0
1
《精準預測 The Signal and the Noise》-貝氏定理的單純數學
PanSci_96
・2013/09/30 ・3433字 ・閱讀時間約 7 分鐘 ・SR值 529 ・七年級

-----廣告,請繼續往下閱讀-----

精準預測-立體書封-大如果貝氏定理的哲學基礎豐富得出人意料,那定理的數學則是單純得令人震驚。定理最基本的形式只是一組代數表達式,有三個已知的變項,一個未知的變項。但這個單純的公式可以導出非常有預測力的洞見。

貝氏定理與條件機率(conditional probability)有關。也就是說,這個定理會告訴我們如果某些事件發生之後,某個理論或假設為真的機率有多少。

假設你跟一位伴侶同居,你出差回來的時候,發現你衣櫃的抽屜裡有件陌生的內衣。你或許會問自己:你的伴侶出軌的機率有多少?條件是你發現了內衣;你有興趣評估的假設是你被背叛的機率有多少。信不信由你,貝氏定理就能給你這類問題的答案—前提是你知道(或願意評估)三個數量:

  • 首先,你必須以內衣的出現作為假設為真—也就是說,你被背叛了—的條件,評估這樣的機率是多少。為了處理這個問題,讓我們假設你是女性,而你的伴侶是男性,我們討論中的內衣是一件內褲。如果他背叛了你,當然很容易想像內褲是怎麼來的。反之,就算(而且或許尤其是)他真的背叛了你,你或許也會希望他更小心一點。我們假設以他背叛你為條件,內褲出現的機率是百分之五十。
  • 第二,你必須以內衣出現作為假設為偽的條件。如果他沒有不忠,那內褲的出現有沒有什麼合理的解釋?當然,不是所有的解釋都能讓人滿意(那可能是他的內褲)。可能是他的行李被搞亂了。可能是他一位純友誼的女性朋友,是你也信任的人,來過了夜。內褲可能是要給你的禮物,他忘了包起來。這些理論沒有一個是完全站不住腳的,不過有些跟「狗把我的作業吃掉了」這樣的藉口差不多。整體來說,你給這些理論的機率放在百分之五。
  • 第三,也是最重要的,你需要貝氏學派所說的「先驗機率」(prior probability,或單純稱為先驗,prior)。你在找到內衣之前,你認為他背叛你的機率有多高?當然,既然內褲已經出現了,對這點就很難完全客觀了。(理想上來說,你在開始檢視證據之前就要建立你的先驗機率了。)但有時候是有可能從經驗上來評估像這樣的數字的。例如,研究發現在特定的任何一年,大約有百分之四已婚的伴侶會對配偶不忠,所以我們就以這個為我們的先驗機率。

如果我們估計過這些數值,那麼就可以運用貝氏定理來建立後驗機率(posterior possibility)。這就是我們有興趣的數字:根據我們找到的內衣,我們被背叛的機率有多高?計算結果(以及產生結果的單純代數表達式)。

-----廣告,請繼續往下閱讀-----

先驗機率:
他背叛你的可能性初始估計:x = 4%

新事件發生:找到神秘內衣
以他背叛為條件,出現內衣的機率:y = 50%
以他沒有背叛為條件,出現內衣的機率:z = 5%

後驗機率:
已知你找到內衣,修正後他背叛你的可能估計:xy / [xy + z ( 1 – x )] = 29%

結果發現這個機率還是相當低:百分之二十九。這樣似乎還是違反直覺—這些內衣不就很能顯示他有罪了嗎?但是這個數字主要來自於你指派給他背叛的先驗機率很低。雖然無辜的男人不像有罪的男人那樣,對出現內褲有那麼多花言巧語的解釋,但是你一開始就認為他是個無辜的男人,所以在等式裡就佔了很大的比重。

-----廣告,請繼續往下閱讀-----

先驗機率高的時候,儘管有新證據出現,還是會強韌得令人訝異。這個狀況典型的例子之一就是四十多歲的女性出現乳癌的狀況。女性在四十多歲時得到乳癌的機會很幸運的相當低—大約百分之一‧四。但是如果乳房攝影檢查結果是陽性,那機率又是多少?

研究顯示,如果女性沒有罹患癌症,而乳房攝影錯誤斷言說她有癌症的機率大約只有百分之十。另一方面,如果她確實有癌症,有百分之七十五的機會會偵測出來。你看到這些統計數字的時候,陽性的乳房攝影結果似乎的確是非常糟糕的消息。但要是你把貝氏定理用到這些數字上,你就會得到不同的結論:假定四十歲的女性乳房攝影為陽性,她得乳癌的機率還是只有大約百分之十。這些假陽性的結果會比這個等式看起來地位更高,是因為年輕女性本來就很少會有乳癌。因為這個理由,所以許多醫生建議,女性要到五十歲以後再開始做定期乳房攝影,那時得乳癌的先驗機率要高得多。

像這樣的問題無疑挑戰極大。最近有份研究,用調查來了解美國民眾對統計的認識程度,就讓民眾看了這個乳癌的例子,發現只有百分之三的民眾提出的機率估計是正確的。有時候,慢下腳步用視覺看看問題(如圖8-4),可以檢查我們不正確的趨近法是否合乎事實。這樣的方式讓人比較容易看到更大的層面—由於乳癌在年輕女性身上非常稀少,所以陽性的乳房攝影結果這件事並不是那麼有效。

然而,我們通常會專注在最新、最直接可得的資訊,而看不到更大的層面。像鮑勃‧伏加瑞斯這樣的聰明賭徒已經學會如何利用我們思考的這種缺陷。他下注湖人隊大有賺頭,一部分是因為莊家太過看重湖人隊的前面幾場比賽,把他們贏得冠軍的機率從四分之一降到六‧五分之一,即使以一支有位明星球員受傷的球隊來說,他們這樣的表現已經算不錯了。貝氏定理需要我們更謹慎地去考量這些問題,在我們憑感覺得到的趨近法實在太過於粗糙的時候,可以靠這個定理來檢測,它非常有用。

-----廣告,請繼續往下閱讀-----

圖8-4

然而,這不表示我們的先驗機率永遠都比新證據地位更高。或是說貝氏定理本來就會產出違反直覺的結果。有時候新的證據非常有力,可以推倒其他一切,而某件事我們可以從原來指派近乎零的機率,立刻就改為幾乎必然發生。

想一想這個令人難過的例子:九一一恐怖攻擊。那天早上起床的時候,我們多數人幾乎都不會指派任何機率給恐怖分子用飛機撞進曼哈頓的大樓這樣的事件。但是第一架飛機一撞上世界貿易中心,我們就承認了恐怖攻擊是種明顯的可能。第二棟大樓一被撞上,我們被攻擊這件事就無庸置疑了。貝氏定理可以複製這個結果。

例如,假設在第一架飛機撞上之前,我們估計曼哈頓的高樓遭受恐怖攻擊的可能性只有大約兩萬分之一,或是百分之○‧○○五。然而,我們指派給飛機因為意外而撞上世界貿易中心的機率也非常低。這些數字是真的可以用經驗估計出來的:九一一事件之前的兩萬五千天之中,曼哈頓上空的航空狀況出現過兩次這樣的意外,一次是一九四五年的帝國大廈,另一次是一九四六年在華爾街四十號。這樣在任何特定的一天,這種意外發生的機率就是一萬兩千五百分之一。如果你用貝氏定理來運算這些數,第一架飛機撞上的那一刻,我們分派給恐怖攻擊的機率就會從百分之○‧○○五增加到百分之三十八。

然而,貝氏定理背後的概念不是要我們只要更新一次機率的估計就好。而是說,隨著我們看到新的證據出現,我們就應該不斷地這樣做。因此,在第一架飛機撞上之後,我們恐怖攻擊的後驗機率:百分之三十八,在第二架飛機撞上之前,就變成了我們的先驗機率。而要是你再次計算這個算式,來考慮第二架飛機撞上世貿中心的狀況,那我們遭受攻擊的機率就變成了幾乎確定—百分之九十九‧九九。

-----廣告,請繼續往下閱讀-----

先驗機率:
恐怖份子會用飛機撞上曼哈頓的摩天大樓,其可能性的初始估計:x = 0.005%

新事件發生:第一架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖分子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率:z = 0.008%

後驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 38%


先驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:x = 38%

-----廣告,請繼續往下閱讀-----

新事件發生:第二架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖份子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率(也就是意外):z = 0.008%

後驗機率:
已知第二架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 99.99%

我們都會驚恐的推論,在豔陽高照的紐約發生一次意外已經夠不可能了,第二次幾乎是真的完全不可能。

我故意挑了些有挑戰性的例子—恐怖攻擊、癌症、被背叛—是因為我想演示貝氏推理法所能處理問題的廣度。貝氏定理不是什麼神奇公式—在我們使用過的單純形式中,裡面包含的不過是加減乘除。我們必須要提供它資訊,尤其是我們對先驗機率的估計,它才能產生有用的結果。

-----廣告,請繼續往下閱讀-----

然而,貝氏定理確實要求我要用機率來看待這個世界,就算是談到我們不願意認為是機率問題的事情也一樣。這定理沒有要求我們採取立場,去認為這個世界本質上、形而上是不確定的—拉普拉斯認為從星球的軌道到最小分子的行為,一切都是受一絲不苟的牛頓定律所支配,然而他在貝氏定理的發展上大有助益。說得更確切些,貝氏定理處理的是認識論上(epistemological)的不確定—我們知識的限制。

摘自《精準預測:如何從巨量雜訊中,看出重要的訊息?》,由三采文化出版。

文章難易度
PanSci_96
1219 篇文章 ・ 2192 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。