0

0
0

文字

分享

0
0
0

《精準預測 The Signal and the Noise》-貝氏定理的單純數學

PanSci_96
・2013/09/30 ・3433字 ・閱讀時間約 7 分鐘 ・SR值 529 ・七年級

精準預測-立體書封-大如果貝氏定理的哲學基礎豐富得出人意料,那定理的數學則是單純得令人震驚。定理最基本的形式只是一組代數表達式,有三個已知的變項,一個未知的變項。但這個單純的公式可以導出非常有預測力的洞見。

貝氏定理與條件機率(conditional probability)有關。也就是說,這個定理會告訴我們如果某些事件發生之後,某個理論或假設為真的機率有多少。

假設你跟一位伴侶同居,你出差回來的時候,發現你衣櫃的抽屜裡有件陌生的內衣。你或許會問自己:你的伴侶出軌的機率有多少?條件是你發現了內衣;你有興趣評估的假設是你被背叛的機率有多少。信不信由你,貝氏定理就能給你這類問題的答案—前提是你知道(或願意評估)三個數量:

  • 首先,你必須以內衣的出現作為假設為真—也就是說,你被背叛了—的條件,評估這樣的機率是多少。為了處理這個問題,讓我們假設你是女性,而你的伴侶是男性,我們討論中的內衣是一件內褲。如果他背叛了你,當然很容易想像內褲是怎麼來的。反之,就算(而且或許尤其是)他真的背叛了你,你或許也會希望他更小心一點。我們假設以他背叛你為條件,內褲出現的機率是百分之五十。
  • 第二,你必須以內衣出現作為假設為偽的條件。如果他沒有不忠,那內褲的出現有沒有什麼合理的解釋?當然,不是所有的解釋都能讓人滿意(那可能是他的內褲)。可能是他的行李被搞亂了。可能是他一位純友誼的女性朋友,是你也信任的人,來過了夜。內褲可能是要給你的禮物,他忘了包起來。這些理論沒有一個是完全站不住腳的,不過有些跟「狗把我的作業吃掉了」這樣的藉口差不多。整體來說,你給這些理論的機率放在百分之五。
  • 第三,也是最重要的,你需要貝氏學派所說的「先驗機率」(prior probability,或單純稱為先驗,prior)。你在找到內衣之前,你認為他背叛你的機率有多高?當然,既然內褲已經出現了,對這點就很難完全客觀了。(理想上來說,你在開始檢視證據之前就要建立你的先驗機率了。)但有時候是有可能從經驗上來評估像這樣的數字的。例如,研究發現在特定的任何一年,大約有百分之四已婚的伴侶會對配偶不忠,所以我們就以這個為我們的先驗機率。

如果我們估計過這些數值,那麼就可以運用貝氏定理來建立後驗機率(posterior possibility)。這就是我們有興趣的數字:根據我們找到的內衣,我們被背叛的機率有多高?計算結果(以及產生結果的單純代數表達式)。

先驗機率:
他背叛你的可能性初始估計:x = 4%

新事件發生:找到神秘內衣
以他背叛為條件,出現內衣的機率:y = 50%
以他沒有背叛為條件,出現內衣的機率:z = 5%

後驗機率:
已知你找到內衣,修正後他背叛你的可能估計:xy / [xy + z ( 1 – x )] = 29%

結果發現這個機率還是相當低:百分之二十九。這樣似乎還是違反直覺—這些內衣不就很能顯示他有罪了嗎?但是這個數字主要來自於你指派給他背叛的先驗機率很低。雖然無辜的男人不像有罪的男人那樣,對出現內褲有那麼多花言巧語的解釋,但是你一開始就認為他是個無辜的男人,所以在等式裡就佔了很大的比重。

先驗機率高的時候,儘管有新證據出現,還是會強韌得令人訝異。這個狀況典型的例子之一就是四十多歲的女性出現乳癌的狀況。女性在四十多歲時得到乳癌的機會很幸運的相當低—大約百分之一‧四。但是如果乳房攝影檢查結果是陽性,那機率又是多少?

研究顯示,如果女性沒有罹患癌症,而乳房攝影錯誤斷言說她有癌症的機率大約只有百分之十。另一方面,如果她確實有癌症,有百分之七十五的機會會偵測出來。你看到這些統計數字的時候,陽性的乳房攝影結果似乎的確是非常糟糕的消息。但要是你把貝氏定理用到這些數字上,你就會得到不同的結論:假定四十歲的女性乳房攝影為陽性,她得乳癌的機率還是只有大約百分之十。這些假陽性的結果會比這個等式看起來地位更高,是因為年輕女性本來就很少會有乳癌。因為這個理由,所以許多醫生建議,女性要到五十歲以後再開始做定期乳房攝影,那時得乳癌的先驗機率要高得多。

像這樣的問題無疑挑戰極大。最近有份研究,用調查來了解美國民眾對統計的認識程度,就讓民眾看了這個乳癌的例子,發現只有百分之三的民眾提出的機率估計是正確的。有時候,慢下腳步用視覺看看問題(如圖8-4),可以檢查我們不正確的趨近法是否合乎事實。這樣的方式讓人比較容易看到更大的層面—由於乳癌在年輕女性身上非常稀少,所以陽性的乳房攝影結果這件事並不是那麼有效。

然而,我們通常會專注在最新、最直接可得的資訊,而看不到更大的層面。像鮑勃‧伏加瑞斯這樣的聰明賭徒已經學會如何利用我們思考的這種缺陷。他下注湖人隊大有賺頭,一部分是因為莊家太過看重湖人隊的前面幾場比賽,把他們贏得冠軍的機率從四分之一降到六‧五分之一,即使以一支有位明星球員受傷的球隊來說,他們這樣的表現已經算不錯了。貝氏定理需要我們更謹慎地去考量這些問題,在我們憑感覺得到的趨近法實在太過於粗糙的時候,可以靠這個定理來檢測,它非常有用。

圖8-4

然而,這不表示我們的先驗機率永遠都比新證據地位更高。或是說貝氏定理本來就會產出違反直覺的結果。有時候新的證據非常有力,可以推倒其他一切,而某件事我們可以從原來指派近乎零的機率,立刻就改為幾乎必然發生。

想一想這個令人難過的例子:九一一恐怖攻擊。那天早上起床的時候,我們多數人幾乎都不會指派任何機率給恐怖分子用飛機撞進曼哈頓的大樓這樣的事件。但是第一架飛機一撞上世界貿易中心,我們就承認了恐怖攻擊是種明顯的可能。第二棟大樓一被撞上,我們被攻擊這件事就無庸置疑了。貝氏定理可以複製這個結果。

例如,假設在第一架飛機撞上之前,我們估計曼哈頓的高樓遭受恐怖攻擊的可能性只有大約兩萬分之一,或是百分之○‧○○五。然而,我們指派給飛機因為意外而撞上世界貿易中心的機率也非常低。這些數字是真的可以用經驗估計出來的:九一一事件之前的兩萬五千天之中,曼哈頓上空的航空狀況出現過兩次這樣的意外,一次是一九四五年的帝國大廈,另一次是一九四六年在華爾街四十號。這樣在任何特定的一天,這種意外發生的機率就是一萬兩千五百分之一。如果你用貝氏定理來運算這些數,第一架飛機撞上的那一刻,我們分派給恐怖攻擊的機率就會從百分之○‧○○五增加到百分之三十八。

然而,貝氏定理背後的概念不是要我們只要更新一次機率的估計就好。而是說,隨著我們看到新的證據出現,我們就應該不斷地這樣做。因此,在第一架飛機撞上之後,我們恐怖攻擊的後驗機率:百分之三十八,在第二架飛機撞上之前,就變成了我們的先驗機率。而要是你再次計算這個算式,來考慮第二架飛機撞上世貿中心的狀況,那我們遭受攻擊的機率就變成了幾乎確定—百分之九十九‧九九。

先驗機率:
恐怖份子會用飛機撞上曼哈頓的摩天大樓,其可能性的初始估計:x = 0.005%

新事件發生:第一架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖分子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率:z = 0.008%

後驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 38%


先驗機率:
已知第一架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:x = 38%

新事件發生:第二架飛機撞上世貿中心
如果恐怖份子攻擊曼哈頓的摩天大樓,飛機撞上的機率:y = 100%
恐怖份子沒有攻擊曼哈頓的摩天大樓,飛機撞上的機率(也就是意外):z = 0.008%

後驗機率:
已知第二架飛機撞上世貿中心,對恐怖攻擊修正後的機率估計:xy / [xy + z ( 1 – x )] = 99.99%

我們都會驚恐的推論,在豔陽高照的紐約發生一次意外已經夠不可能了,第二次幾乎是真的完全不可能。

我故意挑了些有挑戰性的例子—恐怖攻擊、癌症、被背叛—是因為我想演示貝氏推理法所能處理問題的廣度。貝氏定理不是什麼神奇公式—在我們使用過的單純形式中,裡面包含的不過是加減乘除。我們必須要提供它資訊,尤其是我們對先驗機率的估計,它才能產生有用的結果。

然而,貝氏定理確實要求我要用機率來看待這個世界,就算是談到我們不願意認為是機率問題的事情也一樣。這定理沒有要求我們採取立場,去認為這個世界本質上、形而上是不確定的—拉普拉斯認為從星球的軌道到最小分子的行為,一切都是受一絲不苟的牛頓定律所支配,然而他在貝氏定理的發展上大有助益。說得更確切些,貝氏定理處理的是認識論上(epistemological)的不確定—我們知識的限制。

摘自《精準預測:如何從巨量雜訊中,看出重要的訊息?》,由三采文化出版。

文章難易度
PanSci_96
1011 篇文章 ・ 1111 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

46
1

文字

分享

0
46
1
另外一個你可能存在嗎?從宇宙誕生到現在,你的存在需要經過一千兆個「偶然」——《宇宙大哉問》
天下文化_96
・2022/09/23 ・3064字 ・閱讀時間約 6 分鐘

  • 作者/豪爾赫.陳、丹尼爾.懷森
  • 譯者/徐士傑、葉尚倫

還有另一個你嗎?

如果世界上某個地方有另一個版本的你,會不會很奇怪?

這是什麼科幻劇情?圖/天下文化提供

你們兩個之間有很多共通點,喜歡吃的水果(香蕉)、不喜歡吃的水果(桃子)、擁有同樣的技能(製作香蕉冰沙)和相同的缺點(香蕉冰沙吃了停不下來)、同樣的記憶、幽默感以及個性。當你知道有其他版本的你存在時,你會覺得很怪異嗎?你會想與他們會面嗎?

想像一下更詭異的情況:有個人幾乎和你完全一模一樣,僅稍稍有些不同。如果這個人比你更好呢?也許他做的水果冰沙更加美味,或者生活的方式更有意義。或者,這個人比較沒有才華,但是比較卑鄙,就像是邪惡的分身呢?

假如有幸能見到另一個你,或許你可以發現自己的更多可能。圖/天下文化提供

這有可能嗎?

雖然讓人難以想像,但物理學家不能排除另一個你存在的可能性。事實上,物理學家不只認為另一個你是可能存在的,甚至認為另一個你存在的可能性更高。也就是說,就在此刻,當你讀到這篇文章時,可能有另一個你正在某個地方,穿著和你一樣的衣服,以相同的方式坐著,甚至讀著同樣的一本書(好吧,也許是稍微有趣的版本)。

搞不好另一個你也正在看這篇文章喔!圖/天下文化提供

要瞭解另一個你存在的意義及可能性,我們得先考慮你的存在有多麼獨特。

你存在的機率

乍看之下,世界上有另一個與你毫無二致的人,機率好像是微乎其微。畢竟,想像一下,為了讓宇宙創造你,有多少事情必須發生,而且要環環相扣,缺一不可。

超新星必須在氣體和塵埃雲附近爆炸,藉著震動造成引力崩坍,形成我們的太陽和太陽系。這些塵埃中的一小塊(不到萬分之一)必須聚集在一起形成行星,並與太陽保持合適的距離,這樣水就不會結冰或變成蒸汽。生命一定要開始,恐龍必須滅絕,人類不得不演化,羅馬帝國必須崩潰,而你的祖先必須逃過黑死病。然後,你的父母必須相遇並且喜歡上了彼此。你的母親務必在正確時間排卵。在與數十億顆精子的馬拉松游泳賽中,帶有你一半基因的精子必須衝刺獲勝。單單是讓你誕生,就需要這一連串事件。

宇宙必須經歷一連串事件,才會有現在的你。圖/天下文化提供

想一想你在生活中做出的所有決定,使你成為今日的你。你有沒有吃很多香蕉。你有沒有遇到那個重要的朋友。你那時候決定待在家裡,否則會被水果推車碾過。不知何故你發現了這本關於宇宙的蠢書,並決定閱讀它。所有的一切,都從四十五億年前開始,導致了你此時此刻在這裡存在。

假如所有事情以完全相同方式再次發生,從而造就另一個你的機會有多大?這似乎不太可能,對吧?

也許不是喔!讓我們回溯所有導致你出現的隨機事件、決定和時刻,並試著計算機率是多少。

讓我們從今天開始算起:你醒來後做了多少決定呢?你可能決定怎樣起床,穿什麼衣服,吃什麼早餐。即使是看起來很小的決定,也可能改變你的人生歷程。例如,你選擇穿有香蕉圖案的襯衫或者是領帶,可能影響你未來的配偶有沒有注意到你。

讓我們假設,你每分鐘大約會做出一兩個可能改變人生的決定;這聽起來好像很有壓力,但如果你贊同量子物理學和混沌理論,數字應該會更高。假設每分鐘只有幾個決定,那麼你每天就要做出數千個重要決定,每年就高達約一百萬個。如果你超過二十歲,人生到目前為止,就已經做出超過兩千萬個決定,才會有今日的你。

接下來,假設你做的每個決定只有兩種可能,例如 A 或 B,或者香蕉和桃子。好啦,我知道通常要選擇的項目很多(譬如,早餐店的菜單選項多不勝數),但讓我們簡化問題。要計算那兩千萬次決定而成為你的可能性,你必須取 2 的兩千萬次方,即 220,000,000

如果你超過二十歲,人生到目前為止,就已經做出超過兩千萬個決定,才會有今日的你。圖/天下文化提供

為什麼?因為每做一次決定就會讓可能的數目加倍。舉例來說,你必須選擇從哪邊(左邊或右邊)下床、早餐吃什麼水果(香蕉或桃子),以及上班搭什麼交通工具(火車或公車),總共就有 2×2×2(或 23)種開啟一日行程的方式。你從左邊下床、吃香蕉並坐公車的機率是 23 分之一,或說 8 分之一。

因此,如果你在生活中做出兩千萬個 A 或 B 的決定,那就意味你的生活可能有 220,000,000 種不同的結果。這真是一個驚人的數字,是吧!但我們才剛開始暖身而已!

我們還必須考慮你的出生機率,包含你父母做決定的可能結果。如果將你父母的決定算進來,就必須再加上四千萬個決定(你父母各兩千萬個)。再加上你四個祖父母,還有八千萬個。曾祖父母呢?還有一億六千萬個。你瞭解了嗎?每回推一個世代,祖先數量就增加一倍,影響你出生的決定數量也跟著加倍。人類已經在地球上生活了至少三萬年,或許可換算為大約一千五百個世代。若將你所有祖先全部考慮進來,可能的數量會更龐大。

如果再將你父母的決定算進來,就必須再加上四千萬個決定。圖/天下文化提供

其實,真要計算起來實際情況更加複雜,如果回溯得夠遠,你會發現親戚之間盤根錯節的關係,同一個人可能在你的家譜中重複出現,除了引發令人尷尬的話題之外,也讓數學計算變得更加複雜。為簡單起見,我們假設你每代只受到兩個人的影響。這仍然有 1,500 代× 2 人× 2,000 萬個決定= 600 億個決定。及至目前為止,你發生的機率是 260,000,000,000 分之一。

只算到這裡就夠了嗎?讓我們考慮人類史前歷史並回溯到數十億年前最小微生物演化之時。在大約三十五億年前,地球上的生命開始孕育。如果你不得不製作年代如此久遠的家譜,就會發現祖先主要是微生物和簡單植物。他們大概無法做出有意識的決定,但仍會遭受到隨機事件影響,諸如風如何吹動,陽光是否照耀,天降甘霖與否等等。

假設你的微生物祖先每天至少受到一個隨機事件影響,每個隨機事件也有兩種可能結果(例如,一塊石頭是否砸落在你的微生物祖先身上)。這意味我們必須將另外一兆(1,000,000,000,000)個決定事件添加到我們的機率中。

現在,讓我們回到四十五億年前太陽系剛形成的時候,找到你的構成原子之前所在的恆星或行星,然後再一路回到一百四十億年前的大霹靂。讓我們做個超級的低估,假設在那些日子裡,每天都發生了一件可能影響你來到人世的重要大事。直到今日,大約有一千兆個關鍵事件,你存在的機率陡然劇降到約21,000,000,000,000,000 分之一。

總而言之,你存在的機率大概是 2 的 1000 兆次方分之一。圖/天下文化提供

——本文摘自《宇宙大哉問:20個困惑人類的問題與解答》,2022 年 8 月,天下文化,未經同意請勿轉載。

天下文化_96
110 篇文章 ・ 597 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

1

1
0

文字

分享

1
1
0
有施打 mRNA疫苗,住院與死亡風險較低
台灣科技媒體中心_96
・2022/05/08 ・1007字 ・閱讀時間約 2 分鐘

圖/envato elements

2022 年 03 月 16 日,國際期刊《刺胳針》(Lancet)刊登一篇研究「Comparative analysis of the risks of hospitalisation and death associated with SARS-CoV-2 omicron (B.1.1.529) and delta (B.1.617.2) variants in England: a cohort study」,主要是想透過英國衛生安全局(UKHSA)的 COVID-19 國內確診數據,分別從就診、住院和死亡的數據上比較相對風險,了解 Omicron 相較於 Delta 的嚴重程度。

這篇研究,是由英國劍橋大學的湯米・尼伯格教授(Tommy Nyberg)團隊,收集 2021 年 11 月至 2022 年 1 月間,英國國內監測 COVID-19 感染後的確診數據,並比較 Omicron 和 Delta 對不同年齡階段、不同免疫狀態的人群感染的嚴重程度,包括就診、住院治療及死亡風險的變化。

mRNA 疫苗保護力強?

圖/envato elements

其中在比較 mRNA 疫苗施打的結果上,研究發現,施打 mRNA 疫苗加強免疫系統,對防止 Omicron 的住院和死亡,具有高度保護作用。

數據顯示,「有施打 mRNA 疫苗」發生住院與死亡的風險比值(HR)是「未施打疫苗」的 22%。(HR for hospital admission 8–11 weeks post-booster vs unvaccinated: 0·22 [0·20–0·24])也就是與「未施打疫苗」相比,「施打 mRNA 疫苗」的 8 到 11 週後,發生住院的風險下降了約 78%。

解讀時,要注意!

該研究是在比較「施打 mRNA 疫苗」與「未施打疫苗」發生住院與死亡風險,使用的是風險比(Hazard Ratio, HR),是指在相同時間裡兩個風險率的比值。

針對 mRNA 疫苗的數據,解讀上需小心。圖/envato elements

如同前面提到,在 Omicron 的研究結果中,「有施打 mRNA 疫苗」會發生住院與死亡的風險,是「未施打疫苗」的 22%。意思是與「未施打疫苗」相比,「有施打 mRNA 疫苗」發生住院的風險下降了約78%。

這邊的 22%,是來自「有施打 mRNA 疫苗」 vs. 「未施打疫苗」兩個群體,發生住院狀況的風險比值,而不是指「未施打疫苗者」發生重症與死亡的發生率。也就是說:「400 萬人未施打疫苗,其中會有將近 80 萬人重症或死亡。」這是錯誤的歸納且與該研究觀察結果無關。

此外,我們也無法透過上述的風險比較,回推「未施打疫苗」群體,發生重症或死亡的比例。

所有討論 1
台灣科技媒體中心_96
46 篇文章 ・ 325 位粉絲
台灣科技媒體中心希望架構一個具跨領域溝通性質的科學新聞平台,提供正確的科學新聞素材與科學新聞專題探討。

0

7
6

文字

分享

0
7
6
跟名偵探學習推理—回溯推理與貝氏定理分析(上)
tml_96
・2021/12/21 ・4111字 ・閱讀時間約 8 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

編按:回溯推理(或稱溯因推理)是從「證據推理到最佳解釋」的反覆過程。福爾摩斯的名言:「當你把一切不可能的情況都排除之後,那剩下的,不管多麼離奇,也必然是事實。」正點出了「回溯推理」的精隨,以及背後涉及的「貝氏定理」。

本文分為上下篇,上篇將帶領讀者熟悉回溯推理的基本概念,下篇則會運用貝氏定理分析,一窺偵探腦內的判斷機制。

圖/Pixabay

「你要知道,我親愛的華生,」他把試管放回架子上去,開始用教授對他班上的學生講課的口氣往下說,「作出一串推理來,並且使每個推理取決於它前面的那個推理而本身又簡單明瞭,實際上這並不難。然後,只要把中間的推理統統去掉,對你的聽眾僅僅宣佈起點和結論,就可以得到驚人的、也可能是虛誇的效果。所以,我看了你左手的虎口,就覺得有把握說你沒有打算把你那一小筆資本投到金礦中去,這真的不難推斷出來。」

 

「我看不出有什麼關係。」

 

「似乎沒有,但是我可以馬上告訴你這一密切的關係。這一根非常簡單的鏈條中缺少的環節是:第一,昨晚你從俱樂部回來,你左手虎口上有白粉;第二,只有在打台球的時候,為了穩定球桿,你才在虎口上抹白粉;第三,沒有瑟斯頓作伴,你從不打台球;第四,你在四個星期以前告訴過我,瑟斯頓有購買某項南非產業的特權,再有一個月就到期了,他很想你跟他共同使用;第五,你的支票簿鎖在我的抽屜裡,你一直沒跟我要過鑰匙;第六,你不打算把錢投資在南非。」

 

「這太簡單了!」我叫起來了。

 

——柯南.道爾《跳舞的人》

回溯推理的偵探:杜彭、福爾摩斯、馬婁

所謂「回溯推論法」(abduction)是有別於演繹法(deduction)和歸納法(induction)的一種推理方法,但它常被與演繹法或歸納法混淆。

回溯推論法被提出為一種科學研究的推論方法,就我個人所知,最早見於美國哲學家 Charles Sanders Peirce (1839-1914)1878 年發表的科普文章〈Illustrations of the Logic of Science – Deduction, Induction, and Hypothesis〉。但在這篇文章裡,Peirce 用了 hypothesis(假說)這個字來稱呼回溯推論法。後來他改用 retroduction,而且一直到1896年都還用這個字。要在他 1903 年的文章,我才看到abduction這個字的出現。但不論使用哪個名詞,他都把它與演繹法及歸納法並列,作為推論方法的一種形式。

其實就在Peirce還在掙扎著釐清他用不同字眼所指涉的回溯推論法的時候,這個方法的基本形式早就廣泛地被推理小說中虛構的偵探有意識地用作辦案的方法了。這包括埃德加.愛倫.坡(Edgar Allan Poe)筆下的杜彭(Dupin)和柯南.道爾(Conan Doyle)筆下的福爾摩斯(Holmes)。杜彭號稱小說界第一位偵探,但他只出現在 1841-1844 出版的三篇短篇小說中。反觀福爾摩斯,他一共出現在 4 篇長篇及 56 篇短篇裡,其出版年份縱貫 1887-1927。當華生(Watson)已經很清楚地介紹福爾摩斯的探案方法的時候,Pierce 還沒拿定用哪個字眼來稱呼這個方法較恰當。

這就難怪華生把福爾摩斯的推理方法稱為「演繹的科學」(the science of deduction)囉。

不僅小說家會把回溯推論法與其它推論方法混淆,即便學界大師也會搞錯。因果論大師朱迪亞.珀爾(Judea Pearl)便把福爾摩斯的方法稱為歸納法。他在《因果革命:人工智慧的大未來》(The Book of Why: The New Science of Cause and Effect)一書中寫道:「但福爾摩斯真正厲害的,不是由假說演繹出結論,而是歸納。歸納法的運作方向和演繹法相反,是從證據產生假說

沒錯,回溯推論法簡單說是「從證據產生假說」但歸納法是要從統計資料產生通則,而回溯推論法則是要從不斷更新的事實推出最可能的解釋。這些解釋不必是通則:它們可能只是無法觀察到的事實。

科學家要建立通則;偵探對通則沒有興趣,他們有興趣的是事實,特別是未能觀察到的事實。

也是偵探小說作家的雷曼.錢德勒(Raymond Chandler)透過他筆下的偵探馬婁(Marlowe)說:「有些事情是事實:在統計的意義上、寫在紙上、錄在帶上、作為證據的事實。而有些事情之所以為事實是因為缺少了它其它的事情就無法解釋了。」(《回播》)

當然馬婁這話令人想到福爾摩斯的名言:

「當你把一切不可能的情況都排除之後,那剩下的,不管多麼離奇,也必然是事實。(When you have eliminated the impossible, whatever remains, however improbable, must be the truth.)」(《四簽名》)

在《血字的研究》一書中,福爾摩斯進一步地對華生解釋他的方法:

我已經對你說過,凡是異乎尋常的事物,一般都不是什麼阻礙,反而是一種線索。在解決這類問題時,最主要的事情就是能夠用推理的方法,一層層地回溯推理。這是一種很有用的本領,而且也是很容易的,不過,人們在實踐中卻不常應用它。在日常生活中,向前推理的方法用處大些,因此人們也就往往容易忽略回溯推理這一層。如果說有五十個人能夠從事務的各個方面加以綜合推理的話,那麼,能夠用分析的方法推理的,不過是個把人而已。

 

我也很難指望你能夠弄得清楚。讓我試試看我是否能夠把它說得更明確一些。大多數人都是這樣的:如果你把一系列的事實對他們說明以後,他們就能把可能的結果告訴你,他們能夠把這一系列事實在他們的腦子裡聯繫起來,通過思考,就能得出個什麼結果來了。但是,有少數的人,如果你把結果告訴了他們,他們就能通過他們內在的意識,推斷出所以產生出這種結果的各個步驟是什麼。這就是在我說到『回溯推理』或者『分析的方法』時,我所指的那種能力。

《血字的研究 》插圖。圖/Wikipedia

偵探小說中,逆向推理首見於愛倫.坡的杜彭。《血字的研究》中福爾摩斯嘲笑杜彭「賣弄」(showy)、「膚淺」(superficial)、「不入流」(inferior),但也不得不承認杜彭分析問題的天才。我們讀杜彭的故事,讀到他在首次出現時,精準逆推敘述者思路的情節,可以想像道爾完全是在模仿愛倫.坡。如果那是賣弄,那福爾摩斯逆推華生思路的賣弄比起杜彭只有過之。

演繹法、歸納法、回溯推論法的差異

回溯推論法與演繹法、歸納法的區別可以用不同組合的三段論來闡釋。

演繹法

  • 前提 1:若 A 則 B
  • 前提 2:A
  • ———————
  • 結論:B

歸納法

  • 前提 1:A
  • 前提 2:B
  • ==========={p}
  • 結論:若 A 則 B

回溯推論法

  • 前提 1:若 A 則 B
  • 前提 2:B
  • ==========={p}
  • 結論:A

這裡「==={p}」代表結論不是絕對的, 而是只有機率0<p<1的「確定性」

以邏輯學常用的例子 A=「天雨」、B=「地濕」來看。如果演繹法的兩個前提(「若天雨,則地濕」及「天雨」)都成立,其結論(「地濕」)是百分之百(p=1)確定的,不必用「==={p}」的符號來表示。

我們即使在很多不同的時空裡觀察到「天雨」跟「地濕」的連結,但我們仍然不能藉由資料本身就確定「若天雨,則地濕」是一個放諸四海皆準的通則。歸納法出錯的有名例子是「黑天鵝」事件。當 1967 年荷蘭探險家 Willem de Vlamingh 在澳洲看到黑天鵝的時候,歐洲人才知道他們以有限的經驗事實歸納出的「所有的天鵝都是白色的」的結論是錯誤的。

回溯推論法同樣不能導出百分之百確定的結論,但上述回溯推論法的三段論與歸納法有明顯的不同。光以三段論來看,回溯推論法與演繹法毋寧是比較接近的:它們都以通則「若 A 則 B」為前提,只是演繹法是由A來推論B,而回溯推論法是由B來推論A。從邏輯上來說,回溯推論法當然是不對的。我們都知道「若 A 則 B」只能引申出「若 ¬B 則 ¬A」(¬是邏輯中「非」的符號),亦即「以否定後項來否定前項」(modus tollens)而不能以肯定後項來肯定前項。

「地濕」無法推出「天雨」的結論,這是明顯的道理:因為「地濕」有許多原因,「天雨」只是其中之一而已。既然如此,那回溯推論法究竟有沒有邏輯上的價值?

回溯推論法的價值不是建立在單一的三段論上面,它仰仗的是當新事實出現時,這三段論的反覆應用。舉例來說,假設有而且只有三個事實 A1、A2、A3 能產生B的結果,但它們各自也能分別產生B1、B2、B3的結果。如此則我們有三個通則:「若 A1 則 B1 及 B」、「若 A2 則 B2 及 B」、「若 A3 則 B3 及 B」。當我們只觀察到 B 時,回溯推論法讓我們得到 A1、A2、或 A3 的結論,但卻無法告訴我們其中何者為真。

  • 前提 1:若 A1 則 B1 及 B
  • 前提 2:若 A2 則 B2 及 B
  • 前提 3:若 A3 則 B3 及 B
  • 前提 4:B
  • ——————————
  • 結論:無單一對應結果

但當我們觀察到更多的事實時,我們也許就能得到較為確定的結論。例如我們在觀察到 B 的同時也觀察到 B1,則結論為 A1 的確定性將會提高。但即使我們未觀察到B1,如果能觀察到B2、B3的反證,則A2、A3可以被否定,A1的確定性將提高至 p=1。後者的推論方法可以示意如下:

  • 前提 1:若 A1 則 B1 及 B
  • 前提 2:若 A2 則 B2 及 B
  • 前提 3:若 A3 則 B3 及 B
  • 前提 4:B
  • 前提 5:¬B2
  • 前提 6:¬B3
  • ——————————
  • 結論:A1

在福爾摩斯的方法論中,他把 A1、A2、A3稱作「理論」(theory),有時也稱作「假說」(hypothesis)或「解釋」(explanation),把B1、B2、B3稱作「資料」(data)。

登門求助的客戶訴說犯罪現場的狀況後,福爾摩斯有了基本資料。如果基本資料足夠,他會形成幾個有待進一步驗證的理論。但如基本資料不夠,他通常不願立刻提出理論,而寧可等待到現場蒐集進一步資料後再提出理論。此時理論可能仍有好幾個,他會不斷地努力追求新資料,例如拿放大鏡匍匐在地上觀察足跡、塵土、煙灰等等。這些動作雖然常被蘇格蘭場的警探嘲弄,他的目的就是要有更多的事實資料來讓他增加或減少某些理論的確定性。到最後如果某理論達到 p=1,他就破案了。

tml_96
34 篇文章 ・ 226 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。