0

0
0

文字

分享

0
0
0

數算日子的智慧:貝氏統計學家的婚姻難題

林澤民_96
・2019/10/29 ・3154字 ・閱讀時間約 6 分鐘 ・SR值 558 ・八年級

Dear Abby 是 1956 年開始發行、流傳甚廣的美國顧問專欄,起初的作者 Pauline Phillips 已在 2013 年過世,現由她女兒繼續以同名執筆經營。Dear Abby 經常為讀者提供諮商,為他們解決各種疑難雜症。下面這封讀者來函曾被列入統計學教科書裡,我也常用來作為基本統計學的教材。

「Dear Abby:

妳在專欄寫過女人懷胎266天。這是誰說的?我懷我的寶貝懷了 10 個月又 5 天 (310天)。這一點都不容置疑,因為我知道寶貝是哪天開始懷的。我老公在海軍服役,上次我們只見面一個鐘頭,而且之後就一直到生產前一天再見面,因此寶貝一定是在那個時候懷的。我不喝酒也沒亂劈腿,寶貝不可能不是老公的,請務必修正女人懷胎 266 天的說法,否則我的麻煩大了。

聖地牙哥讀者。」

我把這個材料給學生看,然後引用醫學知識,說受孕至生產時間呈常態分配,其平均數為 266 天、標準差為 16 天,要他們計算女人懷胎最少 310 天的機率,他們算出答案為 0.003 時,都發出會心的微笑。

現在我把這題目略改如下:

某貝氏統計學家與老婆婚姻生活一向平靜無波。某年元旦,兩人慶祝新年,決定生產報國,嗣後依然恢復平靜無波的生活。該年 11 月 7 日,老婆產下一女。

老公是一位統計學家,善於數算,老婆生產後,他推算如果此女確為從他所出,則老婆懷孕時間長達 310 天。根據醫學知識,一般婦女懷孕時間呈常態分配,其平均數為 266 天,標準差為 16 天。老公推算懷胎至少 310 天的機率是 0.003。

-----廣告,請繼續往下閱讀-----
統計學家看著剛出生的女兒,再推算老婆的孕期,覺得越想越不對勁。圖/mil

統計學家老公算出這個機率後,不禁眉頭一皺。他想:0.003是小機率事件,比統計推論的顯著水平0.05還小很多,怎麼就發生在自己家裡?此機率是由老婆受孕日期在 1 月 1 日的假設推算出來,因機率甚小,依「以否定後件來否定前件」(modus tollens)的命題邏輯,不能接受這個假設,然則難道自己戴綠帽了!當下咬牙切齒,拍桌大罵老婆。

不過老公畢竟有些學問,他再仔細一想:0.003 的機率雖然小,但若樣本夠大,這麼小的機率也會發生在很多人身上。以台灣每年大約有 20 萬新生兒來說,假設大多數為單胞胎自然生產,則每年約有 600 個媽媽懷孕時間會長達 310 天或更久。

大樂透每注中頭獎的機率 0.00000007 比 0.003 要小很多,而經常都有人中獎。相較之下,老婆中到 0.003 機率的大獎,也沒什麼好奇怪的啊。統計學家老公想到這裡,不禁笑開了嘴:這寶貝女兒,說不定還會給自己帶來財運呢。立馬到彩券行買了十張樂透。

難道要當成中到0.003機率的大獎。圖/pixabay

第二天樂透開獎,十張全部槓龜,統計學家老公又懊惱起來了。他想:雖然說經常都有人中樂透,偏偏自己從來沒中過,連每期對幾十張統一發票都難得中到 200 元的小獎,哪有說這 0.003 機率的事件就輪到我?畢竟「個人中獎」和「有人中獎」是不同的事件,不能一概而論。那怎麼辦呢?究竟我該不該相信老婆?還是乾脆去查驗 DNA 算了?

-----廣告,請繼續往下閱讀-----

貝氏統計學家老公靈光一閃,發現自己面臨的難題其實並沒有那麼簡單,而應該用貝式定理來推算。他這樣想:0.003 是在老婆未出軌的假設下計算的,因此它是一個條件機率

Pr(產期≥11/7|受孕期=1/1)= 0.003

但對一個貝氏統計學家而言,更該問的問題其實是:既然小孩是在 11 月 7 日出生,那老婆未出軌的機率為何?換句話說,更重要的機率應該是上面那個機率的反機率

Pr(受孕期=1/1|產期≥11/7)=?

這就是老婆未出軌的後驗機率。以貝氏統計學家的專長,老公知道要算這個後驗機率需要考慮兩個變數:

  1. 老婆在 1 月 1 日之後,是否有出軌受孕的機會?假設真正的受孕期是 1 月 1 日之後的第X天。X=0 代表老婆沒出軌,受孕期真的是 1 月 1 日;X>0代表老婆在 1 月 1 日後出軌才受孕。
  2. 自己一向對老婆有多少信心?依自己的主觀判斷,老婆未出軌,即 X=0 的機率有多少?假設 X=0 的機率為Y,X>0的機率為 1-Y,則 Y 越接近 1 信心越高,越接近0信心越低。Y是X=0的邊際機率,1-Y是X>0的邊際機率。這邊際機率也就是貝氏定理所謂的先驗機率

另外,如果我們以D來代表懷孕時間,則不論受孕期X是哪天,小孩在11月7日出生時,D都等於310-X。我們以D<310-X代表產期在11月7日之前,D≥310-X代表產期在11月7日這天或這天之後。

-----廣告,請繼續往下閱讀-----
統計學家暗忖,只要知道孕期、出生日,就有機會推算出可能受孕日。圖/freestockphotos

D≥310-X 的機率顯然與X有關,我們用p(X)來代表此一條件機率:p(X)=Pr(D≥310-X|X)。因為懷孕時間呈常態分配:D~N(266,162),我們可以導出:

\(p\left ( X \right )= Pr\left ( D\geq 310- X|X \right )= \frac{1}{2}Erf\left ( \frac{44-X}{16 \sqrt{2}} \right )\)

這裡Erf()是誤差函數;當 X=0時,p(0)=0.003。考慮這些變數後,我們可以用下列矩陣來呈現這個貝氏定理問題:

「行」的條件機率 老婆 1/1後未出軌:X=0
(受孕期=1/1)
老婆 1/1 後出軌:X>0
(受孕期=1/1 後第X天)
D<310-X(產期<11/7) 1-p(0) 1-p(X)
D310-X(產期≧11/7) p(0) p(X)
「行」的邊際機率 Y 1-Y

關於貝氏定理的算法,請參考我寫的《會算「貝氏定理」的人生是彩色的!該如何利用它讓判斷更準確、生活更美好呢?》。老公要求的後驗機率是:Pr(受孕期=1/1|產期≥11/7)=Pr(X=0| D≥310-X)。

-----廣告,請繼續往下閱讀-----

要求這個機率,首先必須把上表中「行」的條件機率轉化成聯合機率。這個只要記得「聯合機率等於條件機率乘以條件本身的邊際機率」的口訣就可算出如下:

聯合機率 老婆 1/1後未出軌:X=0
(受孕期=1/1)
老婆 1/1 後出軌:X>0
(受孕期=1/1 後第X天)
D<310-X(產期<11/7) Y(1-p(0)) (1-Y)(1-p(X))
D310-X(產期≧11/7) Y(p(0)) (1-Y)(p(X))
「行」的邊際機率 Y 1-Y

算出聯合機率之後,再用「條件機率等於聯合機率除以條件本身的邊際機率」的口訣就可算出所要求的「列」的條件機率

Pr(受孕期 =1/1 │產期≧11/7)\(=Pr\left ( X=0 | D\geq 310-X\right )\) \(= \frac{Y p(0)}{Y p(0)+(1-Y)p(X)}\)

把前面算出 p(0) 和 p(X) 套入上式之後,我們可以看到後驗機率 Pr(X=0|D≥310-X) 是X和Y的函數,為了更容易分析這函數,我們先把 Y值固定,再看它如何隨 X值變化。

-----廣告,請繼續往下閱讀-----

首先,假設老公對老婆只有Y=0.5的信心,則後驗機率的函數圖形如下:

這個圖顯示如果老公本來就對老婆疑信參半,則當老婆在1月1日之後的一個半月之內有出軌的機會時,老公對老婆的信心會隨著X的增加而急速下降。當出軌的機會X 增加到預產期(1月1日後第 X+266 天)越接近 11 月 7 日時,X>0 顯得越「正常」而 X=0 顯得越「不正常」, 因此老公的信心會越低,疑心越重。特別是當老婆在二月 (X>30) 有出軌的機會時,那意謂著 11 月 7 日正是預產期的一個標準差(16天)之內,老公的信心會降至幾乎為0。

其次,如果老公平常對老婆有極高的信心,例如 Y=0.99,則後驗機率的圖形為

這圖顯示如果老公平常對老婆有充分的信心,則這信心隨著 X 的增加會下降得比較緩慢。即使到二月初才有出軌機會,也就是預產期開始接近 11 月 7 日時,老公對老婆仍然維持著 0.6 以上的信心。甚至當 X=44,即預產期恰恰為 11 月 7 日時,老公的信心仍在 0.37 的水平。

-----廣告,請繼續往下閱讀-----

雖然信心不至於完全崩潰,但畢竟也會隨著 X 的增加而減小。老公算出貝氏後驗機率後應該了解,310 天是超乎尋常的懷孕時間,除非本來對老婆就有百分之百的信心,否則信心一定會下降的。雖說這只是「信者恆信,不信者恆不信」的貝氏詮釋,但在這個案例,信者卻必須要完全相信才能恆信,而不信者只要心中有點疑竇,終究會不信。

貝氏統計學者數算到這裡,長嘆了一口氣:「還是去查驗DNA吧!」

本文轉載自作者部落格,原文標題:數算日子的智慧:貝氏統計學家的婚姻難題

文章難易度
林澤民_96
37 篇文章 ・ 243 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

1

2
1

文字

分享

1
2
1
天氣預報到底是不是在騙人?我整個就不爽了!從生活案例看條件機率——《跟著網紅老師玩科學》
時報出版_96
・2019/08/23 ・1984字 ・閱讀時間約 4 分鐘 ・SR值 438 ・四年級

許多人說,現在科學這麼發達,為什麼天氣預報總是不準呢?

這裡涉及一個數學問題,稱為「條件機率」。

什麼是條件機率呢?例如我們要確定 6 月 15 日是不是下雨,根據往年資料,下雨的機率有 40% ,不下雨的機率為 60% ,這就稱為「機率」。如果在前一天,天氣預報說 6月15 日下雨,這就稱為「條件」, 在這種條件下, 6 月 15 日真正下雨的機率就稱為「條件概率」。

圖/《跟著網紅老師玩科學》提供

你哭著對我說,天氣預報裡都是騙人的

天氣預報根據一定的氣象參數推測是否會下雨,由於天氣捉摸不定,即便預報下雨,也有可能是晴天。假設天氣預報的準確率為 90% ,即在預報下雨的情況下,有 90% 的機率下雨,有 10% 的機率不下雨;同樣,在預報不下雨的情況下,有 10% 的機率下雨,有 90% 的機率不下雨。

-----廣告,請繼續往下閱讀-----

這樣一來, 6 月 15 日的預報和天氣就有四種可能:預報下雨且真的下雨,預報不下雨但是下雨,預報下雨但是不下雨,預報不下雨且真的不下雨。

我們把四種情況列在下面的表格中,並計算相應的機率。

下雨 不下雨
預報下雨 40% × 90% = 36% 60% × 10% = 6%
預報不下雨 40% × 10% = 4% 60% × 90% = 54%

計算方法就是兩個機率的乘積。例如下雨機率為 40% ,下雨時預報下雨的機率為 90% ,因此預報下雨且下雨這種情況出現的機率為 36% 。同理,我們可以計算出天氣預報下雨但是不下雨的機率為 6% ,二者之和為 42% ,這就是天氣預報下雨的機率。

在這 42% 的可能性中,真正下雨占 36% 的可能,比例為\( 36 \div 42=85.7 \)%,而不下雨的機率為 6% ,占 \( 6 \div 42=14.3 \) %。

也就是說,假設天氣預報的準確率為 90% ,預報下雨的條件下,真正下雨的機率只有 85.7% 。

我們會發現:

-----廣告,請繼續往下閱讀-----

預報下雨時是否真的下雨,不光與預報的準確度有關,同時也與這個地區平時下雨的機率有關

圖/《跟著網紅老師玩科學》提供

檢查報告說我中獎了,我就真的生病了嗎?

與這個問題類似的是在醫院進行重大疾病檢查時,如果醫生發現異常,一般不會直接斷定生病了,而會建議到大醫院再檢查一次,雖然這兩次檢查可能完全相同。為什麼會這樣呢?

假設有一種重大疾病,患病人群占總人群的比例為\(\frac{1}{7000} \) 。也就是說, 隨機選取一個人,有\(\frac{1}{7000} \) 的機率患有這種疾病,有\(\frac{6999}{7000} \) 的機率沒有患這種疾病。

有一種先進的檢測方法,誤診率只有萬分之一,也就是說,患病的人有\(\frac{1}{10000} \) 的可能性被誤診為健康人,健康人也有\(\frac{1}{10000} \) 的可能性被誤診為患病。

-----廣告,請繼續往下閱讀-----

我們要問:在一次檢查得到患病結果的前提下,這個人真正患病的機率有多大?

患病 健康
檢測患病 \(\frac{1}{7000} \times \frac{9999}{10000}\)\(= \frac{9999}{70000000}\)  \(\frac{6999}{7000} \times \frac{1}{10000}\)\(= \frac{6999}{70000000}\)
檢測健康 \(\frac{1}{7000} \times \frac{1}{10000}\)\(= \frac{1}{70000000}\)  \(\frac{6999}{7000} \times \frac{9999}{10000}\)\(= \frac{69983001}{70000000}\)

我們仿照剛才的計算方法,檢測出患病的總機率為:\(\frac{9999}{70000000}+\frac{6999}{70000000} \) \(=\frac{16998}{70000000}\)
患病且檢測出患病的機率為:\(\frac{9999}{70000000}\)

所以在檢測患病的條件下,真正患病的機率為:\( \frac{9999}{70000000} \div  \frac{16998}{70000000}\) \(=\frac{9999}{16998}\) \( \approx 58.8 \)%

顯而易見,即便是萬分之一誤診的情況,一次檢測也不能完全確定這個人是否患病。

-----廣告,請繼續往下閱讀-----

圖/《跟著網紅老師玩科學》提供

那麼,兩次檢測都是患病的情況又如何呢?

大家要注意,在第一次檢測結果為患病的前提下,此人患病的機率已經不再是所有人群的 \(\frac{1}{7000}\) ,而變為自己的 58.8% ,健康的機率只有 41.2% 。

此處的機率就是條件機率,所以第二次檢測的表格變為:

-----廣告,請繼續往下閱讀-----
患病 健康
檢測患病 58.8% × \(\frac{9999}{10000}\)= 58.794%  41.2% × \(\frac{1}{10000}\)= 0.004%
檢測健康  58.8% × \(\frac{1}{10000}\)= 0.006%  41.2% × \(\frac{9999}{10000}\)= 41.196%

兩次檢測都是患病的條件下,此人真正患病的機率為:\(\frac{58.794}{58.794+0.004}\)\(=99.99 \) % 基本確診了。

日常生活超有感──貝式定理

對這個問題進行詳細討論的人是英國數學家貝葉斯

圖/《跟著網紅老師玩科學》提供

貝葉斯指出:如果 A 和 B 是兩個相關的事件, A 有發生和不發生兩種可能, B 有 B1 、 B2 、……、 Bn 共 n 種可能。

-----廣告,請繼續往下閱讀-----

那麼在 A 發生的前提下, Bi 發生的機率稱為:條件機率 \( P(B_i|A) \)

要計算這個機率,首先要計算在 Bi 發生的條件下 ,A 發生的機率,公式為:\( P(B_i)P(A|B_i) \)

然後,需要計算事件A發生的總機率

方法是用每種Bi情況發生的機率與相應情況下A發生的機率相乘,再將乘積相加。
\( P(B_1)P(A_1|B_1)+P(B_2)P(A_2|B_2)+\cdots+P(B_n)P(A_n|B_n) \)

最後,用上述兩個機率相除,完整的貝式定理公式就是:

\( P(B_i|A) \) \(=\frac{P(B_i)P(A|B_i)}{P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+\cdots+P(B_n)P(A|B_n)} \)

貝式定理在社會學、統計學、醫學等領域,都發揮著巨大作用。

-----廣告,請繼續往下閱讀-----

下次遇到天氣誤報、醫院誤診,不要完全怪氣象臺和醫院啦!有時候這是個數學問題。

——本文摘自《跟著網紅老師玩科學》,2019 年 4 月,時報出版

所有討論 1
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

7

11
12

文字

分享

7
11
12
會算「貝氏定理」的人生是彩色的!該如何利用它讓判斷更準確、生活更美好呢?
林澤民_96
・2019/03/19 ・7154字 ・閱讀時間約 14 分鐘 ・SR值 553 ・八年級

-----廣告,請繼續往下閱讀-----

  • 作者:林澤民、巫俊穎

對於許多上過統計課的學生而言,貝氏定理(Bayes Theorem)是又熟悉又陌生的。熟悉,是因為絕大多數的大學或研究所統計課堂都有教貝式定理;陌生,則是因為許多學生上完統計課之後,對於貝式定理仍然一知半解,甚至視為畏途。

根據我們的觀察,造成此現象的原因有二:首先,一般基本統計學教科書雖然會提到貝氏定理,但絕大多數的教科書仍然只涵蓋以P值檢定為基礎的傳統「次數統計推論」(frequentist statistical inference)。學生即使學了貝氏定理,也只把它當作一個數學公式,不知道它對學習統計學有什麼幫助,更不知道它具備生活實用性。其次,貝式定理的數學表示式難以背誦;即使一時背了,也容易忘記。

source:Wikimedia

以下是教科書上常見的貝式定理定義:假定事件A和事件B發生的機率分別是 Pr(A) 和 Pr(B),則在事件 B 已經發生的前提之下,事件 A 發生的機率是(其中「¬」在邏輯上為「非」的符號:「¬A」即「非A」):

-----廣告,請繼續往下閱讀-----

如果沒有充分理解機率運算的定義和法則,實在難以理解此公式背後的邏輯。許多學生因此強記上述公式以準備考試,只求能解題而不求理解;公式反而成為學習貝式定理的主要障礙。

本文的主要目的是要破除許多學生對於貝式定理「困難又不實用」的刻板印象。事實上,我們生活之中有許多情況必須要運用貝式定理的邏輯思考,否則便容易產生偏差甚至陷於謬誤。

被撞到的都是好人?讓貝氏定理算給你看看

圖/pixabay

舉例來說,每逢有人因車禍不幸橫死,當記者報導死者是孝子,我們常唏噓說為何橫死的都是好人?這樣的想法,其實犯了諾貝爾經濟學獎得主、心理學家 Daniel Kahneman 所說的「基率謬誤」(base rate fallacy)。簡單來說,就是沒有把「絕大多數人都是好人」這個「基率」——貝氏定理所謂的先驗機率(prior probability)——納入考量所致。因為絕大多數人都是好人,即使老天爺真的大致上賞善罰惡,橫死的人也會大多是好人,更不用說車禍應該跟善惡無關了。

-----廣告,請繼續往下閱讀-----

比如我們假設每100人中只有1人(1%)是十惡不赦的「壞人」,其餘99人(99%)都是「好人」。再假設90%的壞人果然都遭車禍橫死,而只有10%的好人意外橫死。這樣老天算是有眼了,可是如果今天有人意外橫死,請問他是好人的機率多少呢?用貝氏定理可以算出Pr(好人|橫死)=0.92,也就是橫死的人中有92%會是「好人」,只有8%是壞人!這正是因為大部分人都是好人,出事的當然容易是好人,即使老天有眼也是一樣。

貝氏定理的原理就是在先驗機率的基礎上,納入新事件的資訊來更新先驗機率,這樣算出來的機率便叫做後驗機率(posterior probability)。以前述好人橫死的例子來說,先驗機率的分配是 Pr(好人)=0.99及Pr(壞人)=0.01。在無其他資訊的情況下,我們在街上隨機遇到一個人,此人為好人的機率是0.99。

但現在此人被車子撞死了,根據我們對老天有眼的假設(Pr(橫死|好人)=0.1 及 Pr(橫死|壞人)=0.9),好人不容易橫死,而此人橫死了,這新事件的資訊可以讓我們用貝氏定理來計算後驗機率 Pr(好人|橫死)=0.92,也就是此人為好人的機率變小。新事件的資訊改變了我們原來的估計,這就是所謂「貝氏更新」(Bayesian updating)。

圖/makeagif

-----廣告,請繼續往下閱讀-----

如果我們沒有把先驗機率納入計算,我們很可能因為相信老天有眼,橫死的應該大多是壞人,就斷此人很可能是壞人。而若確定此人是好人,我們就唏噓不已,甚至怨罵老天。這兩種反應的人其實都犯了「基率謬誤」。當然,如果車禍跟人的好壞無關,也就是不論好人壞人橫死的機率都一樣,則有人橫死的新事件是不會更新我們對他是好人或壞人的基率的。

Kahneman在《快思慢想》一書中舉了一個也是跟車禍有關的「基率謬誤」的例子。某天夜晚城裡發生了一件車禍,肇事的車子逃逸,但有證人指認那是一輛藍色的計程車。城裡只有藍色、綠色兩種計程車;綠色車佔85%,藍色車僅佔15%。法庭檢驗證人在夜晚識別車色的能力,發現他識別正確的機率是80%,而識別錯誤的機率是20%。

當Kahneman做實驗問受測者肇事車輛為藍色的機率多少時,大部分人的答案是80%。這也是犯了「基率謬誤」的答案,也就是城裡「綠色車佔85%,藍色車佔15%」這個基率所包含的資訊被忽略了。如果把基率納入考量,貝氏定理給的答案是Pr(肇事車真為藍色|證人指認為藍色)=0.41,只有一般人想像中的一半!

現實生活中類似的例子很多:身體檢查某項檢驗得到陽性反應、職棒大聯盟球員沒通過藥檢、犯罪現場採得的DNA與調查局資料庫CODIS中某人的DNA相符、甚至統計上P值檢定得到顯著結果。這些情況中,如果我們不了解貝氏定理,我們很可能就會在機率估計上犯錯。那麼貝氏定理究竟要如何拿來計算正確的後驗機率呢?本文將用淺易的途徑來介紹貝氏定理的計算方法。

-----廣告,請繼續往下閱讀-----

聯合機率、邊際機率以及條件機率三種必須認識的機率

欲瞭解貝式定理的邏輯,必須先瞭解三種不同的機率:聯合機率(joint probability)、邊際機率(marginal probability)以及條件機率(conditional probability)。

假設有兩個隨機變數(random variable)X和Y,變數X有1, 2, …, J共J個可能的值,而變數Y有1, 2, …, I共I個值。在此可以將變數的「值」視為前面提及的「事件」(event),舉例來說,X代表大聯盟球員有沒有使用禁藥,X=1代表「沒有使用」,X=2代表「有使用」;Y代表藥檢的結果,Y=1代表「陽性反應」,Y=2代表「陰性反應」。這裡X=1、X=2、Y=1、Y=2都是其發生有一定機率的事件。

如果我們想要檢視X和Y之間的關係,可以繪製出下列交叉表:

我們先從概念開始介紹。表一所陳列的Y跟X聯合起來所有可能的結果可以用 {(1,1), (1,2), …, (i,j), …, (I,J)} 這個集合來表示,這就是Y跟X聯合起來的「樣本空間」,它一共有IxJ個可能結果。每一個結果所對應的機率是Y跟X的聯合機率,也就是屬於Y的事件Y=i和屬於X的事件X=j聯合發生的機率,數學表示為Pr(Y=i,X=j)=πij。例如π11就是Y=1和X=1這兩個事件都發生的機率,π12則是Y=1和X=2這兩個事件都發生的機率,以此類推。如果我們把所有可能結果的機率加總,從π11加到πIJ,總和必須是1。

-----廣告,請繼續往下閱讀-----

邊際機率則是屬於Y或X的單一事件發生的機率。表一中,Y的樣本空間是 {1, 2, …, i, …, I};屬於Y的事件發生的邊際機率用Pr(Y=i)=πi.表示。X的樣本空間是 {1, 2, …, j, …, J};屬於X的事件發生的邊際機率用Pr(X=j)=π.j表示。例如π1.就是Y=1這個事件發生的機率,π.2則是X=2這個事件發生的機率,以此類推。Y或X所有邊際機率的總和也必須是1。在表一裡,我們以行或列的總和來計算邊際機率。邊際機率其實就是單一變數的機率分配,之所以稱為邊際機率指是因為我們從表一的雙變數聯合機率分配的脈絡出發,導出單一變數分配的緣故。

最後,條件機率是在屬於X的事件已經發生的前提之下,屬於Y的事件發生的機率,或是在屬於Y的事件已經發生的前提之下,屬於X的事件發生的機率。例如Pr(Y=i|X=j)是在X=j這個事件已經發生的前提下,Y=i這個事件發生的機率;而Pr(X=j|Y=i)是在Y=i這個事件已經發生的前提下,X=j這個事件發生的機率。

條件機率的樣本空間只是聯合機率樣本空間的一部份。在表一中,Y跟X聯合起來的樣本空間一共有IxJ個可能結果。但當我們以X=j這個事件已經發生為前提時,Y這個變數的樣本空間就被侷限在 {(1,j), (2,j), …, (i,j), …, (I,j)} 這I個結果的範圍裡。同樣的,當我們以Y= i這個事件已經發生為前提時,X這個變數的樣本空間就被侷限在 {(i,1), (i,2), …, (i,j), … (i,J)} 這J個結果的範圍裡。因為樣本空間改變,機率也會有所不同。其計算如下:

這也就是說,條件機率等於聯合機率除以條件變數的邊際機率。反過來講,聯合機率等於條件機率乘以條件變數的邊際機率,如下式所示:

-----廣告,請繼續往下閱讀-----

此公式稱為機率的乘法法則(Multiplication Rule),這個法則對於理解貝式定理至關重要。

前述提及條件機率有兩種,分別為Pr(Y=i|X=j)以及Pr(X=j|Y=i),差別僅在於是以X變數的特定事件為給定前提,還是以Y變數的特定事件為給定前提。表一中,因為X是「行」(column,台灣稱「行」,中國大陸稱「列」)的變數,我們把以X變數特定事件為給定前提的條件機率稱之為「行的條件機率」(column conditional probability);如果是以Y變數特定事件為給定前提的條件機率,因為Y是「列」(row,台灣稱「列」,中國大陸稱「行」)的變數,我們稱之為「列的條件機率」(row conditional probability)。

Pr(Y=i|X=j)以及Pr(X=j|Y=i)這兩個機率,我們可以說它們互為「反機率」(inverse probability)。我們以X和Y分別只有兩個值為例,以表二和表三加以說明:

貝式定理算什麼?怎麼算?

接下來要進入本文的主題了,究竟貝式定理是什麼,怎麼算?

-----廣告,請繼續往下閱讀-----

說穿了,貝式定理就是將行的條件機率轉變成列的條件機率,或是將列的條件機率轉變成行的條件機率。貝式定理公式看似複雜,背後邏輯其實相當簡單,它就是一個將「給定 X 事件已發生的前提下,Y 事件發生的條件機率」轉變成「給定 Y 事件已發生的前提下,X 事件發生的條件機率」的過程而已。換句話說,貝氏定理就是在算反機率

圖/pixabay

我們先用一個簡單但實用的例子來說明這個觀念。這個例子出自「看電影學統計: p值的陷阱」一文:

美國職棒大聯盟(Major League Baseball)抽查球員是否使用禁藥 PED(performance enhancing drugs),結果某明星球員藥檢測出有陽性反應。——我們要問的是:這位明星球員其實是清白的機率是多少?

要算這個機率, 我們必須要有球員是否使用 PED 的先驗機率,也就是在還未對球員實施藥檢之前,我們必須先對他是否使用 PED 的機率有一個初步估計。這個估計可能相當主觀,但也未嘗不能用客觀的數據加以估計,比如之前抽檢的結果。另外,我們還必須知道藥檢的準確率,也就是球員真有使用 PED 時藥檢結果呈現陽性的機率,和球員沒有使用 PED 時藥檢結果呈現陰性的機率。

假設我們擁有的這兩項資訊如下:

  1. 根據以前的藥檢結果,我們合理估計大約有 6% 大聯盟球員有使用 PED。
  2. 藥檢的準確率為 0.95:如果球員真的使用了 PED,藥檢結果呈現陽性的機率是 0.95;而如果球員沒有使用 PED,藥檢結果呈現陰性的機率也是 0.95。(這兩個機率不必一樣。)

第一項資訊提供了貝氏定理所需要的先驗機率,也就是在明星球員還沒實施藥檢前,我們對他是否使用 PED 最好的猜測只能是 0.06的機率有使用,0.94 的機率沒使用。第二項資訊告訴我們大聯盟的藥檢的「偽陽性」(false positive)機率──球員並未使用 PED但藥檢結果呈陽性反應的機率──是 0.05,「偽陰性」(false negative)機率—球員有使用 PED 但藥檢結果呈陰性反應的機率──也是0.05。

圖/pexels

如果我們的明星球員藥檢呈陽性反應,我們可能會認為藥檢結果錯誤的機率只有 0.05。但這是沒有考慮先驗機率的想法,我們這樣想就是犯了「基率謬誤」。要考量先驗機率,必須要使用貝氏定理來算後驗機率,也就是要算出「偽陽性的反機率」。

我們用 Y 來代表「藥檢結果是陽性還是陰性」的隨機變數;Y=1 代表藥檢結果呈陽性反應,Y=2 代表藥檢結果呈陰性反應。我們再用X來代表「球員有沒有使用PED」的隨機變數;X=1代表沒有使用,X=2代表有使用。這樣定義之後,我們可以看出:先驗機率是X的邊際機率Pr(X=1)=0.94,Pr(X=2)=0.06。藥檢的準確率和偽陽性、偽陰性機率都是行的條件機率:Pr(Y=1|X=1)=0.05,Pr(Y=2|X=1)=0.95,Pr(Y=1|X=2)=0.95,Pr(Y=2|X=2)=0.05。我們將這些數據放到表二之中可以得到下列表四:

前面說過貝式定理就是將行的條件機率轉變成列的條件機率,或是將列的條件機率轉變成行的條件機率。現在我們已經有行的條件機率了,那麼怎麼求列的條件機率呢?首先我們必須先要算出Y跟X的聯合機率和Y的邊際機率。算聯合機率必須使用機率的乘法法則

也就是把行的條件機率跟X的邊際機率相乘。就是在這裡,我們必須要用到X的先驗機率!聯合機率算出來之後,把各列的聯合機率加總就得到Y的邊際機率:

有了聯合機率跟Y的邊際機率,我們就可以輕易計算列的條件機率了:

事實上,如果我們只是要算「藥檢結果是陽性而實際上球員是清白的機率」,我們只要算左上角 Pr(X=1|Y=1) 這個機率就夠了:

所以答案是「藥檢結果是陽性而實際上球員是清白的機率」不是0.05而是0.452。這個機率相當高!當然,在此例子之中用的藥檢準確率只是假設的數值,然而這結果也顯示即使藥檢準確率看似不低,實際上會冤枉好人的機率超乎我們的想像。其實,即使藥檢的準確率高達 99%,「藥檢結果是陽性而實際上球員是清白的機率」仍然高達0.137;偽陽性的反機率比偽陽性的機率仍然高很多。讀者可以嘗試用這裡介紹的步驟算出這個數值。

以下我們提供第二個例子:用貝氏定理來求解有名的「蒙提霍爾」電視遊戲問題。

蒙提霍爾問題:三扇門選一,贏得汽車大獎

圖/flickr

這是美國電視台一個相當有名的電視遊戲,相信不少讀者都已聽過,我們在此簡單介紹一下。這個遊戲一開始,主持人(Monty Hall)給妳看三道門。他告訴妳:

三道門中,有一道門後面有一輛汽車,另外兩道門後面各有一隻山羊。

Monty 要妳挑選一道門,但先不要打開。妳挑定了一道門之後,Monty 打開另外兩道門之一,顯示門後有一隻山羊。這時 Monty 問妳要維持本來選定的門,還是要換選那一道沒開的門。如果妳選到藏有汽車的那道門,便可贏得汽車,否則便贏到山羊。(如果想看更詳細的遊戲說明,可參考維基百科的蒙提霍爾問題條目)。

這個遊戲的答案是要換,理由很簡單,並不需要用貝氏定理來算。因為參賽者原來隨機選擇的門可以猜中汽車的機率是 1/3,那麼汽車在另兩個門其中之一後面的機率就是 2/3,然而現在 Monty 開了兩個門其中之一,其後並無汽車,那麼這 2/3 的機率便完全屬於另一道門了!參賽者如果換門,抽中汽車的機率將加倍!

圖/wikimedia

雖然如此,當號稱全世界 IQ 最高的專欄作家 Marilyn vos Savant 這樣解釋時,很多讀者不相信。包括數學教授在內的眾多讀者都批評她,說她錯了。這些讀者認為還未開的兩道門可以猜中汽車的機率應該一樣,換門並沒有用。

因為這個問題相當有趣,而且比上例要複雜些,這裡我們用它來幫助我們學習貝氏定理。在此例子之中有兩個變數:汽車的位置和主持人開啟的門,兩個變數各自有三種可能結果:1號、2號以及3號門,交叉相乘可以有九種可能的事件組合。

我們假設參賽者一開始猜選的門為 1號門(在下表中用【1】表示),接著主持人要開啟 2號或 3號門之中後面藏有山羊的那一道門。此時我們必須要知道:

  1. 按照規則,在參賽者選了 1號門之後,主持人就不能開啟 1號門,不論 1號門後面是山羊或汽車都是如此;
  2. 哪一號門會被主持人開啟?這事件的機率皆為條件機率,因為主持人是在已知汽車是在哪一道門後面的前提下做出的選擇;
  3. 主持人理所當然不會開啟後面有汽車的那道門。我們以M代表主持人做出的選擇。

如果汽車就在 1號門後面,那 2號和 3號門後面皆為山羊,因此在參賽者猜了 1號門的情況下,主持人可從 2號及 3號門之中隨機選一道門開啟,因此 Pr(M=2|C=1) 與 Pr(M=3|C=1) 條件機率皆為 1/2。如果汽車在 2號門後面而參賽者猜了 1號門,主持人在不能開啟 1號門和 2號門的情況下只能開啟3號門,因此 Pr(M=3|C=2)=1,此規則也適用在汽車在 3號門後面的情況。當然,參賽者只能看到主持人開了什麼門,根本不知道主持人葫蘆裡賣什麼藥。

據此,我們可以填出表七的先驗機率及條件機率並以之求得表八的聯合機率:

接下來就是直接求列的條件機率了:

這個表第二列的詮釋如下:假設主持人開啟了 2號門則門後是汽車的機率為 0(按照規則),而參賽者維持 1號門和改變主意改選 3號門這兩種策略抽中汽車的機率分別是 1/3和 2/3。這兩個機率是「在已知主持人開啟2號門的給定前提之下,汽車在 1號或 3號門後面」的列的條件機率,在已知所有聯合機率的情況下,我們可以用條件機率的定義輕易算得:

這就是為何參賽者更改選擇至 3號門抽中汽車的機率(2/3)會比維持原初1號門猜測而抽中汽車的機率(1/3)還要高的由來。有興趣的讀者不妨試算「在主持人開啟 3號門的前提下」的條件機率,會發現結果仍是一致的:更換選擇抽中汽車的機率仍是 2/3,不更換抽中汽車的機率仍是 1/3。

正是因為一開始參賽者猜對的機率是 1/3、猜錯的機率是 2/3,致使主持人開啟一道後面是山羊的門的時候,如果參賽者換選僅剩的那道門會有 2/3 的機率猜對。貝式定理以數學方式釐清了這一點。

貝式定理,就在你的生活中

貝式定理在統計學的應用越見廣泛,也讓許多學生以為貝式定理只有跟「貝式統計推論」(Bayesian statistical inference)相關,沒用到貝式統計分析就不需要學會。其實貝式定理在生活之中是很有用的,本文以淺顯的方式介紹貝式定理的邏輯和計算方法,不僅期望讀者在學貝氏定理時確實理解那些複雜公式的由來,也希望讀者將貝式定理的邏輯思維運用到日常生活之中。要學會貝氏定理才能避免「基率謬誤」,正確地用新事件的資訊來更新我們原所信仰的先驗機率。

(Photo Credit: Wikipedia)

所有討論 7
林澤民_96
37 篇文章 ・ 243 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。