許多人說,現在科學這麼發達,為什麼天氣預報總是不準呢?
這裡涉及一個數學問題,稱為「條件機率」。
什麼是條件機率呢?例如我們要確定 6 月 15 日是不是下雨,根據往年資料,下雨的機率有 40% ,不下雨的機率為 60% ,這就稱為「機率」。如果在前一天,天氣預報說 6月15 日下雨,這就稱為「條件」, 在這種條件下, 6 月 15 日真正下雨的機率就稱為「條件概率」。
你哭著對我說,天氣預報裡都是騙人的
天氣預報根據一定的氣象參數推測是否會下雨,由於天氣捉摸不定,即便預報下雨,也有可能是晴天。假設天氣預報的準確率為 90% ,即在預報下雨的情況下,有 90% 的機率下雨,有 10% 的機率不下雨;同樣,在預報不下雨的情況下,有 10% 的機率下雨,有 90% 的機率不下雨。
這樣一來, 6 月 15 日的預報和天氣就有四種可能:預報下雨且真的下雨,預報不下雨但是下雨,預報下雨但是不下雨,預報不下雨且真的不下雨。
我們把四種情況列在下面的表格中,並計算相應的機率。
下雨 | 不下雨 | |
預報下雨 | 40% × 90% = 36% | 60% × 10% = 6% |
預報不下雨 | 40% × 10% = 4% | 60% × 90% = 54% |
計算方法就是兩個機率的乘積。例如下雨機率為 40% ,下雨時預報下雨的機率為 90% ,因此預報下雨且下雨這種情況出現的機率為 36% 。同理,我們可以計算出天氣預報下雨但是不下雨的機率為 6% ,二者之和為 42% ,這就是天氣預報下雨的機率。
在這 42% 的可能性中,真正下雨占 36% 的可能,比例為\( 36 \div 42=85.7 \)%,而不下雨的機率為 6% ,占 \( 6 \div 42=14.3 \) %。
也就是說,假設天氣預報的準確率為 90% ,預報下雨的條件下,真正下雨的機率只有 85.7% 。
我們會發現:
預報下雨時是否真的下雨,不光與預報的準確度有關,同時也與這個地區平時下雨的機率有關。
檢查報告說我中獎了,我就真的生病了嗎?
與這個問題類似的是在醫院進行重大疾病檢查時,如果醫生發現異常,一般不會直接斷定生病了,而會建議到大醫院再檢查一次,雖然這兩次檢查可能完全相同。為什麼會這樣呢?
假設有一種重大疾病,患病人群占總人群的比例為\(\frac{1}{7000} \) 。也就是說, 隨機選取一個人,有\(\frac{1}{7000} \) 的機率患有這種疾病,有\(\frac{6999}{7000} \) 的機率沒有患這種疾病。
有一種先進的檢測方法,誤診率只有萬分之一,也就是說,患病的人有\(\frac{1}{10000} \) 的可能性被誤診為健康人,健康人也有\(\frac{1}{10000} \) 的可能性被誤診為患病。
我們要問:在一次檢查得到患病結果的前提下,這個人真正患病的機率有多大?
患病 | 健康 | |
檢測患病 | \(\frac{1}{7000} \times \frac{9999}{10000}\)\(= \frac{9999}{70000000}\) | \(\frac{6999}{7000} \times \frac{1}{10000}\)\(= \frac{6999}{70000000}\) |
檢測健康 | \(\frac{1}{7000} \times \frac{1}{10000}\)\(= \frac{1}{70000000}\) | \(\frac{6999}{7000} \times \frac{9999}{10000}\)\(= \frac{69983001}{70000000}\) |
我們仿照剛才的計算方法,檢測出患病的總機率為:\(\frac{9999}{70000000}+\frac{6999}{70000000} \) \(=\frac{16998}{70000000}\)
而患病且檢測出患病的機率為:\(\frac{9999}{70000000}\)
所以在檢測患病的條件下,真正患病的機率為:\( \frac{9999}{70000000} \div \frac{16998}{70000000}\) \(=\frac{9999}{16998}\) \( \approx 58.8 \)%
顯而易見,即便是萬分之一誤診的情況,一次檢測也不能完全確定這個人是否患病。
那麼,兩次檢測都是患病的情況又如何呢?
大家要注意,在第一次檢測結果為患病的前提下,此人患病的機率已經不再是所有人群的 \(\frac{1}{7000}\) ,而變為自己的 58.8% ,健康的機率只有 41.2% 。
此處的機率就是條件機率,所以第二次檢測的表格變為:
患病 | 健康 | |
檢測患病 | 58.8% × \(\frac{9999}{10000}\)= 58.794% | 41.2% × \(\frac{1}{10000}\)= 0.004% |
檢測健康 | 58.8% × \(\frac{1}{10000}\)= 0.006% | 41.2% × \(\frac{9999}{10000}\)= 41.196% |
在兩次檢測都是患病的條件下,此人真正患病的機率為:\(\frac{58.794}{58.794+0.004}\)\(=99.99 \) % 基本確診了。
日常生活超有感──貝式定理
對這個問題進行詳細討論的人是英國數學家貝葉斯。
貝葉斯指出:如果 A 和 B 是兩個相關的事件, A 有發生和不發生兩種可能, B 有 B1 、 B2 、……、 Bn 共 n 種可能。
那麼在 A 發生的前提下, Bi 發生的機率稱為:條件機率 \( P(B_i|A) \)
要計算這個機率,首先要計算在 Bi 發生的條件下 ,A 發生的機率,公式為:\( P(B_i)P(A|B_i) \)
然後,需要計算事件A發生的總機率:
方法是用每種Bi情況發生的機率與相應情況下A發生的機率相乘,再將乘積相加。
\( P(B_1)P(A_1|B_1)+P(B_2)P(A_2|B_2)+\cdots+P(B_n)P(A_n|B_n) \)
最後,用上述兩個機率相除,完整的貝式定理公式就是:
\( P(B_i|A) \) \(=\frac{P(B_i)P(A|B_i)}{P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+\cdots+P(B_n)P(A|B_n)} \)
貝式定理在社會學、統計學、醫學等領域,都發揮著巨大作用。
下次遇到天氣誤報、醫院誤診,不要完全怪氣象臺和醫院啦!有時候這是個數學問題。
——本文摘自《跟著網紅老師玩科學》,2019 年 4 月,時報出版。