0

2
1

文字

分享

0
2
1

天氣預報到底是不是在騙人?我整個就不爽了!從生活案例看條件機率——《跟著網紅老師玩科學》

時報出版_96
・2019/08/23 ・1984字 ・閱讀時間約 4 分鐘 ・SR值 438 ・四年級

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

許多人說,現在科學這麼發達,為什麼天氣預報總是不準呢?

這裡涉及一個數學問題,稱為「條件機率」。

什麼是條件機率呢?例如我們要確定 6 月 15 日是不是下雨,根據往年資料,下雨的機率有 40% ,不下雨的機率為 60% ,這就稱為「機率」。如果在前一天,天氣預報說 6月15 日下雨,這就稱為「條件」, 在這種條件下, 6 月 15 日真正下雨的機率就稱為「條件概率」。

圖/《跟著網紅老師玩科學》提供

你哭著對我說,天氣預報裡都是騙人的

天氣預報根據一定的氣象參數推測是否會下雨,由於天氣捉摸不定,即便預報下雨,也有可能是晴天。假設天氣預報的準確率為 90% ,即在預報下雨的情況下,有 90% 的機率下雨,有 10% 的機率不下雨;同樣,在預報不下雨的情況下,有 10% 的機率下雨,有 90% 的機率不下雨。

這樣一來, 6 月 15 日的預報和天氣就有四種可能:預報下雨且真的下雨,預報不下雨但是下雨,預報下雨但是不下雨,預報不下雨且真的不下雨。

我們把四種情況列在下面的表格中,並計算相應的機率。

下雨 不下雨
預報下雨 40% × 90% = 36% 60% × 10% = 6%
預報不下雨 40% × 10% = 4% 60% × 90% = 54%

計算方法就是兩個機率的乘積。例如下雨機率為 40% ,下雨時預報下雨的機率為 90% ,因此預報下雨且下雨這種情況出現的機率為 36% 。同理,我們可以計算出天氣預報下雨但是不下雨的機率為 6% ,二者之和為 42% ,這就是天氣預報下雨的機率。

在這 42% 的可能性中,真正下雨占 36% 的可能,比例為\( 36 \div 42=85.7 \)%,而不下雨的機率為 6% ,占 \( 6 \div 42=14.3 \) %。

也就是說,假設天氣預報的準確率為 90% ,預報下雨的條件下,真正下雨的機率只有 85.7% 。

我們會發現:

預報下雨時是否真的下雨,不光與預報的準確度有關,同時也與這個地區平時下雨的機率有關

圖/《跟著網紅老師玩科學》提供

檢查報告說我中獎了,我就真的生病了嗎?

與這個問題類似的是在醫院進行重大疾病檢查時,如果醫生發現異常,一般不會直接斷定生病了,而會建議到大醫院再檢查一次,雖然這兩次檢查可能完全相同。為什麼會這樣呢?

假設有一種重大疾病,患病人群占總人群的比例為\(\frac{1}{7000} \) 。也就是說, 隨機選取一個人,有\(\frac{1}{7000} \) 的機率患有這種疾病,有\(\frac{6999}{7000} \) 的機率沒有患這種疾病。

有一種先進的檢測方法,誤診率只有萬分之一,也就是說,患病的人有\(\frac{1}{10000} \) 的可能性被誤診為健康人,健康人也有\(\frac{1}{10000} \) 的可能性被誤診為患病。

我們要問:在一次檢查得到患病結果的前提下,這個人真正患病的機率有多大?

患病 健康
檢測患病 \(\frac{1}{7000} \times \frac{9999}{10000}\)\(= \frac{9999}{70000000}\)  \(\frac{6999}{7000} \times \frac{1}{10000}\)\(= \frac{6999}{70000000}\)
檢測健康 \(\frac{1}{7000} \times \frac{1}{10000}\)\(= \frac{1}{70000000}\)  \(\frac{6999}{7000} \times \frac{9999}{10000}\)\(= \frac{69983001}{70000000}\)

我們仿照剛才的計算方法,檢測出患病的總機率為:\(\frac{9999}{70000000}+\frac{6999}{70000000} \) \(=\frac{16998}{70000000}\)
患病且檢測出患病的機率為:\(\frac{9999}{70000000}\)

所以在檢測患病的條件下,真正患病的機率為:\( \frac{9999}{70000000} \div  \frac{16998}{70000000}\) \(=\frac{9999}{16998}\) \( \approx 58.8 \)%

顯而易見,即便是萬分之一誤診的情況,一次檢測也不能完全確定這個人是否患病。

圖/《跟著網紅老師玩科學》提供

那麼,兩次檢測都是患病的情況又如何呢?

大家要注意,在第一次檢測結果為患病的前提下,此人患病的機率已經不再是所有人群的 \(\frac{1}{7000}\) ,而變為自己的 58.8% ,健康的機率只有 41.2% 。

此處的機率就是條件機率,所以第二次檢測的表格變為:

患病 健康
檢測患病 58.8% × \(\frac{9999}{10000}\)= 58.794%  41.2% × \(\frac{1}{10000}\)= 0.004%
檢測健康  58.8% × \(\frac{1}{10000}\)= 0.006%  41.2% × \(\frac{9999}{10000}\)= 41.196%

兩次檢測都是患病的條件下,此人真正患病的機率為:\(\frac{58.794}{58.794+0.004}\)\(=99.99 \) % 基本確診了。

日常生活超有感──貝式定理

對這個問題進行詳細討論的人是英國數學家貝葉斯

圖/《跟著網紅老師玩科學》提供

貝葉斯指出:如果 A 和 B 是兩個相關的事件, A 有發生和不發生兩種可能, B 有 B1 、 B2 、……、 Bn 共 n 種可能。

那麼在 A 發生的前提下, Bi 發生的機率稱為:條件機率 \( P(B_i|A) \)

要計算這個機率,首先要計算在 Bi 發生的條件下 ,A 發生的機率,公式為:\( P(B_i)P(A|B_i) \)

然後,需要計算事件A發生的總機率

方法是用每種Bi情況發生的機率與相應情況下A發生的機率相乘,再將乘積相加。
\( P(B_1)P(A_1|B_1)+P(B_2)P(A_2|B_2)+\cdots+P(B_n)P(A_n|B_n) \)

最後,用上述兩個機率相除,完整的貝式定理公式就是:

\( P(B_i|A) \) \(=\frac{P(B_i)P(A|B_i)}{P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+\cdots+P(B_n)P(A|B_n)} \)

貝式定理在社會學、統計學、醫學等領域,都發揮著巨大作用。

下次遇到天氣誤報、醫院誤診,不要完全怪氣象臺和醫院啦!有時候這是個數學問題。

——本文摘自《跟著網紅老師玩科學》,2019 年 4 月,時報出版

文章難易度
時報出版_96
151 篇文章 ・ 29 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

46
1

文字

分享

0
46
1
另外一個你可能存在嗎?從宇宙誕生到現在,你的存在需要經過一千兆個「偶然」——《宇宙大哉問》
天下文化_96
・2022/09/23 ・3064字 ・閱讀時間約 6 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

  • 作者/豪爾赫.陳、丹尼爾.懷森
  • 譯者/徐士傑、葉尚倫

還有另一個你嗎?

如果世界上某個地方有另一個版本的你,會不會很奇怪?

這是什麼科幻劇情?圖/天下文化提供

你們兩個之間有很多共通點,喜歡吃的水果(香蕉)、不喜歡吃的水果(桃子)、擁有同樣的技能(製作香蕉冰沙)和相同的缺點(香蕉冰沙吃了停不下來)、同樣的記憶、幽默感以及個性。當你知道有其他版本的你存在時,你會覺得很怪異嗎?你會想與他們會面嗎?

想像一下更詭異的情況:有個人幾乎和你完全一模一樣,僅稍稍有些不同。如果這個人比你更好呢?也許他做的水果冰沙更加美味,或者生活的方式更有意義。或者,這個人比較沒有才華,但是比較卑鄙,就像是邪惡的分身呢?

假如有幸能見到另一個你,或許你可以發現自己的更多可能。圖/天下文化提供

這有可能嗎?

雖然讓人難以想像,但物理學家不能排除另一個你存在的可能性。事實上,物理學家不只認為另一個你是可能存在的,甚至認為另一個你存在的可能性更高。也就是說,就在此刻,當你讀到這篇文章時,可能有另一個你正在某個地方,穿著和你一樣的衣服,以相同的方式坐著,甚至讀著同樣的一本書(好吧,也許是稍微有趣的版本)。

搞不好另一個你也正在看這篇文章喔!圖/天下文化提供

要瞭解另一個你存在的意義及可能性,我們得先考慮你的存在有多麼獨特。

你存在的機率

乍看之下,世界上有另一個與你毫無二致的人,機率好像是微乎其微。畢竟,想像一下,為了讓宇宙創造你,有多少事情必須發生,而且要環環相扣,缺一不可。

超新星必須在氣體和塵埃雲附近爆炸,藉著震動造成引力崩坍,形成我們的太陽和太陽系。這些塵埃中的一小塊(不到萬分之一)必須聚集在一起形成行星,並與太陽保持合適的距離,這樣水就不會結冰或變成蒸汽。生命一定要開始,恐龍必須滅絕,人類不得不演化,羅馬帝國必須崩潰,而你的祖先必須逃過黑死病。然後,你的父母必須相遇並且喜歡上了彼此。你的母親務必在正確時間排卵。在與數十億顆精子的馬拉松游泳賽中,帶有你一半基因的精子必須衝刺獲勝。單單是讓你誕生,就需要這一連串事件。

宇宙必須經歷一連串事件,才會有現在的你。圖/天下文化提供

想一想你在生活中做出的所有決定,使你成為今日的你。你有沒有吃很多香蕉。你有沒有遇到那個重要的朋友。你那時候決定待在家裡,否則會被水果推車碾過。不知何故你發現了這本關於宇宙的蠢書,並決定閱讀它。所有的一切,都從四十五億年前開始,導致了你此時此刻在這裡存在。

假如所有事情以完全相同方式再次發生,從而造就另一個你的機會有多大?這似乎不太可能,對吧?

也許不是喔!讓我們回溯所有導致你出現的隨機事件、決定和時刻,並試著計算機率是多少。

讓我們從今天開始算起:你醒來後做了多少決定呢?你可能決定怎樣起床,穿什麼衣服,吃什麼早餐。即使是看起來很小的決定,也可能改變你的人生歷程。例如,你選擇穿有香蕉圖案的襯衫或者是領帶,可能影響你未來的配偶有沒有注意到你。

讓我們假設,你每分鐘大約會做出一兩個可能改變人生的決定;這聽起來好像很有壓力,但如果你贊同量子物理學和混沌理論,數字應該會更高。假設每分鐘只有幾個決定,那麼你每天就要做出數千個重要決定,每年就高達約一百萬個。如果你超過二十歲,人生到目前為止,就已經做出超過兩千萬個決定,才會有今日的你。

接下來,假設你做的每個決定只有兩種可能,例如 A 或 B,或者香蕉和桃子。好啦,我知道通常要選擇的項目很多(譬如,早餐店的菜單選項多不勝數),但讓我們簡化問題。要計算那兩千萬次決定而成為你的可能性,你必須取 2 的兩千萬次方,即 220,000,000

如果你超過二十歲,人生到目前為止,就已經做出超過兩千萬個決定,才會有今日的你。圖/天下文化提供

為什麼?因為每做一次決定就會讓可能的數目加倍。舉例來說,你必須選擇從哪邊(左邊或右邊)下床、早餐吃什麼水果(香蕉或桃子),以及上班搭什麼交通工具(火車或公車),總共就有 2×2×2(或 23)種開啟一日行程的方式。你從左邊下床、吃香蕉並坐公車的機率是 23 分之一,或說 8 分之一。

因此,如果你在生活中做出兩千萬個 A 或 B 的決定,那就意味你的生活可能有 220,000,000 種不同的結果。這真是一個驚人的數字,是吧!但我們才剛開始暖身而已!

我們還必須考慮你的出生機率,包含你父母做決定的可能結果。如果將你父母的決定算進來,就必須再加上四千萬個決定(你父母各兩千萬個)。再加上你四個祖父母,還有八千萬個。曾祖父母呢?還有一億六千萬個。你瞭解了嗎?每回推一個世代,祖先數量就增加一倍,影響你出生的決定數量也跟著加倍。人類已經在地球上生活了至少三萬年,或許可換算為大約一千五百個世代。若將你所有祖先全部考慮進來,可能的數量會更龐大。

如果再將你父母的決定算進來,就必須再加上四千萬個決定。圖/天下文化提供

其實,真要計算起來實際情況更加複雜,如果回溯得夠遠,你會發現親戚之間盤根錯節的關係,同一個人可能在你的家譜中重複出現,除了引發令人尷尬的話題之外,也讓數學計算變得更加複雜。為簡單起見,我們假設你每代只受到兩個人的影響。這仍然有 1,500 代× 2 人× 2,000 萬個決定= 600 億個決定。及至目前為止,你發生的機率是 260,000,000,000 分之一。

只算到這裡就夠了嗎?讓我們考慮人類史前歷史並回溯到數十億年前最小微生物演化之時。在大約三十五億年前,地球上的生命開始孕育。如果你不得不製作年代如此久遠的家譜,就會發現祖先主要是微生物和簡單植物。他們大概無法做出有意識的決定,但仍會遭受到隨機事件影響,諸如風如何吹動,陽光是否照耀,天降甘霖與否等等。

假設你的微生物祖先每天至少受到一個隨機事件影響,每個隨機事件也有兩種可能結果(例如,一塊石頭是否砸落在你的微生物祖先身上)。這意味我們必須將另外一兆(1,000,000,000,000)個決定事件添加到我們的機率中。

現在,讓我們回到四十五億年前太陽系剛形成的時候,找到你的構成原子之前所在的恆星或行星,然後再一路回到一百四十億年前的大霹靂。讓我們做個超級的低估,假設在那些日子裡,每天都發生了一件可能影響你來到人世的重要大事。直到今日,大約有一千兆個關鍵事件,你存在的機率陡然劇降到約21,000,000,000,000,000 分之一。

總而言之,你存在的機率大概是 2 的 1000 兆次方分之一。圖/天下文化提供

——本文摘自《宇宙大哉問:20個困惑人類的問題與解答》,2022 年 8 月,天下文化,未經同意請勿轉載。

天下文化_96
110 篇文章 ・ 597 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

2
0

文字

分享

0
2
0
換個位子,換腦袋!機率在不同行業代表什麼意思?——《塗鴉學數學》
臉譜出版_96
・2020/07/23 ・1978字 ・閱讀時間約 4 分鐘 ・SR值 494 ・六年級

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

  • 作者/ 班‧歐林 (Ben Orlin);譯者/王年愷

若說人類「不擅長」機率,太過簡化又太讓人難堪了。

機率是現代數學裡一門相當精妙的分支,當中處處有悖論陷阱。即使是基本的問題,也可能讓冷靜無情的專家暈頭轉向。嘲諷別人機率算錯,就像是在笑他們怎麼那麼不會飛,或是怎麼那麼不會喝下一整個海洋的水,或是怎麼那麼不防火。

如果真要說句公道話,應該說人類處理機率的能力實在爛透了。康納曼和特沃斯基在心理學研究中發現,人類對於不確定的事件有頑固的錯誤想法。他們會一而再、再而三地高估可能性微乎其微的事件,並低估幾乎鐵定會發生的事件。

圖/臉譜出版提供

這沒什麼大不了的,不是嗎?老實說,我們什麼時候看過機率在真實世界裡冒出頭來呢?又不是一輩子都在想辦法抓住知識性的工具,讓我們也許能在每一個清醒時刻的種種不確定性混沌中稍稍有些安穩⋯⋯

好吧,為了以防萬一——本章是一個操作指南,說明各種不同的人類怎麼去思考不確定性。這個東西就算再難,也不表示我們不能拿它來玩一玩。

如果你是政治記者

圖/臉譜出版提供

哈囉!你是一位政治記者。你會報導即將到來的選舉。你會報導失敗的選戰。在罕見的特別日子裡,你甚至還會報導像是「政策」和「治理」的事。

另外,稍微不可能的事情發生時,你好像會感到困惑。情況並非一直如此。在某個遙遠的過去,你會把選舉視為無限可能的神奇時刻。你輕描淡寫最可能發生的結果來增加刺激感,讓每一場選戰看起來都像是比賽結束鈴聲響起時從中場丟球正中籃框定勝負的。

2004 年美國總統大選當天晚上,小布希在俄亥俄州領先 100,000 票,未開出的選票不到 100,000 張時,你卻說俄亥俄州的選舉結果「太接近,無法確定」。到了 2012 年的總統大選,機率模型預測歐巴馬獲勝的可能性是 90%,你卻說選戰是「兩邊都有可能贏」。

然後,2016 年又把你的世界完全顛倒過來了。川普贏了希拉蕊.柯林頓。第二天醒來時,你覺得你經歷了一次量子奇異點,選舉結果就像是一隻突然憑空冒出來的兔子一樣完全無法預料。但對機率學家席佛(Nate Silver)及看法相近的人來說,這個結果只不過有一點意外而已,發生的機率為三分之一—就像丟骰子丟出 5 或 6 一樣。

如果你是氣象預報員

圖/臉譜出版提供

哈囉!你是一位氣象預報員,是電視上的雲層先知。你的一舉一動都自信滿滿,每一次交談的結尾都是「現在把現場交還棚內主播」。

另外,你會故意把機率說得模稜兩可,讓觀眾不會對你生氣。當然,你會盡可能誠實。如果你說明天的降雨機率是 80%,你所說的完全正確:在這樣的日子當中,降雨的日子總共有 80%。

但是,當降雨比較不可能發生時,你會誇大這些數據。你害怕有人把雨傘留在家裡,天空卻下起雨來,他們跑到網路上罵你。因此,當你說明天降雨機率是 20% 時,這種日子實際上只有 10% 會降雨。你會增加機率,來減少觀眾的咒罵。

假如觀眾更了解機率是什麼,也許你就能夠說出真話。當觀眾聽到「10%」的時候,好像會理解成「不會發生」。假如他們真的理解真正的意思(「每十次會發生一次」),你就能放鬆講出心裡真正想說的數據。在這一天到來以前,你仍然只能兜售半真半假的數據。

現在把現場交還棚內主播。

如果你是千年鷹號太空船船長

圖/臉譜出版提供

哈囉!你是「千年鷹號」(Millennium Falcon)1 太空船船長。你是一位星際暴徒、壞蛋,也是心腸寬大的俠盜。你一生的伙伴是一隻身上只穿一條子彈帶的 8 英尺長太空狗。

另外,你完完全全否認有「可能性」這件事。你不是一個會冷靜反思和考慮戰略的人。你會走私違禁品,也會顛覆整個帝國。你是快速拔槍殺人的冒險之士,只要稍有遲疑便會喪命,多猶豫幾下的話還會更慘。

在散兵坑裡沒有機率專家,而且你一生都躲在散兵坑裡。對你來說,繁複的機率算式只是累贅,和某個一直說「我的天啊」及「請容我建議」的神經質金色機器人一樣是拖油瓶。

我會覺得,我們每一個人的心裡都有一點你的特質。在需要冷靜、細心評估的時候,機率是相當有用的東西,但有時候我們需要一種自信,是頑強的量化數據給不了的。在需要直覺和行動的時刻,被機率拴住的人可能會畏縮,不敢跳出非跳不可的一大步。在這種時候,我們必須忘掉數據,儘管去飛。

註解:

  1. 譯注:《星際大戰》中的宇宙飛船,用於走私業務,影史上最著名的太空船之一。

——本文摘自《塗鴉學數學:以三角形打造城市、用骰子來理解經濟危機、玩井字遊戲學策略思考,24堂建構邏輯思維、貫通幾何學、破解機率陷阱、弄懂統計奧妙的數學課》,2020 年 5 月,臉譜出版

臉譜出版_96
67 篇文章 ・ 244 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

2
1

文字

分享

0
2
1
醫療檢測的準確度:「偽陰性」、「偽陽性」到底是什麼意思?如何計算準確度?
tml_96
・2020/04/28 ・7507字 ・閱讀時間約 15 分鐘 ・SR值 605 ・十年級

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

  • 作者/林澤民

最近關於新冠病毒全面篩檢的問題時不時就在媒體上出現。圖/Martin Lopez@Pexels

最近因為大家關心新冠病毒是否要全面篩檢的問題,媒體上常見一些醫事檢驗學的術語。其中最常聽到的是「偽陰性」,但也常讀到「特異性」與「敏感性」;這些名詞都與新冠病毒檢測的準確度有關。在瘟疫變成每個人生存威脅的時候,這些專門術語也變得跟我們的生活息息相關。

本文嘗試用基本統計檢定概念來詮釋這些名詞,更進一步用數據科學中衡量搜尋、辨識工具準確度的概念來探討醫療檢測的準確度。

「檢測準確度」與「統計檢定」概念可互相對應

在醫檢學,「敏感性」(sensitivity) 常與「特異性」(specificity) 共同用來衡量檢測的準確度。

這些名詞,不熟悉醫檢學的讀者可能會覺得莫測高深,但其實它們與基本統計學所教的統計檢定的基本概念是互相對應的,只是著重點有所不同。這裡先簡單地解釋它們與統計檢定概念的關係,以利讀者了解醫檢學的術語。

先說特異性。特異性是不帶原者中採檢陰性的比例,一般簡稱為「真陰性」的比例。而敏感性則是帶原者中採檢陽性的比例,也可稱為「真陽性」的比例。

表一、醫療檢測結果類型

受檢者
不帶原
(non-carrier)
帶原
(true-carrier)
採檢結果 陽性
(positive)
偽陽性
(false positive)
真陽性
(true positive)
陰性
(negative)
真陰性
(true negative)
偽陰性
(false negative)

如果把上圖跟基本統計學學生所熟悉的下圖相比較,就可以看出醫檢術語與傳統統計檢定概念的對應關係。

表二、統計結果檢定類型

虛無假設(H0) v. 研究假設(HA)
虛無假設為真
(H0 Ture)
研究假設為真
(HA True)
採檢結果 拒絕虛無假設
(positive)
型一錯誤
(size of test=α)
檢定強度
(power of test=1-β)
無法拒絕虛無假設
(negative)
信心水平
(1-α)
型二錯誤
(β)

所以當我們把「比例」視同「機率」時,特異性其實就是統計檢定的信心水平,而敏感性就是統計強度。連結到型一錯誤的機率 α(即顯著水平,也稱檢定規模)、型二錯誤的機率 β,可以清楚看到:

特異性 = 真陰性的機率 = 信心水平 = 1 – α

敏感性 = 真陽性的機率 = 檢定強度 = 1 – β

因為 α、β 是錯誤的機率,愈小愈好,所以特異性、敏感性都是愈高愈好。但 α、β 並不是互相獨立的。如果樣本數固定、所要檢定的效應(即 H0 跟 HA 的差距)也固定,通常 α 愈小 β 會愈大、α 愈大 β 會愈小,因此特異性跟敏感性之間也有同樣的互換關係。

特異性、敏感性這兩個概念其實都還是傳統所謂「頻率學派」(frequentist) 統計學的概念,它們並未涉及貝氏定理的反機率。在討論新冠病毒採檢準確度的問題時,我們更需關注的其實是反機率的問題:「當採檢為陽性時,其為偽陽性的機率有多高?」反過來說:「當採檢為陰性時,其為偽陰性的機率有多高?」

這些問題,也是近年來撼動頻率學派統計檢定方法的貝氏學派統計學者所指出的問題。

要算這些反機率就必須用到貝氏定理。最近在機器學習、自然語言處理等領域被廣泛使用的 F1 便是由「真陽性」的機率與反機率混合組成的一種檢測準確度 (accuracy) 的度量。

關於貝氏統計學派對傳統頻率學派統計檢定方法的批評,可參考:P 值的陷阱(上):P 值是什麼?又不是什麼?  P 值的陷阱(下):「摘櫻桃」問題

在討論新冠病毒採檢準確度的問題時,我們更需關注的其實是反機率的問題:「當採檢為陽性時,其為偽陽性的機率有多高?」反過來說:「當採檢為陰性時,其為偽陰性的機率有多高?」圖/GIPHY

數據科學中的「準確度」:F1 分數

F1 分數有時簡稱 F 分數,也稱為 Sørensen-Dice 係數。在數據科學裡,F1 常被用來做為搜尋、辨識「相似」資料準確度的度量。它可以用來衡量搜尋引擎的準確度,也常用在自然語言處理中資料的搜尋、辨識,當然它也可以用於人臉辨識。

想像你要用文本分析的方法來研究瘟疫流行期間海峽兩岸情緒的互動。台灣這邊,你要找出一月以來所有與疫情及兩岸情緒互動有關的貼文;大陸那邊,你專注於搜尋微信上面的貼文。你使用的辨識工具是一組包括疫情及兩岸關係的關鍵詞;你希望這組關鍵詞能夠正確地指認出每一篇相關貼文。

你知道你的辨識工具的準確度跟你使用的關鍵詞有關,為了要正確找出相關貼文,你希望辨識的準確度越高越好;但是不論你使用了哪些關鍵詞,你的工具的準確度不會是百分之百。有時一篇貼文明明跟你研究的主題有關,你的辨識工具卻指認不出來;有時明明跟研究主題無關的貼文,卻被認定有關。

如何在網路上精準搜尋資料也是門學問呢!圖/GIPHY

不過,這樣的文本處理過程,其實與醫療檢測有類似之處:對同一篇貼文,用關鍵詞為工具來辨識貼文性質的結果可以有偽陽性、真陽性、真陰性、偽陰性四種類型,這基本上跟表一是一樣的。

F1 包含了兩個成分:召回率 (Recall) 和精密性 (Precision)。F1 是這兩個成分的平均數,但不是算數平均數而是調和平均數

\( F1=\frac{2}{\frac{1}{Recall}+\frac{1}{Precision}} \)

因為召回率精密性的值都介於 0 與 1 之間,F1 的值也會介於 0 與 1 之間。如果召回率和精密性之一的值趨近於 0,F1 的值也會趨近於 0;如果召回率和精密性的值都等於 1,F1 的值也會等於 1。

特別值得注意的是:作為調和平均數,F1 的值永遠小於或等於召回率和精密性的算術平均數。這也就是說:相較於算術平均數,F1 的值會更被它的成份中比較小的那個數值拉低。不論召回率和精密性之中哪個成分的值較小,在計算 F1 時,較小那個成分實質上有較大的權重。這是調和平均數與算數平均數不同的地方。

那麼什麼是召回率?什麼是精密性?

召回率其實就是醫檢學中的敏感性(真陽性)。之所以喚作召回率,應該就是真正具有某種性質的受檢群體,有多少比例能夠被正確指認出來的意思。召回率可以用型二機率表示如下:

召回率 = 敏感性 = 真陽性的機率 = Pr(採檢結果陽性 | 受採檢者為帶原者)= 1 – β

精密性則是召回率的反機率:

精密性 = 召回率(敏感性、真陽性)的反機率 = Pr(受採檢者為帶原者 | 採檢結果陽性)

為什麼算準確度除了召回率還要加上召回率的反機率?這是因為反機率其實是更實際、更重要的考慮。召回率的分母是不特定的群體,而精密性(召回性的反機率)的分母是特定的。以醫療檢測來說,召回率(敏感性)的分母包括所有帶原者,但受採檢的個人並不知道自己帶不帶原,採檢的防疫人員也不知道帶原者是哪一群人,因此召回率只是一個抽象的概念。

相對來說,精密性(敏感性的反機率)的分母是所有採檢陽性者,不但採檢陽性的個人知道自己是陽性,防疫人員也知道採檢陽性的是哪一群人,因此它是比較具體的概念。採檢陽性的人會極想知道自己是真正帶原還是不帶原,防疫人員更需要考量採檢陽性的人中有多少真正帶原或其實不帶原。

採檢陽性的人會極想知道自己是真正帶原,還是不帶原。圖/GIPHY

用貝氏定理計算反機率的詳細步驟,可參考:會算「貝氏定理」的人生是彩色的!該如何利用它讓判斷更準確、生活更美好呢?以及本文附錄。

但貝氏定理要求必須先對帶原、不帶原的先驗機率作出假設。我們假設所有受檢者中帶原者的比例為 π ──或者說每一隨機受檢者帶原的機率為 π ──而不帶原的比例為 1-π。

這 π 可以是客觀估計的頻率,也可以是醫生經由對受檢者問診或疫調形成的主觀判斷。我們算出的結果是:

\( Precision=\frac{(1-\beta )\pi }{\alpha+ (1-\alpha -\beta )\pi } \)

精密性(敏感性的反機率)可能甚小於敏感性。例如當 π = 0.1,α=0.05,β=0.2 時,敏感性為 0.8,敏感性的反機率約為 0.14。這是因為採檢陽性者當中有甚多是偽陽性者的緣故。

假設桃園機場每天有 1000 位入境旅客全部接受篩檢,其中未帶原者有 990 人而帶原者只有 10 人。雖然偽陽性 (α) 只有 5%,990 位未帶原者中也會有將近 50 位被誤檢為陽性,而真陽性 (1-β) 雖然高達 80%,10 位帶原者中也只有 8 位確診陽性。這樣採檢陽性者一共 58 人中,帶原者的比例也只有 8/58,大約 14%。

假設受檢者 1000 人, π = 0.1,α=0.05,β=0.2 時,敏感性為 0.8

   \受檢者(人)
採檢結果\
不帶原
990
帶原
10
陽性 偽陽性
50*
真陽性
8
陰性 真陰性
940
偽陰性
2

*因 990 的 5%為 49.5 人不合常理,此處四捨五入

這就是貝氏定理的奧妙之處:雖然型一、型二的錯誤機率都不能說很大,當真正帶原者的比例很小時,以採檢陽性者為分母來算,偽陽性的比例會比 α 高甚多,而真陽性的比例會比 1 – β 低甚多。這是與一般人的直覺很不一樣的。因為大多數人不帶原,只要有一點點偽陽性的機率(α),採檢陽性的人中便會有許多不帶原者。如果不了解貝氏定理而對這一點感到困惑,便是犯了所謂「基率謬誤」(base rate fallacy)。

從精密性的公式可以看出:當 α=0,特異性 100% 的時候,精密性也是 100%。此時 F1 的公式簡化為:

\( F1=\frac{2}{\frac{1}{Recall}+\frac{1}{Precision}}=\frac{2Recall}{1+Recall} \)

也就是 F1 完全由召回率(敏感性、真陽性)來決定,召回率越高,F1 也越高;此時沒有反機率的問題。

將 F1 應到到醫學檢驗上

要用 F1 來衡量醫事檢驗的準確度,只要把召回率改成敏感性(真陽性)、把精密性改成敏感性(真陽性)的反機率就可得到下列 F1 分數:

\( F1=\frac{2}{\frac{1}{Recall}+\frac{1}{Precision}}=\frac{2(1-\beta )\pi }{\alpha+ (2-\alpha -\beta )\pi } \)

這個公式包含了三個變項:α、β、π。

在醫學檢驗,α 是偽陽性也是特異性的反面,β 是偽陰性也是敏感性的反面。在統計分析中,α 是研究者自己可以設定的,就是一般所謂的顯著水平,通常設在 α=0.05。近年因為學界廣泛對 p 值的質疑,有不少學者主張要從嚴用 α=0.005。在採檢新冠狀病毒的時候,核酸檢測的設計極大化了特異性,也就是極小化了偽陽性的機率 α;快篩則因為較難以區別各種冠狀病毒而會有較大的 α。

圖一、二中,我們分別以 α=0.05 及 α=0.005 這兩個顯著水平為參數,在所有受檢者中帶原者的比例 π=0.01 的假設下,劃出召回率(敏感性、真陽性)、精密性(敏感性、真陽性的反機率)、F1 對於 β 的函數圖形。

這兩個圖形的橫軸,β,是型二錯誤機率,也即偽陰性,它是敏感性(真陽性)1 – β 的反面。偽陰性是防疫專家很關心的一個指數;防疫中心指揮官陳時中之所以堅持不肯在機場對入境旅客進行普篩的主要原因就是因為篩檢的偽陰性高,他擔心旅客採檢陰性就放下心防趴趴走。若偽陰性的檢測結果太多,則病毒將在社區廣泛傳播。

防疫中心似乎從不曾明確說出快篩偽陰性的機率,張上淳醫師則說他相信三採陰的核酸檢測敏感性「幾乎是百分之百」。中文網頁曾被引用的敏感性數字如「約 10%~70%」、「只有 50-80%」等,似乎指的都是流感的快篩而不是新冠狀病毒的快篩。

其實,即使 4 月 9 日的 Science Daily 都還引用一篇 Mayo Clinic Proceedings 的論文,指出醫學文獻尚未就現有核酸檢測工具的敏感性有清楚、一致的報告。如果快篩敏感性「只有 50-80%」,那我們必須考慮的 β 數值應在 20-50% 之間。如果偽陰性的機率是 0.2,三採陰性仍為偽陰性的機率是 0.008,那麼三採陰的敏感性的確是張上淳醫師所說的「幾乎是百分之百」。

然而敏感性並不是計算準確度的唯一成分,除了敏感性,我們還要考慮敏感性的反機率。圖一、二顯示,至少在 0 < β < 0.5 的區間,精密性(敏感性的反機率)要小於召回率(敏感性),而兩者的和諧平均數 F1 要比算術平均數更靠近數值較低的精密性。換句話說,當我們在計算準確度時,因為把敏感性的反機率納入考慮,準確度會被拉低

接續前面的例子,當 p=0.1,α=0.05,β=0.2 時,敏感性為 0.8,敏感性的反機率為 0.14,準確度 F1 只有不到 0.24!如果我們把 α 從嚴降低到 α=0.005,則 β=0.2 時,敏感性仍然為 0.8,敏感性的反機率為 0.62,準確度 F1 可以提高到 0.70。如果這樣的準確度仍然不令人放心,那只好「順時中」以三採陰性才算真陰性。如此偽陰性的機率降低到 β=0.008,敏感性增為 0.992,敏感性的反機率為 0.667,準確度 F1 可以提高到將近 0.80。

但是多重採檢也有可能出現統計檢定中所謂「多重假說檢定」 (multiple hypothesis test) 的問題。例如在 α=0.05 時,對一位實際不帶原者進行三次採檢,理論上得到至少一次偽陽性的機率是 1 – (1 – 0.05)= 0.1426,採檢越多次這個機率越大。其實,即使偽陰性降到 0、敏感性達到百分之百,敏感性的反機率仍然只有 0.67,F1 還是只有比 0.80 高一點點。

這癥結所在就不再是敏感性的問題而是特異性 (1-α) 的問題了,只有把偽陽性的機率 α 降到更小,讓特異性趨近百分之百,這樣才能解決反機率的問題,讓 F1 完全由召回率(敏感性、真陽性)來決定。

然而即使核酸檢測能做到這樣,快篩卻不一定行。根據報載,中研院基因體研究中心所發展出來的快篩試劑可以達到 95% 以上的特異性。雖然如此,如圖一所示,在 α=0.05 的水平,敏感性的反機率其實是非常值得注意的問題。

只要普檢仰賴快篩,我們便不能只以特異性及敏感性來衡量醫療檢測的準確度。

只要普檢仰賴快篩,我們便不能只以特異性及敏感性來衡量醫療檢測檢測的準確度。圖/Polina Tankilevitch@Pexels

後記:防疫中心數據核算

(2020/4/30 更新)

本文在泛科學刊出之後不久,防疫中心指揮官陳時中部長即在例行記者會上對快篩偽陽性的問題進行了詳盡的解說。陳部長的解說最珍貴的地方是他提供了防疫中心檢測工具特異性、敏感性的數值,以及專業人員對新冠病毒在台盛行率的估計。這些決定了防疫政策的參數,都是我在撰寫本文時無法確知的。

陳時中在記者會中使用的幾張投影片,正好為我的結論提出了完美的專業驗證。這裡只就兩張投影片的數據來核算。

首先,他設定了兩組參數:

  1. PCR(核酸檢測):特異性=0.9999,敏感性=0.95,盛行率=0.0018 or 0.000016。對應於我所使用的統計學參數:α=0.0001,β=0.05,π=0.0018 or 0.000016。
  2. 快篩:特異性=0.99,敏感性=0.75,盛行率=π=0.0018 or 0.000016。對應於我所使用的統計學參數:α=0.01,β=0.25,π=π=0.0018 or 0.000016。
  • 講解中提到兩種盛行率:π=0.0018 以及 π=0.000016,前者被稱為「極大值」,後者為「合理值」。

請注意:這裡快篩的特異性已經高達 0.99了,但是 PCR 的特異性可以更高到 0.9999,很趨近百分之百了,但還不到百分之百。

我文中提出的精密性公式是:

精密性=敏感性(真陽性)的反機率=Pr(受採檢者為帶原者|採檢結果陽性)= \( Precision=\frac{(1-\beta )\pi }{\alpha+ (1-\alpha -\beta )\pi } \)

依此公式來算,盛行率為極大值(π=0.0018)的情況下:

  • PCR 的精密性=0.9448
  • 快篩 的精密性=0.1191

在極大值的假設下,陳時中估計台灣有 4,800,000 因呼吸道症狀就醫的人,PCR會檢驗出 8,687 陽性患者,其中有 8,208 真正的帶原者。這結果(精密性= 0.9448)可說很不錯,但是還是會有 479 偽陽性案例。

但是如果仰賴快篩,則快篩會檢驗出 54,394 陽性患者,其中只有 6,480 真正的帶原者。這結果(精密性 0.1191)太糟糕了。

此所以我說:只有把偽陽性 α 降到更小,讓特異性趨近百分之百,這樣才能解決反機率的問題。然而即使核酸檢測能做到這樣,快篩卻不一定行。只要普檢必須仰賴快篩,敏感性的反機率仍然是值得注意的問題。

在第二張投影片,陳時中把盛行率降低到百萬分之 16(0.000016)。這是他認為比較合理的數值,反映了防疫中心的先驗信仰。在其它參數不變的條件下,π=0.000016 得到下列結果:

  • PCR的精密性=0.1319
  • 快篩的精密性=0.0012

這樣的精密性,連 PCR 都慘不忍睹。其原因是因為偽陽性的個案數目幾乎不變,而真陽性的個案數目大為減少,自然精密性也就大為減小了。這樣普篩數百萬人的後果就是會有許多偽陽性(以及偽陰性)的個案,造成許多個人、家庭、社區的困擾。


附錄:如何計算精密性——敏感性(真陽性)的反機率?

敏感性的反機率如何計算?在〈會算「貝氏定理」的人生是彩色的!該如何利用它讓判斷更準確、生活更美好呢?〉一文中,我提出一個計算貝氏機率的捷徑:從「行的條件機率」為出發點,貝氏定理所要求的反機率就是「列的條件機率」。

如果採取這個觀點,則不需要死背難記的公式就能計算反機率。這包括兩個步驟:

  1. 把「行的條件機率」乘上「行的邊際機率」就可以得到「聯合機率」。
  2. 把「聯合機率」除以「列的邊際機率」就可以得到「列的條件機率」。

這裡「行的邊際機率」就是算貝氏定理必需要先知道的「先驗機率」。至於「列的邊際機率」則把各列的聯合機率相加就可求得。

表三顯示醫事檢驗結果類型以 α、β 表示之「行的條件機率」。我們假設所有受檢者中帶原者的比例為 π ——或者說每一隨機受檢者帶原的機率為 π ——而不帶原的比例為 1 – π。

這 π 的值通常不難估計,即使無法估計也可以假設不同的數值做為討論基礎,有更多資訊時再求改進。π 與 1 – π 是「行的邊際機率」,也就是「先驗機率」。

表三、醫療檢測結果類型之「行的機率」(以α、β 表示)

受檢者
不帶原
(non-carrier)
帶原
(true-carrier)
採檢結果 陽性
(positive)
偽陽性
α
真陽性
1 – β
陰性
(negative)
真陰性
1 – α
偽陰性
β
行的邊際機率
(隨機採檢人士帶原的先驗機率)
1 – π π

有了「行的條件機率」和「先驗機率」,我們依步驟一算得 4 種類型的「聯合機率」,如表四。再依步驟二,我們很容易依次算得「列的邊際機率」及「列的條件機率」如表五。

表四、醫療檢測結果類型之「聯合機率」(以α、β 表示)

受檢者 列的邊際機率
不帶原
(non-carrier)
帶原
(true-carrier)
採檢結果 陽性
(positive)
偽陽性
α(1 – π)
真陽性
(1 – β)π
α + (1 – α – β)π
陰性
(negative)
真陰性
(1 – α)(1 – π)
偽陰性
βπ
(1 – α) + (1 – α – β)π
行的邊際機率
(隨機採檢人士帶原的先驗機率)
1 – π π 1

表五、醫療檢測結果類型之「列的條件機率」(以α、β 表示)

受檢者 列的邊際機率
不帶原
(non-carrier)
帶原
(true-carrier)
採檢結果 陽性
(positive)
偽陽性
\(\frac{\alpha (1-\pi) }{\alpha+ (1-\alpha -\beta )\pi }\)
真陽性
\(\frac{(1-\beta) \pi }{\alpha+ (1-\alpha -\beta )\pi }\)
α + (1 – α – β)π
陰性
(negative)
真陰性
\(\frac{(1-\alpha) (1-\pi) }{(1-\alpha)+ (1-\alpha -\beta )\pi }\)
偽陰性
\(\frac{\beta \pi }{(1-\alpha)+ (1-\alpha -\beta )\pi }\)
(1 – α) + (1 – α – β)π
行的邊際機率
(隨機採檢人士帶原的先驗機率)
1 – π π 1

 

所以敏感性(真陽性)的反機率是:

\( Precision=\frac{(1-\beta )\pi }{\alpha+ (1-\alpha -\beta )\pi } \)

tml_96
34 篇文章 ・ 227 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。