0

0
0

文字

分享

0
0
0

《真的假不了,假的真不了──數據造假前請考慮『機率』》————2019數感盃/高中職組專題報導類佳作

數感實驗室_96
・2019/05/25 ・2600字 ・閱讀時間約 5 分鐘 ・SR值 553 ・八年級

數感盃青少年寫作競賽」提供國中、高中職學生在培養數學素養後,一個絕佳的發揮舞台。本競賽鼓勵學生跨領域學習,運用數學知識,培養及展現邏輯思考與文字撰寫的能力,盼提升臺灣青少年科普寫作的風氣以及對數學的興趣。
本文為 2019數感盃青少年寫作競賽 / 高中職組專題報導類佳作之作品,為盡量完整呈現學生之作品樣貌,本文除首圖及標點符號、錯字之外並未進行其他大幅度編修。

  • 作者:陳宥諼、林昱佑/國立科學工業園區實驗高級中學
圖/flickr

最近在網路上看到了一則去年的新聞:一名在學術期刊等公共平台發表了高達 200 多篇論文的日本麻醉醫師──藤井善隆,被抓到長期偽造數據,並有高達 183 篇論文遭到撤稿,且數量仍持續增加。引起學界注意的投訴信中說道:「藤井的研究數據完美到難以置信。」

最早開始懷疑藤井數據造假的人之一,英國麻醉師 John Carlisle 觀察了藤井一百多批藥物實驗的數據,並計算了那些數據的隨機分佈,結果發現藤井的數據在統計分析下其實「發生機率極低」。也就是說,藤井的數據雖然看起來漂亮,但實際上卻是「不自然的」。

這使我們產生了興趣:我們所認定「正常」、「隨機」的數據,會不會只是我們主觀直覺思考時所產生的假象?然而事實上卻不符合真實機率?讓我們看一個簡單的例子:

假設老師出了一項作業,請學生每人投擲一枚公正硬幣1000次,並記下每一次的結果;但是,這項作業實在是太繁瑣了,學生們都想直接自己編數據交差了事──「反正,本來得到的結果就是『隨機』的啊!我只要在記錄表上隨便填上「正」或「反」就好了!」於是,大部分的人會編出類似這樣的數據「正反反正反正正反正反反反正……」看起來真的「很隨機」呢!

可是,收作業當天,老師卻一眼就找出了所有偷懶的同學(絕對不是因為有內鬼!)──「你們還太嫩了!實際去丟銅板要丟出這種結果,機率還真的不是一般的低啊……」老師一臉不屑的說。

「機率」?!終於有同學抓到關鍵字了。

其實,如果真的自己丟銅板的話,會發現可能出現這樣的結果:「……正反正正正正正正正正正正反正正正正……」怎麼連續這麼多的「正」啊!不過,如果反過來想,要是丟很多很多次,卻沒出現連續好幾個相同面朝上才奇怪呢!

-----廣告,請繼續往下閱讀-----

什麼意思呢?以機率的角度來看──

假設丟一個公正銅板 n 次,求至少出現 1 組連續 y 個以上正面朝上的機率。

則機率 f(n)=(令擲出結果正面朝上為「+」、背面朝上為「-」;連續y個以上「+」為串列S)

1.若 0<=n<y

-----廣告,請繼續往下閱讀-----

因為擲的次數不滿 y 次,所以就算全部擲出正面,也無法滿足條件。故,f(n) = 0

2.若 n=y

必須保證每一次都擲出正面,而每一次擲出正面的機率都是 1/2 ,所以:

f(n) = (1/2)^y

-----廣告,請繼續往下閱讀-----

3.若  y<n<(2y+1)

最多只可能出現1組S,且要擲出S只有兩種方法:

(1) 在前 n-1 次就已經擲出 S (令機率=g(n)):如果前 n-1 次已經擲出 S,不管最後一次(第n次)擲出「+」或「-」,都不會影響結果。故

g(n) = f(n-1)

-----廣告,請繼續往下閱讀-----

(2) 前 n-1 項未出現 S,擲出最後一項為「+」,和前面的「+」合併後恰形成一個S (令機率=h(n))

此即保證最後的至少 y 項皆擲出「+」(即  (i)第n-y+1項到第n項一定為「+」)。然而,若 S 的長度 >y (即第n-y, n-y-1, …項也為正),那麼在前 n-1 項時,就已經形成 S 了,機率就又回到 g(n)。所以,可以保證  (ii)此種方式的第n-y項絕對不為「+」。

另外,還須確保前n-y-1項未出現S:由於n< (2y+1),已經確定第n-y項為「-」的情況下,第1項到第n-y-1項最多只有2y(全部)-y(最後湊出的S)-1(為「-」的第n-y項)= (y-1) 項,就算全部擲出「+」也無法湊出 S (即  (iii)欲使該區間內未出現S的機率為100%)。

考慮(i)、(ii)與(iii),可求出機率為:

-----廣告,請繼續往下閱讀-----

h(n) = (1/2)^(y+1)*100%

由 (1) 和 (2) 兩種方法可得出,y< n< (2y+1)時:

f(n) = g(n)+h(n) = f(n-1)+(1/2)^(y+1)

4.若 n>= (2y+1)

-----廣告,請繼續往下閱讀-----

想要達成條件同樣有 2 種方法,且要注意可能出現 2 組以上的 S:

(1) 在前 n-1 項就已經出現 S (令機率為g(n))

同3.(1):如果在前n-1項就已經符合條件(即至少有一個S),那麼不管最後一項擲出「+」或「-」都不影響,故得:

g(n) = f(n-1)

-----廣告,請繼續往下閱讀-----

(2) 前n-1項未出現S,擲出最後一項為「+」,和前面的「+」合併後恰形成一個S (令機率=h(n))

加上最後一次(第n次)的「+」恰形成一個S,即第 (n-y+1)項到第n項都必須保證為「+」,且第n-y項為「-」,  (i)此機率為(1/2)^(y+1)。同時,還要考慮第1項到第n-y-1項中不能出現S:由於n>= (2y+1),該區間是有可能存在另一個S的,因此要避免其的機率為  (ii) 1-f(n-y-1)。

綜合與(i)與(ii),得出:

h(n) = [1-f(n-y-1)] / [2^(y+1)]

故,若n>=(2y+1),則機率等於:

f(n) = g(n)+h(n) = f(n-1)+ [1-f(n-y-1)] / [2^(y+1)]

所以,由上述討論,可推出其遞迴關係式為:

回到銅板問題:若取 y=10,以程式執行計算後——當擲銅板次數 n=1421 時,

f(1421)=7, 255, 778, 711, 927, 407, 617, 380, 544, 769, 173, 867, 806, 169, 361, 486, 522, 866, 802, 980, 651, 539, 660, 838, 223, 377, 066, 752, 145, 420, 755, 231, 929, 187, 093, 761, 722, 303, 645, 267, 912, 580, 455, 689, 572, 071, 800, 452, 693, 464, 700, 240, 325, 620, 941, 411, 943, 308, 843, 940, 722, 468, 017, 918, 536, 598, 081, 098, 266, 744, 747, 888, 440, 887, 321, 884, 634, 359, 498, 815, 523, 739, 396, 906, 549, 246, 415, 109, 283, 793, 846, 209, 720, 465, 402, 081, 202, 745, 609, 492, 452, 509, 025, 795, 069, 716, 361, 505, 310, 397, 746, 161, 836, 302, 227, 941, 580, 885, 870, 210, 044, 773, 666, 072, 022, 038, 700, 421, 605, 273, 419, 973, 038, 879, 144, 857, 154, 157, 912, 879, 478, 392, 261  14, 5 06, 540, 244, 799, 649, 295, 363, 967, 385, 272, 259, 250, 661, 462, 164, 996, 145, 242, 670, 971, 396, 368, 427, 928, 550, 752, 333, 318, 302, 269, 391, 954, 931, 996, 110, 373, 344, 247, 437, 783, 405, 976, 812, 508, 208, 014, 387, 645, 084, 573, 461, 084, 331, 611, 962, 071, 030, 245, 089, 177, 219, 397, 347, 545, 783, 897, 084, 779, 561, 785, 928, 834, 057, 620, 352, 012, 602, 971, 900, 896, 382, 103, 058, 767, 619, 551, 583, 898, 875, 428, 087, 721, 830, 150, 897, 600, 890, 899, 165, 970, 697, 060, 836, 381, 274, 022, 825, 694, 219, 432, 474, 834, 063, 680, 015, 967, 772, 773, 093, 077, 100, 779, 252, 371, 658, 190, 278, 159, 625, 450, 473, 401, 620, 223, 010, 779, 161, 044, 426, 883, 596, 288

(這是一個分數,並且是精確數字,由此可見計算的繁雜度!)

總之,f(1421)≒0.5001729281748267≒50%。也就是說,當擲 1421 次銅板時,出現至少一組連續 10 個以上正面的機率就已經略超過 1/2。另外,當擲 3288 次時,機率會再近一步提升至 80%;甚至擲 9391 次,機率已經達到 99%。換句話說,假設擲 1 萬次,幾乎可以保證一定會看到至少一組連續 10 個以上的正面。

然而,一般人在編造數據時,很少會連續寫下很多個正面(或反面),因為直覺上要連續擲出那麼多次相同的結果機率應該很低。正是利用這點,所以,光憑「是否出現連續多次相同結果」這個事件,就足以初步判斷數據的真實性,更遑論除此之外,還有更多事件的真實發生機率也有待計算。想要得出符合真實機率的「完美」數據,與其絞盡腦汁、分析各種事件的機率(而且不太可能分析的完),倒不如穩扎穩打的完成,或許還快些。

再者,在學校偽造作業數據頂多受到老師的批評或輕微的懲罰;但出社會後,要面對的可能是正式的論文、一份財報、甚至是一份關乎人命的實驗報告!造假的後果除了損失聲譽、失去工作,更有可能因此遭受牢獄之災。與其耗費大量精力試圖求出「毫無破綻」的造假方法,卻還要冒著被拆穿的風險苟且偷生,還不如腳踏實地,安分地完成任務,才是正道!

更多2019數感盃青少年寫作競賽內容,歡迎參考 2019數感盃特輯、數感實驗室官網粉絲頁喔。

-----廣告,請繼續往下閱讀-----
文章難易度
數感實驗室_96
76 篇文章 ・ 55 位粉絲
數感實驗室的宗旨是讓社會大眾「看見數學」。 數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁,迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章,內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。 詳見網站:http://numeracy.club/ 粉絲專頁:https://www.facebook.com/pg/numeracylab/

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
賭博與愛情公式:用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/06 ・2486字 ・閱讀時間約 5 分鐘

理解期望值,有助於分析賭場裡的大部分賭局,以及美國中西部和英國的嘉年華會中,常有人玩、但一般人比較不熟悉的賭法:骰子擲好運(chuck-a-luck)。

招攬人來玩「骰子擲好運」的說詞極具說服力:你從 1 到 6 挑一個號碼,莊家一次擲三顆骰子,如果三個骰子都擲出你挑的號碼,莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼,莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼,莊家付你 1 美元。如果你挑的號碼一個也沒有出現,那你要付莊家 1 美元。賽局用三個不同的骰子,你有三次機會贏,而且,有時候你還不只贏 1 美元,最多也不過輸 1 美元。

我們可以套用名主持人瓊安.李維絲(Joan Rivers)的名言(按:她的名言是:「我們能聊一聊嗎?」),問一句:「我們能算一算嗎?」(如果你寧願不算,可以跳過這一節。)不管你選哪個號碼,贏的機率顯然都一樣。不過,為了讓計算更明確易懂,假設你永遠都選 4。骰子是獨立的,三個骰子都出現 4 點的機率是 1/6×1/6×1/6=1/216,你約有 1/216 的機率會贏得 3 美元。

-----廣告,請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率,會難算一點。但你可以使用第 1 章提到的二項機率分布,我會在這裡再導一遍。三個骰子中出現兩個 4,有三種彼此互斥的情況:X44、4X4 或 44X,其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6=5/216,第二種和第三種的結果也是這樣。三者相加,可得出三個骰子裡出現兩個 4 點的機率為 15/216,你有這樣的機率會贏得 2 美元。

圖/envato

同樣的,要算出三個骰子裡只出現一個 4 點的機率,也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6=25/216,得到 X4X 和 XX4 的機率亦同,三者相加,得出 75/216。這是三個骰子裡僅出現一個 4 點的機率,因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率,我們只要算出剩下的機率是多少即可。算法是用 1(或是100%)減去(1/216 +15/216 + 75/216),得出的答案是 125/216。所以,平均而言,你每玩 216 次骰子擲好運,就有 125 次要輸 1 美元。

這樣一來,就可以算出你贏的期望值($3×1/216)+($2×15/216)+($1×75/216)+(–$1×125/216)=$(–17/216)=–$0.08。平均來說,你每玩一次這個看起來很有吸引力的賭局,大概就要輸掉 8 美分。

-----廣告,請繼續往下閱讀-----

尋找愛情,有公式?

面對愛情,有人從感性出發,有人以理性去愛。兩種單獨運作時顯然效果都不太好,但加起來⋯⋯也不是很妙。不過,如果善用兩者,成功的機率可能還是大一些。回想舊愛,憑感性去愛的人很可能悲嘆錯失的良緣,並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人,很可能會對以下的機率結果感興趣。

在我們的模型中,假設女主角——就叫她香桃吧(按:在希臘神話中,香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物,象徵愛與美)有理由相信,在她的「約會生涯」中,會遇到 N 個可能成為配偶的人。對某些女性來說,N 可能等於 2;對另一些人來說,N 也許是 200。香桃思考的問題是:到了什麼時候我就應該接受X先生,不管在他之後可能有某些追求者比他「更好」?我們也假設她是一次遇見一個人,有能力判斷她遇到的人是否適合她,以及,一旦她拒絕了某個人之後,此人就永遠出局。

為了便於說明,假設香桃到目前為止已經見過 6 位男士,她對這些人的排序如下:3—5—1—6—2—4。這是指,在她約過會的這 6 人中,她對見到的第一人的喜歡程度排第 3 名,對第二人的喜歡程度排第 5 名,最喜歡第三個人,以此類推。如果她見了第七個人,她對此人的喜歡程度超過其他人,但第三人仍穩居寶座,那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人,她就更新追求者的相對排序。她在想,到底要用什麼樣的規則擇偶,才能讓她最有機會從預估的 N 位追求者中,選出最好的。

圖/envato

要得出最好的策略,要善用條件機率(我們會在下一章介紹條件機率)和一點微積分,但策略本身講起來很簡單。如果有某個人比過去的對象都好,且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面,她大概需要拒絕前面的 37%,之後真命天子出現時(如果有的話),就接受。

-----廣告,請繼續往下閱讀-----

舉例來說,假設香桃不是太有魅力,她很可能只會遇見 4 個合格的追求者。我們進一步假設,這 4 個人與她相見的順序,是 24 種可能性中的任何一種(24=4×3×2×1)。

由於 N=4,37% 策略在這個例子中不夠清楚(無法對應到整數),而 37% 介於 25% 與 50% 之間,因此有兩套對應的最佳策略如下:

(A)拒絕第一個對象(4×25%=1),接受後來最佳的對象。

(B)拒絕前兩名追求者(4×50%=2),接受後來最好的求愛者。

如果採取A策略,香桃會在 24 種可能性中的 11 種,選到最好的追求者。採取 B 策略的話,會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列,如同前述,1 代表香桃最偏好的追求者,2 代表她的次佳選擇,以此類推。因此,3—2—1—4 代表她先遇見第三選擇,再來遇見第二選擇,第三次遇到最佳選擇,最後則遇到下下之選。序列後面標示的 A 或 B,代表在這些情況下,採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告,請繼續往下閱讀-----

1234;1243;1324;1342;1423;1432;2134(A);2143(A);2314(A, B);2341(A, B);2413(A, B);2431(A, B);3124(A);3142(A);3214(B);3241(B);3412(A, B);3421;4123(A);4132(A);4213(B);4231(B);4312(B);4321

如果香桃很有魅力,預期可以遇見 25 位追求者,那她的策略是要拒絕前 9 位追求者(25 的 37% 約為 9),接受之後出現的最好對象。我們也可以用類似的表來驗證,但是這個表會變得很龐雜,因此,最好的策略就是接受通用證明。(不用多說,如果要找伴的人是男士而非女士,同樣的分析也成立。)如果 N 的數值很大,那麼,香桃遵循這套 37% 法則擇偶的成功率也約略是 37%。接下來的部分就比較難了:要如何和真命天子相伴相守。話說回來,這個 37% 法則數學模型也衍生出許多版本,其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。

0

10
2

文字

分享

0
10
2
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

-----廣告,請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

-----廣告,請繼續往下閱讀-----
Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 68 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。