0

文字

繁 | 简

0

數學妙用科學傳播透視科學

《真的假不了，假的真不了──數據造假前請考慮『機率』》————2019數感盃／高中職組專題報導類佳作

數感實驗室・2019/05/25 ・2600字・閱讀時間約 5 分鐘・SR值 553

・八年級

相關標籤：

熱門標籤：

「數感盃青少年寫作競賽」提供國中、高中職學生在培養數學素養後，一個絕佳的發揮舞台。本競賽鼓勵學生跨領域學習，運用數學知識，培養及展現邏輯思考與文字撰寫的能力，盼提升臺灣青少年科普寫作的風氣以及對數學的興趣。
本文為 2019數感盃青少年寫作競賽 / 高中職組專題報導類佳作之作品，為盡量完整呈現學生之作品樣貌，本文除首圖及標點符號、錯字之外並未進行其他大幅度編修。

作者：陳宥諼、林昱佑／國立科學工業園區實驗高級中學

最近在網路上看到了一則去年的新聞：一名在學術期刊等公共平台發表了高達 200 多篇論文的日本麻醉醫師──藤井善隆，被抓到長期偽造數據，並有高達 183 篇論文遭到撤稿，且數量仍持續增加。引起學界注意的投訴信中說道：「藤井的研究數據完美到難以置信。」

最早開始懷疑藤井數據造假的人之一，英國麻醉師 John Carlisle 觀察了藤井一百多批藥物實驗的數據，並計算了那些數據的隨機分佈，結果發現藤井的數據在統計分析下其實「發生機率極低」。也就是說，藤井的數據雖然看起來漂亮，但實際上卻是「不自然的」。

這使我們產生了興趣：我們所認定「正常」、「隨機」的數據，會不會只是我們主觀直覺思考時所產生的假象？然而事實上卻不符合真實機率？讓我們看一個簡單的例子：

假設老師出了一項作業，請學生每人投擲一枚公正硬幣1000次，並記下每一次的結果；但是，這項作業實在是太繁瑣了，學生們都想直接自己編數據交差了事──「反正，本來得到的結果就是『隨機』的啊！我只要在記錄表上隨便填上「正」或「反」就好了！」於是，大部分的人會編出類似這樣的數據「正反反正反正正反正反反反正……」看起來真的「很隨機」呢！

可是，收作業當天，老師卻一眼就找出了所有偷懶的同學（絕對不是因為有內鬼！）──「你們還太嫩了！實際去丟銅板要丟出這種結果，機率還真的不是一般的低啊……」老師一臉不屑的說。

「機率」？！終於有同學抓到關鍵字了。

其實，如果真的自己丟銅板的話，會發現可能出現這樣的結果：「……正反正正正正正正正正正正反正正正正……」怎麼連續這麼多的「正」啊！不過，如果反過來想，要是丟很多很多次，卻沒出現連續好幾個相同面朝上才奇怪呢！

-----廣告，請繼續往下閱讀-----

什麼意思呢？以機率的角度來看──

假設丟一個公正銅板 n 次，求至少出現 1 組連續 y 個以上正面朝上的機率。

則機率 f(n)=（令擲出結果正面朝上為「＋」、背面朝上為「－」；連續y個以上「＋」為串列S）

1.若 0<=n<y

-----廣告，請繼續往下閱讀-----

因為擲的次數不滿 y 次，所以就算全部擲出正面，也無法滿足條件。故，f(n) = 0

2.若 n=y

必須保證每一次都擲出正面，而每一次擲出正面的機率都是 1/2 ，所以：

f(n) = (1/2)^y

-----廣告，請繼續往下閱讀-----

3.若 y<n<(2y+1)

最多只可能出現1組S，且要擲出S只有兩種方法：

(1) 在前 n-1 次就已經擲出 S (令機率=g(n))：如果前 n-1 次已經擲出 S，不管最後一次(第n次)擲出「＋」或「－」，都不會影響結果。故

g(n) = f(n-1)

-----廣告，請繼續往下閱讀-----

(2) 前 n-1 項未出現 S，擲出最後一項為「＋」，和前面的「＋」合併後恰形成一個S (令機率=h(n))

此即保證最後的至少 y 項皆擲出「＋」(即 (i)第n-y+1項到第n項一定為「＋」)。然而，若 S 的長度 >y (即第n-y, n-y-1, …項也為正)，那麼在前 n-1 項時，就已經形成 S 了，機率就又回到 g(n)。所以，可以保證 (ii)此種方式的第n-y項絕對不為「+」。

另外，還須確保前n-y-1項未出現S：由於n< (2y+1)，已經確定第n-y項為「－」的情況下，第1項到第n-y-1項最多只有2y(全部)-y(最後湊出的S)-1(為「－」的第n-y項)= (y-1) 項，就算全部擲出「＋」也無法湊出 S (即 (iii)欲使該區間內未出現S的機率為100%)。

考慮(i)、(ii)與(iii)，可求出機率為：

-----廣告，請繼續往下閱讀-----

h(n) = (1/2)^(y+1)*100%

由 (1) 和 (2) 兩種方法可得出，y< n< (2y+1)時：

f(n) = g(n)+h(n) = f(n-1)+(1/2)^(y+1)

4.若 n>= (2y+1)

-----廣告，請繼續往下閱讀-----

想要達成條件同樣有 2 種方法，且要注意可能出現 2 組以上的 S：

(1) 在前 n-1 項就已經出現 S (令機率為g(n))

同3.(1)：如果在前n-1項就已經符合條件(即至少有一個S)，那麼不管最後一項擲出「＋」或「－」都不影響，故得：

g(n) = f(n-1)

-----廣告，請繼續往下閱讀-----

(2) 前n-1項未出現S，擲出最後一項為「＋」，和前面的「＋」合併後恰形成一個S (令機率=h(n))

加上最後一次(第n次)的「＋」恰形成一個S，即第 (n-y+1)項到第n項都必須保證為「＋」，且第n-y項為「－」， (i)此機率為(1/2)^(y+1)。同時，還要考慮第1項到第n-y-1項中不能出現S：由於n>= (2y+1)，該區間是有可能存在另一個S的，因此要避免其的機率為 (ii) 1-f(n-y-1)。

綜合與(i)與(ii)，得出：

h(n) = [1-f(n-y-1)] / [2^(y+1)]

故，若n>=(2y+1)，則機率等於：

f(n) = g(n)+h(n) = f(n-1)+ [1-f(n-y-1)] / [2^(y+1)]

所以，由上述討論，可推出其遞迴關係式為：

回到銅板問題：若取 y=10，以程式執行計算後——當擲銅板次數 n=1421 時，

f(1421)=7, 255, 778, 711, 927, 407, 617, 380, 544, 769, 173, 867, 806, 169, 361, 486, 522, 866, 802, 980, 651, 539, 660, 838, 223, 377, 066, 752, 145, 420, 755, 231, 929, 187, 093, 761, 722, 303, 645, 267, 912, 580, 455, 689, 572, 071, 800, 452, 693, 464, 700, 240, 325, 620, 941, 411, 943, 308, 843, 940, 722, 468, 017, 918, 536, 598, 081, 098, 266, 744, 747, 888, 440, 887, 321, 884, 634, 359, 498, 815, 523, 739, 396, 906, 549, 246, 415, 109, 283, 793, 846, 209, 720, 465, 402, 081, 202, 745, 609, 492, 452, 509, 025, 795, 069, 716, 361, 505, 310, 397, 746, 161, 836, 302, 227, 941, 580, 885, 870, 210, 044, 773, 666, 072, 022, 038, 700, 421, 605, 273, 419, 973, 038, 879, 144, 857, 154, 157, 912, 879, 478, 392, 261 / 14, 5 06, 540, 244, 799, 649, 295, 363, 967, 385, 272, 259, 250, 661, 462, 164, 996, 145, 242, 670, 971, 396, 368, 427, 928, 550, 752, 333, 318, 302, 269, 391, 954, 931, 996, 110, 373, 344, 247, 437, 783, 405, 976, 812, 508, 208, 014, 387, 645, 084, 573, 461, 084, 331, 611, 962, 071, 030, 245, 089, 177, 219, 397, 347, 545, 783, 897, 084, 779, 561, 785, 928, 834, 057, 620, 352, 012, 602, 971, 900, 896, 382, 103, 058, 767, 619, 551, 583, 898, 875, 428, 087, 721, 830, 150, 897, 600, 890, 899, 165, 970, 697, 060, 836, 381, 274, 022, 825, 694, 219, 432, 474, 834, 063, 680, 015, 967, 772, 773, 093, 077, 100, 779, 252, 371, 658, 190, 278, 159, 625, 450, 473, 401, 620, 223, 010, 779, 161, 044, 426, 883, 596, 288

（這是一個分數，並且是精確數字，由此可見計算的繁雜度！）

總之，f(1421)≒0.5001729281748267≒50%。也就是說，當擲 1421 次銅板時，出現至少一組連續 10 個以上正面的機率就已經略超過 1/2。另外，當擲 3288 次時，機率會再近一步提升至 80%；甚至擲 9391 次，機率已經達到 99%。換句話說，假設擲 1 萬次，幾乎可以保證一定會看到至少一組連續 10 個以上的正面。

然而，一般人在編造數據時，很少會連續寫下很多個正面（或反面），因為直覺上要連續擲出那麼多次相同的結果機率應該很低。正是利用這點，所以，光憑「是否出現連續多次相同結果」這個事件，就足以初步判斷數據的真實性，更遑論除此之外，還有更多事件的真實發生機率也有待計算。想要得出符合真實機率的「完美」數據，與其絞盡腦汁、分析各種事件的機率（而且不太可能分析的完），倒不如穩扎穩打的完成，或許還快些。

再者，在學校偽造作業數據頂多受到老師的批評或輕微的懲罰；但出社會後，要面對的可能是正式的論文、一份財報、甚至是一份關乎人命的實驗報告！造假的後果除了損失聲譽、失去工作，更有可能因此遭受牢獄之災。與其耗費大量精力試圖求出「毫無破綻」的造假方法，卻還要冒著被拆穿的風險苟且偷生，還不如腳踏實地，安分地完成任務，才是正道！

更多2019數感盃青少年寫作競賽內容，歡迎參考 2019數感盃特輯、數感實驗室官網及粉絲頁喔。

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

數感實驗室

76 篇文章・ 55 位粉絲

數感實驗室的宗旨是讓社會大眾「看見數學」。數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁，迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章，內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。詳見網站：http://numeracy.club/ 粉絲專頁：https://www.facebook.com/pg/numeracylab/

TRENDING 熱門討論

即時熱門

1

文字

0

1

停工即停薪：如何證明你的時間值多少？車禍背後的認知 x 情緒 x 金錢 x 法律大混戰

鳥苷三磷酸 (PanSci Promo) ・2026/01/09 ・3351字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文與 PAMO車禍線上律師合作，泛科學企劃執行

走在台灣的街頭，你是否發現馬路變得越來越「急躁」？滿街穿梭的外送員、分秒必爭的多元計程車，為了拚單量與獎金，每個人都在跟時間賽跑。與此同時，拜經濟發展所賜，路上的豪車也變多了。

這場關於速度與金錢的博弈，讓車禍不再只是一場意外，更是一場複雜的經濟算計。PAMO 車禍線上律師施尚宏律師在接受《思想實驗室 video podcast》訪談時指出，我們正處於一個交通生態的轉折點，當「把車當生財工具」的職業駕駛，撞上了「將車視為珍貴資產」的豪車車主，傳統的理賠邏輯往往會失靈。

在「停工即停薪」（有跑才有錢，沒跑就沒收入）的零工經濟時代，如果運氣不好遇上車禍，我們該如何證明自己的時間價值？又該如何在保險無法覆蓋的灰色地帶中全身而退？

-----廣告，請繼續往下閱讀-----

如果運氣不好遇上車禍，我們該如何證明自己的時間價值？/ 圖片來源: Nano Banana

薪資證明的難題：零工經濟者的「隱形損失」

過去處理車禍理賠，邏輯相對單純：拿出公司的薪資單或扣繳憑單，計算這幾個月的平均薪資，就能算出因傷停工的「薪資損失」。

但在零工經濟時代，這套邏輯卡關了！施尚宏律師指出，許多外送員、自由接案者或是工地打工者，他們的收入往往是領現金，或者分散在多個不同的 App 平台中。更麻煩的是，零工經濟的特性是「高度變動」，上個月可能拚了 7 萬，這個月休息可能只有 0 元，導致「平均收入」難以定義。

這時候，律師的角色就不只是法條的背誦者，更像是一名「翻譯」。

施律師解釋「PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』，轉譯成法官或保險公司聽得懂的法律語言。」這包括將不同平台（如 Uber、台灣大車隊）的流水帳整合，或是找出過往的接單紀錄來證明當事人的「勞動能力」。即使當下沒有收入（例如學生開學期間），只要能證明過往的接單能力與紀錄，在談判桌上就有籌碼要求合理的「勞動力減損賠償」。

-----廣告，請繼續往下閱讀-----

PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』，轉譯成法官或保險公司聽得懂的法律語言 / 圖片來源: Nano Banana

300 萬張罰單背後的僥倖：你的直覺，正在害死你

根據警政署統計，台灣交通違規的第一名常年是「違規停車」，一年可以開出約 300 萬張罰單。這龐大的數字背後，藏著兩個台灣駕駛人最容易誤判的「直覺陷阱」。

陷阱 A：我在紅線違停，人還在車上，沒撞到也要負責？ 許多人認為：「我人就在車上，車子也沒動，甚至是熄火狀態。結果一台機車為了閃避我，自己操作不當摔倒了，這關我什麼事？」

施律師警告，這是一個致命的陷阱。「人在車上」或「車子沒動」在法律上並不是免死金牌。法律看重的是「因果關係」。只要你的違停行為阻礙了視線或壓縮了車道，導致後方車輛必須閃避而發生事故，你就可能必須背負民事賠償責任，甚至揹上「過失傷害」的刑責。

數據會說話：台灣每年約有 700 件車禍是直接因違規停車導致的。這 300 萬張罰單背後的僥倖心態，其巨大的代價可能是人命。

-----廣告，請繼續往下閱讀-----

陷阱 B：變換車道沒擦撞，對方自己嚇到摔車也算我的？ 另一個常年霸榜的肇事原因是「變換車道不當」。如果你切換車道時，後方騎士因為嚇到而摔車，但你感覺車身「沒震動、沒碰撞」，能不能直接開走？

答案是：絕對不行。

施律師強調，車禍不以「碰撞」為前提。只要你的駕駛行為與對方的事故有因果關係，你若直接離開現場，在法律上就構成了「肇事逃逸」。這是一條公訴罪，後果遠比你想像的嚴重。正確的做法永遠是：停下來報警，釐清責任，並保留行車記錄器自保。

正確的做法永遠是：停下來報警，釐清責任，並保留行車記錄器自保。/ 圖片來源: Nano Banana

保險不夠賠？豪車時代的「超額算計」

另一個現代駕駛的惡夢，是撞到豪車。這不僅是因為修車費貴，更因為衍生出的「代步費用」驚人。

-----廣告，請繼續往下閱讀-----

施律師舉例，過去撞到車，只要把車修好就沒事。但現在如果撞到一台 BMW 320，車主可能會主張修車的 8 天期間，他需要租一台同等級的 BMW 320 來代步。以一天租金 4000 元計算，光是代步費就多了 3 萬多塊。這時候，一般人會發現「全險」竟然不夠用。為什麼？

因為保險公司承擔的是「合理的賠償責任」，他們有內部的數據庫，只願意賠償一般行情的修車費或代步費。但對方車主可能不這麼想，為了拿到這筆額外的錢，對方可能會採取「以刑逼民」的策略：提告過失傷害，利用刑事訴訟的壓力（背上前科的恐懼），迫使你自掏腰包補足保險公司不願賠償的差額。

這就是為什麼在全險之外，駕駛人仍需要懂得談判策略，或考慮尋求律師協助，在保險公司與對方的漫天喊價之間，找到一個停損點。

談判桌的最佳姿態：「溫柔而堅定」最有效？

除了有單據的財損，車禍中最難談判的往往是「精神慰撫金」。施律師直言，這在法律上沒有公式，甚至有點像「開獎」，高度依賴法官的自由心證。

-----廣告，請繼續往下閱讀-----

雖然保險公司內部有一套簡單的算法（例如醫療費用的 2 到 5 倍），但到了法院，法官會考量雙方的社會地位、傷勢嚴重程度。在缺乏標準公式的情況下，正確的「態度」能幫您起到加分效果。

施律師建議，在談判桌上最好的姿態是「溫柔而堅定」。有些人會試圖「扮窮」或「裝兇」，這通常會有反效果。特別是面對看過無數案件的保險理賠員，裝兇只會讓對方心裡想著：「進了法院我保證你一毛都拿不到，準備看你笑話」。

相反地，如果你能客氣地溝通，但手中握有完整的接單紀錄、醫療單據，清楚知道自己的底線與權益，這種「堅定」反而能讓談判對手買單，甚至在證明不足的情況下（如外送員的開學期間收入），更願意採信你的主張。

車禍不只是一場意外，它是認知、情緒、金錢與法律邏輯的總和。

在這個交通環境日益複雜的時代，無論你是為了生計奔波的職業駕駛，還是天天上路的通勤族，光靠保險或許已經不夠。大部分的車禍其實都是小案子，可能只是賠償 2000 元的輕微擦撞，或是責任不明的糾紛。為了這點錢，要花幾萬塊請律師打官司絕對「不划算」。但當事人往往會因為資訊落差，恐懼於「會不會被告肇逃？」、「會不會留案底？」、「賠償多少才合理？」而整夜睡不著覺。

-----廣告，請繼續往下閱讀-----

PAMO看準了這個「焦慮商機」，推出了一種顛覆傳統的解決方案——「年費 1200 元的訂閱制法律服務 」。

這就像是「法律界的 Netflix」或「汽車強制險」的概念。PAMO 的核心邏輯不是「代打」，而是「賦能」。不同於傳統律師收費高昂，PAMO 提倡的是「大腦武裝」，當車禍發生時，線上律師團提供策略，教你怎麼做筆錄、怎麼蒐證、怎麼判斷對方開價合不合理等。

施律師表示，他們的目標是讓客戶在面對不確定的風險時，背後有個軍師，能安心地睡個好覺。平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略。

平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略。 / 圖片來源: Nano Banana

從違停的陷阱到訂閱制的解方，我們正處於交通與法律的轉型期。未來，挑戰將更加嚴峻。

-----廣告，請繼續往下閱讀-----

當 AI 與自駕車（Level 4/5）真正上路，一旦發生事故，責任主體將從「駕駛人」轉向「車廠」或「演算法系統」。屆時，誰該負責？怎麼舉證？

但在那天來臨之前，面對馬路上的豪車、零工騎士與法律陷阱，你選擇相信運氣，還是相信策略？ 先「武裝好自己的大腦」，或許才是現代駕駛人最明智的保險。

PAMO車禍線上律師官網：https://pse.is/8juv6k

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

243 篇文章・ 319 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

1

0

文字

0

1

0

賭博與愛情公式：用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》

大牌出版．出版大牌・2024/01/06 ・2486字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

理解期望值，有助於分析賭場裡的大部分賭局，以及美國中西部和英國的嘉年華會中，常有人玩、但一般人比較不熟悉的賭法：骰子擲好運（chuck-a-luck）。

招攬人來玩「骰子擲好運」的說詞極具說服力：你從 1 到 6 挑一個號碼，莊家一次擲三顆骰子，如果三個骰子都擲出你挑的號碼，莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼，莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼，莊家付你 1 美元。如果你挑的號碼一個也沒有出現，那你要付莊家 1 美元。賽局用三個不同的骰子，你有三次機會贏，而且，有時候你還不只贏 1 美元，最多也不過輸 1 美元。

我們可以套用名主持人瓊安．李維絲（Joan Rivers）的名言（按：她的名言是：「我們能聊一聊嗎？」），問一句：「我們能算一算嗎？」（如果你寧願不算，可以跳過這一節。）不管你選哪個號碼，贏的機率顯然都一樣。不過，為了讓計算更明確易懂，假設你永遠都選 4。骰子是獨立的，三個骰子都出現 4 點的機率是 1/6×1/6×1/6＝1/216，你約有 1/216 的機率會贏得 3 美元。

-----廣告，請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率，會難算一點。但你可以使用第 1 章提到的二項機率分布，我會在這裡再導一遍。三個骰子中出現兩個 4，有三種彼此互斥的情況：X44、4X4 或 44X，其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6＝5/216，第二種和第三種的結果也是這樣。三者相加，可得出三個骰子裡出現兩個 4 點的機率為 15/216，你有這樣的機率會贏得 2 美元。

同樣的，要算出三個骰子裡只出現一個 4 點的機率，也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6＝25/216，得到 X4X 和 XX4 的機率亦同，三者相加，得出 75/216。這是三個骰子裡僅出現一個 4 點的機率，因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率，我們只要算出剩下的機率是多少即可。算法是用 1（或是100％）減去（1/216 +15/216 + 75/216），得出的答案是 125/216。所以，平均而言，你每玩 216 次骰子擲好運，就有 125 次要輸 1 美元。

這樣一來，就可以算出你贏的期望值（$3×1/216）+（$2×15/216）+（$1×75/216）+（–$1×125/216）＝$（–17/216）＝–$0.08。平均來說，你每玩一次這個看起來很有吸引力的賭局，大概就要輸掉 8 美分。

-----廣告，請繼續往下閱讀-----

尋找愛情，有公式？

面對愛情，有人從感性出發，有人以理性去愛。兩種單獨運作時顯然效果都不太好，但加起來⋯⋯也不是很妙。不過，如果善用兩者，成功的機率可能還是大一些。回想舊愛，憑感性去愛的人很可能悲嘆錯失的良緣，並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人，很可能會對以下的機率結果感興趣。

在我們的模型中，假設女主角——就叫她香桃吧（按：在希臘神話中，香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物，象徵愛與美）有理由相信，在她的「約會生涯」中，會遇到 N 個可能成為配偶的人。對某些女性來說，N 可能等於 2；對另一些人來說，N 也許是 200。香桃思考的問題是：到了什麼時候我就應該接受X先生，不管在他之後可能有某些追求者比他「更好」？我們也假設她是一次遇見一個人，有能力判斷她遇到的人是否適合她，以及，一旦她拒絕了某個人之後，此人就永遠出局。

為了便於說明，假設香桃到目前為止已經見過 6 位男士，她對這些人的排序如下：3—5—1—6—2—4。這是指，在她約過會的這 6 人中，她對見到的第一人的喜歡程度排第 3 名，對第二人的喜歡程度排第 5 名，最喜歡第三個人，以此類推。如果她見了第七個人，她對此人的喜歡程度超過其他人，但第三人仍穩居寶座，那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人，她就更新追求者的相對排序。她在想，到底要用什麼樣的規則擇偶，才能讓她最有機會從預估的 N 位追求者中，選出最好的。

要得出最好的策略，要善用條件機率（我們會在下一章介紹條件機率）和一點微積分，但策略本身講起來很簡單。如果有某個人比過去的對象都好，且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面，她大概需要拒絕前面的 37％，之後真命天子出現時（如果有的話），就接受。

-----廣告，請繼續往下閱讀-----

舉例來說，假設香桃不是太有魅力，她很可能只會遇見 4 個合格的追求者。我們進一步假設，這 4 個人與她相見的順序，是 24 種可能性中的任何一種（24＝4×3×2×1）。

由於 N＝4，37％策略在這個例子中不夠清楚（無法對應到整數），而 37％介於 25％與 50％之間，因此有兩套對應的最佳策略如下：

（A）拒絕第一個對象（4×25％＝1），接受後來最佳的對象。

（B）拒絕前兩名追求者（4×50％＝2），接受後來最好的求愛者。

如果採取A策略，香桃會在 24 種可能性中的 11 種，選到最好的追求者。採取 B 策略的話，會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列，如同前述，1 代表香桃最偏好的追求者，2 代表她的次佳選擇，以此類推。因此，3—2—1—4 代表她先遇見第三選擇，再來遇見第二選擇，第三次遇到最佳選擇，最後則遇到下下之選。序列後面標示的 A 或 B，代表在這些情況下，採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告，請繼續往下閱讀-----

1234；1243；1324；1342；1423；1432；2134（A）；2143（A）；2314（A, B）；2341（A, B）；2413（A, B）；2431（A, B）；3124（A）；3142（A）；3214（B）；3241（B）；3412（A, B）；3421；4123（A）；4132（A）；4213（B）；4231（B）；4312（B）；4321

如果香桃很有魅力，預期可以遇見 25 位追求者，那她的策略是要拒絕前 9 位追求者（25 的 37％約為 9），接受之後出現的最好對象。我們也可以用類似的表來驗證，但是這個表會變得很龐雜，因此，最好的策略就是接受通用證明。（不用多說，如果要找伴的人是男士而非女士，同樣的分析也成立。）如果 N 的數值很大，那麼，香桃遵循這套 37％法則擇偶的成功率也約略是 37％。接下來的部分就比較難了：要如何和真命天子相伴相守。話說回來，這個 37% 法則數學模型也衍生出許多版本，其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》，2023 年 11 月，大牌出版，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

大牌出版．出版大牌

3 篇文章・ 0 位粉絲

閱讀的大牌不侷限於單一領域，視野寬廣，知識豐富，思考獨立。

TRENDING 熱門討論

即時熱門

10

2

文字

0

10

2

鑑識故事系列：Lucia de Berk 值班死幾人？荷蘭護理冤案

胡中行・2023/02/27 ・2983字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

前言：本文為鑑識系列中，罕見提及統計學的故事。不過，繁複的計算過程全部省略，僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖／Carole Edrich on Wikimedia Commons（CC BY-SA 3.0）

荷蘭護理人員 Lucia de Berk，長年於海牙茱莉安娜兒童醫院（Juliana Kinderziekenhuis）的 1 個病房，與紅十字醫院（Rode Kruis Ziekenhuis）的 2 個病房工作。2001 年 12 月，她因謀殺罪嫌被捕。^[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因，發現是中毒身亡；後來連帶調查 1997 至 2001 年間，幾家醫院可能的謀殺案件，於是找上了她。^[2]在法庭上，司法心理學家 Henk Elffers 用機率的概念，證明 Lucia de Berk 有罪。簡單來說，就是計算嫌犯現身出事班次的機率。他採取的統計方法，叫做超幾何分佈（又稱「超幾何分配」；hypergeometric distribution）。^[1]

超幾何分佈適合用在從一個母數中，隨機抽取樣本，不再放回的情形。例如：袋子裝有 N 顆球，其中 L 顆為紅球。一把抓出 n 顆球，不特別挑選的話，紅球碰巧被抓到的機率為 X。^{[3, 4]}以此類推，在此案被調查的時間範圍內，病房總共有 N 個班次，其中 Lucia de Berk 值了 L 班，而有醫療事故的班次共 n 個。如果不刻意安排，則她正好出現在事故班次的機率為 X。^[1]（公式介紹。^[4]）

此處實際帶入數據後得到的答案，說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一（X = 1 / 3.42 x 10⁸）的機率，會剛好在醫療事故發生的班次值班。因此，法庭認定她的頻繁出現（> 1 / 3.42 x 10⁸），絕非巧合。^{[1, 2, 5, 6]}2003 年，Lucia de Berk因 7 起謀殺和 3 次殺人未遂，^[2]被判終身監禁。^[5]

茱利安納兒童醫院（Juliana Kinderziekenhuis）外觀。圖／Joris on Wikimedia Commons（CC BY-SA 3.0）

紅十字醫院（Rode Kruis Ziekenhuis）已於 2021 年關閉。圖／1Veertje on Wikimedia Commons（CC BY-SA 4.0）。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師，以及 Metta 的兄弟 Ton Derksen 教授，都覺得事有蹊蹺。^[7]Metta 和 Ton 檢視死者的病歷紀錄，並指出部份醫療事故的類型和事發時間，與判決所用的數據對不起來。因為後者大半仰賴記憶，他們甚至發現有些遭指控的班次，Lucia de Berk 其實不在現場。然而，光是這些校正，還不足以推翻判決。^{[1, 7]}

-----廣告，請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學（Universiteit Leiden）統計學榮譽教授 Richard Gill，也伸出援手。^[2]在協助此案的多年後，他的團隊發表了一篇論文，解釋不該使用超幾何分佈的理由，例如：^[1]

護理人員不可互換：所有受訪醫師都說，護理人員可以相互替換；但是護理人員覺得，他們無法取代彼此。由於各別的個性與行事風格迥異，他們對病患的影響也不同。^[1]
醫療事故通報機率：既然每個護理人員都有自己的個性，他們判定某事件為醫療事故，並且通報醫師的機率也不一樣。^[1]畢竟醫院的通報規定是一回事；符合標準與否，都由護理人員判斷。比方說，有個病患每次緊張，血壓就破表。那就讓他坐著冷靜會兒，再登記第二次測量的正常結果即可。不過，難免會有菜鳥護士量一次就嚇到通報，分明給病房添亂。
班次與季節事故率：夜間與週末只剩護理人員和少數待命的醫師；季節性的特定病例增減；以及病患的生理時鐘等，都會影響出事的機率。^[1]
護理排班並不平均：護理人員的班次安排，理想上會有帶狀的規律。可能連續幾天都是白班，接著是幾個小夜班之類的，^[1]比較方便調整作息。此外，護理人員的資歷和個性，通常也會被納入考量。^[1]以免某個班次全是資深人員；但另個班次緊急事故發生時，卻只剩不會臨機應變的新手。在這樣的排班原則下，如果單看某個時期的班表，每個人所輪到的各類班次總數，應該不會完全相同。
出院政策曾經改變：茱莉安娜兒童醫院在案發期間，曾經針對確定救不活的小病患，是否該在家中或病房離世，做過政策上的調整。帳面上來說，算在病房裡的事故量絕對會有變化。^[1]

總之，太多因素會影響護理排班，或是干擾醫療事故的通報率，因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是，Henk Elffers 在計算過程中，分開處理 3 個病房的機率，然後再相乘。Richard Gill 的團隊強調，這樣會造成在多處上班的護理人員，比只為一處服務者，看起來有較高的嫌疑。^[1]

帕松分佈

因應這種情境，Richard Gill 教授建議採用帕松分佈（又譯「布阿松分配」；Poisson distribution），^[1]一種描述特定時間內，事件發生率的統計模型。^[8]有別於先前的計算方法，在這裡事故傾向（accident proneness），以及整體排班狀況等變因，都納入了考量。前者採計護理人員通報醫療事故的意願強度；後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等，也適用於 Lucia de Berk 的案子。^[1]（深入瞭解公式和計算（p. 4 – 6）。^{[1, 8]}）

雖然此模型的細節複雜，統計學家得大費周章解釋給法官聽，但是考慮的條件比較趨近真實。倘若套用原始判決的數據，這個計算最後的答案是 0.0206161，意即醫療事故本來就有 49 分之 1 的機率，會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據，機率更高達 9 分之 1。^{[1, 9]}換句話說，她單純是倒楣出現在那裡，就被當作連續殺人犯。^[6]

其他證據與翻案

大相逕庭的計算結果，顯示出選擇正確統計模型的重要性。然而，最不合理的，是以機率作為判決的主要根據。就謀殺案件來說，怎能不忠於病歷或驗屍報告？Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時，表示後來由醫師和毒物學家組成的獨立團隊，被允許瀏覽當初沒送上法庭的關鍵資料。^[2]他們發現原本被視為受害者的病患，根本都喪命於自然死因。^{[2, 6]}

在各方人士的協助下，Lucia de Berk 還是歷經兩次上訴失敗。^[6]她曾於 2008 年，被允許在家等候重審結果。^[1]但直到 2010 年 4 月，司法才還她清白。^[7]Ton Derksen 認為，在荷蘭像這樣誤判的案件，約佔總判決數的 4 至 11%，也就是每年 1,000 人左右。不過，2006 到 2016 年間被判刑的 2 萬 3 千人裡，只有 5 個上訴到最高法院，而且僅 Lucia de Berk 的案子得以平反。^[10]

-----廣告，請繼續往下閱讀-----