0

文字

繁 | 简

0

好書搶先看專欄科技能源

《精準預測 The Signal and the Noise》－好賭徒如何思考

PanSci ・2013/09/25 ・2149字・閱讀時間約 4 分鐘・SR值 541

・八年級

相關標籤：

熱門標籤：

伏加瑞斯怎麼知道他下注湖人隊可以過關呢？他不知道。成功的賭徒—還有任何一種成功的預測人員—都不是用穩賺不賠的賭注、完全可靠的理論和極為精確的測量這樣的方式來考量未來。這些是笨蛋的幻覺，是他們過度自信的警報。成功的賭徒認為未來是一點一點的機率，像股票行情一樣，每進來一點新的資訊就上下跳動。他們對這些機率的計跟提供的可能性之間到達足夠的差異，他們就可能下注。

伏加瑞斯如何看待他對湖人隊的下注：

結果	機率	淨利
湖人隊贏得冠軍	25%	+$520,000
湖人隊未贏得冠軍	75%	-$80,000
預期利潤		+$70,000

例如，伏加瑞斯下注湖人隊的時候，拉斯維加斯的盤口說他們贏得NBA總冠軍的機率是百分之十三。伏加瑞斯不認為湖人隊有百分之百的機率，甚至不到百分之五十—但是他有信心，他們會比百分之十三高上不少。他認為也許比較可能是百分之二十五。如果伏加瑞斯的估計正確，理論上下注就可能有七萬美元的利潤。

然而，如果未來對預測人員來說是以機率的灰階存在，那麼現在的到來就是非黑即白。鮑勃理論上的七萬美元淨利包含有百分之二十五的機會贏得五十二萬美元，加上百分之七十五的機會輸掉八萬美元。長期來看，輸贏最後會打平：對一個好的預測人員來說，過去和未來兩者之間會比較相似，跟現在比較不像，因為這兩者都可以用長期的機率來表示。但這是個獨一無二的賭注。伏加瑞斯必須要有相當大的優勢（他認為莊家低估湖人隊的六種不同理由），頭腦還得相當好，才能做得到。

-----廣告，請繼續往下閱讀-----

既然伏加瑞斯為自己賺進了大筆現金，就能承擔得起比較小的優勢了。一般NBA有比賽的晚上，他可以下注三、四場。雖然從任何普通的標準來看，這些賭注都很龐大，但是跟他的實際財產比起來都算小，小到他似乎可以漠不在乎。我去拜訪的那晚，在其中一部平面螢幕上，猶他爵士隊把兩百一十八公分、動作不靈活的烏克蘭球員基里洛‧費森科（Kyrylo Fesenko）放進球員名單，這是明確的徵兆，顯示他們要放棄這場比賽，伏加瑞斯會因而輸掉三萬美元的賭注，但他眼睛連眨都沒眨一下。

伏加瑞斯的大祕密就是他沒有大祕密。但是他有一千個小祕密，他把大量的資訊放在一起，一次加上一點。例如，他有套程式，用來模擬每場比賽的結果。但是除非他有非常明顯的優勢，或是有其他補充的資訊，不然他不會只倚靠程式。幾乎每場NBA比賽他都看—有些看即時播出，有些看錄影帶—發展出他自己的看法，判斷哪一隊有發揮天分，哪隊沒有。他經營基本上屬於他自己的球探服務，雇用助理把每個球員對每個動作的守備位置化成圖表，讓他得到連許多NBA球隊都沒有的優勢。他追蹤數十位NBA球員的推文（Twitter feed），仔細檢查每段一百四十個字元的小段情報，尋找相關性：球員推文說當晚他晚點才要去球隊，晚上可能就不會上場。他很注意教練在記者會說的話，還有他們用的代碼：例如如果教練說，他希望他的隊伍「學會進攻」或「打好基本的籃球」，可能是表示他想要把比賽的步調慢下來。

對大多數人來說，伏加瑞斯觀察的這些東西似乎是枝微末節。在某種意義上確實如此：明顯的大優勢會讓別的賭徒注意到，會反映在盤口上。所以他必須再探究得深入一點。

例如，二○○二年球季最後，伏加瑞斯注意到有克里夫蘭騎士隊的比賽總分特別有可能「過頭」。（運動賽事有兩種主要的賭法，一種賭的是比分差距，另一種賭的是總分的上下—兩隊得分的總和會是多少。）仔細看了幾場比賽之後，他很快就查明了原因：瑞奇‧戴維斯（Ricky Davis），該隊的控球後衛，是個惡名昭彰的自私球員，那年底就會成為自由球員，他正在盡全力提高他的統計數字，好讓自己成為更好賣的商品。這表示騎士隊進攻的速度會變得飛快，努力想盡可能創造最多的機會，以累積得分和助攻。這樣算不算打好籃球就沒那麼重要了：騎士隊已經遠離季後賽了。騎士隊的對手多半也打不進季後賽，也樂得給個人情，兩者之間就有了默契，放鬆防守，交換進攻，努力提高彼此的統計數字。有騎士隊參賽的比賽，在球季的最後三週突然間從每場比賽一百九十二分拉高到兩百零七分。賭分數會超過不是十拿九穩—沒有必然的事—但這樣就有豐厚的利益可圖了。

-----廣告，請繼續往下閱讀-----

回想起來，這樣的模式有時候似乎很明顯：如果他們除了提高自己的進攻數據以外沒什麼可以玩的了，那騎士隊的比賽當然會得分很高。但是賭徒如果對統計數字認識有限，沒有考慮造成這些數字的情境的話，就會漏掉他們。如果球隊連續兩場比賽得分都很高，甚至三、四場都如此，通常不代表什麼。的確，因為NBA的球季很長—三十隊，每隊打八十二場比賽—常常會發生這樣的比賽連續出現幾場的狀況。這些狀況大都是傻瓜賭注（suckers’ bet）：發生這種狀況的原因純粹是跟機率有關。事實上，由於莊家通常也會注意到這些趨勢，在設定盤口的時候可能會矯枉過正，所以有時候反過來下注才聰明。

所以伏加瑞斯不只是在找模式。在任何一種資料豐富的環境中，要找到模式很容易；普通的賭徒就這樣做。關鍵在於這些模式代表的是訊號還是雜訊。

伏加瑞斯會不會對某場特定的比賽下注，雖然沒有什麼特別的關鍵，但卻有種特殊的思考過程幫助他控制他的決定。這種過程稱之為貝氏推理（Bayesian reasoning）。

摘自《精準預測：如何從巨量雜訊中，看出重要的訊息？》，由三采文化出版。

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

PanSci

1273 篇文章・ 2668 位粉絲

PanSci的編輯部帳號，會發自產內容跟各種消息喔。

TRENDING 熱門討論

即時熱門

文字

0

預測市場？預測股票？如何讓預測有更高的準確率？——《超越直覺》

一起來・2024/05/04 ・1635字・閱讀時間約 3 分鐘

相關標籤：

熱門標籤：

我們發現在足球賽中，只要知道一個簡單的訊息（主隊過去的獲勝機率超過一半），預測力就會明顯好過隨便亂猜。如果再加上第二個簡單的訊息（勝負紀錄較佳的隊伍會略占優勢），可以再進一步提升預測力。除此之外，你可能還想收集其他訊息，像是四分衛最近的表現、球隊有沒有傷兵、明星跑衛的花邊新聞，但這些資訊對預測的幫助不大。換句話說，預測複雜系統這件事依循著「收益遞減定律」：第一個訊息很有幫助，但很快就找不到有幫助的其他訊息。

對於某些事件，我們當然會非常計較預測的準確性，像是投放線上廣告或投資高頻交易（HFT），可能一天內就要預測數百萬、數十億次，而且金額相當龐大。投入極大心力與費用、運用最精細的運算模型來開發複雜的預測方式，在那種情況下或許值得。但在其他商業領域，例如製作電影、出版書籍到發展新技術，只需要一年預測數十次、頂多數百次，而且這不過是整個決策過程中的一部分。這時，我們只要借助相對簡單的方式，就可以讓預測臻至完善。

預測時，不該只根據一人的意見就做決定——尤其是你自己的意見。雖然人們善於察覺與特定問題相關的因素，卻往往不會評估因素之間的相對重要性。譬如，預測電影的首映週末票房時，你可能會認為一些變項都是高度相關，例如製作費、宣傳費、上映廳數、試映會評價。沒錯。但我們要如何權衡「評價不優」與「額外行銷預算：一千萬美元」之間的比重？這沒有一定答案。同樣，在決定分配行銷預算的方法時，要如何判斷多少人會受到網路或雜誌廣告影響，又有多少人會從親朋好友那邊聽到產品訊息？我們也不清楚。唯一知道的是，這些因素都可能相關。

你可能會以為，精準判斷應該是專家的強項。但正如泰特洛克的試驗結果，專家在量化預測上的表現，其實跟普通人一樣糟糕，甚至可能更糟。然而，我們依賴專家之所以會成效不彰，不是因為專家的預測力跟一般人沒兩樣。問題在於，我們通常一次只會諮詢一位專家（否則何必找專家）。但我們應該要綜合多人的意見（無論是專家或非專家）再取平均值。至於要如何達成？這其實沒那麼重要。

-----廣告，請繼續往下閱讀-----

儘管預測市場有各種花俏的噱頭與技術，表現也比民調這類簡單方式好一點，但這種微小差異，還不如採用某種方式簡單綜合許多觀點再取平均。或者，我們也可以直接根據歷史數據，評估各項因素的相對重要性——這實際上就是統計模型在做的事。我必須再強調一次，雖然複雜模型可能會比簡單模型好一點，但兩者的差異小到幾乎沒有差別。到頭來，模型跟群眾所能達到的預測目的都一樣。第一，這兩種預測方式都要靠人為判斷，確認哪些因素與預測相關。第二，兩者皆需要估計、權衡那些因素的相對重要性。正如心理學家羅賓．道斯所言：「訣竅在於，找到要注意的變項，然後知道如何加入它們。」

只要一直使用這個訣竅，一段時間後，就會知道哪一些預測的失誤率較小，哪一些較大。舉例來說，當你要預測一個事件的結果，假如其他條件都相同，那越早做預測的失誤率就越大。不管你用什麼方法預測電影票房，在「剛開拍」時會比「上映前幾週」時要難得多。同樣，如果你想預測尚未上市的新產品銷量，那準確度可能不會高過預測已上市的產品。

你無法解決這個問題，唯一能做的只有：使用其中一種方式，或甚至結合幾種方式，就像我們研究預測市場時的方法，然後隨時觀察、記錄預測的表現。我在第 6 章開頭也提過，一般人通常不習慣追蹤自己的預測。我們做了大量預測，卻很少回頭檢視自己對了幾次。然而，留意並記錄預測成效或許才是最重要的事，唯有如此，你才能知道準確度是多少，進而知道自己預測的可信度。

——本文摘自《超越直覺》，2024 年 01 月，一起來出版，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

一起來

5 篇文章・ 2 位粉絲

TRENDING 熱門討論

即時熱門

1

0

文字

0

1

0

賭博與愛情公式：用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》

大牌出版．出版大牌・2024/01/06 ・2486字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

理解期望值，有助於分析賭場裡的大部分賭局，以及美國中西部和英國的嘉年華會中，常有人玩、但一般人比較不熟悉的賭法：骰子擲好運（chuck-a-luck）。

招攬人來玩「骰子擲好運」的說詞極具說服力：你從 1 到 6 挑一個號碼，莊家一次擲三顆骰子，如果三個骰子都擲出你挑的號碼，莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼，莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼，莊家付你 1 美元。如果你挑的號碼一個也沒有出現，那你要付莊家 1 美元。賽局用三個不同的骰子，你有三次機會贏，而且，有時候你還不只贏 1 美元，最多也不過輸 1 美元。

我們可以套用名主持人瓊安．李維絲（Joan Rivers）的名言（按：她的名言是：「我們能聊一聊嗎？」），問一句：「我們能算一算嗎？」（如果你寧願不算，可以跳過這一節。）不管你選哪個號碼，贏的機率顯然都一樣。不過，為了讓計算更明確易懂，假設你永遠都選 4。骰子是獨立的，三個骰子都出現 4 點的機率是 1/6×1/6×1/6＝1/216，你約有 1/216 的機率會贏得 3 美元。

-----廣告，請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率，會難算一點。但你可以使用第 1 章提到的二項機率分布，我會在這裡再導一遍。三個骰子中出現兩個 4，有三種彼此互斥的情況：X44、4X4 或 44X，其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6＝5/216，第二種和第三種的結果也是這樣。三者相加，可得出三個骰子裡出現兩個 4 點的機率為 15/216，你有這樣的機率會贏得 2 美元。

同樣的，要算出三個骰子裡只出現一個 4 點的機率，也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6＝25/216，得到 X4X 和 XX4 的機率亦同，三者相加，得出 75/216。這是三個骰子裡僅出現一個 4 點的機率，因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率，我們只要算出剩下的機率是多少即可。算法是用 1（或是100％）減去（1/216 +15/216 + 75/216），得出的答案是 125/216。所以，平均而言，你每玩 216 次骰子擲好運，就有 125 次要輸 1 美元。

這樣一來，就可以算出你贏的期望值（$3×1/216）+（$2×15/216）+（$1×75/216）+（–$1×125/216）＝$（–17/216）＝–$0.08。平均來說，你每玩一次這個看起來很有吸引力的賭局，大概就要輸掉 8 美分。

-----廣告，請繼續往下閱讀-----

尋找愛情，有公式？

面對愛情，有人從感性出發，有人以理性去愛。兩種單獨運作時顯然效果都不太好，但加起來⋯⋯也不是很妙。不過，如果善用兩者，成功的機率可能還是大一些。回想舊愛，憑感性去愛的人很可能悲嘆錯失的良緣，並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人，很可能會對以下的機率結果感興趣。

在我們的模型中，假設女主角——就叫她香桃吧（按：在希臘神話中，香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物，象徵愛與美）有理由相信，在她的「約會生涯」中，會遇到 N 個可能成為配偶的人。對某些女性來說，N 可能等於 2；對另一些人來說，N 也許是 200。香桃思考的問題是：到了什麼時候我就應該接受X先生，不管在他之後可能有某些追求者比他「更好」？我們也假設她是一次遇見一個人，有能力判斷她遇到的人是否適合她，以及，一旦她拒絕了某個人之後，此人就永遠出局。

為了便於說明，假設香桃到目前為止已經見過 6 位男士，她對這些人的排序如下：3—5—1—6—2—4。這是指，在她約過會的這 6 人中，她對見到的第一人的喜歡程度排第 3 名，對第二人的喜歡程度排第 5 名，最喜歡第三個人，以此類推。如果她見了第七個人，她對此人的喜歡程度超過其他人，但第三人仍穩居寶座，那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人，她就更新追求者的相對排序。她在想，到底要用什麼樣的規則擇偶，才能讓她最有機會從預估的 N 位追求者中，選出最好的。

要得出最好的策略，要善用條件機率（我們會在下一章介紹條件機率）和一點微積分，但策略本身講起來很簡單。如果有某個人比過去的對象都好，且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面，她大概需要拒絕前面的 37％，之後真命天子出現時（如果有的話），就接受。

-----廣告，請繼續往下閱讀-----

舉例來說，假設香桃不是太有魅力，她很可能只會遇見 4 個合格的追求者。我們進一步假設，這 4 個人與她相見的順序，是 24 種可能性中的任何一種（24＝4×3×2×1）。

由於 N＝4，37％策略在這個例子中不夠清楚（無法對應到整數），而 37％介於 25％與 50％之間，因此有兩套對應的最佳策略如下：

（A）拒絕第一個對象（4×25％＝1），接受後來最佳的對象。

（B）拒絕前兩名追求者（4×50％＝2），接受後來最好的求愛者。

如果採取A策略，香桃會在 24 種可能性中的 11 種，選到最好的追求者。採取 B 策略的話，會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列，如同前述，1 代表香桃最偏好的追求者，2 代表她的次佳選擇，以此類推。因此，3—2—1—4 代表她先遇見第三選擇，再來遇見第二選擇，第三次遇到最佳選擇，最後則遇到下下之選。序列後面標示的 A 或 B，代表在這些情況下，採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告，請繼續往下閱讀-----

1234；1243；1324；1342；1423；1432；2134（A）；2143（A）；2314（A, B）；2341（A, B）；2413（A, B）；2431（A, B）；3124（A）；3142（A）；3214（B）；3241（B）；3412（A, B）；3421；4123（A）；4132（A）；4213（B）；4231（B）；4312（B）；4321

如果香桃很有魅力，預期可以遇見 25 位追求者，那她的策略是要拒絕前 9 位追求者（25 的 37％約為 9），接受之後出現的最好對象。我們也可以用類似的表來驗證，但是這個表會變得很龐雜，因此，最好的策略就是接受通用證明。（不用多說，如果要找伴的人是男士而非女士，同樣的分析也成立。）如果 N 的數值很大，那麼，香桃遵循這套 37％法則擇偶的成功率也約略是 37％。接下來的部分就比較難了：要如何和真命天子相伴相守。話說回來，這個 37% 法則數學模型也衍生出許多版本，其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》，2023 年 11 月，大牌出版，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

大牌出版．出版大牌

3 篇文章・ 0 位粉絲

閱讀的大牌不侷限於單一領域，視野寬廣，知識豐富，思考獨立。

TRENDING 熱門討論

即時熱門

10

2

文字

0

10

2

鑑識故事系列：Lucia de Berk 值班死幾人？荷蘭護理冤案

胡中行・2023/02/27 ・2983字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

前言：本文為鑑識系列中，罕見提及統計學的故事。不過，繁複的計算過程全部省略，僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖／Carole Edrich on Wikimedia Commons（CC BY-SA 3.0）

荷蘭護理人員 Lucia de Berk，長年於海牙茱莉安娜兒童醫院（Juliana Kinderziekenhuis）的 1 個病房，與紅十字醫院（Rode Kruis Ziekenhuis）的 2 個病房工作。2001 年 12 月，她因謀殺罪嫌被捕。^[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因，發現是中毒身亡；後來連帶調查 1997 至 2001 年間，幾家醫院可能的謀殺案件，於是找上了她。^[2]在法庭上，司法心理學家 Henk Elffers 用機率的概念，證明 Lucia de Berk 有罪。簡單來說，就是計算嫌犯現身出事班次的機率。他採取的統計方法，叫做超幾何分佈（又稱「超幾何分配」；hypergeometric distribution）。^[1]

超幾何分佈適合用在從一個母數中，隨機抽取樣本，不再放回的情形。例如：袋子裝有 N 顆球，其中 L 顆為紅球。一把抓出 n 顆球，不特別挑選的話，紅球碰巧被抓到的機率為 X。^{[3, 4]}以此類推，在此案被調查的時間範圍內，病房總共有 N 個班次，其中 Lucia de Berk 值了 L 班，而有醫療事故的班次共 n 個。如果不刻意安排，則她正好出現在事故班次的機率為 X。^[1]（公式介紹。^[4]）

此處實際帶入數據後得到的答案，說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一（X = 1 / 3.42 x 10⁸）的機率，會剛好在醫療事故發生的班次值班。因此，法庭認定她的頻繁出現（> 1 / 3.42 x 10⁸），絕非巧合。^{[1, 2, 5, 6]}2003 年，Lucia de Berk因 7 起謀殺和 3 次殺人未遂，^[2]被判終身監禁。^[5]

茱利安納兒童醫院（Juliana Kinderziekenhuis）外觀。圖／Joris on Wikimedia Commons（CC BY-SA 3.0）

紅十字醫院（Rode Kruis Ziekenhuis）已於 2021 年關閉。圖／1Veertje on Wikimedia Commons（CC BY-SA 4.0）。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師，以及 Metta 的兄弟 Ton Derksen 教授，都覺得事有蹊蹺。^[7]Metta 和 Ton 檢視死者的病歷紀錄，並指出部份醫療事故的類型和事發時間，與判決所用的數據對不起來。因為後者大半仰賴記憶，他們甚至發現有些遭指控的班次，Lucia de Berk 其實不在現場。然而，光是這些校正，還不足以推翻判決。^{[1, 7]}

-----廣告，請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學（Universiteit Leiden）統計學榮譽教授 Richard Gill，也伸出援手。^[2]在協助此案的多年後，他的團隊發表了一篇論文，解釋不該使用超幾何分佈的理由，例如：^[1]

護理人員不可互換：所有受訪醫師都說，護理人員可以相互替換；但是護理人員覺得，他們無法取代彼此。由於各別的個性與行事風格迥異，他們對病患的影響也不同。^[1]
醫療事故通報機率：既然每個護理人員都有自己的個性，他們判定某事件為醫療事故，並且通報醫師的機率也不一樣。^[1]畢竟醫院的通報規定是一回事；符合標準與否，都由護理人員判斷。比方說，有個病患每次緊張，血壓就破表。那就讓他坐著冷靜會兒，再登記第二次測量的正常結果即可。不過，難免會有菜鳥護士量一次就嚇到通報，分明給病房添亂。
班次與季節事故率：夜間與週末只剩護理人員和少數待命的醫師；季節性的特定病例增減；以及病患的生理時鐘等，都會影響出事的機率。^[1]
護理排班並不平均：護理人員的班次安排，理想上會有帶狀的規律。可能連續幾天都是白班，接著是幾個小夜班之類的，^[1]比較方便調整作息。此外，護理人員的資歷和個性，通常也會被納入考量。^[1]以免某個班次全是資深人員；但另個班次緊急事故發生時，卻只剩不會臨機應變的新手。在這樣的排班原則下，如果單看某個時期的班表，每個人所輪到的各類班次總數，應該不會完全相同。
出院政策曾經改變：茱莉安娜兒童醫院在案發期間，曾經針對確定救不活的小病患，是否該在家中或病房離世，做過政策上的調整。帳面上來說，算在病房裡的事故量絕對會有變化。^[1]

總之，太多因素會影響護理排班，或是干擾醫療事故的通報率，因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是，Henk Elffers 在計算過程中，分開處理 3 個病房的機率，然後再相乘。Richard Gill 的團隊強調，這樣會造成在多處上班的護理人員，比只為一處服務者，看起來有較高的嫌疑。^[1]

帕松分佈

因應這種情境，Richard Gill 教授建議採用帕松分佈（又譯「布阿松分配」；Poisson distribution），^[1]一種描述特定時間內，事件發生率的統計模型。^[8]有別於先前的計算方法，在這裡事故傾向（accident proneness），以及整體排班狀況等變因，都納入了考量。前者採計護理人員通報醫療事故的意願強度；後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等，也適用於 Lucia de Berk 的案子。^[1]（深入瞭解公式和計算（p. 4 – 6）。^{[1, 8]}）

雖然此模型的細節複雜，統計學家得大費周章解釋給法官聽，但是考慮的條件比較趨近真實。倘若套用原始判決的數據，這個計算最後的答案是 0.0206161，意即醫療事故本來就有 49 分之 1 的機率，會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據，機率更高達 9 分之 1。^{[1, 9]}換句話說，她單純是倒楣出現在那裡，就被當作連續殺人犯。^[6]

其他證據與翻案

大相逕庭的計算結果，顯示出選擇正確統計模型的重要性。然而，最不合理的，是以機率作為判決的主要根據。就謀殺案件來說，怎能不忠於病歷或驗屍報告？Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時，表示後來由醫師和毒物學家組成的獨立團隊，被允許瀏覽當初沒送上法庭的關鍵資料。^[2]他們發現原本被視為受害者的病患，根本都喪命於自然死因。^{[2, 6]}

在各方人士的協助下，Lucia de Berk 還是歷經兩次上訴失敗。^[6]她曾於 2008 年，被允許在家等候重審結果。^[1]但直到 2010 年 4 月，司法才還她清白。^[7]Ton Derksen 認為，在荷蘭像這樣誤判的案件，約佔總判決數的 4 至 11%，也就是每年 1,000 人左右。不過，2006 到 2016 年間被判刑的 2 萬 3 千人裡，只有 5 個上訴到最高法院，而且僅 Lucia de Berk 的案子得以平反。^[10]

-----廣告，請繼續往下閱讀-----