0

2
0

文字

分享

0
2
0

人為逼出研究的顯著結果:「披薩門」事件是怎麼一回事?

活躍星系核_96
・2017/04/07 ・4445字 ・閱讀時間約 9 分鐘 ・SR值 547 ・八年級

編按:本文事件起因於曾出版過科普書《 瞎吃》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在2016 年 11 月 21 日刊登在個人部落格的文章:「永不說『不』的研究生」(原文已遭刪除,Cornell的事件處理相關資訊在此)。此文中汪辛克教授簡述了他與研究生合作的成果,而此篇研究與披薩有關,因此本文標題「披薩門」,為作者借用哥倫比亞大學統計學教授、知名學術部落客安德魯.蓋爾曼(Andrew Gelman)從 2017 年 1 月 31 號起,在個人部落格對此事件的稱呼「Pizzagate」[1]。

圖/Yoshihide Nomura @ Flickr
  • 文/ 陳紹慶,慈濟大學人類發展與心理學系助理教授、開放科學中心大使(Center for Open Science Ambassador)

如果你是位關心人類飲食習慣研究最新資訊的科普作家,在2016年11月21日看到出版暢銷書《瞎吃:為什麼我們吃下去的比心裡想的還要多(Mindless Eating: Why We Eat More Than We Think)》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在個人部落格張貼的文章「永不說“不”的研究生」,應該會想寫篇文章轉述教授與這位研究生的合作成果。轉述內容必定會引用這篇文章提到的論文,以及評論為何一夥人想聚餐吃披薩,總是以吃到飽餐廳做為首選。

康乃爾大學布萊恩.汪辛克教授(Brian Wansink)的著作《 瞎吃(Mindless Eating: Why We Eat More Than We Think)》。 圖/Amazon

然而汪辛克教授的首版部落格文章,有幾段文字吸引了近幾年學術圈內惡名昭彰的方法學恐怖份子(methodological terrorists)注意;2017 年開始沒有幾天,文章裡提到的四篇論文就被挑出多達 150 筆錯誤的統計數字。汪辛克看到這篇尚未經同儕審查的論文[7],完全無法辯解被指出的錯誤,只能在原始部落格文章兩度發佈追加致歉訊息,還有向各方聲明會針對出現錯誤的四篇論文,檢討自己的研究方法與指導學生的方式,並召集人員重新進行核實研究[11]。也有關心社會科學假報告揭發爭議的媒體記者,向大學及實驗室公關請求採訪汪辛克本人有關數據為何出錯的細節,汪辛克卻做出二十多年以來首次閃避媒體採訪的舉動[4]。

汪辛克在個人部落格說了什麼話而引起這新一波學術爭議?論文中的錯誤怎麼被人挑出來?「方法學恐怖份子」又是何方神聖?

公開示範人為逼出的顯著結果(p-hacking)

汪辛克在部落格文章提到剛發表的五篇論文,是與一位來自土耳其,與他短期合作的研究生,一起分析一批以前在某家義式餐廳收集完成的資料。

-----廣告,請繼續往下閱讀-----

文章中提到當時他對這位研究生說「收集這些資料花了很多時間與經費,因為這批資料裡可以挖出很多酷玩意,我們應該能做點什麼補救。」

  • (“This cost us a lot of time and our own money to collect. There’s got to be something here we can salvage because it’s a cool (rich & unique) data set.”)。

他們的討論過程提到幾個可能的補救方式,也提到如果這位研究生願意出手的話,汪辛克期望看到的分析結果與圖表是什麼模樣。

  • (“I told her what the analyses should be and what the tables should look like. I then asked her if she wanted to do them.”)

這段現在看起來像是不打自招的說法,看在方法學恐怖份子眼裡,馬上就察覺這不就是人為逼出顯著結果的標準作業程序?也就是為了得到小於顯著水準的 p 值,資料分析過程裡不擇手段修改與增減研究資料的一切行為。

社會科學,特別是社會心理學,已經有好幾起受到大眾媒體青睞的主題,起初被發現當成鐵證的原始研究結果,最後被證實是人為過度操作資料分析的產物。像是丹尼爾.卡尼曼(Daniel Kahneman)在暢銷著作《快思慢想》(Thinking, Fast and Slow)引用約翰.巴赫(John Bargh)的老年化促發(Elderly Priming),因為這一系列的相關論文報告列出的多數 p 值恰好接近顯著水準(比如0.04),已被專業統計方法認證是人為逼出的顯著結果[5]。

-----廣告,請繼續往下閱讀-----
透過恣意的增減統計數據,來達成人為逼出的顯著結果。圖/Matt McGee @ Flickr

統計數據錯誤太多而導致的胃食道逆流(Statistical heartburn)

兩位荷蘭博士生,提姆.凡迪利(Tim van de Zee)與尼克.布朗(Nick Brown),加上一位美國的統計學家喬丹.安那亞(Jordan Anaya)決定合作破解這些論文是不是人為逼出顯著結果的謎題。

尼克.布朗與其指導教授在 2016 年於社會心理與人格科學(Social Psychological and Personality Science)發表一篇論文,介紹偵測心理學論文中報告的平均值,與其報告的樣本數不一致程度的方法:GRIM測試[6]。喬丹將 GRIM 測試結合網路爬蟲程式,開發出可探勘大量文獻並挑出錯誤的應用軟體。看了汪辛克的部落格文章之後,他們與提姆決定要好好檢視汪辛克列出的其中四篇論文,因為他們研判這四篇的資料來源應該是同一家餐廳的現地實驗(Field Experiment)。

在 2017 年 1 月 27 日公開尚未經同儕審查的手稿,三人簡述曾向汪辛克主持的實驗室索取原始資料,卻被婉拒的過程。這個轉折之後,三人決定使用手邊能運用的壞科學探測器(Bad Science Detectors [註1])檢查論文之中的數據。除了喬丹開發的程式,還有荷蘭蒂爾堡大學的博士生蜜雪兒.諾特(Michele Nuijten)開發,用來檢查 t 分數等統計值是否有計算錯誤的應用程式 statcheck[8]。

最後,他們從四篇論文挑出 150 項錯誤,大多數錯誤是圖表中的樣本數與正文報告的樣本數兜不攏,還有同一筆資料在不同表格列出的平均值與樣本數彼此不一致。如果讀者是在大學裡教統計的老師們,甚至是在中小學教數學的老師們,看到幾十頁的數據和圖表充滿這樣的錯誤,想必都需要趕緊來一錠「吉胃服適」。

-----廣告,請繼續往下閱讀-----
提姆等人掃瞄汪辛克過去19年(1997~2016)的著作,挑出的錯誤圖表拼圖。請點擊看大圖。圖/Tim van der Zee 個人部落格

方法學恐怖份子從何而來?

提姆、尼克、與喬丹的行動完美揭發虛假科學報告,讓世人減少被虛假科學消息誤導的機會。但是對於像汪辛克等成名已久,習慣傳統社會科學研究模式的學者們來說,這種行徑猶如恐怖行動。

普林斯頓大學的資深社會心理學教授蘇珊.費斯克(Susan Fiske),曾在 2016 年 9 月被人發現,本來要發表在心理科學學會(Association of Psychological Science)的學會會員刊物專欄文章裡,草稿曾使用方法學恐怖主義(methodological terrorism)一詞,形容這些公開挑論文數據錯誤、指出某項研究無法再現等非常規學術發表樣態[9]。

這項消息見報的時機,也剛好發生蘇珊.費斯克的高徒艾美.柯蒂(Amy Cuddy)的成名作《權力姿勢效應(power posing effect)》,其昔日同儕戴娜.卡奈(Dana Carney)公開坦承「權力姿勢效應是虛假的效應」的事件[10]。

艾美.柯蒂曾於 2012 年在 TED 演講擺出高權力姿勢的好處[12],從此成為家喻戶曉的社會心理學教授。事件發生之前一年,其他實驗室發表以比原始研究多出四倍的樣本數,卻無法再現原始研究的結果[15],接著一系列研究的 p 值被其他學者使用另一種壞科學探測器 P-Curve[13] 分析之後,確定是無真正顯著結果的效應,因此造成昔日同儕與艾美.柯蒂分道揚鑣。現在的艾美.柯蒂在美國大眾的形象,有些像南韓世越號事件發生之後的朴槿惠,有興趣的讀者可留意演講影片[12]下方的討論留言,看到近幾個月要求影片下架與支持艾美.柯蒂的意見相互交鋒,也許哪天她從演講權力姿勢效應得到的光環會徹底消失。

-----廣告,請繼續往下閱讀-----

科普圈如何面對另類事實

布萊恩.汪辛克與艾美.柯蒂向大眾傳達的資訊,在中文世界,或者至少是台灣的科普圈,依然被多數閱聽者認為是科學事實。科普文章與專業科學論文一樣,要傳遞的是真實的科學知識。即使是由實驗室裡的科學家,親自面向大眾介紹最新研究成果,讀者也要保持求真的意志,而非以內容夠不夠新奇,傳播者有沒有名氣來判斷內容的價值。

然而這對處於專業科學家與讀者之間的科普作家,將帶來更巨大的挑戰。雖然沒有明確規範,科普作家應當具備比一般讀者更好的批判能力,研判科學成果的真實性,特別是許多作家身兼大學教師或研究生,甚至是第一線科學家的身份。不過現在的事實是,多數中文讀者認識布萊恩.汪辛克與艾美.柯蒂,主要是透過這群科普作家的著作及演講,也因此相信這兩人的「研究成果」是有助個人生命成長的正面建議。

我並非在此否定這群科普作家的貢獻,只想藉由說明這些事件,提醒現在的中文科普是不是已經來到必須升級的時刻。除了傳達最新的科學知識,科普作家也要負起啟發讀者辨識科學資訊真實性的責任。在個人與群體之間交換資訊的各種場域,許多科普作家應該能預見查核資訊真實性的實際方法無法配合傳達真實知識的理想,而衍生各種問題。要如何掌握與解決這些問題,還需要更多的資訊與討論,不過我相信隨著這類事件不斷浮現,問題的輪廓將越來越清晰。

  • [註1]:壞科學探測器(Bad Science Detectors)一詞出自英國醫師與科普作家班.高達可(Ben Goldacre)的著作《壞科學》(Bad Science)。有興趣的讀者可參考班.高達可的TED演講

原文刊載於作者部落格,原文為披薩門:「瞎吃」教主的完美自爆

-----廣告,請繼續往下閱讀-----

  • [1]: http://andrewgelman.com/2017/02/03/pizzagate-curious-incident-researcher-response-people-pointing-150-errors-four-papers-2/ “Pizzagate, or the curious incident of the researcher in response to people pointing out 150 errors in four of his papers.”
  • [2]: http://andrewgelman.com/2016/12/15/hark-hark-p-value-heavens-gate-sings/ “Hark, hark! the p-value at heaven’s gate sings.”
  • [3]: http://www.brianwansink.com/phd-advice/the-grad-student-who-never-said-no “The grad student who never say ‘no’.”
  • [4]: http://www.chronicle.com/article/Spoiled-Science/239529 “Spoiled Science.”
  • [5]: http://ssrn.com/abstract=2381936 or http://dx.doi.org/10.2139/ssrn.2381936 “Lakens, D. (2014). Professors are not elderly: Evaluating the evidential value of two social priming effects through p-curve analyses.”
  • [6]:https://www.researchgate.net/publication/309275131_The_GRIM_Test_A_Simple_Technique_Detects_Numerous_Anomalies_in_the_Reporting_of_Results_in_Psychology “The GRIM Test: A Simple Technique Detects Numerous Anomalies in the Reporting of Results in Psychology”
  • [7]: https://peerj.com/preprints/2748/ “Statistical heartburn: An attempt to digest four pizza publications from the Cornell Food and Brand Lab”
  • [8]: https://github.com/MicheleNuijten/statcheck “MicheleNuijten/statcheck”
  • [9]: http://www.businessinsider.com/susan-fiske-methodological-terrorism-2016-9 “Scientists are furious after a famous psychologist accused her peers of ‘methodological terrorism'”
  • [10]: http://scchen.com/Text/text_2016005/ “擺姿勢也許能增加你的自信,但是不能真正改變你”
  • [11]: http://retractionwatch.com/2017/02/16/social-science-isnt-definitive-like-chemistry-embattled-food-researcher-defends-work/ “‘Social science isn’t definitive like chemistry:’ Embattled food researcher defends his work”
  • [12]: https://www.ted.com/talks/amy_cuddy_your_body_language_shapes_who_you_are “Amy Cuddy: Your body language shapes who you are.”
  • [13]: http://www.p-curve.com/ “P-curve.com”
  • [14]: https://www.ted.com/talks/ben_goldacre_battling_bad_science “Ben Goldarcre: Batting bad science.” [15]: http://journals.sagepub.com/doi/10.1177/0956797614553946 “Assessing the Robustness of Power Posing: No Effect on Hormones and Risk Tolerance in a Large Sample of Men and Women”
-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
776 篇文章 ・ 130 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
246 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

3
3

文字

分享

0
3
3
論文好多看不完?研究生的救星!用 AI 幫你分析統整!
泛科學院_96
・2023/10/14 ・761字 ・閱讀時間約 1 分鐘

近期科技界最熱烈討論的新聞,應該就屬韓國有研究單位宣布找到了新的室溫常壓超導體 LK-99 ,聽說可以在一般的高中大學實驗室中完成。這讓我不禁好奇它的製作原理,但,大部分的朋友應該跟我一樣都不是專業材料工程人員,看不懂論文怎麼辦呢?除了等泛科學出影片,別忘了我們有 AI 呀!今天我要來分享一套專門訓練來閱讀論文的 AI —— SciSpace Copilot。

今天的影片簡單的跟大家分享了基於 GPT 技術且針對閱讀學術文章進行特別優化的 AI —— SciSpace ,我只要遇到研究型文章都會特別開這個工具起來使用,其他的大語言模型都無法做到如此細緻。我覺得生成式人工智慧的未來就會到處是這種基於某種目的,比如讀論文,使用某個大模型進行微調 Fine-Tuning 之後的小模型,將會協助我們解決各種問題。

是說現在的研究生做研究的工具真是越來越多,你會想要把這支影片分享給你的指導老師看嗎?
歡迎你把使用的經驗與想法在影片下方留言與我分享!

也歡迎加入泛科學院的頻道會員,或者科學AI的Discord論壇,一起討論交流。

-----廣告,請繼續往下閱讀-----

如果這支影片對你有幫助的話,請幫我在影片下方點個喜歡,或是透過超級感謝展現你的心意,讓我製作更多實用有趣的 AI 教學影片,最後別忘了訂閱泛科學院的頻道,我們下支影片再見囉。

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
泛科學院_96
44 篇文章 ・ 55 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

10
2

文字

分享

0
10
2
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

-----廣告,請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

-----廣告,請繼續往下閱讀-----
Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 68 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。