0

2
0

文字

分享

0
2
0

人為逼出研究的顯著結果:「披薩門」事件是怎麼一回事?

活躍星系核_96
・2017/04/07 ・4445字 ・閱讀時間約 9 分鐘 ・SR值 547 ・八年級

編按:本文事件起因於曾出版過科普書《 瞎吃》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在2016 年 11 月 21 日刊登在個人部落格的文章:「永不說『不』的研究生」(原文已遭刪除,Cornell的事件處理相關資訊在此)。此文中汪辛克教授簡述了他與研究生合作的成果,而此篇研究與披薩有關,因此本文標題「披薩門」,為作者借用哥倫比亞大學統計學教授、知名學術部落客安德魯.蓋爾曼(Andrew Gelman)從 2017 年 1 月 31 號起,在個人部落格對此事件的稱呼「Pizzagate」[1]。

圖/Yoshihide Nomura @ Flickr
  • 文/ 陳紹慶,慈濟大學人類發展與心理學系助理教授、開放科學中心大使(Center for Open Science Ambassador)

如果你是位關心人類飲食習慣研究最新資訊的科普作家,在2016年11月21日看到出版暢銷書《瞎吃:為什麼我們吃下去的比心裡想的還要多(Mindless Eating: Why We Eat More Than We Think)》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在個人部落格張貼的文章「永不說“不”的研究生」,應該會想寫篇文章轉述教授與這位研究生的合作成果。轉述內容必定會引用這篇文章提到的論文,以及評論為何一夥人想聚餐吃披薩,總是以吃到飽餐廳做為首選。

康乃爾大學布萊恩.汪辛克教授(Brian Wansink)的著作《 瞎吃(Mindless Eating: Why We Eat More Than We Think)》。 圖/Amazon

然而汪辛克教授的首版部落格文章,有幾段文字吸引了近幾年學術圈內惡名昭彰的方法學恐怖份子(methodological terrorists)注意;2017 年開始沒有幾天,文章裡提到的四篇論文就被挑出多達 150 筆錯誤的統計數字。汪辛克看到這篇尚未經同儕審查的論文[7],完全無法辯解被指出的錯誤,只能在原始部落格文章兩度發佈追加致歉訊息,還有向各方聲明會針對出現錯誤的四篇論文,檢討自己的研究方法與指導學生的方式,並召集人員重新進行核實研究[11]。也有關心社會科學假報告揭發爭議的媒體記者,向大學及實驗室公關請求採訪汪辛克本人有關數據為何出錯的細節,汪辛克卻做出二十多年以來首次閃避媒體採訪的舉動[4]。

汪辛克在個人部落格說了什麼話而引起這新一波學術爭議?論文中的錯誤怎麼被人挑出來?「方法學恐怖份子」又是何方神聖?

公開示範人為逼出的顯著結果(p-hacking)

汪辛克在部落格文章提到剛發表的五篇論文,是與一位來自土耳其,與他短期合作的研究生,一起分析一批以前在某家義式餐廳收集完成的資料。

文章中提到當時他對這位研究生說「收集這些資料花了很多時間與經費,因為這批資料裡可以挖出很多酷玩意,我們應該能做點什麼補救。」

  • (“This cost us a lot of time and our own money to collect. There’s got to be something here we can salvage because it’s a cool (rich & unique) data set.”)。

他們的討論過程提到幾個可能的補救方式,也提到如果這位研究生願意出手的話,汪辛克期望看到的分析結果與圖表是什麼模樣。

  • (“I told her what the analyses should be and what the tables should look like. I then asked her if she wanted to do them.”)

這段現在看起來像是不打自招的說法,看在方法學恐怖份子眼裡,馬上就察覺這不就是人為逼出顯著結果的標準作業程序?也就是為了得到小於顯著水準的 p 值,資料分析過程裡不擇手段修改與增減研究資料的一切行為。

社會科學,特別是社會心理學,已經有好幾起受到大眾媒體青睞的主題,起初被發現當成鐵證的原始研究結果,最後被證實是人為過度操作資料分析的產物。像是丹尼爾.卡尼曼(Daniel Kahneman)在暢銷著作《快思慢想》(Thinking, Fast and Slow)引用約翰.巴赫(John Bargh)的老年化促發(Elderly Priming),因為這一系列的相關論文報告列出的多數 p 值恰好接近顯著水準(比如0.04),已被專業統計方法認證是人為逼出的顯著結果[5]。

透過恣意的增減統計數據,來達成人為逼出的顯著結果。圖/Matt McGee @ Flickr

統計數據錯誤太多而導致的胃食道逆流(Statistical heartburn)

兩位荷蘭博士生,提姆.凡迪利(Tim van de Zee)與尼克.布朗(Nick Brown),加上一位美國的統計學家喬丹.安那亞(Jordan Anaya)決定合作破解這些論文是不是人為逼出顯著結果的謎題。

尼克.布朗與其指導教授在 2016 年於社會心理與人格科學(Social Psychological and Personality Science)發表一篇論文,介紹偵測心理學論文中報告的平均值,與其報告的樣本數不一致程度的方法:GRIM測試[6]。喬丹將 GRIM 測試結合網路爬蟲程式,開發出可探勘大量文獻並挑出錯誤的應用軟體。看了汪辛克的部落格文章之後,他們與提姆決定要好好檢視汪辛克列出的其中四篇論文,因為他們研判這四篇的資料來源應該是同一家餐廳的現地實驗(Field Experiment)。

在 2017 年 1 月 27 日公開尚未經同儕審查的手稿,三人簡述曾向汪辛克主持的實驗室索取原始資料,卻被婉拒的過程。這個轉折之後,三人決定使用手邊能運用的壞科學探測器(Bad Science Detectors [註1])檢查論文之中的數據。除了喬丹開發的程式,還有荷蘭蒂爾堡大學的博士生蜜雪兒.諾特(Michele Nuijten)開發,用來檢查 t 分數等統計值是否有計算錯誤的應用程式 statcheck[8]。

最後,他們從四篇論文挑出 150 項錯誤,大多數錯誤是圖表中的樣本數與正文報告的樣本數兜不攏,還有同一筆資料在不同表格列出的平均值與樣本數彼此不一致。如果讀者是在大學裡教統計的老師們,甚至是在中小學教數學的老師們,看到幾十頁的數據和圖表充滿這樣的錯誤,想必都需要趕緊來一錠「吉胃服適」。

提姆等人掃瞄汪辛克過去19年(1997~2016)的著作,挑出的錯誤圖表拼圖。請點擊看大圖。圖/Tim van der Zee 個人部落格

方法學恐怖份子從何而來?

提姆、尼克、與喬丹的行動完美揭發虛假科學報告,讓世人減少被虛假科學消息誤導的機會。但是對於像汪辛克等成名已久,習慣傳統社會科學研究模式的學者們來說,這種行徑猶如恐怖行動。

普林斯頓大學的資深社會心理學教授蘇珊.費斯克(Susan Fiske),曾在 2016 年 9 月被人發現,本來要發表在心理科學學會(Association of Psychological Science)的學會會員刊物專欄文章裡,草稿曾使用方法學恐怖主義(methodological terrorism)一詞,形容這些公開挑論文數據錯誤、指出某項研究無法再現等非常規學術發表樣態[9]。

這項消息見報的時機,也剛好發生蘇珊.費斯克的高徒艾美.柯蒂(Amy Cuddy)的成名作《權力姿勢效應(power posing effect)》,其昔日同儕戴娜.卡奈(Dana Carney)公開坦承「權力姿勢效應是虛假的效應」的事件[10]。

艾美.柯蒂曾於 2012 年在 TED 演講擺出高權力姿勢的好處[12],從此成為家喻戶曉的社會心理學教授。事件發生之前一年,其他實驗室發表以比原始研究多出四倍的樣本數,卻無法再現原始研究的結果[15],接著一系列研究的 p 值被其他學者使用另一種壞科學探測器 P-Curve[13] 分析之後,確定是無真正顯著結果的效應,因此造成昔日同儕與艾美.柯蒂分道揚鑣。現在的艾美.柯蒂在美國大眾的形象,有些像南韓世越號事件發生之後的朴槿惠,有興趣的讀者可留意演講影片[12]下方的討論留言,看到近幾個月要求影片下架與支持艾美.柯蒂的意見相互交鋒,也許哪天她從演講權力姿勢效應得到的光環會徹底消失。

科普圈如何面對另類事實

布萊恩.汪辛克與艾美.柯蒂向大眾傳達的資訊,在中文世界,或者至少是台灣的科普圈,依然被多數閱聽者認為是科學事實。科普文章與專業科學論文一樣,要傳遞的是真實的科學知識。即使是由實驗室裡的科學家,親自面向大眾介紹最新研究成果,讀者也要保持求真的意志,而非以內容夠不夠新奇,傳播者有沒有名氣來判斷內容的價值。

然而這對處於專業科學家與讀者之間的科普作家,將帶來更巨大的挑戰。雖然沒有明確規範,科普作家應當具備比一般讀者更好的批判能力,研判科學成果的真實性,特別是許多作家身兼大學教師或研究生,甚至是第一線科學家的身份。不過現在的事實是,多數中文讀者認識布萊恩.汪辛克與艾美.柯蒂,主要是透過這群科普作家的著作及演講,也因此相信這兩人的「研究成果」是有助個人生命成長的正面建議。

我並非在此否定這群科普作家的貢獻,只想藉由說明這些事件,提醒現在的中文科普是不是已經來到必須升級的時刻。除了傳達最新的科學知識,科普作家也要負起啟發讀者辨識科學資訊真實性的責任。在個人與群體之間交換資訊的各種場域,許多科普作家應該能預見查核資訊真實性的實際方法無法配合傳達真實知識的理想,而衍生各種問題。要如何掌握與解決這些問題,還需要更多的資訊與討論,不過我相信隨著這類事件不斷浮現,問題的輪廓將越來越清晰。

  • [註1]:壞科學探測器(Bad Science Detectors)一詞出自英國醫師與科普作家班.高達可(Ben Goldacre)的著作《壞科學》(Bad Science)。有興趣的讀者可參考班.高達可的TED演講

原文刊載於作者部落格,原文為披薩門:「瞎吃」教主的完美自爆

  • [1]: http://andrewgelman.com/2017/02/03/pizzagate-curious-incident-researcher-response-people-pointing-150-errors-four-papers-2/ “Pizzagate, or the curious incident of the researcher in response to people pointing out 150 errors in four of his papers.”
  • [2]: http://andrewgelman.com/2016/12/15/hark-hark-p-value-heavens-gate-sings/ “Hark, hark! the p-value at heaven’s gate sings.”
  • [3]: http://www.brianwansink.com/phd-advice/the-grad-student-who-never-said-no “The grad student who never say ‘no’.”
  • [4]: http://www.chronicle.com/article/Spoiled-Science/239529 “Spoiled Science.”
  • [5]: http://ssrn.com/abstract=2381936 or http://dx.doi.org/10.2139/ssrn.2381936 “Lakens, D. (2014). Professors are not elderly: Evaluating the evidential value of two social priming effects through p-curve analyses.”
  • [6]:https://www.researchgate.net/publication/309275131_The_GRIM_Test_A_Simple_Technique_Detects_Numerous_Anomalies_in_the_Reporting_of_Results_in_Psychology “The GRIM Test: A Simple Technique Detects Numerous Anomalies in the Reporting of Results in Psychology”
  • [7]: https://peerj.com/preprints/2748/ “Statistical heartburn: An attempt to digest four pizza publications from the Cornell Food and Brand Lab”
  • [8]: https://github.com/MicheleNuijten/statcheck “MicheleNuijten/statcheck”
  • [9]: http://www.businessinsider.com/susan-fiske-methodological-terrorism-2016-9 “Scientists are furious after a famous psychologist accused her peers of ‘methodological terrorism'”
  • [10]: http://scchen.com/Text/text_2016005/ “擺姿勢也許能增加你的自信,但是不能真正改變你”
  • [11]: http://retractionwatch.com/2017/02/16/social-science-isnt-definitive-like-chemistry-embattled-food-researcher-defends-work/ “‘Social science isn’t definitive like chemistry:’ Embattled food researcher defends his work”
  • [12]: https://www.ted.com/talks/amy_cuddy_your_body_language_shapes_who_you_are “Amy Cuddy: Your body language shapes who you are.”
  • [13]: http://www.p-curve.com/ “P-curve.com”
  • [14]: https://www.ted.com/talks/ben_goldacre_battling_bad_science “Ben Goldarcre: Batting bad science.” [15]: http://journals.sagepub.com/doi/10.1177/0956797614553946 “Assessing the Robustness of Power Posing: No Effect on Hormones and Risk Tolerance in a Large Sample of Men and Women”
文章難易度
活躍星系核_96
752 篇文章 ・ 114 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

8
1

文字

分享

0
8
1
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
胡中行_96
152 篇文章 ・ 54 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

3
1

文字

分享

0
3
1
即便不認同群體意見,我們也不敢提出異議?「共識陷阱」創造了沉默的同意——《集體錯覺》
平安文化_96
・2023/01/14 ・2432字 ・閱讀時間約 5 分鐘

有些時候,沉默就是背叛。
——馬丁.路德.金(Martin Luther King Jr.)

「幫臉蛋打分數」實驗

想像一下,你是二○○○年代末的荷蘭大學生,有一天在上課的路上穿過社會科學院,看到一張召募受試者的海報,名字叫〈看見美麗〉,是一群社會心理學家在研究人類如何認知臉蛋的吸引力。平常就愛翻時尚雜誌的你,覺得自己實在不去不行,而且該實驗還在法國與義大利同步進行,實在太酷了,所以你立刻報了名。

受試內容非常簡單,一邊接受腦部掃描,一邊幫臉蛋打分數。圖/Envato Elements

幾天之後,研究團隊請你填一份健康調查,例如有沒有幽閉恐懼症之類,並安排實驗時間;實驗似乎非常簡單:一邊接受腦部掃描,一邊幫一大堆女生臉蛋的照片打分數。「這根本只是花一個小時滑社交軟體 Tinder 嘛。」你想著,這樣就能為科學做出貢獻,實在太好了。

實驗當天,一名穿著白袍的助手帶你進入房間,房裡有一張小小的床。床的旁邊是一個巨大的白色塑膠甜甜圈,洞的大小剛好可以塞進那張床。「這叫作功能性磁振造影,」助手表示,她請你躺在床上,遞給你兩個控制器,每個控制器上各有四個按鈕,上面分別寫著 1 到 8。

「接下來我們會放出許多照片,請你告訴我們每張照片有多吸引人,」她指著控制器上的按鈕,「毫無吸引力就打 1 分,非常吸引人就打 8 分;每張照片有三到五秒的時間回答。」她說完之後給你戴上耳機,在你頭上敲了幾下把耳機固定。你看了一下那個塑膠甜甜圈,裡面好像有個小螢幕。

「感覺如何?」耳機傳來助手的聲音。

「OK 啦,」你說,雖然你其實有點緊張,而且有點冷。

助手請你盡量保持安靜,然後整張床緩緩滑入了那個白色甜甜圈。

實驗在磁振造影機裡進行,令人感到有點緊張及不適。圖/Envato Elements

一分鐘後,甜甜圈裡的小螢幕亮了起來,出現一張女生的臉蛋照片,畫著濃妝面帶微笑,頭髮看起來油膩膩的;照片消失之後,你給照片打了六分,幾秒鐘後數字「8」亮了起來,旁邊寫著「+2」。看來「米蘭和巴黎的女性受試者」對這張臉的評價,平均比你高兩分。

「喔?」你皺起眉頭,「這樣啊?是我漏看什麼嗎?」

螢幕上出現第二張功能性磁振造影照片,你努力無視磁振造影機器的嗡嗡聲,繼續打分數。在那之後,照片一張又一張出現,就這樣經過了五十分鐘。

實驗完成之後你來到休息室,另一個助理突然走了進來,說要拜託你在沒有磁振造影機的情況下,把每張照片再打一次分數;他把你帶到另一個房間,確認你覺得舒服之後,以不同的順序給你看之前那些照片。

不過這次,那些「歐洲受試者給出的平均分數」消失了,而且沒有時間限制,每張照片你愛看多久就看多久。結束之後助手問你感覺如何,並感謝你的參與,你也很高興對科學做出貢獻。

大腦認為錯的意見

不過你做出貢獻的方式,其實跟你想的不太一樣。實驗結束之後你才知道,其實整個設定都是騙你的,這個實驗的真正目的,是研究你對臉蛋的評價會如何因為其他人的評價而改變。

實驗根本就沒有「歐洲各地同步進行」,那些「其他國家」或者什麼「米蘭和巴黎受試者的平均評分」全都是事先寫好規則的極端值,只是刻意為了跟你唱反調而已。但有趣的是,這個虛構設定的實驗,卻告訴了我們很多真實的事情。

實驗中的極端值只是刻意為了跟你唱反調而已。圖/Envato Elements

功能性磁振造影的掃描結果顯示,當我們發現自己偏離了主流意見,大腦就會在神經層次上,產生一種跟事與願違時相同的反應。

當事情的走向出乎預期,我們通常會認為是自己搞錯,這時大腦會把錯誤記錄下來,讓我們下一次不要再犯。這種機制在我們學習開車跟滑雪的時候很有用,卻會在社會之中造成麻煩:大腦會把與眾不同的意見當成錯誤的意見,讓我們下意識服從群體的共識。

因此,當我們重新幫同一疊照片評分,我們給出的分數就變得跟「歐洲各地的平均分數」更近,請注意這個設定的真正意義。這些「歐洲各地的受試者」並不是我們的內團體,「巴黎跟米蘭的女性受試者」遠在天邊,我們根本就不認識,即使意見不同也不用擔心被他們排擠,可是我們還是被影響了。

這表示即使「其他人」不在現場、不知道打哪來的、甚至根本就不存在,他們的意見還是能夠讓我們服從。

即使「其他人」不在現場、甚至根本不存在,他們的意見還是能讓人服從。圖/Envato Elements

這個實驗告訴我們,即使眼前是一群自己未必重視的群體,即使「主流意見」可能只是我們的錯覺,我們也會在意自己是否偏離。在社交場合,我們的大腦不會仔細檢查眼前的表象是否為真,只會照著本能做事。這種情況我稱之為「共識陷阱」(consensus trap)。

它會創造出另一種集體錯覺:不是奠基於謊言,而是奠基於沉默,讓我們為了保持沉默,最後搞到彼此誤解。這種沉默的共識很可怕,它讓我們搞不清楚自己做錯了什麼,畢竟我們既沒有盲從他人,也沒有假意迎合,只是保持沉默而已。

——本文摘自《集體錯覺:真相,不一定跟多數人站在同一邊!》,2022 年 12 月,平安文化出版,未經同意請勿轉載。

平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。

1

2
0

文字

分享

1
2
0
論文騙局:故弄玄虛的用字,就算內容都是假的一樣可以發表?——《集體錯覺》
平安文化_96
・2023/01/13 ・2144字 ・閱讀時間約 4 分鐘

精心策畫的論文騙局

1996 年,紐ㄝ大學物理學教授艾倫.索卡,在後現代研究期刊《社會文本》設計了一場論文騙局。圖/Envato Elements

一九九六年,紐約大學物理學教授艾倫.索卡(Alan D. Sokal)在後現代研究期刊《社會文本》(Social Text)上發表了一篇論文〈跨越邊界:朝向量子重力的轉形詮釋學〉(”Transgressing the Boundaries:Toward a Transformative Hermeneutics of Quantum Gravity” in the postmodern journal Social Text)。

根據論文摘要,你覺得這篇論文是在講什麼?

「本文的目標,是藉由探究量子重力的最新發展,進一步地深析指出,海森堡的量子力學和愛因斯坦廣義相對論,如今已經被合成和取代。本文將指出,在物理學的這項新興分支中,時空流形不再是客觀的物理實體;幾何學變成了仰賴脈絡的相對關係;過去科學的基本概念已經變成可以質疑的相對性範疇,就連存在本身也不例外。我認為這種觀念革命,對於後現代的自由科學,具有深遠意義。」

如果你覺得這整段話只是用一堆意義不明的術語堆砌起來的胡扯,恭喜你猜對了

索卡教授瞎掰了一篇論文,投稿到《社會文本》期刊,六名編輯審查之後決定接受,當成嚴肅的學術著作放在該期刊的特刊。

然後索卡發文說整件事都是他設計的騙局。他之所以煞費苦心做這種事,是為了要證明很多學術界的人都會用故作高深的方式騙取名聲。

索卡教授為了證明學術界會用故作高深的方式騙取名聲。圖/Envato Elements

住在拉普達裡的學者

強納森.斯威夫特(Jonathan Swift)在一七二六年的《格列佛遊記》(Gulliver’s Travels)就諷刺過這種事情,故事中的天空之城拉普達,住著一群偏執的學者和理論家,整天只會研究一些脫離現實的沒用東西。

索卡跟斯威夫特一樣虛構了很多荒謬的東西來諷刺這種現象,他在論文中塞進許多解構主義的流行術語:「偶然的」(contingent)、「反霸權的」(counterhegemonic)、「知識論的」(epistemological)。事後他對《紐約時報》表示,「這篇文章是在刻意模仿某些學者胡亂引述數學與物理概念的行為。我把這些胡扯連在一起,然後發明一個說法去吹捧。整篇文章完全不需要符合任何知識標準,也不需要符合邏輯,所以超好寫的。」

索卡一邊諷刺文化研究與文學批評期刊那種用字吹毛求疵的無聊文化,一邊用詰屈聱牙的高深術語來諷刺那些學界的派系鬥爭。學界彼此批判時候很愛使用一些沒人看得懂的術語,經常搞到即使是同領域的學者,也看不懂作者在說什麼。

索卡與《社會文本》高層兩方唇槍舌戰。圖/Envato Elements

事件發生之後,《社會文本》高層發表了一篇相當酸的回應:「索卡博士認為我們是知識相對主義者,他搞錯了。」共同創立該期刊的紐約大學教授史丹利.阿諾維茲(Stanley Aronowitz)表示,「而且這是因為他書讀得太少,學的東西也不夠多」。

索卡看到回應反唇相稽,「光是《社會文本》接受這篇文章,就已經證實那些後現代文學理論家的傲慢,已經誇張到可以無視邏輯。難怪他們從來不去問物理學家,那些引述物理的文字有沒有意義。在他們的世界裡,無法理解變成了某種美德;典故、隱喻、雙關語取代了證據跟邏輯。我的文章只是提供了一個例子,證明了這個流派多年以來的作風。」

學術界、法律界、醫學界這些白領人士,最容易被這種聲望連鎖反應所影響。當聲望決定一切,金字塔頂層的聲音就會過度放大,很多時候他們的說法可以廣傳,並不是因為說法有價值,而是因為其他人希望自己聽得懂他們在說什麼。即使其他專業人士聽不懂,通常也都會為了守住自己的飯碗而默默跟隨。

當聲望決定一切時,很多時候並不是因為說法有價值,而是其他人希望自己聽得懂他們在說什麼。圖/Envato Elements

扁桃體切除術就是個好例子。這種手術的效果欠缺科學根據,但因為「專業醫學意見」普遍認同,一度盛行了幾十年。在二十世紀最時興的時期,上百萬名兒童接受了扁桃體切除術,其中許多甚至因此受傷或死亡;直到某一天,醫學界才終於願意仔細檢查該手術的效果,然後很快就淘汰了它。

當我們為了保障自身聲譽而服從權威時,我們會相信某一套既定的敘事,聽不進任何新資訊,所以很容易繼續以訛傳訛。這種時候,敘事的真假並不重要,因為在其他人眼中,我們這群附和的人都是專家,不太可能搞錯。

不過雖然以訛傳訛的效力很大,但它並非無懈可擊的高牆,反而更像一座疊疊樂——只要抽掉那根關鍵的木條,整座塔就會瞬間崩毀。

——本文摘自《集體錯覺:真相,不一定跟多數人站在同一邊!》,2022 年 12 月,平安文化出版,未經同意請勿轉載。

所有討論 1
平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。