0

2
0

文字

分享

0
2
0

人為逼出研究的顯著結果:「披薩門」事件是怎麼一回事?

活躍星系核_96
・2017/04/07 ・4445字 ・閱讀時間約 9 分鐘 ・SR值 547 ・八年級

編按:本文事件起因於曾出版過科普書《 瞎吃》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在2016 年 11 月 21 日刊登在個人部落格的文章:「永不說『不』的研究生」(原文已遭刪除,Cornell的事件處理相關資訊在此)。此文中汪辛克教授簡述了他與研究生合作的成果,而此篇研究與披薩有關,因此本文標題「披薩門」,為作者借用哥倫比亞大學統計學教授、知名學術部落客安德魯.蓋爾曼(Andrew Gelman)從 2017 年 1 月 31 號起,在個人部落格對此事件的稱呼「Pizzagate」[1]。

圖/Yoshihide Nomura @ Flickr
  • 文/ 陳紹慶,慈濟大學人類發展與心理學系助理教授、開放科學中心大使(Center for Open Science Ambassador)

如果你是位關心人類飲食習慣研究最新資訊的科普作家,在2016年11月21日看到出版暢銷書《瞎吃:為什麼我們吃下去的比心裡想的還要多(Mindless Eating: Why We Eat More Than We Think)》的康乃爾大學布萊恩.汪辛克教授(Brian Wansink)在個人部落格張貼的文章「永不說“不”的研究生」,應該會想寫篇文章轉述教授與這位研究生的合作成果。轉述內容必定會引用這篇文章提到的論文,以及評論為何一夥人想聚餐吃披薩,總是以吃到飽餐廳做為首選。

康乃爾大學布萊恩.汪辛克教授(Brian Wansink)的著作《 瞎吃(Mindless Eating: Why We Eat More Than We Think)》。 圖/Amazon

然而汪辛克教授的首版部落格文章,有幾段文字吸引了近幾年學術圈內惡名昭彰的方法學恐怖份子(methodological terrorists)注意;2017 年開始沒有幾天,文章裡提到的四篇論文就被挑出多達 150 筆錯誤的統計數字。汪辛克看到這篇尚未經同儕審查的論文[7],完全無法辯解被指出的錯誤,只能在原始部落格文章兩度發佈追加致歉訊息,還有向各方聲明會針對出現錯誤的四篇論文,檢討自己的研究方法與指導學生的方式,並召集人員重新進行核實研究[11]。也有關心社會科學假報告揭發爭議的媒體記者,向大學及實驗室公關請求採訪汪辛克本人有關數據為何出錯的細節,汪辛克卻做出二十多年以來首次閃避媒體採訪的舉動[4]。

汪辛克在個人部落格說了什麼話而引起這新一波學術爭議?論文中的錯誤怎麼被人挑出來?「方法學恐怖份子」又是何方神聖?

公開示範人為逼出的顯著結果(p-hacking)

汪辛克在部落格文章提到剛發表的五篇論文,是與一位來自土耳其,與他短期合作的研究生,一起分析一批以前在某家義式餐廳收集完成的資料。

-----廣告,請繼續往下閱讀-----

文章中提到當時他對這位研究生說「收集這些資料花了很多時間與經費,因為這批資料裡可以挖出很多酷玩意,我們應該能做點什麼補救。」

  • (“This cost us a lot of time and our own money to collect. There’s got to be something here we can salvage because it’s a cool (rich & unique) data set.”)。

他們的討論過程提到幾個可能的補救方式,也提到如果這位研究生願意出手的話,汪辛克期望看到的分析結果與圖表是什麼模樣。

  • (“I told her what the analyses should be and what the tables should look like. I then asked her if she wanted to do them.”)

這段現在看起來像是不打自招的說法,看在方法學恐怖份子眼裡,馬上就察覺這不就是人為逼出顯著結果的標準作業程序?也就是為了得到小於顯著水準的 p 值,資料分析過程裡不擇手段修改與增減研究資料的一切行為。

社會科學,特別是社會心理學,已經有好幾起受到大眾媒體青睞的主題,起初被發現當成鐵證的原始研究結果,最後被證實是人為過度操作資料分析的產物。像是丹尼爾.卡尼曼(Daniel Kahneman)在暢銷著作《快思慢想》(Thinking, Fast and Slow)引用約翰.巴赫(John Bargh)的老年化促發(Elderly Priming),因為這一系列的相關論文報告列出的多數 p 值恰好接近顯著水準(比如0.04),已被專業統計方法認證是人為逼出的顯著結果[5]。

-----廣告,請繼續往下閱讀-----
透過恣意的增減統計數據,來達成人為逼出的顯著結果。圖/Matt McGee @ Flickr

統計數據錯誤太多而導致的胃食道逆流(Statistical heartburn)

兩位荷蘭博士生,提姆.凡迪利(Tim van de Zee)與尼克.布朗(Nick Brown),加上一位美國的統計學家喬丹.安那亞(Jordan Anaya)決定合作破解這些論文是不是人為逼出顯著結果的謎題。

尼克.布朗與其指導教授在 2016 年於社會心理與人格科學(Social Psychological and Personality Science)發表一篇論文,介紹偵測心理學論文中報告的平均值,與其報告的樣本數不一致程度的方法:GRIM測試[6]。喬丹將 GRIM 測試結合網路爬蟲程式,開發出可探勘大量文獻並挑出錯誤的應用軟體。看了汪辛克的部落格文章之後,他們與提姆決定要好好檢視汪辛克列出的其中四篇論文,因為他們研判這四篇的資料來源應該是同一家餐廳的現地實驗(Field Experiment)。

在 2017 年 1 月 27 日公開尚未經同儕審查的手稿,三人簡述曾向汪辛克主持的實驗室索取原始資料,卻被婉拒的過程。這個轉折之後,三人決定使用手邊能運用的壞科學探測器(Bad Science Detectors [註1])檢查論文之中的數據。除了喬丹開發的程式,還有荷蘭蒂爾堡大學的博士生蜜雪兒.諾特(Michele Nuijten)開發,用來檢查 t 分數等統計值是否有計算錯誤的應用程式 statcheck[8]。

最後,他們從四篇論文挑出 150 項錯誤,大多數錯誤是圖表中的樣本數與正文報告的樣本數兜不攏,還有同一筆資料在不同表格列出的平均值與樣本數彼此不一致。如果讀者是在大學裡教統計的老師們,甚至是在中小學教數學的老師們,看到幾十頁的數據和圖表充滿這樣的錯誤,想必都需要趕緊來一錠「吉胃服適」。

-----廣告,請繼續往下閱讀-----
提姆等人掃瞄汪辛克過去19年(1997~2016)的著作,挑出的錯誤圖表拼圖。請點擊看大圖。圖/Tim van der Zee 個人部落格

方法學恐怖份子從何而來?

提姆、尼克、與喬丹的行動完美揭發虛假科學報告,讓世人減少被虛假科學消息誤導的機會。但是對於像汪辛克等成名已久,習慣傳統社會科學研究模式的學者們來說,這種行徑猶如恐怖行動。

普林斯頓大學的資深社會心理學教授蘇珊.費斯克(Susan Fiske),曾在 2016 年 9 月被人發現,本來要發表在心理科學學會(Association of Psychological Science)的學會會員刊物專欄文章裡,草稿曾使用方法學恐怖主義(methodological terrorism)一詞,形容這些公開挑論文數據錯誤、指出某項研究無法再現等非常規學術發表樣態[9]。

這項消息見報的時機,也剛好發生蘇珊.費斯克的高徒艾美.柯蒂(Amy Cuddy)的成名作《權力姿勢效應(power posing effect)》,其昔日同儕戴娜.卡奈(Dana Carney)公開坦承「權力姿勢效應是虛假的效應」的事件[10]。

艾美.柯蒂曾於 2012 年在 TED 演講擺出高權力姿勢的好處[12],從此成為家喻戶曉的社會心理學教授。事件發生之前一年,其他實驗室發表以比原始研究多出四倍的樣本數,卻無法再現原始研究的結果[15],接著一系列研究的 p 值被其他學者使用另一種壞科學探測器 P-Curve[13] 分析之後,確定是無真正顯著結果的效應,因此造成昔日同儕與艾美.柯蒂分道揚鑣。現在的艾美.柯蒂在美國大眾的形象,有些像南韓世越號事件發生之後的朴槿惠,有興趣的讀者可留意演講影片[12]下方的討論留言,看到近幾個月要求影片下架與支持艾美.柯蒂的意見相互交鋒,也許哪天她從演講權力姿勢效應得到的光環會徹底消失。

-----廣告,請繼續往下閱讀-----

科普圈如何面對另類事實

布萊恩.汪辛克與艾美.柯蒂向大眾傳達的資訊,在中文世界,或者至少是台灣的科普圈,依然被多數閱聽者認為是科學事實。科普文章與專業科學論文一樣,要傳遞的是真實的科學知識。即使是由實驗室裡的科學家,親自面向大眾介紹最新研究成果,讀者也要保持求真的意志,而非以內容夠不夠新奇,傳播者有沒有名氣來判斷內容的價值。

然而這對處於專業科學家與讀者之間的科普作家,將帶來更巨大的挑戰。雖然沒有明確規範,科普作家應當具備比一般讀者更好的批判能力,研判科學成果的真實性,特別是許多作家身兼大學教師或研究生,甚至是第一線科學家的身份。不過現在的事實是,多數中文讀者認識布萊恩.汪辛克與艾美.柯蒂,主要是透過這群科普作家的著作及演講,也因此相信這兩人的「研究成果」是有助個人生命成長的正面建議。

我並非在此否定這群科普作家的貢獻,只想藉由說明這些事件,提醒現在的中文科普是不是已經來到必須升級的時刻。除了傳達最新的科學知識,科普作家也要負起啟發讀者辨識科學資訊真實性的責任。在個人與群體之間交換資訊的各種場域,許多科普作家應該能預見查核資訊真實性的實際方法無法配合傳達真實知識的理想,而衍生各種問題。要如何掌握與解決這些問題,還需要更多的資訊與討論,不過我相信隨著這類事件不斷浮現,問題的輪廓將越來越清晰。

  • [註1]:壞科學探測器(Bad Science Detectors)一詞出自英國醫師與科普作家班.高達可(Ben Goldacre)的著作《壞科學》(Bad Science)。有興趣的讀者可參考班.高達可的TED演講

原文刊載於作者部落格,原文為披薩門:「瞎吃」教主的完美自爆

-----廣告,請繼續往下閱讀-----

  • [1]: http://andrewgelman.com/2017/02/03/pizzagate-curious-incident-researcher-response-people-pointing-150-errors-four-papers-2/ “Pizzagate, or the curious incident of the researcher in response to people pointing out 150 errors in four of his papers.”
  • [2]: http://andrewgelman.com/2016/12/15/hark-hark-p-value-heavens-gate-sings/ “Hark, hark! the p-value at heaven’s gate sings.”
  • [3]: http://www.brianwansink.com/phd-advice/the-grad-student-who-never-said-no “The grad student who never say ‘no’.”
  • [4]: http://www.chronicle.com/article/Spoiled-Science/239529 “Spoiled Science.”
  • [5]: http://ssrn.com/abstract=2381936 or http://dx.doi.org/10.2139/ssrn.2381936 “Lakens, D. (2014). Professors are not elderly: Evaluating the evidential value of two social priming effects through p-curve analyses.”
  • [6]:https://www.researchgate.net/publication/309275131_The_GRIM_Test_A_Simple_Technique_Detects_Numerous_Anomalies_in_the_Reporting_of_Results_in_Psychology “The GRIM Test: A Simple Technique Detects Numerous Anomalies in the Reporting of Results in Psychology”
  • [7]: https://peerj.com/preprints/2748/ “Statistical heartburn: An attempt to digest four pizza publications from the Cornell Food and Brand Lab”
  • [8]: https://github.com/MicheleNuijten/statcheck “MicheleNuijten/statcheck”
  • [9]: http://www.businessinsider.com/susan-fiske-methodological-terrorism-2016-9 “Scientists are furious after a famous psychologist accused her peers of ‘methodological terrorism'”
  • [10]: http://scchen.com/Text/text_2016005/ “擺姿勢也許能增加你的自信,但是不能真正改變你”
  • [11]: http://retractionwatch.com/2017/02/16/social-science-isnt-definitive-like-chemistry-embattled-food-researcher-defends-work/ “‘Social science isn’t definitive like chemistry:’ Embattled food researcher defends his work”
  • [12]: https://www.ted.com/talks/amy_cuddy_your_body_language_shapes_who_you_are “Amy Cuddy: Your body language shapes who you are.”
  • [13]: http://www.p-curve.com/ “P-curve.com”
  • [14]: https://www.ted.com/talks/ben_goldacre_battling_bad_science “Ben Goldarcre: Batting bad science.” [15]: http://journals.sagepub.com/doi/10.1177/0956797614553946 “Assessing the Robustness of Power Posing: No Effect on Hormones and Risk Tolerance in a Large Sample of Men and Women”
文章難易度
活躍星系核_96
752 篇文章 ・ 122 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

3
2

文字

分享

0
3
2
論文好多看不完?研究生的救星!用 AI 幫你分析統整!
泛科學院_96
・2023/10/14 ・761字 ・閱讀時間約 1 分鐘

近期科技界最熱烈討論的新聞,應該就屬韓國有研究單位宣布找到了新的室溫常壓超導體 LK-99 ,聽說可以在一般的高中大學實驗室中完成。這讓我不禁好奇它的製作原理,但,大部分的朋友應該跟我一樣都不是專業材料工程人員,看不懂論文怎麼辦呢?除了等泛科學出影片,別忘了我們有 AI 呀!今天我要來分享一套專門訓練來閱讀論文的 AI —— SciSpace Copilot。

今天的影片簡單的跟大家分享了基於 GPT 技術且針對閱讀學術文章進行特別優化的 AI —— SciSpace ,我只要遇到研究型文章都會特別開這個工具起來使用,其他的大語言模型都無法做到如此細緻。我覺得生成式人工智慧的未來就會到處是這種基於某種目的,比如讀論文,使用某個大模型進行微調 Fine-Tuning 之後的小模型,將會協助我們解決各種問題。

是說現在的研究生做研究的工具真是越來越多,你會想要把這支影片分享給你的指導老師看嗎?
歡迎你把使用的經驗與想法在影片下方留言與我分享!

也歡迎加入泛科學院的頻道會員,或者科學AI的Discord論壇,一起討論交流。

-----廣告,請繼續往下閱讀-----

如果這支影片對你有幫助的話,請幫我在影片下方點個喜歡,或是透過超級感謝展現你的心意,讓我製作更多實用有趣的 AI 教學影片,最後別忘了訂閱泛科學院的頻道,我們下支影片再見囉。

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

泛科學院_96
31 篇文章 ・ 40 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

10
2

文字

分享

0
10
2
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

-----廣告,請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

-----廣告,請繼續往下閱讀-----
Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
胡中行_96
169 篇文章 ・ 65 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

4
1

文字

分享

0
4
1
即便不認同群體意見,我們也不敢提出異議?「共識陷阱」創造了沉默的同意——《集體錯覺》
平安文化_96
・2023/01/14 ・2432字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

有些時候,沉默就是背叛。
——馬丁.路德.金(Martin Luther King Jr.)

「幫臉蛋打分數」實驗

想像一下,你是二○○○年代末的荷蘭大學生,有一天在上課的路上穿過社會科學院,看到一張召募受試者的海報,名字叫〈看見美麗〉,是一群社會心理學家在研究人類如何認知臉蛋的吸引力。平常就愛翻時尚雜誌的你,覺得自己實在不去不行,而且該實驗還在法國與義大利同步進行,實在太酷了,所以你立刻報了名。

受試內容非常簡單,一邊接受腦部掃描,一邊幫臉蛋打分數。圖/Envato Elements

幾天之後,研究團隊請你填一份健康調查,例如有沒有幽閉恐懼症之類,並安排實驗時間;實驗似乎非常簡單:一邊接受腦部掃描,一邊幫一大堆女生臉蛋的照片打分數。「這根本只是花一個小時滑社交軟體 Tinder 嘛。」你想著,這樣就能為科學做出貢獻,實在太好了。

實驗當天,一名穿著白袍的助手帶你進入房間,房裡有一張小小的床。床的旁邊是一個巨大的白色塑膠甜甜圈,洞的大小剛好可以塞進那張床。「這叫作功能性磁振造影,」助手表示,她請你躺在床上,遞給你兩個控制器,每個控制器上各有四個按鈕,上面分別寫著 1 到 8。

「接下來我們會放出許多照片,請你告訴我們每張照片有多吸引人,」她指著控制器上的按鈕,「毫無吸引力就打 1 分,非常吸引人就打 8 分;每張照片有三到五秒的時間回答。」她說完之後給你戴上耳機,在你頭上敲了幾下把耳機固定。你看了一下那個塑膠甜甜圈,裡面好像有個小螢幕。

-----廣告,請繼續往下閱讀-----

「感覺如何?」耳機傳來助手的聲音。

「OK 啦,」你說,雖然你其實有點緊張,而且有點冷。

助手請你盡量保持安靜,然後整張床緩緩滑入了那個白色甜甜圈。

實驗在磁振造影機裡進行,令人感到有點緊張及不適。圖/Envato Elements

一分鐘後,甜甜圈裡的小螢幕亮了起來,出現一張女生的臉蛋照片,畫著濃妝面帶微笑,頭髮看起來油膩膩的;照片消失之後,你給照片打了六分,幾秒鐘後數字「8」亮了起來,旁邊寫著「+2」。看來「米蘭和巴黎的女性受試者」對這張臉的評價,平均比你高兩分。

-----廣告,請繼續往下閱讀-----

「喔?」你皺起眉頭,「這樣啊?是我漏看什麼嗎?」

螢幕上出現第二張功能性磁振造影照片,你努力無視磁振造影機器的嗡嗡聲,繼續打分數。在那之後,照片一張又一張出現,就這樣經過了五十分鐘。

實驗完成之後你來到休息室,另一個助理突然走了進來,說要拜託你在沒有磁振造影機的情況下,把每張照片再打一次分數;他把你帶到另一個房間,確認你覺得舒服之後,以不同的順序給你看之前那些照片。

不過這次,那些「歐洲受試者給出的平均分數」消失了,而且沒有時間限制,每張照片你愛看多久就看多久。結束之後助手問你感覺如何,並感謝你的參與,你也很高興對科學做出貢獻。

-----廣告,請繼續往下閱讀-----

大腦認為錯的意見

不過你做出貢獻的方式,其實跟你想的不太一樣。實驗結束之後你才知道,其實整個設定都是騙你的,這個實驗的真正目的,是研究你對臉蛋的評價會如何因為其他人的評價而改變。

實驗根本就沒有「歐洲各地同步進行」,那些「其他國家」或者什麼「米蘭和巴黎受試者的平均評分」全都是事先寫好規則的極端值,只是刻意為了跟你唱反調而已。但有趣的是,這個虛構設定的實驗,卻告訴了我們很多真實的事情。

實驗中的極端值只是刻意為了跟你唱反調而已。圖/Envato Elements

功能性磁振造影的掃描結果顯示,當我們發現自己偏離了主流意見,大腦就會在神經層次上,產生一種跟事與願違時相同的反應。

當事情的走向出乎預期,我們通常會認為是自己搞錯,這時大腦會把錯誤記錄下來,讓我們下一次不要再犯。這種機制在我們學習開車跟滑雪的時候很有用,卻會在社會之中造成麻煩:大腦會把與眾不同的意見當成錯誤的意見,讓我們下意識服從群體的共識。

-----廣告,請繼續往下閱讀-----

因此,當我們重新幫同一疊照片評分,我們給出的分數就變得跟「歐洲各地的平均分數」更近,請注意這個設定的真正意義。這些「歐洲各地的受試者」並不是我們的內團體,「巴黎跟米蘭的女性受試者」遠在天邊,我們根本就不認識,即使意見不同也不用擔心被他們排擠,可是我們還是被影響了。

這表示即使「其他人」不在現場、不知道打哪來的、甚至根本就不存在,他們的意見還是能夠讓我們服從。

即使「其他人」不在現場、甚至根本不存在,他們的意見還是能讓人服從。圖/Envato Elements

這個實驗告訴我們,即使眼前是一群自己未必重視的群體,即使「主流意見」可能只是我們的錯覺,我們也會在意自己是否偏離。在社交場合,我們的大腦不會仔細檢查眼前的表象是否為真,只會照著本能做事。這種情況我稱之為「共識陷阱」(consensus trap)。

它會創造出另一種集體錯覺:不是奠基於謊言,而是奠基於沉默,讓我們為了保持沉默,最後搞到彼此誤解。這種沉默的共識很可怕,它讓我們搞不清楚自己做錯了什麼,畢竟我們既沒有盲從他人,也沒有假意迎合,只是保持沉默而已。

-----廣告,請繼續往下閱讀-----

——本文摘自《集體錯覺:真相,不一定跟多數人站在同一邊!》,2022 年 12 月,平安文化出版,未經同意請勿轉載。

平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。