搞笑諾貝爾獎每年都是新的開始,2019 年也不例外。今年「第 29 次第一屆搞笑諾貝爾獎」一共頒發 10 個獎項,心理學獎得主 Fritz Strack 的得獎理由是:
「發現嘴上咬著一支筆表現出笑的樣子,會讓人變快樂—然後又發現沒這回事(for discovering that holding a pen in one’s mouth makes one smile, which makes one happier — and for then discovering that it does not.)」。1
哈哈哈哈哈還真的 hen 好笑,不過就像大部分獲得搞笑諾貝爾獎的研究,這也是個很認真,毫無搞笑意圖的研究。這個獎的背後,可以牽連到最近幾年熱門的「重複性危機」(又稱「再現性危機」),以及一些值得科學界深思的問題。
「臉部回饋假說」測試:一支筆,一部片
整個問題的根本,在於情緒與表情的關係。一個人心情好會表現笑臉,心情不好則表現哭臉,是非常符合直覺,也早已被證實的現象。然而,有人認為反過來也成立:不只情緒影響表情,表情也會影響情緒;一個人假如表現出笑的樣子,將感到更快樂;如果表現沮喪的樣子,也會變得更加沮喪。
此一假說被稱作「臉部回饋假說(facial feedback hypothesis)」,一個人快樂的時候會笑,笑了又會更快樂!但是該如何測試快樂正回饋假說呢?
1988 年的時候,Fritz Strack 與他快樂的夥伴們 Leonard Martin 和 Sabine Stepper,一同發表了一道經典實驗,證實臉部回饋假說正確。他們設計的實驗非常簡單,裝備只需要一支筆,以及一部卡通。2
研究人員用了些技巧,在不影響情緒的狀況下,讓受測者表現出笑臉或愁眉苦臉。他們將受測者分為兩群:一群用牙齒咬著筆,如此臉部動作就會類似快樂的笑;另一群則是用嘴唇含著筆,臉部就會呈現類似愁眉苦臉的樣貌。
接著,再播放同一部卡通,讓受測者判斷卡通有多好笑,由最難笑的 0 分給到最好笑的 9 分。最終統計結果是,牙齒咬筆組比起嘴唇含筆組,評分會更高 0.82 分,達到顯著差異。意謂臉部展現出笑的表情,會讓人情緒感到更快樂,證實了臉部回饋假說。
無法重複的實驗
對心理學有點認識的人應該知道,許多學界最近面臨「重複性危機」,而心理學是這個爭議的主要戰場之一。某些心理學實驗的結果,換組人做就不一樣。那麼這些結論到底可不可信,相關的衍生研究及應用又該如何看待?
一部片一支筆實驗支持臉部回饋假說,在 1988 年發表以後成為心理學的經典實驗,被學界普遍接受,至今被引用高達 2042 次,卻長期沒有被人用一樣的方法重複過。後來有人復刻這個經典實驗,發表於 2016 年,重複實驗的結果卻與原本的結論不一致。3
更大規模的新測試中,共有世界各地 17 組研究者參加,總共紀錄到 1894 位受測者。結果 17 組中只有 9 組的效果是正面的,另外 8 組反而是負面影響。
所有受測者一起分析的結果是,笑臉牙齒咬筆組與哭臉嘴唇含筆組,兩邊只差 0.03 分,標準差則是介於 -0.11 到 0.16;也就是說,臉部表現出笑的表情,不會讓人覺得卡通更好笑,反之亦然。
因此最終結論:「發現嘴上咬著一支筆表現出笑的樣子,會讓人變快樂──然後又發現沒這回事。」
結果無法重複怎麼辦?Why so serious?
然而,無法重複當年的結果,不直接意謂當年的實驗就是錯的,也不等於臉部回饋假說是錯的。當初經典實驗的作者之一 Fritz Strack 在 2017 年發表一篇很認真的文章,探討相關的議題,然後使他獲得 2019 年的搞笑諾貝爾獎。4 ????
為什麼心理學實驗無法重複?Fritz Strack 認為有三個可能性,第一是蓄意造假,當然 1988 年的三位作者並沒有造假。另外還有兩種可能,第二個可能是:原本的結果不是真的,並非正確的效應;第三種可能是:原本的效應太弱,由於不夠強,導致在不同的實驗脈絡下無法重現。
這兩種可能性的差異在於,無法重複的舊結論,一種是假的,另一種是真的。倘若舊實驗得到的結果是假的,又不是蓄意造假,那麼可能是偽陽性所致,也就是機率問題。
也有可能舊實驗看到的結果,事實上是正確的,影響力卻太過微弱,會受到每次實驗時不同的外在條件影響,導致無法每一次重複都成功。
驗證假說採取的實驗效果該有多強,又取決於目的。比方說,假如目的是測試臨床藥物,那麼排除不同條件的外在影響,找到強效的測試辦法就很重要;但是如果目的是檢驗理論的基礎研究,實驗方法的強度就相對沒那麼要緊。
- 延伸閱讀:偽陽性誤判太多,調降p值門檻就好?
重複性危機其實被高估?
考量到研究的發表,又是另一個層面。眾所皆知,會被期刊接受發表的論文,多半報告的是有差異的結果(positive result),假如做出的研究品質非常好,卻是沒有差異的結果(negative result),被接受的機率將低得多。
同樣的道理,在重複前人的研究中,會被接受而問世的論文,大部分不是順利重複,得到與前人一致的結果,而是無法複製,推翻過往的研究。也因此,我們會見到「很高比例論文的結果無法再現」這類新聞的標題,而實際狀況或許沒有這麼嚴重。
對科學發展更有建設性的思考方向或許是:
無法再現的研究能有什麼意義?
讓心理學再次偉大,該怎麼做?
有關於自己的實驗無法被重複,造成的影響,Fritz Strack 感到不樂觀,不過理由大概不是你想的那樣。
他的想法是,效果強的實驗容易被重複,效果弱的實驗不容易複製;假如心理學家們因此被鼓勵去多做強效的實驗,將使得心理學轉往更偏應用性的方向,與創新理論漸行漸遠。
倘若心理學研究結果只是單純考慮效果強弱,不能導引出批判性的辯論,那麼這樣的研究,對於了解科學問題的內涵,將無法帶來太多幫助。另一方面,過度強調重複性危機,也會讓公眾對心理學研究失去信心。
2016 年《Annual Review of Psychology》的序言中提到:
「再現失敗不是科學的問題;而是找出條件限制與情境效應的良機。(A replication failure is not a scientific problem; it is an opportunity to find limiting conditions and contextual effects.)」
新的研究如果無法重複舊的結果,將是重新審視此一問題,引發討論的機會,若是能藉此帶來新的想法更好。證實之前的實驗方法在一種情境適用,另一種狀況不能用,比單純打臉以前結果是錯的更有意義。
Fritz Strack 認為如今的心理學,真正面臨的危機其實是「知識論危機(epistemological crisis)」,將科學論述限制於概率模型(probabilistic model),期望由數據直接獲取真相。心理學在這套觀點下或許會退化為,只重視一系列有強有弱的效應與現象,而不再探索人類行為的基本定律。心理學界必需著重在有意義的科學問題,才能開創更好的科學。
每一位科學研究者都應該質問自己:科學研究的目的究竟是什麼,我們該研究怎麼樣的科學?不論你認同不認同 Fritz Strack 的看法,都可以思考思考他的觀點。
話說回來,這個搞笑諾貝爾奬還真的有夠嚴肅的,沒辦法,科學家的搞笑就是這麽樸實無華且枯燥。
2019 年搞笑諾貝爾獎頒獎典禮(心理學獎從 1:09:51 開始)
延伸閱讀
參考文獻
- The 2019 Ig Nobel Prize Winners
- Strack, F., Martin, L. L., & Stepper, S. (1988). Inhibiting and facilitating conditions of the human smile: a nonobtrusive test of the facial feedback hypothesis. Journal of personality and social psychology, 54(5), 768.
- Wagenmakers, E. J., Beek, T., Dijkhoff, L., Gronau, Q. F., Acosta, A., Adams Jr, R. B., … & Bulnes, L. C. (2016). Registered Replication Report: Strack, Martin, & Stepper (1988). Perspectives on Psychological Science, 11(6), 917-928.
- Strack, F. (2017). From Data to Truth in Psychological Science. A Personal Perspective. Frontiers in psychology, 8, 702.
本文亦刊載於作者部落格《盲眼的尼安德塔石匠》暨其 facebook 同名專頁。