0

文字

繁 | 简

0

透視科學

演進中的科學研究方法(4/4) – 運用巨量資料評價實驗結果的再現性

活躍星系核・2014/08/08 ・4129字・閱讀時間約 8 分鐘・SR值 537

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

Credit:Paul Mison CC BY-NC-SA 2.0 — Credit: Paul Mison CC BY-NC-SA 2.0

文/ 陳紹慶（慈濟大學人類發展學系專任助理教授）

前三篇文章討論難以透過統計分析顯現的實驗效應，有可能是統計分析方法的限制，或者實驗方法還不能穩定再現實驗效應，或者實驗效應本來就很微弱。如果某種實驗效應有明確的理論意義，實際發生的案例故事告訴我們，曾經面對如此困境的研究者，會冒著竄改或假造資料數據的風險，爭取發表的機會，或者坦然面對同儕審查的考驗，投稿數十寒暑皆無法發表的「暗無天日」歲月。無論是那種狀況，對於科學知識的前進，或是科學研究者的生涯進程都是一種損耗。到底有沒有讓微弱但有意義的實驗效應，又能兼顧研究品質與誠信的研究及發表程序？使認真做實驗的研究者可以不走險路，發表再現性經得起同儕考驗的研究呢？

最後這一篇介紹二種有研究者或組織正在嘗試的方式，認識這些方式能理解考自已正在接受的科學新知是在什麼樣的狀況所產生的。因為我自已是從事行為科學領域的研究與教學，介紹的內容侷限於這領域的方法，如果讀者在其它科學領域涉獵已有一定程度，可做個比較，看看能不能從其中獲得啟發。

一、先登錄再現研究（Registered Replication Research）

我曾經在〈可重覆的實驗結果是科學進步的基礎？〉這篇文章介紹兩位心理學者，Rolf Zwaan與Daniel Simons，發起並參與先登錄再現研究（Registered Replication Research）的過程所產生的討論，這次一起合作重現Hart與Albarracin於2011年發表在Pscyhological Science的原創性研究。這份研究設計兩篇內容相同的犯罪情節報導，一篇描述嫌疑犯意圖行為的動詞以未完成時貌描寫（imperfect aspect，例如 was doing），另一篇的動詞以完成時貌描寫（perfect aspect，例如did）。參與者隨機閱讀其中一篇報導，接著進行缺字母填空作業（例如將S _ _ P，中間缺少的兩個字母補起來），評估報導中主角的行為動機，或評估報導中犯人與受害者之間的意圖理解。三種評估都顯示閱讀用未完成時貌描寫的報導，參與者的表現分數都高於閱讀另一種報導的參與者，Hart與Albarracin稱此為未完成時貌效應（effect of imperfect aspect）。Zwann與Simons參與的這個專案，就是在不同實驗室以相同的程序及材料，測試此效應的再現性。

-----廣告，請繼續往下閱讀-----

寫這篇文章的時候這個專案還在進行中，我的介紹重點放在串連合作研究者的平台：open science framework （以下簡稱OSF），以及參與專案的研究與專業期刊的合作模式。OSF是一家非營利組織，成立於2011年，辦公室位於美國維吉尼亞州Charlottesville，採用github的運作架構，提供註冊的研究者組織合作研究的平台。現在已有結案的研究專案發表正式論文，例如之前我曾介紹的Many Lab Project（Klein et al., 2014）。Zwann與Simons都有參與的這個專案更是採用APS公布的預先登錄研究規劃協議（Pre-registered Protocol），專案成立之初就登錄於psychological science，投稿程序也同時開始，所有共同合作者都是未來通過psychological science的審查程序後，論文的共同作者。

不僅是研究完成後的原始數據，研究準備到執行的過程一切公開透明，不僅可維持研究誠信，因為投稿程序也同時展開，也可以加速實驗完成之後的審查時程。但是這種模式有研究題材的侷限性，最明顯的是專案題目一定要有明確預測結果的假設及實驗效應，因此再現已發表但多數研究者依然質疑的研究是最可能成案的題目，如果研究結果會牽涉科學發現產生的公益之外的利益，例如這篇blog提到的藥物開發研究，能否成案的因素有非科學的商業或政治因素考量。

為了達到參與專案的合作研究者都能在最接近的研究條件進行實驗，像是相同型號的電腦設備，個別差異條件接近的參與者，執行實驗的成本必定不能太高。因為每位合作者擁有的資源條件都不相同，需要高檔配備的神經電位紀錄或腦部活動造影研究，很難達成跨實驗室的共同再現。所以至目前為止經過OSF平台「揪團」的專案，多數是透過網路施測，或在個人電腦進行實驗的研究。而且除非主題有普世性，並非所有有意願的研究者都能合作。當重現Hart與Albarracin的專題開放徵求合作者時，我曾致信詢問專案發起人能否將實驗材料轉換為中文，找母語為中文的人士參與實驗，探討有無動詞時貌效應。果不其然得到無法合作的回覆，不過專案發起人肯定在不同語言文化背景中，探討有沒有存在類似效應的想法，也許中文地區的心理學者可以合作進行一個新的題目。

二、巨量研究（Mega Study）

實驗心理學的巨量研究是一種實驗讓有能力的人類產生反應的所有刺激，分批呈現給參與者，紀錄而得的資料庫，可以說是數個小實驗組合而成的超大型實驗。這種研究方式的概念可以追溯到實驗心理學的祖師爺Wilhelm Wundt，上個世紀末研究字詞閱讀的語言心理學家們開始使用這種方法突破不同小型實驗結果不一致的限制，方法就是請參與實驗的人員，對學過所有的母語詞彙（英語），進行真假詞判斷（Lexicon decision）與朗讀（reading aloud），參與者對每一條字詞的反應時間與錯誤反應，都用規劃好的紀錄方式儲存為資料庫。

-----廣告，請繼續往下閱讀-----

在此介紹兩種語言心理學的巨量研究實例。第一種是由單一實驗團隊完成的英文詞彙專案（English Lexicon Project），這是由華盛頓大學聖路易校區的David Balota教授領導的團隊收集815位的參與者對40,481個英文真詞與40,481個英文假詞進行的反應，讓有興趣應用的研究者能檢索這些資料，或者運用有理論意義的拼寫或拼音規則，從資料庫選擇可做小型實驗的詞彙。所以這個專案絕對沒有把所有心理學者的實驗都做盡，反而產生新的實驗操作指標，例如orthographic Levenshtein distance 20 (OLD 20，Yarkoni, Balota, and Yap, 2008)。

這個指標的定義非專業人士要理解會有些困難，但指標帶來的後續研究對科學新知有興趣的人者會想了解。OLD 20是評價英文詞彙之間外形相似度的量尺，如果用中文字類比，OLD 20可以告訴我們「王」與「玉」的外形相似度，和「王」與「主」的外形相似度是不同的，而且可以用數字表達相似的程度。這個指標比只用筆劃或字母的差異的相似度基準，提供更明確的計量尺度，之後引用這個指標的著名研究是法國Grainger教授領導的團隊，進行的狒狒識字實驗（Grainger, Dufau, Montant, Ziegler, and Fagot, 2012），泛科學的編輯也曾做過中文報導，只是不論中英文報導都沒有寫到Grainger教授是用OLD 20挑選給狒狒的實驗材料，以及做為分析狒狒識字反應的指標。如果因為我的解說，能促成研究中文的心理學家挑戰台灣彌猴的識字能力研究，也是不錯的貢獻。

另一種實例是跨實驗室團隊的合作成果，類似先登錄再現研究的模式，但是參與合作者不只關切一種或數種實驗的再現，而是所有能產生反應的刺激，以及長期以來相關的實驗研究因為程序的設定而有不一致的發現，例如呈現刺激的時間控制。語義促發（Semantic priming ，Hutchison et al., 2013）和遮蔽促發（Masked priming，Adelman et al., 2014）是這類代表，兩者都是讓要反應的刺激項目跟在呈現促發項目（probe 或 prime word）之後呈現，測量促發項目與刺激項目有關（例如「護士-醫生」，「蝴蝶-蜜蜂」）與兩者無關產生的反應差異。語義促發的項目之間時間差距較長（至少200毫秒），關聯性的操作以字詞語義為主；遮蔽促發的項目之間時間差距極短（約50毫秒左右），關聯性的操作以字詞外形相似度為主。兩種實驗分別用於探討晚期語義處理與早期知覺歷程，有心理學者提出整合兩者的理論，但直到今天還是以專注於一種歷程的理論與實驗方法的研究最有成果，也累積不少爭議。舉遮蔽促發的一項爭議，有英文字詞辨識是一個字母接著一個字母處理的理論，還是整體一起處理的理論。兩種理論的壁壘分明，傳統同儕審查很可能會使其中一方過度挑另一方的毛病，造成「不見天日」的問題。

Adelman等人合作的遮蔽促發巨量研究就有突破「不見天日」的目的，不僅納入已被兩方廣泛接受的實驗效應，也同時測量有爭議的實驗效應。這種模式可稱為「母雞帶小雞」，不是指學術界大咖帶領小咖，而是再現程度高的穩定實驗效應，與再現程度低但有理論意義的實驗效應放在一起測量。同時也能嘗試小型實驗少用的分析方法，例如這份遮蔽促發的巨量研究是供參與的各實驗室設備與參與者個別差異參數，各式已知的字詞外形相似度指標（如OLD 20），與各種實驗效應的相關性分析，讓其它研究者能探討有爭議的實驗效應為何微弱的原因。

-----廣告，請繼續往下閱讀-----

三、新世代的學習思維

實驗結果的可再現性是所有科學知識能被人類記載與傳達的基礎，行為科學的複雜度讓多數理論不易獲得有穩定再現的實驗證據支持，因此有先登錄再現研究與巨量研究的出現，補充小型實驗無法呈現所有可能性的侷限，這系列的前三篇說明這些侷限與研究者設定可驗證假設的否證哲學有關。小型實驗依然是研究者最能掌握的知識工具，這篇文章介紹的例子都顯示先登錄再現研究與巨量研究是開拓新題材的作業模式，大量資料為微弱實驗效應的再現性提供充份的評估，讓需要驗證或不易發表的小型研究有獲得肯定的機會。

傳統學習實驗的設計與分析的方針是再現經典小型實驗效應，著重實驗操作細節的安排與分析方法的演練，不過缺乏對實驗主題演進的體認。我認為這樣的體認才能刺激學習者產生對知識現狀的了解，並提出新的問題與解決方法。先登錄再現研究不只完整公開研究過程，也強調有意願合作者必須理解參與過程的責任，如果能將這種模式落實於學習或訓練，不但能培養後進研究者鑑賞研究題目的眼光，以及執行研究過程應遵守的誠篤原則。我寫這四篇文章的期許是未來能培養有此見識的科學研究者，這樣的科學家才有能力將自已專攻的知識領域，真正落實在自已身處的社會環境之中。

參考文獻

Adelman, J., Johnson, R., McCormick, S., McKague, M., Kinoshita, S., Bowers, J., . . . Davis, C. (2014). A behavioral database for masked form priming. Behavior Research Methods, 1-16. doi: 10.3758/s13428-013-0442-y
Balota, D. A., Yap, M. J., Hutchison, K. A., Cortese, M. J., Kessler, B., Loftis, B., … Treiman, R. (2007, 12). The English Lexicon Project. Behavior Research Methods,39(3), 445-459. doi: 10.3758/BF03193014
Grainger, J., Dufau, S., Montant, M., Ziegler, J. C., & Fagot, J. (2012, 12). Orthographic Processing in Baboons (Papio papio). Science,336(6078), 245-248. doi: 10.1126/science.1218152
Hart, W., & Albarracin, D. (2011, 12). Learning About What Others Were Doing: Verb Aspect and Attributions of Mundane and Criminal Intent for Past Actions. Psychological Science,22(2), 261-266. doi: 10.1177/0956797610395393
Hutchison, K. A., Balota, D. A., Neely, J. H., Cortese, M. J., Cohen-Shikora, E. R., Tse, C., … Buchanan, E. (2013, 12). The semantic priming project. Behavior Research Methods,45(4), 1099-1114. doi: 10.3758/s13428-012-0304-z
Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., . . . Nosek, B. A. (2014). Investigating Variation in Replicability. Social Psychology, 45(3), 142-152. doi: 10.1027/1864-9335/a000178
Yarkoni, T., Balota, D., & Yap, M. (2008, 12). Moving beyond Coltheart’s N: A new measure of orthographic similarity. Psychonomic Bulletin & Review,15(5), 971-979. doi: 10.3758/PBR.15.5.971

延伸閱讀

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

活躍星系核

752 篇文章・ 122 位粉絲

活躍星系核（active galactic nucleus, AGN）是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍，在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。本帳號發表來自各方的投稿。附有資料出處的科學好文，都歡迎你來投稿喔。 Email: contact@pansci.asia

TRENDING 熱門討論

即時熱門

1

0

1

文字

1

0

1

傳說「吃鳳梨可對抗飛蚊症」，這個「研究結果」搞錯了些什麼？

Mr. S ・2019/05/30 ・4002字・閱讀時間約 8 分鐘・SR值 543

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

最近幾日，一篇有關吃鳳梨可以減緩或消滅飛蚊症的文章在各個社群媒體瘋傳，大概看了不下五則貼文，覺得實在不對勁，就看了一下原始論文。不看不知道，一看不得了，這實在不是一個嚴謹的研究，研究結果必須要打上一個大問號。如果這種似是而非的結論，加上媒體的渲染，可能會造成一些負面結果。至於有哪些懷疑的根據與擔心，就請看下去。

編按：相關的網路新聞如下，族繁不及備載

蘋果新聞網【獨家】吃鳳梨改善飛蚊症　台研究登美醫學期刊
ETtoday新聞雲影／飛蚊症超煩！台研究：吃鳳梨可「溶解黑點點」　登美國科學期刊
東森新聞飛蚊症掰掰！台研究：吃鳳梨減少症狀7成
TVBS 健康2.0 最新！鳳梨可改善飛蚊症　每天吃「這個量」就夠了，糖尿病友也可吃
聯合新聞網元氣網國內研究指吃鳳梨改善飛蚊症狀但目前仍不鼓勵取代治療
華視新聞【台語新聞】台研究: 吃鳳梨改善飛蚊症登美國期刊
中時電子報吃鳳梨顧眼睛還有助腸胃保健
三立手機成癮患者多…吃鳳梨可治飛蚊症　台研究登上美國期刊
聯合新聞網吃鳳梨治飛蚊症有效？醫師：勿延誤就醫治療
聯合新聞網台研究稱鳳梨能治飛蚊症？教授：酵素不可能跑到眼睛
早安健康吃鳳梨竟可治飛蚊症？眼科醫師解惑了
ETtoday新聞雲「吃鳳梨治飛蚊症」遭教授打臉：酵素不會跑到眼睛！研究作者回應了

什麼是飛蚊症？

眼球中有很大部分充滿著無色透明的膠狀物質，稱作玻璃體（vitreous body），正常情況下的玻璃體是澄清的，可以讓光線通過，在視網膜上成象。如果今天因為一些原因，讓玻璃體中的液體不再澄清，有一些懸浮物，就會影響成象，就好像眼前出現一隻打不到的蚊子一樣。

飛蚊症的成因，主要有幾種：玻璃體混濁（有懸浮物）、周邊組織出血流入玻璃體、周邊視網膜破裂、玻璃體後脫離（posterior vitreous detachment，PVD）。

「吃鳳梨可對抗飛蚊症」文章來源

這一篇文章，標題是「Pharmacologic vitreolysis of vitreous floaters by 3-month pineapple supplement in Taiwan: a pilot study」，由輔英科技大學附設醫院眼科主治醫師洪啟庭、大仁科技大學藥學系陳福安、郭代璜、謝博銓教授、陳立材助理教授、中山醫學大學視光學系黃宣瑜教授，另外還有一位作者是政府官員：高雄市社會局長葉壽山；文章發表於 Journal of American Science。

-----廣告，請繼續往下閱讀-----

文章內容：固定吃鳳梨，減少飛蚊症？！

文章中找了共 388 位受試者，分成兩組，一組依照分成玻璃體內懸浮物多寡，再分成兩小組，每天固定吃兩塊 100 克的鳳梨；另一組再分成三小組，分別給予每天 120、240、360 克的鳳梨。兩組每個月各追蹤一次，總共追蹤三個月。最後發現到了第三個月，所有組別的懸浮物數量都有減少，好轉人數比例 54.5% 到 74.2% 不等；玻璃體懸浮物有所減少的人數，與開始吃鳳梨前，呈現顯著減少關係。在討論中，作者也舉了一些關於鳳梨酵素（bromelain，鳳梨蛋白酶）的研究，試圖解釋實驗結果與機轉，最後作者做出以下的宣稱：

鳳梨酵素可以為人類飛蚊症、PVD 與玻璃體纖維化帶來新的研究觀點。
持續食用鳳梨有助於飛蚊症的改善。
這篇研究是全世界第一篇提出「每日補充鳳梨，可以作為目前飛蚊症常規醫療之外的便宜另類療法」的文章。
（原文：Our studies revealed that the pineapple supplement every day can offer a cheap alternative to current therapies for the vitreous floaters which is the first report in the world.）

感覺好像期刊論文該有的格式與格局都有了，但是細細一看，其中大有疑竇。

「吃鳳梨可對抗飛蚊症」發表的文章乍看之下格式跟描述像有這麼回事，但其中值得懷疑的點很多。Photo via Good Free Photos

此研究值得懷疑的要點

1. 沒有交代受試者背景

一開始的介紹提到了，造成飛蚊症有許多的原因，其實就連玻璃體混濁，也有許多成因。文章中沒有提到這些飛蚊症患者的病因或背景，就連男女與年紀比例都沒有提到。

2. 研究缺乏對照組

國小、國中就教過了，做實驗必須要有對照組，才可以知道應變變因和操縱變因之間的關係。簡單來說，如果飛蚊症病人在實驗期間照常生活，但不吃鳳梨三個月，他們的飛蚊症會不會也改善了？這篇文章沒辦法回答。

-----廣告，請繼續往下閱讀-----

在醫學研究中，大家可能有聽過安慰劑（placebo），這就屬於一種對照組實驗會使用的方法。另外，如果一開始設計實驗時，就想探究鳳梨的某個特定成分（例如鳳梨酵素）會不會才是改善飛蚊症的主要因子，也可以加入測試，會讓說服力大於僅止在討論章節中進行文獻探討。

3. 統計方法的錯用

在這邊使用了變異數分析（analysis of variance, ANOVA），但以這份資料的型態，一般不會使用 ANOVA 分析。

4. 措辭誇張異常

從文章第一句「 This survey is the first one in world……」，到文章討論也可見「the first report in the world」，似乎作者興奮得想向全世界展示這份研究成果，文中也可見其他似乎不必要的溢美詞句；搭配結果讀來，似乎少了一些期刊的嚴謹性。
如果這篇真的是確確實實的世界 number 1，大可以投到頂尖期刊如《新英格蘭醫學雜誌》（NEJM, IF=79.258）、《刺胳針》（The Lancet, IF=53.254），或者眼科界的頂尖期刊《British Journal of Ophthalmology》（IF=3.384）啊！為何會投在一篇比較少人聽聞的期刊呢？

5. 許多令人感到不可思議的錯誤

隨便看看，就可以發現不少錯字與格式不一致。

-----廣告，請繼續往下閱讀-----

文章一開頭的作者服務單位，中山醫學大學附設醫院被打成了「Chunmg Shan Medical Hospital」，多了一個 m。
表格中的 1st 和 2rd，前者有上標，後者沒有，那到底是要不要上標？
表格中的「3rd」竟然寫成「3th」，原本的 rd 還誤植到 2 那邊！這是國小高年級的英文課內容吧，這種錯誤太不應該。
93 頁尾，Müller and his ci-workers also found……，應該是想寫 co-workers 吧！

6. 期刊編審素質堪憂

看到那麼多的謬誤，除了作者要負一部份責任，期刊編輯也是。一篇被刊出的文章可以被找到那麼多荒謬的錯誤，編輯責無旁貸，也說明了這家期刊的編審素質堪憂。

再看看這期的文章列表頁面，發現這篇文章的標題同時是第 3 篇與第 10 篇，差別就是作者之一的葉壽山局長在第 10 篇被拿掉了；而第 2 和第 5 篇根本是完全一模一樣的文章。這家期刊的編輯還好嗎？把文章重複放在期刊中，是想要衝出版量嗎？

話說回來，這到底是哪家期刊？

The Journal of American Science 這家期刊自 2005 年創立，到今年也活到了第 15 年。

再來很功利地看看所謂的期刊影響因子（impact factor, IF），這家期刊在 Journal Citation Reports 網站中，沒有找到任何影響因子數字，可能未達收錄標準，實在是和作者那個誇張的宣稱無法匹配。

-----廣告，請繼續往下閱讀-----

在查詢過程中發現一件很有趣的事。關於這個期刊的資訊並不多，但另外查到一個名字很像的期刊《American Journal of Science》，成立於 1818 年，是地球科學界的老牌頂尖期刊了，2017 年的 IF 值高達 3.893。看到這邊，是不是要懷疑一下這個《The Journal of American Science》，有沒有可能屬於之前引起廣泛討論的「掠奪型期刊」（predatory journals）？

還真的是掠奪型期刊啊！

掠奪性期刊與出版社，常披著開放取用、出版的理念與經營模式到處邀稿，藉此收入論文處理費，獲取大量的金錢利益。這些期刊大多數重量不重質，缺乏完整的同儕審閱（peer-review）與編審流程，常常是繳了錢，文章就可以被刊登、出版。

這些掠奪性期刊除了繳錢就可刊之外，名字常常取得跟頂尖期刊一樣，常讓投稿者混淆，最後只好付錢了事，根本就像上了詐騙集團的當一樣。

近年來學界越來越重視掠奪型期刊議題，也統整了一些掠奪性期刊的名冊，可以讓研究者在投稿前先行檢查，以免踩雷。這邊查找了許多人使用的兩個清單：HBI list for Predatory Journals 與 Beall’s List，發現這個期刊和出版商 Marsland Press 赫然版上有名。

-----廣告，請繼續往下閱讀-----

搭啦！原來這個「全世界第一篇」的研究，可能是個詐騙呢！

關於「掠奪性期刊」，還可參考中研院訊〈不可不慎的掠奪性出版〉

媒體報導沒有說出來的問題

雖然被我們發現這篇文章可能是個詐騙，但偏偏許多媒體的標題十分吸引注意力，彷彿每天乖乖吃鳳梨就可以扭轉飛蚊症。從前面的幾個質疑，可以知道「每天食用鳳梨」與「改善飛蚊症」之間的因果關係尚不明確（連有沒有關聯都要打上問號），因此可能沒辦法期待每天吃鳳梨三個月之後，眼前打不到的蚊子會因此變少。

鳳梨雖然含有豐富的維他命 C 與纖維，但也含有比較高的糖份，如果長期、大量食用，可能讓體重悄悄上升。

另外，鳳梨的升糖指數也高（65），而飛蚊症的患者有一大部分是年長者，可能同時有糖尿病，這時候就要非常小心地控制鳳梨的食用量；如果因為看到心無標題就開始大量吃鳳梨，對於血糖控制相當不利，這是看到報導後應該要擔心的。

-----廣告，請繼續往下閱讀-----

鳳梨的糖份相對來說比較高，長期大量食用也不太好啊。圖／photo by Claudia caloclau@Pixabay

結語：正視飛蚊症，但別輕信新聞啊

總體而言，有個新聞讓大家正視飛蚊症，或許是件好事，但看到有些不合理的措辭，就要再三小心。

就算沒有把原始文獻找來看，也應當諮詢醫師，綜合評估後，再考慮是否選擇其他輔助治療措施。

相關資料

期刊原始文獻連結（建議不要邊吃飯邊看，有可能氣到吃不下）

附上熱心網友補充的文章與報導：

-----廣告，請繼續往下閱讀-----

林慶順教授的質疑
ptt 上的回文（也是引用林慶順教授的文章）
吃鳳梨治飛蚊症有效？醫師：勿延誤就醫治療
偷渡之前寫的小文章，關於鳳梨為甚麼會咬舌頭的猜測

本文轉載自 FB專頁儲思盆的胡思亂想〈吃鳳梨對抗飛蚊症？還是建議看醫生〉

發表意見

所有討論 1

登入與大家一起討論

#1

黃豊淯 2021/08/20

澳洲工程師因飛蚊症憂鬱到想死台日聯手讓他減輕症狀
https://health.udn.com/health/story/5970/5676357?from=udn-referralnews_ch1005artbottom

住澳洲東海岸的28歲工程師Ahnaf5年來飽受飛蚊症困擾到想輕生，後來在網路上看到日本防衛醫科大學與台灣合作研發的口服綜合水果蛋白酶能增強人體吸收眼睛玻璃體混濁機能，抱一絲希望寫信求助，信件轉至台灣參與研究的輔英科大附醫眼科醫師洪啟庭手中，洪展開跨海協助，解決這名工程師的眼疾困擾，重新恢復正常生活。

Mr. S

5 篇文章・ 0 位粉絲

是個喜歡到處看看、隨便想想，不務正業的小勾椎；希望能把知識的可愛美好之處與大家分享。有一方小小儲思盆，歡迎來看看。

TRENDING 熱門討論

即時熱門

0

文字

0

演進中的科學研究方法(4/4) – 運用巨量資料評價實驗結果的再現性

活躍星系核・2014/08/08 ・4129字・閱讀時間約 8 分鐘・SR值 537

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

文/ 陳紹慶（慈濟大學人類發展學系專任助理教授）

前三篇文章討論難以透過統計分析顯現的實驗效應，有可能是統計分析方法的限制，或者實驗方法還不能穩定再現實驗效應，或者實驗效應本來就很微弱。如果某種實驗效應有明確的理論意義，實際發生的案例故事告訴我們，曾經面對如此困境的研究者，會冒著竄改或假造資料數據的風險，爭取發表的機會，或者坦然面對同儕審查的考驗，投稿數十寒暑皆無法發表的「暗無天日」歲月。無論是那種狀況，對於科學知識的前進，或是科學研究者的生涯進程都是一種損耗。到底有沒有讓微弱但有意義的實驗效應，又能兼顧研究品質與誠信的研究及發表程序？使認真做實驗的研究者可以不走險路，發表再現性經得起同儕考驗的研究呢？

最後這一篇介紹二種有研究者或組織正在嘗試的方式，認識這些方式能理解考自已正在接受的科學新知是在什麼樣的狀況所產生的。因為我自已是從事行為科學領域的研究與教學，介紹的內容侷限於這領域的方法，如果讀者在其它科學領域涉獵已有一定程度，可做個比較，看看能不能從其中獲得啟發。

一、先登錄再現研究（Registered Replication Research）

我曾經在〈可重覆的實驗結果是科學進步的基礎？〉這篇文章介紹兩位心理學者，Rolf Zwaan與Daniel Simons，發起並參與先登錄再現研究（Registered Replication Research）的過程所產生的討論，這次一起合作重現Hart與Albarracin於2011年發表在Pscyhological Science的原創性研究。這份研究設計兩篇內容相同的犯罪情節報導，一篇描述嫌疑犯意圖行為的動詞以未完成時貌描寫（imperfect aspect，例如 was doing），另一篇的動詞以完成時貌描寫（perfect aspect，例如did）。參與者隨機閱讀其中一篇報導，接著進行缺字母填空作業（例如將S _ _ P，中間缺少的兩個字母補起來），評估報導中主角的行為動機，或評估報導中犯人與受害者之間的意圖理解。三種評估都顯示閱讀用未完成時貌描寫的報導，參與者的表現分數都高於閱讀另一種報導的參與者，Hart與Albarracin稱此為未完成時貌效應（effect of imperfect aspect）。Zwann與Simons參與的這個專案，就是在不同實驗室以相同的程序及材料，測試此效應的再現性。

-----廣告，請繼續往下閱讀-----

寫這篇文章的時候這個專案還在進行中，我的介紹重點放在串連合作研究者的平台：open science framework （以下簡稱OSF），以及參與專案的研究與專業期刊的合作模式。OSF是一家非營利組織，成立於2011年，辦公室位於美國維吉尼亞州Charlottesville，採用github的運作架構，提供註冊的研究者組織合作研究的平台。現在已有結案的研究專案發表正式論文，例如之前我曾介紹的Many Lab Project（Klein et al., 2014）。Zwann與Simons都有參與的這個專案更是採用APS公布的預先登錄研究規劃協議（Pre-registered Protocol），專案成立之初就登錄於psychological science，投稿程序也同時開始，所有共同合作者都是未來通過psychological science的審查程序後，論文的共同作者。

不僅是研究完成後的原始數據，研究準備到執行的過程一切公開透明，不僅可維持研究誠信，因為投稿程序也同時展開，也可以加速實驗完成之後的審查時程。但是這種模式有研究題材的侷限性，最明顯的是專案題目一定要有明確預測結果的假設及實驗效應，因此再現已發表但多數研究者依然質疑的研究是最可能成案的題目，如果研究結果會牽涉科學發現產生的公益之外的利益，例如這篇blog提到的藥物開發研究，能否成案的因素有非科學的商業或政治因素考量。

為了達到參與專案的合作研究者都能在最接近的研究條件進行實驗，像是相同型號的電腦設備，個別差異條件接近的參與者，執行實驗的成本必定不能太高。因為每位合作者擁有的資源條件都不相同，需要高檔配備的神經電位紀錄或腦部活動造影研究，很難達成跨實驗室的共同再現。所以至目前為止經過OSF平台「揪團」的專案，多數是透過網路施測，或在個人電腦進行實驗的研究。而且除非主題有普世性，並非所有有意願的研究者都能合作。當重現Hart與Albarracin的專題開放徵求合作者時，我曾致信詢問專案發起人能否將實驗材料轉換為中文，找母語為中文的人士參與實驗，探討有無動詞時貌效應。果不其然得到無法合作的回覆，不過專案發起人肯定在不同語言文化背景中，探討有沒有存在類似效應的想法，也許中文地區的心理學者可以合作進行一個新的題目。

二、巨量研究（Mega Study）

實驗心理學的巨量研究是一種實驗讓有能力的人類產生反應的所有刺激，分批呈現給參與者，紀錄而得的資料庫，可以說是數個小實驗組合而成的超大型實驗。這種研究方式的概念可以追溯到實驗心理學的祖師爺Wilhelm Wundt，上個世紀末研究字詞閱讀的語言心理學家們開始使用這種方法突破不同小型實驗結果不一致的限制，方法就是請參與實驗的人員，對學過所有的母語詞彙（英語），進行真假詞判斷（Lexicon decision）與朗讀（reading aloud），參與者對每一條字詞的反應時間與錯誤反應，都用規劃好的紀錄方式儲存為資料庫。

-----廣告，請繼續往下閱讀-----

在此介紹兩種語言心理學的巨量研究實例。第一種是由單一實驗團隊完成的英文詞彙專案（English Lexicon Project），這是由華盛頓大學聖路易校區的David Balota教授領導的團隊收集815位的參與者對40,481個英文真詞與40,481個英文假詞進行的反應，讓有興趣應用的研究者能檢索這些資料，或者運用有理論意義的拼寫或拼音規則，從資料庫選擇可做小型實驗的詞彙。所以這個專案絕對沒有把所有心理學者的實驗都做盡，反而產生新的實驗操作指標，例如orthographic Levenshtein distance 20 (OLD 20，Yarkoni, Balota, and Yap, 2008)。

這個指標的定義非專業人士要理解會有些困難，但指標帶來的後續研究對科學新知有興趣的人者會想了解。OLD 20是評價英文詞彙之間外形相似度的量尺，如果用中文字類比，OLD 20可以告訴我們「王」與「玉」的外形相似度，和「王」與「主」的外形相似度是不同的，而且可以用數字表達相似的程度。這個指標比只用筆劃或字母的差異的相似度基準，提供更明確的計量尺度，之後引用這個指標的著名研究是法國Grainger教授領導的團隊，進行的狒狒識字實驗（Grainger, Dufau, Montant, Ziegler, and Fagot, 2012），泛科學的編輯也曾做過中文報導，只是不論中英文報導都沒有寫到Grainger教授是用OLD 20挑選給狒狒的實驗材料，以及做為分析狒狒識字反應的指標。如果因為我的解說，能促成研究中文的心理學家挑戰台灣彌猴的識字能力研究，也是不錯的貢獻。

另一種實例是跨實驗室團隊的合作成果，類似先登錄再現研究的模式，但是參與合作者不只關切一種或數種實驗的再現，而是所有能產生反應的刺激，以及長期以來相關的實驗研究因為程序的設定而有不一致的發現，例如呈現刺激的時間控制。語義促發（Semantic priming ，Hutchison et al., 2013）和遮蔽促發（Masked priming，Adelman et al., 2014）是這類代表，兩者都是讓要反應的刺激項目跟在呈現促發項目（probe 或 prime word）之後呈現，測量促發項目與刺激項目有關（例如「護士-醫生」，「蝴蝶-蜜蜂」）與兩者無關產生的反應差異。語義促發的項目之間時間差距較長（至少200毫秒），關聯性的操作以字詞語義為主；遮蔽促發的項目之間時間差距極短（約50毫秒左右），關聯性的操作以字詞外形相似度為主。兩種實驗分別用於探討晚期語義處理與早期知覺歷程，有心理學者提出整合兩者的理論，但直到今天還是以專注於一種歷程的理論與實驗方法的研究最有成果，也累積不少爭議。舉遮蔽促發的一項爭議，有英文字詞辨識是一個字母接著一個字母處理的理論，還是整體一起處理的理論。兩種理論的壁壘分明，傳統同儕審查很可能會使其中一方過度挑另一方的毛病，造成「不見天日」的問題。

Adelman等人合作的遮蔽促發巨量研究就有突破「不見天日」的目的，不僅納入已被兩方廣泛接受的實驗效應，也同時測量有爭議的實驗效應。這種模式可稱為「母雞帶小雞」，不是指學術界大咖帶領小咖，而是再現程度高的穩定實驗效應，與再現程度低但有理論意義的實驗效應放在一起測量。同時也能嘗試小型實驗少用的分析方法，例如這份遮蔽促發的巨量研究是供參與的各實驗室設備與參與者個別差異參數，各式已知的字詞外形相似度指標（如OLD 20），與各種實驗效應的相關性分析，讓其它研究者能探討有爭議的實驗效應為何微弱的原因。

-----廣告，請繼續往下閱讀-----

三、新世代的學習思維

實驗結果的可再現性是所有科學知識能被人類記載與傳達的基礎，行為科學的複雜度讓多數理論不易獲得有穩定再現的實驗證據支持，因此有先登錄再現研究與巨量研究的出現，補充小型實驗無法呈現所有可能性的侷限，這系列的前三篇說明這些侷限與研究者設定可驗證假設的否證哲學有關。小型實驗依然是研究者最能掌握的知識工具，這篇文章介紹的例子都顯示先登錄再現研究與巨量研究是開拓新題材的作業模式，大量資料為微弱實驗效應的再現性提供充份的評估，讓需要驗證或不易發表的小型研究有獲得肯定的機會。

傳統學習實驗的設計與分析的方針是再現經典小型實驗效應，著重實驗操作細節的安排與分析方法的演練，不過缺乏對實驗主題演進的體認。我認為這樣的體認才能刺激學習者產生對知識現狀的了解，並提出新的問題與解決方法。先登錄再現研究不只完整公開研究過程，也強調有意願合作者必須理解參與過程的責任，如果能將這種模式落實於學習或訓練，不但能培養後進研究者鑑賞研究題目的眼光，以及執行研究過程應遵守的誠篤原則。我寫這四篇文章的期許是未來能培養有此見識的科學研究者，這樣的科學家才有能力將自已專攻的知識領域，真正落實在自已身處的社會環境之中。

參考文獻

Adelman, J., Johnson, R., McCormick, S., McKague, M., Kinoshita, S., Bowers, J., . . . Davis, C. (2014). A behavioral database for masked form priming. Behavior Research Methods, 1-16. doi: 10.3758/s13428-013-0442-y
Balota, D. A., Yap, M. J., Hutchison, K. A., Cortese, M. J., Kessler, B., Loftis, B., … Treiman, R. (2007, 12). The English Lexicon Project. Behavior Research Methods,39(3), 445-459. doi: 10.3758/BF03193014
Grainger, J., Dufau, S., Montant, M., Ziegler, J. C., & Fagot, J. (2012, 12). Orthographic Processing in Baboons (Papio papio). Science,336(6078), 245-248. doi: 10.1126/science.1218152
Hart, W., & Albarracin, D. (2011, 12). Learning About What Others Were Doing: Verb Aspect and Attributions of Mundane and Criminal Intent for Past Actions. Psychological Science,22(2), 261-266. doi: 10.1177/0956797610395393
Hutchison, K. A., Balota, D. A., Neely, J. H., Cortese, M. J., Cohen-Shikora, E. R., Tse, C., … Buchanan, E. (2013, 12). The semantic priming project. Behavior Research Methods,45(4), 1099-1114. doi: 10.3758/s13428-012-0304-z
Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., . . . Nosek, B. A. (2014). Investigating Variation in Replicability. Social Psychology, 45(3), 142-152. doi: 10.1027/1864-9335/a000178
Yarkoni, T., Balota, D., & Yap, M. (2008, 12). Moving beyond Coltheart’s N: A new measure of orthographic similarity. Psychonomic Bulletin & Review,15(5), 971-979. doi: 10.3758/PBR.15.5.971

延伸閱讀

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

活躍星系核

752 篇文章・ 122 位粉絲

活躍星系核（active galactic nucleus, AGN）是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍，在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。本帳號發表來自各方的投稿。附有資料出處的科學好文，都歡迎你來投稿喔。 Email: contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

文字

0

華萊士難題：演化，是否停格在人類頭上？——《你不知道我們有多聰明》

PanSci ・2017/12/21 ・5947字・閱讀時間約 12 分鐘・SR值 538

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

新創世論雖然沒有明確表明，但它假定演化已停格在人類頭上。圖／Valerie@Flickr

由於中斷觀點（discontinuity stance）本質上屬於前演化（pre-evolutionary），我就直接把它稱為新創世論（Neo-Creationism）吧。千萬別把新創世論和智能設計論（Intelligent Design）混為一談，後者只是舊瓶裝新酒的創世論。新創世論比較巧妙，因為它接受了半套的演化論，其中新教條是我們的身體演化自猿類，但是我們的心智並非如此。雖然沒有明確表明，但它假定演化已停格在人類頭上。

在許多社會科學、哲學和人文學科領域，這種想法依然普遍。新創世論認為人類心智是如此原創，除了為其確立特殊地位之外，將人類心智與其他動物相比並沒有任何意義。既然明明沒有能夠比較之處，我們為何還需要關心其他物種？這種跳躍式觀點是基於人類必定在演化過程中發生了重大變化而與猿類分道揚鑣，這個過程可能是在近幾百萬年間。儘管這種神奇變化籠罩著神祕色彩，但今日已被授予一個專有名詞－－「人化作用」（hominization），其中經常伴隨了火花、間隔和鴻溝等詞彙。該領域的現代學者顯然不敢提到什麼神聖的火花，更不敢說「特殊創造論」（special creation），但仍然很難撇除此一立場背後的宗教影響。

在生物學中，「演化停格在人類頭上」的概念被稱為華萊士難題。

一顆能譜曲、算數的大腦，是生存必需的嗎？

艾爾弗雷德．羅素．華萊士（Alfred Russel Wallace）是與達爾文生活在同一時代的偉大英國自然學家，被認為與達爾文同是天擇演化的發想者。事實上，天擇的概念也被稱為達爾文-華萊士理論。儘管華萊士毫無疑問地支持演化論，但是他為人類心智領域畫上一條界線。他對所謂的「人類尊嚴」抱持強烈情感，無法忍受拿猿類來與人類做比較。達爾文認為，所有特徵都是功利主義的產物，只有生存才是真正的必要條件，但華萊士認為此規則必定有例外—－那就是人的心智。

為何生活單純的人類，需要一顆能夠譜寫交響樂或計算數學的大腦？他寫道：「天擇，只賦予野蠻人稍微優於猿類的大腦，然而，也許這些野蠻人實際上擁有一顆不輸上流社會人士的大腦。」在東南亞旅行期間，華萊士開始對非使用文字的民族產生高度敬重，他認為我們之間「沒有差多少」的觀念，在當時盛行的種族主義觀點下是一項重大進展，當時認為這些野蠻民族的智力介於猿類和西方國家人民之間。雖然華萊士並無宗教信仰，但他將人類的高超智力歸因於「看不見的精神世界」。他認為人的靈魂幾乎無從解釋。達爾文對於看到他所尊敬的同僚援引上帝之手（無論以何種方式呈現）深感不安。他覺得根本不需要任何超自然的解釋，可是華萊士難題仍然潛伏在學術界四周，意圖讓人類心智擺脫生物學的束縛。

-----廣告，請繼續往下閱讀-----

我最近前往聆聽一位著名哲學家的演講，聽眾大多為「意識」主題慕名而來，沒想到他在演講時突然提及人類在這方面「明顯」遠高於其他物種。我感到疑惑而搔了搔頭，這樣的說法代表他對於靈長類動物的看法其實有著矛盾，因為這位哲學家給人們的印象是正試圖尋找意識演化的成因。演講中，他提到大腦存在龐大的交互作用，指出意識源於神經相連的數量和複雜度。有位機器人專家也說過類似的話，認為如果電腦擁有足夠數量的微晶片，必定會出現類似意識的現象。我頗為願意相信這番言論，只是目前似乎無人知道如何從連結中產生意識，也不確定意識到底是什麼。

萬物之靈的大腦，有什麼特別的嗎？

若是把重點放在神經的連結，我不禁懷疑要如何看待腦部比人類的 1.35 kg 還重的動物。海豚的腦有 1.5 kg 重、大象 4 kg 、抹香鯨 8 kg，難道這些動物比我們「更有意識」嗎？還是該取決於神經元的數量？我們在這方面的了解還不足。過去我們一直以為，即使不考慮腦的大小，人類腦部的神經元數量是所有物種中最多的，後來發現大象腦部神經元的數量是我們的三倍－—高達兩千五百七十億個。不過，這些神經元的分布位置與我們有異，大象的神經元多分布在小腦。厚皮動物（如大象）的腦部如此巨大，有人推測其中的連結分布非常廣泛，就像額外加上的高速公路系統，大大增加複雜度。

面對人類腦部，我們往往強調被譽為理性所在的額葉（frontal lobe），但額葉在最新的解剖報告中並沒有那麼特別。目前，研究人員認為人類腦部是靈長類動物的「線性放大」，這表示人類不同腦區的大小比例和靈長類動物並無不同。總而言之，神經連結的差別似乎不足以支持人類獨特性的論點。如果我們真的能找到測量意識的方法，可能還會發現到意識是很普遍的現象，在那之前，我們可以參考達爾文提出的某些理論。

我並非否認人類的獨特性，在某些方面我們確實具有獨特性。不過，若是抱持這樣的假設看待所有生物的認知能力，我們便將遠離科學領域而進入信仰範疇。身為任職於心理學系的生物學家，我通常以不同方式探究這個問題。生物學、神經科學和醫學領域都默認了連續性（continuity）。若非如此，治療人類恐懼症時，為何要在實驗室研究大鼠杏仁核（amygdala）對於恐懼的反應？能如此實驗的前提，當然就是所有哺乳類動物的腦部皆相似。對這些領域而言，所有物種間的連續性是理所當然的，就算人類有多麼重要，也不過是全體自然界裡的一點塵埃。

-----廣告，請繼續往下閱讀-----

心理學領域正逐漸朝向這個方向發展，但其他社會和人文科學仍然抱持傳統的不連續性假設，所以我每次在面對這些觀眾的演講中都會強調這一點。我的演講難免會提到人類與其他人科動物的相似之處（但也不是每次都會提到），聽眾每每不約而同地問道：「那麼，身而為人到底有什麼特別呢？」以「那麼」做為問題的起頭，就是想把人類與其他物種的所有相似性都推到一旁，並且只想突顯我們和其他物種有何不同。我通常會用冰山的譬喻回答此類問題，描述我們和靈長類親戚之間在認知、情感和行為上存在龐大的相似度，但當然也有類似冰山一角的差異。自然科學領域試圖理解整座冰山，然而其他學科比較想要從冰山的頂端開始研究。

人是什麼？

西方國家迷戀這座冰山一角已久，而且還沒有要停止的跡象。人類的獨特總是被視為正面，甚至是高貴，但真要說出幾個不光彩的特點也沒想像中困難。我們一直在尋找人類的「獨特之處」，無論是拇指對生、合作、幽默、純粹的利他主義、性高潮、語言或是喉部結構。這個現象的源頭也許起始於柏拉圖（Plato）和第歐根尼（Diogenes）的辯論，他們試圖找出最簡潔的人類定義。柏拉圖提出人類是唯一的無毛兩足行走動物，但這個定義很快就被反駁了，當時第歐根尼帶了一隻毛被拔光的雞到柏拉圖的講學地點，一到柏拉圖面前，他便放手讓雞走路並說道：「瞧！我給你帶個人來。」人類的定義因此多添加了一條：「擁有寬指甲」。

一七八四年，約翰．沃夫岡．馮．歌德（Johann Wolfgang von Goethe）興奮地宣稱自己找到了人類生物學起源的證據：一小塊人類上顎骨頭，被稱為「頷間骨」（os intermaxillare）。雖然所有包括猿類在內的哺乳類動物都有這塊骨頭，但在此之前一直未能在人類身上找到，因此始終被解剖學家標誌為「較原始的」骨頭。人類也總是把身上找不到這塊骨頭視為值得自豪的現象。身為詩人的歌德也是一位自然科學家，他非常高興能找到這塊與哺乳類動物共享的原始骨頭，就此讓人類與自然界其他物種連結起來。歌德在達爾文提出演化論前的一個世紀就有這種想法，顯示演化概念已經醞釀許久。

直到今日，連續性和例外主義（exceptionalism）之間的張力依然存在，人類的獨特之處一次次地被點出，再一次次地被反駁。就像剛剛提到的頷間骨，人類獨特性的主張通常會歷經四個階段：言論會不停地被傳頌，隨後有人提出新證據反駁，該主張開始逐漸沒落，最後一腳踏進不光彩的墳墓。我常常覺得被這些主觀的論點打擊，這種吸引大眾目光的人類獨特性論點不知從何而來，大家好像也都忘了我們以前根本不覺得這些特質有什麼問題。

-----廣告，請繼續往下閱讀-----

達爾文因其提出的理論衝擊了人類與動物之間的界線，因而被畫成猿諷刺。圖／jwyg@Flickr

例如，在英語當中（其他語言也是如此），模仿行為的動詞常常用到我們的動物近親，暗示當時認為動物會模仿沒什麼大不了，而且這些行為由人類和猿類所共享。不過，當模仿被重新定義為是複雜的認知行為（也就是「真正的模仿」，”true imitation”），突然間，人類搖身一變成為唯一能掌握這種能力的物種。

這些論點的奇異共識是：「人類是唯一能模仿的猿類」。另一個例子關於心智理論，心智理論其實最早源自於靈長類動物研究。某種程度上，它曾經被重新定義成猿類沒有心智功能。定義與重新定義的循環讓我想起《週六夜現場》節目裡喬恩．洛維茲（Jon Lovitz）扮演的角色，他一直期待能合理化自己的行為，因此不停地思索和尋找理由，直到他能相信自己，於是帶著滿足的假笑說：「是的！這正是我要的！」

討論技術能力時也發生過同樣狀況。早期的印刷品和繪畫通常會將猿類描繪成手持拐杖或其他道具，最令人難忘的圖片是在卡爾．林奈（Carl Linnaeus）於一七三五年出版的《自然系統》（Systema Naturae）。猿類會使用工具眾所皆知，當時也從沒出現過一點爭議。二十世紀時，人類學家將工具使用提升為智力的跡象，因此提出這些藝術家讓牠們手持工具的原因，可能只是想要讓牠們看起來更像人類。此後，猿類的工具使用技術便飽受審視和質疑，甚至是嘲笑，而發生在人類身上的同樣能力則被推舉為智力超群的證明。

正是在這種歷史背景下，發現（或重新發現）野生猿類會使用工具的現象才會如此令人震驚，但人類學家仍試圖淡化其重要性。我聽過他們表示，黑猩猩可能是向人類學會如何使用工具，彷彿向人類學習使用工具會比自己發展出工具更為容易。這個提議顯然還沒碰到把模仿能力視為人類特有行為的論點。當李奇說我們不是選擇把黑猩猩當成人類，不然就得重新定義人類或重新定義工具，科學家總是直接擁抱第二個選項。重新定義人類永遠不會過時，每當我們找出一個新的特質時就會歡呼：「是的！這正是我要的！」

-----廣告，請繼續往下閱讀-----

比起宣稱只有人類的胸腔會跳動（這其實是所有靈長類動物的特點），更過分的是貶低其他物種。嗯，被貶低的不只有其他物種，認為白種男性的基因優於其他人種的觀點也是歷史悠久。種族優勝主義（ethnic triumphalism）的信念延伸至我們自身物種，於是有人會取笑尼安德塔人（Neanderthal）是頭腦簡單的野蠻人。不過，我們現在已經知道尼安德塔人的腦容量還比我們稍微大一點，我們的部分基因亦來自他們，而且他們擁有使用火、懂得墓葬、使用手斧和樂器等能力。即使尼安德塔人最終也許會獲得一點尊重，但每當談到猿類時，我們仍然充滿蔑視。

二○一三年，英國廣播公司（BBC）在其網站調查「您是否和黑猩猩一樣笨？」。我很好奇他們是如何確立黑猩猩的智力程度。後來發現該網頁（之後被移除了）只包含有關人類世界事務的測試，跟黑猩猩一點關係也沒有，標題如此只是想要與人類對比。不過，為什麼要拿猿類對比呢？為什麼不選擇蝗蟲或金魚？究其原因，顯然假定每個人都相信我們是最聰明的物種，只是很多人並不了解這些物種與我們的親緣關係。熱愛比較人類與其他人科動物的行為反應出我們沒有安全感，這也出現在書名上，例如《不止是黑猩猩》（Not a Chimp）和《只是隻猿類？》（Just Another Ape?）。

表現超過人類的黑猩猩阿步

面對黑猩猩阿步（Ayumu the chimpanzee）的表現，也有人展現同樣的不安。他們在網路上觀看阿步展現才能的影片，要不是不相信，就是認為這純粹是場騙局，或是做出「我不能接受我比黑猩猩還笨！」的評論。美國科學家認為這個實驗冒犯了他們，因此必須接受特殊訓練好擊敗這隻黑猩猩。當主導阿步研究計畫的日本科學家松澤哲郎第一次聽到這種回響時，他把頭靠在手上沉思。以下是維吉尼亞．莫瑞爾（Virginia Morrell）在報導演化認知領域背景時，描述了松澤哲郎的反應：

我真不敢相信他們有這種反應。如你所知，我們透過阿步發現黑猩猩在一種記憶測試中表現得比人類更好。這是黑猩猩能立即做到的事，但也只有這件事做得比人類好而已。我了解這讓有些人感到沮喪，但是現在居然有研究人員想透過訓練變得跟黑猩猩一樣好。我真的不明白為什麼我們必須在所有領域都是最優秀的。

儘管冰山已經開始融化了數十年，態度轉變的程度仍然很有限。我不打算深入探討這些問題，或是一一介紹最新的人類獨特性主張，在此我想帶領你們了解一些目前逐漸退流行的論述。這些言論描述了智力測試的方法論，這對於我們為動物進行的研究結果至關重要。我們該怎麼對黑猩猩、大象、章魚或馬進行智力測驗呢？這聽起來很像是在開玩笑，但這其實是科學界面對最棘手的問題之一。人類的智力差異本身就已經充滿爭議，尤其在比較不同文化或種族時，然而當我們在不同物種身上討論這個議題時，衝擊更是劇烈。

-----廣告，請繼續往下閱讀-----

我會樂意接受最近一項發現愛貓人士比愛狗人士更聰明的研究，假如研究裡探討的是貓和狗之間的智力比較，那就完全是另一回事了。這兩個物種間的差異如此之大，很難設計出可以讓兩者同時以相似方式接收和回應的智力測驗。然而，具爭議的不只是如何比較兩種動物，還包括我們往往視而不見、有關動物與人類之間的比較，而我們還經常在這方面放棄所有嚴謹的審查。

科學界對於動物認知領域的新發現都謹慎以待，但是對人類智力的主張卻是反其道而行。只要這些主張如我們預期，科學界就會全盤接受，於是阿步的壯舉便超出了理解範圍。大眾也因此感到困惑，因為不管有人宣稱了什麼，總會有人提出反駁的研究成果。這些研究結論的變動通常是方法論的問題，討論研究方法也許很無聊，但能直指問題核心—我們有能力知道動物有多聰明嗎？

所有科學研究都有其方法論，因此科學家非常重視研究方法。當我們研究的捲尾猴在觸碰螢幕的臉部辨識測試表現不佳時，我們會不斷追蹤數據，直到發現牠們會在每週特定的某天表現得很差。後來我們才發現原因出自一位學生志工，雖然她在測試過程中會仔細地遵循流程，卻做出了分散捲尾猴注意力的行為。這個學生不安且緊張，不斷地改變身體姿勢或調整頭髮，因此也讓猴子感到緊張。我們將這位年輕女性從這個計畫調走後，猴子的表現便大幅提升。

此外，最近也發現在進行小鼠（mouse）研究時，男性研究人員會帶給牠們過多的壓力而影響表現，女性研究人員則沒有這種現象。如果將男性穿過的衣服放在實驗室裡，也會造成相同效果，顯示嗅覺是關鍵。意指男性與女性研究人員執行的小鼠實驗可能有不同的結果。研究方法細節的重要性比我們想像的重要多了，這在進行物種間的比較時尤其關鍵。

-----廣告，請繼續往下閱讀-----

本文摘自《你不知道我們有多聰明：動物思考的時候，人類能學到什麼？》，馬可孛羅出版。

發表意見

所有討論 0

登入與大家一起討論

PanSci

1219 篇文章・ 2184 位粉絲

PanSci的編輯部帳號，會發自產內容跟各種消息喔。

TRENDING 熱門討論

即時熱門

0

1

文字

0

1

海鳥吃塑膠？日益嚴重的海洋塑膠危機——《科學月刊》

科學月刊・2016/03/19 ・2147字・閱讀時間約 4 分鐘・SR值 622

・十年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

黃向文／國立臺灣海洋大學海洋事務與資源管理研究所教授兼所長，本刊副總編輯。

Credit: U.S. Fish and Wildlife Service Headquarters/Flickr

2015 年9 月，一篇海鳥誤食海洋垃圾的研究發表於《美國國家科學院院刊》（Proceeding of the National Academy of Sciences），許多媒體引述標題非常聳動，如「海水汙染嚴重，9 成海鳥曾吞過塑膠」、「2050 年99% 海鳥都會吃到塑膠」，真的嗎？ 99% 海鳥都會吃到塑膠？這可是非常嚴重的環境問題。

因應人類對於塑膠的需求量，塑膠產量從1950 年代以來每11 年倍增，也因為塑膠難以分解，加上儲存、處置的不當，導致大量塑膠被棄置、流入海中、成為主要的海洋廢棄物。最近研究數字顯示，海中塑膠垃圾的數量以對數成長，其密度已達每平方公里58 萬片。這些海洋垃圾可能使海洋生物因為纏繞、吞食無法消化、或者內含有毒物質致死。迄今，已有600 種海洋生物體內發現海洋垃圾。

於是，一群關心海鳥的科學家找出1962~2012 年間曾紀錄海鳥誤食垃圾的文獻，發現135 種海鳥中有80 種（59%）曾誤食海洋垃圾；個體方面則平均有29%。配合186 種海鳥的分布、覓食策略、體積大小、抽樣方法，再結合全球海洋塑膠垃圾的分布，模擬預測海鳥誤食海洋垃圾的高風險區。進而推論倘在今天進行此研究，預估90%海鳥個體的體內會有垃圾，到2050 年則有99% 種類的海鳥會誤食海洋垃圾。結論也提到，誤食垃圾風險最高的是在紐澳鄰近海域、海鳥種類分布最多的區域，並非海洋垃圾密度最高的水域。

-----廣告，請繼續往下閱讀-----

試想，如果你有機會在2050 年到海邊賞鳥，每看到100隻就會有99 隻胃內有海洋塑膠垃圾，那是多驚人的景象？先回頭比較原文與媒體報導，「99% 海鳥」與「99% 種類的海鳥」就有不同，「種類」與「數量」是截然不同的定義。這是中文媒體在翻譯外文新聞時，未仔細查證的結果。其次，倘從數據反向解讀，海鳥中有41%物種（或71%個體）沒有誤食塑膠垃圾，從這個數字來看是否會比較安心？

此類研究屬於後設分析（Meta-analysis），利用多篇前人研究，將各文章之統計資料經過標準化等各種統計過程，得到整合性結果，提供世人對該議題的全面性了解。不過，我們可以從相關資料來源與方法，思考幾項此類環境議題研究的可能誤差：

Q1. 抽樣種類偏差？

從「種類」來說，全世界海鳥多達350 種，生態習性各有不同，對於掠食表層食物的鳥類，誤食垃圾的情況較嚴重；而覓食深層食物的海鳥，誤食垃圾比例較低。但該研究蒐集到的鳥種資訊未達半數，如何僅能依據半數海鳥的分布與誤食趨勢，就誇言另外半數的海鳥在未來30 年內也都將誤食海洋垃圾？

Q2. 抽樣地點誤差？

有關分布水域，結論認為海鳥誤食海洋垃圾的熱點在紐澳外海等南半球水域，然而，此觀點也顯示其可能為抽樣地點的誤差，因為紐澳水域海鳥種類眾多，相關研究也多。然而，該文章沒有交代相關論文的涵蓋水域或是各區域內的研究數量。因此，目前認為誤食比率較低的水域，其實可能是因為研究較少而造成，這部分仍尚待討論。另有科學家表示，在南極洋裡棲息有數量極高的海鳥（例如企鵝），但鮮少發現他們誤食塑膠垃圾，這部分可能歸功於南極條約的保護力，所以未若作者所言的嚴重。反之，在夏威夷群島研究信天翁的海鳥學者則認為夏威夷鄰近太平洋海域，才是海洋垃圾密度最高的地區，學者也見到越來越多住在中途島的信天翁幼鳥因為誤食海洋垃圾而亡，不認為熱帶水域相對比較安全。

-----廣告，請繼續往下閱讀-----

Q3. 研究發表謬誤？

對於此類研究，都可能存在「研究發表誤差」，如果科學家蒐集到的海鳥胃內沒有誤食垃圾，則不具有發表效應，也不會有期刊接受此類「沒有保育價值」的文章。通常是情況越嚴重者，被接受的機率越高，長久以往，能夠見諸期刊的都是情況較危急的研究，因此，如果單純以研究報告分析，可能會造成高估。

這篇文章令人聯想到兩篇海洋保育界的文章，其一是在1990 年代，澳洲科學家發表一篇有關日本延繩釣漁船誤捕的海鳥數量，推估結果認為南太平洋每年因為延繩釣漁業而混獲的海鳥超過十萬隻，引起保育團體憂心忡忡，呼籲政府採取行動。為此，聯合國糧農組織召開多次專家諮商會議，並於1999 年通過乙份避免延繩釣漁業意外混獲海鳥之國際行動計畫，之後更因此成立「信天翁與海燕保育公約」，力推各項海鳥保育措施。但該研究僅利用一艘漁船在短短數個月期間、澳洲沿岸水域的混獲狀況。實際上，海鳥分布並非平均，漁船作業水域亦然。該文章忽略此現象，直接相乘結果造成此極大偏差，之後發表的文章也依據混獲變化情況下修數值。但不可諱言，因此引發的海鳥保育浪潮也的確發揮保育功效。

無獨有偶地，一群英美科學家在2006 年發表一篇文章，預估2048 年將無魚可吃，亦引起各方關注。即便受到一些海洋漁業學家的質疑，第一作者隨後也在2009 年發表文章表示此類過度漁撈的危機能夠被控制。不過，在2006年之後，因應該文章的論點而發起的許多海洋資源保育行動、生態標章等開始風行，相信對於資源保育仍有一定之成效。

所以，從研究方法觀點來看，該等論文或有可議之處，然而，不過才兩周之後，一篇類似的文章隨後於《全球變遷生物學》（Global Change Biology）期刊發表，該文以海洋垃圾與海龜分布區域的資料進行模擬，表示有52% 的海龜可能誤食海洋垃圾。開始有科學家評論這現象有如海洋版寂靜的春天，塑膠垃圾對於海洋的危害已經不下當年DDT 對於陸地環境的危害，我們應該採取積極的行動全面抵制、減少塑膠類垃圾的使用，這才是研究之後更深遠的呼籲吧！

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

科學月刊

249 篇文章・ 3481 位粉絲

非營利性質的《科學月刊》創刊於1970年，自創刊以來始終致力於科學普及工作；我們相信，提供一份正確而完整的科學知識，就是回饋給讀者最好的品質保證。

TRENDING 熱門討論

即時熱門

演進中的科學研究方法(4/4) – 運用巨量資料評價實驗結果的再現性

一、先登錄再現研究（Registered Replication Research）

二、巨量研究（Mega Study）

三、新世代的學習思維

參考文獻

延伸閱讀

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是飛蚊症？

「吃鳳梨可對抗飛蚊症」文章來源

文章內容：固定吃鳳梨，減少飛蚊症？！

此研究值得懷疑的要點

話說回來，這到底是哪家期刊？

還真的是掠奪型期刊啊！

媒體報導沒有說出來的問題

結語：正視飛蚊症，但別輕信新聞啊

相關資料

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

一、先登錄再現研究（Registered Replication Research）

二、巨量研究（Mega Study）

三、新世代的學習思維

參考文獻

延伸閱讀

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

一顆能譜曲、算數的大腦，是生存必需的嗎？

萬物之靈的大腦，有什麼特別的嗎？

人是什麼？

表現超過人類的黑猩猩阿步

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

Q1. 抽樣種類偏差？

Q2. 抽樣地點誤差？

Q3. 研究發表謬誤？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見

發表意見