0

0
0

文字

分享

0
0
0

抽血可以輔助乳癌檢測? 從德國烏龍事件談被誇大的科學新聞

旻諭_96
・2019/11/22 ・2535字 ・閱讀時間約 5 分鐘 ・SR值 579 ・九年級

-----廣告,請繼續往下閱讀-----

今 (2019) 年二月,德國海德堡大學附屬婦科醫院發布新聞稿,聲稱教授索恩 (Christoph Sohn) 的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。

什麼?!只要抽血就可以知道有沒有得乳癌嗎?

該篇新聞稿內容指出,雖然這項技術不能直接取代乳房 X 光攝影檢查,但可以當作早期檢測,且偽陽率(沒有乳癌卻被判斷成有乳癌的機率)只有乳房 X 光攝影檢查的一半。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用。

索恩的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用 。圖/basker_dhandapani @pixabay

奇怪的是,索恩同 (2) 月在德國杜塞道夫的另一場研討會中,說法又大不相同。根據德國線上雜誌 MedWatch 的報導,索恩的演講投影片上顯示該測試的特異度為 45~73%,相當於高達 55% 的偽陽率,幾乎是每兩位女性就有一位會被判斷為乳癌患者。看來這個以抽血看有沒有得乳癌的方法還不是太可靠註1

哪個環節出了問題?科學公關化妝化過頭

從上述的案例中,我們可以發現,這項「用血液檢測有沒有得乳癌」的檢測方式,明明有高達 55% 的偽陽率,卻在醫院發布的新聞稿中,被說是「乳癌檢測的重大里程碑」,嚴重地誇大了好幾個層級。但究竟為什麼新聞稿跟原始研究可以差這麼多呢?

-----廣告,請繼續往下閱讀-----

這攸關於「公關」的角色。

在科學研究組織中的公關單位,必須擔負「提升組織名譽」的重擔。現在各大學相互競爭學術排名的情況下,大學公關透過各方管道(包含亮眼的科學研究成果)來「行銷自己」變得十分重要。因此,科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。

科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。圖/MichaelGaida @pixabay

然而,科學公關作為「學術界」和「媒體界」的橋樑 (Sumner et al, 2014),時常會遇到裡外不是人的窘境。公關單位一方面必須把科學知識講簡單,一方面又要擔任科研組織的化妝師,行銷自己、提高組織的知名度;因此常常沒辦法站在客觀與批判的角度檢視科學研究成果。容易造成問題的情況是,有時候公關單位會化妝化過頭,過去研究顯示,學術單位公關發布的新聞稿也常有機會成為錯誤的資訊來源本身。

誇大的科學新聞不是記者的錯?公關也可能參一腳

英國卡迪夫大學腦研究成像中心 (Cardiff University Brain Research Imaging Centre) Petroc Sumner 教授的研究團隊發現,與健康科學的新聞中,容易出現三種常見的錯誤:

  1. 過度延伸的建議(呼籲讀者改變行為)(exaggerated advice)
  2. 把「相關」描述成「因果關係」(exaggerated causal claims)
  3. 把「動物」研究成果不當延伸,應用在人類身上 (exaggerated inference to humans from animal research)

然而,研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。

-----廣告,請繼續往下閱讀-----
研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。圖/截圖自參考資料 3

研究團隊從英國排名前 20 名的大學取得共 462 篇和健康相關的公關稿,再分別往前往後挖看看同一個研究的原始論文和科學新聞。(原始論文是一定有啦,但有些公關稿不一定會成為新聞題材。)

研究團隊比較了原始論文、公關稿和科學新聞三種版本的文章,發現有 40% 的公關稿含有過度延伸的建議;33% 的公關稿含有把「相關」描述成「因果關係」的錯誤;36% 的公關稿含有把「動物」研究成果不當延伸,應用在人類身上的錯誤。

研究更進一步顯示,當公關稿含有這些誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。

這張圖的上、中、下,分別代表公關稿或新聞稿包含「過度延伸的建議」、「把相關描述成因果關係」、「把動物研究成果不當延伸,應用在人類身上」。右半邊的白色長條圖示,代表當公關稿內含有誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。圖/參考資料 3 圖 2

讀科學新聞要小心,遇到誇張的研究結果要有所警惕

文章看到這裡,或許你會很驚訝:「原來我以前都錯怪記者了,公關稿也可能有過度延伸的問題。」但這項研究結果也不是要你開始改罵公關單位,畢竟公關單位常常有和其他大學競爭的壓力。

-----廣告,請繼續往下閱讀-----

但其實民眾如何理解科學新聞的內容,會直接影響到民眾的實際行為。因此,科學新聞怎麼描述健康相關資訊,真的是一件不能馬虎的事情。(就好比看到抽血可以驗乳癌就開心以為不用去照 X 光檢查,或是看到「常咀嚼固態食物可預防失智」就不顧吃什麼健康不健康的嚼嚼就對了……)

「常咀嚼固態食物可預防失智」並不代表就不用管吃什麼健康嚼嚼嚼嚼就對了。圖/Comfreak @pixabay

不過更聰明的你一定想到了這個解方:當我們看到誇張的科學研究結果,別看到標題就自己腦補胡亂相信,要記得仔細看看內文,有沒有把相關研究講成因果關係,或是把動物研究結果延伸到人類身上(畢竟只有 10% 的非人類研究結果可以成功類推到人類身上)。如此一來,就算遇到了懸疑的科學新聞,你也有可以判斷真偽的能力!

註解

  1. 儘管索恩在研討會的記者會中遭受質疑,他仍拒絕回答任何與該測驗「偽陽率」相關的問題。五月,海德堡大學附屬婦科醫院認為,索恩必須為他的錯誤言論負責。經過幾個月的調查,大學委員會在上個月底舉行記者會,說明調查結果證實索恩宣稱以抽血檢測乳癌是「嚴重的不當行為」。根據報導,索恩已遭停職(包含教學與研究)3 個月,並即將接受大學的紀律調查。

參考資料

  1. German university finds ‘severe’ misconduct by researcher who promoted questionable cancer blood test. Science, 2019.10.25
  2. FORSCHER DES UNIVERSITÄTSKLINIKUMS HEIDELBERG ENTWICKELN ERSTEN MARKTFÄHIGEN BLUTTEST FÜR BRUSTKREBS. Newsroom UKHD, 2019.2.21
  3. Sumner, P., Vivian-Griffiths, S., Boivin, J., Williams, A., Venetis, C. A., Davies, A., … & Boy, F. (2014). The association between exaggeration in health related science news and academic press releases: retrospective observational study. Bmj, 349, g7015.
-----廣告,請繼續往下閱讀-----
文章難易度
旻諭_96
14 篇文章 ・ 2 位粉絲
大學主修生科,研所跳槽科學教育,目前正努力想要聰明又科學的活著。

0

2
0

文字

分享

0
2
0
科學新聞誰來說?當科學家與記者意見相左時!——《是炒作還是真相?媒體與科學家關於真相與話語權的角力戰》
商周出版_96
・2025/04/05 ・4280字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

同床異夢:科學家與科學記者間的緊張關係

為了新成立的科學媒體中心負責人一職準備面試期間,我讀到許多科學家的意見,他們指出媒體對MMR疫苗和基因改造等議題的報導削弱了公眾對科學的信任。然而,當我更深入閱讀當時的科學新聞時卻發現情況並不那麼單純,許多嘩眾取寵的報導出自綜合記者或政治與消費的分線記者,消息來源是善於操縱媒體的運動人士而非優秀科學家,反觀科學記者筆下的報導則多數公正平衡。

中心成立後的頭幾個月主要是諮詢,過程中我與一些傑出的科學記者交流,詢問新的科學新聞辦公室如何產生價值,他們花了很多時間回應我接二連三的提問。互動中我清楚意識到科學記者不需要別人教他們怎麼做報導,而且他們其實與科學家一樣苦惱,覺得手機、核能、複製技術等等議題有太多聳動新聞。後來討論焦點就放在科學媒體中心如何改善現況,方法包括鼓勵科學家接受訪問,以及提升科學專業在編輯室內的地位。

一種說法認為科學記者是個特別的記者類型。有人向英國廣播公司前新聞部主任弗蘭.安斯沃思(Fran Unsworth)提出疑問:為何她們的公司高層很少人有科學報導背景?她短暫遲疑後回答:英國廣播公司的科學記者大都熱愛自己的工作,喜歡報導更甚於管理。我在其他媒體也注意到同樣現象,許多科學、醫藥、環境記者在專門領域耕耘超過二十年。湯姆.菲爾登被問到為何熱愛科學報導,他的回答是:

科學報導的內容幾乎都是探索性而非指控性—代表我和科學家都能開開心心回家!而且我能在自由出入實驗室、見到地球上最聰明的一群人、對他們的畢生心血提出各種粗淺的問題,這是多麼大的特權。再來科學新聞多彩多姿,生醫、太空、氣候、生物多樣性、古生物……最後一點,科學新聞很重要,是現代社會不可或缺的一部分。

「要迅速還是要正確?」——新聞編輯室裡的艱難選擇

二○○二年科學媒體中心剛成立時,社會上針對科學和媒體之間為何緊張有過一波辯論,其中一個話題是科學價值觀與新聞價值觀的矛盾。已故的理查.多爾(Richard Doll)爵士教授是發現吸菸與癌症關聯的科學家,他曾經對著滿屋子的記者一語道破:「你們不喜歡老調重彈、報導大家都知道的事情,總想找些新鮮的。但很可惜,科學裡新的事物通常不對,真理需要透過時間慢慢建立。」

-----廣告,請繼續往下閱讀-----
科學追求真理累積,媒體偏好新鮮話題,價值觀自然衝突。圖/unsplash

另一方面,懂得反求諸己的記者通常也不諱言表示媒體反映真相有很多侷限。《華盛頓郵報》資深記者大衛.布羅德(David Broder)一九七九年曾說:「我希望媒體能一再重複、直到大家明白—每天送到門口的報紙,只是記者對過去二十四小時內聽聞的某些事情做出片面、匆促、不完整的敘述,內容不可避免會有瑕疵與偏差。」難怪科學家對記者戒慎恐懼,而記者與科學家合作時也倍感挑戰。曾經有位報紙編輯對著一房間的皇家學會成員說:在他的編輯室內,「要迅速還是要正確」這問題只會有一個答案。那些科學家的惶恐表情我歷歷在目。

我進入媒體關係工作之前拿的是新聞學學位,至今仍記得一位前記者曾在講座中告訴大家:「車禍後無人傷亡」不能成為新聞,「車禍導致五名青少年死亡」才能引起大眾關注。研究媒體的學生辯論新聞價值觀已經辯了數十年,也有人大膽嘗試不同做法,比方說《龜媒體》(Tortoise Media)之類新興平臺就訴求「慢新聞」,旨在建立有別於速度至上的新模型,透過「慢速新聞學」理念以更長時間來更加深入地製作更大、更複雜的報導。但儘管媒體業界發生許多變化,傳統的新聞價值觀仍屹立不搖。

科學媒體中心所有工作都是為了支持科學報導的高標準,不過我們在二○一一年列文森調查期間發現還有其他機會能夠撼動這些標準。該調查由布萊恩.列文森勳爵法官(Lord Justice Brian Leveson)主持,目的是在《世界新聞報》(News International)竊聽醜聞案後瞭解英國媒體業界有什麼慣例。我當時的同事海倫.賈米森(Helen Jamison)建議我們向調查庭提交證據,幾杯所謂的「女士汽油」下肚後,她操著濃厚曼徹斯特口音說:「傷害公眾利益的不是竊聽名人電話—而是糟糕的科學報導。」隔天我們發郵件給幾位科學通訊人員,詢問他們關注什麼議題,一週後就提交多頁書面證據。

我告訴同事自己被傳喚去做口頭證詞時她們還覺得我在瞎掰。小組內部連續幾週密切關注各大媒體如何報導列文森調查案,包含麗貝卡.布魯克斯(Rebekah Brooks)、阿拉斯泰爾.坎貝爾、保羅.戴克瑞(Paul Dacre)和安迪.考森(Andy Coulson)在內很多媒體界大人物都有出庭,而今居然也有我一份,令人興奮又忐忑—被傳喚的人只有我代表科學界,一定要把握好機會。

-----廣告,請繼續往下閱讀-----

標題戰爭:聳動 vs. 精準,誰來決定科學新聞的呈現?

但其實我沒進過法庭,緊張情緒一目瞭然。印象特別深的是御用大律師羅伯特.傑伊(Robert Jay)和列文森勳爵本人一再要我放慢語速。官方紀錄上,提醒我兩次還不見效,列文森這麼說:「不必因為半小時的限制就講很快,時間是可以延長的……而且我有點擔心,總覺得速記員頭上好像冒煙了。」

我的主要論點是媒體長期以來執著於同一套價值觀,在書面證詞中也有所描述:

追求引發恐慌的故事、誇大單一專家從小規模研究得出的結論、不願將令人擔憂的研究結果置於宏觀而令人安心的脈絡、為了平衡而捏造不存在的學界歧見、過分偏愛另類觀點等等。

當天《獨立報》恰好印證我的觀點,一篇跨兩頁的報導標題為:「眼盲者重見光明—患者因幹細胞『奇蹟』痊癒。」然而實際情況是患者並未痊癒,雖然回報視力小幅度改善(他們原本視力極差,已被登記為盲人),但這僅僅是一項安全性研究,而且只有兩名患者參與。當然,研究本身是值得報導的,在幹細胞研究剛起步、真人試驗剛開始的時期,這是個重要的進展。問題在於報導口吻暗示科學研究取得了巨大突破,可能給成千上萬黃斑部病變患者帶來不切實際的希望。

同一天稍晚我揪著心打電話給《獨立報》科學編輯史提夫.康諾,告知我將他的報導當作科學新聞不良案例交給列文森調查庭。他當然談不上高興,但至少沒發飆,所以我鬆了一口氣。原來前一天晚上他提交的原稿內容較精緻,但夜班編輯決定將報導放在頭版,所以文字編輯就對標題進行過加工。康諾將原稿發過來,我們倆就在辦公室玩起「找出不同點」的遊戲了。

-----廣告,請繼續往下閱讀-----

離開法庭時,《太陽報》總編輯攔住我。我在證詞中批評他們前一週煽動恐慌,報導內容是居家用品內的化學物質,但標題卻叫做「商店貨架上滿滿的乳癌『風險』」。原本我以為對方要吵架,沒想到他說《太陽報》真心想改善科學報導品質,邀請我們為報社裡的一般新聞記者開一場科學報導培訓班。隨著列文森調查案持續推進,業界標準似乎終於迎來變革,而且這一次沒有落下科學新聞。

作證時我順便提出有必要為科學報導制訂新的指導方針,還誇下海口表示只需要幾小時就能與記者和科學家共同完成草擬。一週後,調查庭將人召集起來要我們開始,沒想到折騰了整整一天,而且過程中好幾次我都擔心無法達成共識。標題就是特別棘手的項目,記者和文字編輯很堅持標題只追求簡潔和引人注目,沒必要精準總結文章內容,但科學家聽了很火大,認為這是合理化不精準的敘述。

科學家要求標題的正確性,記者堅持要簡潔吸引,雙方激辯不休。圖/unsplash

我感覺自己成了全球和平談判的調解員,必須設法安撫所有人不拍桌走人並達成協議。所幸雙方都有成就這樁美事的意願,最終相互妥協:標題不應誤導讀者對文章內容的理解,且不應以引號包裝誇大的敘述

總體來說,新指導方針鼓勵記者從協助大眾的角度切入,告訴閱聽人什麼證據是可靠的,又有什麼證據還在研究階段。例如其中有幾條的內容是:新聞故事應附上來源以便讀者查詢。應標明研究的規模、性質和侷限性。應指出研究處於何種階段,並從合理角度預估新療法或新技術能為民眾所用的時間點。

-----廣告,請繼續往下閱讀-----

我們將指導方針寄給列文森勳爵,很高興他在最終版本的報告裡也建議採用。調查案結束後成立了獨立報刊業標準組織(Independent Press Standards Organisation)在各大新聞編輯部推廣指導方針,由於制訂過程有編輯和記者的參與所以接受度很高,不至於引起反彈。

為科學家舉辦講座時,我會展示一些因為科學家參與而變得更客觀準確的新聞報導,其中個人特別喜歡的一篇出自二○○八年的《每日郵報》,內容提到一項小鼠研究發現常用的保濕霜與癌症有相關。記者費奧娜.麥克雷(Fiona MacRae)引用兩位不同專家的意見質疑這項研究與人類皮膚的相關性,並指出該研究需要能在人類身上複現才有意義。

專家之一表示:因為這項研究就停止使用保濕霜太「瘋狂」,還補充說明:「小鼠皮膚癌研究其實不太能幫助我們瞭解人類的皮膚癌。」最精彩在於標題是「保濕霜與皮膚癌相關(僅限小鼠)」,而且括號內外用了同樣大小的字體。

從這個案例來看,優秀的記者可以在講述有趣故事的同時確保讀者不會過早丟掉面霜。我還會在講座使用的幻燈片裡摻入一些小報的報導實例來挑戰學術界偏見,比方說《每日郵報》的社論或許爭議頗多,但他們的科學新聞通常品質並不差,不推廣特定立場的時候更是如此,有時甚至優於大報。我還會強調《每日郵報》在英國銷量排行第二,如果連線上版也算進去讀者數超越所有大報,因此務實一點說:如果科學家希望更有效地向大眾傳遞信息,完全沒有不與《每日郵報》合作的道理。

-----廣告,請繼續往下閱讀-----

——本文摘自《是炒作還是真相?媒體與科學家關於真相與話語權的角力戰:從基改食品、動物實驗、混種研究、疫苗爭議到疫情報導的製作》,2025 年 03 月,商周出版,未經同意請勿轉載

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

商周出版_96
123 篇文章 ・ 364 位粉絲
閱讀商周,一手掌握趨勢,感受愜意生活!商周出版為專業的商業書籍出版公司,期望為社會推動基礎商業知識和教育。

2

3
7

文字

分享

2
3
7
逼近上帝視角——用「統計學」探討因果關係
研之有物│中央研究院_96
・2022/06/15 ・4930字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/郭雅欣、簡克志
  • 美術設計/蔡宛潔

因果關係怎麼研究?

在日常生活的經驗裡,我們往往習慣以主觀的角度來認定因果關係的存在,但在數理統計的協助下,因果關係可以擁有科學定義,並且可以驗證。中央研究院「研之有物」專訪院內統計科學研究所黃彥棕研究員,他的主要研究便是以數理統計的方式來探討因果關係(例如生物體的複雜機轉)。有了統計方法,人類也能接近上帝視角,找出因果關係的存在。

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係。圖/研之有物

以數理統計驗證因果關係

我們絕大多數人相信「凡事必有因果」這句話,例如今天腹瀉,是因為昨天晚餐吃壞肚子;考試沒考好,是因為書念得不夠。但是仔細想想,造成今天拉肚子的原因,除了昨天的晚餐之外,還有沒有別的可能?影響考試成績的因素,除了書念得夠不夠之外,考試環境、考題難易度也都會影響。

所以,我們究竟該如何確定兩件事有因果關係?有沒有什麼科學方法,可以讓我們帶著十足的把握,說出「X 就是造成 Y 結果的原因」這樣的話語?

-----廣告,請繼續往下閱讀-----

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係,除此之外他更進一步在數學上探討「X 透過何種機制造成 Y」,也就是所謂的「因果中介效應」。有興趣的讀者,可以參考「研之有物」之前專訪黃彥棕老師的文章〈喝酒臉紅易罹癌?小時候家裡窮會胖?統計學家黃彥棕來解答〉。

回到因果關係,黃彥棕說到:「因果關係是屬於上帝視角。」也就是說,兩件事之間究竟有無因果關係,理論上只有全知者才知道,而我們能做的,是以數理統計的方式,「從人類視角盡可能地逼近上帝視角,來判斷因果關係是否存在。」

何謂因果關係?

為什麼說「因果存在與否只有上帝才知道」?因果關係建立在「反事實」,如果有一個事實是「打疫苗,就不容易感染 COVID-19」,則我們必須驗證是否「不打疫苗,就容易感染 COVID-19」,這就是反事實。有了事實與反事實的比對,我們才能說「打疫苗」與「不易感染 COVID-19」有因果關係。

不過,除非有時光機或平行宇宙,否則我們不可能讓全世界的人打疫苗,並觀察感染情況;然後又讓全世界的人都不打疫苗,並再次觀察染病狀況。只有全知者才能同時觀察這兩個平行宇宙,得知因果關係。黃彥棕說,身處現實世界的我們,只能盡可能地逼近這個結果。

-----廣告,請繼續往下閱讀-----

用數學語言來描述因果關係,最被廣泛使用的架構是由美國統計學家 Donald Rubin 提出的反事實結果(counterfactual outcome)或潛在結果(potential outcome)。值得一提的是,過去 Rubin 也曾與 2021 年諾貝爾經濟學獎得主 Joshua Angrist 和 Guido Imbens 共同發表重要論文〈使用工具變量確認因果效應〉。

以下我們就以疫苗和傳染病為例,以反事實架構來說明「X 導致 Y」的群體因果效應。先假設 X 為民眾施打疫苗與否( 0:不打疫苗,1:打疫苗),而 Y 為得傳染病與否(0:不染病,1:染病),並使用期望值 E 來描述群體平均效應,詳細如下圖。

為了要取得因果關係,我們必須有兩個獨立的平行世界,分別是 X=1 和 X=0,再去比較這兩個世界中 X 如何導致 Y 的發生。圖/研之有物
(資料來源|黃彥棕)

如果我們觀察到 E[Y(X=1)]=0.1,也就是有打疫苗的人染病機率是 10 %。那麼在反事實因果推論的基礎上,我們必須檢驗 E[Y(X=0)] 等於多少,也就是不打疫苗的染病機率。只要 E[Y(X=1)] ≠ E[Y(X=0)],就代表 X 和 Y 之間具有因果關係。

然而,實務上打完疫苗的人不可能再回復到沒打疫苗的狀態,因此我們沒有辦法再次對同一群母體樣本做實驗來驗證因果關係,僅能退而求其次,「盡量貼近」因果關係。那麼,要怎麼做呢?

-----廣告,請繼續往下閱讀-----

有反事實的對照,才有因果關係。

逼近神的因果視角

如果我們把全世界的人分成兩半,其中一半打疫苗、另一半不打疫苗,然後用打疫苗的那一半代表一個宇宙(事實),不打疫苗的代表另一個宇宙(反事實),不就創造出兩個平行宇宙了嗎?

這是一種很直觀的逼近方法,但若要讓一半的人能夠代表一整個宇宙,則有一個重要的前提:這兩個宇宙裡的人是隨機分配的,也就是這兩群人在各個層面都很相似,例如年齡、性別、健康狀況甚至政治傾向等,以專業術語來說就是必須具有可互換性(exchangeability)。藥廠在做疫苗人體實驗時,就必須以非常嚴謹的方式讓受試者盡可能達到隨機分配,才能得到「疫苗是否有效」的科學結果。

不過,在大多數狀況下,我們很難做到隨機分配。舉例來說,臺灣開放施打 COVID-19 疫苗後,截至 2021 年 10 月 29 日為止,有將近 1700 萬人施打第一劑疫苗,但我們不能把這 1700 萬人視為有打疫苗的宇宙,而另一群沒打疫苗的 600 萬人視為沒打疫苗的宇宙,因為打不打疫苗是人民自由選擇的結果,有很多因素會影響個人選擇,例如比較有健康意識,或是比較年輕、不擔心副作用的人,可能就比較傾向打疫苗。

即使統計結果顯示出打疫苗的人,感染 COVID-19 的比例真的比較低,我們也很難分辨是因為打疫苗,還是他們本來就比較年輕?或本來就比較健康?「這是所謂的『觀察型研究』,容易出現因果推論謬誤的原因。」黃彥棕說。

-----廣告,請繼續往下閱讀-----

然而,我們可以用數理統計的方式逼近真實的因果效應,例如控制年齡、健康狀況——兩方都取 50~60 歲的年齡層,並且都是沒有心血管疾病的人等。黃彥棕說:「我們依據自己的背景知識,知道有哪些因素會影響隨機性,然後使用統計的方式,把它們抓出來做控制。」

理論上統計學家可以把所有可能造成偏誤的因子都舉出來,透過一層層地篩選、限縮,最後得出許多個小小的族群,讓隨機性成立。

之後,透過每一組小小的隨機族群(例如年齡 50~60 歲、沒有心血管疾病、男性、具健康意識……等,統稱為 C),讓 Y 的發生和特定條件 C 之下的 X 群體無關,我們就可以得到逼近兩個平行宇宙的資料(有打疫苗、沒打疫苗),最後再把各族群的結果加權平均回來。就可以貼近上帝視角的因果效應。

以數學語言來說,就是讓條件期望值(E[Y|X=x , C=c)])的計算透過加權平均等同於反事實結果之期望值(E[Y(X=x)])的效果。我們沒有時光機,無法透過事實/反事實結果之期望值檢驗全體打疫苗和不打疫苗的因果關係(E[Y(X=1)] ≠ E[Y(X=0)] 嗎?);但是我們可以透過各種條件的篩選和限縮,去計算每個具備可互換性小群體的條件期望值,最後加權平均回來,檢視打疫苗與得病與否的因果關係(∑c E[Y|X=1 , C=c]*P(C=c) ≠ ∑c E[Y|X=0 , C=c]*P(C=c)嗎?),這才是實務上的作法。

問題來了,要怎麼知道我們是否窮舉了所有可能造成偏誤的因子?我們的確不知道,只有上帝知道,這是個假設,而且是個很難驗證的假設。

實務上,我們不可能同時觀察 X=1 和 X=0 的世界,只能分別獲得 X 和 Y 的相關性。要如何從相關性去檢視因果關係呢?透過統計學上的篩選和限制,我們如果可以讓 X=1 vs. X=0 的隨機性成立,就可以進一步驗證 X 和 Y 的因果關係。為方便說明,圖片的數學式為簡單條件期望值計算,不考慮加權平均。圖/研之有物(資料來源|黃彥棕)

「在控制了年齡、性別、健康狀況等條件的情況下,我們希望可以讓隨機性成立。」

黃彥棕的研究讓因果關係在嚴謹的數學架構下,得以辨證、溝通,而不是只仰賴直觀的思考。因果的存在變得更加科學化,而這也使因果的探討可以進入更深的層次。

-----廣告,請繼續往下閱讀-----

被競爭結果和時間擾亂的因果關係

更進階的因果探討層次,是將時間因素考慮進來。黃彥棕以「B 型肝炎」造成「肝癌」,然後導致「死亡」為例,若想探討這三者間的因果關係時,會發生一個問題,那就是有 B 型肝炎的人,有可能容易因猛爆性肝炎而直接死亡,而這樣的個案在統計上,因為他並沒有得到肝癌,而對「肝癌」這個中介因子造成了「保護」的效果。

「這就是肝癌和死亡這兩個競爭結果造成的影響,而這個競爭關係又會隨著時間推移而改變。肝癌、死亡有時間進程關係,一旦 B 型肝炎患者因猛爆性肝炎死亡了,他就不可能再得肝癌。」更清楚地說,B 型肝炎患者可能還「來不及」得肝癌,就因猛爆性肝炎直接跳到死亡。在界定 B 型肝炎與肝癌之間的因果關係時,這樣的結果會造成偏誤。

黃彥棕將時間因素考慮進來的方法,是把整個時程切割成非常多小段,在每個小段創造一個反事實架構,也就是分析每一位在某小段時間活著的 B 型肝炎患者,把他們分成已得到肝癌及還沒得到肝癌,並考慮這兩組患者在下一個瞬間死亡的可能性,再將這些結果積分起來,得到在隨機過程架構之下的平行宇宙們。

「我等於是在每一個瞬間都製造多個平行宇宙(無 B 肝/無肝癌、無 B 肝/有肝癌、有 B 肝/無肝癌、有 B 肝/有肝癌)出來,這樣做可以避免前面說的蓋牌效應。但你可以想像我所得到的平行宇宙數量……嗯,就跟《奇異博士》看到的差不多。」

「我認為我在這領域的部分貢獻,或許是提出了這樣一個會隨著時間推移的反事實架構。」黃彥棕說。他的論文發表出來後不久,也引起了期刊的興趣,邀請了相關領域的許多專家,探討他所提出的因果模型。

-----廣告,請繼續往下閱讀-----

研究因果的動機

談起對因果關係研究的動機,黃彥棕說,以前在醫學系實習時,會看到開同樣的藥給病人,有些病人會好,有些人不會。這種「不確定性」開始讓他覺得好奇。他說:「我可以接受事情就是會有隨機性,但還是很想搞清楚這樣的不確定性是怎麼來的。」

最近,黃彥棕也發現許多人會把「預測」和「因果」搞混,尤其是現在人工智慧(AI)發展出的預測模型表現愈來愈好,有些做 AI 預測模型的人,會誤以為能夠用預測表現良好的模型,來得到因果關係。

舉例來說,一個模型可以透過一個人是否抽菸,來預測他得肺癌的機率,也可以透過一個人身上是否攜帶著打火機,來預測肺癌機率。「但我們知道抽菸與肺癌有因果關係,而帶打火機與否應該是不會造成任何增加肺癌風險的生物效應的。」黃彥棕說。

「抽菸」與「帶打火機」都能成為 AI 模型預測肺癌時採用的因子,但顯然並非代表它們與肺癌都有因果關係。黃彥棕接著說:「雖然預測未必需要因果關係,但是,決策就需要因果關係的支持。若要降低肺癌風險,政府較合理的做法是下令禁菸,而不是禁打火機。但要看到因果是比較困難的,它先天上的限制使它難以驗證,這個挑戰也是因果推論的迷人之處。」

-----廣告,請繼續往下閱讀-----

最後,黃彥棕切身感受到因果關係的重要性,尤其是藥廠研發藥物或是臨床醫學等領域的應用。而他在反事實架構上考慮時間因素的突破,讓因果推論的知識又更往前推進。反事實因果推論的數學模型,讓人類能夠有深刻的思考,去檢視深藏在直觀表面之下的因果性與相關性。

延伸閱讀

-----廣告,請繼續往下閱讀-----
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

5

603
9

文字

分享

5
603
9
相關、因果,傻傻分不清楚
活躍星系核_96
・2022/03/10 ・3495字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自 Liou YanTing 臉書【相關、因果,傻傻分不清楚】

文/劉彥廷

你一定曾經在網路上看過類似像這樣的研究:

  • 「婚禮花費越高,離婚率越高」
  • 「家中藏書越豐富,小朋友越聰明」
  • 「性生活越活躍的人,越少生病,身體越健康」
  • 「抽雪茄的人更長壽」

不曉得你看到這些訊息時,第一反應會是什麼?

是嘴角上揚,莞爾而笑;還是點點頭,對結論表示贊同;又或者是眉頭緊蹙,心想:「嗯……好像哪裡怪怪的。」面對這些試圖告訴你「兩個事件關聯性」的資訊,有思辨習慣的人,會如何思考、解讀它們呢?

-----廣告,請繼續往下閱讀-----

今天,就來和你分享一下,要正確理解這些訊息,得先有個概念,叫做——「相關,並不等於因果」。

圖/劉彥廷

冰淇淋銷售量與溺死人數

重要的事多說一遍:「相關,不等於因果。」

舉個經典的案例,「研究發現,冰淇淋銷售量越高,溺水死亡人數越多」,也就是「冰淇淋銷量」和「溺死人數」這兩個事件,或者說變數——呈現了「高度正相關」。

相信看到這樣的訊息,任何心智能力正常的人,都不會下結論說:冰淇淋「造成」了溺水。因為所有人都知道,「冰淇淋銷量」與「溺死人數」雖然有相關,但它們並沒有因果關係。

那問題就來了,「為什麼沒有因果關係的兩個事件,彼此會有相關呢?」

聰明的你,一定已經想到了。在這個例子的背後,藏著另一個變因,叫做——「季節」。在夏天,冰淇淋賣得好,銷售量高;同時,在夏天,去玩水的人比較多,意外溺水身亡的人也比較多。這兩個「獨立的事件」,同時並列在一起,就讓「冰淇淋銷量」和「溺死人數」有了相關性。

-----廣告,請繼續往下閱讀-----

一旦我們將「季節」這個變因排除,用科學語言來說,叫做「控制住」——兩個事件的相關性就消失了。

表面上相關的史丹佛棉花糖實驗

在日常生活中,有些事件的相關性很單純,就像冰淇淋與溺水的例子,不會讓人誤判,讓人真的以為它們有因果關係。但有很多例子,就沒這麼容易判斷了,甚至,連受過專業訓練的科學家也會誤判。例如你可能聽過的經典實驗——「史丹佛棉花糖」實驗。

史丹佛大學的研究人員找了一群孩子,讓他們單獨待在房間中,並在面前放置一顆棉花糖,接著告訴他們:「如果你能堅持 15 分鐘,不把這顆棉花糖吃掉,你就能得到兩顆棉花糖。」

之後,研究人員對這些孩子們進行了多年的追蹤,並得出一個結論:「那些沒有在一開始吃掉棉花糖的小朋友,也就是擁有『延遲滿足能力』的小朋友,有更好的人生表現。」

這個實驗的結論以及它帶來的啟發,對兒童教育有著極大的影響。許多家長、老師都不約而同的,開始強調要訓練、培養孩子的「延遲滿足能力」。你在博客來搜尋「棉花糖」這幾個關鍵字,也能查到一堆親子教養的書籍。

但你知道嗎?這個實驗結論已經被證明是有問題的了!

後來有研究團隊又重複做了實驗,但這次,他們特別將「家庭背景」這項因素控制起來,結果發現,「延遲滿足能力」與「未來成就」的相關性就不見了。

-----廣告,請繼續往下閱讀-----

什麼意思呢?翻譯成白話文就是:決定小朋友未來成就的主要因素,並不是什麼延遲滿足的能力,而是你家裡有沒有錢啊!

那些家裡有錢的小朋友,對他們來說,平常有太多機會可以吃到好吃的糖果、零食,當然實驗時,更容易忍住不吃棉花糖;而家裡越有錢,將來越有機會取得成功,這不是很理所當然的事情嗎?

你看,連這麼有名的實驗,都會犯「相關不等於因果」的錯誤。那我們應該如何正確地看待,這些「表面上有相關」的兩個事件呢?

有相關的五種可能性

當我們說 A 和 B 有相關時,從邏輯的角度來看,有五種可能,接下來我們會依序來舉例說明一下。

圖/劉彥廷

相關不是因果,是 A 造成 B,還是 B 造成 A?

舉個例子,研究發現「性生活越活躍的人,越少生病,身體越健康」。

這則訊息最直觀的解讀也許是,「性生活會讓人更健康」,這叫 A 造成了 B。但有沒有可能反過來是 B 造成了 A 呢?也就是──不是性生活讓人健康,而是越健康的人,才可能有活躍、高頻率的性生活啊!

這樣的思考、解讀,是不是也是一種可能,而且更合理呢?

-----廣告,請繼續往下閱讀-----

並非是完整的原因,A 造成 B,但 C 也會造成 B

這種情況簡單來說,就是「一果多因」。我們在現實世界遇到的許多問題,都屬於這一類型。

舉個例子,如果想要證明「死刑具有嚇阻力」,你覺得,需要什麼樣的數據或資料呢?以下是兩種常見的答案:

  • 第一種,上網找已經廢除死刑的國家,比較這個國家在廢除死刑前後,犯罪率的變化。如果在廢除死刑後,犯罪率有顯著的上升,那麼就證明了——「死刑的確具有嚇阻力」。
  • 第二種,上網找找看,有沒有「曾經」廢除死刑,但之後又恢復死刑的國家,比較這個國家在恢復死刑前後,犯罪率的變化。如果在恢復死刑後,犯罪率有顯著的下降,那麼就證明了——「死刑的確具有嚇阻力」。

這兩種答案,雖然切入的角度不一樣,但背後的思考邏輯都相同,都是試圖以死刑和犯罪率的「因果關係」,來證明死刑具有嚇阻力。

但如果我們再多想一層,這兩組數據,真的可以證明「死刑和犯罪率具有因果關係」嗎?要知道,犯罪是一個複雜的社會問題,影響犯罪率高低的原因有很多,而有沒有死刑,只是眾多原因之一,並不是唯一。

-----廣告,請繼續往下閱讀-----

所以,以第一組數據來說,一個國家在廢除死刑後,犯罪率上升。除了廢死這個原因,導致了犯罪率上升外,還有沒有可能有其他原因?比如說,在廢除死刑時,剛好遇到了金融海嘯,或是某個重大災難,導致社會動盪不安、失業率上升,犯罪率也連帶跟著上升。

同樣道理,對於第二組數據來說,一個國家在恢復死刑後,犯罪率下降。除了死刑導致犯罪率下降這種解釋外,有沒有一種可能是,犯罪率下降的原因,是因為這個國家基礎教育做得好、人民素質足夠高,即便沒有死刑,犯罪率也會下降。

在沒有「排除」、「控制」影響犯罪率的「其他變因」之前,如何保證犯罪率的上升或下降,真的是因為死刑存廢所造成的呢?

C 造成 A,同時,C 也會造成 B

前面提到的「冰淇淋與溺水」、「棉花糖實驗」都是這樣的例子,也就是存在一個「隱藏變因」C,同時影響了 A 和 B,以下我再提幾個例子:

  • 像是「家中藏書越豐富,小朋友越聰明」,你覺得是大量的藏書,讓孩子變得更聰明了,還是有其他隱藏變因,會讓家中藏書更豐富,同時,也會讓小朋友更聰明呢?
  • 又或者是「哈佛畢業生薪水比它校畢業生高」,你覺得是念哈佛,會讓你薪水更高,還是有其他隱藏變因,會讓你容易申請上哈佛,同時,也容易拿到較高的薪水呢?

聰明的你,一定能想到答案。

偽相關,又稱「純屬巧合」

這種純屬巧合的相關,也被稱為「偽相關」。美國有個網站,就蒐集了許多偽相關的數據案例,其中有不少讓人哭笑不得的例子。

-----廣告,請繼續往下閱讀-----

例如:「影星尼可拉斯凱吉拍過的電影」和「游泳池溺死人數」,呈現高度正相關;「美國小姐的年齡」和「因取暖設備喪命的人數」,也呈現高度正相關。

看到「有關聯性」,先別急著下定論

行文至此,也寫了快 3000 字。

感謝你願意看完這篇文章,在注意力稀缺的時代,要在社群媒體上看完一篇 3000 字的文章,實屬不易;希望你的大腦還承受得住,沒有當機。

最後總結整理一下,以後若看到一則訊息,試圖告訴你「兩個事件的關聯性」時,在接受它之前,不妨試著先在腦中思考這幾個問題:

  1. 是前者造成了後者,還是,後者造成了前者其實也說得通呢?——就像「性生活和身體健康」的例子。
  2. 有沒有其他可能的原因,也會造成同樣結果?——就像死刑嚇阻力的例子。
  3. 有沒有隱藏變因會同時影響兩者?——就像「冰淇淋和溺水」和經典的「棉花糖實驗」的例子。
  4. 有沒有可能是純屬巧合?
圖/GIPHY
-----廣告,請繼續往下閱讀-----
所有討論 5
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

0
0

文字

分享

0
0
0
抽血可以輔助乳癌檢測? 從德國烏龍事件談被誇大的科學新聞
旻諭_96
・2019/11/22 ・2535字 ・閱讀時間約 5 分鐘 ・SR值 579 ・九年級

-----廣告,請繼續往下閱讀-----

今 (2019) 年二月,德國海德堡大學附屬婦科醫院發布新聞稿,聲稱教授索恩 (Christoph Sohn) 的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。

什麼?!只要抽血就可以知道有沒有得乳癌嗎?

該篇新聞稿內容指出,雖然這項技術不能直接取代乳房 X 光攝影檢查,但可以當作早期檢測,且偽陽率(沒有乳癌卻被判斷成有乳癌的機率)只有乳房 X 光攝影檢查的一半。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用。

索恩的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用 。圖/basker_dhandapani @pixabay

奇怪的是,索恩同 (2) 月在德國杜塞道夫的另一場研討會中,說法又大不相同。根據德國線上雜誌 MedWatch 的報導,索恩的演講投影片上顯示該測試的特異度為 45~73%,相當於高達 55% 的偽陽率,幾乎是每兩位女性就有一位會被判斷為乳癌患者。看來這個以抽血看有沒有得乳癌的方法還不是太可靠註1

-----廣告,請繼續往下閱讀-----

哪個環節出了問題?科學公關化妝化過頭

從上述的案例中,我們可以發現,這項「用血液檢測有沒有得乳癌」的檢測方式,明明有高達 55% 的偽陽率,卻在醫院發布的新聞稿中,被說是「乳癌檢測的重大里程碑」,嚴重地誇大了好幾個層級。但究竟為什麼新聞稿跟原始研究可以差這麼多呢?

這攸關於「公關」的角色。

在科學研究組織中的公關單位,必須擔負「提升組織名譽」的重擔。現在各大學相互競爭學術排名的情況下,大學公關透過各方管道(包含亮眼的科學研究成果)來「行銷自己」變得十分重要。因此,科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。

科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。圖/MichaelGaida @pixabay

然而,科學公關作為「學術界」和「媒體界」的橋樑 (Sumner et al, 2014),時常會遇到裡外不是人的窘境。公關單位一方面必須把科學知識講簡單,一方面又要擔任科研組織的化妝師,行銷自己、提高組織的知名度;因此常常沒辦法站在客觀與批判的角度檢視科學研究成果。容易造成問題的情況是,有時候公關單位會化妝化過頭,過去研究顯示,學術單位公關發布的新聞稿也常有機會成為錯誤的資訊來源本身。

-----廣告,請繼續往下閱讀-----

誇大的科學新聞不是記者的錯?公關也可能參一腳

英國卡迪夫大學腦研究成像中心 (Cardiff University Brain Research Imaging Centre) Petroc Sumner 教授的研究團隊發現,與健康科學的新聞中,容易出現三種常見的錯誤:

  1. 過度延伸的建議(呼籲讀者改變行為)(exaggerated advice)
  2. 把「相關」描述成「因果關係」(exaggerated causal claims)
  3. 把「動物」研究成果不當延伸,應用在人類身上 (exaggerated inference to humans from animal research)

然而,研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。

研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。圖/截圖自參考資料 3

研究團隊從英國排名前 20 名的大學取得共 462 篇和健康相關的公關稿,再分別往前往後挖看看同一個研究的原始論文和科學新聞。(原始論文是一定有啦,但有些公關稿不一定會成為新聞題材。)

-----廣告,請繼續往下閱讀-----

研究團隊比較了原始論文、公關稿和科學新聞三種版本的文章,發現有 40% 的公關稿含有過度延伸的建議;33% 的公關稿含有把「相關」描述成「因果關係」的錯誤;36% 的公關稿含有把「動物」研究成果不當延伸,應用在人類身上的錯誤。

研究更進一步顯示,當公關稿含有這些誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。

這張圖的上、中、下,分別代表公關稿或新聞稿包含「過度延伸的建議」、「把相關描述成因果關係」、「把動物研究成果不當延伸,應用在人類身上」。右半邊的白色長條圖示,代表當公關稿內含有誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。圖/參考資料 3 圖 2

讀科學新聞要小心,遇到誇張的研究結果要有所警惕

文章看到這裡,或許你會很驚訝:「原來我以前都錯怪記者了,公關稿也可能有過度延伸的問題。」但這項研究結果也不是要你開始改罵公關單位,畢竟公關單位常常有和其他大學競爭的壓力。

-----廣告,請繼續往下閱讀-----

但其實民眾如何理解科學新聞的內容,會直接影響到民眾的實際行為。因此,科學新聞怎麼描述健康相關資訊,真的是一件不能馬虎的事情。(就好比看到抽血可以驗乳癌就開心以為不用去照 X 光檢查,或是看到「常咀嚼固態食物可預防失智」就不顧吃什麼健康不健康的嚼嚼就對了……)

「常咀嚼固態食物可預防失智」並不代表就不用管吃什麼健康嚼嚼嚼嚼就對了。圖/Comfreak @pixabay

不過更聰明的你一定想到了這個解方:當我們看到誇張的科學研究結果,別看到標題就自己腦補胡亂相信,要記得仔細看看內文,有沒有把相關研究講成因果關係,或是把動物研究結果延伸到人類身上(畢竟只有 10% 的非人類研究結果可以成功類推到人類身上)。如此一來,就算遇到了懸疑的科學新聞,你也有可以判斷真偽的能力!

註解

  1. 儘管索恩在研討會的記者會中遭受質疑,他仍拒絕回答任何與該測驗「偽陽率」相關的問題。五月,海德堡大學附屬婦科醫院認為,索恩必須為他的錯誤言論負責。經過幾個月的調查,大學委員會在上個月底舉行記者會,說明調查結果證實索恩宣稱以抽血檢測乳癌是「嚴重的不當行為」。根據報導,索恩已遭停職(包含教學與研究)3 個月,並即將接受大學的紀律調查。

參考資料

  1. German university finds ‘severe’ misconduct by researcher who promoted questionable cancer blood test. Science, 2019.10.25
  2. FORSCHER DES UNIVERSITÄTSKLINIKUMS HEIDELBERG ENTWICKELN ERSTEN MARKTFÄHIGEN BLUTTEST FÜR BRUSTKREBS. Newsroom UKHD, 2019.2.21
  3. Sumner, P., Vivian-Griffiths, S., Boivin, J., Williams, A., Venetis, C. A., Davies, A., … & Boy, F. (2014). The association between exaggeration in health related science news and academic press releases: retrospective observational study. Bmj, 349, g7015.
-----廣告,請繼續往下閱讀-----
文章難易度
旻諭_96
14 篇文章 ・ 2 位粉絲
大學主修生科,研所跳槽科學教育,目前正努力想要聰明又科學的活著。