5

603
9

文字

分享

5
603
9

相關、因果,傻傻分不清楚

活躍星系核_96
・2022/03/10 ・3495字 ・閱讀時間約 7 分鐘

本文轉載自 Liou YanTing 臉書【相關、因果,傻傻分不清楚】

文/劉彥廷

你一定曾經在網路上看過類似像這樣的研究:

  • 「婚禮花費越高,離婚率越高」
  • 「家中藏書越豐富,小朋友越聰明」
  • 「性生活越活躍的人,越少生病,身體越健康」
  • 「抽雪茄的人更長壽」

不曉得你看到這些訊息時,第一反應會是什麼?

是嘴角上揚,莞爾而笑;還是點點頭,對結論表示贊同;又或者是眉頭緊蹙,心想:「嗯……好像哪裡怪怪的。」面對這些試圖告訴你「兩個事件關聯性」的資訊,有思辨習慣的人,會如何思考、解讀它們呢?

-----廣告,請繼續往下閱讀-----

今天,就來和你分享一下,要正確理解這些訊息,得先有個概念,叫做——「相關,並不等於因果」。

圖/劉彥廷

冰淇淋銷售量與溺死人數

重要的事多說一遍:「相關,不等於因果。」

舉個經典的案例,「研究發現,冰淇淋銷售量越高,溺水死亡人數越多」,也就是「冰淇淋銷量」和「溺死人數」這兩個事件,或者說變數——呈現了「高度正相關」。

相信看到這樣的訊息,任何心智能力正常的人,都不會下結論說:冰淇淋「造成」了溺水。因為所有人都知道,「冰淇淋銷量」與「溺死人數」雖然有相關,但它們並沒有因果關係。

那問題就來了,「為什麼沒有因果關係的兩個事件,彼此會有相關呢?」

聰明的你,一定已經想到了。在這個例子的背後,藏著另一個變因,叫做——「季節」。在夏天,冰淇淋賣得好,銷售量高;同時,在夏天,去玩水的人比較多,意外溺水身亡的人也比較多。這兩個「獨立的事件」,同時並列在一起,就讓「冰淇淋銷量」和「溺死人數」有了相關性。

-----廣告,請繼續往下閱讀-----

一旦我們將「季節」這個變因排除,用科學語言來說,叫做「控制住」——兩個事件的相關性就消失了。

表面上相關的史丹佛棉花糖實驗

在日常生活中,有些事件的相關性很單純,就像冰淇淋與溺水的例子,不會讓人誤判,讓人真的以為它們有因果關係。但有很多例子,就沒這麼容易判斷了,甚至,連受過專業訓練的科學家也會誤判。例如你可能聽過的經典實驗——「史丹佛棉花糖」實驗。

史丹佛大學的研究人員找了一群孩子,讓他們單獨待在房間中,並在面前放置一顆棉花糖,接著告訴他們:「如果你能堅持 15 分鐘,不把這顆棉花糖吃掉,你就能得到兩顆棉花糖。」

之後,研究人員對這些孩子們進行了多年的追蹤,並得出一個結論:「那些沒有在一開始吃掉棉花糖的小朋友,也就是擁有『延遲滿足能力』的小朋友,有更好的人生表現。」

這個實驗的結論以及它帶來的啟發,對兒童教育有著極大的影響。許多家長、老師都不約而同的,開始強調要訓練、培養孩子的「延遲滿足能力」。你在博客來搜尋「棉花糖」這幾個關鍵字,也能查到一堆親子教養的書籍。

但你知道嗎?這個實驗結論已經被證明是有問題的了!

後來有研究團隊又重複做了實驗,但這次,他們特別將「家庭背景」這項因素控制起來,結果發現,「延遲滿足能力」與「未來成就」的相關性就不見了。

-----廣告,請繼續往下閱讀-----

什麼意思呢?翻譯成白話文就是:決定小朋友未來成就的主要因素,並不是什麼延遲滿足的能力,而是你家裡有沒有錢啊!

那些家裡有錢的小朋友,對他們來說,平常有太多機會可以吃到好吃的糖果、零食,當然實驗時,更容易忍住不吃棉花糖;而家裡越有錢,將來越有機會取得成功,這不是很理所當然的事情嗎?

你看,連這麼有名的實驗,都會犯「相關不等於因果」的錯誤。那我們應該如何正確地看待,這些「表面上有相關」的兩個事件呢?

有相關的五種可能性

當我們說 A 和 B 有相關時,從邏輯的角度來看,有五種可能,接下來我們會依序來舉例說明一下。

圖/劉彥廷

相關不是因果,是 A 造成 B,還是 B 造成 A?

舉個例子,研究發現「性生活越活躍的人,越少生病,身體越健康」。

這則訊息最直觀的解讀也許是,「性生活會讓人更健康」,這叫 A 造成了 B。但有沒有可能反過來是 B 造成了 A 呢?也就是──不是性生活讓人健康,而是越健康的人,才可能有活躍、高頻率的性生活啊!

這樣的思考、解讀,是不是也是一種可能,而且更合理呢?

-----廣告,請繼續往下閱讀-----

並非是完整的原因,A 造成 B,但 C 也會造成 B

這種情況簡單來說,就是「一果多因」。我們在現實世界遇到的許多問題,都屬於這一類型。

舉個例子,如果想要證明「死刑具有嚇阻力」,你覺得,需要什麼樣的數據或資料呢?以下是兩種常見的答案:

  • 第一種,上網找已經廢除死刑的國家,比較這個國家在廢除死刑前後,犯罪率的變化。如果在廢除死刑後,犯罪率有顯著的上升,那麼就證明了——「死刑的確具有嚇阻力」。
  • 第二種,上網找找看,有沒有「曾經」廢除死刑,但之後又恢復死刑的國家,比較這個國家在恢復死刑前後,犯罪率的變化。如果在恢復死刑後,犯罪率有顯著的下降,那麼就證明了——「死刑的確具有嚇阻力」。

這兩種答案,雖然切入的角度不一樣,但背後的思考邏輯都相同,都是試圖以死刑和犯罪率的「因果關係」,來證明死刑具有嚇阻力。

但如果我們再多想一層,這兩組數據,真的可以證明「死刑和犯罪率具有因果關係」嗎?要知道,犯罪是一個複雜的社會問題,影響犯罪率高低的原因有很多,而有沒有死刑,只是眾多原因之一,並不是唯一。

-----廣告,請繼續往下閱讀-----

所以,以第一組數據來說,一個國家在廢除死刑後,犯罪率上升。除了廢死這個原因,導致了犯罪率上升外,還有沒有可能有其他原因?比如說,在廢除死刑時,剛好遇到了金融海嘯,或是某個重大災難,導致社會動盪不安、失業率上升,犯罪率也連帶跟著上升。

同樣道理,對於第二組數據來說,一個國家在恢復死刑後,犯罪率下降。除了死刑導致犯罪率下降這種解釋外,有沒有一種可能是,犯罪率下降的原因,是因為這個國家基礎教育做得好、人民素質足夠高,即便沒有死刑,犯罪率也會下降。

在沒有「排除」、「控制」影響犯罪率的「其他變因」之前,如何保證犯罪率的上升或下降,真的是因為死刑存廢所造成的呢?

C 造成 A,同時,C 也會造成 B

前面提到的「冰淇淋與溺水」、「棉花糖實驗」都是這樣的例子,也就是存在一個「隱藏變因」C,同時影響了 A 和 B,以下我再提幾個例子:

  • 像是「家中藏書越豐富,小朋友越聰明」,你覺得是大量的藏書,讓孩子變得更聰明了,還是有其他隱藏變因,會讓家中藏書更豐富,同時,也會讓小朋友更聰明呢?
  • 又或者是「哈佛畢業生薪水比它校畢業生高」,你覺得是念哈佛,會讓你薪水更高,還是有其他隱藏變因,會讓你容易申請上哈佛,同時,也容易拿到較高的薪水呢?

聰明的你,一定能想到答案。

偽相關,又稱「純屬巧合」

這種純屬巧合的相關,也被稱為「偽相關」。美國有個網站,就蒐集了許多偽相關的數據案例,其中有不少讓人哭笑不得的例子。

-----廣告,請繼續往下閱讀-----

例如:「影星尼可拉斯凱吉拍過的電影」和「游泳池溺死人數」,呈現高度正相關;「美國小姐的年齡」和「因取暖設備喪命的人數」,也呈現高度正相關。

看到「有關聯性」,先別急著下定論

行文至此,也寫了快 3000 字。

感謝你願意看完這篇文章,在注意力稀缺的時代,要在社群媒體上看完一篇 3000 字的文章,實屬不易;希望你的大腦還承受得住,沒有當機。

最後總結整理一下,以後若看到一則訊息,試圖告訴你「兩個事件的關聯性」時,在接受它之前,不妨試著先在腦中思考這幾個問題:

  1. 是前者造成了後者,還是,後者造成了前者其實也說得通呢?——就像「性生活和身體健康」的例子。
  2. 有沒有其他可能的原因,也會造成同樣結果?——就像死刑嚇阻力的例子。
  3. 有沒有隱藏變因會同時影響兩者?——就像「冰淇淋和溺水」和經典的「棉花糖實驗」的例子。
  4. 有沒有可能是純屬巧合?
圖/GIPHY
-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 5
活躍星系核_96
776 篇文章 ・ 130 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
0

文字

分享

0
0
0
肺部為何會「結疤」?揭開比癌症更致命的「菜瓜布肺」,科學家如何找到破解惡性循環的新契機
鳥苷三磷酸 (PanSci Promo)_96
・2026/05/08 ・2041字 ・閱讀時間約 4 分鐘

本文由 肺纖維化(菜瓜布肺)社團衛教 合作,泛科學撰文

在現代醫學的警示清單裡,乳癌、大腸癌這些疾病大家都不陌生;但有一個「隱蔽且致命」的威脅卻常被忽視,那就是「肺纖維化」。其中最常見的類型「特發性肺纖維化」(IPF),其預後往往不太樂觀,確診後的五年存活率甚至比許多常見的癌症還低。

首先,我們得先破解一個迷思:肺纖維化並不是單一疾病,而是許多種間質性肺病的共同表現。當我們聽到「肺纖維化」,腦中常浮現「菜瓜布肺」的形象,患者的肺部外觀充滿一個個空洞與疤痕,像極了乾燥的絲瓜。這精準描繪了肺部組織逐漸硬化、失去彈性的過程。

更重要的是,IPF 這類肺纖維化的威脅在於「不可逆」的特性,一旦形成就很難逆轉。這跟部分 COVID-19 康復者身上、仍有機會復原的肺纖維化,是兩種完全不同的概念。

-----廣告,請繼續往下閱讀-----
IPF 這類肺纖維化的威脅在於「不可逆」的特性,一旦形成就很難逆轉 / 圖示來源:shutterstock

肺部為何會變成「菜瓜布」?

為什麼好端端的肺會變成菜瓜布?這其實是一場身體修復機制失控的結果。

「纖維化」的組織,就是肺部間質組織(interstitium)的疤痕化。間質是圍繞在肺泡周圍,包含血管與支持肺部結構的結締組織。在正常情況下,肺部損傷後會啟動修復機制,並再生健康組織。但在肺纖維化的患者體內,這套修復機制卻「當機」了。

身體會不斷地發出訊號,導致負責修復工作的「纖維母細胞」(fibroblasts)被過度活化,進而失控地沉積膠原蛋白疤痕組織,最終在肺部形成永久性的纖維化。

科學家發現,這個過程之所以棘手,在於它是一個「惡性循環」,肺部同時存在著「發炎反應」與「纖維化」這兩條路徑 ,它們相互加乘,演變成難以阻斷的強大破壞力。

-----廣告,請繼續往下閱讀-----

雖然特發性肺纖維化 (IPF) 的具體成因不明 ,但已知某些特定族群的風險更高。例如抽菸,特定年齡與性別(50歲以上男性)、長期暴露於粉塵環境的工作者(農業、畜牧業、採礦業…)、胃食道逆流者。此外,患有自體免疫疾病(如類風濕性關節炎、乾燥症、硬皮症、皮肌炎/多發性肌炎,)的患者,他們併發肺纖維化的機率遠高於一般人,必須特別警覺。

雖然特發性肺纖維化 (IPF) 的具體成因不明 ,但已知某些特定族群的風險更高。/ 圖示來源:shutterstock

打斷惡性循環的挑戰,為何只對抗「纖維化」還不夠?

面對這個不可逆的疾病,醫學界長年束手無策,直到 2014 年才迎來一道曙光。美國 FDA 批准了兩種機制不同的新藥:Nintedanib 和 Pirfenidone。這兩種藥物的出現是治療史上的分水嶺,首度被證實能夠「延緩」IPF 患者肺功能的惡化速度。

然而,這場戰役尚未結束。現有的治療雖然帶來了希望,卻也凸顯了「未被滿足的醫療需求」。從機制上來看,這些藥物主要抑制的是「纖維化路徑」。

這讓科學界開始思考這個未被滿足的棘手問題:既然疾病的本質是「發炎」與「纖維化」的雙重打擊,那麼,我們是否能找到「同時抑制」這兩條路徑的全新策略,從而更有效地打斷這個惡性循環?

-----廣告,請繼續往下閱讀-----

找到同時調控「發炎」與「纖維化」的新靶點

為了解決難題,科學家將目光鎖定在一個細胞內的酵素:磷酸二酯酶 4B(PDE4B)

為什麼鎖定它?讓我們看看它的「雙重作用」機制:

  1. 關鍵位置: PDE4B 同時存在於免疫細胞(與發炎有關)與纖維母細胞(與纖維化有關)當中。
  2. 作用機制: PDE4B 的主要工作是降解細胞內一種叫 cAMP(環磷酸腺苷) 的訊號分子。cAMP 可以被視為細胞內的「穩定信號」。
  3. 雙重抑制: 當我們使用藥物抑制了 PDE4B 的活性,細胞內的 cAMP 就不會被分解,濃度會隨之升高。高濃度的 cAMP 能穩定免疫細胞和纖維母細胞,同時產生抗發炎抗纖維化的雙重效應。

簡單來說,鎖定並抑制 PDE4B,就像是同時抑制了免疫風暴與纖維化的工程,有望從雙從抑制打擊這個惡性循環。

全球臨床試驗帶來的新希望

近十年來,全球在肺纖維化領域投入了大量的臨床試驗,我們相信,在科學家逐步破解肺纖維化惡性循環的複雜難題後,期盼未來能為無數患者爭取到更安全、健康的生活與未來。

-----廣告,請繼續往下閱讀-----

最後,我們必須再次提醒,特發性肺纖維化(IPF)與漸進性肺纖維化(PPF)是極具破壞性、且不可逆的疾病。面對這個比癌症更致命的對手,雖然現有的治療手段能延緩惡化,但無法逆轉已經形成的肺部疤痕組織,因此「早期診斷、早期治療」仍是對抗肺纖維化最重要的黃金時刻。

必須再次提醒,特發性肺纖維化(IPF)與漸進性肺纖維化(PPF)是極具破壞性、且不可逆的疾病。/ 圖示來源:


-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

2

3
7

文字

分享

2
3
7
逼近上帝視角——用「統計學」探討因果關係
研之有物│中央研究院_96
・2022/06/15 ・4942字 ・閱讀時間約 10 分鐘

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/郭雅欣、簡克志
  • 美術設計/蔡宛潔

因果關係怎麼研究?

在日常生活的經驗裡,我們往往習慣以主觀的角度來認定因果關係的存在,但在數理統計的協助下,因果關係可以擁有科學定義,並且可以驗證。中央研究院「研之有物」專訪院內統計科學研究所黃彥棕研究員,他的主要研究便是以數理統計的方式來探討因果關係(例如生物體的複雜機轉)。有了統計方法,人類也能接近上帝視角,找出因果關係的存在。

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係。圖/研之有物

以數理統計驗證因果關係

我們絕大多數人相信「凡事必有因果」這句話,例如今天腹瀉,是因為昨天晚餐吃壞肚子;考試沒考好,是因為書念得不夠。但是仔細想想,造成今天拉肚子的原因,除了昨天的晚餐之外,還有沒有別的可能?影響考試成績的因素,除了書念得夠不夠之外,考試環境、考題難易度也都會影響。

所以,我們究竟該如何確定兩件事有因果關係?有沒有什麼科學方法,可以讓我們帶著十足的把握,說出「X 就是造成 Y 結果的原因」這樣的話語?

-----廣告,請繼續往下閱讀-----

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係,除此之外他更進一步在數學上探討「X 透過何種機制造成 Y」,也就是所謂的「因果中介效應」。有興趣的讀者,可以參考「研之有物」之前專訪黃彥棕老師的文章〈喝酒臉紅易罹癌?小時候家裡窮會胖?統計學家黃彥棕來解答〉。

回到因果關係,黃彥棕說到:「因果關係是屬於上帝視角。」也就是說,兩件事之間究竟有無因果關係,理論上只有全知者才知道,而我們能做的,是以數理統計的方式,「從人類視角盡可能地逼近上帝視角,來判斷因果關係是否存在。」

何謂因果關係?

為什麼說「因果存在與否只有上帝才知道」?因果關係建立在「反事實」,如果有一個事實是「打疫苗,就不容易感染 COVID-19」,則我們必須驗證是否「不打疫苗,就容易感染 COVID-19」,這就是反事實。有了事實與反事實的比對,我們才能說「打疫苗」與「不易感染 COVID-19」有因果關係。

不過,除非有時光機或平行宇宙,否則我們不可能讓全世界的人打疫苗,並觀察感染情況;然後又讓全世界的人都不打疫苗,並再次觀察染病狀況。只有全知者才能同時觀察這兩個平行宇宙,得知因果關係。黃彥棕說,身處現實世界的我們,只能盡可能地逼近這個結果。

-----廣告,請繼續往下閱讀-----

用數學語言來描述因果關係,最被廣泛使用的架構是由美國統計學家 Donald Rubin 提出的反事實結果(counterfactual outcome)或潛在結果(potential outcome)。值得一提的是,過去 Rubin 也曾與 2021 年諾貝爾經濟學獎得主 Joshua Angrist 和 Guido Imbens 共同發表重要論文〈使用工具變量確認因果效應〉。

以下我們就以疫苗和傳染病為例,以反事實架構來說明「X 導致 Y」的群體因果效應。先假設 X 為民眾施打疫苗與否( 0:不打疫苗,1:打疫苗),而 Y 為得傳染病與否(0:不染病,1:染病),並使用期望值 E 來描述群體平均效應,詳細如下圖。

為了要取得因果關係,我們必須有兩個獨立的平行世界,分別是 X=1 和 X=0,再去比較這兩個世界中 X 如何導致 Y 的發生。圖/研之有物
(資料來源|黃彥棕)

如果我們觀察到 E[Y(X=1)]=0.1,也就是有打疫苗的人染病機率是 10 %。那麼在反事實因果推論的基礎上,我們必須檢驗 E[Y(X=0)] 等於多少,也就是不打疫苗的染病機率。只要 E[Y(X=1)] ≠ E[Y(X=0)],就代表 X 和 Y 之間具有因果關係。

然而,實務上打完疫苗的人不可能再回復到沒打疫苗的狀態,因此我們沒有辦法再次對同一群母體樣本做實驗來驗證因果關係,僅能退而求其次,「盡量貼近」因果關係。那麼,要怎麼做呢?

-----廣告,請繼續往下閱讀-----

有反事實的對照,才有因果關係。

逼近神的因果視角

如果我們把全世界的人分成兩半,其中一半打疫苗、另一半不打疫苗,然後用打疫苗的那一半代表一個宇宙(事實),不打疫苗的代表另一個宇宙(反事實),不就創造出兩個平行宇宙了嗎?

這是一種很直觀的逼近方法,但若要讓一半的人能夠代表一整個宇宙,則有一個重要的前提:這兩個宇宙裡的人是隨機分配的,也就是這兩群人在各個層面都很相似,例如年齡、性別、健康狀況甚至政治傾向等,以專業術語來說就是必須具有可互換性(exchangeability)。藥廠在做疫苗人體實驗時,就必須以非常嚴謹的方式讓受試者盡可能達到隨機分配,才能得到「疫苗是否有效」的科學結果。

不過,在大多數狀況下,我們很難做到隨機分配。舉例來說,臺灣開放施打 COVID-19 疫苗後,截至 2021 年 10 月 29 日為止,有將近 1700 萬人施打第一劑疫苗,但我們不能把這 1700 萬人視為有打疫苗的宇宙,而另一群沒打疫苗的 600 萬人視為沒打疫苗的宇宙,因為打不打疫苗是人民自由選擇的結果,有很多因素會影響個人選擇,例如比較有健康意識,或是比較年輕、不擔心副作用的人,可能就比較傾向打疫苗。

即使統計結果顯示出打疫苗的人,感染 COVID-19 的比例真的比較低,我們也很難分辨是因為打疫苗,還是他們本來就比較年輕?或本來就比較健康?「這是所謂的『觀察型研究』,容易出現因果推論謬誤的原因。」黃彥棕說。

-----廣告,請繼續往下閱讀-----

然而,我們可以用數理統計的方式逼近真實的因果效應,例如控制年齡、健康狀況——兩方都取 50~60 歲的年齡層,並且都是沒有心血管疾病的人等。黃彥棕說:「我們依據自己的背景知識,知道有哪些因素會影響隨機性,然後使用統計的方式,把它們抓出來做控制。」

理論上統計學家可以把所有可能造成偏誤的因子都舉出來,透過一層層地篩選、限縮,最後得出許多個小小的族群,讓隨機性成立。

之後,透過每一組小小的隨機族群(例如年齡 50~60 歲、沒有心血管疾病、男性、具健康意識……等,統稱為 C),讓 Y 的發生和特定條件 C 之下的 X 群體無關,我們就可以得到逼近兩個平行宇宙的資料(有打疫苗、沒打疫苗),最後再把各族群的結果加權平均回來。就可以貼近上帝視角的因果效應。

以數學語言來說,就是讓條件期望值(E[Y|X=x , C=c)])的計算透過加權平均等同於反事實結果之期望值(E[Y(X=x)])的效果。我們沒有時光機,無法透過事實/反事實結果之期望值檢驗全體打疫苗和不打疫苗的因果關係(E[Y(X=1)] ≠ E[Y(X=0)] 嗎?);但是我們可以透過各種條件的篩選和限縮,去計算每個具備可互換性小群體的條件期望值,最後加權平均回來,檢視打疫苗與得病與否的因果關係(∑c E[Y|X=1 , C=c]*P(C=c) ≠ ∑c E[Y|X=0 , C=c]*P(C=c)嗎?),這才是實務上的作法。

問題來了,要怎麼知道我們是否窮舉了所有可能造成偏誤的因子?我們的確不知道,只有上帝知道,這是個假設,而且是個很難驗證的假設。

實務上,我們不可能同時觀察 X=1 和 X=0 的世界,只能分別獲得 X 和 Y 的相關性。要如何從相關性去檢視因果關係呢?透過統計學上的篩選和限制,我們如果可以讓 X=1 vs. X=0 的隨機性成立,就可以進一步驗證 X 和 Y 的因果關係。為方便說明,圖片的數學式為簡單條件期望值計算,不考慮加權平均。圖/研之有物(資料來源|黃彥棕)

「在控制了年齡、性別、健康狀況等條件的情況下,我們希望可以讓隨機性成立。」

黃彥棕的研究讓因果關係在嚴謹的數學架構下,得以辨證、溝通,而不是只仰賴直觀的思考。因果的存在變得更加科學化,而這也使因果的探討可以進入更深的層次。

-----廣告,請繼續往下閱讀-----

被競爭結果和時間擾亂的因果關係

更進階的因果探討層次,是將時間因素考慮進來。黃彥棕以「B 型肝炎」造成「肝癌」,然後導致「死亡」為例,若想探討這三者間的因果關係時,會發生一個問題,那就是有 B 型肝炎的人,有可能容易因猛爆性肝炎而直接死亡,而這樣的個案在統計上,因為他並沒有得到肝癌,而對「肝癌」這個中介因子造成了「保護」的效果。

「這就是肝癌和死亡這兩個競爭結果造成的影響,而這個競爭關係又會隨著時間推移而改變。肝癌、死亡有時間進程關係,一旦 B 型肝炎患者因猛爆性肝炎死亡了,他就不可能再得肝癌。」更清楚地說,B 型肝炎患者可能還「來不及」得肝癌,就因猛爆性肝炎直接跳到死亡。在界定 B 型肝炎與肝癌之間的因果關係時,這樣的結果會造成偏誤。

黃彥棕將時間因素考慮進來的方法,是把整個時程切割成非常多小段,在每個小段創造一個反事實架構,也就是分析每一位在某小段時間活著的 B 型肝炎患者,把他們分成已得到肝癌及還沒得到肝癌,並考慮這兩組患者在下一個瞬間死亡的可能性,再將這些結果積分起來,得到在隨機過程架構之下的平行宇宙們。

「我等於是在每一個瞬間都製造多個平行宇宙(無 B 肝/無肝癌、無 B 肝/有肝癌、有 B 肝/無肝癌、有 B 肝/有肝癌)出來,這樣做可以避免前面說的蓋牌效應。但你可以想像我所得到的平行宇宙數量……嗯,就跟《奇異博士》看到的差不多。」

「我認為我在這領域的部分貢獻,或許是提出了這樣一個會隨著時間推移的反事實架構。」黃彥棕說。他的論文發表出來後不久,也引起了期刊的興趣,邀請了相關領域的許多專家,探討他所提出的因果模型。

-----廣告,請繼續往下閱讀-----

研究因果的動機

談起對因果關係研究的動機,黃彥棕說,以前在醫學系實習時,會看到開同樣的藥給病人,有些病人會好,有些人不會。這種「不確定性」開始讓他覺得好奇。他說:「我可以接受事情就是會有隨機性,但還是很想搞清楚這樣的不確定性是怎麼來的。」

最近,黃彥棕也發現許多人會把「預測」和「因果」搞混,尤其是現在人工智慧(AI)發展出的預測模型表現愈來愈好,有些做 AI 預測模型的人,會誤以為能夠用預測表現良好的模型,來得到因果關係。

舉例來說,一個模型可以透過一個人是否抽菸,來預測他得肺癌的機率,也可以透過一個人身上是否攜帶著打火機,來預測肺癌機率。「但我們知道抽菸與肺癌有因果關係,而帶打火機與否應該是不會造成任何增加肺癌風險的生物效應的。」黃彥棕說。

「抽菸」與「帶打火機」都能成為 AI 模型預測肺癌時採用的因子,但顯然並非代表它們與肺癌都有因果關係。黃彥棕接著說:「雖然預測未必需要因果關係,但是,決策就需要因果關係的支持。若要降低肺癌風險,政府較合理的做法是下令禁菸,而不是禁打火機。但要看到因果是比較困難的,它先天上的限制使它難以驗證,這個挑戰也是因果推論的迷人之處。」

-----廣告,請繼續往下閱讀-----

最後,黃彥棕切身感受到因果關係的重要性,尤其是藥廠研發藥物或是臨床醫學等領域的應用。而他在反事實架構上考慮時間因素的突破,讓因果推論的知識又更往前推進。反事實因果推論的數學模型,讓人類能夠有深刻的思考,去檢視深藏在直觀表面之下的因果性與相關性。

延伸閱讀

-----廣告,請繼續往下閱讀-----
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3914 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook