這篇長評分兩部分,第一部分試以因果圖回應書中對流行病學研究的質疑,第二部分反駁作者對反事實的描述。
雖然我不是相關專業,也才剛撿回腦袋,但我知道這篇文章的排版跟圖片畫質都很糟,還請見諒QWQ。
一、為什麼要調查河流汙染區域的癌症發生率?因果圖拆解邏輯給你看
理想上,因果理論需大量仰賴反事實狀態,因此這些研究設計會因為幾個原因而顯得不完美。許多因素會決定一個人為什麼會在某個團體之中,而不是在其他團體之中。因此,要分析出最重要的因素向來不是件容易的事。假設我們要進行一個研究,探討住在河流汙染區附近是否會增加人們罹患某些癌症的風險。
但也許,住在河附近的人有比較多船,所以本來就較容易暴露在船的燃料毒氣中;或是這些人就在造成河流汙染的工廠工作,整個人常暴露在並沒有排放到水裡的化學物中。這時若研究者在住在汙染區附近的群體身上發現更多癌症案例,他們該如何判斷問題究竟是水汙染、吸入船隻燃料的氣體,還是在工廠觸摸有毒化學物質所致?
作者反對的因果關係,以及第二段提出的假設,分別如圖一與圖二所示。
如果研究要針對圖二的因果圖設計實驗,檢驗成因並區分水汙染、船隻廢氣與工廠致癌物三種可能成因,該怎麼做呢?
想要區分因子就必須掌握差異,但若想掌握差異,就必須先了解三種因子引起癌症的可能途徑,對吧?
水汙染導致癌症的途徑,可能經由飲食或皮膚暴露於受汙染水源引起;船隻廢氣則需人體暴露於氣體之中,受害者分布的範圍,會與氣體於地理環境擴散的特性有所關聯;工廠致癌物則可能透過呼吸、飲食與皮膚接觸引起癌症,但相對於水汙染與船隻廢氣,即便船廠員工不住附近也仍會遭殃,與居住地的關聯較弱。
實線箭號代表假定或已確立的因果關係,虛線則是懷疑存在但有待檢驗的關聯。根據上一段假定(assumption)更新的資訊——三種可能毒物的分布特性與致癌途徑——因果圖可以更新為圖三。
(可觀測的因素應該以實心圓點標示,未知、無法區分或觀測的因素才該用空心點;水汙染攝取的途徑並不會導致居住地,而是居住地可能會導致吃到受汙染的食物……這次的因果圖不及格,下次會改進QAQ)
這種超不專業的因果圖能做什麼呢?
胡亂交作業然後氣死批閱審校者專用QWQ????????
因果圖能呈現因果關係架構,設計好的話可以去做路徑分析,但就算沒設計好,也能展示流行病學研究的研究邏輯好東西不學嗎。
從「河流汙染區域是否某種癌症盛行率或發生率異常高」著手,並不是真的在檢驗住在河流汙染區域附近是否會導致癌症,而是像個探針,在刺探背後未知因素與其因果機制存在的可能性。綜合性別、年齡、職業、生活習慣、健康狀態、家族病史、居住區域、種族等多種變因,研究可以分辨出未知成因的可能類型。
(流行病學研究的盛行率在描述族群的健康狀態,為靜態的分布,而發生率則是描述健康事件的發生,是動態機制。就像今天你與其他人受困在崩塌建築物內,盛行率描述的現場有多少傷亡人員,可能包含災難發生前的老弱傷殘,而發生率則是描述新增的傷亡,代表現場還存在健康事件發生的機制。)
利用先備知識建構合理的架構,依此提出假說,再進一步應用否證法去設計實驗、檢驗假說。就像有了台灣肝癌盛行率異常高的發現為契機,才有合理理據去申請研究經費作肝癌研究、糾出背後作祟的C肝病毒啊。
二、就是與事實相反才叫反事實啊!!!!!
科學家之所以不願使用這個字眼,往往和證據的強度無關,而是因為他們被要求使用反事實角度思考因果關係。除非有人發明時光機器,讓科學家親眼觀察到實際的反事實狀態,否則他們不願說出這個神奇字眼。
反事實敘述之所以被稱為反事實,正是指「若P則Q」的敘述當中,P 與已發生的事實不相符啊!!!!!!!!!!!! 要是直接根據觀測到的現象敘述,那就不能叫做反事實了好嗎!!!!!!
明明 X 發生了,卻相信如果 X 不存在,Y 就不會發生;明明 X 沒有出現,卻在探討要是 X 出現的話, Y 是不是就會跟著發生。哲學領域後來發展出的反事實敘述,雖然貼近人類因果推論直覺,但上個世紀的應用集中於哲學、心理學、歷史、法學與經濟學,自然科學領域除了流行病學之外,可說是與反事實完全絕緣。
本人生科畢業,目前還在抱著Judea Pearl的《The Book of Why》啃,邊惡補模態邏輯跟反事實。我數理統計的底子還沒打扎實,在重新認識科學,目前卻一天到晚想繞過 propositional logic 直接學 modal logic ,拜託路過大神噹大力一點QAQ
我不是相關專業,本篇長評也不是真的要講流行病學研究,僅是回應作者對流行病學研究的質疑,文中並未實際示範因果圖的說明方式,也不能代表流行病學的推論邏輯。
這篇文章不正式,別用來抄作業,亂抄會殘害閱卷者的眼睛和自己的腦袋…