分享本文至 E-mail 信箱

學術引用格式

MLA (點一下全選)

APA (點一下全選)

EndNote(.enw)

你們都誤會了,科學是個好大叔

科學像個偏執的大叔,他不斷犯錯,然後改正,又錯、再改,再錯,再改,用自己的臉去撞出一條通往真理的血路。媒體不應用他的一次面孔去描述他的全貌,而應該引導公眾正確解讀他的這一特點。

常看新聞的人都知道,大眾媒體幾乎天天都在報導「科學發現」。它們出現在新聞播報和時事評論裡,通常是被用來提出各種涉及健康、養育子女、教育乃至信仰、自我認識等重要事情的觀點。我們該如何對待它們呢?

舉例來說,至少從2004年起我們就一直聽到各種有關「維生素D可以預防風濕」 的研究。一份2010年約翰霍普金斯大學健康通告(2010 Johns Hopkins Heath Alert)顯示,「維生素D對關節的健康至關重要,維生素D水平低可能引發類風濕關節炎和骨關節炎等類風濕病情」。然而,在2013年2月,一項更嚴謹 的研究對此前的那些研究提出了質疑。類似的,儘管有很多研究表明,服用煙酸(也叫維生素B3或維生素PP)增加「好膽固醇」可以降低心臟病發作的風險,但 一項更嚴謹的研究表明煙酸並沒有這種效果。

像這樣的研究使得人們懷疑科學的可靠性。而有鑑於這些新聞一貫被報導的方式,產生這樣的懷疑也情有可原。如果科學發現都像這樣常常被推翻,那要它們又有何用?但是,問題通常都不是出在科學,而是在報導上面。

「不科學」的科學報導

在上述兩個例子中,早期研究顯示的都是「相關關係」,而非「因果關係」。 比方說,這些研究沒有表明服用維生素D是疼痛減輕和疼痛沒有減輕這兩者之間唯一不同的有關因素。也許服用維生素D的人同時還做了更多的運動,而這才是導致 疼痛減輕的原因。通常來說,確立因果關係而非相關關係最好的辦法,是進行一項隨機對照試驗(RCT),實驗組和對照組之間只有唯一的一個已知有關因素不 同。維生D和煙酸的例子都是後來的隨機對照實驗表明,先前的研究發現的都只是相關關係而已。

正確設置隨機對照實驗往往很困難,可能需 要很多年才能完成。因此,我們看到的大多數都只是涉及相關關係的研究。約翰•約安尼季斯(John Ioannidis)在他一系列備受關注的分析中指出(註:約安尼季斯在2005年發表的論文《為何大多數發表的研究都是錯誤的?》是 PLoS Medicine 迄今下載次數最多的技術論文),在發表出來的醫學研究中,有80%的非隨機研究(目前最常見的)結果都是錯誤的。就連25%的隨機研究和15%的大型隨機研究(好研究當中的好研究)也都存在種種缺陷。

那麼,明知道大部分結果都會錯,科學家幹嘛還要做這些相關性研究呢?其原因之一是,這類研究是非常好的開始,科學家用它們來決定之後要選擇哪一種假 說用更加嚴謹的隨機對照實驗去評估。與很多非科研工作者想的不同,實證檢驗法的關鍵特徵並不是它不會出錯,而是它具有自我糾錯的功能。正如物理學家約翰• 惠勒(John Wheeler)所說,「我們要做的就是儘可能快地犯錯。」 事實上,科學正是通過竭力證偽其假說來取得進步,卡爾•波普爾(註:Karl Popper,20世紀西方有影響力的哲學家)就是在這一觀點上創立了他那具有啟發性的科學哲學體系。

很多科學報導的問題,在於它們在確保公眾瞭解一項科研成果究竟有多重要這件事情上面做得不夠。好一些的,會暗暗地把結果中的相關性掩飾起來,例如, 維生素D「可能」減少關節炎疼痛,或者煙酸「或許能」減少心臟病發作。但這些報導很少說清楚,大多數的相關性研究是處在一個怎樣的階段,或者在多大程度上 可以依靠。它們沒有解釋這樣的研究通常在整個學科的進展中所具有的特異侷限性。

科學報導、特別是在心理學和社會科學的報導中,往往忽略了另一個重要的侷限。就算有了能夠確立科學定律的隨機對照試驗,並不意味著可以援引其結論來 指導實踐當中的決策。著名的科學哲學家南希•卡特賴特(Nancy Cartwright)近日強調,最好的隨機對照試驗本身只能證明一個原因只在一種特殊的情況下有效。例如,從相同的高度下落的羽毛和鉛球將在同一時間到 達地面——但只在沒有空氣阻力的條件下。通常情況下,科學定律使我們能夠預測一定條件下的某一個特定的行為。如果這些條件不成立,定律並沒有告訴我們會發生什麼。

在面對自然世界時,我們往往能夠建立起足以使有關定律成立的條件;而在人類(尤其是社會性的)世界,其高度複雜性和相互關聯性使得這種條件極難形 成。一種五年級數學的教學法,經過嚴格證明對這一學區的師生很有效,但可能在另一個學區就不管用了。就像卡特賴特所說的那樣,隨機對照試驗告訴我們的,只 是「這個在這種情況下有用」。「這個在那種情況下也會有用」完全是另一回事,而且證明起來往往異常困難。

由此,即使從「純科學」中得到了可靠的結果,還需要工程師來告訴我們,這些結果是否以及如何適用於具體的情況。自然科學(物理、化學、生物)已經建立了良好的工程方法;但在人類世界中,除了少數例外,仍有很長的路要走。在報導人文學科的「突破」時,需要明確區分理論和應用之間的差距。

建立「科學的」的報導體系

媒體傾向於把幾乎所有他們報導的科學成果都做得好像對生活具有指導意義。其實,大多數科研成果並沒有直接的實用價值;它們僅僅是把我們往那個或許最終真的有用的結果推進了小小一步。有太多的新聞報導都將實驗發現當成了可靠的消息,讓人以為可以據此採取行動。在大多數情況下,最好還是把這些發現當成是讓接下來可以少犯一些的錯誤。

如果有一個標識制度,能夠明確指出某一研究在其整個學科發展中所處的位置,科學報導將會大為改善。這僅僅是一個「初步的結果」(小型的啟發式研究, 旨在提出假設,其結果本身就需要接受很多進一步的檢驗,才能得出可靠的結論),還是 「更大規模的觀察性研究」(表明相關關係,但絕不是建立因果關係),或者是「大樣本的隨機對照試驗」(建立特定的條件下因果關係)?又或者,是一個「在很 多條件下都能成立的行之有效的科學定律」?

當然,像這樣分類只是我外行人的一個建議。各個學科應當(通過其管理機構和組織)設置專業的分類標準,對大眾媒體中報導的內容進行標註。一些這樣的制度是必須要有的,因為有很多關注通俗科研報導的人都在尋找科學發現,可以指導他們在生活、工作或公共政策實踐中進行決策。

不幸的是,這樣的成果比起初步研究結果來是少之又少(初步研究極有可能是錯的、但對於最終得出可靠結論的複雜過程是有貢獻的)。媒體報導說:「研究表明……」往往給我們的是非常初步的結果——極有可能是錯誤的。它們需要被標註出來。

資料來源:What Do Scientific Studies Show? NYT [April 25, 2013]
作者​Gary Gutting 是美國聖母大學的哲學教授

轉載自果殼網

關於作者

果殼網

果殼傳媒是一家致力於面向公眾倡導科技理念、傳播科技內容的企業。2010年11月,公司推出果殼網(Guokr.com) 。在創始人兼CEO姬十三帶領的專業團隊努力下,果殼傳媒已成為中國領先的科技傳媒機構,還致力於為企業量身打造面向公眾的科技品牌傳播方案。