Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

抽血可以輔助乳癌檢測? 從德國烏龍事件談被誇大的科學新聞

旻諭_96
・2019/11/22 ・2535字 ・閱讀時間約 5 分鐘 ・SR值 579 ・九年級

-----廣告,請繼續往下閱讀-----

今 (2019) 年二月,德國海德堡大學附屬婦科醫院發布新聞稿,聲稱教授索恩 (Christoph Sohn) 的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。

什麼?!只要抽血就可以知道有沒有得乳癌嗎?

該篇新聞稿內容指出,雖然這項技術不能直接取代乳房 X 光攝影檢查,但可以當作早期檢測,且偽陽率(沒有乳癌卻被判斷成有乳癌的機率)只有乳房 X 光攝影檢查的一半。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用。

索恩的研究團隊研發出一項新技術:以「抽血檢查」偵測乳癌細胞。當時的新聞稿宣稱這項檢測是「乳癌檢測的重大里程碑」,並將在年底投入臨床應用 。圖/basker_dhandapani @pixabay

奇怪的是,索恩同 (2) 月在德國杜塞道夫的另一場研討會中,說法又大不相同。根據德國線上雜誌 MedWatch 的報導,索恩的演講投影片上顯示該測試的特異度為 45~73%,相當於高達 55% 的偽陽率,幾乎是每兩位女性就有一位會被判斷為乳癌患者。看來這個以抽血看有沒有得乳癌的方法還不是太可靠註1

哪個環節出了問題?科學公關化妝化過頭

從上述的案例中,我們可以發現,這項「用血液檢測有沒有得乳癌」的檢測方式,明明有高達 55% 的偽陽率,卻在醫院發布的新聞稿中,被說是「乳癌檢測的重大里程碑」,嚴重地誇大了好幾個層級。但究竟為什麼新聞稿跟原始研究可以差這麼多呢?

-----廣告,請繼續往下閱讀-----

這攸關於「公關」的角色。

在科學研究組織中的公關單位,必須擔負「提升組織名譽」的重擔。現在各大學相互競爭學術排名的情況下,大學公關透過各方管道(包含亮眼的科學研究成果)來「行銷自己」變得十分重要。因此,科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。

科研組織中的公關不僅要能夠把高深複雜的科學知識講到民眾可以理解,還要順勢「宣傳自己」一波,幫科學研究成果「化個妝」,替學校爭取好名聲。圖/MichaelGaida @pixabay

然而,科學公關作為「學術界」和「媒體界」的橋樑 (Sumner et al, 2014),時常會遇到裡外不是人的窘境。公關單位一方面必須把科學知識講簡單,一方面又要擔任科研組織的化妝師,行銷自己、提高組織的知名度;因此常常沒辦法站在客觀與批判的角度檢視科學研究成果。容易造成問題的情況是,有時候公關單位會化妝化過頭,過去研究顯示,學術單位公關發布的新聞稿也常有機會成為錯誤的資訊來源本身。

誇大的科學新聞不是記者的錯?公關也可能參一腳

英國卡迪夫大學腦研究成像中心 (Cardiff University Brain Research Imaging Centre) Petroc Sumner 教授的研究團隊發現,與健康科學的新聞中,容易出現三種常見的錯誤:

  1. 過度延伸的建議(呼籲讀者改變行為)(exaggerated advice)
  2. 把「相關」描述成「因果關係」(exaggerated causal claims)
  3. 把「動物」研究成果不當延伸,應用在人類身上 (exaggerated inference to humans from animal research)

然而,研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。

-----廣告,請繼續往下閱讀-----
研究發現這些在科學新聞中被扭曲、誇大的部分,往往在公關稿就已經出現了。圖/截圖自參考資料 3

研究團隊從英國排名前 20 名的大學取得共 462 篇和健康相關的公關稿,再分別往前往後挖看看同一個研究的原始論文和科學新聞。(原始論文是一定有啦,但有些公關稿不一定會成為新聞題材。)

研究團隊比較了原始論文、公關稿和科學新聞三種版本的文章,發現有 40% 的公關稿含有過度延伸的建議;33% 的公關稿含有把「相關」描述成「因果關係」的錯誤;36% 的公關稿含有把「動物」研究成果不當延伸,應用在人類身上的錯誤。

研究更進一步顯示,當公關稿含有這些誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。

這張圖的上、中、下,分別代表公關稿或新聞稿包含「過度延伸的建議」、「把相關描述成因果關係」、「把動物研究成果不當延伸,應用在人類身上」。右半邊的白色長條圖示,代表當公關稿內含有誇大的錯誤時,分別有 58%、81% 和 86% 的科學新聞會也一樣會延續這三種類型的錯誤。圖/參考資料 3 圖 2

讀科學新聞要小心,遇到誇張的研究結果要有所警惕

文章看到這裡,或許你會很驚訝:「原來我以前都錯怪記者了,公關稿也可能有過度延伸的問題。」但這項研究結果也不是要你開始改罵公關單位,畢竟公關單位常常有和其他大學競爭的壓力。

-----廣告,請繼續往下閱讀-----

但其實民眾如何理解科學新聞的內容,會直接影響到民眾的實際行為。因此,科學新聞怎麼描述健康相關資訊,真的是一件不能馬虎的事情。(就好比看到抽血可以驗乳癌就開心以為不用去照 X 光檢查,或是看到「常咀嚼固態食物可預防失智」就不顧吃什麼健康不健康的嚼嚼就對了……)

「常咀嚼固態食物可預防失智」並不代表就不用管吃什麼健康嚼嚼嚼嚼就對了。圖/Comfreak @pixabay

不過更聰明的你一定想到了這個解方:當我們看到誇張的科學研究結果,別看到標題就自己腦補胡亂相信,要記得仔細看看內文,有沒有把相關研究講成因果關係,或是把動物研究結果延伸到人類身上(畢竟只有 10% 的非人類研究結果可以成功類推到人類身上)。如此一來,就算遇到了懸疑的科學新聞,你也有可以判斷真偽的能力!

註解

  1. 儘管索恩在研討會的記者會中遭受質疑,他仍拒絕回答任何與該測驗「偽陽率」相關的問題。五月,海德堡大學附屬婦科醫院認為,索恩必須為他的錯誤言論負責。經過幾個月的調查,大學委員會在上個月底舉行記者會,說明調查結果證實索恩宣稱以抽血檢測乳癌是「嚴重的不當行為」。根據報導,索恩已遭停職(包含教學與研究)3 個月,並即將接受大學的紀律調查。

參考資料

  1. German university finds ‘severe’ misconduct by researcher who promoted questionable cancer blood test. Science, 2019.10.25
  2. FORSCHER DES UNIVERSITÄTSKLINIKUMS HEIDELBERG ENTWICKELN ERSTEN MARKTFÄHIGEN BLUTTEST FÜR BRUSTKREBS. Newsroom UKHD, 2019.2.21
  3. Sumner, P., Vivian-Griffiths, S., Boivin, J., Williams, A., Venetis, C. A., Davies, A., … & Boy, F. (2014). The association between exaggeration in health related science news and academic press releases: retrospective observational study. Bmj, 349, g7015.
-----廣告,請繼續往下閱讀-----
文章難易度
旻諭_96
14 篇文章 ・ 2 位粉絲
大學主修生科,研所跳槽科學教育,目前正努力想要聰明又科學的活著。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

2
0

文字

分享

0
2
0
科學新聞誰來說?當科學家與記者意見相左時!——《是炒作還是真相?媒體與科學家關於真相與話語權的角力戰》
商周出版_96
・2025/04/05 ・4280字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

同床異夢:科學家與科學記者間的緊張關係

為了新成立的科學媒體中心負責人一職準備面試期間,我讀到許多科學家的意見,他們指出媒體對MMR疫苗和基因改造等議題的報導削弱了公眾對科學的信任。然而,當我更深入閱讀當時的科學新聞時卻發現情況並不那麼單純,許多嘩眾取寵的報導出自綜合記者或政治與消費的分線記者,消息來源是善於操縱媒體的運動人士而非優秀科學家,反觀科學記者筆下的報導則多數公正平衡。

中心成立後的頭幾個月主要是諮詢,過程中我與一些傑出的科學記者交流,詢問新的科學新聞辦公室如何產生價值,他們花了很多時間回應我接二連三的提問。互動中我清楚意識到科學記者不需要別人教他們怎麼做報導,而且他們其實與科學家一樣苦惱,覺得手機、核能、複製技術等等議題有太多聳動新聞。後來討論焦點就放在科學媒體中心如何改善現況,方法包括鼓勵科學家接受訪問,以及提升科學專業在編輯室內的地位。

一種說法認為科學記者是個特別的記者類型。有人向英國廣播公司前新聞部主任弗蘭.安斯沃思(Fran Unsworth)提出疑問:為何她們的公司高層很少人有科學報導背景?她短暫遲疑後回答:英國廣播公司的科學記者大都熱愛自己的工作,喜歡報導更甚於管理。我在其他媒體也注意到同樣現象,許多科學、醫藥、環境記者在專門領域耕耘超過二十年。湯姆.菲爾登被問到為何熱愛科學報導,他的回答是:

科學報導的內容幾乎都是探索性而非指控性—代表我和科學家都能開開心心回家!而且我能在自由出入實驗室、見到地球上最聰明的一群人、對他們的畢生心血提出各種粗淺的問題,這是多麼大的特權。再來科學新聞多彩多姿,生醫、太空、氣候、生物多樣性、古生物……最後一點,科學新聞很重要,是現代社會不可或缺的一部分。

「要迅速還是要正確?」——新聞編輯室裡的艱難選擇

二○○二年科學媒體中心剛成立時,社會上針對科學和媒體之間為何緊張有過一波辯論,其中一個話題是科學價值觀與新聞價值觀的矛盾。已故的理查.多爾(Richard Doll)爵士教授是發現吸菸與癌症關聯的科學家,他曾經對著滿屋子的記者一語道破:「你們不喜歡老調重彈、報導大家都知道的事情,總想找些新鮮的。但很可惜,科學裡新的事物通常不對,真理需要透過時間慢慢建立。」

-----廣告,請繼續往下閱讀-----
科學追求真理累積,媒體偏好新鮮話題,價值觀自然衝突。圖/unsplash

另一方面,懂得反求諸己的記者通常也不諱言表示媒體反映真相有很多侷限。《華盛頓郵報》資深記者大衛.布羅德(David Broder)一九七九年曾說:「我希望媒體能一再重複、直到大家明白—每天送到門口的報紙,只是記者對過去二十四小時內聽聞的某些事情做出片面、匆促、不完整的敘述,內容不可避免會有瑕疵與偏差。」難怪科學家對記者戒慎恐懼,而記者與科學家合作時也倍感挑戰。曾經有位報紙編輯對著一房間的皇家學會成員說:在他的編輯室內,「要迅速還是要正確」這問題只會有一個答案。那些科學家的惶恐表情我歷歷在目。

我進入媒體關係工作之前拿的是新聞學學位,至今仍記得一位前記者曾在講座中告訴大家:「車禍後無人傷亡」不能成為新聞,「車禍導致五名青少年死亡」才能引起大眾關注。研究媒體的學生辯論新聞價值觀已經辯了數十年,也有人大膽嘗試不同做法,比方說《龜媒體》(Tortoise Media)之類新興平臺就訴求「慢新聞」,旨在建立有別於速度至上的新模型,透過「慢速新聞學」理念以更長時間來更加深入地製作更大、更複雜的報導。但儘管媒體業界發生許多變化,傳統的新聞價值觀仍屹立不搖。

科學媒體中心所有工作都是為了支持科學報導的高標準,不過我們在二○一一年列文森調查期間發現還有其他機會能夠撼動這些標準。該調查由布萊恩.列文森勳爵法官(Lord Justice Brian Leveson)主持,目的是在《世界新聞報》(News International)竊聽醜聞案後瞭解英國媒體業界有什麼慣例。我當時的同事海倫.賈米森(Helen Jamison)建議我們向調查庭提交證據,幾杯所謂的「女士汽油」下肚後,她操著濃厚曼徹斯特口音說:「傷害公眾利益的不是竊聽名人電話—而是糟糕的科學報導。」隔天我們發郵件給幾位科學通訊人員,詢問他們關注什麼議題,一週後就提交多頁書面證據。

我告訴同事自己被傳喚去做口頭證詞時她們還覺得我在瞎掰。小組內部連續幾週密切關注各大媒體如何報導列文森調查案,包含麗貝卡.布魯克斯(Rebekah Brooks)、阿拉斯泰爾.坎貝爾、保羅.戴克瑞(Paul Dacre)和安迪.考森(Andy Coulson)在內很多媒體界大人物都有出庭,而今居然也有我一份,令人興奮又忐忑—被傳喚的人只有我代表科學界,一定要把握好機會。

-----廣告,請繼續往下閱讀-----

標題戰爭:聳動 vs. 精準,誰來決定科學新聞的呈現?

但其實我沒進過法庭,緊張情緒一目瞭然。印象特別深的是御用大律師羅伯特.傑伊(Robert Jay)和列文森勳爵本人一再要我放慢語速。官方紀錄上,提醒我兩次還不見效,列文森這麼說:「不必因為半小時的限制就講很快,時間是可以延長的……而且我有點擔心,總覺得速記員頭上好像冒煙了。」

我的主要論點是媒體長期以來執著於同一套價值觀,在書面證詞中也有所描述:

追求引發恐慌的故事、誇大單一專家從小規模研究得出的結論、不願將令人擔憂的研究結果置於宏觀而令人安心的脈絡、為了平衡而捏造不存在的學界歧見、過分偏愛另類觀點等等。

當天《獨立報》恰好印證我的觀點,一篇跨兩頁的報導標題為:「眼盲者重見光明—患者因幹細胞『奇蹟』痊癒。」然而實際情況是患者並未痊癒,雖然回報視力小幅度改善(他們原本視力極差,已被登記為盲人),但這僅僅是一項安全性研究,而且只有兩名患者參與。當然,研究本身是值得報導的,在幹細胞研究剛起步、真人試驗剛開始的時期,這是個重要的進展。問題在於報導口吻暗示科學研究取得了巨大突破,可能給成千上萬黃斑部病變患者帶來不切實際的希望。

同一天稍晚我揪著心打電話給《獨立報》科學編輯史提夫.康諾,告知我將他的報導當作科學新聞不良案例交給列文森調查庭。他當然談不上高興,但至少沒發飆,所以我鬆了一口氣。原來前一天晚上他提交的原稿內容較精緻,但夜班編輯決定將報導放在頭版,所以文字編輯就對標題進行過加工。康諾將原稿發過來,我們倆就在辦公室玩起「找出不同點」的遊戲了。

-----廣告,請繼續往下閱讀-----

離開法庭時,《太陽報》總編輯攔住我。我在證詞中批評他們前一週煽動恐慌,報導內容是居家用品內的化學物質,但標題卻叫做「商店貨架上滿滿的乳癌『風險』」。原本我以為對方要吵架,沒想到他說《太陽報》真心想改善科學報導品質,邀請我們為報社裡的一般新聞記者開一場科學報導培訓班。隨著列文森調查案持續推進,業界標準似乎終於迎來變革,而且這一次沒有落下科學新聞。

作證時我順便提出有必要為科學報導制訂新的指導方針,還誇下海口表示只需要幾小時就能與記者和科學家共同完成草擬。一週後,調查庭將人召集起來要我們開始,沒想到折騰了整整一天,而且過程中好幾次我都擔心無法達成共識。標題就是特別棘手的項目,記者和文字編輯很堅持標題只追求簡潔和引人注目,沒必要精準總結文章內容,但科學家聽了很火大,認為這是合理化不精準的敘述。

科學家要求標題的正確性,記者堅持要簡潔吸引,雙方激辯不休。圖/unsplash

我感覺自己成了全球和平談判的調解員,必須設法安撫所有人不拍桌走人並達成協議。所幸雙方都有成就這樁美事的意願,最終相互妥協:標題不應誤導讀者對文章內容的理解,且不應以引號包裝誇大的敘述

總體來說,新指導方針鼓勵記者從協助大眾的角度切入,告訴閱聽人什麼證據是可靠的,又有什麼證據還在研究階段。例如其中有幾條的內容是:新聞故事應附上來源以便讀者查詢。應標明研究的規模、性質和侷限性。應指出研究處於何種階段,並從合理角度預估新療法或新技術能為民眾所用的時間點。

-----廣告,請繼續往下閱讀-----

我們將指導方針寄給列文森勳爵,很高興他在最終版本的報告裡也建議採用。調查案結束後成立了獨立報刊業標準組織(Independent Press Standards Organisation)在各大新聞編輯部推廣指導方針,由於制訂過程有編輯和記者的參與所以接受度很高,不至於引起反彈。

為科學家舉辦講座時,我會展示一些因為科學家參與而變得更客觀準確的新聞報導,其中個人特別喜歡的一篇出自二○○八年的《每日郵報》,內容提到一項小鼠研究發現常用的保濕霜與癌症有相關。記者費奧娜.麥克雷(Fiona MacRae)引用兩位不同專家的意見質疑這項研究與人類皮膚的相關性,並指出該研究需要能在人類身上複現才有意義。

專家之一表示:因為這項研究就停止使用保濕霜太「瘋狂」,還補充說明:「小鼠皮膚癌研究其實不太能幫助我們瞭解人類的皮膚癌。」最精彩在於標題是「保濕霜與皮膚癌相關(僅限小鼠)」,而且括號內外用了同樣大小的字體。

從這個案例來看,優秀的記者可以在講述有趣故事的同時確保讀者不會過早丟掉面霜。我還會在講座使用的幻燈片裡摻入一些小報的報導實例來挑戰學術界偏見,比方說《每日郵報》的社論或許爭議頗多,但他們的科學新聞通常品質並不差,不推廣特定立場的時候更是如此,有時甚至優於大報。我還會強調《每日郵報》在英國銷量排行第二,如果連線上版也算進去讀者數超越所有大報,因此務實一點說:如果科學家希望更有效地向大眾傳遞信息,完全沒有不與《每日郵報》合作的道理。

-----廣告,請繼續往下閱讀-----

——本文摘自《是炒作還是真相?媒體與科學家關於真相與話語權的角力戰:從基改食品、動物實驗、混種研究、疫苗爭議到疫情報導的製作》,2025 年 03 月,商周出版,未經同意請勿轉載

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

商周出版_96
123 篇文章 ・ 364 位粉絲
閱讀商周,一手掌握趨勢,感受愜意生活!商周出版為專業的商業書籍出版公司,期望為社會推動基礎商業知識和教育。

2

3
7

文字

分享

2
3
7
逼近上帝視角——用「統計學」探討因果關係
研之有物│中央研究院_96
・2022/06/15 ・4930字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/郭雅欣、簡克志
  • 美術設計/蔡宛潔

因果關係怎麼研究?

在日常生活的經驗裡,我們往往習慣以主觀的角度來認定因果關係的存在,但在數理統計的協助下,因果關係可以擁有科學定義,並且可以驗證。中央研究院「研之有物」專訪院內統計科學研究所黃彥棕研究員,他的主要研究便是以數理統計的方式來探討因果關係(例如生物體的複雜機轉)。有了統計方法,人類也能接近上帝視角,找出因果關係的存在。

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係。圖/研之有物

以數理統計驗證因果關係

我們絕大多數人相信「凡事必有因果」這句話,例如今天腹瀉,是因為昨天晚餐吃壞肚子;考試沒考好,是因為書念得不夠。但是仔細想想,造成今天拉肚子的原因,除了昨天的晚餐之外,還有沒有別的可能?影響考試成績的因素,除了書念得夠不夠之外,考試環境、考題難易度也都會影響。

所以,我們究竟該如何確定兩件事有因果關係?有沒有什麼科學方法,可以讓我們帶著十足的把握,說出「X 就是造成 Y 結果的原因」這樣的話語?

-----廣告,請繼續往下閱讀-----

中研院統計所研究員黃彥棕,擅長以數理統計的方式來思考因果關係,除此之外他更進一步在數學上探討「X 透過何種機制造成 Y」,也就是所謂的「因果中介效應」。有興趣的讀者,可以參考「研之有物」之前專訪黃彥棕老師的文章〈喝酒臉紅易罹癌?小時候家裡窮會胖?統計學家黃彥棕來解答〉。

回到因果關係,黃彥棕說到:「因果關係是屬於上帝視角。」也就是說,兩件事之間究竟有無因果關係,理論上只有全知者才知道,而我們能做的,是以數理統計的方式,「從人類視角盡可能地逼近上帝視角,來判斷因果關係是否存在。」

何謂因果關係?

為什麼說「因果存在與否只有上帝才知道」?因果關係建立在「反事實」,如果有一個事實是「打疫苗,就不容易感染 COVID-19」,則我們必須驗證是否「不打疫苗,就容易感染 COVID-19」,這就是反事實。有了事實與反事實的比對,我們才能說「打疫苗」與「不易感染 COVID-19」有因果關係。

不過,除非有時光機或平行宇宙,否則我們不可能讓全世界的人打疫苗,並觀察感染情況;然後又讓全世界的人都不打疫苗,並再次觀察染病狀況。只有全知者才能同時觀察這兩個平行宇宙,得知因果關係。黃彥棕說,身處現實世界的我們,只能盡可能地逼近這個結果。

-----廣告,請繼續往下閱讀-----

用數學語言來描述因果關係,最被廣泛使用的架構是由美國統計學家 Donald Rubin 提出的反事實結果(counterfactual outcome)或潛在結果(potential outcome)。值得一提的是,過去 Rubin 也曾與 2021 年諾貝爾經濟學獎得主 Joshua Angrist 和 Guido Imbens 共同發表重要論文〈使用工具變量確認因果效應〉。

以下我們就以疫苗和傳染病為例,以反事實架構來說明「X 導致 Y」的群體因果效應。先假設 X 為民眾施打疫苗與否( 0:不打疫苗,1:打疫苗),而 Y 為得傳染病與否(0:不染病,1:染病),並使用期望值 E 來描述群體平均效應,詳細如下圖。

為了要取得因果關係,我們必須有兩個獨立的平行世界,分別是 X=1 和 X=0,再去比較這兩個世界中 X 如何導致 Y 的發生。圖/研之有物
(資料來源|黃彥棕)

如果我們觀察到 E[Y(X=1)]=0.1,也就是有打疫苗的人染病機率是 10 %。那麼在反事實因果推論的基礎上,我們必須檢驗 E[Y(X=0)] 等於多少,也就是不打疫苗的染病機率。只要 E[Y(X=1)] ≠ E[Y(X=0)],就代表 X 和 Y 之間具有因果關係。

然而,實務上打完疫苗的人不可能再回復到沒打疫苗的狀態,因此我們沒有辦法再次對同一群母體樣本做實驗來驗證因果關係,僅能退而求其次,「盡量貼近」因果關係。那麼,要怎麼做呢?

-----廣告,請繼續往下閱讀-----

有反事實的對照,才有因果關係。

逼近神的因果視角

如果我們把全世界的人分成兩半,其中一半打疫苗、另一半不打疫苗,然後用打疫苗的那一半代表一個宇宙(事實),不打疫苗的代表另一個宇宙(反事實),不就創造出兩個平行宇宙了嗎?

這是一種很直觀的逼近方法,但若要讓一半的人能夠代表一整個宇宙,則有一個重要的前提:這兩個宇宙裡的人是隨機分配的,也就是這兩群人在各個層面都很相似,例如年齡、性別、健康狀況甚至政治傾向等,以專業術語來說就是必須具有可互換性(exchangeability)。藥廠在做疫苗人體實驗時,就必須以非常嚴謹的方式讓受試者盡可能達到隨機分配,才能得到「疫苗是否有效」的科學結果。

不過,在大多數狀況下,我們很難做到隨機分配。舉例來說,臺灣開放施打 COVID-19 疫苗後,截至 2021 年 10 月 29 日為止,有將近 1700 萬人施打第一劑疫苗,但我們不能把這 1700 萬人視為有打疫苗的宇宙,而另一群沒打疫苗的 600 萬人視為沒打疫苗的宇宙,因為打不打疫苗是人民自由選擇的結果,有很多因素會影響個人選擇,例如比較有健康意識,或是比較年輕、不擔心副作用的人,可能就比較傾向打疫苗。

即使統計結果顯示出打疫苗的人,感染 COVID-19 的比例真的比較低,我們也很難分辨是因為打疫苗,還是他們本來就比較年輕?或本來就比較健康?「這是所謂的『觀察型研究』,容易出現因果推論謬誤的原因。」黃彥棕說。

-----廣告,請繼續往下閱讀-----

然而,我們可以用數理統計的方式逼近真實的因果效應,例如控制年齡、健康狀況——兩方都取 50~60 歲的年齡層,並且都是沒有心血管疾病的人等。黃彥棕說:「我們依據自己的背景知識,知道有哪些因素會影響隨機性,然後使用統計的方式,把它們抓出來做控制。」

理論上統計學家可以把所有可能造成偏誤的因子都舉出來,透過一層層地篩選、限縮,最後得出許多個小小的族群,讓隨機性成立。

之後,透過每一組小小的隨機族群(例如年齡 50~60 歲、沒有心血管疾病、男性、具健康意識……等,統稱為 C),讓 Y 的發生和特定條件 C 之下的 X 群體無關,我們就可以得到逼近兩個平行宇宙的資料(有打疫苗、沒打疫苗),最後再把各族群的結果加權平均回來。就可以貼近上帝視角的因果效應。

以數學語言來說,就是讓條件期望值(E[Y|X=x , C=c)])的計算透過加權平均等同於反事實結果之期望值(E[Y(X=x)])的效果。我們沒有時光機,無法透過事實/反事實結果之期望值檢驗全體打疫苗和不打疫苗的因果關係(E[Y(X=1)] ≠ E[Y(X=0)] 嗎?);但是我們可以透過各種條件的篩選和限縮,去計算每個具備可互換性小群體的條件期望值,最後加權平均回來,檢視打疫苗與得病與否的因果關係(∑c E[Y|X=1 , C=c]*P(C=c) ≠ ∑c E[Y|X=0 , C=c]*P(C=c)嗎?),這才是實務上的作法。

問題來了,要怎麼知道我們是否窮舉了所有可能造成偏誤的因子?我們的確不知道,只有上帝知道,這是個假設,而且是個很難驗證的假設。

實務上,我們不可能同時觀察 X=1 和 X=0 的世界,只能分別獲得 X 和 Y 的相關性。要如何從相關性去檢視因果關係呢?透過統計學上的篩選和限制,我們如果可以讓 X=1 vs. X=0 的隨機性成立,就可以進一步驗證 X 和 Y 的因果關係。為方便說明,圖片的數學式為簡單條件期望值計算,不考慮加權平均。圖/研之有物(資料來源|黃彥棕)

「在控制了年齡、性別、健康狀況等條件的情況下,我們希望可以讓隨機性成立。」

黃彥棕的研究讓因果關係在嚴謹的數學架構下,得以辨證、溝通,而不是只仰賴直觀的思考。因果的存在變得更加科學化,而這也使因果的探討可以進入更深的層次。

-----廣告,請繼續往下閱讀-----

被競爭結果和時間擾亂的因果關係

更進階的因果探討層次,是將時間因素考慮進來。黃彥棕以「B 型肝炎」造成「肝癌」,然後導致「死亡」為例,若想探討這三者間的因果關係時,會發生一個問題,那就是有 B 型肝炎的人,有可能容易因猛爆性肝炎而直接死亡,而這樣的個案在統計上,因為他並沒有得到肝癌,而對「肝癌」這個中介因子造成了「保護」的效果。

「這就是肝癌和死亡這兩個競爭結果造成的影響,而這個競爭關係又會隨著時間推移而改變。肝癌、死亡有時間進程關係,一旦 B 型肝炎患者因猛爆性肝炎死亡了,他就不可能再得肝癌。」更清楚地說,B 型肝炎患者可能還「來不及」得肝癌,就因猛爆性肝炎直接跳到死亡。在界定 B 型肝炎與肝癌之間的因果關係時,這樣的結果會造成偏誤。

黃彥棕將時間因素考慮進來的方法,是把整個時程切割成非常多小段,在每個小段創造一個反事實架構,也就是分析每一位在某小段時間活著的 B 型肝炎患者,把他們分成已得到肝癌及還沒得到肝癌,並考慮這兩組患者在下一個瞬間死亡的可能性,再將這些結果積分起來,得到在隨機過程架構之下的平行宇宙們。

「我等於是在每一個瞬間都製造多個平行宇宙(無 B 肝/無肝癌、無 B 肝/有肝癌、有 B 肝/無肝癌、有 B 肝/有肝癌)出來,這樣做可以避免前面說的蓋牌效應。但你可以想像我所得到的平行宇宙數量……嗯,就跟《奇異博士》看到的差不多。」

「我認為我在這領域的部分貢獻,或許是提出了這樣一個會隨著時間推移的反事實架構。」黃彥棕說。他的論文發表出來後不久,也引起了期刊的興趣,邀請了相關領域的許多專家,探討他所提出的因果模型。

-----廣告,請繼續往下閱讀-----

研究因果的動機

談起對因果關係研究的動機,黃彥棕說,以前在醫學系實習時,會看到開同樣的藥給病人,有些病人會好,有些人不會。這種「不確定性」開始讓他覺得好奇。他說:「我可以接受事情就是會有隨機性,但還是很想搞清楚這樣的不確定性是怎麼來的。」

最近,黃彥棕也發現許多人會把「預測」和「因果」搞混,尤其是現在人工智慧(AI)發展出的預測模型表現愈來愈好,有些做 AI 預測模型的人,會誤以為能夠用預測表現良好的模型,來得到因果關係。

舉例來說,一個模型可以透過一個人是否抽菸,來預測他得肺癌的機率,也可以透過一個人身上是否攜帶著打火機,來預測肺癌機率。「但我們知道抽菸與肺癌有因果關係,而帶打火機與否應該是不會造成任何增加肺癌風險的生物效應的。」黃彥棕說。

「抽菸」與「帶打火機」都能成為 AI 模型預測肺癌時採用的因子,但顯然並非代表它們與肺癌都有因果關係。黃彥棕接著說:「雖然預測未必需要因果關係,但是,決策就需要因果關係的支持。若要降低肺癌風險,政府較合理的做法是下令禁菸,而不是禁打火機。但要看到因果是比較困難的,它先天上的限制使它難以驗證,這個挑戰也是因果推論的迷人之處。」

-----廣告,請繼續往下閱讀-----

最後,黃彥棕切身感受到因果關係的重要性,尤其是藥廠研發藥物或是臨床醫學等領域的應用。而他在反事實架構上考慮時間因素的突破,讓因果推論的知識又更往前推進。反事實因果推論的數學模型,讓人類能夠有深刻的思考,去檢視深藏在直觀表面之下的因果性與相關性。

延伸閱讀

-----廣告,請繼續往下閱讀-----
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook