0

0
0

文字

分享

0
0
0

普篩會出現偽陽性,那之前採檢的結果還能信嗎?由貝氏統計學做解釋

林澤民_96
・2020/05/07 ・3460字 ・閱讀時間約 7 分鐘 ・SR值 588 ・九年級

防疫中心指揮官陳時中在  4 月 28 日的例行記者會中,就新冠病毒普篩的偽陽性偽陰性問題以實際數據進行了分析。他把普篩假想對象分為兩種不同人口:呼吸道症狀就醫人口無症狀人口

再就每一種假想對象依據台灣疫情提出兩種盛行率的估計:極大值、合理值。如此,假想對象 × 盛行率一共有四種組合。

陳時中再對每一種組合分別提出關於 PCR(核酸檢測)和快篩兩種檢測工具精密性的分析。陳時中的數據顯示,快篩在這四種組合都會產生數萬到數十萬的偽陽性,而連 PCR 都會有數百到數千的偽陽性。這就引起了一個問題:

如果快篩的精密性那麼低,而 PCR 也有問題,那防疫中心之前採檢的結果還值得信賴嗎?那四百多個確診個案難道沒有偽陽性嗎?

本文針對這個問題提出貝氏統計學的解釋。

-----廣告,請繼續往下閱讀-----
咦咦咦咦咦,怎麼這麼多偽陽性。圖/giphy

盛行率即貝氏定理的「先驗機率」

陳時中在分析中提供了 PCR 和快篩的特異性和敏感性,分別為:

PCR:特異性 = 0.9999,敏感性 = 0.95
快篩:特異性 = 0.99,敏感性 = 0.75

在固定這些參數值之後,陳時中報告了四種組合中每一組合的真陽性、偽陽性、偽陰性、真陰性的數目。他在報告中特別著重當採檢結果為陽性時,真陽性與偽陽性的數目。

我們知道醫檢學中的所謂「敏感性」是真正帶原者之中真陽性的比例。把比例等同機率,則敏感性就是當受檢者是真帶原者時,採檢結果為陽性的機率:

敏感性 = Pr ( 採檢為陽性|受檢者是真正帶原者 )

-----廣告,請繼續往下閱讀-----

因此,採檢為陽性之中真陽性的比例,轉換成機率的概念,便是敏感性的反機率。這個反機率在數據科學有一個專門的名稱,叫做「精密性」(precision)。

精密性 = Pr ( 受檢者真正帶原|採檢為陽性者 )

數據科學把敏感性叫作「召回率」(recall),召回率與精密性共同決定了檢測的準確度(accuracy)「F1分數」(F1 Score)。醫檢學雖然沒有使用「精密性」這個名詞,但陳時中的講解所著重其實便是精密性的討論。

-----廣告,請繼續往下閱讀-----

精密性是敏感性的反機率,那麼這個反機率如何計算?反機率的計算要用貝氏定理,但光知道敏感性是不夠的,必須還要知道「特異性」及「盛行率」,其中盛行率便是貝氏定理的所謂「先驗機率」。

陳時中的報告提供了各種組合的敏感性、特異性、及盛行率,因此可以算出精密性。下表顯示陳時中報告中 PCR 及快篩的精密性:

檢測工具\普篩對象 呼吸道症狀就醫人口
( 4800000 )
無症狀人口
( 18000000 )
盛行率極大值:
( π=0.0018 )
盛行率合理值:
( π=0.000016 )
盛行率極大值:
( π=0.0018 )
盛行率合理值:
( π=0.00000056 )
PCR 之精密性
(真陽性/採檢陽性)
0.9448
( 8208/8687 )
0.1319
( 71/551 )
0.9448
( 30780/32577)
0.0050
(9/1809)
快篩之精密性
(真陽性/採檢陽性)
0.1191
(6480/54394)
0.0012
(56/48056)
0.1191
(24300/203976)
0.0000
(8/180008)

除了 PCR 在盛行率極大值時以外,這些精密性數值不但小到令人驚訝,而且令人疑惑:如果盛行率 π=0.000016 及 π=0.00000056 的估計真的是「合理」的,那不但快篩,連 PCR 的精密性都低到慘不忍睹的地步。

那這樣的檢測工具還有任何用處嗎? 那豈不是防疫中心疫情開始以來所檢驗出來的所有結果都不值得信賴了?

-----廣告,請繼續往下閱讀-----

先驗機率注重「脈絡」

要解開這個疑惑,必須進一步了解貝氏定理所謂「先驗機率」的意涵。

首先,先驗機率既然是「先驗」的,它就不是客觀的經驗事實。 先驗機率可以用先前(例如別的地區或人口)的數據來估計,但它基本上反映了貝氏統計學者的主觀「信仰」(belief)。

醫學檢測經歷漫長的問診、疫調等專業程序才能成立。圖/wikimedia

在醫學檢測,這個「信仰」,除了醫學文獻、臨床經驗外,它通常還要靠著問診、疫調等專業程序來建立,也就是醫檢人員必須要評估受採檢對象的旅遊史、接觸史、疾病史、健康狀況、有否相關症狀、乃至於飲食作息等等資訊才能建立。 換句話說,先驗機率的建立與受採檢對象的「脈絡」(context)息息相關。採檢對象的脈絡不同,先驗機率也會不同。

既然盛行率是先驗機率,而先驗機率會隨著採檢對象的脈絡而改變,那麼盛行率也會隨著採檢對象而改變。檢測的精密性又與盛行率有關,那精密性自然也會隨著盛行率而改變。

-----廣告,請繼續往下閱讀-----
在給定的敏感性和特異性之下,PCR、快篩兩種檢測工具的精密性與盛行率的關係。

圖一顯示出,盛行率 π=0.0018(陳時中估計的盛行率極大值)時,PCR 的精密性在 94% 左右,快篩的精密性則約 12%。也可看出:在盛行率 π=0.000016 或 π=0.00000056(陳時中估計的盛行率合理值)的時候,PCR 和快篩的精密性都是很小很小的。

這些精密性的準確值在表一都有,但圖一更清楚地顯示了精密性在盛行率小於 0.0020 的範圍內隨著盛行率漸增的趨勢。

現在可以回答前述的問題了:既然合理的盛行率估計值導致 PCR 和快篩都是那麼小的精密性,那麼不論是快篩或 PCR 不是都沒有用嗎?防疫中心之前的採檢不會有很多偽陽性、偽陰性嗎?

這個問題的回答是:精密性低的癥結不是在於採檢工具的品質——就敏感性和特異性而言,防疫中心所使用的 PCR 和快篩的品質都是極佳的——而是在於(假想中)對廣大對象在缺乏足夠脈絡資訊之下做了無厘頭的採檢!

-----廣告,請繼續往下閱讀-----
如果能以更多資訊幫助判斷,則能提高盛行率的合理值。圖/giphy

因為對於一千八百萬無症狀人口沒有任何問診、疫調,防疫中心只能以既有確診案例數來估計這個人口的盛行率而定其合理值為 π=0.00000056。是因為先驗機率未能包含有用資訊,而不是檢測工具的品質,導致了精密性低落到幾乎為 0。

這個解釋,只要看陳時中把採檢對象限制在呼吸道症狀就醫人口所做的分析就立刻得到驗證:因為這個群體看過門診,確定有疑似症狀出現,防疫中心可以用這個脈絡資訊把盛行率的合理值提高到 π=0.000016。

此時同樣品質的 PCR 的精密性就從 0.0050 提高到 0.1319,而快篩的精密性也從 0.0000 提高到 0.0012。這微弱的改進誠然還是嚴重不足,但它可以讓我們看見脈絡資訊的重要性。

無緣無故實施普檢,精密性不足信賴

另外,我們也可以從表一及圖一看到:不論對象是無症狀人口或呼吸道症狀就醫人口,如果都用極大值 π=0.0018 來估計盛行率,則同一檢測工具的精密性不會改變。此時 PCR 的精密性可以高達 0.9448,看似可以接受,但在廣大的採檢對象中,仍然會有不少的偽陽性案例。

-----廣告,請繼續往下閱讀-----
影響普篩結果的不是檢測工具,而是脈絡資訊。圖/pxfuel

以上的分析告訴我們:對廣大人口無緣無故實施普檢,檢測結果的精密性可能不足信賴。這不是檢測工具品質不佳的問題,而是脈絡資訊不足的問題。如果社區感染的現象明顯到防疫中心對盛行率的估計可以提高,則我相信他們也會考慮普檢。

圖二把圖一的橫軸延伸到 π=0.1。從圖中可以看出:當盛行率的合理估計達到 π=0.01 時,PCR 的精密性就很接近 99% 了。只是如果普檢要仰賴快篩,則 43% 的精密性還是有所不足。

例如當合理懷疑某對象受感染的先驗機率達到 π=0.1 時, PCR 的精密性幾乎是 100%,而快篩的精密性也近乎 90% 了。

防疫中心目前使用快篩應該都是有相當的脈絡資訊才使用,當脈絡資訊指出特定對象(例如有明顯症狀的入境旅客、與確診個案有親密接觸的人士)受感染的先驗機率甚高時,使用快篩當然是可以接受的。例如當合理懷疑某對象受感染的先驗機率達到 π=0.1 時,圖二顯示 PCR 的精密性幾乎是 100%,而快篩的精密性也近乎 90% 了。

這就是貝氏定理的秘密:反機率雖然很有用,但要算反機率必須要先估計先驗機率。然而先驗機率不是唯一存在的客觀事實,它的估計必須要仰賴專業判斷。唯有基於經驗、理論、脈絡等專業資訊估計出來的先驗機率才能讓貝氏定理算出精確的反機率。

關於大規模篩檢,泛科學也有做一支影片和大家一起討論唷!

文章難易度
林澤民_96
37 篇文章 ・ 243 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

2
1

文字

分享

0
2
1
推理小說的形上學:法庭語言與維根斯坦的《邏輯哲學論》
林澤民_96
・2023/01/16 ・7312字 ・閱讀時間約 15 分鐘

很多人從小就把福爾摩斯的故事讀到滾瓜爛熟了,我也是如此。但我近年來用貝氏統計學與維根斯坦《邏輯哲學論》的觀點來重讀這些故事,別有一番意趣。

《邏輯哲學論》的作者——路德维希·维根斯坦。圖/wikipedia

這兩個閱讀角度,其實也適用於閱讀其它的偵探故事,包括美國 1930 年以來影響廣泛的冷硬派推理小說。如果說貝氏統計學是推理小說的方法論,那麼《邏輯哲學論》就是推理小說的形上學。

我之前已寫過推理小說方法論的文章;請見跟名偵探學習推理—回溯推理與貝氏定理分析(上)〉跟名偵探學習推理—回溯推理與貝氏定理分析(下)〉

本文在方法論的基礎上論述其背後的形上學:維根斯坦的《邏輯哲學論》

-----廣告,請繼續往下閱讀-----

一、「資料!資料!資料!」

先簡略複習方法論。〈回溯推論法、貝氏定理、及推理小說〉一文就福爾摩斯使用的貝氏推理方法已有詳細論述。除了此文所舉〈皮膚變白的軍人〉一案外,收在《冒險史》系列中的〈銅山毛櫸案〉更是絕佳的貝式推理辦案例子。(按:銅山毛櫸是一種樹木,英文 Copper Beech,這種樹的葉子像擦亮的金屬。這個故事中犯罪現場的住宅外種了很多銅山毛櫸,因此以「銅山毛櫸」名之。)

收在《冒險史》系列中的〈銅山毛櫸案〉更是絕佳的貝式推理辦案例子。圖/wikipedia

這個故事的客戶亨特小姐得到了一個待遇奇高、雇主又有些不尋常要求的家庭教師工作。她受高薪吸引,但雇主要她剪短長髮、穿他女兒衣服等奇怪要求卻令她不安,因而來貝克街 221B 尋求諮商。福爾摩斯也覺得其中必有蹊蹺,答應她在遇到危險時去幫助她。

福爾摩斯在聽到亨特小姐的初步陳述之後,並未立即說出他心中的想法。他坐下來蹙眉深思。華生忍不住問他,他只是不耐煩地嚷道:「資料!資料!資料!」(Data! Data! Data!)。他又說:「沒有粘土,我做不出磚頭!」

不久之後,亨特小姐果然來電要求福爾摩斯前往協助。在搭火車前往「銅山毛櫸」所在的溫徹斯特途中,福爾摩斯終於向華生透露了他的想法:

-----廣告,請繼續往下閱讀-----

「我曾設想過七種不同的解釋,每一種都適用于到目前為止我們所知道的事實。但它們當中哪一種是正確的,只能在得到無疑正在等著我們的新消息後才能做出決定。」

貝式推理辦案

這兩句話,可以視為貝氏統計學的絕佳註解。福爾摩斯在聽過亨特小姐的敘述之後,經過深思,已經用他擅長的「回溯推論法」發展出七種可以推論出已知事實的解釋。

在這個階段,這七種解釋都是可能的,換句話說:七種解釋都有不等於零的機率。這個機率分布,就是貝氏統計學的「先驗機率」。貝氏統計學的功能,便是在獲得進一步的資料之後,用貝式定理算出「後驗機率」的機率分布。後驗機率更新了先驗機率。

如果新資訊是有用的,後驗機率分布通常會比先驗機率有較小的標準差,也就是更集中在較少的解釋上。如果一開始資料不足,貝式統計學家可能會假設所有的解釋都有相同的機率為真,這就是統計學所謂均勻分布(uniform distribution)。

將有用的資料考量進去之後,如果有些解釋因為與新資訊不盡相符,其機率降低,甚至可以完全排除。如此,後驗機率就變成集中在少數幾個解釋的分布了。

-----廣告,請繼續往下閱讀-----

這個故事中,福爾摩斯與華生與亨特小姐在溫徹斯特見面,亨特小姐報告了她在雇主家中的見聞。這些新資料已經足夠讓福爾摩斯把後驗機率分布全部集中在單一解釋上了。他向亨特小姐說:

「當然,只有一個說得通的解釋,你是被請到那裡去冒充某個人,而那個人實際上被囚禁在那間屋子里,這是一清二楚的。至於這個被囚禁的人是誰,我可以斷定就是那個女兒艾麗絲.魯卡斯爾小姐。

如果我沒記錯的話,她是被說成已經到美國去了。毫無疑問,你所以被選中是因為你的高度、身材和你的頭髮的色澤和她的一樣。好的頭髮被剪掉很可能是因為她曾經患過什麼病,因而,自然也必須要你犧牲你的頭髮。

你瞧見那綹頭髮完全是碰巧。那個在公路上的男人無疑是她的什麼朋友,很可能是她的未婚夫。而且無疑,正因為你穿著那個姑娘的衣服,而且又那麼像她,所以每當他看見你的時候,他從你的笑容中,以後又從你的姿勢中,相信魯卡斯爾小姐確實很快樂,並認為她不再需要他的關懷了。」

當後驗機率百分之百集中在單一解釋上,在福爾摩斯心中,案件已經破了。然而,他仍然需要得到法庭可以接受的證據,那才能將罪犯訴之以法。

二、形上學:邏輯哲學論

推理小說中偵探用邏輯探案,最終還是要上法庭用語言陳述,並接受事實證據的檢驗。看過厄爾.斯坦利.加德納 (Erle Stanley Gardner)《梅森探案集》(Perry Mason)的小說讀者或電視觀眾對這點一定印象深刻。這裡要談的是:推理小說中語言與事實的關係,就是早期維根斯坦《邏輯哲學論》中語言與事實的關係。

美國雜誌印刷的“哭泣的燕子案”插圖,佩里·梅森的短篇小說,作者是厄爾·斯坦利·加德納。圖/wikipedia

在《邏輯哲學論》中,維根斯坦主張語言由命題組成,而命題是世界上事實的「圖像」。維根斯坦所謂「圖像」就是「模型」。他在《邏輯哲學論》2.12 寫道:「圖像是事實的模型」。

-----廣告,請繼續往下閱讀-----

其實,維根斯坦用「圖像」及「模型」這兩個字來描述命題與事實的對應關係,正來自於法庭上的實際作法。原來他在報上讀到巴黎法庭在審判時使用模型來呈現交通事故現場,便想到可以用圖像與事實的對應關係來描述命題與事實的對應關係。

世界由基本的事實組成,這些基本事實反映在語言中就是他所謂的「原子命題」。在語言中,這些原子命題組成了較複雜的命題。複合命題可以用邏輯真值表來判斷其真偽。

邏輯不但是語言的結構,也是世界的結構。語言中可以用邏輯推導出的命題,在世界上必然也有相對應的事實。反過來說,只有在世界上有對應事實的命題,才是在語言中有「意義」的命題。維根斯坦的這個理論,一般稱作「語言的圖像理論」或「意義的圖像理論」。

《邏輯哲學論》影響了維也納學派的邏輯實證論。到今天,社會科學中的形式理論(formal theory)都還是用邏輯推導的命題系統來為人文現象建立模型,並尋求經驗世界的實證。

-----廣告,請繼續往下閱讀-----

《邏輯哲學論》中,維根斯坦寫道:

「假設有神創造了一個世界,其中某些命題為真,那祂這樣也就創造了一個這些命題衍出的所有命題皆為真的世界了。依同樣的道理,祂不能創造一個命題『p』為真的世界,而不同時創造這個命題的所有指涉對象。」

——《邏輯哲學論》5.123

這個邏輯世界,就是福爾摩斯推理辦案的世界。福爾摩斯的名言:

「當你把一切不可能的情況都排除之後,那剩下的,不管多麼離奇,也必然是事實。」

——《四簽名》

這就是說經過邏輯演繹確立的假說,必然是案情唯一的解釋。不論這假說有多不可能,也必然可以找到事實證據來支持它通過法庭的檢驗。

這種推理方法當然不是福爾摩斯的專利。雷曼.錢德勒(Raymond Chandler)透過筆下的偵探馬婁(Marlowe)也說:

-----廣告,請繼續往下閱讀-----

「有些事情是事實:在統計的意義上、寫在紙上、錄在帶上、作為證據的事實。而有些事情之所以為事實是因為缺少了它其它的事情就無法解釋了。」

——《回播》

達許.漢密特(Dashiell Hammett)的《瘦子》也有這一段偵探尼克(Nick)與他太太諾拉(Nora)的對話:

諾拉:「所以你並不確知他搶了威年特?」

尼克:「我們當然知道。不是這樣事情就無法接榫。」

諾拉:「所以你並不確定他——」

尼克:「不要這樣說。我們當然確定。只有這樣事情才能接榫。」

換句話說:推理的結論並不是已知的事實,而只是邏輯推論得到的命題。然而,依據《邏輯哲學論》的形上學,這個命題在世界上必然會有相對應的事實,只有這樣才能跟其它已知的事實「接榫」。「接榫」(click)就是邏輯的連結;少了這個連結,案情就無法解釋。

美國的法庭上,檢察官和被告律師的任務是藉由證人的證詞拼湊足夠的事實證據讓陪審團推論出有罪或無罪的判決。證人做證前必須宣誓其所做的證詞是「事實、全部的事實、而且只有事實」(”The truth, the whole truth, and nothing but the truth.”)。

只有與案情事實相關的證詞才能被法官接受而列入紀錄。檢察官和被告律師交叉詰問證人時,常用是非題的陳述提問,只要證人回答「對」或「錯」,也就是邏輯上的「真」或「假」。這些陳述雖然不是維根斯坦所謂的原子命題,但詰問的目的就是要排比出案情的基本事實,以備最後陳述時用真值表的邏輯推論出複合命題之用。

-----廣告,請繼續往下閱讀-----
梅森探案集。圖/IMDb

像《梅森探案集》之類的法庭劇中常可看到檢察官或辯護律師高叫「反對!」(“Objection!”),其理由常是對方的詰問「無能、無關、無重要性」(incompetent, irrelevant, immaterial)。此時法官要判決反對成立(sustained)或不成立(overruled)。

與案情無關的話固然不能陳述,法庭外聽到的話(hearsay),除非是案發過程中自然説出的話(res gestae), 否則也不能作為證據。另外,證人只能陳述事實,不能做邏輯推論;檢察官或辯護律師蓄意引導證人做出結論的詰問也會受到對方的反對。在交叉詰問的階段,邏輯只能由證詞所拚構的圖像「顯示」,不能由檢察官、被告律師、證人口中來「言說」。

在這階段,法庭上的證詞都必須是切合案情、正當合宜、而且法律容許的(pertinent, proper, admissible)。這樣的證詞等同於案情事實:這是語言與事實的對應,而邏輯則是兩者的共同結構。

所有的證人都做了證之後,檢察官和律師會向法官宣稱:「這就是檢方(或辯方)所呈的全部事實了」。這句話的英文是「Thats the prosecutions (or the defendants) case.」。這裡「case」這個字的用法,令人想到維根斯坦《邏輯哲學論》的第一句話:「世界就是全部的事實」(“The world is everything that is the case.”)法庭所建構的世界就是與案情相關的全部事實,這些事實在法庭上由證人陳述,再由檢察官及律師在結辯時總結,引導陪審團作出判決。

當案情只有情況證據時,檢察官及被告律師必須要引導陪審團就情況證據做出有罪或無罪的邏輯推論。這個結論就是「榫」,是重建案情拼圖的一個缺片,它必須由邏輯來補足。

三、邏輯的界限

《梅森探案集》影集常見的劇情是:辯護律師梅森相信被告無罪,但在開庭之前他並不知道真兇是誰。他在法庭上與檢察官交叉詰問證人,檢察官當然竭力證明被告有罪;梅森則從證人證詞中尋找破綻。常常有好幾位證人都有殺人的動機,但梅森排除其他人犯案的可能性之後鎖定一人,用犀利的邏輯推出結論:「所以你就是兇手!」嫌犯在邏輯的力量之下只好認罪,案情就破了。

《梅森探案集》中的《店賊血鞋疑案》。圖/Tse-min Lin

但是辯護律師的職責並不是找出真兇而是說服陪審團被告無罪。如果無法找出真兇,梅森的做法是讓陪審團對被告是真兇的假說起合理的懷疑。依據美國法律,判決被告有罪必須超越合理的懷疑(beyond reasonable doubt),否則便應判被告無罪。什麼是合理的懷疑呢?

《梅森探案集》中的《店賊血鞋疑案》(The Case of the Shoplifters Shoe)是一篇案情錯綜複雜,而法庭攻防令人著迷的小說。這個案子的關鍵在於梅森對陪審團最後陳述時說的這一段話:

「各位女士各位先生,法庭會指示你說:要根據情況證據來判定被告有罪,那些情況不但必須與被告有罪的假說相符合,還必須與其他合理的假說不一致。假如在被告有罪的假說之外還有其它合理的假說可以解釋情況證據,你的責任便是開釋被告。」

《梅森探案集》中的《店賊血鞋疑案》。圖/Tse-min Lin
《梅森探案集》中的《店賊血鞋疑案》。圖/Tse-min Lin

在這個案件中,檢察官以女性被告的包包裡查獲兇槍、贓物,而且鞋上沾有死者血跡為證,信心滿滿地在法庭傳訊證人,重建案情。梅森卻以巧妙的邏輯推理提出另一個與這些情況證據相符的假說,點出兇手可能是另外一人,而且可以合理解釋為何被告持有所謂兇槍並且鞋上沾有死者血跡。他諄諄提醒陪審團:如果不能排除其它合理的假說,便必須開釋被告。後來陪審團果然判決被告無罪。

推理小說之所以引人入勝,常是因為一個凶殺案的真凶是誰可以有好幾個先驗機率不等於零的合理假說。偵探或法庭只要掌握足夠的事實資料,理論上便能把涵蓋所有可能解釋的先驗機率更新到所有機率集中於單一解釋的後驗機率:此時案子就破了。如果做不到,那表示兇手無法確定,邏輯推理會得到互相矛盾的結論。

維根斯坦在《邏輯哲學論》中特別強調:矛盾的命題不是世界的圖像:它不呈現任何可能的事實狀態。互相矛盾的命題,例如「疑犯有罪」和「疑犯無罪」,不可能同時皆真。

「事件或者發生或者不發生,不會有中間路線」。

——《邏輯哲學論》5.143

「矛盾是命題的外部界限」

——《邏輯哲學論》5.153

維根斯坦如是說。但是當我們對基本命題的真假尚不確定時,我們可以對由這些基本命題建構出來的複合命題定出其為真的先驗機率。這些機率的存在並不代表事件可以像「薛丁格的貓」(Schrödingers cat)一樣,又是發生又是不發生。它只是說事實資料不足時,複合命題的真假尚無法確定。當資料足夠時,命題或真或假就只有一種可能了。

《邏輯哲學論》的命題系統不容許有矛盾存在。同樣的,推理小說中的法庭也不容許有矛盾的結論。如果證人的證詞像黑澤明電影《羅生門》那樣四個證人(包括一個鬼)互相不一致,其中必然有人說謊,必須找出說謊者而加之以偽證罪。

然而《邏輯哲學論》並不是只有邏輯實證論。維根斯坦曾經在致出版商的信中說《邏輯哲學論》有兩部分。關於語言之邏輯基礎這部分只是可以寫得出的部分,關於倫理的部分其實更重要,可是不能寫出。這第二部分,通常被視為他的神祕主義。書中神祕主義的一些名言包括:


「只要是可以說的,就可以說得清楚;那些不能說的,我們必須默默地跳過。」

——《邏輯哲學論》序言

「語言的界限意謂我世界的界限。」

——《邏輯哲學論》5.6

「在我們無法言說之處,我們必須沉默。」

——《邏輯哲學論》7

法庭容許的語言是有界限的。

邏輯推理無法破案的時候,偵探必須保持沉默。案子根本上不了法庭,甭說交叉詰問。此時,語言的界限就是法庭世界的界限,「誰是兇手?」(whodunit)將永遠是一個「神祕」(mystery)。

四、結論

維根斯坦「語言的圖像理論」既然是由法庭程序得到的靈感,那麼推理小說中的法庭程序與之契合也就不特別令人訝異了。然而犯罪偵辦真的是如此嗎?

我們只要跳離推理小說,就知道真實的世界要複雜多了。不但很多犯罪事件找不到疑犯,即使找到疑犯上了法庭,證人的供辭也常支離破碎、互相矛盾而無法重建犯罪事實,對疑犯加以定罪。那麼,難道《邏輯哲學論》對語言和世界的論述有所偏差?

羅素在《邏輯哲學論》的導論中說此書所論述的是理想語言的條件,這個說法,維根斯坦當時很不能接受。然而法庭對證人陳述的規範,正是在刻意形塑「理想語言」的條件。

維根斯坦本人必須要等到他後期寫作《哲學研究》的時候,才點出《邏輯哲學論》形上學的問題:

世界上的事實不能純粹由感官來做客觀的認知,因為感官認知的資料無法避免觀點的影響,而因此陳述出的命題也就無法避免矛盾。

他提出的「鴨兔圖」(duck-rabbit picture)從一個觀點看像鴨子,另一個觀點看像兔子。如果同一物件可以因觀點脈絡不同而呈現不同面向,那如何避免不同證人在法庭上依其所看到的面向作出互相矛盾的陳述?對於後期的維根斯坦而言,矛盾已經不再是邏輯禁忌。

《哲學研究》第二部分,第六節探討的「鴨兔錯覺」。圖/wikipedia

維根斯坦是偵探小說迷,不過沒有他讀過福爾摩斯故事的記載。1949 年,在一個討論偵探小說的場合,他說英國人在這個文學類型的創作上特別有天分。他還特別舉阿嘉莎.克莉絲蒂 (Agatha Christie)為例。他認為克莉絲蒂的偵探故事不但情節巧妙,角色更寫得像「真實人物」(real people)一樣帶勁。

但維根斯坦最喜歡的卻是美國冷硬派的偵探小說,特別是較少為人知的諾伯特.戴維斯(Norbert Davis)的小說。他為何會對冷硬派偵探小說那麼入迷?

漢密特出版先驅之作《馬爾他之鷹》的時候,已經是 1930 年了;而戴維斯還要在 1932 年才開始在《黑面具》(Black Mask)雜誌發表他的第一篇小說。此時維根斯坦已經告別他失落的歲月,回到劍橋。他也從此開始與羅素漸行漸遠,揚棄羅素抽象的形式邏輯(formal logic),而逐漸發展出他後期建立在「生活形式」(form of life)之上的語言哲學。

此時的他,正要解構自己的《邏輯哲學論》——「意義」不再是基於語言之作為世界現實的「圖像」,而是基於語言之作為生活脈絡中的「遊戲」——不可能會為推理小說中虛構的邏輯實證論著迷。也許他喜歡冷硬派偵探那種在黑暗巷弄穿梭,行動精力充沛、說話酷勁十足的「真實人物」形象,與他語言哲學的轉折有關吧?

林澤民_96
37 篇文章 ・ 243 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

1

28
4

文字

分享

1
28
4
【2022 年諾貝爾生理或醫學奬】復現尼安德塔人消逝的 DNA,也映襯我們何以為人
寒波_96
・2022/10/06 ・8169字 ・閱讀時間約 17 分鐘

-----廣告,請繼續往下閱讀-----

人對自身歷史的好奇歷久彌新。最近十年古代 DNA 研究大行其道,光是發表於 Cell、Nature、Science 的論文就多到要辛苦讀完,加上其他期刊更是眼花撩亂。「古代遺傳學」的衝擊毋庸置疑,開創者帕波(Svante Pääbo)足以名列歷史偉人;然而,得知 2022 年諾貝爾生理或醫學獎由他一人獨得 ,還是令人吃驚——諾貝爾獎竟然會頒給人類演化學家?

諾貝爾獎有物理獎、有化學獎,但是沒有生物學獎,而是「生理或醫學獎」。帕波獲獎的理由是:「發現滅絕人類的基因組以及研究人類演化」。乍看和生理或醫學沒有關係,深入思考……好像還真的沒有什麼關係。

偷用強者我朋友的感想:「應該就是選厲害的。第一個和生理或醫學無關的生理或醫學獎得主,聽起來滿屌的」。

帕波直接的貢獻非常明確,在他的努力下,重現消失數萬年的尼安德塔人(Neanderthal)基因組。他為什麼想要這樣做,過程中經歷什麼困難,發現又有什麼意義呢?

-----廣告,請繼續往下閱讀-----

喜愛古埃及的演化遺傳學家

帕波公元 1955 年在瑞典出生,獲獎時 67 歲。他從小對古埃及有興趣,大學時選擇醫學仍不忘古埃及,但是一生都在追求新奇的帕波,嫌埃及研究的步調太慢,後來走上科學研究之路。1980 年代初博士班時期,他使用當時最高端的分子生物學手段探討免疫學,成果發表於 Cell 等頂尖期刊,可謂免疫學界的頂級新秀。

然而,他始終無法忘情逝去的世界。1984 年美國的科學家獲得斑驢的 DNA 片段,轟動一時。斑驢已經滅絕一百年,能夠由其遺骸取得古代 DNA,令博士生帕波大為震撼。他很快決定結合自己的專業與興趣,嘗試由古埃及木乃伊取得 DNA,並且獨立將結果發表於 Nature 期刊。

古代 DNA。圖/取自 參考資料 1

博士畢業後,帕波義無反顧地轉換領域,遠渡美國追隨加州柏克萊大學的威爾森(Allan Wilson)。威爾森在 1970 年代便開始探討分子演化,後來又根據不同人類族群間粒線體 DNA 的差異,估計非洲以外的人群,分家只有幾萬年,支持智人出非洲說。

帕波正式投入相關研究後意識到,從古代樣本取樣 DNA 的汙染問題相當嚴重。這邊「汙染」的意思是,並非抓到樣本內真正的古代 DNA 目標,而是周圍環境、實驗操作者等來源的 DNA;包括他自己之前的木乃伊 DNA,很可能也不是真正的古代 DNA。另一大問題是,生物去世後 DNA 便會開始崩潰,經歷成千上萬年後,樣本中即使仍有少量遺傳物質殘存,含量也相當有限。

-----廣告,請繼續往下閱讀-----

帕波投入不少心血改善問題。例如那時新發明的 PCR 能精確並大量複製 DNA,他馬上用於自己的題目(更早前是利用細菌,細菌繁殖時順便生產 DNA)。多年嘗試後,他決定放棄埃及木乃伊(埃及木乃伊的基因組在 2017 年成功),改以遺傳與智人差異較大的尼安德塔人為研究對象。

取得數萬年前尼安德塔人的 DNA

根據現有的證據,尼安德塔人是距今約 4 萬到 40 多萬年前的古人類。確認為尼安德塔人的第一件化石,於 1856 年在德國的尼安德谷發現,並以此得名(之前 2 次更早出土化石卻都沒有意識到)。這是我們所知第一種,不是智人的古代人類(hominin)。

對於古人類化石,一百多年來都是由考古與型態分析。帕波帶著遺傳學工具投入,不但增進考古和古人類學的知識,也拓展了遺傳學的領域。他後來前往德國的慕尼黑大學,幾年後又被挖角到馬克斯普朗克研究所,領導萊比錫新成立的人類演化部門,多年來培養出整個世代的科學家,也改變我們對人類演化的認知。

不同個體的粒線體 DNA 之間差異,智人與黑猩猩最多,智人與智人最少,智人與尼安德塔人介於期間。圖/取自 參考資料 2

帕波在 1996 年首度取得尼安德塔人的 DNA 片段,來自粒線體。他為了確認結果,邀請一位美國小女生重複實驗,驗證無誤,她就是後來也成為一方之霸的史東(Anne Stone)。比較這段長度 105 個核苷酸的片段,尼安德塔人與智人間的差異,明顯超過智人與智人。

-----廣告,請繼續往下閱讀-----

然而,粒線體只有 16500 個核苷酸,絕大部分遺傳訊息其實藏在細胞核的染色體中。想認識尼安德塔人的遺傳全貌,非得重現細胞核的基因組。

可是一個細胞內有數百套粒線體,只有 2 套基因組,因此粒線體 DNA 的含量為細胞核數百倍;而且染色體合計超過 30 億個核苷酸,數量無比龐大。可以說,細胞核基因組可供取材的 DNA 量少,需要復原的訊息又多,比粒線體更難好幾個次元。

方法學與時俱進:從 PCR 到次世代定序

一開始,帕波與合作者使用 PCR,但是帕波知道這是死路一條。取樣 DNA 會破壞材料,尼安德塔人的化石有限;PCR 一次又只能復原幾百核苷酸,要完成 30 億的目標遙遙無期。

帕波持續努力克服難關。2000 年人類基因組首度問世,採取「霰彈槍」定序法,大幅提升效率;也就是將 DNA 序列都打碎,一次定序一大堆片段,再由電腦程式拼湊。帕波因此和 454 生命科學公司合作,改用新的次世代定序法,偵測化石中的古代 DNA。2006 年發表的論文可謂里程碑,報告次世代定序得知的 100 萬個尼安德塔人核苷酸,足以進行一些基因體學的分析。

-----廣告,請繼續往下閱讀-----

帕波當時在美國的合作者魯賓(Edward Rubin)持續使用 PCR,雙方分歧愈來愈大,終於分道揚鑣。所以很可惜地,2010 年尼安德塔人基因組論文發表時,魯賓沒有參與到最後。這是人類史上第一次,取得滅絕生物大致完整的基因組,也是帕波獲頒諾貝爾獎的直接理由。

帕波戰隊。圖/取自 The Neandertal Genome Project

鐵證:尼安德塔人與智人有過遺傳交流

這份拼湊多位尼安德塔人的基因組,儘管品質不佳,卻足以解答一個問題:尼安德塔人與智人有過混血嗎?答案是有,卻和本來想的不一樣。尼安德塔人沒有長居非洲,主要住在歐洲、西南亞、中亞,也就是歐亞大陸的西部。假如與智人有過混血,歐洲人應該最明顯。結果並非如此。

帕波的組隊能力無與倫比,他廣邀各領域的菁英參與計畫,不只取得 DNA 資料,也陸續研發許多分析資料的手法,其中以哈佛大學的瑞克(David Reich)最出名。

分析得知,非洲以外,歐洲、東亞、大洋洲的人,基因組都有 1% 到 4% 能追溯到尼安德塔人(後來修正為 2% 左右)。所以雙方傳承至今的混血,發生在智人離開非洲以後,又向各地分家以前;並非尼安德塔人主要活動的歐洲。

-----廣告,請繼續往下閱讀-----

首度由 DNA 定義古代新人類:丹尼索瓦人

復原古代基因組的工作相當困難,不過引進次世代定序後,從不可能的任務降級為難題,尼安德塔人重出江湖變成時間問題。出乎意料,同樣在 2010 年,帕波戰隊又發表另外 2 篇論文,描述一種前所未知的古人類:丹尼索瓦人(Denisovan)。不是藉由化石,而是首度由 DNA 得知新的古代人種。

根據細胞核基因組,尼安德塔人、丹尼索瓦人的親戚關係最近,智人比較遠,三群人類間有過多次遺傳交流。圖/取自 參考資料 1

丹尼索瓦人得名於出土化石的遺址(地名來自古時候當地隱士的名字),位於西伯利亞南部的阿爾泰地區,算是中亞。帕波對這兒並不陌生,之前俄羅斯科學家在這裡發現過尼安德塔人化石,而且由於乾燥與寒冷,預計化石中的古代 DNA 保存狀況應該不錯。

帕波戰隊對丹尼索瓦洞穴中的一件小指碎骨定序,首先拼裝出粒線體,驚訝地察覺到這不是智人,卻也不是尼安德塔人,接下來的細胞核基因組重複證實此事。它們變成前後 2 篇論文,帕波出名的不喜歡物種爭論,不使用學名,所以直稱其為「丹尼索瓦人」。

還有幾顆丹尼索瓦洞穴出土的牙齒也尋獲粒線體,而且這些臼齒特別大,型態前所未見。奇妙的是,丹尼索瓦人粒線體、基因組的遺傳史不一樣;和智人、尼安德塔人相比,尼安德塔人的粒線體比較接近智人,細胞核基因組卻比較接近丹尼索瓦人。

-----廣告,請繼續往下閱讀-----

這反映古代人類群體間的遺傳交流相當複雜,不只是智人、尼安德塔人,也不只有過一次。後來又在丹尼索瓦洞穴發現一位爸爸是丹尼索瓦人、媽媽是尼安德塔人的混血少女,更是支持不同人群遺傳交流的直接證據。

遠觀丹尼索瓦洞穴。圖/取自論文〈Age estimates for hominin fossils and the onset of the Upper Palaeolithic at Denisova Cave〉的 Supplementary information

回溯分歧又交織的人類演化史

重現第一個尼安德塔人基因組後,帕波戰隊持續改進定序與分析的技術,也獲得更多樣本,深入不同族群的分家年代、彼此間的混血比例等問題,新知識不斷推陳出新。

丹尼索瓦人方面,如今仍無法確認他們的活動範圍,不過很可能是歐亞大陸偏東部的廣大地區。一如尼安德塔人,丹尼索瓦人也與智人有過遺傳交流。

最初估計某些大洋洲人配備 4% 到 6% 的丹尼索瓦人血緣,後來修正為 2% 左右(不同方法估計的結果不一樣,總之和尼安德塔血緣差不多)。不同智人具備丹尼索瓦 DNA 的比例差異頗大,某些大洋洲人之外,東亞族群也具備些許,歐亞大陸西部的人卻幾乎沒有。

-----廣告,請繼續往下閱讀-----
到帕波獲得諾貝爾獎為止,古代 DNA 最早的紀錄是超過一百萬年的西伯利亞古代象。圖/最早古代 DNA,超過一百萬年的西伯利亞象

至今年代最古早的人類 DNA,來自西班牙的胡瑟裂谷(Sima de los Huesos),距今 43 萬年左右(最早的是超過一百萬年的古代象,由受到帕波啟發的其餘團隊發表)。根據 DNA 特徵,胡瑟裂谷人的細胞核基因組更接近尼安德塔人,可以視作初期的尼安德塔人族群。然而,他們的粒線體卻更像丹尼索瓦人。

帕波開發的研究方法,不只針對消逝的智人近親,也能用於古代智人與其他生物,累積一批數萬年前智人的基因組。釐清近期的混血事件外,還能探討不同人群當初分家的時期。估計尼安德塔人、丹尼索瓦人約在 40 多萬年前分家,他們和智人的共同祖先,又能追溯到距今 50 到 80 萬年的範圍。

智人何以為智人?遠古血脈的傳承,磨合,新適應

消逝幾萬年的尼安德塔人、丹尼索瓦人,皆為智人的極近親。由於數萬年前的遺傳交流,仍有一部分近親血脈流傳於智人的體內。這些血脈經過數萬年,早已融入成為我們的一部分。

人,人,人,人呀。圖/取自 參考資料 2

智人的某些基因與基因調控,受到遠古混血影響。最出名的案例,莫過於青藏高原族群(圖博人或藏人)的 EPAS1 基因繼承自丹尼索瓦人,比智人版本的基因更有利於適應缺氧。另外也觀察到許多案例,與免疫、代謝等功能有關。

近年 COVID-19(武漢肺炎、新冠肺炎)席捲世界,觀察到感染者的症狀輕重受到遺傳差異影響;其中至少兩處 DNA 片段,一處會增加、另一處降低住院的機率,都可以追溯到尼安德塔人的遠古混血。

非洲外每個人都有 1% 到 2% 血緣來自尼安德塔人,不同人遺傳到的片段不一樣。將不同智人個體的片段拼起來,大概能湊出 40% 尼安德塔人基因組(不同算法有不同結果),也就是說,當初進入智人族群的尼安德塔 DNA 變異,不少已經失傳。

失傳可能是機率問題,某一段 DNA 剛好沒有智人繼承。但是也可能是由於尼安德塔 DNA 變異,對智人有害或是遺傳不相容,而被天擇淘汰。遺傳重組之故,智人基因組上每個位置,繼承到尼安德塔變異的機率應該差不多;可是相比於體染色體,X 染色體的比例卻明顯偏低;這意謂智人的 X 染色體,不適合換上尼安德塔版本。

例如 2022 年發表的論文,比較 TKTL1 基因上的差異對智人、尼安德塔人神經發育的影響。圖/取自〈Human TKTL1 implies greater neurogenesis in frontal neocortex of modern humans than Neanderthals

智人之所以異於非人者幾希?藉由比較智人的極近親尼安德塔人,能深入思考這個大哉問。是哪些遺傳改變讓智人誕生,後來又衍生出什麼不可取代的遺傳特色?另一方面也能反思,某些我們以為專屬智人的特色,其實並非智人的專利。

分析遺傳序列,畢竟只是鍵盤辦案,一向雄心壯志的帕波,當然想要更進一步解答疑惑。比方說,尼安德塔人、智人間某處 DNA 差異對神經發育有什麼影響?體外培養細胞、模擬器官發育的新穎技術,如今也被帕波引進人類演化學的領域。

瑞典與愛沙尼亞之子,德國製造,替人類做出卓越貢獻的人

回顧完帕波到得獎時的精彩成就,他的工作與生理或醫學有哪些關係,各位讀者可以自行判斷。我還是覺得沒什麼直接關係,如遠古混血影響病毒感染的重症機率這種事,那些 DNA 變異最初是否源自尼安德塔人,其實無關緊要。不過多少還是有些影響,像是為了研究古代基因組而研發出的基因體學分析方法,應該也能用於生醫領域。

《尋找失落的基因組》台灣翻譯本。

帕波 2014 年時發表回憶錄《尋找失落的基因組》,自爆許多內幕。台灣的翻譯出過兩版,可惜目前絕版了。我在 2015 年、2019 年各寫過一篇介紹。書中有許多值得玩味之處,不同讀者會看到不同重點,有興趣可以找來閱讀,看看有什麼啟發。

主題是諾貝爾獎就不能不提,帕波得獎也讓諾貝爾新添一組父子檔,他的爸爸伯格斯特龍(Sune Karl Bergström)是 1982 年生理或醫學獎得主。為什麼父子不同姓?因為他是隨母姓的私生子,父子間非常不熟。

他的媽媽卡琳.帕波(Karin Pääbo)是愛沙尼亞移民瑞典的化學家,2007 年去世前曾在訪問提及,她兒子在 13、14 歲時從埃及旅遊回來,對科學產生興趣。帕波獲頒諾貝爾獎後受訪提到,可惜媽媽已經去世,無法與她分享榮耀。移民異國討生活的單親媽媽,能夠養育出得到諾貝爾獎的兒子,也可謂偉大成就。

人類演化的議題弘大淵博,但是究其根本,依然要回歸到一代一代的傳承。每個人都無比渺小,卻也是全人類中的一份子,親身參與其中。諾貝爾生理或醫學獎 2022 年的頒獎選擇,乍看突兀,仔細思索卻頗有深意。帕波的研究也許很不生理或醫學,卻再度強化諾貝爾奬設立的精神:「獎勵替人類做出卓越貢獻的人」。

  • 帕波得獎後接受電話訪問:

延伸閱讀

參考資料

  1. Press release: The Nobel Prize in Physiology or Medicine 2022. NobelPrize.org. Nobel Prize Outreach AB 2022. Wed. 5 Oct 2022.
  2. Advanced information. NobelPrize.org. Nobel Prize Outreach AB 2022. Wed. 5 Oct 2022.
  3. Geneticist who unmasked lives of ancient humans wins medicine Nobel
  4. Ancient DNA pioneer Svante Pääbo wins Nobel Prize in Physiology or Medicine
  5. Nature 論文蒐集「Nobel Prize in Physiology or Medicine 2022
  6. Estonian descendant Svante Pääbo awarded Nobel prize

本文亦刊載於作者部落格《盲眼的尼安德塔石匠》暨其 facebook 同名專頁

所有討論 1
寒波_96
193 篇文章 ・ 1066 位粉絲
生命科學碩士、文學與電影愛好者、戳樂黨員,主要興趣為演化,希望把好東西介紹給大家。部落格《盲眼的尼安德塔石器匠》、同名粉絲團《盲眼的尼安德塔石器匠》。