0

0
0

文字

分享

0
0
0

「世界末日」、Oreo餅乾以及「仲夏夜之夢」,竟然有共通點?

Write Science
・2012/11/05 ・3533字 ・閱讀時間約 7 分鐘 ・SR值 495 ・六年級

-----廣告,請繼續往下閱讀-----

作者:Shane L. Larson
譯者:王人德(Ray)

我為什麼喜歡網路上的流言呢?因為它們的的確確代表著現代生活中極為荒誕的事物,說起來也不特別啦,但顯然我算是處在一群科學家中的少數族群。我可以理解那些對於時事的評論(或是網路流言),或者願意去看一部好萊塢的鉅作(像是《世界末日》),這些事物跟我腦中處理科學的機制完全搭不上邊,但它們卻和我平常所思考的事物產生衝突,我的腦因而產生化學反應,這些衝突感也為我帶來充實以及愉悅。這種「實事不求是」的精神其實對科學家們來說是非常痛苦的。

為什麼呢?科學家們已經被訓練成為一個不帶任何感情的個體,一切都只為了能夠更公正地觀察著這世間萬物。也就是說,他們已經完全和自然背道而馳,也總是將我們個人的想法像是放在一張桌子上一般,透過放大鏡來檢視。不過,我們終究是人類。但科學這項機制就是設計來保護我們的,不是嗎?我們想要並且需要一直重複做著實驗,而所得到的結果也需要被大家檢視以及懷疑,就為了找出是否哪個小細節有所矛盾。當我們發現了有矛盾的地方,而後新的實驗以及新的想法又出現了。這整個過程一直不斷地、不斷地重複著,永遠都不會停止。縱使實驗後所得到的新數據和想法被大家所肯定了,也只是被大眾認定為這是最好的「實驗示範」,快點改觀吧!若你不在科學這門學問中懂得變通,那你就錯了。若你一直墨守成規,就算你得到令人讚嘆、完美的數據,那麼你也錯了。科學這門學問會自行修正錯誤的數據,所以呢,我們做越多的實驗,我們會越來越了解大自然,對於那些自然界中的迷思也會越來越少,從小學的那些錯誤資訊也會日趨減少。

為何會日趨減少呢?而「高可能性」和「低可能性」又是甚麼意思呢?我們又該如何去理解呢?再一次地,為了理解這一切,我們又要回到先前所提到的「網路流言」了。曾經這麼流傳著:當有一百萬隻猴子站在一百萬台打字機前開始打字,最後一定會完成整部莎士比亞所寫的「仲夏夜之夢」。 

-----廣告,請繼續往下閱讀-----

科學的美在於它的接觸範圍非常的廣,而且早已有著合適的方法去套用在你所感興趣的課題上,例如我們先前提到的想法「猴子竟然能夠完成一部莎士比亞的作品?」(這是一個很有趣的智力測驗,雖然也有人認為這樣的事情就像電影「決戰猩球」一樣令人害怕。 )

我們來討論一下「可能性」吧!這是一個被人們濫用的概念,而且常常被用在稀奇古怪的地方,但我們可以從這些基礎的假設當中來思考那些網路迷因(meme)。這裡是一個簡單的範例 : 擲銅板。(但我們這次要擲的是Oreo餅乾,正反兩面各是巧克力以及原味。) 遊戲規則如下 : 若結果是原味,你就可以得到那片餅乾;反之,若是巧克力,餅乾就屬於我。對於實驗結果,我們兩個人有著同樣的利害關係。現在假設我們兩人是公平的,沒有任何方法能夠控制其變因,就暫且稱它「公平的Oreo餅乾」吧!(其實就跟硬幣和骰子是同樣道理)

所以當我擲一枚餅乾,你有一半的機率可以得到它。這是甚麼意思呢? 也就是說你擲到原味的結果是兩種結果中的其中一種。

你想要的結果/有可能的結果 = 1/2 = 0.5 → 50%

-----廣告,請繼續往下閱讀-----

一個對數學有著狂熱的人可能會向我們解釋 : 當我們拿著每袋各裝有100個餅乾的袋子,總計有10袋,而後將每一片像餅乾擲硬幣一樣,那麼平均來說,每一袋裡面都會有50片是我們想要的結果。「平均來說」是一個很重要的敘述─對於數學的困惑、爭議、發現以及理解,都隱含在這個敘述當中。統計並非一直都正確,稀奇古怪的事確實會發生機率遭到推翻的情況,所以他們才會被稱為「事變」!

那麼我們來點更複雜的問題吧!假設現在我們兩個人想要一次擁有兩塊餅乾,那麼機率又會是如何呢? 我將這個想法製作成下列的表格。有幾種方法可以得到原味Oreo餅乾呢? 兩種:在第一輪或者是第二輪拿到;同樣地也有兩種方法可以得到巧克力口味:在第一輪或者是第二輪擲到。

 

以上就是我們在這場良性競爭下所得到的結果。依序是:你得到所有的餅乾(G1-G2)、我得到所有的餅乾(C1-C2)、以及各自分攤自己的餅乾(C1-G2和G1-C2),我想應該不會影響到我們兩個人的友情吧?

看看這表格,你有四分之一的機率(1/4 = 0.25 = 25%)成為「Cookie Monster」拿走兩種餅乾。那麼我能夠不做表格就知道這結果嗎?當然!只要將每件事情發生的機率相乘就能夠得到你想求的獨立事件之機率。我們先前說過在正常情況下想得到原味餅乾的機率為50% (1/2 = 0.5 =50%),那麼如果我擲了兩次,就會得到 :

-----廣告,請繼續往下閱讀-----

天啊!但老實講:就算我贏得了兩塊餅乾,到最後我還是會分你一塊的啊 😛

現在,我們言歸正傳吧。關於猴子和莎士比亞。經過了一番搜尋之後,我還是找不到有哪個人會知道仲夏夜之夢裡頭到底有幾個字!其實我大可寫出一個程式來計算裡頭的文字量,但我還有名聲要顧啊!怎麼可能讓這種怪事讓大眾知道呢!我們還是想點簡單一點的方法吧。

試問:猴子隨機在鍵盤上打出一個英文單字的機率是多少?就拿「cookie」這個字來當範例吧。我們假設鍵盤上有27個鍵─26個英文字母以及空白鍵。猴子打出任何一個字的機率為27分之1(1/27 = 0.037 = 3.7%) 。而先打出「c」再打出「o」的機率如下:

這並不是個大數字吧? 那麼打出完整的單字「cookie」呢?

-----廣告,請繼續往下閱讀-----

我們可以發現,猴子想要隨機打出「cookie」這個字的機率就高達40億分之1!那麼一部莎士比亞的劇作難度就更高了。裡頭有更多的字需要訂正呢!

但是呢,「猴子」們在網路上更加活躍(當你看過網路上的評論或者是部落格就能夠理解)。當有一大群猴子開始打字,理所當然地一定會有一隻能夠完成這項壯舉,就讓我們來看一下這個有趣的想法吧:仲夏夜之夢一共有2165行,而每一行大致上有45個字,因此:2165(行)X 45(字) = 97425(字),猴子們有97425個字需要去完成。

一隻猴子完成這件事的機率會是多少呢? 以「cookie」這個實驗當作範例,1/27一共要相乘97425次,就成了97425分之一了(以數學符號來表示就是1/2797425)。如果你將27相乘97425次,那數字不只是大,更是令人嘆為觀止!因此1/2797425理所當然是個超級小的數字了。在科學中,我們學到了如何簡潔有力寫出極大和極小的數字,也就是科學記號,方法其實很簡單,只要將在一個數字後面乘上10的次方就行了。

舉例來說吧,1×103的意思就是將10連乘3次後再乘1(也有此一說:每當要乘以10時,就在數字後加個0),因此,1×103 = 1000,理所當然地,7×104 就是7x10x10x10x10 = 70000。

-----廣告,請繼續往下閱讀-----

將這個想法套用在猴子實驗身上之後,我們該怎麼表達2797425呢? 科學記號中,這也可以轉換成1×10139,450(1後面有139,450個0)。所以一隻猴子想要完成一部仲夏夜之夢的機率將會是1/10139,450。換句話說,在我們開始實驗之前,我們需要先收集到10139,450隻猴子。

這是個令人瞠目結舌的數字啊!這麼龐大的數字根本不存在我們所認知的宇宙當中。例如:一個Oreo餅乾大約等於7×1023個原子;相較之下,太陽大約等於1×1057個原子;而整個銀河系大約等於1×1069原子;而在我們可見的宇宙中大約包含1×1080個原子。所以倘若你想要讓一隻猴子意外地打出一部莎士比亞的劇作,你會需要比整個宇宙的原子數量還要多的猴子,似乎是不可能的呢。

其實做這些實驗只是有趣的消遣娛樂而已,但他們真的跟現實世界有所關聯嗎?當然,統計一直與我們的生活息息相關。其實呢,Oreo實驗所使用的計算方式也能套用在其他事情上;得了癌症之後的存活率、無線網路一次可以支援幾支手機、以及計算我們未來登上那未知的星球─火星的成功率。(http://mars.jpl.nasa.gov/)

猴子實驗只是一個對現代文化的反思,也從來沒有想要去挑戰科學,但它卻真實反映了非常人性化的一面─也就是根深蒂固在我們心中的,那種人類無法掌控整個宇宙的無力感。但不可否認的─藝術和科學是我們唯一可以抒發無力感的管道。天才莎士比亞因為沒有同儕之間的影響,所以他能夠以純人類的角度來思考並且創作故事,不只啟發了我們,也深深影響著後代。同樣地,科學也是那些因為那些天才們努力不懈地發掘才有今日的成果。我們能夠發現新事物,並且藉由所學的知識來改善生活品質。我們能夠將所發現的事情記錄下來,而後啟發我們的子孫們,使他們更加了解自己所生活的世界中的點點滴滴。

-----廣告,請繼續往下閱讀-----

對於透過科學來了解事物這件事,我深信不疑,甚至是相當有自信。我很欣慰並且敬畏我擁有「發現」的能力。但這並不代表每個問題都能夠容易解決。發展出能夠穿梭於星球間的科技依舊困難;完全了解動物(或植物)的演化依舊困難;了解癌症的本質也依舊困難。但我還是有信心,只要給我足夠的時間、足夠的資源、以及充足的腦力,任何問題都可以得到一個答案,而你們也應該這麼想。「盡信書,不如無書」,再看一次電影「世界末日」吧,雖然是個逃避現實的科幻故事,但卻也同時表達了一件事:科學永遠在你身邊。

原文:The Commonality of Armageddon, Oreos, & Shakespeare’s “A Midsummer Night’s Dream”

文章難易度
Write Science
17 篇文章 ・ 1 位粉絲
A collaborative project to practice the craft of communicating scientific ideas.

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

0
0

文字

分享

0
0
0
賭博與愛情公式:用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/06 ・2486字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

理解期望值,有助於分析賭場裡的大部分賭局,以及美國中西部和英國的嘉年華會中,常有人玩、但一般人比較不熟悉的賭法:骰子擲好運(chuck-a-luck)。

招攬人來玩「骰子擲好運」的說詞極具說服力:你從 1 到 6 挑一個號碼,莊家一次擲三顆骰子,如果三個骰子都擲出你挑的號碼,莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼,莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼,莊家付你 1 美元。如果你挑的號碼一個也沒有出現,那你要付莊家 1 美元。賽局用三個不同的骰子,你有三次機會贏,而且,有時候你還不只贏 1 美元,最多也不過輸 1 美元。

我們可以套用名主持人瓊安.李維絲(Joan Rivers)的名言(按:她的名言是:「我們能聊一聊嗎?」),問一句:「我們能算一算嗎?」(如果你寧願不算,可以跳過這一節。)不管你選哪個號碼,贏的機率顯然都一樣。不過,為了讓計算更明確易懂,假設你永遠都選 4。骰子是獨立的,三個骰子都出現 4 點的機率是 1/6×1/6×1/6=1/216,你約有 1/216 的機率會贏得 3 美元。

-----廣告,請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率,會難算一點。但你可以使用第 1 章提到的二項機率分布,我會在這裡再導一遍。三個骰子中出現兩個 4,有三種彼此互斥的情況:X44、4X4 或 44X,其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6=5/216,第二種和第三種的結果也是這樣。三者相加,可得出三個骰子裡出現兩個 4 點的機率為 15/216,你有這樣的機率會贏得 2 美元。

圖/envato

同樣的,要算出三個骰子裡只出現一個 4 點的機率,也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6=25/216,得到 X4X 和 XX4 的機率亦同,三者相加,得出 75/216。這是三個骰子裡僅出現一個 4 點的機率,因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率,我們只要算出剩下的機率是多少即可。算法是用 1(或是100%)減去(1/216 +15/216 + 75/216),得出的答案是 125/216。所以,平均而言,你每玩 216 次骰子擲好運,就有 125 次要輸 1 美元。

這樣一來,就可以算出你贏的期望值($3×1/216)+($2×15/216)+($1×75/216)+(–$1×125/216)=$(–17/216)=–$0.08。平均來說,你每玩一次這個看起來很有吸引力的賭局,大概就要輸掉 8 美分。

-----廣告,請繼續往下閱讀-----

尋找愛情,有公式?

面對愛情,有人從感性出發,有人以理性去愛。兩種單獨運作時顯然效果都不太好,但加起來⋯⋯也不是很妙。不過,如果善用兩者,成功的機率可能還是大一些。回想舊愛,憑感性去愛的人很可能悲嘆錯失的良緣,並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人,很可能會對以下的機率結果感興趣。

在我們的模型中,假設女主角——就叫她香桃吧(按:在希臘神話中,香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物,象徵愛與美)有理由相信,在她的「約會生涯」中,會遇到 N 個可能成為配偶的人。對某些女性來說,N 可能等於 2;對另一些人來說,N 也許是 200。香桃思考的問題是:到了什麼時候我就應該接受X先生,不管在他之後可能有某些追求者比他「更好」?我們也假設她是一次遇見一個人,有能力判斷她遇到的人是否適合她,以及,一旦她拒絕了某個人之後,此人就永遠出局。

為了便於說明,假設香桃到目前為止已經見過 6 位男士,她對這些人的排序如下:3—5—1—6—2—4。這是指,在她約過會的這 6 人中,她對見到的第一人的喜歡程度排第 3 名,對第二人的喜歡程度排第 5 名,最喜歡第三個人,以此類推。如果她見了第七個人,她對此人的喜歡程度超過其他人,但第三人仍穩居寶座,那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人,她就更新追求者的相對排序。她在想,到底要用什麼樣的規則擇偶,才能讓她最有機會從預估的 N 位追求者中,選出最好的。

圖/envato

要得出最好的策略,要善用條件機率(我們會在下一章介紹條件機率)和一點微積分,但策略本身講起來很簡單。如果有某個人比過去的對象都好,且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面,她大概需要拒絕前面的 37%,之後真命天子出現時(如果有的話),就接受。

-----廣告,請繼續往下閱讀-----

舉例來說,假設香桃不是太有魅力,她很可能只會遇見 4 個合格的追求者。我們進一步假設,這 4 個人與她相見的順序,是 24 種可能性中的任何一種(24=4×3×2×1)。

由於 N=4,37% 策略在這個例子中不夠清楚(無法對應到整數),而 37% 介於 25% 與 50% 之間,因此有兩套對應的最佳策略如下:

(A)拒絕第一個對象(4×25%=1),接受後來最佳的對象。

(B)拒絕前兩名追求者(4×50%=2),接受後來最好的求愛者。

如果採取A策略,香桃會在 24 種可能性中的 11 種,選到最好的追求者。採取 B 策略的話,會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列,如同前述,1 代表香桃最偏好的追求者,2 代表她的次佳選擇,以此類推。因此,3—2—1—4 代表她先遇見第三選擇,再來遇見第二選擇,第三次遇到最佳選擇,最後則遇到下下之選。序列後面標示的 A 或 B,代表在這些情況下,採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告,請繼續往下閱讀-----

1234;1243;1324;1342;1423;1432;2134(A);2143(A);2314(A, B);2341(A, B);2413(A, B);2431(A, B);3124(A);3142(A);3214(B);3241(B);3412(A, B);3421;4123(A);4132(A);4213(B);4231(B);4312(B);4321

如果香桃很有魅力,預期可以遇見 25 位追求者,那她的策略是要拒絕前 9 位追求者(25 的 37% 約為 9),接受之後出現的最好對象。我們也可以用類似的表來驗證,但是這個表會變得很龐雜,因此,最好的策略就是接受通用證明。(不用多說,如果要找伴的人是男士而非女士,同樣的分析也成立。)如果 N 的數值很大,那麼,香桃遵循這套 37% 法則擇偶的成功率也約略是 37%。接下來的部分就比較難了:要如何和真命天子相伴相守。話說回來,這個 37% 法則數學模型也衍生出許多版本,其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。

0

10
2

文字

分享

0
10
2
鑑識故事系列:Lucia de Berk 值班死幾人?荷蘭護理冤案
胡中行_96
・2023/02/27 ・2983字 ・閱讀時間約 6 分鐘

前言:本文為鑑識系列中,罕見提及統計學的故事。不過,繁複的計算過程全部省略,僅討論統計概念和辦案原理。請害怕數學的讀者放心。

護理人員 Lucia de Berk。圖/Carole Edrich on Wikimedia Commons(CC BY-SA 3.0)

荷蘭護理人員 Lucia de Berk,長年於海牙茱莉安娜兒童醫院(Juliana Kinderziekenhuis)的 1 個病房,與紅十字醫院(Rode Kruis Ziekenhuis)的 2 個病房工作。2001 年 12 月,她因謀殺罪嫌被捕。[1]

超幾何分佈

警方起先偵辦 2 名住院病患的死因,發現是中毒身亡;後來連帶調查 1997 至 2001 年間,幾家醫院可能的謀殺案件,於是找上了她。[2]在法庭上,司法心理學家 Henk Elffers 用機率的概念,證明 Lucia de Berk 有罪。簡單來說,就是計算嫌犯現身出事班次的機率。他採取的統計方法,叫做超幾何分佈(又稱「超幾何分配」;hypergeometric distribution)。[1]

超幾何分佈適合用在從一個母數中,隨機抽取樣本,不再放回的情形。例如:袋子裝有 N 顆球,其中 L 顆為紅球。一把抓出 n 顆球,不特別挑選的話,紅球碰巧被抓到的機率為 X。[3, 4]以此類推,在此案被調查的時間範圍內,病房總共有 N 個班次,其中 Lucia de Berk 值了 L 班,而有醫療事故的班次共 n 個。如果不刻意安排,則她正好出現在事故班次的機率為 X。[1]公式介紹。[4]

此處實際帶入數據後得到的答案,說明 Lucia de Berk 理論上應該只有 3 億 4 千 2 百萬分之一(X = 1 / 3.42 x 108)的機率,會剛好在醫療事故發生的班次值班。因此,法庭認定她的頻繁出現(> 1 / 3.42 x 108),絕非巧合。[1, 2, 5, 6]2003 年,Lucia de Berk因 7 起謀殺和 3 次殺人未遂,[2]被判終身監禁。[5]

茱利安納兒童醫院(Juliana Kinderziekenhuis)外觀。圖/Joris on Wikimedia Commons(CC BY-SA 3.0)
紅十字醫院(Rode Kruis Ziekenhuis)已於 2021 年關閉。圖/1Veertje on Wikimedia Commons(CC BY-SA 4.0)。

統計謬誤

當時有位醫師任職於 Lucia de Berk 待過的一家醫院。他的女性姻親 Metta de Noo-Derksen 醫師,以及 Metta 的兄弟 Ton Derksen 教授,都覺得事有蹊蹺。[7]Metta 和 Ton 檢視死者的病歷紀錄,並指出部份醫療事故的類型和事發時間,與判決所用的數據對不起來因為後者大半仰賴記憶,他們甚至發現有些遭指控的班次,Lucia de Berk 其實不在現場。然而,光是這些校正,還不足以推翻判決。[1, 7]

-----廣告,請繼續往下閱讀-----

所幸出生於英國的荷蘭萊頓大學(Universiteit Leiden)統計學榮譽教授 Richard Gill,也伸出援手。[2]在協助此案的多年後,他的團隊發表了一篇論文,解釋不該使用超幾何分佈的理由,例如:[1]

  1. 護理人員不可互換:所有受訪醫師都說,護理人員可以相互替換;但是護理人員覺得,他們無法取代彼此。由於各別的個性與行事風格迥異,他們對病患的影響也不同。[1]
  2. 醫療事故通報機率:既然每個護理人員都有自己的個性,他們判定某事件為醫療事故,並且通報醫師的機率也不一樣。[1]畢竟醫院的通報規定是一回事;符合標準與否,都由護理人員判斷。比方說,有個病患每次緊張,血壓就破表。那就讓他坐著冷靜會兒,再登記第二次測量的正常結果即可。不過,難免會有菜鳥護士量一次就嚇到通報,分明給病房添亂。
  3. 班次與季節事故率:夜間與週末只剩護理人員和少數待命的醫師;季節性的特定病例增減;以及病患的生理時鐘等,都會影響出事的機率。[1]
  4. 護理排班並不平均:護理人員的班次安排,理想上會有帶狀的規律。可能連續幾天都是白班,接著是幾個小夜班之類的,[1]比較方便調整作息。此外,護理人員的資歷和個性,通常也會被納入考量。[1]以免某個班次全是資深人員;但另個班次緊急事故發生時,卻只剩不會臨機應變的新手。在這樣的排班原則下,如果單看某個時期的班表,每個人所輪到的各類班次總數,應該不會完全相同。
  5. 出院政策曾經改變:茱莉安娜兒童醫院在案發期間,曾經針對確定救不活的小病患,是否該在家中或病房離世,做過政策上的調整。帳面上來說,算在病房裡的事故量絕對會有變化。[1]

總之,太多因素會影響護理排班,或是干擾醫療事故的通報率,因此不能過度簡化成抽取紅球那樣的隨機概念。更嚴重的是,Henk Elffers 在計算過程中,分開處理 3 個病房的機率,然後再相乘。Richard Gill 的團隊強調,這樣會造成在多處上班的護理人員,比只為一處服務者,看起來有較高的嫌疑。[1]

帕松分佈

因應這種情境,Richard Gill 教授建議採用帕松分佈(又譯「布阿松分配」;Poisson distribution),[1]一種描述特定時間內,事件發生率的統計模型。[8]有別於先前的計算方法,在這裡事故傾向(accident proneness),以及整體排班狀況等變因,都納入了考量。前者採計護理人員通報醫療事故的意願強度;後者則為輪班的總次數。這個模型通常是拿來推估非尖峰時段的來電、大城市的火災等,也適用於 Lucia de Berk 的案子。[1](深入瞭解公式計算(p. 4 – 6)。[1, 8]

雖然此模型的細節複雜,統計學家得大費周章解釋給法官聽,但是考慮的條件比較趨近真實。倘若套用原始判決的數據,這個計算最後的答案是 0.0206161,意即醫療事故本來就有 49 分之 1 的機率,會與 Lucia de Berk 的班次重疊。如果帶入 Mettade Noo-Derksen 和 Ton Derksen 校正過的數據,機率更高達 9 分之 1。[1, 9]換句話說,她單純是倒楣出現在那裡,就被當作連續殺人犯。[6]

其他證據與翻案

大相逕庭的計算結果,顯示出選擇正確統計模型的重要性。然而,最不合理的,是以機率作為判決的主要根據。就謀殺案件來說,怎能不忠於病歷或驗屍報告?Richard Gill 教授接受美國犯罪學講師 Jon Robins 的訪問時,表示後來由醫師和毒物學家組成的獨立團隊,被允許瀏覽當初沒送上法庭的關鍵資料。[2]他們發現原本被視為受害者的病患,根本都喪命於自然死因。[2, 6]

在各方人士的協助下,Lucia de Berk 還是歷經兩次上訴失敗。[6]她曾於 2008 年,被允許在家等候重審結果。[1]但直到 2010 年 4 月,司法才還她清白。[7]Ton Derksen 認為,在荷蘭像這樣誤判的案件,約佔總判決數的 4 至 11%,也就是每年 1,000 人左右。不過,2006 到 2016 年間被判刑的 2 萬 3 千人裡,只有 5 個上訴到最高法院,而且僅 Lucia de Berk 的案子得以平反。[10]

-----廣告,請繼續往下閱讀-----
Lucia de Berk 冤案改編電影的海報。圖/電影《Lucia de B.》(2014) on IMDB

  

參考資料

  1. Gill RD, Groeneboom P, de Jong P. (2018) ‘Elementary Statistics on Trial—The Case of Lucia de Berk’. Chance 31, 4, pp. 9-15.
  2. Robins J. (10 APR 2020) ‘Ben Geen: Statisticians back former nurse’s in last chance to clear name’. The Justice Gap.
  3. 超幾何分佈」國立高雄大學統計學研究所(Accessed on 03 FEB 2023)
  4. 李柏堅(06 FEB 2015)「超幾何分配CUSTCourses on YouTube.
  5. Sims J. (24 FEB 2022) ‘Are We in the Midst of a Data Illiteracy Epidemic?’. Inside Hook.
  6. Schneps L, Colmez C. (26 MAR 2013) ‘Justice Flunks Math’. The New York Times.
  7. Alexander R. (28 APR 2013) ‘Amanda Knox and bad maths in court’. BBC News.
  8. 李伯堅(04 FEB 2015)「布阿松分配」CUSTCourses on YouTube.
  9. Wilson D. (13 DEC 2022) ‘Red flag to be wary of when hunting a killer nurse’. The Herald, Scotland.
  10. One in nine criminals may have been wrongly convicted – research’. (21 NOV 2016) Dutch News.
胡中行_96
169 篇文章 ・ 65 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。