Loading [MathJax]/extensions/tex2jax.js

0

1
0

文字

分享

0
1
0

給猴子打字機和足夠的時間,牠能打出曠世巨作……嗎?──《是湊巧還是機率?》

臉譜出版_96
・2018/02/20 ・2560字 ・閱讀時間約 5 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

無限猴子理論:如果你給一隻猴子無限的時間敲鍵盤,牠終究會有機會敲出莎士比亞全集……嗎?圖/By New York Zoological Society, via Wikimedia Commons

猴子問題成為機率論裡統計機制的題目,最早是出現在法國數學家埃米爾.博雷爾(Émile Borel)於一九一三年所寫的文章中,題為〈統計機制與不可逆性〉(Mècanique Statistique et Irrèversibilitè)。文中說,如果給定足夠的時間,一隻猴子可以在鍵盤上隨機敲出莎士比亞全集。當然,「足夠的時間」指的可能是無限長。

英國物理學家亞瑟.艾丁頓公爵(Sir Arthur Eddington)對於隨機性的態度則更為開放,他在一九二七年受邀到愛丁堡大學的紀福講座(Gifford Lecture)演講時說:

「如果我把手指放在打字機的按鍵上隨意亂敲,這個行為『可能可以』造出詞意通順的句子。如果一批猴子大軍亂敲著打字機,牠們可能可以寫完大英博物館中所有的藏書。」

讓猴子敲出指定字句的機率有多高?

現在,讓我們把目標簡化一下。先別指望到大英博物館,也不要談論莎士比亞全集,連十四行詩都先擱在一邊,只討論這一句:

Shall I compare thee to a summer’s day?(我怎能將夏日與你比擬)

如果一隻猴子要能依照這樣的字母順序敲出來,我們肯定會認為這是極罕見的巧合。這可能性有多大呢?絕對非常微小!

-----廣告,請繼續往下閱讀-----
打字嗎?好,我試看看。sourse

假設鍵盤上只有二十六個鍵,只能敲出小寫的字母,那麼猴子要敲對「shall」第一個字母的勝率為 25 比 1。而每一次的敲擊與任何一次的敲擊之間都互為獨立,因此,正確打出頭五個字母的機率,只有26×26×26×26×26=11,881,376 分之一,勝率為 11,881,375 比 1。不過這只是第一次打字就成功的機率,麻煩在於應該不只有一次機會,而有很多很多次。

讓我們算一下第一次嘗試時無法成功打出單字的機率,即是 1–(1 ⁄ 26)5,大約為 0.99999991583,幾近必然會發生。試驗 N 次之後,猴子沒敲對的機率為 (1–(1 ⁄ 26)5)N

嘗試越多次,沒有打出指定字母的機率越低。圖/臉譜出版提供。

N=8235542 時,牠會有超過一半的機率打對莎士比亞著名的十四行詩的第一個單字。上圖可以說明,在經過約莫五千萬次試驗之後,沒有打出「shall」的機率趨近於零 。[10]

內容越複雜,打對的機率越低

把這方法應用到密碼保護裝置上,可以得知,藉由隨機敲打字母,電腦程式就能夠輕易地破解由五個字母組成單字的密碼。如今,就連相對慢的電腦,中央處理器(CPU)都可以在少於十秒的時間內試驗五千萬次。但如果你把密碼多加上一個字母,試 214124096 次之後,才會有一半的機率能破解密碼。困難度會隨著字母(包括混合使用字母、數字及符號或大小寫)的增加而呈指數增加。請見下圖。

-----廣告,請繼續往下閱讀-----
圖/臉譜出版提供。

隨機在鍵盤上亂打,敲對 π 前六個位數的機率為 0.000001,也就是百萬分之一的機率。如果一千隻猴子中,每一隻猴子都敲鍵盤一千次,出現敲對 π 的前六個位數的機會便會超過一半。或許,這會使你覺得 π 畢竟不是那麼特殊的數,不過,這當然是因為我們只取前六個位數而已。接著,取 π 的前一百個位數。就算隨機挑選宇宙間每一顆沙粒與星辰直到時間的盡頭,寫出 π 的前一百個位數的機率還是幾近零,難以動搖。

一九一三年,埃米爾.博雷爾要我們想像一百萬隻猴子,每天花十小時隨機敲擊打字機:

Les contremaîtres illettrés rassembleraient les feuilles noircies et les relieraient en volumes. Et au bout d’un an, ces volumes se trouveraient renfermer la copie exacte des livres de toute nature et de toutes langues conservés dans les plus riches bibliothèques du monde.

(不識字的領班會把髒掉的紙收集起來疊成冊。某一個歲末之際,這些書冊會恰好與世界上藏書最豐富的圖書館中,所有語言與種類書籍的冊數相同。)

英國物理學家及數學家詹姆士.金斯爵士。圖/By Kokorik via Wikimedia Commons

而英國物理學家及數學家詹姆士.金斯爵士(Sir James Jeans)則在其著作《神祕的宇宙》(The Mysterious Universe)中這麼寫:

有人說,我想是赫胥黎吧,把六隻猴子放在打字機前胡亂敲打,數十兆年後的某個時點,會恰好打出所有大英博物館中的藏書。

如果我們檢查某隻特定猴子所打的最後一頁內容,發現在亂打的情況下剛好打出莎士比亞的十四行詩,我們想必馬上就會認定這是一起驚人的意外事件,但如果我們看遍了數百萬頁猴子在難以計量的時間內所打的內容,我們滿篤定會從中找到胡亂敲打的產物──莎士比亞的十四行詩。

同樣地,數十兆顆恆星在太空中隨意地遊蕩數十兆年,必將碰上各種意外,也必將在一定時間內製造出有限數量的行星系統。然而,若與天空中的星星數相比,行星系統的數目肯定非常小。

用電腦模擬的猴子,打出了前十九個字母

用電腦虛擬的猴子來模擬執行猴子問題。二○○四年八月四日,電腦虛擬的猴子在經過 42162500000 乘以十的十八次方個猴年之後,打出了以下內容「VALENTINE. Cease toIdor:eFLP0FRjWK78aXzVOw- m)-’ ; 8t …… 」驚奇的是,這胡亂敲打出的前十九個字母,正是莎士比亞的劇作《維洛那二紳士》(The Two Gentlemen of Verona)的第一行──VALENTINE: Cease to persuade, my loving Proteus

-----廣告,請繼續往下閱讀-----
根據莎士比亞劇本《維洛那二紳士》所繪製的畫作。圖/William Holman Hunt via Wikimedia Commons

在想到大寫鎖定鍵可能「碰巧」暫時遭到鎖定之前,我在思索的是那九個大寫字母。當然啦,四十二百京(編按:quintillion,即十的十八次方)是個相當龐大的數目,但平均得花上這麼久的時間才能等到這十九個字母以此特定的次序排列,並不代表這狀況不會在相較之下短得多的時間內發生。

也得承認,要想第一次亂敲就試出這樣的結果,機率實在小到難以想像,但並非不可能。意料之外的情事可能發生,也確實發生。以 DNA 配對為例,世界上是否會有兩個毫無瓜葛的人身上的 DNA 完全吻合?可能性微乎其微,但並非不可能。事實上,這機率僅僅只有十億分之一。

 

 

本文摘自是湊巧還是機率?臉譜出版。

 

 

-----廣告,請繼續往下閱讀-----
文章難易度
臉譜出版_96
88 篇文章 ・ 255 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

2
0

文字

分享

0
2
0
只要有無限的時間,猴子也能打出莎士比亞?什麼是「無限猴子定理」?
F 編_96
・2025/01/05 ・2391字 ・閱讀時間約 4 分鐘

F 編按:本文編譯自 Live Science

想像有一群猴子,各自拿著打字機或電腦鍵盤,隨機敲擊鍵盤上的字符。若猴子數量無窮大、時間也無限長,牠們最終能否打出《哈姆雷特》或《羅密歐與茱麗葉》所有文本?這個乍聽荒謬的問題,正是「無限猴子定理」(Infinite Monkey Theorem)所探討的核心。無限猴子定理誕生於 20 世紀初,至今已被視為一則展示機率和隨機性的幽默譬喻。它強調的是:在「無限」的前提下,哪怕事件本身概率微乎其微,也終有可能實現。但若將「無限」抽離,狀況就大幅改觀。

無限猴子定理的起源:是數學巧思還是玩笑話?

只要給猴子一台打字機,和無限的時間,就有可能打出莎士比亞嗎?圖/unsplash

無限猴子定理最早可追溯至法國數學家埃米爾·博雷爾(Émile Borel)在 1913 年的著作。他假設若有無限多隻猴子,分別隨機敲擊打字機上字母的鍵盤,那麼理論上能產生所有已經寫下或尚未誕生的文本——從簡單的「banana」字串到複雜的《哈姆雷特》、《馬克白》等莎劇。此「定理」之所以著名,在於它鮮明地說明了在「無限」長度的時間/試驗數中,任何不可能事件皆可能變得「可能」,甚至機率可達 100%。

然而,博雷爾在提出時,也暗示這只是一個數學論證,用來說明「幾近不可能事件」和「無窮大」的辯證關係。後人紛紛加以演繹,結合機率論與字母組合概念,強調這種理論上的結果不意味實際世界能夠成真;它比較像是一場「思想實驗」,或令人莞爾的理論示範。

實猴子 vs. 理論猴子:有限生命與不可預測行為

「若給一隻猴子足夠時間,牠能打出莎士比亞全集。」這句話聽起來驚世駭俗,但真正挑戰並不在於「敲出哪個字」。關鍵是,如果缺乏「無限時間」,任何一隻猴子在有限壽命裡,幾乎無法輸出任何可讀句子。澳洲悉尼科技大學數學家史蒂芬·伍德科克(Stephen Woodcock)便在相關研究中,做了現實條件下的機率估算:

-----廣告,請繼續往下閱讀-----
  • 以黑猩猩當模擬對象,因牠們與人類關係相近,體型與智力也更易想像。
  • 設定:黑猩猩可用一台打字機,每秒都敲一次鍵。
  • 理論上,若要輸出一個八字母詞彙(如 “banana”),黑猩猩在 30 年內碰巧完成的機率僅約 5%。
  • 更別提複雜的句子,機率下降至 10-20 以下,幾乎趨近於零。

伍德科克的研究認為,即便地球所有黑猩猩都在不斷敲擊鍵盤,倘若只給定數十億年的宇宙壽命,仍難以看到「完整抄出莎士比亞某部劇作」的奇蹟。只有在真正意義上的「無限猴子、無限時間」裡,才可說這件事「必然」成真。

為何「無限」只是理論

「無限猴子定理」的核心基礎在「無限」。然而,現實宇宙是有限的:從已知的膨脹速度、暗能量演化、最終熱寂(Heat Death)的走向來看,科學家推估宇宙壽命遠遠達不到真正的「無限」。無論如何,宇宙總有盡頭——能供養猴子族群繁衍與敲字的條件更是隨著時間劇烈下降。因此,哪怕猴子數量再龐大,實際上都無法達成理論中的「無限次嘗試」。

「無限猴子定理」只能是理論,是因為現實不存在「無限」的情況。圖/unsplash

在數學上,小概率事件若能重複嘗試足夠多次,便能「接近確定會發生」。不過,現實環境提供的試驗次數並非真正無窮。因此,本理論更像是用來解釋「僅憑隨機過程,最終可產生任何結構」的純粹數學概念,並不是真正能期待在有生之年或宇宙壽命中目睹它發生。

歷史上的「猴子打字機實驗」

為了更生動地理解此定理,英國藝術團隊曾在 2002 年做過一項實地實驗:他們在動物園裡放置一台電腦鍵盤,並讓 6 隻黑冠長尾獼猴(Celebes crested macaques)在上面亂敲四週。結果最終只得到五頁幾乎全是 S 的亂碼。更具諷刺的是,這群獼猴還對鍵盤進行了「實體攻擊」,甚至拉屎在上面。可見理論上的「緩慢敲擊,終能輸出經典」到了現實環境,不僅在機率上趨近於零,更在人性(以及「猴性」)互動、實驗干擾等層面上無法持續執行。

-----廣告,請繼續往下閱讀-----

這場實驗的參與者──藝術家 Geoff Cox 等人表示,結果「顯然科學上是失敗的」,但他們本來就不打算證明什麼數學命題,而是做一個行為藝術,藉此反思「動物行為本質」與「機率論」之間的斷層。在這些原本就不安於室的獼猴面前,所謂的「靜靜打字機敲鍵」更像是人類一廂情願的想像。

值得一提的是,無限猴子定理在科學與哲學層面引申出更多思考。例如量子力學背後有一定程度的「隨機」或「機率」原理,一個足夠大的時間尺度裡,看似小概率事件也可能成真;然而,我們目前所在的宇宙實際是有限之地,其法則與條件亦不斷演變。有些科學家於是把此定理視為「多世界詮釋」的類比:即在多重宇宙或平行時空中,也許某個平行宇宙里真的有個「猴子」寫下莎士比亞——但這終究超越當前能檢驗的範疇。

理想與現實的交叉

無限猴子定理雖然只是個引人發笑的比喻,卻也提醒我們「大」與「無限」之間的落差有多巨大。

正如著名科學家所言:「無限是個美好的概念,卻永遠跳脫我們的現實。」或許,下次再聽到有人提「無限猴子也能打出天才之作」,不妨微笑回應:在那個純理論的世界裡,莎士比亞的確有再版,但在我們的宇宙之內,能等到的,恐怕只是字母“S”不断刷屏,以及一堆被猴子糞便污損的鍵盤罷了。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

0

1
0

文字

分享

0
1
0
賭博與愛情公式:用數學擬定你的擇偶策略——《數盲、詐騙與偽科學》
大牌出版.出版大牌_96
・2024/01/06 ・2486字 ・閱讀時間約 5 分鐘

理解期望值,有助於分析賭場裡的大部分賭局,以及美國中西部和英國的嘉年華會中,常有人玩、但一般人比較不熟悉的賭法:骰子擲好運(chuck-a-luck)。

招攬人來玩「骰子擲好運」的說詞極具說服力:你從 1 到 6 挑一個號碼,莊家一次擲三顆骰子,如果三個骰子都擲出你挑的號碼,莊家付你 3 美元。要是三個骰子裡出現兩個你挑的號碼,莊家付你 2 美元。

假如三個骰子裡只出現一個你挑的號碼,莊家付你 1 美元。如果你挑的號碼一個也沒有出現,那你要付莊家 1 美元。賽局用三個不同的骰子,你有三次機會贏,而且,有時候你還不只贏 1 美元,最多也不過輸 1 美元。

我們可以套用名主持人瓊安.李維絲(Joan Rivers)的名言(按:她的名言是:「我們能聊一聊嗎?」),問一句:「我們能算一算嗎?」(如果你寧願不算,可以跳過這一節。)不管你選哪個號碼,贏的機率顯然都一樣。不過,為了讓計算更明確易懂,假設你永遠都選 4。骰子是獨立的,三個骰子都出現 4 點的機率是 1/6×1/6×1/6=1/216,你約有 1/216 的機率會贏得 3 美元。

-----廣告,請繼續往下閱讀-----

僅有兩個骰子出現 4 點的機率,會難算一點。但你可以使用第 1 章提到的二項機率分布,我會在這裡再導一遍。三個骰子中出現兩個 4,有三種彼此互斥的情況:X44、4X4 或 44X,其中 X 代表任何非 4 的點數。而第一種的機率是 5/6×1/6×1/6=5/216,第二種和第三種的結果也是這樣。三者相加,可得出三個骰子裡出現兩個 4 點的機率為 15/216,你有這樣的機率會贏得 2 美元。

圖/envato

同樣的,要算出三個骰子裡只出現一個 4 點的機率,也是要將事件分解成三種互斥的情況。得出 4XX 的機率為 1/6×5/6×5/6=25/216,得到 X4X 和 XX4 的機率亦同,三者相加,得出 75/216。這是三個骰子裡僅出現一個 4 點的機率,因此也是你贏得 1 美元的機率。

要計算擲三個骰子都沒有出現 4 點的機率,我們只要算出剩下的機率是多少即可。算法是用 1(或是100%)減去(1/216 +15/216 + 75/216),得出的答案是 125/216。所以,平均而言,你每玩 216 次骰子擲好運,就有 125 次要輸 1 美元。

這樣一來,就可以算出你贏的期望值($3×1/216)+($2×15/216)+($1×75/216)+(–$1×125/216)=$(–17/216)=–$0.08。平均來說,你每玩一次這個看起來很有吸引力的賭局,大概就要輸掉 8 美分。

-----廣告,請繼續往下閱讀-----

尋找愛情,有公式?

面對愛情,有人從感性出發,有人以理性去愛。兩種單獨運作時顯然效果都不太好,但加起來⋯⋯也不是很妙。不過,如果善用兩者,成功的機率可能還是大一些。回想舊愛,憑感性去愛的人很可能悲嘆錯失的良緣,並認為自己以後再也不會這麼愛一個人了。而用比較冷靜的態度去愛的人,很可能會對以下的機率結果感興趣。

在我們的模型中,假設女主角——就叫她香桃吧(按:在希臘神話中,香桃木﹝Myrtle﹞是愛神阿芙蘿黛蒂﹝Aphrodite﹞的代表植物,象徵愛與美)有理由相信,在她的「約會生涯」中,會遇到 N 個可能成為配偶的人。對某些女性來說,N 可能等於 2;對另一些人來說,N 也許是 200。香桃思考的問題是:到了什麼時候我就應該接受X先生,不管在他之後可能有某些追求者比他「更好」?我們也假設她是一次遇見一個人,有能力判斷她遇到的人是否適合她,以及,一旦她拒絕了某個人之後,此人就永遠出局。

為了便於說明,假設香桃到目前為止已經見過 6 位男士,她對這些人的排序如下:3—5—1—6—2—4。這是指,在她約過會的這 6 人中,她對見到的第一人的喜歡程度排第 3 名,對第二人的喜歡程度排第 5 名,最喜歡第三個人,以此類推。如果她見了第七個人,她對此人的喜歡程度超過其他人,但第三人仍穩居寶座,那她的更新排序就會變成 4—6—1—7—3—5—2。每見過一個人,她就更新追求者的相對排序。她在想,到底要用什麼樣的規則擇偶,才能讓她最有機會從預估的 N 位追求者中,選出最好的。

圖/envato

要得出最好的策略,要善用條件機率(我們會在下一章介紹條件機率)和一點微積分,但策略本身講起來很簡單。如果有某個人比過去的對象都好,且讓我們把此人稱為真命天子。如果香桃打算和 N 個人碰面,她大概需要拒絕前面的 37%,之後真命天子出現時(如果有的話),就接受。

-----廣告,請繼續往下閱讀-----

舉例來說,假設香桃不是太有魅力,她很可能只會遇見 4 個合格的追求者。我們進一步假設,這 4 個人與她相見的順序,是 24 種可能性中的任何一種(24=4×3×2×1)。

由於 N=4,37% 策略在這個例子中不夠清楚(無法對應到整數),而 37% 介於 25% 與 50% 之間,因此有兩套對應的最佳策略如下:

(A)拒絕第一個對象(4×25%=1),接受後來最佳的對象。

(B)拒絕前兩名追求者(4×50%=2),接受後來最好的求愛者。

如果採取A策略,香桃會在 24 種可能性中的 11 種,選到最好的追求者。採取 B 策略的話,會在 24 種可能性中的 10 種裡擇偶成功。

以下列出所有序列,如同前述,1 代表香桃最偏好的追求者,2 代表她的次佳選擇,以此類推。因此,3—2—1—4 代表她先遇見第三選擇,再來遇見第二選擇,第三次遇到最佳選擇,最後則遇到下下之選。序列後面標示的 A 或 B,代表在這些情況下,採取 A 策略或 B 策略能讓她選到真命天子。

-----廣告,請繼續往下閱讀-----

1234;1243;1324;1342;1423;1432;2134(A);2143(A);2314(A, B);2341(A, B);2413(A, B);2431(A, B);3124(A);3142(A);3214(B);3241(B);3412(A, B);3421;4123(A);4132(A);4213(B);4231(B);4312(B);4321

如果香桃很有魅力,預期可以遇見 25 位追求者,那她的策略是要拒絕前 9 位追求者(25 的 37% 約為 9),接受之後出現的最好對象。我們也可以用類似的表來驗證,但是這個表會變得很龐雜,因此,最好的策略就是接受通用證明。(不用多說,如果要找伴的人是男士而非女士,同樣的分析也成立。)如果 N 的數值很大,那麼,香桃遵循這套 37% 法則擇偶的成功率也約略是 37%。接下來的部分就比較難了:要如何和真命天子相伴相守。話說回來,這個 37% 法則數學模型也衍生出許多版本,其中加上了更合理的戀愛限制條件。

——本書摘自《數盲、詐騙與偽科學》,2023 年 11 月,大牌出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

大牌出版.出版大牌_96
3 篇文章 ・ 0 位粉絲
閱讀的大牌不侷限於單一領域, 視野寬廣,知識豐富,思考獨立。