0

0
0

文字

分享

0
0
0

學生與政府的「墨西哥對峙」僵局|囚徒困局系列(三)

林澤民_96
・2014/03/26 ・3343字 ・閱讀時間約 6 分鐘 ・SR值 549 ・八年級

8566462-3378108

文 / 林澤民
(轉載自nilnimest 的部落格

本來好好一個賽局,已經玩到一個穩定狀態 ─ 學生持續佔領立法院,政府不敢驅離 ─ 卻把佔上風的「懦夫賽局」,變成了雙輸的「囚徒困局」。政府覺得當「傻瓜」的代價已經比鎮壓的代價更大了,當然只好鎮壓。結果呢?唉!

賽局理論中,參賽兩方對峙而形成僵局的情況可以是所謂「懦夫賽局」 (Chicken Game) 或「囚徒困局」 (Prisoner’s Dilemma)。兩者數學上的差別似乎不大,但理性的參賽者在不同的賽局卻會有很不相同的行為。此次學生運動便見證了兩種賽局的不同,其差異直可以影響到國家及個人的命運。

關於賽局理論的一些重要概念,如參賽者 (player),策略 (strategy),結果 (outcome),收益 (payoff) ,優勝策略 (dominant strategy),納許均衡 (Nash equilibrium),伯瑞多最佳結果 (Pareto-optimal outcome)等,可參考林澤民老師本系列前兩篇文章:

下面是「懦夫賽局」和「囚徒困局」的收益矩陣,其中

  • A,B:參賽者
  • C,D:策略,C=合作 (Cooperate),D=不合作 (Defect)
  • (D,C),(C,C),(D,D),(C,D):結果或策略組合
  • T:收益,參賽者一方合作另一方不合作時,不合作者的誘惑 (Temptation)
  • R:收益,參賽者雙方均合作時,合作者的報酬 (Reward)
  • P:收益,參賽者雙方均不合作時,不合作者的懲罰 (Punishment)
  • S:收益,參賽者一方合作另一方不合作時,合作者的傻瓜收益 (Sucker’s Payoff)
  • 4=最好收益; 3=次好收益; 2=次壞收益; 1=最壞收益

「囚徒困局」 (Prisoner’s Dilemma)

 

Player B

C

D

Player A

C

R=3,R=3

S=1,T=4

D

T=4,S=1

P=2,P=2

T>R>P>S

「懦夫賽局」 (Chicken)

 

Player B

C

D

Player A

C

R=3R=3

S=2T=4

D

T=4S=2

P=1P=1 

T>R>S>P

兩個賽局的差異,在於在「囚徒困局」中,S是最壞收益,而在「懦夫賽局」中,P是最壞收益。

在「囚徒困局」中,由於T>R以及P>S,D 是優勝策略,(D,D) 是納許均衡,但因為 R>P,(D,D) 不是伯瑞多最佳結果。理性的參賽者會選擇D,但雙方均會因 (C,C) 比 (D,D) 來得好而懊惱。可是 (D,D) 是納許均衡,因此參賽者不會一廂情願地改變。反過來說,雖然雙方都知道 (C,C)比 (D,D) 好,(C,C)卻不是納許均衡,即使兩人約好共同選擇 (C,C),只要承諾沒有約束力,堅持合作的結果只會得到最壞的傻瓜收益。這是此賽局之所以是困局的原因。

在「懦夫賽局」中,由於 T>R 但 S>P,不論C或D都不是優勝策略。可是這賽局卻有兩個純粹策略的納許均衡:(C,D) 和 (D,C)。不論是 (C,D) 或 (D,C),理性的參賽者在這兩個結果中,都不會一廂情願地改變策略,因單方面改變只能帶來更壞的結果。而且 (D,C) 和 (D,C) 都是伯瑞多最佳結果,因為不管怎麼改變,都會有參賽者受害,所以這賽局不是一個困局。

「懦夫賽局」的原型故事是兩人開車對撞,如果選擇在相撞前避開,就是合作 (C),否則就是不合作 (D)。因為避開被視為「懦夫」 (Chicken),故賽局俗稱「懦夫賽局」。一般人應該都會同意當懦夫至少比撞死好,所以 T>R>S>P 是成立的。冷戰時期的古巴飛彈危機事件中,美蘇之間核子戰爭一觸即發,但最後關頭蘇聯避開了;賽局的最後結果是理性選擇理論所預測的一個納許均衡的結果。

這次學運,佔領立法院可以看成一個「懦夫賽局」:

 

學生

和平離開立法院

堅持佔領立法院

政府

不驅離

R=3,R=3

S=2,T=4

驅離

T=4,S=2

P=1,P=1

對政府,特別是威權性強的政府而言,驅離可以展現維持社會治安的決心,處罰參與行動的學生以警效尤,並讓事件儘早落幕。如果學生面對驅離而和平離開,則政府鐵腕收效,又沒有流血衝突,這是對政府而言的最好結果。如果政府不驅離而任學生佔領數日後自行離開,則政府雖無橫暴的惡名,卻可能因任學生佔領公署拿不出對策而遭無能之譏,不過事件總算和平解決,這是次好的結果。如果政府不驅離而任學生持久佔領,則政府根本是無能解決問題,這是次壞的結果。最後,如果政府驅離而學生抵抗,致造成流血衝突,此結果恐怕政府不願見,而且也會有嚴重的後續效應,恐怕學生及反對政府暴力的社會人士也不能善罷干休,因此這是對政府而言最壞的結果。如果這樣的收益分析可以成立的話,T>R>S>P 對政府是成立的。

對學生而言,如果政府不驅離,能持續佔領立法院至政府在服貿議題上屈服為止,那當然是最好的。如果覺得象徵性訴求已經達成而自動見好就收退場,像洪仲丘事件時的公民1985行動一樣,則也不錯。如果等到政府驅離才乖乖離開,則團體的威信受損,而且恐怕會遭秋後算帳,這是次壞的結果。當然,被暴力驅離是最壞的結果了。這樣的分析顯示:T>R>S>P 對學生也是成立的。

由於T>R>S>P 對參賽者雙方均成立,這幾天在台灣上演的「佔領/驅離」賽局是「懦夫賽局」。政府的立法及行政部門一再宣示不會用武力驅離立法院的學生,可以說政府至少暫時扮演了懦夫的角色,而立法院的學生並無退讓跡象。根據賽局理論,這樣的結果是「懦夫賽局」的兩個納許均衡之一,在雙方不改變策略的情況下,這個結果是穩定的,各界不期望這僵局能夠很快解決。

那麼為什麼23日晚上會發生流血衝突呢?那是因為賽局的收益矩陣改變了。主要是對政府而言,立法院的情形已經使得它蒙受無能處理的惡名,而且立法院的議事受阻問題還不算太嚴重,如果連行政院施政都要受影響,那根本政府不成其為政府了。而且學生佔領立法院,行政院之後,下一步可想而知是總統府,是可忍,孰不可忍?當一個傻瓜 (Sucker) 已經夠糗了,難道還要當兩個,甚至三個?所以學生佔領行政院後,對政府而言,S 已經變成最壞的結果了,

因此,新的情況使得對政府而言,T>R>P>S,驅離變成優勝策略,而且不必等待,當天就採取行動,學生是否退讓已經不重要了。

那麼學生為什麼要進一步佔領行政院?首先,這也許只是一部分學生的誤算。目前的報導無法確定佔領行政院是誰發起的行動,而且沒有證據顯示它與佔領立法院的學生領袖林飛帆等人有關。但手機及網路世代,動員容易;不論是誰發起,群眾不加深思而跟隨,從賽局理論來看,就是非理性的行為。但也許這些發起人認為在馬英九記者會「跳針」似的談話後,持續佔領立法院已於事無補。而進一步升高衝突,甚至流血,或許能夠得到比枯坐立法院更好的結果。這樣的話,賽局就變成如下的囚犯困局了:

 

學生

和平離開行政院

堅持佔領行政院

政府

不驅離

R=3,R=3

S=1,T=4

驅離

T=4,S=1

P=2,P=2

如此,雙方對峙就是一種所謂「墨西哥對峙」(Mexican Standoff)的囚徒困局了,如吳宇森【喋血雙雄】中有名的這一幕。這種對峙之下,你不開火他開火是最壞的結果,所以理性的參賽者會希圖僥倖而開火,但如果你的火力沒他的大,吃虧的終究是你自己。從支持學運的觀點來看,好好的一個「懦夫賽局」玩成「囚徒困局」,這真是可惜的事。

f_10638303_1

作者:林澤民
台大電機系畢業,美國明尼蘇達大學政治學博士,現任教於美國德州大學奧斯汀校區政府系。林教授今年(2014)五月中至六月底將於台大政治系開授總時數36小時的「理性行為分析專論」課程。七月下旬並將於中央研究院政治學研究所參與政治學研究方法訓練營的教學工作。林教授的中文部落格多為文學、藝術、政治、及文化評論。網址: http://blog.udn.com/nilnimest/article

文章難易度
林澤民_96
36 篇文章 ・ 234 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

4

4
0

文字

分享

4
4
0
做一顆原子彈有多困難?《奧本海默》背後的細節!原子彈究竟是文明之火,還是毀滅之火?
PanSci_96
・2023/08/27 ・6337字 ・閱讀時間約 13 分鐘

人類史上第一顆核武器 The Gadget 試爆。圖/wikimedia

1945 年 7 月 16 日美國時間早上五點三十分,在新墨西哥州的托立尼提沙漠內,人類史上第一顆核武器 The Gadget 引爆,爆炸溫度 7 千萬 K,三位一體核試驗宣告成功。這次爆炸不僅留下 80 公尺寬的核彈坑,徹底打開了潘朵拉之盒。

知名導演克里斯多福.諾蘭的電影「奧本海默」,用鏡頭為我們帶來奧本海默這位偉大科學家波瀾壯闊的一生,從他為人類取來核武器火種以威懾納粹,但意識到自己帶來的不是文明之光,而是毀滅之火。最後拒絕繼續參與氫彈的開發,卻捲入共產思想疑雲的政治風暴之中。

奧本海默的精彩故事,歡迎大家進電影院好好體會,但在進戲院之前,我們先來了解,這位原子彈之父,是怎麼做出原子彈的。為何曼哈頓計畫需要召集如此多的科學家,甚至招募多達 13 萬名員工來完成這項壯舉?預告片中出現的這個球體,是如何改變人類的歷史?

電影《奧本海默》預告片中出現的這個球體,是如何改變人類的歷史?圖/奧本海默電影預告

原子彈如何被製造?

1945 年 8 月 6 日與 8 月 9 日,兩枚原子彈小男孩與胖子分別在廣島與長崎的 550 公尺上空引爆,雖然終結了第二次世界大戰,但造成的直接與間接死傷,更震撼了全世界。

雖然兩顆笨重的原子彈重量超過 4 公噸,但真正的核燃料核心在原子彈小男孩中只占了 50 公斤,而且經過計算,實際參與反應的可能只有其中 1 公斤。另一個原子彈胖子的核心更小,只有 6.2 公斤,是個直徑約 10 公分的球體,實際參與反應的部分大約是 1.2 公斤。

根據愛因斯坦著名的質能等價公式 E=mc^2,我們可以計算出在反應中損失 1g 質量,會產生大約 90 兆焦耳的能量,相當於 2 萬噸 TNT 的能量。1g 質量換 2 萬噸 TNT,難怪不論哪個陣營都想盡快開發出這恐怖的炸彈。預告片裡面也提到,許多科學家都擔心「如果我們不現在加緊研發,被納粹先做出來了怎麼辦」,而推動了這足以毀滅人類的軍武競賽。

但是,就算有了質能等價公式,卻還是無法憑空造出原子彈。我們過去在討論核能的影片中提過,核反應要持續,需要靠連鎖反應。一個反應堆中,每吸收一個中子就會釋放一個中子,讓反應穩定進行下去,稱為臨界狀態,也是一般核能發電廠希望達到的狀態。如果吸收一個中子,卻釋放不到一個中子呢?,那就稱為次臨界。所有沒在反應的燃料棒都應該處於這個狀態。原子彈呢,當然是希望吸收一個中子,釋放出超過一個中子,讓反應快速連鎖下去,在極短時間釋放巨大能量。這個狀態稱為超臨界或是過臨界狀態。

這邊提個物理學家間的有趣討論,預告片中,由麥特戴蒙飾演的格羅夫斯少將問奧本海默,在 The Gadget 試爆的瞬間,世界有沒有可能就此毀滅,奧本海默回答「機率幾乎是零」。這件事其實是出自奧本海默與另一位物理學家康普頓的討論,他們想到,大氣中有許多氫氣、氦氣、氮氣等輕元素,核爆瞬間可能會因為高溫在大氣中引發核融合,甚至產生連鎖反應,連海水中的氫都發生爆炸,讓地球化為太陽,世界終結。奧本海默和其他科學家還實際嚴密計算,確認機率幾乎是零。

預告片中,格羅夫斯少將問奧本海默,在 The Gadget 試爆的瞬間,世界有沒有可能就此毀滅。圖/奧本海默電影預告

雖然核融合與核分裂的條件不相同,這個假設放在現在可能覺得太過誇張,但這也說明要讓核反應連續下去並不簡單。

在核分裂中,要達成超臨界狀態並不容易。在理想條件下,鈾 235 每吸收一顆熱中子,會產出 2.06 個中子,吸收快中子則會產出 2.5 個中子。另一個原子彈核燃料鈽 239,則在吸收熱中子和快中子兩種不同能量的中子後,分別產出 2.1 和 3 個中子。然而實際上,中子往四面八方移動,並不是所有的中子都會被原子核捕獲。加上未濃縮的燃料中含有大量其他元素,例如鈾 238,導致燃料堆很難進入超臨界狀態,大幅降低炸彈的效果。等等,既然如此,曼哈頓計畫是怎麼克服這件事的呢?

如何讓原子彈進入超臨界狀態?

電影預告中的芝加哥 1 號堆 CP-1。圖/奧本海默電影預告

1942 年 12 月 2 日,人類史上第一個核反應堆-芝加哥 1 號堆 CP-1,在物理學家費米的主持下,初次達到臨界狀態,曼哈頓計畫成功踏出第一步,人類正式進入原子能時代。預告中一閃而過的這個結構,就是 CP-1,由 4 萬多個作為中子減速劑的石墨塊組成,裡面塞著一顆顆的鈾塊。

很難想像的是,在當時,控制臨界狀態的控制棒竟然是讓人用手抓著的,反應堆的位置還在芝加哥大學的足球場底下 (Stagg Field)。

人類史上第一個核反應堆-芝加哥 1 號堆 CP-1,可以看見控制臨界狀態的控制棒是讓人用手抓著的。圖/wikimedia

在這之後,曼哈頓計畫進入下一個階段,洛斯阿拉莫斯國家實驗室 LANL(也就是電影預告中的小鎮)成立,奧本海默擔任首任主任,並聚集了當時幾乎所有能找到的物理、化學、工程學專家。

洛斯阿拉莫斯國家實驗室 LANL。圖/奧本海默電影預告

為了讓原子彈能順利進入超臨界狀態,科學家的第一步,就是要濃縮鈾。將天然鈾礦中佔 0.7% 的鈾 235,濃縮到將近 100%。這不簡單,首先,鈾的沸點是攝氏 4000 度,因此要先與氟反應成沸點只有攝氏 57 度的六氟化鈾,接著利用兩者質量的些微差異,使用氣體擴散法或是離心法分離。

以氣體擴散法為例,氣體通過過濾材料的能力,正比於分子量的平方根,然而六氟化鈾 235 和六氟化鈾 238 的分子量分別是 349 和 352,只差了 0.85%。實際上兩者穿越過濾膜的能力大約是 1 比上 1.003,也就是經過一次濃縮,濃度會從 0.7%,變成 0.7021%,經過 100 次濃縮,濃度才會從 0.7% 變成 0.945%,要濃縮到接近 100%,非常耗時又耗力!雖然後來還有發展熱擴散法、透過雷射游離後分離的方法,或是結合質譜儀與迴旋加速器磁鐵的電磁分離法,但不論哪個,不是技術要求極高,就是需要重複多次,有些方法還會有臨界事故的風險,選項其實也不多。

但積沙成塔,聚少成多,只要肯花時間與人力,遲早都能得到濃縮鈾。有了寶貴的濃縮鈾,和來自中子照射鈾 238 產生的鈽 239,終於,原子彈可以登場了。

原子彈如何運作的?

原子彈是如何運作的呢?我們先從「小男孩」開始說起。

原子彈小男孩採用的是槍式結構,裡面有四個重要構造:核心、起爆劑、反射體、和起動物。在炸彈尚未引爆時,含有高濃度鈾的核心會先被分為左右兩塊。爆炸時再透過起爆劑讓兩塊核心撞在一起,進入超臨界狀態。

原子彈小男孩的槍式結構。圖/wikimedia

為什麼兩塊併為一塊就會進入超臨界?這是因為在連鎖反應時,中子會不斷從核心的表面逃脫,變成無效的中子,減緩連鎖反應。對於核心這種球體來說,表面積與體積的比值,會與直徑成反比。也就是當球體越大,表面逃逸的中子對於整體的影響就越小,內部就能有更強的連鎖反應,直到臨界狀態。此時核心的質量,就稱為臨界質量。

也就是當球體越大,表面逃逸的中子對於整體的影響就越小,內部就能有更強的連鎖反應,直到臨界狀態。圖/wikimedia

在小男孩中,被拆成兩半的核心各自都未達到臨界質量,直到兩塊撞在一起,才進入臨界甚至超臨界狀態。這時,旁邊以鈾為材料的反射體,則負責將溢出的中子反射回核心,進一步觸發更強烈的連鎖反應。

最後,為了讓反應在核心撞在一起的瞬間,就以最激烈的方式進行,核心通常會設有「起動物」,由鈹-9 和釙-210 組成。釙 210 會因為自然衰變,不斷產生 α 射線,鈹則會在吸收 α 射線後產生中子,作為整個連鎖反應的開頭。在原子彈爆炸前,鈹和釙會跟著分成兩半的核心分別放在兩側,隨著核心碰撞的瞬間產生反應,釋出大量中子。

但槍式構造的反應方式效率十分低下,原子彈小男孩中實際參與反應的燃料,根據事後計算,大約只有五十分之一。而且,槍式結構也無法使用連鎖反應更強的鈽作為燃料。

因此,電影中球型的內爆式原子彈就登場了。

球形的內爆式原子彈。圖/奧本海默電影預告

什麼是內爆式原子彈?

胖子原子彈的燃料使用率大約是 1/5,是小男孩的十倍,這是因為它採用了內爆式結構。

回頭說一下,小男孩的槍式結構雖然效率不高,但結構簡單不易出錯,因此甚至沒有測試過就被投入實戰。

而內爆式的胖子因為容錯率低,因此前面才有三位一體試驗中原子彈 The Gadget 的試爆。

內爆式結構複雜在哪呢?在內爆式結構中,最內層一樣是用金屬層隔開的起動物鈹-9 和釙-210,外面是由鈾和鈽組成的混合氧化物核燃料 MOX,更外圈是用來反射中子的反射體。在反射體外面,占整顆炸彈體積最大的,是一般的炸藥。作用是在起爆時,將核心用力往內擠壓,將核心推向超臨界狀態,讓起動物的金屬隔層破裂,誘發中子釋放。在原子彈誘爆初期,因為外頭炸藥的擠壓,中子會在反射層內快速反彈,大大增加燃料的使用率。

內爆式結構示意圖。圖/wikimedia

在預告畫面中的球體,就是標準的內爆式原子彈。在結構正中央的圓形物體,其實是反射層,核心和起爆物都被包裹起來,在看不見的更裡頭。而外面一塊塊的多邊形結構,其實都是炸藥,負責擠壓核心,但如何在內爆時讓核心維持完美球形,不會因為壓力不均而從某側破裂,卻是一項巨大挑戰。

內爆式原子彈。圖/奧本海默電影預告

為了確保達到預期效果,原子彈中含有爆炸速度快與慢的兩種炸藥,透過時間差,讓反射層在壓縮核心時能維持對稱的圓形。為了解決這個艱鉅的挑戰,數學家約翰.馮紐曼發展了 ZND 模型,用來計算火藥與震波的模型,成功計算出快、慢火藥的比例與配置。沒錯,就是那位提出電腦馮紐曼架構的那位馮紐曼。

橘色是「慢速火藥」,黃色是「快速火藥」,另外 Detonator 為「雷管」。圖/PanSci YouTube
放置炸藥引信。圖/奧本海默電影預告

更進一步,為了達到計算的效果,32 塊炸藥需要在千萬分之一秒內同時引爆,然而當時的雷管引爆誤差可能有 1/10 秒以上。這時,另一位物理學家阿爾瓦雷茨出馬了,他開發出 EBW 式雷管,解決了問題。這種雷管允許大電流通過,但同時也需要總重量一公噸的電池和電容器才能運作。預告片這句「起爆器已充電」指的應該就是這些電池與電容。

雷管允許大電流通過,但同時也需要總重量一公噸的電池和電容器才能運作。圖/奧本海默電影預告
雷管。圖/wikimedia

至此,濃縮燃料、內爆式結構和啟爆裝置都就緒了,接下來的故事大家都知道了。1945 年 7 月 16 日早上五點三十分,刺眼的火球照亮整個沙漠(聽說只有費曼裸眼看了這場人類核彈首爆秀),人類在核武器的發展上已經無法停下腳步。

人類在核武器的發展上已經無法停下腳步。圖/奧本海默電影預告

導演克里斯多福.諾蘭的最新大作《奧本海默》,改編自這本獲得普林斯頓獎的傳記「American prometheus The Triumph and Tragedy of J. Robert Oppenheimer 」,《奧本海默的真相與悲劇》,並冠上副標 American prometheus 美國普羅米修斯,象徵為人類取來原子之火。

三位一體核試驗成功的 20 年後,奧本海默回憶到:「我們知道世界自此就不再一樣了。有的人笑,有的人哭,但大部分人沉默無言。我想起了印度教古典《薄伽梵譚》中,毗濕奴對阿周那王子所說:『我現在成了死神,世界的毀滅者。』我想,我們大家都多多少少是這樣想的。」

奧本海默的回憶。圖/atomicarchive.com

兩顆原子彈在日本被投下的隔年,奧本海默拒絕參與第四次核試驗,也拒絕杜魯門總統邀請的氫彈計畫。從此,這位原子彈之父人生出現重大轉變。小勞勃道尼飾演的原子能委員會主席,路易斯.史特勞斯,也將為奧本海默的人生帶來許多風雨。

電影原作書籍的兩位作者 Kai Bird 和 Martin J. Sherwin,雖然不是奧本海默的好友,但兩位都是歷史學家,也是政治、核武和冷戰的研究專家。書中從奧本海默小時候的成長與求學開始、講到他參與曼哈頓計畫與擔任洛斯阿拉莫斯國家實驗室主任、成為原子彈之父、受到政治迫害,最後獲得平反,鉅細靡遺地介紹了他的一生與心境變化。整本書花了 25 年完成,蒐集了成千上萬份收藏於美國國會圖書館,來自奧本海默的文件、以及 FBI 超過 25 年累積了數千頁的監控紀錄、還採訪了將近一百位熟悉奧本海默的密友、親戚與同事。光是聽以上的說明,就已經能想像其豐富又崎嶇的生活歷程了。

歷時 25 年,蒐集了成千上萬份資料完成的電影原作書籍。出自原文書第xii頁,中文版第6頁。

關於這些科學家之間的互動與理念的碰撞,我們就等著進電影院,看諾蘭大師如何透過鏡頭,介紹這段人類的重要歷史吧!

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

所有討論 4

0

2
1

文字

分享

0
2
1
為什麼同伴會出賣你?從「囚徒困境」來看共犯為什麼先招了!——《大話題:賽局理論》
大家出版_96
・2023/04/22 ・1979字 ・閱讀時間約 4 分鐘

合作與私利的權衡:囚徒困境

最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。

囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。

囚徒困境是指兩名囚犯陷入「是否要認罪」的心理狀態。圖/《大話題:賽局理論》

阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。

阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。

阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。

刑期長短受到共犯是否認罪的影響。圖/《大話題:賽局理論》

我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。

如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。

囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。

考慮到先認罪的人可以免去刑責,將導致四種可能結果。圖/《大話題:賽局理論》

合作或私利考量下的「最佳解」不同

這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。

請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。

現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。

兩名囚犯就彼此的利益思考,形成「囚犯困境」的心理狀態。圖/《大話題:賽局理論》

很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。

但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。

以個人來說,最佳的回應便是「認罪」。圖/《大話題:賽局理論》

同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。

在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:

{ 認罪,認罪 }

前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。

即使雙方最佳利益為「沉默」,但在囚徒困境下卻會選擇「認罪」。圖/《大話題:賽局理論》

這屬於柏雷多效率嗎?

一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。

囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。

不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。

囚徒困境並非柏雷多效率,因雙方若選擇共同沉默將能有更好的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

大家出版_96
14 篇文章 ・ 8 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

2
1

文字

分享

0
2
1
我預判了你的預判!為什麼高手過招總會和局?——《大話題:賽局理論》
大家出版_96
・2023/04/21 ・1459字 ・閱讀時間約 3 分鐘

什麼是「賽局理論」?

賽局理論是在研究策略性互動。策略性互動也是很多桌遊的關鍵元素,賽局理論因此得名。你的決策影響別人的行動,反之亦然。賽局理論的不少術語直接取自這類遊戲。我們把決策者稱為「參與者」(player)。參與者做決定後,就採取了行動(move)。

以策略性互動為基礎的賽局理論。圖/《大話題:賽局理論》

運用模型簡化複雜世界

真實世界的策略性互動可能非常複雜。例如在人際互動中,不僅行動,包括我們的表情、聲調和肢體語言都會影響他人。

在與他人往來時,人們展現不同的經歷與觀點。這樣無以計數的變化會使得情況異常複雜,也很難分析。

藉由稱為「模型」的簡化結構,我們可以大幅縮減複雜的程度。模型雖然簡單且容易分析,但仍然捕捉了真實世界問題的某些重要特徵。選用適當的簡單模型,可以有效幫助大家學習真實世界的複雜問題。

藉由模型簡化真實世界的複雜策略性互動。圖/《大話題:賽局理論》

西洋棋可以幫助我們瞭解這些變化會讓參與(及預測)賽局變得多麼複雜。西洋棋的規則明確,雖然每一步棋的選項有限,但整體棋局的複雜度令人生畏。不過比起許多人類的基本互動,西洋棋其實簡單多了!

西洋棋儘管複雜,但比人類互動簡單多了。圖/《大話題:賽局理論》

高手過招容易和局!

像西洋棋之類的桌遊有個特性:玩家愈熟練,就容易產生平手的結局。我們如何解釋這種現象?

因為西洋棋太複雜,難以全面分析,以下我們用簡單的井字遊戲來說明一個重要特性。西洋棋和井字遊戲都有明確的勝負規則。玩家輪流落子,且可以下的地方有限。

井字遊戲無法表現西洋棋中的許多特性。但由於兩者有些共同特徵,因此井字遊戲可以幫助人們瞭解高手對陣為什麼容易產生和局。

井字遊戲因為較簡單,掌握規則後就很容易平手。圖/《大話題:賽局理論》
因為井字遊戲太容易平手,因此人們開始挑戰更複雜的遊戲。圖/《大話題:賽局理論》

被簡化的世界縮影:「賽局」

賽局理論的首要關注並非西洋棋之類的桌遊,而是要增進我們對人際、對企業間、對國家間、對生物間……等互動行為的瞭解。原因是,真實的問題可能過於複雜且難以充分掌握。

因此,在賽局理論中我們創造了非常簡化的模型,稱之為「賽局」。創造有用的模型既是科學,也是藝術。

好的模型夠簡單,讓人能充分瞭解驅動參與者的誘因。同時,模型必須能夠捕捉真實世界的重要元素,以富有開創性的洞察力與判斷力決定哪些元素最為相關。

沒有模型能適用任何狀況,因為真實世界如此複雜。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

大家出版_96
14 篇文章 ・ 8 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。