0

0
0

文字

分享

0
0
0

金球的囚徒|囚徒困局系列(一)

tml_96
・2015/12/21 ・2587字 ・閱讀時間約 5 分鐘 ・SR值 523 ・七年級

f_10559118_1

人與人之間的競爭與合作是很難拿捏的事。很多時候,雙方合作比不合作能給各自帶來更大的好處,但是一廂情願地合作的人,卻有可能被對方視為「潘仔」或「傻瓜」(Sucker)而予取予奪。於是,在各自的利害考量下,沒有人願意合作,寧可兩輸也不願意當「潘仔」。這種困境,可以存在於人際關係,經濟交易,政治角力,國際關係,甚至自然環境的維護,在人生及社會上,可說屢見不鮮。

英國BBC電視中心製作的Golden Balls便是模擬這種困境的競賽節目。節目中,二參賽者爭取一筆獎金,例如1000英鎊。二人隔桌對坐,面前各有兩顆金球,其中一個金球裡面寫著Split(平分),另一個寫著Steal(竊佔)。如果二人均選擇Split,則獎金平分。如果二人均Steal,則獎金槓龜。而如果一人Steal而另一人Split,則Steal者獨佔全額獎金,而Split者只能抱蛋含恨而歸。此賽局可用下圖來表示:

Player B
Split Steal
Player A Split 500, 500 S, 1000
Steal 1000, S 0, 0

其中S雖然表面上也是0,其實比零還糟,因為若雙方均Steal,雖然無人得獎,畢竟互相扯平,而單方面的Split除了抱蛋而歸外,還要加上當「潘仔」的懊惱、義憤、和羞辱,所以S<0。(讀者可以自問:你寧可Steal而雙輸呢,還是Split而當「潘仔」?)如此,則理性的參賽者會算計:如果對方Split,自己的較佳策略是Steal,因為Steal會贏得全額獎金,而Split則只能贏得一半。而如果對方Steal,則自己更應該Steal,否則就要當大傻瓜了。於是,對理性的參賽者而言,Steal是一個「優勝策略」。而如果雙方均如此算計,結果就獎金就槓龜了。

「金球」節目容許參賽者在決定之前互相溝通,可是即使雙方協議Split,因為口說無憑,輕易信賴對方的承諾反而容易吃虧上當。以下這場獎金高達100,000英鎊的金球大賽即紀錄了輕信人言的苦果:

Golden Balls 所顯示的困境,正是所謂的「囚徒困局」 (Prisoner’s Dilemma)。囚徒困局是賽局理論中一種非零和賽局,它反映了人際間常見的困境。這個賽局可以表現如下:

Player B
C D
Player A C RA, RB SA, TB
D TA, SB PA, PB

定義:

A,B:參賽者
C,D:策略。C=合作(Cooperate),D=不合作或背叛(Defect)
TA,RA,PA,SA:參賽者A在表中各種策略組合下的收益
TB,RB,PB,SB:參賽者B在表中各種策略組合下的收益
T=Temptation,R=Reward,P=Punishment,S=Sucker’s Payoff

賽局的假設:

  1. A,B均只為自己利益著想
  2. A,B無法達成彼此信賴的有效承諾
  3. TA>RA>PA>SA
  4. TB>RB>PB>SB

賽局中,A,B二人均可以自由選擇合作或不合作兩種策略。在上列假設下,A,B均會發現不論對方合作或不合作,不合作比合作會給自己帶來較大的收益:假使對方合作,你合作可以得到收益R,而不合作則能得到收益T>R;假使對方不合作,你合作可以得到收益S,而不合作則能得到收益P>S。這樣算計的話,二人均不會合作,結果獲得P的收益。然而,二人旋即發現如果二人均合作的話,收益R比P要來得好(R>P)。可是在無法信賴對方的情況下,自己片面合作是不智的,因為對方如果還是不合作的話,對方將會得到最好的收益T,而自己將會得到最壞的收益S。於是,二人會陷於相互背叛的困境。

賽局理論中,D是所謂優勝策略(dominant strategy),也就是不論對方選擇何種策略,選擇D均會給自己帶來較大的收益。相互背叛的(D,D)策略組合是所謂的納許均衡(Nash equilibrium),也就是在(D,D)的情況下,沒有人會片面改採其它策略。可是(D,D)不是所謂的伯瑞多最佳結果(Pareto optimal outcome),因為(C,C)帶來的收益,對兩人均要比(D,D)帶來的收益要來得好。這個賽局之為困局正是因為它唯一的Nash equilibrium不是Pareto optimal。它之所以稱作囚徒困局,是因為以下的故事:

二人共同犯罪被捕而成為囚徒。檢察官要囚徒認罪,但告知他們其求刑不僅與個別囚徒認罪與否有關,也與共犯認罪與否有關:如果二人均供認犯行不諱,則證據確鑿,檢察官將求刑3年。如果二人均不認罪,因證據不足,檢察官將只能以技術性的微罪求刑1年。如果一人認罪而另一人不認罪,則檢察官會對認罪之人處分不起訴,而對不認罪之人求處重刑5年。如果把不認罪視為二囚徒之間的合作而認罪視為相互背叛,則這個故事符合如下的賽局:

Player B
不認罪 認罪
Player A 不認罪 -1, -1 -5, 0
認罪 0, -5 -3, -3

因為TA=TB=0,RA=RB=-1,PA=PB=-3,SA=SB=-5,T>R>P>S對A,B二人而言均成立,所以認罪(D)是dominant strategy。二人均會認罪(D,D)。二人於是會被檢察官求刑3年。(D,D)是為Nash equilibrium。可是(D,D)不是Pareto optimal,因為(C,C)只會被求刑1年。雖然如此,二人在無法相互信賴的情況下還是會互相背叛而認罪。這是囚徒困局的原型典故。上面Golden Balls的賽局中,TA=TB=1000,RA=RB=500,PA=PB=0,SA=SB<0,也是T>R>P>S 對A,B二人而言均成立,因此它是不折不扣的囚徒困局。

Golden Balls賽局容許參賽者在決定Split或Steal之前互相溝通,這是賽局理論所謂的「訊號傳送」(signaling)機制,讓參賽者向對方暗示甚或明示自己是何種類型的玩家。賽局理論一般認為參賽者要付出相當的代價才能讓他傳送的訊號具有可信度,而廉價的訊號只是舌燦蓮花(cheap talk)而已。例如參賽者可能發誓一定會合作,但發誓伴以「斬指頭」的代價顯然要高於「斬雞頭」的代價,前者所傳送的訊號會比後者要可信得多。Golden Balls的參賽者即使信誓旦旦會Split,沒有「斬指頭」之類的行為保證,終究是舌燦蓮花,不足深信。

那麼為何有些Golden Balls參賽者願意Split?賽局理論純粹是數學理論,在實證上並沒有百分之百的預測能力。「理性」有其經驗上的分配:不同國家、文化、宗教、社會、種族、性別、收入、教育等等的人參與Golden Balls都可能做出不同的選擇。而且Golden Balls的signaling雖然是cheap talk,不同的人也可能有不同的反應,例如有些人就容易相信態度誠懇或英俊漂亮的參賽者所傳送的訊號。「理性」終究只是理論上的假設,它是否客觀事實仍有待經驗檢定。

原刊載於Tse-min Lin 的部落格

文章難易度
tml_96
34 篇文章 ・ 227 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

5
1

文字

分享

0
5
1
婚姻中的賽局理論!從兩首古詩理解「穩定婚姻問題」
tml_96
・2021/09/23 ・3781字 ・閱讀時間約 7 分鐘

賽局理論演算的「穩定婚姻」

賽局理論中有所謂「穩定婚姻問題」。在所有婚姻狀態均「穩定」的已婚社群,每對夫妻各自都無法找到比現在更好的另一半。換句話說,所謂「穩定」的已婚社群,就是丈夫想出軌,他想出軌的對象也不認為他會比現在的另一半來得好,因此不可能會跟這位丈夫在一起,反之妻子亦然。 因此,婚姻中的男女即使見異思遷,實際上也改變不了自己的婚姻狀態。

穩定婚姻意涵社群中,曠夫怨婦不可能藉著與原來配偶離婚,再互相結婚來改進他們的婚姻狀況。這也是賽局理論所說的「伯瑞多最佳」狀態。但這並不代表每個婚姻中人都是如魚得水,他們可能只是找不到更好而有意願的對象而已。

賽局理論中的穩定婚姻,並不表示夫妻兩人過得好。圖/Pixabay

「穩定婚姻問題」尋求一個把男女配對而形成穩定婚姻社群的演算法。這方法早在 1962 年即由 2012 年諾貝爾經濟學獎得主 Lloyd ShapleyDavid Gale 解出。其方法稱做 Gale-Shapley 演算法。Gale-Shapley 演算法的應用遠超過婚姻配對問題,例如美國醫學協會把住院醫師與實習醫院配對便用了這個演算法。

這個演算法要求社群中每個人都要列出他或她對所有異性的喜好順序。例如在三男三女的社群中,假設各人的偏好順序如下表:

三男三女各自心目中的喜好順序。

三男三女共可有六組不同的婚姻配對,其中有三組是穩定婚姻。

第一組:(A 女,乙男)、(B 女,丙男)、(C 女,甲男)。社群中每位女士均嫁了她們最心儀的男士,但每位男士均娶了他們最看不上眼的女士。很顯然地,雖然男士們都蠢蠢欲動,其奈女士們不動如山何?這組婚姻符合穩定的定義。

所有的女士都找到了自己最好的對象,就算男士對自己的對象再有怨言,也無法找到願意出軌的女士。

第二組:(A 女,甲男)、(B 女,乙男)、(C 女,丙男)。與第一組恰恰相反,這裡每位男士均娶了他們最心儀的女士,但每位女士均嫁了她們最看不上眼的男士。依同理,這組婚姻也是穩定的。

所有的男士都找到了自己最好的對象,就算女士對自己的對象再有怨言,也無法找到願意出軌的男士。

第三組:(A 女,丙男)、(B 女,甲男)、(C 女,乙男)。這裡不分男女均已獲得了次愛對象的垂青。如果有人還不知足,想更上一層樓,很抱歉:他(她)們心目中最愛的對象卻看他(她)們最不上眼呢,還是乖乖守護家庭吧。穩定婚姻!

三男三女皆找了自己還能接受的對象在一起,但所有人也無法找到比目前對象更好的伴侶。

從這個例子可以看出:穩定婚姻的演算法並不保證唯一解,而且也不保證人人都美滿幸福。

穩定婚姻的演算法是基於無法找到更好的人,並不保證所有人幸福美滿。圖/Pixabay

那麼,對婚姻充滿浪漫期待的青年男女們如何才能在穩定的前提上爭取到如意的對象呢?賽局分析顯示,採取主動的一方,比較容易得到排序較高的對象。例如若女性採取主動,則結果較可能是第一組。若男性採取主動,則結果較可能是第二組。被動的一方很可能在形勢比人強的情形下止於末選。

網路上有好幾個網頁以 Python 程式語言執行了 Gale-Shapley 演算法。有興趣的讀者可以參考文末書目。

中國古詩中的穩定婚姻問題

這裡以兩首中國古詩為例說明什麼是「穩定婚姻」、什麼不是「穩定婚姻」。

從漢朝樂府詩 《陌上桑》來看穩定婚姻問題

漢朝樂府詩《陌上桑》全詩如下:

日出東南隅,照我秦氏樓。秦氏有好女,自名為羅敷。羅敷喜蠶桑,採桑城南隅。青絲為籠繫,桂枝為籠鉤。頭上倭墮髻,耳中明月珠。緗綺為下裙,紫綺為上襦。行者見羅敷,下擔捋髭鬚。少年見羅敷,脫帽著帩頭。耕者忘其犁,鋤者忘其鋤。來歸相怨怒,但坐觀羅敷。

使君從南來,五馬立踟躕。使君遣吏往,問是誰家姝。「秦氏有好女,自名為羅敷。」「羅敷年幾何?」「二十尚不足,十五頗有餘。」使君謝羅敷:「甯可共載不?」

羅敷前致辭:「使君一何愚!使君自有婦,羅敷自有夫。東方千餘騎,夫婿居上頭。何用識夫婿?白馬從驪駒。青絲繫馬尾,黃金絡馬頭;腰中轆轤劍,可直千萬餘。十五府小吏,二十朝大夫,三十侍中郎,四十專城居。為人潔白皙,鬑鬑頗有鬚。盈盈公府步,冉冉府中趨。坐中數千人,皆言夫婿殊。」

這詩中的「使君」與「羅敷」都已婚。「使君」喜歡「羅敷」甚於喜歡自己太太,但是「羅敷」喜歡自己的先生甚於「使君」。何以見得?「使君一何愚」等於現代人罵無聊男子是「癡漢」。而「皆言夫婿殊」更掩不住嫁了如意郎君的沾沾自喜。

另外,詩中雖未點明,但「羅敷」的夫婿四十幾歲了能娶到十幾歲而又真心愛慕他的美女,即使「使君」的太太羨慕「羅敷」先生高富帥,怨嘆「使君」隨地拈花惹草,「羅敷」的先生應該不至於會喜歡她甚於喜歡自己太太。果然如此,這兩對夫妻所組成的社群,其婚姻狀態便算「穩定」。所以「穩定婚姻」不代表婚姻中人不見異思遷,而是即使想劈腿自己更喜歡的人也找不到願意的對象而無法做到。

依照上面的假設,各人的偏好順序如下:

《陌上桑》 中二男二女的喜好順序。

我們可以看到(羅敷,羅敷夫)、(使君婦,使君)的配對是穩定的。雖然使君婦跟使君都是跟他們的最末順位結婚,可是那即使不滿意也已經無法改善了,被罵「癡漢」也只能黯然。

黃色為使君夫婦的配對,藍色為羅敷夫婦的配對,可以看到羅敷夫婦正好是對方心目中的第一順位。縱使使君認為羅敷才是他的真愛,但羅敷對他的另一半非常滿意,因此兩人不可能在一起。

從《節婦吟·寄東平李司空師道》來看穩定婚姻問題

同樣描寫婚姻狀態的唐代張籍的《節婦吟·寄東平李司空師道》,道出了不太一樣的情境。

君知妾有夫,贈妾雙明珠。
感君纏綿意,繫在紅羅襦。
妾家高樓連苑起,良人執戟明光裡。
知君用心如日月,事夫誓擬同生死。
還君明珠雙淚垂,恨不相逢未嫁時。

這首詩中的「妾」受到「君」的撩撥其實已經動了心。她起初還把「君」贈她的兩顆明珠繫在她貼身的紅色蕾絲小可愛上。後來雖然還給了他,並不是因為喜歡「良人」甚於喜歡「君」。

何以見得?詩中所引用的理由是「妾家高樓連苑起,良人執戟明光裡」。這兩句我怎麼看怎麼不對勁。也許傳統的解釋是說夫家有錢還位居高官。但高樓深宅事實上並沒有防得了「妾」與「君」私通款曲,當然更栓不住她愛慕的心。

至於「良人執戟明光裡」,其實也不過是在皇宮充當侍衛,並不是什麼大不了的官,遠比不上「陌上桑」裡羅敷的夫婿。說不定「良人」不值班的夜晚便拿著他那枝戟月光下在自家門外巡防太太私奔呢!無論如何,這詩裡的「妾」只是個受傳統規範羈束的「節婦」加「怨婦」。「事夫誓擬同生死」不過是「從一而終」的概念。

最後一句「恨不相逢未嫁時」更毫不掩飾地表明了「怨婦」的心情:如果不是喜歡「君」甚於喜歡「良人」,直接罵他「痴漢」就是了,何至於「還君明珠雙淚垂」?又何需心中有恨?這樣的婚姻只能以外力來維持穩定,算不得賽局理論的「穩定婚姻」。

在這個配對中,假設各人的偏好順序如下(註:原詩未提「君」是否已婚。這裡的分析假設他已娶妻,但「君婦」的偏愛順序並不重要。):

(妾,妾夫)、(君婦,君)的配對是不穩定的,因為「妾」跟「君」如果做得到可以離開原配、互結連理而改進他們的婚姻幸福。只是不幸活在不能隨意離婚的時代,也只能「恨不相逢未嫁時」了!

黃色為君與君婦的配對,藍色為妾與妾夫的配對,可以看到妾與君兩人都選了第二順位作為伴侶,並認為彼此都是最佳伴侶(紅色標示),因此極有可能出軌。在這個情況下,最穩定的結果是(妾,君)、(君婦,妾夫)的組合。

參考書目

  1. D. Gale and L. S. Shapley. “College Admissions and the Stability of Marriage.” The American Mathematical Monthly, Vol. 69, No. 1 (Jan., 1962), pp. 9-15.
  2. Alexander Osipenko, “Gale–Shapley Algorithm Simply Explained.”
  3. 漢娜弗萊著,洪慧芳譯。《數學的戀愛應用題》第三章〈提高安打率的秘密〉。天下雜誌出版。
tml_96
34 篇文章 ・ 227 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
2

文字

分享

0
0
2
戰機擾台有效嗎?從賽局理論看中國的「危險邊緣」策略
tml_96
・2020/10/06 ・3005字 ・閱讀時間約 6 分鐘 ・SR值 523 ・七年級

  • 作者/林澤民

最近中國在台海附近頻頻軍演,其戰機也連日騷擾台灣領空。央視主播李紅甚至引前總統馬英九「首戰即終戰」論調出言恐嚇。這明顯的是所謂「危險邊緣」 (brinkmanship) 策略的施展,常見於國際間協商談判的「懦夫賽局」中,是逼對方讓步的有效手段。

這個策略讓對方領會「兵凶戰危」,但其實它的極限是「戰爭邊緣」而不是「戰爭」。 

在「懦夫賽局」中,僵局雙方的的偏好順序都是: 

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我讓步,你堅持)=2
  • 最末:(我堅持,你堅持)=1

換句話說,雙方都希望自己堅持而對方讓步。一方堅持一方讓步是「納許均衡」,但雙方都堅持卻是最壞的結果。

施展「危險邊緣」策略的一方會使用各種手段讓對方相信自己寧可玉石俱焚也不會讓步。但是這種不理性的威脅有時會讓對方嗤之以鼻。要讓對方深信,必須要在行為上顯示自己願意一步步走向危險邊緣的態勢。

在懸崖上綁著鐵鍊,如何避免一起摔死?

諾貝爾經濟學獎得主湯瑪士.謝林 (Thomas Schelling) 教授是最早提出「危險邊緣」策略的人。他曾在哈佛大學課堂上舉了一個例子:「想像你在懸崖上,腳踝被鐵鍊與另一人的腳踝互相拴住。如果你們兩人有一人讓步,你們就可得到解放,而堅持到底的那人還可以獲得大獎。你要如何說服另一人讓步呢?要知道你能夠做的可就只有威脅他要把他推下懸崖,而那可會讓你們兩人一齊摔死喔!」

謝林對這個問題的答案是:「你開始跳舞,一步一步逼近懸崖。這樣你不用說服他你會做出兩敗俱傷的不理性動作,你只要讓他相信你比他願意承擔發生意外的危險就行了。」

只要讓對方相信你比他更願意承擔發生意外的風險,就可以說服對方讓步。圖/Pexels

謝林把心理學引入賽局理論,是行為經濟學的先驅。他的意思是:因為兵凶戰危,「與汝偕亡」的威脅不容易讓對方深信,但如果你用魯莽的行為表現出你不在乎「擦槍走火」,這種打了折扣的威脅反而較容易取信於人。

謝林說:「瘋狂可以是惡意地合乎理性」 (“Madness can be wickedly rational.”) 因此,「危險邊緣」的理論常被稱為「瘋子理論」 (Madman Theory) 。

因為雙方都堅持是最壞的結果,施展「危險邊緣」策略的玩家其實就是要對方相信自己是不理性的。當對方相信你瘋了、不可理喻的時候,對方就會讓步。謝林把這種算計稱為「不理性的理性」 (rationality of irrationality) 。

在懸崖邊緣裝瘋賣傻而不真摔需要走鋼索的技巧。

冷戰時期的美國國務卿杜勒斯 (John Foster Dulles) 就說「能做到走向戰爭邊緣而不致真正開戰」是必要的「藝術」。

這種藝術常在電影中被戲劇化。名導演史丹利.庫柏力克 (Stanley Kubrick) 的1964年電影《奇愛博士》 (Dr. Strangelove or: How I Learn to Stop Worrying and Love the Bomb) 便是戲劇化冷戰時期美、蘇雙方「相互保證毀滅」 (mutually assured destruction, MAD) 的黑色喜劇。

片中美方一位發瘋的指揮官下令B–52轟炸機對蘇聯目標投擲氫彈,即使總統及國防部長都無法攔阻。庫柏力克便是因為看了謝林對小說《紅色警戒》 (Red Alert) 的評論而改編小說拍攝成電影,他並邀謝林擔任此片顧問。

電影《奇愛博士》美方對蘇聯投擲氫彈。圖/flickr

1962年古巴飛彈危機的時候,赫魯雪夫在古巴部署核彈及甘迺迪對古巴進行封鎖更是「危險邊緣」策略的實例。羅杰。唐納森 (Roger Donaldson) 主導的2000年電影《驚爆13天》(Thirteen Days) 中蘇聯貨輪在美國艦隊發射魚雷之前迴轉可以說是此一策略的經典意像。

電影《驚爆13天》(Thirteen Days)

前國安會秘書長蘇起說中國會「小打」台灣。蘇起寫過一本叫《危險邊緣》的書分析「兩國論」、「一邊一國」之後的兩岸關係,他是懂得「危險邊緣」策略的。他的意思應該是說中國會以「小打」來「舞」向戰爭邊緣,冀望不必全面開戰就逼使台灣讓步。

甚麼是「最壞的結果」?

但是「危險邊緣」要奏效有一個前提,那就是雙方的對峙必須是「懦夫賽局」。

如果對峙的局面是「囚徒困局」,這策略不會有效。

在「囚徒困局」中,雙方的的偏好順序都是:

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我堅持,你堅持)=2
  • 最末:(我讓步,你堅持)=1

其與「懦夫賽局」最大的不同在於(我讓步,你堅持)是最壞的結果,比玉石俱焚還糟糕。

當參賽雙方感知到讓步會帶來最壞的結果的時候,堅持下去是合乎理性的優勝策略,而雙方都堅持是納許均衡。

我教賽局的時候,常引用電視遊戲節目《金球》來作為例子。詳細請參考拙作金球的囚徒

這個遊戲中參賽者雙方可以選擇「平分」(讓步)或「獨吞」(堅持)。如果兩人中一人選擇獨吞另而一人選擇平分,則獨吞者獨享巨額獎金,平分者抱蛋;如果兩人都選擇平分,則各得一半獎金;如果兩人均選擇獨吞,則兩人均抱蛋。

這個遊戲是「囚徒困局」,因為:

(我獨吞,你平分)>(我平分,你平分)>(我獨吞,你獨吞)>(我平分,你獨吞)

有一次節目中,參賽者之一在賽前向對方做了兩項承諾:第一,他一定會選擇獨吞(堅持);第二,如果對方選擇平分(讓步)而由他贏得全部獎金,他會把獎金分一半給對方。

雖然主持人一再提醒賽前承諾不具法律效力、不可輕信,這位參賽者的口頭承諾卻達到了兩個效果:

第一、他平分獎金的承諾,只要對方相信有一點點可能性,對方就會認為(我平分,你獨吞)的期望值比(我獨吞,你獨吞)還要好。也就是在他的心中,賽局已經悄悄地從「囚犯困境」轉變為「懦夫賽局」。

第二、他堅持會選擇獨吞的承諾,正是「危險邊緣」策略。當對方把賽局認知為「懦夫賽局」的時候,這策略可以奏效。

果然,在這次賽局中,對方選擇了平分。而這位聰明的玩家也出乎意料地選擇了平分,用合乎賽局規則的方式履行了他平分獎金的承諾。遊戲全程請見:

電視遊戲節目《金球》 (Golden Balls)

我用這例子來說明:中國要用「危險邊緣」策略來逼台灣讓步是不夠的。只要台灣民意認為讓中國統治是最壞的結果,「危險邊緣」策略便不會奏效。

傳統中國所謂「大國」要能做到「近者悅,遠者來」。 中國要做大國,恐怕還得學學《金球》遊戲節目的聰明玩家!

tml_96
34 篇文章 ・ 227 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

4
3

文字

分享

0
4
3
連發動戰爭也會選擇困難?幸好,數學家發明了「賽局理論」──《囚犯的兩難》上
左岸文化_96
・2019/09/27 ・2747字 ・閱讀時間約 5 分鐘 ・SR值 570 ・九年級

一九四九年八月,蘇聯在西伯利亞第一次成功試爆原子彈,打破了美國對核子武器的壟斷地位。世界上出現了兩個核武大國的局面,比西方觀察家預期的要早得多。

一顆原子彈直接讓敵人掰掰~圖/Pixabay

蘇聯的原子彈激發了核武競賽,而這種競賽的某些後果是容易預見的。每個國家都希望盡可能武裝,以能夠發動核子武器來快速擊敗對手為目的。許多人意識到,這會導致令人難以接受的兩難困境。

世界歷史上首次出現了這種可能,只要一次閃電式的核武攻擊就可以使敵國從地球上消失。在危機之際,按動核武按鈕的誘惑幾乎不可抗拒。同樣重要的是,每個國家都害怕自己成為他國突襲的犧牲品。

先搶先贏的核武恐嚇

一九五〇年代,美國和西歐有許多人主張對蘇聯發動一次直接、毋須任何理由的核武攻擊。它有一個委婉的名稱,叫做「預防性戰爭」。懷抱這種想法的人認為,美國應該抓住時機,透過核武脅迫或突然襲擊,以建立一個世界政府。

你也許認為只有極端份子才會支持這種計畫。事實上,當時許多十分優秀的知識份子也廣為支持預防性戰爭,包括當代兩個最出色的數學家:羅素和馮紐曼。

圖/pixabay

通常數學家不會由於其政治主張或對世界的看法而聞名於世;況且,從很多方面來看,羅素和馮紐曼都是兩個完全不同的人。然而,對於世界上不應該有兩個核武強權共存的這一觀點,他們的見解恰恰相同。

羅素是預防性戰爭運動的主要推動者,他強調具有核武摧毀能力的蘇聯是個最終的威脅,除非蘇聯同意美國在世界的主導地位。一九四七年,羅素在一次演講中說:「我傾向認為俄羅斯人會默認美國主導世界的狀態;否則,世界將經歷一場戰爭,而出現獨一無二的政府,因為這是世界所需。」

馮紐曼的態度更加強硬,贊成出其不意用核武做第一擊。《生活》雜誌曾經引用他的言論:「如果你問為什麼明天不用原子彈去轟炸他們,我要問為什麼不今天就去轟炸呢?如果你說今天五點鐘去轟炸,那我要問為什麼不今天一點鐘就去轟炸呢?」

還不快按下去!圖/GIPHY

他們兩個人都對蘇聯沒有任何感情。他們相信預防性戰爭是邏輯的必然,是避免核武擴散的唯一合理方案。在一九四八年一月號的《新聯邦》雜誌中,羅素在一篇鼓吹預防性戰爭的文章裡寫道:「我提出的理由就像數學證明一樣,是如此明白無誤和不可避免。」然而邏輯本身也會出錯。

那麼預防性戰爭這場異乎尋常的鬧劇的真實含意是什麼呢?恐怕說得最清楚的是當時的美國海軍部長馬修斯:一九五〇年,他不經意地使用歐威爾式的語言 1 來極力鼓吹美國要「為和平而侵略」!

今天,隨著東西兩方緊張關係的解凍,預防性戰爭看來就像冷戰思維的一種奇特變形。然而我們此刻仍然面臨許多這一類的問題:當某個國家的安全與整個人類的利益發生衝突時,它應該怎麼辦呢?當一個人的利益與公共利益發生衝突時,他應該怎麼辦呢?

數學家是怎麼在戰爭議題裡面參一腳的?

恐怕誰也比不上約翰.馮紐曼那樣能說明原子彈的兩難是如何折磨人了。這個名字對於大多數人來說並沒有多大的意義。這位聲名卓著的數學家幾乎屬於一個不存在的物種。知道這個名字的少數圈外人則大多會把他看成電子數位電腦的先驅,或者是為「曼哈頓計畫」效力的傑出科學家原型之一。還有少數人把他視作庫柏力克的電影《奇愛博士》中的科學家;話說回來,馮紐曼確實曾坐在輪椅上參加原子能委員會的會議。

約翰.馮紐曼 (John von Neumann)。圖/LANL, via Wikimedia Commons

馮紐曼的主要著作是在純數學和數理物理學領域,這些令普通人難以親近的研究,很早就為他贏得天才的聲譽。也許有人會預期他一生的理論工作使他遠離俗事。然而,他卻對應用數學有同樣特別的熱情。電腦和原子彈兩者都是馮紐曼的業餘項目,它們都十分典型地反映了他對於數學應用的興趣。

馮紐曼是個撲克牌玩家,雖然不是頂尖高手,但他敏銳的思維能捕捉到遊戲中的一些要素。他對採用騙術、虛張聲勢、猜測對方意圖等等在規則允許內人們企圖誤導對方的種種手法都特別感興趣。以數學的術語來說,這些都是「非瑣碎的」。

從一九二〇年代中到一九四〇年代,馮紐曼以研究撲克牌和其他遊戲的數學結構自娛。當研究成形時,他發覺這套理論可以應用到經濟學、政治學、外交政策等各種領域。一九四四年,馮紐曼和普林斯頓大學的經濟學家摩根斯坦以《賽局理論與經濟行為》這本書發表了他們的分析報告。

要認識馮紐曼的「賽局/遊戲理論」,首先要認清它與一般人理解的遊戲沒有太多關係。賽局理論研究的其實是大家通常說的「策略」。

偶爾使些小技巧、小策略,總是可以讓生活變得更加愉快~圖/GIPHY

在二次大戰期間與馮紐曼並肩工作的科學家布羅諾斯基在《人之躍昇》書中回憶,有一次在倫敦的計程車上,他和馮紐曼談起賽局:

「……因為我對下棋很著迷,因此很自然對他說:『你的意思是,賽局理論像下棋?』『不,』他說,『下棋不屬於賽局理論。下棋是定義得十分完善的一種計算。你也許無法算出答案,但是理論上,任何棋局必然有一個解,也就是有一個正確的過程。而真正的賽局完全不是這個樣子的。實際生活也不是這個樣子。實際生活中包括虛張聲勢、一些騙人的小策略,互相揣測對方以便應對等等。我的賽局理論研究的就是這些內容。』」

賽局理論是研究有思想的、可能會去騙人的對手之間的衝突。這也許使賽局理論聽起來更像心理學的一個分支,而不是數學的分支。其實並不盡然,因為賽局參與者被假設是完全有理性的,因此賽局理論容許精確的分析。更確切地說,賽局理論是數理邏輯學的分支,以人們之間的真實衝突為研究課題(即使他們並非總是理性)。

註解:

  1. 作家歐威爾著有政治寓言小說,《一九八四》以諷刺極權政府,矛盾修辭法的「雙重思想」是書中黨控制人民的手段。

——本文摘自《囚犯的兩難:賽局理論、數學天才馮紐曼,以及原子彈的謎題》,2019 年 6 月,左岸文化

左岸文化_96
35 篇文章 ・ 10 位粉絲
左岸的出版旨趣側重歷史(文明史、政治史、戰爭史、人物史、物質史、醫療史、科學史)、政治時事(中國因素及其周邊,以及左岸專長的獨裁者)、社會學與人類學田野(大賣場、國會、工廠、清潔隊、農漁村、部落、精神病院,哪裡都可以去)、科學普通讀物(數學和演化生物學在這裡,心理諮商和精神分析也在這裡)。