0

0
0

文字

分享

0
0
0

金球的囚徒|囚徒困局系列(一)

林澤民_96
・2015/12/21 ・2587字 ・閱讀時間約 5 分鐘 ・SR值 523 ・七年級

-----廣告,請繼續往下閱讀-----

f_10559118_1

人與人之間的競爭與合作是很難拿捏的事。很多時候,雙方合作比不合作能給各自帶來更大的好處,但是一廂情願地合作的人,卻有可能被對方視為「潘仔」或「傻瓜」(Sucker)而予取予奪。於是,在各自的利害考量下,沒有人願意合作,寧可兩輸也不願意當「潘仔」。這種困境,可以存在於人際關係,經濟交易,政治角力,國際關係,甚至自然環境的維護,在人生及社會上,可說屢見不鮮。

英國BBC電視中心製作的Golden Balls便是模擬這種困境的競賽節目。節目中,二參賽者爭取一筆獎金,例如1000英鎊。二人隔桌對坐,面前各有兩顆金球,其中一個金球裡面寫著Split(平分),另一個寫著Steal(竊佔)。如果二人均選擇Split,則獎金平分。如果二人均Steal,則獎金槓龜。而如果一人Steal而另一人Split,則Steal者獨佔全額獎金,而Split者只能抱蛋含恨而歸。此賽局可用下圖來表示:

Player B
Split Steal
Player A Split 500, 500 S, 1000
Steal 1000, S 0, 0

其中S雖然表面上也是0,其實比零還糟,因為若雙方均Steal,雖然無人得獎,畢竟互相扯平,而單方面的Split除了抱蛋而歸外,還要加上當「潘仔」的懊惱、義憤、和羞辱,所以S<0。(讀者可以自問:你寧可Steal而雙輸呢,還是Split而當「潘仔」?)如此,則理性的參賽者會算計:如果對方Split,自己的較佳策略是Steal,因為Steal會贏得全額獎金,而Split則只能贏得一半。而如果對方Steal,則自己更應該Steal,否則就要當大傻瓜了。於是,對理性的參賽者而言,Steal是一個「優勝策略」。而如果雙方均如此算計,結果就獎金就槓龜了。

「金球」節目容許參賽者在決定之前互相溝通,可是即使雙方協議Split,因為口說無憑,輕易信賴對方的承諾反而容易吃虧上當。以下這場獎金高達100,000英鎊的金球大賽即紀錄了輕信人言的苦果:

-----廣告,請繼續往下閱讀-----

Golden Balls 所顯示的困境,正是所謂的「囚徒困局」 (Prisoner’s Dilemma)。囚徒困局是賽局理論中一種非零和賽局,它反映了人際間常見的困境。這個賽局可以表現如下:

Player B
C D
Player A C RA, RB SA, TB
D TA, SB PA, PB

定義:

A,B:參賽者
C,D:策略。C=合作(Cooperate),D=不合作或背叛(Defect)
TA,RA,PA,SA:參賽者A在表中各種策略組合下的收益
TB,RB,PB,SB:參賽者B在表中各種策略組合下的收益
T=Temptation,R=Reward,P=Punishment,S=Sucker’s Payoff

賽局的假設:

-----廣告,請繼續往下閱讀-----
  1. A,B均只為自己利益著想
  2. A,B無法達成彼此信賴的有效承諾
  3. TA>RA>PA>SA
  4. TB>RB>PB>SB

賽局中,A,B二人均可以自由選擇合作或不合作兩種策略。在上列假設下,A,B均會發現不論對方合作或不合作,不合作比合作會給自己帶來較大的收益:假使對方合作,你合作可以得到收益R,而不合作則能得到收益T>R;假使對方不合作,你合作可以得到收益S,而不合作則能得到收益P>S。這樣算計的話,二人均不會合作,結果獲得P的收益。然而,二人旋即發現如果二人均合作的話,收益R比P要來得好(R>P)。可是在無法信賴對方的情況下,自己片面合作是不智的,因為對方如果還是不合作的話,對方將會得到最好的收益T,而自己將會得到最壞的收益S。於是,二人會陷於相互背叛的困境。

賽局理論中,D是所謂優勝策略(dominant strategy),也就是不論對方選擇何種策略,選擇D均會給自己帶來較大的收益。相互背叛的(D,D)策略組合是所謂的納許均衡(Nash equilibrium),也就是在(D,D)的情況下,沒有人會片面改採其它策略。可是(D,D)不是所謂的伯瑞多最佳結果(Pareto optimal outcome),因為(C,C)帶來的收益,對兩人均要比(D,D)帶來的收益要來得好。這個賽局之為困局正是因為它唯一的Nash equilibrium不是Pareto optimal。它之所以稱作囚徒困局,是因為以下的故事:

二人共同犯罪被捕而成為囚徒。檢察官要囚徒認罪,但告知他們其求刑不僅與個別囚徒認罪與否有關,也與共犯認罪與否有關:如果二人均供認犯行不諱,則證據確鑿,檢察官將求刑3年。如果二人均不認罪,因證據不足,檢察官將只能以技術性的微罪求刑1年。如果一人認罪而另一人不認罪,則檢察官會對認罪之人處分不起訴,而對不認罪之人求處重刑5年。如果把不認罪視為二囚徒之間的合作而認罪視為相互背叛,則這個故事符合如下的賽局:

Player B
不認罪 認罪
Player A 不認罪 -1, -1 -5, 0
認罪 0, -5 -3, -3

因為TA=TB=0,RA=RB=-1,PA=PB=-3,SA=SB=-5,T>R>P>S對A,B二人而言均成立,所以認罪(D)是dominant strategy。二人均會認罪(D,D)。二人於是會被檢察官求刑3年。(D,D)是為Nash equilibrium。可是(D,D)不是Pareto optimal,因為(C,C)只會被求刑1年。雖然如此,二人在無法相互信賴的情況下還是會互相背叛而認罪。這是囚徒困局的原型典故。上面Golden Balls的賽局中,TA=TB=1000,RA=RB=500,PA=PB=0,SA=SB<0,也是T>R>P>S 對A,B二人而言均成立,因此它是不折不扣的囚徒困局。

-----廣告,請繼續往下閱讀-----

Golden Balls賽局容許參賽者在決定Split或Steal之前互相溝通,這是賽局理論所謂的「訊號傳送」(signaling)機制,讓參賽者向對方暗示甚或明示自己是何種類型的玩家。賽局理論一般認為參賽者要付出相當的代價才能讓他傳送的訊號具有可信度,而廉價的訊號只是舌燦蓮花(cheap talk)而已。例如參賽者可能發誓一定會合作,但發誓伴以「斬指頭」的代價顯然要高於「斬雞頭」的代價,前者所傳送的訊號會比後者要可信得多。Golden Balls的參賽者即使信誓旦旦會Split,沒有「斬指頭」之類的行為保證,終究是舌燦蓮花,不足深信。

那麼為何有些Golden Balls參賽者願意Split?賽局理論純粹是數學理論,在實證上並沒有百分之百的預測能力。「理性」有其經驗上的分配:不同國家、文化、宗教、社會、種族、性別、收入、教育等等的人參與Golden Balls都可能做出不同的選擇。而且Golden Balls的signaling雖然是cheap talk,不同的人也可能有不同的反應,例如有些人就容易相信態度誠懇或英俊漂亮的參賽者所傳送的訊號。「理性」終究只是理論上的假設,它是否客觀事實仍有待經驗檢定。

原刊載於Tse-min Lin 的部落格

文章難易度
林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
1

文字

分享

0
2
1
為什麼同伴會出賣你?從「囚徒困境」來看共犯為什麼先招了!——《大話題:賽局理論》
大家出版_96
・2023/04/22 ・1979字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

合作與私利的權衡:囚徒困境

最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。

囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。

囚徒困境是指兩名囚犯陷入「是否要認罪」的心理狀態。圖/《大話題:賽局理論》

阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。

阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。

-----廣告,請繼續往下閱讀-----

阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。

刑期長短受到共犯是否認罪的影響。圖/《大話題:賽局理論》

我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。

如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。

囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。

-----廣告,請繼續往下閱讀-----
考慮到先認罪的人可以免去刑責,將導致四種可能結果。圖/《大話題:賽局理論》

合作或私利考量下的「最佳解」不同

這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。

請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。

現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。

兩名囚犯就彼此的利益思考,形成「囚犯困境」的心理狀態。圖/《大話題:賽局理論》

很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。

-----廣告,請繼續往下閱讀-----

但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。

以個人來說,最佳的回應便是「認罪」。圖/《大話題:賽局理論》

同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。

在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:

{ 認罪,認罪 }

-----廣告,請繼續往下閱讀-----

前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。

即使雙方最佳利益為「沉默」,但在囚徒困境下卻會選擇「認罪」。圖/《大話題:賽局理論》

這屬於柏雷多效率嗎?

一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。

囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。

不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。

-----廣告,請繼續往下閱讀-----
囚徒困境並非柏雷多效率,因雙方若選擇共同沉默將能有更好的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

0

2
1

文字

分享

0
2
1
我預判了你的預判!為什麼高手過招總會和局?——《大話題:賽局理論》
大家出版_96
・2023/04/21 ・1459字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

什麼是「賽局理論」?

賽局理論是在研究策略性互動。策略性互動也是很多桌遊的關鍵元素,賽局理論因此得名。你的決策影響別人的行動,反之亦然。賽局理論的不少術語直接取自這類遊戲。我們把決策者稱為「參與者」(player)。參與者做決定後,就採取了行動(move)。

以策略性互動為基礎的賽局理論。圖/《大話題:賽局理論》

運用模型簡化複雜世界

真實世界的策略性互動可能非常複雜。例如在人際互動中,不僅行動,包括我們的表情、聲調和肢體語言都會影響他人。

在與他人往來時,人們展現不同的經歷與觀點。這樣無以計數的變化會使得情況異常複雜,也很難分析。

藉由稱為「模型」的簡化結構,我們可以大幅縮減複雜的程度。模型雖然簡單且容易分析,但仍然捕捉了真實世界問題的某些重要特徵。選用適當的簡單模型,可以有效幫助大家學習真實世界的複雜問題。

-----廣告,請繼續往下閱讀-----
藉由模型簡化真實世界的複雜策略性互動。圖/《大話題:賽局理論》

西洋棋可以幫助我們瞭解這些變化會讓參與(及預測)賽局變得多麼複雜。西洋棋的規則明確,雖然每一步棋的選項有限,但整體棋局的複雜度令人生畏。不過比起許多人類的基本互動,西洋棋其實簡單多了!

西洋棋儘管複雜,但比人類互動簡單多了。圖/《大話題:賽局理論》

高手過招容易和局!

像西洋棋之類的桌遊有個特性:玩家愈熟練,就容易產生平手的結局。我們如何解釋這種現象?

因為西洋棋太複雜,難以全面分析,以下我們用簡單的井字遊戲來說明一個重要特性。西洋棋和井字遊戲都有明確的勝負規則。玩家輪流落子,且可以下的地方有限。

井字遊戲無法表現西洋棋中的許多特性。但由於兩者有些共同特徵,因此井字遊戲可以幫助人們瞭解高手對陣為什麼容易產生和局。

-----廣告,請繼續往下閱讀-----
井字遊戲因為較簡單,掌握規則後就很容易平手。圖/《大話題:賽局理論》
因為井字遊戲太容易平手,因此人們開始挑戰更複雜的遊戲。圖/《大話題:賽局理論》

被簡化的世界縮影:「賽局」

賽局理論的首要關注並非西洋棋之類的桌遊,而是要增進我們對人際、對企業間、對國家間、對生物間……等互動行為的瞭解。原因是,真實的問題可能過於複雜且難以充分掌握。

因此,在賽局理論中我們創造了非常簡化的模型,稱之為「賽局」。創造有用的模型既是科學,也是藝術。

好的模型夠簡單,讓人能充分瞭解驅動參與者的誘因。同時,模型必須能夠捕捉真實世界的重要元素,以富有開創性的洞察力與判斷力決定哪些元素最為相關。

沒有模型能適用任何狀況,因為真實世界如此複雜。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

5
2

文字

分享

0
5
2
婚姻中的賽局理論!從兩首古詩理解「穩定婚姻問題」
林澤民_96
・2021/09/23 ・3781字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

賽局理論演算的「穩定婚姻」

賽局理論中有所謂「穩定婚姻問題」。在所有婚姻狀態均「穩定」的已婚社群,每對夫妻各自都無法找到比現在更好的另一半。換句話說,所謂「穩定」的已婚社群,就是丈夫想出軌,他想出軌的對象也不認為他會比現在的另一半來得好,因此不可能會跟這位丈夫在一起,反之妻子亦然。 因此,婚姻中的男女即使見異思遷,實際上也改變不了自己的婚姻狀態。

穩定婚姻意涵社群中,曠夫怨婦不可能藉著與原來配偶離婚,再互相結婚來改進他們的婚姻狀況。這也是賽局理論所說的「伯瑞多最佳」狀態。但這並不代表每個婚姻中人都是如魚得水,他們可能只是找不到更好而有意願的對象而已。

賽局理論中的穩定婚姻,並不表示夫妻兩人過得好。圖/Pixabay

「穩定婚姻問題」尋求一個把男女配對而形成穩定婚姻社群的演算法。這方法早在 1962 年即由 2012 年諾貝爾經濟學獎得主 Lloyd ShapleyDavid Gale 解出。其方法稱做 Gale-Shapley 演算法。Gale-Shapley 演算法的應用遠超過婚姻配對問題,例如美國醫學協會把住院醫師與實習醫院配對便用了這個演算法。

這個演算法要求社群中每個人都要列出他或她對所有異性的喜好順序。例如在三男三女的社群中,假設各人的偏好順序如下表:

三男三女各自心目中的喜好順序。

三男三女共可有六組不同的婚姻配對,其中有三組是穩定婚姻。

-----廣告,請繼續往下閱讀-----

第一組:(A 女,乙男)、(B 女,丙男)、(C 女,甲男)。社群中每位女士均嫁了她們最心儀的男士,但每位男士均娶了他們最看不上眼的女士。很顯然地,雖然男士們都蠢蠢欲動,其奈女士們不動如山何?這組婚姻符合穩定的定義。

所有的女士都找到了自己最好的對象,就算男士對自己的對象再有怨言,也無法找到願意出軌的女士。

第二組:(A 女,甲男)、(B 女,乙男)、(C 女,丙男)。與第一組恰恰相反,這裡每位男士均娶了他們最心儀的女士,但每位女士均嫁了她們最看不上眼的男士。依同理,這組婚姻也是穩定的。

所有的男士都找到了自己最好的對象,就算女士對自己的對象再有怨言,也無法找到願意出軌的男士。

第三組:(A 女,丙男)、(B 女,甲男)、(C 女,乙男)。這裡不分男女均已獲得了次愛對象的垂青。如果有人還不知足,想更上一層樓,很抱歉:他(她)們心目中最愛的對象卻看他(她)們最不上眼呢,還是乖乖守護家庭吧。穩定婚姻!

三男三女皆找了自己還能接受的對象在一起,但所有人也無法找到比目前對象更好的伴侶。

從這個例子可以看出:穩定婚姻的演算法並不保證唯一解,而且也不保證人人都美滿幸福。

穩定婚姻的演算法是基於無法找到更好的人,並不保證所有人幸福美滿。圖/Pixabay

那麼,對婚姻充滿浪漫期待的青年男女們如何才能在穩定的前提上爭取到如意的對象呢?賽局分析顯示,採取主動的一方,比較容易得到排序較高的對象。例如若女性採取主動,則結果較可能是第一組。若男性採取主動,則結果較可能是第二組。被動的一方很可能在形勢比人強的情形下止於末選。

網路上有好幾個網頁以 Python 程式語言執行了 Gale-Shapley 演算法。有興趣的讀者可以參考文末書目。

中國古詩中的穩定婚姻問題

這裡以兩首中國古詩為例說明什麼是「穩定婚姻」、什麼不是「穩定婚姻」。

從漢朝樂府詩 《陌上桑》來看穩定婚姻問題

漢朝樂府詩《陌上桑》全詩如下:

-----廣告,請繼續往下閱讀-----

日出東南隅,照我秦氏樓。秦氏有好女,自名為羅敷。羅敷喜蠶桑,採桑城南隅。青絲為籠繫,桂枝為籠鉤。頭上倭墮髻,耳中明月珠。緗綺為下裙,紫綺為上襦。行者見羅敷,下擔捋髭鬚。少年見羅敷,脫帽著帩頭。耕者忘其犁,鋤者忘其鋤。來歸相怨怒,但坐觀羅敷。

使君從南來,五馬立踟躕。使君遣吏往,問是誰家姝。「秦氏有好女,自名為羅敷。」「羅敷年幾何?」「二十尚不足,十五頗有餘。」使君謝羅敷:「甯可共載不?」

羅敷前致辭:「使君一何愚!使君自有婦,羅敷自有夫。東方千餘騎,夫婿居上頭。何用識夫婿?白馬從驪駒。青絲繫馬尾,黃金絡馬頭;腰中轆轤劍,可直千萬餘。十五府小吏,二十朝大夫,三十侍中郎,四十專城居。為人潔白皙,鬑鬑頗有鬚。盈盈公府步,冉冉府中趨。坐中數千人,皆言夫婿殊。」

這詩中的「使君」與「羅敷」都已婚。「使君」喜歡「羅敷」甚於喜歡自己太太,但是「羅敷」喜歡自己的先生甚於「使君」。何以見得?「使君一何愚」等於現代人罵無聊男子是「癡漢」。而「皆言夫婿殊」更掩不住嫁了如意郎君的沾沾自喜。

另外,詩中雖未點明,但「羅敷」的夫婿四十幾歲了能娶到十幾歲而又真心愛慕他的美女,即使「使君」的太太羨慕「羅敷」先生高富帥,怨嘆「使君」隨地拈花惹草,「羅敷」的先生應該不至於會喜歡她甚於喜歡自己太太。果然如此,這兩對夫妻所組成的社群,其婚姻狀態便算「穩定」。所以「穩定婚姻」不代表婚姻中人不見異思遷,而是即使想劈腿自己更喜歡的人也找不到願意的對象而無法做到。

依照上面的假設,各人的偏好順序如下:

《陌上桑》 中二男二女的喜好順序。

我們可以看到(羅敷,羅敷夫)、(使君婦,使君)的配對是穩定的。雖然使君婦跟使君都是跟他們的最末順位結婚,可是那即使不滿意也已經無法改善了,被罵「癡漢」也只能黯然。

黃色為使君夫婦的配對,藍色為羅敷夫婦的配對,可以看到羅敷夫婦正好是對方心目中的第一順位。縱使使君認為羅敷才是他的真愛,但羅敷對他的另一半非常滿意,因此兩人不可能在一起。

從《節婦吟·寄東平李司空師道》來看穩定婚姻問題

同樣描寫婚姻狀態的唐代張籍的《節婦吟·寄東平李司空師道》,道出了不太一樣的情境。

-----廣告,請繼續往下閱讀-----

君知妾有夫,贈妾雙明珠。
感君纏綿意,繫在紅羅襦。
妾家高樓連苑起,良人執戟明光裡。
知君用心如日月,事夫誓擬同生死。
還君明珠雙淚垂,恨不相逢未嫁時。

這首詩中的「妾」受到「君」的撩撥其實已經動了心。她起初還把「君」贈她的兩顆明珠繫在她貼身的紅色蕾絲小可愛上。後來雖然還給了他,並不是因為喜歡「良人」甚於喜歡「君」。

何以見得?詩中所引用的理由是「妾家高樓連苑起,良人執戟明光裡」。這兩句我怎麼看怎麼不對勁。也許傳統的解釋是說夫家有錢還位居高官。但高樓深宅事實上並沒有防得了「妾」與「君」私通款曲,當然更栓不住她愛慕的心。

至於「良人執戟明光裡」,其實也不過是在皇宮充當侍衛,並不是什麼大不了的官,遠比不上「陌上桑」裡羅敷的夫婿。說不定「良人」不值班的夜晚便拿著他那枝戟月光下在自家門外巡防太太私奔呢!無論如何,這詩裡的「妾」只是個受傳統規範羈束的「節婦」加「怨婦」。「事夫誓擬同生死」不過是「從一而終」的概念。

最後一句「恨不相逢未嫁時」更毫不掩飾地表明了「怨婦」的心情:如果不是喜歡「君」甚於喜歡「良人」,直接罵他「痴漢」就是了,何至於「還君明珠雙淚垂」?又何需心中有恨?這樣的婚姻只能以外力來維持穩定,算不得賽局理論的「穩定婚姻」。

-----廣告,請繼續往下閱讀-----

在這個配對中,假設各人的偏好順序如下(註:原詩未提「君」是否已婚。這裡的分析假設他已娶妻,但「君婦」的偏愛順序並不重要。):

(妾,妾夫)、(君婦,君)的配對是不穩定的,因為「妾」跟「君」如果做得到可以離開原配、互結連理而改進他們的婚姻幸福。只是不幸活在不能隨意離婚的時代,也只能「恨不相逢未嫁時」了!

黃色為君與君婦的配對,藍色為妾與妾夫的配對,可以看到妾與君兩人都選了第二順位作為伴侶,並認為彼此都是最佳伴侶(紅色標示),因此極有可能出軌。在這個情況下,最穩定的結果是(妾,君)、(君婦,妾夫)的組合。

參考書目

  1. D. Gale and L. S. Shapley. “College Admissions and the Stability of Marriage.” The American Mathematical Monthly, Vol. 69, No. 1 (Jan., 1962), pp. 9-15.
  2. Alexander Osipenko, “Gale–Shapley Algorithm Simply Explained.”
  3. 漢娜弗萊著,洪慧芳譯。《數學的戀愛應用題》第三章〈提高安打率的秘密〉。天下雜誌出版。
林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。