分享本文至 E-mail 信箱

學術引用格式

MLA (點一下全選)

APA (點一下全選)

EndNote(.enw)

囚徒困局系列(三):學生與政府的「墨西哥對峙」僵局

8566462-3378108

文 / 林澤民
(轉載自nilnimest 的部落格

本來好好一個賽局,已經玩到一個穩定狀態 ─ 學生持續佔領立法院,政府不敢驅離 ─ 卻把佔上風的「懦夫賽局」,變成了雙輸的「囚徒困局」。政府覺得當「傻瓜」的代價已經比鎮壓的代價更大了,當然只好鎮壓。結果呢?唉!

賽局理論中,參賽兩方對峙而形成僵局的情況可以是所謂「懦夫賽局」 (Chicken Game) 或「囚徒困局」 (Prisoner’s Dilemma)。兩者數學上的差別似乎不大,但理性的參賽者在不同的賽局卻會有很不相同的行為。此次學生運動便見證了兩種賽局的不同,其差異直可以影響到國家及個人的命運。

關於賽局理論的一些重要概念,如參賽者 (player),策略 (strategy),結果 (outcome),收益 (payoff) ,優勝策略 (dominant strategy),納許均衡 (Nash equilibrium),伯瑞多最佳結果 (Pareto-optimal outcome)等,可參考林澤民老師本系列前兩篇文章:

下面是「懦夫賽局」和「囚徒困局」的收益矩陣,其中

  • A,B:參賽者
  • C,D:策略,C=合作 (Cooperate),D=不合作 (Defect)
  • (D,C),(C,C),(D,D),(C,D):結果或策略組合
  • T:收益,參賽者一方合作另一方不合作時,不合作者的誘惑 (Temptation)
  • R:收益,參賽者雙方均合作時,合作者的報酬 (Reward)
  • P:收益,參賽者雙方均不合作時,不合作者的懲罰 (Punishment)
  • S:收益,參賽者一方合作另一方不合作時,合作者的傻瓜收益 (Sucker’s Payoff)
  • 4=最好收益; 3=次好收益; 2=次壞收益; 1=最壞收益

「囚徒困局」 (Prisoner’s Dilemma)

 

Player B

C

D

Player A

C

R=3,R=3

S=1,T=4

D

T=4,S=1

P=2,P=2

T>R>P>S

「懦夫賽局」 (Chicken)

 

Player B

C

D

Player A

C

R=3R=3

S=2T=4

D

T=4S=2

P=1P=1 

T>R>S>P

兩個賽局的差異,在於在「囚徒困局」中,S是最壞收益,而在「懦夫賽局」中,P是最壞收益。

在「囚徒困局」中,由於T>R以及P>S,D 是優勝策略,(D,D) 是納許均衡,但因為 R>P,(D,D) 不是伯瑞多最佳結果。理性的參賽者會選擇D,但雙方均會因 (C,C) 比 (D,D) 來得好而懊惱。可是 (D,D) 是納許均衡,因此參賽者不會一廂情願地改變。反過來說,雖然雙方都知道 (C,C)比 (D,D) 好,(C,C)卻不是納許均衡,即使兩人約好共同選擇 (C,C),只要承諾沒有約束力,堅持合作的結果只會得到最壞的傻瓜收益。這是此賽局之所以是困局的原因。

在「懦夫賽局」中,由於 T>R 但 S>P,不論C或D都不是優勝策略。可是這賽局卻有兩個純粹策略的納許均衡:(C,D) 和 (D,C)。不論是 (C,D) 或 (D,C),理性的參賽者在這兩個結果中,都不會一廂情願地改變策略,因單方面改變只能帶來更壞的結果。而且 (D,C) 和 (D,C) 都是伯瑞多最佳結果,因為不管怎麼改變,都會有參賽者受害,所以這賽局不是一個困局。

「懦夫賽局」的原型故事是兩人開車對撞,如果選擇在相撞前避開,就是合作 (C),否則就是不合作 (D)。因為避開被視為「懦夫」 (Chicken),故賽局俗稱「懦夫賽局」。一般人應該都會同意當懦夫至少比撞死好,所以 T>R>S>P 是成立的。冷戰時期的古巴飛彈危機事件中,美蘇之間核子戰爭一觸即發,但最後關頭蘇聯避開了;賽局的最後結果是理性選擇理論所預測的一個納許均衡的結果。

這次學運,佔領立法院可以看成一個「懦夫賽局」:

 

學生

和平離開立法院

堅持佔領立法院

政府

不驅離

R=3,R=3

S=2,T=4

驅離

T=4,S=2

P=1,P=1

對政府,特別是威權性強的政府而言,驅離可以展現維持社會治安的決心,處罰參與行動的學生以警效尤,並讓事件儘早落幕。如果學生面對驅離而和平離開,則政府鐵腕收效,又沒有流血衝突,這是對政府而言的最好結果。如果政府不驅離而任學生佔領數日後自行離開,則政府雖無橫暴的惡名,卻可能因任學生佔領公署拿不出對策而遭無能之譏,不過事件總算和平解決,這是次好的結果。如果政府不驅離而任學生持久佔領,則政府根本是無能解決問題,這是次壞的結果。最後,如果政府驅離而學生抵抗,致造成流血衝突,此結果恐怕政府不願見,而且也會有嚴重的後續效應,恐怕學生及反對政府暴力的社會人士也不能善罷干休,因此這是對政府而言最壞的結果。如果這樣的收益分析可以成立的話,T>R>S>P 對政府是成立的。

對學生而言,如果政府不驅離,能持續佔領立法院至政府在服貿議題上屈服為止,那當然是最好的。如果覺得象徵性訴求已經達成而自動見好就收退場,像洪仲丘事件時的公民1985行動一樣,則也不錯。如果等到政府驅離才乖乖離開,則團體的威信受損,而且恐怕會遭秋後算帳,這是次壞的結果。當然,被暴力驅離是最壞的結果了。這樣的分析顯示:T>R>S>P 對學生也是成立的。

由於T>R>S>P 對參賽者雙方均成立,這幾天在台灣上演的「佔領/驅離」賽局是「懦夫賽局」。政府的立法及行政部門一再宣示不會用武力驅離立法院的學生,可以說政府至少暫時扮演了懦夫的角色,而立法院的學生並無退讓跡象。根據賽局理論,這樣的結果是「懦夫賽局」的兩個納許均衡之一,在雙方不改變策略的情況下,這個結果是穩定的,各界不期望這僵局能夠很快解決。

那麼為什麼23日晚上會發生流血衝突呢?那是因為賽局的收益矩陣改變了。主要是對政府而言,立法院的情形已經使得它蒙受無能處理的惡名,而且立法院的議事受阻問題還不算太嚴重,如果連行政院施政都要受影響,那根本政府不成其為政府了。而且學生佔領立法院,行政院之後,下一步可想而知是總統府,是可忍,孰不可忍?當一個傻瓜 (Sucker) 已經夠糗了,難道還要當兩個,甚至三個?所以學生佔領行政院後,對政府而言,S 已經變成最壞的結果了,

因此,新的情況使得對政府而言,T>R>P>S,驅離變成優勝策略,而且不必等待,當天就採取行動,學生是否退讓已經不重要了。

那麼學生為什麼要進一步佔領行政院?首先,這也許只是一部分學生的誤算。目前的報導無法確定佔領行政院是誰發起的行動,而且沒有證據顯示它與佔領立法院的學生領袖林飛帆等人有關。但手機及網路世代,動員容易;不論是誰發起,群眾不加深思而跟隨,從賽局理論來看,就是非理性的行為。但也許這些發起人認為在馬英九記者會「跳針」似的談話後,持續佔領立法院已於事無補。而進一步升高衝突,甚至流血,或許能夠得到比枯坐立法院更好的結果。這樣的話,賽局就變成如下的囚犯困局了:

 

學生

和平離開行政院

堅持佔領行政院

政府

不驅離

R=3,R=3

S=1,T=4

驅離

T=4,S=1

P=2,P=2

如此,雙方對峙就是一種所謂「墨西哥對峙」(Mexican Standoff)的囚徒困局了,如吳宇森【喋血雙雄】中有名的這一幕。這種對峙之下,你不開火他開火是最壞的結果,所以理性的參賽者會希圖僥倖而開火,但如果你的火力沒他的大,吃虧的終究是你自己。從支持學運的觀點來看,好好的一個「懦夫賽局」玩成「囚徒困局」,這真是可惜的事。

f_10638303_1

作者:林澤民
台大電機系畢業,美國明尼蘇達大學政治學博士,現任教於美國德州大學奧斯汀校區政府系。林教授今年(2014)五月中至六月底將於台大政治系開授總時數36小時的「理性行為分析專論」課程。七月下旬並將於中央研究院政治學研究所參與政治學研究方法訓練營的教學工作。林教授的中文部落格多為文學、藝術、政治、及文化評論。網址: http://blog.udn.com/nilnimest/article

也可以上科技大觀園搜尋「賽局理論」

關於作者

林澤民

台大電機系畢業,美國明尼蘇達大學政治學博士,現任教於美國德州大學奧斯汀校區政府系。林教授每年均參與中央研究院政治學研究所及政大選研中心「政治學研究方法訓練營」的教學工作,並曾於2012年及2014年在台大政治系開授「理性行為分析專論」課程。林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。