0

0
0

文字

分享

0
0
0

告白的遊戲:紀念約翰‧納許|囚徒困局系列(六)

林澤民_96
・2015/05/26 ・2399字 ・閱讀時間約 4 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

f_12280902_1

前幾天才結束春季的「人類理性行為」課程,沒想到整個學期和學生討論「納許均衡」,而約翰‧納許就驟然離世了。

紀念納許,我覺得最好的方法是讓大家瞭解他的賽局理論如何地可以用在我們日常生活中的各種面向。我的「人類理性行為」課程規定每個學生要交三篇論文,每篇要講一個真實或虛構的、包含「囚徒困局」的故事,然後用賽局理論加以分析。

第一篇只須是簡單的二人單次囚徒困局,第二篇必須是二人重複性囚徒困局,第三篇則須是多人囚徒困局。雖然大學部學生的論文大都乏善可陳,但每次總有幾篇文章有令人驚艷的創意。這些文章間或有關市場經濟、國際關係,但大多數是與學生個人生活密切相關的人際關係,特別是男女關係。多年來,學生把囚徒困局的理論應用到把妹問題、小三問題、性愛問題等等,令我目不暇給,學到了很多年輕人的次文化。

這裡介紹一個今年一位學生提出的「告白遊戲」來闡釋納許均衡此一概念的實用性。關於賽局理論相關概念的意義,這裡先簡單介紹,詳細請參考文後所列我部落格已發表的幾篇文章。

-----廣告,請繼續往下閱讀-----
  • 優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
  • 困局:納許均衡不是伯瑞多最佳狀態的局面。

下圖三個賽局中參賽者均為交往中的男女二人,每人可以選擇「告白」或「不告白」兩種策略。這裡告白意味合作,而不告白意味不合作。兩人的策略選擇交叉相乘,共得四種結果。每一結果以男先女後為序,是為:(不告白,告白),(告白,告白),(不告白,不告白),(告白,不告白)。這四種結果對男女二人各有不同的價值,在賽局一中,我們對這些價值初步假設如下:

如果我不告白而你告白,我可以享受玩咖的樂趣而不必負任何責任,這個結果對我最有利,其價值可以稱之為「誘惑」(Temptation)。用數學式子表示:T=玩咖

如果雙方都告白,兩人都可以享受愛情的甜蜜,但也要負起相當責任(例如不能再劈腿了)。這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward):R=♥

如果雙方都不告白,雙方各自心中忐忑,充滿了狐疑,不知道對方究竟想要怎樣,自己下一步該怎麼走。這個結果算是現狀,其價值可以標準化為0,稱之為「懲罰」(Punishment):P=0

-----廣告,請繼續往下閱讀-----

最後,如果我告白而你不告白,我本將心向明月,誰知明月照溝渠,真是令人感到委屈恥辱!這個結果對我最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff):S=屈辱

在這些價值假設之下,大家大概可以同意T>R>P>S,也就是:玩咖>♥>0>屈辱。這個數學關係的成立,使得第一個賽局符合了囚徒困局的條件。簡言之,因為玩咖的樂趣比要負起責任的愛情好,而且現狀比屈辱好,不論你告白不告白,對我而言不告白都要比告白來得有利,而這對雙方皆然。因此,不告白是男女雙方的所謂「優勝策略」,也就是雙方均會選擇不告白。

這個(不告白,不告白)的策略組合便是「納許均衡」的一個例子。當男女參賽者陷於這個結果中,任何人都不願意單方面改變策略,因為如果你單方面改變不告白策略而逕行告白,你只會讓對方自詡為玩咖而沾沾自喜,而自己得忍受當傻瓜的屈辱。「納許均衡」是一個穩定的結果,理性的參賽者在「納許均衡」的結果中不會單方面改變策略。在告白的遊戲中,男女雙方會陷於(不告白,不告白)的泥淖裡不能自拔。

這個賽局也是「囚徒困局」的一個例子。很明顯的,因為♥>0,男女雙方其實都喜歡相互告白甚於相互不告白,但又不願意單獨採取行動。換句話說,在(不告白,不告白)的納許均衡中,如果雙方都願意,雙方的價值都有同時改進的空間。這意味此賽局唯一的納許均衡不是一個「伯瑞多最佳結果」,這就是「囚徒困局」的定義。在上述價值假設之下,告白遊戲是一個囚徒困局。

-----廣告,請繼續往下閱讀-----

Microsoft Word - PD Game

以上是我學生的第一篇論文所分析的,但也許大家會質疑:那為什麼交往中的男女儘有人會告白呢?這牽涉到價值假設的問題。比如有人太過於為對方著迷,不論對方回應與否,心甘情願地自動告白依附,像那首《在那遙遠的地方》所唱的:「我願做一隻小羊跟在她身旁,我願她拿著細細的皮鞭不斷輕輕打在我身上」。在這樣的價值假設之下,我告白而你不告白的價值S便不是屈辱,而是S=心甘情願>P=0了。這樣的告白遊戲,便變成了下圖中的賽局二。因為T>R>S>P,這已不是「囚徒困局」而是「懦夫賽局」了。「懦夫賽局」有兩個納許均衡:(不告白,告白)和(告白,不告白),其中哪一個會發生,就不是賽局理論所能置喙的了。

Microsoft Word - PD Game

當然,也有人會認為規規矩矩從一而終地談戀愛比當玩咖好,也就是S=♥>T=玩咖。這樣的假設使得下圖中的賽局一變成了賽局三,它也有兩個納許均衡:(告白,告白)和(不告白,不告白),其中(不告白,不告白)仍然不是伯瑞多最佳結果,但(告白,告白)卻是。因為這個賽局有一個是伯瑞多最佳結果的納許均衡,它已經不算是囚徒困局,而是一種「協調賽局」了。在這樣的價值假設之下,男女只要有足夠的默契,便容易相互告白而訂下情緣。

Microsoft Word - PD Game

你也許看過「美麗境界」電影但對數學敬而遠之,你甚至連納許的鼎鼎大名都沒聽過,但你知道嗎:你的人際關係中很多你不願意單方面去改變的狀態,包括男女朋友或夫妻關係,不論你喜歡與否,很可能都是「納許均衡」呢?納許的偉大貢獻,便是在概念上釐清了這些狀態的性質,讓我們清楚瞭解它們之所以存在的邏輯,進而使得人類理性行為的預測成為可能。納許雖然死了,但「納許均衡」仍然無所不在於我們的生活中!

有興趣的讀者請進一步參考其他文章:

-----廣告,請繼續往下閱讀-----

原刊載於Tse-min Lin 的部落格

文章難易度
林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
2

文字

分享

0
0
2
戰機擾台有效嗎?從賽局理論看中國的「危險邊緣」策略
林澤民_96
・2020/10/06 ・3005字 ・閱讀時間約 6 分鐘 ・SR值 523 ・七年級

-----廣告,請繼續往下閱讀-----

  • 作者/林澤民

最近中國在台海附近頻頻軍演,其戰機也連日騷擾台灣領空。央視主播李紅甚至引前總統馬英九「首戰即終戰」論調出言恐嚇。這明顯的是所謂「危險邊緣」 (brinkmanship) 策略的施展,常見於國際間協商談判的「懦夫賽局」中,是逼對方讓步的有效手段。

這個策略讓對方領會「兵凶戰危」,但其實它的極限是「戰爭邊緣」而不是「戰爭」。 

在「懦夫賽局」中,僵局雙方的的偏好順序都是: 

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我讓步,你堅持)=2
  • 最末:(我堅持,你堅持)=1

換句話說,雙方都希望自己堅持而對方讓步。一方堅持一方讓步是「納許均衡」,但雙方都堅持卻是最壞的結果。

-----廣告,請繼續往下閱讀-----

施展「危險邊緣」策略的一方會使用各種手段讓對方相信自己寧可玉石俱焚也不會讓步。但是這種不理性的威脅有時會讓對方嗤之以鼻。要讓對方深信,必須要在行為上顯示自己願意一步步走向危險邊緣的態勢。

在懸崖上綁著鐵鍊,如何避免一起摔死?

諾貝爾經濟學獎得主湯瑪士.謝林 (Thomas Schelling) 教授是最早提出「危險邊緣」策略的人。他曾在哈佛大學課堂上舉了一個例子:「想像你在懸崖上,腳踝被鐵鍊與另一人的腳踝互相拴住。如果你們兩人有一人讓步,你們就可得到解放,而堅持到底的那人還可以獲得大獎。你要如何說服另一人讓步呢?要知道你能夠做的可就只有威脅他要把他推下懸崖,而那可會讓你們兩人一齊摔死喔!」

謝林對這個問題的答案是:「你開始跳舞,一步一步逼近懸崖。這樣你不用說服他你會做出兩敗俱傷的不理性動作,你只要讓他相信你比他願意承擔發生意外的危險就行了。」

只要讓對方相信你比他更願意承擔發生意外的風險,就可以說服對方讓步。圖/Pexels

謝林把心理學引入賽局理論,是行為經濟學的先驅。他的意思是:因為兵凶戰危,「與汝偕亡」的威脅不容易讓對方深信,但如果你用魯莽的行為表現出你不在乎「擦槍走火」,這種打了折扣的威脅反而較容易取信於人。

-----廣告,請繼續往下閱讀-----

謝林說:「瘋狂可以是惡意地合乎理性」 (“Madness can be wickedly rational.”) 因此,「危險邊緣」的理論常被稱為「瘋子理論」 (Madman Theory) 。

因為雙方都堅持是最壞的結果,施展「危險邊緣」策略的玩家其實就是要對方相信自己是不理性的。當對方相信你瘋了、不可理喻的時候,對方就會讓步。謝林把這種算計稱為「不理性的理性」 (rationality of irrationality) 。

在懸崖邊緣裝瘋賣傻而不真摔需要走鋼索的技巧。

冷戰時期的美國國務卿杜勒斯 (John Foster Dulles) 就說「能做到走向戰爭邊緣而不致真正開戰」是必要的「藝術」。

這種藝術常在電影中被戲劇化。名導演史丹利.庫柏力克 (Stanley Kubrick) 的1964年電影《奇愛博士》 (Dr. Strangelove or: How I Learn to Stop Worrying and Love the Bomb) 便是戲劇化冷戰時期美、蘇雙方「相互保證毀滅」 (mutually assured destruction, MAD) 的黑色喜劇。

片中美方一位發瘋的指揮官下令B–52轟炸機對蘇聯目標投擲氫彈,即使總統及國防部長都無法攔阻。庫柏力克便是因為看了謝林對小說《紅色警戒》 (Red Alert) 的評論而改編小說拍攝成電影,他並邀謝林擔任此片顧問。

-----廣告,請繼續往下閱讀-----
電影《奇愛博士》美方對蘇聯投擲氫彈。圖/flickr

1962年古巴飛彈危機的時候,赫魯雪夫在古巴部署核彈及甘迺迪對古巴進行封鎖更是「危險邊緣」策略的實例。羅杰。唐納森 (Roger Donaldson) 主導的2000年電影《驚爆13天》(Thirteen Days) 中蘇聯貨輪在美國艦隊發射魚雷之前迴轉可以說是此一策略的經典意像。

電影《驚爆13天》(Thirteen Days)

前國安會秘書長蘇起說中國會「小打」台灣。蘇起寫過一本叫《危險邊緣》的書分析「兩國論」、「一邊一國」之後的兩岸關係,他是懂得「危險邊緣」策略的。他的意思應該是說中國會以「小打」來「舞」向戰爭邊緣,冀望不必全面開戰就逼使台灣讓步。

甚麼是「最壞的結果」?

但是「危險邊緣」要奏效有一個前提,那就是雙方的對峙必須是「懦夫賽局」。

如果對峙的局面是「囚徒困局」,這策略不會有效。

-----廣告,請繼續往下閱讀-----

在「囚徒困局」中,雙方的的偏好順序都是:

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我堅持,你堅持)=2
  • 最末:(我讓步,你堅持)=1

其與「懦夫賽局」最大的不同在於(我讓步,你堅持)是最壞的結果,比玉石俱焚還糟糕。

當參賽雙方感知到讓步會帶來最壞的結果的時候,堅持下去是合乎理性的優勝策略,而雙方都堅持是納許均衡。

我教賽局的時候,常引用電視遊戲節目《金球》來作為例子。詳細請參考拙作金球的囚徒

這個遊戲中參賽者雙方可以選擇「平分」(讓步)或「獨吞」(堅持)。如果兩人中一人選擇獨吞另而一人選擇平分,則獨吞者獨享巨額獎金,平分者抱蛋;如果兩人都選擇平分,則各得一半獎金;如果兩人均選擇獨吞,則兩人均抱蛋。

-----廣告,請繼續往下閱讀-----

這個遊戲是「囚徒困局」,因為:

(我獨吞,你平分)>(我平分,你平分)>(我獨吞,你獨吞)>(我平分,你獨吞)

有一次節目中,參賽者之一在賽前向對方做了兩項承諾:第一,他一定會選擇獨吞(堅持);第二,如果對方選擇平分(讓步)而由他贏得全部獎金,他會把獎金分一半給對方。

雖然主持人一再提醒賽前承諾不具法律效力、不可輕信,這位參賽者的口頭承諾卻達到了兩個效果:

-----廣告,請繼續往下閱讀-----

第一、他平分獎金的承諾,只要對方相信有一點點可能性,對方就會認為(我平分,你獨吞)的期望值比(我獨吞,你獨吞)還要好。也就是在他的心中,賽局已經悄悄地從「囚犯困境」轉變為「懦夫賽局」。

第二、他堅持會選擇獨吞的承諾,正是「危險邊緣」策略。當對方把賽局認知為「懦夫賽局」的時候,這策略可以奏效。

果然,在這次賽局中,對方選擇了平分。而這位聰明的玩家也出乎意料地選擇了平分,用合乎賽局規則的方式履行了他平分獎金的承諾。遊戲全程請見:

電視遊戲節目《金球》 (Golden Balls)

我用這例子來說明:中國要用「危險邊緣」策略來逼台灣讓步是不夠的。只要台灣民意認為讓中國統治是最壞的結果,「危險邊緣」策略便不會奏效。

-----廣告,請繼續往下閱讀-----

傳統中國所謂「大國」要能做到「近者悅,遠者來」。 中國要做大國,恐怕還得學學《金球》遊戲節目的聰明玩家!

林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
0

文字

分享

0
2
0
媒體在臉書上的「公有地的悲劇」|囚徒困局系列(九)
林澤民_96
・2017/03/07 ・5588字 ・閱讀時間約 11 分鐘 ・SR值 588 ・九年級

-----廣告,請繼續往下閱讀-----

僅以本文紀念湯瑪斯.謝林

  • 作者:林澤民(奧斯汀德州大學政府系)、陳怡璇(奧斯汀德州大學新聞學院)

source:Facebook Media

To Be or Not to Be?媒體在臉書上的抉擇

近年來,臉書成為讀者看新聞的主要管道。媒體在臉書上分享文章鏈結,從臉書上引導流量回到自己的新聞網站。尤其是當自己網站上流量不多的時候,小編們就趕快在粉絲專頁上分享文章,很快就可以把臉書上的流量導回自家網站。臉書也非省油的燈,不願媒體把自己的用戶導離開臉書,仗勢自己廣大的用戶群,推出即時文章(instant article),與之合作的媒體,把內容免費提供在臉書上以換取跟臉書的廣告拆帳與珍貴的用戶資料(透過臉書上的用戶資料,就能夠更精準地賣廣告),如此,臉書用戶看新聞,不需再離開臉書,而臉書擁有這些免費內容,不但吸引更多用戶,也把每個用戶成功地留在自己的平台上。

媒體紛紛加入即時文章引發不少質疑與憂心:當新聞媒體把自己最珍貴的資產──內容──免費貢獻在臉書上, 等於棄守自家的網站流量,把自己的讀者帶到臉書後,恐怕以後也帶不走了,因為讀者已經習慣在臉書上看新聞。當媒體的經濟命脈依附在臉書之上,以後臉書更改規則,媒體也不得不從。縱使擔憂聲浪不小,所有媒體仍舊前仆後繼的加入即時文章。這種明知行動有後果卻不計後果行動的狀況,可用賽局理論中的多人囚徒困局來解釋。本文先說明賽局理論的概念、雙人囚徒困局的成立條件、多人囚徒困局形成的條件、最後用多人囚徒困局理論來看媒體所面臨的困境。

賽局理論及囚徒困局

賽局理論的基本概念:

-----廣告,請繼續往下閱讀-----

優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
困局:納許均衡不是伯瑞多最佳結果的局面。

二人囚徒困局的收益可用下列矩陣呈現:

  • A、B:參賽者
  • C、D:策略;C = Cooperate(合作),D = Defect(不合作或背叛)
  • TA, RA, PA, SA:參賽者 A 在表中各種策略組合下的收益
  • TB, RB, PB, SB:參賽者 B 在表中各種策略組合下的收益
  • T = Tempation(誘惑),R = Reward(獎賞), P = Punishment(懲罰),S = Sucker’s Payoff(傻瓜收益)

當 A、B 都只為自己的利益著想,而且彼此無法達成可信承諾時,如果 T > R > P > S 對 A、B 都成立,則 D 是兩位參賽者的優勝策略,相互背叛是納許均衡,可是這個唯一的納許均衡並不是一個伯瑞多最佳結果,因此賽局是囚徒困局

公有地的悲劇

討論媒體在臉書上的策略互動之前,讓我們先看看下面這個雙人賽局:

-----廣告,請繼續往下閱讀-----

在這個賽局中,參賽者從公有資源獲得屬於自己的利益。如果他們合作——有節制、不過度使用公有資源——他們都得到利益 b。如果一個參賽者合作、另一個參賽者不合作——過度使用公有資源——不合作者可以獲得較大的利益 B,可是同時卻造成了 -e 的外部效應,例如使得資源之永續性減弱,而這外部效應兩人都得承擔。當兩個參賽者都不合作時,兩人都都得到較大利益 B,但同時也得承擔兩份外部效應(-2e)。

這裡很容易證明當 2e > B-b > e 時,T > R > P > S 對 A、B 都成立,因此在這個條件下,抽取公有資源的問題是一個囚徒困局。這個困局就是雙人版的所謂「公有地的悲劇」。當個人過度使用公有資源時,雖然可以比有節制地使用能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。這個情況宛如一個「性格決定命運」的希臘悲劇:自私的「理性」驅使著每一個人無情地走向互相背叛的納許均衡,他們明知這個狀態不是伯瑞多最佳結果,卻有如陷於泥淖難以自拔,無法憑一己之力來改變資源毀滅的整體命運

個人過度使用公有資源時,雖然能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。圖/By verifex @ flickr, CC BY-NC 2.0

我們認為這正是新聞媒體在臉書上所面臨的狀態。

-----廣告,請繼續往下閱讀-----

在這裡,公共資源是臉書上的讀者群。媒體之間的合作策略是有節制地使用臉書——只提供鏈結而不提供內容。當媒體合作時,他們得到較小的利益 b 而不必擔心後果。當媒體背叛——在臉書上提供新聞內容——他們可以得到較大的利益 B(雖然損失自家網站的讀者,但在臉書上吸引到的讀者大於損失),可是同時卻造成了臉書之外整個新聞媒體讀者的流失。這個代價 -e 是個外部效應,因為它不但影響到分享新聞內容的媒體自己,也因為助長讀者對臉書的依賴而影響到整個產業。因為當一家媒體提供新聞內容給臉書之後,臉書使用者不需要離開臉書就可以看到新聞,這些使用者也不再造訪其他媒體的網站,而影響其他媒體網站的讀者數量。為了避免被提供內容給臉書的媒體影響到,各家媒體因此跟進,長期以降,各家媒體必須依賴臉書觸及讀者,傷害整體產業的經濟自主。

湯瑪斯.謝林的多人囚徒困局

要把上面的雙人賽局擴大成多人賽局,我們必須要先了解多人囚徒困局的定義。這是 2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling)的偉大貢獻之一。以下的討論見於他的 《微觀動機與宏觀行為》一書。

上圖中,縱軸(Y)代表收益,橫軸(X)代表除了自己以外合作的人數,紅線代表不合作的收益,綠線代表合作的收益。這圖有四項特徵:

1. 每個參賽者均有兩個策略選擇:合作或背叛(不合作)。
2. 不論其他有多少人合作,對自己而言,不合作的收益總要比合作的收益來得高。這也就是說,不論其他人合作或不合作,不合作是自己的優勝策略,而大家相互背叛的「原始狀態」是納許均衡。
3. 紅線跟綠線均隨著合作人數的增加而升高,也就是說不論自己合作與否,「傻瓜」越多越好。
4. 綠線隨著合作人數增加而升高時會超過原始狀態,如 K 點所示。當傻瓜的總人數(K+1)多到這個程度時,他們可以說是一個「可行的聯盟」(viable coalition)。這時雖然不合作還是比合作的收益要來得高,但傻瓜們至少可以說他們的收益比相互背叛時好。這個條件成立的充分且必要條件是所有參賽者都合作時的收益高於原始狀態的收益。我們把所有參賽者都合作的狀態稱為「烏托邦」。烏托邦的可行性代表原始狀態的納許均衡不是伯瑞多最佳結果。

-----廣告,請繼續往下閱讀-----

因為上述條件蘊含了唯一的納許均衡不是伯瑞多最佳結果,湯瑪斯.謝林把符合以上特徵的人際競合關係界定為多人囚徒困局。以下我們檢驗多家媒體在臉書的策略互動為公有地悲劇型態多人囚徒困局的條件。

媒體在臉書之公有地的悲劇

我們假設市場上共有 n 家媒體。因為每家媒體在決定自己的策略時,必須考量自己以外有幾家媒體會合作(只提供鏈結、不提供免費內容給臉書),我們假設這個數目為 x。

根據以上的假設,每家媒體合作或不合作的收益作為 x 的函數可以分別定出如下:

.不合作的收益為:u(D|x) = B-(n-x)e = B-ne+xe
.合作的收益為:u(C|x) = b-(n-(x+1))e = b-(n-1)e+xe

-----廣告,請繼續往下閱讀-----

由此我們可以演繹出幾個有用的結果:

.在原始狀態,也就是大家都不合作時,媒體的收益為:u(D|0) = B-ne
.在烏托邦狀態,也就是大家都合作時,媒體的收益為:u(C|n-1) = b
.當 x 固定時,不合作與合作的收益差別為:u(D|x)-u(C|x) = B-b-e

我們現在可以根據謝林的多人囚徒困局四條件來分析這個賽局了:

1. 每家媒體有兩種策略:合作(不提供免費內容給臉書)或不合作(提供免費內容給臉書)
2. 因為 u(D|x)-u(C|x) = B-b-e,我們可以推論當 B-b > e 時,不論 x 是多少,也就是不論自己以外有幾家媒體合作,不合作會比合作為媒體帶來更大的收益。B-b > e 是不合作為優勝策略的條件。
3. 因為 u(D|x) 與 u(C|x) 的式子中 x 的係數 e 為正值,也就是 u(D|x) 與 u(C|x) 均與 x 成正比,當越多人合作時,媒體不論合作或不合作,其收益都會越高。
4. 如果 u(C|n-1) = b 大於 u(D|0) = B-ne,也就是當 b-(B-ne) > 0 或 ne > B-b 時,烏托邦狀態的收益高於原始狀態的收益。因此,ne > B-b 是原始狀態不是伯瑞多最佳結果的充分且必要條件。

-----廣告,請繼續往下閱讀-----

綜合以上四點,我們可以結論:當 ne > B-b > e 時,不合作是每個個別媒體的優勝策略,大家都不合作是納許均衡,可是這是一個不是伯瑞多最佳結果的納許均衡。根據謝林的定義,在這個條件下,媒體的臉書困局是一個多人囚徒困局。他們的處境正是一個公有地的悲劇。

ne > B-b > e 這個條件意指提供免費內容給臉書所帶來的額外收益(B-b)要大於媒體新聞網站讀者人數下降的代價(e),可是它同時必須小於整個產業都提供內容給臉書所造成的總代價(ne)。如果收益小於或等於個別代價(B-b≤e),提供內容不划算,合作才是優勝策略;如果收益大於或等於總代價(B-b≥ne),原始狀態比烏托邦還好,是伯瑞多最佳結果,沒有困局可言;這兩種情況都不是囚徒困局。請注意:當 n = 2 時, ne > B-b > e 這個條件正與上面所舉的雙人囚徒困局的條件相符合。

下面進一步申論 ne > B-b > e 這個條件。

第一, 提供免費內容給臉書帶來的的額外利益超過個別媒體之外部效應:B-b > e

-----廣告,請繼續往下閱讀-----

華盛頓郵報曾經表示,提供免費內容給臉書,是預期透過臉書,他們可以觸及更多讀者,而有機會把臉書上的使用者變成自己的讀者(Marshall, 2015)。可見,新聞媒體自己的網站所能吸引到的讀者數量已遠遠不及臉書上的使用者。只要文章一放在臉書上,就可以吸引比在自己網站更多讀者。因此,能夠立刻吸引到讀者的這個利益,與長期依附臉書會失去自己網站上讀者的代價對照考量,當然先選擇解決目前的困境,長遠的負面影響,也是以後再說。

第二,提供免費內容給臉書帶來的的額外利益低於集體總外部效應:ne > B-b

依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。圖/facebook

提供免費內容給臉書得到的是即時利益然而付出的卻是整體新聞業的經濟自主與新聞自主,這也是許多專家大聲疾呼,與臉書打交道千萬三思(Riedmann, 2015)。 吸引媒體提供免費內容如同木馬屠城:臉書先以非常優厚的條件(廣告拆帳與用戶資料)交換媒體的內容。從此讀者透過臉書看新聞,就不再造訪媒體自己的網站,所以提供免費內容給臉書,等於放棄自己網站上的流量。當媒體的經濟命脈建立在另一間大企業上,等同於交出自己的經濟自主權。媒體在臉書上吸引到的讀者仍舊屬於臉書的用戶,等於失去臉書,媒體就失去讀者。以後媒體的廣告收入與讀者資料,都由臉書掌握。臉書一旦更改運算法,各家媒體就要立刻改變新聞生產策略以迎合運算法,才能確保自己的內容能夠推播到更多讀者面前。臉書成為真正的守門人,由運算法決定誰可以看到什麼內容。依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。

這場賽局中,新聞媒體用自己最珍貴的資產──新聞內容──交換短期的讀者數量,長期來看,犧牲的卻是經濟自主與新聞自主。這也是為什麼此舉引起一片憂心,認為與臉書的這場交易如同一場鴻門宴。媒體或許心裡都有數,拿免費新聞吸引讀者是飲鴆止渴,只是死得慢,但提供免費內容給臉書,就有立即經濟收益,也難再考慮之後的隱憂,因為隱憂畢竟只是「隱憂」,現在不加入,失去的則是眼前的廣告收入。在這樣的狀況下,即使知道或許不該加入,卻也不得不交出自己最珍貴的資產,冒著自主性的風險,交換即時利益。然而在這場媒體間的集體困局中,臉書成為最大贏家,獲取更多免費內容,吸引更多用戶,等於吸收他人的資產(內容與讀者),壯大自己的王國。

紀念湯瑪斯.謝林

謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。圖/nobelprize.org

2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling, 1921-2016)在 2016 年 12 月過世了。謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。雖然他最為人所知的是《衝突的策略》一書,特別是其中所論述「可信的承諾」(credible commitment)這一概念在冷戰年代國際關係上所發揮的影響,我卻偏愛他另一本著作:《微觀動機與宏觀行為》。我在學生時代讀他這本書,深深地為其中一個先驅性的「代理人基模型」(agent-based model)──個別居民無害的選擇如何在與鄰居互動的過程中造成社區種族隔離的均衡狀態──所吸引。及到大學教書,第一年即採用這本書開授「人類理性行為」的課程。

二十幾年來,我每次向學生介紹書中「多人囚徒困局」(multi-person prisoner’s dilemma)的理論時,仍然深深為謝林的智慧所激勵。這不只是因為模型本身既優雅又含意深遠,也是因為它所能洞燭的行為困境,從政治、經濟、社會、乃至於國際關係、人際關係幾乎無所不包。有不少人尊謝林為當前顯學行為經濟學之父,我深為同意。本文用一種特殊形態的多人囚徒困局──「公有地的悲劇」(the tragedy of the commons)──來詮釋新聞媒體在臉書上競合的困境。寫作中想到謝林對學術界、對我個人的深遠影響,不禁感懷不已。

原刊載於Tse-min Lin 的部落格

參考書目:

林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
0

文字

分享

0
0
0
台灣選民在投票時會願意進行換票嗎?|囚徒困局系列(八)
林澤民_96
・2016/01/15 ・2954字 ・閱讀時間約 6 分鐘 ・SR值 559 ・八年級

-----廣告,請繼續往下閱讀-----

f_13777171_1
來源:聯合晚報

台灣實行民主政治多年,很多人已學會分裂投票和策略性投票,但很少人知道策略性換票的可能性。在英美等西方國家,早已有網站提供合法平台讓不同選區的選民從事換票。

這運作始於2000年美國總統大選。當時民主黨的高爾(Gore)和共和黨的小布希(Bush)在好幾個州的競爭難分軒輊,可又有提倡公共利益的綠黨候選人納德爾(Nader)居中攪局。當時支持納德爾的選民在兩大黨候選人之間一般喜歡高爾甚於布希。由於高爾和布希之間的選情緊繃,而納德爾絕無當選可能,理論上支持納德爾的選民可以棄納保高。

候選人納德爾(Nader) source:wikipedia
候選人納德爾(Nader)
source:wikipedia

-----廣告,請繼續往下閱讀-----

但美國法令規定總統選舉中小黨必須要得到5%以上的選票才能獲得聯邦政府的選舉補助款,因此納德爾的選民並不見得願意進行策略性投票。在這種情況下,精明的選民們在網際網路建構了一種換票機制將選情不同的兩個州的選民配對換票,其運作方式舉例如下:

  • 甲州(例如佛羅里達州):兩大黨選情緊繃;選民A的偏好順序是(1)納德爾(2)高爾(3)布希。
  • 乙州(例如德克薩斯州):布希大幅領先高爾;選民B的偏好順序是(1)高爾(2)納德爾(3)布希。

網路的換票機制將A,B配對,讓A投票給第二順位的高爾交換B投票給第二順位的納德爾。如此,A最支持的納德爾的總票數不會受到影響,而他最不支持的布希在甲州的勝選機會減少了;同時,B最支持的高爾在乙州本就勝選無望,而他的換票卻增加了高爾在甲州擊敗布希贏得選舉人票的機會。因此,兩人可能會有換票的意願─這點下面會有進一步討論。

美國2000大選時活躍的網路平台如voteexchange.org,NaderTrader.org,VoteSwapp2000.com,WinWinCampaign.org,VoteExchange.com等選後均已關閉,而2016大選連政黨提名程序才即將開始,故網路上見不到運作中的美國平台。其它國家的平台則有:

source:cp.art.cmu.edu
source:cp.art.cmu.edu

-----廣告,請繼續往下閱讀-----

台灣適合換票機制嗎?

台灣的總統大選由於全國是一個選區,這種換票機制並不適用。立委選舉實行單一選區兩票制,雖有分區,卻因為區域立委選票和不分區政黨票分開並立,選民在區域立委選舉投票投票給第二順位的候選人,只要在不分區仍然投給最支持的政黨,並不會影響政黨票的總額,因此並不一定需要策略性換票來催化棄保。

但如果選民進行棄保的意願不高,或因最支持的候選人篤定當選或篤定落選而打算不投票,則策略性換票仍然有催化棄保的作用。舉例而言:

  • 甲選區:民調總支持度的估計是民進黨與國民黨選情緊繃而親民黨遠遠落後;選民A的偏好順序是(1)親民黨(2)國民黨(3)民進黨。
  • 乙選區:民進黨與親民黨選情緊繃而國民黨遠遠落後;選民B的偏好順序是(1)國民黨(2)親民黨(3)民進黨。

在這種情況下,A、B在各自選區本就有策略性投票的動機,也就是A會棄親民黨保國民黨,B會棄國民黨保親民黨,但並不見得所有適合上述條件的A、B選民均有足夠的意願進行策略性投票。如果有網路平台將A、B配對,讓兩人在各自選區同時進行棄保,則策略性投票的意願會加強。這是因為單獨棄保只能幫助自己第二順位的政黨候選人,而配對換票則能同時幫助自己第一支持的政黨在另一選區增加勝選的機會。

當然類似的換票也能幫助綠營的政黨,例如:

-----廣告,請繼續往下閱讀-----
  • 甲選區:民調總支持度的估計是國民黨與民進黨選情緊繃而時代力量遠遠落後;選民A的偏好順序是(1)時代力量(2)民進黨(3)國民黨。
  • 乙選區:國民黨與時代力量選情緊繃而民進黨遠遠落後;選民B的偏好順序是(1)民進黨(2)時代力量(3)國民黨。

如果A、B配對,則兩人也可以同時進行策略性投票及換票。這次選舉,民進黨在若干選區禮讓時代力量,無黨籍,甚至親民黨籍的候選人,其實就是以政黨為平台的大規模策略性換票行動,選民已無甚需要自發性進行支持綠營的策略性換票。反過來講,選民藉網路平台進行策略性換票正是在同陣營政黨彼此無法協調之下的自發性行為。

圓滾木(logrolling) source:pbs.twimg.com
圓滾木(logrolling)。source:pbs.twimg.com

策略性換票固然對雙方有利,但實行換票者也要付出代價,因為換票畢竟傷害了自己最支持候選人。事實上,換票類似所謂「滾圓木」(logrolling)的活動,也就是「你替我搔背,我替你搔背」(“You scratch my back;I scratch yours。”)的行為。這種行為雖然互利,如果缺乏徵信機制,卻不能保證在自己付出代價後,對方會履行承諾。民主國家的選舉採用秘密投票,即使有網路平台公開配對,法律上也不容許有任何機制來確定別人是否依承諾投票。在這種情況下,策略性換票其實是一個非合作性的非零和賽局;它甚至可能是一個囚徒困局(prisoner’s dilemma)!

首先介紹一些賽局理論的基本概念:

-----廣告,請繼續往下閱讀-----
  • 優勝策略 (dominant strategy):不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡 (Nash equilibrium):沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果 (Pareto optimal outcome):參賽者無法「同時」改進的賽局結果。
  • 困局 (dilemma):納許均衡不是伯瑞多最佳狀態的局面。

以上述美國2000年大選的換票為例,我們假設三個原則來計算策略性換票的收益:

  1. 真誠投票作為收益計算基礎,算0分。
  2. 投票給第二順位的政黨候選人,減1分。
  3. 如果自己最支持的政黨得到額外選票的支持,加2分。

依照這三原則,我們可以得到下列收益矩陣:

Microsoft Word - Document1

這矩陣顯示真誠投票,也就是A投給納德爾,B投給高爾,其實是兩人各自的優勝策略,而兩人同時真誠投票的策略組合是此賽局唯一的納許均衡,可是這納許均衡不是伯瑞多最佳結果,因為兩人同時策略性換票的結果(1,1)比納許均衡的結果(0,0)要來得好。根據困局的定義,這換票賽局正是一個囚徒困局,自我中心的理性選民不會履行換票承諾!

這裡可能有爭議的是第二原則,也就是換票對自己最支持候選人傷害的大小。以上例來說,A換票會傷害到納德爾爭取全國範圍5%選票的目標,因此這原則對A是合理的。但高爾在乙州根本毫無機會勝選,B換票對高爾實際上無甚傷害,因此這原則不見得適用。雖然而只要有一點點傷害,理論上此賽局還是囚徒困局,然而傷害越小,現實中B願意合作的可能性便越高。

-----廣告,請繼續往下閱讀-----

台灣的例子中,因為A、B兩人最支持的候選人均毫無當選機會,其情況猶如美國例子中的B選民。如果我們假設投票給第二順位政黨並不造成任何傷害,甚至因策略性投票而加1分的話,則收益矩陣如下:

Microsoft Word - Document1

此時履行承諾是優勝策略,而換票則是伯瑞多最佳的納許均衡了。如果以上的分析無誤,在台灣用網路平台進行自發性換票的可能性應該比美國還高。

不過也許正因為換票的條件存在,所以政黨之間就乾脆以支持非黨籍候選人的方式直接進行換票,而使得自發性配對換票的機會相對減少了。

原刊載於Tse-min Lin 的部落格

-----廣告,請繼續往下閱讀-----
林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
0

文字

分享

0
0
0
告白的遊戲:紀念約翰‧納許|囚徒困局系列(六)
林澤民_96
・2015/05/26 ・2399字 ・閱讀時間約 4 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

f_12280902_1

前幾天才結束春季的「人類理性行為」課程,沒想到整個學期和學生討論「納許均衡」,而約翰‧納許就驟然離世了。

紀念納許,我覺得最好的方法是讓大家瞭解他的賽局理論如何地可以用在我們日常生活中的各種面向。我的「人類理性行為」課程規定每個學生要交三篇論文,每篇要講一個真實或虛構的、包含「囚徒困局」的故事,然後用賽局理論加以分析。

第一篇只須是簡單的二人單次囚徒困局,第二篇必須是二人重複性囚徒困局,第三篇則須是多人囚徒困局。雖然大學部學生的論文大都乏善可陳,但每次總有幾篇文章有令人驚艷的創意。這些文章間或有關市場經濟、國際關係,但大多數是與學生個人生活密切相關的人際關係,特別是男女關係。多年來,學生把囚徒困局的理論應用到把妹問題、小三問題、性愛問題等等,令我目不暇給,學到了很多年輕人的次文化。

這裡介紹一個今年一位學生提出的「告白遊戲」來闡釋納許均衡此一概念的實用性。關於賽局理論相關概念的意義,這裡先簡單介紹,詳細請參考文後所列我部落格已發表的幾篇文章。

-----廣告,請繼續往下閱讀-----
  • 優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
  • 困局:納許均衡不是伯瑞多最佳狀態的局面。

下圖三個賽局中參賽者均為交往中的男女二人,每人可以選擇「告白」或「不告白」兩種策略。這裡告白意味合作,而不告白意味不合作。兩人的策略選擇交叉相乘,共得四種結果。每一結果以男先女後為序,是為:(不告白,告白),(告白,告白),(不告白,不告白),(告白,不告白)。這四種結果對男女二人各有不同的價值,在賽局一中,我們對這些價值初步假設如下:

如果我不告白而你告白,我可以享受玩咖的樂趣而不必負任何責任,這個結果對我最有利,其價值可以稱之為「誘惑」(Temptation)。用數學式子表示:T=玩咖

如果雙方都告白,兩人都可以享受愛情的甜蜜,但也要負起相當責任(例如不能再劈腿了)。這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward):R=♥

如果雙方都不告白,雙方各自心中忐忑,充滿了狐疑,不知道對方究竟想要怎樣,自己下一步該怎麼走。這個結果算是現狀,其價值可以標準化為0,稱之為「懲罰」(Punishment):P=0

-----廣告,請繼續往下閱讀-----

最後,如果我告白而你不告白,我本將心向明月,誰知明月照溝渠,真是令人感到委屈恥辱!這個結果對我最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff):S=屈辱

在這些價值假設之下,大家大概可以同意T>R>P>S,也就是:玩咖>♥>0>屈辱。這個數學關係的成立,使得第一個賽局符合了囚徒困局的條件。簡言之,因為玩咖的樂趣比要負起責任的愛情好,而且現狀比屈辱好,不論你告白不告白,對我而言不告白都要比告白來得有利,而這對雙方皆然。因此,不告白是男女雙方的所謂「優勝策略」,也就是雙方均會選擇不告白。

這個(不告白,不告白)的策略組合便是「納許均衡」的一個例子。當男女參賽者陷於這個結果中,任何人都不願意單方面改變策略,因為如果你單方面改變不告白策略而逕行告白,你只會讓對方自詡為玩咖而沾沾自喜,而自己得忍受當傻瓜的屈辱。「納許均衡」是一個穩定的結果,理性的參賽者在「納許均衡」的結果中不會單方面改變策略。在告白的遊戲中,男女雙方會陷於(不告白,不告白)的泥淖裡不能自拔。

這個賽局也是「囚徒困局」的一個例子。很明顯的,因為♥>0,男女雙方其實都喜歡相互告白甚於相互不告白,但又不願意單獨採取行動。換句話說,在(不告白,不告白)的納許均衡中,如果雙方都願意,雙方的價值都有同時改進的空間。這意味此賽局唯一的納許均衡不是一個「伯瑞多最佳結果」,這就是「囚徒困局」的定義。在上述價值假設之下,告白遊戲是一個囚徒困局。

-----廣告,請繼續往下閱讀-----

Microsoft Word - PD Game

以上是我學生的第一篇論文所分析的,但也許大家會質疑:那為什麼交往中的男女儘有人會告白呢?這牽涉到價值假設的問題。比如有人太過於為對方著迷,不論對方回應與否,心甘情願地自動告白依附,像那首《在那遙遠的地方》所唱的:「我願做一隻小羊跟在她身旁,我願她拿著細細的皮鞭不斷輕輕打在我身上」。在這樣的價值假設之下,我告白而你不告白的價值S便不是屈辱,而是S=心甘情願>P=0了。這樣的告白遊戲,便變成了下圖中的賽局二。因為T>R>S>P,這已不是「囚徒困局」而是「懦夫賽局」了。「懦夫賽局」有兩個納許均衡:(不告白,告白)和(告白,不告白),其中哪一個會發生,就不是賽局理論所能置喙的了。

Microsoft Word - PD Game

當然,也有人會認為規規矩矩從一而終地談戀愛比當玩咖好,也就是S=♥>T=玩咖。這樣的假設使得下圖中的賽局一變成了賽局三,它也有兩個納許均衡:(告白,告白)和(不告白,不告白),其中(不告白,不告白)仍然不是伯瑞多最佳結果,但(告白,告白)卻是。因為這個賽局有一個是伯瑞多最佳結果的納許均衡,它已經不算是囚徒困局,而是一種「協調賽局」了。在這樣的價值假設之下,男女只要有足夠的默契,便容易相互告白而訂下情緣。

Microsoft Word - PD Game

你也許看過「美麗境界」電影但對數學敬而遠之,你甚至連納許的鼎鼎大名都沒聽過,但你知道嗎:你的人際關係中很多你不願意單方面去改變的狀態,包括男女朋友或夫妻關係,不論你喜歡與否,很可能都是「納許均衡」呢?納許的偉大貢獻,便是在概念上釐清了這些狀態的性質,讓我們清楚瞭解它們之所以存在的邏輯,進而使得人類理性行為的預測成為可能。納許雖然死了,但「納許均衡」仍然無所不在於我們的生活中!

有興趣的讀者請進一步參考其他文章:

-----廣告,請繼續往下閱讀-----

原刊載於Tse-min Lin 的部落格

文章難易度
林澤民_96
37 篇文章 ・ 240 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。