0

1
0

文字

分享

0
1
0

沒有結局的比賽:你會選擇合作還是背叛?——《大話題:賽局理論》

大家出版_96
・2023/04/23 ・1525字 ・閱讀時間約 3 分鐘

重複賽局中的均衡結果

在 1883 年,法國經濟學家伯特蘭(1822 – 1900)研究了販售相同產品的廠商之間的價格競爭,在他的分析中,廠商面對的誘因問題很類似囚徒困境賽局。

削價競爭是不同廠商間達到均衡的可能。圖/《大話題:賽局理論》

伯特蘭預測在均衡時廠商之間會彼此削價,類似囚徒困境賽局中的{認罪,認罪}結果。但我們在現實中常常看到廠商彼此勾結並訂定高價。西方民主國家多數立有「反壟斷法」禁止這類勾結,以促進競爭。

為了瞭解在囚徒困境之類的處境中,參與者何時會勾結,我們必須跳脫一次性賽局,也就是參與者只進行一次後就結束的賽局。轉而考慮更符合現實的重複互動,也就是參與者會不斷進行同樣賽局。

為避免削價競爭,廠商間可能會想透過合作訂出更好的價格。圖/《大話題:賽局理論》

如果參與者重複互動,我們能夠在囚徒困境中觀察到合作的均衡嗎?

-----廣告,請繼續往下閱讀-----

假設兩位參與者都知道囚徒困境賽局會進行兩次。為了找出重複互動賽局的均衡,我們要先預測最後一回合賽局的均衡,然後倒推第一回合賽局的均衡。這種推理方式稱為逆向歸納法。

預測下一次均衡的賽局來回推這次該採取的行動。圖/《大話題:賽局理論》

如果這就是結局?

在第二回合,參與者知道這是最後一次互動,也就沒有必要嘗試改變未來的結果。因此,最後一局結果就像是一次性囚徒困境:沒人合作。

參與者可以推論,不論第一回合如何,第二回合肯定沒有合作。那麼,從參與者的角度來看,第一回合也跟一次性囚徒困境沒有兩樣。因此,在均衡時兩回合都不會出現合作。

事實上,即使囚徒困境賽局進行多次,只要賽局有個確切的結束回合,我們永遠不會觀察到合作。逆向歸納法從最終回合拆解了整體賽局的結果。

-----廣告,請繼續往下閱讀-----
由於預測到結局,因此人們選擇不再合作了。圖/《大話題:賽局理論》

現實世界沒有真正的「最終回」

以色列裔美國數學家歐曼(1930 年生)在 2005 年與謝林一起獲得諾貝爾經濟學獎。他的研究之一是無限回合賽局均衡下的合作行為。在無限回合中,逆向歸納法無法從最終局拆解合作情形,因為沒有明確的最終局。

合作要能成為均衡的結果,首要條件是參與者的策略能夠處罰過去的壞行為(不合作)。為了避免以後受罰,參與者可能選擇合作。

此刻的合作將影響到未來自我的利益時….圖/《大話題:賽局理論》

試看在無限回合的囚徒困境賽局中所謂的冷酷策略:參與者起初採取合作行動(例如囚徒保持沉默,也可能是室友賽局中的洗碗,或是廠商的勾結高價)。

在接下來的賽局中,只要對方合作,我也一直保持合作。但只要對方背叛了(例如囚徒認罪、室友不再洗碗、廠商用低價搶走市場),我就選擇背叛。

-----廣告,請繼續往下閱讀-----
此時的合作是怕雙方不合作的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

文章難易度
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

2
1

文字

分享

0
2
1
為什麼同伴會出賣你?從「囚徒困境」來看共犯為什麼先招了!——《大話題:賽局理論》
大家出版_96
・2023/04/22 ・1979字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

合作與私利的權衡:囚徒困境

最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。

囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。

囚徒困境是指兩名囚犯陷入「是否要認罪」的心理狀態。圖/《大話題:賽局理論》

阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。

阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。

-----廣告,請繼續往下閱讀-----

阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。

刑期長短受到共犯是否認罪的影響。圖/《大話題:賽局理論》

我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。

如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。

囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。

-----廣告,請繼續往下閱讀-----
考慮到先認罪的人可以免去刑責,將導致四種可能結果。圖/《大話題:賽局理論》

合作或私利考量下的「最佳解」不同

這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。

請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。

現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。

兩名囚犯就彼此的利益思考,形成「囚犯困境」的心理狀態。圖/《大話題:賽局理論》

很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。

-----廣告,請繼續往下閱讀-----

但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。

以個人來說,最佳的回應便是「認罪」。圖/《大話題:賽局理論》

同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。

在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:

{ 認罪,認罪 }

-----廣告,請繼續往下閱讀-----

前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。

即使雙方最佳利益為「沉默」,但在囚徒困境下卻會選擇「認罪」。圖/《大話題:賽局理論》

這屬於柏雷多效率嗎?

一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。

囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。

不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。

-----廣告,請繼續往下閱讀-----
囚徒困境並非柏雷多效率,因雙方若選擇共同沉默將能有更好的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

2
1

文字

分享

0
2
1
我預判了你的預判!為什麼高手過招總會和局?——《大話題:賽局理論》
大家出版_96
・2023/04/21 ・1459字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

什麼是「賽局理論」?

賽局理論是在研究策略性互動。策略性互動也是很多桌遊的關鍵元素,賽局理論因此得名。你的決策影響別人的行動,反之亦然。賽局理論的不少術語直接取自這類遊戲。我們把決策者稱為「參與者」(player)。參與者做決定後,就採取了行動(move)。

以策略性互動為基礎的賽局理論。圖/《大話題:賽局理論》

運用模型簡化複雜世界

真實世界的策略性互動可能非常複雜。例如在人際互動中,不僅行動,包括我們的表情、聲調和肢體語言都會影響他人。

在與他人往來時,人們展現不同的經歷與觀點。這樣無以計數的變化會使得情況異常複雜,也很難分析。

藉由稱為「模型」的簡化結構,我們可以大幅縮減複雜的程度。模型雖然簡單且容易分析,但仍然捕捉了真實世界問題的某些重要特徵。選用適當的簡單模型,可以有效幫助大家學習真實世界的複雜問題。

-----廣告,請繼續往下閱讀-----
藉由模型簡化真實世界的複雜策略性互動。圖/《大話題:賽局理論》

西洋棋可以幫助我們瞭解這些變化會讓參與(及預測)賽局變得多麼複雜。西洋棋的規則明確,雖然每一步棋的選項有限,但整體棋局的複雜度令人生畏。不過比起許多人類的基本互動,西洋棋其實簡單多了!

西洋棋儘管複雜,但比人類互動簡單多了。圖/《大話題:賽局理論》

高手過招容易和局!

像西洋棋之類的桌遊有個特性:玩家愈熟練,就容易產生平手的結局。我們如何解釋這種現象?

因為西洋棋太複雜,難以全面分析,以下我們用簡單的井字遊戲來說明一個重要特性。西洋棋和井字遊戲都有明確的勝負規則。玩家輪流落子,且可以下的地方有限。

井字遊戲無法表現西洋棋中的許多特性。但由於兩者有些共同特徵,因此井字遊戲可以幫助人們瞭解高手對陣為什麼容易產生和局。

-----廣告,請繼續往下閱讀-----
井字遊戲因為較簡單,掌握規則後就很容易平手。圖/《大話題:賽局理論》
因為井字遊戲太容易平手,因此人們開始挑戰更複雜的遊戲。圖/《大話題:賽局理論》

被簡化的世界縮影:「賽局」

賽局理論的首要關注並非西洋棋之類的桌遊,而是要增進我們對人際、對企業間、對國家間、對生物間……等互動行為的瞭解。原因是,真實的問題可能過於複雜且難以充分掌握。

因此,在賽局理論中我們創造了非常簡化的模型,稱之為「賽局」。創造有用的模型既是科學,也是藝術。

好的模型夠簡單,讓人能充分瞭解驅動參與者的誘因。同時,模型必須能夠捕捉真實世界的重要元素,以富有開創性的洞察力與判斷力決定哪些元素最為相關。

沒有模型能適用任何狀況,因為真實世界如此複雜。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

2

1
2

文字

分享

2
1
2
一切都是時臣的錯?同情心讓你先把拳頭放下來──「私刑正義」的心理學
貓心
・2022/07/04 ・2681字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

在網際網路發達的現代,私刑正義一直是社會議題值得被重視的一塊。當名人、演員、政治人物,甚至是個沒沒無聞的小卒犯錯時,許多人蜂擁到他們的社群媒體攻擊、肉搜、堵人等等,是一件值得被重視的議題。

在這一篇文章中,我將從一些心理學研究,探討「私刑正義」的可能成因,以及可能削減私刑正義的方式。

為什麼我們會想伸張正義?

人們對於不公平,似乎有著天生的敏感度。有一個德國萊比錫的研究團隊,就針對小孩子進行研究。他們讓小孩子看木偶劇場,有些木偶會對小孩子很親切,也就是所謂的好木偶,也有一些木偶會送小孩子禮物,再把禮物搶走,也就是所謂的壞木偶。

當孩子看到好木偶被毆打時,他們會不開心;但是看到壞木偶被毆打時,則會雀躍不已。圖/Pixabay

實驗者發現,當孩子看到好木偶被毆打時,他們會不開心;但是看到壞木偶被毆打時,則會雀躍不已。

實驗者好奇的是,我們是否願意花錢,來換取觀看壞人被打呢?他們在壞木偶要被懲罰的剎那,將布幕拉上,除非孩子交出手上的代幣,否則就無法繼續觀看。

-----廣告,請繼續往下閱讀-----

結果,孩子們紛紛交出了手上的代幣,以求繼續觀看壞木偶被打[1]

然而,這篇實驗僅能解釋,當欺負我們的人跟被懲罰的人是同一個人時,我們先天就很樂見他們被懲罰,甚至是犧牲自己的利益也在所不惜。

但是,當我們只是袖手旁觀的第三者時,為何我們依然會希望伸張正義呢?神經心理學家 Lisa Barret 對此提出了解釋[2]

Lisa Barret 指出,人們的腦容量是有限的,正因為如此,我們不能等自己被攻擊了,才要求別人對這些人做出懲罰,而是希望「當和我們類似的人受到攻擊時,那些犯罪者能夠得到報應,以避免我們自身也受到攻擊。

-----廣告,請繼續往下閱讀-----

因此,當我們對某個人的受罰為之叫好時,肯定是因為他們所損害的他人利益,和我們自身有關。

這就是為什麼比起開車族、機車族,平常徒步走在街上的行人,對於警察針對行駛人行道的汽機車加強取締時,人們會更為振奮的緣故。

因此,當我們對某個人的受罰為之叫好時,肯定是因為他們所損害的他人利益,和我們自身有關。圖/Pexels

同情心,或許可以撫平報復心理

然而,並不是所有人,都能等待警察、法官等等來懲罰犯罪者,私刑正義的新聞我們可是時有所聞,例如先前一則疑似女兒被性侵後自殺,父親烙人抓人虐殺犯人的新聞,就在社會版面轟動一時。有些人為之叫好,但也有些人擔心「私刑正義」的嚴重性。

事實上,精神病學講師 James Kimmel Jr. 便曾指出,過度沉迷於私刑正義的結果,可能會導致「恐怖主義、復仇謀殺、幫派犯罪」等等的發生[3]

-----廣告,請繼續往下閱讀-----

那麼,有什麼可以避免私刑正義呢?有一篇研究指出,也許同情心是一個可能的解決之道[4]

在這份研究中,實驗者招來了 44 名受試者,並將他們隨機分配到三種實驗情境中。在三種實驗情境裡,他們都必須要完成一份測驗,該份測驗是 20 題數學題,而他們都被安排坐在一男一女中間。

受試者不知道的是,那一男一女都是實驗者安排好的演員。

實驗開始了,在考卷發下去之前,女演員都會用眼藥水讓自己裝哭,並表示需要離開實驗。在實驗組裡面的女演員會裝作是得知哥哥得了癌症,自己卻要周末才能返家,此刻時在無法控制住自己的情緒;在控制裡面,女演員則會裝作要趕著去看醫生,必須離開實驗室。

-----廣告,請繼續往下閱讀-----
女演員設定引發受試者的同情心。圖/Pexels

接著,受試者和男演員留在教室內,開始做那 20 題數學題,做了 4 分鐘,實驗者就會走過來,先收走受試者的問券,並檢查完答案後將答案卷用碎紙機碎掉,接著給他答對題數所應得的獎金。此時,實驗者會裝作身上的獎金不夠,必須要離開去拿獎金。

在實驗組中,實驗者離開之後,男演員會自己把答案卷碎掉,並在實驗者回來後,告訴對方「為了省時間,我自己對了答案,結果 20 題全對,我要領取 20 題的獎金。」並真的順利將獎金領走。

在控制組當中,男演員不會碎掉答案紙,而是表示自己比受試者多對了一題,然後領走獎金。

給予受試者報復機會

實驗者接著讓受試者有機會調配味覺測試的材料,並且讓受試者得知,這瓶材料將會讓作弊的男演員喝下,且對方不會知道是他調的。同時受試者也會知道,男演員超級怕辣。

-----廣告,請繼續往下閱讀-----
讓受試者有機會懲罰作弊的男演員,看受試者會加入多少辣椒。圖/Pixabay

透過這三種情境測試,實驗者想觀察兩件事情:

  1. 受試者是否會因為對方作弊,而想要懲罰對方?
  2. 受試者是否會因為剛剛另一位成員因哥哥癌症離去,而產生同情心(compassion),進而原諒作弊者的行為?

同情心可能會讓我們心軟

結果發現,在控制組裡面,受試者平均加入了 2 公克多的辣椒醬,而在實驗組裡面,受試者平均加入了將近 10 公克的辣椒醬,可見受試者對於報復作弊者,是確實會付諸行動的。

問題來了,這些受試者如果先前受到另一位演員的影響,是否會減少加入辣椒醬的量?如果是的話,這也表示,我們會因為自身的同情心,而減少對其他人的報復舉動。

研究結果顯示,同情心確實會有這樣的作用。參與到同情心實驗組的受試者,確實加入了較少的辣椒醬,只有平均約 3 公克左右,和控制組差不多。

-----廣告,請繼續往下閱讀-----
受試者在不同實驗情境下的懲罰程度。誤差線表示一個標準差。 圖/參考資料 4

這樣的研究結果顯示了,也許同情心,真的能讓我們更加寬容地看待這個社會,不再那麼執著於懲罰受試者。

不過,實驗者也特別強調,本篇研究的「同情對象」和「我們想報復的對象」是不同人。如果是同一個人的話,我們會有什麼舉動,其實是值得再進一步探討的。

參考資料

  1. Natacha Mendes et al., ‘Preschool children and chimpanzees incur costs to watch punishment of antisocial others,’ Nature Human Behaviour, vol. 2, 2018, pp. 45-51.
  2. Lisa Feldman Barrett, How Emotions Are Made: The Secret Life of The Brain, Macmillam, London,2017,p.73.
  3. K.M. Carlsmith et al.., ‘The paradoxical consequences of revenge’, Journal of Personality and Social Psychology, vol.95(6), pp.1,316-24.
  4. Condon, Paul & Desteno, David. (2011). Compassion for one reduces punishment for another. Journal of Experimental Social Psychology.
所有討論 2
貓心
76 篇文章 ・ 118 位粉絲
心理作家。台大心理系學士、國北教心理與諮商所碩士。 寫作主題為「安全感」,藉由依附理論的實際應用,讓缺乏安全感的人,了解安全感構成的要素,進而找到具有安全感的對象,並學習建立具有安全感的對話。 對於安全感,許多人有一個想法:「安全感是自己給自己的。」但在實際上,安全感其實是透過成長過程中,從照顧者對自己敏感而支持的回應,逐漸內化而來的。 因此我認為,獲得安全感的兩個關鍵在於:找到相對而言具有安全感的伴侶,並透過能夠創造安全感的說話方式與對方互動,建立起一段具有安全感的關係。 個人專欄粉專: https://www.facebook.com/psydetective/ 個人攝影粉專: https://www.facebook.com/psyphotographer/