合作與私利的權衡:囚徒困境
最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。
囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。
阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。
阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。
阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。
我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。
如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。
囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。
合作或私利考量下的「最佳解」不同
這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。
請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。
現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。
很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。
但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。
同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。
在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:
{ 認罪,認罪 }
前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。
這屬於柏雷多效率嗎?
一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。
囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。
不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。
——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。