0

0
0

文字

分享

0
0
0

要怎麼多吃一點冰淇淋 -從賽局理論與實驗經濟學談連續議價賽局

活躍星系核_96
・2014/08/15 ・2327字 ・閱讀時間約 4 分鐘 ・SR值 476 ・五年級
相關標籤: 賽局理論 (22)

-----廣告,請繼續往下閱讀-----

圖片來源:picjumbo Sunny Ice Cream By Viktor Hanacek
圖片來源:picjumbo Sunny Ice Cream By Viktor Hanacek

作者:謝沛勳|國立台灣大學經濟學研究所

在8月的中午,你跟朋友路過全家,抽獎抽到了一根冰淇淋。在炎炎夏日,你們都想多吃一點冰淇淋,因此你們想到一個文明的辦法來分配冰淇淋。你們說好由你先提案決定分配的大小(因為是你提議要抽獎的),你朋友決定是否要接受提案,若朋友拒絕則輪到朋友提案。在38度C的午後,冰淇淋融化得很快,每經過一次提案冰淇淋就融化掉一半,在第三回合後冰淇淋就沒了。也就是說,在第一回合你們有一份冰淇淋可以分,由你來提議各拿多少,若你朋友答應則按照這樣分配,若你朋友拒絕則進入第二回合。在第二回合,冰淇淋只剩一半,由你朋友來分配,如果你又拒絕則進入第三回合。第三回合時冰淇淋只剩四分之一,若朋友還是拒絕則雙方什麼都拿不到。這個時候,你該怎麼分配冰淇淋呢?

提案

未命名

今天如果你是故事中的主角,你在第一回合會提議分配多少給朋友呢?如果你跟你的朋友都是一個只在乎看的到的利益(也就是說沒有心理感受)、且完全理性而且又十足聰明的人,應該會這樣想:因為在最後一回合你可以拿到剩下全部的四分之一冰淇淋(只要分給朋友一小小口她就會同意,因為拒絕的話就什麼都沒有,聊勝於無),因此你朋友在第二回合至少得分給你四分之一你才會同意(因為你這回合拒絕的話,下回合也可以拿四分之一),因此他會提議分四分之一給你,自己拿四分之一。既然你朋友在第二回合可以拿到四分之一,在第一回合時你也得分四分之一給你朋友爭取他的同意,自己拿四分之三,這就是賽局理論中的逆向推導法(backward induction)。

看到這邊,你可能會有兩個想法。一是原來要這樣想啊,我好像都沒想到呢,就很直覺得想說要分一部分的冰淇淋給朋友。你也有可能會想說,何必這麼計較呢?應該多分一點給他,不管是不是朋友。的確,在實驗經濟學家作的實驗中,大多數第一回合的提案都介在四分之一到一半之間。原因有二,一個是由於逆向推導法並不直覺,並非大多數人會想得到的;也有可能認為並不需要為了這樣的事情耗費太多腦力。第二則是社會偏好,也就是說人會在乎公平,或擔心對方會在乎公平,一氣之下寧可選擇玉石俱焚也不要冰淇淋了。這在獨裁者賽局(dictator game)或最後通牒賽局(ultimatum game)都能觀察到這樣的現象,《 贏家的詛咒》(Richard Thaler,經濟新潮社,2009)或《金錢實驗室的人性考驗》(陳其一,財信出版,2011)內有詳述。

-----廣告,請繼續往下閱讀-----

為了確定這兩個因素在人們決策中的作用,Johnson、Camerer和Sen在2002年做了一個有趣的實驗。實驗的第一部分是給受試者作連續議價賽局(sequential bargaining game),也就是上述分冰淇淋的賽局,但是此處用5塊美金代替,且受試者在實驗中所獲得的報酬結束後可以拿回家(經濟學家很重視實驗中有真實的誘因,缺錢的人快去找徵求受試者的廣告!)。這個實驗是利用電腦進行的,電腦隨機幫受試者兩兩配對,受試者知道對手也是一樣在實驗室的,但不知道對方是誰也不可以交談,且每回合會重新配對。受試者會看到以下畫面。

未命名
圖片來源:E.Johnson,C.Camerer,S.Sen,”Detecting Failures of Backward Induction: Monitoring Information Search in Sequential Bargaining”,2002,Journal of Economic Theory

關於每回合可以分配的報酬是隱藏在盒子後面的,要用滑鼠點擊才看得到。其中pie’s size指的就是這一回合可以分配的金額,左邊的數字指的是第幾回合。下方的數字Bar則是給受試者選擇要分配多少金額。而電腦會記錄受試者點集盒子的次數、時間與順序。Johnson等人發現有很大一部分的受試者甚至連第三回合還剩多少報酬都不知道就做決策,絕大多數的受試者取得資訊的方式也是從第一回合開始,可見絕大多數的受試者並沒有使用逆向推導法。因此提出了有限認知理論取代之:有限認知的模型假設如果受試者只看第一回合的報酬,受試者便會把這個賽局當作最後通牒賽局(註一),並且分給對手40%(2元)的報酬,稱此類的受試者叫Level 0。若這個受試者看兩回合的報酬,則會認為對方在第二回合會分給他40%(1元)的報酬,自己留60%也就是1.5元,因此在第一回合會分給對方1.5元,稱此類的受試者叫Level 1。實驗結果發現,提議給對手1.5元到2元之間的人,的確比提議給對手2元以上的人多看了很多次第二回合的盒子!而在實驗中平均第一回合的提案金額則是2.11美金(賽局理論的均衡是1.25美金)。

第二部分則是告訴受試者他們的對手是只在乎自己利益,而且絕對理性的電腦。因為對手不是真人,受試者不會考慮公平的問題,可以用這個方法來拿掉受試者的社會偏好。結果發現受試者的提案金額的確降低了,第一回合的平均提案金額從2.11美金降為1.84美金,少掉的這部分就是社會偏好的影響。但是距離賽局理論的均衡(1.25美金)仍然有很大一段距離。

所以,在炎炎夏日吃冰淇淋時,別忘了看一下實驗經濟學的書吧。可以看Kahneman的《快思慢想》,有經濟學底子的可以看Thaler《贏家的詛咒》,一起來領略實驗經濟學的趣味吧!

-----廣告,請繼續往下閱讀-----

註一:最後通牒賽局(ultimatum game),提案者可決定如何分配一筆報酬,若對方接受則按照提案分配,若拒絕則兩者都拿不到任何報酬。以分配十元為例,賽局理論認為分一元給對手且對手會接受,因為拿到一元總比拒絕提案沒拿到任何報酬好。但實驗中受試者平均的提案是分40%給對手。

 

參考文獻:E.Johnson,C.Camerer,S.Sen,”Detecting Failures of Backward Induction: Monitoring Information Search in Sequential Bargaining”,2002,Journal of Economic Theory

延伸閱讀

文章難易度
活躍星系核_96
752 篇文章 ・ 126 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

2
1

文字

分享

0
2
1
為什麼同伴會出賣你?從「囚徒困境」來看共犯為什麼先招了!——《大話題:賽局理論》
大家出版_96
・2023/04/22 ・1979字 ・閱讀時間約 4 分鐘

合作與私利的權衡:囚徒困境

最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。

囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。

囚徒困境是指兩名囚犯陷入「是否要認罪」的心理狀態。圖/《大話題:賽局理論》

阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。

阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。

-----廣告,請繼續往下閱讀-----

阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。

刑期長短受到共犯是否認罪的影響。圖/《大話題:賽局理論》

我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。

如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。

囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。

-----廣告,請繼續往下閱讀-----
考慮到先認罪的人可以免去刑責,將導致四種可能結果。圖/《大話題:賽局理論》

合作或私利考量下的「最佳解」不同

這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。

請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。

現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。

兩名囚犯就彼此的利益思考,形成「囚犯困境」的心理狀態。圖/《大話題:賽局理論》

很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。

-----廣告,請繼續往下閱讀-----

但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。

以個人來說,最佳的回應便是「認罪」。圖/《大話題:賽局理論》

同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。

在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:

{ 認罪,認罪 }

-----廣告,請繼續往下閱讀-----

前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。

即使雙方最佳利益為「沉默」,但在囚徒困境下卻會選擇「認罪」。圖/《大話題:賽局理論》

這屬於柏雷多效率嗎?

一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。

囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。

不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。

-----廣告,請繼續往下閱讀-----
囚徒困境並非柏雷多效率,因雙方若選擇共同沉默將能有更好的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

2
1

文字

分享

0
2
1
我預判了你的預判!為什麼高手過招總會和局?——《大話題:賽局理論》
大家出版_96
・2023/04/21 ・1459字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

什麼是「賽局理論」?

賽局理論是在研究策略性互動。策略性互動也是很多桌遊的關鍵元素,賽局理論因此得名。你的決策影響別人的行動,反之亦然。賽局理論的不少術語直接取自這類遊戲。我們把決策者稱為「參與者」(player)。參與者做決定後,就採取了行動(move)。

以策略性互動為基礎的賽局理論。圖/《大話題:賽局理論》

運用模型簡化複雜世界

真實世界的策略性互動可能非常複雜。例如在人際互動中,不僅行動,包括我們的表情、聲調和肢體語言都會影響他人。

在與他人往來時,人們展現不同的經歷與觀點。這樣無以計數的變化會使得情況異常複雜,也很難分析。

藉由稱為「模型」的簡化結構,我們可以大幅縮減複雜的程度。模型雖然簡單且容易分析,但仍然捕捉了真實世界問題的某些重要特徵。選用適當的簡單模型,可以有效幫助大家學習真實世界的複雜問題。

-----廣告,請繼續往下閱讀-----
藉由模型簡化真實世界的複雜策略性互動。圖/《大話題:賽局理論》

西洋棋可以幫助我們瞭解這些變化會讓參與(及預測)賽局變得多麼複雜。西洋棋的規則明確,雖然每一步棋的選項有限,但整體棋局的複雜度令人生畏。不過比起許多人類的基本互動,西洋棋其實簡單多了!

西洋棋儘管複雜,但比人類互動簡單多了。圖/《大話題:賽局理論》

高手過招容易和局!

像西洋棋之類的桌遊有個特性:玩家愈熟練,就容易產生平手的結局。我們如何解釋這種現象?

因為西洋棋太複雜,難以全面分析,以下我們用簡單的井字遊戲來說明一個重要特性。西洋棋和井字遊戲都有明確的勝負規則。玩家輪流落子,且可以下的地方有限。

井字遊戲無法表現西洋棋中的許多特性。但由於兩者有些共同特徵,因此井字遊戲可以幫助人們瞭解高手對陣為什麼容易產生和局。

-----廣告,請繼續往下閱讀-----
井字遊戲因為較簡單,掌握規則後就很容易平手。圖/《大話題:賽局理論》
因為井字遊戲太容易平手,因此人們開始挑戰更複雜的遊戲。圖/《大話題:賽局理論》

被簡化的世界縮影:「賽局」

賽局理論的首要關注並非西洋棋之類的桌遊,而是要增進我們對人際、對企業間、對國家間、對生物間……等互動行為的瞭解。原因是,真實的問題可能過於複雜且難以充分掌握。

因此,在賽局理論中我們創造了非常簡化的模型,稱之為「賽局」。創造有用的模型既是科學,也是藝術。

好的模型夠簡單,讓人能充分瞭解驅動參與者的誘因。同時,模型必須能夠捕捉真實世界的重要元素,以富有開創性的洞察力與判斷力決定哪些元素最為相關。

沒有模型能適用任何狀況,因為真實世界如此複雜。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。