Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

告白的遊戲:紀念約翰‧納許|囚徒困局系列(六)

林澤民_96
・2015/05/26 ・2399字 ・閱讀時間約 4 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

f_12280902_1

前幾天才結束春季的「人類理性行為」課程,沒想到整個學期和學生討論「納許均衡」,而約翰‧納許就驟然離世了。

紀念納許,我覺得最好的方法是讓大家瞭解他的賽局理論如何地可以用在我們日常生活中的各種面向。我的「人類理性行為」課程規定每個學生要交三篇論文,每篇要講一個真實或虛構的、包含「囚徒困局」的故事,然後用賽局理論加以分析。

第一篇只須是簡單的二人單次囚徒困局,第二篇必須是二人重複性囚徒困局,第三篇則須是多人囚徒困局。雖然大學部學生的論文大都乏善可陳,但每次總有幾篇文章有令人驚艷的創意。這些文章間或有關市場經濟、國際關係,但大多數是與學生個人生活密切相關的人際關係,特別是男女關係。多年來,學生把囚徒困局的理論應用到把妹問題、小三問題、性愛問題等等,令我目不暇給,學到了很多年輕人的次文化。

這裡介紹一個今年一位學生提出的「告白遊戲」來闡釋納許均衡此一概念的實用性。關於賽局理論相關概念的意義,這裡先簡單介紹,詳細請參考文後所列我部落格已發表的幾篇文章。

-----廣告,請繼續往下閱讀-----
  • 優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
  • 困局:納許均衡不是伯瑞多最佳狀態的局面。

下圖三個賽局中參賽者均為交往中的男女二人,每人可以選擇「告白」或「不告白」兩種策略。這裡告白意味合作,而不告白意味不合作。兩人的策略選擇交叉相乘,共得四種結果。每一結果以男先女後為序,是為:(不告白,告白),(告白,告白),(不告白,不告白),(告白,不告白)。這四種結果對男女二人各有不同的價值,在賽局一中,我們對這些價值初步假設如下:

如果我不告白而你告白,我可以享受玩咖的樂趣而不必負任何責任,這個結果對我最有利,其價值可以稱之為「誘惑」(Temptation)。用數學式子表示:T=玩咖

如果雙方都告白,兩人都可以享受愛情的甜蜜,但也要負起相當責任(例如不能再劈腿了)。這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward):R=♥

如果雙方都不告白,雙方各自心中忐忑,充滿了狐疑,不知道對方究竟想要怎樣,自己下一步該怎麼走。這個結果算是現狀,其價值可以標準化為0,稱之為「懲罰」(Punishment):P=0

-----廣告,請繼續往下閱讀-----

最後,如果我告白而你不告白,我本將心向明月,誰知明月照溝渠,真是令人感到委屈恥辱!這個結果對我最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff):S=屈辱

在這些價值假設之下,大家大概可以同意T>R>P>S,也就是:玩咖>♥>0>屈辱。這個數學關係的成立,使得第一個賽局符合了囚徒困局的條件。簡言之,因為玩咖的樂趣比要負起責任的愛情好,而且現狀比屈辱好,不論你告白不告白,對我而言不告白都要比告白來得有利,而這對雙方皆然。因此,不告白是男女雙方的所謂「優勝策略」,也就是雙方均會選擇不告白。

這個(不告白,不告白)的策略組合便是「納許均衡」的一個例子。當男女參賽者陷於這個結果中,任何人都不願意單方面改變策略,因為如果你單方面改變不告白策略而逕行告白,你只會讓對方自詡為玩咖而沾沾自喜,而自己得忍受當傻瓜的屈辱。「納許均衡」是一個穩定的結果,理性的參賽者在「納許均衡」的結果中不會單方面改變策略。在告白的遊戲中,男女雙方會陷於(不告白,不告白)的泥淖裡不能自拔。

這個賽局也是「囚徒困局」的一個例子。很明顯的,因為♥>0,男女雙方其實都喜歡相互告白甚於相互不告白,但又不願意單獨採取行動。換句話說,在(不告白,不告白)的納許均衡中,如果雙方都願意,雙方的價值都有同時改進的空間。這意味此賽局唯一的納許均衡不是一個「伯瑞多最佳結果」,這就是「囚徒困局」的定義。在上述價值假設之下,告白遊戲是一個囚徒困局。

-----廣告,請繼續往下閱讀-----

Microsoft Word - PD Game

以上是我學生的第一篇論文所分析的,但也許大家會質疑:那為什麼交往中的男女儘有人會告白呢?這牽涉到價值假設的問題。比如有人太過於為對方著迷,不論對方回應與否,心甘情願地自動告白依附,像那首《在那遙遠的地方》所唱的:「我願做一隻小羊跟在她身旁,我願她拿著細細的皮鞭不斷輕輕打在我身上」。在這樣的價值假設之下,我告白而你不告白的價值S便不是屈辱,而是S=心甘情願>P=0了。這樣的告白遊戲,便變成了下圖中的賽局二。因為T>R>S>P,這已不是「囚徒困局」而是「懦夫賽局」了。「懦夫賽局」有兩個納許均衡:(不告白,告白)和(告白,不告白),其中哪一個會發生,就不是賽局理論所能置喙的了。

Microsoft Word - PD Game

當然,也有人會認為規規矩矩從一而終地談戀愛比當玩咖好,也就是S=♥>T=玩咖。這樣的假設使得下圖中的賽局一變成了賽局三,它也有兩個納許均衡:(告白,告白)和(不告白,不告白),其中(不告白,不告白)仍然不是伯瑞多最佳結果,但(告白,告白)卻是。因為這個賽局有一個是伯瑞多最佳結果的納許均衡,它已經不算是囚徒困局,而是一種「協調賽局」了。在這樣的價值假設之下,男女只要有足夠的默契,便容易相互告白而訂下情緣。

Microsoft Word - PD Game

你也許看過「美麗境界」電影但對數學敬而遠之,你甚至連納許的鼎鼎大名都沒聽過,但你知道嗎:你的人際關係中很多你不願意單方面去改變的狀態,包括男女朋友或夫妻關係,不論你喜歡與否,很可能都是「納許均衡」呢?納許的偉大貢獻,便是在概念上釐清了這些狀態的性質,讓我們清楚瞭解它們之所以存在的邏輯,進而使得人類理性行為的預測成為可能。納許雖然死了,但「納許均衡」仍然無所不在於我們的生活中!

有興趣的讀者請進一步參考其他文章:

-----廣告,請繼續往下閱讀-----

原刊載於Tse-min Lin 的部落格

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

1
1

文字

分享

0
1
1
伺服器過熱危機!液冷與 3D VC 技術如何拯救高效運算?
鳥苷三磷酸 (PanSci Promo)_96
・2025/04/11 ・3194字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 高柏科技 合作,泛科學企劃執行。

當我們談論能擊敗輝達(NVIDIA)、Google、微軟,甚至是 Meta 的存在,究竟是什麼?答案或許並非更強大的 AI,也不是更高速的晶片,而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

 2024 年底至 2025 年初,搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機,傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題,但這場「科技 vs. 熱」的對決,才剛剛開始。 

不僅僅是輝達,微軟甚至嘗試將伺服器完全埋入海水中,希望藉由洋流降溫;而更激進的做法,則是直接將伺服器浸泡在冷卻液中,來一場「浸沒式冷卻」的實驗。

-----廣告,請繼續往下閱讀-----

但這些方法真的有效嗎?安全嗎?從大型數據中心到你手上的手機,散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技,一同看看如何用科學破解這場高溫危機!

運算=發熱?為何電腦必然會發熱?

為什麼電腦在運算時溫度會升高呢? 圖/unsplash

這並非新問題,1961年物理學家蘭道爾在任職於IBM時,就提出了「蘭道爾原理」(Landauer Principle),他根據熱力學提出,當進行計算或訊息處理時,即便是理論上最有效率的電腦,還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失,系統的熵就會上升,而隨著熵的增加,也會產生熱能。

換句話說,當計算是不可逆的時候,就像產品無法回收再利用,而是進到垃圾場燒掉一樣,會產生許多廢熱。

要解決問題,得用科學方法。在一個系統中,我們通常以「熱設計功耗」(TDP,Thermal Design Power)來衡量電子元件在正常運行條件下產生的熱量。一般來說,TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量,通常以瓦特(W)為單位。也就是說,TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP,例如AMD的CPU 9950X,TDP是170W,GeForce RTX 5090則高達575W,伺服器用的晶片,則可能動輒千瓦以上。

-----廣告,請繼續往下閱讀-----

散熱不僅是AI伺服器的問題,電動車、儲能設備、甚至低軌衛星,都需要高效散熱技術,這正是高柏科技的專長。

「導熱介面材料(TIM)」:提升散熱效率的關鍵角色

在電腦世界裡,散熱的關鍵就是把熱量「交給」導熱效率高的材料,而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中,晶片表面和散熱片之間並不會完美貼合,表面多少會有細微間隙,而這些縫隙如果藏了空氣,就會變成「隔熱層」,阻礙熱傳導。

為了解決這個問題,需要一種關鍵材料,導熱介面材料(TIM,Thermal Interface Material)。它的任務就是填補這些縫隙,讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」,即使主線有再多車道,如果匝道堵住了,車流還是無法順利進入高速公路。同樣地,如果 TIM 的導熱效果不好,熱量就會卡在晶片與散熱片之間,導致散熱效率下降。

-----廣告,請繼續往下閱讀-----

那麼,要怎麼提升 TIM 的效能呢?很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁,若要更高效的散熱材料,則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成:高導熱粉末(如金屬或陶瓷粉末)與聚合物基質。大部分散熱膏的特點是流動性好,盡可能地貼合表面、填補縫隙。但也因為太「軟」了,受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸,高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後,會出現乾裂或表面變硬。

為了解決這個問題,高柏科技推出了凝膠狀的「導熱凝膠」,說是凝膠,但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄,比較不會熱裂解、壽命也比較長。

OK,到這裡,「匝道」的問題解決了,接下來的問題是:這條散熱高速公路該怎麼設計?你會選擇氣冷、水冷,還是更先進的浸沒式散熱呢?

-----廣告,請繼續往下閱讀-----

液冷與 3D VC 散熱技術:未來高效散熱方案解析

除了風扇之外,目前還有哪些方法可以幫助電腦快速散熱呢?圖/unsplash

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量,也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限,因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷,熱量在經過 TIM 後進入水冷頭,水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好,且增加的體積不大。唯一需要注意的是,萬一元件損壞,可能會因為漏液而損害其他元件,且系統的成本較高。如果你對成本有顧慮,可以考慮另一種方案,「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義,就是把均溫板層層疊起來,變成3D結構。雖然均溫板長得也像是一塊金屬板,原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」,直接翻譯是「蒸氣腔室」。

在均溫板中,會放入容易汽化的工作流體,當流體在熱源處吸收熱量後就會汽化,當熱量被帶走,汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法,最大的特點是:導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻,不會有熱都聚集在入口(熱源處)的情況,能更有效降溫。

-----廣告,請繼續往下閱讀-----

整個 3DVC 的設計,是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯,能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC,就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是,工作流體移動的過程經過設計,因此不用插電,成本僅有水冷的十分之一。但相對的,因為是被動式散熱,其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC,高柏科技一直致力於不斷創新,並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積,高柏科技開發了6項專利技術,涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後,均溫板不僅保有高導熱性,還增強了結構強度,顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步,有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術,將主機板和零件完全泡在不導電的特殊液體中,許多冷卻液會選擇沸點較低的物質,因此就像均溫板一樣,可以透過汽化來吸收掉大量的熱,形成泡泡向上浮,達到快速散熱的效果。

然而,因為水會導電,因此替代方案之一是氟化物。雖然效率差了一些,但至少可以用。然而氟化物的生產或廢棄時,很容易產生全氟/多氟烷基物質 PFAS,這是一種永久污染物,會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液,例如礦物油、其他油品,又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告,請繼續往下閱讀-----

另外,把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等,都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證,相信很快就能推出更強大的散熱模組。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
224 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
2

文字

分享

0
0
2
戰機擾台有效嗎?從賽局理論看中國的「危險邊緣」策略
林澤民_96
・2020/10/06 ・3005字 ・閱讀時間約 6 分鐘 ・SR值 523 ・七年級

-----廣告,請繼續往下閱讀-----

  • 作者/林澤民

最近中國在台海附近頻頻軍演,其戰機也連日騷擾台灣領空。央視主播李紅甚至引前總統馬英九「首戰即終戰」論調出言恐嚇。這明顯的是所謂「危險邊緣」 (brinkmanship) 策略的施展,常見於國際間協商談判的「懦夫賽局」中,是逼對方讓步的有效手段。

這個策略讓對方領會「兵凶戰危」,但其實它的極限是「戰爭邊緣」而不是「戰爭」。 

在「懦夫賽局」中,僵局雙方的的偏好順序都是: 

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我讓步,你堅持)=2
  • 最末:(我堅持,你堅持)=1

換句話說,雙方都希望自己堅持而對方讓步。一方堅持一方讓步是「納許均衡」,但雙方都堅持卻是最壞的結果。

-----廣告,請繼續往下閱讀-----

施展「危險邊緣」策略的一方會使用各種手段讓對方相信自己寧可玉石俱焚也不會讓步。但是這種不理性的威脅有時會讓對方嗤之以鼻。要讓對方深信,必須要在行為上顯示自己願意一步步走向危險邊緣的態勢。

在懸崖上綁著鐵鍊,如何避免一起摔死?

諾貝爾經濟學獎得主湯瑪士.謝林 (Thomas Schelling) 教授是最早提出「危險邊緣」策略的人。他曾在哈佛大學課堂上舉了一個例子:「想像你在懸崖上,腳踝被鐵鍊與另一人的腳踝互相拴住。如果你們兩人有一人讓步,你們就可得到解放,而堅持到底的那人還可以獲得大獎。你要如何說服另一人讓步呢?要知道你能夠做的可就只有威脅他要把他推下懸崖,而那可會讓你們兩人一齊摔死喔!」

謝林對這個問題的答案是:「你開始跳舞,一步一步逼近懸崖。這樣你不用說服他你會做出兩敗俱傷的不理性動作,你只要讓他相信你比他願意承擔發生意外的危險就行了。」

只要讓對方相信你比他更願意承擔發生意外的風險,就可以說服對方讓步。圖/Pexels

謝林把心理學引入賽局理論,是行為經濟學的先驅。他的意思是:因為兵凶戰危,「與汝偕亡」的威脅不容易讓對方深信,但如果你用魯莽的行為表現出你不在乎「擦槍走火」,這種打了折扣的威脅反而較容易取信於人。

-----廣告,請繼續往下閱讀-----

謝林說:「瘋狂可以是惡意地合乎理性」 (“Madness can be wickedly rational.”) 因此,「危險邊緣」的理論常被稱為「瘋子理論」 (Madman Theory) 。

因為雙方都堅持是最壞的結果,施展「危險邊緣」策略的玩家其實就是要對方相信自己是不理性的。當對方相信你瘋了、不可理喻的時候,對方就會讓步。謝林把這種算計稱為「不理性的理性」 (rationality of irrationality) 。

在懸崖邊緣裝瘋賣傻而不真摔需要走鋼索的技巧。

冷戰時期的美國國務卿杜勒斯 (John Foster Dulles) 就說「能做到走向戰爭邊緣而不致真正開戰」是必要的「藝術」。

這種藝術常在電影中被戲劇化。名導演史丹利.庫柏力克 (Stanley Kubrick) 的1964年電影《奇愛博士》 (Dr. Strangelove or: How I Learn to Stop Worrying and Love the Bomb) 便是戲劇化冷戰時期美、蘇雙方「相互保證毀滅」 (mutually assured destruction, MAD) 的黑色喜劇。

片中美方一位發瘋的指揮官下令B–52轟炸機對蘇聯目標投擲氫彈,即使總統及國防部長都無法攔阻。庫柏力克便是因為看了謝林對小說《紅色警戒》 (Red Alert) 的評論而改編小說拍攝成電影,他並邀謝林擔任此片顧問。

-----廣告,請繼續往下閱讀-----
電影《奇愛博士》美方對蘇聯投擲氫彈。圖/flickr

1962年古巴飛彈危機的時候,赫魯雪夫在古巴部署核彈及甘迺迪對古巴進行封鎖更是「危險邊緣」策略的實例。羅杰。唐納森 (Roger Donaldson) 主導的2000年電影《驚爆13天》(Thirteen Days) 中蘇聯貨輪在美國艦隊發射魚雷之前迴轉可以說是此一策略的經典意像。

電影《驚爆13天》(Thirteen Days)

前國安會秘書長蘇起說中國會「小打」台灣。蘇起寫過一本叫《危險邊緣》的書分析「兩國論」、「一邊一國」之後的兩岸關係,他是懂得「危險邊緣」策略的。他的意思應該是說中國會以「小打」來「舞」向戰爭邊緣,冀望不必全面開戰就逼使台灣讓步。

甚麼是「最壞的結果」?

但是「危險邊緣」要奏效有一個前提,那就是雙方的對峙必須是「懦夫賽局」。

如果對峙的局面是「囚徒困局」,這策略不會有效。

-----廣告,請繼續往下閱讀-----

在「囚徒困局」中,雙方的的偏好順序都是:

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我堅持,你堅持)=2
  • 最末:(我讓步,你堅持)=1

其與「懦夫賽局」最大的不同在於(我讓步,你堅持)是最壞的結果,比玉石俱焚還糟糕。

當參賽雙方感知到讓步會帶來最壞的結果的時候,堅持下去是合乎理性的優勝策略,而雙方都堅持是納許均衡。

我教賽局的時候,常引用電視遊戲節目《金球》來作為例子。詳細請參考拙作金球的囚徒

這個遊戲中參賽者雙方可以選擇「平分」(讓步)或「獨吞」(堅持)。如果兩人中一人選擇獨吞另而一人選擇平分,則獨吞者獨享巨額獎金,平分者抱蛋;如果兩人都選擇平分,則各得一半獎金;如果兩人均選擇獨吞,則兩人均抱蛋。

-----廣告,請繼續往下閱讀-----

這個遊戲是「囚徒困局」,因為:

(我獨吞,你平分)>(我平分,你平分)>(我獨吞,你獨吞)>(我平分,你獨吞)

有一次節目中,參賽者之一在賽前向對方做了兩項承諾:第一,他一定會選擇獨吞(堅持);第二,如果對方選擇平分(讓步)而由他贏得全部獎金,他會把獎金分一半給對方。

雖然主持人一再提醒賽前承諾不具法律效力、不可輕信,這位參賽者的口頭承諾卻達到了兩個效果:

-----廣告,請繼續往下閱讀-----

第一、他平分獎金的承諾,只要對方相信有一點點可能性,對方就會認為(我平分,你獨吞)的期望值比(我獨吞,你獨吞)還要好。也就是在他的心中,賽局已經悄悄地從「囚犯困境」轉變為「懦夫賽局」。

第二、他堅持會選擇獨吞的承諾,正是「危險邊緣」策略。當對方把賽局認知為「懦夫賽局」的時候,這策略可以奏效。

果然,在這次賽局中,對方選擇了平分。而這位聰明的玩家也出乎意料地選擇了平分,用合乎賽局規則的方式履行了他平分獎金的承諾。遊戲全程請見:

電視遊戲節目《金球》 (Golden Balls)

我用這例子來說明:中國要用「危險邊緣」策略來逼台灣讓步是不夠的。只要台灣民意認為讓中國統治是最壞的結果,「危險邊緣」策略便不會奏效。

-----廣告,請繼續往下閱讀-----

傳統中國所謂「大國」要能做到「近者悅,遠者來」。 中國要做大國,恐怕還得學學《金球》遊戲節目的聰明玩家!

-----廣告,請繼續往下閱讀-----
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
0

文字

分享

0
2
0
媒體在臉書上的「公有地的悲劇」|囚徒困局系列(九)
林澤民_96
・2017/03/07 ・5588字 ・閱讀時間約 11 分鐘 ・SR值 588 ・九年級

-----廣告,請繼續往下閱讀-----

僅以本文紀念湯瑪斯.謝林

  • 作者:林澤民(奧斯汀德州大學政府系)、陳怡璇(奧斯汀德州大學新聞學院)

source:Facebook Media

To Be or Not to Be?媒體在臉書上的抉擇

近年來,臉書成為讀者看新聞的主要管道。媒體在臉書上分享文章鏈結,從臉書上引導流量回到自己的新聞網站。尤其是當自己網站上流量不多的時候,小編們就趕快在粉絲專頁上分享文章,很快就可以把臉書上的流量導回自家網站。臉書也非省油的燈,不願媒體把自己的用戶導離開臉書,仗勢自己廣大的用戶群,推出即時文章(instant article),與之合作的媒體,把內容免費提供在臉書上以換取跟臉書的廣告拆帳與珍貴的用戶資料(透過臉書上的用戶資料,就能夠更精準地賣廣告),如此,臉書用戶看新聞,不需再離開臉書,而臉書擁有這些免費內容,不但吸引更多用戶,也把每個用戶成功地留在自己的平台上。

媒體紛紛加入即時文章引發不少質疑與憂心:當新聞媒體把自己最珍貴的資產──內容──免費貢獻在臉書上, 等於棄守自家的網站流量,把自己的讀者帶到臉書後,恐怕以後也帶不走了,因為讀者已經習慣在臉書上看新聞。當媒體的經濟命脈依附在臉書之上,以後臉書更改規則,媒體也不得不從。縱使擔憂聲浪不小,所有媒體仍舊前仆後繼的加入即時文章。這種明知行動有後果卻不計後果行動的狀況,可用賽局理論中的多人囚徒困局來解釋。本文先說明賽局理論的概念、雙人囚徒困局的成立條件、多人囚徒困局形成的條件、最後用多人囚徒困局理論來看媒體所面臨的困境。

賽局理論及囚徒困局

賽局理論的基本概念:

-----廣告,請繼續往下閱讀-----

優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
困局:納許均衡不是伯瑞多最佳結果的局面。

二人囚徒困局的收益可用下列矩陣呈現:

  • A、B:參賽者
  • C、D:策略;C = Cooperate(合作),D = Defect(不合作或背叛)
  • TA, RA, PA, SA:參賽者 A 在表中各種策略組合下的收益
  • TB, RB, PB, SB:參賽者 B 在表中各種策略組合下的收益
  • T = Tempation(誘惑),R = Reward(獎賞), P = Punishment(懲罰),S = Sucker’s Payoff(傻瓜收益)

當 A、B 都只為自己的利益著想,而且彼此無法達成可信承諾時,如果 T > R > P > S 對 A、B 都成立,則 D 是兩位參賽者的優勝策略,相互背叛是納許均衡,可是這個唯一的納許均衡並不是一個伯瑞多最佳結果,因此賽局是囚徒困局

公有地的悲劇

討論媒體在臉書上的策略互動之前,讓我們先看看下面這個雙人賽局:

-----廣告,請繼續往下閱讀-----

在這個賽局中,參賽者從公有資源獲得屬於自己的利益。如果他們合作——有節制、不過度使用公有資源——他們都得到利益 b。如果一個參賽者合作、另一個參賽者不合作——過度使用公有資源——不合作者可以獲得較大的利益 B,可是同時卻造成了 -e 的外部效應,例如使得資源之永續性減弱,而這外部效應兩人都得承擔。當兩個參賽者都不合作時,兩人都都得到較大利益 B,但同時也得承擔兩份外部效應(-2e)。

這裡很容易證明當 2e > B-b > e 時,T > R > P > S 對 A、B 都成立,因此在這個條件下,抽取公有資源的問題是一個囚徒困局。這個困局就是雙人版的所謂「公有地的悲劇」。當個人過度使用公有資源時,雖然可以比有節制地使用能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。這個情況宛如一個「性格決定命運」的希臘悲劇:自私的「理性」驅使著每一個人無情地走向互相背叛的納許均衡,他們明知這個狀態不是伯瑞多最佳結果,卻有如陷於泥淖難以自拔,無法憑一己之力來改變資源毀滅的整體命運

個人過度使用公有資源時,雖然能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。圖/By verifex @ flickr, CC BY-NC 2.0

我們認為這正是新聞媒體在臉書上所面臨的狀態。

-----廣告,請繼續往下閱讀-----

在這裡,公共資源是臉書上的讀者群。媒體之間的合作策略是有節制地使用臉書——只提供鏈結而不提供內容。當媒體合作時,他們得到較小的利益 b 而不必擔心後果。當媒體背叛——在臉書上提供新聞內容——他們可以得到較大的利益 B(雖然損失自家網站的讀者,但在臉書上吸引到的讀者大於損失),可是同時卻造成了臉書之外整個新聞媒體讀者的流失。這個代價 -e 是個外部效應,因為它不但影響到分享新聞內容的媒體自己,也因為助長讀者對臉書的依賴而影響到整個產業。因為當一家媒體提供新聞內容給臉書之後,臉書使用者不需要離開臉書就可以看到新聞,這些使用者也不再造訪其他媒體的網站,而影響其他媒體網站的讀者數量。為了避免被提供內容給臉書的媒體影響到,各家媒體因此跟進,長期以降,各家媒體必須依賴臉書觸及讀者,傷害整體產業的經濟自主。

湯瑪斯.謝林的多人囚徒困局

要把上面的雙人賽局擴大成多人賽局,我們必須要先了解多人囚徒困局的定義。這是 2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling)的偉大貢獻之一。以下的討論見於他的 《微觀動機與宏觀行為》一書。

上圖中,縱軸(Y)代表收益,橫軸(X)代表除了自己以外合作的人數,紅線代表不合作的收益,綠線代表合作的收益。這圖有四項特徵:

1. 每個參賽者均有兩個策略選擇:合作或背叛(不合作)。
2. 不論其他有多少人合作,對自己而言,不合作的收益總要比合作的收益來得高。這也就是說,不論其他人合作或不合作,不合作是自己的優勝策略,而大家相互背叛的「原始狀態」是納許均衡。
3. 紅線跟綠線均隨著合作人數的增加而升高,也就是說不論自己合作與否,「傻瓜」越多越好。
4. 綠線隨著合作人數增加而升高時會超過原始狀態,如 K 點所示。當傻瓜的總人數(K+1)多到這個程度時,他們可以說是一個「可行的聯盟」(viable coalition)。這時雖然不合作還是比合作的收益要來得高,但傻瓜們至少可以說他們的收益比相互背叛時好。這個條件成立的充分且必要條件是所有參賽者都合作時的收益高於原始狀態的收益。我們把所有參賽者都合作的狀態稱為「烏托邦」。烏托邦的可行性代表原始狀態的納許均衡不是伯瑞多最佳結果。

-----廣告,請繼續往下閱讀-----

因為上述條件蘊含了唯一的納許均衡不是伯瑞多最佳結果,湯瑪斯.謝林把符合以上特徵的人際競合關係界定為多人囚徒困局。以下我們檢驗多家媒體在臉書的策略互動為公有地悲劇型態多人囚徒困局的條件。

媒體在臉書之公有地的悲劇

我們假設市場上共有 n 家媒體。因為每家媒體在決定自己的策略時,必須考量自己以外有幾家媒體會合作(只提供鏈結、不提供免費內容給臉書),我們假設這個數目為 x。

根據以上的假設,每家媒體合作或不合作的收益作為 x 的函數可以分別定出如下:

.不合作的收益為:u(D|x) = B-(n-x)e = B-ne+xe
.合作的收益為:u(C|x) = b-(n-(x+1))e = b-(n-1)e+xe

-----廣告,請繼續往下閱讀-----

由此我們可以演繹出幾個有用的結果:

.在原始狀態,也就是大家都不合作時,媒體的收益為:u(D|0) = B-ne
.在烏托邦狀態,也就是大家都合作時,媒體的收益為:u(C|n-1) = b
.當 x 固定時,不合作與合作的收益差別為:u(D|x)-u(C|x) = B-b-e

我們現在可以根據謝林的多人囚徒困局四條件來分析這個賽局了:

1. 每家媒體有兩種策略:合作(不提供免費內容給臉書)或不合作(提供免費內容給臉書)
2. 因為 u(D|x)-u(C|x) = B-b-e,我們可以推論當 B-b > e 時,不論 x 是多少,也就是不論自己以外有幾家媒體合作,不合作會比合作為媒體帶來更大的收益。B-b > e 是不合作為優勝策略的條件。
3. 因為 u(D|x) 與 u(C|x) 的式子中 x 的係數 e 為正值,也就是 u(D|x) 與 u(C|x) 均與 x 成正比,當越多人合作時,媒體不論合作或不合作,其收益都會越高。
4. 如果 u(C|n-1) = b 大於 u(D|0) = B-ne,也就是當 b-(B-ne) > 0 或 ne > B-b 時,烏托邦狀態的收益高於原始狀態的收益。因此,ne > B-b 是原始狀態不是伯瑞多最佳結果的充分且必要條件。

-----廣告,請繼續往下閱讀-----

綜合以上四點,我們可以結論:當 ne > B-b > e 時,不合作是每個個別媒體的優勝策略,大家都不合作是納許均衡,可是這是一個不是伯瑞多最佳結果的納許均衡。根據謝林的定義,在這個條件下,媒體的臉書困局是一個多人囚徒困局。他們的處境正是一個公有地的悲劇。

ne > B-b > e 這個條件意指提供免費內容給臉書所帶來的額外收益(B-b)要大於媒體新聞網站讀者人數下降的代價(e),可是它同時必須小於整個產業都提供內容給臉書所造成的總代價(ne)。如果收益小於或等於個別代價(B-b≤e),提供內容不划算,合作才是優勝策略;如果收益大於或等於總代價(B-b≥ne),原始狀態比烏托邦還好,是伯瑞多最佳結果,沒有困局可言;這兩種情況都不是囚徒困局。請注意:當 n = 2 時, ne > B-b > e 這個條件正與上面所舉的雙人囚徒困局的條件相符合。

下面進一步申論 ne > B-b > e 這個條件。

第一, 提供免費內容給臉書帶來的的額外利益超過個別媒體之外部效應:B-b > e

-----廣告,請繼續往下閱讀-----

華盛頓郵報曾經表示,提供免費內容給臉書,是預期透過臉書,他們可以觸及更多讀者,而有機會把臉書上的使用者變成自己的讀者(Marshall, 2015)。可見,新聞媒體自己的網站所能吸引到的讀者數量已遠遠不及臉書上的使用者。只要文章一放在臉書上,就可以吸引比在自己網站更多讀者。因此,能夠立刻吸引到讀者的這個利益,與長期依附臉書會失去自己網站上讀者的代價對照考量,當然先選擇解決目前的困境,長遠的負面影響,也是以後再說。

第二,提供免費內容給臉書帶來的的額外利益低於集體總外部效應:ne > B-b

依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。圖/facebook

提供免費內容給臉書得到的是即時利益然而付出的卻是整體新聞業的經濟自主與新聞自主,這也是許多專家大聲疾呼,與臉書打交道千萬三思(Riedmann, 2015)。 吸引媒體提供免費內容如同木馬屠城:臉書先以非常優厚的條件(廣告拆帳與用戶資料)交換媒體的內容。從此讀者透過臉書看新聞,就不再造訪媒體自己的網站,所以提供免費內容給臉書,等於放棄自己網站上的流量。當媒體的經濟命脈建立在另一間大企業上,等同於交出自己的經濟自主權。媒體在臉書上吸引到的讀者仍舊屬於臉書的用戶,等於失去臉書,媒體就失去讀者。以後媒體的廣告收入與讀者資料,都由臉書掌握。臉書一旦更改運算法,各家媒體就要立刻改變新聞生產策略以迎合運算法,才能確保自己的內容能夠推播到更多讀者面前。臉書成為真正的守門人,由運算法決定誰可以看到什麼內容。依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。

這場賽局中,新聞媒體用自己最珍貴的資產──新聞內容──交換短期的讀者數量,長期來看,犧牲的卻是經濟自主與新聞自主。這也是為什麼此舉引起一片憂心,認為與臉書的這場交易如同一場鴻門宴。媒體或許心裡都有數,拿免費新聞吸引讀者是飲鴆止渴,只是死得慢,但提供免費內容給臉書,就有立即經濟收益,也難再考慮之後的隱憂,因為隱憂畢竟只是「隱憂」,現在不加入,失去的則是眼前的廣告收入。在這樣的狀況下,即使知道或許不該加入,卻也不得不交出自己最珍貴的資產,冒著自主性的風險,交換即時利益。然而在這場媒體間的集體困局中,臉書成為最大贏家,獲取更多免費內容,吸引更多用戶,等於吸收他人的資產(內容與讀者),壯大自己的王國。

紀念湯瑪斯.謝林

謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。圖/nobelprize.org

2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling, 1921-2016)在 2016 年 12 月過世了。謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。雖然他最為人所知的是《衝突的策略》一書,特別是其中所論述「可信的承諾」(credible commitment)這一概念在冷戰年代國際關係上所發揮的影響,我卻偏愛他另一本著作:《微觀動機與宏觀行為》。我在學生時代讀他這本書,深深地為其中一個先驅性的「代理人基模型」(agent-based model)──個別居民無害的選擇如何在與鄰居互動的過程中造成社區種族隔離的均衡狀態──所吸引。及到大學教書,第一年即採用這本書開授「人類理性行為」的課程。

二十幾年來,我每次向學生介紹書中「多人囚徒困局」(multi-person prisoner’s dilemma)的理論時,仍然深深為謝林的智慧所激勵。這不只是因為模型本身既優雅又含意深遠,也是因為它所能洞燭的行為困境,從政治、經濟、社會、乃至於國際關係、人際關係幾乎無所不包。有不少人尊謝林為當前顯學行為經濟學之父,我深為同意。本文用一種特殊形態的多人囚徒困局──「公有地的悲劇」(the tragedy of the commons)──來詮釋新聞媒體在臉書上競合的困境。寫作中想到謝林對學術界、對我個人的深遠影響,不禁感懷不已。

原刊載於Tse-min Lin 的部落格

參考書目:

-----廣告,請繼續往下閱讀-----
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
0

文字

分享

0
0
0
告白的遊戲:紀念約翰‧納許|囚徒困局系列(六)
林澤民_96
・2015/05/26 ・2399字 ・閱讀時間約 4 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

f_12280902_1

前幾天才結束春季的「人類理性行為」課程,沒想到整個學期和學生討論「納許均衡」,而約翰‧納許就驟然離世了。

紀念納許,我覺得最好的方法是讓大家瞭解他的賽局理論如何地可以用在我們日常生活中的各種面向。我的「人類理性行為」課程規定每個學生要交三篇論文,每篇要講一個真實或虛構的、包含「囚徒困局」的故事,然後用賽局理論加以分析。

第一篇只須是簡單的二人單次囚徒困局,第二篇必須是二人重複性囚徒困局,第三篇則須是多人囚徒困局。雖然大學部學生的論文大都乏善可陳,但每次總有幾篇文章有令人驚艷的創意。這些文章間或有關市場經濟、國際關係,但大多數是與學生個人生活密切相關的人際關係,特別是男女關係。多年來,學生把囚徒困局的理論應用到把妹問題、小三問題、性愛問題等等,令我目不暇給,學到了很多年輕人的次文化。

這裡介紹一個今年一位學生提出的「告白遊戲」來闡釋納許均衡此一概念的實用性。關於賽局理論相關概念的意義,這裡先簡單介紹,詳細請參考文後所列我部落格已發表的幾篇文章。

-----廣告,請繼續往下閱讀-----
  • 優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
  • 困局:納許均衡不是伯瑞多最佳狀態的局面。

下圖三個賽局中參賽者均為交往中的男女二人,每人可以選擇「告白」或「不告白」兩種策略。這裡告白意味合作,而不告白意味不合作。兩人的策略選擇交叉相乘,共得四種結果。每一結果以男先女後為序,是為:(不告白,告白),(告白,告白),(不告白,不告白),(告白,不告白)。這四種結果對男女二人各有不同的價值,在賽局一中,我們對這些價值初步假設如下:

如果我不告白而你告白,我可以享受玩咖的樂趣而不必負任何責任,這個結果對我最有利,其價值可以稱之為「誘惑」(Temptation)。用數學式子表示:T=玩咖

如果雙方都告白,兩人都可以享受愛情的甜蜜,但也要負起相當責任(例如不能再劈腿了)。這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward):R=♥

如果雙方都不告白,雙方各自心中忐忑,充滿了狐疑,不知道對方究竟想要怎樣,自己下一步該怎麼走。這個結果算是現狀,其價值可以標準化為0,稱之為「懲罰」(Punishment):P=0

-----廣告,請繼續往下閱讀-----

最後,如果我告白而你不告白,我本將心向明月,誰知明月照溝渠,真是令人感到委屈恥辱!這個結果對我最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff):S=屈辱

在這些價值假設之下,大家大概可以同意T>R>P>S,也就是:玩咖>♥>0>屈辱。這個數學關係的成立,使得第一個賽局符合了囚徒困局的條件。簡言之,因為玩咖的樂趣比要負起責任的愛情好,而且現狀比屈辱好,不論你告白不告白,對我而言不告白都要比告白來得有利,而這對雙方皆然。因此,不告白是男女雙方的所謂「優勝策略」,也就是雙方均會選擇不告白。

這個(不告白,不告白)的策略組合便是「納許均衡」的一個例子。當男女參賽者陷於這個結果中,任何人都不願意單方面改變策略,因為如果你單方面改變不告白策略而逕行告白,你只會讓對方自詡為玩咖而沾沾自喜,而自己得忍受當傻瓜的屈辱。「納許均衡」是一個穩定的結果,理性的參賽者在「納許均衡」的結果中不會單方面改變策略。在告白的遊戲中,男女雙方會陷於(不告白,不告白)的泥淖裡不能自拔。

這個賽局也是「囚徒困局」的一個例子。很明顯的,因為♥>0,男女雙方其實都喜歡相互告白甚於相互不告白,但又不願意單獨採取行動。換句話說,在(不告白,不告白)的納許均衡中,如果雙方都願意,雙方的價值都有同時改進的空間。這意味此賽局唯一的納許均衡不是一個「伯瑞多最佳結果」,這就是「囚徒困局」的定義。在上述價值假設之下,告白遊戲是一個囚徒困局。

-----廣告,請繼續往下閱讀-----

Microsoft Word - PD Game

以上是我學生的第一篇論文所分析的,但也許大家會質疑:那為什麼交往中的男女儘有人會告白呢?這牽涉到價值假設的問題。比如有人太過於為對方著迷,不論對方回應與否,心甘情願地自動告白依附,像那首《在那遙遠的地方》所唱的:「我願做一隻小羊跟在她身旁,我願她拿著細細的皮鞭不斷輕輕打在我身上」。在這樣的價值假設之下,我告白而你不告白的價值S便不是屈辱,而是S=心甘情願>P=0了。這樣的告白遊戲,便變成了下圖中的賽局二。因為T>R>S>P,這已不是「囚徒困局」而是「懦夫賽局」了。「懦夫賽局」有兩個納許均衡:(不告白,告白)和(告白,不告白),其中哪一個會發生,就不是賽局理論所能置喙的了。

Microsoft Word - PD Game

當然,也有人會認為規規矩矩從一而終地談戀愛比當玩咖好,也就是S=♥>T=玩咖。這樣的假設使得下圖中的賽局一變成了賽局三,它也有兩個納許均衡:(告白,告白)和(不告白,不告白),其中(不告白,不告白)仍然不是伯瑞多最佳結果,但(告白,告白)卻是。因為這個賽局有一個是伯瑞多最佳結果的納許均衡,它已經不算是囚徒困局,而是一種「協調賽局」了。在這樣的價值假設之下,男女只要有足夠的默契,便容易相互告白而訂下情緣。

Microsoft Word - PD Game

你也許看過「美麗境界」電影但對數學敬而遠之,你甚至連納許的鼎鼎大名都沒聽過,但你知道嗎:你的人際關係中很多你不願意單方面去改變的狀態,包括男女朋友或夫妻關係,不論你喜歡與否,很可能都是「納許均衡」呢?納許的偉大貢獻,便是在概念上釐清了這些狀態的性質,讓我們清楚瞭解它們之所以存在的邏輯,進而使得人類理性行為的預測成為可能。納許雖然死了,但「納許均衡」仍然無所不在於我們的生活中!

有興趣的讀者請進一步參考其他文章:

-----廣告,請繼續往下閱讀-----

原刊載於Tse-min Lin 的部落格

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。