Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

告白的遊戲:紀念約翰‧納許|囚徒困局系列(六)

林澤民_96
・2015/05/26 ・2399字 ・閱讀時間約 4 分鐘 ・SR值 521 ・七年級

-----廣告,請繼續往下閱讀-----

f_12280902_1

前幾天才結束春季的「人類理性行為」課程,沒想到整個學期和學生討論「納許均衡」,而約翰‧納許就驟然離世了。

紀念納許,我覺得最好的方法是讓大家瞭解他的賽局理論如何地可以用在我們日常生活中的各種面向。我的「人類理性行為」課程規定每個學生要交三篇論文,每篇要講一個真實或虛構的、包含「囚徒困局」的故事,然後用賽局理論加以分析。

第一篇只須是簡單的二人單次囚徒困局,第二篇必須是二人重複性囚徒困局,第三篇則須是多人囚徒困局。雖然大學部學生的論文大都乏善可陳,但每次總有幾篇文章有令人驚艷的創意。這些文章間或有關市場經濟、國際關係,但大多數是與學生個人生活密切相關的人際關係,特別是男女關係。多年來,學生把囚徒困局的理論應用到把妹問題、小三問題、性愛問題等等,令我目不暇給,學到了很多年輕人的次文化。

這裡介紹一個今年一位學生提出的「告白遊戲」來闡釋納許均衡此一概念的實用性。關於賽局理論相關概念的意義,這裡先簡單介紹,詳細請參考文後所列我部落格已發表的幾篇文章。

-----廣告,請繼續往下閱讀-----
  • 優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
  • 納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
  • 伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
  • 困局:納許均衡不是伯瑞多最佳狀態的局面。

下圖三個賽局中參賽者均為交往中的男女二人,每人可以選擇「告白」或「不告白」兩種策略。這裡告白意味合作,而不告白意味不合作。兩人的策略選擇交叉相乘,共得四種結果。每一結果以男先女後為序,是為:(不告白,告白),(告白,告白),(不告白,不告白),(告白,不告白)。這四種結果對男女二人各有不同的價值,在賽局一中,我們對這些價值初步假設如下:

如果我不告白而你告白,我可以享受玩咖的樂趣而不必負任何責任,這個結果對我最有利,其價值可以稱之為「誘惑」(Temptation)。用數學式子表示:T=玩咖

如果雙方都告白,兩人都可以享受愛情的甜蜜,但也要負起相當責任(例如不能再劈腿了)。這個結果的價值,對雙方是一樣的,可以稱之為「獎勵」(Reward):R=♥

如果雙方都不告白,雙方各自心中忐忑,充滿了狐疑,不知道對方究竟想要怎樣,自己下一步該怎麼走。這個結果算是現狀,其價值可以標準化為0,稱之為「懲罰」(Punishment):P=0

-----廣告,請繼續往下閱讀-----

最後,如果我告白而你不告白,我本將心向明月,誰知明月照溝渠,真是令人感到委屈恥辱!這個結果對我最不利,其價值可以稱之為「傻瓜的報酬」(Sucker’s Payoff):S=屈辱

在這些價值假設之下,大家大概可以同意T>R>P>S,也就是:玩咖>♥>0>屈辱。這個數學關係的成立,使得第一個賽局符合了囚徒困局的條件。簡言之,因為玩咖的樂趣比要負起責任的愛情好,而且現狀比屈辱好,不論你告白不告白,對我而言不告白都要比告白來得有利,而這對雙方皆然。因此,不告白是男女雙方的所謂「優勝策略」,也就是雙方均會選擇不告白。

這個(不告白,不告白)的策略組合便是「納許均衡」的一個例子。當男女參賽者陷於這個結果中,任何人都不願意單方面改變策略,因為如果你單方面改變不告白策略而逕行告白,你只會讓對方自詡為玩咖而沾沾自喜,而自己得忍受當傻瓜的屈辱。「納許均衡」是一個穩定的結果,理性的參賽者在「納許均衡」的結果中不會單方面改變策略。在告白的遊戲中,男女雙方會陷於(不告白,不告白)的泥淖裡不能自拔。

這個賽局也是「囚徒困局」的一個例子。很明顯的,因為♥>0,男女雙方其實都喜歡相互告白甚於相互不告白,但又不願意單獨採取行動。換句話說,在(不告白,不告白)的納許均衡中,如果雙方都願意,雙方的價值都有同時改進的空間。這意味此賽局唯一的納許均衡不是一個「伯瑞多最佳結果」,這就是「囚徒困局」的定義。在上述價值假設之下,告白遊戲是一個囚徒困局。

-----廣告,請繼續往下閱讀-----

Microsoft Word - PD Game

以上是我學生的第一篇論文所分析的,但也許大家會質疑:那為什麼交往中的男女儘有人會告白呢?這牽涉到價值假設的問題。比如有人太過於為對方著迷,不論對方回應與否,心甘情願地自動告白依附,像那首《在那遙遠的地方》所唱的:「我願做一隻小羊跟在她身旁,我願她拿著細細的皮鞭不斷輕輕打在我身上」。在這樣的價值假設之下,我告白而你不告白的價值S便不是屈辱,而是S=心甘情願>P=0了。這樣的告白遊戲,便變成了下圖中的賽局二。因為T>R>S>P,這已不是「囚徒困局」而是「懦夫賽局」了。「懦夫賽局」有兩個納許均衡:(不告白,告白)和(告白,不告白),其中哪一個會發生,就不是賽局理論所能置喙的了。

Microsoft Word - PD Game

當然,也有人會認為規規矩矩從一而終地談戀愛比當玩咖好,也就是S=♥>T=玩咖。這樣的假設使得下圖中的賽局一變成了賽局三,它也有兩個納許均衡:(告白,告白)和(不告白,不告白),其中(不告白,不告白)仍然不是伯瑞多最佳結果,但(告白,告白)卻是。因為這個賽局有一個是伯瑞多最佳結果的納許均衡,它已經不算是囚徒困局,而是一種「協調賽局」了。在這樣的價值假設之下,男女只要有足夠的默契,便容易相互告白而訂下情緣。

Microsoft Word - PD Game

你也許看過「美麗境界」電影但對數學敬而遠之,你甚至連納許的鼎鼎大名都沒聽過,但你知道嗎:你的人際關係中很多你不願意單方面去改變的狀態,包括男女朋友或夫妻關係,不論你喜歡與否,很可能都是「納許均衡」呢?納許的偉大貢獻,便是在概念上釐清了這些狀態的性質,讓我們清楚瞭解它們之所以存在的邏輯,進而使得人類理性行為的預測成為可能。納許雖然死了,但「納許均衡」仍然無所不在於我們的生活中!

有興趣的讀者請進一步參考其他文章:

-----廣告,請繼續往下閱讀-----

原刊載於Tse-min Lin 的部落格

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

0
2

文字

分享

0
0
2
戰機擾台有效嗎?從賽局理論看中國的「危險邊緣」策略
林澤民_96
・2020/10/06 ・3005字 ・閱讀時間約 6 分鐘 ・SR值 523 ・七年級

  • 作者/林澤民

最近中國在台海附近頻頻軍演,其戰機也連日騷擾台灣領空。央視主播李紅甚至引前總統馬英九「首戰即終戰」論調出言恐嚇。這明顯的是所謂「危險邊緣」 (brinkmanship) 策略的施展,常見於國際間協商談判的「懦夫賽局」中,是逼對方讓步的有效手段。

這個策略讓對方領會「兵凶戰危」,但其實它的極限是「戰爭邊緣」而不是「戰爭」。 

在「懦夫賽局」中,僵局雙方的的偏好順序都是: 

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我讓步,你堅持)=2
  • 最末:(我堅持,你堅持)=1

換句話說,雙方都希望自己堅持而對方讓步。一方堅持一方讓步是「納許均衡」,但雙方都堅持卻是最壞的結果。

-----廣告,請繼續往下閱讀-----

施展「危險邊緣」策略的一方會使用各種手段讓對方相信自己寧可玉石俱焚也不會讓步。但是這種不理性的威脅有時會讓對方嗤之以鼻。要讓對方深信,必須要在行為上顯示自己願意一步步走向危險邊緣的態勢。

在懸崖上綁著鐵鍊,如何避免一起摔死?

諾貝爾經濟學獎得主湯瑪士.謝林 (Thomas Schelling) 教授是最早提出「危險邊緣」策略的人。他曾在哈佛大學課堂上舉了一個例子:「想像你在懸崖上,腳踝被鐵鍊與另一人的腳踝互相拴住。如果你們兩人有一人讓步,你們就可得到解放,而堅持到底的那人還可以獲得大獎。你要如何說服另一人讓步呢?要知道你能夠做的可就只有威脅他要把他推下懸崖,而那可會讓你們兩人一齊摔死喔!」

謝林對這個問題的答案是:「你開始跳舞,一步一步逼近懸崖。這樣你不用說服他你會做出兩敗俱傷的不理性動作,你只要讓他相信你比他願意承擔發生意外的危險就行了。」

只要讓對方相信你比他更願意承擔發生意外的風險,就可以說服對方讓步。圖/Pexels

謝林把心理學引入賽局理論,是行為經濟學的先驅。他的意思是:因為兵凶戰危,「與汝偕亡」的威脅不容易讓對方深信,但如果你用魯莽的行為表現出你不在乎「擦槍走火」,這種打了折扣的威脅反而較容易取信於人。

-----廣告,請繼續往下閱讀-----

謝林說:「瘋狂可以是惡意地合乎理性」 (“Madness can be wickedly rational.”) 因此,「危險邊緣」的理論常被稱為「瘋子理論」 (Madman Theory) 。

因為雙方都堅持是最壞的結果,施展「危險邊緣」策略的玩家其實就是要對方相信自己是不理性的。當對方相信你瘋了、不可理喻的時候,對方就會讓步。謝林把這種算計稱為「不理性的理性」 (rationality of irrationality) 。

在懸崖邊緣裝瘋賣傻而不真摔需要走鋼索的技巧。

冷戰時期的美國國務卿杜勒斯 (John Foster Dulles) 就說「能做到走向戰爭邊緣而不致真正開戰」是必要的「藝術」。

這種藝術常在電影中被戲劇化。名導演史丹利.庫柏力克 (Stanley Kubrick) 的1964年電影《奇愛博士》 (Dr. Strangelove or: How I Learn to Stop Worrying and Love the Bomb) 便是戲劇化冷戰時期美、蘇雙方「相互保證毀滅」 (mutually assured destruction, MAD) 的黑色喜劇。

片中美方一位發瘋的指揮官下令B–52轟炸機對蘇聯目標投擲氫彈,即使總統及國防部長都無法攔阻。庫柏力克便是因為看了謝林對小說《紅色警戒》 (Red Alert) 的評論而改編小說拍攝成電影,他並邀謝林擔任此片顧問。

-----廣告,請繼續往下閱讀-----
電影《奇愛博士》美方對蘇聯投擲氫彈。圖/flickr

1962年古巴飛彈危機的時候,赫魯雪夫在古巴部署核彈及甘迺迪對古巴進行封鎖更是「危險邊緣」策略的實例。羅杰。唐納森 (Roger Donaldson) 主導的2000年電影《驚爆13天》(Thirteen Days) 中蘇聯貨輪在美國艦隊發射魚雷之前迴轉可以說是此一策略的經典意像。

電影《驚爆13天》(Thirteen Days)

前國安會秘書長蘇起說中國會「小打」台灣。蘇起寫過一本叫《危險邊緣》的書分析「兩國論」、「一邊一國」之後的兩岸關係,他是懂得「危險邊緣」策略的。他的意思應該是說中國會以「小打」來「舞」向戰爭邊緣,冀望不必全面開戰就逼使台灣讓步。

甚麼是「最壞的結果」?

但是「危險邊緣」要奏效有一個前提,那就是雙方的對峙必須是「懦夫賽局」。

如果對峙的局面是「囚徒困局」,這策略不會有效。

-----廣告,請繼續往下閱讀-----

在「囚徒困局」中,雙方的的偏好順序都是:

  • 最高:(我堅持,你讓步)=4
  • 次高:(我讓步,你讓步)=3
  • 第三:(我堅持,你堅持)=2
  • 最末:(我讓步,你堅持)=1

其與「懦夫賽局」最大的不同在於(我讓步,你堅持)是最壞的結果,比玉石俱焚還糟糕。

當參賽雙方感知到讓步會帶來最壞的結果的時候,堅持下去是合乎理性的優勝策略,而雙方都堅持是納許均衡。

我教賽局的時候,常引用電視遊戲節目《金球》來作為例子。詳細請參考拙作金球的囚徒

這個遊戲中參賽者雙方可以選擇「平分」(讓步)或「獨吞」(堅持)。如果兩人中一人選擇獨吞另而一人選擇平分,則獨吞者獨享巨額獎金,平分者抱蛋;如果兩人都選擇平分,則各得一半獎金;如果兩人均選擇獨吞,則兩人均抱蛋。

-----廣告,請繼續往下閱讀-----

這個遊戲是「囚徒困局」,因為:

(我獨吞,你平分)>(我平分,你平分)>(我獨吞,你獨吞)>(我平分,你獨吞)

有一次節目中,參賽者之一在賽前向對方做了兩項承諾:第一,他一定會選擇獨吞(堅持);第二,如果對方選擇平分(讓步)而由他贏得全部獎金,他會把獎金分一半給對方。

雖然主持人一再提醒賽前承諾不具法律效力、不可輕信,這位參賽者的口頭承諾卻達到了兩個效果:

-----廣告,請繼續往下閱讀-----

第一、他平分獎金的承諾,只要對方相信有一點點可能性,對方就會認為(我平分,你獨吞)的期望值比(我獨吞,你獨吞)還要好。也就是在他的心中,賽局已經悄悄地從「囚犯困境」轉變為「懦夫賽局」。

第二、他堅持會選擇獨吞的承諾,正是「危險邊緣」策略。當對方把賽局認知為「懦夫賽局」的時候,這策略可以奏效。

果然,在這次賽局中,對方選擇了平分。而這位聰明的玩家也出乎意料地選擇了平分,用合乎賽局規則的方式履行了他平分獎金的承諾。遊戲全程請見:

電視遊戲節目《金球》 (Golden Balls)

我用這例子來說明:中國要用「危險邊緣」策略來逼台灣讓步是不夠的。只要台灣民意認為讓中國統治是最壞的結果,「危險邊緣」策略便不會奏效。

-----廣告,請繼續往下閱讀-----

傳統中國所謂「大國」要能做到「近者悅,遠者來」。 中國要做大國,恐怕還得學學《金球》遊戲節目的聰明玩家!

-----廣告,請繼續往下閱讀-----
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
0

文字

分享

0
2
0
媒體在臉書上的「公有地的悲劇」|囚徒困局系列(九)
林澤民_96
・2017/03/07 ・5588字 ・閱讀時間約 11 分鐘 ・SR值 588 ・九年級

-----廣告,請繼續往下閱讀-----

僅以本文紀念湯瑪斯.謝林

  • 作者:林澤民(奧斯汀德州大學政府系)、陳怡璇(奧斯汀德州大學新聞學院)

source:Facebook Media

To Be or Not to Be?媒體在臉書上的抉擇

近年來,臉書成為讀者看新聞的主要管道。媒體在臉書上分享文章鏈結,從臉書上引導流量回到自己的新聞網站。尤其是當自己網站上流量不多的時候,小編們就趕快在粉絲專頁上分享文章,很快就可以把臉書上的流量導回自家網站。臉書也非省油的燈,不願媒體把自己的用戶導離開臉書,仗勢自己廣大的用戶群,推出即時文章(instant article),與之合作的媒體,把內容免費提供在臉書上以換取跟臉書的廣告拆帳與珍貴的用戶資料(透過臉書上的用戶資料,就能夠更精準地賣廣告),如此,臉書用戶看新聞,不需再離開臉書,而臉書擁有這些免費內容,不但吸引更多用戶,也把每個用戶成功地留在自己的平台上。

媒體紛紛加入即時文章引發不少質疑與憂心:當新聞媒體把自己最珍貴的資產──內容──免費貢獻在臉書上, 等於棄守自家的網站流量,把自己的讀者帶到臉書後,恐怕以後也帶不走了,因為讀者已經習慣在臉書上看新聞。當媒體的經濟命脈依附在臉書之上,以後臉書更改規則,媒體也不得不從。縱使擔憂聲浪不小,所有媒體仍舊前仆後繼的加入即時文章。這種明知行動有後果卻不計後果行動的狀況,可用賽局理論中的多人囚徒困局來解釋。本文先說明賽局理論的概念、雙人囚徒困局的成立條件、多人囚徒困局形成的條件、最後用多人囚徒困局理論來看媒體所面臨的困境。

賽局理論及囚徒困局

賽局理論的基本概念:

-----廣告,請繼續往下閱讀-----

優勝策略:不論其他參賽者採取何種策略對自己都是比較有利的策略。
納許均衡:沒有參賽者願意「單方面」改變策略的策略組合。
伯瑞多最佳結果:參賽者無法「同時」改進的賽局結果。
困局:納許均衡不是伯瑞多最佳結果的局面。

二人囚徒困局的收益可用下列矩陣呈現:

  • A、B:參賽者
  • C、D:策略;C = Cooperate(合作),D = Defect(不合作或背叛)
  • TA, RA, PA, SA:參賽者 A 在表中各種策略組合下的收益
  • TB, RB, PB, SB:參賽者 B 在表中各種策略組合下的收益
  • T = Tempation(誘惑),R = Reward(獎賞), P = Punishment(懲罰),S = Sucker’s Payoff(傻瓜收益)

當 A、B 都只為自己的利益著想,而且彼此無法達成可信承諾時,如果 T > R > P > S 對 A、B 都成立,則 D 是兩位參賽者的優勝策略,相互背叛是納許均衡,可是這個唯一的納許均衡並不是一個伯瑞多最佳結果,因此賽局是囚徒困局

公有地的悲劇

討論媒體在臉書上的策略互動之前,讓我們先看看下面這個雙人賽局:

-----廣告,請繼續往下閱讀-----

在這個賽局中,參賽者從公有資源獲得屬於自己的利益。如果他們合作——有節制、不過度使用公有資源——他們都得到利益 b。如果一個參賽者合作、另一個參賽者不合作——過度使用公有資源——不合作者可以獲得較大的利益 B,可是同時卻造成了 -e 的外部效應,例如使得資源之永續性減弱,而這外部效應兩人都得承擔。當兩個參賽者都不合作時,兩人都都得到較大利益 B,但同時也得承擔兩份外部效應(-2e)。

這裡很容易證明當 2e > B-b > e 時,T > R > P > S 對 A、B 都成立,因此在這個條件下,抽取公有資源的問題是一個囚徒困局。這個困局就是雙人版的所謂「公有地的悲劇」。當個人過度使用公有資源時,雖然可以比有節制地使用能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。這個情況宛如一個「性格決定命運」的希臘悲劇:自私的「理性」驅使著每一個人無情地走向互相背叛的納許均衡,他們明知這個狀態不是伯瑞多最佳結果,卻有如陷於泥淖難以自拔,無法憑一己之力來改變資源毀滅的整體命運

個人過度使用公有資源時,雖然能為自己帶來更多利益,可是當大家都這樣做時,集體造成的總外部效應(資源無法永續)卻會使得大家相互背叛的狀態比大家相互合作的狀態更糟糕。圖/By verifex @ flickr, CC BY-NC 2.0

我們認為這正是新聞媒體在臉書上所面臨的狀態。

-----廣告,請繼續往下閱讀-----

在這裡,公共資源是臉書上的讀者群。媒體之間的合作策略是有節制地使用臉書——只提供鏈結而不提供內容。當媒體合作時,他們得到較小的利益 b 而不必擔心後果。當媒體背叛——在臉書上提供新聞內容——他們可以得到較大的利益 B(雖然損失自家網站的讀者,但在臉書上吸引到的讀者大於損失),可是同時卻造成了臉書之外整個新聞媒體讀者的流失。這個代價 -e 是個外部效應,因為它不但影響到分享新聞內容的媒體自己,也因為助長讀者對臉書的依賴而影響到整個產業。因為當一家媒體提供新聞內容給臉書之後,臉書使用者不需要離開臉書就可以看到新聞,這些使用者也不再造訪其他媒體的網站,而影響其他媒體網站的讀者數量。為了避免被提供內容給臉書的媒體影響到,各家媒體因此跟進,長期以降,各家媒體必須依賴臉書觸及讀者,傷害整體產業的經濟自主。

湯瑪斯.謝林的多人囚徒困局

要把上面的雙人賽局擴大成多人賽局,我們必須要先了解多人囚徒困局的定義。這是 2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling)的偉大貢獻之一。以下的討論見於他的 《微觀動機與宏觀行為》一書。

上圖中,縱軸(Y)代表收益,橫軸(X)代表除了自己以外合作的人數,紅線代表不合作的收益,綠線代表合作的收益。這圖有四項特徵:

1. 每個參賽者均有兩個策略選擇:合作或背叛(不合作)。
2. 不論其他有多少人合作,對自己而言,不合作的收益總要比合作的收益來得高。這也就是說,不論其他人合作或不合作,不合作是自己的優勝策略,而大家相互背叛的「原始狀態」是納許均衡。
3. 紅線跟綠線均隨著合作人數的增加而升高,也就是說不論自己合作與否,「傻瓜」越多越好。
4. 綠線隨著合作人數增加而升高時會超過原始狀態,如 K 點所示。當傻瓜的總人數(K+1)多到這個程度時,他們可以說是一個「可行的聯盟」(viable coalition)。這時雖然不合作還是比合作的收益要來得高,但傻瓜們至少可以說他們的收益比相互背叛時好。這個條件成立的充分且必要條件是所有參賽者都合作時的收益高於原始狀態的收益。我們把所有參賽者都合作的狀態稱為「烏托邦」。烏托邦的可行性代表原始狀態的納許均衡不是伯瑞多最佳結果。

-----廣告,請繼續往下閱讀-----

因為上述條件蘊含了唯一的納許均衡不是伯瑞多最佳結果,湯瑪斯.謝林把符合以上特徵的人際競合關係界定為多人囚徒困局。以下我們檢驗多家媒體在臉書的策略互動為公有地悲劇型態多人囚徒困局的條件。

媒體在臉書之公有地的悲劇

我們假設市場上共有 n 家媒體。因為每家媒體在決定自己的策略時,必須考量自己以外有幾家媒體會合作(只提供鏈結、不提供免費內容給臉書),我們假設這個數目為 x。

根據以上的假設,每家媒體合作或不合作的收益作為 x 的函數可以分別定出如下:

.不合作的收益為:u(D|x) = B-(n-x)e = B-ne+xe
.合作的收益為:u(C|x) = b-(n-(x+1))e = b-(n-1)e+xe

-----廣告,請繼續往下閱讀-----

由此我們可以演繹出幾個有用的結果:

.在原始狀態,也就是大家都不合作時,媒體的收益為:u(D|0) = B-ne
.在烏托邦狀態,也就是大家都合作時,媒體的收益為:u(C|n-1) = b
.當 x 固定時,不合作與合作的收益差別為:u(D|x)-u(C|x) = B-b-e

我們現在可以根據謝林的多人囚徒困局四條件來分析這個賽局了:

1. 每家媒體有兩種策略:合作(不提供免費內容給臉書)或不合作(提供免費內容給臉書)
2. 因為 u(D|x)-u(C|x) = B-b-e,我們可以推論當 B-b > e 時,不論 x 是多少,也就是不論自己以外有幾家媒體合作,不合作會比合作為媒體帶來更大的收益。B-b > e 是不合作為優勝策略的條件。
3. 因為 u(D|x) 與 u(C|x) 的式子中 x 的係數 e 為正值,也就是 u(D|x) 與 u(C|x) 均與 x 成正比,當越多人合作時,媒體不論合作或不合作,其收益都會越高。
4. 如果 u(C|n-1) = b 大於 u(D|0) = B-ne,也就是當 b-(B-ne) > 0 或 ne > B-b 時,烏托邦狀態的收益高於原始狀態的收益。因此,ne > B-b 是原始狀態不是伯瑞多最佳結果的充分且必要條件。

-----廣告,請繼續往下閱讀-----

綜合以上四點,我們可以結論:當 ne > B-b > e 時,不合作是每個個別媒體的優勝策略,大家都不合作是納許均衡,可是這是一個不是伯瑞多最佳結果的納許均衡。根據謝林的定義,在這個條件下,媒體的臉書困局是一個多人囚徒困局。他們的處境正是一個公有地的悲劇。

ne > B-b > e 這個條件意指提供免費內容給臉書所帶來的額外收益(B-b)要大於媒體新聞網站讀者人數下降的代價(e),可是它同時必須小於整個產業都提供內容給臉書所造成的總代價(ne)。如果收益小於或等於個別代價(B-b≤e),提供內容不划算,合作才是優勝策略;如果收益大於或等於總代價(B-b≥ne),原始狀態比烏托邦還好,是伯瑞多最佳結果,沒有困局可言;這兩種情況都不是囚徒困局。請注意:當 n = 2 時, ne > B-b > e 這個條件正與上面所舉的雙人囚徒困局的條件相符合。

下面進一步申論 ne > B-b > e 這個條件。

第一, 提供免費內容給臉書帶來的的額外利益超過個別媒體之外部效應:B-b > e

-----廣告,請繼續往下閱讀-----

華盛頓郵報曾經表示,提供免費內容給臉書,是預期透過臉書,他們可以觸及更多讀者,而有機會把臉書上的使用者變成自己的讀者(Marshall, 2015)。可見,新聞媒體自己的網站所能吸引到的讀者數量已遠遠不及臉書上的使用者。只要文章一放在臉書上,就可以吸引比在自己網站更多讀者。因此,能夠立刻吸引到讀者的這個利益,與長期依附臉書會失去自己網站上讀者的代價對照考量,當然先選擇解決目前的困境,長遠的負面影響,也是以後再說。

第二,提供免費內容給臉書帶來的的額外利益低於集體總外部效應:ne > B-b

依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。圖/facebook

提供免費內容給臉書得到的是即時利益然而付出的卻是整體新聞業的經濟自主與新聞自主,這也是許多專家大聲疾呼,與臉書打交道千萬三思(Riedmann, 2015)。 吸引媒體提供免費內容如同木馬屠城:臉書先以非常優厚的條件(廣告拆帳與用戶資料)交換媒體的內容。從此讀者透過臉書看新聞,就不再造訪媒體自己的網站,所以提供免費內容給臉書,等於放棄自己網站上的流量。當媒體的經濟命脈建立在另一間大企業上,等同於交出自己的經濟自主權。媒體在臉書上吸引到的讀者仍舊屬於臉書的用戶,等於失去臉書,媒體就失去讀者。以後媒體的廣告收入與讀者資料,都由臉書掌握。臉書一旦更改運算法,各家媒體就要立刻改變新聞生產策略以迎合運算法,才能確保自己的內容能夠推播到更多讀者面前。臉書成為真正的守門人,由運算法決定誰可以看到什麼內容。依賴臉書,一則失去的是經濟自主,二則失去的是新聞自主。

這場賽局中,新聞媒體用自己最珍貴的資產──新聞內容──交換短期的讀者數量,長期來看,犧牲的卻是經濟自主與新聞自主。這也是為什麼此舉引起一片憂心,認為與臉書的這場交易如同一場鴻門宴。媒體或許心裡都有數,拿免費新聞吸引讀者是飲鴆止渴,只是死得慢,但提供免費內容給臉書,就有立即經濟收益,也難再考慮之後的隱憂,因為隱憂畢竟只是「隱憂」,現在不加入,失去的則是眼前的廣告收入。在這樣的狀況下,即使知道或許不該加入,卻也不得不交出自己最珍貴的資產,冒著自主性的風險,交換即時利益。然而在這場媒體間的集體困局中,臉書成為最大贏家,獲取更多免費內容,吸引更多用戶,等於吸收他人的資產(內容與讀者),壯大自己的王國。

紀念湯瑪斯.謝林

謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。圖/nobelprize.org

2005 年諾貝爾經濟學獎得主湯瑪斯.謝林(Thomas Schelling, 1921-2016)在 2016 年 12 月過世了。謝林在學術上的重要成就是把賽局理論的關注從零和賽局導向非零和賽局,從合作賽局導向非合作賽局,並把行為概念結合純數學而讓賽局理論能夠廣泛地應用於社會領域和日常生活之中。雖然他最為人所知的是《衝突的策略》一書,特別是其中所論述「可信的承諾」(credible commitment)這一概念在冷戰年代國際關係上所發揮的影響,我卻偏愛他另一本著作:《微觀動機與宏觀行為》。我在學生時代讀他這本書,深深地為其中一個先驅性的「代理人基模型」(agent-based model)──個別居民無害的選擇如何在與鄰居互動的過程中造成社區種族隔離的均衡狀態──所吸引。及到大學教書,第一年即採用這本書開授「人類理性行為」的課程。

二十幾年來,我每次向學生介紹書中「多人囚徒困局」(multi-person prisoner’s dilemma)的理論時,仍然深深為謝林的智慧所激勵。這不只是因為模型本身既優雅又含意深遠,也是因為它所能洞燭的行為困境,從政治、經濟、社會、乃至於國際關係、人際關係幾乎無所不包。有不少人尊謝林為當前顯學行為經濟學之父,我深為同意。本文用一種特殊形態的多人囚徒困局──「公有地的悲劇」(the tragedy of the commons)──來詮釋新聞媒體在臉書上競合的困境。寫作中想到謝林對學術界、對我個人的深遠影響,不禁感懷不已。

原刊載於Tse-min Lin 的部落格

參考書目:

-----廣告,請繼續往下閱讀-----
林澤民_96
37 篇文章 ・ 245 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。