0

0
0

文字

分享

0
0
0

金球的囚徒|囚徒困局系列(一)

林澤民_96
・2015/12/21 ・2587字 ・閱讀時間約 5 分鐘 ・SR值 523 ・七年級

f_10559118_1

人與人之間的競爭與合作是很難拿捏的事。很多時候,雙方合作比不合作能給各自帶來更大的好處,但是一廂情願地合作的人,卻有可能被對方視為「潘仔」或「傻瓜」(Sucker)而予取予奪。於是,在各自的利害考量下,沒有人願意合作,寧可兩輸也不願意當「潘仔」。這種困境,可以存在於人際關係,經濟交易,政治角力,國際關係,甚至自然環境的維護,在人生及社會上,可說屢見不鮮。

英國BBC電視中心製作的Golden Balls便是模擬這種困境的競賽節目。節目中,二參賽者爭取一筆獎金,例如1000英鎊。二人隔桌對坐,面前各有兩顆金球,其中一個金球裡面寫著Split(平分),另一個寫著Steal(竊佔)。如果二人均選擇Split,則獎金平分。如果二人均Steal,則獎金槓龜。而如果一人Steal而另一人Split,則Steal者獨佔全額獎金,而Split者只能抱蛋含恨而歸。此賽局可用下圖來表示:

Player B
Split Steal
Player A Split 500, 500 S, 1000
Steal 1000, S 0, 0

其中S雖然表面上也是0,其實比零還糟,因為若雙方均Steal,雖然無人得獎,畢竟互相扯平,而單方面的Split除了抱蛋而歸外,還要加上當「潘仔」的懊惱、義憤、和羞辱,所以S<0。(讀者可以自問:你寧可Steal而雙輸呢,還是Split而當「潘仔」?)如此,則理性的參賽者會算計:如果對方Split,自己的較佳策略是Steal,因為Steal會贏得全額獎金,而Split則只能贏得一半。而如果對方Steal,則自己更應該Steal,否則就要當大傻瓜了。於是,對理性的參賽者而言,Steal是一個「優勝策略」。而如果雙方均如此算計,結果就獎金就槓龜了。

「金球」節目容許參賽者在決定之前互相溝通,可是即使雙方協議Split,因為口說無憑,輕易信賴對方的承諾反而容易吃虧上當。以下這場獎金高達100,000英鎊的金球大賽即紀錄了輕信人言的苦果:

-----廣告,請繼續往下閱讀-----

Golden Balls 所顯示的困境,正是所謂的「囚徒困局」 (Prisoner’s Dilemma)。囚徒困局是賽局理論中一種非零和賽局,它反映了人際間常見的困境。這個賽局可以表現如下:

Player B
C D
Player A C RA, RB SA, TB
D TA, SB PA, PB

定義:

A,B:參賽者
C,D:策略。C=合作(Cooperate),D=不合作或背叛(Defect)
TA,RA,PA,SA:參賽者A在表中各種策略組合下的收益
TB,RB,PB,SB:參賽者B在表中各種策略組合下的收益
T=Temptation,R=Reward,P=Punishment,S=Sucker’s Payoff

賽局的假設:

-----廣告,請繼續往下閱讀-----
  1. A,B均只為自己利益著想
  2. A,B無法達成彼此信賴的有效承諾
  3. TA>RA>PA>SA
  4. TB>RB>PB>SB

賽局中,A,B二人均可以自由選擇合作或不合作兩種策略。在上列假設下,A,B均會發現不論對方合作或不合作,不合作比合作會給自己帶來較大的收益:假使對方合作,你合作可以得到收益R,而不合作則能得到收益T>R;假使對方不合作,你合作可以得到收益S,而不合作則能得到收益P>S。這樣算計的話,二人均不會合作,結果獲得P的收益。然而,二人旋即發現如果二人均合作的話,收益R比P要來得好(R>P)。可是在無法信賴對方的情況下,自己片面合作是不智的,因為對方如果還是不合作的話,對方將會得到最好的收益T,而自己將會得到最壞的收益S。於是,二人會陷於相互背叛的困境。

賽局理論中,D是所謂優勝策略(dominant strategy),也就是不論對方選擇何種策略,選擇D均會給自己帶來較大的收益。相互背叛的(D,D)策略組合是所謂的納許均衡(Nash equilibrium),也就是在(D,D)的情況下,沒有人會片面改採其它策略。可是(D,D)不是所謂的伯瑞多最佳結果(Pareto optimal outcome),因為(C,C)帶來的收益,對兩人均要比(D,D)帶來的收益要來得好。這個賽局之為困局正是因為它唯一的Nash equilibrium不是Pareto optimal。它之所以稱作囚徒困局,是因為以下的故事:

二人共同犯罪被捕而成為囚徒。檢察官要囚徒認罪,但告知他們其求刑不僅與個別囚徒認罪與否有關,也與共犯認罪與否有關:如果二人均供認犯行不諱,則證據確鑿,檢察官將求刑3年。如果二人均不認罪,因證據不足,檢察官將只能以技術性的微罪求刑1年。如果一人認罪而另一人不認罪,則檢察官會對認罪之人處分不起訴,而對不認罪之人求處重刑5年。如果把不認罪視為二囚徒之間的合作而認罪視為相互背叛,則這個故事符合如下的賽局:

Player B
不認罪 認罪
Player A 不認罪 -1, -1 -5, 0
認罪 0, -5 -3, -3

因為TA=TB=0,RA=RB=-1,PA=PB=-3,SA=SB=-5,T>R>P>S對A,B二人而言均成立,所以認罪(D)是dominant strategy。二人均會認罪(D,D)。二人於是會被檢察官求刑3年。(D,D)是為Nash equilibrium。可是(D,D)不是Pareto optimal,因為(C,C)只會被求刑1年。雖然如此,二人在無法相互信賴的情況下還是會互相背叛而認罪。這是囚徒困局的原型典故。上面Golden Balls的賽局中,TA=TB=1000,RA=RB=500,PA=PB=0,SA=SB<0,也是T>R>P>S 對A,B二人而言均成立,因此它是不折不扣的囚徒困局。

-----廣告,請繼續往下閱讀-----

Golden Balls賽局容許參賽者在決定Split或Steal之前互相溝通,這是賽局理論所謂的「訊號傳送」(signaling)機制,讓參賽者向對方暗示甚或明示自己是何種類型的玩家。賽局理論一般認為參賽者要付出相當的代價才能讓他傳送的訊號具有可信度,而廉價的訊號只是舌燦蓮花(cheap talk)而已。例如參賽者可能發誓一定會合作,但發誓伴以「斬指頭」的代價顯然要高於「斬雞頭」的代價,前者所傳送的訊號會比後者要可信得多。Golden Balls的參賽者即使信誓旦旦會Split,沒有「斬指頭」之類的行為保證,終究是舌燦蓮花,不足深信。

那麼為何有些Golden Balls參賽者願意Split?賽局理論純粹是數學理論,在實證上並沒有百分之百的預測能力。「理性」有其經驗上的分配:不同國家、文化、宗教、社會、種族、性別、收入、教育等等的人參與Golden Balls都可能做出不同的選擇。而且Golden Balls的signaling雖然是cheap talk,不同的人也可能有不同的反應,例如有些人就容易相信態度誠懇或英俊漂亮的參賽者所傳送的訊號。「理性」終究只是理論上的假設,它是否客觀事實仍有待經驗檢定。

原刊載於Tse-min Lin 的部落格

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 248 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

2
2

文字

分享

0
2
2
為什麼同伴會出賣你?從「囚徒困境」來看共犯為什麼先招了!——《大話題:賽局理論》
大家出版_96
・2023/04/22 ・1979字 ・閱讀時間約 4 分鐘

合作與私利的權衡:囚徒困境

最廣為人知的賽局理論悖論是囚徒困境,這個賽局由加拿大數學家塔克所命名。塔克教授的囚徒困境賽局就像是好萊塢的犯罪劇情片,有人提供認罪協商給兩名嫌疑犯去供出對方。這個賽局說明了為共同利益而採取聯合行動十分困難,因為人們往往追求私利。

囚徒困境賽局中的誘因屢見不鮮,很適合拿來分析許多領域的問題。從經濟學中公司的競爭,到社會學中的社會規範,到心理學中的決策,到生物學中動物競爭稀缺資源,再到資訊工程中電腦系統競爭頻寬。

囚徒困境是指兩名囚犯陷入「是否要認罪」的心理狀態。圖/《大話題:賽局理論》

阿倫和阿班因為合夥偷車而被捕。警方懷疑他們還涉嫌一起肇事逃逸案件,但沒有足夠的證據起訴他們。兩人被帶到不同的房間分開偵訊。

阿倫和阿班都有兩個可能的行動:保持沉默或認罪。因此,賽局中總共有四種結果。

-----廣告,請繼續往下閱讀-----

阿倫沉默,阿班沉默。阿倫認罪,阿班沉默。阿倫沉默,阿班認罪。阿倫認罪,阿班認罪。

刑期長短受到共犯是否認罪的影響。圖/《大話題:賽局理論》

我們可以用策略型式表達這個囚徒困境。支付矩陣中,列代表阿倫的可能行動,欄代表阿班的可能行動。我們在行與列的相交處填入每位參與者的報酬,在本例中也就是他們各自的刑期。

如果兩人都沉默,兩人都將因偷車而服刑一年。這當然不好,所以報酬是負值(阿倫:-1,阿班:-1)。如果兩人都認罪,兩人都要服刑十年(阿倫:-10,阿班:-10)。

囚徒都知道這個支付矩陣,也都知道彼此面對相同的矩陣。

-----廣告,請繼續往下閱讀-----
考慮到先認罪的人可以免去刑責,將導致四種可能結果。圖/《大話題:賽局理論》

合作或私利考量下的「最佳解」不同

這是一個同步賽局:即使並非字面意義上的同步,但由於兩人身處不同的偵訊室,做決定時也不知道對方的選擇,因此可以視為同步。

請注意,以策略型式表現賽局,並不意味著我們指出了可能會發生什麼事。我們只是列出所有可能結果,無論合理與否,並且把每個結果中參與者的報酬記下來。

現在,寫下囚徒困境賽局的策略型式後,我們可以嘗試分析可能發生的結果。

兩名囚犯就彼此的利益思考,形成「囚犯困境」的心理狀態。圖/《大話題:賽局理論》

很明顯,如果阿倫和阿班可以共同做決定,兩人會選擇一起沉默,只需要坐牢一年。

-----廣告,請繼續往下閱讀-----

但這並非均衡的結果。對阿倫來說,「認罪」的策略絕對優於「沉默」:不管他預期阿班會怎麼做,他的最佳回應都是認罪。

以個人來說,最佳的回應便是「認罪」。圖/《大話題:賽局理論》

同樣地,不管阿班預期阿倫會怎麼做,阿班的最佳回應都是認罪。

在囚徒困境中,納許均衡是兩名參與者都認罪。這個結果的標準寫法是:

{ 認罪,認罪 }

-----廣告,請繼續往下閱讀-----

前者是橫列參與者(阿倫)的行動選擇,後者是直欄參與者(阿班)的行動選擇。在均衡中,雙方都要坐牢十年。

即使雙方最佳利益為「沉默」,但在囚徒困境下卻會選擇「認罪」。圖/《大話題:賽局理論》

這屬於柏雷多效率嗎?

一個有趣的問題是,囚徒困境賽局中的納許均衡是否為柏雷多效率?這個資源分配效率的概念是以義大利經濟學家柏雷多(1848 – 1923)來命名。如果再也沒有其他可能的結果可以使至少一人變得更好,但沒有任何人變糟,這樣的結果就是柏雷多效率。

囚徒困境賽局中的納許均衡並非柏雷多效率,因為如果兩人都沉默,每個囚徒都可以變得更好。這也就是「囚徒困境」名稱的由來。

不過,在多數的賽局中,納許均衡就是柏雷多效率。例如在前面電影檔期的賽局中,沒有其他的結果能使雙方以不損及對方的方式獲得更高利益。

-----廣告,請繼續往下閱讀-----
囚徒困境並非柏雷多效率,因雙方若選擇共同沉默將能有更好的結果。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。

0

3
1

文字

分享

0
3
1
我預判了你的預判!為什麼高手過招總會和局?——《大話題:賽局理論》
大家出版_96
・2023/04/21 ・1459字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

什麼是「賽局理論」?

賽局理論是在研究策略性互動。策略性互動也是很多桌遊的關鍵元素,賽局理論因此得名。你的決策影響別人的行動,反之亦然。賽局理論的不少術語直接取自這類遊戲。我們把決策者稱為「參與者」(player)。參與者做決定後,就採取了行動(move)。

以策略性互動為基礎的賽局理論。圖/《大話題:賽局理論》

運用模型簡化複雜世界

真實世界的策略性互動可能非常複雜。例如在人際互動中,不僅行動,包括我們的表情、聲調和肢體語言都會影響他人。

在與他人往來時,人們展現不同的經歷與觀點。這樣無以計數的變化會使得情況異常複雜,也很難分析。

藉由稱為「模型」的簡化結構,我們可以大幅縮減複雜的程度。模型雖然簡單且容易分析,但仍然捕捉了真實世界問題的某些重要特徵。選用適當的簡單模型,可以有效幫助大家學習真實世界的複雜問題。

-----廣告,請繼續往下閱讀-----
藉由模型簡化真實世界的複雜策略性互動。圖/《大話題:賽局理論》

西洋棋可以幫助我們瞭解這些變化會讓參與(及預測)賽局變得多麼複雜。西洋棋的規則明確,雖然每一步棋的選項有限,但整體棋局的複雜度令人生畏。不過比起許多人類的基本互動,西洋棋其實簡單多了!

西洋棋儘管複雜,但比人類互動簡單多了。圖/《大話題:賽局理論》

高手過招容易和局!

像西洋棋之類的桌遊有個特性:玩家愈熟練,就容易產生平手的結局。我們如何解釋這種現象?

因為西洋棋太複雜,難以全面分析,以下我們用簡單的井字遊戲來說明一個重要特性。西洋棋和井字遊戲都有明確的勝負規則。玩家輪流落子,且可以下的地方有限。

井字遊戲無法表現西洋棋中的許多特性。但由於兩者有些共同特徵,因此井字遊戲可以幫助人們瞭解高手對陣為什麼容易產生和局。

-----廣告,請繼續往下閱讀-----
井字遊戲因為較簡單,掌握規則後就很容易平手。圖/《大話題:賽局理論》
因為井字遊戲太容易平手,因此人們開始挑戰更複雜的遊戲。圖/《大話題:賽局理論》

被簡化的世界縮影:「賽局」

賽局理論的首要關注並非西洋棋之類的桌遊,而是要增進我們對人際、對企業間、對國家間、對生物間……等互動行為的瞭解。原因是,真實的問題可能過於複雜且難以充分掌握。

因此,在賽局理論中我們創造了非常簡化的模型,稱之為「賽局」。創造有用的模型既是科學,也是藝術。

好的模型夠簡單,讓人能充分瞭解驅動參與者的誘因。同時,模型必須能夠捕捉真實世界的重要元素,以富有開創性的洞察力與判斷力決定哪些元素最為相關。

沒有模型能適用任何狀況,因為真實世界如此複雜。圖/《大話題:賽局理論》

——本文摘自《大話題:賽局理論》,2023 年 3 月,大家出版出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
大家出版_96
14 篇文章 ・ 11 位粉絲
名為大家,在藝術人文中,指「大師」的作品;在生活旅遊中,指「眾人」的興趣。