0

4
3

文字

分享

0
4
3

看電影學統計:「多重宇宙」與統計學「隨機變異」的概念

林澤民_96
・2023/03/15 ・2854字 ・閱讀時間約 5 分鐘

「多重宇宙」是我教統計時常用到的名詞,我用它來解釋隨機變異(stochastic variation)的概念:

例如民調抽得一個樣本,此樣本的受訪者固然是一群特定人士,但理論上我們可以抽出許多許多樣本,這些樣本之間雖然會有隨機變異,但樣本彼此的宏觀性質仍會相近。這些不同的隨機樣本,可以以「多重宇宙」一詞來形容。即使事實上只有一個樣本(一個宇宙),我們可以想像在多重宇宙的每個宇宙裡,都有一個微觀上隨機變異的樣本存在。

一個樣本(一個宇宙),在多重宇宙裡,每個宇宙都有一個微觀上隨機變異的樣本存在。 圖/IMDb

什麼是隨機樣本?

其實,數理統計學中「隨機樣本」(random sample)的概念指的是「一組獨立且同一分布的隨機變數」(a set of independently and identically distributed random variables)

在這個定義之下,樣本的每一個單位(資料點)都不是固定不變的數值,而是一個依循某機率分布的隨機變數。「隨機樣本」的要求是樣本所有的 N 個單位不但要互相獨立,而且要依循同一的機率分布。

我們可以想像我們平常所謂「一個樣本」的 N 個觀察值,每一個觀察值背後都有一個產生這個數值的隨機變數,也可以說所謂「一個樣本」其實只是這「一組獨立且同一分布的隨機變數」的一個「實現」(realization)。那麼,不同的樣本就是這「一組獨立且同一分布的隨機變數」的不同「實現」。這樣了解之下的不同樣本、不同「實現」,我喜歡把它們稱為「多重宇宙」。

-----廣告,請繼續往下閱讀-----

多重宇宙中的隨機變異,是我們在分析一個樣本的資料時必須作統計推論的原因。

比如我們分析本屆所有 113 位立委的議事行為,既然立委一共只有 113 人,我們分析的對象不就是立委的母體嗎?那是不是就不必做統計推論?

不是!原因是我們仍然可以想像有多重宇宙存在,每個宇宙都有 113 位立委,而同一位立委在不同的宇宙裡其議事行為會有隨機變異。正是因為這隨機變異的緣故,我們即使分析的是所謂「母體」,我們仍然要做統計推論。

圖/IMDb

「多重宇宙」的概念可以說就是「假如我們可以重來」的反事實思想實驗。被分析的單位不是在時間中重來一次,而是在多重宇宙的空間中展現「假如我們可以重來」的隨機變異的可能性。

名為 Monday 的這集 X 檔案電視劇中,主角的夢境不斷重複,每次夢境的結構大致類似,但細節卻有所不同,這正是「多重宇宙—隨機變異」概念的戲劇化。

-----廣告,請繼續往下閱讀-----

【媽的多重宇宙】(Everything Everywhere All at Once)也是。

「看,這是你的宇宙,一個漂浮在存在宇宙泡沫中的泡泡。周圍的每個氣泡都有細微的變化。但你離你的宇宙越遠,差異就越大。」——【媽的多重宇宙】對白

這是說:變異程度越小的是離你越近的宇宙,程度越大的是離你越遠的宇宙。這裡所謂變異的程度,在統計學裡可以用誤差機率分布的標準差來衡量。

什麼是隨機變異?

關於「隨機變異」這個概念,我最喜歡的例子是研究所入學申請的評審。

例如有 120 人申請入學,我詳細閱讀每人投遞的申請資料(包括性別、年齡等個人特質還有 SOP、大學成績單、GRE 分數、推薦信等),然後打一個 Y=0~100 的分數。全部評閱完畢,我便得到一份 N=120 的資料。這個資料包括了所有的申請者,那麼它是樣本呢?還是母體?

-----廣告,請繼續往下閱讀-----

如果我要分析我自己評分的決定因素,我會把分數 Y 回歸到性別、年齡等個人特質以及資料中可以量化的變數,例如大學成績平均分數(GPA)和 GRE 分數。跑這個迴歸時,需不需要做統計推論,看迴歸係數是不是有統計的顯著性?

我的看法是這份 N=120 的資料是樣本而不是母體,做迴歸分析當然要做統計推論。

那麼我資料的母體是什麼?

迴歸分析資料的母體其實是所謂「母體迴歸函數」(population regression function),也就是通常所說的「資料產生過程」(data generating process, DGP)。

這個 DGP 就是我在評閱每份資料時腦海中的思考機制,它考量了許多量化和質化的變數,賦予不同的權重,然後加總起來產生 Y。

分析資料的母體,也就是常說的「資料產生過程」。 圖/envato.elements

量化變數的權重就是母體迴歸函數的係數,質化變數則是母體迴歸函數的係數的誤差項。如果有很多質化變數攏總納入誤差項,我們通常可以根據中央極限定理,假設誤差項是呈現常態分布的隨機變數。這個誤差項就是「隨機變異」的來源。

評審入學申請,我通常只把所有資料評閱一次。這一次評審結果,會有幾家歡樂幾家愁,這便構成了一個「宇宙」。如果我第二天又把所有 120 份資料重新評分一遍,得到第二個樣本。因為我腦中的「資料產生過程」包括隨機變數,這個新樣本保證跟第一個樣本會有差異。用白話說:我的評分機制不精確,我自己甚至不知道我給每個量化變數多少權重,而且第二次評閱所用的權重也會跟第一次不盡相同,更不用說質化變數如何影響我的評分了。

-----廣告,請繼續往下閱讀-----

這第二個樣本,申請者的排比不會跟第一個樣本一樣,雖然也是幾家歡樂幾家愁,歡樂與愁悶的人也可能不一樣。這是第二個宇宙。依此類推,我們可以想像同樣的120位申請者,因為我「資料產生過程」的隨機變異,活在多重宇宙裡。

這些宇宙有的差異不大,根據【媽的多重宇宙】的說法,它們的泡泡互相之間的距離就較近,差異較大的宇宙,距離就較遠。如果申請者可以像電影所述那樣做宇宙跳躍,他們會看到自己在不同宇宙裡的命運。

我擔任德州大學政府系的研究部主任時,常耽心有申請者拿我們入學評審委員的評分資料去做迴歸分析。如果分析結果顯示種族、性別等變數有統計顯著性,說不定會被拿去控告我違反所謂「平權行動」(affirmative action)的相關法律。如果沒有顯著性,我就不耽心了。

多重宇宙之間會不會有「蝴蝶效應」?也就是宇宙跳躍時,隨機變異產生的微小差異,會不會造成新舊宇宙生命路徑的決然不同?

-----廣告,請繼續往下閱讀-----

在【媽的多重宇宙】中,伊芙琳只要當初做了一個不同的決定,以後的生命便可能跟現世(home universe)有很不一樣的命運。這在統計學也不是不可能。時間序列分析中,有些非線性模式只要初始值稍微改變,其後在時間中的路徑便會與原來的路徑發散開來。

你做時間序列分析時,會不會想想:時間序列資料究竟是樣本還是母體?如果你的研究興趣就只限於資料期間,那要不要做統計推論?當然要的,因為隨機變異的緣故。

如果你今年申請外國研究所不順利,也許在另一個宇宙裡,你不但獲名校錄取,得到鉅額獎學金,而且你的人生旅途將自此一路順遂,事業婚姻兩得意呢。

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 246 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

1
0

文字

分享

0
1
0
停工即停薪:如何證明你的時間值多少?車禍背後的認知 x 情緒 x 金錢 x 法律大混戰
鳥苷三磷酸 (PanSci Promo)_96
・2026/01/09 ・3351字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 PAMO車禍線上律師 合作,泛科學企劃執行

走在台灣的街頭,你是否發現馬路變得越來越「急躁」?滿街穿梭的外送員、分秒必爭的多元計程車,為了拚單量與獎金,每個人都在跟時間賽跑 。與此同時,拜經濟發展所賜,路上的豪車也變多了 。

這場關於速度與金錢的博弈,讓車禍不再只是一場意外,更是一場複雜的經濟算計。PAMO 車禍線上律師施尚宏律師在接受《思想實驗室 video podcast》訪談時指出,我們正處於一個交通生態的轉折點,當「把車當生財工具」的職業駕駛,撞上了「將車視為珍貴資產」的豪車車主,傳統的理賠邏輯往往會失靈 。

在「停工即停薪」(有跑才有錢,沒跑就沒收入)的零工經濟時代,如果運氣不好遇上車禍,我們該如何證明自己的時間價值?又該如何在保險無法覆蓋的灰色地帶中全身而退?

-----廣告,請繼續往下閱讀-----
如果運氣不好遇上車禍,我們該如何證明自己的時間價值?/ 圖片來源: Nano Banana

薪資證明的難題:零工經濟者的「隱形損失」

過去處理車禍理賠,邏輯相對單純:拿出公司的薪資單或扣繳憑單,計算這幾個月的平均薪資,就能算出因傷停工的「薪資損失」。

但在零工經濟時代,這套邏輯卡關了!施尚宏律師指出,許多外送員、自由接案者或是工地打工者,他們的收入往往是領現金,或者分散在多個不同的 App 平台中 。更麻煩的是,零工經濟的特性是「高度變動」,上個月可能拚了 7 萬,這個月休息可能只有 0 元,導致「平均收入」難以定義 。

這時候,律師的角色就不只是法條的背誦者,更像是一名「翻譯」。

施律師解釋「PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』,轉譯成法官或保險公司聽得懂的法律語言。」 這包括將不同平台(如 Uber、台灣大車隊)的流水帳整合,或是找出過往的接單紀錄來證明當事人的「勞動能力」。即使當下沒有收入(例如學生開學期間),只要能證明過往的接單能力與紀錄,在談判桌上就有籌碼要求合理的「勞動力減損賠償 」。

-----廣告,請繼續往下閱讀-----
PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』,轉譯成法官或保險公司聽得懂的法律語言 / 圖片來源: Nano Banana

300 萬張罰單背後的僥倖:你的直覺,正在害死你

根據警政署統計,台灣交通違規的第一名常年是「違規停車」,一年可以開出約 300 萬張罰單 。這龐大的數字背後,藏著兩個台灣駕駛人最容易誤判的「直覺陷阱」。

陷阱 A:我在紅線違停,人還在車上,沒撞到也要負責? 許多人認為:「我人就在車上,車子也沒動,甚至是熄火狀態。結果一台機車為了閃避我,自己操作不當摔倒了,這關我什麼事?」

施律師警告,這是一個致命的陷阱。「人在車上」或「車子沒動」在法律上並不是免死金牌 。法律看重的是「因果關係」。只要你的違停行為阻礙了視線或壓縮了車道,導致後方車輛必須閃避而發生事故,你就可能必須背負民事賠償責任,甚至揹上「過失傷害」的刑責 。 

數據會說話: 台灣每年約有 700 件車禍是直接因違規停車導致的 。這 300 萬張罰單背後的僥倖心態,其巨大的代價可能是人命。

-----廣告,請繼續往下閱讀-----

陷阱 B:變換車道沒擦撞,對方自己嚇到摔車也算我的? 另一個常年霸榜的肇事原因是「變換車道不當」 。如果你切換車道時,後方騎士因為嚇到而摔車,但你感覺車身「沒震動、沒碰撞」,能不能直接開走?

答案是:絕對不行。

施律師強調,車禍不以「碰撞」為前提 。只要你的駕駛行為與對方的事故有因果關係,你若直接離開現場,在法律上就構成了「肇事逃逸」。這是一條公訴罪,後果遠比你想像的嚴重。正確的做法永遠是:停下來報警,釐清責任,並保留行車記錄器自保 。

正確的做法永遠是:停下來報警,釐清責任,並保留行車記錄器自保 。/ 圖片來源: Nano Banana

保險不夠賠?豪車時代的「超額算計」

另一個現代駕駛的惡夢,是撞到豪車。這不僅是因為修車費貴,更因為衍生出的「代步費用」驚人。

-----廣告,請繼續往下閱讀-----

施律師舉例,過去撞到車,只要把車修好就沒事。但現在如果撞到一台 BMW 320,車主可能會主張修車的 8 天期間,他需要租一台同等級的 BMW 320 來代步 。以一天租金 4000 元計算,光是代步費就多了 3 萬多塊 。這時候,一般人會發現「全險」竟然不夠用。為什麼?

因為保險公司承擔的是「合理的賠償責任」,他們有內部的數據庫,只願意賠償一般行情的修車費或代步費 。但對方車主可能不這麼想,為了拿到這筆額外的錢,對方可能會採取「以刑逼民」的策略:提告過失傷害,利用刑事訴訟的壓力(背上前科的恐懼),迫使你自掏腰包補足保險公司不願賠償的差額 。

這就是為什麼在全險之外,駕駛人仍需要懂得談判策略,或考慮尋求律師協助,在保險公司與對方的漫天喊價之間,找到一個停損點 。

談判桌的最佳姿態:「溫柔而堅定」最有效?

除了有單據的財損,車禍中最難談判的往往是「精神慰撫金」。施律師直言,這在法律上沒有公式,甚至有點像「開獎」,高度依賴法官的自由心證 。

-----廣告,請繼續往下閱讀-----

雖然保險公司內部有一套簡單的算法(例如醫療費用的 2 到 5 倍),但到了法院,法官會考量雙方的社會地位、傷勢嚴重程度 。在缺乏標準公式的情況下,正確的「態度」能幫您起到加分效果。

施律師建議,在談判桌上最好的姿態是「溫柔而堅定」。有些人會試圖「扮窮」或「裝兇」,這通常會有反效果。特別是面對看過無數案件的保險理賠員,裝兇只會讓對方心裡想著:「進了法院我保證你一毛都拿不到,準備看你笑話」。

相反地,如果你能客氣地溝通,但手中握有完整的接單紀錄、醫療單據,清楚知道自己的底線與權益,這種「堅定」反而能讓談判對手買單,甚至在證明不足的情況下(如外送員的開學期間收入),更願意採信你的主張 。

車禍不只是一場意外,它是認知、情緒、金錢與法律邏輯的總和 。

在這個交通環境日益複雜的時代,無論你是為了生計奔波的職業駕駛,還是天天上路的通勤族,光靠保險或許已經不夠。大部分的車禍其實都是小案子,可能只是賠償 2000 元的輕微擦撞,或是責任不明的糾紛。為了這點錢,要花幾萬塊請律師打官司絕對「不划算」。但當事人往往會因為資訊落差,恐懼於「會不會被告肇逃?」、「會不會留案底?」、「賠償多少才合理?」而整夜睡不著覺 。

-----廣告,請繼續往下閱讀-----

PAMO看準了這個「焦慮商機」, 推出了一種顛覆傳統的解決方案——「年費 1200 元的訂閱制法律服務 」。

這就像是「法律界的 Netflix」或「汽車強制險」的概念。PAMO 的核心邏輯不是「代打」,而是「賦能」。不同於傳統律師收費高昂,PAMO 提倡的是「大腦武裝」,當車禍發生時,線上律師團提供策略,教你怎麼做筆錄、怎麼蒐證、怎麼判斷對方開價合不合理等。

施律師表示,他們的目標是讓客戶在面對不確定的風險時,背後有個軍師,能安心地睡個好覺 。平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略 。

平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略 。 / 圖片來源: Nano Banana

從違停的陷阱到訂閱制的解方,我們正處於交通與法律的轉型期。未來,挑戰將更加嚴峻。

-----廣告,請繼續往下閱讀-----

當 AI 與自駕車(Level 4/5)真正上路,一旦發生事故,責任主體將從「駕駛人」轉向「車廠」或「演算法系統」 。屆時,誰該負責?怎麼舉證?

但在那天來臨之前,面對馬路上的豪車、零工騎士與法律陷阱,你選擇相信運氣,還是相信策略? 先「武裝好自己的大腦」,或許才是現代駕駛人最明智的保險。

PAMO車禍線上律師官網:https://pse.is/8juv6k 

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
多重宇宙真的存在?艾弗雷特三世(Hugh Everett III)的多世界詮釋
PanSci_96
・2024/07/28 ・2651字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

在前一篇我們聊到,為了反駁量子力學的機率詮釋和疊加態的說法,薛丁格提出著名的思想實驗:「薛丁格的貓」。既然貓在現實中不可能既生又死,所以量子理論一定有不夠完備的地方。

延伸閱讀:物理學四大神獸「薛丁格的貓」,其實是在嘲諷量子力學?物理學家對波函數機率詮釋的爭辯

然而,真的是這樣嗎?有沒有既符合量子理論又能解釋這個實驗的說法呢?

測量問題:量子系統的確定性

在量子力學中,量子系統的狀態在被測量前是不可確定的,所有可能狀態以機率的形式共存,這時系統處於所有狀態的疊加態。只有當我們進行測量時,系統才會變成某個特定狀態。

-----廣告,請繼續往下閱讀-----

例如,原子裡的電子並沒有一個確定的位置,它可能出現在任意地方,像波一樣散佈於空間中。當你測量它,它有一定機率出現在某處。愛因斯坦曾問:「是不是只有當你在看它的時候,月亮才在那兒呢?」對他而言,月亮不管有沒有人在看,都懸掛在天上,他認為量子系統應該也是如此,總是有個確定的狀態,只是我們還沒搞清楚而已。

而薛丁格在與愛因斯坦討論後提出「薛丁格的貓」思想實驗。薛丁格利用貓不可能處於既生又死的疊加態來質疑量子理論,雖然引起了話題,但並未成功反駁量子理論。

量子力學的理解不斷累積,我們知道了許多愛因斯坦和薛丁格當時不知道的事情,因此在某種程度上,回應他們的質疑已經不再是問題。

多世界詮釋:分岔的宇宙

1957 年,美國普林斯頓大學的博士生艾弗雷特三世(Hugh Everett III)提出了一個大膽的想法。他認為,宇宙的一切可以由單一個宇宙波函數(universal wave function)來描述,遵循量子力學的波動方程式。當我們進行測量時,例如檢查「薛丁格的貓」實驗結果,不同的子系統(如貓、毒藥瓶和測量者)會在交互作用下彼此連動,呈現出兩組狀態:貓死亡、毒藥瓶打破、測量者看到貓死亡,或貓活著、毒藥瓶沒破、測量者看到貓活著。

-----廣告,請繼續往下閱讀-----
艾弗雷特三世(Hugh Everett III)提出的多世界詮釋,之後成為許多科幻題材的靈感來源。圖/wikimedia

延伸閱讀:首創平行世界理論,艾弗雷特三世誕辰|科學史上的今天:11/11

測量會讓宇宙波函數分岔出兩個不同的分支,或說兩個平行世界。在其中一個宇宙,貓會活著;另一個宇宙,貓則會死亡。兩個宇宙都真實存在,沒有貓既死又活的事情。

在艾弗雷特的詮釋中,宇宙波函數隨著時間演化,就像一株大樹,每當有測量發生,就會分出不同的枝幹。每個枝幹代表一個獨立的平行世界或平行歷史,這就是著名的多世界詮釋(many-worlds interpretation)。歷史上每次的測量或選擇都會分裂出不同的世界,產生超級龐大的平行世界數量,彼此之間無法溝通或交換資訊。

雖然我們在這個世界買樂透沒中獎,但在另一個平行世界裡,我們可能是中頭獎的大富翁。多世界詮釋的優點是,它與量子理論沒有矛盾,能解決薛丁格的貓等悖論。

然而,儘管有人曾提出過驗證多世界詮釋的方式,現今的科技無法做到。艾弗雷特的博士論文沒有受到學界的多大關注,他之後改從事與物理研究無關的工作。直到1970年代,多世界詮釋才開始受到注意,並在艾弗雷特於1982年去世後,變得越來越受歡迎,甚至被科幻作品挪用。

-----廣告,請繼續往下閱讀-----

量子去相干:量子特性的喪失

量子去相干(quantum decoherence)是另一種解決方法。在雙狹縫干涉實驗中,同一波源的波從兩個狹縫出來並產生干涉條紋,代表它們存在相干性(相互干涉的性質)。若對其中一道狹縫的光波進行干擾,相干性會消失,干涉條紋不會出現,這就是去相干。

在量子力學裡,微觀粒子具有波的特性,也會發生相互干涉。波函數隨外在環境存在許多不同可能狀態,彼此相干。在電子的雙狹縫實驗中,電子以波的形式通過兩個狹縫,接著彼此干涉,形成干涉條紋。當我們測量電子的路徑,就會讓系統不同可能狀態的相干性消失,這就是量子去相干。

只要一個量子系統沒有完全孤立,與外界有交互作用,就算是干擾。想像將熱水和冷水倒在一起,熱水分子和冷水分子會互相作用,交換熱能和動量,最終達到平衡——一杯溫水。原本的每個熱水分子和冷水分子可以視為孤立系統,但當它們互相作用,改變狀態,就必須將整杯水視為整體。

量子系統的測量就像這個例子,測量者和量子系統之間的交互作用會導致量子系統與外界交換資訊,無法再用原本的波函數描述,最終逐漸喪失量子特性。

-----廣告,請繼續往下閱讀-----

現實中的量子去相干

在電子的雙狹縫干涉實驗中,若要知道電子通過雙狹縫時的確切位置和路徑,就必須偵測它,與之產生交互作用,導致量子去相干,干涉條紋消失。量子去相干的概念下,測量是一種交互作用,會引起量子去相干現象。隨著交互作用程度不同,量子系統會逐漸失去量子特性。

在現實世界中,所有量子系統都不可能完全孤立,與外界互動後,時間久了必然去相干。現實生活中的所有物體,雖然由量子系統組成,但當原子構築成更大的結構,會因彼此的交互作用喪失量子特性。因此,愛因斯坦問的「是不是只有當你在看它的時候,月亮才在那兒呢?」我們可以回答:「並不是這樣。」因為月亮已經不是量子系統。

薛丁格的貓不可能存在?

在「薛丁格的貓」實驗中,當作為量子系統的不穩定原子核被偵測到衰變後,交互作用就完成了,量子系統的狀態就確定了,貓也就死定了。此外,貓自身因量子去相干的關係,不會是量子系統,不可能同時處於生和死的狀態。

目前量子相關科技,如量子電腦、量子通訊等,在研發上遇到的困難,部分來自於量子去相干現象。量子電腦使用的量子位元必須保持在隔絕於外界、不受干擾的環境中,才能維持在量子態。一旦有風吹草動,量子位元可能出錯。隨著量子位元數目變多,要同時維持全部的量子態也變得更加困難,這些就是當前技術需要克服的挑戰了。

-----廣告,請繼續往下閱讀-----
歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

0

4
3

文字

分享

0
4
3
看電影學統計:「多重宇宙」與統計學「隨機變異」的概念
林澤民_96
・2023/03/15 ・2854字 ・閱讀時間約 5 分鐘

「多重宇宙」是我教統計時常用到的名詞,我用它來解釋隨機變異(stochastic variation)的概念:

例如民調抽得一個樣本,此樣本的受訪者固然是一群特定人士,但理論上我們可以抽出許多許多樣本,這些樣本之間雖然會有隨機變異,但樣本彼此的宏觀性質仍會相近。這些不同的隨機樣本,可以以「多重宇宙」一詞來形容。即使事實上只有一個樣本(一個宇宙),我們可以想像在多重宇宙的每個宇宙裡,都有一個微觀上隨機變異的樣本存在。

一個樣本(一個宇宙),在多重宇宙裡,每個宇宙都有一個微觀上隨機變異的樣本存在。 圖/IMDb

什麼是隨機樣本?

其實,數理統計學中「隨機樣本」(random sample)的概念指的是「一組獨立且同一分布的隨機變數」(a set of independently and identically distributed random variables)

在這個定義之下,樣本的每一個單位(資料點)都不是固定不變的數值,而是一個依循某機率分布的隨機變數。「隨機樣本」的要求是樣本所有的 N 個單位不但要互相獨立,而且要依循同一的機率分布。

我們可以想像我們平常所謂「一個樣本」的 N 個觀察值,每一個觀察值背後都有一個產生這個數值的隨機變數,也可以說所謂「一個樣本」其實只是這「一組獨立且同一分布的隨機變數」的一個「實現」(realization)。那麼,不同的樣本就是這「一組獨立且同一分布的隨機變數」的不同「實現」。這樣了解之下的不同樣本、不同「實現」,我喜歡把它們稱為「多重宇宙」。

-----廣告,請繼續往下閱讀-----

多重宇宙中的隨機變異,是我們在分析一個樣本的資料時必須作統計推論的原因。

比如我們分析本屆所有 113 位立委的議事行為,既然立委一共只有 113 人,我們分析的對象不就是立委的母體嗎?那是不是就不必做統計推論?

不是!原因是我們仍然可以想像有多重宇宙存在,每個宇宙都有 113 位立委,而同一位立委在不同的宇宙裡其議事行為會有隨機變異。正是因為這隨機變異的緣故,我們即使分析的是所謂「母體」,我們仍然要做統計推論。

圖/IMDb

「多重宇宙」的概念可以說就是「假如我們可以重來」的反事實思想實驗。被分析的單位不是在時間中重來一次,而是在多重宇宙的空間中展現「假如我們可以重來」的隨機變異的可能性。

名為 Monday 的這集 X 檔案電視劇中,主角的夢境不斷重複,每次夢境的結構大致類似,但細節卻有所不同,這正是「多重宇宙—隨機變異」概念的戲劇化。

-----廣告,請繼續往下閱讀-----

【媽的多重宇宙】(Everything Everywhere All at Once)也是。

「看,這是你的宇宙,一個漂浮在存在宇宙泡沫中的泡泡。周圍的每個氣泡都有細微的變化。但你離你的宇宙越遠,差異就越大。」——【媽的多重宇宙】對白

這是說:變異程度越小的是離你越近的宇宙,程度越大的是離你越遠的宇宙。這裡所謂變異的程度,在統計學裡可以用誤差機率分布的標準差來衡量。

什麼是隨機變異?

關於「隨機變異」這個概念,我最喜歡的例子是研究所入學申請的評審。

例如有 120 人申請入學,我詳細閱讀每人投遞的申請資料(包括性別、年齡等個人特質還有 SOP、大學成績單、GRE 分數、推薦信等),然後打一個 Y=0~100 的分數。全部評閱完畢,我便得到一份 N=120 的資料。這個資料包括了所有的申請者,那麼它是樣本呢?還是母體?

-----廣告,請繼續往下閱讀-----

如果我要分析我自己評分的決定因素,我會把分數 Y 回歸到性別、年齡等個人特質以及資料中可以量化的變數,例如大學成績平均分數(GPA)和 GRE 分數。跑這個迴歸時,需不需要做統計推論,看迴歸係數是不是有統計的顯著性?

我的看法是這份 N=120 的資料是樣本而不是母體,做迴歸分析當然要做統計推論。

那麼我資料的母體是什麼?

迴歸分析資料的母體其實是所謂「母體迴歸函數」(population regression function),也就是通常所說的「資料產生過程」(data generating process, DGP)。

這個 DGP 就是我在評閱每份資料時腦海中的思考機制,它考量了許多量化和質化的變數,賦予不同的權重,然後加總起來產生 Y。

分析資料的母體,也就是常說的「資料產生過程」。 圖/envato.elements

量化變數的權重就是母體迴歸函數的係數,質化變數則是母體迴歸函數的係數的誤差項。如果有很多質化變數攏總納入誤差項,我們通常可以根據中央極限定理,假設誤差項是呈現常態分布的隨機變數。這個誤差項就是「隨機變異」的來源。

評審入學申請,我通常只把所有資料評閱一次。這一次評審結果,會有幾家歡樂幾家愁,這便構成了一個「宇宙」。如果我第二天又把所有 120 份資料重新評分一遍,得到第二個樣本。因為我腦中的「資料產生過程」包括隨機變數,這個新樣本保證跟第一個樣本會有差異。用白話說:我的評分機制不精確,我自己甚至不知道我給每個量化變數多少權重,而且第二次評閱所用的權重也會跟第一次不盡相同,更不用說質化變數如何影響我的評分了。

-----廣告,請繼續往下閱讀-----

這第二個樣本,申請者的排比不會跟第一個樣本一樣,雖然也是幾家歡樂幾家愁,歡樂與愁悶的人也可能不一樣。這是第二個宇宙。依此類推,我們可以想像同樣的120位申請者,因為我「資料產生過程」的隨機變異,活在多重宇宙裡。

這些宇宙有的差異不大,根據【媽的多重宇宙】的說法,它們的泡泡互相之間的距離就較近,差異較大的宇宙,距離就較遠。如果申請者可以像電影所述那樣做宇宙跳躍,他們會看到自己在不同宇宙裡的命運。

我擔任德州大學政府系的研究部主任時,常耽心有申請者拿我們入學評審委員的評分資料去做迴歸分析。如果分析結果顯示種族、性別等變數有統計顯著性,說不定會被拿去控告我違反所謂「平權行動」(affirmative action)的相關法律。如果沒有顯著性,我就不耽心了。

多重宇宙之間會不會有「蝴蝶效應」?也就是宇宙跳躍時,隨機變異產生的微小差異,會不會造成新舊宇宙生命路徑的決然不同?

-----廣告,請繼續往下閱讀-----

在【媽的多重宇宙】中,伊芙琳只要當初做了一個不同的決定,以後的生命便可能跟現世(home universe)有很不一樣的命運。這在統計學也不是不可能。時間序列分析中,有些非線性模式只要初始值稍微改變,其後在時間中的路徑便會與原來的路徑發散開來。

你做時間序列分析時,會不會想想:時間序列資料究竟是樣本還是母體?如果你的研究興趣就只限於資料期間,那要不要做統計推論?當然要的,因為隨機變異的緣故。

如果你今年申請外國研究所不順利,也許在另一個宇宙裡,你不但獲名校錄取,得到鉅額獎學金,而且你的人生旅途將自此一路順遂,事業婚姻兩得意呢。

-----廣告,請繼續往下閱讀-----
文章難易度
林澤民_96
37 篇文章 ・ 246 位粉絲
台大電機系畢業,美國明尼蘇達大學政治學博士, 現任教於美國德州大學奧斯汀校區政府系。 林教授每年均參與中央研究院政治學研究所及政大選研中心 「政治學計量方法研習營」(Institute for Political Methodology)的教學工作, 並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。 林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

0

2
1

文字

分享

0
2
1
「倘若那天……」平行時空的你過得怎麼樣?——《超次元.聖戰.多重宇宙》
2046出版
・2024/02/10 ・1920字 ・閱讀時間約 4 分鐘

從無法逆轉的抉擇,到平行時空

但人總喜愛想像,現實世界中無法「重頭來過」,但小說和電影的虛擬世界當然可以。在好萊塢電影《今天暫時停止》(Groundhog Day, 1993;港譯:《偷天情緣》)之中,男主角最先猶如惡夢般不斷在同一天的清晨醒來,後來卻利用這個機會不斷改善他的追求技倆(不但 take two,更take three、take four……),最後贏得美人歸。

電影為觀眾帶來了美滿的結局。但筆者最早領略「如果」作為小說創作中的奇思妙想,卻令我傷感不已。話說筆者自初中已經愛上科幻小說。大概是中三、四那年,我在公共圖書館借了一本英文的短篇科幻小說集,其中一個以「如果」為題的故事(名稱早已忘記)令我畢生難忘。

故事中,一對恩愛的小夫妻駕車外出,丈夫有點兒不適所以改由太太開車。不幸途中遇上車禍,坐在司機位的太太重傷身亡。丈夫悲痛不已終日借酒澆愁,揮之不去的自責是「如果我那天沒有跟她對調位置……」。

一天,他在拾理太太的遺物時,竟然發現她的日記簿中有新的記事!讀將下來,原來在另一時空裡,兩人當天的確沒有對調位置,所以因車禍去世的是他而不是愛妻!

-----廣告,請繼續往下閱讀-----

這兩個「平行時空」原本不會重疊,卻不知怎的透過這本日記簿接通了。結果,「陰陽相隔」的倆人藉著日記互訴衷情。

圖/envato

這本已是十分淒美的情節,但後來日記中的字樣變得愈來愈模糊,最後完全消失,表示兩個「平行宇宙」最終分離而回到互不相通的狀態。筆者當年雖然只有十五、六歲,被觸動的哀愁卻是久久不能平復……。

年少的我已經深深感受到,人生中充滿了無數偶然的變數,而一個簡單的決定,足以改變一生。

多年後,我看到另一部電影《雙面情人》(Sliding Doors, 1998;港譯:《緣分兩面睇》),發覺也是用上了同一意念:女主角每天搭地鐵上班,但某天因事遲了一點而趕不上平日搭的那班車。電影基於「趕得及」和「趕不及」兩種情況,描述了女主角往後出現的兩種截然不同的人生。(我後來才知道,這乃改編自一部一九八一年的波蘭電影。)

-----廣告,請繼續往下閱讀-----

歷年來,運用這類意念創作的小說和電影可謂不少,近年流行的好萊塢「超級英雄」電影中,《奇異博士》(Doctor Strange, 2016)和它的續集《奇異博士 2:失控多重宇宙 》(Doctor Strange in the Multiverse of Madness, 2022;港譯:《奇異博士 2:失控多元宇宙》)更將「平行時空」的意念延伸為「多重宇宙」(Multiverse)。陣容更為龐大的《復仇者聯盟 3:無限之戰》(Avengers 3: theInfinity War, 2018)和《復仇者聯盟 4:終局之戰》(Avengers 4: Endgame, 2019)皆以同樣的意念作為故事主軸。當然,這些電影都由漫畫改編,亦即這些意念的出現時間比電影還要早得多。

《媽的多重宇宙》將平行時空的意念發揮得淋漓盡致。圖/giphy

但將這個意念發揮至極的,毫無疑問是二○二三年橫掃奧斯卡最佳電影、最佳導演、最佳編劇多項大獎的「怪雞」1 電影《媽的多重宇宙》(Everything, Everywhere All At Once,縮寫是 EEAAO;港譯:《神奇女俠玩救宇宙》)。華裔演員楊紫瓊(1962-)更因此而封后(最佳女演員);同樣是華裔的關繼威(1971-)以及潔美.李.寇蒂斯(Jamie Lee Curtis, 1958-)則分別獲得最佳男、女配角的殊榮。電影由兩位導演掌舵,雖然兩個都叫 Daniel,但一個是香港人關家永(Daniel M. Kwan, 1988-),一個是美國人丹尼爾.舒奈特(Daniel Scheinert, 1987-)。2 囊括了這麼多大獎,電影的風頭可謂一時無兩。由於有這麼多華人參與其間,全球絕大部分華人皆感到與有榮焉。

外國的評論幾乎一面倒地對這部電影讚譽有加,包括其中所包含的深刻人生哲理、愛情與理想之間的抉擇、亞裔移民在美國所遇到的生活困難、世代之間的價值矛盾、同性戀(非主流性取向)的社會認同問題,以及貫穿電影的、最重要的母、女之情。不少網友更留言說看至結局時感動流涕。反倒在華人世界,包括不少筆者所認識的朋友,皆對電影甚有保留,認為它寫情的部分毫無新意,而「科幻」的主題和情節則過於胡鬧不知云。(一些更認為電影被大肆吹捧,是近年席捲西方的「政治正確主義」的結果。他們更為另一位最佳女主角競逐者凱特.布蘭琪(Cate Blanchett, 1969-)不值。但那是另一篇文章的主題,暫且按下不表。)

註解

  1. 粵語,意指奇怪、荒謬。
  2. 因二人名字皆為「Daniel」,而被合稱為「Daniels」。

——本文摘自《超次元.聖戰.多重宇宙》,2023 年 11 月,二○四六出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----

討論功能關閉中。