0

8

1

文字

繁 | 简

0

8

1

好書搶先看數學妙用活得科學社會群體精神心理

統計數據是天大的謊言？我們該如何理解統計結果——《塗鴉學數學》

臉譜出版・2020/07/24 ・2606字・閱讀時間約 5 分鐘・SR值 517

・六年級

相關標籤：

熱門標籤：

作者／班‧歐林 (Ben Orlin)；譯者／王年愷

好，我們先把這件事情說清楚。統計數據是謊言，不應該採信。史上最聰明的人都這樣說過，不是嗎？

我的重點是什麼？沒錯，數字會欺騙。但文字也會——更不用說圖案、手勢、嘻哈音樂劇和募款電子郵件了。我們的道德制度會去責怪說謊的人，而不是說謊者用來說謊的媒介。

對我來說，最有意思的批評統計之詞不是批評統計學者的不誠實，而是批評數學本身。我們可以去理解統計的瑕疵，看到每一項統計數據想要捕捉什麼（以及它會刻意忽略什麼），來增強統計的價值。也許這樣我們就能成為威爾斯想像中的優良公民。

統計中的平均數（mean）其實分配不均？

做法：把你的資料全部加起來，把總數除以資料筆數。

-----廣告，請繼續往下閱讀-----

使用時機：平均數滿足了統計的一項基本需求：捕捉一個群體裡的「中間傾向」。籃球隊的身高是多少？你每天賣出幾個冰淇淋甜筒？這班學生的考試成績如何？如果你想用一個數值來概述一整個群體，平均數是合理的第一步。

為什麼不要相信它：平均數只管兩個資訊：總和，以及用來達成這個總和的人數。假如你曾經分配過海盜搶來的財寶，就知道哪裡危險了：分配的方式有許多種。每一個人分別貢獻了多少？這是否平均，還是嚴重偏袒某一方？

如果我吃掉一整個披薩，沒有留下任何一點給你，我們是否可以公正地說每個人「平均吃掉」半個披薩？你可以跟你邀來吃晚餐的客人說，「人類平均」有一顆卵巢和一顆睪丸，但這樣是不是會讓氣氛突然冷掉？（我試過；的確會。）

人類關心分配的問題，但平均數會忽略這個問題不談。

-----廣告，請繼續往下閱讀-----

但平均數還有一個有用之處：它的特性使得它容易計算出來。

假設你的考試成績是 87 分、88 分和 96 分。（對，你在這班如魚得水。）你的平均是多少？你不必耗費腦力去加減乘除，只需要重新分配就好了。

從你最後一次的成績拿走 6 分，把 3 分分給第一次、2 分分給第二次。這樣你的分數便是 90 分、90 分和 90 分，另外還多了 1 分。把這 1 分分配給三次考試，你就會得到平均為 90⅓，完全不需要多花腦力。

統計中的中位數（median）忽視懸殊差異？

做法：中位數是你的資料集裡最中間的那一筆。有一半的資料比它低，另一半比它高。

使用時機：中位數和平均數一樣，捕捉了一個群體裡的中間傾向。差別在於它對離群值（outlier）的敏感度—或者應該說，它有多麼不敏感。

-----廣告，請繼續往下閱讀-----

就拿家庭所得來說吧。美國的富裕家庭可能收入是貧窮家庭的幾十倍（甚至幾百倍）。平均數假裝讓每一個家庭都分配到收入總和的同樣數量，因此它會被這些離群值吸引走，離開大多數資料群聚的地方。這樣它算出的數值是 $75,000。

中位數抗拒離群值的吸引力。它指認出絕對位於美國正中間的家庭所得，這會是剛剛好的中間點，有一半的家庭比這富裕，另一半比這貧窮。在美國，這個數值接近 $58,000。

它和平均數不一樣；中位數可以讓人清楚看到「典型的」家庭是什麼樣子。

為什麼不要相信它：當你找到中位數後，你知道有一半的資料比它大，另一半比它小。但這些數值距離它多遠—只有半步之遙，還是要橫越整片大陸？你只會看到中間的那一塊，不會去管其他部分有多大或多小。這樣你可能誤判。

-----廣告，請繼續往下閱讀-----

當一位創業資本家投資新創公司時，他會預期大多數新創公司將失敗。十分之一的罕見成功案例彌補其他小小的損失。但中位數會忽略這樣的動態。它大叫：「通常的結果是負面的。快中止任務！」

同理，保險公司細心建立一套組合，因為他們知道千分之一的罕見災難會消滅多年以來不太高的獲利。但中位數忽略潛在的大災難。它鼓舞你：「通常的結果是正面的。永遠不要停下來！」

這就是為什麼你常常看到中位數與平均數並列。中位數報出通常的數值，平均數則是報出總數。它們像是兩位有缺陷的證人，兩個合起來的時候會說出比任何一個更全面的故事。

統計中的眾數（mode）排除與眾不同？

做法：它是最常見的數值，最潮、最時尚的資料點。假如每個數值都獨一無二、沒有重複呢？這樣的話，你可以把資料分類，然後把最常見到的那個類別稱為「眾數組」（modal category 或 modal class）。

-----廣告，請繼續往下閱讀-----

使用時機：眾數在進行民意調查和統計非數字的資料時非常出色。假如你想要簡述大家最喜歡的顏色，不可能「計算出顏色的總和」來算出平均數。或者，假如你在舉行投票，如果把所有的選票從「最自由派」排到「最保守派」，然後把公職給拿到中位數選票的候選人，這樣會讓選民發瘋。

為什麼不要相信它：中位數會忽略總和。平均數忽略總和的分布。那眾數呢？它會忽略總和、總和的分布和幾乎所有其他的事情。

眾數只代表單一個最常見的數值。但「常見」的意思不是「有代表性」。美國的薪資眾數是 0——這不是因為大多數美國人破產又沒工作，而是有領薪水的人分布在 $1 到 $100,000,000 的光譜各處，但所有沒領薪水的人都有相同的數字。這項數據不會告訴我們任何和美國有關的事。這項事實幾乎在所有國家都適用，因為這是金錢的運作方式所造成的。

改用「眾數組」只能解決一部分的問題。這樣會讓呈現資料的人有驚人的權力，因為他可以故意操弄分組的界線，來配合他的立場。依照我劃分界線的差異，我可以宣稱美國家庭所得的眾數位在 $10,000 到 $20,000（以 10,000 進位），或 $20,000 到 $40,000（以 20,000 進位），或 $38,000 到 $92,000（以所得稅級距進位）。

-----廣告，請繼續往下閱讀-----

同樣的資料集，同樣的統計數據，但最後的樣貌完全改變了，端視畫出這個樣貌的畫家採用哪一種畫框而定。

——本文摘自《塗鴉學數學：以三角形打造城市、用骰子來理解經濟危機、玩井字遊戲學策略思考，24堂建構邏輯思維、貫通幾何學、破解機率陷阱、弄懂統計奧妙的數學課》，2020 年 5 月，臉譜出版

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

臉譜出版

88 篇文章・ 255 位粉絲

臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書，每本書都能找到讀它的人，讀書可以僅是一種樂趣，甚或一個最尋常的生活習慣。

TRENDING 熱門討論

即時熱門

2

文字

2

買樂透真的可以賺錢？大數法則揭示了賭博的真相！——《統計，讓數字說話》

天下文化・2023/03/05 ・2394字・閱讀時間約 4 分鐘

相關標籤：

熱門標籤：

id S. Moore、諾茨 William I. Notz
譯者：鄭惟厚、吳欣蓓

什麼是大數法則？

期望值的定義是：它是可能結果的一種平均，但在計算平均時，機率大的結果占的比重較高。我們認為期望值也是另一種意義的平均結果，它代表了如果我們重複賭很多次，或者隨機選出很多家戶，實際上會看到的長期平均。這並不只是直覺而已。數學家只要用機率的基本規則就可以證明，用機率模型算出來的期望值，真的就是「長期平均」。這個有名的事實叫做大數法則。

大數法則
大數法則（law of large numbers）是指，如果結果為數值的隨機現象，獨立重複執行許多次，實際觀察到的結果的平均值，會趨近期望值。

大數法則和機率的概念密切相關。在許多次獨立的重複當中，每個可能結果的發生比例會接近它的機率，而所得到的平均結果就會接近期望值。這些事實表達了機遇事件的長期規律性。正如我們在第 17 章提過的，它們是真正的「平均數定律」。

大數法則解釋了：為什麼對個人來說是消遣甚至是會上癮的賭博，對賭場來說卻是生意。經營賭場根本就不是在賭博。大量的賭客贏錢的平均金額會很接近期望值。賭場經營者事先就算好了期望值，並且知道長期下來收入會是多少，所以並不需要在骰子裡灌鉛或者做牌來保證利潤。

賭場只要花精神提供不貴的娛樂和便宜的交通工具，讓顧客川流不息進場就行了。只要賭注夠多，大數法則就能保證賭場賺錢。保險公司的運作也很像賭場，他們賭買了保險的人不會死亡。當然有些人確實會死亡，但是保險公司知道機率，並且依賴大數法則來預測必須給付的平均金額。然後保險公司就把保費訂得夠高，來保證有利潤。

-----廣告，請繼續往下閱讀-----

在樂透彩上做手腳

我們都在電視上看過樂透開獎的實況轉播，看到號碼球上下亂跳，然後由於空氣壓力而隨機彈跳出來。我們可以怎麼樣對開出的號碼做手腳呢？ 1980 年的時候，賓州樂透就曾被面帶微笑的主持人以及幾個舞台工作人員動了手腳。

他們把 10 個號碼球中的 8 顆注入油漆，這樣做會把球變重，因此可保證開出中獎號碼的 3 個球必定有那 2 個沒被注入油漆的號碼。然後這些傢伙就下注買該 2 個號碼的所有組合。當 6-6-6 跳出來的時候，他們贏了 120 萬美元。是的，他們後來全被逮到。

歷史上曾有主持人在樂透上做手腳，後來賺了 120 萬美元隨後被逮捕。圖／envatoelements。

深入探討期望值

跟機率一樣，期望值和大數法則都值得再花些時間，探討相關的細節問題。

多大的數才算是「大數」？

大數法則是說，當試驗的次數愈來愈多，許多次試驗的實際平均結果會愈來愈接近期望值。可是大數法則並沒有說，究竟需要多少次試驗，才能保證平均結果會接近期望值。這點是要看機結果的變異性決定。

-----廣告，請繼續往下閱讀-----

結果的變異愈大，就需要愈多次的試驗，來確保平均結果接近期望值。機遇遊戲一定要變化大，才能保住賭客的興趣。即使在賭場待上好幾個鐘頭，結果也是無法預測的。結果變異性極大的賭博，例如累積彩金數額極大但極不可能中獎的州彩券，需要極多次的試驗，幾乎要多到不可能的次數，才能保證平均結果會接近期望值。

（州政府可不需要依賴大數法則，因為樂透彩金不像賭場的遊戲，樂透彩用的是同注分彩系統。在同注分彩系統裡面，彩金和賠率是由實際下注金額決定的。舉例來說，各州所辦的樂透彩金，是由全部賭金扣除州政府所得部分之後的剩餘金額來決定的。賭馬的賠率則是決定於賭客對不同馬匹的下注金額。）

雖然大部分的賭博遊戲不及樂透彩這樣多變化，但要回答大數法則的適用範圍，較實際的答案就是：賭場的贏錢金額期望值是正的，而賭場玩的次數夠多，所以可以靠著這個期望值贏錢。你的問題則是，你贏錢金額的期望值是負的。全體賭客玩的次數合起來算的話，當然和賭場一樣多，但因為期望值是負的，所以以賭客整體來看，長期下來一定輸錢。

然而輸的金額並不是由賭客均攤。有些人贏很多錢，有些人輸很多，而有些人沒什麼輸贏。賭博帶給人的誘惑，大部分是來自賭博結果的無法預測。而賭博這門生意仰賴的則是：對賭場來說，結果並非不可測的。

-----廣告，請繼續往下閱讀-----

有沒有保證贏錢的賭法？

把賭博很當回事的賭客常常遵循某種賭法，這種賭法每次下注的金額，是看前幾次的結果而定。比如說，在賭輪盤時，你可以每次把賭注加倍，直到你贏為止—或者，當然，直到你輸光為止。即使輪盤並沒有記憶，這種玩法仍想利用你有記憶這件事來贏。

你可以用一套賭法來戰勝機率嗎？不行，數學家建立的另一種大數法則說：如果你沒有無窮盡的賭本，那麼只要遊戲的各次試驗（比如輪盤的各次轉動）之間是獨立的，你的平均獲利（期望值）就會是一樣的。抱歉啦！

高科技賭博

全美國有超過 700,000 台吃角子老虎（拉霸）。從前，你丟硬幣進去再拉下把手，轉動三個輪子，每個輪子有 20 個圖案。但早就不是這樣了。現在的機器是電動遊戲，會閃出許多很炫的畫面，而結果是由隨機數字產生器決定的。

機器可以同時接受許多硬幣，有各種讓你眼花撩亂的中獎結果，還可以多台連線，共同累積成連線大獎。賭徒仍在尋找可以贏錢的賭法，但是長期下來，隨機數字產生器會保證賭場有 5% 的利潤。

-----廣告，請繼續往下閱讀-----

——本文摘自《統計，讓數字說話》，2023 年 1 月，天下文化出版，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 2

登入與大家一起討論

#1

a0921003785彼得潘 2023/03/12

我去過澳門兩次印象極好的是車讓人地理幅員不大走路能到任何地方
我也進娛樂城玩“老虎機”其他的都帶“豪賭”性質
吃角子機較省連玩幾天就千元港幣上下
娛樂嘛早知道贏不了錢在乎的是偶而的小贏快感

天下文化

142 篇文章・ 626 位粉絲

天下文化成立於1982年。一直堅持「傳播進步觀念，豐富閱讀世界」，已出版超過2,500種書籍，涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫，也持續引領台灣社會與國際重要管理潮流同步接軌。

TRENDING 熱門討論

即時熱門

3

1

文字

0

3

1

我的身高有特別矮嗎？為什麼大多數女性身高都「差不多」！——《統計，讓數字說話》

天下文化・2023/03/04 ・2634字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

id S. Moore、諾茨 William I. Notz
譯者：鄭惟厚、吳欣蓓

什麼是常態分布？

圖 13.3 和 13.4 裡的密度曲線，同屬一族特別重要的曲線：常態曲線。圖 13.7 再呈現了兩個常態密度曲線。常態曲線都是對稱、單峰、鐘形的，尾部降得很快，所以我們應該不會看到離群值。由於常態分布是對稱的，所以平均數和中位數都落在曲線的中間位置，而這也是尖峰所在。

常態曲線還有一個特別性質：我們可以用目測方式在曲線上找到它的標準差。對大部分其他的密度曲線，沒有法子這樣做。做法是這樣的。想像你要從山頂開始滑雪，山的形狀和常態曲線一樣。起先，你從山頂出發時，往下滑的角度非常陡：

幸好，在你還沒有直直墜下之前，斜坡就變緩了，你愈往下滑出去，坡度愈平：

曲率（curvature）發生改變的地方，是在平均數兩側、各距平均數一個標準差的位置。圖 13.7 的兩條曲線上都標示出了標準差。你如果用鉛筆沿著常態曲線描，應該可以感受到曲率改變的地方，進而找出標準差。

-----廣告，請繼續往下閱讀-----

常態曲線有個特別的性質是，只要知道平均數及標準差，整條曲線就完全確定了。平均數把曲線的中心定下來，而標準差決定曲線的形狀。變動常態分布的平均數並不會改變曲線的形狀，只會改變曲線在 x 軸上的位置。但是，變動標準差卻會改變常態曲線的形狀，如圖 13.7 所示。標準差較小的分布，散布的範圍比較小，尖峰也比較陡。以下是常態曲線基本性質的總結：

常態密度曲線的特性

常態曲線（normal curve）是對稱的鐘形曲線，具備以下性質：

只要給了平均數和標準差，就可以完全描述特定的常態曲線。
平均數決定分布的中心，這個位置就在曲線的對稱中心。
標準差決定曲線的形狀，標準差是指從平均數到平均數左側或右側的曲率變化點的距離。

為什麼常態分布在統計裡面很重要呢？首先，對於某些真實數據的分布，用常態曲線可以做很好的描述。最早將常態曲線用在數據上的是大數學家高斯（Carl Friedrich Gauss, 1777 – 1855）。

天文學家或測量員仔細重複度量同一個數量時，所得出的量測值會有小誤差，高斯就利用常態曲線來描述這些小誤差。你有時候會看到有人把常態分布叫做「高斯分布」，就是為了紀念高斯。

-----廣告，請繼續往下閱讀-----

十九世紀的大部分時間中，常態曲線曾叫做「誤差曲線」，也就因為常態曲線最早是用來描述量測誤差的分布。後來慢慢發現，有些生物學或心理學上的變數也大致符合常態分布時，「誤差曲線」這個名詞就不再使用了。1889 年，高騰（Francis Galton）率先把這些曲線稱做「常態曲線」。高騰是達爾文的表弟，他開拓了遺傳的統計研究。

常態分布的形狀：鐘形曲線

人類智慧高低的分布，是不是遵循常態分布的「鐘形曲線」？IQ 測驗的分數的確大致符合常態分布，但那是因為測驗分數是根據作答者的答案計算出來的，而計算方式原本就是以常態分布為目標所設計的。要說智慧分布遵循鐘形曲線，前提是：大家都同意 IQ 測驗分數可以直接度量人的智慧。然而許多心理學家都不認為世界上有某種人類特質，可以讓我們稱為「智慧」，並且可以用一個測驗分數度量出來。

當我們從同一母體抽取許多樣本時，諸如樣本比例（當樣本大小很大、而比例的數值中等時）及樣本平均數（當我們從相同母體取出許多樣本時）這類統計量的分布，也可以用常態曲線來描述。我們會在後面的章節進一步細談統計分布。

抽樣調查結果的誤差界限，也常常用常態曲線來算。然而，即使有許多類的數據符合常態分布，仍然有許多是不符合的，比如說，大部分的所得分布是右偏的，因而不是常態分布。非常態的數據就和不平常的人一樣，不僅常見，而且有時比常態的數據還有趣。

-----廣告，請繼續往下閱讀-----

68 – 95 – 99.7 規則

常態曲線有許多，每一個常態曲線都可以用各自的平均數和標準差來描述。所有常態曲線都有許多共同性質，特別要提的是，對常態分布來說，標準差是理所當然的量度單位。這件事實反映在下列規則當中。

68 – 95 – 99.7 規則
在任何常態分布當中，大約有 68% 的觀測值，落在距平均數一個標準差的範圍內。
95% 的觀測值，落在距平均數兩個標準差的範圍內。
99.7% 的觀測值，落在距平均數三個標準差的範圍內。

圖13.8、68–95–99.7規則。圖／《統計，讓數字說話》。

圖 13.8 說明了 68 – 95 – 99.7 規則。記住這三個數字之後，你就可以在不用一直做囉嗦計算的情況下考慮常態分布。不過還得記住，沒有哪組數據是百分之百用常態分布描述的。不管對於 SAT 分數，或者蟋蟀的身長， 68–95–99.7 規則都只是大體正確。

年輕女性的身高常態

年輕女性的身高約略是平均數 63.7 英寸、標準差 2.5 英寸的常態分布。要運用 68 – 95 – 99.7 規則，首先得畫一個常態曲線的圖。圖 13.9 說明了這個規則用在女性的身高上會是什麼情況。

任何常態分布都有一半的觀測值在平均數之上，所以年輕女性中有一半高於 63.7 英寸。

-----廣告，請繼續往下閱讀-----

任何常態分布的中間68%觀測值，會在距平均數一個標準差的範圍內。而這 68 %中的一半，即 34 %，會在平均數之上。所以有 34 %的年輕女性，身高在 63.7 英寸及 66.2 英寸之間。把身高不到 63.7 英寸的 50% 女性也加上去，可以得知總共有84%的年輕女性身高不到 66.2 英寸。所以推知超過 66.2 英寸的人占 16%。

任何常態分布的中間 95% 的值，在距平均數兩個標準差範圍內。這裡的兩個標準差是 5 英寸，所以年輕女性身高的中間 95% 是在 58.7（= 63.7 − 5）和 68.7（= 63.7 + 5）英寸之間。

另外 5% 女性的身高，就超出 58.7 到 68.7 英寸的範圍之外。因為常態分布是對稱的，這其中有一半的女性是在矮的那一頭。年輕女性中最矮的 2.5% ，身高不到 58.7 英寸（149 公分）。

任何常態分布中幾乎所有（99.7%）的值，在距平均數三個標準差的範圍內，所以幾乎所有年輕女性的身高，都在 56.2 及 71.2 英寸之間。

-----廣告，請繼續往下閱讀-----

——本文摘自《統計，讓數字說話》，2023 年 1 月，天下文化出版，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

天下文化

142 篇文章・ 626 位粉絲

天下文化成立於1982年。一直堅持「傳播進步觀念，豐富閱讀世界」，已出版超過2,500種書籍，涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫，也持續引領台灣社會與國際重要管理潮流同步接軌。

TRENDING 熱門討論

即時熱門

1

4

文字

1

4

什麼是抽樣誤差？老師和媒體都沒教你的那些事

林澤民・2020/11/19 ・3758字・閱讀時間約 7 分鐘・SR值 550

・八年級

相關標籤：

熱門標籤：

本文原文刊登時間為2020年11月6日，原文標題為《什麼是抽樣誤差？為何外國媒體報導的與老師教的不一樣？》

美國總統大選進入最後一周時，許多媒體紛紛在搖擺州進行民調，其中佛羅里達是選情極其緊繃的大州。

美國2020總統大選情勢劍拔弩張，許多州出現極小的得票差距。圖／Pixabay。

華盛頓郵報-ABC於10/24-10/29在該州民調的結果顯示：在 824 位可能投票的選民中，川普領先拜登 50−48個百分點，因為抽樣誤差為 ± 4.0 %，報導結論佛州選情難分難解。紐約時報於10/27-10/31在該州民調的結果則顯示：在1,451位可能投票的選民中，拜登領先川普47−44個百分點，其抽樣誤差為 ± 3.2%。

兩個民調相隔只 2−3 天，拜登從落後 2 個百分點轉為領先 3 個百分點，這領先程度有統計顯著性嗎？（佛州開票 96% 的結果是川普 51.2% 拜登 47.8%）

這裡有兩個相關問題要先解決：

第一、樣本數 N＝1,451 為何抽樣誤差是 ±3.2%？這個數字對嗎？一般民調若樣本數在N＝1,000左右，抽樣誤差不是大約 ±3% 嗎？為何紐時的樣本數高達 N＝1,451，抽樣誤差不是更低？反而更高？
第二、如果抽樣誤差低於±3%，那拜登在佛州領先川普超過抽樣誤差，便可以說這差距有統計顯著性嗎？

什麼是「抽樣誤差」？

首先解釋第一個問題：所謂「抽樣誤差」（margin of error）的是當母體比例為π時，重複抽取許多樣本所得樣本比例 P 的標準差乘以 1.96。更詳細地說：當母體比例為π時，重複抽取許多樣本數為 N 的樣本會得到許多不同的P值，這些 P 值的分佈稱作 P 的「抽樣分佈」（sampling distribution）。

-----廣告，請繼續往下閱讀-----

根據中央極限定裡，P 的抽樣分佈是以π為中心的常態分佈，其變異量是 π（1-π）/N。我們若以π為中心取一個區間（π-m, π+m）讓 P 落在區間內的機率為 95%，則代表此區間寬度的 m 即為 95% 信心水平之下的抽樣誤差，其公式為：

雖然這個公式可以適用於任何的π值，在沒有特別資訊的情況下，一般以 π=0.5 來計算 MOE。

舉例來說，聯合報在 2019 年 12 月 12-14 日實施了一個民調，它在報導中特別就調查方法報告如下：

「調查於十二月十二日至十四日晚間進行，成功訪問一千一百一十位合格選民，另二百九十一人拒訪；在百分之九十五信心水準下，抽樣誤差正負三點零個百分點以內。採全國住宅及手機雙電話底冊為母體作尾數隨機抽樣，藉由增補市話無法接觸的唯手機族樣本改善傳統市話抽樣缺點，調查結果依廿歲以上性別、年齡及縣市人口結構加權，調查經費來自聯合報社。」

-----廣告，請繼續往下閱讀-----

同樣的，蘋果日報在報導其於 2019 年12月27-29 實施的民調時也提到：

「本次民調由《蘋果新聞網》委託台灣指標公司執行，經費來源是《蘋果新聞網》，調查對象為設籍在全國22縣市且年滿20歲民眾，調查期間為12月27日至29日，採用市內電話抽樣調查，並使用CATI系統進行訪問。市內電話抽樣依縣市採分層比例隨機抽樣法，再以電話號碼後2碼隨機抽出，成功訪問1,069位受訪者，在95%信心水準下，抽樣誤差為±3.0%。」

依上述公式分別代入 N=1,110 及 N=1069 可得 MOE＝2.94%、3.00%，正是報導所說的「抽樣誤差正負三點零個百分點以內」、「抽樣誤差為 ±3.0%」。

紐時在佛州的選前最後民調的樣本數 N=1,451 要高出 1,110 甚多，為何它所報告的抽樣誤差反而較大？我們若把 N=1,451 套入上式，不是應該得到 MOE=2.57%嗎？為何紐時說是 3.2%？

-----廣告，請繼續往下閱讀-----

其實不只紐時，華郵／ABC 民調的抽樣誤差 4.0% 也超過了以 N=824套入上式所算得的 3.41%。為何美國媒體計算民調抽樣誤差與基本統計學教科書所教的算法不一樣？華郵／ABC在描述其民調方法時特別強調其抽樣誤差是在「納入設計效應」（including design effects）之後計算所得；什麼是「設計效應」？

什麼是「設計效應」？

這個問題牽涉到「有效樣本數」（effective sample size）的概念。所謂「有效樣本數」並不是統計分析中除去遺漏值之後的「有效N」（valid N），而是在調整受訪者代表性之後的「加權樣本數」（weighted sample size）。

下面我會說明：紐時所報告的抽樣誤差其實是根據「有效樣本數」調整過的抽樣誤差，也就是納入設計效應之後算得的抽樣誤差。

一般民調樣本因為不是使用「簡單隨機抽樣」（simple random sampling）得到的結果，母體中每人被抽到的機率並不一致。因此，樣本中某些族群的代表性並不能反映它們在母體中的代表性。為了讓各族群在樣本中的代表性和母體一致，樣本必須經過加權處理。上述聯合報和蘋果日報的報導便報告了它們民調的抽樣設計和加權的概略步驟。一般民調機構會把加權所使用的權重存為資料中的一個變數，其數值代表樣本中每個受訪者所代表族群的權重。

-----廣告，請繼續往下閱讀-----

例如「台灣選舉與民主化研究」2020年民調資料合併檔（TEDS2020）中便有這樣的一個權值變數w，它的值介於0.295至3.474之間，其變異範圍反映了各族群在原樣本中的代表性與它們在母體中的代表性差異的程度。

由於加權的關係，原來的樣本數已不能有效反映加權後的樣本數，因此有所謂「有效樣本數」(effective sample size)的概念，有效樣本數的計算方式因加權方式而異，抽樣理論大師 Leslie Kish 建議了一個粗略的算法：

除非根本沒有加權，否則這個公式一定小於N，也就是加權後的有效樣本數會比原樣本數小。以TEDS2020原樣本數N=2,847為例，ESS=2,359，也就是加權後的有效樣本數只有原樣本數的83%。

我們如果以加權後的有效樣本數來計算抽樣誤差，則調整後的抽樣誤差會比根據原樣本數算出的抽樣誤差還大。這個差異，可以說是因為實際樣本之抽樣設計背離簡單隨機抽樣而造成的結果，我們定義「設計效應」（design effect）為：

-----廣告，請繼續往下閱讀-----

由於抽樣誤差之平方與樣本數成反比，上式也可導出：

再以TEDS2020為例，DE=1/0.83=1.21。換算可以得到加權後的抽樣誤差是原抽樣誤差的 1.1 倍。

跟據紐時所報告的加權後的抽樣誤差以及由原樣本數所算出的簡單隨機抽樣之抽樣誤差，我們可以算出佛州民調的設計效應：

這設計效應比TEDS2020要高出很多！這可能是因為TEDS採用分層隨機抽樣面訪，其設計比起新聞媒體採用電話＋手機有所不同。有了設計效應的估計值，我們就可以算紐時佛州民調的有效樣本數了：它的 ESS=936，只有原樣本數的三分之二。相對而言，華郵／ABC的佛州民調的設計效應是 DE=1.37，其有效樣本數是ESS＝600.

-----廣告，請繼續往下閱讀-----

如果我們以 N＝936 算基於簡單隨機抽樣設計的抽樣誤差，它會恰恰是紐時所報告的 3.2%。以 N＝600 來算的話，抽樣誤差就剛好是ABC／華郵所報告的 4.0%。

值得注意的是：如果紐時效仿聯合報用原樣本數 N＝1,451 計算抽樣誤差，這2.57% 的誤差值可能會讓很多讀者誤以為拜登領先川普的三個百分點已經超過超過抽樣誤差，因而具有統計上的顯著性。紐約時報的分析家沒有這樣做，這是他們的嚴謹之處。

以有效樣本數算候選人支持度差距的顯著性

然而選舉用的對比式民調還有第二個問題：一般媒體通常只報告單一比例的抽樣誤差，而對比式民調著重的不是單一比例，而是兩位候選人所獲支持度比例的差距。此差距的抽樣誤差與單一比例的抽樣誤差完全不一樣，它可以達到單一比例抽樣誤差的兩倍或更多。

關於對比式選舉民調的抽樣誤差，我曾寫過一篇文章指出一般媒體在報導時的錯誤解讀，並提出一個計算正確抽樣誤差的公式。
這篇文章請見：對比式選舉民調的錯誤解讀

佛州民調結果拜登領先川普47−44。我們現在可以用有效樣本數來算拜登領先差距的抽樣誤差了。我在網上提供了一個速算表歡迎讀者下載使用。

-----廣告，請繼續往下閱讀-----

計算的結果是抽樣誤差高達 6.03 %：拜登領先的差距其實還在誤差範圍之內。

注意：如果以原樣本數 N＝1,451 代入速算表，則抽樣誤差為 4.91%，比 6.03% 要小得多。

關於民調報導，還有很多進步空間

台灣的媒體在報導對比式民調的結果時，似乎都像聯合報、蘋果日報一樣報告以「簡單隨機抽樣」為假設的單一比例抽樣誤差，而未考慮設計效應。這個抽樣誤差本來就太小，再加上對比所產生的問題，可以說是雙重的誤導！

外國媒體的民調報導近年來有進步。除了一般會報告根據設計效應調整過的抽樣誤差以外，有些民調機構也報告了對比式民調抽樣誤差的正確解讀方式。有興趣的讀者可以參考 Pew Research Center 這篇解釋抽樣誤差的文章：5 Key Things to Know about the Margin of Error in Election Polls

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 1

登入與大家一起討論

#1

b10312037 2023/11/18

民調抽樣誤差留名！

林澤民

37 篇文章・ 247 位粉絲

台大電機系畢業，美國明尼蘇達大學政治學博士，現任教於美國德州大學奧斯汀校區政府系。林教授每年均參與中央研究院政治學研究所及政大選研中心「政治學計量方法研習營」(Institute for Political Methodology)的教學工作，並每兩年5-6月在台大政治系開授「理性行為分析專論」密集課程。林教授的中文部落格多為文學、藝術、政治、社會、及文化評論。

TRENDING 熱門討論

即時熱門

統計數據是天大的謊言？我們該如何理解統計結果——《塗鴉學數學》

統計中的平均數（mean）其實分配不均？

統計中的中位數（median）忽視懸殊差異？

統計中的眾數（mode）排除與眾不同？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是大數法則？

深入探討期望值

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是常態分布？

常態密度曲線的特性

常態分布的形狀：鐘形曲線

68 – 95 – 99.7 規則

年輕女性的身高常態

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是「抽樣誤差」？

什麼是「設計效應」？

以有效樣本數算候選人支持度差距的顯著性

關於民調報導，還有很多進步空間

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見