0

0
0

文字

分享

0
0
0

民調可靠嗎?

潘 震澤
・2011/12/23 ・1105字 ・閱讀時間約 2 分鐘 ・SR值 588 ・九年級

總統大選在即,除了選舉文宣及口水戰不斷外,各式各樣的民意調查結果幾乎攻佔了每日新聞版面,牽扯整體社會的神經。民調領先的一方,自不免心喜,民調落後者,則有各種安慰排解之道;甚至有候選人怒斥平面媒體民調不公,網路民意才準。我們不免要問:到底民調可靠嗎?

人腦對抽象數字一向不怎麼靈光,如果牽扯到機率及統計,更是少根筋;其中緣由不難理解,因為人類存在的大多數時間裡,直覺反應要比計算機率更有助存活。且不提兩千多年前發明幾何學的希臘人不懂算術,機率與統計的觀念近四百年來才逐漸發展完備;這也難怪多數人看到數字就敬而遠之,更不要說想弄清楚,以致於讓有心玩弄數字的人有機可乘。

從事實驗科學的人都知道,單一數據是無法取信於人的,必須有多次反覆才成;但究竟要重複幾次、或採取多少樣本才夠,就需要統計的幫忙。我碰過兩種實驗工作者:一是不信統計,認為有就是有,沒有就是沒有,無需統計告知;另一是迷信並利用統計,如果統計分析不顯著,就增加樣本以降低標準差,直達顯著為止。自然,兩種都不是正確的態度。

以簡單的機率來說,人的直覺判斷就有許多錯誤;好比擲骰子連續出現一系列小數字後,一般人會認為下一個應該是大數字,一連生了幾個女孩的夫妻會認為下一個應該是男孩;其實在沒有外力影響下,獨立事件的發生機率每次都相同,不受先前事件影響。更複雜一些的問題,好比在多少人當中可能出現兩個生日相同的人;答案是只要 57 人就有 99% 的發生機率,比我們直覺認為的要少得多。

無論是做實驗還是民調,都是試圖以少數樣本一窺整體族群的全貌;因此如何取樣,就成了一門學問。以生物實驗而言,取樣生物的品種、年齡、性別、健康情況,以及取樣的方法、時間等,都可能影響結果。同理,民調也有許多講究,像如何選取受訪者、數目要多少、採訪方式、如何設計問題、結果如何分析等都是;其中尤以頭一項最重要。

科學的民調取樣講究分層及隨機,也就是得按地區、人口密度,以隨機方式抽取,而不是就近取材,甚或以特定子群為對象(好比網路族),得出以偏概全的結果。如果取樣方法正確,那麼只要有一千人的樣本就可有 90% 的機率得出正確的族群分布,誤差在 2% 上下;這也是目前多數民調所依據的法則。

且不說國內的民調機構是否都做到了公正取樣,以少數樣本推出整個族群的分布,本身就免不了誤差存在,更不要說如今都以電話採訪,看不到對象,加上許多人不願意受訪或根本接不到電話,益增誤差。曉得這些缺失,對民調結果當能以平常心看待,僅供參考但不迷信;只不過民調差距過大,仍期待奇蹟出現的人,注定是要失望的。

本文原發表於作者部落格生理人生[2011-12-22]

文章難易度
潘 震澤
13 篇文章 ・ 1 位粉絲
在大學裡教了二十幾年書,專長是生理學(再往下細分是「神經內分泌學」)。十來年前從象牙塔裡伸出頭來,投入科普書譯介及專欄寫作工作,至今已翻譯了十來本科普書、兩本生理學教科書,以及兩本科學散文結集。目前任教美國大學。

2

2
2

文字

分享

2
2
2
買樂透真的可以賺錢?大數法則揭示了賭博的真相!——《統計,讓數字說話》
天下文化_96
・2023/03/05 ・2394字 ・閱讀時間約 4 分鐘

  • id S. Moore、諾茨 William I. Notz
  • 譯者:鄭惟厚、吳欣蓓

什麼是大數法則?

期望值的定義是:它是可能結果的一種平均,但在計算平均時,機率大的結果占的比重較高。我們認為期望值也是另一種意義的平均結果,它代表了如果我們重複賭很多次,或者隨機選出很多家戶,實際上會看到的長期平均。這並不只是直覺而已。數學家只要用機率的基本規則就可以證明,用機率模型算出來的期望值,真的就是「長期平均」。這個有名的事實叫做大數法則。

大數法則
大數法則(law of large numbers)是指,如果結果為數值的隨機現象,獨立重複執行許多次,實際觀察到的結果的平均值,會趨近期望值。

大數法則和機率的概念密切相關。在許多次獨立的重複當中,每個可能結果的發生比例會接近它的機率,而所得到的平均結果就會接近期望值。這些事實表達了機遇事件的長期規律性。正如我們在第 17 章提過的,它們是真正的「平均數定律」。

大數法則解釋了:為什麼對個人來說是消遣甚至是會上癮的賭博,對賭場來說卻是生意。經營賭場根本就不是在賭博。大量的賭客贏錢的平均金額會很接近期望值。賭場經營者事先就算好了期望值,並且知道長期下來收入會是多少,所以並不需要在骰子裡灌鉛或者做牌來保證利潤。

賭場只要花精神提供不貴的娛樂和便宜的交通工具,讓顧客川流不息進場就行了。只要賭注夠多,大數法則就能保證賭場賺錢。保險公司的運作也很像賭場,他們賭買了保險的人不會死亡。當然有些人確實會死亡,但是保險公司知道機率,並且依賴大數法則來預測必須給付的平均金額。然後保險公司就把保費訂得夠高,來保證有利潤。

  • 在樂透彩上做手腳

我們都在電視上看過樂透開獎的實況轉播,看到號碼球上下亂跳,然後由於空氣壓力而隨機彈跳出來。我們可以怎麼樣對開出的號碼做手腳呢? 1980 年的時候,賓州樂透就曾被面帶微笑的主持人以及幾個舞台工作人員動了手腳。

他們把 10 個號碼球中的 8 顆注入油漆,這樣做會把球變重,因此可保證開出中獎號碼的 3 個球必定有那 2 個沒被注入油漆的號碼。然後這些傢伙就下注買該 2 個號碼的所有組合。當 6-6-6 跳出來的時候,他們贏了 120 萬美元。是的,他們後來全被逮到。

歷史上曾有主持人在樂透上做手腳,後來賺了 120 萬美元隨後被逮捕。圖/envatoelements

深入探討期望值

跟機率一樣,期望值和大數法則都值得再花些時間,探討相關的細節問題。

  • 多大的數才算是「大數」?

大數法則是說,當試驗的次數愈來愈多,許多次試驗的實際平均結果會愈來愈接近期望值。可是大數法則並沒有說,究竟需要多少次試驗,才能保證平均結果會接近期望值。這點是要看機結果的變異性決定。

結果的變異愈大,就需要愈多次的試驗,來確保平均結果接近期望值。機遇遊戲一定要變化大,才能保住賭客的興趣。即使在賭場待上好幾個鐘頭,結果也是無法預測的。結果變異性極大的賭博,例如累積彩金數額極大但極不可能中獎的州彩券,需要極多次的試驗,幾乎要多到不可能的次數,才能保證平均結果會接近期望值。

(州政府可不需要依賴大數法則,因為樂透彩金不像賭場的遊戲,樂透彩用的是同注分彩系統。在同注分彩系統裡面,彩金和賠率是由實際下注金額決定的。舉例來說,各州所辦的樂透彩金,是由全部賭金扣除州政府所得部分之後的剩餘金額來決定的。賭馬的賠率則是決定於賭客對不同馬匹的下注金額。)

雖然大部分的賭博遊戲不及樂透彩這樣多變化,但要回答大數法則的適用範圍,較實際的答案就是:賭場的贏錢金額期望值是正的,而賭場玩的次數夠多,所以可以靠著這個期望值贏錢。你的問題則是,你贏錢金額的期望值是負的。全體賭客玩的次數合起來算的話,當然和賭場一樣多,但因為期望值是負的,所以以賭客整體來看,長期下來一定輸錢。

然而輸的金額並不是由賭客均攤。有些人贏很多錢,有些人輸很多,而有些人沒什麼輸贏。賭博帶給人的誘惑,大部分是來自賭博結果的無法預測。而賭博這門生意仰賴的則是:對賭場來說,結果並非不可測的。

對賭場來說,贏錢金額期望值為正。圖/envatoelements
  • 有沒有保證贏錢的賭法?

把賭博很當回事的賭客常常遵循某種賭法,這種賭法每次下注的金額,是看前幾次的結果而定。比如說,在賭輪盤時,你可以每次把賭注加倍,直到你贏為止—或者,當然,直到你輸光為止。即使輪盤並沒有記憶,這種玩法仍想利用你有記憶這件事來贏。

你可以用一套賭法來戰勝機率嗎?不行,數學家建立的另一種大數法則說:如果你沒有無窮盡的賭本,那麼只要遊戲的各次試驗(比如輪盤的各次轉動)之間是獨立的,你的平均獲利(期望值)就會是一樣的。抱歉啦!

  • 高科技賭博

全美國有超過 700,000 台吃角子老虎(拉霸)。從前,你丟硬幣進去再拉下把手,轉動三個輪子,每個輪子有 20 個圖案。但早就不是這樣了。現在的機器是電動遊戲,會閃出許多很炫的畫面,而結果是由隨機數字產生器決定的。

機器可以同時接受許多硬幣,有各種讓你眼花撩亂的中獎結果,還可以多台連線,共同累積成連線大獎。賭徒仍在尋找可以贏錢的賭法,但是長期下來,隨機數字產生器會保證賭場有 5% 的利潤。

——本文摘自《統計,讓數字說話》,2023 年 1 月,天下文化出版,未經同意請勿轉載。

所有討論 2
天下文化_96
129 篇文章 ・ 613 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

2
1

文字

分享

0
2
1
我的身高有特別矮嗎?為什麼大多數女性身高都「差不多」!——《統計,讓數字說話》
天下文化_96
・2023/03/04 ・2634字 ・閱讀時間約 5 分鐘

  • id S. Moore、諾茨 William I. Notz
  • 譯者:鄭惟厚、吳欣蓓

什麼是常態分布?

圖 13.3 和 13.4 裡的密度曲線,同屬一族特別重要的曲線:常態曲線。圖 13.7 再呈現了兩個常態密度曲線。常態曲線都是對稱、單峰、鐘形的,尾部降得很快,所以我們應該不會看到離群值。由於常態分布是對稱的,所以平均數和中位數都落在曲線的中間位置,而這也是尖峰所在。

常態曲線還有一個特別性質:我們可以用目測方式在曲線上找到它的標準差。對大部分其他的密度曲線,沒有法子這樣做。做法是這樣的。想像你要從山頂開始滑雪,山的形狀和常態曲線一樣。起先,你從山頂出發時,往下滑的角度非常陡:

幸好,在你還沒有直直墜下之前,斜坡就變緩了,你愈往下滑出去,坡度愈平:

曲率(curvature)發生改變的地方,是在平均數兩側、各距平均數一個標準差的位置。圖 13.7 的兩條曲線上都標示出了標準差。你如果用鉛筆沿著常態曲線描,應該可以感受到曲率改變的地方,進而找出標準差。

常態曲線有個特別的性質是,只要知道平均數及標準差,整條曲線就完全確定了。平均數把曲線的中心定下來,而標準差決定曲線的形狀。變動常態分布的平均數並不會改變曲線的形狀,只會改變曲線在 x 軸上的位置。但是,變動標準差卻會改變常態曲線的形狀,如圖 13.7 所示。標準差較小的分布,散布的範圍比較小,尖峰也比較陡。以下是常態曲線基本性質的總結:

常態密度曲線的特性

常態曲線(normal curve)是對稱的鐘形曲線,具備以下性質:

  • 只要給了平均數和標準差,就可以完全描述特定的常態曲線。
  • 平均數決定分布的中心,這個位置就在曲線的對稱中心。
  • 標準差決定曲線的形狀,標準差是指從平均數到平均數左側或右側的曲率變化點的距離。

為什麼常態分布在統計裡面很重要呢?首先,對於某些真實數據的分布,用常態曲線可以做很好的描述。最早將常態曲線用在數據上的是大數學家高斯(Carl Friedrich Gauss, 1777 – 1855)。

天文學家或測量員仔細重複度量同一個數量時,所得出的量測值會有小誤差,高斯就利用常態曲線來描述這些小誤差。你有時候會看到有人把常態分布叫做「高斯分布」,就是為了紀念高斯。

十九世紀的大部分時間中,常態曲線曾叫做「誤差曲線」,也就因為常態曲線最早是用來描述量測誤差的分布。後來慢慢發現,有些生物學或心理學上的變數也大致符合常態分布時,「誤差曲線」這個名詞就不再使用了。1889 年,高騰(Francis Galton)率先把這些曲線稱做「常態曲線」。高騰是達爾文的表弟,他開拓了遺傳的統計研究。

常態分布的形狀:鐘形曲線

人類智慧高低的分布,是不是遵循常態分布的「鐘形曲線」?IQ 測驗的分數的確大致符合常態分布,但那是因為測驗分數是根據作答者的答案計算出來的,而計算方式原本就是以常態分布為目標所設計的。要說智慧分布遵循鐘形曲線,前提是:大家都同意 IQ 測驗分數可以直接度量人的智慧。然而許多心理學家都不認為世界上有某種人類特質,可以讓我們稱為「智慧」,並且可以用一個測驗分數度量出來。

當我們從同一母體抽取許多樣本時,諸如樣本比例(當樣本大小很大、而比例的數值中等時)及樣本平均數(當我們從相同母體取出許多樣本時)這類統計量的分布,也可以用常態曲線來描述。我們會在後面的章節進一步細談統計分布。

抽樣調查結果的誤差界限,也常常用常態曲線來算。然而,即使有許多類的數據符合常態分布,仍然有許多是不符合的,比如說,大部分的所得分布是右偏的,因而不是常態分布。非常態的數據就和不平常的人一樣,不僅常見,而且有時比常態的數據還有趣。

68 – 95 – 99.7 規則

常態曲線有許多,每一個常態曲線都可以用各自的平均數和標準差來描述。所有常態曲線都有許多共同性質,特別要提的是,對常態分布來說,標準差是理所當然的量度單位。這件事實反映在下列規則當中。

68 – 95 – 99.7 規則
在任何常態分布當中,大約有 68% 的觀測值,落在距平均數一個標準差的範圍內。
95% 的觀測值,落在距平均數兩個標準差的範圍內。
99.7% 的觀測值,落在距平均數三個標準差的範圍內。
圖13.8、68–95–99.7規則。圖/《統計,讓數字說話》。

圖 13.8 說明了 68 – 95 – 99.7 規則。記住這三個數字之後,你就可以在不用一直做囉嗦計算的情況下考慮常態分布。不過還得記住,沒有哪組數據是百分之百用常態分布描述的。不管對於 SAT 分數,或者蟋蟀的身長, 68–95–99.7 規則都只是大體正確。

年輕女性的身高常態

年輕女性的身高約略是平均數 63.7 英寸、標準差 2.5 英寸的常態分布。要運用 68 – 95 – 99.7 規則,首先得畫一個常態曲線的圖。圖 13.9 說明了這個規則用在女性的身高上會是什麼情況。

任何常態分布都有一半的觀測值在平均數之上,所以年輕女性中有一半高於 63.7 英寸。

任何常態分布的中間68%觀測值,會在距平均數一個標準差的範圍內。而這 68 %中的一半,即 34 %,會在平均數之上。所以有 34 %的年輕女性,身高在 63.7 英寸及 66.2 英寸之間。把身高不到 63.7 英寸的 50% 女性也加上去,可以得知總共有84%的年輕女性身高不到 66.2 英寸。所以推知超過 66.2 英寸的人占 16%。

任何常態分布的中間 95% 的值,在距平均數兩個標準差範圍內。這裡的兩個標準差是 5 英寸,所以年輕女性身高的中間 95% 是在 58.7(= 63.7 − 5)和 68.7(= 63.7 + 5)英寸之間。

另外 5% 女性的身高,就超出 58.7 到 68.7 英寸的範圍之外。因為常態分布是對稱的,這其中有一半的女性是在矮的那一頭。年輕女性中最矮的 2.5% ,身高不到 58.7 英寸(149 公分)。

任何常態分布中幾乎所有(99.7%)的值,在距平均數三個標準差的範圍內,所以幾乎所有年輕女性的身高,都在 56.2 及 71.2 英寸之間。

——本文摘自《統計,讓數字說話》,2023 年 1 月,天下文化出版,未經同意請勿轉載。

天下文化_96
129 篇文章 ・ 613 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

6
1

文字

分享

0
6
1
想知道鯨魚健不健康?首先,你需要牠們的「鼻涕」!
Lea Tang
・2022/03/07 ・2203字 ・閱讀時間約 4 分鐘

為了瞭解鯨豚的健康狀況,科學家們正試圖用更好的方法,來蒐集牠們的鼻涕。

來觀察鯨豚囉!

鯨豚的背鰭,是牠們最容易被人們觀察到的部位,類似於人類的指紋,背鰭是鯨豚的辨識區,可以作為研究人員個體種類辨識上的依據【註1】。然而,若想進一步了解鯨豚的演化史,就不得不仰賴含有 DNA 的活體組織。

不同種類的鯨豚,背鰭都不同。圖/成功海洋環境教室 X ㄈㄈ尺

早期,科學家採集鯨豚活體組織的方式稱作「活體組織切片飛鏢」。如同字面上的意思,他們會向動物投擲飛鏢,獲得牠們的小部分組織作為樣本。但是,這種光用聽的就很痛的方式,不僅會讓鯨豚對研究船隻感到畏懼,更會使得牠們在水中生活時,成為傷口感染的高風險群。

值得高興的是,隨著科技進步,現在科學家已有了新的採集方式。這回,他們自製非侵入性的工具,而且決定改成採集「鼻涕」。

此鼻涕非彼鼻涕

說到鼻涕,我們容易聯想到感冒生病時,從鼻孔裡流出來的東西,不過這裡所提到的「鼻涕」,和那個可不一樣。鯨魚呼氣時所吐出的黏液並非來自呼吸孔,而是來自肺部【註2】。

當鯨豚換氣時,會以相當大的力道呼氣,進而向空中發射鼻涕。有趣的是,不同種類的鯨魚也有不同的吐氣型態。圖/north-atlantic-society.com

藉由蒐集鯨豚呼吸孔吐出的氣,可以得到許多關於牠們的資訊——包含肺表面活性物質(一種蛋白質和脂質的混和物)、呼吸液與肺細胞。同時,這些樣本也可以用來檢測疾病以及皮質醇【註3】、孕酮【註4】等荷爾蒙,幫助研究者知道一頭鯨魚是否染病,甚至可以知道雌鯨是否有孕。

不過,鯨豚的鼻涕藥怎麼蒐集呢?接下來讓我們一起來看看方法。

鼻涕機器人登場

隨著 DNA 提取技術的進步,研究員們從 2010 年起便開始使用新的工具採集。一但在海面上觀察到鯨魚蹤跡,他們便驅船前往,伸出長長的的竿子,利用末端的培養皿來收集鼻涕。

最初,蒐集樣本的工具是一種培養皿與竿子的組合。圖/bbc.com

另一種進階版的工具稱作「鼻涕機器人」(The Parley Snotbot),由無人機和培養皿所組成。鯨魚換氣時,機器人會從後方靠近鯨身,讓鯨魚的鼻涕因慣性往後落在無人機上的培養皿中。

不過以上兩種方法通常用來蒐集座頭鯨等大型鯨魚的 DNA,對於體積、肺部容積較小的海豚則不易達成【註5】。

鯨魚躍升時,鼻涕機器人會迅速在牠後上方 standby,在不驚擾與傷害對方的狀況下蒐集鼻涕。圖/howstuffworks.com

鯨魚鼻涕在遺傳學上的貢獻

至於我們能不能利用鼻涕檢體來進行遺傳學相關的研究呢?答案是可行的。儘管小型鯨豚的鼻涕提取比預期中困難,科學家仍然能從樣本中回收一些粒線體 DNA。

正在分析的鼻涕樣本。圖/bbc.com

他們嘗試以聚丙烯製成的管子倒置在水族館豢養的海豚氣孔上,以得到每隻海豚體內的粒腺體 DNA 和微衛星 DNA ,收集到比野外樣本更加豐富的數據。此外,科學家也發現,從海豚鼻涕中獲得的 DNA 圖譜與從血液中取得的 DNA 圖譜相符,證明了在研究海豚遺傳學上,使用鼻涕的結果可能和抽血一樣好。

現在,科學家們要克服野外採集樣本量不足的挑戰,以期在未來能結合傳統的照片識別,建立有關海豚種群的遺傳學目錄

【註】

  1. 不同種類的鯨豚會有不同形狀的背鰭。就算是同種,不同個體背鰭上的花紋也都不一樣。
  2. 由於鯨豚僅靠呼吸孔呼吸,呼吸孔的堵塞會使牠們窒息死亡。2016 年,研究員曾發現一條呼吸孔先天畸形的海豚在換氣時用嘴呼吸,但這是目前所知的唯一例外。
  3. 腎上腺皮質激素中的糖皮質激素,可以提高血壓、血糖水平和產生免疫抑制作用,有助身體調節壓力事件。
  4. 屬於孕激素荷爾蒙的一種,與懷孕、胚胎與月經週期有關。
  5. 座頭鯨的體型大,吐息也大,容易被船上的研究員發現。海豚因為個體嬌小,肺部僅有約兩個橄欖球大,因此採樣相對困難:牠們呼出的液氣混和物距離海表過近,常在竿子到達前就被海浪打散。另外,面對來勢洶洶的龐大漁船,牠們往往跑得飛快、「走敢若飛」(tsáu kánn-ná pue),不利採樣進行。

資料來源:

  1. 【鯨豚大小事】鯨豚背鰭說
  2. whales-do-not-catch-colds-but-they-do-get-snotty-blowholes
  3. ‘Dolphin snot’ used to look at health of pod off Gower
  4. Those snot-collecting drones are back, and this time they’re seeking dolphins
  5. The Usefulness of Dolphin Snot
  6. The ‘SnotBot’ Drone Is Making Scientific Research Easier on Whales

討論功能關閉中。

Lea Tang
20 篇文章 ・ 8 位粉絲
徜徉在極北之海的浪漫主義者。 喜歡鯨豚、地科、文學和貓。