1

0
0

文字

分享

1
0
0

數字盲與統計之必要

潘 震澤
・2012/01/05 ・1152字 ・閱讀時間約 2 分鐘 ・SR值 578 ・九年級

圖片取自http://www.liveinalpharetta.com/

國內總統大選已達最後階段,各組候選人也做了全國性的公開辯論及政見發表。媒體對尋求連任的馬總統經常出現的評論之一,是說馬總統愛用統計數字來說明政績,「讓人聽得一頭霧水,連愛因斯坦可能也記不住」(注一)。這種說法雖有幾分誇張,但也點出了人類天生的缺陷之一:數字盲

多數人對於數字具有先天的畏懼感,是有演化的根源;因為人類存活在地球的幾十萬年時間裡,大多數時候是以幾十人、最多百來人的小族群過著狩獵採集的生活,全部家當兩隻手就可拎著走,因此不需要用上什麼數字, 對成千上萬的大數字更是沒有概念。只有在近一萬年來,人類採行農業生活後,人類社會的規模與財富不斷累積成長,才開始出現對數字的需求,也才有「天賦異稟」之士發展出各式各樣的數學來。

說起人對大數字沒有概念,可用個小故事說明:有位智者與國王博弈,智者提出的賭注,是在西洋棋盤的第一格放一粒米,之後每天加倍,直到第64 天(格)為止。一開始國王認為這個賭注太便宜了,輸了也不在意,但是還不到一半期間,國王就向智者告饒;因為只要31天,米粒數就上了十億(重約一噸,注二),此後還一路以指數倍增,就算再富裕的國王也負擔不起。

人對抽象數字的無感,反映在人對金錢財富有兩種極端態度:一是貪得無饜、只進不出的守財奴心態,另一則是有多少花多少,毫不擔心未來的敗家子作風。當然多數人介於兩者之間:總認為錢賺得不夠多,更擔心存款不夠養老。因此,培養健康的數字感,是現代人必修的功課之一。

除了大數字外,人碰上了經過統計整理的數字,更是缺少分辨能力;尤其是出現在一閃而過的演講詞中。好比馬總統發表政見的講稿給評論成「數字連篇,但缺少動人的故事敘述」,遠不如訴諸感性、寫政見如寫詩的蔡英文討好,即便蔡的政見「都是掛在天上的甜餅,可望而不可即」(注一)。

根據個案的故事雖然動人,但理性的選民還是得靜下心來看看統計數字,才不至於以偏概全;只不過看統計數字有些訣竅,否則一樣容易受騙。譬如平均數容易受離群的異常值扭曲,加上標準差或是中數與眾數輔助,才能看出變異程度大小;同樣一組數字,使用實際數值或百分比,或是用不同的作圖法呈現,都會給人不同的感受;在不同地區、不同時間以及不同族群所取得的統計數值,不一定能夠直接相比等等。

雖然多數人對數字可能無感,但冰冷的數字還是要比感性的言語可靠。統計是整理大數字的科學方法,如果是因為不懂統計,或吃過統計的虧,就把統計與謊言並列,可說是因噎廢食,也算另一種人的偏見吧。

注一:2011/12/29王健壯:〈愛因斯坦也記不得那麼多數字〉中國時報論壇

注二:我拿家中秤子秤了一下,80粒米約1公克。

本文發表於2012/01/04 中時觀念平台,轉載自作者部落格生理人生

文章難易度
所有討論 1
潘 震澤
13 篇文章 ・ 1 位粉絲
在大學裡教了二十幾年書,專長是生理學(再往下細分是「神經內分泌學」)。十來年前從象牙塔裡伸出頭來,投入科普書譯介及專欄寫作工作,至今已翻譯了十來本科普書、兩本生理學教科書,以及兩本科學散文結集。目前任教美國大學。

2

2
2

文字

分享

2
2
2
買樂透真的可以賺錢?大數法則揭示了賭博的真相!——《統計,讓數字說話》
天下文化_96
・2023/03/05 ・2394字 ・閱讀時間約 4 分鐘

  • id S. Moore、諾茨 William I. Notz
  • 譯者:鄭惟厚、吳欣蓓

什麼是大數法則?

期望值的定義是:它是可能結果的一種平均,但在計算平均時,機率大的結果占的比重較高。我們認為期望值也是另一種意義的平均結果,它代表了如果我們重複賭很多次,或者隨機選出很多家戶,實際上會看到的長期平均。這並不只是直覺而已。數學家只要用機率的基本規則就可以證明,用機率模型算出來的期望值,真的就是「長期平均」。這個有名的事實叫做大數法則。

大數法則
大數法則(law of large numbers)是指,如果結果為數值的隨機現象,獨立重複執行許多次,實際觀察到的結果的平均值,會趨近期望值。

大數法則和機率的概念密切相關。在許多次獨立的重複當中,每個可能結果的發生比例會接近它的機率,而所得到的平均結果就會接近期望值。這些事實表達了機遇事件的長期規律性。正如我們在第 17 章提過的,它們是真正的「平均數定律」。

大數法則解釋了:為什麼對個人來說是消遣甚至是會上癮的賭博,對賭場來說卻是生意。經營賭場根本就不是在賭博。大量的賭客贏錢的平均金額會很接近期望值。賭場經營者事先就算好了期望值,並且知道長期下來收入會是多少,所以並不需要在骰子裡灌鉛或者做牌來保證利潤。

賭場只要花精神提供不貴的娛樂和便宜的交通工具,讓顧客川流不息進場就行了。只要賭注夠多,大數法則就能保證賭場賺錢。保險公司的運作也很像賭場,他們賭買了保險的人不會死亡。當然有些人確實會死亡,但是保險公司知道機率,並且依賴大數法則來預測必須給付的平均金額。然後保險公司就把保費訂得夠高,來保證有利潤。

  • 在樂透彩上做手腳

我們都在電視上看過樂透開獎的實況轉播,看到號碼球上下亂跳,然後由於空氣壓力而隨機彈跳出來。我們可以怎麼樣對開出的號碼做手腳呢? 1980 年的時候,賓州樂透就曾被面帶微笑的主持人以及幾個舞台工作人員動了手腳。

他們把 10 個號碼球中的 8 顆注入油漆,這樣做會把球變重,因此可保證開出中獎號碼的 3 個球必定有那 2 個沒被注入油漆的號碼。然後這些傢伙就下注買該 2 個號碼的所有組合。當 6-6-6 跳出來的時候,他們贏了 120 萬美元。是的,他們後來全被逮到。

歷史上曾有主持人在樂透上做手腳,後來賺了 120 萬美元隨後被逮捕。圖/envatoelements

深入探討期望值

跟機率一樣,期望值和大數法則都值得再花些時間,探討相關的細節問題。

  • 多大的數才算是「大數」?

大數法則是說,當試驗的次數愈來愈多,許多次試驗的實際平均結果會愈來愈接近期望值。可是大數法則並沒有說,究竟需要多少次試驗,才能保證平均結果會接近期望值。這點是要看機結果的變異性決定。

結果的變異愈大,就需要愈多次的試驗,來確保平均結果接近期望值。機遇遊戲一定要變化大,才能保住賭客的興趣。即使在賭場待上好幾個鐘頭,結果也是無法預測的。結果變異性極大的賭博,例如累積彩金數額極大但極不可能中獎的州彩券,需要極多次的試驗,幾乎要多到不可能的次數,才能保證平均結果會接近期望值。

(州政府可不需要依賴大數法則,因為樂透彩金不像賭場的遊戲,樂透彩用的是同注分彩系統。在同注分彩系統裡面,彩金和賠率是由實際下注金額決定的。舉例來說,各州所辦的樂透彩金,是由全部賭金扣除州政府所得部分之後的剩餘金額來決定的。賭馬的賠率則是決定於賭客對不同馬匹的下注金額。)

雖然大部分的賭博遊戲不及樂透彩這樣多變化,但要回答大數法則的適用範圍,較實際的答案就是:賭場的贏錢金額期望值是正的,而賭場玩的次數夠多,所以可以靠著這個期望值贏錢。你的問題則是,你贏錢金額的期望值是負的。全體賭客玩的次數合起來算的話,當然和賭場一樣多,但因為期望值是負的,所以以賭客整體來看,長期下來一定輸錢。

然而輸的金額並不是由賭客均攤。有些人贏很多錢,有些人輸很多,而有些人沒什麼輸贏。賭博帶給人的誘惑,大部分是來自賭博結果的無法預測。而賭博這門生意仰賴的則是:對賭場來說,結果並非不可測的。

對賭場來說,贏錢金額期望值為正。圖/envatoelements
  • 有沒有保證贏錢的賭法?

把賭博很當回事的賭客常常遵循某種賭法,這種賭法每次下注的金額,是看前幾次的結果而定。比如說,在賭輪盤時,你可以每次把賭注加倍,直到你贏為止—或者,當然,直到你輸光為止。即使輪盤並沒有記憶,這種玩法仍想利用你有記憶這件事來贏。

你可以用一套賭法來戰勝機率嗎?不行,數學家建立的另一種大數法則說:如果你沒有無窮盡的賭本,那麼只要遊戲的各次試驗(比如輪盤的各次轉動)之間是獨立的,你的平均獲利(期望值)就會是一樣的。抱歉啦!

  • 高科技賭博

全美國有超過 700,000 台吃角子老虎(拉霸)。從前,你丟硬幣進去再拉下把手,轉動三個輪子,每個輪子有 20 個圖案。但早就不是這樣了。現在的機器是電動遊戲,會閃出許多很炫的畫面,而結果是由隨機數字產生器決定的。

機器可以同時接受許多硬幣,有各種讓你眼花撩亂的中獎結果,還可以多台連線,共同累積成連線大獎。賭徒仍在尋找可以贏錢的賭法,但是長期下來,隨機數字產生器會保證賭場有 5% 的利潤。

——本文摘自《統計,讓數字說話》,2023 年 1 月,天下文化出版,未經同意請勿轉載。

所有討論 2
天下文化_96
132 篇文章 ・ 616 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

2
1

文字

分享

0
2
1
我的身高有特別矮嗎?為什麼大多數女性身高都「差不多」!——《統計,讓數字說話》
天下文化_96
・2023/03/04 ・2634字 ・閱讀時間約 5 分鐘

  • id S. Moore、諾茨 William I. Notz
  • 譯者:鄭惟厚、吳欣蓓

什麼是常態分布?

圖 13.3 和 13.4 裡的密度曲線,同屬一族特別重要的曲線:常態曲線。圖 13.7 再呈現了兩個常態密度曲線。常態曲線都是對稱、單峰、鐘形的,尾部降得很快,所以我們應該不會看到離群值。由於常態分布是對稱的,所以平均數和中位數都落在曲線的中間位置,而這也是尖峰所在。

常態曲線還有一個特別性質:我們可以用目測方式在曲線上找到它的標準差。對大部分其他的密度曲線,沒有法子這樣做。做法是這樣的。想像你要從山頂開始滑雪,山的形狀和常態曲線一樣。起先,你從山頂出發時,往下滑的角度非常陡:

幸好,在你還沒有直直墜下之前,斜坡就變緩了,你愈往下滑出去,坡度愈平:

曲率(curvature)發生改變的地方,是在平均數兩側、各距平均數一個標準差的位置。圖 13.7 的兩條曲線上都標示出了標準差。你如果用鉛筆沿著常態曲線描,應該可以感受到曲率改變的地方,進而找出標準差。

常態曲線有個特別的性質是,只要知道平均數及標準差,整條曲線就完全確定了。平均數把曲線的中心定下來,而標準差決定曲線的形狀。變動常態分布的平均數並不會改變曲線的形狀,只會改變曲線在 x 軸上的位置。但是,變動標準差卻會改變常態曲線的形狀,如圖 13.7 所示。標準差較小的分布,散布的範圍比較小,尖峰也比較陡。以下是常態曲線基本性質的總結:

常態密度曲線的特性

常態曲線(normal curve)是對稱的鐘形曲線,具備以下性質:

  • 只要給了平均數和標準差,就可以完全描述特定的常態曲線。
  • 平均數決定分布的中心,這個位置就在曲線的對稱中心。
  • 標準差決定曲線的形狀,標準差是指從平均數到平均數左側或右側的曲率變化點的距離。

為什麼常態分布在統計裡面很重要呢?首先,對於某些真實數據的分布,用常態曲線可以做很好的描述。最早將常態曲線用在數據上的是大數學家高斯(Carl Friedrich Gauss, 1777 – 1855)。

天文學家或測量員仔細重複度量同一個數量時,所得出的量測值會有小誤差,高斯就利用常態曲線來描述這些小誤差。你有時候會看到有人把常態分布叫做「高斯分布」,就是為了紀念高斯。

十九世紀的大部分時間中,常態曲線曾叫做「誤差曲線」,也就因為常態曲線最早是用來描述量測誤差的分布。後來慢慢發現,有些生物學或心理學上的變數也大致符合常態分布時,「誤差曲線」這個名詞就不再使用了。1889 年,高騰(Francis Galton)率先把這些曲線稱做「常態曲線」。高騰是達爾文的表弟,他開拓了遺傳的統計研究。

常態分布的形狀:鐘形曲線

人類智慧高低的分布,是不是遵循常態分布的「鐘形曲線」?IQ 測驗的分數的確大致符合常態分布,但那是因為測驗分數是根據作答者的答案計算出來的,而計算方式原本就是以常態分布為目標所設計的。要說智慧分布遵循鐘形曲線,前提是:大家都同意 IQ 測驗分數可以直接度量人的智慧。然而許多心理學家都不認為世界上有某種人類特質,可以讓我們稱為「智慧」,並且可以用一個測驗分數度量出來。

當我們從同一母體抽取許多樣本時,諸如樣本比例(當樣本大小很大、而比例的數值中等時)及樣本平均數(當我們從相同母體取出許多樣本時)這類統計量的分布,也可以用常態曲線來描述。我們會在後面的章節進一步細談統計分布。

抽樣調查結果的誤差界限,也常常用常態曲線來算。然而,即使有許多類的數據符合常態分布,仍然有許多是不符合的,比如說,大部分的所得分布是右偏的,因而不是常態分布。非常態的數據就和不平常的人一樣,不僅常見,而且有時比常態的數據還有趣。

68 – 95 – 99.7 規則

常態曲線有許多,每一個常態曲線都可以用各自的平均數和標準差來描述。所有常態曲線都有許多共同性質,特別要提的是,對常態分布來說,標準差是理所當然的量度單位。這件事實反映在下列規則當中。

68 – 95 – 99.7 規則
在任何常態分布當中,大約有 68% 的觀測值,落在距平均數一個標準差的範圍內。
95% 的觀測值,落在距平均數兩個標準差的範圍內。
99.7% 的觀測值,落在距平均數三個標準差的範圍內。
圖13.8、68–95–99.7規則。圖/《統計,讓數字說話》。

圖 13.8 說明了 68 – 95 – 99.7 規則。記住這三個數字之後,你就可以在不用一直做囉嗦計算的情況下考慮常態分布。不過還得記住,沒有哪組數據是百分之百用常態分布描述的。不管對於 SAT 分數,或者蟋蟀的身長, 68–95–99.7 規則都只是大體正確。

年輕女性的身高常態

年輕女性的身高約略是平均數 63.7 英寸、標準差 2.5 英寸的常態分布。要運用 68 – 95 – 99.7 規則,首先得畫一個常態曲線的圖。圖 13.9 說明了這個規則用在女性的身高上會是什麼情況。

任何常態分布都有一半的觀測值在平均數之上,所以年輕女性中有一半高於 63.7 英寸。

任何常態分布的中間68%觀測值,會在距平均數一個標準差的範圍內。而這 68 %中的一半,即 34 %,會在平均數之上。所以有 34 %的年輕女性,身高在 63.7 英寸及 66.2 英寸之間。把身高不到 63.7 英寸的 50% 女性也加上去,可以得知總共有84%的年輕女性身高不到 66.2 英寸。所以推知超過 66.2 英寸的人占 16%。

任何常態分布的中間 95% 的值,在距平均數兩個標準差範圍內。這裡的兩個標準差是 5 英寸,所以年輕女性身高的中間 95% 是在 58.7(= 63.7 − 5)和 68.7(= 63.7 + 5)英寸之間。

另外 5% 女性的身高,就超出 58.7 到 68.7 英寸的範圍之外。因為常態分布是對稱的,這其中有一半的女性是在矮的那一頭。年輕女性中最矮的 2.5% ,身高不到 58.7 英寸(149 公分)。

任何常態分布中幾乎所有(99.7%)的值,在距平均數三個標準差的範圍內,所以幾乎所有年輕女性的身高,都在 56.2 及 71.2 英寸之間。

——本文摘自《統計,讓數字說話》,2023 年 1 月,天下文化出版,未經同意請勿轉載。

天下文化_96
132 篇文章 ・ 616 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

1
1

文字

分享

0
1
1
不用數字的數學還會是數學嗎?一窺當代抽象數學的面向——《不用數字的數學》
經濟新潮社
・2022/09/26 ・2865字 ・閱讀時間約 5 分鐘

  • 文/游森棚|臺灣師範大學數學系教授

讀者手上的書是一本非常特別的數學科普書。

這本書談的數學,會和絕大部分讀者心中的「數學」非常不一樣,也和絕大部分的數學科普書非常不一樣。一言以蔽之,這本書用淺顯的語言介紹現代高等數學中幾個抽象的核心領域:拓樸、分析、代數,最後提及數學的哲學基礎、建模與自動機。所有篇章都談「概念」,都沒有「數字」。

這本書談的數學所有篇章都談「概念」,都沒有「數字」。圖/Pixabay

沒有數字的數學是數學嗎?!

讀完初稿,不禁啞然失笑,回憶起自己年輕時在數學系的惶恐與不知所措。僅僅一個月我就發現大學的數學和高中數學「很不一樣」。高中數學範圍有限,目標是解設計好的題目:不要有計算失誤,快速地解題得到正確的答案。但是大學的數學範圍茫茫無際,大一的微積分(Calculus)與線性代數(Linear Algebra),除了像高中數學一樣的計算與解題,更多的是要求理解與論證。我在這兩門課的證明題中掙扎前行,不知不覺進了大二。

然後我就在大二的高等微積分(Analysis)與代數學(Algebra)卡關了。這兩門課是數學系真正的入門課程,幾乎沒有像高中數學一樣的計算題,而是一整片的理論。前面沒弄懂,後面就根本無法前進。簡單來說,這兩門課從課本內容、習題、到考試,全部是證明題。我可以整個下午在書桌前,只為了想弄懂從這一行到下一行的理由。一道敘述只有十幾個字的習題,可以耗掉好幾天,而且還做不出來,更糟的是書後面還沒有答案。同學們互相自嘲,一本薄薄的課本可以讀這麼久,真的太划算了。

我原以為這兩門課已經嘆為觀止,但到了大三時,修了一門更誇張的課,叫做拓樸學(Topology)。幾百頁的課本中沒有任何數字(數字只出現在頁碼、定理標號、足碼)。每星期連續幾堂課老師寫滿七、八個滿滿的黑板,可以完全不出現任何一個數字。我們一路顛簸,掙扎忍耐到快要學期末,然後老師很興奮地預告,下學期,在書本的後半,我們將會證明 Jordan Curve Theorem 這個大定理:這個定理是說,你拿筆在紙上畫一個圓,會把紙分成兩部分,「圓內」和「圓外」。台下同學一片譁然,這能不譁然嗎!我簡直矇了,那一瞬間,我覺得我在外星球上……

這是數學嗎?!

Jordan Curve Theorem 定理是說,拿筆在紙上畫一個圓,會把紙分成兩部分,「圓內」和「圓外」。圖/Pixabay

「數學」研究的是純粹的論證與推理

是的,這是數學。經過大學數學系,我知道從定義出發,純粹的論證與推理,推出夠一般的結論,是數學理論發展的步驟。而論證與推理,才是數學的核心本質。數學和其他學門非常不同,數學是一步推一步的,要下結論必須要有理由。「論證」與「推理」在數學各個不同的主題或領域上所佔的份量不盡相同,但這個本質不會改變。即使是小學的九九乘法表,三七是二十一也是有理由的。

即使是小學的九九乘法表,三七是二十一也是有理由的。圖/Pixabay

如果我們抽離出最根本的概念,數學就是在研究形狀,研究變化,研究結構,應用之以解決實際問題,資訊時代又賦予數學新的觀點與力量。

用數學專業的語言來說,數學研究形狀,就是「幾何學與拓樸學」;數學研究變化,就是「分析學」;數學研究結構,就是「代數學」;數學解決實際問題,就是「應用數學」;數學與資訊結合,就是「離散數學」。這幾個領域,就是當代數學這棵參天大樹的幾個主幹。

作者的野心藏在這本書中

這正是本書的內容。這本書的五個章節中,第一章是拓樸學(形狀),第二章是分析(變化),第三章是代數(結構),第五章是建模(應用數學與離散數學)。數學既然是一步推一步,根基是否穩固就很關鍵,這個部分穿插在第四章的基礎(數學基礎與數學哲學)。

由此可看到作者的野心非常宏大——他想要在一本小書中一網打盡介紹數學的各個主幹。這當然是不可能的,因此本書作者相當努力,在每一章中,盡量選取那些可以用口語解釋概念的主題材料。在解釋的過程中,盡可能貼近讀者的生活經驗,或是藉由各式各樣生活上的例子來讓讀者體會數學的概念。

要對一般讀者講解抽象的高等數學,細節與精確定義是不可能講清楚的。但是既然只抽離出概念,還是有機會在概念上讓讀者體會的。一個簡單的例子如下:三角形、橢圓、長方形、叉叉,這四個東西哪一個「看起來跟別人最不一樣」?很顯然就是叉叉,這個小朋友都能做。但這樣的直覺,就已經碰觸到拓樸學中的核心概念了,這正是本書第一章的第一部分要介紹的內容。所以很容易理解吧!讀者如果想學嚇人的專業術語,我來註解如下:三角形、橢圓、長方形是同胚的(homeomorphic),但是叉叉和它們不同胚。

一個簡單的例子如下:三角形、橢圓、長方形、叉叉,這四個東西哪一個「看起來跟別人最不一樣」?圖/Pixabay

書中有些材料作者介紹得非常精妙,即使以我專業數學家的眼光來看,都覺得眼睛一亮,比如對稱群、自動機、物理基本粒子等等。既然作者原來的想法就是用口語敘述介紹高層次的概念,讀者就不要有壓力,當作有趣的故事書來讀,會有驚喜的發現:重複圖案的壁紙本質上只有十七種、數學中不同的主義、連續與離散真的天差地遠……

宏觀與有趣的文筆,道出數學的精妙

最後再回到讓全班譁然的 Jordan Curve Theorem。到了研究所後我才知道為什麼這個定理這麼特別─這是平面獨有的一個特別性質。到了三維空間中的流形(manifold)事情就變得非常複雜,讀者可以查「Alexander horned sphere」看看有多詭異。至於什麼是「維度」和「流形」,可以看這本書的第一章……

我欣見這本書的出版,也佩服作者的宏觀與有趣的文筆,把數學某些本質層面藉由適當的選材呈現出來。但數學何其浩瀚,不管是哪個主幹,本書提及的材料都還只是很小的部分,茫茫數學大海,還有非常多新奇的事物。但囿於篇幅與主題限制,許多重要的領域本書沒有碰觸,是較為可惜之處。但這是我太苛求了,本書的視野和高度在數學科普書中是非常少見的,碰觸到的領域已經非常廣闊,足以讓讀者對數學有完全不同的認識與體悟。

無論如何,希望本書能開一扇門,引領有緣的讀者或未來的數學家,體會當代數學的面向,從而進入數學的嚴肅、深邃與美麗。

——本文摘自《不用數字的數學:讓我們談談數學的概念,一些你從沒想過的事……激發無窮的想像力!》,2022 年 9 月,經濟新潮社,未經同意請勿轉載。

經濟新潮社
4 篇文章 ・ 4 位粉絲