0

0
0

文字

分享

0
0
0

哪個國家最需要誠實豆沙包?

葉綠舒
・2016/01/18 ・1064字 ・閱讀時間約 2 分鐘 ・SR值 518 ・六年級

我們往往會對不同國家的人有成見。這些成見之中,有些可能是事實,有些則不是。

近來,東英吉利大學(UEA)的研究發現,不同國家的人之間,他們誠實的程度有所不同。研究團隊針對巴西、中國、希臘、日本、俄羅斯、瑞士、土耳其、美國、阿根廷、丹麥、英國、印度、葡萄牙、南非和韓國這十五個國家,總共一千五百多人,進行「誠實度」的調查。

還沒有看到結果前,你想不想猜猜看,哪一個國家最誠實?

擲銅板。圖片來源:flickr

研究團隊設計了兩個誘因實驗進行網路調查。

-----廣告,請繼續往下閱讀-----

第一個調查中,受試者被要求丟硬幣,並回報人頭是否朝上。在這個測試開始之前,受試者被告知「若人頭朝上,就可以拿到美金三到五元的報酬;如果不是,則不能拿到任何錢。」由於人頭朝上的機率大約為50%,所以如果超過50%,就代表有人不誠實。

在這一部分的調查,研究團隊發現英國人最誠實(人頭朝上的機率為53.4%),中國人最不誠實(人頭朝上的機率為70%),其次是日本、韓國和印度。

第二個調查則是有關音樂知識的測驗,這次必須完全答對才可以領獎金。其中有三題非常困難,甚至難到不上網查可能不會答對。不過受試者在開始測驗前,會先被要求承諾不會上網找答案才可以進入測驗。這項測驗的結果發現,日本是最誠實的,其次是英國,而誰最不誠實呢?土耳其。

除此之外,研究團隊還要受試者預測其他國家人民的平均誠實度。結果發現,人們看待自己國家人民的誠實度有低估的現象。這可能是人們比較常接觸發生在自己國家的不誠實事件之新聞報導。在預測中,希臘和中國則是最悲觀的。

-----廣告,請繼續往下閱讀-----

哪些國家比較誠實?哪些又需要誠實豆沙包呢?

拋硬幣試驗中,四個最不誠實的國家都在亞洲;然而,亞洲國家在第二個測試裡並沒有同樣的不誠實;其中,日本甚至在第二個測試中是最誠實的。也許是文化影響到這種類型的測試?畢竟丟銅板在亞洲國家被當作是跟賭博差不多的事情。此外,各國的人民皆預測希臘是最不誠實的國家,但他們在丟硬幣中的表現卻是最誠實的,在第二個測試則是排在中間。另一個發現,不太誠實的受訪者也不太相信別人會說實話。

誠實度和經濟成長有關係?

雖然國家的誠實度與經濟成長有相關性-富裕的國家比貧困國家來得誠實;但主要反映的是1950年之前發生的經濟成長。原因可能是因為重視誠實價值的國家使得合同更容易監測和執行,於是也比較容易得到經濟成長。

所以,哪個國家最需要誠實豆沙包呢?筆者也沒有答案。不過,在亞洲國家賭博可要小心會被出老千呢!

本文轉載自Miscellaneous999

-----廣告,請繼續往下閱讀-----

參考文獻:

 

文章難易度
葉綠舒
262 篇文章 ・ 9 位粉絲
做人一定要讀書(主動學習),將來才會有出息。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

2

4
0

文字

分享

2
4
0
誠實的主張與草包族科學——《費曼的主張》
天下文化_96
・2021/05/30 ・3561字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者 / 理查.費曼
  • 譯者 / 吳程遠、師明睿、尹萍、王碧

問題:巫醫、超感知覺、南太平洋的島民、犀牛角,和威森食用油, 跟大學畢業典禮能有什麼關連呢?

答案:上述皆是厲害的費曼用來說服應屆畢業生的例子, 要他們相信在研究科學時,誠實比任何讚美或短暫的成功,更加有成就感。

在這篇給加州理工學院一九七四年應屆畢業生的演說中, 費曼橫眉不理同儕的壓力以及提供研究資金的金主的怒目, 給大家上了一課,談科學應有的操守品德。

這是費曼關於科學、偽科學,和如何學習不要自己騙自己的一些想法。

在中古世紀期間,各種瘋狂荒謬的想法可謂層出不窮,例如以為犀牛角可以增進性能力,就是其中之一。隨後有人發現了過濾想法的方法,就是試驗哪些構想可行、哪些不行,把不可行者淘汰掉。當然,這個方法逐漸發展成為科學。它一直發展得很好,我們今天已經進入科學時代了。事實上,我們的年代是那麼的科學化,有時候甚至會覺得難以想像,以前怎麼可能出現過巫醫,因為他們所提出的想法全都行不通─至多只有少數的想法是行得通的。

奈及利亞的巫醫。圖/Wikipedia

然而直到今天,我還是會碰到很多的人,或遲或早跟我談到不明飛行物體(UFO,unidentified flying object)、占星術、或者是某些神祕主義、擴展意識、各種新的覺察、超感知覺(ESP, extra sensory perception)等等。我因此下了一個結論,這並不是一個科學的世界。

-----廣告,請繼續往下閱讀-----

大多數人都相信這許許多多的神奇事物,我便決定研究看看原因何在。而我喜愛追尋真理的好奇心,則把我帶到困境之中,因為我發現世上居然有這麼多的廢話和廢物。

老兄,你還差得遠呢!

首先我要研究的是各種神祕主義以及神祕經驗。我躺在與外界隔絕的水箱內,體驗了許多個小時的幻覺,對它有些了解。然後我跑到依沙倫(Esalen),那是這類想法的溫床。事先我沒想到那裡會有那麼多怪東西,讓我大吃一驚。

依沙倫有好多巨大的溫泉浴池,蓋在一處離海面三十英尺的峭壁平台上。我在依沙倫最愉快的經驗之一,就是坐在這些浴池裡,看著海浪打到下面的石灘上,看著無雲的藍天,以及漂亮女孩靜靜的出現。

依沙倫有好多巨大的溫泉浴池,蓋在一處離海面三十英尺的峭壁平台上。圖/Wikipedia

有一次我又坐在浴池裡,浴池內原先就有一個漂亮女孩,以及一個她好像不認識的傢伙。我立刻開始想:「我應該怎樣跟她搭訕呢?」

-----廣告,請繼續往下閱讀-----

我還想應該說些什麼,那傢伙便跟她說:「呃,我在學按摩。你能讓我練習嗎?」

「當然可以,」她說。他們走出浴池,她躺在附近的按摩檯上。

我想:「那句開場白真絕啊!我怎麼也想不到可以這樣問!」他開始按摩她的大腳趾頭。「我可以感覺到,」他說:「我感覺到凹下去的地方。那是不是腦下垂體呢?」女孩說:「不是,它感覺起來不是那樣。」

我脫口而出:「老兄,你離腦下垂體還遠得很呢!」

-----廣告,請繼續往下閱讀-----

他們兩人看向我,我這句外行話洩露了自己的偵探身分。那女孩說:「我們說的是腳底反射療法。」

我立刻閉上眼睛,假裝在冥想。

那只不過是許多使我驚慌失措的情形之一。

我也研究過超感知覺現象,最近的大熱門是焦勒(Uri Geller),據說他只要用手指撫摸鑰匙,就能使它彎曲。在他邀請之下,我便跑到他旅館房間內,看他表現觀心術。在觀心方面他沒一樣表演成功,也許沒有人能看穿我的心吧?

-----廣告,請繼續往下閱讀-----
焦勒(Uri Geller)。圖/Wikipedia

而我的小孩拿著一根鑰匙讓他摸,什麼也沒有發生。然後他說他的超感知覺能力在水中比較能夠施展得開。你們可以想像,我們跟著他跑到浴室裡,水龍頭開著,他在水中拚命撫摸那把鑰匙。什麼都沒有發生,我根本無法研究這個現象。

接下來我想,我們還相信些什麼?(那時候我想到巫醫,想到要研究他們的真偽是多麼的容易:你只要注意他們什麼也弄不成就行了。)於是我去找些更多人相信的事物,例如「我們已經掌握到教學方法」等。目前有很多閱讀方法和數學方法的提倡及研究。但只要稍微留意,便會發現學生的閱讀能力一路滑落─至少沒怎麼上升;儘管我們還在請這些人改善教學方法。這就是一種由巫醫開出來的不靈藥方了,這早就應該接受檢討,這些人怎麼知道提出來的方法是行得通的?

另一個例子是如何對待罪犯,在這方面很顯然我們一無進展。那裡有一大堆理論,但我們的方法顯然對於減少罪行完全沒有幫助。

然而,這些事物全都以科學之名出現,我們研究它們。一般民眾單靠「普通常識」,恐怕會被這些偽科學嚇倒。假如有位老師想到一些如何教她小孩閱讀的好方法,教育系統卻會迫使她改用別的方法─她甚至會受到教育系統的欺騙,以為自己的方法不是好方法。又例如一些壞孩子的父母在管教過孩子之後,終身無法擺脫罪惡感的陰影,只因為專家說:「這樣管小孩是不對的。」

-----廣告,請繼續往下閱讀-----

因此,我們實在應該好好檢討那些行不通的理論,以及檢討那些不是科學的科學。

圖/Wikipedia

科學研究必須有品

上面提到的一些教育或心理學上的研究,都是屬於我稱為「草包族科學」(cargo cult science)的例子。在南太平洋有一些土人,被稱為草包族。在大戰期間,這些工人看到飛機降落在地面,卸下來一包包的好東西,其中一些是送給他們的。往後他們仍然希望能發生同樣的事,於是現在他們在同樣的地點鋪飛機跑道,兩旁還點上了火,蓋了間小茅屋,派人坐在那裡,頭上綁了兩塊木頭(假裝是耳機)、插了根竹子(假裝是天線),以為這就等於控制塔裡的領航員了。然後他們等待,等待飛機降落。

草包族舉行的升旗儀式。圖/Wikipedia

他們每件事都做對了,一切都十分神似,看來跟戰時沒什麼兩樣,但這行不通:始終沒有飛機降落下來。這是為什麼我叫這些東西為「草包族科學」,因為它們完全學足了科學研究的外表,一切都十分神似,但是事實上它們缺乏了最重要的部分,因為飛機始終沒有降落下來。

接下來,按道理我應該告訴你們,它們缺乏的是什麼,但這跟向那些南太平洋小島上的土人說明,是同樣的困難。你怎麼能夠說服他們應該怎樣重整家園,好自力更生的生產財富?這比「告訴他們改進耳機形狀」要困難多了。

-----廣告,請繼續往下閱讀-----

不過,我還是注意到「草包族科學」的一個通病,那也是我們期望你在學校裡學了這麼多科學之後已經領悟到的觀念─我們從來沒有公開明確的說那是什麼,卻希望你能從許許多多的科學研究中省悟到。因此,像現在這樣公開的討論它,也是蠻有趣的。

我們期望你在學校裡學了這麼多科學之後已經領悟到的觀念─我們從來沒有公開明確的說那是什麼,卻希望你能從許許多多的科學研究中省悟到。圖/Giphy

這就是「科學的品德」了,這是進行科學思考時必須遵守的誠實原則,有點盡力而為的意思在內。舉個例子,如果你在做一個實驗,你應該把一切可能推翻這個實驗的東西併入報告之中,而不是單把你認為對的部分提出來,你應該把其他同樣可以解釋你的數據的理論、某些你想到、但已透過其他實驗將之剔除掉的事物,全部包括在報告中,以確保其他人明白,這些可能性都已經排除。

你必須交代清楚任何你知道、可能會使人懷疑的立論的細枝末節。如果你知道哪裡出了問題,或可能會出問題,你必須盡力解釋清楚。比方說,你想到了一個理論,提出來的時候,便一定要同時把對這理論不利的事實也寫下來。這裡還牽涉到一個層次更高的問題。當你把許多想法放在一起構成一個大理論,提出它與什麼數據相符合時,首先你應該確定:它能說明的不單單是讓你想出這套理論的數據,而是除此以外,還能夠說明其他的實驗數據。

總而言之,重點在於提供所有資訊,讓其他人得以裁定你究竟做出了多少貢獻,而不是單單提出會引導大家偏向某種看法的資料。

-----廣告,請繼續往下閱讀-----
——本書摘自《費曼的主張:誠實.獨立思考.不知為不知》,2021 年 4 月,天下文化
所有討論 2
天下文化_96
139 篇文章 ・ 621 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

8
1

文字

分享

0
8
1
統計數據是天大的謊言?我們該如何理解統計結果——《塗鴉學數學》
臉譜出版_96
・2020/07/24 ・2606字 ・閱讀時間約 5 分鐘 ・SR值 517 ・六年級

  • 作者/ 班‧歐林 (Ben Orlin);譯者/王年愷

好,我們先把這件事情說清楚。統計數據是謊言,不應該採信。史上最聰明的人都這樣說過,不是嗎?

圖/臉譜出版提供

我的重點是什麼?沒錯,數字會欺騙。但文字也會——更不用說圖案、手勢、嘻哈音樂劇和募款電子郵件了。我們的道德制度會去責怪說謊的人,而不是說謊者用來說謊的媒介。

對我來說,最有意思的批評統計之詞不是批評統計學者的不誠實,而是批評數學本身。我們可以去理解統計的瑕疵,看到每一項統計數據想要捕捉什麼(以及它會刻意忽略什麼),來增強統計的價值。也許這樣我們就能成為威爾斯想像中的優良公民。

-----廣告,請繼續往下閱讀-----

統計中的平均數(mean)其實分配不均?

圖/臉譜出版提供

圖/臉譜出版提供

做法:把你的資料全部加起來,把總數除以資料筆數。

使用時機:平均數滿足了統計的一項基本需求:捕捉一個群體裡的「中間傾向」。籃球隊的身高是多少?你每天賣出幾個冰淇淋甜筒?這班學生的考試成績如何?如果你想用一個數值來概述一整個群體,平均數是合理的第一步。

-----廣告,請繼續往下閱讀-----

為什麼不要相信它:平均數只管兩個資訊:總和,以及用來達成這個總和的人數。假如你曾經分配過海盜搶來的財寶,就知道哪裡危險了:分配的方式有許多種。每一個人分別貢獻了多少?這是否平均,還是嚴重偏袒某一方?

如果我吃掉一整個披薩,沒有留下任何一點給你,我們是否可以公正地說每個人「平均吃掉」半個披薩?你可以跟你邀來吃晚餐的客人說,「人類平均」有一顆卵巢和一顆睪丸,但這樣是不是會讓氣氛突然冷掉?(我試過;的確會。)

人類關心分配的問題,但平均數會忽略這個問題不談。

圖/臉譜出版提供

-----廣告,請繼續往下閱讀-----

但平均數還有一個有用之處:它的特性使得它容易計算出來。

假設你的考試成績是 87 分、88 分和 96 分。(對,你在這班如魚得水。)你的平均是多少?你不必耗費腦力去加減乘除,只需要重新分配就好了。

從你最後一次的成績拿走 6 分,把 3 分分給第一次、2 分分給第二次。這樣你的分數便是 90 分、90 分和 90 分,另外還多了 1 分。把這 1 分分配給三次考試,你就會得到平均為 90⅓,完全不需要多花腦力。

統計中的中位數(median)忽視懸殊差異?

圖/臉譜出版提供

圖/臉譜出版提供

-----廣告,請繼續往下閱讀-----

做法:中位數是你的資料集裡最中間的那一筆。有一半的資料比它低,另一半比它高。

使用時機:中位數和平均數一樣,捕捉了一個群體裡的中間傾向。差別在於它對離群值(outlier)的敏感度—或者應該說,它有多麼不敏感。

就拿家庭所得來說吧。美國的富裕家庭可能收入是貧窮家庭的幾十倍(甚至幾百倍)。平均數假裝讓每一個家庭都分配到收入總和的同樣數量,因此它會被這些離群值吸引走,離開大多數資料群聚的地方。這樣它算出的數值是 $75,000。

中位數抗拒離群值的吸引力。它指認出絕對位於美國正中間的家庭所得,這會是剛剛好的中間點,有一半的家庭比這富裕,另一半比這貧窮。在美國,這個數值接近 $58,000。

-----廣告,請繼續往下閱讀-----

它和平均數不一樣;中位數可以讓人清楚看到「典型的」家庭是什麼樣子。

為什麼不要相信它:當你找到中位數後,你知道有一半的資料比它大,另一半比它小。但這些數值距離它多遠—只有半步之遙,還是要橫越整片大陸?你只會看到中間的那一塊,不會去管其他部分有多大或多小。這樣你可能誤判。

圖/臉譜出版提供

當一位創業資本家投資新創公司時,他會預期大多數新創公司將失敗。十分之一的罕見成功案例彌補其他小小的損失。但中位數會忽略這樣的動態。它大叫:「通常的結果是負面的。快中止任務!」

-----廣告,請繼續往下閱讀-----

同理,保險公司細心建立一套組合,因為他們知道千分之一的罕見災難會消滅多年以來不太高的獲利。但中位數忽略潛在的大災難。它鼓舞你:「通常的結果是正面的。永遠不要停下來!」

這就是為什麼你常常看到中位數與平均數並列。中位數報出通常的數值,平均數則是報出總數。它們像是兩位有缺陷的證人,兩個合起來的時候會說出比任何一個更全面的故事。

統計中的眾數(mode)排除與眾不同?

圖/臉譜出版提供

圖/臉譜出版提供

-----廣告,請繼續往下閱讀-----

做法:它是最常見的數值,最潮、最時尚的資料點。假如每個數值都獨一無二、沒有重複呢?這樣的話,你可以把資料分類,然後把最常見到的那個類別稱為「眾數組」(modal category 或 modal class)。

使用時機:眾數在進行民意調查和統計非數字的資料時非常出色。假如你想要簡述大家最喜歡的顏色,不可能「計算出顏色的總和」來算出平均數。或者,假如你在舉行投票,如果把所有的選票從「最自由派」排到「最保守派」,然後把公職給拿到中位數選票的候選人,這樣會讓選民發瘋。

為什麼不要相信它:中位數會忽略總和。平均數忽略總和的分布。那眾數呢?它會忽略總和、總和的分布和幾乎所有其他的事情。

眾數只代表單一個最常見的數值。但「常見」的意思不是「有代表性」。美國的薪資眾數是 0——這不是因為大多數美國人破產又沒工作,而是有領薪水的人分布在 $1 到 $100,000,000 的光譜各處,但所有沒領薪水的人都有相同的數字。這項數據不會告訴我們任何和美國有關的事。這項事實幾乎在所有國家都適用,因為這是金錢的運作方式所造成的。

改用「眾數組」只能解決一部分的問題。這樣會讓呈現資料的人有驚人的權力,因為他可以故意操弄分組的界線,來配合他的立場。依照我劃分界線的差異,我可以宣稱美國家庭所得的眾數位在 $10,000 到 $20,000(以 10,000 進位),或 $20,000 到 $40,000(以 20,000 進位),或 $38,000 到 $92,000(以所得稅級距進位)。

同樣的資料集,同樣的統計數據,但最後的樣貌完全改變了,端視畫出這個樣貌的畫家採用哪一種畫框而定。

——本文摘自《塗鴉學數學:以三角形打造城市、用骰子來理解經濟危機、玩井字遊戲學策略思考,24堂建構邏輯思維、貫通幾何學、破解機率陷阱、弄懂統計奧妙的數學課》,2020 年 5 月,臉譜出版

臉譜出版_96
88 篇文章 ・ 255 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。