0

1
0

文字

分享

0
1
0

「統計不就是按按計算機嗎?」讀統計系到底能做什麼?

活躍星系核_96
・2017/01/21 ・3510字 ・閱讀時間約 7 分鐘 ・SR值 493 ・六年級

文/黃大維|目前在台灣大學就讀統計碩士學位學程。我的研究領域是特徵表達與降維分析、序列決策模型、以及財務時間序列,我喜歡用商業的觀點切入大數據與資料科學!

統計系到底在學什麼?圖/pixabay, CC0
統計系到底在學什麼?圖/pixabay, CC0

我曾經在在粉絲專頁「大鼻觀點」針對 ptt 八卦版的一篇問卦文「[問卦] 統計系是文組最強科系嗎」分享一些看法,反映出乎意料的好。一般大眾好像對於「統計」有著不少迷思,像是以前有一次剪頭髮,設計師問我讀什麼科系,我說我讀的是統計,設計師居然回答:「喔,跟會計差不多對嗎?」當下白眼真的要翻到後腦勺了 XD

泛科學一直有在經營的一個區塊叫「科學教育,科學嗎?」,裡面會不時邀請一些相關科系的學生來談他們自己科系的各種大小事,也是給將來要選系的高中生一些了解這個科系的參考。因此我決定也寫一篇文章,來跟大家分享我在統計這個領域打混一陣子的心得。

統計不就是按計算機嗎?你所不知道的統計

357px-casio-fx115es-5564
許多人聽到「統計」,第一件事情就是想到「按計算機」。事實上,統計的本質並不是計算、也不是數學。圖/By Loadmaster David R. Tribble, 創用CC 姓名標示-相同方式分享 3.0, wikimedia commons

首先,我想先談談「統計不是什麼」。許多人聽到「統計」,第一件事情就是想到「按計算機」,就算大學有修統計課程的學生,課程也不外乎是按計算機算算平均數、標準差,頂多算點變異數分析或回歸。事實上,統計的本質並不是計算、也不是數學,統計界的大師 John Tukey 說過:

“Statistics is a science, not a branch of mathematics, but uses mathematical models as an essential tool.”

統計學會讓一般人認為是數學的主要原因,是需要用到大量的數學、程式設計、科學計算等做為解決問題的工具。因此,對於接觸統計不深的人時常會以為統計是數學的一個分支,其實並不是如此。

那麼,統計的本質是什麼呢?我非常喜歡 R Studio 首席資料科學家 Hadley Wickham 的詮釋:

“Statistics is an important tool in the data analysis/science toolbox. Statistics provides a coherent framework for thinking about random variation, and tools to partition data into signal and noise.”

從他的話中我們可以知道,「統計」其實有兩個功能:一是作為在充滿隨機性(randomness)的世界中,思考資料變異(data variation)的架構,二是作為從資料變異區分出真實信號(signal)與隨機雜訊(noise)的工具。 如果用更一般化的講法,就是提供分析資料的思考架構,從具有隨機性的資料中找出重要的、有意義的資訊,並將協助各個領域的人將這些資訊凝鍊成真正的「知識」。

84967293_6e4c727e4d_z
「統計」其實有兩個功能:一是作為在充滿隨機性的世界中,思考資料變異的架構,二是作為從資料變異區分出真實信號與隨機雜訊的工具。圖/By duncan c @ flickr, CC BY-NC 2.0

接下來,我想了一些時常會有人問的問題,我想要花點篇幅談一談。

疑問 1:統計系是文組還是理組?

有很多人會想要問:統計系是文組還是理組?我覺得其實很難界定,文組並不是純粹只有閱讀、思考與寫作,像是「統計機器翻譯」(Statistical Machine Translation)就是一個跨領域的議題,需要語言學家、電腦科學家、數學家、統計學家一起來解決。而「財務工程」雖然屬於商學院,但本質與電腦科學、統計學、數學等密切相關,所以統計系大多掛在不同的學院底下,有的學校會掛在商學院下、有的會掛在理學院下、也有的會掛在工學院底下。所以,如果是要用文組/理組來分的話,其實很難直接把統計分在其中一個底下。

不過,如果以必備技能來看的話,統計可能比較像是一般工學院或理學院的學生。首先,統計非常吃重數學,尤其是機率與數學分析(主要是實分析)的基礎要很好,才能夠了解怎麼樣用數學的工具去架構問題。二是統計很吃重程式設計的能力,我們不會負責去做系統架構或是前端介面,但我們非常倚賴運用程式工具去整理、運算並分析資料,因此寫程式是不可避免的。三是我們最好要對某個/某些特定領域有足夠的了解,統計不是一個可以引領一代人命運的學問,而是在方向確定後建立穩固根基並持續發展的工具,因此我們通常的角色支援某個領域的專家將他們的專業往前推進,此時你對於你支援的領域要有一定的認識才能發揮所長,將統計模型運用於這些領域問題中。

疑問 2:統計系畢業之後可以幹嘛?

《哈佛商業評論》將資料科學家評為 21 世紀最性感的職業,因此讀統計的前景相當看好。其實統計系畢業之後的發展方向很多,金融、工程、消費品、製造、行銷等各個領域都很需要量化分析的人。

然而我必須跟大家講兩個個現實。首先,因為台灣強勢產業的因素,統計系畢業的學生往往是去(1)金融業(2)藥廠(3)工業製程 做統計分析師,這些行業給的起薪都不錯,但你如果想做物流、電商、應用程式的話,台灣每年的缺滿有限的,必須有往外走的決心。

此外,如果大學你讀的是統計,你可能會跟數學系畢業生遇到同樣的難題,容易找不到畢業之後的方向。但你有了這些統計工具之後,其實很容易轉往其他領域。因此我會建議如果未來想念統計/你正在念統計系,最好輔系或雙主修一個未來就業時你希望投入的領域。如果你想做產品中數據模型的建置者,輔個資工/資管學學軟體設計是很重要的;如果你想做計量交易員,對於債券、股票、期貨、衍生性商品、總體經濟的了解會很有幫助;如果你想去藥廠做統計分析師,對臨床試驗有一定的認識將會幫助很大。

重點在於,你必須找到你運用這些方法的領域,並對這些領域有一定的了解,千萬不要有「我進去再學」就好的心態,因為對於原本就在該領域深耕的人來說,「統計方法」也是可以進去在學的。

疑問 3:統計要在台灣念還是在國外念?

這個問題是個假議題,台灣也有很好的統計學家與教育,如果想補 programming 的技能的話也可以去資工那邊修課,其實要不要出國的問題是取決於「你想要獲得什麼」,以及很現實的「出國讀哪一所學校」。其實要讀統計我覺得重點是在於——你把自己當成一個統計系學生還是統計學家。

我在台灣幾所很好的學校上過統計系所的課,大部分都是在教怎麼使用統計軟體或是推導統計理論,在碩班聽到老師上課說「你們碰實際的資料就會知道很有趣」時,我第一個反應就是:實際資料難道是要讀到碩班才開始碰的嗎?另外,很多時候我們會太過著重於要用哪個 model 去解,但其實重點是「你要解決什麼問題?」將領域的問題重新定義成資料分析問題是非常重要也非常有價值的能力,但說真的這很難在課堂上學到。

我不覺得上面的問題是出在教授,或是在台灣還是在國外,其實根本問題是在學統計時,我們有沒有不斷的去探索不同的領域,不停思考這些領域的問題我們怎麼樣轉成資料分析的問題,怎麼樣去設計實驗或蒐集資料,運用哪些模型才能夠解決問題,最後怎麼樣視覺化分析得到的 insight,並用一般人可以理解的語言說給不懂統計理論的人。這串過程必須反覆的練習,才能夠讓自己資料分析的功力不斷進步。

小結:如果想當資料科學家,統計是個好選擇!

雖然資料科學的夯度最近小輸人工智慧,但不要忘了《紐約時報》曾經如此評論「資料科學」(Data Science):

“This hot new field promises to revolutionize industries from business to government, health care to academia.”

可見這個領域絕對是前景大好。那麼如果想做個資料科學家,是不是一定要讀統計呢?我個人不負責任的認為,如果你想做的資料科學家是分析事情的關連與因果,找出問題的本質,以及透過數據做出更好的決策,我相信統計是一個不錯的選擇。當然,如果你想要做機器學習跟預測科學,統計也有不少人在做,但 computer science 可能是另外一個很棒的選擇,如果能夠跨統計與 CS 兩個領域的話更好。

14276846526_6fc181cd56_z
如果想當資料科學家,統計是個好選擇!圖/By NASA Goddard Space Flight Center @ flickr, CC BY 2.0

資料科學家需要領域知識、程式設計、數學與統計三大能力,常有人會問我說「當資料科學家的數學統計和程式能力一定要很好嗎?」我給自己的答案是:這兩項能力越強,能做的事情越多,老實講如果這兩個領域的能力都不好的話,那怎麼能說是個資料科學家呢?所以說,要走資料科學的路,你可以從三大能力中挑一項能力專精,但另外兩樣也不可以太差,才能夠走的長久!

本文同步刊登於作者部落格「大鼻觀點」,喜歡他的文章也可以追蹤同名臉書粉絲專頁


數感宇宙探索課程,現正募資中!

文章難易度

2

11
3

文字

分享

2
11
3

既是科學家,也是樂團鼓手!──專訪數學物理學家程之寧

研之有物│中央研究院_96
・2022/03/11 ・5978字 ・閱讀時間約 12 分鐘

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文|郭雅欣、簡克志
  • 美術設計|林洵安、蔡宛潔

在學術與搖滾的多重維度上行走

還記得美劇《The Big Bang Theory》嗎?劇中常常出現的物理名詞「弦論」,是描述物理世界基本結構的理論。中央研究院「研之有物」專訪院內數學研究所程之寧研究員,她正是研究弦論的科學家,也是熱愛音樂的搖滾樂團鼓手,這種跨領域身份並不衝突,兩邊都需要創造力與紀律。由於天生斜槓的性格,讓程之寧在數學和物理領域大展身手,透過數學的深入探討,她試圖將弦論更往前推進。最近程之寧更跨足到人工智慧領域,為學界提供理論物理上的貢獻。

中研院數學所程之寧研究員,主要研究 K3 曲面(特殊的四維空間)的弦論,她發現模函數和有限對稱群之間有 23 個新的數學關聯,稱之為「伴影月光猜想」(Umbral Moonshine)。圖/研之有物

萬有理論和難以捉摸的「月光」

世界從那裡來呢?物理世界的本質是什麼呢?回答這樣的大哉問,一直是理論物理學家所追求的目標。從牛頓力學(日常應用)、廣義相對論(探討很重的物質)到量子力學(探討很小的物質),隨著物理學不斷發展,我們似乎一步步接近答案,但至今卻還未走到終點。

舉例來說,如果有個東西很重又很小,就像「黑洞」,或是大爆炸時的宇宙,我們要怎麼用數學描述?於是科學家試圖整合廣義相對論和量子力學,找出所謂的「萬有理論」(Theory of Everything)──能完全解釋物理世界基本結構的核心理論。

程之寧研究的「弦論」就企圖發展成這樣一個萬有理論。弦論一如其名的「玄妙」,它設定宇宙所有的粒子都是由一段段「能量弦線」所組成,每一種基本粒子的振動模式不同,產生不同的粒子特性。

「人類一直以來的夢想之一就是,如果能用一句話解釋所有事情,那該有多麼美好。」中研院數學所研究員程之寧說道。

程之寧的研究牽涉到數學上的「月光猜想」(Moonshine)與弦論中 K3 曲面的連結。月光猜想是存在於模函數係數與特殊群之間的數學關聯,程之寧與其研究夥伴共發現了 23 個新的關連,並稱之為「伴影月光猜想」(Umbral Moonshine)。

基於弦論的假設,我們的世界是十維的,除了人們在日常生活中可以感知到的 3+1 維(空間+時間),還有六維是因為尺寸太小而無法用肉眼觀察的,這些看不到的維度影響著物理世界,最終也產生了我們這個物理世界所需的各種條件與特性。

綜觀程之寧的研究,橫跨了物理與數學兩個領域,她笑稱自己「天生斜槓」。在學術上,程之寧原先喜歡文學,之後卻走上數理研究的道路;在音樂上,程之寧喜愛搖滾樂,至今仍在自己的樂團裡擔任鼓手。

她如何看待自己一路走來的各種轉折?游徜在數學與物理之間,她又對這兩個領域的連結有怎樣的體會?在與「研之有物」的訪談中,程之寧侃侃而談她的經歷、想法,以及對學術研究的熱忱所在。

在弦論的設定中,宇宙所有的粒子都是由一段段「能量弦線」所組成,每一種基本粒子的振動模式不同,產生不同的粒子特性。圖/iStock
  • 請問您是如何對數學及物理產生興趣?從何時開始?

一開始考大學時,其實我想去念中文系(笑)。不過,因為我高中是選理組,而且只念了一兩年,對文科考試比較沒把握,加上對工程科系沒興趣,最後就選擇臺大物理系就讀。

後來發生兩個轉折,第一個是我很認真的去修了大學中文系的課,結果發現真的沒有想像中容易。第二個就是我發現物理系的課還蠻有趣的,像量子力學和相對論,讓我覺得還想再多學一點、多知道一點。

我開始覺得如果念完臺大物理系就停下來,好像有一種小說沒讀完的感覺,所以就想繼續讀碩士班。那時還沒有覺得自己會走上學術研究的路,單純抱著想把故事看完的想法。

  • 後來是如何接觸到弦論?弦論是如何引起您的興趣?

後來我去荷蘭念碩士,指導教授是諾貝爾物理獎得主 Gerard ’t Hooft。他其實蠻不認同弦論,但他對於如何處理量子力學與相對論很有興趣。

當時 ’t Hooft 教授在建議我碩士題目時就說:「你也知道我不太認為弦論是一條正確的道路,不過聽說弦論最近真的在量子重力這一塊有一些成果。不如妳去讀一讀,看看是不是真的有一些東西在那裡,也可以比較一下其他量子重力理論。」

在我很認真的比較各個量子重力理論之後,就變成弦論派了(笑)。’t Hooft 教授對此也保持開放態度,他有幾個不錯的博士生後來也變成弦論學家,之後我在 Erik Verlinde 的指導下念博士時,就完全以弦論為研究主題了。

  • 研究理論物理會影響您對現實世界的理解嗎?

蠻多人會問我說,妳學了量子力學,是不是就會比較了解這個世界不是非黑即白?或問我量子力學跟宗教是不是有關?可是我覺得我分得很開,我不會去做這樣的連結,我還是活在現實裡,走路時大部分都在專注於自己不要跌倒之類的。

如果真的要講,我蠻感激我們的存在,因為我所學的東西讓我知道這是沒有必然性的。我們能這樣以一種人形的很奇怪的生物的形式存在,然後在這樣一個環境過一輩子,是機率很低的事情,而且我還蠻開心我是當人,而不是奇怪的阿米巴蟲或外星生物!有些人會從這裡連結到宗教或轉世,但我不會,我就停在這裡。

  • 來談談您的研究,伴影月光猜想與 K3 曲面弦論之間是什麼關係?

弦論中有很多的可能性,我們可以挑選特定的四維,然後假設這四維空間是個 K3 曲面。例如說,我們可以把兩個甜甜圈乘起來,在上面做特殊的奇異點,來製造出一個 K3 曲面。這個曲面有一些很有趣的對稱性。從弦論的角度來講,我們可以透過這個過程,找出一個解釋為何有伴影月光猜想的框架。

「把維度乘起來」這個概念很難想像,但這在數學上是成立的。我舉例一個我們能想像的「乘起來」:如果有一個空間是一條線,另一個空間是一個圓,乘起來就變成一個圓柱形,從一個方向剖面可以切出圓,另一個方向則切出線。而在數學上,不管幾維,能不能在紙上畫的出來,都可以這樣操作。

程之寧向「研之有物」採訪團隊解釋「把維度乘起來」的概念。圖/研之有物
  • 如何透過計算,發現捉摸不定的「月光」?

有時候這看似湊巧,一個數學上的函數正好就是弦論某個問題的答案。但其實並不是真的那麼巧,弦論看起來很有彈性,好像什麼都可以解釋,但它其實有非常多結構及限制。

當我在計算一個弦論理論時,它的內部結構可能原本就具有某些特定的性質,然後我再去觀察數學中,有這樣性質的函數可能就只有一兩個,只要再初步算一下,就能知道哪一個是答案。弦論學家日常的計算常常是這樣的,所以這是巧合嗎?是也不是。

  • 您曾經發現 23 個新的伴影月光猜想,您對這類題目特別有興趣嗎?

我覺得數學有兩種,有些數學家喜歡系統性的事情,就像蓋房子一樣,在數學裡建造一個很美麗、非常有系統性的結構,可以把很多事情都放入這個結構來理解。

另一種比較少數的,就是喜歡獵奇,去收集分類奇奇怪怪的特殊東西,例如有這些性質的函數在哪裡?可能你算出來就是 5 個,你也不知道為什麼。月光猜想很明顯就屬於這一類。

兩種的樂趣感覺是不一樣的,我覺得應該都很棒,但我可能是屬於偏好獵奇的這種。

  • 您的研究連結了物理上的弦論與數學上的月光猜想,您怎麼看待這兩個知識體系的互動?

弦論是一個需要很多數學理論配合的物理理論,它是一個有點繁複的框架,我們什麼都要會一些,才能看懂這個理論。當你把許多不一樣的學門的知識加起來,有時候就會在某一個學門──例如幾何──有意想不到的收穫。

弦論在數學上也扮演探索與找尋新方向的角色,讓數學家有新的發現。雖然最後數學定理的證明還是得仰賴傳統數學方法,但在這二三十年間,我們一直從弦論身上找尋數學研究的新方向或有趣的猜想,看到了弦論與數學之間的互動。

數學家有兩種,一種人喜歡建立美麗又有系統性的結構,另一種人喜歡尋找和收集奇怪特殊的數學物件(比如函數),程之寧表示自己屬於後者。圖/研之有物
  • 剛才一開始提到,您高中只念了一兩年,是因為對學校沒有興趣嗎?

其實我一直都覺得上學很無聊。我小時候臺灣教育和現在很不一樣,一班 50 幾個人,老師必須盡量軍事化管理,大家最好都一模一樣,比較好管理。我和學校一直處於互相磨合的狀況,我自認已經努力配合學校,但學校一直覺得我在反抗,這可能是一個認知上的差別。

舉例來說,我小學的時候不想睡午覺,可是老師說大家都一定要睡午覺,不睡午覺的人要罰抄課文,所以我早上到學校時就會把已經抄好的課文交給老師。我覺得我這樣做是在配合老師的規定,可是以老師的立場會覺得我在反抗,學校教育中我遇到了很多類似的情況。

還有就是不喜歡高中的升學氛圍,同學和老師好像都只有一個活著的目標,就是「考大學」。我當時無法習慣升學氛圍,感覺好像活在平行宇宙一樣。

  • 高中休學後,您去唱片行工作,可否談談當時的想法?

我國中開始聽音樂,這是我除了看書之外的重要興趣,我也很快就喜歡上了搖滾樂。高中休學的時候,我唯一的謀生技能可能就是我對音樂的各類知識吧!所以我就去了唱片行,這是唯一一個我會做又有興趣的工作,還好那時候還有很多唱片行(笑)。

  • 對音樂的熱忱,讓您與朋友共組了樂團,並擔任鼓手。您是否比較過樂團生活和學術研究之間的異同之處?

有些人覺得我這樣很跳 tone,但我自己覺得還好。音樂和學術都是我發自內心覺得好玩的東西,兩者也有相同之處,例如它們都需要創造性,也都有需要了解的框架。數學需要嚴謹的證明,音樂演奏也需要遵循結構,例如不能掉拍。

音樂領域還有一點和數學類似──玩樂團的圈子也是以男性為主。我們樂團則是只有一個男生,其他都是女生,可能我真的天生對框架有點遲鈍,玩團之後才發現:「怎麼大家都是男生?」

程之寧表示,學術界仍有許多性別不平等問題未受重視。圖/研之有物
  • 也就是說,目前數學學術圈仍是男性主導,在研究路上,您有因為性別而感受到一些衝擊或眼光嗎?您怎麼面對?

有。那感覺很明顯,日復一日地要去面對,尤其是年紀還比較輕、還必須每一天去證明自己的能力的時候,特別有感。

我遇到時的反應就是,在心裡暗罵一句髒話,然後繼續做我要做的事。我不會想改變別人的想法,感覺那是浪費時間,就算環境給我的阻礙是這樣,我還是繼續去做該做的事。

可是有些事情沒那麼簡單,現在我也當過老師,有時候會看到年輕女生在學術界因為性別而被欺負,或遭到不公平待遇、甚至騷擾。

對此我感到心痛,覺得為何我們學術領域還是這樣的狀況?甚至為什麼性騷擾至今還是一個議題?可以確定的是,學術界許多性別不平等問題未受到重視。

  • 您現在已經有傑出的研究成果,還會因為性別而遭受質疑嗎?

我現在比較會遇到一個狀況反而是來自學生的質疑。我在荷蘭阿姆斯特丹大學教書時,有時候學生會因為我是女教授,而且我的外表在許多歐洲人眼中看起來就像小妹妹,所以比較容易去挑我的毛病。

在課堂上,下面坐的可能都是男學生,只有一兩個女學生,那個氣氛就會變得很奇怪。例如說偶爾會聽到學生評論我的身材或樣貌。

我有和其他一些在歐洲或美國的女性教授聊過這樣的問題,似乎不少人都有類似的不太愉快的經驗。感覺不是很好。

  • 看到您最近的研究和人工智慧(AI)有關,為何會想往這個方向發展?

我有兩個動機。一個就是我真的想深入了解人工智慧。我也可以像普羅大眾,看看 AI 下圍棋,讚嘆「哇!好厲害!」這樣就好,可是我覺得我一定可以真的去理解它,這可能就是數學家的自大吧!

另一方面,我知道對科學研究來說,未來 AI 將會是一個非常重要的工具。這是「在職訓練」的概念,我可能會用到這個新工具,或以後我可能會需要教這樣的課,因為學生是下一代的科學家。因為這些原因,我覺得我需要去訓練自己使用新的工具。在我的領域裡,也有一些有趣的、還沒被解答的科學問題,是 AI 有可能幫得上忙的,我看到了一些潛力。

  • 弦論和 AI 感覺差距很大,AI 也可以應用到弦論的研究嗎?

乍看之下,弦論的確比較抽象,也不像其他許多實驗會產生大量數據。但其實弦論有大量的可能性,我認為使用 AI 來在這些巨量的可能性當中搜尋特別有趣的理論,是一個有潛力能夠加深我們對弦論理解的新的研究方法。

而且 AI 的應用絕不僅限於巨量資料。如果是面對一些比較新的挑戰,在沒有現成的演算法可以用的情形之下,可以自己做出需要的功能嗎?這過程我覺得也非常很有趣,而且應該是會有成果的一條路。這種不是那麼顯而易見的事情,我覺得很有挑戰性,也蠻好玩的。

除了用 AI 來幫助物理跟數學的研究之外,我也試著物理研究當做靈感來源,找出新的 AI 的可能性,我覺得這也是一個很有趣的研究方向。我現在有和 AI 的學者合作,嘗試做出一些創新的演算法,真的還蠻有趣的。

  • AI 對您而言是全新的領域,您如何面對跨領域遇到的門檻?

一開始會覺得真的要去碰這個新的領域嗎?其實現在也還是偶爾會有這樣的懷疑。我在弦論領域可能已經是專家,但去了一個新的領域,我學得不會比二十歲的人快,要怎麼去跟人家競爭?是不是在浪費時間?

但也會想,與其想這麼多,不如先做再說。到目前為止我做了兩年多,感覺還蠻好的,我有學到東西,也有做出小小的貢獻。

其實我還蠻感激有這樣的學習機會。對我來說當科學家最大的好處就是,去搞懂一個新的東西就是工作的一部分。當科學家雖然蠻辛苦,但就結果論來說,我還蠻開心能當一位科學家!

延伸閱讀

  1. Moonshine Master Toys With String Theory | Quanta Magazine
  2. Mathematicians Chase Moonshine’s Shadow | Quanta Magazine
  3. 林正洪教授演講 一 怪物與月光(Monster and Moonshine),《數學傳播》

數感宇宙探索課程,現正募資中!

文章難易度
所有討論 2
研之有物│中央研究院_96
8 篇文章 ・ 17 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook