「大數據」(我個人比較喜歡「巨量資料」這個名詞),在歐美主流媒體早已成了常見的名詞了,到《紐約時報》(The New York Times) 用「Big Data」為關鍵字作搜尋就能找到一大堆有深度的文章,近年幾乎每週都有和「大數據」有關的新聞。國外已有媒體指出,大學甚至可能會因應市場需要,而開設 新課程或系所來訓練有能力分析大數據的人才;可是如果你用「大數據」在谷歌找中文新聞,出現的新聞要嘛是對岸的,要不然就是小眾媒體的。難怪台灣經濟會 悶……
不知上哪買?那就先讀牛津大學網路研究所教授麥爾荀伯格(Viktor Mayer-Schonberger)和《經濟學人》(The Economist)雜誌資料編輯庫基耶(Kenneth Cukier)的《大數據》(Big Data: A Revolution That Will Transform How We Live, Work, and Think), 讓他們告訴你什麼碗糕是大數據,大數據有什麼意義…或義氣…還有大數據將如何改變我們的生活,對經濟、社會和科學會帶來什麼影響,我們又能如何趕搭上這波 新潮流,如何懂得保護自己,避免個人資料和隱私受到侵害。《大數據》就用以上提到的實例,深入淺出地解說大數據之發掘和應用。
來自馬來西亞,畢業於台灣國立清華大學生命科學系學士暨碩士班,以及美國加州大學戴維斯分校(University of California at Davis)遺傳學博士班,從事果蠅演化遺傳學研究。曾於台灣中央研究院生物多樣性研究中心擔任博士後研究員,現任教於國立清華大學分子與細胞生物學研究所,從事鳥類的演化遺傳學、基因體學及演化發育生物學研究。過去曾長期擔任中文科學新聞網站「科景」(Sciscape.org)總編輯,現任台大科教中心CASE特約寫手、Readmoo部落格【GENE思書軒】、關鍵評論網專欄作家;個人部落格:The Sky of Gene;臉書粉絲頁:GENE思書齋。
還記得美劇《The Big Bang Theory》嗎?劇中常常出現的物理名詞「弦論」,是描述物理世界基本結構的理論。中央研究院「研之有物」專訪院內數學研究所程之寧研究員,她正是研究弦論的科學家,也是熱愛音樂的搖滾樂團鼓手,這種跨領域身份並不衝突,兩邊都需要創造力與紀律。由於天生斜槓的性格,讓程之寧在數學和物理領域大展身手,透過數學的深入探討,她試圖將弦論更往前推進。最近程之寧更跨足到人工智慧領域,為學界提供理論物理上的貢獻。
我有兩個動機。一個就是我真的想深入了解人工智慧。我也可以像普羅大眾,看看 AI 下圍棋,讚嘆「哇!好厲害!」這樣就好,可是我覺得我一定可以真的去理解它,這可能就是數學家的自大吧!
另一方面,我知道對科學研究來說,未來 AI 將會是一個非常重要的工具。這是「在職訓練」的概念,我可能會用到這個新工具,或以後我可能會需要教這樣的課,因為學生是下一代的科學家。因為這些原因,我覺得我需要去訓練自己使用新的工具。在我的領域裡,也有一些有趣的、還沒被解答的科學問題,是 AI 有可能幫得上忙的,我看到了一些潛力。
弦論和 AI 感覺差距很大,AI 也可以應用到弦論的研究嗎?
乍看之下,弦論的確比較抽象,也不像其他許多實驗會產生大量數據。但其實弦論有大量的可能性,我認為使用 AI 來在這些巨量的可能性當中搜尋特別有趣的理論,是一個有潛力能夠加深我們對弦論理解的新的研究方法。
而且 AI 的應用絕不僅限於巨量資料。如果是面對一些比較新的挑戰,在沒有現成的演算法可以用的情形之下,可以自己做出需要的功能嗎?這過程我覺得也非常很有趣,而且應該是會有成果的一條路。這種不是那麼顯而易見的事情,我覺得很有挑戰性,也蠻好玩的。
除了用 AI 來幫助物理跟數學的研究之外,我也試著物理研究當做靈感來源,找出新的 AI 的可能性,我覺得這也是一個很有趣的研究方向。我現在有和 AI 的學者合作,嘗試做出一些創新的演算法,真的還蠻有趣的。