0

1
0

文字

分享

0
1
0

AlphaGo成為「棋靈王」是有多厲害?人工智慧未來又要怎麼走?

活躍星系核_96
・2016/03/14 ・3227字 ・閱讀時間約 6 分鐘 ・SR值 540 ・八年級

文/于天立|台灣大學電機系教授

相信 2016 年 3 月 12 日是個日後常常會被提起的日子。因為在這一天,電腦圍棋第一次在分先的情況下戰勝了人類一線職業棋手李世乭。

圍棋被認為是人類發明的棋類中最複雜的,在 IBM 開發的「深藍」超級電腦,於 1997 年擊敗西洋棋世界棋王後,圍棋被許多人認為是人類對抗人工智慧的最後一道防線。

圍棋有多困難呢?

有不少人估計過圍棋所有可能的盤面狀況,我個人認為約 10170 是很合理的估計(西洋棋約為 1047)。而這個數字有多大呢?姑且假設電腦一秒鐘可以探索 1020 種不同的盤面狀況(目前根本做不到),要暴力搜尋完所有可能也需要超過 10140 年,而我們目前所估計這個宇宙的年紀僅僅約 1010 年而已。

西洋棋單一個盤面能下的合法步數平均約為 40 左右,而圍棋一開始就有 361 個合法下法。當然你可以說因為有對稱性等等,其實沒那麼多。沒錯,不過這對稱性大概在第 4 手、第 5 手就消失殆盡,就算我們扣掉一開局不太可能在邊線落子,我們說圍棋平均合法下法在 100~200 以上並不為過。這使得深藍所使用的搜尋、剪枝技術在圍棋上派不上用場。

圍棋是目前最複雜的棋,本文作者估計可能的盤面狀況約有10170種。圖/wikipedia。
圍棋是目前最複雜的棋,粗估可能的盤面狀況約有10^170種。圖/wikipedia

身為圍棋及人工智慧的愛好者,我個人也非常關注這次的賽事。更正確的來說,自從 Google 在 Nature 期刊發表了AlphaGo 5:0戰勝歐洲圍棋冠軍,職業圍棋二段樊麾(第一次電腦圍棋在分先的情況下戰勝人類職業棋手), AlphaGo 就成了許多人工智慧研究者關注的焦點。AlphaGo 戰勝李世乭後(目前是 3:1),這成為了我和一些親朋好友之間的話題。說實話,我個人賽前也看好李世乭。我們知道這一天遲早會到來,我個人以為總還要三、五年的時間,但真的沒想到這一天來的這麼快。

AlphaGo的勝利優勢

關於圍棋,比我專業的人太多,這邊我只簡單從演算法的角度講幾句。AlphaGo 中所使用的蒙地卡羅法,所搜尋的是最大勝率的一步,而並非最好的一步。也就是說,當 AlphaGo 佔優勢時,它應該會試著以最穩定的方式贏棋,這可能是為何在第1、2局中我們看到 AlphaGo 似乎有避劫的意圖。因為不需要打劫就能贏棋,不需要無謂地增加不確定性。而同樣的在第4盤後期,我們看到 AlphaGo 無所不用其極地做些試驗(例如無謂的一線立下,招致損目),因為局勢不利,而那些是少數有可能贏棋的下法,即使人類看來似乎很幼稚,但對演算法而言是合理的下法。話又說回來了,真的覺得 AlphaGo 下的可笑的話,不如去向 AlphaGo 討教幾盤。綜合目前4盤來看,我們不能以人類的方式去理解 AlphaGo。

AlphaGo 的實力已獲得証明,它並不如賽前大家想像中的弱,但也並非完美無瑕。

對於電腦圍棋,我發現不少人有一些錯誤的認知,像是:(1)電腦能背那麼多棋譜、(2)現在電腦速度那麼快,所以當然會贏。下面我想就這兩點說明一下。

棋譜背的多就會贏?

在這次的五局賽的第一局,也許是出於試探,李世乭選用了職業賽中未曾見過的開局,而 AlphaGo 正確應對,早早在序盤便取得優勢。第二局中,李世乭小心的選用了常見的開局,AlphaGo 卻在第 13 手下出了職業棋譜中從未出現的一手,這手新著使得李世乭離開座位去抽根煙苦思對策。這些都說明了AlphaGo是從眾多的棋譜中學習,而絕非死背。

電腦速度快就會贏?

摩爾定律常見(但不精確)的一種解讀是每 18~24 個月,電腦效能就增進一倍。這個「定律」在大約 1965 年被提出來後,雖然常常被大家以為已經到了極限,但事實上至今仍然成立。不過我們首先要對「效能增進一倍」是什麼意思說清楚一點。現今的 CPU 時脈可達 3.5 GHz,已進入了 wifi 傳輸頻帶(2.4 GHz及 5 GHz),而power density(每單位面積的能量)約相當於1/10核能發電機的 power density。

換言之,目前單顆核心的運算效能幾乎已經達到了物理極限。那摩爾定律又是如何被維持的呢?是的,就是多核心技術。CPU如此,GPU更是多核心技術發揮的地方。打敗李世乭的分散式 AlphaGo 使用了 1920 顆 CPU 及 280 顆GPU。Google 並未說明所使用的 CPU/GPU 規格如何,但我們姑且以 TESLA S1070 為例,它就含有 960 核心。

CPU及GPU的運算能力。圖/Nvidia Cuda C Programming Guide version 4.2。
CPU及GPU的運算能力。圖/Nvidia Cuda C Programming Guide version 4.2

然而,越多核心就會越快?這可不一定。阿姆達爾定律(Amdahl’s Law)說明了這個現象,而其大致可用如下的式子表示:

公式2

其中(不可平行化比例 + 可平行化比例)= 1,而不可平行的部份原因多半是資料相依性。也就是可能某一運算需要使用到上一個運算的結果,如此一來此兩運算就無法在同一時間分別用兩個核心完成。舉例來說,若一演算法約有一半的部份可被平行化,則無論我們給它多少的運算資源,至多也只能加速兩倍。如果我們考慮產生及結束執行緒(thread)所需的額外花費,有時產生過多的執行緒反而會使程式變慢。至於有效利用平行/分散式運算資源,Google 有著多年的經驗,這也是 AlphaGo 成功的一重要因素。

30462
阿姆達爾定律(Amdahl’s Law)說明。綠線為理想線性加速,藍線為Amdahl’s Law的加速,有其上限,紅線則為實際考慮額外花費的情形。越多核心並不會總是越快。圖/wikipedia

Google使用了新的演算法嗎?

根據 Google 在 Nature 期刊發表的論文,其主要的核心技術在:(1)深度神經網路、(2)加強式學習、(3)蒙地卡羅樹狀搜尋。AlphaGo 使用了兩個深度神經網路,一用來評估盤面狀況,一用來預測下一落子,這兩者可大幅縮減搜尋複雜度。而深度神經網路的特點在於可自動產生特徵,然後利用這些特徵來做分類。AlphaGo 很重要的特點在於可以自我訓練。這是藉由加強式學習將深層搜尋的結果回饋給神經網路做修正。這個特點使的 AlphaGo 能下出自我的風格,而非一味背誦模仿。

AlphaGo使用兩個深度神經網路來輔助蒙地卡羅樹狀搜尋。圖/Nature 期刊。
AlphaGo使用兩個深度神經網路來輔助蒙地卡羅樹狀搜尋。圖/Nature 期刊

嚴格說起來,以上三項技術都不是 Google 發明的。然而如此組合出 AlphaGo 當然得歸功於 Google。(把加強式學習組合到深度神經網路的方式是由DeepMind公司所發展,於2014被Google收購)。至於有些人認為僅僅是組合已有的演算法並沒有什麼實質貢獻,我覺得這是沒有真正了解系統的概念。這就好比說廚師所用的食材都不是自己種/養殖的,所以煮出一道出色的菜餚並沒什麼了不起一樣的可笑。要知道機器學習的演算法有千千萬萬種,找出其中正確的組合何其困難。更不用說就算知道要用哪些演算法,組合的方式也無法計數,有時為了有效的組合運用及配合平行運算,還需要修改原來的演算法。這些方方面面,沒有一件是簡單的事,但Google做到了,實在值得我們喝采。

人工智慧贏了人類之後,要走向哪裡?

圖/deviantart @agsandrew

和深藍不同的是,深藍所使用的技術僅能適用於兩人回合制棋類,且盤面可能性不能太多。而 AlphaGo 所使用的技術,就我個人看來,應該適用於一般連續性決策問題。因為 AlphaGo 是在眾多可行的決策中,適當分配運算資源來探索此一決策所帶來的好處及壞處,並且可從探索中回饋修正錯誤。這樣的學習模型無疑地用途是比深藍更加廣泛的。

 

下一步呢?如上所述,即使 AlphaGo 所使用的學習模型比較具有一般性,但離真正完全通用的學習模型仍有一段距離。其實 IBM 發展的 Watson 也是嘗試著整合許多演算法,從而提供一通用學習模型,可見得這會是未來人工智慧的趨勢。

最後,我們更希望可以從學習模型中萃取出人類能理解且有用的知識。再以 AlphaGo 為例,就算 AlphaGo 真能完勝人類棋手,就我的理解,它目前還無法直接教人類如何下圍棋。是的,你當然可以拿著棋譜,看看 AlphaGo 會下在哪裡。但是如果你問 AlphaGo 為何要下這裡時,它可能會說因為這裡算出 87% 的勝率,而我們人類需要的可能像是:「如果這邊打入活一塊的話,相對地可以威脅上邊的……」而這類型的自動知識獲取,將會是人工智慧未來得面對的更重大的挑戰。

12803250_1060841130646897_607463593091018832_n


數感宇宙探索課程,現正募資中!

文章難易度
活躍星系核_96
755 篇文章 ・ 90 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia


0

2
1

文字

分享

0
2
1

就是想知道十萬個植物的為什麼!解開植物生長之謎的駭客兼翻譯——蔡宜芳專訪

鳥苷三磷酸 (PanSci Promo)_96
・2022/04/06 ・3848字 ・閱讀時間約 8 分鐘

本文由 台灣萊雅L’Oréal Taiwan 為慶祝「台灣傑出女科學家獎」15周年而規劃,泛科學企劃執行。

2018 年「台灣傑出女科學家獎」傑出獎第十一屆傑出獎得主

  • 中研院分子生物研究所特聘研究員蔡宜芳,畢業自台灣大學植物系,在美國卡內基美隆大學(Carnegie Mellon University, CMU)取得博士,後於加州大學聖地牙哥分校(University of California, San Diego, UCSD)進行博士後研究,研究專長為植物分子生物學。主要從事細胞膜蛋白的功能研究,在硝酸鹽轉運蛋白研究領域有卓越貢獻。2021 年蔡宜芳特聘研究員榮獲美國國家科學院(National Academy of Sciences, NAS)外籍院士(international members)。

如果妳撿到蔡宜芳掉的手機,可能很難立即知道失主是誰,甚至有點摸不著頭緒:因為她手機裡超過 80% 的照片,都是植物。為何會選擇植物作為研究領域?身為中研院分子生物研究所特聘研究員,在植物分子生物學領域貢獻卓著的她卻說,這個決定其實「不太科學」,因為起心動念是自己「真的很喜歡植物」。

因為喜歡所以好奇,因為好奇而想要知道更多:許多 love story 都是這樣開始的,而研究領域的開展又何嘗不是一場超浪漫故事呢?也因為一般人都不夠認識植物,聽不懂植物的細語呢喃,更需要蔡宜芳這般熱愛植物的科學家,擔任植物駭客兼翻譯,讓不辨菽麥者也能偷聽花開的聲音。

故事,從一株異變的阿拉伯芥開始說起。

植物對於氮肥的攝取機制與調控方法正是蔡宜芳的研究主題。圖/劉志恒攝影

分子生物學突破:發現植物吸收硝酸鹽的關鍵蛋白 CHL1

上世紀 50 年代起的「綠色革命」,大幅提升了糧食生產量,餵飽了激增的地球人口,「氮肥」在其中功不可沒。它對植物開花結果至關重要,然而植物透過什麼機制攝取氮肥?如何調控才能更有效地吸收?蔡宜芳研究的正是其中的分子機制。

氮,是生物存活的重要元素;從推動光合作用的葉綠素、各種代謝反應的酵素,到與遺傳相關的核酸中,都有氮的存在。但對植物來說,要取得氮元素卻出乎意料地困難;大氣的組成中近五分之四為氮氣,但是除了藉由少數有固氮能力的微生物以外,植物只能使用在土壤中非常少量的氮源,吸收的型態有「氨鹽」與「硝酸鹽」,其中又以硝酸鹽為主。

但是,硝酸鹽是帶電離子,無法自行通過脂質構成的細胞膜,那到底植物如何利用硝酸鹽呢?為了解開這個長年來的謎題,蔡宜芳將目光投向一棵無法正常吸收硝酸鹽的阿拉伯芥突變株,並利用當時最新發展出來的分子生物技術,試圖找到出關鍵基因。蔡宜芳表示,這個無法正常吸收硝酸鹽的突變株,在她約 10 歲時就被荷蘭研究者發現,這麼多年來在傳統技術底下被研究得相當透徹;卻直到她開始進行博士後研究,伴隨植物分子生物相關技術發展,才有方法找到關鍵的轉運蛋白。

這樣的研究自然充滿了挑戰,因為新技術還不穩固,就連實驗室老闆都曾勸她放棄。不願投降的她,決定一邊持續研究氮代謝,一邊到其他研究室學細胞膜研究的新技術,1994 年,蔡宜芳從美國回到台灣,持續研究進一步發現, 位在植物細胞膜上的 CHL1 硝酸鹽轉運蛋白,除了作為硝酸鹽的「搬運工」,還有其他異想不到的功能。在你我的印象當中,植物是被動的吸收養分:但其實當土壤中的的硝酸鹽變化時,植物會主動改變硝酸鹽的運作模式,這就是蔡宜芳團隊在 2003 年的重大發現。運作模式的改變正來自於 CHL1 蛋白的磷酸化轉換,因此 CHL1 蛋白也具備作為「傳令兵」的功能。透過 CHL1,植物便能感應周圍的硝酸鹽濃度,幫助植物調控基因表現,以便能更有效率地利用硝酸鹽。

掌握硝酸鹽吸收的調控,在農業領域十分有發展潛力,蔡宜芳的研究進一步轉向,對接實際應用,期盼為農業的永續未來提供新解方。除了 CHL1硝酸鹽轉運蛋白的機制外,她也針對阿拉伯芥如何吸收與輸送硝酸鹽到不同組織的分子機制展開探索。近期更研究探討是否能以育種或基因調控的方式,增進植物吸收硝酸鹽的效率。由於硝酸鹽非常容易在環境中流失,因此多數的氮肥施放到田間後,植物也往往吸收不了;如果可以改善植物的吸收效率,就能減少施肥的浪費,連帶減少製造氮肥耗用的能源,也讓農作物長得更好。

好消息是,透過基因調控,蔡宜芳團隊已經在阿拉伯芥、菸草及水稻上實驗成功,並取得相關專利,期待未來將授權給生物科技公司進行下一步。

培養科學研究必備品:好奇心、科學思辯與毅力

蔡宜芳從事研究的初衷是因為對植物的喜愛與好奇心,對她來說和植物有關的十萬個為什麼,猶如始終永遠拼不完的大型拼圖,從小時候就在蔡宜芳的心中佔據了重要位子,於是她「追根究柢」(如字面上意義),想靠自己解開植物現象背後的秘密。

人們對自己不了解又無法回嘴的植物充滿了誤解,往往覺得植物跟動物一點也不同,然而在蔡宜芳看來絕非如此,她表示,已經有研究發現,當我們這些動物咬下蔬菜的瞬間,植物裡頭負責傳導的的鈣離子就會產生變化。「大家都覺得植物不會動不會叫,但其實植物是有感知的。」蔡宜芳表示,植物其實都知道,只是用我們不懂的方式在表達,要靠研究才能一句一句地破解植物的密語。

圖/劉志恒攝影

當然研究也不能自己埋頭苦幹,交流非常重要。蔡宜芳擔任植物學期刊 《Plant Physiology》 編輯多年,但回憶起剛建立獨立實驗室的階段,面對那麼多來自審稿人的刁鑽問題,當時的自己也難免生氣。一旦轉換身份成為審稿人,被審的經驗也讓她更明白審查論文時該注意的重點,一來一往的思辨與答辯,反而讓她覺得很好玩。

「我自己有個突破,是因為被質疑的時候很生氣,可是不能光氣,也要想辦法解決。就在生氣的時候,想出來的方法,最後變成我們實驗室很新的工具。」而她也認為自己在替《Nature》等重要期刊審稿時,認真地給出言之有物的評論,幫她累積了領域內的信譽,才讓期刊編輯的位置找到了她。

蔡宜芳曾擔任植物學期刊《Plant Physiology》編輯。圖/《Plant Physiology》網頁截圖

像投稿審稿這般來回思辨的訓練,對科學家的養成非常重要,然而蔡宜芳觀察,科學思辨在台灣教育裡比較缺乏。她舉例,在美國課堂上,老師會要學生先讀一篇論文,接下來整堂課則要學生批評論文有什麼問題。「我們在台灣被訓練的人,都會把 paper 當作傳世經書在讀,讀懂它就覺得很開心了——要去批評它,我們真的沒有習慣。」蔡宜芳坦言那過程對她來說曾經非常痛苦,但會痛就代表該變。

她就此改變了思路:面對知識,蔡宜芳要求自己不僅要讀懂,還要有餘力批評它,說出對、錯在哪裡。蔡宜芳認為,科學就是得永遠抱持著質疑的態度,在不疑處有疑,才能找到真正的答案。「在我自己的實驗室裡面,我也一直在逼學生要去思考」。

蔡宜芳在實驗室中,會不斷要求學生思考、批判。圖/劉志恒攝影

而除了好奇心及思辨能力之外,蔡宜芳認為「毅力」也是科學家在科學界持續前進的重要特質。經驗告訴她,在科學研究中遇見失敗比遇見成功的次數多太多了,革命十次稀鬆平常,如何二十次甚至三十次之後還能繼續往前走?那絕對需要強大的毅力來抗壓才行。

說到壓力,身為科學界的女性,蔡宜芳認為,自己的成長環境中,性別造成的影響並不大,以她所在的中研院分生所為例,研究人員性別比例很平均。但若深入細究,「無意識偏見」(unconscious bias)仍難以避免。她以自己帶過的學生為例,生科領域在大學時期男女比例大約是各半,但隨著碩士、博士一路往上,男性的比例逐漸多於女性。因為許多女學生在面臨職涯選擇的時候,往往會被迫以家庭或是男性伴侶的事業為優先,這種狀況回過頭來又讓部分老師覺得「教育女生有時會是浪費」,成為惡性循環。

榮獲過許多科學成就獎項的她,時常是唯一獲獎的女性,而就在接受採訪不久前,她又獲頒一個獎項,直到頒獎當天的照片寄回到所上,「一片黑西裝裡面,就我穿黃色!」她笑道。所上第五屆台灣女科學家傑出獎得主鍾邦柱老師看到照片時,也對她苦笑說:「哎,革命尚未成功,同志仍需努力。」

「先不要去想會有這個東西,做該做的事情。真正不平的時候,不要安靜不講。」儘管環境仍待改變,蔡宜芳建議女科學人自己先跨出一步,就如同她自己一路走來的態度。

一株莫名異變的阿拉伯芥,遇上一位不放棄的科學家兼植物迷,造就了改變農業、甚至是整體生態未來的契機。如果妳的手機也跟蔡宜芳一樣,裝的幾乎全是自己感興趣、想研究的東西的照片,請別質疑自己是不是怪怪的,或許妳也將靠著研究,改變世界,這是我能想到最浪漫的事了。

台灣傑出女科學家獎邁入第 15 年,台灣萊雅鼓勵女性追求科學夢想,讓科學領域能兩性均衡參與和貢獻。想成為科學家嗎?妳絕對可以!傑出學姊們在這裡跟妳說:YES!:https://towis.loreal.com.tw/Video.php

本文由 台灣萊雅L’Oréal Taiwan 為慶祝「台灣傑出女科學家獎」15周年而規劃,泛科學企劃執行。


數感宇宙探索課程,現正募資中!

鳥苷三磷酸 (PanSci Promo)_96
8 篇文章 ・ 15 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia