- 作者| Chris Shallue,Google人工智慧研究員 / Andrew Vanderburg,德州大學奧斯汀分校天文學家
幾千年來,人們仰望星星,記錄、觀察天文現象,並從中發現其運行模式。第一批天文學家所認定的天體是行星,由於行星在夜空中看似不規則的移動,因此也被希臘人稱之為「planētai」或「漫遊者 (wanderers)」。經過幾個世紀以來的研究,人們已經了解太陽系的運行模式,是地球和其他行星圍繞著太陽公轉,而太陽是一個恆星,就如同我們肉眼所看見會發光的星星一樣。
如今,在望遠鏡光學(telescope optics)、太空飛行、數位相機和電腦等技術的幫助下,我們得以將對宇宙的了解擴展到太陽系之外,偵測並探究其他恆星周圍的行星。這些圍繞在其他恆星周圍的行星也稱之為「系外行星(exoplanet)」,而研究系外行星能幫助我們更深入探索宇宙與人類的奧秘。太陽系之外的宇宙是什麼樣子呢?外太空還有像太陽系一樣的其他行星恆星嗎?
雖然技術的進步有助於我們探索宇宙,但尋找系外行星仍不容易。與火熱的恆星相比,系外行星是冷的、小的、沒有光亮的,這就像要從幾千英里的地方,看見探照燈旁邊飛來的螢火蟲一樣困難。
不過藉助機器學習(Machine Learning),我們在最近有了一些新的進展。
克卜勒任務與 Google AI 的相遇
天文學家搜尋系外行星的方式,其中一個是分析來自NASA 克卜勒任務(Kepler Mission)中的大量資料數據,並透過自動化軟體和手動方式來執行。克卜勒任務用了四年的時間觀察近20萬顆恆星,每30分鐘拍一次照片,並創造了近140億個資料點。這140億個資料點相當於大約2千兆個可能的行星軌道。這個龐大的資料量即使用最強大的電腦來分析也是非常耗時、費力的。為了讓這個分析的過程可以更有效率,我們導入機器學習來加速分析時程。
凌星法是指,當一顆運行中的行星擋住了恆星的光線時,恆星的亮度會減小。我們以此概念為基礎,將其特徵訊號用來辨識周圍運行的行星,並運用克卜勒天文望遠鏡,在四年之間觀察並分析了20萬顆恆星的亮度。
機器學習能夠訓練電腦認識運作模式,而這對於分析大量數據來說尤其有用。機器學習技術的重點在於讓電腦從範例中學習,而不是透過編寫特定的規則。
我是Google人工智慧團隊的機器學習研究員,對於宇宙的世界相當感興趣。因此,我善用「20%計畫」(在Google,你可以利用20%的時間來做你喜歡或感興趣的事情)來開始執行這個專案。我和德州大學奧斯汀分校的天文學家 Andrew 接洽,共同執行這個專案。我們將機器學習技術應用在宇宙探索,並教導機器學習系統如何識別遙遠恆星周圍的行星。
我們利用超過 15,000 個被標記的克卜勒訊號,創造一個 TensorFlow 模組來辨別行星與非行星。為此,這個模型必須能辨認出真正的行星所形成的圖像,與其他天體如 星斑(starspots)和雙星(binary stars)所形成的圖像。當我們讓 TensorFlow 模組辨識從未見過的訊號時,它能以96%的準確率辨認出哪些訊號是行星,哪些是非行星。因此,我們知道這個模組成功了!
克卜勒90i,發現!
有了可行的模組後,我們拍攝恆星,並利用這個模組在克卜勒數據中尋找新的行星。為了縮小搜尋範圍,我們研究了 670個已知可容納兩顆或更多的系外行星的恆星。在這樣的過程中,我們發現兩顆新行星:克卜勒80g 和克卜勒90i。其中值得注意的是,克卜勒90i 是第八個被發現圍繞著克卜勒90的行星,這使它成為除了太陽系之外,第一個已知的八大行星系統。
我們利用15,000個被標示的克卜勒訊號,來訓練機器學習模組去辨認行星訊號,並利用這個模組,從670顆恆星的數據中發現新的行星,且成功發現了兩個先前被忽略的行星。
另外也發現了一些有趣的事:這個行星比地球大了30%;擁有大約華氏800度的地表溫度,絕對不是你下一趟旅行的好選擇;它以14天的週期繞著恆星公轉,這代表你每兩個星期就會過一次生日喔。
克卜勒 90是太陽系以外第一個已知的八大行星系統。在這個星系中,行星運行的軌道更靠近恆星,而克卜勒90i每14天公轉一次。(請注意,行星的大小,以及行星與恆星的距離不在測量範圍內。)
當我們運用科技來嘗試了解宇宙時,會以為已經可以一窺一二,但其實不然。目前為止,我們只用TensorFlow 模組搜尋了20萬個恆星當中的670個,而克卜勒的數據中可能還有更多系外行星尚未被發現,未來機器學習的新思維和技術將能幫助人類進行宇宙探索,發現更多未知的領域!
- 本文原刊載於Google台灣部落格,原文為《用機器學習發現新行星》