0

0
0

文字

分享

0
0
0

如何運用 Google AI的機器學習,發現新的系外行星 Kepler-90i ?

PanSci_96
・2017/12/19 ・1966字 ・閱讀時間約 4 分鐘 ・SR值 476 ・五年級
  • 作者| Chris Shallue,Google人工智慧研究員 / Andrew Vanderburg,德州大學奧斯汀分校天文學家

幾千年來,人們仰望星星,記錄、觀察天文現象,並從中發現其運行模式。第一批天文學家所認定的天體是行星,由於行星在夜空中看似不規則的移動,因此也被希臘人稱之為「planētai」或「漫遊者 (wanderers)」。經過幾個世紀以來的研究,人們已經了解太陽系的運行模式,是地球和其他行星圍繞著太陽公轉,而太陽是一個恆星,就如同我們肉眼所看見會發光的星星一樣。

Image credit: NASA

如今,在望遠鏡光學(telescope optics)、太空飛行、數位相機和電腦等技術的幫助下,我們得以將對宇宙的了解擴展到太陽系之外,偵測並探究其他恆星周圍的行星。這些圍繞在其他恆星周圍的行星也稱之為「系外行星(exoplanet)」,而研究系外行星能幫助我們更深入探索宇宙與人類的奧秘。太陽系之外的宇宙是什麼樣子呢?外太空還有像太陽系一樣的其他行星恆星嗎?

雖然技術的進步有助於我們探索宇宙,但尋找系外行星仍不容易。與火熱的恆星相比,系外行星是冷的、小的、沒有光亮的,這就像要從幾千英里的地方,看見探照燈旁邊飛來的螢火蟲一樣困難。

不過藉助機器學習(Machine Learning),我們在最近有了一些新的進展。

克卜勒任務與 Google AI 的相遇

天文學家搜尋系外行星的方式,其中一個是分析來自NASA 克卜勒任務(Kepler Mission)中的大量資料數據,並透過自動化軟體和手動方式來執行。克卜勒任務用了四年的時間觀察近20萬顆恆星,每30分鐘拍一次照片,並創造了近140億個資料點。這140億個資料點相當於大約2千兆個可能的行星軌道。這個龐大的資料量即使用最強大的電腦來分析也是非常耗時、費力的。為了讓這個分析的過程可以更有效率,我們導入機器學習來加速分析時程。

圖/Google台灣

凌星法是指,當一顆運行中的行星擋住了恆星的光線時,恆星的亮度會減小。我們以此概念為基礎,將其特徵訊號用來辨識周圍運行的行星,並運用克卜勒天文望遠鏡,在四年之間觀察並分析了20萬顆恆星的亮度。

機器學習能夠訓練電腦認識運作模式,而這對於分析大量數據來說尤其有用。機器學習技術的重點在於讓電腦從範例中學習,而不是透過編寫特定的規則。

我是Google人工智慧團隊的機器學習研究員,對於宇宙的世界相當感興趣。因此,我善用「20%計畫」(在Google,你可以利用20%的時間來做你喜歡或感興趣的事情)來開始執行這個專案。我和德州大學奧斯汀分校的天文學家 Andrew 接洽,共同執行這個專案。我們將機器學習技術應用在宇宙探索,並教導機器學習系統如何識別遙遠恆星周圍的行星。

我們利用超過 15,000 個被標記的克卜勒訊號,創造一個 TensorFlow 模組來辨別行星與非行星。為此,這個模型必須能辨認出真正的行星所形成的圖像,與其他天體如 星斑(starspots)雙星(binary stars)所形成的圖像。當我們讓 TensorFlow 模組辨識從未見過的訊號時,它能以96%的準確率辨認出哪些訊號是行星,哪些是非行星。因此,我們知道這個模組成功了!

克卜勒90i,發現!

有了可行的模組後,我們拍攝恆星,並利用這個模組在克卜勒數據中尋找新的行星。為了縮小搜尋範圍,我們研究了 670個已知可容納兩顆或更多的系外行星的恆星。在這樣的過程中,我們發現兩顆新行星:克卜勒80g 和克卜勒90i。其中值得注意的是,克卜勒90i 是第八個被發現圍繞著克卜勒90的行星,這使它成為除了太陽系之外,第一個已知的八大行星系統。

圖/Google台灣

我們利用15,000個被標示的克卜勒訊號,來訓練機器學習模組去辨認行星訊號,並利用這個模組,從670顆恆星的數據中發現新的行星,且成功發現了兩個先前被忽略的行星。

另外也發現了一些有趣的事:這個行星比地球大了30%;擁有大約華氏800度的地表溫度,絕對不是你下一趟旅行的好選擇;它以14天的週期繞著恆星公轉,這代表你每兩個星期就會過一次生日喔。

克卜勒 90是太陽系以外第一個已知的八大行星系統。在這個星系中,行星運行的軌道更靠近恆星,而克卜勒90i每14天公轉一次。(請注意,行星的大小,以及行星與恆星的距離不在測量範圍內。)

當我們運用科技來嘗試了解宇宙時,會以為已經可以一窺一二,但其實不然。目前為止,我們只用TensorFlow 模組搜尋了20萬個恆星當中的670個,而克卜勒的數據中可能還有更多系外行星尚未被發現,未來機器學習的新思維和技術將能幫助人類進行宇宙探索,發現更多未知的領域!


數感宇宙探索課程,現正募資中!

文章難易度
PanSci_96
989 篇文章 ・ 684 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。


0

26
4

文字

分享

0
26
4

極目遠眺的意義:天文學家為何追尋第一代星系

Tiger Hsiao_96
・2022/05/15 ・3764字 ・閱讀時間約 7 分鐘
  • 文/蕭予揚 清大天文所碩士生,將於約翰・霍普金斯大學攻讀天文博士
      林彥興 清大天文所碩士生,EASY 天文地科團隊總編

近日,來自東京大學和倫敦大學學院的科學家 播金優一(Yuichi Harikane) 在天文物理期刊《The Astrophysical Journal》發表了一篇論文,宣稱他們可能找到目前最遠的星系(名為 HD-1,紅移值 z 約為13),打破了原本最遠(GNz-11,z 約為 11)的紀錄。

天文學家為什麼執著要找最遠的星系呢?
是單純為了破紀錄而破、抑或是蘊藏了什麼科學涵義?
天文學家們又是怎麼尋找、並且推論這些星系多遠的呢?

HD1 的影像。圖/Harikane et al.

時間推回到二十世紀初,當時的科學家們對宇宙大小到底是恆定或是膨脹爭論不休,其中,愛因斯坦(Albert Einstein)便是支持「宇宙穩恆態理論」的知名科學家。而支持膨脹宇宙的科學家們,一直到西元 1929 年,愛德溫.哈伯(Edwin Hubble)透過測量其他星系,發現了宇宙在膨脹,才為膨脹宇宙(也就是日後人們所說的「大爆炸理論 The Big Bang Theory」)注入了一劑強心針。

接下來的各種證據,如宇宙微波背景輻射、宇宙中元素的比例等,讓天文學家們越來越確信宇宙的年齡是有限的,並開始利用紙筆與超級電腦,來推測最早、也就是第一代星系及恆星的樣貌,並嘗試用望遠鏡,來尋找早期星系是否和我們預測的相符。

科學家是如何知道距離的呢?

天文學家並沒有一把長達「一百多萬光年」的尺,那他們是如何尋找,並且知道這些早期星系距離我們有多遠呢?讓我們把兩個問題分開,先來探討在宇宙學尺度下的距離是怎麼得到的。

由於我們知道宇宙在膨脹,而這些遠離我們的星系所發出的光,也會因為類似都卜勒效應的影響,有著紅移的現象。而越遠的星系遠離我們的速度越快,它們紅移值也就越大;而從實驗室中,我們知道每種元素都會發出特定的譜線,藉由測量到星系光譜中特定譜線的實際位置,並與那條譜線所該在的位置比較,就能夠計算這些星系的紅移值了。

而結合紅移值和其他測量到的宇宙學參數(例如哈伯常數),就可以從星系的紅移值計算出物理上的距離,比如大家常會看到的「光年」。

星系的紅移(Redshift)與它跟地球的距離(Distance)可以互相換算。圖/林彥興

那既然這樣,我們只要測量所有星系的光譜,不就能知道最遠的星系是哪一個了嗎?可惜事情並沒有這麼簡單。

一來,很多星系(尤其是越遠的星系)都很黯淡,難以測量光譜,二來,測量光譜實際上是又貴又耗時的。所以,以「尋找」的為目的,做單一波段的搜索通常是比較實際的作法。但若是使用單一波段,不就代表我們沒有光譜,這樣不就又不知道距離了?

Well yes, but actually no。大家應該都聽過盲人摸象的故事,透過觀測越多的波段,我們就越能描繪出實際上的光譜,再根據現有的理論模型,我們就可以利用光譜擬合來推論出這些星系的紅移值。

那要如何鎖定這些早期的星系?

天文學家總不可能對每個能測量到的星系都做很多波段的觀測,並且大費周章的利用理論模型去擬合他們。很多特定的望遠鏡(例如 ALMA、JWST)是要寫觀測計畫書和其他天文學家競爭觀測時間的,總要給出一個有力的理由,才能讓你的觀測計劃脫穎而出。

但還沒有資料之前,天文學家要怎麼知道哪個星系是最遠的?這便產生了一個「沒有工作要怎麼有工作經驗」的迴圈。怎麼辦呢?天文學家就是要想辦法,在已經觀測的深空資料庫中去尋找最遠的星系。

哈伯太空望遠鏡拍攝的「哈伯極深空 Hubble Extreme Deep Field」影像。藉由比較圖片中不同紅移的星系的性質,天文學家就能重建出過去百億年來星系的形成與演化歷史。圖/NASA; ESA; G. Illingworth, D. Magee, and P. Oesch, University of California, Santa Cruz; R. Bouwens, Leiden University; and the HUDF09 Team

而要怎麼在龐大的資料庫中尋找遙遠的星系呢?讓我們再次簡單回顧歷史。量子物理在十九世紀末至二十世紀初逐漸開始發展時,瑞士物理學家約翰.巴耳末(Johann Balmer)研究激發態的氫原子所放出的光譜,發現在可見光波段,氫原子只會發射一系列特定波長的譜線。隨後美國物理學家西奧多.萊曼(Theodore Lyman)也接著發現,氫原子從受激態回到基態時,會放出一系列位於紫外線波段的譜線,這些特定的譜線也被稱為萊曼系。

氫原子的各個譜線家族,由上而下分別是位於紫外線的萊曼系,位於可見光的巴耳末系,以及位於紅外線的帕森系。圖/Szdori, OrangeDog

而用來尋找早期星系的第一種方法,也是最主要的搜索方法,就與萊曼系關係密切。天文學家發現,宇宙中有一種名為「萊曼斷裂星系(Lyman-break galaxies; LBGs)」的星系,這種星系的光譜有一個很明顯的特徵,便是在特定的波長以下就幾乎觀測不到,原因是波長更短的光(更高的能量)都被星際物質(Interstellar medium; ISM)和星系際物質(Intergalactic medium; IGM)的中性氫的萊曼線系給吸收了。

而萊曼線系中波長最短的譜線(常稱為萊曼極限)約在 91.2 奈米,最長的萊曼 α 譜線則約在 121.6 奈米。只要透過兩個波長足夠接近的波段去尋找「在長波長有觀測到、但在短波段沒觀測到的天體」(稱為 drop-out),就可以粗略的估計星系的紅移。

舉例來說,如果我們要找紅移值為 9 的萊曼斷裂星系,只需要稍微長於和短於 1216 奈米的兩個波段,看看有沒有星系出現在長波段的影像中,但在短波段的影像中卻沒有出現,就有可能是在紅移值為 9 的萊曼斷裂星系。如果要找越遠的萊曼斷裂星系,只需要換波長較長的波段即可。

近日打破紀錄的最遠星系,也是透過 H-band drop-out(在波長 H 波段沒有觀測到,而較長的波段有)所找出的。

光譜drop-out的例子。圖/Harikane et al (2022)

上圖為近日打破紀錄的最遠星系 HD1 的 H-band drop-out,可以看到長波段:4.5、3.6 微米以及 Ks 波段都有偵測到,但在 H 波段(以及更短波長)的影像就消失不見了。藍色的光譜 z 值為 13.3 的萊曼斷裂模型,灰色的光譜則為可能的低紅移汙染,z=3.9 的巴耳末斷裂模型。

當然,這只能幫助科學家初步的篩選,而且此種方法會受到一些其他非早期星系的汙染。

舉例來說,上文提到氫原子除了萊曼系以外,還有回到第一激發態的巴耳末系。若只是單純地透過 drop-out,因為巴耳末系本身的譜線就比萊曼系來得紅,所以也有可能找到的是紅移值較小的巴耳末斷裂;此外,非常紅且充滿塵埃的星系也會在光譜上出現類似「驟降」的特徵。

當然,更多波段以及光譜的觀測,都有助於釐清這些可能的汙染。而除了上述的方法以外,萊曼 α 發射體(Lyman-alpha emitters; LAEs)、伽瑪射線暴的宿主星系、重力透鏡效應等,也是尋找遙遠星系的重要方法哦!

那麼,找出這些早期星系有什麼科學意義?

現代宇宙學理論認為,宇宙在早期曾經經歷過兩次相變。第一次是宇宙從炙熱的游離態降溫回到中性的氣態,被稱為宇宙的復合時期(Epoch of Recombination),也是大家熟悉的宇宙微波背景的起源;第二次(也是最後一次)的相變,宇宙中的中性氫變成了游離化的氫離子,這個相變的過程被稱為再電離時期(Epoch of Reionization; EoR)。

而目前認為,第二次這個電離的原因,是第一代恆星和第一代星系所發出的強紫外線光,把周圍的中性氫游離成氫離子。藉由尋找越來越多的早期星系,我們就能透過這些早期星系來描繪宇宙再電離時期的歷史,而這又能夠進一步驗證現代宇宙學理論是否正確。不僅如此,研究這些早期星系,可以讓我們對於星系演化的歷史更往前推,或是研究早期星系的超大質量黑洞,是如何長到這麼大等等的議題。

未來展望

在 2021 年底順利升空的詹姆斯.韋伯太空望遠鏡(James Webb Space Telescope; JWST),其中一個主要的科學目標就是研究早期宇宙。如這篇文章一開始提到的「新的最遠的星系(HD-1)」,又如前一陣子發現的「最遠恆星 Earendel」,以及同一團隊的另一個紅移約 11 的星系,都在第一輪 JWST 的觀測計畫之中。

期待幾個月後 JWST 公布的第一批科學照片,能大幅革新我們對早期宇宙的認識。

參考資料(論文們)

延伸閱讀(科普文章)


數感宇宙探索課程,現正募資中!

Tiger Hsiao_96
9 篇文章 ・ 7 位粉絲
現為清大天文所碩二學生,即將赴美於約翰霍普金斯大學攻讀天文博士。