Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

如何運用 Google AI的機器學習,發現新的系外行星 Kepler-90i ?

PanSci_96
・2017/12/19 ・1966字 ・閱讀時間約 4 分鐘 ・SR值 476 ・五年級

  • 作者| Chris Shallue,Google人工智慧研究員 / Andrew Vanderburg,德州大學奧斯汀分校天文學家

幾千年來,人們仰望星星,記錄、觀察天文現象,並從中發現其運行模式。第一批天文學家所認定的天體是行星,由於行星在夜空中看似不規則的移動,因此也被希臘人稱之為「planētai」或「漫遊者 (wanderers)」。經過幾個世紀以來的研究,人們已經了解太陽系的運行模式,是地球和其他行星圍繞著太陽公轉,而太陽是一個恆星,就如同我們肉眼所看見會發光的星星一樣。

Image credit: NASA

如今,在望遠鏡光學(telescope optics)、太空飛行、數位相機和電腦等技術的幫助下,我們得以將對宇宙的了解擴展到太陽系之外,偵測並探究其他恆星周圍的行星。這些圍繞在其他恆星周圍的行星也稱之為「系外行星(exoplanet)」,而研究系外行星能幫助我們更深入探索宇宙與人類的奧秘。太陽系之外的宇宙是什麼樣子呢?外太空還有像太陽系一樣的其他行星恆星嗎?

雖然技術的進步有助於我們探索宇宙,但尋找系外行星仍不容易。與火熱的恆星相比,系外行星是冷的、小的、沒有光亮的,這就像要從幾千英里的地方,看見探照燈旁邊飛來的螢火蟲一樣困難。

不過藉助機器學習(Machine Learning),我們在最近有了一些新的進展。

-----廣告,請繼續往下閱讀-----

克卜勒任務與 Google AI 的相遇

天文學家搜尋系外行星的方式,其中一個是分析來自NASA 克卜勒任務(Kepler Mission)中的大量資料數據,並透過自動化軟體和手動方式來執行。克卜勒任務用了四年的時間觀察近20萬顆恆星,每30分鐘拍一次照片,並創造了近140億個資料點。這140億個資料點相當於大約2千兆個可能的行星軌道。這個龐大的資料量即使用最強大的電腦來分析也是非常耗時、費力的。為了讓這個分析的過程可以更有效率,我們導入機器學習來加速分析時程。

圖/Google台灣

凌星法是指,當一顆運行中的行星擋住了恆星的光線時,恆星的亮度會減小。我們以此概念為基礎,將其特徵訊號用來辨識周圍運行的行星,並運用克卜勒天文望遠鏡,在四年之間觀察並分析了20萬顆恆星的亮度。

機器學習能夠訓練電腦認識運作模式,而這對於分析大量數據來說尤其有用。機器學習技術的重點在於讓電腦從範例中學習,而不是透過編寫特定的規則。

我是Google人工智慧團隊的機器學習研究員,對於宇宙的世界相當感興趣。因此,我善用「20%計畫」(在Google,你可以利用20%的時間來做你喜歡或感興趣的事情)來開始執行這個專案。我和德州大學奧斯汀分校的天文學家 Andrew 接洽,共同執行這個專案。我們將機器學習技術應用在宇宙探索,並教導機器學習系統如何識別遙遠恆星周圍的行星。

我們利用超過 15,000 個被標記的克卜勒訊號,創造一個 TensorFlow 模組來辨別行星與非行星。為此,這個模型必須能辨認出真正的行星所形成的圖像,與其他天體如 星斑(starspots)雙星(binary stars)所形成的圖像。當我們讓 TensorFlow 模組辨識從未見過的訊號時,它能以96%的準確率辨認出哪些訊號是行星,哪些是非行星。因此,我們知道這個模組成功了!

克卜勒90i,發現!

有了可行的模組後,我們拍攝恆星,並利用這個模組在克卜勒數據中尋找新的行星。為了縮小搜尋範圍,我們研究了 670個已知可容納兩顆或更多的系外行星的恆星。在這樣的過程中,我們發現兩顆新行星:克卜勒80g 和克卜勒90i。其中值得注意的是,克卜勒90i 是第八個被發現圍繞著克卜勒90的行星,這使它成為除了太陽系之外,第一個已知的八大行星系統。

圖/Google台灣

我們利用15,000個被標示的克卜勒訊號,來訓練機器學習模組去辨認行星訊號,並利用這個模組,從670顆恆星的數據中發現新的行星,且成功發現了兩個先前被忽略的行星。

另外也發現了一些有趣的事:這個行星比地球大了30%;擁有大約華氏800度的地表溫度,絕對不是你下一趟旅行的好選擇;它以14天的週期繞著恆星公轉,這代表你每兩個星期就會過一次生日喔。

圖/Google台灣

克卜勒 90是太陽系以外第一個已知的八大行星系統。在這個星系中,行星運行的軌道更靠近恆星,而克卜勒90i每14天公轉一次。(請注意,行星的大小,以及行星與恆星的距離不在測量範圍內。)

當我們運用科技來嘗試了解宇宙時,會以為已經可以一窺一二,但其實不然。目前為止,我們只用TensorFlow 模組搜尋了20萬個恆星當中的670個,而克卜勒的數據中可能還有更多系外行星尚未被發現,未來機器學習的新思維和技術將能幫助人類進行宇宙探索,發現更多未知的領域!

-----廣告,請繼續往下閱讀-----
文章難易度
PanSci_96
1262 篇文章 ・ 2413 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

0
0

文字

分享

0
0
0
LDL-C 正常仍中風?揭開心血管疾病的隱形殺手 L5
鳥苷三磷酸 (PanSci Promo)_96
・2025/06/20 ・3659字 ・閱讀時間約 7 分鐘

本文與 美商德州博藝社科技 HEART 合作,泛科學企劃執行。

提到台灣令人焦慮的交通,多數人會想到都市裡的壅塞車潮,但真正致命的「塞車」,其實正悄悄發生在我們體內的動脈之中。

這場無聲的危機,主角是被稱為「壞膽固醇」的低密度脂蛋白( Low-Density Lipoprotein,簡稱 LDL )。它原本是血液中運送膽固醇的貨車角色,但當 LDL 顆粒數量失控,卻會開始在血管壁上「違規堆積」,讓「生命幹道」的血管日益狹窄,進而引發心肌梗塞或腦中風等嚴重後果。

科學家們還發現一個令人困惑的現象:即使 LDL 數值「看起來很漂亮」,心血管疾病卻依然找上門來!這究竟是怎麼一回事?沿用數十年的健康標準是否早已不敷使用?

膽固醇的「好壞」之分:一場體內的攻防戰

膽固醇是否越少越好?答案是否定的。事實上,我們體內攜帶膽固醇的脂蛋白主要分為兩種:高密度脂蛋白(High-Density Lipoprotein,簡稱 HDL)和低密度脂蛋白( LDL )。

-----廣告,請繼續往下閱讀-----

想像一下您的血管是一條高速公路。HDL 就像是「清潔車隊」,負責將壞膽固醇( LDL )運來的多餘油脂垃圾清走。而 LDL 則像是在血管裡亂丟垃圾的「破壞者」。如果您的 HDL 清潔車隊數量太少,清不過來,垃圾便會堆積如山,最終導致血管堵塞,甚至引發心臟病或中風。

我們體內攜帶膽固醇的脂蛋白主要分為兩種:高密度脂蛋白(HDL)和低密度脂蛋白(LDL)/ 圖片來源:shutterstock

因此,過去數十年來,醫生建議男性 HDL 數值至少應達到 40 mg/dL,女性則需更高,達到 50 mg/dL( mg/dL 是健檢報告上的標準單位,代表每 100 毫升血液中膽固醇的毫克數)。女性的標準較嚴格,是因為更年期後]pacg心血管保護力會大幅下降,需要更多的「清道夫」來維持血管健康。

相對地,LDL 則建議控制在 130 mg/dL 以下,以減緩垃圾堆積的速度。總膽固醇的理想數值則應控制在 200 mg/dL 以內。這些看似枯燥的數字,實則反映了體內一場血管清潔隊與垃圾山之間的攻防戰。

那麼,為何同為脂蛋白,HDL 被稱為「好」的,而 LDL 卻是「壞」的呢?這並非簡單的貼標籤。我們吃下肚或肝臟製造的脂肪,會透過血液運送到全身,這些在血液中流動的脂肪即為「血脂」,主要成分包含三酸甘油酯和膽固醇。三酸甘油酯是身體儲存能量的重要形式,而膽固醇更是細胞膜、荷爾蒙、維生素D和膽汁不可或缺的原料。

-----廣告,請繼續往下閱讀-----

這些血脂對身體運作至關重要,本身並非有害物質。然而,由於脂質是油溶性的,無法直接在血液裡自由流動。因此,在血管或淋巴管裡,脂質需要跟「載脂蛋白」這種特殊的蛋白質結合,變成可以親近水的「脂蛋白」,才能順利在全身循環運輸。

肝臟是生產這些「運輸用蛋白質」的主要工廠,製造出多種蛋白質來運載脂肪。其中,低密度脂蛋白載運大量膽固醇,將其精準送往各組織器官。這也是為什麼低密度脂蛋白膽固醇的縮寫是 LDL-C (全稱是 Low-Density Lipoprotein Cholesterol )。

當血液中 LDL-C 過高時,部分 LDL 可能會被「氧化」變質。這些變質或過量的 LDL 容易在血管壁上引發一連串發炎反應,最終形成粥狀硬化斑塊,導致血管阻塞。因此,LDL-C 被冠上「壞膽固醇」的稱號,因為它與心腦血管疾病的風險密切相關。

高密度脂蛋白(HDL) 則恰好相反。其組成近半為蛋白質,膽固醇比例較少,因此有許多「空位」可供載運。HDL-C 就像血管裡的「清道夫」,負責清除血管壁上多餘的膽固醇,並將其運回肝臟代謝處理。正因為如此,HDL-C 被視為「好膽固醇」。

-----廣告,請繼續往下閱讀-----
為何同為脂蛋白,HDL 被稱為「好」的,而 LDL 卻是「壞」的呢?這並非簡單的貼標籤。/ 圖片來源:shutterstock

過去數十年來,醫學界主流觀點認為 LDL-C 越低越好。許多降血脂藥物,如史他汀類(Statins)以及近年發展的 PCSK9 抑制劑,其主要目標皆是降低血液中的 LDL-C 濃度。

然而,科學家們在臨床上發現,儘管許多人的 LDL-C 數值控制得很好,甚至很低,卻仍舊發生中風或心肌梗塞!難道我們對膽固醇的認知,一開始就抓錯了重點?

傳統判讀失準?LDL-C 達標仍難逃心血管危機

早在 2009 年,美國心臟協會與加州大學洛杉磯分校(UCLA)進行了一項大型的回溯性研究。研究團隊分析了 2000 年至 2006 年間,全美超過 13 萬名心臟病住院患者的數據,並記錄了他們入院時的血脂數值。

結果發現,在那些沒有心血管疾病或糖尿病史的患者中,竟有高達 72.1% 的人,其入院時的 LDL-C 數值低於當時建議的 130 mg/dL「安全標準」!即使對於已有心臟病史的患者,也有半數人的 LDL-C 數值低於 100 mg/dL。

-----廣告,請繼續往下閱讀-----

這項研究明確指出,依照當時的指引標準,絕大多數首次心臟病發作的患者,其 LDL-C 數值其實都在「可接受範圍」內。這意味著,單純依賴 LDL-C 數值,並無法有效預防心臟病發作。

科學家們為此感到相當棘手。傳統僅檢測 LDL-C 總量的方式,可能就像只計算路上有多少貨車,卻沒有注意到有些貨車的「駕駛行為」其實非常危險一樣,沒辦法完全揪出真正的問題根源!因此,科學家們決定進一步深入檢視這些「駕駛」,找出誰才是真正的麻煩製造者。

LDL 家族的「頭號戰犯」:L5 型低密度脂蛋白

為了精準揪出 LDL 裡,誰才是最危險的分子,科學家們投入大量心力。他們發現,LDL 這個「壞膽固醇」家族並非均質,其成員有大小、密度之分,甚至帶有不同的電荷,如同各式型號的貨車與脾性各異的「駕駛」。

為了精準揪出 LDL 裡,誰才是最危險的分子,科學家們投入大量心力。發現 LDL 這個「壞膽固醇」家族並非均質,其成員有大小、密度之分,甚至帶有不同的電荷。/ 圖片來源:shutterstock

早在 1979 年,已有科學家提出某些帶有較強「負電性」的 LDL 分子可能與動脈粥狀硬化有關。這些帶負電的 LDL 就像特別容易「黏」在血管壁上的頑固污漬。

-----廣告,請繼續往下閱讀-----

台灣留美科學家陳珠璜教授、楊朝諭教授及其團隊在這方面取得突破性的貢獻。他們利用一種叫做「陰離子交換層析法」的精密技術,像是用一個特殊的「電荷篩子」,依照 LDL 粒子所帶負電荷的多寡,成功將 LDL 分離成 L1 到 L5 五個主要的亞群。其中 L1 帶負電荷最少,相對溫和;而 L5 則帶有最多負電荷,電負性最強,最容易在血管中暴衝的「路怒症駕駛」。

2003 年,陳教授團隊首次從心肌梗塞患者血液中,分離並確認了 L5 的存在。他們後續多年的研究進一步證實,在急性心肌梗塞或糖尿病等高風險族群的血液中,L5 的濃度會顯著升高。

L5 的蛋白質結構很不一樣,不僅天生帶有超強負電性,還可能與其他不同的蛋白質結合,或經過「醣基化」修飾,就像在自己外面額外裝上了一些醣類分子。這些特殊的結構和性質,使 L5 成為血管中的「頭號戰犯」。

當 L5 出現時,它並非僅僅路過,而是會直接「搞破壞」:首先,L5 會直接損傷內皮細胞,讓細胞凋亡,甚至讓血管壁的通透性增加,如同在血管壁上鑿洞。接著,L5 會刺激血管壁產生發炎反應。血管壁受傷、發炎後,血液中的免疫細胞便會前來「救災」。

-----廣告,請繼續往下閱讀-----

然而,這些免疫細胞在吞噬過多包括 L5 在內的壞東西後,會堆積在血管壁上,逐漸形成硬化斑塊,使血管日益狹窄,這便是我們常聽到的「動脈粥狀硬化」。若這些不穩定的斑塊破裂,可能引發急性血栓,直接堵死血管!若發生在供應心臟血液的冠狀動脈,就會造成心肌梗塞;若發生在腦部血管,則會導致腦中風。

L5:心血管風險評估新指標

現在,我們已明確指出 L5 才是 LDL 家族中真正的「破壞之王」。因此,是時候調整我們對膽固醇數值的看法了。現在,除了關注 LDL-C 的「總量」,我們更應該留意血液中 L5 佔所有 LDL 的「百分比」,即 L5%。

陳珠璜教授也將這項 L5 檢測觀念,從世界知名的德州心臟中心帶回台灣,並創辦了美商德州博藝社科技(HEART)。HEART 在台灣研發出嶄新科技,並在美國、歐盟、英國、加拿大、台灣取得專利許可,日本也正在申請中,希望能讓更多台灣民眾受惠於這項更精準的檢測服務。

一般來說,如果您的 L5% 數值小於 2%,通常代表心血管風險較低。但若 L5% 大於 5%,您就屬於高風險族群,建議進一步進行影像學檢查。特別是當 L5% 大於 8% 時,務必提高警覺,這可能預示著心血管疾病即將發作,或已在悄悄進展中。

-----廣告,請繼續往下閱讀-----

對於已有心肌梗塞或中風病史的患者,定期監測 L5% 更是評估疾病復發風險的重要指標。此外,糖尿病、高血壓、高血脂、代謝症候群,以及長期吸菸者,L5% 檢測也能提供額外且有價值的風險評估參考。

隨著醫療科技逐步邁向「精準醫療」的時代,無論是癌症還是心血管疾病的防治,都不再只是單純依賴傳統的身高、體重等指標,而是進一步透過更精密的生物標記,例如特定的蛋白質或代謝物,來更準確地捕捉疾病發生前的徵兆。

您是否曾檢測過 L5% 數值,或是對這項新興的健康指標感到好奇呢?

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

6
3

文字

分享

0
6
3
植物口渴就喊:「啵、啵、啵~」
胡中行_96
・2023/04/06 ・2954字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

久旱不雨,植物悲鳴,[1, 2]類似教育部《臺灣閩南語常用詞辭典》所謂「因飢餓而吵鬧」的「哭枵」(khàu-iau)。[3]別問為何沒聽過,也不怪天地寡情,人類無義,從來漠不關心。植物叫那種超音波,傳至咱們耳裡就只剩寧靜。幸好靠著以色列科學家幫忙,轉換到常人的聽覺範圍,並分享於 2023 年 3 月底的《細胞》(Cell)期刊,才廣為周知。[1]

轉換到人類聽力範圍的番茄「叫聲」。音/參考資料 1,Audio S1(CC BY 4.0)

傾聽植物的聲音

面臨乾旱或草食動物的威脅,植物會做出多種反應,例如:改變外貌,或是以揮發性有機化合物影響鄰居等。[1]過去的文獻指出,缺水引發空蝕現象(cavitation),使植物負責輸送水份的木質部,因氣泡形成、擴張和破裂而震動。[1, 4]現在科學家想知道,這是否也會產生在特定距離內,能被其他物種聽見的聲音。[1]

受試的對象是番茄菸草,分別拆成乾旱、修剪和對照 3 組。對照組又有常態生長的一般對照、有土卻無植物的盆器,以及每株植物實驗前的自體對照 3 種。實驗大致有幾個階段:首先,在隔音箱裡,距離每個受試對象 10 公分處,各立 2 支麥克風收音。將聲音的紀錄分類後,拿去進行機器學習。接著移駕溫室,讓訓練好的模型,分辨雜音和不同情況下植物的聲音。再來,觀察乾旱程度與植物發聲的關係。最後,也測試其他的植物和狀態。[1]

麥克風對著乾旱、修剪和對照組的植物收音。圖/參考資料 1,Graphical Abstract局部(CC BY 4.0)

植物錄音與機器學習

隔音箱裡常態生長的植物,每小時平均發聲少於一次;而沒植物的盆器當然完全無聲。相對地,遭受乾旱或修剪壓力的實驗組植物,反應則十分劇烈:[1]

-----廣告,請繼續往下閱讀-----
 平均值(單位)番茄菸草
乾旱發聲頻率(次/小時)35.4 ± 6.111.0 ± 1.4
 音量(聲壓分貝;dBSPL)61.6 ± 0.165.6 ± 0.4
 聲波頻率(千赫茲;kHz)49.6 ± 0.454.8 ± 1.1
修剪發聲頻率(次/小時)25.2 ± 3.215.2 ± 2.6
 音量(聲壓分貝;dBSPL)65.6 ± 0.263.3 ± 0.2
 聲波頻率(千赫茲;kHz)57.3 ± 0.757.8 ± 0.7

隔音箱中實驗組的錄音,被依照植物品種以及所受的待遇,歸納為 4 個組別,各組別再彼此配對比較,例如:乾旱的番茄對修剪的番茄等。以此資料訓練出來的機器學習模型,判別配對中各組別的準確率為 70%。第二階段在溫室中進行,自然較隔音箱嘈雜。科學家拿空蕩溫室的環境錄音,來教模型分辨並過濾雜訊。訓練後,令其區別乾旱與對照組番茄的聲音,結果 84% 正確。[1]既然能聽得出基本的差別,下一步就是了解水量對番茄發聲的影響。

體積含水量

為了操縱體積含水量(volumetric water content,縮寫VWC),即水份與泥土體積的比值或百分比,[1, 5]科學家狠下心,連續幾天都不給溫室裡的番茄植栽喝水。一邊觀察 VWC 的變化;一邊錄下它們的聲音。起先水份充足,番茄不太吵鬧;4、5 天下來,發聲的次數逐漸增加至高峰;然後應該是快渴死了,有氣無力,所以次數又開始減少。此外,番茄通常都在早上 8 點(圖表較像 7 點)到中午 12 點,以及下午 4 點至晚上 7 點,這兩個時段出聲。[1]科學家覺得這般作息,可能與規律的氣孔導度(stomatal conductance),也就是跟光合作用的換氣以及蒸散作用的水份蒸發,兩個透過氣孔進行的動作有關。[1, 6]

大部份的聲音都是在 VWC < 0.05 時出現;當 VWC > 0.1,水份還足夠,就幾乎無聲。科學家將比較的條件進一步分成 VWC < 0.01 與 VWC > 0.05、VWC < 0.05 跟 VWC > 0.05,以及 VWC < 0.01、VWC > 0.05 和淨空溫室的聲音。機器學習模型分辨起來,都有七、八成的準確率。[1]

縱軸為每日發聲次數;橫軸為缺乏灌溉的天數。圖/參考資料 1,Figure 3A(CC BY 4.0)
乾旱狀態下,番茄發聲的時段。縱軸為每小時發聲次數;橫軸為 24 小時制的時間。圖/參考資料 1,Figure 3B(CC BY 4.0)

植物發聲的原理

實驗觀察所得,都將植物發聲的機制,指向木質部導管中氣體的運動,也就是科學家先前預期的空蝕現象[1]下面為支持這項推論的理由:

-----廣告,請繼續往下閱讀-----
  1. 木質部導管的口徑,與植物被錄到的聲波頻率相關:寬的低;而窄的高。[1]
  2. 乾旱與修剪所造成的聲音不同:在木質部導管中,前者氣泡形成緩慢,發聲時數較長;而後者則相當迅速,時數較短。[1]
  3. 聲音是由植物的莖,向四面八方傳播。[1]
  4. 空蝕現象造成的震動,跟記錄到的超音波,部份頻率重疊;而沒有重疊的,其實已經超出其他物種的聽力以及麥克風收音的範圍。[1]
葡萄、菸草和番茄木質部導管的水平橫截面。圖/參考資料 1,Figure S4B(CC BY 4.0)
葡萄(綠色)、菸草(灰色)和番茄(橙色)的差異:縱軸為聲波頻率;橫軸是木質部導管的平均口徑。圖/參考資料 1,Figure S4A(CC BY 4.0)

問誰未發聲

觀察完番茄和菸草之後,科學家不禁好奇,別的植物是否也會為自己的處境發聲?還是它們都默默受苦,無聲地承擔?研究團隊拿小麥玉米卡本內蘇維濃葡萄(Cabernet Sauvignon grapevine)、奇隆丸仙人掌(Mammillaria spinosissima)與寶蓋草(henbit)來測試,發現它們果然有聲音。不過,像杏仁樹之類的木本植物,還有木質化的葡萄藤就沒有了。另外,科學家又監聽感染菸草嵌紋病毒(tobacco mosaic virus)的番茄,並錄到它們的病中呻吟。[1]

你敢有聽著咱的歌

之前有研究指出,海邊月見草(Oenothera drummondii)暴露於蜜蜂的聲音時,會產出較甜的花蜜。[2]若將角色對調過來:植物在乾旱、修剪或感染等壓力下釋出的超音波,頻率約在 20 至 100 kHz 之間,理論上 3 到 5 公尺內的某些哺乳動物或昆蟲,例如:蝙蝠、老鼠和飛蛾,應該聽得到。[1, 2]以色列科學家認為幼蟲會寄住在番茄或菸草上的飛蛾,或許能辨識植物的聲波,並做出某些反應。同理,人類可以用機器學習模型,分辨農作物的聲音,再給予相應的照顧。如此不僅節省水源,精準培育,還能預防氣候變遷所導致的糧食危機。[1]

  

備註

本文最後兩個子標題,借用音樂劇《Les Misérables》歌曲〈Do You Hear the People Sing?〉的粵語和臺語版曲名。[7]

-----廣告,請繼續往下閱讀-----
  1. Khait I, Lewin-Epstein O, Sharon R. (2023) ‘Sounds emitted by plants under stress are airborne and informative’. Cell, 106(7): 1328-1336.
  2. Marris E. (30 MAR 2023) ‘Stressed plants ‘cry’ — and some animals can probably hear them’. Nature.
  3. 教育部「哭枵」臺灣閩南語常用詞辭典(Accessed on 01 APR 2023)
  4. McElrone A J, Choat B, Gambetta GA, et al. (2013) ‘Water Uptake and Transport in Vascular Plants’. Nature Education Knowledge, 4(5):6.
  5. Datta S, Taghvaeian S, Stivers J. (AUG 2018) ‘Understanding Soil Water Content and Thresholds for Irrigation Management’. OSU Extension of Oklahoma State University.
  6. Murray M, Soh WK, Yiotis C, et al. (2020) ‘Consistent Relationship between Field-Measured Stomatal Conductance and Theoretical Maximum Stomatal Conductance in C3 Woody Angiosperms in Four Major Biomes’. International Journal of Plant Sciences, 181, 1.
  7. FireRock Music.(16 JUN 2019)「【問誰未發聲】歌詞 Mix全民超長版 粵+國+台+英 口琴+小童+學生+市民 Do you hear the people sing?」YouTube.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 67 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

2
1

文字

分享

0
2
1
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告,請繼續往下閱讀-----

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

-----廣告,請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

-----廣告,請繼續往下閱讀-----

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

-----廣告,請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。