0

0
0

文字

分享

0
0
0

團藻:水田裡的夏日花火

MiTalk
・2018/06/13 ・2204字 ・閱讀時間約 4 分鐘 ・SR值 549 ・八年級

江殷儒
中央研究院生物多樣性研究中心 副研究員​
​台灣微生物歲時記

 

直到現在,我依然享受騎乘機車的自在隨意。

初夏時節,騎機車自南港舊庄進入遍植包種茶的淺山地帶後,轉汐碇路可到達石碇。沿途林蔭鬱鬱,山澗處處,令人暑氣全消。沿著靜安路蜿蜒而行,隨著滿山遍野的天燈殘骸漸增,即達平溪十分一帶。進入雙溪後,群山猛然往兩側退去,道路豁然開朗,筆直地進入貢寮。繼續向東行進,嗅聞到海風氣味後,即可到達農田連綿廣衍的田寮洋。

位於新北市東北一隅的生態樂園-貢寮田寮洋。此處的水田在初夏可以找到團藻。記得隨身帶上封口袋與放大鏡。圖/江殷儒提供。

田寮洋面積約200公頃,是雙溪河下游的洪氾平原。雙溪河在此處形成大曲流,可供洪水宣洩。因此,田寮洋具有調節雙溪河水位的功能。

田寮洋以稻田、筊白筍田為構成主體。經由水田耕作的持續干擾,田寮洋得以遠離陸化的命運,長期維持濕地的型態。周遭環繞低矮的丘陵,加上如馬賽克鑲嵌般的水塘與草澤,讓棲地多樣化的田寮洋成為台北盆地重要的生物庇護所,成為許多留鳥的寶貴棲所,亦是候鳥南北遷徙的補給站。跟著水鳥遷徙傳佈的,除了令人聞之色變的禽流感,還有各式各樣的微藻類,肉眼可見、姿態嬌媚的團藻。

-----廣告,請繼續往下閱讀-----
漂浮著的滿江紅的水田或小埤塘,常常可以發現團藻的蹤跡。圖/江殷儒提供。

如果藻類也可以成為神奇寶貝的話,團藻絕對是最值得收服的對象之一。

團藻性喜棲息於富含有機質的靜水域,如淺塘與雨後的暫時性水窪。初夏的田寮洋,在棲息著少量滿江紅的水田裡,很容易發現團藻的蹤跡,甚至會形成極度優勢的藻類純群。團藻與滿江紅要求相似的水質條件;然而,佈滿滿江紅的水田,由於光照缺乏,又會抑制團藻的生長。另一方面,團藻對農藥敏感。因此,棲息著團藻的水田,通常是禁絕或低度用藥的友善耕作水田。

日本東京大學生物科學系野崎久義教授的研究團隊在2016年6月於貢寮田寮洋使用浮游網採集團藻。圖/江殷儒提供。

團藻的藻體是直徑1~5毫米的中空球形群體,是少數肉眼可見的微藻。在野外可以利用透明封口袋採集水田的水樣,於陽光下利用放大鏡貼近封口袋,即可觀察到一顆顆的團藻。也因為極易觀察,顯微鏡之父─荷蘭微生物學家雷文霍克在十八世紀初期即描述過團藻。

分類上團藻屬於綠藻門,這類的藻類由於富含葉綠素 a 和 b,外觀呈現亮綠色。作為最原始的多細胞生物之一,團藻由數百至數萬個單細胞在球體表面排列組成,鑲嵌於由醣蛋白組成的膠質結構。同時,單細胞具有朝外的兩條游動鞭毛及感光用的眼點。

-----廣告,請繼續往下閱讀-----
以光學顯微鏡觀察採集自田寮洋的團藻(Volvox carteri f. nagariensis)之無性球體。G: 無性生殖細胞 (gonidia)。圖片擷取自日本東京大學生物科學系野崎久義教授與中研院生物多樣性研究中心副研究員江殷儒博士合作,甫被接受的論文(1) (江殷儒提供)。

團藻(Volvox spp.)的拉丁字義為「滾動」,顧名思義,放大鏡下的團藻會以優雅的姿態,緩緩地向光照處滾動(影片如下)。這需要令人驚異的協調性。因此,看各自獨立的單細胞,彼此需透過相連的原生質聯絡絲進行緊密的溝通協調。

https://www.youtube.com/watch?time_continue=11&v=nzO-ZSsqc9U

在演化研究上,團藻是相當重要的研究材料。因為團藻可能是單細胞真核生物過渡到多細胞生物的早期生命形式,也是有性生殖發生的起源。日本東京大學生物科學系的野崎久義教授在團藻演化上就有傑出的研究貢獻。

但如果你嘗試連續地培養團藻,難度其實很高,就像企圖強留夏日花火;最後你會在秋天前的某一日發現團藻的藻體萎縮崩潰。

-----廣告,請繼續往下閱讀-----
團藻的生活史。本圖修改自 Nishii 與 Miller 論文之圖二(2)。

藻類往往具有非常複雜的生活史,團藻就是如此。我們肉眼見到的球形群體,其實只是其生活史的一個片段。

在合適的水質條件下,團藻傾向進行無性生殖。群體內少數體型較大的生殖細胞會持續分裂,進而發展成子群體,隨後掉入空腔內。當母群體老化破裂後,子群體們即會釋出到環境中。溫度的劇烈變動及乾燥等理化條件,會促成團藻細胞產生費洛蒙,誘導團藻進入有性生殖,結果便是產生厚壁的休眠孢子,隨後沉入田土中,等待另一個夏天。

這樣的生活史,與水稻田的季節作息相呼應,彷彿團藻是上帝擔憂水稻太過孤單而創造的玩伴。當你漫步於夏日的田寮洋,除了利用望遠鏡觀察遠處的水鳥,不妨彎下腰,拿起放大鏡,仔細觀察田水中的寂靜角落,或許你也能發現那美麗炫目的團藻。

參考文獻

-----廣告,請繼續往下閱讀-----
  1. Nozaki H, Ueki N, Takusagawa M, Yamashita S, Misumi O, Matsuzaki R, Kawachi M, Chiang YR, Wu JT. Morphology, taxonomy and mating-type loci in natural populations of Volvox carteri in Taiwan. Bot Stud. 2018 Apr 3;59(1):10.
  2. Nishii I, Miller SM. Volvox: simple steps to developmental complexity? Curr Opin Plant Biol. 2010 Dec;13(6):646-53.

本文轉載自MiTalkzine,原文《初夏田寮洋的團藻

歡迎訂閱 微雜誌MiTalkzine,加入 MiTalker 的行列,一起來認識這個星球上千萬種各式各樣的微生物吧!

訂閱連結:https://goo.gl/Qo59iG





文章難易度
MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

0
1

文字

分享

0
0
1
人工智慧的「黑箱作業」,類神經網路如何將生物分類的?
MiTalk
・2019/06/08 ・4467字 ・閱讀時間約 9 分鐘 ・SR值 543 ・八年級

  • 作者/吳育瑋 臺北醫學大學醫學資訊研究所助理教授

這篇文章是我在讀到 Nature Methods 在 2018 年 3 月 5 日刊登的文章「Using deep learning to model the hierarchicalstructure and function of a cell」1後,在臉書 MiTalk 社團寫下的三篇短文的整理集結。在這三篇短文中,我簡要地介紹了目前人工智慧的技術基礎「類神經網路」的概念,再將其延伸到這篇文章提及的系統生物學研究,並解釋目前類神經網路之所以被稱為「黑盒子」的原因,以及這項系統生物學研究處理黑盒子的手法。

資訊輸入和輸出,如何用「類神經網路」做出無人車?

我們先來聊聊目前機器學習中最火紅的演算法「類神經網路」究竟是什麼東西?

動物的神經元大致上都有著可以接受來自其他神經元的訊號的樹突 (dendrite),以及可以傳送訊號給其他神經元的軸突 (axon)。類神經網路的單位神經元架構與生物的神經元類似:都有著數個可以接受其他神經元的「輸入 (Input)」,以及數個傳送訊號給其他神經元的 「輸出 (Output)」。將一大堆這樣子的神經元連結起來,就是類神經網路了。

當然,這種連結也不是亂連的。類神經網路通常會分成好幾「層」,而每一層與每一層之間的神經元都會緊密連結著 (fullyconnected),以下我用個實際的例子來說明這所謂的「層」是怎麼回事。

在 1989 年的時候,卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN 2。這台無人車的主要架構有三個:一台在車子前面隨時拍照的照相機或攝影機,一台執行類神經網路運算的電腦,以及由電腦控制的方向盤,請參考下圖:

-----廣告,請繼續往下閱讀-----
  • 第一層(最底層):照相機照出來的 30 x 32 個 pixel 的影像,以及8 x 32 個雷射距離測定器像。總共輸入單位是 30 x 32 + 8 x 32 = 1216 個。
  • 第二層(中層):由 29 個類神經網路神經元構成的隱藏層(最初期的設計只有4 個)。
  • 第三層(最上層):45 個輸出神經元,代表著方向盤要打那個角度;每個神經元代表一個角度,例如第一個神經元代表方向盤往右打 30 度,第二個代表方向盤往右打 28 度,依此類推。

卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN。圖片取自:LVINN 論文2

這麼簡單的類神經網路,就已經可以讓這台車在路上以 60 英哩的速度行駛了。可見得類神經網路機器學習的威力。

那麼類神經網路是怎麼訓練的呢?簡單地說,我們在訓練類神經網路時,必須要給它一組(通常是數量很多的一大組)已經知道正確答案的訓練樣本,讓類神經網路之間的神經元連結可以自動透過輸入訊號與正確答案的比對調整自身的參數。這樣的訓練會持續上數千或甚至數百萬次,直到正確率無法再提昇為止。比如說 ALVINN 無人車的訓練就是在真人開車時,將每張相機照出來的圖片與人類開車者的方向盤角度(也就是正確答案)進行連結,並持續調整參數直到答案錯誤率很低為止。

換句話說,ALVINN 這台無人車所做的事,就是模仿人類的開車行為。

-----廣告,請繼續往下閱讀-----

除了無人車,「類神經網路」也能區分生物種類?

在上一段我們解釋了何謂類神經網路。一句話總結的話就是類神經網路就是連結在一起的人工神經元,而且可以透過無數次訓練盡量提高執行任務(比如說下棋或預測天氣)的準確率。在這一段中我將提到類神經網路與生物網路之間的關係

類神經網路通常是由許多的「層」數以及每一層內的「神經元」數量所構成的;然而究竟需要多少層網路,或是每一層網路需要多少神經元,則沒有一定的準則。

我認為這是類神經網路最關鍵,卻也最難以決定的參數。舉例來說,先前提到過的自駕車 ALVINN 總共只有一層網路(不考慮輸入與輸出層的話),且這一層只包含 29 個神經元節點。但是現在如 Tesla 或其他品牌自駕車的類神經網路絕對比這個架構複雜許多。我們在設計類神經網路的時候,甚至需要不停地 trial-and-error 後才能決定「最佳」的網路架構,而這裡的「最佳」理所當然是由預測準確率來決定的。

那麼這和微生物或生命科學有什麼關係呢?這要先從一篇Nucleic Acids Research 論文3 講起。在這篇論文中,卡內基美隆的研究人員試圖透過類神經網路試圖研究不同的細胞(比如說胚胎分化時期的 early-2-cell、late-2-cell、8-cell、16-cell,或不同種類的細胞如 fibroblast、BMDC、以及上皮細胞等),並查看這些細胞的基因表現是否有著明顯的差異。他們的研究標的是不同研究團隊定序出來的 single-cell RNASeq 資料。

簡單來說,他們希望將許多人體內不同種類細胞的 RNASeq 資料透過類神經網路處理後,能夠過濾雜訊,留下最清楚的基因表現訊號。其最終目的當然是透過分群演算法視覺化看出每種細胞的區別

-----廣告,請繼續往下閱讀-----

舉例來說,在論文的圖中,我們可以看到不同的人類細胞在經過類神經網路處理後,能夠有著最大化的分群效果;而且群與群之間大致上距離都相當遠,顯示出基因的表現量的確會隨著細胞的不同而不同。

不同細胞的基因表現差異視覺化。圖片取自:Nucleic Acids Research 論文3

在同一項研究中,研究人員也發現如果小心地設計類神經網路架構,並將其與生物意義結合的話,將能達到最好的效果。這裡說的與生物意義結合的意思,指的是在設計的類神經網路層級中考慮到生物網路的數量以及結構。

他們首先算出這些基因表現量資料,並將資料建成 protein-protein interaction (PPI) 與 protein-DNA interaction (PDI) 的網路系統,並找出裡面總共有 348 個彼此之間有關聯的子網路;而就在找出「348」這個神奇數字後,研究人員就將類神經網路的隱藏層設計成兩層,且各有著 348 個神經元節點,分別代表這 348 組 PPI 與PDI 子網路。他們發現這樣子的類神經網路設計將能達到最理想的分群效果。

-----廣告,請繼續往下閱讀-----

好的。到底我之所以鋪了類神經網路和生物意義這些梗要幹嘛呢?當然最主要的目的就是要說明 2018 年 Nature Methods的論文1 到底在講什麼。這篇論文雖然也是走類神經網路路線,但是他們網路的設計相當極端:完全按照生物的代謝途徑 (metabolic pathway) 來設計神經元的分佈(作者群在另一篇論文中提到他們就是受到這一篇 Nucleic AcidsResearch 的論文啟發而設計出這種奇妙的架構的)。

換句話說,這篇系統生物學的論文設計的類神經網路事實上已經不太有傳統的「隱藏層」的概念,而是完全按照代謝途徑連結人工神經元。透過這個方法,他們的類神經網路中總共包含了酵母菌的 2526 個子網路系統,分別代表不同的細胞代謝途徑。在經過訓練與比較後,這個經過特殊設計的網路結構可以準確地透過不同的基因表現預測酵母菌的細胞生長,並且預測的準確率比傳統數層緊密連結的類神經網路還要好上許多。

神秘的黑盒子,「類神經網路」是怎麼運作的?

在類神經網路的世界中,常常會聽到一個說法:以類神經網路為基礎架構的人工智慧預測模型是「黑盒子  (black box)」。這裡的黑盒子當然不是飛機出事後可以撿回來分析的那個,而是無法打開無法分析而且完全不曉得裡面到底在幹嘛的系統。為什麼會有這種說法呢?一切都要從類神經網路模型是如何訓練的開始講起。

黑盒子系統就像骰骰子一樣,即使知道力學原理,我們還是無法得知骰盅內部到底發生了什麼?圖/pixabay

-----廣告,請繼續往下閱讀-----

在類神經網路的世界中,每一個神經元可以接收來自數十甚至數百個神經元的訊號,並且可以傳送訊號給數十到數百個其他神經元。這種連接方式讓類神經網路的參數異常地多,且輕易就可以上到百萬千萬甚至億這種等級。我再次拿 ALVINN,那台 1989 年的無人車來當例子好了。

ALVINN 的輸入層有 1216 個神經元節點,中間的隱藏層有 29 個神經元,而輸出層有 45個神經元。這個相對來說架構非常簡單的類神經網路的參數就有 1216 X 29 X 45 = 1586880 個參數要考慮了,更別提其他
更複雜的深度學習類神經網路模型了。

事實上,參數數量多還在其次,真正的關鍵在於類神經網路的訓練方式。在訓練類神經網路時,我們往往會做以下兩件事:

  1. 『 隨機』初始化類神經網路中的『所有』參數
  2. 隨著每個樣本的預測對錯微調所有的參數

我來用實際生活案例舉個例子好了。假設你要登一座山,目標是山頂。這座山每個地方的地型都完全不一樣。所以從 A 點上山和從不一樣的 B 點或 C 點上山的路都不盡相同。假設隨機把你放在這座山邊的某一點,要你朝著山頂為目標前進。這時候你的每一步就都會是在「那個當下」最佳的往山頂路線。所以從不同的點上山路線就有可能會差異極大,雖然最後都能到山頂就是了。

-----廣告,請繼續往下閱讀-----

類神經網路的黑盒子,就是來自這個初始化與細微調整。因為參數太多,而且微調整的方式會隨著初始位置的不同而不同,所以一個調整好的類神經網路雖然可以達到不錯的預測成果,但是幾乎沒有人知道為什麼能夠達到這個預測效果。

  • 題外話,這個議題已經受到機器學習以及人工智慧界的重視了。許多人都在想辦法解開這個「黑盒子之謎」5, 6, 7

再舉個例子。每個人的大腦會隨著發育環境的不同而有著不同的發展軌跡,所以幾乎沒有兩個人的大腦神經連結方式是完全相同的。雖然每個人都知道蘋果可以吃,或者是被打會痛;但是發展出這個知識的「神經元連結」則有可能每個人都不一樣。

參數設定越明確,越能解開「黑箱作業」!

回到主題。在前一段落提到的:完全按照代謝途徑建構的類神經網路,和其他網路系統不同的是,它有著「解開黑盒子」的效果呢。

這是因為這套「酵母菌的類神經網路預測模型」是完全按照「生物的代謝途徑」來連結的,所以雖然每個參數還是會因為類神經網路訓練過程而有所不同,但是我們可以得知某個神經元的總輸入參數值,也就是這個神經元的活化 (activation;中國翻成『激活』) 程度。只要將預測過程中每個神經元被活化的程度彼此比較,就能夠得知那個神經元扮演著最重要的角色;而這個神經元也就會是整個代謝途徑中最關鍵的基因或是調控因子。

-----廣告,請繼續往下閱讀-----

下列 a、b 兩圖中皆可在這個類神經網路中,不同的基因活化後將會趨動不同的細胞反應,如 a 圖的 PMT1 與 IRE1 兩條基因與細胞壁的組成與強度有關,而 b 圖則可見 ERV7 與 RAD57 與DNA 的修復有著密切關聯性。

(點圖放大):按照細胞代謝途徑建構的類神經網路系統模擬測試結果。圖/參考文獻 1 ,Figure 3a 與 3d。

回到系統生物學,這套系統之所以對系統生物學的研究很有幫助的原因,在於它是一個可模擬生物在輸入各種訊號(如食物或環境刺激)後,將整個生物代謝途徑中最關鍵的基因標示出來的系統。礙於篇幅沒辦法將所有的元件講的非常清楚(比如說類神經網路本身就有一大堆參數要設定,然後訓練時也往往要扯到方程式微分模型之類的),只是很概略地將最大方向的概念用各種例子來說明。希望各位在讀完這個系列後能夠對何謂類神經網路有著最基本的認知,也能大致理解為什麼類神經網路會被詬病為「黑盒子」的原因。

參考文獻

  1. Ma et al., “Using deep learning to model the hierarchical structure and function of a cell”, Nature Methods, 15:290–298, 2018.
  2.  Pomerleau D., “ALVINN: an autonomous land vehicle in a neural network”, Advances in Neural Information Processing Systems 1, pp. 305-313, 1989.
  3. Lin et al., “Using neural networks for reducing the dimensions of single-cell RNA-Seq data”, Nucleic Acids Research, 45(17):e156, 2017.
  4. Yu et al., “Visible Machine Learning for Biomedicine”, Cell, 173(7):1562-1565, 2018.
  5. Knight W., “The Dark Secret at the Heart of AI”, MIT Technology Review,2017.
  6. Wisdom D., “Deciphering The Black Box of AI”, Medium, 2018.
  7. Castelvecchi D., “Can we open the black box of AI?”, Nature 538:20-23, 2016.

MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱

0

0
2

文字

分享

0
0
2
別小看無腦水螅,牠可以用神經系統和細菌溝通呢!
MiTalk
・2019/05/24 ・2726字 ・閱讀時間約 5 分鐘 ・SR值 544 ・八年級

  • 許嘉合/中央研究院/生物多樣性研究中心/博士後研究員

由目前的證據推測,科學家們認為這可能是因為神經系統在演化上出現的時間比後天免疫系統還早,在後天免疫系統還沒發展出來的年代,神經系統在動物演化的長河中就扮演了與細菌房客交流的重要的角色!

「靠!絞痛又開始了,而且一陣比一陣還痛!」心裡忍不住的罵了髒話後,我還是認命的吞下ㄧ顆止痛藥。對許多受原發性經痛困擾的女性朋友來說,止痛藥才是我們的好朋友。真不知道痛覺神經演化出來折磨人幹麻?其實,這一切的始作俑者就讓我們怪罪給水螅與它的祖先!

水螅 (hydra) 生活在淡水中[註1], 屬於刺絲胞動物門 (Cnidaria)、水螅蟲綱 (Hydrozoa)。同樣隸屬於刺絲胞動物門的還有水母、海葵、珊瑚。它們擁有簡單的散漫神經系[註2],是第一群具有神經系統的動物。其中水螅因為構造簡單,培養、繁殖容易的特性,最適合拿來當模式物種來研究神經傳導。

水螅照片與形態。形態圖改繪自 GeoChembio.com , 照片/visualhunt

  • [註1]:水螅構造簡單,呈輻射對稱:觸手環繞在口部周圍用以捕食;基盤用來附著或移動。雌雄同體,有精巢和卵巢可行有性生殖,但通常行無性的出芽生殖。常見的種類有綠水螅與褐水螅。

水螅散漫神經系統示意圖。圖片改繪自 Murillo-Rincon et al . 2017 圖 1c 及Reese et al . 圖 49-2a。

-----廣告,請繼續往下閱讀-----
  • [註2]:水螅擁有最簡單的散漫神經系統,神經系統缺乏統整訊息的中樞,具有兩種不同的神經細胞,包括感覺細胞 (sensorycells) 與多極神經元 (ganglionneurons)。水螅上皮細胞表層的黏膜主要成分為醣蛋白複合物,適合細菌居住。

神經系統的功能與定義一直都被認為是清晰無疑的:它可以接收環境中的物理、化學訊息,讓生物能感知、並能對這些訊息有所反應或行動。然而近年來科學家發現神經系統在演化初期可能具有不同功能,可能被用來與周遭環境中的微生物溝通,還能控制微生物菌相的組成。疑!這聽起來是不是很像後天免疫系統的工作內容?由目前的證據推測,科學家們認為這可能是因為神經系統在演化上出現的時間比後天免疫系統還早,在後天免疫系統還沒發展出來的年代,神經系統在動物演化的長河中就扮演了與細菌房客交流的重要的角色!

不會說話的水螅房東,如何和他的細菌房客溝通?

然而,水螅到底是怎麼利用神經系統來跟它們的細菌房客溝通的呢?在水螅 Hydra magnipapillata 的上皮細胞 (epithelialcell) 表面,有群細菌定居在那。裡面數量最多(佔了 75% 以上)的成員是 β- 變形菌綱(β-Proteobacteria)的成員,尤其是曲桿菌屬 (Curvibacter) 的菌種。第二多和第三多的居民則是 γ- 變形菌綱 (γ-Proteobacteria) 和擬桿菌門 (Bacteroidetes) 的菌種。

細菌房客的種類組成會受水螅房東的種類和健康狀況影響,並且會受水螅上皮細胞分泌的抗微生物胜肽 (antimicrobialpeptides) 抑制。然而,抗微生物胜肽的生成又會受到神經系統的抑制(圖3,a)。因此,科學家在缺乏神經系統的水螅突變個體上,發現過量的抗微生物胜肽導致上皮細胞原有的 β- 變形菌綱菌種大量減少到只剩下原本的一成。但是原來的第三名擬桿菌門菌種的數量則增加了十倍。所以雖然社區裡面的總菌口數還是維持不變,但組成卻大大的改變了。

水螅神經訊息傳遞與抑制途徑示意圖。a. 神經細胞會抑制上皮細胞分泌抗微生物肽,減弱抗微生物肽抑制細菌生長的功效。b.水螅觸手部分的神經細胞會合成神經胜肽 NDA-1,傳送至上皮細胞表面的黏液層中,抑制曲桿菌生長。圖/許嘉合繪製

-----廣告,請繼續往下閱讀-----

除此之外, 神經細胞還會分泌另一種叫做 NDA-1 神經胜肽 (cationic neuropeptie), 去控制主要細菌居民曲桿菌 (Curvibacter) 在自己身體上的分佈位置!這種神經胜肽 NDA-1 在水螅的觸手細胞製造得比較多,合成後會被傳送至上皮細胞表面的黏液層中,用來抑制曲桿菌生長(圖3,b)。這也是為什麼曲桿菌主要出現在水螅的軀幹而非觸手上的原因。這個結果證實水螅能用神經系統控制細菌社區的成員組成與分布位置。

垃圾吃垃圾大?長細菌的水螅好壯壯?

但是,如果你以為細菌只能單方面受制於水螅,那就錯了!細菌與水螅的溝通是雙向的。雖然目前還沒有直接的證據,可是當研究人員用抗生素去除掉水螅身上的細菌後,發現如果水螅身上沒有細菌的話,身體收縮的頻率會不正常升高。另外在水螅胚胎發育的過程中,如果和有正常菌陪伴成長的水螅胚胎相比,無菌的水螅胚胎在發育時更容易發生嚴重的真菌感染。所以,好房客細菌可以保庇你健康長大!而為了要讓好房客細菌乖乖的、不離家出走、不失控,神經系統可是擔負著重要的使命呢!

整合目前在水螅的研究結果,科學家推測神經系統不但可以偵測環境中的細菌、辨認出其中的特定菌種,還可以依據細菌房客組成的不同,來調節體內的生理代謝狀況或控制、篩選體表菌相的組成。當有房客搗亂時,它們還可以引發上皮細胞的先天免疫反應,來維持秩序。

當研究回到人身上,有腦的我們也能和細菌溝通嗎?

藉由研究模範房東水螅與細菌房客的對話,我們才有機會進一步瞭解神經、免疫系統與共棲微生物的交互作用。例如水螅上的共棲菌如何影響神經系統的放電,以及如何影響水螅的行為。這樣的研究對應到人類,就和最近很夯的:腸腦軸線 (gut-brain axis) 有關。所謂的「腦腸軸線」,是指腸與腦兩個器官間有神經網路讓彼此,連結溝通。近年來科學家發現,藉由這條專線,腸內的菌群可以影響大腦的發育、功能與內分泌系統;而大腦也利用這條熱線控制腸胃道內的內分泌與免疫反應,進而影響了腸道內的菌群組成。

-----廣告,請繼續往下閱讀-----

所以當你緊張時可能會拉肚子或引起腸躁症;而當你飲食不正常造成腸內菌相失衡時,也可能引起過敏反應或增加焦慮、憂鬱行為。廣義來說,腦腸軸線其實包含了腸道菌群、神經系統、內分泌系統與免疫系統。其研究範疇更可以橫跨微生物學、生理學與神經心理學,在高等生物上所牽涉到的反應非常的錯綜複雜。因此,或許藉由研究小巧簡單的神經模式物種-水螅,能夠幫助我們釐清一些蛛絲馬跡,找到新的答案。

在了解了神經系統的重要性與在演化中所扮演的角色後,我比較能體諒神經系統這一路走來所負擔的工作既複雜又辛苦。我想下次經痛時,我我我….. 髒話會少罵一點的!

參考資料

  1. Augustin R, Schröder K, Murillo Rincón AP, Fraune S, Anton-Erxleben F, Herbst E-M et al. (2017). A secreted antibacterial neuropeptideshapes the microbiome of Hydra. Nature Communications 8: 698.
  2. Bosch TCG, Miller DJ (2016). The hydra holobiont: a tale of several symbiotic lineages. In: Bosch TCG, Miller DJ (eds). The Holobiont Imperative: Perspectives from Early Emerging Animals. Springer Vienna: Vienna. pp 79-97.
  3. Murillo-Rincon AP, Klimovich A, Pemoller E, Taubenheim J, Mortzfeld B, Augustin R et al. (2017). Spontaneous body contractions are modulated by the microbiome of Hydra. Sci Rep 7: 15937.
  4. Reece JB, Urry LA, Cain ML, Wasserman SA, Minorsky PV, Jackson RB (2010). Campbell Biology, 9th edition. Pearson Education.
  5. Foster JA, McVey Neufeld KA (2013). Gut–brain axis: how the microbiome influences anxiety and depression. Trends Neurosci 36: 305-
    312.

本文轉載自MiTalkzine,原文《神經散漫的水螅與細菌小房客的對話

歡迎訂閱微雜誌MiTalkzine,加入 MiTalker 的行列,一起來認識這個星球上千萬種各式各樣的微生物吧!

-----廣告,請繼續往下閱讀-----

訂閱連結:https://goo.gl/Qo59iG

MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱