0

0
1

文字

分享

0
0
1

人工智慧的「黑箱作業」,類神經網路如何將生物分類的?

MiTalk
・2019/06/08 ・4467字 ・閱讀時間約 9 分鐘 ・SR值 543 ・八年級

  • 作者/吳育瑋 臺北醫學大學醫學資訊研究所助理教授

這篇文章是我在讀到 Nature Methods 在 2018 年 3 月 5 日刊登的文章「Using deep learning to model the hierarchicalstructure and function of a cell」1後,在臉書 MiTalk 社團寫下的三篇短文的整理集結。在這三篇短文中,我簡要地介紹了目前人工智慧的技術基礎「類神經網路」的概念,再將其延伸到這篇文章提及的系統生物學研究,並解釋目前類神經網路之所以被稱為「黑盒子」的原因,以及這項系統生物學研究處理黑盒子的手法。

資訊輸入和輸出,如何用「類神經網路」做出無人車?

我們先來聊聊目前機器學習中最火紅的演算法「類神經網路」究竟是什麼東西?

動物的神經元大致上都有著可以接受來自其他神經元的訊號的樹突 (dendrite),以及可以傳送訊號給其他神經元的軸突 (axon)。類神經網路的單位神經元架構與生物的神經元類似:都有著數個可以接受其他神經元的「輸入 (Input)」,以及數個傳送訊號給其他神經元的 「輸出 (Output)」。將一大堆這樣子的神經元連結起來,就是類神經網路了。

當然,這種連結也不是亂連的。類神經網路通常會分成好幾「層」,而每一層與每一層之間的神經元都會緊密連結著 (fullyconnected),以下我用個實際的例子來說明這所謂的「層」是怎麼回事。

在 1989 年的時候,卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN 2。這台無人車的主要架構有三個:一台在車子前面隨時拍照的照相機或攝影機,一台執行類神經網路運算的電腦,以及由電腦控制的方向盤,請參考下圖:

-----廣告,請繼續往下閱讀-----
  • 第一層(最底層):照相機照出來的 30 x 32 個 pixel 的影像,以及8 x 32 個雷射距離測定器像。總共輸入單位是 30 x 32 + 8 x 32 = 1216 個。
  • 第二層(中層):由 29 個類神經網路神經元構成的隱藏層(最初期的設計只有4 個)。
  • 第三層(最上層):45 個輸出神經元,代表著方向盤要打那個角度;每個神經元代表一個角度,例如第一個神經元代表方向盤往右打 30 度,第二個代表方向盤往右打 28 度,依此類推。
卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN。圖片取自:LVINN 論文2

這麼簡單的類神經網路,就已經可以讓這台車在路上以 60 英哩的速度行駛了。可見得類神經網路機器學習的威力。

那麼類神經網路是怎麼訓練的呢?簡單地說,我們在訓練類神經網路時,必須要給它一組(通常是數量很多的一大組)已經知道正確答案的訓練樣本,讓類神經網路之間的神經元連結可以自動透過輸入訊號與正確答案的比對調整自身的參數。這樣的訓練會持續上數千或甚至數百萬次,直到正確率無法再提昇為止。比如說 ALVINN 無人車的訓練就是在真人開車時,將每張相機照出來的圖片與人類開車者的方向盤角度(也就是正確答案)進行連結,並持續調整參數直到答案錯誤率很低為止。

換句話說,ALVINN 這台無人車所做的事,就是模仿人類的開車行為。

除了無人車,「類神經網路」也能區分生物種類?

在上一段我們解釋了何謂類神經網路。一句話總結的話就是類神經網路就是連結在一起的人工神經元,而且可以透過無數次訓練盡量提高執行任務(比如說下棋或預測天氣)的準確率。在這一段中我將提到類神經網路與生物網路之間的關係

-----廣告,請繼續往下閱讀-----

類神經網路通常是由許多的「層」數以及每一層內的「神經元」數量所構成的;然而究竟需要多少層網路,或是每一層網路需要多少神經元,則沒有一定的準則。

我認為這是類神經網路最關鍵,卻也最難以決定的參數。舉例來說,先前提到過的自駕車 ALVINN 總共只有一層網路(不考慮輸入與輸出層的話),且這一層只包含 29 個神經元節點。但是現在如 Tesla 或其他品牌自駕車的類神經網路絕對比這個架構複雜許多。我們在設計類神經網路的時候,甚至需要不停地 trial-and-error 後才能決定「最佳」的網路架構,而這裡的「最佳」理所當然是由預測準確率來決定的。

那麼這和微生物或生命科學有什麼關係呢?這要先從一篇Nucleic Acids Research 論文3 講起。在這篇論文中,卡內基美隆的研究人員試圖透過類神經網路試圖研究不同的細胞(比如說胚胎分化時期的 early-2-cell、late-2-cell、8-cell、16-cell,或不同種類的細胞如 fibroblast、BMDC、以及上皮細胞等),並查看這些細胞的基因表現是否有著明顯的差異。他們的研究標的是不同研究團隊定序出來的 single-cell RNASeq 資料。

簡單來說,他們希望將許多人體內不同種類細胞的 RNASeq 資料透過類神經網路處理後,能夠過濾雜訊,留下最清楚的基因表現訊號。其最終目的當然是透過分群演算法視覺化看出每種細胞的區別

舉例來說,在論文的圖中,我們可以看到不同的人類細胞在經過類神經網路處理後,能夠有著最大化的分群效果;而且群與群之間大致上距離都相當遠,顯示出基因的表現量的確會隨著細胞的不同而不同。

-----廣告,請繼續往下閱讀-----
不同細胞的基因表現差異視覺化。圖片取自:Nucleic Acids Research 論文3

在同一項研究中,研究人員也發現如果小心地設計類神經網路架構,並將其與生物意義結合的話,將能達到最好的效果。這裡說的與生物意義結合的意思,指的是在設計的類神經網路層級中考慮到生物網路的數量以及結構。

他們首先算出這些基因表現量資料,並將資料建成 protein-protein interaction (PPI) 與 protein-DNA interaction (PDI) 的網路系統,並找出裡面總共有 348 個彼此之間有關聯的子網路;而就在找出「348」這個神奇數字後,研究人員就將類神經網路的隱藏層設計成兩層,且各有著 348 個神經元節點,分別代表這 348 組 PPI 與PDI 子網路。他們發現這樣子的類神經網路設計將能達到最理想的分群效果。

好的。到底我之所以鋪了類神經網路和生物意義這些梗要幹嘛呢?當然最主要的目的就是要說明 2018 年 Nature Methods的論文1 到底在講什麼。這篇論文雖然也是走類神經網路路線,但是他們網路的設計相當極端:完全按照生物的代謝途徑 (metabolic pathway) 來設計神經元的分佈(作者群在另一篇論文中提到他們就是受到這一篇 Nucleic AcidsResearch 的論文啟發而設計出這種奇妙的架構的)。

換句話說,這篇系統生物學的論文設計的類神經網路事實上已經不太有傳統的「隱藏層」的概念,而是完全按照代謝途徑連結人工神經元。透過這個方法,他們的類神經網路中總共包含了酵母菌的 2526 個子網路系統,分別代表不同的細胞代謝途徑。在經過訓練與比較後,這個經過特殊設計的網路結構可以準確地透過不同的基因表現預測酵母菌的細胞生長,並且預測的準確率比傳統數層緊密連結的類神經網路還要好上許多。

-----廣告,請繼續往下閱讀-----

神秘的黑盒子,「類神經網路」是怎麼運作的?

在類神經網路的世界中,常常會聽到一個說法:以類神經網路為基礎架構的人工智慧預測模型是「黑盒子  (black box)」。這裡的黑盒子當然不是飛機出事後可以撿回來分析的那個,而是無法打開無法分析而且完全不曉得裡面到底在幹嘛的系統。為什麼會有這種說法呢?一切都要從類神經網路模型是如何訓練的開始講起。

黑盒子系統就像骰骰子一樣,即使知道力學原理,我們還是無法得知骰盅內部到底發生了什麼?圖/pixabay

在類神經網路的世界中,每一個神經元可以接收來自數十甚至數百個神經元的訊號,並且可以傳送訊號給數十到數百個其他神經元。這種連接方式讓類神經網路的參數異常地多,且輕易就可以上到百萬千萬甚至億這種等級。我再次拿 ALVINN,那台 1989 年的無人車來當例子好了。

ALVINN 的輸入層有 1216 個神經元節點,中間的隱藏層有 29 個神經元,而輸出層有 45個神經元。這個相對來說架構非常簡單的類神經網路的參數就有 1216 X 29 X 45 = 1586880 個參數要考慮了,更別提其他
更複雜的深度學習類神經網路模型了。

事實上,參數數量多還在其次,真正的關鍵在於類神經網路的訓練方式。在訓練類神經網路時,我們往往會做以下兩件事:

-----廣告,請繼續往下閱讀-----
  1. 『 隨機』初始化類神經網路中的『所有』參數
  2. 隨著每個樣本的預測對錯微調所有的參數

我來用實際生活案例舉個例子好了。假設你要登一座山,目標是山頂。這座山每個地方的地型都完全不一樣。所以從 A 點上山和從不一樣的 B 點或 C 點上山的路都不盡相同。假設隨機把你放在這座山邊的某一點,要你朝著山頂為目標前進。這時候你的每一步就都會是在「那個當下」最佳的往山頂路線。所以從不同的點上山路線就有可能會差異極大,雖然最後都能到山頂就是了。

類神經網路的黑盒子,就是來自這個初始化與細微調整。因為參數太多,而且微調整的方式會隨著初始位置的不同而不同,所以一個調整好的類神經網路雖然可以達到不錯的預測成果,但是幾乎沒有人知道為什麼能夠達到這個預測效果。

  • 題外話,這個議題已經受到機器學習以及人工智慧界的重視了。許多人都在想辦法解開這個「黑盒子之謎」5, 6, 7

再舉個例子。每個人的大腦會隨著發育環境的不同而有著不同的發展軌跡,所以幾乎沒有兩個人的大腦神經連結方式是完全相同的。雖然每個人都知道蘋果可以吃,或者是被打會痛;但是發展出這個知識的「神經元連結」則有可能每個人都不一樣。

參數設定越明確,越能解開「黑箱作業」!

回到主題。在前一段落提到的:完全按照代謝途徑建構的類神經網路,和其他網路系統不同的是,它有著「解開黑盒子」的效果呢。

-----廣告,請繼續往下閱讀-----

這是因為這套「酵母菌的類神經網路預測模型」是完全按照「生物的代謝途徑」來連結的,所以雖然每個參數還是會因為類神經網路訓練過程而有所不同,但是我們可以得知某個神經元的總輸入參數值,也就是這個神經元的活化 (activation;中國翻成『激活』) 程度。只要將預測過程中每個神經元被活化的程度彼此比較,就能夠得知那個神經元扮演著最重要的角色;而這個神經元也就會是整個代謝途徑中最關鍵的基因或是調控因子。

下列 a、b 兩圖中皆可在這個類神經網路中,不同的基因活化後將會趨動不同的細胞反應,如 a 圖的 PMT1 與 IRE1 兩條基因與細胞壁的組成與強度有關,而 b 圖則可見 ERV7 與 RAD57 與DNA 的修復有著密切關聯性。

(點圖放大):按照細胞代謝途徑建構的類神經網路系統模擬測試結果。圖/參考文獻 1 ,Figure 3a 與 3d。

回到系統生物學,這套系統之所以對系統生物學的研究很有幫助的原因,在於它是一個可模擬生物在輸入各種訊號(如食物或環境刺激)後,將整個生物代謝途徑中最關鍵的基因標示出來的系統。礙於篇幅沒辦法將所有的元件講的非常清楚(比如說類神經網路本身就有一大堆參數要設定,然後訓練時也往往要扯到方程式微分模型之類的),只是很概略地將最大方向的概念用各種例子來說明。希望各位在讀完這個系列後能夠對何謂類神經網路有著最基本的認知,也能大致理解為什麼類神經網路會被詬病為「黑盒子」的原因。

參考文獻

  1. Ma et al., “Using deep learning to model the hierarchical structure and function of a cell”, Nature Methods, 15:290–298, 2018.
  2.  Pomerleau D., “ALVINN: an autonomous land vehicle in a neural network”, Advances in Neural Information Processing Systems 1, pp. 305-313, 1989.
  3. Lin et al., “Using neural networks for reducing the dimensions of single-cell RNA-Seq data”, Nucleic Acids Research, 45(17):e156, 2017.
  4. Yu et al., “Visible Machine Learning for Biomedicine”, Cell, 173(7):1562-1565, 2018.
  5. Knight W., “The Dark Secret at the Heart of AI”, MIT Technology Review,2017.
  6. Wisdom D., “Deciphering The Black Box of AI”, Medium, 2018.
  7. Castelvecchi D., “Can we open the black box of AI?”, Nature 538:20-23, 2016.

文章難易度
MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱

0

4
4

文字

分享

0
4
4
除了蚯蚓、地震魚和民間達人,那些常見的臺灣地震預測謠言
鳥苷三磷酸 (PanSci Promo)_96
・2024/02/29 ・2747字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

災害性大地震在臺灣留下無數淚水和難以抹滅的傷痕,921 大地震甚至直接奪走了 2,400 人的生命。既有這等末日級的災難記憶,又位處於板塊交界處的地震帶,「大地震!」三個字,總是能挑動臺灣人最脆弱又敏感的神經。

因此,當我們發現臺灣被各式各樣的地震傳說壟罩,像是地震魚、地震雲、蚯蚓警兆、下雨地震說,甚至民間地震預測達人,似乎也是合情合理的現象?

今日,我們就要來破解這些常見的地震預測謠言。

-----廣告,請繼續往下閱讀-----

漁民捕獲罕見的深海皇帶魚,恐有大地震?

說到在坊間訛傳的地震謠言,許多人第一個想到的,可能是盛行於日本、臺灣的「地震魚」傳說。

在亞熱帶海域中,漁民將「皇帶魚」暱稱為地震魚,由於皇帶魚身型較為扁平,生活於深海中,魚形特殊且捕獲量稀少,因此流傳著,是因為海底的地形改變,才驚擾了棲息在深海的皇帶魚,並因此游上淺水讓人們得以看見。

皇帶魚。圖/wikimedia

因此,民間盛傳,若漁民捕撈到這種極為稀罕的深海魚類,就是大型地震即將發生的警兆。

然而,日本科學家認真蒐集了目擊深海魚類的相關新聞和學術報告,他們想知道,這種看似異常的動物行為,究竟有沒有機會拿來當作災前的預警,抑或只是無稽之談?

-----廣告,請繼續往下閱讀-----

可惜的是,科學家認為,地震魚與地震並沒有明顯的關聯。當日本媒體報導捕撈深海魚的 10 天內,均沒有發生規模大於 6 的地震,規模 7 的地震前後,甚至完全沒有深海魚出現的紀錄!

所以,在科學家眼中,地震魚僅僅是一種流傳於民間的「迷信」(superstition)。

透過動物來推斷地震消息的風俗並不新穎,美國地質調查局(USGS)指出,早在西元前 373 年的古希臘,就有透過動物異常行為來猜測地震的紀錄!

人們普遍認為,比起遲鈍的人類,敏感的動物可以偵測到更多來自大自然的訊號,因此在大地震來臨前,會「舉家遷徙」逃離原本的棲息地。

-----廣告,請繼續往下閱讀-----

當臺灣 1999 年發生集集大地震前後,由於部分地區出現了大量蚯蚓,因此,臺灣也盛傳著「蚯蚓」是地震警訊的說法。

20101023 聯合報 B2 版 南投竹山竄出蚯蚓群爬滿路上。

新聞年年報的「蚯蚓」上街,真的是地震警訊嗎?

​當街道上出現一大群蚯蚓時,密密麻麻的畫面,不只讓人嚇一跳,也往往讓人感到困惑:為何牠們接連地湧向地表?難道,這真的是動物們在向我們預警天災嗎?動物們看似不尋常的行為,總是能引發人們的好奇與不安情緒。

如此怵目驚心的畫面,也經常成為新聞界的熱門素材,每年幾乎都會看到類似的標題:「蚯蚓大軍又出沒 網友憂:要地震了嗎」,甚至直接將蚯蚓與剛發生的地震連結起來,發布成快訊「昨突竄大量蚯蚓!台東今早地牛翻身…最大震度4級」,讓人留下蚯蚓預言成功的錯覺。

然而,這些蚯蚓大軍,真的與即將來臨的天災有直接關聯嗎?

-----廣告,請繼續往下閱讀-----

蚯蚓與地震有關的傳聞,被學者認為起源於 1999 年的 921 大地震後,在此前,臺灣少有流傳地震與蚯蚓之間的相關報導。

雖然曾有日本學者研究模擬出,與地震相關的電流有機會刺激蚯蚓離開洞穴,但在現實環境中,有太多因素都會影響蚯蚓的行為了,而造成蚯蚓大軍浮現地表的原因,往往都是氣象因素,像是溫度、濕度、日照時間、氣壓等等,都可能促使蚯蚓爬出地表。

大家不妨觀察看看,白日蚯蚓大軍的新聞,比較常出現在天氣剛轉涼的秋季。

因此,下次若再看到蚯蚓大軍湧現地表的現象,請先別慌張呀!

-----廣告,請繼續往下閱讀-----

事實上,除了地震魚和蚯蚓外,鳥類、老鼠、黃鼠狼、蛇、蜈蚣、昆蟲、貓咪到我們最熟悉的小狗,都曾經被流傳為地震預測的動物專家。

但可惜的是,會影響動物行為的因素實在是太多了,科學家仍然沒有找到動物異常行為和地震之間的關聯或機制。

遍地開花的地震預測粉專和社團

這座每天發生超過 100 次地震的小島上,擁有破萬成員的地震討論臉書社團、隨處可見的地震預測粉專或 IG 帳號,似乎並不奇怪。

國內有許多「憂國憂民」的神通大師,這些號稱能夠預測地震的奇妙人士,有些人會用身體感應,有人熱愛分析雲層畫面,有的人甚至號稱自行建製科學儀器,購買到比氣象署更精密的機械,偵測到更準確的地震。

-----廣告,請繼續往下閱讀-----

然而,若認真想一想就會發現,臺灣地震頻率極高,約 2 天多就會發生 1 次規模 4.0 至 5.0 的地震, 2 星期多就可能出現一次規模 5.0 至 6.0 的地震,若是有心想要捏造地震預言,真的不難。 

在學界,一個真正的地震預測必須包含地震三要素:明確的時間、 地點和規模,預測結果也必須來自學界認可的觀測資料。然而這些坊間貼文的預測資訊不僅空泛,也並未交代統計數據或訊號來源。

作為閱聽者,看到如此毫無科學根據的預測言論,請先冷靜下來,不要留言也不要分享,不妨先上網搜尋相關資料和事實查核。切勿輕信,更不要隨意散播,以免造成社會大眾的不安。

此外,大家也千萬不要隨意發表地震預測、觀測的資訊,若號稱有科學根據或使用相關資料,不僅違反氣象法,也有違反社會秩序之相關法令之虞唷!

-----廣告,請繼續往下閱讀-----

​地震預測行不行?還差得遠呢!

由於地底的環境太過複雜未知,即使科學家們已經致力於研究地震前兆和地震之間的關聯,目前地球科學界,仍然無法發展出成熟的地震預測技術。

與其奢望能提前 3 天知道地震的預告,不如日常就做好各種地震災害的防範,購買符合防震規範的家宅、固定好家具,做好防震防災演練。在國家級警報響起來時,熟練地執行避震保命三步驟「趴下、掩護、穩住」,才是身為臺灣人最關鍵的保命之策。

延伸閱讀

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
196 篇文章 ・ 302 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
0

文字

分享

0
0
0
備審卡關、筆記好難整理?國高中生必學,一個 prompt 讓 AI 幫你做科系探索!
泛科學院_96
・2024/04/13 ・450字 ・閱讀時間少於 1 分鐘

這集來分享學生必學的 AI 工具與操作!

本來是想做寫作業的 AI prompt,但肯定會被罵翻……因此這次聚焦在如何用 AI 協助整理筆記、職涯探索、製作歷程檔案等事情上。

廢話不多說,讓我們開始吧 !

最後,附上本支影片的學習懶人包:

如果你有更多想要學習的操作技巧,歡迎在下面留言跟我們敲碗~有其他想要看的 AI 測試或相關問題,也可以留言分享喔!

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
28 篇文章 ・ 37 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

0
1

文字

分享

0
0
1
Canva 不只可以做圖,還可以做影片啦!更強大的 Magic Studio 幫你從修圖到剪片全搞定!
泛科學院_96
・2024/04/04 ・555字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

別再用非常好色跟 Word 的文字藝術師了!

去年初 Canva 推出了 Magic Design 魔術設計師,可以讓你一鍵圖片上傳、自動完成行銷圖片與海報。現在魔術系列正式成為了一個完整的「魔術工作室 Magic Studio」。

Magic Studio 已經成為我快速製作影片的首選,對,你沒有聽錯,用 Canva 做圖已經過時了,現在是 Canva 做影片的時代啦!

今天就用這支影片,快速帶你學會 Canva 的新 AI 功能吧~

-----廣告,請繼續往下閱讀-----

Canva 除了以上的 AI 功能之外,其實還支援更多更多相關的應用。你可以在應用程式選單裡面看到採用 AI 技術的分類裡面有上百種整合第三方的 AI 工具套件,比如知名的人臉 AI 圖片生成說話影片平台 D-ID 或 HeyGen,或者各種圖片編輯套件如 Catoonify 把圖片變成插畫、Colorize 把老照片重新上色等等,應有盡有。如果你有測試到什麼喜歡的套件,歡迎在影片下方留言,或者加入泛科學院的官方 Discord 社群與大家交流分享,我們不見不散。

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
28 篇文章 ・ 37 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!