0

1
1

文字

分享

0
1
1

翡翠水庫為什麼綠綠der?何不問問生活在此的葡萄藻

MiTalk
・2019/03/06 ・2240字 ・閱讀時間約 4 分鐘 ・SR值 566 ・九年級

江殷儒
中央研究院生物多樣性研究中心 副研究員​
​台灣微生物歲時記

 

蓄水、防洪還能發電,萬用的翡翠水庫

住在臺北都會區的小確幸之一,就是品質優良的自來水。相信待過台灣西部其他城市的朋友們,都會心懷感激地用力點頭。首都台北的都市傳說之一,就是以為臺北自來水的主要水源來自翡翠水庫。

事實上,我們使用的自來水主要來源是南勢溪(佔 75% 左右)。翡翠水庫作為備用水源,調蓄供應公共用水。此外,翡翠水庫亦有發電及防洪等功能。翡翠水庫位於新店溪支流北勢溪之上,是型態極為狹長的水庫,上游起始於坪林附近,範圍涵蓋新北市的新店區、石碇區以及坪林區。

翡翠水庫蜿蜒於新店溪支流北勢溪,起始於坪林區的灣潭一帶。圖/作者提供

水庫興建於 1970年代,集水後淹沒了北勢溪原有的許多景點如翡翠谷與鷺鷥潭,也淹沒了烏來杜鵑的野生族群;但同時也創造了千島湖(位於水庫中段)等臺北新景點。如果有機會,搭乘水庫管理局的採樣船自大壩往坪林逆流而上,你將能體會前赤壁賦「縱一葦之所如,凌萬頃之茫然」的暢快。運氣更好的話,晴天時能望見數十隻黑鳶在水庫上空盤旋的奇景。

搭乘採集船沿翡翠水庫的採樣點進行浮游藻採集,行進間能飽覽湖光山色。圖/作者提供
盤旋於翡翠水庫上空的黑鳶等猛禽。圖/作者提供

實際現場走一回,咦?為何水庫褐褐綠綠的

水庫的大壩目前並不開放觀光,進入主壩需向翡翠水庫管理局申請許可。但是驅車從坪林沿著台九線往新店方向,仍然可以經由產業道路進入水庫上游的黃櫸皮寮及灣潭,飽覽翡翠水庫的山光水色。附近的灣潭古道蜿蜒於灣潭溪,沿途綠樹蔭茵,流水潺潺,極盡視聽之娛。當你來到灣潭附近,眺望水庫,觸目所及是漫山遍野的大片茶園。

-----廣告,請繼續往下閱讀-----
翡翠水庫上游灣潭一帶的茶園。圖/作者提供

種植茶葉必須的肥料,尤其是氮肥與磷肥,無可避免地進入水庫,造成水質優養化,引發藻類的生長。水庫優養化的常用指標為卡爾森優養指數法。此方法根據透明度、水中葉綠素 a 及總磷量來決定優養化程度:指數小於 40 為貧養;40 到 50 之間為普養;大於 50 為優養等級。

簡單的講,淡水湖泊與水庫通常是缺磷的環境;磷酸鹽的輸入會造成藻類(主要色素是葉綠素 a) 生長,進而減低湖水的清澈程度。自水庫蓄水以來,中央研究院生物多樣性研究中心的退休研究員吳俊宗博士長期監測水庫藻類的種類與密度,時間持續 25 年之久。

這項重要的長期監測工作 4 年前由筆者接棒進行。我們的研究結果顯示,相對於茶園的肥料使用,集水區的大型開發工程,例如雪山隧道的興建,對水庫水質的影響更為鉅大。工程會導致大量磷酸鹽從土壤岩石中釋出,進入水庫,導致藻類的大量生長。即使工程停止,藻類密度也需經過 5 年左右的時間,才能回復到工程開發之前的貧養狀態(卡爾森指數年平均在 40 以下)。

翡翠水庫的大壩採樣點之藻類密度與總磷量在過去 30 年的變化情形。圖/取自吳俊宗與江殷儒研究結果。

水庫內的葡萄藻也會產油酸?

近年來,翡翠水庫偶爾會出現大量的葡萄藻,導致水面上漂浮著許多褐棕色的團塊。這種形態特殊的群聚型綠藻,最適合的生長水溫約 20 至 23 度之間,因此常出現在春夏之交的貧養溫帶及亞熱帶湖泊及水庫。當水體的磷酸鹽濃度升高時,常會造成葡萄藻的優勢。十年前在花蓮鯉魚潭曾有數次葡萄藻藻華的發生。

-----廣告,請繼續往下閱讀-----

我們(當時我是碩士班學生,指導者是吳俊宗教授)發現葡萄藻會生成大量的不飽和脂肪酸,例如亞麻油酸。這些不飽和脂肪酸會廣泛地抑制其他藻類(影響細胞膜結構及離子通透)及浮游動物的生長。也就是說,葡萄藻會製造生化武器來攻擊競爭對手或是攝食者。

翡翠水庫發生在 2017 年 6 月底的優勢葡萄藻生長。圖/高麗珠提供

除了造成湖泊與水庫的藻華,葡萄藻更引人注目的是生質能源的應用潛力。葡萄藻能產生大量的三萜類脂質 (triterpene),最多能佔到細胞乾重的一半,形成它那著名的褐色膜鞘結構,也是”葡萄藻”名稱的由來。

這些脂質與原油的結構已經很相近,經過簡單的轉化即可當成生質能源利用。可惜的是,至今尚未找到大量培養葡萄藻的方法。也就是說,湖泊水庫常大量發生,甚至造成生態問題;但實驗室環境卻無法穩定培養,且往往失去特徵性的膜鞘(三萜類脂質),僅剩下綠色的藻細胞,因此失去了生質能的用途。這讓我想起我的德國指導教授 Georg Fuchs 博士常常對我說的話:「微生物學,始於培養,終於培養。」微生物的分離培養與發酵技術,是生技利用的基礎與關鍵!

光學顯微鏡下的葡萄藻。圖/高麗珠提供

參考文獻

  1. Wu JT, Chiang YR, Huang WY, Jane WN 2006. Cytotoxic effects of free fatty acids on phytoplankton algae and cyanobacteria. Aquat Toxicol 80: 338-345.
  2. Chiang YR, Huang WY, Wu JT 2004. Allelochemicals of Botryococcus braunii (Chlorophyceae). J Phycol 40: 474-480.
  3. Banerjee A, Sharma R, Chisti Y, Banerjee UC. 2002. Botryococcus braunii: a renewable source of hydrocarbons and other chemicals. Crit Rev Biotechnol 223:245-279.

 

本文轉載自MiTalkzine,原文《夏天翡翠水庫的葡萄藻》

-----廣告,請繼續往下閱讀-----

歡迎訂閱微雜誌MiTalkzine,加入 MiTalker 的行列,一起來認識這個星球上千萬種各式各樣的微生物吧!

訂閱連結:https://goo.gl/Qo59iG

文章難易度
MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

7
1

文字

分享

0
7
1
小小的藻類生長大爆發的「藻華」,如何影響經濟與健康?——《藻的秘密》
臉譜出版_96
・2020/01/16 ・3032字 ・閱讀時間約 6 分鐘 ・SR值 537 ・八年級

  • 作者/茹絲.卡辛吉;譯者/鄧子衿

藻華產生的軟骨藻酸,對人類與哺乳類都有威脅的毒素

全球各地藻華產生軟骨藻酸事件出現的次數不但愈來愈頻繁,面積也愈來愈大,這是因為海水變得更溫暖,同時有更多肥料流入海中所造成的。

根據最近歐盟的研究,軟骨藻酸對於海洋哺乳動物和人類都造成了嚴重的威脅。海獅經常因為軟骨藻酸中毒而死亡。人類如果無意間攝入了軟骨藻酸,會產生嘔吐、頭痛、無法辨別方向、癲癇等症狀,有的時候甚至會死亡。1987 年的加拿大愛德華王子島(Prince Edward Island),有四人因為中毒而死,另外還有超過百人生病,全是因為吃了受到汙染的海鮮。

紫貽貝(淡菜)。赤藻產生藻華時產生軟骨藻酸,容易易蓄積於濾食海藻的生物體內,因此可能經由食物鏈進入人體中。文字資料來源:衛福部食藥署;圖/嵌入自國立台灣海洋大學有毒海洋生物網頁

研究警告,住在海邊的人和以採集貝類為樂的人,最容易受到毒害。長期接觸到這種毒素,除了會產生上面所說的症狀之外,還會有記憶問題。由於貝類接觸到有毒的藻華之後,軟骨藻酸可以留在體內長達一年,美國華盛頓州建議消費者每個月食用刀蟶的次數不要超過十二次。

擬菱形藻形成的藻華也會造成經濟損失。

2015 年夏天,矽藻藻華從美國加州中部海域往北延伸到加拿大卑詩省外海,綿延一千五百哩,產生的軟骨藻酸濃度也破了觀察紀錄。州政府因此禁止在這個區域撈捕貝類長達四個半月,同時也警告消費者不要食用來自這個海岸線的貝類。漁民和岸邊相關事業損失了數千萬的收入。

-----廣告,請繼續往下閱讀-----

藍綠菌會製造哪些毒素?

藍綠菌為何要演化出製造毒素的能力,到現在還不清楚,但這些毒素本來的目的可能不是用於防禦,因為藍綠菌在演化史早期中並沒有掠食者。

圖/GIPHY

微生物學家最近指出,最常見的藍綠菌毒素微囊藻毒(microcystin)可能是用來防護過多的紫外線,這類化合物的功能類似防曬油。如果劑量高的話會致命,劑量低時在肝臟中累積,也會對於寵物造成長期傷害。

另外還有其他的藍綠菌毒素:節球藻毒素(nodularin)存在於微鹹的水域中,而柱孢藻毒素(cylindrospermopsin)存在於淡水中。雖然不是所有由藍綠菌形成的藻華都有毒,不過我絕對不會在長著藻華的池塘或是混濁綠色的池水裡游泳,也不會讓我的狗喝這些水。

腰鞭毛藻形成的「紅潮危機」

但遺憾的是我們不只要小心綠色,具有紅色色素的微型藻類腰鞭毛藻(Karenia brevis)每年都會大量繁衍,從墨西哥灣岸起,往北延伸到北卡羅來納州的大西洋海岸,讓海水呈現暗紅色,並且對岸邊居民造成身體與經濟傷害。

美國加州外海的赤潮。圖/wikimedia

-----廣告,請繼續往下閱讀-----

腰鞭毛藻所呈現的色調讓它們所形成的藻華也稱為「紅潮」(red tide)。紅潮中充滿能夠攻擊人類神經系統及毒害海洋哺乳動物的雙鞭甲藻毒素(brevetoxin)。多年前我前往佛羅里達州外海的安娜瑪麗亞島(Ana Maria Island)度週末假期,就親身體驗到紅潮的厲害。

抵達島上之後,我在海灘散步,卻覺得呼吸不順、眼睛發熱。我以為自己生病了,但是旅館櫃檯人員說這是當地的紅潮所引起的。雖然我沒有注意到海水呈現紅色,但是腰鞭毛藻的確活躍著,在海浪與海風的作用下,腰鞭毛藻飄入空氣中,被我這樣沒有留意而去海灘的人吸入。

遭遇紅潮的地區之所以不幸,是因為紅潮能夠持續好幾個月。

2006 年發生在佛羅里達州的紅潮持續了十七個月,讓當地的旅遊業一蹶不振。二○一七年在佛羅里達州發生的紅潮,到了二○一八年秋天依然造成損害,殺死的魚類和其他海洋哺乳動物,總重高達兩百七十萬磅,因為呼吸道症狀而入院治療的人數也破了紀錄。水中二氧化碳濃度提高(這是大氣中二氧化碳濃度提高所造成的),會刺激腰鞭毛藻生長,紅潮因而出現。

外來貝類導致微囊藻的大量繁衍,並且無時無刻都在釋放毒素

最近幾年的夏天,俄亥俄州陶雷度(Toledo)附近的伊利湖(Lake Erie)中,會出現由銅綠微囊藻(Microcystis aeruginosa)和其他數種有毒藍綠菌形成的藻華。這些藻類讓湖水呈現噁心的綠色,看到這湖水表面藻華的人,把它描述成豌豆湯、綠油漆,或是薄荷奶昔。肥料逕流與水溫升高是藻華出現的主要原因,但是入侵的貝類也助了一臂之力。

-----廣告,請繼續往下閱讀-----

斑馬貽貝(zebra mussel)和條紋貽貝(quagga mussel)在 1980 年代隨著船艙的壓艙水進入了五大湖,之後便大量繁殖。牠們會和魚類競爭,搶食藻類。但是這些貝類很挑食,不吃微囊藻,而是把微囊藻的競爭者吃掉,因此微囊藻在水中得以立足,並且大量繁衍,無時無刻都在釋出毒素。

看的見與看不見的藻華,持續地影響我們的生活

藻華不只難看,還嚴重影響了陶雷度市四萬名飲用伊利湖水的居民。2014 年,伊利湖出現史上最大的藻華,汙染面積高達三百平方哩,大約等於紐約市。

吸取湖水的管子距離岸邊數哩遠,由於受到藻華覆蓋,使得陶雷度市的公共用水系統關閉了兩天,不只沒有飲用水,也沒有清洗碗盤和沐浴嬰兒的水。從那時起,該市設立了早期預警系統,以便動用額外(而且昂貴)的活性炭過濾系統。不過我可以想像,陶雷度市民如果看到水源上完全覆蓋著藻類的衛星照片時,依然會覺得不安。

受綠潮襲擾的海岸線。圖/wikimedia

這樣的問題並不限於陶雷度市,現在蘇必略湖(Lake Superior)和紐約州手指湖(Finger Lakes)也遭到夏季藻華的入侵。

普洛伏(Provo)附近的猶他湖(Utah Lake)不但是熱門的度假地區,也是當地的水源,但是在 2016 年,湖水變成綠色,而且必須關閉,因為市政府發現湖中有毒藍綠菌的濃度是世界衛生組織認為「造成急性健康傷害」濃度的三倍。同年夏天,有幾個人在洛杉磯附近的金字塔湖(Pyramid Lake)游泳之後生病了。衛生官員測量湖水中的微囊藻毒素濃度,發現是警告標準的六倍。

-----廣告,請繼續往下閱讀-----

在奧瑞岡州的上克拉馬斯湖(Upper Klamath Lake)是有毒藻華湖泊的典型。這座湖的湖水淺、湖面平靜,正適合水華束絲藻(Aphanizomenon flos-aquae)生長,這種藍綠菌生產的毒素能夠導致麻痺。奧瑞岡州克拉馬斯河上的水庫,也容易出現微囊藻形成的藻華(飲用水中的微囊藻毒素特別危險,因為就算煮沸也無法消除這種毒素)。這種危險並不只限於當地:通過水力發電的管路,這種藻類可以在一百八十哩外的下游出現。

有些傷害性藻華(harmful algal blooms)會讓水呈現螢光綠,或甚至是明亮的粉紅色,很容易就可以看得出來。但是看不見的藻華每年入侵了美國數千座湖泊、池塘和水庫。

美國地質調查局(US Geological Survey)最近發現,美國西南部地區有 39% 的溪流中有微囊藻毒素。在 2016 年夏天,有十九個州因為傷害性藻華而發布公共健康警報。在北半球,情況愈來愈糟,夏天出現藻華的時間愈來愈早,持續的時間也愈來愈長。

淡水中的傷害性藻華對經濟的影響,雖然現在還沒有完整的資料,不過堪薩斯州立大學在 2009 年的一項研究中估計,淡水傷害性藻華每年會造成二十二億美元的損失,原因包括限制了水上娛樂活動、造成岸邊的房地產下跌、拯救瀕危物種的費用,以及處理飲用水的花費。

——本文摘自泛科學 2020 年 1 月選書《藻的祕密:誰讓氧氣出現?誰在海邊下毒?誰緩解了飢荒?從生物學、飲食文化、新興工業到環保議題,揭開藻類對人類的影響、傷害與拯救》,2019 年 12 月,臉譜出版

-----廣告,請繼續往下閱讀-----

 

臉譜出版_96
88 篇文章 ・ 255 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

0
1

文字

分享

0
0
1
人工智慧的「黑箱作業」,類神經網路如何將生物分類的?
MiTalk
・2019/06/08 ・4467字 ・閱讀時間約 9 分鐘 ・SR值 543 ・八年級

  • 作者/吳育瑋 臺北醫學大學醫學資訊研究所助理教授

這篇文章是我在讀到 Nature Methods 在 2018 年 3 月 5 日刊登的文章「Using deep learning to model the hierarchicalstructure and function of a cell」1後,在臉書 MiTalk 社團寫下的三篇短文的整理集結。在這三篇短文中,我簡要地介紹了目前人工智慧的技術基礎「類神經網路」的概念,再將其延伸到這篇文章提及的系統生物學研究,並解釋目前類神經網路之所以被稱為「黑盒子」的原因,以及這項系統生物學研究處理黑盒子的手法。

資訊輸入和輸出,如何用「類神經網路」做出無人車?

我們先來聊聊目前機器學習中最火紅的演算法「類神經網路」究竟是什麼東西?

動物的神經元大致上都有著可以接受來自其他神經元的訊號的樹突 (dendrite),以及可以傳送訊號給其他神經元的軸突 (axon)。類神經網路的單位神經元架構與生物的神經元類似:都有著數個可以接受其他神經元的「輸入 (Input)」,以及數個傳送訊號給其他神經元的 「輸出 (Output)」。將一大堆這樣子的神經元連結起來,就是類神經網路了。

當然,這種連結也不是亂連的。類神經網路通常會分成好幾「層」,而每一層與每一層之間的神經元都會緊密連結著 (fullyconnected),以下我用個實際的例子來說明這所謂的「層」是怎麼回事。

在 1989 年的時候,卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN 2。這台無人車的主要架構有三個:一台在車子前面隨時拍照的照相機或攝影機,一台執行類神經網路運算的電腦,以及由電腦控制的方向盤,請參考下圖:

-----廣告,請繼續往下閱讀-----
  • 第一層(最底層):照相機照出來的 30 x 32 個 pixel 的影像,以及8 x 32 個雷射距離測定器像。總共輸入單位是 30 x 32 + 8 x 32 = 1216 個。
  • 第二層(中層):由 29 個類神經網路神經元構成的隱藏層(最初期的設計只有4 個)。
  • 第三層(最上層):45 個輸出神經元,代表著方向盤要打那個角度;每個神經元代表一個角度,例如第一個神經元代表方向盤往右打 30 度,第二個代表方向盤往右打 28 度,依此類推。

卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN。圖片取自:LVINN 論文2

這麼簡單的類神經網路,就已經可以讓這台車在路上以 60 英哩的速度行駛了。可見得類神經網路機器學習的威力。

那麼類神經網路是怎麼訓練的呢?簡單地說,我們在訓練類神經網路時,必須要給它一組(通常是數量很多的一大組)已經知道正確答案的訓練樣本,讓類神經網路之間的神經元連結可以自動透過輸入訊號與正確答案的比對調整自身的參數。這樣的訓練會持續上數千或甚至數百萬次,直到正確率無法再提昇為止。比如說 ALVINN 無人車的訓練就是在真人開車時,將每張相機照出來的圖片與人類開車者的方向盤角度(也就是正確答案)進行連結,並持續調整參數直到答案錯誤率很低為止。

換句話說,ALVINN 這台無人車所做的事,就是模仿人類的開車行為。

-----廣告,請繼續往下閱讀-----

除了無人車,「類神經網路」也能區分生物種類?

在上一段我們解釋了何謂類神經網路。一句話總結的話就是類神經網路就是連結在一起的人工神經元,而且可以透過無數次訓練盡量提高執行任務(比如說下棋或預測天氣)的準確率。在這一段中我將提到類神經網路與生物網路之間的關係

類神經網路通常是由許多的「層」數以及每一層內的「神經元」數量所構成的;然而究竟需要多少層網路,或是每一層網路需要多少神經元,則沒有一定的準則。

我認為這是類神經網路最關鍵,卻也最難以決定的參數。舉例來說,先前提到過的自駕車 ALVINN 總共只有一層網路(不考慮輸入與輸出層的話),且這一層只包含 29 個神經元節點。但是現在如 Tesla 或其他品牌自駕車的類神經網路絕對比這個架構複雜許多。我們在設計類神經網路的時候,甚至需要不停地 trial-and-error 後才能決定「最佳」的網路架構,而這裡的「最佳」理所當然是由預測準確率來決定的。

那麼這和微生物或生命科學有什麼關係呢?這要先從一篇Nucleic Acids Research 論文3 講起。在這篇論文中,卡內基美隆的研究人員試圖透過類神經網路試圖研究不同的細胞(比如說胚胎分化時期的 early-2-cell、late-2-cell、8-cell、16-cell,或不同種類的細胞如 fibroblast、BMDC、以及上皮細胞等),並查看這些細胞的基因表現是否有著明顯的差異。他們的研究標的是不同研究團隊定序出來的 single-cell RNASeq 資料。

簡單來說,他們希望將許多人體內不同種類細胞的 RNASeq 資料透過類神經網路處理後,能夠過濾雜訊,留下最清楚的基因表現訊號。其最終目的當然是透過分群演算法視覺化看出每種細胞的區別

-----廣告,請繼續往下閱讀-----

舉例來說,在論文的圖中,我們可以看到不同的人類細胞在經過類神經網路處理後,能夠有著最大化的分群效果;而且群與群之間大致上距離都相當遠,顯示出基因的表現量的確會隨著細胞的不同而不同。

不同細胞的基因表現差異視覺化。圖片取自:Nucleic Acids Research 論文3

在同一項研究中,研究人員也發現如果小心地設計類神經網路架構,並將其與生物意義結合的話,將能達到最好的效果。這裡說的與生物意義結合的意思,指的是在設計的類神經網路層級中考慮到生物網路的數量以及結構。

他們首先算出這些基因表現量資料,並將資料建成 protein-protein interaction (PPI) 與 protein-DNA interaction (PDI) 的網路系統,並找出裡面總共有 348 個彼此之間有關聯的子網路;而就在找出「348」這個神奇數字後,研究人員就將類神經網路的隱藏層設計成兩層,且各有著 348 個神經元節點,分別代表這 348 組 PPI 與PDI 子網路。他們發現這樣子的類神經網路設計將能達到最理想的分群效果。

-----廣告,請繼續往下閱讀-----

好的。到底我之所以鋪了類神經網路和生物意義這些梗要幹嘛呢?當然最主要的目的就是要說明 2018 年 Nature Methods的論文1 到底在講什麼。這篇論文雖然也是走類神經網路路線,但是他們網路的設計相當極端:完全按照生物的代謝途徑 (metabolic pathway) 來設計神經元的分佈(作者群在另一篇論文中提到他們就是受到這一篇 Nucleic AcidsResearch 的論文啟發而設計出這種奇妙的架構的)。

換句話說,這篇系統生物學的論文設計的類神經網路事實上已經不太有傳統的「隱藏層」的概念,而是完全按照代謝途徑連結人工神經元。透過這個方法,他們的類神經網路中總共包含了酵母菌的 2526 個子網路系統,分別代表不同的細胞代謝途徑。在經過訓練與比較後,這個經過特殊設計的網路結構可以準確地透過不同的基因表現預測酵母菌的細胞生長,並且預測的準確率比傳統數層緊密連結的類神經網路還要好上許多。

神秘的黑盒子,「類神經網路」是怎麼運作的?

在類神經網路的世界中,常常會聽到一個說法:以類神經網路為基礎架構的人工智慧預測模型是「黑盒子  (black box)」。這裡的黑盒子當然不是飛機出事後可以撿回來分析的那個,而是無法打開無法分析而且完全不曉得裡面到底在幹嘛的系統。為什麼會有這種說法呢?一切都要從類神經網路模型是如何訓練的開始講起。

黑盒子系統就像骰骰子一樣,即使知道力學原理,我們還是無法得知骰盅內部到底發生了什麼?圖/pixabay

-----廣告,請繼續往下閱讀-----

在類神經網路的世界中,每一個神經元可以接收來自數十甚至數百個神經元的訊號,並且可以傳送訊號給數十到數百個其他神經元。這種連接方式讓類神經網路的參數異常地多,且輕易就可以上到百萬千萬甚至億這種等級。我再次拿 ALVINN,那台 1989 年的無人車來當例子好了。

ALVINN 的輸入層有 1216 個神經元節點,中間的隱藏層有 29 個神經元,而輸出層有 45個神經元。這個相對來說架構非常簡單的類神經網路的參數就有 1216 X 29 X 45 = 1586880 個參數要考慮了,更別提其他
更複雜的深度學習類神經網路模型了。

事實上,參數數量多還在其次,真正的關鍵在於類神經網路的訓練方式。在訓練類神經網路時,我們往往會做以下兩件事:

  1. 『 隨機』初始化類神經網路中的『所有』參數
  2. 隨著每個樣本的預測對錯微調所有的參數

我來用實際生活案例舉個例子好了。假設你要登一座山,目標是山頂。這座山每個地方的地型都完全不一樣。所以從 A 點上山和從不一樣的 B 點或 C 點上山的路都不盡相同。假設隨機把你放在這座山邊的某一點,要你朝著山頂為目標前進。這時候你的每一步就都會是在「那個當下」最佳的往山頂路線。所以從不同的點上山路線就有可能會差異極大,雖然最後都能到山頂就是了。

-----廣告,請繼續往下閱讀-----

類神經網路的黑盒子,就是來自這個初始化與細微調整。因為參數太多,而且微調整的方式會隨著初始位置的不同而不同,所以一個調整好的類神經網路雖然可以達到不錯的預測成果,但是幾乎沒有人知道為什麼能夠達到這個預測效果。

  • 題外話,這個議題已經受到機器學習以及人工智慧界的重視了。許多人都在想辦法解開這個「黑盒子之謎」5, 6, 7

再舉個例子。每個人的大腦會隨著發育環境的不同而有著不同的發展軌跡,所以幾乎沒有兩個人的大腦神經連結方式是完全相同的。雖然每個人都知道蘋果可以吃,或者是被打會痛;但是發展出這個知識的「神經元連結」則有可能每個人都不一樣。

參數設定越明確,越能解開「黑箱作業」!

回到主題。在前一段落提到的:完全按照代謝途徑建構的類神經網路,和其他網路系統不同的是,它有著「解開黑盒子」的效果呢。

這是因為這套「酵母菌的類神經網路預測模型」是完全按照「生物的代謝途徑」來連結的,所以雖然每個參數還是會因為類神經網路訓練過程而有所不同,但是我們可以得知某個神經元的總輸入參數值,也就是這個神經元的活化 (activation;中國翻成『激活』) 程度。只要將預測過程中每個神經元被活化的程度彼此比較,就能夠得知那個神經元扮演著最重要的角色;而這個神經元也就會是整個代謝途徑中最關鍵的基因或是調控因子。

-----廣告,請繼續往下閱讀-----

下列 a、b 兩圖中皆可在這個類神經網路中,不同的基因活化後將會趨動不同的細胞反應,如 a 圖的 PMT1 與 IRE1 兩條基因與細胞壁的組成與強度有關,而 b 圖則可見 ERV7 與 RAD57 與DNA 的修復有著密切關聯性。

(點圖放大):按照細胞代謝途徑建構的類神經網路系統模擬測試結果。圖/參考文獻 1 ,Figure 3a 與 3d。

回到系統生物學,這套系統之所以對系統生物學的研究很有幫助的原因,在於它是一個可模擬生物在輸入各種訊號(如食物或環境刺激)後,將整個生物代謝途徑中最關鍵的基因標示出來的系統。礙於篇幅沒辦法將所有的元件講的非常清楚(比如說類神經網路本身就有一大堆參數要設定,然後訓練時也往往要扯到方程式微分模型之類的),只是很概略地將最大方向的概念用各種例子來說明。希望各位在讀完這個系列後能夠對何謂類神經網路有著最基本的認知,也能大致理解為什麼類神經網路會被詬病為「黑盒子」的原因。

參考文獻

  1. Ma et al., “Using deep learning to model the hierarchical structure and function of a cell”, Nature Methods, 15:290–298, 2018.
  2.  Pomerleau D., “ALVINN: an autonomous land vehicle in a neural network”, Advances in Neural Information Processing Systems 1, pp. 305-313, 1989.
  3. Lin et al., “Using neural networks for reducing the dimensions of single-cell RNA-Seq data”, Nucleic Acids Research, 45(17):e156, 2017.
  4. Yu et al., “Visible Machine Learning for Biomedicine”, Cell, 173(7):1562-1565, 2018.
  5. Knight W., “The Dark Secret at the Heart of AI”, MIT Technology Review,2017.
  6. Wisdom D., “Deciphering The Black Box of AI”, Medium, 2018.
  7. Castelvecchi D., “Can we open the black box of AI?”, Nature 538:20-23, 2016.

MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱