Loading [MathJax]/extensions/tex2jax.js

0

1
1

文字

分享

0
1
1

翡翠水庫為什麼綠綠der?何不問問生活在此的葡萄藻

MiTalk
・2019/03/06 ・2240字 ・閱讀時間約 4 分鐘 ・SR值 566 ・九年級

江殷儒
中央研究院生物多樣性研究中心 副研究員​
​台灣微生物歲時記

 

蓄水、防洪還能發電,萬用的翡翠水庫

住在臺北都會區的小確幸之一,就是品質優良的自來水。相信待過台灣西部其他城市的朋友們,都會心懷感激地用力點頭。首都台北的都市傳說之一,就是以為臺北自來水的主要水源來自翡翠水庫。

事實上,我們使用的自來水主要來源是南勢溪(佔 75% 左右)。翡翠水庫作為備用水源,調蓄供應公共用水。此外,翡翠水庫亦有發電及防洪等功能。翡翠水庫位於新店溪支流北勢溪之上,是型態極為狹長的水庫,上游起始於坪林附近,範圍涵蓋新北市的新店區、石碇區以及坪林區。

翡翠水庫蜿蜒於新店溪支流北勢溪,起始於坪林區的灣潭一帶。圖/作者提供

水庫興建於 1970年代,集水後淹沒了北勢溪原有的許多景點如翡翠谷與鷺鷥潭,也淹沒了烏來杜鵑的野生族群;但同時也創造了千島湖(位於水庫中段)等臺北新景點。如果有機會,搭乘水庫管理局的採樣船自大壩往坪林逆流而上,你將能體會前赤壁賦「縱一葦之所如,凌萬頃之茫然」的暢快。運氣更好的話,晴天時能望見數十隻黑鳶在水庫上空盤旋的奇景。

搭乘採集船沿翡翠水庫的採樣點進行浮游藻採集,行進間能飽覽湖光山色。圖/作者提供
盤旋於翡翠水庫上空的黑鳶等猛禽。圖/作者提供

實際現場走一回,咦?為何水庫褐褐綠綠的

水庫的大壩目前並不開放觀光,進入主壩需向翡翠水庫管理局申請許可。但是驅車從坪林沿著台九線往新店方向,仍然可以經由產業道路進入水庫上游的黃櫸皮寮及灣潭,飽覽翡翠水庫的山光水色。附近的灣潭古道蜿蜒於灣潭溪,沿途綠樹蔭茵,流水潺潺,極盡視聽之娛。當你來到灣潭附近,眺望水庫,觸目所及是漫山遍野的大片茶園。

-----廣告,請繼續往下閱讀-----
翡翠水庫上游灣潭一帶的茶園。圖/作者提供

種植茶葉必須的肥料,尤其是氮肥與磷肥,無可避免地進入水庫,造成水質優養化,引發藻類的生長。水庫優養化的常用指標為卡爾森優養指數法。此方法根據透明度、水中葉綠素 a 及總磷量來決定優養化程度:指數小於 40 為貧養;40 到 50 之間為普養;大於 50 為優養等級。

簡單的講,淡水湖泊與水庫通常是缺磷的環境;磷酸鹽的輸入會造成藻類(主要色素是葉綠素 a) 生長,進而減低湖水的清澈程度。自水庫蓄水以來,中央研究院生物多樣性研究中心的退休研究員吳俊宗博士長期監測水庫藻類的種類與密度,時間持續 25 年之久。

這項重要的長期監測工作 4 年前由筆者接棒進行。我們的研究結果顯示,相對於茶園的肥料使用,集水區的大型開發工程,例如雪山隧道的興建,對水庫水質的影響更為鉅大。工程會導致大量磷酸鹽從土壤岩石中釋出,進入水庫,導致藻類的大量生長。即使工程停止,藻類密度也需經過 5 年左右的時間,才能回復到工程開發之前的貧養狀態(卡爾森指數年平均在 40 以下)。

翡翠水庫的大壩採樣點之藻類密度與總磷量在過去 30 年的變化情形。圖/取自吳俊宗與江殷儒研究結果。

水庫內的葡萄藻也會產油酸?

近年來,翡翠水庫偶爾會出現大量的葡萄藻,導致水面上漂浮著許多褐棕色的團塊。這種形態特殊的群聚型綠藻,最適合的生長水溫約 20 至 23 度之間,因此常出現在春夏之交的貧養溫帶及亞熱帶湖泊及水庫。當水體的磷酸鹽濃度升高時,常會造成葡萄藻的優勢。十年前在花蓮鯉魚潭曾有數次葡萄藻藻華的發生。

-----廣告,請繼續往下閱讀-----

我們(當時我是碩士班學生,指導者是吳俊宗教授)發現葡萄藻會生成大量的不飽和脂肪酸,例如亞麻油酸。這些不飽和脂肪酸會廣泛地抑制其他藻類(影響細胞膜結構及離子通透)及浮游動物的生長。也就是說,葡萄藻會製造生化武器來攻擊競爭對手或是攝食者。

翡翠水庫發生在 2017 年 6 月底的優勢葡萄藻生長。圖/高麗珠提供

除了造成湖泊與水庫的藻華,葡萄藻更引人注目的是生質能源的應用潛力。葡萄藻能產生大量的三萜類脂質 (triterpene),最多能佔到細胞乾重的一半,形成它那著名的褐色膜鞘結構,也是”葡萄藻”名稱的由來。

這些脂質與原油的結構已經很相近,經過簡單的轉化即可當成生質能源利用。可惜的是,至今尚未找到大量培養葡萄藻的方法。也就是說,湖泊水庫常大量發生,甚至造成生態問題;但實驗室環境卻無法穩定培養,且往往失去特徵性的膜鞘(三萜類脂質),僅剩下綠色的藻細胞,因此失去了生質能的用途。這讓我想起我的德國指導教授 Georg Fuchs 博士常常對我說的話:「微生物學,始於培養,終於培養。」微生物的分離培養與發酵技術,是生技利用的基礎與關鍵!

光學顯微鏡下的葡萄藻。圖/高麗珠提供
  1. Wu JT, Chiang YR, Huang WY, Jane WN 2006. Cytotoxic effects of free fatty acids on phytoplankton algae and cyanobacteria. Aquat Toxicol 80: 338-345.
  2. Chiang YR, Huang WY, Wu JT 2004. Allelochemicals of Botryococcus braunii (Chlorophyceae). J Phycol 40: 474-480.
  3. Banerjee A, Sharma R, Chisti Y, Banerjee UC. 2002. Botryococcus braunii: a renewable source of hydrocarbons and other chemicals. Crit Rev Biotechnol 223:245-279.

 

本文轉載自MiTalkzine,原文《夏天翡翠水庫的葡萄藻》

-----廣告,請繼續往下閱讀-----

歡迎訂閱微雜誌MiTalkzine,加入 MiTalker 的行列,一起來認識這個星球上千萬種各式各樣的微生物吧!

訂閱連結:https://goo.gl/Qo59iG

-----廣告,請繼續往下閱讀-----
文章難易度
MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

7
1

文字

分享

0
7
1
小小的藻類生長大爆發的「藻華」,如何影響經濟與健康?——《藻的秘密》
臉譜出版_96
・2020/01/16 ・3032字 ・閱讀時間約 6 分鐘 ・SR值 537 ・八年級

  • 作者/茹絲.卡辛吉;譯者/鄧子衿

藻華產生的軟骨藻酸,對人類與哺乳類都有威脅的毒素

全球各地藻華產生軟骨藻酸事件出現的次數不但愈來愈頻繁,面積也愈來愈大,這是因為海水變得更溫暖,同時有更多肥料流入海中所造成的。

根據最近歐盟的研究,軟骨藻酸對於海洋哺乳動物和人類都造成了嚴重的威脅。海獅經常因為軟骨藻酸中毒而死亡。人類如果無意間攝入了軟骨藻酸,會產生嘔吐、頭痛、無法辨別方向、癲癇等症狀,有的時候甚至會死亡。1987 年的加拿大愛德華王子島(Prince Edward Island),有四人因為中毒而死,另外還有超過百人生病,全是因為吃了受到汙染的海鮮。

紫貽貝(淡菜)。赤藻產生藻華時產生軟骨藻酸,容易易蓄積於濾食海藻的生物體內,因此可能經由食物鏈進入人體中。文字資料來源:衛福部食藥署;圖/嵌入自國立台灣海洋大學有毒海洋生物網頁

研究警告,住在海邊的人和以採集貝類為樂的人,最容易受到毒害。長期接觸到這種毒素,除了會產生上面所說的症狀之外,還會有記憶問題。由於貝類接觸到有毒的藻華之後,軟骨藻酸可以留在體內長達一年,美國華盛頓州建議消費者每個月食用刀蟶的次數不要超過十二次。

擬菱形藻形成的藻華也會造成經濟損失。

2015 年夏天,矽藻藻華從美國加州中部海域往北延伸到加拿大卑詩省外海,綿延一千五百哩,產生的軟骨藻酸濃度也破了觀察紀錄。州政府因此禁止在這個區域撈捕貝類長達四個半月,同時也警告消費者不要食用來自這個海岸線的貝類。漁民和岸邊相關事業損失了數千萬的收入。

-----廣告,請繼續往下閱讀-----

藍綠菌會製造哪些毒素?

藍綠菌為何要演化出製造毒素的能力,到現在還不清楚,但這些毒素本來的目的可能不是用於防禦,因為藍綠菌在演化史早期中並沒有掠食者。

圖/GIPHY

微生物學家最近指出,最常見的藍綠菌毒素微囊藻毒(microcystin)可能是用來防護過多的紫外線,這類化合物的功能類似防曬油。如果劑量高的話會致命,劑量低時在肝臟中累積,也會對於寵物造成長期傷害。

另外還有其他的藍綠菌毒素:節球藻毒素(nodularin)存在於微鹹的水域中,而柱孢藻毒素(cylindrospermopsin)存在於淡水中。雖然不是所有由藍綠菌形成的藻華都有毒,不過我絕對不會在長著藻華的池塘或是混濁綠色的池水裡游泳,也不會讓我的狗喝這些水。

腰鞭毛藻形成的「紅潮危機」

但遺憾的是我們不只要小心綠色,具有紅色色素的微型藻類腰鞭毛藻(Karenia brevis)每年都會大量繁衍,從墨西哥灣岸起,往北延伸到北卡羅來納州的大西洋海岸,讓海水呈現暗紅色,並且對岸邊居民造成身體與經濟傷害。

美國加州外海的赤潮。圖/wikimedia

-----廣告,請繼續往下閱讀-----

腰鞭毛藻所呈現的色調讓它們所形成的藻華也稱為「紅潮」(red tide)。紅潮中充滿能夠攻擊人類神經系統及毒害海洋哺乳動物的雙鞭甲藻毒素(brevetoxin)。多年前我前往佛羅里達州外海的安娜瑪麗亞島(Ana Maria Island)度週末假期,就親身體驗到紅潮的厲害。

抵達島上之後,我在海灘散步,卻覺得呼吸不順、眼睛發熱。我以為自己生病了,但是旅館櫃檯人員說這是當地的紅潮所引起的。雖然我沒有注意到海水呈現紅色,但是腰鞭毛藻的確活躍著,在海浪與海風的作用下,腰鞭毛藻飄入空氣中,被我這樣沒有留意而去海灘的人吸入。

遭遇紅潮的地區之所以不幸,是因為紅潮能夠持續好幾個月。

2006 年發生在佛羅里達州的紅潮持續了十七個月,讓當地的旅遊業一蹶不振。二○一七年在佛羅里達州發生的紅潮,到了二○一八年秋天依然造成損害,殺死的魚類和其他海洋哺乳動物,總重高達兩百七十萬磅,因為呼吸道症狀而入院治療的人數也破了紀錄。水中二氧化碳濃度提高(這是大氣中二氧化碳濃度提高所造成的),會刺激腰鞭毛藻生長,紅潮因而出現。

外來貝類導致微囊藻的大量繁衍,並且無時無刻都在釋放毒素

最近幾年的夏天,俄亥俄州陶雷度(Toledo)附近的伊利湖(Lake Erie)中,會出現由銅綠微囊藻(Microcystis aeruginosa)和其他數種有毒藍綠菌形成的藻華。這些藻類讓湖水呈現噁心的綠色,看到這湖水表面藻華的人,把它描述成豌豆湯、綠油漆,或是薄荷奶昔。肥料逕流與水溫升高是藻華出現的主要原因,但是入侵的貝類也助了一臂之力。

-----廣告,請繼續往下閱讀-----

斑馬貽貝(zebra mussel)和條紋貽貝(quagga mussel)在 1980 年代隨著船艙的壓艙水進入了五大湖,之後便大量繁殖。牠們會和魚類競爭,搶食藻類。但是這些貝類很挑食,不吃微囊藻,而是把微囊藻的競爭者吃掉,因此微囊藻在水中得以立足,並且大量繁衍,無時無刻都在釋出毒素。

看的見與看不見的藻華,持續地影響我們的生活

藻華不只難看,還嚴重影響了陶雷度市四萬名飲用伊利湖水的居民。2014 年,伊利湖出現史上最大的藻華,汙染面積高達三百平方哩,大約等於紐約市。

吸取湖水的管子距離岸邊數哩遠,由於受到藻華覆蓋,使得陶雷度市的公共用水系統關閉了兩天,不只沒有飲用水,也沒有清洗碗盤和沐浴嬰兒的水。從那時起,該市設立了早期預警系統,以便動用額外(而且昂貴)的活性炭過濾系統。不過我可以想像,陶雷度市民如果看到水源上完全覆蓋著藻類的衛星照片時,依然會覺得不安。

受綠潮襲擾的海岸線。圖/wikimedia

這樣的問題並不限於陶雷度市,現在蘇必略湖(Lake Superior)和紐約州手指湖(Finger Lakes)也遭到夏季藻華的入侵。

普洛伏(Provo)附近的猶他湖(Utah Lake)不但是熱門的度假地區,也是當地的水源,但是在 2016 年,湖水變成綠色,而且必須關閉,因為市政府發現湖中有毒藍綠菌的濃度是世界衛生組織認為「造成急性健康傷害」濃度的三倍。同年夏天,有幾個人在洛杉磯附近的金字塔湖(Pyramid Lake)游泳之後生病了。衛生官員測量湖水中的微囊藻毒素濃度,發現是警告標準的六倍。

-----廣告,請繼續往下閱讀-----

在奧瑞岡州的上克拉馬斯湖(Upper Klamath Lake)是有毒藻華湖泊的典型。這座湖的湖水淺、湖面平靜,正適合水華束絲藻(Aphanizomenon flos-aquae)生長,這種藍綠菌生產的毒素能夠導致麻痺。奧瑞岡州克拉馬斯河上的水庫,也容易出現微囊藻形成的藻華(飲用水中的微囊藻毒素特別危險,因為就算煮沸也無法消除這種毒素)。這種危險並不只限於當地:通過水力發電的管路,這種藻類可以在一百八十哩外的下游出現。

有些傷害性藻華(harmful algal blooms)會讓水呈現螢光綠,或甚至是明亮的粉紅色,很容易就可以看得出來。但是看不見的藻華每年入侵了美國數千座湖泊、池塘和水庫。

美國地質調查局(US Geological Survey)最近發現,美國西南部地區有 39% 的溪流中有微囊藻毒素。在 2016 年夏天,有十九個州因為傷害性藻華而發布公共健康警報。在北半球,情況愈來愈糟,夏天出現藻華的時間愈來愈早,持續的時間也愈來愈長。

淡水中的傷害性藻華對經濟的影響,雖然現在還沒有完整的資料,不過堪薩斯州立大學在 2009 年的一項研究中估計,淡水傷害性藻華每年會造成二十二億美元的損失,原因包括限制了水上娛樂活動、造成岸邊的房地產下跌、拯救瀕危物種的費用,以及處理飲用水的花費。

——本文摘自泛科學 2020 年 1 月選書《藻的祕密:誰讓氧氣出現?誰在海邊下毒?誰緩解了飢荒?從生物學、飲食文化、新興工業到環保議題,揭開藻類對人類的影響、傷害與拯救》,2019 年 12 月,臉譜出版

-----廣告,請繼續往下閱讀-----

 

-----廣告,請繼續往下閱讀-----
臉譜出版_96
88 篇文章 ・ 255 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

0
1

文字

分享

0
0
1
人工智慧的「黑箱作業」,類神經網路如何將生物分類的?
MiTalk
・2019/06/08 ・4467字 ・閱讀時間約 9 分鐘 ・SR值 543 ・八年級

-----廣告,請繼續往下閱讀-----

  • 作者/吳育瑋 臺北醫學大學醫學資訊研究所助理教授

這篇文章是我在讀到 Nature Methods 在 2018 年 3 月 5 日刊登的文章「Using deep learning to model the hierarchicalstructure and function of a cell」1後,在臉書 MiTalk 社團寫下的三篇短文的整理集結。在這三篇短文中,我簡要地介紹了目前人工智慧的技術基礎「類神經網路」的概念,再將其延伸到這篇文章提及的系統生物學研究,並解釋目前類神經網路之所以被稱為「黑盒子」的原因,以及這項系統生物學研究處理黑盒子的手法。

資訊輸入和輸出,如何用「類神經網路」做出無人車?

我們先來聊聊目前機器學習中最火紅的演算法「類神經網路」究竟是什麼東西?

動物的神經元大致上都有著可以接受來自其他神經元的訊號的樹突 (dendrite),以及可以傳送訊號給其他神經元的軸突 (axon)。類神經網路的單位神經元架構與生物的神經元類似:都有著數個可以接受其他神經元的「輸入 (Input)」,以及數個傳送訊號給其他神經元的 「輸出 (Output)」。將一大堆這樣子的神經元連結起來,就是類神經網路了。

當然,這種連結也不是亂連的。類神經網路通常會分成好幾「層」,而每一層與每一層之間的神經元都會緊密連結著 (fullyconnected),以下我用個實際的例子來說明這所謂的「層」是怎麼回事。

在 1989 年的時候,卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN 2。這台無人車的主要架構有三個:一台在車子前面隨時拍照的照相機或攝影機,一台執行類神經網路運算的電腦,以及由電腦控制的方向盤,請參考下圖:

-----廣告,請繼續往下閱讀-----
  • 第一層(最底層):照相機照出來的 30 x 32 個 pixel 的影像,以及8 x 32 個雷射距離測定器像。總共輸入單位是 30 x 32 + 8 x 32 = 1216 個。
  • 第二層(中層):由 29 個類神經網路神經元構成的隱藏層(最初期的設計只有4 個)。
  • 第三層(最上層):45 個輸出神經元,代表著方向盤要打那個角度;每個神經元代表一個角度,例如第一個神經元代表方向盤往右打 30 度,第二個代表方向盤往右打 28 度,依此類推。

卡內基美隆大學發明了第一台透過類神經網路控制的無人車 ALVINN。圖片取自:LVINN 論文2

這麼簡單的類神經網路,就已經可以讓這台車在路上以 60 英哩的速度行駛了。可見得類神經網路機器學習的威力。

那麼類神經網路是怎麼訓練的呢?簡單地說,我們在訓練類神經網路時,必須要給它一組(通常是數量很多的一大組)已經知道正確答案的訓練樣本,讓類神經網路之間的神經元連結可以自動透過輸入訊號與正確答案的比對調整自身的參數。這樣的訓練會持續上數千或甚至數百萬次,直到正確率無法再提昇為止。比如說 ALVINN 無人車的訓練就是在真人開車時,將每張相機照出來的圖片與人類開車者的方向盤角度(也就是正確答案)進行連結,並持續調整參數直到答案錯誤率很低為止。

換句話說,ALVINN 這台無人車所做的事,就是模仿人類的開車行為。

-----廣告,請繼續往下閱讀-----

除了無人車,「類神經網路」也能區分生物種類?

在上一段我們解釋了何謂類神經網路。一句話總結的話就是類神經網路就是連結在一起的人工神經元,而且可以透過無數次訓練盡量提高執行任務(比如說下棋或預測天氣)的準確率。在這一段中我將提到類神經網路與生物網路之間的關係

類神經網路通常是由許多的「層」數以及每一層內的「神經元」數量所構成的;然而究竟需要多少層網路,或是每一層網路需要多少神經元,則沒有一定的準則。

我認為這是類神經網路最關鍵,卻也最難以決定的參數。舉例來說,先前提到過的自駕車 ALVINN 總共只有一層網路(不考慮輸入與輸出層的話),且這一層只包含 29 個神經元節點。但是現在如 Tesla 或其他品牌自駕車的類神經網路絕對比這個架構複雜許多。我們在設計類神經網路的時候,甚至需要不停地 trial-and-error 後才能決定「最佳」的網路架構,而這裡的「最佳」理所當然是由預測準確率來決定的。

那麼這和微生物或生命科學有什麼關係呢?這要先從一篇Nucleic Acids Research 論文3 講起。在這篇論文中,卡內基美隆的研究人員試圖透過類神經網路試圖研究不同的細胞(比如說胚胎分化時期的 early-2-cell、late-2-cell、8-cell、16-cell,或不同種類的細胞如 fibroblast、BMDC、以及上皮細胞等),並查看這些細胞的基因表現是否有著明顯的差異。他們的研究標的是不同研究團隊定序出來的 single-cell RNASeq 資料。

簡單來說,他們希望將許多人體內不同種類細胞的 RNASeq 資料透過類神經網路處理後,能夠過濾雜訊,留下最清楚的基因表現訊號。其最終目的當然是透過分群演算法視覺化看出每種細胞的區別

-----廣告,請繼續往下閱讀-----

舉例來說,在論文的圖中,我們可以看到不同的人類細胞在經過類神經網路處理後,能夠有著最大化的分群效果;而且群與群之間大致上距離都相當遠,顯示出基因的表現量的確會隨著細胞的不同而不同。

不同細胞的基因表現差異視覺化。圖片取自:Nucleic Acids Research 論文3

在同一項研究中,研究人員也發現如果小心地設計類神經網路架構,並將其與生物意義結合的話,將能達到最好的效果。這裡說的與生物意義結合的意思,指的是在設計的類神經網路層級中考慮到生物網路的數量以及結構。

他們首先算出這些基因表現量資料,並將資料建成 protein-protein interaction (PPI) 與 protein-DNA interaction (PDI) 的網路系統,並找出裡面總共有 348 個彼此之間有關聯的子網路;而就在找出「348」這個神奇數字後,研究人員就將類神經網路的隱藏層設計成兩層,且各有著 348 個神經元節點,分別代表這 348 組 PPI 與PDI 子網路。他們發現這樣子的類神經網路設計將能達到最理想的分群效果。

-----廣告,請繼續往下閱讀-----

好的。到底我之所以鋪了類神經網路和生物意義這些梗要幹嘛呢?當然最主要的目的就是要說明 2018 年 Nature Methods的論文1 到底在講什麼。這篇論文雖然也是走類神經網路路線,但是他們網路的設計相當極端:完全按照生物的代謝途徑 (metabolic pathway) 來設計神經元的分佈(作者群在另一篇論文中提到他們就是受到這一篇 Nucleic AcidsResearch 的論文啟發而設計出這種奇妙的架構的)。

換句話說,這篇系統生物學的論文設計的類神經網路事實上已經不太有傳統的「隱藏層」的概念,而是完全按照代謝途徑連結人工神經元。透過這個方法,他們的類神經網路中總共包含了酵母菌的 2526 個子網路系統,分別代表不同的細胞代謝途徑。在經過訓練與比較後,這個經過特殊設計的網路結構可以準確地透過不同的基因表現預測酵母菌的細胞生長,並且預測的準確率比傳統數層緊密連結的類神經網路還要好上許多。

神秘的黑盒子,「類神經網路」是怎麼運作的?

在類神經網路的世界中,常常會聽到一個說法:以類神經網路為基礎架構的人工智慧預測模型是「黑盒子  (black box)」。這裡的黑盒子當然不是飛機出事後可以撿回來分析的那個,而是無法打開無法分析而且完全不曉得裡面到底在幹嘛的系統。為什麼會有這種說法呢?一切都要從類神經網路模型是如何訓練的開始講起。

黑盒子系統就像骰骰子一樣,即使知道力學原理,我們還是無法得知骰盅內部到底發生了什麼?圖/pixabay

-----廣告,請繼續往下閱讀-----

在類神經網路的世界中,每一個神經元可以接收來自數十甚至數百個神經元的訊號,並且可以傳送訊號給數十到數百個其他神經元。這種連接方式讓類神經網路的參數異常地多,且輕易就可以上到百萬千萬甚至億這種等級。我再次拿 ALVINN,那台 1989 年的無人車來當例子好了。

ALVINN 的輸入層有 1216 個神經元節點,中間的隱藏層有 29 個神經元,而輸出層有 45個神經元。這個相對來說架構非常簡單的類神經網路的參數就有 1216 X 29 X 45 = 1586880 個參數要考慮了,更別提其他
更複雜的深度學習類神經網路模型了。

事實上,參數數量多還在其次,真正的關鍵在於類神經網路的訓練方式。在訓練類神經網路時,我們往往會做以下兩件事:

  1. 『 隨機』初始化類神經網路中的『所有』參數
  2. 隨著每個樣本的預測對錯微調所有的參數

我來用實際生活案例舉個例子好了。假設你要登一座山,目標是山頂。這座山每個地方的地型都完全不一樣。所以從 A 點上山和從不一樣的 B 點或 C 點上山的路都不盡相同。假設隨機把你放在這座山邊的某一點,要你朝著山頂為目標前進。這時候你的每一步就都會是在「那個當下」最佳的往山頂路線。所以從不同的點上山路線就有可能會差異極大,雖然最後都能到山頂就是了。

-----廣告,請繼續往下閱讀-----

類神經網路的黑盒子,就是來自這個初始化與細微調整。因為參數太多,而且微調整的方式會隨著初始位置的不同而不同,所以一個調整好的類神經網路雖然可以達到不錯的預測成果,但是幾乎沒有人知道為什麼能夠達到這個預測效果。

  • 題外話,這個議題已經受到機器學習以及人工智慧界的重視了。許多人都在想辦法解開這個「黑盒子之謎」5, 6, 7

再舉個例子。每個人的大腦會隨著發育環境的不同而有著不同的發展軌跡,所以幾乎沒有兩個人的大腦神經連結方式是完全相同的。雖然每個人都知道蘋果可以吃,或者是被打會痛;但是發展出這個知識的「神經元連結」則有可能每個人都不一樣。

參數設定越明確,越能解開「黑箱作業」!

回到主題。在前一段落提到的:完全按照代謝途徑建構的類神經網路,和其他網路系統不同的是,它有著「解開黑盒子」的效果呢。

這是因為這套「酵母菌的類神經網路預測模型」是完全按照「生物的代謝途徑」來連結的,所以雖然每個參數還是會因為類神經網路訓練過程而有所不同,但是我們可以得知某個神經元的總輸入參數值,也就是這個神經元的活化 (activation;中國翻成『激活』) 程度。只要將預測過程中每個神經元被活化的程度彼此比較,就能夠得知那個神經元扮演著最重要的角色;而這個神經元也就會是整個代謝途徑中最關鍵的基因或是調控因子。

-----廣告,請繼續往下閱讀-----

下列 a、b 兩圖中皆可在這個類神經網路中,不同的基因活化後將會趨動不同的細胞反應,如 a 圖的 PMT1 與 IRE1 兩條基因與細胞壁的組成與強度有關,而 b 圖則可見 ERV7 與 RAD57 與DNA 的修復有著密切關聯性。

(點圖放大):按照細胞代謝途徑建構的類神經網路系統模擬測試結果。圖/參考文獻 1 ,Figure 3a 與 3d。

回到系統生物學,這套系統之所以對系統生物學的研究很有幫助的原因,在於它是一個可模擬生物在輸入各種訊號(如食物或環境刺激)後,將整個生物代謝途徑中最關鍵的基因標示出來的系統。礙於篇幅沒辦法將所有的元件講的非常清楚(比如說類神經網路本身就有一大堆參數要設定,然後訓練時也往往要扯到方程式微分模型之類的),只是很概略地將最大方向的概念用各種例子來說明。希望各位在讀完這個系列後能夠對何謂類神經網路有著最基本的認知,也能大致理解為什麼類神經網路會被詬病為「黑盒子」的原因。

  1. Ma et al., “Using deep learning to model the hierarchical structure and function of a cell”, Nature Methods, 15:290–298, 2018.
  2.  Pomerleau D., “ALVINN: an autonomous land vehicle in a neural network”, Advances in Neural Information Processing Systems 1, pp. 305-313, 1989.
  3. Lin et al., “Using neural networks for reducing the dimensions of single-cell RNA-Seq data”, Nucleic Acids Research, 45(17):e156, 2017.
  4. Yu et al., “Visible Machine Learning for Biomedicine”, Cell, 173(7):1562-1565, 2018.
  5. Knight W., “The Dark Secret at the Heart of AI”, MIT Technology Review,2017.
  6. Wisdom D., “Deciphering The Black Box of AI”, Medium, 2018.
  7. Castelvecchi D., “Can we open the black box of AI?”, Nature 538:20-23, 2016.

-----廣告,請繼續往下閱讀-----
MiTalk
10 篇文章 ・ 5 位粉絲
MiTalk 由一群微生物領域的科學家組成,希望能讓更多人喜歡上這些有趣的小生物。MiTalkzine 是我們推出的免費電子科普雜誌,歡迎訂閱