Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

是誰在剪輯你的人生?拜見生物體內的RNA剪接團隊!

研之有物│中央研究院_96
・2018/03/09 ・3955字 ・閱讀時間約 8 分鐘 ・SR值 573 ・九年級

  • 執行編輯|林婷嫻 美術編輯|張語辰

如果 DNA 是電影劇本,記載著生物體應該演出什麼樣的電影。那麼 RNA 就像依劇本拍攝出來的影片片段,需再透過「剪接」才能組成劇情相符的電影,而細胞內的「剪接師團隊」就由五個小核核醣核酸及多種蛋白因子、蛋白複合體分工合作。

中研院分子生物研究所的鄭淑珍院士,與團隊透過實驗發現生物體內的「 RNA 剪接師團隊」。 攝影│張語辰
中研院分子生物研究所的鄭淑珍院士,與團隊透過實驗發現生物體內的「 RNA 剪接師團隊」。攝影│張語辰。

由蛇毒蛋白到研究 RNA 剪接

回想四十年前,鄭淑珍還是臺灣大學化學系的大四生,跟著羅銅壁院士做專題研究,以蛇毒蛋白為材料。「這跟作化學實驗很不一樣,感覺跟生命比較有連結,有很多自然奧秘等待被開發!」鄭淑珍回想喜歡上生化實驗的日子。

四十年過去,鄭淑珍仍投身於基礎研究,只是對象不再是蛇毒蛋白,而是生物體內 RNA 剪接的奧秘。電影剪接教父 Walter Murch 曾說:「最好的剪接,是像眨眼一樣自然」。而在自然界中,眨眼一瞬間、甚至比眨眼更快的瞬間,生物體內也有許多「 RNA 剪接」正在進行中。

中心定律:DNA>RNA>蛋白質

瞭解 RNA 剪接之前,我們要先對生物的中心定律 (Central Dogma)──「從 DNA 到蛋白質」這過程有個概念:

DNA 會先轉錄成 RNA ,再剪接加工為成熟 mRNA,並送去細胞質製造蛋白質。(圖中剪刀為 RNA 剪接的示意位置。) 圖說設計│林婷嫻、張語辰
DNA 會先轉錄成 RNA ,再剪接加工為成熟 mRNA,並送去細胞質製造蛋白質。(圖中剪刀為 RNA 剪接的示意位置)。圖說設計│林婷嫻、張語辰

人體中應用蛋白質完成各式各樣的功能,例如代謝作用、調節肌肉收縮、免疫反應等等,而各種蛋白質的功能被「編碼」於最源頭的 DNA 基因片段。最源頭的 DNA 基因片段,可細分為兩種區段:表現子(Exon 或稱外顯子) 、介入子(Intron 或稱內含子) 。

DNA 基因片段,分為表現子 (Exon) 和介入子 (Intron)。 資料來源│鄭淑珍 圖說重製│林婷嫻、張語辰
DNA 基因片段,分為表現子 (Exon) 和介入子 (Intron)。 資料來源│鄭淑珍、圖說重製│林婷嫻、張語辰。

「表現子」在 RNA 剪接時會被「留下」,而「介入子」會在 RNA 剪接時被「捨去」。保留的表現子被組成一段 mRNA 遺傳訊息,並依此 mRNA 遺傳訊息製造出對應的蛋白質,蛋白質再於生物體內發揮應有的功能。

RNA 剪接過程中,由核酸及蛋白因子組成的「剪接體」,會剪下不需要的介入子、組裝被保留的表現子。資料來源│鄭淑珍 圖說重製│林婷嫻、張語辰
RNA 剪接過程中,由核酸及蛋白因子組成的「剪接體」,會剪下不需要的介入子、組裝被保留的表現子。資料來源│鄭淑珍、 圖說重製│林婷嫻、張語辰。

人體中所有的表現子,也就是能夠製造蛋白質的基因編碼,其實只佔人體基因體總長度 1.5% 。為什麼這麼少的基因,卻能組合出人體中那麼多種複雜的蛋白質?又或者,為什麼有些情況下, 表現子的 DNA 序列明明無異常,卻產出奇怪的蛋白質,導致生理異常或遺傳性疾病?

奧秘在於「 RNA 剪接」是否正確運作:剪掉不要的介入子,並保留、組裝需要的表現子。

剪接奧秘在於精準「捨」與「留」

「電影剪接,主要是透過『減法』來達成的一門藝術,否決那些對最終成果無用的元素。這個形式不只是由保留了什麼來決定,被刪除了什麼也同等重要。」——《剪接師之路》作者 Justin Chang 。

這個心法不單指電影剪接,生物體內的 RNA 剪接也是。我們可試著將 RNA 剪接加工成 mRNA 的過程,想像成下圖。

由核酸及多種蛋白因子組成的剪接體 (Spliceosome),就像生物體內的電影剪接團隊。 圖說設計│林婷嫻、張語辰
由核酸及多種蛋白因子組成的剪接體 (Spliceosome),就像生物體內的電影剪接團隊。圖說重製│林婷嫻、張語辰。

RNA 基因片段,是根據 DNA 電影腳本拍攝出來的影片片段,而剪接體 (Spliceosome)就像生物體內的剪接師團隊,將需要的影片片段留下來組裝、說成有意義的故事情節,而不需要的鏡頭畫面,就如同被剪去的介入子。

若某一步驟剪錯,少了、或多了一段影片片段,電影情節就會讓人滿頭問號。情節錯誤的電影,如同最終產出的錯誤蛋白質,讓體內生理機制也滿頭問號,導致生理異常或遺傳性疾病。

以酵母菌為模式,建構 RNA 剪接路徑

要瞭解 RNA 剪接哪裡出錯,需先透徹瞭解剪接路徑。鄭淑珍團隊以酵母菌為模式系統,透過實驗拆解 RNA 剪接加工成為 mRNA 的步驟,找出是哪些「剪接師」也就是蛋白因子、蛋白複合體參與其中。

酵母菌這種單細胞生物,有辦法幫助瞭解人體嗎?鄭淑珍說明,RNA 剪接是真核生物體內一個基本的生化反應,在各種生物中機制大致相似。雖然人體比酵母菌複雜很多,但人體的基因數量其實只有酵母菌的四倍。

高等生物體內,一段基因編碼做出不只一種蛋白質,就是利用「剪接」排列組合來達成。

多年來的努力,結合其他研究團隊提供的資訊,對剪接路徑的認知整合於下圖呈現。簡單來說,RNA 剪接過程可分為四個階段:組裝、活化、催化、拆解。過程中,由五個小核核醣核酸及多種蛋白因子組成剪接師團隊,擔綱剪接任務。

RNA 剪接路徑。 資料來源│鄭淑珍 圖說重製│林婷嫻、張語辰
RNA 剪接路徑。 資料來源│鄭淑珍、圖說重製│林婷嫻、張語辰。

在 RNA 剪接過程中,有些蛋白因子負責將要被組裝的表現子拉近一點,有些蛋白複合體(例如 NTC)負責活化結構、催化剪接反應。有些蛋白複合體(例如 NTR)負責拆解結構,讓蛋白因子可以重新參與下一次剪接輪迴。

其中的 NTC、NTR 蛋白複合體,和 Cwc22、Cwc24、Cwc25、Yju2 等蛋白因子,一開始沒人知道它們的存在與功能,直到鄭淑珍團隊透過生化實驗,一一拆解 RNA 剪接步驟,才發現這些參與反應的「剪接師團隊」。

自然情況下,生物體內的剪接過程有可能會出錯,例如,當剪接蛋白因子都被套牢在 RNA 基因片段上,導致新的 RNA 沒有人手來剪接,就會對細胞產生不良影響。可以想像成,當剪接師團隊全都卡在同一個電影專案、白費功夫,就拖累了後續新電影的剪接進度。

冷凍電子顯微鏡:親眼瞧瞧 RNA 剪接團隊

反覆的生化實驗操作,仔細偵測實驗產物的變化,並運用想像力推論變化的原因。雖然耗時費力,鄭淑珍認為:「實驗程序必須很扎實,才能獲得確實的結果 。很多時候實驗會碰到瓶頸,無法破解。但當想了很久終於想通了,是做研究最開心的時候!」

不少遺傳性疾病跟 RNA 剪接有關,但要以此發展藥物,必須徹底了解 RNA 剪接途徑的機制,才能對症下藥。很令人振奮的, 2016 年底美國食品藥品監督管理局 (FDA) 批准了一個治療脊髓性肌肉萎縮症 (SMA) 的藥,可以矯正調控病患運動神經元蛋白質的 RNA 剪接異常。鄭淑珍提到,此外國團隊在這方面不放棄地研究了二十多年,並攜手生技公司、藥廠合作開發新藥。

國際上除了脊髓性肌肉萎縮症 (SMA)藥物研發成功的激勵,RNA 剪接研究也照進另一道曙光。

以前是透過生化實驗來「推論」 RNA 剪接途徑。近年由於冷凍電子顯微鏡技術的大精進,解出了剪接複合體的複雜結構,可以看到剪接途徑不同階段的剪接體結構細微的部份,相當於直接「看見」RNA 剪接過程,也應證過去的實驗推論。這令研究人員們內心狂喜,因為剪接體的結構既複雜又不穩定,過去很難想像其結構能輕易解出來。

「很多這個領域的創始元老,現都已八十多歲,沒想到有生之年可以親眼看到這些結構,他們都很開心!」說著這段話的鄭淑珍,眼中也帶著期待。

雖然多瞭解了很多,但還有很多需要被瞭解,所以我們就在這個領域繼續做。

RNA 剪接正發生在你我體內,此領域雖已累積不少研究發現,但還有很多需要被探究。多瞭解它們一些,就給我們更多機會去對付因剪接缺失所造成的疾病。

延伸閱讀

 

本著作由研之有物製作,原文為《我們體內竟然住著剪接師!鄭淑珍的 RNA 剪接研究》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3654 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

5
2

文字

分享

0
5
2
研究自閉症成因的新思路:環狀 RNA——專訪中研院基因體研究中心莊樹諄研究員
研之有物│中央研究院_96
・2023/09/22 ・5439字 ・閱讀時間約 11 分鐘

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|寒波
  • 責任編輯|簡克志
  • 美術設計|蔡宛潔

自閉症研究的新方向

臺灣民眾大概都聽說過「自閉症」這個名詞,自閉症是腦部發育障礙導致的複雜疾病,同時受到先天遺傳以及後天環境因素的影響,具體成因依然是個謎,科學家須對遺傳調控方面有更多了解。中央研究院「研之有物」專訪院內基因體研究中心的莊樹諄研究員,他的團隊結合生物學、資訊學以及統計學方法,發現自閉症的風險基因與 RNA 之間有複雜的交互作用,在自閉症患者與非患者的腦部有很大差異。如果持續研究 RNA 的調控機制,或能開闢新的方向進一步理解自閉症。

遺傳性疾病成因——致病基因

根據衛生福利部 2023 年統計數據,我國自閉症患者超過一萬九千人。自閉症的全稱為「自閉症譜系障礙(autism spectrum disorder,簡稱 ASD)」,常見症狀是溝通、表達、社交上有困難,經常出現反復固定的狹窄行為,目前尚無有效的治療藥物。雖然經典電影《雨人》的主角雷蒙或是韓劇《非常律師禹英禑》的禹英禑都令人印象深刻,不過天才或高智商的自閉症患者只是極少數,而且不同患者的症狀輕重差異很大,故稱之為「譜系」(spectrum)。

理解遺傳性疾病,可利用遺傳學與基因體學的研究方法,比較患者與非患者之間的遺傳差異,便有機會尋獲致病的遺傳成因。過往研究得知,有些遺傳性疾病只取決於單一或少數基因的強力影響,例如亨廷頓舞蹈症(Huntington’s disease)、纖維性囊腫(cystic fibrosis)等,致病原因較為單純。

自閉症自然也受到先天遺傳基因影響,然而,它涉及許多影響力不明顯的基因,而且影響每名患者的基因又不盡相同,讓遺傳與症狀的關係更加複雜。如果從 RNA 研究路徑出發呢?RNA 是核糖核酸,具有承載 DNA 訊息和調控基因等功能,相比於其他疾病,在 RNA 層次研究自閉症的另一挑戰是取樣極為困難,自閉症患者的病因位於大腦內部,通常無法直接從人腦取樣分析。所幸的是,若檢視去世者捐贈的大腦樣本,仍有機會一窺自閉症的腦內奧秘。

-----廣告,請繼續往下閱讀-----

莊樹諄分析的數據來自公共存取的 Synapse 資料庫,包括上百位自閉症患者與非自閉症者的資料。人數乍看不多,卻已是當今想同時探討同一個人的基因體(DNA 層次)與轉錄體(RNA 層次)間因果關係的最佳的選擇。藉由此一資料庫蒐集的人類腦部組織轉錄體資料,可全面探討各式各樣的 RNA,包含信使 RNA(messenger RNA,簡稱 mRNA)、小分子 RNA(microRNA,簡稱 miRNA),以及莊樹諄鎖定的研究目標:環狀 RNA(circular RNA)

自閉症成因不明,目前尚無治療用藥物。有自閉症的人需要社會與家人的支持及陪伴,透過療育和行為輔導的協助,慢慢活出自我。
圖|iStock

不能轉譯,但似乎會互相影響?非編碼 RNA

莊樹諄的教育背景是資訊學博士,博士後研究的階段投入生物資訊學,之前主要從事 RNA 與靈長類演化方面的研究,探討多樣性切割、RNA 編輯(RNA editing)等議題,環狀 RNA 則是他近年來特別感興趣的題材。

根據生物資訊學的預測,環狀 RNA 這類長鍊的 RNA 分子有數萬個,但實際上有多少仍不清楚。它們在大腦神經系統特別常見,似乎涉及許多基因調控的工作。莊樹諄目前最關注環狀 RNA 對自閉症的影響,不過他指出這番思路不限於自閉症,阿茲海默症、帕金森氏症、精神分裂症(schizophrenia)等疾病也能用同樣的方法探索。

不過,什麼是環狀 RNA 呢?按照序列長度、作用,可以將 RNA 分為很多種類。DNA 轉錄出的 RNA 經過處理,有些形成 20 多個核苷酸長的短鏈 RNA,如 miRNA 屬於此類。一些較長鏈的 mRNA 又會轉譯成氨基酸,產生各式蛋白質。還有些長鍊的 RNA 不會轉譯,仍然維持長鍊 RNA 的形式發揮作用,統稱為長鍊非編碼 RNA(long noncoding RNA,lncRNA),莊樹諄研究的主角環狀 RNA 大致上被歸屬於一種非編碼 RNA。這麼多種類的 RNA 彼此會互相影響,導致複雜的基因調控。

-----廣告,請繼續往下閱讀-----
長鍊非編碼 RNA(lncRNA)是 Pre-mRNA 選擇性剪接的產物,根據不同的生成方式,產生各種類型的環狀 RNA。
圖|研之有物(資料來源|International Journal of Oncology

由 DNA 轉錄而成的 RNA 是線形,至於「環狀」RNA 一如其名,是 RNA 長鏈首尾相接後形成的環形結構,相比線形 RNA 更加穩定,不容易遭到分解。這些長期存在的圈圈,假如序列可以和短鏈的 miRNA 互補,兩者便有機會結合在一起,讀者可以想像為類似「海綿」(sponge)的吸附作用。

miRNA 原本的工作是結合 mRNA,使其無法轉錄為蛋白質,抑制基因表現。可想而知,一旦 miRNA 被環狀 RNA 吸附,便無法再干擾 mRNA 作用,失去抑制基因表現的效果。因此環狀 RNA 能透過直接影響 miRNA,來間接參與調控其他的下游基因。這便是環狀 RNA 的許多種調控功能中,最常被研究的一種。

左圖是 miRNA 抑制 mRNA 轉譯的一般流程。右圖是環狀 RNA 像海綿一樣吸附 miRNA,讓 miRNA 原本抑制 mRNA 轉譯的「剎車」功能失去作用。因此環狀 RNA 透過直接影響 miRNA,就能間接參與調控其他的下游基因。
圖|研之有物(資料來源|Frontiers in Cardiovascular Medicine

自閉症的成因要往腦部深究,環狀 RNA 又在腦部表現最多,使得莊樹諄好奇當中的奧秘。然而儘管如今 RNA 定序已經很發達,環狀 RNA 由於結構的關係,一般的 RNA 定序方法無法抓到這類環形分子。莊樹諄指出這也是 Synapse 資料庫的一大優點,此一資料庫罕見地包含能找出環狀 RNA 的 RNA 定序資料,配合 miRNA、mRNA 與基因體等資料交叉分析,才有機會闡明環狀 RNA 的角色。

尋找環狀 RNA 和自閉症的關聯

莊樹諄率領的團隊已經發表 2 篇環狀 RNA 與自閉症的研究論文,第一篇論文著重於尋找哪些環狀 RNA 和自閉症有關,研究假設是環狀 RNA 透過 miRNA 間接影響自閉症風險基因 mRNA 的表現。由於環狀 RNA、miRNA 和 mRNA 都多達數萬個,需要統計分析的幫忙。

-----廣告,請繼續往下閱讀-----

首先,將樣本分為有自閉症/無自閉症。要注意每個自閉症患者的基因表現仍有差異,納入夠多樣本一起比較,才有機會看出端倪。

接著,尋找環狀 RNA 和風險基因有顯著相關的搭配組合。例如:高比例自閉症的人,某個環狀 RNA 含量較高時,某個風險基因的 mRNA 表達量也較高,那這組環狀 RNA 和基因就存在正相關;反之則為負相關。

不過相關性很可能只是巧合,所以莊樹諄團隊比對序列,找到符合上述相關性的中介因子「miRNA」。最後再觀察「當排除 miRNA 影響時,環狀 RNA 與風險基因的顯著關係即消失」的組合,這些消失的組合,就是真正共同參與基因調控的「三人組」(環狀 RNA、miRNA、mRNA)。

一番分析後,篩選出的環狀 RNA 共有 60 個,其中涉及與 miRNA、mRNA 的組合總共 8,170 組。人類一共 2 萬個基因,與自閉症有關的調控網路就有 8,000 組之多,數字相當可觀,顯示環狀 RNA 的重要性。莊樹諄用統計手法找出的自閉症風險基因,和過去科學家已知的部分風險基因相符合,未來可以繼續探究在這 8,000 組調控網路中,有哪幾組是真的作用在生物上。

-----廣告,請繼續往下閱讀-----

在資訊與統計分析之外,莊樹諄的團隊也有人進行分子生物學實驗,驗證 RNA 調控網路的相互影響。以體外培養的人類細胞為材料,人為誘導遺傳突變,精確分析特定環狀 RNA 在細胞內分子層次的作用。實驗證實選取的環狀 RNA,確實會結合 miRNA,又影響 mRNA 的表現。

環狀 RNA 會取消原本 miRNA 抑制 mRNA 轉譯的「煞車功能」,進而影響自閉症風險基因的表現。
圖|研之有物(資料來源|中研院基因體研究中心

基因調控是什麼?

莊樹諄強調,使用資料庫的公開資料,好處是經過多方檢視,避免資料品質不一致的問題,缺點是大家都能取得數據,必須要跳脫既有的思考模式才能發現新的結果。他在環狀 RNA 議題的新思路,成為第二篇論文的內容:探討環狀 RNA 的遠端調控(trans-regulation)對自閉症的影響

基因的表達會受到基因調控元件(regulatory element,一段非編碼 DNA 序列)的影響,若調控元件就在基因附近,稱為近端調控(cis-regulation);如果調控元件不在附近,甚至位於另一條染色體上,則為遠端調控。

研究基因調控,通常近端比遠端調控容易,因為近端調控元件(cis-regulatory element)的位置就在基因旁邊,不難尋找;但遠端調控卻沒那麼直觀,作用機制也比較難以想像。實際上常常能發現一個基因的表現,受到多處近端調控,加上多處遠端調控的影響。如果想全方位認識一個基因的表現與調控,最好能都能得知近端與遠端的影響,否則難以掌握調控的全貌。

-----廣告,請繼續往下閱讀-----

莊樹諄的想法是,某些基因被遠端調控的過程,是否有環狀 RNA 參與?具體說來就是某個調控位置,先近端調控其周圍的環狀 RNA 基因,再藉由環狀 RNA 影響基因體上其他位置的基因表現,發揮遠端調控的效果。

如圖顯示,環狀 RNA 表達數量性狀基因座(circQTL)近端調控了環狀 RNA,遠端調控其他基因。莊樹諄的想法是,某些基因被遠端調控的過程,是否有環狀 RNA 的參與?
圖|研之有物(資料來源|Molecular Psychiatry

為了避免用語誤解,有必要先解釋一下什麼是「基因」。基因的概念隨著生物學發展持續改變,如今一般人熟悉的定義,基因是由 DNA 編碼序列構成,能轉錄出 mRNA,再轉譯為蛋白質的訊息載體。不過若將基因定義為會轉錄出 RNA 的 DNA 序列,那麼即使沒有對應的蛋白質產物,只要其衍生的 RNA 產物有所作用,也能視為「基因」,如 miRNA 基因、mRNA 或長鏈非編碼 RNA 基因。既然是有 DNA 編碼的基因,便會受到近端、遠端調控位置影響。

探索遠端調控機制有很多想法,莊樹諄可以說又打開了一條新思路。遠端調控位置不在基因旁邊,亦即基因體任何地方都有機會。假如直接挑戰基因與遠端調控位置的關聯性,可能相關的數量可謂天文數字,而且缺乏生物性的理由支持,找到的目標往往令人半信半疑。

莊樹諄引進環狀 RNA 涉及其中的可能性,尋找「環狀 RNA 基因的近端調控位置」與「目標基因的遠端調控」之交集,大幅縮小了搜索範圍。

-----廣告,請繼續往下閱讀-----
莊樹諄透過「環狀 RNA 基因的近端調控位置」與「目標基因的遠端調控」之交集,找到環狀 RNA 參與遠端調控的證據。
圖|研之有物(資料來源|莊樹諄

一番分析後,研究團隊從自閉症患者的基因體上,定位出 3,619 個近端調控的 circQTLs,這些表達數量性狀基因座相當特殊,可能藉由直接或間接遠端調控兩種模式來調控遠端基因(如上圖)。而這 3,619 個 circQTLs,與環狀 RNA、遠端基因三者形成了八萬六千多組的遠端調控網路。接著團隊使用了不同的統計方法,其中 8,103 組通過多重統計測試,顯示較高的機率是屬於間接遠端調控模式。

莊樹諄團隊透過統計手法,找到相當多基因和調控路徑,雖然目前仍不清楚它們影響自閉症的具體細節,卻無疑讓我們新增一分對自閉症的認識。

莊樹諄指出,這套統計方法或可應用至人類的其他複雜疾病(如思覺失調症),找出基因調控的多個可能路徑,提供臨床醫藥研發更多線索。

生物與資訊的跨領域結合

訪談中問到:為何會從資訊科學跨入到生物領域?莊樹諄回憶,1998 他博士班畢業那年才第一次聽到「生物資訊」這個詞,他基於對生命科學的興趣,以及因為內在性格想往學術轉型的想法,引領他到了中研院。

-----廣告,請繼續往下閱讀-----

莊樹諄接著說,2003 年李文雄院士延攬他進入基因體研究中心,之前他們不曾認識。他感謝李院士帶他進入了分子演化的世界,就此打開了研究視野。在剛開始成立自己的實驗室時,缺少人力,李院士讓當時的博後陳豐奇博士(現為國衛院群體健康科學研究所研究員兼任副所長)與他共同工作。莊樹諄強調,他所有分子演化的觀念與基礎,都是陳博士幫他建立的,如果說陳博士是他的師父,那李院士就是師父的師父了。

如今,莊樹諄在中研院的研究生涯邁入第 25 年,從資訊學背景投入生物學研究,大量使用統計工具,他經常需要持續整合不同領域的觀念與工具,推動自己的新研究。在訪談中,他也感謝諸多研究同儕的協助,特別是幾年前建立分生實驗室時,蕭宏昇研究員及其團隊成員的鼎力相助。

莊樹諄的團隊包含資訊、統計、分子生物三個領域的同仁,來自不同領域,傾聽他人意見自然也特別重要,這是他們實驗室的核心價值之一。莊樹諄認為在科學面前,人是很渺小的,需要互相尊重和理解,方能一起解開科學之謎。

最後,莊樹諄特別強調他個人在相關領域的研究,仍有極巨大的進步空間,感謝研之有物的主動邀訪,期望將來能與更多先進交流學習,也企盼年輕新血加入這個生物資訊的跨領域團隊。

莊樹諄期望在環狀 RNA 與基因調控網路的研究基礎之上,可以對自閉症這個複雜疾病的調控機制,提供更多科學線索,幫助臨床上的診斷和治療。
圖|研之有物
-----廣告,請繼續往下閱讀-----
研之有物│中央研究院_96
296 篇文章 ・ 3654 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

2
2

文字

分享

0
2
2
長達 5 億年的空白:真核生物從何而來?「洛基」是人類起源的解答嗎?──《纏結的演化樹》
貓頭鷹出版社_96
・2022/08/06 ・2927字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

有細胞核的真核細胞,究竟從何而來?

當渥易斯去世時,還在爭議中的最大謎團之一便是真核細胞的起源,也就是說,我們生命最深處的開端,直至今日仍然沒有定論。

當時真核細胞的起源目前還沒有一個定論,不過可以確定的是,粒線體扮演著相當關鍵的角色。圖 / Pixabay

如果像渥易斯在一九七七年宣布的那樣,存在三個生命領域,其中一個領域是真核生物,包括所有動物、植物、真菌,和所有細胞裡面含有細胞核的微生物,那麼這個最終演化出人類和我們可見的所有其他生物的譜系的基礎故事是什麼?是什麼讓真核生物如此不同?

是什麼讓牠們走上如此不同的道路,從細菌和古菌的微小和相對簡單,走向巨大而複雜的紅杉、藍鯨和白犀牛,更不用說人類和我們對地球的所有特殊貢獻,像是美國職棒、抑揚五步格和葛利果聖歌?哪些部分以及哪些過程組合在一起,形成了第一個真核細胞?

如此重大的事件大概發生在 16 億到 21 億年前之間。這個足足有 5 億年之久的窗口,反映當前科學不確定性的程度。

最關鍵的線索?粒線體與「內共生理論」

不同陣營的意見強烈分歧,都提供了一些假設。

-----廣告,請繼續往下閱讀-----

岩石中早期微生物形式的化石證據,並沒能提供多少解答,科學家還是從基因體序列中發掘出更精確多樣的線索,並且其中一些線索仍然來自 S 核糖體 RNA,這要歸功於渥易斯當初的洞察力,以及後來四十多年間他的追隨者的心血。

但是這些數據的涵義為何則見仁見智。現在所有的專家都同意,當年內共生作用發揮了重要作用:不知何故,某個細菌被另一個細胞(宿主)捕獲並且在體內被馴化,然後成為粒線體

它們一旦存在早期真核細胞中並且數量變多後,就會提供大量能量,遠遠超出當時可用的任何能量,讓這些新細胞可以增加體積與複雜性,進而演化成多細胞生物。

粒線體的構造,成為了生物學家探索原生生物起源的重要線索。圖/Elements Evato

複雜性增加的一個顯著特徵,就是控制,特別是對遺傳材料的控制。

-----廣告,請繼續往下閱讀-----

從生命的起源之地尋找答案——前往深海

更具體地說,這意味著將每個細胞的大部分 DNA 包裝在一個內部胞器中,也就是由膜包圍住的細胞核。

因此,真核生物起源之謎包含三個主要問題:

一,原始宿主細胞是什麼?

二,粒線體的獲取是否觸發了最關鍵的變化?或者,是由它引起的嗎?

-----廣告,請繼續往下閱讀-----

三,細胞核是從何而來的?

更簡化的提問方式則是:一個東西跑到另一個東西裡面,形成複雜之類的東西?這些「東西」到底是什麼?

關於前兩個問題,最近的新證據來自一個意想不到的地點:大西洋底部。它來自於格陵蘭和挪威之間,一個近兩千四百多公尺深的區域所挖掘出的海洋沉積物,這地區附近有一個稱為洛基城堡的深海熱泉。

洛基是北歐神話中既狡猾又會變形的神;挪威主導團隊在發現這個熱泉後取了這個名字,因為這個礦化的噴口看起來就像一座城堡,而且所在位置難以尋找。

為了尋找證據,科學家將目光投向了一般生物無法安然生長的海底熱泉,而科學家也把這個發現洛基古菌的地點命名為「洛基城堡」(Loki’s Castle)。圖 / Youtube

他們與其他科學家一起分析這些海洋沉積物裡面所包含的 DNA,發現這代表了一個全新的古菌譜系,這些細菌的基因體與已知的任何東西都截然不同,似乎代表一個獨特的分類門(門是非常高的分類位階;比方說,所有脊椎動物都同屬於一個門)。

-----廣告,請繼續往下閱讀-----

帶領這項基因體研究的生物學家,是任職於瑞典一所大學的年輕荷蘭人,名叫艾特瑪。他結合深處城堡和狡猾神祇的語義,將這個族群命名為洛基古菌

全新的發現!最接近真核生物的古菌:洛基古菌

艾特瑪團隊於二〇一五年公布這項發現。這項發現具有廣泛報導的價值,因為洛基古菌的基因體,似乎與我們人類譜系起源的宿主細胞非常接近。

實驗室培養出來的洛基古菌在顯微鏡底下的樣貌。圖 / biorxiv

《華盛頓郵報》的一則標題說:「新發現的『失落的環節』顯示人類如何從單細胞生物演化而來。」這些從深海軟泥中提取的古菌,真的是二十億年前那些,自身譜系在經過激烈分化後,變成現代真核生物的古菌的表親嗎?這些古菌是我們最親近的微生物親戚嗎?也許真的是。這一點引起大眾的注意。

但是,使艾特瑪的研究在早期演化專家當中引發爭議的,還有另外兩點。

首先,艾特瑪團隊提出證據,表明洛基古菌等細胞在獲得粒線體之前,就已經開始發展出複雜性。也許是重要的蛋白質、內部結構、可以包圍並吞噬細菌的能力。

-----廣告,請繼續往下閱讀-----

若是如此,那麼偉大的粒線體捕獲事件,就是生命史上最大轉變的結果,或一連串變化其中之一的事件,而不是原因。某些人,例如馬丁,會強烈反對。

雖然科學家發現了洛基古菌,但也引起了許多爭議和討論,真核生物的演化謎團仍然沒有被完全解答。圖 / Pixabay

其次,艾特瑪團隊將真核生物的起源置於古菌中,而不是古菌旁邊。如果這個論點正確的話,便意味著我們又回到一棵兩個分支的生命樹,而兩大分支不管哪一支,都不是我們長久以來珍而重之、視為己有的。

這也就是說,我們人類就是古菌這種獨立生命形式的後代,這在一九七七年之前是無法想像的。(這種情況會產生錯綜複雜的糾葛,牽扯到在我們的譜系開始之前,細菌的基因水平轉移到我們的古菌祖先中,結果導致細菌也混入我們的基因體內,但本質仍然是:喔,我們就是它們!)

某些人,例如佩斯,會強烈反對。渥易斯也不會同意,只是他在世的時間不夠長,無緣被艾特瑪二〇一五年發表在《自然》期刊上的論文激怒。

-----廣告,請繼續往下閱讀-----

六月的一個早晨,在多倫多的一間會議室裡,艾特瑪向一屋子全神貫注的聽眾描述這項研究,其中包括杜立德和幾十名研究人員,還有我。

當我之後與杜立德碰面時,他用一貫的自嘲式幽默說:「我有點被洗腦了。」也是後來,我坐下來與艾特瑪對談。我們談到他當時仍未發表的最新研究,這會把同樣的涵義推得更進一步:粒線體是大轉變的次要因素,人類祖先植根於古菌中,位於兩分支的生命樹上。他很清楚反對的觀點,也清楚自己將會遭遇何等激烈的爭論。

他說:「我真的有在為某些可能迎面撲來的風暴做準備。」

——本文摘自《纏結的演化樹》,2022 年 7 月,貓頭鷹,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
貓頭鷹出版社_96
65 篇文章 ・ 26 位粉絲
貓頭鷹自 1992 年創立,初期以單卷式主題工具書為出版重心,逐步成為各類知識的展演舞台,尤其著力於科學科技、歷史人文與整理台灣物種等非虛構主題。以下分四項簡介:一、引介國際知名經典作品如西蒙.德.波娃《第二性》(法文譯家邱瑞鑾全文翻譯)、達爾文傳世經典《物種源始》、國際科技趨勢大師KK凱文.凱利《科技想要什麼》《必然》與《釋控》、法國史學大師巴森《從黎明到衰頹》、瑞典漢學家林西莉《漢字的故事》等。二、開發優秀中文創作品如腦科學家謝伯讓《大腦簡史》、羅一鈞《心之谷》、張隆志組織新生代未來史家撰寫《跨越世紀的信號》大系、婦運先驅顧燕翎《女性主義經典選讀》、翁佳音暨曹銘宗合著《吃的台灣史》等。三、也售出版權及翻譯稿至全世界。四、同時長期投入資源整理台灣物種,並以圖鑑形式陸續出版,如《台灣原生植物全圖鑑》計八卷九巨冊、《台灣蛇類圖鑑》、《台灣行道樹圖鑑》等,叫好又叫座。冀望讀者在愉悅中閱讀並感受知識的美好是貓頭鷹永續經營的宗旨。