- 本文與台大新興科技媒體中心、中央研究院生物醫學科學研究所研究員黃明經和國立臺灣大學生物機電工程學系教授陳倩瑜合作,文章由泛科學編輯 A 改寫。
- 專家回應在此:「AI 可以解決蛋白質結構預測的難題」之專家意見
為什麼要分析蛋白質結構?原來是為了預測功能!
19 世紀末,赫爾曼.埃米爾.費歇爾(Hermann Emil Fischer,1902 年諾貝爾化學獎得主)提出「蛋白質的立體結構(三級結構)決定其功能」後,人們開始從結構的角度去分析蛋白質功能,也發展了一系列分析蛋白質結構的方法,像是 X 光晶格繞射或是低溫電子顯微鏡。
在 20 世紀中期,克里斯蒂安.伯默爾.安芬森(Christian Boehmer Anfinsen,1972 年諾貝爾化學獎得主)透過改變蛋白質所在的環境,讓蛋白質的立體結構攤開成簡單結構(一級結構),他發現這些簡單結構在環境回到原本狀態時,會立刻摺疊成原本的立體結構,經反覆實驗,發現同一個簡單結構只會摺疊成一種立體結構,因此他推論:「蛋白質的簡單結構決定其立體結構」。
克里斯蒂安的發現,指出了一條新的研究方式,只要有一條簡單的胺基酸序列,就能夠預測最終蛋白質的立體結構,並得知該蛋白質具有的功能。
各路好手匯集一堂,由 AI 突破預測困難!
克里斯蒂安的想法聽起來很簡單,但其實非常困難。我們對於簡單的一級結構如何摺疊成立體三級結構的機制,並沒有全面性的了解,只能透過某些已知三級結構的一級結構,或是物理的分子動力學,去推測新的一級結構最終會長成什麼樣的三級結構。
因此,從 1994 年開始,舉辦「蛋白質結構預測技術的關鍵測試」(Critical Assessment of protein Structure Prediction,CASP)大賽,全世界的蛋白質結構分析好手,帶著他們對於摺疊機制的獨特見解,透過一級結構來預測三級結構。
而今年的 CASP 競賽中出現了 AI 挑戰者,是由圍棋軟體 AlphaGo 的人工智慧實驗室「DeepMind」開發的「AlphaFold」,AlphaFold 經過資料庫中 17 萬種已知蛋白質結構和 6 千萬筆胺基酸序列訓練,成功預測三分之二的三級結構,是今年 CASP 中有最高準確率的挑戰者!
AI 崛起,科學家要失業了嗎?
每次有 AI 新聞,大家就會提到 AI 取代人類,那 AlphaFold 會取代科學家嗎?
並不會,中央研究院生物醫學科學研究所研究員黃明經表示,AlphaFold 是不能回答「摺疊機制」的問題,其模擬出的折疊過程,也與實際狀況有落差。國立臺灣大學生物機電工程學系教授陳倩瑜則提到這次在大會上取得優良成績的 AlphaFold,是改良過的「AlphaFold2」,目前還不清楚 AlphaFold2 所使用的方法細節,但如果如果承襲之前 AlphaFold 的策略,會先蒐集目標蛋白質(target protein)的相似序列來進行多序列排列(multiple sequence alignment),進而得到兩個胺基酸的共演化(coevolution)1資訊來推估彼此在空間上的距離,這套方法會在目標蛋白質沒有太多相似序列時,對預測準確度造成影響。
此外,黃明經說:「 AlphaFold 學習的蛋白質結構資料庫,是從已知蛋白質結構的資料庫中學習預測,但是資料庫中的資料大多是單一個蛋白質,多個蛋白質或複合體的資料較少。因為複合體中的蛋白質會受到其他蛋白質作用力的拉扯而修飾原本結構,因此目前 AI 雖然可以預測單一蛋白質結構,但可能仍無法精準預測較複雜的蛋白質複合體。」
而且,預測蛋白質結構是為了預測蛋白質功能,在預測蛋白質功能上,AlphaFold 可能力不從心,黃明經表示目前還必須仰賴科學家整合不同的系統生物資訊學資料,AI 才可能做出正確的功能預測。
科技與人相輔相成,共築理想研究圖像
AlphaFold 所提供的數據,除了能幫助科學家更快速找到三級結構,也可能會幫助科學家找到新的關鍵數據,成為蛋白質摺疊機制的突破口。而 AlphaFold 也能透過科學家的回饋,或接受更多實驗驗證過的結構資料(X光晶格繞射、低溫電子顯微鏡),達到更精準預測的目的。
黃明經認為目前 AlphaFold 所呈現的 AI 精準預測蛋白質結構的技術,可以應用在藥物篩選及研發。由於篩選藥物的重要關鍵之一是看蛋白質與其他作用分子的結合位點和結合方式,AI 預測出蛋白質結構後可以協助研究人員篩選、設計和修改藥物分子,獲得理想藥效。台灣目前也有團隊在研究藥物篩選及研發,期待 AlphaFold 的技術對此有幫助。
陳倩瑜也期待 AlphaFold 未來能進一步挑戰更多重要的計算問題,例如:蛋白質和小分子的嵌合,或是預測胺基酸突變對蛋白質結構與功能的影響,這將對藥物篩選、人類遺傳疾病研究、癌症研究與用藥預測等應用,產生劇烈且莫大的影響。
註解
- 此文中提到的共演化,指的是胺基酸之間因為在三維空間的交互作用,雙方產生相對應改變的演化過程。
參考文獻
- RCSB PDB: Homepage
- Home – Prediction Center
- 亂中有序的蛋白質
- 一窺生物分子私底下在幹嘛!低溫電子顯微技術原子等級突破 – PanSci 泛科學
- 「AI可以解決蛋白質結構預測的難題」之專家意見 – 新興媒體中心
- 蛋白質摺疊 – 維基百科,自由的百科全書