- 作者/Eric Topol,本文摘自《AI 醫療》,旗標出版,2020 年 11 月 20 日
利用演算法搭配顯微鏡影像進行高通量藥物測試
影像處理公司 Recursion Pharmaceuticals 利用演算法及自動顯微鏡,針對細胞和細胞核的尺寸與形狀等極詳細的特徵,進行人體細胞的高通量藥物測試。他們建立了超過 2,000 個分子的模型,來觀察其中有哪些可以將基因疾病模型的病態細胞轉變成看起來較健康的細胞。該公司已利用這種策略辨識出至少 15 種新的潛在治療方式,其中一種針對腦部海綿狀血管畸形 (cerebral cavernous malformation) 的治療方法已進入臨床試驗階段。
Deep Genomics 則從名稱即可看出端倪,是一間針對基因體錨定 (anchoring) 方法進行深度學習的公司。這個位於多倫多、由 Brendan Frey 主導的團隊,曾於 2014 年就人類剪接密碼 (splicing code)1 發表了一篇令人印象深刻的論文,為泛自閉症障礙2和脊髓性肌肉萎縮症 (spinal muscular atrophy)3 等疾病的病患提供了數千種潛在標的 (target)4。
自動化藥物開發過程目標是:縮減找出潛在藥物標的到研發出候選藥物的時間
Atomwise 公司利用深度學習演算法篩選了數百萬個分子以發展藥物開發計畫,至 2017 年底為止,已成立超過 27 個計畫,治療範圍包含伊波拉病毒感染 (Ebola)5 與多發性硬化症 (multiple sclerosis)6 等疾病。該公司的神經網路也藉由搭配 3D 模型,提出了一份包含 72 種最有可能與特定疾病在分子層面發生良好交互作用的藥物列表。瑞士聯邦理工學院 (Swiss Federal Institutes of Technology) 的 Gisbert Schneider 指出:「自動化藥物開發的概念可協助大幅減少藥物化學 (medicinal chemistry) 計畫所需測試的化合物數量,同時為調適性分子設計 (adaptive molecular design) 建立一個理性、無偏見的基礎。」
這些新方法也推動了一些新的公私合夥關係 (private-public partnership)。「加速藥物醫療機會聯盟」(Accelerating Therapeutics for Opportunities in Medicine) 為其中之一,簡稱 ATOM。此聯盟集合了數個學術中心,如杜克大學、杜蘭大學,與 Merck、Abbvie 及 Monsanto 等製藥公司共同開發、測試與驗證跨領域的癌症藥物開發方式,將現代科學、科技與工程學、超級計算 (supercomputing) 模擬、資料科學與 AI 高度整合至一個藥物開發平台,希望最終可與整個藥物研發社群共享。ATOM 的目標是縮減從辨識出潛在藥物標的(drug target,藥物作用的目標)到研發出可擊中標的之候選藥物所需的時間。這段過程通常最快也需要 4 年,ATOM 希望能夠壓低至 1 年。Project Survival 是一個由 BERG Health 資助的公私聯營單位 (public-private consortium),他們收集了癌症病患的生物樣本 (biological sample),並在一項為期 7 年的計畫中,仔細分析檢測與每位病患臨床資訊息息相關的整合資料,以促進生物標記探索開發 (biomarker discovery) 與早期發現。
預測實驗性藥物 (experimental drug) 的正確劑量
AI 在此領域的用途不只有藥物開發,還可預測實驗性藥物 (experimental drug) 的正確劑量。由於最佳藥物劑量可能取決於每個個體身上的許多變數,如年齡、性別、體重、基因體 (genetics)、蛋白質體學及腸道微生物體等,因此是建立模型與使用深度學習演算法的理想題材。不過藥物之間產生交互作用的可能性,也提高了確定正確劑量的困難度。目前已有多間學術中心採取這種預測方式,包括加州大學洛杉磯分校、史丹佛大學、加州大學舊金山分校、維吉尼亞理工大學 (Virginia Tech) 和堪薩斯大學 (University of Kansas)。正如維吉尼亞理工大學的 Josep Bassaganya-Riera 所言:「每個人都會有一套自己的參數集,但與其分析每一項特徵,我們更應該了解的是由各項特徵混合而成的獨特組合所代表的意義。而機器學習能夠幫助我們做到這一點。」
目前的確有許多針對 AI 與藥物開發的炒作,如「AI 成為救星!可望於阿茲海默症的藥物開發有所突破」等新聞。或是類似 BenevolentAI 之前的宣稱:「可以將藥物研發時程縮短 4 年,並將效率提升至高出製藥業界平均的 60%」。但唯有時間才能證明,這些致力於加速藥物開發的各種方法,是否真的能夠實現。
註解
- 剪接(splicing,又稱拼接),是一種基因重組現象。在分子生物學中,主要是指細胞核內基因資訊在轉錄過程中或是在轉錄過後的一種修飾。
- 泛自閉症障礙 (Autism Spectrum Disorder, ASD) 指兒童早期即出現社會互動、溝通表達的困難,對某些事物有強烈的執著性、要求同一性等現象。再依兒童語言能力,從完全無法用口語表達到流利的語言,區分成輕、中、重度障礙。
- 脊髓性肌肉萎縮症 (spinal muscular atrophy, SMA) 屬於體染色體隱性遺傳疾病,因 SMN 基因缺失而造成脊髓的前角運動神經元漸進性退化,使得肌肉逐漸軟弱無力、萎縮的一種疾病,但不影響智力。
- 藥物標的為藥物作用的目標,例如找出最可能導致疾病的蛋白質。
- 伊波拉病毒感染 (Ebola) 為伊波拉病毒所引起的嚴重急性疾病,其初期症狀為突然出現高燒、嚴重倦怠、肌肉痛、頭痛等,接著出現嘔吐、腹瀉、腹痛、皮膚斑點狀丘疹與出血現象。重症者常伴有肝臟受損、腎衰竭、中樞神經損傷、休克併發多重器官衰竭。
- 多發性硬化症 (multiple sclerosis,MS) 發病原因不明,病灶位於腦部和脊髓,是常見的中樞神經系統非外傷性疾病。正常的中樞神經纖維表面覆蓋了一層神經髓鞘,具有神經傳遞和保護神經纖維的作用。如果人體自身免疫系統攻擊和破壞髓鞘就會導致多發性硬化症的發生。在自身免疫反應引起的炎症停止後,無數受到破壞的神經纖維所形成的疤痕,稱為「硬化」。