2

6
2

文字

分享

2
6
2

新藥開發遙遙無期?讓 AI 來助你一臂之力——《AI 醫療》

PanSci_96
・2021/01/07 ・2457字 ・閱讀時間約 5 分鐘 ・SR值 573 ・九年級

-----廣告,請繼續往下閱讀-----

  • 作者/Eric Topol,本文摘自《AI 醫療》,旗標出版,2020 年 11 月 20 日

成功辨識並驗證新的候選藥物 (drug candidate),是生物醫學最大、絕對也是最昂貴的挑戰。由於耗資甚鉅,失敗風險也高,因此任何有望減少藥物研發費用或難度的技術,業界都樂於迅速採用。十年前,他們將大量資源投入硬體,採用自動化機器來執行分子的高通量 (high-throughput)1 大規模篩選。現在,他們則將重點轉移到能自動化的演算法上。2018 年時,就已經有超過 60 家的新創公司與 16 家製藥公司使用 AI 進行藥物開發。這些團隊同樣運用了許多 AI 工具來協助這項如同大海撈針的任務,包含搜尋生物醫學文獻、以電腦挖掘數百萬個分子結構、預測脫靶效應與毒性,以及大規模的細胞檢測分析等。而其他能夠更快研發出更多有效分子的方法(自動化分子設計)也正在開發當中。甚至有初步資料顯示,AI 的化學篩檢有望大幅減少臨床前動物試驗 (preclinical animal testing) 的需求。這些公司在運用 AI 時採用的策略差異很大,因此我將簡單扼要地介紹一些案例,讓各位能夠了解 AI 可能帶來的影響(見表 10.1)。

表 10.1:從事 AI 開發藥物的部分公司名單。資料來源:改自 E. Smalley 的 AI-Powered Drug Discovery Captures Pharma Interest,Nat Biotechnol (2017):35(7),604–605.
*註:配體 (ligand) 在生物化學和藥理學中,指一種能與傳導細胞外信號,並在細胞內產生特定效應的分子(也就是受體)結合以產生某種生理效果的物質。

利用自然語言處理擷取生醫文獻和化學物質資料庫中的藥物及分子資訊

首先要介紹的類型是利用自然語言處理,從生物醫學文獻和化學物質資料庫 (chemical database) 中擷取目前所有關於藥物及分子的資訊。這樣做的另一個好處是可以不受既有理論及偏見束縛,以無特定假設的方式分析完所有資料。

小分子的世界,其實就如銀河般地浩瀚,這些小分子的數量遠遠超越了太陽系所有原子數量的總和(圖 10.1),其中具類藥性且可被製備的化合物約有 1060 種。這對 AI 而言,簡直就是完美的發揮空間。因此,目前 Exscientia 公司正在為這些化合物建立完整目錄,而 Epiodyne 公司則已整理出 1 億種尚未製備但易於合成的化合物。不過並不是只有新創公司在做這些工作。加州大學舊金山分校的 Brian Shoichet 便曾主導一個止痛藥物開發計畫,將 300 萬種化合物篩選到僅剩 23 種。德國明斯特大學 (University of Münster) 的有機化學家們則一直在運用深度學習,使化合物的合成更具預測性、更快速與簡便。劍橋大學的夏娃 (Eve) 機器人,具有 AI 資料庫篩選的功能,能夠為一款抗瘧疾藥物找到多種藥效證據。瑞士伯恩大學 (University of Bern) 的 Jean-Louis Reymond 則建構了一個名為 GDB-17 的資料庫,包含了 1,660 億種化合物,呈現出所有由 17 個以下的原子構成,且從化學角度來看是合理的分子。只要利用近鄰分析演算法,便能在短短幾分鐘內篩選過整個資料庫,找出與已知藥物具有相似作用的新分子。不過事實上,Reymond 的資料庫中有許多化合物都難以合成,因此他又將其精選成一份只有 1,000 萬個易於合成的化合物「候選名單」。沒錯,「只有」1,000 萬個而已!

圖 10.1:以對數尺度比較化學物質資料庫與其他度量標準。資料來源:改自 A. Mullard 的The Drug-Maker’s Guide to the Galaxy,Nature (2017):549(7673):445-447

藉由機器學習進行化學反應預測

藉由機器學習進行的化學反應預測也有了一些進展,普林斯頓大學的 Abigail Doyle 與其同事於 2018 年發表的研究就是其中一例。他們讓事情變得好像很簡單:「你只需要描述結構,輸入起始材料、催化劑與鹼基2,軟體就能找出它們之間的相關化學特徵,並輸出化學反應的產率 (yield)。機器學習會將所有的化學特徵與產率配對,目標是做到無論你放入任何結構,它都能告訴你反應的結果!」

-----廣告,請繼續往下閱讀-----

使用對抗式生成網路 (GAN)3 協助開發藥物

英科智能公司 (Insilico Medicine) 目前致力於癌症藥物開發,已從公共資料庫中篩選出超過 7,200 萬種化合物。他們的做法很有創意,使用了一對對抗式生成網路 (GAN)。第一套用來辨識潛在的治療分子 (therapeutic molecule),第二套則刪除那些使用到已有專利化合物的分子。

BenevolentAI 為歐洲最大私人 AI 司之一,他們建立了可篩選生物醫學文獻與化學物質資料庫的自然語言處理。目前為止,在 AI 藥物開發方面令人印象最深刻的論文之一,便是來自 BenevolentAI 的有機化學家 Marwin Segler。他和明斯特大學的同事設計了一套深度學習演算法,可以自行從數百萬個例子當中學習反應的進行方式。該演算法已根據超過 1,200 萬個已知的單步 (single-step) 有機化學反應,製造出了一些有機小分子。研究人員甚至從兩間享有盛譽的研究所請來一群化學家進行雙盲測試,看看是否能夠辨別出 AI 與人類設計的合成反應路徑,結果他們無法分辨。同樣地,格拉斯哥大學 (University of Glasgow) 的 Leroy Cronin 與他的團隊設計了一個有機合成機器人,可利用機器學習搜尋新的化學反應。該機器人每天能夠進行 36 次反應,而化學家每天只能進行 3 到 4 次。除此之外,機器人也進行了一些無法事先預測結果的反應。Derek Lowe 對這樣的進展提出了反思:「當我們談到智能性任務 (intellectual task) 其實可以被歸類為能夠自動化完成的乏味苦差事時,許多化學家可能會覺得受到侮辱,甚至覺得這是一種威脅。但事實上,使用 AI 反而將讓他們有更多的時間去思考更多高層次的問題,像是該合成哪些分子以及為什麼,而不是將重心都擺在該如何製備出分子的方法及細節上!」

註解

  1. 高通量篩選技術 (high-throughput screening) 可以在短時間內對大量候選化合物完成篩選,找出有效的先導藥物 (lead compoud)。以分生或細胞實驗方法為基礎、微孔盤為載體,自動化系統操作、高靈敏快速判讀儀測量實驗數據,最後針對數據分析處理,達到大量快速篩選出有效先導藥物之目的。此技術結合了分子生物學、醫學、藥學、計算科學以及自動化技術等學科知識和先進技術,成為藥物開發的主要方式。
  2. 核鹼基 (Nucleobase) 是指一類含氮鹼基 (nitrogenous base),在生物學上通常簡單地稱為鹼基 (base)。鹼基在 DNA 和 RNA 中負責配對作用。
  3. 關於對抗式生成網路 (GAN),請參考旗標出版之《GAN 對抗式生成網路》一書。
——本文摘自《AI 醫療 DEEP MEDICINE》,旗標出版,2020 年 11 月 20 日
-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
PanSci_96
1261 篇文章 ・ 2388 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

3
0

文字

分享

0
3
0
AI 破解生命密碼!AlphaFold 3 揭開蛋白質折疊的終極謎團
PanSci_96
・2024/10/07 ・1624字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

AlphaFold的誕生:人工智慧的奇蹟

2018 年,Google 旗下的 DeepMind 團隊推出了第一代 AlphaFold,這是一款基於深度學習的 AI 模型,專門用於預測蛋白質的三維結構。AlphaFold 的命名取自「fold」一詞,意為折疊,指的是蛋白質在胺基酸鏈構成後迅速摺疊成其功能所需的三維結構。

AlphaFold 的突破在於其能夠預測出蛋白質折疊的可能性,這是一個傳統計算方法無法達到的領域。第一代 AlphaFold 在國際 CASP 比賽中取得了一定的成功,雖然其預測準確度尚未達到實驗室標準,但其潛力讓科學家們充滿期待。

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

為什麼蛋白質結構預測如此重要?

蛋白質是生命的基石,它們的功能取決於其複雜的三維結構。然而,僅靠實驗技術來解析蛋白質的結構既昂貴又耗時。過去科學家依賴於如 X 光晶體繞射等技術來解析蛋白質的結構,然而這種方法雖然精確,但往往需要數年時間來得出一個結論。

到目前為止,人類已知的蛋白質數據庫中,全球僅解析了大約 22 萬種蛋白質的結構,這遠遠不足以滿足生物學和醫學研究的需求。尤其是人類的許多蛋白質結構仍然未知,這成為阻礙醫學進步的一個主要瓶頸,特別是在藥物開發和疾病治療上,因此如何加速對蛋白質的結構的解析至關重要。

-----廣告,請繼續往下閱讀-----

AlphaFold 2:技術飛躍

2020 年,AlphaFold 2 橫空出世,改進了多項技術,預測準確度大幅,幾乎達到了與實驗結果相媲美的程度。這一成就震驚了全球生物學界,許多科學家開始將 AlphaFold 2 應用於實際研究中。

AlphaFold 2 的成功源自於其三大技術革新:

  • 注意力機制:模仿人類的思維模式,從大局出發,關注蛋白質結構中的每一個細節,進而提高預測的準確性。
  • 多序列比對功能:通過搜尋類似的胺基酸序列,推斷新的蛋白質結構。
  • 端到端預測模式:利用深度學習神經網路,不斷反饋預測結果,持續優化模型。
AlphaFold 2 預測準確度大幅提升。 圖/envato

AlphaFold 3:下一代 AI 的力量

隨著 AlphaFold 2 的成功,DeepMind 並未停止其腳步。2024 年 5 月,AlphaFold 3 正式推出,這標誌著 AI 技術在生物學領域的又一個里程碑。AlphaFold 3 的改進再次吸引了科學界的目光,它強化了注意力機制,並引入了擴散模型,這使其能夠更快且更準確地預測複合蛋白質的結構。

擴散模型是一項關鍵技術,它能夠生成大量的可能蛋白質結構,並快速篩選出最可能的解答。與此同時,AlphaFold 3 還內建了「減幻覺」功能,這讓其在產生結果時能夠避免過多不切實際的預測,提升了結果的可信度。

-----廣告,請繼續往下閱讀-----

AlphaFold 的實際應用:醫學與藥物開發

AlphaFold 3 的誕生,不僅是一個技術突破,還為醫學和藥物開發帶來了巨大的希望。過去,癌症治療中的標靶藥物需要經過漫長的實驗才能確定其作用原理,然而現在,通過 AlphaFold 的預測,科學家可以更加精確地針對癌細胞中的錯誤蛋白質,設計出更有效的藥物。

除此之外,AlphaFold 3 還在抗病毒藥物、抗生素以及阿茲海默症等領域展現了潛力。其能夠預測蛋白質與其他分子(如DNA、RNA)的交互作用,這使得研發新藥的過程大大加速。

AlphaFold 3 的挑戰與未來

儘管 AlphaFold 3 取得了驚人的進展,但其仍然面臨一些挑戰。首先,目前 AlphaFold 3 的模型尚未完全開源,這限制了研究人員對其內部運作的了解。為此,一些科學家已聯名要求 DeepMind 開放其程式碼,以便進行更深入的研究和應用。

不過,隨著 AlphaFold 3的逐步推廣,生物學家相信它將繼續改變生物學研究的方式。未來,這項技術有望在解決更多未解難題中發揮關鍵作用,並為醫學領域帶來更大的突破。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

0

1
0

文字

分享

0
1
0
免費字幕君!怎麼用 AI 語音辨識幫你自動生成字幕?
泛科學院_96
・2024/07/08 ・2458字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

下載 Youtube 影片、自動生成影片逐字稿、AI 智慧翻譯、匯出雙語 SRT 字幕、字幕內嵌 MP4 影片,甚至是把你的電腦當成 AI 運算伺服器、使用多模態 AI 模型來做圖片辨識……這一切的一切通通都免費,敢有可能 (Kám ū khó-lîng)?

今天的影片要來跟你分享開源 AI 套件 Ollama,這個開源套件AJ 最近上課演講工作坊逢人必教。

今天的影片,我們要手把手教你使用 Ollama 在你的電腦裡執行各種免費開源 AI 模型,希望你能跟我一樣成為 AI 暈船仔……Ollama 真香……啊扯遠了,我們沒有點數可以送。

今天的影片會分成三個部分:

-----廣告,請繼續往下閱讀-----
  1. Ollama 安裝與模型下載
  2. 結合 Memo 翻譯影片字幕
  3. 用多模態模型做圖片辨識

Ollama 安裝與模型下載

首先我們要先安裝 Ollama:

來到 ollama.com 點選 Download,下載適合自己的版本後進行安裝,安裝完畢之後,啟動 Ollama。以我的電腦來說右上角就會出現一個小小的 Ollama 圖示,這樣就成功安裝囉!

接著我們需要下載 AI 模型到你的電腦:

回到 Ollama 首頁,點選右上角 Models,這邊就會列出所有官方支援的模型,比如最近很流行的 Meta LLAMA 3、微軟的 Phi3、法國 Mistral AI 公司的 Mistral、Google Gemini 模型的開源版 Gemma 都有,你可以挑選喜歡的來測試。

-----廣告,請繼續往下閱讀-----

比如我點選 LLAMA 3 的連結,模型頁面有兩個地方要注意:一是模型大小,LLAMA3 是 4.7G,一般而言要玩大模型,電腦記憶體至少 16G,預算夠就 24G 不嫌多;如果你是使用一般文書電腦,記憶體 8G 的話,建議你現在馬上停止你的任何動作。我有測試過電腦會直接當機……不要說我沒有提醒你。

點開 Latest 選單可以依照需求選擇不同版本的模型:

不過我們直接點選最右邊複製執行指令,打開電腦的終端機程式,或著命令提示字元,貼上,這樣電腦就會開始下載並且自動安裝囉。

你可以用 ollama list 指令查看現在電腦內有哪些模型,如果硬碟容量有限,用 ollama rm 後面加上模型名稱可以刪除模型。比如:ollama rm llama3。我們這邊另外安裝 llava 模型:ollama run llava,這樣準備工作就完成囉。

-----廣告,請繼續往下閱讀-----

Ollama + memo

最近只要演講上課,我一定會分享 Memo 這套好用的軟體,我們之前也有一支影片分享他的用法。

最近 Memo 更新之後,我們就可以直接使用 Ollama 結合特定的模型來進行字幕的翻譯。舉例來說,我們打開 memo,複製 Youtube 網址;我們用這支 楊立昆 的演講,貼上網址,開始下載,下載完畢後使用電腦進行語音辨識,接著我們就可以使用 Ollama 搭配剛剛準備好的 LLama3 模型來做翻譯!


翻譯完畢之後就可以匯出 SRT 字幕


如果你本身是影片創作者,這招就可以輕鬆製作你的 SRT 字幕,再也不用花時間對字幕時間軸了。

-----廣告,請繼續往下閱讀-----

或者你要把影片字幕直接內嵌在做簡報的時候播放影片:


匯出 MP4 格式,語言選雙語。如果你還沒用過這招處理影片,我強烈建議你一定要試試看!

Ollama + Enchanted

接下來我們要分享另一套非常實用的工具——Enchanted。他也是開源,可以讓原本是文字介面的 Ollama
提供類似 ChatGPT 的對話視窗,甚至支援圖片辨識的多模態模型 llava,Mac 用戶可以直接去 App Store 免費安裝。


同時開啟 Ollama 跟 Enchanted LLM:

-----廣告,請繼續往下閱讀-----


就擁有一個漂亮的視窗介面,可以優雅的啟用各種想要測試的 AI 模型,他甚至有手機版 APP!用手機連線自己的蘋果電腦跑 AI 模型?這……這,真的可以免費用嗎?

讓我來試試看!

首先要先安裝 ngrok 這套程式,選擇自己的作業系統然後下載。Windows 用戶應該直接安裝就可以了,Mac 的用戶在終端機執行這行 Sudo 指令把程式解壓縮到 user local bin 資料夾,接著註冊一個免費的 ngrok 帳號。

複製 ngrok config 指令,貼回自己電腦的終端機,把連線金鑰寫入自己的電腦。

-----廣告,請繼續往下閱讀-----

最後一步,啟動連線,指令是:ngrok http 11434 –host-header=”localhost:11434″

一切順利的話就會看到類似這個畫面。

然後把 forwarding 的網址複製,打開 iPhone 或 iPad 的 Enchanted app,在設定 Setting 裡面把 Ollama 網址貼上,這樣就可以遠端調用電腦的 Ollama 來使用 AI 模型,比如選用稍早下載的 LLava 多模態模型。

傳一張照片,問它這是什麼?

-----廣告,請繼續往下閱讀-----


是不是非常神奇呢?
快練習把 ollama、ngrok 跟 Enchanted 串起來跟朋友炫耀吧!

總結

今天的影片跟各位分享了基於 Ollama 這個開源 AI 套件的各種有趣應用,你是否有成功在 iphone 上打造自己的 AI 服務呢?

  1. 太複雜了我決定躺平
  2. 笑話,我可是尊榮的 GPT Plus 用戶
  3. 沒有 Mac 電腦不能玩……嗚嗚嗚
  4. 你怎麼不介紹那個 ooxx Ollama 套件

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 52 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

0
0

文字

分享

0
0
0
Claude、ChatGPT 提示詞優化!4 個技巧讓 AI 更懂你的需求!
泛科學院_96
・2024/07/06 ・713字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

聽說 Office 365 Copilot 終於支援中文了!

我還不馬上拿出魔術小卡——加入會員,訂閱,開啟小鈴鐺,啊不是我是說,訂閱 Copilot……

嗯?20 美金?嗯?這沒有 Office 365 Copilot 啊?我找找……

靠,現在訂閱 Office 365 Copilot,最便宜要用商務標準版才能加購,而且加購只能一次買一年,要一萬一……我們本來都準備好各種有趣的測試了,但這錢我真的花不下去阿……那今天準備好的測試該怎麼辦呢?

-----廣告,請繼續往下閱讀-----

別擔心,今天的影片,我來回答三個問題:

  1. 如果 copilot 真的開放,我想像中會遇到什麼問題
    抱歉了,一萬一真的刷不下去……
  2. 用 GPT4 示範大語言模型的進階提示技巧,應用於文稿撰寫的方法
    畢竟 copilot 也是借鑑 GPT4,性能應該差不多啦!(屁啦)
  3. 這些技巧在其他語言模型也可以用嗎?

本集的「進階 AI 提示語」有沒有打開你的 AI 使用靈感呢?

  1. 太複雜了我決定躺平
  2. 炫技,等 GPT-5 出來這些都不再重要
  3. 我決定仿效泛科學院精神鑽研出神級提示語跟大家分享
  4. 其他也可以留言分享喔

欸嘿,前面提到的 QR code 在這邊 ^.< 不要告訴別人喔(噓)


如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

-----廣告,請繼續往下閱讀-----

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 52 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!