0

1
0

文字

分享

0
1
0

藥物設計開外掛!深度學習如何應用在新藥開發?

研之有物│中央研究院_96
・2018/08/28 ・4913字 ・閱讀時間約 10 分鐘 ・SR值 561 ・九年級

  • 採訪編輯|柯旂 美術編輯|張語辰

當藥物設計碰上電腦運算──節省成本又降低風險

中研院應用科學研究中心、生物醫學科學研究所合聘的林榮信研究員,同時也是台大醫學院藥學系與長庚大學工學院的合聘教授,與團隊以分子動力學、統計物理、結構生物等學問為法,藉由電腦的高速運算能力,模擬藥物分子如何與體內的標靶分子作用。此舉不但能縮減藥物研發的時間及成本,也有助了解藥物在人體中的生化反應,降低藥害風險。

每種藥物,都是得來不易的基礎研究與後續研發成果。有些要十年、有些要等二十年、有些直到現在還在等。圖片來源/iStock

現代的藥物研發流程,可簡要地敘述為以下步驟:1. 先透過大規模基因體學、與蛋白質體學實驗,找到可成為藥物的分子及治療標靶 → 2. 解出其分子結構 → 3. 依此分子結構來設計合成藥物化合物。雖然這過程幾行字就打完,但不僅需要生物醫學、藥理學、生物化學、藥物化學等跨領域團隊投入研究,也耗費超乎想像的金錢與時間。 一種藥物,從實驗室研發、臨床試驗、爾後上市的時程十分漫長,政府與科學家們皆在思考如何加速此流程,減少研發資源的錯置,並協助更多民眾緩於苦痛。

我們使用的藥物之所以有藥效,是因為藥物分子與體內的標靶分子(大多是蛋白質),產生交互作用所致。

以往主要是透過生物化學實驗、或生物物理實驗來了解此交互作用,但是這些實驗方式,並不能提供「藥物分子」與其作用的「標靶生物分子」之間作用的動態關係,而且大部分的實驗方法,無法提供原子尺度的資訊,因此對藥物設計的直接用處有限。要知道,許多藥物分子只要差了一個原子,其藥效就有可能截然不同。此外,這些藥物開發需要的實驗所費不貲,一個錯誤的決策,便會導致研究進度的推遲與研究資源的耗損。 有鑑於此,林榮信團隊的著眼點為:如果能夠在藥物研發初期,先利用電腦模擬藥物開發所選定的「標靶分子」,來快速篩選出有機會的「候選藥物分子」,高精度計算兩者相遇後會如何作用與運動,就能很大程度地協助實驗團隊少走冤枉路,減少藥物開發失敗耗損的人力、物力與光陰。 要達到這個目標,不僅有賴電腦逐年進步的高速運算能力,以及計算物理、化學界對計算方法的精進,也有賴科學家對於生物分子結構的了解。

本文專訪林榮信,從物理出身,跨足計算機科學與分子動力學,現將專業運用於藥物設計。攝影/張語辰

藥物設計核心概念:蛋白質結構會隨時間改變

Q:藥物設計,最重要的觀念是?

藥物設計不能只停留在「結構」層次,也需把蛋白質的「動態」考慮進去。

要模擬藥物在原子、分子層次的藥理作用反應,需先得到會和藥物分子作用的體內蛋白質分子、或其他生物分子的結構。 雖然有蛋白質結構資料庫 (Protein Data Bank) 提供了許多利用 X-ray 結晶學、核磁共振學、低溫電子顯微術所決定出來的高解析度分子結構,但該資料庫裡的分子結構實質上仍只是模型。舉例來說,不可能分子裡面每個原子的 X, Y, Z 位置都真的固定在那裡,我們知道一般實驗條件中,蛋白質是相當動態的。因此,這需要有結構生物學的知識,來理解蛋白質結構資料庫中「分子結構」的真實意義。

-----廣告,請繼續往下閱讀-----
諾貝爾獎得主克里克 (Francis Crick, 1916~2004) 有一句名言:「如果你要了解功能,你要研究結構」。這邊所謂的功能,是指生物分子的功能。圖片來源/Wikipedia 。資料來源/〈挑戰神奇子彈—高效能計算與藥物設計〉,作者:林榮信

我們做藥物設計,相當需要和結構生物學的團隊合作。我們以分子動力學 (molecular dynamics) 模擬出來的蛋白質動態資訊,需要透過進階的生物物理實驗,間接驗證所得到的動態訊息,例如:帶有時間解析度的 X 射線晶體學、甚至是自由電子雷射。不過,這些實驗技術雖持續有進展,仍然進展得十分緩慢。 學術研究有趣的現象是,學術界像個很大的生態環境,有些人會進來、有些人會出去;進來的時間點不同,看到的世界也很不同;而每個人獲得與提供的資訊都不太一樣,每次進來的人都會留下不同程度的進展。像這樣逐步推進,從歷史來看,通常要用二、三十年或以上的時間尺度,才比較看得出很突破性的研究進步。

用深度學習預測藥物和標靶分子反應活躍度

Q:目前實驗室的研究方向?

藥物分子如何與體內的生物分子結合、交互作用,是我們研究的核心主題。

例如,若要開發天然物 (Natural product) 製成現代西方醫學的藥物,過往要從古籍或文獻去看某種草藥或複方有什麼可能的活性,接著萃取、純化出有效化合物之後,要再透過生化實驗測試其生物活性,這是一個很漫長的測試過程,期間也需要很多的推測。 這幾年來,我們發展出計算藥物分子和不同蛋白質系統反應的程式,並建構成 idTarget 「藥物標靶預測平台」,開放給大家運用,方便其他研究人員探索藥物可能的作用標靶。 我們的想法是,要多多重視、運用結構生物學近二十年的大量結構資料,配合藥物分子和蛋白質結合的自由能計算,先找出藥物分子和那些蛋白質較有可能作用。我們知道,化學上一個反應會不會發生、或多容易發生,可以由自由能來預測。因此,生物系統上快速、準確的自由能計算,一直是我們實驗室的核心基礎課題。我們最近也運用深度學習,來開發自由能計算的方法。

林榮信團隊建立的「藥物標靶預測平台」 idTarget ,只要上傳藥物分子結構圖,便能預測蛋白質資料庫 (Protein Data Bank) 其中可能結合的標靶蛋白質分子。資料來源/idTarget

我們實驗室另一個重點,是將傳統常見的藥材以科學方法再研究,這也是目前醫藥研究的重要方向之一。 例如,本草綱目記載「天麻」具有安神與鎮定的效果,而現職中國醫藥大學的林雲蓮教授團隊發現,天麻中有個叫作 T1-11 的新的分子,與過去較熟知的天麻素有很不同的作用;另一方面,中研院生物醫學研究所的陳儀莊博士團隊則發現, T1-11 分子能用於治療亨丁頓舞蹈症。基於這些研究發現,我們實驗室透過電腦設計適合的藥物分子,並由台大化學系的方俊民教授團隊將藥物合成出來。這就是一種新藥開發的跨領域合作方式。

不受限於科系,從高中點滴為未來鋪路

Q:您以前讀物理,怎麼會跨領域至藥物設計?

我想要研究藥物設計,不是某天靈機一動決定的,而是做研究的路上漸漸地朝這方向發展。 一開始,也就是讀台大物理系時,某次導生聚會中,那時的導師陳永芳教授對我們說:「21 世紀的物理,應該是生物物理 (Biophysics) 」,那次以後我心中就一直有個想法,覺得日後研究「生物物理」會是個不錯的方向。 後來,大三時開始發現統計力學 (Statistical mechanics) 是很有意思的領域,因為這門學問關注如何理解所謂的複雜系統。很多物理是關注比較單一的系統,例如原子鑽進去有夸克;但有另一個物理研究方向,是去看如何處理很大、很複雜的問題。現在我研究藥物設計,也是關注體內的生物分子和藥物分子之間,整個系統如何產生複雜的反應。 時間點再往前一點回顧,我在建中時很幸運地得以參加第一屆的「北區高中理化學習成就優異學生輔導實驗計畫」,每兩個禮拜的週末,要從台北坐車去清華大學受訓一整天。當時由清華大學物理系、化學系的各六位老師(包含:李怡嚴、陳信雄、王建民、古煥球、劉遠中、張昭鼎、儲三陽等教授),教我們很多不是高中課本裡的知識。比較早接觸這些大學才能學到的物理和化學,我們就能提早思考將來有興趣的是什麼,因為那時候高中還沒分系,沒有框架綁住自己,這算是蠻難得的人生經驗。

-----廣告,請繼續往下閱讀-----

不同的課程,會提供不一樣的世界,如果沒有接觸,就不會知道有那種思考的存在。

但是,我第一次在研究上真的從事「生物物理」相關的題目,已經是 1996 年到德國于利希研究院 (Forschungszentrum Jülich) 讀博士班的時候了。在這之前,我在台大物理碩士班的研究領域是計算物理 (Computational physics);到了德國,我的指導教授 Artur Baumgaertner 原本是研究高分子物理,其博士後的指導教授是著名的 Prof. Flory,他那時已經跨足在生物物理做了十年左右的研究,問我對生物物理有沒有興趣?我一聽也覺得不錯,便一頭栽進去了。那時研究的題目,是探討像蜂毒蛋白這樣的多胜肽大分子,究竟是透過什麼物理機制穿過細胞膜這樣的屏蔽。 德國的于利希研究院 (Forschungszentrum Jülich) 的型態很像中研院,由三十幾個不同的研究所組成,擁有超過 5000 位研究員,在廣大的校園內,走幾步就到另一個所,非常容易做跨領域合作。這裡在當時有全歐洲最大的超級電腦中心,因此對我的研究非常有幫助。我 2007 年回去訪問,他們剛添置了 72 座 IBM 剛推出的 Blue Gene P,因此我與同事在這新建置的機房留影。

于利希研究院的超級電腦中心。圖片來源/林榮信提供

2000 年博士畢業後,我在美國加州大學聖地牙哥分校的霍華休斯醫學研究所工作,2001 年初,有天指導教授 J. Andrew McCammon 發了一封郵件到實驗室群組,問:「我有個新的藥物計算方法的初步構想,有沒有人想開發這個方法?」之前我就希望我的研究成果能有較大的產業價值,因此很快就回應,而我也成為這個方法開發的小組領導人。 當時的藥物計算程式,剛得到一個很大的進展,但仍只考慮蛋白質等生物分子為一個靜態的結構。我們在那時首度將「藥物設計」的計算與「分子動力學」結合,這剛好是我德國博士班時的專業,我又剛好具備許多寫程式及平行計算的經驗,就將所需要的不同計算工具整合在一起。

 無所畏懼擁抱跨領域新知,藥物設計一點也不難

Q:「藥物設計」很難學嗎?

我發現其實現在學生們學習速度非常快,一旦他決定想進到這個領域,便會盡其所能去學,只是目前國內還沒有適當的藥物設計課程,提供完整的訓練。 因此,2018 年 3 月我們在中研院舉辦了「計算藥物設計方法與應用的前沿進展」工作坊,除了回顧藥物設計的重要文獻,介紹藥物設計的程式工具,也選了一些藥物分子與其作用的蛋白質分子讓學生們上機演練,了解其中的計算細節、眉眉角角。 如果對這領域有興趣,千萬不要認為看起來很難,想等到研究所再來了解。其實越早學習、並習慣接觸跨領域的學科,絕對是事半功倍。 延伸閱讀:

本著作由研之有物製作,原文為《高效能計算藥物設計:更精準的新藥開發》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

在網站上看不過癮?研之有物出書啦! 《研之有物:穿越古今!中研院的25堂人文公開課》等著你來認識更多中研院精彩的研究。

文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3568 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

1
0

文字

分享

0
1
0
免費字幕君!怎麼用 AI 語音辨識幫你自動生成字幕?
泛科學院_96
・2024/07/08 ・2458字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

下載 Youtube 影片、自動生成影片逐字稿、AI 智慧翻譯、匯出雙語 SRT 字幕、字幕內嵌 MP4 影片,甚至是把你的電腦當成 AI 運算伺服器、使用多模態 AI 模型來做圖片辨識……這一切的一切通通都免費,敢有可能 (Kám ū khó-lîng)?

今天的影片要來跟你分享開源 AI 套件 Ollama,這個開源套件AJ 最近上課演講工作坊逢人必教。

今天的影片,我們要手把手教你使用 Ollama 在你的電腦裡執行各種免費開源 AI 模型,希望你能跟我一樣成為 AI 暈船仔……Ollama 真香……啊扯遠了,我們沒有點數可以送。

今天的影片會分成三個部分:

-----廣告,請繼續往下閱讀-----
  1. Ollama 安裝與模型下載
  2. 結合 Memo 翻譯影片字幕
  3. 用多模態模型做圖片辨識

Ollama 安裝與模型下載

首先我們要先安裝 Ollama:

來到 ollama.com 點選 Download,下載適合自己的版本後進行安裝,安裝完畢之後,啟動 Ollama。以我的電腦來說右上角就會出現一個小小的 Ollama 圖示,這樣就成功安裝囉!

接著我們需要下載 AI 模型到你的電腦:

回到 Ollama 首頁,點選右上角 Models,這邊就會列出所有官方支援的模型,比如最近很流行的 Meta LLAMA 3、微軟的 Phi3、法國 Mistral AI 公司的 Mistral、Google Gemini 模型的開源版 Gemma 都有,你可以挑選喜歡的來測試。

-----廣告,請繼續往下閱讀-----

比如我點選 LLAMA 3 的連結,模型頁面有兩個地方要注意:一是模型大小,LLAMA3 是 4.7G,一般而言要玩大模型,電腦記憶體至少 16G,預算夠就 24G 不嫌多;如果你是使用一般文書電腦,記憶體 8G 的話,建議你現在馬上停止你的任何動作。我有測試過電腦會直接當機……不要說我沒有提醒你。

點開 Latest 選單可以依照需求選擇不同版本的模型:

不過我們直接點選最右邊複製執行指令,打開電腦的終端機程式,或著命令提示字元,貼上,這樣電腦就會開始下載並且自動安裝囉。

你可以用 ollama list 指令查看現在電腦內有哪些模型,如果硬碟容量有限,用 ollama rm 後面加上模型名稱可以刪除模型。比如:ollama rm llama3。我們這邊另外安裝 llava 模型:ollama run llava,這樣準備工作就完成囉。

-----廣告,請繼續往下閱讀-----

Ollama + memo

最近只要演講上課,我一定會分享 Memo 這套好用的軟體,我們之前也有一支影片分享他的用法。

最近 Memo 更新之後,我們就可以直接使用 Ollama 結合特定的模型來進行字幕的翻譯。舉例來說,我們打開 memo,複製 Youtube 網址;我們用這支 楊立昆 的演講,貼上網址,開始下載,下載完畢後使用電腦進行語音辨識,接著我們就可以使用 Ollama 搭配剛剛準備好的 LLama3 模型來做翻譯!


翻譯完畢之後就可以匯出 SRT 字幕


如果你本身是影片創作者,這招就可以輕鬆製作你的 SRT 字幕,再也不用花時間對字幕時間軸了。

-----廣告,請繼續往下閱讀-----

或者你要把影片字幕直接內嵌在做簡報的時候播放影片:


匯出 MP4 格式,語言選雙語。如果你還沒用過這招處理影片,我強烈建議你一定要試試看!

Ollama + Enchanted

接下來我們要分享另一套非常實用的工具——Enchanted。他也是開源,可以讓原本是文字介面的 Ollama
提供類似 ChatGPT 的對話視窗,甚至支援圖片辨識的多模態模型 llava,Mac 用戶可以直接去 App Store 免費安裝。


同時開啟 Ollama 跟 Enchanted LLM:

-----廣告,請繼續往下閱讀-----


就擁有一個漂亮的視窗介面,可以優雅的啟用各種想要測試的 AI 模型,他甚至有手機版 APP!用手機連線自己的蘋果電腦跑 AI 模型?這……這,真的可以免費用嗎?

讓我來試試看!

首先要先安裝 ngrok 這套程式,選擇自己的作業系統然後下載。Windows 用戶應該直接安裝就可以了,Mac 的用戶在終端機執行這行 Sudo 指令把程式解壓縮到 user local bin 資料夾,接著註冊一個免費的 ngrok 帳號。

複製 ngrok config 指令,貼回自己電腦的終端機,把連線金鑰寫入自己的電腦。

-----廣告,請繼續往下閱讀-----

最後一步,啟動連線,指令是:ngrok http 11434 –host-header=”localhost:11434″

一切順利的話就會看到類似這個畫面。

然後把 forwarding 的網址複製,打開 iPhone 或 iPad 的 Enchanted app,在設定 Setting 裡面把 Ollama 網址貼上,這樣就可以遠端調用電腦的 Ollama 來使用 AI 模型,比如選用稍早下載的 LLava 多模態模型。

傳一張照片,問它這是什麼?

-----廣告,請繼續往下閱讀-----


是不是非常神奇呢?
快練習把 ollama、ngrok 跟 Enchanted 串起來跟朋友炫耀吧!

總結

今天的影片跟各位分享了基於 Ollama 這個開源 AI 套件的各種有趣應用,你是否有成功在 iphone 上打造自己的 AI 服務呢?

  1. 太複雜了我決定躺平
  2. 笑話,我可是尊榮的 GPT Plus 用戶
  3. 沒有 Mac 電腦不能玩……嗚嗚嗚
  4. 你怎麼不介紹那個 ooxx Ollama 套件

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

0
0

文字

分享

0
0
0
Claude、ChatGPT 提示詞優化!4 個技巧讓 AI 更懂你的需求!
泛科學院_96
・2024/07/06 ・713字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

聽說 Office 365 Copilot 終於支援中文了!

我還不馬上拿出魔術小卡——加入會員,訂閱,開啟小鈴鐺,啊不是我是說,訂閱 Copilot……

嗯?20 美金?嗯?這沒有 Office 365 Copilot 啊?我找找……

靠,現在訂閱 Office 365 Copilot,最便宜要用商務標準版才能加購,而且加購只能一次買一年,要一萬一……我們本來都準備好各種有趣的測試了,但這錢我真的花不下去阿……那今天準備好的測試該怎麼辦呢?

-----廣告,請繼續往下閱讀-----

別擔心,今天的影片,我來回答三個問題:

  1. 如果 copilot 真的開放,我想像中會遇到什麼問題
    抱歉了,一萬一真的刷不下去……
  2. 用 GPT4 示範大語言模型的進階提示技巧,應用於文稿撰寫的方法
    畢竟 copilot 也是借鑑 GPT4,性能應該差不多啦!(屁啦)
  3. 這些技巧在其他語言模型也可以用嗎?

本集的「進階 AI 提示語」有沒有打開你的 AI 使用靈感呢?

  1. 太複雜了我決定躺平
  2. 炫技,等 GPT-5 出來這些都不再重要
  3. 我決定仿效泛科學院精神鑽研出神級提示語跟大家分享
  4. 其他也可以留言分享喔

欸嘿,前面提到的 QR code 在這邊 ^.< 不要告訴別人喔(噓)


如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

-----廣告,請繼續往下閱讀-----

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!