Loading [MathJax]/extensions/tex2jax.js

2

20
1

文字

分享

2
20
1

AI 接手譜出的貝多芬遺作《第十號交響曲》,連專業音樂家也「難解難分」!

Peggy Sha/沙珮琦
・2021/11/03 ・2214字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

在古典音樂界裡,流傳著這麼一個傳說:作曲家在寫完第九號交響曲之後,生命也就到了盡頭。而貝多芬(Ludwig von Beethoven)便是這個詛咒最著名的「受害者」之一。

著名作曲家貝多芬。圖/維基百科

1817 年,英國皇家愛樂協會(Royal Philharmonic Society)請貝多芬創作了兩首交響曲,這第一首呢,便是《第九號交響曲》(Symphony No.9 in D minor, Op.125),完工後成為了經典不朽的代表作,把《歡樂頌》快樂直送到世界各地的人們耳中。

然而,可惜的是,在開始著手《第十號交響曲》(Beethoven Symphony No.10)後不久,貝多芬的健康便迅速惡化,最終在 1827 年離開了世界,而這第十號交響曲,除了幾個音符加上各式各樣的筆記之外,就啥也沒有了,從此成為了樂迷們心中的遺憾。

人死不能復生,但,大家的好奇心可沒這麼容易被殺死。最近,一個專門推廣音樂科技的奧地利機構,卡拉揚研究所(Karajan Institute)便集結了一群音樂學家、作曲家、AI 科學家、歷史學家,嘗試從手稿裡找到蛛絲馬跡,並藉由 AI 的力量,將貝多芬的遺作帶給世界,為他慶祝 250 歲生日。

-----廣告,請繼續往下閱讀-----

到底,AI 是怎麼「寫」出這首曲子的?它真能滿足大家的耳朵嗎?

早有人挑戰續寫大師神作!風格不同被罵慘

你或許會想,啊都交給 AI 了,寫個曲應該沒什麼困難的吧?嘿,那你可就太小看貝多芬給大家出的作業了。

1988 年時,一位名叫貝瑞庫珀(Barry Cooper)的音樂學家便曾嘗試挑戰這項任務,他蒐集了貝多芬老大的手稿和各式資料,用自己的理解試圖創作出一個最接近貝多芬風格的第一和第二樂章。

不過呢,這兩個樂章寫完了之後,大家卻是罵聲連連,很多人覺得他根本沒有搞懂貝多芬的風格,只是在狗尾續貂。

-----廣告,請繼續往下閱讀-----

另一方面,所謂「寫得出」曲子跟「寫得好」曲子完全是兩回事,要真正讓 AI 掌握作曲家原本的風格、進而去模仿,需要考量的面向比單純輸入資料難多了。

曾有音樂家挑戰續寫貝多芬的《第十號交響曲》,卻被抨擊為狗尾續貂。圖/Pixabay

發揮偵探精神,分工合作打團戰

曾經失敗沒關係,這次計畫的負責人,卡拉揚研究所的所長 Matthias Röder 可不是吃素的,他的最高原則大概可以八字概括:AI 不夠、人腦來湊

專家們開了幾次小組會議後,基本協調出了這樣的分工:計算音樂學家 Mark Gotham 與 AI 專家 Ahmed Elgammal 要梳理貝多芬的手稿,並將他過去的寫作脈絡通通餵給 AI,讓機器學習他的邏輯與理念;寫出 Intel 鈴聲的奧地利作曲家 Walter Werzowa 負責把貝多芬留下的片段和 AI 生出的旋律給合在一起;音樂學家 Robert Levin 提供專業建議,協助進行優化與調整。

這組合不錯,聽起來會順順完成對吧?錯!

-----廣告,請繼續往下閱讀-----

所謂交響曲呢,通常會由四個樂章組成:第一個樂章開場,節奏稍快;第二個樂章來個轉折,變得較慢;第三樂章會是中板或快板;到了最後一個樂章時,則會以澎湃激昂快節奏結束。

好了那麼問題來了:同樣一段旋律,它出現在第二樂章與第四樂章,會達成完全不同的效果,弄得不好,那差異就像「我要結婚啦!」、「新郎不是我QQ」一樣悲劇。

於是乎,團隊需要判斷:第十號交響曲的主題旋律到底為何?哪個時候可能是新樂章的起點?這種種判斷,都有賴人腦協助決定。

作曲小白,從零開始的譜曲之路

決定好了各個音符或片段出現的位置後,團隊又有新的考驗:要怎麼就既有片段進行擴寫呢?當然不能隨機組合,想要延伸樂句,就必須遵從一些音樂形式,它可能是三拍子、聽起來輕快的詼諧曲;又或許是不同音高旋律和諧融合出的賦格……

-----廣告,請繼續往下閱讀-----

接下來,團隊就開始了漫漫 AI 教學之路,先學會怎麼讓音符組起來和諧、再學怎麼將兩個段落連結、接著要知道怎麼為段落收尾、還要知道怎麼分配各個樂器,總而言之,就是讓 AI 掌握各種基本的作曲規則與技巧,生出的旋律才能符合規範。

小考囉!電腦、人腦,傻傻分不清楚?

經過一段時間的努力後,團隊終於帶著 AI 奔赴「考場」。2019 年 11 月,他們找來了一群記者、音樂學家和專門研究貝多芬的專家作聽眾,並讓鋼琴家演奏 AI 創作的音樂片段,測測聽眾們是否可以確定 AI 開始接手作曲的節點出現在哪裡?結果大家並未成功找出來。

幾天之後,他們又透過弦樂四重奏的方式演奏了 AI 所作的作品片段,結果只有非常熟悉貝多芬手稿的人才能確定人工智慧接手的點究竟在哪裡。

這兩次小考都算是成功通過,讓團隊信心倍增。在接下來的 18 個月中,研究團隊一起編出了兩個完整、各超過 20 分鐘的樂章。

-----廣告,請繼續往下閱讀-----

終於,在 10 月 9 日,研究團隊帶著 AI 創作的作品回到了貝多芬的出生地德國波昂(Bonn)進行了全球首演,至於這首曲子聽起來到底夠不夠「貝多芬」呢?就交給你判斷吧:Beethoven X: The AI Project

  1. https://www.classicfm.com/composers/beethoven/news/computer-completes-unfinished-tenth-symphony/
  2. https://theconversation.com/how-a-team-of-musicologists-and-computer-scientists-completed-beethovens-unfinished-10th-symphony-168160
-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
Peggy Sha/沙珮琦
69 篇文章 ・ 390 位粉絲
曾經是泛科的 S 編,來自可愛的教育系,是一位正努力成為科青的女子,永遠都想要知道更多新的事情,好奇心怎樣都不嫌多。

0

0
0

文字

分享

0
0
0
從PD-L1到CD47:癌症免疫療法進入3.5代時代
鳥苷三磷酸 (PanSci Promo)_96
・2025/07/25 ・4544字 ・閱讀時間約 9 分鐘

-----廣告,請繼續往下閱讀-----

本文與 TRPMA 台灣研發型生技新藥發展協會合作,泛科學企劃執行

如果把癌細胞比喻成身體裡的頭號通緝犯,那誰來負責逮捕?

許多人第一時間想到的,可能是化療、放療這些外來的「賞金獵人」。但其實,我們體內早就駐紮著一支最強的警察部隊「免疫系統」。

既然「免疫系統」的警力這麼堅強,為什麼癌症還是屢屢得逞?關鍵就在於:癌細胞是偽裝高手。有的會偽造「良民證」,騙過免疫系統的菁英部隊;更厲害的,甚至能直接掛上「免查通行證」,讓負責巡邏的免疫細胞直接視而不見,大搖大擺地溜過。

-----廣告,請繼續往下閱讀-----

過去,免疫檢查點抑制劑的問世,為癌症治療帶來突破性的進展,成功撕下癌細胞的偽裝,也讓不少患者重燃希望。不過,目前在某些癌症中,反應率仍只有兩到三成,顯示這條路還有優化的空間。

今天,我們要來聊的,就是科學家如何另闢蹊徑,找出那些連「通緝令」都發不出去的癌細胞。這個全新的免疫策略,會是破解癌症偽裝的新關鍵嗎?

科學家如何另闢蹊徑,找出那些連「通緝令」都發不出去的癌細胞。這個全新的免疫策略,會是破解癌症偽裝的新關鍵嗎?/ 圖片來源:shutterstock

免疫療法登場:從殺敵一千到精準出擊

在回答問題之前,我們先從人類對抗癌症的「治療演變」說起。

最早的「傳統化療」,就像威力強大的「七傷拳」,殺傷力高,但不分敵我,往往是殺敵一千、自損八百,副作用極大。接著出現的「標靶藥物」,則像能精準出招的「一陽指」,能直接點中癌細胞的「穴位」,大幅減少對健康細胞的傷害,副作用也小多了。但麻煩的是,癌細胞很會突變,用藥一段時間就容易產生抗藥性,這套點穴功夫也就漸漸失靈。

直到這個世紀,人類才終於領悟到:最強的武功,是驅動體內的「原力」,也就是「重新喚醒免疫系統」來對付癌症。這場關鍵轉折,也開啟了「癌症免疫療法」的新時代。

-----廣告,請繼續往下閱讀-----

你可能不知道,就算在健康狀態下,平均每天還是會產生數千個癌細胞。而我們之所以安然無恙,全靠體內那套日夜巡邏的「免疫監測 (immunosurveillance)」機制,看到癌細胞就立刻清除。但,癌細胞之所以難纏,就在於它會發展出各種「免疫逃脫」策略。

免疫系統中,有一批受過嚴格訓練的菁英,叫做「T細胞」,他們是執行最終擊殺任務的霹靂小組。狡猾的癌細胞為了躲過追殺,會在自己身上掛出一張「偽良民證」,這個偽裝的學名,「程序性細胞死亡蛋白配體-1 (programmed death-ligand 1, PD-L1) 」,縮寫PD-L1。

當T細胞來盤查時,T細胞身上帶有一個具備煞車功能的「讀卡機」,叫做「程序性細胞死亡蛋白受體-1 (programmed cell death protein 1, PD-1) 」,簡稱 PD-1。當癌細胞的 PD-L1 跟 T細胞的 PD-1 對上時,就等於是在說:「嘿,自己人啦!別查我」,也就是腫瘤癌細胞會表現很多可抑制免疫 T 細胞活性的分子,這些分子能通過免疫 T 細胞的檢查哨,等於是通知免疫系統無需攻擊的訊號,因此 T 細胞就真的會被唬住,轉身離開且放棄攻擊。

這種免疫系統控制的樞紐機制就稱為「免疫檢查點 (immune checkpoints)」。而我們熟知的「免疫檢查點抑制劑」,作用就像是把那張「偽良民證」直接撕掉的藥物。良民證一失效,T細胞就能識破騙局、發現這是大壞蛋,重新發動攻擊!

-----廣告,請繼續往下閱讀-----
狡猾的癌細胞為了躲過追殺,會在自己身上掛出一張「偽良民證」,也就是「程序性細胞死亡蛋白配體-1 (programmed death-ligand 1, 縮寫PD-L1) 」/ 圖片來源:shutterstock

目前免疫療法已成為晚期癌症患者心目中最後一根救命稻草,理由是他們的體能可能無法負荷化療帶來的副作用;標靶藥物雖然有效,不過在用藥一段期間後,終究會出現抗藥性;而「免疫檢查點抑制劑」卻有機會讓癌症獲得長期的控制。

由於免疫檢查點抑制劑是借著免疫系統的刀來殺死腫瘤,所以有著毒性較低並且治療耐受性較佳的優勢。對免疫檢查點抑制劑有治療反應的患者,也能獲得比起化療更長的存活期,以及較好的生活品質。

不過,儘管免疫檢查點抑制劑改寫了治癌戰局,這些年下來,卻仍有些問題。

CD47來救?揭開癌細胞的「免死金牌」機制

「免疫檢查點抑制劑」雖然帶來治療突破,但還是有不少挑戰。

-----廣告,請繼續往下閱讀-----

首先,是藥費昂貴。 雖然在台灣,健保於 2019 年後已有條件給付,但對多數人仍是沉重負擔。 第二,也是最關鍵的,單獨使用時,它的治療反應率並不高。在許多情況下,大約只有 2成到3成的患者有效。

換句話說,仍有七到八成的患者可能看不到預期的效果,而且治療反應又比較慢,必須等 2 至 3 個月才能看出端倪。對患者來說,這種「沒把握、又得等」的療程,心理壓力自然不小。

為什麼會這樣?很簡單,因為這個方法的前提是,癌細胞得用「偽良民證」這一招才有效。但如果癌細胞根本不屑玩這一套呢?

想像一下,整套免疫系統抓壞人的流程,其實是這樣運作的:當癌細胞自然死亡,或被初步攻擊後,會留下些許「屍塊渣渣」——也就是抗原。這時,體內負責巡邏兼清理的「巨噬細胞」就會出動,把這些渣渣撿起來、分析特徵。比方說,它發現犯人都戴著一頂「大草帽」。

-----廣告,請繼續往下閱讀-----

接著,巨噬細胞會把這個特徵,發布成「通緝令」,交給其他免疫細胞,並進一步訓練剛剛提到的菁英霹靂小組─T細胞。T細胞學會辨認「大草帽」,就能出發去精準獵殺所有戴著草帽的癌細胞。

當癌細胞死亡後,會留下「抗原」。體內的「巨噬細胞」會採集並分析這些特徵,並發布「通緝令」給其它免疫細胞,T細胞一旦學會辨識特徵,就能精準出擊,獵殺所有癌細胞。/ 圖片來源:shutterstock

而PD-1/PD-L1 的偽裝術,是發生在最後一步:T 細胞正準備動手時,癌細胞突然高喊:「我是好人啊!」,來騙過 T 細胞。

但問題若出在第一步呢?如果第一關,巡邏的警察「巨噬細胞」就完全沒有察覺這些屍塊有問題,根本沒發通緝令呢?

這正是更高竿的癌細胞採用的策略:它們在細胞表面大量表現一種叫做「 CD47 」的蛋白質。這個 CD47 分子,就像一張寫著「自己人,別吃我!」的免死金牌,它會跟巨噬細胞上的接收器─訊號調節蛋白α (Signal regulatory protein α,SIRPα) 結合。當巨噬細胞一看到這訊號,大腦就會自動判斷:「喔,這是正常細胞,跳過。」

結果會怎樣?巨噬細胞從頭到尾毫無動作,癌細胞就大搖大擺地走過警察面前,連罪犯「戴草帽」的通緝令都沒被發布,T 細胞自然也就毫無頭緒要出動!

這就是為什麼只阻斷 PD-L1 的藥物反應率有限。因為在許多案例中,癌細胞連進到「被追殺」的階段都沒有!

為了解決這個問題,科學家把目標轉向了這面「免死金牌」,開始開發能阻斷 CD47 的生物藥。但開發 CD47 藥物的這條路,可說是一波三折。

-----廣告,請繼續往下閱讀-----

不只精準殺敵,更不能誤傷友軍

研發抗癌新藥,就像打造一把神兵利器,太強、太弱都不行!

第一代 CD47 藥物,就是威力太強的例子。第一代藥物是強效的「單株抗體」,你可以想像是超強力膠帶,直接把癌細胞表面的「免死金牌」CD47 封死。同時,這個膠帶尾端還有一段蛋白質IgG-Fc,這段蛋白質可以和免疫細胞上的Fc受體結合。就像插上一面「快來吃我」的小旗子,吸引巨噬細胞前來吞噬。

問題來了!CD47 不只存在於癌細胞,全身上下的正常細胞,尤其是紅血球,也有 CD47 作為自我保護的訊號。結果,第一代藥物這種「見 CD47 就封」的策略,完全不分敵我,導致巨噬細胞連紅血球也一起攻擊,造成嚴重的貧血問題。

這問題影響可不小,導致一些備受矚目的藥物,例如美國製藥公司吉立亞醫藥(Gilead)的明星藥物 magrolimab,在2024年2月宣布停止開發。它原本是預期用來治療急性骨髓性白血病(AML)的單株抗體藥物。

太猛不行,那第二代藥物就改弱一點。科學家不再用強效抗體,而是改用「融合蛋白」,也就是巨噬細胞身上接收器 SIRPα 的一部分。它一樣會去佔住 CD47 的位置,但結合力比較弱,特別是跟紅血球的 CD47 結合力,只有 1% 左右,安全性明顯提升。

像是輝瑞在 2021 年就砸下 22.6 億美元,收購生技公司 Trillium Therapeutics 來開發這類藥物。Trillium 使用的是名為 TTI-621 和 TTI-622 的兩種融合蛋白,可以阻斷 CD47 的反應位置。但在輝瑞2025年4月29號公布最新的研發進度報告上,TTI-621 已經悄悄消失。已經進到二期研究的TTI-622,則是在6月29號,研究狀態被改為「已終止」。原因是「無法招募到計畫數量的受試者」。

-----廣告,請繼續往下閱讀-----

但第二代也有個弱點:為了安全,它對癌細胞 CD47 的結合力,也跟著變弱了,導致藥效不如預期。

於是,第三代藥物的目標誕生了:能不能打造一個只對癌細胞有超強結合力,但對紅血球幾乎沒反應的「完美武器」?

為了找出這種神兵利器,科學家們搬出了超炫的篩選工具:噬菌體(Phage),一種專門感染細菌的病毒。別緊張,不是要把病毒打進體內!而是把它當成一個龐大的「鑰匙資料庫」。

科學家可以透過基因改造,再加上AI的協助,就可以快速製造出數億、數十億種表面蛋白質結構都略有不同的噬菌體模型。然後,就開始配對流程:

  1. 先把這些長像各異的「鑰匙」全部拿去試開「紅血球」這把鎖,能打開的通通淘汰!
  2. 剩下的再去試開「癌細胞」的鎖,從中挑出結合最強、最精準的那一把「神鑰」!

接著,就是把這把「神鑰」的結構複製下來,大量生產。可能會從噬菌體上切下來,或是定序入選噬菌體的基因,找出最佳序列。再將這段序列,放入其他表達載體中,例如細菌或是哺乳動物細胞中來生產蛋白質。最後再接上一段能號召免疫系統來攻擊的「標籤蛋白 IgG-Fc」,就大功告成了!

目前這領域的領頭羊之一,是美國的 ALX Oncology,他們的產品 Evorpacept 已完成二期臨床試驗。但他們的標籤蛋白使用的是 IgG1,對巨噬細胞的吸引力較弱,需要搭配其他藥物聯合使用。

而另一個值得關注的,是總部在台北的漢康生技。他們利用噬菌體平台,從上億個可能性中,篩選出了理想的融合蛋白 HCB101。同時,他們選擇的標籤蛋白 IgG4,是巨噬細胞比較「感興趣」的類型,理論上能更有效地觸發吞噬作用。在臨床一期試驗中,就展現了單獨用藥也能讓腫瘤顯著縮小的效果以及高劑量對腫瘤產生腫瘤顯著部分縮小效果。因為它結合了前幾代藥物的優點,有人稱之為「第 3.5 代」藥物。

除此之外,還有漢康生技的FBDB平台技術,這項技術可以將多個融合蛋白「串」在一起。例如,把能攻擊 CD47、PD-L1、甚至能調整腫瘤微環境、活化巨噬細胞與T細胞的融合蛋白接在一起。讓這些武器達成 1+1+1 遠大於 3 的超倍攻擊效果,多管齊下攻擊腫瘤細胞。

結語

從撕掉「偽良民證」的 PD-L1 抑制劑,到破解「免死金牌」的 CD47 藥物,再到利用 AI 和噬菌體平台,設計出越來越精準的千里追魂香。 

對我們來說,最棒的好消息,莫過於這些免疫療法,從沒有停下改進的腳步。科學家們正一步步克服反應率不足、副作用等等的缺點。這些努力,都為癌症的「長期控制」甚至「治癒」,帶來了更多的希望。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
228 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
數智驅動未來:從信任到執行,AI 為企業創新賦能
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/13 ・4938字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文由 鼎新數智 與 泛科學 共同規劃與製作

你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?

馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?

-----廣告,請繼續往下閱讀-----
AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?圖/pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。

AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。

此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具,自己卻無法理解?

原因有二。首先,深度學習模型結構複雜,擁有數百萬參數,人類要追蹤每個輸入特徵如何影響最終決策結果,難度極高。例如,ChatGPT 中的 Transformer 模型,利用注意力機制(Attention Mechanism)根據不同詞之間的重要性進行特徵加權計算,因為機制本身涉及大量的矩陣運算和加權計算,這些數學操作使得整個模型更加抽象、不好理解。

-----廣告,請繼續往下閱讀-----

其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。圖/unsplash

試想,AI 協助診斷疾病時,若理由是基於醫生都無法理解的邏輯,患者即使獲得正確診斷,也會感到不安。畢竟,人們更相信能被理解的東西。

打開黑盒子:可解釋 AI 如何運作?我們要如何教育 AI?

首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。

-----廣告,請繼續往下閱讀-----

其次是局部解釋,LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈,它將每個特徵看作「玩家」,而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻,讓我們可以了解各個特徵如何影響最終結果。並且,SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的,還能透過「全局解釋」理解模型整體的運作中,哪些特徵最重要。

以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。

-----廣告,請繼續往下閱讀-----

第三是反事實解釋:如果改變一點點,會怎麼樣?

如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大,就像揭示一道菜中,哪些調味料是味道的關鍵。例如在金融風險預測中,模型可能指出「收入」影響了 40%,「消費習慣」占了 30%,「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時,還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術,才能達到更完整的解釋效果。

講到這裡,你可能會問:我們距離能完全信任 AI 還有多遠?又或者,我們真的應該完全相信它嗎?

-----廣告,請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。因此,AI 既要「可解釋」,也要「能代理」。

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。圖/unsplash

舉例來說,當一家公司要做一個看似「簡單」的決策時,背後的過程其實可能極為複雜。例如,快時尚品牌決定是否推出新一季服裝,不僅需要考慮過去的銷售數據,還得追蹤熱門設計趨勢、天氣預測,甚至觀察社群媒體上的流行話題。像是暖冬來臨,厚外套可能賣不動;或消費者是否因某位明星愛上一種顏色,這些細節都可能影響決策。

這些數據來自不同部門和來源,龐大的資料量與錯綜關聯使企業判斷變得困難。於是,企業常希望有個像經營大師的 AI 代理人,能吸收數據、快速分析,並在做決定時不僅給出答案,還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子,而可解釋 AI (XAI)則清楚解釋其判斷依據。例如,為什麼不建議推出厚外套?可能理由是:「根據天氣預測,今年暖冬概率 80%,過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告,請繼續往下閱讀-----

但會解釋還不夠,AI 還需能真正執行。這時,就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」,大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時,這位產品經理不會手忙腳亂,而是按以下步驟行動:

  1. 檢查倉庫物料:庫存夠不夠?有沒有替代料可用?
  2. 評估交期影響:如果需要新物料,供應商多快能送到?
  3. 計算成本變化:用新料會不會超出成本預算?
  4. 做出最優判斷,並自動生成變更單、工單和採購單,通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節,還會記錄每次決策結果,學習如何變得更高效。隨時間推移,這位「智慧產品經理」的判斷將更聰明、決策速度更快,幾乎不需人工干預。更重要的是,這些判斷是基於「以終為始」的原則,為企業成長目標(如 Q4 業績增長 10%)進行連續且動態地自我回饋,而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作,讓企業決策流程不僅透明,還能自動執行。這正是數智驅動的核心,不僅依靠數據驅動決策,還要能解釋每一個選擇,並自動行動。這個過程可簡化為 SUPA,即「感知(Sensing)→ 理解(Understanding)→ 規劃(Planning)→ 行動(Acting)」的閉環流程,隨著數據的變化不斷進化。

偉勝乾燥工業為例,他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後,偉勝成功將數智驅動融入業務與產品開發,專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合,開發出新形態智慧化設備,成功打入半導體產業,帶動業績大幅成長,創造下一個企業的增長曲線。

-----廣告,請繼續往下閱讀-----

值得一提的是,數智驅動不僅帶動業務增長,還讓員工擺脫繁瑣工作,讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術,還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用,企業首先要確保它服務於具體的業務需求,而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐,才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力?免費上手企業 AI 助理!👉 企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知:https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道,深入科技趨勢與議題內容。

👉立即免費加入

-----廣告,請繼續往下閱讀-----
鳥苷三磷酸 (PanSci Promo)_96
228 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
從遊戲到量子計算:NVIDIA 憑什麼在 AI 世代一騎絕塵?
PanSci_96
・2025/01/09 ・2941字 ・閱讀時間約 6 分鐘

AI 與 GPU 的連結:為什麼 NVIDIA 股價一路飆?

2023 年至今,人工智慧(AI)熱潮引爆全球科技圈的競爭與創新,但最受矚目的企業,莫過於 NVIDIA。它不僅長期深耕遊戲顯示卡市場,在近年來卻因為 AI 應用需求的飆升,一舉躍居市值龍頭。原因何在?大家可能會直覺認為:「顯示卡性能強,剛好給 AI 訓練用!」事實上,真正的關鍵並非只有強悍的硬體,而是 NVIDIA 打造的軟硬體整合技術──CUDA

接下來將為你剖析 CUDA 與通用圖形處理(GPGPU)的誕生始末,以及未來 NVIDIA 持續看好的量子計算與生醫應用,一窺這家企業如何從「遊戲顯示卡大廠」蛻變為「AI 世代的領航者」。

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

CPU vs. GPU:為何顯示卡能成為 AI 領跑者?

在電腦運作中,CPU(中央處理器)向來是整個系統的「大腦」,負責執行指令、邏輯判斷與多樣化的運算。但是,AI 模型訓練需要面對的是龐大的數據量與繁複的矩陣或張量運算。這些運算雖然單一步驟並不複雜,但需要進行「海量且重複性極高」的計算,CPU 難以在短時間內完成。

反觀 GPU(圖形處理器),原先是用來處理遊戲畫面渲染,內部具有 大量且相對簡單的算術邏輯單元。GPU 可以同時在多個核心中進行平行化運算,就像一座「高度自動化、流水線式」的工廠,可一次處理大量像素、頂點或是 AI 訓練所需的運算。這讓 GPU 在大量數值計算上遠遠超越了 CPU 的處理速度,也讓「顯示卡算 AI」成了新時代的主流。

-----廣告,請繼續往下閱讀-----

顯示卡不只渲染:GPGPU 與 CUDA 的誕生

早期,GPU 只被視為遊戲繪圖的利器,但 NVIDIA 的創辦人黃仁勳很快察覺到:這種多核心平行化的結構,除了渲染,也能用來處理科學運算。於是,NVIDIA 在 2007 年正式推出了名為 CUDA(Compute Unified Device Architecture) 的平台。這是一套讓開發者能以熟悉的程式語言(如 C、C++、Python)來調用 GPU 資源的軟體開發工具套件,解決了「人類要如何對 GPU 下指令」的問題。

在 CUDA 出現之前,若要把 GPU 用於渲染以外的用途,往往必須透過「著色器語言」或 OpenGL、DirectX 等繪圖 API 進行繁瑣的間接操作。對想用 GPU 加速數學或科學研究的人來說,門檻極高。然而,有了 CUDA,開發者不需理解圖像著色流程,也能輕鬆呼叫 GPU 的平行運算能力。這代表 GPU 從遊戲卡一躍成為「通用圖形處理單元」(GPGPU),徹底拓展了它在科學研究、AI、影像處理等領域的應用版圖。

AI 崛起的臨門一腳:ImageNet 大賽的關鍵一擊

如果說 CUDA 是 NVIDIA 邁向 AI 領域的踏腳石,那麼真正讓 GPU 與 AI 完美結合的轉捩點,發生在 2012 年的 ImageNet 大規模視覺辨識挑戰賽(ILSVRC)。這場由李飛飛教授創辦的影像辨識競賽中,參賽團隊需要對龐大的影像數據進行訓練、分類及辨識。就在那一年,名為「AlexNet」的深度學習模型橫空出世,利用 GPU 進行平行運算,大幅減少了訓練時間,甚至比第二名的辨識率高出將近 10 個百分點,震撼了全球 AI 研究者。

AlexNet 的成功,讓整個學界與業界都注意到 GPU 在深度學習中的強大潛力。CUDA 在此時被奉為「不二之選」,再加上後來發展的 cuDNN 等深度學習函式庫,讓開發者不必再自行編寫底層 GPU 程式碼,建立 AI 模型的難度與成本大幅降低,NVIDIA 的股價也因此搭上了 AI 波浪,一飛沖天。

-----廣告,請繼續往下閱讀-----
AlexNet 的成功凸顯 GPU 在深度學習中的潛力。圖/unsplash

為什麼只有 NVIDIA 股價衝?對手 AMD、Intel 在做什麼?

市面上有多家廠商生產 CPU 和 GPU,例如 AMD 與 Intel,但為什麼只有 NVIDIA 深受 AI 市場青睞?綜觀原因,硬體只是其一,真正不可或缺的,是 「軟硬體整合」與「龐大的開發者生態系」

硬體部分 NVIDIA 長年深耕 GPU 技術,產品線完整,且數據中心級的顯示卡在能耗與性能上具領先優勢。軟體部分 CUDA 及其相關函式庫生態,涵蓋了影像處理、科學模擬、深度學習(cuDNN)等多方面,讓開發者易於上手且高度依賴。

相比之下,雖然 AMD 也推行了 ROCm 平台、Intel 有自家解決方案,但在市場普及度與生態支持度上,依舊與 NVIDIA 有相當差距。

聰明的管理者

GPU 的優勢在於同時有成百上千個平行運算核心。當一個深度學習模型需要把數據切分成無數個小任務時,CUDA 負責將這些任務合理地排班與分配,並且在記憶體讀寫方面做出最佳化。

-----廣告,請繼續往下閱讀-----
  • 任務分類:同性質的任務集中處理,以減少切換或等待。
  • 記憶體管理:避免資料在 CPU 與 GPU 之間頻繁搬移,能大幅提升效率。
  • 函式庫支援:如 cuDNN,針對常見的神經網路操作(卷積、池化等)做進一步加速,使用者不必從零開始撰寫平行運算程式。

結果就是,研究者、工程師甚至學生,都能輕鬆把 GPU 能力用在各式各樣的 AI 模型上,訓練速度自然飛漲。

從 AI 到量子計算:NVIDIA 對未來的佈局

當 AI 波浪帶來了股價與市值的激增,NVIDIA 並沒有停下腳步。實際上,黃仁勳與團隊還在積極耕耘下一個可能顛覆性的領域──量子計算

2023 年,NVIDIA 推出 CUDA Quantum 平台,嘗試將量子處理器(QPU)與傳統 GPU / CPU 整合,以混合式演算法解決量子電腦無法單獨加速的部分。就像為 AI 量身打造的 cuDNN 一樣,NVIDIA 也對量子計算推出了相對應的開發工具,讓研究者能在 GPU 上模擬量子電路,或與量子處理器協同運算。

NVIDIA 推出 CUDA Quantum 平台,整合 GPU 與 QPU,助力混合量子運算。圖/unsplash

這項新布局,或許還需要時間觀察是否能孕育出市場級應用,但顯示 NVIDIA 對「通用運算」的野心不只停留於 AI,也想成為「量子時代」的主要推手。

-----廣告,請繼續往下閱讀-----

AI 熱潮下,NVIDIA 凭什麼坐穩王座?

回到一開始的疑問:「為什麼 AI 熱,NVIDIA 股價就一定飛?」 答案可簡化為兩點:

  1. 硬體領先 + 軟體生態:顯示卡性能強固然重要,但 CUDA 建立的開發者生態系才是關鍵。
  2. 持續布局未來:當 GPU 為 AI 提供高效能運算平台,NVIDIA 亦不斷將資源投入到量子計算、生醫領域等新興應用,為下一波浪潮預先卡位。

或許,正因為不斷探索新技術與堅持軟硬整合策略,NVIDIA 能在遊戲市場外再創一個又一個高峰。雖然 AMD、Intel 等競爭者也全力追趕,但短期內想撼動 NVIDIA 的領先地位,仍相當不易。

未來,隨著 AI 技術持續突破,晶片性能與通用運算需求只會節節攀升。「AI + CUDA + GPU」 的組合,短時間內看不出能被取代的理由。至於 NVIDIA 是否能繼續攀向更驚人的市值高峰,甚至在量子計算跑道上再拿下一座「王者寶座」,讓我們拭目以待。

歡迎訂閱 Pansci Youtube 頻道 鎖定每一個科學大事件!

-----廣告,請繼續往下閱讀-----

討論功能關閉中。