Loading [MathJax]/extensions/tex2jax.js

0

1
0

文字

分享

0
1
0

人工智慧讓學音樂變簡單!那音樂AI會取代音樂家嗎?

研之有物│中央研究院_96
・2017/08/05 ・4785字 ・閱讀時間約 9 分鐘 ・SR值 517 ・六年級

「自動音樂採譜研究」的重要性

相傳莫札特十四歲時聽到複雜的教堂樂曲,便能默記全曲並寫成樂譜。在這個充滿神秘色彩的故事中,除了隱含人們對音樂「天份」這道門檻的敬畏以外,自動採譜也成為 AI 人工智慧研究者所挑戰的重要夢想。
中研院資訊科學研究所的蘇黎,專攻音樂資訊檢索(Music Information Retrieval,MIR) ,以「多重音高偵測技術」為基礎,發展出自動採譜的人工智慧,以更輕鬆簡單的方式來協助我們學音樂、理解音樂和製作音樂。

自動採譜的功能與發展,讓人人都能開外掛擁有莫札特的絕對音感與解譜能力,可以馬上就編譯樂譜。圖/iStock

目前市場上已經有許多人工智慧在音樂上的應用,例如人們用 Soundhound 音樂識別軟體來搜尋當下聽到的歌,或試聽線上串流平台推薦的歌曲,或透過軟體快速找到自己想要聽的歌。這方面的發展已接近成熟,但主要都是針對「聆聽」的行為。

若想透過人工智慧進一步了解音樂的深層意涵,例如作曲家的創作思維,演奏家的詮釋技法,乃至於樂評家的觀點,那麼,一個擁有像莫札特般卓越音樂聽力,可以協助自動採譜,並將聽見的音樂變成容易親近演奏的完整樂譜的人工智慧,會是關鍵性的一步。

人類如何認識音樂?音高 94 關鍵!

試著哼唱莫札特的〈小星星〉,想起小學教室裡的風琴伴奏,而那架風琴的 Do 還老是走音。在這樣簡單的歌曲裡頭,事實上已經包含了許多複雜的資訊,如速度、節奏、音高、和弦、器樂及人聲的音色等多樣要素,別忘了還有走音的 Do 這個偏差因子。

因此,人工智慧對大編制樂曲如交響樂的自動採譜,必須面對大量且交疊的資訊,難度仍然很高。所以要把聽到的樂曲轉成可以看到的譜,還是要找出其中特徵最穩定,也能決定旋律的關鍵—「音高」。

-----廣告,請繼續往下閱讀-----

「音高」為樂曲所有要素中最基本的特徵,樂譜上的資訊,大多與音高有關。

說起音樂訊號的本質,蘇黎認為音高是音樂訊號中的最基本的資訊之一,而音高偵測正是音樂訊號處理的基本技術。

舉個大家都有的生活經驗:當朋友打電話來,有時我們會覺得對方的聲音好像不太一樣。這是因為線路與裝置在訊號傳輸過程中改變了朋友說話的音色,讓我們的聽覺受到混淆。但對方聲音在電話裡的語調,也就是音高,不論是上揚還是下降,並不容易受影響。

因此,我們即使因為雜訊而不認得對方的聲音,但往往還能聽懂對方講話的內容。也因為音高擁有這樣的基本特性,所以如何辨識音高可以說是分析聲音資訊的一項基本技術。

從最常使用記載樂曲的五線譜來看,接起每一個音高才會組成一段旋律,若依照標準樂譜所演奏的樂曲中,音高該上揚,還是下降,是不會被演奏者影響及改變。 圖/iStock

此外,音高資訊並不僅包含絕對音高,還包含音與音相對的關係,甚至是那轉音之時,各種詮釋的可能。

-----廣告,請繼續往下閱讀-----

就如同有人唱著〈小星星〉的曲調,即使沒一個音在音準上,我們仍然聽得出這是〈小星星〉的曲調。這是因為我們認得旋律軌跡(melody contour)的樣態,也就是「曲調的起伏」。只要曲調起伏的趨勢與原曲相似,我們就能如 Soundhound 音樂識別軟體一樣聽得出來。

用「多重音高偵測」,記錄人耳辨識困難的合音

音高資訊除了表現於旋律以外,更是伴奏、和聲與對位結構中的基本資訊,也就是「和弦辨識(chord recognition)」與「多重音高偵測(multi-pitch estimation, MPE)」技術。

近年來多重音高偵測技術的發展重點,大多仍集中於西方古典音樂,因為此類音樂的資料庫相對完整,每種樂器的聲響型態較容易標準化,在分析樂曲時就相當便利。但因為西方古典音樂大多有完整樂譜,往往是最不需要這項技術輔助研究的。相反的,大量在缺乏譜例記載的傳唱民謠,需大量人力從事轉譜工作以方便判讀分析,多重音高偵測技術在此時便派上用場,並且能給予譜例之外更多的資訊。

以布農族的祈禱小米豐收歌 Pasibutbut ,也就是著名的「八部合音」(註一)為例。為什麼稱之八部,據說是因為「泛音唱法」(註二),即一個人可以同時唱出兩個音高的聲音,除了唱出基音以外,還增強某一個高階泛音的能量。

-----廣告,請繼續往下閱讀-----

但現今所看到音樂學家所整理的譜例,大多仍是記為四部,這是因為演唱的編制確實只有四個聲部:最高音、次高音、中音和低音。至於泛音唱法之下多出的聲部,有些人聽得出來,有些人則感知不到;且不同的錄音版本差很大,很難明確指出是哪八個聲部,各自音高為何。

布農族 Pasibutbut 八部合音的時頻圖:橫軸代表時間,縱軸代表聲音的頻率,發亮的能量條則是聲音。資料來源/蘇黎。聲音/臺灣音樂資訊交流平台

蘇黎透過訊號的時頻圖(spectrogram)資料佐證,可以清楚看見泛音唱法的特徵:每一個聲部都在偶數的倍頻上產生更多能量。經過多重音高偵測(即 CFP transcription result),去掉多倍頻的泛音,除了基音外,也很容易看見第一泛音(基音的二倍頻)的位置上有能量存在,顯示了新的音高成份,演算法呈現的結果證實了泛音唱法的存在。

藉由計算瞬時頻率的技術,也就是「多重音高偵測」,便能把每一個聲部的音高軌跡精準算出,將能協助民族音樂的採譜工作。

音樂視覺化!將視覺和聽覺同步表現

蘇黎團隊目前所研究的「多重音高偵測技術」,以適用於各種音樂訊號為目的,其能有效刻劃出每一種聲響結構,並且將聲響即時轉化成樂譜。

多重音高偵測技術不僅可以應用於民族音樂學等領域的採譜處理問題,它的即時處理以及視覺化能力,也能在教育、娛樂等應用領域中有龐大潛力,將複雜的演奏即時轉為視覺表現。

-----廣告,請繼續往下閱讀-----
使用多重音高偵測技術,鋼琴每彈下一個音,電腦會自動定位音高,在螢幕上再度轉化成鋼琴鍵,圖中的橫軸則為時間軸,清楚地看出該時間點演奏者按下哪一個鋼琴鍵,演奏完畢便完成曲譜的轉譯。資料來源/《日新‧樂譯》跨界科技音樂會 DEMO 宣傳影片。製作/ 魏一傑、吳曉筑

在聆聽音樂的同時建立視覺與聽覺的關聯,以增強對音樂元素如音高、和弦的認知,是豐盛音樂表演 (enriched music performance)所努力的方向。

為了推廣這個概念,蘇黎與沛思文教基金會將於 2017 年 11 月合作推出《日新‧樂譯》跨界科技音樂會(註三),將現場演奏即時轉譯成樂譜動畫,用科技的語言,述說音樂的故事,透過多媒體動畫影像,讓大家聽得到也看得到音樂的演出。

除了紀錄樂譜,還能做什麼應用呢?

「多重音高偵測技術」對於輔助學習的應用,也不僅限於音樂元素的偵測與視覺化。

音樂人工智慧的研究範疇,除了理解音樂天才如何聽音樂以外,還有音樂演奏家如何「詮釋」音樂。圖/Clem Onojeghuo

精確的多重音高偵測技術為了滿足這個目標,往往需要更精確的頻率與能量偵測演算法,精確描述演奏者在演奏時的音量有多大、抖音怎麼使用、如何控制音長等等。

蘇黎與成大蘇文鈺老師、中研院楊奕軒老師合作的工作中,專注探討小提琴演奏者的詮釋,就像同樣的小星星會有很多不同的詮釋版本,可以彈得恬靜、彈得莊嚴、彈得詼諧、彈得有精神,種種不同的表情術語和詮釋方式,都可以從精確的音高偵測演算法中看出端倪。

-----廣告,請繼續往下閱讀-----

更進一步地說,未來我們或許能建立一個檢定的標準:當彈奏者把自己的演奏記錄下來,並輸入音樂人工智慧時,就可以和標準演奏做出比對,看看自己演奏得好不好。或是藉由音樂人工智慧的示範演出,讓初學者可以不斷聆聽各種詮釋方式,再去揣摩自己喜歡的演奏表情。這一些都是未來可以從「多重音高偵測技術」中,延伸開發的音樂人工智慧。

此圖為小星星的第一個 Do 音在不同音樂情緒的表現。每一個彈奏風格的聲音變化,都可以被明確記錄下來,抓到彈奏要點。資料來源/Analysis of expressive musical terms in violin using score-informed and expression-based audio features 。圖/張凱鈞、張語辰

果可以辨識演奏的詮釋方式,則有機會透過音樂人工智慧,從仰慕的音樂高手的精湛演奏中,學習樂器的彈奏技巧。

精確的音高偵測技術不僅可以用來分析古典音樂中的表情術語,另一個有趣的應用是分析搖滾樂中,吉他 solo 複雜的演奏技巧。

帥氣熱血的吉他 solo 往往結合各式不同的演奏技巧,如推弦,滑音、悶音、捶勾弦等等,這是吉他新手在學習抓譜時最困擾的地方。「多重音高偵測技術」有助於辦識出吉他的演奏技巧,把這一些技巧轉變成可閱讀的技巧符號,並記載在樂譜上,讓我們可以更容易去理解彈奏方式,進而模仿演奏者的演奏變化,達成自己想要的音樂學習目標,也是種未來可能發展出的音樂學習系統。

吉他 solo 的時頻圖:可清楚看到推弦、勾弦等不同演奏技巧的音頻變化,並進一步將明星吉他手的「個人演奏風格」變成樂譜,供粉絲或學生「臨摹」學習。資料來源/Electric guitar playing technique detection in real-world recording based on F0 sequence pattern recognition.

音樂人工智慧會取代音樂家嗎?

當 AlphaGo 問世改寫了圍棋的新面貌,一一擊敗了世界頂尖的圍棋好手,有人感到恐懼、有人感到興奮,無非都是因為人工智慧科技所帶來的改變,但換一個角度想,這不正是把漫畫「棋靈王」的故事搬到現實世界嗎?

-----廣告,請繼續往下閱讀-----

當 AlphaGo 變成每個人的藤原佐為,我們就可以像進藤光一樣,即使沒有從小就接觸圍棋,也可以學習到好的圍棋思維。根據類似的道理,我們可以說, 音樂人工智慧科技的進步,其目的並不在於取代音樂家的工作。相反的,我們能看到在不久的將來,這些科技將會被用來增進人類學習音樂的效率,而擴大音樂的學習與消費市場。

正如工業革命讓古鋼琴現代化並大量製造,而孕育浪漫樂派蕭邦、舒曼等作曲家不朽的鋼琴獨奏作品;當代音樂人工智慧的成熟發展將開展另一場革命,不僅讓學習音樂變得更輕鬆有趣,也提供音樂家前所未有的音樂創作思維。

蘇黎不僅是個資訊科學家,也是一個音樂愛好者。深度研究「多重音高偵測技術」,逐步發展出可以正確轉譯樂譜的音樂人工智慧,一方面希望讓專業的音樂創作人擁有更好的創作環境,不用在記載與解析樂譜上耗費太多心力,創作者可以運用更充足的時間來創作嶄新的音樂風格。

另一方面則期望,讓每個想學習音樂的人,可以搭載猶如莫札特的音樂耳。每個人都好像擁有一個虛擬音樂老師,以更輕鬆、簡單的方式,認識音樂的組成結構,降低學習成本,加快學習音樂的速度。讓想學音樂的心,不會隨著年齡增長而有所阻礙,讓全年齡層的人們都有興趣把音樂成為生活的一部分。

如何打破「會音樂」與「不會音樂」的高牆,利用科技創造更好的音樂學習介面,讓音樂欣賞與彈奏更好上手,便是蘇黎致力研究的目標。圖/張語辰

延伸閱讀

-----廣告,請繼續往下閱讀-----
  • 採訪編輯|張凱鈞
  • 美術編輯|張語辰

CC 4.0

本著作由研之有物製作,以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3674 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
從PD-L1到CD47:癌症免疫療法進入3.5代時代
鳥苷三磷酸 (PanSci Promo)_96
・2025/07/25 ・4544字 ・閱讀時間約 9 分鐘

-----廣告,請繼續往下閱讀-----

本文與 TRPMA 台灣研發型生技新藥發展協會合作,泛科學企劃執行

如果把癌細胞比喻成身體裡的頭號通緝犯,那誰來負責逮捕?

許多人第一時間想到的,可能是化療、放療這些外來的「賞金獵人」。但其實,我們體內早就駐紮著一支最強的警察部隊「免疫系統」。

既然「免疫系統」的警力這麼堅強,為什麼癌症還是屢屢得逞?關鍵就在於:癌細胞是偽裝高手。有的會偽造「良民證」,騙過免疫系統的菁英部隊;更厲害的,甚至能直接掛上「免查通行證」,讓負責巡邏的免疫細胞直接視而不見,大搖大擺地溜過。

-----廣告,請繼續往下閱讀-----

過去,免疫檢查點抑制劑的問世,為癌症治療帶來突破性的進展,成功撕下癌細胞的偽裝,也讓不少患者重燃希望。不過,目前在某些癌症中,反應率仍只有兩到三成,顯示這條路還有優化的空間。

今天,我們要來聊的,就是科學家如何另闢蹊徑,找出那些連「通緝令」都發不出去的癌細胞。這個全新的免疫策略,會是破解癌症偽裝的新關鍵嗎?

科學家如何另闢蹊徑,找出那些連「通緝令」都發不出去的癌細胞。這個全新的免疫策略,會是破解癌症偽裝的新關鍵嗎?/ 圖片來源:shutterstock

免疫療法登場:從殺敵一千到精準出擊

在回答問題之前,我們先從人類對抗癌症的「治療演變」說起。

最早的「傳統化療」,就像威力強大的「七傷拳」,殺傷力高,但不分敵我,往往是殺敵一千、自損八百,副作用極大。接著出現的「標靶藥物」,則像能精準出招的「一陽指」,能直接點中癌細胞的「穴位」,大幅減少對健康細胞的傷害,副作用也小多了。但麻煩的是,癌細胞很會突變,用藥一段時間就容易產生抗藥性,這套點穴功夫也就漸漸失靈。

直到這個世紀,人類才終於領悟到:最強的武功,是驅動體內的「原力」,也就是「重新喚醒免疫系統」來對付癌症。這場關鍵轉折,也開啟了「癌症免疫療法」的新時代。

-----廣告,請繼續往下閱讀-----

你可能不知道,就算在健康狀態下,平均每天還是會產生數千個癌細胞。而我們之所以安然無恙,全靠體內那套日夜巡邏的「免疫監測 (immunosurveillance)」機制,看到癌細胞就立刻清除。但,癌細胞之所以難纏,就在於它會發展出各種「免疫逃脫」策略。

免疫系統中,有一批受過嚴格訓練的菁英,叫做「T細胞」,他們是執行最終擊殺任務的霹靂小組。狡猾的癌細胞為了躲過追殺,會在自己身上掛出一張「偽良民證」,這個偽裝的學名,「程序性細胞死亡蛋白配體-1 (programmed death-ligand 1, PD-L1) 」,縮寫PD-L1。

當T細胞來盤查時,T細胞身上帶有一個具備煞車功能的「讀卡機」,叫做「程序性細胞死亡蛋白受體-1 (programmed cell death protein 1, PD-1) 」,簡稱 PD-1。當癌細胞的 PD-L1 跟 T細胞的 PD-1 對上時,就等於是在說:「嘿,自己人啦!別查我」,也就是腫瘤癌細胞會表現很多可抑制免疫 T 細胞活性的分子,這些分子能通過免疫 T 細胞的檢查哨,等於是通知免疫系統無需攻擊的訊號,因此 T 細胞就真的會被唬住,轉身離開且放棄攻擊。

這種免疫系統控制的樞紐機制就稱為「免疫檢查點 (immune checkpoints)」。而我們熟知的「免疫檢查點抑制劑」,作用就像是把那張「偽良民證」直接撕掉的藥物。良民證一失效,T細胞就能識破騙局、發現這是大壞蛋,重新發動攻擊!

-----廣告,請繼續往下閱讀-----
狡猾的癌細胞為了躲過追殺,會在自己身上掛出一張「偽良民證」,也就是「程序性細胞死亡蛋白配體-1 (programmed death-ligand 1, 縮寫PD-L1) 」/ 圖片來源:shutterstock

目前免疫療法已成為晚期癌症患者心目中最後一根救命稻草,理由是他們的體能可能無法負荷化療帶來的副作用;標靶藥物雖然有效,不過在用藥一段期間後,終究會出現抗藥性;而「免疫檢查點抑制劑」卻有機會讓癌症獲得長期的控制。

由於免疫檢查點抑制劑是借著免疫系統的刀來殺死腫瘤,所以有著毒性較低並且治療耐受性較佳的優勢。對免疫檢查點抑制劑有治療反應的患者,也能獲得比起化療更長的存活期,以及較好的生活品質。

不過,儘管免疫檢查點抑制劑改寫了治癌戰局,這些年下來,卻仍有些問題。

CD47來救?揭開癌細胞的「免死金牌」機制

「免疫檢查點抑制劑」雖然帶來治療突破,但還是有不少挑戰。

-----廣告,請繼續往下閱讀-----

首先,是藥費昂貴。 雖然在台灣,健保於 2019 年後已有條件給付,但對多數人仍是沉重負擔。 第二,也是最關鍵的,單獨使用時,它的治療反應率並不高。在許多情況下,大約只有 2成到3成的患者有效。

換句話說,仍有七到八成的患者可能看不到預期的效果,而且治療反應又比較慢,必須等 2 至 3 個月才能看出端倪。對患者來說,這種「沒把握、又得等」的療程,心理壓力自然不小。

為什麼會這樣?很簡單,因為這個方法的前提是,癌細胞得用「偽良民證」這一招才有效。但如果癌細胞根本不屑玩這一套呢?

想像一下,整套免疫系統抓壞人的流程,其實是這樣運作的:當癌細胞自然死亡,或被初步攻擊後,會留下些許「屍塊渣渣」——也就是抗原。這時,體內負責巡邏兼清理的「巨噬細胞」就會出動,把這些渣渣撿起來、分析特徵。比方說,它發現犯人都戴著一頂「大草帽」。

-----廣告,請繼續往下閱讀-----

接著,巨噬細胞會把這個特徵,發布成「通緝令」,交給其他免疫細胞,並進一步訓練剛剛提到的菁英霹靂小組─T細胞。T細胞學會辨認「大草帽」,就能出發去精準獵殺所有戴著草帽的癌細胞。

當癌細胞死亡後,會留下「抗原」。體內的「巨噬細胞」會採集並分析這些特徵,並發布「通緝令」給其它免疫細胞,T細胞一旦學會辨識特徵,就能精準出擊,獵殺所有癌細胞。/ 圖片來源:shutterstock

而PD-1/PD-L1 的偽裝術,是發生在最後一步:T 細胞正準備動手時,癌細胞突然高喊:「我是好人啊!」,來騙過 T 細胞。

但問題若出在第一步呢?如果第一關,巡邏的警察「巨噬細胞」就完全沒有察覺這些屍塊有問題,根本沒發通緝令呢?

這正是更高竿的癌細胞採用的策略:它們在細胞表面大量表現一種叫做「 CD47 」的蛋白質。這個 CD47 分子,就像一張寫著「自己人,別吃我!」的免死金牌,它會跟巨噬細胞上的接收器─訊號調節蛋白α (Signal regulatory protein α,SIRPα) 結合。當巨噬細胞一看到這訊號,大腦就會自動判斷:「喔,這是正常細胞,跳過。」

結果會怎樣?巨噬細胞從頭到尾毫無動作,癌細胞就大搖大擺地走過警察面前,連罪犯「戴草帽」的通緝令都沒被發布,T 細胞自然也就毫無頭緒要出動!

這就是為什麼只阻斷 PD-L1 的藥物反應率有限。因為在許多案例中,癌細胞連進到「被追殺」的階段都沒有!

為了解決這個問題,科學家把目標轉向了這面「免死金牌」,開始開發能阻斷 CD47 的生物藥。但開發 CD47 藥物的這條路,可說是一波三折。

-----廣告,請繼續往下閱讀-----

不只精準殺敵,更不能誤傷友軍

研發抗癌新藥,就像打造一把神兵利器,太強、太弱都不行!

第一代 CD47 藥物,就是威力太強的例子。第一代藥物是強效的「單株抗體」,你可以想像是超強力膠帶,直接把癌細胞表面的「免死金牌」CD47 封死。同時,這個膠帶尾端還有一段蛋白質IgG-Fc,這段蛋白質可以和免疫細胞上的Fc受體結合。就像插上一面「快來吃我」的小旗子,吸引巨噬細胞前來吞噬。

問題來了!CD47 不只存在於癌細胞,全身上下的正常細胞,尤其是紅血球,也有 CD47 作為自我保護的訊號。結果,第一代藥物這種「見 CD47 就封」的策略,完全不分敵我,導致巨噬細胞連紅血球也一起攻擊,造成嚴重的貧血問題。

這問題影響可不小,導致一些備受矚目的藥物,例如美國製藥公司吉立亞醫藥(Gilead)的明星藥物 magrolimab,在2024年2月宣布停止開發。它原本是預期用來治療急性骨髓性白血病(AML)的單株抗體藥物。

太猛不行,那第二代藥物就改弱一點。科學家不再用強效抗體,而是改用「融合蛋白」,也就是巨噬細胞身上接收器 SIRPα 的一部分。它一樣會去佔住 CD47 的位置,但結合力比較弱,特別是跟紅血球的 CD47 結合力,只有 1% 左右,安全性明顯提升。

像是輝瑞在 2021 年就砸下 22.6 億美元,收購生技公司 Trillium Therapeutics 來開發這類藥物。Trillium 使用的是名為 TTI-621 和 TTI-622 的兩種融合蛋白,可以阻斷 CD47 的反應位置。但在輝瑞2025年4月29號公布最新的研發進度報告上,TTI-621 已經悄悄消失。已經進到二期研究的TTI-622,則是在6月29號,研究狀態被改為「已終止」。原因是「無法招募到計畫數量的受試者」。

-----廣告,請繼續往下閱讀-----

但第二代也有個弱點:為了安全,它對癌細胞 CD47 的結合力,也跟著變弱了,導致藥效不如預期。

於是,第三代藥物的目標誕生了:能不能打造一個只對癌細胞有超強結合力,但對紅血球幾乎沒反應的「完美武器」?

為了找出這種神兵利器,科學家們搬出了超炫的篩選工具:噬菌體(Phage),一種專門感染細菌的病毒。別緊張,不是要把病毒打進體內!而是把它當成一個龐大的「鑰匙資料庫」。

科學家可以透過基因改造,再加上AI的協助,就可以快速製造出數億、數十億種表面蛋白質結構都略有不同的噬菌體模型。然後,就開始配對流程:

  1. 先把這些長像各異的「鑰匙」全部拿去試開「紅血球」這把鎖,能打開的通通淘汰!
  2. 剩下的再去試開「癌細胞」的鎖,從中挑出結合最強、最精準的那一把「神鑰」!

接著,就是把這把「神鑰」的結構複製下來,大量生產。可能會從噬菌體上切下來,或是定序入選噬菌體的基因,找出最佳序列。再將這段序列,放入其他表達載體中,例如細菌或是哺乳動物細胞中來生產蛋白質。最後再接上一段能號召免疫系統來攻擊的「標籤蛋白 IgG-Fc」,就大功告成了!

目前這領域的領頭羊之一,是美國的 ALX Oncology,他們的產品 Evorpacept 已完成二期臨床試驗。但他們的標籤蛋白使用的是 IgG1,對巨噬細胞的吸引力較弱,需要搭配其他藥物聯合使用。

而另一個值得關注的,是總部在台北的漢康生技。他們利用噬菌體平台,從上億個可能性中,篩選出了理想的融合蛋白 HCB101。同時,他們選擇的標籤蛋白 IgG4,是巨噬細胞比較「感興趣」的類型,理論上能更有效地觸發吞噬作用。在臨床一期試驗中,就展現了單獨用藥也能讓腫瘤顯著縮小的效果以及高劑量對腫瘤產生腫瘤顯著部分縮小效果。因為它結合了前幾代藥物的優點,有人稱之為「第 3.5 代」藥物。

除此之外,還有漢康生技的FBDB平台技術,這項技術可以將多個融合蛋白「串」在一起。例如,把能攻擊 CD47、PD-L1、甚至能調整腫瘤微環境、活化巨噬細胞與T細胞的融合蛋白接在一起。讓這些武器達成 1+1+1 遠大於 3 的超倍攻擊效果,多管齊下攻擊腫瘤細胞。

結語

從撕掉「偽良民證」的 PD-L1 抑制劑,到破解「免死金牌」的 CD47 藥物,再到利用 AI 和噬菌體平台,設計出越來越精準的千里追魂香。 

對我們來說,最棒的好消息,莫過於這些免疫療法,從沒有停下改進的腳步。科學家們正一步步克服反應率不足、副作用等等的缺點。這些努力,都為癌症的「長期控制」甚至「治癒」,帶來了更多的希望。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
數智驅動未來:從信任到執行,AI 為企業創新賦能
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/13 ・4938字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文由 鼎新數智 與 泛科學 共同規劃與製作

你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?

馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?

-----廣告,請繼續往下閱讀-----
AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?圖/pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。

AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。

此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具,自己卻無法理解?

原因有二。首先,深度學習模型結構複雜,擁有數百萬參數,人類要追蹤每個輸入特徵如何影響最終決策結果,難度極高。例如,ChatGPT 中的 Transformer 模型,利用注意力機制(Attention Mechanism)根據不同詞之間的重要性進行特徵加權計算,因為機制本身涉及大量的矩陣運算和加權計算,這些數學操作使得整個模型更加抽象、不好理解。

-----廣告,請繼續往下閱讀-----

其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。圖/unsplash

試想,AI 協助診斷疾病時,若理由是基於醫生都無法理解的邏輯,患者即使獲得正確診斷,也會感到不安。畢竟,人們更相信能被理解的東西。

打開黑盒子:可解釋 AI 如何運作?我們要如何教育 AI?

首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。

-----廣告,請繼續往下閱讀-----

其次是局部解釋,LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈,它將每個特徵看作「玩家」,而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻,讓我們可以了解各個特徵如何影響最終結果。並且,SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的,還能透過「全局解釋」理解模型整體的運作中,哪些特徵最重要。

以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。

-----廣告,請繼續往下閱讀-----

第三是反事實解釋:如果改變一點點,會怎麼樣?

如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大,就像揭示一道菜中,哪些調味料是味道的關鍵。例如在金融風險預測中,模型可能指出「收入」影響了 40%,「消費習慣」占了 30%,「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時,還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術,才能達到更完整的解釋效果。

講到這裡,你可能會問:我們距離能完全信任 AI 還有多遠?又或者,我們真的應該完全相信它嗎?

-----廣告,請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。因此,AI 既要「可解釋」,也要「能代理」。

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。圖/unsplash

舉例來說,當一家公司要做一個看似「簡單」的決策時,背後的過程其實可能極為複雜。例如,快時尚品牌決定是否推出新一季服裝,不僅需要考慮過去的銷售數據,還得追蹤熱門設計趨勢、天氣預測,甚至觀察社群媒體上的流行話題。像是暖冬來臨,厚外套可能賣不動;或消費者是否因某位明星愛上一種顏色,這些細節都可能影響決策。

這些數據來自不同部門和來源,龐大的資料量與錯綜關聯使企業判斷變得困難。於是,企業常希望有個像經營大師的 AI 代理人,能吸收數據、快速分析,並在做決定時不僅給出答案,還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子,而可解釋 AI (XAI)則清楚解釋其判斷依據。例如,為什麼不建議推出厚外套?可能理由是:「根據天氣預測,今年暖冬概率 80%,過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告,請繼續往下閱讀-----

但會解釋還不夠,AI 還需能真正執行。這時,就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」,大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時,這位產品經理不會手忙腳亂,而是按以下步驟行動:

  1. 檢查倉庫物料:庫存夠不夠?有沒有替代料可用?
  2. 評估交期影響:如果需要新物料,供應商多快能送到?
  3. 計算成本變化:用新料會不會超出成本預算?
  4. 做出最優判斷,並自動生成變更單、工單和採購單,通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節,還會記錄每次決策結果,學習如何變得更高效。隨時間推移,這位「智慧產品經理」的判斷將更聰明、決策速度更快,幾乎不需人工干預。更重要的是,這些判斷是基於「以終為始」的原則,為企業成長目標(如 Q4 業績增長 10%)進行連續且動態地自我回饋,而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作,讓企業決策流程不僅透明,還能自動執行。這正是數智驅動的核心,不僅依靠數據驅動決策,還要能解釋每一個選擇,並自動行動。這個過程可簡化為 SUPA,即「感知(Sensing)→ 理解(Understanding)→ 規劃(Planning)→ 行動(Acting)」的閉環流程,隨著數據的變化不斷進化。

偉勝乾燥工業為例,他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後,偉勝成功將數智驅動融入業務與產品開發,專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合,開發出新形態智慧化設備,成功打入半導體產業,帶動業績大幅成長,創造下一個企業的增長曲線。

-----廣告,請繼續往下閱讀-----

值得一提的是,數智驅動不僅帶動業務增長,還讓員工擺脫繁瑣工作,讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術,還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用,企業首先要確保它服務於具體的業務需求,而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐,才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力?免費上手企業 AI 助理!👉 企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知:https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道,深入科技趨勢與議題內容。

👉立即免費加入

-----廣告,請繼續往下閱讀-----

0

2
1

文字

分享

0
2
1
AI 能像人類一樣思考?諾貝爾物理學獎研究助力人工智慧模擬人類大腦
PanSci_96
・2024/11/14 ・2117字 ・閱讀時間約 4 分鐘

即使再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?畢竟電腦的電子元件和我們大腦中的神經細胞結構截然不同。再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?

錯,可以。

2024 年諾貝爾物理學獎跌破所有專家的眼鏡,頒給了兩位研究機器學習的科學家——約翰·霍普菲爾德(John Hopfield)和傑佛瑞·辛頓(Geoffrey Hinton)。他們以「人工」的方法打造了類神經網路,最終模擬出生物的「智慧」,奠定了當代深度學習的基礎。

為什麼解決人工智慧發展瓶頸的,竟然會是物理學?物理要怎麼讓 AI 更像人類?

-----廣告,請繼續往下閱讀-----
歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

從巴甫洛夫的狗到赫布理論:理解學習的基礎

為了解答這個疑問,我們需要一些背景知識。

20 世紀初,俄羅斯心理學家巴甫洛夫發現,狗在食物還沒入口前,就會開始分泌唾液。他進行了一系列實驗,改變食物出現前的環境,比如讓狗習慣在聽到鈴聲後馬上得到食物。久而久之,狗只要聽到鈴聲,就會開始分泌唾液。

大約 50 年後,神經科學家赫布(Donald Hebb)提出了一個假說:大腦中相近的神經元,因為經常同時放電,會產生更強的連結。這種解釋稱為「赫布理論」,不僅奠定了神經心理學的發展,更成為現代深度學習的基礎。

然而,赫布理論雖然描述了鄰近神經元的關係,卻無法解釋大腦如何建構出如此複雜的聯想網路。

-----廣告,請繼續往下閱讀-----

霍普菲爾德網路:物理學家對神經網路的貢獻

然而,赫布理論雖能描述神經元之間的關係,卻缺乏數學模型。物理學家約翰·霍普菲爾德從數學家約翰·康威(John Conway)的「生命遊戲」(Game of Life)中獲得靈感,試圖建立一個可以在電腦上運行的記憶系統。

霍普菲爾德受「生命遊戲」啟發,嘗試建立電腦記憶系統。圖/envato

「生命遊戲」由數學家康威(John Conway)發明,玩家開始時有一個棋盤,每個格子代表一個細胞,細胞可以是「活」或「死」的狀態。根據特定規則,細胞會根據鄰居的狀態決定下一次的生存狀態。康威的目的是展示複雜的系統不一定需要複雜的規則。

霍普菲爾德發現,這個遊戲與赫布理論有強大的關聯性。大腦中的大量神經元,在出生時處於初始狀態,經過刺激後,神經元間的連結會產生或斷裂,形成強大的記憶系統。他希望利用這些理論,創造一個能在電腦上運行的記憶系統。

然而,他面臨一個難題:赫布理論沒有明確的數學模型來決定神經元連結的規則。而在電腦上運行,必須要有明確的數學規則。

-----廣告,請繼續往下閱讀-----

物理學的啟發:易辛模型

霍普菲爾德從物理學的研究中找到了類似的模型:易辛模型(Ising Model)。這個模型用於解釋鐵磁性物質的磁性特性。

在鐵磁性物質中,電子具有「自旋」,自旋產生磁矩。電子的自旋方向只有「向上」或「向下」,這就像生命遊戲中細胞的「生」或「死」。鄰近的電子會影響彼此的自旋方向,類似於細胞之間的互動。

易辛模型能用數學描述電子間的相互影響,並通過計算系統能量,得出自旋狀態的分佈。霍普菲爾德借用了這個概念,將神經元的互動視為電子自旋的互動。

他結合了康威生命遊戲的時間演化概念、易辛模型的能量計算,以及赫布理論的動態連結,創造了「霍普菲爾德網路」。這讓電腦能夠模擬生物大腦的學習過程。

-----廣告,請繼續往下閱讀-----

突破瓶頸:辛頓與波茲曼機

約翰·霍普菲爾德於1982年發明聯想神經網路,即「霍普菲爾網路」。圖/wikimedia

然而,霍普菲爾德網路並非完美。它容易陷入「局部最小值」的問題,無法找到系統的全局最優解。為了解決這個問題,加拿大計算機科學家傑佛瑞·辛頓(Geoffrey Hinton)提出了「波茲曼機」(Boltzmann Machine)。

辛頓將「模擬退火」的概念引入神經網路,允許系統以一定的機率跳出局部最小值,尋找全局最優解。他還引入了「隱藏層」的概念,將神經元分為「可見層」和「隱藏層」,提高了網路的學習能力。

受限波茲曼機(Restricted Boltzmann Machine)進一步簡化了模型,成為深度學習的基礎結構之一。這些創新使得 AI 能夠更有效地模擬人類的思維和學習過程。

AI 的未來:跨學科的融合

霍普菲爾德和辛頓的工作,將物理學的概念成功應用於人工智慧。他們的研究不僅解決了 AI 發展的瓶頸,還奠定了深度學習的基礎,對現代 AI 技術產生了深遠的影響。因此,2024 年諾貝爾物理學獎頒給他們,並非意外,而是對他們在跨學科領域的重大貢獻的肯定。

-----廣告,請繼續往下閱讀-----

AI 的發展,離不開物理學、生物學、數學等多學科的融合。霍普菲爾德和辛頓的工作,正是這種融合的典範。未來,隨著科學技術的進步,我們有理由相信,AI 將越來越接近人類的思維方式,甚至可能超越我們的想像。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

PanSci_96
1262 篇文章 ・ 2431 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。