數學的推算,或許對不少觀眾來說是一個不討喜的題材。但是,就連在電影中飾演拉馬努金的演員戴夫帕托( Dev Patel )都承認,他個人對數學也並不擅長,而《天才無限家》絕非是一個只在「數學」奧妙上打轉的故事,相反地,它跟其他出色的電影相同,有著相當普世的核心情感。
哈代與拉馬努金的知遇之情,透過飾演哈代的奧斯卡影帝傑瑞米艾朗( Jeremy Irons )精準地表達在銀幕上。哈代透過算式感受到拉馬努金的才華與不被世人理解的艱辛,而後奮力奔走,試圖讓拉馬努金得到應有的榮耀。在故事的發展底下,數學算式只是媒介,富有才能的學士,對彼此的尊重與相知相惜,則是電影的核心。
你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?
馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。
如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?
-----廣告,請繼續往下閱讀-----
黑盒子模型背後的隱藏秘密
無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。
AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。
此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。
其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。
深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。
首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。
以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。
LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。
-----廣告,請繼續往下閱讀-----
第三是反事實解釋:如果改變一點點,會怎麼樣?
如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。
著名的英國數學家哈代(Godfrey Harold Hardy)說:”數學家的創造形式,與畫家及詩人一樣,必須是美的: 將概念(就像顏色及詞語)以和諧的方式組合起來。美是最重要的條件,醜陋無法長存於數學之中。”。哈代的著作 “一個數學家的辯白”(A Mathematician’s Apology),在數學圈外有一定的名氣,前面的那段話也出自本書。但讓他”出圈”的主要原因,是他發掘了傳奇數學天才拉馬努金(Srinivasa Ramanujan)。這個故事在 2015 年被拍成了電影 “天才無限家” The Man Who Knew Infinity)。
McKellar 是一位有知名度的美國演員,她曾演出過白宮風雲(The West Wing),也曾在 NCIS、宅男行不行(The Big Bang Theory)及追愛總動員(How I Met Your Mother)中客串。但真正讓她出名的,是 80 末、90 初的影集兩小無猜(The Wonder Years),故事主軸是主角凱文回憶少年成長的過程,而 McKellar 飾演主角的鄰居溫妮,兩人發展出分分合合的戀愛關係。用現代的話來講, McKellar 可以說是當時少年界的國民女友。另外 2010 開始,她也在動畫影集少年正義聯盟中為火星小姐配音。
演員什麼會與數學扯上關係呢?其實她大學就是學數學的,而且學得很好,在 1998 年以最傑出的成績取得加州大學洛杉磯分校的數學學士學位。不只如此,大學時期與教授 Chayes 及同學 Winn 發表了一篇統計力學的論文,其中的主要結果被稱為 Chayes-McKellar-Winn theorem. 在 2008 年,她出了一本針對中學女孩的數學書 “Math Doesn’t Suck: How to Survive Middle School Math without Losing Your Mind or Breaking a Nail.” ,頗受好評也很暢銷,之後也接續出版了許多書。她表示,她想讓女孩們覺得數學是「可親、有意義、甚至有點迷人」,用來對抗這個社會傳達「女孩不適合數學」的這類負面訊息。除此之外,她也參與影集 Project Mc2 的演出。 這部影節的目標是向全球的青少女們證明,科學、科技、STEAM(Science, Technology, Engineering, Arts, Mathematics)是有趣且平易近人的。
2019 年時,英國巴斯大學管理學院的 Samuel G.B. Johnson 及美國耶魯大學數學系的 Stefan Steinerberger 發表了一篇論文 “Intuitions about mathematical beauty: A case study in the aesthetic experience of ideas”,其中的研究證據,支持一般人可能也跟數學家一樣,能感受到數學論證的美感。在其研究中發現,人們對數學的「美感」,就跟對古典鋼琴樂曲及風景畫產生的美感相似,有其內在的一致性。另外也發現這種數學美感的評判,跟與音樂、畫作美感一樣,和優雅性、深度、清楚性有關。
就像十九世紀英國數學家 James Joseph Sylvester 說的:「數學就是論證的音樂」。愛因斯坦也說:「純數學是一首以其自有方式將邏輯概念寫成的詩」。這句話出自他寫給 Emmy Noether 的訃聞。 Noether 是有名的德國數學家,對抽象代數有極大的貢獻,巧妙的利用升鏈條件來研究代數性質,此後符合這個條件的數學物件我們都會冠以 Noetherian 來稱呼,以紀念 Noether 的貢獻。此外,她的 Noether Theorem 也被稱之為影響物理學最重要的定理之一。
音樂教育學者 Martin J. Bergee 原本也是這樣認為的。他覺得只要能控制相關的根本性變因,如種族、收入、教育背景,就能夠破除音樂與數學能力相關性的迷思。於是他就設計並展開了研究。結果讓他非常震驚,兩者的關聯性不但沒有消失,而且還非常強。在 2021 年他的研究團隊發表了一篇名為 “Multilevel Models of the Relationship Between Music Achievement and Reading and Math Achievement” 的論文。他們調查了不同學區背景的一千多位中學生,在盡可能排除其他因素的干擾下,他們不得不承認音樂及數學能力之間的有統計上顯著的關聯。