文字

繁 | 简

人體解析好書搶先看科學傳播

從能量效率的觀點，告訴你為何人工智慧無法掌控世界——《眼見為憑》

時報出版・2021/06/13 ・2618字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

作者｜理查．馬斯蘭（Richard Masland）
譯者｜鄧子衿

如果你不知道目的地是哪兒，可能要設定其他目標。——尤吉．貝拉（Yogi Berra）

監督學習與無監督學習

我們每天都聽到機器學習能夠做到需要感知才能達成的任務：自動駕駛汽車、臉部辨識等。也有人擔心智慧機器失控所造成的危險，害怕有天它們利用遠勝於人類的智能，會掌控整個世界。不過這些討論絕大部分都沒有看到明顯的重點：機器學習的確能夠完成一些了不起的任務，但是研究人工智慧的傢伙全都深深了解到，現在最佳的人工智慧還比不上四歲的孩子。

原因在於，絕大部分著名的人工智慧演算法在學習技能時要人教，同時需要使用到極龐大的資料庫，並且得在超級電腦上執行。四歲幼兒只要知道幾個例子之後，自己就能夠學習。說真的，教自己小孩某些技能和概念時的確痛苦萬分，但是他們絕大部分知道的事物，都是基於基本的感知機制，自己教自己的結果，用他們小小的腦袋就足以完成。事實上，就算是多層級且具備反向傳播的感知器，比起我的小孫子還是差太多了。他不需要數不清的例子和教師，就能認得出自己的祖父。只要抱幾次就很快學會說「爺爺」這個詞。

人工智慧研究人員區分了監督學習與無監督學習。你應該記得之前提到那個標準的感知器需要教師。蘋果電腦的聲音識別軟體和咸諾斯基會說話的電腦也要。注重隱私權者所害怕的臉部辨識軟體也需要。你需要大量具備身分標籤的臉部照片，才能夠教軟體辨識臉部。電腦能夠辦得到是因為計算速度非常快，事實上，最近幾年機器學習獲得的成就，主要來自於最近（五年）有了能夠用來訓練的資料庫，以及大型的客製化電腦。腦中神經元運作的速度很慢，無法看這些電腦相比。

但是腦部的能力遠超出這些電腦。在赫柏原始的概念中，創造細胞群組的方式是無監督學習：在邊緣上連續的點本來就會一起出現，腦中的邊緣敏感細胞也是自己出現的。目前電腦科學家迫切的任務之一，是建造出訓練過程如大腦的機器。

-----廣告，請繼續往下閱讀-----

電腦也是從錯誤中學習

我很快就會回來談腦部，不過先說明另一種機器學習形式的例子，這種形式結合了神經網絡和一個新方法。電腦科學家大方的用神經科學的名詞來稱呼這類策略：增強原理（principle of reinforcement），最早有系統進行這方面研究的是偉大的俄羅斯生理學家帕夫洛夫（Pavlov），哈佛大學的史金納（B. F. Skinner）等後繼者發掘了其中的細節。電腦科學家稱這種這種演算法為「增強學習」（reinforcement learning）。「增強」的意思是某種行為會得到報償，如果電腦受到了報償，就會重複那種行為。這個過程讓正確的行為比較容易受到重覆，在神經網絡中的突觸會受到加強，你可以說這是一種反向傳播。增強學習與感知學習很像，只不過電腦會自己製造教師。

電腦也可以得到報償。在增強學習的過程中，電腦得找尋一個目標，它會隨便亂猜，剛開始都猜錯，但是如果某個猜測結果稍微接近目標，就會得到報償。電腦得到的報償不是一塊電腦狗糧，而是得到訊息：「幹得好，增強剛才你做出這個猜想時用到的突觸。」接下來電腦會繼續猜，這次會使用新的加權。接下來的步驟你可以想像出來：電腦會持續猜測，每次都調整加權，直到學得完成任務的方法。

人腦與電腦誰比較聰明？

增強學習已經精通了一項極為艱難的技術：下西洋棋，以及更為困難的圍棋。現在電腦的棋力超強，完全勝過人類，而且他們還是自己教自己下棋。我想到的一個演算法是 Alpha Zero，在二○一八年耶誕節前夕於《自然》雜誌上發表研究結果。研究人員只教 Alpha Zero 圍棋的規則：棋盤的模樣、下棋的方式等，之後演算法會自己和自己下西洋棋或是圍棋。這種作法聽起來違背直覺，重點在於每個「自己」並不知道另一個「自己」的思考內容，只知道對方下的棋步。也沒有教師，只有一些事先輸入的規則，讓電腦知道下的棋步是好是壞，以及判定輸贏的標準。四個小時後，電腦就具備了世界級的水準。

這真是非常了不起的成就，而且不只可以讓 Alpha Zero 下各種棋類，還可以讓它做別的事情。谷歌人工智慧團隊的大衛．希爾瓦（David Silver）展示了 Alpha Zero 利用遙控器操縱玩具直升機進行飛行特技，看到那個直升機進行筒狀翻滾飛行（barrel roll），真的讓人確信它有能力。

-----廣告，請繼續往下閱讀-----

但是 Alpha Zero 真的比我的孫子聰明嗎？差得遠了（除非我孫子和它較量西洋棋）。電腦對於任務定義的範圍非常狹隘，而且體積要比我孫子的腦大多了，也不能光靠巧克力夾心餅乾就能運作。史密森尼學會（Smithsonian）的吳凱薩琳（Katherine Wu）估計，Alpha Zero 硬體運作功率約為一百萬瓦，我孫子的腦只需二十瓦。會在這裡提到神經網絡和增強學習，是因為這兩者都屬於概念驗證（Alpha Zero 內部採用了神經網絡），證明了這種邏輯運算的結果雖然距離腦還差得遠，但的確比較接近腦。

人類的腦部是否也採用了類似深度神經網絡或是 Alpha Zero 所運作的方式？當然有，只是慢得不得了。人腦這種電腦是演化經由無數時光打造而成，其中的突觸和連結都縮小到極致。如果由一堆計算晶片組成的笨重電腦能夠辦得到，人腦也可以。

人工智慧領域中的人很清楚我的孫子遠勝過他們的電腦，並且也正在努力改進。每個人都猜電腦會有多聰明。我認為電腦最後會很聰明，我絕對不會想要和電腦競爭。有各種巧妙的無監督學習模式應用在電腦中，唯一的問題是要花多少時間才能追得上人腦，以及機器完成任務的方式和真正的人腦有多相近。更重要的是，機器完成任務的經濟效率能夠比得上人腦嗎，我會屏息以待這些結果。事實上就目前來說，光是超越人類的電腦所需要消耗的能量之高，就讓我無須擔心會電腦會掌控世界了。

——**本文摘自《眼見為憑：從眼睛到大腦，從感知到思考，探索「看見」的奧祕》，2021 年 5 月，時報出版**。

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 5

登入與大家一起討論

狐禪 2021/06/13

電腦的軟硬體如果能無限制升級，那麼也許100代之後，就可以嬴過人腦了。但是現在有任何一台新電腦可以跑最早一代的windows指令嗎？

windmill 2021/06/13

看到「一塊電腦狗糧」那兒我笑了

polo56248 2021/06/15

現在做不到所以不用擔心那也能從反面來看不斷精進終究能超越人類
時間？只要人類不滅絕就不是問題

polo56248 2021/06/15

#3
作者自己可能等不到沒錯但後代子孫就不好說了 “機器完成任務的經濟效率能夠比得上人腦嗎” 效率？跟電腦講效率也太好笑作者還活在幾十年前吧？光是工程計算就知道人腦哪能比的贏電腦？

Ho Wu 2021/06/16

李青雲活223歲
佛陀也說：有修行人類的壽命本該有上千上萬歲
只因文明發達造下種種惡業
所以折福折壽

時報出版

174 篇文章・ 35 位粉絲

出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等，活躍於書市中，累積出版品五千多種，獲得國內外專家讀者、各種獎項的肯定，打造出無數的暢銷傳奇及和重量級作者，在台灣引爆一波波的閱讀議題及風潮。

TRENDING 熱門討論

即時熱門

文字

伺服器過熱危機！液冷與 3D VC 技術如何拯救高效運算？

鳥苷三磷酸 (PanSci Promo) ・2025/04/11 ・3194字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文與高柏科技合作，泛科學企劃執行。

當我們談論能擊敗輝達（NVIDIA）、Google、微軟，甚至是 Meta 的存在，究竟是什麼？答案或許並非更強大的 AI，也不是更高速的晶片，而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

2024 年底至 2025 年初，搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機，傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題，但這場「科技 vs. 熱」的對決，才剛剛開始。

不僅僅是輝達，微軟甚至嘗試將伺服器完全埋入海水中，希望藉由洋流降溫；而更激進的做法，則是直接將伺服器浸泡在冷卻液中，來一場「浸沒式冷卻」的實驗。

-----廣告，請繼續往下閱讀-----

但這些方法真的有效嗎？安全嗎？從大型數據中心到你手上的手機，散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技，一同看看如何用科學破解這場高溫危機！

運算=發熱？為何電腦必然會發熱？

這並非新問題，1961年物理學家蘭道爾在任職於IBM時，就提出了「蘭道爾原理」（Landauer Principle），他根據熱力學提出，當進行計算或訊息處理時，即便是理論上最有效率的電腦，還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失，系統的熵就會上升，而隨著熵的增加，也會產生熱能。

換句話說，當計算是不可逆的時候，就像產品無法回收再利用，而是進到垃圾場燒掉一樣，會產生許多廢熱。

要解決問題，得用科學方法。在一個系統中，我們通常以「熱設計功耗」（TDP，Thermal Design Power）來衡量電子元件在正常運行條件下產生的熱量。一般來說，TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量，通常以瓦特（W）為單位。也就是說，TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP，例如AMD的CPU 9950X，TDP是170W，GeForce RTX 5090則高達575W，伺服器用的晶片，則可能動輒千瓦以上。

-----廣告，請繼續往下閱讀-----

散熱不僅是AI伺服器的問題，電動車、儲能設備、甚至低軌衛星，都需要高效散熱技術，這正是高柏科技的專長。

「導熱介面材料（TIM）」：提升散熱效率的關鍵角色

在電腦世界裡，散熱的關鍵就是把熱量「交給」導熱效率高的材料，而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中，晶片表面和散熱片之間並不會完美貼合，表面多少會有細微間隙，而這些縫隙如果藏了空氣，就會變成「隔熱層」，阻礙熱傳導。

為了解決這個問題，需要一種關鍵材料，導熱介面材料（TIM，Thermal Interface Material）。它的任務就是填補這些縫隙，讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」，即使主線有再多車道，如果匝道堵住了，車流還是無法順利進入高速公路。同樣地，如果 TIM 的導熱效果不好，熱量就會卡在晶片與散熱片之間，導致散熱效率下降。

-----廣告，請繼續往下閱讀-----

那麼，要怎麼提升 TIM 的效能呢？很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁，若要更高效的散熱材料，則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成：高導熱粉末（如金屬或陶瓷粉末）與聚合物基質。大部分散熱膏的特點是流動性好，盡可能地貼合表面、填補縫隙。但也因為太「軟」了，受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸，高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後，會出現乾裂或表面變硬。

為了解決這個問題，高柏科技推出了凝膠狀的「導熱凝膠」，說是凝膠，但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄，比較不會熱裂解、壽命也比較長。

OK，到這裡，「匝道」的問題解決了，接下來的問題是：這條散熱高速公路該怎麼設計？你會選擇氣冷、水冷，還是更先進的浸沒式散熱呢？

-----廣告，請繼續往下閱讀-----

液冷與 3D VC 散熱技術：未來高效散熱方案解析

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量，也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限，因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷，熱量在經過 TIM 後進入水冷頭，水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好，且增加的體積不大。唯一需要注意的是，萬一元件損壞，可能會因為漏液而損害其他元件，且系統的成本較高。如果你對成本有顧慮，可以考慮另一種方案，「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義，就是把均溫板層層疊起來，變成3D結構。雖然均溫板長得也像是一塊金屬板，原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」，直接翻譯是「蒸氣腔室」。

在均溫板中，會放入容易汽化的工作流體，當流體在熱源處吸收熱量後就會汽化，當熱量被帶走，汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法，最大的特點是：導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻，不會有熱都聚集在入口（熱源處）的情況，能更有效降溫。

-----廣告，請繼續往下閱讀-----

整個 3DVC 的設計，是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯，能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC，就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是，工作流體移動的過程經過設計，因此不用插電，成本僅有水冷的十分之一。但相對的，因為是被動式散熱，其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC，高柏科技一直致力於不斷創新，並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積，高柏科技開發了6項專利技術，涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後，均溫板不僅保有高導熱性，還增強了結構強度，顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步，有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術，將主機板和零件完全泡在不導電的特殊液體中，許多冷卻液會選擇沸點較低的物質，因此就像均溫板一樣，可以透過汽化來吸收掉大量的熱，形成泡泡向上浮，達到快速散熱的效果。

然而，因為水會導電，因此替代方案之一是氟化物。雖然效率差了一些，但至少可以用。然而氟化物的生產或廢棄時，很容易產生全氟/多氟烷基物質 PFAS，這是一種永久污染物，會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液，例如礦物油、其他油品，又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告，請繼續往下閱讀-----

另外，把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等，都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證，相信很快就能推出更強大的散熱模組。

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

224 篇文章・ 313 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

文字

數智驅動未來：從信任到執行，AI 為企業創新賦能

鳥苷三磷酸 (PanSci Promo) ・2025/01/13 ・4938字・閱讀時間約 10 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文由鼎新數智與泛科學共同規劃與製作

你有沒有想過，當 AI 根據病歷與 X 光片就能幫你診斷病症，或者決定是否批准貸款，甚至從無人機發射飛彈時，它的每一步「決策」是怎麼來的？如果我們不能知道 AI 的每一個想法步驟，對於那些 AI 輔助的診斷和判斷，要我們如何放心呢？

馬斯克與 OpenAI 的奧特曼鬧翻後，創立了新 AI 公司 xAI，並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型，而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今，AI 已滲透生活各處，而我們對待它的方式卻像求神問卜，缺乏科學精神。如何讓 AI 具備可解釋性，成為當前關鍵問題？

-----廣告，請繼續往下閱讀-----

AI 已滲透生活各處，而我們對待它的方式卻像求神問卜，缺乏科學精神。如何讓 AI 具備可解釋性，成為當前關鍵問題？圖／pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題？試想，現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險，但這些模型往往如同黑箱操作。有人貸款被拒，卻完全不知原因，感覺就像被分手卻不告訴理由。更嚴重的是，AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價，這些與信用風險真的相關嗎？這種不透明性只會讓弱勢群體更難融入金融體系，加劇貧富差距。這種不透明性，會讓原本就已經很難融入金融體系的弱勢群體，更加難以取得貸款，讓貧富差距越來越大，雪上加霜。

AI 不僅影響貸款，還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑，試圖預測嫌犯再犯風險。然而，這些工具被發現對有色人種特別不友好，往往給出偏高的再犯風險評估，導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是，這些決策缺乏透明度，AI 做出的決策根本沒法解釋，這讓嫌犯和律師無法查明問題根源，結果司法公正性就這麼被悄悄削弱了。

此外，AI 在醫療、社交媒體、自駕車等領域的應用，也充滿類似挑戰。例如，AI 協助診斷疾病，但若原因報告無法被解釋，醫生和患者又怎能放心？同樣地，社群媒體或是 YouTube 已經大量使用 AI 自動審查，以及智慧家居或工廠中的黑盒子問題，都像是一場越來越複雜的魔術秀——我們只看到結果，卻無法理解過程。這樣的情況下，對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具，自己卻無法理解？

原因有二。首先，深度學習模型結構複雜，擁有數百萬參數，人類要追蹤每個輸入特徵如何影響最終決策結果，難度極高。例如，ChatGPT 中的 Transformer 模型，利用注意力機制（Attention Mechanism）根據不同詞之間的重要性進行特徵加權計算，因為機制本身涉及大量的矩陣運算和加權計算，這些數學操作使得整個模型更加抽象、不好理解。

-----廣告，請繼續往下閱讀-----

其次，深度學習模型會會從資料中學習某些「特徵」，你可以當作 AI 是用畫重點的方式在學習，人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習，但這些特徵往往對人類來說過於抽象。例如在影像辨識中，人類習慣用眼睛、嘴巴的相對位置，或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵，而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示（Distributed Representation）來編碼特徵，意思是將一個特徵表示為一個高維向量，每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」，在傳統的方式下，你可能用一個簡單的詞來表示這個特徵，例如「紅色」或「藍色」。但是在深度學習中，這個「顏色」特徵可能被表示為一個包含許多數字的高維向量，向量中的每個數字表示顏色的不同屬性，比如亮度、色調等多個數值。對 AI 而言，這是理解世界的方式，但對人類來說，卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」，在傳統的方式下，你可能用一個簡單的詞來表示這個特徵，例如「紅色」或「藍色」。但是在深度學習中，這個「顏色」特徵可能被表示為一個包含許多數字的高維向量，向量中的每個數字表示顏色的不同屬性，比如亮度、色調等多個數值。圖／unsplash

試想，AI 協助診斷疾病時，若理由是基於醫生都無法理解的邏輯，患者即使獲得正確診斷，也會感到不安。畢竟，人們更相信能被理解的東西。

打開黑盒子：可解釋 AI 如何運作？我們要如何教育 AI？

首先，可以利用熱圖（heatmap）或注意力圖這類可視化技術，讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡，來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中，當 AI 判斷這張照片裡是「貓」還是「狗」時，我需要它向我們展示在哪些地方「盯得最緊」，像是耳朵的形狀還是毛色的分布。

-----廣告，請繼續往下閱讀-----

其次是局部解釋，LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈，它將每個特徵看作「玩家」，而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻，讓我們可以了解各個特徵如何影響最終結果。並且，SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的，還能透過「全局解釋」理解模型整體的運作中，哪些特徵最重要。

以實際的情景來說，SHAP 可以讓 AI 診斷出你有某種疾病風險時，指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同，會針對單一個案建立一個簡單的模型，來近似原始複雜模型的行為，目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時，LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用，一大優勢是靈活且計算速度快，適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景，LIME 可以幫助醫生理解 AI 為何推薦某種治療方案，並說明幾個主要原因，這樣醫生不僅能更快做出決策，也能增加患者的信任感。

-----廣告，請繼續往下閱讀-----

第三是反事實解釋：如果改變一點點，會怎麼樣？

如果 AI 告訴你：「這家銀行不會貸款給你」，這時你可能會想知道：是收入不夠，還是年齡因素？這時你就可以問 AI：「如果我年輕五歲，或者多一份工作，結果會怎樣？」反事實解釋會模擬這些變化對結果的影響，讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大，就像揭示一道菜中，哪些調味料是味道的關鍵。例如在金融風險預測中，模型可能指出「收入」影響了 40%，「消費習慣」占了 30%，「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時，還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術，才能達到更完整的解釋效果。

講到這裡，你可能會問：我們距離能完全信任 AI 還有多遠？又或者，我們真的應該完全相信它嗎？

-----廣告，請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事，你自然希望它的決策與行動能讓你認可，幫你省心省力。因此，AI 既要「可解釋」，也要「能代理」。

當未來你和 AI 同事深度共事，你自然希望它的決策與行動能讓你認可，幫你省心省力。圖／unsplash

舉例來說，當一家公司要做一個看似「簡單」的決策時，背後的過程其實可能極為複雜。例如，快時尚品牌決定是否推出新一季服裝，不僅需要考慮過去的銷售數據，還得追蹤熱門設計趨勢、天氣預測，甚至觀察社群媒體上的流行話題。像是暖冬來臨，厚外套可能賣不動；或消費者是否因某位明星愛上一種顏色，這些細節都可能影響決策。

這些數據來自不同部門和來源，龐大的資料量與錯綜關聯使企業判斷變得困難。於是，企業常希望有個像經營大師的 AI 代理人，能吸收數據、快速分析，並在做決定時不僅給出答案，還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子，而可解釋 AI （XAI）則清楚解釋其判斷依據。例如，為什麼不建議推出厚外套？可能理由是：「根據天氣預測，今年暖冬概率 80%，過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告，請繼續往下閱讀-----

但會解釋還不夠，AI 還需能真正執行。這時，就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」，大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時，這位產品經理不會手忙腳亂，而是按以下步驟行動：

檢查倉庫物料：庫存夠不夠？有沒有替代料可用？
評估交期影響：如果需要新物料，供應商多快能送到？
計算成本變化：用新料會不會超出成本預算？
做出最優判斷，並自動生成變更單、工單和採購單，通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節，還會記錄每次決策結果，學習如何變得更高效。隨時間推移，這位「智慧產品經理」的判斷將更聰明、決策速度更快，幾乎不需人工干預。更重要的是，這些判斷是基於「以終為始」的原則，為企業成長目標（如 Q4 業績增長 10%）進行連續且動態地自我回饋，而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作，讓企業決策流程不僅透明，還能自動執行。這正是數智驅動的核心，不僅依靠數據驅動決策，還要能解釋每一個選擇，並自動行動。這個過程可簡化為 SUPA，即「感知（Sensing）→ 理解（Understanding）→ 規劃（Planning）→ 行動（Acting）」的閉環流程，隨著數據的變化不斷進化。

以偉勝乾燥工業為例，他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後，偉勝成功將數智驅動融入業務與產品開發，專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合，開發出新形態智慧化設備，成功打入半導體產業，帶動業績大幅成長，創造下一個企業的增長曲線。

-----廣告，請繼續往下閱讀-----

值得一提的是，數智驅動不僅帶動業務增長，還讓員工擺脫繁瑣工作，讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術，還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用，企業首先要確保它服務於具體的業務需求，而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐，才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力？免費上手企業 AI 助理！企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知：https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道，深入科技趨勢與議題內容。
立即免費加入

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

鳥苷三磷酸 (PanSci Promo)

224 篇文章・ 313 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

文字

AI 能像人類一樣思考？諾貝爾物理學獎研究助力人工智慧模擬人類大腦

PanSci ・2024/11/14 ・2117字・閱讀時間約 4 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

即使再怎麼模仿，AI 終究無法以與生物相同的方式思考吧？畢竟電腦的電子元件和我們大腦中的神經細胞結構截然不同。再怎麼模仿，AI 終究無法以與生物相同的方式思考吧？

錯，可以。

2024 年諾貝爾物理學獎跌破所有專家的眼鏡，頒給了兩位研究機器學習的科學家——約翰·霍普菲爾德（John Hopfield）和傑佛瑞·辛頓（Geoffrey Hinton）。他們以「人工」的方法打造了類神經網路，最終模擬出生物的「智慧」，奠定了當代深度學習的基礎。

為什麼解決人工智慧發展瓶頸的，竟然會是物理學？物理要怎麼讓 AI 更像人類？

-----廣告，請繼續往下閱讀-----

從巴甫洛夫的狗到赫布理論：理解學習的基礎

為了解答這個疑問，我們需要一些背景知識。

20 世紀初，俄羅斯心理學家巴甫洛夫發現，狗在食物還沒入口前，就會開始分泌唾液。他進行了一系列實驗，改變食物出現前的環境，比如讓狗習慣在聽到鈴聲後馬上得到食物。久而久之，狗只要聽到鈴聲，就會開始分泌唾液。

大約 50 年後，神經科學家赫布（Donald Hebb）提出了一個假說：大腦中相近的神經元，因為經常同時放電，會產生更強的連結。這種解釋稱為「赫布理論」，不僅奠定了神經心理學的發展，更成為現代深度學習的基礎。

然而，赫布理論雖然描述了鄰近神經元的關係，卻無法解釋大腦如何建構出如此複雜的聯想網路。

-----廣告，請繼續往下閱讀-----

霍普菲爾德網路：物理學家對神經網路的貢獻

然而，赫布理論雖能描述神經元之間的關係，卻缺乏數學模型。物理學家約翰·霍普菲爾德從數學家約翰·康威（John Conway）的「生命遊戲」（Game of Life）中獲得靈感，試圖建立一個可以在電腦上運行的記憶系統。

「生命遊戲」由數學家康威（John Conway）發明，玩家開始時有一個棋盤，每個格子代表一個細胞，細胞可以是「活」或「死」的狀態。根據特定規則，細胞會根據鄰居的狀態決定下一次的生存狀態。康威的目的是展示複雜的系統不一定需要複雜的規則。

霍普菲爾德發現，這個遊戲與赫布理論有強大的關聯性。大腦中的大量神經元，在出生時處於初始狀態，經過刺激後，神經元間的連結會產生或斷裂，形成強大的記憶系統。他希望利用這些理論，創造一個能在電腦上運行的記憶系統。

然而，他面臨一個難題：赫布理論沒有明確的數學模型來決定神經元連結的規則。而在電腦上運行，必須要有明確的數學規則。

-----廣告，請繼續往下閱讀-----

物理學的啟發：易辛模型

霍普菲爾德從物理學的研究中找到了類似的模型：易辛模型（Ising Model）。這個模型用於解釋鐵磁性物質的磁性特性。

在鐵磁性物質中，電子具有「自旋」，自旋產生磁矩。電子的自旋方向只有「向上」或「向下」，這就像生命遊戲中細胞的「生」或「死」。鄰近的電子會影響彼此的自旋方向，類似於細胞之間的互動。

易辛模型能用數學描述電子間的相互影響，並通過計算系統能量，得出自旋狀態的分佈。霍普菲爾德借用了這個概念，將神經元的互動視為電子自旋的互動。

他結合了康威生命遊戲的時間演化概念、易辛模型的能量計算，以及赫布理論的動態連結，創造了「霍普菲爾德網路」。這讓電腦能夠模擬生物大腦的學習過程。

-----廣告，請繼續往下閱讀-----

突破瓶頸：辛頓與波茲曼機

約翰·霍普菲爾德於1982年發明聯想神經網路，即「霍普菲爾網路」。圖／wikimedia

然而，霍普菲爾德網路並非完美。它容易陷入「局部最小值」的問題，無法找到系統的全局最優解。為了解決這個問題，加拿大計算機科學家傑佛瑞·辛頓（Geoffrey Hinton）提出了「波茲曼機」（Boltzmann Machine）。

辛頓將「模擬退火」的概念引入神經網路，允許系統以一定的機率跳出局部最小值，尋找全局最優解。他還引入了「隱藏層」的概念，將神經元分為「可見層」和「隱藏層」，提高了網路的學習能力。

受限波茲曼機（Restricted Boltzmann Machine）進一步簡化了模型，成為深度學習的基礎結構之一。這些創新使得 AI 能夠更有效地模擬人類的思維和學習過程。

AI 的未來：跨學科的融合

霍普菲爾德和辛頓的工作，將物理學的概念成功應用於人工智慧。他們的研究不僅解決了 AI 發展的瓶頸，還奠定了深度學習的基礎，對現代 AI 技術產生了深遠的影響。因此，2024 年諾貝爾物理學獎頒給他們，並非意外，而是對他們在跨學科領域的重大貢獻的肯定。

-----廣告，請繼續往下閱讀-----

AI 的發展，離不開物理學、生物學、數學等多學科的融合。霍普菲爾德和辛頓的工作，正是這種融合的典範。未來，隨著科學技術的進步，我們有理由相信，AI 將越來越接近人類的思維方式，甚至可能超越我們的想像。

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

PanSci

1262 篇文章・ 2411 位粉絲

PanSci的編輯部帳號，會發自產內容跟各種消息喔。

TRENDING 熱門討論

即時熱門

從能量效率的觀點，告訴你為何人工智慧無法掌控世界——《眼見為憑》

監督學習與無監督學習

電腦也是從錯誤中學習

人腦與電腦誰比較聰明？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

運算=發熱？為何電腦必然會發熱？

「導熱介面材料（TIM）」：提升散熱效率的關鍵角色

液冷與 3D VC 散熱技術：未來高效散熱方案解析

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

黑盒子模型背後的隱藏秘密

為什麼人類設計的 AI 工具，自己卻無法理解？

打開黑盒子：可解釋 AI 如何運作？我們要如何教育 AI？

我們終究是想解決人與 AI 的信任問題

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

從巴甫洛夫的狗到赫布理論：理解學習的基礎

霍普菲爾德網路：物理學家對神經網路的貢獻

物理學的啟發：易辛模型

突破瓶頸：辛頓與波茲曼機

AI 的未來：跨學科的融合

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見