Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

大家都在說人工智慧,其實現在我們真正做的是智能增強

機器之心_96
・2017/01/01 ・5773字 ・閱讀時間約 12 分鐘 ・SR值 593 ・九年級

-----廣告,請繼續往下閱讀-----

本文轉載自機器之心〈人們都在說人工智慧,其實現在我們真正做的是智能增強

  • 智能增強技術有助於提高人類的潛能——通過提高工人生產力、減輕一般任務的工作量以及為我們的生活提供更多方便。本文的作者是 Anupam Rastogi,他是 NGP 的成長期技術投資者,專注於企業中的物聯網、數據與機器學習的交叉領域。本文來自 CB Insights
Robot
智能增強技術有助於提高人類的潛能——通過提高工人生產力、減輕一般任務的工作量以及為我們的生活提供更多方便。圖/cbinsights 提供

自 20 世紀 50 年代以來,人工智慧(The Artificial Intelligence/AI)與智能增強(Intelligence Augmentation/IA)之間的爭論已經持續了半個多世紀。一般來說,智能增強指的是利用訊息技術來增強人類能力。這個想法自 1950 年被首次提出後,現在已經變得無處不在。如今人工智慧越來越多地被用於廣泛描述那些能夠模仿人類功能(比如學習和解決問題)的機器,但它最初所建立的前提條件是:人類智能可以被精確描述,且能夠用所製作的機器進行模擬。人工通用智能(Artificial General Intelligence/AGI)這個術語通常僅僅表示後者,該定義較前者更嚴格。當下存在許多人工智慧方面前所未有的炒作——其近來令人難以置信的增長曲線、無數的潛在應用、及其潛在的社會威脅。

更廣泛的人工智慧定義給一些人造成了困惑,特別是那些或許不太緊跟技術潮流的人。機器學習應用近期所帶來的一些十分顯著的進步有時會被錯誤理解和推斷,使我們以為人類即將取得 AGI 方面的進展、正在逼近為了社會秩序所需要的一切。

智能增強與人工通用智能技術之間可能會有一段持續進步的過程。我在本文中談到,我們所目睹的人工智慧領域的快速進展是來自於機器學習對其產生的強大驅動力。然而,滿足人工智慧——以及人工通用智能——的原始前提條件是大量的、額外的、在近期進展之上的技術突破。智能增強技術有助於提高人類的潛能——通過提高工人生產力、減輕一般任務的工作量以及為我們的生活提供更多方便。我們目前所看到的是機器在任務執行方面的能力提升,在這方面它們幾十年前就勝過人類了。而未來十年中,我們會看到機器學習技術進一步滲透眾多行業和生活領域,推動這種能力進一步地快速提高。

-----廣告,請繼續往下閱讀-----

舊聞新炒

如今所使用的許多人工智慧和機器學習演算法是幾十年前發明的。國防機構使用高級機器人、自動駕駛車輛和無人機的時間已將近半個世紀。第一個虛擬現實原型開發於 20 世紀 60 年代。然而截至 2016 年底,沒有一份主流出版物不對人工智慧即將產生的社會影響發表高論。根據 CB Insights 的數據,對利用人工智慧的創業公司的投資資金將於 2016 年達到 42 億美元,僅僅四年就翻了 8 倍以上。

發生了哪些變化?

影響因素有很多,但也有這樣一個共識:最近的許多事態發展,比如近期 Google 翻譯的巨大進展、Google DeepMind 在圍棋游戲中的勝利、亞馬遜 Alexa 的自然會話介面以及特斯拉的自動駕駛功能,都由機器學習的進步所推動,更確切地說是深度學習神經網路——它是人工智慧的一個分支。深度學習理論已經存在了幾十年,但是它開始看到了新一輪的焦點,以及自 2010 年左右開始顯著加快的進展速度。我們當下所看到的現象是一個雪球效應——深度學習在案例與行業中的影響——的開端。

指數般增加的數據可用性、雲經濟規模、硬體能力的持續提升(包括運行機器學習負載的 GPU 性能)、無處不在的連接、低功耗設備的性能以及演算法學習技術的迭代提升,這些都促成了深度學習在許多日常的情況中的可行性與有用性。深度學習以及統計分析、預測分析和自然語言處理方面的相關技術,已經開始被無縫嵌入到我們的日常生活與企業活動之中。

機器和人類

在某些類型的任務上,機器的表現長期以來一直優於人類,尤其是那些與計算速度和規模相關的任務。三位學院派經濟學家(Ajay A. et al)在最近的一篇論文和《哈佛商業評論》上一篇文章假定最近機器學習的進展可以歸為機器「預測」中的進展一類。

-----廣告,請繼續往下閱讀-----

「機器的工作原理是機器使用了之前的蘋果圖像中的訊息,來預測當前的圖像中是否有蘋果。為什麼會用『預測』這個詞?預測使用的訊息是你沒有的但必須要生成的訊息。機器學習使用的數據是從傳感器、圖像、視頻、輸入的註釋、或者其他任何能被用比特/二進制(bit)表示的東西。這就是你擁有的訊息,機器用這樣的訊息去填補它缺失的訊息來識別物體,並預測下面會發生什麼。這是你沒有的訊息。換句話說,機器學習是一種預測技術。」

完成任何的主要任務都涉及這幾個要素:數據收集、預測、判斷和行動。人類仍然在基於判斷的任務(廣義)上遠超機器,而且 Ajay 等人假設這些任務的價值會隨著機器學習帶來的預測成本下降而增加。

過去幾年中,在深度學習的驅動下,雖然已經有了能夠展示類似人類軟技能的機器,機器在這些領域的能力幾乎無法達到「預測」中的水平。下面是一些人類擅長的領域,讓機器來模擬這些技能可能需要的新技術突破。

學會學習:最近機器學習使用中一些驚人的成果包括,觀察人類在多種實例任務中的行為(這種在手問題輸入和輸出的大數據集),同時「學習」使用深度神經網路方法。

常識:人類擅長運用「常識」,即用一種不加開放思考或無需大數據集的通用方法來做出判斷。在這個領域,除了在使用深度學習處理自然語言任務上有大進展外,機器相對來說還處在初步階段。研究常識推理的科學家估計機器想要運用常識就需要其他新的技術進展。我們(或者我們的孩子)在和 Alexa 或 Siri 時都要面對這個問題。

-----廣告,請繼續往下閱讀-----

直覺和歸零:人類大腦擅長直覺和歸零,例如從一個非常大的復雜又模糊的選擇集合中發現某個事實、想法或者行動過程。學界一直有人在嘗試做將直覺帶給機器的研究,但是在這個維度上的機器智能還普遍處於初級階段。

創造力:雖然有很多機器已經能生成一些和人類藝術大師的作品難以區分的作品,但它們在很大程度上還是基於學習這些大師已經創造出的模式。真正的創造力需要為問題生成之前從未見過的全新解決方案或真正創新的藝術成果。

共情:理解情緒、價值系統、設置願景、領導力和其他仍然還是人類專屬的軟能力。

多功能:同樣一個人可以合理地執行許多人物,比如拿起盒子、駕駛汽車去工作、帶小孩和發表演講。目前的機器和機器人都還是為特定的任務而打造的。

-----廣告,請繼續往下閱讀-----

IA and AI

根據以上的總結,我們可以得知:機器已經在學習(或者被稱為「預測」)的技能方面取得了長足的進展,它們進入了模仿「人類」真正的技能的早期階段。我們建議的分類方式是:將預測、第一階段的機器學習以及需要人類參與的自動化功能(human-in-the-loop automation capabilities)歸為「IA」技術。這些技術通常是使用機器獨有的能力(處理巨大數據集的能力)來有效地增強人類能力,系統最終的輸出通常還是由設計和訓練它們的人來決定,因為系統設計者會提供一些與機器互補的技能。

從根源上講,很容易把它與 AGI 弄混淆,所以我們使用了術語 AI 來描述我們在前面提到的機器擁有的那些屬於人類的判斷、學習和具備常識的能力以及具有先天創造力和同情心的特徵。對於強大的 AGI 而言,這也許只是它的一部分,但是要實現復雜的工作流程的全自動化就需要具有大多數這些技能的機器。

明確了這些概念以後,我們就可以知道如何對當前或者即將出現的那些可能會影響我們日常生活和工作的技術進行分類了:

585ca0765d491
圖/cbinsights 提供

IA 和 AI 帶來的影響

有一個眾所周知的諺語:「我們總是更傾向於在短期內高估技術產生的影響,而在長遠上低估它」。這也被稱為「阿馬拉定律(Amara’s Law)」,人們經常用下圖來表示它。

-----廣告,請繼續往下閱讀-----
585ca08788960
我們總是更傾向於在短期內高估技術產生的影響,而在長遠上低估它。圖/cbinsights 提供

我們可以在這個圖上看到,這條曲線在任何一個軸上都沒有刻度。對於曲線開始處的任何一點,我們不能準確地知道它距離拐點有多遠。但是這條曲線確實說明瞭一個很重要的趨勢——一項新技術的影響在其初始階段十分緩慢,然後隨著技術的發展和市場的大規模採用,該技術的影響顯著變大,最終趨於飽和。人們對於市場預期通常都會忽視這個趨勢。然後,當進入了所謂的著名的「市場炒作周期」,人們對於技術初期影響的預期遠遠超過了技術的真實影響力,因此,人們就會陷入一種失望的境地。隨著技術的影響繼續擴大並且達到一種較大的規模之後,該技術會達到生產率的巔峰。

我相信我們今天所看到的有關於術語「AI」的那些重大的發展和認知其實是「IA」曲線的上升階段,其中使用人工神經網路的深度學習(以及前面提到的一些驅動力如硬體、數據 、雲經濟學、連接性和其他演算法上的進步)正在推動我們走向該曲線上拐點。在許多情況下,相對於回歸(regression)和其他統計工具以及基於規則的系統和人工編碼實現的邏輯等現有「預測」方法而言,深度學習進行了進一步的提升。機器學習通過提高模型精度,增加處理數據能力以及提高對輸入的適應性而推動了發展的速度。

由於機器智能仍然存在上述限制,所以我認為全自動化技術的發展應該是一條全新的曲線。並且我相信我們還處於這條曲線的早期階段。

585ca09e6f598
全自動化技術的發展應該是一條全新的曲線。並且我相信我們還處於這條曲線的早期階段。圖/cbinsights 提供

之前已經有多個和 AI 以及奇點(singularity)相關的並且預測不準確的炒作周期了。許多 AI 先驅在 20 世紀 50 年代的早期認為,具備人類所有能力的機器將在十年或二十年之內就出現。這個目標沒有實現的原因不是因為沒有足夠強大的計算能力,而是在多個新的維度上的科學還沒有突破。然而這種根本性突破的時間很難預測以及調整。根據斯史蒂芬.霍金所言,截至到 2015 年,「人工智慧研究員還不能明確什麼時候可以建造出擁有或超過人類的 AI 機器。」

-----廣告,請繼續往下閱讀-----

我們可能正處於對於「AI」進行炒作的巔峰階段。然而,IA(如同上邊定義的那樣)提供了一個 5 至 10 年的巨大的投資機會。人類和機器正處於一個互補的階段,他們都有一些不同於對方的卓越的才能。這表明人類能夠專注於他們獨有的技能同時還可以享受鍛煉的樂趣,而機器專注於處理大多數那些不需要人類的判斷力,創造力和同情心等能力就能完成的常規任務。目前有很多文章已經寫了關於 IA 技術將會引起工作和勞動的性質的變化,並且這些變化並不容易。這篇文章就很好地進行了總結:「你使用機器的能力將決定你未來的薪資。」

即時創新和投資機會在何處?

我相信智能增強技術(運用深度學習以及其他機器學習技術實現人工增強自動化)在中期階段的影響比多數人認為的要大,而全自動化的影響則遠遠超出近期相關報導中指出的範圍。

本文無意揣測人工通用智能(AGI)是否還遠在十年或百年之後,亦非討論其將成為對社會的威脅與否。我的立足點在於,你是否對正在進行的投資或者即將創立的公司亦或項目有著五至十年的大規模願景。由機器學習推進的智能增強或人類增強技術具有立竿見影且顯著的價值,況且,在這條商業和社會成功之路上鮮有阻力,可謂是一片坦途。

一如傳統的 B2B 模式,我們尋找的方案是止痛藥而不是維他命,不僅能夠做到解決明顯的現有痛點,展示其強勁的投資回報率,與現有的工作流程高度合拍,還能與企業中買方、用戶和協調人三者利益一致。在這個領域,我保證有人參與的智能技術(智能增強)將有助於提高整體生產力、優化投資成本、提供個性化解決方案、或者助力為客戶提供新的產品。

-----廣告,請繼續往下閱讀-----

機器學習技術正被應用於各大垂直產業的許多方面。這是一個關乎整體投資立論的全景話題(至少是獨立於其中),但我們可以通過一個簡明的列表來窺見一斑,看業內如何通過機器學習這一優勢來增強人類自身的能力、提高生產力以及優化資源使用方式。

企業——完成單調重復任務的機器人助手將更具功能性,並將在十年之內更加深入企業各個方面。使用增強技術實現的可穿戴式設備將有助於順利完成危險或者成本高昂的工作。

生產製造——合作型的智能機器人可以安全地與人類共事,並且完成那些複雜高危或者重復性的勞動,從而提高生產效率。

交通和運輸——各大科技公司和傳統製造商們正在就自動駕駛汽車開發進行一場公開而激烈的角逐。而一般駕駛情況下的減少駕駛員工作量的相關技術在短期內其收效是更可預見的。比如:高速公路,降低因人工駕駛車輛造成的誤操作率和交通意外,改善交通車流量及提高燃料使用效率。假以時日,完全自主的生態保障系統將改變都市生活結構,並隨之帶來更多衍生發展機會。

醫療保健——機器學習技術基於更為廣泛的數據庫,從而有助於醫療人員提供高精度,實現個性化診療。

農業——各類農用機器人、作物優化技術、自動灌溉技術以及蟲害預警系統將有助於大幅提高農業生產力。

由一個傑出學術團隊主持進行的百年人工智慧研究最近公佈了一份平衡報告,該報告對橫跨多領域的機器學習技術作了很好的總結和展望。CB Insights 則整理了廣泛應用於各行業創新初創公司的深度學習的各項技術。

到了術語更迭的時候了

由於人工智慧的範疇已經遠遠超出了其在科技工業的既有領域而滲入到各大傳統行業當中,它開始觸及許多並不深諳人工智慧科技相關術語的普羅大眾。

我們最好謹慎地使用「人工智慧」這個術語。為避免混淆,減小不利趨勢和監管的風險,以及更好地認知即將到來的術語更為豐富的時代,我們應該使用例如「智能增強」(IA)這類的術語來指代近期使用機器學習技術所取得的先進成果。我認為智能增強可以更好地闡釋人類與機器的共生關系,而現有技術的影響力正取決於這種關系。之所以這樣提,是因為我們不乏先例。隨著機器變得越發無所不能,從前被認為需要智能的情形就會從人工智慧的定義中清除。比如,光學字元識別(OCR)曾被認為是一種人工智慧科技,但它如今已相當普遍,並不在人工智慧考慮範圍之內了。

還是把人工智慧這個詞用做描述全自動技術吧,那些我們已經論證過的,那些讓我們糾於現狀卻不甚明朗的技術。而與此同時,我們更應該抓住因為智能增強的高歌猛進而帶來的機會。

-----廣告,請繼續往下閱讀-----
文章難易度
機器之心_96
2 篇文章 ・ 0 位粉絲
機器之心是中國領先的前沿科技垂直媒體,關注人工智能、機器人、神經認知科學等前沿科技以及深度科技思考,旨在通過高質量內容讓用戶更好地了解即將到來的下一次技術變革,同時啟發大家對人與科技的哲學思考。

0

1
1

文字

分享

0
1
1
伺服器過熱危機!液冷與 3D VC 技術如何拯救高效運算?
鳥苷三磷酸 (PanSci Promo)_96
・2025/04/11 ・3194字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 高柏科技 合作,泛科學企劃執行。

當我們談論能擊敗輝達(NVIDIA)、Google、微軟,甚至是 Meta 的存在,究竟是什麼?答案或許並非更強大的 AI,也不是更高速的晶片,而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

 2024 年底至 2025 年初,搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機,傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題,但這場「科技 vs. 熱」的對決,才剛剛開始。 

不僅僅是輝達,微軟甚至嘗試將伺服器完全埋入海水中,希望藉由洋流降溫;而更激進的做法,則是直接將伺服器浸泡在冷卻液中,來一場「浸沒式冷卻」的實驗。

-----廣告,請繼續往下閱讀-----

但這些方法真的有效嗎?安全嗎?從大型數據中心到你手上的手機,散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技,一同看看如何用科學破解這場高溫危機!

運算=發熱?為何電腦必然會發熱?

為什麼電腦在運算時溫度會升高呢? 圖/unsplash

這並非新問題,1961年物理學家蘭道爾在任職於IBM時,就提出了「蘭道爾原理」(Landauer Principle),他根據熱力學提出,當進行計算或訊息處理時,即便是理論上最有效率的電腦,還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失,系統的熵就會上升,而隨著熵的增加,也會產生熱能。

換句話說,當計算是不可逆的時候,就像產品無法回收再利用,而是進到垃圾場燒掉一樣,會產生許多廢熱。

要解決問題,得用科學方法。在一個系統中,我們通常以「熱設計功耗」(TDP,Thermal Design Power)來衡量電子元件在正常運行條件下產生的熱量。一般來說,TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量,通常以瓦特(W)為單位。也就是說,TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP,例如AMD的CPU 9950X,TDP是170W,GeForce RTX 5090則高達575W,伺服器用的晶片,則可能動輒千瓦以上。

-----廣告,請繼續往下閱讀-----

散熱不僅是AI伺服器的問題,電動車、儲能設備、甚至低軌衛星,都需要高效散熱技術,這正是高柏科技的專長。

「導熱介面材料(TIM)」:提升散熱效率的關鍵角色

在電腦世界裡,散熱的關鍵就是把熱量「交給」導熱效率高的材料,而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中,晶片表面和散熱片之間並不會完美貼合,表面多少會有細微間隙,而這些縫隙如果藏了空氣,就會變成「隔熱層」,阻礙熱傳導。

為了解決這個問題,需要一種關鍵材料,導熱介面材料(TIM,Thermal Interface Material)。它的任務就是填補這些縫隙,讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」,即使主線有再多車道,如果匝道堵住了,車流還是無法順利進入高速公路。同樣地,如果 TIM 的導熱效果不好,熱量就會卡在晶片與散熱片之間,導致散熱效率下降。

-----廣告,請繼續往下閱讀-----

那麼,要怎麼提升 TIM 的效能呢?很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁,若要更高效的散熱材料,則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成:高導熱粉末(如金屬或陶瓷粉末)與聚合物基質。大部分散熱膏的特點是流動性好,盡可能地貼合表面、填補縫隙。但也因為太「軟」了,受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸,高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後,會出現乾裂或表面變硬。

為了解決這個問題,高柏科技推出了凝膠狀的「導熱凝膠」,說是凝膠,但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄,比較不會熱裂解、壽命也比較長。

OK,到這裡,「匝道」的問題解決了,接下來的問題是:這條散熱高速公路該怎麼設計?你會選擇氣冷、水冷,還是更先進的浸沒式散熱呢?

-----廣告,請繼續往下閱讀-----

液冷與 3D VC 散熱技術:未來高效散熱方案解析

除了風扇之外,目前還有哪些方法可以幫助電腦快速散熱呢?圖/unsplash

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量,也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限,因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷,熱量在經過 TIM 後進入水冷頭,水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好,且增加的體積不大。唯一需要注意的是,萬一元件損壞,可能會因為漏液而損害其他元件,且系統的成本較高。如果你對成本有顧慮,可以考慮另一種方案,「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義,就是把均溫板層層疊起來,變成3D結構。雖然均溫板長得也像是一塊金屬板,原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」,直接翻譯是「蒸氣腔室」。

在均溫板中,會放入容易汽化的工作流體,當流體在熱源處吸收熱量後就會汽化,當熱量被帶走,汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法,最大的特點是:導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻,不會有熱都聚集在入口(熱源處)的情況,能更有效降溫。

-----廣告,請繼續往下閱讀-----

整個 3DVC 的設計,是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯,能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC,就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是,工作流體移動的過程經過設計,因此不用插電,成本僅有水冷的十分之一。但相對的,因為是被動式散熱,其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC,高柏科技一直致力於不斷創新,並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積,高柏科技開發了6項專利技術,涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後,均溫板不僅保有高導熱性,還增強了結構強度,顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步,有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術,將主機板和零件完全泡在不導電的特殊液體中,許多冷卻液會選擇沸點較低的物質,因此就像均溫板一樣,可以透過汽化來吸收掉大量的熱,形成泡泡向上浮,達到快速散熱的效果。

然而,因為水會導電,因此替代方案之一是氟化物。雖然效率差了一些,但至少可以用。然而氟化物的生產或廢棄時,很容易產生全氟/多氟烷基物質 PFAS,這是一種永久污染物,會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液,例如礦物油、其他油品,又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告,請繼續往下閱讀-----

另外,把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等,都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證,相信很快就能推出更強大的散熱模組。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
223 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
數智驅動未來:從信任到執行,AI 為企業創新賦能
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/13 ・4938字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文由 鼎新數智 與 泛科學 共同規劃與製作

你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?

馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?

-----廣告,請繼續往下閱讀-----
AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?圖/pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。

AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。

此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具,自己卻無法理解?

原因有二。首先,深度學習模型結構複雜,擁有數百萬參數,人類要追蹤每個輸入特徵如何影響最終決策結果,難度極高。例如,ChatGPT 中的 Transformer 模型,利用注意力機制(Attention Mechanism)根據不同詞之間的重要性進行特徵加權計算,因為機制本身涉及大量的矩陣運算和加權計算,這些數學操作使得整個模型更加抽象、不好理解。

-----廣告,請繼續往下閱讀-----

其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。圖/unsplash

試想,AI 協助診斷疾病時,若理由是基於醫生都無法理解的邏輯,患者即使獲得正確診斷,也會感到不安。畢竟,人們更相信能被理解的東西。

打開黑盒子:可解釋 AI 如何運作?我們要如何教育 AI?

首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。

-----廣告,請繼續往下閱讀-----

其次是局部解釋,LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈,它將每個特徵看作「玩家」,而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻,讓我們可以了解各個特徵如何影響最終結果。並且,SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的,還能透過「全局解釋」理解模型整體的運作中,哪些特徵最重要。

以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。

-----廣告,請繼續往下閱讀-----

第三是反事實解釋:如果改變一點點,會怎麼樣?

如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大,就像揭示一道菜中,哪些調味料是味道的關鍵。例如在金融風險預測中,模型可能指出「收入」影響了 40%,「消費習慣」占了 30%,「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時,還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術,才能達到更完整的解釋效果。

講到這裡,你可能會問:我們距離能完全信任 AI 還有多遠?又或者,我們真的應該完全相信它嗎?

-----廣告,請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。因此,AI 既要「可解釋」,也要「能代理」。

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。圖/unsplash

舉例來說,當一家公司要做一個看似「簡單」的決策時,背後的過程其實可能極為複雜。例如,快時尚品牌決定是否推出新一季服裝,不僅需要考慮過去的銷售數據,還得追蹤熱門設計趨勢、天氣預測,甚至觀察社群媒體上的流行話題。像是暖冬來臨,厚外套可能賣不動;或消費者是否因某位明星愛上一種顏色,這些細節都可能影響決策。

這些數據來自不同部門和來源,龐大的資料量與錯綜關聯使企業判斷變得困難。於是,企業常希望有個像經營大師的 AI 代理人,能吸收數據、快速分析,並在做決定時不僅給出答案,還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子,而可解釋 AI (XAI)則清楚解釋其判斷依據。例如,為什麼不建議推出厚外套?可能理由是:「根據天氣預測,今年暖冬概率 80%,過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告,請繼續往下閱讀-----

但會解釋還不夠,AI 還需能真正執行。這時,就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」,大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時,這位產品經理不會手忙腳亂,而是按以下步驟行動:

  1. 檢查倉庫物料:庫存夠不夠?有沒有替代料可用?
  2. 評估交期影響:如果需要新物料,供應商多快能送到?
  3. 計算成本變化:用新料會不會超出成本預算?
  4. 做出最優判斷,並自動生成變更單、工單和採購單,通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節,還會記錄每次決策結果,學習如何變得更高效。隨時間推移,這位「智慧產品經理」的判斷將更聰明、決策速度更快,幾乎不需人工干預。更重要的是,這些判斷是基於「以終為始」的原則,為企業成長目標(如 Q4 業績增長 10%)進行連續且動態地自我回饋,而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作,讓企業決策流程不僅透明,還能自動執行。這正是數智驅動的核心,不僅依靠數據驅動決策,還要能解釋每一個選擇,並自動行動。這個過程可簡化為 SUPA,即「感知(Sensing)→ 理解(Understanding)→ 規劃(Planning)→ 行動(Acting)」的閉環流程,隨著數據的變化不斷進化。

偉勝乾燥工業為例,他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後,偉勝成功將數智驅動融入業務與產品開發,專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合,開發出新形態智慧化設備,成功打入半導體產業,帶動業績大幅成長,創造下一個企業的增長曲線。

-----廣告,請繼續往下閱讀-----

值得一提的是,數智驅動不僅帶動業務增長,還讓員工擺脫繁瑣工作,讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術,還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用,企業首先要確保它服務於具體的業務需求,而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐,才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力?免費上手企業 AI 助理!👉 企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知:https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道,深入科技趨勢與議題內容。

👉立即免費加入

-----廣告,請繼續往下閱讀-----
鳥苷三磷酸 (PanSci Promo)_96
223 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
AI 能像人類一樣思考?諾貝爾物理學獎研究助力人工智慧模擬人類大腦
PanSci_96
・2024/11/14 ・2117字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

即使再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?畢竟電腦的電子元件和我們大腦中的神經細胞結構截然不同。再怎麼模仿,AI 終究無法以與生物相同的方式思考吧?

錯,可以。

2024 年諾貝爾物理學獎跌破所有專家的眼鏡,頒給了兩位研究機器學習的科學家——約翰·霍普菲爾德(John Hopfield)和傑佛瑞·辛頓(Geoffrey Hinton)。他們以「人工」的方法打造了類神經網路,最終模擬出生物的「智慧」,奠定了當代深度學習的基礎。

為什麼解決人工智慧發展瓶頸的,竟然會是物理學?物理要怎麼讓 AI 更像人類?

-----廣告,請繼續往下閱讀-----
歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

從巴甫洛夫的狗到赫布理論:理解學習的基礎

為了解答這個疑問,我們需要一些背景知識。

20 世紀初,俄羅斯心理學家巴甫洛夫發現,狗在食物還沒入口前,就會開始分泌唾液。他進行了一系列實驗,改變食物出現前的環境,比如讓狗習慣在聽到鈴聲後馬上得到食物。久而久之,狗只要聽到鈴聲,就會開始分泌唾液。

大約 50 年後,神經科學家赫布(Donald Hebb)提出了一個假說:大腦中相近的神經元,因為經常同時放電,會產生更強的連結。這種解釋稱為「赫布理論」,不僅奠定了神經心理學的發展,更成為現代深度學習的基礎。

然而,赫布理論雖然描述了鄰近神經元的關係,卻無法解釋大腦如何建構出如此複雜的聯想網路。

-----廣告,請繼續往下閱讀-----

霍普菲爾德網路:物理學家對神經網路的貢獻

然而,赫布理論雖能描述神經元之間的關係,卻缺乏數學模型。物理學家約翰·霍普菲爾德從數學家約翰·康威(John Conway)的「生命遊戲」(Game of Life)中獲得靈感,試圖建立一個可以在電腦上運行的記憶系統。

霍普菲爾德受「生命遊戲」啟發,嘗試建立電腦記憶系統。圖/envato

「生命遊戲」由數學家康威(John Conway)發明,玩家開始時有一個棋盤,每個格子代表一個細胞,細胞可以是「活」或「死」的狀態。根據特定規則,細胞會根據鄰居的狀態決定下一次的生存狀態。康威的目的是展示複雜的系統不一定需要複雜的規則。

霍普菲爾德發現,這個遊戲與赫布理論有強大的關聯性。大腦中的大量神經元,在出生時處於初始狀態,經過刺激後,神經元間的連結會產生或斷裂,形成強大的記憶系統。他希望利用這些理論,創造一個能在電腦上運行的記憶系統。

然而,他面臨一個難題:赫布理論沒有明確的數學模型來決定神經元連結的規則。而在電腦上運行,必須要有明確的數學規則。

-----廣告,請繼續往下閱讀-----

物理學的啟發:易辛模型

霍普菲爾德從物理學的研究中找到了類似的模型:易辛模型(Ising Model)。這個模型用於解釋鐵磁性物質的磁性特性。

在鐵磁性物質中,電子具有「自旋」,自旋產生磁矩。電子的自旋方向只有「向上」或「向下」,這就像生命遊戲中細胞的「生」或「死」。鄰近的電子會影響彼此的自旋方向,類似於細胞之間的互動。

易辛模型能用數學描述電子間的相互影響,並通過計算系統能量,得出自旋狀態的分佈。霍普菲爾德借用了這個概念,將神經元的互動視為電子自旋的互動。

他結合了康威生命遊戲的時間演化概念、易辛模型的能量計算,以及赫布理論的動態連結,創造了「霍普菲爾德網路」。這讓電腦能夠模擬生物大腦的學習過程。

-----廣告,請繼續往下閱讀-----

突破瓶頸:辛頓與波茲曼機

約翰·霍普菲爾德於1982年發明聯想神經網路,即「霍普菲爾網路」。圖/wikimedia

然而,霍普菲爾德網路並非完美。它容易陷入「局部最小值」的問題,無法找到系統的全局最優解。為了解決這個問題,加拿大計算機科學家傑佛瑞·辛頓(Geoffrey Hinton)提出了「波茲曼機」(Boltzmann Machine)。

辛頓將「模擬退火」的概念引入神經網路,允許系統以一定的機率跳出局部最小值,尋找全局最優解。他還引入了「隱藏層」的概念,將神經元分為「可見層」和「隱藏層」,提高了網路的學習能力。

受限波茲曼機(Restricted Boltzmann Machine)進一步簡化了模型,成為深度學習的基礎結構之一。這些創新使得 AI 能夠更有效地模擬人類的思維和學習過程。

AI 的未來:跨學科的融合

霍普菲爾德和辛頓的工作,將物理學的概念成功應用於人工智慧。他們的研究不僅解決了 AI 發展的瓶頸,還奠定了深度學習的基礎,對現代 AI 技術產生了深遠的影響。因此,2024 年諾貝爾物理學獎頒給他們,並非意外,而是對他們在跨學科領域的重大貢獻的肯定。

-----廣告,請繼續往下閱讀-----

AI 的發展,離不開物理學、生物學、數學等多學科的融合。霍普菲爾德和辛頓的工作,正是這種融合的典範。未來,隨著科學技術的進步,我們有理由相信,AI 將越來越接近人類的思維方式,甚至可能超越我們的想像。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

PanSci_96
1262 篇文章 ・ 2408 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。