0

6

1

文字

繁 | 简

0

6

1

Promo 專欄科學傳播科技能源

當前最快最準的AI偵測技術！辨識車輛只要一眼瞬間——YOLOv4

研之有物│中央研究院・2020/11/10 ・4055字・閱讀時間約 8 分鐘・SR值 554

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文轉載自中央研究院研之有物，泛科學為宣傳推廣執行單位。

採訪編輯｜郭雅欣、黃曉君；美術編輯｜林洵安

「只要讓我看一眼，我就知道這是什麼！（You Only Look Once，YOLO）」YOLO，是目前當紅的 AI 物件偵測演算法。中研院資訊科學研究所所長廖弘源及博士後研究員王建堯，與俄羅斯學者博科夫斯基（Alexey Bochkovskiy）共同研發最新的 YOLO 第四版（簡稱為 YOLO v4），一舉成為當前全世界最快、最高精準度的物件偵測系統，引爆全球 AI 技術社群，已然改寫物件偵測演算法的發展。究竟，他們在演算法裡動了哪些手腳？又是什麼樣的契機，開啟了這項研究？

產業出難題，學界來解題

故事，是從一項產學合作開始。前幾年，科技部提出了「產學共創」機制：產業出題、學界解題，中研院合作對象義隆電子，出了一個考題給資訊所：如何增進十字路口的交通分析？也就是即時偵測車流量、車速等等。當時義隆電子已經在十字路口架設了監視器，包括全景攝影機及單一方向的槍型攝影機，接下來最需要的，就是辨識車輛的物件偵測技術。

「但我們需要的不只是辨識車輛而已。」王建堯說。在馬路上運行中的車速度很快，物件辨識必須非常即時，在短時間內就能辨識出車輛，並能持續追蹤，計算車速。換句話說，這個技術對物件的偵測必須「快、狠、準」。此外，因為影像資料不斷產生，如果把資料都上傳雲端運算，不但比較耗時，也會給雲端電腦帶來太大的負擔，因此這個偵測技術還得做到一件事──計算量必須夠小，小到可裝在十字路口監視器上的小型計算器，即可完成物件偵測的任務。

要做到交通路況的即時分析，必須有一種速度快、仍能精準辨識，但又可應用在生活中小型計算器的物件偵測技術。

YOLOv4 演算法達到這個不可能的任務！它是目前世界最快、最精準的物件偵測演算法，卻又能小到放在十字路口的監視器內，已實際應用於如「智慧城市交通車流解決方案計畫」，即時偵測車輛、停等車列、車速等等。

-----廣告，請繼續往下閱讀-----

物件辨識的阿基里斯腱：梯度消失問題

怎麼辦到的？首先，王建堯著手研究著名物件偵測系統 YOLOv3 ，「我們想找出在建立一個物件偵測系統時，哪一個步驟是最關鍵的？如果改善了，效率和精確度會提升最多？」廖弘源強調：「雖然是工程問題，但我們要把科學思考帶進來。」

先來認識物件偵測技術！它是個卷積神經網路（Convolutional Neural Network，簡稱 CNN），具有許多網路層，每一層負責抽取某些圖像特徵。一個輸入的影像通過層層層層層層……分析，最後找出最可能的答案。理論上，層數越多、判斷結果應該越精確。

先教電腦定義每個影像的值，再透過神經網路的層層非線性函數運算，判斷這個影像最可能為哪個數字，信心水準比值最高者為答案。圖│研之有物（資料來源│李宏毅）

訓練這個卷積神經網路的方法是：先倒入大量已標記正確答案的學習材料（如標記好各種車輛的圖片），讓機器學習如何判斷。每次機器判斷結果與正確答案不符，就將這個資訊反饋到前面的網路層，調整每一層的參數，以期下次達到更準確的判斷。

那麼，哪一步改善後可以大幅提升表現呢？王建堯找到的關鍵是：學習的反饋過程。當卷積神經網路的網路層數愈多，在訓練階段，因為反饋計算方式，每回傳一層就會損失一些資訊，越前面的網路層學習到的東西越少，稱為「梯度消失問題」（vanishing gradient problem）。

-----廣告，請繼續往下閱讀-----

為了解決梯度消失問題，前人曾經提出 ResNet、DenseNet 等等卷積神經網路，簡單來說，即是將後面資料備份後往前「跳級」傳遞！以 ResNet 為例，我們可以想像成「含水傳話」，從最後一個人往前傳，愈前面的人資訊愈缺失。但如果最後一層開始，每一層都備份錄音，再把錄音跳過一層直接往前傳，那麼前面的所有層都可接收到資訊，前面網路層就不會學不到東西。

上圖為原始的卷積神經網路（CNN），假設只有三層，在資料回傳的過程中會逐層遞減，稱為梯度消失問題。下圖為改良版 ResNet ，從最後一層開始，每一層都備份，再把備份越過一層「跳級」傳遞，前面網路層就能接收到後面的資訊。圖│研之有物（資料來源│王建堯）

然而，ResNet 具有太多重複的拷貝，不但浪費計算量，而且不同層的參數用來學習重複、但多餘的資訊，換句話說，每一層能學到的東西都差不多。「是否有一種更好的方式，在不改參數量，讓機器運算變快，省下來的資源（參數）還能讓機器多學一點，提高精確度？」廖弘源說。

不只最快，還要最精準！

2019 年年初，廖弘源與王建堯團隊首先研發出局部殘差網路 PRNet（partial residual networks, PRNet），將資訊「分流」，減少無謂的計算量，使運算速度增加兩倍。「一開始做出 PRNet，我還是覺得效果不夠好。雖然減少計算量，大幅加快了計算的速度，但是正確率和原本相比並沒有什麼提升。」廖弘源自信的說：「我覺得這樣沒什麼意思，因為我們的目標，是做出全世界最好的物件偵測技術！」

2019 年 11 月，他們在 PRNet 的基礎上，緊接著研發出跨階段局部網路 CSPNet（cross stage partial network, CSPNet），利用分割—分流—合併的路徑，成功達到了大幅減少計算量、卻能增加學習多元性的目標。

-----廣告，請繼續往下閱讀-----

從 PRNet 與 CSPNet，我們一步步把物件偵測的計算量減低，但是學習卻能更多元，因此也得到更好的精確度。

以上為 CSPNet 簡化結構的一部分，三色箭頭代表機器學習過程中，後面的資料如何反饋往前傳。這個設計的重點在於資訊的分流與多了過渡層（Transtion），讓反饋的學習資訊在分流後產生差異，提高每一網路層參數的利用率，目標是讓機器學到更多樣的東西，提高判斷的精確度。另一方面，因為資料分流的關係，有部分直接往後傳，不經過分析計算，使整個計算量變少，運算速度也因此加快。圖│研之有物（資料來源│王建堯）

「我們發表 CSPNet 之後，吸引 YOLO 技術的維護者博科夫斯基（Alexey Bochkovskiy）的注意。」廖弘源說。他們很快與博科夫斯基（Alexey Bochkovskiy）展開合作，將 CSPNet 用於開發新一代的 YOLO，並於今年 4 月發表了 YOLOv4，成為當前全世界最快、最準的物件偵測技術，引爆全球的 AI 社群。廖弘源笑說：「我們 4 月發表的論文，短短不到三個月，閱讀次數就超過了 1400 次，比我以往發表的任何論文都還多。」其中的關鍵技術正是 CSPNet。

此外，由於 YOLOv4 的技術是開放的，各式各樣的應用也如雨後春筍般快速出現。舉例來說，YOLOv4 可即時偵測人們的社交距離，或是快速判斷路上的行人有沒有戴口罩。

YOLOv4 甚至能辨識並捕捉滑雪運動中的人，廖弘源進一步解釋：「滑雪的人姿勢以及運動軌跡都不斷變換，甚至可能拋物線飛起，偵測難度相當高，但 YOLOv4 都能追蹤得非常精準。」

帶學生的第一要求：把科學帶進來！

中研院資訊所所長廖弘源長期研究多媒體視訊處理，從雞尾酒浮水印到人臉資料庫、數位化影片修補等，再到這次的 YOLOv4 物件偵測技術，研究成果卓越。而每一項成果的後面，都是廖弘源帶領資訊所前後屆學生一起努力的成果。

-----廣告，請繼續往下閱讀-----

想在廖弘源的實驗室工作，可不是件輕鬆的事。他說：「做研究，不該只想著工程問題，應該本著科學家的精神，從中找出最具科學價值的關鍵下手。」許多學生一到廖弘源的實驗室，必須將過去狹隘、僵化的工程解題模式打掉重練，重新以科學看待問題。例如：本次 YOLOv4 的成功關鍵，即在於一開始問了個好問題，找到最值得改善的環節。

不論面對的是何種問題，我的第一個要求，就是把科學帶進來。

儘管治學甚嚴，個性海派的廖弘源和學生也有著亦師亦友的關係。他喜歡和學生一起找出好的研究議題後，一起埋首投入研究工作的熱血感，也喜歡在研究遭遇瓶頸時，與學生一起「大吃一頓解憂愁」。如今，他的學生遍布國際級知名公司與研究單位，持續發揮「廖式思考」的深刻影響力，開發更多如 YOLOv4 般頂尖的科研成果。

雖然團隊屢屢創造具商機的研究成果，但廖弘源對於獎項或是申請專利等，卻是看得很淡。「我的目的本來就不是賺錢，」廖弘源說：「我只希望我們對世界的好奇與探索，能真正轉化為對人類的貢獻。」

中研院記者會合影。由左到右，義隆電子葉儀皓董事長、中研院周美吟副院長、中研院資訊所廖弘源特聘研究員、中研院資訊所王建堯博士後研究員、科技部前瞻司楊琇雅司長、台大人工智慧研究中心陳信希主任、杜維洲執行長。圖│研之有物（中研院秘書處）

延伸閱讀

本文轉載自中央研究院研之有物，原文為《一眼揪出你有沒有超速！世界第一物件偵測技術： YOLOv4》，泛科學為宣傳推廣執行單位

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

研之有物│中央研究院

296 篇文章・ 3650 位粉絲

研之有物，取諧音自「言之有物」，出處為《周易·家人》：「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活，成為串聯您與中研院的橋梁，通往博大精深的知識世界。網頁：研之有物臉書：研之有物@Facebook

TRENDING 熱門討論

即時熱門

0

文字

純淨之水的追尋—濾水技術如何改變我們的生活？

鳥苷三磷酸 (PanSci Promo) ・2025/04/17 ・3142字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文與 BRITA 合作，泛科學企劃執行。

你確定你喝的水真的乾淨嗎？

如果你回到兩百年前，試圖喝一口當時世界上最大城市的飲用水，可能會立刻放下杯子——那水的顏色帶點黃褐，氣味刺鼻，甚至還飄著肉眼可見的雜質。十九世紀倫敦泰晤士河的水，被戲稱為「流動的污水」，當時的人們雖然知道水不乾淨，但卻無力改變，導致霍亂和傷寒等疾病肆虐。

十九世紀倫敦泰晤士河的水，被戲稱為「流動的污水」(圖片來源 / freepik)

幸運的是，現代自來水處理系統已經讓我們喝不到這種「肉眼可見」的污染物，但問題可還沒徹底解決。面對 21 世紀的飲水挑戰，哪些技術真正有效？

-----廣告，請繼續往下閱讀-----

濾水技術：從霍亂危機到高效濾芯

19 世紀的歐洲因為城市人口膨脹與工業發展，面臨了前所未有的水污染挑戰。當時多數城市的供水系統仍然依賴河流、湖泊，甚至未經處理的地下水，導致傳染病肆虐。

1854 年，英國醫生約翰·斯諾（John Snow）透過流行病學調查，發現倫敦某口公共水井與霍亂爆發直接相關，這是歷史上首次確立「飲水與疾病傳播的關聯」。這項發現徹底改變了各國政府對供水系統的態度，促使公衛政策改革，加速了濾水與消毒技術的發展。到了 20 世紀初，英國、美國等國開始在自來水中加入氯消毒，成功降低霍亂、傷寒等水媒傳染病的發生率，這一技術迅速普及，成為現代供水安全的基石。

19 世紀末的台灣同樣深受傳染病困擾，尤其是鼠疫肆虐。1895 年割讓給日本後，惡劣的衛生條件成為殖民政府最棘手的問題之一。1896 年，後藤新平出任民政長官，他本人曾參與東京自來水與下水道系統的規劃建設，對公共衛生系統有深厚理解。為改善台灣水源與防疫問題，他邀請了曾參與東京水道工程的英籍技師 W.K. 巴爾頓（William Kinnimond Burton） 來台，規劃現代化的供水設施。在雙方合作下，台灣陸續建立起結合過濾、消毒、儲水與送水功能的設施。到 1917 年，全台已有 16 座現代水廠，有效改善公共衛生，為台灣城市化奠定關鍵基礎。

-----廣告，請繼續往下閱讀-----

進入 20 世紀，人們已經可以喝到看起來乾淨的水，但問題真的解決了嗎？科學家如今發現，水裡仍然可能殘留奈米塑膠、重金屬、農藥、藥物代謝物，甚至微量的內分泌干擾物，這些看不見、嚐不出的隱形污染，正在成為21世紀的飲水挑戰。也因此，濾水技術迎來了一波科技革新，活性碳吸附、離子交換樹脂、微濾、逆滲透（RO）等技術相繼問世，各有其專長：

• 活性碳吸附：去除氯氣、異味與部分有機污染物

• 離子交換樹脂：軟化水質，去除鈣鎂離子，減少水垢

• 微濾技術、逆滲透（RO）技術：攔截細菌與部分微生物，過濾重金屬與污染物等

-----廣告，請繼續往下閱讀-----

這些技術相互搭配，能夠大幅提升飲水安全，然而，無論技術如何進步，濾芯始終是濾水設備的核心。一個設計優良的濾芯，決定了水質能否真正被淨化，而現代濾水器的競爭，正是圍繞著「如何打造更高效、更耐用、更智能的濾芯」展開的。於是，最關鍵的問題就在於到底該如何確保濾芯的效能？

濾芯的壽命與更換頻率：濾水效能的關鍵時刻濾芯，雖然是濾水器中看不見的內部構件，卻是決定水質純淨度的核心。以德國濾水品牌 BRITA 為例，其濾芯技術結合椰殼活性碳和離子交換樹脂，能有效去除水中的氯、除草劑、殺蟲劑及藥物殘留等化學物質，並過濾鉛、銅等重金屬，同時軟化水質，提升口感。

然而，隨著市場需求的增長，非原廠濾芯也悄然湧現，這不僅影響濾水效果，更可能帶來健康風險。據消費者反映，同一網路賣場內便可輕易購得真假 BRITA 濾芯，顯示問題日益嚴重。為確保飲水安全，建議消費者僅在實體官方授權通路或網路官方直營旗艦店購買濾芯，避免誤用來路不明的濾芯產品讓自己的身體當過濾器。

辨識濾芯其實並不難——正品 BRITA 濾芯的紙盒下方應有「台灣碧然德」的進口商貼紙，正面則可看到 BRITA 商標，以及「4週換放芯喝」的標誌。塑膠袋外包裝上同樣印有 BRITA 商標。濾芯本體的上方會有兩個浮雕的 BRITA 字樣，並且沒有拉環設計，底部則標示著創新科技過濾結構。購買時仔細留意這些細節，才能確保濾芯發揮最佳過濾效果，讓每一口水都能保證潔淨安全。

-----廣告，請繼續往下閱讀-----

濾芯本體的上方會有兩個浮雕的 BRITA 字樣，並且沒有拉環設計 (圖片來源 / BRITA)

不過，即便是正品濾芯，其效能也非永久不變。隨著使用時間增加，濾芯的孔隙會逐漸被污染物堵塞，導致過濾效果減弱，濾水速度也可能變慢。而且，濾芯在拆封後便接觸到空氣，潮濕的環境可能會成為細菌滋生的溫床。如果長期不更換濾芯，不僅會影響過濾效能，還可能讓積累的微小污染物反過來影響水質，形成「過濾器悖論」（Filter Paradox）：本應淨化水質的裝置，反而成為污染源。為此，BRITA 建議每四週更換一次濾芯，以維持穩定的濾水效果。

為了解決使用者容易忽略更換時機的問題，BRITA 推出了三大智慧提醒機制，確保濾芯不會因過期使用而影響水質：

1. Memo 或 LED 智慧濾芯指示燈：即時監測濾芯狀況，顯示剩餘效能，讓使用者掌握最佳更換時間。

2. QR Code 掃碼電子日曆提醒：掃描包裝外盒上的 QR Code 記錄濾芯的使用時間，自動提醒何時該更換，減少遺漏。

-----廣告，請繼續往下閱讀-----

3. LINE 官方帳號自動通知：透過 LINE 推送更換提醒，確保用戶不會因忙碌而錯過更換時機。

在濾水技術日新月異的今天，濾芯已不僅僅是過濾裝置，更是智慧監控的一部分。如何挑選最適合自己需求的濾水設備，成為了健康生活的關鍵。

濾水技術：不僅是進步，更是守護未來

人類對潔淨飲用水的追求，從未停止。19世紀，隨著城市化與工業化發展，水污染問題加劇並引發霍亂等疾病，促使濾水技術迅速發展。20世紀，氯消毒技術普及，進一步保障了水質安全。隨著科技進步，現代濾水技術透過活性碳、離子交換等技術，去除水中的污染物，讓每一口水更加潔淨與安全。

-----廣告，請繼續往下閱讀-----

今天，消費者不再單純依賴公共供水系統，而是能根據自身需求選擇適合的濾水設備。例如，BRITA 提供的「純淨全效型濾芯」與「去水垢專家濾芯」可針對不同需求，從去除餘氯、過濾重金屬到改善水質硬度等問題，去水垢專家濾芯的去水垢能力較純淨全效型濾芯提升50%，並通過 SGS 檢測，通過國家標準水質檢測「可生飲」，讓消費者能安心直飲。

然而，隨著環境污染問題的加劇，真正的挑戰在於如何減少水污染，並確保每個人都能擁有乾淨水源。科技不僅是解決問題的工具，更應該成為守護未來的承諾。濾水器不僅是家用設備，它象徵著人類與自然的對話，提醒我們水的純淨不僅是技術的勝利，更是社會的責任和對未來世代的承諾。

*符合濾(淨)水器飲用水水質檢測技術規範所列9項「金屬元素」及15項「揮發性有機物」測試
*僅限使用合格自來水源，且住宅之儲水設備至少每6-12個月標準清洗且無受汙染之虞

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

224 篇文章・ 313 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

1

0

文字

數智驅動未來：從信任到執行，AI 為企業創新賦能

鳥苷三磷酸 (PanSci Promo) ・2025/01/13 ・4938字・閱讀時間約 10 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文由鼎新數智與泛科學共同規劃與製作

你有沒有想過，當 AI 根據病歷與 X 光片就能幫你診斷病症，或者決定是否批准貸款，甚至從無人機發射飛彈時，它的每一步「決策」是怎麼來的？如果我們不能知道 AI 的每一個想法步驟，對於那些 AI 輔助的診斷和判斷，要我們如何放心呢？

馬斯克與 OpenAI 的奧特曼鬧翻後，創立了新 AI 公司 xAI，並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型，而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今，AI 已滲透生活各處，而我們對待它的方式卻像求神問卜，缺乏科學精神。如何讓 AI 具備可解釋性，成為當前關鍵問題？

-----廣告，請繼續往下閱讀-----

AI 已滲透生活各處，而我們對待它的方式卻像求神問卜，缺乏科學精神。如何讓 AI 具備可解釋性，成為當前關鍵問題？圖／pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題？試想，現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險，但這些模型往往如同黑箱操作。有人貸款被拒，卻完全不知原因，感覺就像被分手卻不告訴理由。更嚴重的是，AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價，這些與信用風險真的相關嗎？這種不透明性只會讓弱勢群體更難融入金融體系，加劇貧富差距。這種不透明性，會讓原本就已經很難融入金融體系的弱勢群體，更加難以取得貸款，讓貧富差距越來越大，雪上加霜。

AI 不僅影響貸款，還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑，試圖預測嫌犯再犯風險。然而，這些工具被發現對有色人種特別不友好，往往給出偏高的再犯風險評估，導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是，這些決策缺乏透明度，AI 做出的決策根本沒法解釋，這讓嫌犯和律師無法查明問題根源，結果司法公正性就這麼被悄悄削弱了。

此外，AI 在醫療、社交媒體、自駕車等領域的應用，也充滿類似挑戰。例如，AI 協助診斷疾病，但若原因報告無法被解釋，醫生和患者又怎能放心？同樣地，社群媒體或是 YouTube 已經大量使用 AI 自動審查，以及智慧家居或工廠中的黑盒子問題，都像是一場越來越複雜的魔術秀——我們只看到結果，卻無法理解過程。這樣的情況下，對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具，自己卻無法理解？

原因有二。首先，深度學習模型結構複雜，擁有數百萬參數，人類要追蹤每個輸入特徵如何影響最終決策結果，難度極高。例如，ChatGPT 中的 Transformer 模型，利用注意力機制（Attention Mechanism）根據不同詞之間的重要性進行特徵加權計算，因為機制本身涉及大量的矩陣運算和加權計算，這些數學操作使得整個模型更加抽象、不好理解。

-----廣告，請繼續往下閱讀-----

其次，深度學習模型會會從資料中學習某些「特徵」，你可以當作 AI 是用畫重點的方式在學習，人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習，但這些特徵往往對人類來說過於抽象。例如在影像辨識中，人類習慣用眼睛、嘴巴的相對位置，或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵，而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示（Distributed Representation）來編碼特徵，意思是將一個特徵表示為一個高維向量，每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」，在傳統的方式下，你可能用一個簡單的詞來表示這個特徵，例如「紅色」或「藍色」。但是在深度學習中，這個「顏色」特徵可能被表示為一個包含許多數字的高維向量，向量中的每個數字表示顏色的不同屬性，比如亮度、色調等多個數值。對 AI 而言，這是理解世界的方式，但對人類來說，卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」，在傳統的方式下，你可能用一個簡單的詞來表示這個特徵，例如「紅色」或「藍色」。但是在深度學習中，這個「顏色」特徵可能被表示為一個包含許多數字的高維向量，向量中的每個數字表示顏色的不同屬性，比如亮度、色調等多個數值。圖／unsplash

試想，AI 協助診斷疾病時，若理由是基於醫生都無法理解的邏輯，患者即使獲得正確診斷，也會感到不安。畢竟，人們更相信能被理解的東西。

打開黑盒子：可解釋 AI 如何運作？我們要如何教育 AI？

首先，可以利用熱圖（heatmap）或注意力圖這類可視化技術，讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡，來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中，當 AI 判斷這張照片裡是「貓」還是「狗」時，我需要它向我們展示在哪些地方「盯得最緊」，像是耳朵的形狀還是毛色的分布。

-----廣告，請繼續往下閱讀-----

其次是局部解釋，LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈，它將每個特徵看作「玩家」，而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻，讓我們可以了解各個特徵如何影響最終結果。並且，SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的，還能透過「全局解釋」理解模型整體的運作中，哪些特徵最重要。

以實際的情景來說，SHAP 可以讓 AI 診斷出你有某種疾病風險時，指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同，會針對單一個案建立一個簡單的模型，來近似原始複雜模型的行為，目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時，LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用，一大優勢是靈活且計算速度快，適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景，LIME 可以幫助醫生理解 AI 為何推薦某種治療方案，並說明幾個主要原因，這樣醫生不僅能更快做出決策，也能增加患者的信任感。

-----廣告，請繼續往下閱讀-----

第三是反事實解釋：如果改變一點點，會怎麼樣？

如果 AI 告訴你：「這家銀行不會貸款給你」，這時你可能會想知道：是收入不夠，還是年齡因素？這時你就可以問 AI：「如果我年輕五歲，或者多一份工作，結果會怎樣？」反事實解釋會模擬這些變化對結果的影響，讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大，就像揭示一道菜中，哪些調味料是味道的關鍵。例如在金融風險預測中，模型可能指出「收入」影響了 40%，「消費習慣」占了 30%，「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時，還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術，才能達到更完整的解釋效果。

講到這裡，你可能會問：我們距離能完全信任 AI 還有多遠？又或者，我們真的應該完全相信它嗎？

-----廣告，請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事，你自然希望它的決策與行動能讓你認可，幫你省心省力。因此，AI 既要「可解釋」，也要「能代理」。

當未來你和 AI 同事深度共事，你自然希望它的決策與行動能讓你認可，幫你省心省力。圖／unsplash

舉例來說，當一家公司要做一個看似「簡單」的決策時，背後的過程其實可能極為複雜。例如，快時尚品牌決定是否推出新一季服裝，不僅需要考慮過去的銷售數據，還得追蹤熱門設計趨勢、天氣預測，甚至觀察社群媒體上的流行話題。像是暖冬來臨，厚外套可能賣不動；或消費者是否因某位明星愛上一種顏色，這些細節都可能影響決策。

這些數據來自不同部門和來源，龐大的資料量與錯綜關聯使企業判斷變得困難。於是，企業常希望有個像經營大師的 AI 代理人，能吸收數據、快速分析，並在做決定時不僅給出答案，還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子，而可解釋 AI （XAI）則清楚解釋其判斷依據。例如，為什麼不建議推出厚外套？可能理由是：「根據天氣預測，今年暖冬概率 80%，過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告，請繼續往下閱讀-----

但會解釋還不夠，AI 還需能真正執行。這時，就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」，大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時，這位產品經理不會手忙腳亂，而是按以下步驟行動：

檢查倉庫物料：庫存夠不夠？有沒有替代料可用？
評估交期影響：如果需要新物料，供應商多快能送到？
計算成本變化：用新料會不會超出成本預算？
做出最優判斷，並自動生成變更單、工單和採購單，通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節，還會記錄每次決策結果，學習如何變得更高效。隨時間推移，這位「智慧產品經理」的判斷將更聰明、決策速度更快，幾乎不需人工干預。更重要的是，這些判斷是基於「以終為始」的原則，為企業成長目標（如 Q4 業績增長 10%）進行連續且動態地自我回饋，而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作，讓企業決策流程不僅透明，還能自動執行。這正是數智驅動的核心，不僅依靠數據驅動決策，還要能解釋每一個選擇，並自動行動。這個過程可簡化為 SUPA，即「感知（Sensing）→ 理解（Understanding）→ 規劃（Planning）→ 行動（Acting）」的閉環流程，隨著數據的變化不斷進化。

以偉勝乾燥工業為例，他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後，偉勝成功將數智驅動融入業務與產品開發，專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合，開發出新形態智慧化設備，成功打入半導體產業，帶動業績大幅成長，創造下一個企業的增長曲線。

-----廣告，請繼續往下閱讀-----

值得一提的是，數智驅動不僅帶動業務增長，還讓員工擺脫繁瑣工作，讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術，還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用，企業首先要確保它服務於具體的業務需求，而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐，才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力？免費上手企業 AI 助理！企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知：https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道，深入科技趨勢與議題內容。
立即免費加入

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

鳥苷三磷酸 (PanSci Promo)

224 篇文章・ 313 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

1

0

文字

從遊戲到量子計算：NVIDIA 憑什麼在 AI 世代一騎絕塵？

PanSci ・2025/01/09 ・2941字・閱讀時間約 6 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

AI 與 GPU 的連結：為什麼 NVIDIA 股價一路飆？

2023 年至今，人工智慧（AI）熱潮引爆全球科技圈的競爭與創新，但最受矚目的企業，莫過於 NVIDIA。它不僅長期深耕遊戲顯示卡市場，在近年來卻因為 AI 應用需求的飆升，一舉躍居市值龍頭。原因何在？大家可能會直覺認為：「顯示卡性能強，剛好給 AI 訓練用！」事實上，真正的關鍵並非只有強悍的硬體，而是 NVIDIA 打造的軟硬體整合技術──CUDA。

接下來將為你剖析 CUDA 與通用圖形處理（GPGPU）的誕生始末，以及未來 NVIDIA 持續看好的量子計算與生醫應用，一窺這家企業如何從「遊戲顯示卡大廠」蛻變為「AI 世代的領航者」。

CPU vs. GPU：為何顯示卡能成為 AI 領跑者？

在電腦運作中，CPU（中央處理器）向來是整個系統的「大腦」，負責執行指令、邏輯判斷與多樣化的運算。但是，AI 模型訓練需要面對的是龐大的數據量與繁複的矩陣或張量運算。這些運算雖然單一步驟並不複雜，但需要進行「海量且重複性極高」的計算，CPU 難以在短時間內完成。

反觀 GPU（圖形處理器），原先是用來處理遊戲畫面渲染，內部具有 大量且相對簡單的算術邏輯單元。GPU 可以同時在多個核心中進行平行化運算，就像一座「高度自動化、流水線式」的工廠，可一次處理大量像素、頂點或是 AI 訓練所需的運算。這讓 GPU 在大量數值計算上遠遠超越了 CPU 的處理速度，也讓「顯示卡算 AI」成了新時代的主流。

-----廣告，請繼續往下閱讀-----

顯示卡不只渲染：GPGPU 與 CUDA 的誕生

早期，GPU 只被視為遊戲繪圖的利器，但 NVIDIA 的創辦人黃仁勳很快察覺到：這種多核心平行化的結構，除了渲染，也能用來處理科學運算。於是，NVIDIA 在 2007 年正式推出了名為 CUDA（Compute Unified Device Architecture） 的平台。這是一套讓開發者能以熟悉的程式語言（如 C、C++、Python）來調用 GPU 資源的軟體開發工具套件，解決了「人類要如何對 GPU 下指令」的問題。

在 CUDA 出現之前，若要把 GPU 用於渲染以外的用途，往往必須透過「著色器語言」或 OpenGL、DirectX 等繪圖 API 進行繁瑣的間接操作。對想用 GPU 加速數學或科學研究的人來說，門檻極高。然而，有了 CUDA，開發者不需理解圖像著色流程，也能輕鬆呼叫 GPU 的平行運算能力。這代表 GPU 從遊戲卡一躍成為「通用圖形處理單元」（GPGPU），徹底拓展了它在科學研究、AI、影像處理等領域的應用版圖。

AI 崛起的臨門一腳：ImageNet 大賽的關鍵一擊

如果說 CUDA 是 NVIDIA 邁向 AI 領域的踏腳石，那麼真正讓 GPU 與 AI 完美結合的轉捩點，發生在 2012 年的 ImageNet 大規模視覺辨識挑戰賽（ILSVRC）。這場由李飛飛教授創辦的影像辨識競賽中，參賽團隊需要對龐大的影像數據進行訓練、分類及辨識。就在那一年，名為「AlexNet」的深度學習模型橫空出世，利用 GPU 進行平行運算，大幅減少了訓練時間，甚至比第二名的辨識率高出將近 10 個百分點，震撼了全球 AI 研究者。

AlexNet 的成功，讓整個學界與業界都注意到 GPU 在深度學習中的強大潛力。CUDA 在此時被奉為「不二之選」，再加上後來發展的 cuDNN 等深度學習函式庫，讓開發者不必再自行編寫底層 GPU 程式碼，建立 AI 模型的難度與成本大幅降低，NVIDIA 的股價也因此搭上了 AI 波浪，一飛沖天。

-----廣告，請繼續往下閱讀-----

為什麼只有 NVIDIA 股價衝？對手 AMD、Intel 在做什麼？

市面上有多家廠商生產 CPU 和 GPU，例如 AMD 與 Intel，但為什麼只有 NVIDIA 深受 AI 市場青睞？綜觀原因，硬體只是其一，真正不可或缺的，是 「軟硬體整合」與「龐大的開發者生態系」。

硬體部分 NVIDIA 長年深耕 GPU 技術，產品線完整，且數據中心級的顯示卡在能耗與性能上具領先優勢。軟體部分 CUDA 及其相關函式庫生態，涵蓋了影像處理、科學模擬、深度學習（cuDNN）等多方面，讓開發者易於上手且高度依賴。

相比之下，雖然 AMD 也推行了 ROCm 平台、Intel 有自家解決方案，但在市場普及度與生態支持度上，依舊與 NVIDIA 有相當差距。

聰明的管理者

GPU 的優勢在於同時有成百上千個平行運算核心。當一個深度學習模型需要把數據切分成無數個小任務時，CUDA 負責將這些任務合理地排班與分配，並且在記憶體讀寫方面做出最佳化。

-----廣告，請繼續往下閱讀-----

任務分類：同性質的任務集中處理，以減少切換或等待。
記憶體管理：避免資料在 CPU 與 GPU 之間頻繁搬移，能大幅提升效率。
函式庫支援：如 cuDNN，針對常見的神經網路操作（卷積、池化等）做進一步加速，使用者不必從零開始撰寫平行運算程式。

結果就是，研究者、工程師甚至學生，都能輕鬆把 GPU 能力用在各式各樣的 AI 模型上，訓練速度自然飛漲。

從 AI 到量子計算：NVIDIA 對未來的佈局

當 AI 波浪帶來了股價與市值的激增，NVIDIA 並沒有停下腳步。實際上，黃仁勳與團隊還在積極耕耘下一個可能顛覆性的領域──量子計算。

2023 年，NVIDIA 推出 CUDA Quantum 平台，嘗試將量子處理器（QPU）與傳統 GPU / CPU 整合，以混合式演算法解決量子電腦無法單獨加速的部分。就像為 AI 量身打造的 cuDNN 一樣，NVIDIA 也對量子計算推出了相對應的開發工具，讓研究者能在 GPU 上模擬量子電路，或與量子處理器協同運算。

NVIDIA 推出 CUDA Quantum 平台，整合 GPU 與 QPU，助力混合量子運算。圖／unsplash

這項新布局，或許還需要時間觀察是否能孕育出市場級應用，但顯示 NVIDIA 對「通用運算」的野心不只停留於 AI，也想成為「量子時代」的主要推手。

-----廣告，請繼續往下閱讀-----

AI 熱潮下，NVIDIA 凭什麼坐穩王座？

回到一開始的疑問：「為什麼 AI 熱，NVIDIA 股價就一定飛？」 答案可簡化為兩點：

硬體領先 + 軟體生態：顯示卡性能強固然重要，但 CUDA 建立的開發者生態系才是關鍵。
持續布局未來：當 GPU 為 AI 提供高效能運算平台，NVIDIA 亦不斷將資源投入到量子計算、生醫領域等新興應用，為下一波浪潮預先卡位。

或許，正因為不斷探索新技術與堅持軟硬整合策略，NVIDIA 能在遊戲市場外再創一個又一個高峰。雖然 AMD、Intel 等競爭者也全力追趕，但短期內想撼動 NVIDIA 的領先地位，仍相當不易。

未來，隨著 AI 技術持續突破，晶片性能與通用運算需求只會節節攀升。「AI + CUDA + GPU」 的組合，短時間內看不出能被取代的理由。至於 NVIDIA 是否能繼續攀向更驚人的市值高峰，甚至在量子計算跑道上再拿下一座「王者寶座」，讓我們拭目以待。

歡迎訂閱 Pansci Youtube 頻道 鎖定每一個科學大事件！

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

PanSci

1262 篇文章・ 2411 位粉絲

PanSci的編輯部帳號，會發自產內容跟各種消息喔。

TRENDING 熱門討論

即時熱門

當前最快最準的AI偵測技術！辨識車輛只要一眼瞬間——YOLOv4

產業出難題，學界來解題

物件辨識的阿基里斯腱：梯度消失問題

不只最快，還要最精準！

帶學生的第一要求：把科學帶進來！

延伸閱讀

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

黑盒子模型背後的隱藏秘密

為什麼人類設計的 AI 工具，自己卻無法理解？

打開黑盒子：可解釋 AI 如何運作？我們要如何教育 AI？

我們終究是想解決人與 AI 的信任問題

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

AI 與 GPU 的連結：為什麼 NVIDIA 股價一路飆？

CPU vs. GPU：為何顯示卡能成為 AI 領跑者？

顯示卡不只渲染：GPGPU 與 CUDA 的誕生

AI 崛起的臨門一腳：ImageNet 大賽的關鍵一擊

為什麼只有 NVIDIA 股價衝？對手 AMD、Intel 在做什麼？

聰明的管理者

從 AI 到量子計算：NVIDIA 對未來的佈局

AI 熱潮下，NVIDIA 凭什麼坐穩王座？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見