2

14

2

文字

繁 | 简

2

14

2

好書搶先看文明足跡社會群體科學傳播科技能源電腦資訊

目前超夯的 AI 前瞻技術「深度學習」，用手機就可以跟數位替身對話——《 AI 大局》

PanSci ・2020/12/24 ・1577字・閱讀時間約 3 分鐘・SR值 565

・九年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

編按：深度學習是目前AI發展的核心技術，特別是在影像辨識和自然語言的處理，最能發揮優勢，本篇文章將介紹最具代表性的深度學習技術和最新的應用案例。

CNN（卷積神經網路）的架構

CNN 原本的設計是用來模仿人類視覺功能，因此影像辨識是其主要的應用，
最近已經逐漸擴大應用範圍，訊號和自然語言處理也開始使用 CNN 了。

卷積神經網路 (Convolutional Neural Network，CNN) 是一種神經
網路模型，常用來處理規則排列的影像資料。CNN 這個名稱是從處理時使
用名為卷積 (convolution) 的數學運算而來。
下圖是 CNN 神經網路的基本架構，從圖中可以看到在輸入層和輸出層
之間，多了卷積層和池化層，兩者可以視為是一種過濾器。

RNN（循環神經網路）的架構

RNN 與 CNN 都是最具代表性的深度學習模型。RNN 很擅長自然語言處理這類時間序列的資料，近來也常用於物聯網與機器異常檢測的應用。

RNN（Recurrent Neural Network，循環神經網路）是可以處理不定長度資料的神經網路。下圖說明了 RNN 的基礎結構。從圖中可以看出 RNN與 CNN 最大的不同在於，RNN 具有回饋 (Feedback) 機制，也就是在隱藏層中輸入前一次的輸出值 h。

-----廣告，請繼續往下閱讀-----

生成模型與 GAN（對抗式生成網路）——生成影像資料的技術

深度學習不僅可以辨識影像和聲音，也可以用來產生新資料。近年來，用神經
網路來生成文章、影像等技術不斷提升，相關的商業應用正不斷擴大發展中。

機器學習的分類模型有識別模型 (Discriminative Model) 和生成模型 (Generative Model) 兩種。常見的識別模型能預測輸入資料屬於各類別的機率，例如用 CNN 識別影像，並得到像狗 80 ％、貓 20 ％的機率輸出。

生成模型也會輸出屬於各類別的機率，但會先從大量的訓練資料中，推導出各類別適合的機率分佈，然後在預測新資料時，即可依新資料的分佈結果計算其機率。這裡所謂的機率分佈就如下圖所示，假設資料有 ○ 和 × 兩個類別，依照各類別樣本分佈的情形，就可推測出其機率分佈的範圍，也就是圖中橢圓的部份，而越靠近橢圓中心的資料，有較高的機率屬於該類別。

結合數位替身與 AI 生物辨識的行動銀行

美國的軟體公司 Sensory 多年來持續開發有關語音辨識的嵌入式裝置技術，該公司是使用名為 Virtual Teller 的 AI，開發了適用在行動銀行的解決方案。透過 Virtual Teller，使用者可以如同在櫃檯與服務人員溝通一般，虛擬人員對話同時進行交易。身份認證方面，則使用了語音辨識和人臉辨識的 AI 生物辨識技術以提高安全性。

此外，進行認證的 AI 內建於智慧型手機的應用程式中，因此取得的生物資訊不會上傳到網路。為了與智慧型手機的「數位替身」順暢對話，也搭載了語音辨識和語音合成功能，以提高互動效果。Sensory 透過將 AI 建置於手機軟體中，實現了高安全性且易於使用的使用者介面。

-----廣告，請繼續往下閱讀-----

——本文摘自《 AI 大局：鳥瞰人工智慧技術全貌，重塑 AI 時代的領導力》，旗標，2020 年08月。

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 2

登入與大家一起討論

#1

狐禪 2020/12/24

生物在演化中所與生具來的本能，是AI中欠缺的。因此再怎麼算，也只是複雜的統計，觀微知著可以，但要舉一反三則差遠了–本能為統合之始。

#2

狐禪 2021/01/26

方便好人的也會方便壞人，限制壞人的也會限制好人。這個兩難不是科學家或工程師可以解決的。

PanSci

1262 篇文章・ 2420 位粉絲

PanSci的編輯部帳號，會發自產內容跟各種消息喔。

TRENDING 熱門討論

即時熱門

0

2

1

文字

ECU: 汽車大腦的演化與挑戰

鳥苷三磷酸 (PanSci Promo) ・2025/07/02 ・3793字・閱讀時間約 7 分鐘

相關標籤：

熱門標籤：

本文與威力暘電子合作，泛科學企劃執行。

想像一下，當你每天啟動汽車時，啟動的不再只是一台車，而是一百台電腦同步運作。但如果這些「電腦」突然集體當機，後果會有多嚴重？方向盤可能瞬間失靈，安全氣囊無法啟動，整台車就像失控的高科技廢鐵。這樣的「系統崩潰」風險並非誇張劇情，而是真實存在於你我日常的駕駛過程中。

今天，我們將深入探討汽車電子系統「逆天改運」的科學奧秘。究竟，汽車的「大腦」—電子控制單元（ECU），是如何從單一功能，暴增至上百個獨立系統？而全球頂尖的工程師們，又為何正傾盡全力，試圖將這些複雜的系統「砍掉重練」、整合優化？

第一顆「汽車大腦」的誕生

時間回到 1980 年代，當時的汽車工程師們面臨一項重要任務：如何把汽油引擎的每一滴燃油都壓榨出最大動力？「省油即省錢」是放諸四海皆準的道理。他們發現，關鍵其實潛藏在一個微小到幾乎難以察覺的瞬間：火星塞的點火時機，也就是「點火正時」。

如果能把點火的精準度控制在「兩毫秒」以內，這大約是你眨眼時間的百分之一到千分之一！引擎效率就能提升整整一成！這不僅意味著車子開起來更順暢，還能直接省下一成的油耗。那麼，要如何跨過這道門檻？答案就是：「電腦」的加入！

-----廣告，請繼續往下閱讀-----

工程師們引入了「微控制器」（Microcontroller），你可以把它想像成一顆專注於特定任務的迷你電腦晶片。它能即時讀取引擎轉速、進氣壓力、油門深度、甚至異常爆震等各種感測器的訊號。透過內建的演算法，在千分之一秒、甚至微秒等級的時間內，精準計算出最佳的點火角度，並立刻執行。

從此，引擎的性能表現大躍進，油耗也更漂亮。這正是汽車電子控制單元（ECU）的始祖—專門負責點火的「引擎控制單元」（Engine Control Unit）。

**汽車電子控制單元的始祖**—專門負責點火的「引擎控制單元」（Engine Control Unit）/ 圖片來源:shutterstock

ECU 的失控暴增與甜蜜的負荷

第一顆 ECU 的成功，在 1980 年代後期點燃了工程師們的想像：「這 ECU 這麼好用，其他地方是不是也能用？」於是，ECU 的應用範圍不再僅限於點火，燃油噴射量、怠速穩定性、變速箱換檔平順度、ABS 防鎖死煞車，甚至安全氣囊的引爆時機……各種功能都交給專屬的 ECU 負責。

然而，問題來了：這麼多「小電腦」，它們之間該如何有效溝通？

-----廣告，請繼續往下閱讀-----

為了解決這個問題，1986 年，德國的博世（Bosch）公司推出了一項劃時代的發明：控制器區域網路（CAN Bus）。你可以將它想像成一條專為 ECU 打造的「神經網路」。各個 ECU 只需連接到這條共用的線路上，就能將訊息「廣播」給其他單元。

更重要的是，CAN Bus 還具備「優先通行」機制。例如，煞車指令或安全氣囊引爆訊號這類攸關人命的重要訊息，絕對能搶先通過，避免因資訊堵塞而延誤。儘管 CAN Bus 解決了 ECU 之間的溝通問題，但每顆 ECU 依然需要獨立的電源線、接地線，並連接各種感測器和致動器。結果就是，一輛汽車的電線總長度可能達到 2 到 4 公里，總重量更高達 50 到 60 公斤，等同於憑空多載了一位乘客的重量。

另一方面，大量的 ECU 與錯綜複雜的線路，也讓「電子故障」開始頻繁登上汽車召回原因的榜首。更別提這些密密麻麻的線束，簡直是設計師和維修技師的惡夢。要檢修這些電子故障，無疑讓人一個頭兩個大。

大量的 ECU 與錯綜複雜的線路，也讓「電子故障」開始頻繁登上汽車召回原因的榜首。/圖片來源:shutterstock

汽車電子革命：從「百腦亂舞」到集中治理

到了2010年代，汽車電子架構迎來一場大改革，「分區架構（Zonal Architecture）」搭配「中央高效能運算（HPC）」逐漸成為主流。簡單來說，這就像在車內建立「地方政府＋中央政府」的管理系統。

-----廣告，請繼續往下閱讀-----

可以想像，整輛車被劃分為幾個大型區域，像是車頭、車尾、車身兩側與駕駛艙，就像數個「大都會」。每個區域控制單元（ZCU）就像「市政府」，負責收集該區所有的感測器訊號、初步處理與整合，並直接驅動該區的馬達、燈光等致動器。區域先自理，就不必大小事都等中央拍板。

而「中央政府」則由車用高效能運算平台（HPC）擔任，統籌負責更複雜的運算任務，例如先進駕駛輔助系統（ADAS）所需的環境感知、物體辨識，或是車載娛樂系統、導航功能，甚至是未來自動駕駛的決策，通通交由車輛正中央的這顆「超級大腦」執行。

乘著這波汽車電子架構的轉型浪潮中， 2008 年成立的台灣本土企業威力暘電子，便精準地切入了這個趨勢，致力於開發整合 ECU 與區域控制器（Domain Controller）功能的模組化平台。他們專精於開發電子排檔、多功能方向盤等各式汽車電子控制模組。為了確保各部件之間的溝通順暢，威力暘提供的解決方案，就像是將好幾個「分區管理員」的職責，甚至一部分「超級大腦」的功能，都整合到一個更強大的硬體平台上。

這些模組不僅擁有強大的晶片運算能力，可同時支援 ADAS 與車載娛樂，還能兼容多種通訊協定，大幅簡化車內網路架構。如此一來，車廠在追求輕量化和高效率的同時，也能顧及穩定性與安全性。

-----廣告，請繼續往下閱讀-----

2008 年威力暘電子致力於開發整合 ECU 與區域控制器（Domain Controller）功能的模組化平台 /圖片來源:shutterstock

萬無一失的「汽車大腦」：威力暘的四大策略

然而，「做出來」與「做好」之間，還是有差別。要如何確保這顆集結所有功能的「汽車大腦」不出錯？具體來說，威力暘電子憑藉以下四大策略，築起其產品的可靠性與安全性：

AUTOSAR ： 導入開放且標準化的汽車軟體架構 AUTOSAR。分為應用層、運行環境層（RTE）和基礎軟體層（BSW）。就像在玩「樂高積木」，ECU 開發者能靈活組合模組，專注在核心功能開發，從根本上提升軟體的穩定性和可靠性。
V-Model 開發流程：這是一種強調嚴謹、能在早期發現錯誤的軟體開發流程。就像打勾 V 字形般，左側從上而下逐步執行，右側則由下而上層層檢驗，確保每個階段的安全要求都確實落實。
基於模型的設計 MBD（Model-Based Design）：威力暘的工程師們會利用 MatLab®/Simulink® 等工具，把整個 ECU 要控制的系統(如煞車)，用數學模型搭建起來，然後在虛擬環境中進行大量的模擬和測試。這等於在實體 ECU 誕生前，就能在「數位雙生」世界中反覆演練、預先排除設計缺陷，，並驗證安全機制是否有效。
Automotive SPICE (ASPICE) ： ASPICE 是國際公認的汽車軟體「品質管理系統」，它不直接評估最終 ECU 產品本身的安全性，而是深入檢視團隊在軟體開發的「整個過程」，也就是「方法論」和「管理紀律」是否夠成熟、夠系統化，並只根據數據來評估品質。

既然 ECU 掌管了整輛車的運作，其能否正常運作，自然被視為最優先項目。為此，威力暘嚴格遵循汽車業中一本堪稱「安全聖經」的國際標準：ISO 26262。這套國際標準可視為一本針對汽車電子電氣系統（特別是 ECU）的「超嚴格品管手冊」和「開發流程指南」，從概念、設計、測試到生產和報廢，都詳細規範了每個安全要求和驗證方法，唯一目標就是把任何潛在風險降到最低

有了上述這四項策略，威力暘確保其產品從設計、生產到交付都符合嚴苛的安全標準，才能通過 ISO 26262 的嚴格檢驗。

然而，ECU 的演進並未就此停下腳步。當ECU 的數量開始精簡，「大腦」變得更集中、更強大後，汽車產業又迎來了新一波革命：「軟體定義汽車」（Software-Defined Vehicle, SDV）。

-----廣告，請繼續往下閱讀-----

軟體定義汽車 SDV：你的愛車也能「升級」！

未來的汽車，會越來越像你手中的智慧型手機。過去，車輛功能在出廠時幾乎就「定終身」，想升級？多半只能換車。但在軟體定義汽車（SDV）時代，汽車將搖身一變成為具備強大運算能力與高速網路連線的「行動伺服器」，能夠「二次覺醒」、不斷升級。透過 OTA（Over-the-Air）技術，車廠能像推送 App 更新一樣，遠端傳送新功能、性能優化或安全修補包到你的車上。

不過，這種美好願景也將帶來全新的挑戰：資安風險。當汽車連上網路，就等於向駭客敞開潛在的攻擊入口。如果車上的 ECU 或雲端伺服器被駭，輕則個資外洩，重則車輛被遠端鎖定或惡意操控。為了打造安全的 SDV，業界必須遵循像 ISO 21434 這樣的車用資安標準。

威力暘電子運用前面提到的四大核心策略，確保自家產品能符合從 ISO 26262 到 ISO 21434 的國際認證。從品質管理、軟體開發流程，到安全認證，這些努力，讓威力暘的模組擁有最高的網路與功能安全。他們的產品不僅展現「台灣智造」的彈性與創新，也擁有與國際大廠比肩的「車規級可靠度」。憑藉這些實力，威力暘已成功打進日本 YAMAHA、Toyota，以及歐美 ZF、Autoliv 等全球一線供應鏈，更成為 DENSO 在台灣少數核准的控制模組夥伴，以商用車熱系統專案成功打入日系核心供應鏈，並自 2025 年起與 DENSO 共同展開平台化量產，驗證其流程與品質。

毫無疑問，未來車輛將有更多運作交由電腦與 AI 判斷，交由電腦判斷，比交由人類駕駛還要安全的那一天，離我們不遠了。而人類的角色，將從操作者轉為監督者，負責在故障或斷網時擔任最後的保險。透過科技讓車子更聰明、更安全，人類甘願當一個「最弱兵器」，其實也不錯！

-----廣告，請繼續往下閱讀-----

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

227 篇文章・ 315 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

2

0

文字

拆解邊緣AI熱潮：伺服器如何提供穩固的運算基石？

鳥苷三磷酸 (PanSci Promo) ・2025/05/21 ・5071字・閱讀時間約 10 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文與研華科技合作，泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言，總能牽動整個 AI 產業的神經。然而，我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線，那如果哪天「網路斷了」，會發生什麼事？

想像你正在自駕車打個盹，系統突然警示：「網路連線中斷」，車輛開始偏離路線，而前方竟是萬丈深谷。又或者家庭機器人被駭，開始暴走跳舞，甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎？當然不是！也因為如此，「邊緣 AI」成為業界關注重點。不靠雲端，AI 就能在現場即時反應，不只更安全、低延遲，還能讓數據當場變現，不再淪為沉沒成本。

什麼是邊緣 AI ？

邊緣 AI，乍聽之下，好像是「孤單站在角落的人工智慧」，但事實上，它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前，像是企業、醫院、學校內部的伺服器，個人電腦，甚至手機等裝置，都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算，稱為邊緣運算；而在邊緣節點上運行 AI ，就被稱為邊緣 AI。簡單來說，就是將原本集中在遠端資料中心的運算能力，「搬家」到更靠近數據源頭的地方。

-----廣告，請繼續往下閱讀-----

那麼，為什麼需要這樣做？資料放在雲端，集中管理不是更方便嗎？對，就是不好。

當數據在這些邊緣節點進行運算，稱為邊緣運算；而在邊緣節點上運行 AI ，就被稱為邊緣 AI。/ 圖片來源：MotionArray

第一個不好是物理限制：「延遲」。
即使光速已經非常快，數據從你家旁邊的路口傳到幾千公里外的雲端機房，再把分析結果傳回來，中間還要經過各種網路節點轉來轉去…這樣一來一回，就算只是幾十毫秒的延遲，對於需要「即刻反應」的 AI 應用，比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時，每一毫秒都攸關安全與精度，這點延遲都是無法接受的！這是物理距離與網路架構先天上的限制，無法繞過去。

第二個挑戰，是資訊科學跟工程上的考量：「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送，湧入的資料數據量就像超級大的水流，一下子就把水管塞爆！要避免流量爆炸，你就要一直擴充水管，也就是擴增頻寬，然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理，把重要資訊「濃縮」過後再傳回雲端，是不是就能減輕頻寬負擔，也能節省大量費用呢？

第三個挑戰：系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時，一旦網路不穩、甚至斷線，那怎麼辦？很多關鍵應用，像是公共安全監控或是重要設備的預警系統，可不能這樣「看天吃飯」啊！邊緣處理讓系統更獨立，就算暫時斷線，本地的 AI 還是能繼續運作與即時反應，這在工程上是非常重要的考量。

所以你看，邊緣運算不是科學家們沒事找事做，它是順應數據特性和實際應用需求，一個非常合理的科學與工程上的最佳化選擇，是我們想要抓住即時數據價值，非走不可的一條路！

邊緣 AI 的實戰魅力：從工廠到倉儲，再到你的工作桌

知道要把 AI 算力搬到邊緣了，接下來的問題就是─邊緣 AI 究竟強在哪裡呢？它強就強在能夠做到「深度感知（Deep Perception）」！

-----廣告，請繼續往下閱讀-----

所謂深度感知，並非僅僅是對數據進行簡單的加加減減，而是透過如深度神經網路這類複雜的 AI 模型，從原始數據裡面，去「理解」出更高層次、更具意義的資訊。

以研華科技為例，旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例，利用物件偵測模型，快速將工業產品中的瑕疵挑出來，而且由於 AI 模型可以使用同一套參數去檢測，因此品管上能達到一致性，減少人為疏漏。尤其在高產能工廠中，檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品，替工廠節省大量人力，同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供：研華科技

此外，在智慧倉儲場域，研華與威剛合作，研華與威剛聯手合作，在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台，打造倉儲系統的 AMR（Autonomous Mobile Robot）自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣，AMR 不需要事先規劃好路線，靠著感測器偵測，就能輕鬆避開障礙物，識別路線，並且將貨物載到指定地點存放。

當然，還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning )，除了可以做備忘錄跟排程規劃以外，還能將實務上碰到的問題記錄下來，等到之後碰到類似的問題時，就能詢問 AI 並得到解答。

你或許會問，那為什麼不直接使用 ChatGPT 就好了？其實，對許多企業來說，內部資料往往具有高度機密性與商業價值，有些場域甚至連手機都禁止員工帶入，自然無法將資料上傳雲端。對於重視資安，又希望運用 AI 提升效率的企業與工廠而言，自行部署大型語言模型（self-hosted LLM）才是理想選擇。而這樣的應用，並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器，體積僅如後背包大小，卻能輕鬆支援語言模型的運作，實現高效又安全的 AI 解決方案。

但問題也接著浮現：要在這麼小的設備上跑大型 AI 模型，會不會太吃資源？這正是目前 AI 領域最前沿、最火熱的研究方向之一：如何幫 AI 模型進行「科學瘦身」，又不減智慧。接下來，我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告，請繼續往下閱讀-----

語言模型瘦身術之一：量化（Quantization）—用更精簡的數位方式來表示知識

當硬體資源有限，大模型卻越來越龐大，「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像：有些畫面細節我們肉眼根本看不出來，刪掉也不影響整體感覺，卻能大幅減少檔案大小。

模型量化的原理也是如此，只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示，什麼是浮點數？其實就是你我都熟知的小數。舉例來說，圓周率是個無窮不循環小數，唸下去就會是3.141592653…但實際運算時，我們常常用 3.14 或甚至直接用 3，也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思！

然而，量化並不是那麼容易的事情。而且實際上，降低精度多少還是會影響到模型表現的。因此在設計時，工程師會精密調整，確保效能在可接受範圍內，達成「瘦身不減智」的目標。

當硬體資源有限，大模型卻越來越龐大，「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源：MotionArray

模型剪枝（Model Pruning）—基於重要性的結構精簡

建立一個 AI 模型，其實就是在搭建一整套類神經網路系統，並訓練類神經元中彼此關聯的參數。然而，在這麼多參數中，總會有一些參數明明佔了一個位置，卻對整體模型沒有貢獻。既然如此，不如果斷將這些「冗餘」移除。

這就像種植作物的時候，總會雜草叢生，但這些雜草並不是我們想要的作物，這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在，而動手去清理這些不需要的連結參數或神經元的技術，就稱為 AI 模型的模型剪枝（Model Pruning）。

-----廣告，請繼續往下閱讀-----

模型剪枝的效果，大概能把100變成70這樣的程度，說多也不是太多。雖然這樣的縮減對於提升效率已具幫助，但若我們要的是一個更小幾個數量級的模型，僅靠剪枝仍不足以應對。最後還是需要從源頭著手，採取更治本的方法：一開始就打造一個很小的模型，並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」，是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾（Knowledge Distillation）—讓小模型學習大師的「精髓」

想像一下，一位經驗豐富、見多識廣的老師傅，就是那個龐大而強悍的 AI 模型。現在，他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案，老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」，例如「為什麼我會這樣想？」、「其他選項的可能性有多少？」。這樣一來，小小的學徒模型，用它有限的「腦容量」，也能學到老師傅的「智慧精髓」，表現就能大幅提升！這是一種很高級的訓練技巧，跟遷移學習有關。

舉個例子，當大型語言模型在收到「晚餐：鳳梨」這組輸入時，它下一個會接的詞語跟機率分別為「炒飯：50%，蝦球：30%，披薩：15%，汁：5%」。在知識蒸餾的過程中，它可以把這套機率表一起教給小語言模型，讓小語言模型不必透過自己訓練，也能輕鬆得到這個推理過程。如今，許多高效的小型語言模型正是透過這項技術訓練而成，讓我們得以在資源有限的邊緣設備上，也能部署愈來愈強大的小模型 AI。

但是！即使模型經過了這些科學方法的優化，變得比較「苗條」了，要真正在邊緣環境中處理如潮水般湧現的資料，並且高速、即時、穩定地運作，仍然需要一個夠強的「引擎」來驅動它們。也就是說，要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型，真正放到邊緣的現場去發揮作用，就需要一個強大的「硬體平台」來承載。

-----廣告，請繼續往下閱讀-----

邊緣 AI 的強心臟：SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器，就是扮演「邊緣 AI 引擎」的關鍵角色！那麼，它到底厲害在哪？

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要？因為 GPU 的設計，天生就擅長做「平行計算」，這正好就是 AI 模型裡面那種海量數學運算最需要的！

你想想看，那麼多數據要同時處理，就像要請一大堆人同時算數學一樣，GPU 就是那個最有效率的工具人！而且，有多張 GPU，代表可以同時跑更多不同的 AI 任務，或者處理更大流量的數據。這是確保那些科學研究成果，在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎！

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房，有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計，體積相對緊湊，散熱空間也比較好（這對高功耗的 GPU 很重要！），部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算，進行「工程化」，讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格，背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場，系統穩定壓倒一切！你總不希望 AI 分析跑到一半就掛掉吧？這些設計確保了部署在現場的 AI 系統，能夠長時間、穩定地運作，把實驗室裡的科學成果，可靠地轉化成實際的應用價值。

-----廣告，請繼續往下閱讀-----

研華的 SKY-602E3 塔式 GPU 伺服器，體積僅如後背包大小，卻能輕鬆支援語言模型的運作，實現高效又安全的 AI 解決方案。/ 圖片提供：研華科技

台灣製造 × 在地智慧：打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能，能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署，及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析，還是其他 AI 相關的服務，都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務，讓企業在啟動 AI 專案前，大幅降低前期投入門檻，靈活又實用。

台灣有著獨特的產業結構，從精密製造、城市交通管理，到因應高齡化社會的智慧醫療與公共安全，都是邊緣 AI 的理想應用場域。更重要的是，這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示，這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果，往往已經錯失最佳反應時機。這也是為什麼邊緣 AI，不只是一項技術創新，更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場，就能被有效的「理解」與「利用」，是將數據垃圾變成數據黃金的賢者之石！

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告，請繼續往下閱讀-----

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

227 篇文章・ 315 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

文字

如何讓 Suno 製作出你想要的音樂？四大規則讓你用精準的 prompt 做出心中所想的音樂！

泛科學院・2024/07/04 ・2849字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

最近用了跟 Suno 類似的音樂生成服務 Udio 才讓我理解歌曲生成的 prompt 要怎麼寫，然後配合 sonoteller 這個神器，讓你聽到什麼就能生出什麼！

所以我們這集就來講講：

AI 音樂生成 prompt 的規則
抄音樂 prompt 的好幫手 sonoteller
suno 跟 udio 的差異

提醒一下，這集沒有詳細的 Suno 操作，重點會放在怎麼寫 prompt 上。

這邊整理一下你看這集必須要知道的事，可以暫停看一下：

-----廣告，請繼續往下閱讀-----

那如果想看詳細的 Suno 操作，可以到這支影片：

好啦，讓我們開始吧。

輸入 Suno 的 prompt 只要關鍵字就好？

一開始用 Suno 時，我一直很困惑，到底要怎麼打 prompt 才能有效控制生成的音樂？

自從最近用了 Udio，它有 prompt 隨機生成，研究了一下 Udio 的 prompt，規則大概是「一句有情緒的故事梗概，加上多個曲風或歌曲細節詞彙」。

-----廣告，請繼續往下閱讀-----

然後我把 Udio 的 prompt 拿到 Suno 上跑，也能跑出不錯的東西。

所以，前面應該是指定整首歌的情境？

例如情境換成悲慘命運，聽起來就會變悲傷。

然後我在後面加上輕快 (Brisk)⋯⋯欸？悲傷去哪了？前面那串根本消失啦！

-----廣告，請繼續往下閱讀-----

那如果把前面那句話，拆解成情緒與事件關鍵字輸入也行嗎？

畢竟字數有限，這樣就能下更多 prompt 了！

嗯，事實是沒差，只要關鍵字就好。

所以結論是，音樂生成的 prompt 跟 Stable Diffusion 差不多，一個一個單詞輸入就好。

-----廣告，請繼續往下閱讀-----

四大規則！

在多次測試之後，我認為有效的 prompt 可以分為這四類：

1. 曲風類：funk、rock、pop、classical 之類的特定曲風。

這些詞最重要，會最大幅度限制歌曲的走向，通常會放多個有關聯的曲風，例如 city pop 跟 funk 還有 Disco 有關，我前面的 prompt 就選了 city pop 跟 funk，不用 Disco 單純是出來之後更有電音舞曲感，我不喜歡。

2. 歌曲控制類：B 小調、brisk、BPM 之類的名詞。

-----廣告，請繼續往下閱讀-----

這類名詞只能做到修飾，例如前面的 prompt 加個 BPM 200，也不可能演奏出 BPM 200 的 city pop，只是稍微加快，但如果我把曲風換成 rock, metal，就能接近我要求的 BPM 200。

3. 情緒、狀態類：miserable, adventure 這些日常生活中會出現的詞彙，能提供整首歌曲的旋律、節奏，但效果極弱。

例如前面放了輕快 brisk，悲傷感就消失了。

4. 樂器類：歌曲中有出現什麼樂器。

-----廣告，請繼續往下閱讀-----

你在選曲風的時候，就已經有樂器配置了。像上面的 city pop，就已經預設會有效果器 (Synthesizer)，因此就算輸入民謠吉他 (Acoustic Guitar)，也聽不到民謠吉他的原聲，滿滿的效果器。

我把上面的重點總結在這裡，有需要的可以停下來看，總之，先找對曲風，才能生出你想要的音樂。

怎麼知道喜歡的歌是什麼曲風？

那這時你可能會問啦，我哪知道自己想生的曲風是什麼啊？

這時就輪到 Sonoteller 登場啦！

-----廣告，請繼續往下閱讀-----

Sonoteller 是分析歌詞與曲風的 AI 工具，只要給他 Youtube 網址就會幫你分析啦。

這樣你就可以在 Youtube 上先找一首參考的歌曲，再丟到 Sonoteller 分析，瞬間就有曲風的 prompt 啦。不過近期 Sonoteller 的伺服器不堪負荷，常會遇到拒絕分析歌曲的情況。

但如果是超流行的歌，例如 Ado 的 Show，因為已經有人分析過，就會直接調之前分析的資料給你。

畫面的左半邊是歌詞分析，因我沒有生成歌詞的需求，這裡就不詳細說，

不過我自己截一些 summary 中的字當 prompt。

右半邊是曲風分析，Genres 就是我們的曲風啦，也有提供副曲風、情緒、樂器、BPM、key 之類的資訊，都可以複製回去當 prompt 用。

後面的數字是相似程度，參考就好，畢竟曲風、情緒感受是很主觀的，

好啦，讓我們聽聽用 ado show 的曲風做出來的歌長怎樣吧。

好像不太對勁，加個 J-pop 進去看看，這個感覺比較對，就先到這邊吧。

也提醒一下，我們不太可能只複製一首歌的 prompt 就得到想要的歌，多放幾首你覺得類似的歌到 sonoteller 分析是個好方法！

配合 ChatGPT 之類的工具來生成額外 prompt 也可以。不過我覺得門檻比 sonoteller 高，而且也不容易搞懂那些詞彙到底代表了什麼。

等等，Udio 和 Suno 到底哪一個好用？

再來說說前面有提到的 Udio 和 Suno 有什麼差吧！

基本邏輯是相同的，但 Udio 的操作更直覺，Udio 有提供 prompt 提示，不僅給我靈感，讓我學到很多新名詞，真的超級多，可能我在學校音樂課學的詞彙都沒有這幾個禮拜學到的多。

還有 Udio 每次生成歌曲只有 30 秒，更容易修改或擴充，它的擴充還可以選擇 intro outro 來生成音樂的開頭結尾，比起suno用起來更順手。

然後現在 udio 完全免費，一個月能生成 600 首，超適合拿來練 prompt！

蛤？你說這集為什麼沒有 Udio 生成的歌？

因為現在 udio 免費生成的音樂不能商用！

所以這支影片，就還是以 Suno 為主啦。

最後，你覺得 AI 生成的音樂聽起來如何呢？

當背景音樂不錯聽
匠氣太重，了無新意
沒感覺，要做的話
其他也可以留言分享喔

如果有其他想看的 AI 工具測試或相關問題，也可以留言告訴我們～

更多、更完整的內容，歡迎上泛科學院的 youtube 頻道觀看完整影片，並開啟訂閱獲得更多有趣的資訊！

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

泛科學院

44 篇文章・ 54 位粉絲

我是泛科學院的AJ，有15年的軟體測試與電腦教育經驗，善於協助偏鄉NPO提升資訊能力，以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用，每週更新兩集，讓我們帶你進入科技與創新的奇妙世界，為未來開啟無限可能！

TRENDING 熱門討論

即時熱門

目前超夯的 AI 前瞻技術「深度學習」，用手機就可以跟數位替身對話——《 AI 大局》

CNN（卷積神經網路）的架構

RNN（循環神經網路）的架構

生成模型與 GAN（對抗式生成網路）——生成影像資料的技術

結合數位替身與 AI 生物辨識的行動銀行

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

第一顆「汽車大腦」的誕生

ECU 的失控暴增與甜蜜的負荷

汽車電子革命：從「百腦亂舞」到集中治理

萬無一失的「汽車大腦」：威力暘的四大策略

軟體定義汽車 SDV：你的愛車也能「升級」！

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是邊緣 AI ？

邊緣 AI 的實戰魅力：從工廠到倉儲，再到你的工作桌

語言模型瘦身術之一：量化（Quantization）—用更精簡的數位方式來表示知識

模型剪枝（Model Pruning）—基於重要性的結構精簡

知識蒸餾（Knowledge Distillation）—讓小模型學習大師的「精髓」

邊緣 AI 的強心臟：SKY-602E3 的三大關鍵

台灣製造 × 在地智慧：打造專屬的邊緣 AI 解決方案

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

輸入 Suno 的 prompt 只要關鍵字就好？

四大規則！

怎麼知道喜歡的歌是什麼曲風？

等等，Udio 和 Suno 到底哪一個好用？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見