0

文字

繁 | 简

0

Promo 活得科學科技能源精神心理

利用臉書的動態、鄉民的發文，讓 AI 學習人類字裡行間中的情緒

研之有物│中央研究院・2018/02/15 ・2163字・閱讀時間約 4 分鐘・SR值 540

・八年級

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

執行編輯｜林婷嫻　美術編輯｜張語辰

一組詞、一句話的背後，其實帶有不同的情緒。　圖／freeGraphicToday @Pixabay

「我沒事」到底是什麼情緒？

情緒，是許多疾病和社會問題的表徵。例如有躁鬱傾向的人們，說話用詞有很大的情緒起伏；又如網路霸凌，會反映於社群留言的用字情緒。若能及早偵測到這些情緒，就有機會及時避免憾事發生，而這個任務可透過人工智慧（Artificial Intelligence, AI）協助。

但是，情緒不是那麼容易透過詞語理解。

例如，朋友在 Facebook 發文「我沒事」，究竟代表心平氣和的「我沒事」，還是絕望至極的「我沒事」；還有當鄉民留言「看吧！」，想表達的是讚賞意味的「看吧！」，或是嘲諷語氣的「看吧！」？

社群平台上的簡短發言，往往令人難以辨明當事人究竟想表達什麼。　圖／LoboStudioHamburg @Pixabay

如同《來自星星的傻瓜》電影主角（一名外星人）所言，人類的語言非常難理解，在不同情境脈絡有不同意思，甚至會隱藏真實情感說謊。這些都增加人工智慧從語意分析情緒的難度。

-----廣告，請繼續往下閱讀-----

清華大學資工系的陳宜欣副教授，是三個小孩的媽媽。她發現從小孩學習如何說話表達情緒的過程，可以梳理出一條路徑訓練機器學習。雖然小孩說話常常毫無邏輯，但許多小細節累積起來，就能讓大人判斷小孩的情緒。

例如當小孩對媽媽說「妳總是叫我收玩具」，其中用了「總是」這個詞，可以判斷小孩不太高興。或是小孩說「我永遠不能電視看了」，乍聽滿頭問號，但用了「永遠不能」這組詞，可以判斷其中的負面情緒。

不懂語法、沒背過辭典，還是可以表達情緒，反之也能分析情緒。

網路爬文　借用群眾智慧

陳宜欣團隊運用網路爬蟲技術，將社群網站公開發文（PTT、Facebook、Twitter 等），跟情緒有關的內容都蒐集建立至「情緒資料庫」。或許有些人會認為：「這不就是一堆人在發廢文？」，但以群眾外包（crowdsourcing）的角度，這些社群發言集結起來，就是群眾智慧，可做為訓練機器學習的資料。

「情緒，是社群網站上的一種特性，也是可供機器學習的資料」陳宜欣強調。　圖／2017 台灣人工智慧年會 X 台灣資料科學年會

團隊將社群發文者原先在發文加上的情緒 Hashtag （例如 #anger）作為參考答案，但一開始先把這些「答案」遮起來，訓練機器透過演算法學習發文中「出現哪些字」代表「什麼樣的情緒」，最後再與原本的答案（例如 #anger）對照，一次次地優化機器判斷情緒的準確率。

-----廣告，請繼續往下閱讀-----

「用大數據做情緒分析有個重點，就是刪資料不要心痛！」陳宜欣笑中有股失敗無數次的堅毅，「太多 Hashtag 的發文、重複發文、太短沒有情緒特徵的發文……等等，都要從訓練資料中拿掉」。

團隊也參考新聞標題，找出哪些字是較中性的「非情緒資料」，並從機器學習的訓練資料中排除、優化準確率。值得注意的是，選舉時期的新聞標題不能參考，因為用字遣詞太過激昂。

找出情緒用詞的邏輯

透過機器協助，可以從社群平台上的發文找出當事人情緒的蛛絲馬跡。　圖／geralt @Pixabay

經過機器學習分析，陳宜欣團隊發現一些跨語系的情緒邏輯。例如 “finally *** my” 這組字詞多表達快樂，而中文「我終於***」也多用來傳達正面的消息。又如 “my *** always” 這組字詞多含有生氣意味，就像小朋友說「爸爸／媽媽總是***」藉以表達不快。

中文贅字的處理，也是情緒分析很有趣的一環。「學生建議這很重要，一定要列入分析！」陳宜欣說。例如：「喔，我來做」其實是不太想做，「喔喔，我來做」較為中性，「喔喔喔，我來做」帶有積極感。凡是超過三個以上的贅字，可視同為三個贅字。這個規則用在「哈」、「哈哈」、「哈哈哈」、「哈哈哈哈」也有同工之妙。

-----廣告，請繼續往下閱讀-----

然而陳宜欣團隊發現，社群平台很多人發文以炫耀為主、或是報喜不報憂，導致社群平台上「開心」的發文特別多。

另外，網路霸凌其實有很多「暗語」。

例如，團隊看過一則發文是「那些外國動物不應該被出口」，其實這句暗地裡帶有種族歧視。其中一種解決方案是運用 Hatebase 仇恨發言資料庫，並藉由機器學習比對非仇恨的文字資料，找出這類「暗語」的關聯性（通常哪幾個字會一起被使用）、以及相似性（字詞會在句子中哪些類似地方出現）。

許多人會在憾事發生後，回過頭從當事者社群發文的字裡行間尋找跡象，但未來能否更早偵測？當局者迷，旁觀者清。人工智慧有潛力成為一名不帶情緒的旁觀者，分析社群大數據找出被情緒糾葛的人們，甚至是預防犯罪、偵測自殺傾向。

延伸閱讀：

本著作由研之有物製作，原文為《AI 可以幫助躁鬱、被霸凌的人嗎？》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際授權條款釋出。

-----廣告，請繼續往下閱讀-----

本文轉載自中央研究院研之有物，泛科學為宣傳推廣執行單位

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

研之有物│中央研究院

296 篇文章・ 3656 位粉絲

研之有物，取諧音自「言之有物」，出處為《周易·家人》：「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活，成為串聯您與中研院的橋梁，通往博大精深的知識世界。網頁：研之有物臉書：研之有物@Facebook

TRENDING 熱門討論

即時熱門

0

1

0

文字

拆解邊緣AI熱潮：伺服器如何提供穩固的運算基石？

鳥苷三磷酸 (PanSci Promo) ・2025/05/21 ・5071字・閱讀時間約 10 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

本文與研華科技合作，泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言，總能牽動整個 AI 產業的神經。然而，我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線，那如果哪天「網路斷了」，會發生什麼事？

想像你正在自駕車打個盹，系統突然警示：「網路連線中斷」，車輛開始偏離路線，而前方竟是萬丈深谷。又或者家庭機器人被駭，開始暴走跳舞，甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎？當然不是！也因為如此，「邊緣 AI」成為業界關注重點。不靠雲端，AI 就能在現場即時反應，不只更安全、低延遲，還能讓數據當場變現，不再淪為沉沒成本。

什麼是邊緣 AI ？

邊緣 AI，乍聽之下，好像是「孤單站在角落的人工智慧」，但事實上，它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前，像是企業、醫院、學校內部的伺服器，個人電腦，甚至手機等裝置，都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算，稱為邊緣運算；而在邊緣節點上運行 AI ，就被稱為邊緣 AI。簡單來說，就是將原本集中在遠端資料中心的運算能力，「搬家」到更靠近數據源頭的地方。

-----廣告，請繼續往下閱讀-----

那麼，為什麼需要這樣做？資料放在雲端，集中管理不是更方便嗎？對，就是不好。

當數據在這些邊緣節點進行運算，稱為邊緣運算；而在邊緣節點上運行 AI ，就被稱為邊緣 AI。/ 圖片來源：MotionArray

第一個不好是物理限制：「延遲」。
即使光速已經非常快，數據從你家旁邊的路口傳到幾千公里外的雲端機房，再把分析結果傳回來，中間還要經過各種網路節點轉來轉去…這樣一來一回，就算只是幾十毫秒的延遲，對於需要「即刻反應」的 AI 應用，比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時，每一毫秒都攸關安全與精度，這點延遲都是無法接受的！這是物理距離與網路架構先天上的限制，無法繞過去。

第二個挑戰，是資訊科學跟工程上的考量：「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送，湧入的資料數據量就像超級大的水流，一下子就把水管塞爆！要避免流量爆炸，你就要一直擴充水管，也就是擴增頻寬，然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理，把重要資訊「濃縮」過後再傳回雲端，是不是就能減輕頻寬負擔，也能節省大量費用呢？

第三個挑戰：系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時，一旦網路不穩、甚至斷線，那怎麼辦？很多關鍵應用，像是公共安全監控或是重要設備的預警系統，可不能這樣「看天吃飯」啊！邊緣處理讓系統更獨立，就算暫時斷線，本地的 AI 還是能繼續運作與即時反應，這在工程上是非常重要的考量。

所以你看，邊緣運算不是科學家們沒事找事做，它是順應數據特性和實際應用需求，一個非常合理的科學與工程上的最佳化選擇，是我們想要抓住即時數據價值，非走不可的一條路！

邊緣 AI 的實戰魅力：從工廠到倉儲，再到你的工作桌

知道要把 AI 算力搬到邊緣了，接下來的問題就是─邊緣 AI 究竟強在哪裡呢？它強就強在能夠做到「深度感知（Deep Perception）」！

-----廣告，請繼續往下閱讀-----

所謂深度感知，並非僅僅是對數據進行簡單的加加減減，而是透過如深度神經網路這類複雜的 AI 模型，從原始數據裡面，去「理解」出更高層次、更具意義的資訊。

以研華科技為例，旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例，利用物件偵測模型，快速將工業產品中的瑕疵挑出來，而且由於 AI 模型可以使用同一套參數去檢測，因此品管上能達到一致性，減少人為疏漏。尤其在高產能工廠中，檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品，替工廠節省大量人力，同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供：研華科技

此外，在智慧倉儲場域，研華與威剛合作，研華與威剛聯手合作，在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台，打造倉儲系統的 AMR（Autonomous Mobile Robot）自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣，AMR 不需要事先規劃好路線，靠著感測器偵測，就能輕鬆避開障礙物，識別路線，並且將貨物載到指定地點存放。

當然，還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning )，除了可以做備忘錄跟排程規劃以外，還能將實務上碰到的問題記錄下來，等到之後碰到類似的問題時，就能詢問 AI 並得到解答。

你或許會問，那為什麼不直接使用 ChatGPT 就好了？其實，對許多企業來說，內部資料往往具有高度機密性與商業價值，有些場域甚至連手機都禁止員工帶入，自然無法將資料上傳雲端。對於重視資安，又希望運用 AI 提升效率的企業與工廠而言，自行部署大型語言模型（self-hosted LLM）才是理想選擇。而這樣的應用，並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器，體積僅如後背包大小，卻能輕鬆支援語言模型的運作，實現高效又安全的 AI 解決方案。

但問題也接著浮現：要在這麼小的設備上跑大型 AI 模型，會不會太吃資源？這正是目前 AI 領域最前沿、最火熱的研究方向之一：如何幫 AI 模型進行「科學瘦身」，又不減智慧。接下來，我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告，請繼續往下閱讀-----

語言模型瘦身術之一：量化（Quantization）—用更精簡的數位方式來表示知識

當硬體資源有限，大模型卻越來越龐大，「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像：有些畫面細節我們肉眼根本看不出來，刪掉也不影響整體感覺，卻能大幅減少檔案大小。

模型量化的原理也是如此，只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示，什麼是浮點數？其實就是你我都熟知的小數。舉例來說，圓周率是個無窮不循環小數，唸下去就會是3.141592653…但實際運算時，我們常常用 3.14 或甚至直接用 3，也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思！

然而，量化並不是那麼容易的事情。而且實際上，降低精度多少還是會影響到模型表現的。因此在設計時，工程師會精密調整，確保效能在可接受範圍內，達成「瘦身不減智」的目標。

當硬體資源有限，大模型卻越來越龐大，「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源：MotionArray

模型剪枝（Model Pruning）—基於重要性的結構精簡

建立一個 AI 模型，其實就是在搭建一整套類神經網路系統，並訓練類神經元中彼此關聯的參數。然而，在這麼多參數中，總會有一些參數明明佔了一個位置，卻對整體模型沒有貢獻。既然如此，不如果斷將這些「冗餘」移除。

這就像種植作物的時候，總會雜草叢生，但這些雜草並不是我們想要的作物，這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在，而動手去清理這些不需要的連結參數或神經元的技術，就稱為 AI 模型的模型剪枝（Model Pruning）。

-----廣告，請繼續往下閱讀-----

模型剪枝的效果，大概能把100變成70這樣的程度，說多也不是太多。雖然這樣的縮減對於提升效率已具幫助，但若我們要的是一個更小幾個數量級的模型，僅靠剪枝仍不足以應對。最後還是需要從源頭著手，採取更治本的方法：一開始就打造一個很小的模型，並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」，是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾（Knowledge Distillation）—讓小模型學習大師的「精髓」

想像一下，一位經驗豐富、見多識廣的老師傅，就是那個龐大而強悍的 AI 模型。現在，他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案，老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」，例如「為什麼我會這樣想？」、「其他選項的可能性有多少？」。這樣一來，小小的學徒模型，用它有限的「腦容量」，也能學到老師傅的「智慧精髓」，表現就能大幅提升！這是一種很高級的訓練技巧，跟遷移學習有關。

舉個例子，當大型語言模型在收到「晚餐：鳳梨」這組輸入時，它下一個會接的詞語跟機率分別為「炒飯：50%，蝦球：30%，披薩：15%，汁：5%」。在知識蒸餾的過程中，它可以把這套機率表一起教給小語言模型，讓小語言模型不必透過自己訓練，也能輕鬆得到這個推理過程。如今，許多高效的小型語言模型正是透過這項技術訓練而成，讓我們得以在資源有限的邊緣設備上，也能部署愈來愈強大的小模型 AI。

但是！即使模型經過了這些科學方法的優化，變得比較「苗條」了，要真正在邊緣環境中處理如潮水般湧現的資料，並且高速、即時、穩定地運作，仍然需要一個夠強的「引擎」來驅動它們。也就是說，要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型，真正放到邊緣的現場去發揮作用，就需要一個強大的「硬體平台」來承載。

-----廣告，請繼續往下閱讀-----

邊緣 AI 的強心臟：SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器，就是扮演「邊緣 AI 引擎」的關鍵角色！那麼，它到底厲害在哪？

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要？因為 GPU 的設計，天生就擅長做「平行計算」，這正好就是 AI 模型裡面那種海量數學運算最需要的！

你想想看，那麼多數據要同時處理，就像要請一大堆人同時算數學一樣，GPU 就是那個最有效率的工具人！而且，有多張 GPU，代表可以同時跑更多不同的 AI 任務，或者處理更大流量的數據。這是確保那些科學研究成果，在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎！

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房，有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計，體積相對緊湊，散熱空間也比較好（這對高功耗的 GPU 很重要！），部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算，進行「工程化」，讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格，背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場，系統穩定壓倒一切！你總不希望 AI 分析跑到一半就掛掉吧？這些設計確保了部署在現場的 AI 系統，能夠長時間、穩定地運作，把實驗室裡的科學成果，可靠地轉化成實際的應用價值。

-----廣告，請繼續往下閱讀-----

研華的 SKY-602E3 塔式 GPU 伺服器，體積僅如後背包大小，卻能輕鬆支援語言模型的運作，實現高效又安全的 AI 解決方案。/ 圖片提供：研華科技

台灣製造 × 在地智慧：打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能，能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署，及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析，還是其他 AI 相關的服務，都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務，讓企業在啟動 AI 專案前，大幅降低前期投入門檻，靈活又實用。

台灣有著獨特的產業結構，從精密製造、城市交通管理，到因應高齡化社會的智慧醫療與公共安全，都是邊緣 AI 的理想應用場域。更重要的是，這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示，這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果，往往已經錯失最佳反應時機。這也是為什麼邊緣 AI，不只是一項技術創新，更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場，就能被有效的「理解」與「利用」，是將數據垃圾變成數據黃金的賢者之石！

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告，請繼續往下閱讀-----

-----廣告，請繼續往下閱讀-----

發表意見

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)

225 篇文章・ 314 位粉絲

充滿能量的泛科學品牌合作帳號！相關行銷合作請洽：contact@pansci.asia

TRENDING 熱門討論

即時熱門

0

文字

如何讓 Suno 製作出你想要的音樂？四大規則讓你用精準的 prompt 做出心中所想的音樂！

泛科學院・2024/07/04 ・2849字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

最近用了跟 Suno 類似的音樂生成服務 Udio 才讓我理解歌曲生成的 prompt 要怎麼寫，然後配合 sonoteller 這個神器，讓你聽到什麼就能生出什麼！

所以我們這集就來講講：

AI 音樂生成 prompt 的規則
抄音樂 prompt 的好幫手 sonoteller
suno 跟 udio 的差異

提醒一下，這集沒有詳細的 Suno 操作，重點會放在怎麼寫 prompt 上。

這邊整理一下你看這集必須要知道的事，可以暫停看一下：

-----廣告，請繼續往下閱讀-----

那如果想看詳細的 Suno 操作，可以到這支影片：

好啦，讓我們開始吧。

輸入 Suno 的 prompt 只要關鍵字就好？

一開始用 Suno 時，我一直很困惑，到底要怎麼打 prompt 才能有效控制生成的音樂？

自從最近用了 Udio，它有 prompt 隨機生成，研究了一下 Udio 的 prompt，規則大概是「一句有情緒的故事梗概，加上多個曲風或歌曲細節詞彙」。

-----廣告，請繼續往下閱讀-----

然後我把 Udio 的 prompt 拿到 Suno 上跑，也能跑出不錯的東西。

所以，前面應該是指定整首歌的情境？

例如情境換成悲慘命運，聽起來就會變悲傷。

然後我在後面加上輕快 (Brisk)⋯⋯欸？悲傷去哪了？前面那串根本消失啦！

-----廣告，請繼續往下閱讀-----

那如果把前面那句話，拆解成情緒與事件關鍵字輸入也行嗎？

畢竟字數有限，這樣就能下更多 prompt 了！

嗯，事實是沒差，只要關鍵字就好。

所以結論是，音樂生成的 prompt 跟 Stable Diffusion 差不多，一個一個單詞輸入就好。

-----廣告，請繼續往下閱讀-----

四大規則！

在多次測試之後，我認為有效的 prompt 可以分為這四類：

1. 曲風類：funk、rock、pop、classical 之類的特定曲風。

這些詞最重要，會最大幅度限制歌曲的走向，通常會放多個有關聯的曲風，例如 city pop 跟 funk 還有 Disco 有關，我前面的 prompt 就選了 city pop 跟 funk，不用 Disco 單純是出來之後更有電音舞曲感，我不喜歡。

2. 歌曲控制類：B 小調、brisk、BPM 之類的名詞。

-----廣告，請繼續往下閱讀-----

這類名詞只能做到修飾，例如前面的 prompt 加個 BPM 200，也不可能演奏出 BPM 200 的 city pop，只是稍微加快，但如果我把曲風換成 rock, metal，就能接近我要求的 BPM 200。

3. 情緒、狀態類：miserable, adventure 這些日常生活中會出現的詞彙，能提供整首歌曲的旋律、節奏，但效果極弱。

例如前面放了輕快 brisk，悲傷感就消失了。

4. 樂器類：歌曲中有出現什麼樂器。

-----廣告，請繼續往下閱讀-----

你在選曲風的時候，就已經有樂器配置了。像上面的 city pop，就已經預設會有效果器 (Synthesizer)，因此就算輸入民謠吉他 (Acoustic Guitar)，也聽不到民謠吉他的原聲，滿滿的效果器。

我把上面的重點總結在這裡，有需要的可以停下來看，總之，先找對曲風，才能生出你想要的音樂。

怎麼知道喜歡的歌是什麼曲風？

那這時你可能會問啦，我哪知道自己想生的曲風是什麼啊？

這時就輪到 Sonoteller 登場啦！

-----廣告，請繼續往下閱讀-----

Sonoteller 是分析歌詞與曲風的 AI 工具，只要給他 Youtube 網址就會幫你分析啦。

這樣你就可以在 Youtube 上先找一首參考的歌曲，再丟到 Sonoteller 分析，瞬間就有曲風的 prompt 啦。不過近期 Sonoteller 的伺服器不堪負荷，常會遇到拒絕分析歌曲的情況。

但如果是超流行的歌，例如 Ado 的 Show，因為已經有人分析過，就會直接調之前分析的資料給你。

畫面的左半邊是歌詞分析，因我沒有生成歌詞的需求，這裡就不詳細說，

不過我自己截一些 summary 中的字當 prompt。

右半邊是曲風分析，Genres 就是我們的曲風啦，也有提供副曲風、情緒、樂器、BPM、key 之類的資訊，都可以複製回去當 prompt 用。

後面的數字是相似程度，參考就好，畢竟曲風、情緒感受是很主觀的，

好啦，讓我們聽聽用 ado show 的曲風做出來的歌長怎樣吧。

好像不太對勁，加個 J-pop 進去看看，這個感覺比較對，就先到這邊吧。

也提醒一下，我們不太可能只複製一首歌的 prompt 就得到想要的歌，多放幾首你覺得類似的歌到 sonoteller 分析是個好方法！

配合 ChatGPT 之類的工具來生成額外 prompt 也可以。不過我覺得門檻比 sonoteller 高，而且也不容易搞懂那些詞彙到底代表了什麼。

等等，Udio 和 Suno 到底哪一個好用？

再來說說前面有提到的 Udio 和 Suno 有什麼差吧！

基本邏輯是相同的，但 Udio 的操作更直覺，Udio 有提供 prompt 提示，不僅給我靈感，讓我學到很多新名詞，真的超級多，可能我在學校音樂課學的詞彙都沒有這幾個禮拜學到的多。

還有 Udio 每次生成歌曲只有 30 秒，更容易修改或擴充，它的擴充還可以選擇 intro outro 來生成音樂的開頭結尾，比起suno用起來更順手。

然後現在 udio 完全免費，一個月能生成 600 首，超適合拿來練 prompt！

蛤？你說這集為什麼沒有 Udio 生成的歌？

因為現在 udio 免費生成的音樂不能商用！

所以這支影片，就還是以 Suno 為主啦。

最後，你覺得 AI 生成的音樂聽起來如何呢？

當背景音樂不錯聽
匠氣太重，了無新意
沒感覺，要做的話
其他也可以留言分享喔

如果有其他想看的 AI 工具測試或相關問題，也可以留言告訴我們～

更多、更完整的內容，歡迎上泛科學院的 youtube 頻道觀看完整影片，並開啟訂閱獲得更多有趣的資訊！

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

泛科學院

44 篇文章・ 53 位粉絲

我是泛科學院的AJ，有15年的軟體測試與電腦教育經驗，善於協助偏鄉NPO提升資訊能力，以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用，每週更新兩集，讓我們帶你進入科技與創新的奇妙世界，為未來開啟無限可能！

TRENDING 熱門討論

即時熱門

0

1

文字

動動滑鼠就能生圖修圖？不用付錢就能即時生成的 Leonardo AI 讓繪畫行雲流水！

泛科學院・2024/06/09 ・828字・閱讀時間約 1 分鐘

相關標籤：

熱門標籤：

你在尋找免費的繪圖 AI 嗎？

自從 Stable Doodle 要收費後，我就一直在找類似的替代品，正好前陣子 Leonardo AI 也更新了Realtime Canva 功能，不是那個 Canva，是他們推出的塗鴉功能叫 Canva，試用之後驚為天人！

新增加的 inpaint 功能，能用 prompt 指定畫上去的色塊代表什麼，也有圖層跟透明度功能，大幅降低修整圖片的難度。

重點是，免費可用啊，付費只多了 realtime 及時生成，但免費的速度也不會太慢，你問我為什麼會知道？當然是花了錢之後發現根本沒差啊！

而且及時生成的圖都不用扣點，直到你按下輸出鍵才扣，修改次數無限，可以免費白嫖玩到爽，所以今天，就來教一下怎麼用 Leonardo Canva 啦，大概會說這三件事情：

-----廣告，請繼續往下閱讀-----

從無到有快速生成人物：這邊就簡單介紹基本操作。
在不影響生成人物的狀況下，加上背景：這邊會用到圖層、去背、AI 元素生成等功能。
最後微調：介紹 inpaint 功能怎麼用。

好啦，讓我們開始吧！

最後，你覺得 AI 圖片生成應該還要提供什麼服務呢？

我上色苦手，拜託有個不改我線稿的 AI 上色工具
可以有更多修改細節的方法，現在都太笨了
能不能讓 AI 讀懂構圖，不要每次圖生圖都變樣了
我不知道，能生不就好了

如果有其他想看的 AI 工具測試或相關問題，也可以留言發問。如果喜歡這支影片的話，也別忘了按讚、訂閱，加入會員，我們下集再見～掰！

更多、更完整的內容，歡迎上泛科學院的 youtube 頻道觀看完整影片，並開啟訂閱獲得更多有趣的資訊！

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

泛科學院

44 篇文章・ 53 位粉絲

我是泛科學院的AJ，有15年的軟體測試與電腦教育經驗，善於協助偏鄉NPO提升資訊能力，以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用，每週更新兩集，讓我們帶你進入科技與創新的奇妙世界，為未來開啟無限可能！

TRENDING 熱門討論

即時熱門

利用臉書的動態、鄉民的發文，讓 AI 學習人類字裡行間中的情緒

「我沒事」到底是什麼情緒？

網路爬文 借用群眾智慧

找出情緒用詞的邏輯

延伸閱讀：

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

什麼是邊緣 AI ？

邊緣 AI 的實戰魅力：從工廠到倉儲，再到你的工作桌

語言模型瘦身術之一：量化（Quantization）—用更精簡的數位方式來表示知識

模型剪枝（Model Pruning）—基於重要性的結構精簡

知識蒸餾（Knowledge Distillation）—讓小模型學習大師的「精髓」

邊緣 AI 的強心臟：SKY-602E3 的三大關鍵

台灣製造 × 在地智慧：打造專屬的邊緣 AI 解決方案

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

輸入 Suno 的 prompt 只要關鍵字就好？

四大規則！

怎麼知道喜歡的歌是什麼曲風？

等等，Udio 和 Suno 到底哪一個好用？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

你在尋找免費的繪圖 AI 嗎？

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

網路爬文　借用群眾智慧

發表意見

發表意見

發表意見

發表意見