Loading [MathJax]/extensions/MathZoom.js

0

14
0

文字

分享

0
14
0

AI 讓羽球訓練更聰明!智慧球拍上手,揮拍「爆發力」一測就知道

科技大觀園_96
・2021/10/18 ・3852字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

「啪!」「啪!」在臺南新豐高中的羽球場上,球拍強力揮擊的聲響不絕於耳,幾位選手正奮力廝殺著。但這場羽球賽有點不同,因為旁邊還架著一具電視螢幕,而選手手上的球拍也不太一樣。練習賽結束後,教練與選手聚集在螢幕前,對著螢幕上的揮拍速度、爆發力指數等數據,熱烈地討論了起來。

會出現這麼特殊的景象,是因為新豐高中的羽球隊從去年(2019年) 5 月起,開始做為科技部計畫「從中樞系統建構雲端 AI 運動訓練歷程分析與疲勞診斷系統:以羽球項目為例」(以下簡稱「AIOT 智能羽球訓練模式」)的實驗基地,而這個計畫由成功大學體育健康與休閒研究所特聘教授蔡佳良領軍,希望利用人工智慧,將羽球的訓練科學化,達到最有效精準的訓練效果。

這項計畫包含五個部分,包括智能球拍、智能手錶、高速攝影動作捕捉,以及雲端 AI 運算中心和顯示各項運動與生理數值的 APP。智能球拍、智能手錶、高速攝影負責收集運動資訊,將資訊以 Wifi 網路上傳到雲端的 AI 運算中心計算後,結果呈現在電腦螢幕及專用的手機 APP 上,讓教練與選手一目了然。 

AIOT 智能羽球訓練模式計畫所研發的智能球拍、感測晶片、智能手錶,以及專用的 APP。圖/簡克志攝

 計畫中使用的雲端計算中心是成大電機系教授王振興所主持的人工智能數位轉型研究中心 ,智能球拍、手錶等裝置不斷上傳的資料,會持續訓練 AI 演算法自身,讓演算法變得愈來愈精準。

-----廣告,請繼續往下閱讀-----

為了讓訓練過程面面俱到,蔡佳良組了一支跨領域的「黃金陣容」,除了專研腦波與眼動的自己外,還找了工程專業的成大電機系教授王振興、負責 AI 演算法的逢甲大學自動控制工程學系副教授許煜亮、專研運動傷害的成大物理治療系副教授蔡一如,每位成員的專業領域都不一樣,在計畫中各司其職。

計畫團隊主要成員,左起許煜亮教授、蔡佳良教授、蔡一如教授、羽球教練李宜勳,另外還有成大電機系教授王振興(未參與合影)。圖/簡克志攝

聰明的智能球拍

計畫中的一大重點,就是選手手上那支「智能球拍」,它可以收集選手的揮拍力道、轉動角度等數值,經過計算後,能知道揮拍速度、軌跡,還能分辨出九個不同的球種,這是因為球拍的握把中藏了一個感測晶片。

智能球拍的握把中藏著感測晶片,底部有接線孔以及 2 個 LED 指示燈。圖/簡克志攝
當選手用智能球拍揮拍時,系統可以得知選手揮拍的加速度、拍子轉動的角速度等運動數據。圖/簡克志攝 

在握把中放入感測晶片就能做到,聽起來很容易,但在羽球拍上卻沒那麼簡單。蔡佳良說:「羽球選手對球拍的重量可是很要求的,一般選手使用的球拍大約 80 幾克,重一點輕一點,手感就差很多了。」而一個晶片動輒 10 幾克,直接放上球拍,不但影響重量,還改變了球拍的重心位置,「這樣的球拍沒有人會想用。」蔡佳良說。

後來,蔡佳良找了勝利體育公司合作,在以碳纖維為材料的握把中納入晶片,並盡量減少晶片重量,才做出了目前的智能球拍。蔡佳良說:「不過我們還是想再縮小晶片的重量,看看是否能讓晶片的電池小一點,希望能將球拍再減少 5 公克左右。」

-----廣告,請繼續往下閱讀-----

你累了嗎?疲勞狀態對訓練來說很重要!

有了能收集選手打球狀況的智能球拍還不夠,蔡佳良還希望能將選手的「疲勞狀態」也納入訓練的參考,這也是接下來 AIOT 智能羽球訓練模式的發展重點。

蔡佳良與蔡一如指出,疲勞分成「中樞神經疲勞」與「周邊神經疲勞」,中樞神經疲勞反應在腦的專注力、心理上的鬥志等,例如比賽時間過長,或是選手心態上已經認輸等,這可以從選手的腦波及眼動訊號來判斷;而周邊神經疲勞則反應在肌肉的動作,例如選手的移動腳步可能變慢、揮拍動作變小等。此外,長時間受訓練的選手也可能慢性疲勞,儘管身體好像沒怎麼樣,但可能一早起床就覺得特別累,不想練球等。

分析選手的疲勞狀態,還可以進一步預防選手受傷,在選手有一點點受傷徵兆時,例如動作稍微改變時,就及時察覺,讓選手休息或就醫,這對於延長選手的運動生涯來說是很重要的。

你的疲勞,AI 比你先發現

為了偵測選手的肌肉疲勞狀況,重建選手的動作也是這次計畫的重點之一。蔡佳良說:「一般來說,我們是用『光學式動作捕捉系統』來重建選手的運動姿態。」這是一套專門的系統,選手的身上會貼滿光點,由四面八方的攝影機拍攝光點的移動,來重建選手動作。「不過這套系統太昂貴了,」蔡佳良說:「因此我們希望用一般的高速攝影機來取代。」方法是先以光學式動作捕捉系統找出界定選手疲勞與否的標準(稱為黃金標準),再將黃金標準與高速攝影機的影像共同輸入電腦,訓練電腦以高速攝影機的影像重建選手動作,並判別選手疲勞狀態。

-----廣告,請繼續往下閱讀-----
蔡一如正在選手身上貼感測用的光點,準備以光學式動作捕捉系統重建選手的動作。圖/簡克志攝
電腦重建模擬選手的姿態及動作。圖/簡克志攝
左右畫面皆為電腦重建模擬選手的姿態及動作,左邊是感測器建立的人物模型,右邊同步對應到現場攝影機的實際圖像。圖/簡克志攝

 蔡佳良補充說:「等到我們把高速攝影機這一塊做起來,就會推廣到一般球館。」換句話說,未來一般民眾在運動中心等球館打球時,或許就能透過場館附設的高速攝影機,看見自己的動作及打球狀態,雖然不是職業選手,也可以研究自己的動作,享受運動科技帶來的好處。

智能手錶則由選手整天佩戴著,記錄選手日常的心跳及睡眠狀態,教練可以據此觀察選手生理狀況,也能輔助判斷疲勞狀態。計畫中使用的智能手錶由王振興研發,蔡佳良表示:「我們自己研發而不採用市面上的手錶,這樣可以依據我們的需求來收集資訊,也可以避免個資外洩的問題。」 

智能手錶可以 24 小時記錄選手的生理狀況。圖/簡克志攝

至於中樞神經的疲勞,可以透過腦波與眼動的狀態來發現,這也是蔡佳良的研究專長。但是蔡佳良說:「我們若要收集這些訊號,得讓選手戴上特製眼鏡,並在頭上貼特殊的貼紙,這會對選手打球造成影響。」因此,蔡佳良希望先將腦波及眼動的訊號,和智能球拍的感測訊號做連結,找出彼此的關聯,建立一個演算法,再將這個演算法寫入智能球拍的晶片中,「如果我們的演算法夠強,球拍感測訊號與腦波、眼動的關聯準確性夠高,就能直接從球拍的訊號,計算出選手的中樞神經疲勞狀況。」

學術與運動的跨領域溝通

AIOT 智能羽球訓練模式發展到目前的階段,已經可以從智能球拍的訊號,計算出個別選手的最快揮拍速度、最大擊球力道,以及爆發力、攻擊力、反應力等指數,蔡佳良笑說:「我們和教練也有一段磨合的過程,因為我們做研究的,想的都是怎樣的數據合適發表,卻不一定是教練真正需要的。」

-----廣告,請繼續往下閱讀-----
智能球拍感測到的訊息,經由雲端的 AI 計算中心計算後,轉化為各種淺顯易懂的能力指數,讓教練與選手一目了然。圖/簡克志攝

 新豐高中羽球隊的教練李宜勳也對此舉例:「一開始蔡教授的團隊提供過一個數據叫做『積極度』,判別的方式就是一場雙打比賽中擊球次數多的,就是比較積極。可是事實上,我們比賽的時候,會故意將球打給比較弱的選手,所以他們的擊球次數自然比較多,這不代表他們比較積極。」

不過,李宜勳認為將 AIOT 智能羽球訓練模式納入訓練,對選手的練習的確有幫助,「有時候教練說破了嘴,還不如數據直接攤開來看。」李宜勳笑說。看到明確的數據,選手之間也會有正向競爭,覺得不想輸給同儕,對於自己的動作或缺點也有更明確的認識。

運動訓練科學化

儘管 AIOT 智能羽球訓練模式還未真正完成,但蔡佳良對於這項研究的未來發展深具信心,他說:「我們的研究成果在其他有球拍的運動上都可以應用,例如網球。」

蔡佳良並且認為,運動科技的蓬勃發展下,未來的運動訓練一定也都會走向科學化。「其實我一開始做運動科學時,接觸過一些國家級的教練,他們對運動科學有點排斥,認為運動科學發展起來之後,會搶了他們的教練工作。但其實運動科學只是用數據輔助訓練,真正的訓練專業還是在教練身上。」蔡佳良希望現在還在起步階段,就有機會經歷科學訓練的選手,未來若是成了教練,可以經由自己的經驗,明白如何運用科技,讓訓練變得更有效率。

-----廣告,請繼續往下閱讀-----

「我們還希望我們的成果也能普及到一般民眾,因為運動科學的市場是很大的。」蔡佳良希望將智能球拍研發完整後,普及到一般運動用品店,讓民眾也能買來使用。他說:「即使是一般民眾,若能看看自己今天打球的狀況,也是很好玩、很有趣的事情。我相信會有人想買這種智能球拍的。」

-----廣告,請繼續往下閱讀-----
文章難易度
科技大觀園_96
82 篇文章 ・ 1126 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

0
0

文字

分享

0
0
0
如何讓 Suno 製作出你想要的音樂?四大規則讓你用精準的 prompt 做出心中所想的音樂!
泛科學院_96
・2024/07/04 ・2849字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

最近用了跟 Suno 類似的音樂生成服務 Udio 才讓我理解歌曲生成的 prompt 要怎麼寫,然後配合 sonoteller 這個神器,讓你聽到什麼就能生出什麼!

所以我們這集就來講講:

  1. AI 音樂生成 prompt 的規則
  2. 抄音樂 prompt 的好幫手 sonoteller
  3. suno 跟 udio 的差異

提醒一下,這集沒有詳細的 Suno 操作,重點會放在怎麼寫 prompt 上。

這邊整理一下你看這集必須要知道的事,可以暫停看一下:

-----廣告,請繼續往下閱讀-----


那如果想看詳細的 Suno 操作,可以到這支影片:

好啦,讓我們開始吧。

輸入 Suno 的 prompt 只要關鍵字就好?

一開始用 Suno 時,我一直很困惑,到底要怎麼打 prompt 才能有效控制生成的音樂?

自從最近用了 Udio,它有 prompt 隨機生成,研究了一下 Udio 的 prompt,規則大概是「一句有情緒的故事梗概,加上多個曲風或歌曲細節詞彙」。

-----廣告,請繼續往下閱讀-----

然後我把 Udio 的 prompt 拿到 Suno 上跑,也能跑出不錯的東西。

所以,前面應該是指定整首歌的情境?

例如情境換成悲慘命運,聽起來就會變悲傷。

然後我在後面加上輕快 (Brisk)⋯⋯欸?悲傷去哪了?前面那串根本消失啦!

-----廣告,請繼續往下閱讀-----

那如果把前面那句話,拆解成情緒與事件關鍵字輸入也行嗎?

畢竟字數有限,這樣就能下更多 prompt 了!

嗯,事實是沒差,只要關鍵字就好。

所以結論是,音樂生成的 prompt 跟 Stable Diffusion 差不多,一個一個單詞輸入就好。

-----廣告,請繼續往下閱讀-----

四大規則!

在多次測試之後,我認為有效的 prompt 可以分為這四類:

1. 曲風類:funk、rock、pop、classical 之類的特定曲風。

這些詞最重要,會最大幅度限制歌曲的走向,通常會放多個有關聯的曲風,例如 city pop 跟 funk 還有 Disco 有關,我前面的 prompt 就選了 city pop 跟 funk,不用 Disco 單純是出來之後更有電音舞曲感,我不喜歡。

2. 歌曲控制類:B 小調、brisk、BPM 之類的名詞。

-----廣告,請繼續往下閱讀-----

這類名詞只能做到修飾,例如前面的 prompt 加個 BPM 200,也不可能演奏出 BPM 200 的 city pop,只是稍微加快,但如果我把曲風換成 rock, metal,就能接近我要求的 BPM 200。

3. 情緒、狀態類:miserable, adventure 這些日常生活中會出現的詞彙,能提供整首歌曲的旋律、節奏,但效果極弱。

例如前面放了輕快 brisk,悲傷感就消失了。

4. 樂器類:歌曲中有出現什麼樂器。

-----廣告,請繼續往下閱讀-----

你在選曲風的時候,就已經有樂器配置了。像上面的 city pop,就已經預設會有效果器 (Synthesizer),因此就算輸入民謠吉他 (Acoustic Guitar),也聽不到民謠吉他的原聲,滿滿的效果器。

我把上面的重點總結在這裡,有需要的可以停下來看,總之,先找對曲風,才能生出你想要的音樂。

怎麼知道喜歡的歌是什麼曲風?

那這時你可能會問啦,我哪知道自己想生的曲風是什麼啊?

這時就輪到 Sonoteller 登場啦!

-----廣告,請繼續往下閱讀-----

Sonoteller 是分析歌詞與曲風的 AI 工具,只要給他 Youtube 網址就會幫你分析啦。

這樣你就可以在 Youtube 上先找一首參考的歌曲,再丟到 Sonoteller 分析,瞬間就有曲風的 prompt 啦。不過近期 Sonoteller 的伺服器不堪負荷,常會遇到拒絕分析歌曲的情況。

但如果是超流行的歌,例如 Ado 的 Show,因為已經有人分析過,就會直接調之前分析的資料給你。

畫面的左半邊是歌詞分析,因我沒有生成歌詞的需求,這裡就不詳細說,


不過我自己截一些 summary 中的字當 prompt。

右半邊是曲風分析,Genres 就是我們的曲風啦,也有提供副曲風、情緒、樂器、BPM、key 之類的資訊,都可以複製回去當 prompt 用。

後面的數字是相似程度,參考就好,畢竟曲風、情緒感受是很主觀的,

好啦,讓我們聽聽用 ado show 的曲風做出來的歌長怎樣吧。

好像不太對勁,加個 J-pop 進去看看,這個感覺比較對,就先到這邊吧。

也提醒一下,我們不太可能只複製一首歌的 prompt 就得到想要的歌,多放幾首你覺得類似的歌到 sonoteller 分析是個好方法!

配合 ChatGPT 之類的工具來生成額外 prompt 也可以。不過我覺得門檻比 sonoteller 高,而且也不容易搞懂那些詞彙到底代表了什麼。

等等,Udio 和 Suno 到底哪一個好用?

再來說說前面有提到的 Udio 和 Suno 有什麼差吧!

基本邏輯是相同的,但 Udio 的操作更直覺,Udio 有提供 prompt 提示,不僅給我靈感,讓我學到很多新名詞,真的超級多,可能我在學校音樂課學的詞彙都沒有這幾個禮拜學到的多。

還有 Udio 每次生成歌曲只有 30 秒,更容易修改或擴充,它的擴充還可以選擇 intro outro 來生成音樂的開頭結尾,比起suno用起來更順手。

然後現在 udio 完全免費,一個月能生成 600 首,超適合拿來練 prompt!

蛤?你說這集為什麼沒有 Udio 生成的歌?

因為現在 udio 免費生成的音樂不能商用!

所以這支影片,就還是以 Suno 為主啦。

最後,你覺得 AI 生成的音樂聽起來如何呢?

  1. 當背景音樂不錯聽
  2. 匠氣太重,了無新意
  3. 沒感覺,要做的話
  4. 其他也可以留言分享喔

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
泛科學院_96
44 篇文章 ・ 53 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

1
1

文字

分享

0
1
1
動動滑鼠就能生圖修圖?不用付錢就能即時生成的 Leonardo AI 讓繪畫行雲流水!
泛科學院_96
・2024/06/09 ・828字 ・閱讀時間約 1 分鐘

你在尋找免費的繪圖 AI 嗎?

自從 Stable Doodle 要收費後,我就一直在找類似的替代品,正好前陣子 Leonardo AI 也更新了Realtime Canva 功能,不是那個 Canva,是他們推出的塗鴉功能叫 Canva,試用之後驚為天人!

新增加的 inpaint 功能,能用 prompt 指定畫上去的色塊代表什麼,也有圖層跟透明度功能,大幅降低修整圖片的難度。

重點是,免費可用啊,付費只多了 realtime 及時生成,但免費的速度也不會太慢,你問我為什麼會知道?當然是花了錢之後發現根本沒差啊!

而且及時生成的圖都不用扣點,直到你按下輸出鍵才扣,修改次數無限,可以免費白嫖玩到爽,所以今天,就來教一下怎麼用 Leonardo Canva 啦,大概會說這三件事情:

-----廣告,請繼續往下閱讀-----
  1. 從無到有快速生成人物:這邊就簡單介紹基本操作。
  2. 在不影響生成人物的狀況下,加上背景:這邊會用到圖層、去背、AI 元素生成等功能。
  3. 最後微調:介紹 inpaint 功能怎麼用。

好啦,讓我們開始吧!

最後,你覺得 AI 圖片生成應該還要提供什麼服務呢?

  1. 我上色苦手,拜託有個不改我線稿的 AI 上色工具
  2. 可以有更多修改細節的方法,現在都太笨了
  3. 能不能讓 AI 讀懂構圖,不要每次圖生圖都變樣了
  4. 我不知道,能生不就好了

如果有其他想看的 AI 工具測試或相關問題,也可以留言發問。如果喜歡這支影片的話,也別忘了按讚、訂閱,加入會員,我們下集再見~掰!

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
泛科學院_96
44 篇文章 ・ 53 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

14
0

文字

分享

0
14
0
AI 讓羽球訓練更聰明!智慧球拍上手,揮拍「爆發力」一測就知道
科技大觀園_96
・2021/10/18 ・3852字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

「啪!」「啪!」在臺南新豐高中的羽球場上,球拍強力揮擊的聲響不絕於耳,幾位選手正奮力廝殺著。但這場羽球賽有點不同,因為旁邊還架著一具電視螢幕,而選手手上的球拍也不太一樣。練習賽結束後,教練與選手聚集在螢幕前,對著螢幕上的揮拍速度、爆發力指數等數據,熱烈地討論了起來。

會出現這麼特殊的景象,是因為新豐高中的羽球隊從去年(2019年) 5 月起,開始做為科技部計畫「從中樞系統建構雲端 AI 運動訓練歷程分析與疲勞診斷系統:以羽球項目為例」(以下簡稱「AIOT 智能羽球訓練模式」)的實驗基地,而這個計畫由成功大學體育健康與休閒研究所特聘教授蔡佳良領軍,希望利用人工智慧,將羽球的訓練科學化,達到最有效精準的訓練效果。

這項計畫包含五個部分,包括智能球拍、智能手錶、高速攝影動作捕捉,以及雲端 AI 運算中心和顯示各項運動與生理數值的 APP。智能球拍、智能手錶、高速攝影負責收集運動資訊,將資訊以 Wifi 網路上傳到雲端的 AI 運算中心計算後,結果呈現在電腦螢幕及專用的手機 APP 上,讓教練與選手一目了然。 

AIOT 智能羽球訓練模式計畫所研發的智能球拍、感測晶片、智能手錶,以及專用的 APP。圖/簡克志攝

 計畫中使用的雲端計算中心是成大電機系教授王振興所主持的人工智能數位轉型研究中心 ,智能球拍、手錶等裝置不斷上傳的資料,會持續訓練 AI 演算法自身,讓演算法變得愈來愈精準。

-----廣告,請繼續往下閱讀-----

為了讓訓練過程面面俱到,蔡佳良組了一支跨領域的「黃金陣容」,除了專研腦波與眼動的自己外,還找了工程專業的成大電機系教授王振興、負責 AI 演算法的逢甲大學自動控制工程學系副教授許煜亮、專研運動傷害的成大物理治療系副教授蔡一如,每位成員的專業領域都不一樣,在計畫中各司其職。

計畫團隊主要成員,左起許煜亮教授、蔡佳良教授、蔡一如教授、羽球教練李宜勳,另外還有成大電機系教授王振興(未參與合影)。圖/簡克志攝

聰明的智能球拍

計畫中的一大重點,就是選手手上那支「智能球拍」,它可以收集選手的揮拍力道、轉動角度等數值,經過計算後,能知道揮拍速度、軌跡,還能分辨出九個不同的球種,這是因為球拍的握把中藏了一個感測晶片。

智能球拍的握把中藏著感測晶片,底部有接線孔以及 2 個 LED 指示燈。圖/簡克志攝
當選手用智能球拍揮拍時,系統可以得知選手揮拍的加速度、拍子轉動的角速度等運動數據。圖/簡克志攝 

在握把中放入感測晶片就能做到,聽起來很容易,但在羽球拍上卻沒那麼簡單。蔡佳良說:「羽球選手對球拍的重量可是很要求的,一般選手使用的球拍大約 80 幾克,重一點輕一點,手感就差很多了。」而一個晶片動輒 10 幾克,直接放上球拍,不但影響重量,還改變了球拍的重心位置,「這樣的球拍沒有人會想用。」蔡佳良說。

後來,蔡佳良找了勝利體育公司合作,在以碳纖維為材料的握把中納入晶片,並盡量減少晶片重量,才做出了目前的智能球拍。蔡佳良說:「不過我們還是想再縮小晶片的重量,看看是否能讓晶片的電池小一點,希望能將球拍再減少 5 公克左右。」

-----廣告,請繼續往下閱讀-----

你累了嗎?疲勞狀態對訓練來說很重要!

有了能收集選手打球狀況的智能球拍還不夠,蔡佳良還希望能將選手的「疲勞狀態」也納入訓練的參考,這也是接下來 AIOT 智能羽球訓練模式的發展重點。

蔡佳良與蔡一如指出,疲勞分成「中樞神經疲勞」與「周邊神經疲勞」,中樞神經疲勞反應在腦的專注力、心理上的鬥志等,例如比賽時間過長,或是選手心態上已經認輸等,這可以從選手的腦波及眼動訊號來判斷;而周邊神經疲勞則反應在肌肉的動作,例如選手的移動腳步可能變慢、揮拍動作變小等。此外,長時間受訓練的選手也可能慢性疲勞,儘管身體好像沒怎麼樣,但可能一早起床就覺得特別累,不想練球等。

分析選手的疲勞狀態,還可以進一步預防選手受傷,在選手有一點點受傷徵兆時,例如動作稍微改變時,就及時察覺,讓選手休息或就醫,這對於延長選手的運動生涯來說是很重要的。

你的疲勞,AI 比你先發現

為了偵測選手的肌肉疲勞狀況,重建選手的動作也是這次計畫的重點之一。蔡佳良說:「一般來說,我們是用『光學式動作捕捉系統』來重建選手的運動姿態。」這是一套專門的系統,選手的身上會貼滿光點,由四面八方的攝影機拍攝光點的移動,來重建選手動作。「不過這套系統太昂貴了,」蔡佳良說:「因此我們希望用一般的高速攝影機來取代。」方法是先以光學式動作捕捉系統找出界定選手疲勞與否的標準(稱為黃金標準),再將黃金標準與高速攝影機的影像共同輸入電腦,訓練電腦以高速攝影機的影像重建選手動作,並判別選手疲勞狀態。

-----廣告,請繼續往下閱讀-----
蔡一如正在選手身上貼感測用的光點,準備以光學式動作捕捉系統重建選手的動作。圖/簡克志攝
電腦重建模擬選手的姿態及動作。圖/簡克志攝
左右畫面皆為電腦重建模擬選手的姿態及動作,左邊是感測器建立的人物模型,右邊同步對應到現場攝影機的實際圖像。圖/簡克志攝

 蔡佳良補充說:「等到我們把高速攝影機這一塊做起來,就會推廣到一般球館。」換句話說,未來一般民眾在運動中心等球館打球時,或許就能透過場館附設的高速攝影機,看見自己的動作及打球狀態,雖然不是職業選手,也可以研究自己的動作,享受運動科技帶來的好處。

智能手錶則由選手整天佩戴著,記錄選手日常的心跳及睡眠狀態,教練可以據此觀察選手生理狀況,也能輔助判斷疲勞狀態。計畫中使用的智能手錶由王振興研發,蔡佳良表示:「我們自己研發而不採用市面上的手錶,這樣可以依據我們的需求來收集資訊,也可以避免個資外洩的問題。」 

智能手錶可以 24 小時記錄選手的生理狀況。圖/簡克志攝

至於中樞神經的疲勞,可以透過腦波與眼動的狀態來發現,這也是蔡佳良的研究專長。但是蔡佳良說:「我們若要收集這些訊號,得讓選手戴上特製眼鏡,並在頭上貼特殊的貼紙,這會對選手打球造成影響。」因此,蔡佳良希望先將腦波及眼動的訊號,和智能球拍的感測訊號做連結,找出彼此的關聯,建立一個演算法,再將這個演算法寫入智能球拍的晶片中,「如果我們的演算法夠強,球拍感測訊號與腦波、眼動的關聯準確性夠高,就能直接從球拍的訊號,計算出選手的中樞神經疲勞狀況。」

學術與運動的跨領域溝通

AIOT 智能羽球訓練模式發展到目前的階段,已經可以從智能球拍的訊號,計算出個別選手的最快揮拍速度、最大擊球力道,以及爆發力、攻擊力、反應力等指數,蔡佳良笑說:「我們和教練也有一段磨合的過程,因為我們做研究的,想的都是怎樣的數據合適發表,卻不一定是教練真正需要的。」

-----廣告,請繼續往下閱讀-----
智能球拍感測到的訊息,經由雲端的 AI 計算中心計算後,轉化為各種淺顯易懂的能力指數,讓教練與選手一目了然。圖/簡克志攝

 新豐高中羽球隊的教練李宜勳也對此舉例:「一開始蔡教授的團隊提供過一個數據叫做『積極度』,判別的方式就是一場雙打比賽中擊球次數多的,就是比較積極。可是事實上,我們比賽的時候,會故意將球打給比較弱的選手,所以他們的擊球次數自然比較多,這不代表他們比較積極。」

不過,李宜勳認為將 AIOT 智能羽球訓練模式納入訓練,對選手的練習的確有幫助,「有時候教練說破了嘴,還不如數據直接攤開來看。」李宜勳笑說。看到明確的數據,選手之間也會有正向競爭,覺得不想輸給同儕,對於自己的動作或缺點也有更明確的認識。

運動訓練科學化

儘管 AIOT 智能羽球訓練模式還未真正完成,但蔡佳良對於這項研究的未來發展深具信心,他說:「我們的研究成果在其他有球拍的運動上都可以應用,例如網球。」

蔡佳良並且認為,運動科技的蓬勃發展下,未來的運動訓練一定也都會走向科學化。「其實我一開始做運動科學時,接觸過一些國家級的教練,他們對運動科學有點排斥,認為運動科學發展起來之後,會搶了他們的教練工作。但其實運動科學只是用數據輔助訓練,真正的訓練專業還是在教練身上。」蔡佳良希望現在還在起步階段,就有機會經歷科學訓練的選手,未來若是成了教練,可以經由自己的經驗,明白如何運用科技,讓訓練變得更有效率。

-----廣告,請繼續往下閱讀-----

「我們還希望我們的成果也能普及到一般民眾,因為運動科學的市場是很大的。」蔡佳良希望將智能球拍研發完整後,普及到一般運動用品店,讓民眾也能買來使用。他說:「即使是一般民眾,若能看看自己今天打球的狀況,也是很好玩、很有趣的事情。我相信會有人想買這種智能球拍的。」

-----廣告,請繼續往下閱讀-----
文章難易度
科技大觀園_96
82 篇文章 ・ 1126 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。