Loading [MathJax]/extensions/tex2jax.js

0

0
1

文字

分享

0
0
1

從圖靈機到人工智慧,沒有「數學」怎能召喚電腦降世!

研之有物│中央研究院_96
・2018/01/10 ・3420字 ・閱讀時間約 7 分鐘 ・SR值 536 ・七年級

-----廣告,請繼續往下閱讀-----

 數學有什麼用?我們每天使用的電腦,就是源自於數學。中研院數學所的李國偉兼任研究員,聊聊圖靈機的故事,解開生活中的數學密碼。
簡單來說,拿一個手機出來,裡面很多功能、App 的演算法,都使用數學。
李國偉笑著說:「數學證明不可能全部由一部電腦產生出來。不然所有工作搞一個電腦跑光,我們就不用做數學了!」  圖/張語辰攝影

圖靈測試──這是電腦還是人?

人工智慧圍棋程式 AlphaGo,壓倒性擊敗棋王而轟動全世界,令人不禁疑問:機器可以思考嗎?機器可以超越人類心靈嗎?而著名的「圖靈測試」 (Turing Test),就是對此問題的一種判定。

電影《模仿遊戲》(The imitaiton game)就是圖靈的故事。圖/The Imitation game@IMDB

李國偉說,圖靈測試就是「模仿遊戲」。 1950 年圖靈(Alan Turing)發表了《Computing machinery and intelligence》這篇文章,討論「電腦會不會思考」,成為人工智慧的重要思想來源。由於「思考」本身很難定義,圖靈訴諸可供判定的方法:一台電腦和一個人交談,如果交談的人始終分不清楚誰是電腦、誰是人,那這台電腦在行為上已經接近人的思考能力。

「圖靈測試」是利用電腦模仿人類交談的遊戲,來判斷機器是否像人一樣有思考能力。 圖/張語辰重製

AlphaGo 擊敗棋王,可以說是通過圖靈測試了嗎?李國偉解釋,雖然電腦很多能力的確比人強,不僅下圍棋,計算數學的能力也早就超越人類,但是圖靈測試是「漫無目標」的智能測驗,包括各種「常識」。電腦在很多專業知識上都超越人腦,但是最弱的就是常識。至今,還沒有一台機器真正通過圖靈測試。

不過,如何訓練機器擁有常識,是有方向可循。如同 AlphaGo,訓練機器的方法,就是從一個「嬰兒機器」開始,讓它不斷學習、演化。下棋的好方法保留下來,壞方法淘汰掉,機器就不斷增強。

-----廣告,請繼續往下閱讀-----
AlphaGo 與柯潔的圍棋對戰結果讓全世界開始關注人工智慧議題。 圖/AlphaGo

事實上,機器學習的方法,早在圖靈 1950 年的文章中就已經提出。當時沒有相應的硬體條件可以實際做出,直到現在,GPU、TPU 等硬體效能趕上軟體運算的需求,開始表現出早期人們預期人工智慧能達到的事情。

在圖靈的時代,有許多先進的工程師,甚至不相信電腦有可能幫人算帳。

只有圖靈,深刻了解數學的核心慨念,所以思想沒有受制於當時的硬體,認為未來電腦的能力將會大幅提升。

圖靈為何有先見之明?憑藉的就是他發展出的一套理論數學計算機模型──圖靈機 (Turing Machine)。圖靈機的故事說來話長,李國偉從 19 世紀的數學發展聊起。

從數學難題到資訊科學的開端

19 世紀末的數學家,發現一些數學的基礎出了問題,例如「無窮」的概念定義不清。他們想從最簡單的概念出發,就像歐幾里得建立公理、公設一樣,重新建立起一套數學的體系。他們想到,在自然數之前,更基礎的是 and、or、not 之類的邏輯概念。

-----廣告,請繼續往下閱讀-----
and、or、not 的邏輯概念,也是電子電路、電腦程式碼的基礎。 圖/張語辰重製

試圖找出算術的基礎,數學家弗雷格(Gottlob Frege)嘔心瀝血寫成大作,嚴謹定義什麼叫做「集合」。沒想到,當時才二十幾歲的羅素(Bertrand Russell)找到致命的矛盾:當我考慮把所有「自己不屬於自己」的集合,放在一個集合 A 裡,那麼那個集合 A 屬於不屬於自己?這就導出了著名的「羅素悖論」。

世界頂尖的數學家都跳進來解決集合論基礎問題。若要解決,必須把「自己不屬於自己」這種奇怪的東西,排除到數學王國之外。問題來了,數學王國的圍牆怎麼蓋?大數學家希爾伯特(David Hilbert)選擇了一條安全的途徑:假裝我們每天講的數學,都是以符號寫成。他從「形式系統」出發,完全玩符號遊戲。

但是,問題又來了。怎麼證明一個形式系統是一致的,沒有矛盾?李國偉說,如果用機械化的方法,一步一步寫出來所有系統裡的定理,即使矛盾一直沒有出現,這種方式還是無法說服人!希爾伯特試著尋找真正有效的證明。

沒想到,在 1931 年,年輕數學家哥德爾(Kurt Gödel)證明了相反的結果:如果你的系統複雜到可以講一點點的自然數理論,那就沒有辦法在你的系統裡面,保證不出矛盾。希爾伯特的夢想是達不到的!

-----廣告,請繼續往下閱讀-----

順著這些數學脈絡發展,圖靈從一個新的角度切入,才充分捕捉到「機械性的計算」的概念。

圖靈機不是機器,是理論數學的計算模型

李國偉解釋,所謂的圖靈機,其實不是一個真正的「機器」,而是「理論數學」的模型。

圖靈為了敘述的容易,把理論描述成一張紙帶,上面畫了很多格子,還有一個讀寫頭。讀寫頭儲存了有限個不同狀態,若決定了現在的狀態,再看底下格子的符號,就決定了下一步會變成什麼狀態。

圖靈機就是一張表格:現在的狀態 →下一步怎麼走 → 移動 → 現在的狀態。

圖靈澄清了「什麼是數學的機械化」這件事情。一般從小到大學過的函數,只要在整數值上,圖靈機都可以計算。李國偉說明,因為這個表格是有限的,所以可用自然數來編碼。自然數可以因數分解,一個非常大的數字,一層一層因數分解下來,等於肚子裡頭一層一層包含訊息。就像數字變成了一個機器!

圖靈機邏輯具象化。 圖/wikipedia

延伸這個思維,圖靈還提出一種「通用圖靈機(Universal Turing Machine)」,可以把各種機器的程式都吃進來,模擬另一個機器計算的結果。這就是我們現在使用的電腦,同一套軟體不論移到哪台電腦都能計算。

-----廣告,請繼續往下閱讀-----

電腦協助證明數學定理,並製造出更多難題

圖靈一方面說電腦可以很強大,另一方面又指出機器的侷限。他證明,有個「停機問題」是任何計算機都無法判定,也就是「是否存在一個程式 P ,對於任意輸入的程式 w ,能夠判斷 w 會在有限時間內結束、或者無窮迴圈。」以數學的角度來說,並沒有一般的機械方式,可以處理這種判定。

 

話又說回來,電腦還是有強大的功能,協助數學研究。 1976 年,電腦輔助證明了經典難題「四色定理」;至今,電腦甚至已經能夠自動證明數學定理,只差在還無法主動發明有深度而令數學家感興趣的定理,讓數學家還能保住飯碗。電腦也促成了很多新的數學研究主題,李國偉的研究領域「組合數學」,隨著計算機的發展更加興盛。

組合數學研究的對象是離散的、有限數目的問題。李國偉說,他的師長輩的老派數學家,由於沒有受過計算機的洗禮,認為他們研究組合數學,就好像研究高中的排列組合一樣,沒什麼意思。他們沒想到,當「有限」的數目夠大,可能比探討「無限」的問題更困難。

計算機的發展,創造了龐大的「有限」世界,也產生了深刻的「組合數學」問題。

李國偉說明,組合數學的問題,在網際網路的時代更有趣。人們使用網際網路,假如全世界有幾十億個節點,我跟你通訊就代表兩個點連上一個邊,邊的數目就是更龐大的數字,狀況非常複雜。使用算術處理龐大的離散數據,這類問題成為計算機科學裡面「演算法」的學問。

-----廣告,請繼續往下閱讀-----
圖/By Tumisu @Pixabay

在有限的範圍內一定存在答案,但是實際求解的時候,希望找到最有效率、最節省資源的解,這就是數學的組合優化。

若下回有小朋友問你「學數學有什麼用」,別忘了指著電腦或手機 App 說:「這裡面,就是數學。」

本著作由研之有物製作,原文為《涂林機到人工智慧,誰讓電腦強大?是數學!》,以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3638 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

2
1

文字

分享

0
2
1
上網也要有「技術」!從言論、隱私到國安,你我都該懂的界線
鳥苷三磷酸 (PanSci Promo)_96
・2024/12/18 ・2366字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

本文由 國家通訊傳播委員會 委託,泛科學企劃執行。 

以為鍵盤俠天下無敵?小心一個不留神就觸法!人們常忽略「網路並非法外之地」這個重要事實。不只現實生活中的法律同樣適用於網路空間,隨著科技發展,更多應網路特性而生的法律規範也相繼出現。從基本的言論自由到隱私權保護,從智慧財產權到國家安全,法律體系正全面性地回應數位時代的種種挑戰。

在臺灣,網路上的言論自由權利源自《憲法》第 11 條的明確規定:「人民有言論、講學、著作及出版之自由。」釋字第 509 號則指出,「國家應給予最大限度之維護,俾其實現自我、溝通意見、追求真理及監督各種政治或社會活動之功能得以發揮。」網路快速傳播的特性放大了言論的影響力,而大法官的解釋將言論自由的邊際刻畫得更明確,這在數位時代裡顯得格外重要。

網路與社群媒體的快速傳播,放大了言論的影響力。圖/unsplash

網路上的性、暴力與未成年保護

顯然言論自由並非是毫無限制,2023 年 11 月的一起案件就展現其中一種界線的樣貌。當時,一名 36 歲男子將他和網友在網咖的性愛影片上傳至推特,還寫下「《網咖包廂實戰計 1》我跟某公司 OL 戰鬥」等文字。這段影片一經發布,當事女子立即採取法律行動。最終,法院依其以網際網路「供人觀覽猥褻影像」的罪名,判處該名男子拘役 30 日,得易科罰金。這個判決清楚說明了,即便在虛擬空間,散布猥褻影像仍須承擔實質的法律責任。

-----廣告,請繼續往下閱讀-----

特別是在保護未成年人方面,法律的規範更加嚴格。《刑法》第 235 條明文禁止散布、播送或販賣猥褻物品,無論形式是圖文、聲音還是影像。而《兒童及少年性剝削防制條例》第 36 條更進一步禁止任何形式的兒童色情製品被製造、散布和持有。2019年彰化縣曾層發生過這樣一起案件:一名陳姓中年男子將9歲女童帶往居所,不僅強迫她觀看色情影片,還對她進行猥褻行為,甚至將過程上傳至 Google 雲端。儘管他後來試圖以資助女童就學表達悔意,法院仍以加重強制猥褻等罪,判處他 4 年 4 個月有期徒刑。

不實言論的散布同樣可能觸犯法律。2021 年 9 月爆發的「台大狼師案」就是一個警示。一名女大生在網路上指控教師誘騙她發生關係並傳染性病,幾個月後又指控對方對她進行強制性行為。當她提出告訴時,檢方卻查無性侵事實,加上她反覆的說詞,不僅性侵告訴失敗,還因誹謗罪反被加重判刑。

當駭客、間諜都轉戰網路戰場

2013 年,一名退役空軍上校赴陸經商時被情治單位吸收,返台後透過人脈網絡發展組織、刺探軍事機密,並以空殼公司掩護非法報酬,這個情報網持續運作了 8 年之久。

在涉及國家安全的議題上,法律的態度更是嚴厲。根據《國家安全法》第 2 條的規定,任何人都不得為境外敵對勢力及其控制的組織、機構進行資助、主持、操縱、指揮或發展組織,更不能洩漏、交付或傳遞公務機密,違反者將面臨嚴厲的刑事處罰。《刑法》規定,意圖破壞國體、竊據國土,或以非法方法變更國憲、顛覆政府者,處7年以上有期徒刑,首謀更要判處無期徒刑。

-----廣告,請繼續往下閱讀-----

抄襲與轉貼的邊界在哪裡?

在智慧財產權的保護上,臺灣也經歷了數位時代的轉變。台灣第一個網路著作權相關判決,就發生在傳統出版與數位平台的碰撞之中。南方社區文化網路負責人陳豐偉等三人在中山大學 BBS 上發表的文章,未經同意就被《光碟月刊》收錄在隨刊光碟中發行。三人向台北地檢署提告後,《光碟月刊》發行人兼總經理黃俊義被判處七個月有期徒刑,緩刑三年。這個判決為數位時代的著作權保護樹立了重要典範。

臺灣首例網路著作權案判決,為數位時代智慧財產權保護樹立典範。圖/envato

近年來,影音平台的著作權爭議更趨複雜。2022 年,知名 YouTube 頻道「觸電網」就因為片商車庫娛樂檢舉七十多支未經授權的影片,導致經營 12 年的頻道被迫下架。車庫娛樂透過律師聲明,這是針對「未經合法授權影音內容」的標準處理,並表明將追究民事與刑事責任。

受害了怎麼辦?申訴管道報你知

當我們在網路上的權利受到侵害時,可以根據侵害類型尋求不同的救濟管道。最基本的言論自由權利受到侵犯時,可以先向社群平台提出檢舉。若遇到更嚴重的情況,如散布猥褻影像、非法性私密影片等,除了平台檢舉外,還可以向警方提告,或是尋求衛福部「性影像處理中心」的協助。

在面對網路霸凌、不實言論時,可以向台灣事實查核中心、MyGoPen 等組織求助,協助澄清真相。若發現有害兒少身心健康的不當內容,則可以向 iWIN 網路內容防護機構提出申訴。這個由國家通訊傳播委員會支持的組織,會在受理後進行查核、轉介業者改善或依法處理。

-----廣告,請繼續往下閱讀-----

智慧財產權的侵害在網路時代極為常見,就像「觸電網」遭片商檢舉下架的案例。這類情況可以透過平台既有的著作權保護機制處理,情節嚴重者也可以提起民事訴訟要求賠償。若發現可疑的廣告或不公平交易行為,則可以向公平交易委員會檢舉;若是特定領域的違規內容,則應該向各該主管機關反映,例如藥品廣告歸衛福部管轄、證券期貨廣告則由金管會負責。

網路時代的法律規範正不斷演進,從個人隱私到國家安全,從言論自由到智慧財產權,每個面向都在尋求數位環境下的最佳平衡點。作為網路使用者,我們必須理解並遵守這些法律界線,同時也要懂得運用各種救濟管道保護自身權益。唯有每個人都清楚了解並遵守這些規範,才能共同營造一個更安全、更有序的網路環境。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
222 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
當心網路陷阱!從媒體識讀、防詐騙到個資保護的安全守則
鳥苷三磷酸 (PanSci Promo)_96
・2024/12/17 ・3006字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文由 國家通訊傳播委員會 委託,泛科學企劃執行。 

網路已成為現代人生活中不可或缺的一部分,可伴隨著便利而來的,還有層出不窮的風險與威脅。從充斥網路的惡假害訊息,到日益精進的詐騙手法,再到個人隱私的安全隱憂,這些都是我們每天必須面對的潛在危機。2023 年網路購物詐欺案件達 4,600 起,較前一年多出 41%。這樣的數據背後,正反映出我們對網路安全意識的迫切需求⋯⋯

「第一手快訊」背後的騙局真相

在深入探討網路世界的風險之前,我們必須先理解「錯誤訊息」和「假訊息」的本質差異。錯誤訊息通常源於時效性考量下的查證不足或作業疏漏,屬於非刻意造假的不實資訊。相較之下,假訊息則帶有「惡、假、害」的特性,是出於惡意、虛偽假造且意圖造成危害的資訊。

2018 年的關西機場事件就是一個鮮明的例子。當時,燕子颱風重創日本關西機場,數千旅客受困其中。中國媒體隨即大肆宣傳他們的大使館如何派車前往營救中國旅客,這則未經證實的消息從微博開始蔓延,很快就擴散到各個內容農場。更令人遺憾的是,這則假訊息最終導致當時的外交部駐大阪辦事處處長蘇啟誠,因不堪輿論壓力而選擇結束生命。

-----廣告,請繼續往下閱讀-----

同年,另一則「5G 會抑制人體免疫系統」的不實訊息在網路上廣為流傳。這則訊息聲稱 5G 技術會影響人體免疫力、導致更容易感染疾病。儘管科學家多次出面澄清這完全是毫無根據的說法,但仍有許多人選擇相信並持續轉發。類似的例子還有 2018 年 2 月底 3 月初,因量販業者不當行銷與造謠漲價,加上媒體跟進報導,而導致民眾瘋狂搶購衛生紙的「安屎之亂」。這些案例都說明了假訊息對社會秩序的巨大衝擊。

提升媒體識讀能力,對抗錯假訊息

面對如此猖獗的假訊息,我們首要之務就是提升媒體識讀能力。每當接觸到訊息時,都應先評估發布該消息的媒體背景,包括其成立時間、背後所有者以及過往的報導記錄。知名度高、歷史悠久的主流媒體通常較為可靠,但仍然不能完全放下戒心。如果某則消息只出現在不知名的網站或社群媒體帳號上,而主流媒體卻未有相關報導,就更要多加留意了。

提升媒體識讀能力,檢視媒體背景,警惕來源不明的訊息。圖/envato

在實際的資訊查證過程中,我們還需要特別關注作者的身分背景。一篇可信的報導通常會具名,而且作者往往是該領域的資深記者或專家。我們可以搜索作者的其他作品,了解他們的專業背景和過往信譽。相對地,匿名或難以查證作者背景的文章,就需要更謹慎對待。同時,也要追溯消息的原始來源,確認報導是否明確指出消息從何而來,是一手資料還是二手轉述。留意發布日期也很重要,以免落入被重新包裝的舊聞陷阱。

這優惠好得太誇張?談網路詐騙與個資安全

除了假訊息的威脅,網路詐騙同樣令人憂心。從最基本的網路釣魚到複雜的身分盜用,詐騙手法不斷推陳出新。就拿網路釣魚來說,犯罪者通常會偽裝成合法機構的人員,透過電子郵件、電話或簡訊聯繫目標,企圖誘使當事人提供個人身分、銀行和信用卡詳細資料以及密碼等敏感資訊。這些資訊一旦落入歹徒手中,很可能被用來進行身分盜用和造成經濟損失。

-----廣告,請繼續往下閱讀-----
網路詐騙手法不斷進化,釣魚詐騙便常以偽裝合法機構誘取敏感資訊。圖/envato

資安業者趨勢科技的調查就發現,中國駭客組織「Earth Lusca」在 2023 年 12 月至隔年 1 月期間,利用談論兩岸地緣政治議題的文件,發起了一連串的網路釣魚攻擊。這些看似專業的政治分析文件,實際上是在臺灣總統大選投票日的兩天前才建立的誘餌,目的就是為了竊取資訊,企圖影響國家的政治情勢。

網路詐騙還有一些更常見的特徵。首先是那些好到令人難以置信的優惠,像是「中獎得到 iPhone 或其他奢侈品」的訊息。其次是製造緊迫感,這是詐騙集團最常用的策略之一,他們會要求受害者必須在極短時間內作出回應。此外,不尋常的寄件者與可疑的附件也都是警訊,一不小心可能就會點到含有勒索軟體或其他惡意程式的連結。

在個人隱私保護方面,社群媒體的普及更是帶來了新的挑戰。2020 年,一個發生在澳洲的案例就很具有警示意義。當時的澳洲前總理艾伯特在 Instagram 上分享了自己的登機證照片,結果一位網路安全服務公司主管僅憑這張圖片,就成功取得了艾伯特的電話與護照號碼等個人資料。雖然這位駭客最終選擇善意提醒而非惡意使用這些資訊,但這個事件仍然引發了對於在社群媒體上分享個人資訊安全性的廣泛討論。

安全防護一把罩!更新裝置、慎用 Wi-Fi、強化密碼管理

為了確保網路使用的安全,我們必須建立完整的防護網。首先是確保裝置和軟體都及時更新到最新版本,包括作業系統、瀏覽器、外掛程式和各類應用程式等。許多網路攻擊都是利用系統或軟體的既有弱點入侵,而這些更新往往包含了對已知安全漏洞的修補。

-----廣告,請繼續往下閱讀-----

在使用公共 Wi-Fi 時也要特別當心。許多公共 Wi-Fi 缺乏適當的加密和身分驗證機制,讓不法分子有機可乘,能夠輕易地攔截使用者的網路流量,竊取帳號密碼、信用卡資訊等敏感數據。因此,在咖啡廳、機場、車站等公共場所,都應該避免使用不明的免費 Wi-Fi 處理重要事務或進行線上購物。如果必須連上公用 Wi-Fi,也要記得停用裝置的檔案共享功能。

使用公共 Wi-Fi 時,避免處理敏感事務,因可能存在數據被攔截與盜取的風險。圖/envato

密碼管理同樣至關重要。我們應該為不同的帳戶設置獨特且具有高強度的密碼,結合大小寫字母、數字和符號,創造出難以被猜測的組合。密碼長度通常建議在 8~12 個字元之間,且要避免使用個人資訊相關的詞彙,如姓名、生日或電話號碼。定期更換密碼也是必要的,建議每 3~6 個月更換一次。研究顯示,在網路犯罪的受害者中,高達八成的案例都與密碼強度不足有關。

最後,我們還要特別注意社群媒體上的隱私設定。許多人在初次設定後就不再關心,但實際上我們都必須定期檢查並調整這些設定,確保自己清楚瞭解「誰可以查看你的貼文」。同時,也要謹慎管理好友名單,適時移除一些不再聯繫或根本不認識的人。在安裝新的應用程式時,也要仔細審視其要求的權限,只給予必要的存取權限。

提升網路安全基於習慣培養。辨識假訊息的特徵、防範詐騙的警覺心、保護個人隱私的方法⋯⋯每一個環節都不容忽視。唯有這樣,我們才能在享受網路帶來便利的同時,也確保自身的安全!

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
222 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
0

文字

分享

0
0
0
如何讓 Suno 製作出你想要的音樂?四大規則讓你用精準的 prompt 做出心中所想的音樂!
泛科學院_96
・2024/07/04 ・2849字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

最近用了跟 Suno 類似的音樂生成服務 Udio 才讓我理解歌曲生成的 prompt 要怎麼寫,然後配合 sonoteller 這個神器,讓你聽到什麼就能生出什麼!

所以我們這集就來講講:

  1. AI 音樂生成 prompt 的規則
  2. 抄音樂 prompt 的好幫手 sonoteller
  3. suno 跟 udio 的差異

提醒一下,這集沒有詳細的 Suno 操作,重點會放在怎麼寫 prompt 上。

這邊整理一下你看這集必須要知道的事,可以暫停看一下:

-----廣告,請繼續往下閱讀-----


那如果想看詳細的 Suno 操作,可以到這支影片:

好啦,讓我們開始吧。

輸入 Suno 的 prompt 只要關鍵字就好?

一開始用 Suno 時,我一直很困惑,到底要怎麼打 prompt 才能有效控制生成的音樂?

自從最近用了 Udio,它有 prompt 隨機生成,研究了一下 Udio 的 prompt,規則大概是「一句有情緒的故事梗概,加上多個曲風或歌曲細節詞彙」。

-----廣告,請繼續往下閱讀-----

然後我把 Udio 的 prompt 拿到 Suno 上跑,也能跑出不錯的東西。

所以,前面應該是指定整首歌的情境?

例如情境換成悲慘命運,聽起來就會變悲傷。

然後我在後面加上輕快 (Brisk)⋯⋯欸?悲傷去哪了?前面那串根本消失啦!

-----廣告,請繼續往下閱讀-----

那如果把前面那句話,拆解成情緒與事件關鍵字輸入也行嗎?

畢竟字數有限,這樣就能下更多 prompt 了!

嗯,事實是沒差,只要關鍵字就好。

所以結論是,音樂生成的 prompt 跟 Stable Diffusion 差不多,一個一個單詞輸入就好。

-----廣告,請繼續往下閱讀-----

四大規則!

在多次測試之後,我認為有效的 prompt 可以分為這四類:

1. 曲風類:funk、rock、pop、classical 之類的特定曲風。

這些詞最重要,會最大幅度限制歌曲的走向,通常會放多個有關聯的曲風,例如 city pop 跟 funk 還有 Disco 有關,我前面的 prompt 就選了 city pop 跟 funk,不用 Disco 單純是出來之後更有電音舞曲感,我不喜歡。

2. 歌曲控制類:B 小調、brisk、BPM 之類的名詞。

-----廣告,請繼續往下閱讀-----

這類名詞只能做到修飾,例如前面的 prompt 加個 BPM 200,也不可能演奏出 BPM 200 的 city pop,只是稍微加快,但如果我把曲風換成 rock, metal,就能接近我要求的 BPM 200。

3. 情緒、狀態類:miserable, adventure 這些日常生活中會出現的詞彙,能提供整首歌曲的旋律、節奏,但效果極弱。

例如前面放了輕快 brisk,悲傷感就消失了。

4. 樂器類:歌曲中有出現什麼樂器。

-----廣告,請繼續往下閱讀-----

你在選曲風的時候,就已經有樂器配置了。像上面的 city pop,就已經預設會有效果器 (Synthesizer),因此就算輸入民謠吉他 (Acoustic Guitar),也聽不到民謠吉他的原聲,滿滿的效果器。

我把上面的重點總結在這裡,有需要的可以停下來看,總之,先找對曲風,才能生出你想要的音樂。

怎麼知道喜歡的歌是什麼曲風?

那這時你可能會問啦,我哪知道自己想生的曲風是什麼啊?

這時就輪到 Sonoteller 登場啦!

-----廣告,請繼續往下閱讀-----

Sonoteller 是分析歌詞與曲風的 AI 工具,只要給他 Youtube 網址就會幫你分析啦。

這樣你就可以在 Youtube 上先找一首參考的歌曲,再丟到 Sonoteller 分析,瞬間就有曲風的 prompt 啦。不過近期 Sonoteller 的伺服器不堪負荷,常會遇到拒絕分析歌曲的情況。

但如果是超流行的歌,例如 Ado 的 Show,因為已經有人分析過,就會直接調之前分析的資料給你。

畫面的左半邊是歌詞分析,因我沒有生成歌詞的需求,這裡就不詳細說,


不過我自己截一些 summary 中的字當 prompt。

右半邊是曲風分析,Genres 就是我們的曲風啦,也有提供副曲風、情緒、樂器、BPM、key 之類的資訊,都可以複製回去當 prompt 用。

後面的數字是相似程度,參考就好,畢竟曲風、情緒感受是很主觀的,

好啦,讓我們聽聽用 ado show 的曲風做出來的歌長怎樣吧。

好像不太對勁,加個 J-pop 進去看看,這個感覺比較對,就先到這邊吧。

也提醒一下,我們不太可能只複製一首歌的 prompt 就得到想要的歌,多放幾首你覺得類似的歌到 sonoteller 分析是個好方法!

配合 ChatGPT 之類的工具來生成額外 prompt 也可以。不過我覺得門檻比 sonoteller 高,而且也不容易搞懂那些詞彙到底代表了什麼。

等等,Udio 和 Suno 到底哪一個好用?

再來說說前面有提到的 Udio 和 Suno 有什麼差吧!

基本邏輯是相同的,但 Udio 的操作更直覺,Udio 有提供 prompt 提示,不僅給我靈感,讓我學到很多新名詞,真的超級多,可能我在學校音樂課學的詞彙都沒有這幾個禮拜學到的多。

還有 Udio 每次生成歌曲只有 30 秒,更容易修改或擴充,它的擴充還可以選擇 intro outro 來生成音樂的開頭結尾,比起suno用起來更順手。

然後現在 udio 完全免費,一個月能生成 600 首,超適合拿來練 prompt!

蛤?你說這集為什麼沒有 Udio 生成的歌?

因為現在 udio 免費生成的音樂不能商用!

所以這支影片,就還是以 Suno 為主啦。

最後,你覺得 AI 生成的音樂聽起來如何呢?

  1. 當背景音樂不錯聽
  2. 匠氣太重,了無新意
  3. 沒感覺,要做的話
  4. 其他也可以留言分享喔

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----
泛科學院_96
44 篇文章 ・ 53 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!