2

31
1

文字

分享

2
31
1

機器人的生命權力——《再.創世》專題

再・創世 Cybernetic_96
・2021/08/25 ・4697字 ・閱讀時間約 9 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/高涌泉

人有人權,機器人是否應該也有某種類似於人權的權力(姑且稱之為「機器人權」)?目前這個問題還沒有被大眾認可的標準答案,因為我們還不知道機器人是否值得擁有機器人權。以當下(2021)最先進的機器人來說,我想多數人對於將它「關機」,不會有絲毫猶豫,就像我們可以毫不在意地任意關掉(或開啟)最先進的蘋果電腦。也就是說,當前最先進的機器人還沒有先進到需要我們去擔心關機是否影響它的福祉(生命)。但是未來呢?當,譬如說,一萬年之後 ( 或許不用那麼久,說不定一千年之後即可?)的機器人,已具備人性(我稍後會討論出現這種狀況的機率),那時人類應該允許機器人擁有機器人權嗎?

機器人是否也應有屬於自己的機器人權。圖/Pexels

科幻電影中的機器人

對於這個假設性問題,好萊塢已經給了答案——你所能想像的狀況大約已經出現於某部科幻電影裡。有一類情境相當常見,讓我舉幾部很好看的片子為例來說明:

  1. Ex Machina人造意識,也譯為機械姬;據說拉丁文片名本意是「來自機器」)。片中的女機器人在主人的設計下,已經具有足以通過「圖林測試」(Turing Test)的智能,但是她還進一步發展出主人所不知的自主意識,最終為了自由而殺死把機器人當作娛樂工具的主人。
  2. Blade Runner銀翼殺手)。此片的機器人是仿生人,在外貌、語言以及行動上,與人類沒有區別,和 Ex Machina 中的機器人相比,好似更加先進,然而其機器人本質還是可以被一項對於情緒反應的測試揭發(有如測謊器的功能),片中機器人當然也被安排會為了避免「被退休」而殺人。
  3. I, Robot機械公敵)。片中機器人在外貌上,與人類有明顯區分,它們被製造來服務人類,有遠超越人類的體能,因此必須遵循艾西莫夫「機器人三定律」(第一定律:機器人不得傷害人類,或坐視人類受到傷害;第二定律:機器人必須服從人類命令,除非命令抵觸第一定律;第三定律:機器人在不違背前兩定律的情況下,必須保護自己),此片也一樣安排讓機器人產生某種程度的自主意識(主角機器人甚至會做夢),以及與人類的衝突。

以上三部科幻片的共同點是人類製造出的機器人終究會產生某種具自由意志的心智,並且會捍衛自己生存的權利、抗拒人類的宰制。這種「覺醒、反抗、勝利」三部曲的故事也廣為其他科幻電影所採用。(有一部叫好叫座、由 HBO 推出的科幻電視影集 Westworld西方極樂園)也是大致循這樣的套路。)事實上,這樣的套路也出現在非科幻的一般劇情片中,大約是這種勵志招式符合某種人類的心理需求,所以很受歡迎。總之我們從機器人科幻片學到了兩件事:一是我們與機器人的關係取決於機器人能否產生自我意識(心靈),而且大家願意相信機器人應該終究會具有這樣的能力;第二是對於我們應該賦予機器人多少「機器人權」的問題,無論我們如何操心,恐怕不是重要的事,因為就如「人權是爭取來的,不是靠施捨的」,「機器人權」的內涵還是由機器人決定。不過這兩點若真要仔細推敲,就會發現可以質疑的地方非常多。

科幻片中人類製造出的機器人終究會產生某種具自由意志的心智 。圖/Pexels

機器人適用心物二元論還是原子論?

首先,到底什麼是機器人?對此我一直沒有下個定義,因為不需要:大家都很清楚機器人儘管在外型與行為上,有很多種類,但一定都是人造的。所以機器人就是人造人(或人工人),是人類用材料製造出來的。所謂的材料就是物質,物質拆解到最後,就是各種原子罷了。所以機器人都是原子組裝出來的。但是人類不也是由原子組成的嗎?為什麼人不是機器人?或者,人其實也是一種是機器人?也就是說人也不過是一群原子依據某種明確的指令(程式、算則)在運行罷了!然而自古以來,不斷有哲學家懷疑這樣的看法,因為大家想不透在這樣的假設下,自由意志(俗稱靈魂)如何能夠出現?如果不行,也就是說靈魂這東西和物質屬於兩個範疇(即所謂的二元論),那麼人當然就不是機器人了:人有靈魂,機器人沒有。

-----廣告,請繼續往下閱讀-----

但是自古以來也有不少人不相信二元論,例如古希臘的原子論者就不相信有獨立的靈魂這回事,以法國哲學家柏格森(Henri Bergson)的話說,原子論者相信的是「身體、靈魂、所有的物體以及世界,都是由原子所構成的。自然現象和思維都只是原子的運動而已。一切的事物與現象都是由原子、原子之間的真空(void)、以及原子的運動所組成的。除此之外,就沒有其他東西了。」如果原子論終究是對的,那麼人便只是一類較高明的機器人罷了!

那麼到底二元論與原子論兩者間哪一個比較有道理?(當然了,聰明的哲學家還發明出其他更繁複細膩,或者說更怪異有趣的理論,例如原子本身就是有意識之物體的說法等等,感興趣的人可以自行探究。)自近代科學出現以來,由於物理、化學與生命科學以及電腦科學的快速進展,眾多科學家自然地認為原子論的觀(自然現象和思維都只是原子的運動而已)是一件合理的假設,理解意識如何出現在腦子裡於是成為眾多研究的目標。

認知思考的想像實驗

美國哲學家瑟爾(John Searle)在 1980 年提出一項想像實驗(類似的想法其他人也有),試圖證明意識絕不是物質加上(電腦)程式就能產生的,具體說,即電腦不可能具有思考能力。他這個想像實驗一般稱為「中文房間論證」(Chinese room argument),讓我用一個不同於瑟爾原始版本、但我想仍不失其意的簡化版來說明這個論證:設想在某房間裡有位美國哲學家,他不懂中文與日文,但是能夠依據指令行事,房間裡有個資料庫,裡面有一份中日文字對照表(對哲學家來說,這裡的中日文字都只是奇怪的符號而已)及一本以英文寫的中日文語法規則簿(即中日文字對照表內符號之間應遵循的關係),我們將一篇中文文章送進房裡,這位先生就依據房間裡的資料庫,將這篇文章「翻譯」成日文,然後送出房間。房間外的人會以為這篇文章是房間內有位懂中文與日文的人所做的翻譯,但是瑟爾說房內的哲學家根本不知道他所經手的文章在講些什麼。

以行話說,瑟爾想示範的是掌握了「語法」(syntax)不意味就了解「語意」(semantics),而不了解語意就談不上認知與思考。總之,瑟爾的重點是知道依據明確的規律來操弄符號(這是所謂「人工智慧(智能)」(AI)的功能)儘管有翻譯的本事,但仍不具認知、理解與思考的能力,也就是他不相信電腦(AI)能夠導致意識與心靈。瑟爾的講法引發大量評論,有人主張自由意識根本是個幻覺(當然另有人說這麼想的人錯得離譜),也有人主張人腦與電腦有根本差異(但是究竟差異為何,則意見紛雜)等等。

-----廣告,請繼續往下閱讀-----

在我的簡化版本中,瑟爾的想像實驗假設了機器翻譯是行得通的(但是即便如此,機器還是沒有意識可言),不過長久以來,機器翻譯其實一直沒有太大的進展。然而近年來由於大數據與深度學習方法的出現,機器翻譯的水準已經頗為可觀,儘管還算不上完美,但是已經不像更早些時,譯文漏洞百出,明顯就不是人為的。同樣地,深度學習也讓電腦下棋(無論是西洋棋或是圍棋)的功力,遠遠超越人類棋手。在翻譯與下棋之外,電腦還有很多令人刮目相看的新本事(傳統的本事當然是其快速計算的能力),所以就算電腦還談不上有真正的意識(無論這是什麼意思)可言,不少人(包括我)已經感到震撼。

經深度學習後,電腦也可以下西洋棋。圖/Pexels

對於意識等抽象概念的探討,如果沒有具體的例子作為對象,容易流於空泛,莫衷一是。目前在人類之外,什麼東西可能擁有某種程度的意識?動物是個明顯的答案,無怪乎科學家與哲學家對於動物的心智很感興趣。不過動物心智也不容易捉模,相關意見也一樣紛雜。據說,主張心物二元論的笛卡爾就認為由於動物沒有語言能力,因此談不上具有心智,不過我想很多養過寵物的人恐不會接受這個見解。

動物的心智與生存權

我自己雖不養寵物,但全然認同(起碼有些)動物是具有心智的。主因是我在過去五、六年間,迷上了在 YouTube上觀賞對於白頭鷹(bald eagle)的巢 24 小時全天候(晚上有紅外光夜視)的實況轉播。簡單講,整個情況就像電影 Truman Show(楚門的世界)的白頭鷹版——除了白頭鷹的真實生活比虛假的楚門世界要有趣太多了。白頭鷹是美國國鳥,曾一度列入瀕臨滅絕物種(endangered species)名單,後來在種種保護措施(包括禁止殺蟲劑 DDT)下,族群數量才逐漸回升。白頭鷹是美麗的大型鳥,位於食物鏈頂端,有王者氣質,令人著迷。現在網路上可以找到很多位於世界各地的這種稱為「白頭鷹巢實況監視」(live bald eagle nest cam)的 YouTube 頻道,我最早看的是一個位於美國首都華盛頓特區的巢:多年來,有一對白頭鷹固定在那裡築巢、育(鷹)嬰,人類鷹迷們分別暱稱公、母鷹為「總統先生」與「第一夫人」;它們每年秋季回到這裡,修整離地數十公尺的巢、交配、產卵、孵卵、撫育幼鷹,直到幼鷹於初夏可以自行飛翔離巢。

位於食物鏈頂端,具有王者風範的白頭鷹。圖/Pexels

對於我這樣剛入門的觀鳥人,白頭鷹的一切生活習性都很有意思。例如,幼鷹一但接連破殼而出,殘酷的「手足競爭」(sibling rivalry)立即登場,父母不會介入這種(從觀眾留言可知,令不少人不忍心看的)天生的競爭,弟妹在受到兄姊的壓制之後,很快學到要避開對方的攻擊,並且如何在適當時機,迅速從父母口中搶到食物。又例如,公鷹規律地獵捕魚、松鼠等動物回巢,轉交母鷹餵食幼鷹。還有令我特別訝異的——父母會在下雨(雪)或大太陽時張開翅膀護著幼鷹。

-----廣告,請繼續往下閱讀-----

觀鷹久了,我發現自己能夠預測老鷹的企圖,或者說可以領會老鷹在「想」些什麼、在動些什麼「心思」。老鷹儘管沒有語言,但是能夠發聲「呼喚」、「警告」、「恐嚇」其他老鷹或其他生物。我一點也不懷疑白頭鷹具有某種程度的心智。(知名哲學家奈格爾(Thomas Nagel)在 1974 年發表了一篇文章「身為蝙蝠會有什麼樣的感受?」(What is it like to be a bat?),他此文的主張就是,不是蝙蝠的我們永遠不會知道蝙蝠的主觀感受是什麼。我自以為多少了解白頭鷹的心思,當然是不認同奈格爾的主張可以推廣至白頭鷹。)為什麼白頭鷹能夠具有心智,而機器人沒有?這就是當代心智研究的基本問題。我猜測關鍵在於演化與成長歷史:白頭鷹是經過長期自然演化而產生的物種,從出生至獨立成熟也有個成長過程,而機器人卻不是如此。

動物應該擁有生存權,尤其是那些我們覺得具有某種心智能力的動物,這是很多人認可的事(在很多社會這件事其實已經成為法律)。白頭鷹的生存受到保護,數目也逐年增加,愛鷹人士都很高興。但是如果白頭鷹的數目因為保護而過度增加以至於影響了人類的利益呢?是不是白頭鷹的生存權也應受到限制呢?(對於某些動物,這種情況不是已經出現了嗎?)總之,動物權的範圍操之於人類。

機器人目前的處境還遠在動物之下,我看不出機器人如何能夠因產生心智而改變這種狀況。即便機器人因本事提高,讓我們將它們如同白頭鷹看待,它們生存權的範圍大小,仍是取決於人類,除非它們的聰明才智超越包括人類在內的一切動物。

人類目前的科技水準還處於初級階段,或許在很久很久以後,人類可以製造出和蚊子一樣靈活的「機械蚊」,那時才開始來操心所謂機械人權的問題還不晚。

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
再・創世 Cybernetic_96
11 篇文章 ・ 29 位粉絲
由策展人沈伯丞籌畫之藝術計畫《再・創世 Cybernetic》,嘗試從演化控制學的理論基礎上,探討仿生學、人工智慧、嵌合體與賽伯格以及環境控制學等新知識技術所構成的未來生命圖像。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

0
0

文字

分享

0
0
0
如何讓 Suno 製作出你想要的音樂?四大規則讓你用精準的 prompt 做出心中所想的音樂!
泛科學院_96
・2024/07/04 ・2849字 ・閱讀時間約 5 分鐘

最近用了跟 Suno 類似的音樂生成服務 Udio 才讓我理解歌曲生成的 prompt 要怎麼寫,然後配合 sonoteller 這個神器,讓你聽到什麼就能生出什麼!

所以我們這集就來講講:

  1. AI 音樂生成 prompt 的規則
  2. 抄音樂 prompt 的好幫手 sonoteller
  3. suno 跟 udio 的差異

提醒一下,這集沒有詳細的 Suno 操作,重點會放在怎麼寫 prompt 上。

這邊整理一下你看這集必須要知道的事,可以暫停看一下:

-----廣告,請繼續往下閱讀-----


那如果想看詳細的 Suno 操作,可以到這支影片:

好啦,讓我們開始吧。

輸入 Suno 的 prompt 只要關鍵字就好?

一開始用 Suno 時,我一直很困惑,到底要怎麼打 prompt 才能有效控制生成的音樂?

自從最近用了 Udio,它有 prompt 隨機生成,研究了一下 Udio 的 prompt,規則大概是「一句有情緒的故事梗概,加上多個曲風或歌曲細節詞彙」。

-----廣告,請繼續往下閱讀-----

然後我把 Udio 的 prompt 拿到 Suno 上跑,也能跑出不錯的東西。

所以,前面應該是指定整首歌的情境?

例如情境換成悲慘命運,聽起來就會變悲傷。

然後我在後面加上輕快 (Brisk)⋯⋯欸?悲傷去哪了?前面那串根本消失啦!

-----廣告,請繼續往下閱讀-----

那如果把前面那句話,拆解成情緒與事件關鍵字輸入也行嗎?

畢竟字數有限,這樣就能下更多 prompt 了!

嗯,事實是沒差,只要關鍵字就好。

所以結論是,音樂生成的 prompt 跟 Stable Diffusion 差不多,一個一個單詞輸入就好。

-----廣告,請繼續往下閱讀-----

四大規則!

在多次測試之後,我認為有效的 prompt 可以分為這四類:

1. 曲風類:funk、rock、pop、classical 之類的特定曲風。

這些詞最重要,會最大幅度限制歌曲的走向,通常會放多個有關聯的曲風,例如 city pop 跟 funk 還有 Disco 有關,我前面的 prompt 就選了 city pop 跟 funk,不用 Disco 單純是出來之後更有電音舞曲感,我不喜歡。

2. 歌曲控制類:B 小調、brisk、BPM 之類的名詞。

-----廣告,請繼續往下閱讀-----

這類名詞只能做到修飾,例如前面的 prompt 加個 BPM 200,也不可能演奏出 BPM 200 的 city pop,只是稍微加快,但如果我把曲風換成 rock, metal,就能接近我要求的 BPM 200。

3. 情緒、狀態類:miserable, adventure 這些日常生活中會出現的詞彙,能提供整首歌曲的旋律、節奏,但效果極弱。

例如前面放了輕快 brisk,悲傷感就消失了。

4. 樂器類:歌曲中有出現什麼樂器。

-----廣告,請繼續往下閱讀-----

你在選曲風的時候,就已經有樂器配置了。像上面的 city pop,就已經預設會有效果器 (Synthesizer),因此就算輸入民謠吉他 (Acoustic Guitar),也聽不到民謠吉他的原聲,滿滿的效果器。

我把上面的重點總結在這裡,有需要的可以停下來看,總之,先找對曲風,才能生出你想要的音樂。

怎麼知道喜歡的歌是什麼曲風?

那這時你可能會問啦,我哪知道自己想生的曲風是什麼啊?

這時就輪到 Sonoteller 登場啦!

-----廣告,請繼續往下閱讀-----

Sonoteller 是分析歌詞與曲風的 AI 工具,只要給他 Youtube 網址就會幫你分析啦。

這樣你就可以在 Youtube 上先找一首參考的歌曲,再丟到 Sonoteller 分析,瞬間就有曲風的 prompt 啦。不過近期 Sonoteller 的伺服器不堪負荷,常會遇到拒絕分析歌曲的情況。

但如果是超流行的歌,例如 Ado 的 Show,因為已經有人分析過,就會直接調之前分析的資料給你。

畫面的左半邊是歌詞分析,因我沒有生成歌詞的需求,這裡就不詳細說,


不過我自己截一些 summary 中的字當 prompt。

右半邊是曲風分析,Genres 就是我們的曲風啦,也有提供副曲風、情緒、樂器、BPM、key 之類的資訊,都可以複製回去當 prompt 用。

後面的數字是相似程度,參考就好,畢竟曲風、情緒感受是很主觀的,

好啦,讓我們聽聽用 ado show 的曲風做出來的歌長怎樣吧。

好像不太對勁,加個 J-pop 進去看看,這個感覺比較對,就先到這邊吧。

也提醒一下,我們不太可能只複製一首歌的 prompt 就得到想要的歌,多放幾首你覺得類似的歌到 sonoteller 分析是個好方法!

配合 ChatGPT 之類的工具來生成額外 prompt 也可以。不過我覺得門檻比 sonoteller 高,而且也不容易搞懂那些詞彙到底代表了什麼。

等等,Udio 和 Suno 到底哪一個好用?

再來說說前面有提到的 Udio 和 Suno 有什麼差吧!

基本邏輯是相同的,但 Udio 的操作更直覺,Udio 有提供 prompt 提示,不僅給我靈感,讓我學到很多新名詞,真的超級多,可能我在學校音樂課學的詞彙都沒有這幾個禮拜學到的多。

還有 Udio 每次生成歌曲只有 30 秒,更容易修改或擴充,它的擴充還可以選擇 intro outro 來生成音樂的開頭結尾,比起suno用起來更順手。

然後現在 udio 完全免費,一個月能生成 600 首,超適合拿來練 prompt!

蛤?你說這集為什麼沒有 Udio 生成的歌?

因為現在 udio 免費生成的音樂不能商用!

所以這支影片,就還是以 Suno 為主啦。

最後,你覺得 AI 生成的音樂聽起來如何呢?

  1. 當背景音樂不錯聽
  2. 匠氣太重,了無新意
  3. 沒感覺,要做的話
  4. 其他也可以留言分享喔

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

1

0
0

文字

分享

1
0
0
動動滑鼠就能生圖修圖?不用付錢就能即時生成的 Leonardo AI 讓繪畫行雲流水!
泛科學院_96
・2024/06/09 ・828字 ・閱讀時間約 1 分鐘

你在尋找免費的繪圖 AI 嗎?

自從 Stable Doodle 要收費後,我就一直在找類似的替代品,正好前陣子 Leonardo AI 也更新了Realtime Canva 功能,不是那個 Canva,是他們推出的塗鴉功能叫 Canva,試用之後驚為天人!

新增加的 inpaint 功能,能用 prompt 指定畫上去的色塊代表什麼,也有圖層跟透明度功能,大幅降低修整圖片的難度。

重點是,免費可用啊,付費只多了 realtime 及時生成,但免費的速度也不會太慢,你問我為什麼會知道?當然是花了錢之後發現根本沒差啊!

而且及時生成的圖都不用扣點,直到你按下輸出鍵才扣,修改次數無限,可以免費白嫖玩到爽,所以今天,就來教一下怎麼用 Leonardo Canva 啦,大概會說這三件事情:

-----廣告,請繼續往下閱讀-----
  1. 從無到有快速生成人物:這邊就簡單介紹基本操作。
  2. 在不影響生成人物的狀況下,加上背景:這邊會用到圖層、去背、AI 元素生成等功能。
  3. 最後微調:介紹 inpaint 功能怎麼用。

好啦,讓我們開始吧!

最後,你覺得 AI 圖片生成應該還要提供什麼服務呢?

  1. 我上色苦手,拜託有個不改我線稿的 AI 上色工具
  2. 可以有更多修改細節的方法,現在都太笨了
  3. 能不能讓 AI 讀懂構圖,不要每次圖生圖都變樣了
  4. 我不知道,能生不就好了

如果有其他想看的 AI 工具測試或相關問題,也可以留言發問。如果喜歡這支影片的話,也別忘了按讚、訂閱,加入會員,我們下集再見~掰!

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

所有討論 1
泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!