2

7
0

文字

分享

2
7
0

正當且公開的實驗室裡的秘密實驗——《再.創世》專題

再・創世 Cybernetic_96
・2021/07/15 ・6052字 ・閱讀時間約 12 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者 / 林纓

在許多年以後的某個地方。

那裡的土地有兩種顏色,紅色與藍色。紅色是因為鐵鏽、藍色是因為鈷和銅。紅土與藍土界線分明,幾乎是一條延伸到地平線另一端、看不見盡頭的直線。

空氣則是灰的。灰色的空氣像濃霧一樣籠罩土地之上的所有空間。如果你有眼睛,你會發現你看不到天空,只看得到眼前一公尺半的距離,而且你的眼睛會越來越痛,並在半小時內壞死。

所以這地方已經沒有所謂的「原生動物」或「原生植物」,會移動的只剩下灰撲撲的空氣和四種東西:

-----廣告,請繼續往下閱讀-----

AI。

把人腦裝進殻裡行走的人類。

機器人。

和奇美拉。

-----廣告,請繼續往下閱讀-----

雖然這四種東西都能自主行走,在「人權」的劃分方面卻有著非常明確的界線──就像紅土與藍土一樣。

擁有人權的是「AI」和「把人腦裝進殻裡行走的人類」,它們都有著相當的情感、智能和人格。

而機器人和奇美拉都不具有人權。機器人只是普通的工作用的空殼,沒有人格也沒有情緒,所以當然不具有人權。至於奇美拉──牠們是實驗室製造的「生物」,能在這種極端的灰色空氣裡生存的複合式生命體──組成牠們的是各種生物的基因,目的在於創造能適應這種極端環境的生物,但這實驗其實沒什麼意義,就屬哲學性質和娛樂性質。

圖爲展於安納托利亞文明博物館的獅身人像「奇美拉」。「奇美拉」在近代演變為異種生物部位混和之神話幻想生物的泛稱。圖/wikimedia

畢竟現在所有具有「人權」的「人」都已經不需要肉體──或許需要腦,但不需要眼睛耳朵和皮膚,也不需要進食──所以既不需要能吃的動物糧食,也不需要能被使用的動物肉體──那麼創造這些能呼吸灰色空氣的生命體又有什麼用呢?

-----廣告,請繼續往下閱讀-----

大概就像開發手機遊戲和桌上型點頭娃娃的目的一樣,為了賺錢或紓壓吧。

但奇美拉終究不及遊戲和影視等其他娛樂產業討喜,因此在全盛期的熱潮過後,許多奇美拉都被放歸自然,數百間實驗室惡性倒閉,現在只剩寥寥幾間矗立在這奔馳著野生奇美拉的荒蕪大地上。

而其中一間全然合法、營收還過得去、經歷過三波裁員但在員工福利方面頗有口碑的中型實驗室,正巧就座落在那條紅色與藍色的土地交界線上,紅色三百坪、藍色三百坪,不多不少剛剛好。

現在這間實驗室的某個房間正在進行一場哲學的思辨。

-----廣告,請繼續往下閱讀-----

「你說,為什麼練僧侶的人那麼多?」白色殼子裡的AI傳了一條思緒。

「為了省藥水錢吧。」坐在它隔壁的黑色殼子裡的人腦也傳了一條思緒。

「不是為了滿足某種對他人施恩的慾望嗎?自我滿足的救世情節之類的。」白殼AI傳。

「不是為了滿足某種對他人施恩的慾望嗎?自我滿足的救世情節之類的。」白殼 AI傳。圖/Pexels

「好啊,那我今晚不補你啊,你自己打王去。」黑殼人腦傳。

-----廣告,請繼續往下閱讀-----

「你當我沒人要嗎?去廣場揮個手就十五個僧侶黏上來。」白殼AI傳。

「好啊,拆夥啊,你去跟他們打啊。」黑殼人腦傳,順帶附上3D晃動效果的不雅手勢貼圖。

「好啊!拆就拆!怕你啊!」白殼AI附上發光效果的爆破貼圖。

黑殼人腦舉起手,揍了白殼AI肩膀一拳,坑的一聲,白殼AI的警示器響了兩下:「嗶嗶,遭受衝擊。損傷率百分之零」。

-----廣告,請繼續往下閱讀-----

白殼AI也舉起拳頭,正要往黑殼人腦肩頭揍去,門就開了,兩人立刻坐正,埋頭檢查觀察箱裡的資料。

「身體素質……B。」黑殼人腦公開傳訊。

「還不錯呢,果然是亞洲獅、鞭蠍和豪豬的混種。」白殼AI公開傳訊,讚賞地敲敲觀察箱的強化隔窗。

「或許應該加點蟑螂?」黑殼人腦公開傳訊。

-----廣告,請繼續往下閱讀-----

「你什麼都想加蟑螂。」白殼AI公開傳訊,附上翻白眼貼圖。

「蟑螂是已知曾經存在的最強勢物種,混什麼都是優勢吧。」黑殼人腦公開傳訊。

「既然都滅絕了,當時的素質評比就沒什麼意義。現在重要的是基因之間的協調性。」白殼AI敲了敲操作台。

門口的機器人嗶嗶兩聲,移動手腳到一旁進行例行房間維護。

「既然都滅絕了,當時的素質評比就沒什麼意義。現在重要的是基因之間的協調性。」圖/Pixabay

白殼AI和黑殼人腦這才回頭,兩人都洩氣地傳了一連串無意義的貼圖,重新懶回椅子上。

「還以為是陳上司咧。」黑殼人腦傳。

「你都叫它陳上司啊?我都叫它奧特曼。」白殼AI傳。

「那是它幾年前的名字啊?」黑殼人腦問。

「二十年前……?還是四十?忘了。這個比較好記。」白殼AI傳。

「那肯定是它黑歷史時期的名字……它後來都取簡單的單名了。」黑殼人腦傳。

「我倒是不喜歡換名字。」白殼AI傳。

「對喔,沒見你換過名字。我倒是換過兩次。」黑殼人腦傳。

「三次。還有『黑月X影殺』。」白殼AI傳。

「黑歷史──」黑殼人腦傳了一連串表示崩壞的貼圖。

「當時大家都不知道那個X到底是什麼意思呢。問你你也不說,只會傳月亮貼圖。」白殼AI傳。

「別說了。還是談談奇美拉吧。我們還在工作呢。」黑殼人腦傳。

白殼AI對黑殼人腦露骨的轉移話題感到可笑,同時也憐憫它曾經暴露於工作場合的黑歷史時期,想想如果是自己取了那種名字來工作,肯定會在清醒後立刻羞憤辭職的吧。就這點來看黑殼人腦還算有骨氣,就這麼堅持到現在沒換工作,著實令人敬佩。

白殼AI於是配合地轉移話題:

「你覺得如果把這些奇美拉的腦裝進殻裡,牠們也能和我們溝通嗎?」

黑殼人腦停頓了一會兒,把掃描器的正面轉向白殼AI,遲疑地傳:

「你怎麼每次都在想這麼哲學的問題?」

「你怎麼每次都在想這麼哲學的問題?」圖/Pexels

白殼AI傳:

「不然我們繼續聊你的名字?」

黑殼人腦傳:

「奇美拉的腦嗎?我覺得嗯,我想想,應該是可以。或許能進行某種程度的溝通吧。」

白殼AI傳:

「但這樣會產生更嚴重的人權問題。萬一證明這些怪物真的有思考能力,這些實驗或許就得終止了。畢竟目前牠們被視作和機器人同等級無智能、無感情、無人格的生物嘛。」

黑殼人腦傳:

「而我們會失業。」

白殼AI傳:

「你怎麼老是能提出這麼膚淺的觀點?」

黑殼人腦傳:

「那如果是人腦被放進奇美拉裡呢?」

白殼AI傳:

「肯定無法和我們溝通。奇美拉的身體裡沒有晶片也沒有收發器,無法接收到我們的訊息。」

黑殼人腦傳:

「但人腦放得進去嗎?」

白殼AI傳:

「如果建構一個內接轉換槽……可以試試看。」

這兩人的哲學探討隨著時間過去,就這樣持續了六年。

終於在某一天,兩人都難以按耐住好奇心,打算在這座一成不變的實驗室裡展開一場秘密實驗。

終於在某一天,兩人都難以按耐住好奇心,打算在這座一成不變的實驗室裡展開一場秘密實驗。圖/Pexels

把人腦放進奇美拉肉體裡的秘密實驗。

它們利用自己的工作時間和休息時間暗自打造了人腦轉接槽,暗自解剖了觀察箱裡它們創造的第十二隻奇美拉:黑猩猩和家豬和塔朗圖拉狼蛛混種,並在那一天──那關鍵的一天──把黑殼人腦的殼蓋打開,並把黑殼人腦的腦放進奇美拉裡。

因為要用無菌低溫箱轉換的關係,黑殼人腦失去意識了一段時間。

當它醒來,設法掃描周圍的時候──

它發現它的感知器變得十分奇怪。感知範圍只有面前一小塊區域,而且無法模式轉換,只能用色感光譜的方式呈現。

而且它要呼吸。每一口氣吸進肺裡都像異物,那感覺一點也不好,噁心且疲累。

它想傳訊給白殼AI說這簡直是個糟透的蠢殼,但它無法傳訊,只能透過窗格看著光譜下呈現白色的那具人形金屬殼。

它於是上前──幾乎難以移動,因為它的腳是八隻很不協調的巨型狼蛛腳,而驅動狼蛛腳的肌肉是猩猩的大腿肌──跌跌撞撞地摔向窗格,用力打了打窗面。

白殼AI對它揮了揮上臂,它們之間只剩下這種溝通方式。

畢竟沒有晶片、沒有網路,只剩下奇美拉的眼睛和耳朵。

而無論AI或人腦,現在的人們溝通只需要意念,自從耳朵與嘴巴被淘汰後,語言和聲音成了失落許久的古文明。

自從耳朵與嘴巴被淘汰後,語言和聲音成了失落許久的古文明。圖/Pexels

它驅動狼蛛腿也想進行一樣的揮手動作,卻狼狽地摔倒了。摔進地上那坨黏膩的──黏膩?這種感覺也是第一次。神奇的令人不自在的觸覺。還有痛覺。天啊!竟然會痛,它摔倒了。

它在地上翻滾爬行想站起來,但這具不協調的混合軀體無法隨它所願。

白殼AI拍了拍窗格,它不確定這是要它冷靜或是在詢問它在幹嘛的意思,但它冷靜不下來也不知道自己在幹嘛。

這具軀體實在太不自然也太不協調了。

一切感官都如此限縮又多餘,限縮的部分在於:不能三百六十度掃描、不能切換鏡頭、不能傳訊、不能開啟腳部的噴射推進器,多餘的部分在於:有痛覺、要呼吸、有八隻腳。

它才待兩分鐘就受不了了,它想立刻換回去,終止這現在看來完全就是無意義且愚蠢的好奇心,但它爬不起身,無法告訴白殼AI它的想法。

當它終於重新用八隻腳站立,已經過了一個半小時,白殼AI坐在觀察窗前觀察它,而它撲向觀察窗,很野性地用兩條前腿敲打窗格。

白殼AI又對它揮了揮前臂。

這個混帳。

它暗自傳了一大堆不雅手勢貼圖,卻發現它現在這具肉做的軀體根本無法傳貼圖,它越來越惱怒,又敲了敲窗格。

此時,外頭那扇門開了。

它看見白殼AI回頭,而陳上司走進來,白殼AI和陳上司說了一些話,白殼AI被帶走,陳上司也離開,這裡只剩它一人。

怎麼回事?

它感到驚慌,但安慰自己等等就能換回來吧。

但是白殼AI沒有回來,過了半小時後,變成另外兩位灰殼和紅殼的人坐在觀察窗外,很不熟練地操作房間的設備,好像正在瀏覽這隻奇美拉的資料。

調職?這是調職嗎?

之前有聽說過最近要調職,所以它們兩人才加緊這項秘密實驗的腳步,沒想到竟然是在這種關鍵的時刻調職?

不,或許只是例行的職場檢查?白殼AI馬上就會回來吧?

它惴惴不安地盯著窗格外的灰紅兩人,因為種族歧視的問題現在多數的外殼型號已經無法從外觀辨別是人腦還是AI了,總之就是兩個人。

它就這樣在這具不協調的軀殼裡盯著那兩人──

持續了半年。

在這半年內它沒日沒夜地等著白殼AI回來,沒日沒夜地感到疼痛,沒日沒夜地設法要和窗格裡的灰紅兩人溝通,但那兩人什麼都不明白。

它們只會在儀器上操作,只會在房間偷懶,只會在窗格前悠哉地打鬧,對它的舉動視而不見,頂多偶爾敲敲窗面,但顯然不是為了要認真溝通。

天啊!這一切都是因為那該死的好奇心!該死的哲學思辨!該死!

終於在它變成奇美拉的半年後,陳上司進來,紅灰兩人離開房間,取而代之的是白殼AI。單從外觀型號它不確定那是否就是它的同事、它的朋友,畢竟沒有晶片無法感知到IP位址或姓名ID。

但那顯然是白殼AI,因為陳上司一離開,它就立刻用力拍了拍窗格,然後開始準備無菌低溫箱,然後嘶──麻醉氣體瀰漫整個觀察箱,奇美拉的軀殼昏了過去。

當它再次醒來時,已經回到那具再熟悉不過的黑色外殼。

它不用再眨眼了。它有感應器。

它傳的第一條訊息是:

笑臉貼圖。

它傳的第一條訊息是:笑臉貼圖。圖/Pixabay

那是最便捷的基礎貼圖。

「你還好嗎?」白殼AI傳,「我沒想到那麼剛好會在那個時間點被調走,據說是人事部挪用公款的問題,還有第四波裁員……這房間又必須靠個體晶片掃描才能進入,我只能向奧特曼申訴說我想調回來,奧特曼這個人又很會拖,沒想到竟然耗了半年才回到這個房間……」

黑殼人腦傳不出訊息,它現在正感動於這具協調身體的無病無痛無呼吸和切換三百六十度掃描以及遠紅外線感知模式和全境衛星視角。

「啊對,第四波裁員你中獎了,你現在失業了。」白殼AI傳。

黑殼人腦又傳了一個笑臉貼圖。

「你沒事吧?」白殼AI傳。

黑殼人腦緩慢地點開記錄檔,開始撥放自己這半年來的錄像。

監視錄像裡的它,無論是遲鈍不協調的動作還是那些看似無意義的行為,看起來都像隻再普通不過的奇美拉。

像每一隻被它們創造出來的奇美拉。

「看起來……和其他奇美拉一模一樣。」黑殼人腦傳。

「是啊。」白殼AI傳。

「沒有人會發現異常。」黑殼人腦傳。

「是啊。」白殼AI傳。

「會不會其他奇美拉其實也有和我們相當的智能和人格……」

「這個問題就不要再深究了。自從你遭遇這件事後,我就對哲學探討沒興趣了,我現在的興趣只有躺著不動自動續能,和玩遊戲。」白殼AI傳。

黑殼人腦沉默接收著奇美拉的監視錄像。

白殼AI關掉錄像撥放,推著黑殼人腦走出房間,提前打卡請假下班,一路將黑殼人腦推到研究室外,站在荒蕪的藍紅土地交界線上。

白殼AI輕輕揍了黑殼人腦的肩膀一下,黑殼人腦沒有感覺到痛,只聽到警示器響了兩下:「嗶嗶,遭受衝擊。損傷率百分之零」。

黑殼人腦體會到一種難以言喻的情緒,它漫無目的地傳了熱咖啡和陽光燦爛的海邊的貼圖給白殼AI。

白殼AI沒說什麼,拉起黑殼人腦的手,用黑殼人腦的手打了自己一下:「嗶嗶,遭受衝擊。損傷率百分之零」。

黑殼人腦的感測器正面轉向白殼AI,然後伸出拳頭。

白殼AI的拳頭和它撞了一下,就像每次下班後它們的默契。

「今晚,再一起打遊戲?」白殼AI傳。

「幸好我練僧侶。我今天實在……沒心情打怪物。」黑殼人腦傳。

實驗室靜靜地矗立在藍與紅土的界線上,兩年後,又一波經濟蕭條襲來,這間中型奇美拉實驗室終於也在拖欠了員工十個月薪水後惡性倒閉。遊戲和貼圖產業倒是一如既往地蒸蒸日上,應該說現在只剩這兩樣能穩定推陳出新又賺錢如洪水的產業了。

文章難易度
所有討論 2
再・創世 Cybernetic_96
11 篇文章 ・ 29 位粉絲
由策展人沈伯丞籌畫之藝術計畫《再・創世 Cybernetic》,嘗試從演化控制學的理論基礎上,探討仿生學、人工智慧、嵌合體與賽伯格以及環境控制學等新知識技術所構成的未來生命圖像。

0

2
2

文字

分享

0
2
2
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 54 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

1
0

文字

分享

0
1
0
免費字幕君!怎麼用 AI 語音辨識幫你自動生成字幕?
泛科學院_96
・2024/07/08 ・2458字 ・閱讀時間約 5 分鐘

下載 Youtube 影片、自動生成影片逐字稿、AI 智慧翻譯、匯出雙語 SRT 字幕、字幕內嵌 MP4 影片,甚至是把你的電腦當成 AI 運算伺服器、使用多模態 AI 模型來做圖片辨識……這一切的一切通通都免費,敢有可能 (Kám ū khó-lîng)?

今天的影片要來跟你分享開源 AI 套件 Ollama,這個開源套件AJ 最近上課演講工作坊逢人必教。

今天的影片,我們要手把手教你使用 Ollama 在你的電腦裡執行各種免費開源 AI 模型,希望你能跟我一樣成為 AI 暈船仔……Ollama 真香……啊扯遠了,我們沒有點數可以送。

今天的影片會分成三個部分:

-----廣告,請繼續往下閱讀-----
  1. Ollama 安裝與模型下載
  2. 結合 Memo 翻譯影片字幕
  3. 用多模態模型做圖片辨識

Ollama 安裝與模型下載

首先我們要先安裝 Ollama:

來到 ollama.com 點選 Download,下載適合自己的版本後進行安裝,安裝完畢之後,啟動 Ollama。以我的電腦來說右上角就會出現一個小小的 Ollama 圖示,這樣就成功安裝囉!

接著我們需要下載 AI 模型到你的電腦:

回到 Ollama 首頁,點選右上角 Models,這邊就會列出所有官方支援的模型,比如最近很流行的 Meta LLAMA 3、微軟的 Phi3、法國 Mistral AI 公司的 Mistral、Google Gemini 模型的開源版 Gemma 都有,你可以挑選喜歡的來測試。

-----廣告,請繼續往下閱讀-----

比如我點選 LLAMA 3 的連結,模型頁面有兩個地方要注意:一是模型大小,LLAMA3 是 4.7G,一般而言要玩大模型,電腦記憶體至少 16G,預算夠就 24G 不嫌多;如果你是使用一般文書電腦,記憶體 8G 的話,建議你現在馬上停止你的任何動作。我有測試過電腦會直接當機……不要說我沒有提醒你。

點開 Latest 選單可以依照需求選擇不同版本的模型:

不過我們直接點選最右邊複製執行指令,打開電腦的終端機程式,或著命令提示字元,貼上,這樣電腦就會開始下載並且自動安裝囉。

你可以用 ollama list 指令查看現在電腦內有哪些模型,如果硬碟容量有限,用 ollama rm 後面加上模型名稱可以刪除模型。比如:ollama rm llama3。我們這邊另外安裝 llava 模型:ollama run llava,這樣準備工作就完成囉。

-----廣告,請繼續往下閱讀-----

Ollama + memo

最近只要演講上課,我一定會分享 Memo 這套好用的軟體,我們之前也有一支影片分享他的用法。

最近 Memo 更新之後,我們就可以直接使用 Ollama 結合特定的模型來進行字幕的翻譯。舉例來說,我們打開 memo,複製 Youtube 網址;我們用這支 楊立昆 的演講,貼上網址,開始下載,下載完畢後使用電腦進行語音辨識,接著我們就可以使用 Ollama 搭配剛剛準備好的 LLama3 模型來做翻譯!


翻譯完畢之後就可以匯出 SRT 字幕


如果你本身是影片創作者,這招就可以輕鬆製作你的 SRT 字幕,再也不用花時間對字幕時間軸了。

-----廣告,請繼續往下閱讀-----

或者你要把影片字幕直接內嵌在做簡報的時候播放影片:


匯出 MP4 格式,語言選雙語。如果你還沒用過這招處理影片,我強烈建議你一定要試試看!

Ollama + Enchanted

接下來我們要分享另一套非常實用的工具——Enchanted。他也是開源,可以讓原本是文字介面的 Ollama
提供類似 ChatGPT 的對話視窗,甚至支援圖片辨識的多模態模型 llava,Mac 用戶可以直接去 App Store 免費安裝。


同時開啟 Ollama 跟 Enchanted LLM:

-----廣告,請繼續往下閱讀-----


就擁有一個漂亮的視窗介面,可以優雅的啟用各種想要測試的 AI 模型,他甚至有手機版 APP!用手機連線自己的蘋果電腦跑 AI 模型?這……這,真的可以免費用嗎?

讓我來試試看!

首先要先安裝 ngrok 這套程式,選擇自己的作業系統然後下載。Windows 用戶應該直接安裝就可以了,Mac 的用戶在終端機執行這行 Sudo 指令把程式解壓縮到 user local bin 資料夾,接著註冊一個免費的 ngrok 帳號。

複製 ngrok config 指令,貼回自己電腦的終端機,把連線金鑰寫入自己的電腦。

-----廣告,請繼續往下閱讀-----

最後一步,啟動連線,指令是:ngrok http 11434 –host-header=”localhost:11434″

一切順利的話就會看到類似這個畫面。

然後把 forwarding 的網址複製,打開 iPhone 或 iPad 的 Enchanted app,在設定 Setting 裡面把 Ollama 網址貼上,這樣就可以遠端調用電腦的 Ollama 來使用 AI 模型,比如選用稍早下載的 LLava 多模態模型。

傳一張照片,問它這是什麼?

-----廣告,請繼續往下閱讀-----


是不是非常神奇呢?
快練習把 ollama、ngrok 跟 Enchanted 串起來跟朋友炫耀吧!

總結

今天的影片跟各位分享了基於 Ollama 這個開源 AI 套件的各種有趣應用,你是否有成功在 iphone 上打造自己的 AI 服務呢?

  1. 太複雜了我決定躺平
  2. 笑話,我可是尊榮的 GPT Plus 用戶
  3. 沒有 Mac 電腦不能玩……嗚嗚嗚
  4. 你怎麼不介紹那個 ooxx Ollama 套件

如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

0
0

文字

分享

0
0
0
Claude、ChatGPT 提示詞優化!4 個技巧讓 AI 更懂你的需求!
泛科學院_96
・2024/07/06 ・713字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

聽說 Office 365 Copilot 終於支援中文了!

我還不馬上拿出魔術小卡——加入會員,訂閱,開啟小鈴鐺,啊不是我是說,訂閱 Copilot……

嗯?20 美金?嗯?這沒有 Office 365 Copilot 啊?我找找……

靠,現在訂閱 Office 365 Copilot,最便宜要用商務標準版才能加購,而且加購只能一次買一年,要一萬一……我們本來都準備好各種有趣的測試了,但這錢我真的花不下去阿……那今天準備好的測試該怎麼辦呢?

-----廣告,請繼續往下閱讀-----

別擔心,今天的影片,我來回答三個問題:

  1. 如果 copilot 真的開放,我想像中會遇到什麼問題
    抱歉了,一萬一真的刷不下去……
  2. 用 GPT4 示範大語言模型的進階提示技巧,應用於文稿撰寫的方法
    畢竟 copilot 也是借鑑 GPT4,性能應該差不多啦!(屁啦)
  3. 這些技巧在其他語言模型也可以用嗎?

本集的「進階 AI 提示語」有沒有打開你的 AI 使用靈感呢?

  1. 太複雜了我決定躺平
  2. 炫技,等 GPT-5 出來這些都不再重要
  3. 我決定仿效泛科學院精神鑽研出神級提示語跟大家分享
  4. 其他也可以留言分享喔

欸嘿,前面提到的 QR code 在這邊 ^.< 不要告訴別人喔(噓)


如果有其他想看的 AI 工具測試或相關問題,也可以留言告訴我們~

-----廣告,請繼續往下閱讀-----

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 51 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!