2

0
0

文字

分享

2
0
0

玩三滴記

timd_huang
・2011/05/18 ・2940字 ・閱讀時間約 6 分鐘 ・SR值 533 ・七年級

有人這麼說,大人和小孩的差異在哪裡?答案是「玩具的不同」,比方說,大人玩大車,小人玩小車,都還是車;對我來說,此說真是受用,人生嘛!如果從腦神經的結構來說,會玩的人,人生才會過得有趣,活得愉快,微笑過人生,沒有浪費在世走一趟。

不過,我們老中,卻有很(太)多扳著面孔太嚴肅過人生的,他們對於「玩」這個字很過敏,想是被一個成語所害,人生苦短,怎可「玩物喪志」呢?聖賢書不是教導我們要:「勤有功、戲無益」嗎?所以整天從早到晚,神經緊繃得兮兮的,還沒有幾歲,身體就開始討債,各種毛病接二連三,蒙主恩報到去,唯恐不及。

其實,科學家們研究小狗狗發現,如果小狗狗從小就不讓牠們好好的玩,整天玩,這種小狗學習不了謀生的伎倆,長不大,也會很快夭折;我們人類,不也只是千萬生物的一種?難道我們可以逃得開大自然生物的宿命嗎?自從體會到這一點之後,我的人生態度有了很大的轉變,雖然不見得別人能理解、肯理解,我都以「玩」的心情來面對人生,「玩」中文電腦、「玩」催眠、「玩」石頭,好家在,在這三個不是我大學本行的領域,我這烏手老「玩」童,都還出「玩」了一點點名堂來,看來人生沒有虛度。

最近從亦生亦友借到了一台桌上型三滴(3D)雷射掃描機,當然非常的興奮,也宣佈了「桌上三維數位化(Desktop 3Digitizing)革命」時代的來臨,從今之後,想將某個物件,透過雷射三維掃描,變成數位化的模型,甚至利用三維列印技術,製作出各種放大縮小的複製品出來,已經不是高不可攀的學術象牙塔科目,你我小老百姓,只要有興趣,都可好好地「玩」「玩」。

-----廣告,請繼續往下閱讀-----

所以,當借到了這個設備之後,雖然需要使用那個被我罵得臭頭非人用的視窗,我還是花了好多天,好好地「玩」它一「玩」,把手邊的一些化石,從大的到小的,都拿出來「玩」它一「玩」,看到這些實體的化石,在自己的桌上「蛻變」成虛擬的三滴模型,在電腦上任我把玩,放大縮小、左轉右旋、切片貼皮、…,太爽了,比做愛還爽。

從學習製作桌上三滴模型的過程中發現,對於雞蛋大小以上的化石物件,這台桌上型三滴掃描機的操作,只要照著所附軟體的指示一步步做,就可以得到所要的虛擬三維模型,我所得到的成果,已經放到網路我的「臉書(FaceBook)」和「你管(YouTube)」,歡迎大家也去「玩」,過過乾癮;在此,我也把它們列出來。

不過,我是個鐵齒的「玩」家,從小就很調皮,讓親友大人們非常頭痛,既然要「玩」,我總要(會)「玩」出一點名堂來,總像頑童那樣,想測試一下這套系統的極限,試試看它最小能掃描到什麼程度;哈!在到目前為止所做的十多個學習製作當中,就以這個長度只有5.12 mm、中央直徑只有2.1 mm的恐龍胚胎脊椎骨(以下第14個視訊檔案),花了最多的時間,超過兩個禮拜,老是得不到可以接受的成績單來,真是苦惱;不過,經過這家公司的工程人員不停地討論和指導,加上自己不停地摸索,終於得到雖不絕對滿意、但可以拿出來給人看的成品;在這過程中,當然學習到了一兩招祕招,如該怎麼樣把樣本放在掃描架子上,如何防止轉盤所引發的震動、…等等,也得到一個很有用的參考資料:這台三滴掃描機的最小掃描物件極限,也就是所謂的邊界條件(Boundary Condition),大約在5 mm左右,若比此更小,就有可能無法完成。

1. 檔案名稱:Ediacaran3D.m4v
這個樣本是我第一個取得的埃迪卡拉紀巨型實體化石,其上的生物,我紀念媽媽特別命名為「黃楊清蓮體」;化石物件長度:15.7 cm,寬度8 cm,厚度4.7 cm;影片展示X, Y, 和Z軸的旋轉。

-----廣告,請繼續往下閱讀-----

2. 檔案名稱:Ediacaran 2.mov
這個樣本是我第二次到現場取得的埃迪卡拉紀巨型實體化石,其上的生物也是「黃楊清蓮體」的一部份;化石物件長度:8 cm,寬度7 cm,厚度4.3 cm。

3. 檔案名稱:Ediacaran3.mov
這個樣本是我第一次到現場取得的埃迪卡拉紀巨型實體化石,其上的生物也是「黃楊清蓮體」的一部份;化石物件長度:10.7 cm,寬度6.7 cm,厚度4.2 cm。

4. 檔案名稱:Ediacaran4.mov
這個樣本是最早期老鄉給的埃迪卡拉紀巨型實體化石,其上有「朵西繩蟲(Funisia dorthea)」的小片段,約2 cm 長,整塊上面還很多種有待鑑定命名的生物,這塊化石和下面那塊,原本連在一起;化石物件長度:16.2 cm,寬度11.4 cm,厚度4 cm。

5. 檔案名稱:Ediacaran5.mov
這個樣本是最早期老鄉給的埃迪卡拉紀巨型實體化石,其上有很多種有待鑑定命名的生物,這塊化石和上面那塊,原本連在一起;化石物件長度:25.2 cm,寬度17.2 cm,厚度4.5 cm。

-----廣告,請繼續往下閱讀-----

6. 檔案名稱:Ediacaran6.mov
這個樣本是最早期老鄉給的埃迪卡拉紀巨型實體化石,也是到目前為止所採集最大塊的樣本,其上有「黃楊清蓮體」的一部份,也有很多種有待鑑定命名的生物;化石物件長度:26.4 cm,寬度20 cm,厚度6.5 cm。

7. 檔案名稱:Ediacaran – 7 DoubleTubes.mov
這個樣本是第二次到現場取得的埃迪卡拉紀巨型實體化石,兩個管狀生物直徑一大(3.6 cm)一小(1.9 cm)並排在一起,也有一些有待鑑定命名的生物;化石物件長度:15.5 cm,寬度7.6 cm,厚度4.4 cm。

8. 檔案名稱:Ediacaran – 8 BigTube.mov
這個樣本是最早期老鄉給的埃迪卡拉紀巨型實體化石,也是到目前為止所採集最大的管狀生物樣本,該管的直徑有6 cm,也有些有待鑑定命名的生物;化石物件長度:18.2 cm,寬度10.3 cm,厚度9.6 cm。

9. 檔案名稱:Chinglian_huangyangMockUp.mov
這是完整「黃楊清蓮體」的重建模型,透過研究多次到現場考察採集到的眾多片段,推論出此生物可能的整體形狀;模型物件長度:17.1 cm,寬度9.5 cm,厚度1.4 cm。

-----廣告,請繼續往下閱讀-----

10. 檔案名稱:Phalange.mov
這個樣本採集於2006年「黃大一生日點」,其形狀顯示骨頭病變,可以看出這個趾骨的恐龍,當時是活得痛苦的頗腳恐龍,它和下一個爪子在一起;化石物件長度:7.9 cm,寬度6.5 cm,厚度4.6 cm。

11. 檔案名稱:Claw2.mov
這個樣本採集於2006年「黃大一生日點」,它和上一個病變趾骨的在一起,可以看出這個趾骨的恐龍,當時是活得痛苦的頗腳恐龍;化石物件長度:10.7 cm,寬度4.6 cm,厚度4 cm。

12. 檔案名稱:UpperJaw.mov
這個樣本是2005年我帶著喜願兒阿德到雲南祿豐大洼、完成他短暫人生中與恐龍面對面的願望過程中,我和他一起挖到的,特別感心有意義;牠是原蜥腳類恐龍(很可能是祿豐龍)的上頜骨,裡面還有兩根沒有長出來的牙齒;化石物件長度:16.3 cm,寬度6.2 cm,厚度3 cm。

13. 檔案名稱:EmbryoCast.mov
這是我2003年撿到、2009年鑑定出來,我所發現世界上最古老恐龍胚胎樣本的複製品,(原樣本研究中,暫時不在我手中,先以複製品做三滴掃描);此恐龍胚胎化石,與南非所發現大椎龍的胚胎化石,同屬於晚三疊紀早侏羅紀地層,意義非常重大;化石物件長度:7.1 cm,寬度6 cm,厚度2.2 cm。

-----廣告,請繼續往下閱讀-----

14. 檔案名稱:Embryonic Vertebrae.mov
這個世界最古老恐龍胚胎的脊椎骨,長度 5.12 mm,中央部份直徑 2.1 mm;在骨頭旁邊的紅塊為 0.5 mm的參考標誌;用NextEngine 3D Scanner HD掃描很(太)小,花了大約兩個禮拜;樣本採集於2010年3月,發現該化石點是個世界最古老恐龍孵育場所;正在進行國際兩岸合作科研計畫;本視訊短片,也以X, Y, 和Z軸的旋轉展示。

15. 檔案名稱:Bauculite.mov
這個樣本是2008年暑假帶著台灣小朋友和家長到美國蒙大拿挖恐龍行程中撿到的,回來之後清理拋光,六千五百萬年前桿菊石的紋路非常漂亮;化石物件長度:9 cm,寬度4.7 cm,厚度2.6 cm。

16. 檔案名稱:echino.mov
這個樣本是十多年前在台年玉井採集到的「台灣林西海膽(Linthia taiwanensis)」,記得當時發現的時候,它就如此的乾淨溜溜躺在大塊石頭上,不用任何工具,只用手把它撿起來;化石物件長度:6.2 cm,寬度5 cm,厚度3.4 cm。

本文原發表於催眠恐龍[2010-11-08]

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
timd_huang
24 篇文章 ・ 0 位粉絲
跟我玩恐龍去!

0

1
0

文字

分享

0
1
0
人與 AI 的關係是什麼?走進「2024 未來媒體藝術節」,透過藝術創作尋找解答
鳥苷三磷酸 (PanSci Promo)_96
・2024/10/24 ・3176字 ・閱讀時間約 6 分鐘

本文與財團法人臺灣生活美學基金會合作。 

AI 有可能造成人們失業嗎?還是 AI 會成為個人專屬的超級助理?

隨著人工智慧技術的快速發展,AI 與人類之間的關係,成為社會大眾目前最熱烈討論的話題之一,究竟,AI 會成為人類的取代者或是協作者?決定關鍵就在於人們對 AI 的了解和運用能力,唯有人們清楚了解如何使用 AI,才能化 AI 為助力,提高自身的工作效率與生活品質。

有鑑於此,目前正於臺灣當代文化實驗場 C-LAB 展出的「2024 未來媒體藝術節」,特別將展覽主題定調為奇異點(Singularity),透過多重視角探討人工智慧與人類的共生關係。

-----廣告,請繼續往下閱讀-----

C-LAB 策展人吳達坤進一步說明,本次展覽規劃了 4 大章節,共集結來自 9 個國家 23 組藝術家團隊的 26 件作品,帶領觀眾從了解 AI 發展歷史開始,到欣賞各種結合科技的藝術創作,再到與藝術一同探索 AI 未來發展,希望觀眾能從中感受科技如何重塑藝術的創造範式,進而更清楚未來該如何與科技共生與共創。

從歷史看未來:AI 技術發展的 3 個高峰

其中,展覽第一章「流動的錨點」邀請了自牧文化 2 名研究者李佳霖和蔡侑霖,從軟體與演算法發展、硬體發展與世界史、文化與藝術三條軸線,平行梳理 AI 技術發展過程。

圖一、1956 年達特茅斯會議提出「人工智慧」一詞

藉由李佳霖和蔡侑霖長達近半年的調查研究,觀眾對 AI 發展有了清楚的輪廓。自 1956 年達特茅斯會議提出「人工智慧(Artificial Intelligence))」一詞,並明確定出 AI 的任務,例如:自然語言處理、神經網路、計算學理論、隨機性與創造性等,就開啟了全球 AI 研究浪潮,至今將近 70 年的過程間,共迎來三波發展高峰。

第一波技術爆發期確立了自然語言與機器語言的轉換機制,科學家將任務文字化、建立推理規則,再換成機器語言讓機器執行,然而受到演算法及硬體資源限制,使得 AI 只能解決小問題,也因此進入了第一次發展寒冬。

-----廣告,請繼續往下閱讀-----
圖二、1957-1970 年迎來 AI 第一次爆發

之後隨著專家系統的興起,讓 AI 突破技術瓶頸,進入第二次發展高峰期。專家系統是由邏輯推理系統、資料庫、操作介面三者共載而成,由於部份應用領域的邏輯推理方式是相似的,因此只要搭載不同資料庫,就能解決各種問題,克服過去規則設定無窮盡的挑戰。此外,機器學習、類神經網路等技術也在同一時期誕生,雖然是 AI 技術上的一大創新突破,但最終同樣受到硬體限制、技術成熟度等因素影響,導致 AI 再次進入發展寒冬。

走出第二次寒冬的關鍵在於,IBM 超級電腦深藍(Deep Blue)戰勝了西洋棋世界冠軍 Garry Kasparov,加上美國學者 Geoffrey Hinton 推出了新的類神經網路算法,並使用 GPU 進行模型訓練,不只奠定了 NVIDIA 在 AI 中的地位, 自此之後的 AI 研究也大多聚焦在類神經網路上,不斷的追求創新和突破。

圖三、1980 年專家系統的興起,進入第二次高峰

從現在看未來:AI 不僅是工具,也是創作者

隨著時間軸繼續向前推進,如今的 AI 技術不僅深植於類神經網路應用中,更在藝術、創意和日常生活中發揮重要作用,而「2024 未來媒體藝術節」第二章「創造力的轉變」及第三章「創作者的洞見」,便邀請各國藝術家展出運用 AI 與科技的作品。

圖四、2010 年發展至今,高性能電腦與大數據助力讓 AI 技術應用更強

例如,超現代映畫展出的作品《無限共作 3.0》,乃是由來自創意科技、建築師、動畫與互動媒體等不同領域的藝術家,運用 AI 和新科技共同創作的作品。「人們來到此展區,就像走進一間新科技的實驗室,」吳達坤形容,觀眾在此不僅是被動的觀察者,更是主動的參與者,可以親身感受創作方式的轉移,以及 AI 如何幫助藝術家創作。

-----廣告,請繼續往下閱讀-----
圖五、「2024 未來媒體藝術節——奇異點」展出現場,圖為超現代映畫的作品《無限共作3.0》。圖/C-LAB 提供

而第四章「未完的篇章」則邀請觀眾一起思考未來與 AI 共生的方式。臺灣新媒體創作團隊貳進 2ENTER 展出的作品《虛擬尋根-臺灣》,將 AI 人物化,採用與 AI 對話記錄的方法,探討網路發展的歷史和哲學,並專注於臺灣和全球兩個場景。又如國際非營利創作組織戰略技術展出的作品《無時無刻,無所不在》,則是一套協助青少年數位排毒、數位識毒的方法論,使其更清楚在面對網路資訊時,該如何識別何者為真何者為假,更自信地穿梭在數位世界裡。

透過歷史解析引起共鳴

在「2024 未來媒體藝術節」規劃的 4 大章節裡,第一章回顧 AI 發展史的內容設計,可說是臺灣近年來科技或 AI 相關展覽的一大創舉。

過去,這些展覽多半以藝術家的創作為展出重點,很少看到結合 AI 發展歷程、大眾文明演變及流行文化三大領域的展出內容,但李佳霖和蔡侑霖從大量資料中篩選出重點內容並儘可能完整呈現,讓「2024 未來媒體藝術節」觀眾可以清楚 AI 技術於不同階段的演進變化,及各發展階段背後的全球政治經濟與文化狀態,才能在接下來欣賞展區其他藝術創作時有更多共鳴。

圖六、「2024 未來媒體藝術節——奇異點」分成四個章節探究 AI 人工智慧時代的演變與社會議題,圖為第一章「流動的錨點」由自牧文化整理 AI 發展歷程的年表。圖/C-LAB 提供

「畢竟展區空間有限,而科技發展史的資訊量又很龐大,在評估哪些事件適合放入展區時,我們常常在心中上演拉鋸戰,」李佳霖笑著分享進行史料研究時的心路歷程。除了從技術的重要性及代表性去評估應該呈現哪些事件,還要兼顧詞條不能太長、資料量不能太多、確保內容正確性及讓觀眾有感等原則,「不過,歷史事件與展覽主題的關聯性,還是最主要的決定因素,」蔡侑霖補充指出。

-----廣告,請繼續往下閱讀-----

舉例來說,Google 旗下人工智慧實驗室(DeepMind)開發出的 AI 軟體「AlphaFold」,可以準確預測蛋白質的 3D 立體結構,解決科學家長達 50 年都無法突破的難題,雖然是製藥或疾病學領域相當大的技術突破,但因為與本次展覽主題的關聯性較低,故最終沒有列入此次展出內容中。

除了內容篩選外,在呈現方式上,2位研究者也儘量使用淺顯易懂的方式來呈現某些較為深奧難懂的技術內容,蔡侑霖舉例說明,像某些比較艱深的 AI 概念,便改以視覺化的方式來呈現,為此上網搜尋很多與 AI 相關的影片或圖解內容,從中找尋靈感,最後製作成簡單易懂的動畫,希望幫助觀眾輕鬆快速的理解新科技。

吳達坤最後指出,「2024 未來媒體藝術節」除了展出藝術創作,也跟上國際展會發展趨勢,於展覽期間規劃共 10 幾場不同形式的活動,包括藝術家座談、講座、工作坊及專家導覽,例如:由策展人與專家進行現場導覽、邀請臺灣 AI 實驗室創辦人杜奕瑾以「人工智慧與未來藝術」為題舉辦講座,希望透過帶狀活動創造更多話題,也讓展覽效益不斷發酵,讓更多觀眾都能前來體驗由 AI 驅動的未來創新世界,展望 AI 在藝術與生活中的無限潛力。

展覽資訊:「未來媒體藝術節——奇異點」2024 Future Media FEST-Singularity 
展期 ▎2024.10.04 ( Fri. ) – 12.15 ( Sun. ) 週二至週日12:00-19:00,週一休館
地點 ▎臺灣當代文化實驗場圖書館展演空間、北草坪、聯合餐廳展演空間、通信分隊展演空間
指導單位 ▎文化部
主辦單位 ▎臺灣當代文化實驗場

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
台灣有恐龍嗎?化石學家帶你探索島嶼的古老秘密——《好久・不見》
麥田出版_96
・2024/11/02 ・2579字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

台灣的地理位置與化石形成

台灣也有化石嗎?台灣也有恐龍嗎?

世界地圖攤開一看,台灣陸地上的面積看來是不大,但其面對的太平洋,不只在我的想像中、在我多年搭著飛機到世界各地檢視相關的標本,試著拼湊出鯨魚們在數千萬年間演化歷程的經驗中,我知道也相信台灣的地底下,必定蘊涵著能跟我們講出帶有全球視野的化石標本。

同時,台灣除了被海洋包圍之外,那平均深度只有六、七十公尺深的台灣海峽,也清楚的意味著,當更新世的冰河時期讓海平面下降幅度來到或超過這個臨界點時,台灣就會成為歐亞大陸最東南邊的一角。

相信在台灣的不少人都常聽過,台灣在冰河時期會和中國大陸連在一起,但我在跟大家解釋這樣的環境變遷與古生物演化時,總是會特別強調我不想泛政治化,但世界地圖清楚的標示出台灣的地理位置應該是可以、也該要放在更大的版圖:歐亞大陸的板塊底下來討論,而不是只有限縮在與中國大陸連結的關係。

畢竟,當我們像是讚嘆著非洲地區的陸生大型哺乳動物,能在以年為單位的時間軸來進行長距離的移動時,基本上是用「萬年」以上的尺度來探討生物演化、移動的古生物學,處於歐亞大陸東岸的台灣上的大型脊椎動物,要橫跨歐亞大陸到西邊、或是反方向的來到台灣,大概都會是稀鬆平常的移動距離。

-----廣告,請繼續往下閱讀-----

建立起這樣的思維模式後,當然就是需要有最直接的化石證據來驗證這樣的想法,或深入討論其化石標本的背後,隱藏了怎樣的大尺度演化事件。

大型脊椎動物跨越歐亞大陸到台灣,在古生物學的長時尺度下是平常現象。圖/envato

早坂一郎的開創性研究與犀牛化石

二○一八年一月底從日本的筑波搬到台北後,一邊重新改造所接手的退休丘臺生教授的實驗室、一邊開始準備新學期的上課內容;除此之外,很重要、也是主要的工作內容,就是要開始到野外和各個單位的收藏庫裡尋找、檢視相關的化石標本,試著解讀其背後所帶有的古生物學、演化學上的意義。

有趣、但不令人意外的是,知道我開始要在台灣從事大型脊椎動物化石研究的人,第一個反應通常都會是:台灣也有化石嗎?台灣也有恐龍嗎?這樣之類的疑問。

要回答台灣有沒有化石紀錄的出現,我在日本的工作經驗,和剛好不小心娶了日本太太,讓我能從搬到日本工作前還不會五十音的狀態,到現在能有一定用日文溝通和閱讀日文文獻的基礎能力,幫了很大的忙。

-----廣告,請繼續往下閱讀-----

因為,台灣的古生物研究歷史,基本上就是從日治時期展開並奠下根基。也因此,有一定的日文能力和在日本古生物學界中遊走的經驗,確實是對於一些細微的狀況,更能推敲或掌握。

舉例來說,我目前所服務的台灣大學於一九二八年創立時的前身:日治時期的台北帝國大學,一開始創校時就加入的早坂一郎教授,可以說就是在研究台灣大型脊椎動物化石的先驅,也就不意外為什麼一九八四年在台灣所發現、並被命名為一個新亞種的犀牛化石,會以早坂為名(犀牛的故事書寫在第四話)。

延伸閱讀:從放牛學生到震驚世界:左鎮犀牛化石背後的傳奇——《好久・不見》

台灣有化石的出沒,對生物多樣性、生命演化等議題有些敏感度的人來說,大概不會太意外。但台灣有沒有令許多人為之瘋狂的恐龍,聽起來就是一個棘手許多的疑問。

或許出乎大多數人的意外,台灣不只有貨真價實的恐龍,還有台灣才有的特有種恐龍!

-----廣告,請繼續往下閱讀-----

一九九三年上映的《侏羅紀公園》(Jurassic Park),可以說是徹底的激發了全世界對於恐龍的狂熱與追逐。即使到了二○二四年的今天,恐龍的形象,對於大多數的人來說,似乎就是古生物學研究的全部了。

《侏羅紀公園》激發全球恐龍熱潮,至今在大眾心中恐龍仍象徵著古生物學。圖/wikimedia

但恐龍有如此的代表性,可不是只有形象般的讓人摸不著邊際,而是有全世界各地的古生物學家用一生的精力,和政府、私人所挹注的大量資源,來試著一點一滴揭開恐龍那引人入勝的演化歷程。

舉一個比較可以讓大多數人理解到我們對於恐龍知識是如何持續的累積、建構起來的例子:我正在書寫這段文字的當下是二○二○年的五月中旬,這年從一月一日到這個時間點,已經有二十種,先前完全未知、生存於中生代的恐龍們被古生物學家發現,並且正式的命名為新物種、發表在國際間相關的古生物學研究期刊中—平均不到一個禮拜,全世界就又會多了一種中生代的恐龍在我們的知識體系中!

台灣的鳥類恐龍故事:恐龍演化新視角

藉由這樣的研究能量,我們現在不只清楚的知道所有現生鳥類都是貨真價實的恐龍,連我上課在談論恐龍演化所使用的教科書,所提到恐龍定義裡的其中一個主角,即有我們幾乎每天都會見到面的麻雀:

-----廣告,請繼續往下閱讀-----

恐龍包含了滅絕的三角龍和現生的麻雀最近的共同祖先,以及從這共同祖先開始的所有後代,都是恐龍。沒有被包含在三角龍和麻雀最近的共同祖先裡的後代,都不是恐龍。

大部分隨口問我台灣到底有沒有恐龍的人,我基本上都很難有足夠的時間用上述簡短的內容來說明,因為可以感覺得出來,大部分的人,真的都只是隨口問問,大概也沒有打算真的想要了解恐龍、或是古生物學的研究工作到底是怎麼一回事,背後又有什麼重要的意涵。所以我一般都只會簡短的回應著像是,台灣當然有恐龍,因為所有的鳥類都是恐龍,不只如此,我們每天也都在吃著貨真價實的恐龍肉!

——本文摘自《好久・不見:露脊鯨、劍齒虎、古菱齒象、鱷魚公主、鳥類恐龍⋯⋯跟著「古生物偵探」重返遠古台灣,尋訪神祕化石,訴說在地生命的演化故事》,2024 年 9 月,麥田出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

麥田出版_96
27 篇文章 ・ 15 位粉絲
1992,麥田裡播下了種籽…… 耕耘多年,麥田在摸索中成長,然後努力使自己成為一個以人文精神為主軸的出版體。從第一本文學小說到人文、歷史、軍事、生活。麥田繼續生存、繼續成長,希圖得到眾多讀者對麥田出版的堅持認同,並成為讀者閱讀生活裡的一個重要部分。

0

3
0

文字

分享

0
3
0
OpenAI 新突破!為什麼 Sora 可以產出這麼流暢的動畫?你不可錯過的技術文件大解密!
泛科學院_96
・2024/02/26 ・2968字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

什麼?不需要拍攝團隊與剪輯師,一句話就可以生成短片?!

OpenAI 近來發布的短影片生成器——Sora,能依據各種「咒語」生成難分真偽的流暢影片。

是什麼技術讓它如此強大?讓我們來一探究竟吧!

你被 Sora 了嗎?這幾天 Sora 佔據了各大版面,大家都在說 OpenAI 放大絕,不止 YouTuber,連好萊塢都要崩潰啊啊啊!

但真有這麼神嗎?我認真看了下 Sora 的官方說明以及參考資料,發現這東西,還真的挺神的!這東西根本不是 AI 取代人或單一產業,而是 AI 變成人,根本是通用型人工智慧 AGI 發展的里程碑啊!

別怕,要讓 Sora 為你所用,就先來搞懂到底是什麼神奇的訓練方法讓 Sora 變得那麼神,這就要從官網說明中唯一的斜體字——diffusion transformer 說起了。

這集我們要來回答三個問題,第一,Sora 跟過去我們產圖的 Midjourney、Dall-E,有什麼不同?第二,Diffusion transformer 是啥?第三,為什麼 Diffusion transformer 可以做出這麼絲滑的動畫?

-----廣告,請繼續往下閱讀-----

最後,我想說說我的感想,為什麼我會覺得 Sora 很神,不只是取代坐在我旁邊的剪接師,而是 AI 變人的里程碑。

我們已經很習慣用 Midjourney、Dall-E 這些 Diffusion 模型產圖了,從 logo 到寫真集都能代勞,他的原理我們在泛科學的這裡,有深入的解說,簡單來說就像是逐格放大後,補上圖面細節的過程。不過如果你要讓 Diffusion 產影片,那後果往往是慘不忍睹,就像這個威爾史密斯吃麵的影片,每一格影格的連續性不見得相符,看起來就超級惡趣味。

要影格連續性看來合理……咦?像是 GPT-4 這種 tranformer 模型,不是就很擅長文字接龍,找關聯性嗎?要是讓 transformer 模型來監督 Diffusion 做影片,撒尿蝦加上牛丸,一切不就迎刃而解了嗎?

沒錯,OpenAI 也是這樣想的,因此才把 Sora 模型稱為「Diffusion transformer」,還在網站上用斜體字特別標示起來。

-----廣告,請繼續往下閱讀-----
圖/OpenAI

但說是這樣說啦,但 transformer 就只會讀文本,做文字接龍,看不懂影片啊,看不懂是要怎麼給建議?於是,一個能讓 transformer 看懂圖片的方式——patch 就誕生啦!

ChatGPT 理解內容的最小單位是 token,token 類似單詞的文字語意,ChatGPT 用 token 玩文字接龍,產生有連續性且有意義句子和文章。

那 Patch 呢?其實就是圖片版的 token,讓 ChatGPT 可以用圖片玩接龍,玩出有連貫性的圖片。

Sora 官方提供的訓練說明圖上,最後所形成的那些方塊就是 patch,這些 patch 是包含時間在內的 4D 立體拼圖,可以針對畫面與時間的連續性進行計算。

-----廣告,請繼續往下閱讀-----
圖/OpenAI

那這個 patch 要怎麼做呢?以 Sora 提供的參考文獻 15 來說明會比較容易懂,patch 是將影像切成一樣等大的區塊後,進行編碼、壓縮,產生類似 ChatGPT 能分析的文字語意 token。

有了這些 patch 後,Transformer 就可以計算 patch 之間的關聯性形成序列,例如論文中被分割在中上與右上的兩塊藍天,就會被分類在天空,之後算圖的時候,就會知道這兩塊 patch 是一組的,必須一起算才行。

也就是說,畫面上的這塊天空已經被鎖定,必須一起動。

雖然這篇論文只提圖片,但影片的處理只要再加上 patch 間的先後順序,這樣就能讓 transformer 理解隨時間改變的演化。

-----廣告,請繼續往下閱讀-----

同樣是上面被鎖定的天空,多了先後順序,就相當於是增加了前一個影格與後一個影格限制條件,讓這塊天空在畫面中移動時,被限縮在一定範圍內,運動軌跡看起來更加合理。

而他的成果,就是在 Sora 官網上看到的驚人影片,那種絲滑的高畫質、毫無遲滯且高度合理、具有空間與時間一致性的動作與運鏡,甚至可以輕易合成跟分割影片。

不過啊,能把 Sora 模型訓練到這個程度,依舊是符合 OpenAI 大力出奇跡的硬道理,肯定是用了非常驚人的訓練量,要是我是 Runway 或 Pika 這兩家小公司的人,現在應該還在咬著牙流著血淚吧。別哭,我相信很多人還是想要看威爾史密斯繼續吃義大利麵的。

在訓練過程中,Sora 從提取影像特徵,到形成有意義的 patch,到最後串聯成序列,如果你接觸過認知心理學,你會發現這其過程就跟認知心理學描述人類處理訊息的過程如出一轍。都是擷取特徵、幫特徵編碼形成意義、最後組合長期記憶形成序列,可以說 Sora 已經接近複製人類認知過程的程度。

-----廣告,請繼續往下閱讀-----

這邊是我的推測,影片中那些逼真的物理效果,不是有特定的物理模型或遊戲引擎在輔助,而是在 patch 的訓練與序列推理中,就讓 Sora 理解到要讓物體這樣動,看起來才會是真實的,這跟 GPT-4 並不需要文法引擎是一樣的,只要玩文字接龍,就能生成流暢又有邏輯的文字跟代碼。但這也是為什麼,GPT 依舊很會胡說八道,產生幻覺。如果不是這樣,我很難想像 Sora 會算出這種影片。

Sora 能理解並產生人類眼睛能接收的視覺影片,同樣的技術若能做出聽覺、觸覺等其他人類感官,這樣我們被 AI 豢養的時刻是不是就越來越近了呢?

後 Sora 時代到底會發生什麼事,老實講我不知道,上面提到的 diffusion transformer 或 patch,都是近一年,甚至是幾個月前才有研究成果的東西。

臉書母公司 Meta 的首席人工智慧科學家 Yann Lecun 也在他自己的臉書公開抨擊 Sora 這種基於像素預測的技術註定失敗,但這篇感覺比較像是對自己的老闆 Zuckerberg 喊話:「欸這沒戲,不要叫我學 Sora,拿寶貴的運算資源去搞你的元宇宙。」是說今年初就有新聞說祖老闆 2024 年預計買超過 35 萬顆 H100 處理器,這明顯就是要搞一波大的吧,這就是我想要的血流成河。

-----廣告,請繼續往下閱讀-----

而且,從去年 ChatGPT 出來開始,我感覺就已經不是討論 AI 會怎麼發展,而是要接受 AI 必定會發展得越來越快,我們要怎麼面對 AI 帶來的機會與衝擊。

我們去年成立泛科學院,就是希望跟大家一起,透過簡單易懂的教學影片,把對 AI 的陌生跟恐慌,變成好奇與駕馭自如。Sora 或類似的模型應該可以協助我把這件事做得更好,可惜的的是目前 OpenAI 僅開放 Sora 給內部的 AI 安全團隊評估工具可能帶來的危害與風險,另外就是與少數外部特定的藝術家、設計師跟電影製片人確保模型用於創意專業領域的實際應用,若有新消息,我會再即時更新。

最後也想問問你,若能用上 Sora,你最想拿來幹嘛呢?歡迎留言跟我們分享。喜歡這支影片的話,也別忘了按讚、訂閱,加入會員,下集再見~掰!

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

泛科學院_96
44 篇文章 ・ 52 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!