Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

真的能眼見為憑嗎?飽含數學、藝術、設計與文化的《錯視維度》展覽

Sharkie Lin_96
・2018/06/30 ・4232字 ・閱讀時間約 8 分鐘 ・SR值 520 ・七年級

-----廣告,請繼續往下閱讀-----

「我們看錯了世界,卻說它欺騙我們。」

“We read the world wrong and say that it deceives us.”

-詩人泰戈爾(Rabindranath Tagore,1861-1941)

長久以來錯視藝術令人目眩神迷,許多藝術家與設計師為此不疲,創造出衝擊世人感官與意識的圖形,模糊錯覺與真實的邊界;維度除了是描述時空座標的參數,也代表一件事物的特點與面向。

本展試著透過國際與台灣在地設計、文化、數學類的作品,呈現當代錯視藝術的多重趣味與驚喜。

圖 / 錯視維度官網

Seeing is believing? 進入空間一起眼見為憑吧!

錯視藝術一直是人們好奇探索與競相分享的主題,在娛樂產業中更是被運用得淋漓盡致,像是以錯視和不可能的幾何物體構成迷宮的紀念碑谷(Monument Valley),許多遊戲場景都是向錯覺大師艾雪(M.C. Escher)致敬;擅長拍攝創意MV的OK Go樂團,在〈The Writing’s On the Wall〉中一鏡到底的拍攝手法,融合人物、物體與場景表現出各種驚人的錯視。

近期 EnterSpace密室逃脫/咖啡實驗室正推出第一檔展覽《錯視維度》(Dimension of Illusion)。基於錯視常以欺騙的型式出現,特別選在4/1愚人節開幕,希望呈現當代錯視藝術的多重面向,帶給每位來到展場的觀眾驚喜與樂趣,接下來就由策展人也就是我來介紹這檔展覽。

-----廣告,請繼續往下閱讀-----

首先是以謎題手法呈現的主視覺設計,裡頭藏了一些關於文字的玄機,可在此試著解解看。

幾何色塊除了向蒙德里安(Piet Cornelies Mondrian)致敬之外,還是個重要提示,這道謎題要從兩個方向來解讀。如果正面看不出端倪,斜斜地去看這個圖形,隱含的文字就會比較明顯。避免破壞大家解謎的樂趣,解答放在最後一張圖片的圖說。

《錯視維度》酷卡設計,你看出其中的巧思了嗎?圖/EnterSpace提供。

文化與設計維度

本檔展覽呈現了錯視藝術的多重面向,介紹完主視覺設計上的錯視之後,再來是近來相當火紅的的雙向圖(ambigram)。雙向圖乍看之下是只有一種讀法的普通文字,但透過旋轉或是鏡射等技巧,可以產生多種讀法或改變其意義,是一種錯視藝術,經常能夠讓人感到解謎的樂趣。

我第一次接觸到雙向圖是在丹‧布朗《達文西密碼》與《天使與魔鬼》的書中,當時看到約翰·蘭登(John Langdon)創作的英文雙向圖還把書旋轉了好多次,在心中讚歎其巧思。沒想到多年之後,竟然出現了中文/漢字的雙向圖創作。

與英文字母相比,中文與漢字的使用字數較多,而且字形也有一定的差異,因此用中文與漢字來創作是相當困難的。前陣子,日本雙向字設計師野村一晟 (Issei  Nomura)為花蓮地震創作了〈台灣加油〉,我們特別邀請到他來參展。

-----廣告,請繼續往下閱讀-----
野村一晟系列創作
圖片來源:EnterSpace提供

野村先生想要展現雙向字創作的多元面向,因此提供不同類型的雙向圖作品,像是即興創作的〈赤與青與紫〉、立體雕塑光影構成的〈陰與陽〉,以及同義、反義、相關字詞之設計作品,如〈挑戰與勝利〉、〈才能與努力〉、〈浪費與節約〉等,與別具意義的〈台灣加油〉,共有八幅作品,而這也是他首次海外展覽。

  • 野村一晟 (Issei  Nomura)的推特頁面

不只日本有雙向圖設計,其實台灣也有而且發展得更早。

為了讓大家看到台灣在地的設計,EnterSpace特別與魔翻文創合作,新製作一件互動作品──喜「翻」台灣,上頭的雙向圖是林國慶設計師從台灣各縣市地名發想與創作。期待透過這個大型的台灣地圖,讓來自不同縣市的觀眾,親自動手發掘雙向圖的奧妙,都能夠找到自己的家鄉,將「臺灣」翻轉成「寶島」。

喜「翻」台灣。文字設計:林國慶 / 地圖概念:Shark Lin、Ching-Yu Tsao / 視覺設計:魔翻文創 / 展板製作:EnterSpace
圖片來源:EnterSpace提供

有發現這個台灣地圖哪裡不太一樣嗎?

我們在這裡將台灣地圖橫著放,有兩個主要原因,首要是打破觀者對於台灣慣常的凝視角度,邀請觀者尋思作品本身的奇妙之處;再來是受到國立台灣文學館開館「從台南向世界出發」概念以及台灣古地圖方位之啟發,希望能夠呼應先民不畏風浪渡海來台之歷史,以創意從台灣向世界出發。

數學與藝術維度

談完了設計與文化的面向,接著來介紹數學與藝術的維度。2016年的全球《年度視覺錯視大賽》(Best Illusion of the Year Contest),有一件作品驚艷全球:

-----廣告,請繼續往下閱讀-----

那就是由明治大學教授杉原厚吉(Kokichi Sugihara)所創作,讓人分不清到底是方還是圓的〈Ambiguous Cylinder Illusion〉,我們取得授權在此展出,想要挑戰人類視覺與認知極限,眼見是否真的為憑?

Ambiguous Cylinder Illusion,杉原厚吉
圖片來源:EnterSpace提供

為什麼這些柱體在鏡子裡的形狀看起來會不一樣呢?

一邊是方的,另一邊則是圓的。其實這些柱體既不是方形柱也不是圓形柱,而是界於兩者之間的方圓形(Squircle)。若是在展場中仔細觀察柱體,會發現柱體的上側為波浪狀,外側也有較為突出的地方,因此形成有趣的錯視。

這樣的作品竟然只獲得2016年的《年度視覺錯視大賽》第二名(第一名的連結在此),杉原厚吉教授運用數學原理,設計了一堆讓人難以置信的錯視物體與圖形,他的官網有更多影片。

接著同樣來介紹台灣的創作,吳寬瀛老師經典的〈柱面投影〉,利用軟體將正常圖像轉化成變形的圖樣(anamorphosis),再以不銹鋼柱面還原其原本面貌,製造出兩者虛實之間的反差形成錯視,轉換後的圖像與原本反差愈大的愈是有趣。我們在展場中放了一些圖形,讓觀眾可以自行動手與觀察圖形是如何投影到圓柱上。

-----廣告,請繼續往下閱讀-----
柱面投影,吳寬瀛
圖片來源:EnterSpace提供

匈牙利藝術家István Orosz也是這方面的專家,創造出許多融合圓柱與其他錐體於平面畫作的變形畫作,想像力十分驚人;藝術家Jonty Hurwitz甚至跳脫出平面創作,其扭曲雕塑在圓柱裡顯現出不可思議的立體圖像。

台灣哪邊可以欣賞到這些大型公共藝術呢?不妨到南部走走,經過台南高鐵站時可以看見主題為黑面琵鷺的鏡面雕塑,到高雄後還可以拜訪福田繁雄設計藝術館,除了圓柱之外更有大師精彩的錯視創作。

最後一件展品是由國立後壁高中沈岳霖師生共同完成的碎形幾何──〈YES, I DO〉,曾經在《多面自造》展覽展示過,裡頭的數學原理為謝爾賓斯基四面體(Sierpinski Tetrahedron)。四面體的每一面皆為謝爾賓斯基三角形,此三角形是一種自我相似的碎形,其生成過程如下:

謝爾賓斯基三角形。圖/wikipedia

本件作品的製作過程分成兩個部分,先將謝爾賓斯基四面體實體化,再依照YES與I DO兩個詞的形狀,將對應到的三角形著上顏色。這些三角形雖然距觀者的遠近不一,卻能讓觀者站在兩個特定位置時看到英文字,達到一種空間錯視與樂趣。在我們的安排之下,可以捕捉到多件作品形成之「台灣加油,YES寶島」的畫面。

-----廣告,請繼續往下閱讀-----
YES, I DO-作者:廖梓馮、郭晉程、黃頌麟、葉威汎,指導老師:沈岳霖。
圖片來源:EnterSpace提供

拓展維度的錯視選書

錯視藝術的面向很廣,因此我們設置了選書區,讓大家能夠自由探索錯視的多重面貌,接下來我想推薦幾本特別有趣的書。

首先是由倉嶌隆広(Takahiro Kurashima)創作,讓人愛不釋手的《Poemotion》系列!它是Poem(詩)+ Emotion(情感)+ Motion(移動),我喚它為詩意的移動。每一頁乍看只是靜態的圖樣,如果用書中附的黑色塑膠片掃過去,會有非常奇妙的動態錯視,請小心,很容易會被這些舞蹈、跳躍、旋轉的幾何圖樣撩到。

如果你/妳覺得被騙得還不夠,不管策展人嗑了什麼都想要來一點。那麼我接下來要鄭重推薦《Masters of Deception》與攝影師Erik Johansson的《Imagine》,分別介紹了讓人瞠目結舌的藝術創作以及超現實的當代攝影。讀完後只覺得錯視根本是人類智慧與幽默感結合的藝術,想像力就是藝術家的超能力!

最後,EnterSpace是個漫布謎題的趣味空間,也計劃打造成公開展示與討論數學藝術的場域;這裡有許多新奇好玩的東西與創意飲品,即日起只要報上「我是泛科學的讀者/粉絲」,即可享有餐飲特別優惠。

-----廣告,請繼續往下閱讀-----
還記得主視覺設計本身的謎題嗎?答案是本檔展覽的名稱──錯視維度。圖片來源:EnterSpace提供

展覽資訊

展出藝術家|沈岳霖師生、吳寬瀛、林國慶、野村一晟、杉原厚吉

策展人|Shark Lin

視覺設計|Ching-Yu Tsao

主辦單位|EnterSpace 密室逃脫/咖啡實驗室

線上介紹|https://www.enterspace.tw/illusion

特別感謝|莊舒茵、魔翻文創

展期|2018/4/1-12/31

地點|EnterSpace 密室逃脫/咖啡實驗室

地址|台北市中山區明水路581巷15號B1(7-11旁樓梯走下去)

導覽|團體10人以上可預約導覽解說

錯視書單

  1. Masters of Deception: Escher, Dali & the Artists of Optical Illusion│ Al Seckel
  2. Can You Believe Your Eyes?: Over 250 Illusions and Other Visual Oddities│ J. Richard Block, Harold Yuker
  3. Poemotion 1, 2 , 3│Takahiro Kurashima
  4. The Magic of M.C. Escher│J. L. Locher
  5. Imagine│Erik Johansson
  6. 樂.快.想.設計 福田繁雄的插畫設計美學│東方技術學院福田繁雄設計藝術館
  7. 為什麼你沒看見大猩猩?:教你擺脫六大錯覺的操縱│Christopher Chabris, Daniel Simons
  8. 眼睛在搞鬼!錯視的奇妙世界│Jules Mathruin、Giampiero Caiti
  9. 不可思議的房子│青山邦彥

-----廣告,請繼續往下閱讀-----
文章難易度
Sharkie Lin_96
24 篇文章 ・ 6 位粉絲
在國二無聊的早自習意外發現數學的趣味,因此近來體驗到數學研究、藝術創作、採訪寫作、展覽策劃、資優教育等工作。不是念數學也不是學藝術,但樂於從多元視角聊聊數學的各種姿態,以及進行數學藝術創作,希望能為世界帶來一點樂趣。科普部落格〈鯊奇事務所〉https://medium.com/sharkie-studio,聯絡信箱 sharkgallium@gmail.com

0

3
1

文字

分享

0
3
1
為機器人換上「物理大腦」:一場終結AI數位囚禁的革命
鳥苷三磷酸 (PanSci Promo)_96
・2025/09/03 ・5732字 ・閱讀時間約 11 分鐘

本文與 研華科技 合作,泛科學企劃執行

我們都看過那種影片,對吧?網路上從不缺乏讓人驚嘆的機器人表演:數十台人形機器人像軍隊一樣整齊劃一地耍雜技 ,或是波士頓動力的機器狗,用一種幾乎違反物理定律的姿態後空翻、玩跑酷 。每一次,社群媒體總會掀起一陣「未來已來」、「人類要被取代了」的驚呼 。

但當你關掉螢幕,看看四周,一個巨大的落差感就來了:說好的機器人呢?為什麼大街上沒有他們的身影,為什麼我家連一件衣服都還沒人幫我摺?

這份存在於數位螢幕與物理現實之間的巨大鴻溝,源於一個根本性的矛盾:當代AI在數位世界裡聰明絕頂,卻在物理世界中笨拙不堪。它可以寫詩、可以畫畫,但它沒辦法為你端一杯水。

-----廣告,請繼續往下閱讀-----

這個矛盾,在我們常見的兩種機器人展示中體現得淋漓盡致。第一種,是動作精準、甚至會跳舞的類型,這本質上是一場由工程師預先寫好劇本的「戲」,機器人對它所處的世界一無所知 。第二種,則是嘗試執行日常任務(如開冰箱、拿蘋果)的類型,但其動作緩慢不穩,彷彿正在復健的病人 。

這兩種極端的對比,恰恰點出了機器人技術的真正瓶頸:它們的「大腦」還不夠強大,無法即時處理與學習真實世界的突發狀況 。

這也引出了本文試圖探索的核心問題:新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦,真的能終結機器人的「復健時代」,開啟一個它們能真正理解、並與我們共同生活的全新紀元嗎?

新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦 / 圖片來源:研華科技

為何我們看到的機器人,總像在演戲或復健?

那我們怎麼理解這個看似矛盾的現象?為什麼有些機器人靈活得像舞者,有些卻笨拙得像病人?答案,就藏在它們的「大腦」運作方式裡。

-----廣告,請繼續往下閱讀-----

那些動作極其精準、甚至會後空翻的機器人,秀的其實是卓越的硬體性能——關節、馬達、減速器的完美配合。但它的本質,是一場由工程師預先寫好劇本的舞台劇 。每一個角度、每一分力道,都是事先算好的,機器人本身並不知道自己為何要這麼做,它只是在「執行」指令,而不是在「理解」環境。

而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。

這就像教一個小孩走路,你可以抱著他,幫他擺動雙腿,看起來走得又快又穩,但那不是他自己在走。真正的學習,是他自己搖搖晃晃、不斷跌倒、然後慢慢找到平衡的過程。過去的機器人,大多是前者;而我們真正期待的,是後者。

所以,問題的核心浮現了:我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好?

-----廣告,請繼續往下閱讀-----
我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好? / 圖片來源:shutterstock

機器人的大腦,為什麼不能放在雲端?

聽起來好像很合理,對吧?把所有複雜的運算都交給雲端最強大的伺服器,機器人本身只要負責接收指令就好了。但……真的嗎?

想像一下,如果你的大腦在雲端,你看到一個球朝你飛過來,視覺訊號要先上傳到雲端,雲端分析完,再把「快閃開」的指令傳回你的身體。這中間只要有零點幾秒的網路延遲,你大概就已經鼻青臉腫了。

現實世界的互動,需要的是「即時反應」。任何網路延遲,在物理世界中都可能造成無法彌補的失誤 。因此,運算必須在機器人本體上完成,這就是「邊緣 AI」(Edge AI)的核心概念 。而 NVIDIA  Jetson 平台,正是為了解決這種在裝置端進行高運算、又要兼顧低功耗的需求,而誕生的關鍵解決方案 。

NVIDIA Jetson 就像一個緊湊、節能卻效能強大的微型電腦,專為在各種裝置上運行 AI 任務設計 。回顧它的演進,早期的 Jetson 系統主要用於視覺辨識搭配AI推論,像是車牌辨識、工廠瑕疵檢測,或者在相機裡分辨貓狗,扮演著「眼睛」的角色,看得懂眼前的事物 。但隨著算力提升,NVIDIA Jetson 的角色也逐漸從單純的「眼睛」,演化為能夠控制手腳的「大腦」,開始驅動更複雜的自主機器,無論是地上跑的、天上飛的,都將NVIDIA Jetson 視為核心運算中樞 。

-----廣告,請繼續往下閱讀-----

但再強大的晶片,如果沒有能適應現場環境的「容器」,也無法真正落地。這正是研華(Advantech)的角色,我們將 NVIDIA Jetson 平台整合進各式工業級主機與邊緣運算設備,確保它能在高熱、灰塵、潮濕或震動的現場穩定運行,滿足從工廠到農場到礦場、從公車到貨車到貨輪等各種使用環境。換句話說,NVIDIA 提供「大腦」,而研華則是讓這顆大腦能在真實世界中呼吸的「生命支持系統」。

這個平台聽起來很工業、很遙遠,但它其實早就以一種你意想不到的方式,進入了我們的生活。

從Switch到雞蛋分揀員,NVIDIA Jetson如何悄悄改變世界?

如果我告訴你,第一代的任天堂Switch遊戲機與Jetson有相同血緣,你會不會很驚訝?它的核心處理器X1晶片,與Jetson TX1模組共享相同架構。這款遊戲機對高效能運算和低功耗的嚴苛要求,正好與 Jetson 的設計理念不謀而合 。

而在更專業的領域,研華透過 NVIDIA Jetson 更是解決了許多真實世界的難題 。例如

-----廣告,請繼續往下閱讀-----
  • 在北美,有客戶利用 AI 進行雞蛋品質檢測,研華的工業電腦搭載NVIDIA Jetson 模組與相機介面,能精準辨識並挑出髒污、雙黃蛋到血蛋 
  • 在日本,為避免鏟雪車在移動時發生意外,導入了環繞視覺系統,當 AI 偵測到周圍有人時便會立刻停止 ;
  • 在水資源珍貴的以色列,研華的邊緣運算平台搭載NVIDIA Jetson模組置入無人機內,24 小時在果園巡航,一旦發現成熟的果實就直接凌空採摘,實現了「無落果」的終極目標 。

這些應用,代表著 NVIDIA Jetson Orin™ 世代的成功,它讓「自動化」設備變得更聰明 。然而,隨著大型語言模型(LLM)的浪潮來襲,人們的期待也從「自動化」轉向了「自主化」 。我們希望機器人不僅能執行命令,更能理解、推理。

Orin世代的算力在執行人形機器人AI推論時的效能約為每秒5到10次的推論頻率,若要機器人更快速完成動作,需要更強大的算力。業界迫切需要一個更強大的大腦。這也引出了一個革命性的問題:AI到底該如何學會「動手」,而不只是「動口」?

革命性的一步:AI如何學會「動手」而不只是「動口」?

面對 Orin 世代的瓶頸,NVIDIA 給出的答案,不是溫和升級,而是一次徹底的世代跨越— NVIDIA Jetson Thor 。這款基於最新 Blackwell 架構的新模組,峰值性能是前代的 7.5 倍,記憶體也翻倍 。如此巨大的效能提升,目標只有一個:將過去只能在雲端資料中心運行的、以 Transformer 為基礎的大型 AI 模型,成功部署到終端的機器上 。

NVIDIA Jetson Thor 的誕生,將驅動機器人控制典範的根本轉變。這要從 AI 模型的演進說起:

-----廣告,請繼續往下閱讀-----
  1. 第一階段是 LLM(Large Language Model,大型語言模型):
    我們最熟悉的 ChatGPT 就屬此類,它接收文字、輸出文字,實現了流暢的人機對話 。
  2. 第二階段是 VLM(Vision-Language Model,視覺語言模型):
    AI 學會了看,可以上傳圖片,它能用文字描述所見之物,但輸出結果仍然是給人類看的自然語言 。
  3. 第三階段則是 VLA(Vision-Language-Action Model,視覺語言行動模型):
    這是革命性的一步。VLA 模型的輸出不再是文字,而是「行動指令(Action Token)」 。它能將視覺與語言的理解,直接轉化為控制機器人關節力矩、速度等物理行為的具體參數 。

這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。

NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技

其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。

好,我們有了史上最強的大腦。但一個再聰明的大腦,也需要一副強韌的身體。而這副身體,為什麼非得是「人形」?這不是一種很沒效率的執念嗎?

為什麼機器人非得是「人形」?這不是一種低效的執念嗎?

這是我一直在思考的問題。為什麼業界的主流目標,是充滿挑戰的「人形」機器人?為何不設計成效率更高的輪式,或是功能更多元的章魚型態?

-----廣告,請繼續往下閱讀-----

答案,簡單到令人無法反駁:因為我們所處的世界,是徹底為人形生物所打造的。

從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。

這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。

人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態 / 圖片來源:shutterstock

但要讓一個「多面手」真正活起來,光有骨架還不夠。它必須同時擁有強大的大腦平台與遍布全身的感知神經,才能理解並回應外在環境。人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態。但這些訊號若沒有通過一個穩定的「大腦平台」,就無法匯聚成有意義的行動。

這正是研華的角色:我們不僅把 NVIDIA Jetson Thor 這顆核心晶片包載在工業級電腦中,讓它成為能真正思考與反應的「完整大腦」,同時也提供神經系統的骨幹,將感測器、I/O 介面與通訊模組可靠地連結起來,把訊號傳導進大腦。你或許看不見研華的存在,但它實際上遍布在機器人全身,像隱藏在皮膚之下的神經網絡,讓整個身體真正活過來。

但有了大腦、有了身體,接下來的挑戰是「教育」。你要怎麼教一個物理 AI?總不能讓它在現實世界裡一直摔跤,把一台幾百萬的機器人摔壞吧?

打造一個「精神時光屋」,AI的學習速度能有多快?

這個問題非常關鍵。大型語言模型可以閱讀網際網路上浩瀚的文本資料,但物理世界中用於訓練的互動資料卻極其稀缺,而且在現實中反覆試錯的成本與風險實在太高 。

答案,就在虛擬世界之中。

NVIDIA Isaac Sim™等模擬平台,為這個問題提供了完美的解決方案 。它能創造出一個物理規則高度擬真的數位孿生(Digital Twin)世界,讓 AI 在其中進行訓練 。

這就像是為機器人打造了一個「精神時光屋」 。它可以在一天之內,經歷相當於現實世界千百日的學習與演練,從而在絕對安全的環境中,窮盡各種可能性,深刻領悟物理世界的定律 。透過這種「模擬-訓練-推論」的 3 Computers 閉環,Physical AI (物理AI) 的學習曲線得以指數級加速 。

我原本以為模擬只是為了節省成本,但後來發現,它的意義遠不止於此。它是在為 AI 建立一種關於物理世界的「直覺」。這種直覺,是在現實世界中難以透過有限次的試錯來建立的。

所以你看,這趟從 Switch 到人形機器人的旅程,一幅清晰的未來藍圖已經浮現了。實現物理 AI 的三大支柱已然齊備:一個劃時代的「AI 大腦」(NVIDIA Jetson Thor)、讓核心延展為「完整大腦與神經系統」的工業級骨幹(由研華 Advantech 提供),以及一個不可或缺的「教育環境」(NVIDIA Isaac Sim 模擬平台) 。

結語

我們拆解了那些酷炫機器人影片背後的真相,看見了從「自動化」走向「自主化」的巨大技術鴻溝,也見證了「物理 AI」時代的三大支柱——大腦、身軀、與教育——如何逐一到位 。

專家預測,未來 3 到 5 年內,人形機器人領域將迎來一場顯著的革命 。過去我們只能在科幻電影中想像的場景,如今正以前所未有的速度成為現實 。

這不再只是一個關於效率和生產力的問題。當一台機器,能夠觀察我們的世界,理解我們的語言,並開始以物理實體的方式與我們互動,這將從根本上改變我們與科技的關係。

所以,最後我想留給你的思想實驗是:當一個「物理 AI」真的走進你的生活,它不只是個工具,而是一個能學習、能適應、能與你共同存在於同一個空間的「非人智慧體」,你最先感受到的,會是興奮、是便利,還是……一絲不安?

這個問題,不再是「我們能否做到」,而是「當它發生時,我們準備好了嗎?」

研華已經整裝待發,現在,我們與您一起推動下一代物理 AI 與智慧設備的誕生。
https://bit.ly/4n78dR4

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
231 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

3
3

文字

分享

1
3
3
在數學中尋找想像力的自由——《生而為人的13堂數學課》
臉譜出版_96
・2022/03/28 ・2312字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/ 蘇宇瑞 
  • 原文作者/ Francis Su
  • 譯者/ 畢馨云

存在於數學中的第四個自由,是想像的自由

如果探索是在尋找已經存在的東西,那麼想像就是在建構新的想法,或至少對你來說是新的想法。凡是在沙灘上堆過沙堡的孩子,都知道一桶沙子的無限潛力,同樣的,康托也曾說過:「數學的本質就在於它的自由。」[3](康托在19世紀後期做出開創性的研究成果,讓我們首度對無限的本質有了清楚的了解。)

他的意思是,數學不像科學,研究的主題未必和特定的實物有關,因此數學家在能夠研究的題材上,不像其他科學家那樣受限。數學探險家可以運用她的想像,砌出她心目中的任何一座數學城堡。

拓撲學帶領我們進入想像的空間

我的拓撲學課傳授了想像的實踐。正如前面提到的,拓撲學在研究幾何物件受到連續拉伸時會保持不變的性質。

如果我讓一個物件變形,且沒有引進或移走「洞」,那麼從拓撲學的角度,我並沒有改變它。因此,橄欖球和籃球在拓撲學上是相同的,因為其中一個形狀可以變形成另一個;另一方面,甜甜圈和橄欖球在拓撲學上就是不一樣的,因為你必須在橄欖球上戳一個洞,才可以把它變成甜甜圈。

-----廣告,請繼續往下閱讀-----

拓撲學是很有趣的主題,因為我們可以用奇奇怪怪的方式把東西切割開、黏起來或拉伸,來做出各種很妙的形狀。我們常想像在這些形狀裡面走動,所以稱它們為空間

拓撲學愛好者非常樂在想像他們自己的怪異空間,通常是為了回答某個奇特的問題,例如「是否存在具有這種或那種病態的物件?」。(對,我們在數學上會用到病態一詞,是在描述奇怪或異常的表現,就像在醫學中一樣。)然後會用腦袋聯想出一個例子。

舉例來說,有和田湖(Lakes of Wada):可在地圖上繪出,且邊界完全相同的三個相連區域(「湖」);位於其中一座湖的邊上的任何一點,一定會在所有三座湖的邊上。這個建構是以發明它們的數學家和田健雄(Takeo Wada)的名字命名的。還有夏威夷耳環(Hawaiian earring),這是個華麗的物件,上頭有無限多個逐次變小的環,全相切於一個點。[4]

這個碎形圖有三個區域(深色、中間色和淺色的「湖」),有相同的邊界,但與原始和田湖不同的是,圖中的每個湖都由不連通的水池組成。
圖/生而為人的13堂數學課
夏威夷耳環。圖/生而為人的13堂數學課

亞歷山大角球的病態空間

病態空間(pathological space)有個相當著名的例子(至少在數學家當中很有名),就是亞歷山大角球(Alexander horned sphere)。球是呈泡泡形狀的曲面,正圓球表面的空間具有「單連通」(simply connected)這個性質,意思大致上就是,如果你在球的表面拿著一條繩子,把兩端繫在一起,做成一個圈,那麼所繫成的圈不會卡在球上,永遠可以從球上移走,與球分離。(甜甜圈就截然不同了,它表面的空間不是單連通的:如果把繩子的一端穿過甜甜圈中心的洞,再把兩端繫在一起,你就無法讓繩圈脫離甜甜圈。)

-----廣告,請繼續往下閱讀-----

1924年,J. W. 亞歷山大(J. W. Alexander)在想像他的帶角球時,思考了一個問題:有沒有可能用某種奇特的變形方式,讓泡泡上的相異兩點永遠不會相碰,但泡泡表面的空間又不是單連通的?

起先亞歷山大認為,不管哪個變形泡泡的表面都一定是單連通的。[5]但後來他舉出了一個表面不是單連通的例子!他的假想結構可以描述如下(這不完全是他的結構,但在拓撲學上是相同的):取一個泡泡,擠出兩個「角」,接著再從每個角擠出一對捏起的手指,且讓這兩對捏起的手指幾乎相扣在一起。因為捏起的手指並沒有完全相碰,所以你可以在更小的尺度上重複這個步驟,從前面各組手指擠出一對細小的捏合手指,相扣但沒完全相碰。像這樣繼續做下去,做到極限,就會得到亞歷山大角球。

環繞在其中一個初始角底部的繩圈,無法從帶角球脫離,原因正是相扣手指鉗的極限過程。如果指鉗在某個階段結束,沒有做到極限,那麼繩圈就很容易脫落了。這種令人驚奇的結構,不僅需要靠想像力思考,還需運用想像力去驗證帶角球在極限時確實仍是一個球。

亞歷山大角球。圖/生而為人的13堂數學課

你可以想像把圖放大,去看接連各層級的捏角的碎形本質:在細節的每個層級,景象看起來都相同。

-----廣告,請繼續往下閱讀-----

想像力是我們的超能力

想像的自由為數學注入了夢幻般的特性。許個願,瞧!你的夢想成真了。

如果在每個階段我們都有機會運用想像力,數學學習的樂趣會多出多少?你不必從事高等數學,就能運用想像力。

在算術中,我們可以嘗試建構出帶有奇特性質的數;能被你出生年月日的所有數字整除的最小數字是多少?你能不能找出連續十個不是質數的數?

在幾何學中,我們可以設計出屬於自己的圖案,探究它們的幾何性質;你喜歡的圖案裡有哪些對稱性?

-----廣告,請繼續往下閱讀-----

在統計學中,我們可以考慮一個資料集,想出有創造力的視覺化方法;哪些方法的特點最好?

如果你是從枯燥的教科書上學數學,那就看看能不能把問題改造一下,以提升你的想像力,這麼做就是在讓你鍛鍊想像的自由。

摘自《生而為人的13堂數學課:透過數學的心智體驗與美德探索,讓你成為更好的人的練習》,2022 年 1 月,臉譜出版
-----廣告,請繼續往下閱讀-----
所有討論 1
臉譜出版_96
88 篇文章 ・ 255 位粉絲
臉譜出版有著多種樣貌—商業。文學。人文。科普。藝術。生活。希望每個人都能找到他要的書,每本書都能找到讀它的人,讀書可以僅是一種樂趣,甚或一個最尋常的生活習慣。

0

3
4

文字

分享

0
3
4
大腦其實略懂「預知未來」?NATURE 新發表在視覺皮質發現「預測性編碼」的關鍵拼圖
活躍星系核_96
・2020/05/21 ・3644字 ・閱讀時間約 7 分鐘 ・SR值 585 ・九年級

  • 文/V. 瓦西里耶夫│日內瓦大學博士後研究員,23 歲獨自背著背包從亞洲跨越俄國歐洲來到美國,28 歲取得神經科學博士後重新回到路上;始終更喜歡穿梭亂入各種不同形貌的生活,浪跡各大洲 100 多個國家以尋找寫小說的靈感。撰寫臉書部落格「瑞士豬尾巴・神經科學界的V

一個畫面可以有多種解讀,真相永遠只有一個

很多時候,我們所見到的,與大腦對於這個世界的預期有著緊密的連結。用 Kanizsa 三角作為示範,即便我們可以確定此圖形僅是由三個缺角的實心圓形和三個銳角邊緣所組成,我們卻不可否認地知覺到一個白色的倒三角形,位於三個黑球和一個黑框正三角形之前,即便它不存在著可明確眼見的邊界。

Kanizsa三角是錯覺輪廓中的著名例子,通過幾何排列,讓人感知到白色三角形的存在。圖:Wikipedia

這個現象最早是由義大利心理學家 Gaetano Kanizsa 所描述,可謂「心有所想,目有所見」的範例。

過去有段時間裡,興起於 20 世紀德國的格式塔學派,又稱為完形心理學,將此現象歸功於人腦專司將感覺訊息彙整成最具完整性的運作原理;然而直到近代神經科學的蓬勃發展,才使得過去無法從生物上去證明的假說得以受到研究與辯論。

-----廣告,請繼續往下閱讀-----

然而神經科學又是如何解釋:為何我們都看到白色的倒三角形,而不是其他各種可能的組合,例如一個白色正三角形周邊圍繞著三個小精靈(Pac-Man),抑或是一個異色六芒星前置於三個黑球?這也許涉及了大腦如何運作的終極大哉問。

大腦很在意外部感覺輸入和內部預期的落差

早在神經科學家能夠記錄神經元的訊號,並且發現大腦內有大量對於視野中移動訊息產生反應的神經元,過去的科學家就已經假設了人腦有偵測物體移動的能力;然而神奇的是,在我們用眼睛掃射周邊的當下並不會產生世界移動了的感覺。赫爾曼.馮.亥姆霍茲(Hermann von Helmholtz)於是推測,眼球運動期間沒有移動知覺,是由於自發眼球運動的訊號抵銷了整個世界在視網膜上產生的移動訊息;相對的,如果我們使用外力推動眼球,整個世界往反方向移動的知覺就會產生。這就是一個用行為實驗推敲大腦運作法則的成功案例。

一年多前,Georg B. Keller 和 Thomas D. Mrsic-Flogel 在這一篇文獻回顧中1清楚闡明了大腦對於外在環境的預測處理可作為解釋多重大腦功能的框架:皮質中負責預測誤差的神經元、負責內部表徵的神經元和其他抑制性的神經元合力組成了一個標準的計算單元

高級動物的大腦皮層是包裹在腦外側的連通皮狀結構,其中各類神經元共同組成標準的計算單元。圖:Wikipedia

-----廣告,請繼續往下閱讀-----

而過去十年間,在小鼠初級視皮層的研究已經產出了許多支持的證據:部分神經元會受到不符合預期的光流(optical flow)大量活化,或者對於不符合預期的視覺刺激而劇烈反應。 而這些個別的結果都正逐步完成預測處理的理論藍圖。

大腦資訊傳播的另一種可能:預測性編碼

起源於計算機領域,預測性編碼(Predictive Coding)在神經系統的應用,是由 Rajesh P. N. Rao和Dana H. Ballard 所提出的2神經系統的連結在適應了外界規則後,會在各個階層比較訊息中沒有被預期的成分,並將這個精簡化的結果向上傳輸。

更且,在這篇論文中,他們利用電腦模擬建立以此前提而連結的多層次神經網絡,在讓這個模型對自然場景進行學習後,他們在初階層級發現的網路節點,與生物學家在視覺皮質中所記錄到的神經元,表現出相似的行為反應,例如對角度與明暗邊界的選擇性。

預測性編碼的優勢在於可以大量減少冗餘的資訊處理,僅僅傳輸跟預期不同的部分,並高效率地應用神經元有限的訊息傳遞量;畢竟自然環境中的信號大部分都是可預期的,而大腦在短暫瞬間可以處理的訊息量卻是有限的。

-----廣告,請繼續往下閱讀-----

預測性編碼的優勢是精簡冗餘的資訊處理,能夠高效率應用神經元的訊息傳遞。圖:Wikipedia

即便過去科學家們經由神經生理紀錄而推理出「前饋(Feedforward)主導神經編碼」,即感覺訊號從周邊系統單向傳輸到大腦初級皮質進行加工;繼而認定感官系統的工作就是在大量冗餘的訊息裡篩選偵測出關鍵的訊息,例如邊界、物件甚至語義的表徵;然而在研究成果推陳出新之後,是時候討論預測性編碼的可能了。

NATURE: 科學家發現關鍵的一塊拼圖

近日,位在加州大學舊金山分校 Massimo Scanziani 的實驗室中,Andreas J. Keller 與其同僚在最富盛名的科學期刊《自然》上發表了一系列驚動感覺神經學界的研究成果3

一切始於 David H. Hubel 和 Torsten Wiesel 在五零年代研究貓的視覺皮質而發現「感受野」(Receptive Field),也就是視覺刺激能激發神經元活性的空間區域;並因此獲得 1981 年諾貝爾生理醫學獎的肯定。自此以後,通過研究從感覺器官一路向大腦傳輸訊息的經典前饋感受野,就成了感覺神經學界的圭臬。傳統經典的神經科學認為大腦的訊息傳播,類似於最早期計算機科學中的類神經網路,控制參數只會從輸入層向輸出層單向傳播,而不會反向傳播。

-----廣告,請繼續往下閱讀-----

然而,這樣一套訊息處理的機制不免陷入對於反饋(Feedback)功能解釋模糊或者冗餘過剩的問題。

在Andreas J. Keller新發表的論文中,作者發現來自高級視覺皮層的反饋,在傳輸到小鼠初級視覺皮層中的興奮性神經元之後會產生另一個從未被找到的反饋感受野。除了在視野部分與前饋感受野互補,反應也相對緩慢;更重要的是,這個反饋感受野和前饋感受野有著拮抗的特徵,也就是神經只會對於其中一方存在時有所反應。因此,反饋感受野使得神經元能夠使用前饋感受野原先所無法偵測的周邊訊息作比較,並向上層報告整個視覺空間中刺激特徵的差異,而這就恰巧是預測性編碼的核心價值。

作者們在實驗方法上使用雙光子鈣成像技術,在頭部固定的清醒小鼠之初級視覺皮層記錄神經活性,並用改變大小的古典光柵視覺刺激(下圖上)來測量前饋感受野;其後再反其道而行地用一個全場光柵,其中一部分被灰色圓形遮蓋而產生反向刺激的方式(下圖下),測量反饋感受野。

圖源:Feedback Generates a Second Receptive Field in Neurons of Visual Cortex

-----廣告,請繼續往下閱讀-----

前饋感受野和反饋感受野在受到均勻刺激時相互拮抗的現象,使其可被視作皮質中負責預測誤差的神經元;而預測性編碼迴路中關鍵的抑制性調節,將可能由其他鄰近的抑制性神經元處理。於是作者使用基因轉殖小鼠的技術標定了帶有三種不同基因的抑制性神經元群集:即小白蛋白(PV),血管活性腸肽(VIP)和生長素抑制因子(SOM);繼而發現反饋感受野只存在於表現出小白蛋白和血管活性腸肽的抑制性神經元中,因此證明表現出生長素抑制因子的抑制性神經元所扮演的拮抗調節腳色。

最後,作者使用抑制性光遺傳學技術(Optogenetics),將對光敏感的離子通道表現在欲控制的神經元上,並使用雷射加以個別操弄,選擇性關閉個別高級視覺區域的活性,繼而證明反饋感受野的訊息傳遞,是源自特定高級視覺區域的反饋而非來自視覺感官的前饋迴路。

總結來說,此研究中應用多種神經科學的新興技術,除了使用神經造影以及電生理紀錄來偵測大腦活性,更應用光遺傳學來操弄大腦活動以達成因果的討論,大大增加了支持證據的可信度。而此篇論文的重要性在於完成了預測性編碼理論的最後一塊關鍵拼圖,將此理論融合到了神經科學界最廣為研究的視覺皮質系統之中,因此將對於未來領域的發展有著革命性的影響力。

作者怎麼從幻想三角形看到未來呢?

回到最初關於 Kanizsa 三角的解釋,Keller 談到:「簡而言之,根據自然圖像的統計數據對我們視覺系統所進行的訓練,大腦的內部表徵是傾向偵測到完整的圖像之間互相受到遮蔽,而非四散的小精靈和銳角圖形。因此,當視覺皮層中的神經元沒有偵測到任何東西出現在前饋感受野時,就會根據周圍的刺激,即反饋感受野中的刺激做出最佳猜測。」

-----廣告,請繼續往下閱讀-----

視覺皮層為大腦皮層中主要負責處理視覺訊息的部分,位於大腦後部的枕葉,圖為其中的初級視皮層、背側流和腹側流。圖:Wikipedia

而在古典的前饋式神經迴路架構之下,視覺皮層中的神經元就像一個個的空間過濾器,針對已存在於視野的部分邊界進行處理,而後經由複雜的周邊連結優先補足倒三角形的虛幻邊緣,才能在高級視覺區域突破雜訊繼而偵測到它的存在。然而這說法卻是有違直覺的;畢竟,我是無法說服自己有看到白色倒三角形的邊界,卻又無法否定它的存在。

「大腦擁有對世界的內部表徵,其最大好處是讓我們可以『預測未來』。不僅可以預期自體運動所造成的後果,更可以預測其他主體的物理屬性與動態。」Keller說道。也許在大腦持續演化的情況下,預知更長遠的未來也不無可能呢!

感謝

之所以有機會為這篇研究撰寫新聞稿,是基於論文作者與筆者私交甚篤而在發表前所分享的內容。預祝他很快就能在瑞士擁有自己的實驗室!

-----廣告,請繼續往下閱讀-----

原始論文

  1. Keller, G. B. & Mrsic-Flogel, T. D. Predictive Processing: A Canonical Cortical Computation. Neuron 100, 424–435 (2018).
  2. Rao, R. P. & Ballard, D. H. Predictive coding in the visual cortex: a functional interpretation of some extra-classical receptive field effects. Nat. Neurosci. 2, 79–87 (1999).
  3. Keller, A.J., Roth, M.M. & Scanziani, M. Feedback generates a second receptive field in neurons of the visual cortex. Nature (2020). https://doi.org/10.1038/s41586-020-2319-4
-----廣告,請繼續往下閱讀-----
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia