而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。
這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。
NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技
其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。
從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。
這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。
有時候,現代都市的地標排列也會與時鐘般規律的天體運行呈現巧妙的呼應,或許是有意設計的,但多半都是出於偶然。看看曼哈頓島 (Island of Manhattan) 就知道了,這座島位於哈德遜河 (Hudson River) 的河口,對角線往南北方向偏斜;最早有人在此定居時,街道都是隨意開闢的,像大部分的古老城市一樣雜亂無章地發展。這些曲折小路看起來大同小異、難以辨別,讓整個城區儼然成為不斷擴大的迷宮,最後終於根據 1811 年委員會計劃 (Commissioners’ Plan of 1811) 將整座城市的發展方針制定為棋盤式的街道。
芝加哥巨石陣的例子 [圖片來源:Ken Ilio’s Uncommon Photographers]。無論你身在何處,都有機會將你居住的城市化為現代巨石陣,拍下太陽不斷變換推移的運動軌跡,就算是像加拿大安大略省 Vankleek Hill 這樣的小城鎮也不例外。這個小鎮大約位於渥太華 (Ottawa) 和蒙特婁 (Montreal) 的中間,人口只有 2000 人左右。這裡的棋盤式街道往羅盤方位偏斜,大致上平行於從安大略湖 (Lake Ontario) 流入聖羅倫斯灣 (Gulf of Saint Lawrence) 的河流。這樣的角度,就可以在夏至和冬至時正對著太陽了,像這張由 Gabriel Landriault 所拍攝的照片一樣。
-----廣告,請繼續往下閱讀-----
(左) 安大略省 Vankleek Hill 的棋盤式街道,與東西方向約有 20 度的偏斜。(右) 夏至時在 Vankleek Hill 街道上所見的光景 [攝影:Gabriel Landriault]。這張 Vankleek Hill 的照片也顯示出值得注意的一點:Vankleek Hill 的街道只與正東西方向偏斜 20 度左右,而夏至時的太陽會更為偏向北方,所以此時並不是完全正對著街道的。但是在一年之中,總會有一天是完全對準的!