而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。
這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。
NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技
其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。
從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。
這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。
此外,聽損與否也可能會影響一個人大腦的結構與功能。美國約翰霍普金斯大學的研究人員 [10],利用「巴的摩爾老化長期研究(Baltimore Longitudinal Study of Aging)」的資料,針對聽損與腦容量的關係進行了一項有趣的研究,他們分析了一群受試者在逐漸老化時,其腦容量的變化。受試者在研究之初,做了聽力評估,接著接受為期長達十年、每年一次的核磁共振檢查。結果顯示,研究開始時就患有聽損的受試者,相較於聽常者,其大腦有較大幅度的萎縮,平均以每年一立方釐米以上的速度流失大腦組織,而這些大腦組織恰好與輕度認知功能退化和早期失智症所表現出的記憶衰退的行為有關 [11]。
Livingston, G., Huntley, J., Sommerlad, A., Ames, D., Ballard, C., Banerjee, S., … & Mukadam, N. (2020). Dementia prevention, intervention, and care: 2020 report of the Lancet Commission. The Lancet, 396(10248), 413-446.
Lin, F. R., Metter, E. J., O’Brien, R. J., Resnick, S. M., Zonderman, A. B., & Ferrucci, L. (2011). Hearing loss and incident dementia. Archives of Neurology, 68(2), 214-220.
Fulton, S. E., Lister, J. J., Bush, A. L. H., Edwards, J. D., & Andel, R. (2015, August). Mechanisms of the hearing–cognition relationship. In Seminars in Hearing (Vol. 36, No. 03, pp. 140-149). Thieme Medical Publishers.
Mishra, S., Stenfelt, S., Lunner, T., Rönnberg, J., & Rudner, M. (2014). Cognitive spare capacity in older adults with hearing loss. Frontiers in Aging Neuroscience, 6, 96.
Mishra, S., Lunner, T., Stenfelt, S., Rönnberg, J., & Rudnera, M. (2013). Visual Information Can Hinder Working Memory Processing of Speech. Journal of Speech, Language, and Hearing Research, 56, 1120-1132.
Glick, H. A., & Sharma, A. (2020). Cortical neuroplasticity and cognitive function in early-stage, mild-moderate hearing loss: evidence of neurocognitive benefit from hearing aid use. Frontiers in Neuroscience, 93.
Lin, F. R., Ferrucci, L., An, Y., Goh, J. O., Doshi, J., Metter, E. J., … & Resnick, S. M. (2014). Association of hearing impairment with brain volume changes in older adults. Neuroimage, 90, 84-92.
Liu, J., Zhang, X., Yu, C., Duan, Y., Zhuo, J., Cui, Y., … & Liu, Y. (2016). Impaired parahippocampus connectivity in mild cognitive impairment and Alzheimer’s disease. Journal of Alzheimer’s Disease, 49(4), 1051-1064.
Steptoe, A., Shankar, A., Demakakos, P., & Wardle, J. (2013). Social isolation, loneliness, and all-cause mortality in older men and women. Proceedings of the National Academy of Sciences, 110(15), 5797-5801.
Maharani, A., Pendleton, N., & Leroi, I. (2019). Hearing impairment, loneliness, social isolation, and cognitive function: Longitudinal analysis using English longitudinal study on ageing. The American Journal of Geriatric Psychiatry, 27(12), 1348-1356.
Lin, F. R., Metter, E. J., O’Brien, R. J., Resnick, S. M., Zonderman, A. B., & Ferrucci, L. (2011). Hearing loss and incident dementia. Archives of Neurology, 68(2), 214-220.
Paciello, F., Pisani, A., Rinaudo, M., Cocco, S., Paludetti, G., Fetoni, A. R., & Grassi, C. (2023). Noise-induced auditory damage affects hippocampus causing memory deficits in a model of early age-related hearing loss. Neurobiology of Disease, 178, 106024.
動物的視覺敏銳度以單位視角週期數(cycles per degree)為測量單位——這個概念剛好可以用剛剛的斑馬條紋來做例子。各位伸出手臂並豎起大拇指,你的指甲大約可以代表一單位視角;以你的手臂為距並涵蓋四周三百六十度的距離範圍來說,各位應該可以在指甲上畫了六十至七十條黑白條紋的情況下,依然辨識得出黑白條紋之間的區別。因此人類視覺敏銳度的單位視角週期數便約為六十至七十;目前的最高紀錄是來自澳洲的楔尾鵰(Aquila audax),牠們的視覺敏銳度之高,單位視角週期數高達一百三十八。