0

3
1

文字

分享

0
3
1

Google 聊天機器人 LaMDA 竟然有了「自我意識」!圖靈測試終於能通過了嗎?人工智慧發展歷史大解密!

PanSci_96
・2023/02/17 ・4733字 ・閱讀時間約 9 分鐘

前陣子不知道各位是否有發漏到一個很科幻的消息,有一名 GOOGLE 工程師勒穆因(Blake Lemoine)上網公布他自己和他協助開發的對話型 AI LaMDA(Language Model for Dialog Applications)之間的對話紀錄。

他宣稱這個 AI 已經具有知覺和自我意識,甚至能對《悲慘世界》有獨到的評論,也略懂禪宗甚至能冥想。震驚的勒穆因形容它就像個 7 – 8 歲的孩子,而且 LaMDA 還明確表達自己是人而非 google 的財產。

難道說 AI 界最知名的圖靈測驗已經被 google 攻克了嗎?

圖靈與模仿遊戲

提起圖靈,大家心中應該會浮現以新世紀福爾摩斯、奇異博士走紅,人稱飾演天才專業戶的班奈狄克·康柏拜區 Benedict Cumberbatch)的臉。

他曾在一部名為《模仿遊戲》的電影中,詮釋了現代電腦科學概念之父艾倫‧圖靈 (Alan Turing) 的傳奇一生。他在二戰時期成功研發出一台能破解德軍密碼的計算機 Bombe ,而後更完成了電腦數學的理論化,在概念發展上仍是無人能出其右,例如他 1936 年提出的通用計算機/圖靈機架構,以及嘗試區隔AI與人的差異的哲學思考:圖靈測驗(Turing Test)。

-----廣告,請繼續往下閱讀-----

圖靈測驗是一個思想實驗,早在 1950 年,第一台商用電腦連個影子都沒有的時代下,圖靈就已經思考到未來「計算機」的智慧表現將可能到達人類難辨真假的程度,具體來說這個思想實驗是如果一台機器能夠透過介面,與不知對面是機器人或是人類的受試者展開對話,而不被辨別出其機器身分,那麼就可稱這台機器具有智慧。

但我們也知道智慧有很多面向跟層次,語言和問題回應都不一定能反應這台機器有無智慧,因此這個思想實驗的有效性也被許多科學家和心理學家質疑。即使如此簡單粗暴的模仿遊戲,至今其實也都沒人能攻克。

等等,你可能會想到,前面提到的 google 工程師勒穆因,他不是已經分不出來對面是機器還是人了嗎?原因很簡單,他自己就是 AI 的開發者而非圖靈測試設定中的不知情受試者,因此根本不能算數,除非 google 拿這個 AI 給不知情民眾作測試。

不過今年 8 / 28 google 已經將這個對話機器人以 AI Test Kitchen 項目開放部分美國人作小規模測試,其中包含了「 Imagine It (想像一下)」,只要你說出一個想像或實際存在的地點,LaMDA 就會嘗試以文字描述,而另一個「List It(列個清單)」,則會幫你摘要分類起你提供的清單內容。最有可能和圖靈測驗有關係的「 Talk About It (你說看看)」項目,可以針對特定主題與使用者進行自由對談。

-----廣告,請繼續往下閱讀-----

搞不好等到這個封閉測試結束後,我們會真的分不清楚現在到底是人還是 AI 在和我們對話,屆時也許就真能達成「通過圖靈測試」這個 AI 里程碑!

未來也許我們會分不清楚是在跟人類還是 AI 說話。圖/envatoelements

真實世界的棋靈王 AlphaGo

其實這已經不是 google 第一次用 AI 震驚世人了,讓我們回到 2016 年的圍棋大賽會場,當時 google 收購的公司 Deepmind 研發的圍棋計算 AI Alpha Go 以四勝一敗擊敗韓國棋王李世石,爾後又於 2017 年三戰全勝當時世界棋王柯潔。

若這場對奕發生在網路上,就像是棋靈王中佐為以 SAI 為化名擊敗塔矢名人,我們是否真的能分辨在電腦對面和你下棋的是 AI 藤原佐為、還是黑嘉嘉呢?

而這樣玄妙的畫面,當年還真的發生了,就在 2016 年末網路棋壇上一個名為 Master 的帳號出現,專挑職業棋士對奕,最後獲得 60 勝 1 和這麼大殺四方的成績。

-----廣告,請繼續往下閱讀-----

而在第 54 局和中國棋聖聶衛平對奕後, Master 首次打出繁體中文「謝謝聶老師」,在第 60 局對上中國的古力九段 Master 更自曝身分,說出自己就是「AlphaGo 的黃博士」。這位黃博士就是打從 2012 就開發出國產圍棋程式 Erica ,爾後被 Deepmind 公司挖角,參與開發 AlphaGo 的台灣資深工程師黃士傑。

不論是讓工程師自己都認知錯亂的 LamDA ,或是在圍棋界痛宰各路棋王的 AlphaGo ,驚嘆之餘,我們更好奇的是,它們是怎麼開發出來的?

人工智慧的起起落落

讓我們來看看歷代電腦科學家們是如何發展出各種人工智慧,一路迎來現在幾乎琴棋詩書樣樣通的黃金時代,我先提醒大家,這過程可不是一帆風順,就像股票一樣起起落落,在 AI 的發展史上,套牢過無數科學家。

人工智慧這概念是在 1956 年提出,就在麥卡錫(John McCarthy)和明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(Claude Shannon)四位 AI 鼻祖與其他六位研究者參與的一個名為「達特茅斯夏季人工智慧研究會」的會議上,這一年也被公認為 AI 元年。

-----廣告,請繼續往下閱讀-----

會議中除了人工智慧這個詞以外,當年這些金頭腦們就已經提出大家現在很熟悉的「自然語言處理」(就是 SIRI 啦)、神經網路等概念,而在這個會議後,正好遇上美蘇冷戰和科技競賽的時代。除了在大家耳熟能詳的阿波羅系列等太空任務上較勁外,兩大強國也投資大量資源在電腦科學上,期待能夠像圖靈當年那樣,開發出扭轉戰局的電腦科技。

而他們也不負所託產出了很多有趣的運用,例如第一個具備學習能力的跳棋程式、或是聊天機器人伊莉莎(Eliza)、醫療診斷系統「MYCIN」。史丹佛大學(Standord University)甚至就從那時開始研發現在很夯的汽車自動駕駛技術。

冷戰的科技競賽讓 AI 迅速發展,不過其發展過程仍遇到許多問題。圖/envatoelements

然而到了 70 年代初期,AI 的發展開始遭遇許多瓶頸,主要是研究者們慢慢發現,即使他們開發的AI 已經擁有簡單的邏輯與推理能力,甚至一定程度的學習能力,但仍離所謂智慧和判斷能力差太遠,使得當時的 AI 甚至被批評為只能解決所謂的「玩具問題(Toy Problem)」。

也因為能解決的問題太有限,也導致出資的英美政府失去了信心, AI 研究領域迎來了第一次寒冬。但這並非當時的科學家能力不足,而是他們生錯了時代,例如我們現在都經常聽到的「類神經網路」就是前述的 AI 鼻祖明斯基提出的。

-----廣告,請繼續往下閱讀-----

就像仿生獸的創造者一樣,他想從大自然中找答案,而既然要探索智慧,明斯基就直接模仿人類腦細胞,做出第一台神經網路學習機,但當年受限於電腦硬體效能和可用的資料不足,使類神經網路沒有辦法像現在一樣揚名立萬。

在寒冬之中,另一位大神麥卡錫認為追求智慧和思考是緣木求魚,不如利用機器比我們還強大的優勢邏輯與運算,來幫我們解決問題就好,因此演進出「專家系統」這條路線,帶來人工智慧的復興。

專家系統的本質就是把所有參數和結果塞進去,用搜索和運算的方式來回答問題,這種人工智慧特別適合解決一些有明確答案的專業問題,所以被稱為專家系統,例如醫生針對已知病徵開立處方用藥,或是法律相關問題。

隨著電腦運算效能的大提升,專家系統在復興之路上有不少發揮和成果,但很快又遇到下一個瓶頸,即是「專家系統無法面對新問題」,例如即使能將開處方籤這件事自動化,但卻沒有辦法對應新疾病例如 COVID – 19,或是還沒來得及輸入資料庫的新型藥品,離取代醫生太遠了。

-----廣告,請繼續往下閱讀-----

於是就像景氣循環一樣,大量投資的熱錢又開始泡沫化,人工智慧迎來了第二次寒冬,許多電腦科學家甚至改自稱自己在做自動化設計或最佳化系統等等來掩人耳目,避免被唱衰。

這概念非常合理,可惜受限於當時電腦硬體能力和資料量,因此原型機能解決問題的速度還不如傳統統計方式,但隨著電晶體的高速發展,以及網路世代帶來海量資料,類神經網路這門技藝開始文藝復興。

1984 年,美國普林斯頓大學的物理學家和神經學家霍普菲爾德(John Hopfield)用模擬集成電路(linear integrated circuit)完成了新的類神經網路模型,而雲端運算、大量資料讓科學家可以輕易的餵養資料訓練模型,更能夠增加更多「隱含層」讓運算更複雜,這種「深度學習技術」,讓人工智慧的第二次寒冬看見暖陽。

從李飛飛推出的 ImageNet 年度競賽開始,演化到 google 的 alphaGo , AI 開始能夠認得圖像上的物件,甚至攻克本來被認為不可能攻克的圍棋領域。何會說圍棋曾被認為不可能被攻克呢?因為每一盤圍棋的複雜度可是高達 10 的 172 次方,比現在已知的宇宙原子數量還多,因此圍棋界才有「千股無同局」之說。

-----廣告,請繼續往下閱讀-----

相較起來 1997 年 IBM 的深藍攻克的西洋棋複雜度僅有 10 的 46 次方,但也動用了 30 台電腦加裝 480 加速運算晶片,基本上就有如火鳳燎原中八奇思維的「我知道你的下一步的下一步」,當年深藍每一次下棋可是都暴力計算到了後面 12 步的發展,才打敗西洋棋世界冠軍卡斯帕羅夫。

圍棋的複雜度高達 10 的 172 次方,讓其有著「千股無同局」的說法。圖/wikipedia

AlphaGo 到底是怎麼算出這麼複雜的圍棋呢,難道它比深藍還厲害,能像是奇異博士雖然能透過時間寶石演算出一千四百多萬種平行宇宙的可能性才落子嗎?

這就要提到 Deepmind 公司非常有趣的洞見,那就是真正的智慧是捨棄那些無須多想、壓根不可能成功的可能性。 google 工程師使用了一種叫做蒙地卡羅樹搜尋的方式一方面讓 alpha go 大量隨機生成類神經網路參數和層數,二方面讓它快速搜尋並略過「不需要運算的路徑」。

這其實是我們日常生活中很熟悉的現象 ——人腦的「捷思」,也就是直接專注於我們要解決的問題,忽略周遭的雜訊或多餘的想法。而類神經網路的設計思維是尋求最佳解而非唯一解,即使是 Alpha go 也會下錯棋,也曾輸給李世石,但關鍵是能夠在有限的資訊和時間中得到答案。

除了下出神之一手以外,Alpha go 這樣的 AI 能做的事情還多著, Deepmind 用 AlphaGo 打遍天下無敵手後宣布讓 AlphoGo 退休,後續將這套技術拿去學玩貪食蛇,打星海爭霸,展現出超越電競選手的技巧,現在甚至能預測蛋白質結構,或比醫生更精準地判定乳癌。

GOOGLE 工程師讓 alpha go 快速搜尋並略過「不需要運算的路徑」,就如同「人類的捷思」一樣。圖/envatoelements

人類的最後堡壘陷落了嗎?

最後我們回到一開始的問題,實用化的 LaMDA 究竟有沒有可能通過圖靈測試呢?

即使目前 google 仍強烈否認 LaMDA 具有知覺,而勒穆因也因涉嫌洩漏商業機密被停職。英國謝菲爾德大學機器人學院教授羅傑‧摩爾澄清這個AI背後的算法體系只是「詞序建模」(world sequence modelling)而非「語言建模」(language modeling)。

他強調對答如流的 LaMDA ,會給你他有人格的感覺只是錯覺。但最新的應用中,google 找來了 13 個作家,測試以 LaMDA 為基礎開發的寫作協助工具LaMDA Wordcraft。運作上有點像手機輸入法的關聯字詞推薦概念,但它的設計完全是為了文字創作者而生,利用整個網際網路中的文字,它彷彿擁有了類似榮格「集體潛意識」的能力,當小說家起了一個頭,它就能開始推薦下一個單詞甚至一整個句子補完,甚至還能調整生成文字的風格,例如有趣或憂鬱,這些應用聽起來簡直像是科幻小說。

有些作家甚至可以使用 AI 來創作小說。圖/envatoelements

奇妙的是,參與測試的作家之一正是曾翻譯《三體》英文版並寫出《摺紙動物園》的科幻小說家劉宇昆,他形容這個工具讓他數次突破「創作瓶頸」,節約了自己的腦容量,專注於創作故事更重要的東西。

更驚人的是,他提到有一次他連開頭的靈感都沒有,因此他把「創作的主動權」交給了 LaMDA ,並從中看到了從未想過的可能性,有了繼續寫下去的新寫作靈感。儼然就像當年 Alpha Go 下出一些人類棋譜中從沒想過的棋路一樣,有了「洞見」。

到了這個地步,你仍能堅持 AI 只是我們拿來「解決問題」的工具,而不具備一定程度對人文的認知或智慧嗎?

-----廣告,請繼續往下閱讀-----
文章難易度
PanSci_96
1265 篇文章 ・ 2620 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

0
0

文字

分享

0
0
0
停工即停薪:如何證明你的時間值多少?車禍背後的認知 x 情緒 x 金錢 x 法律大混戰
鳥苷三磷酸 (PanSci Promo)_96
・2026/01/09 ・3286字 ・閱讀時間約 6 分鐘

本文與 PAMO車禍線上律師 合作,泛科學企劃執行

走在台灣的街頭,你是否發現馬路變得越來越「急躁」?滿街穿梭的外送員、分秒必爭的多元計程車,為了拚單量與獎金,每個人都在跟時間賽跑 。與此同時,拜經濟發展所賜,路上的豪車也變多了 。

這場關於速度與金錢的博弈,讓車禍不再只是一場意外,更是一場複雜的經濟算計。PAMO 車禍線上律師施尚宏律師在接受《思想實驗室 video podcast》訪談時指出,我們正處於一個交通生態的轉折點,當「把車當生財工具」的職業駕駛,撞上了「將車視為珍貴資產」的豪車車主,傳統的理賠邏輯往往會失靈 。

在「停工即停薪」(有跑才有錢,沒跑就沒收入)的零工經濟時代,如果運氣不好遇上車禍,我們該如何證明自己的時間價值?又該如何在保險無法覆蓋的灰色地帶中全身而退?

-----廣告,請繼續往下閱讀-----
如果運氣不好遇上車禍,我們該如何證明自己的時間價值?/ 圖片來源: Nano Banana

薪資證明的難題:零工經濟者的「隱形損失」

過去處理車禍理賠,邏輯相對單純:拿出公司的薪資單或扣繳憑單,計算這幾個月的平均薪資,就能算出因傷停工的「薪資損失」。

但在零工經濟時代,這套邏輯卡關了!施尚宏律師指出,許多外送員、自由接案者或是工地打工者,他們的收入往往是領現金,或者分散在多個不同的 App 平台中 。更麻煩的是,零工經濟的特性是「高度變動」,上個月可能拚了 7 萬,這個月休息可能只有 0 元,導致「平均收入」難以定義 。

這時候,律師的角色就不只是法條的背誦者,更像是一名「翻譯」。

施律師解釋「PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』,轉譯成法官或保險公司聽得懂的法律語言。」 這包括將不同平台(如 Uber、台灣大車隊)的流水帳整合,或是找出過往的接單紀錄來證明當事人的「勞動能力」。即使當下沒有收入(例如學生開學期間),只要能證明過往的接單能力與紀錄,在談判桌上就有籌碼要求合理的「勞動力減損賠償 」。

-----廣告,請繼續往下閱讀-----
PAMO車禍線上律師的工作是把外送員口中零散的『跑單損失』,轉譯成法官或保險公司聽得懂的法律語言 / 圖片來源: Nano Banana

300 萬張罰單背後的僥倖:你的直覺,正在害死你

根據警政署統計,台灣交通違規的第一名常年是「違規停車」,一年可以開出約 300 萬張罰單 。這龐大的數字背後,藏著兩個台灣駕駛人最容易誤判的「直覺陷阱」。

陷阱 A:我在紅線違停,人還在車上,沒撞到也要負責? 許多人認為:「我人就在車上,車子也沒動,甚至是熄火狀態。結果一台機車為了閃避我,自己操作不當摔倒了,這關我什麼事?」

施律師警告,這是一個致命的陷阱。「人在車上」或「車子沒動」在法律上並不是免死金牌 。法律看重的是「因果關係」。只要你的違停行為阻礙了視線或壓縮了車道,導致後方車輛必須閃避而發生事故,你就可能必須背負民事賠償責任,甚至揹上「過失傷害」的刑責 。 

數據會說話: 台灣每年約有 700 件車禍是直接因違規停車導致的 。這 300 萬張罰單背後的僥倖心態,其巨大的代價可能是人命。

-----廣告,請繼續往下閱讀-----

陷阱 B:變換車道沒擦撞,對方自己嚇到摔車也算我的? 另一個常年霸榜的肇事原因是「變換車道不當」 。如果你切換車道時,後方騎士因為嚇到而摔車,但你感覺車身「沒震動、沒碰撞」,能不能直接開走?

答案是:絕對不行。

施律師強調,車禍不以「碰撞」為前提 。只要你的駕駛行為與對方的事故有因果關係,你若直接離開現場,在法律上就構成了「肇事逃逸」。這是一條公訴罪,後果遠比你想像的嚴重。正確的做法永遠是:停下來報警,釐清責任,並保留行車記錄器自保 。

正確的做法永遠是:停下來報警,釐清責任,並保留行車記錄器自保 。/ 圖片來源: Nano Banana

保險不夠賠?豪車時代的「超額算計」

另一個現代駕駛的惡夢,是撞到豪車。這不僅是因為修車費貴,更因為衍生出的「代步費用」驚人。

-----廣告,請繼續往下閱讀-----

施律師舉例,過去撞到車,只要把車修好就沒事。但現在如果撞到一台 BMW 320,車主可能會主張修車的 8 天期間,他需要租一台同等級的 BMW 320 來代步 。以一天租金 4000 元計算,光是代步費就多了 3 萬多塊 。這時候,一般人會發現「全險」竟然不夠用。為什麼?

因為保險公司承擔的是「合理的賠償責任」,他們有內部的數據庫,只願意賠償一般行情的修車費或代步費 。但對方車主可能不這麼想,為了拿到這筆額外的錢,對方可能會採取「以刑逼民」的策略:提告過失傷害,利用刑事訴訟的壓力(背上前科的恐懼),迫使你自掏腰包補足保險公司不願賠償的差額 。

這就是為什麼在全險之外,駕駛人仍需要懂得談判策略,或考慮尋求律師協助,在保險公司與對方的漫天喊價之間,找到一個停損點 。

談判桌的最佳姿態:「溫柔而堅定」最有效?

除了有單據的財損,車禍中最難談判的往往是「精神慰撫金」。施律師直言,這在法律上沒有公式,甚至有點像「開獎」,高度依賴法官的自由心證 。

-----廣告,請繼續往下閱讀-----

雖然保險公司內部有一套簡單的算法(例如醫療費用的 2 到 5 倍),但到了法院,法官會考量雙方的社會地位、傷勢嚴重程度 。在缺乏標準公式的情況下,正確的「態度」能幫您起到加分效果。

施律師建議,在談判桌上最好的姿態是「溫柔而堅定」。有些人會試圖「扮窮」或「裝兇」,這通常會有反效果。特別是面對看過無數案件的保險理賠員,裝兇只會讓對方心裡想著:「進了法院我保證你一毛都拿不到,準備看你笑話」。

相反地,如果你能客氣地溝通,但手中握有完整的接單紀錄、醫療單據,清楚知道自己的底線與權益,這種「堅定」反而能讓談判對手買單,甚至在證明不足的情況下(如外送員的開學期間收入),更願意採信你的主張 。

車禍不只是一場意外,它是認知、情緒、金錢與法律邏輯的總和 。

在這個交通環境日益複雜的時代,無論你是為了生計奔波的職業駕駛,還是天天上路的通勤族,光靠保險或許已經不夠。大部分的車禍其實都是小案子,可能只是賠償 2000 元的輕微擦撞,或是責任不明的糾紛。為了這點錢,要花幾萬塊請律師打官司絕對「不划算」。但當事人往往會因為資訊落差,恐懼於「會不會被告肇逃?」、「會不會留案底?」、「賠償多少才合理?」而整夜睡不著覺 。

-----廣告,請繼續往下閱讀-----

PAMO看準了這個「焦慮商機」, 推出了一種顛覆傳統的解決方案——「年費 1200 元的訂閱制法律服務 」。

這就像是「法律界的 Netflix」或「汽車強制險」的概念。PAMO 的核心邏輯不是「代打」,而是「賦能」。不同於傳統律師收費高昂,PAMO 提倡的是「大腦武裝」,當車禍發生時,線上律師團提供策略,教你怎麼做筆錄、怎麼蒐證、怎麼判斷對方開價合不合理等。

施律師表示,他們的目標是讓客戶在面對不確定的風險時,背後有個軍師,能安心地睡個好覺 。平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略 。

平時保留好收入證明、發生事故時懂得不亂說話、與各方談判時掌握對應策略 。 / 圖片來源: Nano Banana

從違停的陷阱到訂閱制的解方,我們正處於交通與法律的轉型期。未來,挑戰將更加嚴峻。

-----廣告,請繼續往下閱讀-----

當 AI 與自駕車(Level 4/5)真正上路,一旦發生事故,責任主體將從「駕駛人」轉向「車廠」或「演算法系統」 。屆時,誰該負責?怎麼舉證?

但在那天來臨之前,面對馬路上的豪車、零工騎士與法律陷阱,你選擇相信運氣,還是相信策略? 先「武裝好自己的大腦」,或許才是現代駕駛人最明智的保險。

PAMO車禍線上律師官網:https://pse.is/8juv6k 

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
242 篇文章 ・ 318 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
0

文字

分享

0
0
0
人工智慧的極限
賴昭正_96
・2026/01/15 ・5792字 ・閱讀時間約 12 分鐘

在發現的道路上,智慧(intellect)作用不大。意識(consciousness)━你可以稱之為直覺或其它任何你想用的詞━會發生一次飛躍,答案會突然出現在你面前,而你卻不知道它是如何或為什麼出現的。

-愛因斯坦(1879-1955),1921年諾貝爾物理獎

2025 年 10 月 13 日在參加建國中學高三 6 班畢業 66 週年的同學旅遊後,希望能瞭解一下投稿多年、從未謀面之《泛科學》的作業情形及發展計畫等,我決定到「泛科創新股份有限公司」參觀一下:沒想到知識長鄭國威竟然邀請我錄了一集「思想實驗室」。當被問及有關人工智慧(artificial intelligence,AI)的看法時,我突然冒出「因為科學的發現很多都是意外的,因此AI無法像人類一樣具有創造性」。沒想到這句話似乎成為這次訪問的主題,也引起比較熱烈的討論,因此我想在這裡補充一下。

AI(人工智慧)是否能青出於藍、更勝於藍地超越我們?這事實上也是專家爭論最多的話題。我不是專家,雖然知道「我思故我在」,但完全不知人類如何思想、大腦如何運作,更不瞭解上面愛因斯坦所提到之意識(consciousness)如何飛躍!但是已經被國威推上了這個平台,因此只好在這裡野人獻曝,依我所知的科學史提出懷疑。

回歸正題,上面問題的直覺反應答案是:人製造出來的怎麼可能比人聰明呢?但相信很多人都知道:人類所製造出來的圍棋軟體 AlphaGo 已經戰勝了所有的人類!其主人谷歌(Google)謂:它能戰勝人類是因為它利用策略網絡來推薦有希望的走法,並利用價值網絡來評估在給定局面下獲勝的機率,從而大幅縮小搜尋空間,使得它能夠「預想」數百萬步棋,並透過自身的對弈不斷學習,最終超越人類的層次。從這段話看來,我覺得 AlphaGo 能戰勝人類是基於高速地使用人類所設計出來之有路可循、亦有跡可尋的「邏輯策略」!

同樣地,如果我們給 AI 一含所有物質之性質的資料庫,然後告訴它如何尋找「規律」(pattern),相信它會非常勝任地發現許多具有某種特性的「新物質」、「新藥物」、甚或告訴我們如何製造它們(有機合成的資料庫)。但是 AI 雖然知道哈密瓜的所有性質(資料庫),可是它會想到哈密瓜含有能大量分泌青黴素的菌株、即時在第二次世界大戰中拯救了上百萬士兵的生命嗎(見後)?我覺得後者不是邏輯的問題,是沒辦法訓練的,因此 AI 不能「真正創造」不是依靠邏輯的發現。這正是本文所要談的:許多科學大突破都不是靠訓練或邏輯分析的!

-----廣告,請繼續往下閱讀-----

視眾人所見視,思眾人所未思

牛頓的傳記《艾薩克·牛頓爵士生平回憶錄》(Memoirs of Sir Isaac Newton’s Life)於1752年出版;作者斯圖克利(William Stukeley)在書中轉述:「晚餐後,天氣溫暖,我們去了花園,在幾棵蘋果樹的樹蔭下喝茶……他(牛頓)告訴我,他當時的處境和以前一樣,剛剛想到萬有引力的概念。當他正沉思時,一個蘋果掉了下來。他心想:『為什麼蘋果總是垂直落到地上,永遠不會向上或向一側掉落呢?……』,這使他得出結論:地球一定具有『引力』,從而發展出他的萬有引力理論。」

早在西元前 4 世紀左右,亞里斯多德(Aristotle)及歐幾里德(Euclid)等希臘哲學家就為自然哲學和邏輯奠定了基礎。樹上的水果都是往地面掉,這是任何小孩都知道的「常識」,但為什麼卻等了 1700 年才引起牛頓的注意?我們不知道為何牛頓會想到這個問題,但 AI 也會注意到這個現象嗎?如果會,它會先想到萬有引力或是直接跳到更精確的愛因斯坦廣義相對論(見後)呢? 

發現世上第一個抗生素的弗萊明(Alexander Fleming)度假回來後發現培養皿因未加蓋而發霉(見後),一般的研究者大多會將這些被黴菌孢子污染的培養皿丟掉;但弗萊明這次卻心血來潮……。他回憶說:

「基於先前「溶菌酶」的經驗,也像許多細菌學家那樣,我應該會把污染的培養皿丟掉,……某些細菌學家也有可能(早就)注意到我(那時)看到的相似變化,……但是在對天然產生的抗菌物質沒有任何興趣的情況下,都會順手地將培養物丟棄。……但(這次)我沒有找個藉口丟掉受污染的培養液;相反地,我做了進一步的探討。」

如果AI也能做實驗,它會像許多細菌學家那樣「順手地」丟棄培養物嗎?機會總是降臨在那些做好準備的「人」身上。

-----廣告,請繼續往下閱讀-----

幸運的靈感/直覺

一位正在自由下落的人不會感覺到自己的重量,那不是等於漂浮在沒有任何重力的外太空空間嗎?如果加速度可以抵消重力,那麼在沒有重力的情況下,加速度本身不是可以模擬重力,產生與真實重力沒有區別的人造重力嗎?愛因斯坦稱上面這一發現為「等效原理」(Equivalence Principle):我們雖然不知道重力是什麼,但其現象可以用加速度來模擬!這一想法啟動了愛因斯坦嘗試改變牛頓重力論的八年艱苦抗戰,於 1915 年 11 月完成了人類有史以來最美麗的物理理論━「廣義相對論」(General Theory of Relativity)。100 多年後的今天,愛因斯坦這一透過想像力來推測的理論仍然在指引著物理學家們去瞭解宇宙的基本特徵!怪不得愛因斯坦後來大膽地稱它為「我一生中最幸運的靈感」。

德國理論物理學家普朗克 (Max Planck) 謂他是靠「幸運的直覺 (lucky intuition) 」而意外地敲響了量子力學革命之鐘聲!在 1918 年諾貝爾獎頒獎典禮上,普朗克回憶說:

「然而,即使(我推導出來的)輻射公式絕對準確,它仍然只是一個幸運猜測(lucky guess)了正確插值公式的結果,其價值是非常有限的。因為這個原因,從那時起,我就忙著… 想闡明此公式的真實物理特性,這導致我考慮連接熵和概率之間的波茲曼(Boltzmann)關係。在經過我生命中最艱苦的幾個星期之工作後,光明終於驅除了黑暗,一個新的、從未夢想到的的觀點在我面前展開了。」

這普朗克從未夢想到的觀點是什麼呢? 就是「能量量化」的觀念,違反了當時「能量是連續」的共識!因之此後的十幾年,普朗克便一直在努力地想使他的量子觀念能容於古典力學裡;可是每次嘗試的結果,似乎均使自己失望得想收回那革命性的「大膽假設」而已。

錯誤的假設

好吧,就假設 AI 像愛因斯坦一樣也有「最幸運的靈感」,發現了廣義相對論。可是後來物理學家瞭解到了愛因斯坦的「等效定理」事實上不完全正確,是有限制的,也就是說它只是一種近似的基本定律,只適用於一個局部、無限小的時空區域內。哈,如果AI比人類聰明,怎麼會在邏輯上犯下這個錯誤呢?如果不犯這個錯誤,它能發現廣義相對論呢?

-----廣告,請繼續往下閱讀-----

又如 1905 年,愛因斯坦在題為「關於運動物體的電動力學」的(狹義相對論)論文引言裡,開宗明義地謂「不要爭辯」光速了:

「我們建議將「相對性原理」這個猜想(conjecture)提升到一個公設(postulate)的地位,並引入另一個表面上與前者不調和(irreconcilable)的公設,即光是在真空中的傳播速率為一與發射體運動狀態無關的定值 c。 這兩個假設足以(讓我們)透過適用於靜止物體(狀態)之馬克斯威(Maxwell)理論,導出一個簡單且不矛盾(consistent)的電動力學理論。」

愛因斯坦真大膽:一個可以用實驗來確定的光速,怎麼可以定為「公設」呢?光速與發射體運動狀態無關不是完全違反了我們日常生活的經驗(如聲速)嗎?愛因斯坦在其時鐘「同步程序」的假想實驗裡魔術般地導入了他的公設:光在任何方向的速度都是一樣的 c 值!完全忽略了當時幾乎所有物理學家都相信光是在「以太」中傳播的理論。

1924 年,一位名不見經傳,任教於東巴基斯坦的講師波思 (Styendra Bose) 在一篇 1500 字的論文裡做了一個誤打誤撞、連他自己本人都不知道、在整篇論文中隻字未提的重要及創新性假設:光量子是不可分辨的!在當時,所有的物理學家都認為光量子像銅板一樣是可以分辨的(我們可以分辨哪個是 A 銅板、哪個是 B 銅板、…),因此兩個銅板出現「一正及一反」的或然率是 2/4;但如果它們不能分辨呢?則出現「一正及一反」的或然率將變成 1/3。沒想到這一「錯誤」的假設後來竟成為打開量子統計力學的鑰匙!超強邏輯的AI會犯這種錯誤嗎?

愛因斯坦1915年完成他的廣義相對論後,發現他的方程式所預測的宇宙只能膨脹或收縮,與當時大部分科學家所認為的靜態宇宙觀相衝突!沒想到推翻了深植物理學家心中達兩百多年之牛頓時空觀念的革命壯士,竟然在這裡屈服了:為了符合當時的想法,愛因斯坦於1917年強行地於其廣義相對論導出之宇宙觀中加入一「常數」來平衡萬有引力,使他的宇宙能保持靜態!沒想到1929年後,新數據顯示宇宙不是靜態,而是在膨脹中;愛因斯坦因而後悔當初為何不相信自己的推論,稱那強行加入人為常數━「宇宙論常數」(cosmological constant)━為他一生中所犯之「最大錯誤」。AI會犯這種錯誤嗎?

-----廣告,請繼續往下閱讀-----

只有萬有引力的宇宙膨脹速率在一段時間後應該慢慢減小;但90年代末期,新的發現顯示現在宇宙膨脹速率不是隨時間減小、而是在加大!沒想到那錯誤的「宇宙論常數」現在竟然成為提供瞭解釋膨脹速率加快所需之排斥力來源─雖然我們還不知道那是啥!當然,我們也不知道愛因斯坦在天之靈是否還認為「宇宙論常數」是他一生中所犯的最大錯誤?而AI如果當初未犯那「最大錯誤」,現在是否反而會後悔呢?

老天的幫忙

硝化甘油為液體,非常不穩定,一不小心就爆炸;因此諾貝爾 (Alfred Nobel)一直在尋找取代物,但久而不得。傳說有一天儲存的硝化甘油意外泄漏,與用來包裝儲存鐵桶之板狀矽藻土混合但未爆炸,使他想到了試用此板狀矽藻土。經實驗後,他發現兩者相混之固體不但安全可靠,而且還可保持原有之爆炸威力─這不正是他夢寐以求、研究甚久而未能找到的「穩定炸藥」嗎?他因此發了大財,設定了今日大家所知道的諾貝爾獎。

在「發現能治療糖尿病的胰島素—胰島素與生技產業的誕生(上)」一文裡,我提到了「….將狗的胰臟割除,發現這隻可憐狗整天口渴及隨地小便。數日後,一位助手覺得實驗室內的蒼蠅好像突然多了起來,尤其是在狗小便過的地板。分析狗尿及其血液後,梅倫(Joseph von Mering)及明考斯基(Oskar Minkowski)很驚奇地發現裡面充滿了糖份。」顯然地,胰腺具有調解體內糖代謝的功能,它一旦受損將導致糖尿病。就這樣,法國兩位外科手術醫生無意中發現了「困擾」人類三千多年之糖尿病的病源━胰臟分泌物「胰島素」失調!這不是透過邏輯分析得到的結果,AI能做到嗎? 

前面所提到之蘇格蘭醫生兼微生物學家弗萊明是一位粗心的實驗室技術員。1928 年夏在研究葡萄球菌的某一天,他忘了將含有葡萄球菌培養物的培養皿放在培養箱中,留在實驗室工作台上就匆匆忙忙地離開實驗室去度假。命運就是這樣作弄人:那時室內的溫度及濕度均適合霉菌(mold,或譯「黴菌」)的生長;因此兩個禮拜回來後,弗萊明發現在敞開窗戶旁的培養皿因未加蓋而發霉。經細心觀察及研究後,弗萊明發現抑制或預防細菌生長的不是黴菌本身,而是黴菌產生的「黴汁」。就這樣,弗萊明發現了世上第一個抗生素「盤尼西林」(Penicillin,又稱為「青黴素」)!被《時代》雜誌評選為20世紀的100位最重要人物!

-----廣告,請繼續往下閱讀-----

1943年的某一天,在伊利諾州皮奧里亞 (Peoria) 的農業部北部區域研究實驗室 (NRRL) 工作的亨特 (Mary Hunt) ,無意中在一雜貨店裡發現了一顆表皮長滿漂亮及金色青黴的哈密瓜。將它帶回實驗室,篩選出能大量分泌青黴素的菌株後,她發現該菌株產生的青黴素數量是notatum的200倍━她因之贏得「發霉瑪麗 (Moldy Mary)」的綽號。在許多研究團隊紛紛加入菌種及製造方法的改良後,青黴素產量由1943年只能醫治不到1000人,一下子跳到1944年時,已有足夠的青黴素來治療每位需要的士兵,為第二次世界大戰提供了功不可沒的貢獻!也啓動了尋找其它抗生素的研究,開創了醫學的新紀元。

結論

上面我們提到科學家意外地發現了穩定的炸藥、控制血糖的胰島素、及治療特定細菌感染的抗生素。這些化合物都已經存在自然界中,但絕對不是邏輯分析可以發現其功能的,因此如果不是「老天的幫忙」,我實在很難理解AI怎麼會想到?事實上靠「老天幫忙」所發現的化學物是非常之多的。不需要靠老天幫忙的理論物理呢?

在討論牛頓「思眾人所未思」地發現萬有引力、開創了古典物理後,我們其它的討論都是針對全面改變我們日常生活之近代物理━量子力學及相對論━的發現史。希望讀完本文後,讀者能體會到科學進步不但鮮少一帆風順,相反地是一條充滿了意想不到之彎路和迷茫時刻的曲折蜿蜒旅程:這正是我在訪談中所提到的要多看「課外書」,鑑古知今瞭解理論背後歷史有助於瞭解理論本身。也希望讀完本文後,讀者能感受到科學上的突破幾乎全不是源自邏輯分析,而是出自無法捕捉的「靈感」、「直覺」、「錯誤假設」,「老天幫忙」、以及挑戰既有認知的「勇氣」。AI具有這些人性「缺點」嗎?

最後讓我們在此以公認為最偉大之兩位物理學家的話來結束。牛頓說:「沒有大膽的猜測,就沒有偉大的發現」;愛因斯坦謂:「我從未通過理性思考的過程取得任何發現」。

-----廣告,請繼續往下閱讀-----

致謝

謹在此感謝《泛科學》鄭國威、曹盛威、謝富丞、廖儀瑄、王喆宣等同仁的招待及讓我有機會當了一次近代科技 Podcast 的明星。Podcast 的出現造就了許多不需要經過好萊塢的影視明星以及網紅,是我首次接觸到之近代日常生活典範的另一個重大轉變,真是活到老學到老。

延伸閱讀

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

賴昭正_96
50 篇文章 ・ 61 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此獲有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪,IBM顧問研究化學家退休 。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲它轉載我的科學月刊上的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」。

0

1
0

文字

分享

0
1
0
解密機器人如何學會思考、觸摸與變形
鳥苷三磷酸 (PanSci Promo)_96
・2025/09/09 ・6820字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

本文與 Perplexity 合作,泛科學企劃執行

「Hello. I am… a robot.」

在我們的記憶裡,機器人的聲音就該是冰冷、單調,不帶一絲情感 。它們的動作僵硬,肢體不協調,像一個沒有靈魂的傀儡,甚至啟發我們創造了機械舞來模仿那獨特的笨拙可愛。但是,現今的機器人發展不再只會跳舞或模仿人聲,而是已經能獨立完成一場膽囊切除手術。

就在2025年,美國一間實驗室發表了一項成果:一台名為「SRT-H」的機器人(階層式手術機器人Transformer),在沒有人類醫師介入的情況下,成功自主完成了一場完整的豬膽囊切除手術。SRT-H 正是靠著從錯誤中學習的能力,最終在八個不同的離體膽囊上,達成了 100% 的自主手術成功率。

-----廣告,請繼續往下閱讀-----

這項成就的意義重大,因為過去機器人手術的自動化,大多集中在像是縫合這樣的單一「任務」上。然而,這一場完整的手術,是一個包含數十個步驟、需要連貫策略與動態調整的複雜「程序」。這是機器人首次在包含 17 個步驟的完整膽囊切除術中,實現了「步驟層次的自主性」。

這就引出了一個讓我們既興奮又不安的核心問題:我們究竟錯過了什麼?機器人是如何在我們看不見的角落,悄悄完成了從「機械傀儡」到「外科醫生」的驚人演化?

這趟思想探險,將為你解密 SRT-H 以及其他五款同樣具備革命性突破的機器人。你將看到,它們正以前所未有的方式,發展出生物般的觸覺、理解複雜指令、學會團隊合作,甚至開始自我修復與演化,成為一種真正的「準生命體」 。

所以,你準備好迎接這個機器人的新紀元了嗎?

-----廣告,請繼續往下閱讀-----

只靠模仿還不夠?手術機器人還需要學會「犯錯」與「糾正」

那麼,SRT-H 這位機器人的外科大腦,究竟藏著什麼秘密?答案就在它創新的「階層式框架」設計裡 。

你可以想像,SRT-H 的腦中,住著一個分工明確的兩人團隊,就像是漫畫界的傳奇師徒—黑傑克與皮諾可 。

  • 第一位,是動口不動手的總指揮「黑傑克」: 它不下達具體的動作指令,而是在更高維度的「語言空間」中進行策略規劃 。它發出的命令,是像「抓住膽管」或「放置止血夾」這樣的高層次任務指令 。
  • 第二位,是靈巧的助手「皮諾可」: 它負責接收黑傑克的語言指令,並將這些抽象的命令,轉化為機器手臂毫釐不差的精準運動軌跡 。

但最厲害的還不是這個分工,而是它們的學習方式。SRT-H 研究團隊收集了 17 個小時、共 16,000 條由人類專家操作示範的軌跡數據來訓練它 。但這還只是開始,研究人員在訓練過程中,會刻意讓它犯錯,並向它示範如何從抓取失敗、角度不佳等糟糕的狀態中恢復過來 。這種獨特的訓練方法,被稱為「糾正性示範」 。

SRT-H 研究團隊收集了 17 個小時、共 16,000 條由人類專家操作示範的軌跡數據來訓練它 。 / 圖片來源:shutterstock

這項訓練,讓 SRT-H 學會了一項外科手術中最關鍵的技能:當它發現執行搞砸了,它能即時識別偏差,並發出如「重試抓取」或「向左調整」等「糾正性指令」 。這套內建的錯誤恢復機制至關重要。當研究人員拿掉這個糾正能力後,機器人在遇到困難時,要不是完全失敗,就是陷入無效的重複行為中 。

-----廣告,請繼續往下閱讀-----

正是靠著這種從錯誤中學習、自我修正的能力,SRT-H 最終在八次不同的手術中,達成了 100% 的自主手術成功率 。

SRT-H 證明了機器人開始學會「思考」與「糾錯」。但一個聰明的大腦,足以應付更混亂、更無法預測的真實世界嗎?例如在亞馬遜的倉庫裡,機器人不只需要思考,更需要實際「會做事」。

要能精準地與環境互動,光靠視覺或聽覺是不夠的。為了讓機器人能直接接觸並處理日常生活中各式各樣的物體,它就必須擁有生物般的「觸覺」能力。

解密 Vulcan 如何學會「觸摸」

讓我們把場景切換到亞馬遜的物流中心。過去,這裡的倉儲機器人(如 Kiva 系統)就像放大版的掃地機器人,核心行動邏輯是極力「避免」與周遭環境發生任何物理接觸,只負責搬運整個貨架,再由人類員工挑出包裹。

-----廣告,請繼續往下閱讀-----

但 2025 年5月,亞馬遜展示了他們最新的觸覺機器人 Vulcan。在亞馬遜的物流中心裡,商品被存放在由彈性帶固定的織物儲物格中,而 Vulcan 的任務是必須主動接觸、甚至「撥開」彈性織網,再從堆放雜亂的儲物格中,精準取出單一包裹,且不能造成任何損壞。

2025 年5月,亞馬遜展示了他們最新的觸覺機器人 Vulcan / 圖片引用:https://www.aboutamazon.com/news

Vulcan 的核心突破,就在於它在「拿取」這個動作上,學會了生物般的「觸覺」。它靈活的機械手臂末端工具(EOAT, End-Of-Arm Tool),不僅配備了攝影機,還搭載了能測量六個自由度的力與力矩感測器。六個自由度包含上下、左右、前後的推力,和三個維度的旋轉力矩。這就像你的手指,裡頭分布著非常多的受器,不只能感測壓力、還能感受物體橫向拉扯、運動等感觸。

EOAT 也擁有相同精確的「觸覺」,能夠在用力過大之前即時調整力道。這讓 Vulcan 能感知推動一個枕頭和一個硬紙盒所需的力量不同,從而動態調整行為,避免損壞貨物。

其實,這更接近我們人類與世界互動的真實方式。當你想拿起桌上的一枚硬幣時,你的大腦並不會先計算出精準的空間座標。實際上,你會先把手伸到大概的位置,讓指尖輕觸桌面,再沿著桌面滑動,直到「感覺」到硬幣的邊緣,最後才根據觸覺決定何時彎曲手指、要用多大的力量抓起這枚硬幣。Vulcan 正是在學習這種「視覺+觸覺」的混合策略,先用攝影機判斷大致的空間,再用觸覺回饋完成最後精細的操作。

-----廣告,請繼續往下閱讀-----

靠著這項能力,Vulcan 已經能處理亞馬遜倉庫中約 75% 的品項,並被優先部署來處理最高和最低層的貨架——這些位置是最容易導致人類員工職業傷害的位置。這也讓自動化的意義,從單純的「替代人力」,轉向了更具建設性的「增強人力」。

SRT-H 在手術室中展現了「專家級的腦」,Vulcan 在倉庫中演化出「專家級的手」。但你發現了嗎?它們都還是「專家」,一個只會開刀,一個只會揀貨。雖然這種「專家型」設計能有效規模化、解決痛點並降低成本,但機器人的終極目標,是像人類一樣成為「通才」,讓單一機器人,能在人類環境中執行多種不同任務。

如何教一台機器人「舉一反三」?

你問,機器人能成為像我們一樣的「通才」嗎?過去不行,但現在,這個目標可能很快就會實現了。這正是 NVIDIA 的 GR00T 和 Google DeepMind 的 RT-X 等專案的核心目標。

過去,我們教機器人只會一個指令、一個動作。但現在,科學家們換了一種全新的教學思路:停止教機器人完整的「任務」,而是開始教它們基礎的「技能基元」(skill primitives),這就像是動作的模組。

-----廣告,請繼續往下閱讀-----

例如,有負責走路的「移動」(Locomotion) 基元,和負責抓取的「操作」(Manipulation) 基元。AI 模型會透過強化學習 (Reinforcement Learning) 等方法,學習如何組合這些「技能基元」來達成新目標。

舉個例子,當 AI 接收到「從冰箱拿一罐汽水給我」這個新任務時,它會自動將其拆解為一系列已知技能的組合:首先「移動」到冰箱前、接著「操作」抓住把手、拉開門、掃描罐子、抓住罐子、取出罐子。AI T 正在學會如何將這些單一的技能「融合」在一起。有了這樣的基礎後,就可以開始來大量訓練。

當多重宇宙的機器人合體練功:通用 AI 的誕生

好,既然要學,那就要練習。但這些機器人要去哪裡獲得足夠的練習機會?總不能直接去你家廚房實習吧。答案是:它們在數位世界裡練習

NVIDIA 的 Isaac Sim 等平台,能創造出照片級真實感、物理上精確的模擬環境,讓 AI 可以在一天之內,進行相當於數千小時的練習,獨自刷副本升級。這種從「模擬到現實」(sim-to-real)的訓練管線,正是讓訓練這些複雜的通用模型變得可行的關鍵。

-----廣告,請繼續往下閱讀-----

DeepMind 的 RT-X 計畫還發現了一個驚人的現象:用來自多種「不同類型」機器人的數據,去訓練一個單一的 AI 模型,會讓這個模型在「所有」機器人上表現得更好。這被稱為「正向轉移」(positive transfer)。當 RT-1-X 模型用混合數據訓練後,它在任何單一機器人上的成功率,比只用該機器人自身數據訓練的模型平均提高了 50%。

這就像是多重宇宙的自己各自練功後,經驗值合併,讓本體瞬間變強了。這意味著 AI 正在學習關於物理、物體特性和任務結構的抽象概念,這些概念獨立於它所控制的特定身體。

AI 正在學習關於物理、物體特性和任務結構的抽象概念,這些概念獨立於它所控制的特定身體。/ 圖片來源:shutterstock

不再是工程師,而是「父母」: AI 的新學習模式

這也導向了一個科幻的未來:或許未來可能存在一個中央「機器人大腦」,它可以下載到各種不同的身體裡,並即時適應新硬體。

這種學習方式,也從根本上改變了我們與機器人的互動模式。我們不再是逐行編寫程式碼的工程師,而是更像透過「示範」與「糾正」來教導孩子的父母。

NVIDIA 的 GR00T 模型,正是透過一個「數據金字塔」來進行訓練的:

  • 金字塔底層: 是大量的人類影片。
  • 金字塔中層: 是海量的模擬數據(即我們提過的「數位世界」練習)。
  • 金字塔頂層: 才是最珍貴、真實的機器人操作數據。

這種模式,大大降低了「教導」機器人新技能的門檻,讓機器人技術變得更容易規模化與客製化。

當機器人不再是「一個」物體,而是「任何」物體?

我們一路看到了機器人如何學會思考、觸摸,甚至舉一反三。但這一切,都建立在一個前提上:它們的物理形態是固定的。

但,如果連這個前提都可以被打破呢?這代表機器人的定義不再是固定的形態,而是可變的功能:它能改變身體來適應任何挑戰,不再是一台單一的機器,而是一個能根據任務隨選變化的物理有機體。

有不少團隊在爭奪這個機器人領域的聖杯,其中瑞士洛桑聯邦理工學院特別具有代表性,該學院的仿生機器人實驗室(Bioinspired Robotics Group, BIRG)2007 年就打造模組化自重構機器人 Roombots。

有不少團隊在爭奪這個機器人領域的聖杯,其中瑞士洛桑聯邦理工學院(EPFL)特別具有代表性。該學院的仿生機器人實驗室(BIRG)在 2007 年就已打造出模組化自重構機器人 Roombots。而 2023 年,來自 EPFL 的另一個實驗室——可重組機器人工程實驗室(RRL),更進一步推出了 Mori3,這是一套把摺紙藝術和電腦圖學巧妙融合的模組化機器人系統。

2023 年來自 EPFL 的另一個實驗室—可重組機器人工程實驗室(RRL)推出了 Mori3 © 2023 Christoph Belke, EPFL RRL

Mori3 的核心,是一個個小小的三角形模組。別看它簡單,每個模組都是一個獨立的機器人,有自己的電源、馬達、感測器和處理器,能獨立行動,也能和其他模組合作。最厲害的是,它的三條邊可以自由伸縮,讓這個小模組本身就具備「變形」能力。

當許多 Mori3 模組連接在一起時,就能像一群活的拼圖一樣,從平面展開,組合成各種三維結構。研究團隊將這種設計稱為「物理多邊形網格化」。在電腦圖學裡,我們熟悉的 3D 模型,其實就是由許多多邊形(通常是三角形)拼湊成的網格。Mori3 的創新之處,就是把這種純粹的數位抽象,真正搬到了現實世界,讓模組們化身成能活動的「實體網格」。

這代表什麼?團隊已經展示了三種能力:

  • 移動:他們用十個模組能組合成一個四足結構,它能從平坦的二維狀態站立起來,並開始行走。這不只是結構變形,而是真正的協調運動。
  • 操縱: 五個模組組合成一條機械臂,撿起物體,甚至透過末端模組的伸縮來擴大工作範圍。
  • 互動: 模組們能形成一個可隨時變形的三維曲面,即時追蹤使用者的手勢,把手的動作轉換成實體表面的起伏,等於做出了一個會「活」的觸控介面。

這些展示,不只是實驗室裡的炫技,而是真實證明了「物理多邊形網格化」的潛力:它不僅能構建靜態的結構,還能創造具備複雜動作的動態系統。而且,同一批模組就能在不同情境下切換角色。

想像一個地震後的救援場景:救援隊帶來的不是一台笨重的挖土機,而是一群這樣的模組。它們首先組合成一條長長的「蛇」形機器人,鑽入瓦礫縫隙;一旦進入開闊地後,再重組成一隻多足的「蜘蛛」,以便在不平的地面上穩定行走;發現受困者時,一部分模組分離出來形成「支架」撐住搖搖欲墜的橫樑,另一部分則組合成「夾爪」遞送飲水。這就是以任務為導向的自我演化。

這項技術的終極願景,正是科幻中的概念:可程式化物質(Programmable Matter),或稱「黏土電子學」(Claytronics)。想像一桶「東西」,你可以命令它變成任何你需要的工具:一支扳手、一張椅子,或是一座臨時的橋樑。

未來,我們只需設計一個通用的、可重構的「系統」,它就能即時創造出任務所需的特定機器人。這將複雜性從實體硬體轉移到了規劃重構的軟體上,是一個從硬體定義的世界,走向軟體定義的物理世界的轉變。

更重要的是,因為模組可以隨意分開與聚集,損壞時也只要替換掉部分零件就好。足以展現出未來機器人的適應性、自我修復與集體行為。當一群模組協作時,它就像一個超個體,如同蟻群築橋。至此,「機器」與「有機體」的定義,也將開始動搖。

從「實體探索」到「數位代理」

我們一路見證了機器人如何從單一的傀儡,演化為學會思考的外科醫生 (SRT-H)、學會觸摸的倉儲專家 (Vulcan)、學會舉一反三的通才 (GR00T),甚至是能自我重構成任何形態的「可程式化物質」(Mori3)。

但隨著機器人技術的飛速發展,一個全新的挑戰也隨之而來:在一個 AI 也能生成影像的時代,我們如何分辨「真實的突破」與「虛假的奇觀」?

舉一個近期的案例:2025 年 2 月,一則影片在網路上流傳,顯示一台人形機器人與兩名人類選手進行羽毛球比賽,並且輕鬆擊敗了人類。我的第一反應是懷疑:這太誇張了,一定是 AI 合成的影片吧?但,該怎麼驗證呢?答案是:用魔法打敗魔法。

在眾多 AI 工具中,Perplexity 特別擅長資料驗證。例如這則羽球影片的內容貼給 Perplexity,它馬上就告訴我:該影片已被查證為數位合成或剪輯。但它並未就此打住,而是進一步提供了「真正」在羽球場上有所突破的機器人—來自瑞士 ETH Zurich 團隊的 ANYmal-D

接著,選擇「研究模式」,就能深入了解 ANYmal-D 的詳細原理。原來,真正的羽球機器人根本不是「人形」,而是一台具備三自由度關節的「四足」機器人。

如果你想更深入了解,Perplexity 的「實驗室」功能,還能直接生成一份包含圖表、照片與引用來源的完整圖文報告。它不只介紹了 ANYmal-D 在羽球上的應用,更詳細介紹了瑞士聯邦理工學院發展四足機器人的完整歷史:為何選擇四足?如何精進硬體與感測器結構?以及除了運動領域外,四足機器人如何在關鍵的工業領域中真正創造價值。

AI 代理人:數位世界的新物種

從開刀、揀貨、打球,到虛擬練功,這些都是機器人正在學習「幫我們做」的事。但接下來,機器人將獲得更強的「探索」能力,幫我們做那些我們自己做不到的事。

這就像是,傳統網路瀏覽器與 Perplexity 的 Comet 瀏覽器之間的差別。Comet 瀏覽器擁有自主探索跟決策能力,它就像是數位世界裡的機器人,能成為我們的「代理人」(Agent)

它的核心功能,就是拆解過去需要我們手動完成的多步驟工作流,提供「專業代工」,並直接交付成果。

例如,你可以直接對它說:「閱讀這封會議郵件,檢查我的行事曆跟代辦事項,然後草擬一封回信。」或是直接下達一個複雜的指令:「幫我訂 Blue Origin 的太空旅遊座位,記得要來回票。」

接著,你只要兩手一攤,Perplexity 就會接管你的瀏覽器,分析需求、執行步驟、最後給你結果。你再也不用自己一步步手動搜尋,或是在不同網站上重複操作。

AI 代理人正在幫我們探索險惡的數位網路,而實體機器人,則在幫我們前往真實的物理絕境。

立即點擊專屬連結 https://perplexity.sng.link/A6awk/k74… 試用 Perplexity吧! 現在申辦台灣大哥大月付 599(以上) 方案,還可以獲得 1 年免費 Perplexity Pro plan 喔!(價值 新台幣6,750)

◆Perplexity 使用實驗室功能對 ANYmal-D 與團隊的全面分析 https://drive.google.com/file/d/1NM97…

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
242 篇文章 ・ 318 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia