2

4
8

文字

分享

2
4
8

「意識」是什麼?人們已經找到答案了嗎?

PanSci_96
・2023/11/26 ・6000字 ・閱讀時間約 12 分鐘

「意識」是什麼?

直到現在,仍是宗教、哲學、心理學、神經科學都還無法解答的難題。

但是今年, 2023 年,一場來自神經學家與哲學家對於「意識」解釋的賭注,在經過長達 25 年的研究後,終於要畫下句點了嗎?到底是誰贏了?對自己頭上頂著的大腦,我們又了解多少了?

25 年前,一場圍繞「意識」之謎的賭局

1998 年,神經科學家克里斯托夫・科赫(Christof Koch)和哲學家戴維・查爾莫斯(David John Chalmers)打賭一箱葡萄酒,如果 25 年後,人們已經能清楚地解釋意識背後的神經機制,那麼就是科赫贏了。反之,如果還是未能解答意識之謎,就是查爾莫斯贏了。

-----廣告,請繼續往下閱讀-----

但在揭曉勝者之前,我們要先來談談一個最基本的問題,「意識」到底是什麼?首先我們要先定義清楚,因為在中文中,意識指的可能是一個人的清醒狀態、也可以是對內在自我的一種感知、又或是包含感知、情緒、思考等等的一種總和、又甚至可以是指在精神分析理論中與前意識和潛意識的比較。

若要深入探討意識定義的發展以及不同的哲學論點,那真的不做個三十集做不完,在這集的時間內,就讓我們把重點放在感質(Qualia)的相關概念。感質,指的是個人直接體驗的主觀感受,被認為無法通過客觀描述或第三人稱觀察來完全理解或解釋。我們感知世界的方式、感受事物的質感、觸覺、視覺、聽覺、嗅覺等等都是屬於感質。

感質,指的是個人直接體驗的主觀感受,被認為無法通過客觀描述或第三人稱觀察來完全理解或解釋。圖/wikipedia

舉一個例子。若是把一顆紅蘋果放在大家面前,詢問蘋果這是什麼顏色,相信大家應該都會說這是紅色。然而,雖然科學能解釋紅色是因為有波長約 620 到 750 奈米的光,刺激到視網膜的錐細胞,產生一連串的神經反應,最後形成大腦的表徵,但卻無法解釋我們對紅色的主觀感受是怎麼形成的。

哲學家們也常思考,你看到的紅色,和我看到的紅色究竟是否一樣,是否有可能我眼中的紅其實是你眼中的綠。

-----廣告,請繼續往下閱讀-----

舉另一個例子,這件數年前爆紅的衣服,你覺得是藍色與黑色相間,還是白色與金色相間呢?

另外,像是這張圖究竟是兔子還是鴨子?

圖/wikipedia

這張圖究竟是狗還是小女孩?

明明有張客觀的圖片存在,每個人的主觀感受卻有不同的答案。

-----廣告,請繼續往下閱讀-----

「困難問題」(Hard problem of consciousness)是找不到答案的問題?

在意識賭局中的哲學家戴維・查爾莫斯,就提出感質以及主觀經驗為什麼(why)存在以及如何(how)產生是所謂的困難問題(Hard problem of consciousness),相較於簡單的問題是討論意識相關的功能和行為,困難問題涉及意識的經驗(現象、主觀),是沒辦法客觀觀察測量。也就是這個問題,是沒有答案的。

舉一個屬於困難問題的例子,明明都只是大腦的神經在放電,為何某些神經放電後會導致飢餓感而不是其他感覺,譬如口渴?他認為即使沒有飢餓這種「感覺」,飢餓衍伸出的行為,例如進食,也可以發生。因此這些產生的感覺,無法單純簡化由大腦等物理系統解釋。

圖/giphy

然而,困難問題的說法其實也存在爭論。根據 2020 年哲學期刊文章的互動式學術資料庫 PhilPapers 的調查, 29.72% 的受訪哲學家認為難題不存在,而 62.42% 的受訪哲學家認為難題是一個真正的問題。

也有一群神經科學家們雖然接受困難問題的存在,卻也認為困難問題未來可以被解決,又或是被證明這不是一個真正的問題。並開啟了他們對於意識相關神經區(neural correlates of consciousness)簡稱 NCC 的研究發展,試圖找到足以產生意識的最小神經集合。

-----廣告,請繼續往下閱讀-----
精神科學家開啟對於意識相關神經區(neural correlates of consciousness)簡稱 NCC 的研究發展,試圖找到足以產生意識的最小神經集合。圖/PanSci YouTube

但 NCC 的研究被認為最多只能找到神經反應與意識的相關性,解決的仍然只是簡單問題而非困難問題。為了突破 NCC 本身的限制,人們又開始轉往重視意識理論(theories of consciousness (ToCs))的發展。希望透過意識理論來超越以 NCC 為基礎的方法論,轉向提供更具解釋性見解的意識模型。

在意識模型這邊還在爭論不休,讓我們先把鏡頭換到神經學家這一邊。

研究科技進步,為意識研究帶來哪些幫助?

面對意識這個艱難的大哉問,克里斯托夫・科赫當初怎麼那麼有自信,敢發起這個看起來勝算就不大的挑戰呢?有那麼愛喝嗎?

1998 年,年輕有為的克里斯托夫・科赫已經是加州理工學院的助理教授,並和生命科學領域大咖中的大咖弗朗西斯・克里克,合作研究意識這個主題。沒錯,就是和華生一同發現 DNA 是雙股螺旋結構的克里克。除此之外,克里斯托夫還擁有物理的碩士學位,擁有跨領域的知識,讓他更加相信透過實證的方式,能找到意識的神經機制。

-----廣告,請繼續往下閱讀-----
克里斯托夫・科赫合作研究意識的對象便是與華生一同發現 DNA 是雙股螺旋結構的弗朗西斯・克里克。圖/PanSci YouTube

當時有許多大腦研究的技術蓬勃發展,像是功能性磁振造影(fMRI)已經獲得廣泛使用,使得科學家們能在對象進行活動或是受外界刺激時,同步從大腦血氧濃度的變化來推斷神經反應。

此外,光學遺傳學(optogenetics)技術也在那個時期開始萌芽,這讓研究者能用極佳的時間解析度來調控特定的大腦神經元,並藉此解碼大腦的秘密。舉例來說,現在的光學遺傳學能讓科學家們鎖定小鼠的特定神經細胞,並在小鼠頭上裝上 LED 光纖,只要開啟 LED 的光刺激,那些特定神經細胞就會興奮或抑制。藉由觀察小鼠行為的變化,就能了解不同行為表現是由哪些神經元所調控。

現在的光學遺傳學能讓科學家們鎖定小鼠的特定神經細胞。圖/PanSci YouTube

厲害的是,在 1979 年光學遺傳學的技術還未誕生前,克里克就認為如果想要了解大腦的運作,精準控制大腦中一種類型的所有細胞是非常重要的,而若想要有極佳的時間和空間精細度,必須使用光的技術,這與後來光學遺傳學的發明不謀而合。

有了這些科技加持,長達 25 年對於意識的賭注也即將來到結局。

-----廣告,請繼續往下閱讀-----

所以,誰贏了賭注?

2023 年 6 月 23 日,在科學意識研究協會的年會上,揭曉了這長達 25 年的賭局。神經科學家克里斯托夫・科赫(Christof Koch)最終承認,目前還不能解釋大腦的神經元是如何產生意識,並買了一箱好葡萄酒(1978 Madeira)給哲學家戴維・查爾莫斯(David John Chalmers)實現諾言。

克里斯托夫・科赫最終承認,目前還不能解釋大腦的神經元是如何產生意識,並買了一箱好葡萄酒給戴維・查爾莫斯。圖/PanSci YouTube

當然,這不是說意識的來源永遠沒有解答,只是當初賭局設下的 25 年時限到了。實際上到了 2018 年,他們兩位根本都忘了這場賭局,直到一位科學記者佩爾・斯納普魯德重新提及這個話題,才讓大家重新想起。

恰巧那個時間點,克里斯托夫・科赫和戴維・查爾莫斯都參與了鄧普頓世界慈善基金會支持加速意識研究的大型項目。該計畫建立一系列意識理論的「對抗性」實驗,希望透過讓兩個或多個持相反觀點的競爭對手共同合作研究,來挑戰各種意識假設。

意識理論的百家爭鳴

而其中包含兩個著名的意識理論,全局工作空間理論(Global Workspace Theory (GWT))和整合資訊理論(Integrated Information Theory (IIT))。

-----廣告,請繼續往下閱讀-----
全局工作空間理論(Global Workspace Theory (GWT))。圖/PanSci YouTube

全局工作空間理論(Global Workspace Theory (GWT))的概念,最早是由認知科學家伯納德・巴爾斯和斯坦・富蘭克林在 1980 年代晚期提出。他們認為意識的產生就像是劇場聚光燈一樣,當這個意識劇場透過名為選擇性注意的聚光燈在舞台上照出內容,我們就會產生意識情境。這聚光燈的投射也代表著全局工作空間,只有當感官輸入、記憶或內在表徵受到注意時,它們才有機會整合成為全局工作空間的一部分,被我們主觀意識到。而我們的行為決策,也是透過這個全局工作空間整合訊息,並分配到其他系統所產生。目前認為全局工作是發生於大腦前方的前額葉區域。

整合資訊理論(Integrated Information Theory (IIT))。圖/PanSci YouTube

與全局工作空間理論打對臺的,是整合資訊理論(Integrated Information Theory (IIT)),最早由朱利奧・托諾尼(Giulio Tononi)在 2004 年提出。這理論認為,意識背後是有數學以及物理為基礎的因果關係。應該先肯定意識的存在,再回推尋找其背後的物質基礎,並認為主觀意識是由客觀的感覺經驗產生的。克里斯托夫・科赫就是此理論的擁護者,他進一步認為,意識背後的那個神經機制,就存在於大腦後方後皮質熱區(Posterior cortical hot zone),包括頂葉、顳葉和枕葉的感覺皮質區域。

讓我們稍微總結一下兩者差異:

全局工作空間理論——

  • 意識只能透過訊息投射到一個稱做「全局工作空間」之後才能呈現
  • 訊息本身不會形成意識
  • 訊息要被注意到才會產生意識

整合資訊理論——

  • 意識存在
  • 產生的關鍵是需要將大腦處理感覺的皮質區域訊息整合

然而,經過六個獨立實驗室的研究,雖然有較多的證據支持整合資訊理論,但兩個理論都存在缺陷和質疑,直到目前都尚未有明確解答能解釋意識的神經機制,這也讓克里斯托夫・科赫大方承認自己輸掉了這 25 年的賭局。

隨著科學測量技術的演進以及越來越多的研究進展,有一些神經科學家認為意識理論即將崛起,目前的狀態只不過是一種研究過渡期。科學哲學家托馬斯・庫恩(Thomas Kuhn)將這種過渡期以「前典範式」(preparadigmatic science)來形容,認為一門不成熟的科學在成熟前,會面臨相互競爭的思想流派並各說各話。就像是當初達爾文提出演化論的物競天擇前有拉馬克主義、災變論與均變論來試圖解釋物種起源一樣。

下一場賭約?

雖然這次的打賭由戴維・查爾莫斯獲得一勝,但克里斯托夫・科赫在今年加倍賭注,認為下一個 25 年他一定會贏。到時候克里斯托夫已經 91 歲,戴維 82 歲了。

大家別擔心,這一集是會員共同選出來的題目, 25 年之後,我們也會再為各位泛糰做一集討論賭局的結果。

最後也想問問大家, 25 年之後,你賭這場對決會是誰贏呢?

  1. 我壓在克里斯托夫・科赫身上,我們一定能解開意識之謎
  2. 我賭戴維・查爾莫斯,意識這個問題,可能很難用科學來解釋
  3. 在那之前, AI 可能都已經有意識了,直接問 AI 還比較快

趕快來留言吧,記得 25 年後要回來看啊!

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
PanSci_96
1262 篇文章 ・ 2494 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

3
1

文字

分享

0
3
1
為機器人換上「物理大腦」:一場終結AI數位囚禁的革命
鳥苷三磷酸 (PanSci Promo)_96
・2025/09/03 ・5732字 ・閱讀時間約 11 分鐘

本文與 研華科技 合作,泛科學企劃執行

我們都看過那種影片,對吧?網路上從不缺乏讓人驚嘆的機器人表演:數十台人形機器人像軍隊一樣整齊劃一地耍雜技 ,或是波士頓動力的機器狗,用一種幾乎違反物理定律的姿態後空翻、玩跑酷 。每一次,社群媒體總會掀起一陣「未來已來」、「人類要被取代了」的驚呼 。

但當你關掉螢幕,看看四周,一個巨大的落差感就來了:說好的機器人呢?為什麼大街上沒有他們的身影,為什麼我家連一件衣服都還沒人幫我摺?

這份存在於數位螢幕與物理現實之間的巨大鴻溝,源於一個根本性的矛盾:當代AI在數位世界裡聰明絕頂,卻在物理世界中笨拙不堪。它可以寫詩、可以畫畫,但它沒辦法為你端一杯水。

-----廣告,請繼續往下閱讀-----

這個矛盾,在我們常見的兩種機器人展示中體現得淋漓盡致。第一種,是動作精準、甚至會跳舞的類型,這本質上是一場由工程師預先寫好劇本的「戲」,機器人對它所處的世界一無所知 。第二種,則是嘗試執行日常任務(如開冰箱、拿蘋果)的類型,但其動作緩慢不穩,彷彿正在復健的病人 。

這兩種極端的對比,恰恰點出了機器人技術的真正瓶頸:它們的「大腦」還不夠強大,無法即時處理與學習真實世界的突發狀況 。

這也引出了本文試圖探索的核心問題:新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦,真的能終結機器人的「復健時代」,開啟一個它們能真正理解、並與我們共同生活的全新紀元嗎?

新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦 / 圖片來源:研華科技

為何我們看到的機器人,總像在演戲或復健?

那我們怎麼理解這個看似矛盾的現象?為什麼有些機器人靈活得像舞者,有些卻笨拙得像病人?答案,就藏在它們的「大腦」運作方式裡。

-----廣告,請繼續往下閱讀-----

那些動作極其精準、甚至會後空翻的機器人,秀的其實是卓越的硬體性能——關節、馬達、減速器的完美配合。但它的本質,是一場由工程師預先寫好劇本的舞台劇 。每一個角度、每一分力道,都是事先算好的,機器人本身並不知道自己為何要這麼做,它只是在「執行」指令,而不是在「理解」環境。

而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。

這就像教一個小孩走路,你可以抱著他,幫他擺動雙腿,看起來走得又快又穩,但那不是他自己在走。真正的學習,是他自己搖搖晃晃、不斷跌倒、然後慢慢找到平衡的過程。過去的機器人,大多是前者;而我們真正期待的,是後者。

所以,問題的核心浮現了:我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好?

-----廣告,請繼續往下閱讀-----
我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好? / 圖片來源:shutterstock

機器人的大腦,為什麼不能放在雲端?

聽起來好像很合理,對吧?把所有複雜的運算都交給雲端最強大的伺服器,機器人本身只要負責接收指令就好了。但……真的嗎?

想像一下,如果你的大腦在雲端,你看到一個球朝你飛過來,視覺訊號要先上傳到雲端,雲端分析完,再把「快閃開」的指令傳回你的身體。這中間只要有零點幾秒的網路延遲,你大概就已經鼻青臉腫了。

現實世界的互動,需要的是「即時反應」。任何網路延遲,在物理世界中都可能造成無法彌補的失誤 。因此,運算必須在機器人本體上完成,這就是「邊緣 AI」(Edge AI)的核心概念 。而 NVIDIA  Jetson 平台,正是為了解決這種在裝置端進行高運算、又要兼顧低功耗的需求,而誕生的關鍵解決方案 。

NVIDIA Jetson 就像一個緊湊、節能卻效能強大的微型電腦,專為在各種裝置上運行 AI 任務設計 。回顧它的演進,早期的 Jetson 系統主要用於視覺辨識搭配AI推論,像是車牌辨識、工廠瑕疵檢測,或者在相機裡分辨貓狗,扮演著「眼睛」的角色,看得懂眼前的事物 。但隨著算力提升,NVIDIA Jetson 的角色也逐漸從單純的「眼睛」,演化為能夠控制手腳的「大腦」,開始驅動更複雜的自主機器,無論是地上跑的、天上飛的,都將NVIDIA Jetson 視為核心運算中樞 。

-----廣告,請繼續往下閱讀-----

但再強大的晶片,如果沒有能適應現場環境的「容器」,也無法真正落地。這正是研華(Advantech)的角色,我們將 NVIDIA Jetson 平台整合進各式工業級主機與邊緣運算設備,確保它能在高熱、灰塵、潮濕或震動的現場穩定運行,滿足從工廠到農場到礦場、從公車到貨車到貨輪等各種使用環境。換句話說,NVIDIA 提供「大腦」,而研華則是讓這顆大腦能在真實世界中呼吸的「生命支持系統」。

這個平台聽起來很工業、很遙遠,但它其實早就以一種你意想不到的方式,進入了我們的生活。

從Switch到雞蛋分揀員,NVIDIA Jetson如何悄悄改變世界?

如果我告訴你,第一代的任天堂Switch遊戲機與Jetson有相同血緣,你會不會很驚訝?它的核心處理器X1晶片,與Jetson TX1模組共享相同架構。這款遊戲機對高效能運算和低功耗的嚴苛要求,正好與 Jetson 的設計理念不謀而合 。

而在更專業的領域,研華透過 NVIDIA Jetson 更是解決了許多真實世界的難題 。例如

-----廣告,請繼續往下閱讀-----
  • 在北美,有客戶利用 AI 進行雞蛋品質檢測,研華的工業電腦搭載NVIDIA Jetson 模組與相機介面,能精準辨識並挑出髒污、雙黃蛋到血蛋 
  • 在日本,為避免鏟雪車在移動時發生意外,導入了環繞視覺系統,當 AI 偵測到周圍有人時便會立刻停止 ;
  • 在水資源珍貴的以色列,研華的邊緣運算平台搭載NVIDIA Jetson模組置入無人機內,24 小時在果園巡航,一旦發現成熟的果實就直接凌空採摘,實現了「無落果」的終極目標 。

這些應用,代表著 NVIDIA Jetson Orin™ 世代的成功,它讓「自動化」設備變得更聰明 。然而,隨著大型語言模型(LLM)的浪潮來襲,人們的期待也從「自動化」轉向了「自主化」 。我們希望機器人不僅能執行命令,更能理解、推理。

Orin世代的算力在執行人形機器人AI推論時的效能約為每秒5到10次的推論頻率,若要機器人更快速完成動作,需要更強大的算力。業界迫切需要一個更強大的大腦。這也引出了一個革命性的問題:AI到底該如何學會「動手」,而不只是「動口」?

革命性的一步:AI如何學會「動手」而不只是「動口」?

面對 Orin 世代的瓶頸,NVIDIA 給出的答案,不是溫和升級,而是一次徹底的世代跨越— NVIDIA Jetson Thor 。這款基於最新 Blackwell 架構的新模組,峰值性能是前代的 7.5 倍,記憶體也翻倍 。如此巨大的效能提升,目標只有一個:將過去只能在雲端資料中心運行的、以 Transformer 為基礎的大型 AI 模型,成功部署到終端的機器上 。

NVIDIA Jetson Thor 的誕生,將驅動機器人控制典範的根本轉變。這要從 AI 模型的演進說起:

-----廣告,請繼續往下閱讀-----
  1. 第一階段是 LLM(Large Language Model,大型語言模型):
    我們最熟悉的 ChatGPT 就屬此類,它接收文字、輸出文字,實現了流暢的人機對話 。
  2. 第二階段是 VLM(Vision-Language Model,視覺語言模型):
    AI 學會了看,可以上傳圖片,它能用文字描述所見之物,但輸出結果仍然是給人類看的自然語言 。
  3. 第三階段則是 VLA(Vision-Language-Action Model,視覺語言行動模型):
    這是革命性的一步。VLA 模型的輸出不再是文字,而是「行動指令(Action Token)」 。它能將視覺與語言的理解,直接轉化為控制機器人關節力矩、速度等物理行為的具體參數 。

這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。

NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技

其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。

好,我們有了史上最強的大腦。但一個再聰明的大腦,也需要一副強韌的身體。而這副身體,為什麼非得是「人形」?這不是一種很沒效率的執念嗎?

為什麼機器人非得是「人形」?這不是一種低效的執念嗎?

這是我一直在思考的問題。為什麼業界的主流目標,是充滿挑戰的「人形」機器人?為何不設計成效率更高的輪式,或是功能更多元的章魚型態?

-----廣告,請繼續往下閱讀-----

答案,簡單到令人無法反駁:因為我們所處的世界,是徹底為人形生物所打造的。

從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。

這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。

人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態 / 圖片來源:shutterstock

但要讓一個「多面手」真正活起來,光有骨架還不夠。它必須同時擁有強大的大腦平台與遍布全身的感知神經,才能理解並回應外在環境。人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態。但這些訊號若沒有通過一個穩定的「大腦平台」,就無法匯聚成有意義的行動。

這正是研華的角色:我們不僅把 NVIDIA Jetson Thor 這顆核心晶片包載在工業級電腦中,讓它成為能真正思考與反應的「完整大腦」,同時也提供神經系統的骨幹,將感測器、I/O 介面與通訊模組可靠地連結起來,把訊號傳導進大腦。你或許看不見研華的存在,但它實際上遍布在機器人全身,像隱藏在皮膚之下的神經網絡,讓整個身體真正活過來。

但有了大腦、有了身體,接下來的挑戰是「教育」。你要怎麼教一個物理 AI?總不能讓它在現實世界裡一直摔跤,把一台幾百萬的機器人摔壞吧?

打造一個「精神時光屋」,AI的學習速度能有多快?

這個問題非常關鍵。大型語言模型可以閱讀網際網路上浩瀚的文本資料,但物理世界中用於訓練的互動資料卻極其稀缺,而且在現實中反覆試錯的成本與風險實在太高 。

答案,就在虛擬世界之中。

NVIDIA Isaac Sim™等模擬平台,為這個問題提供了完美的解決方案 。它能創造出一個物理規則高度擬真的數位孿生(Digital Twin)世界,讓 AI 在其中進行訓練 。

這就像是為機器人打造了一個「精神時光屋」 。它可以在一天之內,經歷相當於現實世界千百日的學習與演練,從而在絕對安全的環境中,窮盡各種可能性,深刻領悟物理世界的定律 。透過這種「模擬-訓練-推論」的 3 Computers 閉環,Physical AI (物理AI) 的學習曲線得以指數級加速 。

我原本以為模擬只是為了節省成本,但後來發現,它的意義遠不止於此。它是在為 AI 建立一種關於物理世界的「直覺」。這種直覺,是在現實世界中難以透過有限次的試錯來建立的。

所以你看,這趟從 Switch 到人形機器人的旅程,一幅清晰的未來藍圖已經浮現了。實現物理 AI 的三大支柱已然齊備:一個劃時代的「AI 大腦」(NVIDIA Jetson Thor)、讓核心延展為「完整大腦與神經系統」的工業級骨幹(由研華 Advantech 提供),以及一個不可或缺的「教育環境」(NVIDIA Isaac Sim 模擬平台) 。

結語

我們拆解了那些酷炫機器人影片背後的真相,看見了從「自動化」走向「自主化」的巨大技術鴻溝,也見證了「物理 AI」時代的三大支柱——大腦、身軀、與教育——如何逐一到位 。

專家預測,未來 3 到 5 年內,人形機器人領域將迎來一場顯著的革命 。過去我們只能在科幻電影中想像的場景,如今正以前所未有的速度成為現實 。

這不再只是一個關於效率和生產力的問題。當一台機器,能夠觀察我們的世界,理解我們的語言,並開始以物理實體的方式與我們互動,這將從根本上改變我們與科技的關係。

所以,最後我想留給你的思想實驗是:當一個「物理 AI」真的走進你的生活,它不只是個工具,而是一個能學習、能適應、能與你共同存在於同一個空間的「非人智慧體」,你最先感受到的,會是興奮、是便利,還是……一絲不安?

這個問題,不再是「我們能否做到」,而是「當它發生時,我們準備好了嗎?」

研華已經整裝待發,現在,我們與您一起推動下一代物理 AI 與智慧設備的誕生。
https://bit.ly/4n78dR4

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
231 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
E10 低碳汽油:台灣減碳新契機,為何我們應該接受?
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/17 ・3468字 ・閱讀時間約 7 分鐘

本文與美國穀物協會合作,泛科學企劃執行。

台灣將在 2040 年禁售燃油車。但別急,現在路上開的舊有車款不會馬上報廢消失,因為舊有的車輛會繼續開到年限結束。根據計算,當禁售燃油車的那一天來臨時,還有大約 60% 的車輛是燃油車。這時,在多數交通工具還是燃油的情況下,美國、歐盟等國已經開始使用酒精燃料來減少碳排放,那麼,台灣也能做到嗎?

你聽過 E3、E10 汽油嗎?

這是指在汽油中加入酒精,E3 代表有 3% 的汽油被酒精取代,而 E10 則是 10% 的汽油換成酒精。酒精是一種抗爆震性能更好的燃料,且比化石燃料更環保,因為它可以來自生質燃料,碳排放也較低。即便算上運輸和加工的碳足跡,用玉米製造的乙醇仍比傳統汽油的碳排放低了 43%。其實,在美國、歐洲、澳洲等地,E10 或更高比例的酒精汽油早已廣泛使用,這在我們之前的影片中也有提過。

現在,台灣有 14 間加油站可以加到 E3 汽油,而中油也正積極促使相關部門開放 E10 汽油的銷售。

-----廣告,請繼續往下閱讀-----

不過,在推動這項改變之前,仍有許多民眾對酒精汽油有疑慮。大家最關心的問題是,把不是汽油的燃料放到引擎中,到底會不會對車輛引擎造成不良影響?例如會不會影響引擎運行,甚至影響里程數?
其實,換燃料確實會對引擎有影響,因為不同燃料燃燒後所產生的能量與副產物都不一樣。但別擔心,根據我們之前的討論,2011 年以後生產的所有汽車,還有大部分 1990 年代後期生產的汽機車,都能直接相容 E10 汽油。換句話說,除了少數舊車或特殊車型,約 95% 的汽機車都不需要擔心這個相容性問題。

2011 年以後生產的所有汽車,還有大部分 1990 年代後期生產的汽機車,都能直接相容 E10 汽油。圖 / 美國穀物協會提供

E10 汽油在效能上的表現,會不會受到影響?

學過化學的人都知道,燃燒其實是一種氧化反應,可以用化學式表達。也就是只要汽缸的大小是固定的,就能算出空氣中能參與氧化反應的氧氣分子有多少,進而推算出每次汽缸燃燒時,應該搭配多少的燃料。

當引擎運作時,汽缸內的氧氣分子會與燃料反應,產生動力。為了最佳化效能,引擎的噴油嘴會精準控制每次的進油量,確保空氣和燃料的比例,稱為「空燃比」。接著調整噴油嘴的設定,讓出油量符合我們的需求。

每當空氣成分改變,燃料量或燃料的種類更換時,空燃比就會產生變化。在燃料相對空氣來說比較多時,我們通常稱為「富油」;相反的,如果燃料相比空氣來的少,就稱為「貧油」。如果我們把汽油換成百分之百的酒精,因為酒精每單位體積所需要的氧氣比較少,而且熱值比較低,因此會產生貧油現象,推力感受起來自然也會比較低。

要解決這個問題,方法其實不難,只要增加燃料量即可。而巴西早已證明,使用 E100 汽油是可行的。巴西近 50 年來推動 E85、E100 燃料車輛,並展示了彈性燃料引擎的優勢。

而巴西早已證明,使用 E100 汽油是可行的。巴西近 50 年來推動 E85、E100 燃料車輛,並展示了彈性燃料引擎的優勢。圖/美國穀物協會

這類交通工具被稱為彈性燃料引擎,顧名思義,能很彈性的使用汽油、E100 酒精汽油、或是任何比例的甲醇、乙醇、汽油的混合物。彈性燃料引擎跟一般引擎最大的差別,就是內建了「燃料成分感測器」。能透過判斷燃料的種類與比例,調整噴油嘴的出油量設定以及點火正時,讓引擎的輸出動力維持在最佳狀態,確保引擎效能不受影響。

-----廣告,請繼續往下閱讀-----

所謂的點火正時,指的是火星塞點火的時機。不同的燃料,化學反應的速度與膨脹的體積不同,當然會對應不同的點火時機。

但是 E100 其實也不是純酒精?

大家都知道,蒸餾酒需要經過多次反覆蒸餾,為什麼不能只蒸餾一次就好呢?原因在於,酒精與水的沸點雖然不同,但它們不完全互斥,會產生交互作用。在蒸餾過程中,即使酒精的沸點較低,水仍然會在加熱的過程中,隨著酒精部分蒸發進入容器中。

事實上,當酒精濃度達到 95.63% 時,不論再怎麼蒸餾,濃度也不會再上升。這是因為當酒精濃度接近這個比例時,酒精與水的沸點非常接近,這種現象稱為「共沸」,意思是酒精和水的混合物會一起沸騰,無法再進一步蒸餾分離。

共沸現象的結果,就是為什麼市面上銷售的藥用酒精,濃度最高都是 95%,而非 100%。因為更高濃度就必須使用脫水劑等方式處理,成本會提高,或是因為有添加物而不符合藥用標準。所以當然,E100 汽油裡面,實際上使用的也是濃度 95% 的酒精,而不是 100%。

-----廣告,請繼續往下閱讀-----
E100 汽油裡面,實際上使用的也是濃度 95% 的酒精,而不是 100%。 圖 / 美國穀物協會提供

解決迷思:酒精汽油是否容易因吸收水分,而產生油水分離?

事實上,酒精和水是高度互溶的,這使得高比例的酒精在汽油中有更高的水分耐受性。簡單來說,進入油箱的水氣,會溶在酒精汽油中而不會產生油水分離。

根據美國國家可再生能源實驗室的研究,即使在高溫高濕的極端環境下,E10 酒精汽油也需要經過三個月才會出現明顯的油水分離。而三個月也是一般汽油建議最長的保存時間,因為汽油放太久就會氧化。

也就是說,酒精與水混和物的特性,不是把酒精和水的相加除以二那麼簡單,它們的交互作用更加複雜。

一篇刊登在《國際能源研究期刊》的研究指出,在可變壓縮比引擎中的實驗結果,加入酒精後,引擎的功率會逐漸升高,在 E10 酒精時為最佳比例效果。

-----廣告,請繼續往下閱讀-----

當然,實際情況和實驗室當然不能直接類比。大多數汽車和機車並未專門為酒精汽油做調整,那這樣會有多大影響呢?根據英國政府的官方結論,直接使用 E10 汽油與一般汽油相比,每公升的里程數大約會降低 1%,但在日常駕駛中,這個差異幾乎不會被察覺。實際上,載貨量和駕駛習慣對油耗的影響,遠遠大於是否使用 E10 汽油的影響。

更好的一點是,酒精其實是一種常見的工業用品,以每美國為例,在過去一年中,酒精的離岸價格實際上都比汽油還低,因此不用擔心酒精會讓油價變貴。

此外,經過調校的引擎也不必擔心推力問題。事實上,F1 賽車從 2022 年開始使用 E10 作為燃料,納斯卡賽車更早在 2011 年就採用了 E15 燃料,運行上沒有太大問題。

F1 賽車從 2022 年開始使用 E10 作為燃料,納斯卡賽車更早在 2011 年就採用了 E15 燃料,運行上沒有太大問題。圖/unsplash

最重要的是,使用 E10 燃料的好處明顯更多。由於酒精和烷類燃料的分子式不一樣,酒精分子式中多了一個氧原子,這使得燃燒過程中反應會更完全,能夠產生更多二氧化碳而非有毒的一氧化碳,同時降低一氧化氮和二氧化氮等氮氧化物的產生。

-----廣告,請繼續往下閱讀-----

最關鍵的一點,酒精與化石燃料相比,能夠更快速地幫助減碳。只要確保使用永續農法、不與糧食競爭土地的前提下,所製造的玉米乙醇,碳排量就是比化石燃料還要低。

E10 低碳汽油是填補減碳缺口的最快方案,挑戰只在接受度

英國引入 E10 後,每年減碳 75 萬噸,相當於減少 35 萬輛汽車的碳排量。而台灣呢?目前根據政策規劃,台灣 2040 年起將新售的汽機車全面電動化。依照這個目標進程,在 2025 年將達成減碳 288.6 萬噸的目標。然而,這距離運輸部門須減少 487 萬噸碳排量目標,還差 198 萬噸。

如果燃油車全面改用 E10 低碳汽油,則能減碳 202 萬噸,幾乎能完全彌補缺口。這項方案的優勢在於,E10 與一般汽油性質相近,不需更換新的引擎設計或架設特規加油站,執行門檻低。

實際上,目前推動低碳汽油最大的瓶頸,大概就是民眾對於這個新燃料的接受度了吧!如果接受度提升,購買量上升,成本也有機會進一步再下降。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
鳥苷三磷酸 (PanSci Promo)_96
231 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
數智驅動未來:從信任到執行,AI 為企業創新賦能
鳥苷三磷酸 (PanSci Promo)_96
・2025/01/13 ・4938字 ・閱讀時間約 10 分鐘

本文由 鼎新數智 與 泛科學 共同規劃與製作

你有沒有想過,當 AI 根據病歷與 X 光片就能幫你診斷病症,或者決定是否批准貸款,甚至從無人機發射飛彈時,它的每一步「決策」是怎麼來的?如果我們不能知道 AI 的每一個想法步驟,對於那些 AI 輔助的診斷和判斷,要我們如何放心呢?

馬斯克與 OpenAI 的奧特曼鬧翻後,創立了新 AI 公司 xAI,並推出名為 Grok 的產品。他宣稱目標是以開源和可解釋性 AI 挑戰其他模型,而 xAI 另一個意思是 Explainable AI 也就是「可解釋性 AI」。

如今,AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?

-----廣告,請繼續往下閱讀-----
AI 已滲透生活各處,而我們對待它的方式卻像求神問卜,缺乏科學精神。如何讓 AI 具備可解釋性,成為當前關鍵問題?圖/pexels

黑盒子模型背後的隱藏秘密

無法解釋的 AI 究竟會帶來多少問題?試想,現在許多銀行和貸款機構已經使用 AI 評估借貸申請者的信用風險,但這些模型往往如同黑箱操作。有人貸款被拒,卻完全不知原因,感覺就像被分手卻不告訴理由。更嚴重的是,AI 可能擅自根據你的住所位置或社會經濟背景給出負面評價,這些與信用風險真的相關嗎?這種不透明性只會讓弱勢群體更難融入金融體系,加劇貧富差距。這種不透明性,會讓原本就已經很難融入金融體系的弱勢群體,更加難以取得貸款,讓貧富差距越來越大,雪上加霜。

AI 不僅影響貸款,還可能影響司法公正性。美國部分法院自 2016 年起使用「替代性制裁犯罪矯正管理剖析軟體」 COMPAS 這款 AI 工具來協助量刑,試圖預測嫌犯再犯風險。然而,這些工具被發現對有色人種特別不友好,往往給出偏高的再犯風險評估,導致更重的刑罰和更嚴苛的保釋條件。更令人擔憂的是,這些決策缺乏透明度,AI 做出的決策根本沒法解釋,這讓嫌犯和律師無法查明問題根源,結果司法公正性就這麼被悄悄削弱了。

此外,AI 在醫療、社交媒體、自駕車等領域的應用,也充滿類似挑戰。例如,AI 協助診斷疾病,但若原因報告無法被解釋,醫生和患者又怎能放心?同樣地,社群媒體或是 YouTube 已經大量使用 AI 自動審查,以及智慧家居或工廠中的黑盒子問題,都像是一場越來越複雜的魔術秀——我們只看到結果,卻無法理解過程。這樣的情況下,對 AI 的信任感就成為了一個巨大的挑戰。

為什麼人類設計的 AI 工具,自己卻無法理解?

原因有二。首先,深度學習模型結構複雜,擁有數百萬參數,人類要追蹤每個輸入特徵如何影響最終決策結果,難度極高。例如,ChatGPT 中的 Transformer 模型,利用注意力機制(Attention Mechanism)根據不同詞之間的重要性進行特徵加權計算,因為機制本身涉及大量的矩陣運算和加權計算,這些數學操作使得整個模型更加抽象、不好理解。

-----廣告,請繼續往下閱讀-----

其次,深度學習模型會會從資料中學習某些「特徵」,你可以當作 AI 是用畫重點的方式在學習,人類劃重點目的是幫助我們加速理解。AI 的特徵雖然也能幫助 AI 學習,但這些特徵往往對人類來說過於抽象。例如在影像辨識中,人類習慣用眼睛、嘴巴的相對位置,或是手指數量等特徵來解讀一張圖。深度學習模型卻可能會學習到一些抽象的形狀或紋理特徵,而這些特徵難以用人類語言描述。

深度學習模型通常採用分佈式表示(Distributed Representation)來編碼特徵,意思是將一個特徵表示為一個高維向量,每個維度代表特徵的不同方面。假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。對 AI 而言,這是理解世界的方式,但對人類來說,卻如同墨跡測驗般難以解讀。

假設你有一個特徵是「顏色」,在傳統的方式下,你可能用一個簡單的詞來表示這個特徵,例如「紅色」或「藍色」。但是在深度學習中,這個「顏色」特徵可能被表示為一個包含許多數字的高維向量,向量中的每個數字表示顏色的不同屬性,比如亮度、色調等多個數值。圖/unsplash

試想,AI 協助診斷疾病時,若理由是基於醫生都無法理解的邏輯,患者即使獲得正確診斷,也會感到不安。畢竟,人們更相信能被理解的東西。

打開黑盒子:可解釋 AI 如何運作?我們要如何教育 AI?

首先,可以利用熱圖(heatmap)或注意力圖這類可視化技術,讓 AI 的「思維」有跡可循。這就像行銷中分析消費者的視線停留在哪裡,來推測他們的興趣一樣。在卷積神經網絡和 Diffusion Models 中 ,當 AI 判斷這張照片裡是「貓」還是「狗」時,我需要它向我們展示在哪些地方「盯得最緊」,像是耳朵的形狀還是毛色的分布。

-----廣告,請繼續往下閱讀-----

其次是局部解釋,LIME 和 SHAP 是兩個用來發展可解釋 AI 的局部解釋技術。

SHAP 的概念來自博弈,它將每個特徵看作「玩家」,而模型的預測結果則像「收益」。SHAP 會計算每個玩家對「收益」的貢獻,讓我們可以了解各個特徵如何影響最終結果。並且,SHAP 不僅能透過「局部解釋」了解單一個結果是怎麼來的,還能透過「全局解釋」理解模型整體的運作中,哪些特徵最重要。

以實際的情景來說,SHAP 可以讓 AI 診斷出你有某種疾病風險時,指出年齡、體重等各個特徵的影響。

LIME 的運作方式則有些不同,會針對單一個案建立一個簡單的模型,來近似原始複雜模型的行為,目的是為了快速了解「局部」範圍內的操作。比如當 AI 拒絕你的貸款申請時,LIME 可以解釋是「收入不穩定」還是「信用紀錄有問題」導致拒絕。這種解釋在 Transformer 和 NLP 應用中廣泛使用,一大優勢是靈活且計算速度快,適合臨時分析不同情境下的 AI 判斷。比方說在醫療場景,LIME 可以幫助醫生理解 AI 為何推薦某種治療方案,並說明幾個主要原因,這樣醫生不僅能更快做出決策,也能增加患者的信任感。

-----廣告,請繼續往下閱讀-----

第三是反事實解釋:如果改變一點點,會怎麼樣?

如果 AI 告訴你:「這家銀行不會貸款給你」,這時你可能會想知道:是收入不夠,還是年齡因素?這時你就可以問 AI:「如果我年輕五歲,或者多一份工作,結果會怎樣?」反事實解釋會模擬這些變化對結果的影響,讓我們可以了解模型究竟是如何「權衡利弊」。

最後則是模型內部特徵的重要性排序。這種方法能顯示哪些輸入特徵對最終結果影響最大,就像揭示一道菜中,哪些調味料是味道的關鍵。例如在金融風險預測中,模型可能指出「收入」影響了 40%,「消費習慣」占了 30%,「年齡」占了 20%。不過如果要應用在像是 Transformer 模型等複雜結構時,還需要搭配前面提到的 SHAP 或 LIME 以及可視化技術,才能達到更完整的解釋效果。

講到這裡,你可能會問:我們距離能完全信任 AI 還有多遠?又或者,我們真的應該完全相信它嗎?

-----廣告,請繼續往下閱讀-----

我們終究是想解決人與 AI 的信任問題

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。因此,AI 既要「可解釋」,也要「能代理」。

當未來你和 AI 同事深度共事,你自然希望它的決策與行動能讓你認可,幫你省心省力。圖/unsplash

舉例來說,當一家公司要做一個看似「簡單」的決策時,背後的過程其實可能極為複雜。例如,快時尚品牌決定是否推出新一季服裝,不僅需要考慮過去的銷售數據,還得追蹤熱門設計趨勢、天氣預測,甚至觀察社群媒體上的流行話題。像是暖冬來臨,厚外套可能賣不動;或消費者是否因某位明星愛上一種顏色,這些細節都可能影響決策。

這些數據來自不同部門和來源,龐大的資料量與錯綜關聯使企業判斷變得困難。於是,企業常希望有個像經營大師的 AI 代理人,能吸收數據、快速分析,並在做決定時不僅給出答案,還能告訴你「為什麼要這麼做」。

傳統 AI 像個黑盒子,而可解釋 AI (XAI)則清楚解釋其判斷依據。例如,為什麼不建議推出厚外套?可能理由是:「根據天氣預測,今年暖冬概率 80%,過去三年數據顯示暖冬時厚外套銷量下降 20%。」這種透明解釋讓企業更信任 AI 的決策。

-----廣告,請繼續往下閱讀-----

但會解釋還不夠,AI 還需能真正執行。這時,就需要另一位「 AI 代理人」上場。想像這位 AI 代理人是一位「智慧產品經理」,大腦裝滿公司規則、條件與行動邏輯。當客戶要求變更產品設計時,這位產品經理不會手忙腳亂,而是按以下步驟行動:

  1. 檢查倉庫物料:庫存夠不夠?有沒有替代料可用?
  2. 評估交期影響:如果需要新物料,供應商多快能送到?
  3. 計算成本變化:用新料會不會超出成本預算?
  4. 做出最優判斷,並自動生成變更單、工單和採購單,通知各部門配合執行。

這位 AI 代理人不僅能自動處理每個環節,還會記錄每次決策結果,學習如何變得更高效。隨時間推移,這位「智慧產品經理」的判斷將更聰明、決策速度更快,幾乎不需人工干預。更重要的是,這些判斷是基於「以終為始」的原則,為企業成長目標(如 Q4 業績增長 10%)進行連續且動態地自我回饋,而非傳統系統僅月度檢核。

這兩位 AI 代理人的合作,讓企業決策流程不僅透明,還能自動執行。這正是數智驅動的核心,不僅依靠數據驅動決策,還要能解釋每一個選擇,並自動行動。這個過程可簡化為 SUPA,即「感知(Sensing)→ 理解(Understanding)→ 規劃(Planning)→ 行動(Acting)」的閉環流程,隨著數據的變化不斷進化。

偉勝乾燥工業為例,他們面臨高度客製化與訂單頻繁變更的挑戰。導入鼎新 METIS 平台後,偉勝成功將數智驅動融入業務與產品開發,專案準時率因此提升至 80%。他們更將烤箱技術與搬運機器人結合,開發出新形態智慧化設備,成功打入半導體產業,帶動業績大幅成長,創造下一個企業的增長曲線。

-----廣告,請繼續往下閱讀-----

值得一提的是,數智驅動不僅帶動業務增長,還讓員工擺脫繁瑣工作,讓工作更輕鬆高效。

數智驅動的成功不僅依賴技術,還要與企業的商業策略緊密結合。為了讓數智驅動真正發揮作用,企業首先要確保它服務於具體的業務需求,而不是為了技術而技術。

這種轉型需要有策略、文化和具體應用場景的支撐,才能讓數智驅動真正成為企業持續增長的動力。

還在猶豫數智驅動的威力?免費上手企業 AI 助理!👉 企業 AI 體驗
現在使用專屬邀請碼《 KP05 》註冊就享知:https://lihi.cc/EDUk4
訂閱泛科學獨家知識頻道,深入科技趨勢與議題內容。

👉立即免費加入

-----廣告,請繼續往下閱讀-----
鳥苷三磷酸 (PanSci Promo)_96
231 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

2

4
8

文字

分享

2
4
8
「意識」是什麼?人們已經找到答案了嗎?
PanSci_96
・2023/11/26 ・6000字 ・閱讀時間約 12 分鐘

「意識」是什麼?

直到現在,仍是宗教、哲學、心理學、神經科學都還無法解答的難題。

但是今年, 2023 年,一場來自神經學家與哲學家對於「意識」解釋的賭注,在經過長達 25 年的研究後,終於要畫下句點了嗎?到底是誰贏了?對自己頭上頂著的大腦,我們又了解多少了?

25 年前,一場圍繞「意識」之謎的賭局

1998 年,神經科學家克里斯托夫・科赫(Christof Koch)和哲學家戴維・查爾莫斯(David John Chalmers)打賭一箱葡萄酒,如果 25 年後,人們已經能清楚地解釋意識背後的神經機制,那麼就是科赫贏了。反之,如果還是未能解答意識之謎,就是查爾莫斯贏了。

-----廣告,請繼續往下閱讀-----

但在揭曉勝者之前,我們要先來談談一個最基本的問題,「意識」到底是什麼?首先我們要先定義清楚,因為在中文中,意識指的可能是一個人的清醒狀態、也可以是對內在自我的一種感知、又或是包含感知、情緒、思考等等的一種總和、又甚至可以是指在精神分析理論中與前意識和潛意識的比較。

若要深入探討意識定義的發展以及不同的哲學論點,那真的不做個三十集做不完,在這集的時間內,就讓我們把重點放在感質(Qualia)的相關概念。感質,指的是個人直接體驗的主觀感受,被認為無法通過客觀描述或第三人稱觀察來完全理解或解釋。我們感知世界的方式、感受事物的質感、觸覺、視覺、聽覺、嗅覺等等都是屬於感質。

感質,指的是個人直接體驗的主觀感受,被認為無法通過客觀描述或第三人稱觀察來完全理解或解釋。圖/wikipedia

舉一個例子。若是把一顆紅蘋果放在大家面前,詢問蘋果這是什麼顏色,相信大家應該都會說這是紅色。然而,雖然科學能解釋紅色是因為有波長約 620 到 750 奈米的光,刺激到視網膜的錐細胞,產生一連串的神經反應,最後形成大腦的表徵,但卻無法解釋我們對紅色的主觀感受是怎麼形成的。

哲學家們也常思考,你看到的紅色,和我看到的紅色究竟是否一樣,是否有可能我眼中的紅其實是你眼中的綠。

-----廣告,請繼續往下閱讀-----

舉另一個例子,這件數年前爆紅的衣服,你覺得是藍色與黑色相間,還是白色與金色相間呢?

另外,像是這張圖究竟是兔子還是鴨子?

圖/wikipedia

這張圖究竟是狗還是小女孩?

明明有張客觀的圖片存在,每個人的主觀感受卻有不同的答案。

-----廣告,請繼續往下閱讀-----

「困難問題」(Hard problem of consciousness)是找不到答案的問題?

在意識賭局中的哲學家戴維・查爾莫斯,就提出感質以及主觀經驗為什麼(why)存在以及如何(how)產生是所謂的困難問題(Hard problem of consciousness),相較於簡單的問題是討論意識相關的功能和行為,困難問題涉及意識的經驗(現象、主觀),是沒辦法客觀觀察測量。也就是這個問題,是沒有答案的。

舉一個屬於困難問題的例子,明明都只是大腦的神經在放電,為何某些神經放電後會導致飢餓感而不是其他感覺,譬如口渴?他認為即使沒有飢餓這種「感覺」,飢餓衍伸出的行為,例如進食,也可以發生。因此這些產生的感覺,無法單純簡化由大腦等物理系統解釋。

圖/giphy

然而,困難問題的說法其實也存在爭論。根據 2020 年哲學期刊文章的互動式學術資料庫 PhilPapers 的調查, 29.72% 的受訪哲學家認為難題不存在,而 62.42% 的受訪哲學家認為難題是一個真正的問題。

也有一群神經科學家們雖然接受困難問題的存在,卻也認為困難問題未來可以被解決,又或是被證明這不是一個真正的問題。並開啟了他們對於意識相關神經區(neural correlates of consciousness)簡稱 NCC 的研究發展,試圖找到足以產生意識的最小神經集合。

-----廣告,請繼續往下閱讀-----
精神科學家開啟對於意識相關神經區(neural correlates of consciousness)簡稱 NCC 的研究發展,試圖找到足以產生意識的最小神經集合。圖/PanSci YouTube

但 NCC 的研究被認為最多只能找到神經反應與意識的相關性,解決的仍然只是簡單問題而非困難問題。為了突破 NCC 本身的限制,人們又開始轉往重視意識理論(theories of consciousness (ToCs))的發展。希望透過意識理論來超越以 NCC 為基礎的方法論,轉向提供更具解釋性見解的意識模型。

在意識模型這邊還在爭論不休,讓我們先把鏡頭換到神經學家這一邊。

研究科技進步,為意識研究帶來哪些幫助?

面對意識這個艱難的大哉問,克里斯托夫・科赫當初怎麼那麼有自信,敢發起這個看起來勝算就不大的挑戰呢?有那麼愛喝嗎?

1998 年,年輕有為的克里斯托夫・科赫已經是加州理工學院的助理教授,並和生命科學領域大咖中的大咖弗朗西斯・克里克,合作研究意識這個主題。沒錯,就是和華生一同發現 DNA 是雙股螺旋結構的克里克。除此之外,克里斯托夫還擁有物理的碩士學位,擁有跨領域的知識,讓他更加相信透過實證的方式,能找到意識的神經機制。

-----廣告,請繼續往下閱讀-----
克里斯托夫・科赫合作研究意識的對象便是與華生一同發現 DNA 是雙股螺旋結構的弗朗西斯・克里克。圖/PanSci YouTube

當時有許多大腦研究的技術蓬勃發展,像是功能性磁振造影(fMRI)已經獲得廣泛使用,使得科學家們能在對象進行活動或是受外界刺激時,同步從大腦血氧濃度的變化來推斷神經反應。

此外,光學遺傳學(optogenetics)技術也在那個時期開始萌芽,這讓研究者能用極佳的時間解析度來調控特定的大腦神經元,並藉此解碼大腦的秘密。舉例來說,現在的光學遺傳學能讓科學家們鎖定小鼠的特定神經細胞,並在小鼠頭上裝上 LED 光纖,只要開啟 LED 的光刺激,那些特定神經細胞就會興奮或抑制。藉由觀察小鼠行為的變化,就能了解不同行為表現是由哪些神經元所調控。

現在的光學遺傳學能讓科學家們鎖定小鼠的特定神經細胞。圖/PanSci YouTube

厲害的是,在 1979 年光學遺傳學的技術還未誕生前,克里克就認為如果想要了解大腦的運作,精準控制大腦中一種類型的所有細胞是非常重要的,而若想要有極佳的時間和空間精細度,必須使用光的技術,這與後來光學遺傳學的發明不謀而合。

有了這些科技加持,長達 25 年對於意識的賭注也即將來到結局。

-----廣告,請繼續往下閱讀-----

所以,誰贏了賭注?

2023 年 6 月 23 日,在科學意識研究協會的年會上,揭曉了這長達 25 年的賭局。神經科學家克里斯托夫・科赫(Christof Koch)最終承認,目前還不能解釋大腦的神經元是如何產生意識,並買了一箱好葡萄酒(1978 Madeira)給哲學家戴維・查爾莫斯(David John Chalmers)實現諾言。

克里斯托夫・科赫最終承認,目前還不能解釋大腦的神經元是如何產生意識,並買了一箱好葡萄酒給戴維・查爾莫斯。圖/PanSci YouTube

當然,這不是說意識的來源永遠沒有解答,只是當初賭局設下的 25 年時限到了。實際上到了 2018 年,他們兩位根本都忘了這場賭局,直到一位科學記者佩爾・斯納普魯德重新提及這個話題,才讓大家重新想起。

恰巧那個時間點,克里斯托夫・科赫和戴維・查爾莫斯都參與了鄧普頓世界慈善基金會支持加速意識研究的大型項目。該計畫建立一系列意識理論的「對抗性」實驗,希望透過讓兩個或多個持相反觀點的競爭對手共同合作研究,來挑戰各種意識假設。

意識理論的百家爭鳴

而其中包含兩個著名的意識理論,全局工作空間理論(Global Workspace Theory (GWT))和整合資訊理論(Integrated Information Theory (IIT))。

-----廣告,請繼續往下閱讀-----
全局工作空間理論(Global Workspace Theory (GWT))。圖/PanSci YouTube

全局工作空間理論(Global Workspace Theory (GWT))的概念,最早是由認知科學家伯納德・巴爾斯和斯坦・富蘭克林在 1980 年代晚期提出。他們認為意識的產生就像是劇場聚光燈一樣,當這個意識劇場透過名為選擇性注意的聚光燈在舞台上照出內容,我們就會產生意識情境。這聚光燈的投射也代表著全局工作空間,只有當感官輸入、記憶或內在表徵受到注意時,它們才有機會整合成為全局工作空間的一部分,被我們主觀意識到。而我們的行為決策,也是透過這個全局工作空間整合訊息,並分配到其他系統所產生。目前認為全局工作是發生於大腦前方的前額葉區域。

整合資訊理論(Integrated Information Theory (IIT))。圖/PanSci YouTube

與全局工作空間理論打對臺的,是整合資訊理論(Integrated Information Theory (IIT)),最早由朱利奧・托諾尼(Giulio Tononi)在 2004 年提出。這理論認為,意識背後是有數學以及物理為基礎的因果關係。應該先肯定意識的存在,再回推尋找其背後的物質基礎,並認為主觀意識是由客觀的感覺經驗產生的。克里斯托夫・科赫就是此理論的擁護者,他進一步認為,意識背後的那個神經機制,就存在於大腦後方後皮質熱區(Posterior cortical hot zone),包括頂葉、顳葉和枕葉的感覺皮質區域。

讓我們稍微總結一下兩者差異:

全局工作空間理論——

  • 意識只能透過訊息投射到一個稱做「全局工作空間」之後才能呈現
  • 訊息本身不會形成意識
  • 訊息要被注意到才會產生意識

整合資訊理論——

  • 意識存在
  • 產生的關鍵是需要將大腦處理感覺的皮質區域訊息整合

然而,經過六個獨立實驗室的研究,雖然有較多的證據支持整合資訊理論,但兩個理論都存在缺陷和質疑,直到目前都尚未有明確解答能解釋意識的神經機制,這也讓克里斯托夫・科赫大方承認自己輸掉了這 25 年的賭局。

隨著科學測量技術的演進以及越來越多的研究進展,有一些神經科學家認為意識理論即將崛起,目前的狀態只不過是一種研究過渡期。科學哲學家托馬斯・庫恩(Thomas Kuhn)將這種過渡期以「前典範式」(preparadigmatic science)來形容,認為一門不成熟的科學在成熟前,會面臨相互競爭的思想流派並各說各話。就像是當初達爾文提出演化論的物競天擇前有拉馬克主義、災變論與均變論來試圖解釋物種起源一樣。

下一場賭約?

雖然這次的打賭由戴維・查爾莫斯獲得一勝,但克里斯托夫・科赫在今年加倍賭注,認為下一個 25 年他一定會贏。到時候克里斯托夫已經 91 歲,戴維 82 歲了。

大家別擔心,這一集是會員共同選出來的題目, 25 年之後,我們也會再為各位泛糰做一集討論賭局的結果。

最後也想問問大家, 25 年之後,你賭這場對決會是誰贏呢?

  1. 我壓在克里斯托夫・科赫身上,我們一定能解開意識之謎
  2. 我賭戴維・查爾莫斯,意識這個問題,可能很難用科學來解釋
  3. 在那之前, AI 可能都已經有意識了,直接問 AI 還比較快

趕快來留言吧,記得 25 年後要回來看啊!

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 2
PanSci_96
1262 篇文章 ・ 2494 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。