Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

設計產品時,只考慮一種感官可不行──《用大腦行為科學玩行銷》

PanSci_96
・2017/05/10 ・3918字 ・閱讀時間約 8 分鐘 ・SR值 510 ・六年級

  • 【科科愛看書】你覺得自己是明辨是非、智慧超群的科青,但面對五花八門的商品就是無法割捨?購物車裡總是堆滿待買清單、每到月底就感到扼腕……這到底是什麼疾病啊啊啊!還請各位莫急莫慌莫害怕,容《用大腦行為科學玩行銷:操控潛意識,顧客不自覺掏錢買單,賣什麼都暢銷》向你道出決策之後的腦科學,相信在了解潛意識的力量之後,無論你是消費者或是行銷人,都能夠荷包滿滿、財源滾滾來呀

把感覺聯在一起,讓你更有想像力

有個與大腦的跨感官整合相關、十分有趣的研究領域「聯覺」──(synesthesia,亦稱「共感覺」)──是與擁有特殊感覺的人相關的研究。例如說聯覺者或許會覺得數字、星期等文字帶有顏色,比方說會覺得「1」是紅色、「2」是綠色、「3」是黃色;或者「星期一」是藍色、「星期二」是紅色、「星期三」是黃色……等等。

你的每一天有沒有自己的顏色呢?圖/By Kelley@flickr

據說約每兩百人中有一個人擁有這項特殊的感覺;藝術家或小說家等創造力豐富的族群裡,擁有聯覺的比例則較一般人高出八倍。美國的著名腦科學家拉馬錢德蘭(Vilayanur  S. Ramachandran)博士認為,能成為藝術家或小說家,腦中擁有能夠結合毫無關係的兩者、有創造出隱喻(metaphor)的能力。

然而聯覺──結合不同感官傳入的資訊──絕非特殊族群才具備的能力,有個研究可以說明這點。

實驗假設外星人來到地球上,他們也和人類同樣使用文字,即圖 4 所示的兩個圖案;其中一個圖案是火星語的「布巴」(bouba)另一個則是「奇奇」(kiki)。實驗人員會詢問研究對象,「你覺得哪個圖案搭配哪個外星詞彙呢?」

-----廣告,請繼續往下閱讀-----

各位讀者,你又會怎麼回答呢?

你覺得誰是「布巴」(bouba)誰是「奇奇」(kiki)呢?圖/《用大腦行為科學玩行銷》提供

實驗結果──可能和許多讀者的答案相同── 98%的人會回答尖尖刺刺的圖案是「奇奇」,像變形蟲一樣的圖案則是「布巴」。就像從這個實驗中可以理解到的一樣,從視覺進入的「圖案資訊」,和從聽覺進入的「詞彙發音資訊」在腦中受到統合,而被認知為擁有相同的屬性。這可以想成「聯覺」的一種。

還有一個重點,大家應該是第一次看到這些圖案和詞彙,當筆者在講習會等說明這項實驗,並請聽眾舉手投票時,實驗結果和在美國所做的原始實驗也大致相同。也就是說,像這樣的圖案和聲音聯覺,有可能不受人種或文化影響而有相同的答案;至少「布巴」、「奇奇」和與之聯結的圖案,是相當普遍、跨國界的組合。

根據實驗結果,可以看出公司名稱(文字)和品牌標誌(圖像)、商品名稱(文字)和商品包裝(圖像)間的重要關連性。如果這兩者之間的關係性不佳,或許會讓很多人在潛意識中覺得不自然,而這份「不自然」的感覺,則可能成為妨礙購買降低評價的要因。因此,理解人類有結合各類感官資訊的能力,對商品開發、廣告行銷和公司經營都很重要。

不同的會議室,讓你變成另個人

人在潛意識中,會透過五感等各式各樣的感覺器官來持續獲得與自己周邊環境(或許應該說對大腦而言的周邊環境會更加合適)有關的資訊。大腦會在潛意識中處理進入的資訊,必要時進行各種決策和行動。當然會廢棄不需要的資訊,但並非以你的意識去判斷需要或不需要,而是大腦在潛意識中決定。

-----廣告,請繼續往下閱讀-----

就像我們在用餐時,可能使用視覺、嗅覺加上味覺,甚至是觸覺去作為感測器,來收集重要的資訊。而這並不只是在用餐的時候而已。作為「應用腦科學聯盟」活動的一環,有個由日本五大建設公司之一的竹中工務店、京都大學和早稻田大學等合作進行的實驗。他們合成穿著西裝的商務人士照片與各種會議室景象的照片,讓受試者來評價照片中的人物。

結果,即使人物相同,也會因為背景的會議室景象,比方說可能是舉行董事會的氣派會議室,或作為一般會議室使用的明亮空間,但隨著牆壁的顏色、桌椅的設計等等,背景氛圍一旦不同,對於照片中人物的評價也會改變。在某個背景中覺得看起來值得信賴、充滿生氣的人,在別的會議室背景中魅力度卻下降,或是看起來感覺冷酷無情。也就是說受試者看了照片,要評價照片中的人物時,背景的資訊會帶來影響。

不同的辦公室會讓受試者對同一個人產生不同的評價。圖/By cdu445@Pixabay

受試者所受到的指示是評價人物,一般來說不需要注意背景,意識應該是集中在人物上面才對。可是,視覺認為背景也包含在資訊當中,將所有的資訊都輸入大腦。這和通常用相機拍攝人物的時候,雖然會以人物為主,但是不會排除掉背景資訊是相同的。

透過相機鏡頭所獲得的圖像,和人類從視覺所獲得的資訊是同樣的。如果說用相機所捕捉的圖像,想要只聚焦在人物身上的話,也可以將人物的部分剪裁下來移動到單色的背景上。可是對大腦來說,背景或許也是重要資訊。當大腦判斷為重要的話,和受試者的意志無關,大腦會將這些資訊留在記憶中,在進行決策時活用。

-----廣告,請繼續往下閱讀-----

看人還是看景?東西方大不同

有個很有趣的實驗說明了這個重點。這是加拿大阿爾伯塔大學(University  of Alberta)增田貴彥(Takahiko Masuda)副教授與其團隊,進行的美國人與亞洲人比較研究。此研究請受試者拍攝人物,之後比較人物臉部大小與照片面積的比率。結果發現,美國人拍到的臉部面積比率較高。

這說明美國人是以「人」,特別是以「臉部」為中心來拍攝,因此包含的背景相對較少。亞洲人則傾向拍攝人物的全身像,也包含了照片主角的周圍環境。

從這一點來看,可以知道潛意識中美國人會聚焦在對象身上,亞洲人則在潛意識中傾向考量整體的平衡性。其實,還有許多這樣的實驗,並且每個都是相同的結論。

潛意識中,美國人聚焦在對象,亞洲人考量平衡。圖/By Alexas_Fotos@Pixabay

比方說,解析看到人物合照時的視線移動,亞洲人的視線會觀看照片整體,歐美人的視線停留在照片中心人物身上的時間比較長。此外,讓受試者看風景畫的照片或圖畫,之後詢問記得哪些部分時,亞洲人會針對整體來回答,歐美人則有針對被拍攝的主體來回答的傾向。

-----廣告,請繼續往下閱讀-----

也有像這樣的實驗:分別有手拿著杯內裝有冰咖啡的小組,以及手拿著杯內裝有熱咖啡的小組,這兩個小組對他人的寬容度會表現出差異,手拿熱咖啡的小組對於他人顯得較為寬大。此外,面試官讓一個小組把履歷表夾在比較重的文件夾,再讓另外一個小組把履歷表夾在比較輕的文件夾,結果履歷表夾在厚重文件夾的小組,更加認真地參與面試。

建築領域中,也有針對天花板高度和工作之間關係的實驗,結果發現較高的天花板適合創作型的工作,低天花板則適合較精密的作業。此外,較多曲線、重視設計感的家具,跟四四方方、充滿角度的家具比起來,帶圓弧造型、有曲線的家具讓人感覺放鬆度較高。

這些實驗顯示出,人在潛意識中也會活用注目焦點以外的資訊,並為了活用而收集這些資訊,很有可能因為文化而使得影響程度有所差異。

 無意識的「體現認知」能左右行為

再介紹另外一個實驗。這是以電腦或遊戲機常有的賽車遊戲所進行,讓受試者使用性能完全相同、但車身包覆有不同標誌的汽車(實際上都是同一台)來進行遊戲。標誌的種類有五種:紅牛(Red Bull)、可口可樂(Coca Cola)、健力士啤酒(Guinness)、純品康納(Tropicana),以及沒有品牌。

-----廣告,請繼續往下閱讀-----

汽車的性能都一樣,因此不論比賽幾次,分別成為第一名到第五名(最後一名)的次數應該差不多才對。實際上,這五種汽車當中,有四種就是這樣的結果。但是,其中一種標誌的結果與眾不同;這款車成為第一名和第五名的次數特別多。這應該是因為,操縱者更喜歡用這種標誌的車在直線上提升速度,轉彎時的減速幅度也比較少,因此容易拿到第一名;另一方面,也是因為速度快,或硬要轉彎,而容易衝出賽道,或是和其他車輛碰撞,所以容易落到第五名。

而究竟是哪台標誌的車有這項結果呢?答案是「紅牛」。在這實驗中,可以了解「紅牛能量飲料」的品牌形象不只是影響飲料的味道或選擇,也可能影響到行動。

「紅牛」讓你狂奔如牛!圖/By schuger@Pixabay

像這樣,人只是自己沒有察覺到,其實在無意識中會活用由感覺器官所獲得的環境資訊來進行決策,並且付諸行動。如此與環境之間的相互作用而進行的認知活動和影響,在專門用語中稱為「體現認知」(embodied cognition)。

大腦認知偏差、跨感官整合模式、聯覺和體現認知等,不管是從飲料到建築物、消費者到店員、市場行銷到管理……在所有的商務層面中都會產生作用。不論哪一項都是在我們沒有發現到的無意識狀態下,大腦逕自進行判斷。因為是大腦擅自在無意識中進行的決策和行動,因此即使透過主觀性的問卷調查或團體訪問,也很難讓「無意識」做的事浮現到意識層面。

-----廣告,請繼續往下閱讀-----

因為如此,透過大腦測量或心理物理實驗來了解消費者的大腦特性,或是藉此評估商品或服務、品牌的潛在影響,甚至是員工的工作意願等等,都是現在商務業界所需要的。


《用大腦行為科學玩行銷:操控潛意識,顧客不自覺掏錢買單,賣什麼都暢銷》書封

 

本文摘自用大腦行為科學玩行銷:操控潛意識,顧客不自覺掏錢買單,賣什麼都暢銷方言文化出版。

-----廣告,請繼續往下閱讀-----
文章難易度
PanSci_96
1262 篇文章 ・ 2498 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

3
1

文字

分享

0
3
1
為機器人換上「物理大腦」:一場終結AI數位囚禁的革命
鳥苷三磷酸 (PanSci Promo)_96
・2025/09/03 ・5732字 ・閱讀時間約 11 分鐘

本文與 研華科技 合作,泛科學企劃執行

我們都看過那種影片,對吧?網路上從不缺乏讓人驚嘆的機器人表演:數十台人形機器人像軍隊一樣整齊劃一地耍雜技 ,或是波士頓動力的機器狗,用一種幾乎違反物理定律的姿態後空翻、玩跑酷 。每一次,社群媒體總會掀起一陣「未來已來」、「人類要被取代了」的驚呼 。

但當你關掉螢幕,看看四周,一個巨大的落差感就來了:說好的機器人呢?為什麼大街上沒有他們的身影,為什麼我家連一件衣服都還沒人幫我摺?

這份存在於數位螢幕與物理現實之間的巨大鴻溝,源於一個根本性的矛盾:當代AI在數位世界裡聰明絕頂,卻在物理世界中笨拙不堪。它可以寫詩、可以畫畫,但它沒辦法為你端一杯水。

-----廣告,請繼續往下閱讀-----

這個矛盾,在我們常見的兩種機器人展示中體現得淋漓盡致。第一種,是動作精準、甚至會跳舞的類型,這本質上是一場由工程師預先寫好劇本的「戲」,機器人對它所處的世界一無所知 。第二種,則是嘗試執行日常任務(如開冰箱、拿蘋果)的類型,但其動作緩慢不穩,彷彿正在復健的病人 。

這兩種極端的對比,恰恰點出了機器人技術的真正瓶頸:它們的「大腦」還不夠強大,無法即時處理與學習真實世界的突發狀況 。

這也引出了本文試圖探索的核心問題:新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦,真的能終結機器人的「復健時代」,開啟一個它們能真正理解、並與我們共同生活的全新紀元嗎?

新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦 / 圖片來源:研華科技

為何我們看到的機器人,總像在演戲或復健?

那我們怎麼理解這個看似矛盾的現象?為什麼有些機器人靈活得像舞者,有些卻笨拙得像病人?答案,就藏在它們的「大腦」運作方式裡。

-----廣告,請繼續往下閱讀-----

那些動作極其精準、甚至會後空翻的機器人,秀的其實是卓越的硬體性能——關節、馬達、減速器的完美配合。但它的本質,是一場由工程師預先寫好劇本的舞台劇 。每一個角度、每一分力道,都是事先算好的,機器人本身並不知道自己為何要這麼做,它只是在「執行」指令,而不是在「理解」環境。

而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。

這就像教一個小孩走路,你可以抱著他,幫他擺動雙腿,看起來走得又快又穩,但那不是他自己在走。真正的學習,是他自己搖搖晃晃、不斷跌倒、然後慢慢找到平衡的過程。過去的機器人,大多是前者;而我們真正期待的,是後者。

所以,問題的核心浮現了:我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好?

-----廣告,請繼續往下閱讀-----
我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好? / 圖片來源:shutterstock

機器人的大腦,為什麼不能放在雲端?

聽起來好像很合理,對吧?把所有複雜的運算都交給雲端最強大的伺服器,機器人本身只要負責接收指令就好了。但……真的嗎?

想像一下,如果你的大腦在雲端,你看到一個球朝你飛過來,視覺訊號要先上傳到雲端,雲端分析完,再把「快閃開」的指令傳回你的身體。這中間只要有零點幾秒的網路延遲,你大概就已經鼻青臉腫了。

現實世界的互動,需要的是「即時反應」。任何網路延遲,在物理世界中都可能造成無法彌補的失誤 。因此,運算必須在機器人本體上完成,這就是「邊緣 AI」(Edge AI)的核心概念 。而 NVIDIA  Jetson 平台,正是為了解決這種在裝置端進行高運算、又要兼顧低功耗的需求,而誕生的關鍵解決方案 。

NVIDIA Jetson 就像一個緊湊、節能卻效能強大的微型電腦,專為在各種裝置上運行 AI 任務設計 。回顧它的演進,早期的 Jetson 系統主要用於視覺辨識搭配AI推論,像是車牌辨識、工廠瑕疵檢測,或者在相機裡分辨貓狗,扮演著「眼睛」的角色,看得懂眼前的事物 。但隨著算力提升,NVIDIA Jetson 的角色也逐漸從單純的「眼睛」,演化為能夠控制手腳的「大腦」,開始驅動更複雜的自主機器,無論是地上跑的、天上飛的,都將NVIDIA Jetson 視為核心運算中樞 。

-----廣告,請繼續往下閱讀-----

但再強大的晶片,如果沒有能適應現場環境的「容器」,也無法真正落地。這正是研華(Advantech)的角色,我們將 NVIDIA Jetson 平台整合進各式工業級主機與邊緣運算設備,確保它能在高熱、灰塵、潮濕或震動的現場穩定運行,滿足從工廠到農場到礦場、從公車到貨車到貨輪等各種使用環境。換句話說,NVIDIA 提供「大腦」,而研華則是讓這顆大腦能在真實世界中呼吸的「生命支持系統」。

這個平台聽起來很工業、很遙遠,但它其實早就以一種你意想不到的方式,進入了我們的生活。

從Switch到雞蛋分揀員,NVIDIA Jetson如何悄悄改變世界?

如果我告訴你,第一代的任天堂Switch遊戲機與Jetson有相同血緣,你會不會很驚訝?它的核心處理器X1晶片,與Jetson TX1模組共享相同架構。這款遊戲機對高效能運算和低功耗的嚴苛要求,正好與 Jetson 的設計理念不謀而合 。

而在更專業的領域,研華透過 NVIDIA Jetson 更是解決了許多真實世界的難題 。例如

-----廣告,請繼續往下閱讀-----
  • 在北美,有客戶利用 AI 進行雞蛋品質檢測,研華的工業電腦搭載NVIDIA Jetson 模組與相機介面,能精準辨識並挑出髒污、雙黃蛋到血蛋 
  • 在日本,為避免鏟雪車在移動時發生意外,導入了環繞視覺系統,當 AI 偵測到周圍有人時便會立刻停止 ;
  • 在水資源珍貴的以色列,研華的邊緣運算平台搭載NVIDIA Jetson模組置入無人機內,24 小時在果園巡航,一旦發現成熟的果實就直接凌空採摘,實現了「無落果」的終極目標 。

這些應用,代表著 NVIDIA Jetson Orin™ 世代的成功,它讓「自動化」設備變得更聰明 。然而,隨著大型語言模型(LLM)的浪潮來襲,人們的期待也從「自動化」轉向了「自主化」 。我們希望機器人不僅能執行命令,更能理解、推理。

Orin世代的算力在執行人形機器人AI推論時的效能約為每秒5到10次的推論頻率,若要機器人更快速完成動作,需要更強大的算力。業界迫切需要一個更強大的大腦。這也引出了一個革命性的問題:AI到底該如何學會「動手」,而不只是「動口」?

革命性的一步:AI如何學會「動手」而不只是「動口」?

面對 Orin 世代的瓶頸,NVIDIA 給出的答案,不是溫和升級,而是一次徹底的世代跨越— NVIDIA Jetson Thor 。這款基於最新 Blackwell 架構的新模組,峰值性能是前代的 7.5 倍,記憶體也翻倍 。如此巨大的效能提升,目標只有一個:將過去只能在雲端資料中心運行的、以 Transformer 為基礎的大型 AI 模型,成功部署到終端的機器上 。

NVIDIA Jetson Thor 的誕生,將驅動機器人控制典範的根本轉變。這要從 AI 模型的演進說起:

-----廣告,請繼續往下閱讀-----
  1. 第一階段是 LLM(Large Language Model,大型語言模型):
    我們最熟悉的 ChatGPT 就屬此類,它接收文字、輸出文字,實現了流暢的人機對話 。
  2. 第二階段是 VLM(Vision-Language Model,視覺語言模型):
    AI 學會了看,可以上傳圖片,它能用文字描述所見之物,但輸出結果仍然是給人類看的自然語言 。
  3. 第三階段則是 VLA(Vision-Language-Action Model,視覺語言行動模型):
    這是革命性的一步。VLA 模型的輸出不再是文字,而是「行動指令(Action Token)」 。它能將視覺與語言的理解,直接轉化為控制機器人關節力矩、速度等物理行為的具體參數 。

這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。

NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技

其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。

好,我們有了史上最強的大腦。但一個再聰明的大腦,也需要一副強韌的身體。而這副身體,為什麼非得是「人形」?這不是一種很沒效率的執念嗎?

為什麼機器人非得是「人形」?這不是一種低效的執念嗎?

這是我一直在思考的問題。為什麼業界的主流目標,是充滿挑戰的「人形」機器人?為何不設計成效率更高的輪式,或是功能更多元的章魚型態?

-----廣告,請繼續往下閱讀-----

答案,簡單到令人無法反駁:因為我們所處的世界,是徹底為人形生物所打造的。

從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。

這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。

人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態 / 圖片來源:shutterstock

但要讓一個「多面手」真正活起來,光有骨架還不夠。它必須同時擁有強大的大腦平台與遍布全身的感知神經,才能理解並回應外在環境。人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態。但這些訊號若沒有通過一個穩定的「大腦平台」,就無法匯聚成有意義的行動。

這正是研華的角色:我們不僅把 NVIDIA Jetson Thor 這顆核心晶片包載在工業級電腦中,讓它成為能真正思考與反應的「完整大腦」,同時也提供神經系統的骨幹,將感測器、I/O 介面與通訊模組可靠地連結起來,把訊號傳導進大腦。你或許看不見研華的存在,但它實際上遍布在機器人全身,像隱藏在皮膚之下的神經網絡,讓整個身體真正活過來。

但有了大腦、有了身體,接下來的挑戰是「教育」。你要怎麼教一個物理 AI?總不能讓它在現實世界裡一直摔跤,把一台幾百萬的機器人摔壞吧?

打造一個「精神時光屋」,AI的學習速度能有多快?

這個問題非常關鍵。大型語言模型可以閱讀網際網路上浩瀚的文本資料,但物理世界中用於訓練的互動資料卻極其稀缺,而且在現實中反覆試錯的成本與風險實在太高 。

答案,就在虛擬世界之中。

NVIDIA Isaac Sim™等模擬平台,為這個問題提供了完美的解決方案 。它能創造出一個物理規則高度擬真的數位孿生(Digital Twin)世界,讓 AI 在其中進行訓練 。

這就像是為機器人打造了一個「精神時光屋」 。它可以在一天之內,經歷相當於現實世界千百日的學習與演練,從而在絕對安全的環境中,窮盡各種可能性,深刻領悟物理世界的定律 。透過這種「模擬-訓練-推論」的 3 Computers 閉環,Physical AI (物理AI) 的學習曲線得以指數級加速 。

我原本以為模擬只是為了節省成本,但後來發現,它的意義遠不止於此。它是在為 AI 建立一種關於物理世界的「直覺」。這種直覺,是在現實世界中難以透過有限次的試錯來建立的。

所以你看,這趟從 Switch 到人形機器人的旅程,一幅清晰的未來藍圖已經浮現了。實現物理 AI 的三大支柱已然齊備:一個劃時代的「AI 大腦」(NVIDIA Jetson Thor)、讓核心延展為「完整大腦與神經系統」的工業級骨幹(由研華 Advantech 提供),以及一個不可或缺的「教育環境」(NVIDIA Isaac Sim 模擬平台) 。

結語

我們拆解了那些酷炫機器人影片背後的真相,看見了從「自動化」走向「自主化」的巨大技術鴻溝,也見證了「物理 AI」時代的三大支柱——大腦、身軀、與教育——如何逐一到位 。

專家預測,未來 3 到 5 年內,人形機器人領域將迎來一場顯著的革命 。過去我們只能在科幻電影中想像的場景,如今正以前所未有的速度成為現實 。

這不再只是一個關於效率和生產力的問題。當一台機器,能夠觀察我們的世界,理解我們的語言,並開始以物理實體的方式與我們互動,這將從根本上改變我們與科技的關係。

所以,最後我想留給你的思想實驗是:當一個「物理 AI」真的走進你的生活,它不只是個工具,而是一個能學習、能適應、能與你共同存在於同一個空間的「非人智慧體」,你最先感受到的,會是興奮、是便利,還是……一絲不安?

這個問題,不再是「我們能否做到」,而是「當它發生時,我們準備好了嗎?」

研華已經整裝待發,現在,我們與您一起推動下一代物理 AI 與智慧設備的誕生。
https://bit.ly/4n78dR4

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

9
5

文字

分享

0
9
5
聲音是什麼顏色、什麼味道?談聯覺與跨感官反應
雅文兒童聽語文教基金會_96
・2023/12/21 ・3162字 ・閱讀時間約 6 分鐘

  • 文/陳品均|雅文基金會聽語科學研究中心 助理研究員

星期一,聽起來是什麼顏色?

先別急著回答藍色,對某些人來說,這個答案可不是受到情緒經驗的影響,而是真實的色彩反應。

星期怎麼可能聽起來有顏色?事實上,根據研究大約有 4% 左右的人[1],在某個認知或感官接收資訊刺激後,另一種感覺或認知會同步自發的出現,並且具有特定規律,此反應與刺激本身並不一定相關,這些人被稱為聯覺者,擁有像是聽到聲音時,除了聲音的反應外,同時認知到了形狀或顏色等的特徵。

舉例而言,若一位聯覺者聽見 A,除了聲音 A 以外還自動產生了它是紅色的聯覺認知,則不論是在 Apple 或 Angel 中,A 對他而言都是紅色的,不會因為 Angel 比較常以白色的型態出現,便轉換成白色的 A。在學界,聯覺的發展和原因尚在探索中,有些研究指出可能與小時候接觸抽象觀念時的發展、遺傳以及大腦神經機制有關 [2、3]

聽覺及視覺的聯覺者在聽到詞彙時,除了聲音外,同時自動產生了色彩的認知反應。(圖片來源:作者自行繪製)

隨著聯合反應的感官組成不同,聯覺者的異能經驗也五花八門

你能想像當單一感官接收某一訊息時,同時產生另一感官的不同認知是怎樣的經驗嗎?BBC 的科普節目《Horizon》其中一集< Derek Tastes of Earwax >記錄了數名聯覺者的跨感官連結經驗。其中,一名酒吧老闆兼有聽覺和味覺的聯覺,當他聽見各式各樣的詞彙時,宛如品嚐綜合風味豆,讓他飽嘗各種滋味[4]

-----廣告,請繼續往下閱讀-----
聽覺和味覺的聯覺者,聽見各種名詞之際,嘴巴就像是咀嚼著各種滋味。(圖片來源:pexels

另一名受訪者是聽覺及視覺的聯覺者,經實驗後科學家發現,若聽到數字或是月份日期時,這名受訪者的腦部除了聽覺區域外,視覺區域也會產生反應。特別的是,他本身是一名視覺障礙者。

聽覺及視覺的視障聯覺者聽到日期時,腦部視覺及聽覺區域都有反應。(圖片來源:作者自行繪製)

感官認知上特別的連結,讓聯覺者所經驗的世界像是搭載了酷炫的特效般,使他們在藝術創作及記憶上屢有出色的表現,代表人物有:知名文學《蘿莉塔》作者 Nabokov[5]、以引起聽眾共鳴聞名的音樂家 Olivier Messiaen、表現主義的經典畫家 Wassily Kandinsky 等。若想檢視自身是否為天選之人的聯覺者,除了自我覺察是否有異於常人的跨感官連結反應外,目前也有相關的測驗[6]可以參考。

你我的類聯覺」跨感官反應

若說聯覺是天生具有特別音感的人,那麼跨感官反應肯定就是音樂家們透過經驗累積產生的直覺判斷,兩者不盡相同、卻又有其類似之處。那麼,不具有聯覺的異能,我們難道只能認命當麻瓜了嗎?

別急,縱使不是聯覺者,普通人也多少會有類似聯覺的經驗,這樣的類聯覺稱作跨感官反應,往往在我們渾然不覺時,悄悄地舉辦同樂會,並影響人們的喜好、感知和行為等。

-----廣告,請繼續往下閱讀-----

先來看看研究者們發現的有趣現象,請看這兩個形狀:

圖片來源:作者自行繪製

過去曾有研究者以 bouba 及 kiki 兩個虛構詞進行實驗,九成受訪者傾向認為雲朵狀的形狀是 bouba,尖銳的形狀則被認為是 kiki,即使這些受訪者其實並不認識兩個假詞,但基於聲音和形狀的特徵,卻讓多數人做出這樣的選擇[7]

後續研究者也繼續投入各式各樣以不同語言文化環境為背景、不同年齡階層為對象的研究,有趣的是,結果顯示此現象幾乎是跨語言、跨文化、跨地域存在的,甚至在少與外界互動的部落居民,或是尚未識字的幼兒身上,也有這類從聲音特徵影響其視覺形狀感知歸類的效應 [8、9、10]。除了虛構的詞彙以外,有些研究者使用真實存在的詞彙(如:Bob 及 Kirk),來對應圓潤及尖銳的剪影或人臉,最後也有相似的結果[11、12]

一般人的經驗和認知,往往加速催化感官間的互相影響

除了語言與形狀外,我們生活中還有許多感官互相影響的例子,來試試看下面這張圖,你聽見聲音了嗎?

-----廣告,請繼續往下閱讀-----
(圖片來源:GIPHY

瑞克搖(Rickrolled)的影片在 2019 年突破了 10 億次的 youtube 觀看次數[13、14],迷因化後大量的連結及有聲影片傳播,使得曾經的觀眾在看見這張圖時根據經驗,腦海中自然出現了<Never Gonna Give You Up>的旋律。

然而,不同於聯覺,若沒有經驗累積,跨感官的反應便無法被觸發,以上圖為例,即便觀看次數如此驚人,對於未曾接觸過此影片的人而言,由於缺乏經驗和認知的累積,在看見該張圖片時,理所當然也無法產生相對的聲音反應。

將跨感官反應置入在行銷中的策略,現正流行中!

在大量接收資訊的生活中,我們不自覺地累積了許多感官經驗,成為由單一感官啟動與其他感官同步作用的引線。行銷高手們從中嗅出了商機,精明的將消費者們不由自主產生的跨感官反應也算進了商業行銷的一環。如:某知名咖啡品牌在過去曾進行一項實驗,將兩杯一樣的咖啡配以不同的音效提供給不知情的消費者。前一杯搭配液體沖入便宜咖啡杯、攪拌,模仿沖泡即溶咖啡的聲音,另一杯則在播放磨豆聲、蒸氣聲以及倒進陶瓷杯的聲響後,再次提供給消費者,結果發現在不同的聲音所營造的環境氛圍下,同樣的兩杯咖啡,人們覺得後一杯更加濃醇香,並願意為之付出更高的金額[15]

近年熱門的 ASMR 亦是味覺和聽覺的跨感官應用,若想了解更多,別錯過之前的專欄文章﹤加點「聲音調味料」,享受聽覺與味覺的極致饗宴吧!﹥。

-----廣告,請繼續往下閱讀-----

下次若覺得某張圖片有聲音、光看某部電影的宣傳海報就起雞皮疙瘩,或是外帶的咖啡沒有內用的美味,也許就是跨感官反應悄悄影響了你的感覺。最後,讓我們回到一開始的問題,星期一聽起來是什麼顏色的?不論是不是藍色的,何不試試透過 GIF 圖和親朋好友無聲地分享你震耳欲聾的情感吧! 

  1. Simner, J., Mulvenna, C., Sagiv, N., Tsakanikos, E., Witherby, S. A., Fraser, C., Scott, K., & Ward, J. (2006). Synaesthesia: The prevalence of atypical cross-modal experiences. Perception, 35(8), 1024–1033. https://doi.org/10.1068/p5469 
  2. Bankieris, K., & Simner, J. (2015). What is the link between synaesthesia and sound symbolism? Cognition, 136, 186–195. https://doi.org/10.1016/j.cognition.2014.11.013
  3. Freeman, E. D. (2020). Hearing what you see: Distinct excitatory and disinhibitory mechanisms contribute to visually-evoked auditory sensations. Cortex, 131, 66–78. https://doi.org/10.1016/j.cortex.2020.06.014
  4. BBC. (2014, September 17). Science & Nature – Horizon. BBC.
  5. Eagleman, D. (2023, September 6). Wednesday is Indigo Blue. David Eagleman. https://eagleman.com/books/wednesday-is-indigo-blue/
  6. Eagleman, D. M., Kagan, A. D., Nelson, S. S., Sagaram, D., & Sarma, A. K. (2007). A standardized test battery for the study of Synesthesia. Journal of Neuroscience Methods, 159(1), 139–145. https://doi.org/10.1016/j.jneumeth.2006.07.012
  7. Ramachandran, V. S., & Hubbard, E. M. (2001). Synaesthesia–a window into perception, thought and language. Journal of consciousness studies, 8(12), 3-34.
  8. Ozturk, O., Krehm, M., & Vouloumanos, A. (2013). Sound symbolism in infancy: Evidence for sound–shape cross-modal correspondences in 4-month-olds. Journal of Experimental Child Psychology, 114(2), 173–186. https://doi.org/10.1016/j.jecp.2012.05.004
  9. Styles, S. J., & Gawne, L. (2017). When does Maluma/takete fail? Two key failures and a meta-analysis suggest that phonology and phonotactics matter. I-Perception, 8(4), 204166951772480. https://doi.org/10.1177/2041669517724807
  10. Ćwiek, A., Fuchs, S., Draxler, C., Asu, E. L., Dediu, D., Hiovain, K., Kawahara, S., Koutalidis, S., Krifka, M., Lippus, P., Lupyan, G., Oh, G. E., Paul, J., Petrone, C., Ridouane, R., Reiter, S., Schümchen, N., Szalontai, Á., Ünal-Logacev, Ö., Winter, B. (2021). The bouba/kiki effect is robust across cultures and writing systems. Philosophical Transactions of the Royal Society B: Biological Sciences, 377(1841). https://doi.org/10.1098/rstb.2020.0390
  11. Barton, D. N., & Halberstadt, J. (2017). A Social Bouba/Kiki Effect: A bias for people whose names match their faces. Psychonomic Bulletin &amp; Review, 25(3), 1013–1020. https://doi.org/10.3758/s13423-017-1304-x 
  12. Sidhu, D. M., Pexman, P. M., & Saint-Aubin, J. (2016). From the bob/kirk effect to the Benoit/éric effect: Testing the mechanism of name sound symbolism in two languages. Acta Psychologica, 169, 88–99. https://doi.org/10.1016/j.actpsy.2016.05.011
  13. BBC. (2021, July 29). Rick Astley rolls into a billion YouTube views. BBC News. https://www.bbc.com/news/technology-58011677
  14. BBC. (2018, September 10). Rick Astley on the Rickroll meme that made him an online legend. BBC Scotland. https://www.bbc.co.uk/programmes/articles/5D3ZmWf1hJmCxCc5Vn0sS64/rick-astley-on-the-rickroll-meme-that-made-him-an-online-legend
  15. Jones, R. (2021)。跨感官心理學:解鎖行為背後的知覺密碼,改變他人、提升表現的生活處方箋 (陳松筠譯)。商周出版。
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

雅文兒童聽語文教基金會_96
63 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

6
2

文字

分享

0
6
2
指甲刮黑板的聲音,為何讓人難以忍受?
雅文兒童聽語文教基金會_96
・2023/10/22 ・2522字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

  • 朱家瑩/雅文基金會聽語科學研究中心 研究員

想像一下當你聽到手指甲刮著黑板產生的摩擦聲,或者是拿著叉子摩擦著不鏽鋼碗的聲音,抑或是小孩的哭叫聲,有沒有哪一個聲音會讓你全身起雞皮疙瘩,想要用手摀住耳朵,甚至是情緒爆炸、只想要遠離現場呢?這些讓人不適的聲音,是有其特有的聲學特質?或是其他緣故呢?

想像一下指甲刮黑板的聲音。圖/Pexels

不是尖銳、高頻音就刺耳,而是流淌在你我血液的祖先智慧

一般認為,令人不適的聲音是因為刺耳的高頻聲,尤其像是手指甲刮黑板時所產生的摩擦聲,其中那種「ㄍㄧ ㄍㄧ ㄍㄧ」的聲音,似乎是造成不適感的主因。

然而,Halpern、Blake 和 Hillenbrand(1986)這三位研究者對於這個現象感到好奇,因此他們進行了一項實驗 [1],他們將那些令人不適聲音(如:刮金屬或石板的聲音)中的高頻音減弱。

結果顯示,即使減弱尖銳的高頻聲音,受試者仍然感到不適,因而主張尖銳的高頻音並不是造成不適感的主因。接續 Halpern 等人在企圖尋求答案時,意外發現刮黑板的聲音頻譜圖跟靈長類猴子的警告叫聲非常相似,因而大膽推測這個不適感並非高頻音造成的,而是源於人類祖先的記憶。

-----廣告,請繼續往下閱讀-----

人類對特定頻率區間的聲音感知最敏感,加上跨感官的連結,讓人聽到某些音就不適

可惜,到底是不是來自老祖先的智慧傳承,這點未獲得後續研究的支持。另一方面,Kumar 等人(2008)進一步以聲學分析探究是否是因特定頻率導致聆聽的不適感時,發現聲音中涵蓋 2500-5500 赫茲這個頻率區間的聲學頻率似乎特別容易引起聽者的不適感 [2]

有沒有哪一個聲音會讓你全身起雞皮疙瘩,想要用手摀住耳朵?圖/Pexels

他們推測這可能是因為這個頻率範圍的聲音感知上最為強烈,同時也具有最高的能量,因此使得聽覺系統特別對這些頻率的聲音敏感。

但是,我們平常聊天談話中也涵蓋了這個頻率範圍的聲音,除了頻率之外,是不是還有其他因素造成對某些聲音的不適感呢?

Ro 等人(2013)發現當聽到聲音時,聲音進入大腦的聽覺皮質同時,會傳遞訊號到觸覺感官系統,啟動了觸覺感官,讓聽者聽到聲音時,「感覺」到自己的皮膚彷彿被指甲刮的刺痛感 [3]

-----廣告,請繼續往下閱讀-----

聽聲音會啟動身體觸覺感官系統並非只存在刮黑板這類聲音,有些人在聽到音樂聲,像是聽到低音貝斯的聲音時,也會感覺到自己的身體也在震動,甚至感受到皮膚的不適感 [4、5]

也許因為這個跨感官的訊號傳遞,讓身體的其他部位也出現不適的感受,才會讓聽者對於這些聲音感到不適。

當感知到令人不適的聲音,杏仁核會依據習得經驗,決定是否啟動保護機制!

Zald 與 Pardo(2002)發現當聽到讓人感到不適的聲音刺激時,大腦中的杏仁核(amygdala)會高度活化 [6],而杏仁核在大腦中負責掌控恐懼、焦慮、害怕等負面情緒,換句話說,當聲音訊息抵達杏仁核時,它會誘發情緒反應,進而導致我們做出不同行為反應 [7]

杏仁核的啟動是大腦的一種保護機制,透過過往的經驗連結學習會對讓人不適的聲音發出警報[8] ,當聽者遇到可能危及安全的聲音時,杏仁核就會發出警報。

-----廣告,請繼續往下閱讀-----

例如,當聽到車子緊急剎車的聲音時,這個聲音傳送到杏仁核,會進而引起我們想要逃離的反應,或者產生對駕駛者行為的憤怒反應。

由於杏仁核在聆聽這些聲音時會高度活化,Kumar 等人(2012)進一步試圖了解在聆聽令人不適的聲音時,杏仁核在大腦中扮演著怎樣的角色,以及聲音資訊如何被傳遞到杏仁核。

他們的研究結果顯示,聲音刺激會最先傳送到聽覺皮質(auditory cortex)進行聲學訊息處理和分析,解碼聲音所代表的意義,例如,聽到「ㄍㄧ」的剎車聲,解碼出來的是來自汽車或者腳踏車的剎車聲。聽覺皮質處理完畢後,將資訊傳遞到杏仁核,當杏仁核接收到來自聽覺皮質的訊號後,依據這些訊息及過去經驗發出警報 [8],誘發恐懼、焦慮或憤怒等負面情緒,並可能促使進一步的行為反應,像是尖叫、摀住耳朵,或逃離現場。

舉例來說,如果是汽車的剎車聲,基於過去的經驗,可能存在危險,因此可能會誘發恐懼情緒,並引發立馬逃離現場的行為舉動。

-----廣告,請繼續往下閱讀-----
有些人基於過去的經驗,聽到汽車的剎車聲,可能會誘發恐懼情緒。圖/Pexels

然而,如果解碼後的聲音是腳踏車的剎車聲,根據過去的經驗,可能不會有危及生命的危險,因此即便會觸發閃躲的動作行為,但負面情緒可能不如汽車剎車聲來的強烈,可能只會憤怒的罵騎車的人不長眼。

聽到某些聲音,讓人立馬想逃或想戰,也許這個過往的經驗是來自遠古時代祖先的傳承,但更可能是因為聽到這些聲音時,觸覺感官系統被啟動了,身體上「感覺」到不適,所以當不適的聲音再次出現時,杏仁核的活化反應就更增強,讓我們除了單純的接收到聲音之外,也產生了身體及情緒上的反應。

  1. Halpern, D. L., Blake, R., & Hillenbrand, J. (1986). Psychoacoustics of a chilling sound. Perception & Psychophysics39, 77-80.
  2. Kumar, S., Forster, H. M., Bailey, P., & Griffiths, T. D. (2008). Mapping unpleasantness of sounds to their auditory representation. The Journal of the Acoustical Society of America124(6), 3810-3817.
  3. Ro, T., Ellmore, T. M., & Beauchamp, M. S. (2013). A neural link between feeling and hearing. Cerebral cortex, 23(7), 1724-1730.
  4. Koenig, L., & Ro, T. (2022). Sound Frequency Predicts the Bodily Location of Auditory-Induced Tactile Sensations in Synesthetic and Ordinary Perception. bioRxiv.
  5. Lad, D., Wilkins, A., Johnstone, E., Vuong, Q.C. (2022). Feeling the music: The feel and sound of songs attenuate pain. British Journal of Pain, 16(5), 518-527. 
  6. Zald, D. H., & Pardo, J. V. (2002). The neural correlates of aversive auditory stimulation. Neuroimage16(3), 746-753.
  7. LeDoux, J. E. (2000). Emotion circuits in the brain. Annual review of neuroscience23(1), 155-184.
  8. Kumar, S., von Kriegstein, K., Friston, K., & Griffiths, T. D. (2012). Features versus feelings: dissociable representations of the acoustic features and valence of aversive sounds. Journal of Neuroscience, 32(41), 14184-14192.
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
63 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。