Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

科學怎麼搞:真的有GAYDAR這回事嗎?

YTLai_96
・2013/12/26 ・4888字 ・閱讀時間約 10 分鐘 ・SR值 475 ・五年級

請勿搭配此音樂服用

cc創用授權
credit: CC by thaths@flickr

歲末年終,三個月不見的科學怎麼搞又回來了。

最近多元成家的議題吵得沸沸揚揚,什麼雲啊霧啊寶劍鎖鍊魂結都出現了,許多同志們也紛紛跳出來捍衛自己的權益。但是很不幸的,社會上身為多數份子的人,並不一定總是能夠看見自己習以為常司空見慣的事情,在身為少數份子的他人生活中有多麼難能可貴。所以,在本文開始之前,「科學怎麼搞」要為站出來爭取權益,並且讓社會更加多元兼容的同志或直同志們致上由衷敬意。

回到這次的主題。我身邊的一些朋友總是號稱自己有能力從相貌判斷一個人是不是同志,也就是所謂的『GAYDAR』(偵測Gay的雷達)。我也曾經以非正式的角度測試過他們的GAYDAR能力,看起來好像真有那麼一回事。但總之,如果真的想要證實這些人的GAYDAR能力是真是假,或是想更進一步的瞭解GAYDAR偵測的特徵為何,就跟著這次的科學怎麼搞一起來想想這實驗該怎麼進行吧。

-----廣告,請繼續往下閱讀-----
cc創用授權:http://flic.kr/p/84SXUS
credit: CC by acon online@flickr

不過在開始之前我要先澄清一下,不知道為什麼,GAYDAR這件事好像總是限縮在男同性戀上頭,鮮少聽到有人擅長偵測女同性戀的案例。據我的GAYDAR友人說,除了明顯打扮中性的T之外,女同志非常難以偵測。當然,這很可能只是我孤陋寡聞而已,在此先向各位不滿的讀者道歉,也還請各位讀者多多指教。總之為了行文方便,本文的GAYDAR還是只限縮在偵測男同志的能力上頭。但是也請讀者們理解,若是有人宣稱自己擁有偵測女同志的能力,檢測的方式也是一樣的。

首先,如果只是想要知道GAYDAR友人的能力是真是假,那麼只要先找到一群生理男性(最好30人以上,因為一般來說這個數量的樣本群比較有統計上的意義,但當然越多越好),請他們大方且自願的揭露自己的性傾向(同志/直男),然後幫每個人拍個白背景、相同打光的正面全身站立照。之後就可以拿這些自願者的照片來測試友人的GAYDAR能力了。你可以先將照片洗牌,然後一張一張的讓友人判斷影中人是不是同志,之後再對照自願者們自我揭露的性傾向。照理說,隨機亂猜的正確率應該是五成左右,但如果被測試的友人判定是不是同志的正確率達到七成以上,那麼在樣本數30人的狀況下,統計上就已經達到了顯著(卡方檢定),也就是這位友人真的擁有GAYDAR的能力。

到此,擁有GAYDAR能力的讀者或你的友人可能會嗤之以鼻:七成正確率就可以算是擁有GAYDAR能力?這也太容易了吧,人家我們GAYDAR的準度是很高的。更何況,同志的人口比例那麼少(各種正式非正式的統計大概都不超過一成五,錯誤請指教),如果找到的這群志願者裡面只有幾個同志甚至更少,那就算是沒有GAYDAR能力的人來亂猜,只要都猜『直男』結果也會顯著然後被判定為『擁有GAYDAR能力』啊不是嗎?這麼容易濫竽充數的測驗,怎麼顯得出我們GAYDAR的厲害?

cc創用授權:http://flic.kr/p/gnkn6X
Credit: CC by I-Ta Tsai@flickr

非常好,既然你想到了這個層面的問題,那就讓我們繼 續 看 下 去。

-----廣告,請繼續往下閱讀-----

的確,無論是一成五或兩成,同志的人口比例就是極少數。如果我們在大街上隨便捕捉男性,餵食誠實豆沙包之後問他是同志還是直男,絕大部分的答案想必還是直男。因此,在大家都知道這個『同志是極少數』的事實之下,一個沒有GAYDAR能力的人若是要猜測街上遇到的陌生人的性傾向,保險一點的答案當然是『直男』,因為一般而言猜直男的正確率恐怕都還有八成以上而且答案從眾也比較不會被打。所以,以上面這個實驗而言,我們選取的樣本最好是同志跟直男各半,藉此讓兩個答案的出現率都趨近相等,以排除一路直男到底卻矇對大半的可能。

不過,如果很不幸的你運氣就是不好,在路上抓人抓半天也找不到足夠且願意坦然出櫃的同志朋友讓你拍照,除了讓直男照片也一起變少以配合同志照片的數量這種傷害統計效力的方法之外,就沒有別的辦法可以讓真正的GAYDAR出頭天嗎?

當然有。

就算你的志願者照片同志的比例很低,你還是可以把號稱有GAYDAR能力的友人看照片的判斷結果畫成下圖。

-----廣告,請繼續往下閱讀-----

這是一個科學上探討檢測或篩檢的優劣時很常見的表格。如你所見,一般狀況下的事實大概都是二分法,例如這裡討論的『同志』和『直男』,而檢測的結果當然也是『是個同志』或『是個直男』這兩種。因此,事實與檢測所組成的四種可能,分別是『被說是同志的同志』的真陽性(A)『被說是同志的直男』的偽陽性(B)『被說是直男的同志』的偽陰性(C)、以及『被說是直男的直男』的真陰性(D)。理想狀況下,一個完美的GAYDAR當然是『同志就同志,直男就直男』,也就是B跟C均為零,A跟D包含所有的案例這樣。可是,除了可以看到雲啊霧啊的MC美江之外這種完美的GAYDAR當然罕見,現有的各種科學檢測也都還辦不到這件事。於是,要知道一個GAYDAR的能力有多強,就要利用這個表格得到更進一步的資訊。

利用這表格中四種結果的比例,可以換算出正確率以外的四個重要指標比率如下:

  • 靈敏度 Sensitivity:『被說是同志的同志』佔所有同志的比例,也就是把所有同志都找出來的能力。
  • 特異度 Specificity:『被說是直男的直男』佔所有直男的比例,也就是把所有直男都找出來的能力。
  • 陽性預測值 Positive Predictive Value (PPV)『被說是同志的同志』佔『被說是同志的人』的比例,也就是鐵口直斷是同志的預測力。
  • 陰性預測值 Negative Predictive Value(NPV)『被說是直男的直男』佔『被說是直男的人』的比例,也就是鐵口直斷是直男的預測力。

於是,我們將號稱擁有GAYDAR能力的這位挑戰者的測驗結果做成下表。

前面提到的檢測GAYDAR的方式,只不過是看受測者的正確率,也就是真陽性和真陰性的判斷在所有判斷中的比例((A+D)/(A+B+C+D))。但因為今天大家都知道同志的所佔的人口比例就是少,所以不是GAYDAR的人就算一路壓寶『直男』,在多數的志願者可能都是直男的狀況下還是會有相當好的正確率,於是就成了充數的濫竽。以本例來說,一路『直男』到底的正確率是86.7%,以先前的檢定來看絕對是個顯著GAYDAR。可是一旦把結果畫成這個表,就可以清楚的看出來:雖然一路壓寶直男的特異度很高(100%),但是根本沒有靈敏度跟陽性預測值可言(0%),而且陰性預測值也可以發現根本和直男的人口比例一樣,表示根本就是瞎貓碰上死耗子。所以,大概就可以判定這個號稱有GAYDAR的人是濫竽充數裝裝樣子而已。

-----廣告,請繼續往下閱讀-----

好,假設今天有另一位號稱有GAYDAR能力的人來接受檢測,他費盡心力做了三十次的判斷,得到的結果畫成下表。

你可以看出來,雖然這個人的整體正確率也是26/30=86.7%,但是他的靈敏度可是紮實的75%,陽性預測值PPV也有五成,雖然特異度比起前一個一路直男的騙子稍低,但總還是將近九成的88%,而且陰性預測值96%也還是比前一個高。根據這些數據,我們大概就可以說:這是個貨真價實的GAYDAR,真的有能力能夠根據照片就判斷出一個人是同志或直男,不過這個GAYDAR『鐵口直斷是同志』的可信度只有五成,遠不如『鐵口直斷是直男』超過九成五的可信度高就是了。白話的意思就是說,他如果說某個人是同志,那可以參考一下,但是當他說某個人是直男那就幾乎可以拍胸脯保證了。

(OS:那這樣是要叫他GAYDAR還是STRAIGHTDAR??)

到這裡你或許也已經發現,這四個重要指標比率終究是彼此連動、此消彼長的。一旦有個GAYDAR鐵了心寧可錯殺一百不可放過一個,那麼當然就可能找出所有的GAY,靈敏度直逼100%,但是可能也會出現很多被當成同志的直男,因此讓陽性預測值升不了太高。所以,對於一個GAYDAR而言,最重要的或許還是磨練自己找出是否為同志的關鍵特徵來得要緊。

-----廣告,請繼續往下閱讀-----
cc創用授權:http://flic.kr/p/ehZXQB
cc創用授權:http://flic.kr/p/ehZXQB

但是話說回來,就算檢測結果證實GAYDAR真的存在好了,知其然也想知其所以然,到底GAYDAR偵測的特徵是什麼呢?

從我對自己GAYDAR友人的觀察,以及網路上各種號稱可以判斷同志與否的心得文,似乎多數GAYDAR的判斷依據都是『氣質』也就是一個人的穿著打扮舉止姿態語調等外在行為。要測驗GAYDAR們偵測的是否是外在行為融合成的氣質,最簡單的方法就是改讓所有的志願者換下自己的服裝改穿上同樣鬆緊程度的白T,以同樣的姿勢、打光、甚至帶上同樣的假髮以遮蔽原有的髮型,留下面無表情的大頭照。這麼一來,當外在的行為線索都排除了之後,一旦GAYDAR的能力也不再靈光,大概就可以確定GAYDAR們看的都是這些氣質項目了。

不過,萬一GAYDAR們偵測的不是氣質呢?如果GAYDAR們在志願者穿上相同白T,以同樣的打扮跟假髮,留下面無表情照片的嚴苛條件下都能夠指出同志或直男,那麼或許就得把照片數位化並且素描化,讓膚質和鬍渣等細微差異都消失,再來讓GAYDAR們判斷。而如果GAYDAR們真的這麼厲害,在僅有線條勾勒五官跟輪廓的數位素描化照片裡頭都還看得出誰是同志和直男,那麼或許,或許同志跟直男的臉型輪廓和五官真的有什麼不一樣,讓GAYDAR們可以分辨得出來吧?我不知道有沒有研究指出同志的臉型輪廓或五官跟直男真的不一樣,MC美江是有說到同志的臉型不一樣啦,我聽了笑笑就是,你相信嗎?

cc創用授權:http://flic.kr/p/rqw4v
cc創用授權:http://flic.kr/p/rqw4v

最後,說真的,一樣米養百樣人,吃米的同志當然也不會只有一種模樣。所以,就算真的有所謂的『典型同志氣質』或甚至是『典型同志臉型/輪廓/五官』好了,GAYDAR們若僅僅以這個氣質或輪廓做為判斷依據,終究還是會有不少的同志因為與同志的刻板印象不同,而始終隱形於GAYDAR們引以為傲的犀利眼光之中。同樣的,也會有不少的直男們因為不符合『典型直男氣質』或『典型直男輪廓』而可能被GAYDAR們認定是同志,無論是不是剛好又趨近『典型同志氣質』或『典型同志輪廓』。到頭來,GAYDAR的判斷或許是個人小嗜好,卻說不定在言談跟分享之間幫了倒忙,加深了同志和直男兩者的刻板印象。更何況,知名的性學專家金賽博士說過,性傾向應該是個光譜般的分佈,而非同志或直男這樣零與一的兩端。這樣說來,GAYDAR們到底把界線畫在哪裡,來區別同志跟直男呢?

-----廣告,請繼續往下閱讀-----

與其知道一個人是同志或直男,何不輕鬆一點,努力讓每一個人都能夠開心地愛自己也愛別人,對吧。

 

文章看到這裡,累了的話聽些歌吧XDD

想知道各種檢測背後的優劣和準確度等資料請看這裡

 

12/30補充:

-----廣告,請繼續往下閱讀-----

話說有網友留言提到,有研究指出男同志的臉部肌肉群使用方式跟直男不同,因此可以從臉部判斷出是否為同志。我也記得在知名美劇『lie to me』裡頭看過這樣的說法,但是在寫這篇文章的時候並沒有去查資料,因此就略過不提。但既然又有人提到了,那我就來找一下研究好了。

雖然我沒有看到有哪裡明確指出是臉部肌肉群的使用方式不同,但是的確有相關研究發現GAYDAR這回事,而且是男女同志都可以偵測。請看
相關報導一相關報導二男性同志/直男的臉的確可以判斷而且有七成左右正確率的PAPER男同志/直男的臉的判斷過程最快只要0.05秒就可以完成的PAPER女同志/直女的臉也的確可以判斷而且也有七成正確率、而且直覺判斷比再三思考更準的PAPERGAYDAR的過程其實用上了不少性別刻板印象的線索所以一旦遇到與刻板印象不符的同志就會錯的PAPER然後如果你有很多同志朋友你的GAYDAR能力當然也越好的PAPER這一篇聽聲音或看臉都可以分辨同志和直男而且同志的臉對女性受試者而言更MAN的PAPER也很有趣喔還有這個實驗室做了好些GAYDAR的研究有興趣可以看看。

但我目前為止倒是沒看到什麼同志和直男的臉部肌肉群使用有關的研究….

-----廣告,請繼續往下閱讀-----
文章難易度
YTLai_96
51 篇文章 ・ 32 位粉絲
也許永遠無法自稱學者,但總是一直努力學著

0

17
4

文字

分享

0
17
4
為機器人換上「物理大腦」:一場終結AI數位囚禁的革命
鳥苷三磷酸 (PanSci Promo)_96
・2025/09/03 ・5732字 ・閱讀時間約 11 分鐘

本文與 研華科技 合作,泛科學企劃執行

我們都看過那種影片,對吧?網路上從不缺乏讓人驚嘆的機器人表演:數十台人形機器人像軍隊一樣整齊劃一地耍雜技 ,或是波士頓動力的機器狗,用一種幾乎違反物理定律的姿態後空翻、玩跑酷 。每一次,社群媒體總會掀起一陣「未來已來」、「人類要被取代了」的驚呼 。

但當你關掉螢幕,看看四周,一個巨大的落差感就來了:說好的機器人呢?為什麼大街上沒有他們的身影,為什麼我家連一件衣服都還沒人幫我摺?

這份存在於數位螢幕與物理現實之間的巨大鴻溝,源於一個根本性的矛盾:當代AI在數位世界裡聰明絕頂,卻在物理世界中笨拙不堪。它可以寫詩、可以畫畫,但它沒辦法為你端一杯水。

-----廣告,請繼續往下閱讀-----

這個矛盾,在我們常見的兩種機器人展示中體現得淋漓盡致。第一種,是動作精準、甚至會跳舞的類型,這本質上是一場由工程師預先寫好劇本的「戲」,機器人對它所處的世界一無所知 。第二種,則是嘗試執行日常任務(如開冰箱、拿蘋果)的類型,但其動作緩慢不穩,彷彿正在復健的病人 。

這兩種極端的對比,恰恰點出了機器人技術的真正瓶頸:它們的「大腦」還不夠強大,無法即時處理與學習真實世界的突發狀況 。

這也引出了本文試圖探索的核心問題:新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦,真的能終結機器人的「復健時代」,開啟一個它們能真正理解、並與我們共同生活的全新紀元嗎?

新一代AI晶片NVIDIA® Jetson Thor™ ,這顆號稱能驅動「物理AI」的超級大腦 / 圖片來源:研華科技

為何我們看到的機器人,總像在演戲或復健?

那我們怎麼理解這個看似矛盾的現象?為什麼有些機器人靈活得像舞者,有些卻笨拙得像病人?答案,就藏在它們的「大腦」運作方式裡。

-----廣告,請繼續往下閱讀-----

那些動作極其精準、甚至會後空翻的機器人,秀的其實是卓越的硬體性能——關節、馬達、減速器的完美配合。但它的本質,是一場由工程師預先寫好劇本的舞台劇 。每一個角度、每一分力道,都是事先算好的,機器人本身並不知道自己為何要這麼做,它只是在「執行」指令,而不是在「理解」環境。

而另一種,那個開冰箱慢吞吞的機器人,雖然看起來笨,卻是在做一件革命性的事:它正在試圖由 AI 驅動,真正開始「理解」這個世界 。它在學習什麼是冰箱、什麼是蘋果、以及如何控制自己的力量才能順利拿起它。這個過程之所以緩慢,正是因為過去驅動它的「大腦」,也就是 AI 晶片的算力還不夠強,無法即時處理與學習現實世界中無窮的變數 。

這就像教一個小孩走路,你可以抱著他,幫他擺動雙腿,看起來走得又快又穩,但那不是他自己在走。真正的學習,是他自己搖搖晃晃、不斷跌倒、然後慢慢找到平衡的過程。過去的機器人,大多是前者;而我們真正期待的,是後者。

所以,問題的核心浮現了:我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好?

-----廣告,請繼續往下閱讀-----
我們需要為機器人裝上一個強大的大腦!但這個大腦,為什麼不能像ChatGPT一樣,放在遙遠的雲端伺服器上就好? / 圖片來源:shutterstock

機器人的大腦,為什麼不能放在雲端?

聽起來好像很合理,對吧?把所有複雜的運算都交給雲端最強大的伺服器,機器人本身只要負責接收指令就好了。但……真的嗎?

想像一下,如果你的大腦在雲端,你看到一個球朝你飛過來,視覺訊號要先上傳到雲端,雲端分析完,再把「快閃開」的指令傳回你的身體。這中間只要有零點幾秒的網路延遲,你大概就已經鼻青臉腫了。

現實世界的互動,需要的是「即時反應」。任何網路延遲,在物理世界中都可能造成無法彌補的失誤 。因此,運算必須在機器人本體上完成,這就是「邊緣 AI」(Edge AI)的核心概念 。而 NVIDIA  Jetson 平台,正是為了解決這種在裝置端進行高運算、又要兼顧低功耗的需求,而誕生的關鍵解決方案 。

NVIDIA Jetson 就像一個緊湊、節能卻效能強大的微型電腦,專為在各種裝置上運行 AI 任務設計 。回顧它的演進,早期的 Jetson 系統主要用於視覺辨識搭配AI推論,像是車牌辨識、工廠瑕疵檢測,或者在相機裡分辨貓狗,扮演著「眼睛」的角色,看得懂眼前的事物 。但隨著算力提升,NVIDIA Jetson 的角色也逐漸從單純的「眼睛」,演化為能夠控制手腳的「大腦」,開始驅動更複雜的自主機器,無論是地上跑的、天上飛的,都將NVIDIA Jetson 視為核心運算中樞 。

-----廣告,請繼續往下閱讀-----

但再強大的晶片,如果沒有能適應現場環境的「容器」,也無法真正落地。這正是研華(Advantech)的角色,我們將 NVIDIA Jetson 平台整合進各式工業級主機與邊緣運算設備,確保它能在高熱、灰塵、潮濕或震動的現場穩定運行,滿足從工廠到農場到礦場、從公車到貨車到貨輪等各種使用環境。換句話說,NVIDIA 提供「大腦」,而研華則是讓這顆大腦能在真實世界中呼吸的「生命支持系統」。

這個平台聽起來很工業、很遙遠,但它其實早就以一種你意想不到的方式,進入了我們的生活。

從Switch到雞蛋分揀員,NVIDIA Jetson如何悄悄改變世界?

如果我告訴你,第一代的任天堂Switch遊戲機與Jetson有相同血緣,你會不會很驚訝?它的核心處理器X1晶片,與Jetson TX1模組共享相同架構。這款遊戲機對高效能運算和低功耗的嚴苛要求,正好與 Jetson 的設計理念不謀而合 。

而在更專業的領域,研華透過 NVIDIA Jetson 更是解決了許多真實世界的難題 。例如

-----廣告,請繼續往下閱讀-----
  • 在北美,有客戶利用 AI 進行雞蛋品質檢測,研華的工業電腦搭載NVIDIA Jetson 模組與相機介面,能精準辨識並挑出髒污、雙黃蛋到血蛋 
  • 在日本,為避免鏟雪車在移動時發生意外,導入了環繞視覺系統,當 AI 偵測到周圍有人時便會立刻停止 ;
  • 在水資源珍貴的以色列,研華的邊緣運算平台搭載NVIDIA Jetson模組置入無人機內,24 小時在果園巡航,一旦發現成熟的果實就直接凌空採摘,實現了「無落果」的終極目標 。

這些應用,代表著 NVIDIA Jetson Orin™ 世代的成功,它讓「自動化」設備變得更聰明 。然而,隨著大型語言模型(LLM)的浪潮來襲,人們的期待也從「自動化」轉向了「自主化」 。我們希望機器人不僅能執行命令,更能理解、推理。

Orin世代的算力在執行人形機器人AI推論時的效能約為每秒5到10次的推論頻率,若要機器人更快速完成動作,需要更強大的算力。業界迫切需要一個更強大的大腦。這也引出了一個革命性的問題:AI到底該如何學會「動手」,而不只是「動口」?

革命性的一步:AI如何學會「動手」而不只是「動口」?

面對 Orin 世代的瓶頸,NVIDIA 給出的答案,不是溫和升級,而是一次徹底的世代跨越— NVIDIA Jetson Thor 。這款基於最新 Blackwell 架構的新模組,峰值性能是前代的 7.5 倍,記憶體也翻倍 。如此巨大的效能提升,目標只有一個:將過去只能在雲端資料中心運行的、以 Transformer 為基礎的大型 AI 模型,成功部署到終端的機器上 。

NVIDIA Jetson Thor 的誕生,將驅動機器人控制典範的根本轉變。這要從 AI 模型的演進說起:

-----廣告,請繼續往下閱讀-----
  1. 第一階段是 LLM(Large Language Model,大型語言模型):
    我們最熟悉的 ChatGPT 就屬此類,它接收文字、輸出文字,實現了流暢的人機對話 。
  2. 第二階段是 VLM(Vision-Language Model,視覺語言模型):
    AI 學會了看,可以上傳圖片,它能用文字描述所見之物,但輸出結果仍然是給人類看的自然語言 。
  3. 第三階段則是 VLA(Vision-Language-Action Model,視覺語言行動模型):
    這是革命性的一步。VLA 模型的輸出不再是文字,而是「行動指令(Action Token)」 。它能將視覺與語言的理解,直接轉化為控制機器人關節力矩、速度等物理行為的具體參數 。

這就是關鍵! 過去以NVIDIA Jetson Orin™作為大腦的機器人,僅能以有限的速度運行VLA模型。而由 VLA 模型驅動,讓 AI 能夠感知、理解並直接與物理世界互動的全新形態,正是「物理 AI」(Physical AI)的開端 。NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 。

NVIDIA Jetson Thor 的強大算力,就是為了滿足物理 AI 的嚴苛需求而生,要讓機器人擺脫「復健」,迎來真正自主、流暢的行動時代 / 圖片來源:研華科技

其中,物理 AI 強調的 vision to action,就需要研華設計對應的硬體來實現;譬如視覺可能來自於一般相機、深度相機、紅外線相機甚至光達,你的系統就要有對應的介面來整合視覺;你也會需要控制介面去控制馬達伸長手臂或控制夾具拿取物品;你也要有 WIFI、4G 或 5G 來傳輸資料或和別的 AI 溝通,這些都需要具體化到一個系統上,這個系統的集大成就是機器人。

好,我們有了史上最強的大腦。但一個再聰明的大腦,也需要一副強韌的身體。而這副身體,為什麼非得是「人形」?這不是一種很沒效率的執念嗎?

為什麼機器人非得是「人形」?這不是一種低效的執念嗎?

這是我一直在思考的問題。為什麼業界的主流目標,是充滿挑戰的「人形」機器人?為何不設計成效率更高的輪式,或是功能更多元的章魚型態?

-----廣告,請繼續往下閱讀-----

答案,簡單到令人無法反駁:因為我們所處的世界,是徹底為人形生物所打造的。

從樓梯的階高、門把的設計,到桌椅的高度,無一不是為了適應人類的雙足、雙手與身高而存在 。對 AI 而言,採用人形的軀體,意味著它能用與我們最相似的視角與方式去感知和學習這個世界,進而最快地理解並融入人類環境 。這背後的邏輯是,與其讓 AI 去適應千奇百怪的非人形設計,不如讓它直接採用這個已經被數千年人類文明「驗證」過的最優解 。

這也區分了「通用型 AI 人形機器人」與「專用型 AI 工業自動化設備」的本質不同 。後者像高度特化的工具,產線上的機械手臂能高效重複鎖螺絲,但它無法處理安裝柔軟水管這種預設外的任務 。而通用型人形機器人的目標,是成為一個「多面手」,它能在廣泛學習後,理解物理世界的運作規律 。理論上,今天它在產線上組裝伺服器,明天就能在廚房裡學會煮菜 。

人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態 / 圖片來源:shutterstock

但要讓一個「多面手」真正活起來,光有骨架還不夠。它必須同時擁有強大的大腦平台與遍布全身的感知神經,才能理解並回應外在環境。人形機器人的手、腳、眼睛、甚至背部,都需要大量感測器去理解環境就像神經末梢一樣,隨時傳回方位、力量與外界狀態。但這些訊號若沒有通過一個穩定的「大腦平台」,就無法匯聚成有意義的行動。

這正是研華的角色:我們不僅把 NVIDIA Jetson Thor 這顆核心晶片包載在工業級電腦中,讓它成為能真正思考與反應的「完整大腦」,同時也提供神經系統的骨幹,將感測器、I/O 介面與通訊模組可靠地連結起來,把訊號傳導進大腦。你或許看不見研華的存在,但它實際上遍布在機器人全身,像隱藏在皮膚之下的神經網絡,讓整個身體真正活過來。

但有了大腦、有了身體,接下來的挑戰是「教育」。你要怎麼教一個物理 AI?總不能讓它在現實世界裡一直摔跤,把一台幾百萬的機器人摔壞吧?

打造一個「精神時光屋」,AI的學習速度能有多快?

這個問題非常關鍵。大型語言模型可以閱讀網際網路上浩瀚的文本資料,但物理世界中用於訓練的互動資料卻極其稀缺,而且在現實中反覆試錯的成本與風險實在太高 。

答案,就在虛擬世界之中。

NVIDIA Isaac Sim™等模擬平台,為這個問題提供了完美的解決方案 。它能創造出一個物理規則高度擬真的數位孿生(Digital Twin)世界,讓 AI 在其中進行訓練 。

這就像是為機器人打造了一個「精神時光屋」 。它可以在一天之內,經歷相當於現實世界千百日的學習與演練,從而在絕對安全的環境中,窮盡各種可能性,深刻領悟物理世界的定律 。透過這種「模擬-訓練-推論」的 3 Computers 閉環,Physical AI (物理AI) 的學習曲線得以指數級加速 。

我原本以為模擬只是為了節省成本,但後來發現,它的意義遠不止於此。它是在為 AI 建立一種關於物理世界的「直覺」。這種直覺,是在現實世界中難以透過有限次的試錯來建立的。

所以你看,這趟從 Switch 到人形機器人的旅程,一幅清晰的未來藍圖已經浮現了。實現物理 AI 的三大支柱已然齊備:一個劃時代的「AI 大腦」(NVIDIA Jetson Thor)、讓核心延展為「完整大腦與神經系統」的工業級骨幹(由研華 Advantech 提供),以及一個不可或缺的「教育環境」(NVIDIA Isaac Sim 模擬平台) 。

結語

我們拆解了那些酷炫機器人影片背後的真相,看見了從「自動化」走向「自主化」的巨大技術鴻溝,也見證了「物理 AI」時代的三大支柱——大腦、身軀、與教育——如何逐一到位 。

專家預測,未來 3 到 5 年內,人形機器人領域將迎來一場顯著的革命 。過去我們只能在科幻電影中想像的場景,如今正以前所未有的速度成為現實 。

這不再只是一個關於效率和生產力的問題。當一台機器,能夠觀察我們的世界,理解我們的語言,並開始以物理實體的方式與我們互動,這將從根本上改變我們與科技的關係。

所以,最後我想留給你的思想實驗是:當一個「物理 AI」真的走進你的生活,它不只是個工具,而是一個能學習、能適應、能與你共同存在於同一個空間的「非人智慧體」,你最先感受到的,會是興奮、是便利,還是……一絲不安?

這個問題,不再是「我們能否做到」,而是「當它發生時,我們準備好了嗎?」

研華已經整裝待發,現在,我們與您一起推動下一代物理 AI 與智慧設備的誕生。
https://bit.ly/4n78dR4

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
231 篇文章 ・ 316 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

10
1

文字

分享

0
10
1
群眾監控科技:以 2023 雪梨世界驕傲節為例
胡中行_96
・2023/03/16 ・3422字 ・閱讀時間約 7 分鐘

COVID-19 疫情趨緩後,各國都敞開大門,迎接國際觀光客。今年雪梨同志狂歡節(Sydney Gay and Lesbian Mardi Gras)的主辦單位,與 InterPride 合作,將活動升級為 2023 雪梨世界驕傲節(Sydney World Pride)。[1]其中最受矚目的年度大遊行,也於 2 月 25 日晚間,重磅回歸 Oxford 和 Flinders 兩街。[2, 3]

今年遊行中,率先登場的女同志團體「Dykes on Bikes」。圖/胡中行攝(CC BY-SA 4.0)
今年遊行的第二個隊伍,是男同志團體「Boys on Bikes」。圖/胡中行攝(CC BY-SA 4.0)

警察的角色

澳洲雪梨一年到頭,觀光活動難以計數。從知名的跨年煙火、國慶典禮、體育賽事、聖誕市集、繽紛雪梨燈光音樂節(Vivid Sydney)到同志狂歡節等,[4]負責維安的警察早已身經百戰,什麼場面都見過了。如果當天鬧事被逮的人數不多,他們有時還會在事後,透過新聞稿嘉勉群眾幾句。[5]雖然新南威爾斯州警察,在1978年拘捕同志運動抗爭者;但誰也沒想到他們後來化敵為友,自 1998 年起,竟每屆都組隊參加遊行。[6, 7]

2023 年面對前所未有的人潮挑戰,他們派出 900 多名員警,並與主辦單位、雪梨市政府、科技保全公司,以及州政府的觀光、交通、消防和急救等部門攜手合作。[2, 7]

曾參與 1978 年抗爭的同志乘車遊行,受到群眾熱烈歡迎。圖/胡中行攝(CC BY-SA 4.0)
新南威爾斯州警察今年的遊行花車。(不含背景右上的彩虹旗。)圖/胡中行攝(CC BY-SA 4.0)

RAMP分析

根據英國曼徹斯特都會大學(Manchester Metropolitan University)G. Keith Still 教授 30 多年的經驗,規劃大型活動時,要從 RAMP 分析(RAMP Analysis)的 4 個面向,評估群眾安全。[8]

-----廣告,請繼續往下閱讀-----
  1. 路線(routes):進入與離開的方向。[8]雪梨同志遊行的隊伍,一般不超出 Oxford 和 Flinders 這兩條街。[2]遊客則必定是從四面八方,逐漸湧入。
  2. 區域(areas):人群聚集的範圍。[8]當天的交通管制,擴及市中心與市郊的幾條主要幹道。[9]
  3. 動向(movement):進場及散場的時間。[8]官網號稱遊行從晚上 6 開始,預計 11 點結束。[10]實際上,觀眾提早幾個小時佔位,正式開幕的時間為晚上 7 點左右,而結束後不少人仍於附近逗留。各街道的交通管制不同,最早從下午 2 點開始,最晚至隔天凌晨 4 點結束。[9]
  4. 群眾(people):對參與群眾的了解。[8]官方預計有 1 萬 2 千 500 人和 200 多輛花車參與遊行。[10]此外,疫情解封以及世界驕傲節的國際觀光效應,勢必帶來人數龐大,而且類型多元的遊客。

此活動行之有年,遊行的路線、群眾聚集的區域,以及周邊交通管制的規劃等,多少都有參考依據。唯一可能比較難以預測的,是今年會增加的遊客。

遊行開始前,Oxford 和 Flinders 街口的人海。圖/胡中行攝(CC BY-SA 4.0)
散場時,尚未撤離的維安、急救、轉播和封街用車輛。圖/胡中行攝(CC BY-SA 4.0)

群眾與手機

為了精準掌握群眾的情形,這次遊行首度依循跨年和燈光音樂節的模式,請動態群眾測量(Dynamic Crowd Measurement)公司在遊行地點周邊,架設了臨時性的監視攝影機與手機偵測器材。[2]

  1. 監視攝影機:配合相應的軟體,從蒐集到的個體表情,例如:開心、中性、難過、生氣等,分析群眾情緒的平均值。同時,測量他們步行移動的速度[2]
  2. 手機訊號:現在幾乎人手一機,由手機通訊用的電磁波,便可推估現場人數。接受《雪梨晨鋒報》(Sydney Morning Herald)訪問的專家認為,不仰賴基地臺的技術,可以避免人數過多時,電信網絡的數據失準。動態群眾測量公司在附近店面,安裝臨時性的偵測器材。[2]
澳洲原住民團體帶了一條蛇來助興。圖/胡中行攝(CC BY-SA 4.0)
技職學校(TAFE)隊伍的大型人偶。圖/胡中行攝(CC BY-SA 4.0)

監控軟體的功能

監視攝影機蒐集到的數據,會被上傳雲端,並呈現於動態群眾測量公司設計的軟體。[11]遊行當天,由主辦單位的工作人員監控,再將必要的資訊報告給警方,以疏導聚眾。[2]下面是該公司官網,所介紹的軟體特色功能:[12]

  1. 地理空間熱區圖(geospatial heatmap):地圖以不同顏色,顯示人群的密集程度,並附帶群眾情緒和人流速度等資訊。[12]
  2. 警報程度指標(alert level indicator):將各區域的危險程度,分級且視覺化,方便監控者一目了然。[12]
  3. 區域監視(zone monitor):群眾密度、情緒和移動速率的警示程度,各區域可以分開設定。[12]
  4. 數據回放(data playback):除了即時監控,已經上傳雲端的數據,也能重新調出來檢視。[12]
  5. 通知管理(notifications manager):客製化群眾密度、情緒平均值,或移動速率等警示,以接收特定的更新資訊通知。[12]
  6. 視覺驗證(visual validator):將即時影像或地理空間熱區圖,與數據並列比較。[12]
https://youtu.be/rTv5ETjEUYk?t=72
動態群眾測量公司的軟體介紹影片,範例地圖是臨近雪梨歌劇院的環形碼頭。影/參考資料11

隱私疑慮

美國喬治城大學法律中心(Georgetown University Law Center)的 Paul Ohm 教授曾說,手機的位置,不該被視為匿名數據。試想一個人幾乎每天在住家與公司之間往返,從手機蒐集到的地理資訊,還真能推測出其身份。[13]所以,參與雪梨同志遊行的群眾,是否有個人隱私外洩的疑慮?主辦單位的發言人表示,他們單純偵測範圍內的手機數量,不包含任何個人化特徵。另外,監視攝影機不具人臉辨識功能,影像也不留紀錄,只儲存數據,因此大家不用擔心。[2]

-----廣告,請繼續往下閱讀-----
雪梨舞蹈團的遊行花車。圖/胡中行攝(CC BY-SA 4.0)
工人團體的遊行花車。圖/胡中行攝(CC BY-SA 4.0)

通宵達旦

遊行吸引 30 萬人聚集,[14]連總理 Anthony Albanese 也親臨現場,成為第一位參加此活動的澳洲現任元首。[3]整晚狂歡不夠,據報相關的官方派對,還續攤到翌日早晨 8 點。[14]遊行當天有 4 人遭到逮捕;而衝突過程中,1 名員警似乎斷了鼻子,另個眼睛瘀青。[7, 15]除此之外,賴在地上阻擋花車的國會議員 Lidia Thorpe,被和平勸離,並登上各大媒體。[16]新南威爾斯州警察在新聞稿中,表示滿意群眾表現,請大家在 2023 雪梨世界驕傲節剩餘的活動裡,繼續關照彼此的安全。[7]

總理 Anthony Albanese 是第一位參加同志遊行的澳洲現任元首。圖/Anthony Albanese on Twitter

  

  1. InterPride. ‘Proud to be here – Who we are’. Sydney World Pride 2023. (Accessed on 27 FEB 2023)
  2. Grubb B. (24 FEB 2023) ‘How your phone and mood will be tracked at Mardi Gras’. Sydney Morning Herald.
  3. Anthony Albanese makes history as first sitting PM to march in Sydney’s Mardi Gras parade’. (26 FEB 2023) SBS News.
  4. Destination NSW. ‘Sydney, Australia’. Sydney.com. (Accessed on 26 FEB 2023)
  5. Police pleased with behaviour of revellers during 2022 New Year’s Eve celebrations’. (01 JAN 2023) NSW Police Force.
  6. The Age & Sydney Morning Herald. (24 FEB 2023) ‘Sydney Mardi Gras – from ’78 to World Pride’. YouTube.
  7. 45th Mardi Gras celebrated in high spirits and perfect weather’. (26 FEB 2023) NSW Police Force.
  8. Still GK. (2019) ‘Crowd Science and Crowd Counting’. Impact, 2019(1): 19-23.
  9. InterPride. ‘Sydney Worldpride 2023 Road Closures’. Sydney World Pride 2023.  (Accessed on 01 MAR 2023)
  10. InterPride. ‘Mardi Gras Parade’. Sydney World Pride 2023. (Accessed on 26 FEB 2023)
  11. Shortstories Media. (28 JUL 2022) ‘DCM/Dynamic Crowd Measurement Explainer Video’. YouTube.
  12. DCM Features’. Dynamic Crowd Measurement. (Accessed on 28 FEB 2023)
  13. Thompson SA, Warzel C. (19 DEC 2019) ‘Twelve Million Phones, One Dataset, Zero Privacy’. The New York Times.
  14. Hyland J, Pearson-Jones B. (26 FEB 2023) ‘The morning after! Mardi Gras revellers finally start heading home as the last official party ends at 8am – and there’ll be some sore heads today’. Daily Mail Australia.
  15. Sarkari K, Sciberras A. (26 FEB 2023) ‘Police praise behaviour of Mardi Gras attendees as Anthony Albanese makes history’. 9News.
  16. Hildebrandt C. (27 FEB 2023) ‘Federal senator Lidia Thorpe halts Sydney’s Mardi Gras parade with police protest’. ABC News.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 67 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

1
0

文字

分享

0
1
0
精神個案系列:同性病患瘋狂追求馬來西亞醫師
胡中行_96
・2023/02/13 ・1853字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

人一生中,能遇到幾個愛慕者,如此高調追求?同性戀性行為在伊斯蘭律法下,可處鞭刑、罰鍰與 20 年以下有期徒刑。[1]這 2 名馬來西亞女子,卻干冒風險,在所不惜,分別對她瘋狂示愛。[2]

玻璃市 Tuanku Fauziah 醫院的精神科醫師,無福消受,困擾至極。[2]

馬來西亞玻璃市景觀。圖/Wolfgang Holzem on Wikimedia Commons(CC BY 3.0)

病史

A 小姐 18 歲的時候,輕微跌跤,右側手腳便虛弱無力。在 5 名手足中排行第 2 的她,感受不到愛,認為父母偏心。[2]兩件沒有明顯關聯的事情:無真實肇因的身體問題;以及未達重度憂鬱的心情不好,讓她被診斷為罹患伴隨轉化症狀的低落性情感疾患(dysthymic disorder with conversion symptoms)。[2, 3]精神科醫師花了 1 小時為 A 小姐諮商,沒有開藥。[2]

B 女士社經地位低落,缺乏家庭和社會支持。面對酗酒丈夫的精神與肢體虐待,她幾回過量用藥,自殺未遂。後來兩人離婚,她因 32 歲時罹患思覺失調症(schizophrenia),而喪失 9 歲兒子的監護權。服藥不確實的 B 女士,精神疾患老是復發,多次進出醫院。[2]

-----廣告,請繼續往下閱讀-----

自殺防治諮詢:
衛生福利部安心專線-1925
全臺生命線協談專線-1995
張老師專線-1980

追求

那次短暫的相處,令 A 小姐對精神科醫師一見鍾情。她追蹤醫師的臉書,下載數張照片。然後在臉書、微信和推特上,假冒後者建立帳號,發佈滿是愛意的影片。此外,A 小姐佯裝病患家屬,問得醫師的聯絡方式。用超過 10 個不同的手機號碼,每週猛灌大量的訊息和未接來電。[2]

起先她談及生活和情感的困境;後來逐漸以威脅來換取關注。自稱病情惡化,有幻聽與自殘等症狀,卻堅決不就診。接著,內容竟變成指控父母家暴,逼得當地社福單位介入。他們發現 A 小姐用兩個門號,撥打政府的求助熱線,編造故事。假通報的案件,最終在詳盡的調查、驗傷,以及訪談家長後了結。[2]

B 女士也是首次見面,便一往情深。當時離診斷出思覺失調症,已有三年之久,受妄想(delusions)和幻覺(hallucinations)纏身:以為被人控制迫害;「聽見」不存在的話語;甚至不知從哪生出與醫師交媾的「觸覺」體驗。她將醫師比做天神,覺得兩人命定要成為知己,而且來生當對方轉世為男人,她們終將結合。秉持著這般信念,B 女士不僅跟蹤人家,還贈與情書、禮物、糖果以及豪華的情人節花束。[2]

戀愛妄想症

戀愛妄想症(erotomania)又譯「情愛妄想症」,有個逗趣綽號叫「老女僕的瘋狂」(old maid’s insanity);還有以法國醫師Gatian de Clérambault (1872–1934)為名的別稱──「克雷宏波症候群」(de Clerambault’s syndrome)。[2, 4]

-----廣告,請繼續往下閱讀-----

每 10 萬人裡,只有 1 至 3 名會產生妄想;其中戀愛妄想的患者又更少,多以女性為主。[2, 4, 5]而同性的戀愛妄想個案,則是不分男女都相當稀罕,難免被拿來投稿學術期刊。[2, 4]上述兩名病患的行為雖然稍有差異,但發病脈絡高度相似。她們都自顧自地熱烈單戀,窮盡騷擾之所能,還以為人家也情投意合。作為一種克服極度空虛的調節機制,患者通常傾向追求社經地位較高,卻不熟識的對象。一面之緣或素昧平生,也能愛得痴狂入迷,死心塌地。[2]

研究指出,典型的戀愛妄想症患者,多半缺乏魅力或性愛經驗,且從未建立有意義的情侶關係。[4]病因方面的理論與假說,目前包括:大腦結構異常;多巴胺與血清素濃度失衡;以及環境、身心、藥物多方交互作用等。[2, 4]

治療

這名馬來西亞醫師,僅想維持專業的醫病關係。當然做不到的時候,最輕易的解方,就是轉診給別人。然而,這未必有助於療效。A 小姐在醫師向警方通報跟蹤案件後,開始由其他醫師負責。及至 2021 年,她已經看過3個精神科醫師。從愛吃不吃的口服藥劑,換成每月穩定施打的長效肌肉注射,她依然沒有病識感。儘管不再試圖與第一個醫師聯繫,A 小姐始終堅信對方深愛著她。另一邊,醫師勉為其難地承諾 B 女士,繼續為她診療。B 女士於是同意接受注射。不過,一旦症狀改善,她就開始錯過門診,毛病三兩下便又再犯。[2]

  

-----廣告,請繼續往下閱讀-----
  1. Bloom LB. (25 NOV 2019) ‘20 Most Dangerous Places For Gay Travelers (And The 5 Safest)’. Forbes.
  2. Jamaluddin R. (2021) ‘Same Gender Erotomania: When the Psychiatrist Became the Delusional Theme—A Case Report and Literature Review’. Case Reports in Psychiatry, 7463272.
  3. Conversion Disorder’. APA Dictionary of Psychology. (Accessed on 20 JAN 2023)
  4. Valadas MTTRT, Bravo LEA. (2020) ‘De Clérambault’s syndrome revisited: a case report of Erotomania in a male’. BMC Psychiatry, 20, 516.
  5. González-Rodríguez A, Esteve M, Álvarez A, et al. (2019) ‘What We Know and Still Need to Know about Gender Aspects of Delusional Disorder: A Narrative Review of Recent Work’. Journal of Psychiatry and Brain Science, 4:e190009.
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 67 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。