網站更新隱私權聲明
本網站使用 cookie 及其他相關技術分析以確保使用者獲得最佳體驗,通過我們的網站,您確認並同意本網站的隱私權政策更新,了解最新隱私權政策

0

0
0

文字

分享

0
0
0

科學怎麼搞:真的有GAYDAR這回事嗎?

YTLai_96
・2013/12/26 ・4888字 ・閱讀時間約 10 分鐘 ・SR值 475 ・五年級

請勿搭配此音樂服用

cc創用授權
credit: CC by thaths@flickr

歲末年終,三個月不見的科學怎麼搞又回來了。

最近多元成家的議題吵得沸沸揚揚,什麼雲啊霧啊寶劍鎖鍊魂結都出現了,許多同志們也紛紛跳出來捍衛自己的權益。但是很不幸的,社會上身為多數份子的人,並不一定總是能夠看見自己習以為常司空見慣的事情,在身為少數份子的他人生活中有多麼難能可貴。所以,在本文開始之前,「科學怎麼搞」要為站出來爭取權益,並且讓社會更加多元兼容的同志或直同志們致上由衷敬意。

回到這次的主題。我身邊的一些朋友總是號稱自己有能力從相貌判斷一個人是不是同志,也就是所謂的『GAYDAR』(偵測Gay的雷達)。我也曾經以非正式的角度測試過他們的GAYDAR能力,看起來好像真有那麼一回事。但總之,如果真的想要證實這些人的GAYDAR能力是真是假,或是想更進一步的瞭解GAYDAR偵測的特徵為何,就跟著這次的科學怎麼搞一起來想想這實驗該怎麼進行吧。

cc創用授權:http://flic.kr/p/84SXUS
credit: CC by acon online@flickr

不過在開始之前我要先澄清一下,不知道為什麼,GAYDAR這件事好像總是限縮在男同性戀上頭,鮮少聽到有人擅長偵測女同性戀的案例。據我的GAYDAR友人說,除了明顯打扮中性的T之外,女同志非常難以偵測。當然,這很可能只是我孤陋寡聞而已,在此先向各位不滿的讀者道歉,也還請各位讀者多多指教。總之為了行文方便,本文的GAYDAR還是只限縮在偵測男同志的能力上頭。但是也請讀者們理解,若是有人宣稱自己擁有偵測女同志的能力,檢測的方式也是一樣的。

首先,如果只是想要知道GAYDAR友人的能力是真是假,那麼只要先找到一群生理男性(最好30人以上,因為一般來說這個數量的樣本群比較有統計上的意義,但當然越多越好),請他們大方且自願的揭露自己的性傾向(同志/直男),然後幫每個人拍個白背景、相同打光的正面全身站立照。之後就可以拿這些自願者的照片來測試友人的GAYDAR能力了。你可以先將照片洗牌,然後一張一張的讓友人判斷影中人是不是同志,之後再對照自願者們自我揭露的性傾向。照理說,隨機亂猜的正確率應該是五成左右,但如果被測試的友人判定是不是同志的正確率達到七成以上,那麼在樣本數30人的狀況下,統計上就已經達到了顯著(卡方檢定),也就是這位友人真的擁有GAYDAR的能力。

到此,擁有GAYDAR能力的讀者或你的友人可能會嗤之以鼻:七成正確率就可以算是擁有GAYDAR能力?這也太容易了吧,人家我們GAYDAR的準度是很高的。更何況,同志的人口比例那麼少(各種正式非正式的統計大概都不超過一成五,錯誤請指教),如果找到的這群志願者裡面只有幾個同志甚至更少,那就算是沒有GAYDAR能力的人來亂猜,只要都猜『直男』結果也會顯著然後被判定為『擁有GAYDAR能力』啊不是嗎?這麼容易濫竽充數的測驗,怎麼顯得出我們GAYDAR的厲害?

cc創用授權:http://flic.kr/p/gnkn6X
Credit: CC by I-Ta Tsai@flickr

非常好,既然你想到了這個層面的問題,那就讓我們繼 續 看 下 去。

的確,無論是一成五或兩成,同志的人口比例就是極少數。如果我們在大街上隨便捕捉男性,餵食誠實豆沙包之後問他是同志還是直男,絕大部分的答案想必還是直男。因此,在大家都知道這個『同志是極少數』的事實之下,一個沒有GAYDAR能力的人若是要猜測街上遇到的陌生人的性傾向,保險一點的答案當然是『直男』,因為一般而言猜直男的正確率恐怕都還有八成以上而且答案從眾也比較不會被打。所以,以上面這個實驗而言,我們選取的樣本最好是同志跟直男各半,藉此讓兩個答案的出現率都趨近相等,以排除一路直男到底卻矇對大半的可能。

不過,如果很不幸的你運氣就是不好,在路上抓人抓半天也找不到足夠且願意坦然出櫃的同志朋友讓你拍照,除了讓直男照片也一起變少以配合同志照片的數量這種傷害統計效力的方法之外,就沒有別的辦法可以讓真正的GAYDAR出頭天嗎?

當然有。

就算你的志願者照片同志的比例很低,你還是可以把號稱有GAYDAR能力的友人看照片的判斷結果畫成下圖。

這是一個科學上探討檢測或篩檢的優劣時很常見的表格。如你所見,一般狀況下的事實大概都是二分法,例如這裡討論的『同志』和『直男』,而檢測的結果當然也是『是個同志』或『是個直男』這兩種。因此,事實與檢測所組成的四種可能,分別是『被說是同志的同志』的真陽性(A)『被說是同志的直男』的偽陽性(B)『被說是直男的同志』的偽陰性(C)、以及『被說是直男的直男』的真陰性(D)。理想狀況下,一個完美的GAYDAR當然是『同志就同志,直男就直男』,也就是B跟C均為零,A跟D包含所有的案例這樣。可是,除了可以看到雲啊霧啊的MC美江之外這種完美的GAYDAR當然罕見,現有的各種科學檢測也都還辦不到這件事。於是,要知道一個GAYDAR的能力有多強,就要利用這個表格得到更進一步的資訊。

利用這表格中四種結果的比例,可以換算出正確率以外的四個重要指標比率如下:

  • 靈敏度 Sensitivity:『被說是同志的同志』佔所有同志的比例,也就是把所有同志都找出來的能力。
  • 特異度 Specificity:『被說是直男的直男』佔所有直男的比例,也就是把所有直男都找出來的能力。
  • 陽性預測值 Positive Predictive Value (PPV)『被說是同志的同志』佔『被說是同志的人』的比例,也就是鐵口直斷是同志的預測力。
  • 陰性預測值 Negative Predictive Value(NPV)『被說是直男的直男』佔『被說是直男的人』的比例,也就是鐵口直斷是直男的預測力。

於是,我們將號稱擁有GAYDAR能力的這位挑戰者的測驗結果做成下表。

前面提到的檢測GAYDAR的方式,只不過是看受測者的正確率,也就是真陽性和真陰性的判斷在所有判斷中的比例((A+D)/(A+B+C+D))。但因為今天大家都知道同志的所佔的人口比例就是少,所以不是GAYDAR的人就算一路壓寶『直男』,在多數的志願者可能都是直男的狀況下還是會有相當好的正確率,於是就成了充數的濫竽。以本例來說,一路『直男』到底的正確率是86.7%,以先前的檢定來看絕對是個顯著GAYDAR。可是一旦把結果畫成這個表,就可以清楚的看出來:雖然一路壓寶直男的特異度很高(100%),但是根本沒有靈敏度跟陽性預測值可言(0%),而且陰性預測值也可以發現根本和直男的人口比例一樣,表示根本就是瞎貓碰上死耗子。所以,大概就可以判定這個號稱有GAYDAR的人是濫竽充數裝裝樣子而已。

好,假設今天有另一位號稱有GAYDAR能力的人來接受檢測,他費盡心力做了三十次的判斷,得到的結果畫成下表。

你可以看出來,雖然這個人的整體正確率也是26/30=86.7%,但是他的靈敏度可是紮實的75%,陽性預測值PPV也有五成,雖然特異度比起前一個一路直男的騙子稍低,但總還是將近九成的88%,而且陰性預測值96%也還是比前一個高。根據這些數據,我們大概就可以說:這是個貨真價實的GAYDAR,真的有能力能夠根據照片就判斷出一個人是同志或直男,不過這個GAYDAR『鐵口直斷是同志』的可信度只有五成,遠不如『鐵口直斷是直男』超過九成五的可信度高就是了。白話的意思就是說,他如果說某個人是同志,那可以參考一下,但是當他說某個人是直男那就幾乎可以拍胸脯保證了。

(OS:那這樣是要叫他GAYDAR還是STRAIGHTDAR??)

到這裡你或許也已經發現,這四個重要指標比率終究是彼此連動、此消彼長的。一旦有個GAYDAR鐵了心寧可錯殺一百不可放過一個,那麼當然就可能找出所有的GAY,靈敏度直逼100%,但是可能也會出現很多被當成同志的直男,因此讓陽性預測值升不了太高。所以,對於一個GAYDAR而言,最重要的或許還是磨練自己找出是否為同志的關鍵特徵來得要緊。

cc創用授權:http://flic.kr/p/ehZXQB
cc創用授權:http://flic.kr/p/ehZXQB

但是話說回來,就算檢測結果證實GAYDAR真的存在好了,知其然也想知其所以然,到底GAYDAR偵測的特徵是什麼呢?

從我對自己GAYDAR友人的觀察,以及網路上各種號稱可以判斷同志與否的心得文,似乎多數GAYDAR的判斷依據都是『氣質』也就是一個人的穿著打扮舉止姿態語調等外在行為。要測驗GAYDAR們偵測的是否是外在行為融合成的氣質,最簡單的方法就是改讓所有的志願者換下自己的服裝改穿上同樣鬆緊程度的白T,以同樣的姿勢、打光、甚至帶上同樣的假髮以遮蔽原有的髮型,留下面無表情的大頭照。這麼一來,當外在的行為線索都排除了之後,一旦GAYDAR的能力也不再靈光,大概就可以確定GAYDAR們看的都是這些氣質項目了。

不過,萬一GAYDAR們偵測的不是氣質呢?如果GAYDAR們在志願者穿上相同白T,以同樣的打扮跟假髮,留下面無表情照片的嚴苛條件下都能夠指出同志或直男,那麼或許就得把照片數位化並且素描化,讓膚質和鬍渣等細微差異都消失,再來讓GAYDAR們判斷。而如果GAYDAR們真的這麼厲害,在僅有線條勾勒五官跟輪廓的數位素描化照片裡頭都還看得出誰是同志和直男,那麼或許,或許同志跟直男的臉型輪廓和五官真的有什麼不一樣,讓GAYDAR們可以分辨得出來吧?我不知道有沒有研究指出同志的臉型輪廓或五官跟直男真的不一樣,MC美江是有說到同志的臉型不一樣啦,我聽了笑笑就是,你相信嗎?

cc創用授權:http://flic.kr/p/rqw4v
cc創用授權:http://flic.kr/p/rqw4v

最後,說真的,一樣米養百樣人,吃米的同志當然也不會只有一種模樣。所以,就算真的有所謂的『典型同志氣質』或甚至是『典型同志臉型/輪廓/五官』好了,GAYDAR們若僅僅以這個氣質或輪廓做為判斷依據,終究還是會有不少的同志因為與同志的刻板印象不同,而始終隱形於GAYDAR們引以為傲的犀利眼光之中。同樣的,也會有不少的直男們因為不符合『典型直男氣質』或『典型直男輪廓』而可能被GAYDAR們認定是同志,無論是不是剛好又趨近『典型同志氣質』或『典型同志輪廓』。到頭來,GAYDAR的判斷或許是個人小嗜好,卻說不定在言談跟分享之間幫了倒忙,加深了同志和直男兩者的刻板印象。更何況,知名的性學專家金賽博士說過,性傾向應該是個光譜般的分佈,而非同志或直男這樣零與一的兩端。這樣說來,GAYDAR們到底把界線畫在哪裡,來區別同志跟直男呢?

與其知道一個人是同志或直男,何不輕鬆一點,努力讓每一個人都能夠開心地愛自己也愛別人,對吧。

 

文章看到這裡,累了的話聽些歌吧XDD

想知道各種檢測背後的優劣和準確度等資料請看這裡

 

12/30補充:

話說有網友留言提到,有研究指出男同志的臉部肌肉群使用方式跟直男不同,因此可以從臉部判斷出是否為同志。我也記得在知名美劇『lie to me』裡頭看過這樣的說法,但是在寫這篇文章的時候並沒有去查資料,因此就略過不提。但既然又有人提到了,那我就來找一下研究好了。

雖然我沒有看到有哪裡明確指出是臉部肌肉群的使用方式不同,但是的確有相關研究發現GAYDAR這回事,而且是男女同志都可以偵測。請看
相關報導一相關報導二男性同志/直男的臉的確可以判斷而且有七成左右正確率的PAPER男同志/直男的臉的判斷過程最快只要0.05秒就可以完成的PAPER女同志/直女的臉也的確可以判斷而且也有七成正確率、而且直覺判斷比再三思考更準的PAPERGAYDAR的過程其實用上了不少性別刻板印象的線索所以一旦遇到與刻板印象不符的同志就會錯的PAPER然後如果你有很多同志朋友你的GAYDAR能力當然也越好的PAPER這一篇聽聲音或看臉都可以分辨同志和直男而且同志的臉對女性受試者而言更MAN的PAPER也很有趣喔還有這個實驗室做了好些GAYDAR的研究有興趣可以看看。

但我目前為止倒是沒看到什麼同志和直男的臉部肌肉群使用有關的研究….

文章難易度
YTLai_96
47 篇文章 ・ 18 位粉絲
也許永遠無法自稱學者,但總是一直努力學著


5

7
0

文字

分享

5
7
0

當 AI 的「深度學習」形成偏見,法規該如何遏止傷害?

科學月刊_96
・2022/01/03 ・3732字 ・閱讀時間約 7 分鐘
  • 文/廖英凱|非典型的不務正業者、興致使然地從事科普工作、科學教育與科技政策研究。對資訊與真相有詭異的渴望與執著,夢想能做出鋼鐵人或心理史學。

Take Home Message

  • AI 雖然能協助遏止違法或侵權的言論,但一般大眾卻無法得知其評斷的機制,已於無形中造成傷害。
  • AI 的資料庫誤差,將造成演算法對文化或族群產生偏見等;而深度學習的演算法因處理龐大的資料,常使研究者或運用 AI 的機構無法理解與回溯 AI 的決策原因。
  • 歐盟、美國、聯合國等組織已相繼研擬 AI 的規範與監管方式。
  • 臺灣仍須再制定 AI 相關的監管辦法,以因應科技的發展及變遷。

「你今天被祖了嗎?」

眾所皆知目前社群網路最大的平台臉書(Facebook),為遏阻違法或侵權的言論,會判定某些言論違反其「社群守則」而隱藏。不可否認,違法與侵權言論在社群網路上造成了嚴重的傷害,不過有時候這些隱文的原則,似乎與政治或特定議題有關。時不時也有朋友提到,一則再平凡不過的貼文或照片,卻莫名其妙地被宣告違反社群守則。於是乎在去(2021)年時,網友們開始把臉書創辦人祖克柏(Mark Zuckerber)的姓氏,變成了諷刺臉書封鎖文章標準混亂的話梗:你被「祖」了嗎?

想當然爾如臉書等社群媒體,是仰賴著演算法自動判斷一則貼文是否違規。除了針對文字與圖片的內容分析以外,其他例如被檢舉的數量、帳號的活躍程度、帳號的發文模式、商業價值等,都成為演算法評估一則貼文是否違規的依據,彷彿法官在定罪犯人時不只依據犯罪行為,也會權衡犯人及其社會狀態一樣。然而,我們看得到法官的決策過程與理由,但卻從來沒有機會搞清楚,到底演算法發生了什麼事情,才會宣告一則平凡的貼文違規。

雖然大家平常遇到這種貼文被刪的情況,通常也就是重新打篇文章貼個圖發發牢騷,就這麼過去了。但這個時不時可見的神祕隱文事件,其實就是我們生活中,人工智慧(artificial intelligence, AI)已經持續帶來隱性傷害的頻繁案例。

AI 的傷害跟以往想像的不一樣

自工業革命以降,人類其實蠻迅速地就提出對科技發展副作用的深層反思。例如人類史上第一部科幻作品,1818 年由英國作家雪萊(Mary Shelley)所著作的《科學怪人》(Frankenstein),即是以一個具有擬人思維的人造生命為主角的科幻驚悚作品。伴隨著機器的發展,1956 年達特矛斯會議(Dartmouth Summer Research Project on Artificial Intelligence)上,與會專家提出「artificial intelligence」一詞,認為機器的發展將可像人一般具有學習、理解、適應的能力。

隨著 AI 技術上的演進,人們對 AI 的樂觀與悲觀態度,也愈發分歧。對於 AI 發展所帶來社會的影響,依其態度可以分為:對科技抱持樂觀者,相信「強 AI」的問世可以使電腦與人有相同甚至超越人類的思考能力,並為人類解決大部分問題,帶來更理想的明天,在電影動畫等作品中不乏這類理想的人工智慧角色;重視科技實用者,傾向認為 AI 是以輔助人類的角色,解放人類的勞力工作而能開創更多科技應用的可能;重視科技發展脈絡者,則認為 AI 只是科技發展中的一個流行詞(buzzword),只有尚在發展中,尚未充分掌握的技術才會被視為 AI。與科技領域相對,在人文社會領域中則較常出現對 AI 發展的反思,例如研究 AI 對人類勞力取代後所創造的弱勢衝擊;或更甚者認為強 AI 的不受控發展,將會導致人類文明的毀滅。這些不同立場的觀點,均揭示了人類看待 AI 對社會影響的多元與矛盾預測。

儘管當代影視作品和學術研究,都對 AI 會造成什麼樣的傷害有興趣,但 AI 帶來的傷害早已出現多年而默默影響著人類社會。2018 年在《自然》(Nature)期刊上的一則評論,介紹了一張身披白紗的歐美傳統新娘和印度傳統新娘的組圖,而演算法在看待兩張新娘照片時,會將前者判斷為「新娘」、「洋裝」、「女人」、「婚禮」等,但將後者判斷為「表演」和「戲服」。在這個案例中,AI 或演算法設計本身其實並沒有獨鍾哪一種文化,但因為演算法的訓練來自於既有圖庫,而圖庫中的圖片來源和圖片的詮釋註記,與真實世界的樣貌出現落差,使人工智慧就如真人一般,憑藉著片面不完整的學習資料,產生了對族群與文化的偏見(偏誤),而演算法可能更無法自覺與反思自我產生的偏見(圖一)。

(圖一)由於 AI 只憑藉片面且不完整的資料進行學習,以婚紗為例,AI 只能辨識出傳統歐美的婚紗裝扮(左),卻難以辨識出不同文化的婚紗樣貌,例如印度傳統服飾(右)。(123RF)

除了資料庫的誤差而導致演算法對文化或族群的偏見以外,「深度學習」(deep learning)的演算法因處理龐大的訓練資料、分析資料,也常使研究者或使用 AI 服務的機構,無法理解與回溯 AI 決策的具體原因。例如亞馬遜公司(Amazon.com, Inc.)仰賴演算法全自動判斷大量受僱員工的工作狀態,並以此決定他們的績效與裁員與否。儘管這種做法能大幅縮減決策時間,並減少人資成本,但也因此發生數起亞馬遜員工因系統過失而被降低績效,或是員工績效良好卻被無故裁員,更申訴無門的矛盾事件。這與將 AI 應用於人資的初衷似乎有點相悖,演算法或許可以避免人為決策時,因涉及個人喜惡偏好而作出不公允的判斷,但卻也造成了另一種不公允也無從理解緣由的傷害。

誰來規範 AI?

既然 AI 的傷害已然出現,自然也應有對 AI 的監管與規範機制。例如歐盟執委會(European Commission)在 2019 年 4 月公布「值得信賴的人工智慧倫理指引」(Ethics Guidelines For Trustworthy AI),強調人工智慧應為輔助角色,尊重人類自主、避免傷害、維護公平、具有可解釋性,且能受到監管並回溯決策過程,以避免演算法的黑箱決策,作為歐盟成員國在訂定 AI 相關規範的上位依據。2019 年 5 月,經濟合作暨發展組織(Organisation for Economic Cooperation and Development, OECD),提出 AI 發展的原則應有永續精神以造福人類與地球,能尊重民主與法治、人權與多元性,兼顧透明度、課責機制等原則。美國白宮科技辦公室在 2020 年 1 月發布的「人工智慧應用的管制指引」(Guidance for Regulation of Artificial Intelligence Application),也強調衡量風險避免傷害、公平無歧視、透明度、重視科學實證、立法過程應兼顧公共參與等,作為美國政府各機關在訂定與人工智慧相關規範的指導原則。聯合國教科文組織(United Nations Educational Scientific and Cultural Organization, UNESCO)則在去年 11 月,發布《人工智慧倫理建議書》草案(Draft text of the recommendation on the ethics of artificial intelligence),作為會員國訂定 AI 相關法律與政策時,可依循的通用價值觀、原則和行動框架。

國際上重要的原則指引,也同等地體現在民意對 AI 治理的期待,臺灣師範大學教授李思賢、劉湘瑤、張瓅勻等人針對臺灣 1200 位民眾的調查發現,臺灣民眾對 AI 的應用最在意的是避免傷害,其次則是透明度與公平性,相對最不在意的是隱私。調查亦發現民眾明確偏好以公民審議和立法機關來制定嚴格傾向的規範,這反映了民眾對新興科技的擔憂與對透明治理的期待,也呼應了國際組織的指引方向(圖二)。

(圖二)AI 規範制定權則偏好。李思賢教授等人,調查國人對 AI 規範制定的偏好。發現國人無論對 AI 發展持保守態度或開放態度,均傾向以公民審議和立法機構來制定規範。

然而,國際上的重要指引與民調結果,卻也讓我國在相關規範的設計上略顯矛盾。例如調查研究顯示,雖然民眾最期待以「公民審議」和「立法機構」來訂定 AI 相關規範,但現今國內外相關規範的研擬與討論,仍是以由產官學組成的研究與應用社群為主,例如科技部自 2017 年起,開展多場 AI 倫理議題的研究計畫與論壇工作坊等,並於 2019 年 9 月提出《人工智慧科研發展指引》,明訂 AI 科研的核心價值與指引,使科研人員在學術自由與創新發展的同時,也能兼顧 AI 發展的方向。

但科技部並非產業的主責機關,所訂定的指引僅能提供科研人員更好的方向,對已產生傷害的業界應用仍然鞭長莫及。儘管 2018 年 11 月立法院曾通過初具 AI 倫理精神的《無人載具創新實驗條例》;2019 年 5 月,時任立法委員許毓仁等人也提出《人工智慧發展基本法》修法草案,作為政府兼顧人工智慧產業發展和倫理規範的法律基礎,但該草案的相關修法討論並未被積極延續,作為國家更上位看待 AI 發展的治理框架,於立法體制和公民審議機制中均尚未開展高強度的討論。

AI 對今日生活的便利已無遠弗屆,而 AI 所帶來的傷害,雖微小、難以察覺,但也已經出現,對應的倫理指引與規範在國際也蔚成趨勢,但臺灣仍在牛步,或許國家在看待 AI 發展時,必須開始將這些規範視為迫切的基礎建設。

如同歷史上所有科技進展一般,科技帶來的進步與災變往往是隱性與持續的,直到人們已慣於新興科技的進步,發現科技的受害者已經出現,才驚覺世界已經完全改觀。

延伸閱讀

  1. James Zou and Londa Schiebinger, AI can be sexist and racist — it’s time to make it fair, Nature, Vol.559, 324-326, 2018.
  2. 人工智慧之相關法規國際發展趨勢與因應,https://www.ndc.gov.tw/nc_1871_31998
  3. 《人工智慧發展基本法》草案,https://pse.is/3w9rrf
  • 〈本文選自《科學月刊》2022 年 1 月號〉
  • 科學月刊/在一個資訊不值錢的時代中,試圖緊握那知識餘溫外,也不忘科學事實和自由價值至上的科普雜誌。

所有討論 5
科學月刊_96
84 篇文章 ・ 331 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。