0

0
0

文字

分享

0
0
0

你是「黃種人」嗎?這本書會告訴你不一樣的答案

林書帆
・2015/08/24 ・1581字 ・閱讀時間約 3 分鐘 ・SR值 531 ・七年級

-----廣告,請繼續往下閱讀-----

(八旗)0UEC0006成為黃種人300dpi立體書封

 

近日關於「祖國」的爭議沸沸揚揚,幾乎可以肯定的是,至少對目前台灣的年輕一代來說,「炎黃子孫」已經退流行了,但如果問題換成「你是不是黃種人」呢?在回答之前,或許該先讀讀奇邁可這本《成為黃種人:一部東亞人由白變黃的歷史》

這本書的副標題已經透露出一個令人驚訝的訊息:我們曾經是白色的。奇邁可指出,「在歐洲『探險年代』之始,東亞民族幾乎一致被描述為『白色』,而從來就不是『黃色』。」那東亞人又是為何不復白皙?這就要提到奇邁可一個非常重要的觀察:在這些歐洲人的描述中,「白色」是屬於評價性用詞,而非敘述性用詞。東亞人被稱為「白」是因為他們的財富與文化精緻度,還有更重要的,「變得真正文明(即改信基督教)」的能力。奇邁可推論,或許是因為改宗情況不如預期,到了一六○○年左右,中國人的顏色開始變成「棕色」、「紅色」、「黃褐色」、「黑色」及「黝黑」(較多人改宗的日本就比較白)。

歐洲的殖民擴張讓科學家取得更多動植物及人體標本,加速了分類學的發展,瑞典植物學者林奈(Carl Linnaeus)以及德國醫師布盧門巴赫(Johann Blumenbach)的研究,成為科學種族主義的濫觴。林奈在《自然系統》第一版中,將「人屬」(Homo)分為四個「種」:歐羅巴白色、美利堅紅色、亞細亞棕色與阿非利加黑色。第十版修訂時,原指亞細亞的「棕」(fuscus)被改為luridus,此詞可譯為「黃色」、「灰黃色」、「死氣沉沉」等,在古典拉丁文中還帶有恐怖、醜陋與蒼白的含意。[1]

雖然《自然系統》被視為「黃種人」的重要起源,但要到十八世紀末,布盧門巴赫將「黃色」與他發明的「蒙古人種」聯繫在一起,才真正使得「黃色」與東亞人的形象密不可分。一八九五年出現的「黃禍」一詞,更強化了「黃種人」的負面意涵。奇邁可寫道:「只有在『黃皮膚』被接受為東方『禍害』的表徵時,人們才一致認為東方人的皮膚確實為『黃色』,進而緊緊凝聚數百年來緊密相關的概念:『黃皮膚』、多次『蒙古人種』侵略,以及該地區移民至西方的大量人口的駭人形象。」更進一步說,將東亞人稱為「黃色」是為了確保他們再也無法被稱為「白色」。

-----廣告,請繼續往下閱讀-----

從東亞人由白變黃的歷史中,可以看出科學很容易被用來支持種族成見。一次大戰後,學術界逐漸意識到種族主義可能帶來的惡果,更多左派與自由派的科學家否定種族主義是科學觀念。國際科學社群於1950年代早期在聯合國教科文組織的支持下,否認種族是個能用來辨認人類遺傳差異的科學名詞。[2]已故演化生物學家古爾德(S. J .Gould)也曾明言反對再將智人細分為不同種族或亞種,因為亞種這個單位,對自然界極具連續動態形式的種內變異來說是太過僵硬死板了。[3]

雖然已經有許多這樣的聲音,但種族論述至今仍沒有在醫療等科學領域完全消失。2003年,史丹佛大學十二位橫跨文科、理科的學者共同撰寫了聲明〈差異描述的倫理學〉,希望他們提出的十項原則能避免未來的生醫或遺傳學研究走回種族主義的老路。聲明中有個觀察似乎頗能呼應最近的祖國爭議:個人或族群對祖先的自我認同,會因一系列的歷史、文化和社會政治因素而和生物地理家譜不符。所以不論你身上流著誰的血,祖先都是可以選擇的。

在大多聚焦於黑白問題的種族研究領域中,《成為黃種人》無疑是一塊重要的拼圖,稍微可惜的是,它的行文風格並不如題材有趣,大量文獻資料對不習慣閱讀學術著作的讀者而言可能稍嫌枯燥,但也正因為作者鉅細靡遺地將這些史料羅列出來,我們才能清楚看到所謂的種族差異不過是社會文化的產物,且隨著時間不斷變遷,進而對所有的偏見與刻板印象更有抵抗力。

 

註1:《自然系統》不同版本、譯本眾多,若想細究「亞洲智人」在諸多版本中的細微「色差」,建議閱讀原書。

-----廣告,請繼續往下閱讀-----

註2:Keir Waddington,《歐洲醫療五百年》(2014:107-108)

註3:S. J .Gould,《達爾文大震撼》(1995:347-355)

文章難易度
林書帆
15 篇文章 ・ 1 位粉絲
在東華大學華文所發現自己對科普書的興趣,相信E.O.Wilson說的「科學和人文藝術是由同一個紡織機編織出來的」。就像為蝴蝶命名這件事,誰能肯定林奈將「金色之馬」(Chrysippus)做為樺斑蝶的種名時,沒有一點文學想像呢?

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

1

5
1

文字

分享

1
5
1
我們的遺傳差異有多大?基因竟會影響我們的教育程度!——《我們源自何方?》
馬可孛羅_96
・2023/03/19 ・2958字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

族群間差很大?

要了解遺傳學家為何不再和人類學家手牽手,不再認為人類族群之間的差異小到微不足道,只要看看「基因組部落格主」(genome blogger)就可以知道。

在基因組革命開始之後,人們便在網際網路上熱烈討論關於人類變異的論文,有些基因組部落格主後來精通於分析網路上公開的基因組資料。

相較於絕大多數的學術界人員,基因組部落格主的政治態度往往偏向右派,拉茲布.可汗(Razib Khan)與迪奈可斯.彭迪可斯(Dienekes Pontikos)發表了各族群特徵的平均差異,其中包括了身體外貌和運動能力。

許多基因部落格組認為學術界人士刻意忽視了族群間的差異。圖/envatoelements

部落格「歐洲基因」(The Eurogenes)中,「哪個古代民族散播了印歐語系語言」這樣激起反應的標題,往往會有上千個留言灌爆。這個非常敏感的議題在第二部分中討論了,那些印歐語系者的擴張過程,被當成建立國家神話的基礎,有的時候受到濫用,如同納粹德國時期的狀況。

-----廣告,請繼續往下閱讀-----

基因組部落格主的信念,有部分來自於在討論各族群之間生物性差異時,學術界人士並沒有保持科學家追求真實的精神。基因組部落格主很樂於指出一項矛盾:學術人士基於政治正確所傳遞的訊息,說族群之間的特徵無法區別,但是在他們發表的論文中得出的科學結果卻不是這樣的。

族群內的差異比族群間大

我們知道的實際差異有哪些?我們無法否認,各族群之間有顯著的平均遺傳差異,不只有膚色,還包括了體型、消化澱粉與乳糖的效率、在高海拔地區呼吸的難易程度,以及某些疾病的罹患率。這些還只是我們剛發現的差異而已。

我預料,不知道更多的人類族群之間的差異,是因為能夠找出這些差異的適當統計資源還沒有投入。人類大部分的特徵,一如呂文廷所說,在族群內的差異要大過族群之外。

這代表在任何的族群中,如身高等絕大部分的特徵,都有位於高低兩個極端的個體存在,例如很高與很矮的人。但是這並沒有排除各族群之間在特徵上有細微的平均差異存在。

-----廣告,請繼續往下閱讀-----
高矮差異不分族群。圖/envatoelements

幾乎每次回爭論,傳統教條都沒能站穩腳跟。二○一六年,我參加了一場約瑟夫.葛拉夫(Joseph L. Graves)在哈佛大學皮博迪考古與民族學博物館(Peabody Museum of Archaeology and Ethnography)的演講,主題是種族與遺傳學。在演講中,葛拉夫舉出五個能夠大幅影響皮膚色素沉積作用的突變,在不同族群中這五個突變出現的頻率差異很大。

他把這個五個突變和腦中上萬個會在腦中活動的基因比較。他指出,會在腦中活躍的基因和那五個和色素沉積的基因不同,會在許多部位活動。有些突變會推動認知和行為出現某個面向的特徵,但是另一些突變會推動的是別的面向,各種作用相加就平均掉了。

但他的論點其實並不可行,因為在實際的狀況下,如果天擇對兩個分開的族群施以不同的壓力,有許多突變所影響的特徵,會如同那些受到少數突變影響的特徵,讓兩個族群之間產生平均差異。事實上,已知有由許多突變所影響的特徵(可能如同行為和認知),如同膚色這種由幾個突變所影響的特徵,也受到天擇篩選。目前最佳的例子是身高。

身高是由基因組中數千個有變異的位置所決定的,二○一二年,喬爾.赫斯霍恩(Joel Hirschhorn)領導的分析研究指出,天擇對於那些位置的篩選結果,使得歐洲南部人的身高平均來說比歐洲北部人矮。

-----廣告,請繼續往下閱讀-----

身高並不是唯一的例子,強納森.普瑞查德(Jonathan Pritchard)所帶領的研究指出,至少從兩千年前,天擇就作用在英國人許多特徵的遺傳變異之上,結果包括嬰兒頭部平均來說比較大,女性臀部也是(可能是為了要在生產時配合嬰兒頭部的增大)。

遺傳變異間接影響教育程度

遺傳差異間接影響到教育程度與認知行為。圖/envatoelements

人們很容易會想,遺傳影響體型是一回事,但是影響認知和行為特徵又是另一回事。不過這種界線已經打破了。如果你加入了某個疾病的遺傳研究,得填寫表格,註明自己的身高、體重和受教育時間長度。

丹尼爾.班傑明(Daniel Benjamin)和同事彙整了四十萬名有歐洲血統者的受教育資料,那些人提供自己的基因組資料,以供研究各種遺傳疾病。

班傑明等人找到了七十四個在受教育時間長的人中更為常見的遺傳變異,那些變異在受教育時間短的人中比較少見。這樣研究已經去除了受到研究族群中各種會造成影響的差異,結果很紮實。這些科學家還指出,雖然平均來說,社會影響力在這方面要大過遺傳,但是從遺傳去推測受教育時間長短的準確度不容忽視。

-----廣告,請繼續往下閱讀-----

他們指出針對受到研究的歐洲血統族群,設計一個遺傳預測方式,計算出其中完成十二年教育的概率為百分之九十六,而最低的則為百分之三十七。

那些遺傳變異怎麼影響到教育程度?馬上浮現的猜想是它們會直接影響學業能力,但這可能是錯的。

一項包含了十萬多名冰島人的研究指出,那些遺傳變異也會讓女性生第一個小孩的年紀增加,而且造成影響的程度要遠大於對於受教育時間的影響。那些變異可能是以間接的方式發揮作用,讓人們比較晚有小孩,使得小孩必較容易接受完整的教育。

這個結果指出了,在我們發現控制行為的生物性差異時,這些差異發揮功用的方式往往和我們無知的猜想不同。

-----廣告,請繼續往下閱讀-----

各族群間影響教育程度的突變在出現頻率上的平均差異,還沒有找出來。但是在冰島,從遺傳上預期年長者整體上受教育的時間要長過年輕人,這點讓我們警覺。

領導這項冰島研究的奧古斯丁.江(Augustine Kong)指出,這項結果代表了在上個世紀,天擇作用不利於預期受到有更多教育的人身上,就像是篩選出比較年輕就有孩子的狀況。

遺傳變異透過生孩子的時間間接影響孩子的教育程度。圖/envatoelements

由於在單一族群中,影響受教育時間的遺傳成因顯然於一個世紀內因為受到了天擇壓力而產生明顯的改變,那麼這個特徵在各族群之間出現差異也是極有可能之事。

影響歐洲血統教育程度的遺傳變異,是否會對於非歐洲血統者的行為發生影響,或是對結構不同的社會系統發生影響?這些沒有人知道。不過,如果那些突變對於某一個族群的行為會發生影響,很可能對於其他族群也發生影響,縱使這些族群的社會狀況有所差異。

-----廣告,請繼續往下閱讀-----

在遺傳所影響的行為特徵中,教育程度可能只是冰山一角。其他人也和班傑明一樣,發現了能夠預測行為特徵的遺傳因素,其中一項研究調查了七萬多人,發現到在二十多個基因中的突變適合用來預測在智力測驗中的表現。

——本文摘自《我們源自何方?:古代DNA革命解構人類的起源與未來》,2023 年 3 月,馬可孛羅出版,未經同意請勿轉載。

所有討論 1
馬可孛羅_96
25 篇文章 ・ 19 位粉絲
馬可孛羅文化為台灣「城邦文化出版集團」的一個品牌,成立於1998年,經營的書系多元,包含旅行文學、探險經典、文史、社科、文學小說,以及本土華文作品,期望為全球中文讀者提供一個更開闊、可以縱橫古今、和全世界對話的新閱讀空間。

1

2
0

文字

分享

1
2
0
AI 也會出差錯?使用人工智慧可能帶來的倫理與風險——《科學月刊》
科學月刊_96
・2023/02/19 ・3976字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

  • 甘偵蓉|清華大學人文社會 AI 應用與發展研究中心博士後研究學者。

Take Home Message

  • Facebook 或 Instagram 的訊息推薦、YouTube 或 Netflix 推薦觀賞影片、掃瞄臉部以解鎖手機,AI 應用早已在我們日常生活中隨處可見。
  • AI 應用中四種常見的倫理和風險:演算法偏誤、相關技術或產品偏離原先使用目的、擁有善惡兩種用途,以及演算法設計不良或現有技術限制。
  • 近年來各國家皆制訂有關 AI 發展的規範,臺灣則在 2019 年制訂「AI 科研發展指引」,期望能改善 AI 發展帶來的問題與風險。

當談到人工智慧(artificial intelligence, AI)、也就是 AI 時,讀者會想到什麼?是多年前由史匹柏(Steven Spielberg)導演的那部《A.I. 人工智慧》(A.I. Artificial Intelligence)中那個一直盼不到人類母愛而令人心碎的機器人小男孩?還是由史密斯(Will Smith)主演的《機械公敵》(I, Robot)裡那些沒遵守機器人三大法則的機器人或中央系統?

《A.I. 人工智慧》(A.I. Artificial Intelligence)電影海報,上映於 2001 年。圖/IMDb

或許未來有一天,人類真的可以設計出如電影中那些像人一樣的 AI 系統或機器人。但目前為止,你常聽到的 AI 其實既很厲害又很不厲害,為什麼呢?厲害的是它下圍棋可贏過世界冠軍,還能夠比放射科技師更快、更準確地辨識 X 光片中疑似病變的細胞;但它不厲害的是,很會下圍棋的 AI 就只能下圍棋,別說不會打牌,連撲克牌是什麼都不知道!而且每次學新事物幾乎都是打掉重練,得不斷做好多考古題才有可能學得會,不像人類通常教幾次就會舉一反三。

不過,即使目前世界上的 AI 都是這種只具備特定功能的「弱 AI」(artificial narrow intelligence, ANI),但已經為這個世界帶來相當大的進步與便利。所以,以下要談的就是 ANI 的倫理與風險。

談到這種只具特定功能的 ANI,讀者知道目前生活周遭有哪些事物有利用 AI 技術嗎?其實 Google 上的搜尋資訊、Facebook 或 Instagram 的訊息推薦、對智慧型手機喊「Siri 現在外面有下雨嗎?」等功能,或是以掃瞄臉部解鎖手機與進入大樓、YouTube 或 Netflix 推薦觀賞影片,甚至是投履歷求職、銀行審核貸款申請等都常用到 AI 技術,它早在我們日常生活中隨處可見。

-----廣告,請繼續往下閱讀-----
AI 技術在日常生活中隨處可見,如 YouTube 推薦觀看影片。圖/Pexels

但也正是如此,讓人們這幾年在使用 AI 時,逐漸發現它可能造成的問題或傷害,以下簡單介紹常見的四種AI應用可能造成的倫理問題或風險。

演算法偏誤

第一種是演算法偏誤(algorithmic bias)。什麼是演算法偏誤?簡單來說就是 AI 在某些群體的判斷準確率或預測結果上總是很差,導致結果可能對於此群體造成系統性的不利。但為何會造成演算法偏誤?常見原因有三項。

第一項原因是,建立 AI 模型的研究資料集有偏誤,在性別、種族、社經地位等特徵上,沒有真實世界的人口分布代表性。例如數位裝置採用 AI 臉部辨識技術解鎖,原本是希望保護個人使用數位裝置的安全性,結果皮膚深的人卻常常遇到辨識失敗而無法解鎖。這通常是因為目前許多 AI 模型都是以機器學習技術設計,而機器學習的主要特性就是從過去人類留下的大量資料中學習;當初提供電腦學習臉部辨識的圖片時,如果多數都是白皮膚而非黑皮膚、多數都是男性的臉而非女性的臉,那麼電腦在學習辨識人臉的準確率上,整體而言辨識男性白人就會比辨識女性黑人要高出許多。

第二項產生演算法偏誤的原因是建立 AI 模型的研究資料集不只有偏誤,還反映現實社會中的性別、種族、社經地位等歧視;例如美國警政單位以過往犯罪資料訓練出獄後犯人再犯風險評估的 AI 模型,那些資料不意外地有色人種的犯罪紀錄遠多於白人犯罪紀錄。然而,那些紀錄也反映美國社會長久以來對於有色人種的歧視,其中包含警察對於有色人種的盤查比例遠高於白人、法院對於有色人種的定罪比例及判刑嚴重程度也遠高於白人、警力通常被派往多黑人與拉丁裔人種居住的窮困社區盤查等。所以根據過往犯罪資料所訓練出來的 AI 模型,不意外地也就會預測有色人種的再犯機率普遍來說比白人高。

-----廣告,請繼續往下閱讀-----

第三項產生演算法偏誤的原因則是 AI 學會了連系統開發者都沒有察覺到,潛藏在資料裡的偏誤。例如科技公司人資部門本來想借助 AI 更有效率地篩選出適合來面試的履歷,所以挑選在該公司任職一定年資且曾升遷二次的員工履歷來訓練 AI 模型。問題是,高科技公司向來男多女少,所提供給 AI 學習的資料自然就男女比例相當不均。AI 也就學會了凡是出現偏向女性名字、嗜好、畢業學校系所等文字的履歷,平均所給的評分都比出現偏向男性等相關文字的履歷還低。

潛藏在資料裡的偏誤造成 AI 預測結果彷彿帶有性別歧視。圖/Envato Elements

但目前科技公司陽盛陰衰,是受到以往鼓勵男性就讀理工、女性就讀人文科系,或男性在外工作女性在家帶小孩等性別刻板偏見所影響。所以 20~30 年來許多人做出各種努力以消除這種性別刻板偏見所帶來的不良影響,政府也努力制定各種政策來消除這種不當的性別偏見,像是求才廣告基本上不能限定性別、公司聘雇員工應該達到一定的性別比例等。因此,訓練 AI 的研究資料一旦隱藏類似前述性別比例不均的現象,訓練出來的 AI 預測結果就彷彿帶有性別歧視,讓人們過往致力消除性別不平等的各種努力都白費了!

其他 AI 應用帶來的倫理與風險

除了演算法偏誤的問題外,第二種可能帶來的倫理問題或風險是 AI 技術已經偏離原先使用目的,例如深偽技術(deepfake)原本用來解決圖片資料量不夠的問題,後來卻被利用在偽造名人性愛影片等。

第三種則是有些 AI 技術或產品本身就可能有善惡兩種用途(dual-use)。例如 AI 人臉辨識技術可用在保護數位裝置的使用者或大樓保全,但也可用來窺探或監控特定個人;無人機可以在農業上幫助農夫播種,但也可作為自動殺人武器;可用來搜尋如何產生毒性最少的藥物合成演算法,也能反過來成為搜尋如何產生毒性最強的藥物合成演算法。

-----廣告,請繼續往下閱讀-----

最後,第四種是演算法設計不良或現有技術限制所導致的問題。在演算法設計不良方面,例如下棋機器人手臂可能因為沒有設計施力回饋或移動受阻暫停等防呆裝置,而造成誤抓人類棋手的手指且弄斷的意外。在現有技術限制方面,道路駕駛的交通標誌在現實中可能時常有老舊或髒汙的情況,儘管對於人類駕駛來說可能不影響判讀,但對於自駕車來說很可能就因此會嚴重誤判,例如無法正確辨識禁止通行標誌而繼續行駛,或是將速限 35 公里誤判成 85 公里等。但前述情況也有可能是自駕車網路、控制權限或物件辨識模型受到惡意攻擊所致。

以上介紹了 AI 常見的四種倫理問題或風險:演算法偏誤、相關技術或產品偏離原先使用目的、擁有善惡兩種用途,以及演算法設計不良或現有技術限制。但人們該如何減少這些倫理問題與風險呢?

培養AI使用倫理與風險的敏銳度

近五、六年來國際組織如聯合國教育科學及文化組織(United Nations Educational, Scientific and Cultural Organization, UNESCO)、歐盟(European Union, EU)、電機電子工程師學會(Institute of Electrical and Electronics Engineers, IEEE)或是國家、國際非營利組織皆紛紛制訂有關 AI 發展的白皮書或倫理指引(ethical guidelines),甚至逐漸朝向法律治理的方向,如歐盟的人工智慧規則草案等。儘管這些文件所提出的倫理價值、原則或行為規範,看似各有不同,但經過這些年的討論與摸索,也逐漸匯聚出一些共識。

「人工智慧科研發展指引」提出三項倫理價值,包含以人為本、永續發展、多元包容。圖/Pexels

臺灣相較於前述國際文件來說,在制訂的時間上比較晚。2019 年由當時的科技部(現改為國科會)制訂「人工智慧科研發展指引」,裡面提出的三項倫理價值以及八項行為指引,基本上涵蓋了前述各種國際 AI 發展指引文件最常提及的內容。所謂三項倫理價值包含以人為本、永續發展、多元包容,行為指引則有共榮共利、安全性、問責與溝通、自主權與控制權、透明性與可追溯性、可解釋性、個人隱私與數據治理、公平性與非歧視性共八項。

-----廣告,請繼續往下閱讀-----

未來當讀者看到又出現哪些 AI 新技術或產品時,不妨試著評估看看是否有符合這三項價值及八項行為指引。若沒有,究竟是哪項不符合?不符合的原因是上述所介紹常見的四種倫理問題或風險的哪一種?若都不是,還有哪些倫理問題或風險過去被忽略了但值得重視?

AI 技術發展日新月進,在日常生活中的應用也愈來愈廣。但考量法律條文有強制性,在制訂時必須相當謹慎,免得動輒得咎,也很可能在不清楚狀況下反而制訂了不當阻礙創新發展的條文;再加上法律制定也必須有一定的穩定性,不能朝令夕改,否則會讓遵守法規者無所適從。因此可以想見,法令規範趕不上新興科技所帶來的問題與風險本來就是常態,而非遇到 AI 科技才有這種情況。

人們若能培養自身對於 AI 倫理問題或風險的敏銳度,便可發揮公民監督或協助政府監督的力量,評估 AI 開發或使用者有無善盡避免傷害特定個人或群體之嫌,逐漸改善 AI 開發者與大眾媒體常過度誇大 AI 功能,但對於可能帶來的倫理問題或風險卻常閃爍其詞或避而不談的不好現象。

本文感謝工業技術研究院產業科技國際策略發展所支持。

  • 〈本文選自《科學月刊》2023 年 2 月號〉
  • 科學月刊/在一個資訊不值錢的時代中,試圖緊握那知識餘溫外,也不忘科學事實和自由價值至上的科普雜誌。
所有討論 1
科學月刊_96
249 篇文章 ・ 3481 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。