0

20
0

文字

分享

0
20
0

轉變了性別,周圍的眼光也變了?從巴雷斯教授的故事看見社會中隱含的歧視——《隱性偏見》

平安文化_96
・2022/12/16 ・2134字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

性別認同使「他」決定成為男生

在治療癌症多年之後,本‧巴雷斯(Ben Barres)回憶他是如何措辭向腫瘤科醫師提出了請求。

他問道:在切除我的乳房時,能否請你把另一個乳房也一併拿掉?由於他的家族有癌症病史,醫師便同意了,但事實是巴雷斯只是想要擺脫那雙乳房。他有個女性名字,身為女孩長大成人,但他對自己的女性身分一向感到不自在。四歲時他覺得自己是個男孩,青春期的身體變化令他難安,成年後要把自己塞進高跟鞋和伴娘禮服也令他不自在。

那是一九九五年,是在變性人拉維恩‧考克斯(Laverne Cox)和凱特琳‧詹納(Caitlyn Jenner)成為家喻戶曉的人物之前,是在谷歌搜尋「變性人」會得到法律建議之前,甚至是在有谷歌之前。當時巴雷斯並不了解身為變性人是什麼意思,但是切除了雙邊乳房是種莫大的解脫。一年之後,他讀到一篇講一名變性男子的文章,他豁然了悟。

巴雷斯渴望展開荷爾蒙治療,但是他有一大顧慮:他的事業。當時四十三歲的他是史丹佛大學的神經生物學家,剛發現了神經膠質細胞的重要,這種大腦細胞的角色在那之前一直被低估,他的發現具有開創性。

-----廣告,請繼續往下閱讀-----

科學界的同儕一直視他為女性,他不知道他們對於他改變性別會有什麼反應。學生是否會不想再參與他的實驗室工作?他是否不會再受邀參加學術研討會?

科學界的態度變化

科學界的確作出了反應,但不是以巴雷斯所擔心的方式。在他變性之後,不曉得他是變性人的那些人開始更仔細地聆聽他的意見,不再質疑他的權威。身為中年白人男子,在開會時不再有人打斷他。在證據不夠充分的時候,別人一次又一次地姑且相信他。他甚至在購物時得到更好的服務。

在一場研討會上,他無意間聽到一個不知道他是變性人的科學家說:「本今天做的專題研討很棒,再說,他的研究成果要比他姊姊強得多。」

學術界在巴雷斯變性後對他的態度有了改變。圖/envato.elements

巴雷斯很驚訝。在變性之前,他很少察覺性別歧視,甚至連明顯的例子都沒注意到。巴雷斯還就讀於麻省理工學院大學部時,有一次他在一堂數學課上解開了一個難題,是全班唯一解開這道題的學生,教授說:「想必是你男朋友替你解答的。」這句話冒犯了巴雷斯。題目當然是他自己解開的,他甚至根本沒有男朋友。

可是當時他不認為教授此言帶有歧視,因為他以為性別歧視已經不存在了。就算性別歧視還存在,由於他對女性身分缺少認同,不足以讓他覺得性別歧視會發生在他身上,他只氣憤自己被指控作弊。在變性之前,巴雷斯認為自己受到的對待就跟其他人一樣。

-----廣告,請繼續往下閱讀-----

現在他有了驚人的證據,證明了事情正好相反。那簡直就像個科學實驗:他擁有同樣的學歷、同樣的技能、同樣的成就、同樣的職位。除了一個變數之外,其餘的變數都維持不變。

巴雷斯清楚看出,他的日常遭遇、他的科學家生涯、他的生活全都由別人眼中所見的性別所塑造,以他自己以前不曾看出的方式。在變性之前,他的想法、貢獻和權威都遭到貶抑,雖然並非公開,也非全盤,但是當造成貶抑的因素忽然消失,這一切就變得清晰可見。如今,男性和女性所受到的差別待遇被看清了,就像花瓣在紫外線照射下呈現出新的圖案。

日常中的一切都是由別人眼中性別所塑造。圖/envato.elements

科學界中對女性的偏見

因此,二○○五年,當哈佛大學校長薩默斯(Larry Summers)表示科學界的女性之所以不多,可能係由於兩性在能力上的先天差異,巴雷斯無法默不吭聲。他在《自然》雜誌(Nature)上發表了一篇由衷的呼籲,要求科學界關注偏見的問題。

「這就是女性在學術界工作所佔比例不高的原因」,他說,「原因不在於照顧小孩,也不在於家庭責任。」他又說,在他改以男性的身分在科學界工作之後,「這個念頭在我腦中浮現了一百萬次:現在的我更受到重視。」並不是說巴雷斯在變性之前從未在職業生涯中遇到過障礙和偏見,「只是我從來沒有看出來」,他告訴我。

我們當中許多人都曾在與別人接觸時有過經驗,使我們納悶偏見是否起了作用。但是我們呈現在外界眼中的樣子如果不曾有過戲劇化的轉變,我們可能就沒有機會來證實這些直覺。

-----廣告,請繼續往下閱讀-----

如果我們的體重有了可觀的增減,或是有了明顯可見的殘疾,我們或許能夠向自己證實這些直覺。如果我們去其他國家旅行,而我們的膚色在當地具有不同的意義,那麼我們或許也會看得出來。就像有個黑人學生告訴我,他在義大利旅行時有種奇怪的感覺,後來他明白那是因為他在商店裡被懷有疑心的店員緊盯著。

異性婚姻的夫妻,如果配偶進行了性別轉換,就往往會看出當他們還是異性婚姻的伴侶時多麼受到認可。最終,我們當中許多人都將會感受到老年人所受到的歧視和不尊重。但我們往往還是很難確定自己所遭遇的偏見。

——本文摘自《隱性偏見》,2022 年 10 月,平安文化出版,未經同意請勿轉載

文章難易度
平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。

0

5
1

文字

分享

0
5
1
快!還要更快!讓國家級地震警報更好用的「都會區強震預警精進計畫」
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/21 ・2584字 ・閱讀時間約 5 分鐘

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

從地震儀感應到地震的震動,到我們的手機響起國家級警報,大約需要多少時間?

臺灣從 1991 年開始大量增建地震測站;1999 年臺灣爆發了 921 大地震,當時的地震速報系統約在震後 102 秒完成地震定位;2014 年正式對公眾推播強震即時警報;到了 2020 年 4 月,隨著技術不斷革新,當時交通部中央氣象局地震測報中心(以下簡稱為地震中心)僅需 10 秒,就可以發出地震預警訊息!

然而,地震中心並未因此而自滿,而是持續擴建地震觀測網,開發新技術。近年來,地震中心執行前瞻基礎建設 2.0「都會區強震預警精進計畫」,預計讓臺灣的地震預警系統邁入下一個新紀元!

-----廣告,請繼續往下閱讀-----

連上網路吧!用建設與技術,換取獲得地震資料的時間

「都會區強震預警精進計畫」起源於「民生公共物聯網數據應用及產業開展計畫」,該計畫致力於跨部會、跨單位合作,由 11 個執行單位共同策畫,致力於優化我國環境與防災治理,並建置資料開放平台。

看到這裡,或許你還沒反應過來地震預警系統跟物聯網(Internet of Things,IoT)有什麼關係,嘿嘿,那可大有關係啦!

當我們將各種實體物品透過網路連結起來,建立彼此與裝置的通訊後,成為了所謂的物聯網。在我國的地震預警系統中,即是透過將地震儀的資料即時傳輸到聯網系統,並進行運算,實現了對地震活動的即時監測和預警。

地震中心在臺灣架設了 700 多個強震監測站,但能夠和地震中心即時連線的,只有其中 500 個,藉由這項計畫,地震中心將致力增加可連線的強震監測站數量,並優化原有強震監測站的聯網品質。

-----廣告,請繼續往下閱讀-----

在地震中心的評估中,可以連線的強震監測站大約可在 113 年時,從原有的 500 個增加至 600 個,並且更新現有監測站的軟體與硬體設備,藉此提升地震預警系統的效能。

由此可知,倘若地震儀沒有了聯網的功能,我們也形同完全失去了地震預警系統的一切。

把地震儀放到井下後,有什麼好處?

除了加強地震儀的聯網功能外,把地震儀「放到地下」,也是提升地震預警系統效能的關鍵做法。

為什麼要把地震儀放到地底下?用日常生活來比喻的話,就像是買屋子時,要選擇鬧中取靜的社區,才不會讓吵雜的環境影響自己在房間聆聽優美的音樂;看星星時,要選擇光害比較不嚴重的山區,才能看清楚一閃又一閃的美麗星空。

-----廣告,請繼續往下閱讀-----

地表有太多、太多的環境雜訊了,因此當地震儀被安裝在地表時,想要從混亂的「噪音」之中找出關鍵的地震波,就像是在搖滾演唱會裡聽電話一樣困難,無論是電腦或研究人員,都需要花費比較多的時間,才能判讀來自地震的波形。

這些環境雜訊都是從哪裡來的?基本上,只要是你想得到的人為震動,對地震儀來說,都有可能是「噪音」!

當地震儀靠近工地或馬路時,一輛輛大卡車框啷、框啷地經過測站,是噪音;大稻埕夏日節放起絢麗的煙火,隨著煙花在天空上一個一個的炸開,也是噪音;台北捷運行經軌道的摩擦與震動,那也是噪音;有好奇的路人經過測站,推了推踢了下測站時,那也是不可忽視的噪音。

因此,井下地震儀(Borehole seismometer)的主要目的,就是盡量讓地震儀「遠離塵囂」,記錄到更清楚、雜訊更少的地震波!​無論是微震、強震,還是來自遠方的地震,井下地震儀都能提供遠比地表地震儀更高品質的訊號。

-----廣告,請繼續往下閱讀-----

地震中心於 2008 年展開建置井下地震儀觀測站的行動,根據不同測站底下的地質條件,​將井下地震儀放置在深達 30~500 公尺的乾井深處。​除了地震儀外,站房內也會備有資料收錄器、網路傳輸設備、不斷電設備與電池,讓測站可以儲存、傳送資料。

既然井下地震儀這麼強大,為什麼無法大規模建造測站呢?簡單來說,這一切可以歸咎於技術和成本問題。

安裝井下地震儀需要鑽井,然而鑽井的深度、難度均會提高時間、技術與金錢成本,因此,即使井下地震儀的訊號再好,若非有國家建設計畫的支援,也難以大量建置。

人口聚集,震災好嚴重?建立「客製化」的地震預警系統!

臺灣人口主要聚集於西半部,然而此區的震源深度較淺,再加上密集的人口與建築,容易造成相當重大的災害。

-----廣告,請繼續往下閱讀-----

許多都會區的建築老舊且密集,當屋齡超過 50 歲時,它很有可能是在沒有耐震規範的背景下建造而成的的,若是超過 25 年左右的房屋,也有可能不符合最新的耐震規範,並未具備現今標準下足夠的耐震能力。 

延伸閱讀:

在地震界有句名言「地震不會殺人,但建築物會」,因此,若建築物的結構不符合地震規範,地震發生時,在同一面積下越密集的老屋,有可能造成越多的傷亡。

因此,對於發生在都會區的直下型地震,預警時間的要求更高,需求也更迫切。

-----廣告,請繼續往下閱讀-----

地震中心著手於人口密集之都會區開發「客製化」的強震預警系統,目標針對都會區直下型淺層地震,可以在「震後 7 秒內」發布地震警報,將地震預警盲區縮小為 25 公里。

111 年起,地震中心已先後完成大臺北地區、桃園市客製化作業模組,並開始上線測試,當前正致力於臺南市的模組,未來的目標為高雄市與臺中市。

永不停歇的防災宣導行動、地震預警技術研發

地震預警系統僅能在地震來臨時警示民眾避難,無法主動保護民眾的生命安全,若人民沒有搭配正確的防震防災觀念,即使地震警報再快,也無法達到有效的防災效果。

因此除了不斷革新地震預警系統的技術,地震中心也積極投入於地震的宣導活動和教育管道,經營 Facebook 粉絲專頁「報地震 – 中央氣象署」、跨部會舉辦《地震島大冒險》特展、《震守家園 — 民生公共物聯網主題展》,讓民眾了解正確的避難行為與應變作為,充分發揮地震警報的效果。

-----廣告,請繼續往下閱讀-----

此外,雖然地震中心預計於 114 年將都會區的預警費時縮減為 7 秒,研發新技術的腳步不會停止;未來,他們將應用 AI 技術,持續強化地震預警系統的效能,降低地震對臺灣人民的威脅程度,保障你我生命財產安全。

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
194 篇文章 ・ 297 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

8
3

文字

分享

1
8
3
揭開雙性的面紗:從雌雄嵌合體看待多元性別的世界
水鯨球_96
・2023/05/31 ・3092字 ・閱讀時間約 6 分鐘

你知道嗎?世界上的另一個族群
在這個世界上存在一種族群,叫雙性人,俗稱間性人,或陰陽人。他們的性器官或是性染色體異常,所造成性徵上不符合典型的男生或女生。根據聯合國統計,雙性人約佔全球人口 0.05% 到 1.7%。而我國監察院依照上限估算,台灣人約有 40 萬名雙性人。在許多生物中,也有因突變所形成的雙性特徵。讓我們透過自然界的案例,從其他生物面對雙性所造成的影響,檢視社會上面對雙性人的問題。

大自然中的「雌雄嵌合體」

一研究團隊在北美進行蝴蝶物種調查中,採集到很特別的一隻蝴蝶,經鑑定後為卡納藍蝴蝶(Plebejus samuelis。奇特的地方在於,這是一隻帶有雄性特徵和雌性特徵的蝴蝶,一側為藍色,但另一側為棕色邊緣還帶點橘色斑紋。

一側雌性,一側雄性的卡納藍蝴蝶。圖/Joshua P Jahner, 2015

這種生物現象叫做「雌雄嵌合體」,一半雄性、一半雌性。雌雄嵌合體不同於「雌雄同體」,雌雄同體指的是卵巢和精巢共存於同一個體上,身上所有體細胞都具同一基因型,但雌雄嵌合體是在同一個體上具有不同的基因型,而且不同基因型分布在不同的區域。

北美紅雀(也就是「憤怒鳥」的原型),也同樣存在「雌雄嵌合體」的現象。北美紅雀的雄鳥毛色鮮紅,雌鳥毛色呈淡褐色。雌雄嵌合體的北美紅雀則是一面紅色、一面白色。

-----廣告,請繼續往下閱讀-----
雌雄嵌合體的北美紅雀。

對於雌雄嵌合體的北美紅雀來說,雙重的性別特徵大大影響了牠們的生活。牠們求偶時唱著雄性的求偶歌,但身體卻跳著雌性舞蹈,而奇特的體色也讓牠們無法融入族群。

在求偶上遇到困難的除了北美紅雀,還有雌雄嵌合體的蚊子。科學家在加州聖華金谷(san joaquin valley)採集到多種雌雄嵌合體的蚊子,比較特別的是,牠們雌雄的區域分佈不是左、右兩邊,而是上、下兩部分。科學家們採集到的其中一隻是紅胸庫蚊(Culex rubithoracis),牠的雌性部分在頭部,雄性區域則是在胸腹部。

實驗採集到的紅胸庫蚊。其頭部呈現雌性,具有羽狀觸角和短鬚;腹部則為雄性。圖/De La Vega et al., 2020

這樣的蚊子在繁殖上有著極大的阻礙,原因有兩個。第一個是牠們的翅膀。雌性蚊子的翅膀發出的聲音頻率,可以吸引雄蚊進行交配,然而雌雄嵌合體的蚊子,其翅膀卻可能是雄性的,因此無法和雄蚊互相吸引。第二個原因則和進食有關。雌蚊之所以會有吸血的行為,是因為牠們在產卵時需要血中的營養素,但對於雌雄嵌合體的蚊子來說,「頭部雌性、腹部雄性」的特徵,會導致吸進去的血沒有對應的消化酶可以被消化、吸收,進而導致死亡,牠們在開心吸血的同時可能連自己怎麼死的都不知道。

如果頭部剛好是雄性區域,也可能因爲刺吸式口器中的上下顎退化,導致根本不能刺穿動物皮膚來獲取血液;此外,雄性頭部也沒有感知宿主的受器,根本找不到可以吸血的對象。種種特徵和功能缺陷對於雌雄嵌合體的蚊子來說簡直厄運連連。

-----廣告,請繼續往下閱讀-----

雌雄嵌合體」的現象是如何產生的?

到底為什麼會產生雌雄嵌合體或雙性人這種生物現象呢?可能的原因有部分受精重複受精染色體分離異常性染色體異常缺失染色體連鎖互換異常等等,許多基因上的突變都很有可能造成雌雄嵌合體產生。

在鳥類的基因中,是由 Z 染色體和 W 染色體決定性別特徵,雄性的鳥類具有同型染色體(ZZ)雌性具有異型染色體(ZW),類似人類 XY 染色體的性別決定系統。

鳥類的 ZW 性別決定系統。雄鳥生殖細胞中的兩個 Z 染色體(黑色字母);雌鳥的生殖細胞中則有一個 Z 染色體和一個 W 染色體。這些染色體會被隨機分配到子代的身上(雄鳥、雌鳥各貢獻其中一個)。子代身上的染色體組合,就決定了子代的性別。圖/作者繪

正常狀態下,卵母細胞會分裂成分別具有 Z 染色體的卵子和 W 染色體的卵子。如果分裂的時候出現問題,原本各帶一條染色體的兩顆卵子,會變成一顆卵子同時攜帶 Z 和 W 兩種性染色體,而另一顆則完全沒有性染色體。這顆同時具有兩種性染色體的卵子可能被兩條精子同時受精,如此一來,生出的後代就會同時具有 ZZ 和 ZW 的細胞;也就是說,這個後代的身體內會同時具有雄性特徵和雌性特徵。

一般來說,一條精子進入卵子時會觸發卵膜「極化」,以快速阻斷其他精子進入卵內,因此要有兩條精子同時儘速卵內、形成雌雄嵌合體的條件機率極低,除了要在細胞分裂時出問題,還要意外地讓兩隻精子進入卵內才能達成。

-----廣告,請繼續往下閱讀-----

位於蘇格蘭愛丁堡的「羅斯林研究所」研究了一隻雌雄嵌合體的雞。這隻雞的左側是雄性,具有白色羽毛和大胸肌,腳上也具有骨刺(是雄性的最大特徵);而右側則是雌性,具深色羽毛,體型相對比雄性小,腳上也無骨刺。研究發現,脊索動物中「鳥類」的性發育機制,是來自於染色體而不是激素。

雌雄嵌合體的雞。圖/Clinton et al., 2012

在人類身上,性別是由 XY 性染色體決定,一般男性為 XY 異型性染色體,女性則是 XX 同型性染色體。性染色體的缺失或多餘都會造成雙性人的出現。在醫學上常見的雙性人分類有克林伊斯菲特症、透納氏症、腎上腺素增生症(CAH)、雄性激素不敏症(AIS)、尿道下裂症等等,這些人雖然身體構造和其他人略顯差異,但多數都是健康的狀態。

Y 染色體缺失所引發透納氏症。圖/wikimedia

目前各國已開始努力維護雙性人的人權及權益,而台灣對雙性人人權的重視也才剛起步。監察院在 2018年發布首次對雙性人人權進行調查的報告。同年 10 月,衛生福利部頒布〈未成年雙性人之醫療矯正手術共同性建議原則〉,其中最重要的是一項原則為「訂定雙性人性別手術的年齡規範」,成為亞洲先驅。

不管是人類還是自然界,都可能出現雌雄嵌合體的現象,生活在這樣性別多元的世界,大眾應以正面的態度認識雙性人。願大家都能保持多元開放的心態看待每一個人。

-----廣告,請繼續往下閱讀-----

參考文獻

所有討論 1
水鯨球_96
1 篇文章 ・ 2 位粉絲
東海大學生命科學系學生,腦袋可以裝下一整個生物圈。對於進那個實驗室猶豫不決,透過寫作廣泛吸收各種科普資訊。

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。