0

0
0

文字

分享

0
0
0

聞一下!你是男生或女生?

Jacky Hsieh
・2014/05/13 ・1043字 ・閱讀時間約 2 分鐘 ・SR值 522 ・七年級

-----廣告,請繼續往下閱讀-----

本文由民視《科學再發現》贊助,泛科學獨立製作

123

「費洛蒙」是動物利用化學分子傳遞訊息的溝通方式,最常聽到的就是同物種內的費洛蒙,會透過嗅覺器官吸引異性。根據一篇刊載在《Current Biology》的研究指出,人類可以「聞」一下費洛蒙──男性的雄二烯酮(Androstadienone,下文以男性費洛蒙簡略)與女性的雌甾四烯(Estratetraenol,下文以女性費洛蒙簡略)──對不同性別、性向的人,影響性別的視覺知覺。

過去的研究發現,從男性精子、腋下蒐集到的男性費洛蒙,可以讓女性產生正面情緒;而從女性尿液中蒐集到的女性費洛蒙,對男性也有相同的效果。但並不清楚這些化學分子是否代表任何性徵。這個實驗便想為此解答。

這個實驗找來96位參與者,男女各半,男性中有一半是同性戀、一半異性戀;女性中有一半雙性戀或同性戀、一半異性戀(即:男同、異男、女同/女雙、異女)。他們觀看由15個亮點組成的動態亮點走路人(point-light walkers,請到這個網站看看),並聞特定氣味,要參與者判定該亮點走路人偏男性或偏女性。

-----廣告,請繼續往下閱讀-----

參與者會分三天經歷「聞」男性費洛蒙、女性費洛蒙、或無費洛蒙三種情況,三種情況的都混入丁香,所以聞起來都一樣,參與者並無意識「聞」到不同費洛蒙。結果發現「聞」男性費洛蒙時,異女傾向認為亮點走路人偏男性;反之「聞」女性費洛蒙的異男,傾向認為亮點走路人偏女性。

而有趣的是,男同的結果與異女雷同,都傾向認為亮點走路人偏男性;但女同/女雙的結果介於異男與異女之間,不把亮點走路人判定偏男或偏女,也就是說,女同/女雙在四組參與者中,最能正確的區辨亮點走路人是男是女。

這個實驗的數據說明,男性或女性費洛蒙在不同性向、性別之間,影響對於性別的視覺感知,而且,是透過無意識的生物化學線索。

備註:本文「聞」字加上引號,因為實驗過程確實是讓參與者透過「聞」來接收費洛蒙,但卻無法「聞」出差異。

-----廣告,請繼續往下閱讀-----

資料來源:Chemosensory Communication of Gender through Two Human Steroids in a Sexually Dimorphic Manner
圖片來源:Olfactory / James Auger: Smell+

—————————–

延伸科學再發現@科技大觀園

更多內容也可以上科技大觀園搜尋「知覺」,或每週六上午8點收看民視53台科學再發現

-----廣告,請繼續往下閱讀-----
文章難易度
Jacky Hsieh
57 篇文章 ・ 0 位粉絲
中大認知所碩士。使用者經驗工程師。喜歡寫東西分享。

1

8
3

文字

分享

1
8
3
揭開雙性的面紗:從雌雄嵌合體看待多元性別的世界
水鯨球_96
・2023/05/31 ・3092字 ・閱讀時間約 6 分鐘

你知道嗎?世界上的另一個族群
在這個世界上存在一種族群,叫雙性人,俗稱間性人,或陰陽人。他們的性器官或是性染色體異常,所造成性徵上不符合典型的男生或女生。根據聯合國統計,雙性人約佔全球人口 0.05% 到 1.7%。而我國監察院依照上限估算,台灣人約有 40 萬名雙性人。在許多生物中,也有因突變所形成的雙性特徵。讓我們透過自然界的案例,從其他生物面對雙性所造成的影響,檢視社會上面對雙性人的問題。

大自然中的「雌雄嵌合體」

一研究團隊在北美進行蝴蝶物種調查中,採集到很特別的一隻蝴蝶,經鑑定後為卡納藍蝴蝶(Plebejus samuelis。奇特的地方在於,這是一隻帶有雄性特徵和雌性特徵的蝴蝶,一側為藍色,但另一側為棕色邊緣還帶點橘色斑紋。

一側雌性,一側雄性的卡納藍蝴蝶。圖/Joshua P Jahner, 2015

這種生物現象叫做「雌雄嵌合體」,一半雄性、一半雌性。雌雄嵌合體不同於「雌雄同體」,雌雄同體指的是卵巢和精巢共存於同一個體上,身上所有體細胞都具同一基因型,但雌雄嵌合體是在同一個體上具有不同的基因型,而且不同基因型分布在不同的區域。

北美紅雀(也就是「憤怒鳥」的原型),也同樣存在「雌雄嵌合體」的現象。北美紅雀的雄鳥毛色鮮紅,雌鳥毛色呈淡褐色。雌雄嵌合體的北美紅雀則是一面紅色、一面白色。

-----廣告,請繼續往下閱讀-----
雌雄嵌合體的北美紅雀。

對於雌雄嵌合體的北美紅雀來說,雙重的性別特徵大大影響了牠們的生活。牠們求偶時唱著雄性的求偶歌,但身體卻跳著雌性舞蹈,而奇特的體色也讓牠們無法融入族群。

在求偶上遇到困難的除了北美紅雀,還有雌雄嵌合體的蚊子。科學家在加州聖華金谷(san joaquin valley)採集到多種雌雄嵌合體的蚊子,比較特別的是,牠們雌雄的區域分佈不是左、右兩邊,而是上、下兩部分。科學家們採集到的其中一隻是紅胸庫蚊(Culex rubithoracis),牠的雌性部分在頭部,雄性區域則是在胸腹部。

實驗採集到的紅胸庫蚊。其頭部呈現雌性,具有羽狀觸角和短鬚;腹部則為雄性。圖/De La Vega et al., 2020

這樣的蚊子在繁殖上有著極大的阻礙,原因有兩個。第一個是牠們的翅膀。雌性蚊子的翅膀發出的聲音頻率,可以吸引雄蚊進行交配,然而雌雄嵌合體的蚊子,其翅膀卻可能是雄性的,因此無法和雄蚊互相吸引。第二個原因則和進食有關。雌蚊之所以會有吸血的行為,是因為牠們在產卵時需要血中的營養素,但對於雌雄嵌合體的蚊子來說,「頭部雌性、腹部雄性」的特徵,會導致吸進去的血沒有對應的消化酶可以被消化、吸收,進而導致死亡,牠們在開心吸血的同時可能連自己怎麼死的都不知道。

如果頭部剛好是雄性區域,也可能因爲刺吸式口器中的上下顎退化,導致根本不能刺穿動物皮膚來獲取血液;此外,雄性頭部也沒有感知宿主的受器,根本找不到可以吸血的對象。種種特徵和功能缺陷對於雌雄嵌合體的蚊子來說簡直厄運連連。

-----廣告,請繼續往下閱讀-----

雌雄嵌合體」的現象是如何產生的?

到底為什麼會產生雌雄嵌合體或雙性人這種生物現象呢?可能的原因有部分受精重複受精染色體分離異常性染色體異常缺失染色體連鎖互換異常等等,許多基因上的突變都很有可能造成雌雄嵌合體產生。

在鳥類的基因中,是由 Z 染色體和 W 染色體決定性別特徵,雄性的鳥類具有同型染色體(ZZ)雌性具有異型染色體(ZW),類似人類 XY 染色體的性別決定系統。

鳥類的 ZW 性別決定系統。雄鳥生殖細胞中的兩個 Z 染色體(黑色字母);雌鳥的生殖細胞中則有一個 Z 染色體和一個 W 染色體。這些染色體會被隨機分配到子代的身上(雄鳥、雌鳥各貢獻其中一個)。子代身上的染色體組合,就決定了子代的性別。圖/作者繪

正常狀態下,卵母細胞會分裂成分別具有 Z 染色體的卵子和 W 染色體的卵子。如果分裂的時候出現問題,原本各帶一條染色體的兩顆卵子,會變成一顆卵子同時攜帶 Z 和 W 兩種性染色體,而另一顆則完全沒有性染色體。這顆同時具有兩種性染色體的卵子可能被兩條精子同時受精,如此一來,生出的後代就會同時具有 ZZ 和 ZW 的細胞;也就是說,這個後代的身體內會同時具有雄性特徵和雌性特徵。

一般來說,一條精子進入卵子時會觸發卵膜「極化」,以快速阻斷其他精子進入卵內,因此要有兩條精子同時儘速卵內、形成雌雄嵌合體的條件機率極低,除了要在細胞分裂時出問題,還要意外地讓兩隻精子進入卵內才能達成。

-----廣告,請繼續往下閱讀-----

位於蘇格蘭愛丁堡的「羅斯林研究所」研究了一隻雌雄嵌合體的雞。這隻雞的左側是雄性,具有白色羽毛和大胸肌,腳上也具有骨刺(是雄性的最大特徵);而右側則是雌性,具深色羽毛,體型相對比雄性小,腳上也無骨刺。研究發現,脊索動物中「鳥類」的性發育機制,是來自於染色體而不是激素。

雌雄嵌合體的雞。圖/Clinton et al., 2012

在人類身上,性別是由 XY 性染色體決定,一般男性為 XY 異型性染色體,女性則是 XX 同型性染色體。性染色體的缺失或多餘都會造成雙性人的出現。在醫學上常見的雙性人分類有克林伊斯菲特症、透納氏症、腎上腺素增生症(CAH)、雄性激素不敏症(AIS)、尿道下裂症等等,這些人雖然身體構造和其他人略顯差異,但多數都是健康的狀態。

Y 染色體缺失所引發透納氏症。圖/wikimedia

目前各國已開始努力維護雙性人的人權及權益,而台灣對雙性人人權的重視也才剛起步。監察院在 2018年發布首次對雙性人人權進行調查的報告。同年 10 月,衛生福利部頒布〈未成年雙性人之醫療矯正手術共同性建議原則〉,其中最重要的是一項原則為「訂定雙性人性別手術的年齡規範」,成為亞洲先驅。

不管是人類還是自然界,都可能出現雌雄嵌合體的現象,生活在這樣性別多元的世界,大眾應以正面的態度認識雙性人。願大家都能保持多元開放的心態看待每一個人。

-----廣告,請繼續往下閱讀-----

參考文獻

所有討論 1
水鯨球_96
1 篇文章 ・ 2 位粉絲
東海大學生命科學系學生,腦袋可以裝下一整個生物圈。對於進那個實驗室猶豫不決,透過寫作廣泛吸收各種科普資訊。

0

3
0

文字

分享

0
3
0
采采蠅與寄生蟲,以及空氣中的油膩愛情
寒波_96
・2023/04/04 ・4059字 ・閱讀時間約 8 分鐘

-----廣告,請繼續往下閱讀-----

非洲的采采蠅(tsetse fly)以吸血維生,但是它們也時常是錐蟲的宿主,如果吸食人血,便有機會將錐蟲傳染給人類,引發昏睡病,在非洲導致不少問題。

昆蟲常以費洛蒙作為溝通媒介,采采蠅也不例外。2023 年發表的新研究,找到幾款采采蠅使用的費洛蒙,能促進情慾交流;而且又發現感染錐蟲會改變費洛蒙組成,求偶時還會降低身價。

在非洲體驗大自然,務必注意采采蠅!圖/TripSavvy / Nez Riaz 

昆蟲的氣味語言

舌蠅屬(Glossina)旗下有多個物種統稱「采采蠅」,這項研究著重的是 Glossina morsitans,為求簡便,本文之後直接稱之為「采采蠅」。要注意還有不一樣的其他款采采蠅,本文後面會登場一種。

費洛蒙是生物排放到體外,用於溝通的訊號分子,可謂是昆蟲的化學語言。一如人類的花言巧語或暴言各有巧妙,各種昆蟲使用不同費洛蒙,能達到不同效果。

-----廣告,請繼續往下閱讀-----

從前對采采蠅的費洛蒙也不是一無所知,以前知道有一種化學分子 15,19,23-trimethylheptatriacontane,也叫作 morsilure,被采采蠅當作費洛蒙。此分子是主鏈為 37 個碳鍊長,總共有 40 碳的脂肪酸衍生物,而且含量非常多,5 天大的女生超過 4 mg。

有些費洛蒙輕盈,可以揮發;也有的飄不起來,要直接接觸。40 碳的分子體重太胖,只能直接碰觸,可以說是一種接觸式的油膩情慾。

傳宗接代,迅速而持久

新研究的目標是探討:采采蠅是否存在揮發性費洛蒙,又如何作用。比較效果之前,要先了解采采蠅情慾交流的正常狀況。

把沒有性經驗的一男一女擺在一起,20 組幾乎都迅速合體,在 15 秒內開始啪啪啪(請自行腦補音效);而且平均 do 愛 58.5 分鐘之久,持久力一級棒。

-----廣告,請繼續往下閱讀-----
讓一女一男共處一室,紀錄它們的交配過程。所有沒有性經驗的采采蠅,都在幾分鐘內合體,延續超過 55 分鐘。圖/參考資料1

拿來對照的對象,是常被當作實驗動物的黃果蠅(Drosophila melanogaster)。黃果蠅和采采蠅雖然都叫蠅,但是親戚關係比人和猩猩之差還要遠,不是最合適的比較對象,不過是最方便取得的材料。

黃果蠅平均要等 22 分鐘才男女合體,維持 20 分鐘左右,明顯不如采采蠅對性的渴望。然而,采采蠅的實驗,假如一方換成交配過的女生,原本興致高昂的男生竟然會完全不想 do 愛,判若兩蠅。

總之,采采蠅情慾交流的正常狀態是,由男生向女生求偶,女生很快接受。過程中吸引男生辨識的「女蠅味」是哪些費洛蒙呢?

空氣中充滿愛情的味道

采采蠅的費洛蒙是脂肪酸衍伸物,和果蠅、螞蟻一樣,能用有機溶劑己烷(hexane)分離。

-----廣告,請繼續往下閱讀-----

可是一開始實驗,把接觸采采蠅 10 分鐘的己烷塗在棒棒上,結果不論是有或沒有性經驗的男女,4 類原味樣品對男生都毫無吸引力。

做過實驗都知道,沒反應不能寫論文 💔。所以又把搜集費洛蒙的時間延長到 24 小時,這下就對惹 ❤️!

觀察得知,沒有性經驗的處女原味,能吸引 60% 男生;有性經驗的女生則是 27%;男蠅味對男生依然缺乏吸引力。

把采采蠅身上萃取的氣味,塗在棒棒上,觀察是否會吸引采采蠅。圖/參考資料1

「女蠅味」具體是什麼呢?用氣相層析質譜儀(Gas Chromatography Mass Spectrometry,簡稱 GC-MS)分離可得到 6 種化學物質。

-----廣告,請繼續往下閱讀-----

3 種是脂肪酸:16 碳的棕櫚酸、棕櫚油酸,以及 18 碳的油酸。3 種是脂肪酸加上甲基酯(methyl ester)的衍生物:methyl palmitoleate(MPO)、methyl oleate(MO)、methyl palmitate(MP)。

就算是做這一行的,大部分也會覺得那一串名詞彷彿火星文,反正就是好幾種結構略有不同的油。但是以訊號分子來說,重點不是有多油膩,而是這些分子會啟動哪些神經反應,又影響哪些行為。

費洛蒙有時候化學結構只差一點點,意義完全不同,就像人類講話,「我日常生性活潑,想要多交朋友」和「我日常性生活潑,想要多交朋友」意思就很不一樣。

采采蠅身體外,存在感最明顯的 6 種分子,包括 3 種脂肪酸以及 3 種脂肪酸衍生物。圖/參考資料1

饞她身子的味道,油膩的情慾語言

女蠅味 6 種成分逐一測試,女生們完全不為所動。至於男生,3 款脂肪酸都缺乏吸引力,不過 3 款衍生物都有吸引力,尤其是塗抹 MPO 的棒棒,能吸引 87% 男生,效果最強(有人覺得奇怪,比前述實驗 60% 更高嗎?應該是因為濃度更高,效果更強)。

-----廣告,請繼續往下閱讀-----

費洛蒙有具體的收訊器,訊號應該是透過觸角(antenna)上的感覺受器傳達,因為如果把觸角切除,男生也不會起反應。

為了進一步認識費洛蒙的效果,研究者又將費洛蒙塗在近親物種 Glossina fuscipes 身上。正常時這次的主角 Glossina morsitans 采采蠅男生,對異種女生不會有性趣;但是近親女 MPO 上身後,有 60% 男生會撲上來。

可見單單 MPO 這種化學分子,便對男生有強烈的誘惑力。可是這只是單方面的喜歡,近親女依然對異種男生毫無感覺,會把他們馬上踢開。

感受情慾的神經元

不一樣的費洛蒙,會激發不同感覺神經元,就像把某個開關打開。采采蠅的觸角上有許多微小的感覺零件(sensilla),各自配備不同的受器神經元。被激發的 sensilla 上存在兩款神經元 A 與 B,對不同物質起反應。

-----廣告,請繼續往下閱讀-----

MPO 會刺激 B 神經元,而且分隔一段距離,透過氣流傳送便有效果。由此判斷 MPO 是揮發性作用的費洛蒙。

但是同樣的距離,MO 與 MP 都不起反應。不過縮短到距離 1mm 後,MP 就能刺激 B 神經元,MO 則能同時刺激 A 與 B。這兩款費洛蒙僅管結構類似 MPO,卻要近到快直接接觸才有作用。顯然這種事不能看結構鍵盤辦案,要實測才知道。

測試費洛蒙是否可以透過氣流飄送,只有 MPO 能在比較遠的距離起作用。圖/參考資料1

奇妙的是,這些費洛蒙對近親物種 Glossina fuscipes 的神經元,幾乎都不起作用。因此上述費洛蒙與受器的組合,僅限於 Glossina morsitans 這款采采蠅,和其他物種未必有共通語言,近親即使收到也理解不能。

寄生錐蟲降低身價,采采蠅也是受害者

不少采采蠅體內存在錐蟲,吸血時成為傳播媒介。檢驗發現,錐蟲對采采蠅的影響也非常明顯,會大幅影響求偶選擇。

-----廣告,請繼續往下閱讀-----

采采蠅的求偶是男生提出要求,女生決定是否接受。觀察得知,有或沒有感染的兩男,如果和處女共處一室,女生接受兩者的機率差異不多。但是有或沒有感染的兩女,給男生選擇,男生 100% 挑選沒有感染的女生。

這麼看來,有錐蟲寄生的女生,在男生眼中是比較差的對象,但是不知道男生如何分辨。費洛蒙方面,被寄生的采采蠅又會多出 21 種揮發性小分子,也許有所影響,可惜這些氣味的具體作用仍不清楚。

采采蠅感染錐蟲與否,費洛蒙們明顯有別。圖為氣相層析在不同時間點,陸續分離出的分子,感染錐蟲的采采蠅多出許多種分子。圖/參考資料1

上述結果都是實驗室中的測試。采采蠅在野外活動時,或許大部份候選蠅都是感染錐蟲的不理想對象。野生的采采蠅實際上如何擇偶,也許是另一番光景。不過應該能推測,它們也不喜歡錐蟲。

食慾與情慾的開關一同打開,吃飯,順便do愛?

野生的采采蠅,要自己尋找對象。最容易碰到異性的場合是采采蠅餐廳,也就是被吸血的動物周圍。實際觀察到,采采蠅常常在獵物附近順便情慾交流。

動物散發的氣味分子,就像餐廳飄出的香味,吸引采采蠅前來覓食。有趣的是,獵物排放的 4-methylphenol、1-octen-3-ol 兩種揮發性物質,和采采蠅的揮發性費洛蒙 MPO 使用同一套神經受器。

或許采采蠅去吃飯,開啟食慾的同時,也一同釋放情慾的開關。交配和吃飯是兩回事,如果能一次滿足,也很棒。

如果對氣味在各種生物的角色有興趣,可以閱讀科普書你聞到了嗎?:從人類、動植物到機器,看嗅覺與氣味如何影響生物的愛恨、生死與演化》。

延伸閱讀

參考資料

  1. Ebrahim, S. A., Dweck, H. K., Weiss, B. L., & Carlson, J. R. (2023). A volatile sex attractant of tsetse flies. Science, 379(6633), eade1877.
  2. Chemical notes of tsetse fly mating

本文亦刊載於作者部落格《盲眼的尼安德塔石匠》暨其 facebook 同名專頁

寒波_96
193 篇文章 ・ 1019 位粉絲
生命科學碩士、文學與電影愛好者、戳樂黨員,主要興趣為演化,希望把好東西介紹給大家。部落格《盲眼的尼安德塔石器匠》、同名粉絲團《盲眼的尼安德塔石器匠》。

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
55 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。