0

6
0

文字

分享

0
6
0

你能說出名字的科學家,有幾位是女性?

雷雅淇 / y編_96
・2021/04/09 ・1826字 ・閱讀時間約 3 分鐘 ・SR值 534 ・七年級

-----廣告,請繼續往下閱讀-----

請你舉幾位科學家的名字,應該不是太難吧?那如果限定在「女性科學家」呢?又或者,增加一下難度,不准提到瑪麗.居禮(Marie Curie)呢?

頓時覺得啞口無言?你其實不是少數。

除了瑪麗.居禮,再也講不出其他女性科學家的名字?圖/wikimedia

早就有研究者做過相關統計了:在一項針對公眾對女性科學家認知的調查中,研究者請受試者提出十位女性科學家的名字。其中,只有百分之一的人完成了任務,近三分之一的人只說得出瑪麗居禮。類似的現象也發生在另一項調查研究,當研究者希望受試者提及取得重大突破的科學家時,有 75% 的男性和 68% 的女性給出了男性科學家的名字,而瑪麗居禮則是絕大多數的人名單中唯一的女性。

同樣的題目,你的完成率又是多少呢?

歸根結底,這樣的現象當然與女性科學家數量較少脫不了關係。但這是因為女性「天生」不適合唸科學嗎?其實,已經有許許多多的研究證明,在國高中時期,數學以及自然成績優異的學生,男女性別比例是沒有顯著差異的,但在自我評估、以及將 STEM(Science, Technology, Engineering, and Mathematics,即科學、科技、工程、數學領域的簡稱)納入職涯考量的意願,都是女性比較低。

-----廣告,請繼續往下閱讀-----
儘管在國高中,數理成績優異的學生無男女性別比例之差異,但考慮投身 STEM 領域的女性比例卻比較低。圖/Pexels

根據聯合國教科文組織的統計,雖然在博士畢業生女性佔比為 43%,但卻僅有 28% 的研究人員是女性。而女性研究人員比例低,也直接影響女性往 STEM 發展的意願。畢竟在學習與工作環境缺乏典範以及同儕,都會影響到人們在求學及就職時的選擇,更別說當社會、家庭與學校教育中,隱隱存在的「性別刻板印象」了。

要打破這面「天花板」並不容易,但起碼,我們可以從認識那些用知識推動世界前行的女姓科學家開始。由親子天下出版的女力科學家系列套書第一彈,就帶來了好幾位絕對值得你好好認識的科學家。

奠定無線網路與藍牙傳輸基礎的斜槓發明家海蒂.拉瑪開發出第一個複雜電腦程式語言和抓到第一個 bug 的始祖程式工程師葛麗絲.霍普,以及用實驗證明「宇稱不守恆」的超強物理學家吳健雄。他們的故事,只要生而為人,若不曾聽過,做科學傳播的我們真的會感到非常抱歉,多麼慶幸親子天下挺身而出,讓我們能從更多元的面向來認識這些科學家。

身兼發明家與演員等多種身份的海蒂.拉瑪(Hedy Lamarr)。圖/wikimedia
在核物理學領域有著無可取代貢獻的吳健雄。圖/wikimedia
對電腦程式語言開發功不可沒的葛麗絲.霍普(Grace Murray Hopper)。圖/flickr

除了他們之外,還有好多好多的女性科學家用他們自身,推動著世界前進。希望親子天下的女力科學家系列可以長長久久,直到我們再也不需要特別去述說「女性科學家」故事的那天。也恭喜你,起碼從今天開始,我們所認識的女性科學家,不只有瑪麗.居禮了。

參考資料:

-----廣告,請繼續往下閱讀-----
文章難易度
雷雅淇 / y編_96
38 篇文章 ・ 1223 位粉絲
之前是總編輯,代號是(y.),是會在每年4、7、10、1月密切追新番的那種宅。中興生技學程畢業,台師大科教所沒畢業,對科學花心的這個也喜歡那個也愛,彷徨地不知道該追誰,索性決定要不見笑的通吃,因此正在科學傳播裡打怪練功衝裝備。

0

8
2

文字

分享

0
8
2
快!還要更快!讓國家級地震警報更好用的「都會區強震預警精進計畫」
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/21 ・2584字 ・閱讀時間約 5 分鐘

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

從地震儀感應到地震的震動,到我們的手機響起國家級警報,大約需要多少時間?

臺灣從 1991 年開始大量增建地震測站;1999 年臺灣爆發了 921 大地震,當時的地震速報系統約在震後 102 秒完成地震定位;2014 年正式對公眾推播強震即時警報;到了 2020 年 4 月,隨著技術不斷革新,當時交通部中央氣象局地震測報中心(以下簡稱為地震中心)僅需 10 秒,就可以發出地震預警訊息!

然而,地震中心並未因此而自滿,而是持續擴建地震觀測網,開發新技術。近年來,地震中心執行前瞻基礎建設 2.0「都會區強震預警精進計畫」,預計讓臺灣的地震預警系統邁入下一個新紀元!

-----廣告,請繼續往下閱讀-----

連上網路吧!用建設與技術,換取獲得地震資料的時間

「都會區強震預警精進計畫」起源於「民生公共物聯網數據應用及產業開展計畫」,該計畫致力於跨部會、跨單位合作,由 11 個執行單位共同策畫,致力於優化我國環境與防災治理,並建置資料開放平台。

看到這裡,或許你還沒反應過來地震預警系統跟物聯網(Internet of Things,IoT)有什麼關係,嘿嘿,那可大有關係啦!

當我們將各種實體物品透過網路連結起來,建立彼此與裝置的通訊後,成為了所謂的物聯網。在我國的地震預警系統中,即是透過將地震儀的資料即時傳輸到聯網系統,並進行運算,實現了對地震活動的即時監測和預警。

地震中心在臺灣架設了 700 多個強震監測站,但能夠和地震中心即時連線的,只有其中 500 個,藉由這項計畫,地震中心將致力增加可連線的強震監測站數量,並優化原有強震監測站的聯網品質。

-----廣告,請繼續往下閱讀-----

在地震中心的評估中,可以連線的強震監測站大約可在 113 年時,從原有的 500 個增加至 600 個,並且更新現有監測站的軟體與硬體設備,藉此提升地震預警系統的效能。

由此可知,倘若地震儀沒有了聯網的功能,我們也形同完全失去了地震預警系統的一切。

把地震儀放到井下後,有什麼好處?

除了加強地震儀的聯網功能外,把地震儀「放到地下」,也是提升地震預警系統效能的關鍵做法。

為什麼要把地震儀放到地底下?用日常生活來比喻的話,就像是買屋子時,要選擇鬧中取靜的社區,才不會讓吵雜的環境影響自己在房間聆聽優美的音樂;看星星時,要選擇光害比較不嚴重的山區,才能看清楚一閃又一閃的美麗星空。

-----廣告,請繼續往下閱讀-----

地表有太多、太多的環境雜訊了,因此當地震儀被安裝在地表時,想要從混亂的「噪音」之中找出關鍵的地震波,就像是在搖滾演唱會裡聽電話一樣困難,無論是電腦或研究人員,都需要花費比較多的時間,才能判讀來自地震的波形。

這些環境雜訊都是從哪裡來的?基本上,只要是你想得到的人為震動,對地震儀來說,都有可能是「噪音」!

當地震儀靠近工地或馬路時,一輛輛大卡車框啷、框啷地經過測站,是噪音;大稻埕夏日節放起絢麗的煙火,隨著煙花在天空上一個一個的炸開,也是噪音;台北捷運行經軌道的摩擦與震動,那也是噪音;有好奇的路人經過測站,推了推踢了下測站時,那也是不可忽視的噪音。

因此,井下地震儀(Borehole seismometer)的主要目的,就是盡量讓地震儀「遠離塵囂」,記錄到更清楚、雜訊更少的地震波!​無論是微震、強震,還是來自遠方的地震,井下地震儀都能提供遠比地表地震儀更高品質的訊號。

-----廣告,請繼續往下閱讀-----

地震中心於 2008 年展開建置井下地震儀觀測站的行動,根據不同測站底下的地質條件,​將井下地震儀放置在深達 30~500 公尺的乾井深處。​除了地震儀外,站房內也會備有資料收錄器、網路傳輸設備、不斷電設備與電池,讓測站可以儲存、傳送資料。

既然井下地震儀這麼強大,為什麼無法大規模建造測站呢?簡單來說,這一切可以歸咎於技術和成本問題。

安裝井下地震儀需要鑽井,然而鑽井的深度、難度均會提高時間、技術與金錢成本,因此,即使井下地震儀的訊號再好,若非有國家建設計畫的支援,也難以大量建置。

人口聚集,震災好嚴重?建立「客製化」的地震預警系統!

臺灣人口主要聚集於西半部,然而此區的震源深度較淺,再加上密集的人口與建築,容易造成相當重大的災害。

-----廣告,請繼續往下閱讀-----

許多都會區的建築老舊且密集,當屋齡超過 50 歲時,它很有可能是在沒有耐震規範的背景下建造而成的的,若是超過 25 年左右的房屋,也有可能不符合最新的耐震規範,並未具備現今標準下足夠的耐震能力。 

延伸閱讀:

在地震界有句名言「地震不會殺人,但建築物會」,因此,若建築物的結構不符合地震規範,地震發生時,在同一面積下越密集的老屋,有可能造成越多的傷亡。

因此,對於發生在都會區的直下型地震,預警時間的要求更高,需求也更迫切。

-----廣告,請繼續往下閱讀-----

地震中心著手於人口密集之都會區開發「客製化」的強震預警系統,目標針對都會區直下型淺層地震,可以在「震後 7 秒內」發布地震警報,將地震預警盲區縮小為 25 公里。

111 年起,地震中心已先後完成大臺北地區、桃園市客製化作業模組,並開始上線測試,當前正致力於臺南市的模組,未來的目標為高雄市與臺中市。

永不停歇的防災宣導行動、地震預警技術研發

地震預警系統僅能在地震來臨時警示民眾避難,無法主動保護民眾的生命安全,若人民沒有搭配正確的防震防災觀念,即使地震警報再快,也無法達到有效的防災效果。

因此除了不斷革新地震預警系統的技術,地震中心也積極投入於地震的宣導活動和教育管道,經營 Facebook 粉絲專頁「報地震 – 中央氣象署」、跨部會舉辦《地震島大冒險》特展、《震守家園 — 民生公共物聯網主題展》,讓民眾了解正確的避難行為與應變作為,充分發揮地震警報的效果。

-----廣告,請繼續往下閱讀-----

此外,雖然地震中心預計於 114 年將都會區的預警費時縮減為 7 秒,研發新技術的腳步不會停止;未來,他們將應用 AI 技術,持續強化地震預警系統的效能,降低地震對臺灣人民的威脅程度,保障你我生命財產安全。

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
196 篇文章 ・ 300 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

8
3

文字

分享

1
8
3
揭開雙性的面紗:從雌雄嵌合體看待多元性別的世界
水鯨球_96
・2023/05/31 ・3092字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

你知道嗎?世界上的另一個族群
在這個世界上存在一種族群,叫雙性人,俗稱間性人,或陰陽人。他們的性器官或是性染色體異常,所造成性徵上不符合典型的男生或女生。根據聯合國統計,雙性人約佔全球人口 0.05% 到 1.7%。而我國監察院依照上限估算,台灣人約有 40 萬名雙性人。在許多生物中,也有因突變所形成的雙性特徵。讓我們透過自然界的案例,從其他生物面對雙性所造成的影響,檢視社會上面對雙性人的問題。

大自然中的「雌雄嵌合體」

一研究團隊在北美進行蝴蝶物種調查中,採集到很特別的一隻蝴蝶,經鑑定後為卡納藍蝴蝶(Plebejus samuelis。奇特的地方在於,這是一隻帶有雄性特徵和雌性特徵的蝴蝶,一側為藍色,但另一側為棕色邊緣還帶點橘色斑紋。

一側雌性,一側雄性的卡納藍蝴蝶。圖/Joshua P Jahner, 2015

這種生物現象叫做「雌雄嵌合體」,一半雄性、一半雌性。雌雄嵌合體不同於「雌雄同體」,雌雄同體指的是卵巢和精巢共存於同一個體上,身上所有體細胞都具同一基因型,但雌雄嵌合體是在同一個體上具有不同的基因型,而且不同基因型分布在不同的區域。

北美紅雀(也就是「憤怒鳥」的原型),也同樣存在「雌雄嵌合體」的現象。北美紅雀的雄鳥毛色鮮紅,雌鳥毛色呈淡褐色。雌雄嵌合體的北美紅雀則是一面紅色、一面白色。

-----廣告,請繼續往下閱讀-----
雌雄嵌合體的北美紅雀。

對於雌雄嵌合體的北美紅雀來說,雙重的性別特徵大大影響了牠們的生活。牠們求偶時唱著雄性的求偶歌,但身體卻跳著雌性舞蹈,而奇特的體色也讓牠們無法融入族群。

在求偶上遇到困難的除了北美紅雀,還有雌雄嵌合體的蚊子。科學家在加州聖華金谷(san joaquin valley)採集到多種雌雄嵌合體的蚊子,比較特別的是,牠們雌雄的區域分佈不是左、右兩邊,而是上、下兩部分。科學家們採集到的其中一隻是紅胸庫蚊(Culex rubithoracis),牠的雌性部分在頭部,雄性區域則是在胸腹部。

實驗採集到的紅胸庫蚊。其頭部呈現雌性,具有羽狀觸角和短鬚;腹部則為雄性。圖/De La Vega et al., 2020

這樣的蚊子在繁殖上有著極大的阻礙,原因有兩個。第一個是牠們的翅膀。雌性蚊子的翅膀發出的聲音頻率,可以吸引雄蚊進行交配,然而雌雄嵌合體的蚊子,其翅膀卻可能是雄性的,因此無法和雄蚊互相吸引。第二個原因則和進食有關。雌蚊之所以會有吸血的行為,是因為牠們在產卵時需要血中的營養素,但對於雌雄嵌合體的蚊子來說,「頭部雌性、腹部雄性」的特徵,會導致吸進去的血沒有對應的消化酶可以被消化、吸收,進而導致死亡,牠們在開心吸血的同時可能連自己怎麼死的都不知道。

如果頭部剛好是雄性區域,也可能因爲刺吸式口器中的上下顎退化,導致根本不能刺穿動物皮膚來獲取血液;此外,雄性頭部也沒有感知宿主的受器,根本找不到可以吸血的對象。種種特徵和功能缺陷對於雌雄嵌合體的蚊子來說簡直厄運連連。

-----廣告,請繼續往下閱讀-----

雌雄嵌合體」的現象是如何產生的?

到底為什麼會產生雌雄嵌合體或雙性人這種生物現象呢?可能的原因有部分受精重複受精染色體分離異常性染色體異常缺失染色體連鎖互換異常等等,許多基因上的突變都很有可能造成雌雄嵌合體產生。

在鳥類的基因中,是由 Z 染色體和 W 染色體決定性別特徵,雄性的鳥類具有同型染色體(ZZ)雌性具有異型染色體(ZW),類似人類 XY 染色體的性別決定系統。

鳥類的 ZW 性別決定系統。雄鳥生殖細胞中的兩個 Z 染色體(黑色字母);雌鳥的生殖細胞中則有一個 Z 染色體和一個 W 染色體。這些染色體會被隨機分配到子代的身上(雄鳥、雌鳥各貢獻其中一個)。子代身上的染色體組合,就決定了子代的性別。圖/作者繪

正常狀態下,卵母細胞會分裂成分別具有 Z 染色體的卵子和 W 染色體的卵子。如果分裂的時候出現問題,原本各帶一條染色體的兩顆卵子,會變成一顆卵子同時攜帶 Z 和 W 兩種性染色體,而另一顆則完全沒有性染色體。這顆同時具有兩種性染色體的卵子可能被兩條精子同時受精,如此一來,生出的後代就會同時具有 ZZ 和 ZW 的細胞;也就是說,這個後代的身體內會同時具有雄性特徵和雌性特徵。

一般來說,一條精子進入卵子時會觸發卵膜「極化」,以快速阻斷其他精子進入卵內,因此要有兩條精子同時儘速卵內、形成雌雄嵌合體的條件機率極低,除了要在細胞分裂時出問題,還要意外地讓兩隻精子進入卵內才能達成。

-----廣告,請繼續往下閱讀-----

位於蘇格蘭愛丁堡的「羅斯林研究所」研究了一隻雌雄嵌合體的雞。這隻雞的左側是雄性,具有白色羽毛和大胸肌,腳上也具有骨刺(是雄性的最大特徵);而右側則是雌性,具深色羽毛,體型相對比雄性小,腳上也無骨刺。研究發現,脊索動物中「鳥類」的性發育機制,是來自於染色體而不是激素。

雌雄嵌合體的雞。圖/Clinton et al., 2012

在人類身上,性別是由 XY 性染色體決定,一般男性為 XY 異型性染色體,女性則是 XX 同型性染色體。性染色體的缺失或多餘都會造成雙性人的出現。在醫學上常見的雙性人分類有克林伊斯菲特症、透納氏症、腎上腺素增生症(CAH)、雄性激素不敏症(AIS)、尿道下裂症等等,這些人雖然身體構造和其他人略顯差異,但多數都是健康的狀態。

Y 染色體缺失所引發透納氏症。圖/wikimedia

目前各國已開始努力維護雙性人的人權及權益,而台灣對雙性人人權的重視也才剛起步。監察院在 2018年發布首次對雙性人人權進行調查的報告。同年 10 月,衛生福利部頒布〈未成年雙性人之醫療矯正手術共同性建議原則〉,其中最重要的是一項原則為「訂定雙性人性別手術的年齡規範」,成為亞洲先驅。

不管是人類還是自然界,都可能出現雌雄嵌合體的現象,生活在這樣性別多元的世界,大眾應以正面的態度認識雙性人。願大家都能保持多元開放的心態看待每一個人。

-----廣告,請繼續往下閱讀-----

參考文獻

所有討論 1
水鯨球_96
1 篇文章 ・ 2 位粉絲
東海大學生命科學系學生,腦袋可以裝下一整個生物圈。對於進那個實驗室猶豫不決,透過寫作廣泛吸收各種科普資訊。

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。