0

0
0

文字

分享

0
0
0

男女玩家大PK!男生的電動真的打得比女生好?

Peggy Sha
・2016/07/16 ・1931字 ・閱讀時間約 4 分鐘 ・SR值 533 ・七年級

-----廣告,請繼續往下閱讀-----

雖然女性玩家已逾半,電玩界對於女性仍懷有敵意。舉例來說,2014年的「玩家門」事件(GamerGate controversy)便是對於傑出女性電玩玩家、記者和電玩設計師的騷擾事件,顯示出社群中潛藏的厭女情節與性別歧視。其中,某些挺身對抗性別歧視的人甚至遭到了強暴與死亡的威脅。

玩家門事件的過程跌宕起伏,好萊塢當紅女星史嘉蕾‧喬韓森甚至爭取演出事件改編電影。事情起因於一位女性電玩開發者的性別歧視指控,而後卻演變成一發不可收拾的性醜聞風暴。

不過,除卻上述這種特殊事件,其實電玩界始終存在著刻板印象,認為女性玩家的能力較差,註冊帳號只為引起注意而非真正對電玩有興趣;若女玩家的成績優秀,則會被當作靠作弊成功的「駭客」,因為「女生不可能那麼厲害」!

但是,在電玩領域中,男女的差異真的如此懸殊嗎?難道女生沒有了騎士團就只能一輩子銅牌?

-----廣告,請繼續往下閱讀-----
電玩能力也分男女?   source:Pixabay

來單挑啊:升等速度見真章

為了檢驗刻板印象的正確性,在近期的研究中,研究者嘗試確認兩性在線上電玩的升等速度是否存在差異,也希望從中了解到性別為什麼會造成差異。在研究假設中,如果男性玩家較為優越,則應能在相同電玩時間內達到較高等級;相反地,如果差異不存在,便可就此終結電玩界長期的刻板印象。

研究採計美國電玩《無盡的任務2》(EverQuest II)與中國電玩《劍網3》(Chevaliers’ Romance III)中超過一萬筆的兩性玩家數據,並通過帳號註冊訊息得知確切的性別資訊。當玩家在電玩中完成任務或殺怪時,便會獲得經驗值,而當經驗值達到某一標準,玩家便會升等並解鎖新的能力、技能和內容;在大部分電玩中,等級便代表玩家的進度。

一般而言,花較多時間玩電玩的玩家等級可能較高,因此在研究中,關注的是升等「速度」而非等級高低。
同時,此研究:

  1. 排除了封頂(等級最高)的玩家,因為他們沒有進步空間
  2. 僅做同等級間的比較,因為「等級越高,升等越慢」(例如:60等的玩家升等所需的時間精力比30等多)

換言之,無論你是否整天泡在網咖或是下班(課)才能上線都沒關係,就算是新手也不用擔心數據會被老鳥慘電;只要你不是所向披靡的封頂怪物,研究都會用公平的方式去比較「同等級玩家」的升等數據。在這個研究裡,只讓升等速度說話。

-----廣告,請繼續往下閱讀-----

阿璃李星一家親:英雄不論男與女

相對於刻板印象,研究結果顯示玩家性別本身並不影響電玩表現。事實上,女性玩家之所以被認為較差是因為其他因素,如:

  1. 花費在電玩上的時間較少
  2. 偏好選擇輔助性角色(如:祭司、補師,著名的甜心琴人 索娜便是其一)

    Sona_7
    甜心琴人 索娜  source:《英雄聯盟 LoL》官方網站

當研究在分析時將這些上述因素的數據列為控制變因,則性別差異便不復存在。同時,研究也發現到:在電玩裡,不同的性別有相異喜好:男性玩家注重電玩中的成就───快速升等、贏得頭銜、決鬥挑戰;而女性玩家則在乎社交互動,包括幫助其他玩家或建立長久關係。

反歧視尚未成功,同志仍須努力!

不過,錯誤的刻板印象有什麼關係?何必如此認真看待電玩界中的性別歧視?錯!關係可大了!因為電玩可說是通往STEM(科學、科技、工程、數學)領域的重要關卡,電玩界的歧視可能讓女性容易氣餒或者不願開始嘗試,間接影響她們進入領域的可能性。

不過,值得慶幸的是,這樣的問題逐漸獲得重視,也有人嘗試改善現況。除了用科學的方法破解迷思之外,現今已有PMS Clan等支持女性的電玩社群以及惡意監督系統Tribunal等設計,或許可以逐漸改善女性的電玩經驗。

children-593313_960_720
一起享受遊戲吧!  source:Pixabay

在電玩世界之外,現實生活裡的反歧視之戰正悄悄展開,或許在不久的將來,電玩玩家再也不用在意性別,人人都能憑實力說話,可以盡情享受在遊戲帶來的快樂之中。

-----廣告,請繼續往下閱讀-----

原文出處:

參考資料:

文章難易度
Peggy Sha
69 篇文章 ・ 390 位粉絲
曾經是泛科的 S 編,來自可愛的教育系,是一位正努力成為科青的女子,永遠都想要知道更多新的事情,好奇心怎樣都不嫌多。

0

0
0

文字

分享

0
0
0
Intel® Core™ Ultra AI 處理器:下一代晶片的革命性進展
鳥苷三磷酸 (PanSci Promo)_96
・2024/05/21 ・2364字 ・閱讀時間約 4 分鐘

本文由 Intel 委託,泛科學企劃執行。 

在當今快節奏的數位時代,對於處理器性能的需求已經不再僅僅停留在日常應用上。從遊戲到學術,從設計到內容創作,各行各業都需要更快速、更高效的運算能力,而人工智慧(AI)的蓬勃發展更是推動了這一需求的急劇增長。在這樣的背景下,Intel 推出了一款極具潛力的處理器—— Intel® Core™ Ultra,該處理器不僅滿足了對於高性能的追求,更為使用者提供了運行 AI 模型的全新體驗。

先進製程:效能飛躍提升

現在的晶片已不是單純的 CPU 或是 GPU,而是混合在一起。為了延續摩爾定律,也就是讓相同面積的晶片每過 18 個月,效能就提升一倍的目標,整個半導體產業正朝兩個不同方向努力。

其中之一是追求更先進的技術,發展出更小奈米的製程節點,做出體積更小的電晶體。常見的方法包含:引進極紫外光 ( EUV ) 曝光機,來刻出更小的電晶體。又或是從材料結構下手,發展不同構造的電晶體,例如鰭式場效電晶體 ( FinFET )、環繞式閘極 ( GAAFET ) 電晶體及互補式場效電晶體 ( CFET ),讓電晶體可以更小、更快。這種持續挑戰物理極限的方式稱為深度摩爾定律——More Moore。

-----廣告,請繼續往下閱讀-----

另一種則是將含有數億個電晶體的密集晶片重新排列。就像人口密集的都會區都逐漸轉向「垂直城市」的發展模式。對晶片來說,雖然每個電晶體的大小還是一樣大,但是重新排列以後,不僅單位面積上可以堆疊更多的半導體電路,還能縮短這些區塊間資訊傳遞的時間,提升晶片的效能。這種透過晶片設計提高效能的方法,則稱為超越摩爾定律——More than Moore。

而 Intel® Core™ Ultra 處理器便是具備兩者優點的結晶。

圖/PanSci

Tile 架構:釋放多核心潛能

在超越摩爾定律方面,Intel® Core™ Ultra 處理器以其獨特的 Tile 架構而聞名,將 CPU、GPU、以及 AI 加速器(NPU)等不同單元分開,使得這些單元可以根據需求靈活啟用、停用,從而提高了能源效率。這一設計使得處理器可以更好地應對多任務處理,從日常應用到專業任務,都能夠以更高效的方式運行。

CPU Tile 採用了 Intel 最新的 4 奈米製程和 EUV 曝光技術,將鰭式電晶體 FinFET 中的像是魚鰭般阻擋漏電流的鰭片構造減少至三片,降低延遲與功耗,使效能提升了 20%,讓使用者可以更加流暢地執行各種應用程序,提高工作效率。

-----廣告,請繼續往下閱讀-----
鰭式電晶體 FinFET。圖/Intel

Foveros 3D 封裝技術:高效數據傳輸

2017 年,Intel 開發出了新的封裝技術 EMIB 嵌入式多晶片互聯橋,這種封裝技術在各個 Tile 的裸晶之間,搭建了一座「矽橋 ( Silicon Bridge ) 」,達成晶片的橫向連接。

圖/Intel

而 Foveros 3D 封裝技術是基於 EMIB 更進一步改良的封裝技術,它能將處理器、記憶體、IO 單元上下堆疊,垂直方向利用導線串聯,橫向則使用 EMIB 連接,提供高頻寬低延遲的數據傳輸。這種創新的封裝技術不僅使得處理器的整體尺寸更小,更提高了散熱效能,使得處理器可以長期高效運行。

運行 AI 模型的專用筆電——MSI Stealth 16 AI Studio

除了傳統的 CPU 和 GPU 之外,Intel® Core™ Ultra 處理器還整合了多種專用單元,專門用於在本機端高效運行 AI 模型。這使得使用者可以在不連接雲端的情況下,依然可以快速準確地運行各種複雜的 AI 算法,保護了數據隱私,同時節省了連接雲端算力的成本。

MSI 最新推出的筆電 Stealth 16 AI Studio ,搭載了最新的 Intel Core™ Ultra 9 處理器,是一款極具魅力的產品。不僅適合遊戲娛樂,其外觀設計結合了落質感外型與卓越效能,使得使用者在使用時能感受到高品質的工藝。鎂鋁合金質感的沉穩機身設計,僅重 1.99kg,厚度僅有 19.95mm,輕薄便攜,適合需要每天通勤的上班族,與在咖啡廳尋找靈感的創作者。

-----廣告,請繼續往下閱讀-----

除了外觀設計之外, Stealth 16 AI Studio 也擁有出色的散熱性能。搭載了 Cooler Boost 5 強效散熱技術,能夠有效排除廢熱,保持長時間穩定高效能表現。良好的散熱表現不僅能夠確保處理器的效能得到充分發揮,還能幫助使用者在長時間使用下的保持舒適性和穩定性。

Stealth 16 AI Studio 的 Intel Core™ Ultra 處理器,其性能更是一大亮點。除了傳統的 CPU 和 GPU 之外,Intel Core™ Ultra 處理器還整合了多種專用單元,專門針對在本機端高效運行 AI 模型的需求。內建專為加速AI應用而設計的 NPU,更提供強大的效能表現,有助於提升效率並保持長時間的續航力。讓使用者可以在不連接雲端的情況下,依然可以快速準確地運行各種複雜的 AI 算法,保護了數據隱私,同時也節省了連接雲端算力的成本。

軟體方面,Intel 與眾多軟體開發商合作,針對 Intel 架構做了特別最佳化。與 Adobe 等軟體的合作使得使用者在處理影像、圖像等多媒體內容時,能夠以更高效的方式運行 AI 算法,大幅提高創作效率。獨家微星AI 智慧引擎能針對使用情境並自動調整硬體設定,以實現最佳效能表現。再加上獨家 AI Artist,更進一步提升使用者體驗,直接輕鬆生成豐富圖像,實現了更便捷的內容創作。

此外 Intel 也與眾多軟體開發商合作,針對 Intel 架構做了特別最佳化,讓 Intel® Core™ Ultra處理器將AI加速能力充分發揮。例如,與 Adobe 等軟體使得使用者可以在處理影像、圖像等多媒體內容時,能夠以更高效的方式運行 AI 算法,大幅提高創作效率。為各行專業人士提供了更加多元、便捷的工具,成為工作中的一大助力。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
199 篇文章 ・ 305 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

9
4

文字

分享

1
9
4
揭開雙性的面紗:從雌雄嵌合體看待多元性別的世界
水鯨球_96
・2023/05/31 ・3092字 ・閱讀時間約 6 分鐘

你知道嗎?世界上的另一個族群
在這個世界上存在一種族群,叫雙性人,俗稱間性人,或陰陽人。他們的性器官或是性染色體異常,所造成性徵上不符合典型的男生或女生。根據聯合國統計,雙性人約佔全球人口 0.05% 到 1.7%。而我國監察院依照上限估算,台灣人約有 40 萬名雙性人。在許多生物中,也有因突變所形成的雙性特徵。讓我們透過自然界的案例,從其他生物面對雙性所造成的影響,檢視社會上面對雙性人的問題。

大自然中的「雌雄嵌合體」

一研究團隊在北美進行蝴蝶物種調查中,採集到很特別的一隻蝴蝶,經鑑定後為卡納藍蝴蝶(Plebejus samuelis。奇特的地方在於,這是一隻帶有雄性特徵和雌性特徵的蝴蝶,一側為藍色,但另一側為棕色邊緣還帶點橘色斑紋。

一側雌性,一側雄性的卡納藍蝴蝶。圖/Joshua P Jahner, 2015

這種生物現象叫做「雌雄嵌合體」,一半雄性、一半雌性。雌雄嵌合體不同於「雌雄同體」,雌雄同體指的是卵巢和精巢共存於同一個體上,身上所有體細胞都具同一基因型,但雌雄嵌合體是在同一個體上具有不同的基因型,而且不同基因型分布在不同的區域。

北美紅雀(也就是「憤怒鳥」的原型),也同樣存在「雌雄嵌合體」的現象。北美紅雀的雄鳥毛色鮮紅,雌鳥毛色呈淡褐色。雌雄嵌合體的北美紅雀則是一面紅色、一面白色。

-----廣告,請繼續往下閱讀-----
雌雄嵌合體的北美紅雀。

對於雌雄嵌合體的北美紅雀來說,雙重的性別特徵大大影響了牠們的生活。牠們求偶時唱著雄性的求偶歌,但身體卻跳著雌性舞蹈,而奇特的體色也讓牠們無法融入族群。

在求偶上遇到困難的除了北美紅雀,還有雌雄嵌合體的蚊子。科學家在加州聖華金谷(san joaquin valley)採集到多種雌雄嵌合體的蚊子,比較特別的是,牠們雌雄的區域分佈不是左、右兩邊,而是上、下兩部分。科學家們採集到的其中一隻是紅胸庫蚊(Culex rubithoracis),牠的雌性部分在頭部,雄性區域則是在胸腹部。

實驗採集到的紅胸庫蚊。其頭部呈現雌性,具有羽狀觸角和短鬚;腹部則為雄性。圖/De La Vega et al., 2020

這樣的蚊子在繁殖上有著極大的阻礙,原因有兩個。第一個是牠們的翅膀。雌性蚊子的翅膀發出的聲音頻率,可以吸引雄蚊進行交配,然而雌雄嵌合體的蚊子,其翅膀卻可能是雄性的,因此無法和雄蚊互相吸引。第二個原因則和進食有關。雌蚊之所以會有吸血的行為,是因為牠們在產卵時需要血中的營養素,但對於雌雄嵌合體的蚊子來說,「頭部雌性、腹部雄性」的特徵,會導致吸進去的血沒有對應的消化酶可以被消化、吸收,進而導致死亡,牠們在開心吸血的同時可能連自己怎麼死的都不知道。

如果頭部剛好是雄性區域,也可能因爲刺吸式口器中的上下顎退化,導致根本不能刺穿動物皮膚來獲取血液;此外,雄性頭部也沒有感知宿主的受器,根本找不到可以吸血的對象。種種特徵和功能缺陷對於雌雄嵌合體的蚊子來說簡直厄運連連。

-----廣告,請繼續往下閱讀-----

雌雄嵌合體」的現象是如何產生的?

到底為什麼會產生雌雄嵌合體或雙性人這種生物現象呢?可能的原因有部分受精重複受精染色體分離異常性染色體異常缺失染色體連鎖互換異常等等,許多基因上的突變都很有可能造成雌雄嵌合體產生。

在鳥類的基因中,是由 Z 染色體和 W 染色體決定性別特徵,雄性的鳥類具有同型染色體(ZZ)雌性具有異型染色體(ZW),類似人類 XY 染色體的性別決定系統。

鳥類的 ZW 性別決定系統。雄鳥生殖細胞中的兩個 Z 染色體(黑色字母);雌鳥的生殖細胞中則有一個 Z 染色體和一個 W 染色體。這些染色體會被隨機分配到子代的身上(雄鳥、雌鳥各貢獻其中一個)。子代身上的染色體組合,就決定了子代的性別。圖/作者繪

正常狀態下,卵母細胞會分裂成分別具有 Z 染色體的卵子和 W 染色體的卵子。如果分裂的時候出現問題,原本各帶一條染色體的兩顆卵子,會變成一顆卵子同時攜帶 Z 和 W 兩種性染色體,而另一顆則完全沒有性染色體。這顆同時具有兩種性染色體的卵子可能被兩條精子同時受精,如此一來,生出的後代就會同時具有 ZZ 和 ZW 的細胞;也就是說,這個後代的身體內會同時具有雄性特徵和雌性特徵。

一般來說,一條精子進入卵子時會觸發卵膜「極化」,以快速阻斷其他精子進入卵內,因此要有兩條精子同時儘速卵內、形成雌雄嵌合體的條件機率極低,除了要在細胞分裂時出問題,還要意外地讓兩隻精子進入卵內才能達成。

-----廣告,請繼續往下閱讀-----

位於蘇格蘭愛丁堡的「羅斯林研究所」研究了一隻雌雄嵌合體的雞。這隻雞的左側是雄性,具有白色羽毛和大胸肌,腳上也具有骨刺(是雄性的最大特徵);而右側則是雌性,具深色羽毛,體型相對比雄性小,腳上也無骨刺。研究發現,脊索動物中「鳥類」的性發育機制,是來自於染色體而不是激素。

雌雄嵌合體的雞。圖/Clinton et al., 2012

在人類身上,性別是由 XY 性染色體決定,一般男性為 XY 異型性染色體,女性則是 XX 同型性染色體。性染色體的缺失或多餘都會造成雙性人的出現。在醫學上常見的雙性人分類有克林伊斯菲特症、透納氏症、腎上腺素增生症(CAH)、雄性激素不敏症(AIS)、尿道下裂症等等,這些人雖然身體構造和其他人略顯差異,但多數都是健康的狀態。

Y 染色體缺失所引發透納氏症。圖/wikimedia

目前各國已開始努力維護雙性人的人權及權益,而台灣對雙性人人權的重視也才剛起步。監察院在 2018年發布首次對雙性人人權進行調查的報告。同年 10 月,衛生福利部頒布〈未成年雙性人之醫療矯正手術共同性建議原則〉,其中最重要的是一項原則為「訂定雙性人性別手術的年齡規範」,成為亞洲先驅。

不管是人類還是自然界,都可能出現雌雄嵌合體的現象,生活在這樣性別多元的世界,大眾應以正面的態度認識雙性人。願大家都能保持多元開放的心態看待每一個人。

-----廣告,請繼續往下閱讀-----

參考文獻

所有討論 1
水鯨球_96
1 篇文章 ・ 3 位粉絲
東海大學生命科學系學生,腦袋可以裝下一整個生物圈。對於進那個實驗室猶豫不決,透過寫作廣泛吸收各種科普資訊。

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
56 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。