0

0
0

文字

分享

0
0
0

音樂進入我們的耳朵時發生了什麼事?--《知識大圖解》

知識大圖解_96
・2017/07/01 ・2331字 ・閱讀時間約 4 分鐘 ・SR值 510 ・六年級

我們如何製作音樂?音樂進入我們的耳朵時又會發生什麼事?

音樂是我們文化中古老的一環,對我們的心智具有強大的影響力。歌曲可以讓人哭、讓人笑、讓人聞之起舞,或是厭惡地掩耳拒聽;每個人也都有各自喜愛的歌曲。

聲音由振動產生。

當樂器的弦振動時,便會推擠前方的空氣(壓縮),並使後方的空氣擴張(稀薄化);此過程會產生在空氣中行進的聲波

當聲波到達耳朵時,就會推動耳道中的空氣、讓耳膜產生振動。這種振動會觸動三塊聽小骨,將振動傳往耳蝸(充滿液體的螺旋形結構);耳蝸中液體的運動則能產生會被送到腦部的電訊號。然而,這只是人耳能聽見音樂的一小部分過程。

這些簡單的振動能引發強烈的情緒反應,而音調本身以及我們腦部的感知方式亦十分複雜。

-----廣告,請繼續往下閱讀-----

抵達你耳朵的聲波帶有大量資訊,音樂的音調基本上包含音量音高音質(或稱音色)。振動越大,聲音越響;振動頻率越高,音高越高;音質則取決於聲波的平滑程度。

在物理教科書中出現的標準波形都十分平滑,但人或樂器所產生的聲音並不會真的如此平順;正是這些小小的不完美彼此加乘,才能形成最終音調的音色。此外,還須考量回聲、混響(reverberation)、共鳴及層層疊加的樂器、嗓音和歌詞。

我們的腦部須處理這些輸入耳內的聲音,而不只是將音調轉譯成電訊號。處理音樂訊息的過程與我們腦中控制愉悅、恐懼、動作、記憶和情緒的部位有關,且歌曲還能啟動意想不到的迴路。接下來,我們將深入介紹,當你聽到喜愛的歌曲時,腦中究竟會發生什麼事。

點擊放大圖。圖/《知識大圖解》提供

聲學共鳴

撥動套在人造奶油罐上的橡皮筋時,所發出的聲音與撥弄吉他鋼弦並不相同。撥動橡皮筋或琴弦時,產生的振動會傳遞至樂器本身;樂器的形狀和材質對最終的音調影響頗大。不同的物體會傾向以特定的頻率振動,某些頻率也會特別容易被放大,這就是所謂的共鳴。

-----廣告,請繼續往下閱讀-----

除非樂器改變形狀,否則共鳴頻率都會固定,而這也是人聲會如此特別的原因。喉嚨、嘴巴和鼻子就如同樂器的管子,能放大聲帶產生的振動;改變嘴形能發出不同的字音,打開喉嚨或用鼻音唱歌則可唱出截然不同的音調,這是因為我們改變了發聲系統的共鳴特性。歌劇演唱家是共鳴專家,他們能善用共鳴,在不使用麥克風的情況下讓歌聲傳遍整個音樂廳。

點擊放大圖。圖/《知識大圖解》提供

音樂廳的聲學

演奏出正確的音調只是完美演出的一部分

音樂廳擔負著重責大任,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。想確保聽眾能夠盡興,音樂廳的設計得考量三項因素:音量等化混響

完美的演出還要加上完美的音樂廳,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。圖/By Hanserblich, CC BY 3.0, wikimedia commons

音量主要由管弦樂團直接發出的聲響來控制,但也會受牆壁和天花板的反射所影響。音樂廳絕對不能有過多的回音,因為聽眾的耳朵會預期音樂來自於管弦樂團,而非身後的牆壁。

等化可確保聽眾聽到所有的頻率。有的空間會放大某些特定的頻率,而等化的目標就是使聲音達到平衡,並稍微消減最高的音調,以免出現任何來自弦樂器的尖銳聲音。

-----廣告,請繼續往下閱讀-----

混響則是樂音在音樂廳內部四處反彈的結果。各個物體表面所反射的聲音並不一致,因此若不加以矯正,樂音就會有些失真。

音樂廳能夠平衡上述所有的因素,它利用了各種不同的形狀和材質來維持聲音的平衡,再將之導向聽眾。平坦而堅硬的表面能反彈聲音;柔軟的表面可吸收聲音;粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使樂音在抵達你的耳朵之前,先被調整並優化。

改善音響效果

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。這些蘑菇在 1960 年代經過測試,隨後便安裝上去,並於 2001 年再次改良;目前共掛著 85 朵玻璃纖維製的真菌。皇家阿爾伯特音樂廳很大,天花板具有拱頂,若少了這些蘑菇,管弦樂團奏出的每個音符都會出現冗長的延遲回音。然而,即便有了這些蘑菇,仍需大型管弦樂團來讓這座巨型音樂廳充滿著樂音。

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。圖/By Colin, CC BY-SA 4.0, wikimedia commons
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供

本文節錄自《How It Works 知識大圖解 國際中文版》第 33 期(2017 年 06 月號)

-----廣告,請繼續往下閱讀-----

更多精彩內容請上知識大圖解

-----廣告,請繼續往下閱讀-----
文章難易度
知識大圖解_96
76 篇文章 ・ 14 位粉絲
How It Works擅長將複雜的知識轉化為活潑有趣的圖解知識,編輯方式以圖像化百科呈現,精簡易懂、精采動人、深入淺出的圖文編排,讓各年齡層的讀者們都能輕鬆閱讀。

0

0
2

文字

分享

0
0
2
腦中那首歌停不下來?可能是「耳蟲」找上你!
雅文兒童聽語文教基金會_96
・2025/08/20 ・3373字 ・閱讀時間約 7 分鐘

  • 文 / 雅文基金會聽語科學研究中心 林旻萱 助理研究員

在你的日常生活中,是否也有過這樣的經驗呢?四周一片寂靜,你坐在書桌前,試圖專心準備即將到來的考試,卻發現怎麼樣都無法靜下心來,因為腦袋裡正不受控制地播放同一首歌,甚至有時候還會不自覺的哼唱起旋律。那也許是你在商店裡無意間聽到的廣告歌曲,也或許是喜歡的歌手發的新歌,無論你有沒有刻意去回想,它都會佔據你的腦海,像是腦中的背景音樂,不斷重播。

像這樣被一首歌「洗腦」的狀況,到底為什麼會發生呢?

為什麼我們會被歌曲洗腦?原來是耳蟲搞的鬼

事實上,上述的這種現象稱為不自主音樂意象(Involuntary Musical Imagery, INMI),也稱為卡歌症候群(Stuck Song Syndrome, SSS),在口語上常被稱為耳蟲(earworm),是指一段旋律在大腦中自發浮現,並不斷重播的現象 [1][2]。耳蟲這個詞是從德文的詞彙 “ohrwurm” 而來 [3],”ohr” 是指耳朵,而 “wurm” 則是小蟲子的意思,用以形容像小蟲子爬進耳朵一般,在腦中揮之不去的音樂。根據研究,耳蟲最早的文學來源,或許可以追溯到 19 世紀 [3]。在 1845 年美國出版的一部短篇小說《悖理的惡魔》中,故事的角色就遭遇了「腦中自發響起旋律而無法擺脫」的困擾,這與現代常被提起的耳蟲現象極為相似。這顯示出,即使當時尚未明確定義耳蟲現象,人們也早已在日常生活中有過這種音樂入侵大腦的經驗,甚至為此感到困擾。

心理學教授 Philip Beaman 指出,2008 年就曾有研究針對芬蘭約 12000 名網路使用者進行大規模的問卷調查,結果顯示,有 33% 的受試者表示耳蟲會每天出現,且有超過 90% 的受試者表示至少每週會發生一次耳蟲現象 [2][4],由此可見,耳蟲現象其實相當普遍。那麼,究竟是什麼原因導致耳蟲現象呢?

-----廣告,請繼續往下閱讀-----
旋律在腦袋裡重播,讓人也忍不住地哼唱起來。 圖 / AI創建

常見的耳蟲現象,與大腦構造息息相關

為了探討大腦結構與耳蟲現象之間的關聯,Farrugia 等人於 2015 年進行了一項研究 [1],他們調查了 44 名受試者接觸音樂的經驗,並透過問卷了解受試者對耳蟲現象的看法,包括耳蟲的出現頻率及其對生活的影響等等。結果顯示,曾學習音樂或經常接觸音樂的人,更容易出現耳蟲現象,而且這些音樂片段可能對他們產生更強烈的情緒與心理影響。

另一方面,研究也透過磁振造影(Magnetic Resonance Imaging, MRI)對受試者進行腦部掃描,分析大腦的灰質體積與皮質厚度。結果發現,耳蟲現象的頻率可能與某些特定腦區的結構有關。大腦右側的額下回(Inferior Frontal Gyrus, IFG)不僅與音高記憶有關 [1][5-7],也負責抑制機制,當右側 IFG 的皮質厚度降低,抑制能力便會減弱 [1]。研究者發現,耳蟲現象發生時,IFG 的活動或許能夠抑制耳蟲出現 [1][8-9]。此外,耳蟲出現的頻率與大腦的前扣帶迴皮質(Anterior Cingulate Cortex, ACC) 厚度也有顯著的關聯,當耳蟲出現得越頻繁,ACC 的皮質厚度越薄 [1]。ACC 位置所在的大腦網絡區域,即使是大腦處於「非任務狀態」時,仍在進行各種思維活動 [1][10]。也就是說,在人們處於放空、發呆,甚至沉浸在白日夢中的時候,ACC 並不會休息停滯,反而呈現高度活躍的狀態。一項研究顯示,ACC 的皮質厚度與非任務狀態的思維活動比例有關 [11]。若將耳蟲視為一種非刻意但可感受到的意識活動,則 ACC 在耳蟲現象的神經機制中,可能扮演重要的角色。

有些人會對耳蟲感到困擾,而有些人則會擁有正向的情緒。 圖 / AI創建

對某些人而言,耳蟲能喚起愉快回憶,帶來正面影響;但對另一些人來說,強烈情緒反而可能使耳蟲成為困擾。先前已有研究指出,聆聽音樂時較容易產生正向情緒的人,其海馬旁迴(Parahippocampal Cortex, PHC)體積通常較大 [1][12], Farrugia 等人也進一步發現,認為耳蟲對自己有幫助的人,其 PHC 的灰質體積也相對較大。他們推測,PHC 灰質體積較大可能喚起與耳蟲相關的記憶,激發情緒,讓耳蟲產生較正向的作用。此外,右側顳極(Temporal Pole, TP)則被認為與情感處理相關 [1][13],若 TP 灰質體積較大,個體對情緒的刺激反應可能更為敏感,而這一類的人也較難抑制耳蟲經驗所連結到的負向情緒反應。這些結果顯示,大腦結構與功能互相影響,使每個人對於耳蟲的感受都有所不同。

那些「洗腦神曲」是怎麼來的?這些特徵是關鍵!

除了大腦結構與自身情感機制會使得耳蟲現象發生之外,歌曲本身的特徵也扮演了重要角色。根據研究,歌曲若具備某些特徵,會更容易引發耳蟲現象 [14],如下所示:

-----廣告,請繼續往下閱讀-----
  1. 節奏較快:INMI 歌曲的節奏通常比非 INMI 歌曲快,輕快的節奏更容易吸引注意力並留下記憶。
  2. 旋律輪廓常見:若旋律的起伏模式符合人們熟悉的音樂結構,更容易在腦中重播。
  3. 特殊旋律轉折:即使旋律不常見,只要具有獨特且引人注意的起伏變化,也可能成為耳蟲。
  4. 近期曝光與流行程度:最近聽過或正在流行的歌曲,更容易成為耳蟲。
經常聽的流行音樂,更容易引起耳蟲現象。圖 / freepik 

重複的旋律,能夠促進兒童語言發展嗎?

根據研究,使用兒歌作為教學素材,能有效提升 4 至 5 歲兒童的詞彙量,且兒童在理解與運用新詞彙方面皆有明顯進步 [15]。兒歌是兒童日常生活中最常接觸的音樂形式之一,而且具備了引來耳蟲的特性:旋律輕快、有節奏感,常見且具記憶點。若兒歌能透過耳蟲現象在兒童腦中自發性地重現,利用這種「非刻意但頻繁回想」的特性,或許能在自然語境中提供兒童額外的語言練習機會,使語言學習不僅僅是限於教學情境中,甚至能夠延伸至日常生活的潛意識層面。

研究也指出,透過兒歌進行學習,不僅能提升幼兒的詞彙量,亦能增強其語言學習的自信心,自我表達也會更為積極 [15]。因此,若能善用兒歌作為語言學習的媒介,並考量耳蟲現象可能帶來的記憶強化效果,也許有助於促進兒童在語言學習上的發展。

耳蟲現象,其實有跡可循

總而言之,當你腦中突然浮現一段旋律,反覆播放、揮之不去時,其實不必感到意外。這正是大腦運作與音樂特性交互作用的結果,是一種相當普遍且自然的現象。即使你沒有刻意記住某首歌,它仍可能在潛意識中悄悄留下痕跡。

所以下次當某首歌又悄悄佔據你的思緒時,不妨放鬆心情,靜靜欣賞它的旋律與節奏。你之所以忍不住想哼唱,並不是因為分心,而是因為這段旋律剛好觸發了大腦中的某個開關,也許還會勾起某些情緒或回憶呢!

-----廣告,請繼續往下閱讀-----

耳蟲,是音樂在我們腦海中留下的溫柔印記,時刻提醒著我們:大腦與音樂之間,總有著令人著迷的互動。

參考資料:

  1. Farrugia, N., Jakubowski, K., Cusack, R., & Stewart, L. (2015). Tunes stuck in your brain: The frequency and affective evaluation of involuntary musical imagery correlate with cortical structure. Consciousness and cognition35, 66-77.
  2. Liikkanen, L. A. (2008). Music in everymind: commonality of involuntary musical imagery. In 10th International Conference of Music Perception and Cognition. Sapporo, Japan, August 2008 (pp. 1-5).
  3. Beaman, C. P. (2018). The literary and recent scientific history of the earworm: A review and theoretical framework. Auditory Perception & Cognition1(1-2), 42-65.
  4. Beaman, C. P., & Williams, T. I. (2010). Earworms (stuck song syndrome): Towards a natural history of intrusive thoughts. British Journal of Psychology101(4), 637-653.
  5. Albouy, P., Mattout, J., Bouet, R., Maby, E., Sanchez, G., Aguera, P. E., … & Tillmann, B. (2013). Impaired pitch perception and memory in congenital amusia: the deficit starts in the auditory cortex. Brain136(5), 1639-1661.
  6. Hyde, K. L., & Peretz, I. (2004). Brains that are out of tune but in time. Psychological science15(5), 356-360.
  7. Hyde, K. L., Lerch, J. P., Zatorre, R. J., Griffiths, T. D., Evans, A. C., & Peretz, I. (2007). Cortical thickness in congenital amusia: when less is better than more. Journal of Neuroscience27(47), 13028-13032.
  8. Aron, A. R., Robbins, T. W., & Poldrack, R. A. (2004). Inhibition and the right inferior frontal cortex. Trends in cognitive sciences8(4), 170-177.
  9. Aron, A. R., Robbins, T. W., & Poldrack, R. A. (2014). Inhibition and the right inferior frontal cortex: one decade on. Trends in cognitive sciences18(4), 177-185.
  10. 廖泊喬。(2024/3/13)。DMN腦神經科學研究:好好躺平有助潛能發展。觀點同不同。取自:https://issues.ptsplus.tv/articles/7927/
  11. Bernhardt, B. C., Smallwood, J., Tusche, A., Ruby, F. J., Engen, H. G., Steinbeis, N., & Singer, T. (2014). Medial prefrontal and anterior cingulate cortical thickness predicts shared individual differences in self-generated thought and temporal discounting. Neuroimage, 90, 290-297.
  12. Koelsch, S., Skouras, S., & Jentschke, S. (2013). Neural correlates of emotional personality: A structural and functional magnetic resonance imaging study. PLoS One8(11), e77196.
  13. Royet, J. P., Zald, D., Versace, R., Costes, N., Lavenne, F., Koenig, O., & Gervais, R. (2000). Emotional responses to pleasant and unpleasant olfactory, visual, and auditory stimuli: a positron emission tomography study. Journal of Neuroscience20(20), 7752-7759.
  14. Jakubowski, K., Finkel, S., Stewart, L., & Müllensiefen, D. (2017). Dissecting an earworm: Melodic features and song popularity predict involuntary musical imagery. Psychology of Aesthetics, Creativity, and the Arts11(2), 122.
  15. Christina, Y., & Pujiarto, P. (2023). The Effectiveness of Nursery Rhymes Media to Improve English Vocabulary and Confidence of Children (4-5 Years) in Tutor Time Kindergarten. Journal of Education Research, 4(3), 1326-1333.
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

雅文兒童聽語文教基金會_96
63 篇文章 ・ 224 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

3
0

文字

分享

0
3
0
迴盪在耳際的聲音——迴響與聆聽知多少!
雅文兒童聽語文教基金會_96
・2023/06/28 ・2050字 ・閱讀時間約 4 分鐘

  • 文/樊家欣|雅文基金會聽語科學研究中心 助理研究員 

P. LEAGUE 最大咖球星林書豪加盟鋼鐵人隊,帶領鋼鐵人打出新氣象,並獲選為籃球單月最有價值球員「三連霸」,堪稱史上第一人!你,也愛打籃球嗎?當你在體育館時,是否有察覺到周圍的聲音跟平常不太一樣呢? 

迴響,能讓聲音隔空變魔術!

體育館一般有挑高的設計以及較大的室內容積,當其中有聲音產生,傳遞到周圍較硬的介質表面「反射」回來,而產生延遲和失真的現象,稱為「迴響(Reverberation)」。由於空間容積與迴響時間成正比,空間越大,迴響時間隨之延長。沒有進行吸音處理的體育館,運球聲、腳步聲、群眾吆喝聲等人造聲音將迴盪在空間中,聲音必須經過更長的時間才會完全消失,使人在體育館倍感喧騰。

 聲音傳遞出去遇到牆面,反射回來形成迴響。圖/shutterstock

善用設計,打造餘音繞樑的迴響聲學空間 

迴響在不同的空間,會因周圍反射的材質,展現不同的聲景樣貌,例如:音樂廳就是利用各種不同的「形狀」「材質」來平衡聲音,再將之導向聽眾。

早期音樂廳的「形狀」只有鞋盒式,台北國家音樂廳就是歐洲數百年經典傳統鞋盒式音樂廳,平面觀眾席的聲響很好,但是後面的眺望台座位,由於天花板空間被擋住,與前面造成相異聲場,聲音就顯得不夠飽滿;而高雄衛武營音樂廳,其內部設計柏林愛樂廳一樣,採用的是葡萄園式音響設計,所有觀眾皆處在同一個屋簷下,觀眾席如同葡萄園般由舞台四周錯落展開,享受相同的音場,因此聲響均等優美。

-----廣告,請繼續往下閱讀-----

從細部來看,「材質」平坦而堅硬的表面能反彈聲音、柔軟的表面可吸收聲音,粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使聲音在抵達你的耳朵之前,先被調整並優化[3]。藉由空間整體的設計,能讓迴響成為小精靈,締造優美的聲學空間。

打造餘音繞樑的音樂廳。圖/shutterstock

迴響時間過長,對聆聽語音是個壞消息⋯⋯

美國國家標準協會(American National Standards Institutes, ANSI)於 2002 年建議迴響時間(Reverberation Time)少於 600 毫秒(= 0.6 秒)有最佳的語音理解和學習。在安靜的情境中,如果反射回來的語音較早抵達聽者的耳朵,則原聲和迴響會在聽覺系統裡整合,可能提升語音辨識度(Speech Recognition);而較晚抵達的迴響,則不會與原聲有加成的作用,反而會遮蔽或模糊原本的聲音,而使語音辨識表現下降。除了語音辨識度之外,也可能因聲音的失真,而使聆聽變得費力。

聆聽費力度(Listening Effort)為一更敏感的指標,在一些迴響時間過長的情境中,即使語音辨識度沒有下降,但聆聽者可能因著迴響,而使聆聽造成負擔,或進一步使記憶或理解力下降[5],相關文章可以參考連結。因此,迴響時間過長,會提高語音辨識的難度和增加聆聽費力度。

善用科技,讓聽損者輕鬆聽清楚

一般人在有迴響的地方聽講可能會覺得比較不清楚或費力,而對於有聽力損失的人來說,會更容易受到迴響的不利影響[4] [6]。因此,許多配戴助聽器或人工電子耳的聽損者,在聽講或聲音環境較為複雜的地方會搭配使用輔助聆聽裝置(Assistive Listening Device),如T線圈(Telecoil,又稱 T-coil)、藍芽及數位遠端麥克風等。此類裝置可將聲音訊號轉換,以無線的方式傳輸至助聽器/人工電子耳,來克服環境中迴響的干擾或距離因素,幫助聽損者聽得更清楚也更輕鬆[1] [2],相關文章也可參考連結

-----廣告,請繼續往下閱讀-----

綜言之,迴響在不同的聲學空間會產生不同的效應:在設計不良的空間會產生聽覺上的干擾,而在好的聲學空間則能使聆聽成為一種享受;另外,藉著輔助聆聽裝置也能幫助我們克服迴響等外部因素而有好的聆聽

參考文獻

  1. 吳彥玢(2019)。助聽器使用者使用數位遠端無線麥克風系統與動態調頻系統之比較〔未出版之碩士論文〕。國立台北護理健康大學語言治療與聽力研究所。
  2. 林郡儀、張秀雯(2016)。校園聽覺環境及聽覺輔具之應用發展。輔具之友,39,29-34。
  3. 凌美雪(2018年08月14日)。鞋盒式或葡萄園式、柏林愛樂黃金之音怎麼聽?自由時報。ltn.com.tw
  4. Brennan, M. A., McCreery, R. W., Massey, J. (2021). Influence of Audibility and Distortion on Recognition of Reverberant Speech for Children and Adults with Hearing Aid Amplification. Journal of the American Academy of Audiology, 33, 170-180. Doi: 10.1055/a-1678-3381.
  5. Picou, E. M., Gordon, J., Ricketts, T. A. (2016). The Effects of Noise and Reverberation on Listening Effort in Adults With Normal Hearing. Ear and Hearing,37(1), 1-13. Doi: 10.1097/AUD.0000000000000222.
  6. Xu, L., Luo, J., Xie, D., Chao, X., Wang, R., Zahorik, P., Luo, X. (2022). Reverberation Degrades Pitch Perception but Not Mandarin Tone and Vowel Recognition of Cochlear Implant Users. Ear and Hearing, 43(4), 1139-1150. Doi: 10.1097/AUD.0000000000001173.
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
63 篇文章 ・ 224 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik

參考資料:

  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
63 篇文章 ・ 224 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。