0

0
0

文字

分享

0
0
0

音樂進入我們的耳朵時發生了什麼事?--《知識大圖解》

知識大圖解_96
・2017/07/01 ・2331字 ・閱讀時間約 4 分鐘 ・SR值 510 ・六年級

-----廣告,請繼續往下閱讀-----

我們如何製作音樂?音樂進入我們的耳朵時又會發生什麼事?

音樂是我們文化中古老的一環,對我們的心智具有強大的影響力。歌曲可以讓人哭、讓人笑、讓人聞之起舞,或是厭惡地掩耳拒聽;每個人也都有各自喜愛的歌曲。

聲音由振動產生。

當樂器的弦振動時,便會推擠前方的空氣(壓縮),並使後方的空氣擴張(稀薄化);此過程會產生在空氣中行進的聲波

當聲波到達耳朵時,就會推動耳道中的空氣、讓耳膜產生振動。這種振動會觸動三塊聽小骨,將振動傳往耳蝸(充滿液體的螺旋形結構);耳蝸中液體的運動則能產生會被送到腦部的電訊號。然而,這只是人耳能聽見音樂的一小部分過程。

這些簡單的振動能引發強烈的情緒反應,而音調本身以及我們腦部的感知方式亦十分複雜。

-----廣告,請繼續往下閱讀-----

抵達你耳朵的聲波帶有大量資訊,音樂的音調基本上包含音量音高音質(或稱音色)。振動越大,聲音越響;振動頻率越高,音高越高;音質則取決於聲波的平滑程度。

在物理教科書中出現的標準波形都十分平滑,但人或樂器所產生的聲音並不會真的如此平順;正是這些小小的不完美彼此加乘,才能形成最終音調的音色。此外,還須考量回聲、混響(reverberation)、共鳴及層層疊加的樂器、嗓音和歌詞。

我們的腦部須處理這些輸入耳內的聲音,而不只是將音調轉譯成電訊號。處理音樂訊息的過程與我們腦中控制愉悅、恐懼、動作、記憶和情緒的部位有關,且歌曲還能啟動意想不到的迴路。接下來,我們將深入介紹,當你聽到喜愛的歌曲時,腦中究竟會發生什麼事。

點擊放大圖。圖/《知識大圖解》提供

聲學共鳴

撥動套在人造奶油罐上的橡皮筋時,所發出的聲音與撥弄吉他鋼弦並不相同。撥動橡皮筋或琴弦時,產生的振動會傳遞至樂器本身;樂器的形狀和材質對最終的音調影響頗大。不同的物體會傾向以特定的頻率振動,某些頻率也會特別容易被放大,這就是所謂的共鳴。

-----廣告,請繼續往下閱讀-----

除非樂器改變形狀,否則共鳴頻率都會固定,而這也是人聲會如此特別的原因。喉嚨、嘴巴和鼻子就如同樂器的管子,能放大聲帶產生的振動;改變嘴形能發出不同的字音,打開喉嚨或用鼻音唱歌則可唱出截然不同的音調,這是因為我們改變了發聲系統的共鳴特性。歌劇演唱家是共鳴專家,他們能善用共鳴,在不使用麥克風的情況下讓歌聲傳遍整個音樂廳。

點擊放大圖。圖/《知識大圖解》提供

音樂廳的聲學

演奏出正確的音調只是完美演出的一部分

音樂廳擔負著重責大任,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。想確保聽眾能夠盡興,音樂廳的設計得考量三項因素:音量等化混響

完美的演出還要加上完美的音樂廳,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。圖/By Hanserblich, CC BY 3.0, wikimedia commons

音量主要由管弦樂團直接發出的聲響來控制,但也會受牆壁和天花板的反射所影響。音樂廳絕對不能有過多的回音,因為聽眾的耳朵會預期音樂來自於管弦樂團,而非身後的牆壁。

等化可確保聽眾聽到所有的頻率。有的空間會放大某些特定的頻率,而等化的目標就是使聲音達到平衡,並稍微消減最高的音調,以免出現任何來自弦樂器的尖銳聲音。

-----廣告,請繼續往下閱讀-----

混響則是樂音在音樂廳內部四處反彈的結果。各個物體表面所反射的聲音並不一致,因此若不加以矯正,樂音就會有些失真。

音樂廳能夠平衡上述所有的因素,它利用了各種不同的形狀和材質來維持聲音的平衡,再將之導向聽眾。平坦而堅硬的表面能反彈聲音;柔軟的表面可吸收聲音;粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使樂音在抵達你的耳朵之前,先被調整並優化。

改善音響效果

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。這些蘑菇在 1960 年代經過測試,隨後便安裝上去,並於 2001 年再次改良;目前共掛著 85 朵玻璃纖維製的真菌。皇家阿爾伯特音樂廳很大,天花板具有拱頂,若少了這些蘑菇,管弦樂團奏出的每個音符都會出現冗長的延遲回音。然而,即便有了這些蘑菇,仍需大型管弦樂團來讓這座巨型音樂廳充滿著樂音。

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。圖/By Colin, CC BY-SA 4.0, wikimedia commons
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供

本文節錄自《How It Works 知識大圖解 國際中文版》第 33 期(2017 年 06 月號)

-----廣告,請繼續往下閱讀-----

更多精彩內容請上知識大圖解

文章難易度
知識大圖解_96
76 篇文章 ・ 11 位粉絲
How It Works擅長將複雜的知識轉化為活潑有趣的圖解知識,編輯方式以圖像化百科呈現,精簡易懂、精采動人、深入淺出的圖文編排,讓各年齡層的讀者們都能輕鬆閱讀。

0

8
2

文字

分享

0
8
2
快!還要更快!讓國家級地震警報更好用的「都會區強震預警精進計畫」
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/21 ・2584字 ・閱讀時間約 5 分鐘

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

從地震儀感應到地震的震動,到我們的手機響起國家級警報,大約需要多少時間?

臺灣從 1991 年開始大量增建地震測站;1999 年臺灣爆發了 921 大地震,當時的地震速報系統約在震後 102 秒完成地震定位;2014 年正式對公眾推播強震即時警報;到了 2020 年 4 月,隨著技術不斷革新,當時交通部中央氣象局地震測報中心(以下簡稱為地震中心)僅需 10 秒,就可以發出地震預警訊息!

然而,地震中心並未因此而自滿,而是持續擴建地震觀測網,開發新技術。近年來,地震中心執行前瞻基礎建設 2.0「都會區強震預警精進計畫」,預計讓臺灣的地震預警系統邁入下一個新紀元!

-----廣告,請繼續往下閱讀-----

連上網路吧!用建設與技術,換取獲得地震資料的時間

「都會區強震預警精進計畫」起源於「民生公共物聯網數據應用及產業開展計畫」,該計畫致力於跨部會、跨單位合作,由 11 個執行單位共同策畫,致力於優化我國環境與防災治理,並建置資料開放平台。

看到這裡,或許你還沒反應過來地震預警系統跟物聯網(Internet of Things,IoT)有什麼關係,嘿嘿,那可大有關係啦!

當我們將各種實體物品透過網路連結起來,建立彼此與裝置的通訊後,成為了所謂的物聯網。在我國的地震預警系統中,即是透過將地震儀的資料即時傳輸到聯網系統,並進行運算,實現了對地震活動的即時監測和預警。

地震中心在臺灣架設了 700 多個強震監測站,但能夠和地震中心即時連線的,只有其中 500 個,藉由這項計畫,地震中心將致力增加可連線的強震監測站數量,並優化原有強震監測站的聯網品質。

-----廣告,請繼續往下閱讀-----

在地震中心的評估中,可以連線的強震監測站大約可在 113 年時,從原有的 500 個增加至 600 個,並且更新現有監測站的軟體與硬體設備,藉此提升地震預警系統的效能。

由此可知,倘若地震儀沒有了聯網的功能,我們也形同完全失去了地震預警系統的一切。

把地震儀放到井下後,有什麼好處?

除了加強地震儀的聯網功能外,把地震儀「放到地下」,也是提升地震預警系統效能的關鍵做法。

為什麼要把地震儀放到地底下?用日常生活來比喻的話,就像是買屋子時,要選擇鬧中取靜的社區,才不會讓吵雜的環境影響自己在房間聆聽優美的音樂;看星星時,要選擇光害比較不嚴重的山區,才能看清楚一閃又一閃的美麗星空。

-----廣告,請繼續往下閱讀-----

地表有太多、太多的環境雜訊了,因此當地震儀被安裝在地表時,想要從混亂的「噪音」之中找出關鍵的地震波,就像是在搖滾演唱會裡聽電話一樣困難,無論是電腦或研究人員,都需要花費比較多的時間,才能判讀來自地震的波形。

這些環境雜訊都是從哪裡來的?基本上,只要是你想得到的人為震動,對地震儀來說,都有可能是「噪音」!

當地震儀靠近工地或馬路時,一輛輛大卡車框啷、框啷地經過測站,是噪音;大稻埕夏日節放起絢麗的煙火,隨著煙花在天空上一個一個的炸開,也是噪音;台北捷運行經軌道的摩擦與震動,那也是噪音;有好奇的路人經過測站,推了推踢了下測站時,那也是不可忽視的噪音。

因此,井下地震儀(Borehole seismometer)的主要目的,就是盡量讓地震儀「遠離塵囂」,記錄到更清楚、雜訊更少的地震波!​無論是微震、強震,還是來自遠方的地震,井下地震儀都能提供遠比地表地震儀更高品質的訊號。

-----廣告,請繼續往下閱讀-----

地震中心於 2008 年展開建置井下地震儀觀測站的行動,根據不同測站底下的地質條件,​將井下地震儀放置在深達 30~500 公尺的乾井深處。​除了地震儀外,站房內也會備有資料收錄器、網路傳輸設備、不斷電設備與電池,讓測站可以儲存、傳送資料。

既然井下地震儀這麼強大,為什麼無法大規模建造測站呢?簡單來說,這一切可以歸咎於技術和成本問題。

安裝井下地震儀需要鑽井,然而鑽井的深度、難度均會提高時間、技術與金錢成本,因此,即使井下地震儀的訊號再好,若非有國家建設計畫的支援,也難以大量建置。

人口聚集,震災好嚴重?建立「客製化」的地震預警系統!

臺灣人口主要聚集於西半部,然而此區的震源深度較淺,再加上密集的人口與建築,容易造成相當重大的災害。

-----廣告,請繼續往下閱讀-----

許多都會區的建築老舊且密集,當屋齡超過 50 歲時,它很有可能是在沒有耐震規範的背景下建造而成的的,若是超過 25 年左右的房屋,也有可能不符合最新的耐震規範,並未具備現今標準下足夠的耐震能力。 

延伸閱讀:

在地震界有句名言「地震不會殺人,但建築物會」,因此,若建築物的結構不符合地震規範,地震發生時,在同一面積下越密集的老屋,有可能造成越多的傷亡。

因此,對於發生在都會區的直下型地震,預警時間的要求更高,需求也更迫切。

-----廣告,請繼續往下閱讀-----

地震中心著手於人口密集之都會區開發「客製化」的強震預警系統,目標針對都會區直下型淺層地震,可以在「震後 7 秒內」發布地震警報,將地震預警盲區縮小為 25 公里。

111 年起,地震中心已先後完成大臺北地區、桃園市客製化作業模組,並開始上線測試,當前正致力於臺南市的模組,未來的目標為高雄市與臺中市。

永不停歇的防災宣導行動、地震預警技術研發

地震預警系統僅能在地震來臨時警示民眾避難,無法主動保護民眾的生命安全,若人民沒有搭配正確的防震防災觀念,即使地震警報再快,也無法達到有效的防災效果。

因此除了不斷革新地震預警系統的技術,地震中心也積極投入於地震的宣導活動和教育管道,經營 Facebook 粉絲專頁「報地震 – 中央氣象署」、跨部會舉辦《地震島大冒險》特展、《震守家園 — 民生公共物聯網主題展》,讓民眾了解正確的避難行為與應變作為,充分發揮地震警報的效果。

-----廣告,請繼續往下閱讀-----

此外,雖然地震中心預計於 114 年將都會區的預警費時縮減為 7 秒,研發新技術的腳步不會停止;未來,他們將應用 AI 技術,持續強化地震預警系統的效能,降低地震對臺灣人民的威脅程度,保障你我生命財產安全。

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
195 篇文章 ・ 299 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

3
0

文字

分享

0
3
0
迴盪在耳際的聲音——迴響與聆聽知多少!
雅文兒童聽語文教基金會_96
・2023/06/28 ・2048字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/樊家欣|雅文基金會聽語科學研究中心 助理研究員 

P. LEAGUE 最大咖球星林書豪加盟鋼鐵人隊,帶領鋼鐵人打出新氣象,並獲選為籃球單月最有價值球員「三連霸」,堪稱史上第一人!你,也愛打籃球嗎?當你在體育館時,是否有察覺到周圍的聲音跟平常不太一樣呢? 

迴響,能讓聲音隔空變魔術!

體育館一般有挑高的設計以及較大的室內容積,當其中有聲音產生,傳遞到周圍較硬的介質表面「反射」回來,而產生延遲和失真的現象,稱為「迴響(Reverberation)」。由於空間容積與迴響時間成正比,空間越大,迴響時間隨之延長。沒有進行吸音處理的體育館,運球聲、腳步聲、群眾吆喝聲等人造聲音將迴盪在空間中,聲音必須經過更長的時間才會完全消失,使人在體育館倍感喧騰。

 聲音傳遞出去遇到牆面,反射回來形成迴響。圖/shutterstock

善用設計,打造餘音繞樑的迴響聲學空間 

迴響在不同的空間,會因周圍反射的材質,展現不同的聲景樣貌,例如:音樂廳就是利用各種不同的「形狀」「材質」來平衡聲音,再將之導向聽眾。

早期音樂廳的「形狀」只有鞋盒式,台北國家音樂廳就是歐洲數百年經典傳統鞋盒式音樂廳,平面觀眾席的聲響很好,但是後面的眺望台座位,由於天花板空間被擋住,與前面造成相異聲場,聲音就顯得不夠飽滿;而高雄衛武營音樂廳,其內部設計柏林愛樂廳一樣,採用的是葡萄園式音響設計,所有觀眾皆處在同一個屋簷下,觀眾席如同葡萄園般由舞台四周錯落展開,享受相同的音場,因此聲響均等優美。

-----廣告,請繼續往下閱讀-----

從細部來看,「材質」平坦而堅硬的表面能反彈聲音、柔軟的表面可吸收聲音,粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使聲音在抵達你的耳朵之前,先被調整並優化[3]。藉由空間整體的設計,能讓迴響成為小精靈,締造優美的聲學空間。

打造餘音繞樑的音樂廳。圖/shutterstock

迴響時間過長,對聆聽語音是個壞消息⋯⋯

美國國家標準協會(American National Standards Institutes, ANSI)於 2002 年建議迴響時間(Reverberation Time)少於 600 毫秒(= 0.6 秒)有最佳的語音理解和學習。在安靜的情境中,如果反射回來的語音較早抵達聽者的耳朵,則原聲和迴響會在聽覺系統裡整合,可能提升語音辨識度(Speech Recognition);而較晚抵達的迴響,則不會與原聲有加成的作用,反而會遮蔽或模糊原本的聲音,而使語音辨識表現下降。除了語音辨識度之外,也可能因聲音的失真,而使聆聽變得費力。

聆聽費力度(Listening Effort)為一更敏感的指標,在一些迴響時間過長的情境中,即使語音辨識度沒有下降,但聆聽者可能因著迴響,而使聆聽造成負擔,或進一步使記憶或理解力下降[5],相關文章可以參考連結。因此,迴響時間過長,會提高語音辨識的難度和增加聆聽費力度。

善用科技,讓聽損者輕鬆聽清楚

一般人在有迴響的地方聽講可能會覺得比較不清楚或費力,而對於有聽力損失的人來說,會更容易受到迴響的不利影響[4] [6]。因此,許多配戴助聽器或人工電子耳的聽損者,在聽講或聲音環境較為複雜的地方會搭配使用輔助聆聽裝置(Assistive Listening Device),如T線圈(Telecoil,又稱 T-coil)、藍芽及數位遠端麥克風等。此類裝置可將聲音訊號轉換,以無線的方式傳輸至助聽器/人工電子耳,來克服環境中迴響的干擾或距離因素,幫助聽損者聽得更清楚也更輕鬆[1] [2],相關文章也可參考連結

-----廣告,請繼續往下閱讀-----

綜言之,迴響在不同的聲學空間會產生不同的效應:在設計不良的空間會產生聽覺上的干擾,而在好的聲學空間則能使聆聽成為一種享受;另外,藉著輔助聆聽裝置也能幫助我們克服迴響等外部因素而有好的聆聽

參考文獻

  1. 吳彥玢(2019)。助聽器使用者使用數位遠端無線麥克風系統與動態調頻系統之比較〔未出版之碩士論文〕。國立台北護理健康大學語言治療與聽力研究所。
  2. 林郡儀、張秀雯(2016)。校園聽覺環境及聽覺輔具之應用發展。輔具之友,39,29-34。
  3. 凌美雪(2018年08月14日)。鞋盒式或葡萄園式、柏林愛樂黃金之音怎麼聽?自由時報。ltn.com.tw
  4. Brennan, M. A., McCreery, R. W., Massey, J. (2021). Influence of Audibility and Distortion on Recognition of Reverberant Speech for Children and Adults with Hearing Aid Amplification. Journal of the American Academy of Audiology, 33, 170-180. Doi: 10.1055/a-1678-3381.
  5. Picou, E. M., Gordon, J., Ricketts, T. A. (2016). The Effects of Noise and Reverberation on Listening Effort in Adults With Normal Hearing. Ear and Hearing,37(1), 1-13. Doi: 10.1097/AUD.0000000000000222.
  6. Xu, L., Luo, J., Xie, D., Chao, X., Wang, R., Zahorik, P., Luo, X. (2022). Reverberation Degrades Pitch Perception but Not Mandarin Tone and Vowel Recognition of Cochlear Implant Users. Ear and Hearing, 43(4), 1139-1150. Doi: 10.1097/AUD.0000000000001173.
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik

參考資料:

  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。