Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

音樂進入我們的耳朵時發生了什麼事?--《知識大圖解》

知識大圖解_96
・2017/07/01 ・2331字 ・閱讀時間約 4 分鐘 ・SR值 510 ・六年級

我們如何製作音樂?音樂進入我們的耳朵時又會發生什麼事?

音樂是我們文化中古老的一環,對我們的心智具有強大的影響力。歌曲可以讓人哭、讓人笑、讓人聞之起舞,或是厭惡地掩耳拒聽;每個人也都有各自喜愛的歌曲。

聲音由振動產生。

當樂器的弦振動時,便會推擠前方的空氣(壓縮),並使後方的空氣擴張(稀薄化);此過程會產生在空氣中行進的聲波

當聲波到達耳朵時,就會推動耳道中的空氣、讓耳膜產生振動。這種振動會觸動三塊聽小骨,將振動傳往耳蝸(充滿液體的螺旋形結構);耳蝸中液體的運動則能產生會被送到腦部的電訊號。然而,這只是人耳能聽見音樂的一小部分過程。

這些簡單的振動能引發強烈的情緒反應,而音調本身以及我們腦部的感知方式亦十分複雜。

-----廣告,請繼續往下閱讀-----

抵達你耳朵的聲波帶有大量資訊,音樂的音調基本上包含音量音高音質(或稱音色)。振動越大,聲音越響;振動頻率越高,音高越高;音質則取決於聲波的平滑程度。

在物理教科書中出現的標準波形都十分平滑,但人或樂器所產生的聲音並不會真的如此平順;正是這些小小的不完美彼此加乘,才能形成最終音調的音色。此外,還須考量回聲、混響(reverberation)、共鳴及層層疊加的樂器、嗓音和歌詞。

我們的腦部須處理這些輸入耳內的聲音,而不只是將音調轉譯成電訊號。處理音樂訊息的過程與我們腦中控制愉悅、恐懼、動作、記憶和情緒的部位有關,且歌曲還能啟動意想不到的迴路。接下來,我們將深入介紹,當你聽到喜愛的歌曲時,腦中究竟會發生什麼事。

點擊放大圖。圖/《知識大圖解》提供

聲學共鳴

撥動套在人造奶油罐上的橡皮筋時,所發出的聲音與撥弄吉他鋼弦並不相同。撥動橡皮筋或琴弦時,產生的振動會傳遞至樂器本身;樂器的形狀和材質對最終的音調影響頗大。不同的物體會傾向以特定的頻率振動,某些頻率也會特別容易被放大,這就是所謂的共鳴。

-----廣告,請繼續往下閱讀-----

除非樂器改變形狀,否則共鳴頻率都會固定,而這也是人聲會如此特別的原因。喉嚨、嘴巴和鼻子就如同樂器的管子,能放大聲帶產生的振動;改變嘴形能發出不同的字音,打開喉嚨或用鼻音唱歌則可唱出截然不同的音調,這是因為我們改變了發聲系統的共鳴特性。歌劇演唱家是共鳴專家,他們能善用共鳴,在不使用麥克風的情況下讓歌聲傳遍整個音樂廳。

點擊放大圖。圖/《知識大圖解》提供

音樂廳的聲學

演奏出正確的音調只是完美演出的一部分

音樂廳擔負著重責大任,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。想確保聽眾能夠盡興,音樂廳的設計得考量三項因素:音量等化混響

完美的演出還要加上完美的音樂廳,它必須讓聽眾沉浸在管弦樂團的最大樂聲中,卻又不能造成回音;另外,還得放大獨奏樂手奏出的精緻樂音,讓後排聽眾能聽得一清二楚。圖/By Hanserblich, CC BY 3.0, wikimedia commons

音量主要由管弦樂團直接發出的聲響來控制,但也會受牆壁和天花板的反射所影響。音樂廳絕對不能有過多的回音,因為聽眾的耳朵會預期音樂來自於管弦樂團,而非身後的牆壁。

等化可確保聽眾聽到所有的頻率。有的空間會放大某些特定的頻率,而等化的目標就是使聲音達到平衡,並稍微消減最高的音調,以免出現任何來自弦樂器的尖銳聲音。

-----廣告,請繼續往下閱讀-----

混響則是樂音在音樂廳內部四處反彈的結果。各個物體表面所反射的聲音並不一致,因此若不加以矯正,樂音就會有些失真。

音樂廳能夠平衡上述所有的因素,它利用了各種不同的形狀和材質來維持聲音的平衡,再將之導向聽眾。平坦而堅硬的表面能反彈聲音;柔軟的表面可吸收聲音;粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使樂音在抵達你的耳朵之前,先被調整並優化。

改善音響效果

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。這些蘑菇在 1960 年代經過測試,隨後便安裝上去,並於 2001 年再次改良;目前共掛著 85 朵玻璃纖維製的真菌。皇家阿爾伯特音樂廳很大,天花板具有拱頂,若少了這些蘑菇,管弦樂團奏出的每個音符都會出現冗長的延遲回音。然而,即便有了這些蘑菇,仍需大型管弦樂團來讓這座巨型音樂廳充滿著樂音。

倫敦皇家阿爾伯特音樂廳的天花板掛滿了一顆顆蘑菇,但這並不是溼氣太重所致,這種奇異的構造可是為了改善音響效果。圖/By Colin, CC BY-SA 4.0, wikimedia commons
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供
點擊放大圖。圖/《知識大圖解》提供

本文節錄自《How It Works 知識大圖解 國際中文版》第 33 期(2017 年 06 月號)

-----廣告,請繼續往下閱讀-----

更多精彩內容請上知識大圖解

-----廣告,請繼續往下閱讀-----
文章難易度
知識大圖解_96
76 篇文章 ・ 12 位粉絲
How It Works擅長將複雜的知識轉化為活潑有趣的圖解知識,編輯方式以圖像化百科呈現,精簡易懂、精采動人、深入淺出的圖文編排,讓各年齡層的讀者們都能輕鬆閱讀。

0

1
0

文字

分享

0
1
0
ECU: 汽車大腦的演化與挑戰
鳥苷三磷酸 (PanSci Promo)_96
・2025/07/02 ・3793字 ・閱讀時間約 7 分鐘

本文與 威力暘電子 合作,泛科學企劃執行。

想像一下,當你每天啟動汽車時,啟動的不再只是一台車,而是一百台電腦同步運作。但如果這些「電腦」突然集體當機,後果會有多嚴重?方向盤可能瞬間失靈,安全氣囊無法啟動,整台車就像失控的高科技廢鐵。這樣的「系統崩潰」風險並非誇張劇情,而是真實存在於你我日常的駕駛過程中。

今天,我們將深入探討汽車電子系統「逆天改運」的科學奧秘。究竟,汽車的「大腦」—電子控制單元(ECU),是如何從單一功能,暴增至上百個獨立系統?而全球頂尖的工程師們,又為何正傾盡全力,試圖將這些複雜的系統「砍掉重練」、整合優化?

第一顆「汽車大腦」的誕生

時間回到 1980 年代,當時的汽車工程師們面臨一項重要任務:如何把汽油引擎的每一滴燃油都壓榨出最大動力?「省油即省錢」是放諸四海皆準的道理。他們發現,關鍵其實潛藏在一個微小到幾乎難以察覺的瞬間:火星塞的點火時機,也就是「點火正時」。

如果能把點火的精準度控制在「兩毫秒」以內,這大約是你眨眼時間的百分之一到千分之一!引擎效率就能提升整整一成!這不僅意味著車子開起來更順暢,還能直接省下一成的油耗。那麼,要如何跨過這道門檻?答案就是:「電腦」的加入!

-----廣告,請繼續往下閱讀-----

工程師們引入了「微控制器」(Microcontroller),你可以把它想像成一顆專注於特定任務的迷你電腦晶片。它能即時讀取引擎轉速、進氣壓力、油門深度、甚至異常爆震等各種感測器的訊號。透過內建的演算法,在千分之一秒、甚至微秒等級的時間內,精準計算出最佳的點火角度,並立刻執行。

從此,引擎的性能表現大躍進,油耗也更漂亮。這正是汽車電子控制單元(ECU)的始祖—專門負責點火的「引擎控制單元」(Engine Control Unit)。

汽車電子控制單元的始祖—專門負責點火的「引擎控制單元」(Engine Control Unit)/ 圖片來源:shutterstock

ECU 的失控暴增與甜蜜的負荷

第一顆 ECU 的成功,在 1980 年代後期點燃了工程師們的想像:「這 ECU 這麼好用,其他地方是不是也能用?」於是,ECU 的應用範圍不再僅限於點火,燃油噴射量、怠速穩定性、變速箱換檔平順度、ABS 防鎖死煞車,甚至安全氣囊的引爆時機……各種功能都交給專屬的 ECU 負責 。

然而,問題來了:這麼多「小電腦」,它們之間該如何有效溝通?

-----廣告,請繼續往下閱讀-----

為了解決這個問題,1986 年,德國的博世(Bosch)公司推出了一項劃時代的發明:控制器區域網路(CAN Bus)。你可以將它想像成一條專為 ECU 打造的「神經網路」。各個 ECU 只需連接到這條共用的線路上,就能將訊息「廣播」給其他單元。

更重要的是,CAN Bus 還具備「優先通行」機制。例如,煞車指令或安全氣囊引爆訊號這類攸關人命的重要訊息,絕對能搶先通過,避免因資訊堵塞而延誤。儘管 CAN Bus 解決了 ECU 之間的溝通問題,但每顆 ECU 依然需要獨立的電源線、接地線,並連接各種感測器和致動器。結果就是,一輛汽車的電線總長度可能達到 2 到 4 公里,總重量更高達 50 到 60 公斤,等同於憑空多載了一位乘客的重量。

另一方面,大量的 ECU 與錯綜複雜的線路,也讓「電子故障」開始頻繁登上汽車召回原因的榜首。更別提這些密密麻麻的線束,簡直是設計師和維修技師的惡夢。要檢修這些電子故障,無疑讓人一個頭兩個大。

大量的 ECU 與錯綜複雜的線路,也讓「電子故障」開始頻繁登上汽車召回原因的榜首。/圖片來源:shutterstock

汽車電子革命:從「百腦亂舞」到集中治理

到了2010年代,汽車電子架構迎來一場大改革,「分區架構(Zonal Architecture)」搭配「中央高效能運算(HPC)」逐漸成為主流。簡單來說,這就像在車內建立「地方政府+中央政府」的管理系統。

-----廣告,請繼續往下閱讀-----

可以想像,整輛車被劃分為幾個大型區域,像是車頭、車尾、車身兩側與駕駛艙,就像數個「大都會」。每個區域控制單元(ZCU)就像「市政府」,負責收集該區所有的感測器訊號、初步處理與整合,並直接驅動該區的馬達、燈光等致動器。區域先自理,就不必大小事都等中央拍板。

而「中央政府」則由車用高效能運算平台(HPC)擔任,統籌負責更複雜的運算任務,例如先進駕駛輔助系統(ADAS)所需的環境感知、物體辨識,或是車載娛樂系統、導航功能,甚至是未來自動駕駛的決策,通通交由車輛正中央的這顆「超級大腦」執行。

乘著這波汽車電子架構的轉型浪潮中, 2008 年成立的台灣本土企業威力暘電子,便精準地切入了這個趨勢,致力於開發整合 ECU 與區域控制器(Domain Controller)功能的模組化平台。他們專精於開發電子排檔、多功能方向盤等各式汽車電子控制模組。為了確保各部件之間的溝通順暢,威力暘提供的解決方案,就像是將好幾個「分區管理員」的職責,甚至一部分「超級大腦」的功能,都整合到一個更強大的硬體平台上。

這些模組不僅擁有強大的晶片運算能力,可同時支援 ADAS 與車載娛樂,還能兼容多種通訊協定,大幅簡化車內網路架構。如此一來,車廠在追求輕量化和高效率的同時,也能顧及穩定性與安全性。

-----廣告,請繼續往下閱讀-----
2008 年威力暘電子致力於開發整合 ECU 與區域控制器(Domain Controller)功能的模組化平台 /圖片來源:shutterstock

萬無一失的「汽車大腦」:威力暘的四大策略

然而,「做出來」與「做好」之間,還是有差別。要如何確保這顆集結所有功能的「汽車大腦」不出錯?具體來說,威力暘電子憑藉以下四大策略,築起其產品的可靠性與安全性:

  1. AUTOSAR : 導入開放且標準化的汽車軟體架構 AUTOSAR。分為應用層、運行環境層(RTE)和基礎軟體層(BSW)。就像在玩「樂高積木」,ECU 開發者能靈活組合模組,專注在核心功能開發,從根本上提升軟體的穩定性和可靠性。
  2. V-Model 開發流程:這是一種強調嚴謹、能在早期發現錯誤的軟體開發流程。就像打勾 V 字形般,左側從上而下逐步執行,右側則由下而上層層檢驗,確保每個階段的安全要求都確實落實。
  3. 基於模型的設計 MBD(Model-Based Design) 威力暘的工程師們會利用 MatLab®/Simulink® 等工具,把整個 ECU 要控制的系統(如煞車),用數學模型搭建起來,然後在虛擬環境中進行大量的模擬和測試。這等於在實體 ECU 誕生前,就能在「數位雙生」世界中反覆演練、預先排除設計缺陷,,並驗證安全機制是否有效。
  4. Automotive SPICE (ASPICE) : ASPICE 是國際公認的汽車軟體「品質管理系統」,它不直接評估最終 ECU 產品本身的安全性,而是深入檢視團隊在軟體開發的「整個過程」,也就是「方法論」和「管理紀律」是否夠成熟、夠系統化,並只根據數據來評估品質。

既然 ECU 掌管了整輛車的運作,其能否正常運作,自然被視為最優先項目。為此,威力暘嚴格遵循汽車業中一本堪稱「安全聖經」的國際標準:ISO 26262。這套國際標準可視為一本針對汽車電子電氣系統(特別是 ECU)的「超嚴格品管手冊」和「開發流程指南」,從概念、設計、測試到生產和報廢,都詳細規範了每個安全要求和驗證方法,唯一目標就是把任何潛在風險降到最低

有了上述這四項策略,威力暘確保其產品從設計、生產到交付都符合嚴苛的安全標準,才能通過 ISO 26262 的嚴格檢驗。

然而,ECU 的演進並未就此停下腳步。當ECU 的數量開始精簡,「大腦」變得更集中、更強大後,汽車產業又迎來了新一波革命:「軟體定義汽車」(Software-Defined Vehicle, SDV)。

-----廣告,請繼續往下閱讀-----

軟體定義汽車 SDV:你的愛車也能「升級」!

未來的汽車,會越來越像你手中的智慧型手機。過去,車輛功能在出廠時幾乎就「定終身」,想升級?多半只能換車。但在軟體定義汽車(SDV)時代,汽車將搖身一變成為具備強大運算能力與高速網路連線的「行動伺服器」,能夠「二次覺醒」、不斷升級。透過 OTA(Over-the-Air)技術,車廠能像推送 App 更新一樣,遠端傳送新功能、性能優化或安全修補包到你的車上。

不過,這種美好願景也將帶來全新的挑戰:資安風險。當汽車連上網路,就等於向駭客敞開潛在的攻擊入口。如果車上的 ECU 或雲端伺服器被駭,輕則個資外洩,重則車輛被遠端鎖定或惡意操控。為了打造安全的 SDV,業界必須遵循像 ISO 21434 這樣的車用資安標準。

威力暘電子運用前面提到的四大核心策略,確保自家產品能符合從 ISO 26262 到 ISO 21434 的國際認證。從品質管理、軟體開發流程,到安全認證,這些努力,讓威力暘的模組擁有最高的網路與功能安全。他們的產品不僅展現「台灣智造」的彈性與創新,也擁有與國際大廠比肩的「車規級可靠度」。憑藉這些實力,威力暘已成功打進日本 YAMAHA、Toyota,以及歐美 ZF、Autoliv 等全球一線供應鏈,更成為 DENSO 在台灣少數核准的控制模組夥伴,以商用車熱系統專案成功打入日系核心供應鏈,並自 2025 年起與 DENSO 共同展開平台化量產,驗證其流程與品質。

毫無疑問,未來車輛將有更多運作交由電腦與 AI 判斷,交由電腦判斷,比交由人類駕駛還要安全的那一天,離我們不遠了。而人類的角色,將從操作者轉為監督者,負責在故障或斷網時擔任最後的保險。透過科技讓車子更聰明、更安全,人類甘願當一個「最弱兵器」,其實也不錯!

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

3
0

文字

分享

0
3
0
迴盪在耳際的聲音——迴響與聆聽知多少!
雅文兒童聽語文教基金會_96
・2023/06/28 ・2048字 ・閱讀時間約 4 分鐘

  • 文/樊家欣|雅文基金會聽語科學研究中心 助理研究員 

P. LEAGUE 最大咖球星林書豪加盟鋼鐵人隊,帶領鋼鐵人打出新氣象,並獲選為籃球單月最有價值球員「三連霸」,堪稱史上第一人!你,也愛打籃球嗎?當你在體育館時,是否有察覺到周圍的聲音跟平常不太一樣呢? 

迴響,能讓聲音隔空變魔術!

體育館一般有挑高的設計以及較大的室內容積,當其中有聲音產生,傳遞到周圍較硬的介質表面「反射」回來,而產生延遲和失真的現象,稱為「迴響(Reverberation)」。由於空間容積與迴響時間成正比,空間越大,迴響時間隨之延長。沒有進行吸音處理的體育館,運球聲、腳步聲、群眾吆喝聲等人造聲音將迴盪在空間中,聲音必須經過更長的時間才會完全消失,使人在體育館倍感喧騰。

 聲音傳遞出去遇到牆面,反射回來形成迴響。圖/shutterstock

善用設計,打造餘音繞樑的迴響聲學空間 

迴響在不同的空間,會因周圍反射的材質,展現不同的聲景樣貌,例如:音樂廳就是利用各種不同的「形狀」「材質」來平衡聲音,再將之導向聽眾。

早期音樂廳的「形狀」只有鞋盒式,台北國家音樂廳就是歐洲數百年經典傳統鞋盒式音樂廳,平面觀眾席的聲響很好,但是後面的眺望台座位,由於天花板空間被擋住,與前面造成相異聲場,聲音就顯得不夠飽滿;而高雄衛武營音樂廳,其內部設計柏林愛樂廳一樣,採用的是葡萄園式音響設計,所有觀眾皆處在同一個屋簷下,觀眾席如同葡萄園般由舞台四周錯落展開,享受相同的音場,因此聲響均等優美。

-----廣告,請繼續往下閱讀-----

從細部來看,「材質」平坦而堅硬的表面能反彈聲音、柔軟的表面可吸收聲音,粗糙的表面則會將入射的聲波散射。在牆壁和天花板上裝設經特別設計的嵌板,就能使聲音在抵達你的耳朵之前,先被調整並優化[3]。藉由空間整體的設計,能讓迴響成為小精靈,締造優美的聲學空間。

打造餘音繞樑的音樂廳。圖/shutterstock

迴響時間過長,對聆聽語音是個壞消息⋯⋯

美國國家標準協會(American National Standards Institutes, ANSI)於 2002 年建議迴響時間(Reverberation Time)少於 600 毫秒(= 0.6 秒)有最佳的語音理解和學習。在安靜的情境中,如果反射回來的語音較早抵達聽者的耳朵,則原聲和迴響會在聽覺系統裡整合,可能提升語音辨識度(Speech Recognition);而較晚抵達的迴響,則不會與原聲有加成的作用,反而會遮蔽或模糊原本的聲音,而使語音辨識表現下降。除了語音辨識度之外,也可能因聲音的失真,而使聆聽變得費力。

聆聽費力度(Listening Effort)為一更敏感的指標,在一些迴響時間過長的情境中,即使語音辨識度沒有下降,但聆聽者可能因著迴響,而使聆聽造成負擔,或進一步使記憶或理解力下降[5],相關文章可以參考連結。因此,迴響時間過長,會提高語音辨識的難度和增加聆聽費力度。

善用科技,讓聽損者輕鬆聽清楚

一般人在有迴響的地方聽講可能會覺得比較不清楚或費力,而對於有聽力損失的人來說,會更容易受到迴響的不利影響[4] [6]。因此,許多配戴助聽器或人工電子耳的聽損者,在聽講或聲音環境較為複雜的地方會搭配使用輔助聆聽裝置(Assistive Listening Device),如T線圈(Telecoil,又稱 T-coil)、藍芽及數位遠端麥克風等。此類裝置可將聲音訊號轉換,以無線的方式傳輸至助聽器/人工電子耳,來克服環境中迴響的干擾或距離因素,幫助聽損者聽得更清楚也更輕鬆[1] [2],相關文章也可參考連結

-----廣告,請繼續往下閱讀-----

綜言之,迴響在不同的聲學空間會產生不同的效應:在設計不良的空間會產生聽覺上的干擾,而在好的聲學空間則能使聆聽成為一種享受;另外,藉著輔助聆聽裝置也能幫助我們克服迴響等外部因素而有好的聆聽

  1. 吳彥玢(2019)。助聽器使用者使用數位遠端無線麥克風系統與動態調頻系統之比較〔未出版之碩士論文〕。國立台北護理健康大學語言治療與聽力研究所。
  2. 林郡儀、張秀雯(2016)。校園聽覺環境及聽覺輔具之應用發展。輔具之友,39,29-34。
  3. 凌美雪(2018年08月14日)。鞋盒式或葡萄園式、柏林愛樂黃金之音怎麼聽?自由時報。ltn.com.tw
  4. Brennan, M. A., McCreery, R. W., Massey, J. (2021). Influence of Audibility and Distortion on Recognition of Reverberant Speech for Children and Adults with Hearing Aid Amplification. Journal of the American Academy of Audiology, 33, 170-180. Doi: 10.1055/a-1678-3381.
  5. Picou, E. M., Gordon, J., Ricketts, T. A. (2016). The Effects of Noise and Reverberation on Listening Effort in Adults With Normal Hearing. Ear and Hearing,37(1), 1-13. Doi: 10.1097/AUD.0000000000000222.
  6. Xu, L., Luo, J., Xie, D., Chao, X., Wang, R., Zahorik, P., Luo, X. (2022). Reverberation Degrades Pitch Perception but Not Mandarin Tone and Vowel Recognition of Cochlear Implant Users. Ear and Hearing, 43(4), 1139-1150. Doi: 10.1097/AUD.0000000000001173.
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
62 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik
  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
62 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。