Loading [MathJax]/extensions/tex2jax.js

0

0
1

文字

分享

0
0
1

音樂與噪音的差別——《好音樂的科學》

大雁出版基地_96
・2016/07/21 ・2665字 ・閱讀時間約 5 分鐘 ・SR值 522 ・七年級

音高是什麼?

有了音高,我們就能區分「樂音」和「噪音」。接下來我會用更多篇幅加以說明,這裡我們先用一段簡短介紹起個頭。

在哼唱任一曲調時,你需要為每一個音選擇時值、響度和音高。一首曲子的響度(音量)和時值(音長)的細微變化,可傳遞許多情緒上的訊息——不過由於我們等會只需哼唱〈黑綿羊咩咩叫〉這首歌的前四個音,所以暫且不必太在意這個部分。若你現在試著以同樣的音量和音長哼唱這首歌的前四個音,剩下的,就只需選擇音高了。這首歌前兩個音的音高是一樣的,而第三個音的音高要提高,第四個音的音高則又跟第三個音相同。

每個音都是由空氣間規律、重複的振動所產生,你剛才所哼唱的每一個音,都是由聲帶間高頻率的規律振動所發出。當哼唱頭兩個音的時候,我們的聲帶每秒約振動一百次;而唱到第三個音時,由於我們必須把音高向上拉,因此聲帶每秒的振動次數也跟著增加。所以,無論一個音是由振動的弦、還是由你振動的聲帶所產生的——較高的音每秒需振動的次數也較多。而每一首曲調都是由一連串音高不同的音所組成的。

音高1
使用喉鏡觀察的聲帶(Vocal fold)示意圖。圖/wikipedia

為這些音命名

鋼琴或其他樂器上的音乃是以前七個英文字母來命名,即 A、B、C、D、E、F、G。在這些音之間還另外穿插有幾個音,即鋼琴上的黑色琴鍵,例如在 A 和 B 之間穿插了一個音,我們可叫它「升 A」,意即比 A 高一個音級;或「降B」,意即比 B 低一個音級。這套看來有點兩光的音符命名系統,已傳承了數個世紀,這部分我會在第九章詳加說明。目前各位只需知道音符是以英文字母命名,且有時前面還會跟著「升」或「降」等字眼。在左頁圖片中,因頁面限制,我無法將「升」或「降」等字加上去,只能以傳統符號「♭」來表示「降」;並以「#」來表示「升」。

-----廣告,請繼續往下閱讀-----
音高2
音階以及升降音示意圖。圖/youtube

全世界所有的鋼琴,都被調成一樣的音,亦即你在赫爾辛基按下鋼琴上的一個琴鍵,並將此鍵的音高記錄下來,然後與在紐約的某架鋼琴上的同一個琴鍵的音高相比較,就會發現兩個音是一模一樣的。同樣地,全世界由單簧管或是薩克斯風所發出的音,也都是一樣的。你也許覺得理所當然,但其實才在不久前,世界各國、甚至各城市間同一個音的音高原本都是不一樣的。而今日全球統一採行的音符,是後來經過謹慎挑選的產物。但問題是,當初是由誰來挑選的?又為什麼是這些音?

大家為何使用一樣的音?

假如你會演奏弦樂器像是小提琴或吉他的話,就能以扭緊鬆開琴弦的方式來調整音高。在一開始學琴的時候,就需學習如何利用這種收緊或放鬆弦的方式來為你的琴調音,也就是讓弦以正確的音高差距來發出每個音。舉例來說,任兩根相鄰的小提琴弦之間的音高差,就跟〈小星星〉這首兒歌裡的頭兩個音(第一組「一閃」),以及第三、四個音(第二組「一閃」),之間的差距是相同的。

那麼就拿為小提琴調音來舉例吧!第一步是將最粗的那根弦調成正確的 G 音,接著再利用該曲第一句中兩組「一閃」音高間的音差,將其餘的弦,以兩兩對照的方式互相調音。這第一個做為基準的 G 音,可使用音叉進行校準,或利用調好音的鋼琴來對照調音。但倘若你手邊既無音叉亦無鋼琴時,該怎麼辦呢?

當你獨自演奏弦樂器時,可從最粗的那根琴弦上挑選一個原始音,然後根據這根弦來調其餘的弦。務必確認任兩根弦之間的音差,與兩組「一閃」間的音高差一致。在選擇原始音高時,只需確保該弦已繃得夠緊以便發出清楚的音,但又不會太緊以致琴弦斷裂。你一開始所挑選的音高並非 G 音(除非你擁有絕對音高,這部分我留待之後的章節說明),其實,這個音可能是介於鋼琴上兩個相鄰琴鍵間的音,像是「較 A 高一點」或「比 F 低一些」的音。

-----廣告,請繼續往下閱讀-----
音高3
藉由弦的鬆緊度調整音高。圖/flickr

只要你任兩根琴弦間的音高差,與兩組「一閃」間的音高差一致,所奏出的音便不會偏到哪去,接著其他的弦樂手就能跟著調成一樣的音了。不過,要是其中有吹奏長笛的樂手,便無法一起演奏了。這是因為長笛或任何管樂器上的音都是固定的,沒辦法讓你自行選用之前的那些原始音。例如,長笛手可吹奏「E」或「F」音,卻無法吹出「比 E 高一點」的音。

你和其他弦樂手可同時演奏一段「比 E 高一點─比 F 高一點─比 C 高一點」的旋律,且聽起來就跟長笛手吹奏「E——F——C」的旋律一樣悅耳。但當兩組人馬同時演奏時,恐怕就很難聽了。只有下列兩種方式可容許大家作伙一起演奏:

  1. 當有人看到長笛手的樂器多出了幾公釐時,小提琴手得先制止長笛手演奏,然後就必須在長度較短的新長笛上,就正確的指位把所有的洞鑽出來,或是
  2. 將所有的小提琴都調成跟長笛一樣的音,這樣做的話,其他樂器就可加入了,因為大家都統一以標準音來演奏。

這些標準音並沒有比其他的音更優美動聽,只是「比較正確」而已,因為有人必須決定長笛或其他管樂器的長度。過去比較麻煩的是,不同國家所製造的長笛長短不大一致,意即德國的長笛手除非用的是英國製的長笛,否則便無法跟英國的長笛手一起演奏。

在歷經許多何者才是最佳長度的爭論後,便決定由一群不太講究穿著的專家組成委員會,來統一制訂大家今後使用的標準音。在經過相當多的專業討論(聽起來比較像爭吵)後,這群人便於 1939 年在倫敦舉行的一場會議中,決定我們今日所使用的音有哪些。這也就是現在通行全世界,不論是長笛還是所有其他的西洋樂器如小提琴、單簧管、吉他、鋼琴和木琴等,所共同採用的一套標準音。

-----廣告,請繼續往下閱讀-----

如今,當你聽到有人說「我擁有絕對音感」時,即表示這些標準音的音高已深深烙印在他們的腦海裡,而此一特殊能力,將會是下一章的主題。


書封

 

 

你知道最早被記錄下來的完整樂曲竟然是古希臘的搖滾樂嗎?為什麼身為亞洲人的我們,比較容易擁有「絕對音感」?從科學的角度書寫音樂的故事。 《好音樂的科學:破解基礎樂理和美妙旋律的音階秘密》,大雁文化出版。

-----廣告,請繼續往下閱讀-----
文章難易度
大雁出版基地_96
5 篇文章 ・ 8 位粉絲
一個支撐成熟編輯人獨當一面、有利中小品牌生存發展的書業基地。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

2
0

文字

分享

0
2
0
天冷又沙啞了嗎?來看看氣候如何影響語言演化!
雅文兒童聽語文教基金會_96
・2024/12/21 ・2599字 ・閱讀時間約 5 分鐘

  • 文/雅文基金會聽語科學研究中心 廖永賦 助理研究員

你也有這樣的經驗嗎?冬天,尤其是冷氣團來襲時,喉嚨特別容易乾癢。這種季節若在戶外運動,對喉嚨更是一大挑戰!每吸入一口氣,喉嚨就彷彿被餐巾紙抹過一次,愈發乾涸。此時若想開口說話,總得先吞吞口水、潤潤嗓子後才得以清晰表達。其實,天冷對喉嚨的影響不僅於此,甚至還可能影響語言演化的歷程!就讓我們來看看氣候環境能如何形塑語言吧!不過在此之前,我們先來科普一下溫度、濕度及乾喉嚨之間的關聯。

「冷」就一定「乾」?溼度與乾喉嚨的關聯

相信大家都有過雨天衣服晾不乾的經驗,也或許對午後雷陣雨前的悶熱難耐再熟悉不過。一般而言,環境中水分蒸散的速率取決於相對濕度:在相同溫度下,相對溼度越低,空氣擁有越多攜帶水蒸氣的「潛力」,因此能從物體表面帶走更多的水份。而雨天衣服晾不乾,就是因為相對溼度高 ( 接近或是等於 100% ) 所造成的。

聰明的讀者可能會馬上聯想到,那喉嚨容易乾,是否也直接受到相對濕度的影響?答案是……但情況會更加複雜一點,因為我們還需額外考量氣溫的改變。由於呼吸時,空氣會經過呼吸道而逐漸加溫(假設環境溫度低於體溫),此時空氣的「飽和蒸汽壓」(即空氣所能攜帶水氣的最大總量)會逐漸上升,因而能吸收更多水分。舉例來說,若目前溫度為 10°C,此時每立方公尺的空氣中最多 ( 當相對溼度為 100% 時 ) 可以帶有約 9 克的水氣 [1];再假設吸氣後所吐出的空氣增至 30°C,此時,這團空氣最多能夠攜帶31克/公尺3的水氣。換言之,經過一次呼吸之後,這團空氣多出了 22 克/公尺3以上的空間來吸納水氣。

因此,當我們考量到空氣吸入及吐出時的溫度差,便能清楚看出喉嚨乾燥與否其實主要是受絕對溼度而非相對溼度的影響——氣溫低時 ( 例如,10°C 以下 ) ,絕對溼度也一定低(小於 9 克/公尺3),我們因此較容易感到喉嚨乾燥。

-----廣告,請繼續往下閱讀-----

聲調語言與聲帶

所以喉嚨乾不乾到底跟語言有何關聯?其實,它跟台灣人最熟悉的幾種語言 (華語、台語、客語)關係非常密切喔!

台灣人在學習講英語或其他歐洲語言時,舌頭經常會感覺打結。與此同時,來自歐美的中文學習者,也經常難以準確地唸出中文的各種聲調。語言作為一套表達意義的系統,必需仰賴語音上的各種對比來區辨及表達意義。像是英語之所以對我們來說那麼難發音的緣故,是因為它們仰賴許多相近但不同的子音 (consonant) 來區辨及表達意義。舉例來說,/s/ (sand)、/ʃ/ (sheep) 及 /ʒ/ (genre) 這三種子音皆為類似的擦音 (fricative),但華語中僅有 /s/ 的音 ()。

相對而言,我們熟知的華語(北京官話)、台語、客語等,皆為聲調語言 (tonal language)。這類語言中的聲調系統透過母音音高 (pitch) 的變化來達到區辨語意的功能。例如,華語的「嗎」、「麻」、「馬」、「罵」這四個字音僅在聲調 (及時間長度) 上有所差異,其它影響語音的變項如舌位、唇位等則維持不變。

換言之,說話者僅能透過聲調的操弄來表達這四個字的差異,而要能精確操弄聲調,需仰賴的就是精細的聲帶控制——從下圖我們可以看到,要表達出這四種聲調的差異,控制聲帶的肌肉必須在 0.5~0.8 秒內非常精細地調控聲帶,以精確呈現出各種聲調音高的輪廓 (pitch contour )。因此,當聲帶因為濕度、氣溫或是感冒而變得乾燥時,發出母音本身已經很難了 [2],還需作出聲調變化更是難上加難。

-----廣告,請繼續往下閱讀-----
華語的四個聲調 ( 以「ㄇㄚ」為例 )。圖/根據 [3] 之發音資料由作者繪製。

氣候環境對於聲調語言演化的影響

根據上文的這些現象,Everett、Blasi 及 Roberts [4] 提出一個有趣的想法:既然絕對濕度對聲帶的生理有如此顯著的影響,這些影響會不會早已在上千上萬年的尺度上推動著語言聲調系統的演化?為了驗證這個想法,作者分析了 The World Atlas of Language Structures (WALS) [5] 與 World Phonotactics Database 這兩個資料庫的語言,並使用美國國家環境預測中心 ( National Centers for Environmental Prediction, NCEP ) 與國家大氣研究中心 ( National Center for Atmospheric Research, NCAR ) 的資料計算各語言起源地的平均絕對溼度與平均氣溫。

分析結果顯示,一地的平均絕對溼度與平均氣溫皆與該地之語言聲調系統的發展有著顯著的關聯,並且,溼度的與聲調的關聯最為強烈:氣候環境越為乾燥,該地發展出聲調語言的機率越低。當然,直接由地理分布去論證氣候環境對語言之演化影響是大有問題的,畢竟語言的分布同時也受到語族及語系 ( language family ) 的歷史影響。例如,兩種聲調語言在地理分布上皆位於潮濕的地區,或許並非受到氣候影響,而是由於它們恰巧有著共同的祖先,因而在地理分布上相當接近。

面對這種可能性,作者們嘗試分析單一語族「內」的語言(皆為聲調語言),發現「濕度與聲調」以及「溫度與聲調」之間的關係仍然穩定存在:潮濕地區所發展出的聲調語言,其聲調系統相較於起源地乾燥之聲調語言,通常更為複雜多樣、更需仰賴精細的聲調控制。綜上所述,作者認為除了社會與文化因素之外,氣候環境因子如濕度與氣溫,也很有可能是推動語言變遷與演化的因素之一。

聲調語言 ( 紅色 ) 與非聲調語言 ( 藍色 ) 的分布。從圖中可以看出聲調語言多集中分布於潮濕溫暖的地區;非聲調語言的分布則非常廣泛,在各種氣候環境皆可見其蹤影。圖/根據 WALS [5-6] 與 Leaflet [7] 繪製。

看似毫無關聯的「天氣」與「語言」,其實有著很深的淵源。從聲帶的細微震動到語言的地理分布,不知不覺中可能都受了環境左右。下次天氣轉涼時,這些有趣的研究或許能提醒我們,多圍圍巾、多喝溫水,對於呵護嗓子有多重要!

-----廣告,請繼續往下閱讀-----
  1. https://teaching.ch.ntu.edu.tw/gclab/wp-content/uploads/A10-飽和水蒸氣壓.pdf
  2. Leydon, C., Sivasankar, M., Falciglia, D. L., Atkins, C., & Fisher, K. V. (2009). Vocal fold surface hydration: A review. Journal of Voice, 23(6), 658–665. https://doi.org/10.1016/j.jvoice.2008.03.010 https://doi.org/10.1016/j.jvoice.2008.03.010
  3. Ryu, Catherine, Mandarin Tone Perception & Production Team, and Michigan State University Libraries. Tone Perfect: Multimodal Database for Mandarin Chinese. Accessed 1 November 2024. https://tone.lib.msu.edu/
  4. Everett, C., Blasi, D. E., & Roberts, S. G. (2015). Climate, vocal folds, and tonal languages: Connecting the physiological and geographic dots. Proceedings of the National Academy of Sciences of the United States of America, 112(5), 1322–1327. https://doi.org/10.1073/pnas.1417413112
  5. Dryer, M. S., & Haspelmath, M. (2013). The World Atlas of Language Structures Online. https://doi.org/10.5281/zenodo.13950591
  6. Maddieson, I. (2013). Tone (v2020.4). In M. S. Dryer & M. Haspelmath (Eds.), The world atlas of language structures online. Zenodo. https://doi.org/10.5281/zenodo.13950591
  7. Leaflet—An open-source JavaScript library for interactive maps. (n.d.). Retrieved November 5, 2024, from https://leafletjs.com/
-----廣告,請繼續往下閱讀-----

討論功能關閉中。

雅文兒童聽語文教基金會_96
61 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

6
2

文字

分享

0
6
2
指甲刮黑板的聲音,為何讓人難以忍受?
雅文兒童聽語文教基金會_96
・2023/10/22 ・2522字 ・閱讀時間約 5 分鐘

  • 朱家瑩/雅文基金會聽語科學研究中心 研究員

想像一下當你聽到手指甲刮著黑板產生的摩擦聲,或者是拿著叉子摩擦著不鏽鋼碗的聲音,抑或是小孩的哭叫聲,有沒有哪一個聲音會讓你全身起雞皮疙瘩,想要用手摀住耳朵,甚至是情緒爆炸、只想要遠離現場呢?這些讓人不適的聲音,是有其特有的聲學特質?或是其他緣故呢?

想像一下指甲刮黑板的聲音。圖/Pexels

不是尖銳、高頻音就刺耳,而是流淌在你我血液的祖先智慧

一般認為,令人不適的聲音是因為刺耳的高頻聲,尤其像是手指甲刮黑板時所產生的摩擦聲,其中那種「ㄍㄧ ㄍㄧ ㄍㄧ」的聲音,似乎是造成不適感的主因。

然而,Halpern、Blake 和 Hillenbrand(1986)這三位研究者對於這個現象感到好奇,因此他們進行了一項實驗 [1],他們將那些令人不適聲音(如:刮金屬或石板的聲音)中的高頻音減弱。

結果顯示,即使減弱尖銳的高頻聲音,受試者仍然感到不適,因而主張尖銳的高頻音並不是造成不適感的主因。接續 Halpern 等人在企圖尋求答案時,意外發現刮黑板的聲音頻譜圖跟靈長類猴子的警告叫聲非常相似,因而大膽推測這個不適感並非高頻音造成的,而是源於人類祖先的記憶。

-----廣告,請繼續往下閱讀-----

人類對特定頻率區間的聲音感知最敏感,加上跨感官的連結,讓人聽到某些音就不適

可惜,到底是不是來自老祖先的智慧傳承,這點未獲得後續研究的支持。另一方面,Kumar 等人(2008)進一步以聲學分析探究是否是因特定頻率導致聆聽的不適感時,發現聲音中涵蓋 2500-5500 赫茲這個頻率區間的聲學頻率似乎特別容易引起聽者的不適感 [2]

有沒有哪一個聲音會讓你全身起雞皮疙瘩,想要用手摀住耳朵?圖/Pexels

他們推測這可能是因為這個頻率範圍的聲音感知上最為強烈,同時也具有最高的能量,因此使得聽覺系統特別對這些頻率的聲音敏感。

但是,我們平常聊天談話中也涵蓋了這個頻率範圍的聲音,除了頻率之外,是不是還有其他因素造成對某些聲音的不適感呢?

Ro 等人(2013)發現當聽到聲音時,聲音進入大腦的聽覺皮質同時,會傳遞訊號到觸覺感官系統,啟動了觸覺感官,讓聽者聽到聲音時,「感覺」到自己的皮膚彷彿被指甲刮的刺痛感 [3]

-----廣告,請繼續往下閱讀-----

聽聲音會啟動身體觸覺感官系統並非只存在刮黑板這類聲音,有些人在聽到音樂聲,像是聽到低音貝斯的聲音時,也會感覺到自己的身體也在震動,甚至感受到皮膚的不適感 [4、5]

也許因為這個跨感官的訊號傳遞,讓身體的其他部位也出現不適的感受,才會讓聽者對於這些聲音感到不適。

當感知到令人不適的聲音,杏仁核會依據習得經驗,決定是否啟動保護機制!

Zald 與 Pardo(2002)發現當聽到讓人感到不適的聲音刺激時,大腦中的杏仁核(amygdala)會高度活化 [6],而杏仁核在大腦中負責掌控恐懼、焦慮、害怕等負面情緒,換句話說,當聲音訊息抵達杏仁核時,它會誘發情緒反應,進而導致我們做出不同行為反應 [7]

杏仁核的啟動是大腦的一種保護機制,透過過往的經驗連結學習會對讓人不適的聲音發出警報[8] ,當聽者遇到可能危及安全的聲音時,杏仁核就會發出警報。

-----廣告,請繼續往下閱讀-----

例如,當聽到車子緊急剎車的聲音時,這個聲音傳送到杏仁核,會進而引起我們想要逃離的反應,或者產生對駕駛者行為的憤怒反應。

由於杏仁核在聆聽這些聲音時會高度活化,Kumar 等人(2012)進一步試圖了解在聆聽令人不適的聲音時,杏仁核在大腦中扮演著怎樣的角色,以及聲音資訊如何被傳遞到杏仁核。

他們的研究結果顯示,聲音刺激會最先傳送到聽覺皮質(auditory cortex)進行聲學訊息處理和分析,解碼聲音所代表的意義,例如,聽到「ㄍㄧ」的剎車聲,解碼出來的是來自汽車或者腳踏車的剎車聲。聽覺皮質處理完畢後,將資訊傳遞到杏仁核,當杏仁核接收到來自聽覺皮質的訊號後,依據這些訊息及過去經驗發出警報 [8],誘發恐懼、焦慮或憤怒等負面情緒,並可能促使進一步的行為反應,像是尖叫、摀住耳朵,或逃離現場。

舉例來說,如果是汽車的剎車聲,基於過去的經驗,可能存在危險,因此可能會誘發恐懼情緒,並引發立馬逃離現場的行為舉動。

-----廣告,請繼續往下閱讀-----
有些人基於過去的經驗,聽到汽車的剎車聲,可能會誘發恐懼情緒。圖/Pexels

然而,如果解碼後的聲音是腳踏車的剎車聲,根據過去的經驗,可能不會有危及生命的危險,因此即便會觸發閃躲的動作行為,但負面情緒可能不如汽車剎車聲來的強烈,可能只會憤怒的罵騎車的人不長眼。

聽到某些聲音,讓人立馬想逃或想戰,也許這個過往的經驗是來自遠古時代祖先的傳承,但更可能是因為聽到這些聲音時,觸覺感官系統被啟動了,身體上「感覺」到不適,所以當不適的聲音再次出現時,杏仁核的活化反應就更增強,讓我們除了單純的接收到聲音之外,也產生了身體及情緒上的反應。

  1. Halpern, D. L., Blake, R., & Hillenbrand, J. (1986). Psychoacoustics of a chilling sound. Perception & Psychophysics39, 77-80.
  2. Kumar, S., Forster, H. M., Bailey, P., & Griffiths, T. D. (2008). Mapping unpleasantness of sounds to their auditory representation. The Journal of the Acoustical Society of America124(6), 3810-3817.
  3. Ro, T., Ellmore, T. M., & Beauchamp, M. S. (2013). A neural link between feeling and hearing. Cerebral cortex, 23(7), 1724-1730.
  4. Koenig, L., & Ro, T. (2022). Sound Frequency Predicts the Bodily Location of Auditory-Induced Tactile Sensations in Synesthetic and Ordinary Perception. bioRxiv.
  5. Lad, D., Wilkins, A., Johnstone, E., Vuong, Q.C. (2022). Feeling the music: The feel and sound of songs attenuate pain. British Journal of Pain, 16(5), 518-527. 
  6. Zald, D. H., & Pardo, J. V. (2002). The neural correlates of aversive auditory stimulation. Neuroimage16(3), 746-753.
  7. LeDoux, J. E. (2000). Emotion circuits in the brain. Annual review of neuroscience23(1), 155-184.
  8. Kumar, S., von Kriegstein, K., Friston, K., & Griffiths, T. D. (2012). Features versus feelings: dissociable representations of the acoustic features and valence of aversive sounds. Journal of Neuroscience, 32(41), 14184-14192.
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
61 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。