Loading [MathJax]/extensions/tex2jax.js

0

3
1

文字

分享

0
3
1

巨石陣用途新解:巨大音效系統?──《傷風敗俗文化史》

時報出版_96
・2018/03/07 ・3248字 ・閱讀時間約 6 分鐘 ・SR值 548 ・八年級

史前存在的任何建物,其生辰八字我們都只能猜個大概。學者相當篤定巨石陣(Stonehenge)的動工是在西元前三千年到兩千兩百年之間。這一來一往差了八百年,美國歷史都可以跑三遍了。但這還算好的,因為我們對於巨石陣一開始為什麼要蓋,我們連個大概都說不出來。

巨石陣:神主牌、天文曆、音效系統?

在風行的理論中,有比較腳踏實地的(祖先的神主牌、巨型的天文曆),也有人天馬行空地說那是外星人的降落區。但我這兒有一種你應該沒聽過的版本,那就是巨石陣是一個巨型的音效系統。古代如果有所謂的大型場館,長得應該就是這副模樣。或者用英國人聽得懂的說法,這就是古人在廢棄的倉庫裡搭了一間DJ的混音室。

圖/bosmanerwin@wikimedia

索爾福德(Salford)、布里斯托(Bristol)與哈德斯菲爾德(Huddersfield)等大學的學者研究顯示巨石的陣型能產生人耳可輕易辨別的音效──想當然那些慢慢把石頭拖到定位放置的史前人類也有耳朵。布魯諾.法詹達博士(Dr. Bruno Fazenda)是位科學家,他長年投身於巨石陣的音場研究。對於研究的發現,他抱持著審慎的觀點。所以在我跟他連絡上之後,他第一件事就是要我別把事情想得太簡單了,巨石陣很可能不是為了單一的功能而生。

我們應該假設巨石陣在古人的心中,是一種有如瑞士刀的實用主義概念。這麼多巨石要多少人才拖得動?要供養這些人的資源,在五千年前肯定不是「小數目」。何況當時的人不論居住在地球上的哪個角落,恐怕都還沒有精通一門藝術叫做「不要被狼吃掉」。當時的人為了物盡其用,巨石陣很可能「身兼多職」,而且主要的用途還可能在建造的過程中幾度換過。

-----廣告,請繼續往下閱讀-----

不過巨石陣是史前某種「演唱會」場地的理論,還是可以解釋這些石碑的一項成分之謎。巨石陣用上的較小石塊,都是屬於青石(bluestone),也就是輝綠岩或粗粒玄武岩(spotted dolerite)。人類學家咸信這些青石是從約兩百英里(三百二十餘公里)外的地方拖來──不過也有一說是這些青石搭了冰河移動的便車。明明不遠處就有很多大石頭可用,立陣者為什麼要捨近求遠,大費周章地弄來這些特別的石頭?

圖/Andymoor1980@wikimedia

嗯,關於舊石器時代音樂家的經驗談,現代的聲學知識已經可以解開。倫敦皇家藝術學院(Royal College of Art in London)的學者發現普萊西利群丘(Preseli Hills)作為巨石陣可能的青石源頭,上頭的許多青石都有一個特色是敲擊後會產生「共鳴」。拿給專業的打擊樂手測試,這些青石甚至能當作高音鐵琴(glockenspiels)使用(高音鐵琴像是木琴,算是兄弟)。

巨石陣複製品:華府瑪莉丘博物館

要測試這理論有一個顯而易見的難題,那就是巨石陣是珍貴的文化資產,不可能讓人隨便拿根棍子去敲。現行法律甚至禁止在巨石陣中使用多種電器。所幸皇天不負苦心人,美國有一個一比一的巨石陣複製品,就在華府瑪麗丘(Maryhill, Washington)的一間博物館裡,是位百萬富翁要求設置的。

圖/donwhite84@pixabay

山姆.希爾(Sam Hill)──山姆是個活生生的人,不是老掉牙的「惡魔」委婉語──的職涯都在美國西北各地造橋舖路。不過真正披荊斬棘的不是他本人,是一大群勞工弟兄的功勞,他的身分是建設公司的老闆。總之,他賺到了錢,蓋起了屬於他自己的巨石陣。所以你看人有多「長進」,以前蓋個東西要耗費幾代人的韌性,現在只不過是有錢人的任性。

-----廣告,請繼續往下閱讀-----

不過我想替山姆講兩句話。他複製巨石陣的動機,並不只是想要把史前懶散的山頂洞人給比下去,他還沒那麼無聊。他的初衷是想替在一戰中戰死的數百萬青年立碑。在當時,主流的觀念下巨石陣是祭壇。而在希爾的心中,一戰也是個無形的祭壇,犧牲品就是那些莫須有死去的百千萬年輕人。全尺寸複製歷史上最知名的異教徒衣冠塚,真的恰好是致敬之舉。

希爾複製的巨石碑,其實也是美國第一次有人以建物來紀念一戰死難者。實際上,極少有證據指向原版的巨石陣是作為人類獻祭之用。在歷史的長河中,巨石陣所在的區域有不少人安葬,但看得出被處決或犧牲的人數甚少。經年累月,巨石陣見證了五花八門,甚至狗屁倒灶的各種事件,但我們可以確信這裡辛辛苦苦蓋起來,興建者心心念念想的絕不是一個午門或刑場的概念。

儘管如此,瑪麗丘巨石碑向死難者致意的心意仍舊非常溫暖,而山姆本人也很合情合理地在這裡埋骨安息。我對他充滿了感激,因為有他才有這座複製品,而有這巨石陣的複製品,我才有機會測試巨石陣作為遠古的環場音效設備,到底稱不稱職。

圖/MaartenB@pixabay

建造石器時代迪斯可的科學

瑪麗丘的巨石陣是水泥做的,不是青石或任何一種自然的岩石。但蓋的人很用心地讓複製品呈現出逼近本尊的質感。索爾福德大學法詹達(Fazenda)博士的團隊選擇在華府進行他們驚世的聲學實驗,就是因為華盛頓「贗品」與英格蘭「真貨」間的音質差距小到可以忽視不計。

-----廣告,請繼續往下閱讀-----

法詹達團隊的研究發現瑪麗丘石陣的回聲程度正符合人類預期中良好的講堂設計。該研究發現石陣會導致聲學活動的增加,不論是演說或「念經」都會產生顯著不同的效果。當然你會說任何一處場地或房間夠大、夠圓,多少能產生一些回響,但巨石陣的設計恐怕不是這麼單純。

巨石之間穿插的兩圈石頭雖小,對整體音效的挹注卻很大,讓音波在其中進行折射跟散射。根據索爾福德大學的報告,這意味著「空間內所有音波會各自以不同的方向前進,而不會走得整整齊齊。」

這樣的設計其實會抑制一去一回的回音,同時促進聲音在音場內回響。這代表身處在石陣中的任何一點,都不會有聲音的死角,不會有任何聽眾聽不清楚的情形發生。但我對在石器時代的「國家音樂廳」沒有興趣。我看到媒體報導法詹達博士的研究,記者下的標題長這樣:

「巨石陣是遠古的銳舞(rave)派對地點」

──發現頻道新聞〈Discovery News〉,二○一三年

「巨石陣:一個超屌的銳舞場地」

──國家廣播公司新聞〈NBC News〉,二○○九年

上色的石頭補完了石陣的原始配置,也就是石陣在被歲月跟遊客聯手摧殘之前的模樣。我們很幸運,瑪麗丘複製的是完整版的石陣。圖/塔薇亞.莫拉(Tavia Morra)繪製。

法詹達博士二○一二年在索爾福德大學發表《巨石陣的聲學原理》(Acoustics of Stonehenge)可以說是旁徵博引,但也乾得可以:一大堆數學算式,「銳舞」或像「一個超屌」的用法一次都沒有出現過。

-----廣告,請繼續往下閱讀-----

就在這個時候,我誤打誤撞看到了魯伯特.提爾(Rupert Till)博士受訪的資料。提爾博士是位音樂專長的人類學家,也參與了法詹達博士在瑪麗丘碑址的測試工作。

提爾博士描繪的光景就鮮活多了。他把類似巨石陣民族的音樂風格比喻成森巴樂曲,快步調、有大型樂團助陣,而且參與者可能多達數百人。提爾博士親自跳下來把數千年前的場面比喻成銳舞派對,收錄在二○一二年《獨立流行音樂研究學會學報》(Journal of the Independent Association for the Study of Popular Music)的報導中。他說巨石陣的音場效果是間接證據,當時應該有「一大群人聚在一起演奏『重拍、旋律簡單、有著反覆強烈節奏的音樂』來進入恍惚或出神的狀態」提爾博士接著說:

類似的活動可以在電子舞曲音樂文化中的「銳舞」活動中看見……許多目擊者都形容那樣的場面對參與者而言,具有儀式性或宗教性的意義。

 

本文摘自為《傷風敗俗文化史:十五個改寫人類文明的墮落惡習》。

 

 

-----廣告,請繼續往下閱讀-----
文章難易度
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik
  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
61 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

2
1

文字

分享

0
2
1
破解史前巨石陣謎團!科學家分析核心樣本找到石材來源
活躍星系核_96
・2020/08/21 ・2121字 ・閱讀時間約 4 分鐘 ・SR值 577 ・九年級

-----廣告,請繼續往下閱讀-----

  • 文/韻涵|以人文視角洞察科普,淺顯轉述科學奧義。這輩子離不開地球,只能遙望星空。

巨大石塊突兀地聳立在平原上,它們怎麼會出現在這,為什麼會圍成一個圓,是用作神秘儀式,還是外星人傑作?數百年來,科學家試圖探索英格蘭史前遺跡巨石陣(Stonehenge)之謎,如今多虧了保存在美國逾半世紀的巨石核心樣本,巨石陣石材的身世謎團終於解開。

圖/Pixabay

英格蘭布萊頓大學(University of Brighton)地形學家納許(David Nash)領導的研究團隊,利用 X光分析組成巨石陣的 52 塊淺灰色砂岩「撒森岩」(sarsens)的化學組成,發現其中含有 99% 的矽土,以及其他諸多化學成分。

科研團隊檢測的 52 塊撒森岩中,有 50 塊與距離 25 公里外的西伍茲(West Woods)的岩石組成相似;西伍茲位於英格蘭威爾特郡(Wiltshire)馬堡丘陵(Marlborough Downs)南方,距離巨石陣約 25 公里。納許說:「大部分岩石都有著共同的化學物質,顯示它們來自同一區。」

-----廣告,請繼續往下閱讀-----

圖/Google Map

納許表示,「撒森岩建構巨石陣標誌性的外圈,以及中央的馬蹄形三石結構,非常龐大。」英格蘭遺產委員會(English Heritage)介紹,三石結構指的是兩塊垂直岩石支撐上方的一塊水平石塊。巨石陣約在西元前 2500 年建造,經年風蝕雨淋,許多石塊已然掉落或失蹤,目前最高聳的石塊約 9.1 公尺,最重的石塊達 30 噸。

關鍵巨石核心棒,失而復得

1958 年,考古學團隊聘請鑽石切割公司「萬磨」(Van Moppes)搶救一組掉落的三石結構,工程人員在巨石上鑽了三個孔,取出三支巨石核心棒,再嵌入足以支撐三石結構的金屬棒。

其中一支直徑約 25 公分、長約 108 公分的巨石核心樣本,送給參與修復工程的萬磨雇員菲力普斯(Robert Phillips),他 1977 年獲准攜帶這個巨石陣樣本移民美國,輾轉各州後落腳佛羅里達; 2019 年,菲力普斯90大壽前夕,決定把樣本歸還英格蘭遺產委員會,讓研究團隊有機會一探巨石陣石材的來歷。

-----廣告,請繼續往下閱讀-----

這支「菲利浦斯核心」(Phillips core)巨石核心樣本歸還的消息傳開後,第二支核心棒也在附近博物館被找著,但它並不完整,只剩18公分,其餘的部分以及第三支核心棒至今仍下落不明。

英格蘭遺產委員會將半根「菲利浦斯核心」交由納許團隊研究分析,另外半根則由委員會妥善保存。納許團隊利用「感應耦合電漿質譜儀」(Inductively coupled plasma mass spectrometry,簡稱 ICP-MS),詳盡分析半根「菲利浦斯核心」,精準辨識更多化學元素,接著比對另外 20 處的岩石樣本,發現巨石陣的岩石與西伍茲的岩石組成最接近。

納許說:「利用 21 世紀的科學技術探索新石器時代(Neolithic)的歷史,最終解答考古學家辯論數個世紀之謎,著實令人興奮。」

這項發表於開放式科學期刊《科學進展》(Science Advances)的研究結果,呼應了巨石陣在 4500 多年前被運送到現今地點的理論,當時是巨石陣建造的第二階段,凸顯建造者來自高度組織化的社會。

-----廣告,請繼續往下閱讀-----

英格蘭遺產委員會考古學研究員蘇珊‧葛瑞尼里(Susan Greaney)說:「新研究得以確定巨石陣建造者在西元前 2500 年取材的地點,著實令人興奮。我們猜測撒森岩可能來自馬堡丘陵,但之前還無法確定,威爾特郡許多地區都有撒森岩,石材可能來自四面八方。」她表示,新證據反映出「建造者在此階段規劃縝密且考量周全」。

新研究結果也推翻了過往文獻假說,該假說認為其中一塊大型的「席爾石」(Heel Stone)為就地取材或早在其他石柱聳立前就已經在那兒。

17 世紀的英國自然哲學家約翰奧布里(John Aubrey)曾假設,奧佛頓森林(Overton Wood)與巨石陣之間可能有關係,奧佛頓森林可能是西伍茲的舊稱。葛瑞尼里說:「建造者想利用當時能找到最大且最耐用的石材,就近尋找也很合理。」

巨石陣的石材從何而來,一直是科學家想要搞懂的問題。圖/Photo © Pam Brophy (cc-by-sa/2.0)

-----廣告,請繼續往下閱讀-----

青石來歷,去年驗明

地質學家和考古學家長期以來知道,巨石陣中較小的「青石」(bluestones)來自威爾斯(Wales)西方的普萊西利群丘(Preseli Hills),離巨石陣約 200 公里處;然而,此論點直到去年才有確切的地質學研究佐證。

英國考古學家湯瑪斯(Herbert Henry Thomas)1923 年宣稱,青石源自威爾斯西部,但當年缺乏有力科學證據而遭學界質疑。

英國倫敦大學(UCL)考古學研究所教授皮爾森(Mike Parker Pearson)領導的科研團隊,利用地球化學分析石柱的元素組成,確認青石來自威爾斯西部,但並非湯瑪斯所說的 Carn Menyn 礦場,而是普萊西利群丘的 Carn Goedog 和 Craig Rhos-y-felin 採石場,研究結果 2019 年刊載於《古物》(Antiquity)期刊。

學界普遍認為,新石器時代的建造者利用人力和畜力拖拉,或以木製滾輪運送等方式搬運巨石,但運輸路線仍是個謎。納許說:「當時肯定費了一番功夫,巨石陣的建造石材來自不同地區。」納許表示,研究團隊未來企盼運用各種技術,進一步解答巨石陣石材運送路線等謎團。

-----廣告,請繼續往下閱讀-----
  1. Nash, D. J., Ciborowski, T. J. R., Ullyott, J. S., Pearson, M. P., Darvill, T., Greaney, S., … & Whitaker, K. A. (2020). Origins of the sarsen megaliths at Stonehenge. Science Advances, 6(31), eabc0133. DOI: 10.1126/sciadv.abc0133
  2. Pearson, M. P., Pollard, J., Richards, C., Welham, K., Casswell, C., French, C., … & Bevins, R. (2019). Megalith quarries for Stonehenge’s bluestones. Antiquity, 93(367), 45-62. DOI: 10.15184/aqy.2018.111
  3. 英格蘭遺產委員會
  4. Live Science:Returned chunk of Stonehenge solves long-standing monument mystery
  5. 路透 Scientists solve mystery of the origin of Stonehenge megaliths
  6. Science alert: We Finally Know Where The Megaliths of Stonehenge Really Came From
  7. 英國廣播公司 Missing part of Stonehenge returned 60 years on
-----廣告,請繼續往下閱讀-----
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia