Loading [MathJax]/extensions/tex2jax.js

1

18
1

文字

分享

1
18
1

放屁的聲音可以控制嗎?屁的聲響從何而來?——《一顆屁的科學》

時報出版_96
・2019/09/04 ・2744字 ・閱讀時間約 5 分鐘 ・SR值 527 ・七年級

歡迎來到羞羞物理學的領域

編按:本書作者專攻(?)肛道聲學(研究產自屁股、引發聲響的力學波)與括約肌專屬之流體力學,研究穿越肛門的氣體與液體移動。接下來有不少關於肛門與括約肌的討論,請做好心理準備。作者表示:「就一個沒念過醫學院的人而言,我研究過的肛門圖表應該是世界上最多的。」

聲音來自能製造許多壓力波的振動。人類只能聽見每秒發生一定次數的波動(頻率),範圍特別是介於每秒二十次的重低音(20Hz)和每秒兩萬次的極高音(20KHz),因此,一顆屁要被聽見,必定來自振動頻率在此範圍的某種東西。這東西就是你的肛門,說得更明確點是你的直腸外開口,由肛門內括約肌與肛門外括約肌這兩組環形肌肉牢牢控制著。氣體在直腸這處氣體與糞便儲存槽裡累積時,壓力隨之累積,你會感覺到屁意或便意,因為有一組輕巧細微的機械式受器會傳訊息到大腦,說:「留意後頭,朋友,大條的要來了。」

這些知覺很靈敏,因此你通常可以分辨是屁還是大便。當你決定放鬆肛門外括約肌時(肛門內括約肌是你無法控制的,只有外括約肌在你掌控中),受擠壓的氣體就能衝開一個小漏洞,穿過肛門。

但,為什麼屁氣釋放時肛門會振動,發出那要命的呸呸氣音呢?好,這是因為壓力與摩擦力的緣故。情況是這樣,括約肌打開一點縫隙讓屁出來,但就在氣體移動時,氣體也在屁流過的同時將肛門括約肌吸回來,部分是因為流速快使壓力降低,部分是因為氣流沿著括約肌周圍繞出,還有部分原因是有洞開啟,直腸裡的壓力稍微下降。因此洞會短暫關閉,但幾乎在關閉的同時,壓力又多一些,再度把洞推開,降低壓力後又關上,如此反覆形成快速打開又關上的動作。當這打開又關上的重複動作每秒發生至少二十次,恭喜中獎,你製造了在聽覺範圍內的長串壓力波,獲得一顆屁了!從這裡開始就會談到流體力學。很神奇,對吧?

當你的肛門排氣時打開/關上的頻率達到 20 Hz,你就獲得一顆屁啦!圖/時報出版提供

所以,直腸內高壓與屁從肛門衝出瞬間所創造的低壓進行對抗,打造出響屁。

-----廣告,請繼續往下閱讀-----

在屁流出時縮緊或鬆開括約肌也能讓你改變屁的響聲──將屁眼擠得愈緊,音調就愈高,因為這樣會增加直腸裡的氣體壓力──而括約肌愈緊,孔洞愈小,振動就愈快。

看來有點兩難是吧?將括約肌鬆得太開有可能會洩出一點便便(一般稱為水屁),而更糟的是完全不放屁。括約肌真是不聽話。

藉由控制括約肌,你可以創造娛樂效果,也能維繫自己與心儀對象的關係。比方說,如果天還沒亮你就驚醒了,感覺有股大砲即將引爆,可是又不想吵醒枕邊人,請先為空氣撇條做好準備,在氣體即將出來時,就把兩瓣屁股盡量掰開,這樣括約肌篤定張開著,無法振動產生那熟悉的刺耳聲,你的直腸氣逸出只會帶著潛力被浪費掉的一絲咻咻嘆息,你的床伴依舊無知是福的安然熟睡(當然啦,還得看看它荼毒嗅覺的程度)。後續氣流當然也要小心,但多數練過的放屁人都有辦法好好收尾的。同樣的情況,如果已經早上七點,太陽晒到你伴侶的屁股上了,請將自己屁股與括約肌收起,像琴弓一樣繃緊,再用全力一洩而出,早安!

放屁的白努利定律/寬德效應

丹尼爾.白努利(Daniel Bernoulli,1700-82)是瑞士物理學家兼數學家,出生於苛薄善妒又工於心計的科學世家。他在力學研究中的數學應用這方面特別有天分,以白努利定律聞名後世,該定律描述流體力學中的能量保留現象。聽起來很無聊,實際應用卻很有趣,這是汽車汽化器運作的基本原理,可能也解釋了屁在不同情況下會以不同壓力與速度行進的現象。

-----廣告,請繼續往下閱讀-----

白努利定律是這樣的:在運動的流體中,流動速度高的點承受壓力比較小。

氣體流入,減少流體壓力而增加動能,由圖中兩管水銀的高度差可以看出氣壓差異。圖/Wikimedia Commons

據稱能表現這個運動現象的典型科學演示就是讓乒乓球在吹風機的氣流中漂浮,或者我個人偏愛的做法是,用吹葉機讓沙灘球飄起來。有不少物理學家爭論這現象究竟與白努利原理相關,還是寬德效應所致,不過利用紋影光學(Sschlieren optics)這種漂亮的視覺呈現技巧來分析球體周圍的氣流,可以清楚顯現球離開中央氣流,移向一旁,和噴射器中間較快的氣流相比,外側氣流速度較慢,球正被吸-與推-回到中間。白努利原理適用於封閉系統,但是在這個例子也行得通。

屁也一樣,當它衝出括約肌時會產生低壓,將括約肌吸回關閉位置,括約肌之前打開放出屁時,壓力暫時減弱也有關係。

羅馬尼亞工程師寬德(Henri Coandǎ,1886-1972)當兵表現糟透了,幹工程師的工作則特別優異,自稱他製造的寬德 1910 是史上第一架噴射機(不過他同事及當時的人都不相信那是史上第一架)。他在空氣動力學下了功夫,發現噴射的流體傾向於貼緊在浮凸表面上,形成低壓區域,這個結論被稱為寬德效應,這是另一個,或許講得更好的一個,能用來說明為何海灘球會漂浮在氣流中央的基本原理。如果球飄離主要噴射氣流,外側氣流速度較慢,擾流也多(壓力較高),而在氣流中央的球體凸面上的空氣流速比較快(壓力較低),這樣一來,球會被吸(與推)回中央。挺複雜的,但相同的壓力變化也可能在你的括約肌邊緣上演。

如何建造由吹葉機驅動的超大響屁?

圖/時報出版提供

小事一樁。首先你需要巨大括約肌。

-----廣告,請繼續往下閱讀-----
  1. 從水槽下拿出橡膠手套,或者去買直徑一公尺的氣球(用這個特別適合)。如果是用手套,切掉手指與拇指部分,只留下手腕處的橡膠袖套。若是用氣球,就將氣球橫向切半(也就是不要縱切,不要切到吹口部分)。
  2. 拿到吹葉機後要小心,這玩意兒可以變得很危險。絕對、一定、萬萬不可朝著自己的臉。
    只要有一丁點砂石被吸進去,就可能毀掉你的眼睛。切記別這麼做。
  3. 把手套或氣球最細的一端拉開、套上吹葉機,用強力膠帶封好固定住。
  4. 戴上耳塞,或者戴著耳機,然後請朋友拿著吹葉機,自己以雙手抓好手套或氣球鬆開的那一端,將它拉住、張開以做好準備,站在它的某一側,別讓吹口對著你。
  5. 現在大聲叫你朋友啟動吹葉機,當空氣通過吹葉機暴衝而出,可拉著、鬆開這括約肌來調整聲音,從劈里啪啦響亮高音到恐怖片級女妖鬼叫,各種屁聲都行。
  6. 痛快地玩吧。

* 給某些物理達人讀者。流體力學有個關鍵原理稱為白努利定律:流體速度增加時,壓力會降低。但是,任何能力還不差的工程師都知道,這只適用於流線(流體在力場中的流動線條)當中。麻煩的是,一旦你的屁通過肛門內括約肌,到達肛門外括約肌並逸出成為開放狀態,要確定流線實際上的位置就變得複雜了。

本文摘自《一顆屁的科學》,2019 年 7 月,時報出版

-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 1
時報出版_96
174 篇文章 ・ 35 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik
  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
61 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

5
0

文字

分享

0
5
0
製作完美可麗餅的終極物理廚技
胡中行_96
・2022/07/04 ・1882字 ・閱讀時間約 3 分鐘

《論語》〈鄉黨〉裡,關於吃飯的規定,超—級—多—!!「食不厭精,膾不厭細。食饐而餲,魚餒而肉敗,不食。色惡不食,臭惡不食。失飪不食,不時不食。割不正不食,不得其醬不食。肉雖多,不使勝食氣。唯酒無量,不及亂。沽酒市脯不食。不撤薑食,不多食。祭於公,不宿肉。祭肉不出三日,出三日,不食之矣。食不語,寢不言。雖疏食菜羹瓜祭,必齊如也。」[1]吼~這麼囉嗦,有本事自己來啊!

有些男人激不得。

  

為了吃,您願意付出多少努力?圖/Monika Grabkowska

  

物理學家 Mathieu SellierEdouard Boujo 就因為前者的妻子提出挑戰,而用電腦運算出最佳烹調模型,還在 2019 年的《物理評論流體》(Physical Review Fluids)期刊上,分享成果,造福饕客。[2, 3, 4]全文第一句話,是這麼說的:「本論文研究固化流體薄膜,受制於複雜的運動學,在固體表面的流動…」,[5, 6]意思是「我們要教大家做可麗餅。

-----廣告,請繼續往下閱讀-----

  

完美可麗餅的定義

撇開二位科學家基於品味差異,而無法達成共識的餡料不談,[2]這個研究中,可麗餅的最高境界,被定義為「厚度均勻,無孔洞,且呈現完美圓形」。[6, 7]要在自家廚房,達成此終極目標,通常會遇上難題:當麵糊在鍋底鋪開,同時也會逐漸被煮熟。如果水平放置鍋子,麵糊便在平均地觸及鍋緣之前固化。為避免這個問題,一般有兩種常見的解決辦法:第一種是用刀具迫使麵糊在鍋中散開,類似刮刀塗層的動作;另個做法則是將鍋子傾斜旋轉,令麵糊往低處流動。[6]

  

運算製作可麗餅的模型

二位科學家採用「伴隨優化」(adjoint optimisation)的數學方法,描述流體在活動容器中的運動,模擬以最小施力,鋪出最平坦的可麗餅。[7, 8]其中考慮的因素,包含:以通過鍋子圓心的縱軸為中心運動;藉重力鋪開麵糊;以及隨溫度改變濃度的麵糊與旋轉中的鍋子的互動。[3]經過一番(讓人反胃的)計算過程,他們找到最佳的做法:先快速翻動鍋子,然後在煮的過程中,緩慢旋轉。[7]

-----廣告,請繼續往下閱讀-----

詳細的技巧,如下:一倒入麵糊,就馬上以陡峭的角度傾斜鍋子,把液體逼到邊緣。接著,手腕輕扭,轉鍋子一圈,確保麵糊完整鋪滿底部。在轉動的時候,傾斜的角度得逐漸縮小,轉速也隨著麵糊固化而趨緩。當覆蓋動作完成,鍋子也恢復水平狀態。[4, 7, 8]

圖中,深紅處麵糊最厚,深藍則最薄。可麗餅的製作流程,由左上開始,先向下,再依序往中、右二欄進行。[7]

起初濃厚的(紅色)麵糊被推向鍋子的右上緣,把稀薄的(淺藍)剩料拋在後頭。然而隨著順時鐘的轉動,麵糊逐漸勻稱地分佈於整個鍋底。[7]

圖/參考資料 6,figure 6

  

製作鬆餅的技巧,也受到科學家的重視。來源:參考資料 9

  

做鬆餅救眼疾

科學家們之所以對餅皮類食物的製作如此著迷,是因為類似的手法不僅能生產巧克力,幫智慧型手機螢幕鍍膜,[4]還可以懸壺濟世。2016 年倫敦大學學院(University College London)在 YouTube 上,也發佈了一個看似玩物喪志的作品。全長約 5 五分鐘的影片裡,前 4 分鐘幾乎都在以嚴謹的態度,講述鬆餅(此指 pancake,而非 waffle)的製作。到了最後卻話鋒一轉,道出製餅技術與眼疾治療的關係。原來手術中控制眼睛內部液體外流的皮瓣(surgical flaps),就要倚靠類似的原理來研發。[9]

救世的精神,於是賦予了科學家一個精進廚藝的學術使命。

  

-----廣告,請繼續往下閱讀-----
  1. 論語/鄉黨第十(維基文庫)
  2. Making the Perfect Crêpe (APS Physics, 2019)
  3. The hard-hitting science behind crepes and beauty pageants (Chemical & Engineering News, 2019)
  4. Using fluid dynamics to perfect crêpe cooking techniques (Phys.org, 2019)
  5. Boujo E and Sellier M. (2019) ‘Pancake making and surface coating: Optimal control of a gravity-driven liquid film’. Physical Review Fluids, 4, 064802.
  6. Boujo E and Sellier M. (2019) ‘Pancake making and surface coating: Optimal control of a gravity-driven liquid film’. arXiv
  7. Physicists Think They’ve Finally Found the Trick to Making Perfect Crepes (Science Alert, 2019)
  8. A computer model explains how to make perfectly smooth crepes (Science News, 2019)
  9. Understanding the physics of pancakes to save sight (University College Lodon on YouTube, 2016)
-----廣告,請繼續往下閱讀-----
胡中行_96
169 篇文章 ・ 67 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。