0

0
0

文字

分享

0
0
0

又一個黑科技:由腦神經訊號直接轉譯出合成語音,成真啦!

活躍星系核_96
・2019/05/01 ・1344字 ・閱讀時間約 2 分鐘 ・SR值 470 ・五年級

-----廣告,請繼續往下閱讀-----

上周(4月24日)剛出爐,熱騰騰的「 Nature 」,有一篇論文「 Speech synthesis from neural decoding of spoken sentences 」(利用神經解碼技術對整句口語的語音合成),是由加州大學舊金山分校神經外科系的  Edward F. Chang  領導的研究團隊所發表。

在腦部植入電極,就可以讀出語音了?圖/pixabay

心領神會不是神話?

研究團隊與腦袋裡已經為了治療癲癇而植入電極陣列的病人合作,讓他們講數以百計的句子,利用植入的電極紀錄腦部活動,將句子的內容、說這些句子時發音器官(舌頭、嘴唇、下顎等)的運動模式、以及對應的大腦電訊號的紀錄,作為遞迴神經網路( recurrent neural network )的訓練資料集,然後讓受試者在心中默唸句子,再將此時記錄到的腦波輸入訓練好的神經網路。神經網路的不是直接輸出句子,而是由腦訊號先轉成「發音器官的運動」,再以這些器官的動作模擬出合成語音。

測試結果顯示,聽了 101 句由腦波直接轉譯的句子,測試者可以分辨出 70% 左右。

植入大腦中的電極陣列。圖/Nature News

物理學家史蒂芬‧霍金,因罹患漸凍人症,做了氣切手術無法說話,所以得靠語音輔助系統與別人溝通,必須一個字母一個字母輸入,然後合成語音,這種方式講話超慢,大約每分鐘只能講十個字,本研究可以達到正常講話的速度,每分鐘約 150 個字。

-----廣告,請繼續往下閱讀-----
因罹患漸凍人症,而必須依靠語音輔助系統才能表達的霍金。圖/wiki

過去類似的技術只能轉譯一個一個的單字,這次能夠說出整個句子,是技術上的一大突破。由於人工智慧輸出的不是變化繁複之極的人類語言,而是相對單純的發音運動,所以不需要太大的訓練資料集。

https://www.nature.com/articles/d41586-019-01328-x
音訊播放器
  • 你聽懂了嗎?由腦波轉譯的語音檔。音源:Nature News Credit: Chang lab, UCSF Dept. of Neurosurgery

鋼彈故事中的科技逐漸成真

鋼彈世界裡面的兩大不可思議黑科技:「米諾夫斯基粒子」,與能夠讀取駕駛員腦波,並增幅直接操控機體的「精神感應框體 Psycho Frame 」。上回講了米諾夫斯基核融合爐(只是內容物不含米諾夫斯基粒子);今天的報導告訴我們,距離製造出 Psycho Frame 與「強化人間」的日子又接近了一步!

獨角獸鋼彈Psycho Frame的暴走,不過這已經是超自然現象了,不是一般的Psycho Frame。圖/Sunrise, BANDAI
。

只是想起來有點恐怖的是,以前拷問俘虜的時候用的是嚴刑拷打與自白劑,有了這個技術,只要電極一接,腦袋裡想什麼就可以直接讀取,根本就是反烏托邦世界……

什麼?跟物理學無關?以電極讀取神經電訊號的神經電生理學、由發音器官運動模擬聲音的聲學,當然都是物理學啊!超有關的好不好!

資料來源

 

  • 本文轉載自東海大學應用物理系粉絲頁,歡迎追蹤!
-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik
  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
-----廣告,請繼續往下閱讀-----
雅文兒童聽語文教基金會_96
60 篇文章 ・ 223 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

673

29
5

文字

分享

673
29
5
一起寫下圓周率迎接 π day!你可以寫到第幾位?
PanSci_96
・2021/03/14 ・346字 ・閱讀時間少於 1 分鐘 ・SR值 450 ・四年級

-----廣告,請繼續往下閱讀-----

「π 等於 3.14 」這個觀念在學生時期深植人心,平時我們加以運算也多是套用這個數字,更後面的位數便較少為人所記得 (。ŏ_ŏ)

一年一度的 3 月 14 日是圓周率日,它的確立首先由美國麻省理工學院倡議,到 2009 年美國眾議院正式通過將每年的 3 月 14 號設定為「圓周率日」(Pi day)。

3 月 14 日同時也是科學家愛因斯坦(Albert Einstein)和思想家卡爾.馬克思(Karl Marx)的生日,以及宇宙學家史蒂芬.霍金(Stephen Hawking)的忌日。

為了度過這個特別的日子,泛科學準備了一小活動!想和大家一起接力蓋樓慶祝 Pi day!

-----廣告,請繼續往下閱讀-----

參加方法如下:

1. 在本文底下留言任一數字進行接龍(你可以留了又留留了又留喔!)

2. 成功接到下一個數字的夥伴,留言框會出現藍色數字,表示你接到的位數

3. 接龍成功的科夥伴也有機會獲得我們的小獎勵ヽ(●´∀`●)ノ

現在已經來到小數點後 324 位囉!

共有 58 位科夥伴,用 672 則留言,一起寫下圓周率!
-----廣告,請繼續往下閱讀-----
所有討論 673
PanSci_96
1262 篇文章 ・ 2408 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

1

2
2

文字

分享

1
2
2
在所有可能性中尋找不存在黑洞的宇宙——《時空行者 史蒂芬.霍金》
大塊文化_96
・2020/11/07 ・3096字 ・閱讀時間約 6 分鐘 ・SR值 552 ・八年級

-----廣告,請繼續往下閱讀-----

為了解決資訊遺失的問題,霍金設想以一種特殊的方式,把一大群粒子集中射向同一個地方,這樣,當它們相遇時,它們將具有足夠的物質和能量去形成一個黑洞。然後,他研究在理論上,所有這些粒子發生交互作用後可能出現的情況。

2004 年,霍金決心要解決對於黑洞資訊悖論的賭注。圖/Wikimedia common

他在都柏林演講中說:「人們從無窮遠處(即,很遠的地方)發出粒子和輻射,再回去測量無窮遠處發生了什麼事。」「人們永遠不會在中間(發生複雜交互作用的地方)去探測場的強度。」

儘管概念很簡單,但分析過程卻很複雜。為了做到這一點,霍金使用了費曼的方法:歷史總和法。記住,造就某一個可測量到的結果,背後都有無限多種可能的歷史途徑,而費曼的方法是要求你把這所有可能的歷史途徑全部加總起來:對於你正在研究中的系統的所有粒子,每個粒子可能出現「歷史」軌跡。

福爾摩斯說:「在排除所有可能性後,剩下的無論多麼不合乎情理,那就是真相。」是歷史總合法的一種解釋。圖/pixabay

在追蹤碰撞過程中可能發生的演變時,霍金說,儘管絕大多數可能的歷史都會被包含進黑洞形成的過程,但有少數的歷史軌跡是不會有黑洞形成的。霍金說,這是他的主要頓悟。「我將證明資訊可以透過這種可能性而保留下來」,他說。

-----廣告,請繼續往下閱讀-----
霍金提出的概念很簡單,背後計算過程卻很複雜。圖/stephen hawking

在那些沒有形成黑洞的歷史軌跡中,顯然不會發生黑洞資訊遺失的現象,因此,他大部分的談話內容都集中在論證,當我們把所有的歷史以費曼總和法相加時,這一小部分的歷史子集合將使得資訊可以復原:資訊透過未形成黑洞的歷史軌跡,而偷偷潛逃回來。

當然,這個簡單的邏輯背後的數學計算可以困難到是一場噩夢,而且讓霍金得出這個結論的計算過程有點神秘。

就某方面而言,為了能夠進行數學運算,霍金必須做出的幾個可疑的近似值,可謂是「極大的簡化」。他在演講中介紹了這些內容,而且承諾稍後將會把所有的細節寫成論文發表。

在描述了他的想法之後,霍金承認他賭輸了。他宣布自己錯了,資訊不會遺失,而且公正性和量子理論都是有效的。他向普雷斯基爾獻出了他應得的賭注:一套「可以從中隨意回收資訊」的百科全書。

研討會結束後,與霍金站在同一立場、認為資訊會遺失的索恩,拒絕遵循霍金的想法與認輸。「從表面上看,這是一個可愛的論點。」索恩說:「但是我還未看到細節。」普雷斯基爾接受了霍金的認輸與百科全書,但他也沒有接受霍金的論點。「說實話,」他說:「我聽不懂他所說的內容。」他說:需要看到更多細節,我才能被說服。

他們的反應是物理學家的典型反應。無論是贊成或反對霍金的人,都在等待他的細節。以前的霍金應該可以提供這些細節,但「新的霍金」卻認為他沒有足夠的時間去堅持嚴謹性的問題,他並沒有實際上去計算這些細節。

-----廣告,請繼續往下閱讀-----

他提出了自己的想法,然後把它分配給一名研究生,在他的監督下去進行這份艱巨的計算。不幸的是,這位學生還沒完成這份工作。索恩說:「他不是一個強到可以嚇人的學生。」

在霍金報名參加都柏林的研討會時,當時所完成的計算已經夠多,讓他有信心認為這個想法會成功。然而,證明它真正可行的研究成果,卻從未完成,但對霍金而言,他對這個答案深信不疑,因此,他不願意再花費自己在這個地球上的有限時間去對此進行補救。所以,他在都柏林會議上那段籠統含糊的演講,以及發表在該研討會論文集裡的摘要短文,就是他對這個所表達過的全部想法與意見。

在研討會上,霍金發表他對於黑洞資訊的想法。圖/Pixabay

霍金的這場演講以及他認輸的宣言,立刻成為全球的頭版新聞,但這僅僅是一場媒體秀,算是小題大作。在他發表這段演講時,幾乎所有物理學家都已經開始相信,這些資訊並沒有遺失,但是包括霍金本人在內,沒有任何人可以證明這一點。而對於那些尚未得出結論的人來說,也沒有人因為霍金的一席話,就開始跟著他而改變想法。

看到「標籤的力量」實在令我驚訝。在霍金成名之前,陌生人有時會根據他的外表而把他看成是一個身心都有缺陷的人,而不自覺地把視線移開。但是,一旦他被宣稱為是「現代愛因斯坦」,媒體則開始大量報導他所說過的任何事情。

-----廣告,請繼續往下閱讀-----
都柏林的研討會因霍金的參加,吸引許多媒體前來。圖/giphy

如果沒有他這麼一位出名的人物來參加這次的都柏林會議,那麼這將會是一場絕佳的思想漩渦,讓物理學家圍繞著這個話題進行深度討論,但是卻不會在任何報紙上出現相關報導。然而,由於有了霍金,所以這次的談話就成了一場媒體圈的「大拜拜」。

對於霍金本人來說,他的這項轉變算是一個重大時刻,甚至是一個歡樂的時刻。

對於大多數人來說,自己證明自己犯了錯,大概不會成為是件值得開香檳慶祝的事,但是,就像澤爾多維奇終於弄懂了霍金輻射的感覺一樣,霍金最為關心在意的事情始終是真相,他為了解了自己原本不了解的某件事而感到高興,特別這又是一件對物理學而言非常重要的事。

今天,距離都柏林那場研討會已經十五年了,距離霍金發現霍金輻射更是超過四十年了,相信資訊會遺失的人愈來愈少了。誠如霍金所言:幾乎所有的物理學家都相信,「如果你跳入黑洞裡,你的質能 (mass energy) 將會回歸到我們的宇宙裡」,儘管會是以一種殘破的形式,但是仍會「包含著關於你先前狀態的資訊」。儘管我們認為資訊不會丟失,但是仍然沒有確切的解釋可以說明實際發生的情況。

2015 年,霍金在斯德哥爾摩海濱會議中心舉行的演講。圖/Wikimedia common

除了霍金提出的方案之外,還有非常多的各式各樣理論,數量之多,讓物理學家撰寫評論文章時,已經不會列出個別理論,只會列出不同的理論類別而已,而每個類別都還包含許多不同的變體。轉換過立場的霍金所堅持的立場,與大多數人所認同的觀點一致,但未必與他最初的原始想法相同—他仍持續在研究可以得出這一結論替代性理由。

-----廣告,請繼續往下閱讀-----

雖然是斷斷續續,但是直到他過世之前,他都沒有放棄對這個問題的研究。而這也成為他最後一篇物理學術論文的主題,該論文於二○一八年在霍金辭世之後發表。

-----廣告,請繼續往下閱讀-----
所有討論 1
大塊文化_96
11 篇文章 ・ 13 位粉絲
由郝明義先生創辦於1996年,旗下擁有大辣出版、網路與書、image3 等品牌。出版領域除了涵括文學(fiction)與非文學(non-fiction)多重領域,尤其在圖像語言的領域長期耕耘不同類別出版品,不但出版幾米、蔡志忠、鄭問、李瑾倫、小莊、張妙如、徐玫怡等作品豐富的作品,得到讀者熱切的回應,更把這些作家的出版品推廣到國際市場,以及銷售影視版權、周邊產品的能力與經驗。