0

0
0

文字

分享

0
0
0

又一個黑科技:由腦神經訊號直接轉譯出合成語音,成真啦!

活躍星系核_96
・2019/05/01 ・1344字 ・閱讀時間約 2 分鐘 ・SR值 470 ・五年級

-----廣告,請繼續往下閱讀-----

上周(4月24日)剛出爐,熱騰騰的「 Nature 」,有一篇論文「 Speech synthesis from neural decoding of spoken sentences 」(利用神經解碼技術對整句口語的語音合成),是由加州大學舊金山分校神經外科系的  Edward F. Chang  領導的研究團隊所發表。

在腦部植入電極,就可以讀出語音了?圖/pixabay

心領神會不是神話?

研究團隊與腦袋裡已經為了治療癲癇而植入電極陣列的病人合作,讓他們講數以百計的句子,利用植入的電極紀錄腦部活動,將句子的內容、說這些句子時發音器官(舌頭、嘴唇、下顎等)的運動模式、以及對應的大腦電訊號的紀錄,作為遞迴神經網路( recurrent neural network )的訓練資料集,然後讓受試者在心中默唸句子,再將此時記錄到的腦波輸入訓練好的神經網路。神經網路的不是直接輸出句子,而是由腦訊號先轉成「發音器官的運動」,再以這些器官的動作模擬出合成語音。

測試結果顯示,聽了 101 句由腦波直接轉譯的句子,測試者可以分辨出 70% 左右。

植入大腦中的電極陣列。圖/Nature News

物理學家史蒂芬‧霍金,因罹患漸凍人症,做了氣切手術無法說話,所以得靠語音輔助系統與別人溝通,必須一個字母一個字母輸入,然後合成語音,這種方式講話超慢,大約每分鐘只能講十個字,本研究可以達到正常講話的速度,每分鐘約 150 個字。

-----廣告,請繼續往下閱讀-----
因罹患漸凍人症,而必須依靠語音輔助系統才能表達的霍金。圖/wiki

過去類似的技術只能轉譯一個一個的單字,這次能夠說出整個句子,是技術上的一大突破。由於人工智慧輸出的不是變化繁複之極的人類語言,而是相對單純的發音運動,所以不需要太大的訓練資料集。

  • 你聽懂了嗎?由腦波轉譯的語音檔。音源:Nature News Credit: Chang lab, UCSF Dept. of Neurosurgery

鋼彈故事中的科技逐漸成真

鋼彈世界裡面的兩大不可思議黑科技:「米諾夫斯基粒子」,與能夠讀取駕駛員腦波,並增幅直接操控機體的「精神感應框體 Psycho Frame 」。上回講了米諾夫斯基核融合爐(只是內容物不含米諾夫斯基粒子);今天的報導告訴我們,距離製造出 Psycho Frame 與「強化人間」的日子又接近了一步!

獨角獸鋼彈Psycho Frame的暴走,不過這已經是超自然現象了,不是一般的Psycho Frame。圖/Sunrise, BANDAI
。

只是想起來有點恐怖的是,以前拷問俘虜的時候用的是嚴刑拷打與自白劑,有了這個技術,只要電極一接,腦袋裡想什麼就可以直接讀取,根本就是反烏托邦世界……

什麼?跟物理學無關?以電極讀取神經電訊號的神經電生理學、由發音器官運動模擬聲音的聲學,當然都是物理學啊!超有關的好不好!

資料來源

 

  • 本文轉載自東海大學應用物理系粉絲頁,歡迎追蹤!
文章難易度
活躍星系核_96
752 篇文章 ・ 122 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

0
0

文字

分享

0
0
0
人體吸收新突破:SEDDS 的魔力
鳥苷三磷酸 (PanSci Promo)_96
・2024/05/03 ・1194字 ・閱讀時間約 2 分鐘

-----廣告,請繼續往下閱讀-----

本文由 紐崔萊 委託,泛科學企劃執行。 

營養品的吸收率如何?

藥物和營養補充品,似乎每天都在我們的生活中扮演著越來越重要的角色。但你有沒有想過,這些關鍵分子,可能無法全部被人體吸收?那該怎麼辦呢?答案或許就在於吸收率!讓我們一起來揭開這個謎團吧!

你吃下去的營養品,可以有效地被吸收嗎?圖/envato

當我們吞下一顆膠囊時,這個小小的丸子就開始了一場奇妙的旅程。從口進入消化道,與胃液混合,然後被推送到小腸,最後透過腸道被吸收進入血液。這個過程看似簡單,但其實充滿了挑戰。

首先,我們要面對的挑戰是藥物的溶解度。有些成分很難在水中溶解,這意味著它們在進入人體後可能無法被有效吸收。特別是對於脂溶性成分,它們需要透過油脂的介入才能被吸收,而這個過程相對複雜,吸收率也較低。

-----廣告,請繼續往下閱讀-----

你有聽過「藥物遞送系統」嗎?

為了解決這個問題,科學家們開發了許多藥物遞送系統,其中最引人注目的就是自乳化藥物遞送系統(Self-Emulsifying Drug Delivery Systems,簡稱 SEDDS),也被稱作吸收提升科技。這項科技的核心概念是利用遞送系統中的油脂、界面活性劑和輔助界面活性劑,讓藥物與營養補充品一進到腸道,就形成微細的乳糜微粒,從而提高藥物的吸收率。

自乳化藥物遞送系統,也被稱作吸收提升科技。 圖/envato

還有一點,這些經過 SEDDS 科技處理過的脂溶性藥物,在腸道中形成乳糜微粒之後,會經由腸道的淋巴系統吸收,因此可以繞過肝臟的首渡效應,減少損耗,同時保留了更多的藥物活性。這使得原本難以吸收的藥物,如用於愛滋病或新冠病毒療程的抗反轉錄病毒藥利托那韋(Ritonavir),以及緩解心絞痛的硝苯地平(Nifedipine),能夠更有效地發揮作用。

除了在藥物治療中的應用,SEDDS 科技還廣泛運用於營養補充品領域。許多脂溶性營養素,如維生素 A、D、E、K 和魚油中的 EPA、DHA,都可以通過 SEDDS 科技提高其吸收效率,從而更好地滿足人體的營養需求。

隨著科技的進步,藥品能打破過往的限制,發揮更大的療效,也就相當於有更高的 CP 值。SEDDS 科技的出現,便是增加藥物和營養補充品吸收率的解決方案之一。未來,隨著科學科技的不斷進步,相信會有更多藥物遞送系統 DDS(Drug Delivery System)問世,為人類健康帶來更多的好處。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
197 篇文章 ・ 303 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

69
2

文字

分享

0
69
2
聲音的DNA:聲紋辨識
雅文兒童聽語文教基金會_96
・2023/01/14 ・2473字 ・閱讀時間約 5 分鐘

  • 文/洪萱眉 雅文基金會聽語科學研究中心 助理研究員

在如今這個網路時代,人人在日常生活中都常要透過帳號、密碼來辨識身份,不管是提款卡、行動裝置(手機、筆電、平板)、網路銀行、行動支付等,都需設定一組帳號密碼來辨識自己的身份。

為了不讓自己的帳號被駭,每次都得抓破頭來設定,太簡單擔心被破解,太複雜又怕自己記不住。更煩人的是,每個平台的密碼設定都有自己的規則,有些要求要有特殊符號,有些則要求英文大小寫和數字都要有。

於是,為了兼顧安全與便利性,越來越多廠商使用指紋辨識來解鎖,這樣既不用擔心忘記密碼,也不容易被盜用。然而,你知道,我們的聲音其實和指紋一樣,也能進行身份辨識嗎?

專屬個人的聲音密碼

每個人的聲音都有獨特性,和指紋一樣能進行身份辨識。圖/freepik

聲音跟指紋一樣,都有獨一無二的特定性,而在利用聲音的特性做辨識時,就稱為聲紋辨識。我們接到熟識親朋好友來電時,他們不用說他是誰,我們只要一聽到聲音就能辨識。這是因為每個人的說話特性不同,聽聲音就能辨識說話者。而我們的語音訊號中可供辨識的因素,主要可分為三個面向[1]

-----廣告,請繼續往下閱讀-----
  • 發音器官的差異:因每個人的發音器官差異,如口腔形狀、聲帶長短粗細不同,造成每個人的聲音特性有所不同。例如,當小朋友前排乳牙掉了時,說話時會有俗稱「漏風」的感覺,就是因為口腔的共鳴特性變了而造成的;而男生的聲帶比女生的要長且粗厚,振動頻率較低,因此聲音較低沈。
  • 說話方式的差異:每個人的說話習慣的不同,像是說話的語速、語氣、抑揚頓挫、咬字清晰度、口音等等。比如電話一接通,就聽到大聲又連珠炮似的說話,馬上就知道是樓上的王阿姨要找媽媽。或是一聽到緩慢溫柔充滿感情的台灣國語,就知道是阿嬤從台南打電話來了。
  • 說話內容的差異:生長背景、教育程度、社經地位的不同,使說話內容有所差異,例如:用詞、句型等等。像巷口賣水果的阿伯和他讀中文系的女兒,同樣要向顧客自賣自誇鳳梨有多甜,女兒也許會說「那甜蜜的滋味藏著一絲微微的酸,就像那年夏天的初戀」,阿伯則可能會說「帥哥偶謀騙你,這粒旺來跟我女兒的笑容一樣甜啦!」

上述的這些差異都可作為我們辨識說話者的依據。而其中說話方式和內容可能被他人學習、模仿,只有發音器官的差異是天生的,無法被模仿且在分析,所以許多辨識系統是採用發音的聲學特徵(acoustic features),例如,聲音頻率(高/低)、音色(如:輕柔、渾厚)等特性都可作為辨識的依據[1]

聲紋比對辨身分

聲紋辨識和指紋一樣,皆為生物辨識的一種。從人類的身上萃取出具有身份鑑別能力的特徵,如:指紋、聲音,將此特徵經處理、分析後儲在系統裡,日後可依據此特徵來辨識使用者的身份。利用我們獨特的聲音來辨識身份的聲紋技術,亦可稱為「語者辨認」或「說話人辨認」(speaker identification)[2]

聲紋辨識的過程包含兩個階段:1. 聲紋提取(voiceprint extraction)。2. 聲紋比對(voiceprint comparison)。在確認說話者的身分之前,要先有說話者的聲音語料,依說話者提供的聲音語料進行分析,並建立專屬他的聲紋模型

一般在處理語音訊號時,會將音檔切割成小區段的方式來處理、進行分析,透過聲譜圖上的資訊來分析說話者的聲音頻率、音強、抑揚頓挫等建立專屬他的聲紋模型,並將其聲紋資訊存到系統裡。就像將我們的指紋存到手機的系統裡一樣,可以比對我們登錄系統裡的生物資訊來進行身份的核對。

-----廣告,請繼續往下閱讀-----

當系統裡存有說話者的聲紋資訊後,其實就就能快速的進行一對一的說話者身份驗證(speaker verification),或是進行一對多的說話者辨認(speaker identification),從眾多人找出誰是說話者[3]

聲紋辨識不只可以抓犯人,還可以……

上述的聲紋辨識,是不是會讓你聯想到在看影集時,劇中的刑警從報案中心的人聲或是搜集回來的錄音檔中,辨識出報案人或犯人的身份。一般大家的印象會覺得聲紋辨識只會出現在刑事調查中,但其實日常生活中已經有用到聲紋來辨識身份囉!比如,智慧型手機的語音助理,只要說出關鍵詞:「嘿,Siri」、「OK Google」就能啟動AI回應。

其實,這個過程就是擷取聲音特徵,並與之前登錄的音檔互相比對,進行說話者的身份認證。除此之外,越來越多的金融機構也開始引進這項技術,憑聲音來確認身份,這樣除了可以取代回答冗長的問題來確認客戶身份、提高便利性外,也同時提高了安全性[4]

除了辨識身份,聲紋辨識其實也能應用在其他地方。現在也有許多研究團隊開發各種聲紋科技的應用,例如:透過大數據的聲音比對,由電腦判斷出鳳梨的好壞[5]、或是辨識青蛙叫聲的APP [6]等,這些也都是運用到聲紋辨識的原理。想必聲紋科技的發展會是一種趨勢,未來會有越來越多的場合都能運用此技術,讓我們拭目以待!

-----廣告,請繼續往下閱讀-----
現今生活中越來越多使用聲紋辨識技術。比如,現代人不可分開的智慧型手機,對手機的語音助理說出關鍵台詞,就能啟動AI的回應。圖/freepik

參考資料:

  1. 王小川。(2009)。說話人辨認。語音訊號處理(第二版,頁12-2 – 12-12)。全華圖書。清華大學電機系。淺談語者辨認http://web.ee.nthu.edu.tw/p/404-1175-11508.php?Lang=zh-tw
  2. Phonexia. (n.d). What Is Voice Biometrics?https://www.phonexia.com/knowledge-base/voice-biometrics-essential-guide/
  3. 緒方憲太郎。(2022)。語音科技將會如何改變未來。聲音經濟學(林詠譯,頁159-191)。商周出版。
  4. 洪明生、蘇晟維。(2022/12/11)。大數據聲紋比對判斷好壞 選鳳梨用「聽」的! Yahoo!新聞。取自:https://bit.ly/3Vrh2Hf
  5. 上游新聞市集。(2022/8/25)。現在是哪隻青蛙在叫?「蛙抵家」APP幫你聽聲認蛙!青蛙辨識軟體,揪你幫台灣錄蛙聲。取自:https://today.line.me/tw/v2/article/7NjZrr8
雅文兒童聽語文教基金會_96
55 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

673

29
5

文字

分享

673
29
5
一起寫下圓周率迎接 π day!你可以寫到第幾位?
PanSci_96
・2021/03/14 ・346字 ・閱讀時間少於 1 分鐘 ・SR值 450 ・四年級

「π 等於 3.14 」這個觀念在學生時期深植人心,平時我們加以運算也多是套用這個數字,更後面的位數便較少為人所記得 (。ŏ_ŏ)

一年一度的 3 月 14 日是圓周率日,它的確立首先由美國麻省理工學院倡議,到 2009 年美國眾議院正式通過將每年的 3 月 14 號設定為「圓周率日」(Pi day)。

3 月 14 日同時也是科學家愛因斯坦(Albert Einstein)和思想家卡爾.馬克思(Karl Marx)的生日,以及宇宙學家史蒂芬.霍金(Stephen Hawking)的忌日。

為了度過這個特別的日子,泛科學準備了一小活動!想和大家一起接力蓋樓慶祝 Pi day!

-----廣告,請繼續往下閱讀-----

參加方法如下:

1. 在本文底下留言任一數字進行接龍(你可以留了又留留了又留喔!)

2. 成功接到下一個數字的夥伴,留言框會出現藍色數字,表示你接到的位數

3. 接龍成功的科夥伴也有機會獲得我們的小獎勵ヽ(●´∀`●)ノ

現在已經來到小數點後 324 位囉!

共有 58 位科夥伴,用 672 則留言,一起寫下圓周率!
所有討論 673