讓機器人的「耳朵」更聰明

2013/10/30 | | 標籤:

新科技教導智慧型機器人聽懂語言之外的聲音。

撰文/蒙恩(Gregory Mone)
譯/周坤毅

lending-robots-an-ear_1

Image: Thomas Fuchs

在Siri這類語音辨識軟體幫助下,機器人已能分辨並回應人類語言,但即使是最聰明的機器人也難以理解語言之外的聲音。美國波士頓再思機器人公司的機器人專家羅瑪諾(Joseph Romano)表示:「這個問題看起來沒那麼難,但目前針對環境噪音的研究並不多,更遑論整合進入機器人的控制迴路中。」

現在羅瑪諾要讓機器人聆聽人類語言之外的其他聲音。他與賓州大學的同事合作開發一款名為「開源聽覺辨識機器人作業系統」(ROAR)的軟體,能讓研究人員訓練機器人對更廣泛的聲音做出反應。發表在《自動機器人》的論文指出,系統的主要硬體需求只有麥克風。

訓練開始前,機器人的麥克風得先錄下環境中的聲音,ROAR會將靜電噪音抹除,接著操作員重複單一動作(例如關門或讓智慧型手機的鬧鈴響起),以教導ROAR辨識並標記這個獨特的聲紋,最後程式再根據一系列的訓練聲紋,產生每個動作的聲音模型。

研究人員利用一具單臂機器人測試ROAR能否改善機器人執行特定工作的能力。在一項測試中,機器人得嘗試自動抓起並啟動電鑽。在缺乏聽覺回饋的狀況下,機器人在20次嘗試中只成功了9次,但藉由ROAR輔助後,成功機率提高了兩倍。如果機器人抓起電鑽後沒有聽到電動馬達的轉動聲,它便調整握法再嘗試一次。

下一步是設法讓這套系統在嘈雜環境中也能運作。將聽覺整合進入機器人的控制迴路中,配合視覺與觸覺反饋,未來能幫助機器人護士快速回應病患的呼救,或讓工廠機器人聽見設備故障並做出反應。儘管這項科技還在萌芽階段,羅瑪諾相信它的應用潛力無窮,他說:「我們甚至還未開始探索它的威力。」

SA原文:New Software Gives Robots the Gift of Hearing

刊載於《科學人》2013年第139期9月號


華人世界第一堂系統性地方創生課程

泛科學院《風土經濟學》線上課全台首賣

如何運用在地文化的元素,打造出獨一無二的「體驗經濟」? 洪震宇老師累積 10 年走訪各地的實務經驗,梳理出一套將在地風土文化資產轉化成地方特色產業「風土經濟學」模式。 想要投入鄉村振興、文化創意、地方創生的人,這是最值得投資的一門課!➡️ http://bit.ly/35tCFO5


泛科學院獨家新課募資 限量5折預購 🚀

【兒童基礎財商養成-家長篇:10堂課搞懂兒童理財教育】

孩子從 3 歲開始知道錢有支付的功能,5 歲之後孩子想要的東西越來越多。財商(FQ)即生活,這堂由泛科學院與布萊恩兒童商學院攜手共同企劃「兒童基礎財商養成-家長篇」線上課程,以家長的視角理解如何與孩子溝通金錢觀念!➡ http://bit.ly/2kMxsOV

關於作者

《科學人》雜誌-遠流出版公司於2002年3月發行Scientific American中文版,除了翻譯原有文章更致力於本土科學發展與關懷。

網站更新隱私權聲明
本網站使用 cookie 及其他相關技術分析以確保使用者獲得最佳體驗,通過我們的網站,您確認並同意本網站的隱私權政策更新,了解最新隱私權政策