Loading [MathJax]/extensions/tex2jax.js

0

1
0

文字

分享

0
1
0

喜歡教書、喜歡台灣自由的研究學風 ,要讓語音助理「賈維斯」成真——陳縕儂專訪

Suzuki
・2019/12/11 ・2748字 ・閱讀時間約 5 分鐘 ・SR值 460 ・五年級

-----廣告,請繼續往下閱讀-----

「其實我已經不是最年輕的老師了!」陳縕儂笑著說,臺大資工系已經有比她更年輕的老師了,不到30歲就回臺任教不算少見。至於外界好奇她為何捨棄微軟千萬年薪工作回臺大當教授,她的答案很簡潔就是「喜歡」。

陳縕儂在四年半拼完博士,回台任教是當時臺大最年輕的教授之一(圖片提供/陳縕儂)。

喜歡教書、喜歡台灣自由的研究學風,做自己喜歡的事情比較重要。陳縕儂有著不隨波逐流的精神,十年前她選擇「語音辨識」作為研究領域時,資訊界盛行的研究是網路搜尋系統。

就讀研究所時,她跟著李琳山老師做語音辨識系統,當時在訓練機器做錄音和影片中的自動關鍵字擷取,主要是讓機器單向理解人類語言,後來至卡内基梅隆大學攻讀博士,開始做雙向的對話系統,機器不只要理解你說什麼,還要回應、給予相關的協助。

她的目標是讓機器成為鋼鐵人語音助理「賈維斯」(Jarvis)一樣,不只跟你說話,還會幫完成你交辦的訂機票、分析報表等一切任務。隨著深度學習演算法提出,這件事在將來變得可能。

-----廣告,請繼續往下閱讀-----

不過,現階段開發的語音助理Siri或Alexa都離Jarvis還有段距離。陳縕儂表示,訓練語音助理的一切事宜,包括:語言理解、自然語言處理、對話系統和機器智慧,都是她的研究範圍。

訓練一位Jarvis要克服哪些問題呢?現在就讓陳縕儂為我們解答吧~

和機器聊天有何困難?

你有沒有發現使用Siri時,常常話不投機半句多,更別說要幫忙處理訂車票、推薦飯店等雜事了。陳縕儂表示,機器要做到可以對話及像真人般的助理服務,從麥克風收音、語音轉成文字、語意理解,最後到協助擷取有用的資訊,每一步都是難關。


Siri是大家常接觸的語音聊天機器人,但它的功能還不算完備(圖片提供/Wikipedia)。

雖然「神經網絡」架構提升語音辨識之準確度,但比起影像辨識或單純語意理解,對話困難許多,因為每句話都有關聯性,百種人有百種答案,而百種答案可能也有百種的回應方式,因此傳統單純塞資料給機器的學習法是行不通的。

-----廣告,請繼續往下閱讀-----

陳縕儂表示,要克服這個難題,通常會設計兩台機器,將所有使用者的問題灌入機器中,一台機器當客服人員、一台機器當顧客開始互動,互動一段時間開放真人互動,想辦法讓互動變得更順暢,這是現行最好的方式了。

假使機器與人類可以對答如流,下一步面臨的問題就是機器能不能幫你辦事,當你跟他說「想去東京玩」時,他不會打哈哈叫你搭飛機去東京,而是能依據你的需求,提供你機票、住宿和旅遊景點的建議。

這下可就複雜了,試想你若是個旅行專員,除了回答自己已知的事項,如:旅遊注意事項、服務內容說明,還需要將各地的旅遊景點、飯店和餐廳資訊倒背如流,這對機器來說就得去找自己資料庫外的內容,可能是看完google的資訊或旅遊雜誌,才能回應客戶的需求。

結構化資料與非結構化資料的比較圖(圖片提供/陳縕儂)。

陳縕儂表示,語音助理若要成為Jarvis必須要擅長處理結構化(structured data)和非結構化(unstructured)兩種類型的數據資料。結構化數據是指已經整理成表格的資料,有欄位和數據,可立即做數據分析,這類似語音助理已經內建、整理好的資料庫,提到相關問題可以立即回覆,不需要額外找資料。

-----廣告,請繼續往下閱讀-----

然而,大部分的資料都是非結構化資料,像是文字、圖片、網頁和影片等,因此如何快速將沒結構化的資料結構化就是挑戰,這將大大影響機器人提供服務的速度與品質。陳縕儂坦言,目前這兩部分都做得不夠完善,因此她的研究會朝這部分努力。

遇到口音問題怎麼辦?

讓機器成為個人助理之前,更根本的是解決「聽不懂人話」問題,不同的口音確實常讓機器混肴,若把「台式餐廳」聽成「泰式餐廳」,助理找出來的東西就完全不同了!

因此,語音辨識得考慮聲音的錯誤,人才能順暢地與機器對話。陳縕儂表示,她是以跟BERT類似的GPT-2架構來做預訓練模型。概略來說,就是訓練機器學習語言的架構,然後讓機器會根據語音的內容去推估後面兩個字,這部分從Siri轉成文字很像,能依據你講的內容選字。

此時,再把語音的差異納入考量,並將發音相似的字像是「泰、台」調整為同個向量,使得機器得以辨識類似的發音,當機器判讀可能發生誤聽的狀況時,便能再次向使用者確認。

-----廣告,請繼續往下閱讀-----

不過陳縕儂坦言,這並不容易,因為聲音資料取得困難,大部分拿到的都是文字資料,再加上機器會算出最合適的語詞和句子結構,所以不同選字會影響後面的詞彙選取,「如何讓機器辨析口音問題」就是個挑戰。

熱愛教學 實踐夢想

語言理解、對話系統和機器智慧是很廣泛的領域,不缺研究主題,陳縕儂認為自己很幸運搭上這股熱潮,且最終回到研究自由度高的台灣繼續努力,她一點都不覺得捨棄微軟工作很可惜。

「教學是很快樂的事情!」她笑說,把自己會的東西交給學生,看到學生從不懂到成為專家,可以跟妳一起討論研究問題,是一件無比有成就感的事。

找一找陳老師在哪裡?陳縕儂表示,跟學生一起學習成長,比待在微軟的研究部門更快樂(圖片提供/陳縕儂)。

今年初,陳縕儂帶領臺大團隊在科技部「科技大擂台:與AI對話」比賽拿下冠軍,成績甚至超越華碩電腦達文西實驗室。她形容這是場艱難的馬拉松,從初賽、複賽至決賽比了快一年,決賽題目比照「華語文能力測驗」,機器在比賽現場得聽完一段文章和選項,並選出正確答案,除了選擇題,還有簡答題。

-----廣告,請繼續往下閱讀-----

陳縕儂笑說,學生為了訓練機器、調整類神經網絡,以及整合成一個系統熬了無數個夜,這對學生和她來說是個難得的體驗,目前團隊決賽成績是1000題中拿下約54%的正確率,希望未來能再提高,讓機器的成績有機會超過人類。

陳縕儂老師與李宏毅老師帶領臺大資工系學生在今年「科技大擂台:與AI對話」比賽拿下冠軍(圖片提供/陳縕儂)。

很多學生覺得自己不夠聰明,沒辦法學好code,陳縕儂認為,聰明確實可以幫你快速掌握code的規則,但是多練習也可以補足,它不會像物理或數學一樣轉不過來就是沒辦法。

她坦言,自己博班時也很拼,一部分是課業負擔重,一部分則是想縮短臺美遠距離戀愛的時間,所以硬是在四年半拼完博士。每天只睡四、五個小時,一睜開眼就坐在電腦前打code,「不過該玩的還是有玩,我是寧可犧牲睡眠,也要玩到的人!」

陳縕儂表示,她比其他人幸運,能一路延續研究旨趣,選到自己熱愛的研究主題。她建議國高中課程可以提早將寫程式納入課程中,這就像Excel和輸入法一樣是未來必備的技能,從中學生也可以挖掘未來志趣,對資訊科學有興趣的,就一起進來努力吧!

-----廣告,請繼續往下閱讀-----
陳縕儂認為玩樂與課業應該並重,生活才會多采多姿,圖為她與指導教授在卡内基梅隆大學的合影(圖片提供/陳縕儂)。
-----廣告,請繼續往下閱讀-----
文章難易度
Suzuki
18 篇文章 ・ 0 位粉絲
超純社會組學生,對未知的一切感到好奇,意外掉入科技與科學領域,希望在猛點頭汲取知識的同時,也能將箇中妙趣分享給大家。

0

0
0

文字

分享

0
0
0
翻越性別高牆 打破生乳營養迷思 埃凡斯促成牛奶滅菌(2)
顯微觀點_96
・2024/08/13 ・2351字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自顯微觀點

顯微鏡後的女性科學家系列

他像是一艘船在河中航行;四處遇到阻礙,唯獨一面通暢;在那,所有的障礙都消失了,他徐徐地穿越著深深的航道,進入無盡的海洋。

——愛默生

埃凡斯在動物工業局的研究興趣集中到一種致流產的傳染性微生物。

丹麥獸醫伯納.班(Bernhard Bang) 在 19 世紀末發現了一種導致乳牛流產的病菌,而這種病菌多年來已知存在於受感染的乳牛乳房中。

而農業工業局病理部的施洛德(Schroeder) 和卡登(Cotton)在 1911 年從看似健康的牛隻的牛奶樣本中分離出這種病菌;幾乎同時,另一組研究人員史密斯(Theobeld Smith)和費比恩(Febyen)也在 1912 年從牛奶中分離出同樣的病菌。因此埃凡斯開始思索這類致牛隻流產的病菌是否也會導致人類生病。

-----廣告,請繼續往下閱讀-----

與此同時,蘇格蘭病理學家布魯斯(David Bruce)分離出了會使人類發燒和肌肉疼痛的波浪熱(或稱馬爾他熱,Malta fever)的病菌,且發現可透過羊奶傳染給人類。

當時的科學家都認為透過羊奶傳染給人和導致牛流產的是不同的病菌。透過羊奶傳染馬爾他熱的是羊微球菌;引起牛流產的則是流產芽孢桿菌。

但埃凡斯透過觀察,認為這兩種來源的細菌形態相似:這些細胞呈桿狀,但有不同的長度;有些細胞很短,在顯微鏡下看起來呈球形。

經過細菌鑑定以及將病菌接種在動物身上的對比試驗,埃凡斯推斷這兩者其實是同一種桿菌,並將這些發現於 1917 年 12 月在美國細菌學家協會(the Society of American Bacteriologists)年會上報告,並發表於 1918 年 7 月的《傳染病雜誌》(The Journal of Infectious Diseases)。而後來為紀念首先研究這病症的布魯斯,這個病原菌被定名為「布氏桿菌」(Brucella abortus)。

-----廣告,請繼續往下閱讀-----

同時埃凡斯基於研究發現也提出質疑:「我們是否確信,人類不會因為飲用生牛奶而偶爾發生腺熱(glandular fever)、流產或可能的呼吸道疾病?」

Alice Evans 1945。圖片來源:wiki

避免人畜傳染 推動牛奶滅菌

1864 年,法國生物、化學家.巴斯德(Louis Pasteur)描述了如何透過加熱保存液體的系統,也就是巴氏殺菌。但當時這樣的滅菌法應用於葡萄酒或啤酒,而不是牛奶,因為人們認為牛奶只要不被污染就是安全的。

當時牛奶的問題在於變質的速度。過去,有些乳牛場為了解決變質,會建在城市,以縮短生產和消費之間的時間;而有些則使用摻假物,例如碳酸氫鹽、糖、糖蜜甚至粉筆,來掩蓋乳品腐敗的狀況。

對於埃凡斯提出喝生牛乳可能致病的質疑,不但未被採納,還遭到其他科學家、醫師和酪農業等各界的批判。

-----廣告,請繼續往下閱讀-----

一來是科學家普遍相信發現結核菌的德國生物學家柯霍(Heinrich Hermann Robert Koch)所提出的觀點:同一種病菌會同時造成動物與人類的共同疾病。

柯霍曾在 1901 年提出儘管結核病是牛隻常見的疾病,產出的牛奶含有大量的「結核菌」,但這種牛型結核病不會傳染給人。

他說,如果牛結核桿菌能夠感染人類,就會出現很多病例,尤其是脆弱的兒童;但大多數醫護人員認為案例數並不多並非如此。他甚至認為,採取措施保護人類免受牛結核病的侵害是不明智的。

二來是科學家們不相信埃凡斯這樣沒有博士學位的女性,能提出如此「重大的發現」。對酪農和乳製品業而言,埃凡斯則被認為在圖利巴氏殺菌設備。

-----廣告,請繼續往下閱讀-----

所幸,埃凡斯的發現在 1920 年後陸續得到梅耶(Karl Friedrich Meyer)等人的研究支持,被認為是可信的科學發現。 美國衛生局(USPHS)也從 1924 年開始制定了一項名為《標準牛奶條例》(Standard Milk Ordinance)的示範法規,由州和地方掌控乳製業機構自願採用。之後又陸續頒布行政和技術細節,修改成 A 級巴氏滅菌牛奶條例(Grade A Pasteurized Milk Ordinance),提供全國統一的牛奶衛生標準。

重要貢獻鼓勵後進女科學家

為了表彰埃凡斯的成就,美國細菌學家協會(現為美國微生物學會,the American Society for Microbiology,ASM)於 1928 年推舉她成為首位女性主席。

然而儘管有豐富的實驗室經驗以及預防措施,但埃凡斯仍在 1922 年感染布氏桿菌,並在往後幾年反覆發作。她曾在回憶錄中提到,「完全喪失能力和康復的時期交替出現,最後一次致殘的病情惡化發生在 1943 年夏天,距感染之日已近 21 年」。

更慘的是,當時對疾病沒有夠多的認識,因此她和其他布氏桿菌患者一樣,被診斷為「神經衰弱」,認為這些症狀是被幻想出來的,被誤解為騙子,是在「詐病」。但埃凡斯說,慢性症狀方面的經歷使她有機會親眼觀察這種疾病及其影響。

-----廣告,請繼續往下閱讀-----

不過她也漸漸將研究目光轉向溶血性鏈球菌,一直致力於此直到 1945 年退休。1975 年 9 月 5 日埃凡斯於維吉尼亞州亞歷山大市逝世,享年 94 歲。她的墓誌銘刻著::「溫柔的獵人,追趕並馴服她的獵物,穿越到了新的家園」。

雖然埃凡斯並未取得博士學位,又曾因女性身分導致科學發現不被認可。但美國微生物學會於1983年為表彰埃凡斯在微生物學領域的參與以及傑出貢獻,設立了「埃凡斯獎」(The Alice C. Evans Award),以表揚後進致力於微生物科學領域的女性。

查看原始文章

推薦閱讀

顯微鏡後的女性科學家:甘居配角仍不減貢獻 微生物學家安娜‧威廉斯

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

顯微觀點_96
26 篇文章 ・ 5 位粉絲
從細微的事物出發,關注微觀世界的一切,對肉眼所不能見的事物充滿好奇,發掘蘊藏在微觀影像之下的故事。

0

1
1

文字

分享

0
1
1
翻越性別高牆 打破生乳營養迷思 埃凡斯促成牛奶滅菌(1)
顯微觀點_96
・2024/07/24 ・1686字 ・閱讀時間約 3 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自顯微觀點

顯微鏡後的女性科學家系列

顯微鏡學的蓬勃發展,不僅促進了醫學﹑公共衛生的發展,而在這背後也有許多偉大的女性科學家參與其中。

屏東縣九如鄉一處養羊場有 3 頭羊確診「布氏桿菌病」,為台灣約 30 年來首例,動防所已撲殺感染羊隻並進行消毒。由於「布氏桿菌」為人畜共通傳染病,衛福部疾病管制署匡列 4 名牧場員工…。2023 年 12 月 9 日報導

由於乳製品滅菌的觀念普及,現在已很少聽聞布氏桿菌感染。這都得歸功於首先發現經由飲用感染布氏桿菌的生牛乳而導致人類得馬爾他熱,進而促成乳品全面巴氏消毒的細菌學家艾莉絲.埃凡斯(Alice Catherine Evans)。

Alice C Evans。圖片來源:PICRYL public domain

從偏鄉教師到微生物學家

埃凡斯的祖父 1831 年從英國威爾斯移民至美國,她於 1881 年 1 月 29 日出生在美國賓州尼斯威爾斯社區的一戶農家。

-----廣告,請繼續往下閱讀-----

埃凡斯在出生地念中小學,因當地沒有高中,她到了賓州托旺達(Towanda)的薩斯奎漢納學院(Susquehenna)就讀。1901 年畢業後,進入大學就讀的夢想因家裡無法負擔而破碎,且當時小學教職幾乎是唯一對女性開放的非基層勞力職業,因此她沒有多想就進入一所小學擔任 1 至 4 年級的教師。

她在家鄉和外地的小學共教了 4 年書後,得知有康乃爾大學農學院提供偏鄉教師免學費的自然科學課程。當時康乃爾大學的農學院院長貝利(Liberty Hyde Bailey)希望藉由受過訓練的教師,培養學生對大自然的熱愛、對植物和動物以及無生命世界的興趣。

埃凡斯申請了這項計畫,並用她四年教書的積蓄來到康乃爾大學,並選擇細菌學作為研究領域,指導教授是研究乳製品的微生物學家史托金(William A. Stocking)。

1908 年她獲得康乃爾大學農學院的學士學位,經指導教授推薦,獲得威斯康辛大學的獎學金;這是專門提供給專攻農化或細菌學研究的獎學金,且在此之前未曾頒給女性。於是埃凡斯前往威斯康辛大學繼續碩士學業。

-----廣告,請繼續往下閱讀-----

但她雖然是拿細菌學獎學金,但在農業細菌學指導教授黑斯廷斯(Edwin George Hastings)的要求下,埃凡斯花了三分之二的時間研讀化學,並於 1910 年獲得碩士學位。 碩士學業最後一年,教授希望埃凡斯留下來繼續攻讀博士學位。雖然意識到這是不錯的機會,但大學和碩士學業已帶給她不小的經濟和精神負擔,加上博士學位在當時對科學家並非必要,因此她選擇不再繼續攻讀。

與布氏桿菌相遇

每個人都有自己的天職,天賦就是呼喚,有一個方向,所有的空間都向他敞開。他擁有靜靜地吸引不斷往前努力的能力。

——愛默生

幸運的是,埃凡斯獲得了農業部動物產業局(Bureau of Animal Industry)的研究職位。由於乳酪是威斯康辛州的重要產業,當時威斯康辛大學化學系和細菌學系與乳製品部門合作,研究更好的乳酪製作方法。

埃凡斯是該單位首位女性員工。當時的動物產業局官員沒有想到可能會選擇女性。據傳聞,官員們在一次會議中聽到一名女科學家將加入他們的工作行列的「壞消息」時,他們充滿了驚愕,甚至「差點從椅子上跌下來」。

埃凡斯的回憶錄寫到:「就我而言,進入動物產業局純屬意外,因為長官在女性就業屏障上留下了一個漏洞,我不知不覺地就鑽了進去。」但這在女性就業可說是一個重要的里程碑,因為除非對美國公務員提出嚴重的投訴,否則埃凡斯不會被任意解僱。

-----廣告,請繼續往下閱讀-----

所幸埃凡斯的頂頭上司,乳製品部長羅爾(B. H. Rawl)與研究主任羅傑斯(Lore A. Rogers),都不認同其他高級官員對女性的敵意。她在此研究主題是牛乳中各式各樣的細菌,並了解這些類型細菌的來源。同時,她也每年在大學選修一門課,以充實知識。

研究過程中,她的目光漸漸集中到一個特定的對象,一種致流產的傳染性微生物。

查看原始文章

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

顯微觀點_96
26 篇文章 ・ 5 位粉絲
從細微的事物出發,關注微觀世界的一切,對肉眼所不能見的事物充滿好奇,發掘蘊藏在微觀影像之下的故事。

0

2
0

文字

分享

0
2
0
展頻技術之母海蒂.拉瑪(Hedy Lamarr)
數感實驗室_96
・2024/06/08 ・768字 ・閱讀時間約 1 分鐘

-----廣告,請繼續往下閱讀-----

本文由 國立臺灣師範大學 委託,泛科學企劃執行。 

被美貌耽誤才能的代表,這句話或許再適合不過地形容我們今天的主角——海蒂.拉瑪。她是一位好萊塢女明星,但她的成就絕不僅限於螢光幕前的光鮮亮麗。

好萊塢巨星與發明家雙重身份

海蒂.拉瑪不僅在影壇上熠熠生輝,她還是「展頻」這項重要通信技術的發明人。這項技術如今在無線通訊中廣泛應用,像藍牙和 Wi-Fi 等技術的基礎都能追溯到這項發明。

她的一生充滿了傳奇色彩,不僅僅是一位銀幕女神,還是一位傑出的發明家,她的貢獻至今仍影響著我們的日常生活。讓我們一起走進這位才能與美貌並存的女性,了解海蒂.拉瑪(Hedy Lamarr)如何在那個年代突破重重障礙,成為展頻技術的奠基者。

-----廣告,請繼續往下閱讀-----

如今,我們所使用的藍牙、Wi-Fi 等傳輸技術,其中部分原理來自於海蒂.拉瑪與喬治.安塞爾的跳頻展頻技術。儘管為了提升效率和安全性,現代已經有了更多展頻方式,但這並不會抹去拉瑪與安塞爾的巨大貢獻。

海蒂.拉瑪一生在影壇輝煌,雖然未曾獲得奧斯卡獎,但卻得到由「電子前哨基金會」頒發,有發明界奧斯卡獎之稱的「先鋒獎」,拉瑪離世後 14 年,入選美國國家發明名人堂,肯定她在展頻技術上的突破。或許大家記得她螢光幕前的風采,那如同她在好萊塢星光大道上的那顆星一樣閃耀的身影。但我希望每當我們享受便利的通訊科技時,能記得她也是這條技術發展長路上的一位重要火炬手。

更多、更完整的內容,歡迎上數感實驗室 Numeracy Lab 的 YouTube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

數感實驗室_96
76 篇文章 ・ 50 位粉絲
數感實驗室的宗旨是讓社會大眾「看見數學」。 數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁,迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章,內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。 詳見網站:http://numeracy.club/ 粉絲專頁:https://www.facebook.com/pg/numeracylab/