《二○○一太空漫遊》作者克拉克曾說過:「任何足夠先進的科技,都與魔法無異。」那柯南的追蹤眼鏡和鋼鐵人全身貴桑桑的整套穿戴式裝置的魔法又在哪裡呢?答案藏在這些穿戴式裝置的晶片裡。雖然說阿笠博士和鋼鐵人的財力可能有些差距,但是他們應該都用了 ARM 架構的省電高效能晶片(沒辦法,ARM 架構晶片在穿戴式裝置的市佔率接近百分之百)。
默默耕耘市場25年,研發晶片架構的 ARM 公司可謂一路引領智慧型行動裝置市場的興起。有別於傳統 PC 時代追求高效率運算的晶片設計, ARM 追求的是 The Right Size for the Right Task,讓行動裝置中的晶片體積夠小、能省電、效率夠高。行動裝置時代晶片設計概念需要靈活多工的游擊隊,而不是靠複雜沉重的龐大軍隊。
到了穿戴式裝置時代,就更眼花撩亂,從戴在手上的智慧型手錶、掛在臉上的眼鏡、穿在腳上的運動鞋、環在小狗脖子上的項圈,掛在牙套上的食物監測器,都可以是有智慧的穿戴式裝置。因此,ARM 對穿戴式裝置的構想是 One Size Doesn’t Fit All,針對不同裝置所需性能,開發出節能、效率、體積等不同特性的晶片。就像特種部隊要潛水就要配備潛水衣,要跳傘就要有降落傘,要街頭游擊就要有短槍枝。
當全身上下都可以掛上穿戴式裝置,你會優先想要使用哪些功能呢?可以照相的眼鏡?可以通話的耳環?可以看地圖的手錶?這些科幻情節許多已經在現實生活中發生,靠的是感測器、連接器(wifi/藍牙/3G)、顯示器、系統單晶片 (Systems on Chip, SoC)等技術的改良。ARM 所專精的就是支撐整個穿戴式系統單晶片的核心架構設計,因為不同類型的裝置依目的性與使用者習慣的不同,需要不同的晶片支援不同的功能和特性,如效率、省電,或是計算能力、傳輸能力。例如只要處理小量資料的感測裝置,就會搭載成本低也比較不耗電的晶片;但若是要計算大量資料的晶片,就得要支援如 Linux 這樣的操作系統能在上面運行。
像是下圖為手機與 VR 虛擬實境結合的穿戴式裝置,可以看 720 度全景圖片還可以玩 Temple Run!手機就直接裝在鏡框上,所以利用手機裡的陀螺儀就可以偵測你頭部轉動的方向了。試玩後發現,虛擬實境的 Temple Run 玩起來果真比較刺激!
鋼鐵人可說是穿戴式設備發展到極致的情況,很多人都會好奇東尼史塔克究竟是如何在一副裝甲上,整合那麼多不同的功能?ARM 行動市場全球行銷總監 James Bruce 笑著表示:「當然就是要用很多 ARM 的晶片囉!整個鋼鐵人最困難的部分是要整合所有感測器蒐集到的資訊,讓電腦計算然後在螢幕上呈現有意義的資訊,他的頭盔則用到虛擬實境的技術,需要搭載不同功能的晶片。」
就算你不是鋼鐵人,也會在每天的日常生活裡遇到 ARM 架構晶片,說不定你正用著採用ARM 架構晶片的裝置閱讀這篇文章呢! 又或者,透過廣泛運用ARM架構晶片,我們將一步步實現科幻電影裡的奇妙情節!
近年來因為人工智慧、大數據、區塊鏈等應用科技快速發展,以及 Google 等科技公司大舉來到臺灣進駐並招聘大量軟體工程師,臺灣頂大的資工科系成為超熱門志願。不過大家對資工系的印象就是要學寫程式,也就是俗稱的 coding,但 coding 在解決什麼問題?今天我們訪問了臺大資工系的陳縕儂副教授,從老師的專業「自然語言處理」(Natural Language Processing,縮寫 NLP)做切入,來帶大家了解資工系究竟在解決什麼問題。
大家可以想像一下,今天要跟一個 AI 互動,通常是透過語音或者文字來下達指令,接著 AI 就會協助我們完成特定的任務,並解決特定的問題。
在這個過程中,有四個主要的環節必須克服,分別是語音辨識 (Automatic Speech Recognition; ASR)、語意理解 (Natural Language Understanding; NLU)、對話決策 (Dialogue Management)、以及語言生成 (Natural Language Generation; NLG),說的白話一點,就是接收你講的話、翻譯成 AI 能理解的指令、要如何處理指令,以及怎麼把回應翻譯成人類能聽懂的聲音或文字。
在這四個環節裡都有相當複雜的問題需要去解決,譬如語音辨識,在技術上通常是將語音訊號直接轉換成文字,讓 AI 去理解,但在將音訊輸入的過程中,就必須要排除掉我們口語中會用的「嗯」、「啊」、「喔」等贅字或不自然的停頓,又或者是新創的流行語、方言、口音……等等的問題必須先解決,才能讓 AI 真的能聽懂人類的自然語言。
在「語意理解」上,要讓 AI 去分析語言或文字的脈絡、理解關鍵字,再找出對應的資料(搜尋資料庫);而「對話決策」更是困難,前面理解了人類的語言或文字表意後,AI 應該要如何回應?可能使用者給的資訊不完整,AI 要追問使用者以釐清問題?又或者在語意理解上有聽不懂的字,得要再次詢問並確認?
-----廣告,請繼續往下閱讀-----
這還只是 AI 面對人類自然語言時,其中幾個回應的選項,真實的對話情境可能更加複雜,而且整個對話過程只要有一個環節正確度不夠高,那 AI 後續也很難準確的回應,只要有一步錯了,就會對後續對話體驗造成負面影響。
不過好消息是,現在的深度學習技術已經相當成熟,只要餵資料給電腦時,告訴他怎麼樣是對、怎麼樣是錯,基本上電腦都可以不斷修正(餵的資料也要夠多),再加上現行語言代表模型的優化,智慧 AI 在特定領域的應用上都有蠻不錯的成果。
Jarvis 仍遙遠,AI 的新突破是精準翻譯
聊到這幾年 AI 的重要突破,老師提到三年前 Google 所開發的語言代表模型 BERT(Bidirectional Encoder Representations from Transformers),當時 BERT 一出現市面上所有自然語言處理的模型都改採用了它的運作邏輯。相較於過去的語言模型,通常都是餵指定任務的文字來訓練電腦,BERT 是在給電腦任務前,先餵它吃很多的文章或書,接著再提供任務給它。
而 BERT 的技術確實也得到相當好的成效,所以擊敗了當時許多正在開發的語言模型,成為了當前語言模型的基礎。有趣的是,BERT 的前身是一個名為 ELMo(Embeddings from Language Models,與芝麻街角色名字相同)的語言模型,所以 BERT 的開發者們就用芝麻街的角色,來為他們開發出來的語言模型命名。
雖然說 NLP 領域在商業與學術上都有相當大的發展空間,但陳老師認為,目前要達到人的「common sense(常識)」對 AI 來說還是非常困難,舉例來說,今天我們跟智慧助理說我今天要跟某某人吃晚餐,這個時候如果是人類的助理,我們可能會聯想到「吃什麼」、「要不要聯絡某某人」、「交通方式是?」……等等與飯局相關的問題,但 AI 目前並沒有辦法執行這麼複雜的互動,還得必須跟 AI 說「幫我訂位」、「幫我叫車」,仍在一個指令一個動作的狀態,這種 AI「common sense」的建立,可說是目前非常有挑戰性的項目。
身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分,雖然說現階段許多人對於 AI 可以執行我們的工作感到彆扭,但實際上 AI 正在減輕我們的工作量,舉例來說,像是目前醫院已經有在使用協助診斷的 AI,但這樣的 AI 並不會取代醫生的工作,因為 AI 只是提供醫生診斷的相關依據,實務上對於病患的判斷最終還是得由醫生來做。
雖然 AI 已在產業中被廣泛利用,但基本上仍以「人機協作」為大宗,雖然能取代部分人力,但像是創造類型的工作 AI 就幾乎無法獨自完成。至於大家想像中,AI 恐對人類造成威脅的情節,基本上不會發生,因為 AI 是不會憑空出現意識的,AI 威脅人類的可能,比較會是人類不當利用造成的風險,所以在未來 AI 的開發上,基本上會往輔助人類的方向去做應用。
Wie 等人(2010)的研究也指出,單側聽損成人比聽常者更容易感到幸福感下降,以及在人際上遭到排擠。聽損者之所以容易遭遇人際互動困難,除了因為自己聽不清他人說話外,也可能是因旁人與聽損者互動時,必須經常重複說過的話、放慢速度、注意距離是否過遠、發音是否清楚等等,而降低了他們與聽損者溝通的意願,使得聽損者感覺更加孤立(Arlinger,2003)。
此外,Lin 等人(2014)的大腦影像研究也顯示聽損者的大腦萎縮比聽常者來得快。Lin的團隊運用核磁共振造影術(fMRI)觀測56歲以上聽損成人十年間的大腦變化,發現他們招募的受試者聽損程度雖然大多只有輕度,但全腦及右腦顳葉(temporal lobe,位置見上圖)的容量(volume)減少速度明顯較聽常者快。聽損受試者右腦顳葉萎縮的區域除了負責口語處理外,也影響語意記憶及知覺整合,而這部份正是早期阿茲海默症相關的腦區(Lin et al.,2014)。
製造業者、工人、軍警、牙醫、美髮業者等人員的耳朵較常接觸高分貝器械的噪音,因此聽力容易受損,而柯南劇中犯人的微聽損或許就是征戰沙場所帶來的職業傷害。此外,有些工作需搭乘的交通工具會發出巨大聲響,例如機組人員、消防車、救護車或垃圾車隨行人員,還有一些工作環境總是人聲鼎沸,例如酒吧、夜店等等,這些人長久下來也有微聽損的隱憂(European Agency for Safety and Health at Work,2014;Hear it,2008;Manatee Hearing & Speech Center,2016;余仁方,2014)。
另外,吸菸及藥物使用也是導致聽損的危險因子。目前已有研究證實抽菸與聽損相關,聽力損失發生在抽煙者的機會是不抽菸者的1.7倍(Cruickshanks et al.,1998),而且通常是輕度的聽損(Kumar, Gulati, Singhal, Hasan & Khan,2013)。美國語言聽力協會(ASHA)也指出,使用耳毒性藥物(Ototoxic medications)也可能使聽力產生損傷,例如新黴素、呋塞米、某些化療藥物、大量的阿斯匹靈等。
(1997). Causes of hearing loss in adults [Web blog message].
Bainbridge, K. E., Hoffman, H. J., & Cowie, C. C. (2008). Diabetes and hearing impairment in the United States: Audiometric evidence from the national health and nutrition examination surveys, 1999-2004. Ann Intern Med, 149(1), 1-10.
Bess, F. H., Dodd-Murphy, J., & Parker, R. A. (1998). Children with minimal sensorineural hearing loss: Prevalence, educational performance, and functional status. Ear and hearing, 19(5), 339-354.
Cruickshanks, K. J., Klein, R., Klein, B. E. K., Wiley, T. L., Nondahl, D. M., & Tweed, T. S. (1998). Cigarette smoking and hearing loss: The epidemiology of hearing loss study. JAMA, 279(21), 1715-1719.
Ford, A. H., Hankey, G. J., Yeap, B. B., Flicker, L., & Almeida, O. P. (2018). Hearing loss and the risk of dementia in later life. Maturitas, 112, 1-11.
Kumar, A., Gulati, R., Singhal, S., Hasan, A., & Khan, A. (2013). The effect of smoking on the hearing status –A hospital based study. Journal of Clinical and Diagnostic Research, 7(2), 210-214.
Lin, C. Y., Yang, Y. C., Guo, Y. L., Wu, C. H., Chang, C. J., & Wu, J. L. (2007). Prevalence of hearing impairment in an adult population in southern Taiwan. International Journal of Audiology, 46, 732-
Lin, F. R., & Ferrucci, L. (2012). Hearing loss and falls among older adults in the United States. Arch Intern Med, 172(4), 369-371.
Lin, F. R., Ferrucci, L., An, Y., Goh,, J.O., Jimit Doshi, M. S., Metter, E. J., Davatzikos, C., Kraut, M. A., & Resnick, S. M. (2014). Association of hearing impairment with brain volume changes in older adults. Neuroimage. 90, 84-92.
Lin, F. R., Yaffe, K., Xia, J., Xue, O-L., Harris, T. B., Purchase-Helzner, E., Satterfield, S., Ayonayon, H. N., Ferrucci, L., & Simonsick, E. M. (2013). Hearing loss and cognitive decline among older adults. JAMA Intern Med, 173(4), 293-299.
Monzani, D., Galeazzi, G. M., Genovese, E., Marrara, A., Martini, A. (2008). Psychological profile and social behaviour of working adults with mild or moderate hearing loss.Acta Otorhinolaryngologica Italica, 28(2), 61-66.
Wallhagen, M.I., Strawbridge, W. J., Shema, S. J., Kaplan, G. A. (2004). Impact of self-assessed hearing loss on a spouse: A longitudinal analysis of couples. Journal of Gerontology: Social Sciences, 59B(3), S190-S196.
Wie, O. B., Pripp, A. H., & Tvete, O. (2010). Unilateral deafness in adults: Effects on communication and social interaction. Annals of Otology. Rhinology & Laryngology 119, (11), 772-781.