0

0
0

文字

分享

0
0
0

鋼鐵人和阿笠博士沒跟你說的核心秘密

鳥苷三磷酸 (PanSci Promo)_96
・2015/08/10 ・3012字 ・閱讀時間約 6 分鐘 ・SR值 483 ・五年級

conanandironman

本篇文章由 ARM 贊助,泛科學策畫執行。

《二○○一太空漫遊》作者克拉克曾說過:「任何足夠先進的科技,都與魔法無異。」那柯南的追蹤眼鏡和鋼鐵人全身貴桑桑的整套穿戴式裝置的魔法又在哪裡呢?答案藏在這些穿戴式裝置的晶片裡。雖然說阿笠博士和鋼鐵人的財力可能有些差距,但是他們應該都用了 ARM 架構的省電高效能晶片(沒辦法,ARM 架構晶片在穿戴式裝置的市佔率接近百分之百)。

默默耕耘市場25年,研發晶片架構的 ARM 公司可謂一路引領智慧型行動裝置市場的興起。有別於傳統 PC 時代追求高效率運算的晶片設計, ARM 追求的是 The Right Size for the Right Task,讓行動裝置中的晶片體積夠小、能省電、效率夠高。行動裝置時代晶片設計概念需要靈活多工的游擊隊,而不是靠複雜沉重的龐大軍隊。

MV5BMTU4Nzk0NzQ2MF5BMl5BanBnXkFtZTcwODM3Mjk1MQ@@._V1__SX1303_SY591_
source:IMDB

到了穿戴式裝置時代,就更眼花撩亂,從戴在手上的智慧型手錶、掛在臉上的眼鏡、穿在腳上的運動鞋、環在小狗脖子上的項圈,掛在牙套上的食物監測器,都可以是有智慧的穿戴式裝置。因此,ARM 對穿戴式裝置的構想是 One Size Doesn’t Fit All,針對不同裝置所需性能,開發出節能、效率、體積等不同特性的晶片。就像特種部隊要潛水就要配備潛水衣,要跳傘就要有降落傘,要街頭游擊就要有短槍枝。

-----廣告,請繼續往下閱讀-----

可以將穿戴式裝置大約分成四類,來看它們需要配備怎樣的晶片吧!

1.嵌入式穿戴式裝置–偷偷藏在燕尾服裡

2
source:IMBD

成龍在《燕尾服》裡身穿一套可以設定不同模式的萬能燕尾服,裡面鐵定有嵌入式穿戴裝置(deeply embedded wearable。現今的嵌入式穿戴裝置,還不能讓衣服的主人後空翻耍帥,但可以貼身監測人體數據。像是由以色列新創公司 LiveBEAM 所研發的感測運動帽,在帽子前額放上感測器,能偵測人體脈搏,跑步的時候只要戴帽子就可以得到心跳的數據,帽子裡的電池也可以取出,方便清洗。

這種嵌入式裝置體積很小,電池也要能支撐夠久,畢竟你不會想要常常幫衣服充電。所對應的 ARM 架構晶片就會做的很小,而且省電。 ARM 架構晶片現在已經可以做到比高爾夫球上的一個小凹洞還小。

3
source:freescale

2.可攜式裝置–隨身、方便、好攜帶

JW
注意到捲髮弟弟左手上的智慧腕帶了嗎?source:IMDB

侏羅紀世界裡可以優先排隊又能駕駛水晶遊園車的VIP智慧腕帶,就算是可攜式裝置portable device的代表囉!穿戴在身上隨時與各種機器互動,隨時收集資料,處理及顯示資料則在手機端運作。這裡需要的晶片仍以節能為主要目的,不需要太高效率的運算。現實生活中的小米手環就算是可攜式裝置的一種。

-----廣告,請繼續往下閱讀-----

3.互補型裝置–手機的延伸

pepple
source:Pebble官網

最早商業化成功的互補型裝置(companion device)首推 Pebble,讓你不用接個電話或者是看個時間就要把手機從口袋裡掏出來。互補型裝置連結智慧型手機以處理繁複的資訊,本身要處理、顯示一定的資訊量,像是看時間、地圖、閱讀簡訊。如果是要寫email,就還是回到手機端輸入吧!

互補型裝置比可攜式裝置多了螢幕以及基礎運算功能,像是 Android wear 、Apple watch 等產品,這就需要更高效能的晶片囉!另外,像 Apple 在其 Apple Watch上放入NFC 技術讓使用者可以直接以手錶付款,裝置與晶片的安全性跟身份驗證就變得相當重要。

4.獨立運算裝置

獨立運算裝置(stand-alone computing device)是具有優秀運算能力、可以獨立使用的穿戴式裝置,可能是手錶或者是眼鏡,且不需要依靠與智慧型手機做連結。柯南的眼鏡就算是這種高級厲害的裝置喔!獨立運算裝置需要更高效能的晶片,否則不能即時顯示嫌犯位置,柯南的眼鏡就達不到追蹤效果了。

conan
source:日本讀賣電視台

多元的穿戴式裝置,你今天想穿哪一件?

當全身上下都可以掛上穿戴式裝置,你會優先想要使用哪些功能呢?可以照相的眼鏡?可以通話的耳環?可以看地圖的手錶?這些科幻情節許多已經在現實生活中發生,靠的是感測器、連接器(wifi/藍牙/3G)、顯示器、系統單晶片 (Systems on Chip, SoC)等技術的改良。ARM 所專精的就是支撐整個穿戴式系統單晶片的核心架構設計,因為不同類型的裝置依目的性與使用者習慣的不同,需要不同的晶片支援不同的功能和特性,如效率、省電,或是計算能力、傳輸能力。例如只要處理小量資料的感測裝置,就會搭載成本低也比較不耗電的晶片;但若是要計算大量資料的晶片,就得要支援如 Linux 這樣的操作系統能在上面運行。

-----廣告,請繼續往下閱讀-----
7
ARM CORTEX-M系列處理器,欲看大圖請點選連結。source:ARM

穿戴式裝置與手機的結合會出現更多可能。未來會有更多照片、影音內容在手機上運作,智慧型手機勢必將越來越聰明,成為掌握數位生活的遙控器。尤其是在像印度、東南亞等新興市場,隨著行動裝置快速普及,人們跳過桌機和便宜筆電,直接進階使用智慧型手機,手機因此成為很多人第一個、也是唯一的數位連網工具。而智慧型手機的玩法也已經不限於低頭滑手機了。結合不同的應用,有更多有趣的可能性。

像是下圖為手機與 VR 虛擬實境結合的穿戴式裝置,可以看 720 度全景圖片還可以玩 Temple Run!手機就直接裝在鏡框上,所以利用手機裡的陀螺儀就可以偵測你頭部轉動的方向了。試玩後發現,虛擬實境的 Temple Run 玩起來果真比較刺激!

8
手機與 VR 虛擬實境結合的穿戴式裝置。source:作者提供

鋼鐵人可說是穿戴式設備發展到極致的情況,很多人都會好奇東尼史塔克究竟是如何在一副裝甲上,整合那麼多不同的功能?ARM 行動市場全球行銷總監 James Bruce 笑著表示:「當然就是要用很多 ARM 的晶片囉!整個鋼鐵人最困難的部分是要整合所有感測器蒐集到的資訊,讓電腦計算然後在螢幕上呈現有意義的資訊,他的頭盔則用到虛擬實境的技術,需要搭載不同功能的晶片。」

就算你不是鋼鐵人,也會在每天的日常生活裡遇到 ARM 架構晶片,說不定你正用著採用ARM 架構晶片的裝置閱讀這篇文章呢! 又或者,透過廣泛運用ARM架構晶片,我們將一步步實現科幻電影裡的奇妙情節!

-----廣告,請繼續往下閱讀-----

延伸閱讀:

文章難易度
鳥苷三磷酸 (PanSci Promo)_96
200 篇文章 ・ 308 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

2

7
0

文字

分享

2
7
0
用 coding 寫出《鋼鐵人》的 AI 助理 Jarvis 有多難?——專訪臺大資工系陳縕儂副教授
科技大觀園_96
・2022/01/04 ・3527字 ・閱讀時間約 7 分鐘

近年來因為人工智慧、大數據、區塊鏈等應用科技快速發展,以及 Google 等科技公司大舉來到臺灣進駐並招聘大量軟體工程師,臺灣頂大的資工科系成為超熱門志願。不過大家對資工系的印象就是要學寫程式,也就是俗稱的 coding,但 coding 在解決什麼問題?今天我們訪問了臺大資工系的陳縕儂副教授,從老師的專業「自然語言處理」(Natural Language Processing,縮寫 NLP)做切入,來帶大家了解資工系究竟在解決什麼問題。

讓 AI 聽得懂人話,就是「自然語言處理」

陳縕儂老師的機器智慧與理解實驗室,主要是針對語言處理及對話系統相關技術進行研發,藉由機器學習技術,透過資料讓機器自動學習,理解人類語言並且進行適當的互動,目標是希望能讓機器的智能比肩人類,甚至超越人類。

陳縕儂教授與實驗室今年參加 Amazon Alexa Prize Taskbot 競賽的研究生們合影。(圖/陳縕儂提供)

「自然語言處理」是資工領域中的一個分支,名字聽起來很抽象,但其實這項學門的目標就是讓電腦可以「聽懂」人類說的話、「理解」語意並給予「回應」,就像鋼鐵人電影中的 AI 助理 Jarvis,鋼鐵人只要說如常說話就可以下達指令,讓 Jarvis 協助生活中各種大小事。

不過理想很飽滿現實卻很骨感,要做到像 Jarvis 這樣有求必應的 AI 助理並不容易,目前市面上的智慧助理如 Apple Siri、Google Assistant 及 Amazon Alexa 都已經隨著 3C 產品普及化了,但很多時候它們仍會說:「很抱歉,我聽不懂你的意思。」可見,從 Siri 到到 Jarvis 仍有很長的一段路要走,但為什麼這是條漫漫長路?——歡迎來到「自然語言處理」的思考領域。

-----廣告,請繼續往下閱讀-----

從「聽懂」到「回應」,AI 必須克服多項關卡

大家可以想像一下,今天要跟一個 AI 互動,通常是透過語音或者文字來下達指令,接著 AI 就會協助我們完成特定的任務,並解決特定的問題。

在這個過程中,有四個主要的環節必須克服,分別是語音辨識 (Automatic Speech Recognition; ASR)、語意理解 (Natural Language Understanding; NLU)、對話決策 (Dialogue Management)、以及語言生成 (Natural Language Generation; NLG),說的白話一點,就是接收你講的話、翻譯成 AI 能理解的指令、要如何處理指令,以及怎麼把回應翻譯成人類能聽懂的聲音或文字。

在這四個環節裡都有相當複雜的問題需要去解決,譬如語音辨識,在技術上通常是將語音訊號直接轉換成文字,讓 AI 去理解,但在將音訊輸入的過程中,就必須要排除掉我們口語中會用的「嗯」、「啊」、「喔」等贅字或不自然的停頓,又或者是新創的流行語、方言、口音……等等的問題必須先解決,才能讓 AI 真的能聽懂人類的自然語言。

在「語意理解」上,要讓 AI 去分析語言或文字的脈絡、理解關鍵字,再找出對應的資料(搜尋資料庫);而「對話決策」更是困難,前面理解了人類的語言或文字表意後,AI 應該要如何回應?可能使用者給的資訊不完整,AI 要追問使用者以釐清問題?又或者在語意理解上有聽不懂的字,得要再次詢問並確認?

-----廣告,請繼續往下閱讀-----

這還只是 AI 面對人類自然語言時,其中幾個回應的選項,真實的對話情境可能更加複雜,而且整個對話過程只要有一個環節正確度不夠高,那 AI 後續也很難準確的回應,只要有一步錯了,就會對後續對話體驗造成負面影響。

不過好消息是,現在的深度學習技術已經相當成熟,只要餵資料給電腦時,告訴他怎麼樣是對、怎麼樣是錯,基本上電腦都可以不斷修正(餵的資料也要夠多),再加上現行語言代表模型的優化,智慧 AI 在特定領域的應用上都有蠻不錯的成果。

AI 處理語音指令的過程。圖/陳縕儂提供

Jarvis 仍遙遠,AI 的新突破是精準翻譯

聊到這幾年 AI 的重要突破,老師提到三年前 Google 所開發的語言代表模型 BERT(Bidirectional Encoder Representations from Transformers),當時 BERT 一出現市面上所有自然語言處理的模型都改採用了它的運作邏輯。相較於過去的語言模型,通常都是餵指定任務的文字來訓練電腦,BERT 是在給電腦任務前,先餵它吃很多的文章或書,接著再提供任務給它。

以翻譯為例,這就好像讓一般人翻譯,跟讀過很多書的人來翻譯一樣,讀過很多書的人懂得字彙跟用法,自然翻譯出來的成品更流暢。

-----廣告,請繼續往下閱讀-----

而 BERT 的技術確實也得到相當好的成效,所以擊敗了當時許多正在開發的語言模型,成為了當前語言模型的基礎。有趣的是,BERT 的前身是一個名為 ELMo(Embeddings from Language Models,與芝麻街角色名字相同)的語言模型,所以 BERT 的開發者們就用芝麻街的角色,來為他們開發出來的語言模型命名。

當前 AI 發展的目標,為它建立「人的常識」

雖然說 NLP 領域在商業與學術上都有相當大的發展空間,但陳老師認為,目前要達到人的「common sense(常識)」對 AI 來說還是非常困難,舉例來說,今天我們跟智慧助理說我今天要跟某某人吃晚餐,這個時候如果是人類的助理,我們可能會聯想到「吃什麼」、「要不要聯絡某某人」、「交通方式是?」……等等與飯局相關的問題,但 AI 目前並沒有辦法執行這麼複雜的互動,還得必須跟 AI 說「幫我訂位」、「幫我叫車」,仍在一個指令一個動作的狀態,這種 AI「common sense」的建立,可說是目前非常有挑戰性的項目。

AI 的開發方向——人類的工作輔具

身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分,雖然說現階段許多人對於 AI 可以執行我們的工作感到彆扭,但實際上 AI 正在減輕我們的工作量,舉例來說,像是目前醫院已經有在使用協助診斷的 AI,但這樣的 AI 並不會取代醫生的工作,因為 AI 只是提供醫生診斷的相關依據,實務上對於病患的判斷最終還是得由醫生來做。

雖然 AI 已在產業中被廣泛利用,但基本上仍以「人機協作」為大宗,雖然能取代部分人力,但像是創造類型的工作 AI 就幾乎無法獨自完成。至於大家想像中,AI 恐對人類造成威脅的情節,基本上不會發生,因為 AI 是不會憑空出現意識的,AI 威脅人類的可能,比較會是人類不當利用造成的風險,所以在未來 AI 的開發上,基本上會往輔助人類的方向去做應用。

-----廣告,請繼續往下閱讀-----
身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分。圖/Pixabay

資工領域瞬息萬變,「喜歡新知」很關鍵

談到什麼特質適合來讀資工系,陳縕儂老師認為,數學或是邏輯只是基礎,重要的是「喜歡接受新知」的特質,因為在資工領域瞬息萬變,資訊更新的相當快速,隨時都會有新東西出來,如果不喜歡吸收新知識,讀資工系可能會比較痛苦一點。另外,資工在應用上時常會和不同領域的人做合作,你必須了解對方的需求跟他們的條件,才能設計出能夠幫別人解決問題的方法,而這也是資工有趣的地方。

陳縕儂老師也和我們分享了在他眼中臺灣學生和外國學生的差異,他認為臺灣學生應用網路資源自學的能力非常強,而外國學生則是勇於在課堂上和老師提問並討論,各有各的優點,不過教授也認為由於臺灣學生擅長自己找答案,所以在協作與表達上的可能相較於外國會比較弱一些,但如果這一塊能做到加強,臺灣的學生其實是非常有競爭力的。

陳縕儂副教授認為,臺灣學生在協作與表達上相較於外國學生較弱一些,但若能加強這一塊能力,臺灣學生非常有競爭力。圖/呂元弘攝

最後老師還告訴我們,當初大學時機器學習與 NLP 領域並不是資工領域的主流,一開始只是選擇了自己有興趣的領域,也沒想到近幾年 NLP 會變成現在的顯學,他認為自己真的非常幸運,可以一路延續自己熱愛的主題。

最後的最後,陳縕儂老師建議有意投入資工領域的學員們,可以先了解這個領域需要的先備知識,像是 coding 要用到的程式語言、跟 AI 相關的內容則會牽涉到數學,最後當然就是對知識的熱情和態度,了解之後才比較能判斷這個領域適不適合你,千萬不要因為從眾而選擇。

-----廣告,請繼續往下閱讀-----
所有討論 2
科技大觀園_96
82 篇文章 ・ 1125 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。

0

0
0

文字

分享

0
0
0
《〈柯南 零的執行人〉足球真能解決任何事?》——2019數感盃 / 國中組專題報導類佳作
數感實驗室_96
・2019/05/15 ・2474字 ・閱讀時間約 5 分鐘 ・SR值 562 ・九年級

數感盃青少年寫作競賽」提供國中、高中職學生在培養數學素養後,一個絕佳的發揮舞台。本競賽鼓勵學生跨領域學習,運用數學知識,培養及展現邏輯思考與文字撰寫的能力,盼提升臺灣青少年科普寫作的風氣以及對數學的興趣。

本文為 2019數感盃青少年寫作競賽 / 國中組專題報導類佳作 之作品,為盡量完整呈現學生之作品樣貌,本文除首圖及標點符號、錯字之外並未進行其他大幅度編修。

  • 作者:鍾依庭/台北市立明倫高中

一、研究動機

去年紅遍全台的柯南電影——零的執行人,不但壓倒性強勢攻上日本全國票房榜首,創下觀影人數達1,289,000人,票房突破16.7億円(約新台幣4.67億元),創下系列作品首週票房最高紀錄!我們就來一探柯南拯救世界背後的數字究竟隱藏了多驚人的秘密吧!

二、前情提要

一開始,無人探測機-天鵝號,結束火星上採樣本的任務,即將返回地球,透過遠端操控程式修正衛星軌道,讓其脫離等速率圓周運動的軌跡,使其墜落地球,且墜落過程中,探測機本體會在大氣層中燃燒,僅讓直徑約4m的太空艙重返大氣層,之後本體的隔熱罩分離,降落傘會展開,預定將在日本近海的的太平洋上降落。

殊不知,兇嫌利用網路技術,駭入遠端操控無人機的程式,更改其墜落軌道,企圖讓太空艙墜落於警視廳。警方為了避免傷亡,將居民疏散並暫時安置在新興建造,位於東京填海地區的博弈塔中。另一方面,為了防止無人機墜落於警視廳,柯南與公安警察安適透利用阿笠博士發明的遙控型無人機,承載炸藥,飛向墜落中太空艙,於離地30000m的高空將炸藥引爆,藉由爆炸的能量改變無人探測機落下的軌道,希望讓其落入太平洋上,沒想到改變軌道後的太空艙,居然不偏不倚的朝向充滿避難居民的博弈塔方向飛去 !

此時,柯南乘坐安室的車,為了再次解決危機,朝向博弈塔的方向駛去,並開上了一棟20層樓高的興建中大樓,從頂樓以180km/hr的速度衝向空中,接著就是大家熟悉的場景,柯南利用一記射門,將足球踢向墜落中的太空艙,並成功讓其些微偏移原本的軌道,只有擦撞到博弈塔邊緣,對整體結構沒有很大的影響,成功化解了危機。

-----廣告,請繼續往下閱讀-----

接著,就來探討這令人吸睛的過程,究竟有無可能發生?

三、禍從天降

根據每日頭條報導,以色列一無人太空飛行器高1.5米,直徑2米,重600公斤,若將所有太空艙視為一圓柱體且密度皆相同,接著由圓柱體積公式及密度公式 :

將無人探測機從宇宙失重落下的位置視為警視廳的正上方,離地30km處(也就是引爆炸藥的高度)的順時速度為10km/s,不計空氣阻力,重力加速度為10m/,炸藥爆炸時會改變太空艙墜落的方向。

-----廣告,請繼續往下閱讀-----

將炸藥產生的能量視為水平衝擊,不影響鉛質落下的速度,爆炸釋放的能量會使太空艙進行水平拋射運動。接著由下圖可知,警視廳本部到博弈塔(東京填海地區)的直線距離為11.63km(約12km)。

google地圖與東京都港灣局公布的填海地區域圖之疊圖

三、禍不單行

爆炸後太空艙會因為炸藥衝擊而得到一水平方向的力,也就是說爆炸造成的平拋運動,不影響鉛質速度,爆炸前後落地時間不會改變。已知改變軌道的太空艙會撞上博弈塔,又太空艙在爆炸後第3秒末時(落地瞬間),要擊中相距警視廳(原落下位置))12km處的博弈塔,可以推算出爆炸後太空艙的水平速度為(km/s)。

太空艙落下過程示意圖(圖源 : 自己)

-----廣告,請繼續往下閱讀-----

安室與柯南將車駛至高20層樓的廢棄大樓,高度約為3*20=60(m),柯南由離地60m高處將足球踢向墜落中的太空艙,假設柯南踢球的力道為鉛直向上,一顆普通足球的平均重量為440g,使球做一鉛直上拋運動,且足球與太空艙碰撞時,要讓太空艙產生1m的軌道偏離,也就是說球向上的鉛直速度要大到足夠讓太空艙鉛直下降的速度降低,使其落地的距離延後1m。若柯南所踢的足球接觸到太空艙的瞬間為落地前一秒,碰撞前,太空艙最後一秒的水平位移原為4km=4000m,碰撞後,要延後1m落地,也就是說,最後一秒內要行走的距離變成4000+1m。

利用動量守恆公式,可得4000 2400+0.44v=(2400+0.44) 4001,v = 9455.55m/s。

如果想讓太空艙偏離原本落下的軌道,柯南至少要讓一顆440g的足球產生將近10000m/s。那麼究竟需要多大的力道才能讓球產生比音速還快的速度呢?這個速度就連M16突擊步槍(子彈射出的速度為1450m/s)也無法超越。

假設柯南踢球時,腳與球的接觸時間為0.1s,接著可以利用衝量公式

-----廣告,請繼續往下閱讀-----

當柯南對足球的鉛直施力大於41604.42N時才能讓太空艙產生1m的偏移,反之,若施以小於41604.42N的力,墜落太空艙就會擊中博弈塔,這樣是無法拯救在塔中避難的居民(還有小蘭)。

上述討論情形還是在沒有空氣阻力的理想情況下,若討論空氣阻力,也就是現實的情況之下,需要施比41604.42N更大的力,才有可能讓太空艙產生些許的軌道偏移。

五、大危機背後的數字

那麼,41604.42N的力量又有多大呢?如果對牛頓這個單位沒有概念的話,可以用1kgw=10N來換算,大約是4160.442kgw的重量,就連武林中的風雲人物李小龍,一也只能踢出700kgw的力量,再者以一個小學生的外表與肌肉量,想踢出超過4160kgw的力道,根本違反了人體工學,想做到幾乎不可能,但從成功的結果來看,應該要將一切歸功青山岡昌老師(名偵探柯南的作者)過人的想像力。

六、有朝一日

或許在未來科技的進步之下,宇宙並非遙不可及,但探索其奧秘的同時,勢必會有些負面的影響,例如大量的探測機要從宇宙帶回遙遠星球甚至星系的樣本,又或是突然有巨大太空垃圾撞擊地球時,一定會對地球造成傷害,但若科學家們能製做一台機器,讓某物體(例如足球)在極短的時間內獲得極大的加速度,藉此改變其落下的軌道,將能減少對地球的傷害。

-----廣告,請繼續往下閱讀-----

更多2019數感盃青少年寫作競賽內容,歡迎參考 2019數感盃特輯、數感實驗室官網粉絲頁喔。

參考資料

數感實驗室_96
76 篇文章 ・ 49 位粉絲
數感實驗室的宗旨是讓社會大眾「看見數學」。 數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁,迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章,內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。 詳見網站:http://numeracy.club/ 粉絲專頁:https://www.facebook.com/pg/numeracylab/