Loading [MathJax]/extensions/tex2jax.js

0

1
0

文字

分享

0
1
0

鋼鐵人和阿笠博士沒跟你說的核心秘密

鳥苷三磷酸 (PanSci Promo)_96
・2015/08/10 ・3012字 ・閱讀時間約 6 分鐘 ・SR值 483 ・五年級

-----廣告,請繼續往下閱讀-----

conanandironman

本篇文章由 ARM 贊助,泛科學策畫執行。

《二○○一太空漫遊》作者克拉克曾說過:「任何足夠先進的科技,都與魔法無異。」那柯南的追蹤眼鏡和鋼鐵人全身貴桑桑的整套穿戴式裝置的魔法又在哪裡呢?答案藏在這些穿戴式裝置的晶片裡。雖然說阿笠博士和鋼鐵人的財力可能有些差距,但是他們應該都用了 ARM 架構的省電高效能晶片(沒辦法,ARM 架構晶片在穿戴式裝置的市佔率接近百分之百)。

默默耕耘市場25年,研發晶片架構的 ARM 公司可謂一路引領智慧型行動裝置市場的興起。有別於傳統 PC 時代追求高效率運算的晶片設計, ARM 追求的是 The Right Size for the Right Task,讓行動裝置中的晶片體積夠小、能省電、效率夠高。行動裝置時代晶片設計概念需要靈活多工的游擊隊,而不是靠複雜沉重的龐大軍隊。

MV5BMTU4Nzk0NzQ2MF5BMl5BanBnXkFtZTcwODM3Mjk1MQ@@._V1__SX1303_SY591_
source:IMDB

到了穿戴式裝置時代,就更眼花撩亂,從戴在手上的智慧型手錶、掛在臉上的眼鏡、穿在腳上的運動鞋、環在小狗脖子上的項圈,掛在牙套上的食物監測器,都可以是有智慧的穿戴式裝置。因此,ARM 對穿戴式裝置的構想是 One Size Doesn’t Fit All,針對不同裝置所需性能,開發出節能、效率、體積等不同特性的晶片。就像特種部隊要潛水就要配備潛水衣,要跳傘就要有降落傘,要街頭游擊就要有短槍枝。

-----廣告,請繼續往下閱讀-----

可以將穿戴式裝置大約分成四類,來看它們需要配備怎樣的晶片吧!

1.嵌入式穿戴式裝置–偷偷藏在燕尾服裡

2
source:IMBD

成龍在《燕尾服》裡身穿一套可以設定不同模式的萬能燕尾服,裡面鐵定有嵌入式穿戴裝置(deeply embedded wearable。現今的嵌入式穿戴裝置,還不能讓衣服的主人後空翻耍帥,但可以貼身監測人體數據。像是由以色列新創公司 LiveBEAM 所研發的感測運動帽,在帽子前額放上感測器,能偵測人體脈搏,跑步的時候只要戴帽子就可以得到心跳的數據,帽子裡的電池也可以取出,方便清洗。

這種嵌入式裝置體積很小,電池也要能支撐夠久,畢竟你不會想要常常幫衣服充電。所對應的 ARM 架構晶片就會做的很小,而且省電。 ARM 架構晶片現在已經可以做到比高爾夫球上的一個小凹洞還小。

3
source:freescale

2.可攜式裝置–隨身、方便、好攜帶

JW
注意到捲髮弟弟左手上的智慧腕帶了嗎?source:IMDB

侏羅紀世界裡可以優先排隊又能駕駛水晶遊園車的VIP智慧腕帶,就算是可攜式裝置portable device的代表囉!穿戴在身上隨時與各種機器互動,隨時收集資料,處理及顯示資料則在手機端運作。這裡需要的晶片仍以節能為主要目的,不需要太高效率的運算。現實生活中的小米手環就算是可攜式裝置的一種。

-----廣告,請繼續往下閱讀-----

3.互補型裝置–手機的延伸

pepple
source:Pebble官網

最早商業化成功的互補型裝置(companion device)首推 Pebble,讓你不用接個電話或者是看個時間就要把手機從口袋裡掏出來。互補型裝置連結智慧型手機以處理繁複的資訊,本身要處理、顯示一定的資訊量,像是看時間、地圖、閱讀簡訊。如果是要寫email,就還是回到手機端輸入吧!

互補型裝置比可攜式裝置多了螢幕以及基礎運算功能,像是 Android wear 、Apple watch 等產品,這就需要更高效能的晶片囉!另外,像 Apple 在其 Apple Watch上放入NFC 技術讓使用者可以直接以手錶付款,裝置與晶片的安全性跟身份驗證就變得相當重要。

4.獨立運算裝置

獨立運算裝置(stand-alone computing device)是具有優秀運算能力、可以獨立使用的穿戴式裝置,可能是手錶或者是眼鏡,且不需要依靠與智慧型手機做連結。柯南的眼鏡就算是這種高級厲害的裝置喔!獨立運算裝置需要更高效能的晶片,否則不能即時顯示嫌犯位置,柯南的眼鏡就達不到追蹤效果了。

conan
source:日本讀賣電視台

多元的穿戴式裝置,你今天想穿哪一件?

當全身上下都可以掛上穿戴式裝置,你會優先想要使用哪些功能呢?可以照相的眼鏡?可以通話的耳環?可以看地圖的手錶?這些科幻情節許多已經在現實生活中發生,靠的是感測器、連接器(wifi/藍牙/3G)、顯示器、系統單晶片 (Systems on Chip, SoC)等技術的改良。ARM 所專精的就是支撐整個穿戴式系統單晶片的核心架構設計,因為不同類型的裝置依目的性與使用者習慣的不同,需要不同的晶片支援不同的功能和特性,如效率、省電,或是計算能力、傳輸能力。例如只要處理小量資料的感測裝置,就會搭載成本低也比較不耗電的晶片;但若是要計算大量資料的晶片,就得要支援如 Linux 這樣的操作系統能在上面運行。

-----廣告,請繼續往下閱讀-----
7
ARM CORTEX-M系列處理器,欲看大圖請點選連結。source:ARM

穿戴式裝置與手機的結合會出現更多可能。未來會有更多照片、影音內容在手機上運作,智慧型手機勢必將越來越聰明,成為掌握數位生活的遙控器。尤其是在像印度、東南亞等新興市場,隨著行動裝置快速普及,人們跳過桌機和便宜筆電,直接進階使用智慧型手機,手機因此成為很多人第一個、也是唯一的數位連網工具。而智慧型手機的玩法也已經不限於低頭滑手機了。結合不同的應用,有更多有趣的可能性。

像是下圖為手機與 VR 虛擬實境結合的穿戴式裝置,可以看 720 度全景圖片還可以玩 Temple Run!手機就直接裝在鏡框上,所以利用手機裡的陀螺儀就可以偵測你頭部轉動的方向了。試玩後發現,虛擬實境的 Temple Run 玩起來果真比較刺激!

8
手機與 VR 虛擬實境結合的穿戴式裝置。source:作者提供

鋼鐵人可說是穿戴式設備發展到極致的情況,很多人都會好奇東尼史塔克究竟是如何在一副裝甲上,整合那麼多不同的功能?ARM 行動市場全球行銷總監 James Bruce 笑著表示:「當然就是要用很多 ARM 的晶片囉!整個鋼鐵人最困難的部分是要整合所有感測器蒐集到的資訊,讓電腦計算然後在螢幕上呈現有意義的資訊,他的頭盔則用到虛擬實境的技術,需要搭載不同功能的晶片。」

就算你不是鋼鐵人,也會在每天的日常生活裡遇到 ARM 架構晶片,說不定你正用著採用ARM 架構晶片的裝置閱讀這篇文章呢! 又或者,透過廣泛運用ARM架構晶片,我們將一步步實現科幻電影裡的奇妙情節!

-----廣告,請繼續往下閱讀-----

延伸閱讀:

-----廣告,請繼續往下閱讀-----
文章難易度
鳥苷三磷酸 (PanSci Promo)_96
225 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

2

7
0

文字

分享

2
7
0
用 coding 寫出《鋼鐵人》的 AI 助理 Jarvis 有多難?——專訪臺大資工系陳縕儂副教授
科技大觀園_96
・2022/01/04 ・3527字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

近年來因為人工智慧、大數據、區塊鏈等應用科技快速發展,以及 Google 等科技公司大舉來到臺灣進駐並招聘大量軟體工程師,臺灣頂大的資工科系成為超熱門志願。不過大家對資工系的印象就是要學寫程式,也就是俗稱的 coding,但 coding 在解決什麼問題?今天我們訪問了臺大資工系的陳縕儂副教授,從老師的專業「自然語言處理」(Natural Language Processing,縮寫 NLP)做切入,來帶大家了解資工系究竟在解決什麼問題。

讓 AI 聽得懂人話,就是「自然語言處理」

陳縕儂老師的機器智慧與理解實驗室,主要是針對語言處理及對話系統相關技術進行研發,藉由機器學習技術,透過資料讓機器自動學習,理解人類語言並且進行適當的互動,目標是希望能讓機器的智能比肩人類,甚至超越人類。

陳縕儂教授與實驗室今年參加 Amazon Alexa Prize Taskbot 競賽的研究生們合影。(圖/陳縕儂提供)

「自然語言處理」是資工領域中的一個分支,名字聽起來很抽象,但其實這項學門的目標就是讓電腦可以「聽懂」人類說的話、「理解」語意並給予「回應」,就像鋼鐵人電影中的 AI 助理 Jarvis,鋼鐵人只要說如常說話就可以下達指令,讓 Jarvis 協助生活中各種大小事。

不過理想很飽滿現實卻很骨感,要做到像 Jarvis 這樣有求必應的 AI 助理並不容易,目前市面上的智慧助理如 Apple Siri、Google Assistant 及 Amazon Alexa 都已經隨著 3C 產品普及化了,但很多時候它們仍會說:「很抱歉,我聽不懂你的意思。」可見,從 Siri 到到 Jarvis 仍有很長的一段路要走,但為什麼這是條漫漫長路?——歡迎來到「自然語言處理」的思考領域。

-----廣告,請繼續往下閱讀-----

從「聽懂」到「回應」,AI 必須克服多項關卡

大家可以想像一下,今天要跟一個 AI 互動,通常是透過語音或者文字來下達指令,接著 AI 就會協助我們完成特定的任務,並解決特定的問題。

在這個過程中,有四個主要的環節必須克服,分別是語音辨識 (Automatic Speech Recognition; ASR)、語意理解 (Natural Language Understanding; NLU)、對話決策 (Dialogue Management)、以及語言生成 (Natural Language Generation; NLG),說的白話一點,就是接收你講的話、翻譯成 AI 能理解的指令、要如何處理指令,以及怎麼把回應翻譯成人類能聽懂的聲音或文字。

在這四個環節裡都有相當複雜的問題需要去解決,譬如語音辨識,在技術上通常是將語音訊號直接轉換成文字,讓 AI 去理解,但在將音訊輸入的過程中,就必須要排除掉我們口語中會用的「嗯」、「啊」、「喔」等贅字或不自然的停頓,又或者是新創的流行語、方言、口音……等等的問題必須先解決,才能讓 AI 真的能聽懂人類的自然語言。

在「語意理解」上,要讓 AI 去分析語言或文字的脈絡、理解關鍵字,再找出對應的資料(搜尋資料庫);而「對話決策」更是困難,前面理解了人類的語言或文字表意後,AI 應該要如何回應?可能使用者給的資訊不完整,AI 要追問使用者以釐清問題?又或者在語意理解上有聽不懂的字,得要再次詢問並確認?

-----廣告,請繼續往下閱讀-----

這還只是 AI 面對人類自然語言時,其中幾個回應的選項,真實的對話情境可能更加複雜,而且整個對話過程只要有一個環節正確度不夠高,那 AI 後續也很難準確的回應,只要有一步錯了,就會對後續對話體驗造成負面影響。

不過好消息是,現在的深度學習技術已經相當成熟,只要餵資料給電腦時,告訴他怎麼樣是對、怎麼樣是錯,基本上電腦都可以不斷修正(餵的資料也要夠多),再加上現行語言代表模型的優化,智慧 AI 在特定領域的應用上都有蠻不錯的成果。

AI 處理語音指令的過程。圖/陳縕儂提供

Jarvis 仍遙遠,AI 的新突破是精準翻譯

聊到這幾年 AI 的重要突破,老師提到三年前 Google 所開發的語言代表模型 BERT(Bidirectional Encoder Representations from Transformers),當時 BERT 一出現市面上所有自然語言處理的模型都改採用了它的運作邏輯。相較於過去的語言模型,通常都是餵指定任務的文字來訓練電腦,BERT 是在給電腦任務前,先餵它吃很多的文章或書,接著再提供任務給它。

以翻譯為例,這就好像讓一般人翻譯,跟讀過很多書的人來翻譯一樣,讀過很多書的人懂得字彙跟用法,自然翻譯出來的成品更流暢。

-----廣告,請繼續往下閱讀-----

而 BERT 的技術確實也得到相當好的成效,所以擊敗了當時許多正在開發的語言模型,成為了當前語言模型的基礎。有趣的是,BERT 的前身是一個名為 ELMo(Embeddings from Language Models,與芝麻街角色名字相同)的語言模型,所以 BERT 的開發者們就用芝麻街的角色,來為他們開發出來的語言模型命名。

當前 AI 發展的目標,為它建立「人的常識」

雖然說 NLP 領域在商業與學術上都有相當大的發展空間,但陳老師認為,目前要達到人的「common sense(常識)」對 AI 來說還是非常困難,舉例來說,今天我們跟智慧助理說我今天要跟某某人吃晚餐,這個時候如果是人類的助理,我們可能會聯想到「吃什麼」、「要不要聯絡某某人」、「交通方式是?」……等等與飯局相關的問題,但 AI 目前並沒有辦法執行這麼複雜的互動,還得必須跟 AI 說「幫我訂位」、「幫我叫車」,仍在一個指令一個動作的狀態,這種 AI「common sense」的建立,可說是目前非常有挑戰性的項目。

AI 的開發方向——人類的工作輔具

身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分,雖然說現階段許多人對於 AI 可以執行我們的工作感到彆扭,但實際上 AI 正在減輕我們的工作量,舉例來說,像是目前醫院已經有在使用協助診斷的 AI,但這樣的 AI 並不會取代醫生的工作,因為 AI 只是提供醫生診斷的相關依據,實務上對於病患的判斷最終還是得由醫生來做。

雖然 AI 已在產業中被廣泛利用,但基本上仍以「人機協作」為大宗,雖然能取代部分人力,但像是創造類型的工作 AI 就幾乎無法獨自完成。至於大家想像中,AI 恐對人類造成威脅的情節,基本上不會發生,因為 AI 是不會憑空出現意識的,AI 威脅人類的可能,比較會是人類不當利用造成的風險,所以在未來 AI 的開發上,基本上會往輔助人類的方向去做應用。

-----廣告,請繼續往下閱讀-----
身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分。圖/Pixabay

資工領域瞬息萬變,「喜歡新知」很關鍵

談到什麼特質適合來讀資工系,陳縕儂老師認為,數學或是邏輯只是基礎,重要的是「喜歡接受新知」的特質,因為在資工領域瞬息萬變,資訊更新的相當快速,隨時都會有新東西出來,如果不喜歡吸收新知識,讀資工系可能會比較痛苦一點。另外,資工在應用上時常會和不同領域的人做合作,你必須了解對方的需求跟他們的條件,才能設計出能夠幫別人解決問題的方法,而這也是資工有趣的地方。

陳縕儂老師也和我們分享了在他眼中臺灣學生和外國學生的差異,他認為臺灣學生應用網路資源自學的能力非常強,而外國學生則是勇於在課堂上和老師提問並討論,各有各的優點,不過教授也認為由於臺灣學生擅長自己找答案,所以在協作與表達上的可能相較於外國會比較弱一些,但如果這一塊能做到加強,臺灣的學生其實是非常有競爭力的。

陳縕儂副教授認為,臺灣學生在協作與表達上相較於外國學生較弱一些,但若能加強這一塊能力,臺灣學生非常有競爭力。圖/呂元弘攝

最後老師還告訴我們,當初大學時機器學習與 NLP 領域並不是資工領域的主流,一開始只是選擇了自己有興趣的領域,也沒想到近幾年 NLP 會變成現在的顯學,他認為自己真的非常幸運,可以一路延續自己熱愛的主題。

最後的最後,陳縕儂老師建議有意投入資工領域的學員們,可以先了解這個領域需要的先備知識,像是 coding 要用到的程式語言、跟 AI 相關的內容則會牽涉到數學,最後當然就是對知識的熱情和態度,了解之後才比較能判斷這個領域適不適合你,千萬不要因為從眾而選擇。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
所有討論 2
科技大觀園_96
82 篇文章 ・ 1126 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。

0

0
0

文字

分享

0
0
0
《〈柯南 零的執行人〉足球真能解決任何事?》——2019數感盃 / 國中組專題報導類佳作
數感實驗室_96
・2019/05/15 ・2474字 ・閱讀時間約 5 分鐘 ・SR值 562 ・九年級

數感盃青少年寫作競賽」提供國中、高中職學生在培養數學素養後,一個絕佳的發揮舞台。本競賽鼓勵學生跨領域學習,運用數學知識,培養及展現邏輯思考與文字撰寫的能力,盼提升臺灣青少年科普寫作的風氣以及對數學的興趣。

本文為 2019數感盃青少年寫作競賽 / 國中組專題報導類佳作 之作品,為盡量完整呈現學生之作品樣貌,本文除首圖及標點符號、錯字之外並未進行其他大幅度編修。

  • 作者:鍾依庭/台北市立明倫高中

一、研究動機

去年紅遍全台的柯南電影——零的執行人,不但壓倒性強勢攻上日本全國票房榜首,創下觀影人數達1,289,000人,票房突破16.7億円(約新台幣4.67億元),創下系列作品首週票房最高紀錄!我們就來一探柯南拯救世界背後的數字究竟隱藏了多驚人的秘密吧!

二、前情提要

一開始,無人探測機-天鵝號,結束火星上採樣本的任務,即將返回地球,透過遠端操控程式修正衛星軌道,讓其脫離等速率圓周運動的軌跡,使其墜落地球,且墜落過程中,探測機本體會在大氣層中燃燒,僅讓直徑約4m的太空艙重返大氣層,之後本體的隔熱罩分離,降落傘會展開,預定將在日本近海的的太平洋上降落。

殊不知,兇嫌利用網路技術,駭入遠端操控無人機的程式,更改其墜落軌道,企圖讓太空艙墜落於警視廳。警方為了避免傷亡,將居民疏散並暫時安置在新興建造,位於東京填海地區的博弈塔中。另一方面,為了防止無人機墜落於警視廳,柯南與公安警察安適透利用阿笠博士發明的遙控型無人機,承載炸藥,飛向墜落中太空艙,於離地30000m的高空將炸藥引爆,藉由爆炸的能量改變無人探測機落下的軌道,希望讓其落入太平洋上,沒想到改變軌道後的太空艙,居然不偏不倚的朝向充滿避難居民的博弈塔方向飛去 !

此時,柯南乘坐安室的車,為了再次解決危機,朝向博弈塔的方向駛去,並開上了一棟20層樓高的興建中大樓,從頂樓以180km/hr的速度衝向空中,接著就是大家熟悉的場景,柯南利用一記射門,將足球踢向墜落中的太空艙,並成功讓其些微偏移原本的軌道,只有擦撞到博弈塔邊緣,對整體結構沒有很大的影響,成功化解了危機。

-----廣告,請繼續往下閱讀-----

接著,就來探討這令人吸睛的過程,究竟有無可能發生?

三、禍從天降

根據每日頭條報導,以色列一無人太空飛行器高1.5米,直徑2米,重600公斤,若將所有太空艙視為一圓柱體且密度皆相同,接著由圓柱體積公式及密度公式 :

將無人探測機從宇宙失重落下的位置視為警視廳的正上方,離地30km處(也就是引爆炸藥的高度)的順時速度為10km/s,不計空氣阻力,重力加速度為10m/,炸藥爆炸時會改變太空艙墜落的方向。

-----廣告,請繼續往下閱讀-----

將炸藥產生的能量視為水平衝擊,不影響鉛質落下的速度,爆炸釋放的能量會使太空艙進行水平拋射運動。接著由下圖可知,警視廳本部到博弈塔(東京填海地區)的直線距離為11.63km(約12km)。

google地圖與東京都港灣局公布的填海地區域圖之疊圖

三、禍不單行

爆炸後太空艙會因為炸藥衝擊而得到一水平方向的力,也就是說爆炸造成的平拋運動,不影響鉛質速度,爆炸前後落地時間不會改變。已知改變軌道的太空艙會撞上博弈塔,又太空艙在爆炸後第3秒末時(落地瞬間),要擊中相距警視廳(原落下位置))12km處的博弈塔,可以推算出爆炸後太空艙的水平速度為(km/s)。

太空艙落下過程示意圖(圖源 : 自己)

-----廣告,請繼續往下閱讀-----

安室與柯南將車駛至高20層樓的廢棄大樓,高度約為3*20=60(m),柯南由離地60m高處將足球踢向墜落中的太空艙,假設柯南踢球的力道為鉛直向上,一顆普通足球的平均重量為440g,使球做一鉛直上拋運動,且足球與太空艙碰撞時,要讓太空艙產生1m的軌道偏離,也就是說球向上的鉛直速度要大到足夠讓太空艙鉛直下降的速度降低,使其落地的距離延後1m。若柯南所踢的足球接觸到太空艙的瞬間為落地前一秒,碰撞前,太空艙最後一秒的水平位移原為4km=4000m,碰撞後,要延後1m落地,也就是說,最後一秒內要行走的距離變成4000+1m。

利用動量守恆公式,可得4000 2400+0.44v=(2400+0.44) 4001,v = 9455.55m/s。

如果想讓太空艙偏離原本落下的軌道,柯南至少要讓一顆440g的足球產生將近10000m/s。那麼究竟需要多大的力道才能讓球產生比音速還快的速度呢?這個速度就連M16突擊步槍(子彈射出的速度為1450m/s)也無法超越。

假設柯南踢球時,腳與球的接觸時間為0.1s,接著可以利用衝量公式

-----廣告,請繼續往下閱讀-----

當柯南對足球的鉛直施力大於41604.42N時才能讓太空艙產生1m的偏移,反之,若施以小於41604.42N的力,墜落太空艙就會擊中博弈塔,這樣是無法拯救在塔中避難的居民(還有小蘭)。

上述討論情形還是在沒有空氣阻力的理想情況下,若討論空氣阻力,也就是現實的情況之下,需要施比41604.42N更大的力,才有可能讓太空艙產生些許的軌道偏移。

五、大危機背後的數字

那麼,41604.42N的力量又有多大呢?如果對牛頓這個單位沒有概念的話,可以用1kgw=10N來換算,大約是4160.442kgw的重量,就連武林中的風雲人物李小龍,一也只能踢出700kgw的力量,再者以一個小學生的外表與肌肉量,想踢出超過4160kgw的力道,根本違反了人體工學,想做到幾乎不可能,但從成功的結果來看,應該要將一切歸功青山岡昌老師(名偵探柯南的作者)過人的想像力。

六、有朝一日

或許在未來科技的進步之下,宇宙並非遙不可及,但探索其奧秘的同時,勢必會有些負面的影響,例如大量的探測機要從宇宙帶回遙遠星球甚至星系的樣本,又或是突然有巨大太空垃圾撞擊地球時,一定會對地球造成傷害,但若科學家們能製做一台機器,讓某物體(例如足球)在極短的時間內獲得極大的加速度,藉此改變其落下的軌道,將能減少對地球的傷害。

-----廣告,請繼續往下閱讀-----

更多2019數感盃青少年寫作競賽內容,歡迎參考 2019數感盃特輯、數感實驗室官網粉絲頁喔。

參考資料

-----廣告,請繼續往下閱讀-----
數感實驗室_96
76 篇文章 ・ 50 位粉絲
數感實驗室的宗旨是讓社會大眾「看見數學」。 數感實驗室於 2016 年 4 月成立 Facebook 粉絲頁,迄今超過 44,000 位粉絲追蹤。每天發布一則數學文章,內容包括介紹數學新知、生活中的數學應用、或是數學和文學、藝術等跨領域結合的議題。 詳見網站:http://numeracy.club/ 粉絲專頁:https://www.facebook.com/pg/numeracylab/