Loading [MathJax]/extensions/tex2jax.js

0

0
1

文字

分享

0
0
1

到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(下)【科系篇】

人機共生你我它_96
・2020/05/22 ・4807字 ・閱讀時間約 10 分鐘 ・SR值 558 ・八年級

  • 作者:楊期蘭

路人:「聽起來就是在設計 APP 啦~」

同系的朋友:「好像是在做網路通訊吧,還是多媒體那種,常常需要找人來試用他們的系統。」

社會科學專家:「人機互動真的有在讀理論嗎?我看實驗都做得不是很嚴謹欸,人的行為很複雜,不是幾行數字就可以解釋清楚的。」

資訊領域專家:「人機互動做的東西感覺我們都做過了啊,而且技術都很成熟也商品化了,再說你們的研究方法怎麼樣本數都這麼少?沒有大數據支持、資料處理方式看起來也是靠人力沒有自動化?怎麼不用自然語言處理技術處理訪談資料?樣本這麼少或根本沒有數字很難讓人相信你們的結果欸。」

不同領域的人會從不同角度看待人機互動,因此每個人看到的角度就會不太一樣。圖\pexels

當身邊有在做「人機互動研究」的人時,大家會不會有類似的疑惑?好奇他們到底在做什麼?

而自己就是在做「人機互動研究」的人,多少會被問到類似的問題:「人機互動到底是在做什麼?」特別是當對方來自某個學科背景,在聽完人機互動研究後經常因為覺得學科間部份重疊性而帶著自己的有色眼鏡來評斷人機互動研究。

這次要透過、下兩篇,用面對 20 種不同背景的聽眾來解釋人機互動在做什麼,一方面為好奇的讀者們解惑;另一方面想跟同為人機互動研究的讀者們一起討論到底怎麼向不同類型聽眾溝通比較合適。

上集,我們已經先從生活會遇到的對象解釋起;這篇下集會從面對不同學科背景的朋友開始解釋:人機互動是什麼?

-----廣告,請繼續往下閱讀-----

11.  對正要選系的高中生:

目前在台灣的大學部跟研究所都還沒有一個系所稱作人機互動學系,但是因為人機互動是一個沒有領域分界的學科知識(但是有一套專屬的研究方法論),所以在任何科系裡都有可能將某一個科系的學理知識或方法論挪用到人機互動的研究上。

人機互動顧名思義有包含人的部分跟機器、系統的部分,因此在無論你/妳對人感興趣或對電腦比較感興趣,只要選的科系能夠讓你/妳對這兩個其中一個有很深入了解,未來都很有機會直接把所學跟人機互動研究結合在一起。

人機互動是不分領域的學科知識,因此可以廣泛運用於各領域。圖\GIPHY

12. 對人文藝術背景的朋友:

-----廣告,請繼續往下閱讀-----

人機互動是去探究科技如何對人類產生不同層面的影響,像是如何透過科技來進行藝術創作,進而引發人去反思;如何將文本數位化讓使用者有更多不同於以往的新互動,產生新的閱讀、欣賞體驗;如何運用科技作為媒介來輔助創作者創作、分享作品、擴大與欣賞者的互動等,都會有人機互動的成分在其中。

13. 對自然科學背景的朋友:

人機互動是一門運用科學研究方法了解人類如何使用電子系統的學科。人機互動跟自然科學相同地方在於兩個學科都會提出研究問題、提出假說、進行實驗,最後得到不同於以往的新發現來回答研究問題,透過可被重複驗證的方式來了解某個現象,這個現象在自然科學領域就是「自然現象」,而在人機互動領域就是人類行為如何受系統影響,或是系統的什麼新設計幫助了人類。而不同於自然科學之處在於人機互動研究對象是「人與機器」的這個組合,而自然科學則是研究自然界的純物質。

人機互動跟自然科學都需要提出研究問題、提出假說、進行實驗,並得出實驗結論並探討。圖\GIPHY

14. 對生物醫學背景的朋友:

-----廣告,請繼續往下閱讀-----

人機互動與生物醫學領域部分相同之處在於研究對象都是人,而人機互動領域除了了解人以外,多加入了設計系統的部分。就應用層面來說,了解醫護人員、生醫專家如何在緊急繁忙醫療現場使用生醫系統或是醫院內部資訊系統,並透過科技來輔助醫療行為進行、如何設計好的溝通媒介來促進醫病之間溝通等,就是部分人機互動研究在解決的事。

最近為了找到對抗新冠病毒的疫苗,除了生物醫學科學家之外,群眾外包也被視為其中一個嘗試找到新型蛋白質結構的方式,透過遊戲化的互動設計,讓不同觀點的群眾可以投入共同解決科學領域難解的問題,突破一些專家盲點。怎麼設計一個好的群眾外包機制來讓公民參與科學,也是人機互動領域的一個研究主題之一。

人機互動研究亦可透過科技來輔助醫療行為進行,或加速實驗的運行。圖\GIPHY

15. 對社會科學背景的朋友:

人機互動與社會科學領域部分相似之處在於我們都以人當作研究對象,也同樣會根據不同研究問題分別透過微觀與鉅觀角度來分析人類行為。「人」是人機互動領域的主角,因此人機互動借用了許多社會科學長期對於人類行為了解所建立的理論,藉此引導系統設計的方向,像是心理學對於個體的認知優勢與限制的理論、傳播學對於人際溝通時語言行為使用的了解、社會學對於個體與社會結構如何相互影響的理論、人類學告訴我們不同文化下人類形成的不同慣習等,這些對於人類社會豐富的了解都是人機互動研究需要的基礎。

-----廣告,請繼續往下閱讀-----

人機互動研究想達到的目標之一就是去了解:當人與科技互動時,人類會有什麼新的行為發生、會如何被賦能;同時並提出科技對人類社會可能帶來的利與弊,藉此引導政策制定方向或科技系統設計方向。

人機互動能借用社會科學長期對於人類行為了解所建立的理論,建立系統性的設計。圖\GIPHY

16. 對工程背景的朋友:

人機互動是了解人如何使用機械或電子系統的學科,與工程領域相似的地方在於兩者都需要先定義問題,並設計出能解決問題的最佳系統;不同之處在於人機互動在系統設計的環節中多把「使用者」納入設計考量,所以在評斷系統效能的時候,除了比較不同系統之間的表現 (performance) ,也同時需要評量使用者使用系統的表現。

17. 對資訊背景的朋友:

-----廣告,請繼續往下閱讀-----

人機互動是一門了解人怎麼跟資訊系統互動的學科,與電腦科學相同的地方在於兩者都是為了解決一個問題設計出一套最佳的演算法或是資訊系統,並且用量化方法來比較不同算法或是系統的效能;不同之處在於人機互動研究者在設計演算法與資訊系統需要將使用資訊系統的人也納入設計考量中,因此在比較系統效能時,除了透過「數字」比較系統效能外,也會有部分不能數值化的比較參數,原因在於使用系統的使用者包含了「可被數值化」與「不可被數值化」的部分,可被數值化的部分就跟資訊系統的評量方式一樣,可以透過比較數字大小看出差異,但不可被數值化的部分就需要透過其他研究方法來了解,也就是「質化」分析方式,才能告訴我們資訊系統對人產生了什麼影響、背後隱含的意義是什麼。

在資訊系統開發設計過程中,人機互動研究者也會需要考量其中「不能被數值化的部分」,讓系統設計更加貼近人的需求。圖\pexels

18. 對設計背景的朋友:

人機互動就是在透過科技解決問題的學科,與設計領域相同之處在於兩者都是透過「設計」某個實體或虛擬的東西來解決問題,設計學門的設計範疇非常多元廣泛,但人機互動則是將目標放在設計「人與科技物之間的互動」的範疇內。

19. 對做使用者經驗 (UX) 的朋友:

-----廣告,請繼續往下閱讀-----

人機互動是了解使用者如何跟各種不同的科技物、數位系統或網路互動的學門。使用者經驗研究涵蓋的範圍很豐富多元,只要有人的地方就會產生經驗,而這些經驗不一定需要在有科技物的情況下發生,像是人在傳統市場採購的經驗、人們在某個場所共同經歷一個活動的經驗等,使用者經驗可以包含使用科技物的經驗也可以不包含;而人機互動與使用者經驗重疊的部分在於人機互動也需要了解人的經驗,但不同之處在於它是企圖了解:人如何使用科技物、人際關係怎麼被科技物影響、科技如何影響人等,解決問題的範疇是在「人與科技物互動」之中。

透過了解使用者,人機互動研究才得以知道「人如何使用科技物」或是「人怎麼透過科技物跟其他人建立關係」,進而產出好的設計。圖\GIPHY

20. 對其他也是在做人機互動的朋友:

人機互動廣義來說就是人與運算系統的互動,但在人機互動研究的大傘下又有許多不同的子主題,詳細請參考,不同子領域有各自著重的研究貢獻,有些著重於新奇的互動設計、有些則將重點放在系統設計、而又有一些是把重點放在了解這些使用社群科技系統下的人們或是特殊情境。每個子主題的共通點就是包含了「人」與「運算系統」這兩個成分。對筆者而言,科技在人機互動中扮演的角色是「賦能」 (empower) 而非取代人類,科技設計目的是為了讓人完成原本做不到的事、產生原本無法實現的人際交流,使得人在物理上、心理上都比以往更有能量。

你/妳的定義是什麼?

看完了 20 種不同的人機互動解釋,可以看出無論解釋的對象是誰,

-----廣告,請繼續往下閱讀-----

人機互動共通的內涵就是去了解並設計人與機器之間的互動機制。

人機互動的定義絕對不是只有這些,根據不同對象的需求、談話的目的,就會有不同的定義,而且不同背景的人即便看到同一個詞彙,解讀跟思考方向都不同。就像「人工智慧」這個詞,有人看到後想的是數學模型、有人是演算法、有人是應用情境、有人是倫理議題,無論從哪個角度看都有其道理,但若想展開討論,我們需要確認雙方都是在對某個詞彙有同樣定義情況下討論,否則就只能各說各話、耍耍嘴皮子。

人機互動因為研究主題包含「人」與「科技」,因此除了自己發展出屬於這個學門的理論外,也會奠基於其他學門不斷累積的知識,像是社會科學對人的認識、工程科學科學在電腦科學技術的發展,相互融合來產出人機互動的研究成果。不同學門在主題選擇上、方法上、研究結果上多少會有重疊的部分,學門的定義到底該涵蓋那些概念,最後還是回歸到某個所屬的科學社群共同想解決的問題是什麼。

不同學門在主題選擇上、方法上、研究結果上多少會有重疊的部分,學門的定義到底該涵蓋那些概念,最後還是回歸到某個所屬的科學社群共同想解決的問題是什麼。圖\pexels

定義是由人建構出來的,不同科學社群想解決的問題不同,定義跟切入點就會有所不同,這些定義也可能隨著時空背景推移跟著調整,找 10 個在做人機互動的研究者來分享,也很有可能會產出 10 個不同的版本。一個詞彙的定義很多元,端看我們想跟誰說、目的是什麼。

各位讀者同意這(上)、(下)兩篇提到的人機互動解釋嗎?同意的話,有什麼想補充嗎?不同意的話,覺得哪裡可以更好?找機會跟我們交流討論吧!

延伸閱讀:

到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(上)【親友篇】

  • 感謝沈奕超、張元嘉、陳美伶、黃振瑋、王邦任提供編輯建議

本文轉載自人機共生你我它,原文為〈【科系篇】到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(下)

-----廣告,請繼續往下閱讀-----
文章難易度
人機共生你我它_96
12 篇文章 ・ 4 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
講話太難語音助理聽不懂?利用互動設計讓人講「機器話」
人機共生你我它_96
・2020/07/27 ・2309字 ・閱讀時間約 4 分鐘 ・SR值 536 ・七年級

「這段時間,我們一直納悶控制的方法在哪裡……」
「沒想到就是我們自己。」

——《人生複本》 Blake Crouch

有沒有注意自己的日常用語會跟自己經常接觸的朋友們越趨接近?像是辦公室有人開始講:「是在哈囉?」身旁會也越來越多人在不經意間說出:「是在哈囉?」我們跟某個朋友聊天時,如果對方原本都沒有在用貼圖,但是突然有一天他/她開始用了貼圖,我們也開始跟著用貼圖來回應對方。

用語上的一致性 (lexical alignment / lexical entrainment)能夠讓人跟人之間距離更靠近,增加彼此的信任感。不僅在語言上,行為上一致性(姿勢、動作等)也能在兩個溝通越來越順暢的人們身上觀察到,而且人們在沒有察覺的情況下,對於那些語言與行為跟自己一致的人也展現較多好感。

大家下次在外面吃飯時,不妨觀察隔壁桌的兩人是否會輪流用手托腮。圖/Unsplash

語言一致性的涵蓋範圍廣泛,包含用詞選擇、腔調、語速,甚至是修辭結構。

-----廣告,請繼續往下閱讀-----

舉例來說,當我們在跟朋友描述自己所在的位置時:「我在地下室一樓」此時,對方比較有可能回應「我在地下室二樓」,而不是「我在 B2」。

但人與人之間對話時的用語一致性跟語音助理設計有什麼關係呢?

無論與人或電腦對話,我們都會配合對方的用語

我們可以透過瞭解人跟電腦對話的時候,是否也會出現這樣的用語一致性。在這個實驗當中,研究者們會讓使用者分別跟三個不同的角色語音對話對話,分別是:

  • 真人
  • 較舊版本的電腦
  • 較新版本的電腦

而且使用者們會明確地被告知即將對話者的身分。如果是舊版電腦,就會看到一個螢幕開機畫面上寫著是 1987 年的作業系統版本;如果對話的是新版電腦,就會在螢幕上看到 2003 年的作業系統版本。

-----廣告,請繼續往下閱讀-----

圖/pickpik

接著,請使用者在實驗過程中分別跟三個不同的角色互相看著圖片描述一個物品,例如:看一張電燈的圖片。不過「電燈」的另一個稱呼也可以是「檯燈」,這時候研究者就讓他們輪流向對方說出照片裡的物品,進而讓研究者們分析使用者會不會因為對方用了某個詞彙,後續再看到同樣的圖片時也用同樣的詞彙。

結果發現,是的!使用者不但會配合另一個人的用詞方式,也會配合電腦的用詞。

即便使用者知道自己在跟電腦對話,當電腦一直用固定的詞彙描述圖中物品時,使用者的描述用詞也會配合電腦,就如同配合人一樣,用同樣的詞彙來描述物品。

但是這種用同樣詞彙的配合程度不同,當使用者知道自己在跟一個舊版本的電腦對話時,配合的程度就高於最新版本的電腦或是人類。也就是說,當我們知道電腦可能「比較笨」的時候,我們就更容易去配合它的用語。而這個效果透過很表面的知覺操弄就可以做到,就像實驗中讓使用者看到不同版本作業系統就會達到配合程度不同的效果。

-----廣告,請繼續往下閱讀-----

不只用詞,在句子結構上也會配合語音助理

除了看字彙選擇是不是會有一致性,研究者們也發現當請使用者分別跟另一個真人、另一個發出機器音的語音助理、另一個擬人聲的語音助理對話,無論和誰對話,使用者自己的句子結構都會有配合對方的傾向。

圖/Unsplash

研究者們邀請使用者向三個不同的角色互相描述圖片中的畫面,從中我們可以發現兩個不同的描述方式:

  • 左圖:「大明給小王一張卡片」=「大明把卡片給小王」;
  • 右圖:「一個藍色的圓圈」=「一個圓圈是藍色的」。

接著讓使用者分別跟三個角色輪流描述多長不同的圖片給對方聽。結果發現,如果對方一直用「A 把(物品)給 B」或是「形容詞 + 名詞」這種結構來描述圖片的話,自己後續描述圖片的方式也會趨向這個方式。

-----廣告,請繼續往下閱讀-----

所以,無論跟自己對話的是人,或是機器音的語音助理,還是擬人聲的語音助理都有同樣的效果。

利用人們「一致性」本能,互動設計讓語音助理更好用

從我們與語音助理的互動經驗中可以發現,只要語音助理無法辨識我們說出來的內容,就無法給出符合期待的回應,所以自然語言處理(Natural language processing, NLP)的專家們持續發展語音辨識的技術。然而在新技術尚未推出之前,我們其實可以從人機互動的角度來修正語音助理的設計。

以本次回顧的系列研究的結論來說,人會隨著溝通對象而改變語言使用習慣,包含用語、句構。尤其當人認為電腦越不聰明時,配合程度越強。因此,設計師們不妨根據現有技術,先讓語音助理講出一些簡單的句子結構來開啟對話,再引導使用者也使用相似的簡單結構來回覆,而不是一定要專注在設計出能夠進行複雜對話的語音助理。

例如:當我們透過 Hey, bot 喚醒語音助理後,先讓語音助理說出:「嗨,下指令」這個簡單的句子結構,進而引導使用者說出:「好,播音樂」。

從系統設計角度來看,這麼做能在一開始就讓使用者在不知不覺中說出系統比較容易辨識的指令。就像我們在跟小小孩對話的時候,當他對我們說:「我要車車~」的時候,自己也會很自然的回應:「車車給你~」。

-----廣告,請繼續往下閱讀-----

如此一來,使用者就不會因語音助理辨識錯誤而太失望了,不是嗎?

圖/unsplash

延伸閱讀

感謝沈奕超、張元嘉提供編輯建議

參考資料

  1. Cowan, B. R., Branigan, H. P., Obregón, M., Bugis, E., & Beale, R. (2015). Voice anthropomorphism, interlocutor modeling and alignment effects on syntactic choices in human-computer dialogue. International Journal of Human-Computer Studies, 83, 27-42.
  2. Branigan, H. P., Pickering, M. J., Pearson, J., McLean, J. F., & Brown, A. (2011). The role of beliefs in lexical alignment: Evidence from dialogs with humans and computers. Cognition, 121(1), 41-57.
-----廣告,請繼續往下閱讀-----
人機共生你我它_96
12 篇文章 ・ 4 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。

0

0
1

文字

分享

0
0
1
到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(上)【親友篇】
人機共生你我它_96
・2020/05/21 ・4886字 ・閱讀時間約 10 分鐘 ・SR值 517 ・六年級

  • 作者:楊期蘭

鄰居:「人機互動喔?感覺是在做機器人。這樣以後要做什麼?去台積電嗎?」
:「好像跟 UX 有關吧,我也不太確定 @@ 」
路人:「人際互動喔?人際互動怎麼是在資訊系?聽起來是文組的東西欸。」

當身邊有人提及「人機互動」,非專業的人不免會露出疑惑的表情。圖\pixabay

當身邊有在做「人機互動研究」的人時,大家會不會有類似的疑惑?好奇他們到底在做什麼?

而自己就是在做「人機互動研究」的人,多少會被問到類似的問題:「人機互動到底是在做什麼?

這次要透過上、兩篇,用面對 20 種不同背景的聽眾來解釋人機互動在做什麼,一方面為好奇的讀者們解惑;另一方面想跟同為人機互動研究的讀者們一起討論到底怎麼向不同類型聽眾溝通比較合適。

-----廣告,請繼續往下閱讀-----

這篇上集我們會先從生活常遇到的對象解釋起;下集會從面對不同學科背景的朋友開始解釋起。

1. 對在讀國小的表弟妹:
在路上抓過寶可夢嗎?我們之所以能用手機 APP 看到街上有寶可夢,又能跟一群不認識的路人同時沈迷於蒐集寶可夢的過程就是人機互動研究的應用之一。人機互動就是在設計一些小遊戲,讓大家在玩遊戲的過程中同時養成一些好的習慣或是改變人的行為

像是我們有時候會懶得刷牙,但是如果刷牙的時候可以看到牙刷一閃一閃或是放出音樂,我們就會把刷牙這件事想成是在玩遊戲,久而久之就能養成刷牙習慣;或是我們討厭爬樓梯,但如果樓梯塗上黑白的顏色,被畫得像鋼琴一樣,踩下去會發出不同聲音,我們就會想走到樓梯上試試看,自然而然就養成了走樓梯的習慣。

2. 對爺爺奶奶:
每次新買一個電視、電子鍋、熱水壺、遙控器就要找孫子教或是看半天說明書還是不太會用,人機互動研究就是要想辦法讓每天會用到的電器產品可以更容易被使用,讓阿公阿嬤可以完全不看說明書就直接能夠操作各式各樣電器產品。

-----廣告,請繼續往下閱讀-----

3. 對爸媽跟親戚:
在外地生活的小孩電話都不接時,看他有沒有已讀訊息就好,至少知道他還會看手機。這種通訊軟體上已讀功能的設計或是讓我們在群組裡面回覆某一則訊息、傳送表情符號等,通訊軟體上的各種小細節能讓我們感覺到不在身邊的人與我們心理距離很近,這些巧思就是人機互動的研究範疇之一。

人機互動的研究範疇也包含設計便於長輩使用的電器、通訊軟體等,讓長輩們的生活更便利。圖\pexels

人機互動就是在解決生活中每天都會用到的電子產品、網路世界的問題,包含要怎麼讓車子裡的導航系統順利引導我們找到方向又不會分心、手機上 LINE 要怎麼設計才可以很方便讓我們傳訊息給朋友、點進去網頁的時候怎麼讓我們看到可能有興趣的新聞、操作網路銀行的時候怎麼很清楚知道哪個按鈕點下去能讓我們完成想做的事等等。

4. 對國高中生:
大家每天幾乎都會滑 IG 、抖音、看 YouTube ,我們在用這些線上軟體時能跟每天見面的同學有跟深入的交流,也可以投過這些社群平台認識更多實體生活以外的人;在虛擬世界裡,經常有自己被觀眾圍繞的感覺、能一直看到自己感興趣的東西,這些都是人機互動研究精心設計達成的;我們經常在網路論壇上看到別人打筆戰或是講一些很難聽的話,要怎麼引導網友們友善討論,這些都是人機互動想解決的事。這個學科是了解並設計我們每天都會用到的數位電子產品還有線上服務,讓我們可以透過電腦來跟更多人建立社會關係。

-----廣告,請繼續往下閱讀-----

人機互動研究的精心設計能讓人們在虛擬世界展開人際互動,並促進社會交流。圖\GIPHY

5.  對鄰居、搭話的店員:
人機互動就是在想辦法設計出好用的電子產品跟數位服務,把生活中的東西都電子化、數位化,然後設計一些方法讓我們不用出門就可以完成大部分的事。像是網拍網站要怎麼設計,怎麼引導消費者在虛擬商店購物;或是我們每天在路上都會看到的外送員,我們怎麼透過 APP 訂餐、對外送員評分機制該怎麼設計才能讓所有人滿意;硬體的話,像是大家戴的運動手環,裡面要收哪些身體的資訊、收完了要怎麼呈現給我們看才會有幫助、都是算是人機互動的研究範圍。

6. 對愛好科幻電影的朋友:
人機互動就是在想辦法實現那些科幻電影或科幻小說裡面提到的各種新奇科技,像是手在空中滑來滑去就可以讀取資訊啊、讓人在虛擬世界裡面也能感受到實體世界的沈浸感、怎麼跟雲端情人好好說話等等。

未來的人機互動或許能實現科幻電影中的情節。圖\GIPHY

-----廣告,請繼續往下閱讀-----

7. 對公司主管:
最近經常被大家提及的數位轉型就非常仰賴人機互動研究方法跟理論知識,因為人機互動就是在了解使用者如何透過資訊系統取得想要的資訊、資訊系統如何幫助人更順利完成手邊任務。舉例來說,員工如何很快就了解資訊架構、透過公司內部系統取得需要的資料;員工透過內部通訊軟體與遠端部門溝通的時候有如人就在旁邊的感覺;客戶怎麼透過線上入口網站獲得公司的資訊、如何順利在線上完成各種購買、申請、詢問等等。

人機互動研究對內可以幫助公司運用資訊系統來管理數位化知識、輔助不同部門員工協作、整合跨國跨部門資料;對外也可以讓公司透過適當的數位媒體設計來讓客戶更容易了解公司產品或是更有效率解決客戶問題。

人機互動研究可以幫助公司運用資訊系統來管理數位化知識、輔助不同部門員工協作、整合跨國跨部門資料,甚至有效率處理客戶協商。圖\pexels

8. 想轉職、喜好涉略不同知識、想嘗試不同可能性的朋友:
人機互動就是現在在台灣就業市場幾乎不會開出來的職缺 XDD ,但沒職缺不表示沒需求,這一方面源自於過去台灣的產業結構與發展重點著重於硬體發展,另一方面在於還不是這麼多人知道人機互動到底是什麼、能怎麼運用人機互動知識。

-----廣告,請繼續往下閱讀-----

但是在看了這篇之後能夠看出人機互動在生活上的普遍性,特別是在現今這個每天都離不開電子裝置、網路世界、重要資料都數位化的時代裡。所以還有很多探索新方向、解決舊問題的機會,了解這些人機互動討論的議題可以擴展自己更多可能性。

9. 對覺得自己很跨領域、害怕面對愛戰文組理組的人的朋友:
人機互動廣義來說關注的是科技與社會之間的關係,在這範疇下的研究問題可以從很多元的層面切入,因此在這科學社群裡不需要戰文組理組,不需要帶著過去訓練背景的領域來區分彼此。某個知識體系下培養出來的是一個人思維的方式、認識世界的方式,而這些不同的學理知識或思維方式都能幫助人機互動領域產生新的知識。

由不同專業領域的人士共同設計人機互動,能使功能更全面。圖\pexels

無論你/妳擅長哪一種認識世界的方式,都可能在人機互動的問題中提出有趣的觀點,並運用某一學門的方法論來回答人機互動的研究問題。每個人擅長的領域都不同,有人對動手做東西很有概念,有人對理解人類行為很敏銳,無論是哪種,都能在人機互動領域有所發揮。

-----廣告,請繼續往下閱讀-----

10. 對什麼都不信,只相信數據(數字)會說話的朋友:
人機互動要解決的是「人跟電腦」兩者間的問題,所以在設定評鑑標準的時候就會有「數值化」與「非數值化」的部分。要衡量「系統本身的成效」透過數字是必要的,但是在衡量「人」的部分,數字只能提供部分的資訊,不能幫助設計者、開發者了解脈絡。

舉例來說,當我們知道使用者在用系統 A 的時候比系統 B 的時候表現來得好,透過問卷得到的分數只能讓我們知道哪個系統對使用者有幫助,但卻無法讓我們知道表現好與不好背後可能的原因,不知道原因的話就不能讓我們在系統設計面對症下藥,這時候就需要透過行為分析或訪談加以了解;另一方面,人跟自然物質不同,人包含了「可數值化」與「不可數值化」的部分。

完全「數值化」的資訊會使得系統設計不夠全面。圖\GIPHY

可數值化的部分就像是身高、體重、視力、反應時間、頭髮長度、眼睛大小等,難以數值化的部分則是人的思考歷程、情緒、想法等。透過數值化的方式來衡量人類行為雖然可以很快讓我們了解行為趨勢,但是不能了解原因。比如說這篇文章當讀者跟我說可讀性 3 分(滿分 10 分) ,這個資訊可以讓我知道文章不好讀,但卻無法讓我知道究竟是訊息呈現方式不好讀?作者跟讀者之間的知識落差尚未被填滿?或是被傳遞的資訊本身就需要花時間思考?

-----廣告,請繼續往下閱讀-----

機器的所有特質都可以被數值化,所以會有標準答案,但是人這種不能全部被數值化的特性,也使得與人有關的事就不會有標準答案存在。這也是為什麼人機互動這門學科除了透過量化方式來回答研究問題外,也非常需要仰賴質化分析幫助我們了解人機互動中「人」的部分。

講到嘴角全是泡沫,卻如同雞同鴨講

我們身邊有各種不同領域的大大、達人、專家,當這些擅長某個領域的專家在向外行人解釋自己非常熟悉的內容時,由於太過熟悉自己的拿手項目,容易落入向外行人解說時會描述得太抽象、忽略許多細節的陷阱,或是難以站在不同讀者的角度換位思考,以致於外行人無法理解。一旦你知道得太深入,就回不去什麼都不知道的狀態,理所當然難以想像什麼都不知道的人需要知道什麼、想聽什麼。

各式各樣內行人與外行人的溝通困難發生在你我身邊,回想當教授在台上講的天花亂墜,底下一頭霧水的畫面;看病時醫生描述的病情自己需要反覆釐清才能知道那些專有名詞是什麼;資深的同事無法理解新人怎麼連這個都聽不懂;客戶或其他部門的人怎麼都聽不出自己報告的重點;甚至是政府部門向大眾溝通新的教育政策、公共政策時,若沒有妥善溝通,聽眾便不一定能理解政策背後的專業性與目的,以致於政策執行困難或反彈聲浪四起。

過於專業的用語來解釋一樣東西,常常會使非專業領域人士有聽沒有懂。圖\pixabay

溝通專業知識時需要「見人說人話」

不少研究者致力於了解要如何輔助「不同領域專家」向外行人解釋自己熟悉的概念,系列研究發現,當某個領域的專家向外行人說明時,

如果能知道接收者(聽眾、觀眾)的背景知識,就能調適自己解釋的方式來配合對方,讓對方更理解自己在說什麼。

每位讀者都是某個領域的專家,當身旁有朋友問起你/妳在做什麼的時候,可以試著從對方的興趣與背景著手,嘗試調整自己的解釋方式,讓更多人認識妳/你的專業領域。

最後,也歡迎分享你們的專業領域,試著用對不同角色聽眾來說明你/妳的專業是什麼,想知道 +1

延伸閱讀:到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(下)【科系篇】

  1. Nückles, M., Winter, A., Wittwer, J., Herbert, M., & Hübner, S. (2006). How do experts adapt their explanations to a layperson’s knowledge in asynchronous communication? An experimental study. User Modeling and User-Adapted Interaction, 16(2), 87–127.
  2. Fussell, S. R., & Krauss, R. M. (1992). Coordination of knowledge in communication: Effects of speakers’ assumptions about what others know. Journal of Personality and Social Psychology, 62(3), 378.
  • 感謝沈奕超、張元嘉、陳美伶、黃振瑋、王邦任提供編輯建議

本文轉載自人機共生你我它,原文為〈【親友篇】到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(上)

-----廣告,請繼續往下閱讀-----
人機共生你我它_96
12 篇文章 ・ 4 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。