Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

為什麼寧願自己亂來,也不願看一下說明書?──2018 搞笑諾貝爾文學獎

淨妍
・2018/10/04 ・2798字 ・閱讀時間約 5 分鐘 ・SR值 512 ・六年級

如果你拿著某樣產品,不停地問別人要怎麼使用,美國人有可能會回答你:RTFM (Read the F××king Manual),翻譯成台灣的用語則是:「啊你不會自己看說明書喔?」。

但 2018 搞笑諾貝爾文學獎的得獎者卻告訴我們:不想看說明書是人之常情,這不單是使用者的問題,產品設計者也有責任,沒事不要做那麼多複雜的功能啊!大家根本很少在用!

2018搞笑諾貝爾文學獎頒獎畫面。圖/截圖自Youtube影片

大部分的人都不看說明書 也不使用產品所有功能

得獎者是澳洲昆士蘭科技大學的 Alethea Blackler 等人,他們因為論文「人生苦短,不該花更多時間看說明書 (Life Is Too Short to RTFM):使用者和說明書及產品累贅功能之間的關係」而獲頒獎項。

他們想知道大家到底會不會看產品說明書、會不會使用產品的所有功能,於是用了 7 年的時間蒐集了 170 份問卷,再搭配 6 個月的使用者日記與訪談,做了質化與量化的研究分析,證實了以下幾個現象:

-----廣告,請繼續往下閱讀-----
  1. 只有 25% 的人會看產品說明書,並使用產品所有的功能。
  2. 看說明書會引起人的煩惱和負面情緒。
  3. 年輕人比年紀大的人還不喜歡看說明書。
  4. 教育程度越高的人越不喜歡看說明書。
  5. 男性比女性有可能會看使用說明書和使用產品所有功能,但兩者適應新產品所需的時間和正確使用率沒有差異。
  6. 大家買東西的時候,喜歡選擇功能比較多的那一種,但使用後就會嫌那些功能複雜而無用。

綜觀以上六個研究結果可以發現,似乎問題都出在使用者身上,明明使用說明書就擺在那裏,翻一翻就可以找到解答,為什麼大家寧可自己亂按或是問別人(然後被嫌棄),也不想看說明書?

為什麼大家不看說明書?

答案很簡單,因為很麻煩阿!

「為了實作而閱讀」對成人來說是很麻煩的。圖/pixibay

2001 年的一項研究發現,人們在閱讀說明書時,常常會越看心情越差,因為他們要花很多時間才能找到解答,就算找到了,也有可能因為資訊量不足而無法獲得幫助。有些說明書甚至會假設使用者知道某些事情,但事實上他們根本不了解,所以越看越疑惑。不只紙本的說明書會為使用者帶來困擾,一些電腦、網路上的使用說明或輔助工具也是如此,像是經典的 Office 小幫手,大眼迴紋針 (Clippy) 就是因為被使用者嫌棄而慘遭淘汰的產物。

Office 小幫手問你是否需要幫助。圖/wikipedia

然而,就算說明書寫得很詳盡、整體架構也很清晰,大家還是不太喜歡看它們,因為比起密密麻麻的白紙黑字,人們還是比較願意相信實際行動的結果;只有在不論如何實驗都無法正確操作的情況下,才會勉勉強強地打開說明書,抓到了關鍵資訊後,又繼續埋首亂按。「為了實作而閱讀」(Read to do) 這種不直覺的任務對成人來說是很麻煩的。

得獎者舉例,「客服的說明書」:看不懂說明書,找客服就對了。圖/截圖自Youtube影片

那麼,為什麼年輕人 (25 歲以下)會比較不喜歡看說明書?研究認為,因為他們強烈的好奇心使他們更願意嘗試自己摸索未知的產品。另一方面,老年人會比中年人更依賴文字的說明書,因為他們對現代推陳出新的產品較為不熟悉,技術的吸收能力也比較差。

-----廣告,請繼續往下閱讀-----

論文也指出,教育程度較高的人越不會閱讀說明書,因為他們對自己的知識水平及新事物的吸收能力有較強的信心,所以偏好自己動手探索產品功能;但他們使用到的產品功能卻也比較少,這是因為他們為了節省時間,只選擇使用最有效益的產品功能。

產品功能越多越划算?

除了說明書與使用者之間的關係,Alethea Blackler 等人將產品的累贅功能作為此篇研究的另一個重點。隨著軟、硬體等產品不斷更新或推出新型號,如果設計者沒有考慮產品功能的效益與多寡,就可能會造成產品功能過多、介面設計越來越複雜的情況。

諷刺產品功能過多的笑話。圖/flickr

但事實上,產品功能越來越多,消費者也有部分責任,因為大家選購產品時,老是喜歡選擇功能較多的那一種,而設計者為了迎合市場需求,常常增添許多無用的功能,曾有學者用「產品功能戰」來形容這樣的現象。以 App 商店為例,許多應用程式都喜歡列出長長的功能清單,以博得消費者的青睞。

儘管買東西時,大部分的人偏好選擇功能看似較強大的款式,但在實際使用後,卻又覺得產品太複雜,只好拿起手邊的說明書尋求解答(心中順便給了產品差評),然後在用過某些產品功能後,才會真正發覺它們有多雞肋(心中對產品的評價更低了)。當產品功能越多,使用者使用某項功能的機率就越低,也會認為那項功能越沒用,這是研究者歸納出的現象。

-----廣告,請繼續往下閱讀-----

打破框架吧!說明書和產品功能該怎麼設計?

在結論中,研究者強調,說明書和產品功能的使用有很大的關聯,如果完全沒有說明書的幫助,使用者很難了解產品的所有功能,但若是產品功能太多,介面設計不貼近人性,同時說明書又架構混亂或是資訊不足,就會讓使用者對產品越來越不耐煩。

他們給說明書設計者一些建議:說明書的設計最好能夠打破紙本說明書或是網路說明書的概念,舉例來說,影片或動畫就是很好的呈現方式,因為它們可以自然地融入網站或廣告之中,不易讓使用者感到厭煩。另外一點,因為每個年齡層偏好的說明書形式都不太一樣,所以可以讓多種說明書的版本並行。

教你如何組裝傢俱的 AR 應用程式。圖/截圖自vimeo影片

而關於產品功能的設計,研究者解釋到,他們不認為產品設計師要避免設計多功能的產品,也不是建議廣告上不能強調產品的多項功能,而是要找到適當的平衡點,讓產品的每項功能都有其效用。

他們也提到,產品功能過多的情況近年來有得到改善,因為部分消費已經者開始意識到並不是產品功能越多就越有價值,重要的是產品功能的效益;而產品設計者也注意到這樣的現象,所以開始仔細考慮每項產品功能是否會改善使用者體驗。

-----廣告,請繼續往下閱讀-----

只有在產品貼近使用者需求的情況下,才能讓買賣雙方都皆大歡喜,而如果未來的產品都能朝這個目標邁進,我們也不用為產品功能而煩惱啦!畢竟人生苦短,不該花更多時間看說明書!

資料來源:

  1. Alethea L Blackler, Rafael Gomez, Vesna Popovic, M Helen Thompson; Life Is Too Short to RTFM: How Users Relate to Documentation and Excess Features in Consumer Products, Interacting with Computers, Volume 28, Issue 1, 1 January 2016, Pages 27–46
  2. The 28th First Annual Ig Nobel Prize Ceremony (2018)
-----廣告,請繼續往下閱讀-----
文章難易度
淨妍
6 篇文章 ・ 0 位粉絲
泛科的新人實習生,希望能在這個資訊過量的時代裡,留下有價值文字。 另一個身分是「喀報」記者https://castnet.nctu.edu.tw/search/%E6%88%B4%E6%B7%A8%E5%A6%8D

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
講話太難語音助理聽不懂?利用互動設計讓人講「機器話」
人機共生你我它_96
・2020/07/27 ・2309字 ・閱讀時間約 4 分鐘 ・SR值 536 ・七年級

-----廣告,請繼續往下閱讀-----

「這段時間,我們一直納悶控制的方法在哪裡……」
「沒想到就是我們自己。」

——《人生複本》 Blake Crouch

有沒有注意自己的日常用語會跟自己經常接觸的朋友們越趨接近?像是辦公室有人開始講:「是在哈囉?」身旁會也越來越多人在不經意間說出:「是在哈囉?」我們跟某個朋友聊天時,如果對方原本都沒有在用貼圖,但是突然有一天他/她開始用了貼圖,我們也開始跟著用貼圖來回應對方。

用語上的一致性 (lexical alignment / lexical entrainment)能夠讓人跟人之間距離更靠近,增加彼此的信任感。不僅在語言上,行為上一致性(姿勢、動作等)也能在兩個溝通越來越順暢的人們身上觀察到,而且人們在沒有察覺的情況下,對於那些語言與行為跟自己一致的人也展現較多好感。

大家下次在外面吃飯時,不妨觀察隔壁桌的兩人是否會輪流用手托腮。圖/Unsplash

語言一致性的涵蓋範圍廣泛,包含用詞選擇、腔調、語速,甚至是修辭結構。

-----廣告,請繼續往下閱讀-----

舉例來說,當我們在跟朋友描述自己所在的位置時:「我在地下室一樓」此時,對方比較有可能回應「我在地下室二樓」,而不是「我在 B2」。

但人與人之間對話時的用語一致性跟語音助理設計有什麼關係呢?

無論與人或電腦對話,我們都會配合對方的用語

我們可以透過瞭解人跟電腦對話的時候,是否也會出現這樣的用語一致性。在這個實驗當中,研究者們會讓使用者分別跟三個不同的角色語音對話對話,分別是:

  • 真人
  • 較舊版本的電腦
  • 較新版本的電腦

而且使用者們會明確地被告知即將對話者的身分。如果是舊版電腦,就會看到一個螢幕開機畫面上寫著是 1987 年的作業系統版本;如果對話的是新版電腦,就會在螢幕上看到 2003 年的作業系統版本。

-----廣告,請繼續往下閱讀-----

圖/pickpik

接著,請使用者在實驗過程中分別跟三個不同的角色互相看著圖片描述一個物品,例如:看一張電燈的圖片。不過「電燈」的另一個稱呼也可以是「檯燈」,這時候研究者就讓他們輪流向對方說出照片裡的物品,進而讓研究者們分析使用者會不會因為對方用了某個詞彙,後續再看到同樣的圖片時也用同樣的詞彙。

結果發現,是的!使用者不但會配合另一個人的用詞方式,也會配合電腦的用詞。

即便使用者知道自己在跟電腦對話,當電腦一直用固定的詞彙描述圖中物品時,使用者的描述用詞也會配合電腦,就如同配合人一樣,用同樣的詞彙來描述物品。

但是這種用同樣詞彙的配合程度不同,當使用者知道自己在跟一個舊版本的電腦對話時,配合的程度就高於最新版本的電腦或是人類。也就是說,當我們知道電腦可能「比較笨」的時候,我們就更容易去配合它的用語。而這個效果透過很表面的知覺操弄就可以做到,就像實驗中讓使用者看到不同版本作業系統就會達到配合程度不同的效果。

-----廣告,請繼續往下閱讀-----

不只用詞,在句子結構上也會配合語音助理

除了看字彙選擇是不是會有一致性,研究者們也發現當請使用者分別跟另一個真人、另一個發出機器音的語音助理、另一個擬人聲的語音助理對話,無論和誰對話,使用者自己的句子結構都會有配合對方的傾向。

圖/Unsplash

研究者們邀請使用者向三個不同的角色互相描述圖片中的畫面,從中我們可以發現兩個不同的描述方式:

  • 左圖:「大明給小王一張卡片」=「大明把卡片給小王」;
  • 右圖:「一個藍色的圓圈」=「一個圓圈是藍色的」。

接著讓使用者分別跟三個角色輪流描述多長不同的圖片給對方聽。結果發現,如果對方一直用「A 把(物品)給 B」或是「形容詞 + 名詞」這種結構來描述圖片的話,自己後續描述圖片的方式也會趨向這個方式。

-----廣告,請繼續往下閱讀-----

所以,無論跟自己對話的是人,或是機器音的語音助理,還是擬人聲的語音助理都有同樣的效果。

利用人們「一致性」本能,互動設計讓語音助理更好用

從我們與語音助理的互動經驗中可以發現,只要語音助理無法辨識我們說出來的內容,就無法給出符合期待的回應,所以自然語言處理(Natural language processing, NLP)的專家們持續發展語音辨識的技術。然而在新技術尚未推出之前,我們其實可以從人機互動的角度來修正語音助理的設計。

以本次回顧的系列研究的結論來說,人會隨著溝通對象而改變語言使用習慣,包含用語、句構。尤其當人認為電腦越不聰明時,配合程度越強。因此,設計師們不妨根據現有技術,先讓語音助理講出一些簡單的句子結構來開啟對話,再引導使用者也使用相似的簡單結構來回覆,而不是一定要專注在設計出能夠進行複雜對話的語音助理。

例如:當我們透過 Hey, bot 喚醒語音助理後,先讓語音助理說出:「嗨,下指令」這個簡單的句子結構,進而引導使用者說出:「好,播音樂」。

從系統設計角度來看,這麼做能在一開始就讓使用者在不知不覺中說出系統比較容易辨識的指令。就像我們在跟小小孩對話的時候,當他對我們說:「我要車車~」的時候,自己也會很自然的回應:「車車給你~」。

-----廣告,請繼續往下閱讀-----

如此一來,使用者就不會因語音助理辨識錯誤而太失望了,不是嗎?

圖/unsplash

延伸閱讀

感謝沈奕超、張元嘉提供編輯建議

參考資料

  1. Cowan, B. R., Branigan, H. P., Obregón, M., Bugis, E., & Beale, R. (2015). Voice anthropomorphism, interlocutor modeling and alignment effects on syntactic choices in human-computer dialogue. International Journal of Human-Computer Studies, 83, 27-42.
  2. Branigan, H. P., Pickering, M. J., Pearson, J., McLean, J. F., & Brown, A. (2011). The role of beliefs in lexical alignment: Evidence from dialogs with humans and computers. Cognition, 121(1), 41-57.
-----廣告,請繼續往下閱讀-----
人機共生你我它_96
12 篇文章 ・ 4 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。

0

0
1

文字

分享

0
0
1
到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(下)【科系篇】
人機共生你我它_96
・2020/05/22 ・4807字 ・閱讀時間約 10 分鐘 ・SR值 558 ・八年級

  • 作者:楊期蘭

路人:「聽起來就是在設計 APP 啦~」

同系的朋友:「好像是在做網路通訊吧,還是多媒體那種,常常需要找人來試用他們的系統。」

社會科學專家:「人機互動真的有在讀理論嗎?我看實驗都做得不是很嚴謹欸,人的行為很複雜,不是幾行數字就可以解釋清楚的。」

資訊領域專家:「人機互動做的東西感覺我們都做過了啊,而且技術都很成熟也商品化了,再說你們的研究方法怎麼樣本數都這麼少?沒有大數據支持、資料處理方式看起來也是靠人力沒有自動化?怎麼不用自然語言處理技術處理訪談資料?樣本這麼少或根本沒有數字很難讓人相信你們的結果欸。」

不同領域的人會從不同角度看待人機互動,因此每個人看到的角度就會不太一樣。圖\pexels

當身邊有在做「人機互動研究」的人時,大家會不會有類似的疑惑?好奇他們到底在做什麼?

而自己就是在做「人機互動研究」的人,多少會被問到類似的問題:「人機互動到底是在做什麼?」特別是當對方來自某個學科背景,在聽完人機互動研究後經常因為覺得學科間部份重疊性而帶著自己的有色眼鏡來評斷人機互動研究。

這次要透過、下兩篇,用面對 20 種不同背景的聽眾來解釋人機互動在做什麼,一方面為好奇的讀者們解惑;另一方面想跟同為人機互動研究的讀者們一起討論到底怎麼向不同類型聽眾溝通比較合適。

-----廣告,請繼續往下閱讀-----

上集,我們已經先從生活會遇到的對象解釋起;這篇下集會從面對不同學科背景的朋友開始解釋:人機互動是什麼?

11.  對正要選系的高中生:

目前在台灣的大學部跟研究所都還沒有一個系所稱作人機互動學系,但是因為人機互動是一個沒有領域分界的學科知識(但是有一套專屬的研究方法論),所以在任何科系裡都有可能將某一個科系的學理知識或方法論挪用到人機互動的研究上。

人機互動顧名思義有包含人的部分跟機器、系統的部分,因此在無論你/妳對人感興趣或對電腦比較感興趣,只要選的科系能夠讓你/妳對這兩個其中一個有很深入了解,未來都很有機會直接把所學跟人機互動研究結合在一起。

-----廣告,請繼續往下閱讀-----

人機互動是不分領域的學科知識,因此可以廣泛運用於各領域。圖\GIPHY

12. 對人文藝術背景的朋友:

人機互動是去探究科技如何對人類產生不同層面的影響,像是如何透過科技來進行藝術創作,進而引發人去反思;如何將文本數位化讓使用者有更多不同於以往的新互動,產生新的閱讀、欣賞體驗;如何運用科技作為媒介來輔助創作者創作、分享作品、擴大與欣賞者的互動等,都會有人機互動的成分在其中。

13. 對自然科學背景的朋友:

-----廣告,請繼續往下閱讀-----

人機互動是一門運用科學研究方法了解人類如何使用電子系統的學科。人機互動跟自然科學相同地方在於兩個學科都會提出研究問題、提出假說、進行實驗,最後得到不同於以往的新發現來回答研究問題,透過可被重複驗證的方式來了解某個現象,這個現象在自然科學領域就是「自然現象」,而在人機互動領域就是人類行為如何受系統影響,或是系統的什麼新設計幫助了人類。而不同於自然科學之處在於人機互動研究對象是「人與機器」的這個組合,而自然科學則是研究自然界的純物質。

人機互動跟自然科學都需要提出研究問題、提出假說、進行實驗,並得出實驗結論並探討。圖\GIPHY

14. 對生物醫學背景的朋友:

人機互動與生物醫學領域部分相同之處在於研究對象都是人,而人機互動領域除了了解人以外,多加入了設計系統的部分。就應用層面來說,了解醫護人員、生醫專家如何在緊急繁忙醫療現場使用生醫系統或是醫院內部資訊系統,並透過科技來輔助醫療行為進行、如何設計好的溝通媒介來促進醫病之間溝通等,就是部分人機互動研究在解決的事。

-----廣告,請繼續往下閱讀-----

最近為了找到對抗新冠病毒的疫苗,除了生物醫學科學家之外,群眾外包也被視為其中一個嘗試找到新型蛋白質結構的方式,透過遊戲化的互動設計,讓不同觀點的群眾可以投入共同解決科學領域難解的問題,突破一些專家盲點。怎麼設計一個好的群眾外包機制來讓公民參與科學,也是人機互動領域的一個研究主題之一。

人機互動研究亦可透過科技來輔助醫療行為進行,或加速實驗的運行。圖\GIPHY

15. 對社會科學背景的朋友:

人機互動與社會科學領域部分相似之處在於我們都以人當作研究對象,也同樣會根據不同研究問題分別透過微觀與鉅觀角度來分析人類行為。「人」是人機互動領域的主角,因此人機互動借用了許多社會科學長期對於人類行為了解所建立的理論,藉此引導系統設計的方向,像是心理學對於個體的認知優勢與限制的理論、傳播學對於人際溝通時語言行為使用的了解、社會學對於個體與社會結構如何相互影響的理論、人類學告訴我們不同文化下人類形成的不同慣習等,這些對於人類社會豐富的了解都是人機互動研究需要的基礎。

-----廣告,請繼續往下閱讀-----

人機互動研究想達到的目標之一就是去了解:當人與科技互動時,人類會有什麼新的行為發生、會如何被賦能;同時並提出科技對人類社會可能帶來的利與弊,藉此引導政策制定方向或科技系統設計方向。

人機互動能借用社會科學長期對於人類行為了解所建立的理論,建立系統性的設計。圖\GIPHY

16. 對工程背景的朋友:

人機互動是了解人如何使用機械或電子系統的學科,與工程領域相似的地方在於兩者都需要先定義問題,並設計出能解決問題的最佳系統;不同之處在於人機互動在系統設計的環節中多把「使用者」納入設計考量,所以在評斷系統效能的時候,除了比較不同系統之間的表現 (performance) ,也同時需要評量使用者使用系統的表現。

-----廣告,請繼續往下閱讀-----

17. 對資訊背景的朋友:

人機互動是一門了解人怎麼跟資訊系統互動的學科,與電腦科學相同的地方在於兩者都是為了解決一個問題設計出一套最佳的演算法或是資訊系統,並且用量化方法來比較不同算法或是系統的效能;不同之處在於人機互動研究者在設計演算法與資訊系統需要將使用資訊系統的人也納入設計考量中,因此在比較系統效能時,除了透過「數字」比較系統效能外,也會有部分不能數值化的比較參數,原因在於使用系統的使用者包含了「可被數值化」與「不可被數值化」的部分,可被數值化的部分就跟資訊系統的評量方式一樣,可以透過比較數字大小看出差異,但不可被數值化的部分就需要透過其他研究方法來了解,也就是「質化」分析方式,才能告訴我們資訊系統對人產生了什麼影響、背後隱含的意義是什麼。

在資訊系統開發設計過程中,人機互動研究者也會需要考量其中「不能被數值化的部分」,讓系統設計更加貼近人的需求。圖\pexels

18. 對設計背景的朋友:

-----廣告,請繼續往下閱讀-----

人機互動就是在透過科技解決問題的學科,與設計領域相同之處在於兩者都是透過「設計」某個實體或虛擬的東西來解決問題,設計學門的設計範疇非常多元廣泛,但人機互動則是將目標放在設計「人與科技物之間的互動」的範疇內。

19. 對做使用者經驗 (UX) 的朋友:

人機互動是了解使用者如何跟各種不同的科技物、數位系統或網路互動的學門。使用者經驗研究涵蓋的範圍很豐富多元,只要有人的地方就會產生經驗,而這些經驗不一定需要在有科技物的情況下發生,像是人在傳統市場採購的經驗、人們在某個場所共同經歷一個活動的經驗等,使用者經驗可以包含使用科技物的經驗也可以不包含;而人機互動與使用者經驗重疊的部分在於人機互動也需要了解人的經驗,但不同之處在於它是企圖了解:人如何使用科技物、人際關係怎麼被科技物影響、科技如何影響人等,解決問題的範疇是在「人與科技物互動」之中。

透過了解使用者,人機互動研究才得以知道「人如何使用科技物」或是「人怎麼透過科技物跟其他人建立關係」,進而產出好的設計。圖\GIPHY

20. 對其他也是在做人機互動的朋友:

人機互動廣義來說就是人與運算系統的互動,但在人機互動研究的大傘下又有許多不同的子主題,詳細請參考,不同子領域有各自著重的研究貢獻,有些著重於新奇的互動設計、有些則將重點放在系統設計、而又有一些是把重點放在了解這些使用社群科技系統下的人們或是特殊情境。每個子主題的共通點就是包含了「人」與「運算系統」這兩個成分。對筆者而言,科技在人機互動中扮演的角色是「賦能」 (empower) 而非取代人類,科技設計目的是為了讓人完成原本做不到的事、產生原本無法實現的人際交流,使得人在物理上、心理上都比以往更有能量。

你/妳的定義是什麼?

看完了 20 種不同的人機互動解釋,可以看出無論解釋的對象是誰,

人機互動共通的內涵就是去了解並設計人與機器之間的互動機制。

人機互動的定義絕對不是只有這些,根據不同對象的需求、談話的目的,就會有不同的定義,而且不同背景的人即便看到同一個詞彙,解讀跟思考方向都不同。就像「人工智慧」這個詞,有人看到後想的是數學模型、有人是演算法、有人是應用情境、有人是倫理議題,無論從哪個角度看都有其道理,但若想展開討論,我們需要確認雙方都是在對某個詞彙有同樣定義情況下討論,否則就只能各說各話、耍耍嘴皮子。

人機互動因為研究主題包含「人」與「科技」,因此除了自己發展出屬於這個學門的理論外,也會奠基於其他學門不斷累積的知識,像是社會科學對人的認識、工程科學科學在電腦科學技術的發展,相互融合來產出人機互動的研究成果。不同學門在主題選擇上、方法上、研究結果上多少會有重疊的部分,學門的定義到底該涵蓋那些概念,最後還是回歸到某個所屬的科學社群共同想解決的問題是什麼。

不同學門在主題選擇上、方法上、研究結果上多少會有重疊的部分,學門的定義到底該涵蓋那些概念,最後還是回歸到某個所屬的科學社群共同想解決的問題是什麼。圖\pexels

定義是由人建構出來的,不同科學社群想解決的問題不同,定義跟切入點就會有所不同,這些定義也可能隨著時空背景推移跟著調整,找 10 個在做人機互動的研究者來分享,也很有可能會產出 10 個不同的版本。一個詞彙的定義很多元,端看我們想跟誰說、目的是什麼。

各位讀者同意這(上)、(下)兩篇提到的人機互動解釋嗎?同意的話,有什麼想補充嗎?不同意的話,覺得哪裡可以更好?找機會跟我們交流討論吧!

延伸閱讀:

到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(上)【親友篇】

  • 感謝沈奕超、張元嘉、陳美伶、黃振瑋、王邦任提供編輯建議

本文轉載自人機共生你我它,原文為〈【科系篇】到底什麼是人機互動?二十種向朋友解釋人機互動是什麼的說法(下)

-----廣告,請繼續往下閱讀-----
人機共生你我它_96
12 篇文章 ・ 4 位粉絲
由致力於人機互動研究(HCI, Human-Computer Interaction)的研究者與實務工作者所創立,我們定期發表人機互動相關文章,與讀者一起思考科技對社會生活帶來的好處與限制。