5

11
2

文字

分享

5
11
2

別懷疑,Google 真的知道你在想什麼! 蜂鳥演算法如何提升人類的搜尋體驗?

Abby T
・2021/08/26 ・4467字 ・閱讀時間約 9 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

打開 Google 輸入「水煮蛋」,Google 會知道,你是想了解「水煮蛋的煮法」,並且快速地給出你想要的答案。

或是只輸入「麵包店」,Google 就會自動推測,你是想找附近的麵包店。因此會依照你的網路所在位置,優先提供附近麵包店的資訊。

能有以上更方便的搜尋方式,和更能滿足使用者需求的搜尋結果,都是蜂鳥演算法加強「語意判讀」和更理解「搜尋意圖」的功勞。

搜尋引擎的基本原理,分別是爬文(Crawling)、收錄 (Indexing)和排名(Ranking)三步驟。首先必須透過爬文蒐集資料,再把這些資料收編和儲存進 Google 的資料庫,最後則是網站經營者或 SEO 專家最關心的排名步驟──也就是 Google 如何決定哪些資料要優先推薦給使用者。

而演算法就像是為上述整個過程套上一個公式,不同公式能導出不同計算過程和結果,連帶影響 Google 給出的搜尋結果,比如「咖啡因演算法」改變了網頁收錄的方式,「熊貓演算法」則大大提升網頁內容品質。那,蜂鳥演算法帶來哪些影響呢?

蜂鳥演算法:讓「搜尋意圖」判斷更進化

蜂鳥演算法(Google Hummingbird)是Google 演算法歷屆演變中,相當重要的變革之一,因為它並非只針對舊有的演算法做出些微調整,而是一口氣替換掉演算法的核心,不過也同時保留了部分舊有演算法的元素。

在蜂鳥演算法出現以前,Google 本來只會從搜尋字串中抓出幾個關鍵字,判斷各個字詞字面上的意思,再從資料庫中找出有關鍵字詞的資料。例如:使用者搜尋「水煮蛋 時間」,Google 可能會從資料庫中撈出同時有提到「水煮蛋」和「烹調時間」的網頁,再排序推薦給使用者。

反過來說,如果使用者想知道水煮蛋需要煮多久才會熟,直接搜尋「水煮蛋需要煮多久才會熟」如此直白語句,未必找得到答案,因此使用者可能必須將問題先切成幾個關鍵字,轉換成 Google 看得懂的語言,如「水煮蛋 時間」,或是推測可能要看水煮蛋食譜才能解決問題,而改搜尋「水煮蛋 食譜」或「水煮蛋 步驟」。

簡單來說,使用者會需要配合搜尋引擎能理解的語言來提問,才能找到需要的資訊。但如果搜尋前,還得先思考要打什麼關鍵字才能找到答案,豈不是很麻煩嗎? 

Google 搜尋引擎秉持的理念是,要提供最相關的資訊給使用者,且讓使用者花越少時間在搜尋越好。換句話說,就是要讓使用者在最短的時間內獲得想要的資訊──「速度」跟「精確度」是兩大重點,而蜂鳥演算法的出現大大改善了這兩個問題。

蜂鳥雖然體型嬌小,卻以翅膀振動速度飛快和敏捷行動力出名,而蜂鳥演算法正如其名,希望帶給使用者的搜尋體驗能是快而精準。

但要如何做到?最重要的關鍵是,要能更了解使用者想要找什麼樣的資訊、使用者為什麼要搜尋該關鍵字,也就是要判讀所謂使用者的「搜尋意圖」。 

搜尋意圖(Search Intent)是什麼?

簡單來說,搜尋意圖就是使用者搜尋的「目的」,可以是想知道關鍵字是什麼意思、想要購買商品、想找到某個網站等。蜂鳥演算法正式運行以後,我們已能更準確地從搜尋結果頁面,來推測使用者的搜尋意圖。

舉例來說,搜尋關鍵字「演算法」,搜尋結果第一頁會出現有關演算法的介紹,因此可以推測使用者,使用者搜尋「演算法」,應該就是想了解演算法是什麼。

圖/作者提供

再看一下關鍵字「水煮蛋」,搜尋結果第一頁上的內容大多是在介紹「水煮蛋的煮法」,諸如水煮蛋要煮多久等等,而非水煮蛋的營養成分等知識性內容。也就是說,Google 猜測,查詢「水煮蛋」的使用者,最想知道的是「水煮蛋怎麼煮」,而不是有關水煮蛋的知識。

圖/作者提供

判斷搜尋意圖未必是件容易的事,但對執行搜尋引擎優化(SEO)來說卻很重要。因為 Google 會提供給使用者的是和搜尋意圖最相關的資訊,因此正確掌握搜尋意圖,正是做好 SEO 的第一步。

以水煮蛋為例,如果你經營的網站,寫了一篇水煮蛋「營養成分的介紹文章」。但因為搜尋「水煮蛋」的使用者,比較想了解的是水煮蛋的「製作方式」,所以 Google 很可能不會把你的文章排得太前面。

蜂鳥演算法如何幫助 Google 更精確地判斷搜尋意圖? 

在蜂鳥演算法推出前,Google 先推出了語音搜尋的服務,用口語表達的方式即可以執行搜尋。比起文字輸入搜尋,語音搜尋的用語更為自然、口語化,比如以文字搜尋時,使用者可能會輸入「水煮蛋製作」,但使用語音搜尋時,卻可能會說出較為口語的「水煮蛋怎麼做」。

此時,如何解讀使用者的搜尋字詞變得相當重要,而蜂鳥演算法帶來最大的改變是從字詞上的辨識,進階成為「語意上的解讀」。

也就是說,Google 本來只會根據關鍵字提供對應的資料給使用者,但蜂鳥演算法的導入,卻讓 Google 開始學會讀取上下文。能將所有輸入的字詞融為整體作判斷,並參照彼此間的關聯性去推測更深層的意涵,而非單單只是把搜尋字詞看成是有很多關鍵字集合的字串。

比如搜尋關鍵字「明天天氣」,若只抓取字面上的關鍵字,搜尋引擎可能只會判斷使用者想知道天氣,所以會提供各縣市天氣預報。但是加入語意上的判讀後,Google 會將「明天天氣」此搜尋字詞理解為「使用者想知道所在區域的明天天氣狀況」,便會在使用者有授權的情況下,自動參考使用者的位置資訊,進而提供使用者所在位置的天氣資訊。

圖/作者提供

蜂鳥演算法對搜尋引擎優化(SEO)的影響?

如果蜂鳥演算法只是強化了Google 對於搜尋字詞的理解能力,那麼對於網頁在搜尋結果的排名,理論上來說應該沒有直接影響?

但實際上,蜂鳥演算法雖然沒有改變影響排名的因素,但對於網站流量的成效和 SEO 執行策略方面卻有帶來一些改變。

1.流量可能變少

在蜂鳥演算法導入的前一年,Google 推出了「知識圖譜」(knowledge graph)功能。它結合了語意分析和資料蒐集,事先彙整了一些使用者可能需要資料,只要使用者一搜尋相關關鍵字,Google 就能從資料庫中提取資料,提供現成的知識圖譜,讓使用者的疑問能快速被回答。使用者甚至不需要點入任何搜尋結果就能得到答案,例如搜尋「強尼戴普幾歲」:

圖/作者提供

從搜尋結果最上方及右側的知識面板,就能立即得到強尼戴普的年齡和其他相關資訊,甚至不需要點入維基百科查看。

這對於使用者來說當然是好事,畢竟搜尋問題能立刻得到答案,還不需要自己一一點入網站彙整需要的資訊。相反的,對於網站主來說,語意理解加知識圖譜的出現卻會是個威脅,因為辛苦策劃了網頁內容,卻可能吸引不到點擊/流量。這時候的網頁排名競爭,相當於要競爭的對手不只是其他網站,還有 Google 本身。

2.長尾關鍵字更受歡迎

因為語音搜尋服務的推出,使用者的搜尋字詞開始越來越口語化,而這些口語化的搜尋字詞,是屬於搜尋量較少、非主要搜尋字詞的長尾關鍵字。本來在蜂鳥演算法推出以前,Google 比較不擅長將這類長尾關鍵字和相對應的網頁內容串連在一起,SEO 操作上較少選擇長尾關鍵字作為要操作的目標關鍵字。在蜂鳥演算法導入之後,Google 的關鍵字語意判讀能力提升,才能逐漸辨識這些長尾關鍵字的搜尋意圖。

SEO 策略能如何因應蜂鳥演算法調整?

延續前一段提到蜂鳥演算法對 SEO 的影響,可以了解蜂鳥演算法與網頁排名指標較沒直接關係,網站主沒辦法針對特定因素進行優化,因此只能將重心放在優化網頁內容,增加搜尋引擎將網站推薦給使用者的機會。

常見的 SEO 優化策略有:

1.多發布優質內容

針對網站主題多發布相關的原創內容,網站內容越豐富,越有機會解答使用者的問題。

2.加強文章的廣度

文章內容題材涵蓋範圍越廣,越能解決使用者可能會有的疑問。能一文解決使用者所有疑問的文章,有較高的機會被Google 認定為優質內容,進而推薦給使用者,而使用者也可能透過搜尋不同疑問接觸到同一篇文章。

3.善用長尾關鍵字

上段有提到蜂鳥演算法讓長尾關鍵字越來越受歡迎,代表使用者會更容易透過搜尋長尾關鍵字而接觸到相關網頁。網站主可以善用蜂鳥演算法能理解長尾關鍵字語意的特性,挑選適合的長尾關鍵字作為 SEO 的操作目標,或許反而能因為長尾關鍵字競爭程度相對小、搜尋意圖相對明確的優勢,讓網頁更有機會獲得好排名。

以上三個策略,都是著重在「如何用內容增加網頁曝光」的機會,所以最後還是老話一句,當你不曉得 Google 演算法革新帶來什麼影響、不知道該如何因應改變時,只要記住:持續提供優質內容、解決越多使用者的問題,就是做好 SEO 的最高原則。

蜂鳥演算法對搜尋引擎使用者的影響

蜂鳥演算法是 Google 用來判斷搜尋意圖的一大利器,透過精準掌握搜尋意圖,達到能快速提供使用者有用資訊的效果。Google 對關鍵字的理解,從初階的「詞彙」辨識,進階到「語意」上的解讀。因此,Google 更加清楚理解,使用者對搜尋引擎提出的問題,究竟是在問什麼,以及使用者預期想得到的答案又是什麼。

Google 彷彿真的知道,在電腦前輸入關鍵字的你我在想些什麼。例如正想自製早午餐的你,搜尋「法式吐司」,Google 會馬上告訴你,做出好吃法式吐司的方法。搜尋「最佳燒烤店」,Google 會找出離你最近的高評價燒烤店資訊(而不是依照「最佳燒烤店」字面上的意思,列出全世界最高分的燒烤店)。

藉由蜂鳥演算法的幫助,Google 大神不只有問必答,提供的答案也一點都不馬虎,能確實幫助使用者解決問題。

從蜂鳥演算法對使用者的影響來看,基本上是有益無害。蜂鳥演算法能將多樣化的使用者問題和網頁提供的資訊,更精準地連接在一起。並加入知識圖譜、本地資訊等貼心服務,優化使用者體驗。不僅可以讓使用者使用更人性化的用詞搜尋,得到的搜尋結果往往也更符合所需。

不過,蜂鳥演算法在語意判讀的精準度能否更提升,精準度是否會因不同語言而有差異?仍是值得持續觀察的問題。

參考資料:

  1. Google Hummingbird – Moz
  2. Searcher Intent: The Overlooked ‘Ranking Factor’ You Should Be Optimizing For – Ahrefs
  3. SEO 搜尋引擎優化 – JKL SEO
  4. 搜尋引擎原理 – JKL SEO
  5. Should You Change Your SEO Strategy Because of Google Hummingbird? – Neilpatel
  6. 什麼是長尾關鍵字?流量不是最多但非常重要的 SEO 觀念! – dcplus
文章難易度
所有討論 5
Abby T
5 篇文章 ・ 7 位粉絲
內容行銷專欄作家,JKL SEO 行銷公司行銷長 (CMO),對 SEO搜尋引擎優化相關演算法小有研究,致力於將 SEO 相關知識以淺顯易懂方式撰寫成科普文章,使普羅大眾有機會認識 SEO 這項專業數位行銷技術。

0

1
0

文字

分享

0
1
0
給你多少錢,才會願意放棄使用 FB ?社群軟體的體驗該如何被「金錢」衡量?──《資訊超載的幸福與詛咒》
天下文化_96
・2022/08/27 ・2405字 ・閱讀時間約 5 分鐘

使用社群媒體後,你變得更快樂還是更憂鬱?

想知道更多資訊的時候,你可能會上網搜尋。有時候是為了資訊的工具價值,比如透過 Google 地圖確認 A 地到 B地 的路線;腳踝扭傷時,也可以從網路上搜尋到應變的實用資訊;又或是並非真的出於任何用途,只覺得知道某些事很有趣,像是忽然想了解流行音樂歷史。你當然完全可以這樣做。

我們身邊有許多資訊都是一些抽象的概念,其中部分資訊卻可能和你切身相關。比如依據某些基本事實可以推斷你的預期壽命;某些資訊可以了解你的健康風險、未來「錢」景,甚至是個性。比起 10 年前,我們現在能得到的資訊更為詳盡正確,再過 10 年,肯定能夠知道得更多。

這章要談的內容很多,不妨開頭就先提示最大的重點:

研究顯示,整體而言,臉書會讓人變得比較不開心,而且可能感到憂鬱、更為焦慮,也對生活變得更不滿意。

你每天花多少時間使用 FB?使用社群軟體對你的心情造成了什麼影響?圖/Pixabay

我並不打算危言聳聽,事實上這些影響並不大。然而,它們的確存在。

而與此同時,有些人明明已經停用臉書、也感受到幸福感明顯增加,卻又非常想要重新打開臉書。實際上他們要求要得到一大筆錢才願意放棄臉書。這是為什麼?我們雖然無法確定,但一項合理的解釋是,使用臉書的體驗,包括帶來的資訊,並不會讓人變得更快樂,但還是有它的價值。

無知並不是幸福,而很多人都感受到這一點。人們需要知道自己在意的資訊,這是因為喜歡、甚至珍視一種和重要的人之間產生連結的感覺。

若須付費才能使用社群媒體,會怎樣?

重要的是,我們必須強調,社群媒體的功能不僅僅是提供資訊,至少不是我在這裡反覆強調的揭露資訊的意義。你會使用臉書,可能是為了和家人或朋友聯繫,也可能是為了改善荷包或健康。但無論如何,社群媒體的一大重點在於資訊傳遞,雖然這個概念要比我目前所談的更為廣泛。

而這裡的核心問題是:社群媒體究竟多值錢?

在社群媒體上,大部分的資訊是免費的,至少表面上你無須付費;或許可以說你仍需要付出注意力或個資等等。臉書和推特這些企業是從廣告獲得收益,但有鑑於相關爭議不斷,也有人認真討論起將這些平台及其服務的商業模式改成付費使用。

除此之外也有些偏理論的探討,主要關注在如何評估這些平台的經濟價值。要是民眾必須付費才能使用臉書,情況會變得如何?而民眾又願意花多少錢成為用戶?

要是社群媒體要付費的話,你們願意花多少錢呢?圖/LightFieldStudios

這些答案會透露出一些重要的資訊,讓我們知道社群媒體與一般資訊所擁有的價值。而回答這些問題,也有助於了解一些更基本的問題:如何計算經濟上的價值;知道某些消費決定可能只是表面工夫;了解傳統經濟指標與實際民眾福利有何差距(請見第二章)。此外,這些答案也會進一步影響政策與法規。

要你放棄使用 FB ,可能比要你付費使用來得更難?

行為經濟學特別感興趣的一個問題,就是「支付意願」和「願意接受金額」間可能出現的巨大落差。

以臉書為例,如果我們想知道它能為我們帶來多少福利,究竟該問民眾願意為此付出多少錢,抑或該問要給他們多少錢才會願意放棄使用臉書?許多研究都探討過稟賦效應(endowment effect)的現象,也就是被要求放棄某樣商品時所要求的價格,會遠高於他們當初獲得這些商品時支付的費用

稟賦效應目前還有爭議,至少在適用的領域、來源與程度上仍未有定論。我們可能會想知道,使用社群媒體願意付出的費用,是否大於不使用社群媒體所得到的費用?如果是的話,傳統論點又能否提出說明?

IKEA 所設置的家具體驗區,常常被拿來當作「稟賦效應」的案例。圖/Pixabay

另一個同樣常見、甚至是更基本的問題,則是涉及支付意願或願意接受金額的衡量與民眾福利。我在前面也提過,在經濟學中,要是談到民眾擁有某樣商品時的福利效果,往往是以民眾願意付出多少錢來使用那件商品作為衡量。

當然,「願意付出多少錢」也是現實市場的衡量標準。但請回想一下,要提出這項金額,事實上也就是做出預測:預測該商品會對自己的福利造成什麼樣的影響。

這個問題乍看不難,尤其當談到自己熟悉的商品(鞋子、襯衫、肥皂);但換做是從未使用過的商品,回答起來也就沒那麼簡單。對於一項從未擁有過的商品,哪知道能帶給自己多大的福利效果,以及可以換算成多少錢?

對許多人而言,臉書、推特、Instagram 等平台都是再熟悉不過的社群媒體,而且有著豐富的使用體驗。但出於某些我們馬上會討論到的原因,社群媒體用戶就是很難估算這些平台可以換算的金錢價值。

只要看看民眾提出使用社群媒體願意付出的金額,就會了解在尋求資訊上,「願意付出的金額」和民眾得到的福利效果似乎並不對等;同時值得進一步研究其中的福利效果究竟是什麼。

在這種時候,「願意付出的金額」只反映出部分的福利效果,還可能只反映一小部分。我們必須找出反映效果不佳的實際原因,並且嘗試找出更能呈現福利效果的方式。而我在這裡的目標,就是希望推進這項任務的進展。


——本文摘自《資訊超載的幸福與詛咒》,2022 年 8 月,天下文化 ,未經同意請勿轉載。

天下文化_96
110 篇文章 ・ 597 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

1
0

文字

分享

0
1
0
找到自己的角色定位:矽谷人的遠端工作模式和團隊管理——《矽谷為什麼》
商周出版_96
・2022/07/10 ・3187字 ・閱讀時間約 6 分鐘

  • 專訪胡煜昌/Google 使用者經驗資深經理

跟許多目前在矽谷工作的台灣人一樣,目前在 Google 擔任使用者經驗(UX)資深經理的胡煜昌,畢業於成功大學建築系,在美國哈佛、卡內基美隆大學取得學位後,留在矽谷繼續工作。

從韓國三星到矽谷科技巨擘 Google,從個人工作者到管理職位,胡煜昌覺得台灣人在矽谷的優勢在於說到做到、執行力超強。而「願意分享與溝通」、「成為解決問題的人」、「永遠為自己的工作與團隊多想一步,成為高信任感的夥伴」是他在矽谷能持續得到工作上的成就與晉升的關鍵成功要素。

從韓國三星到矽谷科技巨擘 Google,從個人工作者到管理職位,胡煜昌覺得台灣人在矽谷的優勢在於說到做到、執行力超強。圖/Pexels

胡煜昌指出,疫情前,遠端工作與跨國團隊間合作本來就已經是矽谷科技公司的日常,雖然疫情來得又急又快,但這些基礎架構都已成型,所以對工作的影響其實並不大。疫情剛開始的時候,大家都不覺得會在家工作很久,團隊還會遠距約了一起吃午餐、品酒、運動。

但是,隨著在家工作的時間越來越久,大家也開始習慣這種遠距工作的新常態,展現出人類的韌性。

胡煜昌指出,矽谷公司間的遠距與跨國工作能夠如此自然,在於大家心態上的正確設定,不要有先入為主的想法,文化沒有高低、對錯之分,大家彼此尊重、願意交流相當重要。當然,實體工作也有許多遠距無法取代的優勢,譬如過去大家在偶遇時的討論,快速在用餐時間的交流,都能讓許多沒有在計畫內的事情,高效解決。但是遠距工作後,需要先設定事項,再透過會議正式討論,還要考慮時區的差異,因此,大家在疫情剛開始時的工作時間的確變得更長。現在大家也逐漸習慣用各種即時與非即時的溝通模式提升合作效率,在工作與生活間找到新的平衡。

分享、溝通與信任是遠距工作的成功祕訣

胡煜昌表示,「分享、溝通與信任」是遠距工作的成功祕訣。要明確地讓別人知道你在做什麼、你想做什麼,透過可視化的 Google 工作檔案,讓團隊清楚了解每個人正在處理的任務,減少誤會產生。譬如團隊中有些在家工作的同事,需要照顧孩子、家人,造成工作有所延誤,也可以開誠布公地表達與溝通。

「分享、溝通與信任」是遠距工作的成功祕訣。圖/Pexels

胡煜昌指出,Google 利用 Google 文件,不但可以分享工作進度,也可以隨時評論,過程中不僅可以高效溝通,更能建立信任感與默契。

主管的存在,在於解決團隊中每個人的問題

胡煜昌表示,主管的團隊管理相當重要,而且主管要有一個正確的認知,了解團隊每個人是主管的重要工作,而主管的主要職責,在於解決每個人的問題,這可以說是耐心與智慧的考驗。

胡煜昌在職場上的升遷與轉職,都遇到了願意教導、願意給機會的好老闆。美國三星是胡煜昌人生中的第一個工作,只花了兩年的時間,便從專業設計工程師晉升到主管。

過程中除了老闆對他的支持,更提供一對一的教練,一步步帶領他設定目標、激勵員工,並在面對困難的決定時一起討論,找出方法。這為期兩年的訓練,對胡煜昌來說,是絕佳的成長養分。

台灣人在矽谷擁有說到做到、高執行力的優勢,但需要學習的是,如何在工作中建立自己獨特的「角色定位」。很多人一進公司就埋頭做事,但是矽谷文化重視「解決問題的人」,也就是策略性的思考能力,能夠主動出擊並能將個人在產品與組織中的影響力最大化。

胡煜昌說,以主管的角度來看,現在產品開發越來越複雜,主管們往往不能對每一個細節都瞭若指掌,這時候更加依賴團隊,提出建議,進而做出正確的判斷。這時團隊要是有人能適時補上這些不足的地方,甚至成為移開路中大石的那人,就顯得更有價值了。

職場的每一步,隱形信譽的重要累積

台灣在團隊合作上,比較趨向於競爭,但在美國則傾向於發展個人價值的同時,也能尊重彼此專業的合作關係。胡煜昌回想,之前在三星第一個應徵的前端工程師是位初出茅廬的年輕小伙子,當時,在提拔他的同時也在他身上「偷」學到許多前端開發與架構的知識。如今這位當初的年輕人已經是在蘋果獨當一面的軟體開發經理。雙方一直保持聯絡,時常見面交換業界心得。

胡煜昌笑著說,在矽谷應該沒有人會在同一個公司終老。這個產業很小,曾經的上司與同事,幾年後都分別在各大公司任職,套一句俗話:「出來行走江湖,總有一天要還的」。

美國傾向於發展個人價值的同時,也能尊重彼此專業的合作關係。圖/Pexels

在美國很重視信用(credibility),在工作場域,隱形的信譽,也就是過去的表現,更具有舉足輕重的重要性,想要在美國的職場任職與升遷,「推薦」扮演相當重要的角色,你過去的紀錄與表現,將跟著你一輩子。胡煜昌表示,自己在三星與 Google 的幾次升遷都是受助於幾位上司與同事的大力支持;過去幾年自己也推薦過多位以前的同事與下屬,靠的都是彼此間在專業合作中累積起來的信任。

在 Google 工作很輕鬆嗎?

當胡煜昌決定轉職到 Google,很多人恭喜他換到這麼一個錢多又人性化的工作場域。Google 真的這麼輕鬆嗎?

胡煜昌笑著說,Google 的確是一個沒有人會叫你做什麼的環境,很多人可能會認為,你就把該做的事情做一做就好,薪水也不會比較少。但是,這就取決於個人的職涯規劃,有沒有更上一層樓的打算。

其實,在 Google 花很多時間在找問題、解決問題。不只是自己專案的問題,很多時候更要看到產品甚至是組織上的問題。

胡煜昌說他在 Google 花很多時間在找問題、解決問題。不只是自己專案的問題,很多時候更要看到產品甚至是組織上的問題。圖/Pexels

或許從上到下、直接命令的做事方式的確比較高效,而 Google 從下而上的管理與工作模式相對耗時,但是在這過程中,展現個人問題解決的能力,在不同想法下互相討論、合作,開創最佳的創意火花,卻是效率所買不到的重要資產。

= I C 筆記/ 詹益鑑=

熟悉 KT 的聽眾與讀者,應該非常容易猜到胡煜昌的身分。對許多 KT 的粉絲來說,胡煜昌就是那個矽谷最幸福、可以嘗到 KT 手藝的矽谷美味人夫(笑)。從我們家兩年多前移居矽谷以來,常受到這個「矽谷美味家庭」的款待,一起度過節日或跟其他朋友在他們家聚餐。除了是一個稱職的男主人,胡煜昌的學霸背景與精彩的業界經歷,也常成為聚餐時的談話主題。

所以這一集訪談,除了是胡煜昌首度出道獻聲之外,更是彷彿在他們家客廳的閒聊(實際上還是遠距錄音,而且應該是三支麥克風)。從三星到 Google 這兩家文化不同的科技公司,從工程師升上管理職的心路歷程與管理心法,還有在疫情之下的居家遠距與跨國工作模式,都是非常有意義的享。而主管最重要的工作是提高每個同仁的效率,最重要的就是解決員工面對的問題(無論是工作上或工作以外),更是我從很多 Google 朋友身上聽到與學到的獨特文化,非常值得台灣的企業經理人與每一個職場上的朋友思考。

——本文摘自《矽谷為什麼:科技、新創、生醫、投資,矽谷直送的最新趨勢與實戰經驗》,2022 年 6 月,商周出版,未經同意請勿轉載。

商周出版_96
101 篇文章 ・ 344 位粉絲
閱讀商周,一手掌握趨勢,感受愜意生活!商業出版為專業的商業書籍出版公司,期望為社會推動基礎商業知識和教育。

0

4
3

文字

分享

0
4
3
從「工人智慧」到「人工智慧」——《普林斯頓最熱門的電腦通識課》
商業周刊
・2022/03/13 ・3569字 ・閱讀時間約 7 分鐘

  • 作者/ 布萊恩·柯尼罕( Brian W. Kernighan)
  • 譯者/ 李芳齡

人工智慧的開端

在電腦發展之初的二十世紀中期,人們開始思考可以如何用電腦來執行通常只有人類才能做到的事情,一個明顯的目標是玩西洋跳棋和西洋棋之類的棋盤遊戲,因為這領域有個優點,那就是有完全明確的規則,並有一大群感興趣且有資格稱為專家的人。

另一個目標是把一種語言翻譯成另一種語言,這顯然困難得多,但更為重要,例如,在冷戰時期,從俄文到英文的機器翻譯是很要緊的事。其他的應用包括語音辨識與生成,數學與邏輯推理,做決策,及學習過程。

這些主題的研究很容易取得資助,通常是來自美國國防部之類的政府機構。我們已經在前文中看到,美國國防部對早期網路研究的資助有多珍貴,它引領出網際網路的發展。人工智慧的研究也同樣受到激勵及慷慨資助。

我認為,把 1950 年代及 1960 年代的人工智慧研究形容為「天真的樂觀」,應該是公允的。當時的科學家覺得突破就快到來,再過個五或十年,電腦就能正確地翻譯語言,在西洋棋比賽中擊敗最優的人類棋手。

我當時只是個大學生,但我著迷於這個領域和潛在成果,大四時的畢業論文就以人工智慧為主題。可惜,那篇論文早已被我搞丟了,我也想不起當年的我是否也抱持相同於當時普遍的樂觀態度。

但是,事實證明,幾乎每個人工智慧的應用領域都遠比設想的要困難得多,「再過個五或十年」總是一次又一次被端出來。成果很貧乏,資金用罄了,這領域休耕了一、二十年,那段期間被稱為「人工智慧之冬」。

網際網路發展成未來趨勢。圖/Pexels

把專家的判斷規則,直接寫成一堆判斷式的「工人智慧」階段

到了 1980 年代和1990年代,這個領域開始用一種不同的方法復耕了,這方法名為專家系統(expert systems)或規則式系統(rule-based systems)。

專家系統是由領域專家寫出很多規則,程式設計師把這些規則轉化為程式,讓電腦應用它們來執行某個工作。醫療診斷系統就是一個著名的應用領域,醫生制定研判一名病患有何問題的規則,讓程式去執行診斷、支援、補充,或理論上甚至取代醫生。

MYCIN 系統是早期的一個例子,用於診斷血液感染,它使用約 600 條規則,成效至少跟一般醫生一樣好。這系統是由專家系統先驅愛德華.費根鮑姆(Edward Feigenbaum)發展出來的,他因為在人工智慧領域的貢獻,於 1994 年獲頒圖靈獎。

專家系統有一些實質性的成功,包括顧客支援系統、機械維修系統以及其他焦點領域,但最終看來也有重大限制。

實務上,難以彙集一套完整的規則,而且有太多例外情況。這種方法未順利擴大應用於大量主題或新問題領域,需要隨著情況變化或了解的改進,更新規則,舉例而言,想想看,在 2020 年遇上一名體溫升高、喉嚨痛、劇烈咳嗽的病患時,診斷規則該如何改變?這些原本是一般感冒的症狀,或許有輕微的併發症,但很可能是新冠肺炎,具有高傳染性,且對病患本身及醫療人員都非常危險。

擺脫「工人智慧」,讓電腦能自學——機器學習的基本概念

機器學習的基本概念是對一種演算法給予大量的例子,讓它自行學習,不給它一套規則,也不明確地編程讓它去解決特定問題。

最簡單的形式是,我們為程式提供一個標記了正確值的訓練集(training set),例如,我們不試圖建立如何辨識手寫數字的規則,而是用一個大樣本的手寫數字去訓練一套學習演算法,我們對每個訓練資料標記其數值,這演算法使用它在辨識訓練資料時的成功及失敗來學習如何結合這些訓練資料的特徵,得出最佳辨識結果。

當然,所謂的「最佳」,並不是確定的:機器學習演算法盡力去提高得出好結果的機率,但不保證完美。訓練之後,演算法根據它從訓練集學到的,對新的資料進行分類,或是預測它們的值。

監督式學習——人類教電腦看見特徵,由演算法來算出規則

使用有標記的資料(labeled data/tagged data)來學習,此稱為監督式學習(supervised learning)。大多數監督式學習演算法有一個共通的架構,它們處理大量標記了正確類別(正確值)的例子,例如,這文本是不是垃圾郵件,或者,這照片中的動物是哪種動物,或者,一棟房子的可能價格。演算法根據這個訓練集,研判能讓它得出最佳分類或做出最佳預測的參數值;其實就是讓它學習如何從例子做出推斷。

我們仍然得告訴演算法,哪些「特徵」能幫助做出正確研判,但我們不對這些特徵給予權值或把它們結合起來。舉例而言,若我們試圖訓練演算法去過濾郵件,我們需要與垃圾郵件內容有關的特徵,例如類似郵件用詞(「免費!」)、已知的垃圾郵件主題、怪異字符、拼字錯誤、不正確的文法等等。

這些特徵單獨來看,並不能研判一份郵件就是垃圾郵件,但給予足夠的標記資料,演算法就能開始區別垃圾郵件與非垃圾郵件——至少,在濫發垃圾郵件者做出進一步調整之前,這演算法具有此過濾成效。

手寫數字辨識是一個眾所周知的問題,美國國家標準與技術研究院(National Institute of Standards and Technology,NIST)提供一公開測試組,有 60,000 個訓練圖像集和 10,000 個測試圖像集,<圖表>是其中一個小樣本。機器學習系統對此資料的辨識成效很好,在公開競賽中,錯誤率低於 0.25%,亦即平均 400 個字符中只有一個錯誤。

機器學習演算法可能因種種因素而失敗,例如,「過度擬合」(over-fitting),演算法對其訓練資料的表現很好,但對新資料的表現遠遠較差。或者,我們可能沒有足夠的訓練資料,或是我們提供了錯誤的特徵集,或者,演算法產生的結果可能確證了訓練集內含偏誤。

這在刑事司法應用系統(例如判刑或預測再犯)中是特別敏感的問題,但在使用演算法來對人們做出研判的任何情況,也會造成問題,例如信用評等、房貸申請、履歷表篩選。

垃圾郵件偵測及數位辨識系統是分類型演算法(classification algorithms)的例子:對資料項做出正確分類。

預測型演算法(prediction algorithms)則是試圖預測一數值,例如房子價格、運動比賽得分、股市趨勢。

舉例而言,我們可能試圖根據位置、年齡、客廳面積與房間數等主要特徵來預測房子價格,更複雜的模型——例如 Zillow 使用的模型——會加入其他特徵,例如相似房屋之前的售價、社區特色、房地產稅、當地學校素質。

非監督式學習——讓電腦自己找出特徵與規則

不同於監視式學習,非監督式學習(unsupervised learning)使用未加入標記的訓練資料,亦即沒有對資料加上任何標記或標籤。非監督式學習演算法試圖在資料中找出型態或結構,根據資料項的特徵,把它們分組。有一種盛行的演算法名為「k 群集分析」(k-means clustering),演算法盡力把資料分成 k 群,讓每一群中的資料項相似性最大化,並且各群之間的相似性最小化。

舉例而言,為研判文件的作者,我們可能假設有兩名作者,我們選擇可能的關聯性特徵,例如句子的長度、詞彙量、標點符號風格等等,然後讓分群演算法(clustering algorithm)盡它所能地把文件區分成兩群。

非監督式學習也適用於在一群資料項中辨識離群項(outliers),若大多數資料項以某種明顯方式群集,但有一些資料項不能如此群集,可能代表必須進一步檢視這些資料項。

舉例而言,設若<圖表>中的人工資料代表信用卡使用情形的某個層面,多數資料點分別群集於兩大群之一,但有一些資料點無法群集於這兩群中的任何一群,或許,這些資料點沒什麼問題——群集分析不需要做到完美,但它們也可能是詐欺或錯誤的情況。

群集分析以辨識異常值。圖/普林斯頓最熱門的電腦通識課

非監督式學習的優點是不需要做可能滿花錢的訓練資料標記工作,但它不能應用於所有情況。使用非監督式學習,必須思考出與各群集相關的一些可用的特徵,當然,對於可能有多少個分群,也需有一個起碼的概念。

我曾經做過一個實驗,使用一個標準的 k 群集分析演算法來把約 5,000 個臉孔影像區分為兩群,我天真地期望這演算法或許能區分出性別。結果是,它的正確率約 90%,我不知道它是根據什麼來下結論的,我也無法從那些錯誤的情況中看出什麼明顯型態。

——摘自《普林斯頓最熱門的電腦通識課》,2022 年 2 月,商業周刊

商業周刊
12 篇文章 ・ 3 位粉絲