過去的「深藍」僅是意味資料庫與運算能力上的突破, 今日的「華生」則能夠理解人類語言,並且具備分析能力。
文 / 連以婷
美國電視節目「危險境地」(Jeopardy!)自2011年2月15日起,一連三天展開益智答題競賽,題目範疇涵蓋歷史、文化、文學、科學等範疇,參賽者中有兩位世界紀錄保持人,分別是詹寧斯(Ken Jennings)以及魯特(Brad Rutter),而挑戰者名為「華生」(Watson),三位參賽者將在三天的比賽中,爭奪100萬美元的冠軍獎金。
主持人:「這個字含有四個字母,是馬蹄鐵,也是賭場中用來發牌的盒子。」
華 生:「Shoe」
主持人:「沒錯!」
比賽一開始,華生就拔得頭籌,面對兩位紀錄保持人,華生沒有一絲畏懼的神情,從容自在的按下搶答鈕,回答出正確答案並贏得400美元的獎金積分。
主持人:「意思為時尚優雅,或是同屆畢業生。」
華 生:「chic(時髦的)」
主持人:「不對!」
魯 特:「class」
主持人:「正確!」
在第一天的比賽中,大部分時間由華生保持領先優勢,直到最後的幾題才讓魯特迎頭趕上,最後華生與魯特以累積獎金積分5000美元暫時領先,而詹寧斯則暫時以2000美元落後。華生沉著穩定的表現吸引了全場的目光,但到底是怎樣的一位參賽者,能以毫無畏懼的姿態同時挑戰兩位紀錄保持人,表現甚至還略居上風呢?
新生代超級電腦誕生
「華生」的全名為IBM Watson,以IBM創辦人Thomas J. Watson命名,是繼「深藍」後,IBM研發出新一代挑戰人腦的超級電腦。
「深藍」(Deep Blue)在1997年打敗世界西洋棋棋王,曾引起廣大的注目,當時「深藍」儲存了世界上所有的棋譜,運算速度為每秒2億步棋,在與人類對弈時可搜尋及估計隨後的12步棋,而一名人類西洋棋好手大約可估計隨後的10步棋。但是「深藍」的勝利只是意味電腦在有固定規則與邏輯、屬於數學計算性質的領域中取得重大突破,並不表示電腦已突破往日的框架,可以理解人類的語言、跟人類進行互動,甚至幫人類解決問題。
要讓電腦了解自然語言,也就是一般人日常溝通所使用的語言,一直是電腦科學最大的挑戰,也是好萊塢科幻電影演不膩的主題。IBM在「深藍」退役後,把重心放在自然語言上,他們希望打造一個像《星艦迷航記》(Star Trek)影集裡能和人類互動,幫助人類做出重大決定的電腦,但首要條件就是聽得懂人類語言、能夠和人類談話,華生也就是在這樣的期待中誕生了。
2007年,華生研究中心(IBM Thomas J. Watson Research Center)費魯奇博士(Dr. David Ferrucci)開始思考讓電腦參加益智性問答節目的可能性,他提出「華生」電腦的研發構想,希望透過參賽,利用自然語言技術和超級運算能力,讓華生快速、準確且有策略地回答問題,進一步接近人類更複雜的知識和語言領域。費魯奇博士將「危險境地」鎖定為挑戰對象,但要贏得比賽可不是那麼容易,因為該節目在美國家喻戶曉,以高難度著稱;參賽者除了需要有豐富的知識,更要從得到的線索中察覺語言所隱含的細微差別。對於含意曖昧、使用隱喻,並含有諷刺、雙關意義的機智謎題或詩歌,人腦都能順利理解,但電腦通常無法做到,因為電腦系統的分析能力習於執行準確的要求。
為了達成這史無前例的挑戰,由費魯奇博士領軍,帶領IBM華生研究中心的25位研究員,耗費四年的時間,研究自然語言技術的利用和超級運算能力,此為IBM每年投入約六十億美元的研究專案之一。
首先建構華生的大腦,他們使用擴充性良好的Power 750伺服器主機,組合成10台機櫃,共2880個POWER7處理器核心,能同時運行逾千項數據分析工作,即時運算15TB的數據,運算速度每秒可執行80兆次,而一般電腦每秒可做千億次運算。接著華生的記憶體被灌進了100萬本書,包括百科全書、莎士比亞劇本、地圖圖鑑、新聞等,總計華生的資料庫裡累積了約2億頁來自各個領域的知識。當龐大資料庫建立後,如何分析問題並找到最佳答案?華生採用的關鍵技術為「DeepQA」(深度問答)技術,能融合自然語言處理、智慧資訊檢索、知識表徵、推理和學習機制等。螢幕上「華生」的形象是一顆地球,有光線圍繞閃爍,宛如星軌,而星軌的顏色代表華生的「臉色」,當華生很有信心,星軌會呈現綠色,沒信心時,則是橘色。
比賽來到第二天,所有題目的獎金都提高了,比賽也正式進入白熱化階段,首先由前一天成績最低的詹寧斯選題。
詹寧斯:「我選『放心吧!』獎金2000元的題目。」
主持人:「你其實只是長了痤瘡,並沒有受到韓森氏病(Hansen’s Disease)的感染。」
華 生:「痲瘋病(leprosy)」
主持人:「正確!」
當主持人用字正腔圓的英文念完題目,華生幾乎是同時按下了搶答鈕,回答出正確答案,到底華生是如何在短短的幾秒鐘內辦到呢?
判讀人類語言的意義與脈絡
當人們在交談時,通常都能透過前後文知道對方的問題,但對電腦而言卻極為困難,想想當你試圖使用翻譯軟體翻譯一段完整句子時的慘狀就知道了。電腦在分析一個英文問句時,需先判別主詞、動詞、受詞與介系詞;有些字還不只有單一個意思,電腦還需從眾多意思中挑選符合的出來。另一個問題是當電腦嘗試模仿人腦以經驗為基礎的思考方式,需要很冗長的計算過程,若只是回答一個簡單問題,用最快的處理器,大約也需要2小時才能計算出答案。若想要從電腦中快速地得到答案,最常使用的是「關鍵字」搜尋,電腦會從網路上、說明書中把有關鍵字的網頁或句子一一列舉出來,但這個方法雖然快速,若關鍵字不夠精確,仍需耗費許多時間過濾資料。
華生與只能理解基本問題或以相關資料列表的關鍵字搜尋引擎不同,它可以理解並處理人類的自然語言,進行語句結構或文本分析。在比賽進行中,每當主持人提出一個新問題,在沒有與網路連線的情況下,華生運用600萬條邏輯規則來了解人類語言的意義和前後脈絡,從內建的2億頁文字中,藉著IBM POWER 7處理器每秒運算500GB資料能力,火速搜索、瀏覽、對照,交叉分析文章段落,用數百種演算法搜尋出每個可能的答案,並算出每個答案的信心指數(Confidence level),最後用機器合成聲音回答,但如果對答案的信心指數不高時,華生會直接放棄回答,而不會冒險作答。以這樣的方法,在大部份狀況下,華生都能比兩位人類對手更快答對。
在第二天的比賽中,華生一路遙遙領先另外兩名參賽者,令人驚訝的是,當它不確定答案時,除了臉色變為橘色,它還會說:「我猜猜看!」當碰到「每日雙倍獎金」(Daily Double)問題,華生以悅耳的電子合成聲音說:「我下注6435美元。」主持人和所有人都很好奇這個數目是怎麼跑出來的,但主持人卻說:「我不要問!」
當第二天的比賽來到尾聲,主持人揭開了最後一題題目,這一題題目不是搶答題,而是每位參賽者在各自的作答區中寫下答案,並寫出下注的金額,答案公佈後,每位參賽者依下注的金額得到或失去不同的獎金。
主持人:「第一個提示,美國城市;第二個提示,這個城市以二次世界大戰的一位英雄及一場知名戰役,分別命名它第一大與第二大的機場。」
詹寧斯:「芝加哥」
魯 特:「芝加哥」
華 生:「多倫多???」
正確答案是芝加哥,因為芝加哥以二次世界大戰中的王牌飛行員歐海爾少校(O’Hare)及中途島(Midway),來為它的兩大國際機場命名。但儘管華生在這一題答錯了,不過影響不大,因為它精明地只下注947美元。
華生也會犯錯?
偶爾華生也會犯下錯誤,但跟一開始的練習賽比起來,現在的狀況可稱得上完美!一開始的練習賽可說是慘不忍睹,當時許多千奇百怪的答案惹得工程師們各個捧腹大笑,不是把性別搞錯,就是把應該是地名的答案回答人名。有時候比賽的題目會暗示性別,對人類而言可以輕而一舉的知道暗示,但對華生來說卻是一大挑戰,也鬧出不少笑話。比如說它搞不懂當問題出現「第一夫人」時,有很大的可能性是在指女性,或當題目類別是「歷史上的女性」,它反而回答出男性的名字,IBM為此花了超過一年的時間訓練華生,直到2010年的夏天才有長足進步。
另一個需要克服的是華生的發音,就單純的英文字而言,華生的發音不是問題,但對不是英文的外來字發音,或是外國人名,華生一開始吃了許多虧,它曾經把無尾熊(koala)念成可樂(cola),或是把重音的位置放錯而出現奇怪的發音。
經過不斷地訓練與改進後,華生的答題正確率從一開始2007年2月份的15%,2008年8月上升到參賽者平均60%的答題正確率,到2009年11月華生第一次與參賽者進行練習,此時的答題正確率已到達總冠軍程度的90%。
但聰明過人的華生怎麼會把多倫多當成「美國城市」呢?費魯奇博士說,在訓練華生的過程中,研究員一直灌輸它一個重要答題的技巧,就是節目給的所有提示都要一併考慮,對於那些看似枝微末節或是表面訊息,絕對不可視為理所當然或是妄下斷語。因此華生可能認為「美國城市」並不是一個真正的提示,再加上從它的資料庫中找不到充分的證據,證實「芝加哥」、「機場」、「芝加哥的機場」與「二次世界大戰」這幾個關鍵詞之間的關係,信心水準只有三成而已,因此沒有拿下這一題。雖然華生出錯,但費魯奇博士很樂觀地把華生的失誤當成一種鼓勵,他說:「華生透過參加人類的益智節目,更了解自己的優缺點。」
第三天的比賽由主持人正經八百的說:「現在,我知道多倫多是美國城市。」揭開序幕,但華生一點也沒有受到昨天失誤的影響,仍四平八穩的回答每一題答案。最後華生以累計獎金積分7萬7147美元,打敗詹寧斯的2萬4000美元,以及魯特的2萬1600元,拿下最終勝利,並獲得百萬美元的冠軍獎金。比賽結束後,詹寧斯也在螢幕上打趣地寫下「我在此,歡迎新的電腦統治者」,向他的機器人競爭者華生致意。
朝未來邁進
華生的勝利象徵著IBM近年來在電腦系統的研究達到另一個新高峰,也開啟了下一波電腦運算的新頁,未來電腦不再只是台「計算機」,而是台「有溝通與學習能力的機器」,它可以讀懂人類的語言,自行思考分析、消化學習,再從中幫助人類挖掘各種更具創意、或創新的最佳解答。無論在工業、商業、醫療或法律上,它都可以提供更具價值的建議來幫助企業、機構或個人進行決策。或許不久的將來,你可以像「危險境地」的主持人一樣拐彎抹角的問問題,也可以直接了當的請求幫忙,它絕對理性,也不會意氣用事。
有些人可能會擔心或許未來華生背後的技術將凌駕人類的智慧,但費魯奇博士表示,這些擔心都是多餘的,電腦分析龐大資料是它「思考」的方式,但其中扮演如同大腦分析的技術,是奠基在人類的智能上,再輔以卓越運算能力,才完成精確有效率的資料分析。而這些科技,即將提供人們超乎想像的智慧應用,幫助人類突破限制,在過往機器無法涉獵的領域發揮所長。費魯奇強調,人類智慧仍持續支配電腦,就如同在網際網路的時代,人們並未被網路主宰。
後 記
當我在寫稿時,為了蒐集資料而瀏覽網頁,不知為何我的電腦中毒了,所有資料全部不見,也不能上網。就在我心急的打電話給認識的人,問該怎麼辦時,我突然想到華生,如果我有一台像華生一樣的電腦,他不需要連上網就可以幫我解決問題,而我只需要著急的問他:
「華生,當我在瀏覽某某網頁時,電腦突然壞掉了,所有資料都不見,我不知道是不是中毒了,但我需要回復資料,我該怎麼辦?」
這時只見華生不疾不徐地說:
「首先,看看電腦硬碟空間是否有改變,如果沒有的話,把硬碟拔出,連接其他電腦,然後……」
作者連以婷:科學月刊特約編輯 | 本文為《科學月刊》2011.6月號封面故事「華生啊,你自認超越人腦了嗎?」