0

0
0

文字

分享

0
0
0

說到太空探索,有學習能力的機器人能為我們做什麼?——《離開太陽系》

時報出版_96
・2019/04/15 ・3466字 ・閱讀時間約 7 分鐘 ・SR值 549 ・八年級

-----廣告,請繼續往下閱讀-----

編按:本文選自《離開太陽系》第七章:機器人上太空。今日的機器其實是過度美化的機器——它們能執行特定且反覆的有限任務,卻無法勝任涉及基本知識的複雜工作。過去數十年來,電腦運算能力每 18 個月就翻倍成長,我們能懷抱怎樣的期待?

圖/flickr

來到某個階段,我們應該會不得不指望由機器接手控制。
──英國計算機科學家亞倫.圖靈(Alan Turing)
倘若如此遙不可及的事會在接下來一兩百年內發生,我大概會非常驚訝。
──美國跨學科研究者道格拉斯.侯世達(Douglas Hofstadter)

DARPA 挑戰賽:製作可以清理核災高輻射現場的機器人

二○一三年,隸屬美國國防部、負責網路基礎建置工作的「高級研究計畫局」(Defense Advanced Research Projects Agency,DARPA)向全球科學家下戰帖:為二○一一年發生三座核電廠爐心熔毀的日本福島縣設計機器人,清理輻射外洩造成的嚴重混亂。電廠殘骸的輻射殘留極強烈,工作人員在致命輻射區待個幾分鐘就得離開,導致清理作業嚴重落後。據官方估計,該輻射汙染區至少得花三十至四十年才能清理完畢,作業成本高達一千八百億美元。

海嘯後的沿岸。圖/wikipedia

如果科學家有辦法做出毋須人類介入、能自動清理垃圾與廢棄物的機器人,無疑也可視為打造外星用自動機(協助打造月球基地或火星移居地)的第一步,即使在高輻射環境工作也不怕。

DARPA 意識到,日本福島縣會是應用最新 AI 技術的理想場所,於是決定推出獎金三百五十萬美元的「 DARPA 機器人挑戰」,徵選可執行基礎清理任務的機器人。(事實證明上一屆的 DARPA 挑戰賽極為成功,順利為開發「無人駕駛車輛」做好暖身工作。)這場競賽無疑也是完美的公共論壇,得以宣揚 AI 領域的相關進展。經過多年過度讚譽和誇大宣傳,此刻該是秀出真本事的時候了。世人將親眼目睹,機器人有能力執行較不適合人類處理的重要工作。

DARPA 訂下的規則不多,但意義明確:若想贏得大獎,機器人必須執行八項簡單任務,包括駕車、移除廢棄物、開門、關閉滲漏閥門、組接消防水喉及水帶、旋開或關閉閥門等。來自世界各地的文章條目湧入論壇,競相爭取榮耀和優渥獎酬。然而競賽結果並未順利開啟 AI 新紀元,倒是留下略嫌難堪的局面:

-----廣告,請繼續往下閱讀-----

參賽者多數無法完成任務,有些甚至直接在鏡頭前失敗出糗。

經過這次挑戰賽,顯示 AI 的複雜程度可能比「由上往下」的設計概念還要複雜許多。

機器不像人腦具有神經網路,所以無法學習

某些 AI 研究人員已徹底揚棄由上往下法,改為「由下往上」(bottom-up),選擇模仿大自然。這套替代策略或能另闢蹊徑,有希望造出能在外太空作業的機器人。出了 AI 實驗室,這類精細複雜的全能自動機其實處處可見,遠勝過人類目前設計過功能最強大的作品。這種全能自動機叫「動物」。小不嚨咚的蟑螂在森林裡熟門熟路、動作靈巧地鑽來竄去,尋找食物和交配對象。相較之下,咱們身形龐大、動作笨拙的機器人在行進期間,有時不小心還會刮破壁紙呢。

六十年前,達特茅斯研討會在理論推定上的潛在瑕疵,至今仍是 AI 領域揮之不去的陰影。人腦不是數位電腦。人腦不跑主程式、不跑子程式,沒有中央處理器也沒有晶片組,更不需要程式碼。若移除電腦的某顆電晶體,電腦大概就掛了,然而人類就算切掉半顆大腦,大腦還是能設法運作。

人類就算切掉半顆大腦,大腦還是能設法運作。圖/flickr

大自然實現運算奇蹟的方式是將大腦設計成一套神經網絡,一部學習機器。各位的筆記型電腦永遠不可能學習,今天的它跟昨天、跟去年一樣,沒有長進。但人腦不同。人腦在學習任何事物之後,理論上都會「重組」一遍,這也就是娃娃在還沒學習任何語言之前只會咿咿呀呀、我們在學會騎單車之前只能歪歪倒倒或急轉急煞之故。

-----廣告,請繼續往下閱讀-----

神經網絡依循「赫布定律」(Hebb’s rule),藉由「持續重複」來改善功能。赫布定律言明:

你執行某項工作的次數越多,與這項工作有關的神經傳導路徑就會使用得越頻繁,達到加強效果。

在神經科學領域中,有句話是這麼說的:「同時受激發的神經元亦彼此相連。」(Neurons that fire together wire together.)各位或許聽過一則老笑話,「『卡內基廳』怎麼去?」神經網絡解讀後回答:「練習、練習、再練習。」

舉例來說,常登山健行的人都曉得,假如某條山徑被踩得亂七八糟,就表示一定有很多人走過這條路,那麼這條路很可能就是最好的選擇。正確的途徑每使用一次就會強化一次。同樣的,你越常從事某項行為,和這項行為有關的神經路徑也會越頻繁受到強化。

圖/pixabay

這套概念非常重要,因為具學習能力的機器無疑是太空探索的關鍵要素。機器人將會在外太空持續遭遇全新、不斷變化的危險挑戰,被迫跟當今科學家設想不到的意外場景短兵相接。若只為機器人安裝應付固定緊急事件的處理程式,機器人將毫無用處,因為命運會扔給它一堆無法預料的難題。比方說,老鼠身上不可能預載能應付所有局面的基因密碼,因為牠一輩子要面對的狀況無法勝數,但牠的基因卻是有限的。

-----廣告,請繼續往下閱讀-----

假設火星某基地遭到流星雨襲擊,造成許多建物損毀。這時,配備神經網絡的機器人就能一邊處理這類意外狀況、一邊學習,並且越做越好。反觀傳統的「由上往下設計」型機器人,屆時大概只會癱在原地,無力應付意料之外的緊急狀況。

目標是打造具有學習能力的機器人

羅尼.布魯克斯(Rodney Brooks)將許多這類新概念導入研究。羅尼是麻省理工學院著名的「人工智慧實驗室」前實驗室主任。在訪談期間,他曾讚嘆像蚊子這麼簡單的小東西(那顆顯微等級的小腦袋少說也有上萬神經元),都能毫不費力在三維空間飛行,但我們卻得用無數複雜的電腦程式控制一具只會走路的機器人,而且還可能走得跌跌撞撞、蹣跚踉蹌。羅尼用他研發的「機器蟲」(bugbots)和「類昆蟲」(insectoids)率先開闢一條新路徑。透過學習,這兩種自動機都能像六腳昆蟲般移動。起初牠們總是摔個四腳朝天,不過每次嘗試都有進步、越走越好,漸漸能像真的昆蟲一樣順暢調控六隻腳。

這套將神經網路置入電腦的過程稱為「深度學習」(deep learning)。隨著這項科技逐漸發展,極可能在許多產業引發重大革新。在不久的將來,若您想看醫生、找律師,只消對著智慧牆或智慧腕錶下達「找(機器)醫師」或「找(機器)律師」的指令,程式軟體會立刻上網搜尋,提供語音醫療或語音法律服務。這類程式會透過重複的問題持續磨練學習,回答得越來越好──或甚至先發制人,滿足你的特殊需求。

深度學習也可能主導太空全能自動機的發展方向。未來數十年內,人類可能結合「由上往下」及「由下往上」兩套方式,初期先為機器人植入部分基本知識,但機器人也能利用神經網絡運作學習。它們將與人類一樣能透過經驗學習,直至精通「模式識別」和「運用常識」,終而能在三維空間內移動工具、掌控新情勢。不論在火星或整個太陽系、或甚至其他系外星球上,這群機器人都將成為建造、維持外星移居地不可或缺的重要角色。

-----廣告,請繼續往下閱讀-----
也許會有蜘蛛造型的機器人。圖/pixabay

未來,科學家也會針對各種特殊任務而設計不同的機器人。機器人可以像蛇一樣,學習在下水道系統內游泳,尋找滲漏或破損處。超級強壯的機器人則學習在建築工地負責所有重物搬運工作。飛行機器人的外型可能像鳥,它們要學的是調查與分析外星地貌。學會探勘地下熔岩通道的機器人可能外型像蜘蛛,因為這種多足生物能十分平穩地越過起伏不平的地面。還有,負責在火星冰帽提供遊歷探險服務的機器人,造型大概會像智慧型雪橇機車。至於必須潛入歐羅巴海洋採集樣本的機器人,說不定會設計成章魚的模樣。

為了探索外太空,機器人必須要能從兩方面學習:一是向隨時、隨機接觸的環境學習,二是吸收直接取得的資訊。
不過,倘若我們希望機器人能靠自己獨力建構整座城市,那麼 AI 領域就算發展到前述這種進階等級,可能還是不夠用。看來,打造「有複製能力」、並且具有「自我意識」的全能自動機,或許才是機器人這門科學的終極挑戰吧。

 

 

 

本文摘自《離開太陽系:移民火星、超人類誕生到星際旅行,探索物理學家眼中的未來世界》,2018 年 12 月,時報出版

文章難易度
時報出版_96
174 篇文章 ・ 34 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。

0

4
4

文字

分享

0
4
4
除了蚯蚓、地震魚和民間達人,那些常見的臺灣地震預測謠言
鳥苷三磷酸 (PanSci Promo)_96
・2024/02/29 ・2747字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

災害性大地震在臺灣留下無數淚水和難以抹滅的傷痕,921 大地震甚至直接奪走了 2,400 人的生命。既有這等末日級的災難記憶,又位處於板塊交界處的地震帶,「大地震!」三個字,總是能挑動臺灣人最脆弱又敏感的神經。

因此,當我們發現臺灣被各式各樣的地震傳說壟罩,像是地震魚、地震雲、蚯蚓警兆、下雨地震說,甚至民間地震預測達人,似乎也是合情合理的現象?

今日,我們就要來破解這些常見的地震預測謠言。

-----廣告,請繼續往下閱讀-----

漁民捕獲罕見的深海皇帶魚,恐有大地震?

說到在坊間訛傳的地震謠言,許多人第一個想到的,可能是盛行於日本、臺灣的「地震魚」傳說。

在亞熱帶海域中,漁民將「皇帶魚」暱稱為地震魚,由於皇帶魚身型較為扁平,生活於深海中,魚形特殊且捕獲量稀少,因此流傳著,是因為海底的地形改變,才驚擾了棲息在深海的皇帶魚,並因此游上淺水讓人們得以看見。

皇帶魚。圖/wikimedia

因此,民間盛傳,若漁民捕撈到這種極為稀罕的深海魚類,就是大型地震即將發生的警兆。

然而,日本科學家認真蒐集了目擊深海魚類的相關新聞和學術報告,他們想知道,這種看似異常的動物行為,究竟有沒有機會拿來當作災前的預警,抑或只是無稽之談?

-----廣告,請繼續往下閱讀-----

可惜的是,科學家認為,地震魚與地震並沒有明顯的關聯。當日本媒體報導捕撈深海魚的 10 天內,均沒有發生規模大於 6 的地震,規模 7 的地震前後,甚至完全沒有深海魚出現的紀錄!

所以,在科學家眼中,地震魚僅僅是一種流傳於民間的「迷信」(superstition)。

透過動物來推斷地震消息的風俗並不新穎,美國地質調查局(USGS)指出,早在西元前 373 年的古希臘,就有透過動物異常行為來猜測地震的紀錄!

人們普遍認為,比起遲鈍的人類,敏感的動物可以偵測到更多來自大自然的訊號,因此在大地震來臨前,會「舉家遷徙」逃離原本的棲息地。

-----廣告,請繼續往下閱讀-----

當臺灣 1999 年發生集集大地震前後,由於部分地區出現了大量蚯蚓,因此,臺灣也盛傳著「蚯蚓」是地震警訊的說法。

20101023 聯合報 B2 版 南投竹山竄出蚯蚓群爬滿路上。

新聞年年報的「蚯蚓」上街,真的是地震警訊嗎?

​當街道上出現一大群蚯蚓時,密密麻麻的畫面,不只讓人嚇一跳,也往往讓人感到困惑:為何牠們接連地湧向地表?難道,這真的是動物們在向我們預警天災嗎?動物們看似不尋常的行為,總是能引發人們的好奇與不安情緒。

如此怵目驚心的畫面,也經常成為新聞界的熱門素材,每年幾乎都會看到類似的標題:「蚯蚓大軍又出沒 網友憂:要地震了嗎」,甚至直接將蚯蚓與剛發生的地震連結起來,發布成快訊「昨突竄大量蚯蚓!台東今早地牛翻身…最大震度4級」,讓人留下蚯蚓預言成功的錯覺。

然而,這些蚯蚓大軍,真的與即將來臨的天災有直接關聯嗎?

-----廣告,請繼續往下閱讀-----

蚯蚓與地震有關的傳聞,被學者認為起源於 1999 年的 921 大地震後,在此前,臺灣少有流傳地震與蚯蚓之間的相關報導。

雖然曾有日本學者研究模擬出,與地震相關的電流有機會刺激蚯蚓離開洞穴,但在現實環境中,有太多因素都會影響蚯蚓的行為了,而造成蚯蚓大軍浮現地表的原因,往往都是氣象因素,像是溫度、濕度、日照時間、氣壓等等,都可能促使蚯蚓爬出地表。

大家不妨觀察看看,白日蚯蚓大軍的新聞,比較常出現在天氣剛轉涼的秋季。

因此,下次若再看到蚯蚓大軍湧現地表的現象,請先別慌張呀!

-----廣告,請繼續往下閱讀-----

事實上,除了地震魚和蚯蚓外,鳥類、老鼠、黃鼠狼、蛇、蜈蚣、昆蟲、貓咪到我們最熟悉的小狗,都曾經被流傳為地震預測的動物專家。

但可惜的是,會影響動物行為的因素實在是太多了,科學家仍然沒有找到動物異常行為和地震之間的關聯或機制。

遍地開花的地震預測粉專和社團

這座每天發生超過 100 次地震的小島上,擁有破萬成員的地震討論臉書社團、隨處可見的地震預測粉專或 IG 帳號,似乎並不奇怪。

國內有許多「憂國憂民」的神通大師,這些號稱能夠預測地震的奇妙人士,有些人會用身體感應,有人熱愛分析雲層畫面,有的人甚至號稱自行建製科學儀器,購買到比氣象署更精密的機械,偵測到更準確的地震。

-----廣告,請繼續往下閱讀-----

然而,若認真想一想就會發現,臺灣地震頻率極高,約 2 天多就會發生 1 次規模 4.0 至 5.0 的地震, 2 星期多就可能出現一次規模 5.0 至 6.0 的地震,若是有心想要捏造地震預言,真的不難。 

在學界,一個真正的地震預測必須包含地震三要素:明確的時間、 地點和規模,預測結果也必須來自學界認可的觀測資料。然而這些坊間貼文的預測資訊不僅空泛,也並未交代統計數據或訊號來源。

作為閱聽者,看到如此毫無科學根據的預測言論,請先冷靜下來,不要留言也不要分享,不妨先上網搜尋相關資料和事實查核。切勿輕信,更不要隨意散播,以免造成社會大眾的不安。

此外,大家也千萬不要隨意發表地震預測、觀測的資訊,若號稱有科學根據或使用相關資料,不僅違反氣象法,也有違反社會秩序之相關法令之虞唷!

-----廣告,請繼續往下閱讀-----

​地震預測行不行?還差得遠呢!

由於地底的環境太過複雜未知,即使科學家們已經致力於研究地震前兆和地震之間的關聯,目前地球科學界,仍然無法發展出成熟的地震預測技術。

與其奢望能提前 3 天知道地震的預告,不如日常就做好各種地震災害的防範,購買符合防震規範的家宅、固定好家具,做好防震防災演練。在國家級警報響起來時,熟練地執行避震保命三步驟「趴下、掩護、穩住」,才是身為臺灣人最關鍵的保命之策。

延伸閱讀

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
196 篇文章 ・ 302 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

5
0

文字

分享

0
5
0
來當一日語音設計師——如何設計好聽的合成語音?
雅文兒童聽語文教基金會_96
・2023/03/31 ・3727字 ・閱讀時間約 7 分鐘

  • 文/邱彥哲|雅文基金會聽語科學研究中心 助理研究員

「Hey, Siri!」「OK, Google!」你曾經對手上的行動裝置說話嗎?你會要求他回答什麼呢?受限於目前的技術,你可能不會得到非常滿意的答案,但至少你會聽到一陣悅耳如同真人的語音吧!這項現今習以為常的技術,其實背後是由很多知識累積而成的。今天,讓我邀請你擔任一日「語音設計師」,從語音合成的技術開始,接著了解人類使用者的聽覺偏好,最後探索不同族群對聆聽合成語音的差異吧!

語音助理進駐現代人的日常生活。圖/freepik

語音合成(speech synthesis),是指以人工方式,製造出說話的聲音,可以理解為使機器裝置說出人話的技術。廣義來說,很多人也會把文字轉語音(Text to Speech,簡稱 TTS),含括在語音合成的範疇。

語音合成像樂高,但樂高有兩種

早在 1970 年代,人類就已經開始嘗試讓機器說話了。構思如何讓機器說話這件事,最直接的方式就是請真人錄一段聲音,然後在指定的時機播放。不過,面對複雜的語言情境,我們不可能錄下所有可能的回應 ; 而且若要這樣做,也實在太沒效率。幸好,借助電腦運算技術,可以讓人類向自動生成語音邁進一大步。合成的方法可以分成兩大類,分別是單元選取合成(Unit Selection Synthesis)及參數合成(Parametric Synthesis)[1]

單元選取合成這種方法,是將某個語言的語音成分分別以人聲錄製起來,再根據需要的目標語音進行組合。簡單來說,如果需要機器說發出「八」的語音,就必須單獨錄製「ㄅ」跟「ㄚ」。這個技術聽起來直觀方便,但也有缺點。就是事先必須建立一個龐大的語音資料庫,這個資料庫必須包含一個語言所有語音成分,此外,還必須錄下這些語音成分在所有情境下的變化,光想起來就令人有點頭痛。

-----廣告,請繼續往下閱讀-----

所以後者,參數合成,就顯得方便許多。這種方法,是直接將語音參數輸入電腦,讓電腦直接根據參數發出聲音,再組成語音。使用參數合成,就可以免去請人錄音的步驟,但直接使用電腦生成的語音,聽起來也會相對不自然。我們可以把這兩類方法想像成是在組合樂高,都是將語音成分一塊一塊組合起來,只是前者的樂高是自然材質(比如說木頭製),後者是人造材質(比如說塑膠)。

借助深度學習,電腦說話很自動

不過,無論是上述哪種方法,都還是需要不少的人工調校,才能使聲音逐步接近人類的語音。但還好,隨著電腦演算的進步,將深度學習(deep learning)運用在語音合成的領域,不但減少了人工成本,也大大提升的語音的擬人性。所謂深度學習,簡單來說就是一套模擬人類神經網絡的演算法。

使用這樣的演算法,設計者只需蒐集大量的語音資料,將資料「餵」給電腦,無須事先切分或分析,電腦便會自動學習其中的規律。如此一來,只要資料數量足夠龐大,電腦就可以自動產生符合自然規律且真實的語音。

但是,身為一位語音設計師,要進一步思考的是:「究竟要餵給電腦什麼呢?」這個問題又必須從使用者的角度來思考:「人類會偏好聆聽什麼樣的語音?」就像生產商品一樣,語音百百款,要能投其所好,才能讓使用者日日寸步不離,對吧!

-----廣告,請繼續往下閱讀-----

聆聽也要投其所好,性別頻率最重要

人類對不同性別及頻率有特殊的聆聽偏好。圖/freepik

關於合成語音的聆聽偏好,最先被討論的,是性別。雖然我們都知道機器沒有性別,但若希望他和人一樣跟你互動,投射性別是很自然的。不過有人就提出質疑:「為什麼我們的語音助理,都是女性的聲音呢?」美國西北大學梅迪爾傳播新聞整合行銷學院教授 Candy Lee 進行一項調查,測試了 8 種族裔的使用者,結果發現 64% 的人只偏好女性的聲音[2]

這樣看起來,預設為女性的聲音應該是沒問題的吧?不過,有人認為這是社會對「助理」的性別刻板印象所致;因為社會習慣女性作為「服務者」,所以在設計語音時,直覺地就挑選了女性聲音。雖然單就頻率方面,的確有研究指出,使用者確實是偏好頻率較高的合成語音[3],但若是一昧如此,也極有可能不斷複製性別偏見的印象[4]

有鑒於此,越來越多系統開始提供男性語音的選項。更甚者,哥本哈根研究團隊突發奇想,不以性別為選項,而是改以頻率作為調查標準。分析之後,他們得到一個最佳的頻率值──185 赫茲,設計出史上第一個無性別語音助理「Q」[5]。如此一來,青菜蘿蔔各有所好,聆聽的偏好也朝著多元共好的目標邁進!

聽得舒服,語速考量不能少

解決的性別與頻率的問題,還得注意甚麼呢?專門研究輔助溝通系統(Augmentative and Alternative Communication,簡稱 AAC)的專家想到了語速的問題。輔助溝通系統可以簡單理解成「溝通輔具」,是用以輔助溝通障礙者溝通的工具; 簡單如圖卡,複雜如電子溝通板,都算是其中一員。而像是電子溝通板這類,以螢幕顯示圖片,點擊後可以播放語音的輔具來說,合成語音是很關鍵的技術。

-----廣告,請繼續往下閱讀-----

這些溝通障礙專家想知道:「究竟什麼樣的語音速度,是最舒服的呢?」。

Sutton 與其研究團隊招募了 21 至 28 歲的年輕人與 61 至 79 歲的年長者,對合成語音進行語速評分[6]。語速的計算方式,採用每分鐘幾個字(Words per minute,簡稱 WPM)計算。他們將合成語音調整成不同的語速,範圍介於 120 到 250WPM 之間。結果發現,無論年輕人或年長者,偏好的語速都落在 150 到 200WPM 之間 ; 而年長者則是相對年輕人偏好較慢的語速。這樣的範圍,其實與過去研究提出的人類平均語速,相去不遠[7]

如果想知道不同語速聽起來感受如何,可以到合成語音軟體 Speechify[8]的網站試用,自行調整語速(以 WPM 計算),細細品味其中差異。或者,讓我為你朗讀,請聽示範(語速約 180WPM,內容為「我是彥哲,我是普通人。」)! 

可見,語音合成的技術雖是極為理性的領域,但若要設計出美妙的語音,對人類感性的理解,也絕對不能偏廢。

-----廣告,請繼續往下閱讀-----
圖/Pixabay

合成語音聆聽不易,考量族群差異最貼心

「所以,我只要想辦法把語音設計得很像人類就可以了吧?」你可能會這樣想,不過這裡頭還少了一個部分。現代社會提倡多元,客製化當道,每個人使用同個產品的狀況必然會有差異。

其實,即使是一般人,聆聽並理解合成語音是比自然語音更加困難的。Winters 及 Pisoni 發表的回顧研究指出:由於合成語音的清晰度普遍較差,因此聆聽者通常需要動用更多的認知資源(像是電腦需要動用較多記憶體),以及更多高層次的語言知識來彌補語音訊息的不完整[9]。如果對普通人來說是如此,對於某些特殊族群來說,想必有更加需要注意的地方。

比如說兒童。Mirenda 及 Beukelman 招募了成年人、10 至 12 歲以及 6 至 8 歲的兒童進行研究[10]。參與者的任務,是要在聽完自然語音及合成語音播放的八個詞彙之後,再將這八個詞彙回憶並說出來,回答無須按照順序。結果研究者發現,兩組兒童無論聆聽自然或合成語音,回憶詞彙的表現都比成人還差 ; 對於兩組兒童而言,記憶合成語音的表現又更不理想。

由此可知,兒童本身的記憶能力就較成年人弱,在聆聽合成語音時,可以說是是難上加難。

-----廣告,請繼續往下閱讀-----

另一個被探討的,是聽障族群。聽障族群最主要的困難,就在於聆聽。聆聽合成語音如果對聽常族群來說本來就比較困難,那對聽障族群應該是更加艱困的挑戰吧!Kangas 和 Allen 的研究[11]回答了這個問題。研究者請年長聽障者聆聽自然語音與合成語音,並請他們在聆聽後寫出聽到的單字。結果可想而知,聽障者確實在聆聽合成語音的部分表現得比較差。

看完上面的狀況,身為語音設計師的你,在設計語音的時候,是不是也應該從使用者的背景差異去調整你的語音呢?也許是調整語音的頻率,也許是調整語速,也可能,也可能有更多領域需要探索。唯有這樣,才能朝充滿人性又個人化的智慧語音邁進。

怎麼樣?沒想到要設計語音,希望機器說出一句話,背後涉及理性的技術與感性的考量,非常不容易吧!看完之後,你還是可以輕鬆地要求你的行動裝置說個笑話,唱首歌給你聽,自娛娛人;但也千萬別忘記,多留點心思,給這人類文明的結晶致上敬意。一日語音設計師,功成身退!

參考資料

  1. 詹姆士・弗拉霍斯。(2019)。從說話機器人到聊天機器人。聲控未來:引爆購物、搜尋、導航、語音助理的下一波兆元商機(孔令新譯,頁104-137)。商周出版。
  2. Marc Jacob.(2022/3/30). Medill Study Finds Preference for Female Voices and Local Accents. Northwestern Medill Local News Initiative.
  3. 顏宏旭,楊麗平,宋慧宏。(2020)。聽眾對語音合成導覽裝置聲音偏好之探討。戶外遊憩研究。33(4),83-107。
  4. West, M., Rebecca K., & Chew H.E. (2019). I’d Blush if I Could: Closing Gender Divides in Digital Skills Through Education.UNESCO & EQUALS Skills Coalition.
  5. GenderLess Voice. (2023/3/3) Meet Q [Web message].
  6. Sutton, B., King, J., Hux, K., & Beukelman, D. (1995). Younger and older adults’ rate performance when listening to synthetic speech. Augmentative and Alternative Communication, 11(3), 147-153.
  7. Walker, V. G. (1988). Durational Characteristics of Young Adults during Speaking and Reading Tasks. Folia Phoniatrica et Logopaedica, 40(1), 12–20.
  8. Speechify. (2023/3/3) Speechify.
  9. Winters, S. J., & Pisoni, D. B. (2004). Perception and comprehension of synthetic speech. Research on spoken language processing report, 26, 95-138.
  10. Mirenda, P. & Beukelman, D.R. (1987). A comparison of speech synthesis intelligibility with listeners from three age groups. Augmentative and Alternative Communication, 3, 120-128.
  11. Kangas, K.A. & Allen, G.D. (1990). Intelligibility of synthetic speech for normal-hearing and hearing impaired listeners. Journal of Speech and Hearing Disorders, 55, 751-755.
雅文兒童聽語文教基金會_96
54 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

1

38
1

文字

分享

1
38
1
回到 AlphaGo 打敗棋王的那一天,看 AI 如何顛覆世界——《AI 製造商沒說的祕密》
時報出版_96
・2023/01/30 ・4915字 ・閱讀時間約 10 分鐘

谷歌收購深度心智(DeepMind)幾週後,深度心智創辦人德米斯.哈薩比斯(Demis Hassabis)與其他幾位深度心智研究人員搭機來到北加州,與他們母公司的領袖舉行會議,並向他們展示深度學習如何破解「打磚塊」。

幕後推手——德米斯.哈薩比斯

會議結束後,哈薩比斯和谷歌創辦人賽吉.布林(Sergey Brin)聊了起來。他們聊著聊著發現有一共同的興趣:圍棋。布林表示當初他和賴利.佩吉(Larry Page)建立谷歌時,他沉迷在圍棋中,害得佩吉擔心他們根本無法成立公司。

哈薩比斯表示,如果他和他的團隊想要的話,他們能夠建造一套系統來打敗世界冠軍。「我覺得這是不可能的。」布林說道。就在這一刻,哈薩比斯下定決心要做到。

深度心智創辦人、英國人工智慧研究者——德米斯.哈薩比斯(Demis Hassabis)。圖/維基百科

「深度學習運動之父」傑弗瑞.辛頓(Geoffrey Hinton)將哈薩比斯比作羅伯.奧本海默(Robert Oppenheimer),二戰期間做出第一顆原子彈的曼哈頓計畫主持人。奧本海默是世界級的物理學家:他懂得眼前重大任務的科學原理,不過他更深諳激勵之道,他結合手下不斷擴大的科學家,將他們的力量合而為一,並且接納他們的弱點,一起為計畫目標努力。

-----廣告,請繼續往下閱讀-----

他知道如何感動男人(以及女人,包括辛頓的堂姊瓊安.辛頓),辛頓在哈薩比斯身上看到同樣的特質。「他主持 AlphaGo 就像奧本海默主持曼哈頓計畫,如果是別人來主持,他們可能就不會這麼快成功。」辛頓說。

揭開比賽序幕

深度心智的研究員們在 2014 年中曾發表一篇關於他們初期研究的論文,之後他們的研究規模大為擴大,並在第二年擊敗歐洲圍棋冠軍樊麾。此一結果震驚了全球圍棋界與人工智慧研究圈,但是 AlphaGo 對戰李世乭所造成的聲勢更是轟動。

IBM 的深藍超級電腦 1997 年在曼哈頓西城的一棟高樓裡擊敗世界頂尖的西洋棋高手,為電腦科學建立了一座里程碑,受到全球新聞界的廣為報導。但是若是與首爾的這場人機大戰相比,卻是小巫見大巫。在韓國——更別提日本與中國——圍棋是民族性的消遣活動。有超過二億人會觀看 AlphaGo 與李世乭的對弈,觀眾比超級盃多上一倍。

圍棋在中、日、韓具民族性,AlphaGo 與李世乭的對弈備受矚目。圖/維基百科

在總共五局對戰前夕的記者會上,李世乭誇口他能輕鬆獲勝:四比一或五比零。大部分的圍棋棋手也都有同感,雖然 AlphaGo 徹底擊敗樊麾,顯示這部機器是真正的贏家,但是樊麾的棋力遠不及李世乭。根據用來評估遊戲對戰能力的 ELO 等級制度,李世乭完全是在不同的等級。但是哈薩比斯卻認為這場人機大戰會有截然不同的結果。

-----廣告,請繼續往下閱讀-----

第二天下午,在展開第一局對戰的兩小時前,他與幾名記者共進午餐,他拿著一份《韓國先驅報》(Korea Herald),這是用桃色紙張印刷的韓國英文日報。他和李世乭的照片都出現在報紙的頭版上半部。他沒有想到竟會受到如此重視。

「我知道會受到關注,」這位像孩子般矮小,39 歲但已禿頂的英國人說道,「但是沒有想到會這麼多。」不過,在吃著餃子、韓式泡菜的午餐時,哈薩比斯表示他對這場棋賽「審慎樂觀」。他解釋,那些名嘴並不知道 AlphaGo 在十月的棋賽後仍在繼續苦練棋藝。

他和他的團隊初始是將三千萬步棋路輸入深度神經網路來教導機器學習圍棋,自此之後,AlphaGo 就開始不斷與自己對弈,並且記錄哪些棋路是成功的,哪些又是失敗的——其運作與實驗室用來破解雅達利老遊戲的系統類似。自擊敗樊麾以來這幾個月,AlphaGo 已和自己對弈了數百萬局;AlphaGo 持續自學圍棋,學習速度之快遠超過所有人類。

在四季飯店頂樓的賽前餐敘,谷歌董事長艾力克.施密特(Eric Schmidt)坐在哈薩比斯的對面,以他一貫冷峻的態度闡述深度學習的優點。一度有人稱他為工程師,他糾正他們,「我不是工程師,」他說道,「我是電腦科學家。」

-----廣告,請繼續往下閱讀-----
艾力克.施密特(Eric Schmidt)2001~2011 年間在 Google 擔任 CEO。圖/維基百科

他回憶他在 1970 年代研讀電腦科學時,人工智慧看來前景一片大好,但是隨著 1980 年代過去,進入 1990 年代,這樣的美景從未實現。如今,終於實現了。「這一科技,」他說道,「力量強大,引人入勝。」他表示,人工智慧不只是辨識照片的戲法,同時也代表谷歌 750 億美元的網際網路事業與其他無數的產業,包括保健產業。

機器與人類高手對決

在第一局,哈薩比斯是在私人觀賞室與走廊另一頭的 AlphaGo 控制室之間來回兩頭跑。控制室滿是個人電腦、筆記型電腦與平面顯示幕,這些設備全都與遠在太平洋彼端的谷歌數據中心內部數百台電腦相連。一支谷歌團隊在比賽前一週就已架設一條專屬的超高速光纖電纜直達控制室,以確保網際網路暢通無阻。

不過結果卻顯示控制室根本不需要進行多少操控:幾過多月的訓練之後,AlphaGo 已能完全獨力作業,不需要人為的幫助。同時,就算哈薩比斯與團隊想幫忙,也無用武之地。他們沒有一人的圍棋棋力達到大師級的水準,他們只能觀看棋局。

「我無法形容有多緊張,」深度心智研究員說道,「我們不知道該聽誰的。一邊是評論員的看法,你同時也看到 AlphaGo 的評估。所有的評論員都有不同的意見。」

-----廣告,請繼續往下閱讀-----

在第一天的棋賽,深度心智團隊與谷歌的重要人物都親眼目睹 AlphaGo 獲勝。

賽後記者會上,李世乭面對來自東、西方數百名記者與攝影師表示他感到震驚。這位 33 歲的棋士透過口譯員說道:「我沒想到 AlphaGo 下棋竟能夠如此完美。」經過逾四小時的對弈,AlphaGo 證明自己的棋力可與全球最厲害的高手匹敵,李世乭表示他被 AlphaGo 殺了個措手不及,他在第二局會改變策略。

左為代替 AlphaGo 移動棋子的深度心智台灣研究員黃士傑,右則為李世乭。圖/YouTube

神來一筆的第三十七手

第二局對弈進行一小時後,李世乭起身離開賽場,走到露台抽菸。坐在李世乭對面,代替 AlphaGo 移動棋子的是來自台灣的深度心智研究員黃士傑,他將一枚黑子落在棋盤右邊一大塊空地上單獨一枚白子的側邊下方,這是該局的第三十七手。

在角落的評論室內,西方唯一的圍棋最高段九段棋手邁克.雷蒙(Michael Redmond)忍不住多看了一眼確認,然後他告訴在線上觀看棋賽的兩百多萬英語觀眾:「我真的不知道這是高招還是爛招。」他的共同評論員克里斯.戈拉克(Chris Garlock)則表示:「我認為下錯了。」他是一本網路圍棋雜誌的資深編輯,同時也是美國圍棋協會的副會長。

-----廣告,請繼續往下閱讀-----

李世乭在幾分鐘後返回座椅,然後又緊盯著棋盤幾分鐘。他總共花了 15 分鐘才做出回應,在棋局的第一階段他有兩小時的時間,而這一手占用了他不少時間——而且此後他再也沒有找回節奏。在經過逾四小時的對弈後,他投子認輸,他連輸兩局了。

第三十七手也讓樊麾大感詫異,他在幾個月前遭到 AlphaGo 徹底擊敗,自此之後他就加入深度心智,在 AlphaGo 與李世乭對弈前擔任它的陪訓員。他從來沒有擊敗過這部人工智慧機器,但是他與 AlphaGo 的對弈也讓他對棋路的變化大開眼界。事實上,他在遭 AlphaGo 擊敗後的幾週內,與(人類)高手對弈連贏六場,他的世界排名也升至新高。

現在,他站在四季飯店七樓的評論室外面,在第三十七手落子幾分鐘後,他看出了此一怪招的威力。「這不是人類會下的棋路,我從來沒有看過有人這麼下,」他說道,「太美了。」他不斷地重複說道,太美了、太美了、太美了。

第二天上午,深度心智的研究員大衛.席瓦爾溜進控制室,他想知道 AlphaGo 如何做出第三十七手的選擇。AlphaGo 在每一局對弈中都會根據它所受過數千萬種人類落子變化的訓練,來計算人類做出此一選擇的機率,而在第三十七手,它算出的機率是萬分之一。

-----廣告,請繼續往下閱讀-----
AlphaGo 在對弈中會根據千萬種落子變化,計算出人類下此一步棋的機率。圖/YouTube

AlphaGo 知道這不是專業棋手會選擇的路數,然而它根據與自己對弈的數百萬次經驗——沒有人類參與的棋局——它仍是這麼做了;它已了解儘管人類不會選擇這一步,這一步棋仍是正確的選擇。「這是它自己發現的,」席瓦爾說道,「透過它的內省。」

這是一個既甜美又苦澀的時刻,儘管樊麾大讚此一步棋是神來之筆,但是一股鬱悶之情席捲四季飯店,甚至整個韓國。一位中國記者表示,儘管他為 AlphaGo 贏得第一局感到高興,可是現在他深感沮喪。

第二天,一位在首爾彼端經營一家新創企業育成中心的韓國人權五亨表示他也感到悲傷,這並非因為李世乭是一位韓國人,而是因為他是人類,「這是全人類的轉捩點,」權五亨說道,他的幾位同事點頭表示同意,「它讓我們了解人工智慧真的已在我們眼前——也讓我們了解到其中的危險。」

在那個週末,此一鬱悶的情緒只增不減。李世乭第三局也輸了,等於輸掉整個棋賽。坐在賽後記者會的桌子後面,李世乭懺悔之情溢於言表。「我不知道今天要說什麼,但是我首先要表達我的歉意,」他說道,「我應該拿出更好的成績,更好的結局,更好的比賽。」但是坐在李世乭身邊的哈薩比斯卻發現,自己衷心期盼這位韓國棋手在接下來的兩局中至少能贏一局。

-----廣告,請繼續往下閱讀-----

AlphaGo 認輸的那一局

在第四局的七十七手,李世乭再度陷入長考,就和第二局的情況一樣,但是這一回他考慮的時間更久。棋盤中間有一堆棋子,黑白相間,他有近二十分鐘只是緊盯著這些棋子,抓著後頸前後擺動。最後,他將他的白子落在棋盤中央的兩枚黑子之間,將棋勢一分為二,AlphaGo 方寸大亂。

在每一場對弈中,AlphaGo 都會不斷重新計算勝率,並且顯示在控制室的一台平面顯示幕上。

在李世乭落子後——第七十八手——這部機器的反擊很差,在顯示幕上的勝率立刻大降。「AlphaGo 累積到那一步之前的所有戰略都算是報銷了,」哈薩比斯說道,「它必須重新再來。」就在此刻,李世乭抬頭看著對面的黃士傑,彷彿他擊敗的是這人,不是機器。自此之後,AlphaGo 的勝率一路下跌,在近五個小時後,它投子認輸。

DeepMind 製作的 AlphaGo 與李世乭對弈紀綠片。/YouTube

兩天後,哈薩比斯穿過四季飯店的大廳,解釋 AlphaGo 為什麼會輸。AlphaGo 當時是假設沒有人類會這樣下第七十八手,它計算出來的機率是萬分之一——這是一個它熟悉的數字。

就像 AlphaGo 一樣,李世乭的棋力也達到一個新境界,他在棋賽最後一天的私人聚會場合中這樣告訴哈薩比斯。他說與機器對弈不僅讓他重燃對圍棋的熱情,同時也讓他茅塞頓開,使他有了新想法。「我已經進步了。」他告訴哈薩比斯,一如幾天前的樊麾,李世乭之後與人類高手對弈,連贏九場。

AlphaGo 與李世乭的對弈,使得人工智慧在世人眼前大爆發,它不僅是屬於人工智慧領域與科技公司,同時也是屬於市井小民的里程碑。在美國如此,在韓國與中國更是如此,因為這些國家視圍棋為人類智慧結晶的巔峰。這場棋賽彰顯出科技的力量與其終將超越人類的恐懼,同時也帶來樂觀的前景,此一科技往往會以出人意表的方式推動人類更上層樓。儘管馬斯克等人警告其中的危險性,但是這段時期人工智慧的前景一片光明。

裘蒂.英賽恩(Jordi Ensign)是佛羅里達州一位四十五歲的程式設計師,她在讀完棋賽報導後出去在身上紋了兩幅刺青,她在右臂內側紋了 AlphaGo 的第三十七手——左臂紋了李世乭的第七十八手。

——本文摘自《AI製造商沒說的祕密: 企業巨頭的搶才大戰如何改寫我們的世界?》,2022 年 8 月,時報出版,未經同意請勿轉載

所有討論 1
時報出版_96
174 篇文章 ・ 34 位粉絲
出版品包括文學、人文社科、商業、生活、科普、漫畫、趨勢、心理勵志等,活躍於書市中,累積出版品五千多種,獲得國內外專家讀者、各種獎項的肯定,打造出無數的暢銷傳奇及和重量級作者,在台灣引爆一波波的閱讀議題及風潮。