文字

繁 | 简

科學傳播科技能源透視科學

海量資料萬歲？請三思！

活躍星系核・2013/05/25 ・4971字・閱讀時間約 10 分鐘・SR值 616

・十年級

相關標籤：

熱門標籤：

本文出處：Think Again: Big Data
作者：KATE CRAWFORD
譯者：Leonard Chien

「海量資料」是當今最流行的用語，也是科技界對世上各種棘手難題的萬用解答，意指藉由分析龐大資訊後，歸納出模式、精闢見解，並預測複雜問題的答案，聽來或許有些無趣，但無論是阻止恐怖份子、終結貧窮、拯救地球，海量資料支持者都深信可迎刃而解。

在《Big Data: A Revolution That Will Transform How We Live, Work, and Think》一書中，兩位作者寫道，「對於氣候變遷、根除疾病、促進良好治理與經濟發展等全球迫切問題，海量資料均可提供部分答案，為社會提供眾多好處」。

只要握有足夠數據，例如iPhone內部資料、雜貨店購物內容、網路交友檔案、全國匿名醫療紀錄，電腦運算即可拆解這些原始資料，從中挖掘出無數見解。美國歐巴馬政府亦傾力投入，於5月9日「首開先例」，公開「過往無法取用或管理的資料」，供企業家、研究人員及大眾使用。

-----廣告，請繼續往下閱讀-----

歐巴馬總統表示，「我們希望促成更多民間創新與發現，因此史上首次釋出大量美國資料，開放人們輕鬆取用，優秀企業家也已開發出眾多用途」。

可是海量資料的威力是否名實相符？在龐大電腦數據裡，是否真能揭露人類行為的秘密？《外交政策》雜誌邀請麻省理工學院「公民媒體中心」成員Kate Crawford，說明數字背後的真相。－編按

「只要資料足夠，數字自會說話。」

不可能。海量資料支持者希望我們相信，在程式碼字裡行間與巨大資料庫內，必有客觀及通用的見解，能解釋人類行為模式，包括消費情況、犯罪或恐怖主義行動、健康習慣、員工產能等，但他們卻總不願正視缺點。數字不會說話，資料不論規模大小，仍受人類設計限制，Apache Hadoop軟體架構等海量資料工具亦無法排除偏斜、落差與假設錯誤。當海量資料試圖歸納社會狀態，這些因素影響格外顯著，但我們卻常誤以為分析結果比個人意見更客觀。其實海量資料、個人觀感及體驗皆然，充滿偏見及盲點，可是許多人卻以為資料量越大就代表品質越好的資料，也以為「相關」與「因果」一樣好。

例如社群媒體常成為海量資料分析主題，其中也確實充斥大量資訊，據稱從Twitter資料裡可見，人們離家愈遠愈開心，且情緒在每週四晚上最低落。可是我們必須懂得質疑資料背後真正的涵義，例如「皮猶研究中心」指出，美國只有16%的成年網路用戶使用Twitter，亦無法如實代表社會結構，通常年紀較輕、較集中於都會區。此外，許多Twitter帳號均為自動機器人或假檔案，近期估計總數可能高達2000萬，因此討論如何從Twitter分析輿論之前，得先釐清這些反應究竟來自真人或電腦演算式。

-----廣告，請繼續往下閱讀-----

縱然各位相信絕大多數Twitter用戶均為真人，偏見依然存在，例如為分析2013年澳洲網球公開賽中，人們在社群媒體對哪些選手「看法最佳」，IBM透過「社會觀感指數」，大量分析Twitter訊息，結果由Victoria Azarenka奪冠，但許多訊息提到她時，都在批評她濫用傷停時間，如此看來，很難相信IBM的演算式確能反映現實。

即便排除不良資料問題，演算式本身亦有偏見，新聞彙整網站取用你我的個人偏好與瀏覽紀錄，編排出用戶感興趣的最新消息，其中假設頻率與重要性呈正比，或個人社群最常分享的資訊，也必定與你興趣相符。演算式過濾龐大資料時，也訂定呈現世界的原則，一般用戶不會感受到這些規則，可是大大左右民眾觀點。

不少資訊工程專家正在努力解除疑慮，Ed Felten為普林斯頓大學教授，曾為美國聯邦貿易委員會首席科技專家，最近發起一項計畫，測驗各項演算式的偏見，尤其是美國政府也運用演算式評估個人，例如聯邦調查局與運輸安全局即彙整多項官方海量資料，列出航空旅客黑名單，做為飛安制度之用。

「海量資料可提高城市智慧及效能。」

仍有上限。海量資料可提供珍貴見解，協助改善城市，但也僅止於此，由於資料生成與收集過程並不均等，其中會出現「信號問題」，造成有些民眾及社區遭到漠視或代表性不足，若以海量資料處理城市規劃問題，必須仰賴官員同時瞭解資料及其侷限。

-----廣告，請繼續往下閱讀-----

例如美國波士頓的Street Bump應用程式裡，收集行經坑洞的駕駛人智慧型手機資料，能以低成本途徑收集資訊，類似應用程式也與日俱增，可是城市若完全依賴智慧型手機用戶提供資料，等於自動排除部分樣本，某些社區內智慧型手機用戶比例若較低，通常年齡層較高，經濟條件也較弱勢，因此遭到排擠。波士頓市政單位盡力想彌補潛在資料缺口，但假若官員對此警覺性較低，就可能忽略這項問題，導致資源分配不均，進一步擴大既有社會失衡現象。2012年Google的流感趨勢預測中，就曾犯下相同錯誤，嚴重高估年度流感比例，證明若依賴有瑕疵的海量資料，將大大影響公共服務與政策。

「開放政府」計畫將公部門資料張貼於網路上，如Data.gov或美國白宮「開放政府計畫」，也可能面臨相同問題，資料增加未必可改善透明度、責信等政府功能，必須搭配公眾參與機制，政府也得懂得如何詮釋資料，再運用適當資料因應。這些條件都不簡單，況且目前優秀的資料科學家也不足，各大學仍在趕緊劃定學科領域、編寫課程，希望能滿足需求。

人權團體也希望運用海量資料，瞭解各種衝突和危機，但資料與分析品質同樣令人存疑，麥克阿瑟基金會最近核准17.5萬美元的獎助金，由卡內基梅隆大學人權科學中心投入為期18個月的研究，分析海量資料數據如何改變人權運動發展，例如開發「可信度測驗」，以驗證張貼於Crisis Mappers、Ushahidi、Facebook、YouTube等網站的人權侵害控訴真偽。該中心主任Jay D. Aronson指出，「包括學界及人權組織的消息來源，以及資料使用情況，都產生嚴重問題，有了這些新科技之後，對於通報者的人身安全是利或弊，許多時候仍不得而知」。

「海量資料對各個社會族群一視同仁。」

未必如此。海量資料號稱客觀，因為原始資料似乎能排除社會偏見，故可減少歧視少數族群的機率，讓大規模分析避免族群歧視，但海量資料之所以存在，就是為了將個人劃入族群之中，再解釋各族群行為有何異同。例如近期一篇論文才提到，在海量資料基因體研究內，科學家如何讓個人立場左右研究方向。

-----廣告，請繼續往下閱讀-----

如Alistair Croll所言，人們可能運用海量資料製造價格歧視，引起眾多公民權疑慮，在「個人化」名義下，海量資料卻可能用來針對特定社會族群，給予不一樣的待遇，法律通常禁止企業與個人出現此種歧視行為。企業購買網路廣告宣傳信用卡時，可能依據家戶所得或信貸紀錄，挑選特定目標群眾，導致他人完全無從得知該項優惠。Google甚至握有浮動設定內容價格的專利，例如你過往消費紀錄若顯示，可能花高價購買鞋子，下回在網路上打算買鞋時，搜尋結果也將傾向高價品。雇主如今也希望在人力資源方面運用海量資料，完全透過分析電腦使用習慣，評估如何提高員工生產力，而員工可能對這些資料與用途毫不知情。

其他因素也可能產生歧視，例如《紐約時報》曾報導，量販店Target多年前便已開始收集消費者分析數據，如今消費紀錄相當龐大，在某些情況下，甚至可單純根據消費品項歴史，判斷該名女性顧客是否懷孕，可靠度甚至高達87%。儘管該公司代表在報導內強調，這些資料是用來改善對準媽媽的行銷策略，可是這種手段很容易用於歧視，大大影響社會平等與隱私。

英國劍橋大學最近發表一項海量資料研究，運用58000則Facebook網站的按讚紀錄，預測用戶相當敏感的個人資訊，例如性傾向、族裔、宗教與政治立場、個性、智商、幸福程度、菸毒習慣、父母婚姻狀況、年齡、性別等，記者Tom Foremski指出，「取得如此敏感的資訊後，可能遭雇主、房東、政府機關、教育機構、民間組織利用，刻意歧視與懲罰個人，且對方完全無法抵抗」。

海量資料也會影響執法，無論是華府或德拉瓦州的新堡郡，警方都開始採用海量資料「預防巡邏」模型，希望有助調查懸案，甚至避免犯罪發生，可是若將警力集中在海量資料判斷出的潛在犯罪熱點，卻可能強化某些社會族群的污名，認為他們較可能犯案，也等於將區域警力落差視為常態。一名警官曾表示，雖然預防巡邏演算式刻意避免種族、性別等分類，但若隨意使用這些系統，又未察覺差別待遇可能造成的後果，將會造成「警察與社區關係惡化，欠缺程序正義、遭指控種族歧視，也威脅執法基礎」。

-----廣告，請繼續往下閱讀-----

「海量資料屬匿名，不會侵犯隱私。」

大錯特錯。許多海量資料供應者都盡其所能，希望避免個人身分曝光，但風險卻仍存在，大量手機資料或許看似匿名，但近期研究歐洲150萬手機用戶資料顯示，只要四點參考點，即可辨識95%的民眾。研究人員提到，人們往來城市路徑有其獨特性，又能以大量公開資料組推論，讓隱私「疑慮愈來愈強烈」。拜Alessandro Acquisti等學者之賜，只要交叉分析公開資料，即可預測個人社會安全碼。

可是海量資料的隱私問題，不只是一般身分辨識風險，目前醫療資料轉售給分析公司後，可能用來追蹤個人身分，許多人都在討論個人化醫學，希望藥品及其他療程能夠針對個人需求，讓治療效果如同取自個人DNA。此舉可改善療效，但基本上得辨識人體分子和基因，假若使用不當或外流，可能造成高風險。儘管RunKeeper、Nike+等個人健康資料收集裝置迅速增加，尚無太多海量資料實際改善醫療服務的案例。

海量資料能源計畫亦收集各種私密資訊，智慧電力網即為一例，分析龐大消費者用電量資料後，希望改善住家與企業能源配送效能，雖然前景可期，隱私風險也很高，不僅可預測能源用量及需用時間，亦包括住戶在家中動向及行為的時刻資訊，例如何時洗澡、客人何時離開、何時關燈睡覺。

這些充滿個人資訊的海量資料，自然成為駭客及洩露情報者下手的目標，「維基解密」為近期釋出海量資料的知名案例，此外，英國境外金融產業資料最近也大量曝光，顯見人們不論貧富，個人資料都可能公諸於世。

-----廣告，請繼續往下閱讀-----

「海量資料是科學的未來。」

部分屬實，但仍在持續發展。海量資料確實提供科學發展的新方向，例如在發現希格斯玻子的過程中，歐洲核子研究組織CERN即運用Hadoop分散式檔案系統管理資料，可是除非我們正視及處理海量資料反映人類生活的缺陷，就可能依據錯誤假設做出重大公共政策及企業決定。

為處理此事，資料科學家開始與社會科學家合作，因為後者處理資料的經驗相當豐富，包括評估來源、資料收集方式、使用倫理等，發掘結合海量資料策略與少量資料研究的新方式，不只是需要焦點團體、A/B測試等廣告行銷策略。新混成方式能思考行為背後的成因，而不只是計算事物發生頻率，故除了資訊檢索與機器學習，也需要社會學分析及民族誌學見解。

科技公司很早就明白，社會科學家能協助解釋消費者與產品互動的方式，例如PARC就曾聘請知名人類學家Lucy Suchman，資訊工程、統計、社會科學等領域未來將更密切合作，不僅是為測試彼此研究所得，也要以更嚴謹的態度提出各種問題。

每天各方都收集關於你我的大量資料，包括Facebook點擊習慣、衛星定位資料、醫療處方、Netflix影片觀賞紀錄等，我們必須盡早決定可託付資料的對象及用途。資料永遠不可能中立，也很難匿名，但我們可運用各項專業領域，以察覺種種偏見、落差與假設，進而面對有關隱私及公平性的新挑戰。

-----廣告，請繼續往下閱讀-----

本文原發表於譯者部落格「我書」

-----廣告，請繼續往下閱讀-----

發表意見

文章難易度

剛好

太難

所有討論 0

登入與大家一起討論

活躍星系核

778 篇文章・ 128 位粉絲

活躍星系核（active galactic nucleus, AGN）是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍，在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。本帳號發表來自各方的投稿。附有資料出處的科學好文，都歡迎你來投稿喔。 Email: contact@pansci.asia

TRENDING 熱門討論

即時熱門

文字

數據塑造生活與社會，讓人既放心但又不安？——《 AI 世代與我們的未來》

聯經出版・2022/12/28 ・2760字・閱讀時間約 5 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

數位世界已經改變了我們日常生活的體驗，一個人從早到晚都會接受到大量數據，受益於大量數據，也貢獻大量數據。這些數據龐大的程度，和消化資訊的方式已經太過繁多，人類心智根本無法處理。

與數位科技建立夥伴關係

所以人會本能地或潛意識地倚賴軟體來處理、組織、篩選出必要或有用的資訊，也就是根據用戶過去的偏好或目前的流行，來挑選要瀏覽的新項目、要看的電影、要播放的音樂。自動策劃的體驗很輕鬆容易，又能讓人滿足，人們只會在沒有自動化服務，例如閱讀別人臉書塗鴉牆上的貼文，或是用別人的網飛帳號看電影時，才會注意到這服務的存在。

有人工智慧協助的網路平臺加速整合，並加深了個人與數位科技間的連結。人工智慧經過設計和訓練，能直覺地解決人類的問題、掌握人類的目標，原本只有人類心智才能管理的各種選擇，現在能由網路平臺來引導、詮釋和記錄（儘管效率比較差）。

網路平臺收集資訊和體驗來完成這些任務，任何一個人的大腦在壽命期限內都不可能容納如此大量的資訊和體驗，所以網路平臺能產出看起來非常恰當的答案和建議。例如，採購員不管再怎麼投入工作，在挑選冬季長靴的時候，也不可能從全國成千上萬的類似商品、近期天氣預測、季節因素、回顧過去的搜尋記錄、調查物流模式之後，才決定最佳的採購項目，但人工智慧可以完整評估上述所有因素。

-----廣告，請繼續往下閱讀-----

因此，由人工智慧驅動的網路平臺經常和我們每個人互動，但我們在歷史上從未和其他產品、服務或機器這樣互動過。當我們個人在和人工智慧互動的時候，人工智慧會適應個人用戶的偏好（網際網路瀏覽記錄、搜尋記錄、旅遊史、收入水準、社交連結），開始形成一種隱形的夥伴關係。

個人用戶逐漸依賴這樣的平臺來完成一串功能，但這些功能過去可能由郵政、百貨公司，或是接待禮賓、懺悔自白的人和朋友，或是企業、政府或其他人類一起來完成。

個人、網路平臺和平臺用戶之間的關係，是一種親密關係與遠距聯繫的新穎組合。人工智慧網路平臺審查大量的用戶數據，其中大部分是個人數據（如位置、聯絡資訊、朋友圈、同事圈、金融與健康資訊）；網路會把人工智慧當成嚮導，或讓人工智慧來安排個人化體驗。

人工智慧如此精準、正確，是因為人工智慧有能力可以根據數億段類似的關係，以及上兆次空間（用戶群的地理範圍）與時間（集合了過去的使用）的互動來回顧和反應。網路平臺用戶與人工智慧形成了緊密的互動，並互相學習。

-----廣告，請繼續往下閱讀-----

網路平臺的人工智慧使用邏輯，在很多方面對人類來說都難以理解。例如，運用人工智慧的網路平臺在評估圖片、貼文或搜尋時，人類可能無法明確地理解人工智慧會在特定情境下如何運作。谷歌的工程師知道他們的搜尋功能若有人工智慧，就會有清楚的搜尋結果；若沒有人工智慧，搜尋結果就不會那麼清楚，但工程師沒辦法解釋為什麼某些結果的排序比較高。

要評鑑人工智慧的優劣，看的是結果實用不實用，不是看過程。這代表我們的輕重緩急已經和早期不一樣了，以前每個機械的步驟或思考的過程都會由人類來體驗（想法、對話、管理流程），或讓人類可以暫停、檢查、重複。

人工智慧陪伴現代人的生活

例如，在許多工業化地區，旅行的過程已經不需要「找方向」了。以前這過程需要人力，要先打電話給我們要拜訪的對象，查看紙本地圖，然後常常在加油站或便利商店停下來，確認我們的方向對不對。現在，透過手機應用程式，旅行的過程可以更有效率。

這些應用程式不但可以根據他們「所知」的交通記錄來評估可能的路線與每條路線所花費的時間，還可以考量到當天的交通事故、可能造成延誤的特殊狀況（駕駛過程中的延誤）和其他跡象（其他用戶的搜尋），來避免和別人走同一條路。

-----廣告，請繼續往下閱讀-----

從看地圖到線上導航，這轉變如此方便，很少人會停下來想想這種變化有多大的革命性意義，又會帶來什麼後果。個人用戶、社會與網路平臺和營運商建立了新關係，並信任網路平臺與演算法可以產生準確的結果，獲得了便利，成為數據集的一部分，而這數據集又在持續進化（至少會在大家使用應用程式的時候追蹤個人的位置）。

在某種意義上，使用這種服務的人並不是獨自駕駛，而是系統的一部分。在系統內，人類和機器智慧一起協作，引導一群人透過各自的路線聚集在一起。

持續陪伴型的人工智慧會愈來愈普及，醫療保健、物流、零售、金融、通訊、媒體、運輸和娛樂等產業持續發展，我們的日常生活體驗透過網路平臺一直在變化。

當用戶找人工智慧網路平臺來協助他們完成任務的時候，因為網路平臺可以收集、提煉資訊，所以用戶得到了益處，上個世代完全沒有這種經驗。這種平臺追求新穎模式的規模、力量、功能，讓個人用戶獲得前所未有的便利和能力；同時，這些用戶進入一種前所未有的人機對話中。

-----廣告，請繼續往下閱讀-----

運用人工智慧的網路平臺有能力可以用我們無法清楚理解，甚至無法明確定義或表示的方式來形塑人類的活動，這裡有一個很重要的問題：這種人工智慧的目標功能是什麼？由誰設計？在哪些監管參數範圍裡？

類似問題的答案會繼續塑造未來的生活與未來的社會：誰在操作？誰在定義這些流程的限制？這些人對於社會規範和制度會有什麼影響？有人可以存取人工智慧的感知嗎？有的話，這人是誰？

如果沒有人類可以完全理解或查看數據，或檢視每個步驟，也就是說假設人類的角色只負責設計、監控和設定人工智慧的參數，那麼對人工智慧的限制應該要讓我們放心？還是讓我們不安？還是既放心又不安？

——本文摘自《 AI 世代與我們的未來：人工智慧如何改變生活，甚至是世界？》，2022 年 12 月，聯經出版公司，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 1

登入與大家一起討論

狐禪 2023/12/04

方便好人的也會方便，限制壞人的也會限制好人。AI於此無解，因為它不知好壞。

聯經出版

27 篇文章・ 20 位粉絲

聯經出版公司創立於1974年5月4日，是一個綜合性的出版公司，為聯合報系關係企業之一。三十多年來已經累積了近六千餘種圖書，範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

TRENDING 熱門討論

即時熱門

文字

AI 的 3 種學習形式：不同的目標功能，不同的訓練方式——《 AI 世代與我們的未來》

聯經出版・2022/12/27 ・2368字・閱讀時間約 4 分鐘

相關標籤：

熱門標籤：

-----廣告，請繼續往下閱讀-----

搭配不同的任務，人工智慧的應用方式也不一樣，所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰：不同的目標和功能需要不同的訓練技巧。

不過，結合不同的機器學習法，尤其是應用神經網路，就出現不同的可能性，例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候，機器學習的三種形式：受監督式學習、不受監督式學習和增強式學習，都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說，麻省理工學院的研究人員想要找出有潛力的新抗生素，在資料庫裡放入二千種分子來訓練模型，輸入項目是分子結構，輸出項目是抑菌效果；研究人員把分子結構展示給人工智慧看，每一種結構都標示抗菌力，然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告，請繼續往下閱讀-----

這種技巧稱為受監督式學習，因為人工智慧開發人員利用包含了輸入範例（即分子結構）的資料集，在這裡面，每一筆數據都單獨標示研究人員想要的輸出項目或結果（即抗菌力）。

開發人員已經把受監督式學習的技巧應用於許多處，例如創造人工智慧來辨識影像。為了這項任務，人工智慧先拿已經標示好的圖像來訓練，學著把圖像和標籤，例如把貓的照片和「貓」的標籤，聯想在一起，人工智慧把圖片和標籤的關係編碼之後，就可以正確地辨識新圖片。

因此，當開發人員有一個資料集，其中每個輸入項目都有期望的輸出項目，受監督式學習就能有效地創造出模型，根據新的輸入項目來預測輸出項目。

不過，當開發人員只有大量資料，沒有建立關係的時候，他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化，比過去更容易取得資料，現在企業、政府和研究人員都被淹沒在資料中。

-----廣告，請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群，或詐騙分析師想要在大量交易中找到不一致的資訊，不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時，訓練資料只有輸入項目，然後工程師會要求學習演算法根據相似性來設定權重，將資料分類。舉例來說，像網飛（Netflix）這樣的影音串流服務，就是利用演算法來找出哪些觀眾群有類似的觀影習慣，才好向他們推薦更多節目；但要優化、微調這樣的演算法會很複雜：因為多數人有好幾種興趣，會同時出現在很多組別裡。

經過不受監督式學習法訓練的人工智慧，可以找出人類或許會錯過的模式，因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」，所以可以產生讓人驚豔的創新見解，這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧，都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法，人工智慧都是運用資料來執行任務，以發現新趨勢、識別影像或做出預測。在資料分析之外，研究人員想要訓練人工智慧在多變的環境裡操作，第三種機器學習法就誕生了。

-----廣告，請繼續往下閱讀-----

增強式學習：需要理想的模擬情境與回饋機制

若用增強式學習，人工智慧就不是被動地識別資料間的關聯，而是在受控的環境裡具備「能動性」，觀察並記錄自己的行動會有什麼反應；通常這都是模擬的過程，把複雜的真實世界給簡化了，在生產線上準確地模擬機器人比較容易，在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡，如西洋棋比賽，每一步都還是會引發一連串不同的機會與風險。因此，引導人工智慧在人造環境裡訓練自己，還不足以產生最佳表現，這訓練過程還需要回饋。

提供反饋和獎勵，可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色：人工智慧因為在數位處理器上運作，所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次，人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化，謹慎精確地說明這些功能要如何操作，以及這些功能的本質是要模擬現實。理想情況下，模擬器會提供擬真的環境，回饋功能則會讓人工智慧做出有效的決定。

-----廣告，請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴：對戰。阿爾法元為了評估自己的表現，運用獎勵功能，根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境（儘管在訓練過程中不直接提供回饋）：人類要定義模擬情境和回饋功能，人工智慧會在這基礎上自我訓練。為產生有意義的結果，謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來：人工智慧如何改變生活，甚至是世界？》，2022 年 12 月，聯經出版公司，未經同意請勿轉載。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 0

登入與大家一起討論

聯經出版

27 篇文章・ 20 位粉絲

TRENDING 熱門討論

即時熱門

文字

花粉揭秘：黑死病災情，歐洲各地很不一樣

寒波・2022/02/21 ・4340字・閱讀時間約 9 分鐘

相關標籤：

熱門標籤：

14 世紀中葉，歐洲各地陸續爆發鼠疫。瘟疫在當時的歐洲並不稀罕，可是這回實在嚴重，大量人口慘遭消滅，後世稱之為「黑死病」。疫情主要發生在公元 1347 到 1352 年，有些學者估計令歐洲在短期內減少 30 到 50% 人口，或許高達 5000 萬人之多。

一項新上市的研究根據花粉分析，卻得到結論：黑死病對歐洲各地的影響差異不小，有些區域確實大受打擊，但是有些地區輕微得多。我們該怎麼解讀這些研究呢？

瘟疫殺死歐洲一半人！真的嗎？

黑死病的病原體是鼠疫桿菌（Yersinia pestis），可藉由老鼠和跳蚤輔助傳播。近年來由遺骸取得古代 DNA 的研究大行其道，令我們得知超過五千年前，便有人感染鼠疫桿菌。鼠疫桿菌能搭乘跳蚤便車，關鍵在於 ymt（Yersinia murine toxin）基因，晚於四千年前的鼠疫桿菌皆已經具備。

延伸閱讀：拉脫維亞5000年前，最古早的鼠疫桿菌，源自動物傳染？

歷史上三次大爆發：6世紀的查士丁尼瘟疫，14 世紀的黑死病，以及 19 世紀末的全球流行，人們面對的都是傳染力升級的細菌版本；除此之外，還有多次規模較小的流行。遺傳變化有限的病原體，在不同時空的疫情差異很大。

-----廣告，請繼續往下閱讀-----

歷次鼠疫桿菌導致的疫情中，黑死病的衝擊最大，有些研究甚至認為它消滅當時歐洲 50% 人口。這類死亡率的評估，主要來自歷史資料，如文書、稅務等紀錄；然而，這類資訊來源未必準確，有時文字會誇大不實，和實際數字有所差異。

還有一點侷限在，歷史資料主要紀錄人口聚居的城鎮，可是黑死病那個時候，歐洲超過 75% 人住在城市之外。人擠人的城市碰上鼠疫這類傳染病，通常受害較大，所以根據城市評估而得的結果，也許會高估瘟疫的危害。

另一方面，不同地區的受災程度很可能不同，就像正在進行的 COVID-19（武漢肺炎、新冠肺炎）疫情，遺傳上相同的病毒重擊秘魯，對澳洲的傷害卻相對有限。而黑死病也是如此，既有資料已經足以看出，相比於義大利深受打擊，波蘭更加輕微。幾處地區的狀況，不能擴大代表整個歐洲。

概念：在黑死病死亡率低的地區，農耕不太受到影響；死亡率高的地區則影響較大，產業轉為畜牧，甚至是恢復野生狀態；這些植物變化會反映在沉積物中的花粉。圖／參考資料 3

花粉大數據

要評估黑死病這類歷史大事件的影響，沒有一種理想辦法，一定要從不同方面尋找證據切入、互補，而環境變化可以作為切入點。突然爆發的疾病，導致大量人口死亡之後，也將造成經濟與社會的動盪，可想而知，自然環境也會受到牽連。

新發表的研究選擇以花粉作為指標，探討黑死病的影響，還創造一個看似 fancy 的新名詞描述：「大數據古生態學（big data palaeoecology，簡稱 BDP）」，反正大數據就是那樣。

概念是，受到黑死病負面影響愈嚴重的地區，人類活動會減少愈多，可以由花粉變化看出。具體樣本來自歐洲各地 261 處遺址，一共 1634 個沉積層樣本；年代介於公元 1250 到 1450 年，大致涵蓋黑死病發生之前到之後的各一百年，也就是前後約 4 代人。短時間內大量人口死亡，影響可能延續數代。

-----廣告，請繼續往下閱讀-----

不同植物會生成不同花粉，有些花粉落到湖泊等環境，變成湖底的沉積物，有機會保存下來，成為歷史切片的見證。而人類活動影響環境，使得植物生態有別，便會留下不同的花粉組合。
例如農耕發達的地區，會留下大量農作物的花粉，畜牧業普及區則會是另一種風貌；若是人口減少令農牧活動降低，野生植物的花粉便會增加，不同階段又會生長不同野生植物。

地段，地段，地段！

新的分析思維看似很有道理，但是能相信嗎？研究者首先分析資訊最豐富的兩處地點：瑞典、波蘭。許多證據表示黑死病過去後，瑞典慘遭打擊，波蘭反而明顯成長；倘若花粉呈現的狀況一致，便說明這套分析是可靠的。結果花粉分析順利通過考驗。

花粉分析擴大到歐洲全境，最肯定的結論是：各地差異不小。黑死病前後，一些地區差異有限，有些甚至逆風高飛；農牧活動減少最多的地區位於斯堪地那維亞（北歐）、法國、德國西部、希臘、義大利中部。

有個假設是：瘟疫使人口減少以後，產業可能由勞力密集的農耕，轉向較不需要人力的畜牧。但是這回研究指出，所有農耕下降的地區，畜牧也跟著減少；唯一例外是德國西南部，畜牧反而增長。

考察文獻得知，義大利、法國深受黑死病危害，這也反映在當地的花粉中，證實歷史紀錄的準確。農業開墾往往是森林的敵人，黑死病過後，義大利的森林甚至重新蓬勃復育；慘烈至此，難怪有薄伽丘《十日談》的誕生。

然而不少地區的農牧活動，黑死病前後的差異有限，或是顯著成長，像是伊比利、愛爾蘭，以及中歐、東歐多數地點。這些分析指出黑死病對歐洲各地的影響有別，整體死亡率大概沒有 50% 那麼誇張。

其實還是不清楚黑死病的死亡率

該如何看待上述論點呢？花粉分析有優點，也有缺點。一如文字、稅務等切入方向，花粉也有自己方法學上的侷限。它能告訴我們歐洲各地的死亡率不均值，卻無法真正評估死亡率高低。

-----廣告，請繼續往下閱讀-----

根據花粉組成在不同年代的相對變化，可以推論當地農牧活動的改變，卻不直接等同於人口的死亡程度。

一個地區在黑死病後一段時間，農牧活動明顯增長，不見得意謂瘟疫時沒有死很多人，也可能是恢復速度很快，或是還有黑死病以外的其他因素。

也要注意這兒的評估是相對的，某地相對的受災比較輕微，不等於災情不嚴重。一個地區在幾十年的時段內，如果損失 30% 人口當然是大災難，但是就算死亡「只有」5%，也不可能馬照跑，舞照跳。

歐洲各地在黑死病前後的變化統整，偏紅色為衰退，偏綠色為成長。圖中名號是當時的政權疆域。圖／參考資料 3

評估大瘟疫更廣泛的社會影響

儘管無法準確判斷死亡率，花粉能評估傳染病對社會更廣泛的影響。黑死病這類大瘟疫，不是只有鼠疫桿菌殺死多少人而已，還會牽連更廣泛的社會運作，累積間接傷害。

延伸閱讀：歷史大瘟疫：黑死病重塑社會貧富

即使是一個較小的地理範圍，受災程度也可能有內部差異，如城鎮中心及其周圍的郊區、鄉村。沉積物中的花粉，是一個地區一段時間內的集合紀錄，似乎較能避免城鄉差距的影響。

有學者認為，黑死病過後一個地區之所以沒有衰退，也可能是外地人口填補所致，故質疑新研究的論點。就算真是如此，新遷入的人口也是來自歐洲其他地方，同樣支持新論點的大方向：歐洲各地受災程度有異，並非每處一樣嚴重。何況過往公認疫情嚴重的地區，新分析中也看得出來。

-----廣告，請繼續往下閱讀-----

有趣的是，一項 2019 年發表的研究在檢視多重證據後，也認為查士丁尼瘟疫的災情言過其實，不如過往認知的那麼嚴重。提醒各位千萬不能忽略「沒有那麼嚴重，跟不嚴重是兩回事」。

花粉無法回答的問題是：黑死病為什麼在各地影響有別？有人推測是鼠疫桿菌的品系不同，在西歐的殺傷力較強，東歐較弱。但是此一論點缺乏遺傳學、病理學的證據。

2019 年底至今的全球瘟疫清楚告訴我們，遺傳上一模一樣的品系，在不同國家的傳播與傷害天差地別，涉及許多複雜的因素。黑死病比當下冠狀病毒造成的疫情嚴重很多，基本道理大概還是一樣的。

參考資料

Susat, J., Lübke, H., Immel, A., Brinker, U., Macāne, A., Meadows, J., … & Krause-Kyora, B. (2021). A 5,000-year-old hunter-gatherer already plagued by Yersinia pestis. Cell Reports, 35(13), 109278.
Spyrou, M. A., Tukhbatova, R. I., Wang, C. C., Valtueña, A. A., Lankapalli, A. K., Kondrashin, V. V., … & Krause, J. (2018). Analysis of 3800-year-old Yersinia pestis genomes suggests Bronze Age origin for bubonic plague. Nature Communications, 9(1), 1-10.
Izdebski, A., Guzowski, P., Poniat, R., Masci, L., Palli, J., Vignola, C., … & Masi, A. (2022). Palaeoecological data indicates land-use changes across Europe linked to spatial heterogeneity in mortality during the Black Death pandemic. Nature Ecology & Evolution, 1-10.
Black death mortality not as widespread as believed
Did the ‘Black Death’ Really Kill Half of Europe? New Research Says No
Mordechai, L., Eisenberg, M., Newfield, T. P., Izdebski, A., Kay, J. E., & Poinar, H. (2019). The Justinianic Plague: an inconsequential pandemic?. Proceedings of the National Academy of Sciences, 116(51), 25546-25554.

本文亦刊載於作者部落格《盲眼的尼安德塔石匠》暨其 facebook 同名專頁。

-----廣告，請繼續往下閱讀-----

發表意見

所有討論 1

登入與大家一起討論

fierycloud 2022/02/21

英國鉛礦小鎮不移動避免疫情擴散到英國中北部的文章之後，就突然覺得，會有甚麼農牧產業以外的狀況嗎? 比如說礦產發現或衰竭之類的?

寒波

193 篇文章・ 1090 位粉絲

生命科學碩士、文學與電影愛好者、戳樂黨員，主要興趣為演化，希望把好東西介紹給大家。部落格《盲眼的尼安德塔石器匠》、同名粉絲團《盲眼的尼安德塔石器匠》。

TRENDING 熱門討論

即時熱門

海量資料萬歲？請三思！

「只要資料足夠，數字自會說話。」

「海量資料可提高城市智慧及效能。」

「海量資料對各個社會族群一視同仁。」

「海量資料屬匿名，不會侵犯隱私。」

「海量資料是科學的未來。」

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

與數位科技建立夥伴關係

人工智慧陪伴現代人的生活

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

機器的 3 種學習形式

增強式學習：需要理想的模擬情境與回饋機制

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

瘟疫殺死歐洲一半人！真的嗎？

花粉大數據

地段，地段，地段！

其實還是不清楚黑死病的死亡率

評估大瘟疫更廣泛的社會影響

延伸閱讀

參考資料

發表意見 <img width="24" height="24" class="icon_arrow ml-2" src="https://pansci.asia/wp-content/themes/pansci-bootstrap-child/src/imgs/chevron-down.svg">

發表意見

發表意見

發表意見

發表意見