0

1
1

文字

分享

0
1
1

下棋之外也能看病?淺析台灣人工智慧醫療之發展

Research Portal(科技政策觀點)_96
・2019/07/24 ・4071字 ・閱讀時間約 8 分鐘 ・SR值 589 ・九年級

國小高年級科普文,素養閱讀就從今天就開始!!

文/呂宜瑾

從探索、深度學習到圍棋奪勝,人工智慧的歷史與發展

圖/deviantart @agsandrew

「人工智慧」(Artificial Intelligence,簡稱AI),顧名思義是由人類所製造出來的機器(電腦),透過反覆的訓練與學習所展現的智慧。AI內含了「機器學習」、「深度學習」與「自然語言」等概念,且依據電腦能處理與判斷的能力不同,產生不同的分級。

AI發展的歷史,從第一台電腦出現迄今已過半世紀,期間經歷了三波熱潮,前兩次熱潮因受限於當時的技術發展而退燒(曲建仲,2018;盧傑瑞,2018)。

(一)第一波熱潮(1950~1960年):探索與推論的時代

1946 年,全世界第一台電腦Enica誕生,之後的 10 年,在 1956 年達特茅斯研習會(Dartmouth Workshop)中首度出現「人工智慧」 (Artificial Intelligence,簡稱 AI)的專有名詞。

(二) 第二波熱潮(1980~1990年):知識的時代

專家系統:自 1980 年開始,將大量的專家知識輸入電腦中,再由電腦依據使用者的問題來判斷答案,後續應用在疾病的初步診斷。

(三) 第三波熱潮(2000年~現在):深度學習的時代

自 2000 年起,半導體技術的進步,提升了電腦運算的能力;半導體的成本下降,讓雲端儲存的使用變得便宜。而透過雲端伺服器蒐集而來的大數據(Big Data),則成為了 AI 發展最重要的資源。

圍棋是目前最複雜的棋,本文作者估計可能的盤面狀況約有10170種。圖/wikipedia。
圍棋是目前最複雜的棋,粗估可能的盤面狀況約有10^170種。圖/wikipedia

2016年,Google 開發的人工智慧 AlphaGo,打敗南韓棋王李世乭後,讓 AI 的發展再次受到重視。2018 年,美國國際研究暨顧問公司 Gartner「十大技術趨勢」報告中指出,AI技術是近年科技發展的重要目標,並預估 2018 年 AI 相關產業年產值達 1.2 兆美元,相較前一年成長 70%,2022 年相關產值則達  3.9 兆美元(Kasey Panetta, 2017;Gartner, 2018)。

而最新一期 2019「十大技術趨勢」報告中,除了原有 AI 技術外,其餘 AI 衍生或是相關技術也名列其中,可能在未來 5 年內快速成長,對於人類生活、產業發展、科學技術更有機會帶來顛覆性的影響(Gartner, 2019)。

進入「深度學習」時代的 AI 醫療應用

圖/fshoq

依據美國市調機構 CB Insights 的調研結果,從投資趨勢來看,自 2013 年起,美國 AI 醫療新創投資件數共 576 件,募資金額超過 43 億美元,位居 AI 新創相關產業募資首位,而 AI 醫療募資之案件數,也於 2018 年第二季達新高峰,AI 醫療受矚目的程度,可見一斑(Kyle Wiggers, 2018)。

AI 醫療的應用,進入「深度學習」的時代,除了將大量生理資訊輸入電腦,透過拋轉、整合、計算與紀錄,作為醫護團隊預測參考依據外,目前較主流的應用仍為醫學影像辨識。以台灣為例,國人每年平均看診次數約為 15 次,所累積的處方簽高達 3 億 6 千萬張;每年約有 200 萬人次使用電腦斷層與核磁共振等影像檢查,以肺部電腦斷層掃瞄為例,每進行一次電腦斷層掃瞄便可產生 500 張影像,一位有經驗的醫師進行初步篩選至少就要花 20 分鐘。

醫療技術的進步,讓診斷更為細緻,疾病的分類則變得更為複雜。傳統影像辨識,靠的是醫師肉眼的判斷與經驗,一旦醫療數據增多、辨識時間拉長,長時間的工作帶來的疲乏,加上疾病的高複雜度,使醫師犯錯的機率提高(王若樸-c, ,2019; 基因線上,2018)。

醫療影像辨識的發展,可追溯到 2012 年,由 Google 所建立的 ImageNet,一個開放使用的圖像辨識測試數據庫,參賽者將深度學習應用到ImageNet,使圖樣辨識準確度高達 85%,在當年電腦視覺比賽中奪冠,確認了深度學習在影像辨識的可行性。2016 年,Google 旗下的科研機構,發表了第一篇由機器深度學習進而提早發現糖尿病視網膜病變的論文,透過糖尿病患視網膜的影像辨識,早期偵測病變預防失明,技術研發成果後續將佈署於印度等眼科醫師缺乏的國家。

圖/pixabay

台灣實施全民健康保險迄今已 24 年,病歷電子化也即將邁入第 10 年,巨量的醫療數據累積,成為台灣發展 AI 醫療的利基。分析醫療數據的組成,除了基本的生理資訊外,絕大部分就是各類的影像資料,包含:X光片、超音波、核磁共振、電腦斷層、病理切片等。影像辨識技術的發展,除了要足夠的影像資料來「訓練」電腦,從數據獲取→分析→建立模組,最後才能回答問題或是預測未來。

過程中要如何讓電腦得到經驗,「理解」資料的特徵,達成「特徵表達學習」靠的就是專家知識的輸入,透過一群醫師針對影像進行標記,建置模組後再用影像試驗,並進行校正,影像標記是建立模組原型最重要的基礎,也會影響影像預測的準確性。目前AI醫療影像辨識的應用,也已逐漸在台灣發展,相關案例如下(王若樸-a,2019):

  1.  乳房超音波 AI 輔助分類系統:早期發現,腫瘤辨識度達 9 成,但良性、惡性的辨識度約 7 成。
  2. AI 骨齡輔助判讀系統:準確度可達 9 成 5。
  3.  DeepMets:人工智慧腦瘤自動判讀系統,30 秒就能圈出病灶,還能自動計算腫瘤體積。

當然,開發中的醫療影像辨識技術遠比上述的例子多更多。2017 年科技部為了推動國人醫療影像在地化,建置 AI 醫療影像資料庫,提出「醫療影像專案計畫」。次年(2018)年底,台灣首座「AI 醫療影像」資料庫上線,15 類疾病,共 4.6 萬筆影像,目前已有 1/3 完成疾病辨識,資料庫影像開放供很多團隊一同開發演算法,目前有台大、北榮及北醫等團隊參與(吳元熙,2018)。

AI醫療不止步於影像辨識,還需發展文字語意辨識與分子生物檢測

圖/pixabay

醫學影像的辨識難度,會與最終影像的辨識準確度有關,除了需處理的影像數量多外,以肺部為例,其影像有很多血管紋,血管橫切面與肺結節十分相像,增加辨識難度。另外,以開發數位病理AI聞名的雲象科技為例,顯微鏡底下的病理切片影像,又是另外一個層次的首先面臨到的困難,就是病理切片影像傳換為數位影像,解析度非常高,超出電腦的運作能力,必須裁切成小區塊來訓練,以建立模組。初步完成鼻咽癌 AI 模組,自動標示癌症的高風險區,準確度達 97%。全新挑戰則是全球幾乎沒有人在做的數位病理 AI-血癌偵測模組,需辨識近 40 種不同種類或成熟度的骨髓細胞(王若樸-b,2019)。

然而,AI 醫療的應用,不僅止於醫療影像辨識,目前正在發展的還包含文字與語意辨識、分子生物檢測等。以文字與語意辨識為例:全球首建肺癌病灶語意描述資料庫,過去的診療經驗,最關鍵的往往是問診的語句,其中夾帶足以判斷疾病的關鍵,卻無法單純從影像或是病歷中察覺。因此,除了既有的影像病灶標記外,北醫附醫的研究團隊更嘗試加入病灶語意描述,希望藉由AI的協助,讓醫師早一步發現肺癌。

以分子生物檢測為例,藉由目前生物技術的發展,病人基因檢測或蛋白質體學檢測等變得相對容易,依據過去疾病的文獻研究,某些疾病的發生或是疾病發展的進程,可能與基因突變(或遺傳)或基因表現異常有關,如果能藉由病理數據、影像與基因變異之間,建立相關性的分析模組,希望進一步能達成降低早期風險或疾病的發生,或是預測病人預後狀況等。

華生以相當精密的問答系統作為基礎模板。圖/wikipedia

AI 醫療的應用,可以藉由深度學習來增加準確度,而電腦學習的模式,必須由專家知識的輸入(給予框架或答案)來決定模組的原型,目前醫事人力的短缺,是阻礙AI醫療發展的原因之一。另外,AI 於醫療之應用與其他產業的差別在於,醫療往往沒有標準答案,還有太多的例外,以及一些「只能意會、無法言傳」的醫師經驗累積,這些都會影響電腦的訓練結果,以及最終診斷的準確度與一致性。

醫療領域最知名的 AI 應用,就不能不提 IBM 的超級電腦-華生(Waston),主要以自然語言訓練,從2011年發展至今,華生的腫瘤系統已在全球超過 230 家醫院使用,而近年華生醫生的發展聲勢卻持續下跌,原因出在:

  1. 華生雖透過大量文獻資料、診斷紀錄等訓練,但效果仍與醫師診斷有著很大的差距,例如:對於醫療方法的選擇,無法提出具體而合理的解釋,更可能因為無法通盤考量病患條件,而做出不適切之診斷,顯見其電腦學習資料量不足;
  2. 另因應疾病與醫療的變化,須輸入新資料供系統學習,而新舊資料整合不易且所費不貲,這些臨床應用的瓶頸,終將讓華生輪為第二、第三線的醫療諮詢系統,或是為節省成本而捨棄不用,這些都必須在AI醫療的發展與應用上,引以為鑑(陳苓,2017)。
  3. 最後一點,卻也是最重要的,便是相關法規及配套措施,包含技術開發與資料管理規範,建議相關部會積極主動研議,並透過跨部會合作,提出具體規範,才能讓台灣的 AI 醫療發展得更為順利(王郁倫,2019)。

參考文獻

文章難易度
Research Portal(科技政策觀點)_96
10 篇文章 ・ 4 位粉絲
Research Portal(科技政策觀點)為科技政策研究與資訊中心(STPI)以重要議題導向分析全球科技政策與科技發展趨勢,呈現研究觀點與產出精華。

0

5
1

文字

分享

0
5
1
從「自動化」進化成「智動化」——智慧製造是半導體產業的未來趨勢
鳥苷三磷酸 (PanSci Promo)_96
・2022/08/15 ・3611字 ・閱讀時間約 7 分鐘

  • 文/曾繁安

台灣擁有傲視全球、成熟完整的半導體產業聚落,在世界科技領域中扮演舉足輕重的角色。這個國家的經濟命脈,經過全自動化的時代後,即將迎來另一次生產技術的大變革——智慧製造。

當訂單越來越多,人力卻不夠,半導體業者該怎麽辦?

半導體產業包含了矽晶圓[註]、相關化學品與氣體及導線架等封裝材料,其中又以晶圓厰為大宗,例如台積電便是全球規模最大的晶圓代工厰。素有「現代科技應用的大腦與心臟」之稱的半導體,是現代多數電子產品的核心單元,因為各項產品正是利用半導體電導率變化的特性來處理資訊。然而,目前半導體製造業卻面臨人力資源跟不上產量需求提高的挑戰。

晶圓是積體電路製程中的載體基片。圖/wikimedia

一般半導體廠場域面積大,人力短缺使企業面臨管理人手吃緊,再加上人員進出無塵室的過程繁瑣耗時,也是另一大負擔。與此同時,在廠內儀器參數比對和規劃生產計劃上,傳統人力也可能有出現誤差的風險。疫情時代也促成在宅經濟和 5G 應用的高速發展,各領域對晶片的需求大增,造成半導體產業出現產量需求高,但人力短缺的現象。

因此對不少業者而言,可有效緩解人力不足、大幅提升作業效率的數位轉型(Digital Transformation),可謂勢在必行。

從「自動化」升級到「智動化」的智慧製造

那半導體產業的數位轉型,該怎麽做?所謂數位轉型,不僅僅只是將資料或作業數位化,還包括導入人工智慧(Artificial Intelligence,簡稱 AI)與數位科技,來改變企業的整個營運生產模式。AI 指的是電腦程式可模擬人類思維過程的能力,而在 AI 概念下的機器學習(Machine Learning,簡稱 ML),即為機器可以根據已收集的大量數據,經由建立模型對新數據進行推測,學習找出最佳解、改善效能

結合 ML 的製造執行系統,需搭配裝置在工廠各處的多個傳感器(Sensor),來收集與回傳各樣的生產數據。它們與工廠設備的相互連接,即是運用了物聯網(Internet of Things)的技術。有賴於 5G 科技的發展,數據可以達成高速率傳輸與低延遲,使得機器與機器之間可以達成溝通,在整合分析各方數據資訊後,有效率地完成各種指令操作,可以比自動化製造系統,更進一步為人類代勞工廠運作的大小事務。

舉例來説,當工廠的生產過程出現問題,自動化系統只會跳出異常通知,還是需要仰賴人員來進行手動排除;但換作應用 ML 系統的話,便可透過自我學習,來自動調整製作流程以解除異常狀況,無需人力介入便可自主解決,提升良率,達成「智動化」智慧製造(Smart Manufacturing)的最終目的。

機器可以根據已收集的大量數據,經由建立模型對新數據進行推測,學習找出最佳解、改善效能。 圖/elements

懂得精益求精、提高品質產量的智慧工廠

一座運用智慧製造的半導體工厰,不但能自主克服製程中的疑難雜症,更能幫助提高晶圓的產量品質。在研發方面,AI 可以協助理解高複雜、高維度的製程開發挑戰,也可與 ML 軟體分析感測資料和檢測影響,進行品質管理與缺陷檢查。

此外,數據治理和數位分身,也是智慧製造的關鍵策略。對企業整體的數據進行管理和控制以提高數據的價值將因為數據產生的成本風險降到最低,是數據治理(Data Governance)的核心精神。

在兼顧資訊安全下,數據治理的體系能使跨部門間的數據共享更為方便暢通。輔以 AI 及 ML 的運算,便可以使業務部門的客戶需求、供應鏈管理等資料,與工廠生產部門的設備控制與品管等流程,有更迅速緊密的配合,規劃好合適的未來生產計劃,指導人員進行相關作業。

如同我們可以在電玩游戲或社交媒體上,按照自己的個人形象,來打造自己的虛擬化身,工厰也能藉助現今的科技,來為產品的物理實體,在資訊化平臺或系統的虛擬空間中,打造一個類比實物數位分身(Digital Twin)

數位分身模型之概念圖。圖/wikimedia

數位分身也是物聯網的應用之一,半導體廠中,由傳感器所收集到的晶圓製造數據,在 AI、ML 和軟體分析的協助下被整合,對映成數位空間中「雙胞胎」的存在。這位孿生兄弟不僅能夠隨物理實體的變化而即時做出相應變化,還可以提供無法在實體產品上測試計算的數據。

理想情況下,數位分身可以經由機器學習,分析過去的歷史資料或多重來源的數據,來推估實體的未來情境。因此在危機或異常事件發生前,業者便可預先進行預測性的設備維護與產品的良率分析,比起傳統人力的判斷更加精確,降低技術風險,大大提高生產效率。

工業 4.0 浪潮來襲,智慧製造是產業未來趨勢

運用通訊科技、資料庫和電腦系統達成全自動化生產,已不是新鮮事,如今人類社會正迎來第四次工業革命的新一波浪潮。主打網絡與機械相互連接的核心精神,導入人工智慧、機器學習、物聯網感測與大數據分析等人機協作的智慧製造,是因應多變市場需求的時下趨勢。

在半導體領域中,企業龍頭台積電可説是數位轉型的成功案例,從二十年前的全自動化製造系統,如今致力於打造組織內部友善 AI 的工作環境,努力向智慧製造全面轉型。數位轉型的技術支援不能沒有半導體產業製造的晶片,而如今數位轉型也有望帶領半導體產業突破產能吃緊、人才短缺的困境,走向智慧製造的新紀元。

以台灣在地企業的智慧製造覆蓋率而言,就已在短短 6 年內成長 50%。舉全台最大的國際半導體展 SEMICON Taiwan 為例,智慧製造相關的展商在近六年內的成長幅度也同樣攀升了 50%。

今年高科技智慧製造特展將以歷年最大規模之姿登場,與全台最大半導體盛宴 SEMICON Taiwan 2022 國際半導體展同期同地舉辦,匯集橫跨高科技製造業智慧製造解決方案業者、系統整合、軟硬體商及智慧製造需求端業者,如盟立自動化、倍福自動化、家登精密、攝揚企業、日商 JEL 等不容錯過。

今年高科技智慧製造特展將以歷年最大規模之姿登場,與全台最大半導體盛宴 SEMICON Taiwan 2022 國際半導體展同期同地舉辦。圖/SEMI

因應疫情下數位轉型成為全球企業的重要任務,今屆展覽中的「高科技智慧製造論壇」將由美光科技、 Lam Research、 Rockwell Automation、Siemens 等知名企業專家以人工智慧工廠為主軸,探討 GEC 技術藍圖,內容包含五個部分包含數據管理、智能分析、數位分身預測等重點實務經驗分享,從晶圓厰到設備製造商和解決方案提供者的角度,讓參與者得以探究 AI 智能工廠的前景和挑戰,跟上數位轉型的步伐。

除了智慧製造議題,展覽期間共有超過 20 場重磅級的國際趨勢論壇,豐富主題涵蓋先進製程、異質整合、化合物半導體、車用晶片、永續製造、半導體資安及人才。論壇將在今年 9 月 13 日率先開幕,展覽則於 9 月 14 日至 16 日於臺北南港展覽館一館盛大開場,規模創歷年新高,届時將有 700 間國內外指標性大廠共襄盛舉,現場將有 2,450 個攤位展出,完整串聯全球半導體供應鏈,目前展會參觀與論壇皆已開放報名,參與席次有限,有興趣者趕快手刀至官網報名起來!

註:晶圓(Wafer)是半導體晶體圓形的簡稱,是從半導體材料如最常見的矽,經過拉製、提煉等一系列處理過程,製成的圓柱狀半導體晶體經過切片、抛光而來。這些圓形薄切片被用於積體電路製程中的載體基片,也可用來製作太陽能電池。

參考資料

  1. 半導體是什麼?晶片產業一次看懂
  2. About SEMI Smart Manufacturing initiative
  3. 【獨家披露】台積電數位轉型的下一步,靠AI推動全面轉型(上
  4. 【獨家披露】台積電數位轉型的下一步,靠AI推動全面轉型(下)
  5. 泛科學:每分鐘 15 次的駭客攻擊,5G 世代的臺灣資安挑戰——資安所王仁甫策略總監專訪
  6. Data Governance – 臺灣人工智慧行動網
  7. 「數據治理」:人工智慧企業的基本功
  8. 科技大觀園:從全自動化製造邁向智慧製造
  9. 聯剛科技股份有限公司
  10. 【新興領域:9月焦點8】數位分身(Digital Twin)技術發展趨勢與不同層次應用模式
  11. 半導體資安的新挑戰!後疫情時代,如何全面打造半導體供應鏈數位韌性
  12. 工業4.0大全,從淺到深一篇搞懂它!
鳥苷三磷酸 (PanSci Promo)_96
147 篇文章 ・ 268 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

1

3
3

文字

分享

1
3
3
AI 是理科「主場」? AI 也可以成為文科人的助力!
研之有物│中央研究院_96
・2022/08/13 ・5646字 ・閱讀時間約 11 分鐘

國小高年級科普文,素養閱讀就從今天就開始!!

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/田偲妤
  • 美術設計/蔡宛潔

AI 的誕生,文理缺一不可

人工智慧(Artificial Intelligence,簡稱 AI)在 21 世紀的今日已大量運用在生活當中,近期掀起熱議的聊天機器人 LaMDA、特斯拉自駕系統、AI 算圖生成藝術品等,都是 AI 技術的應用。多數 AI 的研發秉持改善人類生活的人文思維,除了仰賴工程師的先進技術,更需要人文社會領域人才的加入。

中央研究院「研之有物」專訪院內人文社會科學研究中心蔡宗翰研究員,帶大家釐清什麼是 AI?文科人與工程師合作時,需具備什麼基本 AI 知識?AI 如何應用在人文社會領域的工作當中?

中央研究院人文社會科學研究中心蔡宗翰研究員。圖/研之有物

詩詞大對決:人與 AI 誰獲勝?

一場緊張刺激的詩詞對決在線上展開!人類代表是有「AI 界李白」稱號的蔡宗翰研究員,AI 代表則是能秒速成詩的北京清華九歌寫詩機器人,兩位以「人工智慧」、「類神經」為命題創作七言絕句,猜猜看以下兩首詩各是誰的創作?你比較喜歡哪一首詩呢?

猜猜哪首詩是 AI 做的?哪首詩是人類做的?圖/研之有物

答案揭曉!A 詩是蔡宗翰研究員的創作,B 詩是寫詩機器人的創作。細細賞讀可發覺,A 詩的內容充滿巧思,為了符合格律,將「類神經」改成「類審經」;詩中的「福落天赦」是「天赦福落」的倒裝,多念幾次會發現,原來是 Google 開發的機器學習開源軟體庫「Tensor Flow」的音譯;而「拍拓曲」則是 Facebook 開發的機器學習庫「Pytorch」的音譯,整首詩創意十足,充滿令人會心一笑的魅力!

相較之下,B 詩雖然有將「人工」兩字穿插引用在詩中,但整體內容並沒有呼應命題,只是在詩的既有框架內排列字句。這場人機詩詞對決明顯由人類獲勝!

由此可見,當前的 AI 缺乏創作所需的感受力與想像力,無法做出超越預先設定的創意行為。然而,在不久的將來,AI 是否會逐漸產生情感,演變成電影《A.I. 人工智慧》中渴望人類關愛的機器人?

AI 其實沒有想像中聰明?

近期有一則新聞「AI 有情感像 8 歲孩童?Google 工程師爆驚人對話遭停職」,讓 AI 是否已發展出「自我意識」再度成為眾人議論的焦點。蔡宗翰研究員表示:「當前的 AI 還是要看過資料、或是看過怎麼判讀資料,經過對應問題與答案的訓練才能夠運作。換而言之,AI 無法超越程式,做它沒看過的事情,更無法替人類主宰一切!

會產生 AI 可能發展出情感、甚至主宰人類命運的傳言,多半是因為我們對 AI 的訓練流程認識不足,也缺乏實際使用 AI 工具的經驗,因而對其懷抱戒慎恐懼的心態。這種狀況特別容易發生在文科人身上,更延伸到文科人與理科人的合作溝通上,因不了解彼此領域而產生誤會與衝突。如果文科人可以對 AI 的研發與應用有基本認識,不僅能讓跨領域的合作更加順利,還能在工作中應用 AI 解決許多棘手問題。

「職場上常遇到的狀況是,由於文科人不了解 AI 的訓練流程,因此對 AI 產生錯誤的期待,認為辛苦標注的上千筆資料,應該下個月就能看到成果,結果還是錯誤百出,準確率卡在 60、70% 而已。如果工程師又不肯解釋清楚,兩方就會陷入僵局,導致合作無疾而終。」蔡宗翰研究員分享多年的觀察與建議:

如果文科人了解基本的 AI 訓練流程,並在每個訓練階段協助分析:錯誤偏向哪些面向?AI 是否看過這方面資料?文科人就可以補充缺少的資料,讓 AI 再進行更完善的訓練。

史上最認真的學生:AI

認識 AI 的第一步,我們先從分辨什麼是 AI 做起。現在的數位工具五花八門,究竟什麼才是 AI 的應用?真正的 AI 有什麼樣的特徵?

基本上,有「預測」功能的才是 AI,你無法得知每次 AI 會做出什麼判斷。如果只是整合資料後視覺化呈現,而且人類手工操作就辦得到,那就不是 AI。

數位化到 AI 自動化作業的進程與舉例。圖/研之有物

蔡宗翰研究員以今日常見的語音辨識系統為例,大家可以試著對 Siri、Line 或 Google 上的語音辨識系統講一句話,你會發現自己無法事先知曉將產生什麼文字或回應,結果可能正是你想要的、也可能牛頭不對馬嘴。此現象點出 AI 與一般數位工具最明顯的不同:AI 無法百分之百正確!

因此,AI 的運作需建立在不斷訓練、測試與調整的基礎上,盡量維持 80、90% 的準確率。在整個製程中最重要的就是訓練階段,工程師彷彿化身老師,必須設計一套學習方法,提供有助學習的豐富教材。而 AI 則是史上最認真的學生,可以穩定、一字不漏、日以繼夜地學習所有課程。

AI 的學習方法主要分為「非監督式學習」、「監督式學習」。非監督式學習是將大批資料提供給 AI,讓其根據工程師所定義的資料相似度算法,逐漸學會將相似資料分在同一堆,再由人類檢視並標注每堆資料對應的類別,進而產生監督式學習所需的訓練資料。而監督式學習則是將大批「資料」和「答案」提供給 AI,讓其逐漸學會將任意資料對應到正確答案。

圖/研之有物

學習到一定階段後,工程師會出試題,測試 AI 的學習狀況,如果成績只有 60、70 分,AI 會針對答錯的地方調整自己的觀念,而工程師也應該與專門領域專家一起討論,想想是否需補充什麼教材,讓 AI 的準確率可以再往上提升。

就算 AI 最後通過測試、可以正式上場工作,也可能因為時事與技術的推陳出新,導致準確率下降。這時,AI 就要定時進修,針對使用者回報的錯誤進行修正,不斷補充新的學習內容,讓自己可以跟得上最新趨勢。

在了解 AI 的基本特徵與訓練流程後,蔡宗翰研究員建議:文科人可以看一些視覺化的操作影片,加深對訓練過程的認識,並實際參與檢視與標注資料的過程。現在網路上也有很多 playground,可以讓初學者練習怎麼訓練 AI,有了上述基本概念與實務經驗,就可以跟工程師溝通無礙了。

AI 能騙過人類,全靠「自然語言處理」

AI 的應用領域相當廣泛,而蔡宗翰研究員專精的是「自然語言處理」。問起當初想投入該領域的原因,他充滿自信地回答:因為自然語言處理是「AI 皇冠上的明珠」!這顆明珠開創 AI 發展的諸多可能性,可以快速讀過並分類所有資料,整理出能快速檢索的結構化內容,也可以如同真人般與人類溝通。

著名的「圖靈測試」(Turing Test)便證明了自然語言處理如何在 AI 智力提升上扮演關鍵角色。1950 年代,傳奇電腦科學家艾倫・圖靈(Alan Turing)設計了一個實驗,用來測試 AI 能否表現出與人類相當的智力水準。首先實驗者將 AI 架設好,並派一個人操作終端機,再找一個第三者來進行對話,判斷從終端機傳入的訊息是來自 AI 或真人,如果第三者無法判斷,代表 AI 通過測試。

圖靈測試:AI(A)與真人(B)同時傳訊息給第三者(C),如果 C 分不出訊息來自 A 或 B,代表 AI 通過實驗。圖/研之有物

換而言之,AI 必須擁有一定的智力,才可能成功騙過人類,讓人類不覺得自己在跟機器對話,而這有賴自然語言處理技術的精進。目前蔡宗翰的研究團隊有將自然語言處理應用在:人文研究文本分析、新聞真偽查核,更嘗試以合成語料訓練臺灣人專用的 AI 語言模型。

讓 AI 替你查資料,追溯文本的起源

目前幾乎所有正史、許多地方志都已經數位化,而大量數位化的經典更被主動分享到「Chinese Text Project」平台,讓 AI 自然語言處理有豐富的文本資料可以分析,包含一字不漏地快速閱讀大量文本,進一步畫出重點、分門別類、比較相似之處等功能,既節省整理文本的時間,更能橫跨大範圍的文本、時間、空間,擴展研究的多元可能性。

例如我們想了解經典傳說《白蛇傳》是怎麼形成的?就可以應用 AI 進行文本溯源。白蛇傳的故事起源於北宋,由鎮江、杭州一帶的說書人所創作,著有話本《西湖三塔記》流傳後世。直至明代馮夢龍的《警世通言》二十八卷〈白娘子永鎮雷峰塔〉,才讓流傳 600 年的故事大體成型。

我們可以透過「命名實體辨識技術」標記文本中的人名、地名、時間、職業、動植物等關鍵故事元素,接著用這批標記好的語料來訓練 BERT 等序列標注模型,以便將「文本向量化」,進而找出給定段落與其他文本的相似之處。

經過多種文本的比較之後發現,白蛇傳的原型可追溯自印度教的那伽蛇族故事,傳說那伽龍王的三女兒轉化成佛、輔佐觀世音,或許與白蛇誤食舍利成精的概念有所關連,推測印度神話應該是跟著海上絲路傳進鎮江與杭州等通商口岸。此外,故事的雛型可能早從唐代便開始醞釀,晚唐傳奇《博異志》便記載了白蛇化身美女誘惑男子的故事,而法海和尚、金山寺等關鍵人物與景點皆真實存在,金山寺最初就是由唐宣宗時期的高僧法海所建。

白蛇傳中鎮壓白娘子的雷峰塔。最早為五代吳越王錢俶於 972 年建造,北宋宣和二年(1120 年)曾因戰亂倒塌,大致為故事雛形到元素齊全的時期。照片中雷峰塔為 21 世紀重建。圖/Wikimedia

在 AI 的協助之下,我們得以跨時空比較不同文本,了解說書人如何結合印度神話、唐代傳奇、在地的真人真事,創作出流傳千年的白蛇傳經典。

最困難的挑戰:AI 如何判斷假新聞

除了應用在人文研究文本分析,AI 也可以查核新聞真偽,這對假新聞氾濫的當代社會是一大福音,但對 AI 來說可能是最困難的挑戰!蔡宗翰研究員指出 AI 的弱點:

如果是答案和數據很清楚的問題,就比較好訓練 AI。如果問題很複雜、變數很多,對 AI 來說就會很困難!

困難點在於新聞資訊的對錯會變動,可能這個時空是對的,另一個時空卻是錯的。雖然坊間有一些以「監督式學習」、「文本分類法」訓練出的假新聞分類器,可輸入當前的新聞讓機器去判讀真假,但過一段時間可能會失準,因為新的資訊源源不絕出現。而且道高一尺、魔高一丈,當 AI 好不容易能分辨出假新聞,製造假新聞的人就會破解偵測,創造出 AI 沒看過的新模式,讓先前的努力功虧一簣。

因此,現在多應用「事實查核法」,原理是讓 AI 模仿人類查核事實的過程,尋找權威資料庫中有無類似的陳述,可用來支持新聞上描述的事件、主張與說法。目前英國劍橋大學為主的學者群、Facebook 與 Amazon 等業界研究人員已組成 FEVEROUS 團隊,致力於建立英文事實查核法模型所能運用的資源,並透過舉辦國際競賽,廣邀全球學者專家投入研究。

蔡宗翰教授團隊 2021 年參加 FEVEROUS 競賽勇奪全球第三、學術團隊第一後,也與合作夥伴事實查核中心及資策會討論,正著手建立中文事實查核法模型所需資源。預期在不久的將來,AI 就能幫讀者標出新聞中所有說法的資料來源,節省讀者查證新聞真偽的時間。

AI 的無限可能:專屬於你的療癒「杯麵」

想像與 AI 共存的未來,蔡宗翰研究員驚嘆於 AI 的學習能力,只要提供夠好、夠多的資料,幾乎都可以訓練到讓人驚訝的地步!圖/研之有物

AI 的未來充滿無限可能,不僅可以成為分類與查證資料的得力助手,還能照護並撫慰人類的心靈,這對邁入高齡化社會的臺灣來說格外重要!許多青壯年陷入三明治人(上有老、下有小要照顧)的困境,期待有像動畫《大英雄天團》的「杯麵」(Baymax)機器人出現,幫忙分擔家務、照顧家人,在身心勞累時給你一個溫暖的擁抱。

機器人陪伴高齡者已是現在進行式,新加坡南洋理工大學 Gauri Tulsulkar 教授等學者於 2021 年發表了一項部署在長照機構的機器人實驗。這名外表與人類相似的機器人叫「娜丁」(Nadine),由感知、處理、互動等三層架構組成,可以透過麥克風、3D和網路鏡頭感知用戶特徵、所處環境,並將上述資訊發送到處理層。處理層會依據感知層提供的資訊,連結該用戶先前與娜丁互動的記憶,讓互動層可以進行適當的對話、變化臉部表情、用手勢做出反應。

長照機構的高齡住戶多數因身心因素、長期缺乏聊天對象,或對陌生事物感到不安,常選擇靜默不語,需要照護者主動引導。因此,娜丁內建了注視追蹤模型,當偵測到住戶已長時間處於被動狀態,就會自動發起話題。

實驗發現,在娜丁進駐長照機構一段時間後,住戶有一半的天數會去找她互動,而娜丁偵測到的住戶情緒多為微笑和中性,其中有 8 位認知障礙住戶的溝通能力與心理狀態有明顯改善。

照護機器人娜丁的運作架構。圖/研之有物

至於未來的改進方向,研究團隊認為「語音辨識系統」仍有很大的改進空間,需要讓機器人能配合老年人緩慢且停頓較長的語速,音量也要能讓重聽者可以清楚聽見,並加強對方言與多語混雜的理解能力。

臺灣如要發展出能順暢溝通的機器人,首要任務就是要開發一套臺灣人專用的 AI 語言模型,包含華語、臺語、客語、原住民語及混合以上兩種語言的理解引擎。這需花費大量人力與經費蒐集各種語料、發展預訓練模型,期待政府能整合學界與業界的力量,降低各行各業導入 AI 相關語言服務的門檻。

或許 AI 無法發展出情感,但卻可以成為人類大腦的延伸,協助我們節省處理資料的時間,更可以心平氣和地回應人們的身心需求。與 AI 共存的未來即將來臨,如何讓自己的行事邏輯跟上 AI 時代,讓 AI 成為自己的助力,是值得你我關注的課題。

延伸閱讀

所有討論 1
研之有物│中央研究院_96
248 篇文章 ・ 2038 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

2
2

文字

分享

0
2
2
若風力、太陽能變成主要能源,如何不被無風陰天弄得全國大停電?──《牛津通識課|再生能源:尋找未來新動能》
日出出版
・2022/07/20 ・3299字 ・閱讀時間約 6 分鐘

國小高年級科普文,素養閱讀就從今天就開始!!

電網:將電力輸送到各地的網路系統

在十九世紀,電力是在靠近電力需求的地方生產的,但到了二十世紀,規模經濟催生出集中式發電廠、長距離傳輸線和地方的變電站。現在,世界上大多數國家的電力都是透過電網來提供。

電網,就是用來傳輸電力的網路,像是電廠、變電廠、配電系統等等,都是電網的一環。圖/Pixabay

這套系統是為了滿足供電需求──最低需求稱為基本負載(baseload)──所設計的,由最便宜的發電機來滿足。

直到最近,發電方式通常是以燃煤為主(也有國家是以核電或水力發電為主),而且大部分的時間都在運作。會搭配其他發電廠(通常是循環燃氣渦輪發電機)來支援,以滿足每天的負載量變化,也會有可快速運作的小型燃氣渦輪或柴油發電機來應對激增的需求或是發電廠停擺等故障問題。

發電廠和變電站間的輸配電系統很重要,這可確保即使有單一線路或發電廠出現問題,仍舊能夠維持電力供應。電網有辦法將電力輸送到偏遠社區,也能獲得偏遠地區的發電。

再生能源進場後,該如何和傳統電廠互相配合?

現在,太陽光電場和風場在許多電網上提供的電力占比日益升高,這正在改變對發電廠的要求。在一般情況下,一天之中混合使用再生能源和傳統發電廠的發電方式最為經濟,而不是完全使用大型的傳統發電機。

風場和太陽光電場容易受到天氣的影響,現階段該如何讓再生能源電場與一般傳統電廠配合,也是能源議題中的一大考驗。圖/Pixabay

除了提供潔淨的電力外,風場和太陽光電場的營運成本最低──這稱為邊際成本(marginal costs)──因為它們沒有燃料成本,並且會首先調用。

為了讓風場和太陽光電場達到最大使用效能,最好是搭配能夠因應電力供需變化而快速反應的其他發電廠;而且理想上,這些電廠的運作也應該符合經濟效應,運作時消耗的用電量僅占其最大負載量的一小部分。

一般來說,燃煤電廠和核電廠的數量並不會有快速的增減,而燃氣和再生能源電廠則是更好的選項。根據地點的不同,水力發電、生質能、地熱和聚光太陽能(搭配蓄熱儲能)都可以擔任靈活發電的功能。

化石燃料發電廠可以儲存燃料並因應需求來提供電力。風場和太陽光電場與這些可以隨時供電──稱為可調度或固定供應──的發電廠不同,這兩者的運作都取決於天氣這項變數。

運用 AI 技術,擺脫「天氣」這個天生弱點!

儘管有時會出現風力弱和陰天的日子,然而,與一些人想像的剛好相反,擁有大量風力發電和太陽光電的電網其實能夠在需要時提供電力。

透過人工智慧(artificial intelligence,AI)來獲取良好的天氣預報,太陽光電場和風場的輸出變化通常是可以預期的,因此可得到最佳結果。

透過人工智慧的協助,可以更有效的運用電力。圖Envato Elements

當再生能源供應達到總電力需求的 30% 時,這些變化可以輕易透過裝配在電網上的快速反應發電廠來填補,以滿足供電需求的變化。

當一處 1000 兆瓦的大型發電廠意外跳電(可能是設備故障或過載),處理起來可能遠比風力發電或太陽光電的電力突然下降更具挑戰性。備用儲電站必須迅速上線,而風場和太陽光電場若是尚未達到滿載,還可以在有風和晴天的天氣迅速提高其發電量,提供額外的寶貴備用電。

再生能源成為主要來源後,怎麼讓電供保持穩定?

為了提供潔淨、安全和價格低廉的電力,並且在本世紀中葉大幅減少碳排放,避免氣候變遷演變到危及生靈的程度,全球的供電必須以再生能源為主。透過增加再生能源的輸出、地理分布以及與其他電網的連結,再生能源的供電占比將可望提高到電網的 50% 左右。

在一定程度上,增加這類綠電的發電能力可以彌補天氣條件惡劣的情況,而連接大範圍的太陽光電場和風場則可以提供更平穩可靠的電力。

在歐洲,丹麥已經與挪威、瑞典或德國等國進行電力交易,以此來平衡電力供需:在他們自己的風力發電量高時出口電力,而在發電量低時則進口電力。

然而,建立洲際再生電網並非易事。過去曾經有一項 DESERTEC(沙漠科技基金會)的提案,計畫要將北非的太陽能傳送到歐洲,但由於政治不穩定,再加上不同地區和國家對規畫中的電網各有所圖,產生相互衝突的反對意見,因此難以具體實現提案。

增加太陽能板的面積、建立跨國、洲際再生電網,都是維持電力供應穩定的做法。圖/Pixabay

此外,由於太陽能板的成本急劇下降,因此日照多的優勢變得不那麼重要,因為可以靠增加太陽能板的大小來彌補日照少的缺憾,這比支付長距離傳輸費用更為經濟。能夠在地方發電也等於是提供了一份供電的安全保障,不必依賴化石燃料進口。然而,廣泛架設的電網確實對於供需平衡有極大的幫助。

若是能配合供電來調整電力需求,就可降低對儲能廠的需求──這稱為「需量反應(demand response)」──或許可成為一個更便宜的選項,因為那些用來支援電力尖峰的快速反應發電廠的運作成本最高。

智慧電網:更聰明、更彈性的調整電力供應!

使用智慧電網可以讓電網營運商和用戶間進行雙向溝通,調整電力負載量,使其與供電端相等,這樣就能確定出需要從電網中取用的的需求量,或是添加量。

出現短時間停電或減少電力供應時,許多運作仍有可能繼續維持,好比那些具有熱慣性的操作──像是保持鐵或瀝青、熔融物或超市冰箱冷藏食物的溫度;或是建築物的溫度調節──或是在將零件組裝成產品前,先製造出充足的零件備量。

智慧電網最重要的就是雙向的溝通來進行調整。圖/Envato Elements

同樣地,可以透過啟動電爐、大型電解槽或海水淡化廠(以幫助應對氣候變遷造成的乾旱)來增加需求量。在數位化科技的推動下,我們正處於智慧電網革命的開端,這將會對電力負載量造成重大變化,將會讓邁向再生能源的這段過渡期更為容易,並且為客戶帶來更低的成本。

另外,可以用價格差異來鼓勵客戶改變他們的電力需求。在義大利,有推行一個簡單的計畫,是以固定費用(取決於所使用的最大功率)和每度電的價格來回收發電廠的資本和配電成本以及發電成本。

以限制電力需求的方式(讓消費端的電價變得更便宜),白天必須間隔使用電熱水壺、洗衣機和烤箱等電器;如果一次全部使用,就會跳電。

這樣便可降低發電成本中最高的尖峰用電。而在離峰期(例如夜間)提供便宜電價也是一種方式。不過要達到有效調整,需要同時使用智慧電網和智慧電錶。這樣用戶端可以看到他們的消費細節,並選擇僅在低電價或優惠價格時段才使用某些電器設備。

儲能設備對於提高再生能源的發電占比非常有幫助。以太陽光電場和風場這樣的組合來供應夜間用電,往往會有白天過度生產,導致電價下跌的情況。若是沒有儲能設備,必須盡可能出口過剩電力,或是以減少供電來降低損失。短期儲能可以將部分電力從下午轉移到晚上,因此小容量即可以滿足日常需求。

隨著電池成本的急劇下降,這種儲能的可用性變得越來越高,而且也開始取代那些用來補強綠電不足時的快速反應化石燃料電廠。

——本文摘自《【牛津通識課02】再生能源:尋找未來新動能》,2022 年 6 月,日出出版,未經同意請勿轉載。

日出出版
8 篇文章 ・ 4 位粉絲