0

0
0

文字

分享

0
0
0

用大數據從基因序列抽絲剝繭出思覺失調和腦中風的片段,然後呢?

陳妤寧
・2016/03/24 ・3688字 ・閱讀時間約 7 分鐘 ・SR值 543 ・八年級

-----廣告,請繼續往下閱讀-----

活動記錄/陳妤寧

由資策會和工業局主辦的「智慧醫療新契機」的三位講者黃玉華、查怡和溫在弘分別從基因醫學和公共衛生的角度來談談,在他們的科學領域之中,那筆重要的大數據到底是什麼?

黃講師
美國麻省總醫院、麻省理工學院、哈佛醫學院的研究員黃玉華博士,在PanSci「智慧醫療新契機-智慧化長照新科技應用的契機」講座中用科學角度讓人打破對「精神分裂症」的刻板印象。

「如果我今天的演講能夠激起你對於科學一點點的興奮感,那麼它也許就會成為你日後追求知識或是職涯中的燈塔。」

黃玉華博士是美國麻省總醫院、麻省理工學院、哈佛醫學院的研究員,專長為高階心智功能的腦造影研究,近年的研究則以尋找思覺失調症(舊稱精神分裂症)之腦造影生物標記為主。而她在「智慧醫療新契機」講座中談的最多的是:人類應該怎麼看待科學。

「判有」精神分裂症 ≠ 「有」精神分裂症

「即使今天有一千個醫生判定一個人有 Schizophrenia(思覺失調症,舊譯精神分裂症),這也未必代表真相。」黃玉華拿起麥克風,一開口就這麼說。儘管身為一名科學家,她呼籲我們應該保持對自然的謙卑-不要以為能用科學控制一切,也不要以為今日的科學發現、不會在明天被新的證據所推翻。(延伸閱讀:【科學史上的今天】10/12——最有爭議的諾貝爾醫學獎

-----廣告,請繼續往下閱讀-----

「當今天我們用『症』、『症候群』而非『病』來形容思覺失調症時,這代表醫學界還沒辦法明確界定它的範圍,包括自閉症、憂鬱症、亞斯伯格症候群等等,你無法將人分為『有病』和『沒病』的兩群,這些病症的存在更像是一個光譜-我雖然症狀不嚴重,但我也有一點點病。」(延伸閱讀:瘋與不瘋,誰說了算?

黃玉華解釋,思覺失調症具有正向症狀和負向症狀-別人沒有而患者有的症狀,就是正向症狀,例如妄想。「不過,有時候他們所相信的不可思議之事,也可能是真的啊。例如水門案中的調查員費爾特認為自己被跟蹤,後來才被證明真有其事。」而負向症狀,指的就是別人擁有而患者失去的能力,例如情緒和意志力。「最常見的狀況是,思覺失調症的病人表示他們的特定行為是被一個神祕聲音所指使的。我們有時也覺得自己『幻聽』了、說是『撞鬼』了,但思覺失調症的病人會順從那聲音去做某件事,這是比較嚴重的。」

種種實際影響生活和社交六個月以上的症狀,必須持續的發生而非偶一為之、才能夠被斷定為具有思覺失調症。「這種診斷方式,當然不是很好。在醫學上,我們有沒有可能找到一個生物標記、使思覺失調症就像糖尿病一般,今天測出來不管你自己說有或沒有、如山的鐵證就是躺在那裡?目前我們對思覺失調症的瞭解仍然不足以達成這步。」思覺失調症的真相,就和所有科學的真相一樣是持續追求的過程。

聽眾
PanSci「智慧醫療新契機-智慧化長照新科技應用的契機」,在2016/3/17由資策會和工業局舉辦。

基因不是全部的故事

全世界人口的1%有思覺失調症,科學家嘗試從基因中找答案。不過黃玉華先預告,即使是擁有相同基因的同卵雙胞胎,其中也有 52% 並不會同時擁有思覺失調症。「這代表什麼?即使我的雙胞胎兄弟姊妹被診斷有思覺失調症,我也有52%機率是健康的。這代表什麼?表示基因不是100%的理由,環境也有影響,人是可能拿回主控權的。」

-----廣告,請繼續往下閱讀-----

另外,也有些思覺失調症病人的兄弟姊妹,在16~18歲的青少年時期發病、但在20歲又恢復健康。「你怎麼詮釋這個世界,會決定你的身體怎麼因應他。」黃玉華再三強調,雖然很多理論仍在嘗試做出解釋,但環境因素的確扮演很大角色。「曾有個實驗告訴其中一組清潔婦受試者,他們所做的事情相當於在健身,數月之後,這組清潔婦的體能較另一組大幅增加。信念的改變能夠影響身體甚鉅,有時即便已被告知該藥是安慰劑,也對受試病人產生了正面作用。」

找出思覺失調起因的嫌疑犯,關鍵就在基因大數據

今年年初的一則科研消息,大大振奮了黃玉華和他的研究世界。哈佛大學遺傳學副教授麥卡羅爾(Steven McCarroll) 發現,擁有 Complement Component 4、簡稱「C4」這種基因變異者,大腦中的「突觸修剪」(synaptic pruning)過程速度會加快;擁有 C4 基因者,得到思覺失調症的比例也遠高於不帶這種變異者。「C4 的任務是調控體內的補體蛋白質,一旦免疫系統出了問題、就跑去清理被殺死的細胞;但一旦他跑去大腦和心狀細胞聯手修剪突觸、若修過頭可能就會使大腦無法正常運作了。」

神經元
照片中神經元間的綠色者為 C4 調控的補體蛋白質。(Heather de Rivera/McCarroll Lab/Harvard via AP)

哈佛決定要針對 C4 基因深入研究,也許是一種天才或是運氣的直覺決定,不過哈佛找出 C4 的過程,其實就是運用數學方法去解一道生物醫學習題。「C4 這種基因有非常多種變形,這就像是,你今天正在追查的一個嫌犯,你只知道他住在波士頓、只知道他的電話前三碼;但是他的身分會一直轉變:他可男可女、他可能變成兩個人、他也可能是個小孩……」

要怎麼研究呢?哈佛利用人體基因資料庫中的龐大資料-包括三萬七千名思覺失調症患者的基因、以及十一萬健康者的基因資料互相比對。「C4 的結構裡有太多種SNP變化的可能性、並和遺傳有所關連。他們手上沒有 C4 的資料,只有既有的 SNP(單一核苷酸多態性)基因圖譜,於是他們做的事情相當於建立一個龐大的對照表,利用這幾十萬人的基因資料,去把每個 C4 有可能對應的 SNP 改變全部查出來。」這筆用以分析的資料,想必就是一種具體的大數據了。「結果證明,C4 產生的補體蛋白質越多,的確和思覺失調的關連就越高。但!我們只能說 C4 是個有力的嫌疑犯,尚不能斷言它就是唯一的兇手。」

-----廣告,請繼續往下閱讀-----

「1861年,科學家才發表論文指出人類形而上的心智功能、是建立在大腦這樣物理性的存在而生。但如今,我們不但能知道你的大腦在運作,還能利用視覺化科技重現你腦中看到的東西!腦科學的發展,太需要資料和工具了。」黃玉華不想只談科技進步的讓人興奮之處,她反道而行、再三提醒-當我們急著用藥去阻斷 C4 或補體蛋白質,我們也在冒著打亂身體中另一處某個重要機能的風險-人體就和大自然一樣,有著自己的生態平衡。在科學研究中追求真相固然迷人,但也不能忘卻對於自然的那份謙卑。

找腦中風基因,也要電腦演算法的幫忙

黃玉華說,大數據分析其實是在醫學上一直存在的方法,但自從用到商業之後開始廣泛引起大家的興趣。而查怡從事她的腦中風基因研究的博士論文時,也沒想過那會是如今火紅的大數據。

查怡
現任職於資策會國際處的查怡博士,過去在美國肯塔基州路易維爾大學解剖科學與神經生物學系研究腦中風基因序列,也是她本次在PanSci「智慧醫療新契機-智慧化長照新科技應用的契機」講座中主要分享的內容。

「我們努力想預防中風,但有時即使年紀輕輕、飲食得宜,中風還是說來就來。」在基因序列中,能找到和腦中風有關的那一段嗎?

儘管主題完全是生物,但查怡的方法,可以說非常數學、也非常傾向電腦科學。為了研究腦中風基因序列的比較,「一段一段來檢查長得一不一樣,這個過程就需要透過電腦演算。」

-----廣告,請繼續往下閱讀-----

PDE4 是磷酸二酯酶的一種,也是很多醫學人員的研究對象。若血液中 PDE4 產生的特定蛋白質比例增高,也會隨之影響中風的風險。「我的運氣好,利用了電腦演算比對出一些過去 PDE4 沒有被發現的選擇性剪接-包括一些雖然長得很像、但寬度不同者,它們會轉譯出不同的蛋白質來影響生理狀況。電腦推算出的假設,必須更進一步透過生物實驗去證實;所以我的指導老師以田鼠實驗、證實了這些新序列片段的存在。」

數據越多、運算越快、越能幫助醫學一臂之力

AI人工智慧,能夠自己完成尋找基因序列的旅途嗎?查怡認為,在大數據的邏輯中,若分析的材料越多,醫療判斷就能獲得更多的依據;而越多的分析材料,意味著仰賴日漸進化的電腦演算速度。「過去要花一年運算的基因序列,現在你只要花一千塊,就能幫你在一個月內找出你的潛在發病基因。」黃玉華也補充,AI一直以不同的面貌存在於醫療科學,在 try and learn 的過程中嘗試最佳化的運算方式。

基因檢測之後的道德難題

來到現場的聽眾,除了有相關從業人員提出醫學上的疑問,還有更多是對醫療和道德之間的有趣討論。黃玉華說,疾病對藥商而言等於商機。「於是,他們喜歡把所有症狀都詮釋為各種疾病。They make people insane. 而為了解決你的恐懼,方法就是你要吃藥吃一輩子。」查怡則說,除了藥商之外,保險公司也想賺你的錢。「基因檢測真的這麼棒嗎?有很多病人家屬並不願意做基因檢測和預防性治療;另一個問題是,當你做了基因檢測,保險公司能否以這筆資料中你所擁有的某些基因為由,拒絕讓你投保?」

看來在突破人工智慧的極限之前,我們要先回到二十年前桃莉羊誕生時即困擾著我們的道德問題-當科技真的賦予了我們充分的選擇、我們該怎麼選擇才好

-----廣告,請繼續往下閱讀-----
文章難易度
陳妤寧
38 篇文章 ・ 0 位粉絲
熱愛將知識拆解為簡單易懂的文字,喜歡把一件事的正反觀點都挖出來思考,希望用社會科學的視角創造更宏觀的視野。

0

8
2

文字

分享

0
8
2
快!還要更快!讓國家級地震警報更好用的「都會區強震預警精進計畫」
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/21 ・2584字 ・閱讀時間約 5 分鐘

本文由 交通部中央氣象署 委託,泛科學企劃執行。

  • 文/陳儀珈

從地震儀感應到地震的震動,到我們的手機響起國家級警報,大約需要多少時間?

臺灣從 1991 年開始大量增建地震測站;1999 年臺灣爆發了 921 大地震,當時的地震速報系統約在震後 102 秒完成地震定位;2014 年正式對公眾推播強震即時警報;到了 2020 年 4 月,隨著技術不斷革新,當時交通部中央氣象局地震測報中心(以下簡稱為地震中心)僅需 10 秒,就可以發出地震預警訊息!

然而,地震中心並未因此而自滿,而是持續擴建地震觀測網,開發新技術。近年來,地震中心執行前瞻基礎建設 2.0「都會區強震預警精進計畫」,預計讓臺灣的地震預警系統邁入下一個新紀元!

-----廣告,請繼續往下閱讀-----

連上網路吧!用建設與技術,換取獲得地震資料的時間

「都會區強震預警精進計畫」起源於「民生公共物聯網數據應用及產業開展計畫」,該計畫致力於跨部會、跨單位合作,由 11 個執行單位共同策畫,致力於優化我國環境與防災治理,並建置資料開放平台。

看到這裡,或許你還沒反應過來地震預警系統跟物聯網(Internet of Things,IoT)有什麼關係,嘿嘿,那可大有關係啦!

當我們將各種實體物品透過網路連結起來,建立彼此與裝置的通訊後,成為了所謂的物聯網。在我國的地震預警系統中,即是透過將地震儀的資料即時傳輸到聯網系統,並進行運算,實現了對地震活動的即時監測和預警。

地震中心在臺灣架設了 700 多個強震監測站,但能夠和地震中心即時連線的,只有其中 500 個,藉由這項計畫,地震中心將致力增加可連線的強震監測站數量,並優化原有強震監測站的聯網品質。

-----廣告,請繼續往下閱讀-----

在地震中心的評估中,可以連線的強震監測站大約可在 113 年時,從原有的 500 個增加至 600 個,並且更新現有監測站的軟體與硬體設備,藉此提升地震預警系統的效能。

由此可知,倘若地震儀沒有了聯網的功能,我們也形同完全失去了地震預警系統的一切。

把地震儀放到井下後,有什麼好處?

除了加強地震儀的聯網功能外,把地震儀「放到地下」,也是提升地震預警系統效能的關鍵做法。

為什麼要把地震儀放到地底下?用日常生活來比喻的話,就像是買屋子時,要選擇鬧中取靜的社區,才不會讓吵雜的環境影響自己在房間聆聽優美的音樂;看星星時,要選擇光害比較不嚴重的山區,才能看清楚一閃又一閃的美麗星空。

-----廣告,請繼續往下閱讀-----

地表有太多、太多的環境雜訊了,因此當地震儀被安裝在地表時,想要從混亂的「噪音」之中找出關鍵的地震波,就像是在搖滾演唱會裡聽電話一樣困難,無論是電腦或研究人員,都需要花費比較多的時間,才能判讀來自地震的波形。

這些環境雜訊都是從哪裡來的?基本上,只要是你想得到的人為震動,對地震儀來說,都有可能是「噪音」!

當地震儀靠近工地或馬路時,一輛輛大卡車框啷、框啷地經過測站,是噪音;大稻埕夏日節放起絢麗的煙火,隨著煙花在天空上一個一個的炸開,也是噪音;台北捷運行經軌道的摩擦與震動,那也是噪音;有好奇的路人經過測站,推了推踢了下測站時,那也是不可忽視的噪音。

因此,井下地震儀(Borehole seismometer)的主要目的,就是盡量讓地震儀「遠離塵囂」,記錄到更清楚、雜訊更少的地震波!​無論是微震、強震,還是來自遠方的地震,井下地震儀都能提供遠比地表地震儀更高品質的訊號。

-----廣告,請繼續往下閱讀-----

地震中心於 2008 年展開建置井下地震儀觀測站的行動,根據不同測站底下的地質條件,​將井下地震儀放置在深達 30~500 公尺的乾井深處。​除了地震儀外,站房內也會備有資料收錄器、網路傳輸設備、不斷電設備與電池,讓測站可以儲存、傳送資料。

既然井下地震儀這麼強大,為什麼無法大規模建造測站呢?簡單來說,這一切可以歸咎於技術和成本問題。

安裝井下地震儀需要鑽井,然而鑽井的深度、難度均會提高時間、技術與金錢成本,因此,即使井下地震儀的訊號再好,若非有國家建設計畫的支援,也難以大量建置。

人口聚集,震災好嚴重?建立「客製化」的地震預警系統!

臺灣人口主要聚集於西半部,然而此區的震源深度較淺,再加上密集的人口與建築,容易造成相當重大的災害。

-----廣告,請繼續往下閱讀-----

許多都會區的建築老舊且密集,當屋齡超過 50 歲時,它很有可能是在沒有耐震規範的背景下建造而成的的,若是超過 25 年左右的房屋,也有可能不符合最新的耐震規範,並未具備現今標準下足夠的耐震能力。 

延伸閱讀:

在地震界有句名言「地震不會殺人,但建築物會」,因此,若建築物的結構不符合地震規範,地震發生時,在同一面積下越密集的老屋,有可能造成越多的傷亡。

因此,對於發生在都會區的直下型地震,預警時間的要求更高,需求也更迫切。

-----廣告,請繼續往下閱讀-----

地震中心著手於人口密集之都會區開發「客製化」的強震預警系統,目標針對都會區直下型淺層地震,可以在「震後 7 秒內」發布地震警報,將地震預警盲區縮小為 25 公里。

111 年起,地震中心已先後完成大臺北地區、桃園市客製化作業模組,並開始上線測試,當前正致力於臺南市的模組,未來的目標為高雄市與臺中市。

永不停歇的防災宣導行動、地震預警技術研發

地震預警系統僅能在地震來臨時警示民眾避難,無法主動保護民眾的生命安全,若人民沒有搭配正確的防震防災觀念,即使地震警報再快,也無法達到有效的防災效果。

因此除了不斷革新地震預警系統的技術,地震中心也積極投入於地震的宣導活動和教育管道,經營 Facebook 粉絲專頁「報地震 – 中央氣象署」、跨部會舉辦《地震島大冒險》特展、《震守家園 — 民生公共物聯網主題展》,讓民眾了解正確的避難行為與應變作為,充分發揮地震警報的效果。

-----廣告,請繼續往下閱讀-----

此外,雖然地震中心預計於 114 年將都會區的預警費時縮減為 7 秒,研發新技術的腳步不會停止;未來,他們將應用 AI 技術,持續強化地震預警系統的效能,降低地震對臺灣人民的威脅程度,保障你我生命財產安全。

文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
196 篇文章 ・ 300 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

2

3
0

文字

分享

2
3
0
數據塑造生活與社會,讓人既放心但又不安?——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/28 ・2760字 ・閱讀時間約 5 分鐘

-----廣告,請繼續往下閱讀-----

數位世界已經改變了我們日常生活的體驗,一個人從早到晚都會接受到大量數據,受益於大量數據,也貢獻大量數據。這些數據龐大的程度,和消化資訊的方式已經太過繁多,人類心智根本無法處理。

與數位科技建立夥伴關係

所以人會本能地或潛意識地倚賴軟體來處理、組織、篩選出必要或有用的資訊,也就是根據用戶過去的偏好或目前的流行,來挑選要瀏覽的新項目、要看的電影、要播放的音樂。自動策劃的體驗很輕鬆容易,又能讓人滿足,人們只會在沒有自動化服務,例如閱讀別人臉書塗鴉牆上的貼文,或是用別人的網飛帳號看電影時,才會注意到這服務的存在。

有人工智慧協助的網路平臺加速整合,並加深了個人與數位科技間的連結。人工智慧經過設計和訓練,能直覺地解決人類的問題、掌握人類的目標,原本只有人類心智才能管理的各種選擇,現在能由網路平臺來引導、詮釋和記錄(儘管效率比較差)。

日常生活中很少察覺到對自動策劃的依賴。圖/Pexels

網路平臺收集資訊和體驗來完成這些任務,任何一個人的大腦在壽命期限內都不可能容納如此大量的資訊和體驗,所以網路平臺能產出看起來非常恰當的答案和建議。例如,採購員不管再怎麼投入工作,在挑選冬季長靴的時候,也不可能從全國成千上萬的類似商品、近期天氣預測、季節因素、回顧過去的搜尋記錄、調查物流模式之後,才決定最佳的採購項目,但人工智慧可以完整評估上述所有因素。

-----廣告,請繼續往下閱讀-----

因此,由人工智慧驅動的網路平臺經常和我們每個人互動,但我們在歷史上從未和其他產品、服務或機器這樣互動過。當我們個人在和人工智慧互動的時候,人工智慧會適應個人用戶的偏好(網際網路瀏覽記錄、搜尋記錄、旅遊史、收入水準、社交連結),開始形成一種隱形的夥伴關係。

個人用戶逐漸依賴這樣的平臺來完成一串功能,但這些功能過去可能由郵政、百貨公司,或是接待禮賓、懺悔自白的人和朋友,或是企業、政府或其他人類一起來完成。

網路平臺和用戶之間是既親密又遠距的聯繫。圖/Envato Elements

個人、網路平臺和平臺用戶之間的關係,是一種親密關係與遠距聯繫的新穎組合。人工智慧網路平臺審查大量的用戶數據,其中大部分是個人數據(如位置、聯絡資訊、朋友圈、同事圈、金融與健康資訊);網路會把人工智慧當成嚮導,或讓人工智慧來安排個人化體驗。

人工智慧如此精準、正確,是因為人工智慧有能力可以根據數億段類似的關係,以及上兆次空間(用戶群的地理範圍)與時間(集合了過去的使用)的互動來回顧和反應。網路平臺用戶與人工智慧形成了緊密的互動,並互相學習。

-----廣告,請繼續往下閱讀-----

網路平臺的人工智慧使用邏輯,在很多方面對人類來說都難以理解。例如,運用人工智慧的網路平臺在評估圖片、貼文或搜尋時,人類可能無法明確地理解人工智慧會在特定情境下如何運作。谷歌的工程師知道他們的搜尋功能若有人工智慧,就會有清楚的搜尋結果;若沒有人工智慧,搜尋結果就不會那麼清楚,但工程師沒辦法解釋為什麼某些結果的排序比較高。

要評鑑人工智慧的優劣,看的是結果實用不實用,不是看過程。這代表我們的輕重緩急已經和早期不一樣了,以前每個機械的步驟或思考的過程都會由人類來體驗(想法、對話、管理流程),或讓人類可以暫停、檢查、重複。

人工智慧陪伴現代人的生活

例如,在許多工業化地區,旅行的過程已經不需要「找方向」了。以前這過程需要人力,要先打電話給我們要拜訪的對象,查看紙本地圖,然後常常在加油站或便利商店停下來,確認我們的方向對不對。現在,透過手機應用程式,旅行的過程可以更有效率。

透過導航,為旅途帶來不少便利。圖/Pexels

這些應用程式不但可以根據他們「所知」的交通記錄來評估可能的路線與每條路線所花費的時間,還可以考量到當天的交通事故、可能造成延誤的特殊狀況(駕駛過程中的延誤)和其他跡象(其他用戶的搜尋),來避免和別人走同一條路。

-----廣告,請繼續往下閱讀-----

從看地圖到線上導航,這轉變如此方便,很少人會停下來想想這種變化有多大的革命性意義,又會帶來什麼後果。個人用戶、社會與網路平臺和營運商建立了新關係,並信任網路平臺與演算法可以產生準確的結果,獲得了便利,成為數據集的一部分,而這數據集又在持續進化(至少會在大家使用應用程式的時候追蹤個人的位置)。

在某種意義上,使用這種服務的人並不是獨自駕駛,而是系統的一部分。在系統內,人類和機器智慧一起協作,引導一群人透過各自的路線聚集在一起。

持續陪伴型的人工智慧會愈來愈普及,醫療保健、物流、零售、金融、通訊、媒體、運輸和娛樂等產業持續發展,我們的日常生活體驗透過網路平臺一直在變化。

網路平台協助我們完成各種事項。圖/Pexels

當用戶找人工智慧網路平臺來協助他們完成任務的時候,因為網路平臺可以收集、提煉資訊,所以用戶得到了益處,上個世代完全沒有這種經驗。這種平臺追求新穎模式的規模、力量、功能,讓個人用戶獲得前所未有的便利和能力;同時,這些用戶進入一種前所未有的人機對話中。

-----廣告,請繼續往下閱讀-----

運用人工智慧的網路平臺有能力可以用我們無法清楚理解,甚至無法明確定義或表示的方式來形塑人類的活動,這裡有一個很重要的問題:這種人工智慧的目標功能是什麼?由誰設計?在哪些監管參數範圍裡?

類似問題的答案會繼續塑造未來的生活與未來的社會:誰在操作?誰在定義這些流程的限制?這些人對於社會規範和制度會有什麼影響?有人可以存取人工智慧的感知嗎?有的話,這人是誰?

如果沒有人類可以完全理解或查看數據,或檢視每個步驟,也就是說假設人類的角色只負責設計、監控和設定人工智慧的參數,那麼對人工智慧的限制應該要讓我們放心?還是讓我們不安?還是既放心又不安?

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
所有討論 2
聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。

0

1
0

文字

分享

0
1
0
AI 的 3 種學習形式:不同的目標功能,不同的訓練方式——《 AI 世代與我們的未來》
聯經出版_96
・2022/12/27 ・2368字 ・閱讀時間約 4 分鐘

搭配不同的任務,人工智慧的應用方式也不一樣,所以開發人員用來創造人工智慧的科技也不一樣。這是部署機器學習時最基礎的挑戰:不同的目標和功能需要不同的訓練技巧。

機器學習最基礎的挑戰:不同目標和功能需配合不同訓練技巧。圖/Pexels

不過,結合不同的機器學習法,尤其是應用神經網路,就出現不同的可能性,例如發現癌症的人工智慧。

機器的 3 種學習形式

在我們撰寫本章的時候,機器學習的三種形式:受監督式學習、不受監督式學習和增強式學習,都值得注意。

受監督式學習催生了發現海利黴素的人工智慧。總結來說,麻省理工學院的研究人員想要找出有潛力的新抗生素,在資料庫裡放入二千種分子來訓練模型,輸入項目是分子結構,輸出項目是抑菌效果;研究人員把分子結構展示給人工智慧看,每一種結構都標示抗菌力,然後讓人工智慧去評估新化合物的抗菌效果。

-----廣告,請繼續往下閱讀-----

這種技巧稱為受監督式學習,因為人工智慧開發人員利用包含了輸入範例(即分子結構)的資料集,在這裡面,每一筆數據都單獨標示研究人員想要的輸出項目或結果(即抗菌力)。

開發人員已經把受監督式學習的技巧應用於許多處,例如創造人工智慧來辨識影像。為了這項任務,人工智慧先拿已經標示好的圖像來訓練,學著把圖像和標籤,例如把貓的照片和「貓」的標籤,聯想在一起,人工智慧把圖片和標籤的關係編碼之後,就可以正確地辨識新圖片。

貓貓!圖/Pexels

因此,當開發人員有一個資料集,其中每個輸入項目都有期望的輸出項目,受監督式學習就能有效地創造出模型,根據新的輸入項目來預測輸出項目。

不過,當開發人員只有大量資料,沒有建立關係的時候,他們可以透過不受監督式學習來找出可能有用的見解。因為網際網路與資料數位化,比過去更容易取得資料,現在企業、政府和研究人員都被淹沒在資料中。

-----廣告,請繼續往下閱讀-----

行銷人員擁有更多顧客資訊、生物學家擁有更多資料、銀行家有更多金融交易記錄。當行銷人員想要找出客戶群,或詐騙分析師想要在大量交易中找到不一致的資訊,不受監督式學習就可以讓人工智慧在不確定結果的資訊中找出異常模式。

這時,訓練資料只有輸入項目,然後工程師會要求學習演算法根據相似性來設定權重,將資料分類。舉例來說,像網飛(Netflix)這樣的影音串流服務,就是利用演算法來找出哪些觀眾群有類似的觀影習慣,才好向他們推薦更多節目;但要優化、微調這樣的演算法會很複雜:因為多數人有好幾種興趣,會同時出現在很多組別裡。

影音串流服務利用演算法,進而推薦使用者可能喜歡的節目。圖/Pexels

經過不受監督式學習法訓練的人工智慧,可以找出人類或許會錯過的模式,因為這些模式很微妙、數據規模又龐大。因為這樣的人工智慧在訓練時沒有明定什麼結果才「適當」,所以可以產生讓人驚豔的創新見解,這其實和人類的自我教育沒什麼不同——無論是人類自學或是人工智慧,都會產生稀奇古怪、荒謬無理的結果。

不管是受監督式學習法或不受監督式學習法,人工智慧都是運用資料來執行任務,以發現新趨勢、識別影像或做出預測。在資料分析之外,研究人員想要訓練人工智慧在多變的環境裡操作,第三種機器學習法就誕生了。

-----廣告,請繼續往下閱讀-----

增強式學習:需要理想的模擬情境與回饋機制

若用增強式學習,人工智慧就不是被動地識別資料間的關聯,而是在受控的環境裡具備「能動性」,觀察並記錄自己的行動會有什麼反應;通常這都是模擬的過程, 把複雜的真實世界給簡化了,在生產線上準確地模擬機器人比較容易,在擁擠的城市街道上模擬就困難得多了。

但即使是在模擬且簡化的環境裡,如西洋棋比賽,每一步都還是會引發一連串不同的機會與風險。因此,引導人工智慧在人造環境裡訓練自己,還不足以產生最佳表現,這訓練過程還需要回饋。

西洋棋比賽中的每一步會引發一連串機會與風險。圖/Pexels

提供反饋和獎勵,可以讓人工智慧知道這個方法成功了。沒有人類可以有效勝任這個角色:人工智慧因為在數位處理器上運作,所以可以在數小時或數日之內就訓練自己幾百次、幾千次或幾十億次,人類提供的回饋相比之下根本不切實際。

軟體工程師將這種回饋功能自動化,謹慎精確地說明這些功能要如何操作,以及這些功能的本質是要模擬現實。理想情況下,模擬器會提供擬真的環境,回饋功能則會讓人工智慧做出有效的決定。

-----廣告,請繼續往下閱讀-----

阿爾法元的模擬器就很簡單粗暴:對戰。阿爾法元為了評估自己的表現,運用獎勵功能,根據每一步創造的機會來評分。

增強式學習需要人類參與來創造人工智慧的訓練環境(儘管在訓練過程中不直接提供回饋):人類要定義模擬情境和回饋功能,人工智慧會在這基礎上自我訓練。為產生有意義的結果,謹慎明確地定義模擬情境和回饋功能至關重要。

——本文摘自《 AI 世代與我們的未來:人工智慧如何改變生活,甚至是世界?》,2022 年 12 月,聯經出版公司,未經同意請勿轉載。

聯經出版_96
27 篇文章 ・ 20 位粉絲
聯經出版公司創立於1974年5月4日,是一個綜合性的出版公司,為聯合報系關係企業之一。 三十多年來已經累積了近六千餘種圖書, 範圍包括人文、社會科學、科技以及小說、藝術、傳記、商業、工具書、保健、旅遊、兒童讀物等。