0

0
0

文字

分享

0
0
0

學術論文的圖片該怎麼處理?國外期刊早有規範—《科學月刊》

科學月刊_96
・2017/03/05 ・2859字 ・閱讀時間約 5 分鐘 ・SR值 607 ・十年級

-----廣告,請繼續往下閱讀-----

文/曹哲嘉|美國羅徹斯特大學生物學博士,現任教於國立臺南大學生物科技學系。

台大論文造假案引發學界爭議。圖/Richy Li, CC BY-SA 3.0, https://zh.wikipedia.org/

這幾個月來,臺大多篇論文遭質疑圖片有問題,至今已有 2 篇撤銷發表。此事件引發不小的風波,案情至今仍在調查處理之中。科技部部長楊弘敦在立法院接受質詢時表示會有造假是人性使然,古今中外皆有,因此應強化學術倫理教育,並且在制度面檢討來杜絕弊端。到底當今生醫發表內容,有多少比例的可信度有問題?造假是否中外皆有?早在臺大案例受到注目之前的 2016 年 6 月,在美國微生物學會(ASM)出版的電子期刊 mBio 上就刊出一篇文章「生物醫學研究期刊中不當圖像重複的普遍性(The prevalence of inappropriate image duplication in biomedical research publications)」, 3 位美國學者檢視了 1995 至 2014 年間,於選定的生醫相關領域期刊上、共 2 萬餘篇論文,發現幾乎每 25 篇就有一篇(3.8%)出現了圖片重複使用或修改的情況。

該文作者定義出 3 種有問題的圖片類型:

  1. 單純重複使用同一圖片:在標示為不同樣品或處理的實驗之間,使用了相同的圖片來呈現結果。最常出現此類問題的是作為比對量化標準的載入控制組(loading control)。在利用免疫轉漬法偵測不同樣品中某一蛋白質含量變化的實驗時,通常需選用一種量多恆定、在該實驗條件下各樣品間均不會明顯改變的物質,以作為相互比對的基準;並亦用以顯示待測蛋白的變化是有針對性的,而不是每種成分都概括改變。因為這是判讀實驗結果的基準,每次實驗操作都應重做這種控制組的測試。
  2. 經過截切與調整位置後使用同一圖片:在生化電泳或是顯微照片中,將來自同一個樣品的部分圖片截切擷選出來,經過上下或左右翻轉之後,標示為不同的樣品或處理。
  3. 經過變造後使用同一圖片:這比前兩類更進一步,不僅截切圖片或改變位向,而且修改增刪了圖片的訊息:包括將某一部份圖片局部複製貼上、添加原本沒有的內容,或是塗色遮蔽、抹去某部分細節。

雖然無法確知出現這幾類圖片的確切因素,但可推想其動機的「惡意」顯然有別。第一類有可能是疏忽造成的,因為許多載入控制組的圖像十分類似,沒注意時確有可能誤用到同一張圖。但也可能是刻意的,作者有心挑選符合某種情況的圖片,來迎合自己的理論或期望的結果;或是根本沒做控制組的測試而便宜行事,挪用其他的結果來塘塞。至於第二類與第三類的圖片,都需經過後製加工處理,幾乎不可能是疏忽大意,刻意造假的成分甚高。當前臺大生醫論文爭議的案情,即因為遭檢舉論文中多個圖片,分別符合上述第一或第二種類型。

-----廣告,請繼續往下閱讀-----

這個研究指出早期問題圖片數量較少,但自 2003 年之後出現問題圖片的情況增多並大致維持一定比例。這趨勢可能與近年來數位影像處理的便捷與普及有關。而各期刊出現問題論文的比例差別甚大:表現最佳的如《細胞生物學期刊》(Journal of Cell Biology)只有 0.3% 有爭議,而《國際腫瘤學期刊》(International Journal of Oncology)則高達 12.4% 。概括來說,引用率高、影響因子(Impact Factor)高的科學引文索引(Science Citation Index, SCI)期刊,出錯比例愈低。這顯示期刊編輯團隊的管控與重視與否,直接影響了該期刊論文的真偽程度。

期刊編輯者的態度影響到品質管控,可拿《細胞生物學期刊》為典範來探究。早在 2004 年,該期刊就以專文探討數位圖片處理的準則。他們體認到當今分子生物與生化實驗的結果,常是膠體電泳或轉漬檢測的幾個顯影色帶,多一條少一條、顏色相對深淺就影響判讀結果,偏偏這些都可用影像軟體輕易地修飾。問題雖重要,但當時各期刊尚未把規範明確講清楚,所以《細胞生物學期刊》挺身而出訂定規則,並附上範例實驗來講解:

  1. 圖片整體調整是可接受的,但不可只修改一小部分。可利用軟體以線性方式把整體明暗對比調整清楚,但絕不能只選取某個區域而片面局部調整,這會被視為是造假。此外,若用到非線性的處理方式,應該註明清楚。
  2. 調整背景的對比亮度時,不應使得背景完全消失看不見,因為許多資訊細節可能就此被濾除。
  3. 不可把不同膠體使用的對照組剪貼到另一片膠體的圖中;不可以自行增添內容到圖片上,也不可以把自認多餘的的訊息抹去。
  4. 若因故要把數個小圖拼成一個大圖,不論是電泳圖片、轉漬檢測顯影或顯微照片,拼接的小圖之間要留下白邊作區隔,讓讀者知悉這些原始來源不同。
  5. 如果顯微照片上想顯示的某個結構或特徵不清楚,即使是確有其事,也不可自行描繪。應在旁加上箭頭或標記,或利用人工著色的方式來突顯。讓讀者得以了解要強調的重點為何,也能自行判斷真確與否。

而在 mBio 刊出的這篇研究中另指出 2 種圖片處理方式,作者雖未採計為有爭議但也特別指出要注意,這 2 種方式為「過度美化圖片背景」與「圖片拼接未標明」──這些都已在《細胞生物學期刊》的準則中。因此,目前早有明確的規範,只是學界同儕是否知悉?是否重視?是否真的自我要求、嚴謹遵守?此篇研究中也探討到論文中作者人數的多寡與是否出現問題圖片,兩者之間有無相關性。結果發現兩者並無關連,並未因為共同作者人數增多,在投稿前就能多幾個人仔細檢閱文稿,得以自己內控發現問題。這顯示當前生醫研究對內容的「量」要求愈來愈多、日益龐雜,因而要靠專業分工而造成零碎「片段化」:許多共同作者僅是負責其中一小部分的實驗或提供材料,無法掌握文稿整體。另一方面,這也是否暗示著無法負責或不具實質貢獻的共同作者,因為種種緣由而掛名其上的現象盛行?

值得警惕的是這篇研究的圖七: 3 位作者選定了發表於 PLOS ONE 這個開放取用之期刊上的論文為對象,以各國學者所發表的總論文數所占比例,與有疑義的論文數所佔比例來分析,有 3 國的爭議性論文之出現比例明顯偏高,分別是印度、中國、臺灣。

-----廣告,請繼續往下閱讀-----

回到本文最初的提問:生醫論文圖片造假確實是古今中外皆有,但是有的常出包,有的少犯錯。不幸地,臺灣就是常出包的慣犯。該地域研究的取材樣本或許不夠大,但應足以反映出部分實情。無獨有偶,近年來臺灣的工程學門也出現嚴重違反學術倫理的案例:有虛創假冒審查者帳號來自我審查論文的;有擅將他人論文改寫逕自列名發表且一稿多投的;也有提不出特殊關鍵實驗的原始數據、號稱數據來自神秘人士於神祕地點的產出,且對實驗細節毫無所知。這些匪夷所思的案例,已讓臺灣學界的聲譽受損。

再經過此篇研究,臺灣學界的某些造假歪風(或輕忽成習)的現況,更經過同儕審查認證了。人們會怎樣看待臺灣?為何導致如此?原因可能與當前政府獎勵學術發展的政策手段偏差,與大學經營的扭曲管理方針等結構問題糾纏在一起。個人或許無法扭轉,但若多數人都能正視此事,不再犬儒或鄉愿,或許能改變。既為身在學術圈裡的一員,不論是涉入、默許、旁觀、還是無感,你我都是共業一環。只想獨善其身,就莫怨嘆自己本分規矩做研究遭人連累。因為沒有內省檢討反叛與行動,覆巢之下,也是咎由自取。

參考資料:

  1. Bik, E.M., A. Casadevall, and F. C. Fang, The prevalence of inappropriate image duplication in biomedical research publications, mBio, Vol. 7(3):e00809-16, 2016.
  2. Rossner, M. and K. M. Yamada, What’s in a picture? The temptation of image manipulation, J. Cell Biol., Vol. 116: 11-15, 2004.

〈本文選自《科學月刊》2017年2月號〉

-----廣告,請繼續往下閱讀-----

什麼?!你還不知道《科學月刊》,我們47歲囉!入不惑之年還是可以當個科青

文章難易度
科學月刊_96
249 篇文章 ・ 3481 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。

1

2
0

文字

分享

1
2
0
論文騙局:故弄玄虛的用字,就算內容都是假的一樣可以發表?——《集體錯覺》
平安文化_96
・2023/01/13 ・2144字 ・閱讀時間約 4 分鐘

-----廣告,請繼續往下閱讀-----

精心策畫的論文騙局

1996 年,紐ㄝ大學物理學教授艾倫.索卡,在後現代研究期刊《社會文本》設計了一場論文騙局。圖/Envato Elements

一九九六年,紐約大學物理學教授艾倫.索卡(Alan D. Sokal)在後現代研究期刊《社會文本》(Social Text)上發表了一篇論文〈跨越邊界:朝向量子重力的轉形詮釋學〉(”Transgressing the Boundaries:Toward a Transformative Hermeneutics of Quantum Gravity” in the postmodern journal Social Text)。

根據論文摘要,你覺得這篇論文是在講什麼?

「本文的目標,是藉由探究量子重力的最新發展,進一步地深析指出,海森堡的量子力學和愛因斯坦廣義相對論,如今已經被合成和取代。本文將指出,在物理學的這項新興分支中,時空流形不再是客觀的物理實體;幾何學變成了仰賴脈絡的相對關係;過去科學的基本概念已經變成可以質疑的相對性範疇,就連存在本身也不例外。我認為這種觀念革命,對於後現代的自由科學,具有深遠意義。」

如果你覺得這整段話只是用一堆意義不明的術語堆砌起來的胡扯,恭喜你猜對了

-----廣告,請繼續往下閱讀-----

索卡教授瞎掰了一篇論文,投稿到《社會文本》期刊,六名編輯審查之後決定接受,當成嚴肅的學術著作放在該期刊的特刊。

然後索卡發文說整件事都是他設計的騙局。他之所以煞費苦心做這種事,是為了要證明很多學術界的人都會用故作高深的方式騙取名聲。

索卡教授為了證明學術界會用故作高深的方式騙取名聲。圖/Envato Elements

住在拉普達裡的學者

強納森.斯威夫特(Jonathan Swift)在一七二六年的《格列佛遊記》(Gulliver’s Travels)就諷刺過這種事情,故事中的天空之城拉普達,住著一群偏執的學者和理論家,整天只會研究一些脫離現實的沒用東西。

索卡跟斯威夫特一樣虛構了很多荒謬的東西來諷刺這種現象,他在論文中塞進許多解構主義的流行術語:「偶然的」(contingent)、「反霸權的」(counterhegemonic)、「知識論的」(epistemological)。事後他對《紐約時報》表示,「這篇文章是在刻意模仿某些學者胡亂引述數學與物理概念的行為。我把這些胡扯連在一起,然後發明一個說法去吹捧。整篇文章完全不需要符合任何知識標準,也不需要符合邏輯,所以超好寫的。」

索卡一邊諷刺文化研究與文學批評期刊那種用字吹毛求疵的無聊文化,一邊用詰屈聱牙的高深術語來諷刺那些學界的派系鬥爭。學界彼此批判時候很愛使用一些沒人看得懂的術語,經常搞到即使是同領域的學者,也看不懂作者在說什麼。

-----廣告,請繼續往下閱讀-----
索卡與《社會文本》高層兩方唇槍舌戰。圖/Envato Elements

事件發生之後,《社會文本》高層發表了一篇相當酸的回應:「索卡博士認為我們是知識相對主義者,他搞錯了。」共同創立該期刊的紐約大學教授史丹利.阿諾維茲(Stanley Aronowitz)表示,「而且這是因為他書讀得太少,學的東西也不夠多」。

索卡看到回應反唇相稽,「光是《社會文本》接受這篇文章,就已經證實那些後現代文學理論家的傲慢,已經誇張到可以無視邏輯。難怪他們從來不去問物理學家,那些引述物理的文字有沒有意義。在他們的世界裡,無法理解變成了某種美德;典故、隱喻、雙關語取代了證據跟邏輯。我的文章只是提供了一個例子,證明了這個流派多年以來的作風。」

學術界、法律界、醫學界這些白領人士,最容易被這種聲望連鎖反應所影響。當聲望決定一切,金字塔頂層的聲音就會過度放大,很多時候他們的說法可以廣傳,並不是因為說法有價值,而是因為其他人希望自己聽得懂他們在說什麼。即使其他專業人士聽不懂,通常也都會為了守住自己的飯碗而默默跟隨。

當聲望決定一切時,很多時候並不是因為說法有價值,而是其他人希望自己聽得懂他們在說什麼。圖/Envato Elements

扁桃體切除術就是個好例子。這種手術的效果欠缺科學根據,但因為「專業醫學意見」普遍認同,一度盛行了幾十年。在二十世紀最時興的時期,上百萬名兒童接受了扁桃體切除術,其中許多甚至因此受傷或死亡;直到某一天,醫學界才終於願意仔細檢查該手術的效果,然後很快就淘汰了它。

-----廣告,請繼續往下閱讀-----

當我們為了保障自身聲譽而服從權威時,我們會相信某一套既定的敘事,聽不進任何新資訊,所以很容易繼續以訛傳訛。這種時候,敘事的真假並不重要,因為在其他人眼中,我們這群附和的人都是專家,不太可能搞錯。

不過雖然以訛傳訛的效力很大,但它並非無懈可擊的高牆,反而更像一座疊疊樂——只要抽掉那根關鍵的木條,整座塔就會瞬間崩毀。

——本文摘自《集體錯覺:真相,不一定跟多數人站在同一邊!》,2022 年 12 月,平安文化出版,未經同意請勿轉載。

所有討論 1
平安文化_96
5 篇文章 ・ 3 位粉絲
皇冠文化集團旗下的平安文化有限公司以出版非文學作品為主,書系涵蓋心理勵志、人文社科、健康、兩性、商業……等,致力於將好書推廣給廣大讀者。

6

20
2

文字

分享

6
20
2
阿茲海默風暴:通訊作者的辯駁與責任
胡中行_96
・2022/07/28 ・3231字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

「關於《科學》…控訴我的前同事 Sylvain Lesné 博士可能篡改影像,我不予置評,畢竟後者正在接受明尼蘇達大學的正式調查。然而,文中的科學陳述我有意見,因為針對我的學理描述並不正確。」[1] 2022 年 7 月 21 日,知名期刊《科學》的新聞專題,指出影響深遠的 2006 年阿茲海默症論文造假,向全球醫療圈投下震撼彈。[2] 隔天當事人之一,明尼蘇達大學的 Karen Hsiao Ashe 教授親上火線,在阿茲海默症新聞論壇 Alzforum 上,發出嚴正聲明,同時引發學界熱烈討論。[1]

《自然》期刊 2022 年 7 月 14 日的(黃色底線)編按,提到正在調查遭質疑的圖像。
圖/參考資料 3(Screenshot used as fair dealing for news report.)

《科學》期刊報導,去年 8 月,二名希望 Cassava Sciences 製藥公司股票下跌,以從中獲利的投資人,[註] 透過律師聘雇時年 37 歲的范德比大學神經科學家 Matthew Schrag 。他們付了美金 1 萬 8 千元,要求調查該公司的阿茲海默症實驗藥物 Simufilam 。執行任務的過程中, Schrag 發現一篇 2006 年刊登於《自然》期刊的論文,十分可疑。[2] 該研究的第一作者是 Sylvain Lesné ,而 Karen Hsiao Ashe 則是通訊作者。[3]

明尼蘇達大學 Karen Hsiao Ashe 教授。圖/University of Minnesota(Image used as fair dealing for news report.)

Karen H. Ashe 教授是中國裔美國人,本姓蕭,但冠上第二任丈夫的姓氏 Ashe 。[4] 母親為生化學家袁昭穎(Joyce C.Y. Yuan),曾任諾貝爾得主 Alexander Todd 實驗室的訪問學者;[5] 父親則是明尼蘇達大學航太工程榮譽教授蕭之㑺(Chih Chun Hsiao),於兩次國共內戰之間移民美國,後來曾受邀赴共產中國教書,並致力於中美交流。[4, 6, 7] 不枉其家學淵源, Ashe 教授 3 歲立志當科學家, 17 歲跳級進入哈佛大學二年級就讀, 27 歲時不僅已經唸完哈佛大學醫學系,還取得麻省理工的博士學位。她曾追隨諾貝爾得主 Stanley Prusiner 教授進行腦部研究;後來在自己領導的團隊中,和法國科學家 Sylvain Lesné 合作阿茲海默症相關主題,[4] 還因此獲得重要獎項。[2] 2012 年明尼蘇達的世紀老報《明星論壇》,在專訪中更描述她多才多藝,且具有謙遜的中國傳統美德。[4]

明尼蘇達大學 Sylvain Lesné 副教授。
圖/University of Minnesota
(Image used as fair dealing for news report.)

在 2006 年《自然》期刊關鍵性的論文中, Lesné 和 Ashe 表示注射到腦袋裡的 Aβ*56 ,會令年輕小鼠失智,並認為此發現將有助未來的阿茲海默症研究。[2, 3] Aβ*56 唸作「 amyloid beta star 56 」,是一種 β 澱粉類蛋白(amyloid beta,縮寫成Aβ)。[2]如何減少 Aβ 的累積,至今仍是阿茲海默症研究的方向之一;[2, 8, 9] 而 Cassava Sciences 的 Simufilam ,則是以預防 Aβ 與特定受器結合,來達此效果[10, 11]

范德比大學神經科學家 Matthew Schrag 。
圖/Vanderbilt University Medical Center
(Image used as fair dealing for news report.)

這次新聞事件的吹哨者 Matthew Schrag ,此前就曾公開批評美國食品藥管理局,不該核准另一款抗 Aβ 藥物;而他自己的研究也與 Cassava Sciences 的主張相悖,認定 Simufilam 對受試者有弊無利。當 Schrag 開始懷疑 Lesné 不只是在 2006 年《自然》刊載的影像上動手腳,《科學》期刊請來 George Perry 和 John Forsayeth 等頂尖專家協助鑑定。他們均認同 Schrag 的看法,也就是對 Lesné 發表於超過 70 篇論文中的上百張影像存疑。[2]

-----廣告,請繼續往下閱讀-----

這把燒毀阿茲海默症重要研究根基的熊熊烈火,一發不可收拾,向四面八方蔓延開來。美國國家衛生研究院、《自然》、《神經科學期刊》、《PLOS ONE》,以及與《科學》同屬美國科學促進會的《科學信號》等單位,通通重新審視 Lesné 參與的論文,而且其中部份已遭撤回。 Schrag 批評這些錯誤資訊,不單浪費國家衛生研究院為數可觀的贊助經費,還被引用數千次,「因此誤導了整個學界。」另外,他也揪出 34 篇由其他作者撰寫,跟 Cassava Sciences 直接相關的問題論文,並上報國家衛生研究院。[2] 因此,那斯達克股票交易所警告投資人, Cassava Sciences (股票代號: SAVA )的情況岌岌可危。如果未來美國食品藥物管理局不批准 Simufilam ,其股價或許會慘跌至個位數字。[12]

儘管事件主要聚焦在 Lesné 上,就學術倫理來說,身為 2006 年那篇論文的通訊作者, Ashe 教授也得為研究品質負責。[13-15]面對「誤導整個學界」的指控,她在 Alzforum 上以自己過去發表的研究,說明 Aβ 分為第一型與第二型。當年害小鼠失智的 Aβ*56 ,屬於第一型;而第二型則是在類澱粉蛋白斑塊(amyloid plaques)中找到的。「後者是藥物研發者屢戰屢敗的目標。」Ashe 教授寫道:「從來就沒有臨床試驗針對第一型,但那才是我在研究中點出的失智關聯。」[1]

阿茲海默新聞論壇 Alzforum 上,Karen H. Ashe 教授和其他學者,對此事件公開表態。
圖/參考資料1(Screenshot used as fair dealing for news report.)

在 Ashe 教授的辯駁下方,有幾名學者留言強調學界不該以偏概全,為了一則新聞報導,抹滅相關研究的重要性。[1] 此外,目前仍在進行中的 Simufilam 臨床試驗,也與 Aβ*56 無關。他們當初挑選受試者的條件,包含某種蛋白質跟 Aβ42 的比例(CSF tau/Aβ42 ratio ≥ 0.28);[16] 所發表的論文,也是在分析是否能抑制 Aβ42 的負面影響。[10]

這是本文未提及,但也是針對 Aβ 的研究。由左至右: Aβ 逐漸累積成塊,右上為接受免疫療法的(灰色)神經元,右下則缺乏治療。
圖/Esang M and Gupta M. (2021) ’Aducanumab as a Novel Treatment for Alzheimer’s Disease: A Decade of Hope, Controversies, and the Future.’ Cureus, 13, 8, e17591. (CC BY 4.0)

然而,就因為阿茲海默症的藥物臨床試驗,都不是和 Aβ*56 直接相關,[11, 16] Ashe 教授便責無旁貸了嗎?美國軍醫學校的 David Brody 博士在 Alzforum 的討論串中提到,他的團隊以前試圖重複 Aβ *56 的研究,花了約一整年的時間,卻徒勞無功。[11] 《科學》也提及不少實驗室,遇到一樣的情形。[2] 這些想要以經典為基石向前邁進的人,都被謊言所羈絆,而使得醫學的進展停滯不前。失敗的研究當然不太有論文發表,[2] 更甭論人體臨床試驗。害大家耗費精力走冤枉路,難道不是對阿茲海默症研究的嚴重傷害?

「你可以靠作弊發表論文,獲取學位,贏得補助」, Schrag 對《科學》的記者說:「但你不能用欺騙來治癒疾病」。[2] 諷刺的是,十年前《明星論壇》也記錄了 Ashe 教授類似的談話。她當時鼓勵人們要勇於挑戰她,因為錯誤的理論「不會迎來解藥」。[4]

-----廣告,請繼續往下閱讀-----

  

備註

根據美國第一證券的解釋,「賣空」(short selling)的投資人會將非己有的股票售出,計劃未來以較低的股價買回。[17] (筆者完全沒聽懂為何這樣能獲利,還請會玩股票的讀者不吝指教,謝謝。)

參考資料

  1. Sylvain Lesné, Who Found Aβ*56, Accused of Image Manipulation (Alzforum, 2022)
  2. Charles Piller. (2022) ‘Blots On A Field?’ Science, 377, 6604.
  3. Lesné, S., Koh, M., Kotilinek, L. et al. (2006) ‘A specific amyloid-β protein assembly in the brain impairs memory’. Nature, 440, pp. 352–357.
  4. Dr. Karen Ashe: Stalking Alzheimer’s (Star Tribune, 2012)
  5. MCFGS ADVISORS (明州中国友好花园协会,accessed on 26 JUL 2022)
  6. CC Hsiao Memorial (The University of Minnesota Digital Conservancy, 2009)
  7. Changsha Garden History (明州中国友好花园协会,accessed on 26 JUL 2022)
  8. Multiple Dose Study of Aducanumab (BIIB037) (Recombinant, Fully Human Anti-Aβ IgG1 mAb) in Participants With Prodromal or Mild Alzheimer’s Disease (PRIME) (ClinicalTrials.gov, 2020)
  9. An Extension Study of V203-AD Study to Evaluate the Safety, Tolerability, Immunogenicity, and Efficacy of UB-311 (ClinicalTrials.gov, 2021)
  10. Wang HY, Bakshi K, Frankfurt M, et al. (2012) ‘Reducing Amyloid-Related Alzheimer’s Disease Pathogenesis by a Small Molecule Targeting Filamin A’. Journal of Neuroscience, 32, 29, pp. 9773-9784.
  11. Simufilam (Alzforum, 2022)
  12. 7 Meme Stocks Trading at a Massive Discount Right Now (Nasdaq, 2022)
  13. 想一想:共同作者是誰(臺灣學術倫理教育資源中心,accessed on 26 JUL 2022)
  14. 科技部對研究人員學術倫理規範(科技部,2017)
  15. Corresponding author defined (Springer, 2020)
  16. Simufilam (PTI-125), 100 mg, for Mild-to-moderate Alzheimer’s Disease Patients (ClinicalTrials.gov, 2021)
  17. 投資辭彙(FirstTrade,accessed on 28 JUL 2022)
所有討論 6
胡中行_96
169 篇文章 ・ 65 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

2

7
0

文字

分享

2
7
0
用 coding 寫出《鋼鐵人》的 AI 助理 Jarvis 有多難?——專訪臺大資工系陳縕儂副教授
科技大觀園_96
・2022/01/04 ・3527字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

近年來因為人工智慧、大數據、區塊鏈等應用科技快速發展,以及 Google 等科技公司大舉來到臺灣進駐並招聘大量軟體工程師,臺灣頂大的資工科系成為超熱門志願。不過大家對資工系的印象就是要學寫程式,也就是俗稱的 coding,但 coding 在解決什麼問題?今天我們訪問了臺大資工系的陳縕儂副教授,從老師的專業「自然語言處理」(Natural Language Processing,縮寫 NLP)做切入,來帶大家了解資工系究竟在解決什麼問題。

讓 AI 聽得懂人話,就是「自然語言處理」

陳縕儂老師的機器智慧與理解實驗室,主要是針對語言處理及對話系統相關技術進行研發,藉由機器學習技術,透過資料讓機器自動學習,理解人類語言並且進行適當的互動,目標是希望能讓機器的智能比肩人類,甚至超越人類。

陳縕儂教授與實驗室今年參加 Amazon Alexa Prize Taskbot 競賽的研究生們合影。(圖/陳縕儂提供)

「自然語言處理」是資工領域中的一個分支,名字聽起來很抽象,但其實這項學門的目標就是讓電腦可以「聽懂」人類說的話、「理解」語意並給予「回應」,就像鋼鐵人電影中的 AI 助理 Jarvis,鋼鐵人只要說如常說話就可以下達指令,讓 Jarvis 協助生活中各種大小事。

不過理想很飽滿現實卻很骨感,要做到像 Jarvis 這樣有求必應的 AI 助理並不容易,目前市面上的智慧助理如 Apple Siri、Google Assistant 及 Amazon Alexa 都已經隨著 3C 產品普及化了,但很多時候它們仍會說:「很抱歉,我聽不懂你的意思。」可見,從 Siri 到到 Jarvis 仍有很長的一段路要走,但為什麼這是條漫漫長路?——歡迎來到「自然語言處理」的思考領域。

-----廣告,請繼續往下閱讀-----

從「聽懂」到「回應」,AI 必須克服多項關卡

大家可以想像一下,今天要跟一個 AI 互動,通常是透過語音或者文字來下達指令,接著 AI 就會協助我們完成特定的任務,並解決特定的問題。

在這個過程中,有四個主要的環節必須克服,分別是語音辨識 (Automatic Speech Recognition; ASR)、語意理解 (Natural Language Understanding; NLU)、對話決策 (Dialogue Management)、以及語言生成 (Natural Language Generation; NLG),說的白話一點,就是接收你講的話、翻譯成 AI 能理解的指令、要如何處理指令,以及怎麼把回應翻譯成人類能聽懂的聲音或文字。

在這四個環節裡都有相當複雜的問題需要去解決,譬如語音辨識,在技術上通常是將語音訊號直接轉換成文字,讓 AI 去理解,但在將音訊輸入的過程中,就必須要排除掉我們口語中會用的「嗯」、「啊」、「喔」等贅字或不自然的停頓,又或者是新創的流行語、方言、口音……等等的問題必須先解決,才能讓 AI 真的能聽懂人類的自然語言。

在「語意理解」上,要讓 AI 去分析語言或文字的脈絡、理解關鍵字,再找出對應的資料(搜尋資料庫);而「對話決策」更是困難,前面理解了人類的語言或文字表意後,AI 應該要如何回應?可能使用者給的資訊不完整,AI 要追問使用者以釐清問題?又或者在語意理解上有聽不懂的字,得要再次詢問並確認?

-----廣告,請繼續往下閱讀-----

這還只是 AI 面對人類自然語言時,其中幾個回應的選項,真實的對話情境可能更加複雜,而且整個對話過程只要有一個環節正確度不夠高,那 AI 後續也很難準確的回應,只要有一步錯了,就會對後續對話體驗造成負面影響。

不過好消息是,現在的深度學習技術已經相當成熟,只要餵資料給電腦時,告訴他怎麼樣是對、怎麼樣是錯,基本上電腦都可以不斷修正(餵的資料也要夠多),再加上現行語言代表模型的優化,智慧 AI 在特定領域的應用上都有蠻不錯的成果。

AI 處理語音指令的過程。圖/陳縕儂提供

Jarvis 仍遙遠,AI 的新突破是精準翻譯

聊到這幾年 AI 的重要突破,老師提到三年前 Google 所開發的語言代表模型 BERT(Bidirectional Encoder Representations from Transformers),當時 BERT 一出現市面上所有自然語言處理的模型都改採用了它的運作邏輯。相較於過去的語言模型,通常都是餵指定任務的文字來訓練電腦,BERT 是在給電腦任務前,先餵它吃很多的文章或書,接著再提供任務給它。

以翻譯為例,這就好像讓一般人翻譯,跟讀過很多書的人來翻譯一樣,讀過很多書的人懂得字彙跟用法,自然翻譯出來的成品更流暢。

-----廣告,請繼續往下閱讀-----

而 BERT 的技術確實也得到相當好的成效,所以擊敗了當時許多正在開發的語言模型,成為了當前語言模型的基礎。有趣的是,BERT 的前身是一個名為 ELMo(Embeddings from Language Models,與芝麻街角色名字相同)的語言模型,所以 BERT 的開發者們就用芝麻街的角色,來為他們開發出來的語言模型命名。

當前 AI 發展的目標,為它建立「人的常識」

雖然說 NLP 領域在商業與學術上都有相當大的發展空間,但陳老師認為,目前要達到人的「common sense(常識)」對 AI 來說還是非常困難,舉例來說,今天我們跟智慧助理說我今天要跟某某人吃晚餐,這個時候如果是人類的助理,我們可能會聯想到「吃什麼」、「要不要聯絡某某人」、「交通方式是?」……等等與飯局相關的問題,但 AI 目前並沒有辦法執行這麼複雜的互動,還得必須跟 AI 說「幫我訂位」、「幫我叫車」,仍在一個指令一個動作的狀態,這種 AI「common sense」的建立,可說是目前非常有挑戰性的項目。

AI 的開發方向——人類的工作輔具

身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分,雖然說現階段許多人對於 AI 可以執行我們的工作感到彆扭,但實際上 AI 正在減輕我們的工作量,舉例來說,像是目前醫院已經有在使用協助診斷的 AI,但這樣的 AI 並不會取代醫生的工作,因為 AI 只是提供醫生診斷的相關依據,實務上對於病患的判斷最終還是得由醫生來做。

雖然 AI 已在產業中被廣泛利用,但基本上仍以「人機協作」為大宗,雖然能取代部分人力,但像是創造類型的工作 AI 就幾乎無法獨自完成。至於大家想像中,AI 恐對人類造成威脅的情節,基本上不會發生,因為 AI 是不會憑空出現意識的,AI 威脅人類的可能,比較會是人類不當利用造成的風險,所以在未來 AI 的開發上,基本上會往輔助人類的方向去做應用。

-----廣告,請繼續往下閱讀-----
身為 AI 的設計者,陳縕儂老師認為 AI 會成為輔助人類的一部分。圖/Pixabay

資工領域瞬息萬變,「喜歡新知」很關鍵

談到什麼特質適合來讀資工系,陳縕儂老師認為,數學或是邏輯只是基礎,重要的是「喜歡接受新知」的特質,因為在資工領域瞬息萬變,資訊更新的相當快速,隨時都會有新東西出來,如果不喜歡吸收新知識,讀資工系可能會比較痛苦一點。另外,資工在應用上時常會和不同領域的人做合作,你必須了解對方的需求跟他們的條件,才能設計出能夠幫別人解決問題的方法,而這也是資工有趣的地方。

陳縕儂老師也和我們分享了在他眼中臺灣學生和外國學生的差異,他認為臺灣學生應用網路資源自學的能力非常強,而外國學生則是勇於在課堂上和老師提問並討論,各有各的優點,不過教授也認為由於臺灣學生擅長自己找答案,所以在協作與表達上的可能相較於外國會比較弱一些,但如果這一塊能做到加強,臺灣的學生其實是非常有競爭力的。

陳縕儂副教授認為,臺灣學生在協作與表達上相較於外國學生較弱一些,但若能加強這一塊能力,臺灣學生非常有競爭力。圖/呂元弘攝

最後老師還告訴我們,當初大學時機器學習與 NLP 領域並不是資工領域的主流,一開始只是選擇了自己有興趣的領域,也沒想到近幾年 NLP 會變成現在的顯學,他認為自己真的非常幸運,可以一路延續自己熱愛的主題。

最後的最後,陳縕儂老師建議有意投入資工領域的學員們,可以先了解這個領域需要的先備知識,像是 coding 要用到的程式語言、跟 AI 相關的內容則會牽涉到數學,最後當然就是對知識的熱情和態度,了解之後才比較能判斷這個領域適不適合你,千萬不要因為從眾而選擇。

-----廣告,請繼續往下閱讀-----
所有討論 2
科技大觀園_96
82 篇文章 ・ 1124 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。