0

0
0

文字

分享

0
0
0

正義破表的論文打手:SCIgen

鄭國威
・2015/04/16 ・1633字 ・閱讀時間約 3 分鐘 ・SR值 590 ・九年級
si-robottyping
ANDREY VOSKRESSENSKIY/ISTOCK

這件事始於2005年,原本只是三位研究生的鬧劇而已。麻省理工學院(Massachusetts Institute of Technology)的電腦科學博士生傑里米.斯特里布林(Jeremy Stribling)、馬克斯.克倫(Max Krohn)和達納.阿瓜約(Dan Aguayo)編寫了一個程式SCIgen,它可以產生無意義的電腦科學研究論文。目前已為軟體工程師的斯特里布琳表示:「這個程式的目的是要揭發低質會議,這種會議缺乏同行審查,並以出版和開會費用詐騙研究人員。」

程式的使用者在短時間內遍布全球,而它自動產生的「傑作」更是被許多科學會議和期刊所接受。不過,如此打遍天下無敵手的SCIgen終於遇到了它的對手-SciDetect,學術出版商施普林格(Springer)利用這個開放原始碼的程式來自動偵測機械化產生的論文。(施普林格為學術出版巨頭,其總部設於德國海德堡,並在紐約設有電氣及電子工程師學會)

SCIgen使用「上下文無關文法」(context-free grammar)來生成詞彙,這些文句表面上看似合理,但實際上只需閱讀過便可以發現完全是一派胡言。以下為範例:

Cyberneticists agree that semantic modalities are an interesting new topic in the field of programming languages, and theorists concur. This is a direct result of the development of web browsers. After years of compelling research into access points, we confirm the visualization of kernels. Amphibious approaches are particularly theoretical when it comes to the refinement of massive multiplayer online role-playing games.

 

SCIgen也可以產生令人印象深刻但無意義的數據圖、流程圖和引文。他們投稿了三篇SCIgen論文至「世界系統學、控制論與信息學會議」(World Multiconference on Systemics, Cybernetics and Informatics,簡稱WMSCI),一場他們懷疑主辦方聲稱以同行審核呈件但實為詐欺的年度學術研討會。果不其然,其中的兩篇論文被WMSCI所接受。

後來,他們將SCIgen放上了網路供大眾免費使用,鼓勵研究人員自主性產生論文,並投稿至疑似低審查標準的會議,然後上網提交「戰績」。在過去的十年間,研究人員挖出了許多聲稱執行同行實質審查卻不然的期刊和會議,SCIgen也開始產生變異以應用在各個領域,從數學到後現代理論都逃不過它的「肆虐」。(作者延續了這個傳統,但使用了不同以往紙本的生成方式

出版商飽受這場鬧劇折磨直到2013年,在2008到2011年間共有85篇SCIgen論文被發表在24項不同的電腦科學會議中,但也有成功擋下的出版商,施普林格就退回了122篇無意義論文。此項調查背後的首席研究員,同時也是法國約瑟夫.傅立葉大學(Joseph Fourier University)電腦科學家的斯瑞爾.拉貝(Cyril Labbé)表示:「假論文除了製造鬧劇外,從中還發現有中國學者和學生買來擴充其出版紀錄。」隔年,《科學》(Science)便破獲了專門買賣假學歷的地下市場,其中一些小販會利用SCIgen來省下手寫「正宗」假論文的力氣。

為了終結這場噩夢,施普林格向拉貝求助。他提供了一個可以精準搜尋無意義論文的方法,此法需要類似偵測垃圾郵件的統計技術,但不是像Viagra一樣的語法模式。此交易結果被刊登在新聞上,也正式宣告了SciDetect的誕生,這個由拉貝研究團隊產生的程式,可以自動偵測由SCIgen和類似程式所產生的論文。它的目的為確保所有不公平、快速作弊的方式無所遁形。

但有些人認為SciDetect的產生並不是為了抓騙子,而是為了避免尷尬。在出版界擔任諮詢的獨立研究者菲利普.戴維斯(Philip Davis)認為:「正如有人利用SCIgen來揭露編輯的缺失和期刊的同行審查,任何具備些許英文水平的人都應該能夠發現這些SCIgen或類似軟體的傑作。對我來說,這似乎只是出版商保護自己、免於被期刊編輯退件的招數。」

arXiv的創辦人保羅.金斯帕格(Paul Ginsparg)則表示:「施普林格排除由軟體刻意產生的無意義論文是立意良善,但對於人類作者無意間產生的無意義文句該怎麼辦呢?」(arXiv免費提供演算法偵測無意義文句)而對此,施普林格的代表表示:「軟體的確無法取代同行審查和學術評價,但將SciDetect出借給出版商等同於多了一隻手,有助於打擊詐欺和偽造論文。」她也補充說道,自從2013年撤稿後,便再也沒有SCIgen亂碼文章提交至施普林格會議。

參考資料:

相關標籤: 論文 電腦
文章難易度
鄭國威
26 篇文章 ・ 0 位粉絲
愛吃愛玩愛科學,過著沒錢的快樂日子。


0

4
0

文字

分享

0
4
0

江山代有 B 肝出,各領風騷數千年—— B 型肝炎病毒的萬年演化史

寒波_96
・2021/10/22 ・4398字 ・閱讀時間約 9 分鐘

B 型肝炎是台灣很熟悉的傳染病,主要藉由血液、體液的交流傳染。它的歷史非常久遠,在世界各地普遍存在。新發表的論文報告:超過一萬年的人類遺骸中,已經能見到 B 型肝炎病毒(Hepatitis B virus,簡稱 HBV);各款遺傳品系萬年來起了又落,可謂各領風騷數千年。

古代 DNA 的研究,技術已經進步到可以由遺骸或環境樣本,定序裡頭所有的 DNA 片段。例如取自人類牙齒的樣本,定序不只能獲得人類的 DNA,也可能捕獲當事人生前口腔中的微生物。所以同一份樣本被定序後,可以進行不同目的之探索。

論文的 B 型肝炎病毒取樣地點、年代。A 為歐亞大陸的古代樣本,B 為美洲的古代樣本,C 為現代各地流行的基因型分布狀況。圖/參考資料 1

和人類一起移民美洲,獨立發展的 B 肝病毒

B 肝病毒以 DNA 為遺傳物質,被感染的人去世後,病毒的 DNA 可能保留在死人骨頭、牙齒中,因此有機會被偵測到。新問世的論文搜尋資料庫,在世界各地 137 個古代樣本中,偵測到 B 肝病毒的存在。

這批古代 B 肝病毒,年代介於距今 400 到 10500 年前,絕大部份位於歐亞大陸西部和美洲。將各款病毒擺在一起畫演化樹,美洲的古代病毒自成一群,和歐亞大陸的同類平行發展。

一直到數百年前歐洲人殖民以前,美洲的 B 肝病毒都自成一群,最古老的樣本距今約 9000 年,位於安地斯高地的 Cuncaicha 岩蔭遺址(CUN002)。

如今的 B 肝病毒被分為 10 種基因型,稱為 A 到 J 型。美洲流行的 H 型、F 型(genotype H、genotype F),便是這群病毒流傳至今的後裔。

現代、古代的 B 型肝炎病毒擺在一塊,畫出的演化樹。這兒估計的分家年代,相對比較晚。圖/參考資料 1

B 肝病毒的主要宿主是人類,大部分傳播會跟著人走。(北極區以外)美洲原住民的祖先從亞洲移民到美洲後,長期獨立發展,和其他地區缺乏交流。而美洲居民的 B 肝病毒也獨立演化超過一萬年,和人類遷徙、分家的狀況一致。

B 肝病毒在哪兒起源,有多資深?

美洲和歐亞大陸的 B 肝病毒,在什麼時候分家?論文對此不敢給出肯定的答案,也許是一萬多年前,也可能較接近兩萬年前。不過再怎麼說,都比智人祖先離開非洲的年代,要更晚許久。

過去有學者認為,B 肝病毒的歷史能追溯到數萬年前,智人離開非洲的時候。一大證據來自澳洲原住民感染的 C4 亞型(subgenotype C4),和同類分家 5 萬年之久。

但是這回估計 C4 資歷應該不超過 4500 年,遠遠比人類移民抵達澳洲的年代更遲。由此推論,C4 很可能是後來才抵達澳洲的。

根據現有資訊推敲,B 肝病毒的共同祖先頂多處於 2 萬年前。但是更早以前是否已經存在,卻在歷史洪流中失傳呢?目前無法判斷,需要更多樣本才能釐清。

傳染病同類的不同品系間競爭激烈,若是新秀徹底取代老將並不意外。B 肝病毒在歐洲一萬年來的發展史,便是鮮明的興替實例。

歐亞大陸西部不同年代,B 肝病毒的品系存在感,以及其演化關係。圖/參考資料 1

歐亞大陸西部,延續四千年的上古霸權

137 個樣本,大部分位於歐亞大陸西部,可以看出比較詳細的端倪。簡單說:江山代有病毒出,各領風騷數千年。

距今 9000 到 11000 年前,歐洲一帶有 2 款遺傳品系;隨後的 7500 到 9000 年前,其中一款完全消失(Mesolithic 1,下圖左紅色),只剩另外一款(Mesolithic 2,下圖紫色),最早出現在高加索北部,接著在歐洲各處,缺乏農業,不定居的採集狩獵族群中廣傳。

距今 7500 到 11000 年前之間,歐亞大陸西部的 B 肝病毒型號分佈。圖/參考資料 1

接下來四千年,也就是距今 3500 到 7500 年前,歐洲和中東幾乎完全被另一群病毒佔領(WENBA,下圖綠色)。論文推測此一品系,是在距今 8000 年過後的歐洲新石器時代,隨著中東農夫移民潮進入歐洲,廣傳各地。

歐洲最初的農夫移民源於安那托利亞(現在屬於土耳其),可是約一萬年前,唯一的安那托利亞樣本卻不屬於這款(上圖左淡紅色),不是 WENBA 品系的直系祖先。

可想而知,目前取樣很有限之下,無法精準判斷各品系起源的位置與年代。每個時期可能都有多款品系共存,我們只能見到,當時存在感比較高的少數代表。

距今 3000 到 7500 年前之間,歐亞大陸西部的 B 肝病毒型號分佈。圖/參考資料 1

距今約 5000 年前,青銅時代開始之際,歐洲又有大量移民湧入,能追溯到其東方的草原地區。但是人類族群的 DNA 組成明顯改變之際,B 肝病毒卻沒有變化。或許這時歐洲、草原流行的品系是同一款,你傳我,我傳你,還是看不出差別?

反正歐亞大陸西部在這四千年間,各地的人們不管生活方式、文化差異多大,大家都共享同一款 B 肝病毒!

B肝病毒的興替:霸權崩潰與轉移

盛極四千年的 WENBA 戰隊,距今 3300 年前過後卻幾乎消失。取而代之的是至今仍然存在的 A 型品系(Genotype A,上圖右紅色、下圖左紅色),已知樣本中距今 3500 到 5000 年前分佈於中東、高加索、歐洲東緣;隨後又前進歐洲,到 1500 年前還很有存在感。

接下來興起的是 D 型品系(Genotype D,下圖藍色),與 A 型共存一段時間後,從 1500 年前起成為歐亞大陸西部的新興霸權,從此一直延續到現代。

現代到距今 3000 年前之間,歐亞大陸西部的 B 肝病毒型號分佈。圖/參考資料 1

江山代有 B 肝出,WENBA 戰隊為什麼會徹底退出江湖呢?論文推測,多半和距今 3000 多年前的氣候、政治等劇變有關。

青銅時代晚期,地中海東部、中東一帶發生大規模的崩潰潮,周圍的歐洲、埃及動蕩不安(知名的特洛伊戰爭就發生在那個時期),數個重要的政權、勢力瓦解,社會秩序崩解。希臘的邁錫尼文明,黎凡特地區的烏加里特等城邦,安那托利亞的西臺帝國都不復存在。

在人類的經濟、政治強權崩潰,人群大洗牌的同時,B 肝病毒似乎也跟著霸權轉移。

青銅時代晚期的動盪局勢。圖/取自 wiki

上古霸權仍有後裔!卻是半殘的?

然而,在古代樣本沒有取樣到的地方,WENBA 戰隊仍有後裔持續傳承,衍生出 G 型品系(Genotype G)。如今它的存在感薄弱,遺傳多樣性很低,三千餘年來應該是悄悄地活著。

奇妙的是,G 型其實不算是健全的病毒,由於突變之故,它的核心蛋白(core protein)功能受到影響,而且無法生產「B 型肝炎 E 抗原(HBeAg)」,嚴重降低它的複製和感染能力。

曾經縱橫四千年的霸權,現存唯一後裔竟然是半殘的。但是 G 型也有其厲害之處:善於和其他病毒共生。現代的 G 型感染者,多數也同時是愛滋病患。而且 G 型品系的搭便車能力,很可能不是最近出現。

進一步考察非常驚人地發現,與其類似的突變缺失,其實古代樣本中相當常見:距今 3500 到 7000 年前,總共有 14 款略有差異的 B 肝病毒具有這些缺陷。

已知歐亞大陸西部的 83 位古代 B 肝宿主中,高達 22 人同時感染有缺失的病毒,以及健全的另一款品系(包括目前主流之一的 A 型)。半殘的 G 型品系似乎就靠著搭便車,一路前進到現在。

B 肝病毒的蛋白質組成。HBeAg 是關鍵成分,但是 G 型品系無法生產。圖/取自 wiki

B型肝炎的歷史,也是全人類的歷史

感染 B 肝病毒多半不會致命,長期帶原卻會影響健康,有時候後果非常嚴重,因此被列為公衛計畫的打擊目標。台灣成功根除 B 肝病毒,是偉大的公衛成就,每一位居民都因此受益。

上萬年來普遍與人共生的 B 肝病毒,其歷史也是人類的一部分歷史。至今古代 B 肝病毒的研究,取樣幾乎都來自美洲和歐亞大陸西部,其餘地區如東亞、東南亞、非洲的樣本極少。B 肝病毒在這些地方如何演化,也令人好奇。

延伸閱讀

參考資料

  1. Kocher, A., Papac, L., Barquera, R., Key, F. M., Spyrou, M. A., Hübler, R., … & Moiseyev, V. (2021). Ten millennia of hepatitis B virus evolution. Science, 374(6564), 182-188.
  2. Study traces the evolution of the hepatitis B virus from prehistory to the present

本文亦刊載於作者部落格《盲眼的尼安德塔石匠》暨其 facebook 同名專頁

寒波_96
156 篇文章 ・ 376 位粉絲
生命科學碩士、文學與電影愛好者、戳樂黨員,主要興趣為演化,希望把好東西介紹給大家。部落格《盲眼的尼安德塔石器匠》、同名粉絲團《盲眼的尼安德塔石器匠》。
網站更新隱私權聲明
本網站使用 cookie 及其他相關技術分析以確保使用者獲得最佳體驗,通過我們的網站,您確認並同意本網站的隱私權政策更新,了解最新隱私權政策