0

0
0

文字

分享

0
0
0

若腸病毒和登革熱上熱搜排行榜,那可就糟了!

miss9_96
・2016/09/03 ・3063字 ・閱讀時間約 6 分鐘 ・SR值 557 ・八年級

啊?為什麼Google會比疾病管制署還早知道登革熱正在流行?

腸病毒
根據〈台灣流感疫情也可以問問Google大神!〉一文,我們發現了民眾非常仰賴 Google,連生病了也會用 Google 查症狀。因此當感冒的人多了,在網路上查詢「發燒」的活動強度跟著提高,讓特定關鍵字的搜尋熱門度,成了疫情變化的指標[1]。

對防疫人員來說,在傳染病肆虐之時,能夠越早掌握疫情的情況越好,但在傳統的疾病檢測技術上,從送檢到確診耗時費日,甚至可能會長達兩周以上(圖 1、表 1),此拖延在流行病爆發之際是難以避免的致命傷 [註1]。

然而如圖 1 所示,患者會因為發燒、痠痛而搜尋特定關鍵字,醫師也會利用 Google 等網路工具來查詢患者的症狀,因此網路活動的變化會立即地(Google 幾乎可提供當日的數據)反應出民間和第一線醫院的嚴重度。反觀傳統的實驗室檢測,一般有 1~5 日的等待期,但在少數特殊案例,也可能會出現長達 20 日的等待期。而此空窗期正好可透過分析網路活動的變化來彌補,以達到掌握疫情和輿論之功效!

疫情1
圖 1:分析網路活動量和傳統疾病檢測互相搭配,可彌補檢測等待期。圖/ 張昱維、蔣維倫
圖片1
表 1:各疾病的送檢與檢測時間。圖/中華民國疾病管制署署長信箱回應

腸病毒熱搜,急診病患也變多

在台灣,腸病毒通常是 4 月開始延燒,約莫 9 月結束,從圖 2 歷年來的急診比例變化中即可看出此現象。而我們使用了「腸病毒」和「水泡」關鍵字來觀察網路搜尋強度 [註2],可以發現到「腸病毒」(藍色線)的變化趨勢,似乎和該年感染腸病毒而掛急診的人潮有正比的關係。而經由統計分析後發現(圖 3),兩組數據在歷年的線性關係都極高,除 2016 年以外,其餘四年的 R線性值皆大於 0.8,而 pearson 相關係數也呈現類似趨勢。顯示就腸病毒而言,觀察網路活動的變化,的確能協助評估腸病毒在台灣肆虐的嚴重程度

搜尋「腸病毒」的變化趨勢,和感染腸病毒掛急診的患者比例變化趨勢,有很高程度的相關。

疫情2 疫情3 疫情4 疫情5

疫情6
圖 2:2012 年至 2016 年的各週裡,台灣急診因腸病毒而前往求診的比例(柱狀圖),以及關鍵字在網路的搜尋強度(線性圖)。

 

疫情7
圖 3:2012 年至 2016 年,以急診因腸病毒而前往求診的比例,和關鍵字在網路的搜尋強度,這兩組數據的相關性。

登革熱大流行年,搜尋量才會跟上疫情

登革熱在台灣的疫情表現,和腸病毒完全不同。通常從該年的 9 月開始延燒,若疫情嚴重時,甚至會持續到翌年 1 月(為什麼跟氣溫不是正相關呢?不懂啊…… O_O)。而雖然登革熱在南台灣看似很嚴重,但事實上,僅有 2014 年高雄和 2015 年台南大爆發算是比較顯著的大流行。

圖 4 顯示了自 2012 年以來每週通報的登革熱患者人數,以及「登革熱」和「關節痛」關鍵字的網路搜尋強度 [註2]。可以發現到在爆發大流行的 2014 年、2015 年,每週通報患者數和「登革熱」(紅色線)的變化趨勢,似乎有正比的關係未爆發大流行的 2012 年、2013 年則看不出明顯的連動關係。而統計分析的結果和圖 4 類似,「登革熱」的搜尋強度和新增患者人數,在爆發大流行的那兩年都有高度的線性關係( R線性值皆大於 0.7,而 pearson 相關係數大於 0.8),但未爆發流行的年份則呈現低度相關。顯示就登革熱而言,在疫情爆發的年份,觀察網路活動變化,的確能協助評估登革熱的嚴重程度;在沒有大流行的年份,網路活動和疫情並沒有連動效果

登革熱在大流行年份(2014、2015),網路搜尋關鍵字「登革熱」的趨勢,才會與通報患者趨勢相似。

15-16 14-15 13-14

12-13
圖4:2012 年至 2015 年的各週裡,台灣通報感染登革熱的人數(柱狀圖),以及關鍵字在網路的搜尋強度(線性圖)。

 

圖5
圖5:2012 年至 2015 年,以台灣通報染登革熱人數,和關鍵字在網路的搜尋強度,這兩組數據的相關性。

用網路活動評估宣導成效

我在研究今年的腸病毒數據時發現了一個有趣的現象,關鍵字「腸病毒」在 03/15~03/18 時,網路活動的強度突然提高(圖6),但當時並沒有爆發腸病毒流行。那麼是什麼因素所致呢?

深入調查後發現,疾病管制署在 3/15 發布新聞稿,警告台灣今年可能有腸病毒 71 型的大流行(圖7),而自03/15~03/18 間,疾病管制署的新聞稿顯然收到了相當好的宣傳效果!許多民眾因此開始關心、研究腸病毒的知識,因此在網路上可以觀察到一波搜尋的高峰。所以我們可以知道,分析網路活動強度的變化,不僅能夠觀察疫情的嚴重程度,更重要的是能夠評估、量化政府、企業業主的宣傳成效,進一步的判斷未來的策略規劃!

圖6
圖6:2016/01/03至08/06,關鍵字「腸病毒」在網路的搜尋強度。
圖7
圖7:2016/03/15,疾病管制署在今年首次發佈台灣可能會發生大流行的新聞稿。

接下來還可以做什麼?

本文僅利用了 Google 的數據,因此難免會有疏失之處。在未來,應該結合 Yahoo 搜尋和其他論壇、社交平台的統計數據,才能夠更全面地了解重大事件對民眾的影響,以獲得更精密的資訊!

此外,知名期刊《臨床傳染病》(Clinical Infectious Diseases)也曾在 2012 年發表網路活動和急診壅塞程度的相關研究,顯示可從網路活動的變化,推估市區內急診壅塞的程度 [2]。因此未來應該要開放式地嘗試各種臨床資料和網路數據結合的能力(沒錯,我想說的就是開放資料/Open Data,讓更多人想像可以怎麼玩!),以期達到各種有利於台灣醫療的效果。

  • 本文感謝 UDN 聯合報系媒體創新研發中心研究員和 OmnInsight 公司的 CEO 陸子鈞、鍾采芳、衛生福利部台東醫院檢驗科張昱維(Yu-Wei Chang)和衛生福利部疾病管制署副署長羅一鈞醫師協助

註:

  1. 用 Google 評估疫情會受到許多因素影響,如媒體大量報導時,因個人興趣而查詢特定關鍵字的民眾會變多,導致搜尋熱門度趨勢受到影響。因此群眾行為模式並不能完全取代現行的機制。所以本文著重於提供「不同面向的參考」,最準確的疫情掌握仍需仰賴實驗室的檢驗報告。
  2. 我也用了其他症狀的關鍵字,但為了提高易讀性,因此在本文中僅提到少部份的研究

參考文獻

  1. Chiang Wei-Lun. (2016, April 20). 台灣流感疫情也可以問問Google大神!. PanSci 泛科學. Retrieved August 14, 2016 from pansci.asia/archives/96812
  2. Dugas AF, Hsieh YH, Levin SR, Pines JM, Mareiniss DP, Mohareb A, Gaydos CA, Perl TM, Rothman RE. Google Flu Trends: correlation with emergency department influenza rates and crowding metrics. Clinical Infectious Diseases 54 (2012) 463-469. DOI: 10.1093/cid/cir883

數感宇宙探索課程,現正募資中!

文章難易度
miss9_96
169 篇文章 ・ 536 位粉絲
蔣維倫。很喜歡貓貓。曾意外地收集到台、清、交三間學校的畢業證書。泛科學作家、科學月刊作家、故事作家、udn鳴人堂作家、前國衛院衛生福利政策研究學者。 商業邀稿:miss9ch@gmail.com 文章作品:http://pansci.asia/archives/author/miss9


0

0
0

文字

分享

0
0
0

遲來報到的質數——《數學,這樣看才精采》

天下文化_96
・2022/05/20 ・2868字 ・閱讀時間約 5 分鐘

2013 年國際數學界最轟動的新聞,應屬中國留美學者張益唐在孿生質數問題上所作出的突破。他個人的經歷更增加了整件事的傳奇性。

數學家張益唐。圖/VOA, 公有領域

張益唐雖然是北大數學系的高材生,但是 37 歲從美國普渡大學拿到博士學位之後,因與指導教授意趣不合,一時在學界無法發展,多年靠打工餬口。1999 年才好不容易至新罕布夏大學數學系任講師。在張益唐長期不得意的歲月裡,他雖然沒有發表什麼數學論文,但是也不曾喪失志氣,還是堅持研究自己喜歡的數學問題。

張益唐在 58 歲暴得大名,各種獎項與頭銜接踵而來,在最是少年逞英豪的數學世界裡,真成為一個異數。英國數學家哈代在他著名的小冊子《一個數學家的辯白》裡曾說:「我不知道有任何一項數學的主要進展,是由超過五十歲的人所啟動。」張益唐正好給哈代的偏見一個反例。

張益唐研究的是關於質數的性質。

一個自然數 p 是質數(也稱為素數)的條件有二:其一,p 大於 1;其二,除了 1 與 p 自己之外,沒有別的自然數能整除 p。全體質數可以從小到大排成一個數列 2, 3, 5, 7, 11, 13, …,通常把排在第 n 個位置的質數記作 pn。如果 pn 與 pn+1 相差為2,則稱質數對 (pn, pn+1) 為一對孿生質數,例如 3 與 5,5 與 7,11 與 13。

圖/envato elements

「孿生質數猜想」就說這樣的質數對有無窮多組。因為古希臘的歐幾里得在他的巨著《原本》裡,曾經證明質數有無窮多個,所以有人以為也是歐幾里得最先提出孿生質數猜想。其實不然,目前從文獻中所見, 1879 年英國數學家格萊舍(James Whitbread Lee Glaisher)在《數學信使》(Messenger of Mathematics)雜誌上的一篇文章,才是第一次將孿生質數猜想見諸文字。

張益唐的大突破是證明有無窮多組質數對 (pn, pn+1) 使得 pn 與 pn+1 相距不超過 7 千萬。

為什麼這是一個大突破呢?因為在張益唐之前,不管給出什麼固定數 m,完全不知道相差在 m 之內的質數對,到底是有限多個還是無窮多個。自從 2013 年 5 月他的成就在國際媒體上廣為流傳之後,世界上很多數學家努力要把 7千萬的差距往下壓縮,目前已經改善到 246 之內。但是距離孿生質數猜想所需的 2,還有巨大而艱困的鴻溝。

一般人從媒體得知張益唐對數學做出了重大貢獻,可能會好奇問他的結果有什麼用?這裡「用」當然是指實際的應用。其實,他的成果目前還只有純學術價值,與國計民生毫不相干。自從古希臘人辨識出質數,在兩千多年的時間裡,除了數學家關心質數外,質數一直缺乏任何應用價值。二十世紀電腦發達之後,才利用因數分解成質數的超級困難特性,產生了某些幾乎無法有效破解的密碼系統,廣泛的應用到金融、通信、資料保密上。

圖/envato elements

在中國古算裡缺席?

一個基本的數學概念,經歷了兩千多年的滄桑,才顯現出它的實用價值,這不是一件平凡的成就。因此,我們不得不佩服希臘人研究質數的真知灼見,並且感嘆十八世紀前的中國傳統數學裡卻不見質數的蹤跡。質數為什麼會在中國遲來報到?實在是一個令人費解的現象。

歐幾里得的《原本》約在西元前 300 年左右成書,是古希臘數學集大成之作。第七卷討論數的性質,是使用幾何的觀點來理解數。也就是從「單位」的概念出發,以度量直線段的方式引入「數」。第七卷定義 2 說「一個數是由許多單位合成的。」因此,1 代表單位而不算作「數」。定義 11 說「質數是只能為一個單位所量盡者。」定義 16 說「兩數相乘得出的數稱為面,其兩邊就是相乘的數。」所以質數只能是線,而不能稱為面。

歐幾里德畫像。圖/wiki, 公有領域

從這些定義可看出來,古希臘人所謂的「數」是依附在幾何的體系裡而得以操作。中國古代缺乏像《原本》這種按照邏輯次序鋪陳結果的數學書,通常是以解決實際問題的風貌來書寫,因此不太可能探討與闡述「數」的純粹性質。

例如,以《九章算術》為代表的中國古算裡,數字是與矩形、直角三角形的面積緊密相連結,但卻沒有像希臘人那樣分辨,有些數是可以表現為面,而有些數卻不可以。

也許古代中國缺乏一項歐幾里得所擁有的知識背景,因而造成了雙方關注問題的差異。古希臘有一位重要的哲人德謨克利特(Democritus),他主張萬物皆由不可分割的「原子」所構成。在「原子論」的知識背景下,數目 1 就不會與其他數目等量齊觀了,1 是「單位」,是數的「原子」。

圖/envato elements

中國古代沒有明確的「原子論」,《墨子.經說下》所說:「非半,進前取也。前,則中無為半,猶端也。」其中切得不能再切的「端」在《墨子.經說上》解釋為「端,體之無序而最前者也。」也只是類似「原子」的概念,並未發展到德謨克利特的思想程度。「原子論」思想的欠缺,或許是質數在中國古算裡缺席的因素之一。

難以望其項背

康熙敕編的《御製數理精蘊》(簡稱《數理精蘊》)是融合中西數學的百科全書,其中將質數譯為「數根」,並且在附表〈對數闡微〉中列有質數表。雖然質數已經在中國現身,但是數學家並沒有感到相見恨晚而深入探討。

晚清數學名家李善蘭在翻譯歐幾里得《原本》後九卷時,第一卷第一界說為:「數根者唯一能度而他數不能度」,也把質數翻譯成「數根」。

數學家李善蘭。圖/傅任敢 《中華教育界》 1936 -1937年, 公有領域

李善蘭很可能受《數理精蘊》的影響,而去研究判別給定數是否為質數的方法。英國傳教師偉烈亞力(Alexander Wylie)將其中一法,以給編輯的信公布在香港一家英文雜誌上,其敘述為「以 2 的對數乘給定的數,求出其真數,以 2 減同數,以給定數除餘數,若能除盡,則給定數為質數;若不能除盡,則不是質數。」

此命題常被稱為「中國定理」,其實是歐洲早已知道的「費馬小定理」的逆命題,該定理斷言若 p 為質數,則 2p − 2 ≣ 0 (mod p)。

其實李善蘭的方法並不永遠正確,例如:2341 − 2 是 341 的整倍數,但是 341 = 11 × 31 並不是一個質數。1872 年李善蘭在《中西聞見錄》報刊發表了〈考數根法〉一文,成為清末關於質數研究的重要成果,但是他並沒有收錄「中國定理」,應該是他已經知道命題並不為真。

要知道李善蘭與高斯的生命是有重疊的時期,因此當西方以質數為基礎所建立的數論,已經繁複深刻美不勝收之時,也許連李善蘭都不曾完全清楚中國落後的程度是多麼巨大!


數感宇宙探索課程,現正募資中!

天下文化_96
9 篇文章 ・ 7 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。