分享本文至 E-mail 信箱

學術引用格式

MLA (點一下全選)

APA (點一下全選)

EndNote(.enw)

若腸病毒和登革熱上熱搜排行榜,那可就糟了!

啊?為什麼Google會比疾病管制署還早知道登革熱正在流行?

腸病毒
根據〈台灣流感疫情也可以問問Google大神!〉一文,我們發現了民眾非常仰賴 Google,連生病了也會用 Google 查症狀。因此當感冒的人多了,在網路上查詢「發燒」的活動強度跟著提高,讓特定關鍵字的搜尋熱門度,成了疫情變化的指標[1]。

對防疫人員來說,在傳染病肆虐之時,能夠越早掌握疫情的情況越好,但在傳統的疾病檢測技術上,從送檢到確診耗時費日,甚至可能會長達兩周以上(圖 1、表 1),此拖延在流行病爆發之際是難以避免的致命傷 [註1]。

然而如圖 1 所示,患者會因為發燒、痠痛而搜尋特定關鍵字,醫師也會利用 Google 等網路工具來查詢患者的症狀,因此網路活動的變化會立即地(Google 幾乎可提供當日的數據)反應出民間和第一線醫院的嚴重度。反觀傳統的實驗室檢測,一般有 1~5 日的等待期,但在少數特殊案例,也可能會出現長達 20 日的等待期。而此空窗期正好可透過分析網路活動的變化來彌補,以達到掌握疫情和輿論之功效!

疫情1

圖 1:分析網路活動量和傳統疾病檢測互相搭配,可彌補檢測等待期。圖/ 張昱維、蔣維倫

圖片1

表 1:各疾病的送檢與檢測時間。圖/中華民國疾病管制署署長信箱回應

腸病毒熱搜,急診病患也變多

在台灣,腸病毒通常是 4 月開始延燒,約莫 9 月結束,從圖 2 歷年來的急診比例變化中即可看出此現象。而我們使用了「腸病毒」和「水泡」關鍵字來觀察網路搜尋強度 [註2],可以發現到「腸病毒」(藍色線)的變化趨勢,似乎和該年感染腸病毒而掛急診的人潮有正比的關係。而經由統計分析後發現(圖 3),兩組數據在歷年的線性關係都極高,除 2016 年以外,其餘四年的 R線性值皆大於 0.8,而 pearson 相關係數也呈現類似趨勢。顯示就腸病毒而言,觀察網路活動的變化,的確能協助評估腸病毒在台灣肆虐的嚴重程度

搜尋「腸病毒」的變化趨勢,和感染腸病毒掛急診的患者比例變化趨勢,有很高程度的相關。

疫情2 疫情3 疫情4 疫情5

疫情6

圖 2:2012 年至 2016 年的各週裡,台灣急診因腸病毒而前往求診的比例(柱狀圖),以及關鍵字在網路的搜尋強度(線性圖)。

 

疫情7

圖 3:2012 年至 2016 年,以急診因腸病毒而前往求診的比例,和關鍵字在網路的搜尋強度,這兩組數據的相關性。

登革熱大流行年,搜尋量才會跟上疫情

登革熱在台灣的疫情表現,和腸病毒完全不同。通常從該年的 9 月開始延燒,若疫情嚴重時,甚至會持續到翌年 1 月(為什麼跟氣溫不是正相關呢?不懂啊…… O_O)。而雖然登革熱在南台灣看似很嚴重,但事實上,僅有 2014 年高雄和 2015 年台南大爆發算是比較顯著的大流行。

圖 4 顯示了自 2012 年以來每週通報的登革熱患者人數,以及「登革熱」和「關節痛」關鍵字的網路搜尋強度 [註2]。可以發現到在爆發大流行的 2014 年、2015 年,每週通報患者數和「登革熱」(紅色線)的變化趨勢,似乎有正比的關係未爆發大流行的 2012 年、2013 年則看不出明顯的連動關係。而統計分析的結果和圖 4 類似,「登革熱」的搜尋強度和新增患者人數,在爆發大流行的那兩年都有高度的線性關係( R線性值皆大於 0.7,而 pearson 相關係數大於 0.8),但未爆發流行的年份則呈現低度相關。顯示就登革熱而言,在疫情爆發的年份,觀察網路活動變化,的確能協助評估登革熱的嚴重程度;在沒有大流行的年份,網路活動和疫情並沒有連動效果

登革熱在大流行年份(2014、2015),網路搜尋關鍵字「登革熱」的趨勢,才會與通報患者趨勢相似。

15-16 14-15 13-14

12-13

圖4:2012 年至 2015 年的各週裡,台灣通報感染登革熱的人數(柱狀圖),以及關鍵字在網路的搜尋強度(線性圖)。

 

圖5

圖5:2012 年至 2015 年,以台灣通報染登革熱人數,和關鍵字在網路的搜尋強度,這兩組數據的相關性。

用網路活動評估宣導成效

我在研究今年的腸病毒數據時發現了一個有趣的現象,關鍵字「腸病毒」在 03/15~03/18 時,網路活動的強度突然提高(圖6),但當時並沒有爆發腸病毒流行。那麼是什麼因素所致呢?

深入調查後發現,疾病管制署在 3/15 發布新聞稿,警告台灣今年可能有腸病毒 71 型的大流行(圖7),而自03/15~03/18 間,疾病管制署的新聞稿顯然收到了相當好的宣傳效果!許多民眾因此開始關心、研究腸病毒的知識,因此在網路上可以觀察到一波搜尋的高峰。所以我們可以知道,分析網路活動強度的變化,不僅能夠觀察疫情的嚴重程度,更重要的是能夠評估、量化政府、企業業主的宣傳成效,進一步的判斷未來的策略規劃!

圖6

圖6:2016/01/03至08/06,關鍵字「腸病毒」在網路的搜尋強度。

圖7

圖7:2016/03/15,疾病管制署在今年首次發佈台灣可能會發生大流行的新聞稿。

接下來還可以做什麼?

本文僅利用了 Google 的數據,因此難免會有疏失之處。在未來,應該結合 Yahoo 搜尋和其他論壇、社交平台的統計數據,才能夠更全面地了解重大事件對民眾的影響,以獲得更精密的資訊!

此外,知名期刊《臨床傳染病》(Clinical Infectious Diseases)也曾在 2012 年發表網路活動和急診壅塞程度的相關研究,顯示可從網路活動的變化,推估市區內急診壅塞的程度 [2]。因此未來應該要開放式地嘗試各種臨床資料和網路數據結合的能力(沒錯,我想說的就是開放資料/Open Data,讓更多人想像可以怎麼玩!),以期達到各種有利於台灣醫療的效果。

  • 本文感謝 UDN 聯合報系媒體創新研發中心研究員和 OmnInsight 公司的 CEO 陸子鈞、鍾采芳、衛生福利部台東醫院檢驗科張昱維(Yu-Wei Chang)和衛生福利部疾病管制署副署長羅一鈞醫師協助

註:

  1. 用 Google 評估疫情會受到許多因素影響,如媒體大量報導時,因個人興趣而查詢特定關鍵字的民眾會變多,導致搜尋熱門度趨勢受到影響。因此群眾行為模式並不能完全取代現行的機制。所以本文著重於提供「不同面向的參考」,最準確的疫情掌握仍需仰賴實驗室的檢驗報告。
  2. 我也用了其他症狀的關鍵字,但為了提高易讀性,因此在本文中僅提到少部份的研究

參考文獻

  1. Chiang Wei-Lun. (2016, April 20). 台灣流感疫情也可以問問Google大神!. PanSci 泛科學. Retrieved August 14, 2016 from pansci.asia/archives/96812
  2. Dugas AF, Hsieh YH, Levin SR, Pines JM, Mareiniss DP, Mohareb A, Gaydos CA, Perl TM, Rothman RE. Google Flu Trends: correlation with emergency department influenza rates and crowding metrics. Clinical Infectious Diseases 54 (2012) 463-469. DOI: 10.1093/cid/cir883

關於作者

Chiang Wei-Lun

Wei-Lun

蔣維倫。喜歡虎斑、橘子、白底虎斑、三花貓。曾意外地先後收集到台、清、交三間學校的畢業證書。泛科學PanSci專欄作家、上下游新聞市集公民寫手、故事專欄作家。 文章作品:http://pansci.asia/archives/author/miss9 https://www.newsmarket.com.tw/blog/author/miss9ch/