分享本文至 E-mail 信箱

學術引用格式

MLA (點一下全選)

APA (點一下全選)

EndNote(.enw)

台灣流感疫情也可以問問Google大神!

今(2016)年年初,台灣各地出現流感病例,疫情在春節期間達到高峰,急診就醫的民眾超過上萬人,併發重症者將近兩千人。面對瞬息萬變的疫情,除了仰賴疾病管制署(以下稱疾管署)每週的疫情報導,難道沒有更快速的評估方法嗎?

google-485611_640

用 Google 評估疫情研究登 Nature 期刊

現代人喜歡任何事都問問看 Google,甚至連生病了也會用 Google 查查症狀。因此當感冒的人多了,使用 Google 查詢「發燒」或「咳嗽」的民眾也跟著變多,讓特定關鍵字的搜尋熱門度,成了疫情變化的指標。2009 年在「自然(Nature)」期刊上發表了一篇以上述理論為基礎的評估系統,並且對照 2008 年真實爆發的流感病例,該系統的表現令人激賞,預測的數值和真實的病情呈現超高度的正相關(請參考表 1。該系統在評估 2008 年疫情的表現上,相關係數高達 0.85)[1]!

表 1:相關係數等級 [2]

正相關係數(介於1~0之間) 等級
≧0.8 超高度相關(excellent correlation)
0.8~0.6 高度相關(good correlation)
0.6~0.4 中度相關(moderate correlation)
<0.4 低度或無相關(poor correlation)

為什麼要用 Google 協助評估疫情?

640px-thumbnail

圖/wikipedia,由U.S. Navy photo by Mass Communication Specialist 3rd Class Jake Berenguer,公有領域。

正式的疫情統計方式,是由醫院採集患者檢體,再送交實驗室檢驗,確診後再回報給疾管署,最後再由政府每週公佈上週的確診病例數。可以預料的是,這套系統雖然可靠,但作業時間曠時費日(如 PCR 等檢驗需數日的時間),面對發展迅速的流行病,難免會有慢半拍的疑慮。而 Google 利用群眾的行為模式進行評估,不但隨時都是最新的資訊(Google Trend 每分鐘更新一次),並且所有人都能使用,更重要的是省卻了曠時費日的檢驗、公文流程,在面對瞬息萬變的疫情時,提供了另一種角度的疫情參考。因此 Google 設立了專門的流感統計系統—— Google Flu Trend,用來協助各國預警可能襲來的全球大流感。

但 Google Flu Trend 的評估規模是如美國、澳洲等大國,台灣是個相對小型的國家,並且 Google Flu Trend 也沒有提供中文關鍵字的資訊,難道台灣不能用 google 來協助評估疾病了嗎?讓我們改用 Google 趨勢(Google Trend)的關鍵字搜尋熱門度,來分析看看今年的流感疫情!

(J 編註:目前 Google Flu Trend 已經停止服務,但舊的資料依舊可以查詢喔!)

實際用在台灣,也有評估能力嗎?

首先針對今年的流感進行分析,條件如下:

表 2:2016 年流感分析條件

時間範圍:2016 年 1 月至 4 月初(第 1~13 週)
疾病別 每週流感重症確診人數
資料來源:中華民國疾管署的統計資料
正體中文關鍵字 A 感冒
正體中文關鍵字 B 發燒
正體中文關鍵字 C 咳嗽
資料來源:Google趨勢(Google Trend)

我們得到圖 1 的趨勢圖,其中直條圖為疾管署每週公佈的病例數,曲線圖為關鍵字每週的搜尋熱門度。

圖1:台灣2016年每週流感重症人數和關鍵字搜尋熱門度關係圖。圖/作者製圖。資料來源/中華民國疾管署、Google Trend。

從上圖中我們可以觀察到,疫情感覺上和關鍵字有正相關。但「感覺上」、「看起來」還不夠,我們實際來計算相關係數的表現如何。

熱搜圖

圖2:「感冒」每週搜尋熱門度和當週病例數作相關分析。

根據圖 2,「感冒」的搜尋熱門度和病例數產生的交點,有很高的線性關係,相關係數高達 0.9326,屬超高度相關!而從表 3 中可以看出,「感冒」、「發燒」和「咳嗽」的當週搜尋熱門度,都和當週的疫情數字有高度相關!顯示用Google 來幫助評估流感疫情是很有潛力的方式!

表3:關鍵字和流感重症人數的相關程度

關鍵字 相關程度(相關係數)
感冒 超高度相關(0.9326)
發燒 超高度相關(0.8378)
咳嗽 高度相關(0.7279)

所以真的能用 Google 預測下週疫情嗎?

用當週的數值比較只能算是「評估」系統,接下來我們以「當週」的 Google 數值和「下週」的病例數做計算 [2],來看看 Google 能不能幫我們「提前猜到趨勢」,替未來的疫情做一個猜測呢?

從圖 3 可以發現到,當週的 Google 數值和「下週」的實際病例數依然有線性關係,並且呈現高度相關!

疫情預測

圖 3:以感冒每週搜尋熱門度和「下一週」實際病例數作相關分析。

而表 4 的結果裡可以發現到,以「感冒」的預警效果最好,屬高度相關,而「發燒」和「咳嗽」的表現也不錯,屬中度相關!雖然未達神預測的地步,但在時刻必爭的疫情控制上,也是另一種值得參考的角度!

表 4:以「當週」的 Google 數據對照「下週」的確診病例,觀察預警的效果

  疫情「評估」效果 疫情「預警」效果
關鍵字 相關程度(相關係數) 相關程度(相關係數)
感冒 超高度相關(0.9326) 高度相關(0.7534)
發燒 超高度相關(0.8378) 中度相關(0.5184)
咳嗽 高度相關(0.7279) 中度相關(0.5919)

群眾的行為模式就是趨勢

近年來在商業界裡,以觀察群眾行為作出未來趨勢判斷的例子越來越多(如:Netflix 打造熱門影視「紙牌屋」),而利用群眾行為模式在公衛防疫上的應用更在最近興起(如:利用飛航記錄預測茲卡病毒的流行 [3]),而利用群眾的活動模式來協助我國疫情的評估,將能有快速、預警的優勢,並且提供不同角度的觀點。未來在面對腸病毒、登革熱,甚至於是明年的流感威脅,何不聚集群眾的智慧來替我國的防疫多一層把關呢?

本文感謝台東部立醫院 醫檢師 張昱維(Yu-Wei Chang)和病後人生 一站式服務網 站長 羅佩琪 協助

註釋:

  1. 筆者尚有以 2012 年的腸病毒疫情,以及 2015 年的登革熱疫情作評估的數據,若有興趣者歡迎一起來討論。
  2. 用 Google 評估疫情會受到許多因素影響,如媒體大量報導時,因個人興趣而查詢特定關鍵字的民眾會變多,導致搜尋熱門度趨勢受到影響。因此群眾行為模式並不能完全取代現行的機制。所以本文著重於提供「不同面向的參考」。

參考文獻:

  1. Jeremy Ginsberg, Matthew H. Mohebbi, Rajan S. Patel, Lynnette Brammer, Mark S. Smolinski & Larry Brilliant (2009) Detecting influenza epidemics using search engine query data. Nature, 457, 1012-1014
  2. Andrea Freyer Dugas, Yu-Hsiang Hsieh, Scott R. Levin, Jesse M. Pines, Darren P. Mareiniss, Amir Mohareb, Charlotte A. Gaydos, Trish M. Perl, and Richard E. Rothman (2012) Google Flu Trends: Correlation With Emergency Department Influenza Rates and Crowding Metrics. Clinical Infectious Diseases, 54, 463-469
  3. Isaac I Bogoch, Oliver J Brady, Moritz U G Kraemer, Matthew German, Marisa I Creatore, Manisha A Kulkarni, John S Brownstein, Sumiko R Mekaru, Simon I Hay, Emily Groot, Alexander Watts, Kamran Khan (2016) Anticipating the international spread of Zika virus from Brazil. The Lancet, 387, 335-336
ad3

問答是人類最原始的知識互動方式,也是文明火箭推進的燃料,更是茫茫知識大海中的羅盤
為什麼蘋果會落下?為什麼人類不能飛?所有偉大的事物,都萌芽於一個最初的問題。
我們全新推出的問答平台——泛答,讓大家用最輕鬆直接的方式挖掘最有價值的知識。

受夠了虛實難辨的假新聞?懷疑自己困在同溫層?想念那個充滿好奇的內心自我?
來泛答吧,跟我們一起用問答打破現狀,用問答找回專屬於你的知識。

關於作者

Chiang Wei-Lun

Wei-Lun

蔣維倫。喜歡虎斑、橘子、白底虎斑、三花貓。曾意外地先後收集到台、清、交三間學校的畢業證書。泛科學PanSci專欄作家、上下游新聞市集公民寫手、故事專欄作家。 文章作品:http://pansci.asia/archives/author/miss9 https://www.newsmarket.com.tw/blog/author/miss9ch/