今(2016)年年初,台灣各地出現流感病例,疫情在春節期間達到高峰,急診就醫的民眾超過上萬人,併發重症者將近兩千人。面對瞬息萬變的疫情,除了仰賴疾病管制署(以下稱疾管署)每週的疫情報導,難道沒有更快速的評估方法嗎?
用 Google 評估疫情研究登 Nature 期刊
現代人喜歡任何事都問問看 Google,甚至連生病了也會用 Google 查查症狀。因此當感冒的人多了,使用 Google 查詢「發燒」或「咳嗽」的民眾也跟著變多,讓特定關鍵字的搜尋熱門度,成了疫情變化的指標。2009 年在「自然(Nature)」期刊上發表了一篇以上述理論為基礎的評估系統,並且對照 2008 年真實爆發的流感病例,該系統的表現令人激賞,預測的數值和真實的病情呈現超高度的正相關(請參考表 1。該系統在評估 2008 年疫情的表現上,相關係數高達 0.85)[1]!
表 1:相關係數等級 [2]
正相關係數(介於1~0之間) | 等級 |
≧0.8 | 超高度相關(excellent correlation) |
0.8~0.6 | 高度相關(good correlation) |
0.6~0.4 | 中度相關(moderate correlation) |
<0.4 | 低度或無相關(poor correlation) |
為什麼要用 Google 協助評估疫情?
正式的疫情統計方式,是由醫院採集患者檢體,再送交實驗室檢驗,確診後再回報給疾管署,最後再由政府每週公佈上週的確診病例數。可以預料的是,這套系統雖然可靠,但作業時間曠時費日(如 PCR 等檢驗需數日的時間),面對發展迅速的流行病,難免會有慢半拍的疑慮。而 Google 利用群眾的行為模式進行評估,不但隨時都是最新的資訊(Google Trend 每分鐘更新一次),並且所有人都能使用,更重要的是省卻了曠時費日的檢驗、公文流程,在面對瞬息萬變的疫情時,提供了另一種角度的疫情參考。因此 Google 設立了專門的流感統計系統—— Google Flu Trend,用來協助各國預警可能襲來的全球大流感。
但 Google Flu Trend 的評估規模是如美國、澳洲等大國,台灣是個相對小型的國家,並且 Google Flu Trend 也沒有提供中文關鍵字的資訊,難道台灣不能用 google 來協助評估疾病了嗎?讓我們改用 Google 趨勢(Google Trend)的關鍵字搜尋熱門度,來分析看看今年的流感疫情!
(J 編註:目前 Google Flu Trend 已經停止服務,但舊的資料依舊可以查詢喔!)
實際用在台灣,也有評估能力嗎?
首先針對今年的流感進行分析,條件如下:
表 2:2016 年流感分析條件
時間範圍:2016 年 1 月至 4 月初(第 1~13 週) | |
疾病別 | 每週流感重症確診人數 |
資料來源:中華民國疾管署的統計資料 | |
正體中文關鍵字 A | 感冒 |
正體中文關鍵字 B | 發燒 |
正體中文關鍵字 C | 咳嗽 |
資料來源:Google趨勢(Google Trend) |
我們得到圖 1 的趨勢圖,其中直條圖為疾管署每週公佈的病例數,曲線圖為關鍵字每週的搜尋熱門度。
從上圖中我們可以觀察到,疫情感覺上和關鍵字有正相關。但「感覺上」、「看起來」還不夠,我們實際來計算相關係數的表現如何。
根據圖 2,「感冒」的搜尋熱門度和病例數產生的交點,有很高的線性關係,相關係數高達 0.9326,屬超高度相關!而從表 3 中可以看出,「感冒」、「發燒」和「咳嗽」的當週搜尋熱門度,都和當週的疫情數字有高度相關!顯示用Google 來幫助評估流感疫情是很有潛力的方式!
表3:關鍵字和流感重症人數的相關程度
關鍵字 | 相關程度(相關係數) |
感冒 | 超高度相關(0.9326) |
發燒 | 超高度相關(0.8378) |
咳嗽 | 高度相關(0.7279) |
所以真的能用 Google 預測下週疫情嗎?
用當週的數值比較只能算是「評估」系統,接下來我們以「當週」的 Google 數值和「下週」的病例數做計算 [2],來看看 Google 能不能幫我們「提前猜到趨勢」,替未來的疫情做一個猜測呢?
從圖 3 可以發現到,當週的 Google 數值和「下週」的實際病例數依然有線性關係,並且呈現高度相關!
而表 4 的結果裡可以發現到,以「感冒」的預警效果最好,屬高度相關,而「發燒」和「咳嗽」的表現也不錯,屬中度相關!雖然未達神預測的地步,但在時刻必爭的疫情控制上,也是另一種值得參考的角度!
表 4:以「當週」的 Google 數據對照「下週」的確診病例,觀察預警的效果
疫情「評估」效果 | 疫情「預警」效果 | |
關鍵字 | 相關程度(相關係數) | 相關程度(相關係數) |
感冒 | 超高度相關(0.9326) | 高度相關(0.7534) |
發燒 | 超高度相關(0.8378) | 中度相關(0.5184) |
咳嗽 | 高度相關(0.7279) | 中度相關(0.5919) |
群眾的行為模式就是趨勢
近年來在商業界裡,以觀察群眾行為作出未來趨勢判斷的例子越來越多(如:Netflix 打造熱門影視「紙牌屋」),而利用群眾行為模式在公衛防疫上的應用更在最近興起(如:利用飛航記錄預測茲卡病毒的流行 [3]),而利用群眾的活動模式來協助我國疫情的評估,將能有快速、預警的優勢,並且提供不同角度的觀點。未來在面對腸病毒、登革熱,甚至於是明年的流感威脅,何不聚集群眾的智慧來替我國的防疫多一層把關呢?
本文感謝台東部立醫院 醫檢師 張昱維(Yu-Wei Chang)和病後人生 一站式服務網 站長 羅佩琪 協助
註釋:
- 筆者尚有以 2012 年的腸病毒疫情,以及 2015 年的登革熱疫情作評估的數據,若有興趣者歡迎一起來討論。
- 用 Google 評估疫情會受到許多因素影響,如媒體大量報導時,因個人興趣而查詢特定關鍵字的民眾會變多,導致搜尋熱門度趨勢受到影響。因此群眾行為模式並不能完全取代現行的機制。所以本文著重於提供「不同面向的參考」。
參考文獻:
- Jeremy Ginsberg, Matthew H. Mohebbi, Rajan S. Patel, Lynnette Brammer, Mark S. Smolinski & Larry Brilliant (2009) Detecting influenza epidemics using search engine query data. Nature, 457, 1012-1014
- Andrea Freyer Dugas, Yu-Hsiang Hsieh, Scott R. Levin, Jesse M. Pines, Darren P. Mareiniss, Amir Mohareb, Charlotte A. Gaydos, Trish M. Perl, and Richard E. Rothman (2012) Google Flu Trends: Correlation With Emergency Department Influenza Rates and Crowding Metrics. Clinical Infectious Diseases, 54, 463-469
- Isaac I Bogoch, Oliver J Brady, Moritz U G Kraemer, Matthew German, Marisa I Creatore, Manisha A Kulkarni, John S Brownstein, Sumiko R Mekaru, Simon I Hay, Emily Groot, Alexander Watts, Kamran Khan (2016) Anticipating the international spread of Zika virus from Brazil. The Lancet, 387, 335-336