「加值」(Value-Added),是為事物創造新的用途,以增加它的價值;而我們此處所討論的「健康與醫療資料加值應用」則是將健康相關的資料做目的外的使用。像是將原本記錄健保給付紀錄的資料庫,與其他社會、經濟或地理資訊的統計資料庫結合,進行學術研究,即為將在這些健康資料原本蒐集的目的外,再賦予這些資料其他有價值的功能一種加值模式。
透過本文的簡介,您可以獲知各國目前健康資料加值業務的實際情況,並比較箇中的異同。加值與應用有許多不同的模式,以下只是提供各位作為參考。(編註:本文為議題手冊第二章的一部分,僅先節錄台灣的「全民健康保險資料庫」簡介)
全民健康保險資料庫
臺灣自民國 84 年 3 月起,由行政院衛生署下轄的「全民健康保險局」負責推動。實施全民健康保險,至今已邁入第十七年。目前臺灣的健保納保率達 99% 以上,累積豐富的資料,可做為相關研究第一手資料的來源。
自民國 87 年起,中央健保局即委託國家衛生研究院(以下簡稱國衛院)進行「全民健康保險資料庫」的建置,至民國 89 年起,依據醫療機構向健保局申報資料,每年年底發行前一年的健保申報資料,提供學界與生物技術產業界使用資料庫加值服務。
依據健保局「全民健康保險研究資料庫加值服務申請原則」的規定,健保資料庫加值服務的申請者,分為學術界與非學術界研究兩類,非學術類必須為登記立案的公司或機構,並經國衛院召集學者專家組成的指導委員會審核通過。申請者須填妥相關表格後,由指導委員會審核申請文件與研究計畫,通過後再由國衛院工作小組擷取申請者需要的資料,加密後釋出。資料庫申請者在收到申請資料當日算起,至屆滿三年前,應繳回所申請資料。
一、健保資料庫的檔案結構
健保資料庫的原始目的是醫療費用申報,在了解健保資料庫所包含的資料類別前,得先釐清醫療院所申報健保給付的流程,才能得其要領。在一個診療過程中,醫事人員會依據病患的症狀,做出檢查、診斷與處置,這一個流程可以拆解成許多「全民健保給付標準」裡訂定的醫令,對應健保局給付給醫療院所的金額。
在了解健保給付額申報的程序之後,我們來看健保資料庫的檔案結構。健保資料庫裡頭的資料分為三大類,其中,每一位病患完成診療程序後,這個診療程序所包含檢查及處置,其中牽涉的每一項醫令記錄屬於「醫令檔」;而將各項醫令所對應的價格,分類加總後得出給付金額的相關紀錄,則屬於「費用檔」,費用檔記載了就診相關人(病患與醫師)、事(就診病患與醫師)、時(就診時間)、地(就診院所)以及就診費用等等的資訊,堪稱整個健保資料庫的核心;最後,健保資料庫會另行針對健保承保記錄、醫師以及醫療院所的基本資訊,整理出「基本資料檔」。下面的表格整理出這三類檔案中,各自又包含哪些檔案項目。
二、健保資料庫如何加密隱私資料
當醫療院所向健保各分局申報給付金額時,健保各分局所收集的資料會彙整至健保局總局的倉儲系統,這些資料的身分資料欄位再被加密後,由國衛院的健保資料庫工作小組製作成「全民健康保險研究資料庫」及各種加值資料檔案,提供申請單位使用。
一開始儲存在健保局總局倉儲系統裡的資訊,包含有可辨識身分的資訊欄位,當健保局在將資訊釋出給國衛院健保資料庫工作小組時,會將身分資訊欄位加密,國衛院在釋出被申請使用的資訊時,會進行第二次的加密程序,即為所謂「二代加密」的程序。
國衛院的第二次的加密程序,是在身分資料已經被健保局去除的情況下,國衛院的工作小組依據申請者所提出的需求擷取資料後,若這些資料有差異性過低或過高情況,容易被識出資料所屬人的身分,便會視差異程度加密這些資訊,使其差異性增高或降低至不易被識出資料所屬人的程度,再提供給申請者使用。若資訊經過第二次加密程序後,仍然容易從中識別出資料所屬人,則這個申請案將被退回,國衛院將不釋出被申請的資訊與申請者。
國衛院工作小組進行加密的過程中,每件申請案會採取不同的加密方式,但是若申請人符合相關規定條件,則可以申請同一申請人資料加密方式皆相同。
三、如何使用健保資料庫來進行研究呢?
利用健保資料庫進行學術研究,面向頗為廣泛,從臨床研究、流行病學研究、公共衛生研究到衛生政策都有,多年來,已經有一千多篇相關論文發表。健保資料庫到目前為止已經累積共 17 年的資料量,幾乎全國所有納保民眾的資料皆包含在內,樣本數相當大,使利用健保資料庫分析產生的實證研究,有較高的代表性。
如何利用健保資料庫進行研究?為了讓您能夠更容易了解,我們舉了下面這個虛構的案例供您參考。假設目前有一研究者欲得知在民國 96 年間罹患乳癌的女性,其中服用中藥的比率,就可以申請使用健保資料庫中的 96 年住院抽樣檔、門診抽樣檔與重大傷病檔,利用「女性」、「乳癌患者」兩個條件,在申請到的資料中篩選出相關的資料,再利用「使用中藥」的條件,篩選並計算出使用中藥的乳癌患者佔所有患者有多少。這是一個簡單的例子,實際上利用健保資料庫進行研究,也會有串連不同類型間的資料庫資料,比對不同資料間的關係,以得到研究結果的狀況。【待續】
* 補充:什麼是開放資料(Open Data)?
開放資料指的是任何人能夠自由使用、重新使用與散佈的資料,最多也只能要求要有來源標示,並且以相同的方式來分享這些資料。開放資料的定義中有幾點重要的特性:例如這些資料是具有可得性與可讀性的,即是一般人能夠容易且方便獲得,與易於瞭解的資料;還有開放資料是大家可以重新使用與重新散佈,也就是開放資料它本身具有能夠分享的普遍性,也能夠讓彼此互相流通,不同的資料庫或是資料群組,可以彼此互用或是混合。
也因為開放資料的這些特性,開放資料是一種「非個人性的」資料,它並不包含特定人物的資訊;像是一些受到國家安全限制管理的政府資料,就不能夠任意開放釋出,這些資料就不屬於開放資料。而我們此次論壇所討論的議題-「健康與醫療資料公開加值」所引發的爭議,有部分來自於對於健康與醫療資料是否屬於「開放資料」的疑慮,因此在這裡我們先簡單介紹公開資料的概念,在參、相關議題裡,將會有更深入的討論。
資料來源:本文節錄自《健康與醫療資料的加值應用公民論壇議題手冊》
作者與編輯群:呂宗學、邱伊翎、黃柔翡、馮瑜茜、呂家華、李宜卿、孫語辰
審定:呂宗學、林子倫、邱伊翎、徐子涵、陳再晉、黃旭明、滕西華
健康與醫療資料的加值應用公民論壇,希望促成社會公眾對「健康及醫療資料運用及加值」議題進行理性、知情的討論,形成公共意見以作為決策的參考。PanSci將在:
- 8/17 的 PM 7:00-8:00
- 8/17 的 PM 9:00-10:00
- 8/18 的 PM 7:00-8:00
- 8/18 的 PM 9:00-10:00
四個時段各舉辦一場線上論壇,歡迎報名參加!
論壇一:政府現有健康相關資料之加值,是否須先經個人同意或立法授權?
論壇二:健康資料庫加值應用之現況是否侵犯或有未能保護個人資訊自主及隱私之疑慮?
論壇三:健康資料庫加值應用衍生利益之歸屬:公有?共有?私有?
論壇四:總體討論(後續該怎麼監督)
>>前往健康與醫療資料的加值應用公民論壇的【網站】、【Facebook】、【線上報名表單】