0

0
1

文字

分享

0
0
1

喝酒臉紅就容易罹癌嗎?用「因果中介模型」透視疾病的黑盒子

研之有物│中央研究院_96
・2019/03/26 ・3867字 ・閱讀時間約 8 分鐘 ・SR值 512 ・六年級

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

  • 執行編輯|林婷嫻、美術編輯|林洵安

從統計找因果關係

人體中,有一些奇妙的因果關係。例如:小時候家裡窮,為什麼長大較胖?喝酒容易臉紅,因此易罹肝癌嗎?中研院統計所的黃彥棕副研究員說明,透過「因果中介模型」,可以找出中間究竟發生什麼事,藉此提供可能的醫療對策。

就讀醫學院、專攻生物統計的黃彥棕,與我們分享基礎的統計觀念。請放心,本篇沒有困難的數學算式。
攝影│張語辰

您畢業於醫學院,為什麼沒當醫師,而是研究統計?

我讀大四的時候,人類基因被解碼出來,大家就在討論下一個世代的醫學和生物研究要做什麼。當基因的資料量變大,就不太可能用傳統一個分子、一個基因的方法來看,那時候覺得「量化」的訓練可能是我以後需要的,而且我本身也對數學有興趣。

其實,醫學存在大量的「不確定性」,例如,同樣的醫師看病,給 A 病人吃這個藥可以康復,但 B 病人吃同樣的藥卻不會好。換句話說:

醫學體現了不確定性,而統計學是用來研究不確定性

之後我加入陳建仁老師的實驗室,研究 B 肝病毒和 C 肝病毒對於肝臟的交互作用,這跟我後來跨入「因果中介模型」的領域有關。那時候楊懷壹學長帶著我,從最基礎怎麼寫程式,手把手教我慢慢做。

後來我們發現 B 肝病毒和 C 肝病毒呈現競爭關係,它們都想佔領肝臟,通常是 B 肝病毒因為母子垂直傳染先抵達,而 C 肝病毒後到。兩個病毒交互作用,這個中介過程造成的結果很有趣──反而是肝癌機率會變低。(註一)

在陳老師實驗室研究的這個題目,對於我的學術生涯有很大的影響,包括後來到哈佛大學攻讀流行病學和生物統計,以及投入因果中介模型的研究,都是受到這個題目的啟蒙。

研究生物統計,要特別注意什麼?

要注意「相關性」和「因果關係」不能混淆。舉個例子,如果有人發現「吃冰淇淋」和「被鯊魚攻擊」的次數呈現正相關,如下圖所示:

「吃冰淇淋」和「被鯊魚攻擊」的次數變化,呈現高度正相關。(舉例)
資料來源│黃彥棕    圖說重製│林洵安

可能有人看了這個資料,會下一個結論:吃冰淇淋會導致你容易被鯊魚攻擊。但真的是這樣嗎?其實影響這兩者的原因是「夏天」。因為夏天人們喜歡吃冰淇淋,而夏天人們也喜歡去海邊,導致被鯊魚攻擊的次數提高。

這個例子可以用常識判斷,但生物和醫學研究不太能只靠常識。如果沒有區別「因果關係」和「相關性」的差別,有時會產生一些嚴重的後果,關係到病人的生存。

如何確認「因」和「果」的關係?

以醫學來說,疾病都會有一個病程,通常我們知道開頭和結尾,但不知道中間發生什麼事。

舉個例子,若我們要研究「抽菸」透過改變身體什麼機制導致「肺癌」,就能藉由因果中介模型解釋因和果中間的機制,找出肺部的腫瘤是如何發生。(註二)

「因果中介模型」在於找出因和果「中間」發生什麼事。例如:抽菸到肺部產生腫瘤的過程中,是因為香菸所含物質,導致細胞基因發生甲基化。
資料來源│黃彥棕    圖說設計│林婷嫻、林洵安

疾病的過程常常是一個黑盒子。站在醫生的角度,通常只知道疾病的因和果,但若疾病的「因」是沒辦法被改變的,這樣對病人一點幫助也沒有。這種情況下,我們若能找出「中介因子」,就能透過追蹤或調節中介因子,來避免或降低疾病「結果」發生的可能性。

「肥胖」也能找出中介因子嗎?

肥胖的原因有很多,其中一個是:在美國已經知道「小時候家裡社經地位低」和「長大後過胖」這兩者的關係是確立的,但不知道中間的機制。我們用因果中介模型分析發現,其實這中間可能是受到基因甲基化的影響。

基因是與生俱來的,一般來說基因序列不會改變,可是每個基因的表現量會不一樣。就像鋼琴鍵盤順序不會變,但各個琴鍵可以彈出不一樣的大小聲。而甲基化的意思,就是環境因子會影響基因表現量。

我們從受試者的臀部,以 FNA (細針抽取細胞檢查)抽取脂肪細胞,作為分析基因的資料。的確發現,脂肪細胞裡一些基因的甲基化,參與中間的間接作用。也就是說,家裡社會經濟地位低,會導致脂肪細胞某一些基因甲基化的程度不太一樣;這些不太一樣的程度,可能進而導致成年時候肥胖。(註三)

童年的外在環境,如何影響成年肥胖?以美國受試者的資料來分析,是因為家裡吃得不健康,使得脂肪細胞一些基因甲基化。
資料來源│黃彥棕    圖說設計│林婷嫻、林洵安

窮困家庭能吃飽就不容易,很難注重健康。家裡大人如果吃得不健康,小孩也會跟著吃,這個環境因素會影響下一代。因為吃的東西,會記憶在基因裡面,透過改變脂肪細胞一些基因的甲基化程度,造成長大後容易肥胖。不過,這些是以美國人為受試對象的研究,我們需要臺灣族群的研究,來了解目前臺灣人口肥胖的問題。

還有一個常見的因果關係:喝酒容易臉紅,易罹肝癌嗎?

喝酒容易臉紅的人,是因為肝臟代謝乙醛的基因有缺陷,導致身體缺乏解酒酵素 (ALDH2) 。這個基因缺陷,通常會讓這個人變得比較不喜歡喝酒,因為會臉紅、起酒疹、不舒服。不喝酒的話,「間接作用」就會保護肝臟。

可是另一方面,不容易代謝乙醛的基因,影響的不只是喝酒的行為,也會造成肝臟代謝毒物的效用不佳。你帶著一個有缺陷的基因,導致毒物無法代謝、累積在肝臟,這「直接作用」會對肝臟產生危險性。

陳建仁老師和楊懷壹老師合作,我們用因果中介模型,來看這兩個機制的交互作用,發現最後對肝臟的正負作用會相互抵消。也就是說,喝酒容易臉紅的人,透過「不喝酒/肝臟易累積毒物」這兩個機制並存、相抵,不會對肝臟造成顯著的罹癌風險。(註四)

代謝乙醛的基因有缺陷,會造成人們不喜歡喝酒(間接作用),但肝臟也會容易累積毒物(直接作用)。兩個作用相抵,對於肝臟其實不會造成顯著的罹癌風險。(編註:本圖說於 2019/3/19 將甲醛更正為乙醛)
圖說設計│林婷嫻、林洵安

研究過程中,有沒有遇到什麼困難?

就是……數學算式推導不出來,呵呵呵。有時候回到家會跟太太說:「我今天又把一個題目做死了。」統計學和其它領域一樣,學術研究大部分的時間都是在面對挫折。

想要特別說明的是,很多人認為因果推論是發展一個統計模型,證明 A 和 B 是因果關係。其實這是誤解,我們做因果推論,其實花很多時間在探討什麼「不是」因果關係。生活上常常要用消去法,因果推論也是。

研究上常有的合作模式是,我們先把「因果中介模型」推導出來,合作對象讀了論文再來找我們,希望用這個統計模型回答他們的問題,找出影響病程的中介因子。我們也會和醫師合作,運用去識別化的病歷和健保資料來分析。

如果物理學家真的發明時光機,我可能就失業了。

如果人生可以重來,就能比較同一個人這輩子有抽菸、另一輩子沒有抽菸,導致肺部腫瘤的過程機制。但因為時光機還沒被發明出來,我就可以繼續做這門統計研究。

延伸閱讀

本文轉載自中央研究院研之有物,原文為喝酒易罹癌?小時候家裡窮會胖?統計學家黃彥棕來解答,泛科學為宣傳推廣執行單位

文章難易度
研之有物│中央研究院_96
253 篇文章 ・ 2213 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

1
1

文字

分享

0
1
1
準備出國啦!Surfshark VPN 快趁黑五買起來,上網購物最安心
鳥苷三磷酸 (PanSci Promo)_96
・2022/11/01 ・2113字 ・閱讀時間約 4 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

本文由 Surfshark VPN 贊助。

兩、三年以來的防疫生活,終於迎來全面 0+7 的這一天啦!返國之後不再需要隔離的一天來了,冰友們,你是不是已經收拾好心情、收拾好行李,在進行機+酒的比價了呢?除了規劃好出國行程、找好景點與美食店家,想要讓自己不可或缺的網路生活也更加安全,一定要趁即將到來了感恩節黑五期間,把超優惠的 Surfshark VPN 服務買起來,為自己的網路生活加買最平安的保險!

Surfshark 黑五限時 18 折折扣,額外加送兩個月
專屬連結:https://lihi2.cc/8XwRN

在疫情下,網購成為了更多人的日常。不僅各樣的在地購物節為網友帶來眾多優惠,全球化的購物活動,台灣當然也不會缺席!美國感恩節(Thanksgiving)都是 11 月第四個星期四,但是感恩節後的週五,便是聖誕節前的購物佳期啟動日,這一天通常都會業績超標(在收支表上呈現正向收入(顯示為黑色字體,而非赤字的紅色字體),各家的瘋狂優惠都會在黑五祭出!相信許多精打細算的朋友,對黑五購物節絕對不陌生(很可能還搶過很多優惠!!)

網購怎能漏掉「亞馬遜」!

雅虎奇摩之於台灣,就像是亞馬遜(Amazon.com)之於美國那麼的有名!絕對也是什麼都賣、什麼都不奇怪的最佳代表。

如果你平常就很喜愛一些美國品牌,趁著黑五的日子到亞馬遜清空購物車,覺對優惠不會讓你失望。這時候,透過 Surfshark 連線到亞馬遜美國站,絕對會顯示的價格絕對讓你眼睛為之一亮,這時候最新搭載 M2 晶片的 iPad Pro,獨家支援動態島顯示的 iPhone 14 Pro,絕對是最好入手的時機。除此之外,亞馬遜平台經典的 Kindle 閱讀器,也是超合適的禮物,送禮自用兩相宜啊!另外要特別留意,購買時可以確認商品有沒有幫忙送到台灣,如果還沒有,可以先跟美國的朋友確認一下,邀請他們回國時幫你一起帶回來!

跨國追劇最爽快

對於喜愛追劇的朋友,品味可能相當豐富且多元,畢竟欣賞優秀影視作品,不現語言,更是不限地區啊!只不過,若是你訂閱 Netflix 等跨國 OTT 服務,都會有各地不同的上架影視作品,可能會讓你無法在第一時間就能夠立即「追」到劇,讓你等得心癢癢!還好這一切只要連上 Surfshark VPN 都能解決,Surfshark 支援超過 100 國的 VPN 連線,無論你想看韓國、日本還是哪一國的最新戲劇,通通讓你一秒追到最新進度!

Surfshark 黑五限時 18 折折扣,額外加送兩個月

專屬連結:https://lihi2.cc/8XwRN

出差大陸翻牆超方便

在過往出國、返國都需要隔離的階段,肯定讓不少工作上需要經常往返多國之間的朋友,感到生活驟變。所幸,在防疫政策解封之後,一切都可逐漸恢復正常。對於經常有需要到中國大陸出差的朋友,肯定都會感受到網路斷聯的不方便,因為無論是 LINE、Facebook Messenger、YouTube、Gmail 等你可很能天天都在使用的網路服務,大陸都無法使用。這還不打緊,連跟家人、朋友報平安也很不便。這時候 Surfshark 連上,就可以幫助你輕鬆「翻牆」,跟台灣親人網路無距離!

 

上網不留痕跡,不被追蹤最自由

對於一個人來說,最私密的資料之一,除了你的個資,就屬我們每天耗費大量時間逗留的網路。我們所在網路上留下的痕跡,絕對是超真實的自己,當然你不會期待這樣的自己被「搜尋引擎」、「網路廣告」公司了解得太透徹,好像你在網路上的一言一行,都被監視著。

..0000000\0;也可隱藏IP位置,避免被廣告商追蹤;更可以為你我阻擋惡意程式、釣魚軟體等,讓你防止被攻擊,以及被網路充斥的廣告打擾,好處多又多!

如果對於 Surfshark 還覺得不夠熟悉的話,不得不告訴大家,今年 Surfshark 榮獲第六屆 CyberSecurity Breakthrough 頒發的「VPN 年度最佳解決方案」(VPN Solution of the Year),也就是成為今年最推薦的 VPN 方案。CyberSecurity Breakthrough 是全球領先的獨立市場情報組織,致力於表揚當今全球資訊安全市場上的頂尖企業、技術和產品。有了他們「掛保證」,代表 Surfshark 絕對是品質、信譽都讓你安心的VPN 服務。

講了這麼多,是不是讓你感到很心動了。如果你原本就是網路重度使用者,用來上網的設備是樣樣都有,Surfshark 一個帳號就能支援所有設備,CP 值超高!趁著年度超狂黑五購物節的到來,送給你自己兩年安心無虞的網路生活,肯定是送自己的最好禮物!

Surfshark 黑五限時 18 折折扣,額外加送兩個月
專屬連結:https://lihi2.cc/8XwRN

文章難易度
鳥苷三磷酸 (PanSci Promo)_96
155 篇文章 ・ 268 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

1
0

文字

分享

0
1
0
久站或久坐,讓你靜脈曲張了嗎?了解靜脈曲張的成因與症狀
J. Yang_96
・2022/11/23 ・1529字 ・閱讀時間約 3 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

靜脈曲張,英文為 Varicose vein,意即異常增大或腫脹的靜脈。

大家對於這個疾病應該不陌生,小時候就時常聽到老師們在辦公室閒談聊到長時間的站立,讓他們飽受靜脈曲張的困擾。鼓脹彎曲的靜脈如藤蔓般爬滿本該平滑的小腿,輕則影響美觀,重則甚至寸步難行。

靜脈曲張輕則影響美觀,重則甚至寸步難行。圖/pexels

變形的靜脈?

靜脈曲張到底是如何形成的?

讓我們先從根本認識起靜脈這個平常容易被忽略,實則肩負重責大任的無名英雄。下肢靜脈在解剖學上分為深層、淺層及如橋樑般穿梭期間的穿通枝,他們負責讓供完養分的血流順利回到心臟。

而靜脈曲張發生的位置是主要由大隱及小隱靜脈組成的淺層系統。大隱靜脈的走向由內踝沿著小腿內側一路直上至大腿內側,在鼠蹊部匯入股靜脈;小隱靜脈則由外踝繞至小腿正後方匯入膕靜脈。

故我們常見發生靜脈曲張的位置多沿著這些位子,尤其是內側鼠蹊及膝蓋後側,也就是大隱及小隱匯入深層靜脈之處(saphenofemoral junction & saphenopopliteal junction)。

健康的靜脈能夠形成以自身的內膜形成瓣膜,確保遠端的血液能夠抵抗重力,像閘門一樣讓通過的血液不會逆流。

然而,當瓣膜功能減弱時,本該回流的血液隨著重力累積在下肢靜脈,深層靜脈的血液透過穿通支逆流至淺層系統,長此以往則會造成靜脈高壓。

除此之外,淤積的血液也會帶來多種發炎因子,進一步導致管壁結構的變形。機械性及化學性的致病機轉共同作用,使平滑的靜脈開始鼓脹變形,形成我們熟知的靜脈曲張。

有些人的手可以看到明顯的靜脈。圖/pexels

檢測自己是不是高危險族群!

哪些人容易有靜脈曲張呢?老化是最重要的風險因子,其他如女性、多產、吸菸、肥胖者、受過外力創傷、工作需要長時間站立及已知家族遺傳都是應該特別注意的族群。

這個疾病對生活的影響可大可小,因為輕微的靜脈曲張來到醫院診治的病人多數是在意美觀上的影響,所以在大醫院的醫美中心看到心血管外科醫師也不足為奇,主要就是針對靜脈曲張的部分提供諮詢及治療。

靜脈曲張對生活的影響可大可小。圖/pexels

而隨著疾病的進展,程度不一的疼痛是最常見的主訴,可能伴隨著腫脹、搔癢、甚至隨著站立時間累積的沈重感。

「像大象一樣笨重的步伐。」上星期來開刀的病人這麼形容道。

「連吃飽飯想都跟家人去散步都沒有辦法。」

如果置之不理,最嚴重的情況甚至可能因為不良的血液循環導致下肢滯鬱性皮膚炎、潰瘍出血甚至,極少數的情況下,形成血栓堵塞血管。當看到皮膚出現暗沉、紅腫時,須及時至醫院接受檢查,排除其他病因並及早接受適當的治療。

臨床上根據症狀的嚴重度將靜脈曲張分為0到6級,如下表所示:

2S 以上建議接受醫療介入。表/作者提供

下一篇文章則詳細向大家說明靜脈曲張現行有哪些治療的選擇,並協助你們分析到底哪種治療方式最適合自己?

參考資料

  • Campbell B. Varicose veins and their management. BMJ. 2006;333(7562):287-292. doi:10.1136/bmj.333.7562.287
  • Courtney M. Townsend, Jr., MD, R. Daniel Beauchamp, MD, B. Mark Evers, MD, and Kenneth L. Mattox, MD (2021). Sabiston Textbook of Surgery (21st edition).
  • Lurie F, Passman M, Meisner M, et al. The 2020 update of the CEAP classification system and reporting standards [published correction appears in J Vasc Surg Venous Lymphat Disord. 2021 Jan;9(1):288]. J Vasc Surg Venous Lymphat Disord. 2020;8(3):342-352. doi:10.1016/j.jvsv.2019.12.075

0

2
2

文字

分享

0
2
2
資料科學與研究資料管理的最前沿:2022 國際資料週
研究資料寄存所 (depositar)_96
・2022/10/07 ・5342字 ・閱讀時間約 11 分鐘

立即填寫問卷,預約【課程開賣早鳥優惠】與送你【問卷專屬折扣碼】!

 

想和來自全世界的科學家、研究者、政策制定者、企業領袖等一起討論資料議題,想跟上資料科學與研究資料管理最前沿的腳步?國際資料週(International Data Week, IDW)是最好的選擇之一。

國際資料週是什麼?

「國際資料週」是由研究資料聯盟(Research Data Alliance, RDA)以及國際科學理事會(Internatioanl Science Counci, lSC)所屬的資料委員會(Committee on Data, CODATA)、世界資料系統(World Data System, WDS)所共同舉辦的資料科學盛事。自 2016 年起,通常每兩年舉辦一次,吸引近千名全球參與者。因為 COVID-19,2020 年的大會延到今年六月在首爾舉行。

國際資料週的議程由兩個大型研討會構成。例如 2022 的國際資料週,即結合了 RDA 第 19 次大會(RDA 19th Plenary Meeting)與 2022 年的科學資料會議(SciDataCon 2022 )這兩項會議。RDA 大會專注於促進資料分享與再利用的討論,SciDataCon 則著墨在研究資料的前沿議題。

2022 為 IDW 第 3 次舉行,議程為期 5 天,於今年的 6 月 20-24 日,在南韓首爾舉行,主題為「用資料改善世界」(Data To Improve Our World)。因  COVID-19 疫情,採實體與虛擬會議併行,議程總計約 150 場次。在 8 月底,RDA 大會與 SciDataCon 已將多數議程的錄影開放給所有人線上觀看(連結見本文最末)。

研究資料寄存所(depositar) 團隊也參與了本次會議,我們除加入各場次的討論外,亦參加海報徵件,向所有與會者說明我們近來在研究資料管理上的工作。筆者參與會議的部分場次,礙於篇幅,以下僅紀錄筆者感興趣的報告與討論。

場次紀錄:如何提高研究成果的可再重現或可複製性?

SUPPORTING RESEARCH TRANSPARENCY, ACCOUNTABILITY, AND REPRODUCIBILITY: LESSONS FROM THE TRENCHES

本場次專注討論研究成果在「運算」上的可再重現(reproducibility)或可複製性(replicability)。

有關研究成果可否被重現或複製,攸關該研究的可信度與透明性。美國國家學院(The National Academy of Science, Engineer, Medicine)在 2019 年出版了《科學的可重現與可複製性》報告,是研究者可參考的重要指引。

研究不可重現的原因眾多,在本場次中,來自 AGU 的 Shelly Stall 即指出,如紀錄不足、報告不透明、數位技術過時、或嘗試重現的過程有缺陷等,皆可能是研究結果無法重現的原因;要改善這類狀況,則可從分享資料與工作流程、對數位物件編配持續識別碼、強化資料引用、建立數位物件的說明等方面著手進行。

對此,來自 CURE 的講者們亦分享其機構內的作法。CURE 是由康乃爾大學、北卡羅萊納大學教堂山分校、以及耶魯大學等組成的聯盟,致力於倡議並實作研究在運算領域的可重現性。CURE 的運作環繞著四個基本原則:(1) 透明、近用、信任 (2) 可使用性 (3) 獨立性 (4) 出版前的研究重現(pre-publication)。

上述四個原則的完整說明,可在 CURE 的網頁上取得,例如獨立性即意味著可重現性必須「能在獨立的運算環境,交由獨立的第三方來確認」。

CURE 的成員亦分享了其如何實踐計算上的可重現性。例如康乃爾的社會科學中心的講者即表示,他們提供了全整合的服務(All-in-one service),除提供程式碼驗證的服務外,亦有經營資料儲存庫,將研究重現所需的資料悉數打包,存放於該機構的服務內,供他人使用或引用。

BEYOND MACHINE-ACTIONABLE DMPS – LET’S GO FORWARD TOGETHER!

本場次介紹「機器可操作的資料管理方案(machine-actionable Data Management Plans, maDMPs)」的近來發展。

DMP 是描述研究資料將如何被蒐集、使用、管理、(短期或長期)保存、分享等歷程的文件(有關 DMP 的介紹可見此)。 傳統上在撰寫 DMP 時,多是仰賴書寫以整理多方資料整理的工具與資源;而若完成的內容要挪作他用,亦多只能以人工手動進行。

為使 DMP 的內容能取用不同機器的資料,並在機器間進行順暢流通,RDA 自 2017 年起組成工作小組,擬定共通的控制語彙,以在人類可讀的條件下,實現機器可操作的 DMP。

經歷了數年的發展,採用該語彙的 maDMPs 服務亦已逐漸成形。在介紹何謂 maDMP 時,本場次講者 Tomasz Miksa 即指出,maDMP 就如各系統間的「膠水」,它能連結各個不同的研究系統,並自動將資料搬進搬出。

目前已邁入實作階段的 maDMPs 服務有歐盟資助的 Argos,其與歐盟的 OpenAIRE 和 EOSC 的相關服務進行整合,可讓研究者迅速取用不同平台的資料。

圖/Argos

DAMAP 則是另一類似的工具,其遵循 Science Europe 出版的「國際合用的研究資料管理實用指南」,以引導使用者填寫 DMP,而 DAMAP 在欄位設計上,亦遵循 RDA 工作小組所制定的標準,其匯出的 DMP 資料因此可被採用相同標準的服務自動取用。

DATA PUBLISHING IN THE OPEN SCIENCE ERA

本場次討論在自然科學領域,發布研究資料的相關議題,也討論如何消彌資料發布的障礙。

分享研究資料是開放科學的重要實踐項目之一,但在實踐上時常遭遇眾多複雜的阻礙。本場次的講者之一 Ohseok Kwon 教授分享了一篇 2014 年發表於 BMC Public Health 期刊上的文章,該文章透過實證研究,歸納出 6 類的資料分享障礙:技術、動機、經濟、政治、法律、倫理,並再進一步細分為 20 種不同的阻礙,如資料並未搜集(技術型阻礙)、欠缺信任(政治型阻礙)等。資料分享的複雜性可見一斑。

類似的研究,2021 年發表於 Scientifc Data 的研究,在向 199 名論文作者詢問資料後,亦彙整了其中 67 個拒絕分享資料的理由,「沒時間找資料」和「資料遺失」高居其中前兩名。

資料分享的困境,亦可從研究的準備工作就見端倪。來自密西根大學圖書館的報告者指出,根據其對該校所有的 DMP 進行分析的結果,僅有約 21% 的 DMP 會包含後設資料的陳述、僅有約 32% 包含了研究流程文件化的陳述,而若進一步深究兩者皆有提及的 DMP,更僅剩約 9% 左右。報告者 Jake Carlson 指出,這反映了研究人員普遍仍未意識到後設資料與文件化的建立,對研究資料分享至關重要,這是未來須強化的地方。

要改變資料分享與寄存的文化,由單一研究機構著力十分有限,跨學術機構的結盟時常是必要的。由十多個學術機構組成的「資料策展網絡(Data Curation Network, DCN)便是這樣的聯盟。

類似 DCN 的跨機構網絡,匯集了更充足的資源,可用以培訓來自各方的研究者,更完善地落實資料分享。相關網絡亦可為後續的資料策展提供一致的流程,並發展資料的策展標準。例如 DCN 即發展出了「資料策展入門(Data Curation Premier),針對不同類型的資料(如 PDF、Google 文件、Twitter 推文等)提供收藏上應有的考量與實作,供相關人員參考。

本場次的最後一部分,是由韓國科學技術研究院(Korea Institute of Science and Technology, KITSI)報告其對「資料論文」(Data Paper)的研究。資料論文是研究領域近來用以確保資料品質的重要方式之一。 根據 KITSI 的分析,全球資料論文的產量約自 2016 年後大幅上升,Elsevier 的加入,看來是造成明顯變化的主因。

CODATA-RDA SCHOOLS FOR RESEARCH DATA SCIENCE GROUP UPDATES AND NEW CHALLENGES

本場次由 CODATA-RDA School of Research Data Science 發起,討論該短期學校在經營永續性上的可能財務模式。

當代科學使用並生產了各式各樣的資料,研究人員是否具備充足的資料技能,往往是研究能否順利推展的關鍵。為此,CODATA 和 RDA 自 2016 年起,建立了 CODATA-RDA School(下稱「學校」),學校以數天至數週短期課程的方式,培力來自各國(特別是中低收入國家)研究人員相關的資料技能。

自 2016 年至今,學校所開設的課程總計已吸引逾 800 名的參與者。但如同研究資料會面臨如何永續保存的問題,資料學校也持續面臨組織如何方能永續有效運作的問題。

資料來源/CODATA-RDA Data Schools – Ignition Report

CODATA-RDA School 目前的經費主要來自各國政府或私部門所資助的專案經費(project funds)。計畫經費的使用有著用途固定、明確的優點,但也時常受到資金提供者的各種限制。

為了打造長期運作的模式,學校擘劃了兩種未來可能發展方向:小幅擴展、大幅擴展,並評估了兩類發展方式各別所需的活動及人事需求。

學校並設想了五種可能的資金來源:專案經費、CODATA 國家會員的額外資助、高教機構或研究組織的訂閱或貢獻、參與者付費、募資捐款,這五類來源可能交雜構成了未來的財務模式。

報告者也分析了各項經費來源的優缺點。例如「參與者付費」的優點,可能是學生會有較強的學習動機,學生也有正當理由去找尋不同來源的經費支持;但缺點則是學生可能對課程有較高的期待,而目前僅靠志願講師擔綱的課程,可能無法達到對應的要求等。

議程並邀請參與者針對各種可能資金來源集思廣益,例如提供可能資金贊助者的名單、或建立需求者間的國際網絡等,都是會議上曾被提出的建議。

或許是議程本身定位在意見蒐集,本場次在討論上並未有明確的結論。但可預見的是,隨著資料的重要性日益提升,這些與資料基礎建設攸關的學術財務或行政議題,在未來只會越來越受到重視,並不斷浮上檯面被討論。

海報:研究資料寄存所推展研究資料管理的現況 – ADVOCATING GOOD DATA PRACTICES: FROM RESEARCH DATA REPOSITORY TO RESEARCH DATA MANAGEMENT

除工作坊的議程外,RDA 大會歷來亦會有海報徵件的活動,讓研究者能透過自製海報,向與會者展示近來的工作成果。研究資料寄存所(depositar)在本次會議中也投稿海報,並順利入選

作為資料儲存庫的經營者,我們以「提倡良好的資料實務:從研究資料儲存庫到研究資料管理」為題,簡述台灣在研究資料管理的現況與背景、depositar 在推廣研究資料管理上的實踐、所習得的教訓、並描繪了研究資料管理與資料儲存庫的互動關係。

小結

確保資料具良好品質、可相互操作、可長期保存等特性,是以資料為底的科學研究能被持續推展的基礎。參與跨國界的科學合作,它們更是須被優先處理的基本議題。這些基本議題時常是由技術、經濟、政策、與法律等多面向交織而成,它們也構成了 International Data Week 多數議程的討論核心。

略嫌可惜的是,台灣對於這些基礎議題的討論與實踐仍少,國際會議的參與人數也不多。

但無論如何,2022 年國際資料週的所有場次(含 SciDataCon 2022 和 RDA Plenary 19)錄影均已在 8 月底公開,如有興趣一覽本次議程內容,可至以下網址,再次回顧這個全球的科學資料盛事。

研究資料寄存所 (depositar)_96
2 篇文章 ・ 2 位粉絲
研究資料寄存所 (depositar) 是由研究人員建立的線上資料儲存庫。所有人都能使用這個平台,自由地儲存、尋找、再次使用研究資料。