0

0
0

文字

分享

0
0
0

捕捉野生台北人:如何利用手機訊號資料,研究川流不息的人潮?

研之有物│中央研究院_96
・2018/03/16 ・4740字 ・閱讀時間約 9 分鐘 ・SR值 573 ・九年級

-----廣告,請繼續往下閱讀-----

  • 採訪編輯/廖英凱 美術編輯/張語辰

中研院人社中心的詹大千團隊與遠傳電信合作,利用資料探勘技術,分析電信公司所統計的行動裝置網路訊號,藉以建立更準確的人群流動預測模型,有助了解人口流動與社會經濟活動的關係。

人,是會流動的

你有沒有想過,一個地區、一個城市,甚至是一整個國家內部,「人」在哪裡、在哪裡工作、在哪裡居住?「長時間」的遷徙趨勢是往城市、還是往鄉村移動?「短時間」的通勤人口是來自外縣市還是不同行政區?

或者你會否好奇,不同的年齡層、性別有沒有不一樣的生活範圍、移動特徵?對於某一個商圈、公共設施的選址,是不是建立在一個適宜行人路過的良好地點?

這種探討與人類遷徙、移動、人口增減等現象的學科,就是「人口學」。

「人口學」觀察與調查區域人口的變化趨勢,來幫助我們理解一個區域的特徵,例如是否適宜居住、適宜生活、或是適宜工作? 圖片來源/iStock

人的流動可能是大尺度的遷移消長,也可能是小尺度的通勤或消費行為。人口學探討國家或大城市之間的人口消長、人口遷徙時,往往以「數個月」至「數年」作為時間尺度,並利用人口普查、抽查、電話問卷、民調訪談等方式,來了解指定地區的人數和習性。

-----廣告,請繼續往下閱讀-----

但是,像這樣子的調查方法,長期以來會有取樣代表性的疑慮,例如戶口抽查時,可能只會調查到剛好在家的族群。而藉由訪談或問卷來了解民眾生活型態,也會受到回憶偏差的影響。或是傳染病傳染區域、或傳染路徑的預測,運用許多假設與模型來猜測人移動的方式,而降低了預測的準確度。

「動態人口學」的概念被提出來,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與消費行為。

動態人口學:人口如何分布與流動

2005 年起,「動態人口學」的概念被提出來,在人口學的基礎上,透過研究概念與研究方法的改進,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與休閒消費行為,或是有脈絡地拆解出不同年齡層、性別、族群等的行為差異。

因此,研究者需要有比既有普查、抽查等方式,還能獲得更多資料的研究方法,例如,所取得的資料能精細到越短的時間尺度、越小的空間尺度,才有機會探討人口,如何處在動態中不斷變化,如何受到各種不同環境變數影響。

日常生活中,剛好有一種資料,能表現出「小尺度」的時間與空間下人口分布的特徵──就是行動裝置的上網資料。特別是今日的臺灣社會,平均一個人擁有兩個以上的手機門號,並且多用於持續性的行動上網。因此,透過電信公司於每個基地台所記錄到的行動裝置網路訊號,我們就可以藉此推估各個區域中的實際人口。

例如 google 利用手機定位紀錄來了解交通流量;國內電信業者,也曾紀錄正在行動上網的門號數量,來分析中元普渡時,人潮在基隆祭典園區內的流動趨勢。
 圖片來源/ Google 地圖

2017 年起,在「中央研究院資料科學種子研究計畫」支持下,中研院人社中心詹大千副研究員及其團隊,與遠傳電信合作。利用資料探勘技術分析電信公司所統計的行動裝置網路訊號,建立更為準確的人口調查方法、人群流動的演算法模型,以此了解人群的流動趨勢,來探索動態人口與社會經濟活動的關係。

為了確保個資隱私,研究運用的行動裝置網路訊號,並非追蹤每個人手機的定位,而是加總在不同時段、不同區域中的行動上網門號數。

在空間解析度上,研究團隊鎖定了「台北市」與「新北市」為研究範圍,以每 250 公尺 x 250 公尺作為一個網格。時間解析度上,則是以每 10 分鐘作為區間。

如果某一個手機門號的網路訊號,在同一網格中停留超過 10 分鐘則列入一次計數,這樣子的計數意義是將這個手機門號的使用者,視為停留在這個網格中、或是正在步行經過,而並非在交通通勤的路上匆匆擦身而過。因此,我們就可以假定這個使用者,有可能跟這個網格中的設施有所互動。

區分「居住」與「通勤」人口

將手機網路訊號統計資料應用於人口學,就能突破傳統研究的許多限制,例如過去對於居住人口、通勤人口、日間人口的估算,均需仰賴戶口普查抽查、或是民調訪談等。

詹大千團隊鎖定資料登記為 15 至 64 歲的遠傳電信用戶,並設定晚上 10 點至凌晨 3 點有行動上網訊號的紀錄為「手機夜間人口」,早上 10 點至下午 3 點則為「手機日間人口」,同時比對戶籍資料數作為「戶籍夜間人口」,就能分辨哪些人住在哪區(因為手機晚上在此有長期的網路訊號紀錄),而到了早上這些人又移動到哪區上班(因為手機白天在此有長期的網路訊號紀錄)。

從團隊推估結果,我們可以輕易地看出日間與夜間、住宅區和商業區的人口差異。也能發現不同性別的日夜分布區域也略有差別,比起傳統戶口調查的方式更為即時且準確。

行動網路訊號不僅可看出日夜人口分布的差異,還能看出男女也有細微的分布差異。資料來源/詹大千提供 圖說重製/廖英凱、張語辰

除了找出什麼類型的人,會在什麼地方工作或居住,上下班時刻看到的龐大人潮,也可以透過行動裝置的網路訊號,建構演算法來分析人口流動規律。只要計算隨時間推移,相鄰網格的人數變化差異,我們就可以掌握人群的移動方向與移動速度。

例如,詹大千團隊發現上午 8:50 、 9:40 和下午 5:00,是人口流速最大的三個時段,而且人潮熱區也不同,這就可供交通部門規劃合適的通勤疏運方案。

以 40-49 歲男性為例。早上 8:50 通勤時,人潮主要往車站、捷運站移動,到了 9:40 上班時間,人潮主要位於市中心、內湖。下班時間 5:00,人潮往通勤區域回巢。 資料來源/詹大千 圖說重製/廖英凱、張語辰

統計同一天中 40-49 歲人口的流動狀況,也可以發現在信義計畫區一帶,女性的人潮明顯多於男性。這樣的發現有助於研究者了解性別在不同產業或地區的差異,有機會更進一步找出社會結構的問題、與政策制度的改善方向。

在信義計畫區,可看到女性人潮明顯多於男性。 資料來源/詹大千 圖說重製/廖英凱、張語辰

而不同年齡層的流動區域也有差異,甚至透露著生活型態。以 2017/1/10(二)為例,這天是學期末, 18-24 歲男性多分佈於各學區。這天也是工作日,40-49 歲男性多位於市中心與捷運沿線人口稠密區。而 65-84 歲男性,則與前述兩個年齡層有較不一樣的分佈,例如集中在北投、萬華一帶活動。

同一時段中,三個年齡層的男性,在地圖上流動的熱點區域。 資料來源/詹大千 圖說重製/廖英凱、張語辰

結合政府開放資料:電子發票、土地利用

圖/Pexels @Pixabay

有了人口隨時間與空間流動的趨勢,進一步再結合內政部的「國土利用調查資料」與財政部的「電子發票開放資料」,詹大千團隊就能更入微地分類行動用戶的族群,並推測其生活特徵、消費行為、經濟能力。

例如從「時間」來分群,可以觀察到有兩種群體:一種是在白天出沒、離開居住地;另外一種則是早晚出沒、離開居住地。比較兩群體的消費能力,會發現白天出沒的族群消費力較高,早晚出沒的族群消費力則較低。

從「出沒地點」來看,白天出沒的族群分布於服務業、商業住宅、小學與大專校院;而日夜出沒的族群則主要集中於住宅區。

因此,從上述資料中,我們就可以推測出:白天出沒的族群,可能就是上班族、服務業等大部分通勤族群;而早晚出沒的族群,則可能是家管與退休人員。

因此,研究者就可以藉此了解一個地區中通勤族與家管、退休待業族群的人口差異。地方政府主管機關,也可以利用這樣的推估成果,設計符合該地區的社區營造、或是足以負荷人流的交通規劃。

整體人口的移動,其實是由許多種不同的人流所組成。若能細緻地分群、找出每一種分群的移動規律,也能將過往的人流資料當作機器學習的訓練資料(請見下方影片的上半部 Groundtruth Data),提升電腦預測未來人流路徑的準確度(請見下方影片的下半部 Predicting Data)。

資料開放 vs. 隱私機密的拉鋸

利用手機網路資料,可以更即時、更準確地掌握人口流動的趨勢。一切的關鍵,也在於有沒有辦法取得這些資料,以及取得資料後會不會損害個人隱私。因此,資料必須去除個資、去識別化後才能被使用。

依目前政府規定,這些手機門號、網路訊號資料被歸為電信業者的財產,電信業者可在不涉及個資隱私的狀況下運用,但也需肩負監管責任。研究中大量應用到在單一網格中的行動網路訊號數量,對於電信業者來說,其實是一個不方便公諸於世的商業機密。

詹大千團隊有賴遠傳電信指派數位協同人員,協助將資料整理成符合法規、並合適電腦分析的格式,才得以進行這系列動態人口研究。團隊研究中遇到的另一個難題,是政府管理的電子發票開放資料時空解析度不足,且開放效率也不夠積極,導致無法更細微地分割各區域的商業活動、與人口流動的關係。

其實,運用資料科學來解決問題,已然是近年來相當熱門的潮流,各公私部門也多紛紛積極地開辦各種黑客松競賽,希望透過網路社群、技術社群的活力,運用政府資料來發現問題、解決問題。因此,若政府能提升資料品質,並為研究社群建立取得資料的合適管道,就有機會讓更多研究者透過資料科學,找到隱藏於巨量資料中的關鍵線索,一窺社會的真實面貌。

本文動態人口研究團隊:郭巧玲(前排左一)、詹大千(前排中)、林柏丞(前排右一)、陳建州(後排左一)、林子佑(後排右一)。 攝影/廖英凱

延伸閱讀:

  • 詹大千的個人網頁
  • 林柏丞、郭巧玲、葉耀鮮、楊毓仁、魏敬玲、江麗香、詹大千*,2017,〈運用開放式地理資訊架構於登革熱防疫機制之研究〉,《醫療資訊雜誌》,26(3), 1-14。
  • Jia-Hong Tang,Yen-Hui Chiu,Po-Huang Chiang,Ming-Daw Su,Ta-Chien Chan*, 2017, “A Flow-based Statistical Model Integrating Spatial and Nonspatial Dimensions to Measure Healthcare Access”, HEALTH & PLACE, 47C, 126-138.
  • 章可藍、蔡煜書、詹大千、束連文、陳娟瑜、顏正芳、 余沛蓁、徐睿、蔡文瑛、陳為堅*,2016,〈地理資訊系統應用於毒品查獲空間分布:縣市毒品查獲地點的分析〉,《台灣公共衛生雜誌》,35(6), 671-684。
  • 鄧詠竹、郭巧玲、陳建州、葉耀鮮、高瑞鴻、林柏丞、范毅軍、詹大千*,2016,〈利用政府開放性資料建構台灣線上互動式疾病死因地圖〉,《台灣公共衛生雜誌》,第35卷第5期,頁553-566。
  • Simini, F., González, M. C., Maritan, A., & Barabási, A. L. (2012). A universal model for mobility and migration patterns. Nature, 484(7392), 96-100.

本著作由研之有物製作,原文為《從手機網路訊號資料,探勘人口動態奧妙》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3914 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
為什麼越累越難睡?當大腦想下班,「腸道」卻還在加班!
鳥苷三磷酸 (PanSci Promo)_96
・2026/04/30 ・2519字 ・閱讀時間約 5 分鐘

本文與  益福生醫 合作,泛科學企劃執行

昨晚,你又在床上翻來覆去、無法入眠了嗎?這或許是現代社會最普遍的深夜共鳴。儘管換了昂貴的乳膠枕、拉上百分之百遮光的窗簾,甚至在腦海中數了幾百隻羊,大腦的那個「睡眠開關」卻彷彿生鏽般卡住。這種渴望休息卻睡不著的過程,讓失眠成了一場耗損身心的極限馬拉松 。

皮質醇:你體內那位「永不熄滅」的深夜警報器

要理解失眠,我們得先認識身體的一套精密防衛系統:下視丘-垂體-腎上腺軸(HPA axis) 。這套系統原本是演化給我們的禮物,讓我們在面對劍齒虎或突如其來的危險時,能迅速進入「戰鬥或快逃」的備戰狀態。當這套系統啟動,腎上腺就會分泌皮質醇 (壓力荷爾蒙),這種荷爾蒙能調動能量、提高警覺性,讓我們在危機中保持清醒 。

然而,現代人的「劍齒虎」不再是野獸,而是無止盡的專案進度、電子郵件與職場競爭。對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態。

-----廣告,請繼續往下閱讀-----

在理想的狀態下,人類的生理時鐘像是一場精確的接力賽。入夜後,身體會進入「修復模式」,此時壓力荷爾蒙「皮質醇」的濃度應該降至最低點,讓「睡眠荷爾蒙」褪黑激素(Melatonin)接棒主導。褪黑激素不僅負責傳遞「天黑了」的訊號,它還能抑制腦中負責維持清醒的食慾素(Orexin)神經元,幫助大腦順利關閉覺醒開關。

對於長期處於高壓或高強度工作環境的人們來說,身體的警報系統可能處於一種「切換不掉」的狀態 / 圖片來源:envato

然而,當壓力介入時,這場接力賽就會變成跑不完的馬拉松賽。研究指出,長期的高壓環境會導致 HPA 軸過度活化,使得夜間皮質醇異常分泌。這不僅會抑制褪黑激素的分泌,更會讓食慾素在深夜裡持續活化,強迫大腦維持在「高覺醒狀態(Hyperarousal)」。 這種令人崩潰的狀態就是,明明你已經累到不行,但大腦卻像停不下來的發電機!

長期的睡眠不足會導致體內促發炎細胞激素上升,而發炎反應又會進一步活化 HPA 軸,分泌更多皮質醇來試圖消炎,高濃度的皮質醇會進一步干擾深層睡眠與快速動眼期(REM),導致睡眠品質變得低弱又破碎,最終形成「壓力-發炎-失眠」的惡行循環。也就是說,你不是在跟睡眠上的意志力作對,而是在跟失控的生理長期鬥爭。

從腸道重啟好眠開關:PS150 菌株如何調校你的生理時鐘

面對這種煞車失靈的失眠困局,科學家們將目光投向了人體內另一個繁榮的生態系:腸道。腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」,而某些特殊菌株不僅能幫助消化、排便,更能透過神經與內分泌途徑與大腦對話,直接參與調節我們的壓力調節與睡眠節律。這種菌株被科學家稱為「精神益生菌」(Psychobiotics)。

-----廣告,請繼續往下閱讀-----
腸道與大腦之間存在著一條雙向通訊的高速公路,這就是「菌-腸-腦軸 (Microbiome-Gut-Brain Axis, MGBA)」/圖片來源:益福生醫

在眾多研究菌株中,發酵乳桿菌 Limosilactobacillus fermentum PS150 的表現格外引人注目。PS150菌株源於亞洲益生菌權威「蔡英傑教授」團隊的專業研發,累積多年功能性菌株研發經驗的科學成果。針對臨床常見的「初夜效應」(First Night Effect, FNE),也就是現代人因出差、換床或環境改變導致的入睡困難,俗稱認床。科學家在進行實驗時發現,補充 PS150 菌株能顯著恢復非快速動眼期(NREM)的睡眠長度,且入睡更快,起床後也更容易清醒。更重要的是,不同於常見的藥物助眠手段(如抗組織胺藥物 DIPH)容易造成快速動眼期(REM)剝奪或導致睡眠破碎化,PS150 菌株展現出一種更為「溫和且自然」的調節力,它能有效縮短入睡所需的時間,並恢復睡眠中代表深層修復的「Delta 波」能量。

科學家發現,即便將 PS150 菌株經過特殊的熱處理(Heat-treated),轉化為不具活性但保有關鍵成分的「後生元」(Postbiotics),其生物活性依然能與活菌媲美 。HT-PS150 技術解決了益生菌在儲存與攝取過程中容易失去活性的痛點,讓這些腸道通訊員能更穩定地發揮作用 。

在臨床實驗中,科學家觀察到一個耐人尋味的現象:當詢問受試者的主觀感受時,往往會遇到強大的「安慰劑效應」,無論是服用 HT-PS150 還是安慰劑的人,主觀上大多表示睡眠變好了。這種「體感上的進步」有時會掩蓋真相,讓人分不清是心理作用還是真實效益。

然而,客觀的生理數據(Biomarkers)卻揭開了關鍵的差異。在排除主觀偏誤後,實驗數據顯示 HT-PS150 組有更高比例的人(84.6%)出現了夜間褪黑激素分泌增加,且壓力荷爾蒙(皮質醇)顯著下降,這證明了菌株確實啟動了體內的睡眠調控系統,而不僅僅是心理安慰。

-----廣告,請繼續往下閱讀-----

最值得關注的是,對於那些失眠指數較高(ISI ≧ 8)的族群,這種「生理修復」與「主觀體感」終於達成了一致。這群人在補充 HT-PS150 後,不僅生理標記改善,連原本嚴重困擾的主觀睡眠效率、持續時間,以及焦慮感也出現了顯著的進步。

了解更多PS150助眠益生菌:https://lihi3.me/KQ4zi

重新定義深層睡眠:構建全方位的深夜修復計畫

睡眠從來就不只是單純的休息,而是一場生理功能的全面重整。想要重獲高品質的睡眠,關鍵在於為自己建立一個全方位的修復生態系。

這套系統的基石,始於良好的生活習慣。從減少睡前數位螢幕的干擾、優化室內環境,到作息調整。當我們透過規律作息來穩定神經系統,並輔以現代科學對於 PS150 菌株的調節力發現,身體便能更順暢地啟動睡眠開關,回歸自然的運作節律。

-----廣告,請繼續往下閱讀-----

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通。透過生活作息的調整與科學實證的支持,每個人都能擁有掌控睡眠的主動權。現在就從優化生活型態開始,為自己按下那個久違的、如嬰兒般香甜的關機鍵吧。

與其將失眠視為意志力的抗爭,不如將其看作是生理機能與腸道微生態的深度溝通 / 圖片來源 : envato

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
247 篇文章 ・ 319 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

104
0

文字

分享

0
104
0
肺部為何會「結疤」?揭開比癌症更致命的「菜瓜布肺」,科學家如何找到破解惡性循環的新契機
鳥苷三磷酸 (PanSci Promo)_96
・2026/05/08 ・2041字 ・閱讀時間約 4 分鐘

本文由 肺纖維化(菜瓜布肺)社團衛教 合作,泛科學撰文

在現代醫學的警示清單裡,乳癌、大腸癌這些疾病大家都不陌生;但有一個「隱蔽且致命」的威脅卻常被忽視,那就是「肺纖維化」。其中最常見的類型「特發性肺纖維化」(IPF),其預後往往不太樂觀,確診後的五年存活率甚至比許多常見的癌症還低。

首先,我們得先破解一個迷思:肺纖維化並不是單一疾病,而是許多種間質性肺病的共同表現。當我們聽到「肺纖維化」,腦中常浮現「菜瓜布肺」的形象,患者的肺部外觀充滿一個個空洞與疤痕,像極了乾燥的絲瓜。這精準描繪了肺部組織逐漸硬化、失去彈性的過程。

更重要的是,IPF 這類肺纖維化的威脅在於「不可逆」的特性,一旦形成就很難逆轉。這跟部分 COVID-19 康復者身上、仍有機會復原的肺纖維化,是兩種完全不同的概念。

-----廣告,請繼續往下閱讀-----
IPF 這類肺纖維化的威脅在於「不可逆」的特性,一旦形成就很難逆轉 / 圖示來源:shutterstock

肺部為何會變成「菜瓜布」?

為什麼好端端的肺會變成菜瓜布?這其實是一場身體修復機制失控的結果。

「纖維化」的組織,就是肺部間質組織(interstitium)的疤痕化。間質是圍繞在肺泡周圍,包含血管與支持肺部結構的結締組織。在正常情況下,肺部損傷後會啟動修復機制,並再生健康組織。但在肺纖維化的患者體內,這套修復機制卻「當機」了。

身體會不斷地發出訊號,導致負責修復工作的「纖維母細胞」(fibroblasts)被過度活化,進而失控地沉積膠原蛋白疤痕組織,最終在肺部形成永久性的纖維化。

科學家發現,這個過程之所以棘手,在於它是一個「惡性循環」,肺部同時存在著「發炎反應」與「纖維化」這兩條路徑 ,它們相互加乘,演變成難以阻斷的強大破壞力。

-----廣告,請繼續往下閱讀-----

雖然特發性肺纖維化 (IPF) 的具體成因不明 ,但已知某些特定族群的風險更高。例如抽菸,特定年齡與性別(50歲以上男性)、長期暴露於粉塵環境的工作者(農業、畜牧業、採礦業…)、胃食道逆流者。此外,患有自體免疫疾病(如類風濕性關節炎、乾燥症、硬皮症、皮肌炎/多發性肌炎,)的患者,他們併發肺纖維化的機率遠高於一般人,必須特別警覺。

雖然特發性肺纖維化 (IPF) 的具體成因不明 ,但已知某些特定族群的風險更高。/ 圖示來源:shutterstock

打斷惡性循環的挑戰,為何只對抗「纖維化」還不夠?

面對這個不可逆的疾病,醫學界長年束手無策,直到 2014 年才迎來一道曙光。美國 FDA 批准了兩種機制不同的新藥:Nintedanib 和 Pirfenidone。這兩種藥物的出現是治療史上的分水嶺,首度被證實能夠「延緩」IPF 患者肺功能的惡化速度。

然而,這場戰役尚未結束。現有的治療雖然帶來了希望,卻也凸顯了「未被滿足的醫療需求」。從機制上來看,這些藥物主要抑制的是「纖維化路徑」。

這讓科學界開始思考這個未被滿足的棘手問題:既然疾病的本質是「發炎」與「纖維化」的雙重打擊,那麼,我們是否能找到「同時抑制」這兩條路徑的全新策略,從而更有效地打斷這個惡性循環?

-----廣告,請繼續往下閱讀-----

找到同時調控「發炎」與「纖維化」的新靶點

為了解決難題,科學家將目光鎖定在一個細胞內的酵素:磷酸二酯酶 4B(PDE4B)

為什麼鎖定它?讓我們看看它的「雙重作用」機制:

  1. 關鍵位置: PDE4B 同時存在於免疫細胞(與發炎有關)與纖維母細胞(與纖維化有關)當中。
  2. 作用機制: PDE4B 的主要工作是降解細胞內一種叫 cAMP(環磷酸腺苷) 的訊號分子。cAMP 可以被視為細胞內的「穩定信號」。
  3. 雙重抑制: 當我們使用藥物抑制了 PDE4B 的活性,細胞內的 cAMP 就不會被分解,濃度會隨之升高。高濃度的 cAMP 能穩定免疫細胞和纖維母細胞,同時產生抗發炎抗纖維化的雙重效應。

簡單來說,鎖定並抑制 PDE4B,就像是同時抑制了免疫風暴與纖維化的工程,有望從雙從抑制打擊這個惡性循環。

全球臨床試驗帶來的新希望

近十年來,全球在肺纖維化領域投入了大量的臨床試驗,我們相信,在科學家逐步破解肺纖維化惡性循環的複雜難題後,期盼未來能為無數患者爭取到更安全、健康的生活與未來。

-----廣告,請繼續往下閱讀-----

最後,我們必須再次提醒,特發性肺纖維化(IPF)與漸進性肺纖維化(PPF)是極具破壞性、且不可逆的疾病。面對這個比癌症更致命的對手,雖然現有的治療手段能延緩惡化,但無法逆轉已經形成的肺部疤痕組織,因此「早期診斷、早期治療」仍是對抗肺纖維化最重要的黃金時刻。

必須再次提醒,特發性肺纖維化(IPF)與漸進性肺纖維化(PPF)是極具破壞性、且不可逆的疾病。/ 圖示來源:


-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

2
2

文字

分享

0
2
2
資料科學與研究資料管理的最前沿:2022 國際資料週
研究資料寄存所 (depositar)_96
・2022/10/07 ・5342字 ・閱讀時間約 11 分鐘

想和來自全世界的科學家、研究者、政策制定者、企業領袖等一起討論資料議題,想跟上資料科學與研究資料管理最前沿的腳步?國際資料週(International Data Week, IDW)是最好的選擇之一。

國際資料週是什麼?

「國際資料週」是由研究資料聯盟(Research Data Alliance, RDA)以及國際科學理事會(Internatioanl Science Counci, lSC)所屬的資料委員會(Committee on Data, CODATA)、世界資料系統(World Data System, WDS)所共同舉辦的資料科學盛事。自 2016 年起,通常每兩年舉辦一次,吸引近千名全球參與者。因為 COVID-19,2020 年的大會延到今年六月在首爾舉行。

國際資料週的議程由兩個大型研討會構成。例如 2022 的國際資料週,即結合了 RDA 第 19 次大會(RDA 19th Plenary Meeting)與 2022 年的科學資料會議(SciDataCon 2022 )這兩項會議。RDA 大會專注於促進資料分享與再利用的討論,SciDataCon 則著墨在研究資料的前沿議題。

2022 為 IDW 第 3 次舉行,議程為期 5 天,於今年的 6 月 20-24 日,在南韓首爾舉行,主題為「用資料改善世界」(Data To Improve Our World)。因  COVID-19 疫情,採實體與虛擬會議併行,議程總計約 150 場次。在 8 月底,RDA 大會與 SciDataCon 已將多數議程的錄影開放給所有人線上觀看(連結見本文最末)。

-----廣告,請繼續往下閱讀-----

研究資料寄存所(depositar) 團隊也參與了本次會議,我們除加入各場次的討論外,亦參加海報徵件,向所有與會者說明我們近來在研究資料管理上的工作。筆者參與會議的部分場次,礙於篇幅,以下僅紀錄筆者感興趣的報告與討論。

場次紀錄:如何提高研究成果的可再重現或可複製性?

SUPPORTING RESEARCH TRANSPARENCY, ACCOUNTABILITY, AND REPRODUCIBILITY: LESSONS FROM THE TRENCHES

本場次專注討論研究成果在「運算」上的可再重現(reproducibility)或可複製性(replicability)。

有關研究成果可否被重現或複製,攸關該研究的可信度與透明性。美國國家學院(The National Academy of Science, Engineer, Medicine)在 2019 年出版了《科學的可重現與可複製性》報告,是研究者可參考的重要指引。

研究不可重現的原因眾多,在本場次中,來自 AGU 的 Shelly Stall 即指出,如紀錄不足、報告不透明、數位技術過時、或嘗試重現的過程有缺陷等,皆可能是研究結果無法重現的原因;要改善這類狀況,則可從分享資料與工作流程、對數位物件編配持續識別碼、強化資料引用、建立數位物件的說明等方面著手進行。

-----廣告,請繼續往下閱讀-----

對此,來自 CURE 的講者們亦分享其機構內的作法。CURE 是由康乃爾大學、北卡羅萊納大學教堂山分校、以及耶魯大學等組成的聯盟,致力於倡議並實作研究在運算領域的可重現性。CURE 的運作環繞著四個基本原則:(1) 透明、近用、信任 (2) 可使用性 (3) 獨立性 (4) 出版前的研究重現(pre-publication)。

上述四個原則的完整說明,可在 CURE 的網頁上取得,例如獨立性即意味著可重現性必須「能在獨立的運算環境,交由獨立的第三方來確認」。

CURE 的成員亦分享了其如何實踐計算上的可重現性。例如康乃爾的社會科學中心的講者即表示,他們提供了全整合的服務(All-in-one service),除提供程式碼驗證的服務外,亦有經營資料儲存庫,將研究重現所需的資料悉數打包,存放於該機構的服務內,供他人使用或引用。

BEYOND MACHINE-ACTIONABLE DMPS – LET’S GO FORWARD TOGETHER!

本場次介紹「機器可操作的資料管理方案(machine-actionable Data Management Plans, maDMPs)」的近來發展。

-----廣告,請繼續往下閱讀-----

DMP 是描述研究資料將如何被蒐集、使用、管理、(短期或長期)保存、分享等歷程的文件(有關 DMP 的介紹可見此)。 傳統上在撰寫 DMP 時,多是仰賴書寫以整理多方資料整理的工具與資源;而若完成的內容要挪作他用,亦多只能以人工手動進行。

為使 DMP 的內容能取用不同機器的資料,並在機器間進行順暢流通,RDA 自 2017 年起組成工作小組,擬定共通的控制語彙,以在人類可讀的條件下,實現機器可操作的 DMP。

經歷了數年的發展,採用該語彙的 maDMPs 服務亦已逐漸成形。在介紹何謂 maDMP 時,本場次講者 Tomasz Miksa 即指出,maDMP 就如各系統間的「膠水」,它能連結各個不同的研究系統,並自動將資料搬進搬出。

目前已邁入實作階段的 maDMPs 服務有歐盟資助的 Argos,其與歐盟的 OpenAIRE 和 EOSC 的相關服務進行整合,可讓研究者迅速取用不同平台的資料。

-----廣告,請繼續往下閱讀-----
圖/Argos

DAMAP 則是另一類似的工具,其遵循 Science Europe 出版的「國際合用的研究資料管理實用指南」,以引導使用者填寫 DMP,而 DAMAP 在欄位設計上,亦遵循 RDA 工作小組所制定的標準,其匯出的 DMP 資料因此可被採用相同標準的服務自動取用。

DATA PUBLISHING IN THE OPEN SCIENCE ERA

本場次討論在自然科學領域,發布研究資料的相關議題,也討論如何消彌資料發布的障礙。

分享研究資料是開放科學的重要實踐項目之一,但在實踐上時常遭遇眾多複雜的阻礙。本場次的講者之一 Ohseok Kwon 教授分享了一篇 2014 年發表於 BMC Public Health 期刊上的文章,該文章透過實證研究,歸納出 6 類的資料分享障礙:技術、動機、經濟、政治、法律、倫理,並再進一步細分為 20 種不同的阻礙,如資料並未搜集(技術型阻礙)、欠缺信任(政治型阻礙)等。資料分享的複雜性可見一斑。

類似的研究,2021 年發表於 Scientifc Data 的研究,在向 199 名論文作者詢問資料後,亦彙整了其中 67 個拒絕分享資料的理由,「沒時間找資料」和「資料遺失」高居其中前兩名。

-----廣告,請繼續往下閱讀-----

資料分享的困境,亦可從研究的準備工作就見端倪。來自密西根大學圖書館的報告者指出,根據其對該校所有的 DMP 進行分析的結果,僅有約 21% 的 DMP 會包含後設資料的陳述、僅有約 32% 包含了研究流程文件化的陳述,而若進一步深究兩者皆有提及的 DMP,更僅剩約 9% 左右。報告者 Jake Carlson 指出,這反映了研究人員普遍仍未意識到後設資料與文件化的建立,對研究資料分享至關重要,這是未來須強化的地方。

要改變資料分享與寄存的文化,由單一研究機構著力十分有限,跨學術機構的結盟時常是必要的。由十多個學術機構組成的「資料策展網絡(Data Curation Network, DCN)便是這樣的聯盟。

類似 DCN 的跨機構網絡,匯集了更充足的資源,可用以培訓來自各方的研究者,更完善地落實資料分享。相關網絡亦可為後續的資料策展提供一致的流程,並發展資料的策展標準。例如 DCN 即發展出了「資料策展入門(Data Curation Premier),針對不同類型的資料(如 PDF、Google 文件、Twitter 推文等)提供收藏上應有的考量與實作,供相關人員參考。

本場次的最後一部分,是由韓國科學技術研究院(Korea Institute of Science and Technology, KITSI)報告其對「資料論文」(Data Paper)的研究。資料論文是研究領域近來用以確保資料品質的重要方式之一。 根據 KITSI 的分析,全球資料論文的產量約自 2016 年後大幅上升,Elsevier 的加入,看來是造成明顯變化的主因。

-----廣告,請繼續往下閱讀-----

CODATA-RDA SCHOOLS FOR RESEARCH DATA SCIENCE GROUP UPDATES AND NEW CHALLENGES

本場次由 CODATA-RDA School of Research Data Science 發起,討論該短期學校在經營永續性上的可能財務模式。

當代科學使用並生產了各式各樣的資料,研究人員是否具備充足的資料技能,往往是研究能否順利推展的關鍵。為此,CODATA 和 RDA 自 2016 年起,建立了 CODATA-RDA School(下稱「學校」),學校以數天至數週短期課程的方式,培力來自各國(特別是中低收入國家)研究人員相關的資料技能。

自 2016 年至今,學校所開設的課程總計已吸引逾 800 名的參與者。但如同研究資料會面臨如何永續保存的問題,資料學校也持續面臨組織如何方能永續有效運作的問題。

資料來源/CODATA-RDA Data Schools – Ignition Report

CODATA-RDA School 目前的經費主要來自各國政府或私部門所資助的專案經費(project funds)。計畫經費的使用有著用途固定、明確的優點,但也時常受到資金提供者的各種限制。

-----廣告,請繼續往下閱讀-----

為了打造長期運作的模式,學校擘劃了兩種未來可能發展方向:小幅擴展、大幅擴展,並評估了兩類發展方式各別所需的活動及人事需求。

學校並設想了五種可能的資金來源:專案經費、CODATA 國家會員的額外資助、高教機構或研究組織的訂閱或貢獻、參與者付費、募資捐款,這五類來源可能交雜構成了未來的財務模式。

報告者也分析了各項經費來源的優缺點。例如「參與者付費」的優點,可能是學生會有較強的學習動機,學生也有正當理由去找尋不同來源的經費支持;但缺點則是學生可能對課程有較高的期待,而目前僅靠志願講師擔綱的課程,可能無法達到對應的要求等。

議程並邀請參與者針對各種可能資金來源集思廣益,例如提供可能資金贊助者的名單、或建立需求者間的國際網絡等,都是會議上曾被提出的建議。

或許是議程本身定位在意見蒐集,本場次在討論上並未有明確的結論。但可預見的是,隨著資料的重要性日益提升,這些與資料基礎建設攸關的學術財務或行政議題,在未來只會越來越受到重視,並不斷浮上檯面被討論。

海報:研究資料寄存所推展研究資料管理的現況 – ADVOCATING GOOD DATA PRACTICES: FROM RESEARCH DATA REPOSITORY TO RESEARCH DATA MANAGEMENT

除工作坊的議程外,RDA 大會歷來亦會有海報徵件的活動,讓研究者能透過自製海報,向與會者展示近來的工作成果。研究資料寄存所(depositar)在本次會議中也投稿海報,並順利入選

作為資料儲存庫的經營者,我們以「提倡良好的資料實務:從研究資料儲存庫到研究資料管理」為題,簡述台灣在研究資料管理的現況與背景、depositar 在推廣研究資料管理上的實踐、所習得的教訓、並描繪了研究資料管理與資料儲存庫的互動關係。

小結

確保資料具良好品質、可相互操作、可長期保存等特性,是以資料為底的科學研究能被持續推展的基礎。參與跨國界的科學合作,它們更是須被優先處理的基本議題。這些基本議題時常是由技術、經濟、政策、與法律等多面向交織而成,它們也構成了 International Data Week 多數議程的討論核心。

略嫌可惜的是,台灣對於這些基礎議題的討論與實踐仍少,國際會議的參與人數也不多。

但無論如何,2022 年國際資料週的所有場次(含 SciDataCon 2022 和 RDA Plenary 19)錄影均已在 8 月底公開,如有興趣一覽本次議程內容,可至以下網址,再次回顧這個全球的科學資料盛事。

-----廣告,請繼續往下閱讀-----
研究資料寄存所 (depositar)_96
2 篇文章 ・ 2 位粉絲
研究資料寄存所 (depositar) 是由研究人員建立的線上資料儲存庫。所有人都能使用這個平台,自由地儲存、尋找、再次使用研究資料。