0

0
0

文字

分享

0
0
0

捕捉野生台北人:如何利用手機訊號資料,研究川流不息的人潮?

研之有物│中央研究院_96
・2018/03/16 ・4734字 ・閱讀時間約 9 分鐘 ・SR值 573 ・九年級

國民法官生存指南:用足夠的智識面對法庭裡的一切。

  • 採訪編輯/廖英凱 美術編輯/張語辰

中研院人社中心的詹大千團隊與遠傳電信合作,利用資料探勘技術,分析電信公司所統計的行動裝置網路訊號,藉以建立更準確的人群流動預測模型,有助了解人口流動與社會經濟活動的關係。

人,是會流動的

你有沒有想過,一個地區、一個城市,甚至是一整個國家內部,「人」在哪裡、在哪裡工作、在哪裡居住?「長時間」的遷徙趨勢是往城市、還是往鄉村移動?「短時間」的通勤人口是來自外縣市還是不同行政區?

或者你會否好奇,不同的年齡層、性別有沒有不一樣的生活範圍、移動特徵?對於某一個商圈、公共設施的選址,是不是建立在一個適宜行人路過的良好地點?

這種探討與人類遷徙、移動、人口增減等現象的學科,就是「人口學」。

「人口學」觀察與調查區域人口的變化趨勢,來幫助我們理解一個區域的特徵,例如是否適宜居住、適宜生活、或是適宜工作? 圖片來源/iStock

人的流動可能是大尺度的遷移消長,也可能是小尺度的通勤或消費行為。人口學探討國家或大城市之間的人口消長、人口遷徙時,往往以「數個月」至「數年」作為時間尺度,並利用人口普查、抽查、電話問卷、民調訪談等方式,來了解指定地區的人數和習性。

但是,像這樣子的調查方法,長期以來會有取樣代表性的疑慮,例如戶口抽查時,可能只會調查到剛好在家的族群。而藉由訪談或問卷來了解民眾生活型態,也會受到回憶偏差的影響。或是傳染病傳染區域、或傳染路徑的預測,運用許多假設與模型來猜測人移動的方式,而降低了預測的準確度。

「動態人口學」的概念被提出來,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與消費行為。

動態人口學:人口如何分布與流動

2005 年起,「動態人口學」的概念被提出來,在人口學的基礎上,透過研究概念與研究方法的改進,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與休閒消費行為,或是有脈絡地拆解出不同年齡層、性別、族群等的行為差異。

因此,研究者需要有比既有普查、抽查等方式,還能獲得更多資料的研究方法,例如,所取得的資料能精細到越短的時間尺度、越小的空間尺度,才有機會探討人口,如何處在動態中不斷變化,如何受到各種不同環境變數影響。

日常生活中,剛好有一種資料,能表現出「小尺度」的時間與空間下人口分布的特徵──就是行動裝置的上網資料。特別是今日的臺灣社會,平均一個人擁有兩個以上的手機門號,並且多用於持續性的行動上網。因此,透過電信公司於每個基地台所記錄到的行動裝置網路訊號,我們就可以藉此推估各個區域中的實際人口。

例如 google 利用手機定位紀錄來了解交通流量;國內電信業者,也曾紀錄正在行動上網的門號數量,來分析中元普渡時,人潮在基隆祭典園區內的流動趨勢。
 圖片來源/ Google 地圖

2017 年起,在「中央研究院資料科學種子研究計畫」支持下,中研院人社中心詹大千副研究員及其團隊,與遠傳電信合作。利用資料探勘技術分析電信公司所統計的行動裝置網路訊號,建立更為準確的人口調查方法、人群流動的演算法模型,以此了解人群的流動趨勢,來探索動態人口與社會經濟活動的關係。

為了確保個資隱私,研究運用的行動裝置網路訊號,並非追蹤每個人手機的定位,而是加總在不同時段、不同區域中的行動上網門號數。

在空間解析度上,研究團隊鎖定了「台北市」與「新北市」為研究範圍,以每 250 公尺 x 250 公尺作為一個網格。時間解析度上,則是以每 10 分鐘作為區間。

如果某一個手機門號的網路訊號,在同一網格中停留超過 10 分鐘則列入一次計數,這樣子的計數意義是將這個手機門號的使用者,視為停留在這個網格中、或是正在步行經過,而並非在交通通勤的路上匆匆擦身而過。因此,我們就可以假定這個使用者,有可能跟這個網格中的設施有所互動。

區分「居住」與「通勤」人口

將手機網路訊號統計資料應用於人口學,就能突破傳統研究的許多限制,例如過去對於居住人口、通勤人口、日間人口的估算,均需仰賴戶口普查抽查、或是民調訪談等。

詹大千團隊鎖定資料登記為 15 至 64 歲的遠傳電信用戶,並設定晚上 10 點至凌晨 3 點有行動上網訊號的紀錄為「手機夜間人口」,早上 10 點至下午 3 點則為「手機日間人口」,同時比對戶籍資料數作為「戶籍夜間人口」,就能分辨哪些人住在哪區(因為手機晚上在此有長期的網路訊號紀錄),而到了早上這些人又移動到哪區上班(因為手機白天在此有長期的網路訊號紀錄)。

從團隊推估結果,我們可以輕易地看出日間與夜間、住宅區和商業區的人口差異。也能發現不同性別的日夜分布區域也略有差別,比起傳統戶口調查的方式更為即時且準確。

行動網路訊號不僅可看出日夜人口分布的差異,還能看出男女也有細微的分布差異。資料來源/詹大千提供 圖說重製/廖英凱、張語辰

除了找出什麼類型的人,會在什麼地方工作或居住,上下班時刻看到的龐大人潮,也可以透過行動裝置的網路訊號,建構演算法來分析人口流動規律。只要計算隨時間推移,相鄰網格的人數變化差異,我們就可以掌握人群的移動方向與移動速度。

例如,詹大千團隊發現上午 8:50 、 9:40 和下午 5:00,是人口流速最大的三個時段,而且人潮熱區也不同,這就可供交通部門規劃合適的通勤疏運方案。

以 40-49 歲男性為例。早上 8:50 通勤時,人潮主要往車站、捷運站移動,到了 9:40 上班時間,人潮主要位於市中心、內湖。下班時間 5:00,人潮往通勤區域回巢。 資料來源/詹大千 圖說重製/廖英凱、張語辰

統計同一天中 40-49 歲人口的流動狀況,也可以發現在信義計畫區一帶,女性的人潮明顯多於男性。這樣的發現有助於研究者了解性別在不同產業或地區的差異,有機會更進一步找出社會結構的問題、與政策制度的改善方向。

在信義計畫區,可看到女性人潮明顯多於男性。 資料來源/詹大千 圖說重製/廖英凱、張語辰

而不同年齡層的流動區域也有差異,甚至透露著生活型態。以 2017/1/10(二)為例,這天是學期末, 18-24 歲男性多分佈於各學區。這天也是工作日,40-49 歲男性多位於市中心與捷運沿線人口稠密區。而 65-84 歲男性,則與前述兩個年齡層有較不一樣的分佈,例如集中在北投、萬華一帶活動。

同一時段中,三個年齡層的男性,在地圖上流動的熱點區域。 資料來源/詹大千 圖說重製/廖英凱、張語辰

結合政府開放資料:電子發票、土地利用

圖/Pexels @Pixabay

有了人口隨時間與空間流動的趨勢,進一步再結合內政部的「國土利用調查資料」與財政部的「電子發票開放資料」,詹大千團隊就能更入微地分類行動用戶的族群,並推測其生活特徵、消費行為、經濟能力。

例如從「時間」來分群,可以觀察到有兩種群體:一種是在白天出沒、離開居住地;另外一種則是早晚出沒、離開居住地。比較兩群體的消費能力,會發現白天出沒的族群消費力較高,早晚出沒的族群消費力則較低。

從「出沒地點」來看,白天出沒的族群分布於服務業、商業住宅、小學與大專校院;而日夜出沒的族群則主要集中於住宅區。

因此,從上述資料中,我們就可以推測出:白天出沒的族群,可能就是上班族、服務業等大部分通勤族群;而早晚出沒的族群,則可能是家管與退休人員。

因此,研究者就可以藉此了解一個地區中通勤族與家管、退休待業族群的人口差異。地方政府主管機關,也可以利用這樣的推估成果,設計符合該地區的社區營造、或是足以負荷人流的交通規劃。

整體人口的移動,其實是由許多種不同的人流所組成。若能細緻地分群、找出每一種分群的移動規律,也能將過往的人流資料當作機器學習的訓練資料(請見下方影片的上半部 Groundtruth Data),提升電腦預測未來人流路徑的準確度(請見下方影片的下半部 Predicting Data)。

資料開放 vs. 隱私機密的拉鋸

利用手機網路資料,可以更即時、更準確地掌握人口流動的趨勢。一切的關鍵,也在於有沒有辦法取得這些資料,以及取得資料後會不會損害個人隱私。因此,資料必須去除個資、去識別化後才能被使用。

依目前政府規定,這些手機門號、網路訊號資料被歸為電信業者的財產,電信業者可在不涉及個資隱私的狀況下運用,但也需肩負監管責任。研究中大量應用到在單一網格中的行動網路訊號數量,對於電信業者來說,其實是一個不方便公諸於世的商業機密。

詹大千團隊有賴遠傳電信指派數位協同人員,協助將資料整理成符合法規、並合適電腦分析的格式,才得以進行這系列動態人口研究。團隊研究中遇到的另一個難題,是政府管理的電子發票開放資料時空解析度不足,且開放效率也不夠積極,導致無法更細微地分割各區域的商業活動、與人口流動的關係。

其實,運用資料科學來解決問題,已然是近年來相當熱門的潮流,各公私部門也多紛紛積極地開辦各種黑客松競賽,希望透過網路社群、技術社群的活力,運用政府資料來發現問題、解決問題。因此,若政府能提升資料品質,並為研究社群建立取得資料的合適管道,就有機會讓更多研究者透過資料科學,找到隱藏於巨量資料中的關鍵線索,一窺社會的真實面貌。

本文動態人口研究團隊:郭巧玲(前排左一)、詹大千(前排中)、林柏丞(前排右一)、陳建州(後排左一)、林子佑(後排右一)。 攝影/廖英凱

延伸閱讀:

  • 詹大千的個人網頁
  • 林柏丞、郭巧玲、葉耀鮮、楊毓仁、魏敬玲、江麗香、詹大千*,2017,〈運用開放式地理資訊架構於登革熱防疫機制之研究〉,《醫療資訊雜誌》,26(3), 1-14。
  • Jia-Hong Tang,Yen-Hui Chiu,Po-Huang Chiang,Ming-Daw Su,Ta-Chien Chan*, 2017, “A Flow-based Statistical Model Integrating Spatial and Nonspatial Dimensions to Measure Healthcare Access”, HEALTH & PLACE, 47C, 126-138.
  • 章可藍、蔡煜書、詹大千、束連文、陳娟瑜、顏正芳、 余沛蓁、徐睿、蔡文瑛、陳為堅*,2016,〈地理資訊系統應用於毒品查獲空間分布:縣市毒品查獲地點的分析〉,《台灣公共衛生雜誌》,35(6), 671-684。
  • 鄧詠竹、郭巧玲、陳建州、葉耀鮮、高瑞鴻、林柏丞、范毅軍、詹大千*,2016,〈利用政府開放性資料建構台灣線上互動式疾病死因地圖〉,《台灣公共衛生雜誌》,第35卷第5期,頁553-566。
  • Simini, F., González, M. C., Maritan, A., & Barabási, A. L. (2012). A universal model for mobility and migration patterns. Nature, 484(7392), 96-100.

本著作由研之有物製作,原文為《從手機網路訊號資料,探勘人口動態奧妙》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

文章難易度
研之有物│中央研究院_96
255 篇文章 ・ 2340 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

1
0

文字

分享

0
1
0
用這劑補好新冠預防保護力!免疫功能低下病患防疫新解方—長效型單株抗體適用於「免疫低下族群預防」及「高風險族群輕症治療」
鳥苷三磷酸 (PanSci Promo)_96
・2023/01/19 ・2882字 ・閱讀時間約 6 分鐘

國民法官生存指南:用足夠的智識面對法庭裡的一切。

本文由 台灣感染症醫學會 合作,泛科學企劃執行。

  • 審稿醫生/ 台灣感染症醫學會理事長 王復德

「好想飛出國~」這句話在長達近 3 年的「鎖國」後終於實現,然而隨著各國陸續解封、確診消息頻傳,讓民眾再度興起可能染疫的恐慌,特別是一群本身自體免疫力就比正常人差的病友。

全球約有 2% 的免疫功能低下病友,包括血癌、接受化放療、器官移植、接受免疫抑制劑治療、HIV 及先天性免疫不全的患者…等,由於自身免疫問題,即便施打新冠疫苗,所產生的抗體和保護力仍比一般人低。即使施打疫苗,這群病人一旦確診,因免疫力低難清除病毒,重症與死亡風險較高,加護病房 (ICU) 使用率是 1.5 倍,死亡率則是 2 倍。

進一步來看,部分免疫低下病患因服用免疫抑制劑,使得免疫功能與疫苗保護力下降,這些藥物包括高劑量類固醇、特定免疫抑制之生物製劑,或器官移植後預防免疫排斥的藥物。國外臨床研究顯示,部分病友打完疫苗後的抗體生成情況遠低於常人,以器官移植病患來說,僅有31%能產生抗體反應。

疫苗保護力較一般人低,靠「被動免疫」補充抗新冠保護力

為什麼免疫低下族群打疫苗無法產生足夠的抗體?主因為疫苗抗體產生的機轉,是仰賴身體正常免疫功能、自行激化主動產生抗體,這即為「主動免疫」,一般民眾接種新冠疫苗即屬於此。相比之下,免疫低下病患因自身免疫功能不足,難以經由疫苗主動激化免疫功能來保護自身,因此可採「被動免疫」方式,藉由外界輔助直接投以免疫低下病患抗體,給予保護力。

外力介入能達到「被動免疫」的有長效型單株抗體,可改善免疫低下病患因原有治療而無法接種疫苗,或接種疫苗後保護力較差的困境,有效降低確診後的重症風險,保護力可持續長達 6 個月。另須注意,單株抗體不可取代疫苗接種,完成單株抗體注射後仍需維持其他防疫措施。

長效型單株抗體緊急授權予免疫低下患者使用 有望降低感染與重症風險

2022 年美、法、英、澳及歐盟等多國緊急使用授權用於 COVID-19 免疫低下族群暴露前預防,台灣也在去年 9 月通過緊急授權,免疫低下患者專用的單株抗體,在接種疫苗以外多一層保護,能降低感染、重症與死亡風險。

從臨床數據來看,長效型單株抗體對免疫功能嚴重不足的族群,接種後六個月內可降低 83% 感染風險,效力與安全性已通過臨床試驗證實,證據也顯示該藥品針對 Omicron、BA.4、BA.5 等變異株具療效。

六大類人可公費施打 醫界呼籲民眾積極防禦

台灣提供對 COVID-19 疫苗接種反應不佳之免疫功能低下者以降低其染疫風險,根據 2022 年 11 月疾管署公布的最新領用方案,符合施打的條件包含:

一、成人或 ≥ 12 歲且體重 ≥ 40 公斤,且;
二、六個月內無感染 SARS-CoV-2,且;
三、一周內與 SARS-CoV-2 感染者無已知的接觸史,且;
四、且符合下列條件任一者:

(一)曾在一年內接受實體器官或血液幹細胞移植
(二)接受實體器官或血液幹細胞移植後任何時間有急性排斥現象
(三)曾在一年內接受 CAR-T 治療或 B 細胞清除治療 (B cell depletion therapy)
(四)具有效重大傷病卡之嚴重先天性免疫不全病患
(五)具有效重大傷病卡之血液腫瘤病患(淋巴肉瘤、何杰金氏、淋巴及組織其他惡性瘤、白血病)
(六)感染HIV且最近一次 CD4 < 200 cells/mm3 者 。

符合上述條件之病友,可主動諮詢醫師。多數病友施打後沒有特別的不適感,少數病友會有些微噁心或疲倦感,為即時處理發生率極低的過敏性休克或輸注反應,需於輸注時持續監測並於輸注後於醫療單位觀察至少 1 小時。

目前藥品存放醫療院所部分如下,完整名單請見公費COVID-19複合式單株抗體領用方案

  • 北部

台大醫院(含台大癌症醫院)、台北榮總、三軍總醫院、振興醫院、馬偕醫院、萬芳醫院、雙和醫院、和信治癌醫院、亞東醫院、台北慈濟醫院、耕莘醫院、陽明交通大學附設醫院、林口長庚醫院、新竹馬偕醫院

  • 中部

         大千醫院、中國醫藥大學附設醫院、台中榮總、彰化基督教醫療財團法人彰化基督教醫院

  • 南部/東部

台大雲林醫院、成功大學附設醫院、奇美醫院、高雄長庚醫院、高雄榮總、義大醫院、高雄醫學大學附設醫院、花蓮慈濟

除了預防 也可用於治療確診者

長效型單株抗體不但可以增加免疫低下者的保護力,還可以用來治療「具重症風險因子且不需用氧」的輕症病患。根據臨床數據顯示,只要在出現症狀後的 5 天內投藥,可有效降低近七成 (67%) 的住院或死亡風險;如果是3天內投藥,則可大幅減少到近九成 (88%) 的住院或死亡風險,所以把握黃金時間盡早治療是關鍵。

  • 新冠治療藥物比較表:
藥名Evusheld
長效型單株抗體
Molnupiravir
莫納皮拉韋
Paxlovid
帕克斯洛維德
Remdesivir
瑞德西韋
作用原理結合至病毒的棘蛋白受體結合區域,抑制病毒進入人體細胞干擾病毒的基因序列,導致複製錯亂突變蛋白酵素抑制劑,阻斷病毒繁殖抑制病毒複製所需之酵素的活性,從而抑制病毒增生
治療方式單次肌肉注射(施打後留觀1小時)口服5天口服5天靜脈注射3天
適用對象發病5天內、具有重症風險因子、未使用氧氣之成人與兒童(12歲以上且體重至少40公斤)的輕症病患。發病5天內、具有重症風險因子、未使用氧氣之成人與兒童(12歲以上且體重至少40公斤)的輕症病患。發病5天內、具有重症風險因子、未使用氧氣之成人(18歲以上)的輕症病患。發病7天內、具有重症風險因子、未使用氧氣之成人與孩童(年齡大於28天且體重3公斤以上)的輕症病患。
*Remdesivir用於重症之適用條件和使用天數有所不同
注意事項病毒變異株藥物交互作用孕婦哺乳禁用輸注反應

免疫低下病友需有更多重的防疫保護,除了戴口罩、保持社交距離、勤洗手、減少到公共場所等非藥物性防護措施外,按時接種COVID-19疫苗,仍是最具效益之傳染病預防介入措施。若有符合施打長效型單株抗體資格的病患,應主動諮詢醫師,經醫師評估用藥效益與施打必要性。

文章難易度

0

2
2

文字

分享

0
2
2
資料科學與研究資料管理的最前沿:2022 國際資料週
研究資料寄存所 (depositar)_96
・2022/10/07 ・5342字 ・閱讀時間約 11 分鐘

想和來自全世界的科學家、研究者、政策制定者、企業領袖等一起討論資料議題,想跟上資料科學與研究資料管理最前沿的腳步?國際資料週(International Data Week, IDW)是最好的選擇之一。

國際資料週是什麼?

「國際資料週」是由研究資料聯盟(Research Data Alliance, RDA)以及國際科學理事會(Internatioanl Science Counci, lSC)所屬的資料委員會(Committee on Data, CODATA)、世界資料系統(World Data System, WDS)所共同舉辦的資料科學盛事。自 2016 年起,通常每兩年舉辦一次,吸引近千名全球參與者。因為 COVID-19,2020 年的大會延到今年六月在首爾舉行。

國際資料週的議程由兩個大型研討會構成。例如 2022 的國際資料週,即結合了 RDA 第 19 次大會(RDA 19th Plenary Meeting)與 2022 年的科學資料會議(SciDataCon 2022 )這兩項會議。RDA 大會專注於促進資料分享與再利用的討論,SciDataCon 則著墨在研究資料的前沿議題。

2022 為 IDW 第 3 次舉行,議程為期 5 天,於今年的 6 月 20-24 日,在南韓首爾舉行,主題為「用資料改善世界」(Data To Improve Our World)。因  COVID-19 疫情,採實體與虛擬會議併行,議程總計約 150 場次。在 8 月底,RDA 大會與 SciDataCon 已將多數議程的錄影開放給所有人線上觀看(連結見本文最末)。

研究資料寄存所(depositar) 團隊也參與了本次會議,我們除加入各場次的討論外,亦參加海報徵件,向所有與會者說明我們近來在研究資料管理上的工作。筆者參與會議的部分場次,礙於篇幅,以下僅紀錄筆者感興趣的報告與討論。

場次紀錄:如何提高研究成果的可再重現或可複製性?

SUPPORTING RESEARCH TRANSPARENCY, ACCOUNTABILITY, AND REPRODUCIBILITY: LESSONS FROM THE TRENCHES

本場次專注討論研究成果在「運算」上的可再重現(reproducibility)或可複製性(replicability)。

有關研究成果可否被重現或複製,攸關該研究的可信度與透明性。美國國家學院(The National Academy of Science, Engineer, Medicine)在 2019 年出版了《科學的可重現與可複製性》報告,是研究者可參考的重要指引。

研究不可重現的原因眾多,在本場次中,來自 AGU 的 Shelly Stall 即指出,如紀錄不足、報告不透明、數位技術過時、或嘗試重現的過程有缺陷等,皆可能是研究結果無法重現的原因;要改善這類狀況,則可從分享資料與工作流程、對數位物件編配持續識別碼、強化資料引用、建立數位物件的說明等方面著手進行。

對此,來自 CURE 的講者們亦分享其機構內的作法。CURE 是由康乃爾大學、北卡羅萊納大學教堂山分校、以及耶魯大學等組成的聯盟,致力於倡議並實作研究在運算領域的可重現性。CURE 的運作環繞著四個基本原則:(1) 透明、近用、信任 (2) 可使用性 (3) 獨立性 (4) 出版前的研究重現(pre-publication)。

上述四個原則的完整說明,可在 CURE 的網頁上取得,例如獨立性即意味著可重現性必須「能在獨立的運算環境,交由獨立的第三方來確認」。

CURE 的成員亦分享了其如何實踐計算上的可重現性。例如康乃爾的社會科學中心的講者即表示,他們提供了全整合的服務(All-in-one service),除提供程式碼驗證的服務外,亦有經營資料儲存庫,將研究重現所需的資料悉數打包,存放於該機構的服務內,供他人使用或引用。

BEYOND MACHINE-ACTIONABLE DMPS – LET’S GO FORWARD TOGETHER!

本場次介紹「機器可操作的資料管理方案(machine-actionable Data Management Plans, maDMPs)」的近來發展。

DMP 是描述研究資料將如何被蒐集、使用、管理、(短期或長期)保存、分享等歷程的文件(有關 DMP 的介紹可見此)。 傳統上在撰寫 DMP 時,多是仰賴書寫以整理多方資料整理的工具與資源;而若完成的內容要挪作他用,亦多只能以人工手動進行。

為使 DMP 的內容能取用不同機器的資料,並在機器間進行順暢流通,RDA 自 2017 年起組成工作小組,擬定共通的控制語彙,以在人類可讀的條件下,實現機器可操作的 DMP。

經歷了數年的發展,採用該語彙的 maDMPs 服務亦已逐漸成形。在介紹何謂 maDMP 時,本場次講者 Tomasz Miksa 即指出,maDMP 就如各系統間的「膠水」,它能連結各個不同的研究系統,並自動將資料搬進搬出。

目前已邁入實作階段的 maDMPs 服務有歐盟資助的 Argos,其與歐盟的 OpenAIRE 和 EOSC 的相關服務進行整合,可讓研究者迅速取用不同平台的資料。

圖/Argos

DAMAP 則是另一類似的工具,其遵循 Science Europe 出版的「國際合用的研究資料管理實用指南」,以引導使用者填寫 DMP,而 DAMAP 在欄位設計上,亦遵循 RDA 工作小組所制定的標準,其匯出的 DMP 資料因此可被採用相同標準的服務自動取用。

DATA PUBLISHING IN THE OPEN SCIENCE ERA

本場次討論在自然科學領域,發布研究資料的相關議題,也討論如何消彌資料發布的障礙。

分享研究資料是開放科學的重要實踐項目之一,但在實踐上時常遭遇眾多複雜的阻礙。本場次的講者之一 Ohseok Kwon 教授分享了一篇 2014 年發表於 BMC Public Health 期刊上的文章,該文章透過實證研究,歸納出 6 類的資料分享障礙:技術、動機、經濟、政治、法律、倫理,並再進一步細分為 20 種不同的阻礙,如資料並未搜集(技術型阻礙)、欠缺信任(政治型阻礙)等。資料分享的複雜性可見一斑。

類似的研究,2021 年發表於 Scientifc Data 的研究,在向 199 名論文作者詢問資料後,亦彙整了其中 67 個拒絕分享資料的理由,「沒時間找資料」和「資料遺失」高居其中前兩名。

資料分享的困境,亦可從研究的準備工作就見端倪。來自密西根大學圖書館的報告者指出,根據其對該校所有的 DMP 進行分析的結果,僅有約 21% 的 DMP 會包含後設資料的陳述、僅有約 32% 包含了研究流程文件化的陳述,而若進一步深究兩者皆有提及的 DMP,更僅剩約 9% 左右。報告者 Jake Carlson 指出,這反映了研究人員普遍仍未意識到後設資料與文件化的建立,對研究資料分享至關重要,這是未來須強化的地方。

要改變資料分享與寄存的文化,由單一研究機構著力十分有限,跨學術機構的結盟時常是必要的。由十多個學術機構組成的「資料策展網絡(Data Curation Network, DCN)便是這樣的聯盟。

類似 DCN 的跨機構網絡,匯集了更充足的資源,可用以培訓來自各方的研究者,更完善地落實資料分享。相關網絡亦可為後續的資料策展提供一致的流程,並發展資料的策展標準。例如 DCN 即發展出了「資料策展入門(Data Curation Premier),針對不同類型的資料(如 PDF、Google 文件、Twitter 推文等)提供收藏上應有的考量與實作,供相關人員參考。

本場次的最後一部分,是由韓國科學技術研究院(Korea Institute of Science and Technology, KITSI)報告其對「資料論文」(Data Paper)的研究。資料論文是研究領域近來用以確保資料品質的重要方式之一。 根據 KITSI 的分析,全球資料論文的產量約自 2016 年後大幅上升,Elsevier 的加入,看來是造成明顯變化的主因。

CODATA-RDA SCHOOLS FOR RESEARCH DATA SCIENCE GROUP UPDATES AND NEW CHALLENGES

本場次由 CODATA-RDA School of Research Data Science 發起,討論該短期學校在經營永續性上的可能財務模式。

當代科學使用並生產了各式各樣的資料,研究人員是否具備充足的資料技能,往往是研究能否順利推展的關鍵。為此,CODATA 和 RDA 自 2016 年起,建立了 CODATA-RDA School(下稱「學校」),學校以數天至數週短期課程的方式,培力來自各國(特別是中低收入國家)研究人員相關的資料技能。

自 2016 年至今,學校所開設的課程總計已吸引逾 800 名的參與者。但如同研究資料會面臨如何永續保存的問題,資料學校也持續面臨組織如何方能永續有效運作的問題。

資料來源/CODATA-RDA Data Schools – Ignition Report

CODATA-RDA School 目前的經費主要來自各國政府或私部門所資助的專案經費(project funds)。計畫經費的使用有著用途固定、明確的優點,但也時常受到資金提供者的各種限制。

為了打造長期運作的模式,學校擘劃了兩種未來可能發展方向:小幅擴展、大幅擴展,並評估了兩類發展方式各別所需的活動及人事需求。

學校並設想了五種可能的資金來源:專案經費、CODATA 國家會員的額外資助、高教機構或研究組織的訂閱或貢獻、參與者付費、募資捐款,這五類來源可能交雜構成了未來的財務模式。

報告者也分析了各項經費來源的優缺點。例如「參與者付費」的優點,可能是學生會有較強的學習動機,學生也有正當理由去找尋不同來源的經費支持;但缺點則是學生可能對課程有較高的期待,而目前僅靠志願講師擔綱的課程,可能無法達到對應的要求等。

議程並邀請參與者針對各種可能資金來源集思廣益,例如提供可能資金贊助者的名單、或建立需求者間的國際網絡等,都是會議上曾被提出的建議。

或許是議程本身定位在意見蒐集,本場次在討論上並未有明確的結論。但可預見的是,隨著資料的重要性日益提升,這些與資料基礎建設攸關的學術財務或行政議題,在未來只會越來越受到重視,並不斷浮上檯面被討論。

海報:研究資料寄存所推展研究資料管理的現況 – ADVOCATING GOOD DATA PRACTICES: FROM RESEARCH DATA REPOSITORY TO RESEARCH DATA MANAGEMENT

除工作坊的議程外,RDA 大會歷來亦會有海報徵件的活動,讓研究者能透過自製海報,向與會者展示近來的工作成果。研究資料寄存所(depositar)在本次會議中也投稿海報,並順利入選

作為資料儲存庫的經營者,我們以「提倡良好的資料實務:從研究資料儲存庫到研究資料管理」為題,簡述台灣在研究資料管理的現況與背景、depositar 在推廣研究資料管理上的實踐、所習得的教訓、並描繪了研究資料管理與資料儲存庫的互動關係。

小結

確保資料具良好品質、可相互操作、可長期保存等特性,是以資料為底的科學研究能被持續推展的基礎。參與跨國界的科學合作,它們更是須被優先處理的基本議題。這些基本議題時常是由技術、經濟、政策、與法律等多面向交織而成,它們也構成了 International Data Week 多數議程的討論核心。

略嫌可惜的是,台灣對於這些基礎議題的討論與實踐仍少,國際會議的參與人數也不多。

但無論如何,2022 年國際資料週的所有場次(含 SciDataCon 2022 和 RDA Plenary 19)錄影均已在 8 月底公開,如有興趣一覽本次議程內容,可至以下網址,再次回顧這個全球的科學資料盛事。

研究資料寄存所 (depositar)_96
2 篇文章 ・ 2 位粉絲
研究資料寄存所 (depositar) 是由研究人員建立的線上資料儲存庫。所有人都能使用這個平台,自由地儲存、尋找、再次使用研究資料。

0

0
0

文字

分享

0
0
0
捕捉野生台北人:如何利用手機訊號資料,研究川流不息的人潮?
研之有物│中央研究院_96
・2018/03/16 ・4734字 ・閱讀時間約 9 分鐘 ・SR值 573 ・九年級

國民法官生存指南:用足夠的智識面對法庭裡的一切。

  • 採訪編輯/廖英凱 美術編輯/張語辰

中研院人社中心的詹大千團隊與遠傳電信合作,利用資料探勘技術,分析電信公司所統計的行動裝置網路訊號,藉以建立更準確的人群流動預測模型,有助了解人口流動與社會經濟活動的關係。

人,是會流動的

你有沒有想過,一個地區、一個城市,甚至是一整個國家內部,「人」在哪裡、在哪裡工作、在哪裡居住?「長時間」的遷徙趨勢是往城市、還是往鄉村移動?「短時間」的通勤人口是來自外縣市還是不同行政區?

或者你會否好奇,不同的年齡層、性別有沒有不一樣的生活範圍、移動特徵?對於某一個商圈、公共設施的選址,是不是建立在一個適宜行人路過的良好地點?

這種探討與人類遷徙、移動、人口增減等現象的學科,就是「人口學」。

「人口學」觀察與調查區域人口的變化趨勢,來幫助我們理解一個區域的特徵,例如是否適宜居住、適宜生活、或是適宜工作? 圖片來源/iStock

人的流動可能是大尺度的遷移消長,也可能是小尺度的通勤或消費行為。人口學探討國家或大城市之間的人口消長、人口遷徙時,往往以「數個月」至「數年」作為時間尺度,並利用人口普查、抽查、電話問卷、民調訪談等方式,來了解指定地區的人數和習性。

但是,像這樣子的調查方法,長期以來會有取樣代表性的疑慮,例如戶口抽查時,可能只會調查到剛好在家的族群。而藉由訪談或問卷來了解民眾生活型態,也會受到回憶偏差的影響。或是傳染病傳染區域、或傳染路徑的預測,運用許多假設與模型來猜測人移動的方式,而降低了預測的準確度。

「動態人口學」的概念被提出來,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與消費行為。

動態人口學:人口如何分布與流動

2005 年起,「動態人口學」的概念被提出來,在人口學的基礎上,透過研究概念與研究方法的改進,更精準地了解人口的分布與流動的特徵,更細緻地分析人們的日常生活與休閒消費行為,或是有脈絡地拆解出不同年齡層、性別、族群等的行為差異。

因此,研究者需要有比既有普查、抽查等方式,還能獲得更多資料的研究方法,例如,所取得的資料能精細到越短的時間尺度、越小的空間尺度,才有機會探討人口,如何處在動態中不斷變化,如何受到各種不同環境變數影響。

日常生活中,剛好有一種資料,能表現出「小尺度」的時間與空間下人口分布的特徵──就是行動裝置的上網資料。特別是今日的臺灣社會,平均一個人擁有兩個以上的手機門號,並且多用於持續性的行動上網。因此,透過電信公司於每個基地台所記錄到的行動裝置網路訊號,我們就可以藉此推估各個區域中的實際人口。

例如 google 利用手機定位紀錄來了解交通流量;國內電信業者,也曾紀錄正在行動上網的門號數量,來分析中元普渡時,人潮在基隆祭典園區內的流動趨勢。
 圖片來源/ Google 地圖

2017 年起,在「中央研究院資料科學種子研究計畫」支持下,中研院人社中心詹大千副研究員及其團隊,與遠傳電信合作。利用資料探勘技術分析電信公司所統計的行動裝置網路訊號,建立更為準確的人口調查方法、人群流動的演算法模型,以此了解人群的流動趨勢,來探索動態人口與社會經濟活動的關係。

為了確保個資隱私,研究運用的行動裝置網路訊號,並非追蹤每個人手機的定位,而是加總在不同時段、不同區域中的行動上網門號數。

在空間解析度上,研究團隊鎖定了「台北市」與「新北市」為研究範圍,以每 250 公尺 x 250 公尺作為一個網格。時間解析度上,則是以每 10 分鐘作為區間。

如果某一個手機門號的網路訊號,在同一網格中停留超過 10 分鐘則列入一次計數,這樣子的計數意義是將這個手機門號的使用者,視為停留在這個網格中、或是正在步行經過,而並非在交通通勤的路上匆匆擦身而過。因此,我們就可以假定這個使用者,有可能跟這個網格中的設施有所互動。

區分「居住」與「通勤」人口

將手機網路訊號統計資料應用於人口學,就能突破傳統研究的許多限制,例如過去對於居住人口、通勤人口、日間人口的估算,均需仰賴戶口普查抽查、或是民調訪談等。

詹大千團隊鎖定資料登記為 15 至 64 歲的遠傳電信用戶,並設定晚上 10 點至凌晨 3 點有行動上網訊號的紀錄為「手機夜間人口」,早上 10 點至下午 3 點則為「手機日間人口」,同時比對戶籍資料數作為「戶籍夜間人口」,就能分辨哪些人住在哪區(因為手機晚上在此有長期的網路訊號紀錄),而到了早上這些人又移動到哪區上班(因為手機白天在此有長期的網路訊號紀錄)。

從團隊推估結果,我們可以輕易地看出日間與夜間、住宅區和商業區的人口差異。也能發現不同性別的日夜分布區域也略有差別,比起傳統戶口調查的方式更為即時且準確。

行動網路訊號不僅可看出日夜人口分布的差異,還能看出男女也有細微的分布差異。資料來源/詹大千提供 圖說重製/廖英凱、張語辰

除了找出什麼類型的人,會在什麼地方工作或居住,上下班時刻看到的龐大人潮,也可以透過行動裝置的網路訊號,建構演算法來分析人口流動規律。只要計算隨時間推移,相鄰網格的人數變化差異,我們就可以掌握人群的移動方向與移動速度。

例如,詹大千團隊發現上午 8:50 、 9:40 和下午 5:00,是人口流速最大的三個時段,而且人潮熱區也不同,這就可供交通部門規劃合適的通勤疏運方案。

以 40-49 歲男性為例。早上 8:50 通勤時,人潮主要往車站、捷運站移動,到了 9:40 上班時間,人潮主要位於市中心、內湖。下班時間 5:00,人潮往通勤區域回巢。 資料來源/詹大千 圖說重製/廖英凱、張語辰

統計同一天中 40-49 歲人口的流動狀況,也可以發現在信義計畫區一帶,女性的人潮明顯多於男性。這樣的發現有助於研究者了解性別在不同產業或地區的差異,有機會更進一步找出社會結構的問題、與政策制度的改善方向。

在信義計畫區,可看到女性人潮明顯多於男性。 資料來源/詹大千 圖說重製/廖英凱、張語辰

而不同年齡層的流動區域也有差異,甚至透露著生活型態。以 2017/1/10(二)為例,這天是學期末, 18-24 歲男性多分佈於各學區。這天也是工作日,40-49 歲男性多位於市中心與捷運沿線人口稠密區。而 65-84 歲男性,則與前述兩個年齡層有較不一樣的分佈,例如集中在北投、萬華一帶活動。

同一時段中,三個年齡層的男性,在地圖上流動的熱點區域。 資料來源/詹大千 圖說重製/廖英凱、張語辰

結合政府開放資料:電子發票、土地利用

圖/Pexels @Pixabay

有了人口隨時間與空間流動的趨勢,進一步再結合內政部的「國土利用調查資料」與財政部的「電子發票開放資料」,詹大千團隊就能更入微地分類行動用戶的族群,並推測其生活特徵、消費行為、經濟能力。

例如從「時間」來分群,可以觀察到有兩種群體:一種是在白天出沒、離開居住地;另外一種則是早晚出沒、離開居住地。比較兩群體的消費能力,會發現白天出沒的族群消費力較高,早晚出沒的族群消費力則較低。

從「出沒地點」來看,白天出沒的族群分布於服務業、商業住宅、小學與大專校院;而日夜出沒的族群則主要集中於住宅區。

因此,從上述資料中,我們就可以推測出:白天出沒的族群,可能就是上班族、服務業等大部分通勤族群;而早晚出沒的族群,則可能是家管與退休人員。

因此,研究者就可以藉此了解一個地區中通勤族與家管、退休待業族群的人口差異。地方政府主管機關,也可以利用這樣的推估成果,設計符合該地區的社區營造、或是足以負荷人流的交通規劃。

整體人口的移動,其實是由許多種不同的人流所組成。若能細緻地分群、找出每一種分群的移動規律,也能將過往的人流資料當作機器學習的訓練資料(請見下方影片的上半部 Groundtruth Data),提升電腦預測未來人流路徑的準確度(請見下方影片的下半部 Predicting Data)。

資料開放 vs. 隱私機密的拉鋸

利用手機網路資料,可以更即時、更準確地掌握人口流動的趨勢。一切的關鍵,也在於有沒有辦法取得這些資料,以及取得資料後會不會損害個人隱私。因此,資料必須去除個資、去識別化後才能被使用。

依目前政府規定,這些手機門號、網路訊號資料被歸為電信業者的財產,電信業者可在不涉及個資隱私的狀況下運用,但也需肩負監管責任。研究中大量應用到在單一網格中的行動網路訊號數量,對於電信業者來說,其實是一個不方便公諸於世的商業機密。

詹大千團隊有賴遠傳電信指派數位協同人員,協助將資料整理成符合法規、並合適電腦分析的格式,才得以進行這系列動態人口研究。團隊研究中遇到的另一個難題,是政府管理的電子發票開放資料時空解析度不足,且開放效率也不夠積極,導致無法更細微地分割各區域的商業活動、與人口流動的關係。

其實,運用資料科學來解決問題,已然是近年來相當熱門的潮流,各公私部門也多紛紛積極地開辦各種黑客松競賽,希望透過網路社群、技術社群的活力,運用政府資料來發現問題、解決問題。因此,若政府能提升資料品質,並為研究社群建立取得資料的合適管道,就有機會讓更多研究者透過資料科學,找到隱藏於巨量資料中的關鍵線索,一窺社會的真實面貌。

本文動態人口研究團隊:郭巧玲(前排左一)、詹大千(前排中)、林柏丞(前排右一)、陳建州(後排左一)、林子佑(後排右一)。 攝影/廖英凱

延伸閱讀:

  • 詹大千的個人網頁
  • 林柏丞、郭巧玲、葉耀鮮、楊毓仁、魏敬玲、江麗香、詹大千*,2017,〈運用開放式地理資訊架構於登革熱防疫機制之研究〉,《醫療資訊雜誌》,26(3), 1-14。
  • Jia-Hong Tang,Yen-Hui Chiu,Po-Huang Chiang,Ming-Daw Su,Ta-Chien Chan*, 2017, “A Flow-based Statistical Model Integrating Spatial and Nonspatial Dimensions to Measure Healthcare Access”, HEALTH & PLACE, 47C, 126-138.
  • 章可藍、蔡煜書、詹大千、束連文、陳娟瑜、顏正芳、 余沛蓁、徐睿、蔡文瑛、陳為堅*,2016,〈地理資訊系統應用於毒品查獲空間分布:縣市毒品查獲地點的分析〉,《台灣公共衛生雜誌》,35(6), 671-684。
  • 鄧詠竹、郭巧玲、陳建州、葉耀鮮、高瑞鴻、林柏丞、范毅軍、詹大千*,2016,〈利用政府開放性資料建構台灣線上互動式疾病死因地圖〉,《台灣公共衛生雜誌》,第35卷第5期,頁553-566。
  • Simini, F., González, M. C., Maritan, A., & Barabási, A. L. (2012). A universal model for mobility and migration patterns. Nature, 484(7392), 96-100.

本著作由研之有物製作,原文為《從手機網路訊號資料,探勘人口動態奧妙》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

文章難易度
研之有物│中央研究院_96
255 篇文章 ・ 2340 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

8
1

文字

分享

1
8
1
貪污如何刺激中國經濟起飛?——吳介民解析中國的「官僚尋租」現象
研之有物│中央研究院_96
・2021/12/16 ・6667字 ・閱讀時間約 13 分鐘

國民法官生存指南:用足夠的智識面對法庭裡的一切。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文|龔雋幃
  • 美術設計|林洵安

中國如何創造經濟神話?

中國崛起,是近年舉世矚目的議題,但中國的發展軌跡與日、韓、台迥然不同,所謂的「中國模式」有何特殊性?下一步,中國還能持續創造奇蹟嗎?中研院社會學研究所吳介民研究員,拆解分析中國崛起背後,如何透過「尋租式」的政商結合打造出世界工廠。「研之有物」專訪吳介民,一探他費時 25 年的著作《尋租中國》,背後橫跨多年的田野觀察,以及他歷經年少困頓、輟學、童工,依舊未曾改變的知識憧憬。

負債逃難、休學做工,少年遍嘗底層辛酸

「經濟起飛/你們家墜毀/那是你們曾經感受飢餓的一年/『家的破裂與復合的真理唯一是勞動,無產階級的身體』/於是,在城市邊陲的小衛星工廠/你們成為輸送帶上的少年工/⋯⋯」

在出版的詩集《地犬》裡,吳介民以詩作〈一九七七〉,描繪自己十五歲時的生命史片段。

吳介民父親原為《中華日報》地方記者,眼見人造纖維毛衣的加工貿易可為,遂與親友借錢開工廠,不料一敗塗地。此後一、二十年債務纏身,全家命運丕變。

「我爸媽是連夜逃離宜蘭,向鄰居借一百塊買火車票,弟弟跟著走。那時候家裡已經破產,我和妹妹、外祖母留在原來的工廠,後來才陸陸續續北上團聚。」吳介民說。

年少的吳介民遍嘗底層生活的辛勞。一家落腳三重,他和弟弟曾輟學一年到膠鞋工廠當童工,還要同時幫忙家裡的自助餐生意。後來,父母頂下一間水餃館,就位在省北師專(今國立臺北教育大學)對面。透早五點,全家起床賣豆漿,接著備料、包水餃、煮麵,一路忙到晚上十一、二點的宵夜場,週而復始。

直到吳介民考上台大的頭幾年,仍是掙錢還債、讀書兩頭燒,期間更兩度休學,回家當起水餃師傅。大三後家裡陸續還清欠債,他才終於揮別那樣的時光。吳介民感性地說:「父母選擇還債,而不躲債賴帳,確保了全家人的尊嚴,這一點對我們小孩是很要緊的情感教育。」

歷經舉家欠債、還債、輟學做工,吳介民回憶起成長歷程,「我確實有幾年生活其中,經歷過那樣的世界,知道底層工人賺錢的辛苦、被羞辱的感覺。」一切彷若已雲淡風輕,化為他構築、深化理論的養分。圖│研之有物
歷經舉家欠債、輟學做工,「我確實有幾年生活其中,經歷過那樣的世界,知道底層工人賺錢的辛苦、被羞辱的感覺。」吳介民回憶自己的成長歷程,一切彷若已雲淡風輕,化為他構築、深化理論的養分。
圖│研之有物

少時,家裡生計著實困難。吳介民猶記曾和弟弟遠遠望著蚵仔麵攤,眼巴巴地像是肚子餓的小狗。另一次,兩人湊出十塊錢到麵攤合吃一碗油麵,上頭浮著薄薄一小片瘦肉,兩兄弟饞得緊,仍忍著餓相互說你吃你吃,「雖然不到饑荒,但當時真的常有『腹肚枵』(餓肚子)的感覺。」

吳介民重省這段歷程,說道:「那是真實的下層階級生活,所以後來讀馬克思、韋伯,就能用自己的親身經歷看那些理論。我知道理論的重要,但也知道很多時候『理論只是理論』。」

這些經驗也讓他日後更能感同身受工人階級的思維,以及勞力謀生的不易。

即便沒有優渥環境,高中讀的是放牛吃草的補校,吳介民卻從未放棄他的知識、文學與藝術夢。他自己買石膏像臨摹,也曾努力攢下一千元,買了一台 FM 收音機,晚上聽 ICRT 練英文、聽古典樂。家中的黨外雜誌與柏楊著作,亦是啟蒙養分。

另一個驅動的強烈欲望,則是迫切想離開當時的生活環境,流氓砍殺、幫派械鬥、警匪追逐,社會的幽暗面時時出現眼前。

透視中國軌跡,反思台灣發展

1981 年,吳介民決定向父親「請假」半年,專心準備大學聯考,如願考上他的第一志願台大政治系。然而,結果卻不如所想。

保守呆板的課程讓他大失所望,有些同學轉投法律懷抱,吳介民不改其志,一面參加讀書會、接觸黨外人士,也投身 80 年代風起雲湧的社會運動,反杜邦自由之愛野百合學運都曾親身參與。他說道:

「從大學到現在 40 年,我關心的事情都一樣──台灣的民主,希望台灣成為真正好的國家和社會。這個核心關懷從來沒有變過。」

直到考入台大,吳介民仍五點起床賣豆漿,課後到餐館包餃子、煮麵、洗碗,忙到深夜才能看書。他笑說自己從小特別愛讀書,高中讀的是被體制放棄的「流氓補校」,仍立志考上大學。進入台大後兩度休學,他依舊不改其志,積極投身社會運動直至今日。圖│吳介民
考入台大後,吳介民仍日日五點起床賣豆漿,課後到餐館包餃子、煮麵、洗碗,忙到深夜才能看書。但他依舊不改選擇政治系的初衷,積極投身社會運動直至今日。圖為翻拍人間雜誌社報導,當時吳介民與學運夥伴從鹿港調查反杜邦運動回到台北,整理問卷資料後,在消基會舉辦的記者會上報告。
圖│吳介民

就算後來出國留學,又或跑遍中國做田野,仍是為了回答台灣自身的問題。吳介民直言,「台灣作為一個現代國家,將來跟中國不管是什麼關係,都離不開這個地緣政治、經濟。這是我們的宿命,必須面對。」

因著這份長期以來的關懷,他一眼持續觀照台灣本土公民社會的茁壯、衝擊與變遷;另一眼,則望向中國經濟改革開放的發展與運作機制,以及飽受工資壓榨、身份差序雙重剝削的中國底層民工。復再凝結成「中國因素」的分析框架,透視兩岸關係。

看見中國,反思台灣,雙重田野形成的視域交疊,成為吳介民念茲在茲的研究母題。

1994 年起,吳介民開始在中國進行田野調查,採訪台商、幹部,也走訪民工村。從鄉村長途遷徙至外地的民工,常在打工城市的郊區聚居。圖為 2005 年吳介民造訪的北京民工村,當時正在拆除,後再次前來時村落已不復存在。圖│吳介民
1994 年起,吳介民開始在中國進行田野調查,採訪台商、幹部,也走訪民工村。從鄉村長途遷徙至外地的民工,常在打工城市的郊區聚居。圖為 2005 年吳介民造訪的北京民工村,當時正在拆除,後再次前來時村落已不復存在。
圖│吳介民

「我怕不趕快寫,死了會很遺憾」

早在 1993 年的紀錄片《台胞》中,吳介民和幾個朋友就試圖刻畫兩岸交往的不同面貌,包括老兵返鄉、漁民衝擊、政治談判,以及形形色色的第一代台商經驗。但首映會上飽受批評,質疑他們流於片面的現象陳述、囿限於意識形態。今時回顧,吳介民坦言《台胞》的技術與結構還不成熟,可是他仍自信地說,當時提出的問題、方向都是對的。

只是吳介民沒料到,首映會上他的豪語「我會用 5 年、10 年去尋找答案」,結果卻歷經 25 年的淬煉醞釀後,才交出令他自己滿意的答案。

「我知道不寫會很遺憾,因為我怕我會死掉。」幾年前吳介民大病一場,住院、休養超過 4 個月,甫恢復即刻埋首案前,3 個月就寫下 10 萬字,加上之前累積的草稿,共完成了 25 萬字的書稿,終於迎來這本遲來許久的學術代表作——《尋租中國:台商、廣東模式與全球資本主義》。

貪污與經濟成長並行:認識中國的「官僚尋租」

過去 40 年,中國經濟快速騰飛,同時卻也伴隨著猖獗的「官僚尋租」現象(rent seeking)。亦即,

政府部門透過政策法規,獲取高額利潤的壟斷租金(rent),例如回扣、抽取人頭稅、掌控審批權等,其中往往與貪汙索賄具有高度親近性。

圖│研之有物
圖│研之有物

於是這便形成了一個巨大的謎題——尋租、成長為何能夠並行不悖?當中國地方基層幹部紛紛躋身「收租階級」之際,為什麼卻未削弱整體發展,反倒產生了正面的助益?

1994 年,河南省濟源市一家摩托車店的標示。明明是當地生產,卻被特別標註「台灣機」,而且一台摩托車要價 12500 元!一方面顯示當時台灣因素扮演的經濟影響力,同時這樣的高價品,必定也是飽賺「灰色收入」的幹部才買得起。圖│吳介民
1994 年,河南省濟源市一家摩托車店的標示。明明是當地生產,卻被特別標註「台灣機」,而且一台摩托車要價 12500 元!一方面顯示當時台灣因素扮演的經濟影響力,同時這樣的高價品,必定也是飽賺「灰色收入」的幹部才買得起。
圖│吳介民

吳介民指出,關鍵在於鄧小平提出改革開放後,一方面,中央以明文法規或非正式規則,授予地方官員尋租的空間,作為地方招商引資的誘因;同時,又將經濟發展的成績,納入幹部升遷考核機制。於是,從這兩方面成功動員了地方的積極性,整個黨官僚體系漸漸從過去的政治掛帥,切換到經濟掛帥。

循此,吳介民別出心裁地結合政治經濟學、制度經濟與產權理論,提出「機構化尋租」(institutional rent-seeking)的概念。

在中央放行下,手握加工貿易許可權的地方官員,兼具創租(rent creation)、分租(rent distribution)與尋租三重角色,以組織化、制度化的形式發展。包括工繳費匯差、土地批租費、勞動管理費、虛擬所有權、社會保險費與住房公積金等,各式形形色色的獲益,創造地方財政收入與幹部個人利益的雙贏,並實現國家攫取價值的創匯目標。

圖│研之有物
圖│研之有物

從另一方面來看,因為這套尋租制度受國家認可,具有一定正當性,提供外資可靠穩定的承諾,也相對降低了應付紛雜政商關係的交易成本。於是,在歷史耦合的時空條件之下,看似南轅北轍的尋租與成長,便得以齊頭並進。

而台商正是過去這波浪潮的重要推手!

中國改革後開放以廣東作為領頭羊,台商受政策優惠補貼所牽引,將全球產業鏈帶進中國,和地方政府攜手,將原先的農、漁村聚落打造為世界工廠,方才觸發中國資本主義高速成長,躍為世界核心國家。

然而,當國家與資本相謀,打造經濟火車頭的同時,底層民工階級卻深陷雙重剝削的困境。一方面,是典型資本主義對勞動階級的剝削,不斷從中榨取剩餘價值。另一方面,則是中國特殊的資本模式,

由國家一手打造「公民身份差序」體制,把不同背景身分者有位階性的區隔,使企業能「合法地」把民工排除在制度保障之外,只需提供次等待遇。

透過國家積極參與剝削民工階級,大幅降低勞動成本,形成二次剝削。

廣東珠三角工業區,大批民工站在廢棄物前休息。「廣東模式」是吳介民分析中國模式的原型,1978 年廣東成為中國「改革開放」先鋒,政府從內地省分的農村引入農民工,持續提供大量的勞動力。圖│吳介民
廣東珠三角工業區,常見大批民工站在廢棄物前休息。「廣東模式」是吳介民分析中國模式的原型,1978 年廣東成為中國「改革開放」先鋒,政府從內地省分的農村大量引入農民工(簡稱民工),持續提供勞動力。
圖│吳介民
民工、職工被國家區隔,政府刻意壓低民工的工資,底薪通常是最低工資,只能靠加班掙錢;同時,民工作為外來人口,也被排除在當地社會保險、福利之外。透過這種「公民身份差序」體制,為企業提供低廉勞力。圖│研之有物(資料來源│吳介民)
民工、一般勞工被國家區隔分開。政府刻意壓低民工的工資,底薪通常是最低工資,只能靠加班掙錢;同時,民工作為外來人口,也被排除在當地社會保險、福利之外。透過這種「公民身份差序」體制,為企業提供低廉勞力。
圖│研之有物(資料來源│吳介民)

中國的尋租模式仍有未來嗎?

不過時至今日,中國原先倚仗勞力密集產業、創造高額利潤的模式,已走到了盡頭。

吳介民分析,首先民工供給已經飽和,人口紅利不再。再者,中國的經濟成長進入「中所得階段」,無法再繼續維持原本的模式。第三,中國政府有意識地開始大力推動高技術、高資本的經濟發展策略,進行產業升級轉型;周邊國家如越南、印尼、印度,也慢慢取代中國在中低階消費品全球價值鏈的原有角色。

內外因素交雜,中國過往的尋租發展模式不再可行。

吳介民在廣東村落田調,一群民工從他身前經過,他順手拿起相機,按下快門的剎那,身前的工人正好抬起頭,直直望向鏡頭,留下這張意味深長的照片。民工是過去中國經濟成長的沉默貢獻與犧牲者,建築隊是最底層的民工,經常被拖欠工資、睡在工地。圖│吳介民
吳介民在廣東村落田調,一群民工從他身前經過,他順手拿起相機,按下快門的剎那,身前的工人正好抬起頭,直直望向鏡頭,留下這張意味深長的照片。民工是過去中國經濟成長的沉默貢獻與犧牲者,建築隊是最底層的民工,經常被拖欠工資、睡在工地。
圖│吳介民

「如果十年前寫,對尋租發展主義的前景比較明亮一點;可是經過這十年,當它想脫離這個發展模式,就遇到很多內部陷阱,所以我對中國發展前景的評估會比較悲觀。除非它在技術上獲得很大突破,或者孤注一擲跟美國打一仗,而且打贏了。」

昭然若揭的是,中國已經無意韜光養晦,大國崛起的自信愈來愈膨脹,對外侵略性也愈來愈強,美中戰略競爭的對抗局勢顯然沒有回頭路。吳介民觀察,「中國統治精英最大的弱點就是太急躁、沉不住氣,如果再默默耕耘半世紀,等到完全茁壯,美國也拿它沒辦法。」

現階段,中國最想突破的是半導體產業,晶片製造正是「中國製造 2025」首要目標,晶片一天生產不出來,就永遠被西方掐住要害。但總體來看,吳介民評估中國仍具有相當韌性。

「你不能把它看成是 1970、80 年代的蘇聯,經濟非常沉悶。它有 14 億人口的市場,有相當製造技術能力,關鍵是要能夠掌握重要的戰略物資不被西方切斷。所以一帶一路試圖打開中巴、中泰走廊,這樣不必只依賴南海海運,戰略自由度就較高。近年來投擲鉅金,想打造自主的半導體供應鏈,目前還在脫困奮戰,是另外一個例子。」

霸權間的台灣憂患不斷,也充滿機遇希望

如同台灣數百年來的命運,始終只能在帝國霸權的支配與競爭的夾縫中謀生存。吳介民認為,當兩岸永遠維持在一個懸置、難以釐清的關係,甚至處在戰爭爆發的陰影下,會扭曲台灣作為主權國家的正常發展,讓很多事情複雜化。但另一面來看,連帶而來的憂患意識也讓台灣人更戰戰兢兢求生存。

「如果我作為個體,不是鑲嵌在這個集體命運當中,而是跳脫自身認同的束縛,以純然研究者的眼光,觀察現在台灣跟中國的互動關係,其實是很精彩、很熱鬧,充滿懸疑跟劇場效果。」吳介民不改幽默地說。

研究兩岸大半輩子,吳介民至今仍饒富興味持續他的知識遠航。在他心裡,也仍有無數本專著等待完成,「一本中國因素大論述,一本香港政治論,一本玩政治,然後還要寫我的田野,所以說要活到 150 歲才可能。」

數十年磨一劍,吳介民歷經 25 年深入中國各地田野調查,構思、醞釀、積累,出版重量級著作《尋租中國》,本書也獲得中研院人文社科學術專書獎。書中不僅對中國經濟崛起的過去與未來,提出完整解釋,更關鍵的是回應:緊鄰中國的台灣,該走向哪裡?圖│臺大出版中心
吳介民歷經 25 年深入中國各地田野調查,構思、醞釀、積累,出版重量級著作《尋租中國》,本書也獲得中研院人文社會科學學術專書獎。書中不僅對中國經濟崛起的過去與未來,提出完整解釋,更關鍵的是回應:緊鄰中國的台灣,該走向哪裡?
圖│臺大出版中心

延伸閱讀

所有討論 1
研之有物│中央研究院_96
255 篇文章 ・ 2340 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook