0

0
0

文字

分享

0
0
0

「開放資料」和醫療衛生

2012健康與醫療資料加值應用論壇_96
・2012/08/14 ・1830字 ・閱讀時間約 3 分鐘 ・SR值 571 ・九年級

開放資料(Open Data)可定義為「經過挑選」、應讓大眾自由取得以供隨意使用或重新發表的資料,不受版權、專利或其他控管過度的機制所限。

開放資料並不是什麼新穎的觀念。提倡資料公開的人們主張科學數據資料的取得管道應該對公眾開放、不受任何限制,尤其是由政府機關收集製作、以公帑出資進行調查所得來的資料。他們也認為某些資料的取用限制和公共利益有所牴觸,應該取消所有的限制或收費。

雖然推動開放資料和開放近用(Open Data and Open Access)的運動正蓄勢待發,仍有不少組織團體極力反對,例如營利的出版社,還有一些需要靠收取資料使用費來維持運作的非營利教育研究單位。

開放資料資源──以醫療衛生為例

-----廣告,請繼續往下閱讀-----

以下挑選出來的是幾個關於世界人口健康和醫療保健的「開放資料」來源連結:

CDC Data & Statistics-美國疾病控制與預防中心(Centers for Disease Control & Prevention, CDC),開放取用各種資料以促進公共健康。

Google Public Data Explorer-提供關於醫療保健、經濟狀況、以及其他主題的大型公共資料集,容易取得、便於探討,且能以圖表呈現。

HCUP Databases-由美國保健政策研究機構(Agency for Healthcare Research & Quality, AHRQ)提供,關於醫療保健開支與用途的資料集。

-----廣告,請繼續往下閱讀-----

Health.Data.Gov-美國衛生及公共服務部(The U.S. Department of Health & Human Services, HHS)提供,由美國政府製作並/或握有的各種健康資料和數據集。

NationMaster-統整歐盟、世界衛生組織、聯合國教科文組織、聯合國兒童基金會、世界銀行等組織提供的健康資料和數據。

WHO Global Health Observatory-世界衛生組織設立的全球衛生觀察站(Global Health Observatory),提供關於全球健康重點議題的資料和分析。

World Bank Health Data-世界銀行(World Bank)針對各國醫療保健體系、疾病預防、優生保健、營養攝取、人口數據等等議題所收集的資料。

-----廣告,請繼續往下閱讀-----

*此外還有更多公開的健康醫療資料集和網站可以進一步瞭解,例如:

結論

關鍵就是──我們正目睹一個由「開放資料」建構的全新產業崛起,以創新的觀點重複使用公共部門的數據資料。這包括整合不同來源的資訊、開發新的工具或應用軟體、分析資料並製作實用的新報告或產品,藉此設法增加研究價值,不論是做為營利還是非營利之用。由公共部門所製作的「開放資料」的取用途徑非常具有經濟潛力,可提供公民和組織團體想要或需要的資訊,在這過程中也能催生許多新的公司和工作機會。

更多關於健康醫療資訊加值應用的討論,請見此專題

-----廣告,請繼續往下閱讀-----

天天問:

1. 如果你簽署同意提供自己的健康檢查結果或剩餘檢體用作研究,比如說,捐出說一根頭髮,關於這根頭髮如何運用,你認為自己應該被怎麼樣告知、要告知什麼或到何種程度呢?

2. 健康資料庫的加值應用所衍生的利益,歸屬於誰? 

3. 雖然個人所提供的資料可以匿名處理,但在串連起癌症檔、死因檔、地理資訊中心、處方籤等資訊後,特定年齡層、或居住於某些地區的人們,卻可能會因此被貼標籤,甚或汙名化。比如說,當若有研究指出年齡 50 歲以上、居住在南部的閩南婦女,最容易濫用醫療資源時,就會對於特定族群造成影響。你認為這樣的情況應該要如何避免呢? 

-----廣告,請繼續往下閱讀-----

4. 就你的了解,你認為健康資料庫加值應用的現況,是否有侵犯或未保護個人資訊自主及隱私的情形呢?歡迎分享你的經驗。

論壇一:政府現有健康相關資料之加值,是否須先經個人同意或立法授權?
論壇二:健康資料庫加值應用之現況是否侵犯或有未能保護個人資訊自主及隱私之疑慮?
論壇三:健康資料庫加值應用衍生利益之歸屬:公有?共有?私有?
論壇四:總體討論(後續該怎麼監督)

文章難易度
2012健康與醫療資料加值應用論壇_96
15 篇文章 ・ 0 位粉絲
舉辦公眾論壇,促成社會公眾對「健康及醫療資料運用及加值」進行理性、知情的討論,形成公共意見以作為決策的參考。 一、提出公眾論壇的討論成果:結論報告。 二、統整各界對健康及醫療資料運用及加值」之爭議意見及政策建議。 三、建構論壇準備期間為促成對話的重要程序和原則。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

11
2

文字

分享

0
11
2
政府、學校、公民三方合作,共同完成臺灣第一份「國家鳥類報告」
PanSci_96
・2020/12/25 ・2131字 ・閱讀時間約 4 分鐘 ・SR值 492 ・五年級

中華民國野鳥學會與特有生物研究保育中心正式發表「2020 臺灣國家鳥類報告(The State of Taiwan’s Birds 2020)」!這是臺灣第一份由政府部門、大專院校及民間組織共同完成的鳥類生存狀態評估報告。

2020 臺灣國家鳥類報告封面。圖/2020 臺灣國家鳥類報告

「2020 臺灣國家鳥類報告」整合了臺灣長期透過公民科學和監測調查的鳥類類群和特定鳥種,首次報導其族群狀態、數量變化趨勢、受威脅程度,以及保育策略與行動。簡單的說,這份報告將告訴各位,臺灣的鳥類們活得好不好?數量是變多還是變少?可能是什麼原因造成的?以及我們接下來該怎麼做?

「2020 臺灣國家鳥類報告」同時發布中文版與英文版,以及一冊報導更多細節的「詳細報告」,三冊報告都會公開在網路上供自由下載,讓臺灣大眾與世界各國認識臺灣鳥類的生存現況,以及思索未來鳥類保育和我們的生活環境的發展。

目前,全臺灣有確切紀錄的野生鳥類共有 674 種,其中有 52 種鳥類的生存受到威脅。29 種繁殖鳥類的數量在減少,有 15 種度冬水鳥的數量在下降,這些都是臺灣自然環境劣化的警訊。「2020 臺灣國家鳥類報告」共分成三大篇:

  • (一)特定類群:包括繁殖鳥、度冬水鳥、繁殖燕鷗及遷徙猛禽。
繁殖鳥—烏頭翁。圖/2020 臺灣國家鳥類報告,呂翊維攝
繁殖燕鷗—鳳頭燕鷗。圖/2020 臺灣國家鳥類報告,呂翊維攝
  • (二)、特定鳥種:包括黑面琵鷺、黑嘴端鳳頭燕鷗、黑鳶、水雉、八色鳥、小辮鴴、山麻雀、草鴞及熊鷹等 9 種鳥類。
黑嘴端鳳頭燕鷗。圖/2020 臺灣國家鳥類報告,呂翊維攝
水雉。圖/2020 臺灣國家鳥類報告,吳志典攝
  • (三)、保育議題:探討鳥類可能的受脅原因及未來的保育策略,包括氣候變遷、濕地喪失與劣化、野鳥販賣、農藥毒害、外來入侵種及海鳥混獲共6項議題。

什麼是「國家鳥類報告」

鳥類是反映棲地環境狀態的重要指標生物,鳥類活得好不好,是一個國家環境是否健全的指標。許多重視環境健全和鳥類保育的國家,包括美國、加拿大、英國、印度、南非、澳洲和紐西蘭,都會定期整理鳥類調查紀錄並發布「國家鳥類報告」,作為環境狀況的重要基礎資訊,也是環境劣化的預警機制。

「2020臺灣國家鳥類報告」的緣起

臺灣雖然不是聯合國的會員國,但是仍積極配合聯合國生物多樣性公約,發布生物多樣性相關的國家報告。2013 年,眾多關注生物多樣性保育的政府機關、大專院校及民間組織,共同整合與分析我國鳥類的監測資料成果,編撰成「2020 臺灣國家鳥類報告」。於全世界檢視保育成果的 2020 年,向全世界報告臺灣的鳥類保育狀況。

-----廣告,請繼續往下閱讀-----
台灣鳥類紅皮書摘要。圖/2020 臺灣國家鳥類報告

「公民科學」與「開放資料」功不可沒

「2020 臺灣國家鳥類報告」集結了許多臺灣在地鳥類的監測與研究,更有許多由民間長年來累績的公民科學資料,這些資料是完成國家鳥類報告的必要條件。

eBird Taiwan 賞鳥紀錄資料庫為例,已有近 3900 人貢獻鳥類觀察紀錄,並累計超過 47 萬 3 千份賞鳥紀錄,是全球排名第 7。「臺灣生物多樣性網絡」也累積了超過 780 萬筆鳥類觀察紀錄。這樣在國際上名列前矛的成績,歸功於數千名鳥類及自然觀察愛好者熱切且熱心的觀察與記錄、並且分享資訊。

有了這樣的大數據,我們才能知道這些鳥類的數量多不多、活得好不好。

2022 下集待續

「2020 臺灣國家鳥類報告」是臺灣鳥類保育工作的重要里程碑,但不是終點站。在報告的編撰過程中,我們也注意到了還有許多鳥類和牠們的棲地尚未受到關注,也還需要保育資源的投入。鳥類的生活不會受到國界限制,身為全球夥伴的一員,臺灣的保育工作將以聯合國千禧年永續發展目標作為核心,持續與國際社會分享我們的觀察紀錄和保育工作進展。

-----廣告,請繼續往下閱讀-----

未來,每兩年會發布一次國家鳥類報告,定期更新臺灣鳥類的生存與保育狀況,我們期待下一份報告會為大家帶來更多的好消息。

延伸閱讀

PanSci_96
1226 篇文章 ・ 2337 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

0
0

文字

分享

0
0
0
技術宅如何拯救真實世界?這不是輕小說,是資料科學家陳伶志的專訪
研之有物│中央研究院_96
・2018/01/07 ・4558字 ・閱讀時間約 9 分鐘 ・SR值 473 ・五年級

用「資料科學」解決生活問題

2018 年後台灣國中小學生要學程式設計,如何「編寫」程式可以教,但如何「運用」程式就需要以人生經驗付學費。

本文專訪中研院資訊科學所陳伶志副研究員,擅長硬體組裝設計,也擅長分析資料數據,透過心路歷程為你揭曉:無論是孕婦和老人搭公車遇到的玩命關頭,或是氣喘兒遇到的 PM2.5 空污問題,都能用「硬體感測」結合「公開資料」找出對策。

陳伶志希望能用程式解決生活問題, 和團隊研發「公車舒適度評測 App」和「空氣盒子」偵測 PM2.5 。圖/張語辰

小時候會好奇亂拆東西嗎?

「小時候會把東西拆開來再組回去,也不懂原理,其實就是搗蛋,然後就越玩越大。我哥哥以前是讀電子科,家裡有很多小零件,所以我從小就喜歡玩、不會害怕這些電的東西。有一次不小心把電子錶丟到洗衣機洗,結果壞了,只好自己把電子錶全部拆開來曬乾,想不到組回去又可以用。也常常隨便把東西插到插座裡,造成家裡跳電,因為怕被大人罵就學會自己把插座拆下來、換上新的保險絲。」

陳伶志家裡以前就有很多電子小零件。圖/Pexels@pixabay

大學是宅宅嗎?都在做什麼?

「我算蠻宅的 (呵呵)第一次開始學電腦是在大學,那時候參加過三次 ACM – ICPC 程式比賽,平常花很多時間練習解題。也當過計中的工讀生,到各處室幫忙解決電腦問題,到了那邊發現很多只是插頭沒插、或是網路線被踢斷而已(笑)。」

「大學時做過最熱血的事情是擔任 BBS 站長,現在 BBS 有彩色模式、丟水球等功能,但那時候還蠻陽春的,我們團隊就花很多時間熬夜摸程式,自己想怎麼做出來、弄得很炫。也有一次進站發現駭客入侵,把整個 BBS 站台砍掉,畫面中只留下駭客的名字證明他很厲害。那時候不太知道怎麼辦,就和朋友一起挖系統的歷史資料,把駭客潛伏的洞補起來,後來透過其他高手我們也入侵駭客的主機,發現他有點收藏癖,收藏了各個駭過的完整站台,我們也把被駭客備份的 BBS 站台再整個備份回來。」

陳伶志大學最熱血的事情是曾擔任 BBS 站長,現在的 BBS 功能比較複雜。圖/By moboo@ Wikimedia Commons

不用怕問題,這個世界上一定有人解決過其中部分的問題,上網看看別人怎麼做、自己也試試看。

「師大第一次網路選課系統,是我在大三暑假時寫出來的,因為當時廠商要價太高,計中的主任就丟了一個 SQL Server 叫我試試看。玩了一兩天後發現如果用這種方法,我大概開學後也寫不出來,就改用在檔案系統上開檔讀檔的做法,硬是把選課系統完成。那時程式語言不像現在這麼方便,寫法比較低階,沒有那麼豐富的函數庫可以呼叫。最麻煩的是,如果同時有兩個人選門課,中間會有競爭關係,必須去學怎樣把檔案優先權鎖起來。那時候還沒學到這些課,我把這個選課系統做出來之後,後來上課時才發現原來這些理論我之前已經實作過。回想這段期間是最快樂的,因為可以自己上網找資源解決問題,很開心。」

「大學很宅的原因是,把這些事情跟別人講,別人只覺得你很無聊。(呵呵)」

程式很厲害,還需要出國讀書嗎?

「考量到家庭經濟,我本來一直很不想出國,因為我是師大資訊教育系的師範生,大學畢業後我先教書再去當兵。當兵時有各單位來選兵,常常都會先讓資訊系的站起來,然後只有大學學歷的坐下,後來我根本不想站起來,因為最後一定會坐下、不會被選到,那時讓我很有感觸,也改變心意決定繼續深造。」

「退伍後曾經有公司提供很好的待遇,但那時有位長輩跟我說『你這時候年輕,要先投資自己,錢以後再賺就好』,加上當兵時看了很多勵志的書,被《牧羊少年奇幻之旅》這本書打動,就決定出國讀碩士。但出國念碩班沒有獎學金,那時候第一年就要花 100 萬,為了在出國前就先存到一年的錢,我就白天上班、晚上兼差、同時準備托福和 GRE 考試、也回學校跟老師做研究,退伍後那一年過得超充實。」

當你真心渴望某種東西時,整個宇宙都會聯合起來幫助你完成。──《牧羊少年奇幻之旅》

「在加州大學洛杉磯分校讀資訊科學碩博士時,一開始我是做 Wi-Fi 網路的行動運算研究。例如我的筆電現在連到 A 網路,但我走一走連到 B 網路時,正在下載的檔案或正在看的棒球比賽轉播能不能不要中斷、直接切換過去。接著想進一步研究頻寬變化,因為若切換時知道頻寬如何改變,就能即時調整影片傳輸大小。最後論文主軸聚焦在頻寬研究,現在很多測頻寬都是丟資料去量「可用頻寬」,但我研究的是「最大頻寬」,難度是不能送太多封包影響別人,還要可以測量高速網路、低速網路、或者是去跟回來速度不一樣的非對稱性網路。這些計畫在國外做得差不多,回台灣後就沒有繼續往下鑽,改成尋找別的題目。」

陳伶志曾從事 Wi-Fi 網路的行動運算研究,可以應用在棒球直播上。圖/Roberto Coquis – Flickr

從宅宅變成中研院的研究人員,你認為研究是什麼?

研究成果應該用來解決人們生活中的問題,要能看得到、實際可以使用。

「中研院蠻自由,不會干擾你要做什麼題目。我比較不喜歡純粹只有理論,會希望理論最好跟現實接上線,因此選擇研究題目時比較實際導向,例如之前做過『公車舒適度評測 APP』。做研究會有很多理論,要想辦法在理論和實際間找到連接點,不是所有題目都能在現階段就能看得到東西,但現階段看得到東西的題目,又很容易變成是在做黑手、沒有理論。要能兩者兼具的題目很不好找,我們一直想辦法挖掘,像『空氣盒子』計畫就有符合。」

陳伶志與團隊研發的「微型空污偵測模組」,可以即時偵測所在環境的溫濕度、氣壓、 PM2.5 濃度。圖/張語辰

人生中有失敗過嗎?

「2009 年時研究院路二段發生一起公車車禍,甚至有人因此喪命。坐過公車都知道有些公車開得很猛、有些公車開得很穩,那時候我們在想能不能把大家坐過都知道的事實,用科學化數據呈現出來。這個數據對孕婦和老人很重要,因為他寧可多等五分鐘,搭到一班比較穩的公車,才不用在公車上抓桿子抓得那麼緊,所以我們就做了『公車舒適度評測 App』,鼓勵大眾攜帶手機、搭公車時使用。」

「我們將『公車舒適度』定義為『公車的搖晃程度』,也可以延伸到路平專案的道路顛簸偵測。一般走路的震動很小,但公車的震動很大,利用手機的三軸加速度計就能測量公車晃動程度,接著將震動量測換成舒適度分數。因為手機同時有 GPS ,可以知道這台公車的行車軌跡,藉以比對台北市公開資料中的公車即時軌跡,就能找出這台使用者的手機是在哪台公車上,連車牌號碼都能知道,藉以評比哪台公車開得比較穩。這個 App 獲得 2011 年『App Star 高手爭霸戰』社會組首獎,但一陣子後就沒有人在用了。因為 App 有生命週期,像 Pokemon GO 和 Angry Birds 當初那麼紅,現在還有多少人在玩?」

憤怒鳥(Angry Birds)為曾經風靡一時的手機遊戲。 圖/thethreesisters@flickr

如果 Angry Birds 熱潮都會消退,我們的 App 憑什麼活這麼久?

「我們學到的經驗是,若要讓『公車舒適度評測』變得長久,大眾的手機不是一個好平台,因為我們帶手機是為了講電話,不是為了量這些事情,這和我們的使用習慣不一樣,也沒辦法請大眾上公車後還幫忙打開 App 測量,因為上公車後抓住桿子都來不及。後來我們想用開源的硬體來做簡單的設備,剛好搭上自造者運動( The Maker Movement ),才有接下來的『空氣盒子』計畫。」

「但『公車舒適度評測』其實還有個應用機會,現在我父親因為行動不方便,會搭復康巴士去醫院。我發現復康巴士有的開得很好、有的很晃,輪椅上去都會綁安全帶,有的甚至開得會跳動,身為家屬會希望有個評鑑機制。復康巴士每台車都有 GPS 連線,業者或政府如果要評估復康巴士開得穩不穩,只要在上頭裝個一兩千塊的智慧型手機蒐集數據,也不用需要即時的網路傳輸,只要看記憶卡上的儲存紀錄就能知道今天巴士是怎樣的開法。」

做研究至今,覺得現實哪裡殘酷?解決的方式?

「以前遇到一個問題,大家會期待政府從上而下解決問題,但這樣不太容易推動大型計畫,因為上面的人不容易了解下面的人真正需要什麼,又要花很多錢,而且通常下面的人也會反彈。但無論『公車舒適度評測 App』或『空氣盒子』計畫,都是先找出大家需要什麼、關心什麼議題,我鼓動你、讓你有辦法做想做的事情,在協助你的同時也順便做我的研究,由下而上推動事情完成。」

空氣盒子的介紹網頁

「做研究需要大量 Data ,如果由上而下推行往往需要花費很多資源,但若找到大眾關心的議題,由下而上就能像滾雪球、越滾越大,只是需要一種包裝讓大眾接受你的想法。當對方認為『你是來幫助我的』,對方就會願意合作,例如『空氣盒子』的切入點是:我幫你知道現在的空氣狀況怎樣、幫你做分析、找出空氣污染的變化。」

要和參與專案的人站在一起、由下而上一起解決問題,而不是我想做什麼研究、我要你接受。

「合作時也要注意守住科學的立場。例如就曾經有訴求較強的議題團體找我們合作,但畢竟我們是做科學的人,雖然心理也許認同對方的想法,但還是要嚴守『讓數據說話』的原則,不要被帶著走。在台灣一旦被貼上特定立場的標籤,你的數據別人就再也不相信了,這是過程中學到的經驗。我們現在的合作對象可以是環保團體、政府單位、不同企業、不同社群,彼此之間靠著一條『線』互相合作,而這條『線』就是我們提供『正確的數據』。」

「平常學校都在講理論,沒有實際上戰場。理論的資料都很乾淨漂亮,可以做很多模型,但現實世界拿到的任何資料都很『髒』,要花很多時間清理資料。有些資料會有 outlier (異常值),有些有 missing data (缺失值),理論模型不一定套得上去。以前在學校都從理論出發,再去找實際觀測值,但現在實際的觀測資料就開放在這裡,就看你有沒有辦法解決問題。從這個角度出發,實作出來的東西馬上就會有價值,而且你會找到新的理論,這是一個很好的過程。」

「這段話太妙啦!」陳伶志從網路上看到,印下來勉勵自己。

本著作由研之有物製作,以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

研之有物│中央研究院_96
296 篇文章 ・ 3568 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
「開放資料」和醫療衛生
2012健康與醫療資料加值應用論壇_96
・2012/08/14 ・1830字 ・閱讀時間約 3 分鐘 ・SR值 571 ・九年級

-----廣告,請繼續往下閱讀-----

開放資料(Open Data)可定義為「經過挑選」、應讓大眾自由取得以供隨意使用或重新發表的資料,不受版權、專利或其他控管過度的機制所限。

開放資料並不是什麼新穎的觀念。提倡資料公開的人們主張科學數據資料的取得管道應該對公眾開放、不受任何限制,尤其是由政府機關收集製作、以公帑出資進行調查所得來的資料。他們也認為某些資料的取用限制和公共利益有所牴觸,應該取消所有的限制或收費。

雖然推動開放資料和開放近用(Open Data and Open Access)的運動正蓄勢待發,仍有不少組織團體極力反對,例如營利的出版社,還有一些需要靠收取資料使用費來維持運作的非營利教育研究單位。

開放資料資源──以醫療衛生為例

-----廣告,請繼續往下閱讀-----

以下挑選出來的是幾個關於世界人口健康和醫療保健的「開放資料」來源連結:

CDC Data & Statistics-美國疾病控制與預防中心(Centers for Disease Control & Prevention, CDC),開放取用各種資料以促進公共健康。

Google Public Data Explorer-提供關於醫療保健、經濟狀況、以及其他主題的大型公共資料集,容易取得、便於探討,且能以圖表呈現。

HCUP Databases-由美國保健政策研究機構(Agency for Healthcare Research & Quality, AHRQ)提供,關於醫療保健開支與用途的資料集。

-----廣告,請繼續往下閱讀-----

Health.Data.Gov-美國衛生及公共服務部(The U.S. Department of Health & Human Services, HHS)提供,由美國政府製作並/或握有的各種健康資料和數據集。

NationMaster-統整歐盟、世界衛生組織、聯合國教科文組織、聯合國兒童基金會、世界銀行等組織提供的健康資料和數據。

WHO Global Health Observatory-世界衛生組織設立的全球衛生觀察站(Global Health Observatory),提供關於全球健康重點議題的資料和分析。

World Bank Health Data-世界銀行(World Bank)針對各國醫療保健體系、疾病預防、優生保健、營養攝取、人口數據等等議題所收集的資料。

-----廣告,請繼續往下閱讀-----

*此外還有更多公開的健康醫療資料集和網站可以進一步瞭解,例如:

結論

關鍵就是──我們正目睹一個由「開放資料」建構的全新產業崛起,以創新的觀點重複使用公共部門的數據資料。這包括整合不同來源的資訊、開發新的工具或應用軟體、分析資料並製作實用的新報告或產品,藉此設法增加研究價值,不論是做為營利還是非營利之用。由公共部門所製作的「開放資料」的取用途徑非常具有經濟潛力,可提供公民和組織團體想要或需要的資訊,在這過程中也能催生許多新的公司和工作機會。

更多關於健康醫療資訊加值應用的討論,請見此專題

-----廣告,請繼續往下閱讀-----

天天問:

1. 如果你簽署同意提供自己的健康檢查結果或剩餘檢體用作研究,比如說,捐出說一根頭髮,關於這根頭髮如何運用,你認為自己應該被怎麼樣告知、要告知什麼或到何種程度呢?

2. 健康資料庫的加值應用所衍生的利益,歸屬於誰? 

3. 雖然個人所提供的資料可以匿名處理,但在串連起癌症檔、死因檔、地理資訊中心、處方籤等資訊後,特定年齡層、或居住於某些地區的人們,卻可能會因此被貼標籤,甚或汙名化。比如說,當若有研究指出年齡 50 歲以上、居住在南部的閩南婦女,最容易濫用醫療資源時,就會對於特定族群造成影響。你認為這樣的情況應該要如何避免呢? 

-----廣告,請繼續往下閱讀-----

4. 就你的了解,你認為健康資料庫加值應用的現況,是否有侵犯或未保護個人資訊自主及隱私的情形呢?歡迎分享你的經驗。

論壇一:政府現有健康相關資料之加值,是否須先經個人同意或立法授權?
論壇二:健康資料庫加值應用之現況是否侵犯或有未能保護個人資訊自主及隱私之疑慮?
論壇三:健康資料庫加值應用衍生利益之歸屬:公有?共有?私有?
論壇四:總體討論(後續該怎麼監督)

文章難易度
2012健康與醫療資料加值應用論壇_96
15 篇文章 ・ 0 位粉絲
舉辦公眾論壇,促成社會公眾對「健康及醫療資料運用及加值」進行理性、知情的討論,形成公共意見以作為決策的參考。 一、提出公眾論壇的討論成果:結論報告。 二、統整各界對健康及醫療資料運用及加值」之爭議意見及政策建議。 三、建構論壇準備期間為促成對話的重要程序和原則。