Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

健康與醫療資料的加值應用(六):國外健康資料加值相關情形

2012健康與醫療資料加值應用論壇_96
・2012/07/22 ・2346字 ・閱讀時間約 4 分鐘 ・SR值 531 ・七年級

(編註:)本文為〈健康與醫療資料的加值應用〉系列文章的尾篇,前面幾篇文章首先從健康紀錄如何轉換成健康資料庫談起,再分別詳細介紹目前台灣全民健康保險資料庫以及健康資料加值應用協作中心,接著從政策面的角度切入,為讀者們介紹政府預計推動的電子化醫療政策,還有健康與醫療資料應用上可能將面臨到的諸多議題挑戰。最後,本文列舉了一些國外健康資料加值的相關應用範例,作為參考與借鏡,期能幫助大家更全面地理解議題面貌。

一、美國的個人醫療資訊保障法案-HIPAA

美國HIPAA概念簡圖@wiki
美國HIPAA@wiki

1996 年,美國國會通過「健康保險可攜性與可責性法案」(The Health Insurance Portability and Accountability Act,以下簡稱 HIPAA),立法目的是為了將美國醫療產業電子化、規格化(大家的格式都差不多)、減少浪費,並促進醫療資源的有效運用、簡化行政作業,同時也提高了對於公民個人醫療資訊的保障。有許多學者指出,醫療電子化能夠使得醫師更能夠掌握病患資訊,像是醫師會知道病患同時間在服用甚麼藥物、做甚麼診療,或是能夠接續上一位醫師的診斷來修正用藥,舉例而言,小華看皮膚科,希望拯救她的痘痘問題,上一位醫師可能開了某些藥物,這一次,小華到另一家醫院就診,醫療電子化使得醫師知道小華之前是服用甚麼藥物,可以因此調整劑量或是換另外一種。

將醫療電子化、規格化,其目的就是促進醫療資訊的流通,減低因為病患換一家醫院,病歷資料就必須重新填寫、重新來過的時間。這些醫療資訊可能會存在同一個地方或資料庫,或者是用同一規格撰寫,使得醫師拿到病患之前的就診記錄,不需要謄寫過來。但是這些作法可能會威脅到病患隱私權、資訊安全。因此 HIPAA 分別在 2000 年制定「個人可辨識身分之健康資訊的隱私標準」(Standards for Privacy of Individually Identifiable Health Information),2003 年制定「安全標準」(Security Standards),為個人醫療資訊保障做更全面性的規範。

從前面小華和阿嬤的例子,我們可以看出,現階段能夠獲得病患醫療、就診紀錄的不僅僅只有醫師,而美國這法案使得醫療產業電子化,以後除了前面圖上所指出的單位能夠獲得就診記錄,其他醫院可能也可以獲得這次的就診記錄。HIPAA 擴大了能夠接受到單次就診紀錄的規模,換言之,醫療資訊被揭露給其他非醫院的人的情形更多了,由於醫療資訊可以識別出個人,或是特定個人(例如住在曼哈頓的白人之聾啞人士),相應地,它對於隱私也有更嚴謹的要求。2000 年制定的「個人可辨識身分之健康資訊的隱私標準」規定醫療資訊只有在為了下面這幾種原因,醫院才能將該次醫療資訊、就診記錄揭露給其他人使用:

-----廣告,請繼續往下閱讀-----

(1)把醫療資訊揭露給病患個人,例如病患個人向醫師申請該次就診的病歷摘要。
(2)基於診療、核銷費用或是健康照護之目的,例如醫師需要知道病患同時間服用甚麼藥物或是今年照過幾次 X 光片;保險公司、健保局需要知道這次的就診記錄、用藥紀錄以支付病患、醫師費用;安養院需要知道老人家健康檢查的結果以安排特定的照護人員和後續的檢查。
(3)合法的要求,像是 Medicare 資料庫,她們將保戶的資料做匿名處理、去身分辨識性之後,釋出供研究使用。
(4)其他獲得 HIPAA 授權的情形。

不過符合以上原因的揭露病患個人醫療資訊的行為必須要獲得病患個人的同意,同時也要符合最小使用原則,即如果醫師只需要知道病患同時間吃哪些藥,就不能要求病患要將上次就診時做了甚麼診療的記錄一併揭露。

HIPAA 不僅僅規範這些擁有個人健康資訊的機關必須要遵守規範,也明示公民個人的權利,像是我們可以決定這些機關能否將我的健康資料揭露給他人使用,或是當機關要把資訊給他人使用時必須要先經過我的同意,而且我可以更正我的健康記錄。

除了就診需求之外,許多研究單位、政府機關也會需要病患的健康醫療資訊,以利研究之用,於此,HIPAA 也做了相應的規範,當這些擁有公民個人醫療、健康資訊的組織在使用、釋出或是分享時,必須要遵守三大原則:不具有直接閱讀性、資料無法辨識出公民身分、在經過授權使用前,資料無法被重新建構。而此處 HIPAA 所保護的個人醫療資訊,指的是可以辨識出個人身分的醫療資訊,像是有個人姓名、社會保險號碼、駕照號碼、信用卡號碼、診斷記錄等敏感性資訊。由於許多機關擁有這些資訊,當他們在使用或是釋出資料上,有可能會侵害到個人的隱私權和資訊自主權。

-----廣告,請繼續往下閱讀-----

以美國聯邦醫療保險(Medicare)為例,此醫療保險是提供給 65 歲以上的老人、需要洗腎的民眾和身心障礙者,讓他們能以低廉的看診費獲得適宜的照護。Medicare 有將這些保戶資料釋出供做研究使用,申請費用大約是一年 400 美金(約 1 萬 2 千台幣),詳細費用因申請項目而不同。按照 HIPAA 規範,在資料釋出中,必須要處理過原始資訊,使得資訊無法被直接閱讀,即當資料不小心遺失時,其他沒有獲得授權的人是無法從上面獲知保戶的個人醫療資訊。Medicare 通常也只釋出部分保戶資訊(5%),不會將所有保戶資料都釋出。

而在 HIPAA 的安全規定要求,這些機關必須要建置合理的安全措施來保障個人醫療資訊的釋出,例如當要將個人醫療資訊以紙本方式釋出給研究人員、拿給保險公司的下游廠商做資料處理等,在傳輸的過程中,得放在一從外觀看不出是甚麼東西的不透明瓶罐裡,且送到研究單位後,要將這些資料存放在一個安全上鎖的地方,只有經過授權的人士才能從這存放處拿到資訊,而當資訊使用完之後,必須銷毀紙本資訊,像是化成紙漿、用碎紙機碎掉、燒掉等等。 而如果是電子資料,HIPAA 也要求擁有個人醫療資訊的機構必須要建置一適當的、可以維護個人隱私和資訊安全的防火牆,以限制個人資訊被盜取、避免未經授權者使用的可能。若是這些組織違反規定,因為營利、個人目的或是惡意散佈個人健康資訊,不僅會被罰 $100 到 $250,000 美金(約 3000 台幣到 750 萬台幣),更可以處理十年以上有期徒刑。

【下一頁:英國 GPRD 與歐盟的電子病歷管理制度】

-----廣告,請繼續往下閱讀-----
文章難易度
2012健康與醫療資料加值應用論壇_96
15 篇文章 ・ 0 位粉絲
舉辦公眾論壇,促成社會公眾對「健康及醫療資料運用及加值」進行理性、知情的討論,形成公共意見以作為決策的參考。 一、提出公眾論壇的討論成果:結論報告。 二、統整各界對健康及醫療資料運用及加值」之爭議意見及政策建議。 三、建構論壇準備期間為促成對話的重要程序和原則。

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

11
2

文字

分享

0
11
2
政府、學校、公民三方合作,共同完成臺灣第一份「國家鳥類報告」
PanSci_96
・2020/12/25 ・2131字 ・閱讀時間約 4 分鐘 ・SR值 492 ・五年級

-----廣告,請繼續往下閱讀-----

中華民國野鳥學會與特有生物研究保育中心正式發表「2020 臺灣國家鳥類報告(The State of Taiwan’s Birds 2020)」!這是臺灣第一份由政府部門、大專院校及民間組織共同完成的鳥類生存狀態評估報告。

2020 臺灣國家鳥類報告封面。圖/2020 臺灣國家鳥類報告

「2020 臺灣國家鳥類報告」整合了臺灣長期透過公民科學和監測調查的鳥類類群和特定鳥種,首次報導其族群狀態、數量變化趨勢、受威脅程度,以及保育策略與行動。簡單的說,這份報告將告訴各位,臺灣的鳥類們活得好不好?數量是變多還是變少?可能是什麼原因造成的?以及我們接下來該怎麼做?

「2020 臺灣國家鳥類報告」同時發布中文版與英文版,以及一冊報導更多細節的「詳細報告」,三冊報告都會公開在網路上供自由下載,讓臺灣大眾與世界各國認識臺灣鳥類的生存現況,以及思索未來鳥類保育和我們的生活環境的發展。

目前,全臺灣有確切紀錄的野生鳥類共有 674 種,其中有 52 種鳥類的生存受到威脅。29 種繁殖鳥類的數量在減少,有 15 種度冬水鳥的數量在下降,這些都是臺灣自然環境劣化的警訊。「2020 臺灣國家鳥類報告」共分成三大篇:

  • (一)特定類群:包括繁殖鳥、度冬水鳥、繁殖燕鷗及遷徙猛禽。
繁殖鳥—烏頭翁。圖/2020 臺灣國家鳥類報告,呂翊維攝
繁殖燕鷗—鳳頭燕鷗。圖/2020 臺灣國家鳥類報告,呂翊維攝
  • (二)、特定鳥種:包括黑面琵鷺、黑嘴端鳳頭燕鷗、黑鳶、水雉、八色鳥、小辮鴴、山麻雀、草鴞及熊鷹等 9 種鳥類。
黑嘴端鳳頭燕鷗。圖/2020 臺灣國家鳥類報告,呂翊維攝
水雉。圖/2020 臺灣國家鳥類報告,吳志典攝
  • (三)、保育議題:探討鳥類可能的受脅原因及未來的保育策略,包括氣候變遷、濕地喪失與劣化、野鳥販賣、農藥毒害、外來入侵種及海鳥混獲共6項議題。

什麼是「國家鳥類報告」

鳥類是反映棲地環境狀態的重要指標生物,鳥類活得好不好,是一個國家環境是否健全的指標。許多重視環境健全和鳥類保育的國家,包括美國、加拿大、英國、印度、南非、澳洲和紐西蘭,都會定期整理鳥類調查紀錄並發布「國家鳥類報告」,作為環境狀況的重要基礎資訊,也是環境劣化的預警機制。

「2020臺灣國家鳥類報告」的緣起

臺灣雖然不是聯合國的會員國,但是仍積極配合聯合國生物多樣性公約,發布生物多樣性相關的國家報告。2013 年,眾多關注生物多樣性保育的政府機關、大專院校及民間組織,共同整合與分析我國鳥類的監測資料成果,編撰成「2020 臺灣國家鳥類報告」。於全世界檢視保育成果的 2020 年,向全世界報告臺灣的鳥類保育狀況。

-----廣告,請繼續往下閱讀-----
台灣鳥類紅皮書摘要。圖/2020 臺灣國家鳥類報告

「公民科學」與「開放資料」功不可沒

「2020 臺灣國家鳥類報告」集結了許多臺灣在地鳥類的監測與研究,更有許多由民間長年來累績的公民科學資料,這些資料是完成國家鳥類報告的必要條件。

eBird Taiwan 賞鳥紀錄資料庫為例,已有近 3900 人貢獻鳥類觀察紀錄,並累計超過 47 萬 3 千份賞鳥紀錄,是全球排名第 7。「臺灣生物多樣性網絡」也累積了超過 780 萬筆鳥類觀察紀錄。這樣在國際上名列前矛的成績,歸功於數千名鳥類及自然觀察愛好者熱切且熱心的觀察與記錄、並且分享資訊。

有了這樣的大數據,我們才能知道這些鳥類的數量多不多、活得好不好。

2022 下集待續

「2020 臺灣國家鳥類報告」是臺灣鳥類保育工作的重要里程碑,但不是終點站。在報告的編撰過程中,我們也注意到了還有許多鳥類和牠們的棲地尚未受到關注,也還需要保育資源的投入。鳥類的生活不會受到國界限制,身為全球夥伴的一員,臺灣的保育工作將以聯合國千禧年永續發展目標作為核心,持續與國際社會分享我們的觀察紀錄和保育工作進展。

-----廣告,請繼續往下閱讀-----

未來,每兩年會發布一次國家鳥類報告,定期更新臺灣鳥類的生存與保育狀況,我們期待下一份報告會為大家帶來更多的好消息。

延伸閱讀

-----廣告,請繼續往下閱讀-----
PanSci_96
1262 篇文章 ・ 2411 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

0

0
0

文字

分享

0
0
0
技術宅如何拯救真實世界?這不是輕小說,是資料科學家陳伶志的專訪
研之有物│中央研究院_96
・2018/01/07 ・4558字 ・閱讀時間約 9 分鐘 ・SR值 473 ・五年級

用「資料科學」解決生活問題

2018 年後台灣國中小學生要學程式設計,如何「編寫」程式可以教,但如何「運用」程式就需要以人生經驗付學費。

本文專訪中研院資訊科學所陳伶志副研究員,擅長硬體組裝設計,也擅長分析資料數據,透過心路歷程為你揭曉:無論是孕婦和老人搭公車遇到的玩命關頭,或是氣喘兒遇到的 PM2.5 空污問題,都能用「硬體感測」結合「公開資料」找出對策。

陳伶志希望能用程式解決生活問題, 和團隊研發「公車舒適度評測 App」和「空氣盒子」偵測 PM2.5 。圖/張語辰

小時候會好奇亂拆東西嗎?

「小時候會把東西拆開來再組回去,也不懂原理,其實就是搗蛋,然後就越玩越大。我哥哥以前是讀電子科,家裡有很多小零件,所以我從小就喜歡玩、不會害怕這些電的東西。有一次不小心把電子錶丟到洗衣機洗,結果壞了,只好自己把電子錶全部拆開來曬乾,想不到組回去又可以用。也常常隨便把東西插到插座裡,造成家裡跳電,因為怕被大人罵就學會自己把插座拆下來、換上新的保險絲。」

陳伶志家裡以前就有很多電子小零件。圖/Pexels@pixabay

大學是宅宅嗎?都在做什麼?

「我算蠻宅的 (呵呵)第一次開始學電腦是在大學,那時候參加過三次 ACM – ICPC 程式比賽,平常花很多時間練習解題。也當過計中的工讀生,到各處室幫忙解決電腦問題,到了那邊發現很多只是插頭沒插、或是網路線被踢斷而已(笑)。」

「大學時做過最熱血的事情是擔任 BBS 站長,現在 BBS 有彩色模式、丟水球等功能,但那時候還蠻陽春的,我們團隊就花很多時間熬夜摸程式,自己想怎麼做出來、弄得很炫。也有一次進站發現駭客入侵,把整個 BBS 站台砍掉,畫面中只留下駭客的名字證明他很厲害。那時候不太知道怎麼辦,就和朋友一起挖系統的歷史資料,把駭客潛伏的洞補起來,後來透過其他高手我們也入侵駭客的主機,發現他有點收藏癖,收藏了各個駭過的完整站台,我們也把被駭客備份的 BBS 站台再整個備份回來。」

陳伶志大學最熱血的事情是曾擔任 BBS 站長,現在的 BBS 功能比較複雜。圖/By moboo@ Wikimedia Commons

不用怕問題,這個世界上一定有人解決過其中部分的問題,上網看看別人怎麼做、自己也試試看。

「師大第一次網路選課系統,是我在大三暑假時寫出來的,因為當時廠商要價太高,計中的主任就丟了一個 SQL Server 叫我試試看。玩了一兩天後發現如果用這種方法,我大概開學後也寫不出來,就改用在檔案系統上開檔讀檔的做法,硬是把選課系統完成。那時程式語言不像現在這麼方便,寫法比較低階,沒有那麼豐富的函數庫可以呼叫。最麻煩的是,如果同時有兩個人選門課,中間會有競爭關係,必須去學怎樣把檔案優先權鎖起來。那時候還沒學到這些課,我把這個選課系統做出來之後,後來上課時才發現原來這些理論我之前已經實作過。回想這段期間是最快樂的,因為可以自己上網找資源解決問題,很開心。」

「大學很宅的原因是,把這些事情跟別人講,別人只覺得你很無聊。(呵呵)」

程式很厲害,還需要出國讀書嗎?

「考量到家庭經濟,我本來一直很不想出國,因為我是師大資訊教育系的師範生,大學畢業後我先教書再去當兵。當兵時有各單位來選兵,常常都會先讓資訊系的站起來,然後只有大學學歷的坐下,後來我根本不想站起來,因為最後一定會坐下、不會被選到,那時讓我很有感觸,也改變心意決定繼續深造。」

「退伍後曾經有公司提供很好的待遇,但那時有位長輩跟我說『你這時候年輕,要先投資自己,錢以後再賺就好』,加上當兵時看了很多勵志的書,被《牧羊少年奇幻之旅》這本書打動,就決定出國讀碩士。但出國念碩班沒有獎學金,那時候第一年就要花 100 萬,為了在出國前就先存到一年的錢,我就白天上班、晚上兼差、同時準備托福和 GRE 考試、也回學校跟老師做研究,退伍後那一年過得超充實。」

當你真心渴望某種東西時,整個宇宙都會聯合起來幫助你完成。──《牧羊少年奇幻之旅》

「在加州大學洛杉磯分校讀資訊科學碩博士時,一開始我是做 Wi-Fi 網路的行動運算研究。例如我的筆電現在連到 A 網路,但我走一走連到 B 網路時,正在下載的檔案或正在看的棒球比賽轉播能不能不要中斷、直接切換過去。接著想進一步研究頻寬變化,因為若切換時知道頻寬如何改變,就能即時調整影片傳輸大小。最後論文主軸聚焦在頻寬研究,現在很多測頻寬都是丟資料去量「可用頻寬」,但我研究的是「最大頻寬」,難度是不能送太多封包影響別人,還要可以測量高速網路、低速網路、或者是去跟回來速度不一樣的非對稱性網路。這些計畫在國外做得差不多,回台灣後就沒有繼續往下鑽,改成尋找別的題目。」

陳伶志曾從事 Wi-Fi 網路的行動運算研究,可以應用在棒球直播上。圖/Roberto Coquis – Flickr

從宅宅變成中研院的研究人員,你認為研究是什麼?

研究成果應該用來解決人們生活中的問題,要能看得到、實際可以使用。

「中研院蠻自由,不會干擾你要做什麼題目。我比較不喜歡純粹只有理論,會希望理論最好跟現實接上線,因此選擇研究題目時比較實際導向,例如之前做過『公車舒適度評測 APP』。做研究會有很多理論,要想辦法在理論和實際間找到連接點,不是所有題目都能在現階段就能看得到東西,但現階段看得到東西的題目,又很容易變成是在做黑手、沒有理論。要能兩者兼具的題目很不好找,我們一直想辦法挖掘,像『空氣盒子』計畫就有符合。」

陳伶志與團隊研發的「微型空污偵測模組」,可以即時偵測所在環境的溫濕度、氣壓、 PM2.5 濃度。圖/張語辰

人生中有失敗過嗎?

「2009 年時研究院路二段發生一起公車車禍,甚至有人因此喪命。坐過公車都知道有些公車開得很猛、有些公車開得很穩,那時候我們在想能不能把大家坐過都知道的事實,用科學化數據呈現出來。這個數據對孕婦和老人很重要,因為他寧可多等五分鐘,搭到一班比較穩的公車,才不用在公車上抓桿子抓得那麼緊,所以我們就做了『公車舒適度評測 App』,鼓勵大眾攜帶手機、搭公車時使用。」

「我們將『公車舒適度』定義為『公車的搖晃程度』,也可以延伸到路平專案的道路顛簸偵測。一般走路的震動很小,但公車的震動很大,利用手機的三軸加速度計就能測量公車晃動程度,接著將震動量測換成舒適度分數。因為手機同時有 GPS ,可以知道這台公車的行車軌跡,藉以比對台北市公開資料中的公車即時軌跡,就能找出這台使用者的手機是在哪台公車上,連車牌號碼都能知道,藉以評比哪台公車開得比較穩。這個 App 獲得 2011 年『App Star 高手爭霸戰』社會組首獎,但一陣子後就沒有人在用了。因為 App 有生命週期,像 Pokemon GO 和 Angry Birds 當初那麼紅,現在還有多少人在玩?」

憤怒鳥(Angry Birds)為曾經風靡一時的手機遊戲。 圖/thethreesisters@flickr

如果 Angry Birds 熱潮都會消退,我們的 App 憑什麼活這麼久?

「我們學到的經驗是,若要讓『公車舒適度評測』變得長久,大眾的手機不是一個好平台,因為我們帶手機是為了講電話,不是為了量這些事情,這和我們的使用習慣不一樣,也沒辦法請大眾上公車後還幫忙打開 App 測量,因為上公車後抓住桿子都來不及。後來我們想用開源的硬體來做簡單的設備,剛好搭上自造者運動( The Maker Movement ),才有接下來的『空氣盒子』計畫。」

「但『公車舒適度評測』其實還有個應用機會,現在我父親因為行動不方便,會搭復康巴士去醫院。我發現復康巴士有的開得很好、有的很晃,輪椅上去都會綁安全帶,有的甚至開得會跳動,身為家屬會希望有個評鑑機制。復康巴士每台車都有 GPS 連線,業者或政府如果要評估復康巴士開得穩不穩,只要在上頭裝個一兩千塊的智慧型手機蒐集數據,也不用需要即時的網路傳輸,只要看記憶卡上的儲存紀錄就能知道今天巴士是怎樣的開法。」

做研究至今,覺得現實哪裡殘酷?解決的方式?

「以前遇到一個問題,大家會期待政府從上而下解決問題,但這樣不太容易推動大型計畫,因為上面的人不容易了解下面的人真正需要什麼,又要花很多錢,而且通常下面的人也會反彈。但無論『公車舒適度評測 App』或『空氣盒子』計畫,都是先找出大家需要什麼、關心什麼議題,我鼓動你、讓你有辦法做想做的事情,在協助你的同時也順便做我的研究,由下而上推動事情完成。」

空氣盒子的介紹網頁

「做研究需要大量 Data ,如果由上而下推行往往需要花費很多資源,但若找到大眾關心的議題,由下而上就能像滾雪球、越滾越大,只是需要一種包裝讓大眾接受你的想法。當對方認為『你是來幫助我的』,對方就會願意合作,例如『空氣盒子』的切入點是:我幫你知道現在的空氣狀況怎樣、幫你做分析、找出空氣污染的變化。」

要和參與專案的人站在一起、由下而上一起解決問題,而不是我想做什麼研究、我要你接受。

「合作時也要注意守住科學的立場。例如就曾經有訴求較強的議題團體找我們合作,但畢竟我們是做科學的人,雖然心理也許認同對方的想法,但還是要嚴守『讓數據說話』的原則,不要被帶著走。在台灣一旦被貼上特定立場的標籤,你的數據別人就再也不相信了,這是過程中學到的經驗。我們現在的合作對象可以是環保團體、政府單位、不同企業、不同社群,彼此之間靠著一條『線』互相合作,而這條『線』就是我們提供『正確的數據』。」

「平常學校都在講理論,沒有實際上戰場。理論的資料都很乾淨漂亮,可以做很多模型,但現實世界拿到的任何資料都很『髒』,要花很多時間清理資料。有些資料會有 outlier (異常值),有些有 missing data (缺失值),理論模型不一定套得上去。以前在學校都從理論出發,再去找實際觀測值,但現在實際的觀測資料就開放在這裡,就看你有沒有辦法解決問題。從這個角度出發,實作出來的東西馬上就會有價值,而且你會找到新的理論,這是一個很好的過程。」

「這段話太妙啦!」陳伶志從網路上看到,印下來勉勵自己。

本著作由研之有物製作,以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook