0

0
0

文字

分享

0
0
0

監測龐大量測物理量的智慧型異常偵測運算法

科景_96
・2011/02/10 ・817字 ・閱讀時間約 1 分鐘 ・SR值 558 ・八年級

Original publish date:Feb 20, 2010

編輯 HCC 報導

 

數量龐大的量測資料進行分析與後處理時,因為雜訊、外在環境干擾、設備問題等等,經常包含許多錯誤資料,工程師必須正確且有效率的去除錯誤數據,並研判感應器是否失效;一套創新的運算技術能協助解決上述問題。

美國National Center for Atmospheric Research (NCAR) 與University of Colorado at Boulder (CU)研究人員研發了上述稱之為智慧型異常偵測運算法(Intelligent Outlier Detection Algorithm. IODA) 的專利技術,論文發表於二月份的Journal of Atmospheric and Oceanic Technology。

-----廣告,請繼續往下閱讀-----

IODA係依據統計學、圖形理論、影像處理與決策樹發展,並以MATLAB程式撰寫而成;此專家系統可使用於敏感的複雜技術系統,例如人造衛星、氣象設備、發電廠、雷達、太空探測或各式監測量測系統等。基本上,只要是藉由感應器量測所得之時域(time domain)物理量,數量過於龐大,無法以人工方式檢視篩選(譯者的舊經驗是先把量測物理量時域圖畫出,研判數據不合理的地方,再進入數據資料庫刪除不正常的數據,或寫個小程式研判數據變化率是否合理,很不科學吧!),或者感應器故障的後果很嚴重時,都適用IODA處理。

在量測數據發生錯誤讀數或其他由失效感應器所引起的問題時,IODA能協助警告儀具設備操作者;儀具感應器一旦故障,並開始傳遞謬誤的資料時,IODA即能辨識問題並且將謬誤資料隔離。

一般而言,系統需要辨識出壞數據時,需要佐以多重感應器(利用其他正常感應器讀數辨識出壞的感應器讀數;所以在做物理量監測時,一定要有備份感應器),或以能表現所量測物理量特性的運算邏輯,在數據突然變化時,依據運算結果辨識出問題(例如你在監測高鐵橋樑結構,以應變計長期量測橋樑結構的應變量時,依據工程經驗,所計算出的應力值不應超過待量測材料的降服強度);所以應用工程師所寫的運算邏輯只適用於某種型態的時域物理量,無法遍及其他的物理量。而IODA能將進來的讀數與通用失效模式進行比較,以影像處理方式進行運算,因此能廣泛的應用於各種物理量監測。

 

 

參考來源:

-----廣告,請繼續往下閱讀-----

相關連結:

文章難易度
科景_96
426 篇文章 ・ 7 位粉絲
Sciscape成立於1999年4月,為一非營利的專業科學新聞網站。

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

0

2
1

文字

分享

0
2
1
時時刻刻監測您的「飛行安全」——智慧型手機有潛力作為「大麻檢測器」
帕德波耶特 Pas de poète_96
・2021/10/30 ・3146字 ・閱讀時間約 6 分鐘

智慧型手機的功能日趨全面,幾乎就要包辦日常生活大小事,當然也包含我們的健康。有些人拿它來記錄每天的運動狀況,也有人搭配應用程式,監測自己的心肺功能。

但這還不夠,科學家總是能想到更奇葩的需求:未來,你的手機也有機會變身「大麻檢測器」了!羅格斯大學健康暨健康政策與高齡研究所(Rutgers Institute for Health, Health Care Policy and Aging Research)研究團隊,調查大麻使用者的「嗨度」,並將其與機器學習技術做結合,試圖打造能準確判斷大麻中毒程度的日常小工具。

研究發表於《藥物與酒精依賴》(Drug and Alcohol Dependence)期刊[1]

大麻何以讓人愉悅?

法國喜劇劇集《大麻咖啡館》(Family Business)中,年輕企業家喬瑟夫.亞贊(Joseph Hazan)乘著法國大麻合法化的順風車,決定將老父親傑哈德.亞贊(Gérard Hazan)的肉鋪改造成大麻咖啡館。雖說父親一開始很反對,但在偶像安瑞可.馬西亞斯(Enrico Macias)的循循善誘下,父親最終也體驗了呼麻的快感,並開始積極面對他們的咖啡館事業。

-----廣告,請繼續往下閱讀-----

大麻為何能讓人快樂到放棄執著?一個叫四氫大麻酚(Tetrahydrocannabinol, THC)的傢伙扮演著關鍵角色。由於 THC 的化學結構與人體的內源性大麻「花生四烯乙醇胺」(anandamide)十分相似,它能與大麻素受體(cannabinoid receptors)結合,並啟動大腦的獎勵系統,讓我們感到身心愉悅[2]

這不免讓人感到好奇:究竟,人們是如何攝入大麻的呢?

一般來說,大麻被攝取的途徑有二:吸食,或直接拿起來嗑(沒啦,是摻在食物裡面服用)。當人們吸食大麻時,裡頭的化學物質會從肺部進入血液,進而將它們運送到身體各處,包括大腦。但如果是用吃的,由於是透過消化系統吸受,因此大麻所帶來的影響通常會晚個 30 分鐘到 1 小時出現。

製作中的大麻奶油。圖/WIKIPEDIA

大麻中毒將導致「定向感」降低

對大麻使用者來說,它最迷人的地方大概就是使用後欣快的放鬆感受。此外,有些人也會體驗到感官放大的飄忽景象,但也有部分人認為,大麻會讓他們感到焦慮、恐懼、不信任和恐慌。雖然目前較少有因純粹吸食大麻而死亡的案例,然而,若是使用過量,便會引發大麻中毒(cannabis intoxication)[3]

-----廣告,請繼續往下閱讀-----

大麻中毒的人,輕則產生飢餓與嗜睡等症狀,嚴重的話,會導致認知與對人事時地物的定向感降低,甚至會出現急性精神病(acute psychosis)[4]。其他典型、可預測的症狀,還包括口乾舌燥、紅眼、短期記憶受損,以及知覺和動作的影響等5

部分大麻中毒者,會因為大麻在精神上的影響,對外界反應時間過慢,造成工作或學校表現低落,甚至在開車、駕駛時形成干擾,最終導致交通事故與傷亡等憾事。

雖說如今有血液、尿液或唾液等測試,能針對大麻中毒進行檢測,但若要實現日常生活中的時刻監測,恐怕還是有些限制的。

過去曾有研究,以現代人形影不離的「智慧型手機」裡的感測器,來探測高風險的飲酒者,準確率高達 90%[6]。有鑑於此,羅格斯大學健康暨健康政策與高齡研究所團隊開始研究,想知道在機器學習模型的協助下,手機是否能發揮檢測「大麻中毒」的作用,即時探測那些可能因大麻中毒引發的危機。

-----廣告,請繼續往下閱讀-----
智慧型手機,有潛力作為「大麻中毒」的檢測器。圖/Pexels

如何檢測嗨不嗨?關鍵是「使用後的行為」

團隊首先從美國賓州匹茲堡(Pittsburgh, PA)找來 57 位年齡介在 18~25 歲的年輕人,透過自我報告,得知他們每週至少使用大麻兩次。之後,團隊透過「手機回傳調查」搭配「手機內感測器數據」等方法,每日收集受試者使用大麻的相關數據持續至多 30 天,以掌握他們在大麻中毒後的狀況。

其中,回傳調查每日三次,包含開始與結束使用大麻的時間、用量,以及主觀感受的自我評分——依據「嗨」的程度,評分標準為 1~10分,其中 10 分為「敲級嗨」。後來回傳的 451 起大麻使用事件中,平均「嗨度」為 3.77 分。

而手機則搭配應用程式,收集了 102 種手機感測器的數據,如 GPS、加速度計(accelerometer)、撥出的電話數量以及平均移動距離等。有些人聽到這裡可能坐不住了。等等⋯⋯GPS 這類定位工具與加速度計,到底能做什麼?是這樣的,GPS 可用來偵測大麻使用者陷入「自我陶醉」時的行進範圍(travel boundary),而加速度計則是用來監測他們的步態與身體活動量。

在對照受試者的回傳調查及手機數據後發現,當使用者回報他們「正嗨」時,透過 GPS 的數據分析可知,他們的移動範圍並不遠。另外,此時加速度計的資料也顯示,主觀報告大麻中毒者,雖然活動多樣性下降,但身體的活動程度卻比較劇烈。

-----廣告,請繼續往下閱讀-----

考慮時間點的監測,精確度大提升!

最後,他們在演算法的幫助下[7][註1],盼能瞭解上述方法,是否能區別無中毒和中毒(輕度或中度)的情形。透過各種中毒時的行為特徵,加上機器學習技術的檢核,智慧型手機就可以變成如假包換的「大麻使用監測器」啦!

為了探究這個組合的準確性,團隊企圖在不同的時間點(例如:一周中的某一天,或是某一天的幾點幾分)下做排查,找出與大麻使用行為與特定時間點的關係,以進一步確認大麻中毒的具體指標。

結果顯示,僅出動手機內的感測器偵測這群人是否使用大麻,準確度為 67 %;但若結合「個人呼麻時間點」與 GPS 和加速度計等資料,則準確度高達 90%

經乾燥過後的大麻示意圖。圖/Pexels

用手機偵測大麻使用?得再等等⋯⋯

面對如此結果,研究團隊認為,以手機結合機器學習預測大麻中毒程度,是相當可行的。不過,未來還需要加入更多資料,以完備這項工具。

-----廣告,請繼續往下閱讀-----

首先,由於該研究對大麻中毒的判定,主要建立在「受試者主觀判斷和自我(ㄕㄡˇ)報告」的基礎上,因此在物質使用和生理反應的識別上,不如執法部門的檢驗工具那般客觀。此外,像是大麻使用者的使用史、攝入身體的途徑、劑量,以及使用者對大麻的耐受性,都會影響他們報告身體狀況的結果。

不僅如此,像是不常使用大麻者在中毒時,他們的行為與身體反應和那些「老司機」們相比,是否有明顯差異?該研究受試者多為白人,其他人種在同劑量的條件下,會不會產生相應的數據?這裡不是要戰種族,但光是「喝酒」這件事,每個人種的反應也多少帶有一些差異,像亞洲人普遍就很難代謝酒精[8]

以上種種,都是這個工具可能被泛用的關鍵。最後,假設這個大麻偵測小工具,有朝一日被推到應用程式的市場上,你會想下載嗎?又,我們是否能因為大麻使用者的敏感身份與風險,而逕自對他們搜集資料、加以監控?作為一旁拍手叫好等待好用產品問世的小老百姓,在引頸期盼的同時,也必須深思這樣的問題。

註解

  • 註 1:該研究所使用的技術為「Light Gradient Boosting Machine」,是微軟公司以「決策數演算法」(decision tree algorithms)為基礎,於二〇一七年釋出 LightGBM 演算法,用於排序、分類和其它機器學習的任務。

參考文獻

  1.  Sang Won Bae et al. (2021) Mobile phone sensor-based detection of subjective cannabis intoxication in young adults: A feasibility study in real-world settings. Drug and Alcohol Dependence
  2.  How does marijuana produce its effects? National Institute on Drug Abuse, 2020.
  3.  What are marijuana’s effects? National Institute on Drug Abuse, 2020.
  4.  Helen Okoye. Cannabis Intoxication DSM-5 292.89 (F12.12). Theravive.
  5.  Marijuana intoxication. U.S. National Library of Medicine.
  6.  Bae et al. (2018) Mobile phone sensors and supervised machine learning to identify alcohol use events in young adults: Implications for just-in-time adaptive interventions. Addictive Behaviors
  7.   LightGBM. Wikipedia.
  8.  Hui Li et al. (2009) Refined Geographic Distribution of the Oriental ALDH2*504Lys (nee 487Lys) Variant. Annals of Human Genetics.

0

0
0

文字

分享

0
0
0
網路鄉民說「有圖有真相」,但真的是這樣嗎?你應該注意的科學三原則──《晨讀10分鐘:科學跟你想的不一樣》
親子天下_96
・2019/07/17 ・1906字 ・閱讀時間約 3 分鐘 ・SR值 534 ・七年級

文/鄭國威

中文說「眼見為憑」,英文說「Seeing is believing」,網路鄉民說「有圖有真相」,不過真的是這樣嗎?

很可惜,我們人類的眼睛接收到的視覺,以及所有的感官,例如觸覺、嗅覺、聽覺、味覺等,甚至是我們的記憶,其實都不太可靠,又都會受到各自觀察角度跟生活經驗的影響,而扭曲了觀察結果,因此做好科學觀察,便是科學探索的第一道關卡。

科學不只是把墨鏡摘下來的問題。圖/picryl

科學是探索世界的一種「過程」,而過程的產出就是知識,如果過程出了問題,產出也很可能會失真,就像戴上了墨鏡,看出去的世界都是陰陰暗暗的,總不能說世界本來就是這樣。「那就把墨鏡摘下來就好啦!」問題是,我們很容易堅信自己沒有帶墨鏡,更不知道怎麼摘下來。所以要能科學觀察,就要先了解怎樣讓過程,也就是科學方法,符合科學的原則。原則主要有三個:

第一個原則是:

要讓結果是科學的,所收集的證據必須是可以被觀察、被量度、被經歷過的。空口說白話不能當成證據,要想證明什麼,一定要是現實生活中可以「量測」得到的現象才行。例如在〈長頸鹿啊長頸鹿,你的脖子怎麼那麼長?〉這篇文章中,科學家如果想知道脖子長的長頸鹿是不是比較有生存優勢,不能只是想當然爾,而是得去紀錄,去量長頸鹿吃過的灌木高度,最好也把他們進食的過程拍下來。

第二個原則是:

在過程中,根據所觀察、量度、經驗的事實,去證明「假說」正確還是不正確。假說就是我們根據已經知道的知識,包括科學事實和科學原理,對想研究的自然現象及規律性提出的推測和說明,是一個暫時可以被接受的解釋。

為了避免做調查跟實驗時發生錯誤或誤解,或是運氣太好或太不好,調查跟實驗的步驟、結果都必須要能夠讓其他研究者能夠照著做看看,這就是「可重複性」。例如在〈政權轉移,天機早已透漏?──「熒惑守心」與歷史上的政治陰謀〉這篇文章裡,你會看到為什麼火星的位置跟帝王的政權會被錯誤但刻意的連結起來,這就是還不具有科學思維的古人,對於「可重複性」這一點的不理解。看完之後也可以想想看,我們在看到令人嘖嘖稱奇的科學新聞時,例如「吃XXOO能預防癌症」,就算看起來合邏輯,也都該問問自己「有其他研究者重複實驗過了嗎?」

第三個原則是:

整個過程都必須是客觀的。所謂客觀,就是調查與實驗者的意志,不能夠影響步驟的進行和數據的取得,就算實驗者百分之百確認實驗結果,也必須要以各種方式和實驗設計,來減低實驗者可能帶來的影響,這就是「把墨鏡摘下」的意思。

例如在〈海鳥食安大危機:不死的塑膠垃圾〉這篇文章中,就算對海鳥誤食塑膠垃圾的現況再生氣,如果想要知道海洋塑膠都到哪裡去了,也得從各種地區的各種海鳥身上做調查,而不只是看網路上的海鳥屍體圖片就下定論,或是只到「最常發現體內充滿塑膠垃圾的屍體」的地方採樣本。

客觀也意謂著,科學家在實驗取樣的時候,要重視隨機性跟代表性。就算是針對特定實驗對象,反覆實驗,也要盡可能讓施測時的條件一致,避免實驗者或被實驗者刻意造成的差異。這一點,在以人類為對象的實驗上尤其要特別小心,像是有些針對超能力的研究,就是違反客觀原則的重災區。

實驗紀錄是科學觀察重要的一環。圖/wikipedia

為了滿足這三大原則,科學家需要在整個過程中,完整保留所有紀錄、結果和資料。這可不是要讓記性差的科學家可以記得之前到底實驗是怎麼做的,而是能讓之後的科學家能重複實驗步驟。而且,科學家也應該把實驗的紀錄、結果和資料保留好,盡可能公開接受檢驗;若有違背科學原則的隱瞞或刪減,通常會在各方的檢視下或他人重複實驗下現形。

就算對自己的科學觀察有自信,符合上述科學原則,也不代表就萬無一失。所以科學家得對於「自己支持或信任的假說和理論被新出現的事證推翻」的可能性保持開放、彈性和豁達。

當然,如果你約會遲到半小時,發現女朋友或男朋友很生氣,你肯定不會還在那邊觀察、提出問題假說,然後重複實驗,然後再觀察,確定對方是不是因為你遲到半小時才生氣,或是如果遲到二十八分鐘,是不是就不會生氣……。科學觀察,的確不容易!

——本文摘自《晨讀10分鐘:科學跟你想的不一樣》,2019 年 6 月,親子天下出版

親子天下_96
26 篇文章 ・ 25 位粉絲
【親子天下】起源於雜誌媒體和書籍出版,進而擴大成為華文圈影響力最大的教育教養品牌,也是最值得信賴的親子社群平台:www.parenting.com.tw。我們希望,從線上(online)到實體(offline),分齡分眾供應華人地區親子家庭和學校最合身體貼的優質內容、活動、產品與服務。

0

0
0

文字

分享

0
0
0
監測龐大量測物理量的智慧型異常偵測運算法
科景_96
・2011/02/10 ・817字 ・閱讀時間約 1 分鐘 ・SR值 558 ・八年級

-----廣告,請繼續往下閱讀-----

Original publish date:Feb 20, 2010

編輯 HCC 報導

 

數量龐大的量測資料進行分析與後處理時,因為雜訊、外在環境干擾、設備問題等等,經常包含許多錯誤資料,工程師必須正確且有效率的去除錯誤數據,並研判感應器是否失效;一套創新的運算技術能協助解決上述問題。

美國National Center for Atmospheric Research (NCAR) 與University of Colorado at Boulder (CU)研究人員研發了上述稱之為智慧型異常偵測運算法(Intelligent Outlier Detection Algorithm. IODA) 的專利技術,論文發表於二月份的Journal of Atmospheric and Oceanic Technology。

-----廣告,請繼續往下閱讀-----

IODA係依據統計學、圖形理論、影像處理與決策樹發展,並以MATLAB程式撰寫而成;此專家系統可使用於敏感的複雜技術系統,例如人造衛星、氣象設備、發電廠、雷達、太空探測或各式監測量測系統等。基本上,只要是藉由感應器量測所得之時域(time domain)物理量,數量過於龐大,無法以人工方式檢視篩選(譯者的舊經驗是先把量測物理量時域圖畫出,研判數據不合理的地方,再進入數據資料庫刪除不正常的數據,或寫個小程式研判數據變化率是否合理,很不科學吧!),或者感應器故障的後果很嚴重時,都適用IODA處理。

在量測數據發生錯誤讀數或其他由失效感應器所引起的問題時,IODA能協助警告儀具設備操作者;儀具感應器一旦故障,並開始傳遞謬誤的資料時,IODA即能辨識問題並且將謬誤資料隔離。

一般而言,系統需要辨識出壞數據時,需要佐以多重感應器(利用其他正常感應器讀數辨識出壞的感應器讀數;所以在做物理量監測時,一定要有備份感應器),或以能表現所量測物理量特性的運算邏輯,在數據突然變化時,依據運算結果辨識出問題(例如你在監測高鐵橋樑結構,以應變計長期量測橋樑結構的應變量時,依據工程經驗,所計算出的應力值不應超過待量測材料的降服強度);所以應用工程師所寫的運算邏輯只適用於某種型態的時域物理量,無法遍及其他的物理量。而IODA能將進來的讀數與通用失效模式進行比較,以影像處理方式進行運算,因此能廣泛的應用於各種物理量監測。

 

 

參考來源:

-----廣告,請繼續往下閱讀-----

相關連結:

文章難易度
科景_96
426 篇文章 ・ 7 位粉絲
Sciscape成立於1999年4月,為一非營利的專業科學新聞網站。