1

0
0

文字

分享

1
0
0

保護雲端隱私的技術: Unhosted 與 Homomorphic Encryption

洪朝貴
・2011/09/25 ・1894字 ・閱讀時間約 3 分鐘 ・SR值 503 ・六年級

(公有雲的) 雲端上, 沒有隱私。 [石頭閒語網路法律資訊人權貴; 或搜尋 「雲端 隱私」 ] (SaaS) 雲端廠商本身不一定有興趣窺探你的秘密資料; 但若 某國政府,或 官司對手 突然對貴公司/組織/您的秘密有興趣, 廠商可能沒有勇氣甚至沒有法律立場可以抗拒要求。

既要上雲端, 又想保護隱私, 唯一的希望是:讓雲端廠商看不懂/看不見你的秘密資料。 那麼就算 (本國或他國) 政府或律師把你的隱私資料從雲端調閱出來, 也不會構成威脅。 Homomorphic encryption 與 unhosted 這兩個保護雲端隱私的資訊安全技術, 分別就是依據這兩個想法在運作。

homomorphic encryption
homomorphic encryption

Homomorphic encryption 的概念是: 資料先加密才放上雲端, 確保 SaaS 雲端服務商看不懂你存了什麼東東。 但是雲端服務商看不懂你存的資料, 又如何提供 「軟體即服務」 給你呢? 如果加密演算法經過特殊設計,可以找到加法、 乘法等等每個運算的相對應函數 f、 g 等等, 使得雲端上的對應運算 (f 或 g) 恰好 “等同於” (equivalent to) 原本想要做的運算 (加法或乘法) — 也就是說, 加法或乘法運算之前與之後的資料, 其加密的結果正好就是 f 運算或 g 運算之前與之後的資料 — 那麼雲端廠商等於是矇著眼睛在計算你的資料, 即使他們看不懂你的資料, 也能算出你所需要的結果 (然後你再自己解密)。

IBM 的學者 Craig Gentry 在 2009 年首度找到一個滿足上述要求的加解密系統, homomorphic encryption 在理論上證實為可行。 詳見 Craig Stuntz維基百科。 資安專家 Bruce Schneier 則 提醒大家: 理論與實用之間還有一段距離。 後來 Gentry 與其他學者又改良原本的演算法, 大幅簡化運算方式; 微軟於今年八月展示可行的實作。 Homomorphic encryption 還有其他許多應用, 包含線上投票等等。 詳見密碼學者所搜集的 許多學術文章連結

unhosted
unhosted

更進一步, 何必讓 SaaS 雲端應用軟體的服務商看見你的資料呢? 一群程式高手觀察到一個重點: 雲端運算, 其實 「運算」 不見得一定要發生在 「雲端」 上。 雲端運算的重點是: (1) 自己的資料放在雲端上 (2) 大家共用一套來自雲端的軟體 (例如: 用 wiki 或 googledoc 之類的雲端文書系統取代 MS Office 就不會出現 “你我檔案格式版本不同” 的困擾); 至於真正的運算工作到底在哪裡發生,其實並不重要。 如果我們把資料和程式碼切割考慮, 如果把雲端廠商切割成兩類角色: unhosted application 提供程式碼; unhosted account 提供儲存空間, 那麼真正的運算可以在本地機發生, 並不需要在雲端發生, 而且兩個雲端廠商都無法窺探你的秘密。 也就是說, 你的本地機從一朵雲 (unhosted application) 取得程式碼, 又從另一朵雲 (unhosted account) 取得加密過的資料, 然後 在本地機 解密、 處理資料、 加密、 再傳回後者 (unhosted account)。 Unhosted application 從來就看不見你的資料; unhosted account 則永遠只看得見加密過後的資料。

從雲端隱私保護的角度來看, Unhosted 不論在理論或實作上, 都比 homomorphic encryption 簡單。 Javascript 就是現成的客戶端 (本地機) 執行技術, 可以作為 unhosted application 提供程式碼給本地機的載具; 而 WebDAV 則是現成的遠端資料編寫協訂, 可以作為本地機透過 javascript 向 unhosted account 請求讀寫資料的溝通 “語言”。 Unhosted 計畫官網 已經推出程式庫、 文件、 範例程式供開發者取用; LibreOffice 也開始探索與 unhosted 計畫合作的可能性。 如果有一天 LibreOffice 成功移植到 unhosted 架構上, 將會是 (保有隱私的) 文書處理雲端化的重要里程碑。

採用 unhosted 技術, 還可以得到許多額外的贈禮:

  1. 提供 unhosted application 服務的廠商或組織可以免除管理資料的困擾 (儲存空間、 備份、 消費者隱私保護法規、 …), 降低成本。
  2. 提供 unhosted account 服務的廠商或組織不需要提供複雜的軟體服務; 同時加解密技術也替他們免除了 [消費者隱私保護法規所施加的責任]。
  3. 用戶享有軟體自由與資料自由 — 你甚至可以把資料放在私有雲上面, 完全保護自己的穩私。
  4. 即便 unhosted application 供應商所提供的不是自由軟體, 它至少必須尊守開放檔案格式/開放通訊協定的規範 — 這讓用戶可以免於封閉檔案格式或專利地雷檔案格式 (例如 docx) 的綁架。 切換不同的應用軟體處理自己的同一份資料, 將會變得比較容易。

幫公司/組織/學校導入雲端運算方案時, 如果遇到涉及員工隱私或組織機密的資料, 採取的又不是私有雲技術, 那麼一位有職業道德的 CIO電算中心主任 應該考慮堅持採用 unhosted 技術 (或至少採用 homomorphic encryption 技術), 確保用戶的資訊安全。 尤其像是 「教育雲」 之類的構想, 強制將全國學生甚至是家長的隱私搬上雲端, 爭議性極高。 如果不採用 unhosted 技術, 將來發生隱私外洩糾紛時, 很可能又會發生 「公民納稅、 政府國賠」 的遺憾事件。

(轉載自 資訊人權貴ㄓ疑)

文章難易度
所有討論 1

2

2
1

文字

分享

2
2
1
如何選擇「基因交友軟體」?——影集《真愛基因》的現實
胡中行_96
・2022/06/27 ・4916字 ・閱讀時間約 10 分鐘

國小高年級科普文,素養閱讀就從今天就開始!!

「身為交友軟體公司的執行長,用自家服務找對象並不道德,可是我偶爾會做市場調查,所以手機裡下載了 20 個同行的產品。當我打開其一,便收到一個月前,某位友善男士的來訊。內容實在迷人,可惜他整頭紅髮……」幸好見面之後,一拍即合。她徵求對方的同意,採集其口腔的 DNA 樣本,進而得知他們擁有最頂尖 10% 的相容性。「我從不想要紅髮伴侶,認為自己不會喜歡,但其實我超愛。……,這都在你的 DNA 裡。」[1]

  

影集《真愛基因》中的基因配對廣告:「接受檢測,找到真愛」。圖/IMDB

  

Netflix 影集《真愛基因》

Netflix 影集《真愛基因》(The One)講述科學家發現有一種 DNA 檢測,可以找到完美伴侶,於是數百萬人踴躍嘗試。以此營利的媒合公司執行長,卻在事業愛情兩得意之際,捲入一場謀殺案……。[2][3]

話說回來,本文第一段引述的並不是影集劇情,而是美國交友網站 Pheramor 的共同創辦人兼執行長,接受德州醫療中心(Texas Medical Center)專訪時的自白。[1]

  

您的手機裡,裝有哪些交友軟體?圖/Pratik Gupta

  

真實的基因配對業者

影集《真愛基因》於 2021 年上映,然而在更早之前,就已經有業者開始提供類似的服務。以下是幾個知名的例子:

DNA Romance 的口腔 DNA 採集套件。圖/參考資料 11

  

基因配對的原理與目的

在考慮註冊一般交友軟體或網站的帳號之前,我們由最基本的動機,例如:純交友、約砲、短期約會、長期戀愛,甚至是以婚姻為前提交往等,搜尋適合的平台。選擇基因配對服務時,想清楚使用的目的,同樣也是首要之務。同時,最好瞭解這些檢測的功能,是否符合您的需求。有鑑於業界廣告的項目繁多,單一基因觸及的層面也相當複雜,以下只簡單說明其中一小部份:

  • 人類白血球抗原(human leukocyte antigens,HLA),即人類的主要組織相容性複合體(major histocompatibility complex,MHC):[15]1995 年瑞士 Claus Wedekind 教授等人,發現動物身上的MHC,會影響體現免疫特質的體味。排除避孕藥干擾的情形下,女人喜愛的味道,通常屬於與自己 HLA 差異較大的男人。[16]2016 年的德國研究,認為 HLA 相異者的結合,能帶來令人滿意的關係和性愛,以及強健的子代[15]不過,2020 年另一群德國科學家檢視 3,691 對情侶後,覺得 HLA 對人類求偶的實際作用甚微。[17]
  • 血清素轉運體(serotonin transporter,SERT基因:編寫蛋白質 SERT 的基因變異體 5-HTTLPR,[18]是調節神經系統中血清素濃度的關鍵,與情緒控管有關[19]
  • 催產素受體基因(oxytocin receptor gene):這種基因有幾個不同的類型,2019 年的美國研究指出,GG 基因型的人合群、有同情心,且情緒穩定。他們或他們的伴侶,比 AA 或 AG 基因型婚姻滿意度高[20]
  • 多巴胺受體基因(dopamine receptor gene)DRD4:多巴胺帶給人愉悅感,但相應受體遲鈍的 DRD4 7R+ 基因型,必須要更大的刺激,才能達到相同效果。[21] 2010 年美國研究 DRD4 的論文指出,相較於 7R-,屬於 7R+ 者,傾向從事一夜情、出軌等高風險的行為,因而有旺盛的繁殖力,且容易繁衍多元的子代。[22]
  • 兒茶酚-O-甲基轉移酶基因COMT gene):COMT 基因若異常,會提高某些精神疾病的風險。[23]2019 年的德國研究顯示 COMT 基因的不同類型,會導致情緒辨識表現的差別。與 Val/Val 相比,有 Met/Met 和 Met/Val 基因型的人,能更準確的辨識負面情緒。因此,遇到負面的社交經驗時,也更輕易地陷入焦慮或憂傷的情緒。[24]
  • 單核苷酸多態性(single-nucleotide polymorphism,SNP):SNP 是指 DNA 序列中的變異,可以用來尋找致病基因和療法、做親子鑑定,或是瞭解族群的演化等。目前科學界已知約 400 萬個 SNP,[25]如果交友網站沒說要驗哪些,其實算是過度籠統。

值得注意的是,許多現有的相關研究均以順性別異性戀為主,所以對性少數的族群而言,未必有參考價值。Instant Chemistry 為此展開大型研究,正在招募後者參加。[6]

  

《真愛基因》劇照:如果已經有伴侶了,您還會想做基因檢測嗎?圖/參考資料 3

  

基因在戀愛中的角色

除了正在尋覓另一半的單身人士,Instant Chemistry 更鼓勵情侶們購買雙人檢驗套組,說是有助於解決兩人對關係的不滿。[6]影集《真愛基因》的原著小說《命定之人》(The One)裡,就有這麼一個經典的橋段:「如果我們的 DNA 結果不合,怎麼辦?」「那就要留心,或許我們得為戀情更加把勁。就像約翰.藍儂說的,『你只需要愛』。」「對,可是他也說過『我是海象』,所以咱們還是別太相信他智慧的箴言。」[26][註1]

想去驗基因的伴侶,是不是早就對感情缺乏信心?若是心中的芥蒂被科學驗證了,又該如何面對?

換個角度來說,這可能要看兩人不合的基因,是關乎哪個面向。比方,美劇《宅男行不行》(The Big Bang Theory)裡,不用驗也知道大難臨頭的 Amy,以反諷的口吻抱怨:「噢,當然,因為 Sheldon 跟我的 DNA 加起來,會等於一個曉得怎麼交朋友的孩子。成熟點!」[27]憂慮子代基因無法適應社會的心情,擺在生育意願超低的臺灣,不僅很難激起觀眾共鳴,應該也不太會動搖已經成形的交往關係。

但,要是基因檢測,還有其他風險呢?

  

Michael Connelly 的小說《Fair Warning》,點出基因檢測的風險。圖/參考資料 28

  

基因資訊的隱私疑慮

「你知道今年五角大廈叫所有軍人,不准使用 DNA 試劑,因為那會造成國安問題嗎?」曾任記者的知名美國作家 Michael Connelly,在 2020 年出版的虛構小說《合理警告》(Fair Warning;暫譯)裡,[註2]描述真實世界可能上演的基因隱私危機。「骯髒四號。有些遺傳學家這麼稱呼 DRD4。」故事中,有心人士從盜用的基因資料,斷定哪些女性水性楊花,然後跟蹤並殺害她們。[28]當原本屬於隱私的個人資訊被交予私人企業,以獲取服務,消費者究竟能得到多少法律的保障?

根據 Michael Connelly 的調查,目前美國食品藥物管理局(Food and Drug Administration,FDA)尚且無法有效規範基因資料的蒐集與運用。[28][29]DNA Romance 強調他們遵守美國《健康保險攜帶和責任法案》(Health Insurance Portability and Accountability Act,HIPAA)的隱私準則,而且不會把使用者個資賣給第三方。[11]

可是美國國家人類基因組研究所(National Human Genome Research Institute)坦承:「雖然很多公司設有健全的隱私及知情同意政策,但沒有聯邦法律能禁止他們將個人的基因資訊提供給第三方。[30]

  

臺灣的基因隱私保障

科技部 2021 年的《科技魅癮》數位季刊,曾探討臺灣與美國在基因法規方面的異同。[31]比起美國允許某些科學研究不經當事人同意,就能使用去識別化的基因資訊;[30][31]臺灣的規範較為嚴謹,卻也因阻礙科技發展而為人詬病。[31]基因檢測等相關科技,是一個仍在不斷演進的領域。

我們一來不能光看基因就認識一個人的特質,畢竟後天環境也是造就人格和生理條件的重要因素;二來在研究還未成熟的階段,對檢測的解讀必有其侷限。另外,還得注意檢測單位是否遵循當地法規,以保障消費者權益。萬一不小心,資料外洩或是驗出個本來不曉得的基因缺陷,當事人受到的打擊,說不定會比失戀還嚴峻。

總之,基因檢測是潘朵拉的盒子。一旦勇敢嘗試,便如同 Michael Connelly 書中所言:「你的 DNA 可以開啟任何事物,從此秘密再也不是秘密了。[28]

  

備註

  1. 影集《真愛基因》和原著小說《命定之人》的原文名稱都叫做「The One」。本文引述的段落是由筆者自行翻譯,所以可能與目前通行的繁體中文版用字略有出入。
  2. Michael Connelly 小說改編的作品中,較為臺灣人所知的,大概是電影《下流正義》(The Lincoln Lawyer)和影集《絕命警探》(Bosch)。至於《Fair Warning》,目前好像沒有中文譯本。

參考資料

  1. Dating app taps genetics and social media (Texas Medical Center, 2019)
  2. The One (Netflix, 2021)
  3. The One (IMDB, 2021)
  4. GenePartner (2022)
  5. Instant Chemistry (LinkedIn, 2022)
  6. Instant Chemistry (2022)
  7. SingldOut (Crunchbase, 2022)
  8. This Online Dating Site Thinks It Can Match You Based On Your DNA (Business Insider, 2014)
  9. How Identity Evolves in the Age of Genetic Imperialism (Scientific American, 2015)
  10. DNA Romance (LinkedIn, 2022)
  11. DNA Romance (2022)
  12. Nozze (2022)
  13. The Illusion of Genetic Romance (Scientific American, 2020)
  14. Pheramor (Facebook, 2019)
  15. Kromer J, Hummel T, Pietrowski D, Giani AS, et al. (2016) ‘Influence of HLA on human partnership and sexual satisfaction’ Scientific Reports, 6: 32550.
  16. Wedekind C, Seebeck T, Bettens F, and Paepke AJ. (1995) ‘MHC-dependent mate preferences in humans’ Biological Sciences, 260: 1359, pp. 245 -249.
  17. Croy I, Ritschel G, Kreßner-Kiel D, Schäfer L, et al. (2020) ‘Marriage does not relate to major histocompatibility complex: a genetic analysis based on 3691 couples’. Biological Sciences, 287: 1936.
  18. serotonin transporter (SERT) (APA Dictionary of Psychiatry, 2022)
  19. Cao H, Harneit A, Walter H, et al. (2018) ‘The 5-HTTLPR Polymorphism Affects Network-Based Functional Connectivity in the Visual-Limbic System in Healthy Adults’. Neuropsychopharmacology, 43, pp. 406–414.
  20. Monin JK, Goktas SO, Kershaw T, DeWan A. (2019) ‘Associations between spouses’ oxytocin receptor gene polymorphism, attachment security, and marital satisfaction’. PLOS One, 14 (2): e0213083.
  21. Muda R, Kicia M, Michalak-Wojnowska M, Ginszt M, et al. (2018) ‘The Dopamine Receptor D4 Gene (DRD4) and Financial Risk-Taking: Stimulating and Instrumental Risk-Taking Propensity and Motivation to Engage in Investment Activity’. Behavioral Neuroscience, 12: 34.
  22. Garcia JR, MacKillop J, Aller EL, et al. (2010) ‘Associations between Dopamine D4 Receptor Gene Variation with Both Infidelity and Sexual Promiscuity’. PLOS One, 5(11): e14162.
  23. COMT gene (APA Dictionary of Psychiatry, 2022)
  24. Lischke A, Pahnke R, König J, Homuth G, et al. (2019) ‘COMTVal158Met Genotype Affects Complex Emotion Recognition in Healthy Men and Women’. Frontiers in Neuroscience, 12:1007.
  25. single_nucleotide_polymorphism_snp (國立中正大學生物資訊實驗室,2014)
  26. John Marrs. (2020) Chapter 9. ‘The One: Now a major Netflix series!’ USA: Random House.
  27. Big Bang Theory Quote 11016 (The Big Bang Theory)
  28. Michael Connelly. (2020) ‘Fair Warning‘. USA: Little Brown and Company.
  29. Beautiful Places to Die (The New York Times, 2020)
  30. Privacy in Genomics (National Human Genome Research Institute, 2021)
  31. 【個人vs.社會】基因檢測如打開潘朵拉盒子?隱私權成為重要問題!(科技魅癮,2021)
所有討論 2
胡中行_96
47 篇文章 ・ 16 位粉絲
曾任澳洲臨床試驗研究護理師,以及臺、澳劇場工作者。 西澳大學護理碩士、國立台北藝術大學戲劇學士(主修編劇)。邀稿請洽臉書「荒誕遊牧」,謝謝。

0

8
1

文字

分享

0
8
1
雲端是什麼?——《普林斯頓最熱門的電腦通識課》
商業周刊
・2022/03/12 ・3015字 ・閱讀時間約 6 分鐘

  • 作者/ 布萊恩‧柯尼罕( Brian W. Kernighan)
  • 譯者/ 李芳齡

網路的普及

回想第六章中敘述的電腦運算使用模式,你有一台或好幾台個人電腦,你讓個別應用程式執行不同的工作,例如用 Word 製作文件,用 Quicken 或 Excel 做你的個人財務,用 iPhoto 管理你的相片。這些程式雖可能連結網際網路以取得一些服務,但它們在你的電腦上運轉,你可以不時地去下載一個修補了漏洞的新版本應用程式,偶爾可能得購買一個升級版以取得新功能。

這個模式的本質是,程式和資料都在你自己的電腦上。若你在一台電腦上修改了一個檔案,然後在另一台電腦上需要這檔案,你必須自己做轉移。若你在辦公室或外出旅行途中需要一個儲存於你家中一台電腦上的檔案,那就麻煩了。若你需要在一台視窗個人電腦和一台麥金塔電腦(Mac)上都有 Excel 或 PowerPoint,你必須為兩台電腦各買一個程式。上面說的這些情況,還沒把你的手機包含在內哦。

另一種不同的模式是愈來愈普及:使用瀏覽器或手機去存取及操作儲存於網際網路伺服器上的資訊。Gmail 或 Outlook 之類的郵件服務是最普遍的例子,你可以從任何一台電腦或手機存取你的電子郵件,可以上傳一封在本機上撰寫的郵件訊息,或是下載郵件訊息至本機檔案系統,但多數時候,你把資訊留在提供服務的伺服器上。

你不需要做什麼軟體更新,但不時會有新功能出現。你通常是在臉書上跟朋友保持聯繫或觀看他們的照片,但交談及照片儲存在臉書,不是儲存在你自己的電腦上,這些服務是免費的,唯一可見的「成本」是當你閱讀你的郵件或查看你的朋友在做什麼時,你可能會看到廣告。

科技未來趨勢——雲端運算

這種模式通常被稱為「雲端運算」(cloud computing),因為網際網路被比喻為「雲」,沒有特定的實體位置,資訊被儲存於「雲端」的某處。

電子郵件和社交網路是最常見的雲端服務,但還有很多其他的雲端服務,例如多寶箱(Dropbox)、推特、領英、YouTube、線上行事曆等等。資料不是儲存於本機,而是儲存於雲端,亦即雲端服務供應商的伺服器上:你的電子郵件及行事曆儲存於谷歌的伺服器,你的相片儲存於多寶箱(Dropbox)或臉書的伺服器,你的履歷表儲存於領英的伺服器等等。

雲端運算示意圖。圖/Pixabay

雲端運算的問世,得力於多個因素的匯聚。個人電腦變得愈來愈強大的同時,瀏覽器也是,瀏覽器現在能夠有效率地執行顯示要求很高的大程式,儘管使用的程式語言是直譯式的 JavaScript。對多數人而言,現在的頻寬及用戶端與伺服器端之間的延遲(等候時間)遠優於十年前,這使得資料的傳送與接收更快,甚至在你輸入搜尋詞時,當即反應你的鍵擊,在你還未輸入完之前,就列出一些建議的搜尋詞。結果是,以往需要一個單獨的程式去處理的絕大多數使用者介面操作,用瀏覽器就能搞定,在此同時,使用一台伺服器去承載大量資料,執行任何複雜運算。這種組織方式也在手機上運作得很好:不需要再下載一款行動應用程式。

以瀏覽器為基礎(browser-based)的系統的反應速度可以媲美以個別電腦為基礎(desktop-based)的系統,並且讓你可以從任何地方存取資料。

以來自谷歌的雲端「office」工具為例,它提供文書處理器、試算表、以及簡報程式,讓多使用者可以同時存取使用及更新。(譯註:以瀏覽器為基礎的系統又稱為 web-based,或稱「brower-server model」,簡稱 B/S 模式,指的是透過瀏覽器去使用網路上的軟體來執行各種工作;以個別電腦為基礎的系統又稱為 client-based,或稱為「client-server model」,簡稱 C/S 模式,指的是必須在每台電腦上安裝各種軟體來執行各種工作。)

雲端工具的快速崛起

一個受到關心的議題是,這些雲端工具會不會最終運轉得夠好而完全取代以個別電腦為基礎的版本。你大概可以想像得到,微軟非常關心這個,因為 Office 軟體佔該公司營收的相當比重,而 Office 主要在視窗作業系統上執行,微軟的其餘營收大多來自視窗作業系統。以瀏覽器為基礎的文書處理及試算表不需要來自微軟的任何軟體,因此將威脅到微軟的 Offic 及視窗作業系統這兩大核心業務。

目前,谷歌文件(Google Docs)及其他類似的系統還不具備 Word、Excel、及 PowerPoint 的所有功能,但科技進步史中充滿這樣的例子――明顯較差的系統問市,搶走認為此系統已經夠好的新使用者,漸漸侵蝕在位者的市場佔有率,並且持續改進本身的功能。微軟顯然很清楚這問題,實際上,為因應此問題,該公司已經推出雲端版本的 Office 365。

雲端工具的快速崛起。圖/Pixabay

以網路為基礎(web-based,亦即以瀏覽器為基礎)的服務其實對微軟及其他供應商具有吸引力,因為易於採用訂閱收費模式,用戶必須持續付費以取得服務。但是,消費者可能偏好一次性購買軟體,必要時再付費升級。我目前仍然在我的較舊的麥金塔電腦上使用 2008 年版本的 Microsoft Office,它運作得很好(在此應該稱讚微軟),而且,它仍然偶爾獲得安全性更新,因此,我並不急於升級。

雲端運算仰賴用戶端的快速處理及大量記憶體,以及伺服器端的高頻寬。用戶端的程式是用 JavaScript 語言撰寫的,通常錯綜複雜。JavaScript 程式重度要求瀏覽器更新及快速顯示圖形資料,敏捷反應使用者的動作(例如拖曳)及伺服器的動作(例如更新的內容),這已經是夠難了,難上加難的是,瀏覽器版本與 JavaScript 版本之間的不相容性,需要雲端服務供應商找出傳送程式給用戶端的最佳方法。不過,伴隨電腦運算速度愈來愈快,以及更加遵從標準,這些都在進步中。

雲端運算可以在「於何處執行運算」和「處理過程中把資訊寄存於何處」這兩者之間作出取捨,例如,使 JavaScript 程式與特定瀏覽器脫鉤的方法之一是,在程式本身裡頭包含測試,譬如:「若瀏覽器是 Firefox 75 版,就執行這個;若瀏覽器是 Safari 12 版,就執行那個;若為其他瀏覽器版本,執行別的。」這樣的程式比較大,意味的是,需要更多頻寬來把 JavaScript 程式傳送至用戶端,而且,程式中增加的測試可能使瀏覽器運轉得較慢。另一種方法是,伺服器可以詢問用戶使用的是哪種瀏覽器,然後傳送針對這款瀏覽器撰寫的程式,這程式可能更簡潔,執行得更快,不過,對於原本就小的程式,差異可能不大。

網頁內容可以用不壓縮形式傳送,這樣,用戶端及伺服器端需要的處理工作較少,但需要較多的頻寬來傳輸;或者,用壓縮形式來傳送網頁內容,傳輸時需要的頻寬較少,但兩端需要增加處理工作。有時候,只有一端做壓縮處理,大型 JavaScript 程式經常被壓縮,移除所有不必要的空白,讓變數及函式使用一或兩個字母的名稱,壓縮後的程式是人類看不懂的,但用戶端電腦不在意。

儘管有技術性挑戰,若你總是能連上網際網路的話,雲端運算的優點很多。它們供應的軟體總是最新的,資訊儲存於專業管理的、有大容量的伺服器上,客戶資料隨時都有備份,幾乎沒有遺失的可能。一份文件只有一種版本,不會發生同一份文件在不同的電腦上可能有不一致版本的情形,而且,很容易即時共享文件及通力合作。雲端服務的價格很便宜,個人消費者往往可以免費取得,但企業客戶可能得付費。

——本文摘自《普林斯頓最熱門的電腦通識課》,2022 年 2 月,商業周刊

商業周刊
6 篇文章 ・ 2 位粉絲

2

4
0

文字

分享

2
4
0
AI 戰警出動——抓出惡意程式,資訊安全有保障!
科技大觀園_96
・2022/02/27 ・3145字 ・閱讀時間約 6 分鐘

數位戰警網路掃黑。圖/fatcat11 繪

網路數位世界黑影幢幢,美國有線電視新聞網 CNN 曾報導,全世界每天產生超過 100 萬個惡意程式;臺灣軟體聯盟也曾發布調查報告,全球企業因惡意程式攻擊,每年損失超過 10 兆新臺幣,相當於我國 109 年度政府總預算的 5 倍。駭客散播惡意程式橫行網路,不僅企業深受其害,各國政府也防不勝防。

行政院資通安全處偵測統計,我國各政府單位每月被攻擊次數高達 2,000 萬到 4,000 萬次。近期最受矚目的就是,總統府在蔡英文總統 520 連任就職前夕,驚傳遭駭客入侵電腦竊取資料;接著 5 月底美國資安公司「Cyble Inc」揭露駭客在暗網[1]兜售「臺灣全國戶政登記資料庫」超過 2,000 萬筆臺灣民眾個資,接連引發輿論譁然。

面對駭客無窮盡的闇黑攻擊,臺灣大學電機工程學系教授林宗男從 2018 年開始,帶領團隊利用資料科學處理分析,建立網路異常與攻擊預測模式,發展「AI Cyber Security」(人工智慧網路安全)系統,從偵測藏身於 Windows 與 Android 系統的惡意程式、暗網流量分類與網路惡意流量偵測等「四管齊下」,全面展開網路掃黑行動,防堵駭客散播惡意程式搞破壞。 

國立臺灣大學電機工程學系教授林宗男。圖/李宗祐攝

抓出惡意程式的 AI 網路安全系統

這項研究計畫今年邁進第 3 年,「我們做出來的技術,都是可以馬上用的真槍實彈!」林宗男透露,相關前瞻技術初步成果陸續發表後,「國家安全局就找上門,要跟我們技術合作。」隨著世界各國競相重點投資,引領 AI 成為國力象徵,研究團隊除了以建置臺灣國家級網路防禦系統為目標,更希望這套系統能夠推廣成為捍衛各國企業或組織的數位戰警。

就如同 CNN 報導,全世界每天產生超過 100 萬個惡意程式,網路數位世界危機四伏;但值得注意的是,這個數據還是 2015 年的統計,現在恐怕有增無減。研究團隊以先發制人策略,杜絕惡意程式伸出魔爪,利用 CNN(Convolutional Neural Networks,卷積神經網路)模型[2]訓練 AI ,偵測是否有惡意程式潛伏在使用者電腦 Windows 或手機 Android 系統蠢蠢欲動。

Windows 與 Android 的惡意程式偵測

「我們的目標是在他還沒有執行之前,阻止惡意程式啟動。」面對五花八門的應用程式,研究團隊指出,使用者在下載執行前,「把程式的 exe 執行檔轉換成圖片檔,放進我們建立的模型,AI 就會告訴你這個程式是惡意程式的機率是多少。如果很高,就不要執行,避免系統被惡意程式感染。」林宗男強調,能夠辨認程式碼到底是惡意或者是正常,是確保網路安全最重要的基本功。

偵測惡意程式效率明顯提升 7.2%。把執行檔圖形化的方法更為安全,只看圖的結構,不會啟動執行檔,可以避免在偵測過程被感染。圖/林宗男實驗室提供

經過測試驗證,Windows 偵惡系統成功率與準確率達 88.9%,超越全球圖形處理器領導廠商 NVIDIA 發表的 AI 偵惡技術 7.2%。林宗男指出,很多軟體公司都競相投入研究,就過去已公開發表的研究論文,NVIDIA 抓駭效率暫時領先群雄;臺大團隊與擁有雄厚資源的 NVIDIA 研究團隊相較,就像是小蝦米與大鯨魚,能夠超越他們很不容易。「但這僅是初步研究結果,我們還在持續精進中。」 

相對於 Windows 偵惡系統獨立開發,Android 偵惡系統則是與日本 NICT(情報通信研究機構)合作研發,利用臺大團隊提出的新演算法,把 NICT 研發的 AI 偵惡系統抓駭效率從 92% 提升到 96.2%,青出於藍而勝於藍,讓日本團隊印象深刻。 

Android 惡意程式偵測:研究團隊透過取出已知惡意程式的可執行檔特徵,並利用反混淆技術加入新的特徵,再透過 AI 演算法處理特徵,判斷是否為惡意 Android 程式。圖/林宗男實驗室提供

透過機器學習,分析暗網流量

雖然無法做到百分之百滴水不漏,但為了知已知彼,研究團隊更直搗黃龍,「潛水」暗網蒐集情資,分析駭客行為特徵。林宗男表示,駭客為了躲避追蹤,都在暗網活動,因為透過 TOR 瀏覽器加密,網管人員無法辨識使用者到底是在上網聊天、傳資料、發送 Email,還是看 YouTube 聽音樂或追劇等。對追蹤技術研究者而言,到暗網觀察駭客「水面下」的活動,是很重要的情資來源。 

研究團隊透過 AI 研究分析已知惡意程式的網路行為特徵,再側錄蒐集暗網不同使用者上傳流量與行為模式,找出「壞人經常走的路徑」,把暗網流量做善惡分類,研判哪些是正常上網行為,哪些是惡意程式發動攻擊。林宗男舉例,就像防疫期間每個人都戴著口罩,但年紀大的和年紀輕的行為就是不一樣,「我們就是利用 AI 從行為特徵分辨使用者上網行為是否正常。」 

研究成果經與美國 IBM 和中華電信合作驗證測試,辨識率高達 99.6%,遠超過加拿大研究團隊的 81.6%。對 ISP(網路服務供應商)而言,若能明確辨識暗網流量分類,就不必把看影片或聽音樂等受到惡意攻擊可能性極低的影音串流,全部導入 IDS(入侵檢測系統)資安偵測,大幅節省資源。

暗網流量類型分類:臺大研究團隊利用 AI 演算法分析網路流量特徵,把經過匿名加密的流量分門別類,協助網管人員有效而安全的管理網路。圖/林宗男實驗室提供

惡意流量偵測,鞏固第 2 道防線

研究團隊也利用最近 3 年眾所周知的 10 種惡意程式,包括 2017 年肆虐全球的勒索軟體 WannaCry(想哭)進行惡意流量偵測「實兵演練」。畢竟惡意程式偵測不可能做到百分之百,漏網之魚在所難免。根據資安調查顯示,惡意程式滲透入侵電腦系統之後,平均長達 56 天才會被發現。 

「惡意流量偵測其實是第 2 道防線!發生惡意流量代表電腦已經中毒了,我們的目標是在最短時間偵測出惡意流量。」林宗男透露,跨國網路科技公司 CISCO 現有商用偵測系統精確度已達 97.7%,「我們做得再好,也僅能微幅提升到 98.2%。」研究團隊再發揮 3 個臭皮匠勝過 1 個諸葛亮的精神,把 2 套系統截長補短,將精確度再向上提升 0.3%,堅持沒有最好、只有更好的信念,鍥而不捨地挑戰不可能的任務。

惡意流量偵測:研究團隊透過 AI 研究分析已知惡意程式的網路行為特徵,加速偵測發現網路異常流量,並揪出潛伏在網海裡面興風作浪的惡意程式。圖/林宗男實驗室提供

eID 的潛在風險

然而,林宗男也深知,資安不可能做到百分之百的絕對安全。當內政部決定在明年全面換發 new eID 數位身分證,建置 T-Road(政府資料傳輸平臺),打造跨政府機關資料通道網路,推動「一卡多用」串聯戶籍資料、健保資料庫、汽機車駕照交通監理資料、國民年金與勞保勞退年金等,同時政府也將讓 new eID 擁有線上交易完整性與不可否認性,做為電子商務交易憑證。林宗男對此呼籲政府應正視 new eID 缺乏法源依據的問題,更要從資訊安全的角度,重新審慎評估全面換發數位身分證的必要性。 

「透過 new eID 建置 T-Road 聽起來好像很方便、很進步,但對駭客而言,要偷取全國 2,300 萬人的資料,也非常方便。一旦出現資安破口,整個系統就會因單點失效而全面瓦解。」林宗男說,「new eID 把國人從出生到死亡所有資料全部放在 T-Road,我們都知道網路沒有絕對安全,還要把所有的東西全部放在一個籃子裡面嗎?」政府應該要有分散風險的危機意識,數位身分證絕對不能「一卡多用」。  

註解

  1. 利用 TOR(The Onion Router 洋蔥路由器)瀏覽器遮蔽使用者真實位址,避開網管系統追蹤的匿名網路。
  2. 參考人類大腦視覺組織建立的深度學習模型。
所有討論 2
科技大觀園_96
82 篇文章 ・ 1097 位粉絲
為妥善保存多年來此類科普活動產出的成果,並使一般大眾能透過網際網路分享科普資源,科技部於2007年完成「科技大觀園」科普網站的建置,並於2008年1月正式上線營運。 「科技大觀園」網站為一數位整合平台,累積了大量的科普影音、科技新知、科普文章、科普演講及各類科普活動訊息,期使科學能扎根於每個人的生活與文化中。