Loading [MathJax]/extensions/tex2jax.js

4

22
2

文字

分享

4
22
2

心理學界的再現性危機,研究數據指出別輕易相信你所看到的「研究數據指出」

Te-Yi Hsieh_96
・2021/06/25 ・5224字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

「培養媒體識讀能力」已是這個資訊爆炸時代,人人都須具備的基本素養。閱讀報章雜誌時檢查資料出處、收到危言聳聽的訊息時先查明是否為假消息,這些幾乎都己經是基本常識。然而,撇除一些惡意扭曲事實的報導、刻意造假的研究結果不算,那些發表在國際科學期刊、經過嚴謹審查機制的研究報告,我們就真能全盤相信嗎?首先,讓我們從 2015 年心理學界的再現性危機1(reproducibility crisis,或作replication crisis)案例說起……

在資訊爆炸的時代,我們生活可能充斥著各種假消息。圖/Giphy

2015 年,有鑒於學界出版偏誤2(publication bias,註一)、選擇性分析資料、選擇性報告結果等問題,一大群世界各地的心理學家集結一起,合作進行了 100 個複製性研究 (replication studies),要看看如果以同樣的研究方法、實驗配置,能否成功重現一些刊登於三個心理學領域重要期刊(註二)的研究結果。畢竟,若一現象為真,研究人員能再次發現相同結果的機率應是相當高。心理學家們先是利用準隨機抽樣 (quasi-random sampling) 方式選擇要進行重複驗證的研究題目,分工合作、嚴謹複製原實驗的研究設計、程序與工具,過程也經過原作者的認證,並以相當高的統計考驗力(average replication power = 0.92)去檢定原實驗效果。原本,在他們參照的 100 個已發表研究結果中,高達97%的結果是有統計顯著性的,簡單來說,幾乎所有的原始研究都成功驗證某假說,或者發現某個顯著的現象、關聯。

然而令人驚訝且失望的是,重複驗證的結果中僅有 36% 是有統計顯著性的,即使是那些達到統計顯著的結果,新發現的平均效果值(mean effect size = 0.197)也小於原本發表於期刊上的效果值(mean effect size = 0.403)。這樣的結果給心理學界丟下了一個巨大的震撼彈!畢竟,可重複性(或作再現性,reproducibility)是科學的重要特徵之一,在眾多條件都控制的情況下,仍有如此高比例的研究結果無法被再現,不禁使人懷疑,是否多數心理學發現僅是曇花一現?在某個陰錯陽差的機緣下「幸運」達到的統計顯著性?再者,如果一項科學發現可以有時候是對的、很多時候是錯的,那這項科學發現的價值何在?

心理學期刊充斥著「有統計顯著性」的結果,但其中有多少是真實存在、能被重複驗證的現象?圖/Giphy

2018 年,另一批超過 200 位心理學家參與的大型研究計畫(Many Lab 2)3, 4中,他們針對 28 個常見的心理學現象進行重複驗證。類似於前述 2015 年的例子1,28 個重複驗證的研究中只有約一半(15 個)結果是支持原發現的,並有高達 75%(21 個)研究的效果值是低於原期刊中報告的效果值。另外,Many Lab 2 這項大型研究計畫廣納 36 個國家的 15305 位受試者,以確認心理學研究結果是否會受到族群間異質性等背景因素影響,他們的結果顯示,只有 39%(11 個)的研究結果呈現群體異質性(heterogeneity),而這 11 個研究大多是那些成功被重複驗證、效果值很大的研究題目。

-----廣告,請繼續往下閱讀-----

換句話說,要以受試者、情境的不同來解釋那些無法被重複驗證的結果,似乎是不成立的,因為反而是那些能成功重複驗證的研究題目會受到群體異質性影響4。複製性研究的成敗,更多取決於研究的現象本身1, 4。真實存在的現象、貼近事實的理論與假設,通常都能在不同環境、對象、時空背景下被重複驗證;相對的,僅因為偽陽性 (false positive) 機率或其他因素而發現的顯著結果,即使完美重現原研究場域、工具、對象,能再次有相同發現的機率也不高。

更令人吃驚的是,在近年無法被重複驗證的案例中,甚至不乏一些對心理系學生來說耳熟能詳、出現於教科書的經典心理學現象,例如,「臉部回饋假說」(facial-feedback hypothesis,註三)4-6、促發效應(priming effect,註四)4和自我耗損(Ego Depletion,註五)7, 8

在這波重複驗證風潮中最諷刺的莫過於,最經得住考驗的發現居然是「大約只有一半的心理學研究結果能被重複驗證」9

複製性研究的結果,令人大失所望!圖/Giphy

讀到這,先別急著把心理學教科書、期刊丟進垃圾桶!也先別急著下定論說:「果然心理學、社會科學都是主觀的!是不可信的!」當然不是。事實上,再現性不高的現象,在生物學、工程學、物理學、甚至醫學,都不算罕見10, 11。在質疑批判之前,或許我們更該思考:是什麼造成目前的現狀?以及,作為知識的產出者、使用者、讀者,我們能做些什麼?

-----廣告,請繼續往下閱讀-----

為何無法重複驗證?

假設研究員 A 和研究員 B 使用同樣研究設計、實驗方法,但得出的結果卻不一致,例如 A 發現的東西 B 沒發現,我們可以懷疑的解釋有:

  1. A、B 所研究的對象與環境不同,情境與個體差異的因素造成結果不同
  2. A 或 B 在研究時不小心出了錯,以至於 A 與 B 的實驗事實上不完全一樣
  3. 結果不同僅是由於抽樣誤差(sampling error)、機率的關係,A 的結果可能是偽陽性(false positive),或者 B 的結果是偽陰性(false negative)。此點的深入探討可參考「p 值的陷阱:p 值是什麼?又不是什麼?」12一文。
心理學的再現性危機,是由於實驗情境誤差?機率?抑或是其他因素?圖/Giphy

像是在 2015 年1與 2018 年4的大型複製性研究中,無法重複驗證的原因較不可能是實驗方法誤差或個體差異等混淆變項。原因是,可能影響結果、但無關於研究主題的混淆因素,都已被研究人員納入考量並透過統計方法排除,例如,樣本數、個體差異、文化差異等。並且,研究團隊在進行重複驗證時都與經過原作者審核、同儕審查,以確認實驗程序成功複製原始實驗。也就是說,現實條件下能控制的都控制了,但仍有如此高比例的研究結果與原始發現不同,究竟是哪裡出了問題?

Open Science Collaboration 團隊認為1,多數研究無法重複驗證的結果,指出了目前心理學領域出現的出版偏誤與選擇性報告等問題。一直以來,期刊出版者重視原創性研究多於複製性研究,加上過去期刊多半傾向發表有統計顯著性的結果,少數研究者甚至為了能成功在期刊發表,選擇性的報告結果,甚至修改原先假設、操弄資料以達到成功驗證假說的假象。而重複驗證危機正是顯現了這樣不當的風氣、行為造成的後果,並彰顯施行複製性研究的重要性與必要性。

當然,針對個別研究,單一一次重複驗證的失敗,不代表我們應該全盤否認原始發現,而應是蒐集更多、更透明、更全面的證據,以後設分析 (meta-analysis) 等統計方式,得出真正有可信度的結論1, 4

-----廣告,請繼續往下閱讀-----

研究人員可以如何應對?面對這樣系統性的問題,矯正方法當然也需要系統性的合作與改變。出版決策者在判斷是否發表一篇研究報告的標準,不該單靠結果的顯著與否,而是主題重要性、研究方法正確性、嚴謹性等,並給予支持性與不支持性的證據同等重視;研究資金贊助者,可以更鼓勵這類複製型研究、而非僅是創新研究;此外,目前學者也建議研究人員在開始進行實驗前進行預先註冊(Preregistration)13,或選擇進行註冊研究(registered report)14

例如,在 OSF (Open Science Framework)15此平台上,研究人員可以在實驗、收資料之前,先將實驗設計、實驗假設、受試者的排除標準(Exclusion Criteria)等,先在網頁上進行註冊16,如此一來便能保證研究的透明性、可信性,並避免有心懷不軌的研究人員在蒐集資料後,才事後操弄假設、扭曲數據13

此外,也越來越多心理學期刊提供「註冊研究」(registered report)17。此投稿方式,有別於以往只在完整撰寫完一篇研究報告後才投稿,進行註冊研究時,會在研究緒論、方法撰寫好時(實驗開始前),就先投稿到期刊接受第一階段審查(Stage 1 peer review),待該領域專家認可其研究價值、方法正確性之後,再開始實際進行實驗、收受試者的步驟。此舉也確保了,不管之後的研究結果是支持或不支持原先假設,其結果的報告都會在第二階段審查(Stage 2 peer review)之後刊登在該期刊上,藉此,多少有辦法校正目前文獻中支持性和不支持性證據失衡、研究發現過於正向的狀況14

同時,Open Science Collaboration 團隊也強調1,再現性危機不代表心理學家們應該志在讓所有初始研究都能在未來被重複驗證,因為這樣反而是變相地鼓勵研究者只去探討那些「明顯會成功」的研究題目,限制了該領域的創新性與探索性。也許我們該做的,單純就是回歸科學、理性的本質,真正聚焦在一研究主題的價值、方法嚴謹度、結果解釋的正確性等。而非單純因為某一研究題目有多「吸睛」或是某一研究「感覺」會不會成功,來決定研究以及領域的走向。

-----廣告,請繼續往下閱讀-----

身為讀者、知識使用者,我們可以如何看待再現性危機?

科學成果的品質很大程度取決於研究者,但同時,任何研究人員都不是完人、每個研究都可能因資源限制、現實考量而有其限制。另一方面,我們也不太可能要求社會上所有人都熟悉統計、數據分析的判讀,但身為讀者、知識使用者,我們可以做到的是,用正確、理性的態度面對所接受到的資訊。尤其是針對新穎、單一、小規模、樣本數少的研究證據,不要馬上視之為「真理」,並在之後有相斥、反駁的證據出現時,保持開放的心態,才不會落入確認偏見 (confirmation bias) 的陷阱中18

科學是一種問題解決、探究世界的方式,而非一種盲目的「信仰」。更重要的是,科學是依循序漸進的過程,也許我們很多時候會以為,科學發現的過程像是卡通、故事中的那樣,研究者經過幾年埋頭苦幹,在某個天時地利人和的當下,對天大喊「Aha!我找到了(某現象、某理論、某關聯)!」然後留下改變世代的研究成果與發現。

偉大的科學發現都是如石破天驚般、一舉成名?圖/Giphy

當然,這種故事可能在少數案例是真的,但大多時候,科學是一個集眾人之力、不斷自我修正、相互辯論,最後達到一個「趨近」真理的過程,過程中,可能會走岔路、會誤判虛實、會自相矛對,這不代表我們必須對科學失望,相反地,我們應該為「發現錯誤與不足」感到欣喜,因為唯有診斷出現有的病灶,我們才能真正對症下藥,從而將知識探索推向一個更正確的方向。

備註

註一:出版偏誤(publication bias)意指,科學期刊傾向於發表有顯著結果、成功驗證假設的研究結果,而非無顯著性、不支持假說的其他證據,造成學界充斥著過於正向的支持性證據,使學者難以權衡正負向證據、達成客觀觀點。

-----廣告,請繼續往下閱讀-----

註二:Open Science Collaboration(2015)進行複製性研究的主題選自2008年刊登於Psychological Science (PSCI)、Journal of Personality and Social Psychology (JPSP)、以及 Journal of Experimental Psychology: Learning, Memory, and Cognition (JEP: LMC)的共100個研究

註三:「臉部回饋假說」(facial-feedback hypothesis)由美國心理學家William James提出,其假說認為臉部表情、肌肉的變化能導致心裡情緒反應上的變化,例如,咬一支筆時,做出嘴角上揚的表情能讓人心情感到快樂。

註四:促發效應(priming effect)指,藉由激發人們心中的某個概念,相關、類似的態度、信念、行為也會一同被激發。如,激發「熱」的概念,會強化人們對溫室效應的信念。

註五:自我耗損(Ego Depletion)理論認為,人的意志力(willpower)為有限資源,因此進行任何需要消耗心理能源的事之後,如自我控制、決策等,再從事其他作業的效能就會降低。例如,壓抑自己想吃零食的欲望後,專心於解數學難題的毅力就會降低。

-----廣告,請繼續往下閱讀-----
  1. Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251).
  2. Van Aert, R. C., Wicherts, J. M., & Van Assen, M. A. (2019). Publication bias examined in meta-analyses from psychology and medicine: A meta-meta-analysis. PloS one, 14(4), e0215052.
  3. https://osf.io/8cd4r/ 
  4. Klein, R. A., Vianello, M., Hasselman, F., Adams, B. G., Adams Jr, R. B., Alper, S., … & Sowden, W. (2018). Many Labs 2: Investigating variation in replicability across samples and settings. Advances in Methods and Practices in Psychological Science, 1(4), 443-490.
  5. https://digest.bps.org.uk/2016/09/01/no-reason-to-smile-another-modern-psychology-classic-has-failed-to-replicate/ 
  6. https://pansci.asia/archives/170845#:~:text=%E3%80%8C%E8%87%89%E9%83%A8%E5%9B%9E%E9%A5%8B%E5%81%87%E8%AA%AA%E3%80%8D%E6%B8%AC%E8%A9%A6,%E6%94%AF%E7%AD%86%EF%BC%8C%E4%B8%80%E9%83%A8%E7%89%87&text=%E7%84%B6%E8%80%8C%EF%BC%8C%E6%9C%89%E4%BA%BA%E8%AA%8D%E7%82%BA%E5%8F%8D%E9%81%8E%E4%BE%86,%E4%BA%86%E5%8F%88%E6%9C%83%E6%9B%B4%E5%BF%AB%E6%A8%82%EF%BC%81
  7. http://www.slate.com/articles/health_and_science/cover_story/2016/03/ego_depletion_an_influential_theory_in_psychology_may_have_just_been_debunked.html?via=gdpr-consent
  8. Hagger, M. S., Chatzisarantis, N. L., Alberts, H., Anggono, C. O., Batailler, C., Birt, A. R., … & Zwienenberg, M. (2016). A multilab preregistered replication of the ego-depletion effect. Perspectives on Psychological Science, 11(4), 546-573.
  9. https://www.theatlantic.com/science/archive/2018/11/psychologys-replication-crisis-real/576223/ 
  10. Baker, M. (2016). Reproducibility crisis. Nature, 533(26), 353-66.
  11. http://www.angle.com.tw/ahlr/discovery/post.aspx?ipost=2658#:~:text=%E6%A0%B9%E6%93%9AKNAW%E5%A0%B1%E5%91%8A%E4%B8%AD%E7%9A%84,%E7%9A%84%E7%9B%B8%E5%90%8C%E7%9A%84%E7%B5%90%E8%AB%96%EF%BC%8C%E5%8D%B3
  12. https://pansci.asia/archives/110923 
  13. Lakens, D. (2019). The value of preregistration for psychological science: A conceptual analysis. Japanese Psychological Review, 62(3), 221-230.
  14. Nosek, B. A., & Lakens, D. (2014). Registered Reports. Social Psychology, 45(3), 137–141. https://doi.org/10.1027/1864-9335/a000192 
  15. https://osf.io 
  16. https://www.cos.io/initiatives/prereg?_ga=2.70913104.1585635274.1623426782-1610779414.1622469013
  17. https://www.cos.io/initiatives/registered-reports
  18. https://pansci.asia/archives/185705
-----廣告,請繼續往下閱讀-----
文章難易度
所有討論 4
Te-Yi Hsieh_96
6 篇文章 ・ 8 位粉絲
PhD in Neuroscience and Psychology/Social Robotics (University of Glasgow, 🇬🇧)。寫心理🧠、寫機器人🤖、寫跟你我生活有關的🙋‍♀️ 。 發表詳見 👉 https://hsadeline.wixsite.com/teyihsieh (Twitter: @TeYiHsieh)

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

1
0

文字

分享

0
1
0
當心網路陷阱!從媒體識讀、防詐騙到個資保護的安全守則
鳥苷三磷酸 (PanSci Promo)_96
・2024/12/17 ・3006字 ・閱讀時間約 6 分鐘

本文由 國家通訊傳播委員會 委託,泛科學企劃執行。 

網路已成為現代人生活中不可或缺的一部分,可伴隨著便利而來的,還有層出不窮的風險與威脅。從充斥網路的惡假害訊息,到日益精進的詐騙手法,再到個人隱私的安全隱憂,這些都是我們每天必須面對的潛在危機。2023 年網路購物詐欺案件達 4,600 起,較前一年多出 41%。這樣的數據背後,正反映出我們對網路安全意識的迫切需求⋯⋯

「第一手快訊」背後的騙局真相

在深入探討網路世界的風險之前,我們必須先理解「錯誤訊息」和「假訊息」的本質差異。錯誤訊息通常源於時效性考量下的查證不足或作業疏漏,屬於非刻意造假的不實資訊。相較之下,假訊息則帶有「惡、假、害」的特性,是出於惡意、虛偽假造且意圖造成危害的資訊。

2018 年的關西機場事件就是一個鮮明的例子。當時,燕子颱風重創日本關西機場,數千旅客受困其中。中國媒體隨即大肆宣傳他們的大使館如何派車前往營救中國旅客,這則未經證實的消息從微博開始蔓延,很快就擴散到各個內容農場。更令人遺憾的是,這則假訊息最終導致當時的外交部駐大阪辦事處處長蘇啟誠,因不堪輿論壓力而選擇結束生命。

-----廣告,請繼續往下閱讀-----

同年,另一則「5G 會抑制人體免疫系統」的不實訊息在網路上廣為流傳。這則訊息聲稱 5G 技術會影響人體免疫力、導致更容易感染疾病。儘管科學家多次出面澄清這完全是毫無根據的說法,但仍有許多人選擇相信並持續轉發。類似的例子還有 2018 年 2 月底 3 月初,因量販業者不當行銷與造謠漲價,加上媒體跟進報導,而導致民眾瘋狂搶購衛生紙的「安屎之亂」。這些案例都說明了假訊息對社會秩序的巨大衝擊。

提升媒體識讀能力,對抗錯假訊息

面對如此猖獗的假訊息,我們首要之務就是提升媒體識讀能力。每當接觸到訊息時,都應先評估發布該消息的媒體背景,包括其成立時間、背後所有者以及過往的報導記錄。知名度高、歷史悠久的主流媒體通常較為可靠,但仍然不能完全放下戒心。如果某則消息只出現在不知名的網站或社群媒體帳號上,而主流媒體卻未有相關報導,就更要多加留意了。

提升媒體識讀能力,檢視媒體背景,警惕來源不明的訊息。圖/envato

在實際的資訊查證過程中,我們還需要特別關注作者的身分背景。一篇可信的報導通常會具名,而且作者往往是該領域的資深記者或專家。我們可以搜索作者的其他作品,了解他們的專業背景和過往信譽。相對地,匿名或難以查證作者背景的文章,就需要更謹慎對待。同時,也要追溯消息的原始來源,確認報導是否明確指出消息從何而來,是一手資料還是二手轉述。留意發布日期也很重要,以免落入被重新包裝的舊聞陷阱。

這優惠好得太誇張?談網路詐騙與個資安全

除了假訊息的威脅,網路詐騙同樣令人憂心。從最基本的網路釣魚到複雜的身分盜用,詐騙手法不斷推陳出新。就拿網路釣魚來說,犯罪者通常會偽裝成合法機構的人員,透過電子郵件、電話或簡訊聯繫目標,企圖誘使當事人提供個人身分、銀行和信用卡詳細資料以及密碼等敏感資訊。這些資訊一旦落入歹徒手中,很可能被用來進行身分盜用和造成經濟損失。

-----廣告,請繼續往下閱讀-----
網路詐騙手法不斷進化,釣魚詐騙便常以偽裝合法機構誘取敏感資訊。圖/envato

資安業者趨勢科技的調查就發現,中國駭客組織「Earth Lusca」在 2023 年 12 月至隔年 1 月期間,利用談論兩岸地緣政治議題的文件,發起了一連串的網路釣魚攻擊。這些看似專業的政治分析文件,實際上是在臺灣總統大選投票日的兩天前才建立的誘餌,目的就是為了竊取資訊,企圖影響國家的政治情勢。

網路詐騙還有一些更常見的特徵。首先是那些好到令人難以置信的優惠,像是「中獎得到 iPhone 或其他奢侈品」的訊息。其次是製造緊迫感,這是詐騙集團最常用的策略之一,他們會要求受害者必須在極短時間內作出回應。此外,不尋常的寄件者與可疑的附件也都是警訊,一不小心可能就會點到含有勒索軟體或其他惡意程式的連結。

在個人隱私保護方面,社群媒體的普及更是帶來了新的挑戰。2020 年,一個發生在澳洲的案例就很具有警示意義。當時的澳洲前總理艾伯特在 Instagram 上分享了自己的登機證照片,結果一位網路安全服務公司主管僅憑這張圖片,就成功取得了艾伯特的電話與護照號碼等個人資料。雖然這位駭客最終選擇善意提醒而非惡意使用這些資訊,但這個事件仍然引發了對於在社群媒體上分享個人資訊安全性的廣泛討論。

安全防護一把罩!更新裝置、慎用 Wi-Fi、強化密碼管理

為了確保網路使用的安全,我們必須建立完整的防護網。首先是確保裝置和軟體都及時更新到最新版本,包括作業系統、瀏覽器、外掛程式和各類應用程式等。許多網路攻擊都是利用系統或軟體的既有弱點入侵,而這些更新往往包含了對已知安全漏洞的修補。

-----廣告,請繼續往下閱讀-----

在使用公共 Wi-Fi 時也要特別當心。許多公共 Wi-Fi 缺乏適當的加密和身分驗證機制,讓不法分子有機可乘,能夠輕易地攔截使用者的網路流量,竊取帳號密碼、信用卡資訊等敏感數據。因此,在咖啡廳、機場、車站等公共場所,都應該避免使用不明的免費 Wi-Fi 處理重要事務或進行線上購物。如果必須連上公用 Wi-Fi,也要記得停用裝置的檔案共享功能。

使用公共 Wi-Fi 時,避免處理敏感事務,因可能存在數據被攔截與盜取的風險。圖/envato

密碼管理同樣至關重要。我們應該為不同的帳戶設置獨特且具有高強度的密碼,結合大小寫字母、數字和符號,創造出難以被猜測的組合。密碼長度通常建議在 8~12 個字元之間,且要避免使用個人資訊相關的詞彙,如姓名、生日或電話號碼。定期更換密碼也是必要的,建議每 3~6 個月更換一次。研究顯示,在網路犯罪的受害者中,高達八成的案例都與密碼強度不足有關。

最後,我們還要特別注意社群媒體上的隱私設定。許多人在初次設定後就不再關心,但實際上我們都必須定期檢查並調整這些設定,確保自己清楚瞭解「誰可以查看你的貼文」。同時,也要謹慎管理好友名單,適時移除一些不再聯繫或根本不認識的人。在安裝新的應用程式時,也要仔細審視其要求的權限,只給予必要的存取權限。

提升網路安全基於習慣培養。辨識假訊息的特徵、防範詐騙的警覺心、保護個人隱私的方法⋯⋯每一個環節都不容忽視。唯有這樣,我們才能在享受網路帶來便利的同時,也確保自身的安全!

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
225 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia

0

2
0

文字

分享

0
2
0
NCC 公民培力活動百花齊放,公私協力推動媒體素養
鳥苷三磷酸 (PanSci Promo)_96
・2024/01/10 ・1036字 ・閱讀時間約 2 分鐘

-----廣告,請繼續往下閱讀-----

本文為 國家通訊傳播委員會 廣告

疫情加速全球數位化發展,也改變了大眾接收資訊的方式。隨著影音媒體平台及自媒體崛起,每個人除了是訊息接收者,也是內容的生產者,百花齊放的訊息管道也帶來了內容及資訊管理上的挑戰。

國家通訊傳播委員會(NCC)因應全球性之數位匯流發展及監理革新趨勢,致力於促進通訊傳播健全發展,保障消費者及尊重弱勢權益,打造多元文化均衡發展,迄今持續推動「廣電媒體專業素養培訓與公民培力推廣計畫」。

本年度( 112 年)公民培力推廣部分,藉由與廣電媒體產製端合作,包括公視、正聲廣播、新聲廣播、鳳鳴廣播、陽明山電視和全聯電視,及與大學、公民團體包括國立臺灣師範大學、朝陽科技大學、法律白話文、臺灣新聞記者協會等共 11 個單位,於 7 月至 12 月在北、中、南、東四大區域舉辦共 20 場媒體識讀活動,累積超過 1,300 人次參與,參與者豐富多元,包含媒體專業人員、銀髮族、身障群體、新住民、兒童及青少年、 YouTuber 、 KOL 等,多面向推廣媒體素養意識。

-----廣告,請繼續往下閱讀-----

本次公民培力活動形式多元,合作夥伴邀請各方講師發揮所長,針對不同參與對象因材施教,如正聲廣播電臺透過辦理相聲演出,讓平時不易接觸到媒體素養資訊的長輩、偏鄉學生,透過有趣的段子逐漸認識辨別假訊息的重要;國立臺灣師範大學大眾傳播研究所舉辦媒體素養營隊,至臺東教授國中生性別平等的重要性;公視透過舉辦電視台參訪,讓想認識電視媒體運作、節目製播的民眾得以大開眼界。許多單位也透過不同議題講座、互動與大學生或地方社區產生共鳴,散播媒體素養的種子,民眾課後紛紛表示收穫良多。

公視參訪-實際走進攝影棚,認識節目錄製過程。
臺師大媒體素養營-善盡大學社會責任,向年輕學子回饋所學知識。
正聲廣播電台-以相聲演出搭配假訊息防制宣導,讓銀髮族及兒童也能辨識假訊息。

NCC 以提升廣電媒體專業及社會大眾媒體識讀能力為已任,透過每年持續舉辦公民培力活動,幫助閱聽者對廣電媒體的認識、思考,以及對訊息評估的能力,讓不同年齡層及族群得以將媒體素養教育的種子深埋在心、向下扎根,進而提高全民媒體素養,打造更優質的社會環境。

-----廣告,請繼續往下閱讀-----
鳥苷三磷酸 (PanSci Promo)_96
225 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia