Loading [MathJax]/extensions/tex2jax.js

0

0
0

文字

分享

0
0
0

演進中的科學研究方法(3/4) – 假設檢定能衡量研究結果的價值嗎?

活躍星系核_96
・2014/08/08 ・3320字 ・閱讀時間約 6 分鐘 ・SR值 567 ・九年級

-----廣告,請繼續往下閱讀-----

文/ 陳紹慶(慈濟大學人類發展學系專任助理教授)

這一篇要談談證偽邏輯在心理科學研究未充分思考的情況,特別是運用假設檢定評估資料有沒有意義所造成的問題。了解什麼是特設假設,就能理解證偽邏輯的思考模式:排除所有可以解釋原因的特設假設之後,剩下的就是最有解釋力的理論。特設假設是因果關係的概念推論,設定者儘可能列舉各種特設假設會成立的證據要件,讓統計訊息顯現可以排除的特設假設。以證據為本的實驗科學家,任務是確認手上的資料是否符合特設假設的條件,如果符合,就不能以設定為真的理論解釋原因;如果不符合,才能接受設定為真的理論。假設檢定就是完成判斷任務的統計工具,抱著這個認識,來談談運用工具的問題意識如何產生可靠的知識、錯誤的知識和無法帶來啟發的知識等困境。

一、不虛無的虛無假設

不論你的假設檢定學得好或不好,必定記得最後步驟要根據得到的p值,判斷研究資料是不是符合假設的預期。還有一種情況是因為有完成課程要求而收集資料,並且要進行統計檢定撰寫報告,得到的p值越小似乎代表自己做的研究越成功。不過現在了解特設假設的意義,可知虛無假設就是一種特設假設,p值表示不接受虛無假設但結論錯誤的機率。嚴格來說真正的研究假設是不是成立並不能依據p值的大小判斷,除非研究設計讓研究假設與唯一的特設假設相互對決。然而一個研究主題已經進展到公認只有一種假設能解釋因果關係,通常是有多重虛無假設(或特設假設)要逐步排除。這也是為何許多實驗研究報告不會只有一個實驗,也是心理科學的學習與規劃研究的最大難關。

藉著分析一個語言演化理論的筆戰案例,我在此試著呈現設定研究假設與特設假設對決的複雜性。Hauser、Chomsky與Fitch發表在2002年的「自然」期刊,提出遞迴(recursion)是人類語言獨有成份的假設與支持假設的證據。遞迴是程式設計中常見的名詞,指一道編程(program)輸出的結果自動成為下一步計算的輸入,人類語言中有此結構的認知機制僅限於發語習得,語法(syntax)及特化的語義概念等認知結構適用遞迴運作的機制。Hauser等人將這些設定為狹義語言機關(Faculty of Language Narrow, FLN),只屬人類獨有。其它也是構成人類語言的認知機制,例如語音辦識與詞彙知識,與非語言的心理功能有相同的演化來源,而且是包括人類在內的靈長類動物都能觀察到的認知能力。Hauser等人將這部分稱為廣義語言機關(Faculty of Language Broad, FLB),整理支持兩種機關相互獨立的各種證據,大致如下表所示。

-----廣告,請繼續往下閱讀-----

1

如此的區分使心理學者與語言學者可以透過非人類的靈長類動物為研究對象,測試是否有屬於FLB的能力,以及是否沒有屬於FLN的能力。如果研究的是FLB的能力,特設假設就是此能力並非研究對象所有;反之,如果研究的是FLN的能力,特設假設是研究對象能掌握此類能力。這一套證偽邏輯的推理,是Pinker與Jackendoff發表在2005年「認知」期刊的文章批判重點,因為每種能力的各項證據都不足以支持兩種機關之間的區別,他們花了許多篇幅說明每個主題尚且無法排除對應的特設假設為真的可能性。雖然Pinker與Jakendoff沒有提到研究方法與統計分析的術語(有提到虛無假設,但使用的脈絡其實是指特設假設),這兩篇論文照出有證偽邏輯瑕疵的理論推理,會妨害有效研究的設計。

現在可以了解研究設計的優劣在設定對立假設與虛無假設的成立條件時,就已經確定,顯著的結果並非好研究的充分條件。以假設檢定做出結論的報告,除非能確定除了對立假設與虛無假設立之外,沒有第三種解釋結果的可能性,否則必須檢討實驗結果的限制與需要改進的地方。現實的科學研究生態是沒有達到統計顯著性的實驗結果通常很難獲得發表機會,造成兩個方面的問題。一個是原始研究結果無法重現的問題,另一個是本系列第一集提過的「不見天日」效應。前者會傷害科學知識的誠篤性(scientific integrity),後者阻礙科學知識的進展。

二、無法重現的研究 = 不能重覆推翻的特設假設

舉Hauser與Pinker的筆戰為例是有用意的,Hauser違反學術倫理的事件是近年心理學界探討的重大案例之一。根據案件爆發當年(2010)曾志朗院士在科學人雜誌發表的專欄文章,可知事件的引爆點是Hauser的團隊測試猿猴語音辨識能力的實驗,也就是證實是語音辨識是FLB一部分的證據。當時在哈佛大學組織的調查委員會調查過程中,還發生接受爭議論文發表的「認知」(cognition)期刊主編辭職的事件,隔年(2011)調查即將結束時,Hauser主動辭去教授職位,並宣佈致力投入中輟學生的輔導工作,不再參與語言與道德演化的研究。這個動作讓哈佛調查委員會完成報告後,決定不公開發表,當時部落客Neuroskeptic就指出如此一來世人將無法得知全部真相,無法從Hauser的案例學到教訓。

Marc Hauser。圖片來源:Scitable
Marc Hauser。圖片來源:Scitable

不過在撰寫本文的時候(快寫不下去?),2014年5月,不再做研究的Hauser在Frontiers in Psychology發表兩篇回顧性論文(Hauser et al., 2014, Watumull, J. and Hauser, 2014),一篇是自已掛第一作者,而且有2002年一起在「科學」發表論文的Chomsky並列共同作者,主要是整理語言演化的理論主張。另一篇是談論語言演化理論與實驗研究面臨的困難。 也許是沈寂三年突然有論文發表,波士頓致力資訊透明化的公民團體,找出當年調查委員會封存的報告並透露給當地媒體。2014年5月30日的新聞報導透露的報告內容指出,Hauser早期研究的行為反應編碼資料,有部分並非呈現研究對象(猿猴)的實際表現,導致調查小組從實驗錄影重新編碼的行為資料做出不同的統計分析結果,曾經發表的論文並未忠實呈現編碼與行為觀察的不一致,可以確定Hauser為了得到有顯著性的統計結果而變造部分資料。

-----廣告,請繼續往下閱讀-----

我認為可以從Hauser與Pinker的筆戰論點能發現讓Hauser鋌而走險的遠因,儘管理論能明確區分相互對立的假設成立的條件(FLB,FLN),非人類對象的實驗會有較大的隨機誤差,可以預期得到的差異效果遠較人類實驗小,不大容易獲得顯著的統計結果,而且相同實驗由不同研究團隊進行也會得到不一致的統計結果。但是限於發表的壓力,對於差一點就顯著的差異效果,很難有不去調整的動機。Hauser的早年研究生涯也面臨這樣的壓力,而且他的實驗方法如果可行,能擴大心理學實驗的研究範疇,這是能功成名就的誘惑,凡人能抵抗者幾希。

三、無法發表的研究 = 很難推翻的特設假設

極少數研究只會有一個特設假設需要推翻,多數研究要經過許多回合的實驗技術與設計的改良,逐一消去各種特設假設,並且實驗效果經過多次重覆,都能得到一致的統計顯著結果,才能得到同行人士的接受。這也表示有理論意義,但是結果未達到統計顯著的實驗,在早期大多面臨被鎖進抽屜的命運,也就是第一篇提到的「不見天日」偏誤(file drawer bias)。比較著名的案例是錯誤記憶的實驗典範DRM效應,這是首見於1959年Deese發表的論文,1994年由Roediger與McDermott改良,成為今天記憶研究者廣泛運用的實驗方法,也改變認知心理學對於記憶的看法。

為何以上提到的兩篇論文相差35年?因為Deese的論文發表後並未在其它心理學者的實驗室裡獲得穩定的重現,相當於被鎖在抽屜多年才得到應有的重視。Hauser與DRM的例子互為極端,都指出即使研究者的點子相同不錯,若實驗結果不能穩定地證實特設假設可被推翻,很難在現代科學知識生產體系中出線。實驗結果的統計顯著性並非是確定某個特設假設可被推翻的指標,而是能不能獲得發表機會的基本門檻。現實情況對科學知識的累積有如雙面刃:有好主意但研究結果不顯著的研究者,冒著造假的風險發表有問題的研究,或著沉潛多年等待被肯定的機會。無論是那一種情況,對於科學知識的進步都是損失,但有沒有方法可以改變現況?最後一篇要介紹現在正在進行的一些方式,還有我對未來研究教學趨勢的想法。

  1. Deese, J. (1959). On the prediction of occurrence of particular verbal intrusions in immediate recall. Journal of Experimental Psychology, 58, 17–22.
  2. Hauser, M. D., Chomsky, N., and Fitch, (2002). The Faculty of Language: What Is It, Who Has It, and How Did It Evolve? Science, 298, 1569-1579. doi: 10.1126/science.298.5598.1569
  3. Hauser MD, Yang C, Berwick RC, Tattersall I, Ryan MJ, Watumull J, Chomsky N and Lewontin RC (2014) The mystery of language evolution. Frontiers in Psychology. 5:401. doi: 10.3389/fpsyg.2014.00401
  4. Roediger, H.L., & McDermott, K. B. (1995). Creating false memories: Remembering words not presented in lists. Journal of Experimental Psychology: Learning, Memory and Cognition, 24(4), 803–814.
  5. Pinker, S., & Jackendoff, R. (2005). The faculty of language: What’s special about it? Cognition, 95, 201-236. doi: 10.1016/j.cognition.2004.08.004
  6. Watumull, J. & Hauser MD, (2014). Conceptual and empirical problems with game theoretic approaches to language evolution. Front. Psychol. 5:226. doi: 10.3389/fpsyg.2014.00226

延伸閱讀

-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

0

3
1

文字

分享

0
3
1
當情緒像過山車?從亢奮到低落,解碼躁鬱症的真實面貌
PanSci_96
・2024/10/12 ・2253字 ・閱讀時間約 4 分鐘

躁鬱症(Bipolar Disorder),正式名稱為「雙向情緒疾患」或「雙極性情感障礙」,是一種讓患者的情緒不受控制地在極度亢奮和極度低落之間擺盪的精神疾病。這樣的情緒變化不僅僅是短暫的起伏,而是持續多天、甚至數週的狀態,對於患者的生活、關係和工作會造成重大影響。

歡迎訂閱 Pansci Youtube 頻道 獲取更多深入淺出的科學知識!

什麼是躁鬱症?

躁鬱症患者的情緒通常經歷兩個極端階段:躁期和鬱期。

在躁期,患者可能會感到無比的精力充沛、自信心爆棚,甚至會有過度樂觀和衝動的行為。然而,躁鬱症不僅僅是「情緒高漲」的表現,在躁期過後,患者往往會經歷嚴重的情緒低谷,進入所謂的鬱期。此時,他們會感到情緒低落、無力感、甚至有自我傷害的傾向。

近幾年大眾逐漸正視精神疾病的影響,許多名人也曾經公開分享他們的躁鬱症經歷,如歌手瑪麗亞.凱莉、演員小勞勃道尼。這些公眾人物的經歷讓我們看到了這種精神疾病的廣泛影響,以及如何對他們的創作、生活和心理造成衝擊。

-----廣告,請繼續往下閱讀-----

躁鬱症的分類與盛行率

根據跨國研究,不論種族、性別或地區,躁鬱症的盛行率約為 1%,這意味著每 100 人中就有一人可能經歷過躁鬱症的發作。如果將所有的亞型計算在內,終生盛行率甚至可能高達 2.4%。躁鬱症的發病年齡通常集中在 20 至 30 歲之間,超過 70% 的患者在 25 歲前就會出現早期症狀。

躁鬱症依照症狀的不同,還可以分為不同的亞型。最常見的分類是第一型和第二型。第一型躁鬱症的特徵是患者會經歷完整的躁期,通常會影響患者的日常功能,甚至需要住院治療。而第二型躁鬱症的躁期則相對較輕,稱為「輕躁期」,但鬱期仍然會對患者的生活造成嚴重影響。

躁鬱症根據症狀可分為不同亞型,最常見的是第一型和第二型。圖/envato

什麼是「躁期」和「鬱期」?

「躁期」和「鬱期」是躁鬱症的兩個主要特徵階段。

躁期: 許多人對「躁」字的理解常常會聯想到「暴躁」或「焦躁」,實際上躁鬱症的躁期,更多的是情緒高昂、亢奮的狀態。在輕躁期(Hypomania),患者會持續數天感到極度精力充沛,無論在工作還是生活中,表現得比平時更有自信和創造力。但問題是,這種情緒亢奮狀態不一定持續太久,躁期可能會逐漸惡化為狂躁期(Mania)。這時,患者的行為可能會變得極端,容易做出無法預測的決定,例如過度消費、縱情娛樂或進行不安全的行為。

-----廣告,請繼續往下閱讀-----

鬱期: 在鬱期,患者的情緒和行為完全反轉。他們會感到無精打采、情緒低落,對任何事物都提不起勁。這時候,患者的日常活動變得困難,注意力和記憶力也會大幅下降,甚至有自我傷害或自殺的傾向。

從外界看來,躁期似乎是一個非常「高能」的狀態,但實際上,躁鬱症的危險之處正在於它的不穩定性。躁鬱症患者在躁期中無法控制自己的情緒與行為,即使感覺自己處於高峰狀態,這樣的「興奮」很可能會導致衝動行為,如不理智的財務決策或人際衝突。

如何應對躁鬱症?

躁鬱症不僅僅是情緒的擺盪,同時也會對患者的生活產生影響:

  1. 無法控制的躁期時間:躁期的長度和強度不是患者能控制的,患者可能從精力充沛的狀態,轉變為難以收拾的混亂局面。
  2. 鬱期的危險性:在躁期過後,進入鬱期的患者常常因為自責或對前期行為的後悔,而陷入更深的低谷,這增加了自我傷害的風險。
  3. 生活質量下降:反覆發作的情緒擺盪讓患者難以享受生活,甚至對快樂的感受也會變得懷疑和恐懼。
  4. 人際關係受損:情緒極端的變化會讓患者難以建立穩定的人際關係,這對於長期支持系統的建立是巨大的挑戰。
  5. 大腦損傷:每次發作對大腦的損害都是不可逆的,長期下來,注意力、記憶力、甚至思考能力都會受到影響。

治療與日常應對方法

對於躁鬱症的治療,藥物和心理治療是兩個不可或缺的部分。穩定情緒的藥物,如鋰鹽,是控制躁鬱症的重要工具。鋰鹽自 20 世紀開始就被廣泛用於躁鬱症的治療,能有效減少躁鬱症的復發風險。如果患者正處於躁期,醫生還可能會使用抗精神病藥物來幫助控制症狀。

-----廣告,請繼續往下閱讀-----

除了藥物治療,心理治療同樣重要,特別是在症狀穩定後,透過心理治療,患者可以學習如何識別躁鬱症復發的早期徵兆,以及如何調適壓力和情緒。

心理治療可以幫助患者學習識別躁鬱症復發的早期徵兆,並有效調適壓力和情緒。圖/envato

如何支持身邊的躁鬱症患者?

身為躁鬱症患者的家人或朋友,了解如何在不同的情緒階段支持患者是關鍵。在躁期時,避免硬碰硬,而是試著將患者的注意力引導到安全的活動上;在鬱期時,提供非批評的陪伴,讓患者感受到被理解與支持。

躁鬱症是一種需要長期管理的疾病,但這並不意味著生活的希望就此消失。許多躁鬱症患者在接受治療後,依然能過著豐富充實的生活,並在自己的專業領域中發揮才華,擁有幸福的人生。

-----廣告,請繼續往下閱讀-----

討論功能關閉中。

PanSci_96
1262 篇文章 ・ 2411 位粉絲
PanSci的編輯部帳號,會發自產內容跟各種消息喔。

2

10
4

文字

分享

2
10
4
尿急可以讓人做更好的決定,但這個決定不一定是好決定—— 2011 年搞笑諾貝爾醫學獎
雷雅淇 / y編_96
・2023/04/01 ・1828字 ・閱讀時間約 3 分鐘

車輪餅要選奶油還是紅豆?遊戲機該買 Switch 還是 PS5?要吃麥當勞還是肯德基?父母和伴侶落水應該先救誰?人生中會有很多時候需要做終極二選一,有選擇困難的時候怎麼辦?2011 年搞笑諾貝爾獎醫學獎的得獎研究提供了一個方法:憋尿。

生活大爆炸(The Big Bang Theory)裡,主角謝爾頓(Sheldon)在 PS4 與 Xbox 之間難以抉擇。

搞笑諾貝爾獎頒發給「讓人捧腹大笑,然後發人深省 (achievements that make people LAUGH, then THINK.)」的研究或事件,2011 年的醫學獎頒給兩個研究團隊,表彰他們證明:當人尿急的時候會做出更好的決定,但對其他事情來說這是糟糕的決定。這到底是怎麼一回事?

為什麼當人尿急的時候會做出更好的決定,但對其他事情來說,卻是糟糕的決定呢?圖/Pixabay

憋尿幫助你終極二選一?

荷蘭特文特大學行銷傳播與消費者心理學系的米賈姆 (Mirjam A Tuk) 從一次聽演講時不小心喝太多咖啡得到靈感,讓他想知道「當人們需要控制膀胱的時候會發生什麼事?」

於是他和研究團隊一起設計了實驗,一群喝一點水和另一群喝很多水的受試者,在 40 分鐘後水到達膀胱的時候,開始要受試者回答一系列的問題,例如「會選擇明天收到 480 元還是 30 天後拿到 900 元?」等問題。實驗發現,當人們很想上廁所、不得不控制膀胱的時候,反而更比較願意延遲滿足、變得更有耐心,且有助於控制衝動。

-----廣告,請繼續往下閱讀-----

這結果令人驚奇的地方,因為許多心理學研究都支持過於克制反而會使人「自我耗盡 (ego-depletion)」,讓他們對其他事情更難以控制自己。米賈姆認為這可能是因為膀胱控制在某些程度上來說,是自動的、無意識的過程。

不過這不代表尿急就是好事,另一個一起得獎的研究則發現,當人很想尿尿的時候,注意力和工作記憶會顯著下降,而且糟糕的程度和酒醉(血液中酒精濃度 0.05%)、疲勞(持續清醒 24 小時)相似,而在尿尿警報解除後認知就會回到原來的水平。

當人很想尿尿的時候,注意力和工作記憶會顯著下降,就和喝醉時類似。圖/PIxabay

研究團隊讓八位健康成年人每 15 分鐘喝 250c.c. 的水,直到他們很想上廁所、再也忍不住為止,並在這個時候讓他們進行自評和認知測驗。

不過,為什麼要做這個實驗呢?研究成員之一、耶魯醫學院的皮特札克 (Robert Pietrzak)  教授解釋,有很多工作是無法隨時想去上廁所就能去上廁所的。例如:長途卡車司機、醫護人員等,這個研究提醒大家,當你在憋尿的時候,很可能會干擾正在執行的工作。

-----廣告,請繼續往下閱讀-----

挑戰人類的憋尿極限?勸你還是不要比較好

人到底可以憋尿憋多久?會不會憋死掉?一天又會尿尿幾次呢?

膀胱是可以伸縮的器官,成年人的膀胱可以儲存約 400~500cc 的尿液,膀胱和大腦有直接溝通的專線,約四分之一滿的時候就會有尿意。尿尿的次數也和膀胱的大小有關,成年人平均一天尿尿 6~7 次,不過在 4~10 次之間都屬正常範圍;小小朋友和嬰兒的膀胱比較小,一天會尿尿 10 次或以上。

憋尿對身體的影響大多是長期累積而來的:如果沒有定期排空膀胱,最常見的是細菌滋生造成尿道感染,和因為都憋著導致膀胱肌肉在該放鬆的時候無法放鬆,極少極少出現憋尿憋到漲破膀胱的狀況。

偶而一兩次憋尿、試試看是不是會做比較理性的決定還無妨,但還是要養成想上廁所時不要憋太久,尿尿時不要急、要盡量排空的好習慣喔!

-----廣告,請繼續往下閱讀-----
  1. About the Igs
  2. The Impulsive client: theory, research, and treatment
  3. Inhibitory spillover: increased urination urgency facilitates impulse control in unrelated domains
  4. Bladder control – DW – 10/05/2011
  5. How needing a wee affects your decision making – Big Think
  6. Full Bladder, Better Decisions? Controlling Your Bladder Decreases Impulsive Choices
  7. IG Nobel prize goes to University of Twente researcher
  8. Lifespan researcher wins Ig Nobel Prize
  9. Ig Nobel Award Winners: Do Humans Think Less Clearly When They Have To Urinate? | HuffPost Weird News
  10. Why Having To Pee While Driving Is As Bad As Drinking
  11. Ig Nobel Prize: Humor and Science – Yale Scientific Magazine
  12. The effect of acute increase in urge to void on cognitive function in healthy adults
  13. How Long Can You Go Without Peeing? Risks, Complications, Concerns
-----廣告,請繼續往下閱讀-----
所有討論 2
雷雅淇 / y編_96
38 篇文章 ・ 1306 位粉絲
之前是總編輯,代號是(y.),是會在每年4、7、10、1月密切追新番的那種宅。中興生技學程畢業,台師大科教所沒畢業,對科學花心的這個也喜歡那個也愛,彷徨地不知道該追誰,索性決定要不見笑的通吃,因此正在科學傳播裡打怪練功衝裝備。

0

0
0

文字

分享

0
0
0
演進中的科學研究方法(3/4) – 假設檢定能衡量研究結果的價值嗎?
活躍星系核_96
・2014/08/08 ・3320字 ・閱讀時間約 6 分鐘 ・SR值 567 ・九年級

文/ 陳紹慶(慈濟大學人類發展學系專任助理教授)

這一篇要談談證偽邏輯在心理科學研究未充分思考的情況,特別是運用假設檢定評估資料有沒有意義所造成的問題。了解什麼是特設假設,就能理解證偽邏輯的思考模式:排除所有可以解釋原因的特設假設之後,剩下的就是最有解釋力的理論。特設假設是因果關係的概念推論,設定者儘可能列舉各種特設假設會成立的證據要件,讓統計訊息顯現可以排除的特設假設。以證據為本的實驗科學家,任務是確認手上的資料是否符合特設假設的條件,如果符合,就不能以設定為真的理論解釋原因;如果不符合,才能接受設定為真的理論。假設檢定就是完成判斷任務的統計工具,抱著這個認識,來談談運用工具的問題意識如何產生可靠的知識、錯誤的知識和無法帶來啟發的知識等困境。

一、不虛無的虛無假設

不論你的假設檢定學得好或不好,必定記得最後步驟要根據得到的p值,判斷研究資料是不是符合假設的預期。還有一種情況是因為有完成課程要求而收集資料,並且要進行統計檢定撰寫報告,得到的p值越小似乎代表自己做的研究越成功。不過現在了解特設假設的意義,可知虛無假設就是一種特設假設,p值表示不接受虛無假設但結論錯誤的機率。嚴格來說真正的研究假設是不是成立並不能依據p值的大小判斷,除非研究設計讓研究假設與唯一的特設假設相互對決。然而一個研究主題已經進展到公認只有一種假設能解釋因果關係,通常是有多重虛無假設(或特設假設)要逐步排除。這也是為何許多實驗研究報告不會只有一個實驗,也是心理科學的學習與規劃研究的最大難關。

藉著分析一個語言演化理論的筆戰案例,我在此試著呈現設定研究假設與特設假設對決的複雜性。Hauser、Chomsky與Fitch發表在2002年的「自然」期刊,提出遞迴(recursion)是人類語言獨有成份的假設與支持假設的證據。遞迴是程式設計中常見的名詞,指一道編程(program)輸出的結果自動成為下一步計算的輸入,人類語言中有此結構的認知機制僅限於發語習得,語法(syntax)及特化的語義概念等認知結構適用遞迴運作的機制。Hauser等人將這些設定為狹義語言機關(Faculty of Language Narrow, FLN),只屬人類獨有。其它也是構成人類語言的認知機制,例如語音辦識與詞彙知識,與非語言的心理功能有相同的演化來源,而且是包括人類在內的靈長類動物都能觀察到的認知能力。Hauser等人將這部分稱為廣義語言機關(Faculty of Language Broad, FLB),整理支持兩種機關相互獨立的各種證據,大致如下表所示。

-----廣告,請繼續往下閱讀-----

1

如此的區分使心理學者與語言學者可以透過非人類的靈長類動物為研究對象,測試是否有屬於FLB的能力,以及是否沒有屬於FLN的能力。如果研究的是FLB的能力,特設假設就是此能力並非研究對象所有;反之,如果研究的是FLN的能力,特設假設是研究對象能掌握此類能力。這一套證偽邏輯的推理,是Pinker與Jackendoff發表在2005年「認知」期刊的文章批判重點,因為每種能力的各項證據都不足以支持兩種機關之間的區別,他們花了許多篇幅說明每個主題尚且無法排除對應的特設假設為真的可能性。雖然Pinker與Jakendoff沒有提到研究方法與統計分析的術語(有提到虛無假設,但使用的脈絡其實是指特設假設),這兩篇論文照出有證偽邏輯瑕疵的理論推理,會妨害有效研究的設計。

現在可以了解研究設計的優劣在設定對立假設與虛無假設的成立條件時,就已經確定,顯著的結果並非好研究的充分條件。以假設檢定做出結論的報告,除非能確定除了對立假設與虛無假設立之外,沒有第三種解釋結果的可能性,否則必須檢討實驗結果的限制與需要改進的地方。現實的科學研究生態是沒有達到統計顯著性的實驗結果通常很難獲得發表機會,造成兩個方面的問題。一個是原始研究結果無法重現的問題,另一個是本系列第一集提過的「不見天日」效應。前者會傷害科學知識的誠篤性(scientific integrity),後者阻礙科學知識的進展。

二、無法重現的研究 = 不能重覆推翻的特設假設

舉Hauser與Pinker的筆戰為例是有用意的,Hauser違反學術倫理的事件是近年心理學界探討的重大案例之一。根據案件爆發當年(2010)曾志朗院士在科學人雜誌發表的專欄文章,可知事件的引爆點是Hauser的團隊測試猿猴語音辨識能力的實驗,也就是證實是語音辨識是FLB一部分的證據。當時在哈佛大學組織的調查委員會調查過程中,還發生接受爭議論文發表的「認知」(cognition)期刊主編辭職的事件,隔年(2011)調查即將結束時,Hauser主動辭去教授職位,並宣佈致力投入中輟學生的輔導工作,不再參與語言與道德演化的研究。這個動作讓哈佛調查委員會完成報告後,決定不公開發表,當時部落客Neuroskeptic就指出如此一來世人將無法得知全部真相,無法從Hauser的案例學到教訓。

Marc Hauser。圖片來源:Scitable
Marc Hauser。圖片來源:Scitable

-----廣告,請繼續往下閱讀-----

不過在撰寫本文的時候(快寫不下去?),2014年5月,不再做研究的Hauser在Frontiers in Psychology發表兩篇回顧性論文(Hauser et al., 2014, Watumull, J. and Hauser, 2014),一篇是自已掛第一作者,而且有2002年一起在「科學」發表論文的Chomsky並列共同作者,主要是整理語言演化的理論主張。另一篇是談論語言演化理論與實驗研究面臨的困難。 也許是沈寂三年突然有論文發表,波士頓致力資訊透明化的公民團體,找出當年調查委員會封存的報告並透露給當地媒體。2014年5月30日的新聞報導透露的報告內容指出,Hauser早期研究的行為反應編碼資料,有部分並非呈現研究對象(猿猴)的實際表現,導致調查小組從實驗錄影重新編碼的行為資料做出不同的統計分析結果,曾經發表的論文並未忠實呈現編碼與行為觀察的不一致,可以確定Hauser為了得到有顯著性的統計結果而變造部分資料。

我認為可以從Hauser與Pinker的筆戰論點能發現讓Hauser鋌而走險的遠因,儘管理論能明確區分相互對立的假設成立的條件(FLB,FLN),非人類對象的實驗會有較大的隨機誤差,可以預期得到的差異效果遠較人類實驗小,不大容易獲得顯著的統計結果,而且相同實驗由不同研究團隊進行也會得到不一致的統計結果。但是限於發表的壓力,對於差一點就顯著的差異效果,很難有不去調整的動機。Hauser的早年研究生涯也面臨這樣的壓力,而且他的實驗方法如果可行,能擴大心理學實驗的研究範疇,這是能功成名就的誘惑,凡人能抵抗者幾希。

三、無法發表的研究 = 很難推翻的特設假設

極少數研究只會有一個特設假設需要推翻,多數研究要經過許多回合的實驗技術與設計的改良,逐一消去各種特設假設,並且實驗效果經過多次重覆,都能得到一致的統計顯著結果,才能得到同行人士的接受。這也表示有理論意義,但是結果未達到統計顯著的實驗,在早期大多面臨被鎖進抽屜的命運,也就是第一篇提到的「不見天日」偏誤(file drawer bias)。比較著名的案例是錯誤記憶的實驗典範DRM效應,這是首見於1959年Deese發表的論文,1994年由Roediger與McDermott改良,成為今天記憶研究者廣泛運用的實驗方法,也改變認知心理學對於記憶的看法。

為何以上提到的兩篇論文相差35年?因為Deese的論文發表後並未在其它心理學者的實驗室裡獲得穩定的重現,相當於被鎖在抽屜多年才得到應有的重視。Hauser與DRM的例子互為極端,都指出即使研究者的點子相同不錯,若實驗結果不能穩定地證實特設假設可被推翻,很難在現代科學知識生產體系中出線。實驗結果的統計顯著性並非是確定某個特設假設可被推翻的指標,而是能不能獲得發表機會的基本門檻。現實情況對科學知識的累積有如雙面刃:有好主意但研究結果不顯著的研究者,冒著造假的風險發表有問題的研究,或著沉潛多年等待被肯定的機會。無論是那一種情況,對於科學知識的進步都是損失,但有沒有方法可以改變現況?最後一篇要介紹現在正在進行的一些方式,還有我對未來研究教學趨勢的想法。

-----廣告,請繼續往下閱讀-----
  1. Deese, J. (1959). On the prediction of occurrence of particular verbal intrusions in immediate recall. Journal of Experimental Psychology, 58, 17–22.
  2. Hauser, M. D., Chomsky, N., and Fitch, (2002). The Faculty of Language: What Is It, Who Has It, and How Did It Evolve? Science, 298, 1569-1579. doi: 10.1126/science.298.5598.1569
  3. Hauser MD, Yang C, Berwick RC, Tattersall I, Ryan MJ, Watumull J, Chomsky N and Lewontin RC (2014) The mystery of language evolution. Frontiers in Psychology. 5:401. doi: 10.3389/fpsyg.2014.00401
  4. Roediger, H.L., & McDermott, K. B. (1995). Creating false memories: Remembering words not presented in lists. Journal of Experimental Psychology: Learning, Memory and Cognition, 24(4), 803–814.
  5. Pinker, S., & Jackendoff, R. (2005). The faculty of language: What’s special about it? Cognition, 95, 201-236. doi: 10.1016/j.cognition.2004.08.004
  6. Watumull, J. & Hauser MD, (2014). Conceptual and empirical problems with game theoretic approaches to language evolution. Front. Psychol. 5:226. doi: 10.3389/fpsyg.2014.00226

延伸閱讀

-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia