0

4
1

文字

分享

0
4
1

犯錯讓你更強大:揭開錯誤驅動型學習的秘密——《記憶決定你是誰》

天下文化_96
・2024/08/01 ・3678字 ・閱讀時間約 7 分鐘

-----廣告,請繼續往下閱讀-----

我們天生會從錯誤和挑戰中學習——這種現象稱為「錯誤驅動型學習」(error-driven learning)。我相信這個簡單的原則可以解釋很多現象,例如我們在哪些條件下學習成效最好、在哪些條件下容易忘記,甚至是我們睡覺時發生在記憶上的改變。

人生實難

滿五十歲那年,我下了兩個決心:第一是要寫一本書(也就是你正在讀的這本),第二則是要學衝浪。跟學衝浪比起來,我攻讀博士學位時遇到的所有挑戰都相形見絀。一部分問題是因為我不再年輕,而衝浪對核心肌群的要求非常高——我甚至不知道自己有那些肌肉。

再者,衝浪的學習曲線本來就陡峭,因為要學的東西非常多:划水技巧;判讀海浪以將自己調整到正確位置,並拿準開始划水的時機;弄清楚自己在何時真的追到浪;還有起身站立(如果我有幸進展到這個節骨眼),儘管隨即又會整個人掉進水裡。過程裡的任何差錯都會讓前面的努力報銷,而且既耗體力又打擊信心。

錯誤的過程往往讓人喪失信心。 圖/envato

不管你是學習新的運動如衝浪,或學習新的語言、新的樂器,犯錯時的痛苦是學習的一大障礙,況且在學習曲線的初期時特別容易令人沮喪。但即使是看似能表現自如的高手,以前也曾經是菜鳥,他們同樣得從犯錯開始。要從菜鳥進步為高手,必須先持續把自己推向能力的邊界。沒有付出,沒有收穫。但反過來說,某些痛苦的耕耘可以轉變為很大的收穫。

-----廣告,請繼續往下閱讀-----

這裡指的不是生理上的痛苦,而是犯錯時心理上甚至情緒上的痛苦。我也不建議利用痛苦來鍛鍊性格。這裡所說的收穫是指,把犯錯當作學習的機會。

在大腦的運動系統中,「錯誤驅動型學習」是一套公認的原則。許多神經科學家相信,我們學會進行有技巧的動作,是透過觀察我們想做和實際上做到的動作,並找出兩者之間的差異。例如,當音樂家練習某支他們已經很熟悉的樂曲時,某些段落相對簡單,但另一些段落則比較難找到正確的和弦。如果每次練習時都得為這支曲子的每個部分建立一個新的記憶,未免太沒有效率。比較好的解決方式是,稍微局部修改記憶,好應付樂曲裡困難的部分。

錯誤驅動型學習也可以解釋,為什麼我們透過主動的「從做中學」,會比被動的記憶學習得到更多好處。例如在一個陌生的地區,相較於搭計程車經過,你自己開車一定會對這裡的空間動線取得更清楚的概念。在新的環境裡主動搜尋有許多好處,其中之一是讓你依據自身決定和行動而得到的結果來學習,這是看地圖得不到的好處。

在其他活動中,類似的機制也發揮著作用。無論是進行彩排的演員、在分組練習比賽中的橄欖球員,或是為了在董事會面前做簡報而預先練習的企業主管,都是憑直覺就利用了錯誤驅動型學習的力量。

-----廣告,請繼續往下閱讀-----

記憶研究者從很久以前就知道,在充滿挑戰的情況下學習有不少好處。我們談談實際一點的問題,好比學生應該如何準備隨堂測驗?最簡單的方法,也是世界各地最多學生採用的方法,就是重複閱讀教科書,試圖記住內容。

測驗效應:從錯誤中學習的力量

認知心理學家羅迪格和卡皮克(Jeff Karpicke)則考慮另一種方式,他們想知道,如果不透過複習而用「測驗」來自我訓練,會有什麼效果?直覺上來說,一次又一次的複習或許看似比自我測驗更有用,我們可能會想:既然可以專注於記住正確的答案,為何要冒著答錯的風險?

羅迪格和卡皮克樂意違反一般見解,把賭注押在測驗那邊,因為他們已經看到一些研究,間接顯示了把測驗做為學習工具的力量。為了檢驗測驗的影響力,他們讓兩組學生記憶托福測驗參考書的節選材料。一組的做法是重複閱讀約十四次並試圖記下內容,另一組則是閱讀三到四次,接著進行三次測驗,在測驗裡必須盡可能回想剛才讀過的內容。

重複閱讀的學生對於掌握教材的能力顯出很高的自信,反覆接受測驗的學生則在一開始時信心受損。重複閱讀的人對教材的學習效果比起接受測驗的人好一點點,但是這並不令人意外,因為重複閱讀組接觸教材的機會是接受測驗組的四倍。

-----廣告,請繼續往下閱讀-----

然而羅迪格和卡皮克等待一週,看這些學生是否還保留著學過的內容,結果差異十分巨大。平均而言,重複閱讀組的學生只記得原先學得內容的一半,至於接受測驗組則超過。所以,雖然學生以為自己透過重複閱讀教材可以學得更多,但實際上自我測驗的投資報酬率卻高上不少。

羅迪格曾寫到,記憶科學跟物理學不同,記憶科學沒有「定律」,但跟複習相對照,測驗的好處(也就是測驗效應)幾乎像重力定律一樣可靠。在各種不同條件下的大量研究中,也都呈現出測驗效應。測驗的效用一直以來沒有爭議,不過測驗究竟為什麼對記憶有如此強大的效果,科學家還未得到共識。

最簡單的一種解釋是,測驗能暴露你的弱點。一般來說,我們覺得自己能記住剛學過的東西,甚至偏向過度自信。羅格斯和卡皮克實驗裡的學生認為,自己反覆研讀那麼多次,一定可以學得更多,那是因為他們尚未受到挑戰。至於接受測驗的學生,則在回想自認為應該學得不錯的資訊時,經歷困難、甚至失敗,因而消磨傲氣。因此,測驗組的學生在明白自己學得沒有想像中徹底時,可能會更加努力。

假設你想學非洲的斯瓦希里語(Swahili),但在你還沒有機會學到之前,就被人問到:「usingizi 是什麼意思?」如果你的母語不是斯瓦希里語,恐怕不會知道正確答案,所以只好在得到正確答案「睡覺」前盡力去猜。

-----廣告,請繼續往下閱讀-----

這種運用測驗的方法看起來很糟,也與一般人對教育的看法背道而馳,畢竟你努力回答的東西根本還沒有學過。令人驚訝的是,這種「事前測驗」居然對學習非常有效。為什麼在還沒有機會學到正確答案之前,先讓你的大腦費力製造很可能是錯誤的答案,會是件好事呢?

一般的見解會認為,產生錯誤的資訊應該沒有效率,甚至適得其反,因為錯誤的資訊將導致競爭與干擾,而大多數的神經科學理論會預測,先給大腦正確的資訊無論如何都比較好。然而,給大腦機會主動掙扎,似乎能幫助我們學得更多,也讓資訊保留得更久。

記憶的科學:錯誤驅動型學習的突破

1992 年時,認知心理學家卡里爾(Mark Carrier)和帕什勒(Hal Pashler)提出一個吸引人的理論,解釋記憶的這類原則。在電腦科學領域裡,大家都知道機器遇到困難時能學到很多。現代人工智慧系統的骨幹是神經網路模型,這種模型透過嘗試錯誤來學習,方法是修改人工神經元之間的連結,藉此愈來愈善於得出正確答案。卡里爾和帕什勒認為,人類或許也是從這類錯誤驅動型學習中獲益。

為了探究人腦中如何發生測驗效應,我實驗室裡的科學家劉瀟楠(現為香港中文大學教授),研究生鄭奕聰、歐萊利還有我,使用我們的神經網路模型「盒子裡的海馬迴」來模擬測驗效應。

-----廣告,請繼續往下閱讀-----

當我們遵從記憶的標準理論,假定海馬迴會記錄所有進入的事情時,這個神經網路模型可以記憶新資訊,卻不善於保存已經學過的東西;模擬的結果與羅迪格和卡皮克的發現差不多(如同重複閱讀卻忘得多的學生)。當我們改變設定,納入錯誤驅動型學習時,海馬迴模型得到有效的提升。在干擾之下,它能學到更多資訊並加以保存。

當我們探究海馬迴模型的運作,可以發現測驗的好處並非來自犯錯本身,而在於強迫大腦去取出已經學過的東西。為了理解為什麼會這樣,先讓我們回到細胞群組的比喻。自我測驗時,大腦會嘗試給出正確答案,但結果不盡然完美。大腦會稍微掙扎,給出一個與學過的東西大致相符的答案。不過這個掙扎提供了很大的學習機會。

對記憶進行這種類型的壓力測試,可以暴露出細胞群組中較弱的地方,所以記憶可以據此進行更新,加強有用的連結,修剪掉沒有幫助的連結。與其一次又一次重複學習同樣的東西,不如採用更有效率的方式,也就是只修改我們感到困難的部分,再稍微鞏固正確的神經連結。關鍵在於記憶更新,因為讓大腦節省空間、快速學習最有效率的方法,是專注於我們不知道的部分。

雖然錯誤驅動型學習通常能為我們帶來好處,但是它有一個重要的邊界條件。如果你最後可以更接近正確答案,或至少可以排除錯誤答案,因而讓你有機會從錯誤中學習,錯誤驅動型學習才能奏效。如果你根本不知道自己哪裡弄錯,就無法從錯誤中學習。你想要的是努力挑戰,而不是漫無目標的失敗。所以學習衝浪

-----廣告,請繼續往下閱讀-----

這類複雜的技術才會如此困難,畢竟有太多事情同時進行,連在成功時知道自己哪裡做對、失敗時哪裡做錯都很困難。在這類情況中,專家的指引就非常有幫助,可以讓你知道該做什麼,也能針對你做對與做錯的地方給予回饋。

——本文摘自《記憶決定你是誰:探索心智基礎,學習如何記憶》,2024 年 7 月,天下文化,未經同意請勿轉載

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

天下文化_96
142 篇文章 ・ 623 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。

0

1
1

文字

分享

0
1
1
伺服器過熱危機!液冷與 3D VC 技術如何拯救高效運算?
鳥苷三磷酸 (PanSci Promo)_96
・2025/04/11 ・3194字 ・閱讀時間約 6 分鐘

-----廣告,請繼續往下閱讀-----

本文與 高柏科技 合作,泛科學企劃執行。

當我們談論能擊敗輝達(NVIDIA)、Google、微軟,甚至是 Meta 的存在,究竟是什麼?答案或許並非更強大的 AI,也不是更高速的晶片,而是你看不見、卻能瞬間讓伺服器崩潰的「熱」。

 2024 年底至 2025 年初,搭載 Blackwell 晶片的輝達伺服器接連遭遇過熱危機,傳聞 Meta、Google、微軟的訂單也因此受到影響。儘管輝達已經透過調整機櫃設計來解決問題,但這場「科技 vs. 熱」的對決,才剛剛開始。 

不僅僅是輝達,微軟甚至嘗試將伺服器完全埋入海水中,希望藉由洋流降溫;而更激進的做法,則是直接將伺服器浸泡在冷卻液中,來一場「浸沒式冷卻」的實驗。

-----廣告,請繼續往下閱讀-----

但這些方法真的有效嗎?安全嗎?從大型數據中心到你手上的手機,散熱已經成為科技業最棘手的難題。本文將帶各位跟著全球散熱專家 高柏科技,一同看看如何用科學破解這場高溫危機!

運算=發熱?為何電腦必然會發熱?

為什麼電腦在運算時溫度會升高呢? 圖/unsplash

這並非新問題,1961年物理學家蘭道爾在任職於IBM時,就提出了「蘭道爾原理」(Landauer Principle),他根據熱力學提出,當進行計算或訊息處理時,即便是理論上最有效率的電腦,還是會產生某些形式的能量損耗。因為在計算時只要有訊息流失,系統的熵就會上升,而隨著熵的增加,也會產生熱能。

換句話說,當計算是不可逆的時候,就像產品無法回收再利用,而是進到垃圾場燒掉一樣,會產生許多廢熱。

要解決問題,得用科學方法。在一個系統中,我們通常以「熱設計功耗」(TDP,Thermal Design Power)來衡量電子元件在正常運行條件下產生的熱量。一般來說,TDP 指的是一個處理器或晶片運作時可能會產生的最大熱量,通常以瓦特(W)為單位。也就是說,TDP 應該作為這個系統散熱的最低標準。每個廠商都會公布自家產品的 TDP,例如AMD的CPU 9950X,TDP是170W,GeForce RTX 5090則高達575W,伺服器用的晶片,則可能動輒千瓦以上。

-----廣告,請繼續往下閱讀-----

散熱不僅是AI伺服器的問題,電動車、儲能設備、甚至低軌衛星,都需要高效散熱技術,這正是高柏科技的專長。

「導熱介面材料(TIM)」:提升散熱效率的關鍵角色

在電腦世界裡,散熱的關鍵就是把熱量「交給」導熱效率高的材料,而這個角色通常是金屬散熱片。但散熱並不是簡單地把金屬片貼在晶片上就能搞定。

現實中,晶片表面和散熱片之間並不會完美貼合,表面多少會有細微間隙,而這些縫隙如果藏了空氣,就會變成「隔熱層」,阻礙熱傳導。

為了解決這個問題,需要一種關鍵材料,導熱介面材料(TIM,Thermal Interface Material)。它的任務就是填補這些縫隙,讓熱可以更加順暢傳遞出去。可以把TIM想像成散熱高速公路的「匝道」,即使主線有再多車道,如果匝道堵住了,車流還是無法順利進入高速公路。同樣地,如果 TIM 的導熱效果不好,熱量就會卡在晶片與散熱片之間,導致散熱效率下降。

-----廣告,請繼續往下閱讀-----

那麼,要怎麼提升 TIM 的效能呢?很直覺的做法是增加導熱金屬粉的比例。目前最常見且穩定的選擇是氧化鋅或氧化鋁,若要更高效的散熱材料,則有氮化鋁、六方氮化硼、立方氮化硼等更高級的選項。

典型的 TIM 是由兩個成分組成:高導熱粉末(如金屬或陶瓷粉末)與聚合物基質。大部分散熱膏的特點是流動性好,盡可能地貼合表面、填補縫隙。但也因為太「軟」了,受熱受力後容易向外「溢流」。或是造成基質和熱源過分接觸,高分子在高溫下發生熱裂解。這也是為什麼有些導熱膏使用一段時間後,會出現乾裂或表面變硬。

為了解決這個問題,高柏科技推出了凝膠狀的「導熱凝膠」,說是凝膠,但感覺起來更像黏土。保留了可塑性、但更有彈性、更像固體。因此不容易被擠壓成超薄,比較不會熱裂解、壽命也比較長。

OK,到這裡,「匝道」的問題解決了,接下來的問題是:這條散熱高速公路該怎麼設計?你會選擇氣冷、水冷,還是更先進的浸沒式散熱呢?

-----廣告,請繼續往下閱讀-----

液冷與 3D VC 散熱技術:未來高效散熱方案解析

除了風扇之外,目前還有哪些方法可以幫助電腦快速散熱呢?圖/unsplash

傳統的散熱方式是透過風扇帶動空氣經過散熱片來移除熱量,也就是所謂的「氣冷」。但單純的氣冷已經達到散熱效率的極限,因此現在的散熱技術有兩大發展方向。

其中一個方向是液冷,熱量在經過 TIM 後進入水冷頭,水冷頭內的不斷流動的液體能迅速帶走熱量。這種散熱方式效率好,且增加的體積不大。唯一需要注意的是,萬一元件損壞,可能會因為漏液而損害其他元件,且系統的成本較高。如果你對成本有顧慮,可以考慮另一種方案,「3D VC」。

3D VC 的原理很像是氣冷加液冷的結合。3D VC 顧名思義,就是把均溫板層層疊起來,變成3D結構。雖然均溫板長得也像是一塊金屬板,原理其實跟散熱片不太一樣。如果看英文原文的「Vapor Chamber」,直接翻譯是「蒸氣腔室」。

在均溫板中,會放入容易汽化的工作流體,當流體在熱源處吸收熱量後就會汽化,當熱量被帶走,汽化的流體會被冷卻成液體並回流。這種利用液體、氣體兩種不同狀態進行熱交換的方法,最大的特點是:導熱速度甚至比金屬的熱傳導還要更快、熱量的分配也更均勻,不會有熱都聚集在入口(熱源處)的情況,能更有效降溫。

-----廣告,請繼續往下閱讀-----

整個 3DVC 的設計,是包含垂直的熱導管和水平均溫板的 3D 結構。熱導管和均溫板都是採用氣、液兩向轉換的方式傳遞熱量。導熱管是電梯,能快速把散熱工作帶到每一層。均溫板再接手將所有熱量消化掉。最後當空氣通過 3DVC,就能用最高的效率帶走熱量。3DVC 跟水冷最大的差異是,工作流體移動的過程經過設計,因此不用插電,成本僅有水冷的十分之一。但相對的,因為是被動式散熱,其散熱模組的體積相對水冷會更大。

從 TIM 到 3D VC,高柏科技一直致力於不斷創新,並多次獲得國際專利。為了進一步提升 3D VC 的散熱效率並縮小模組體積,高柏科技開發了6項專利技術,涵蓋系統設計、材料改良及結構技術等方面。經過設計強化後,均溫板不僅保有高導熱性,還增強了結構強度,顯著提升均溫速度及耐用性。

隨著散熱技術不斷進步,有人提出將整個晶片組或伺服器浸泡在冷卻液中的「浸沒式冷卻」技術,將主機板和零件完全泡在不導電的特殊液體中,許多冷卻液會選擇沸點較低的物質,因此就像均溫板一樣,可以透過汽化來吸收掉大量的熱,形成泡泡向上浮,達到快速散熱的效果。

然而,因為水會導電,因此替代方案之一是氟化物。雖然效率差了一些,但至少可以用。然而氟化物的生產或廢棄時,很容易產生全氟/多氟烷基物質 PFAS,這是一種永久污染物,會對環境產生長時間影響。目前各家廠商都還在試驗新的冷卻液,例如礦物油、其他油品,又或是在既有的液體中添加奈米碳管等特殊材質。

-----廣告,請繼續往下閱讀-----

另外,把整個主機都泡在液體裡面的散熱邏輯也與原本的方式大相逕庭。如何重新設計液體對流的路線、如何讓氣泡可以順利上浮、甚至是研究氣泡的出現會不會影響元件壽命等等,都還需要時間來驗證。

高柏科技目前已將自家產品提供給各大廠商進行相容性驗證,相信很快就能推出更強大的散熱模組。

-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

鳥苷三磷酸 (PanSci Promo)_96
223 篇文章 ・ 313 位粉絲
充滿能量的泛科學品牌合作帳號!相關行銷合作請洽:contact@pansci.asia