0

32
4

文字

分享

0
32
4

人海中注意你的聲音、喧鬧中聽見我的名字:認識雞尾酒會效應

雅文兒童聽語文教基金會_96
・2021/05/24 ・3028字 ・閱讀時間約 6 分鐘

  • 文 / 李翊瑞|雅文基金會聽語科學研究中心研究助理

在一場雞尾酒會上,有著豐盛的佳餚,以及來自四面八方的賓客。你與三五好友們正享受著派對的氣氛,開心地閒聊彼此的生活。儘管環境中充滿各式各樣的聲音—空調運行的風聲、會場的背景音樂、以及隔壁桌的談笑聲,似乎一點也不打斷你們之間交談的樂趣。然而,當你正專注地和眼前的朋友聊天,並聊得渾然忘我時,另一位好友在遠方呼喚你的名字,你卻能馬上回過頭去尋找聲音的來源,究竟是怎麼辦到的呢?

身處在派對的吵雜的環境中,我們卻能盡情地與朋友們把酒言歡,彷彿一點也不受干擾。圖/Pexels

左耳進,左耳出?雞尾酒會效應的發現

前面所提到的現象稱為雞尾酒會效應(cocktail-party effect),指的是在環境中其他對話或噪音干擾的情況下,選擇性聆聽特定聲音的能力[1]。雞尾酒會效應最早是由英國認知科學家 Colin Cherry 於 1953 年提出[2],有趣的是,Cherry 在進行研究時,並沒有舉辦或者參加了很多場雞尾酒會,而是設計了一項名為跟讀(shadowing)的實驗。

在跟讀實驗中,受試者會載上耳機,左耳及右耳會聽到完全不同的句子,且聽到的當下必須馬上複誦其中一耳所聽到的內容。例如當被要求複誦「右耳」所聽到的內容,而左耳聽到「在她的野餐籃裡,有著花生醬、三明治……」,右耳聽到「有隻小貓正在追著老鼠…」時,受試者就必須即時回答「有隻小貓正在追著老鼠……」。實驗結果發現[2],多數的受試者都能正確跟讀某一耳所聽到的語句,並忽略另一耳的訊息,顯示注意力(attention)似乎能選擇性地投入某個事物上。

在跟讀實驗裡,雙耳會分別呈現不同的訊息,而受試者必須注意聆聽並覆誦其中一隻耳朵聽到的內容。圖/雅文基金會

是誰在呼喚我?刻在心底的名字

然而,當受試者正聚精會神地聆聽與複誦右耳的句子時,未受注意的左耳所聽到的內容,真的就如同耳邊風一樣,完全沒有進入大腦的處理歷程嗎?其實,有部分的訊息依然可以被我們的大腦所處理。

-----廣告,請繼續往下閱讀-----

在剛剛所提到的實驗中,Cherry 指出受試者雖然很難回答出未受注意一耳的語句內容,卻能察覺到訊息在語音性質上的變化—像是從句子變成單音,或是從男性的聲音變成女性的聲音[2]。更特別的是,後續研究發現當未受注意的一耳出現自己的名字時,受試者也能即時察覺,並將注意力轉移到原本未受注意的一耳[3]。而這種聽到自己名字的現象不僅出現在成人,甚至在五個多月大的嬰兒身上就能觀察到[4]

聽覺注意力的調節水閥,訊息被減弱但不消失

即使我們特別去注意某些訊息,並忽略環境中的其他刺激,仍然有部分訊息會被大腦所處理。不論是前面所提到的語音性質變化、或是自己的名字,雞尾酒會效應顯示了訊息的處理似乎不是依循全有或全無的原則(all-or-none law):接收應注意的訊息,並過濾或排除掉所有不需注意的訊息。

為了進一步解釋此現象,英國心理學家 Anne Treisman 提出了注意力的減弱模型(attenuation model[5,6]—這個模型主張注意力系統分為四個階段:感官收錄(sensory register)、減弱控制(attenuation control)、知覺歷程(perceptual process)和短期記憶(short-term memory),其中最特別的就是「減弱控制」這個部分。

減弱控制就像是調節訊息的水閥,那些未受注意的訊息,由於和當下正在進行的任務無關(如跟讀作業),而轉為減弱的狀態存在於系統中。最後,被減弱的訊息會進入短期記憶,再依據各個訊息的閾值(threshold)高低而被受試者察覺。閾值可以想像成是個門檻,不同的訊息有不同的門檻,而門檻越低越容易被覺察。像是自己的名字由於閾值較低,因此我們很容易就能注意到;相反的,一些不常聽到的字詞,因為閾值較高而較難被察覺[6]

-----廣告,請繼續往下閱讀-----
在 Treisman 的減弱模型中,未受注意的訊息以「減弱」的狀態存在,而非完全被注意力系統排除。圖/Sternberg et al., 2012

用對方法,背景噪音不干擾

「對不起,你剛說什麼?」、「麻煩你說大聲一點」在日常生活中,是不是常常聽到這些話呢?當環境中充斥著各種噪音時,我們能不能主動採取一些策略,讓對方的聲音變得更清楚呢?假如你正打算參加一場派對、或是到一間人聲嘈雜的餐廳,以下三個方法將更有助於你把注意力焦點放在眼前的對話,而不被環境的噪音輕易打斷[1,7]

  1. 留意目標聲音的特性

留意目標說話者一些明顯的聲音特性(像是阿霞有煙嗓,聲音低沉充滿磁性,講話慢慢的),能有效降低鄰近對話內容的干擾。

  1. 提升對話的音量

隨著對話音量的提升,環境中的其他聲音轉為背景音,使對話內容變得更為突出。

  1. 尋找聲音的來源處

不論是眼前的對話,或者是環境中的其他對話或雜音,若能清楚各個聲音的來源(如前後、左右或遠近位置),更有助於將注意力集中在目標來源上。就像坐在咖啡廳突然聽到情侶吵架聲,在定位他們的位置後,通常偷聽起來就會更輕鬆。

-----廣告,請繼續往下閱讀-----

Google AI 新應用,讓機器模仿人類的雞尾酒會效應

在吵雜環境中,將注意力集中在特定的目標上,藉以分辨不同的聲音內容,是人類與生俱來的能力;然而,這件事情對於機器來說卻顯得格外的困難,原因在於當多人同時說話時,混雜的音訊會影響單一人聲的辨識效果。不過,隨著科技的進步,人工智慧技術(artificial intelligenceAI)的發展,現在機器也能辦到同樣的事情!

由 Google 研發團隊結合 AI 所打造的視聽語音分離模型 (audio-visual speech separation model)能夠有效地增強特定說話者的聲音,同時降低環境中其他人聲或雜音干擾[8]。這套系統獨特的地方,在於它能夠同時分析視覺特徵和語音訊息,判讀說話者的嘴型與聲音的變化,建立人與聲音之間的對應關係[9]

這項技術的發展,未來也可望應用在許多領域上:像是在多人對話的影片中,提升自動化字幕生成的正確率。另一方面,也可以用來提升助聽輔具的表現,幫助聽損人士即使身處在吵雜環境中,依然能夠聽到清晰的人聲。

Google 所開發的視聽語音分離模型,能同時判讀視覺(嘴型)與聽覺(語音)特徵,進而獨立出特定說話者的聲音。圖/Ephrat et al., 2018

雞尾酒會效應揭開了注意力系統的奧妙,使我們能在吵雜環境中去關注重要的訊息。瞭解了越多相關的原理與應用後,不妨想想日常生活中還有哪些雞尾酒會效應吧!

-----廣告,請繼續往下閱讀-----

參考資料

  1. Sternberg, R. J., Sternberg, K., & Mio, J. S. (2012). Cognitive Psychology. Wadsworth/Cengage Learning.
  2. Cherry, E. C. (1953). Some experiments on the recognition of speech, with one and with two ears. The Journal of the Acoustical Society of America, 25(5), 975–979.
  3. Moray, N. (1959). Attention in Dichotic Listening: Affective Cues and the Influence of Instructions. Quarterly Journal of Experimental Psychology, 11(1), 56–60.
  4. Newman R. S. (2005). The cocktail party effect in infants revisited: listening to one’s name in noise. Developmental Psychology41(2), 352–362.
  5. Treisman A. M. (1964). Monitoring and storage of irrelevant messages in selective attention. Journal of Verbal Learning and Verbal Behavior, 3(6), 449–459.
  6. Treisman A. M. (1969). Strategies and models of selective attention. Psychological Review76(3), 282–299.
  7. Brungart, D. S., & Simpson, B. D. (2007). Cocktail party listening in a dynamic multitalker environment. Perception and Psychophysics, 69(1), 79–91.
  8.  Mosseri, I., & Lang, O. (2018, April 11). Looking to Listen: Audio-Visual Speech Separation. Google AI Blog.
  9. Ephrat, A., Mosseri, I., Lang, O., Dekel, T., Wilson, K., Hassidim, A., Freeman, W. T., & Rubinstein, M. (2018). Looking to listen at the cocktail party. ACM Transactions on Graphics, 37(4), 1–11.
文章難易度
雅文兒童聽語文教基金會_96
55 篇文章 ・ 222 位粉絲
雅文基金會提供聽損兒早期療育服務,近年來更致力分享親子教養資訊、推動聽損兒童融合教育,並普及聽力保健知識,期盼在家庭、學校和社會埋下良善的種子,替聽損者營造更加友善的環境。

0

0
0

文字

分享

0
0
0
AI 生成影像有多接近真實世界?人類將製造出世界模擬器?
泛科學院_96
・2024/04/22 ・670字 ・閱讀時間約 1 分鐘

Sora 號稱自己是世界模擬器,但真的嗎?

這個問題,AI 大佬與研究者們比你更關心!

Sora 推出後不到一個月,不僅各大研究機構像開掛般發表相關論文,連 Nvidia、Meta、微軟,甚至是特斯拉創辦人 Elon Musk 也都跳出來分享看法⋯⋯

今天呢,我們從論文與 AI 大佬們的意見,來回答這兩個問題:

-----廣告,請繼續往下閱讀-----
  1. 為什麼 Sora 敢稱自己是世界模擬器?
  2. 世界模擬器離我們還有多遠?

說了那麼多,最後想問各位,你覺得照這個速度發展下去,你覺得會先成真呢?

  1. 通用型人工智慧
  2. 人類移民火星
  3. 都看不到,人類要滅亡了

歡迎在下面留言大家分享討論。喜歡這支影片的話,也別忘了按讚、訂閱,加入會員,下集再見~掰!

更多、更完整的內容,歡迎上科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

泛科學院_96
31 篇文章 ・ 40 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

1
0

文字

分享

0
1
0
可以瑟瑟!AI 陪伴使用心得——我的 AI 女友有點危險?
泛科學院_96
・2024/04/21 ・963字 ・閱讀時間約 2 分鐘

任何新科技誕生,人們總會問:「可以拿來瑟瑟嗎?」

AI 也不例外,在去年 AI 浪潮中,「AI 女友」,或者說「AI 陪伴」,也如雨後春筍般出來。

從去年六月開始,加密創投傳奇 A16z 就不斷宣揚 AI 陪伴是趨勢,這東西有搞頭阿!還順勢在 GitHub 上分享自己開發的 AI 陪伴服務。

不過,我更在意的是 A16z 年初分享的 AI 陪伴工具圖!這裡的英文字母(NSFW)引起我高度的興趣,因此稍微探索了一下。所以今天呢,就來分享使用第一象限服務的心得……

-----廣告,請繼續往下閱讀-----

額……會被黃標?剪輯說所有素材都要上馬賽克?

蛤?這集居然能接到業配?廠商爸爸會罵?

恩……好,所以今天,我們來聊三件事:

  1. A16z 這張圖除了第一象限,還說了什麼未來趨勢?
  2. 推出 firefox 的 Mozilla 基金會對 AI 陪伴提出的警告
  3. 「AI 陪伴」真的有助於心理健康嗎?

如果你想來點刺激的,請自己探索第一象限,我幫不了你,但也麻煩看完 Mozilla 對 AI 交友提出的警告再行動。廢話不多說,讓我們開始吧~

-----廣告,請繼續往下閱讀-----

總之,使用 AI 陪伴服務的時候,我們建議妳參考Mozilla基金會的建議,我把中文翻譯放在這,希望能幫助到想用 AI 女友的人。

然後我回頭看了一下我有用過的 AI 女友,好像都蠻危險的……就不推薦各位去用了,自己斟酌。

最後,我們把兩方對 AI 陪伴的觀點與資訊放在這裡。因為我只研究 AI 女友,如果你想要看 AI 男友的測試,這個……給我一點時間。

也想問問大家,你覺得未來 AI 陪伴會怎麼發展?

-----廣告,請繼續往下閱讀-----
  1. 我就是要瑟瑟,A16z 的藍圖一定會成真
  2. 有太多問題了,AI 陪伴市場會泡沫
  3. 最終我們都會有一個 AI 伴侶,但不是現在看到的服務模式
  4. 其他,也歡迎留言分享喔


有想要看的 AI 測試或問題,也可以在下面敲碗留言!

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
31 篇文章 ・ 40 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!

0

0
0

文字

分享

0
0
0
【suno AI】五音不全也沒關係,讓 AI 幫你唱歌!這些 AI 是怎麼做到音樂生成的?
泛科學院_96
・2024/04/18 ・459字 ・閱讀時間少於 1 分鐘

-----廣告,請繼續往下閱讀-----

不知道大家有沒有被傳說中的OO緊縮術攻擊,總之小編是中招了。

有時候一個人上網也是挺無助的,手足無措的我就想了解一下歌曲生成的魔法是怎麼出現的。

今天就讓我們來評測一下線上歌曲生成的服務,順便說說這些聲音生成是怎麼做出來的。

廢話不多說,讓我們開始吧!

-----廣告,請繼續往下閱讀-----

你有用過什麼更好笑,更好用的 AI 音樂生成工具呢?

我們最近有在研究怎麼用 AI 剪片,還有……AI 女友。

想看剪片的打+1,想看女友的打 <3

有其他想要看的 AI 測試或相關問題,也可以留言分享喔!

-----廣告,請繼續往下閱讀-----

更多、更完整的內容,歡迎上泛科學院的 youtube 頻道觀看完整影片,並開啟訂閱獲得更多有趣的資訊!

討論功能關閉中。

泛科學院_96
31 篇文章 ・ 40 位粉絲
我是泛科學院的AJ,有15年的軟體測試與電腦教育經驗,善於協助偏鄉NPO提升資訊能力,以Maker角度用發明解決身邊大小問題。與你分享人工智慧相關應用,每週更新兩集,讓我們帶你進入科技與創新的奇妙世界,為未來開啟無限可能!