Loading [MathJax]/extensions/tex2jax.js

0

7
0

文字

分享

0
7
0

為什麼有那麼多的語言都叫母親為 mama,父親為 papa?

活躍星系核_96
・2018/09/28 ・3725字 ・閱讀時間約 7 分鐘 ・SR值 499 ・六年級

  • 文/大家的語言學│在科技業闖蕩的語言學人,有感於社會大眾對於語言學的誤解,因此致力於將語言學知識科普化,帶領你發掘生活中無所不在的語言學大小事。

為什麼有那麼多的語言,都要叫母親為 mama、父親為 papa? 這一切都只是巧合嗎? 或是其中有什麼樣的語言秘密呢? 今天我們要為各位解開,mama/papa 這兩個詞產生的謎題。

到底有多少語言稱母親為 mama、父親為 papa? 語言學家 George P. Murdoch 曾經調查了 470 個語言,發現這些語言中稱呼母親的詞,有 52% 都含有 ma、me、或是 mo 的音,稱呼父親的詞則只有 15% 含有 mame、或是 mo。他進一步發現,這些語言中用來稱呼父親的詞,有 55% 是含有 papotato 的音,但稱呼母親的詞僅有 7% 含有 papotato 的音。下方這張圖列出部分語言為例,我們確實發現,稱母親的詞,幾乎都含有 ma 的音,稱父親則多半有 pata 的音。

語言中母親、父親的說法。圖/作者提供。

假設 mama/papa 存在於原始語言中

語言學家首先假設,人類在很久很久之前,曾經有一個共通語,之後所有的語言都是從這個共通語發展而來。至於這個共通語到底是多久以前的語言,目前沒有人知道,只能假設或許在 10 萬年前的智人時代(Homo sapiens)就已存在 。截至目前為止,因為印歐語系(Indo-European)是語言學家研究最廣泛、深入的語系,於是,語言學家根據比較語言學的方式,建構了假想的原始印歐語(Proto-Indo-European),這也是目前語言學家所建構出印歐語系各個語言的共同祖先。

那麼,我們就假設 mama/papa 在原始印歐語就已經存在,並且流傳至今吧!這個假設看起來很完美:「很久很久以前,人類有一個最早的語言,這個語言叫母親為 mama,父親為 papa,並且流傳至今」。

-----廣告,請繼續往下閱讀-----

但實際上語言學有個的重要概念,會推翻這個假設。在這之前,我們先來看看一個和 mama 的語意類似的詞──代表女性的 「woman」。以下我們列出在七個不同印歐語系中,代表 woman 的詞:

Woman在不同印歐語系語言的詞彙。圖/作者提供。

上方這些語料都是屬於印歐語系的語言。當我們試著找出這些詞的源頭, 我們發現各個印歐語言代表 「woman」的詞彙都不一樣,有些甚至差異甚大,已經很難推論在原始印歐語中,「woman」這個詞究竟是長什麼樣子。

然而,還是有語言學家很努力的用比較語言學的方法,推斷 「woman」在原始印歐語的形式是: ∗gwena。看到這裡,我們發現在上表這七個印歐語系中,已經很難找出和 ∗gwena 共同的語言特徵了。因為語言經過幾千年的演變,字型、語意、讀音可能都已經改變了。

這裡帶出來的語言學重要概念是:語言會不停地改變。假設在 mama/papa 這兩個詞在原始語言就已經存在,那麼,我們現在看到代表母親/父親的詞,就絕對不會是 mama/papa,因為,語言是一直在變的,不可能經過幾千年都沒有任何變化。

-----廣告,請繼續往下閱讀-----

不斷演變的語言,不停轉換的語音

麻麻~麻麻。圖/《蠟筆小新》via imdb

以日文為例,現代日語稱母親為 haha,但根據歷史語言學家的研究,現代日語 /h/ 這個音,是從古日語(Old Japanese)的 */p/ 轉換而來。也就是說,母親在古日語的念法是 ∗papa;值得注意的是,這樣的演變才經過幾個世紀而已。也就是說,短短幾個世紀就有這樣顯著的音變,如果我們假設 mama/papa 存在數千了前的原始語,那麼字型、語義、讀音不可能維持和現在完全一樣。

更有趣的是,有些語言開始出現 mama/papa 的用法,但這些語言中傳統稱呼母親/父親的詞也仍存在著。也就是說這些語言有傳統代表母親/父親的詞,卻也新產生 mama/papa,使得傳統用法和新用法共存(如下表法語和義大利語為例)。這樣一來,我們假設 mama/papa 是存在於原始語言的說法,就無法成立了。

說到法文的 papa,筆者想到了一段有趣的影片,提供給各位觀賞:

在前面,我們假設 mama/papa 這兩個詞是從古老的原始語就存在了,因此,許多語言至今都還保留這樣的用法。這個假設看似完美,但實際上語言是會改變的,我們舉了古日語和現代日語的例子,才經過幾個世紀的時間,就有讀音從 /p/ 變成  /h/ 的音變現象,更何況是假想中幾千年前的原始語呢? 很可能拼法和讀音都會變化得完全不一樣了。

-----廣告,請繼續往下閱讀-----

來自小孩的第一個發音:mama/papa

「呀語時期」的兒童,開始發出成人可以辨識的音。 圖/balouriarajesh @pixabay

那麼,mama/papa 究竟是從何而來?我們將根據語言學家 Jakobson 的分析,提供一個大多數人都同意的答案。Jakobson 可說是研究兒童語言習得的先驅,根據他的論述,mama/papa 這兩個詞很有可能是小孩的父母親創造的。

首先,我們先簡單介紹兩個兒童語言習得的階段:咕咕時期 (cooing)和 呀語時期 (babbling)。

  • 兒童在大約一個月大時,進入所謂的「咕咕時期(cooing)」,這個階段的嬰兒會開始發出一些聲音,但這些聲音是無法判別語意的,因此父母親不會認為他們的小孩是在說話。
  • 從三到四個月開始,進入了「呀語時期 (babbling)」,到了這個階段的兒童,開始發出成人可以辨識的音,包含一些母音和子音,且會慢慢出現重複音節的音。

我們假設有個小女孩名叫艾瑪,當她進入了呀語時期,開始發出他的父母熟悉且可以辨識的音。奇妙的事情在「呀語時期 (babbling)」這個階段發生了,她的父母親會認為,艾瑪開始在跟他們說話。但實際上,呀語時期這個階段對於艾瑪來說,主要是在練習發音器官,而不是在和大人對話;不過欣喜若狂的父母可不是這麼想,他們會很自然地認為,艾瑪是在跟他們對話。

那麼,艾瑪最有可能發出的第一個可辨識的音是什麼?這就與發音的困難度有關了,分成子音和母音來看,最容易發的母音是 [a],因為你只要張開嘴巴、震動聲帶、送出氣流,音就發出來了,舌頭和嘴唇幾乎都不用動;子音則是 [m]、[b]、 [p]。

-----廣告,請繼續往下閱讀-----

因此,[ma]、[pa]、[ba] 可說是最容易產生的發音組合。

「叫 mama、叫 papa」就是常見的父母親和小孩的 baby talk。圖/balouriarajesh @pixabay

當小孩發出 mama 的音時,母親會很興奮的認為小孩在與他互動,並且認為小孩是在叫她,而不是在叫家裡的狗、桌上的食物等。接著,母親就會開始認為,這是他的小孩所說的第一個字,「叫 mama、叫 papa」就是常見的父母親和小孩的 baby talk。

接下來, mama/papa 這兩個詞會開始擴展,艾瑪的父母會向他的親戚好友說:「我的艾瑪會開始叫 mama/papa 囉」,於是 mama/papa 開始代表著父親和母親的意思,而不是特定指瑪的父親和母親。這是一個重要的轉折點,代表詞彙開始進入這個語言的系統裡,社會上越來越多人這樣使用。當艾瑪長大後,她也會知道 mama/papa 代表所有的父親和母親。

Jakobson 所提出來的這個解釋,還能夠幫助我們釐清為什麼有些語言中,父親叫 mama、母親叫 papa

-----廣告,請繼續往下閱讀-----

喬治語 (Georgian)就是一個例子, 叫母親為 deda、父親為 mama,和大多數的語言正好相反。若用語言習得的角度來解釋,子音 [d] 也是屬於容易發出的音,所以有可能是因為喬治亞語在一開始有小孩在「呀語時期 」所發出的第一個音是 deda,於是他的母親認定 deda 就是她的寶貝在叫她;無獨有偶,恰好也有不少的喬治亞孩童的第一個發音也是 deda,慢慢地詞彙經過無數次的使用後,從此 deda 就進入了喬治亞語的系統,代表母親。

取自 Google 翻譯:喬治亞文的 deda 代表母親,mama 則代表父親。

行文到此,我們對這個主題做個總結:

  1. 語言是會改變的。原始語的文字拼法、發音,經過了幾千年的時間,可能都改變了好幾次,因此,要從目前的 mama/papa 去推判其原始語,非常不容易(且前提是假設真的有原始語)。
  2. 此外,有些語言的父親叫 mama,母親叫 papa,假設我們真的找到了原始語中的 mama/papa,該怎麼解釋這些用法剛好相反的例子?
  3. 若從兒童語言習得的角度來探討,兒童第一個發出的可辨識音節,通常是比較容易發出來的音;再加上父母親賦予  mama/papa 的語意,透過語言擴張、約定俗成後,就慢慢地進入語言系統。這就是為何有那麼多的語言都有 mama/papa 這兩個詞彙。

下回當你聽見有小孩在叫 mama/papa 時,相信也能會心一笑,體驗語言發展的魅力。

備註:依歷史語言學的慣例,未證實的形式會以星號標記岀來,例如本文的 ∗gwena “woman” 或 */p/ 是經語言學家推測,但目前仍無法證實的形式。

-----廣告,請繼續往下閱讀-----
  • Jakobson, R. (1962) “Why ‘mama’ and ‘papa’?” In Jakobson, R. Selected Writings, Vol. I: Phonological Studies, pp. 538–545. The Hague: Mouton
    Where do mama/papa words come from?

本文轉載自大家的語言學,原文為《為什麼有那麼多的語言都叫母親為mama, 父親為papa?(上)》《為什麼有那麼多的語言都叫母親為mama, 父親為papa?(下)》

 

-----廣告,請繼續往下閱讀-----
文章難易度
活躍星系核_96
778 篇文章 ・ 128 位粉絲
活躍星系核(active galactic nucleus, AGN)是一類中央核區活動性很強的河外星系。這些星系比普通星系活躍,在從無線電波到伽瑪射線的全波段裡都發出很強的電磁輻射。 本帳號發表來自各方的投稿。附有資料出處的科學好文,都歡迎你來投稿喔。 Email: contact@pansci.asia

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

2

1
0

文字

分享

2
1
0
語言也是一種證據!南島語族發源地竟在臺灣?——專訪語言學研究所張永利研究員
研之有物│中央研究院_96
・2023/08/27 ・4908字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|田偲妤
  • 美術設計|蔡宛潔

南島語族的起源與變遷

南島語族發源自何方?是學界長期探索的焦點,在眾多研究領域中,語言學界為分布在南太平洋與印度洋諸島的族群確立關係,分類命名為南島語族(Austronesian-speaking peoples) 。除此之外,還有許多語言證據指出,南島語族可能是從臺灣擴散出去。中央研究院「研之有物」專訪院內語言學研究所張永利研究員,為我們深入分析,臺灣南島語保存哪些其他南島語「丟失的現象」,可以藉此重建南島語族的發展源頭與遷徙路徑。

嘉義阿里山鄉新美國小學生獻唱鄒族古謠。圖|Wikimedia

南島語族的發源地究竟在何方?目前已有越來越多證據指出,南島語族可能是從臺灣出發,遷徙至廣大的南太平洋與印度洋島嶼開枝散葉。

考古學家在臺灣、呂宋島、大洋洲等地出土相似的陶器碎片,經年代鑑定後發現,最早的繩紋紅陶陶器來自 5、6 千年前的臺灣大坌坑文化。植物學家則對各地的構樹樣本進行分子親緣分析,發現南太平洋島嶼的構樹應源自臺灣,推測先民帶著樹皮衣材料構樹,自臺灣遷徙至南太平洋諸島。

除了上述證據,還有一樣活在生活周遭的非物質遺產,能作為南島語族「出臺灣說」的有力證據,那就是臺灣原住民族正在使用的「語言」!

-----廣告,請繼續往下閱讀-----

中研院語言學研究所是研究與推廣「臺灣南島語」的重要基地,走進語言所典藏豐富研究著作的展覽室,投身臺灣南島語研究近 30 年的張永利研究員,與我們熱情分享語言學家的工作。

各地南島語言的特徵與變遷,是語言學家長期探索的問題,多年來一位位研究者深入原住民族部落,用羅馬拼音一字一句記錄部落長者的口語發音,經由比較臺灣與其他地區南島語言的關連與特徵,南島語族的發展源頭與遷徙路徑就在歷代語言學家的重建下現形。

中研院語言學研究所張永利研究員,投身南島語言研究近 30 年,與我們熱情分享語言學家的工作。圖|研之有物

如何確定臺灣南島語更接近原始南島語?同源詞繁簡成線索

南島語族是總人口數近 4 億人的龐大族群,其分布範圍北到臺灣、南到紐西蘭、東到復活節島、西到馬達加斯加。臺灣是南島語族分布的最北界,目前官方認定的原住民族共有 16 族,每個族群都有自己的語言,在整個南島語族 10 個主要語言分支中,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。

南島語族 10 個主要語言分支,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。圖|研之有物    資料來源|Blust, 1999: 45

「曾有外國學者讚嘆:南島語言是上帝送給臺灣的禮物!」張永利逐步分析臺灣南島語的珍貴之處:「考古和語言證據推估,臺灣南島語至少有 5 千年歷史,而麻六甲海峽附近國家使用的馬來語只有 2 千多年而已。此外,臺灣南島語還保留一些其他語言丟失的現象。」

-----廣告,請繼續往下閱讀-----

所謂「丟失的現象」正是語言學家證實臺灣南島語較古老、可能是南島語族早期祖居地的關鍵證據。藉由歷史語言學方法比較南島語言之間的親緣關係與發展先後,丟失的現象慢慢浮現,成為值得研究的案例。

首先,語言學家特別構擬出一套「原始南島語」作為比較標準,音韻、構詞、句法越接近原始南島語者,就越有可能是族群發源地。

要構擬出原始南島語並不簡單,語言學家無法穿越時空回到 5 千年前,必須集結全球語言學家的力量,深入各個南島語族聚落採集語言材料,再從中找出語音、語意相似的「同源詞」做比較。由於語言變化的過程經常發生「由繁趨簡」現象,因此發音越複雜的語言通常越古老,語言學家再從較古老的語言構擬出原始南島語。

張永利舉同源詞「眼睛」為例,說明臺灣南島語較為古老的原因。眼睛的原始南島語是「maCa」(大 C 的發音為 ts 複合音,同注音符號ㄗ),而臺灣的排灣語是「maca」,其發音與原始南島語相同。

再看看馬來語的眼睛是「mata」,ts 複合音明顯簡化成 t,發生語言「由繁趨簡」的現象,證明臺灣南島語比馬來語更古老。

-----廣告,請繼續往下閱讀-----
從同源詞「眼睛」的語音變化可發現,排灣語、鄒語較接近原始南島語,而賽夏語、馬來語的發音出現簡化現象,從中可看出族群發展的先後順序。圖|研之有物    資料來源|張永利

張永利進一步解釋,為何「由繁趨簡」現象可看出語言發展的先後順序:「有人可能會質疑,為什麼語言不是從簡單變複雜,發音由 t 變成 ts?如果是這樣你要解釋,多出來的 s 音是怎麼無中生有。這就如同人類社會的變遷,從複雜變簡單通常有跡可循,但無中生有需要創新的力量,從來不是簡單的事。」

這些語言有畫面!從同源詞推測千年前的生活型態

同源詞還可以重建南島語族原初的生活環境。根據語言學家的觀察,能成為同源詞的單字通常是日常使用的基本詞彙,例如爸爸、媽媽等親屬稱呼、數字 1 到 10,或是眼睛、頭、手、腳等身體部位。

因此,如果還能發現動物、植物、生活器具的同源詞,代表這些事物是曾經長時間存在的文化,才得以跨越千年時空在語言中留下印記,成為一窺南島語族原初生活環境的線索。

語言學家從原始南島語、原始排灣語、原始泰雅語、原始鄒語彙整出 100 個基本同源詞,當中包含許多指稱農作物、野生動植物、生活日用品的字詞:

-----廣告,請繼續往下閱讀-----
原始南島語同源詞反映之自然與文化特徵。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 17-22

從上述同源詞可推測,原始南島語族應該是以稻作維生,擅長紡織與編織技藝,生活周遭可見「露兜樹、甘蔗、藤」、「河鰻、田鼠、蒼蠅」等主要分布在亞熱帶地區的動植物。這些同源詞所反映的自然與文化特徵,對解答南島語族發源地問題具有相當大的啟發。

此外,從某些同源詞的語意轉變還可看出指稱的是外來事物。例如鄒語的「水牛」叫作「’ua chumu」,「chumu」是指「水」,但「’ua」最初並不是指「牛」,其真正的意思是「鹿」。換句話說,水牛應該是外來物種,推測鄒族先民看到外來的牛,跟鹿一樣都是四隻腳的大型哺乳類動物,因而發生「指鹿為牛」的情形。

講話講重點!第一個字就表明重點的「焦點系統」

除了從同源詞可以證明臺灣南島語較接近原始南島語,語言學家還發現,比起其他地方的南島語言,臺灣南島語保存最完整的「焦點系統」。這是一種非常古老的文法,在世界其他語言中並不常見。

焦點系統是用來凸顯一句話中想要強調的焦點,主要分成主事、受事、處所、工具共 4 種焦點,每種焦點都有相對應的動詞詞綴變化,並會在重點字詞前方加上格位標記 a。

-----廣告,請繼續往下閱讀-----

由於南島語言習慣將動詞置於句首,等於你聽到第一個字就知道說話者想強調什麼。以下為 4 種焦點在排灣語的使用方式:

排灣語焦點系統應用,句首動詞 qaljup(打獵)會因應不同焦點而加上不同詞綴,焦點前方也會加上格位標記 a 來指稱重點。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 8

古老的修飾用語:副動詞

最後一個臺灣南島語較為古老的證據在於,其詞類相當有限,主要是動詞、名詞的應用,沒有真正的副詞、形容詞等修飾詞。但是當有需要用到修飾用語時該怎麼辦?這就輪到特殊的「副動詞」登場!

副動詞顧名思義是指:具副詞作用的動詞,是臺灣南島語經常使用的詞類。張永利秀出排灣語和馬來語的句子,進一步說明副動詞與一般副詞的不同:

圖|研之有物    資料來源|張永利

排灣語的「g<em>alju」就是一個副動詞,意思是「慢」,之所以看出它是一種動詞,關鍵在於它跟後頭表示「吃」的動詞「k<em>an」有一樣的詞綴變化「em」。而中間的連繫詞 a 亦可應證「g<em>alju」與「k<em>an」應同屬於動詞。此外,「g<em>alju」的後面連接附著代詞「aken」表示「我」的意思,附著代詞一般會貼在動詞上。

-----廣告,請繼續往下閱讀-----

值得注意的是,古老的副動詞在臺灣南島語言普遍保留下來,但是在臺灣之外的南島語言,如馬來語,卻通常都已經丟失。

綜上所述,從同源詞複雜度、焦點系統完整性、使用詞類有限等語言證據可知,臺灣南島語在目前已知的上千種南島語中,其古老排名可說名列前茅,也代表臺灣可能是南島語族早期的祖居地。

張永利表示:「綜合歸納現在的語言和考古證據,我們可以畫出南島語族遷徙路徑,基本上是從臺灣遷徙出去,先遷往菲律賓群島,再往南到婆羅州一帶,隨後一分為二,分別往東方太平洋和西方印度洋遷徙。」

南島語族遷徙路徑。圖|研之有物    資料來源|Bellwood, 2011

用「說」的文化資產——母語

對張永利來說,越深入研究就越能體會,臺灣南島語真的是臺灣千年不墜的國寶!除了持續在學界發表臺灣南島語的概念運用規則,張永利也會到原住民部落推廣族語,多年來也跟國內語言學家一起編寫鄒語、噶瑪蘭語、賽德克語等族語教科書。

張永利研究員持續研究臺灣南島語的概念運用規則,多年來編寫多本族語教科書,更前往部落推廣族語。圖|研之有物

在與族人互動的過程中,張永利發現,年輕族人為了溝通方便,有簡化族語的傾向,以致某些傳統用語漸漸流失。

-----廣告,請繼續往下閱讀-----

以鄒語為例,傳統上在說 11 這個數字時,老人家會講 maskx veiya ucni,「maskx」是 10、「ucni」是 1,中間的「veiya」是「回來」的意思,翻譯成中文就是「10 回 1」,可見鄒族會使用十進位來算數,可是現在的年輕人通常會省略「veiya」的用法。

另外名字的說法也發生簡化現象,例如有一位鄒族人的名字是 Pasuya、家族名是 Tiakiana,老人家會講 Pasu’e Tiakiana,大致的意思是「來自 Tiakiana 家族的 Pasuya」。但是現在的年輕人就直接講 Pasuya Tiakiana,身分證上的名字也這樣登記。

面對日漸普遍的族語簡化現象,張永利有感而發的說:「年輕人覺得只要聽得懂就好,但我會跟他們說,語言也是文化的一部分,而且很多說法只存在特定族群中,想復振傳統文化就要講道地的族語。」

一般人常將語言視為溝通工具,認為只要能有效溝通就好,然而深諳語言奧妙的張永利卻有不同看法:

語言也是一種文化資產,不論是臺灣南島語、華語、臺語或客語都有其文化特色,具有身分識別作用。

「母語能留著就是你的寶藏,現在『特色』就是你最重要的資產!」母語是臺語的張永利不僅在學術場域研究語言,更在日常生活中透過多使用母語來保存語言資產。「語言不是只寫在教科書、或在課堂上唸,一定要積極使用,這樣語言才能真的活起來!」

千年以來,臺灣這座南島語族的原鄉發展出眾多語言文化各具特色的族群,如今在族人及語言學家的努力下,族語的復振工作正如火如荼進行,許多正名成功的族群紛紛從族語找回身分認同,找回值得守護的南島語族寶藏。

噶瑪蘭族自 2002 年 12 月 25 日正式被認定為原住民的第 11 族,其族語至今依然被族人保存使用,並編印成噶瑪蘭語辭典、語法書,作為學校鄉土教學的教材。圖|Wikimedia
-----廣告,請繼續往下閱讀-----
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3654 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

3
1

文字

分享

1
3
1
麥擱問啦!我講話自帶證據——孫天心解密「示證式」語法
研之有物│中央研究院_96
・2022/09/17 ・4504字 ・閱讀時間約 9 分鐘

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/黃楷元
  • 責任編輯/田偲妤
  • 美術設計/蔡宛潔

你是個言之有據的人嗎?

胡適先生曾說過「有一分證據,說一分話」。當有人質疑你時,你就必須提出證據來。然而,世界上有些民族在說話時會「自帶證據」,真正落實言之有據!中央研究院「研之有物」專訪院內語言學研究所特聘研究員孫天心院士,在翻山越嶺深入藏族部落後,揭開神秘的「示證式」語法。究竟藏人如何在每句話中結合證據?為何會發展出如此特殊的語法形態?一起來認識言之有據的溝通方式,從語言的多樣性中,體會不同文化的繽紛之美。

中央研究院語言學研究所特聘研究員孫天心院士。圖/研之有物

班長走進鬧哄哄的教室,大聲宣佈:「期末考取消了!」這時候,同學們會怎麼反應呢?

「真的假的?」

-----廣告,請繼續往下閱讀-----

「誰跟你說的?」

「你怎麼知道?」

類似這樣的場景,在日常生活中時時可見。班長原本講的話,資訊不夠,欠缺「發言依據」。得透過其他的詞彙、語句,去把那句話「補充」得更加可信。像是:

「老師要我跟大家說,期末考取消了!」

-----廣告,請繼續往下閱讀-----

「我看到公佈欄上寫,期末考取消了!」

但有的語言,直接在「語法」之中,就融入了這段話的「證據程度」,讓發言的人真正做到「有一分證據,說一分話」,聽者也能立即判斷這段話的可信度。這就是語言中的「示證式(evidential)」,也是中研院語言學研究所特聘研究員孫天心院士一項引人入勝的研究。

如何用語法的形態變化,讓講話可以「自帶證據」呢?用「時制(tense)」來打個比方,要表示「那時候他很快樂」,中文必須額外加上時間副詞「那時候」;但有現在–過去時制形態的英文卻只需改變動詞形式「He WAS happy」,就可表達時制。

「示證式」也是相同道理。孫天心院士表示,世界上大約有四分之一的語言,會藉由語法形態變化,直接表達陳述的證據。例如南美洲的 Quechua 語,就有三種不同的動詞後綴(語尾),對應三種證據狀態:直接證據(親眼所見)、間接證據(由情況判斷)和聽聞證據(由他人提供)。

-----廣告,請繼續往下閱讀-----
南美洲 Quechua 語「示證式」形態變化。圖/研之有物

臺灣人熟悉的母語和外語中,示證式的用法不易見,不過在跟漢語同屬漢藏語系的「藏語」,就存在細緻的示證區別。孫天心院士是國內少數精研藏語的專家,就用示證形態特別豐富的「達古藏語」,來為我們介紹這個有趣又有點燒腦的機制。

證據強度的關鍵:如何及何時取得訊息?

達古藏族居住在四川阿壩藏族羌族自治州黑水縣,語言帶有形態豐富的示證式。圖/Wikimedia

如果你是一位達古藏語的使用者,你在講話時會特別留意言談中的證據強度,來決定動詞的形式。而證據有多強,則關乎你如何得知所要陳述的訊息。

首先,當你講的事情是你自己現在或過去的「自主行為、習慣或持續性狀態」,由於這些訊息本來就掌握在你手中,需使用「親知示證」(動詞後綴 -lə),這也是證據強度最高的形態。

若是陳述自己親見的他人行為,或自己的「非自主行為」(例如不小心跌倒),你就是個「目擊者」,仍然擁有高度的訊息取得權,需使用「親歷示證」(動詞後綴 -wɐ)。

-----廣告,請繼續往下閱讀-----

若某件事發生當下並沒有參與(包括雖在場但未察覺),而是在「事後察知」的話,不同於前兩種情況,你這時只掌握「間接」訊息取得權,需使用「後知示證」(動詞後綴 -tsə)。

前述這三種情況是以訊息取得的來源來界定,而另外一種區分標準,則是從「認知整合的程度」來看。比方說,某件事情才剛剛發生、甚至正在進行中,你雖然是「直接」取得這些現場、當下發生的訊息,但認知上還來不及完全整合,需使用「新知示證」(動詞後綴 -wuʔ)。

如果認知整合的程度比較充分,像是你陳述的是自己當前的生理、心理狀態,或對於外界情況較長時間的觀察結果,則需使用「深知示證」(動詞後綴 -jiː)。

達古藏語的示證形態系統。圖/研之有物

於是,達古藏語的使用者光聽你使用的動詞形式,就可以判斷你講的話有幾分證據了。除了這種陳述句之外,示證式也可以用在疑問句中,用來「判斷與猜測」對方回答時所提供的證據。如果猜錯,回答者也同樣可以用示證式來推翻提問者的判斷。

-----廣告,請繼續往下閱讀-----

看起來眼花撩亂?但對於把達古藏語當成母語的人來說,這些都是有如呼吸一般的本能反應。而巴布亞新幾內亞的 Wola 語更為複雜,甚至把「受話者」的證據也考慮進去,稱為「集體示證」。這讓 Wola 語「做了(某事)」的謂語形態竟然有多達 57 種變化!

示證式「解碼」:從語言使用中窺見生活軌跡

然而,為什麼藏語、Quechua、Wola 這些語言會發展出「示證式」語法呢?這些使用示證式的民族,有什麼地緣上、親緣上的脈絡可循嗎?

孫天心院士介紹,學者發現世界上有三處「示證熱區」:喜馬拉雅山區、新幾內亞高地、南美洲西北角。這些區域的地理條件落差很大,看不出共通性。

世界三大示證熱區:喜馬拉雅山區、新幾內亞高地、南美洲西北角。圖/研之有物

以藏語而言,古代藏語並沒有嚴謹的示證區別,直到現代才發展出來。各地的藏語方言在示證體系的繁簡不一、形式也無法對應,顯見示證式的語法化、多樣化,是在相對短暫的時間內各自發展出來的。空間地緣、歷史親緣,恐怕都不是關鍵因素。

-----廣告,請繼續往下閱讀-----

那麼,到底是什麼原因,讓這些民族在講話時都特別「實事求是」呢?

目前看來,有複雜示證區別的語言,多使用於小型或封閉的語言社群。

這個問題,不只語言學家好奇,人類學家也感興趣。在大量的田野調查及資料分析後,學者們發現,越是小而封閉的社會,人們彼此熟識、互動頻繁,你早上講話不實在、可能下午就被抓包。

這種氛圍下,為了避免被指責和質疑,對於訊息交流時的「言語誠信」就會要求較高,語言中的示證式便應運而生。龐大而流動快速的社會,人際關係較為疏離,就比較難以在語言中發展出示證的用法。

四川黑水縣達古藏族的自然村。圖/孫天心院士提供

在南美洲秘魯的 Nanti 語言社會,示證式甚至不只是語法,而是一種根深柢固的「價值」。當地的不成文規範,提及他人行為時只能陳述親眼所見,或引用當事人自述,不能揣測推斷。

-----廣告,請繼續往下閱讀-----

有位人類學家提到,他只是請當地友人揣測一下她的丈夫去了哪裡(他出門時沒有說),一直遭到拒絕,最後居然大發脾氣:「你怎麼可以叫我做這種事?」這是他第一次看到當地人發這麼大的火。

語言之中,通常隱含著每個社會的集體思維、習癖、價值觀。示證式只是其中一種,各語言中還存在很多隱藏線索值得觀察,例如重視「時制(tense)」的語言,說話者就會特別留意事件的相對時序,以及說話時間的關聯。

特別有趣的是,孫天心院士分享了四川的嘉戎語動詞非常重要的「方向(orientation)範疇」,也就是講話時必須在動詞上標明(垂直)上下、(河流)上下游、(太陽)東西方。例如,當我們說「我去上一下洗手間」,當地人則會說「我去上一下(位在東邊的)洗手間」。

「這個文化裡面的人,方向感都特別好。若是路癡,可能連話都沒辦法好好講。」孫天心院士笑道。

差點為學術「捐軀」?研究少數民族語言的苦與樂

四川藏區險峻的山路。圖/孫天心院士提供

一般人可能連背英文動詞時態變化都覺得有些頭痛了,但對於孫天心院士來說,這些少數民族語言的特殊規則,就有如萬花筒一般,越探究越是興味盎然。

但要研究少數民族的語言,可沒辦法像報名外語補習班那麼簡單。最難的關卡,就是要找到理想的該語言使用者。因為不只是要學會聽說溝通而已,還要透徹研究,深入掌握語言的結構、變化、演進,這就是為什麼好的研究請益對象,猶如鳳毛麟角般稀有。

不只母語要好、漢語要好、還要耐性好,才能忍受學者打破砂鍋式的糾纏提問。最重要的,是要有時間跟著我們耗。

如果能夠在臺灣找到適合的研究對象,語言學家們必然是滿懷感激。但為了更充分地研究,有時候仍然需要走訪母語原鄉,實際觀察語言使用中的精微奧妙。

這種時候,研究少數民族語言的學者可就辛苦了。母語聚落通常地處偏僻,物質條件、交通環境也往往較不理想。孫天心院士回憶,有一次為了要研究藏族及羌族的語言,前往高海拔的四川馬爾康。想避開一路上的二手煙味及塵土,沒有搭乘大客車,而是從成都包了私家出租車上山。

沒想到,成都的司機不熟悉當地路況,沿途彎道及坍方,走得險象環生。突然一個轉彎的下坡,來不及放慢速度,連人帶車衝出路面,打滑了一圈,在懸崖的邊緣停住。司機嚇到臉色慘白,剩餘路程全都龜速前進。

雖然是餘悸猶存的回憶,但孫天心院士講起長年在四川藏區做田野研究的經歷,仍然帶著興奮雀躍。辛苦之處自不待言,然而箇中樂趣,讓他甘之如飴。

「藏緬語豐富的音韻、形態變化在世界語言中引人矚目。剛開始研究確實會感到困惑,但當慢慢找出規則、對應模式、甚至類型化之後,那種成就感難以言喻,而且越挖掘就會找到越多驚喜,令人欲罷不能!」

少數民族語言有豐富的語言現象,有如萬花筒一般,越探究越是興味盎然!圖/孫天心院士提供

孫天心院士捲起舌頭,親自示範不同藏緬語發音的微妙差異。生動之處,讓人忍不住想推出有聲書。語言學是一種「口耳之學」,把音發準是學習新語言的第一課,必須嚴格、精確地模仿,差一點點都不行。如果無法掌握細微差異,要進行任何進一步的比較分析都是空談。而要做好這件事,熟練掌握國際音標是重要的基本功。

學語言已不簡單,鑽研少數民族語言的困難度更非一般人能想像。對孫天心院士來說,除了興趣外,還有一種更重要的驅動力,是身為學者的「使命感」!

語言的現象極為豐富,以不同的角度反映人類思維的運作、人際交流的策略。然而多數語言處於弱勢,甚至瀕臨消亡。我選擇離開安適的象牙塔,走進田野研究瀕危語言,目的就是為記錄保存人類語言的多樣性做出一份貢獻。

一種專屬於學者的自豪,展露在孫天心院士的眉宇間。

-----廣告,請繼續往下閱讀-----
所有討論 1
研之有物│中央研究院_96
296 篇文章 ・ 3654 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook