Loading [MathJax]/extensions/tex2jax.js

0

2
1

文字

分享

0
2
1

花轟、撇步、粉阿劣!語言學家如何做「臺灣國語」研究?

研之有物│中央研究院_96
・2020/10/05 ・5338字 ・閱讀時間約 11 分鐘 ・SR值 539 ・八年級

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪編輯|蕭智帆、劉芝吟;美術編輯|林洵安

認識臺式國語的前世今生

在禁說臺語的年代,不小心說溜嘴,學生得掛牌、罰錢,字正腔圓的國語是最受推崇的標準語言。但曾幾何時,臺式國語越來越當道,許多流行字詞也來自華閩交混,例如奧步、撇步不但是本世紀初「臺灣製造」,甚至同步影響華語圈!中研院語言學研究所蕭素英副研究員,透過古漢語、現代國語、近現代閩南語的語料分析,帶領「研之有物」讀者一同看看臺式國語的前世今生。

行、步、走,最熟悉的陌生詞

「行」、「走」、「步」,身為中文使用者,你說得出有什麼差別嗎?

中研院蕭素英副研究員長年研究閩南語語言學,碩士論文還全程用閩南語口試。她整理上古漢語研究,並透過《廈英大辭典》、明清閩南戲曲以及 1885 年創刊至今的《台灣教會公報》,比較國語、閩南語留下的語意痕跡,梳理出行、步、走的語意地圖。

在現代國語,這三個動詞都有「行動、移動」本義。但是上古漢語裡,「行、步」意指走,「走」則代表跑。演變至今,奔跑之意仍保留在閩南語的「走」(tsáu),但轉變成了現代國語的「跑」。

-----廣告,請繼續往下閱讀-----

被繞得頭暈了嗎?先暫停一下,讓我們一一來拆解吧。

大體來說,閩南語的「行」接近國語的「走」,「走」則為國語的「跑」。資料來源/蕭素英

首先來看看「行」,上古漢語這個字有「行走」、「道路」等具體意象,也已經出現「德行」、「排行」的抽象意義。

到了現代國語,行走的意思被「走」這個字取代了,只有少數用詞(例如行人)仍保留。但是,國語從移動這個意涵擴充更多用詞:運行、流行,還多了「可以」的意思(你行嗎)。

「行」的「行走」意義在國語裡消失不見,卻保留於閩南語,而且延伸出「接觸、交往」之意。這種抽象用法非常生動,想像一下兩人常常行走,走著走著距離自然就拉近,所以當我們說兩個人「行鬥陣」(kiânn tàu-tīn),字面上乍看像「走在一起」,其實真正的意思是:他們正在交往,戀愛 ing!

國語的行,從核心的「行走」語意往外延伸,最後發展出「時尚」(如流行)、「可以」(行不行),都是古漢語沒有之意。閩南語則演變出「接觸、交往」的意思。道路之意則都不存在了。資料來源/蕭素英

「走」,在金文中是一個奔跑的人形,本義為「疾行、奔跑」,例如走馬看花、敗走樊城。但是到了國語,除了走馬看花、奔走保有原義,大部分都被「跑」這個字所取代。「走」,基本上就只是步行、走路。

-----廣告,請繼續往下閱讀-----

不過閩南語的「走」依然很復古!鮮明保留了「疾行、奔跑」的金文本意,例如「好膽莫走」(Hó-tánn mài tsáu)。

「走」的「疾行、奔跑」之意,在現代國語由「跑」來表達,但仍保留在閩南語的「走」。資料來源/蕭素英

最後,是「步」這個字。

《說文解字》有云:「步,行也」,步與行兩者意義相近,但在上古漢語已經分工,步多作「腳步」(名詞);行則是「行走」(動詞)。現代國語保留名詞用法,還衍生「境地、狀況」的抽象意義,如:地步。

閩南語則擴充出「方法、手段」的意思,例如「漚步」(àu-pōo)指的是卑劣手段。等等!讀到這裡,你的腦袋是不是卡了一下?「àu-pōo」多數人很耳熟,但想必更習慣寫成「奧步」這兩字。

-----廣告,請繼續往下閱讀-----

蕭素英解釋:「這就是閩南語影響、滲入國語的明顯例子,在臺灣的語言脈絡下,才出現奧步、撇步這類新詞彙。」

閩南語中的「步」擴充出「方法、手段」的語意,有許多相關詞彙。在台灣華閩交雜的語言使用脈絡下,閩南語的語意滲入國語,因此出現「奧步」、「撇步」這類新詞彙。資料來源/蕭素英

奧步、撇步,「臺式國語」征服華語圈

但語言學家是如何推知奧步、撇步的身世?如何確定這兩個字詞來自臺灣閩南語的影響呢?

「奧步」,閩南語正字寫作「漚步」。從先前的語意地圖,步在國語中沒有招數、手段的意思,奧也沒有卑劣之意;相反地,「形容詞或動作+步」是閩南語的構詞方式,用來形容特定的手段與方法。

奧步、撇步的出現也非常晚近,可以說是臺灣土生土長冒出的。

從這些線索可知,奧步、撇步應是從閩南語「音譯」而來,借用相似音,書寫表達母語意涵。

-----廣告,請繼續往下閱讀-----

那麼,這幾個「臺式國語」如何進入日常語言?

蕭素英檢索《聯合報》的「聯合知識庫」發現,大約 2000 年後,奧步、撇步才明顯見於大眾媒體。1981 年,《聯合報》第一次出現奧步兩字。報導如下:

【台南訊】台南市長候選人王奕棋,昨天在灣裡萬年殿前廣場的政見會中相互請問。王奕棋說,還有的人用別人的名義買票,真是「奧步」(閩南話,意即差勁的辦法)。

當時,奧步不但加上引號,後面還得補充註解做說明!同樣的,撇步首度出現在《聯合報》時,也用括號加註說明(偏方)。由此再次看出,這些字詞並不是國語原本的固有詞彙。

有趣的是,2007-2008 年奧步的曝光量大爆增!原因不難想像,首要因素是當時正值總統大選,伴隨造勢活動與檯面上下的暗潮洶湧,大量政治新聞讓「奧步」搶登媒體版面,成為熱門的新潮用字

-----廣告,請繼續往下閱讀-----

而長期來看,1990 年代至 2000 年後隨著母語文化的推動,鄉土語言開始進入學校課程,也改變了語言使用習慣。蕭素英強調,國家語言政策不只影響教育現場,更會鬆動語言的「標準化」,打開方言進入主流文化的空間。

「我快花轟了、「你粉阿劣」、「啥米碗糕」……俏皮用法大逆襲!從原本主播式「字正腔圓」才是正統,融合方言、口音的「臺式國語」漸漸不再被台灣主流社會排斥,語言文化展露更多彈性。

從統計數據可知,奧步、撇步幾乎是在本世紀 2000 年以後才出現於主流媒體。資料來源/蕭素英

不只如此,Made in Taiwan 的臺式國語還影響了海外華語圈!蕭素英透過追蹤比對發現,

奧步、撇步等「臺灣製造」詞彙,從閩南語進入國語,又傳播到華語圈,包括中國、新加坡、馬來西亞、香港、澳門。

由於奧步並非新、馬閩南語的說法,因此並不是當地語言內部的借詞。

-----廣告,請繼續往下閱讀-----

踹共、落漆、毋湯,那要不要「接地氣」?

在語言多元、網路時代的影響下,還有越來越多流行詞彙從閩南語轉化而來

要對方出來面對的「踹共」(tshuài kóng)、出糗或遜掉了的「落漆」(lak-tshat)、為躲避特定人物而連夜逃跑的「跑路」(tsáu-lōo)、表達歉意的「拍謝」(pháinn-sè)、表示不應該的「毋湯」(m̄-thang)。

蕭素英分析,奧步、撇步是新造詞傳達母語意義;跑路、落漆則是擴充原本字義,轉成母語用法。這些都屬於「借詞」。

借詞,是語言相互接觸後的自然現象,但大多是優勢語言被借用。相較來說,奧步、撇步則是本土語言回過頭影響國語的特殊例子。

-----廣告,請繼續往下閱讀-----

借詞在各種語言間普遍可見。以閩南語為例,有文讀、白讀不同發音,例如阿里山(san)、爬山(suann),山會發成不同音。白讀是原本閩南一帶的方言;文讀則是各朝代的讀書人,學習官話後融入到方言中。因此閩南語的文讀,即是方言受標準官方語言影響後的借詞現象。

我們現在慣用的歐巴桑,來自日文借詞;摩托車(motorcycle)、幽默(humor),音譯自英文。當新事物、觀念或新用詞傳入後,原有語言系統若沒有相應、貼切的用詞,經常就會借用外來語。

隨著網路時代崛起,影音資訊在國際間海量串流,現代人的用字遣詞更傾向「接地氣」,然而「接地氣」這類中國網路用語,卻掀起了另一波政治與文化意識的新論戰

面對「外來語」爭議,蕭素英從使用者的視角來理解:「每一個時代、每一種語言,都會有人提出語言純潔性的主張,但是如果使用者覺得詞彙生動、好用,自然就會流傳,很難禁絕。」即使國家強力介入,也很難達到完全的純潔排他。

以土耳其為例,凱末爾革命後,土耳其政府將所有非傳統固有詞彙,通通改回本土用語,「當時看似成功,但現在有多少外來用詞又逐漸被納入?」

語言間彼此流通、影響不必然是完全負面,許多當代詞彙都是在不斷刺激、活化下誕生,碰撞釀造出新的意義和用法。

不過她也強調,借詞雖是語言接觸的自然現象,仍需留意是否從只借用特定用語,轉變成大量取代本土語詞。因為若語言越來越少被使用,逐漸走上消亡,我們失去的將不單單是一種語言,同時還抹去背後蘊含的文化、歷史記憶。

如果失去了語言,我們還會失去什麼?

「每種語言都代表了一套知識體系、文化視野,從詞彙就能反映出社會結構與價值觀。」蕭素英說。

例如,漢語的親屬詞彙與父系社會結構密切相關。對父親的兄弟區分極細,伯父、伯母、叔父、叔母;但稱呼父親的姊妹、母親的手足:姑姑、舅舅、阿姨,就沒有長幼之別。

蒙古語中有各式各樣的「馬」,剛出生、公馬、母馬、不同花色的馬,都有對應的字彙;但我們統稱為馬。閩南語中,搔癢(ngiau)、皮膚癢(tsiūnn)使用不同的字詞,中文則都用癢表示。從語言學角度,不同語言有各自描繪世界的方式,如同一扇扇窗,展示出特定而富有文化意涵的視野風景。

語言多樣性,就是文化多樣性的一部分,我們得以從中看見背後的世界觀、知識體系。

同時,語言有不同發音方式,有些發音存在於英語、閩南語,國語則沒有。因此學習越多種語言,就如同打開越多開關,擁有越多和世界聯繫的窗口。

「這不也正是母語傳承的意義與價值?」蕭素英慎重地提醒,當年輕一代的父母大多用國語和孩子溝通,國家體制的母語教育更顯重要。

《台灣教會公報》是台灣發行最久的報紙,1885 年由長老教會創刊,用羅馬拼音拼寫閩南語,只要學會 26 個英文字母發音就能讀寫,快速掃盲。這套拼音書寫系統被稱為「白話字」。蕭素英參與中研院語言所數位典藏,負責的閩南語語料庫就收藏了教會的白話字。資料來源/節錄自《臺南教會報》1912 年,蔡瑋芬翻譯

從教育影響家庭?臺灣內部的語言態度

母語教育、使用機會,都會直接影響一般人的「語言態度」。

蕭素英從實證研究發現,「即使每週只有一堂課,只要母語教育進入正規課程,家長就會更願意與子女用母語交談。」因此政府的責任在於提供誘因,包括學校課程的規劃。

其次則是工作需求,「很多醫學系學生會特別練習台語,但是如果到了大學才從零開始,難免比較辛苦。」《國家語言發展法》通過後,政府必須投入資源培育人才,包括教材編寫、語言調查、口譯等。當國家創造更多語言使用的公共環境和機會,自然有助於提升母語傳承的態度、意願。

她從自身經驗觀察,父親與自己對話都用閩南語,但只要面對孫子,就像內建了感應切換系統,會立刻轉用彆扭的國語溝通。這個觀察一定程度反應出臺灣世代間對語言想像的差異。

「以閩南語來說,跨世代傳承並不樂觀。因此國家政策的投入很重要,我們自己對母語的態度與想像也必須轉變。」作為語言學家,閩南語不只是研究課題,更是她心心念念的文化資產,若臺灣能保留、傳承越多語言,便如同是為下一代打造一扇扇通向不同世界的「任意門」。

「我的研究動機很簡單,為什麼我的母語都沒有人研究?」碩士、博士論文都是研究閩南語,蕭素英說,研究母語最大好處就是能掌握細微語義差別。她帶孩子念故事書,也會用閩南語來講,讓孩子知道漢字也可以用閩南語來念,因為「語言傳承,就是要創造接觸的環境。」攝影/林洵安

延伸閱讀

  • 蕭素英,〈閩南語「行、步、走」的語意地圖與其在華語區的傳播〉,《臺灣語文研究》7(1):87—127,2012
  • 鄭錦全、何大安、蕭素英、江敏華、張永利編,《語言政策的多元文化思考》,中央研究院語言學研究所,2007
  • 蕭素英個人網站

本文轉載自中央研究院研之有物,原文為《出奧步、小撇步、毋湯喔!語言學家的「台灣國語」研究》,泛科學為宣傳推廣執行單位

-----廣告,請繼續往下閱讀-----
文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

2

1
0

文字

分享

2
1
0
語言也是一種證據!南島語族發源地竟在臺灣?——專訪語言學研究所張永利研究員
研之有物│中央研究院_96
・2023/08/27 ・4908字 ・閱讀時間約 10 分鐘

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|田偲妤
  • 美術設計|蔡宛潔

南島語族的起源與變遷

南島語族發源自何方?是學界長期探索的焦點,在眾多研究領域中,語言學界為分布在南太平洋與印度洋諸島的族群確立關係,分類命名為南島語族(Austronesian-speaking peoples) 。除此之外,還有許多語言證據指出,南島語族可能是從臺灣擴散出去。中央研究院「研之有物」專訪院內語言學研究所張永利研究員,為我們深入分析,臺灣南島語保存哪些其他南島語「丟失的現象」,可以藉此重建南島語族的發展源頭與遷徙路徑。

嘉義阿里山鄉新美國小學生獻唱鄒族古謠。圖|Wikimedia

南島語族的發源地究竟在何方?目前已有越來越多證據指出,南島語族可能是從臺灣出發,遷徙至廣大的南太平洋與印度洋島嶼開枝散葉。

考古學家在臺灣、呂宋島、大洋洲等地出土相似的陶器碎片,經年代鑑定後發現,最早的繩紋紅陶陶器來自 5、6 千年前的臺灣大坌坑文化。植物學家則對各地的構樹樣本進行分子親緣分析,發現南太平洋島嶼的構樹應源自臺灣,推測先民帶著樹皮衣材料構樹,自臺灣遷徙至南太平洋諸島。

除了上述證據,還有一樣活在生活周遭的非物質遺產,能作為南島語族「出臺灣說」的有力證據,那就是臺灣原住民族正在使用的「語言」!

-----廣告,請繼續往下閱讀-----

中研院語言學研究所是研究與推廣「臺灣南島語」的重要基地,走進語言所典藏豐富研究著作的展覽室,投身臺灣南島語研究近 30 年的張永利研究員,與我們熱情分享語言學家的工作。

各地南島語言的特徵與變遷,是語言學家長期探索的問題,多年來一位位研究者深入原住民族部落,用羅馬拼音一字一句記錄部落長者的口語發音,經由比較臺灣與其他地區南島語言的關連與特徵,南島語族的發展源頭與遷徙路徑就在歷代語言學家的重建下現形。

中研院語言學研究所張永利研究員,投身南島語言研究近 30 年,與我們熱情分享語言學家的工作。圖|研之有物

如何確定臺灣南島語更接近原始南島語?同源詞繁簡成線索

南島語族是總人口數近 4 億人的龐大族群,其分布範圍北到臺灣、南到紐西蘭、東到復活節島、西到馬達加斯加。臺灣是南島語族分布的最北界,目前官方認定的原住民族共有 16 族,每個族群都有自己的語言,在整個南島語族 10 個主要語言分支中,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。

南島語族 10 個主要語言分支,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。圖|研之有物    資料來源|Blust, 1999: 45

「曾有外國學者讚嘆:南島語言是上帝送給臺灣的禮物!」張永利逐步分析臺灣南島語的珍貴之處:「考古和語言證據推估,臺灣南島語至少有 5 千年歷史,而麻六甲海峽附近國家使用的馬來語只有 2 千多年而已。此外,臺灣南島語還保留一些其他語言丟失的現象。」

-----廣告,請繼續往下閱讀-----

所謂「丟失的現象」正是語言學家證實臺灣南島語較古老、可能是南島語族早期祖居地的關鍵證據。藉由歷史語言學方法比較南島語言之間的親緣關係與發展先後,丟失的現象慢慢浮現,成為值得研究的案例。

首先,語言學家特別構擬出一套「原始南島語」作為比較標準,音韻、構詞、句法越接近原始南島語者,就越有可能是族群發源地。

要構擬出原始南島語並不簡單,語言學家無法穿越時空回到 5 千年前,必須集結全球語言學家的力量,深入各個南島語族聚落採集語言材料,再從中找出語音、語意相似的「同源詞」做比較。由於語言變化的過程經常發生「由繁趨簡」現象,因此發音越複雜的語言通常越古老,語言學家再從較古老的語言構擬出原始南島語。

張永利舉同源詞「眼睛」為例,說明臺灣南島語較為古老的原因。眼睛的原始南島語是「maCa」(大 C 的發音為 ts 複合音,同注音符號ㄗ),而臺灣的排灣語是「maca」,其發音與原始南島語相同。

再看看馬來語的眼睛是「mata」,ts 複合音明顯簡化成 t,發生語言「由繁趨簡」的現象,證明臺灣南島語比馬來語更古老。

-----廣告,請繼續往下閱讀-----
從同源詞「眼睛」的語音變化可發現,排灣語、鄒語較接近原始南島語,而賽夏語、馬來語的發音出現簡化現象,從中可看出族群發展的先後順序。圖|研之有物    資料來源|張永利

張永利進一步解釋,為何「由繁趨簡」現象可看出語言發展的先後順序:「有人可能會質疑,為什麼語言不是從簡單變複雜,發音由 t 變成 ts?如果是這樣你要解釋,多出來的 s 音是怎麼無中生有。這就如同人類社會的變遷,從複雜變簡單通常有跡可循,但無中生有需要創新的力量,從來不是簡單的事。」

這些語言有畫面!從同源詞推測千年前的生活型態

同源詞還可以重建南島語族原初的生活環境。根據語言學家的觀察,能成為同源詞的單字通常是日常使用的基本詞彙,例如爸爸、媽媽等親屬稱呼、數字 1 到 10,或是眼睛、頭、手、腳等身體部位。

因此,如果還能發現動物、植物、生活器具的同源詞,代表這些事物是曾經長時間存在的文化,才得以跨越千年時空在語言中留下印記,成為一窺南島語族原初生活環境的線索。

語言學家從原始南島語、原始排灣語、原始泰雅語、原始鄒語彙整出 100 個基本同源詞,當中包含許多指稱農作物、野生動植物、生活日用品的字詞:

-----廣告,請繼續往下閱讀-----
原始南島語同源詞反映之自然與文化特徵。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 17-22

從上述同源詞可推測,原始南島語族應該是以稻作維生,擅長紡織與編織技藝,生活周遭可見「露兜樹、甘蔗、藤」、「河鰻、田鼠、蒼蠅」等主要分布在亞熱帶地區的動植物。這些同源詞所反映的自然與文化特徵,對解答南島語族發源地問題具有相當大的啟發。

此外,從某些同源詞的語意轉變還可看出指稱的是外來事物。例如鄒語的「水牛」叫作「’ua chumu」,「chumu」是指「水」,但「’ua」最初並不是指「牛」,其真正的意思是「鹿」。換句話說,水牛應該是外來物種,推測鄒族先民看到外來的牛,跟鹿一樣都是四隻腳的大型哺乳類動物,因而發生「指鹿為牛」的情形。

講話講重點!第一個字就表明重點的「焦點系統」

除了從同源詞可以證明臺灣南島語較接近原始南島語,語言學家還發現,比起其他地方的南島語言,臺灣南島語保存最完整的「焦點系統」。這是一種非常古老的文法,在世界其他語言中並不常見。

焦點系統是用來凸顯一句話中想要強調的焦點,主要分成主事、受事、處所、工具共 4 種焦點,每種焦點都有相對應的動詞詞綴變化,並會在重點字詞前方加上格位標記 a。

-----廣告,請繼續往下閱讀-----

由於南島語言習慣將動詞置於句首,等於你聽到第一個字就知道說話者想強調什麼。以下為 4 種焦點在排灣語的使用方式:

排灣語焦點系統應用,句首動詞 qaljup(打獵)會因應不同焦點而加上不同詞綴,焦點前方也會加上格位標記 a 來指稱重點。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 8

古老的修飾用語:副動詞

最後一個臺灣南島語較為古老的證據在於,其詞類相當有限,主要是動詞、名詞的應用,沒有真正的副詞、形容詞等修飾詞。但是當有需要用到修飾用語時該怎麼辦?這就輪到特殊的「副動詞」登場!

副動詞顧名思義是指:具副詞作用的動詞,是臺灣南島語經常使用的詞類。張永利秀出排灣語和馬來語的句子,進一步說明副動詞與一般副詞的不同:

圖|研之有物    資料來源|張永利

排灣語的「g<em>alju」就是一個副動詞,意思是「慢」,之所以看出它是一種動詞,關鍵在於它跟後頭表示「吃」的動詞「k<em>an」有一樣的詞綴變化「em」。而中間的連繫詞 a 亦可應證「g<em>alju」與「k<em>an」應同屬於動詞。此外,「g<em>alju」的後面連接附著代詞「aken」表示「我」的意思,附著代詞一般會貼在動詞上。

-----廣告,請繼續往下閱讀-----

值得注意的是,古老的副動詞在臺灣南島語言普遍保留下來,但是在臺灣之外的南島語言,如馬來語,卻通常都已經丟失。

綜上所述,從同源詞複雜度、焦點系統完整性、使用詞類有限等語言證據可知,臺灣南島語在目前已知的上千種南島語中,其古老排名可說名列前茅,也代表臺灣可能是南島語族早期的祖居地。

張永利表示:「綜合歸納現在的語言和考古證據,我們可以畫出南島語族遷徙路徑,基本上是從臺灣遷徙出去,先遷往菲律賓群島,再往南到婆羅州一帶,隨後一分為二,分別往東方太平洋和西方印度洋遷徙。」

南島語族遷徙路徑。圖|研之有物    資料來源|Bellwood, 2011

用「說」的文化資產——母語

對張永利來說,越深入研究就越能體會,臺灣南島語真的是臺灣千年不墜的國寶!除了持續在學界發表臺灣南島語的概念運用規則,張永利也會到原住民部落推廣族語,多年來也跟國內語言學家一起編寫鄒語、噶瑪蘭語、賽德克語等族語教科書。

張永利研究員持續研究臺灣南島語的概念運用規則,多年來編寫多本族語教科書,更前往部落推廣族語。圖|研之有物

在與族人互動的過程中,張永利發現,年輕族人為了溝通方便,有簡化族語的傾向,以致某些傳統用語漸漸流失。

-----廣告,請繼續往下閱讀-----

以鄒語為例,傳統上在說 11 這個數字時,老人家會講 maskx veiya ucni,「maskx」是 10、「ucni」是 1,中間的「veiya」是「回來」的意思,翻譯成中文就是「10 回 1」,可見鄒族會使用十進位來算數,可是現在的年輕人通常會省略「veiya」的用法。

另外名字的說法也發生簡化現象,例如有一位鄒族人的名字是 Pasuya、家族名是 Tiakiana,老人家會講 Pasu’e Tiakiana,大致的意思是「來自 Tiakiana 家族的 Pasuya」。但是現在的年輕人就直接講 Pasuya Tiakiana,身分證上的名字也這樣登記。

面對日漸普遍的族語簡化現象,張永利有感而發的說:「年輕人覺得只要聽得懂就好,但我會跟他們說,語言也是文化的一部分,而且很多說法只存在特定族群中,想復振傳統文化就要講道地的族語。」

一般人常將語言視為溝通工具,認為只要能有效溝通就好,然而深諳語言奧妙的張永利卻有不同看法:

語言也是一種文化資產,不論是臺灣南島語、華語、臺語或客語都有其文化特色,具有身分識別作用。

「母語能留著就是你的寶藏,現在『特色』就是你最重要的資產!」母語是臺語的張永利不僅在學術場域研究語言,更在日常生活中透過多使用母語來保存語言資產。「語言不是只寫在教科書、或在課堂上唸,一定要積極使用,這樣語言才能真的活起來!」

千年以來,臺灣這座南島語族的原鄉發展出眾多語言文化各具特色的族群,如今在族人及語言學家的努力下,族語的復振工作正如火如荼進行,許多正名成功的族群紛紛從族語找回身分認同,找回值得守護的南島語族寶藏。

噶瑪蘭族自 2002 年 12 月 25 日正式被認定為原住民的第 11 族,其族語至今依然被族人保存使用,並編印成噶瑪蘭語辭典、語法書,作為學校鄉土教學的教材。圖|Wikimedia
-----廣告,請繼續往下閱讀-----
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

3
1

文字

分享

1
3
1
麥擱問啦!我講話自帶證據——孫天心解密「示證式」語法
研之有物│中央研究院_96
・2022/09/17 ・4504字 ・閱讀時間約 9 分鐘

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/黃楷元
  • 責任編輯/田偲妤
  • 美術設計/蔡宛潔

你是個言之有據的人嗎?

胡適先生曾說過「有一分證據,說一分話」。當有人質疑你時,你就必須提出證據來。然而,世界上有些民族在說話時會「自帶證據」,真正落實言之有據!中央研究院「研之有物」專訪院內語言學研究所特聘研究員孫天心院士,在翻山越嶺深入藏族部落後,揭開神秘的「示證式」語法。究竟藏人如何在每句話中結合證據?為何會發展出如此特殊的語法形態?一起來認識言之有據的溝通方式,從語言的多樣性中,體會不同文化的繽紛之美。

中央研究院語言學研究所特聘研究員孫天心院士。圖/研之有物

班長走進鬧哄哄的教室,大聲宣佈:「期末考取消了!」這時候,同學們會怎麼反應呢?

「真的假的?」

-----廣告,請繼續往下閱讀-----

「誰跟你說的?」

「你怎麼知道?」

類似這樣的場景,在日常生活中時時可見。班長原本講的話,資訊不夠,欠缺「發言依據」。得透過其他的詞彙、語句,去把那句話「補充」得更加可信。像是:

「老師要我跟大家說,期末考取消了!」

-----廣告,請繼續往下閱讀-----

「我看到公佈欄上寫,期末考取消了!」

但有的語言,直接在「語法」之中,就融入了這段話的「證據程度」,讓發言的人真正做到「有一分證據,說一分話」,聽者也能立即判斷這段話的可信度。這就是語言中的「示證式(evidential)」,也是中研院語言學研究所特聘研究員孫天心院士一項引人入勝的研究。

如何用語法的形態變化,讓講話可以「自帶證據」呢?用「時制(tense)」來打個比方,要表示「那時候他很快樂」,中文必須額外加上時間副詞「那時候」;但有現在–過去時制形態的英文卻只需改變動詞形式「He WAS happy」,就可表達時制。

「示證式」也是相同道理。孫天心院士表示,世界上大約有四分之一的語言,會藉由語法形態變化,直接表達陳述的證據。例如南美洲的 Quechua 語,就有三種不同的動詞後綴(語尾),對應三種證據狀態:直接證據(親眼所見)、間接證據(由情況判斷)和聽聞證據(由他人提供)。

-----廣告,請繼續往下閱讀-----
南美洲 Quechua 語「示證式」形態變化。圖/研之有物

臺灣人熟悉的母語和外語中,示證式的用法不易見,不過在跟漢語同屬漢藏語系的「藏語」,就存在細緻的示證區別。孫天心院士是國內少數精研藏語的專家,就用示證形態特別豐富的「達古藏語」,來為我們介紹這個有趣又有點燒腦的機制。

證據強度的關鍵:如何及何時取得訊息?

達古藏族居住在四川阿壩藏族羌族自治州黑水縣,語言帶有形態豐富的示證式。圖/Wikimedia

如果你是一位達古藏語的使用者,你在講話時會特別留意言談中的證據強度,來決定動詞的形式。而證據有多強,則關乎你如何得知所要陳述的訊息。

首先,當你講的事情是你自己現在或過去的「自主行為、習慣或持續性狀態」,由於這些訊息本來就掌握在你手中,需使用「親知示證」(動詞後綴 -lə),這也是證據強度最高的形態。

若是陳述自己親見的他人行為,或自己的「非自主行為」(例如不小心跌倒),你就是個「目擊者」,仍然擁有高度的訊息取得權,需使用「親歷示證」(動詞後綴 -wɐ)。

-----廣告,請繼續往下閱讀-----

若某件事發生當下並沒有參與(包括雖在場但未察覺),而是在「事後察知」的話,不同於前兩種情況,你這時只掌握「間接」訊息取得權,需使用「後知示證」(動詞後綴 -tsə)。

前述這三種情況是以訊息取得的來源來界定,而另外一種區分標準,則是從「認知整合的程度」來看。比方說,某件事情才剛剛發生、甚至正在進行中,你雖然是「直接」取得這些現場、當下發生的訊息,但認知上還來不及完全整合,需使用「新知示證」(動詞後綴 -wuʔ)。

如果認知整合的程度比較充分,像是你陳述的是自己當前的生理、心理狀態,或對於外界情況較長時間的觀察結果,則需使用「深知示證」(動詞後綴 -jiː)。

達古藏語的示證形態系統。圖/研之有物

於是,達古藏語的使用者光聽你使用的動詞形式,就可以判斷你講的話有幾分證據了。除了這種陳述句之外,示證式也可以用在疑問句中,用來「判斷與猜測」對方回答時所提供的證據。如果猜錯,回答者也同樣可以用示證式來推翻提問者的判斷。

-----廣告,請繼續往下閱讀-----

看起來眼花撩亂?但對於把達古藏語當成母語的人來說,這些都是有如呼吸一般的本能反應。而巴布亞新幾內亞的 Wola 語更為複雜,甚至把「受話者」的證據也考慮進去,稱為「集體示證」。這讓 Wola 語「做了(某事)」的謂語形態竟然有多達 57 種變化!

示證式「解碼」:從語言使用中窺見生活軌跡

然而,為什麼藏語、Quechua、Wola 這些語言會發展出「示證式」語法呢?這些使用示證式的民族,有什麼地緣上、親緣上的脈絡可循嗎?

孫天心院士介紹,學者發現世界上有三處「示證熱區」:喜馬拉雅山區、新幾內亞高地、南美洲西北角。這些區域的地理條件落差很大,看不出共通性。

世界三大示證熱區:喜馬拉雅山區、新幾內亞高地、南美洲西北角。圖/研之有物

以藏語而言,古代藏語並沒有嚴謹的示證區別,直到現代才發展出來。各地的藏語方言在示證體系的繁簡不一、形式也無法對應,顯見示證式的語法化、多樣化,是在相對短暫的時間內各自發展出來的。空間地緣、歷史親緣,恐怕都不是關鍵因素。

-----廣告,請繼續往下閱讀-----

那麼,到底是什麼原因,讓這些民族在講話時都特別「實事求是」呢?

目前看來,有複雜示證區別的語言,多使用於小型或封閉的語言社群。

這個問題,不只語言學家好奇,人類學家也感興趣。在大量的田野調查及資料分析後,學者們發現,越是小而封閉的社會,人們彼此熟識、互動頻繁,你早上講話不實在、可能下午就被抓包。

這種氛圍下,為了避免被指責和質疑,對於訊息交流時的「言語誠信」就會要求較高,語言中的示證式便應運而生。龐大而流動快速的社會,人際關係較為疏離,就比較難以在語言中發展出示證的用法。

四川黑水縣達古藏族的自然村。圖/孫天心院士提供

在南美洲秘魯的 Nanti 語言社會,示證式甚至不只是語法,而是一種根深柢固的「價值」。當地的不成文規範,提及他人行為時只能陳述親眼所見,或引用當事人自述,不能揣測推斷。

-----廣告,請繼續往下閱讀-----

有位人類學家提到,他只是請當地友人揣測一下她的丈夫去了哪裡(他出門時沒有說),一直遭到拒絕,最後居然大發脾氣:「你怎麼可以叫我做這種事?」這是他第一次看到當地人發這麼大的火。

語言之中,通常隱含著每個社會的集體思維、習癖、價值觀。示證式只是其中一種,各語言中還存在很多隱藏線索值得觀察,例如重視「時制(tense)」的語言,說話者就會特別留意事件的相對時序,以及說話時間的關聯。

特別有趣的是,孫天心院士分享了四川的嘉戎語動詞非常重要的「方向(orientation)範疇」,也就是講話時必須在動詞上標明(垂直)上下、(河流)上下游、(太陽)東西方。例如,當我們說「我去上一下洗手間」,當地人則會說「我去上一下(位在東邊的)洗手間」。

「這個文化裡面的人,方向感都特別好。若是路癡,可能連話都沒辦法好好講。」孫天心院士笑道。

差點為學術「捐軀」?研究少數民族語言的苦與樂

四川藏區險峻的山路。圖/孫天心院士提供

一般人可能連背英文動詞時態變化都覺得有些頭痛了,但對於孫天心院士來說,這些少數民族語言的特殊規則,就有如萬花筒一般,越探究越是興味盎然。

但要研究少數民族的語言,可沒辦法像報名外語補習班那麼簡單。最難的關卡,就是要找到理想的該語言使用者。因為不只是要學會聽說溝通而已,還要透徹研究,深入掌握語言的結構、變化、演進,這就是為什麼好的研究請益對象,猶如鳳毛麟角般稀有。

不只母語要好、漢語要好、還要耐性好,才能忍受學者打破砂鍋式的糾纏提問。最重要的,是要有時間跟著我們耗。

如果能夠在臺灣找到適合的研究對象,語言學家們必然是滿懷感激。但為了更充分地研究,有時候仍然需要走訪母語原鄉,實際觀察語言使用中的精微奧妙。

這種時候,研究少數民族語言的學者可就辛苦了。母語聚落通常地處偏僻,物質條件、交通環境也往往較不理想。孫天心院士回憶,有一次為了要研究藏族及羌族的語言,前往高海拔的四川馬爾康。想避開一路上的二手煙味及塵土,沒有搭乘大客車,而是從成都包了私家出租車上山。

沒想到,成都的司機不熟悉當地路況,沿途彎道及坍方,走得險象環生。突然一個轉彎的下坡,來不及放慢速度,連人帶車衝出路面,打滑了一圈,在懸崖的邊緣停住。司機嚇到臉色慘白,剩餘路程全都龜速前進。

雖然是餘悸猶存的回憶,但孫天心院士講起長年在四川藏區做田野研究的經歷,仍然帶著興奮雀躍。辛苦之處自不待言,然而箇中樂趣,讓他甘之如飴。

「藏緬語豐富的音韻、形態變化在世界語言中引人矚目。剛開始研究確實會感到困惑,但當慢慢找出規則、對應模式、甚至類型化之後,那種成就感難以言喻,而且越挖掘就會找到越多驚喜,令人欲罷不能!」

少數民族語言有豐富的語言現象,有如萬花筒一般,越探究越是興味盎然!圖/孫天心院士提供

孫天心院士捲起舌頭,親自示範不同藏緬語發音的微妙差異。生動之處,讓人忍不住想推出有聲書。語言學是一種「口耳之學」,把音發準是學習新語言的第一課,必須嚴格、精確地模仿,差一點點都不行。如果無法掌握細微差異,要進行任何進一步的比較分析都是空談。而要做好這件事,熟練掌握國際音標是重要的基本功。

學語言已不簡單,鑽研少數民族語言的困難度更非一般人能想像。對孫天心院士來說,除了興趣外,還有一種更重要的驅動力,是身為學者的「使命感」!

語言的現象極為豐富,以不同的角度反映人類思維的運作、人際交流的策略。然而多數語言處於弱勢,甚至瀕臨消亡。我選擇離開安適的象牙塔,走進田野研究瀕危語言,目的就是為記錄保存人類語言的多樣性做出一份貢獻。

一種專屬於學者的自豪,展露在孫天心院士的眉宇間。

-----廣告,請繼續往下閱讀-----
所有討論 1
研之有物│中央研究院_96
296 篇文章 ・ 3652 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook