0

5
1

文字

分享

0
5
1

如何斷開中文峰峰相連的詞彙鎖鍊,讓電腦能讀懂字裡行間的語意?

研之有物│中央研究院_96
・2018/07/13 ・7302字 ・閱讀時間約 15 分鐘 ・SR值 536 ・七年級

  • 執行編輯|林婷嫻  美術編輯|張語辰

「自然語言處理」是什麼?

讓電腦擁有理解人類語言的能力,就是自然語言處理(Natural Language Processing,縮寫 NLP)。然而,人和人之間就會誤會彼此的語言了,電腦要如何理解語義?中研院資訊科學研究所的馬偉雲助研究員說明:以中文來說,最基本的,要先教電腦學會「斷詞」和「理解詞的意思」。

電腦和人腦的語言不同,那要如何讓電腦擁有理解人類語言的能力呢?source:maxpixel

如何理解一種語言?

小時候學習中文,會背誦課文詞彙的注釋,在作業簿練習這個詞的寫法。到了國中時期學英文,面對像天書般的英文文章,會把不懂的單字圈起來,拿出字典查這個字的意思。為什麼這樣做?

因為,詞彙是語言的最小單位。

然而,中文有一個特殊現象,就是「詞」和「詞」之間沒有邊界,整句串起來像條鎖鏈,不像英文有空格將每個字斷開。所以,若要理解一篇中文文章,必須先學會斷詞,而要學會斷詞,必須先知道這是一個詞、以及這個詞的意思。否則可能會產生這種令人「難過」的情況:

中文的詞沒有邊界,若誤解「詞的意思」與「句法結構」,會寫出這般造句練習。 資料來源/網路趣聞

那麼,問題來了,如果聰明的人類都會誤解複雜的語言,那麼只懂 011000110 的電腦有可能學會斷詞、甚至理解同一個詞在不同上下文的意思嗎?其實,這就是自然語言處理(Natural Language Processing)的研究目標。本文專訪中研院中文詞知識庫小組計畫主持人馬偉雲,聊聊自然語言處理究竟是什麼。

馬偉雲,是一名對於「讓機器擁有理解語言的能力」深感著迷的計算機科學家。 攝影/張語辰

「自然語言」有多自然?

我們先來了解「自然語言」的定義,與「程式語言」有什麼差別。

程式語言 vs. 自然語言 圖說設計/林婷嫻、張語辰

簡要來說,程式語言是人類為了與計算機溝通,而設計的人工語言;而自然語言的自然,是相對於「人工」語言的「自然」,換句話說,自然語言是人們溝通時自然地發展出來的語言。「自然語言處理」的目標,就在於讓電腦理解、或是運用人類語言。

如何教電腦學會一種語言?

若要讓電腦理解人類的語言,以中文來說,分成兩步驟:

第一步是斷詞、理解詞;第二步則是分析句子,包含語法及語義的自動解析。

自然語言處理透過這兩個步驟,將複雜的語言轉化為電腦容易處理、計算的形式。早期是人工訂定規則,現在則是讓機器自己學習。

早期的方式是基於一套詞彙資料庫,用程式語言寫好人工訂定的規則,讓電腦依指令做出反應。但這種人工方式不可能包含所有語言的歧異性,例如,當同樣的詞在不同上下文產生不同意思,就會和原本的人工規則相互牴觸。

1980 年代末期,自然語言處理引進機器學習(Machine Learning)的演算法,不再用程式語言命令電腦所有規則,而是建立演算法模型,讓電腦學會從訓練的資料中,尋找資料所含的特定模式和趨勢。我們實驗室──中研院的「中文詞知識庫小組」團隊──就是利用機器學習的演算法,讓電腦學會從訓練的資料中,自動歸納出語言的特性。

自然語言處理的演變。 圖說設計/林婷嫻、張語辰

訓練電腦處理自然語言,需要什麼樣的資料?

我們團隊成員涵蓋中研院語言所、資訊所的研究人員,所以我們也充分利用這兩個領域的專長。

首先,語言學家為九萬多個中文詞彙定義了完整的語法、以及語義表達方式,並且也標明詞彙之間的關係,例如:「蝴蝶」和「昆蟲」具備「前者是後者的一種」這樣的詞彙關係;「醫生」和「病人」具備「前者醫治後者」這樣的詞彙關係。這樣的表達構建了中文的知識圖譜,我們稱為「廣義知網」。

詞彙的語法、語義定義完畢後,接下來我們就依這些規則,大量分析文章中的每個句子、每個詞彙的語法和語義,並將分析的結果記錄下來 ,這就是「語料標注」的工作。這些標注的語料,提供給電腦系統進行機器學習,讓電腦學會自動歸納、找出語言的語法以及語義。

我們的想法是,既然語言學家已分析了某些語言結構的邏輯,那麼基於這些存在的語言學知識來教電腦歸納出語言的特性,是一種相當自然合理的方式。

只是我們大多數情況下,不會直接教電腦學會語言學上的規則,給它一條魚,不如給它一支釣竿。我們是給電腦看語言學家分析完成的大量結果,由電腦利用機器學習而自動歸納得到 「規則」, 並以參數的方式(請別擔心,一定是人們看得懂的形態),儲存在資訊學家所設計的模型當中。這種電腦自動學出來的模型,能夠很好地解決語言歧異性,也不會有人工寫死規則的問題。

電腦可以認識所有「詞」嗎?

語言的詞彙組合無窮無盡,不可能將所有詞都收進資料庫中訓練電腦。當電腦面對與時俱進的新詞,例如「郭書瑤」、「班奈狄克 · 康柏拜區」、「漫撕男」、「非典」,電腦就無法辨識、理解這個詞。

通常未知詞可分為幾種類型:可能是人名、可能是複合詞、或可能是專有名詞。

我們團隊將「中文斷詞」這個工作,切分成下圖 7 個步驟,每個步驟都是一種演算法模組,處理一種特別的問題。

中文斷詞系統的處理步驟。
資料來源/〈未知詞擷取作法〉,作者:馬偉雲

教電腦擷取人名,是相對單純的工作,因為人名的結構有跡可循。

中文人名通常是三個字、或兩個字,甚至能參考百家姓、某一年考生的所有名字來建立資料庫,例如「慧」、「婷」常出現在女性人名中,而「雄」這個字常用在男性人名中。從統計機率來看,有些字則是不可能作為人名使用。人名的前後文也會有一些暗示訊息,例如「XXX 表示…」、「 XXX 做了…」、「執行長 XXX」。當電腦分析訓練用的文章資料,自己找出這些規律,電腦就能學會判斷某些未知詞是否為人名。

此外,「複合詞」也是舉不勝舉的未知詞來源。

中文的複合詞,由相當隨性的詞性結構組成,例如「趣味性」,隨意置換字尾,就變成「趣味感」或是「趣味化」。複合詞的字差一點點,就能延伸許多詞意,這讓電腦需辨識的詞彙量變得無比龐大。這部分透過前輩們的研究,漸漸找出複合詞的組成邏輯,整理在中央研究院漢語平衡語料庫(標記了一千多萬個詞彙),也整理出常用詞首、詞尾字資料庫。

目前斷詞系統中的複合詞主要是針對「名詞複合詞」,但其實我們也在「動詞複合詞」上也累積了不少研究。舉一個實例來說明,例如「開聊」和「聊開」:

「開」的複合動詞結構舉例。
資料來源/〈現代漢語複合動詞之詞首詞尾研究〉,作者:邱智銘、駱季青、陳克健

從語言學的角度,動詞是句子的核心,也是最重要的中心語。「開」這個字有著動詞中心語的起始功能(inchoative),然而放在詞首、詞尾不同位置會產生些微差異。

除了人名、複合詞,新聞或網路文章還會看到許多新創的專有詞,例如:非典(SARS 重症非典型肺炎的簡稱)、河蟹(意指封鎖、掩蓋負面消息)。這類專有詞可以透過 bottom-up merging algorithm(合併字詞演算法)處理。

以「河蟹」為例,透過合併字詞演算法分析新聞、網路文章等資料,電腦會發現:通常「河」後面就是「蟹」,「蟹」前面就是「河」,「河蟹」兩個字一起出現的統計機率蠻高的,而且整組詞意無法單用「河」或「蟹」的各別字意取代。因此,電腦就會判斷「河蟹」最可能是個專有詞、並做出斷詞。

此外,就算是字典當中已經有的詞彙,有時候仍然會有不同斷詞的情況,我們必須根據上下文決定哪一種斷法才是正確的。例如:「努力才能成功」的「才能」應該切分為兩個詞彙:「才」和「能」,語義接近英文的 “to make”;而「他的領導才能很突出」的「才能」是一個詞彙,不可切分,在此表達英文的 “ability” 的意思。

語言學家會把這樣子的斷詞標注清楚,供電腦進行機器學習。經過不同語句的大量標注,電腦最後會自己學會利用「才能」的上下文做判斷。 資料來源/馬偉雲說明

電腦理解「詞」了,那「句子」呢?

學會斷詞、並理解個別的詞義之後,下一步我們就要使電腦學會理解整個句子的意思。例如「張三打李四」和「李四被張三打」,兩個句子雖然句型不同,但是語義卻是一樣。

我們怎麼表達句子的語義呢?答案是透過「結構樹」。

「張三打李四」和「李四被張三打」,兩個句子的結構樹。 資料來源/馬偉雲說明

我們將每個詞彙集結成片語,再把每個片語標記上它所扮演的語義角色(semantic role)。「張三」在兩個結構樹中都是「打」的發動者(agent)的角色,而「李四」都是「打」的對象(goal)的角色。如此一來,透過包含語義角色的結構樹,我們可以得知這兩個句子擁有相同的語義。

先透過人工訂好結構樹的表達,下一步就是要利用機器學習,使電腦能夠自動針對每一句產生出正確的結構樹。歷年來,中文詞知識庫小組從中央研究院漢語平衡語料庫抽取句子,經由電腦初步剖析成結構樹,再加以人工修正檢驗,共整理了六萬多個中文句結構樹圖,標注了各個中文句的語法以及語義角色,這些就形成機器學習的訓練材料,使得電腦剖析結構樹的工作越做越好。

自然語言處理的進展到了這裡,斷詞有解,句子結構及語義有解,但還有另一個難題──曖昧不清的指代詞。

寫作時為了避免某些詞重複出現,會使用別的指代詞,像是「他」、「某某職稱」等等。用句子舉例,「張三打李四,他很痛」,覺得痛的人究竟是誰?除了考量語句結構,也需基於常識和上下文來理解。

若要教電腦理解指代詞、處理「指代消解」(Coreference Resolution)的問題,有兩種方式。一種較傳統,用程式語言寫好所有判定的人工規則,好處是較精準,壞處是有其侷限,因為列舉的規則不可能對應至世間所有指代情形。另一種是機器學習的方式,當電腦分析所有訓練文章的上下文發現:幾乎都是被打的李四感到痛,「他 = 李四」這個相關性的機率即為最高,進而做為電腦日後判斷的準則。

自然語言處理的方法,有因「深度學習」而改變嗎?

近年來蓬勃發展的深度學習(Deep Learning),提出了另一種方法來教電腦表達詞彙。這種方法是將詞彙轉換為「詞向量」,也就是 Word Vector 或稱 Word Embedding,作法是讓電腦閱讀大量文章,利用前後文的統計特性,慢慢學習出每一個詞彙的詞向量,不必利用任何語言學知識。

詞向量的概念。(其中的向量數字為舉例) 資料來源/馬偉雲 圖說重製/林婷嫻、張語辰

舉例來說,傳統的符號學中,「蝴蝶」、「瓢蟲」、「爬」是不同的三個詞彙。但改成用向量思考,「蝴蝶」和「瓢蟲」的向量距離就會比較近,「蝴蝶」和「爬」的向量距離就會比較遠,隨著訓練的文本越來越多,電腦可以自動調整各個詞彙的向量,解決訓練資料不足的問題,並提升電腦的抽象化思考。

運用「詞向量」的好處是,很多時候針對特定的自然語言處理任務,訓練資料是不足的。因為許多字詞的語義,在人類語感上明明意思很接近、可以相通,但對機器來說,詞彙符號(也就是字元)不同,就是截然不同的詞彙,造成各個詞彙在訓練資料的統計佔比相當低,無法得到足夠信心水準的分析結果。

然而,訓練過程中,若我們以「詞彙向量」作統計,在向量空間上,有些字詞間的向量很靠近,團結力量大,就會發現相近的詞彙向量在訓練資料的統計佔比大幅提升,解決了訓練資料不足的困境。同時,詞彙向量在深度學習的模型之中,被視為可修改的參數,所以也具備了語義(詞彙向量)自動調整的能力。

You shall know a word by the company it keeps.

John Rupert Firth 這句古老的語言學名言,恰巧能說明「詞向量」的思維。其實每個詞就像一個人,若想了解這個人,可以觀察他身旁的人是什麼模樣,也就是物以類聚的概念。

我們團隊目前嘗試結合「傳統詞彙符號」與「詞向量」,共同從事自然語言處理的任務、以及教電腦表達知識。傳統詞彙符號的好處,在於提供清晰的解釋與穩定的應用,而詞向量可以解決訓練資料不足的困境,並且提供語義(詞彙向量)自動調整的能力。這兩者的長處互補,結合起來具有很高的學理價值、更多應用突破。

自然語言處理,有什麼用?

其實,自然語言處理的用途,已經悄悄在我們身邊幫上許多忙。

自然語言處理,常見的後續應用。 資料來源/李宏毅演講 圖說重製/林婷嫻、張語辰

例如,運用「摘要文本大綱」的能力,電腦可以擔任助手,幫助連睡覺時間都快沒有的醫生閱讀最新的醫學報告、篩選醫學文獻,找出眼前這位病患的病徵,可能跟哪些疾病相關、或是服用某種藥物可能有哪些副作用。像是 2017 年台北醫學大學,就導入 IBM 的 Watson for Oncology(人工智慧治療輔助系統),協助醫師診斷致病機制複雜的癌症。

現在許多人遇到地震、颱風等災害,第一步是上社群媒體發佈消息,例如哪裡的大樓倒了、哪些親友失聯了、各地需要捐助多少物資等等。若運用自然語言處理,讓電腦自動搜集、分析這些社群媒體的文本,就能幫助整合災情、協助救援。

另外,輿情分析聊天機器人等熱門應用,其基礎也需要先讓電腦理解人類所使用的語言,掌握其中的句法結構、分析字裡行間的情緒,才能統計輿情、或讓機器人做出適當的聊天回應。

自然語言處理,是時間的累積。從民國 75 年到現在,中研院資訊所和語言所合作建立許多語料庫和線上系統,我們很歡迎公家機關和公益團體無償使用,也歡迎有需求的單位來討論合作方式。

為什麼會對「讓電腦擁有語言能力」感到著迷?

我很幸運十幾年前有機會進入這個領域,那時候很驚嘆:怎麼會有一種學問,可以把「語言學」和「計算機科學」結合在一起。

語言是很複雜的現象,語言也代表人類的智慧,像是我們的思緒、意識,很多都是透過語言來展現。

1999 年那時候,我在交大電腦科學與資訊工程系碩士班是做語音辨識,那時候我只懂「聲音訊號」的處理,很好奇「語言」這塊怎麼讓電腦了解。當時和中研院接觸,知道中研院做了很多自然語言處理的工作,例如蒐集大量語料,用計算機的方式把語言的統計特性找出來。

後來我來到中研院服國防役,從研究助理做起,跟著陳克健老師研究中文的斷詞切分,也逐漸發現原來理解語言有非常多面向,包含:語音、詞彙本身的學問、語法結構(這句話怎麼說才合理)、語義解讀(這句話是什麼意思),還有「語用」,也就是什麼時候講這句話、為什麼要這樣講。

2006 年之後,我到美國哥倫比亞大學的電腦科學系讀碩博士,除了博士論文是做機器翻譯,也在那裡的實驗室研究電腦的 Q&A 系統:問電腦問題,讓電腦讀過一堆文獻後回答,這些文獻資料包含中文、英文和阿拉伯文,三種語言混合運用。因為國防上的需求,美國國防部需要透過電腦幫助,了解這些文本在說什麼。

有些對人工智慧發展的疑慮是,在近年電腦深度學習的運算過程中,不知道為什麼會這樣得出結果、難以控制電腦。但現在有一種發展方向,叫做「可解釋人工智慧」(Explainable AI),明確了解電腦運算過程,藉以優化表現、降低人們擔憂。舉例來說,當 IBM 的 Watson for Oncology 建議醫生要開刀治療病患,醫生也得知道電腦分析文本的過程、為什麼會下這個決策,不是電腦控制人而已。

至於之前曾傳出 Facebook 的 AI 對話失控,其實是過度擔憂。

因為這只是 Facebook 工程師教電腦學會「談判」的過程中,電腦自動將對話內容表達地極簡再極簡、能通就好。

當初唸書時,「自然語言」很冷門,跟別人說也不知道這是什麼東西,因為那時人工智慧在商業上還沒有實際應用,和我們的生活還很遙遠。選擇這個領域並不是因為有遠見,只是基於好奇參與、覺得這很有趣,過程就看到自然語言處理(NLP)蓬勃發展至今。

參考資料

本著作由研之有物製作,原文為〈斷開中文的鎖鍊!自然語言處理(NLP)〉以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。
本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

在網站上看不過癮?研之有物出書啦!

研之有物:穿越古今!中研院的25堂人文公開課》等著你來認識更多中研院精彩的研究。





文章難易度
研之有物│中央研究院_96
287 篇文章 ・ 2913 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

0
0

文字

分享

0
0
0
從工作評語、法餐菜單看出「石門水庫」的背後祕辛!——專訪中研院台灣史研究所顧雅文副研究員
研之有物│中央研究院_96
・2023/10/03 ・7733字 ・閱讀時間約 16 分鐘

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|田偲妤
  • 美術設計|蔡宛潔

一批詳實記載石門水庫大小事的檔案

每到枯水期、颱風季,新聞常會報導水庫的蓄水率,供應新北、桃園、新竹用水的「石門水庫」往往是關注重點。石門水庫已陪伴臺灣民眾走過一甲子歲月,在經濟部水利署北區水資源局的庫房中,留有一批被視為鎮局之寶的檔案,記載石門水庫從設計到興建期間的大小事。中央研究院臺灣史研究所團隊自 2020 年起進駐北水局 19 個月,重新整編 7 千多件、數十萬頁的檔案,又花了近一年研究解讀,終在 2023 年公開其中的 1,700 件、約 14 多萬頁「石門水庫建設委員會檔案」數位影像,並與北水局合作出版《石門水庫歷史檔案中的人與事》專書,藉由歷史檔案訴說一段段藏在紙張中的故事。

圖|研之有物(歷史照片|經濟部水利署北區水資源局)

說到臺灣北部的重要水庫,就不能不提「石門水庫」。這座橫跨桃園市大溪區、龍潭區、復興區與新竹縣關西鎮的水庫,是臺灣第一座多目標水庫,具備公共給水、灌溉、防洪、發電、觀光等功能。每到颱風季,觀看洪水從石門水庫溢洪道奔騰而出,是許多臺灣民眾共同的記憶;枯水期時,水庫的蓄水率也是近年民眾相當熟悉的新聞畫面。

儲存水流的水庫曾一度被視為解決水資源與洪水等問題的萬靈丹,但此一龐大水利工程的光環在環保運動中逐漸褪去。至今,人們對水庫充滿了複雜的情感與不同的評價。在此情形下,水庫的歷史更不該被淡忘,它就藏在石門水庫興建期間的檔案內,等待有心人為它們拂去灰塵、物歸原始脈絡,訴說一段段藏在紙張中的故事。

負責管理石門水庫的經濟部水利署北區水資源局(簡稱北水局),一直將這批石門水庫歷史檔案視為鎮局之寶。為了讓散落各處的檔案能有系統的典藏與近用,也希望透過研究深化檔案的歷史價值,北水局找上經驗豐富的中研院臺灣史研究所。

在與臺史所顧雅文副研究員、檔案館王麗蕉主任等團隊成員的合作下,2020 年 5 月至 2021 年 12 月間,臺史所團隊進駐北水局 19 個月,完成 7 千多件、數十萬頁檔案的整編工作,又花了近一年解讀研究。最終於 2023 年在臺史所檔案資源系統公開其中的 1,700 件、14 多萬頁的「石門水庫建設委員會檔案」(簡稱石建會檔案)數位影像,並出版《石門水庫歷史檔案中的人與事》專書。

(左起)中研院臺灣史研究所顧雅文副研究員、檔案館王麗蕉主任,帶領團隊完成「石門水庫建設委員會檔案」數位影像公開,並出版《石門水庫歷史檔案中的人與事》專書。
圖|研之有物

究竟這批走過一甲子歲月的檔案藏著什麼樣的故事?有哪些人參與水庫建設、受到水庫工程影響?褪去偉大工程的光環後,我們又該怎麼看待水庫的歷史與文化價值?

在揭曉檔案內容前,讓我們先將時間倒轉回日治時期的臺灣,回到那個築壩如築夢的年代。

日治時期對大壩的想像

顧雅文與團隊中的佛光大學助理教授簡佑丞,曾針對日治時期石門水庫的規劃與設計進行研究,揭開一段追求「大壩烏托邦」的歷史。

在日本領土建高壩的夢想源自曾任臺灣民政長官的後藤新平。1890 年赴德國留學的後藤受到歐陸建壩風潮影響,將「タールスペル(Talsperre)」(德文「山谷」及「阻塞」的複合字,意指「高壩」)水治理概念帶回日本。

在 1911 年一場日本帝國議會的預算審查會議中,時任遞信省大臣的後藤新平與議員展開關於水力發電調查費預算的辯論,揭示了他對多目標水庫的想法。後藤想像中的高壩具備蓄水、防洪、發電等功能,動工前需進行長期調查,掌握每年河川水量、流域地形、地質和雨量等資訊,才能以順應自然的方式築壩。但擔心潰堤造成嚴重災害的議員之言論,反映彼時世人對築壩仍感到陌生及擔憂。

在臺灣,後藤新平的想法也萌了芽。受到他的啟發,任職於臺灣總督府土木局的技師德見常雄,在 1907 年就提出要在石門興建多目標水庫的夢想。當時對水文環境條件的了解十分有限,這個構想在日治初期只是一個烏托邦,雖然沒有完整實現,但在石門築壩的企圖以「灌溉貯水池」的形式留了下來。

德見常雄提出以灌溉為主要目標的「石門大壩計畫」,被納入總督府的「官設埤圳事業」。不過,由於種種原因,土木局最後放棄了築壩的核心設計,改由「桃園大圳」替代,直接從大嵙崁溪(今大漢溪)取水,將溪水透過隧道與圳路幹線引至桃園臺地灌溉。另一方面,下游淡水河氾濫造成臺北水患不斷,土木局只得採行「輪中」治水方式,也就是用堤防將臺北市街包圍起來。

桃園大圳灌溉系統平面圖
圖|臺灣總督府公文類纂,冊文號:7279-1

然而,這兩個脫鈎的利水(桃園大圳)與治水(臺北輪中)計畫,卻在 1920 年代有了轉變。以石門大壩同時解決兩大問題的思想再次復活,這與壩工技術發展、國際局勢變化有關。

開始對外擴張的日本,為了對抗「充滿敵意的世界」,高度重視河水統制事業,而大壩則被視為最佳的科學處方,它能灌溉增加糧食,將洪水變成資源,還能發電促進工業。昭和時期,在統制思潮下的臺灣水利建設規劃,多帶有全流域綜合治理、以多目標水庫或水庫群為核心的特質,由此便不難理解石門水庫為何在 1920 年代末期重啟建設,且長成一個以水庫為核心,兼顧防洪、灌溉、發電及築港的巨型計畫。

總督府將此任務交由興建嘉南大圳有功的八田與一負責,可惜因戰爭爆發及預算問題,大壩烏托邦終究無法實現。不過,不管是桃園大圳、淡水河治水或築壩計畫,皆是日治時期的報紙熱議焦點,官方與民間對多目標水庫的殷切盼望,即便到戰後也未曾消失。

人定勝天?從多元視角看石門水庫的建成

興建石門水庫的計畫並沒有耽擱太久,1948 年起,臺灣省政府就有重啟計畫的企圖,鮮為人知的是,最初政府希望仰賴民間力量,以水利公司的形式籌措興建資金。而後,歷經國內外政經局勢的劇烈變化,石門水庫成為中央政府事業,並在美援的資源挹注下獲得建設經費,也得到美方專業技術的支援。

石門水庫的建設主要經歷三個階段,包括 1954 年的石門水庫設計委員會(簡稱石設會)、1955 年的石門水庫建設籌備委員會(簡稱石籌會),以及 1956 年的石門水庫建設委員會(簡稱石建會)。耗費 10 年時間,主體工程終在 1964 年竣工。

1964 年主體工程竣工至今,石門水庫再經歷兩代建設。 2023 年最新完工的阿姆坪防淤隧道,每年約可增加 64 萬噸清淤量,有助延長水庫壽命。
圖|研之有物(資料來源|經濟部水利署北區水資源局)

今日我們常以大事紀方式回顧重要事件,但這就如同只看到冰山的一角,埋沒了微觀、多元的歷史樣貌,這時檔案的角色就變得相當重要。王麗蕉表示,從檔案學的角度來看:

檔案是研究歷史的關鍵證據,因此在整編檔案時,最重要的是盡量完整呈現全貌。

為了不漏掉任何一段屬於石門水庫的歷史,臺史所團隊進駐北水局期間,希望盡量把所有檔案交給團隊整編。團隊成員盤點庫房中的檔案,也清查塵封在紙箱內未整理的文件,目標是讓檔案回歸最初的分類脈絡,日後檢索時能清楚知道,這件檔案來自哪個單位、當初怎麼產生。

在整編檔案的過程中發現,除了公文、會議紀錄、工程報告等公文書,還有為數眾多的照片與底片、設計大圖、工程師手稿與書信,甚至還留下一張菜單。檔案內容也遠不只與水庫建設相關,還能從中了解工程師生活、參訪賓客流程、民眾陳情等故事,這些也成為臺史所團隊構思專書敘事觀點的重要啟發。

石建會宴請越南總統吳廷琰的菜單。法式料理是 1960 年代的國宴標準形式,「牛肉茶」為當時流行的保健飲料,其源頭可追溯至普法戰爭時期法國士兵的營養品。「吉力明蝦」是以麵包粉裹炸的明蝦。主菜是烤雞佐火腿,配上法式炸薯條、奶油炒菜豆及蘆筍沙拉。甜點「香草沙法蘭」及「巧克力牛奶沙士」,今日更為大眾熟悉的名字是舒芙蕾及巧克力牛奶醬。
圖|經濟部水利署北區水資源局

顧雅文回顧當初構思專書敘事觀點的靈感,來自石建會檔案中一份 1958 年委託臺灣省電影製片廠拍攝紀錄片的腳本。紀錄片開頭帶領觀眾從宇宙望向地球,再聚焦到中華民國、臺灣北部,講述政府秉持「人力勝天」的精神不斷開發水資源,使臺灣的農田水利和水力發電工程,具有相當規模。

這是一個以單一鳥瞰鏡頭凸顯偉大建設的英雄式敘事觀點,同時隱含以水庫征服大自然的人定勝天象徵。然而,在環保與人權意識抬頭後,水庫工程被視為破壞自然、與民爭地的元兇。

面對極端的論述,身為環境史學者的顧雅文試圖帶入不一樣的思考:一味陳述工程的宏偉與進步當然不是好的書寫方式,但把一切人工構造物都視為罪惡就能理解水庫嗎?一些研究者已試圖對環境史寫作中強烈的悲觀主義進行反思。

此外,過去強調「科學勝利」的水利工程界也開始反省,在水患威脅或缺水危機不斷加劇的今日呼籲起「水文化」概念,避免以工程作為唯一的治理手段,而是嘗試從歷史中尋找解方,了解過去人們怎麼與水共存。

顧雅文注意到,環境史學界與水利工程界在看水庫問題時,逐漸趨向跨域共構,尊重並學習彼此的觀點。她希望這本書擺脫歌頌宏偉建設及治理效益的論調,從各種尺度與視角描繪石門水庫,因而將觀察時間拉長,試圖從日本帝國、戰後中華民國、國際與在地的各種視角探尋建水庫的歷史脈絡。更重要的是去追溯建設過程中身處不同時代、角色、立場的人物眼中的水庫,因為這正是跨域學習最好的橋樑。石建會檔案豐富多元的記錄,讓這種書寫方式成為可能。

編寫專書就像在拍另一部紀錄片,但這次不是將鏡頭定格在北臺灣,而是在不同視角中交錯切換,並從直昇機走下來,捕捉呈現統治者、外籍及國內工程師、水庫淹沒區與安置區居民、都市計畫專家或參訪賓客們對石門水庫的多重敘事。

針對美國工程師的犀利評價

在參與石門水庫工程的眾多人員中,有一群來自美國的工程師。石建會根據美援規定,透過美國國際合作總署遴聘提愛姆斯公司協助工程設計與監驗、莫克公司擔任施工顧問,並協助訓練臺灣技術人員。

美國莫克公司協助訓練臺灣的技術人員
圖|經濟部水利署北區水資源局

與美方的合作不僅為臺灣帶進建造水庫的工程技術,也讓施工與監工各司其職的制度成為日後臺灣營造工程的慣例。然而,看似順利的臺美合作,實際上是在不斷爭執與磨合的過程中進行。

在石建會檔案中,有一份美國莫克公司人員合約狀態報告表,上頭由臺灣高階工程師為美國工程師的工作表現寫上評語,方便石建會進行人事評估。只見泛黃紙張上的藍色墨水筆跡寫到:Bassette 工作熱心而負責、Bonnington 不善指揮訓練、Kingery 性情粗暴擬同意遣返等犀利評論。

這似乎暗示著美方與我方工程師之間,或許並非想像中簡單的「援助—被援助」、「指導—被指導」關係。事實上,石門水庫作為跨國、跨文化、跨部門的大規模工程,發生爭執在所難免,大至國際情勢、物料跨國移動、公款運用,小至職業操守、工作習慣、組織文化等,在在考驗兩國工程師的相處韌性。

標註著工作評語的莫克公司人員合約狀態報告表
圖|經濟部水利署北區水資源局

臺、美兩國的工程師除了在工作上朝夕相處,在生活中也成為鄰居。浩大的水庫工程仰賴大批人力長期投入,並為水庫周遭帶入新居民。上千名工程人員攜家帶眷搬入位於桃園龍潭十一份地區的總辦公區域,或是鄰近大壩工區的臨時性宿舍。

其中,外籍顧問宿舍特別仿效美國獨門獨院社區型式,備有泳池、運動場、高爾夫球果嶺等設施。另設有飯廳、醫務所、幼稚園、福利社等公有設施,滿足全體員工及眷屬的基本生活需求。

1959 年十一份總辦公區平面圖,右區為外籍顧問宿舍、左區為一般員工宿舍,合計近 3 百戶。另設有飯廳、醫務所、幼稚園、福利社等公有設施。
圖|經濟部水利署北區水資源局

在石建會檔案中還發現許多社團活動文件,為員工自發性組成的社團,包含集郵社、橋牌社、圍棋社、攝影社、羽毛球隊、排球隊、網球隊等。細看集郵社留下的集郵狀況調查表,有社員寫到「幼年曾集郵,兵亂遺失。赴美(1956-1958)集郵以解除旅中寂寞。」呈現大時代下小人物們的生命片段。

石建會水利橋社留下的橋牌玩法與規則,推測應是受美國文化影響而傳入臺灣。
圖|經濟部水利署北區水資源

水庫建造計畫之下的多方衝突

因水庫工程而遷入的新居民正準備迎接新生活,居住在水庫淹沒區的民眾則面臨被迫搬遷的命運。興建水庫的工程用地需徵購千餘公頃土地,開始蓄水後更將淹沒 6 百餘公頃的土地與民房,有 4 百多戶、2 千多位「水庫移民」需另尋他處安置。

透過媒體報導及既有研究可知,水庫移民被迫多次搬遷、辛苦開墾海口與河川荒地、土地被大潭工業區污染等辛酸血淚史,但在時間壓力下如何取得安置地的詳細歷程卻少有人了解。尤其許多物色到的安置地並非想像中的無人荒地,早已被農民開墾,如何在兼顧農民生活與協助移民安置之間取得平衡,成為一道難題。

在石建會檔案中,有多件農民抗議耕地遭奪取的陳情書,其中有一張辦公室遭破壞的照片,記錄下 1960 年 4 月在桃園觀音鄉樹林子安置地的衝突現場。

桃園觀音鄉樹林子移民小組辦公室遭破壞照片
圖|經濟部水利署北區水資源局

當天負責移民事務的趙技正遇上前來理論土地問題的吳家父子,不只辦公桌被推翻,還被揍了一拳。吳家人之所以如此憤怒,與家中農地被劃入移民安置區有關。

經石建會調查,吳家的農地屬於禁止開墾的保安林地,現因安置需求而被規劃使用。為了讓安置作業及早完成,石建會不僅向新竹地方法院主動提供照片證據,還數度發文要求依法嚴辦。

地方法院要求在期限內將土地復原,並具結永不再犯,但此判決讓石建會與吳家都不滿意。石建會想要遏止侵墾歪風,上訴到高等法院;吳家也是滿腹委屈,自認是在戰後「反共抗俄、鼓勵墾荒」的口號下響應國策,因而轉向省政府、省議會、桃園縣議會陳情,甚至將陳情書上呈副總統兼行政院長陳誠,希望政府能體恤貧民。

沒想到看似塵埃落定的事件竟出現轉機,原來要移做安置區的保安林地中還有桃園縣政府出租給人民的土地,縣府及觀音鄉人員皆主張「據以收回頗有窒礙」。為此, 1959 年特別訂定「移民新地處理四項原則」,當中規定:撥用前由縣府放租之土地,及撥用前人民濫墾成熟之土地一律暫不收回。吳家據此再度遞交陳情書,石建會在諮詢顧問律師確認該原則能溯及既往後,最終裁定把土地還給吳家。

吳家父子一吐多年怨氣,將之前遭受農損的情緒發洩在趙技正身上,該事件在當地派出所調停下以和解告終,但從趙技正呈給上級的報告可看到基層員工的處境:既要「辦理解除林木,推平土地,劃分田坵,興建學校,整修道路,規劃移民新村……試植各種農作物」等工作,又要晝夜巡守,力保土地不被侵墾,還需隨時面對地方居民的不滿。

從這個例子可得知,水庫移民的歷史不只兩個主角,有時是石建會、移民及安置區原墾民三方角力攻防的故事。

移民新村紅磚建築落成景觀,看似和平的畫面卻暗藏多方衝突。
圖|經濟部水利署北區水資源局

歷史檔案間的連結:官方文件下的暗潮洶湧

閱讀檔案有助我們了解過去身影模糊的一群人,從不同角度看到歷史耐人尋味的面向。檔案經過有系統整編與研究後,許多暗藏的驚喜也一一浮現。

王麗蕉提到,在整理石設會時期的會議紀錄時,其中一份 1954 年 11 月 29 日的石門水庫壩高決議紀錄中,看到一個熟悉的名字「劉永楙」。劉永楙曾代表臺灣省建設廳出席石門水庫設計會議,而臺史所正好典藏了劉永楙的日記。

對照當天的日記才得知,整場會議出現意見分歧,從上午 11 點激辯到下午 3 點,水庫的壩高才定案。但從官方紀錄只看到平鋪直敘的「標高 250 公尺為石門水庫大壩之壩高,獲得通過」,絲毫感受不到會議現場的緊張氣氛。在不同類型文獻的交互參照下,事件的發生經過得以具體還原。

1954 年 11 月 29 日劉永楙在日記中寫到:「今日又赴石門開會,決定壩高為 250 公尺,爭辯劇烈,至三時方決定此數。」
圖|中央研究院臺灣史研究所

另一個驚喜則意外串起一段跨國緣分。某天臺大生命科學系于宏燦教授與顧雅文聯絡,表示自己正在蒐集資料,準備在恩師 William (Bill) Z. Lidicker Jr. 博士的紀念研討會上演講。聽說這位恩師的父親曾任職石門水庫,見過許多臺灣政要,希望顧雅文可以協助確認恩師父親的身分。

當時顧雅文剛好看完撰寫美國工程師篇章的作者羅文君的草稿,想起當中提及一位提愛姆斯公司的首席工程師 William Z. Lidicker,經確認果然是恩師的父親。在北水局及羅文君的協助下,于宏燦教授於石建會檔案中找到 Lidicker 的手稿、書信與年輕時的照片,成功完成演講。

演講當天出席的家屬大受感動,又輾轉寄來一本 Lidicker 生前與其孫 Jeffery Lidicker 共同完成的自傳,讓檔案中的人物形象更加躍然紙上。

顧雅文與王麗蕉認為,檔案就像大壩一樣,大壩儲存了水流,讓洪水變成資源,而檔案儲存了時間洪流中的人與事,讓團隊的作者們據此撰寫成歷史,這些過往就不再是無意義的瑣碎細節,而是澆灌臺灣水文化的養分。民眾可從中知道石門水庫的治理思維從何而來、為何如此設計、為何尋求美援、帶來什麼深遠影響,以及作為文化資產有何價值。

你要先知道過去才能思索未來,我們的研究成果就是一個交流平台。

研究團隊翻閱精心編寫的專書,回顧一點一滴累積的成果,如今已水到渠成、充滿無限可能!

(左起)中研院臺灣史研究所檔案館王麗蕉主任、顧雅文副研究員、李依陵館員,翻閱精心編寫的專書,回顧一點一滴累積的研究成果。
圖|研之有物
研之有物│中央研究院_96
287 篇文章 ・ 2913 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

0
1

文字

分享

1
0
1
考試好煩!你知道考試原來的作用是什麼嗎?——專訪中研院近代史研究所徐兆安助研究員
研之有物│中央研究院_96
・2023/09/16 ・4800字 ・閱讀時間約 10 分鐘

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|李芊
  • 責任編輯|田偲妤
  • 美術設計|蔡宛潔

考試制度是怎麼從科舉變成今天這個樣子的?

我們從小到大經歷過無數次考試,但你是否有想過,這個影響我們求學與就業的重要制度是因何而起?究竟考試制度背後隱藏哪些驚人內幕?中央研究院「研之有物」專訪院內近代史研究所徐兆安助研究員,帶我們回到清末民初的教育現場,探索政府與教育界如何應用考試,挽救岌岌可危的新式教育制度,雙方又如何相互制衡與合作,讓考試及學校成為管控社會秩序的利器。

升大學分科測驗成績出爐,路過補習班紅榜,你是否想過考試的目的?
圖|研之有物

對於在臺灣準備升高中的九年級學生、準備升大學的高三生來說,也許一年的劃分就是以冬季與夏季的升學考試為依據。在競爭激烈的職場中,優秀學歷成為社會新鮮人的最佳利器,但想謀得好學歷就必須力拚考試高分,讓考試成為跨世代臺灣人共同的記憶。

儘管持續有教改團體針對考試的內容、形式、公平性等提出改革建議,但數十年來,眾多考生與家長依然接受了升學考試制度,投入大量時間、精力備考,更不惜砸重金搶補教名師課程。

我們的一生經歷過大大小小的考試,卻不一定清楚這些考試制度當初成立的目的。

事實上,在民國初年,新式教育剛施行的 1920、1930 年代,曾經考試除了用來測驗學生,更被用來監督學校的辦學成效。

專長明清及近代思想史、制度史的中研院近代史研究所徐兆安助研究員,深入探討 1905 年科舉廢除後的新式教育制度,訴說一段政府與學校透過考試相互制衡與合作的詭譎歷史。

中研院近代史研究所徐兆安助研究員
圖|研之有物

要怎麼讓社會接受新式學校的文憑?來考個試吧!

在談現代考試制度之前,讓我們先回到清末科舉存廢的關鍵時刻。

1900 至 1901 年八國聯軍攻佔北京,科舉考場「貢院」遭到破壞,當時受科舉宰制的教育與選才方式已成眾矢之的,該將有限的國家資源拿來修復貢院,還是發展新式教育制度,在 1905 年成為各方人馬的爭論焦點。在這次辯論中,廢除科舉最終定案,新式教育制度成為肩負國家教育大業的主要系統。

然而,科舉與新式教育的不同目的與學習過程,卻帶來新的價值觀混亂。

首先,在科舉制度下,為了一舉成名而寒窗苦讀者,不需在私塾或書院待滿固定年限,大半時間是靠自學通過層層考試關卡。但是,接受新式教育的學生必須依序就讀小學、中學、大學等學校,一級一級往上累積學歷,且每個學歷都有固定的修業年限。

1928 年的新式教育學制,每個學歷都有學齡與修業年限規範。
圖|研之有物

身處當代教育環境的我們已經很習慣循序漸進的學習制度,但清末民初的人們卻一時難以適應。新式學校不像傳統書院會發學習津貼給學生,還要收取相對高額的學雜費。畢業後還要面臨社會對學校文憑的不信任,一時難以成為求職的有效助力。

許多學生一開始受政府鼓吹而進入學校就讀,卻經常未完成修業年限即離開校園,「教育破產」很快成為政府與社會各界的共識,而學校便成為被究責的單位。

廢除科舉後的十多年間,各界的討論開始聚焦於該如何監督學校、管制學生。到了 1920 年代,政府與教育界推出了各種校外考試的實驗方案。這些方案大同小異,都預設考試可以成為規範學校、解決「教育破產」的重要手段。

是什麼讓考試成為評鑑辦學效率的方法?——「以簡馭繁」的法家精神

支持考試論的學者以史學家呂思勉、厚黑學作者李宗吾為首,面對民國初年的教育破產危機,他們為何都倡議由國家透過集體考試來監督學校呢?

一方面,用監察態度面對學校起因於對教育界的不信任,這可追溯至廢除科舉後的教育改革過程並不公開透明。新式教育的推行牽涉政府官員、半官方與非官方代表,包含辦學人員、民間教育會、教科書出版商等,他們彼此拉扯出錯綜複雜的利害關係、形成勢力龐大的教育界。

李、呂二人身涉教育事務,看到學校各種圖利卻未自我要求的行為,因而認為一個審核學校的機制勢在必行。

李、呂二人更主張,考試制度還能讓教育過程更有彈性,學生只要通過考試即可證明自己的實力。因此,學生可以選擇私塾或新式學校等不同的學習方式,不需受到學校修業年限的硬性規範。而且不同學習機構並存還可強化競爭力,促使學校為了招生而更積極辦學。

另一方面,對當時的國民政府來說,在國家資源有限的情況下,國家只需負擔統一大考即可由上而下監督學校,提醒學校要維持該有的教學品質。這樣秉持法家「以簡馭繁」精神的手段,使考試制度最終受到執政當局的採用

「我不要考試啦!」學生的反彈與思想控制的開始

1932 年政府正式頒布《中小學學生畢業會考暫行規程》,卻受到各地師生的反抗。對於參加會考的學生來說,會考對取得學歷、升學和職涯發展都沒有明顯好處。

首先,單就畢業資格來說,不參加會考也能在修業期滿後獲得學歷,一旦參加會考卻成績不及格,反倒會被留級。再來,許多大學並不以通過會考作為入學資格。最後,除非想要成為公務員或任職國營機構,畢業生沒有會考成績也可直接應聘私人單位。整體看來,不參加會考才是比較聰明的選擇。

面對反抗考試的學生,一意推行會考制度的國民政府,採用相當直接的手段回應:以武力逼迫學生就範。

臺灣在 1970 年代出了一位拒絕聯考的小子,時間回到 1930 年代的中國,不願考試的可不只一、二位學生。1932 年,山東濟南高中學生因反對會考而與校方展開對峙,最終在教育廳長出動軍警武力鎮壓後落幕,卻造成大批學生受傷、被勒令退學。

1919 年 5 月 4 日,天安門廣場聚集北京 13 家大學逾 3 千名學生。五四運動開啟近代學生運動浪潮,卻也讓各政權擔心學生會動搖社會秩序,進而應用學校與考試制度加以管制。
圖|Wikimedia

隔年 1933 年,政府再根據實施情況及各方意見修改規程,最大的改變是取消小學畢業會考,轉而針對初級和高級中學制定《中學畢業會考規程》、《中學畢業會考委員會規程》。針對中學施行會考的原因之一是,當局認為小學生還年幼,不像中學生會發起學運,至此,會考除了監督學校以外,更加上了控制學生思想行為的功能。

學校各自為政,會考制度名存實亡

至於考試論支持者最重視的「以考試監督並制衡學校」卻反而沒有達成。預設的中央化考試制度、標準化知識內容,實際執行時卻面臨經費與人力嚴重不足的困境。真正負責考試業務的單位並非中央政府,而是非官方、地方仕紳聯合形成的教育會,或者資源多寡不一的各地省政府。

地方資源的多寡深刻影響考試的舉行。例如,大規模考試為了防堵作弊,通常不讓考生在原校就考,但在不可能另撥經費建造考場的情況下,仍舊得仰賴學校提供大量考場。如果一個地方沒有足夠的學校,學生往往就在原校就考,在熟悉的環境享受主場優勢,甚至發生老師協助作弊等醜聞。

此外,照理來說,各校的考生名單應該由中央政府統一管理,但無力建立管理機制的政府只好交由學校來處理報考業務。有些學校因而私下篩選成績好的學生參加考試。

不久,隨著 1937 年抗日戰爭的全面爆發,各省行政資源逐漸耗竭、多地交通中斷、學生四散,集中考試變得難以辦理,改以「抽考」部分學生作為學校整體畢業標準指標,甚至讓學校自行辦理會考,政府僅派代表監臨。

自此,會考可說名存實亡。雖曾短暫於 1957 年在臺灣復辦,將國文、史地、三民主義的會考成績與聯考合併計算,試圖鼓勵學生重視中華民族主義的相關知識。但會考與聯考的標準無法整合,在各方反對之下,僅一年時間便告終,結束近 20 年的政府與學校角力之爭。

會考的考試科目包含:黨義(公民)、國文、算學、物理、化學、生物、歷史、地理、外國語。其中「黨義」後改稱「三民主義」,主要教授孫中山提出之民族、民權、民生思想,以及國民黨反共抗俄理念。圖為 1951 年南投縣立初級中學課堂,黑板上寫著「奉行三民主義,擁護反共抗俄」。
圖|Wikimedia

為了什麼而考?不同治理方法中有不同目的

徐兆安出生於英國殖民時代末期的香港,身處的教育制度仍然相對寬鬆,通常上午 8 點半上課、下午 4 點即放學,在升學上並未經歷臺灣式的考試高壓。來臺求學與就業的過程中,他逐漸體會臺灣教育與升學考試之間緊密的關係,印象最深刻的是補習班門口榜單滿掛的盛況!

如今在臺灣結婚生子的徐兆安,開始想像女兒長大後必經的升學考試歷程,研究近代中國考試制度,有助了解臺灣過去 70 多年的考試發展脈絡,讓他更認識臺灣親友的生長背景。

徐兆安出生於英國殖民時代末期的香港,在升學上未經歷臺灣式的考試高壓。研究近代中國考試制度,有助了解臺灣過去 70 多年的考試發展脈絡。
圖|研之有物

徐兆安想深入探討的是:「廢了科舉以後,為什麼我們現在還這麼相信考試?中間發生什麼事?作為一個歷史學家,我覺得現有的解釋還不完整,跳過很多具體的事件。」

我們需要了解細節,以避免誤解的延續。今日我們在臺灣所共同面對的升學體制,並不是直接延續自科舉的產物。對歷史的誤解,會讓我們無法確切把握教育問題的病源。

事實上,在科舉與現代考試之間還有一段歷史需要填補。校外中央化考試的立意不僅是監督學校的辦學成效,更隱含執政者對學生的高度不信任。尤其在五四運動後,一連串的學運讓學生被視為動搖社會秩序者,因而以考試制衡學校、也間接淘汰反抗的學生。

國民政府遷臺後,1949 年起在臺灣實施長達 38 年又 56 天的戒嚴令,也連帶改變過去制衡學校與淘汰學生的作法,轉而讓學校成為吸納大批學生、管控社會秩序的幫手。考試的目的之一遂變成把學生依照分數高低分發至不同學校予以教導

在臺灣戒嚴時期,學校成為吸納大批學生、管控社會秩序的幫手。考試的目的之一遂變成把學生依照分數高低分發至不同學校予以教導。
圖|iStock

目前徐兆安正著手進行科舉與近代考試制度的研究出版計畫,他認為近代史的研究難題在於材料「既多又少」。所謂「多」是指,各種出版與轉引的材料往往多到難以處理。所謂「少」則是指,特定材料宛如試金石,讓研究者理解眾多一般材料背後的真正意義,但這些關鍵材料卻相當稀少,且分散在兩岸以至歐美的各個機構中。

徐兆安生動比喻自己的研究過程:「就像跳探戈一樣,周旋在多與少之間,這是近代史學者比古代史學者更困難的地方。」

即使困難重重,近代史學者仍持續蒐集並解讀每筆文獻,修正對過往事件的刻板印象,讓歷史盡可能以貼近事實的方式呈現,我們因而能更明白自己承續的故事和當下的處境。

所有討論 1
研之有物│中央研究院_96
287 篇文章 ・ 2913 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

1
0

文字

分享

1
1
0
語言也是一種證據!南島語族發源地竟在臺灣?——專訪語言學研究所張永利研究員
研之有物│中央研究院_96
・2023/08/27 ・4908字 ・閱讀時間約 10 分鐘

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|田偲妤
  • 美術設計|蔡宛潔

南島語族的起源與變遷

南島語族發源自何方?是學界長期探索的焦點,在眾多研究領域中,語言學界為分布在南太平洋與印度洋諸島的族群確立關係,分類命名為南島語族(Austronesian-speaking peoples) 。除此之外,還有許多語言證據指出,南島語族可能是從臺灣擴散出去。中央研究院「研之有物」專訪院內語言學研究所張永利研究員,為我們深入分析,臺灣南島語保存哪些其他南島語「丟失的現象」,可以藉此重建南島語族的發展源頭與遷徙路徑。

嘉義阿里山鄉新美國小學生獻唱鄒族古謠。圖|Wikimedia

南島語族的發源地究竟在何方?目前已有越來越多證據指出,南島語族可能是從臺灣出發,遷徙至廣大的南太平洋與印度洋島嶼開枝散葉。

考古學家在臺灣、呂宋島、大洋洲等地出土相似的陶器碎片,經年代鑑定後發現,最早的繩紋紅陶陶器來自 5、6 千年前的臺灣大坌坑文化。植物學家則對各地的構樹樣本進行分子親緣分析,發現南太平洋島嶼的構樹應源自臺灣,推測先民帶著樹皮衣材料構樹,自臺灣遷徙至南太平洋諸島。

除了上述證據,還有一樣活在生活周遭的非物質遺產,能作為南島語族「出臺灣說」的有力證據,那就是臺灣原住民族正在使用的「語言」!

中研院語言學研究所是研究與推廣「臺灣南島語」的重要基地,走進語言所典藏豐富研究著作的展覽室,投身臺灣南島語研究近 30 年的張永利研究員,與我們熱情分享語言學家的工作。

各地南島語言的特徵與變遷,是語言學家長期探索的問題,多年來一位位研究者深入原住民族部落,用羅馬拼音一字一句記錄部落長者的口語發音,經由比較臺灣與其他地區南島語言的關連與特徵,南島語族的發展源頭與遷徙路徑就在歷代語言學家的重建下現形。

中研院語言學研究所張永利研究員,投身南島語言研究近 30 年,與我們熱情分享語言學家的工作。圖|研之有物

如何確定臺灣南島語更接近原始南島語?同源詞繁簡成線索

南島語族是總人口數近 4 億人的龐大族群,其分布範圍北到臺灣、南到紐西蘭、東到復活節島、西到馬達加斯加。臺灣是南島語族分布的最北界,目前官方認定的原住民族共有 16 族,每個族群都有自己的語言,在整個南島語族 10 個主要語言分支中,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。

南島語族 10 個主要語言分支,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。圖|研之有物    資料來源|Blust, 1999: 45

「曾有外國學者讚嘆:南島語言是上帝送給臺灣的禮物!」張永利逐步分析臺灣南島語的珍貴之處:「考古和語言證據推估,臺灣南島語至少有 5 千年歷史,而麻六甲海峽附近國家使用的馬來語只有 2 千多年而已。此外,臺灣南島語還保留一些其他語言丟失的現象。」

所謂「丟失的現象」正是語言學家證實臺灣南島語較古老、可能是南島語族早期祖居地的關鍵證據。藉由歷史語言學方法比較南島語言之間的親緣關係與發展先後,丟失的現象慢慢浮現,成為值得研究的案例。

首先,語言學家特別構擬出一套「原始南島語」作為比較標準,音韻、構詞、句法越接近原始南島語者,就越有可能是族群發源地。

要構擬出原始南島語並不簡單,語言學家無法穿越時空回到 5 千年前,必須集結全球語言學家的力量,深入各個南島語族聚落採集語言材料,再從中找出語音、語意相似的「同源詞」做比較。由於語言變化的過程經常發生「由繁趨簡」現象,因此發音越複雜的語言通常越古老,語言學家再從較古老的語言構擬出原始南島語。

張永利舉同源詞「眼睛」為例,說明臺灣南島語較為古老的原因。眼睛的原始南島語是「maCa」(大 C 的發音為 ts 複合音,同注音符號ㄗ),而臺灣的排灣語是「maca」,其發音與原始南島語相同。

再看看馬來語的眼睛是「mata」,ts 複合音明顯簡化成 t,發生語言「由繁趨簡」的現象,證明臺灣南島語比馬來語更古老。

從同源詞「眼睛」的語音變化可發現,排灣語、鄒語較接近原始南島語,而賽夏語、馬來語的發音出現簡化現象,從中可看出族群發展的先後順序。圖|研之有物    資料來源|張永利

張永利進一步解釋,為何「由繁趨簡」現象可看出語言發展的先後順序:「有人可能會質疑,為什麼語言不是從簡單變複雜,發音由 t 變成 ts?如果是這樣你要解釋,多出來的 s 音是怎麼無中生有。這就如同人類社會的變遷,從複雜變簡單通常有跡可循,但無中生有需要創新的力量,從來不是簡單的事。」

這些語言有畫面!從同源詞推測千年前的生活型態

同源詞還可以重建南島語族原初的生活環境。根據語言學家的觀察,能成為同源詞的單字通常是日常使用的基本詞彙,例如爸爸、媽媽等親屬稱呼、數字 1 到 10,或是眼睛、頭、手、腳等身體部位。

因此,如果還能發現動物、植物、生活器具的同源詞,代表這些事物是曾經長時間存在的文化,才得以跨越千年時空在語言中留下印記,成為一窺南島語族原初生活環境的線索。

語言學家從原始南島語、原始排灣語、原始泰雅語、原始鄒語彙整出 100 個基本同源詞,當中包含許多指稱農作物、野生動植物、生活日用品的字詞:

原始南島語同源詞反映之自然與文化特徵。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 17-22

從上述同源詞可推測,原始南島語族應該是以稻作維生,擅長紡織與編織技藝,生活周遭可見「露兜樹、甘蔗、藤」、「河鰻、田鼠、蒼蠅」等主要分布在亞熱帶地區的動植物。這些同源詞所反映的自然與文化特徵,對解答南島語族發源地問題具有相當大的啟發。

此外,從某些同源詞的語意轉變還可看出指稱的是外來事物。例如鄒語的「水牛」叫作「’ua chumu」,「chumu」是指「水」,但「’ua」最初並不是指「牛」,其真正的意思是「鹿」。換句話說,水牛應該是外來物種,推測鄒族先民看到外來的牛,跟鹿一樣都是四隻腳的大型哺乳類動物,因而發生「指鹿為牛」的情形。

講話講重點!第一個字就表明重點的「焦點系統」

除了從同源詞可以證明臺灣南島語較接近原始南島語,語言學家還發現,比起其他地方的南島語言,臺灣南島語保存最完整的「焦點系統」。這是一種非常古老的文法,在世界其他語言中並不常見。

焦點系統是用來凸顯一句話中想要強調的焦點,主要分成主事、受事、處所、工具共 4 種焦點,每種焦點都有相對應的動詞詞綴變化,並會在重點字詞前方加上格位標記 a。

由於南島語言習慣將動詞置於句首,等於你聽到第一個字就知道說話者想強調什麼。以下為 4 種焦點在排灣語的使用方式:

排灣語焦點系統應用,句首動詞 qaljup(打獵)會因應不同焦點而加上不同詞綴,焦點前方也會加上格位標記 a 來指稱重點。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 8

古老的修飾用語:副動詞

最後一個臺灣南島語較為古老的證據在於,其詞類相當有限,主要是動詞、名詞的應用,沒有真正的副詞、形容詞等修飾詞。但是當有需要用到修飾用語時該怎麼辦?這就輪到特殊的「副動詞」登場!

副動詞顧名思義是指:具副詞作用的動詞,是臺灣南島語經常使用的詞類。張永利秀出排灣語和馬來語的句子,進一步說明副動詞與一般副詞的不同:

圖|研之有物    資料來源|張永利

排灣語的「g<em>alju」就是一個副動詞,意思是「慢」,之所以看出它是一種動詞,關鍵在於它跟後頭表示「吃」的動詞「k<em>an」有一樣的詞綴變化「em」。而中間的連繫詞 a 亦可應證「g<em>alju」與「k<em>an」應同屬於動詞。此外,「g<em>alju」的後面連接附著代詞「aken」表示「我」的意思,附著代詞一般會貼在動詞上。

值得注意的是,古老的副動詞在臺灣南島語言普遍保留下來,但是在臺灣之外的南島語言,如馬來語,卻通常都已經丟失。

綜上所述,從同源詞複雜度、焦點系統完整性、使用詞類有限等語言證據可知,臺灣南島語在目前已知的上千種南島語中,其古老排名可說名列前茅,也代表臺灣可能是南島語族早期的祖居地。

張永利表示:「綜合歸納現在的語言和考古證據,我們可以畫出南島語族遷徙路徑,基本上是從臺灣遷徙出去,先遷往菲律賓群島,再往南到婆羅州一帶,隨後一分為二,分別往東方太平洋和西方印度洋遷徙。」

南島語族遷徙路徑。圖|研之有物    資料來源|Bellwood, 2011

用「說」的文化資產——母語

對張永利來說,越深入研究就越能體會,臺灣南島語真的是臺灣千年不墜的國寶!除了持續在學界發表臺灣南島語的概念運用規則,張永利也會到原住民部落推廣族語,多年來也跟國內語言學家一起編寫鄒語、噶瑪蘭語、賽德克語等族語教科書。

張永利研究員持續研究臺灣南島語的概念運用規則,多年來編寫多本族語教科書,更前往部落推廣族語。圖|研之有物

在與族人互動的過程中,張永利發現,年輕族人為了溝通方便,有簡化族語的傾向,以致某些傳統用語漸漸流失。

以鄒語為例,傳統上在說 11 這個數字時,老人家會講 maskx veiya ucni,「maskx」是 10、「ucni」是 1,中間的「veiya」是「回來」的意思,翻譯成中文就是「10 回 1」,可見鄒族會使用十進位來算數,可是現在的年輕人通常會省略「veiya」的用法。

另外名字的說法也發生簡化現象,例如有一位鄒族人的名字是 Pasuya、家族名是 Tiakiana,老人家會講 Pasu’e Tiakiana,大致的意思是「來自 Tiakiana 家族的 Pasuya」。但是現在的年輕人就直接講 Pasuya Tiakiana,身分證上的名字也這樣登記。

面對日漸普遍的族語簡化現象,張永利有感而發的說:「年輕人覺得只要聽得懂就好,但我會跟他們說,語言也是文化的一部分,而且很多說法只存在特定族群中,想復振傳統文化就要講道地的族語。」

一般人常將語言視為溝通工具,認為只要能有效溝通就好,然而深諳語言奧妙的張永利卻有不同看法:

語言也是一種文化資產,不論是臺灣南島語、華語、臺語或客語都有其文化特色,具有身分識別作用。

「母語能留著就是你的寶藏,現在『特色』就是你最重要的資產!」母語是臺語的張永利不僅在學術場域研究語言,更在日常生活中透過多使用母語來保存語言資產。「語言不是只寫在教科書、或在課堂上唸,一定要積極使用,這樣語言才能真的活起來!」

千年以來,臺灣這座南島語族的原鄉發展出眾多語言文化各具特色的族群,如今在族人及語言學家的努力下,族語的復振工作正如火如荼進行,許多正名成功的族群紛紛從族語找回身分認同,找回值得守護的南島語族寶藏。

噶瑪蘭族自 2002 年 12 月 25 日正式被認定為原住民的第 11 族,其族語至今依然被族人保存使用,並編印成噶瑪蘭語辭典、語法書,作為學校鄉土教學的教材。圖|Wikimedia
所有討論 1
研之有物│中央研究院_96
287 篇文章 ・ 2913 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook