0

1
0

文字

分享

0
1
0

最難的語言存在嗎?語言學研究對外語學習會有幫助嗎?——語言學家林若望專訪

研之有物│中央研究院_96
・2018/03/15 ・4110字 ・閱讀時間約 8 分鐘 ・SR值 566 ・九年級

-----廣告,請繼續往下閱讀-----

  • 採訪編輯/黃楷元 美術編輯/張語辰
圖/Maialisa @Pixabay

人類能成為「萬物之靈」,「語言」扮演著極其重要的角色。透過語言,我們累積知識、傳遞文化,逐漸形成多元繽紛的文明體系。研究語言學,從深層的角度看,是對於人類本質的探究;而從務實面,語言學從不同語系的異與同之間找出邏輯與規則,更有助於外語的學習。

在文章開始之前,請先給你自己拍拍手。為什麼?因為你正在進行一件高難度的任務──閱讀中文。

許多正式或非正式的排名中,「漢語/中文/ Mandarin」都被列為最難學習的語言之一。光是中文裡的平上去入聲調、同音字、破音字,就已經夠讓外國人頭大了,更別提中文字的一筆一畫,看在他們眼中簡直就是不聽話的外星蚯蚓。

所以我們可以輕鬆流利地使用中文,真是件值得驕傲的事情,對吧?中文這麼難,是不是顯示我們比外國人聰明呢?

中文學習對於許多外國人來說是件艱難任務,坊間甚至流傳一則網路謠言,假藉聯合國教科文組織名義,把中文封為「最難學習的語言」。雖然實際上聯合國不曾做過這份調查,但以 「the hardest language to learn」為關鍵字,的確可以找到許多嚴謹程度不一的心得或資料,支持這個論點,例如這份這份資料。 圖說設計/黃楷元、張語辰

語言沒有難不難,端看找不找得到「開關」

很可惜,不是這樣的。世界上並不存在「最難」的語言。

-----廣告,請繼續往下閱讀-----

因為語言的學習困難度是相對的,要看它在族譜上,跟你的「母語」距離遠近而定。

比方說,母語為台語的人學習客家話或是國語,因為同樣是漢語方言,語法結構較相近,就會比較容易;又比如,因為日語在漢字上借用中文字,以日文為母語的人,學習中文字也會比英文為母語的人來得快速。

而且,「母語」的學習,可能根本就沒有「難易度」的問題。

「一個小嬰兒,不管他的血統人種是什麼,你讓他從小聽英語、他就會講英語;從小聽中文、他就會講中文;你讓他在非洲部落長大,他就會說流利的非洲話。」中研院語言學研究所的林若望所長說,「世界上有 4000 至 6000 種語言,以可能性來說,他可以學會任何一種語言。」

擔任中研院語言學研究所所長的林若望,研究語言學已經將近卅年,是國內少數精研「語意學」領域的學者。 攝影/張語辰

兩三歲的幼兒認知能力尚未成熟,也許左邊右邊不會區分、加法減法算不清楚,但在母語的掌握度上,卻能以驚人的速度成長。四歲以前,我們每個人都當過一段時間的語言天才。這種「奇蹟」的成因,語言學大師 Noam Chomsky 認為,這是嬰兒的「語言本能」,就跟視覺聽覺這些感官能力一樣與生俱來。

-----廣告,請繼續往下閱讀-----

不過這樣的語言學習效率,在我們長大後反而不復存在。於是,我們學習外語時,總會有些環節頭痛萬分。可能是背不起來的英文單字、複雜瑣碎的文法問題、或是那些永遠發不標準的西語彈舌音。

林若望認為,我們也許未必能重現嬰幼兒時期的語言學習效率,但只要找到語言學習的某些「開關」,學習外文其實沒有這麼困難。

鏡中倒影:中文與英文的對稱句法結構

林若望先從多數人最熟悉的外文──英文,開始談起。

中文和英文是南轅北轍的兩種語言:拼寫上,中文是表意文字、英文是拼音文字;聲音上,中文是聲調語言、英文是重音語言。其他還有很多語序和文法上的差異,例如姓名的順序,就剛好相反:

-----廣告,請繼續往下閱讀-----

中文的姓名,我們會先講家族姓氏、然後才是個人名字;但英文相反,先名後姓,這是什麼原因呢?

大多數人被問到這個問題,最先聯想到的答案應該是:「華人的家庭觀念較重,所以家族姓氏放前面;西方社會重視個體,因此反過來。」這說法聽似合理,畢竟語言的確會受到傳統文化的影響。

那麼,如果這個邏輯成立,林若望繼續追問,中文和英文在「日期」和「地址」的寫法上,又有何差異?

姓名、日期、以及地址在中英文中的寫法對照。圖說設計/黃楷元、張語辰

從上方表格可以看出,中文和英文順序相反的不只是姓名,日期和地址的寫法也是。若前述「比較重視家庭觀念」的原因成立,那麼難道英美語系的人重視「日」勝過於「年」?重視門牌多過城市國家?看來,「重要性」這個邏輯,無法類推到日期和地址的順序上。

接著,林若望繼續舉了個句子為例:

-----廣告,請繼續往下閱讀-----
中英文句法結構的對照,同意義的字詞以相同顏色顯示,可以比對出句法的結構順序。 圖說設計/黃楷元、張語辰

這兩個句子,除了主詞之外的所有詞語,順序又剛好相反。連續幾個範例看下來,我們大概可以猜出個端倪了。原來,中文和英文雖然差異很大,但在句法結構上,它們就像是鏡子裡外的兩人,彼此對稱。

從語言學的角度,每個句子都是一齣戲,裡面最核心的「劇本」,就是動詞。

林若望繼續用前面的句子為例,「讀書/ study」就是核心劇本(動詞),「約翰/ John」是主角,其他用來補充動詞的就是配角(修飾語),跟動詞配在一起形成「動詞片語」。

動詞是句子中的核心,也就是「中心語」。從圖中可以看出,中文與英文的中心語位置剛好是相反的。 圖說設計/黃楷元、張語辰

好玩的來了,英文句子中,動詞是領頭走在最前面,所有配角跟在後頭;而中文的句型,卻是先讓配角們出場,核心的動詞在最後壓軸。

語感關鍵:「中心語在前」vs.「中心語在後」

林若望解釋,語言學中,有一種語言分類方式,是依照「中心語的位置」。

-----廣告,請繼續往下閱讀-----

英文就是一種相對於修飾語,「中心語在前」的語言,重要的元素打頭陣,後面再補充說明;中文剛好相反,是「中心語在後」的語言,所以語序上反而是修飾語先出場,然後才是中心語。

這種基本「中心語在前」或是「中心語在後」的規則差異,就能夠用來解釋姓名、日期、和地址在中英文裡的相反順序了。

以姓名來說,姓氏只是縮小範圍用的修飾語(例如:周家人),名字才是準確指涉特定身分的中心語(例如:周家的杰倫)。中英文的姓名先後順序,就是決定於中心語的位置。中文「中心語在後」,所以先姓後名,英文「中心語在前」,所以先名後姓。英文日期、地址的概念,也是如此。

林若望表示,套句語言學的專業術語,中文和英文擁有不同的「中心語參數(head parameter)」。在不同的語言中,找出類似這樣的參數規則,就是語言學家致力研究的面向之一。「就好像一個語言裡面有一整排開關,當我們掌握了一項參數,就打開了其中一個開關。你打開的開關越多,學習這種語言就會越事半功倍。」

一般人談到語言學習時常提到的抽象詞彙──「語感」,其實就是如此。理出規則、舉一反三、類推適用,什麼希臘文、非洲語,一下子好像也沒那麼可怕了。加把勁,也許你也可以重現自己四歲前「語言天才」的光輝榮景!

-----廣告,請繼續往下閱讀-----

所以您的研究是找出語言規則、幫大家學好外文嗎?

(笑)其實不是這樣的。找出這些規則固然是件有趣的事,不過以「中心語位置」這個參數來說,其實是語言學中「句法學」這一支的關注面向。句法學是我碩士以前的領域,從博士學位開始,我真正鑽研的領域是「語意學」,特別是「邏輯語意學」。

我的研究基本上是用數學及邏輯的工具,研究語言的意義是如何產生出來的,像是以數學中的集合、函數等觀念,來解釋語言意思的組合運算。在台灣,我算是第一個做這方面研究的語言學家,也是整個大中華區域少數作這方面研究的。

那麼為何您會喜歡研究語言學?並且專研語意學領域?

這種研究的興趣,是循序漸進的。大學修課接觸到語言學,側重的是「句法結構」的部分。那時吸引我的,就是找出語言規則和論證的過程。後來,在清大攻讀研究所碩士的時候,我開始著迷於語言中一種「對稱的美」,很想進一步知道這種對稱之美是如何形成的,於是就這樣一路專研下來,並到美國攻讀語言學博士。

其實我真正學習語意學是在撰寫博士論文時。碩士時期,台灣清華大學的老師把我的句法學底子打得很好,所以到國外讀博士時,句法學這門課相當輕鬆,但是「邏輯語意學」則是一門從來沒聽過的課,用到了許多哲學、邏輯以及數學的概念,直到寫博士論文前,我對這門學問都還一知半解。

-----廣告,請繼續往下閱讀-----

但想到以前碩士班的老師說:「人的手上一定要有兩把刀子,將來才不會捉襟見肘」,於是硬著頭皮找了系上著名語意學大師 Angelika Kratzer 當指導教授,在邊學邊寫的情形下完成博士論文,也正式讓我走上邏輯語意學這條道路。

語言學的研究很有趣,特別是我的研究領域不需要倚賴什麼貴重設備,通常只要需要我的大腦、文獻資料和語言資料庫,隨時隨地都可以一篇文章或是一書在手,就天馬行空地遨遊於想像世界,享受鑽研的樂趣,不會被外在環境所限制,所以研究這樣的一門學問,真的是很享受。

有些研究就是我在散步時想出來的,手腳快一點的話,幾個禮拜就可以完成。

語意學,其實台灣研究的人真的不算多。所以不管我做什麼,很容易就成為先鋒。看到別人沒有看過的風景、讓後來的人必須跟著我的足跡,不也是一件很過癮的事情嗎?

延伸閱讀:

本著作由研之有物製作,原文為《世上不存在「最難」的語言?專訪語言學家林若望》以創用CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位

文章難易度
研之有物│中央研究院_96
296 篇文章 ・ 3568 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

0

3
3

文字

分享

0
3
3
圖形處理單元與人工智慧
賴昭正_96
・2024/06/24 ・6944字 ・閱讀時間約 14 分鐘

-----廣告,請繼續往下閱讀-----

  • 作者/賴昭正|前清大化學系教授、系主任、所長;合創科學月刊

我擔心人工智慧可能會完全取代人類。如果人們能設計電腦病毒,那麼就會有人設計出能夠自我改進和複製的人工智慧。 這將是一種超越人類的新生命形式。

——史蒂芬.霍金(Stephen Hawking) 英國理論物理學家

大約在八十年前,當第一台數位計算機出現時,一些電腦科學家便一直致力於讓機器具有像人類一樣的智慧;但七十年後,還是沒有機器能夠可靠地提供人類程度的語言或影像辨識功能。誰又想到「人工智慧」(Artificial Intelligent,簡稱 AI)的能力最近十年突然起飛,在許多(所有?)領域的測試中擊敗了人類,正在改變各個領域——包括假新聞的製造與散佈——的生態。

圖形處理單元(graphic process unit,簡稱 GPU)是這場「人工智慧」革命中的最大助手。它的興起使得九年前還是個小公司的 Nvidia(英偉達)股票從每股不到 $5,上升到今天(5 月 24 日)每股超過 $1000(註一)的全世界第三大公司,其創辦人(之一)兼首席執行官、出生於台南的黃仁勳(Jenson Huang)也一躍成為全世界排名 20 內的大富豪、台灣家喻戶曉的名人!可是多少人了解圖形處理單元是什麼嗎?到底是時勢造英雄,還是英雄造時勢?

黃仁勳出席2016年台北國際電腦展
Nvidia 的崛起究竟是時勢造英雄,還是英雄造時勢?圖/wikimedia

在回答這問題之前,筆者得先聲明筆者不是學電腦的,因此在這裡所能談的只是與電腦設計細節無關的基本原理。筆者認為將原理轉成實用工具是專家的事,不是我們外行人需要了解的;但作為一位現在的知識分子或公民,了解基本原理則是必備的條件:例如了解「能量不滅定律」就可以不用仔細分析,即可判斷永動機是騙人的;又如現在可攜帶型冷氣機充斥市面上,它們不用往室外排廢熱氣,就可以提供屋內冷氣,讀者買嗎?

CPU 與 GPU

不管是大型電腦或個人電腦都需具有「中央處理單元」(central process unit,簡稱 CPU)。CPU 是電腦的「腦」,其電子電路負責處理所有軟體正確運作所需的所有任務,如算術、邏輯、控制、輸入和輸出操作等等。雖然早期的設計即可以讓一個指令同時做兩、三件不同的工作;但為了簡單化,我們在這裡所談的工作將只是執行算術和邏輯運算的工作(arithmetic and logic unit,簡稱 ALU),如將兩個數加在一起。在這一簡化的定義下,CPU 在任何一個時刻均只能執行一件工作而已。

-----廣告,請繼續往下閱讀-----

在個人電腦剛出現只能用於一般事物的處理時,CPU 均能非常勝任地完成任務。但電腦圖形和動畫的出現帶來了第一批運算密集型工作負載後,CPU 開始顯示心有餘而力不足:例如電玩動畫需要應用程式處理數以萬計的像素(pixel),每個像素都有自己的顏色、光強度、和運動等, 使得 CPU 根本沒辦法在短時間內完成這些工作。於是出現了主機板上之「顯示插卡」來支援補助 CPU。

1999 年,英偉達將其一「具有集成變換、照明、三角形設定/裁剪、和透過應用程式從模型產生二維或三維影像的單晶片處理器」(註二)定位為「世界上第一款 GPU」,「GPU」這一名詞於焉誕生。不像 CPU,GPU 可以在同一個時刻執行許多算術和邏輯運算的工作,快速地完成圖形和動畫的變化。

依序計算和平行計算

一部電腦 CPU 如何計算 7×5+6/3 呢?因每一時刻只能做一件事,所以其步驟為:

  • 計算 7×5;
  • 計算 6/3;
  • 將結果相加。

總共需要 3 個運算時間。但如果我們有兩個 CPU 呢?很多工作便可以同時(平行)進行:

-----廣告,請繼續往下閱讀-----
  • 同時計算 7×5 及 6/3;
  • 將結果相加。

只需要 2 個運算時間,比單獨的 CPU 減少了一個。這看起來好像沒節省多少時間,但如果我們有 16 對 a×b 要相加呢?單獨的 CPU 需要 31 個運算的時間(16 個 × 的運算時間及 15 個 + 的運算時間),而有 16 個小 CPU 的 GPU 則只需要 5 個運算的時間(1 個 × 的運算時間及 4 個 + 的運算時間)!

現在就讓我們來看看為什麼稱 GPU 為「圖形」處理單元。圖一左圖《我愛科學》一書擺斜了,如何將它擺正成右圖呢? 一句話:「將整個圖逆時針方向旋轉 θ 即可」。但因為左圖是由上百萬個像素點(座標 x, y)組成的,所以這句簡單的話可讓 CPU 忙得不亦樂乎了:每一點的座標都必須做如下的轉換

x’ = x cosθ + y sinθ

y’ = -x sinθ+ y cosθ

-----廣告,請繼續往下閱讀-----

即每一點均需要做四個 × 及兩個 + 的運算!如果每一運算需要 10-6 秒,那麼讓《我愛科學》一書做個簡單的角度旋轉,便需要 6 秒,這豈是電動玩具畫面變化所能接受的?

圖形處理的例子

人類的許多發明都是基於需要的關係,因此電腦硬件設計家便開始思考:這些點轉換都是獨立的,為什麼我們不讓它們同時進行(平行運算,parallel processing)呢?於是專門用來處理「圖形」的處理單元出現了——就是我們現在所知的 GPU。如果一個 GPU 可以同時處理 106 運算,那上圖的轉換只需 10-6 秒鐘!

GPU 的興起

GPU 可分成兩種:

  • 整合式圖形「卡」(integrated graphics)是內建於 CPU 中的 GPU,所以不是插卡,它與 CPU 共享系統記憶體,沒有單獨的記憶體組來儲存圖形/視訊,主要用於大部分的個人電腦及筆記型電腦上;早期英特爾(Intel)因為不讓插卡 GPU 侵蝕主機的地盤,在這方面的研發佔領先的地位,約佔 68% 的市場。
  • 獨立顯示卡(discrete graphics)有不與 CPU 共享的自己專用內存;由於與處理器晶片分離,它會消耗更多電量並產生大量熱量;然而,也正是因為有自己的記憶體來源和電源,它可以比整合式顯示卡提供更高的效能。

2007 年,英偉達發布了可以在獨立 GPU 上進行平行處理的軟體層後,科學家發現獨立 GPU 不但能夠快速處理圖形變化,在需要大量計算才能實現特定結果的任務上也非常有效,因此開啟了為計算密集型的實用題目編寫 GPU 程式的領域。如今獨立 GPU 的應用範圍已遠遠超出當初圖形處理,不但擴大到醫學影像和地震成像等之複雜圖像和影片編輯及視覺化,也應用於駕駛、導航、天氣預報、大資料庫分析、機器學習、人工智慧、加密貨幣挖礦、及分子動力學模擬(註三)等其它領域。獨立 GPU 已成為人工智慧生態系統中不可或缺的一部分,正在改變我們的生活方式及許多行業的遊戲規則。英特爾在這方面發展較遲,遠遠落在英偉達(80%)及超微半導體公司(Advance Micro Devices Inc.,19%,註四)之後,大約只有 1% 的市場。

-----廣告,請繼續往下閱讀-----
典型的CPU與GPU架構

事實上現在的中央處理單元也不再是真正的「單元」,而是如圖二可含有多個可以同時處理運算的核心(core)單元。GPU 犧牲大量快取和控制單元以獲得更多的處理核心,因此其核心功能不如 CPU 核心強大,但它們能同時高速執行大量相同的指令,在平行運算中發揮強大作用。現在電腦通常具有 2 到 64 個核心;GPU 則具有上千、甚至上萬的核心。

結論

我們一看到《我愛科學》這本書,不需要一點一點地從左上到右下慢慢掃描,即可瞬間知道它上面有書名、出版社等,也知道它擺斜了。這種「平行運作」的能力不僅限於視覺,它也延伸到其它感官和認知功能。例如筆者在清華大學授課時常犯的一個毛病是:嘴巴在講,腦筋思考已經不知往前跑了多少公里,常常為了追趕而越講越快,將不少學生拋到腦後!這不表示筆者聰明,因為研究人員發現我們的大腦具有同時處理和解釋大量感官輸入的能力。

人工智慧是一種讓電腦或機器能夠模擬人類智慧和解決問題能力的科技,因此必須如人腦一樣能同時並行地處理許多資料。學過矩陣(matrix)的讀者應該知道,如果用矩陣和向量(vector)表達,上面所談到之座標轉換將是非常簡潔的(註五)。而矩陣和向量計算正是機器學習(machine learning)演算法的基礎!也正是獨立圖形處理單元最強大的功能所在!因此我們可以了解為什麼 GPU 會成為人工智慧開發的基石:它們的架構就是充分利用並行處理,來快速執行多個操作,進行訓練電腦或機器以人腦之思考與學習的方式處理資料——稱為「深度學習」(deep learning)。

黃仁勳在 5 月 22 日的發布業績新聞上謂:「下一次工業革命已經開始了:企業界和各國正與英偉達合作,將價值數萬億美元的傳統資料中心轉變為加速運算及新型資料中心——人工智慧工廠——以生產新商品『人工智慧』。人工智慧將為每個產業帶來顯著的生產力提升,幫助企業降低成本和提高能源效率,同時擴大收入機會。」

附錄

人工智慧的實用例子:下面一段是微軟的「copilot」代書、谷歌的「translate」代譯之「one paragraph summary of GPU and AI」。讀完後,讀者是不是認為筆者該退休了?

-----廣告,請繼續往下閱讀-----

GPU(圖形處理單元)和 AI(人工智慧)之間的協同作用徹底改變了高效能運算領域。GPU 具有平行處理能力,特別適合人工智慧和機器學習所需的複雜資料密集運算。這導致了影像和視訊處理等領域的重大進步,使自動駕駛和臉部辨識等技術變得更加高效和可靠。NVIDIA 開發的平行運算平台 CUDA 進一步提高了 GPU 的效率,使開發人員能夠透過將人工智慧問題分解為更小的、可管理的、可同時處理的任務來解決這些問題。這不僅加快了人工智慧研究的步伐,而且使其更具成本效益,因為 GPU 可以在很短的時間內執行與多個 CPU 相同的任務。隨著人工智慧的不斷發展,GPU 的角色可能會變得更加不可或缺,推動各產業的創新和新的可能性。大腦透過神經元網路實現這一目標,這些神經元網路可以獨立但有凝聚力地工作,使我們能夠執行複雜的任務,例如駕駛、導航、觀察交通信號、聽音樂並同時規劃我們的路線。此外,研究表明,與非人類動物相比,人類大腦具有更多平行通路,這表明我們的神經處理具有更高的複雜性。這個複雜的系統證明了我們認知功能的卓越適應性和效率。我們可以一邊和朋友聊天一邊走在街上,一邊聽音樂一邊做飯,或一邊聽講座一邊做筆記。人工智慧是模擬人類腦神經網路的科技,因此必須能同時並行地來處理許多資料。研究人員發現了人腦通訊網路具有一個在獼猴或小鼠中未觀察獨特特徵:透過多個並行路徑傳輸訊息,因此具有令人難以置信的多任務處理能力。

註解

(註一)當讀者看到此篇文章時,其股票已一股換十股,現在每一股約在 $100 左右。

(註二)組裝或升級過個人電腦的讀者或許還記得「英偉達精視 256」(GeForce 256)插卡吧?

(註三)筆者於 1984 年離開清華大學到 IBM 時,就是參加了被認為全世界使用電腦時間最多的量子化學家、IBM「院士(fellow)」Enrico Clementi 的團隊:因為當時英偉達還未有可以在 GPU 上進行平行處理的軟體層,我們只能自己寫軟體將 8 台中型電腦(非 IBM 品牌!)與一大型電腦連接來做平行運算,進行分子動力學模擬等的科學研究。如果晚生 30 年或許就不會那麼辛苦了?

-----廣告,請繼續往下閱讀-----

(註四)補助個人電腦用的 GPU 品牌到 2000 年時只剩下兩大主導廠商:英偉達及 ATI(Array Technology Inc.)。後者是出生於香港之四位中國人於 1985 年在加拿大安大略省成立,2006 年被超微半導體公司收購,品牌於 2010 年被淘汰。超微半導體公司於 2014 年 10 月提升台南出生之蘇姿豐(Lisa Tzwu-Fang Su)博士為執行長後,股票從每股 $4 左右,上升到今天每股超過 $160,其市值已經是英特爾的兩倍,完全擺脫了在後者陰影下求生存的小眾玩家角色,正在挑戰英偉達的 GPU 市場。順便一題:超微半導體公司現任總裁(兼 AI 策略負責人)為出生於台北的彭明博(Victor Peng);與黃仁勳及蘇姿豐一樣,也是小時候就隨父母親移居到美國。

(註五)

延伸閱讀

  • 熱力學與能源利用」,《科學月刊》,1982 年 3 月號;收集於《我愛科學》(華騰文化有限公司,2017 年 12 月出版),轉載於「嘉義市政府全球資訊網」。
  • 網路安全技術與比特幣」,《科學月刊》,2020 年 11 月號;轉載於「善科教育基金會」的《科技大補帖》專欄。
文章難易度

討論功能關閉中。

賴昭正_96
43 篇文章 ・ 56 位粉絲
成功大學化學工程系學士,芝加哥大學化學物理博士。在芝大時與一群留學生合創「科學月刊」。一直想回國貢獻所學,因此畢業後不久即回清大化學系任教。自認平易近人,但教學嚴謹,因此穫有「賴大刀」之惡名!於1982年時當選爲 清大化學系新一代的年青首任系主任兼所長;但壯志難酬,兩年後即辭職到美留浪。晚期曾回台蓋工廠及創業,均應「水土不服」而鎩羽而歸。正式退休後,除了開始又爲科學月刊寫文章外,全職帶小孫女(半歲起);現已成七歲之小孫女的BFF(2015)。首先接觸到泛科學是因爲科學月刊將我的一篇文章「愛因斯坦的最大的錯誤一宇宙論常數」推薦到泛科學重登。

2

1
0

文字

分享

2
1
0
語言也是一種證據!南島語族發源地竟在臺灣?——專訪語言學研究所張永利研究員
研之有物│中央研究院_96
・2023/08/27 ・4908字 ・閱讀時間約 10 分鐘

-----廣告,請繼續往下閱讀-----

本文轉載自中央研究院「研之有物」,為「中研院廣告」

  • 採訪撰文|田偲妤
  • 美術設計|蔡宛潔

南島語族的起源與變遷

南島語族發源自何方?是學界長期探索的焦點,在眾多研究領域中,語言學界為分布在南太平洋與印度洋諸島的族群確立關係,分類命名為南島語族(Austronesian-speaking peoples) 。除此之外,還有許多語言證據指出,南島語族可能是從臺灣擴散出去。中央研究院「研之有物」專訪院內語言學研究所張永利研究員,為我們深入分析,臺灣南島語保存哪些其他南島語「丟失的現象」,可以藉此重建南島語族的發展源頭與遷徙路徑。

嘉義阿里山鄉新美國小學生獻唱鄒族古謠。圖|Wikimedia

南島語族的發源地究竟在何方?目前已有越來越多證據指出,南島語族可能是從臺灣出發,遷徙至廣大的南太平洋與印度洋島嶼開枝散葉。

考古學家在臺灣、呂宋島、大洋洲等地出土相似的陶器碎片,經年代鑑定後發現,最早的繩紋紅陶陶器來自 5、6 千年前的臺灣大坌坑文化。植物學家則對各地的構樹樣本進行分子親緣分析,發現南太平洋島嶼的構樹應源自臺灣,推測先民帶著樹皮衣材料構樹,自臺灣遷徙至南太平洋諸島。

除了上述證據,還有一樣活在生活周遭的非物質遺產,能作為南島語族「出臺灣說」的有力證據,那就是臺灣原住民族正在使用的「語言」!

-----廣告,請繼續往下閱讀-----

中研院語言學研究所是研究與推廣「臺灣南島語」的重要基地,走進語言所典藏豐富研究著作的展覽室,投身臺灣南島語研究近 30 年的張永利研究員,與我們熱情分享語言學家的工作。

各地南島語言的特徵與變遷,是語言學家長期探索的問題,多年來一位位研究者深入原住民族部落,用羅馬拼音一字一句記錄部落長者的口語發音,經由比較臺灣與其他地區南島語言的關連與特徵,南島語族的發展源頭與遷徙路徑就在歷代語言學家的重建下現形。

中研院語言學研究所張永利研究員,投身南島語言研究近 30 年,與我們熱情分享語言學家的工作。圖|研之有物

如何確定臺灣南島語更接近原始南島語?同源詞繁簡成線索

南島語族是總人口數近 4 億人的龐大族群,其分布範圍北到臺灣、南到紐西蘭、東到復活節島、西到馬達加斯加。臺灣是南島語族分布的最北界,目前官方認定的原住民族共有 16 族,每個族群都有自己的語言,在整個南島語族 10 個主要語言分支中,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。

南島語族 10 個主要語言分支,臺灣南島語就佔了 9 個分支,其語言多樣性與存古性為世界少見。圖|研之有物    資料來源|Blust, 1999: 45

「曾有外國學者讚嘆:南島語言是上帝送給臺灣的禮物!」張永利逐步分析臺灣南島語的珍貴之處:「考古和語言證據推估,臺灣南島語至少有 5 千年歷史,而麻六甲海峽附近國家使用的馬來語只有 2 千多年而已。此外,臺灣南島語還保留一些其他語言丟失的現象。」

-----廣告,請繼續往下閱讀-----

所謂「丟失的現象」正是語言學家證實臺灣南島語較古老、可能是南島語族早期祖居地的關鍵證據。藉由歷史語言學方法比較南島語言之間的親緣關係與發展先後,丟失的現象慢慢浮現,成為值得研究的案例。

首先,語言學家特別構擬出一套「原始南島語」作為比較標準,音韻、構詞、句法越接近原始南島語者,就越有可能是族群發源地。

要構擬出原始南島語並不簡單,語言學家無法穿越時空回到 5 千年前,必須集結全球語言學家的力量,深入各個南島語族聚落採集語言材料,再從中找出語音、語意相似的「同源詞」做比較。由於語言變化的過程經常發生「由繁趨簡」現象,因此發音越複雜的語言通常越古老,語言學家再從較古老的語言構擬出原始南島語。

張永利舉同源詞「眼睛」為例,說明臺灣南島語較為古老的原因。眼睛的原始南島語是「maCa」(大 C 的發音為 ts 複合音,同注音符號ㄗ),而臺灣的排灣語是「maca」,其發音與原始南島語相同。

再看看馬來語的眼睛是「mata」,ts 複合音明顯簡化成 t,發生語言「由繁趨簡」的現象,證明臺灣南島語比馬來語更古老。

-----廣告,請繼續往下閱讀-----
從同源詞「眼睛」的語音變化可發現,排灣語、鄒語較接近原始南島語,而賽夏語、馬來語的發音出現簡化現象,從中可看出族群發展的先後順序。圖|研之有物    資料來源|張永利

張永利進一步解釋,為何「由繁趨簡」現象可看出語言發展的先後順序:「有人可能會質疑,為什麼語言不是從簡單變複雜,發音由 t 變成 ts?如果是這樣你要解釋,多出來的 s 音是怎麼無中生有。這就如同人類社會的變遷,從複雜變簡單通常有跡可循,但無中生有需要創新的力量,從來不是簡單的事。」

這些語言有畫面!從同源詞推測千年前的生活型態

同源詞還可以重建南島語族原初的生活環境。根據語言學家的觀察,能成為同源詞的單字通常是日常使用的基本詞彙,例如爸爸、媽媽等親屬稱呼、數字 1 到 10,或是眼睛、頭、手、腳等身體部位。

因此,如果還能發現動物、植物、生活器具的同源詞,代表這些事物是曾經長時間存在的文化,才得以跨越千年時空在語言中留下印記,成為一窺南島語族原初生活環境的線索。

語言學家從原始南島語、原始排灣語、原始泰雅語、原始鄒語彙整出 100 個基本同源詞,當中包含許多指稱農作物、野生動植物、生活日用品的字詞:

-----廣告,請繼續往下閱讀-----
原始南島語同源詞反映之自然與文化特徵。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 17-22

從上述同源詞可推測,原始南島語族應該是以稻作維生,擅長紡織與編織技藝,生活周遭可見「露兜樹、甘蔗、藤」、「河鰻、田鼠、蒼蠅」等主要分布在亞熱帶地區的動植物。這些同源詞所反映的自然與文化特徵,對解答南島語族發源地問題具有相當大的啟發。

此外,從某些同源詞的語意轉變還可看出指稱的是外來事物。例如鄒語的「水牛」叫作「’ua chumu」,「chumu」是指「水」,但「’ua」最初並不是指「牛」,其真正的意思是「鹿」。換句話說,水牛應該是外來物種,推測鄒族先民看到外來的牛,跟鹿一樣都是四隻腳的大型哺乳類動物,因而發生「指鹿為牛」的情形。

講話講重點!第一個字就表明重點的「焦點系統」

除了從同源詞可以證明臺灣南島語較接近原始南島語,語言學家還發現,比起其他地方的南島語言,臺灣南島語保存最完整的「焦點系統」。這是一種非常古老的文法,在世界其他語言中並不常見。

焦點系統是用來凸顯一句話中想要強調的焦點,主要分成主事、受事、處所、工具共 4 種焦點,每種焦點都有相對應的動詞詞綴變化,並會在重點字詞前方加上格位標記 a。

-----廣告,請繼續往下閱讀-----

由於南島語言習慣將動詞置於句首,等於你聽到第一個字就知道說話者想強調什麼。以下為 4 種焦點在排灣語的使用方式:

排灣語焦點系統應用,句首動詞 qaljup(打獵)會因應不同焦點而加上不同詞綴,焦點前方也會加上格位標記 a 來指稱重點。圖|研之有物    資料來源|何大安與楊秀芳, 2000: 8

古老的修飾用語:副動詞

最後一個臺灣南島語較為古老的證據在於,其詞類相當有限,主要是動詞、名詞的應用,沒有真正的副詞、形容詞等修飾詞。但是當有需要用到修飾用語時該怎麼辦?這就輪到特殊的「副動詞」登場!

副動詞顧名思義是指:具副詞作用的動詞,是臺灣南島語經常使用的詞類。張永利秀出排灣語和馬來語的句子,進一步說明副動詞與一般副詞的不同:

圖|研之有物    資料來源|張永利

排灣語的「g<em>alju」就是一個副動詞,意思是「慢」,之所以看出它是一種動詞,關鍵在於它跟後頭表示「吃」的動詞「k<em>an」有一樣的詞綴變化「em」。而中間的連繫詞 a 亦可應證「g<em>alju」與「k<em>an」應同屬於動詞。此外,「g<em>alju」的後面連接附著代詞「aken」表示「我」的意思,附著代詞一般會貼在動詞上。

-----廣告,請繼續往下閱讀-----

值得注意的是,古老的副動詞在臺灣南島語言普遍保留下來,但是在臺灣之外的南島語言,如馬來語,卻通常都已經丟失。

綜上所述,從同源詞複雜度、焦點系統完整性、使用詞類有限等語言證據可知,臺灣南島語在目前已知的上千種南島語中,其古老排名可說名列前茅,也代表臺灣可能是南島語族早期的祖居地。

張永利表示:「綜合歸納現在的語言和考古證據,我們可以畫出南島語族遷徙路徑,基本上是從臺灣遷徙出去,先遷往菲律賓群島,再往南到婆羅州一帶,隨後一分為二,分別往東方太平洋和西方印度洋遷徙。」

南島語族遷徙路徑。圖|研之有物    資料來源|Bellwood, 2011

用「說」的文化資產——母語

對張永利來說,越深入研究就越能體會,臺灣南島語真的是臺灣千年不墜的國寶!除了持續在學界發表臺灣南島語的概念運用規則,張永利也會到原住民部落推廣族語,多年來也跟國內語言學家一起編寫鄒語、噶瑪蘭語、賽德克語等族語教科書。

張永利研究員持續研究臺灣南島語的概念運用規則,多年來編寫多本族語教科書,更前往部落推廣族語。圖|研之有物

在與族人互動的過程中,張永利發現,年輕族人為了溝通方便,有簡化族語的傾向,以致某些傳統用語漸漸流失。

-----廣告,請繼續往下閱讀-----

以鄒語為例,傳統上在說 11 這個數字時,老人家會講 maskx veiya ucni,「maskx」是 10、「ucni」是 1,中間的「veiya」是「回來」的意思,翻譯成中文就是「10 回 1」,可見鄒族會使用十進位來算數,可是現在的年輕人通常會省略「veiya」的用法。

另外名字的說法也發生簡化現象,例如有一位鄒族人的名字是 Pasuya、家族名是 Tiakiana,老人家會講 Pasu’e Tiakiana,大致的意思是「來自 Tiakiana 家族的 Pasuya」。但是現在的年輕人就直接講 Pasuya Tiakiana,身分證上的名字也這樣登記。

面對日漸普遍的族語簡化現象,張永利有感而發的說:「年輕人覺得只要聽得懂就好,但我會跟他們說,語言也是文化的一部分,而且很多說法只存在特定族群中,想復振傳統文化就要講道地的族語。」

一般人常將語言視為溝通工具,認為只要能有效溝通就好,然而深諳語言奧妙的張永利卻有不同看法:

語言也是一種文化資產,不論是臺灣南島語、華語、臺語或客語都有其文化特色,具有身分識別作用。

「母語能留著就是你的寶藏,現在『特色』就是你最重要的資產!」母語是臺語的張永利不僅在學術場域研究語言,更在日常生活中透過多使用母語來保存語言資產。「語言不是只寫在教科書、或在課堂上唸,一定要積極使用,這樣語言才能真的活起來!」

千年以來,臺灣這座南島語族的原鄉發展出眾多語言文化各具特色的族群,如今在族人及語言學家的努力下,族語的復振工作正如火如荼進行,許多正名成功的族群紛紛從族語找回身分認同,找回值得守護的南島語族寶藏。

噶瑪蘭族自 2002 年 12 月 25 日正式被認定為原住民的第 11 族,其族語至今依然被族人保存使用,並編印成噶瑪蘭語辭典、語法書,作為學校鄉土教學的教材。圖|Wikimedia
所有討論 2
研之有物│中央研究院_96
296 篇文章 ・ 3568 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook

1

3
1

文字

分享

1
3
1
麥擱問啦!我講話自帶證據——孫天心解密「示證式」語法
研之有物│中央研究院_96
・2022/09/17 ・4504字 ・閱讀時間約 9 分鐘

本文轉載自中央研究院研之有物,泛科學為宣傳推廣執行單位。

  • 採訪撰文/黃楷元
  • 責任編輯/田偲妤
  • 美術設計/蔡宛潔

你是個言之有據的人嗎?

胡適先生曾說過「有一分證據,說一分話」。當有人質疑你時,你就必須提出證據來。然而,世界上有些民族在說話時會「自帶證據」,真正落實言之有據!中央研究院「研之有物」專訪院內語言學研究所特聘研究員孫天心院士,在翻山越嶺深入藏族部落後,揭開神秘的「示證式」語法。究竟藏人如何在每句話中結合證據?為何會發展出如此特殊的語法形態?一起來認識言之有據的溝通方式,從語言的多樣性中,體會不同文化的繽紛之美。

中央研究院語言學研究所特聘研究員孫天心院士。圖/研之有物

班長走進鬧哄哄的教室,大聲宣佈:「期末考取消了!」這時候,同學們會怎麼反應呢?

「真的假的?」

-----廣告,請繼續往下閱讀-----

「誰跟你說的?」

「你怎麼知道?」

類似這樣的場景,在日常生活中時時可見。班長原本講的話,資訊不夠,欠缺「發言依據」。得透過其他的詞彙、語句,去把那句話「補充」得更加可信。像是:

「老師要我跟大家說,期末考取消了!」

-----廣告,請繼續往下閱讀-----

「我看到公佈欄上寫,期末考取消了!」

但有的語言,直接在「語法」之中,就融入了這段話的「證據程度」,讓發言的人真正做到「有一分證據,說一分話」,聽者也能立即判斷這段話的可信度。這就是語言中的「示證式(evidential)」,也是中研院語言學研究所特聘研究員孫天心院士一項引人入勝的研究。

如何用語法的形態變化,讓講話可以「自帶證據」呢?用「時制(tense)」來打個比方,要表示「那時候他很快樂」,中文必須額外加上時間副詞「那時候」;但有現在–過去時制形態的英文卻只需改變動詞形式「He WAS happy」,就可表達時制。

「示證式」也是相同道理。孫天心院士表示,世界上大約有四分之一的語言,會藉由語法形態變化,直接表達陳述的證據。例如南美洲的 Quechua 語,就有三種不同的動詞後綴(語尾),對應三種證據狀態:直接證據(親眼所見)、間接證據(由情況判斷)和聽聞證據(由他人提供)。

-----廣告,請繼續往下閱讀-----
南美洲 Quechua 語「示證式」形態變化。圖/研之有物

臺灣人熟悉的母語和外語中,示證式的用法不易見,不過在跟漢語同屬漢藏語系的「藏語」,就存在細緻的示證區別。孫天心院士是國內少數精研藏語的專家,就用示證形態特別豐富的「達古藏語」,來為我們介紹這個有趣又有點燒腦的機制。

證據強度的關鍵:如何及何時取得訊息?

達古藏族居住在四川阿壩藏族羌族自治州黑水縣,語言帶有形態豐富的示證式。圖/Wikimedia

如果你是一位達古藏語的使用者,你在講話時會特別留意言談中的證據強度,來決定動詞的形式。而證據有多強,則關乎你如何得知所要陳述的訊息。

首先,當你講的事情是你自己現在或過去的「自主行為、習慣或持續性狀態」,由於這些訊息本來就掌握在你手中,需使用「親知示證」(動詞後綴 -lə),這也是證據強度最高的形態。

若是陳述自己親見的他人行為,或自己的「非自主行為」(例如不小心跌倒),你就是個「目擊者」,仍然擁有高度的訊息取得權,需使用「親歷示證」(動詞後綴 -wɐ)。

-----廣告,請繼續往下閱讀-----

若某件事發生當下並沒有參與(包括雖在場但未察覺),而是在「事後察知」的話,不同於前兩種情況,你這時只掌握「間接」訊息取得權,需使用「後知示證」(動詞後綴 -tsə)。

前述這三種情況是以訊息取得的來源來界定,而另外一種區分標準,則是從「認知整合的程度」來看。比方說,某件事情才剛剛發生、甚至正在進行中,你雖然是「直接」取得這些現場、當下發生的訊息,但認知上還來不及完全整合,需使用「新知示證」(動詞後綴 -wuʔ)。

如果認知整合的程度比較充分,像是你陳述的是自己當前的生理、心理狀態,或對於外界情況較長時間的觀察結果,則需使用「深知示證」(動詞後綴 -jiː)。

達古藏語的示證形態系統。圖/研之有物

於是,達古藏語的使用者光聽你使用的動詞形式,就可以判斷你講的話有幾分證據了。除了這種陳述句之外,示證式也可以用在疑問句中,用來「判斷與猜測」對方回答時所提供的證據。如果猜錯,回答者也同樣可以用示證式來推翻提問者的判斷。

-----廣告,請繼續往下閱讀-----

看起來眼花撩亂?但對於把達古藏語當成母語的人來說,這些都是有如呼吸一般的本能反應。而巴布亞新幾內亞的 Wola 語更為複雜,甚至把「受話者」的證據也考慮進去,稱為「集體示證」。這讓 Wola 語「做了(某事)」的謂語形態竟然有多達 57 種變化!

示證式「解碼」:從語言使用中窺見生活軌跡

然而,為什麼藏語、Quechua、Wola 這些語言會發展出「示證式」語法呢?這些使用示證式的民族,有什麼地緣上、親緣上的脈絡可循嗎?

孫天心院士介紹,學者發現世界上有三處「示證熱區」:喜馬拉雅山區、新幾內亞高地、南美洲西北角。這些區域的地理條件落差很大,看不出共通性。

世界三大示證熱區:喜馬拉雅山區、新幾內亞高地、南美洲西北角。圖/研之有物

以藏語而言,古代藏語並沒有嚴謹的示證區別,直到現代才發展出來。各地的藏語方言在示證體系的繁簡不一、形式也無法對應,顯見示證式的語法化、多樣化,是在相對短暫的時間內各自發展出來的。空間地緣、歷史親緣,恐怕都不是關鍵因素。

-----廣告,請繼續往下閱讀-----

那麼,到底是什麼原因,讓這些民族在講話時都特別「實事求是」呢?

目前看來,有複雜示證區別的語言,多使用於小型或封閉的語言社群。

這個問題,不只語言學家好奇,人類學家也感興趣。在大量的田野調查及資料分析後,學者們發現,越是小而封閉的社會,人們彼此熟識、互動頻繁,你早上講話不實在、可能下午就被抓包。

這種氛圍下,為了避免被指責和質疑,對於訊息交流時的「言語誠信」就會要求較高,語言中的示證式便應運而生。龐大而流動快速的社會,人際關係較為疏離,就比較難以在語言中發展出示證的用法。

四川黑水縣達古藏族的自然村。圖/孫天心院士提供

在南美洲秘魯的 Nanti 語言社會,示證式甚至不只是語法,而是一種根深柢固的「價值」。當地的不成文規範,提及他人行為時只能陳述親眼所見,或引用當事人自述,不能揣測推斷。

-----廣告,請繼續往下閱讀-----

有位人類學家提到,他只是請當地友人揣測一下她的丈夫去了哪裡(他出門時沒有說),一直遭到拒絕,最後居然大發脾氣:「你怎麼可以叫我做這種事?」這是他第一次看到當地人發這麼大的火。

語言之中,通常隱含著每個社會的集體思維、習癖、價值觀。示證式只是其中一種,各語言中還存在很多隱藏線索值得觀察,例如重視「時制(tense)」的語言,說話者就會特別留意事件的相對時序,以及說話時間的關聯。

特別有趣的是,孫天心院士分享了四川的嘉戎語動詞非常重要的「方向(orientation)範疇」,也就是講話時必須在動詞上標明(垂直)上下、(河流)上下游、(太陽)東西方。例如,當我們說「我去上一下洗手間」,當地人則會說「我去上一下(位在東邊的)洗手間」。

「這個文化裡面的人,方向感都特別好。若是路癡,可能連話都沒辦法好好講。」孫天心院士笑道。

差點為學術「捐軀」?研究少數民族語言的苦與樂

四川藏區險峻的山路。圖/孫天心院士提供

一般人可能連背英文動詞時態變化都覺得有些頭痛了,但對於孫天心院士來說,這些少數民族語言的特殊規則,就有如萬花筒一般,越探究越是興味盎然。

但要研究少數民族的語言,可沒辦法像報名外語補習班那麼簡單。最難的關卡,就是要找到理想的該語言使用者。因為不只是要學會聽說溝通而已,還要透徹研究,深入掌握語言的結構、變化、演進,這就是為什麼好的研究請益對象,猶如鳳毛麟角般稀有。

不只母語要好、漢語要好、還要耐性好,才能忍受學者打破砂鍋式的糾纏提問。最重要的,是要有時間跟著我們耗。

如果能夠在臺灣找到適合的研究對象,語言學家們必然是滿懷感激。但為了更充分地研究,有時候仍然需要走訪母語原鄉,實際觀察語言使用中的精微奧妙。

這種時候,研究少數民族語言的學者可就辛苦了。母語聚落通常地處偏僻,物質條件、交通環境也往往較不理想。孫天心院士回憶,有一次為了要研究藏族及羌族的語言,前往高海拔的四川馬爾康。想避開一路上的二手煙味及塵土,沒有搭乘大客車,而是從成都包了私家出租車上山。

沒想到,成都的司機不熟悉當地路況,沿途彎道及坍方,走得險象環生。突然一個轉彎的下坡,來不及放慢速度,連人帶車衝出路面,打滑了一圈,在懸崖的邊緣停住。司機嚇到臉色慘白,剩餘路程全都龜速前進。

雖然是餘悸猶存的回憶,但孫天心院士講起長年在四川藏區做田野研究的經歷,仍然帶著興奮雀躍。辛苦之處自不待言,然而箇中樂趣,讓他甘之如飴。

「藏緬語豐富的音韻、形態變化在世界語言中引人矚目。剛開始研究確實會感到困惑,但當慢慢找出規則、對應模式、甚至類型化之後,那種成就感難以言喻,而且越挖掘就會找到越多驚喜,令人欲罷不能!」

少數民族語言有豐富的語言現象,有如萬花筒一般,越探究越是興味盎然!圖/孫天心院士提供

孫天心院士捲起舌頭,親自示範不同藏緬語發音的微妙差異。生動之處,讓人忍不住想推出有聲書。語言學是一種「口耳之學」,把音發準是學習新語言的第一課,必須嚴格、精確地模仿,差一點點都不行。如果無法掌握細微差異,要進行任何進一步的比較分析都是空談。而要做好這件事,熟練掌握國際音標是重要的基本功。

學語言已不簡單,鑽研少數民族語言的困難度更非一般人能想像。對孫天心院士來說,除了興趣外,還有一種更重要的驅動力,是身為學者的「使命感」!

語言的現象極為豐富,以不同的角度反映人類思維的運作、人際交流的策略。然而多數語言處於弱勢,甚至瀕臨消亡。我選擇離開安適的象牙塔,走進田野研究瀕危語言,目的就是為記錄保存人類語言的多樣性做出一份貢獻。

一種專屬於學者的自豪,展露在孫天心院士的眉宇間。

所有討論 1
研之有物│中央研究院_96
296 篇文章 ・ 3568 位粉絲
研之有物,取諧音自「言之有物」,出處為《周易·家人》:「君子以言有物而行有恆」。探索具體研究案例、直擊研究員生活,成為串聯您與中研院的橋梁,通往博大精深的知識世界。 網頁:研之有物 臉書:研之有物@Facebook