摘要:目的:文章討論喬姆斯基語言觀及其語言學理論與語言智能的關系,駁斥以大語言模型為代表的新一代人工智能只強調經(jīng)驗主義和行為主義而完全摒棄理性主義和心智主義的發(fā)展路徑,強調從喬姆斯基的語言理論和語言觀中為語言智能的發(fā)展汲取智慧。方法:文章從兩個層面建構喬姆斯基語言觀和語言智能的聯(lián)系。一方面,通過論述從傳統(tǒng)計算語言學或自然語言處理到以大語言模型為代表的人工智能范式轉變過程中的變與不變,使語言智能得以繼續(xù)保留從以喬姆斯基為代表的傳統(tǒng)語言學理論中獲得啟發(fā)的可能。另一方面,通過爬梳喬姆斯基的基本觀點和語言觀,包括天賦假說、普遍語法和語言官能,論證喬姆斯基超前的理論預見性,其所關注的語言問題正是語言智能亟待解決的。結果:在現(xiàn)代語言學主流流派中,喬姆斯基的邏輯理性主義和心智主義觀點尤其值得當前語言智能研究吸收借鑒。結論:隨著計算科學的發(fā)展和人工智能技術的進步,前沿研究深入交叉,語言智能逐漸受到語言學研究者的青睞。語言智能是語言學與人工智能的交叉領域,其發(fā)展同語言學尤其是以喬姆斯基為代表的傳統(tǒng)語言學經(jīng)典理論密不可分。
關鍵詞:喬姆斯基;語言智能;語言觀;理性主義;心智主義
中圖分類號:H0;TP18 文獻標識碼:A 文章編號:1004-9436(2024)18-0-03
0 引言
2024年,諾貝爾物理學獎授予美國科學家約翰·霍普菲爾德和英國裔加拿大科學家杰弗里·辛頓,旨在表彰他們“通過人工神經(jīng)網(wǎng)絡實現(xiàn)機器學習的基礎性發(fā)現(xiàn)和發(fā)明”。杰弗里·辛頓是人工智能領域研究機器學習,尤其是深度神經(jīng)網(wǎng)絡方法的著名學者。不同于同時獲得諾獎的學者約翰·霍普菲爾德,辛頓幾乎沒有任何傳統(tǒng)理論物理學的學習和研究背景,單純是因為提供了基礎性方法就斬獲了諾貝爾物理學獎。因此,獲獎信息甫一公布,即引起全世界范圍內(nèi)物理學學者和公眾的熱議。除此之外,辛頓獲獎時的言論,同其在早前獲得尤利西斯獎章時的獲獎發(fā)言[1],同樣在語言學界引起軒然大波[2]。因為他在獲獎發(fā)言中不止一次提及語言學同大語言模型技術、人工智能發(fā)展的關系問題,并毫不客氣地對以轉換生成語法理論提出者美國著名語言學家諾姆·喬姆斯基為代表的語言學研究范式提出了批評,認為“語言學家被一個名叫喬姆斯基的人誤導了好幾代”,提出了與喬姆斯基截然相反的語言智能觀點??傮w來看,辛頓代表一種聯(lián)結主義范式的觀點,這種路徑采用數(shù)據(jù)驅動的神經(jīng)網(wǎng)絡方法使機器具有“類人”表現(xiàn),并在大語言模型技術中獲得巨大成功?;谶@種范式,海量的數(shù)據(jù)、足夠的算力和先進的算法足以完成從數(shù)字智能向人類智能的轉換。而喬姆斯基代表的是符號主義范式的觀點,通常采用先驗規(guī)則約束描寫人類語言能力,以先天的規(guī)則和參數(shù)描寫使機器具備“語言能力”。而隨著認知科學的發(fā)展,強調具身經(jīng)驗和強化學習對能力的正向作用的行為主義范式也成為一種流行觀點,在強化學習增強人工智能領域發(fā)揮關鍵作用。就現(xiàn)實來看,聯(lián)結主義范式的成功只是暫時的,而并非“終結性”的。符號主義范式并未完全失去意義,行為主義范式更是具有重要價值。實際上,“當局者迷”,“旁觀者”也未必“清”。人工智能發(fā)展70年,理論在爭辯,范式在更新,技術在進步,算法在迭代,算力在升級。身處轉折的當下,一方面有大語言模型的成功示范,另一方面有來自不同理論學科和產(chǎn)業(yè)的爭議,這些有助于持續(xù)推動人工智能領域的研究和發(fā)展。而對喬姆斯基的認識,也不是僅通過辛頓的獲獎和他的發(fā)言就可以完全顛覆的。喬姆斯基所關注的語言問題實際上并沒有完全得到解答,大語言模型的暫時成功并不能直接回應其關切。盡管現(xiàn)在的人工智能技術已經(jīng)具備某些人類語言智能的表現(xiàn),但要真正將二者畫上等號,還需要非常嚴謹科學的論證。本文主要討論喬姆斯基語言觀及其語言學理論與語言智能的關系,旨在從喬姆斯基的語言理論中為語言智能的發(fā)展汲取智慧。
1 語言學與人工智能的交叉領域:語言智能
計算語言學是現(xiàn)代語言學研究最前沿的研究領域之一,在計算機科學中也有自然語言處理的相關研究。計算語言學主要是研究如何利用計算機來分析、處理和理解自然語言的一門科學。計算語言學自發(fā)軔以來,就具備深厚的跨學科基礎,根植于計算機科學、語言學和認知科學等眾多學科中,具有很強的跨學科屬性和理論的復雜性。語言智能則是語言學與人工智能的最新交叉領域,關注的是人工智能技術背景下與語言相關的問題,包括語言的神經(jīng)認知基礎、語言生成與理解機制、語言的社會問題、自然語言處理、人工智能語言等一系列內(nèi)容。
傳統(tǒng)的計算語言學研究者一致認為計算機對自然語言的研究和處理大致流程如下:首先,提出需要通過計算機處理的語言學問題;再根據(jù)語言學理論把需要研究的語言學問題形式化,使之嚴謹規(guī)范并能采用一定的數(shù)學描述方法描述出來(規(guī)則方法),或把需要研究的語言學問題抽象成數(shù)學模型(統(tǒng)計方法);然后通過計算機語言來設計計算機程序,使計算機能夠通過算法自動處理形式化的語言學問題,或者按數(shù)學模型進行相應的統(tǒng)計和處理;根據(jù)算法,運行編寫的計算機程序來實現(xiàn)自然語言處理;最后對計算機處理的結果進行實驗分析,得出結論[3]。由此,基本上可以得出兩個觀點:一是自然語言處理首先是語言學問題,其要解決的一定是在語言學所涉問題范圍之內(nèi)的對象,如人機對話、情感分析、主題計算等。這些語言問題都可以在傳統(tǒng)的理論語言學中發(fā)掘其理論根源,這意味著傳統(tǒng)語言學研究對自然語言處理具有指導意義。二是自然語言處理和傳統(tǒng)語言學研究的區(qū)別主要在于其需要將語言理論應用于計算機程序運算上,以實現(xiàn)計算機算法的自動化操作。自然語言處理雖然根植于人類語言生成和理解的經(jīng)驗成分,但已經(jīng)將經(jīng)驗成分轉化為形式化的規(guī)則描寫,編譯成機器語言,把自然語言完全編碼為計算機代碼,命令計算機完成相關程序運行。這和傳統(tǒng)語言學中投射的經(jīng)驗主義和人本主義色彩有著本質區(qū)別。而隨著基于深度神經(jīng)網(wǎng)絡的機器學習算法在2012年之后逐漸成為主流,人工智能技術呈現(xiàn)出全新面貌。2022年以后,以大語言模型為代表的新一代人工智能徹底改變了傳統(tǒng)自然語言處理或計算語言學的研究路徑。大語言模型通過“預訓練模型+微調”范式,從海量的預訓練數(shù)據(jù)中學習“知識”,在面向用戶的指令輸入時,可以流暢地通過生成自然語言的方式輸出回答。這完全繞過了傳統(tǒng)的自然語言處理任務,直接實現(xiàn)了由計算機掌握并使用人類自然語言,完成任務處理工作。
但不論是傳統(tǒng)語言學研究還是自然語言處理,以及進入大語言模型范式下的人工智能研究,對自然語言的共同關注是殊途同歸的,就是破解人類自然語言的密碼,使機器能夠自如流暢地使用人類語言。語言智能就是對這一問題進行探索的學問。而對于這一問題,深受理性主義思想影響的喬姆斯基的語言理論具有啟發(fā)意義。喬姆斯基的理論彰顯形式化和邏輯理性的光芒,但他同時堅持心智主義的語言觀,將語言學帶出了行為主義的桎梏,引入了心理和天賦官能的觀點??梢哉f,喬姆斯基的思想一方面根植于傳統(tǒng)語言學的沃土,另一方面也向人工智能的高廈延伸。因此,本文試圖從喬姆斯基語言觀的視角為語言智能的發(fā)展提供某種智慧。
2 喬姆斯基的語言觀
1957年,喬姆斯基出版《句法結構》一書[4],創(chuàng)建了轉換生成語法理論。由于其不同的語言觀帶來的研究新范式,其成就被稱為“喬姆斯基革命”。生成語法在唯理主義哲學觀的基礎上,主張解釋充分性,以內(nèi)省、演繹、形式化的方法探尋人類語言的普遍運作機制和特點[5]1。自理論創(chuàng)建以來,喬姆斯基不斷修正完善生成語法理論,整個理論完成了5次重大調整。圍繞喬姆斯基的語言理論,國內(nèi)外學者從不同角度展開研究,甚至一度出現(xiàn)逆喬姆斯基語言理論的純粹批判態(tài)勢,并未完全客觀地展示喬姆斯基語言觀的全貌。
而實際上,喬姆斯基的語言觀本身才是更值得注意的問題。對喬姆斯基來說,其理論前提假設主要包括三點。首先,他認為人的語法知識是天賦的,即天賦論假設。長久以來,柏拉圖問題一直困擾著語言學家,因為人類在語言上表現(xiàn)出來的創(chuàng)造性正好呼應柏拉圖問題。在喬姆斯基天賦論之前,行為主義的觀點大行其道。喬姆斯基認為人類的語言行為機制和動物研究中的行為原則有著根本不同,人類有推理、概括功能,語言行為是人類心智系統(tǒng)的體現(xiàn),是受遺傳決定的。在結構主義的影響下,喬姆斯基認為,兒童在出生時便具備關于語言的語法結構的所有知識,這種先天的知識解釋了人類為何總能快速且成功地掌握語言[6]。這種觀點把語言學研究帶入了心智主義的新發(fā)展階段,行為主義心理學的“刺激—反應”語言發(fā)展觀基本失去解釋力。
其次,喬姆斯基主張人類語言是一個演繹的形式系統(tǒng),即普遍語法。不同人的外在都有一定差別,如有人高、有人矮,但原則上,人的基本生理構造是相同的,都有一個腦袋、一個軀干。語言也有如此特點。根據(jù)喬姆斯基的研究,不同的語言系統(tǒng)存在許多顯而易見的差別,但是語言與語言之間,包括那些根本沒有任何歷史淵源的語言之間,同樣存在許多顯而易見的共同原則[5]18-19。人的“初始狀態(tài)”是人類的種屬特性之一,是兒童先于語言經(jīng)驗的心智狀態(tài),它將經(jīng)驗映射到穩(wěn)定狀態(tài)。普遍語法是這種“初始狀態(tài)”的一部分。所有人都遵從普遍語法,事實上,人出生時便具備一整套語言規(guī)則,它是所有語言共有的,先天地規(guī)定著人類語言的組織原則[7]。普遍語法體現(xiàn)的是人的語言能力,體現(xiàn)了“人對語言的直覺理解能力和創(chuàng)造性運用語言的能力”[5]19。普遍語法的原則是對語言系統(tǒng)形式、屬性的抽象描寫,并不一定具有現(xiàn)實性。
另外,喬姆斯基認為人的大腦中有特別的語言機制——語言官能。語言是一個復雜但精確的系統(tǒng),是話語的無限集合。既然語言能力是人類的遺傳生物特性,那么人類的生理結構必然有語言產(chǎn)生的某些生物前提,也就是說,作為人類心智系統(tǒng)的核心器官——大腦中應該有某些實體來操控復雜的語言行為。喬姆斯基把這個暫時不能被腦科學家觀測或分離提取的實體假設為語言官能,也就是語言獲得機制。
綜上所述,喬姆斯基把語言研究帶入了關注人類認知的生物特性和大腦語言機制的階段,大膽地從假設入手,采用假設演繹的方法進行研究。語言學也從經(jīng)驗主義和行為主義的桎梏中得到解放,語言學家開始從理性主義和心智主義的視角來研究語言,開辟了一條新的研究路徑。
3 喬姆斯基對語言智能的影響
喬姆斯基的語言學說對當今社會的許多領域都產(chǎn)生了重要影響,如喬姆斯基語法就深刻地影響著自然語言處理技術的發(fā)展。另外,心理學、邏輯學、哲學、神經(jīng)生理學等學科也深受喬姆斯基學說的影響,而這些學科現(xiàn)在看來都與語言智能研究密不可分。
研究語言智能的前提就是要盡可能地解碼人類語言生成和理解的神經(jīng)認知機制、運作方式、結構和功能的對應關系等基礎問題。喬姆斯基的語言天賦論和語言官能的假設都是對這些問題的大膽假設,在這個基礎上對人類語言理解和生成機制進行仿擬,這恰恰是語言智能的重要發(fā)展方向之一。研究人工智能如何掌握語言,掌握了語言的哪些方面,其語言能力的優(yōu)越表現(xiàn)是如何出現(xiàn)的,等等,繞不開對人類語言智能的認識。而當前對這一問題的研究,神經(jīng)語言學和喬姆斯基開創(chuàng)的生物語言學都可以提供重要證據(jù)。在這一點上,喬姆斯基的語言觀為這種發(fā)展路徑提供了巨大幫助??梢哉f,以大語言模型為代表的人工智能在通向通用人工智能的發(fā)展之路上必須尊重傳統(tǒng)語言學的重要觀點,尤其是不能忽視喬姆斯基語言觀點的重要性。
4 結語
本文論證喬姆斯基語言觀與語言智能的關系,駁斥了以大語言模型為代表的新一代人工智能忽視理性和心智觀點的發(fā)展路徑,認為喬姆斯基語言觀值得語言智能研究借鑒。本文還對語言智能作了初步論述,作為語言學和人工智能的交叉領域,對其研究有待深入。此外,本文從辛頓與喬姆斯基的觀點碰撞入手,僅就喬姆斯基的語言觀展開討論,但在傳統(tǒng)語言學理論中,仍有許多值得語言智能研究吸收借鑒的精華,這也有待深入討論。
參考文獻:
[1] 陳國華,杰弗里·埃佛勒斯·辛頓.杰弗里·辛頓接受尤利西斯獎章時發(fā)表的獲獎感言[J].當代語言學,2024(4):489-495.
[2] 馮志偉,陳國華,李宇明,等.“辛頓·喬姆斯基·語言學發(fā)展”多人談[J].語言戰(zhàn)略研究,2024,54(6):5-17.
[3] 劉穎.計算語言學[M].北京:清華大學出版社,2014:引言I.
[4] Chomsky, N.Systematic Structure[M]. Netherlands: Mouton, The Hague" 1957: 1.
[5] 趙美娟.喬姆斯基的語言觀[D].上海:上海外國語大學,2007:1,18-19.
[6] Chomsky, N.Knowledge of language: Its nature, origin and use[M]. New York: Praeger Publishers, 1985: 69.
[7] Chomsky,N. Rules and representations[M]. New York: Columbia University Press, 1980: 4.