摘要:目的:文章討論喬姆斯基語言觀及其語言學(xué)理論與語言智能的關(guān)系,駁斥以大語言模型為代表的新一代人工智能只強調(diào)經(jīng)驗主義和行為主義而完全摒棄理性主義和心智主義的發(fā)展路徑,強調(diào)從喬姆斯基的語言理論和語言觀中為語言智能的發(fā)展汲取智慧。方法:文章從兩個層面建構(gòu)喬姆斯基語言觀和語言智能的聯(lián)系。一方面,通過論述從傳統(tǒng)計算語言學(xué)或自然語言處理到以大語言模型為代表的人工智能范式轉(zhuǎn)變過程中的變與不變,使語言智能得以繼續(xù)保留從以喬姆斯基為代表的傳統(tǒng)語言學(xué)理論中獲得啟發(fā)的可能。另一方面,通過爬梳喬姆斯基的基本觀點和語言觀,包括天賦假說、普遍語法和語言官能,論證喬姆斯基超前的理論預(yù)見性,其所關(guān)注的語言問題正是語言智能亟待解決的。結(jié)果:在現(xiàn)代語言學(xué)主流流派中,喬姆斯基的邏輯理性主義和心智主義觀點尤其值得當(dāng)前語言智能研究吸收借鑒。結(jié)論:隨著計算科學(xué)的發(fā)展和人工智能技術(shù)的進步,前沿研究深入交叉,語言智能逐漸受到語言學(xué)研究者的青睞。語言智能是語言學(xué)與人工智能的交叉領(lǐng)域,其發(fā)展同語言學(xué)尤其是以喬姆斯基為代表的傳統(tǒng)語言學(xué)經(jīng)典理論密不可分。
關(guān)鍵詞:喬姆斯基;語言智能;語言觀;理性主義;心智主義
中圖分類號:H0;TP18 文獻標識碼:A 文章編號:1004-9436(2024)18-0-03
0 引言
2024年,諾貝爾物理學(xué)獎授予美國科學(xué)家約翰·霍普菲爾德和英國裔加拿大科學(xué)家杰弗里·辛頓,旨在表彰他們“通過人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)機器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明”。杰弗里·辛頓是人工智能領(lǐng)域研究機器學(xué)習(xí),尤其是深度神經(jīng)網(wǎng)絡(luò)方法的著名學(xué)者。不同于同時獲得諾獎的學(xué)者約翰·霍普菲爾德,辛頓幾乎沒有任何傳統(tǒng)理論物理學(xué)的學(xué)習(xí)和研究背景,單純是因為提供了基礎(chǔ)性方法就斬獲了諾貝爾物理學(xué)獎。因此,獲獎信息甫一公布,即引起全世界范圍內(nèi)物理學(xué)學(xué)者和公眾的熱議。除此之外,辛頓獲獎時的言論,同其在早前獲得尤利西斯獎?wù)聲r的獲獎發(fā)言[1],同樣在語言學(xué)界引起軒然大波[2]。因為他在獲獎發(fā)言中不止一次提及語言學(xué)同大語言模型技術(shù)、人工智能發(fā)展的關(guān)系問題,并毫不客氣地對以轉(zhuǎn)換生成語法理論提出者美國著名語言學(xué)家諾姆·喬姆斯基為代表的語言學(xué)研究范式提出了批評,認為“語言學(xué)家被一個名叫喬姆斯基的人誤導(dǎo)了好幾代”,提出了與喬姆斯基截然相反的語言智能觀點。總體來看,辛頓代表一種聯(lián)結(jié)主義范式的觀點,這種路徑采用數(shù)據(jù)驅(qū)動的神經(jīng)網(wǎng)絡(luò)方法使機器具有“類人”表現(xiàn),并在大語言模型技術(shù)中獲得巨大成功。基于這種范式,海量的數(shù)據(jù)、足夠的算力和先進的算法足以完成從數(shù)字智能向人類智能的轉(zhuǎn)換。而喬姆斯基代表的是符號主義范式的觀點,通常采用先驗規(guī)則約束描寫人類語言能力,以先天的規(guī)則和參數(shù)描寫使機器具備“語言能力”。而隨著認知科學(xué)的發(fā)展,強調(diào)具身經(jīng)驗和強化學(xué)習(xí)對能力的正向作用的行為主義范式也成為一種流行觀點,在強化學(xué)習(xí)增強人工智能領(lǐng)域發(fā)揮關(guān)鍵作用。就現(xiàn)實來看,聯(lián)結(jié)主義范式的成功只是暫時的,而并非“終結(jié)性”的。符號主義范式并未完全失去意義,行為主義范式更是具有重要價值。實際上,“當(dāng)局者迷”,“旁觀者”也未必“清”。人工智能發(fā)展70年,理論在爭辯,范式在更新,技術(shù)在進步,算法在迭代,算力在升級。身處轉(zhuǎn)折的當(dāng)下,一方面有大語言模型的成功示范,另一方面有來自不同理論學(xué)科和產(chǎn)業(yè)的爭議,這些有助于持續(xù)推動人工智能領(lǐng)域的研究和發(fā)展。而對喬姆斯基的認識,也不是僅通過辛頓的獲獎和他的發(fā)言就可以完全顛覆的。喬姆斯基所關(guān)注的語言問題實際上并沒有完全得到解答,大語言模型的暫時成功并不能直接回應(yīng)其關(guān)切。盡管現(xiàn)在的人工智能技術(shù)已經(jīng)具備某些人類語言智能的表現(xiàn),但要真正將二者畫上等號,還需要非常嚴謹科學(xué)的論證。本文主要討論喬姆斯基語言觀及其語言學(xué)理論與語言智能的關(guān)系,旨在從喬姆斯基的語言理論中為語言智能的發(fā)展汲取智慧。
1 語言學(xué)與人工智能的交叉領(lǐng)域:語言智能
計算語言學(xué)是現(xiàn)代語言學(xué)研究最前沿的研究領(lǐng)域之一,在計算機科學(xué)中也有自然語言處理的相關(guān)研究。計算語言學(xué)主要是研究如何利用計算機來分析、處理和理解自然語言的一門科學(xué)。計算語言學(xué)自發(fā)軔以來,就具備深厚的跨學(xué)科基礎(chǔ),根植于計算機科學(xué)、語言學(xué)和認知科學(xué)等眾多學(xué)科中,具有很強的跨學(xué)科屬性和理論的復(fù)雜性。語言智能則是語言學(xué)與人工智能的最新交叉領(lǐng)域,關(guān)注的是人工智能技術(shù)背景下與語言相關(guān)的問題,包括語言的神經(jīng)認知基礎(chǔ)、語言生成與理解機制、語言的社會問題、自然語言處理、人工智能語言等一系列內(nèi)容。
傳統(tǒng)的計算語言學(xué)研究者一致認為計算機對自然語言的研究和處理大致流程如下:首先,提出需要通過計算機處理的語言學(xué)問題;再根據(jù)語言學(xué)理論把需要研究的語言學(xué)問題形式化,使之嚴謹規(guī)范并能采用一定的數(shù)學(xué)描述方法描述出來(規(guī)則方法),或把需要研究的語言學(xué)問題抽象成數(shù)學(xué)模型(統(tǒng)計方法);然后通過計算機語言來設(shè)計計算機程序,使計算機能夠通過算法自動處理形式化的語言學(xué)問題,或者按數(shù)學(xué)模型進行相應(yīng)的統(tǒng)計和處理;根據(jù)算法,運行編寫的計算機程序來實現(xiàn)自然語言處理;最后對計算機處理的結(jié)果進行實驗分析,得出結(jié)論[3]。由此,基本上可以得出兩個觀點:一是自然語言處理首先是語言學(xué)問題,其要解決的一定是在語言學(xué)所涉問題范圍之內(nèi)的對象,如人機對話、情感分析、主題計算等。這些語言問題都可以在傳統(tǒng)的理論語言學(xué)中發(fā)掘其理論根源,這意味著傳統(tǒng)語言學(xué)研究對自然語言處理具有指導(dǎo)意義。二是自然語言處理和傳統(tǒng)語言學(xué)研究的區(qū)別主要在于其需要將語言理論應(yīng)用于計算機程序運算上,以實現(xiàn)計算機算法的自動化操作。自然語言處理雖然根植于人類語言生成和理解的經(jīng)驗成分,但已經(jīng)將經(jīng)驗成分轉(zhuǎn)化為形式化的規(guī)則描寫,編譯成機器語言,把自然語言完全編碼為計算機代碼,命令計算機完成相關(guān)程序運行。這和傳統(tǒng)語言學(xué)中投射的經(jīng)驗主義和人本主義色彩有著本質(zhì)區(qū)別。而隨著基于深度神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)算法在2012年之后逐漸成為主流,人工智能技術(shù)呈現(xiàn)出全新面貌。2022年以后,以大語言模型為代表的新一代人工智能徹底改變了傳統(tǒng)自然語言處理或計算語言學(xué)的研究路徑。大語言模型通過“預(yù)訓(xùn)練模型+微調(diào)”范式,從海量的預(yù)訓(xùn)練數(shù)據(jù)中學(xué)習(xí)“知識”,在面向用戶的指令輸入時,可以流暢地通過生成自然語言的方式輸出回答。這完全繞過了傳統(tǒng)的自然語言處理任務(wù),直接實現(xiàn)了由計算機掌握并使用人類自然語言,完成任務(wù)處理工作。
但不論是傳統(tǒng)語言學(xué)研究還是自然語言處理,以及進入大語言模型范式下的人工智能研究,對自然語言的共同關(guān)注是殊途同歸的,就是破解人類自然語言的密碼,使機器能夠自如流暢地使用人類語言。語言智能就是對這一問題進行探索的學(xué)問。而對于這一問題,深受理性主義思想影響的喬姆斯基的語言理論具有啟發(fā)意義。喬姆斯基的理論彰顯形式化和邏輯理性的光芒,但他同時堅持心智主義的語言觀,將語言學(xué)帶出了行為主義的桎梏,引入了心理和天賦官能的觀點??梢哉f,喬姆斯基的思想一方面根植于傳統(tǒng)語言學(xué)的沃土,另一方面也向人工智能的高廈延伸。因此,本文試圖從喬姆斯基語言觀的視角為語言智能的發(fā)展提供某種智慧。
2 喬姆斯基的語言觀
1957年,喬姆斯基出版《句法結(jié)構(gòu)》一書[4],創(chuàng)建了轉(zhuǎn)換生成語法理論。由于其不同的語言觀帶來的研究新范式,其成就被稱為“喬姆斯基革命”。生成語法在唯理主義哲學(xué)觀的基礎(chǔ)上,主張解釋充分性,以內(nèi)省、演繹、形式化的方法探尋人類語言的普遍運作機制和特點[5]1。自理論創(chuàng)建以來,喬姆斯基不斷修正完善生成語法理論,整個理論完成了5次重大調(diào)整。圍繞喬姆斯基的語言理論,國內(nèi)外學(xué)者從不同角度展開研究,甚至一度出現(xiàn)逆喬姆斯基語言理論的純粹批判態(tài)勢,并未完全客觀地展示喬姆斯基語言觀的全貌。
而實際上,喬姆斯基的語言觀本身才是更值得注意的問題。對喬姆斯基來說,其理論前提假設(shè)主要包括三點。首先,他認為人的語法知識是天賦的,即天賦論假設(shè)。長久以來,柏拉圖問題一直困擾著語言學(xué)家,因為人類在語言上表現(xiàn)出來的創(chuàng)造性正好呼應(yīng)柏拉圖問題。在喬姆斯基天賦論之前,行為主義的觀點大行其道。喬姆斯基認為人類的語言行為機制和動物研究中的行為原則有著根本不同,人類有推理、概括功能,語言行為是人類心智系統(tǒng)的體現(xiàn),是受遺傳決定的。在結(jié)構(gòu)主義的影響下,喬姆斯基認為,兒童在出生時便具備關(guān)于語言的語法結(jié)構(gòu)的所有知識,這種先天的知識解釋了人類為何總能快速且成功地掌握語言[6]。這種觀點把語言學(xué)研究帶入了心智主義的新發(fā)展階段,行為主義心理學(xué)的“刺激—反應(yīng)”語言發(fā)展觀基本失去解釋力。
其次,喬姆斯基主張人類語言是一個演繹的形式系統(tǒng),即普遍語法。不同人的外在都有一定差別,如有人高、有人矮,但原則上,人的基本生理構(gòu)造是相同的,都有一個腦袋、一個軀干。語言也有如此特點。根據(jù)喬姆斯基的研究,不同的語言系統(tǒng)存在許多顯而易見的差別,但是語言與語言之間,包括那些根本沒有任何歷史淵源的語言之間,同樣存在許多顯而易見的共同原則[5]18-19。人的“初始狀態(tài)”是人類的種屬特性之一,是兒童先于語言經(jīng)驗的心智狀態(tài),它將經(jīng)驗映射到穩(wěn)定狀態(tài)。普遍語法是這種“初始狀態(tài)”的一部分。所有人都遵從普遍語法,事實上,人出生時便具備一整套語言規(guī)則,它是所有語言共有的,先天地規(guī)定著人類語言的組織原則[7]。普遍語法體現(xiàn)的是人的語言能力,體現(xiàn)了“人對語言的直覺理解能力和創(chuàng)造性運用語言的能力”[5]19。普遍語法的原則是對語言系統(tǒng)形式、屬性的抽象描寫,并不一定具有現(xiàn)實性。
另外,喬姆斯基認為人的大腦中有特別的語言機制——語言官能。語言是一個復(fù)雜但精確的系統(tǒng),是話語的無限集合。既然語言能力是人類的遺傳生物特性,那么人類的生理結(jié)構(gòu)必然有語言產(chǎn)生的某些生物前提,也就是說,作為人類心智系統(tǒng)的核心器官——大腦中應(yīng)該有某些實體來操控復(fù)雜的語言行為。喬姆斯基把這個暫時不能被腦科學(xué)家觀測或分離提取的實體假設(shè)為語言官能,也就是語言獲得機制。
綜上所述,喬姆斯基把語言研究帶入了關(guān)注人類認知的生物特性和大腦語言機制的階段,大膽地從假設(shè)入手,采用假設(shè)演繹的方法進行研究。語言學(xué)也從經(jīng)驗主義和行為主義的桎梏中得到解放,語言學(xué)家開始從理性主義和心智主義的視角來研究語言,開辟了一條新的研究路徑。
3 喬姆斯基對語言智能的影響
喬姆斯基的語言學(xué)說對當(dāng)今社會的許多領(lǐng)域都產(chǎn)生了重要影響,如喬姆斯基語法就深刻地影響著自然語言處理技術(shù)的發(fā)展。另外,心理學(xué)、邏輯學(xué)、哲學(xué)、神經(jīng)生理學(xué)等學(xué)科也深受喬姆斯基學(xué)說的影響,而這些學(xué)科現(xiàn)在看來都與語言智能研究密不可分。
研究語言智能的前提就是要盡可能地解碼人類語言生成和理解的神經(jīng)認知機制、運作方式、結(jié)構(gòu)和功能的對應(yīng)關(guān)系等基礎(chǔ)問題。喬姆斯基的語言天賦論和語言官能的假設(shè)都是對這些問題的大膽假設(shè),在這個基礎(chǔ)上對人類語言理解和生成機制進行仿擬,這恰恰是語言智能的重要發(fā)展方向之一。研究人工智能如何掌握語言,掌握了語言的哪些方面,其語言能力的優(yōu)越表現(xiàn)是如何出現(xiàn)的,等等,繞不開對人類語言智能的認識。而當(dāng)前對這一問題的研究,神經(jīng)語言學(xué)和喬姆斯基開創(chuàng)的生物語言學(xué)都可以提供重要證據(jù)。在這一點上,喬姆斯基的語言觀為這種發(fā)展路徑提供了巨大幫助。可以說,以大語言模型為代表的人工智能在通向通用人工智能的發(fā)展之路上必須尊重傳統(tǒng)語言學(xué)的重要觀點,尤其是不能忽視喬姆斯基語言觀點的重要性。
4 結(jié)語
本文論證喬姆斯基語言觀與語言智能的關(guān)系,駁斥了以大語言模型為代表的新一代人工智能忽視理性和心智觀點的發(fā)展路徑,認為喬姆斯基語言觀值得語言智能研究借鑒。本文還對語言智能作了初步論述,作為語言學(xué)和人工智能的交叉領(lǐng)域,對其研究有待深入。此外,本文從辛頓與喬姆斯基的觀點碰撞入手,僅就喬姆斯基的語言觀展開討論,但在傳統(tǒng)語言學(xué)理論中,仍有許多值得語言智能研究吸收借鑒的精華,這也有待深入討論。
參考文獻:
[1] 陳國華,杰弗里·埃佛勒斯·辛頓.杰弗里·辛頓接受尤利西斯獎?wù)聲r發(fā)表的獲獎感言[J].當(dāng)代語言學(xué),2024(4):489-495.
[2] 馮志偉,陳國華,李宇明,等.“辛頓·喬姆斯基·語言學(xué)發(fā)展”多人談[J].語言戰(zhàn)略研究,2024,54(6):5-17.
[3] 劉穎.計算語言學(xué)[M].北京:清華大學(xué)出版社,2014:引言I.
[4] Chomsky, N.Systematic Structure[M]. Netherlands: Mouton, The Hague" 1957: 1.
[5] 趙美娟.喬姆斯基的語言觀[D].上海:上海外國語大學(xué),2007:1,18-19.
[6] Chomsky, N.Knowledge of language: Its nature, origin and use[M]. New York: Praeger Publishers, 1985: 69.
[7] Chomsky,N. Rules and representations[M]. New York: Columbia University Press, 1980: 4.