王聞慧
摘 要:名詞短語(yǔ)是構(gòu)成句子的重要語(yǔ)言單位,其復(fù)雜性、歧義性的特點(diǎn)對(duì)計(jì)算機(jī)處理語(yǔ)言造成了很大困擾。運(yùn)用概念層次網(wǎng)絡(luò)(Hierarchical Network of Concepts)理論分析越南語(yǔ)名詞短語(yǔ)內(nèi)部構(gòu)成,并結(jié)合語(yǔ)義塊知識(shí)對(duì)越南語(yǔ)名詞性語(yǔ)義塊進(jìn)行探討,可以發(fā)現(xiàn),越南語(yǔ)名詞性語(yǔ)義塊有五種組成模式。對(duì)越南語(yǔ)名詞短語(yǔ)進(jìn)行形式化描述,可以為越南語(yǔ)自然語(yǔ)言的計(jì)算機(jī)處理提供新的視角。
關(guān)鍵詞:概念層次網(wǎng)絡(luò);越南語(yǔ);名詞性語(yǔ)義塊;內(nèi)部結(jié)構(gòu)
名詞短語(yǔ),是自然語(yǔ)言句子中數(shù)量最多、比重最大、內(nèi)部結(jié)構(gòu)最為復(fù)雜的語(yǔ)言單元,它所承擔(dān)的句法功能比其他類型短語(yǔ)更為多樣。目前對(duì)名詞短語(yǔ)的研究已有不少,大多是從傳統(tǒng)句法層面(詹衛(wèi)東,2000;張孝榮,2010;錢(qián)小飛等,2017)、DP假說(shuō)理論(肖紅,2005;周君,2014;李亞非,2015)等方面進(jìn)行探討,但隨之而來(lái)的歧義問(wèn)題卻難以解決。概念層次網(wǎng)絡(luò)(Hierarchical Network of Concepts,簡(jiǎn)稱HNC)是一種將自然語(yǔ)言映射到概念空間的理論體系。它通過(guò)模擬人類大腦對(duì)自然語(yǔ)言理解的脈絡(luò)聯(lián)想過(guò)程,使計(jì)算機(jī)在消解語(yǔ)言歧義方面有所提高。HNC具有多個(gè)概念節(jié)點(diǎn),能將隱性知識(shí)顯性化地用符號(hào)系統(tǒng)來(lái)表示,有利于計(jì)算機(jī)理解自然語(yǔ)言。
在概念層次網(wǎng)絡(luò)中,短語(yǔ)則對(duì)應(yīng)于語(yǔ)義塊這一概念,語(yǔ)義塊作為句子的下一級(jí)語(yǔ)義構(gòu)成單位,是構(gòu)成句類的函數(shù)(苗傳江,2015:54),它在句類中充當(dāng)十分重要的角色。例如,可以通過(guò)語(yǔ)義塊的個(gè)數(shù)和順序、特征語(yǔ)義塊(EK)的類型來(lái)判斷該句所屬類型。從服務(wù)于語(yǔ)言信息處理的角度出發(fā),無(wú)論是何種自然語(yǔ)言理解任務(wù)都需要對(duì)句子進(jìn)行詞匯分析、句法分析以及語(yǔ)義理解。HNC理論通過(guò)對(duì)語(yǔ)義塊的分析,得到相應(yīng)的句類信息,直接從詞形上升到詞匯意義概念層面,省略了從詞形到“實(shí)物”的對(duì)應(yīng)過(guò)程。
根據(jù)語(yǔ)義塊承載語(yǔ)義信息的重要程度,HNC理論將其分為主語(yǔ)義塊(即句子的中心主干成分)與輔語(yǔ)義塊(即可選的輔助性成分)。本文主要是對(duì)主語(yǔ)義塊中作名詞性成分的名詞性語(yǔ)義塊進(jìn)行探討,在此基礎(chǔ)上對(duì)名詞性語(yǔ)義塊的內(nèi)部構(gòu)成進(jìn)行分析總結(jié)。本文第一部分對(duì)HNC語(yǔ)義塊的相關(guān)知識(shí)進(jìn)行簡(jiǎn)要介紹;第二部分從短語(yǔ)結(jié)構(gòu)語(yǔ)法層面,對(duì)越南語(yǔ)名詞短語(yǔ)的內(nèi)部結(jié)構(gòu)進(jìn)行梳理;第三部分主要對(duì)越南語(yǔ)名詞性語(yǔ)義塊進(jìn)行分類研究。
一、基于HNC理論的語(yǔ)義塊知識(shí)
在HNC理論的基礎(chǔ)上,所有自然語(yǔ)言句子均可以用語(yǔ)義塊的排列組合來(lái)表示。例如,在轉(zhuǎn)移句中分別存在轉(zhuǎn)移動(dòng)作發(fā)出者TA、轉(zhuǎn)移T、轉(zhuǎn)移接收者TB以及轉(zhuǎn)移的內(nèi)容TC,其句類表達(dá)式為:TJ=TA+T+TB+TC。由此可以看出,句子是由語(yǔ)義塊組合構(gòu)成的。語(yǔ)義塊可以由一個(gè)單獨(dú)的詞、一個(gè)短語(yǔ)、一個(gè)句子來(lái)構(gòu)成。HNC理論將主語(yǔ)義塊分為A(作用者)、B(對(duì)象)、C(內(nèi)容)、E(特征)四大類,其中,A、B、C統(tǒng)稱為廣義對(duì)象語(yǔ)義塊(JK),而E因決定句類則被稱之為特征語(yǔ)義塊(EK)。A與B被統(tǒng)稱為句子說(shuō)明的對(duì)象,并依據(jù)動(dòng)作的主動(dòng)性程度進(jìn)行區(qū)分判定;EK常常由謂詞性成分來(lái)?yè)?dān)任,如喜歡、送給、打等。從這四類主語(yǔ)義塊各自特點(diǎn)來(lái)看,名詞性語(yǔ)義塊通常作廣義對(duì)象語(yǔ)義塊(JK),在個(gè)別情況下也可以充當(dāng)特征語(yǔ)義塊。
與傳統(tǒng)語(yǔ)言學(xué)將短語(yǔ)劃分為中心成分與修飾成分不同,HNC認(rèn)為,在語(yǔ)義塊中包含著核心部分與說(shuō)明部分。例如,在“張先生喜歡李小姐的個(gè)性”一句中,對(duì)“李小姐的個(gè)性”這一名詞短語(yǔ),傳統(tǒng)短語(yǔ)結(jié)構(gòu)語(yǔ)言學(xué)將“個(gè)性”視作中心成分,“李小姐的”則充當(dāng)限定性成分。而在HNC理論則不同,“李小姐”與“個(gè)性”是反應(yīng)引發(fā)者及其表現(xiàn),“李小姐”與“張先生”之間有直接引發(fā)關(guān)系,所以“李小姐”是語(yǔ)義塊的核心成分?!皬埾壬矚g李小姐的妹妹”與上句句法結(jié)構(gòu)完全相同,但“李小姐”和“妹妹”并不是反應(yīng)句的引發(fā)者及其表現(xiàn),而是作為一個(gè)整體充當(dāng)反應(yīng)引發(fā)者,因此,“妹妹”是語(yǔ)義塊的核心部分,“李小姐”只是語(yǔ)義塊的說(shuō)明部分。
眾所周知,語(yǔ)言的復(fù)雜性特征使得計(jì)算機(jī)在分析處理自然語(yǔ)言時(shí)困難重重,HNC理論可以對(duì)語(yǔ)言中的歧義、模糊現(xiàn)象進(jìn)行理解和分析,并在中文自然語(yǔ)言處理中得到成功應(yīng)用。這主要體現(xiàn)在以下方面:
一是語(yǔ)言具有嵌套性,在理論上可以無(wú)限嵌套進(jìn)行下去。如“張先生喜歡李小姐”“張先生喜歡貌美的李小姐”“張先生喜歡貌美的李小姐的氣質(zhì)”等。HNC將這一現(xiàn)象解釋為廣義對(duì)象語(yǔ)義塊的B-C分解(對(duì)象和內(nèi)容的分解),只要計(jì)算機(jī)識(shí)別出來(lái)語(yǔ)義塊的邊界,就可以將無(wú)論嵌套多長(zhǎng)的語(yǔ)義塊提取出來(lái),有利于更進(jìn)一步的句法分析與語(yǔ)義理解。
二是語(yǔ)序具有靈活性,它直接表現(xiàn)為一個(gè)意思可以由若干種句式來(lái)表達(dá)。如“張三打斷了李四的腿”“李四的腿被張三打斷了”“李四被張三打斷了腿”,這三種句式雖然不同,但表達(dá)的意思完全相同。前兩句分別是作用句的基本格式與規(guī)范格式(HNC理論中對(duì)應(yīng)為!12代碼)。第三句通常情況下被認(rèn)為有四個(gè)組成部分,即“李四”“張三”“打斷了”“腿”。但HNC仍將它視為是三主塊句規(guī)范格式,其中,“李四”與“腿”之間發(fā)生了廣義對(duì)象語(yǔ)義塊的分離現(xiàn)象,它們本是一個(gè)語(yǔ)義塊單位。
三是句子作語(yǔ)義塊的情況,這是語(yǔ)義塊復(fù)雜構(gòu)成的特殊形式,在HNC中稱之為句蛻與塊擴(kuò)。句蛻指的是由句子蛻變成語(yǔ)義塊或者是其中一部分,包括原型句蛻和要素句蛻兩類。其中,原型句蛻就是句子不經(jīng)變化直接當(dāng)作語(yǔ)義塊使用。要素句蛻又包括JK要素句蛻和EK要素句蛻兩類,主要區(qū)別在于突出的核心成分是JK還是EK。在句蛻的基礎(chǔ)上加入其他成分就構(gòu)成了包裝句蛻。例如,“老師知道張三打斷了李四的腿這件事”就是原型包裝句蛻,“老師不相信打斷了李四的張三的謊話”就是JK要素包裝句蛻。塊擴(kuò)這一概念,顧名思義,可以理解為語(yǔ)義塊擴(kuò)展為一個(gè)句子的情況,但這種情況是有選擇性的,并不適用于所有語(yǔ)義塊。在信息轉(zhuǎn)移句中,JK3常常用來(lái)表示信息轉(zhuǎn)移的內(nèi)容,如“我告訴他今天我要去北京參加會(huì)議”中,“今天我要去北京參加會(huì)議”是轉(zhuǎn)移句的JK3語(yǔ)義塊。傳統(tǒng)上將這類句子稱為復(fù)句,“今天我要去北京參加會(huì)議”是其中的分句,而HNC理論將它解釋為信息轉(zhuǎn)移句的JK3塊擴(kuò)成一個(gè)句子。
第一類與第二類雖然都是語(yǔ)義塊內(nèi)部結(jié)構(gòu)的循環(huán)模式,但在根本上有很大不同。第一類側(cè)重于說(shuō)明部分的嵌套迭代,第二類是語(yǔ)義塊分解的特殊情況。這兩類都能說(shuō)明語(yǔ)言的層次性與非線性特點(diǎn),HNC對(duì)它們的理解也更加直觀與全面。
(三)含句蛻現(xiàn)象的名詞性語(yǔ)義塊
在越南語(yǔ)中,常存在“N+V+N”的歧義現(xiàn)象,該詞性組合序列既可以表示一句話,也可以是一個(gè)短語(yǔ),其中,“V+N”作定語(yǔ)修飾前面的中心詞。在傳統(tǒng)語(yǔ)法中,往往將“V+N”結(jié)構(gòu)作定語(yǔ)的情況,解釋為省略介詞“ma?”的特殊形式。這類“句子型”的名詞性語(yǔ)義塊結(jié)構(gòu)復(fù)雜,在HNC理論中,則將它解釋為語(yǔ)義塊的句蛻現(xiàn)象。可以說(shuō),正是由于越南語(yǔ)定語(yǔ)后置的特殊性,使得本是要素句蛻的表達(dá)同原型句蛻的完全相同。如:“các ho?t_??ng tr?_giúp ng??i tàn_t?t(幫助殘疾人的各項(xiàng)活動(dòng))”,該句子是“各項(xiàng)活動(dòng)幫助殘疾人”的JK要素句蛻,正是由于越南語(yǔ)定語(yǔ)后置的特點(diǎn),導(dǎo)致這兩句話譯成越南語(yǔ)時(shí)句子完全一樣。計(jì)算機(jī)在處理這類歧義現(xiàn)象時(shí),很難弄清楚該類表達(dá)到底是表主謂賓的句子成分還是短語(yǔ)成分,而HNC就給出了消解歧義的方法,即通過(guò)對(duì)句類中語(yǔ)義塊的切分進(jìn)而做出有效判斷。在越南語(yǔ)中,除了語(yǔ)義塊全部成分的句蛻,還存在語(yǔ)義塊內(nèi)部部分結(jié)構(gòu)的句蛻。如:“nhi?m v? ki?m_tra,??n ??c các B?,ngành,??a_ph??ng(檢查督促各部、各界、各地方的任務(wù))”,它與上個(gè)例子在句法結(jié)構(gòu)上完全相同,但上個(gè)例子中的“各項(xiàng)活動(dòng)”可充當(dāng)句子的主語(yǔ),也就是JK1;而此例中,“nhi?m v?(任務(wù))”后面的動(dòng)詞短語(yǔ)(動(dòng)賓結(jié)構(gòu))作定語(yǔ)。從語(yǔ)義限制的角度來(lái)看,“nhi?m v?(任務(wù))”就不能作“ki?m_tra , ??n ??c(檢查、督促)”等特征語(yǔ)義塊的JK1成分,該類動(dòng)詞的主語(yǔ)應(yīng)當(dāng)由pp類(HNC概念節(jié)點(diǎn)中的“人”)概念來(lái)充當(dāng)。在此例中,可以理解為“ki?m_tra,??n ??c các B?,ngành,??a_ph??ng(檢查督促各部、各界、各地方)”語(yǔ)義塊的說(shuō)明部分所產(chǎn)生的省略主語(yǔ)形式(!3)格式句蛻??偟膩?lái)看,第三類中含句蛻現(xiàn)象的情況包含了整個(gè)語(yǔ)義塊句蛻與部分成分句蛻兩種情況。
(四)含“cu?a”的名詞性語(yǔ)義塊核心成分區(qū)分
“cu?a”結(jié)構(gòu)在越南語(yǔ)中的重要程度如同漢語(yǔ)中的“的”字結(jié)構(gòu),通常用來(lái)表示領(lǐng)屬,該結(jié)構(gòu)在名詞短語(yǔ)中使用非常頻繁,同時(shí)它也是形成越南語(yǔ)定語(yǔ)復(fù)雜性的重要原因。一般來(lái)說(shuō),領(lǐng)屬范疇包含了范圍領(lǐng)屬(如“B??c Kinh cu?a Trung Qu??c”中國(guó)的北京)、處所范疇(“s?n v??n ???ng cu?a ho?c viê?n”學(xué)校的運(yùn)動(dòng)場(chǎng))、領(lǐng)有范疇(“cu??n sa?ch cu?a t?i”我的書(shū))、親屬范疇(“me? cu?a chi? ??y”她的媽媽)、附屬領(lǐng)屬(“m??t cu?a anh ??y”他的眼睛)、整體部分領(lǐng)屬(“tu?i cu?a a?o”衣服的口袋)、本體屬性領(lǐng)屬(“ca?i khi? ch??t cu?a chi? ??y”她的氣質(zhì))、本體特征領(lǐng)屬(“di?ch bê?nh cu?a con cho?”狗的病)(沈陽(yáng),1995)。在HNC中,“cu?a”結(jié)構(gòu)既可以用來(lái)表示C(內(nèi)容),也可以用來(lái)表示B(對(duì)象)與C(內(nèi)容)的融合。當(dāng)表示后者時(shí),名詞性語(yǔ)義塊的核心成分往往與短語(yǔ)結(jié)構(gòu)語(yǔ)法所定義的中心成分有所差別。如上文提到的“?ng Tr??ng thi?ch em ga?i cu?a c? Ly?(張先生喜歡李小姐的妹妹)”與“?ng Tr??ng thi?ch ca?i khi? ch??t cu?a c? Ly?(張先生喜歡李小姐的氣質(zhì))”,“em ga?i cu?a c? Ly?(李小姐的妹妹)”與“ca?i khi? ch??t cu?a c? Ly?(李小姐的氣質(zhì))”短語(yǔ)結(jié)構(gòu)雖然相同,但前者的核心成分是cu?a 之前的“em ga?i(妹妹)”,而后者語(yǔ)義塊的核心成分是“c? Ly?(李小姐)”,處于cu?a結(jié)構(gòu)之后。從越南語(yǔ)含“cu?a”名詞性語(yǔ)義塊的領(lǐng)屬性關(guān)系來(lái)看,表示本體特征屬性的“cu?a”字結(jié)構(gòu)核心成分通常位于后面,其他類型領(lǐng)屬關(guān)系核心成分位于“cu?a”字之前。因此,“cu?a”字結(jié)構(gòu)到底偏重于前部還是后部,HNC理論可以通過(guò)對(duì)概念層面的合理解析,得到語(yǔ)義塊的核心成分,有利于機(jī)器在處理復(fù)雜長(zhǎng)難句時(shí),對(duì)句子主干的正確把握。
(五)名詞短語(yǔ)中介詞修飾成分輔語(yǔ)義塊化
除了第四類中“cu?a”字結(jié)構(gòu)作復(fù)雜定語(yǔ)之外,越南語(yǔ)中還存在著諸多介詞短語(yǔ)做定語(yǔ)的情況,如引出內(nèi)容的“vê?……”結(jié)構(gòu)、表示時(shí)間空間的“trong/va?o……”結(jié)構(gòu)、表示目的的“?ê?/nh??m……”結(jié)構(gòu)、表示結(jié)果的“cho……”結(jié)構(gòu)等。句子除了由主語(yǔ)義塊構(gòu)成外,還存在具有輔助性意義的輔語(yǔ)義塊成分,用以表示手段、工具、途徑、比照、條件、起因、目的等,對(duì)應(yīng)于一般而言的介詞短語(yǔ)。因此,短語(yǔ)結(jié)構(gòu)中的介詞短語(yǔ)做后置定語(yǔ)的情況,在HNC中則可被視作是輔語(yǔ)義塊的表示形式。例如:
(1)Ch?_th? v? t?ng_c??ng c?ng_tác qu?n_l?,ch?_??o nh?m thúc_??y s? ra_??i,phát_tri?n c?a các b?o_tàng và s?u_t?p t?_nh?n.(有關(guān)加強(qiáng)管理與指導(dǎo)工作的指示,旨在促進(jìn)寶藏與私人藏品的誕生與發(fā)展。)
(2)L??i di chu?c vê? viê?c riêng.(個(gè)人遺囑)
(3)B??u kh?ng khi? gia ?i?nh ?oa?n tu? êm ?ê?m trên ki?nh d???i nh???ng tr???c nh??ng ba?n th?? ph??t.(供桌前洋溢著敬上愛(ài)下溫馨和諧的家庭團(tuán)聚氣氛)
上述用例都是結(jié)構(gòu)復(fù)雜的名詞性語(yǔ)義塊,其中,包含了“vê?”內(nèi)容說(shuō)明、“nh?m”目的限制、“c?a”領(lǐng)屬成分等介詞短語(yǔ)充當(dāng)定語(yǔ)的情況。根據(jù)越南語(yǔ)語(yǔ)法書(shū)(Nguy?n Tài C?n,1997)的看法,這些語(yǔ)義塊是整體作為一個(gè)名詞短語(yǔ),但根據(jù)HNC理論的觀點(diǎn),“vê?”“nh?m”等介詞結(jié)構(gòu)是句子的輔語(yǔ)義塊,由此來(lái)降低語(yǔ)義塊內(nèi)部的構(gòu)成復(fù)雜性。計(jì)算機(jī)可以通過(guò)“分而治之”的方法,先采取將輔語(yǔ)塊去除的方式,找出語(yǔ)義塊邊界;再根據(jù)輔語(yǔ)義塊的限定對(duì)象,對(duì)語(yǔ)義塊甚至是句類做進(jìn)一步分析,以此來(lái)降低語(yǔ)義塊分析解剖的難度。
綜上所述,筆者根據(jù)越南語(yǔ)語(yǔ)言特點(diǎn)、名詞短語(yǔ)結(jié)構(gòu)以及HNC理論,對(duì)越南語(yǔ)名詞性語(yǔ)義塊進(jìn)行了分類研究。從本文的論述可以看出,對(duì)結(jié)構(gòu)復(fù)雜的名詞短語(yǔ)而言,HNC理論在分析語(yǔ)義塊時(shí)更為清晰,便于機(jī)器的理解,同時(shí)也為自然語(yǔ)言處理后續(xù)更高層次任務(wù)的開(kāi)展奠定了基礎(chǔ)。HNC理論在漢語(yǔ)中已經(jīng)形式化,并產(chǎn)生了很多成功應(yīng)用的案例,但不同語(yǔ)言之間會(huì)存在一定的差異性,如何針對(duì)不同語(yǔ)言的特點(diǎn),使HNC理論得到更為切實(shí)、更為有效的應(yīng)用,則是今后將面臨的關(guān)鍵問(wèn)題。由于HNC理論是一個(gè)關(guān)于自然語(yǔ)言理解處理的理論體系,是一套形式化的符號(hào)基元系統(tǒng),而真正做到讓計(jì)算機(jī)處理、理解語(yǔ)言是具體的工程性問(wèn)題,如何將理論落地,在技術(shù)應(yīng)用層面實(shí)現(xiàn)語(yǔ)言智能,也是一項(xiàng)十分艱辛的任務(wù)。具體到本文討論的問(wèn)題而言,就是在HNC理論指導(dǎo)下,如何找到語(yǔ)義塊邊界并將相關(guān)句類界定清楚。語(yǔ)言現(xiàn)象再?gòu)?fù)雜多變也總歸是有規(guī)律可循的,HNC為我們提供了從概念空間層面理解語(yǔ)言的思路,我們也希望這一理論在今后會(huì)有更大的發(fā)展與突破。
參考文獻(xiàn):
[1]Nguy?n Tài C?n. Ng? pháp ti?ng Vi?t[M].Ti?ng-T? ghép-?o?n ng?,NXB ?H và THCN,1997.
[2]Cheng,L.& R.Sybesma.Bare and not-so-bare nouns and the structure of NP[J].Linguistic Inquiry,1999,(4).
[3]詹衛(wèi)東.面向中文信息處理的現(xiàn)代漢語(yǔ)短語(yǔ)結(jié)構(gòu)規(guī)則研究[M].北京:清華大學(xué)出版社,南寧:廣西科學(xué)技術(shù)出版社,2000.
[4]錢(qián)小飛,侯敏.漢語(yǔ)最長(zhǎng)名詞短語(yǔ)的結(jié)構(gòu)復(fù)雜性研究[J].語(yǔ)料庫(kù)語(yǔ)言學(xué),2017,(1).
[5]張孝榮.名詞短語(yǔ)的內(nèi)部結(jié)構(gòu)及其句法實(shí)現(xiàn)[J].安徽師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2010,(4).
[6]周君.也談?dòng)h名詞短語(yǔ)的句法層級(jí)結(jié)構(gòu)[J].外國(guó)語(yǔ)(上海外國(guó)語(yǔ)大學(xué)學(xué)報(bào)),2014,(5).
[7]肖紅.越南語(yǔ)名詞短語(yǔ)的內(nèi)部結(jié)構(gòu)[D].湖南大學(xué)碩士學(xué)位論文,2005.
[8]李亞非.也談漢語(yǔ)名詞短語(yǔ)的內(nèi)部結(jié)構(gòu)[J].中國(guó)語(yǔ)文, 2015,(2).
[9]苗傳江.HNC(概念層次網(wǎng)絡(luò))理論導(dǎo)論[M].北京:清華大學(xué)出版社,2005.
[10]林麗.面向信息處理的越南語(yǔ)主謂謂語(yǔ)句句式轉(zhuǎn)換研究[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2013,(5).
[11]譚志詞,徐方宇,林麗.基礎(chǔ)越南語(yǔ)(3)[M].北京:世界圖書(shū)出版公司,2013.
[12]沈陽(yáng).領(lǐng)屬范疇及領(lǐng)屬性名詞短語(yǔ)的句法作用[J].北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1995,(5).