劉盼盼 王慶江
關(guān)鍵詞:結(jié)合邏輯;結(jié)合子;范疇語(yǔ)法;結(jié)合范疇語(yǔ)法;樹(shù)庫(kù)
中圖分類(lèi)號(hào):TP301.2 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)03-0015-04
0 引言
近年來(lái),神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)在自然語(yǔ)言處理中被廣泛應(yīng)用,但在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),其運(yùn)行機(jī)制難以從語(yǔ)言學(xué)的方面得到理性解釋[1]。語(yǔ)言語(yǔ)法的研究仍十分重要。
范疇語(yǔ)法[2](Categorial Grammar,CG)是一種同時(shí)兼顧句法和語(yǔ)義且把自然語(yǔ)言的句法分析看作是邏輯推理的形式語(yǔ)法。組合范疇語(yǔ)法[3](Combinatory Cat?egorial Grammar,CCG)是20世紀(jì)末的理性主義產(chǎn)物,對(duì)CG的擴(kuò)展在于增加結(jié)合邏輯[4]結(jié)合子C、B、B對(duì)應(yīng)的類(lèi)型提升及函數(shù)組合,用斜線類(lèi)型將范疇結(jié)合的精準(zhǔn)控制由規(guī)則一側(cè)轉(zhuǎn)向詞匯一側(cè)[5]。CCG對(duì)于計(jì)算語(yǔ)言學(xué)具有重要價(jià)值[6],然而在運(yùn)用CCG于缺乏屈折的漢語(yǔ)時(shí),需要對(duì)擴(kuò)展CG的基本依據(jù)——結(jié)合邏輯重新做一系統(tǒng)的考慮。
文獻(xiàn)[7]構(gòu)建CCG漢語(yǔ)謂詞詞庫(kù),收集多義謂詞在真實(shí)語(yǔ)境中的不同分布,其目標(biāo)是為每個(gè)謂詞選擇在句中合適的范疇標(biāo)記,該方法可用于對(duì)漢語(yǔ)其他詞類(lèi)的句法類(lèi)型消歧。文獻(xiàn)[8]分析CCG和漢語(yǔ)句法之間的差異,提出一個(gè)改進(jìn)的組合性方案,但本質(zhì)上還是基于CCG的句法規(guī)則對(duì)漢語(yǔ)句法結(jié)構(gòu)進(jìn)行分析。
漢語(yǔ)不像其他語(yǔ)言能夠通過(guò)改變?cè)~的形態(tài)來(lái)表示詞的語(yǔ)法功能和語(yǔ)義特征,它的詞基本上保持了固定的形式,不會(huì)出現(xiàn)屈折變化。文獻(xiàn)[9]認(rèn)為詞類(lèi)或短語(yǔ)結(jié)構(gòu)在參與構(gòu)建短語(yǔ)時(shí)可發(fā)生語(yǔ)法性質(zhì)轉(zhuǎn)變,使用轉(zhuǎn)類(lèi)后的句法范疇,為此在組合范疇語(yǔ)法中增加了范疇轉(zhuǎn)換規(guī)則。文獻(xiàn)[10]認(rèn)為“類(lèi)有定職”違反語(yǔ)法簡(jiǎn)約,“類(lèi)有多職”是漢語(yǔ)缺乏屈折的必然結(jié)果,范疇轉(zhuǎn)換是未轉(zhuǎn)類(lèi)情況下詞類(lèi)選擇其非典型句法范疇,建立帶有范疇轉(zhuǎn)換的組合范疇語(yǔ)法 (CCG with CategoryConversions,CCG-C2),該語(yǔ)法使句子結(jié)構(gòu)中同一詞類(lèi)或短語(yǔ)結(jié)構(gòu)可指派不同句法范疇。只考慮部分結(jié)合子來(lái)對(duì)CG進(jìn)行擴(kuò)展,使CCG句法的解釋能力獲得有限的提升,這對(duì)英語(yǔ)來(lái)說(shuō)可能已經(jīng)足夠,但對(duì)漢語(yǔ)來(lái)說(shuō)可能還不行。CCG句法規(guī)則有8條,CCG-C2用51 種范疇轉(zhuǎn)換才取得其樹(shù)庫(kù)所需的句法解釋能力。若更充分地考慮結(jié)合邏輯,使CCG句法規(guī)則更強(qiáng)大,解釋漢語(yǔ)所需的范疇轉(zhuǎn)換種數(shù)就會(huì)下降。在范疇語(yǔ)法中系統(tǒng)地引入結(jié)合子,可建立一個(gè)基于完整結(jié)合邏輯的語(yǔ)法,簡(jiǎn)稱結(jié)合范疇語(yǔ)法(Combinatory CategorialGrammar,CCG),其英文名稱與Steedman的CCG一樣,區(qū)別在于結(jié)合范疇語(yǔ)法考慮了可用作二元句法的所有結(jié)合子,而Steedman的CCG只考慮了結(jié)合子C、B、B。
結(jié)合邏輯是一個(gè)基于結(jié)合子把經(jīng)典一階邏輯里所有邏輯常量規(guī)約為單個(gè)邏輯常量而形成的符號(hào)系統(tǒng)。從結(jié)合邏輯的類(lèi)型系統(tǒng)找到常見(jiàn)結(jié)合子類(lèi)型,得到能夠作為范疇語(yǔ)法句法規(guī)則的結(jié)合子類(lèi)型,再增加少量范疇轉(zhuǎn)換,形成結(jié)合范疇語(yǔ)法,使其能夠解釋漢語(yǔ)的各種短語(yǔ)結(jié)構(gòu)。語(yǔ)義組合是范疇語(yǔ)法的一個(gè)亮點(diǎn),用結(jié)合子的歸結(jié)模式解釋每一步句法分析的語(yǔ)義。
本文的創(chuàng)新在于:1)在范疇語(yǔ)法中系統(tǒng)地引入常見(jiàn)結(jié)合子類(lèi)型,找出能夠作為范疇語(yǔ)法句法規(guī)則的類(lèi)型,形成一套語(yǔ)法規(guī)則體系。2)用結(jié)合子對(duì)短語(yǔ)成分義項(xiàng)的依次應(yīng)用,作為句法規(guī)則關(guān)聯(lián)的語(yǔ)義式。
本文第1節(jié)介紹結(jié)合范疇語(yǔ)法的定義;第2節(jié)介紹結(jié)合子的類(lèi)型指派以及與范疇規(guī)則的對(duì)應(yīng)關(guān)系;第3介紹如何給漢語(yǔ)句法成分指派范疇;第4節(jié)通過(guò)示例說(shuō)明結(jié)合范疇語(yǔ)法的分析能力;最后一節(jié)總結(jié)研究?jī)?nèi)容,給出接下來(lái)的研究工作。
1 結(jié)合范疇語(yǔ)法的定義
范疇語(yǔ)法(CL) 中范疇衍生的唯一方式是函數(shù)范疇對(duì)參數(shù)范疇的“應(yīng)用”,結(jié)合邏輯中項(xiàng)衍生的唯一方式是一個(gè)項(xiàng)“應(yīng)用”到它右邊的項(xiàng)(也稱兩個(gè)項(xiàng)的并置)。若不考慮范疇符號(hào)內(nèi)部結(jié)構(gòu),則范疇系統(tǒng)與項(xiàng)系統(tǒng)一開(kāi)始就是一回事。結(jié)合子使右邊項(xiàng)之間有各種各樣的應(yīng)用關(guān)系,要保持范疇系統(tǒng)與項(xiàng)系統(tǒng)等價(jià),范疇系統(tǒng)就應(yīng)該有對(duì)應(yīng)這些結(jié)合子的東西。。范疇語(yǔ)法的全部擴(kuò)展就是引入結(jié)合邏輯的所有結(jié)合子,而全部結(jié)合子無(wú)限可列,被分為基本和衍生兩部分。如果按已知結(jié)合子在左、新衍生的結(jié)合子在右排列所有結(jié)合子,只引入基本結(jié)合子和排在前面的能用于形成二元句法規(guī)則的結(jié)合子就足夠了。下面是基本結(jié)合子S、K和一開(kāi)始衍生的結(jié)合子,其中‘?表示左邊歸結(jié)到右邊,大寫(xiě)字母是結(jié)合子,小寫(xiě)字母x、y、z、v 是結(jié)合子的參數(shù)。
詞類(lèi)或短語(yǔ)直接通過(guò)結(jié)合規(guī)則結(jié)合成句子[11],首先給句子中的每個(gè)詞指派范疇,通過(guò)以上結(jié)合規(guī)則可以使相鄰范疇進(jìn)行一步步結(jié)合,每一步使用到的結(jié)合規(guī)則直接用結(jié)合子來(lái)表示,從而得到句子的結(jié)構(gòu),用范疇結(jié)合解釋句子的基本結(jié)構(gòu)。
3 詞類(lèi)或短語(yǔ)的范疇指派
詞是按句法功能分類(lèi)[12],可以為句法成分指派范疇。如為主謂結(jié)構(gòu)小句指派范疇s,為名詞性短語(yǔ)指派范疇np,這兩個(gè)范疇為基本范疇,通過(guò)斜線拼接基本范疇得到衍生范疇,使用結(jié)合規(guī)則結(jié)合相鄰的兩個(gè)范疇得到一個(gè)新范疇。由S、K、B、T等規(guī)則可得謂語(yǔ)范疇s/np、定語(yǔ)范疇np/np和np、述語(yǔ)范疇(s/np)/np和((s/np)/np)/np、狀語(yǔ)范疇np/np、(s/np)/(s/np)、(np/np)/(np/np)和((np/np)/(np/np))/(np/np)等、補(bǔ)語(yǔ)范疇np/np、(s/np)/(s/np)和(np/np)/(np/np)等。
漢語(yǔ)的句法基本結(jié)構(gòu)有主謂(subject-predicate,SP)、述賓(verb-object,VO)、定中(attribute-headword,AHn)、狀中(adverbial-headword,DHa 或DHn)、中補(bǔ)(headword-complement,HnC 或HaC)、聯(lián)合(coordina?tion,XX)等,這里中心成分H的語(yǔ)法性質(zhì)可為名詞(n)、動(dòng)詞(v)或形容詞(a),這些結(jié)構(gòu)的范疇都可根據(jù)其句法成分使用范疇結(jié)合規(guī)則得到。其中聯(lián)合結(jié)構(gòu)是兩個(gè)成分直接用連詞或頓號(hào)連接,用(X/X)/X來(lái)表示其范疇,X表示可以匹配任意范疇。使用CCG對(duì)例句“主考教師亦是本校教師”進(jìn)行分析,其分析樹(shù)如圖1所示,首先給每個(gè)詞指派范疇,‘:后是使用結(jié)合子歸結(jié)后的語(yǔ)義表達(dá)式,虛線后表示兩個(gè)范疇組合所用到的句法規(guī)則。當(dāng)一個(gè)小句是不飽和的,即沒(méi)有完整的句法結(jié)構(gòu)時(shí),結(jié)合子的參數(shù)是不完整的,那么結(jié)合子的歸結(jié)語(yǔ)義式則是不完全歸結(jié)的,如圖2所示。
本文CCG的句法規(guī)則部分是跨語(yǔ)言通用的范疇結(jié)合規(guī)則,由于漢語(yǔ)沒(méi)有屈折變化,CCG在用于漢語(yǔ)時(shí)應(yīng)考慮其語(yǔ)法的詞組本位特征[13],詞組本位是由于漢語(yǔ)的句子構(gòu)造原則與詞組的構(gòu)造原則基本一致,可在詞組的基礎(chǔ)上來(lái)描寫(xiě)句法,建立一種以詞組為基點(diǎn)的語(yǔ)法體系。在分析漢語(yǔ)時(shí),有的詞組入句其語(yǔ)法性質(zhì)發(fā)生變化,詞組應(yīng)該轉(zhuǎn)類(lèi),需要通過(guò)增加范疇轉(zhuǎn)換規(guī)則來(lái)滿足詞組入更大詞組的結(jié)構(gòu)需要。如在例句“在校學(xué)生一百五十三點(diǎn)七萬(wàn)人”中,“在校”修飾“學(xué)生”作定語(yǔ),需轉(zhuǎn)換規(guī)則A/v,即把動(dòng)詞轉(zhuǎn)為定語(yǔ),“在?!焙汀皩W(xué)生”結(jié)合作主語(yǔ),“一百五十三點(diǎn)七萬(wàn)”和“人”結(jié)合作“在校學(xué)生”的謂語(yǔ),需轉(zhuǎn)化規(guī)則P/n,該句的分析樹(shù)如圖3所示。
4 結(jié)合范疇語(yǔ)法的分析能力
在使用本文的CCG對(duì)漢語(yǔ)的句子結(jié)構(gòu)進(jìn)行分析時(shí),首先考慮使用跨語(yǔ)言通用的句法規(guī)則,當(dāng)直接使用句法規(guī)則對(duì)漢語(yǔ)句子結(jié)構(gòu)無(wú)法解釋時(shí),增加相應(yīng)的范疇轉(zhuǎn)換,兩者相結(jié)合,使其形成完整的結(jié)合范疇語(yǔ)法,能夠?qū)h語(yǔ)的各種結(jié)構(gòu)進(jìn)行分析。
用本文CCG和CCG-C2分別對(duì)“學(xué)生成績(jī)有了大幅度上升”進(jìn)行分析,分析樹(shù)如圖4、圖5所示,其區(qū)別在于兩者使用的句法規(guī)則不同,且前者未使用范疇轉(zhuǎn)換,后者則通過(guò)增加了相應(yīng)的范疇轉(zhuǎn)換規(guī)則,最終兩者同時(shí)產(chǎn)生相同結(jié)構(gòu)的分析樹(shù)。
CCG為滿足對(duì)漢語(yǔ)的分析,也加入了少量的范疇轉(zhuǎn)換,對(duì)比CCG-C2 存在67個(gè)范疇轉(zhuǎn)換規(guī)則,CCG在增加句法規(guī)則的基礎(chǔ)上只保留39個(gè)范疇轉(zhuǎn)換規(guī)則,是由于CCG充分融入了結(jié)合子的類(lèi)型,其句法規(guī)則更強(qiáng)大,可以減少對(duì)范疇轉(zhuǎn)換的使用,這樣就減少了對(duì)漢語(yǔ)分析時(shí)的主觀性,在對(duì)例句“國(guó)家教委打算出臺(tái)一項(xiàng)改革方案”分析時(shí),CCG也使用了范疇轉(zhuǎn)換,如圖6 所示,但對(duì)比CCG-C2的分析,如圖7所示,范疇轉(zhuǎn)換的數(shù)量相對(duì)減少。對(duì)樹(shù)庫(kù)進(jìn)行比較表明,引入完整結(jié)合邏輯可使范疇語(yǔ)法的句法能力比CCG-C2只引入部分結(jié)合邏輯的句法能力增強(qiáng)37%。
5 結(jié)論
漢語(yǔ)由于缺乏屈折變化,其詞類(lèi)有多種句法功能,基于以前的范疇語(yǔ)法及其擴(kuò)展,需要對(duì)詞類(lèi)進(jìn)行大量轉(zhuǎn)類(lèi),用轉(zhuǎn)類(lèi)的方法分析漢語(yǔ)具有主觀性,這是由于以前的范疇語(yǔ)法及其擴(kuò)展沒(méi)有更充分地考慮結(jié)合邏輯。因此根據(jù)結(jié)合邏輯的類(lèi)型系統(tǒng)找到常見(jiàn)結(jié)合子的類(lèi)型,提取出可以作為對(duì)應(yīng)范疇語(yǔ)法句法規(guī)則的結(jié)合子類(lèi)型,得出一套基于結(jié)合邏輯的范疇語(yǔ)法的句法規(guī)則,并增加少量的范疇轉(zhuǎn)換,形成一套能解釋漢語(yǔ)的語(yǔ)法體系。語(yǔ)義部分使用結(jié)合子的歸結(jié)模式來(lái)表示,其語(yǔ)義邏輯式也是完全由句法范疇決定,因此支持范疇類(lèi)型的透明性。結(jié)合邏輯中是否還存在其他的結(jié)合子類(lèi)型可以用來(lái)減少詞類(lèi)的轉(zhuǎn)類(lèi)問(wèn)題,以及CCG是否能夠解釋漢語(yǔ)中所有的句子結(jié)構(gòu)情況,需要通過(guò)構(gòu)建樹(shù)庫(kù)去驗(yàn)證,這也是本文接下來(lái)的工作。
【通聯(lián)編輯:李雅琪】