朱樂亞
(湘潭大學(xué)碧泉書院,湖南 湘潭 411105)
組合范疇語法(以下簡稱CCG)是因?yàn)榉懂狀愋瓦壿嬙谧匀徽Z言理解(NLU)中的應(yīng)用而發(fā)展起來的,CCG 作為計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要研究方向,其目的是使理論盡可能地接近心理和計(jì)算機(jī)制。這樣的機(jī)制可將語句映射為意義,再將意義映射成語句,并且能夠使兒童或計(jì)算機(jī)程序通過接觸文本中有意義的語句而學(xué)習(xí)任何人類語言的語法,進(jìn)而實(shí)現(xiàn)人與計(jì)算機(jī)之間的有效交流。CCG 又給表層句法和底層語義之間提供了一個(gè)完全透明的接口,每一個(gè)接口直接對應(yīng)了一個(gè)解釋結(jié)構(gòu),這就允許CCG 為人類語言處理的遞增本質(zhì)提供一個(gè)說明。
CCG 的句法規(guī)則基于組合邏輯以及范疇演算,使用CCG 進(jìn)行語法分析的魅力在于它便于恢復(fù)在提取、并列組合、控制和提升等結(jié)構(gòu)中涉及的非局部依存關(guān)系,從而實(shí)現(xiàn)自然語言的機(jī)器理解,因此CCG 的研究也就成了NLU 的先導(dǎo)性工作。因此,自Ades & Steedman 提出CCG 以來,CCG 已經(jīng)成為最直接面向NLU 的邏輯理論[1]。但是在自然語言中,尤其是在漢語這種意合型語言中,我們難以準(zhǔn)確地刻畫其表層句法形式和語義描述之間完整的關(guān)系模式。正是從這一個(gè)角度考慮,我們從語義的形式化入手,為CCG 構(gòu)建配套的漢語形式語義系統(tǒng)。
我們選擇漢語動趨式為突破口,一個(gè)重要的原因在于目前漢語動趨勢的組合性探討并不多,而動趨勢之間的對比研究和推演問題又是漢語句式所關(guān)注的熱點(diǎn)[2-6]。與現(xiàn)有的CCG 強(qiáng)調(diào)的“句法-語義”并行推演不同,本研究更加側(cè)重漢語部分動趨式的句法和語義對比研究。在句法方面,本研究旨在嘗試通過CCG 的組合性原則導(dǎo)出漢語動趨式的合法范疇并進(jìn)行解析,歸納兩類漢語動趨式的異同。在語義層面,本研究將基于會話語境,從而借助CCG 析出兩類漢語動趨式的話語信息結(jié)構(gòu),并探究其是否總是遵循“焦點(diǎn)居尾”原則;然后分別系統(tǒng)地陳述趨向動詞主觀和客觀范疇的具體使用情況。
Steedman 通過擴(kuò)張范疇語法(CG)的規(guī)則,使CG 成為一種具有更充分推理能力的邏輯體系,形成了CCG 理論[7]。按照鄒崇理的介紹,CCG 出現(xiàn)的最重要的特征是在CG 系統(tǒng)中增加了不同的組合算子[8]。引入這些新算子,必然導(dǎo)致了新規(guī)則的引入,而所有的規(guī)則都要服從Steedman 所述的組合類型透明原則(The Principle of Type Transparency)[9];使用這些組合規(guī)則就有可能對提取和并列組合結(jié)構(gòu)涉及的長距離依存關(guān)系作一個(gè)簡潔的分析。與傳統(tǒng)的邏輯學(xué)研究有所不同,CCG 以“認(rèn)知=計(jì)算;語法=邏輯;分析=演繹”為核心思想[10]。因此,CCG 通過引入這些算子和規(guī)則來擴(kuò)張CG 是基于語言學(xué)實(shí)際需求,而非出于邏輯性質(zhì)的考慮。這是一種以問題為導(dǎo)向的擴(kuò)張,即規(guī)則的擴(kuò)張主要是以找出適于計(jì)算機(jī)處理自然語言的實(shí)際辦法為目標(biāo)。正是這種實(shí)用主義導(dǎo)向使得CCG 成為與NLU 結(jié)合最為緊密的一種邏輯理論。
尤其是漢語這樣的意合型語言,句法結(jié)構(gòu)與語義結(jié)構(gòu)難以截然分開。相應(yīng)的,在對自然語言做形式化解析時(shí),“句法-語義”互動推演也應(yīng)該成為CCG 需要考慮的問題。為了使語法的生成力和解析力保持在可控的范圍內(nèi),Steedman 提出了組合性規(guī)則必須遵守以下原則[11]:a. 毗連性原則,即組合性規(guī)則(詞法規(guī)則和句法規(guī)則)只能應(yīng)用于有窮多個(gè)語音上表現(xiàn)出來的字串鄰接實(shí)體;b. 一致性原則,也就是說,所有的句法組合規(guī)則一定要與主函子的方向一致;c. 繼承性原則,如果運(yùn)用組合性規(guī)則生成了一個(gè)函項(xiàng)范疇,那么在那個(gè)范疇中定義一個(gè)已知論元的方向性斜線同于在輸入范疇中定義相對應(yīng)的論元的方向性斜線。
CCG 主要采取詞匯主義路線,通過為詞匯指派相應(yīng)的范疇類型,據(jù)此決定不同的句法解析路徑,從而一步到位地得到語句的表層結(jié)構(gòu)和相應(yīng)的語義表征。也就是說,同一個(gè)詞匯可能具有不同的范疇,而不同范疇參與句法運(yùn)算,就會產(chǎn)生不同的句法結(jié)構(gòu),同時(shí)也獲得了相應(yīng)的語義結(jié)構(gòu)。近年來,Steedman 將CCG 運(yùn)用到話語信息結(jié)構(gòu),從而更好地解釋說話者傳達(dá)的信息在會話語境中的含義[11]。Steedman 分別使用“θ”和“p”兩個(gè)維度進(jìn)一步區(qū)分“主位”和“述位”,其依據(jù)是聽話者是否有效地回答說話者的問話,或者聽話者自身對說話者預(yù)設(shè)聽話者所回答內(nèi)容的立場表決。
試看以下兩種動趨式。
表1 漢語動趨勢分類
CCG 的優(yōu)勢就是將豐富的組合信息編碼到詞條信息中,那么A 式和B 式的詞項(xiàng)范疇對于整個(gè)語句的組合性推演就十分重要,基于CCG 可進(jìn)一步給出A 式和B 式在會話語境下的組合性解釋。據(jù)此,本文將分別給出A 式和B 式的CCG 推演。AI 的隱性主語“e”用范疇S/IV 表示;“拿出來”作為中補(bǔ)短語用范疇IV/NUMP 表示;“一本”作為度量詞用范疇NUMP/NP 表示。具體來說,AI 可以重構(gòu)為:
H①“H 表示說話人”,“S表示聽話人”,“*”表示新信息和焦點(diǎn),“ㄒ”表示完全肯定,“⊥”表示立場否定。:拿出來什么?
S:我拿出來一本書。
ㄒ(p(*一本書)S)
“話語者認(rèn)為他拿出的是一本書。”(蘊(yùn)含:肯定)
在CCG 框架內(nèi)先給出AI 的主要詞條,如下所示:
詞條1
e(我):=S/IV:λp.p 我';拿出來:=IV/NUMP:λxλy.拿出來'xy
一本書:=NUMPT,p:λq.q(*skolem'書')
根據(jù)詞條范疇可組合性地推演出AI,見圖1。
圖1 “拿出來一本書”的CCG 推演圖
AII 可還原為目的語句:(e)拿出一本書(e)來(看),其中“拿出”這個(gè)動作是先于“來(看)”之前,因此“拿出”是過去體標(biāo)記,而“出”作為體態(tài)助詞且視為動作完成的標(biāo)記詞。AII 是分別由“(e)拿出一本書”和“(e)來(看)”兩個(gè)小句構(gòu)成,從而可得到圖2。
圖2 “拿出一本書來”的范疇生成推演樹一
AII 也可以用另一種方式推導(dǎo),見圖3。其中,“來”的范疇為SS,很明顯,“來”理應(yīng)作副詞從而修飾整個(gè)語句,而此處“來”是趨向動詞,在詞性上與副詞屬性不兼容,故這種組合方式不可取。
圖3 “拿出一本書來”的范疇生成推演樹二
AII 可重構(gòu)為:
H:你拿出一本書干什么?
S:我拿出一本書來看。
ㄒ(p(*來看)S)
“話語者認(rèn)為他的目的是看書?!保ㄌN(yùn)含:肯定)
AII 的主要詞條如下所示:
詞條2
e(我):=NP1:λp.p 我';拿出:=(S1NP1)/NP2:λxλy.拿出'xy
一本書:=NP2:λq.q(*skolem'書');然后:=CONJ:and'
來(看):=S2,T,pNP1,T,p:λw.purpuse'(*來(看)')w
根據(jù)詞條2 和圖2 的組合方式,可進(jìn)而得到圖4。
圖4 “拿出一本書來”的CCG 推演圖
AIII 可解讀為:(e)拿一本書(書)出來,其中“出來”的主語是“書”而不是“e”,AIII 由“(e)拿一本書”和“(書)出來”兩個(gè)小句構(gòu)成,AIII 的詞條指派與AII 除兩個(gè)小句的主語不一致外,其余詞條指派一致。
詞條3
e(我):=NP1:λp.p 我';
拿:=(S1NP1)/NP2:λxλy.拿'xy
一本書:=NP2,T,p:λq.q(*skolem'書')
導(dǎo)致:=CONJ:and';出來:=S2NP2:λw.appear'(出來')w
從而AIII 的推演結(jié)果如圖5 所示。
圖5 “拿一本書出來”的CCG 推演圖
BI 中“一只鳥”做“飛進(jìn)來”的施事賓語,也就是說,“飛進(jìn)來”的主語不是空的而是其賓語“一只鳥”。
基于詞條4,可得到圖6。
圖6 “飛進(jìn)來一只鳥”的CCG 推演圖
詞條4
一只鳥:=NPT,p:λp.p(*skolem'鳥');飛進(jìn)來:=VP/NP:λy.飛進(jìn)來'y
BII 可解讀為:(e1)飛進(jìn)一只鳥來(e2),“飛進(jìn)……來”表示一只鳥位移的起始,“飛進(jìn)”的前面表示一只鳥位移的起點(diǎn),比如:(窗外)飛進(jìn)一只鳥。趨向動詞“來”表示位移的終點(diǎn),比如:(窗外)飛進(jìn)一只鳥來(屋里)?!帮w進(jìn)……來”同時(shí)也指涉“一只鳥”發(fā)出動作的先后順序。
BII 的詞條指派見詞條5,進(jìn)而生成圖7。
圖7 “飛進(jìn)一只鳥來”的CCG 推演圖
BII 可重構(gòu)如下:
H:窗外飛進(jìn)一只蜜蜂來(屋里)?
S:窗外飛進(jìn)來一只鳥來(屋里)。
⊥(p(*一只鳥)H)
“話語者認(rèn)為飛進(jìn)來的對象不是蜜蜂而是鳥。” (蘊(yùn)含:否定)
詞條5
(窗外)e1:=NP1:λq.q 窗外';飛進(jìn):=(S1NP1)/NP2:λxλy.飛進(jìn)'xy
然后:=CONJ:and';一只鳥:=NP2,T,p:λp.p(*skolem'鳥')
來e2(屋里):=S2NP2:λw.來'屋里'w
在BIII 中,“飛”是不及物動詞,“一只鳥進(jìn)來”是完整的語句S,若“飛一只鳥進(jìn)來”是個(gè)合法的語句,其范疇指派應(yīng)為S,那么“一只鳥進(jìn)來”的范疇?wèi)?yīng)指派為S/IV,這與“一只鳥進(jìn)來”的范疇S 不符合,所以BIII 違背CCG 的組合性規(guī)則。符號“*”表示該范疇無法和其他范疇進(jìn)行兼容運(yùn)算,具體分析見圖(8)。
如上所述,A 式和B 式在句法推演過程中都遵循CCG 的組合規(guī)則而生成合法語句,A式和B 式相比,A 式組合性強(qiáng),句式靈活;B 式組合性弱而導(dǎo)致衍生語句的不合法性。而在不同的會話語境下,A 式和B 式的焦點(diǎn)信息分布也不一樣,故未完全遵循“焦點(diǎn)居尾”原則。因而可得:A 式[+強(qiáng)組合性,±焦點(diǎn)居尾];B 式[+弱組合性,±焦點(diǎn)居尾]。
A 式是典型的動作句,表明施事者通過施加某個(gè)動作“拿”從而導(dǎo)致“一本書”出來(呈現(xiàn)結(jié)果)。A 式強(qiáng)調(diào)客觀敘述某個(gè)“動作”所帶來的結(jié)果,然而這個(gè)“動作”是真實(shí)存在的。A 式客觀語義可用圖9 表示。
圖9 “A 式”的客觀語義圖
B 式是典型的存在句,B 式的側(cè)重點(diǎn)在于某個(gè)物體(一只鳥)。BI 式側(cè)重描述“一只鳥”飛進(jìn)來的過程,視角點(diǎn)在于描寫“一只鳥”飛的過程,然而這個(gè)過程是持續(xù)的;BII 式描述了“一只鳥”位移的終點(diǎn),這個(gè)過程是有限的。B 式的描述都是根據(jù)觀察者的主觀意識來刻畫“一只鳥”這個(gè)物體。BI 式的語義解析可通過圖10 表示,其中,灰色陰影部分表示“一只鳥”飛入的空間,黑色的球體表示“一只鳥”,實(shí)線箭頭表示“一只鳥”位移的時(shí)長,虛線箭頭表示“一只鳥”位移的過程。由此,我們可以清楚地發(fā)現(xiàn)BI 式側(cè)重描寫物體的位移過程。
圖10 “BI 式”的客觀語義圖
BII 式的語義解析如圖11,與BI 不同的是,BII 式完整地刻畫了“一只鳥”位移的整個(gè)過程(起點(diǎn)和終點(diǎn))。由于視線范圍的描述取決于觀察者,因而B 式有強(qiáng)主觀性。綜上,A 式[+客觀性];B 式[+主觀性]。
圖11 “BII 式”的客觀語義圖
再基于A 式和B 式的結(jié)構(gòu)分析,我們可明顯地發(fā)現(xiàn)賓語“一本書”在A 式中做受事賓語;而“一只鳥”在類型B 中做施事賓語。BIII 和BIV 不合法,故不再做分析。A 式是典型的動作句,表明“一本書”是某人施加動作而得以顯現(xiàn),所以A 式的賓語又是動作對象。B 式是以觀察者為切入視角而發(fā)現(xiàn)的結(jié)果,所以在B 式中賓語側(cè)重描寫出乎意料和引人注目的事情,B 式的賓語又是描寫對象。與B 式相同類型的語句如下:
a.從那灰棕色汽車?yán)锾鰩讉€(gè)暴徒,把楊林生捆綁起來,打了幾拳,把他的皮包搶走了。
b.劉寬聽見陌生人冒出這番話,神經(jīng)如同被烙鐵燙了一下,臉色陡變,立即轉(zhuǎn)過臉來,喝問:“你是什么意思……你……你是誰?”
c.后臺門口忽然跑進(jìn)一個(gè)略帶緊張神色的軍官。
如以上例句所示,“幾個(gè)暴徒”“這番話”和“一個(gè)略帶緊張神色的軍官”都是動作主體所描述的場景,而且這些描述性賓語往往有出乎意料之意。語句a 對“暴徒”所做的事情作出了描述,語句b 對“這番話”說出的結(jié)果產(chǎn)生了“神經(jīng)如同被烙鐵燙了一下”和“臉色陡變”等反應(yīng);語句c 用“忽然”來形容描述對象所出現(xiàn)的場景。所以B 式更加側(cè)重描述出乎意料的事情?;谝陨戏治?,最終可得:A 式賓語[+客觀動作義];B 式賓語[+主觀描述義]。
若A 式和B 式刪除量詞后,其結(jié)果見表2。
表2 無量詞式漢語動趨勢分類
沈家煊認(rèn)為某些句法組合沒有數(shù)量短語就不能成立[12]。其中A 類語句沒有數(shù)量短語的限制,A 句仍然合法,而B 句若是刪去數(shù)量短語,B 句的語義就會發(fā)生變化甚至不成立。也就是說,A 類語句不受數(shù)量短語語義制約,A 句具有穩(wěn)定性;而B 句的語義和結(jié)構(gòu)卻因數(shù)量短語而產(chǎn)生了變異或者結(jié)構(gòu)成分缺失。但是,若在B 句中增添“這/那只”則形成C 句。即使B 句有數(shù)量短語修飾名詞,但是B 句仍然不能夠生成合法的句子,只有當(dāng)B 句中的量詞以“無定”形式且修飾可數(shù)名詞的時(shí)候才視為合法的句子,因而量詞對B 句的影響是不完全的。
Bach[13]曾以集合的概念,來說明普通名詞的語義指涉,比如:B 句中,“鳥”作為普通名詞,可以用來指一個(gè)集合,而這個(gè)集合中,含有的是所有具有“鳥”特性的個(gè)體。正如Bach所解釋的,普通名詞的指涉與集合關(guān)系,以及動詞組的時(shí)間指涉語義,與Montague[14]所談及的種類與個(gè)體之間的特性關(guān)聯(lián),來解釋B 類動趨式結(jié)構(gòu)和名詞組間的語義互動,從而了解B 類動趨式結(jié)構(gòu)中名詞組的語言形式所帶來的語義變化。Montague 稱“一”表達(dá)的是某一的意思,即“一”具有任意性。從集合的觀點(diǎn)來看,“一只鳥”是同種類的一個(gè)個(gè)體而不是整個(gè)種類,因而無法從單一個(gè)體特性推至種類中全部個(gè)體,所以“一只鳥”描繪的是狀態(tài)性或者短暫性,這與“飛進(jìn)來”所指涉的時(shí)間語境相符合,因而當(dāng)B 式使用“一只”作為度量詞修飾名詞時(shí)最為合適。
但A 式無論刪減量詞與否,都不影響A 式的語義,沈家煊認(rèn)為“有界”與“無界”的區(qū)分主要以人的感知和認(rèn)識為準(zhǔn)。進(jìn)而,人的感知和認(rèn)知是有差異性的,“書”對于使用的人而言是具有熟知度的,因?yàn)槭褂谜咧雷约涸撃脮鍪裁矗康男裕?,這種目的性在A 式中的含義是隱性的,所以無論A 式是否使用量詞,這些都不會干擾使用者的確認(rèn)度(使用者知道拿書做什么)。
這也同樣蘊(yùn)含觀察者非常熟悉“這只/那只鳥”,但如果在“飛進(jìn)來”所指涉的短暫語境里,觀察者是無法識別“這只/那只鳥”就是自己見過的“鳥”,這具有不確定性,因此,C 類根本不成立,除非觀察者給“鳥”做了特殊記號。BIII 中,“飛鳥”具有歧義性,在語法方面,“飛鳥”要么做主語,表示飛鳥這類動物;要么做賓語,表達(dá)外面飛了鳥進(jìn)來。然而,“飛鳥”從形式上來看:?x(鳥'(x)∧飛'(x)),意思指存在“飛鳥”這類動物,但“飛鳥”是文學(xué)概念,并無法在現(xiàn)實(shí)生活中找到“飛鳥”,故BIII 在現(xiàn)實(shí)中不成立?;谝陨戏治觯嚎傻?,A 式賓語[±數(shù)量短語];B 式[+無定性]。
CCG 是一種強(qiáng)詞匯化語法理論,其中A 式和B 式的動趨勢語法范疇包括“句法類型所確定的價(jià)數(shù)”(論元的數(shù)量和相應(yīng)類型)以及組合后結(jié)果的類型、論元的線性排列、論元組合的先后次序以及邏輯形式和語音形式。語類詞庫用來存儲動趨勢的特定信息,一些通用的類型驅(qū)動組合句法規(guī)則將這種特定語言詞庫的語音和語義映射到相對應(yīng)的句子中。
動趨勢所有的范疇都是肯定極性詞,并堅(jiān)守極性詞保存原則,因而暫時(shí)不考慮所有的句法和語義相關(guān)的極性標(biāo)記。CCG 是裹攜式結(jié)構(gòu)納入語法內(nèi),然后根據(jù)詞元關(guān)系進(jìn)行組合性運(yùn)算,而不是純粹的句法組合規(guī)則,CCG 處理動趨勢在句法上僅通過組合性規(guī)則而消去毗連成分。若將A 式和B 式的“量詞”全作“逆向轄域解讀”處理,那么A 式可解讀為“一本書被人拿出來了”。與A 式不同的是,B 式卻解讀為“一只鳥被飛進(jìn)來了”,顯然該解讀的可接受性低,“飛進(jìn)來”是不及物動詞,而B 式的逆向轄域解讀卻作及物動詞,這是不合理的。無論是量詞逆向還是表層轄域解讀,A 式的可接受性更具優(yōu)勢,故:A 式[+強(qiáng)描述力];B 式[+弱描述力]。
漢語是一種意合型語言,形式句法標(biāo)記貧乏,“句法-語義”不對稱的現(xiàn)象比比皆是。句法的推演不是僅僅由句法標(biāo)記和語序決定的,詞匯本身所攜帶的語義信息對句法推演起到了很大的支配作用,這是CCG 理論的最大特色。我們借助CCG 探討了兩類漢語動趨式的異同,研究結(jié)果有以下幾方面。一方面,A 式和B 式在句法和語義方面都嚴(yán)格遵守了組合性原則,且A 式的描述力更強(qiáng),A 式側(cè)重客觀地?cái)⑹鰟幼鞯膶?shí)施,B 式側(cè)重主觀地描寫在觀察者視角下物體的位移過程,由此可見,漢語動趨式句并不一定存在主觀范疇,也有客觀范疇。另一方面,在數(shù)量短語修飾方面,A 式不受數(shù)量短語的嚴(yán)格約束,有無數(shù)量短語修飾都不影響A 式,B 式只能夠相容無定形式的量詞。此外,A 式和B 式在會話語境中都并未嚴(yán)格遵守“漢語焦點(diǎn)居尾”原則。即:
A 式:[+強(qiáng)組合性,+客觀動作義,±數(shù)量短語,±焦點(diǎn)居尾,+強(qiáng)描述力]
B 式:[+弱組合性,+主觀描述義,+無定性,±焦點(diǎn)居尾,+弱描述力]
盡管CCG 以實(shí)現(xiàn)自然語言“句法-語義”并行推演為特色,但是面對棘手的語義問題,也不得不有所放手,優(yōu)先實(shí)現(xiàn)句法的解析。由于漢語動趨勢形式語義多變,因而擴(kuò)充CCG的語義標(biāo)注和推演是十分必要的。因本文篇幅有限,故未探討動趨勢句的虛詞化研究。