蔣本蓉
提 要:《現(xiàn)代漢語語義詞典》(Semantic Knowledge-base of Contemporary Chinese, 簡稱SKCC)是一部機(jī)器可讀的漢語語義詞典。本文概括介紹SKCC的內(nèi)容、特點并分析其主要缺點,嘗試用莫斯科語義學(xué)派“意思諼謀盡蹦J街械摹爸配模式”來克服SKCC的不足。支配模式同時體現(xiàn)關(guān)鍵詞用于所有義項時的語義、句法信息以及詞義搭配的語義限制,應(yīng)成為語義詞典知識描述系統(tǒng)不可缺少的組成部分。
關(guān)鍵詞:語義詞典;支配模式;語義配價;句法配價
中圖分類號:H16文獻(xiàn)標(biāo)識碼:A文章編號:1000-0100(2009)04-0129-3
Mode of Government in Semantic Dictionaries of Chinese
Jiang Ben-rong
(Heilongjiang University, Harbin 150080,China)
Semantic Knowledge-base of Contemporary Chinese (SKCC) is a Machine Readable Dictionary. This paper has discussed the contents, character, analyzed the shortage of the SKCC and put forward a settlement — the Mode of Government of system“MeaningText”of the Moscow semantic school. The Mode of Government presents the semantic and syntactic information of all the senses of a word and semantic restraint in word combinations. The Mode of Government should be a necessary part of the Semantic Dictionaries.
Key words:semantic dictionary; mode of government; semantic valence; syntactic valence
漢語語義詞典的研發(fā)經(jīng)歷了不斷發(fā)展變化的過程,從以人為對象、以動詞為主,類似德語、法語基于動名搭配形式偏重價量分析的配價詞典,如孟琮等(1987)編寫的《動詞用法詞典》,林杏光等編寫的《現(xiàn)代漢語動詞大詞典》(1994)和魯川編寫的《動詞大詞典》(1994)到以機(jī)器為對象、系統(tǒng)描寫名詞、動詞、形容詞等實詞語義信息的語義詞典。語義詞典的描寫模式日趨成熟。
從1994年開始,北京大學(xué)與中國科學(xué)院計算所著手研制面向漢英機(jī)器翻譯的《現(xiàn)代漢語語義詞典》(Semantic Knowledge-base of Contemporary Chinese, 簡稱SKCC),其目的是“在語法分析的基礎(chǔ)上為計算機(jī)自動分析漢語句子和生成英語句子提供更深入的語義信息”。(王惠等2003:352)本文以該詞典為對象,概括介紹其內(nèi)容、特點,分析其缺點,并嘗試用莫斯科語義學(xué)派“意思諼謀盡蹦J街械摹爸配模式”彌補(bǔ)SKCC的不足之處,在此基礎(chǔ)上提出建構(gòu)漢語語義詞典的一個更為合理的語義知識描述框架。
1 《現(xiàn)代漢語語義詞典》概述
SKCC主要包括兩方面的內(nèi)容——詞的語義分類和語義搭配。一方面,SKCC 對名詞、動詞、形容詞等實詞進(jìn)行了系統(tǒng)的語義分類;另一方面,SKCC以詞的義項為單位全面描寫詞的語法、語義信息,包括拼音、詞類、兼類(名詞“鎖”兼為動詞)、同形(字形、詞類相同但詞義不同,如“抄近道”的“抄”與“抄作業(yè)”的“抄”)、義項、釋義、語義類、配價數(shù)量,配價成分的語義角色(主體、客體、與事)和搭配的語義約束(即主體、客體、與事所屬的語義類名稱,例如,“死”的主體語義約束條件是“生物”)等。其中詞的語義搭配(后三項)是描寫重點。
SKCC的建構(gòu)原理被稱為“廣義配價模式”,即基本采用配價理論的模式并融合格語法的語義角色系統(tǒng)。廣義配價模式包括語義分類、配價、論元角色選擇限制、配價成分變化四個方面(詹衛(wèi)東 2000:40)。其中對配價成分變化的描寫只是SKCC初期的嘗試,廣義配價模式實際上只包括前三個方面。
SKCC把格語法的論元概念從動詞擴(kuò)展到謂詞(即動詞、形容詞和名詞),并把格系統(tǒng)進(jìn)行簡化,“主體”和“客體”的含義更加廣泛,“主體”包括通常的“施事”、“當(dāng)事”,還包括部分名詞和形容詞的配價成分。動詞的論元有6個:“主體”、“客體”、“與事”、“工具”、“處所”為核心論元,“空間”、“時間”為外圍論元。對大多數(shù)動詞只標(biāo)注前3個核心論元,其他論元必要時才標(biāo)注。SKCC把格語法和配價理論融合在一起,這樣,論元成分的數(shù)量多于配價的數(shù)量。例如,動詞“找”是一個同形詞,當(dāng)“找”表示“尋找”的意義時,其語義類別為“對待”,是2價動詞,即可以搭配“主體”和“客體”配價,對“主體”配價的要求是“人”,對“客體”配價的要求是“具體事物”,如“他找書”;當(dāng)“找”表示“退還”意義時,其語義類別也是“對待”,但卻是3價動詞——“主體”、“客體”、“與事”,對“主體”的要求是“人”,對客體的要求是“錢”,對與事的要求是“人”,如“我找他3塊錢”(王惠等 2006:140)。
SKCC采用“廣義配價模式”系統(tǒng)描寫詞的語義分類和語義搭配??偟膩砜?SKCC對詞的語義知識描寫是比較全面、深入、合理的。與以往的語義詞典相比,SKCC在理論基礎(chǔ)、內(nèi)容、規(guī)模、描寫框架等方面更加成熟,更加合理。實踐證明,SKCC對于漢英機(jī)器翻譯系統(tǒng)的句義分析、詞匯歧義消解、提高翻譯精度方面有較明顯的作用。
2 SKCC的缺陷及解決辦法
SKCC的語義知識描述框架并非完美無缺。范曉曾指出,理想的動詞配價詞典是“某種語言生成句子的詞典”,應(yīng)描寫述謂結(jié)構(gòu)的性質(zhì)(動作、性狀、變化、關(guān)系等)和所聯(lián)系的語義角色以及某些經(jīng)常聯(lián)系的說明語,在此基礎(chǔ)上,對該動詞的形式特征以及它組配成的述謂結(jié)構(gòu)所生成的句模和各種可能有的句型進(jìn)行詳盡的描寫。如果可能,還可標(biāo)注該動詞使用的條件和所組成的句型、句模組合體在語用上的選擇性(范曉1996:7)。
范曉的觀點恰好說明了SKCC最大的缺陷——SKCC沒有以詞的義項為單位全面、系統(tǒng)描寫句型并且沒有詳盡刻畫該義項在不同句型中使用的語義約束條件,即SKCC描寫的詞的組合信息是靜態(tài)的,不是動態(tài)的。例如,上文中“找”的第1義項的語義信息是不全面的,許多組合,如“你找誰”,“我找你們領(lǐng)導(dǎo)”,“找工作”,“找對象”(男、女朋友)等的客體配價并不是“具體事物”,如果不全面標(biāo)注“找”在所有不同句子中的組合搭配信息及搭配限制,計算機(jī)就無法譯出正確的句子。
我們認(rèn)為,采用莫斯科語義學(xué)派“意思諼謀盡蹦J降拇士狻斷執(zhí)俄語詳解組合詞典》(Толково-комбинаторный словарь современного русского языка, 簡稱TKC)中的“支配模式”可以克服SKCC的不足。支配模式表示被釋詞項的語義配價和句法題元間的對應(yīng)關(guān)系以及限制句法題元表達(dá)方法的語法、語義條件,支配模式是描寫謂詞語義與句法結(jié)構(gòu)的接口。按照莫斯科語義學(xué)派的觀點,語義配價直接來源于詞匯語義單位的詞匯意義,與詞匯語義單位的元語言釋文中表示必須情景參與者的變項一一對應(yīng),而句法題元是由文本中實際出現(xiàn)的與關(guān)鍵詞具有強(qiáng)支配關(guān)系的主語和補(bǔ)語決定的,即謂詞在句法結(jié)構(gòu)層面上連接的句法位(Апресян 1974:120-121,Мельчук1974:135)。在支配模式中對應(yīng)關(guān)鍵詞的每個語義配價給出相應(yīng)句法題元的表達(dá)方法;反過來,對應(yīng)關(guān)鍵詞的每個句法題元在支配模式中給出語義解釋,即指出關(guān)鍵詞所示的情景中該題元表示的角色(Мельчук 1974:138)。一個詞有幾個義項可能就有幾個支配模式。
3 支配模式
支配模式分為“支配模式表格”和“支配模式限制”兩個欄目。
3.1 支配模式表格
支配模式以表格形式呈現(xiàn)。表格中每一個縱列對應(yīng)被釋詞項的一個語義配價,而每一個橫列描寫相應(yīng)句法題元的一種表達(dá)方式。例如,動詞“治療1” 的釋義為“X采用方法Z作用于Y,目的是停止Y的疾病、創(chuàng)傷W或是停止W的后果”(TKC 1984: 400)。《現(xiàn)代漢語詞典》(簡稱《現(xiàn)漢》 2006:1758)對“治療”的釋義為“用藥物、手術(shù)等消除疾病”,從釋義中可以看出,俄、漢語中“治療”有4個語義配價:主體X(醫(yī)生),客體 Y(病人)、W(疾病、外傷)和方式Z。其支配模式如下圖所示:
患者Y和身體部位的疾病、外傷W是領(lǐng)屬關(guān)系,在語義層面是一個復(fù)合語義配價——“客體”,在表層,即句法題元層面,可以由一個復(fù)合題元表示,即由領(lǐng)屬名詞短語作賓語,如“老中醫(yī)用針灸治療病人的關(guān)節(jié)炎”,也可分裂為不同的句法題元,即分裂為領(lǐng)有者和所屬事物兩個部分,可表示:(1)患者的疾病;(2)疾病;(3)患者。例如,“老中醫(yī)用針灸給病人治療關(guān)節(jié)炎”;“這個醫(yī)生專門治療風(fēng)濕病”;“他只治療危重病人”。漢語中有許多類似的配價分裂現(xiàn)象,如“王冕死了父親”,“他摸我頭”,“電視降價了”等。此外,主體X還可以用“名詞短語+治療”表示,客體復(fù)合語義配價用領(lǐng)屬名詞短語表示,在句中作主謂謂語,如“他的胃潰瘍醫(yī)生在用藥物治療”。
除了配價分裂,支配模式還能反映配價合并現(xiàn)象。配價合并指的是謂詞的兩個語義配價用一個句法題元體現(xiàn)。例如,兼語句動詞“佩服”可以把客體配價和緣由配價合二為一,如“我佩服你(客體)的勇氣(原因)”,“父親佩服敢想敢干的年輕人(原因+客體)”,“所有人佩服他(客體)門門功課得100分(原因)”?!芭宸钡闹淠J胶唵伪硎緸橄聢D,其中第三行跨兩個縱列,共同體現(xiàn)客體和緣由:
3.2支配模式限制
“支配模式限制”欄目描寫關(guān)鍵詞的句法配價兼容共現(xiàn)的約束條件?!爸委?”的支配模式限制有2個:(1)主體為表人的名詞短語。(2)2.2為動物名詞短語,不表示器官??梢哉f,“醫(yī)生給病人(或熊貓)治療消化不良”,不能說*“我們給小草治療疾病”??梢哉f,“醫(yī)生給他治療痛風(fēng)”,“醫(yī)生給老王治療手部骨折”,不能說*“醫(yī)生給他的腳治療痛風(fēng)”;*“醫(yī)生給老王的手治療骨折”。
“治療2”的釋義為“Z 治療 W = 方法或手段Z能夠停止疾病或創(chuàng)傷W(Y的)或W的后果”(TKC 1984: 403),當(dāng)表示方法、手段的詞作主語時,“治療”有三個語義配價:方法1Z、客體2W(什么被停止)和主體3Y(誰生病/受傷),其中主體隱匿在表層句法結(jié)構(gòu)中,只體現(xiàn)在深層句法結(jié)構(gòu)中。Z和W在表層句法結(jié)構(gòu)中都用名詞或名詞短語表示。例如,“板藍(lán)根治療感冒”;“針灸治療頸椎病”。
“治療3”表示“Y讓職業(yè)醫(yī)師X用Z治療Y的疾病W”,“治療3”有4個配價:1Y(誰接受治療),2W(治療什么),3X(誰治療),4Z(用什么治療)。其中Y在表層句法結(jié)構(gòu)中有三種表達(dá)方法——名詞、名詞短語和代詞;W用名詞或名詞短語表示,是必有配價;X用“在+名詞(名詞短語、代詞)”表示,Z用“(采)用+名詞短語”表示。例如,“我在張醫(yī)生那里用中藥治療腰間盤突出”; “許多患者在我們這兒采用手術(shù)治療近視,效果很好”。
4 結(jié)束語
我們認(rèn)為,在SKCC內(nèi)容的基礎(chǔ)上補(bǔ)充“支配模式”的描寫是編寫漢語語義詞典的一個更合理的語義知識描述框架。在機(jī)譯系統(tǒng)中,語義詞典的核心內(nèi)容是具體地、詳盡地反映詞的語法、語義和句法信息。詞的語義和句法信息是相互融合的,脫離句子孤立、靜態(tài)地描寫詞的語義信息是不行的,對于以機(jī)器為對象的語義詞典來說,“支配模式”應(yīng)是不可缺少的部分。支配模式同時描寫關(guān)鍵詞用于所有義項時的語義與句法信息,包括語義配價、句法配價、語義角色,列出含關(guān)鍵詞的句型并結(jié)合實例詳細(xì)刻畫詞義組合的搭配限制,從而能輔助機(jī)器綜合地、正確地分析判斷,哪些句子是正確的,哪些句子是錯誤的,有效地進(jìn)行詞義消歧。支配模式對人們學(xué)習(xí)語言以及計算機(jī)處理自然語言都有實用價值,缺少了“支配模式”信息的語義詞典是不完整的,不是真正意義上的語義詞典。
參考文獻(xiàn)
范 曉. 動詞的配價與句子的生成[J]. 漢語學(xué)習(xí), 1996 (1)
林杏光 王玲玲 孫德金. 現(xiàn)代漢語動詞大詞典[Z]. 北京:北京語言學(xué)院出版社, 1994
魯 川.動詞大詞典[Z]. 北京:中國物資出版社, 1994.
孟 琮 鄭懷德 孟慶海 蔡文蘭.動詞用法詞典[Z]. 上海:上海辭書出版社, 1987
王 惠 詹衛(wèi)東 俞士汶.“現(xiàn)代漢語語義詞典”的結(jié)構(gòu)及應(yīng)用[J]. 語言文字應(yīng)用,2006 (1).
王 惠 俞士汶 詹衛(wèi)東. 現(xiàn)代漢語語義詞典(SKCC)的新進(jìn)展[A]. 語言計算與基于內(nèi)容的文本處理[C]. 全國第七屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議, 2003.
詹衛(wèi)東. 基于配價的漢語語義詞典[J]. 語言文字應(yīng)用, 2000 (1)
中國社會科學(xué)院語言研究所詞典編輯室. 現(xiàn)代漢語詞典[Z]. 商務(wù)印書館, 2006
Апресян Ю.Д. Лексическая семантика[M].М., : Наука, 1974
Мельчук И.А. Опыт теории лингвистический моделей “Смысл訌揣支堙悃洹盵M].М., : Наука, 1974
Мельчук И.А. Жолковский А.К. Толково — комбинаторный словарь современного русского языка[Z]. Вена, :Wiener Slawistischer Almanach Sonderband, 1984.
收稿日期:2008-06-14
【責(zé)任編輯李鳳琴】