李仕春
(西南大學文學院,重慶400715)
中國語文辭書的分期問題
李仕春
(西南大學文學院,重慶400715)
古今中外辭書的重要差別之一就在于多義詞釋義方面。以多義詞釋義體系的不斷完善作為參照點,中國語文辭書的發(fā)展歷史可以分為三個時期:以《說文解字》、《康熙字典》為代表的古代時期,以《新華字典》、《現(xiàn)代漢語詞典》為代表的現(xiàn)代時期和運用語料庫技術(shù)編纂詞典的新時期。古代語文辭書的釋義特點是:對某些字詞的解釋很不科學、多隨文釋義,“義項”的收錄重古輕今,多是唐宋以前的,忽視了明清時代的;現(xiàn)代語文辭書的釋義特點是:釋義科學,義項劃分合理,缺點是由于靠語感編纂存在義項漏收的情況;新時期也即語料庫時期語文辭書除繼承現(xiàn)代時期的釋義特點外,還對多義詞的義項進行了全面收錄。
語文辭書;隨文釋義;語感;語料庫;多義詞
羅賓斯指出,中國語言研究“主要是辭書編纂和音韻研究”[1]96。這一評價客觀而恰當,真實地說明了一部中國語言學史就是一部中國辭書發(fā)展史的特有現(xiàn)象。中國自古以來就是辭書大國,辭書在國人的學習生活中起著舉足輕重的作用。在此僅舉一例:《現(xiàn)代漢語詞典》自問世以來,發(fā)行量大、應用面廣,世所罕見,特別是進入新世紀以來《現(xiàn)代漢語詞典》每年的發(fā)行量大概在300萬至500萬冊之間,銷售額度在2個億至4個億,可見其在國民學習生活中的重要作用,堪稱國典。辭書編纂水準的高低直關(guān)國運!事關(guān)你我他!正因如此,古往今來有多位學者對辭書的作用進行了高度評價。晉代郭璞稱贊《爾雅》說:“誠九流之津涉,六藝之鈐鍵,學覽者之潭奧,摛翰者之華苑。若乃可以博物不惑,多識于鳥獸草木之名者。”[2]1~2當代學者張志毅說:“辭書大業(yè),惠及天下,功在當代,利在千秋。它是民族思想、科學、文化和語言的結(jié)晶,是國運的標志。”[3]1然而,中國辭書編纂的現(xiàn)狀卻是:“從人才、理論、辭書文本以及產(chǎn)業(yè)規(guī)模四方面綜合取出平均值,我們離辭書強國還有50年左右的距離。”[3]15因此,總結(jié)以往中國辭書編纂經(jīng)驗的同時借鑒英美辭書強國的先進理念最終編纂出反映21世紀學術(shù)水準的漢語辭書,是繁榮當代中國辭書事業(yè)的當務之急。
辭書史的研究對于指導辭書編纂具有重大的意義。雖然中國辭書編纂歷史淵源流長,但是對中國辭書史的系統(tǒng)研究直到20世紀70年代末才起步,主要成果有方厚樞的《中國辭書史話》(1979)[4][5]、劉葉秋的《中國字典史略》(1983)[6]、錢劍夫的《中國古代字典辭典概論》(1986)[7]、趙振鐸的《古代辭書史話》(1986)[8]、曹先擢和楊潤陸的《古代詞書講話》(1990)[9]、林玉山的《中國辭書編纂史略》(1992)[10]、張明華的《中國字典詞典史話》(1998)[11]以及雍和明的《中國辭典史論》(2006)[12]等。
研究歷史首先遇到的就是分期問題,研究中國辭書歷史首先遇到的也是分期問題。目前已有辭書史類論著對中國辭書史的分期大致如下:
劉葉秋把中國辭書發(fā)展史分為五個時期:萌芽與奠基期(戰(zhàn)國秦漢),繼承與演變期(魏晉南北朝),建設與發(fā)展期(唐宋元),進化與興盛期(明清),演變與改革期(近代)[6]。
林玉山把中國辭書發(fā)展史分為六個時期:萌芽期(夏商周先秦),奠基期(兩漢魏晉南北朝),初步發(fā)展期(隋唐宋元),進一步發(fā)展期(明清),成熟期(近代和現(xiàn)代),興盛期(當代)[10]。
雍和明將中國辭典發(fā)展史分為四個階段:中國辭典的萌芽與開創(chuàng)期(西周至兩漢),中國辭典的探索與建設期(魏晉至元朝),中國辭典的沿革與成形期(明朝至清朝),中國辭典的沉寂與興盛期(20世紀)[12]。
上述三家基本遵循時間順序,以“萌芽—發(fā)展—興盛”的模式對中國辭書史進行分期,雖然劃分的具體時間段不同,但都采用了通史性質(zhì)的寫法,注重從辭書編纂體例的角度闡述辭書發(fā)展史。我們認為辭書史的研究除了要重視辭書編纂體例的傳承關(guān)系外,更要關(guān)注多義詞釋義體系在不同時期的傳承關(guān)系,尤其是語文辭書史的研究更應如此。
陳平原指出:“談論學術(shù)史研究,我傾向于以問題為中心,而不是編寫各種通史?!盵13]他認為“通史”性質(zhì)的寫史體例往往會使“著述”變成“編纂”,造成部頭雖大但創(chuàng)新性見解很少的現(xiàn)象。因此,本文力避已有研究弊病,注重以“問題”為研究中心,從多義詞釋義體系不斷完善的角度研究中國語文辭書發(fā)展史。多義詞釋義體系的不斷完善是衡量語文辭書是否發(fā)展的根本標準,事實上,古今中外語文辭書最大的差別就在于多義詞的釋義方面。在中國歷代語文辭書中,多義詞釋義體系經(jīng)歷了一個從無到有、從釋義不科學到釋義科學、從義項收錄不全面到全面收錄的過程,按照這個過程,中國語文辭書的發(fā)展歷史可以劃分為三個時期:以《說文解字》和《康熙字典》為代表的古代時期,以《新華字典》、《現(xiàn)代漢語詞典》為代表的現(xiàn)代時期,運用語料庫技術(shù)編纂詞典的新時期。
漢語辭書的產(chǎn)生可以遠溯至周朝,在古代辭書發(fā)展的歷史長河中,中國先后出現(xiàn)了近千種辭書,大致分為以下六類:義類辭書、字書、韻書、目錄(以《七略》、《四庫全書總目》為代表)、類書(以《藝文類聚》、《永樂大典》為代表)、政書(以《太平御覽》、《冊府元龜》為代表)等。其中,以義類辭書、字書、韻書為代表的語文辭書是中國古代語文辭書發(fā)展的主流。這段時期,語文辭書集中出現(xiàn)在漢代至清代,形成了三個系列:一是字書,有《說文解字》、《字林》、《玉篇》、《類篇》、《字匯》、《康熙字典》等,以《說文解字》和《康熙字典》為代表;二是義類辭書,有《爾雅》、《廣雅》、《通雅》、《別雅》、《比雅》、《疊雅》,以《爾雅》為代表,此外還有《方言》、《釋名》等①通常,語言學者把《方言》看成是方言詞典、《釋名》為詞源詞典。但是它們的編纂體例和《爾雅》基本一致,事實上《方言》也是按字義分類,按照同一個事物在不同方言區(qū)有不同的稱謂進行釋義;《釋名》也是按字義分類,以聲訓釋義。;三是韻書,有《切韻》、《廣韻》、《集韻》、《禮部韻略》、《洪武正韻》、《韻略易通》、《韻略匯通》和《中原音韻》等,以《廣韻》為代表。古代語文辭書以字書、韻書的應用價值最大、適用范圍最廣。
在兩千多年的發(fā)展史中,古代語文辭書的編纂體例漸趨完善,收詞不斷增加、釋義不斷豐富,至《康熙字典》集大成。從多義詞義項劃分的角度來看,這段時期,多義詞的發(fā)展在漢語辭書中經(jīng)歷了一個從無到有的過程,一詞多義的現(xiàn)象首先見于漢代《說文解字》,其釋義特點主要是據(jù)形釋義、一詞一義,僅僅是偶爾涉及到一詞多義,多義詞和單義詞的區(qū)分并不明顯。例如《說文解字》對“人”和“鬼”的解釋分別是:
【人】天地之性最貴者也。此籀文象臂脛之形。
【鬼】人所歸為鬼。從人,象鬼頭。鬼陰氣賊害,從厶。此后,經(jīng)歷代字書、韻書的發(fā)展,漢語辭書中多義詞和單義詞的區(qū)分越來越明顯,至清代《康熙字典》則已收錄了大量多義詞。我們以《康熙字典》中對“人”和“鬼”的釋義為例說明:
【人】《說文》天地之性最貴者也?!夺屆啡?,仁也,仁生物也。《禮·禮運》人者,天地之德,陰陽之交,鬼神之會,五行之秀氣也。又一人,君也。《書·呂》一人有慶,兆民賴之。又予一人,天子自稱也?!稖a》嗟爾萬方有眾,明聽予一人誥。又二人,父母也?!对姟ば⊙拧访靼l(fā)不寐,有懷二人。又左人,中人,翟國二邑。又官名。《周禮》有庖人,亨人,漿人,凌人之類。又楓人,老楓所化,見《朝野僉載》。又蒲人,艾人,見《歲時記》。又姓。明人杰。又左人,聞人,俱復姓。《劉向·列女頌》望色請罪,桓公嘉焉。厥后治內(nèi),立為夫人。
【鬼】《說文》人所歸為鬼。從人,象鬼頭。鬼陰氣賊害,從厶?!稜栄拧め層枴饭碇疄檠詺w也?!对姟ば⊙拧窞楣頌轵??!抖Y·禮運》列于鬼神。注:鬼者精魂所歸。《列子·天瑞篇》精神離形。各歸其真,故謂之鬼。鬼,歸也。歸其眞宅。又《易·旣濟》高宗伐鬼方?!对姟ご笱拧否肮矸??!秱鳌饭矸?,遠方也。又星名?!妒酚洝ぬ旃贂份浌砉盱羰拢邪渍邽橘|(zhì)。注:輿鬼,五星,其中白者為質(zhì)。又姓?!肚皾h·郊祀志》黃帝得寶鼎,冕侯問于鬼臾區(qū)。注:黃帝臣也。又國名?!渡胶=?jīng)》鬼國在負二之尸北。又烏鬼?!抖鸥Αで矏炘姟芳壹茵B(yǎng)烏鬼?!堵旁娫挕反ㄈ思壹茵B(yǎng)豬,每呼豬作烏鬼聲,故謂之烏鬼。《夢溪筆談》夔州圖經(jīng)稱,峽中人皆養(yǎng)鸕鶿,以繩系頸使捕魚,得則倒提出之,謂之烏鬼?!对⒅暝姟凡≠悶醴Q鬼。自注:南人染病,競賽烏鬼。又《揚子·方言》虔儇,慧也。自關(guān)而東趙魏之閑謂之黠?;蛑^之鬼。
《說文解字》是中國辭書史上第一部真正意義上的辭書,它開中國古代辭書編纂體例的先河,此后的歷代字書、韻書都是對《說文解字》體例的豐富與補充,至《康熙字典》集古代辭書之大成,可以說《康熙字典》是古代辭書中編纂體例最完善、最實用的一部辭書。通過這兩部辭書,我們可以清楚地看到多義詞義項在古代辭書中經(jīng)歷了一個從無到有的劃分過程,《說文解字》中的絕大多數(shù)漢語常用詞只有一個“義項”,而《康熙字典》中絕大部分常用詞有了多個“義項”,同時每個“義項”后面附列了書證。用今天的眼光來看,古代辭書對“人”和“鬼”的解釋很不科學,如《說文解字》把“人”解釋為“天地之性最貴者也”、“鬼”解釋為“歸也”?!犊滴踝值洹吩谘匾u《說文解字》釋義的基礎(chǔ)上,“人”還有仁、君(指一人)、父母(指二人)、左人、中人、翟國二邑、官名、楓人、蒲人、艾人、姓等十幾個“義項”,“鬼”還有鬼方、星名、姓、國名、烏鬼(既指豬又指鸕鶿還是烏龜)等“義項”,但是這些意義都是具體語境中的意思,用現(xiàn)代詞典學的眼光來看“鬼”和“人”的上述“義項”一個也不能成立!
古代語文辭書的釋義缺陷主要有:①對某些字詞的解釋很不科學。②多隨文釋義性質(zhì)。③“義項”的收錄重古輕今,多是唐宋以前的,忽視了明清時代的。④古代語文辭書中的“義項”大多數(shù)不是現(xiàn)代詞典學意義上的義項。
現(xiàn)代時期指20世紀至今。在這一時期,中國辭書學人有了現(xiàn)代辭書意識,他們在吸取傳統(tǒng)辭書釋義精華、借鑒西方現(xiàn)代辭書理論的基礎(chǔ)上,先后編纂了以語文詞典、百科詞典、??圃~典等為代表的種類繁多的辭書共計一萬八千余種①該數(shù)據(jù)根據(jù)張志毅先生的統(tǒng)計,截止到2000年。[3]2~3,其中語文辭書仍是中國現(xiàn)代辭書發(fā)展的主流。這段時期形成了三個系列的語文辭書:一是詞典,有《王云五大詞典》、《王云五小詞典》、《國語詞典》、《現(xiàn)代漢語詞典》、《現(xiàn)代漢語大詞典》、《現(xiàn)代漢語規(guī)范詞典》,以《現(xiàn)代漢語詞典》為代表;二是字典,有《中華大字典》、《國音字典》、《新華字典》和《現(xiàn)代漢語字典》,以《新華字典》為代表;三是義類詞典,以《同義詞詞林》、《簡明漢語義類詞典》、《現(xiàn)代漢語分類詞典》為代表。其中,《新華字典》、《現(xiàn)代漢語詞典》的應用價值最大、適用范圍最廣:《新華字典》自1953年出版以來發(fā)行4億冊,在當今,幾乎每一個識字的中國人都知道它;《現(xiàn)代漢語詞典》自1978出版以來發(fā)行5000多萬冊。另外,這一時期還出現(xiàn)了一批大型的歷時性語文辭書,主要有《辭源》、《漢語大詞典》、《漢語大字典》等。
中國語文辭書的現(xiàn)代化歷程始于《中華大字典》(1915年出版)、完善于《現(xiàn)代漢語詞典》(1978年出版),與此相應,多義詞的釋義在現(xiàn)代辭書中也經(jīng)歷了一個從釋義不科學到釋義科學的過程?,F(xiàn)代辭書中多義詞的釋義多合于現(xiàn)代詞典學、語言學理論,具體特征有:①釋義科學;②義項劃分合理;③嚴格區(qū)分詞語的共時性義項和歷時性義項,共時性辭書只收某個時期的義項,歷時性辭書收錄歷史不同時期出現(xiàn)的義項。在此以《現(xiàn)代漢語詞典》對“人”、“鬼”的釋義為例加以說明:
【人】名①能制造工具并使用工具進行勞動的高等動物:男~|女~|~們|~類。②每人;一般人:~手一冊|~所共知。③指成年人:長大成~。④指某種人:工~|軍~|主~|介紹~。⑤別人:~云亦云|待~誠懇。⑥指人的品質(zhì)、性格或名譽:丟~|這個同志~很好|他~老實。⑦指人的身體或意識:這兩天~不大舒服|送到醫(yī)院~已經(jīng)昏迷過去了。⑧指人手、人才:~浮于事|我們這里正缺~。⑨(Rén)姓。
【鬼】①名迷信的人所說的人死后的靈魂。②形對人的憎稱或蔑稱:煙~|討厭~|吝嗇~|吸血~。③躲躲閃閃;不光明:~頭~腦|~~祟祟。④名不可告人的打算或勾當:搗~|心里有~。⑤形屬性詞。惡劣的,糟糕的:~天氣|~主意|~名堂|這~地方連棵草都不長。⑥〈口〉形機靈(多指小孩兒或動物):這孩子~得很?、摺捶健祵θ说年欠Q(多用于小孩兒):小~|機靈~兒。⑧二十八宿之一。
與古代辭書相比,現(xiàn)代辭書中多義詞義項釋義科學、劃分合理,缺點是由于靠語感確定多義詞的義項,因此多義詞義項多存在收錄不全的情況,主要有以下三種情況:
1.同一個詞在不同的漢語類中型語文性詞典中存在義項劃分不一致的情況,憑借語感我們很難斷定這些不一致的義項是否應該收錄①大多數(shù)漢語常用詞的義項在《現(xiàn)代漢語詞典》、《現(xiàn)代漢語學習詞典》、《現(xiàn)代漢語規(guī)范詞典》等漢語類中型語文性詞典中的釋義基本是一致的,由于《現(xiàn)代漢語詞典》早出,所以我們說其他詞典中常用詞的釋義基本沿襲了《現(xiàn)代漢語詞典》中對應詞的釋義,因此漢語類中型語文性詞典的釋義相似度很高。拙文《漢英中型語文性詞典釋義相似度對比研究》(待刊)就說明了這種情況。我們的研究顯示:從歷時角度看,《現(xiàn)代漢語詞典》(1-6版)對相同所指的釋義相似度高于《牛津高階英語詞典》(1-8版)對相同所指的釋義相似度,這說明《現(xiàn)代漢語詞典》不同版本之間對釋義的改動程度小于《牛津高階英語詞典》(1-8版);從共時角度看,漢語類中型語文性詞典對相同所指的釋義相似度高于英語類中型語文性詞典對相同所指的釋義相似度,這說明漢語類中型語文性詞典之間相互沿襲的現(xiàn)象嚴重,英語類中型語文性詞典則重視原創(chuàng)性研究,最終形成了牛津傳統(tǒng)系列詞典、朗文傳統(tǒng)系列詞典、柯林斯傳統(tǒng)系列詞典等品牌詞典。。例如:《現(xiàn)代漢語學習詞典》中“果”的第④個義項是“飽;充實”的意思,舉例是“食不~腹”,《現(xiàn)代漢語詞典》(第6版)和《現(xiàn)代漢語規(guī)范詞典》(第3版)都沒有收錄該義項,只是把它作為復合詞“果腹”的意義,分別解釋為“吃飽肚子|食不~腹”、“吃飽肚子|以野菜~腹”。如果不占有大量語料,我們很難判斷“果”在現(xiàn)代漢語中是否有該義項,通過我們對“果”字3萬條共計160余萬字語料的窮盡性分析,發(fā)現(xiàn)現(xiàn)代漢語中“果”沒有“飽;充實”的意思,這個意思存在于復合詞“果腹”中。
2.一些常用詞的義項在歷時性的大型詞典中有,而共時性的中型語文性詞典中沒有。例如《現(xiàn)代漢語詞典》就沒有收錄“黃”在《漢語大詞典》中的三個義項:①色變黃,枯萎;②指枯萎的枝葉;③黃熟。根據(jù)我們的研究,上述三個義項還存在于現(xiàn)代漢語中,只是《現(xiàn)代漢語詞典》漏收了它們。
3.更多的是一些常用詞的義項沒有被漢語類詞典編纂者發(fā)現(xiàn)。例如:在漢語類辭書中,表示動物的詞語僅有龍、牛、虎、猴、貓等少數(shù)幾個是多義詞,像狼、豬、羊、狗、馬、蛇、熊、驢、兔、雞、魚、龜?shù)葎游镌~語在漢語辭書中都是以單義詞的身份出現(xiàn)的,事實上它們都是多義詞,之所以在漢語辭書中是單義詞主要是因為漢語辭書編纂者在解釋這些動物詞語時注重了它們的指物特征,忽略了它們伴隨的語義特征。
上述現(xiàn)象,在靠語感編纂詞典的時代,基本無解。語料庫時代的到來,為解決這一難題提供了可能。
20世紀50年代以前,世界各國詞典對多義詞義項的劃分都經(jīng)歷了一個從無到有、從釋義不科學到釋義科學的過程。然而,自20世紀五六十年代世界語言學進入語料庫時代后,辭書編纂便發(fā)生了革命性的變化,也即由過去通過做卡片靠語感確定常用詞義項的方法轉(zhuǎn)變到現(xiàn)在通過建立大規(guī)模的語料庫依靠定量分析的方法研究常用詞義項,因此新時期(語料庫時期)詞典編纂者的主要任務就是用語料庫技術(shù)的方法研究常用詞義項的分布情況,借以達到詞典不再漏收常用詞義項的目的,最終進一步完善常用詞的釋義體系。目前英美等辭書強國已經(jīng)完成了用語料庫技術(shù)研究英語常用詞義項分布情況的工作,而包括中國在內(nèi)的等為數(shù)眾多的國家中的辭書還沒有開始這項工作,因此,就中國而言,這是一項亟待展開的工作。下文是我們對開展這項工作的一些具體性建議。
(一)語料庫技術(shù)研究常用詞義項分布的可能性
國外:從20世紀80年代開始,語料庫技術(shù)就已經(jīng)廣泛應用于英語詞典編纂與研究中了。目前,占據(jù)英語辭書主要市場的牛津、韋氏、朗文與麥克米倫等英語詞典,都是在語料庫的基礎(chǔ)上編成的。英語詞典編纂者非常重視用語料庫技術(shù)發(fā)現(xiàn)英語多義詞的新義項(為了表述方便,本文以100核心詞在漢英中型語文性詞典中的平均義項為例做說明),我們的統(tǒng)計顯示《牛津高階英語詞典》1至8版中100核心詞的平均義項分別是7.55個、7.91個、7.03個、8.25個、8.47個、10.2個、10.47、10.61。由此,我們可以得出以下結(jié)論:《牛津高階英語詞典》1至3版分別出版于1948、1963、1974年,這三版中100核心詞的平均義項數(shù)目基本穩(wěn)定,這說明此段時間《牛津》詞典編纂者還沒有利用語料庫技術(shù)把豐富、補充常用詞的義項作為重點修訂對象;4至6版分別出版于1989、1995、2000年,這三版中100核心詞的平均義項數(shù)目有較大的變化,說明《牛津》詞典編纂者在這段時間內(nèi)已經(jīng)利用語料庫技術(shù)把豐富、補充常用詞的義項作為重點修訂對象;6至8版分別出版于2000、2005、2012年,這三版100核心詞的平均義項數(shù)目基本穩(wěn)定下來,并且從第6版開始《牛津高階英語詞典》常用詞的編纂體例也發(fā)生了很大變化,這說明《牛津》詞典編纂者在2000年就已經(jīng)完成了用語料庫技術(shù)研究英語常用詞義項分布情況的工作。在最新出版的英語類中型語文性詞典中,100核心詞的平均義項分別是:《牛津高階英語詞典》(第8版)10.61個,《牛津簡明英語詞典》(第10版)12.81個,《麥克米倫高階英語詞典》(第2版)11.68個,《韋氏高階英語詞典》(2009年版)11.43個,《郎文當代英語詞典》(第4版)10.35個。
與傳統(tǒng)憑借語感編纂的詞典相比,建立在語料庫技術(shù)基礎(chǔ)上的英語類中型語文性詞典在多義詞義項的劃分方面更加細化、義項的收錄更加全面,在詞典編纂史上實現(xiàn)了里程碑式的跨越發(fā)展。
國內(nèi):20世紀90年代以來,中國相繼建設了一批漢語語料庫,最有代表性的如北京大學中國語言學研究中心研制的“CCL現(xiàn)代漢語語料庫”,截止2015年6月18日規(guī)模已達5.81億字,可以說,目前我國的語料庫已經(jīng)初步具備了詞典編纂所需要的規(guī)模。盡管如此,在當今中國,用語料庫技術(shù)發(fā)現(xiàn)漢語常用詞新義項的方法還沒有引起漢語詞典編纂者的足夠重視。例如:我們的統(tǒng)計顯示,《現(xiàn)代漢語詞典》1至6版中100核心詞的平均義項分別是4.85個、5.20個、5.18個、5.18個、5.20個、5.42個,這表明,《現(xiàn)代漢語詞典》1至6版并沒有把豐富、補充常用詞的義項作為重點修訂對象,也就是說《現(xiàn)代漢語詞典》第6版對100核心詞義項的劃分還和《現(xiàn)詞漢語詞典》第1版基本一致。與《現(xiàn)代漢語詞典》同類的其他漢語類詞典,如《現(xiàn)代漢語規(guī)范詞典》(第2版)100核心詞的平均義項是5.68個,《現(xiàn)代漢語學習詞典》(2010年版)是5.9個,《新華詞典》(最新修訂版)是4.33個。這說明,漢語類中型語文性詞典中100核心詞乃至更多常用詞義項的劃分并沒有建立在大型語料庫的基礎(chǔ)上進行成規(guī)模的系統(tǒng)修訂,從而導致漢語類中型語文性詞典義項的劃分比較粗疏,存在義項漏收的情況。
總之,目前我國漢語類詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學者還沒有大規(guī)模地運用語料庫技術(shù)對漢語常用詞的義項進行豐富與補充,漢語類詞典中常用詞義項的編纂水準至今仍處在20世紀五六十年代靠語感編纂的水準。因此,相對于以往辭書中多義詞靠語感編纂的情況來講,充分利用語料庫資源和計算機強大的計算功能來統(tǒng)計并分析每個常用詞的義項在現(xiàn)代漢語中的分布情況,是一座非常誘人的學術(shù)富礦,有著巨大的挖掘潛力。
(二)語料庫技術(shù)研究常用詞義項分布的優(yōu)點
1.用語料庫技術(shù)研究常用詞義項分布的最大貢獻就在于把語料庫技術(shù)也即把比人工閱讀提高上百億倍速度的搜集語料的方法引進到詞匯學、詞典學研究中來,這在中國詞典學史、詞匯學史乃至語言學史上具有里程碑式的、劃時代的方法論意義。
以“黑”為例:用語料庫檢索的方法可以在16毫秒的時間內(nèi)得出“黑”在北京大學CCL現(xiàn)代漢語語料庫中有130831條。假設用人工閱讀的方法查找1條含有“黑”字的語句需要用1個小時(實際上有時候不只1個小時),那么要找130831條“黑”字語料則要用130831小時。經(jīng)過計算可以知道,查找同樣多的語料,用語料庫技術(shù)的方法約是人工閱讀的290多億倍,簡直是神速。
2.語料海量。已有漢語類中型語文性詞典的釋義基本依靠語感通過做卡片的方式編纂,每個詞占有的語料非常有限,而用語料庫技術(shù)的方法對大多數(shù)常用詞義項的考察都是在下載3萬條語料共計160萬字的基礎(chǔ)上進行的①如果抽取的語料過少就不可能發(fā)現(xiàn)其所有義項,如根據(jù)我們對“黃”字3萬條語料的分析結(jié)果顯示“黃”字在現(xiàn)代漢語中有15個義項(包括《現(xiàn)代漢語詞典》的8個義項),在“黃”的3萬條語料中,專有名詞大概有14406條(它們基本是無效語料),另外“黃”的表顏色的義項、黃金、黃河、黃帝等4個義項有14037條,其他11個義項加起來只有1557條語料,因此,如果我們抽取的語料條數(shù)過少是不可能發(fā)現(xiàn)“黃”字的新義項的。相反,如果抽取的語料過多就會做很多無用功。。與語音、語法相比,語義研究的最大困難在于主觀性太強,常用詞義項的劃分也是如此,常常存在仁者見仁智者見智的情況,所以最好安排兩人同時進行標注,結(jié)果一致最好,如果不一致,要找原因或再安排其他人進行標注直到一致,這就在一定程度上增加了義項劃分的客觀性。
新理論、新方法是推動一門學科進步的兩大引擎,正因為用語料庫技術(shù)研究常用詞義項分布具有劃時代的方法論意義,所以把語料庫技術(shù)和詞典編纂結(jié)合起來成規(guī)模地、系統(tǒng)地研究現(xiàn)代漢語常用詞的義項分布規(guī)律問題,是一項亟待展開的、需要成千上萬人參與的重大基礎(chǔ)應用研究項目,它是一項非常宏大的工程。
(三)語料庫技術(shù)研究常用詞義項分布的思路
古今中外辭書的差距主要體現(xiàn)在常用詞的釋義方面,具體表現(xiàn)為:常用詞義項的精細度、常用詞義項的釋義用語、常用詞義項的排列等。雖然目前很多漢語類詞典冠以語料庫名義編纂,但實際上并沒有對已有的辭書釋義體系進行根本革新,所謂的更新僅僅是一些細枝末節(jié)的更新,如果要進行根本的革新就必須把常用詞義項的研究建立在語料庫分析基礎(chǔ)之上。用語料庫技術(shù)研究漢語常用詞義項分布的具體思路是:
首先,組建學術(shù)團隊。用語料庫技術(shù)研究現(xiàn)代漢語常用詞義項分布是一項前無古人后有來者、惠及當代澤披后世的重大基礎(chǔ)應用研究項目,絕非兩三人或十幾人就能完成的項目,它需要成百上千甚至成千上萬的人參與才能得以順利完成。因此,完成這樣的項目就需要組建學術(shù)團隊,團隊成員在從事該項目之前除了要掌握本課題需要的語料庫技術(shù)外,還要有辨義能力,這就要求團隊負責人事先通讀與有關(guān)詞典學、詞匯學等相關(guān)的語言學論著,在了解詞典釋義原則的基礎(chǔ)上,理清詞義歷時演變與共時分布之間的關(guān)系、詞典中義項劃分與義項排列之間的關(guān)系、詞的意義和詞的用法之間的關(guān)系等等,然后以集體授課的方式教給團隊成員與本項目有關(guān)的上述詞匯學、詞典學知識。
其次,確定研究對象。根據(jù)有關(guān)字頻、詞頻的統(tǒng)計材料,可以確定常用詞的數(shù)目在3000個左右,這些詞的特點是構(gòu)詞能力強、使用頻率高。為了系統(tǒng)地研究多義詞在現(xiàn)代漢語中的義項分布情況,應把選好的詞系聯(lián)為三大語義場———動作、名物、性狀,然后每類義場再進一步細分。動作義場可細分為上肢動作義場、下肢動作義場、頭部動作義場等,名物義場可細分為動物義場、植物義場、人體器官義場等,性狀義場可細分為顏色義場、空間屬性義場、品性義場等。這樣一方面可以詳細描寫出每個常用詞在現(xiàn)代漢語中的義項分布情況,另一方面也可以歸納出同類詞在現(xiàn)代漢語中的義項分布規(guī)律。
第三,運用抽樣統(tǒng)計法從北京大學CCL現(xiàn)代漢語語料庫中下載所需要的語料,為每個常用詞建立語料庫并進行標注,要特別注意新義項的標注。重要的常用詞都要分別安排兩位課題組成員進行標注,如果標注的義項相同,就不再標注。如果不同則再進行標注,直到取得一致。
第四,發(fā)現(xiàn)新義項。以《現(xiàn)代漢語詞典》常用詞的釋義作為基準,通過與《現(xiàn)代漢語學習詞典》、《現(xiàn)代漢語規(guī)范詞典》、《新華詞典》等漢語類中型語文性詞典中對應詞的釋義做比較,重點找出《現(xiàn)代漢語詞典》中沒有而其他詞典中有的義項,通過標注語料看《現(xiàn)代漢語詞典》中沒有的義項是否存在于現(xiàn)代漢語中,如果語料庫中有則建議《現(xiàn)代漢語詞典》補充;以《現(xiàn)代漢語詞典》常用詞的釋義作為基準,通過與《漢語大詞典》、《漢語大字典》、《辭源》等漢語類歷時性的大型詞典中對應詞的釋義做比較,重點找出《現(xiàn)代漢語詞典》中沒有而歷時性詞典中有的義項,通過語料標注看歷時上曾出現(xiàn)過而《現(xiàn)代漢語詞典》中沒有收錄的義項是否存在于現(xiàn)代漢語中,如果語料庫中有則建議《現(xiàn)代漢語詞典》補充。在此基礎(chǔ)上,鼓勵團隊成員依靠自己的辨義能力,發(fā)現(xiàn)漢語類詞典中沒有而語料庫中有的義項,這樣的義項為原創(chuàng)性發(fā)現(xiàn)。
第五,解釋新義項成立的原因。運用詞匯學、詞典學、語義學等相關(guān)學科的理論,解釋新義項成立的原因。我們在標注“?!弊终Z料的時候發(fā)現(xiàn)類似“牛吼”、“牛勁”、“牛眼”、“牛飲”中“?!钡囊馑际乾F(xiàn)有詞典中的義項所不能概括的,例如:
①等送老婆走了,趕到河邊,見逃黃水的人正和孫克賢在交錢交貨。他牛吼一聲:“孫克賢!”(嚴歌苓《第九個寡婦》)
②扛來啤酒送給他的隊友,他的隊友沖著他砰砰地打開啤酒,仰著脖子牛飲,有幾個頑皮的騎手還朝我揚了揚酒瓶以示致意。(池莉《讓夢穿越你的心》)
以漢語為母語的人自然會把“牛吼”、“牛飲”理解為(人)大聲叫喊、(人)很能喝酒,但是對于漢語是非母語的外國人來說,他們因為沒有中國文化背景,就很難做出這樣的理解。如果我們告訴他們在上述詞中“?!庇写蟮囊馑迹瑒t他們就容易理解得多,因此,我們可以考慮為“?!绷⒁粋€新義項“大”。這可以用張志毅先生的詞義七因素新說來解釋:“物象,是事物反映在意識中的群體表象……人們對物的反映可以從物象到物性,也可以舍棄物性,只選取物象。”[14]129在漢族人的群體表象中,“?!笔且环N軀體龐大的動物,語言是思維的直接現(xiàn)實,漢族人的這種群體意識就體現(xiàn)在現(xiàn)代漢語“?!钡牧x項中,于是“牛”就有了“大”的意思。
同樣,我們在標注“猴”字語料的時候,發(fā)現(xiàn)“猴”字在“猴急”、“猴精”、“猴瘦”等詞語中的意思在現(xiàn)有詞典中也是查不到的。對母語是非漢語的外國人來說,他們會很困惑為什么漢語中有把人比喻成像猴子那樣精的說法?為什么把人的智商比喻成動物的智商?如果我們事先告訴他們“猴”在漢語中有“很”的意思,那么他們就能愉快地接受了?!昂铩庇懈痹~性用法“很”的意思也可以用詞義七因素新說來解釋:“物性,是事物反映在意識中的群體特征屬性或本質(zhì)屬性?!盵14]129在漢族人的意識中,“猴”區(qū)別于其他動物的群體特征屬性是行動急促、外形像人很精明、與其他動物相比“猴”顯得很瘦,經(jīng)過語義磨損,“猴”的上述語義特征逐漸消失,最終在漢族人的意識中“猴”有了一個很寬泛的副詞性用法“很”,這個意義正是“猴”的動物屬性在漢語中的顯現(xiàn)。
第六,熟悉與漢語常用詞相對應的英語單詞在《牛津高階英語詞典》、《韋氏高階英語詞典》、《麥克米倫高階英語詞典》、《朗文當代高級英語詞典》等英語類中型語文性詞典中的釋義,借鑒英語詞典中常用詞義項的編排方式,把它們應用于相應的漢語常用詞義項編纂中。例如:《現(xiàn)代漢語詞典》(第6版)中“跑”的第一個義項是“兩條腿或四條腿迅速前進(腳可以同時騰空)”,但是我們通過語料庫標注發(fā)現(xiàn)類似“跑”的義項還有“人憑借汽車、火車等交通工具的跑”、“汽車、火車等交通工具自身的跑”、“分子、原子、離子等的跑”、“土、水、風、電等物態(tài)東西的跑”等,它們是《現(xiàn)代漢語詞典》“跑”的第一個義項所不能概括的。在這種情況下,我們可以借鑒《牛津簡明英語詞典》中以義項群編排多義詞義項的方式,把《現(xiàn)代漢語詞典》“跑”的第一個義項設立為主義項①“快速移動”,然后再分別列出次要義項:a.兩條腿或四條腿迅速前進(腳可以同時騰空);b.汽車、火車等交通工具自身快速前進;c.分子、原子、離子等快速移動;d.土、水、風、電等物態(tài)的東西快速移動①雖然《現(xiàn)代漢語詞典》也以義項群的形式編排多義詞義項,但其以義項群編排多義詞義項的條數(shù)明顯少于《牛津簡明英語詞典》。。英語詞典中除了以義項群的方式編排多義詞的義項外,還有分詞性排列義項、以釋義提示語的形式釋義等等,都值得我們借鑒。
目前我國漢語類詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學者還沒有大規(guī)模地運用語料庫技術(shù)對漢語常用詞的義項進行豐富與補充,漢語類詞典中常用詞義項的編纂水準至今仍處在20世紀五六十年代靠語感編纂的水準。因此,相對于以往辭書中多義詞靠語感編纂的情況來講,充分利用語料庫資源和計算機強大的計算功能來統(tǒng)計并分析每個常用詞的義項在現(xiàn)代漢語中的分布情況,是一座非常誘人的學術(shù)富礦,有著巨大的挖掘潛力。張志毅先生指出:“今天的語料庫已經(jīng)成為能量巨大的語言樣本集。它正在印證、充實、修訂、改寫甚至顛覆以往的辭書釋語。它也正孕育出、孕育著更現(xiàn)代、更可信的辭書?!盵15]42真正建立在語料庫技術(shù)基礎(chǔ)上的漢語詞典,必將會在中國辭書史上留下濃重的一筆,成為中國辭書史上具有里程碑式性質(zhì)的辭書。
[附注]本文還獲得了西南大學中央高校基本業(yè)務費專項資金創(chuàng)新團隊項目(編號:SWU1609105)以及西南大學科研基金項目(編號:SWU1509502)的資助。
[1]羅賓斯.簡明語言學史[M].北京:中國社會科學出版社,2012.
[2]爾雅[M].郭璞,注.北京:中華書局,1985.
[3]張志毅,張慶云.理論詞典學[M].北京:商務印書館,2015.
[4]方厚樞.中國辭書史話:上[J].辭書研究,1979,(1).
[5]方厚樞.中國辭書史話:下[J].辭書研究,1979,(2).
[6]劉葉秋.中國字典史略[M].北京:中華書局,1983.
[7]錢劍夫.中國古代字典辭典概論[M].北京:商務印書館,1986.
[8]趙振鐸.古代辭書史話[M].成都:四川人民出版社,1986.
[9]曹先擢,楊潤陸.古代詞書講話[M].上海:上海教育出版社,1990.
[10]林玉山.中國辭書編纂史略[M].鄭州:中州古籍出版社,1992.
[11]張明華.中國字典詞典史話[M].北京:商務印書館,1998.
[12]雍和明,羅振躍,張相明.中國辭典史論[M].北京:中華書局,2006.
[13]陳平原“.當代學術(shù)”如何成“史”[J].云夢學刊,2005,(4).
[14]張志毅,張慶云.詞匯語義學[M].北京:商務印書館,2012.
[15]張志毅,長召其.辭書編纂現(xiàn)代化的新理念——人機接口工具使用的智能發(fā)揮[M]//樂嘉民,亢世勇.辭書編纂現(xiàn)代化研究.上海:上海辭書出版社,2009.
[責任編輯:熊顯長]
H16
A
1001-4799(2017)01-0109-07
2016-03-20
國家社會科學基金重點資助項目:14AYY018
李仕春(1973-),男,山東莒縣人,西南大學文學院教授,主要從事語言學史和詞匯學、詞典學研究。