李仕春
相似度是指兩個或多個事物之間的匹配程度,相似度越大,說明事物之間相似程度越高,反之就越低。目前,相似度作為一種量化方法被廣泛應(yīng)用于自然科學和人文科學等多門學科中。相似度在語言學研究中也有著廣泛的應(yīng)用,鄭錦全[1]、陸致極[2]、王士元,沈鐘偉[3]、陳海倫[4]討論了方言相似度及其計算方法的問題,這有利于精確地劃定方言分區(qū)和確定方言之間的親屬關(guān)系。我們在本研究中把相似度引入詞典學評價領(lǐng)域,通過比較不同辭書文本之間釋義相似度,以量化的形式顯示不同辭書文本之間的差異程度。
釋義相似度是指不同詞典或同一詞典的不同版本在釋義方面的相似程度,它涉及的主要參數(shù)有釋義用語、配例、語法信息標注及其他。我們可以通過計算上述釋義參數(shù)所占比重得出不同版本詞典的釋義相似度。
“英語詞典可能在所有國家都是詞典編纂發(fā)展的先行者?!盵5]與其他英語學習詞典相比,《牛津高階英語詞典》(Oxford Advanced Learner’s Dictionary,以下簡稱《牛高》)是應(yīng)用面最廣、修訂次數(shù)最多、時間跨度最長的一部外向型學習詞典,因此,該詞典具備很高的學術(shù)研究價值。本文主要從歷時角度考查《牛高》第1至9版[6-14]的釋義相似度,用量化的形式顯示以《牛高》為代表的英語中型語文詞典編纂的現(xiàn)代化進程。
英語詞典的釋義相似度涉及釋義用語、配例、語法信息標注及其他四類釋義參數(shù)。具體來講,英語詞典的釋義用語包括義項數(shù)量的增減、釋義方式的改變、釋義元語言、釋義提示語、搭配、義頻、詞頻等釋義參數(shù);配例包括配例數(shù)量的增減、配例內(nèi)容的改變等;語法信息標注包括標注詞性、按詞性排列義項,動詞時態(tài)、單復數(shù),名詞可數(shù)不可數(shù),形容詞比較級、定語或表語的用法等;其他包括字體顏色、語域等釋義參數(shù)。如果更細化一些,英語詞典共涉及四大類八十余種釋義參數(shù)。
詞典編纂的總體趨勢是由簡單到復雜,相應(yīng)地釋義參數(shù)也就由少到多。因此同一部詞典后出版本的釋義參數(shù)要比先出版本的釋義參數(shù)多,先進辭書文本的釋義參數(shù)要多于落后辭書文本的釋義參數(shù)。我們把《牛高》先出版本的釋義參數(shù)作為分子,后出版本的釋義參數(shù)作為分母,分子除以分母即為兩個版本的釋義相似度。本文用S表示釋義相似度,下標X表示所求釋義相似度的對象詞,下標數(shù)字1、2、3、4、5、6、7、8、9……分別表示X所在的版本,兩個下標數(shù)字連在一起表示X所在的兩個版本,則Sfly12就表示《牛高》第1版和第2版 “fly”的釋義相似度。下文,我們以《牛高》中“fly”第1版和第9版的釋義相似度的計算方法為例加以說明。
釋義用語是指解釋被釋詞的語言,在釋義相似度公式中它占的分值是65,用字母a表示,具體來講它又包括以下釋義參數(shù):
1.義項數(shù)量和釋義方式
義項數(shù)量的變化是指義項數(shù)量的增減分合,在釋義相似度公式中,占的分值是25,用a1表示,如“fly”在《牛高》第1版有6個義項,第9版有21個義項。釋義方式的改變是指由“以詞釋詞”或“以短語釋詞”變?yōu)椤岸陶Z釋詞”或“句子釋詞”,其作用是把義項和語境結(jié)合起來,增加了釋義的準確性,在釋義相似度公式中,占的分值是40,用a2表示。與第1版相比,“fly”在第9版中的釋義方式和義項數(shù)量都發(fā)生了根本的變化,以至于兩個版本的釋義語言中只有幾個關(guān)鍵的詞語相似,因此在Sfly19釋義相似度公式中,釋義用語的分子估值是a1+a2=4.78。
2.釋義元語言
《牛高》自第5版開始使用釋義元語言,用a3表示。如第1版至第4版在解釋“sit”的第一個義項的時候都使用了單詞“buttock”,但在第5版就改用淺顯易懂的詞語了。在釋義相似度公式中,釋義元語言占的分值是10。因為“fly”在第1版中沒用釋義元語言,所以在Sfly19釋義相似度公式中,分子估值為a3=0。
3.釋義提示語
《牛高》自第6版開始標注釋義提示語,用a4表示。在釋義相似度公式中它占的分值是10。因為“fly”在第1版中沒用釋義提示語,所以在Sfly19釋義相似度公式中,釋義提示語的分子估值為a4=0。
4.義頻
《牛高》自第6版開始標注義頻,用a5表示。在釋義相似度公式中它占的分值是10。因為“fly”在第1版中沒有義頻標注,所以在Sfly19釋義相似度公式中,義頻的分子估值為a5=0。
5.詞頻
《牛高》自第6版開始標注詞頻,用a6表示。在釋義相似度公式中它占的分值是10。因為“fly”在第1版中沒有詞頻標注,所以在Sfly19釋義相似度公式中,詞頻的分子估值為a6=0。
那么,“fly”的釋義用語在釋義相似度公式中,分母占的分值是65,分子的估值是4.78。
配例是以舉例的形式對釋義用語進行補充,主要以詞、短語、句子的形式來體現(xiàn),在釋義相似度公式中占的分值是15,用字母b表示。從《牛高》第1版至第9版,配例的數(shù)量在逐漸增加,內(nèi)容也在改變。例如,相對第1版,第9版中“fly”的配例發(fā)生了本質(zhì)性的變化,所以在Sfly19的釋義相似度公式中,配例的分子估值是b=1。
《牛高》中標注的語法信息非常豐富,在釋義相似度公式中占的分值是10,用字母c表示。與第1版相比,第9版對“fly”的語法信息標注發(fā)生了根本的變化,所以在Sfly19釋義相似度公式中,語法信息的分子估值是c=2。
“其他”主要是指除上述釋義參數(shù)之外的釋義參數(shù),在釋義相似度公式中所占的分值是10,用字母d表示?!杜8摺返?版對“fly”的釋義比第1版多了慣用語、顏色、情感等釋義參數(shù),所以在Sfly19釋義相似度公式中其他信息的分子估值是d=2。
根據(jù)上文,我們得出fly在《牛高》第1版和第9版之間的釋義相似度是:
我們用同樣的方法可以算出其他常用詞不同版本的釋義相似度。
釋義是辭書的靈魂,常用詞釋義更是判斷一部詞典能否成為品牌辭書的首要因素?!杜8摺沸抻喺叻浅V匾暢S迷~釋義的修訂,因此我們著重從常用詞的釋義角度考察《牛高》不同版本的釋義相似度。本文主要采用抽樣統(tǒng)計的方法研究《牛高》不同版本的釋義相似度。具體做法是:首先從《牛高》中隨機抽取各版本均有的三組詞,每組詞有10個;其次計算出每個常用詞相鄰版本的釋義相似度,通過加權(quán)的方式得出每組詞的相鄰版本釋義相似度;再次以加權(quán)的方式得出三組詞相鄰版本的釋義相似度,并將其視為《牛高》兩個版本的釋義相似度。
我們在《牛高》中隨機抽取的三組詞分別是:
第一組:fly、wash、sit、lie、sheep、grass、apple、white、long、dirty;
第二組:drink、push、stand、die、pig、tea、root、black、short、bad;
第三組:sing、kill、walk、hear、hand、blood、water、straight、slow、front
《牛高》不同版本的釋義相似度計算結(jié)果見表1—27:
表1 第一組第1版和第2版的個體和平均釋義相似度
表2 第二組第1版和第2版的個體和平均釋義相似度
表3 第三組第1版和第2版的個體和平均釋義相似度
《牛高》第1版和第2版的釋義相似度是:S12=(S一組12+ S二組12+ S三組12)/3=(66.60%+ 54.27%+74.10%)/3=64.99%。
表4 第一組第2版和第3版的個體和平均釋義相似度
表5 第二組第2版和第3版的個體和平均釋義相似度
表6 第三組第2版和第3版的個體和平均釋義相似度
《牛高》第2版和第3版的釋義相似度是:S23=(S一組23+ S二組23+ S三組23)/3=(84.20%+ 85.70%+83.60%)/3=84.50%。
表7 第一組第3版和第4版的個體和平均釋義相似度
表8 第二組第3版和第4版的個體和平均釋義相似度
表9 第三組第3版和第4版的個體和平均釋義相似度
《牛高》第3版和第4版的釋義相似度是:S34=(S一組34+ S二組34+ S三組34)/3=(53.10%+62.40%+47.90%)/3=54.47%。
表10 第一組第4版和第5版的個體和平均釋義相似度
表11 第二組第4版和第5版的個體和平均釋義相似度
表12 第三組第4版和第5版的個體和平均釋義相似度
《牛高》第4版和第5版的釋義相似度是:S45=(S一組45+ S二組45+ S三組45)/3=(75.10%+ 75.80%+82.10%)/3=77.67%。
表13 第一組第5版和第6版的個體和平均釋義相似度
表14 第二組第5版和第6版的個體和平均釋義相似度
表15 第三組第5版和第6版的個體和平均釋義相似度
《牛高》第5版和第6版的釋義相似度是:S56=(S一組56+ S二組56+ S三組56)/3=(69.40%+ 67.78%+73.05%)/3=70.08%。
表16 第一組第6版和第7版的個體和平均釋義相似度
表17 第二組第6版和第7版的個體和平均釋義相似度
表18 第三組第6版和第7版的個體和平均釋義相似度
《牛高》第6版和第7版的釋義相似度是:S67=(S一組67+ S二組67+ S三組67)/3=(90.10%+91.60%+93.30%)/3=91.67%。
表19 第一組第7版和第8版的個體和平均釋義相似度
表20 第二組第7版和第8版的個體和平均釋義相似度
表21 第三組第7版和第8版之間的個體和平均釋義相似度
《牛高》第7版和第8版的釋義相似度是:S78=(S一組78+ S二組78+ S三組78)/3=(95.25%+95.70%+93.70%)/3=94.88%。
表22 第一組第8版和第9版的個體和平均釋義相似度
表23 第二組第8版和第9版的個體和平均釋義相似度
表24 第三組第8版和第9版的個體和平均釋義相似度
《牛高》第8版和第9版的釋義相似度是:S89=(S一組89+ S二組89+ S三組89)/3=(98.00%+97.60%%+97.80%)/3=97.80%。
表25 第一組第1版和第9版的個體和平均釋義相似度
表26 第二組第1版和第9版的個體和平均釋義相似度
表27 第三組第1版和第9版的個體和平均釋義相似度
《牛高》第1版和第9版的釋義相似度是:S19=(S一組19+ S二組19+ S三組19)/3=(7.61%+8.58%+6.86%)/3=7.68%。
《牛高》自1948年出版以來,先后于1963、1974、1989、1995、2000、2005、2010、2016年進行了8次修訂,其修訂幅度大致可以從上文釋義相似度的變化情況研判出來。我們可以根據(jù)這種變化總結(jié)出《牛高》在釋義方面的修訂特點及動機,進而了解《牛高》釋義的現(xiàn)代化進程,以收到“他山之石,可以攻玉”的效果,為外向型漢語學習詞典的編纂提供有益啟發(fā)。
《牛高》第1版和第2版、第2版和第3版、第3版和第4版、第4版和第5版、第5版和第6版、第6版和第7版、第7版和第8版、第8版和第9版、第1版和第9版的釋義相似度分別是:S12=64.99%、S23=84.50%、S34=54.47%、S45=77.67%、S56=70.08%、S67=91.67%、S78=94.88%、S89=97.80%、S19=7.68%。上述數(shù)據(jù)表明:
1.《牛高》的釋義變化主要集中在第1版至第6版。這說明《牛高》的修訂變化主要集中在第1版至第6版,也即2000年以前?!杜8摺犯鱾€版本的“出版說明”也印證了上述觀點,這說明《牛高》詞典編纂者非常注重與時俱進。例如:《牛高》第2版的出版說明指出:“This is a completely revised and reset edition of the Dictionary/這是一部徹底重新編纂的修訂本。”[7]第3版的出版說明中強調(diào):“This is a completely revised,up-dated and reset edition of the Dictionary/這是一部根據(jù)新形勢重新編纂的修訂本?!盵8]第4版的出版說明中寫道:“Fully revised and up-to-date,with greatly increased coverage,especially of scientific and technical vocabulary.Clear,precise definition through.Numerous example phrase and sentences carefully chosen to illustrate words in context/(該版本)做了全面修訂和更新,詞匯覆蓋范圍大大增加,尤其是增加了科學和技術(shù)詞,定義更加精確。精心挑選的大量例句和短語,有利于通過語境表明詞義。”[9]
2.《牛高》第1版和第9版的釋義相似度只有7.68%,這說明《牛高》第1版和第9版之間的修訂幅度非常大,這與英美詞典編纂者非常注重品牌效應(yīng)有關(guān)。目前英語辭書市場上外向型學習詞典主要有《牛津高階英語詞典》《朗文當代高級英語詞典》《韋氏高階英語詞典》《柯林斯COBUILD高階英語學習詞典》《麥克米倫高階英語詞典》等系列品牌,內(nèi)向型詞典主要有《牛津簡明英語詞典》《錢伯斯20世紀詞典》《柯林斯英語詞典》《韋氏大學詞典》等系列品牌。為了能在英語辭書市場上站穩(wěn)腳跟,贏得穩(wěn)定的讀者群,保障辭書編纂者和出版者的利益,英語詞典編纂者就必須不斷地修訂辭書才行。這是《牛高》編纂者一直在不斷超越自我的動力之一。
《牛高》編纂者既有否認自我的勇氣和精神,但有時也表現(xiàn)出動搖不定的搖擺態(tài)度。例如:“apple”在第1版中有兩個義項:一種水果和長這種水果的樹,第2版和第3版合并為一個義項,第4版則又分為兩個義項;“tea”在第1版中有4個義項,第2版和第3版合為2個義項,第4版又參照第1版再重新分為4個義項。《牛高》編纂者對待同一個詞語釋義的反復變化,也反映了他們在詞典釋義方面的審慎態(tài)度。
用數(shù)字變化的規(guī)律說明語言變化規(guī)律的形式已經(jīng)成為當今語言學研究的一個重要趨勢,因而,我們也可以用數(shù)字變化的規(guī)律研究英語語文辭書編纂的現(xiàn)代化進程。把上文數(shù)字和《牛高》各版本中具體詞的釋義變化情況結(jié)合起來,可知《牛高》釋義的現(xiàn)代化進程大致分為三個階段:以現(xiàn)代語言學知識為指導進行釋義的階段、以詞典用戶為中心進行釋義的階段和依托語料庫技術(shù)進行全面釋義的階段。
1.以現(xiàn)代語言學知識為指導進行釋義的階段(第1版—第4版)
以現(xiàn)代語言學知識為指導進行釋義(劃分詞的義項)的階段主要是指辭書的初創(chuàng)時期,這與時代發(fā)展特點密切相關(guān),同時,由于《牛高》的編纂還處于嘗試、摸索階段,所以釋義不穩(wěn)定,變化較大。這種變化在《牛高》的第1版至第4版表現(xiàn)尤為突出。第1版和第2版釋義相似度為S12=64.99%,這說明第1、2版的釋義非常不穩(wěn)定。例如:“bad”在《牛高》第1版的解釋是:“wicked; evil; not right and good.It is bad to steal.……be in a bad temper.be very angry.”《牛高》第2版則把該義項拆分為兩個義項: “1.wicked,evil,immoral.2.unpleasant; disagreeable; unwelcome.”第1版?zhèn)戎赜凇癰ad”的社會意義,把心理意義以配例的形式補充出來,第2版則把兩種意義都列為義項?!皐hite”在第1版的解釋是: “the contrary of black; the color of clean snow or common salt,as an old man with white hair.”同樣的釋義在第2版改為:“the color of clean snow or common salt:his hair turned white.”顯然第2版的釋義更科學一些。
2.以詞典用戶為中心進行釋義的階段(第4版—第5版)
20世紀70年代中后期,英語辭書市場上先后出現(xiàn)了《朗文當代高級英語詞典》(1978年第1版)、《柯林斯COBUILD高階英語學習詞典》(1987年第1版)等一批新型詞典,這些詞典編纂的共同特征是以詞典用戶為中心,因此在編纂體例、釋義方式方面與以往辭書存在著很大的區(qū)別。這種新的編纂理念對《牛高》的修訂也產(chǎn)生了很大影響,主要表現(xiàn)在多義詞義項的排列和釋義方式的改變等方面。《牛高》第1、2、3版中多義詞的義項和由其組成的習語、復合詞是混合排列在一起的,從第4版開始,則是把多義詞的義項排列在前,由其組成的習語和復合詞單列于多義詞義項后面。除了在釋義方面尋求更精確的表述外,《牛高》第4版在釋義方面還有一個更大的變化就是用描述性的話語釋義代替“以詞釋詞”。《牛高》詞典1、2、3版的最常見釋義方式是“以詞釋詞”或“短語釋義”,如:“blood”在《牛高》第1版的第3個義項是:“family; descent; birth; relationship.”第2版第2個義項是:“passion;temper.”第3個義項:“relationships.”但從第4版開始改為“短語釋義”或“句子釋義”了。
真正接近現(xiàn)代詞典釋義的則從第6版開始。例如:“hear”在《牛高》第1、2、3、4、5版的解釋是:“to perceive sounds with ears.”在《牛高》第6、7、8、9版的解釋是:“to be aware of sounds with your ears.”
“dirty”的動詞性義項在《牛高》第4、5版的釋義是:“to become or make (sth) dirty.”第6、7、8、9版改為:“to make (sth) dirty.”
“kill”在《牛高》第1版的第1個義項是:“put to death; destroy life; cause the death of.”《牛高》第4版的相應(yīng)義項改為:“cause death or cause the death of(sb/sth).”第6、7、8、9版的相應(yīng)義項是:“to make sb/sth die.”
總之,《牛高》第6版的釋義最接近現(xiàn)代語言學的意義,其后第7、8、9版相關(guān)詞的釋義和第6版基本一致。
3.依托語料庫技術(shù)進行釋義的階段(第3版—第6版)
多項研究指標顯示,英語詞典編纂的語料庫化工作始于20世紀70年代中期,《牛高》詞典的編纂與語料庫技術(shù)結(jié)合也是始于第3版(1974年),經(jīng)過20多年的修訂:“《牛高》詞典編纂者在2000年就已經(jīng)完成了用語料庫技術(shù)豐富并補充英語語文詞典中多義詞義項劃分的任務(wù)?!盵15]語料庫技術(shù)和詞典編纂相結(jié)合的直接結(jié)果是:“第4版是全新修訂的新版本,內(nèi)容比第3版增加50%以上”[16],第7版則又比第4版的篇幅增了一倍以上?!杜8摺吩~典編纂者主要從補充義項、改“以詞釋詞”為句子釋義、增加配例、增加習語等幾個方面把詞典編纂和語料庫技術(shù)結(jié)合在一起修訂已有版本。
為了能在競爭激烈的英語辭書市場站穩(wěn)腳跟、贏得穩(wěn)定的讀者群,為了保證辭書編纂者和出版者的利益,不僅《牛高》詞典的編纂者,其他英語品牌詞典的編纂者也非常注重對已有版本進行革新式的修訂,可以這樣說,英語詞典編纂者在新版本的修訂方面一直走著精益求精的路子。
與英語詞典編纂者注重辭書修訂相反,漢語詞典編纂者似乎不是十分注重辭書修訂創(chuàng)新,這方面的證據(jù)是漢語辭書相鄰版本釋義的變化幅度并不是很大,例如:《現(xiàn)代漢語詞典》第1版和第2版、第2版和第3版……第6版和第7版、第1版和第7版的釋義相似度分別是:S12=98%,S23=96%,S34=97%,S45=88%,S56=98%,S67=100%,S17=85%。(1)數(shù)據(jù)為艾紅娟、李仕春在 “《現(xiàn)代漢語詞典》第1至第7版釋義相似度”課題研究過程中所得。
由此可見,漢語詞典編纂者和英語詞典編纂者在辭書修訂理念和修訂意識方面還是有差別的。如果我們從英美等辭書強國的英語中型語文辭書的文本角度看,就會發(fā)現(xiàn)國內(nèi)漢語詞典編纂者在辭書版本的修訂方面確實需要向國外同行學習。為了早日使我們國家由辭書大國轉(zhuǎn)變?yōu)檗o書強國,漢語詞典編纂者確實應(yīng)該學習英語詞典編纂者這種勇于否定自我、不斷革新的勇氣和精神。