梁瀅
【摘要】 本文對《全宋詞》進行字頻統(tǒng)計,并與《全唐詩》《全元散曲》《四庫全書》 《四部叢刊》等進行比較,分析了宋詞的用字特點。宋詞用字具有文藝語體形象性、情意性、創(chuàng)新性的特點。在唐詩、宋詞、元曲的比較中,唐詩用字較接近書面語體;宋詞和元曲則較為口語化、通俗化,用字的相似程度也較高。宋詞和元曲使用的去聲字都略多于唐詩。
【關(guān)鍵詞】 字頻;語體風格;宋詞;唐詩;元曲
【中圖分類號】I206? ? ? ? ? 【文獻標識碼】A? ? ? ? ? 【文章編號】2096-8264(2020)28-0029-02
基金項目: 2015年度河北省高層次人才資助項目(類型:博士后科研項目擇優(yōu)資助),項目名稱:基于計量分析的宋詞語體研究(編號:B2015001009)。
一、古代詩歌的語體風格和用字特點
詞是古代詩歌的一種,在語體學(xué)系統(tǒng)中屬于文藝語體。談宋詞的語體風格和用字特點,就不能不談古代詩歌和文藝語體。因此,本文先從古代詩歌與一般古籍的比較來梳理古代詩歌的語體風格和用字特點。
唐詩、宋詞、元曲(本文指元散曲)是古代文學(xué)史上作品數(shù)量較多、影響較大、流傳范圍較廣的三種詩體,在發(fā)生和發(fā)展的次序上一脈相承。因此,在討論宋詞的用字特點時,與唐詩和元曲的比較也是不可或缺的。本文使用《全唐詩》《全宋詞》和《全元散曲》的電子化文本,利用“語料庫在線”網(wǎng)站的字頻詞頻統(tǒng)計工具CorpusWordFrequencyApp,獲得這三種語料的字頻信息,用于探討古代詩歌的用字特點。與詩歌相比較的一般古籍則使用《古籍字頻統(tǒng)計》的數(shù)據(jù)。
(一)單字使用頻率
將《全唐詩》《全宋詞》和《全元散曲》合并為一個古代詩歌語料庫,進行字頻統(tǒng)計,獲得的數(shù)據(jù)是:漢字總數(shù)4199179個,字種數(shù)(即單字數(shù))7998個,平均單字使用頻率為525次。《古籍字頻統(tǒng)計》的數(shù)據(jù)為:《四庫全書》總字數(shù)699684465個,單字29088個,平均單字使用頻率為230325次;《四部叢刊》總字數(shù)90616538個,單字27606字,平均單字使用頻率為3283次。詩歌使用單字的平均頻率遠遠低于其他文獻。
(二)高頻字
《古籍字頻統(tǒng)計》的最高頻一百字為:之不以也而其人為有者一曰子於十大所二三中無┃年則下天上此王書是公事處在可言至五如日山四故文與又得時行州知月后南生見道亦謂東君明相然水今皆作國名使臣出百未于何詩太西官矣六用正能縣夫云氏地同元士成陽非方心
古代詩歌語料庫的最高頻一百字為:不人風一無花山云春來日天有月時何上水中年相如生心長歸是清去玉自為秋處里知得君金香江夜雨見明空此行白寒下未在千今酒青高聲誰事多飛紅東三落前煙新子萬我家盡情流愁西南更與道客深門看閑重遠似老回思開成路朝滿草
(三)詩歌的文藝語體風格與其用字特點的對應(yīng)
1.文藝語體的語言形象生動,使用具象鮮明的語言和修辭手段展現(xiàn)事物的形狀,細選顏色詞,展現(xiàn)事物的色彩形象。因此,表現(xiàn)自然景觀的“風花山云春月水秋”、表示顏色的“白紅青金”等字在詩歌中高頻出現(xiàn)。
2.文學(xué)語言必須情感充沛,真摯感人,這是藝術(shù)性語體區(qū)別于其他語體的本質(zhì)特征。文藝語體使用直接或間接的抒情詞語與手段來表達作者的情感。
因此,用于表達個人印象和感受的“寒情愁閑知香”等字在詩歌中高頻使用。
詩歌注重抒情而非理性的思考和計算,因此,詩歌中表示數(shù)量的字往往是約數(shù)而非確數(shù),“一三千萬多”是詩歌的高頻字,“二四五六百”卻不是。
3.文藝語體追求語言的創(chuàng)新性。文藝語體的語言不落俗套,在用字上表現(xiàn)為兩個特點:首先,單字使用頻率低,即單字重復(fù)少。詩歌是個性化的創(chuàng)作,語言要表現(xiàn)作者鮮明的個性特點,遣詞造句就不會是程式化的,而是反復(fù)錘煉,斟酌用字,單字重復(fù)率自然就低。詩人為求參差錯落之美,往往還要在一篇詩作中有意識地避免使用非修辭性的重復(fù)的字。格律詩中有“避同”之說,將非修辭性的重復(fù)字視為詩病。其次,實詞較多,虛詞較少。我國古代詩歌有著寄托象征的傳統(tǒng),善于借景抒情、托物詠志,寫作時縱橫捭闔,盡情揮灑,用字涉及自然現(xiàn)象景物、抽象事物、人、時間、地點、數(shù)量等范疇,比其他文體的用字范圍要廣泛。因此,詩歌中用于表示名詞、動詞、形容詞等實詞的字數(shù)量多,而作為虛詞使用的“之乎者於也以其而則又”這類字則比一般古籍少得多。
二、宋詞與唐詩、元散曲的用字情況比較
(一)宋詞的書面語色彩低于唐詩而高于元曲
人們往往用“詩莊詞媚曲俗”這種簡明扼要的對照來說明這三種詩體的風格差異。馮勝利(2011)從詩歌的“齊整律”和“長短律”說明,齊言體與雜言體詩歌在風格上的正式、隨意的差別是由它們的韻律決定的,越整齊越莊重,越參差越隨意。本文的字頻研究可以對這一理論作一個補充。上文的分析已經(jīng)指出,單字使用頻率與文體、語體相對應(yīng),一般的書面語體單字使用頻率高,詩歌類的作品單字使用頻率低。
那么,唐詩、宋詞、元曲這三種詩體與書面語體之間的距離,也就可以從單字使用頻率來觀察?!度圃姟窛h字總數(shù)2469471個,字種數(shù)7427個?!度卧~》漢字總數(shù)1382445個,字種數(shù)5864個?!度⑶窛h字總數(shù)347322個,字種數(shù)4753個。
單字使用頻率為:唐詩332.5,宋詞235.75,元曲73.07。從單字使用頻率來看,唐詩最接近其他書面語體,其正式、典雅程度高于宋詞和元曲。宋詞和元曲的書面語色彩都比唐詩低,元曲的口語化、通俗化程度最高。也就是說,詩歌的單字使用頻率與語體莊重程度成正比,單字使用頻率越高的詩體,書面語色彩、莊重正式的色彩越濃;反之則口語化程度越高。
(二)宋詞與元曲的用字相似程度較高
從淵源來說,詞為詩余,宋詞的產(chǎn)生與唐詩有著密切的關(guān)系;從語言風格來說,宋詞語言有口語化的特點,與元曲語言的通俗化、生活化相近。究竟宋詞的用字更靠近哪一端?這需要通過統(tǒng)計比較才能了解。
由于詩歌的單字使用頻率低,這三個語料庫都要到大約前1000個高頻字才能對整個語料庫累積覆蓋到80%以上,前2000個高頻字才能覆蓋到95%左右。
為了避免蕪雜,便于探討,本文選取三個語料庫的前100個高頻字,能對各自的語料庫覆蓋到30%以上。這些字的出現(xiàn)情況統(tǒng)計為共用、獨用的7種類型共148字,分布如下表:
三種詩體同用的字超過一半,說明這三種詩體使用的詞匯相似程度很大?!按簴|風”是它們共用的高頻字,可以想見,三個時代的詩人都偏愛吟詠春光。
元曲與唐詩共用的字最少,說明它們之間不但時代相距較遠,文體風格也差別較大。三個語料庫獨用的字,宋詞最少,因為它銜接著唐詩與元曲,與二者共用的字都比較多。宋詞與元曲共用字略多于宋詞與唐詩共用字,說明宋詞與元曲的用字相似程度更高,關(guān)系更近。
三、宋詞使用去聲字多于唐詩
從《廣韻》分卷和收字數(shù)量可以知道,漢字的四聲數(shù)量分布是平聲最多,去聲次之,上聲更少,入聲最少。宋詞的格律不但講平仄,還講四聲,在四聲中最強調(diào)去聲,領(lǐng)字多用去聲。“一字逗”的句子很常見。有的詞調(diào)還規(guī)定詞中換韻處、音律吃緊處必用去聲。那么,宋詞是否因此而使用了較多去聲字?對三個語料庫的前100個高頻字進行聲調(diào)標注以后,統(tǒng)計結(jié)果如下表:
從表2可見,宋詞的去聲字多于唐詩。宋詞是一種重視追求音響之美的音樂文學(xué)。對音樂美的重視和對去聲的強調(diào)使宋詞的語言使用較多的去聲字。如果落實到作品的篇幅去理解表2的數(shù)據(jù),一首112字的長調(diào)字數(shù)等于兩首56字的七律相加,按表2去聲字的比例來算,長調(diào)會用17個去聲字,兩首七律則共用15個去聲字,相當于長調(diào)的上、下片各多用一個去聲字。也可以這樣說:每一首56字的詞,都比字數(shù)相等的七律多用一個去聲字。
宋代詞人發(fā)現(xiàn)并強調(diào)去聲的特殊性,隨著音律理論的傳承和發(fā)展,到了元曲的時代,“音律吃緊處用去聲”的觀念更為深入人心,也得到了更自覺、更普遍的實踐,表現(xiàn)為元曲的去聲字略多于宋詞。元曲和宋詞重視使用去聲字的共同傾向,使它們的關(guān)系更密切了。
參考文獻:
[1]北京書同文數(shù)化技術(shù)有限公司編.古籍漢字字頻統(tǒng)計[M].北京:商務(wù)印書館,2008.
[2]覃勤.先秦古籍字頻分析[J].語言研究,2005,(25).
[3]馮勝利.語體語法及其文學(xué)功能[J].當代修辭學(xué),2011.
[4]俞敏.古四聲平議[J].訓(xùn)詁研究,1981,(1).
[5](宋)陳彭年.永祿本韻鏡·宋本廣韻·七音略[M].南京:江蘇教育出版社,2002.
[6]王景琳,徐匋.中國古代文體叢書·詞[M].北京:人民文學(xué)出版社,1994.
[7]葉君遠.中國古代文體叢書·詩[M].北京:人民文學(xué)出版社,1994.
[8]隋樹森.全元散曲[M].北京:中華書局,1964.
[9](清)彭定求等.全唐詩[M].鄭州:中州古籍出版社,2008.
[10]唐圭璋.全宋詞[M].北京:中華書局,2009.
[11]袁暉,李熙宗.漢語語體概論[M].北京:商務(wù)印書館,2005.