零、引言
本文的工作是對國家語言文字工作委員會語言文字規(guī)范GF3003-1999,即傅永和等編《GB13000.1字符集:漢字字序(筆畫序)規(guī)范》(以下簡稱《筆畫序規(guī)范》)中的20902個漢字的筆畫及筆畫數(shù)進(jìn)行統(tǒng)計與分析。
本文的做法是:首先把《筆畫序規(guī)范》中的20902個漢字的筆畫及筆畫數(shù)逐個輸入電腦。這項輸入與校對工作前后花了大約半年的時間,這是本文整個統(tǒng)計研究工作中最基礎(chǔ)性的工作,當(dāng)然也是最繁重的工作。然后在此基礎(chǔ)上進(jìn)行了數(shù)據(jù)統(tǒng)計。
在統(tǒng)計中,本文首先統(tǒng)計了20902個漢字的筆畫及筆畫數(shù)。作為比較,本文還統(tǒng)計了《現(xiàn)代漢語常用字表》中的3500個現(xiàn)代漢語常用字的相關(guān)數(shù)據(jù)。本文的統(tǒng)計包括兩個方面,一是畫數(shù)(筆畫數(shù))統(tǒng)計,一是筆畫統(tǒng)計。我們對所有統(tǒng)計數(shù)據(jù)都進(jìn)行了分析說明,最后對全文的統(tǒng)計分析進(jìn)行了簡要的小結(jié)。
一、畫數(shù)統(tǒng)計
首先來看《筆畫序規(guī)范》的總體數(shù)據(jù)。
《筆畫序規(guī)范》中20902個漢字筆畫總數(shù)為268479,平均每字12.8畫,最少的1畫,有10個字,最多的48畫,只有1個字。其中12畫的漢字最多,有1957個,其次是11畫、13畫。這說明筆畫數(shù)超過平均值的要比低于平均值的多。詳見表一。
表一 不同筆畫數(shù)漢字?jǐn)?shù)表(20902字)
《現(xiàn)代漢語常用字表》3500個現(xiàn)代漢語常用字筆畫總數(shù)為34097,平均每字9.7畫,最少的1畫,有2個字,最多的24畫,只有1個字。其中9畫的漢字最多,有415個,其次是8畫、10畫。這里更說明筆畫數(shù)超過平均值的要比低于平均值的多,平均是每字9.7畫,但9畫的漢字最多。詳見表二。
表二 不同筆畫數(shù)漢字?jǐn)?shù)表(3500常用字)
其中2500個最常用字筆畫總數(shù)為22925,平均每字9.2畫,最少的1畫,有2個字,最多的23畫,只有1個字。其中9畫的漢字最多,有316個,其次是8畫、10畫。詳見表三。
表三 不同筆畫數(shù)漢字?jǐn)?shù)表(2500最常用字)
其中1000個次常用字漢字筆畫總數(shù)為11172,平均每字11.2畫,最少的2畫,有2個字,最多的24畫,只有1個漢字。其中11畫的漢字最多,有142個,其次是10畫、12畫。詳見表四。
表四 不同筆畫數(shù)漢字?jǐn)?shù)表(1000次常用字)
二、筆畫統(tǒng)計
接下來,我們再看一下不同筆畫使用的情況。
還是先來看總體數(shù)據(jù)。20902個漢字筆畫總數(shù)為268479,其中橫畫最多,82682個,占30.8%,其次是豎畫,51459個,占19.2%。從中可以看出:橫畫和豎畫加起來占一半,剩下的撇畫、點畫和折畫所占比例差不多,它們加起來也占一半。
表五 不同筆畫統(tǒng)計表(20902字)
下面是3500常用字的筆畫數(shù)據(jù)。不同筆畫的比例與20902個漢字的有所不同,但是大同小異,總的比例差不多,也是橫畫和豎畫占一半,撇畫、點畫和折畫占一半。
表六 不同筆畫統(tǒng)計表(3500常用字)
其中2500最常用字的筆畫數(shù)據(jù)是:
表七 不同筆畫統(tǒng)計表(2500最常用字)
1000次常用字的筆畫數(shù)據(jù)是:
表八 不同筆畫統(tǒng)計表(1000次常用字)
最常用字的筆畫與次常用字的筆畫比例有一些差別,主要是橫畫和豎畫的比例:最常用字的較低,而次常用字的較高。
三、小結(jié)
(一)畫數(shù)數(shù)據(jù)
現(xiàn)在,我們把漢字的平均筆畫數(shù)據(jù)放在一起來做個歸納,可以發(fā)現(xiàn)一些比較明顯的變化。
表九 不同筆畫數(shù)漢字?jǐn)?shù)比較表
從這個比較表中,可以看出:
1、常用漢字的平均筆畫要少,尤其是最常用漢字要少很多,但次常用漢字的平均筆畫卻少得并不多:3500常用字的平均筆畫要比《筆畫序規(guī)范》中20902個漢字的少3.1,其中最常用的2500個漢字,平均筆畫比20902個漢字的少3.6,而次常用的1000個漢字的平均筆畫卻比20902個漢字的只少1.6;
2、C行的數(shù)據(jù)普遍低于B行的數(shù)據(jù),這說明筆畫數(shù)多的漢字要比低的漢字多,這也驗證了越常用的漢字筆畫越少;
3、從E行的數(shù)據(jù)看,漢字最多的筆畫數(shù)的漢字?jǐn)?shù)(即某一個筆畫數(shù)的漢字最多,最多的這個筆畫數(shù)的漢字?jǐn)?shù))占整個漢字總數(shù)的百分比在9.4%到14.2%之間,平均為12.0%,約為八分之一。一般說總字?jǐn)?shù)越多,最多漢字的筆畫數(shù)也大。這并不奇怪。但有趣的是:隨著總字?jǐn)?shù)的減少,漢字最多的筆畫數(shù)的漢字?jǐn)?shù)占整個漢字總數(shù)的百分比卻逐步增大。
(二)筆畫數(shù)據(jù)
表十 不同筆畫統(tǒng)計比較表
從表十的比較看,橫畫最多,其次是豎畫,再次是點畫、折畫和撇畫。這其中,橫畫和豎畫加起來占一半,剩下的撇畫、點畫和折畫差不多,它們加起來也占一半??偟膩碚f,筆畫數(shù)據(jù)的比例變化不大,只有橫畫占有絕對優(yōu)勢,比例總是最高,高達(dá)三成。
本文通過對《筆畫序規(guī)范》20902個漢字筆畫數(shù)據(jù)的統(tǒng)計分析,可以對漢字筆畫有個總體的了解,同時對常用漢字筆畫數(shù)據(jù)進(jìn)行了統(tǒng)計分析,更讓我們看到了常用漢字的筆畫數(shù)情況。我們相信這些數(shù)據(jù)可以為漢字的整理、筆形編碼以及漢字教學(xué)提供重要的參考。
參考文獻(xiàn):
[1]傅永和等.GB13000.1字符集:漢字字序(筆畫序)規(guī)范[M].上海教育出版社,2000.
[2]國家語言文字工作委員會漢字處.現(xiàn)代漢語常用字表[M].語文出版社,1988.
[3]周錫衛(wèi)、陳民.對<漢字部件規(guī)范>的若干數(shù)據(jù)統(tǒng)計[J].計算機世界,1998,(15).
(郭曙綸 樸貞姬,上海交通大學(xué)國際教育學(xué)院)