周聰聰 于冬偉
在河北大學(xué),一間300平方米的工作室內(nèi),多名專家學(xué)者以及學(xué)生,正在參與進(jìn)行一項(xiàng)規(guī)模浩大的漢字整理與考釋工作一一中華字庫(kù)工程。這是一項(xiàng)國(guó)家重大文化建設(shè)工程,河北大學(xué)獨(dú)立承擔(dān)著明清圖書用字的整理與考釋工作。
什么是中華字庫(kù)?我們已有《漢語(yǔ)大字典》《中華字?!愤@些大部頭的字書,為什么還要對(duì)中華文字進(jìn)行全面的搜集整理?
近日,記者走進(jìn)河北大學(xué)中華字庫(kù)工程工作室,試圖揭開(kāi)中華字庫(kù)工程的神秘面紗,同時(shí)也走近這群人,聽(tīng)他們講如何讓一個(gè)個(gè)沉寂在古舊書籍上的漢字,在數(shù)字媒體中找到新的安身之所,擁有新的“身份”信息。
幫生僻字尋找“身份”信息
“這兩個(gè)字念什么?你知道嗎?”4月9日,窗外細(xì)雨蒙蒙,在河北大學(xué)中華字庫(kù)工程工作室,負(fù)責(zé)人楊寶忠寫下的兩個(gè)字令記者一頭霧水。
只見(jiàn)紙上的這兩個(gè)字,左邊都有一個(gè)“鼠”字,不過(guò)“鼠”字右邊還各有一個(gè)“占”字和“靈”字,寫作“鼠占”“鼠靈”。
第一個(gè)字,雖在《康熙字典》《漢語(yǔ)大字典》《中華字?!愤@樣的大型字書中有收錄,但被作為雙音節(jié)詞用字處理,至于讀音,書中卻未給出。第二個(gè)字大型字書都沒(méi)有收錄。
與這些令普通人直皺眉頭,甚至大型字書中都未給出答案或沒(méi)有收錄的疑難字打交道,對(duì)它們追根溯源,辨析淵源流變,是河北大學(xué)文學(xué)院漢語(yǔ)言文字學(xué)教授楊寶忠多年來(lái)的主要工作。
人們的印象中,漢語(yǔ)言文字學(xué)這門學(xué)科,可能更多的是在“故紙堆”中埋頭考究。而現(xiàn)在,楊寶忠正帶領(lǐng)30多位老師和學(xué)生,參與一項(xiàng)解決中國(guó)目前在信息化、數(shù)字化中所碰到的瓶頸問(wèn)題的重大工程。
走進(jìn)工作室,只見(jiàn)大家伏案于一排排電腦桌前,全神貫注地盯著屏幕,電腦屏幕上是電子掃描版的豎排文字古文獻(xiàn),不少還紙張斑駁,字跡模糊。工作室忙碌而安靜,只聽(tīng)見(jiàn)計(jì)算機(jī)的嗡嗡聲。
“擬認(rèn)同字、康熙部首、康熙附形部首等屬性,以及讀音、釋義、字際關(guān)系等,這些都是一個(gè)字的‘身份信息,我們的工作就是為這些從明清圖書上找出來(lái)的生僻字填寫一張完整的‘身份證?!惫ぷ魇页蓡T、河北大學(xué)文學(xué)院徐世權(quán)博士,一邊向記者展示中華字庫(kù)工作平臺(tái)界面,一邊向記者解釋他們的主要工作內(nèi)容。
“我國(guó)現(xiàn)有的計(jì)算機(jī)字符集僅有7萬(wàn)多個(gè),已無(wú)法滿足時(shí)代需求。因此,國(guó)家啟動(dòng)了中華字庫(kù)工程,將利用先進(jìn)的信息技術(shù)手段,收集和匯總歷代文獻(xiàn)資源中出現(xiàn)過(guò)的漢字和少數(shù)民族文字,辨析源流衍變,確定每個(gè)字形的歷史地位,建立漢字及少數(shù)民族文字的編碼和主要字體字符庫(kù),”中華字庫(kù)工程第15包項(xiàng)目管理辦公室主任楊清臣介紹。
中華字庫(kù)工程于2011年啟動(dòng),完成之后的中華字庫(kù)預(yù)計(jì)可編碼字符數(shù)在50萬(wàn)左右。工程共有28個(gè)工作包,河北大學(xué)以獨(dú)立承擔(dān)的方式,獲得第15包明清圖書用字搜集與整理之三·文字整理與考釋的分包任務(wù),對(duì)約100萬(wàn)字形(楷體漢字)的疑難字進(jìn)行辨識(shí)、整理和考釋。
而他們考釋的生僻字“身份信息”,最終將被收進(jìn)“中華字庫(kù)”,然后提交給國(guó)際標(biāo)準(zhǔn)化組織,在電腦區(qū)位中給每個(gè)字編碼,廠商再據(jù)此做出宋體、黑體、隸書等字體,最終進(jìn)入計(jì)算機(jī)。
“我們每天的工作就是研究生僻字。很多人并不覺(jué)得生僻字對(duì)我們的現(xiàn)實(shí)生活有何影響,但有的人就因?yàn)樯ё?,連一張信息準(zhǔn)確的身份證都無(wú)法得到?!痹谛刑瓶h獨(dú)羊崗鄉(xiāng)某村進(jìn)行的一次實(shí)地考察,令楊清臣深有感觸。
該村的歷史可以追溯到南宋時(shí)期,距今已有近千年歷史。但苦于計(jì)算機(jī)打不出這個(gè)村名,當(dāng)?shù)卮迕竦牡谝淮矸葑C上的村名信息只能靠手工填寫,而現(xiàn)在使用的第二代身份證,只能用“差取”二字來(lái)代表。
最難的是疑難字考釋
從某種意義上說(shuō),在信息化、數(shù)字化時(shí)代大潮之下,不論是常用字還是生僻字,只有被納入字庫(kù)當(dāng)中,才算找到了“家”。
在中華字庫(kù)工程的計(jì)算機(jī)操作平臺(tái)上,每個(gè)從上一環(huán)節(jié)遞交過(guò)來(lái)的文字,都設(shè)有一個(gè)專屬的號(hào)碼,就像一個(gè)人的身份證號(hào)。工作室成員要做的,就是把這些漢字有名有姓地帶回“家”,以便它們能信息完整地“居住”在字庫(kù)這個(gè)虛構(gòu)的網(wǎng)格式大廈里。
然而,這條尋“家”之路并不容易。
按照工作窒的流程安排,一審主要是碩、博研究生對(duì)填寫的內(nèi)容進(jìn)行互審,二審則是由教師對(duì)一審內(nèi)容進(jìn)行檢查,二審解決不了的問(wèn)題,則要進(jìn)一步提交給楊寶忠、梁春勝二人“坐鎮(zhèn)”的三級(jí)審核。
一般沖破重重關(guān)卡來(lái)到楊寶忠和梁春勝面前的,都是幾輪考釋仍啃不下來(lái)的硬骨頭一一疑難字。
楊寶忠解釋,疑難字是個(gè)相對(duì)概念,指一般人不認(rèn)識(shí)或認(rèn)錯(cuò)的字,在普通人看來(lái),它們的結(jié)構(gòu)都復(fù)雜得令人咂舌。在大型字書里,有些字音義不全,標(biāo)為“音未詳”“義未詳”或“音義未詳”。有些字雖然音義俱全,很可能也存在注音、釋義、字際關(guān)系整理等諸多錯(cuò)誤。
因此,疑難字的考釋,是中華字庫(kù)工程最難也最見(jiàn)功底的領(lǐng)域。
當(dāng)初,清代李元所著《蠕范》中出現(xiàn)的“鼠占”“鼠靈”二字的考釋,曾令楊寶忠頗費(fèi)周折。
“鼠占、鼠靈,怎么念?什么意思?”憑借多年疑難字考釋的經(jīng)驗(yàn),利用自己總結(jié)的疑難字考釋方法和自己發(fā)現(xiàn)的近代漢字“異體部件替換”規(guī)律,楊寶忠聯(lián)想到“鼠占”“鼠靈”很有可能就是“鳥鼠同穴”中的鼠名“鼠突”字。
循著這個(gè)思路,楊寶忠多方求證,最終弄清了“鼠占”“鼠靈”二字的來(lái)歷。
“在歷代傳抄轉(zhuǎn)錄過(guò)程中,很容易出現(xiàn)各種書寫錯(cuò)誤,這就需要我們根據(jù)漢字書寫習(xí)慣和變異規(guī)律,結(jié)合上下文意思,順藤摸瓜,追根溯源,考釋出一個(gè)字的準(zhǔn)確讀音和含義?!睏顚氈医忉?,“鼠占”“鼠靈”二字就是在傳抄過(guò)程中,一錯(cuò)再錯(cuò)錯(cuò)出來(lái)的。
《山海經(jīng)>郭璞注:“鼠名日鼠突。鼠突如人家鼠而短尾……”一誤作“鼠名日鼠戾。鼠戾如人家鼠而短尾……”(中華書局影印本《太平御覽》),再誤作“鼠名日鼠占。鼠戾如人家鼠而短尾……”(文淵閣、文津閣本《太平御覽》),三誤作“鼠名鼠占鼠靈”(《禹貢合注》),四又誤改作“鼠占鼠靈”,此《蠕范》“鼠占鼠靈”所由生。
“《字匯補(bǔ)》以下大型字書收錄‘鼠占‘鼠靈二字,既不能與‘鼠突字加以溝通,又皆處理為雙音節(jié)用字,均欠妥當(dāng)?!睏顚氈易詈蟮贸鼋Y(jié)論。
考釋,不僅要搞清楚一個(gè)字的音義,還意味著要抽絲剝繭,通過(guò)一個(gè)字形考釋出一系列的疑難字,并建立字際關(guān)系。
正是通過(guò)這一系列的研究,楊寶忠最終構(gòu)建了一個(gè)以“鼠突”為中心的矩形聯(lián)系圖,古籍中出現(xiàn)的“鼠戾”“鼠占”“鼠靈”“鼠靈”“鼠錄”“鼠炎”“鼠空”“鼠炎”“鼠犬”“鼠吾”“鼠奚”“突鳥”等都是“鼠突”變來(lái)的。
從1990年至今,楊寶忠一直從事大型字書的疑難字考釋,近30年里,他考釋的疑難字將近4000字。
近30個(gè)年頭,不到4000字,兩個(gè)數(shù)字對(duì)比,文字考釋的個(gè)中艱辛不言自明。
考驗(yàn)學(xué)識(shí)和學(xué)養(yǎng)的積累
河北大學(xué)中華字庫(kù)工程工作室以玻璃為隔斷,辟出一間小型閱覽室,占據(jù)工作室三分之一的空間。別看面積不大,卻滿滿當(dāng)當(dāng)碼放了整整13排、100多個(gè)大書架。
文津閣本《四庫(kù)全書》《續(xù)修四庫(kù)全書》《百部叢書集成》《域外漢籍珍本文庫(kù)》《高麗大藏經(jīng)》……在這里,幾乎能查閱到項(xiàng)目研發(fā)所需要的各種古籍。
作為補(bǔ)充,閱覽室一旁的電腦上,還裝有一個(gè)文獻(xiàn)檢索包,收錄著書架上沒(méi)有的電子書,足有10多T。
這些都是為方便大家考釋文字時(shí)查閱古籍準(zhǔn)備的。
每天從早上8時(shí)到晚上10時(shí)教學(xué)樓關(guān)門,除上課外,工作室的成員幾乎全都泡在這里,即使節(jié)假日和周末,也基本是這樣,可謂名副其實(shí)的埋首“故紙堆”。
這樣的工作節(jié)奏,很容易讓人聯(lián)想到“枯燥”這個(gè)詞。
“表面看,我們一直是在做重復(fù)性工作,但實(shí)際上每天都是新的?!睂?duì)此,楊清臣卻自得其樂(lè)。
作為工作平臺(tái)中的二級(jí)審核老師,楊清臣所謂的樂(lè)趣和成就感就在于,能在很多習(xí)焉不察的一審結(jié)果中尋獲到“漏網(wǎng)之魚”。
有一次,一級(jí)審核提交上來(lái)一個(gè)“氵艾”字。對(duì)這個(gè)字,一級(jí)審核并未發(fā)覺(jué)有何問(wèn)題,而是根據(jù)正常流程,對(duì)其各項(xiàng)屬性進(jìn)行了標(biāo)注,但楊清臣看到這個(gè)字卻頗為眼生。
這個(gè)字出現(xiàn)在明嘉靖刻本《皇明疏議輯略>卷三十一《處置夷情疏》一文中:“又有一路從草坡出氵艾州,一路從 氵僚澤壩出灌縣,一路從清溪口出崇慶?!?/p>
“氵艾州?從來(lái)沒(méi)有聽(tīng)說(shuō)過(guò)還有這個(gè)地方?。 苯?jīng)過(guò)一番仔細(xì)查閱,最終,楊清臣的懷疑在文淵閣四庫(kù)本《忠肅集》中得到了印證,“氵艾”應(yīng)為“汶”。另外,“氵僚”即“僚”之加旁俗字。
“類似這樣的錯(cuò)誤,很多都是習(xí)焉不察的,在這種地方能產(chǎn)生懷疑的,就是高手?!毙焓罊?quán)說(shuō)。而能像導(dǎo)師楊寶忠一樣,由“鼠占”“鼠靈”找到一個(gè)系列的字形,構(gòu)成矩形系聯(lián),形成宏觀觀察,則令徐世權(quán)神往,“這就是我們搞語(yǔ)言文字學(xué)追求的最高境界?!?/p>
在長(zhǎng)期疑難字考釋實(shí)踐中,楊寶忠在前人“形音義三者互相求”的考字方法基礎(chǔ)上,提出“形用義音序五者互相求”“五者之中,形最重要”的考釋方法,使疑難字考釋成為有規(guī)律可循、有方法指導(dǎo)的科學(xué)。
從一堆“故紙”中理出頭緒、解決問(wèn)題,考驗(yàn)的是能力。能從中有所懷疑,更考驗(yàn)學(xué)識(shí)和學(xué)養(yǎng)的積累。
觸發(fā)懷疑的機(jī)關(guān),要建立在大量閱讀基礎(chǔ)之上形成的“語(yǔ)感”。
1982年,楊寶忠本科畢業(yè)留校后,宿舍和中文系資料室在一層樓,楊寶忠曾以一天一本古書的速度,在六年多的時(shí)間里差不多讀完了資料室所藏的先秦兩漢古書。
在近30年的大型字書疑難字考釋中,楊寶忠把《漢語(yǔ)大字典》(八卷本)第一版通讀三遍,《漢語(yǔ)大字典》(九卷本)第二版通讀一遍,《中華字?!吠ㄗx四遍,而且是將兩本大型字書一個(gè)字一個(gè)字對(duì)照著讀。
苦行僧式的閱讀經(jīng)歷,使楊寶忠儼然一本“活字典”,很多字的源流衍變信口拈來(lái),如數(shù)家珍。
相比老一輩主要靠翻閱紙本古書,楊清臣和徐世權(quán)以及他們的學(xué)生們更多地是利用電子文獻(xiàn),有了更便捷的閱讀手段。
雖然由于字庫(kù)不全,目前的古籍信息搜索還有頗多不便,但工作室還是通過(guò)購(gòu)買和自主研發(fā)兩種渠道,建立了專門的古籍信息數(shù)據(jù)庫(kù),借助搜索技術(shù),輸入相關(guān)搜索內(nèi)容,幾秒內(nèi)便能把相關(guān)文獻(xiàn)搜索完畢。
不過(guò),不論哪種模式,都需要堅(jiān)持。
雖然楊寶忠平時(shí)不茍言笑,要求非常嚴(yán)格,但打心眼兒里,他對(duì)這些青年學(xué)者們嚴(yán)謹(jǐn)踏實(shí)的學(xué)術(shù)態(tài)度深感欣慰。在他辦公室一旁的角落里,放著幾副羽毛球拍和乒乓球拍,對(duì)于學(xué)習(xí),楊寶忠從不多言,反而總是趕著大家多運(yùn)動(dòng)。
“搞學(xué)術(shù)在外人看來(lái)很辛苦,但做出來(lái)特別有成就感。就像在海邊撿貝殼,在那么多好認(rèn)的字里找著一個(gè)難認(rèn)的,就像撿著一個(gè)特別漂亮的貝殼?!闭f(shuō)著,本略顯拘謹(jǐn)?shù)臈钋宄寂e起雙臂,嘴角揚(yáng)笑,“那種如獲至寶的心情,就想手舞足蹈地跳起來(lái)!”