(河洛文化研究中心 河南洛陽(yáng) 471022)
隨著計(jì)算機(jī)與信息技術(shù)的迅猛發(fā)展,古籍?dāng)?shù)字化已成為對(duì)古籍文獻(xiàn)資源進(jìn)行有效保護(hù)和廣泛利用的重要手段。中國(guó)古籍文獻(xiàn)數(shù)字化工作至今已走過(guò)30余年的歷程,實(shí)踐與理論方面均取得豐碩成果。耿元驪《三十年來(lái)中國(guó)古籍?dāng)?shù)字化研究綜述(1979-2009)》一文統(tǒng)計(jì)中國(guó)古籍?dāng)?shù)字化相關(guān)研究論著有809篇,〔1〕再加上近3年的研究成果,總量應(yīng)有近千篇。研究論題主要集中在兩方面:首先是古籍?dāng)?shù)字化建設(shè),屬于技術(shù)層面;其次是對(duì)數(shù)字化古籍的利用,屬于學(xué)術(shù)層面?!?〕縱觀現(xiàn)有研究成果,關(guān)于古籍?dāng)?shù)字化理論與實(shí)踐的探討日益成熟、完善,并呼吁從國(guó)家層面管理協(xié)調(diào)古籍?dāng)?shù)字化的研發(fā),本文擬就古籍?dāng)?shù)字化的性質(zhì)及其開(kāi)發(fā)略加分析。
學(xué)者們一致認(rèn)為古籍?dāng)?shù)字化是利用計(jì)算機(jī)信息技術(shù)對(duì)古籍信息和內(nèi)容進(jìn)行數(shù)字化處理,并轉(zhuǎn)化為數(shù)字媒體形式的數(shù)據(jù)庫(kù)。張軸才認(rèn)為:狹義的典籍?dāng)?shù)字化是把整理后的古籍文獻(xiàn)內(nèi)容,從紙面轉(zhuǎn)換為數(shù)字,與相關(guān)的數(shù)字化工具結(jié)合在一起,達(dá)到字字可查、句句可檢的水準(zhǔn),提供給文史工作者使用。這是一個(gè)基礎(chǔ)工作。目的不是取代文史工作者,而是讓學(xué)者“如虎添翼”,進(jìn)行深層次的研究。廣義的數(shù)字化:標(biāo)引、???、版本對(duì)比、注釋、同義詞語(yǔ)、韻律、批評(píng)……文史工作者的使命?!?〕張軸才對(duì)古籍?dāng)?shù)字化進(jìn)行狹義與廣義之分,揭示了古籍?dāng)?shù)字化處理的層次之別。
狹義的古籍?dāng)?shù)字化是將已通過(guò)編纂、??薄?biāo)點(diǎn)、注釋和今譯等方法整理過(guò)的古籍轉(zhuǎn)化為數(shù)字媒體形式的數(shù)據(jù)庫(kù),這一層次的古籍?dāng)?shù)字化與現(xiàn)代文獻(xiàn)資源數(shù)字化并無(wú)二致。廣義的古籍?dāng)?shù)字化在狹義的基礎(chǔ)上還涉及了古籍編纂、校勘、標(biāo)點(diǎn)、注釋和今譯等古籍整理方法,既是古籍整理,又包括文獻(xiàn)載體轉(zhuǎn)換,屬于更高層次的古籍?dāng)?shù)字化。隨著計(jì)算機(jī)智能化程度的提高,將來(lái)還有可能產(chǎn)生利用計(jì)算機(jī)技術(shù)進(jìn)行古籍自動(dòng)編纂、自動(dòng)注釋、自動(dòng)???、自動(dòng)斷句標(biāo)點(diǎn)等智能化整理技術(shù)。目前所談的古籍?dāng)?shù)字化多半是廣義上的,本文討論的古籍?dāng)?shù)字化也是如此。
古籍整理者,是對(duì)原有的古籍作種種加工,目的是使古籍更便于今人以及后人閱讀利用,這就是古籍整理的涵義,或者可以說(shuō)是古籍整理的領(lǐng)域?!?〕古籍整理的傳統(tǒng)方法有影印、校勘、輯佚、標(biāo)點(diǎn)、注釋、今譯、索引和編纂等等。許逸民《古籍與古籍整理(代自序)》談及古籍整理目前通常采用的方式時(shí),將古籍?dāng)?shù)字化與影印、點(diǎn)校、注釋、輯佚、索引、編纂等古籍整理傳統(tǒng)方法并列?!?〕
古籍?dāng)?shù)字化包括古籍書目信息數(shù)字化和古籍內(nèi)容數(shù)字化,古籍?dāng)?shù)字化產(chǎn)品則可分為書目數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)和圖文數(shù)據(jù)庫(kù)等類型。古籍書目的數(shù)字化需要運(yùn)用古籍目錄學(xué)、版本考證與辨?zhèn)蔚裙偶韺I(yè)知識(shí),也牽涉到編纂、索引等古籍整理方法。古籍原文圖像數(shù)字化則需要選擇底本,可以認(rèn)為是印刷版階段“影印本”的數(shù)字化,與古籍善本縮微膠片以及影印版古籍有相似之處。古籍原文的文字?jǐn)?shù)字化還涉及校勘、注釋、今譯、斷句與標(biāo)點(diǎn)等古籍整理傳統(tǒng)方法。由此可見(jiàn),無(wú)論何種形式與內(nèi)容的古籍?dāng)?shù)字化均必須運(yùn)用古籍整理的傳統(tǒng)方法。古籍?dāng)?shù)字化并不是單一的、全新的古籍整理方法,而是計(jì)算機(jī)信息技術(shù)時(shí)代古籍整理種種傳統(tǒng)方法在實(shí)現(xiàn)形式上的數(shù)字化革新。
至于古籍?dāng)?shù)字化的性質(zhì),專家學(xué)者均認(rèn)為是利用計(jì)算機(jī)信息技術(shù)對(duì)古籍進(jìn)行加工、整理與研究,對(duì)古籍信息進(jìn)行的數(shù)字化處理,數(shù)據(jù)庫(kù)是其表現(xiàn)形式,實(shí)質(zhì)是借助數(shù)字化的手段完成古籍的影印、點(diǎn)校、注釋、輯佚、索引、編纂等一系列古籍整理工作。其中有兩層含義,一是將人工整理的成果數(shù)字化;二是智能化整理,并將整理成果數(shù)字化。故古籍?dāng)?shù)字化在本質(zhì)上是古籍整理傳統(tǒng)方法的延續(xù)與創(chuàng)新,其性質(zhì)可以說(shuō)是古籍整理數(shù)字化或自動(dòng)化。
雖然都知道古籍?dāng)?shù)字化屬于古籍整理的范疇,但在具體的古籍?dāng)?shù)字化開(kāi)發(fā)與研究過(guò)程中卻有時(shí)會(huì)出現(xiàn)認(rèn)識(shí)偏差。如談到古籍?dāng)?shù)字化的建設(shè)問(wèn)題時(shí),經(jīng)常有人提及漢字字符集和文字錄入等技術(shù)問(wèn)題。糾結(jié)于這個(gè)問(wèn)題表明并沒(méi)有領(lǐng)會(huì)古籍?dāng)?shù)字化的古籍整理性質(zhì)。根據(jù)古籍整理的原則,古籍全文錄入,多半要將原文中的異體字、俗字、古今字、通假字、避諱字等改為規(guī)范的漢字,以便讀者閱讀和利用。若依古籍原文錄入,不過(guò)是依葫蘆畫瓢而已,沒(méi)有實(shí)際意義,也不符合古籍整理的精神。
當(dāng)今諸多古籍?dāng)?shù)字化成果所起到的作用及實(shí)際效果如何呢?首先需要看一下古籍?dāng)?shù)字化開(kāi)發(fā)群體從事古籍?dāng)?shù)字化的動(dòng)機(jī),其次了解古籍?dāng)?shù)字化成果的現(xiàn)狀及使用情況。
古籍?dāng)?shù)字化開(kāi)發(fā)群體指從事古籍?dāng)?shù)字化建設(shè)或制作的機(jī)構(gòu)或個(gè)人,可分為古籍收藏機(jī)構(gòu)、學(xué)術(shù)研究機(jī)構(gòu)和商業(yè)機(jī)構(gòu)三大類別。王立清將其細(xì)分為圖書館、學(xué)術(shù)科研機(jī)構(gòu)、出版社、數(shù)字公司、個(gè)人、聯(lián)合體等類型,并認(rèn)為各類型的主體性質(zhì)不同,扮演的角色各異,古籍?dāng)?shù)字化的目的不同?!?〕其實(shí)質(zhì)是古籍?dāng)?shù)字化的動(dòng)機(jī)不同。圖書館、博物館、檔案館等作為古籍收藏機(jī)構(gòu),進(jìn)行的古籍?dāng)?shù)字化是館藏資源數(shù)字化,具有保存收藏的性質(zhì);文史哲類學(xué)術(shù)研究機(jī)構(gòu)以學(xué)術(shù)研究為目的進(jìn)行古籍?dāng)?shù)字化;出版社、數(shù)字公司等企業(yè)與個(gè)人即以商業(yè)性或贏利性為目的。也有傳統(tǒng)文化愛(ài)好者及宗教界人士?jī)H以個(gè)人喜好來(lái)從事古籍?dāng)?shù)字化,但所占比例極小。
中國(guó)古籍文獻(xiàn)資源數(shù)字化建設(shè)成就卓著,代表性成果有:《四庫(kù)全書》、《四部叢刊》、《古今圖書集成》、《國(guó)學(xué)定典》、《中國(guó)基本古籍庫(kù)》、《二十五史》等?,F(xiàn)有古籍?dāng)?shù)字化成果絕大多數(shù)是由迪志、書同文、超星、龍語(yǔ)翰堂、國(guó)學(xué)網(wǎng)等企業(yè)或個(gè)人出于贏利性或商業(yè)性目的制作完成的,故其成果或者產(chǎn)品的使用不具有公益性,且價(jià)格不菲,動(dòng)輒上萬(wàn)、甚至上百萬(wàn)元?!?〕
自孔子刪《詩(shī)》、劉向校書以至當(dāng)今信息技術(shù)條件下的古籍?dāng)?shù)字化,均是從利用和保護(hù)文獻(xiàn)的目的出發(fā)。具體來(lái)講,古籍書目數(shù)字化便于用戶檢索、發(fā)現(xiàn)特定古籍,古籍圖像數(shù)字化和古籍全文數(shù)字化更便于用戶檢索、發(fā)現(xiàn)、識(shí)別和獲取特定古籍內(nèi)容。
特別是古籍全文數(shù)字化一般具備基于超鏈接設(shè)計(jì)的瀏覽閱讀環(huán)境、強(qiáng)大的檢索功能和研究支持功能,面向的用戶多為學(xué)術(shù)研究人員,其實(shí)際作用如何呢?臺(tái)灣唐史研究專家賴瑞和在《唐代基層文官·自序》中這樣說(shuō):“市面上和網(wǎng)上的《全唐詩(shī)》電子文庫(kù)很多,但多為簡(jiǎn)體字版,且校對(duì)欠佳,又無(wú)卷數(shù)頁(yè)數(shù),都不合學(xué)術(shù)用途。最合乎學(xué)界需要,校對(duì)精細(xì),且以繁體字制作的,據(jù)我所知就只有陳教授這一套了”〔8〕。這番話應(yīng)該可以代表學(xué)術(shù)研究群體對(duì)當(dāng)今古籍?dāng)?shù)字化產(chǎn)品的基本認(rèn)識(shí),也體現(xiàn)了古籍?dāng)?shù)字化的實(shí)際作用。古籍?dāng)?shù)字化成果之所以不符合學(xué)術(shù)用途,是因?yàn)閺氖鹿偶當(dāng)?shù)字化的機(jī)構(gòu)與個(gè)人在古籍?dāng)?shù)字化建設(shè)過(guò)程中沒(méi)有嚴(yán)格遵循古籍整理的方法與程序。一些數(shù)字化公司和單位,為了追求利潤(rùn)的最大化,對(duì)古籍?dāng)?shù)字化過(guò)程后的文獻(xiàn)??背绦?,往往淡化或者省略?!?〕古籍?dāng)?shù)字化成果的制作過(guò)程與表現(xiàn)形式多方面不符合古籍整理的原則,沒(méi)有相當(dāng)于序跋、凡例和附錄之類的古籍?dāng)?shù)字化說(shuō)明。用戶不知道數(shù)字化所采用的古籍版本,也不清楚如何更好利用這件學(xué)術(shù)利器,自然就不能很好地滿足研究需求,更談不上使學(xué)術(shù)研究人員少受“上窮碧落下黃泉,動(dòng)手動(dòng)腳找資料”之苦。
古籍?dāng)?shù)字化成果的開(kāi)發(fā)群體多為學(xué)術(shù)研究人員,使人產(chǎn)生古籍?dāng)?shù)字化是為學(xué)術(shù)研究服務(wù),而非供大眾消遣的余興節(jié)目的認(rèn)識(shí)?!?0〕計(jì)算機(jī)環(huán)境下的多媒體技術(shù)的發(fā)展,為歷史知識(shí)、傳統(tǒng)文化的普及提供了前所未有、極具吸引力的表現(xiàn)手段。〔11〕大眾群體通過(guò)閱讀古籍來(lái)汲取傳統(tǒng)文化精華,弘揚(yáng)傳統(tǒng)文化,這才是古籍?dāng)?shù)字化利用真正應(yīng)該起到的社會(huì)作用。古籍?dāng)?shù)字化更應(yīng)該為素質(zhì)教育、普及傳統(tǒng)文化服務(wù)。目前從事古籍?dāng)?shù)字化的機(jī)構(gòu)與個(gè)人可嘗試開(kāi)發(fā)蒙學(xué)經(jīng)典與古典名著方面的多媒體古籍?dāng)?shù)字化產(chǎn)品,并將之應(yīng)用到中小學(xué)義務(wù)教育和各類國(guó)民文化素質(zhì)教育等領(lǐng)域中去。
古籍?dāng)?shù)字化學(xué)術(shù)研究服務(wù)質(zhì)量不佳,說(shuō)明當(dāng)前從事古籍?dāng)?shù)字化建設(shè)的研發(fā)機(jī)構(gòu)與個(gè)人對(duì)古籍?dāng)?shù)字化的古籍整理實(shí)質(zhì)重視不夠;大眾閱讀服務(wù)欠缺,表明研發(fā)機(jī)構(gòu)沒(méi)有從一定廣度和深度上真正領(lǐng)會(huì)古籍整理的社會(huì)作用。從事古籍?dāng)?shù)字化研究開(kāi)發(fā)的機(jī)構(gòu)和個(gè)人應(yīng)認(rèn)真思考這個(gè)問(wèn)題,使古籍?dāng)?shù)字化走上健康發(fā)展之路。
1.耿元驪.三十年來(lái)中國(guó)古籍?dāng)?shù)字化研究綜述.〔2012-10-06〕.http://www.guoxue.com/wk/000652.htm
2.吳夏平.古籍?dāng)?shù)字化與學(xué)術(shù)異化.山西師大學(xué)報(bào)(社會(huì)科學(xué)版),2012(5):131-135
3.張軸材.典籍?dāng)?shù)字化與搜索:源與流,深與淺.〔2012-10-06〕.http://www.guoxue.com/zt/gjszh/yjwz_027.htm
4.黃永年.古籍整理概論.上海:上海書店出版社,2001:5
5.許逸民.古籍整理釋例.北京:中華書局,2011:12
6.王立清.關(guān)于多元古籍?dāng)?shù)字化主體的探討.圖書館學(xué)研究,2011(4):53-58
7.康琳.?dāng)?shù)字化古籍軟件的成就及面臨問(wèn)題.科技創(chuàng)新導(dǎo)報(bào),2007(36):121-122
8.賴瑞和.唐代基層文官.北京:中華書局,2008:5
9.李玉安.對(duì)現(xiàn)階段古籍?dāng)?shù)字化中的思考——兼論古籍?dāng)?shù)字化中國(guó)家行為的重要性.〔2012 -10 -06〕.http://www.guoxue.com/wk/000651.htm
10.史睿.?dāng)?shù)字化條件下古籍整理的基本問(wèn)題(論綱).〔2012-1120〕.http://www.nlc.gov.cn/old/old/wijls/htm1/8_07.htm
11.李國(guó)新.中國(guó)古籍資源數(shù)字化的進(jìn)展與任務(wù).大學(xué)圖書館學(xué)報(bào),2002(1):21-26