●張稚鯤,李文林
(南京中醫(yī)藥大學(xué) 圖書館,南京 210046)
古籍?dāng)?shù)字化建設(shè)是指通過現(xiàn)代信息技術(shù)處理古籍文獻(xiàn),以達(dá)到既便于保存又利于使用的目的。我國(guó)古籍?dāng)?shù)字化建設(shè)研究的歷史并不長(zhǎng),根據(jù)中國(guó)知網(wǎng)的數(shù)據(jù),第一篇對(duì)古籍?dāng)?shù)字化建設(shè)提出設(shè)想的論文發(fā)表于1988年,[1]而第一篇對(duì)古籍?dāng)?shù)字化建設(shè)提出具體實(shí)施方案的論文發(fā)表于1989年。其后,相關(guān)研究論文逐漸增多。近10年來,古籍?dāng)?shù)字化建設(shè)已取得不少成果。為便于回顧與總結(jié),達(dá)到了解現(xiàn)狀、發(fā)現(xiàn)問題,使已發(fā)表成果能夠更好地為相關(guān)部門的工作與研究提供參考與借鑒,本文以中國(guó)知網(wǎng)和維普科技期刊全文數(shù)據(jù)庫的相關(guān)數(shù)據(jù)源為基礎(chǔ),對(duì)2000年以來發(fā)表的古籍?dāng)?shù)字化文獻(xiàn)進(jìn)行了文獻(xiàn)計(jì)量學(xué)研究。
本文以期刊論文為數(shù)據(jù)收集對(duì)象,利用中國(guó)期刊全文數(shù)據(jù)庫檢索2000—2009年間發(fā)表在各學(xué)術(shù)期刊上的有關(guān)古籍?dāng)?shù)字化建設(shè)的文獻(xiàn),并以維普科技期刊全文數(shù)據(jù)庫為補(bǔ)充。檢索表達(dá)式為:
#1主題=數(shù)字化OR主題=電子化OR主題=機(jī)讀化OR主題=數(shù)據(jù)化OR主題=計(jì)算機(jī)
#2主題=古籍OR典籍
#3出版年=2000—2009
#4#1 AND#2 AND#3
共檢出文獻(xiàn)386篇,去除重復(fù)及不切題文獻(xiàn)41篇,共345篇。
圖1 各年度發(fā)文量趨勢(shì)
從上圖可以看出,文獻(xiàn)量呈逐年上升趨勢(shì),2004、2009年文獻(xiàn)量波動(dòng)較大,這可能與古籍?dāng)?shù)字化項(xiàng)目的階段性研究周期有關(guān)。從檢出結(jié)果中發(fā)現(xiàn),有的作者發(fā)表的多篇論文均集中在某一項(xiàng)目研究期間,之前或之后無相關(guān)論文發(fā)表,體現(xiàn)了科研課題或基金資助對(duì)文獻(xiàn)量的顯著影響。2009年文獻(xiàn)量的下降還可能與檢索時(shí)間有關(guān)。本文數(shù)據(jù)的檢索時(shí)間為2009年12月8日,在此日期之后至2010年1月1日,可能還有部分未檢出的2009年文獻(xiàn)。根據(jù)目前情報(bào)界的一致觀點(diǎn),普賴斯曲線方程中的b值近似等于文獻(xiàn)持續(xù)增長(zhǎng)率,本文計(jì)算出近10年來古籍?dāng)?shù)字化建設(shè)的文獻(xiàn)持續(xù)增長(zhǎng)率為42.7%。①羅式勝于1994年發(fā)表的《關(guān)于普賴斯曲線方程參數(shù)b的討論》一文中指出,普賴斯曲線方程中參數(shù)b近似等于文獻(xiàn)持續(xù)增長(zhǎng)率r,并介紹了b的三種取值方式。朱寧,華瑩隨后對(duì)羅氏的三種取值方式進(jìn)行了驗(yàn)證,得出以-1 (r≈b) 為公式計(jì)算文獻(xiàn)持續(xù)增長(zhǎng)率誤差最小。1997年,劉莉?qū)υ摴竭M(jìn)行了更正,指出正確的計(jì)算公式應(yīng)為-1 (b≈r)。本文所計(jì)算的文獻(xiàn)持續(xù)增長(zhǎng)率是根據(jù)劉莉的公式計(jì)算而得。[2-4]故總體來說,論文量逐年上升的趨勢(shì)還是較為顯著的,說明數(shù)字化建設(shè)是近10年來古籍整理的主要發(fā)展方向。
地區(qū)分布數(shù)據(jù)采集自古籍?dāng)?shù)字化論文的作者機(jī)構(gòu)所在地。全國(guó)共有29個(gè)省、直轄市或自治區(qū)有相關(guān)研究成果發(fā)表,區(qū)域覆蓋面廣,具體來說,東北有黑龍江、吉林、遼寧;西北有陜西、甘肅、寧夏、青海;華北有北京、河北、天津、山西、內(nèi)蒙古;華中地區(qū)有河南、湖北、湖南;華東有江蘇、山東、安徽、浙江、上海、福建、江西;華南有廣東、海南;西南地區(qū)有四川、重慶、云南、貴州、西藏。
從我國(guó)各地區(qū)發(fā)文量來看,華東、華北地區(qū)為古籍?dāng)?shù)字化研究的主要地區(qū),兩地區(qū)所產(chǎn)生的文獻(xiàn)量之和占全部文獻(xiàn)量的50%。華東為我國(guó)東部沿海的6省1市,經(jīng)濟(jì)、科技發(fā)展水平較高,整體實(shí)力較強(qiáng),其古籍?dāng)?shù)字化研究論文居全國(guó)之首,數(shù)據(jù)主要來自江蘇、山東、浙江、上海;華北為我國(guó)北部的2省2市1區(qū),與華東相比,地區(qū)發(fā)展不均衡,古籍?dāng)?shù)字化建設(shè)的數(shù)據(jù)主要來自北京,占華北地區(qū)發(fā)文量的近80%。
從全國(guó)各省、直轄市的發(fā)文情況來看,發(fā)文在10篇及以上的省、市較多,共13個(gè),分別為北京、江蘇、廣東、甘肅、河南、湖北、遼寧、四川、山東、浙江、上海、陜西、黑龍江。發(fā)文總計(jì)305篇,占2000年以來古籍?dāng)?shù)字化建設(shè)研究論文總量的88.4%。說明近10年來,我國(guó)古籍?dāng)?shù)字化建設(shè)開展的范圍較廣,涉及區(qū)域較多,數(shù)字化建設(shè)已成為各省、市古籍整理的重要途徑。在全國(guó)的省、直轄市中,北京最為突出,發(fā)文63篇,占18.26%,在全國(guó)古籍?dāng)?shù)字化建設(shè)中起著主導(dǎo)作用。這與參與到古籍?dāng)?shù)字化建設(shè)中的在京高校及科研院所較多有關(guān),如北京大學(xué)、清華大學(xué)、北京師范大學(xué)、北京航空航天大學(xué)、中國(guó)人民大學(xué)、中國(guó)科學(xué)院、中國(guó)農(nóng)業(yè)科學(xué)院、中國(guó)中醫(yī)科學(xué)院等。另外,一些著名的大型古籍?dāng)?shù)字化項(xiàng)目也多由在京高?;蚩蒲性核鞒?。如北京大學(xué)劉俊文教授主持的《中國(guó)基本古籍庫》,收錄先秦至民國(guó)期間古籍1萬種,被列為中國(guó)“全國(guó)高等院校古籍整理研究工作委員會(huì)重點(diǎn)項(xiàng)目”和中國(guó)“國(guó)家重點(diǎn)電子出版物‘十五’規(guī)劃項(xiàng)目”,是目前最具影響的古籍?dāng)?shù)據(jù)庫之一。
從作者的發(fā)文量可以了解某一研究領(lǐng)域的核心研究人員。近10年來共有387位作者(含合作者)發(fā)表了古籍?dāng)?shù)字化建設(shè)方面的文獻(xiàn),其中發(fā)文量最多的為23篇,發(fā)表兩篇及以上者56人,僅發(fā)表1篇的有331人。
表1 古籍?dāng)?shù)字化建設(shè)的論文作者發(fā)文量
根據(jù)普賴斯定律,核心作者的最小發(fā)文量等于最高產(chǎn)作者論文數(shù)平方根的0.749倍,即:
M=0.749(nmax)1/2
式中“nmax”為最高產(chǎn)作者發(fā)文篇數(shù)。本次研究中M=3.592,取整后為4。也就是說,可將發(fā)文在4篇及以上者確定為古籍?dāng)?shù)字化建設(shè)的核心研究人員。他們是毛建軍、符永馳、單廣榮、包和平、王立清、李明杰、李斌、侯漢清、曹玲。毛建軍為南京大學(xué)博士研究生,可以看出,其研究方向即為古籍?dāng)?shù)字化建設(shè),發(fā)文量達(dá)23篇;符永馳、李斌為中國(guó)中醫(yī)科學(xué)院醫(yī)學(xué)信息研究所的研究人員,主要研究領(lǐng)域?yàn)橹嗅t(yī)古籍資源的數(shù)字化研究。單廣榮來自西北民族大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,主要研究領(lǐng)域?yàn)閿?shù)字化處理的相關(guān)技術(shù)。包和平為大連民族大學(xué)圖書館館長(zhǎng),主要從事民族文獻(xiàn)的研究工作。李明杰為武漢大學(xué)信息管理學(xué)院研究人員,主要從事版本學(xué)、古籍文獻(xiàn)數(shù)字化等研究。侯漢清、曹玲為南京農(nóng)業(yè)大學(xué)信息管理系研究人員,兩人系師生關(guān)系,故二人的研究領(lǐng)域是一致的,均為農(nóng)業(yè)古籍的數(shù)字化研究。9位核心作者有7位來自高校,體現(xiàn)了高校在古籍?dāng)?shù)字化建設(shè)中的中堅(jiān)作用。在來自高校的作者中,王立清等4人均來自信息管理學(xué)院,說明信息管理學(xué)院在高校古籍?dāng)?shù)字化研究中占有相當(dāng)重要的地位。從作者所屬專業(yè)來看,涉及中文、農(nóng)業(yè)、中醫(yī)、民族文獻(xiàn)等領(lǐng)域,暗示這些領(lǐng)域是古籍?dāng)?shù)字化建設(shè)的核心領(lǐng)域。
表2 古籍?dāng)?shù)字化建設(shè)研究論文第一作者發(fā)文量
一般認(rèn)為,第一作者對(duì)科學(xué)研究的貢獻(xiàn)不同于其他作者。本文去除合作者后,對(duì)266位第一作者也利用普賴斯定律進(jìn)行了研究,結(jié)果M=2.9,取整后為3。即發(fā)文3篇及以上者屬核心作者群作者,共12人,分別為毛建軍、包和平、符永馳、王立清、李明杰、常春、陳陽、龔婭君、裴麗、潘德利、徐清、鄭永曉。前5位作者也同時(shí)屬于全體作者統(tǒng)計(jì)中的核心作者群,后7位作者分別來自中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所、北京大學(xué)新聞與傳播學(xué)院、浙江中醫(yī)藥大學(xué)圖書館、黑龍江中醫(yī)藥大學(xué)圖書館、沈陽師范大學(xué)圖書館、杭州師范學(xué)院圖書館以及中國(guó)科學(xué)院文學(xué)研究所。作者來源機(jī)構(gòu)仍以高校和科研院所為主,作者專業(yè)同樣主要涉及中文、中醫(yī)、農(nóng)業(yè)、民族文獻(xiàn)等學(xué)科。來自高校的文學(xué)院、中文系以及文學(xué)研究所的核心作者數(shù)據(jù)較多,說明中文專業(yè)的研究人員研究力量較強(qiáng),對(duì)古籍?dāng)?shù)字化建設(shè)的貢獻(xiàn)較大。12位核心作者中,5位來自高校圖書館,與全體作者為數(shù)據(jù)基礎(chǔ)的核心作者群相比,圖書館力量明顯增強(qiáng),說明高校圖書館在古籍?dāng)?shù)字化建設(shè)中的核心地位。近年來,隨著古籍申遺及對(duì)古籍保護(hù)等各方面重視程度的提高,高校圖書館所獲立項(xiàng)的古籍研究項(xiàng)目日漸增多,其研究人員在項(xiàng)目研究中較多地以主導(dǎo)者,而非合作者的身份承擔(dān)研究任務(wù),故第一作者數(shù)據(jù)較多。
普賴斯定律指出,核心作者群所發(fā)表的論文數(shù)之和應(yīng)達(dá)到相關(guān)論文總量的50%左右。本次研究中,以全體作者及第一作者為數(shù)據(jù)基礎(chǔ)得到的核心作者群發(fā)文量之和分別占18%、19.5%,均未達(dá)到普賴斯定律所要求的比例。暗示真正長(zhǎng)期而穩(wěn)定的核心作者群尚未形成,這可能與我國(guó)古籍?dāng)?shù)字化建設(shè)的發(fā)展歷史較短、相關(guān)研究涉及多個(gè)學(xué)科有關(guān)。
在全部作者的統(tǒng)計(jì)結(jié)果中,單廣榮、李斌、侯漢清、曹玲4位屬核心作者群,但在以第一作者為數(shù)據(jù)基礎(chǔ)的核心作者群中,沒有這4位作者。通過文獻(xiàn)調(diào)研發(fā)現(xiàn),這4位作者或?yàn)閷?dǎo)師型作者,或與導(dǎo)師同屬某一研究團(tuán)隊(duì),合作研究較多,其主要貢獻(xiàn)除自已撰寫相關(guān)論文外,還指導(dǎo)他人,或與他人合作從事相關(guān)領(lǐng)域的研究,是重要的研究力量之一。因此,認(rèn)定其為核心作者并無矛盾之處。
總體來說,第一作者與全體作者的統(tǒng)計(jì)數(shù)據(jù)分析結(jié)果具有一致性,均能較好地反映古籍?dāng)?shù)字化建設(shè)核心人員及其研究背景、學(xué)科專業(yè)等方面信息。同時(shí)對(duì)全體作者和第一作者進(jìn)行統(tǒng)計(jì)與分析,所得出的信息既可兼顧全面性,又可準(zhǔn)確揭示個(gè)體信息,在進(jìn)行深入研究時(shí),應(yīng)采用這種方法。相比較而言,以全體作者為基礎(chǔ)進(jìn)行的作者分析可以較為全面地反映某項(xiàng)研究的各方面力量的概況,對(duì)于多學(xué)科交叉的研究項(xiàng)目來說更為適合。而以第一作者為數(shù)據(jù)基礎(chǔ)進(jìn)行的作者分析可以更為客觀、準(zhǔn)確地反映個(gè)體或某一股力量在某項(xiàng)研究中的情況。當(dāng)對(duì)作者的統(tǒng)計(jì)與研究目的側(cè)重于整體分析時(shí),既可以以全體作者為基礎(chǔ)進(jìn)行統(tǒng)計(jì)分析,也可以忽略合作者,僅以第一作者為數(shù)據(jù)基礎(chǔ)進(jìn)行統(tǒng)計(jì)分析。
根據(jù)作者所屬的單位或機(jī)構(gòu)可以全面了解承擔(dān)古籍?dāng)?shù)字化建設(shè)的各方面力量。近10年來,古籍?dāng)?shù)字化建設(shè)的研究主要由高校、公共圖書館、科研院所承擔(dān)。在高校,圖書館所占有的古籍資源最為豐富,對(duì)其進(jìn)行合理的保護(hù)與開發(fā)是圖書館的重要工作之一。而信息管理學(xué)院多涉及信息資源管理與利用等方面研究,不少信息管理學(xué)院本身就是由原圖書館學(xué)系發(fā)展而來,古籍?dāng)?shù)字化研究是其學(xué)科研究?jī)?nèi)容之一;中文系的研究人員多具有扎實(shí)的古文獻(xiàn)學(xué)知識(shí),古籍文獻(xiàn)的版本、內(nèi)容、校勘是其主要研究?jī)?nèi)容之一,這股力量可為數(shù)字化建設(shè)提供內(nèi)容上的質(zhì)量保障;計(jì)算機(jī)與信息技術(shù)學(xué)院是古籍?dāng)?shù)字化建設(shè)必不可少的一支力量。如果說在古籍?dāng)?shù)字化建設(shè)者中,圖書館是以其資源及大量的人員投入、信息管理學(xué)院及中文系是以其學(xué)科專業(yè)及研究?jī)?nèi)容與古籍?dāng)?shù)字化發(fā)生密切關(guān)系的話,計(jì)算機(jī)與信息技術(shù)學(xué)院則是以其技術(shù)占據(jù)十分重要的地位,此類機(jī)構(gòu)的特點(diǎn)是常作為重要的合作力量參與到古籍?dāng)?shù)字化建設(shè)中,提供技術(shù)支持與保障。
古籍?dāng)?shù)字化建設(shè)的另一類重要機(jī)構(gòu)為科研院所。此類機(jī)構(gòu)具有人員、資源、資金等多方優(yōu)勢(shì),不少科研院所還承擔(dān)相關(guān)專業(yè)研究生培養(yǎng)的任務(wù),常常是以團(tuán)隊(duì)的模式進(jìn)行研究的,所承擔(dān)的科研課題亦較多,其研究更具針對(duì)性,是一支不可或缺的重要研究力量。近10年來,國(guó)內(nèi)古籍?dāng)?shù)字化建設(shè)研究力量較強(qiáng)的科研院所主要有中國(guó)中醫(yī)科學(xué)院、中國(guó)農(nóng)業(yè)科學(xué)院、中國(guó)科學(xué)院、中國(guó)社會(huì)科學(xué)院等。
公共圖書館是另一股重要力量,表現(xiàn)較為突出的有國(guó)家圖書館、廣東省中山圖書館、貴州省圖書館、陜西省圖書館、安徽省圖書館、南京圖書館、上海圖書館等,縣級(jí)及以下圖書館幾乎沒有相關(guān)數(shù)據(jù),說明該項(xiàng)研究主要由國(guó)家、省市級(jí)圖書館承擔(dān)。
所檢出的345篇文獻(xiàn)來自166種期刊,根據(jù)美國(guó)文獻(xiàn)計(jì)量學(xué)家高夫曼(Goffman) 對(duì)布拉德福定律(Bradford Law)的解釋,刊載某一主題的最小核心期刊量的計(jì)算公式為:
L=A/m
其中A為論文總量,m為期刊最大分區(qū)值,本次研究中L=3.2,取整后為4,也就是說,可以將刊載論文數(shù)在4篇及以上的期刊確定為核心區(qū)內(nèi)期刊,如下表:
表3 刊載古籍?dāng)?shù)字化建設(shè)論文的核心期刊群
以上26種期刊占相關(guān)期刊總量的15.7%,刊載古籍?dāng)?shù)字化研究論文167篇,占相關(guān)論文總量的48.4%,為這一領(lǐng)域的核心期刊群。核心期刊群中,圖書館學(xué)、情報(bào)學(xué)專業(yè)期刊占絕大多數(shù),說明刊載相關(guān)論文的期刊具有明顯的學(xué)科傾向。其優(yōu)點(diǎn)是有利于學(xué)科內(nèi)的學(xué)術(shù)交流,缺點(diǎn)是信息交流具有局限性,對(duì)于需要多學(xué)科支持的研究主題來說,不利于擴(kuò)大影響面,吸收潛在的研究力量。核心期刊群涵蓋的期刊較多,暗示古籍?dāng)?shù)字化建設(shè)的涉及面廣泛,其研究成果在圖情專業(yè)期刊中被廣泛接受。在26種期刊中,被《中文核心期刊要目總覽》和CSSCI收錄的期刊論文占相關(guān)論文總量的21%,說明古籍?dāng)?shù)字化建設(shè)已有相當(dāng)一部分研究成果具有較高的學(xué)術(shù)價(jià)值。從期刊的學(xué)科專業(yè)來看,農(nóng)業(yè)及醫(yī)學(xué)專業(yè)期刊較為突出,《農(nóng)業(yè)圖書情報(bào)學(xué)刊》載文量居首位,而醫(yī)學(xué)類則有《中國(guó)中醫(yī)藥信息雜志》《中華醫(yī)學(xué)圖書情報(bào)雜志》兩種期刊入圍核心期刊群。說明,與其他學(xué)科相比,農(nóng)業(yè)古籍及中醫(yī)古籍?dāng)?shù)字化建設(shè)具有較為穩(wěn)定而長(zhǎng)期的延續(xù)性工作,已擁有刊載本學(xué)科成果的較為固定的期刊。
古籍?dāng)?shù)字化建設(shè)涉及多個(gè)學(xué)科,用于刊載其研究成果的期刊范圍應(yīng)更為廣泛。高校是古籍?dāng)?shù)字化建設(shè)的主要力量之一,同時(shí)又是數(shù)字化成果的主要使用對(duì)象之一,但刊載相關(guān)研究成果的核心期刊群中未有一種為大學(xué)學(xué)報(bào)。在全部166種期刊中,有34種屬大學(xué)學(xué)報(bào),但所刊載的論文總量?jī)H35篇,也就是說,除一種大學(xué)學(xué)報(bào)在10年中刊載過2篇古籍?dāng)?shù)字化論文外,其余33種期刊僅刊載過1篇,說明大學(xué)學(xué)報(bào)對(duì)古籍?dāng)?shù)字化研究成果的接納程度較低。大學(xué)學(xué)報(bào)是古籍?dāng)?shù)字化建設(shè)的一個(gè)窗口,應(yīng)該為更多的圖書館學(xué)科以外的潛在的數(shù)字化研究人員提供了解該項(xiàng)工作的途徑,進(jìn)而參與到古籍?dāng)?shù)字化建設(shè)中,充實(shí)數(shù)字化建設(shè)隊(duì)伍,提供技術(shù)支持,提升數(shù)字化建設(shè)水平。遺憾的是,這一窗口多年來幾乎處于關(guān)閉狀態(tài)。
345篇文獻(xiàn)中,共標(biāo)注關(guān)鍵詞508個(gè),總頻次1002次。除去在關(guān)鍵詞中出現(xiàn)頻率極高的“古籍”“數(shù)字化”“數(shù)據(jù)庫”等詞外,通過對(duì)所標(biāo)注關(guān)鍵詞進(jìn)行分類處理,可以揭示古籍?dāng)?shù)字化建設(shè)的現(xiàn)狀、問題、趨勢(shì)等內(nèi)容特征。
2.6.1 古籍?dāng)?shù)據(jù)庫建設(shè)的類型
從已標(biāo)關(guān)鍵詞的頻次來看,近10年來,我國(guó)古籍?dāng)?shù)字化建設(shè)以書目數(shù)據(jù)庫為主,全文數(shù)據(jù)庫建設(shè)起步較晚,但近年有增多趨勢(shì),表明全文數(shù)據(jù)庫建設(shè)是今后古籍?dāng)?shù)字化建設(shè)的發(fā)展方向。檢出文獻(xiàn)中,對(duì)圖像型、文本型及圖文對(duì)照型古籍全文數(shù)據(jù)庫的探討均有涉及。圖像型古籍全文數(shù)據(jù)庫可較好地反映古籍原貌,但不便于檢索;文本型雖利于檢索,但無法較好地反映古籍全貌,目前傾向性觀點(diǎn)是圖文對(duì)照開發(fā)古籍?dāng)?shù)據(jù)庫,這樣既可保留古籍原貌,又具有較好的檢索功能,是古籍全文數(shù)據(jù)庫建設(shè)的方向。
2.6.2 古籍?dāng)?shù)字化建設(shè)的地區(qū)特色
與地區(qū)有關(guān)的關(guān)鍵詞有粵、港、云南、臺(tái)灣、寧夏、四川、西藏、海南等,說明這些地區(qū)的古籍?dāng)?shù)字化建設(shè)具有特色,值得關(guān)注。如臺(tái)灣,是較早開始古籍?dāng)?shù)字化研究的地區(qū),早在20世紀(jì)80年代初期,臺(tái)灣中央大學(xué)就將館藏善本制成機(jī)讀目錄。[2]1984年,臺(tái)灣中央研究院又開始研制瀚典全文檢索數(shù)據(jù)庫,目前,該庫已成為全球最大的漢籍資料庫。而且,臺(tái)灣所使用的字符編碼系統(tǒng)在字符處理與轉(zhuǎn)換上較大陸的更易于兼容,因此,相關(guān)的技術(shù)阻礙及瓶頸較少,古籍?dāng)?shù)字化建設(shè)的步伐較快,其數(shù)字化成果具有規(guī)模大,共享度高的特點(diǎn),是目前通過網(wǎng)絡(luò)提供中文古籍資源最多的地區(qū)。[3]
2.6.3 古籍?dāng)?shù)字化的共建共享
有些文章對(duì)古籍資源的整合及合作開發(fā)等提出了具體的建議,如對(duì)于藏書量少,保存條件差的圖書館,應(yīng)采用贈(zèng)送、有償出讓、代管等途徑委托有開發(fā)能力的圖書館進(jìn)行數(shù)字化開發(fā),以原館享有所有權(quán)、代管圖書館享有查閱權(quán)的形式解決成果歸屬與利用問題;[4]對(duì)于有相同專業(yè)特色的高校圖書館可以考慮走聯(lián)合建庫的道路,通過信息整合完成數(shù)字化項(xiàng)目的建設(shè)。
與近幾年古籍合作共建共享項(xiàng)目有關(guān)的關(guān)鍵詞主要涉及CADAL、CALIS、JALIS。CADAL(China-America Digital Academic Library,中英文圖書數(shù)字化國(guó)際合作計(jì)劃)是由浙江大學(xué)、中國(guó)科學(xué)院研究生院牽頭,北京大學(xué)、清華大學(xué)等14所高校共同建設(shè)的大型數(shù)字化項(xiàng)目,至2007年,用戶已可通過該門戶網(wǎng)站檢索古籍十幾萬冊(cè)。[5]CALIS(Chinese Academic Library and Information System,全國(guó)高等教育文獻(xiàn)保障體系)是目前國(guó)內(nèi)最大的共建共享體系。CALIS于2003年面向全國(guó)古籍收藏單位,正式啟動(dòng)CALIS古籍聯(lián)合編目項(xiàng)目。[6]2005年出臺(tái)《CALIS古籍聯(lián)機(jī)合作編目規(guī)則》等規(guī)范性的建設(shè)標(biāo)準(zhǔn)。[7]CALIS對(duì)共建成員采用全國(guó)中心、地區(qū)中心和成員館三級(jí)管理模式,使用Z39.50協(xié)議,以ISO 2709格式上傳/下載數(shù)據(jù),實(shí)現(xiàn)了各成員館之間資源的共建共享,為全國(guó)古籍資源的合作共建、資源共享作出了較大貢獻(xiàn)。JALIS(Jiangsu Academic Library and Information System,江蘇省高等教育文獻(xiàn)保障體系)的建設(shè)目標(biāo)是整合省內(nèi)資源,建成全省高校共建共享的文獻(xiàn)資源數(shù)字化網(wǎng)絡(luò),并與CALIS接軌,其建設(shè)的規(guī)范、標(biāo)準(zhǔn)等參照CALIS項(xiàng)目標(biāo)準(zhǔn),同時(shí)又具有地區(qū)特點(diǎn),所使用的共建平臺(tái)為江蘇匯文信息管理系統(tǒng),目前,江蘇高校該系統(tǒng)的使用率已達(dá)98%,[8]在目前省級(jí)共建共享建設(shè)中較具代表性。
2.6.4 古籍?dāng)?shù)字化建設(shè)中涉及的技術(shù)、標(biāo)準(zhǔn)及規(guī)范
與古籍?dāng)?shù)字化建設(shè)相關(guān)的技術(shù)類關(guān)鍵詞共出現(xiàn)38次,相關(guān)詞語有 Hibernate、Spring、Struts、N-gram、Unicode、XML、J2EE 、Erwin模型、JAXB、Arnold置換、Fedora、JSP等,內(nèi)容涉及古籍字、詞、句、圖等的處理及轉(zhuǎn)換技術(shù)以及開發(fā)平臺(tái)、技術(shù)標(biāo)準(zhǔn)等。例如,古籍?dāng)?shù)字化過程中字符及字庫研發(fā)一直是近10年的研究熱點(diǎn),關(guān)鍵詞“Unicode”為四字節(jié)編碼技術(shù),能夠提供21億多個(gè)碼位,可以較好地解決古籍文獻(xiàn)中生字、僻字的數(shù)字化問題,并可實(shí)現(xiàn)跨語言、跨平臺(tái)的文本轉(zhuǎn)換,是目前古籍全文數(shù)據(jù)庫的常用編碼。
跨平臺(tái)技術(shù)所涉及的標(biāo)準(zhǔn)與規(guī)范是近幾年的研究熱點(diǎn)。但從檢出文獻(xiàn)來看,近10年來,各單位在開發(fā)古籍資源時(shí),在如何選擇開發(fā)對(duì)象、開發(fā)平臺(tái)、技術(shù)標(biāo)準(zhǔn)等方面國(guó)內(nèi)仍沒有統(tǒng)一標(biāo)準(zhǔn)。對(duì)于已開發(fā)資源來說,開發(fā)機(jī)構(gòu)所選的開發(fā)平臺(tái)、字符編碼、數(shù)據(jù)存儲(chǔ)及瀏覽格式等各不相同,常造成古籍?dāng)?shù)字化成果無法兼容。另一個(gè)值得關(guān)注的問題是,古籍?dāng)?shù)字化建設(shè)中標(biāo)準(zhǔn)不一、互不兼容的現(xiàn)象還與個(gè)別以盈利為目的的數(shù)據(jù)庫開發(fā)商有關(guān),他們出于利益的考慮,已在事實(shí)上造成了信息壟斷,人為加劇了各數(shù)字化系統(tǒng)之間的不兼容狀況。所以,建立國(guó)家統(tǒng)一標(biāo)準(zhǔn),在技術(shù)上將資源對(duì)象的語義信息統(tǒng)一為元數(shù)據(jù)格式等措施已很有必要。[9]目前古籍?dāng)?shù)據(jù)庫所使用的數(shù)據(jù)格式主要有 MARC(Machine Readable Cataloging Records) 和 DC(Dublin Core Metadata)。MARC格式已有成熟的著錄標(biāo)準(zhǔn),可交換性程度高,但數(shù)據(jù)創(chuàng)建耗時(shí)長(zhǎng)、成本高。DC元數(shù)據(jù)格式簡(jiǎn)單、靈活,具有個(gè)性化,開放性等特點(diǎn),更適合網(wǎng)絡(luò)編目,不過,相配套的著錄標(biāo)準(zhǔn)和知識(shí)管理體系還有待完善。[10]為加強(qiáng)標(biāo)準(zhǔn)化管理,國(guó)家標(biāo)準(zhǔn)局早在1987年就制定了《古籍著錄規(guī)則》(該規(guī)則于2008年重新修訂,新版于2009年實(shí)施)。1996年,中國(guó)文獻(xiàn)編目規(guī)則編撰小組編撰了《中文文獻(xiàn)編目規(guī)則》。2002年,科技部委托國(guó)家科技圖書文獻(xiàn)中心協(xié)調(diào)國(guó)內(nèi)21家單位聯(lián)合開展數(shù)字圖書館的標(biāo)準(zhǔn)化研究,其中有多項(xiàng)技術(shù)規(guī)范與古籍整理有關(guān)。[11]另外,許多高校在建立古籍特色數(shù)據(jù)庫時(shí)開始遵守CALIS的建庫標(biāo)準(zhǔn),這些工作使古籍?dāng)?shù)據(jù)庫建設(shè)具有了分散對(duì)象數(shù)據(jù)和統(tǒng)一元數(shù)據(jù)集的構(gòu)架,對(duì)古籍?dāng)?shù)字化開發(fā)中涉及的技術(shù)、平臺(tái)等的規(guī)范起積極的促進(jìn)作用。[12]
2.6.5 人員素質(zhì)
345篇文獻(xiàn)中,僅有兩篇文獻(xiàn)在關(guān)鍵詞中涉及古籍?dāng)?shù)字化建設(shè)中的人員素質(zhì),說明人員素質(zhì)問題還未引起足夠的重視。不過,有些文章雖不是專篇討論人員素質(zhì),但在文中也對(duì)相關(guān)問題進(jìn)行了探討。如有文章指出,有些古籍在數(shù)字化過程中,由于建庫人員的知識(shí)局限,大量的異形字、異體字和簡(jiǎn)繁字被視為不同的漢字,生造出大量Unicode表外字,其結(jié)果是不僅增加了錄入工作量,而且直接影響到數(shù)字化古籍成果的“知識(shí)發(fā)現(xiàn)”功能。[13]
人員素質(zhì)決定事業(yè)成敗,關(guān)于古籍?dāng)?shù)字化建設(shè)中的人才素質(zhì),目前的一致觀點(diǎn)是古籍?dāng)?shù)字化人員既要具有計(jì)算機(jī)、網(wǎng)絡(luò)等現(xiàn)代信息技術(shù),又要具有較為全面的文獻(xiàn)學(xué)知識(shí)。另外,古籍特色數(shù)據(jù)庫建設(shè)還要求建設(shè)人員具有特色專業(yè)的知識(shí)背景。古籍?dāng)?shù)字化人員除應(yīng)具備以上知識(shí)外,具有較好的古籍保護(hù)知識(shí)亦至關(guān)重要,它能夠在數(shù)字化過程中最大限度地降低對(duì)古籍的損傷。[14]
從古籍?dāng)?shù)字化建設(shè)人員所需的各方面知識(shí)結(jié)構(gòu)來看,主要問題集中在古文獻(xiàn)學(xué)方面,而有關(guān)計(jì)算機(jī)、信息技術(shù)應(yīng)用方面的問題較少。因此,古文獻(xiàn)學(xué)知識(shí)應(yīng)成為人員培訓(xùn)的重點(diǎn)內(nèi)容。除此之外,建庫人員的思想素質(zhì)培訓(xùn)也十分重要,一個(gè)沒有責(zé)任心、無全局觀念及協(xié)作精神的人員,即使各方面專業(yè)知識(shí)再好,也可能無法保證工作質(zhì)量。2.6.6 其他
與國(guó)家有關(guān)的關(guān)鍵詞主要涉及日本、美國(guó),說明這兩個(gè)國(guó)家的古籍資源或古籍?dāng)?shù)字化建設(shè)值得關(guān)注。日本和美國(guó)在國(guó)內(nèi)均收藏有一定數(shù)量的中國(guó)古籍,并依賴本國(guó)的力量將其開發(fā)成數(shù)字化資源,而且起步較國(guó)內(nèi)早。如美國(guó)人P.J.Ivanhoe在1978年就利用保存在美國(guó)的中文古籍編制了《朱熹太學(xué)章句索引》等數(shù)字化書目。[15]
345篇文獻(xiàn)中有59篇論文標(biāo)注為基金成果,受到74項(xiàng)各級(jí)科研項(xiàng)目的資助,科研項(xiàng)目成果占論文總量的17.1%。從受資助單位的類別來看,80%為高校、17%為科研院所、3%為公共圖書館。說明相關(guān)研究項(xiàng)目主要由高校和科研院所承擔(dān)而高校更具有實(shí)力,為這一研究領(lǐng)域的主力軍。受資助的科研院所中,主要數(shù)據(jù)來自中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所和中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,說明這兩個(gè)單位不僅具有較強(qiáng)實(shí)力及較大研究?jī)?yōu)勢(shì),而且說明中醫(yī)古籍和農(nóng)業(yè)古籍是近10年來古籍?dāng)?shù)字化建設(shè)的兩個(gè)重點(diǎn)。
為古籍?dāng)?shù)字化建設(shè)提供資助的有國(guó)家級(jí)、部省級(jí)、市級(jí)等不同級(jí)別的科技主管部門,其中科技部及省級(jí)基金項(xiàng)目最多,其次為各高校的校級(jí)科研項(xiàng)目。說明近10年來,古籍?dāng)?shù)字化建設(shè)得到了從國(guó)家到地方的普遍重視,各類高校為開發(fā)自已的古籍資源,為沒有得到高一級(jí)科研主管部門資助的項(xiàng)目提供了校級(jí)基金支持,保證了古籍?dāng)?shù)字化建設(shè)的順利進(jìn)行。
近10年來,古籍資源的數(shù)字化建設(shè)已成為古籍整理與利用的重點(diǎn),各領(lǐng)域均有不少數(shù)字化成果研制成功并付諸使用。但不可否認(rèn)的是,很多研究成果主要刊載在圖書情報(bào)專業(yè)期刊上,大學(xué)學(xué)報(bào)對(duì)古籍?dāng)?shù)字化研究成果的接受程度普遍較低。其讀者群多為圖書館界人士,而十分需要這方面信息的其他專業(yè)的師生卻較少接觸,不少論文的實(shí)際作用并未充分發(fā)揮。故大學(xué)學(xué)報(bào)應(yīng)適應(yīng)信息時(shí)代對(duì)師生信息素質(zhì)的要求,根據(jù)各高校學(xué)科特點(diǎn),為包括古籍?dāng)?shù)字化建設(shè)在內(nèi)的圖情專業(yè)論文提供信息資源建設(shè)與利用的專欄,促進(jìn)本校或相關(guān)專業(yè)資源的充分利用與開發(fā),這也是高校有效實(shí)施信息素質(zhì)教育以及優(yōu)化資源建設(shè)的有效途徑之一。
另外,從檢出文獻(xiàn)中我們也看到,古籍資源缺少統(tǒng)籌,同一內(nèi)容的古籍資源重復(fù)開發(fā)現(xiàn)象還比較普遍,不僅造成了資源浪費(fèi),也使得更多值得開發(fā)的古籍資源由于缺少資金、人員等方面的支持而得不到開發(fā)。還有在檢出的文獻(xiàn)中,對(duì)已開發(fā)資源的共用共享問題涉及較少。其實(shí),我國(guó)的已開發(fā)古籍資源已相當(dāng)豐富,但所發(fā)揮的作用有限。目前,不少課題的研究成果(如數(shù)據(jù)庫)常止步于結(jié)題階段,下一步的利用與共享等問題少有人問津,有些已開發(fā)數(shù)據(jù)庫由于運(yùn)行成本、所有權(quán)等問題沒有得到妥善解決而被束之高閣。因此,如果能夠考慮各單位或部門之間的互用共享,將大量分散在不同機(jī)構(gòu)或課題主持人手中的已開發(fā)資源充分公開,解決版權(quán)及運(yùn)行成本等問題,實(shí)現(xiàn)信息共享,那么,人們就可以把更多的精力及財(cái)力放在還未觸及的古籍資源的數(shù)字化建設(shè)中,為人類文明的傳承作出更大的貢獻(xiàn)。
[1]曹書杰.古籍整理與電子計(jì)算機(jī)應(yīng)用研究的思考[J].古籍整理研究學(xué)刊,1988(1):44-47.
[2]羅式勝.關(guān)于普賴斯曲線方程參數(shù)b的討論[J].情報(bào)理論與實(shí)踐,1994(1):13-14.
[3]朱寧,華瑩.再談普賴斯曲線方程中b的求法[J].情報(bào)理論與實(shí)踐,1995(4):13,27.
[4]劉莉.再談普賴斯指數(shù)規(guī)律中參數(shù)b的求法——與朱寧等商榷[J].情報(bào)理論與實(shí)踐,1997,20(1):9-11.
[5]毛建軍.臺(tái)灣地區(qū)古籍書目數(shù)據(jù)庫的建設(shè)及其特點(diǎn)[J].福建圖書館理論與實(shí)踐,2007(3):58-60.
[6]許紅健.臺(tái)灣中文古籍?dāng)?shù)字化成果特色談[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2009,21(1):130-133.
[7]張偉娜,等.全國(guó)中醫(yī)古籍保存與保護(hù)現(xiàn)狀調(diào)查分析 [J].中國(guó)中醫(yī)藥信息雜志,2009,16 (6):1-4.
[8]程仁桃,楊健.高校圖書館古籍保護(hù)的現(xiàn)狀與展望[J].圖書館工作與研究,2009(8):61-63.
[9]雷順利.CALIS古籍聯(lián)機(jī)合作編目的特點(diǎn)[J].山東圖書館季刊,2008(1):54-61.
[10]吳春明,周玉陶.JALIS對(duì)江蘇地區(qū)高校圖書館數(shù)字化建設(shè)的影響[J].圖書情報(bào)工作,2006,50(2):117-119.
[11]陳得媛.古籍?dāng)?shù)字化工作統(tǒng)籌協(xié)調(diào)機(jī)制的構(gòu)建[J].中國(guó)圖書館學(xué)報(bào),2009,135(138):47-51.
[12]徐清,王唯.近十年古籍書目數(shù)據(jù)庫建設(shè)研究概述[J].圖書情報(bào)知識(shí),2006(113):37-41.
[13]藍(lán)永.論古籍整理的新方式——古籍?dāng)?shù)字化[D].濟(jì)南:山東大學(xué),2007.
[14]劉春金,等.中文古籍?dāng)?shù)字化現(xiàn)狀分析[J].江西圖書館學(xué)刊,2008(2):112-113,126.
[15]朱慧,楊興山.試論高校圖書館古籍保護(hù)工作的人才問題 [J].情報(bào)探索,2008(10):88-90.