段曉林 蔡迎春(上海師范大學(xué)圖書館 上海 200234)
?
高校圖書館民國文獻(xiàn)自建數(shù)據(jù)庫調(diào)查與分析*
段曉林 蔡迎春(上海師范大學(xué)圖書館 上海 200234)
近年來,高校圖書館充分利用和挖掘自身民國文獻(xiàn)館藏,建成館藏全文數(shù)據(jù)庫及各具特色的專題數(shù)據(jù)庫,在CALIS、CADAL等的協(xié)調(diào)和平臺支持下,民國文獻(xiàn)數(shù)據(jù)庫共享系統(tǒng)的建設(shè),也取得很大的成績。文章介紹CADAL等項目及全國20余家民國文獻(xiàn)館藏較豐富的高校圖書館數(shù)據(jù)庫建設(shè)的基本情況,指出當(dāng)前高校民國文獻(xiàn)數(shù)字化存在的問題,并提出對策建議。
民國文獻(xiàn) 自建數(shù)據(jù)庫 高校圖書館
高校圖書館是民國文獻(xiàn)的主要收藏機(jī)構(gòu)之一,北京大學(xué)、復(fù)旦大學(xué)、南京大學(xué)、武漢大學(xué)、南開大學(xué)、中山大學(xué)等高校圖書館都有一定收藏規(guī)模,近年來,高校圖書館非常重視民國文獻(xiàn)的保護(hù)、利用和開發(fā),不僅充分利用和挖掘自身館藏,建成館藏全文數(shù)據(jù)庫及各具特色的專題數(shù)據(jù)庫,在CALIS、CADAL等的協(xié)調(diào)和平臺支持下,民國文獻(xiàn)數(shù)據(jù)庫共享系統(tǒng)的建設(shè),取得很大成績。筆者根據(jù)近年來發(fā)表的文章中對民國文獻(xiàn)數(shù)據(jù)庫建設(shè)的介紹及相關(guān)線索,并通過對全國20余家民國文獻(xiàn)館藏較豐富的高校圖書館網(wǎng)站的檢索、查詢和試用,對數(shù)據(jù)庫開發(fā)建設(shè)情況進(jìn)行了逐一調(diào)研和了解。本文就調(diào)研情況,在介紹民國文獻(xiàn)數(shù)據(jù)庫建設(shè)基本概況的基礎(chǔ)上,總結(jié)當(dāng)前高校民國文獻(xiàn)數(shù)字化開發(fā)存在的問題,并提出對策建議。
“大學(xué)數(shù)字圖書館國際合作計劃”(China Academic Digital Associative Library,簡稱CADAL)是一個以數(shù)字化圖書期刊為主、覆蓋所有重點學(xué)科的學(xué)術(shù)文獻(xiàn)資源體系,其收錄的中文圖書包括珍貴古籍、民國圖書、民國期刊、博士碩士學(xué)位論文及其他特色文獻(xiàn)資源。截止2013年5月,CADAL在線發(fā)布民國期刊148674冊,民國圖書159064冊,特色資源(滿鐵、僑批等)51354冊(件)[1]。2015年,CADAL與北京時代瀚堂科技有限公司合作,共同推出“民國文獻(xiàn)大全(-1949)”數(shù)據(jù)庫,整合CADAL項目的書刊資源和北京正字典藏公司瀚堂近代報刊數(shù)據(jù)庫的報紙資源,包括民國圖書逾13萬冊,期刊2萬余種,報紙新聞與廣告條目1000萬筆[2],該數(shù)據(jù)庫內(nèi)容動態(tài)更新添加,向70家成員館提供CADAL資源的免費在線閱讀服務(wù)。
依托CADAL提供的建設(shè)平臺,部分高校成員館基于館藏的民國文獻(xiàn)數(shù)字化建設(shè)項目,也取得了一些成果。這些項目包括武漢大學(xué)圖書館“武漢大學(xué)圖書館CADAL民國珍藏庫”,囊括館藏民國圖書12725冊,民國期刊11873冊,民國學(xué)位論文1945冊;復(fù)旦大學(xué)圖書館的CADAL項目已完成全部民國期刊的數(shù)字化制作,通過“CADAL民國書刊本館鏡像”,或“CADAL民國書刊主站”,可瀏覽閱讀全文;中國農(nóng)業(yè)大學(xué)圖書館“書香記憶――舊文獻(xiàn)集萃”,也是依托CADAL項目開展的民國文獻(xiàn)數(shù)字化工作,收入民國期刊2709冊。
另外,中國高等教育文獻(xiàn)保障系統(tǒng)(China Academic Library & Information System,簡稱CALIS)組織全國高校共同建設(shè)以高等教育數(shù)字圖書館為核心的文獻(xiàn)保障體系,以全國高校專題特色數(shù)據(jù)庫項目的形式,立項支持中國人民大學(xué)“民國時期文獻(xiàn)資源庫”、北京大學(xué)“西南聯(lián)大史料數(shù)據(jù)庫”、北京郵電大學(xué)“中國近現(xiàn)代郵電史數(shù)字圖書館資料庫”、福建師范大學(xué)“民國時期福建教會大學(xué)特色文獻(xiàn)數(shù)據(jù)庫”、中山大學(xué)“(民國)嶺南高校記憶”、華南師范大學(xué)“華南師范大學(xué)民國特色珍藏文獻(xiàn)數(shù)據(jù)庫”等一批民國文獻(xiàn)的數(shù)字化開發(fā)工作。[3]
目前,中國高校人文社會科學(xué)文獻(xiàn)中心(China Academic Social Sciences and Humanities Library,簡稱CASHL)繼古文獻(xiàn)傳遞服務(wù)項目之后,也在嘗試拓展民國文獻(xiàn)傳遞服務(wù)項目,提出CASHL、CALIS、CADAL在民國文獻(xiàn)共建共享方面實現(xiàn)進(jìn)一步的融合,通力合作,協(xié)同發(fā)展,共同保障民國文獻(xiàn)的開放獲取。[4]
除CASHL、CALIS、CADAL外,一些地方區(qū)域性的資源共建共享平臺也整合了部分民國數(shù)據(jù)庫資源,如“上海地區(qū)高校優(yōu)質(zhì)資源共建共享平臺”鏈接了“復(fù)旦CADAL民國書刊”和“上海師大解放前報刊數(shù)據(jù)庫”等民國文獻(xiàn)資源,提供書目檢索和全文瀏覽。該平臺是在上海市教委組織領(lǐng)導(dǎo)下構(gòu)建的上海地區(qū)高校優(yōu)質(zhì)資源支撐平臺,實現(xiàn)了上海地區(qū)高校自建數(shù)據(jù)庫、特色資源數(shù)據(jù)庫、優(yōu)質(zhì)資源數(shù)據(jù)庫的共建共享,突破高校圖書館物理空間上的局限和特色優(yōu)質(zhì)資源僅對本校師生開放的限制,旨在更好地滿足各校師生日趨多樣化和個性化的文獻(xiàn)需求,達(dá)到優(yōu)勢互補(bǔ)、資源共享。
2.1 館藏數(shù)據(jù)庫建設(shè)
建有專門的民國文獻(xiàn)館藏書目數(shù)據(jù)庫的圖書館比較少,從各圖書館網(wǎng)頁檢索的結(jié)果來看,只有北京大學(xué)圖書館“民國舊報刊庫”、西北師范大學(xué)圖書館“解放前報刊資料書目”、上海師范大學(xué)圖書館“館藏解放前報刊題錄”以及福建師范大學(xué)的民國圖書、期刊、報紙目錄庫等為數(shù)不多的幾種,更多的圖書館是在OPAC上直接進(jìn)行檢索,但是館藏全文數(shù)據(jù)庫的建設(shè),則明顯多于書目數(shù)據(jù)庫。
北京大學(xué)圖書館“民國舊報刊庫全文數(shù)據(jù)庫”在目錄庫的基礎(chǔ)上持續(xù)建設(shè)中,截止2013年5月,發(fā)布4174種,34019冊期刊,619385篇文章;南京大學(xué)圖書館自建有“南大圖書館館藏民國圖書數(shù)據(jù)庫”和“南大圖書館館藏民國期刊數(shù)據(jù)庫”,分別收入民國圖書2497種,民國期刊27835冊;中國人民大學(xué)圖書館“民國時期圖書資源庫”及“民國時期期刊資源庫”,分別收錄館藏民國時期圖書數(shù)據(jù)48684種,期刊5815種。另外,“民國時期文獻(xiàn)資源庫”收錄館藏民國時期的圖書、期刊、報紙以及民國時期的著名學(xué)者和相關(guān)書評23000多條,中文期刊創(chuàng)刊號2400余種;北京師范大學(xué)圖書館“民國圖書全文庫”、“中文珍稀期刊題錄庫”,分別收入民國圖書11822種,期刊283種,但后者只是一個題錄庫而非全文庫;華南師范大學(xué)圖書館“民國圖書”,收入以館藏為基礎(chǔ)的13萬種民國圖書全文影像資源;廣西師范大學(xué)圖書館“館藏廣西民國圖書數(shù)據(jù)庫”,收錄231條全文數(shù)據(jù);上海交通大學(xué)圖書館“民國報刊數(shù)據(jù)庫”采取邊建設(shè)邊服務(wù)的方式,目前收入民國報刊數(shù)據(jù)10717條;“中山大學(xué)民國期刊全文數(shù)據(jù)庫”收錄清末民國期刊6000余種,6萬多期;福建師范大學(xué)圖書館“館藏民國中文圖書專題全文數(shù)據(jù)庫”、“館藏民國外文圖書專題全文數(shù)據(jù)庫”,分別收錄圖書8420種、5779種。(高校自建數(shù)據(jù)庫情況見表1)
表1 高校圖書館民國文獻(xiàn)自建數(shù)據(jù)庫情況
數(shù)據(jù)來源:各圖書館網(wǎng)站(查詢?nèi)掌冢?015年2月6日)
2.2專題數(shù)據(jù)庫建設(shè)
高校圖書館的專題數(shù)據(jù)庫,比較偏重校史及與學(xué)校性質(zhì)類型相關(guān)文獻(xiàn)的整理和數(shù)字化。以校史、學(xué)校學(xué)術(shù)成就、學(xué)校出版物為主題的專題數(shù)據(jù)庫,有清華大學(xué)圖書館“清華文庫”、“清華學(xué)位論文”,前者收錄清華自建校以來的??捌渌麅?nèi)部或?qū)ν獬霭婵?,以及各種有關(guān)清華人、事、物、歷史等的書籍資料、早期??龋笳甙◤纳鲜兰o(jì)20年代末到60年代的部分畢業(yè)論文。另外,清華大圖書館自建“《清華周刊》數(shù)據(jù)庫”,收集創(chuàng)刊于1915年的清華學(xué)生刊《清華周刊》608期;武漢大學(xué)圖書館“武大老教師著述及相關(guān)資料篇名索引(1949年以前)”,收集300余名武漢大學(xué)及其前身老一輩教育家學(xué)者的5000多篇資料;南開大學(xué)“西南聯(lián)大史料庫”,總數(shù)據(jù)量達(dá)18000余條;華南師范大學(xué)圖書館“本校早期論文”和“本校早期出版物”,分別收入華南師大現(xiàn)存早期畢業(yè)生論文1200多冊以及包括《廣東省立勷勤大學(xué)概覽》、《勷勤大學(xué)季刊》、《廣東省立勷勤大學(xué)師范學(xué)院講義》以及各種同學(xué)錄在內(nèi)的30余冊華南師大早期出版物。華中師范大學(xué)圖書館“華大文庫”收入館藏1952年以前出版的珍藏圖書、珍稀報刊、解放區(qū)出版物以及畢業(yè)論文。福建師范大學(xué)圖書館“館藏前身校出版期刊全文數(shù)據(jù)庫”、“館藏前身校畢業(yè)論文中文全文數(shù)據(jù)庫”、“館藏前身校畢業(yè)論文西文全文數(shù)據(jù)庫”等。
師范大學(xué)圖書館則比較偏重教育文獻(xiàn)及教科書的數(shù)字化建設(shè),如北京師范大學(xué)圖書館建有“館藏解放前師范學(xué)校及中小學(xué)教科書全文庫”,收入清末民國教科書2626種;南京師范大學(xué)圖書館自建“民國文獻(xiàn)資源庫?民國教育期刊庫”,收入館藏教育學(xué)、心理學(xué)方面的圖書2400余種近4000冊,期刊130余種;上海師范大學(xué)圖書館“民國教育期刊全文數(shù)據(jù)庫”收入民國教育類期刊140種,7萬余篇文章,并析出了發(fā)表于其它各種非教育類刊物中的教育學(xué)相關(guān)文章2萬余篇。
圖書館根據(jù)自己的館藏特色,也建有一些地方文獻(xiàn)數(shù)據(jù)庫,如上海師范大學(xué)圖書館“近代上海方志資料數(shù)據(jù)庫”收錄上海近代方志資料26種,218冊,551卷;廣西師范大學(xué)圖書館“館藏廣西舊地方志”收錄本館所藏清代及民國時期編修的廣西舊地方志;蘇州大學(xué)圖書館與江蘇省吳文化基地合作開發(fā)的吳文化數(shù)據(jù)庫,包含有大量民國文獻(xiàn)資料。[5]
另外,還有一些零星的民國報刊全文數(shù)據(jù)庫,如清華大學(xué)“銀行民國期刊”,華南師范大學(xué)圖書館《廣州民國日報》,延安大學(xué)圖書館“紅色數(shù)據(jù)庫”[6]等。
3.1民國文獻(xiàn)數(shù)字化開發(fā)尚無統(tǒng)一規(guī)劃,重復(fù)建設(shè)現(xiàn)象嚴(yán)重
雖然高校圖書館在CALIS、CADAL和CASHL的支持下,開展了一些民國文獻(xiàn)數(shù)字化項目,但目前三C都只發(fā)揮了指導(dǎo)性作用,并沒有形成一個統(tǒng)一的規(guī)劃和協(xié)調(diào),高校圖書館依托館藏進(jìn)行的全文數(shù)據(jù)庫建設(shè),尚處于大而全、小而全的狀態(tài),館藏的紙質(zhì)資源,無論是否已有數(shù)據(jù)庫收錄,均進(jìn)行全文獻(xiàn)的開發(fā)和建設(shè),導(dǎo)致相同的紙質(zhì)資源,數(shù)字化開發(fā)時,館與館之間不斷進(jìn)行重復(fù)建設(shè)。
要解決這一問題,圖書館在自建館藏全文數(shù)據(jù)庫前,首先應(yīng)對已購買或擬購買的民國文獻(xiàn)數(shù)據(jù)庫,進(jìn)行收錄資源的檢索和調(diào)研,如果已包含本館紙質(zhì)文獻(xiàn),則不再重復(fù)建設(shè),商用數(shù)據(jù)庫未包含的資源,則作為本館全文數(shù)據(jù)庫建設(shè)的內(nèi)容,進(jìn)行數(shù)字化加工;第二,通過技術(shù)層面的處理,以下載、鏈接或跨庫檢索等方式,使上述商業(yè)數(shù)據(jù)庫或共享資源中檢出的館藏紙質(zhì)文獻(xiàn)內(nèi)容,嵌入本館數(shù)據(jù)庫,標(biāo)注數(shù)據(jù)來源及紙質(zhì)館藏的索書號、館藏地等信息,實現(xiàn)無縫衘接,全文檢索;第三,通過資源共享或鏈接國家圖書館、上海圖書館、浙江圖書館等一些免費開放資源的方式,獲得更多全文獲取途徑。
3.2以綜合性數(shù)據(jù)庫為主,學(xué)科主題的專題型數(shù)據(jù)庫比較少
高校圖書館,包括CADAL的全文數(shù)據(jù)庫,基本是基于館藏書刊的綜合性全文獻(xiàn)數(shù)據(jù)庫,按學(xué)科類型進(jìn)行資源收集與整理的數(shù)字化開發(fā),尚未引起重視。目前,以學(xué)科為主題建成的專題庫,僅有北京師范大學(xué)圖書館“館藏解放前師范學(xué)校及中小學(xué)教科書全文庫”以及上海師范大學(xué)圖書館“民國教育期刊全文數(shù)據(jù)庫”等為數(shù)不多的幾家。
高校圖書館基于館藏的全文獻(xiàn)開發(fā)模式,是導(dǎo)致目前民國文獻(xiàn)資源重復(fù)開發(fā)、重復(fù)建設(shè)的重要原因之一。因此,在下一步的數(shù)據(jù)庫建設(shè)中,應(yīng)考慮對現(xiàn)有開發(fā)模式進(jìn)行適當(dāng)變革,不僅從文獻(xiàn)類型,還應(yīng)從學(xué)科分類和地域區(qū)間上,進(jìn)行文獻(xiàn)的整理式、挖掘式開發(fā)。這種主題型的文獻(xiàn)整理,在民國文獻(xiàn)的影印出版行業(yè),已經(jīng)取得了很好的成績,出版社整理開發(fā)的宗教、圖書館學(xué)、新聞出版、滿鐵、女性以及政府公報、畫報、調(diào)查報告等專題民國文獻(xiàn),已有大量的影印出版物問世。數(shù)據(jù)庫的開發(fā),可以參考和借鑒影印出版的收集整理方法和選題模式,比如,開發(fā)學(xué)科主題或論文匯編型數(shù)據(jù)庫,從數(shù)據(jù)資源內(nèi)容的選擇上,加強(qiáng)數(shù)字建設(shè)的學(xué)術(shù)性,提升數(shù)據(jù)庫質(zhì)量,從而避免低水平的重復(fù)建設(shè)。
目前,CALIS三期“專題特色數(shù)據(jù)庫”立項支持的幾種民國文獻(xiàn)數(shù)據(jù)庫,大部分是基于學(xué)科或史料的專題性數(shù)據(jù)庫,如前述北京大學(xué)“西南聯(lián)大史料數(shù)據(jù)庫”、北京郵電大學(xué)“中國近現(xiàn)代郵電史數(shù)字圖書館資料庫”、福建師范大學(xué)“民國時期福建教會大學(xué)特色文獻(xiàn)數(shù)據(jù)庫”、中山大學(xué)“(民國)嶺南高校記憶”等,可以看出,高校的民國文獻(xiàn)整理已經(jīng)有從綜合性館藏全文獻(xiàn)向?qū)n}型、學(xué)科型數(shù)據(jù)庫發(fā)展的趨勢。
3.3數(shù)據(jù)庫的開放程度不高
商業(yè)數(shù)字公司開發(fā)的數(shù)據(jù)庫,出于商業(yè)利益的考慮,實現(xiàn)有償限制開放,無可厚非。公共圖書館在資源的開放性方面,比高校圖書館略強(qiáng),但目前也只有國家圖書館開發(fā)的民國資源庫,浙江省圖書館的“民國期刊”等幾個為數(shù)不多的資源可以在免費注冊后全文瀏覽(不提供下載),而高校圖書館開發(fā)的民國文獻(xiàn)數(shù)據(jù)庫,幾乎對館外或校外訪問都有限制,一些數(shù)字資源,非本?;虮攫^IP地址,甚至連目錄檢索都無法實現(xiàn)。雖然目前有CADAL、CALIS等資源共建共享系統(tǒng),CASHL也積極推進(jìn)民國文獻(xiàn)開放獲取方面的合作,但這些合作和共享,只限于高校成員館,對非成員館及絕大多數(shù)的非高校用戶,這些數(shù)據(jù)庫系統(tǒng),是不開放的。
隨著網(wǎng)絡(luò)化程度的不斷提高,讀者獲取文獻(xiàn)的途徑和渠道也漸趨多元化,如果圖書館仍舊對已有數(shù)字資源,尤其是自建資源進(jìn)行限制,會使讀者日漸遠(yuǎn)離圖書館,圖書館漸趨邊緣化而缺乏生命力。因此,文獻(xiàn)的開放性已經(jīng)成為圖書館發(fā)展的必然趨勢,圖書館應(yīng)考慮在通過加密、禁止非法拷貝等技術(shù)手段實現(xiàn)版權(quán)保護(hù)的前提下,盡量放寬用戶限制,使圖書館珍貴的館藏文獻(xiàn)以及花費大量人力物力開發(fā)的數(shù)字資源,能夠被更多的人知曉,并得到更多的共享和使用,實現(xiàn)文獻(xiàn)和數(shù)據(jù)庫開發(fā)的價值。
3.4與商業(yè)數(shù)字公司開發(fā)的數(shù)據(jù)庫相比,在檢索功能和閱讀功能上,有較大差距
高校圖書館開發(fā)的一些數(shù)據(jù)庫,通常只有刊名、題名、出版者、出版地等基礎(chǔ)數(shù)據(jù)的簡單著錄,并不是每個數(shù)據(jù)庫都進(jìn)行關(guān)鍵詞或主題詞標(biāo)引,文獻(xiàn)標(biāo)引深度和揭示程度較淺,因此,檢索途徑單一,檢索功能較弱,甚至一些大型圖書館開發(fā)的期刊數(shù)據(jù)庫,也只提供刊名,不提供篇名檢索,如CADAL的民國期刊庫,只能按刊名檢索,按期瀏覽,無法從篇章入手查找具體的文章。另外,在閱讀功能上,通常只提供在線瀏覽,無法下載和打印。
相比較而言,商業(yè)數(shù)字公司開發(fā)的數(shù)據(jù)庫,在檢索功能和閱讀功能的設(shè)計上,大大優(yōu)越于圖書館自建數(shù)據(jù)庫,不僅提供的檢索路徑更多,而且多采用先進(jìn)技術(shù),實現(xiàn)全文檢索和文本全文版與原始圖片版的對照閱讀,支持簡繁體、異體字自動轉(zhuǎn)換。因此,高校圖書館在開發(fā)館藏數(shù)據(jù)庫時,有必要借鑒商用數(shù)據(jù)庫的檢索和閱讀功能設(shè)計,在深度標(biāo)引、全面揭示文獻(xiàn)以及提供良好閱讀界面方面下功夫。
[1] CADAL數(shù)字圖書館[EB/OL].[2015-02-09]. http://www.cadal.zju.edu.cn/search/newHelp.
[2] 民國文獻(xiàn)大全(-1949)[EB/OL].[2016-01-10].http://cadal.hytung.cn/.
[3] 教育部“211工程”高等教育文獻(xiàn)保障系統(tǒng)(CALIS)三期“專題特色數(shù)據(jù)庫”立項項目一覽表[EB/OL].[2015-02-09]. http://ww wdocin.com/p-275982781.html.
[4] CASHL主頁-CASHL華東南地區(qū)民國文獻(xiàn)共建與共享服務(wù)啟動大會圓滿召開[EB/ OL].[2015-02-09]. http://www.cashl.edu.cn/ portal/html/article317.html.
[5] 杭亞楊,王雅戈,陸琳.蘇州民國文獻(xiàn)收藏保護(hù)與開發(fā)利用研究[J].圖書館學(xué)研究,2014 (1):84.
[6] 收入我黨最早創(chuàng)辦的《紅色中華》、《新中華報》和《解放日報》三種報刊.[EB/OL].[2015-02-07]. http://120.95.97.253/library/35/180. html.
段曉林 副研究館員,上海師范大學(xué)圖書館資源建設(shè)部主任。
蔡迎春 副研究館員,上海師范大學(xué)圖書館副館長。
*本文系上海師范大學(xué)“《民國文獻(xiàn)出版總目:1949-》編撰研究”(項目編號:A-0230-16-001032)、“民國文獻(xiàn)整理與研究發(fā)展報告”(項目編號:A-0233-16-005009)的階段性成果。