龍向洋(復旦大學圖書館研究館員)
報告中涉及到的數(shù)據(jù)采集依據(jù)主要是芝加哥大學東亞圖書館周元館長2005年發(fā)表在《大學圖書館學報》的《美國大學中的東亞圖書館》一文中提到的11家圖書館,圍繞這11家圖書館進行了數(shù)據(jù)調(diào)查。
民國文獻資料主要有紙質(zhì)的文獻、縮微資料以及近年來的電子圖書等類型,數(shù)量基數(shù)很大。2008年,我到哈佛大學燕京圖書館進行為期一年的訪學。此前,對國內(nèi)主要大學的民國文獻、民國時期總書目12萬條數(shù)據(jù)和香港地區(qū)的3萬條數(shù)據(jù)進行了收集,共積累三十四五萬條數(shù)據(jù)。我的工作就是從這三十幾萬數(shù)據(jù)與在美國采集到的數(shù)據(jù)進行對比整理開始。
2009年我先后到芝加哥大學、加州大學洛杉磯分校、加州大學伯克利分校和斯坦福大學的幾家圖書館,對這些館的民國文獻進行了考察和收集。2013年,受哥倫比亞大學東亞圖書館館長之邀到哥大訪學期間,把普林斯頓和耶魯大學的民國文獻也做了采集。通過對這八家大學圖書館民國文獻數(shù)據(jù)的收集,大致知道主要的東亞館有哪些資料。遺憾的是,密歇根大學,康奈爾大學和華盛頓大學的民國文獻一直沒有機會去采集。
基于這樣一個數(shù)據(jù)采集的基礎(chǔ),進行了書目數(shù)據(jù)整理:1)在整理范圍上,僅對紙本圖書進行統(tǒng)計,不包括1949年以后影印本、微縮資料、電子圖書和報刊資料;2)在整理方式上主要以數(shù)據(jù)庫的方式來做。保留原始數(shù)據(jù)的路徑、原始數(shù)據(jù)采集的形態(tài),并保持所有過程的完整性和連貫性,這樣便于發(fā)現(xiàn)在整理過程中發(fā)生的一些誤差;3)在文字上做了規(guī)范,采用字頻統(tǒng)計的方式,對所有14萬條數(shù)據(jù)進行文字規(guī)范的整理,仍然采用繁體字;4)在分類上做了兼容,東亞圖書館主要采用哈佛燕京圖書館分類法,但其實哈佛燕京圖書館民國文獻也只有三分之二的圖書采用哈佛燕京圖書館分類法。因此對所采集的八家館的民國文獻進行了統(tǒng)一的分類處理,同時將中圖分類法和哈佛燕京分類法映射,使同一本書既有哈佛燕京的分類,也有中圖分類法的分類;5)在做關(guān)聯(lián)映射的過程中涉及到數(shù)據(jù)比較;6)基于這些基礎(chǔ)性整理進行目錄編纂。
從學科分類來看(以哈佛燕京圖書館的分類法來進行統(tǒng)計),總錄書志類、語言文學類、社會科學類中的歷史學科這三大類別在東亞館的收藏非常多。這些類目的二級類目中,中國文學、史地、政法、經(jīng)濟、社會這些門類有相當豐富的收藏。其中我特別注意到民國方面軍事類著作有很多,而在國內(nèi)很少見到。另外書目資料收集的特別多,也就是說北美東亞館在收集中國文獻,尤其是在工具書的目錄資料方面是特別注重的。
八家館的民國圖書按照年代來進行統(tǒng)計,有幾個地方值得注意:抗戰(zhàn)時期的文獻資料非常多也很有特色。這些資料當時從延安到美國再到斯坦福大學東亞圖書館,有詳細書目來源記載,這部分資料值得我們關(guān)注。
從出版地看,上海是民國時期重要的出版地。民國總書目中有60~70%的書在上海出版。東亞館的收藏也不例外,大部分是出版于上海的。除上海外,重慶、南京、北京、香港也是主要的出版地,此外,廣州出版的資料在東亞館的收藏中是比較特有的,如南亞的資料收藏比較突出。通過東亞館民國文獻資料與香港地區(qū)、北大圖書館的收藏進行對比,這個特征非常明顯。從出版機構(gòu)來看,商務(wù)印書館、中華書局和正中書局這幾家大的機構(gòu)的出版物是東亞館收藏的主要部分。值得注意的是,一些團體、組織的史料甚至稿本和一些小冊子類的資料也非常多。
在做民國文獻的搶救保護的時候,作為大學圖書館,從藏書發(fā)展的角度,首先關(guān)注的是民國時期重要的學者和人物以及他們著作的情況。所以我們做了一個比較有規(guī)模的民國時期人物資料數(shù)據(jù)庫,2006年時該數(shù)據(jù)庫條目已達10萬條。我們將這個數(shù)據(jù)庫跟民國時期的書目資料進行關(guān)聯(lián),其中袁同禮編的《中國留美同學博士論文目錄》是一個非常重要的資料。
通過關(guān)聯(lián)統(tǒng)計,可以從目錄學的角度來討論近代獲得歐美國家博士學位的人物所發(fā)表的中文著作及其后來的勘驗情況,以及對中國學術(shù)產(chǎn)生的影響。因此,我們將《中國留美同學博士論文目錄》《中國留英同學博士論文目錄》和《中國留歐大陸各國博士論文目錄》共計4000多個人物的資料,跟美國東亞館的14萬條民國文獻進行關(guān)聯(lián)統(tǒng)計,發(fā)現(xiàn)胡適在1917年獲得哥倫比亞大學博士。東亞館里關(guān)于胡適的資料最多,還有馬寅初、馮友蘭、趙元任等人的資料。
另外一個關(guān)聯(lián)統(tǒng)計是胡建國先生的《近代華人生卒簡歷表》,這是研究民國文獻的一個很重要的一個工具數(shù)據(jù)。該書收集了1.5萬個近代人物的詳細生卒年表。將這份年表與東亞館的14萬條數(shù)據(jù)進行關(guān)聯(lián)統(tǒng)計,其中關(guān)于蔣介石和毛澤東這兩位民國時期最重要的政治人物的著作情況很有特點,斯坦福大學收藏的蔣介石的圖書資料在東亞館中最多。
一方面,將東亞館的14萬數(shù)據(jù)跟《民國時期總書目》收藏的12萬條數(shù)據(jù)進行比較,發(fā)現(xiàn)沒有被收錄的非常多。由此引出的問題是,當時遺漏的,現(xiàn)在重編總目時是否放進去?哪些應(yīng)該放進去?線裝書籍、手稿等文獻是否要放進去?這個是值得思考的問題。同時,把當時 CADAL(大學數(shù)字圖書館國際合作計劃)40萬冊民國文獻(其中圖書近十萬冊)與北美東亞館藏進行了比較。對于我們沒有的這一部分我們?nèi)绾翁幚??哪些東西可以去數(shù)字化?是不是稀見的就去數(shù)字化?也是值得思考的問題。在民國文獻的數(shù)字化建設(shè)方面,如何推動國際合作,也值得我們深思。
最后是希望通過這樣的整理編一個聯(lián)合目錄。我們采用先做聯(lián)合整理,把所有的目錄放在一個數(shù)據(jù)庫中,對所有的文字進行規(guī)范化處理,找到之間的差異,再一家一家來做的方式。最終在編纂的目錄中可以看到,書目標注了八家東亞館的館藏地、在民國總書目中的位置、在CADAL中是否已經(jīng)被數(shù)字化。同時也標注了該書目國內(nèi)圖書館的收藏情況。