郭廣
(遼寧省圖書館,遼寧 沈陽 110015)
1.1 選題意義
家譜是一種記錄家族遷徙、發(fā)展的事跡和家族人物世系、傳記的書籍,是以特殊形式組織、編寫的家族生活史。它是傳統(tǒng)文化的折射和側(cè)影,既可以彌補正史、地方文獻之不足,也可以為人們提供尋祖認親的重要信息。中國家譜經(jīng)過幾百年的發(fā)展,成為一種種類繁多、內(nèi)容豐富、記事詳備的獨特史料,對我們今天弘揚民族文化,增強民族凝聚力,以及進行社會學(xué)、人口學(xué)、民族學(xué)、歷史學(xué)等學(xué)科的研究,都具有很大的作用。
1.2 選題價值
家譜屬于珍貴資料,具有很高的保存價值。在大量的古籍數(shù)字化開發(fā)實踐過程中,家譜數(shù)字化有利于解決古籍的“保護”與“利用”這對矛盾,是實現(xiàn)家譜再生性保護的有效途徑,有利于改善古文獻資源的服務(wù)工作,推動珍稀古籍的資源共享與學(xué)術(shù)研究。
2.1 地區(qū)特點
從地區(qū)即從家譜的籍貫來說,館藏家譜文獻覆蓋面廣,涵蓋全國19個省,兩個直轄市(北京和上海),其中以江蘇、浙江家譜居多,超過了總數(shù)的30%,其次是湖南、安徽和山東家譜,北方的家譜較少收藏。如表1統(tǒng)計。
表1
2.2 姓氏特點
從姓氏上來說,所藏家譜文獻姓氏眾多,共有106個姓氏。如表2統(tǒng)計。2.3 時代特點
表2
從時代上來說,所藏家譜文獻大部分纂修于清末至民國年間以及20世紀初。明代纂修的家譜只有兩種,清代纂修的家譜有146種,民國年間纂修的家譜有11種,20世紀初至今纂修的家譜有212種。其中清代纂修的家譜統(tǒng)計如表3所示。
表3 清代纂修的家譜統(tǒng)計表
2.4 版本類型特點
從版本上來說,所藏家譜文獻的版本類型多種多樣,統(tǒng)計如表4。
表4
清代纂修的家譜以刻本和活字本為主。
隨著網(wǎng)絡(luò)化、自動化、數(shù)字化等計算機技術(shù)的高速進步,傳統(tǒng)的圖書館也面臨著新的挑戰(zhàn),人們已不再滿足于二次文獻的獲取,而是更迫切需要一種不受時間、地域限制的文獻閱讀方式,即從網(wǎng)上直接獲取一次文獻,于是進入了一個由傳統(tǒng)文獻信息資源轉(zhuǎn)向傳統(tǒng)與數(shù)字化信息資源相結(jié)合的新階段。3.1 館藏家譜數(shù)字化項目總體概況
遼寧省圖書館對其館藏清代家譜進行數(shù)字化處理,最終實現(xiàn)了網(wǎng)上多途徑檢索并通過電子書方式提供全文瀏覽功能。累計采集家譜圖片28萬3千多頁,打包電子版家譜圖書1700多冊,收錄并分類整理了家譜、宗譜、支譜、家乘、世系表等,共371種,著錄項目主要包含書名、卷數(shù)、始祖、始遷祖、名人、索書號等18個檢索字段,涉及姓氏106個,涵蓋全國19個省、兩個直轄市,對家譜姓氏源流進行完整著錄,真實地反映原始文獻的內(nèi)容與特征,數(shù)據(jù)庫總?cè)萘?41G。數(shù)據(jù)庫采用清華同方TPI數(shù)據(jù)庫加工發(fā)布系統(tǒng),利用此系統(tǒng)的電子書加工、元數(shù)據(jù)加工、內(nèi)容加工與發(fā)布子系統(tǒng),實現(xiàn)了家譜數(shù)據(jù)庫完善的檢索功能,可進行全文瀏覽,全面揭示遼寧省圖書館館藏家譜的文獻全貌。3.2 館藏家譜數(shù)字化方法
根據(jù)前期的整理和調(diào)研工作及家譜圖書的特點,該項目在實施的過程中采用多種技術(shù)手段對家譜進行數(shù)字化處理,如對于不超過掃描儀掃描范圍的家譜,采用無邊距掃描對紙質(zhì)家譜實行全文數(shù)字化,盡量減少對家譜原件的損傷。對于超過掃描儀范圍的大本家譜采用了專業(yè)數(shù)碼照相設(shè)備進行采集。在電子圖書的制作方面采用了清華同方TPI系統(tǒng)的電子書加工系統(tǒng),此系統(tǒng)可以支持多種方式的掃描,并可以對書頁圖像進行批處理,然后自動生成目錄樹,進行背景處理,還可以高度壓縮,最后支持CAJ格式的電子書導(dǎo)出。后期將打包的電子書與元數(shù)據(jù)進行鏈接,只要在發(fā)布界面通過點擊書名即可進入電子書,進行全文瀏覽。
3.2.1 掃描的數(shù)字化要求
根據(jù)家譜圖書的特點,將家譜掃描的技術(shù)指標定為能靈活應(yīng)用的TIFF格式。每冊書的每一頁作為一個圖片文件,圖片色彩模式采用灰度模式,精度為300dpi,對圖片進行無壓縮掃描。為了保證圖像能夠真實地反映原始文獻的內(nèi)容與特征,對于家譜中涉及到多頁記錄的圖譜、家族地圖等,運用軟件Adobe Photoshop7.0拼接,以達到完整顯示。
3.2.2 照相的數(shù)字化要求
照相圖片的格式采用JPG格式,質(zhì)量能夠很好地滿足數(shù)據(jù)庫的要求,符合打印標準。照相后,運用軟件光影魔術(shù)手或I See對掃描后的圖像進行手動加工,如銳化、去噪、糾偏、裁剪等優(yōu)化處理。3.3 設(shè)置導(dǎo)航欄
為了便于數(shù)據(jù)的管理使用,我們對所采集的家譜數(shù)據(jù)進行了分類。通過多次論證和考察,將家譜數(shù)據(jù)庫的數(shù)據(jù)按照姓氏第一個字的首字母為分類標準,分類到二級類目。體現(xiàn)在發(fā)布界面是給讀者提供了一個導(dǎo)航欄,導(dǎo)航欄顯示從A~Z的26個英文字母,下設(shè)以姓氏為分類的二級類目。如:【浙江海寧市】海寧渤海陳氏宗譜,分類在C>陳>【浙江海寧市】海寧渤海陳氏宗譜。
3.4 內(nèi)容著錄詳盡
該庫每條記錄均詳細著錄家譜的書名、卷數(shù)、編目員補充的附加題名、責任者、版本說明、書名與責任說明附注、冊數(shù)、外形尺寸、插圖、載體形態(tài)附注、始祖、始遷祖、名人、裝訂、備注、收藏者、索書號、以及編目員等信息,對家譜文獻的外在特征和內(nèi)部特點進行了充分揭示。數(shù)據(jù)采用集中式管理,同一種家譜在庫中只存在一條書目數(shù)據(jù),不同家族撰修的家譜以及同一家族在不同年代每一次的續(xù)修本各自著錄一條書目數(shù)據(jù)。
館藏家譜數(shù)據(jù)庫采用清華同方TPI數(shù)據(jù)庫加工發(fā)布系統(tǒng),這對于我們來說是一個全新的嘗試,利用此系統(tǒng)的電子書加工、元數(shù)據(jù)加工、內(nèi)容加工與發(fā)布系統(tǒng),實現(xiàn)了家譜庫以姓氏、地區(qū)、單冊電子圖書的形式進行檢索、瀏覽全文的功能,而且與館藏其他電子數(shù)據(jù)庫統(tǒng)一在一個平臺上,方便了數(shù)據(jù)庫的管理。
4.1 TPI系統(tǒng)簡介
TPI系統(tǒng)即清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng),是清華同方光盤股份有限公司為大中小型信息服務(wù)機構(gòu)開發(fā)的一個以內(nèi)容管理為核心的數(shù)字圖書館解決方案。TPI是基于非結(jié)構(gòu)化文檔管理而開發(fā)的大型智能內(nèi)容管理系統(tǒng)。
圖1為利用TPI系統(tǒng)構(gòu)建的家譜數(shù)據(jù)庫流程示意圖。
圖1
4.2 家譜數(shù)據(jù)庫的發(fā)布
我們利用TPI自帶的發(fā)布模板,通過動態(tài)頁面技術(shù)的采用,實現(xiàn)了數(shù)據(jù)庫的自動發(fā)布,界面友好。讀者可以根據(jù)個人愛好、檢索策略等選擇不同的檢索手段,方便檢索。數(shù)據(jù)庫檢索系統(tǒng)采用Web界面,提供書名、卷數(shù)、編目員補充的附加題名、責任者等18個檢索字段,并且支持這些檢索字段的全部索引,即按打開的順序進行檢索。檢索信息快、準、全,既能成批簡單顯示,便于比較和取舍,又能單獨顯示詳細數(shù)據(jù),能夠滿足讀者高查準率和高查全率的需求。同時能夠?qū)@些字段進行合并檢索,即基本檢索、高級檢索和二次檢索,并具有全文圖片瀏覽功能,方便讀者了解所需家譜的詳細信息,全面揭示了遼寧省圖書館所藏家譜的文獻全貌。
5.1 圖書館員通過對古籍資源的收集、篩選、分類、組織和發(fā)布,可以使讀者直接獲取查詢主題,大大節(jié)約了信息獲取成本。
5.2 家譜數(shù)字化采用了館藏資源和虛擬館藏一體化建庫模式,用戶通過統(tǒng)一界面的檢索平臺就能最大限度地獲得信息。這是圖書館在網(wǎng)絡(luò)環(huán)境下一種比較可行的方法,也是評價一所圖書館在網(wǎng)絡(luò)環(huán)境下信息服務(wù)水平和能力的重要標志。
5.3 家譜數(shù)據(jù)庫文獻內(nèi)容全面系統(tǒng),圖文并茂,多角度地反映了館藏家譜的原貌。
5.4 古籍數(shù)據(jù)庫建設(shè)不能僅注意技術(shù)方面,還要注意用戶環(huán)境。不僅要圍繞建設(shè)數(shù)字化館藏和服務(wù)兩方面,更要從數(shù)字資源的結(jié)構(gòu)上滿足用戶需求,家譜數(shù)據(jù)庫很好地做到了這一點。
[1] 洪其庚.家譜史話.鐘山風雨,2009(5).
[2] 管颯爽.家譜檔案的數(shù)字化生存.蘭臺世界,2008(21).
[3] 毛建軍.中國家譜數(shù)字化資源的開發(fā)與建設(shè).檔案與建設(shè),2007(1).