柏晗 陸玉瑩
[摘 要]隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,圖書文獻(xiàn)資源服務(wù)的數(shù)字化、網(wǎng)絡(luò)化需求越來越強(qiáng)烈。為了適應(yīng)這種需求,在分析南京水利科學(xué)研究館藏資源的現(xiàn)狀和讀者需求的基礎(chǔ)上,提出了在數(shù)字圖書館建設(shè)方面應(yīng)采取的初步策略,以此開展館藏特色資源的數(shù)字化建設(shè)和研究。
[關(guān)鍵詞]數(shù)字圖書館;數(shù)字化;文獻(xiàn)信息;數(shù)據(jù)庫
doi:10.3969/j.issn.1673 - 0194.2018.22.072
[中圖分類號]G250.76 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673-0194(2018)22-0-03
南京水利科學(xué)研究院自1935年建院以來,累積了大量的科研成果報告和20世紀(jì)的珍貴水利資料,都是獨(dú)具特色的寶貴文獻(xiàn)資料。這些紙質(zhì)資源由于存放時間長,加上紙張質(zhì)量、印刷及庫存條件等因素,急需進(jìn)行保護(hù)性處理,否則將會造成難以彌補(bǔ)的損失。同時,隨著信息化網(wǎng)絡(luò)化技術(shù)的快速發(fā)展,為了方便廣大科研人員通過網(wǎng)絡(luò)環(huán)境快速查詢下載所需文獻(xiàn)資源,為此需要集中力量進(jìn)行數(shù)字化建設(shè),從而有效地保護(hù)和利用這些寶貴的文獻(xiàn)資源。
1 數(shù)字圖書館建設(shè)的需求
南京水利科學(xué)研究院信息中心是建館80余年的專業(yè)圖書館,從建院之初已經(jīng)存在,館內(nèi)收藏了大量寶貴的文獻(xiàn)資料,其中不單包含大量的建國早期乃至清末、民國時期的珍貴水利資料,還保存了從建院之初到現(xiàn)在的所有紙質(zhì)科研成果報告,但由于各方面的原因,館藏文獻(xiàn)資源的數(shù)字化程度較低。為了加快館藏文獻(xiàn)資源電子化、數(shù)字化建設(shè)的步伐,同時也為了更好地保存這些特色文獻(xiàn)資源,需要對這些寶貴的紙質(zhì)文獻(xiàn)進(jìn)行保護(hù)性的搶救處理,并建設(shè)獨(dú)具特色的全文數(shù)據(jù)庫,為科研及水利水電、水運(yùn)交通行業(yè)的生產(chǎn)建設(shè)提供更好的服務(wù),這也是建設(shè)數(shù)字化圖書館的必然要求。
2 現(xiàn)階段的研究內(nèi)容
數(shù)字圖書館的理念是20世紀(jì)90年代美國最先提出的,在建設(shè)發(fā)展的過程中,特色文獻(xiàn)的數(shù)字化建設(shè)以自身的優(yōu)勢,開始引起各國重視,我國也在進(jìn)行這方面的建設(shè)和研究?;谔厣墨I(xiàn)數(shù)字化所具有的整體優(yōu)勢,南京水利科學(xué)研究院的數(shù)字化圖書館建設(shè)也以特色文獻(xiàn)的數(shù)字化為突破口,其中圖書館的特色之一就是館藏科研成果報告。
在館藏科研成果數(shù)字化建設(shè)方面,根據(jù)南京水利科學(xué)研究院圖書館的管理運(yùn)作現(xiàn)狀及考慮到讀者需求,計劃分為3個階段進(jìn)行?,F(xiàn)階段主要對1990-2009年產(chǎn)生的紙質(zhì)科研成果報告進(jìn)行數(shù)字化處理并建設(shè)相應(yīng)的數(shù)據(jù)庫。主要研究內(nèi)容包含四點(diǎn):①數(shù)字化建設(shè)過程中的控制和管理研究,確定過程控制的流程和管理要求;②數(shù)字化建設(shè)的規(guī)范和標(biāo)準(zhǔn)問題研究,確定掃描方式、色彩模式、分辨率、質(zhì)量標(biāo)準(zhǔn)、圖像存儲格式和命名原則等相關(guān)內(nèi)容;③檢索庫的建設(shè)和數(shù)據(jù)掛接問題研究,確定檢索庫數(shù)據(jù)格式和驗(yàn)收標(biāo)準(zhǔn);④數(shù)字化資源的管理、存儲和提供服務(wù)方式的研究,建立特色資源數(shù)據(jù)庫發(fā)布系統(tǒng)。
2.1 數(shù)字化建設(shè)過程的控制和管理研究
南京水利科學(xué)研究院館藏科研成果全部集中在密集書庫管理,每項(xiàng)成果入庫時都有2~4本復(fù)本,按1~4編號,在書庫里是分部門按年份以及成果編號的順序存放,因此,通過分析紙質(zhì)文獻(xiàn)資源的借還方式和規(guī)律,確定了數(shù)字化建設(shè)過程中的控制方法。
在不影響讀者正常借閱的基礎(chǔ)上,利用類似于讀者借還的方式,工作人員通過已建立的館藏書目數(shù)據(jù)庫進(jìn)行檢索,導(dǎo)出所需數(shù)字化建設(shè)資料的清單,按照清單在書庫對應(yīng)區(qū)域查找并取復(fù)本編號靠前的一本,并在清單上記錄相應(yīng)編號;并通過流通處進(jìn)行核對、登記、借出等手續(xù),最后在移交清單上簽字。在文獻(xiàn)資源掃描完成后,再次利用讀者借還方式,將之前清單上的文獻(xiàn)資料通過流通部辦理歸還手續(xù),并再次在移交清單上簽字確認(rèn)。
資料掃描前,好需要先了解資料本身的清晰度、完整度等,根據(jù)需要確定是否需要拆解,如何拆解并復(fù)原,還需要確認(rèn)是否含有超大圖紙頁面,確定其掃描及拼接方式,并做好相應(yīng)的登記工作。
2.2 數(shù)字化建設(shè)的規(guī)范與標(biāo)準(zhǔn)問題研究
很多館藏科研成果由于歷史悠久,會出現(xiàn)各種不同的情況,例如紙張發(fā)黃變脆、字跡變淡、插圖清晰度不夠,甚至由于印刷和借閱導(dǎo)致的污漬、年代和印刷技術(shù)導(dǎo)致的差異性。如何提高掃描質(zhì)量和效率成為數(shù)字化建設(shè)的一個關(guān)鍵問題。
2.2.1 數(shù)字化建設(shè)的規(guī)范問題研究
(1)紙質(zhì)文獻(xiàn)資源管理方面。實(shí)物資料的交接需嚴(yán)格核對文獻(xiàn)資料清單與實(shí)物是否一致,并做好《資料交接記錄》交由管理人員簽字確認(rèn),對資料的成果編號、數(shù)量、經(jīng)手人及借還時間進(jìn)行詳細(xì)登記,確保其完整性。
(2)掃描前的拆分整理工作。由于時代原因,導(dǎo)致紙質(zhì)文獻(xiàn)的裝訂和印刷存在各種問題,對需要拆分掃描的文獻(xiàn)資料需按照原頁碼順序整理,并去除其中可能引起掃描問題的訂書釘?shù)?,盡可能提高掃描結(jié)果的清晰度。
(3)掃描加工的規(guī)范化。掃描人員需要根據(jù)實(shí)際情況選擇預(yù)先設(shè)定的模板或重新設(shè)定新的參數(shù)。同時,由于早年印刷技術(shù)、紙張質(zhì)量及借閱保管不當(dāng)?shù)葘?dǎo)致的各種問題,還應(yīng)根據(jù)需要對掃描所得的圖片進(jìn)行手動去黑邊、糾正傾斜角度、頁面不顛倒、文件順序不混亂等,以保證掃描所得數(shù)字化文獻(xiàn)的整體質(zhì)量。
(4)掃描過程中紙質(zhì)資源的保護(hù)。按文獻(xiàn)資源的頁碼順序掃描,處理過的資料也需按順序擺放整齊,避免資料出現(xiàn)丟失或缺頁。同時,按規(guī)定操作方法進(jìn)行掃描操作,避免操作不當(dāng)導(dǎo)致資料文件或掃描設(shè)備損壞。
(5)掃描后的整理工作。對于掃描過程中需要拆解的紙質(zhì)文獻(xiàn),應(yīng)按原樣再裝訂還原。
(6)破損文獻(xiàn)資源的管理。資料本身存在破損,或掃描過程中出現(xiàn)了損壞情況,需及時告知流通管理人員,并登記。
2.2.2 數(shù)字化建設(shè)標(biāo)準(zhǔn)問題研究
在科研成果數(shù)字化的過程中,如何保證不同資料掃描所得的數(shù)字化文件的清晰度和存儲大小的平衡,既能保證圖像的清晰度完整度,又能有效利用存儲空間,方便數(shù)字化資源的網(wǎng)絡(luò)傳輸和利用,在經(jīng)過大量掃描和反復(fù)修改實(shí)踐的基礎(chǔ)上,終于確定了下列標(biāo)準(zhǔn)。
掃描方式標(biāo)準(zhǔn):①按文獻(xiàn)標(biāo)明的頁碼順序掃描;②對于同一份文獻(xiàn)資料或同一頁面內(nèi)存在不同清晰度的內(nèi)容,特別是早期文獻(xiàn)資料存在鉛筆、鋼筆、圓珠筆同時使用的,以主要部分的清晰度為準(zhǔn),也可以根據(jù)不同清晰度一頁多掃;③對于紙張質(zhì)量差、容易破損的,應(yīng)使用平板掃描,禁止使用滾筒掃描;④掃描圖像應(yīng)該包括文件上的頁眉、頁腳、頁碼等所有相關(guān)標(biāo)記,以確保文獻(xiàn)的完整性;⑤合成掃描文件時,應(yīng)使用原文獻(xiàn)名稱命名,章節(jié)名也需如此,同一篇文獻(xiàn)的全文文件和各章節(jié)文件應(yīng)存于同一個子目錄。
參數(shù)設(shè)置標(biāo)準(zhǔn):在實(shí)際掃描過程中,因?yàn)閭€人的操作的差異和不同掃描設(shè)備之間存在差異,導(dǎo)致掃描的結(jié)果也會出現(xiàn)差異,經(jīng)過大量的比對最終確定了主要參數(shù)標(biāo)準(zhǔn),如表1所示。
圖像質(zhì)量標(biāo)準(zhǔn):在對掃描完成的圖像進(jìn)行比對之后,確定了以下標(biāo)準(zhǔn)。①圖像文件最大傾斜角度不得大于0.5o。②掃描所得圖像文件必須是A3、A4、B4的標(biāo)準(zhǔn)尺寸(附件圖表除外)。③確保圖像文件的長寬比一致。④清理圖像文件中存在的污點(diǎn),確保污點(diǎn)量不超過50%。⑤確保整體清晰度不低于原紙質(zhì)文獻(xiàn),圖像準(zhǔn)確率100%,圖像文件格式為tiff和雙層PDF格式。
2.3 數(shù)字化文獻(xiàn)資料管理系統(tǒng)檢索庫建設(shè)和數(shù)據(jù)掛接問題研究
南京水利科學(xué)研究院館藏科研成果報告本身包含多種信息,為了使數(shù)字化后的文獻(xiàn)資料便于查找和應(yīng)用,需要重新設(shè)計檢索庫。
2.3.1 檢索庫數(shù)據(jù)格式
通過長期從事科研成果編目工作,發(fā)現(xiàn)成果報告主要包含26個信息點(diǎn),其中由于項(xiàng)目類別和要求的差異,所含信息也有不同,通過比對分析最終確定檢索庫的每個字段數(shù)據(jù)格式如表2所示。
2.3.2 檢索庫的數(shù)據(jù)錄入
為了便于錄入數(shù)據(jù),在數(shù)字化掃描的最后要生成雙層PDF文件,用于識別文字信息,從而便于識別出檢索庫各數(shù)據(jù)化文獻(xiàn)對應(yīng)信息源的信息,準(zhǔn)確快速地錄入檢索數(shù)據(jù)。所以,檢索庫的建設(shè)過程與數(shù)字化掃描可同步完成。
2.3.3 檢索庫數(shù)據(jù)掛接問題研究
為了解決數(shù)據(jù)掛接的問題,需要先確定命名規(guī)則,以便于數(shù)據(jù)批量掛接,同時也便于讀者下載時辨別所需文獻(xiàn)內(nèi)容。根據(jù)研究確定了以下兩條:①每篇成果全文為“1.0”+“報告名稱”;②每章節(jié)為“1.”+“章節(jié)序號”+“章節(jié)名稱”。
2.3.4 檢索庫驗(yàn)收標(biāo)準(zhǔn)
在完成檢索庫錄入和全文數(shù)據(jù)掛接之后,還需要通過驗(yàn)收才能提供讀者使用。這里可以直接利用檢索窗查詢的方式查看所查文獻(xiàn)資料是否正確,數(shù)據(jù)是否完整,鏈接全文是否能正常閱讀和下載。
2.4 數(shù)字化資料的管理、存儲和服務(wù)方式
2.4.1 數(shù)字化資源的管理
在文獻(xiàn)資料數(shù)字化后主要生成tiff和雙層PDF兩種格式的文件,其中對數(shù)字化資源管理是以tiff文件按報告建立目錄,而雙層PDF文件則作為數(shù)據(jù)庫的備份進(jìn)行管理。
2.4.2 數(shù)字化資源的存儲
由于數(shù)字化的文獻(xiàn)資源是按兩種格式進(jìn)行管理的,因此存儲也是一樣,tiff文件直接存儲在機(jī)房的存儲設(shè)備上,而PDF文件則存儲于服務(wù)器上,并由系統(tǒng)進(jìn)行定期備份,以確保數(shù)字化資源的安全。
2.4.3 數(shù)字化資源的使用
根據(jù)我國數(shù)字圖書館建設(shè)的實(shí)際情況,加上“十三五”時期國家重點(diǎn)突出了網(wǎng)絡(luò)信息安全保障能力建設(shè),而現(xiàn)階段數(shù)字化的文獻(xiàn)資源主體為南京水利科學(xué)研究院獨(dú)具特色的成果報告,因此,瀏覽和下載是需要受限的,根據(jù)讀者的不同設(shè)置不同的權(quán)限,有的只能查看,有的可以下載本部門的文獻(xiàn),有的則可以瀏覽和下載全部文獻(xiàn)。
3 結(jié) 語
進(jìn)入21世紀(jì)以來,隨著移動數(shù)字平臺飛速發(fā)展,信息交流的速度大幅提高,人們可以隨時隨地獲取想要的信息資源,為工作和娛樂帶來了很多便利。但帶來便利的同時也帶來的各種挑戰(zhàn),那就是如何才能更好地滿足大眾對信息資源的需求,如何才能更快速地為人們提供更迅捷和準(zhǔn)確的數(shù)據(jù)資源,最終促進(jìn)各行各業(yè)的信息化發(fā)展,而數(shù)字圖書館在其中占據(jù)主導(dǎo)地位。
如何建立擁有自身特色的文獻(xiàn)資源數(shù)據(jù)庫,將館藏核心文獻(xiàn)及特色文獻(xiàn)資源轉(zhuǎn)化為數(shù)字信息,實(shí)現(xiàn)網(wǎng)絡(luò)傳播、信息共享,建立一個包羅萬象的信息倉儲,并通過網(wǎng)絡(luò)為用戶提供更高效便捷的信息獲取途徑,是各圖書館、信息中心等信息機(jī)構(gòu)未來必須擔(dān)負(fù)的重任。本文的研究成果為南京水利科學(xué)研究院館藏特色文獻(xiàn)資源的數(shù)字化建設(shè)積累了寶貴的經(jīng)驗(yàn),能夠?yàn)橐院蟮臄?shù)字化建設(shè)工作以及其他圖書館在數(shù)字化建設(shè)方面的交流提供有力的支撐,為今后逐步實(shí)現(xiàn)真正意義的數(shù)字化圖書館奠定了基礎(chǔ)。
主要參考文獻(xiàn)
[1]湯紅娟.中共黨史文獻(xiàn)資料數(shù)字化建設(shè)研究[J].江漢大學(xué)學(xué)報:社會科學(xué)版,2011(5).
[2]張秋.新疆少數(shù)民族特色文獻(xiàn)數(shù)字化構(gòu)建研究[J].現(xiàn)代情報,2009(8).
[3]蔡屛.圖書館文獻(xiàn)資源數(shù)字化立項(xiàng)論證工作研究[J].圖書館論壇,2012(1).
[4]龔麗瑛.企業(yè)檔案數(shù)字化研究文獻(xiàn)綜述[J].辦公自動化雜志,2012(6).
[5]蘇云,張慶來.面向海量文獻(xiàn)的數(shù)字化系統(tǒng)研究[J].圖書與情報,2010(2).