■ 張鳳剛
圖書,是一代又一代人知識的凝聚、智慧的結(jié)晶。在風(fēng)云際遇的歷史長河中,為社會(huì)留下了一串串厚重的足印。云南省檔案館館藏圖書資料品種豐富,包括明清時(shí)期、民國時(shí)期、革命歷史時(shí)期、建國后時(shí)期約十萬冊。裝幀多樣、版本各異,諸如圖書、報(bào)刊、雜志、叢書、圖冊、影印本等類別齊全。為了使查閱利用者獲得云南社會(huì)發(fā)展全方位、多角度的直觀感受,2019年6月,省檔案館啟動(dòng)館藏圖書資料數(shù)字化庫建設(shè),計(jì)劃覆蓋所有圖書資料館藏。屆時(shí),將極大方便廣大研究人員、大中專院校師生、文學(xué)歷史愛好者的查閱利用需求,也將為館藏檔案史料的開發(fā)挖掘提供新的契機(jī)。
民國圖書資料數(shù)字化著錄條目
檔號為D-005147 的圖書數(shù)字化圖像
省館決定先從掃描難度最大,但是利用需求最高的民國時(shí)期圖書資料著手加工。館藏民國圖書資料約有一萬冊,即在1949年10月建國以前的民國時(shí)期印制。首期數(shù)字化3523 本,內(nèi)容涉及政治、經(jīng)濟(jì)、軍事、歷史、工業(yè)、文學(xué)、哲學(xué)、法律、教育、藝術(shù)、地理等社會(huì)的方方面面。
通過對原書的逐頁翻檢,了解其保存狀況,為后續(xù)的保護(hù)與修復(fù)提供依據(jù)。檢查過程中記錄褪色、擴(kuò)散、脫頁、殘頁、缺頁、跳頁、夾紙、夾字、粘連、蟲蛀、脆化、污漬、空白頁等情況。其中,當(dāng)書況有輕微破損瑕疵或是開膠脫垂時(shí),要準(zhǔn)備漿糊、毛筆、裁尺、裁刀、襯板、襯紙等工具,對其進(jìn)行修補(bǔ)。有嚴(yán)重書質(zhì)問題、不能直接掃描的書;或是書脊熔粘膠老化開裂,造成書頁零散,需用棉線把書攔腰捆扎。這些問題書籍都要裝入裝具(如大信封),注明破損狀況,不予加工,以免毀損。
民國圖書和古籍不同。古籍,又叫善本,是指未采用現(xiàn)代印刷技術(shù)印制的書籍。雖然民國圖書資料有相當(dāng)一部分是線裝書,而且反映的內(nèi)容是明清時(shí)期的,如《周禮精華》《四部備要》《御批歷代通鑒輯覽》《春秋三傳》《古今清版圖書集成》等,但均為正式出版社印刷的書籍,所以不能稱為古籍。因此,民國圖書資料的數(shù)字化不能依據(jù)2014年5月由國家古籍保護(hù)中心出臺的古籍?dāng)?shù)字化工作手冊(試用本)中的著錄規(guī)范來直接套用(現(xiàn)在云南省圖書館對保存的古籍?dāng)?shù)字化加工是采用此規(guī)范)。
圖書在古代稱作典籍,也叫文獻(xiàn),兼有文書、檔案、書籍三重意義。但是在近現(xiàn)代社會(huì),隨著各領(lǐng)域功能定義的范疇不斷細(xì)化,致使館藏圖書資料和館藏文書檔案也有其差異性:檔案本質(zhì)上是人們在社會(huì)實(shí)踐中直接形成的原始記錄;圖書本質(zhì)上是系統(tǒng)知識的結(jié)晶,是人類對自然及社會(huì)現(xiàn)象進(jìn)行系統(tǒng)認(rèn)識研究的結(jié)果。所以,圖書檔號的編號規(guī)則有其特殊性。省館尊重圖書的原始屬性,根據(jù)中國圖書館圖書分類法來標(biāo)注每本書的檔號。檔號是唯一的,編號規(guī)則是:圖書分類號+書次號(六位數(shù)字)。如D-005147,代表D 類圖書在庫房排架第五千一百四十七本書,不夠六位的補(bǔ)零。
中國圖書館圖書分類法簡表(部分)
在工作開展伊始,就要設(shè)置若干著錄字段。如書名、檔號、分類號、書次號、頁數(shù)、開本、冊數(shù)、出版發(fā)行者、作者、其他作者、叢書名、出版發(fā)行地、出版發(fā)行時(shí)間、價(jià)格、版本、備注等。原書涵蓋的信息都要完整著錄。其中,每本書一個(gè)檔號,即為一條條目,包括叢書,有幾本書就有幾個(gè)檔號,即有幾條。如果是上下冊,則共用一個(gè)檔號,一并掃描。
圖書資料以冊為單位進(jìn)行數(shù)字化,從封面、正文、封底依次加工。掃描設(shè)備選擇零邊距平板掃描儀、A3 幅面、光學(xué)分辨率600DPI、24 位真彩。數(shù)字化環(huán)境注意防護(hù)光源,避免透光或反光的影響。按1:1 比例掃描,圖像不能有明顯歪斜。如原件有粘貼物,先將原件與粘貼物一起掃描,然后將粘貼物掀開,再次掃描原件,這樣就獲得2 個(gè)圖像。原書透字時(shí),需墊上顏色相近的襯紙后掃描。發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。
按裝幀方式來看,民國圖書主要分為精裝、膠裝、線裝書幾大類。每個(gè)類別都有符合其自身特點(diǎn)的加工設(shè)備和方式。精裝本數(shù)量不多,主要是各類詞典、紀(jì)念冊、圖冊等。書的封面封底多是硬殼,內(nèi)頁的紙質(zhì)也比較好、比較厚,不透字、不透光、字跡清晰、印刷精良。省館存有一臺彩色仿真復(fù)制非接觸掃描儀,采用投射式無炫目冷光源、高精度真彩色掃描鏡頭、自動(dòng)開啟壓稿玻璃、自適應(yīng)壓力調(diào)節(jié)托稿臺,專門針對此類書籍而設(shè)。其余的普裝書(即膠裝、線裝等),由于加工進(jìn)度所限,需要采用流水化作業(yè),適用于普通的平板掃描儀。其中,線裝書頁面主要有筒子頁、半頁、雙半頁等,由于紙薄易透,需要襯紙掃描;必要的時(shí)候,可以拆線展平,單頁依次掃描。
拆線展平后的筒子頁掃描圖像
在未改變原掃描件的色彩、分辨率、格式、壓縮等情況下進(jìn)行,減少對圖像的后期處理。
監(jiān)理人員對照原書,對剪輯以后的圖像逐頁檢查。檢查是否有透字、裁字、變形、雜點(diǎn)、彩線、黑邊、歪斜、雜色、模糊、漏頁、重頁、顛倒、背面、無邊距、褶皺等現(xiàn)象。
個(gè)別厚書由于掃描中出現(xiàn)弧度,需拆線壓實(shí),每頁依次平掃。掃描完畢后,準(zhǔn)備棉線、剪刀、針錐等工具,按照三孔/ 四孔裝訂法,盡量原孔裝訂還原,要求頁面按原書排列準(zhǔn)確,不得跳頁、漏頁。
一是安全性保管條件苛刻,不可抗力會(huì)發(fā)生損耗。圖書資料從恒溫恒濕、相對封閉的檔案庫房調(diào)出,進(jìn)入數(shù)字化加工場所。加工期間的人力調(diào)歸、搬動(dòng)、上架、下架、清點(diǎn)、拆裝、派發(fā)、翻動(dòng)、掃描、質(zhì)檢、入庫等各個(gè)流程都會(huì)直接和頁面接觸。本就年代久遠(yuǎn)、紙質(zhì)脆弱的頁面經(jīng)過一遍遍工序的損耗,直接會(huì)對頁面壽命產(chǎn)生重大影響。有時(shí)質(zhì)檢后返工,損耗的頻率就更高了。這就要求加工公司做好規(guī)劃,合理地調(diào)配人員、圖書的進(jìn)出庫頻率、優(yōu)化操作流程、熟練培訓(xùn)員工操作技能、避免重掃,盡量減少出庫圖書的損害;并且在加工場所、臨時(shí)庫房減少開關(guān)窗和柜門的次數(shù),保持清潔和一定的溫濕度,注意遮光。
二是書質(zhì)新舊不一、書況各異,需要修復(fù)、適配。由于加工公司的員工不是修復(fù)專業(yè)科班出身,修復(fù)技巧不如專業(yè)人員,在加工前期,只能適當(dāng)?shù)貙栴}輕微的圖書比如小破洞、小缺損、小蟲蛀等略作修補(bǔ)。對于問題嚴(yán)重的書籍,比如檔案磚、酸脆粉化的書籍無能為力,暫時(shí)不予調(diào)卷;已調(diào)出庫的要裝入大信封標(biāo)示,暫時(shí)擱置、不予加工。另外,古體書紙張和現(xiàn)今的印刷用紙有很大不同,又經(jīng)過了多年的生化積累,造成了材質(zhì)的特殊。對于透字透光書籍的襯紙問題,要盡量選擇顏色和材質(zhì)相近的襯紙。紙的種類繁多,如麻紙、綿紙、皮紙、宣紙、竹紙等,每種紙又分多種顏色,從黃褐色到淺黃、純白,深淺不一;又因?yàn)椴轁{成分含量的不同,從而形成各種規(guī)格。不同的顏色和材質(zhì)排列組合,又衍生許多紙張的適配性。到底選哪一種襯紙適合于哪一本書,情況復(fù)雜;并且經(jīng)過機(jī)器掃描以后的圖像和實(shí)際的原書對比,終究會(huì)有些許差異,只能是盡量保持一致。
三是圖書規(guī)格不同、印刷裝訂古今有異,需要選擇合適的掃描方式。較厚的書具有更強(qiáng)回彈力的書脊,很不容易壓實(shí)壓平,掃描儀平板蓋下來后直接造成書籍變形,從而造成圖像彎曲失真。掃描這類書籍,即使小心翼翼,但效果仍差強(qiáng)人意,并且效率不高。古體書印刷裝訂不如現(xiàn)在規(guī)整,書頁四圍留白有限,有時(shí)臨近中縫的字由于進(jìn)入了裝訂線內(nèi),造成夾字。但有的書本身的裝訂就是歪的,目測偏差有一定角度,這時(shí)就要實(shí)事求是,書本身是什么樣的,就按原狀態(tài)掃描。更有一些書歷經(jīng)輾轉(zhuǎn),最終進(jìn)入檔案館保存時(shí),面貌已然滄海桑田:許多書頁被圈點(diǎn)勾畫、批注剪貼,附著物眾多。主觀上加入了很多原有讀者的意志,具有很大隨意性。本著忠于原書的準(zhǔn)則,需要一一連帶著掃描,此時(shí)已經(jīng)不是一頁一個(gè)粘貼物,掃描得到兩個(gè)圖像的情形了,而是一頁多個(gè)圖像,容易造成頁碼的失序和利用者閱讀時(shí)的混亂。
四是館藏圖書根據(jù)類別進(jìn)行庫房排架,不分年代時(shí)期。經(jīng)過擇選后可以加工的書,和不適宜加工的書混雜在一起;民國時(shí)期的書和建國后的書編排在一起,彼此交織。所以,加工后進(jìn)入數(shù)據(jù)庫的圖書檔號并不全是按順序排列的,中間有跳號。不利于調(diào)歸卷的實(shí)施:加工人員通常要全體出動(dòng),分人分區(qū)域進(jìn)庫房撿卷。此時(shí)加工流程就要暫停,影響了項(xiàng)目的進(jìn)程。
綜上,省館館藏圖書資料并非所有都適合數(shù)字化,部分書籍只能待修復(fù)完畢后再行加工。另外,在現(xiàn)有技術(shù)、設(shè)備條件下,一些無法很好地達(dá)到掃描效果的圖書,即使很有利用價(jià)值,也只能擱置,進(jìn)而影響著整體的加工進(jìn)度。
省館館藏圖書資料形態(tài)瑰麗多姿、內(nèi)容包羅萬象,有許多還是異常珍貴的孤本。建設(shè)圖書資料數(shù)字化庫,能最大限度地對原書進(jìn)行保護(hù),有利于精細(xì)安全的檔案管護(hù)體系建立;同時(shí),對于檔案資源體系的全覆蓋和檔案利用體系的多層次建設(shè)也都具有重要意義。