趙長波
(遼寧省圖書館,遼寧 沈陽 110167)
淺談古籍?dāng)?shù)字化操作中的問題及對策
趙長波
(遼寧省圖書館,遼寧 沈陽 110167)
古籍?dāng)?shù)字化是古籍再生性保護(hù)的重要手段。目前,古籍?dāng)?shù)字化的具體操作中存在著一定的問題,包括古籍?dāng)?shù)字化的硬件設(shè)備、古籍?dāng)?shù)字化人員不足以及古籍?dāng)?shù)字化掃描軟件缺陷等。對這些問題進(jìn)行了初步探討,并提出相應(yīng)的對策。
古籍 古籍?dāng)?shù)字化 再生性保護(hù)
古籍?dāng)?shù)字化是以保護(hù)和利用古籍為目的,利用掃描、拍照等技術(shù)手段,將古籍的文本信息轉(zhuǎn)化為計(jì)算機(jī)識別的數(shù)字符號,進(jìn)而揭示古籍文獻(xiàn)中包含的信息資源的系統(tǒng)工作。由于古籍尤其是善本古籍的歷史文物性,使得在我國大多數(shù)的古籍收藏單位都嚴(yán)格限制其原件使用。目前來看,古籍?dāng)?shù)字化是對古籍進(jìn)行再生性保護(hù)的重要手段之一,包括商業(yè)數(shù)據(jù)公司、圖書館系統(tǒng)和一些科研機(jī)構(gòu),近年來都進(jìn)行了卓有成效的工作,取得了豐碩的數(shù)字化成果。同時(shí),古籍?dāng)?shù)字化也成為近年來學(xué)界研究的熱點(diǎn)問題。在中國知網(wǎng)上僅以“古籍?dāng)?shù)字化”來搜索相關(guān)的論文即有近千篇之多,相關(guān)的著作包括毛建軍的《古籍?dāng)?shù)字化理論與實(shí)踐》與王立清的《中文古籍?dāng)?shù)字化研究》等。這些論著對古籍?dāng)?shù)字化的各方面幾乎都有涉足,但美中不足的是,對古籍?dāng)?shù)字化實(shí)際操作中存在的問題和應(yīng)該采取的對策,卻鮮有論述。筆者近年來一直從事古籍?dāng)?shù)字化的相關(guān)工作,在實(shí)踐中對一些相關(guān)問題深有體會,現(xiàn)不揣鄙陋,對古籍?dāng)?shù)字化具體操作中存在的問題進(jìn)行初步探討,以期拋磚引玉。
1.1 操作設(shè)備未能盡善盡美
1.1.1 操作平臺設(shè)計(jì)不足,現(xiàn)有掃描模式效果不甚理想
古籍?dāng)?shù)字化操作平臺是進(jìn)行古籍?dāng)?shù)字化的主要硬件。從全球范圍來看,真正做到完全符合古籍?dāng)?shù)字化各項(xiàng)標(biāo)準(zhǔn)的操作平臺幾乎沒有。以遼寧省圖書館為例,該館現(xiàn)有善本12萬余冊,目前只有一臺專業(yè)的德國Bookeye4自動書刊掃描儀掃描的書影能夠達(dá)到國家古籍保護(hù)中心的要求。Bookeye4掃描儀可以說是目前進(jìn)行古籍?dāng)?shù)字化較為高端的設(shè)備,但其操作平臺最大只可以掃描A2幅面,對一些大型地圖和篇幅較大的古籍只能先分段掃描,后期再進(jìn)行整理拼接,拼接后的書影容易與一次掃描的書影有出入,并且費(fèi)時(shí)費(fèi)力。
Bookeye4掃描儀具有“V”型掃描和書籍折葉修正掃描等模式,但這兩種模式掃描后的書影效果并不理想,達(dá)不到國家古籍保護(hù)中心規(guī)定的原始書影采集標(biāo)準(zhǔn),只能改用平面壓板式掃描。這種掃描方式需要使古籍左右兩頁基本處在同一水平線上,為了達(dá)到這一要求,要在薄的一頁后面進(jìn)行墊板(如圖1所示)。由于操作平臺不具備升降功能,導(dǎo)致有些古籍還需要在書脊下墊板,在調(diào)整古籍位置時(shí)墊板很容易滑出,如果是稍微滑出一點(diǎn),在圖像放大時(shí)才能看清,后期質(zhì)檢時(shí)發(fā)現(xiàn)這樣的書影就要返工重新掃描(如圖2所示)。更主要的是,操作人員要經(jīng)常接觸古籍,極易對古籍造成二次破壞。此外,目前使用的普通鋼化玻璃板用久會產(chǎn)生劃痕,并且因?yàn)槭鞘謩臃?,一般掃?到5幅書影就要對玻璃板進(jìn)行清理、擦拭,無疑會影響到掃描速度。
圖1
遼寧省圖書館目前新購入的一臺德國Bookeye3掃描儀(正在調(diào)試階段),雖然操作平臺具備了升降功能,并且標(biāo)配了水平壓稿玻璃,但經(jīng)過反復(fù)調(diào)試后仍有兩個無法解決的問題:一是由于該掃描儀的光源是從兩側(cè)偏上打入,掃描完成后的書影中縫處有一道明顯的黑影(如圖3所示),古籍越厚陰影越明顯;二是對黑色或者深藍(lán)色的古籍封面、封底無法識別。針對這兩個問題,筆者專門與國家古籍保護(hù)中心的老師進(jìn)行了溝通,認(rèn)定此款掃描儀掃描成型后的書影達(dá)不到國家古籍保護(hù)中心的要求。
圖2
圖3
1.1.2 掃描儀的操作環(huán)境仍需改善
由于受自然光照環(huán)境的影響,使得掃描的古籍書影有時(shí)會出現(xiàn)偏色和色彩分布不均等情況(如圖4所示),從而影響掃描效果,需要經(jīng)常反復(fù)加工、多次掃描才能達(dá)到要求。
圖4
1.1.3 存儲空間不足
設(shè)備存儲空間不足也是操作中存在的問題之一。掃描后的古籍書影基本都是以TIFF無壓縮圖像進(jìn)行存儲,每個書影在后期加工處理前都在100MB左右,這樣算來,每人每天掃描的圖像數(shù)據(jù)容量在10GB左右,占用的空間相當(dāng)大,經(jīng)常出現(xiàn)電腦空間不足,即使是將掃描好的書影剪切到移動硬盤或者其他磁盤上,復(fù)制速度較慢,同時(shí)只能是以點(diǎn)對點(diǎn)的形式進(jìn)行保存,很容易造成數(shù)據(jù)丟失,對數(shù)據(jù)安全造成隱患。
1.2 古籍?dāng)?shù)字化人員嚴(yán)重缺乏
現(xiàn)階段,遼寧省圖書館從事古籍?dāng)?shù)字化掃描工作的人員很少,從筆者與其他省市公共圖書館員的溝通來看,或多或少都存在著這樣的問題。這就導(dǎo)致古籍?dāng)?shù)字化人員的工作量特別大,從前期整理、原始書影采集,到后期糾偏裁切、元數(shù)據(jù)著錄等都由一名同志完成,在不包括元數(shù)據(jù)著錄的情況下,每人每天最多只能處理100幅書影左右,大大影響了掃描速度,而且容易造成漏掃、多掃與重復(fù)掃描等問題。
1.3 操作軟件存在缺陷
Bookeye掃描儀所自帶軟件雖然經(jīng)過多次升級,但仍然沒有完全漢化。此外,軟件的默認(rèn)設(shè)置參數(shù)比較混亂。比如:每次掃描設(shè)置好的分辨率400DPI、TIFF無壓縮格式、平面掃描、矩形裁切等參數(shù)無法保存,掃描不同部古籍時(shí)默認(rèn)參數(shù)每次都不一樣,有時(shí)其他參數(shù)不變,只將TIFF無壓縮格式變成TIFF-G4,或者只將TIFF格式變成PDF格式等等,一不小心就容易出錯,所以每次打開軟件都需要重新設(shè)定參數(shù)。同時(shí)該軟件裁切和傾斜校正參數(shù)不完善,無法精確設(shè)置留邊1CM,也沒有大批量處理功能,需要利用其他軟件逐幅書影進(jìn)行糾編和裁切,給書影的后期加工處理增加了難度。
1.4 古籍元數(shù)據(jù)著錄尚有不明確之處
在填寫《文獻(xiàn)整理登記表(各卷)》中,葉數(shù)一欄的規(guī)定是阿拉伯?dāng)?shù)字。除封面、前護(hù)、后護(hù)、封底單獨(dú)統(tǒng)計(jì)葉數(shù)外,各卷葉數(shù)均在此填寫。但如果上一卷卷末和下一卷卷端在同一頁上則沒有明確的規(guī)定(如圖5所示),容易造成卷次葉數(shù)統(tǒng)計(jì)混亂。
圖5
2.1 改善操作環(huán)境,加大設(shè)備投入力度
應(yīng)提供專門的古籍?dāng)?shù)字化加工場地,改善古籍?dāng)?shù)字化的工作環(huán)境;在購入掃描儀時(shí),操作平臺應(yīng)滿足不同尺寸古籍掃描工作的需要;操作平臺最好是能夠具有升降功能的電動書稿臺;要帶有平面透明電動壓稿玻璃;掃描儀的光源要與德國Bookeye4一樣從正上方打入;對深顏色能夠完整識別等,盡量使操作人員減少接觸古籍的次數(shù);加大計(jì)算機(jī)自帶硬盤的存儲空間,最少需要1TB才能保證整部古籍的掃描不間斷。
2.2 加強(qiáng)古籍?dāng)?shù)字化人才隊(duì)伍建設(shè),提高人員的整體素質(zhì)
2.2.1 古籍?dāng)?shù)字化是一個人力密集型的行業(yè)
以國家圖書館數(shù)字方志掃描項(xiàng)目為例,若要求每天掃描10000葉,需配置項(xiàng)目經(jīng)理1人,古籍編目專家1人,軟件工程師1人,設(shè)備維護(hù)工程師1人,數(shù)據(jù)加工人員共分4組,前整理組4人,圖像采集組8人,圖像處理組12人,圖像質(zhì)檢組4人,目錄標(biāo)引組3人,這樣才能保證圖像數(shù)據(jù)加工的數(shù)量與質(zhì)量。目前按照遼寧省圖書館的標(biāo)準(zhǔn),最少需要配置前期整理1人,圖像處理兩人,圖像質(zhì)檢1人,元數(shù)據(jù)著錄兩人,才能保證圖像數(shù)據(jù)加工的質(zhì)量。
2.2.2 提高古籍?dāng)?shù)字化操作人員的整體素質(zhì)
古籍?dāng)?shù)字化操作人員必須由事業(yè)心、責(zé)任心強(qiáng)的同志擔(dān)任,因?yàn)閽呙璧墓偶S多已經(jīng)入選《國家珍貴古籍名錄》,其中不乏宋元精品。所以要求操作人員必須嚴(yán)格按照相關(guān)規(guī)定要求進(jìn)行數(shù)字化加工,強(qiáng)化個人素質(zhì)和職業(yè)道德的修養(yǎng),進(jìn)而提高古籍?dāng)?shù)字化隊(duì)伍的整體素質(zhì),同時(shí)這也是古籍?dāng)?shù)字化不可或缺的,因?yàn)橐幻咚刭|(zhì)的操作人員直接關(guān)系到古籍?dāng)?shù)字化的質(zhì)量。
2.2.3 加強(qiáng)古籍?dāng)?shù)字化操作人員的業(yè)務(wù)培訓(xùn)
古籍?dāng)?shù)字化需要有較強(qiáng)業(yè)務(wù)能力和綜合素質(zhì)的人才。為此,需要進(jìn)行相關(guān)的人員培訓(xùn)。其中既要包括與數(shù)字化加工相關(guān)的技能培訓(xùn),如掃描、拍照、圖像處理等,也包括古籍基礎(chǔ)知識、古籍版本鑒定、古籍普查、古籍修復(fù)及古籍元數(shù)據(jù)著錄等知識培訓(xùn)。
在培訓(xùn)方式上,可以采取“請進(jìn)來,走出去”的方式。“請進(jìn)來”即請國家古籍保護(hù)中心或者相關(guān)的專家實(shí)地對數(shù)字化加工中存在的問題進(jìn)行指導(dǎo);“走出去”即指派操作人員參加由國家古籍保護(hù)中心舉辦的各類古籍培訓(xùn)班,為以后的人員管理、文獻(xiàn)管理、數(shù)字化加工業(yè)務(wù)管理打下良好的基礎(chǔ)。
2.3 進(jìn)一步完善掃描設(shè)備的操作軟件
古籍?dāng)?shù)字化設(shè)備供貨商要多征求古籍?dāng)?shù)字化實(shí)踐人員的意見,定期對軟件進(jìn)行更新升級,如將設(shè)置參數(shù)固定化,避免重復(fù)設(shè)定,將圖像裁切和校正參數(shù)進(jìn)一步完善,增加批次處理功能等;要根據(jù)用戶需求完善掃描硬件的配置,如能否將現(xiàn)有操作臺添加升降功能和配備高質(zhì)量的水平壓稿玻璃等。只有這樣,才能更好地提高古籍?dāng)?shù)字化掃描效率以及書影質(zhì)量。此外,應(yīng)該利用微信等形式,隨時(shí)與用戶進(jìn)行溝通,不斷予以改進(jìn)。
2.4 明確元數(shù)據(jù)著錄各項(xiàng)表格的填寫
元數(shù)據(jù)著錄具有多樣性、復(fù)雜性和不規(guī)范性,是一項(xiàng)要求很高的工作,它需要操作人員既要懂得古籍整理相關(guān)知識,又要精通計(jì)算機(jī)操作,著錄時(shí)更要細(xì)心,耐心,有不明確的地方要及時(shí)向有關(guān)專家請教,也可以通過網(wǎng)絡(luò)、電話等方式與國家古籍保護(hù)中心的老師溝通,盡量保證元數(shù)據(jù)著錄的準(zhǔn)確。
古籍?dāng)?shù)字化是一項(xiàng)系統(tǒng)工程。目前來看,日本、中國臺灣等國家和地區(qū)都已取得了令人矚目的成績。2007年“中華古籍保護(hù)計(jì)劃”實(shí)施以來,建立“中華古籍?dāng)?shù)字資源庫”是其中的重要內(nèi)容。按照“統(tǒng)一規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、合作共建、資源共享”的原則,以及“邊建設(shè)邊服務(wù)”的宗旨,通過中國古籍保護(hù)網(wǎng)將古籍?dāng)?shù)字化成果向全社會提供服務(wù),而古籍?dāng)?shù)字化也必將迎來發(fā)展建設(shè)的歷史機(jī)遇。
[1]康爾琴.我國古籍?dāng)?shù)字化建設(shè)探析[J].圖書館學(xué)刊,2010(6).
[2]劉偉紅.中文古籍?dāng)?shù)字化的現(xiàn)狀與意義[J].圖書與情報(bào),2009(4).
趙長波 男,1981年生。本科學(xué)歷,助理館員。
G255.1
2016-04-11;責(zé)編:徐向東。)