耿文紅,陳 晨,張 莉,郭 淼
(北方科技信息研究所,北京 100089)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,全球信息量在以井噴的速度沖擊我們的視線,一方面是圖書館數(shù)據(jù)庫,無論是紙質(zhì)還是電子化記載的數(shù)據(jù),需要收集和存儲的信息資源日益增長,另一方面,用戶想要得到最全面的數(shù)據(jù),則需在海量的數(shù)據(jù)中層層篩選,無疑增加了工作成本和時間成本。為縮短檢索時間,需要更快捷更專業(yè)更現(xiàn)代化的圖書資料數(shù)據(jù)庫,提供最直接最全面的信息資源。為適應時代需求,我們不能只限于數(shù)字化一些當前信息,丟棄傳統(tǒng)文獻,使它們成為“睡美人”,這是一種資源的浪費,我們有責任把傳統(tǒng)文獻與數(shù)字資源進行元數(shù)據(jù)整合,給讀者和用戶提供系統(tǒng)化、專業(yè)化,網(wǎng)絡化的文獻服務。
傳統(tǒng)運行模式的圖書館里,會對圖書館內(nèi)部所擁有的書籍資料名稱和存放地點進行記錄,也就是創(chuàng)建目錄。[1]這樣的管理模式,使用者能夠根據(jù)目錄對信息資源進行統(tǒng)計,快速找到想要的書籍,為使用者提供了不少的便利。但為了數(shù)字化這些傳統(tǒng)文獻,尤其是紙質(zhì)文獻,需要投入大量的人力物力,對傳統(tǒng)文獻進行掃描、復印、數(shù)據(jù)加工、校對入庫。以兵器情報中心文獻館為例,從2004年開始建設數(shù)字化圖書館,每年復制掃描人員不僅要完成當年采購資料的數(shù)字化工作,還要對文獻館成立以來,所有的紙質(zhì)文獻逐一掃描,幾十萬份資料無疑是個漫長而龐大的工程,費時費力,但作為數(shù)據(jù)庫的基礎工作,這項工作又是必需的。
科研人員對信息資源進行檢索時,可能輸入同樣的關(guān)鍵詞,通常情況下數(shù)據(jù)庫會為讀者推送批量元數(shù)據(jù),科研人員要根據(jù)需求進行仔細篩選。這個檢索的過程中,數(shù)據(jù)庫元數(shù)據(jù)的加工質(zhì)量,直接影響檢索結(jié)果和信息質(zhì)量。元數(shù)據(jù)加工過程不僅要求掃描復制人員保證資料的清晰完整,最重要的是數(shù)據(jù)加工人員對科研論文及學術(shù)資料的理解和把握,要以最精確最專業(yè)的國防敘詞主題詞,標引資料主題,并將文獻資料做準確分類,避免出現(xiàn)泛泛之詞,造成檢索結(jié)果大量重復和沒有明確指向的擦邊內(nèi)容,每一條文獻資源所要表達的內(nèi)容都是不同的信息,要確保檢索結(jié)果與文獻資源的高度一致性。
從上世紀90年代開始,國際上已經(jīng)有相當多的圖書館意識到了數(shù)字元數(shù)據(jù)整合的重要意義,開始進行數(shù)字資源與傳統(tǒng)文獻元數(shù)據(jù)整合的工作。有一部分圖書館從系統(tǒng)層入手,花費資金鋪設了一個系統(tǒng)。數(shù)字資源作為新的資源形式放到這個特定的系統(tǒng)里面,與傳統(tǒng)文獻資源分隔開來,等到實際使用的時候,圖書館管理人員可以通過事先搭建的相關(guān)鏈接,為使用者搜索到相要的信息資源。這樣的做法既有存在的價值,也有一定的弊端:使用這樣的方法對元數(shù)據(jù)進行整合,確實可以方便圖書館工作人員的操作,因為該方法實現(xiàn)的過程中對工作人員的各項能力并沒有很多的要求。這種方法的壞處就是,只創(chuàng)建了這樣一個系統(tǒng),將數(shù)字資源和傳統(tǒng)文獻資源分隔開來,并沒有從數(shù)據(jù)層面對整個資源庫進行整合。[2]雖然這樣的方法可以加快元數(shù)據(jù)整合的速度,但是整合出來的質(zhì)量很差,這樣的措施對圖書館未來的長遠發(fā)展沒有什么實質(zhì)性的幫助。還有一點問題在于,系統(tǒng)只單單設置在數(shù)字資源方面,傳統(tǒng)文獻資源方面不能通過系統(tǒng)來進行規(guī)范。讀者檢索資源的時候,只有資源處于系統(tǒng)內(nèi)時才能享受到系統(tǒng)所帶來的快捷便利服務,當資源沒有處于系統(tǒng)內(nèi)時還是只能選用較為麻煩的方式搜索查找資源,這不是很符合元數(shù)據(jù)整合工作的初衷。
除了從系統(tǒng)層面入手外,部分圖書館還從數(shù)據(jù)層面開展工作,實現(xiàn)元數(shù)據(jù)整合。簡單一點的方法就是將傳統(tǒng)文獻資源進行標引,并將標引的相關(guān)內(nèi)容上傳,將傳統(tǒng)文獻資源與數(shù)字資源相結(jié)合,讀者在搜索關(guān)鍵詞的時候,能夠通過上傳的數(shù)字鏈接,找到想要的資源的出處,從而找到想要的信息。[3]復雜一點的辦法就是對元數(shù)據(jù)進行分類,根據(jù)類別整合。這樣的方法相較于簡單的方法來說更加方便了讀者的使用,而且數(shù)據(jù)也更加的有條理性。而數(shù)據(jù)標引與分類相結(jié)合,則形成了數(shù)字圖書館數(shù)據(jù)庫建設最基礎的數(shù)據(jù)加工流程,需要專業(yè)、耐心、認真的工作態(tài)度,才能完成此項工作。
隨著科研一線對文獻資源的需求增大,文獻資源要開展專題數(shù)據(jù)庫服務,利用數(shù)圖的數(shù)字化資源,根據(jù)特定用戶的需求,制成網(wǎng)絡版、單機版或光盤版的專題全文數(shù)據(jù)庫,為特定用戶提供專題數(shù)據(jù)庫服務,定期更新,依托強大的數(shù)字文獻資源,把數(shù)字圖書館建成主動型服務型數(shù)字圖書館。
數(shù)字資源與傳統(tǒng)文獻元數(shù)據(jù)整合的理念是符合信息化時代的發(fā)展需求的,相關(guān)人員要努力做好這個工作。在整合的過程中,要秉持著讀者即上帝的原則,為讀者提供更好的服務,同時還要根據(jù)實際情況,努力將整合之后的信息資源有效的利用起來,更好的服務于大眾、服務于科研,使傳統(tǒng)文獻與數(shù)字文獻創(chuàng)造更大的社會效益和經(jīng)濟效益。