摘 要:本文以綜合大學(xué)圖書館為例,詳細(xì)分析了多校區(qū)圖書館書目數(shù)據(jù)庫整合中可能存在的問題,并就存在問題提出了具體解決辦法,對我軍院校多校區(qū)書目數(shù)據(jù)庫的整合及管理將得到有益幫助。
關(guān)鍵詞:多校區(qū) 圖書館 整合 書目數(shù)據(jù)
中圖分類號:G253 文獻標(biāo)識碼:A 文章編號:1672-3791(2013)06(a)-0248-01
綜合大學(xué)多校區(qū)有多館逐步過渡到一個總館,圖書館的書目數(shù)據(jù)和館藏的整合是圖書館工作面臨的一個重要課題。本人就多年從事圖書館管理工作的工作實踐,根據(jù)總館與各分館書目數(shù)據(jù)的現(xiàn)狀整合經(jīng)驗談?wù)勛约嚎捶ǎ云鋵︻愃凭C合大學(xué)圖書館在書目數(shù)據(jù)庫整合上有所借鑒。
1 書目數(shù)據(jù)及館藏整合過程可能存在問題
隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)、計算機技術(shù)的快速發(fā)展,為了提升圖書館自動化業(yè)務(wù)管理水平,圖書館開始相繼使用自動化管理系統(tǒng),這對獨立館藏圖書管理是有效的,但如何對多館書目數(shù)據(jù)進行整合,必須要解決以下幾個問題。
1.1 分類標(biāo)準(zhǔn)不一致
對整合前各圖書館來說,有的館需要重點收藏的文獻,而對其館則可能是非重點收藏的文獻。圖書館整合后對同一種類的文獻就有多種不同的分類標(biāo)準(zhǔn)。這樣在各館書目數(shù)據(jù)中,就有不同程度地存在同書異號和異書同號現(xiàn)象。
1.2 書目記錄重復(fù)現(xiàn)象
書目數(shù)據(jù)的重復(fù)主要表現(xiàn)為同一種書有兩個或多個索書號,編目人員工作粗心大意,不認(rèn)真細(xì)致地查重,導(dǎo)致將復(fù)本書誤作新書著錄。有時因數(shù)據(jù)錄入錯誤,也會造成書目數(shù)據(jù)的重復(fù)記錄,通過對各館書目數(shù)據(jù)庫檢查,發(fā)現(xiàn)各館或多或少都存在書目記錄重復(fù)現(xiàn)象。
1.3 數(shù)據(jù)項著錄詳簡程度不一致
其一雖然校、院圖書館都采用總參軍訓(xùn)部統(tǒng)一配發(fā)的軍隊院校圖書館網(wǎng)絡(luò)管理系統(tǒng)(MILNETS系統(tǒng)),但各館在數(shù)據(jù)項的著錄上要求不同,而數(shù)據(jù)項著錄的詳簡也不完全相同,著錄標(biāo)準(zhǔn)也不一致。其二編目人員對文獻著錄標(biāo)準(zhǔn)理解不一致。
1.4 條碼號(財產(chǎn)登錄號)重復(fù)
條碼號的重復(fù)。多數(shù)圖書館業(yè)務(wù)工作進行了計算機自動化管理,基本實現(xiàn)了計算機編目、流通等功能模塊,各館原有的圖書條形碼一直保留在現(xiàn)系統(tǒng)中,如果把這些書目數(shù)據(jù)整合到一起,必然會引起不同種書圖書條碼會有重復(fù)現(xiàn)象,因此,圖書條碼號重復(fù)會給書目數(shù)據(jù)整合和流通借閱工作造成很大的麻煩。
1.5 書標(biāo)位置、規(guī)格、顏色不一致
由于各館根據(jù)自己館藏特點,圖書上書標(biāo)的顏色、位置、規(guī)格各不相同,每個館至少有兩種以上的顏色,而且各館根據(jù)自己的館藏確定書標(biāo)的位置,這樣造成了書標(biāo)位置也不一樣(有高有低)。
2 解決問題的途徑
2.1 刪除重復(fù)記錄
書目數(shù)據(jù)在整合前,各館要對各自書目數(shù)據(jù)庫的重復(fù)記錄要進行刪除,制定判重規(guī)則,讓計算機能夠識別重復(fù)記錄,進行自動識別處理。判重條件可包括:題名、責(zé)任者、版次、ISBN、出版社、頁碼等項。盡可能保證各學(xué)院圖書館書目數(shù)據(jù)唯一性。重復(fù)書目數(shù)據(jù)刪除應(yīng)更改與其相對應(yīng)流通書庫里的條形碼、館藏位置、索書號等信息。由于編目人員書目數(shù)據(jù)著錄不盡相同,導(dǎo)致計算機系統(tǒng)難以識別所有相同的書目數(shù)據(jù),一些重復(fù)記錄還需要人工干預(yù)進行判重處理。
2.2 按照標(biāo)準(zhǔn)選定基礎(chǔ)數(shù)據(jù)庫
第一步,選定基礎(chǔ)數(shù)據(jù)庫。重復(fù)數(shù)據(jù)合并時,原則上應(yīng)該保留一條MARC質(zhì)量最好的數(shù)據(jù),將其余數(shù)據(jù)刪除。由于系統(tǒng)自動判斷MARC質(zhì)量高低難度很大,所以在合并之前,應(yīng)組織專家對將要合并的各館書目數(shù)據(jù)庫進行評估,在評估過程中,應(yīng)參考兩個重要指標(biāo):其一要根據(jù)CNMARC標(biāo)準(zhǔn)選一個數(shù)據(jù)相對最為標(biāo)準(zhǔn)的書目數(shù)據(jù)庫作為合并基礎(chǔ),書目數(shù)據(jù)標(biāo)準(zhǔn)直接影響數(shù)據(jù)庫的質(zhì)量;其二要考慮書目數(shù)據(jù)庫記錄數(shù)的數(shù)量,記錄數(shù)的多少將直接影響以后圖書整合的工作量,兩種因素應(yīng)綜合考慮,以選取適合本校的基礎(chǔ)數(shù)據(jù)庫。
2.3 構(gòu)建查重書目數(shù)據(jù)流程
首先選定基礎(chǔ)數(shù)據(jù)庫,以基礎(chǔ)數(shù)據(jù)庫為標(biāo)準(zhǔn),其它三館的書目數(shù)據(jù)依次進行查重比對,對于重復(fù)的記錄和未重復(fù)的書目數(shù)據(jù)記錄進行相關(guān)信息處理(重復(fù)如復(fù)本量累加、建立與基礎(chǔ)書目數(shù)據(jù)索書號的映射表等;未重復(fù)記錄進行書目信息追加、索書號重新更改等,系統(tǒng)自動判重方式的核心是編寫判重算法規(guī)則的處理程序)。
其次制定判重規(guī)則,在制定規(guī)則時應(yīng)考慮重復(fù)記錄的要素和特征。系統(tǒng)自動判重必須在書目記錄高度匹配的情況下方可自動合并,而匹配數(shù)據(jù)運算又是一個時間消耗過程。因此,為了提高數(shù)據(jù)查重和匹配效率,確定重復(fù)記錄的要素和特征時,應(yīng)選擇合適的字段作為重復(fù)記錄的判重檢查點。常被選擇為系統(tǒng)判重檢查點的字段有:題名、責(zé)任者、ISBN號/統(tǒng)一書號、版次號、出版社、出版地、出版時間等字段。數(shù)據(jù)匹配點的檢查原則應(yīng)忽略全角、半角的輸入方式(包括漢字與阿拉伯?dāng)?shù)字);忽略外文字母的大、小寫;忽略空格及各種標(biāo)點符號等。
再次制定判重數(shù)據(jù)處理方法,應(yīng)根據(jù)選定的判重字段進行篩選,完全相同者視為重復(fù)記錄,如果判重點不完全匹配,在專用合并程序輔助下進行人工判重。以表格形式兩條記錄同時顯示出來,由人工來確認(rèn)是否重復(fù)數(shù)據(jù)。若是重復(fù)數(shù)據(jù),選擇一條質(zhì)量最好的數(shù)據(jù)作為合并基礎(chǔ)進行合并,若不是重復(fù)數(shù)據(jù),繼續(xù)保留。人工判重比較靈活,判重的準(zhǔn)確率比較高,比規(guī)定某幾個字段的條件進行比較判重更科學(xué)。在處理重復(fù)記錄過程中,應(yīng)采取系統(tǒng)與人工輔助相結(jié)合的方法。
2.4 圖書條碼的使用
圖書條碼為確保其唯一性,否則將造成不同圖書,圖書條碼號可能相同,無法保證圖書條碼唯一性,條碼的更改應(yīng)在書目數(shù)據(jù)合并前進行,這樣可更好地提高工作效率。
2.5 書標(biāo)的解決方法
針對各館書標(biāo)顏色(紅、綠、蘭)、位置高低及用途不同,合并后圖書館書標(biāo)顏色、位置必須統(tǒng)一,最捷徑的辦法應(yīng)該以基本書目數(shù)據(jù)庫為基準(zhǔn),在此基礎(chǔ)上根據(jù)館藏特點來決定是否增加書標(biāo)顏色,若其他館藏圖書的書標(biāo)位置與基礎(chǔ)書目數(shù)據(jù)庫中的圖書書標(biāo)位置不一致,在處理時應(yīng)以基礎(chǔ)數(shù)據(jù)庫中的書標(biāo)位置為標(biāo)準(zhǔn),在綜合考慮美觀、整齊、經(jīng)濟的基礎(chǔ)上制定適合本單位實施方案。
參考文獻
[1]黃艷芬.淺議合并院校圖書館館書目數(shù)據(jù)庫整的合[J].圖書館論壇,2003(4):20.