肖麗萍
〔摘 要〕Millennium系統(tǒng)是美國INNOVATIVE公司開發(fā)的一個功能齊全的圖書館集成管理系統(tǒng),其發(fā)展已超過25年歷史,在國內(nèi)外擁有眾多用戶。我館于2006年引進(jìn)該系統(tǒng),本文結(jié)合2年的編目模塊實踐,從數(shù)據(jù)套錄、統(tǒng)計、數(shù)據(jù)質(zhì)量控制等方面,全面論述該系統(tǒng)在我館編目工作中的應(yīng)用,同時分析其存在的問題并提出解決的辦法。
〔關(guān)鍵詞〕Millennium系統(tǒng);編目;數(shù)據(jù)質(zhì)量控制
〔中圖分類號〕G254.3 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)07-0174-03
Applications and Problems of Utilizing Millennium System in CatalogingXiao Liping
(Library,Jinan University,Guangzhou 510632,China)
〔Abstract〕Millennium system is a full-featured integrated library management system developed by INNOVATIVE Corp.of USA with 25 years history and thousands of users worldwide.Based on two years cataloging experience since 2006,the author analyze the advantages of application of Millennium system in cataloging and provide solutions for the existing defects.
〔Key words〕Millennium System;Cataloging;Data Quality Control
2006年,暨南大學(xué)圖書館引進(jìn)Millennium系統(tǒng),該系統(tǒng)是由美國INNOVATIVE公司開發(fā)的一個集采訪、編目、流通、期刊、OPAC、系統(tǒng)管理等于一體的功能齊全的圖書館集成管理系統(tǒng),在全世界40多個國家和地區(qū)擁有眾多用戶。在中國內(nèi)地有清華大學(xué)、西安交通大學(xué)、華中科技大學(xué)、國家會計學(xué)院、浙江省圖書館等10多家圖書館使用,其功能全面、結(jié)構(gòu)嚴(yán)謹(jǐn),使用方便,得到用戶的廣泛認(rèn)可。本文將結(jié)合2年的編目模塊實踐,具體討論Millennium系統(tǒng)編目模塊應(yīng)用中的優(yōu)勢和存在的問題,分析其中原因,并提出較為可行的解決辦法。
1 Millennium系統(tǒng)編目模塊應(yīng)用的優(yōu)勢
1.1 支持多數(shù)據(jù)源檢索
在聯(lián)機(jī)合作編目的形勢下,圖書館書目數(shù)據(jù)共建共享,數(shù)據(jù)套錄漸漸成為編目工作不可或缺的一部分。如何有效提高套錄效率就成為提高編目效率的一個重要方面。在Millennium系統(tǒng)的Z39.50客戶端,可以配置多個Z39.50服務(wù)器,其遠(yuǎn)程檢索支持不同語種和多種MARC格式,套錄數(shù)據(jù)可以同時選擇多個數(shù)據(jù)源庫進(jìn)行檢索。例如套錄西文圖書數(shù)據(jù)時,可以同時選上CALIS聯(lián)合目錄、美國國會圖書館聯(lián)合目錄、美國Ohiolink聯(lián)合目錄等數(shù)據(jù)庫,進(jìn)行一次檢索,即可同時下載不同數(shù)據(jù)源庫的檢索結(jié)果。
1.2 具有強(qiáng)大而靈活的統(tǒng)計功能
圖書館統(tǒng)計工作是圖書館業(yè)務(wù)工作的重要組成部分,它對圖書館運(yùn)行中的各種數(shù)據(jù)進(jìn)行搜集、整理、分析研究,以便從中發(fā)現(xiàn)問題和解決問題。國內(nèi)系統(tǒng)在統(tǒng)計方面的功能比較欠缺,例如不能對數(shù)據(jù)進(jìn)行深層次的統(tǒng)計和分析,問題數(shù)據(jù)進(jìn)入大庫后很難將其查找出來等。Millennium系統(tǒng)具有非常強(qiáng)大的統(tǒng)計功能,編目模塊常用統(tǒng)計工具產(chǎn)生資料檔(Create lists)可以非常方便的統(tǒng)計出幾乎所有需要的統(tǒng)計結(jié)果。
利用資料檔,用戶可以根據(jù)自己所設(shè)定的條件,從書目、館藏等記錄數(shù)據(jù)庫中進(jìn)行檢索,找出符合自己要求的記錄集合。設(shè)定表達(dá)式時,可以針對某一個索引組、某一字段或子字段,利用=、≥、含有等數(shù)學(xué)表達(dá)式,結(jié)合“與”、“或”、“非”等邏輯條件[1]。
在編目實踐中,主要用資料檔進(jìn)行個人工作量統(tǒng)計、抓取有問題記錄、批次業(yè)務(wù)統(tǒng)計、書目數(shù)據(jù)審校以及產(chǎn)生新書通報。
1.2.1 抓取有問題或需處理的書目記錄
只要根據(jù)需處理記錄的共同特征設(shè)定條件,就可以輕而易舉地找出相關(guān)記錄進(jìn)行處理[1]。例如要找出2008年12月已編目數(shù)據(jù)中漏加索書號字段的記錄,設(shè)定條件如下:
BIBLIOGRAPHIC Cat.Date between″2008-12-01″and″2008-12-31″AND BIBLIOGRAPHIC Call No.not exist。通過這個表達(dá)式即可抓取12月編目的所有書目記錄中無索書號字段的記錄。
1.2.2 批次業(yè)務(wù)統(tǒng)計
批次業(yè)務(wù)統(tǒng)計是編目典藏工作之前非常重要的內(nèi)容,統(tǒng)計結(jié)果的核查尤為重要。利用資料檔的字段排序功能,可以很容易找出取值范圍之外的錯誤記錄。例如用書目記錄的索書號排序,沒有分編(即沒有索書號字段)的記錄就會排在最前面;同樣,用館藏記錄的條碼進(jìn)行排序,就可以將不符合本條碼段的記錄找出來。
1.2.3 書目數(shù)據(jù)審校
書目數(shù)據(jù)審校是書目數(shù)據(jù)質(zhì)量控制的重要環(huán)節(jié),也是保證書目數(shù)據(jù)標(biāo)準(zhǔn)化、規(guī)范化所采取的重要質(zhì)量控制措施。Millennium系統(tǒng)資料檔的數(shù)據(jù)排序及輸出等功能,可以非常方便的完成此工作。利用不同的字段排序,從資料檔里直接輸出該批數(shù)據(jù)需要檢查的字段內(nèi)容,比如題名、責(zé)任者、版本、索書號等,在本地直接用文本文檔查看。這就省去了逐條打開記錄的繁瑣,而且也更加直觀明了。
1.3 可有效控制數(shù)據(jù)質(zhì)量
圖書館的書目數(shù)據(jù)庫質(zhì)量的優(yōu)劣直接影響到文獻(xiàn)檢索效果,進(jìn)而影響到文獻(xiàn)的流通、文獻(xiàn)的開發(fā)利用和文獻(xiàn)資源共享[2]。然而,如何有效控制書目數(shù)據(jù)質(zhì)量卻是系統(tǒng)開發(fā)商面臨的重要難題。Millennium系統(tǒng)提供的多項功能如全域更新、標(biāo)目查重、標(biāo)目異動報表等,為用戶控制書目數(shù)據(jù)質(zhì)量提供了充分的空間。只要編目人員充分利用這些功能,就可以極大的提高書目數(shù)據(jù)庫的質(zhì)量。
1.3.1 全域更新
Millennium系統(tǒng)的全域更新功能可以批次插入、修改、刪除、復(fù)制變長字段,修改特殊字段等。在抓取需要更新的記錄后,利用此功能可以批次快速更新記錄,在執(zhí)行更新之前還可以通過預(yù)覽查看更新之后的結(jié)果,以核對更新條件是否正確[3]。
例如我館正在回溯院系資料室回收圖書,需要在某一批數(shù)據(jù)的館藏記錄中增加一個字段表明該批數(shù)據(jù)回收來源。設(shè)置一定的條件抓取資料檔后,利用“插入定長字段”,將來源信息如“經(jīng)濟(jì)學(xué)院回收”加入條件中,執(zhí)行即可批次添加。
1.3.2 編目即時查重
Millennium系統(tǒng)在編目狀態(tài)下,提供了多種幫助功能來保障書目數(shù)據(jù)質(zhì)量。其幫助功能主要有:實時MARC格式提示、MARC格式檢查、標(biāo)目即時查重等。標(biāo)目即時查重功能可以在3個方面對書目數(shù)據(jù)的質(zhì)量予以保障。
(1)避免查重不嚴(yán)所致記錄重復(fù)。Millennium系統(tǒng)既可以對被編目記錄中某一索引字段即時查重,也可以同時對被編目記錄的全部索引字段即時查重。如遇到多個索引字段值均在書目數(shù)據(jù)庫中存在的情況,尤其是ISBN與題名同時出現(xiàn)重復(fù)的情況,就需要引起編目員的注意,通過仔細(xì)判斷來避免失誤[1]。
(2)索書號查重。通過索書號字段的即時查重,可以及時發(fā)現(xiàn)重號圖書,從而避免異書同號現(xiàn)象。
(3)排除輸入錯誤。通過對題名、責(zé)任者等字段的即時查重,可以顯示相鄰記錄的索引值,有助于發(fā)現(xiàn)可能存在的輸入錯誤[1]。
1.3.3 標(biāo)目異動報表
書目數(shù)據(jù)庫中的記錄,只要有所變化,Millennium系統(tǒng)都會記錄下其標(biāo)目的變動,形成標(biāo)目異動報表。通過報表,我們可以實時監(jiān)控數(shù)據(jù)質(zhì)量。在我館,標(biāo)目異動報表主要用來記錄重復(fù)使用標(biāo)目的變化。
標(biāo)目異動報表能夠產(chǎn)生重復(fù)控制號、索書號和館藏記錄條碼號的報表。從“索書號”重復(fù)提示,直接打開報表中的各個條目,可以進(jìn)行人工判重,排除因為區(qū)分號不同而被系統(tǒng)認(rèn)為重號的記錄;從“條碼號重復(fù)”提示,可以明確標(biāo)示出重復(fù)的條碼,從而保證館藏記錄主要標(biāo)識的惟一性。
另外,如果圖書館建立有本館的規(guī)范記錄庫,還可以使用標(biāo)目異動報表進(jìn)行規(guī)范記錄控制。通過報表指出與規(guī)范記錄有關(guān)的規(guī)范記錄重復(fù)、使用非規(guī)范標(biāo)目和盲目參照等[1]。
2 Millennium系統(tǒng)存在的問題及解決辦法
Millennium系統(tǒng)是西方國家開發(fā)的系統(tǒng),由于國情的差異和思維方式的不同,系統(tǒng)功能開發(fā)的側(cè)重點也會有所不同。在編目模塊的設(shè)計上,國外系統(tǒng)更注重檢索[4],而對中國特殊國情需要的某些功能開發(fā)有所欠缺,目前,Millennium系統(tǒng)編目模塊存在的問題主要體現(xiàn)在如下3個方面:
2.1 有些中文字符轉(zhuǎn)換錯誤
我館Millennium系統(tǒng)使用的是圖形界面,字符集為Unicode碼。Millennium系統(tǒng)對中日韓文采用EACC/CCCII作為內(nèi)碼存儲,在系統(tǒng)升級為Unicode之后,客戶端漢字輸入設(shè)為Unicode字符集。由于客戶端字符集與系統(tǒng)內(nèi)碼的不同,就需要進(jìn)行字符集編碼的轉(zhuǎn)換[5]。因為字符集轉(zhuǎn)換表的問題,在字符轉(zhuǎn)換過程中,就出現(xiàn)了一系列的問題,包括字符缺漏,如“稅”字不能保存;有些字符轉(zhuǎn)換成了異體字或者亂碼,如漢字“真”在導(dǎo)入系統(tǒng)之后變成了“真”,等等。
為了解決字符問題,我館主要采用兩種方式:一是在編目過程中搜集錯誤的字符,并將其發(fā)送給公司,由公司方重新匹配字符集,逐個修改;二是定期統(tǒng)計月度編目數(shù)據(jù),利用全域更新批次修改轉(zhuǎn)換錯誤字符。
2.2 中文圖書原編時拼音羅馬化不符合CNMARC著錄要求因為我國使用象形文字,CNMARC著錄規(guī)則要求對有檢索意義的字段如題名、主題、責(zé)任者增設(shè)我國特有的拼音子字段,從而提供多一種檢索途徑。Millennium系統(tǒng)對漢字羅馬化(即產(chǎn)生拼音)的定義是將定長字段language為chi的記錄中所有的中文漢字都匹配一個拼音[6]。顯然,這種羅馬化的定義與CNMARC圖書著錄規(guī)則不相符。在Millennium系統(tǒng)中做中文圖書原編時,無法使用其羅馬化功能自動生成拼音,必須手動逐個輸入。為了解決這一問題,我館中文圖書原編都在CALIS Z39.50客戶端完成,數(shù)據(jù)提交之后再從Millennium系統(tǒng)遠(yuǎn)程下載,覆蓋本地系統(tǒng)的簡編記錄。
2.3 Millennium系統(tǒng)還未與中國高等學(xué)校文獻(xiàn)保障系統(tǒng)(簡稱CALIS)達(dá)成協(xié)議,在系統(tǒng)中無法直接向CALIS上交館藏
作為CALIS的成員館,我們在下載其記錄的同時還必須向其提供本館的館藏信息,以利于各成員館之間的館際互借。由于協(xié)議尚未達(dá)成,我們不能直接通過Millennium系統(tǒng)向CALIS提交館藏,而只能到CALIS Z39.50客戶端重新執(zhí)行一次檢索并上交館藏信息。目前公司正在與CALIS協(xié)商,我們期待早一點有結(jié)果。
3 結(jié) 語
2年多的編目實踐,我們感受到Millennium系統(tǒng)編目模塊結(jié)構(gòu)嚴(yán)密,功能強(qiáng)大,使用方便,它提供了一整套編目業(yè)務(wù)管理的規(guī)范操作,有效提高了數(shù)據(jù)質(zhì)量,整體上提高了編目工作效率。然而由于各國國情不同,思維方式的差異等原因,造成了上述的問題。我們希望Millennium在今后的系統(tǒng)升級中,能更多考慮不同用戶的需求以滿足用戶需要。
參考文獻(xiàn)
[1]胡小菁.INNOPAC系統(tǒng)書目數(shù)據(jù)庫質(zhì)量控制[J].圖書館雜志,2001,(11):23-26.
[2]萬麗蓉.論書目數(shù)據(jù)的質(zhì)量控制[J].圖書館工作與研究,2007,(5):34-35.
[3]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 104002,2009-01-01.
[4]孫曉菲,曹玉霞.圖書館集成管理系統(tǒng)Horizon編目模塊評價[J].大學(xué)圖書館學(xué)報,2002,(4):37-39.
[5]方紅.INNOPAC/MILLENNIUM系統(tǒng)漢字處理問題的研究[J].高等工程教育研究,2006,(S1):119-121.
[6]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 105472,2009-01-01.
[7]Millennium ILS:Innovative Interfaces[EB].http:∥www.iii.com/products/millennium_ils.shtml,2009-01-01.