王思敏
摘要:為更好的了解紡織院校特色資源館藏現(xiàn)狀,了解各高校館藏的差異、優(yōu)勢和不足,促進紡織高校圖書資源的共知、共建和共享。本文對全國九所紡織院校的紡織服裝大類圖書OPAC數(shù)據(jù)進行整理,通過人工清洗加計算機自動匹配的模式,實現(xiàn)了9所紡織高校的聯(lián)合書目。結(jié)果顯示,紡織類高校的文獻資源異質(zhì)性高,加強資源的共建有利于提高整體紡織學科資源體系的完善,并總結(jié)了資源共建中院校間編目不規(guī)范的問題,為今后大范圍的聯(lián)盟和資源共建提供有益參考。
Abstract: In order to better understand the status quo of characteristic resources collection in Textile Universities, to understand the differences, advantages and disadvantages of the collection in various universities, and to promote the co-knowledge, co-construction and sharing of books resources in Textile Universities, in this paper, the OPAC data of textile and garment books in nine Textile Universities are sorted out, and the joint bibliography of nine Textile Universities is realized by the mode of manual cleaning and computer automatic matching. The results show that Textile Universities have high heterogeneity of literature resources. Strengthening the co-construction of textile resources is conducive to improving the overall textile discipline resources system. It also summarizes the problems of non-standardized inter-university cataloging in the co-construction of resources, and provides a useful reference for the future large-scale alliance and co-construction of resources.
關鍵詞:紡織高校;圖書館聯(lián)盟;資源共建;資源共享;聯(lián)合書目;館藏分析
Key words: Textile Universities;library consortia;resources co-construction;resource sharing;joint bibliography;collection analysis
0? 引言
圖書館資源的共建和共享,不僅能夠極大的提高資源的滿足率,而且可以降低資源建設成本[1] [2] [3]。我國作為世界上最大的紡織品、服裝生產(chǎn)和出口國,紡織行業(yè)在國民經(jīng)濟中占有舉足輕重的地位。然而就紡織學科而言,在眾多的學科領域中,仍屬于小學科,紡織學科相關的專業(yè)數(shù)據(jù)庫和專業(yè)學會并不多,資源量不夠充沛。我國共有近30家紡織類高校,建校時間和規(guī)模不盡相同,各有自身優(yōu)勢學科,館藏也有側(cè)重點,資源存貯異質(zhì)性很大。然而隨著人才和信息的加速流通,各個高校對資源的需求不再僅局限于自身的優(yōu)勢學科,而轉(zhuǎn)變?yōu)槿嬖鲩L,單一高校的資源建設顯得勢單力薄。因此加強紡織院校資源的共知、共建、共享,勢在必行[4]。
東華大學的劉建平,陳惠蘭[5]提出在沒有共建共享機制與體系的情況下,不僅工作效率和信息利用率低下,而且存在技術、信息資源、人才缺乏以及重復建設等問題;尹方屏,谷秀潔[6]。提出了構(gòu)建跨區(qū)域“大紡織”學科聯(lián)盟共享域的設想,讓紡織行業(yè)間能夠順暢的進行溝通和學術交流,強強聯(lián)合,共同提高。近年來,“中國高等教育文獻保障系統(tǒng)”、“中國高校人文社會科學文獻中心”等資源共享平臺的投入運行,極大的豐富了國內(nèi)信息資源,提高了信息滿足率[7]。然而,紡織學科在全國性的文獻信息資源共享平臺中,并未達到應有的規(guī)模,學科資源不夠豐富、學科體系不完整。
為了加快紡織學科的資源共建和共享,我館聯(lián)合武漢紡織大學,東華大學,江南大學,北京服裝學院,蘇州大學,天津工業(yè)大學,鹽城工學院,浙江理工大學,西安工程大學,國內(nèi)共九所紡織兄弟院校,對紡織專業(yè)圖書互通有無,建立聯(lián)合目錄,了解各自館藏資源優(yōu)勢和不足,加強資源互補,為今后的共建和共享奠定基礎,更好的為紡織行業(yè)的發(fā)展發(fā)揮作用。
1? 紡織高校館藏狀況分析
1.1 數(shù)據(jù)來源
本次聯(lián)合書目的收集、整理工作,共收到來自全國9所紡織兄弟院校的提供的TS1和TS9大類OPAC數(shù)據(jù),共計113509條。其中TS1大類書目數(shù)據(jù)35573條,TS9大類書目數(shù)據(jù)77936條。具體數(shù)量見表1。
各個高校提供的數(shù)據(jù)略有差異:部分高校提供圖書的本數(shù),也有部分高校提供圖書種數(shù)。
1.2 數(shù)據(jù)分析
數(shù)據(jù)的分析和處理,是本次整理工作的難點。原因在于書目數(shù)據(jù)編目較為混亂,隨意性大。各個高校著錄的詳簡級次不同、編目規(guī)則不同,質(zhì)量差別大,給數(shù)據(jù)分析和匹配工作帶來極大的困難。主要問題有以下幾種:
①ISBN缺失嚴重:
ISBN號錄入的主要問題有:1)缺失嚴重,共有3萬多冊圖書沒有ISBN號;2)ISBN號寫法不一致,有些帶連字符“-”,有些采用簡寫的方式,位數(shù)也不一致;3)年代較早的圖書沒有ISBN;4)系列圖書多本共用一個ISBN。
②題目、作者、出版社等字段,書寫混亂:
字段著錄的隨意性很大,同樣一本圖書,由于著錄的問題造成計算機不能準確識別。主要問題有:1)同一責任者沒有明確統(tǒng)一的著錄形式;2)多個責任者的著錄數(shù)量有差別;3)對機構(gòu)名稱著錄時全稱簡稱并存,且簡稱程度不同;4)對個人著者名稱的附加和復分成分沒有優(yōu)先順序;5)作者和出版社字段混淆;6)著錄中遇到的生僻字,拼寫錯誤或者漏寫[8]。示例見表2、表3。
③著錄信息、字段嚴重不足,影響對圖書信息的識別;
1)題目著錄過于簡單;2)上下冊及分冊未進行著錄,并且非全套購買的圖書;3)同一書名,有不同年份和版本,且未進行標注的。此類數(shù)據(jù)基本無法識別圖書的真實信息,更不能準確的與其他院校圖書進行匹配,對人工處理也造成了困難。為此,項目組設置了統(tǒng)一的處理原則,規(guī)范化處理該類模糊數(shù)據(jù)。
1.3 數(shù)據(jù)處理方法及原則
鑒于各個高校數(shù)據(jù)著錄不一致的情況,項目組采用計算機自動匹配和手工清洗相結(jié)合的方式,完成聯(lián)合目錄的制作。
對于數(shù)據(jù)錄入準確的記錄可以直接采用計算機自動匹配;而對錄入方式不一致的相似記錄,采用先手工清洗數(shù)據(jù),后計算機匹配的方式進行。
1.3.1 計算機自動匹配:結(jié)合數(shù)據(jù)實際情況,設計了兩種自動匹配算法。
①通過ISBN號匹配:ISBN號匹配的準確度高,但是由于ISBN號著錄格式多樣的問題,匹配成功概率小,該方法僅用于初次匹配;
②通過題名、作者、出版社三個字段結(jié)合進行匹配:作為最主要的匹配算法,用于初次匹配和手工清洗后的數(shù)據(jù)匹配。當題名、作者、出版社三個字段均相同時,計算機才認為兩條書目數(shù)據(jù)相同。
1.3.2 手工清理數(shù)據(jù):通過手工規(guī)范題名和作者、出版社,使得相似記錄的三個字段完全一致,便于計算機匹配。
我館投入五名骨干館員,耗時兩周進行數(shù)據(jù)清洗。為了使清洗結(jié)果更加準確,減少個人主觀判斷,項目組制定了統(tǒng)一的數(shù)據(jù)清洗原則:
①如果疑難記錄來自同一個學校,根據(jù)分類號或者ISBN判斷是否為副本數(shù)據(jù),相似記錄盡量不做合并,以免較少館藏;
②如果疑難記錄來自不同學校,且較為相似,可以歸為一本書,對各館館藏量不會產(chǎn)生影響;
③對于同館的多條重復記錄,參照其他館的上、下冊,或者版本情況,進行手工修正,補全提名;
④日文、俄文等小語種圖書,由于語言問題,無法進行人工識別,僅通過計算機進行自動匹配;
⑤將人工判定相同的記錄,其題目、作者和地址三個字段復制成一致,便于后續(xù)計算機識別。
在數(shù)據(jù)確實難以辨別的情況下,進行集體討論,以盡量不減少各館館藏為主要原則。
2? 結(jié)果
2.1 紡織高校館藏聯(lián)合目錄的實現(xiàn)
按照以上數(shù)據(jù)處理過程,完成了9所紡織院校的TS1大類和TS9大類圖書聯(lián)合目錄。圖1是節(jié)選的TS9聯(lián)合目錄。如圖1所示,聯(lián)合目錄中標注了每一條OPAC數(shù)據(jù)所在的圖書館,以及各館的副本量、館藏共有情況。目前該聯(lián)合目錄已在9所院校內(nèi)進行共享。
2.2 館藏分析
從各館圖書的館藏與聯(lián)合目錄的覆蓋率來看,每所高校的圖書覆蓋率都未能超過聯(lián)合書目的50%。具體數(shù)據(jù)如圖2、圖3所示。
TS1大類圖書,江南大學館藏覆蓋率最高,為47.4%,而最低為8.03%,紡織大類圖書館藏覆蓋率差別較大;TS9類圖書館藏覆蓋率為39.6%,最低為10.57%。主要的原因在于TS9大類不完全為紡織服裝類圖書,因此各館差異較大,各有千秋。但總體而言,紡織高校圖書館的館藏的異質(zhì)性很高,圖書的共建、共享有利于各館的發(fā)展。
3? 總結(jié)與展望
館藏的共知是進行共建和共享的前提。通過聯(lián)合目錄進行館藏分析,可以了解整體紡織類圖書館的館藏現(xiàn)狀,認識館藏的差異、優(yōu)勢和不足,不僅有利于加強和完善自身館藏建設,同時也讓各個圖書館看到了資源共享的必要性。
然而資源共享并非易事,要準確實現(xiàn)資源的共享需要數(shù)據(jù)提供方和數(shù)據(jù)組織單位共同努力:作為數(shù)據(jù)提供方,在進行數(shù)據(jù)共享時,盡可能對數(shù)據(jù)進行預處理,提供規(guī)范化的數(shù)據(jù),便于對真實信息的識別;而數(shù)據(jù)組織單位,應提出具體的要求,規(guī)范數(shù)據(jù)的格式。
在信息資源共享這個大趨勢下,紡織類高校圖書館應進一步規(guī)范編目工作,選擇適宜的著錄標準、著錄詳簡級次,確保目錄質(zhì)量,便于數(shù)據(jù)發(fā)現(xiàn)和資源共享,加強資源流通,提升資源價值,促進我國紡織行業(yè)的發(fā)展。
參考文獻:
[1]趙伯興,盛興軍.網(wǎng)絡條件下我國合作構(gòu)建文獻儲存庫的理論思考——兼論低利用率文獻的共建共享[J].圖書情報工作,2008,52(1):109-111,116.
[2]張紅揚.弘揚文化傳統(tǒng)彰顯個性特色——試論近年來高校圖書館特藏的發(fā)展[J].大學圖書館學報,2007,25(2):83-87.
[3]姜愛蓉.21世紀大學圖書館的文獻資源共享趨勢[J].圖書情報工作,2000,44(7):59-62.
[4]王廣三.圖書館聯(lián)盟知識共享影響因素及策略研究[J].圖書館工作與研究,2017(10):37-41.
[5]劉建平,陳惠蘭.高校圖書館紡織服裝學科信息資源共建共享研究[J] .圖書情報工作,2009,53(11):80-83.
[6]尹方屏,谷秀潔.構(gòu)建跨區(qū)域“大紡織”學科聯(lián)盟共享域的可行性研究——CALIS示范館建設啟示[J].圖書館學研究,2012(10):91-94.
[7]李錦蘭.國內(nèi)區(qū)域圖書館聯(lián)盟研究——基于31個省級圖書館聯(lián)盟網(wǎng)站的調(diào)研[J].圖書館工作與研究,2017(03):56-61.
[8]牛麗莉.高校合并后多校區(qū)館藏文獻共建共享的問題[J].圖書館建設,2002(5):93-94.