孔德超
(河南省圖書館,河南鄭州 450052)
?
河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)建構(gòu)研究
孔德超
(河南省圖書館,河南鄭州450052)
河南省地方文獻(xiàn);文獻(xiàn)聯(lián)合目錄合作系統(tǒng);檢索系統(tǒng)
地方文獻(xiàn)整理是圖書館文獻(xiàn)信息資源建設(shè)的重要補充方式。河南省未能形成統(tǒng)一的地方文獻(xiàn)聯(lián)合目錄體系,呈現(xiàn)為各自為戰(zhàn)、缺乏共享、品種重復(fù)等現(xiàn)象。為此,依托河南省圖書館,聯(lián)合公共、高校圖書館,著手開發(fā)由河南省地方文獻(xiàn)目錄數(shù)據(jù)中心、河南省地方文獻(xiàn)目錄檢索系統(tǒng)、河南省地方數(shù)字資源互訪系統(tǒng)及河南省地方文獻(xiàn)數(shù)據(jù)分析系統(tǒng)4部分組成的河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng),以期統(tǒng)一地方文獻(xiàn)聯(lián)合編目與共享,最大化地發(fā)揮地方文獻(xiàn)的作用。
地方文獻(xiàn)是指反映某一地區(qū)政治、經(jīng)濟、科技、文化、教育、藝術(shù)、衛(wèi)生、體育、歷史、地理等重要內(nèi)容的文獻(xiàn)資源[1],其收藏范圍包括有關(guān)本地方的文獻(xiàn)或由本地方人士編著的文獻(xiàn)以及由本地方編輯出版的文獻(xiàn)[2]。地方文獻(xiàn)承載著一個地區(qū)的發(fā)展脈絡(luò),是一個地區(qū)客觀縮影和文化底蘊的集中反映。地方文獻(xiàn)和一個地區(qū)的各項工作有密切的關(guān)系,對經(jīng)濟建設(shè)和社會發(fā)展至關(guān)重要。不論是從制訂地區(qū)發(fā)展規(guī)劃、開發(fā)地方資源,還是到規(guī)劃人文旅游、發(fā)掘地方特色、研究地方任務(wù)、歷史以及編纂地方史志,都離不開地方文獻(xiàn)。目前河南省還沒有統(tǒng)一的地方文獻(xiàn)聯(lián)合目錄信息,沒有明確統(tǒng)計出全省地方文獻(xiàn)的不重復(fù)品種,很多圖書館投入大量資金做地方特色數(shù)據(jù)庫,但沒有條件與其他圖書館共享,致使各圖書館特色地方資源不能實現(xiàn)全省互訪共享。研發(fā)河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng),匯集河南省各類型圖書館地方文獻(xiàn)聯(lián)合目錄信息,具有重大現(xiàn)實意義。
2015年,全國出版新品種地方文獻(xiàn)5萬種,其中河南省出版機構(gòu)出版1,600種左右(不含中小學(xué)教輔),外地出版河南省地方文獻(xiàn)內(nèi)容約300種。另外,再加上各類型非正式出版物、圖書、影像及各類型文獻(xiàn)全年品種達(dá)1萬種以上[3]。因資金有限,圖書館難以全部采購,只能選擇性采購,這就造成了各個圖書館的重復(fù)式漏采現(xiàn)象,即有些品種重復(fù)性購買,而另一些品種又都沒有采購。長期以來,因沒有統(tǒng)一的合作平臺,河南省無法統(tǒng)計出全省準(zhǔn)確的地方文獻(xiàn)品種數(shù)量以及各圖書館的確切館藏。河南省圖書館根據(jù)全省地方文獻(xiàn)的館藏現(xiàn)狀,聯(lián)合各地方圖書館、鄭州大學(xué)圖書館以及河南大學(xué)圖書館,并組織一批專家在全省范圍內(nèi)對地方文獻(xiàn)進(jìn)行目錄的收集、整理工作,統(tǒng)計各圖書館館藏以及各館準(zhǔn)確的館藏目錄信息,根據(jù)全國出版信息及館藏信息,提供準(zhǔn)確的館藏文獻(xiàn)的出版地或館藏地,為河南各個地方文獻(xiàn)研究機構(gòu)提供數(shù)據(jù)支持。同時,利用河南省圖書館的技術(shù)優(yōu)勢,研發(fā)出的河南省地方文獻(xiàn)聯(lián)合目錄合作平臺是將上述設(shè)想通過大數(shù)據(jù)分析,采用先進(jìn)技術(shù)實現(xiàn)整理、查詢及分析功能的有效統(tǒng)一體。
目前一些圖書館建有地方資源特色數(shù)據(jù)庫,該系統(tǒng)的完成可以達(dá)到資源互訪的目的,提高資源利用率。特別是編目聯(lián)合中心的建立,可以使各圖書館實現(xiàn)資源共建共享的目的。系統(tǒng)對讀者群體及借閱趨勢的分析也是借助“互聯(lián)網(wǎng)+”的科技模式,將科技與圖書館業(yè)務(wù)有機地結(jié)合在一起,發(fā)揮大數(shù)據(jù)功能,使該系統(tǒng)的應(yīng)用成果可以在取得社會效益的同時產(chǎn)生經(jīng)濟效益。該系統(tǒng)的完成,可以使全省各類型圖書館地方文獻(xiàn)資源得以統(tǒng)計梳理,能詳細(xì)了解全省地方文獻(xiàn)資源現(xiàn)狀,有利于以后的科學(xué)館藏建設(shè),豐富河南省內(nèi)館藏文獻(xiàn)資源。
河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)的建構(gòu)主要是將全省圖書館地方文獻(xiàn)館藏資源數(shù)據(jù)加以收集、整理分析,通過系統(tǒng)統(tǒng)計出全省的地方文獻(xiàn)館藏品種和全部出版書目進(jìn)行對比,查漏補缺,完善河南省區(qū)域文獻(xiàn)資料的館藏。
2.1平臺系統(tǒng)建構(gòu)內(nèi)容
河南省地方文獻(xiàn)聯(lián)合目錄合作平臺由河南省地方文獻(xiàn)目錄數(shù)據(jù)中心、河南省地方文獻(xiàn)目錄檢索系統(tǒng)、河南省地方數(shù)字資源互訪系統(tǒng)及河南省地方文獻(xiàn)數(shù)據(jù)分析系統(tǒng)4部分組成。
2.1.1河南省地方文獻(xiàn)聯(lián)合目錄數(shù)據(jù)中心。河南省地方文獻(xiàn)聯(lián)合目錄數(shù)據(jù)中心主要收錄河南省不同類型圖書館館藏地方文獻(xiàn)數(shù)據(jù),不但包括地方文獻(xiàn)基本數(shù)據(jù)、書目數(shù)據(jù)、讀者數(shù)據(jù)、特藏數(shù)據(jù)等,同時也包括電子資源、古籍善本、非書資料、地圖等書目記錄,能連接圖片、影像、全文數(shù)據(jù)庫的多媒體聯(lián)合數(shù)據(jù)庫,甚至一些紙質(zhì)地方文獻(xiàn)通過數(shù)字化處理后呈現(xiàn)出的書目信息。河南省地方文獻(xiàn)聯(lián)合目錄合作研發(fā)系統(tǒng)計劃到2017年年底完成累計160余萬條書目記錄、600余萬條館藏信息。目錄數(shù)據(jù)庫涵蓋地方文獻(xiàn)的印刷型圖書、連續(xù)出版物、電子期刊和古籍等多種文獻(xiàn)類型,覆蓋中文、西文和日文等語種。數(shù)據(jù)中心涉及數(shù)字資源聚合的問題,數(shù)字資源聚合是指運用一定的技術(shù)與手段,將分布異構(gòu)的海量數(shù)據(jù)資源聚合起來,通過加工排序的處理,使其形成一個整體,并呈現(xiàn)出知識性、便利性與規(guī)律性[4]。數(shù)字資源聚合主要是通過數(shù)字資源語義分析與關(guān)聯(lián)聚合的方式,來構(gòu)建基于語義關(guān)聯(lián)的知識聚合模型,達(dá)到數(shù)字資源聚合的目的,同時也為后期河南省地方文獻(xiàn)目錄檢索與數(shù)字資源互訪提供便利的條件。
2.1.2河南省地方文獻(xiàn)目錄檢索系統(tǒng)。河南省地方文獻(xiàn)目錄檢索系統(tǒng)可以使省內(nèi)各圖書館的地方文獻(xiàn)館藏信息通過檢索系統(tǒng)查詢、借閱到本館未收藏的資料,有利于讀者服務(wù)工作,并且通過館藏目錄檢索,可以對所缺少的文獻(xiàn)進(jìn)行查漏補缺,完善全省統(tǒng)一的館藏資源。地方文獻(xiàn)目錄檢索的前提在于科學(xué)、合理的分類。地方文獻(xiàn)分編包括歷史文獻(xiàn)資料與近現(xiàn)代地方文獻(xiàn)資料[5]。辛亥革命之前歷史文獻(xiàn)資料采用四庫分類法,即“經(jīng)、史、子、集”劃分;民國時期的近代地方文獻(xiàn)史料往往運用《中小型圖書館圖書分類法》;現(xiàn)代地方文獻(xiàn)分類多采用杜定友先生的《中國圖書館圖書分類法》的統(tǒng)一分類法。一些特殊地方文獻(xiàn)分類,例如全國方志目錄,通常采用權(quán)威的《中國地方志聯(lián)合目錄》《中國地方志綜錄》《中國地方志總目提要》等。河南省地方文獻(xiàn)分類基本上按照以上時間階段劃分。
2.1.3河南省數(shù)字資源互訪系統(tǒng)。目前,河南省很多圖書館做出了有濃郁地方特色的文獻(xiàn)數(shù)據(jù)庫,但因沒有統(tǒng)一的發(fā)布平臺,其他圖書館無法訪問。數(shù)字資源互訪體現(xiàn)了知識共享、共知、開放獲取的理念。河南省地方數(shù)字資源互訪系統(tǒng)可以使各圖書館富有地方特色館藏的數(shù)字資源對讀者開放,使資源共享的目標(biāo)得以實現(xiàn)。該系統(tǒng)將提供共享平臺,解決資源上傳與共享問題。
2.1.4河南省地方文獻(xiàn)數(shù)據(jù)分析系統(tǒng)。地方文獻(xiàn)數(shù)據(jù)分析系統(tǒng)一是通過對借閱目錄的數(shù)據(jù)分析,科學(xué)地開展地方館藏工作,了解讀者實際需求,有的放矢地發(fā)揮地方館藏資源的價值。二是通過對讀者信息數(shù)據(jù)分析,了解不同行業(yè)、不同年齡讀者的差異需求,根據(jù)讀者借閱數(shù)據(jù),為出版社提供圖書類別發(fā)行對象的分析報告,為各圖書館資源共建共享提供理論數(shù)據(jù)的支持。
2.2平臺系統(tǒng)技術(shù)支持
河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)的研發(fā)突破傳統(tǒng)模式,運用圖書館學(xué)與科技手段相結(jié)合的方式對標(biāo)準(zhǔn)MARC圖書編目、館藏數(shù)據(jù)和非標(biāo)準(zhǔn)特藏資源數(shù)據(jù)進(jìn)行處理、分析。
為保證提供離線計算、即席查詢、實時計算、實時查詢這幾個方面的功能,大數(shù)據(jù)平臺采用hadoop+spark+hive的數(shù)據(jù)架構(gòu)[6],其中hadoop的HDFS分布式文件系統(tǒng)解決存儲問題;hadoop mapreduce、hive、spark application、sparkSQL解決離線計算和即席查詢的問題;spark streaming解決實時計算問題;另外,采用HBase解決實時查詢的問題。除此之外,平臺中不能缺少任務(wù)調(diào)度系統(tǒng)和數(shù)據(jù)交換工具:任務(wù)調(diào)度系統(tǒng)解決所有大數(shù)據(jù)平臺中的任務(wù)調(diào)度與監(jiān)控;數(shù)據(jù)交換工具解決其他數(shù)據(jù)源與HDFS之間的數(shù)據(jù)傳輸。該系統(tǒng)采用SkyNet調(diào)度監(jiān)控系統(tǒng),其具有分布式架構(gòu)、高可用性、高容錯性、完善易用的Web用戶界面、支持任意類型的任務(wù)、完整的日志記錄、任務(wù)之間的靈活依賴、靈活多樣的告警規(guī)則等特性。
河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)建立有穩(wěn)定、高效、大容量、節(jié)能、環(huán)保的數(shù)據(jù)中心,計劃采用目前大數(shù)據(jù)中心流行的冷通道機房,達(dá)到提高制冷效率、節(jié)能減耗的目標(biāo);建立集群服務(wù)器虛擬化,提升災(zāi)備能力,HBA光纖高效SAN存儲、硬件設(shè)備IOE(IBM、Oracle、EMC)用于保障數(shù)據(jù)安全。
為保證河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)的正常開發(fā)并盡可能地完善設(shè)計,河南省圖書館采用Welcom公司的OpenPlan作為開發(fā)的管理工具。Open Plan可以根據(jù)需求在不同的級別上,針對不同的部門或興趣產(chǎn)生各種數(shù)據(jù)報表,自上而下實現(xiàn)分解資源、資源優(yōu)化、費用控制、風(fēng)險分析等,有效保障項目開發(fā)、執(zhí)行各個環(huán)節(jié)的順利進(jìn)行。根據(jù)以上分析,河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)模型建構(gòu)如下(見圖1)。
圖1 河南省地方文獻(xiàn)聯(lián)合目錄合作平臺系統(tǒng)建構(gòu)示意圖
2.3平臺系統(tǒng)實施方案
本項目前期將陸續(xù)完成項目需求分析、項目可行性分析和研發(fā)工具及人員的準(zhǔn)備、聯(lián)合目錄平臺的開發(fā)、數(shù)字資源的互訪系統(tǒng)的開發(fā)、目錄檢索系統(tǒng)及借閱書籍分析模塊的開發(fā)工作,并收集河南省地方文獻(xiàn)目錄館藏數(shù)據(jù),組織專家對地方文獻(xiàn)目錄進(jìn)行整理、分類,項目驗收合格后開始在省內(nèi)圖書館中推廣實施,預(yù)計實現(xiàn)建立起涵蓋80%以上的圖書館館藏的河南省館藏信息數(shù)據(jù)庫的目標(biāo)。
河南省處于中原大地,是一個歷史悠久的大省,各地方圖書館保存著豐富的特色文獻(xiàn),但由于各種原因,我們無法準(zhǔn)確了解地方文獻(xiàn)的館藏分布。通過河南省地方文獻(xiàn)聯(lián)合目錄合作平臺可以把這些特藏展示出來,并通過對這些豐厚的地域文化資源進(jìn)行開發(fā)利用,使寶貴的地方文獻(xiàn)資源在本地經(jīng)濟社會的發(fā)展進(jìn)程中發(fā)揮重要的作用,使其產(chǎn)生巨大的社會效益和經(jīng)濟效益。同時,通過平臺中的技術(shù)功能,可以檢索目錄,實現(xiàn)資源共建共享,特色數(shù)據(jù)庫系統(tǒng)可以實現(xiàn)資源互訪共享功能,以便盡快讓讀者看到省內(nèi)特色數(shù)據(jù)庫資源,實現(xiàn)資源的使用價值。合作系統(tǒng)的研發(fā)實現(xiàn)了數(shù)字資源共享,便于各館之間數(shù)據(jù)交換和讀者進(jìn)行目錄檢索,有利于讀者查閱,以更好地為讀者服務(wù)。
現(xiàn)階段,關(guān)于地方文獻(xiàn)的市場需求數(shù)據(jù)無法統(tǒng)計,造成出版社的盲目選題和庫存積壓。而通過該系統(tǒng)的大數(shù)據(jù)分析可以為出版社提供數(shù)據(jù)支持,并可大大減輕出版社的庫存壓力。全國580余家出版社(截至2014年年底,全國共有出版社583家(包括副牌社33家)[7]有此類需求的出版社在200家以上。同時本軟件通過大數(shù)據(jù)的分析可與相關(guān)產(chǎn)品廠家合作,特別是分析高校學(xué)生讀者借閱數(shù)字資源的內(nèi)容數(shù)據(jù),可以利用大數(shù)據(jù)資源,了解讀者閱讀趨向,開發(fā)相應(yīng)產(chǎn)品,促進(jìn)智慧型圖書館的建設(shè),為整個圖書出版行業(yè)的建設(shè)貢獻(xiàn)力量。
[1]鄧福泉,楊宏.地方文獻(xiàn)統(tǒng)一分類研究[J].圖書館理論與實踐,2016(1):69-70.
[2]趙萍萍.關(guān)于機讀目錄中地方文獻(xiàn)主題標(biāo)引的探討[J].國家圖書館學(xué)刊,2003(2):80-83.
[3]楊超.公共圖書館地方文獻(xiàn)的征集與利用芻議[J].圖書情報導(dǎo)刊,2016(3):11-12.
[4]張建紅.基于語義關(guān)聯(lián)的海量數(shù)字資源知識聚合與服務(wù)研究[J].圖書館工作與研究,2016(8):44-47.
[5]李妹.近代地方文獻(xiàn)分類實例探析:以云南省圖書館為例[C].中華醫(yī)學(xué)會第二十一次全國醫(yī)學(xué)信息學(xué)術(shù)會議論文匯編,2015:555-559.
[6]吳黎兵,邱鑫,葉璐瑤,等.基于Hadoop的SQL查詢引擎性能研究[J].華中師范大學(xué)學(xué)報(自然科學(xué)版),2016(2):174-182.
[7]江水.2014新書出版種數(shù)微降:《2014年全國新聞出版業(yè)基本情況》出爐[N].圖書館報,2015-09-15.
(編校:崔萌)
2016-09-10
孔德超(1968—),河南省圖書館館長,河南省圖書館學(xué)會理事長,研究館員。
G253
A
1003-1588(2016)10-0113-03