張宏偉,史惠媛
黑龍江中醫(yī)藥大學(xué),黑龍江 哈爾濱 150040
?
數(shù)據(jù)挖掘在高校圖書館文獻采購決策中的應(yīng)用——以黑龍江中醫(yī)藥大學(xué)圖書館為例
張宏偉,史惠媛
黑龍江中醫(yī)藥大學(xué),黑龍江 哈爾濱 150040
摘要:在高校圖書館文獻采購過程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)對讀者利用圖書館歷史數(shù)據(jù)進行分析,可以預(yù)測出圖書采購經(jīng)費分配比例,按照讀者閱讀需求采購熱點圖書,補充缺漏圖書及復(fù)本量不足圖書,進而為文獻采購工作提供科學(xué)、合理的決策依據(jù)。
關(guān)鍵詞:高校圖書館;文獻采購;數(shù)據(jù)挖掘
【引文格式】張宏偉,史惠媛.數(shù)據(jù)挖掘在高校圖書館文獻采購決策中的應(yīng)用——以黑龍江中醫(yī)藥大學(xué)圖書館為例[J].中國中醫(yī)藥圖書情報雜志,2016,40(2):22-24.DOI:10.3969/j.issn.2095-5707.2016.02.006
程煥文先生認(rèn)為資源是圖書館絕對的至高無上的王[1]。文獻采購是高校圖書館文獻資源建設(shè)的第一站,是決定文獻資源建設(shè)質(zhì)量的最重要的關(guān)鍵環(huán)節(jié)。隨著圖書價格持續(xù)上漲,高校圖書館文獻購置費相對有限,在圖書采購過程中如何保證館藏結(jié)構(gòu)科學(xué)性的同時,提高紙質(zhì)文獻資源利用率,是圖書館亟待解決的問題。
數(shù)據(jù)挖掘(date mining)是從大量的、隨機的數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識的過程。圖書館自動化管理系統(tǒng)每天會產(chǎn)生大量流通、檢索、查詢等數(shù)據(jù),對這些數(shù)據(jù)進行挖掘,可以獲知讀者個性化需求、文獻利用率等信息。利用這些信息對已有館藏進行評估,可以為文獻采購工作提供科學(xué)、合理的決策依據(jù)。
目前,高校圖書館紙質(zhì)文獻傳統(tǒng)采購決策過程中,決策主觀性較強,客觀依據(jù)不足[2]。文獻采購多以現(xiàn)場采購和書目采購為主,采購人員少,對各專業(yè)、學(xué)科所需文獻資源把握不到位、訂購精確度不高。一方面受采購人員的知識結(jié)構(gòu)、專業(yè)背景、業(yè)務(wù)素質(zhì)及工作經(jīng)驗等因素的限制,圖書館文獻采購決策長期以來停留在憑經(jīng)驗和靠感覺的水平上,文獻采購時主觀判斷成分過多。另一方面讀者參與文獻采購的熱情不高,使得文獻采購的采全率和采準(zhǔn)率不高,導(dǎo)致學(xué)校投入的有限購書經(jīng)費所購文獻資源利用率不高,讀者文獻需求得不到滿足和保障[3]。
為了使文獻采購工作更客觀、科學(xué)、合理,有必要應(yīng)用數(shù)據(jù)挖掘技術(shù)對讀者借閱流通、檢索查詢、預(yù)約借書、博碩學(xué)位論文引文等歷史數(shù)據(jù)進行定性和定量分析,獲知讀者個性化閱讀需求,為圖書館文獻采購決策提供數(shù)據(jù)參考,進而提高文獻資源采選質(zhì)量和館藏資源利用率。
2.1 依據(jù)借閱流通數(shù)據(jù)指導(dǎo)采購資金分配
利用金盤圖書管理系統(tǒng)集成統(tǒng)計模塊對每年各大類圖書借閱流通情況進行統(tǒng)計,得到讀者借閱量趨勢變化情況,進而預(yù)測讀者需求量,指導(dǎo)下一年采購經(jīng)費在各大類文獻中的投入增減情況[4]。遵循文獻利用率最大效應(yīng)原則,對于零借閱的圖書應(yīng)減少或停止采購,保證各大類圖書的借閱流通數(shù)量和采購經(jīng)費所占比重相一致,有針對性地補充館藏文獻資源,從而達到資源優(yōu)化配置。
黑龍江中醫(yī)藥大學(xué)圖書館2013、2014、2015年圖書采購經(jīng)費分別為166.1萬、155.9萬、143.2萬元人民幣,借閱量分別為71 112、87 278、80 538冊。表1中列出這3年各類借出圖書所占采購經(jīng)費及借閱量的百分比,據(jù)此可以指導(dǎo)2016年制定文獻資源采購計劃,合理分配各類圖書采購經(jīng)費,使采購決策更加科學(xué)合理,最大限度地提升館藏資源利用率。
表1 2013-2015年黑龍江中醫(yī)藥大學(xué)圖書館圖書采購經(jīng)費分配與圖書借閱量統(tǒng)計(%)
2.2 依據(jù)檢索查詢數(shù)據(jù)獲知讀者亟需文獻
利用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則對讀者每個月圖書檢索查詢數(shù)據(jù)進行自動捕捉、采集和整理,過濾冗余信息。將讀者關(guān)注度較高的檢索詞按使用次數(shù)降序排列(見圖1)。對照2014年熱門圖書檢索詞排行榜,取檢索次數(shù)≥50次的圖書作為熱點圖書,這些是讀者迫切亟需的文獻資源,圖書館應(yīng)對照館藏規(guī)劃,優(yōu)先采購人氣熱點圖書。
2.3 依據(jù)圖書預(yù)約借書數(shù)據(jù)補充館藏復(fù)本量
預(yù)約借書是指讀者預(yù)約登記某種借出狀態(tài)的圖書,該圖書歸還后,預(yù)約讀者優(yōu)先得到此書的借閱權(quán),館藏復(fù)本量不足是讀者預(yù)約借書的原因。圖書預(yù)約信息真實反映了讀者對某類圖書的實際需求。首先,采購人員基于金盤管理系統(tǒng),對預(yù)約數(shù)據(jù)進行統(tǒng)計。其次,根據(jù)讀者預(yù)約次數(shù),形成預(yù)約熱點圖書的書目表。最后,通過與館藏書目數(shù)據(jù)比較,制定符合讀者需求的采購計劃,確定復(fù)本采購數(shù)量。及時補充館藏復(fù)本量不足的圖書,提升圖書館的服務(wù)質(zhì)量和服務(wù)效果,使高校圖書館文獻資源保障能力得到加強。
圖1 黑龍江中醫(yī)藥大學(xué)圖書館熱門檢索詞排行榜
2.4 依據(jù)博碩士論文引文量補充缺漏圖書
博碩士學(xué)位論文的引文真實地反映出作者在撰寫過程中對專業(yè)文獻的需求特點和規(guī)律,其引文具有數(shù)量大、范圍廣和學(xué)術(shù)質(zhì)量高的特點。博碩士學(xué)位論文是對以前成果的借鑒、利用和創(chuàng)新,參考文獻具有精選性,對文獻的學(xué)術(shù)價值具有評測功能。因此,對博碩士學(xué)位論文引文進行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)博碩士所在學(xué)科信息需求的一般規(guī)律和特點,有利于指導(dǎo)圖書館文獻信息資源的館藏建設(shè)?;诓┐T士學(xué)位論文在線提交系統(tǒng),對博碩論文引文量進行統(tǒng)計分析,對照館藏將文獻引用頻次≥3的缺漏圖書,列為預(yù)采購圖書。并根據(jù)文獻購置經(jīng)費的許可程度,最終有重點、有層次對缺漏圖書進行補充。
2.5 依據(jù)科技查新參考文獻獲知教學(xué)科研文獻需求
科技查新,是為避免科研課題重復(fù)立項和客觀正確地判別科研成果的創(chuàng)新性而設(shè)立的一項工作。通過科技查新工作,能為科研立項,科技成果的鑒定、評估、驗收、獎勵,專利申請等提供客觀依據(jù),為科研人員提供快捷、可靠、豐富的文獻支持。
黑龍江中醫(yī)藥大學(xué)圖書館檢索中心(中國中醫(yī)藥文獻檢索中心黑龍江分中心),是國家中醫(yī)管理局于1995年批準(zhǔn)成立的,為首批國家級定點查新分中心,也是我省中醫(yī)藥領(lǐng)域唯一的國家級查新單位。由于科研人員研究方向多,文獻需求廣,因此不易從個體角度來分析其文獻需求,但可以從群體角度來研究高校教研室、重點實驗室所需文獻需求?;谖茵^科技查新系統(tǒng),對科研人員申報的科技查新參考文獻進行數(shù)據(jù)挖掘,可以對我校重點實驗室所關(guān)注的研究領(lǐng)域、研究熱點和發(fā)展方向進行分類和預(yù)測。通過專家咨詢、建立模型與數(shù)據(jù)可視化等動態(tài)結(jié)合方式,生成重點實驗室所需科研文獻采購報告,為滿足該重點實驗室文獻需求提供客觀準(zhǔn)確的采購依據(jù)。
2015年,我館采購原則是“保證中醫(yī)藥學(xué)科,兼顧醫(yī)學(xué)相關(guān)門類,關(guān)注學(xué)校新增專業(yè),滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展需求”。通過對上述5類數(shù)據(jù)綜合分析,形成科學(xué)、合理的客觀采購依據(jù),輔助管理層作出及時有效的決策,進而制定2016年的圖書采購原則,即“中醫(yī)類求精、西醫(yī)類求新、關(guān)注新增專業(yè)、滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展要求”。
3 小結(jié)
應(yīng)用數(shù)據(jù)挖掘技術(shù)從海量的借閱流通數(shù)據(jù)中預(yù)測采購經(jīng)費比例,對照年度采購原則和計劃,將讀者亟需的圖書進行分類,按需求頻度進行排序,頻度相同、資金有限或數(shù)量已達上限的情況下,以優(yōu)先滿足教學(xué)和科研圖書為采購原則。需要指出的是,采購決策應(yīng)以實際數(shù)據(jù)為參考,同時也要避免唯數(shù)據(jù)論,對時效性強、借閱量大的教材、輔導(dǎo)類等圖書要控制其采購的種數(shù)和復(fù)本量,可通過購買電子書形式予以解決。在經(jīng)費有限的情況下使投入產(chǎn)出收益達到最大化,真正做到“每位讀者有其書”和“每本書有其讀者”。
參考文獻
[1]程煥文.圖書館的價值與使命[J].圖書館雜志,2013(3):4-8.
[2]王春生.我國圖書館實施讀者主導(dǎo)式采購的策略[J].圖書情報工作,2013,57(5):71-75.
[3]杜友桃,伍曉光,宋宇.圖書館文獻采訪中讀者薦購工作探討[J].中國中醫(yī)藥圖書情報雜志,2014,38(2):51-54.
[4]袁芳.大數(shù)據(jù)環(huán)境下圖書館文獻資源建設(shè)模式的變革[J].圖書情報工作,2015,59(18):91-94.
(修回日期:2016-01-23;編輯:魏民)
Applicatin of Data Mining in the Literature Purchasing Decisions of Libraries of the Colleges and Universities - Taking Library of Heilongjiang University of Chinese Medicine as an Example
ZHANG Hong-wei,SHI Hui-yuan
(Heilongjiang University of Chinese Medicine,Harbin Heilongjiang 150040,China)
Abstract:In the literature purchasing process of libraries of the colleges and universities,applying data mining technology in the analysis of library historical data can predict the allocation proportion of book purchasing budget,purchase hotspot books according to readers’ reading demands,and supplement missing books and books with insufficient duplications,with a purpose to provide scientific and reasonable decision basis for literature purchasing.
Key words:libraries of the colleges and universities; literature purchasing; data mining
收稿日期:(2016-01-11)
基金項目:2015年度黑龍江省藝術(shù)科學(xué)規(guī)劃課題省級共建項目(2015D002)
中圖分類號:G253.1
文獻標(biāo)識碼:A
文章編號:2095-5707(2016)02-0022-03
第一作者:張宏偉,館員,研究方向為數(shù)據(jù)挖掘、數(shù)據(jù)倉儲、數(shù)字圖書館建設(shè)。E-mail:dbt5@163.com