摘 要:針對(duì)目前圖書(shū)館數(shù)字資源采購(gòu)過(guò)程中主觀意識(shí)強(qiáng)、科學(xué)規(guī)范與量化性差的問(wèn)題,本文對(duì)重慶市科技文獻(xiàn)資源共享服務(wù)平臺(tái)重慶理工大學(xué)分中心2010年4月-2014年4月(四年)提供的文獻(xiàn)傳遞數(shù)據(jù)進(jìn)行屬性分析,并確定新的評(píng)估指標(biāo),然后采用改進(jìn)的遺傳神經(jīng)網(wǎng)絡(luò)算法對(duì)數(shù)據(jù)進(jìn)行建模。通過(guò)文章新提出文獻(xiàn)傳遞評(píng)估指標(biāo)找出使用頻率較多數(shù)據(jù),從而來(lái)指導(dǎo)本校圖書(shū)館數(shù)字資源的采購(gòu)方向。
關(guān)鍵詞:評(píng)估指標(biāo);文獻(xiàn)傳遞;數(shù)字資源采購(gòu);遺傳算法;圖書(shū)館
中圖分類號(hào):TP212.9
目前,各個(gè)高校在選擇數(shù)字資源采購(gòu)模式上,沒(méi)有一個(gè)科學(xué)的規(guī)范與量化的比對(duì),都是以人的主觀意識(shí)在采購(gòu)。通常由用戶的數(shù)量和使用量的需求程度確定數(shù)字資源訪問(wèn)級(jí)別高低并結(jié)合經(jīng)費(fèi)劃撥情況決定是否購(gòu)買(mǎi)。也有一些高校針對(duì)數(shù)字資源質(zhì)量評(píng)價(jià)體系進(jìn)行研究,對(duì)數(shù)字資源采購(gòu)起到一定的參考作用,但在實(shí)際操作中還存在一些問(wèn)題。
新的評(píng)估指標(biāo)為解決數(shù)字資源采購(gòu)問(wèn)題,提供了采購(gòu)參考依據(jù),以達(dá)到對(duì)文獻(xiàn)傳遞數(shù)據(jù)全面分析。不同等級(jí)用戶滿意度指數(shù)不同,所有用戶最終加權(quán)總值能全面客觀、毫無(wú)遺漏地反映評(píng)價(jià)目標(biāo)綜合保障能力。評(píng)估指標(biāo)對(duì)于比較數(shù)字資源的學(xué)術(shù)質(zhì)量有實(shí)質(zhì)性效果,其評(píng)估結(jié)果能對(duì)高校數(shù)字資源庫(kù)采購(gòu)起到量化參考作用。[1-2]
本文對(duì)重慶市科技文獻(xiàn)資源共享服務(wù)平臺(tái)重慶理工大學(xué)分中心4年(2010年4月-2014年4月)提供的文獻(xiàn)傳遞服務(wù)進(jìn)行研究,提出文獻(xiàn)傳遞服務(wù)的各種屬性并確定評(píng)估指標(biāo),從圖書(shū)館文獻(xiàn)傳遞基本情況、文獻(xiàn)傳遞的文種、類型及學(xué)科分類等方面進(jìn)行統(tǒng)計(jì),用于本校數(shù)字資源采購(gòu)的數(shù)學(xué)模型,通過(guò)遺傳神經(jīng)網(wǎng)絡(luò)挖掘文獻(xiàn)傳遞服務(wù)的各種屬性與是否被采購(gòu)之間的潛在關(guān)系,從而實(shí)現(xiàn)更好地提供有效決策的預(yù)測(cè)分類。
1 遺傳神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)迭代地處理訓(xùn)練元組數(shù)據(jù)集,將每個(gè)元組的網(wǎng)絡(luò)預(yù)測(cè)與實(shí)際已知的目標(biāo)值比較。對(duì)于每個(gè)訓(xùn)練樣本,修改權(quán)重使網(wǎng)絡(luò)預(yù)測(cè)和實(shí)際目標(biāo)值之間的均方差最小。其具體推導(dǎo)過(guò)程請(qǐng)參考文獻(xiàn)[3]-[5]算法流程見(jiàn)圖1。
2 模型的建立
2.1 數(shù)據(jù)來(lái)源
重慶市科技文獻(xiàn)資源共享服務(wù)平臺(tái)整合了重慶大學(xué)、西南大學(xué)、重慶醫(yī)科大學(xué)、重慶市標(biāo)準(zhǔn)化研究院、西南信息有限公司、重慶摩托車(chē)(汽車(chē))知識(shí)產(chǎn)權(quán)信息中心、重慶理工大學(xué)、重慶郵電大學(xué)等八個(gè)單位的所有文獻(xiàn)資源。平臺(tái)可檢索文獻(xiàn)記錄近2.6億條,包括期刊論文4374萬(wàn)篇、學(xué)位論文167萬(wàn)篇、中外專利2400萬(wàn)項(xiàng)、中外標(biāo)準(zhǔn)27萬(wàn)項(xiàng)、會(huì)議論文594萬(wàn)篇。平臺(tái)2010年4月至2014年4月,平臺(tái)總訪問(wèn)量為16752285人次,本校分中心文獻(xiàn)傳遞24601次,外文傳遞578次,標(biāo)準(zhǔn)傳遞236次。
2.2 改進(jìn)遺傳算法流程
算法中使用混合交叉產(chǎn)生新個(gè)體,再其使用混合變異。判斷是否滿足終止條件,滿足則停止算法,不滿足則進(jìn)入計(jì)算適應(yīng)度。圖2表示了改進(jìn)遺傳算法的基本過(guò)程:
2.3 實(shí)驗(yàn)結(jié)果
本文用matlab7[5]建立評(píng)估模型。首先通過(guò)文獻(xiàn)傳遞中形成的數(shù)據(jù),結(jié)合相關(guān)文獻(xiàn)[6]研究,整理完成11個(gè)圖書(shū)館的評(píng)估指標(biāo):文獻(xiàn)傳遞文種、文獻(xiàn)類型、文獻(xiàn)年代、學(xué)科分類、關(guān)鍵詞詞頻、引文次數(shù)、文獻(xiàn)作者、傳遞篇數(shù)、傳遞方式、用戶類型、滿足率、評(píng)價(jià)完成難度進(jìn)行評(píng)估,并將得到的評(píng)估指標(biāo)值、信息服務(wù)質(zhì)量值量化考核,以得出訓(xùn)練樣本。遺傳神經(jīng)網(wǎng)絡(luò)精度收斂曲線如圖3。
3 結(jié)束語(yǔ)
本文將遺傳算法的全局搜索能力和神經(jīng)網(wǎng)絡(luò)的局部搜索能力相結(jié)合,實(shí)現(xiàn)了對(duì)文獻(xiàn)傳遞數(shù)據(jù)綜合水平的有效評(píng)估,從而能為圖書(shū)館的文獻(xiàn)傳遞質(zhì)量提供相對(duì)有效的、科學(xué)的綜合評(píng)價(jià),最終為購(gòu)建數(shù)字資源提出意見(jiàn)。但建立這樣的數(shù)學(xué)模型,評(píng)估指標(biāo)的確定的采集和準(zhǔn)確性本身就是一個(gè)難題,如何解決這一問(wèn)題也是我們下一步工作的目標(biāo)。從實(shí)驗(yàn)結(jié)果來(lái)看,基于本文的文獻(xiàn)傳遞質(zhì)量評(píng)估模型基本達(dá)到目的,希望該方法能為圖書(shū)館如何購(gòu)買(mǎi)數(shù)字資源提供新的思路。規(guī)范、準(zhǔn)確、客觀,確保樣本數(shù)據(jù)真實(shí)性和科學(xué)性。
參考文獻(xiàn):
[1]馬曉亭.大學(xué)圖書(shū)館數(shù)字資源采購(gòu)評(píng)估指標(biāo)體系研究[J].現(xiàn)代情報(bào)2010(10):92-94.
[2]Guidelines for Statistical Measures of Usage of Web—based Information Resources[EB/OL].http://www.library.yale. edu/eonsortia/state –mensanddocuments.htm1,2007-09-27:1-3.
[3]王小平,槽立.遺傳算法-理論?應(yīng)用與軟件實(shí)現(xiàn)[M].西安:西安交通大學(xué)出版社,2000.
[4]唐淑香,李利.國(guó)內(nèi)文獻(xiàn)傳遞研究概述[J].圖書(shū)館下作與研究,20l0(10):8-l1.
[5]聞新,周露,王丹力,等.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:科學(xué)出版社,2000.
[6]國(guó)家技術(shù)監(jiān)督局,國(guó)家科學(xué)技術(shù)委員會(huì).GB/T13745—1992學(xué)科分類與代碼[s]∥新聞出版署圖書(shū)管理司,中國(guó)標(biāo)準(zhǔn)出版社.作者編輯常用國(guó)家標(biāo)準(zhǔn).北京:中國(guó)標(biāo)準(zhǔn)出版社,1997:426-513.
作者簡(jiǎn)介:胡欽文(1981-),女,重慶人,本科,館員,研究方向:數(shù)據(jù)挖掘、圖書(shū)館資料。
作者單位:重慶理工大學(xué)圖書(shū)館,重慶 400054
基金項(xiàng)目:此文為重慶理工大學(xué)高等教育教學(xué)改革研究項(xiàng)目(編號(hào)編號(hào):2013YB64)。