●李冬梅(福建農(nóng)林大學(xué)圖書館,福州350002)
圖書利用率的ARMA模型構(gòu)建與預(yù)測實證分析
——以福建農(nóng)林大學(xué)圖書館為例
●李冬梅(福建農(nóng)林大學(xué)圖書館,福州350002)
圖書利用率;ARMA模型;EⅤiews軟件
ARMA模型是研究時間序列的重要方法,本文以福建農(nóng)林大學(xué)圖書館2003~2011年22大類館藏紙質(zhì)圖書利用率數(shù)據(jù)作為建模樣本,在EⅤiews 6.0軟件平臺建立各類圖書利用率的ARMA模型,經(jīng)檢驗擬合效果較好。并對2012~2015年的各類圖書利用率進(jìn)行了預(yù)測,對未來圖書館圖書采購、典藏管理有一定的現(xiàn)實意義。
圖書利用率是館藏質(zhì)量及藏書利用情況的一項重要指標(biāo),反映了文獻(xiàn)被讀者利用的情況及完成社會功能的水平。時間序列分析是一種通過研究對象隨時間變化的過程來反映其變化規(guī)律并進(jìn)行預(yù)測和分析的定量分析方法。筆者利用維普、萬方、清華同方數(shù)據(jù)庫,用“時間序列*(文獻(xiàn)+電子+資源+期刊+圖書)*(利用+借閱)”進(jìn)行檢索,發(fā)現(xiàn)目前文獻(xiàn)利用率的研究主要集中于理論的分析和探討,[1,2]時間序列分析在高校圖書館預(yù)測領(lǐng)域的應(yīng)用不多,少數(shù)作者將灰色系統(tǒng)理論、回歸預(yù)測分析、時間序列分析等方法應(yīng)用于圖書館借閱量的預(yù)測。[3-5]文章以福建農(nóng)林大學(xué)圖書館2003~2011年22大類圖書的館藏紙質(zhì)圖書利用率數(shù)據(jù)為樣本,構(gòu)建ARMA模型,并進(jìn)行實證分析擬合及預(yù)測。
1.1 ARMA模型
ARMA模型是研究時間序列的重要方法,由美國統(tǒng)計學(xué)家博克斯和英國統(tǒng)計學(xué)家詹金斯于20世紀(jì)70年代提出,ARMA模型的數(shù)學(xué)公式為:[6]
式中:φ1,φ2,……,φp為自回歸系數(shù);θ1,θ2,……θq為移動平均系數(shù),都是模型的待估參數(shù)。此式為(p,q)階的自回歸移動平均模型。時間序列yt是自回歸移動平均序列。
1.2 ARMA建模步驟
ARMA模型對于短期預(yù)測具有較高的精度。運用該模型預(yù)測既考慮到圖書利用率在時間序列上的變化規(guī)律性,又考慮了隨機(jī)波動的干擾性,故可較準(zhǔn)確預(yù)測圖書利用率的未來趨勢。其建模步驟如下:[6,7]
(1)時間序列的識別和模型形式的選擇;
(2)用EⅤiews 6.0統(tǒng)計軟件進(jìn)行模型參數(shù)估計;[8](3)模型的診斷檢驗。
2.1 序列平穩(wěn)性檢驗和處理
以福建農(nóng)林大學(xué)圖書館2003~2011年中圖法22大類的圖書利用率數(shù)據(jù)作為分析樣本,分別計算出各大類圖書在統(tǒng)計年限內(nèi)的圖書利用率,圖書利用率公式[9]為:
22大類藏書利用率時間序列,如圖1所示。
由圖1可見,2007~2008年,圖書利用率出現(xiàn)較大的飛躍,分析其主要原因是:為迎接本科評估,學(xué)校加大了圖書購置經(jīng)費的投入,館藏圖書極大豐富,吸引更多讀者前來借閱;2008年,建筑面積達(dá)2.7萬平方米的新館投入使用,寬敞明亮的閱覽和外借環(huán)境讓更多讀者流連駐足,借閱量隨之大幅增長。然而2008年后圖書利用率呈下降趨勢。從整個時序圖來看,具有非平穩(wěn)性。
從圖1還可以看到各類圖書利用率排名情況,Ⅰ、H和B類在歷年統(tǒng)計中都位居前三,K、E、J類相比于F類稍高。在自然科學(xué)中,O類最高,其次是Q、T、R和X類,Ⅴ類、P類、Z類排在倒數(shù)幾位,圖書利用率較低,這說明基礎(chǔ)類或公共類學(xué)科受重視程度較高;反映農(nóng)林特色的S類在2003~2011年間排名一直處于倒數(shù)第五或第六。
經(jīng)ADF單位根檢驗,該22大類圖書利用率時間序列均為非平穩(wěn)序列,需要進(jìn)行差分處理。經(jīng)處理,樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都迅速落入隨機(jī)區(qū)間,各序列達(dá)到較好的平穩(wěn)性,具體差分情況見表1。
圖1 22大類圖書利用率的時間序列
表1 22大類圖書利用率時間序列的差分平穩(wěn)序列
由表1可知,A、B、C、D、F、G、H、J、N、O、T、U、Ⅴ、X、Ⅰ、K序列1階差分后即平穩(wěn),E、R、Q、S、Z類2階差分后得到平穩(wěn)序列,P類則進(jìn)行了3階差分。
2.2 ARMA模型的識別和建立
根據(jù)差分后得到的平穩(wěn)序列自相關(guān)-偏自相關(guān)系數(shù)圖,確定可能的p和q值,建立多個模型進(jìn)行檢驗比較,根據(jù)AⅠC準(zhǔn)則和SC準(zhǔn)則評判擬合模型的優(yōu)劣,選取最優(yōu)的模型,結(jié)果如表2所示。
2.3 模型特征根檢驗和殘差序列自相關(guān)檢驗
為診斷所選用的模型是否合適,需對模型特征根和殘差序列自相關(guān)進(jìn)行檢驗。若全部特征根的倒數(shù)都在單位圓以內(nèi),說明模型具有平穩(wěn)性和可逆性。同時,殘差對應(yīng)的自相關(guān)和偏相關(guān)函數(shù)均在置信區(qū)間內(nèi),認(rèn)為殘差序列為白噪聲序列,不存在自相關(guān),模型通過檢驗可以用于實際預(yù)測。
結(jié)合之前已定階數(shù)d可以得到原時間序列的ARⅠMA(p,d,q)模型(如表3所示)。
表2 22大類圖書利用率時間序列的ARMA模型及AⅠC和SC值
表3 圖書利用率時間序列ARⅠMA模型
2.4 預(yù)測分析
用所建22大類ARMA模型對2003~2015年各類圖書的利用率進(jìn)行擬合預(yù)測,結(jié)果如圖2所示。從平均絕對百分誤差、希爾不等系數(shù)、偏差率、方差率和協(xié)方差率等5個指標(biāo)來考察各類圖書的利用率模型的預(yù)測效果(如表4所示)。平均絕對百分誤差一般在MAPE<10時,認(rèn)為預(yù)測精度較高,表4中除F類和G類略高于10之外,大部分類別的MAPE值都小于3。希爾不等系數(shù)值越小,表示擬合值和真實值差異越小,從表4中可以看到22大類的希爾不等系數(shù)均較接近于0,說明其擬合值和真實值差異很小,擬合效果好??傮w上衡量預(yù)測精度的各個指標(biāo)均較為理想,各類圖書利用率的ARMA模型擬合效果較好,對圖書利用率的預(yù)測具有一定的實用性和可操作性。
由圖2可見,22大類圖書利用率從2012年后整體呈下降趨勢,但突出農(nóng)林特色的專業(yè)圖書(Q、R、S、U、X類)的利用率一直呈上升趨勢,甚至在2015年利用率較2011年翻了一番,F(xiàn)類圖書的利用率在2012年小幅下降后,在未來4年總體利用率比較均衡。
表4 圖書利用率預(yù)測效果指標(biāo)
圖2 2012~2015年圖書利用率預(yù)測結(jié)果
3.1 小結(jié)
本研究利用ARMA模型,基于福建農(nóng)林大學(xué)圖書館數(shù)據(jù)構(gòu)建了圖書利用率模型,通過實證分析,取得較好的擬合效果,反映了ARMA模型在圖書利用率方面具有較強(qiáng)的指導(dǎo)意義。2003~2011年的時間序列圖(圖1)反映了該校學(xué)科特點及藏書建設(shè)情況。各類圖書利用率在2007~2008年高峰后又逐漸下降,分析其中一個重要原因是由于網(wǎng)絡(luò)信息資源的飛速發(fā)展,導(dǎo)致其借閱量下降,這給傳統(tǒng)圖書館如何構(gòu)建新的“供給-需求”服務(wù)模式提出了新課題。
福建農(nóng)林大學(xué)近10年已從農(nóng)科特色大學(xué)逐漸發(fā)展成綜合性大學(xué),Ⅰ、H、B、K、E、J、F、O類等基礎(chǔ)、綜合性知識利用率高,反映綜合性大學(xué)特點;S、 Q、R和X類等反映農(nóng)科、生物科學(xué)類的圖書利用率較低,表明以農(nóng)科優(yōu)勢學(xué)科為主的大學(xué)特點沒有很好地體現(xiàn)。然而,從圖2預(yù)測分析看,在具有農(nóng)林特色的專業(yè)圖書中,S和Q類圖書利用率明顯呈上升趨勢,X類呈小幅平穩(wěn)上升,表明該校圖書館在2011年后應(yīng)加強(qiáng)農(nóng)林特色學(xué)科建設(shè)的圖書采購和優(yōu)化配置。3.2建議
目前,紙質(zhì)圖書利用率仍是體現(xiàn)高校圖書館利用價值的重要指標(biāo),在網(wǎng)絡(luò)信息時代,圖書館可以借助微博、微信等進(jìn)一步拓寬服務(wù)的深度和廣度,實現(xiàn)與用戶實時互動,方便讀者更好地利用圖書館紙質(zhì)資源。同時,可以從本校實際出發(fā),建立適合自己學(xué)科發(fā)展的圖書利用率模型,更好地指導(dǎo)圖書采購,實現(xiàn)資源最優(yōu)利用。
[1]張曉艷.關(guān)于提高紙質(zhì)期刊利用率的思考[J].圖書館學(xué)刊,2010(7):30-32.
[2]胡彥成.關(guān)于藏書利用率計算方法的探討[J].圖書館理論與實踐,1989(4):35-36.
[3]吳紅艷.圖書借閱流量行為季節(jié)預(yù)測模型[J].圖書情報工作,2007(11):98-101.
[4]王春梅.圖書流量預(yù)測模型[J].佳木斯大學(xué)學(xué)報(自然科學(xué)版),2005(7):431-433.
[5]劉琳.圖書借閱預(yù)測的ARⅠMA乘積季節(jié)模型構(gòu)建及實證分析[J].華北科技學(xué)院學(xué)報,2011(3):105-108.
[6]范玉妹,玄婧.ARMA算法在GDP預(yù)測中的應(yīng)用[J].江南大學(xué)學(xué)報(自然科學(xué)版),2010,9(6):736-740.
[7]李良.Eviews軟件在ARⅠMA模型中的應(yīng)用研究——以蘇州接待國內(nèi)游客人數(shù)為例[J].安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報,2011,10(53):31-32,51.
[8]攸頻,張曉峒.EⅤiews 6實用教程[M].北京:中國財政經(jīng)濟(jì)出版社,2008.
[9]陳潔薇.圖書利用率的辯證分析[J].四川圖書館學(xué)報,2010(4):44-46.
G252.8;G253.5
A
1005-8214(2014)09-0016-03
李冬梅(1975-),女,碩士,福建農(nóng)林大學(xué)圖書館辦公室主任,館員,已發(fā)表論文10余篇,研究方向:信息資源與信息服務(wù)。
2013-07-17[責(zé)任編輯]邵晉蓉