• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      讀者借閱行為的時(shí)間序列分析及預(yù)測(cè)

      2013-04-25 09:51:28
      河北科技圖苑 2013年5期
      關(guān)鍵詞:時(shí)序校區(qū)差分

      張 淼

      (華南師范大學(xué)圖書館 廣東 廣州 510631)

      1 研究背景與目的

      隨著信息研究范式從“以系統(tǒng)為中心”到“以用戶為中心”的轉(zhuǎn)變[1],對(duì)用戶信息行為的全面分析日益成為圖書館學(xué)研究的熱點(diǎn)。讀者的借閱行為是讀者最主要的信息行為之一,對(duì)讀者借閱歷史行為的客觀記錄進(jìn)行分析,可以改變讀者工作主觀經(jīng)驗(yàn)積累的現(xiàn)狀,也是圖書館開展深層次服務(wù)工作的前提條件。同時(shí),隨著圖書館信息化的發(fā)展,館藏信息資源的購買數(shù)量、比例分布都發(fā)生了明顯的變化,對(duì)讀者借閱行為的發(fā)展趨勢(shì)進(jìn)行分析和預(yù)測(cè),可以了解紙質(zhì)館藏借閱的發(fā)展情況、變化規(guī)律,完成預(yù)測(cè)未來行為等決策性工作。而時(shí)間序列分析,作為統(tǒng)計(jì)分析預(yù)測(cè)的方法之一[2],可以對(duì)讀者借閱行為進(jìn)行良好的分析與預(yù)測(cè)。

      2 研究方法及研究對(duì)象

      所謂時(shí)間序列分析(Time Series Analysis),是一種動(dòng)態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法,該方法基于隨機(jī)過程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問題[3]。時(shí)間序列分析方法豐富多樣,有不同的流派和方法,其中簡單回歸分析法、趨勢(shì)外推法、指數(shù)平滑法等都是產(chǎn)生時(shí)間較長且較簡單直觀的分析方法。而B-J算法的ARMA、ARIMA模型等則是較新的、近期才逐漸受到關(guān)注的方法。這些方法對(duì)時(shí)間序列有著不同的考察角度,因而有著自己適合的分析領(lǐng)域和用途。本文根據(jù)讀者借閱數(shù)據(jù)的序列特點(diǎn),選取其中適合的三種模型分別進(jìn)行比較分析。

      通過華南師范大學(xué)圖書館(以下簡稱本館)匯文文獻(xiàn)信息服務(wù)系統(tǒng)中的統(tǒng)計(jì)模塊,以2000年1月1日到2011年12月31日為限,收集一校三區(qū)圖書館(石牌校區(qū)、大學(xué)城校區(qū)、南海校區(qū))11年以來的紙本中文圖書的借閱信息,分別進(jìn)行統(tǒng)計(jì)整理與分析。本研究使用SPSS17.0作為統(tǒng)計(jì)分析工具。

      3 時(shí)間序列分析與預(yù)測(cè)

      3.1 時(shí)序特性分析

      為了建立適宜的時(shí)序模型,首先需要對(duì)序列的特性進(jìn)行分析,即對(duì)時(shí)間序列的隨機(jī)性、平穩(wěn)性、季節(jié)性的判斷分析。圖1是根據(jù)正在流通的中文圖書的借閱數(shù)據(jù)繪制的時(shí)序曲線圖,即時(shí)序分布圖。

      圖1 時(shí)序分布圖

      從圖1直觀地看,數(shù)據(jù)從2000年開始慢慢走高,在2008年開始回落,之后漸漸走低。序列是帶有明顯的趨勢(shì)性、波動(dòng)性、伴有周期性的季節(jié)變動(dòng)的非平穩(wěn)數(shù)據(jù),且波動(dòng)幅度不斷增大。由于序列中數(shù)據(jù)較多,可以繼續(xù)利用自相關(guān)函數(shù)圖(自相關(guān)函數(shù)圖是序列平穩(wěn)性考察中首當(dāng)其沖的圖形工具,對(duì)識(shí)別時(shí)間序列的各種非平穩(wěn)性和確定時(shí)序模型中的參數(shù)有非常重要的作用[2])進(jìn)行序列判斷。圖2是本序列的自相關(guān)函數(shù)圖,由圖2可知,25階自相關(guān)函數(shù)值大部分超出隨機(jī)區(qū)間,序列為非平穩(wěn)序列,具有趨勢(shì)性、波動(dòng)性變動(dòng),并在k=6、12、18、24處取值較大,再次確認(rèn)序列具有明顯的季節(jié)性。

      圖2 自相關(guān)函數(shù)圖

      運(yùn)用時(shí)間序列分析法的關(guān)鍵就是模型選擇,根據(jù)時(shí)間按序列的特性選擇一個(gè)與實(shí)際過程相吻合的模型結(jié)果,即模型選擇[3],不同的時(shí)序分析方法采用不同的工具選擇模型。根據(jù)本序列的時(shí)序特征分析,可以初步選定三類模型:傳統(tǒng)時(shí)序分析中的指數(shù)平滑模型(假設(shè)為A型)、隨機(jī)時(shí)序分析中的ARIMA模型(B型)、季節(jié)分解模型(C型)。接下來分別闡述并比較三種模型。

      圖3 預(yù)測(cè)殘差

      3.2 指數(shù)平滑模型

      指數(shù)平滑模型是在B-J方法產(chǎn)生之前最為常見的一種方法,它是在加權(quán)移動(dòng)平均法的基礎(chǔ)上形成,可以對(duì)不規(guī)則數(shù)據(jù)加以平滑,從而獲得其變化規(guī)律和趨勢(shì),以此對(duì)未來的數(shù)據(jù)進(jìn)行預(yù)測(cè)[4]。主要有三種方法:Simple、Holt、Winter。這些模型在其趨勢(shì)和季節(jié)構(gòu)成方面是不同的,根據(jù)對(duì)趨勢(shì)和季節(jié)的不同假設(shè),可任一選擇相應(yīng)的模型對(duì)不規(guī)則構(gòu)成的時(shí)間序列進(jìn)行平滑處理[5]。本序列采用季節(jié)性指數(shù)平滑WINTERS。統(tǒng)計(jì)結(jié)果顯示:平穩(wěn)的R方值為0.681,R方為0.853,從兩個(gè)R方值來看,該指數(shù)平滑模型的擬合情況比較良好。殘差的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)如圖3所示,可見兩個(gè)圖形都沒有顯著的趨勢(shì)特征,故可以初步判斷本序列所用模型比較適當(dāng)。預(yù)測(cè)結(jié)果和擬合圖形輸出如圖4所示,可以看出觀測(cè)值與預(yù)測(cè)值的擬合情況,最初的幾年擬合良好,之后前期不如后期。這與指數(shù)平滑模型的特點(diǎn)一致,指數(shù)平滑法的不足是模型有一定的不確定之處,預(yù)測(cè)只根據(jù)部分?jǐn)?shù)據(jù),對(duì)全部數(shù)據(jù)中的信息利用不足,因此如果是對(duì)2012年預(yù)測(cè),可以選取比較臨近的數(shù)據(jù)進(jìn)行預(yù)測(cè)。下面介紹的ARIMA模型將對(duì)序列的整體趨勢(shì)利用得更充分。

      圖4 指數(shù)平滑模型擬合值圖

      3.3 ARIMA隨機(jī)時(shí)序模型

      ARIMA是自回歸綜合移動(dòng)平均模型(Autoregressive Integrated Moving Average Models),是隨機(jī)性時(shí)間序列分析的代表性方法[2],也是時(shí)間序列分析模型中非常通用的方法[6],最常用于含有季節(jié)成分時(shí)間序列的分析[7],對(duì)于同時(shí)存在趨勢(shì)性和季節(jié)性的序列,其模型一般記為 ARIMA(p,d,q)(P,D,Q)s,其中P、Q為季節(jié)性的自回歸和移動(dòng)平均階數(shù),D為季節(jié)差分的階數(shù),s為季節(jié)周期。ARIMA實(shí)際上是建立在平穩(wěn)序列基礎(chǔ)上的,因此首先要對(duì)非平穩(wěn)數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)序列。

      3.3.1 數(shù)據(jù)平穩(wěn)化處理

      平穩(wěn)化指根據(jù)序列的特點(diǎn)和分析的需要對(duì)數(shù)據(jù)進(jìn)行必要的變換處理,目的使序列的特征體現(xiàn)得更加明顯,利于模型的選擇,包括階差分、季節(jié)差分、對(duì)數(shù)轉(zhuǎn)換等。過多平穩(wěn)化處理的數(shù)據(jù)不能真實(shí)的反應(yīng)數(shù)據(jù)的特點(diǎn),但如果平穩(wěn)化不足,也會(huì)給后面的預(yù)測(cè)帶來很大的誤差。由以上分析可知本序列具有趨勢(shì)性及季節(jié)變動(dòng),可進(jìn)行一階逐期差分,發(fā)現(xiàn)序列在K=6,12時(shí),自相關(guān)系數(shù)均較大,具有季節(jié)變動(dòng),對(duì)一階差分序列再進(jìn)行一階季節(jié)差分,再繪制差分后序列的自相關(guān)圖和偏自相關(guān)圖,如圖5、6所示,序列的趨勢(shì)、季節(jié)變動(dòng)消除,序列已基本平穩(wěn)。

      圖5 平穩(wěn)化后的自相關(guān)圖

      圖6 平穩(wěn)化的偏自相關(guān)圖

      3.3.2 參數(shù)確定

      接下來,根據(jù)前面進(jìn)行的差分過程,嘗試建立ARIMA模型,并考察模型效果。AMIMA的完整形式是 ARIMA(p,d,q)(P,D,Q)s。平穩(wěn)化處理中進(jìn)行一階逐期差分和一階季節(jié)差分,得到了一個(gè)基本平穩(wěn)的序列。于是模型中d和D應(yīng)同時(shí)取1;從自相關(guān)圖5看,1階以后函數(shù)值明顯趨于0,呈拖尾性,可取q為1,而12階的函數(shù)值明顯不為0,因此Q可取1;再看偏自相關(guān)圖6,前3階函數(shù)值均顯著不為0,之后慢慢趨于0,因此P可取3或4,而第12階值在線以內(nèi),因此P可取0。于是得到初步的模型形式為:ARIMA(3,1,1)(0,1,1)12或 ARIMA(4,1,1)(0,1,1)12,比較以后可選前者,模型分析結(jié)果如圖7所示。

      圖7 ARIMA模型擬合圖

      3.4 季節(jié)分解模型

      以上兩種模型都是把季節(jié)性周期作為序列利用中的一個(gè)成分在預(yù)測(cè)時(shí)加以利用,而季節(jié)分解模型目的是將季節(jié)因素提取出來,從而更便于對(duì)剩余序列做進(jìn)一步的分析[2]。季節(jié)分解法認(rèn)為,時(shí)間序列有4種成分,分別是:趨勢(shì)性T(Trend)、季節(jié)性S(Seasonal)、周期性P(Periodicity)和不規(guī)則波動(dòng)性I(Irregular Variations)。這些成分通過不同的組合方式影響時(shí)間序列的變化,通常分為加法模型和乘法模型。加法模型的一般形式為Y=T+S+P+I(xiàn),乘法模型的一般形式為Y=T×S×P×I。由于本序列具有趨勢(shì)性及明顯的季節(jié)性,因此在季節(jié)分解中應(yīng)引入趨勢(shì)因素、季節(jié)因素,序列上下波動(dòng)幅度有增大的趨勢(shì),這點(diǎn)提示可以采用乘法模型?;具^程為先通過移動(dòng)平均消除序列中的季節(jié)性和其他波動(dòng),再剔除趨勢(shì)因素,計(jì)算出季節(jié)指數(shù)(SAF),之后剔除季節(jié)成分,得到季節(jié)調(diào)整的序列(SAS),再進(jìn)行平滑處理得到循環(huán)波動(dòng)序列(STC),最后根據(jù)STC值進(jìn)行線性回歸,預(yù)測(cè)2012年的借閱量。由SPSS進(jìn)行季節(jié)分解,可以得到四個(gè)新變量:ERR(誤差項(xiàng))、SAS(季節(jié)調(diào)整)、SAF(季節(jié)指數(shù))、STC_1(周期變化指數(shù))。季節(jié)指數(shù)如圖8所示,每年的2月是寒假,是借閱量第一個(gè)最低點(diǎn),之后3月份開學(xué)是整年中借閱量最大的月份,之后一路走低,到8月份是整年借閱量的最低點(diǎn),暑假開學(xué)后由于各類考試的增多,借閱量不斷走高。對(duì)獲得的STC值進(jìn)行SPSS中的專家模型預(yù)測(cè),將預(yù)測(cè)值與季節(jié)指數(shù)相乘,最終得到2012年的預(yù)測(cè)值。

      圖8 季節(jié)比率圖

      圖9 季節(jié)分解法擬合圖

      4 分析、預(yù)測(cè)及結(jié)論

      4.1 各模型比較分析

      對(duì)歷史數(shù)據(jù)擬合效果分析,由圖4、7、9可以看出,三種模型的擬合效果都不錯(cuò),他們對(duì)2012年預(yù)測(cè)如表1所示,將表格作折線圖如圖10所示。從三種模型對(duì)借閱量的擬合與試預(yù)測(cè)效果看,ARIMA模型的精度高于傳統(tǒng)模型;在傳統(tǒng)模型中,WINTERS指數(shù)平滑法效果略好于季節(jié)分解法。ARIMA模型適用于短期預(yù)測(cè),若預(yù)測(cè)借閱量下一年各月的變化,在外界環(huán)境相對(duì)穩(wěn)定的情況下,從實(shí)用的角度可選用 ARIMA(3,1,1)(0,1,1)12預(yù)測(cè)較好,若預(yù)測(cè)借閱量一段時(shí)期的變化,ARIMA模型可能不如傳統(tǒng)時(shí)序模型。

      表1 2012年1-11月借閱實(shí)際值與各模型預(yù)測(cè)值

      圖10 2012年1-11月借閱實(shí)際值與各模型預(yù)測(cè)值

      4.2 各校區(qū)館藏、借閱量比較分析

      利用時(shí)間序列圖的比較分析仍然可以發(fā)現(xiàn)一些有趣的結(jié)論,例如,對(duì)石牌校區(qū)、大學(xué)城兩校區(qū)的館藏及借閱年度增長量進(jìn)行比較分析,如圖11。可以看出,2006年到2012年兩校區(qū)的館藏增加量基本相同,兩條曲線基本重合,都呈現(xiàn)逐漸下降的趨勢(shì),這主要是由于購書經(jīng)費(fèi)的減少以及采購策略的變化(逐步減少對(duì)紙本資源的購買力度,擴(kuò)大電子資源的購買)。與之相應(yīng)的兩校區(qū)的借閱增長的幅度也逐漸下滑,下滑速度比館藏的下滑速度更為明顯。到2008年,由于當(dāng)年政府招標(biāo)采購出現(xiàn)誤差造成新書到館延遲,上半年基本沒有新書入庫,而上半年正是學(xué)生撰寫畢業(yè)論文,導(dǎo)致2008年與2007年相比借閱量大幅下滑,增長量開始出現(xiàn)負(fù)值。

      圖11 兩校區(qū)館藏與借閱的增長量

      另外,本館近年來在暑假期間堅(jiān)持開放,逐年延長開放時(shí)間,結(jié)合石牌校區(qū)借閱庫室的劃分,將社科書庫(A-F與 H)、理科書庫(N-Z)、文藝書庫(IJK類)、教育書庫(G類)的各年8月份借閱量及總量繪制在一起,如圖12所示。2008年以前有波動(dòng),之后借閱量逐步升高,但2012年突然下滑,其中可能的原因與2012年暑假前夕將本館的自修室取消有關(guān)。暑假期間是考研等各類考試的準(zhǔn)備期,來館自修也會(huì)間接地借閱圖書。當(dāng)然,讀者借閱量的變化與館藏入庫新書量的變化、入館人數(shù)是否有關(guān),相關(guān)的程度又如何,還需進(jìn)一步的驗(yàn)證。例如,可以對(duì)兩校區(qū)2006年到2012年館藏的增加量與借閱量進(jìn)行一個(gè)積差相關(guān)(皮爾遜相關(guān)),可以得到二者在0.01水平(雙側(cè))上顯著相關(guān),相關(guān)系數(shù)(r)=0.688,二者呈正相關(guān)。

      圖12 石牌校區(qū)歷年8月份借閱量

      4.3 圖書館應(yīng)建立長效而深入的分析機(jī)制

      從時(shí)間序列分析的預(yù)測(cè)結(jié)果看,讀者借閱量的變化容易受到各種環(huán)境因素的干擾。例如,本研究中2004年我館本科評(píng)估時(shí)購買大量的圖書補(bǔ)充進(jìn)來促使當(dāng)時(shí)的借閱量上升明顯,2008年由于招標(biāo)采購的政策問題導(dǎo)致年底才有新書入庫從而使當(dāng)年借閱量大幅下降,2012年暑假石牌校區(qū)庫室調(diào)整關(guān)閉自修室導(dǎo)致8月份借閱量顯著下滑。而外部環(huán)境的劇烈變化造成借閱量的波動(dòng)都會(huì)對(duì)時(shí)間序列預(yù)測(cè)結(jié)果的精度產(chǎn)生影響。可以說,目前讀者工作的開展更多地停留在主觀經(jīng)驗(yàn)的積累,這種形式的積累不利于傳承,不利于應(yīng)用,也使得政策決策缺乏客觀依據(jù)。那么如何客觀有效地把握館藏利用的動(dòng)態(tài)規(guī)律、讀者閱讀心理與行為的內(nèi)在機(jī)制呢?基于圖書館自動(dòng)化信息系統(tǒng),對(duì)其積攢的大量館藏及利用數(shù)據(jù)進(jìn)行客觀、深入、長效的統(tǒng)計(jì)分析就是一種思路,這種分析不是短期的、個(gè)體館員的零散行為,而是長期的、深入的圖書館的機(jī)構(gòu)行為。將圖書館的統(tǒng)計(jì)分析成為各級(jí)館員都能動(dòng)態(tài)掌握的工具,作為工作的常態(tài)進(jìn)行開展,將讀者借閱看成是有生命的有機(jī)體,傾聽其中傳遞的聲音,制定相應(yīng)靈活、適用于本館的規(guī)則與決策,使讀者工作變得鮮活。

      [1]李桂華.信息服務(wù)設(shè)計(jì)與管理[M].北京:清華大學(xué)出版社,2009:1-245.

      [2]薛微.SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2004:402-407.

      [3]馮力.統(tǒng)計(jì)學(xué)實(shí)驗(yàn)[M].大連:東北財(cái)經(jīng)大學(xué)出版社,2008:134-142.

      [4]劉震,吳廣,丁維岱,等.SPSS統(tǒng)計(jì)分析與應(yīng)用[M].北京:電子工業(yè)出版社,2011:339-363.

      [5]呂振通,張凌云.SPSS統(tǒng)計(jì)分析與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2009:253-257.

      [6]胡平,崔文田,徐青川.應(yīng)用統(tǒng)計(jì)分析教學(xué)實(shí)踐案例集[M].北京:清華大學(xué)出版社,2007:30-34.

      [7]黃潤龍.數(shù)據(jù)統(tǒng)計(jì)分析——SPSS原理及應(yīng)用[M].北京:高等教育出版社,2010:310-318.

      猜你喜歡
      時(shí)序校區(qū)差分
      時(shí)序坐標(biāo)
      成都醫(yī)學(xué)院新都校區(qū)南大門
      成都醫(yī)學(xué)院新都校區(qū)一角
      基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
      數(shù)列與差分
      山東大學(xué)青島校區(qū)
      文苑(2018年23期)2018-12-14 01:06:04
      我校臨安校區(qū)簡介
      一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
      電子制作(2016年15期)2017-01-15 13:39:08
      基于差分隱私的大數(shù)據(jù)隱私保護(hù)
      相對(duì)差分單項(xiàng)測(cè)距△DOR
      太空探索(2014年1期)2014-07-10 13:41:50
      青海省| 丹巴县| 勃利县| 呼和浩特市| 隆子县| 噶尔县| 榆林市| 科技| 罗平县| 峡江县| 宝坻区| 阳西县| 永定县| 马关县| 罗平县| 长宁县| 吴川市| 萝北县| 遵义市| 庄河市| 永新县| 睢宁县| 淮南市| 班戈县| 建平县| 温州市| 广元市| 固阳县| 会宁县| 大田县| 五河县| 阿坝县| 麟游县| 大新县| 丹巴县| 麻江县| 常德市| 岑巩县| 靖宇县| 满洲里市| 日照市|