齊 航 楊婷婷 馬致明
高校圖書館是大學(xué)的信息集散地之一,館內(nèi)存放著各種科類書籍,是大學(xué)中存放書籍科類最全、數(shù)目最多的地方,也是學(xué)生除了宿舍和教室以外出入最多的地方。在圖書館中,每天都有學(xué)生出入借閱書籍,從而產(chǎn)生大量的數(shù)據(jù)。這些數(shù)據(jù)記錄著學(xué)生出入圖書館時(shí)間以及借閱書籍信息,隱含著學(xué)生的行為習(xí)慣、書籍流通的規(guī)律等。對(duì)圖書館內(nèi)記錄的數(shù)據(jù)進(jìn)行分析總結(jié),從分析結(jié)果中可以推測(cè)出學(xué)生借閱書籍的規(guī)律、讀書習(xí)慣和需求等,分析結(jié)果能夠使圖書館更好地服務(wù)學(xué)生,向?qū)W生提供更有參考價(jià)值的書籍,為高校的人才培養(yǎng)、科學(xué)研究提供更加可靠、有參考價(jià)值的數(shù)據(jù)應(yīng)用。
1.數(shù)據(jù)分析概述。數(shù)據(jù)分析即通過(guò)恰當(dāng)?shù)难芯糠椒▽?duì)收集的大量數(shù)據(jù)進(jìn)行詳細(xì)的分析研究,從分析的結(jié)果中得出有用的信息,對(duì)分析結(jié)果進(jìn)行概述和總結(jié)。數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)在20世紀(jì)早期就已確立,但直到計(jì)算機(jī)的出現(xiàn)才使得實(shí)際操作成為可能,并使得數(shù)據(jù)分析得以推廣[1]。數(shù)據(jù)分析的目的是從大批看似毫無(wú)關(guān)聯(lián)的數(shù)據(jù)中篩選和提取有用信息出來(lái),找出研究對(duì)象的內(nèi)在規(guī)律。
2.數(shù)據(jù)分析流程。(1)數(shù)據(jù)收集。根據(jù)研究的需要收集與研究相關(guān)的數(shù)據(jù)。(2)數(shù)據(jù)處理。對(duì)收集的數(shù)據(jù)進(jìn)行篩選和提取,從收集的數(shù)據(jù)中,根據(jù)研究問(wèn)題的需要對(duì)數(shù)據(jù)進(jìn)行篩選,刪除無(wú)用和冗余的數(shù)據(jù)。(3)數(shù)據(jù)分析。采用適合的方法對(duì)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)數(shù)據(jù)中存在的新特征,挖掘并驗(yàn)證數(shù)據(jù)之間潛在的關(guān)聯(lián)。(4)數(shù)據(jù)展示。根據(jù)數(shù)據(jù)分析出來(lái)的結(jié)果,挑選出最適合展現(xiàn)數(shù)據(jù)的方式,表格或者圖形等能夠一目了然地發(fā)現(xiàn)數(shù)據(jù)之間存在的規(guī)律。(5)編寫報(bào)告。數(shù)據(jù)分析的最后一步即編寫報(bào)告,將數(shù)據(jù)分析的結(jié)果進(jìn)行匯總。一份優(yōu)秀的報(bào)告需要一個(gè)明確的主題、清晰的目錄、圖文并茂的描述數(shù)據(jù)、結(jié)論和建議。
3.數(shù)據(jù)分析方法。數(shù)據(jù)分析方法分為兩種,一種是統(tǒng)計(jì)分析方法,另一種是數(shù)據(jù)挖掘方法[2]。根據(jù)分析目的的不同,選擇不同的分析方法,得出的結(jié)論也會(huì)有所不同。(1)統(tǒng)計(jì)分析方法。①描述性統(tǒng)計(jì)分析。描述性統(tǒng)計(jì)分析是通過(guò)圖標(biāo)或數(shù)學(xué)方法, 對(duì)數(shù)據(jù)資料進(jìn)行整理、分析,并對(duì)數(shù)據(jù)的分布狀態(tài)、數(shù)字特征和隨機(jī)變量之間的關(guān)系進(jìn)行估計(jì)和描述的方法[2]。②關(guān)聯(lián)分析。又稱關(guān)聯(lián)挖掘, 通過(guò)分析由定性變量構(gòu)成的交互匯總表,從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有趣的關(guān)聯(lián)和相關(guān)聯(lián)系[2]。③回歸分析?;貧w分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法[2]。④因子分析。因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù),即從大量的數(shù)據(jù)中尋找內(nèi)在的聯(lián)系從而減輕決策困難的分析方法[2]。⑤方差分析。方差分析又稱 “ 變異數(shù)分析 ” 或 “ F 檢驗(yàn) ” ,用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)[2]。(2)數(shù)據(jù)挖掘方法。①分類分析。分類分析是基于數(shù)據(jù)中某些相同的特點(diǎn)將數(shù)據(jù)劃分為不同的類型。分類分析的目的是將數(shù)據(jù)庫(kù)中的數(shù)據(jù)映射到某類別中。分類算法一般有決策樹、貝葉斯分類等。②聚類分析。對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分組,使得相近的數(shù)據(jù)為同一組,相異數(shù)據(jù)為不同組,通過(guò)分組識(shí)別出數(shù)據(jù)之間的差異。③關(guān)聯(lián)規(guī)則。在數(shù)據(jù)庫(kù)中某一數(shù)據(jù)項(xiàng)發(fā)生的同時(shí),另一數(shù)據(jù)項(xiàng)也隨之出現(xiàn),即描述隱藏在數(shù)據(jù)之間的關(guān)系規(guī)則。④回歸分析。數(shù)據(jù)挖掘中的回歸分析主要是多元線性回歸和邏輯斯蒂回歸,后者多在數(shù)據(jù)化運(yùn)營(yíng)中使用[2]。多元線性回歸主要用于概括一批自變量的變化導(dǎo)致一個(gè)因變量的變化,反映數(shù)據(jù)中因變量和自變量之間存在的關(guān)系。
圖1 數(shù)據(jù)分析在圖書館中的應(yīng)用模型
1.理論應(yīng)用。在大學(xué)里,除了宿舍和教室這些必經(jīng)之地外,學(xué)生去的最多的地方便是學(xué)校圖書館。高校圖書館存在意義和價(jià)值很多,并不只是簡(jiǎn)單為學(xué)生們提供知識(shí)信息,給教師們提供參考文獻(xiàn),而是在于對(duì)高校文化建設(shè)的支持和輔助,為高校精神文化建設(shè)提供源源不斷的動(dòng)力支持,使大學(xué)精神能夠得到延續(xù)和傳承[3]。
數(shù)據(jù)分析主要分為數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用,圖1 所展示的是數(shù)據(jù)分析在高校圖書館應(yīng)用的模型,不同階段對(duì)應(yīng)著不同的作用。
數(shù)據(jù)采集是將學(xué)生一卡通內(nèi)學(xué)生的個(gè)人信息(如學(xué)生的年級(jí)、性別、專業(yè)等)、學(xué)生借閱書籍的信息、圖書的信息、學(xué)生進(jìn)出圖書館時(shí)間等這些數(shù)據(jù)進(jìn)行采集并保存到數(shù)據(jù)庫(kù)。
數(shù)據(jù)處理即對(duì)采集的原始數(shù)據(jù)進(jìn)行增、刪、改、查。原始數(shù)據(jù)中會(huì)有過(guò)于偏差沒有參考性的數(shù)據(jù),研究人員需要?jiǎng)h除這些冗余的數(shù)據(jù)。同時(shí)因?yàn)榉治龅哪康牟煌?,需要的?shù)據(jù)也不同,對(duì)數(shù)據(jù)的提取也不相同。例如,分析不同專業(yè)學(xué)生之間借閱書籍類別的差別,則提取學(xué)生專業(yè)信息、學(xué)生借閱書籍類別的信息進(jìn)行分析即可。數(shù)據(jù)處理通過(guò)對(duì)數(shù)據(jù)的轉(zhuǎn)換、整合、提取,為下一步的數(shù)據(jù)分析提供更有效、可靠的數(shù)據(jù)。
數(shù)據(jù)分析是利用大數(shù)據(jù)技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行存儲(chǔ)和分析[4]。根據(jù)分析的要求,提取與之相關(guān)的數(shù)據(jù),采用不同的分析算法對(duì)數(shù)據(jù)進(jìn)行分析,通過(guò)對(duì)數(shù)據(jù)之間潛在關(guān)聯(lián)的挖掘,充分體現(xiàn)數(shù)據(jù)的價(jià)值。例如,分析學(xué)生借閱書籍類別之間存在的關(guān)聯(lián),可采用Apriori 算法計(jì)算書籍之間存在的聯(lián)系。
數(shù)據(jù)展示與應(yīng)用即根據(jù)數(shù)據(jù)分析結(jié)果對(duì)數(shù)據(jù)進(jìn)行不同的展示,通過(guò)圖表或文字等能充分展現(xiàn)數(shù)據(jù)的方式將數(shù)據(jù)分析結(jié)果、研究主題展現(xiàn)出來(lái)。例如,分析圖書館中每年學(xué)生借閱在各書籍類別中占有的比例,可以采用餅狀圖充分展現(xiàn)出各個(gè)類別書籍借閱量的不同,分析結(jié)果也可作為下次采購(gòu)書籍的參考依據(jù)。
2.實(shí)際應(yīng)用。高校圖書館每日會(huì)有大量的學(xué)生借閱書籍,這些數(shù)據(jù)是重要的信息資源,學(xué)??梢越柚冗M(jìn)的技術(shù)手段從這些數(shù)據(jù)中分析出有用的信息。例如,分析每年哪類課外書籍被借閱次數(shù)最多,可以看出該校的學(xué)生閱讀傾向,為下次采購(gòu)書籍提供有力的依據(jù);分析不同學(xué)科學(xué)生借閱圖書之間存在的差異,根據(jù)不同學(xué)科之間的差異確定下次購(gòu)買書籍的種類,推動(dòng)學(xué)生全面發(fā)展,主動(dòng)完善知識(shí)結(jié)構(gòu);分析不同種類之間會(huì)同時(shí)被借閱的概率,從中發(fā)現(xiàn)不同種類書籍之間存在的關(guān)聯(lián),合理規(guī)劃書籍的擺放等。
對(duì)借閱書籍的統(tǒng)計(jì)分析是了解書籍流通與學(xué)生需求變化的重要方法,根據(jù)學(xué)生的不同借閱情況來(lái)決定下次購(gòu)買書籍時(shí)不同種類的書籍占有的比重,借閱量大的書籍便是學(xué)生需求多的書籍。文獻(xiàn)[5][6]中,在該校圖書館中學(xué)生借閱最多的書籍是文科類,文科類書籍在該校學(xué)生閱讀中最受歡迎,需求最多,因此學(xué)校采購(gòu)書籍時(shí)可以加大文科類書籍占比,為學(xué)生提供更多的課外書籍。
在文獻(xiàn)[6]中,理科學(xué)生對(duì)文科知識(shí)的涉及遠(yuǎn)遠(yuǎn)大于文科學(xué)生對(duì)理科知識(shí)的涉及程度,文理科學(xué)生在學(xué)習(xí)上的互逆性存在著差異。從理科生借閱文科書籍可以發(fā)現(xiàn),學(xué)生的借閱行為更多源于閱讀興趣,同時(shí)也兼顧學(xué)業(yè)的需要。無(wú)論是理工科還是文科類的學(xué)生,都會(huì)借閱文科類書籍,管理人員可以將文科類書籍放置在方便學(xué)生查找的地方,方便館員管理的同時(shí),也節(jié)省了學(xué)生查找書籍的時(shí)間。
不同科類書籍之間也存在一定潛在借閱的關(guān)聯(lián),文獻(xiàn)[7]中發(fā)現(xiàn),學(xué)生借閱馬克思主義與語(yǔ)言類書籍的同時(shí)還借閱文化類圖書,表明這三類學(xué)科存在很強(qiáng)關(guān)聯(lián)關(guān)系。圖書館管理人員在擺放書籍時(shí)可以考慮將這三類圖書放在同一區(qū)域,方便圖書館工作人員對(duì)圖書進(jìn)行管理,也便于學(xué)生借閱。
月份不同借閱書籍的數(shù)量也存在著差距,從文獻(xiàn)[8]中可以看出,學(xué)生在開學(xué)季和考試周借閱書籍?dāng)?shù)目比平時(shí)要大,以專業(yè)課為主,此時(shí)可以考慮適時(shí)向?qū)W生推薦與專業(yè)相關(guān)的圖書資料。文獻(xiàn)[8]中還分析出,各學(xué)院每個(gè)年級(jí)所借書籍的種類大致相同,不同年級(jí)的借閱量不同,高年級(jí)借閱專業(yè)課的書籍要大于低年級(jí)的借閱數(shù)量。可見,隨著專業(yè)課增多學(xué)生借閱的書籍也越來(lái)越專業(yè)化。學(xué)校在采購(gòu)書籍時(shí)應(yīng)該以本校所開設(shè)的專業(yè)為基礎(chǔ),所購(gòu)買專業(yè)課的書籍以本校教授的專業(yè)為主,本校學(xué)生多的專業(yè)書籍應(yīng)占有較大的比重。
學(xué)生進(jìn)出圖書館時(shí)間也存在一定規(guī)律,考試周時(shí)學(xué)生會(huì)比平時(shí)去得更早,離開圖書館的時(shí)間更晚,因?yàn)閷W(xué)生需要復(fù)習(xí),準(zhǔn)備期末考試,所以在圖書館學(xué)習(xí)的時(shí)間會(huì)比平時(shí)長(zhǎng)。
圖書館對(duì)于高校教育和學(xué)生學(xué)習(xí)都十分重要,一個(gè)好的圖書館可以成為高校的 “ 知識(shí)門面 ” ,強(qiáng)化高校的文化知識(shí)建設(shè)效率,為學(xué)校的科學(xué)研究做好鋪墊;引導(dǎo)學(xué)生在校期間的閱讀方向,提升學(xué)生閱讀質(zhì)量,提高學(xué)校的人才培養(yǎng)水平;給學(xué)生的閱讀提供一種文明熱情、和諧融洽以及催人奮進(jìn)的環(huán)境,幫助學(xué)校的文化傳承不斷創(chuàng)新。因此,圖書館的整體質(zhì)量十分重要。
提高圖書館的整體質(zhì)量,不僅僅是擁有豐富的館藏資源,更需要學(xué)校根據(jù)學(xué)生的需求科學(xué)采購(gòu)并且合理地?cái)[放書籍,根據(jù)時(shí)間段的不同調(diào)整開館時(shí)間等各個(gè)環(huán)節(jié)都不容忽視。對(duì)圖書館記錄的數(shù)據(jù)進(jìn)行分析,從分析結(jié)果中得出學(xué)生閱讀書籍的傾向、借閱規(guī)律等,能更科學(xué)、深層次地采購(gòu)和管理書籍,掌握館內(nèi)現(xiàn)有藏書的配置比例,更好地優(yōu)化藏書結(jié)構(gòu),為下次館內(nèi)購(gòu)買書籍提供堅(jiān)實(shí)的理論依據(jù),使得館內(nèi)的整體管理與服務(wù)更加完善。
定期對(duì)圖書館的記錄書籍流通、學(xué)生行為信息的數(shù)據(jù)進(jìn)行分析,能夠及時(shí)掌握館藏書籍的實(shí)際使用情況和學(xué)生的需求情況,采取有力措施,使得圖書館整體管理不斷完善,館內(nèi)書籍得到更好的使用,藏書的質(zhì)量不斷提高。