孟志強(qiáng) 李慧
摘 要:高校各學(xué)部的讀者借閱特征不同,文章基于對(duì)應(yīng)分析方法,選取吉林某高校2012—2014級(jí)本科生大學(xué)期間借閱數(shù)據(jù)進(jìn)行多維度分析,揭示了不同專業(yè)不同年級(jí)本科生的借閱行為特征。研究結(jié)果有助于高校圖書(shū)館合理建設(shè)館藏體系,適時(shí)正向引導(dǎo)同方向讀者的閱讀行為,解決現(xiàn)有高校圖書(shū)館的館藏文獻(xiàn)與高校讀者需求不匹配的問(wèn)題。
關(guān)鍵詞:圖書(shū)館數(shù)據(jù);對(duì)應(yīng)分析;借閱行為
項(xiàng)目基金:吉林省社科基金項(xiàng)目《基于語(yǔ)義的高校圖書(shū)館數(shù)字資源聚合研究》(項(xiàng)目編號(hào):2019wt39)研究成果;吉林大學(xué)基本科研業(yè)務(wù)費(fèi)哲學(xué)社會(huì)科學(xué)研究種子基金項(xiàng)目《廣度關(guān)聯(lián)與深度語(yǔ)義融合的數(shù)字圖書(shū)館資源聚合服務(wù)質(zhì)量評(píng)價(jià)與提升策略研究》(項(xiàng)目編號(hào):2017ZZ026)研究成果
引言
隨著目前的技術(shù)手段的完善,大數(shù)據(jù)分析已經(jīng)不再構(gòu)成技術(shù)瓶頸[1]。挖掘各院系(專業(yè))讀者的需求,并對(duì)各院系(專業(yè))讀者在不同年級(jí)的閱讀需求變化進(jìn)行精細(xì)分析,已經(jīng)提上日程。通過(guò)對(duì)讀者借閱行為特征進(jìn)行分析研究,為圖書(shū)館文獻(xiàn)采購(gòu)提供科學(xué)的依據(jù),為相關(guān)讀者提供精準(zhǔn)服務(wù)推送并對(duì)圖書(shū)分布進(jìn)行合理規(guī)劃安排。這個(gè)問(wèn)題是一種典型的屬性數(shù)據(jù)處理的問(wèn)題[2]。所以本文采用屬性數(shù)據(jù)的處理方法——對(duì)應(yīng)分析來(lái)進(jìn)行分析研究。
本文研究了2012—2014級(jí)本科生的借閱行為特征,這些學(xué)生來(lái)源于8個(gè)不同學(xué)部(白求恩學(xué)部,地球科學(xué)學(xué)部,工學(xué)部,農(nóng)學(xué)部,人文學(xué)部,社會(huì)科學(xué)學(xué)部,信息科學(xué)學(xué)部,理學(xué)部),涵蓋了該高校的主要學(xué)科類別,能夠確保研究數(shù)據(jù)具有較高的覆蓋面。所選學(xué)部學(xué)生的在校時(shí)間均為5年,相比4年的本學(xué)學(xué)部,可以提供更加穩(wěn)定豐富的數(shù)據(jù)支持。
1.1 對(duì)應(yīng)分析
對(duì)應(yīng)分析方法是在r型和q型因子分析的基礎(chǔ)上發(fā)展出來(lái)的一種多元統(tǒng)計(jì)分析方法,又稱r-q型因子分析[3]。它比因子分析更適合樣本量大的數(shù)據(jù)。對(duì)應(yīng)分析主要用于分析二維列表或可以表示為二維表的數(shù)據(jù)。它依賴于主成分分析中的降維方法,可以在低維空間中更直觀地觀察和分析行變量與列變量之間的關(guān)系[4]。通過(guò)對(duì)應(yīng)分析,可以在二維分布圖上反映行變量和列變量的分布特征以及行變量和列變量的各類之間的關(guān)系[5]。如果不同類別的行變量有相同的特性,它們?cè)趯?duì)應(yīng)圖上的分布會(huì)彼此接近,相似度越高。這同樣適用于不同類別的列變量的分布[6]。不僅如此,如果某些類別的行變量和列變量之間有密切的關(guān)系,它們?cè)趯?duì)應(yīng)圖上也會(huì)彼此接近。
1.2 常規(guī)簡(jiǎn)單統(tǒng)計(jì)方法及結(jié)果
為了分析不同學(xué)年學(xué)生的借閱行為特征,我們首先繪制了學(xué)年-圖書(shū)借閱量的折線圖。在考慮學(xué)年借閱行為特征的時(shí)候,為了消除學(xué)部屬性對(duì)圖書(shū)借閱量的影響,我們分別根據(jù)8個(gè)學(xué)部的數(shù)據(jù)獨(dú)立地做了不同折線圖。
折線圖表現(xiàn)如下:
第一,對(duì)于同一種書(shū)目,在不同學(xué)年它的借閱量是不同的。
第二,在相同學(xué)年不同書(shū)目的借閱量不同。
第三,對(duì)于同種書(shū)目,在相同學(xué)年里每個(gè)學(xué)部的借閱量也是有差異的。
第四,對(duì)于3個(gè)年級(jí)他們的折線的趨勢(shì)幾乎相同,這表明我們所發(fā)現(xiàn)的規(guī)律是具有穩(wěn)定性的。
此外,我們可以看到每個(gè)書(shū)目的借閱量并得到其隨學(xué)年的變化趨勢(shì)。然而,正是這些書(shū)目使得其他書(shū)目的發(fā)展趨勢(shì)難以識(shí)別,所以我們刪除了這些比其他書(shū)目借閱量大得多的書(shū)目,重新做了折線圖,如圖1所示。
通過(guò)圖1我們可以看到每個(gè)書(shū)目的借閱數(shù)量并得到每個(gè)書(shū)目隨學(xué)年的變化趨勢(shì)。例如,對(duì)于地球科學(xué)學(xué)部,我們可以看到在移除書(shū)目‘i‘t‘o‘h后,書(shū)目“k”“p”“b”“f”“x”被學(xué)生借得較多,且呈現(xiàn)出不同的變化情況??梢?jiàn):學(xué)生在不同學(xué)部和學(xué)年需要借用不同的書(shū)目。為了更好地發(fā)現(xiàn)潛在規(guī)律,對(duì)比內(nèi)容整理成表格1。
1.3 對(duì)應(yīng)分析在讀者借閱數(shù)據(jù)上的應(yīng)用及結(jié)果
不同學(xué)年和不同學(xué)部的學(xué)生通常借用不同的書(shū)目,我們也在第1.2小節(jié)中做了一些簡(jiǎn)單的分析。在這一部分,我們將通過(guò)對(duì)應(yīng)分析進(jìn)一步分析學(xué)生的借閱行為特征。首先,對(duì)各學(xué)部單獨(dú)進(jìn)行了對(duì)應(yīng)分析以反映各學(xué)部的借閱行為特征。數(shù)據(jù)組織結(jié)構(gòu)如下:行變量為學(xué)年,列變量為22個(gè)書(shū)目。我們選擇所有書(shū)目和2012級(jí)、2013級(jí)、2014級(jí)學(xué)生的在校學(xué)年作為對(duì)應(yīng)分析的屬性,發(fā)現(xiàn)不同學(xué)部的借閱行為特征是不同的,如:地球科學(xué)學(xué)部的學(xué)生在第一學(xué)年、第二學(xué)年和第三學(xué)年借書(shū)傾向是不同的,而在第四學(xué)年和第五學(xué)年借用同樣的書(shū)目。在第二學(xué)年更偏向借閱書(shū)目“s”“i”“d”“h”“j”“k”,在第三學(xué)年更偏向借閱書(shū)目“t”“f”“q”“d”“h”,在第四學(xué)年和第五學(xué)年則更偏向借閱書(shū)目“x”“t”“f”“n”“p”。
選擇2014年的圖書(shū)借閱情況進(jìn)行進(jìn)一步分析,分析結(jié)果如圖2和圖3所示。
在圖2中,我們找不到更多的東西,因?yàn)閿?shù)據(jù)點(diǎn)太近,很難區(qū)分。因此,我們?cè)谝瞥浊蠖麽t(yī)學(xué)部后重新做了對(duì)應(yīng)分析,得出了圖3。分析可知:首先,我們分析各學(xué)部之間以及各學(xué)年之間的關(guān)系。人文學(xué)部和社會(huì)科學(xué)學(xué)部是兩個(gè)獨(dú)立學(xué)部,不與其他學(xué)部產(chǎn)生交叉。工學(xué)部和信息科學(xué)學(xué)部有很強(qiáng)的相似性。這主要反映在他們的學(xué)生在第四、五學(xué)年借的書(shū)目非常相似。工學(xué)部、農(nóng)學(xué)部和地球科學(xué)學(xué)部在第一學(xué)年和第二學(xué)年相互交叉。各學(xué)部間的具體聯(lián)系我們用圖4表示。單從書(shū)目的角度來(lái)看,我們發(fā)現(xiàn)22種書(shū)目聚集成了5個(gè)類別,第1類包含書(shū)目“f”“d”,第2類包含書(shū)目“a”“b”“c”“g”“i”“j”“k”“h”“z”,第3類包含書(shū)目“e”“n”“q”“o”,第4類包含書(shū)目“s”“x”“p”“r”,第5類包含書(shū)目“t”“u”“v”。
2 結(jié)論與討論
首先,通過(guò)對(duì)吉林某高校的圖書(shū)館的數(shù)據(jù)的分析,我們得出了一些結(jié)論。一是對(duì)于同一種書(shū)目不同學(xué)年的借閱量是有差異的;二是在相同學(xué)年不同書(shū)目的借閱情況也是有差異的;三是對(duì)于同種書(shū)目,在同一學(xué)年中每個(gè)學(xué)部的借閱情況是有差異的;四是在不同學(xué)部和學(xué)年里學(xué)生的借閱偏好不同;五是一些學(xué)部之間有關(guān)聯(lián);六是根據(jù)某種規(guī)則書(shū)目可以被分成幾個(gè)類別。
然后,這些結(jié)論對(duì)圖書(shū)館的服務(wù)與管理產(chǎn)生一些幫助。一是我們建議圖書(shū)館在不同學(xué)年向?qū)W生推薦最合適的書(shū),例如,對(duì)于工學(xué)部的學(xué)生,在第二學(xué)年向其推薦書(shū)目“i”“o”,在第三學(xué)年向其推薦“h”,在第五學(xué)年向其推薦“t”“u”。這種推薦體系將激發(fā)學(xué)生的閱讀興趣,提高圖書(shū)利用率。二是我們發(fā)現(xiàn)不同學(xué)部的學(xué)生借閱不同的書(shū)目,有些書(shū)目只被一個(gè)學(xué)部大量借閱,而有些書(shū)目則被許多學(xué)部大量借閱,還有一些書(shū)目幾乎不被任何學(xué)部大量借閱。三是從對(duì)應(yīng)分析中我們知道一些書(shū)目聚集在一起,這表明聚集在一起的圖書(shū)有很強(qiáng)的聯(lián)系。因此,就圖書(shū)分布而言,我們建議將書(shū)目“f”“d”放在一起,書(shū)目“a”“b”“c”“g”“i”“j”“k”“h”“z”放在一起,書(shū)目“e”“n”“q”“o”放在一起,書(shū)目“s”“x”“p”“r”放在一起,書(shū)目“t”“u”“v”放在一起,使讀者更容易找到他們需要的書(shū)。
最后,高校圖書(shū)館可以根據(jù)相近閱讀特征的讀者需求將資源進(jìn)行歸納整合,形成多個(gè)同類型資源子庫(kù),進(jìn)而合并成大學(xué)生就業(yè)指導(dǎo)數(shù)據(jù)總庫(kù),并在圖書(shū)館服務(wù)網(wǎng)站掛出就業(yè)指導(dǎo)資源總庫(kù)鏈接,這樣相關(guān)專業(yè)的畢業(yè)生就可以根據(jù)需求,在高校圖書(shū)館獲得相應(yīng)的資源支撐,進(jìn)而幫助學(xué)生獲得提升。
參考文獻(xiàn)
[1]陳列柱.高校學(xué)生利用圖書(shū)館紙本資源現(xiàn)狀調(diào)查[J].中國(guó)報(bào)業(yè),2019(12):46-47.
[2]ShiozakiR,Eisenschitz T.Role and Justification of Web Archiving by National Libraries:A Questionnaire Survey[J].Journal of Librarianship&Information Science,2009,41(2):90-107.
[3]Greenacre,Michael J.Multiple correspondence analysis and related methods[M].Chapman&Hall/CRC,2006:148-156.
[4]黃維玲,成全.基于Logistic模型的高校學(xué)生借閱行為影響因素分析[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2021,43(3):268-274.
[5]施國(guó)良,張瀟瀟,楊小莉.高校讀者群體差異對(duì)其借閱行為和閱讀偏好的影響研究[J].圖書(shū)館,2020(4):59-64,78.
[6]艾金勇.基于關(guān)聯(lián)規(guī)則的高校圖書(shū)館讀者借閱行為研究——以西藏民族大學(xué)圖書(shū)館為例[J].西藏民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2017,38(4):142-146.
作者簡(jiǎn)介:孟志強(qiáng)(1976— ),吉林大學(xué)圖書(shū)館館員,研究方向:數(shù)據(jù)挖掘;李慧(1983— ),吉林大學(xué)圖書(shū)館副研究館員,研究方向:信息分析。