饒麗瓊
摘要:在大數(shù)據(jù)時(shí)代,圖書(shū)館服務(wù)創(chuàng)新是新技術(shù)環(huán)境中從傳統(tǒng)知識(shí)服務(wù)向大數(shù)據(jù)知識(shí)過(guò)渡的一部分。本文論述了“大數(shù)據(jù)”技術(shù)在圖書(shū)館的應(yīng)用,以及如何深化圖書(shū)館信息服務(wù)的思路和建議。
關(guān)鍵詞:新技術(shù)環(huán)境 大數(shù)據(jù) 知識(shí)服務(wù) 圖書(shū)館服務(wù)
隨著網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,大型數(shù)據(jù)存儲(chǔ)庫(kù)中數(shù)據(jù)收集和存儲(chǔ)量的迅速增加需要理解和處理。目前,這些數(shù)據(jù)是依據(jù)常規(guī)數(shù)據(jù)分析技術(shù)分析的,但目前PB層面大量數(shù)據(jù)積累、信息稀缺的局面顯然不能滿足日益增長(zhǎng)的社會(huì)需求。為了更好地了解和處理這些豐富的數(shù)據(jù),并確定指導(dǎo)決策的潛在規(guī)則和鏈接,成為讀者改進(jìn)學(xué)校發(fā)展的知識(shí)庫(kù),除了傳統(tǒng)的讀者服務(wù),只要是方便借閱者的都是研究的方向。
一、高校圖書(shū)館服務(wù)對(duì)數(shù)據(jù)挖掘的需求
目前,高校圖書(shū)館注重借閱者的需求,實(shí)施圖書(shū)館服務(wù),滿足讀者的真實(shí)需求,實(shí)現(xiàn)盡可能低的教學(xué)、科研和扎實(shí)的支持。高校圖書(shū)館根據(jù)讀者對(duì)圖書(shū)館服務(wù)過(guò)程的需要,首先通過(guò)多種方式收集讀者信息數(shù)據(jù),實(shí)現(xiàn)讀者的有效識(shí)別。其次大學(xué)圖書(shū)館根據(jù)信息數(shù)據(jù)對(duì)讀者進(jìn)行排名,以確保完全反映不同用戶組之間的差異。第三,大學(xué)圖書(shū)館分析每個(gè)用戶組,并揭示每個(gè)用戶組的特點(diǎn)和需求。最后,高校圖書(shū)館結(jié)合讀者需求,合理利用大數(shù)據(jù)資源,針對(duì)讀者提供電子信息供給和目標(biāo)服務(wù)的特點(diǎn)。作為圖書(shū)館書(shū)籍采購(gòu)的一部分,用于形成記錄業(yè)績(jī)信息和最終數(shù)據(jù)的服務(wù)流程,以及上述用戶標(biāo)識(shí)、用戶分類和其他鏈接。[ 1 ]
與流程整理結(jié)合使用時(shí),每個(gè)流程都需要大量數(shù)據(jù)需求分析才能開(kāi)始,許多有價(jià)值的分析結(jié)果都隱藏在需要專家和相關(guān)技術(shù)才能實(shí)現(xiàn)此流程的數(shù)據(jù)中。然而,結(jié)合高校圖書(shū)館目前的人員配置結(jié)構(gòu),很難有條不紊地完成大部分信息數(shù)據(jù)分析任務(wù)。因此,您需要找到一種有效的方法,以便對(duì)這些信息數(shù)據(jù)進(jìn)行有效的分析。
二、數(shù)據(jù)挖掘技術(shù)的背景與定義
1.數(shù)據(jù)挖掘的背景
(1)數(shù)據(jù)挖掘的商業(yè)背景。數(shù)據(jù)挖掘主要是在業(yè)務(wù)環(huán)境中收集大量數(shù)據(jù),并且需要知識(shí)挖掘。在業(yè)務(wù)中,數(shù)據(jù)挖掘用作四種工具:數(shù)據(jù)挖掘作為搜索工具,數(shù)據(jù)挖掘作為過(guò)程控制,數(shù)據(jù)挖掘作為營(yíng)銷工具,數(shù)據(jù)挖掘作為獲取知識(shí)的渠道。
(2)數(shù)據(jù)挖掘的社會(huì)背景。如果沒(méi)有數(shù)據(jù)挖掘的結(jié)果,一個(gè)人的想象力可能并不完全正確。由于客戶的行為與社會(huì)環(huán)境有關(guān),因此數(shù)據(jù)挖掘本身受社會(huì)環(huán)境的影響。
2.數(shù)據(jù)挖掘的定義
根據(jù)相關(guān)研究表明:數(shù)據(jù)挖掘是一個(gè)新興、交叉學(xué)科領(lǐng)域,數(shù)據(jù)挖掘即為從大量的、不完全的,有噪聲的、隨機(jī)的數(shù)據(jù)中提取含在其中的、人們事先不知道的、有用的信息和知識(shí)的過(guò)程。
三、大數(shù)據(jù)時(shí)代圖書(shū)館面臨的機(jī)遇和挑戰(zhàn)
1.擴(kuò)大圖書(shū)館的服務(wù)內(nèi)容和提高服務(wù)質(zhì)量需要大數(shù)據(jù)提供支持
目前圖書(shū)館行業(yè)競(jìng)爭(zhēng)的關(guān)鍵:圖書(shū)館資源、使用空間、大數(shù)據(jù)所有權(quán)、分析各種重要復(fù)雜數(shù)據(jù)的能力、預(yù)測(cè)和價(jià)值發(fā)展,圖書(shū)館未來(lái)的發(fā)展戰(zhàn)略也基于大數(shù)據(jù)分析和預(yù)測(cè)。
2.大數(shù)據(jù)將是圖書(shū)館的主要資源與核心資產(chǎn)
隨著人們對(duì)大數(shù)據(jù)技術(shù)的理解不斷提高,大數(shù)據(jù)分析技術(shù)變得更加成熟,使大家對(duì)大數(shù)據(jù)的價(jià)值進(jìn)行了更深入地探索。
3.大數(shù)據(jù)時(shí)代為圖書(shū)館帶來(lái)了發(fā)展機(jī)遇和挑戰(zhàn)
就目前情況來(lái)看,圖書(shū)館不僅可以使用結(jié)構(gòu)化數(shù)據(jù)來(lái)理解和控制現(xiàn)有讀者接受的服務(wù)類型,還可以通過(guò)巨大的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)找到更好的服務(wù)模型,以應(yīng)對(duì)未來(lái)的競(jìng)爭(zhēng)挑戰(zhàn),并且你必須預(yù)測(cè)和分析未來(lái)。
四、大數(shù)據(jù)時(shí)代圖書(shū)館服務(wù)創(chuàng)新和發(fā)展方向
1.關(guān)注和重視大量的圖書(shū)館用戶的數(shù)據(jù)和信息
在大數(shù)據(jù)時(shí)代,除了文獻(xiàn)數(shù)據(jù)信息外,其他數(shù)據(jù)挖掘和利用也是圖書(shū)館產(chǎn)業(yè)競(jìng)爭(zhēng)力的重要因素,增加信息資源的收集是大數(shù)據(jù)時(shí)代圖書(shū)館資源建設(shè)的內(nèi)容之一。大數(shù)據(jù)庫(kù)時(shí)代需要大量數(shù)據(jù),包括當(dāng)前正在構(gòu)建的文獻(xiàn)和網(wǎng)絡(luò)資源,以及無(wú)法運(yùn)行或當(dāng)前無(wú)法運(yùn)行的非結(jié)構(gòu)數(shù)據(jù)。
2.著力提升圖書(shū)館服務(wù)的智能化程度
現(xiàn)代圖書(shū)館服務(wù)需要高技術(shù)要求和先進(jìn)的智能服務(wù)。首先,圖書(shū)館需要使用一定程度的智能技術(shù)來(lái)自動(dòng)執(zhí)行復(fù)雜的高級(jí)數(shù)據(jù)收集和處理任務(wù),以節(jié)省人力和物力資源來(lái)解決手動(dòng)任務(wù)。第二個(gè)是查看讀者的服務(wù)內(nèi)容。智能化手段水平也為圖書(shū)館智能決策、改進(jìn)、社會(huì)信息、生活數(shù)據(jù)等服務(wù)工作提供了必要資料的上下文和信息。[ 2 ]第三,智能圖書(shū)館服務(wù)水平不僅影響知識(shí)從單一學(xué)科向多學(xué)科的傳播,而且影響知識(shí)的變革,成為知識(shí)發(fā)現(xiàn)、挖掘和知識(shí)組織的基礎(chǔ)。
3.深度的參考咨詢服務(wù)
傳統(tǒng)的參考咨詢服務(wù)主要是利用現(xiàn)有的圖書(shū)館參考圖書(shū)和研究工具書(shū)。室外和自建數(shù)據(jù)庫(kù)由具有一定專業(yè)知識(shí)和對(duì)大數(shù)據(jù)時(shí)代研究工具熟悉的專業(yè)知識(shí)的專用參考圖書(shū)館員組織,這可以減少咨詢圖書(shū)館員資源的時(shí)間,擴(kuò)大咨詢館員對(duì)資源的獲取,大幅度地提高讀者滿意度,提高閱讀者咨詢的效率。[ 3 ]
4.充分利用大量的復(fù)雜的數(shù)據(jù)分析技術(shù)與工具
圖書(shū)館將來(lái)對(duì)工具應(yīng)用的需求將更為迫切,這也突出了對(duì)提高圖書(shū)館技術(shù)應(yīng)用水平的更高要求。
5.數(shù)據(jù)挖掘相關(guān)技術(shù)
(1)頻繁模式挖掘。頻繁模式提取是事務(wù)數(shù)據(jù)庫(kù)中不同貨物之間的連接規(guī)則,即數(shù)據(jù)中頻繁發(fā)生的模式,包括項(xiàng)目子集、設(shè)備和技巧。
(2)聚類。聚類使用多種特征組合將樣本分類為組,將個(gè)人組分類為組或聚類,特別是基于相似性。因?yàn)橥蝗杭械膶?duì)象之間的高度相似性以及不同群集中的對(duì)象之間具有較大差異。
(3)時(shí)間序列分析。時(shí)間序列分析是時(shí)間序列中發(fā)生的一系列事件,研究人員按每個(gè)固定間隔的順序記錄事件結(jié)果。時(shí)間序列數(shù)據(jù)的最大特征是,每個(gè)事件在數(shù)據(jù)后立即以相同的間隔記錄。按時(shí)間順序排列的數(shù)據(jù),如圖書(shū)館讀者的年齡分布、自由閱讀時(shí)間的波動(dòng)、每月進(jìn)出圖書(shū)館的人流量和借閱圖書(shū)的人流量在每個(gè)時(shí)間段的分布情況。[4]
五、數(shù)據(jù)挖掘技術(shù)在圖書(shū)館中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在大學(xué)圖書(shū)館中的應(yīng)用包括個(gè)性服務(wù)的優(yōu)化、內(nèi)容評(píng)估、閱讀區(qū)的建設(shè)、每月借閱量的評(píng)估、采購(gòu)書(shū)籍?dāng)?shù)目的優(yōu)化(書(shū)籍名文檔資源構(gòu)建)、圖書(shū)館管理人員工作流程優(yōu)化、借閱者愛(ài)好分析、借閱者對(duì)于閱讀體驗(yàn)的評(píng)價(jià)、數(shù)據(jù)挖掘技術(shù)的發(fā)現(xiàn)和使用。
1.個(gè)性化服務(wù)
首先,分析相關(guān)規(guī)律,找出讀者從借閱記錄庫(kù)借閱的圖書(shū)的相同點(diǎn),向讀者推薦相關(guān)圖書(shū)。其次,當(dāng)我們做時(shí)間序列分析,讀者借還一本書(shū)籍所需要的時(shí)間,我們可以先借一本書(shū)給讀者,然后深入調(diào)查,當(dāng)我們找出這些借出,還入順序的特點(diǎn),我們積極推薦給讀者,他們下次借閱方便。
長(zhǎng)期以來(lái),圖書(shū)館提供的服務(wù)主要由圖書(shū)館工作人員滿足用戶需求,在服務(wù)期間,服務(wù)始終以用戶為中心,圖書(shū)館不能被動(dòng)地提供服務(wù)。大學(xué)圖書(shū)館利用數(shù)據(jù)挖掘技術(shù)改進(jìn)日常管理任務(wù)的用戶借閱文件的收集和分析,使圖書(shū)館管理員能夠結(jié)合互聯(lián)網(wǎng)上不同用戶的實(shí)際特征,將及時(shí)有效的信息資源與個(gè)性化建議相結(jié)合,結(jié)合用戶的興趣偏好。它為用戶提供有關(guān)他們免費(fèi)需求的信息,并逐漸將其轉(zhuǎn)換為穩(wěn)定的用戶。[5]
2.館藏維護(hù)與采訪
您可以使用分組分析來(lái)發(fā)現(xiàn)不同組之間的不同借閱行為,深入了解每個(gè)組之間的常見(jiàn)圖書(shū)類型,以此作為采購(gòu)圖書(shū)的參考。根據(jù)當(dāng)下時(shí)間,溫度等不同,有不同的借還習(xí)慣,取決于一些書(shū)籍在領(lǐng)先位置的期限,取決于閱讀者的行為習(xí)慣,例如到期末考試,你會(huì)明顯發(fā)現(xiàn)這樣的規(guī)則。
3.離線數(shù)據(jù)分析中心
進(jìn)行數(shù)據(jù)趨勢(shì)分析:期刊數(shù)據(jù),包括在線情況、持續(xù)時(shí)間分析、關(guān)鍵詞分析、在線分析。各種服務(wù)系統(tǒng),定量統(tǒng)計(jì)、時(shí)間序列分析、系統(tǒng)特征、用戶用法、數(shù)據(jù)對(duì)象探索、事實(shí)數(shù)據(jù)、收集分布、人員、資金使用、設(shè)備配置等趨勢(shì)分析。
4.讀者數(shù)據(jù)信息的質(zhì)量問(wèn)題
準(zhǔn)確收集相關(guān)讀者數(shù)據(jù)也是收集讀者信息數(shù)量時(shí)的一個(gè)重要問(wèn)題,例如如何用圖片庫(kù)全臉進(jìn)行搜索。如果結(jié)果不是一個(gè)很好的收集對(duì)讀者的相關(guān)數(shù)據(jù),那么對(duì)讀者的需要性服務(wù)就不能更好的開(kāi)展,這項(xiàng)工作是要求圖書(shū)館收集讀者的信息準(zhǔn)確,做各方面的收集準(zhǔn)備。我們盡最大努力減少相關(guān)數(shù)據(jù)庫(kù)設(shè)置中的缺陷數(shù)量。
六、結(jié)語(yǔ)
總體上看,數(shù)據(jù)挖掘技術(shù)作為一種新技術(shù),近年來(lái)在許多行業(yè)得到了廣泛的推廣,高校圖書(shū)館目前正加快改革步伐,可以大大支持高校圖書(shū)館的改革和發(fā)展。因此,高校圖書(shū)館管理者應(yīng)創(chuàng)新思路,有效了解高校圖書(shū)館部門(mén)對(duì)數(shù)據(jù)挖掘的需求,收集資源,建設(shè)數(shù)據(jù)挖掘技術(shù),改進(jìn)信息資源利用,提高數(shù)據(jù)挖掘技術(shù)水平,提供個(gè)性化服務(wù),積極推進(jìn)高校圖書(shū)館健康穩(wěn)定發(fā)展。在研究大量數(shù)據(jù)和來(lái)源之前,很難可靠地預(yù)測(cè)將形成哪些挖掘結(jié)果。首先,根據(jù)挖掘要搜索的物理目的可以確認(rèn)數(shù)據(jù),在根據(jù)本身數(shù)據(jù)進(jìn)行挖掘的過(guò)程中,可以在適當(dāng)?shù)臅r(shí)候在檢查部分檢查已到達(dá)挖掘目標(biāo)數(shù)量作動(dòng)態(tài)狀態(tài)調(diào)整。
(本文系2013年南京鐵道職業(yè)技術(shù)學(xué)院的立項(xiàng)課題大數(shù)據(jù)理論與方法在圖書(shū)館工作中的應(yīng)用研究階段性成果,項(xiàng)目編號(hào):YQ1309。)
【參?考?文?獻(xiàn)】
[1]楊海燕.大數(shù)據(jù)時(shí)代的圖書(shū)館服務(wù)淺析0.圖書(shū)與情報(bào),2012.(4):120-122.
[2]孫琳.大數(shù)鋸時(shí)代圖書(shū)館服務(wù)體系創(chuàng)新研究0.理論觀察,2013.(4):99-100.
[3]董云鵬.數(shù)據(jù)挖掘技術(shù)在圖書(shū)館中的應(yīng)用胖現(xiàn)代情報(bào).
[4]晁陽(yáng).淺析數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館中的應(yīng)用[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2O16,(1).
[5]郝海濤,馬元元.數(shù)據(jù)挖掘技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用EJ.信息通信,2O16,(8).
(責(zé)任編輯:劉占行)