蔣鵬
摘 要
人類利用圖書館產(chǎn)生信息活動(dòng)時(shí)所表現(xiàn)出的最基礎(chǔ)、最平常、最通用的一種關(guān)系,便是用戶資源和圖書館之間的關(guān)系。從這種關(guān)系出發(fā),分析嫁接起這一簡(jiǎn)單聯(lián)系的規(guī)律,便是數(shù)據(jù)挖掘技術(shù)。本文認(rèn)為對(duì)圖書館用戶資源分析研究應(yīng)以數(shù)據(jù)挖掘技術(shù)為邏輯起點(diǎn),從云計(jì)算、信息共享、數(shù)據(jù)排查、智能搜索、大數(shù)據(jù)存儲(chǔ)等對(duì)圖書館用戶資源進(jìn)行整合和建設(shè)。面對(duì)信息資源日益豐富的今天,數(shù)據(jù)挖掘技術(shù)對(duì)管理圖書館信息資源技術(shù)提供了巨大便利。
【關(guān)鍵詞】數(shù)據(jù)挖掘 用戶資源
數(shù)據(jù)挖掘,即數(shù)據(jù)系統(tǒng)中的信息發(fā)現(xiàn)。隨著計(jì)算機(jī)技術(shù),特別是云計(jì)算、大數(shù)據(jù)記憶技術(shù)的快速發(fā)展,傳統(tǒng)的手動(dòng)查找信息模式被大數(shù)據(jù)智能檢索替代。數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于市場(chǎng)、工業(yè)、金融行業(yè)、科學(xué)界、互聯(lián)網(wǎng)行業(yè)以及醫(yī)療業(yè)。數(shù)據(jù)挖掘技術(shù)在圖書館的應(yīng)用,可以將海量的用戶資源進(jìn)行聚類、關(guān)聯(lián)、整合,可以對(duì)用戶搜索記錄、圖書流通記錄、用戶借閱信息等數(shù)據(jù)進(jìn)行精確預(yù)判,發(fā)現(xiàn)一些隱蔽的聯(lián)系,為圖書館采購圖書、淘汰文獻(xiàn)資料提供科學(xué)建議,也可以為用戶提供個(gè)性化訂閱服務(wù),創(chuàng)新用戶服務(wù)模式,為圖書館建設(shè)整個(gè)信息網(wǎng)絡(luò)提供有力支撐。
1 大數(shù)據(jù)下的圖書館用戶資源特征
圖書館用戶資源是通過數(shù)字技術(shù)進(jìn)行組織和管理的:
(1)經(jīng)過數(shù)據(jù)關(guān)聯(lián)分析,把數(shù)據(jù)庫中存在的兩個(gè)或兩個(gè)以上用戶之間的相同性提取出來,提高支持度和說服力;
(2)把用戶信息按照相似性歸納成幾個(gè)類別,建立宏觀概念,發(fā)現(xiàn)其間的相互關(guān)系;其次定義這些相互關(guān)系,概念產(chǎn)生以后,即等同于這些相互關(guān)系的整體信息,用于建構(gòu)分類規(guī)則或者數(shù)據(jù)模型;其次利用以上數(shù)據(jù)找出變化規(guī)律,對(duì)此規(guī)律進(jìn)行模型化處理,并由數(shù)據(jù)模型對(duì)未知信息進(jìn)行預(yù)判;
(3)把用戶資源進(jìn)行時(shí)序排序,檢索出高重復(fù)率的模型;
(4)進(jìn)行偏差比對(duì),檢查數(shù)據(jù)之中的異常情況。圖書館利用大量的用戶訪問信息獲取用戶興趣,發(fā)現(xiàn)用戶群體,為不同的群體定制信息,還可以建立一個(gè)共享信息平臺(tái),讓不同用戶建立網(wǎng)絡(luò)交流。
1.1 數(shù)據(jù)量大并且分布更廣
大數(shù)據(jù)形勢(shì)下,圖書館可以獲取的用戶資源不僅限于用戶個(gè)人信息和搜索記錄,也包括檔案、學(xué)術(shù)研究、教學(xué)模式、用戶評(píng)價(jià)和反饋等,數(shù)據(jù)豐富。同時(shí),數(shù)據(jù)分布廣泛,在互聯(lián)網(wǎng)時(shí)代,可從圖書館應(yīng)用系統(tǒng)、數(shù)據(jù)系統(tǒng)記錄以及各種網(wǎng)頁、移動(dòng)終端的信息獲取,顯示出用戶資源的分散性。
1.2 數(shù)據(jù)內(nèi)容多元化,形式靈活化
數(shù)據(jù)系統(tǒng)里的存儲(chǔ)方式不同,服務(wù)器不同,系統(tǒng)開發(fā)平臺(tái)不同,致使許多用戶資源無法交流互換。圖書館用戶資源有半模型化、模型化和非模型化之分。傳統(tǒng)的圖書館用戶資源中,用戶只是圖書資源的使用者,與圖書館之間只是點(diǎn)對(duì)點(diǎn)單線互動(dòng),用戶之間不存在交流,而在大數(shù)據(jù)網(wǎng)絡(luò)平臺(tái)下,用戶之間可以建立內(nèi)容共享互動(dòng)平臺(tái),使得用戶資源的內(nèi)容更加多元化。
2 圖書館用戶資源利用
2.1 有助于利用數(shù)據(jù)挖掘技術(shù)建立用戶資源圖書館
用戶資源圖書館具備信息量大的特點(diǎn),用戶可獲得各方各面的信息,且從服務(wù)的個(gè)性化和全方位化而言,圖書館可根據(jù)社會(huì)熱點(diǎn)或用戶需求定制服務(wù)。一方面,建立用戶資源圖書館,使各類用戶信息在同一界面統(tǒng)一呈現(xiàn),方便用戶的選擇和檢索。另一方面,利用數(shù)據(jù)挖掘技術(shù)建立的用戶資源圖書館,服務(wù)器眾多,具有較強(qiáng)的計(jì)算能力和存儲(chǔ)能力,擁有較高的數(shù)據(jù)處理能力,能同時(shí)容納多數(shù)用戶。因數(shù)據(jù)量大所導(dǎo)致的硬件費(fèi)用和后期運(yùn)行費(fèi)用劇增,可通過構(gòu)建用戶資源圖書館平臺(tái)以及應(yīng)用服務(wù)得到解決。為應(yīng)付不斷提高的用戶資源存儲(chǔ)方面的壓為,目前亟需的就是投入大量資金以擴(kuò)容存儲(chǔ)設(shè)備,無疑,建立用戶資源平臺(tái)可以解決此問題。
2.2 加速圖書館資源的數(shù)字化
強(qiáng)大的互聯(lián)網(wǎng)呈現(xiàn)功能和用戶信息保存的可靠性功能,用戶資源存儲(chǔ)的復(fù)雜性問題可得到很好的解決。其次,數(shù)據(jù)挖掘技術(shù)對(duì)于資源整合方面具有優(yōu)勢(shì),通過分布式的存儲(chǔ)模式整合大量信息資源提供給用戶檢索。不同的數(shù)據(jù)之間的互相操作以及全方位的互聯(lián)網(wǎng)服務(wù)得以實(shí)現(xiàn),很好的解決了資源重復(fù)建設(shè)的問題。因此,利用數(shù)據(jù)挖掘使得圖書館資源數(shù)字化具備可行性。從這個(gè)意義上來看,資源的館藏?cái)?shù)字化將會(huì)加快發(fā)展,而不只是圖書書目的劇增。
2.3 降低人力資源成本,使圖書館各類資源得以整合和優(yōu)化
隨著各類用戶資源利用步伐的加快,加之依賴因特網(wǎng)的用戶對(duì)服務(wù)的可行性和效率性要求更高,大量不同體系的服務(wù)器布置在機(jī)房,系統(tǒng)維護(hù)人員的壓力也相應(yīng)増大。通過數(shù)據(jù)挖掘技術(shù),可有效進(jìn)行資源整合和優(yōu)化,無需通過人力進(jìn)行。
2.4 有利于分析用戶心理和提升用戶體驗(yàn)
數(shù)據(jù)挖掘技術(shù)能夠利用用戶資源計(jì)算出用戶模型,這是研究用戶需求、偏好、行為的一種常規(guī)方式,一般認(rèn)為用戶模型是對(duì)用戶在某段時(shí)間內(nèi)相對(duì)穩(wěn)定的信息需求的記錄。用戶模型反過來對(duì)獲取用戶資源有十分重要的作用,建構(gòu)用戶模型,能夠使圖書館更加精深、準(zhǔn)確地掌握當(dāng)前用戶資源。通過對(duì)用戶資源的處理來預(yù)測(cè)用戶需求,進(jìn)而達(dá)到持續(xù)提高服務(wù)質(zhì)量和用戶滿意度的目的。一方面,預(yù)判用戶心理是利用圖書館用戶資源更加深入的表現(xiàn)。隨著用戶環(huán)境與圖書館環(huán)境的不斷變化,這種預(yù)判力覆蓋范圍已經(jīng)不單單是用戶信息行為的某個(gè)過程或某幾個(gè)過程,相反,用戶心理能夠?qū)τ脩粜枨蟮膹?qiáng)弱、層次、方向產(chǎn)生極為重要的影響,同時(shí)也能夠?qū)Λ@取用戶資源全部過程產(chǎn)生重要影響。另一方面,最先研究用戶體驗(yàn)研究當(dāng)屬企業(yè)營(yíng)銷活動(dòng),主要用來研究用戶與企業(yè)、產(chǎn)品或服務(wù)之間的互動(dòng)。數(shù)據(jù)挖掘技術(shù)能夠更精準(zhǔn)預(yù)測(cè)用戶的實(shí)際感受,通過研究用戶情感體驗(yàn)與用戶行為動(dòng)作,提高用戶的滿意度,滿足用戶需求。
3 結(jié)語
在數(shù)據(jù)大爆發(fā)時(shí)代,重視圖書館用戶資源,通過多渠道、多方式匯聚用戶資源,采用數(shù)據(jù)挖掘、數(shù)據(jù)歸檔分析等技術(shù),掌握用戶資源特征,有助于圖書館精準(zhǔn)定位用戶群體,對(duì)調(diào)整圖書館運(yùn)營(yíng)策略有重要前置作用,更能創(chuàng)新圖書館服務(wù)的內(nèi)容和形式,實(shí)現(xiàn)圖書館資源的有效利用。
參考文獻(xiàn)
[1]陳文偉等.數(shù)據(jù)挖掘技術(shù)[M].北京:北京工業(yè)出版社,2002.
[2]郭崇慧等.北京數(shù)據(jù)挖掘教程[M].北京:清華大學(xué)出版社,2005.
[3]徐永麗等.網(wǎng)絡(luò)環(huán)境中用戶信息需求障礙分析[J].圖書館理論與實(shí)踐,2004.
作者單位
南陽醫(yī)學(xué)高等??茖W(xué)校 河南省南陽市 473000endprint