郭艾華++劉業(yè)亮
DOI:10.16661/j.cnki.1672-3791.2017.25.007
摘 要:本文將從數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應(yīng)用的領(lǐng)域進(jìn)行研究,從數(shù)據(jù)挖掘在國內(nèi)的數(shù)字圖書館、高校圖書館以及圖書館個(gè)性化服務(wù)等方面入手分析數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應(yīng)用的現(xiàn)狀,總結(jié)其中存在的問題,并找出解決問題的方法,提高數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫的應(yīng)用效率。
關(guān)鍵詞:數(shù)據(jù)挖掘 圖書館數(shù)據(jù)庫 應(yīng)用研究
中圖分類號(hào): G25.73 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)09(a)-0007-02
隨著數(shù)據(jù)挖掘?qū)W科的不斷發(fā)展,很多領(lǐng)域都引進(jìn)了數(shù)據(jù)挖掘知識(shí),解決人們對(duì)數(shù)據(jù)分析、處理、應(yīng)用的難題。數(shù)據(jù)挖掘是一項(xiàng)綜合性很強(qiáng)的學(xué)科,不但涉及到了數(shù)據(jù)庫的技術(shù),還有統(tǒng)計(jì)學(xué)、人工智能、檢索信息等領(lǐng)域,適用范圍十分廣泛,當(dāng)今國內(nèi)的很多圖書館也關(guān)注到了數(shù)據(jù)挖掘,通過對(duì)數(shù)據(jù)挖掘在圖書館中的應(yīng)用研究,提高數(shù)據(jù)挖掘應(yīng)用效率。
1 數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應(yīng)用研究存在的問題
1.1 理論研究不夠深入
雖然從20世紀(jì)90年代至今,都有國內(nèi)外的專家學(xué)者們對(duì)于圖書館數(shù)據(jù)挖掘相關(guān)理論的研究,但是這樣的研究還不夠深入和全面,沒有建立起系統(tǒng)的理論模型,這也是導(dǎo)致我國圖書館數(shù)據(jù)庫應(yīng)用數(shù)據(jù)挖掘效率不高的原因之一。
1.2 圖書館數(shù)據(jù)庫應(yīng)用研究不夠全面
數(shù)據(jù)挖掘是一門綜合性很強(qiáng)的學(xué)科,它集計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、可視化以及人工智能等學(xué)科相關(guān)知識(shí)于一身,并且在很多領(lǐng)域包括金融、醫(yī)療、互聯(lián)網(wǎng)等都得到廣泛的應(yīng)用。但是在國內(nèi)的圖書館中,由于對(duì)數(shù)據(jù)挖掘?qū)W科認(rèn)識(shí)的不足,數(shù)據(jù)挖掘并不能充分地發(fā)揮其強(qiáng)大的作用,所以在圖書館數(shù)據(jù)庫應(yīng)用數(shù)據(jù)挖掘過程中出現(xiàn)多種問題,如對(duì)圖書館數(shù)據(jù)挖掘應(yīng)用研究不夠全面的問題。
1.3 研究項(xiàng)目和經(jīng)費(fèi)支持少
數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應(yīng)用研究存在的又一難題是對(duì)于數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應(yīng)用的研究項(xiàng)目和經(jīng)費(fèi)支持少。國家對(duì)于研究項(xiàng)目的支持很少,從現(xiàn)有數(shù)據(jù)可以發(fā)現(xiàn)國家對(duì)于863計(jì)劃資助的研究項(xiàng)目只有1篇,這樣低的支持率造成了論文基金資助率低下的情況發(fā)生,僅僅只有3.47%的論文基金資助率,遠(yuǎn)遠(yuǎn)低于其他領(lǐng)域的資助水平。和其他研究領(lǐng)域相比,數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應(yīng)用的類型研究項(xiàng)目的支持經(jīng)費(fèi)不高。但是圖書館的發(fā)展和管理的推進(jìn)都需要大量的經(jīng)費(fèi)作為后盾支持,特別是數(shù)據(jù)挖掘,此技術(shù)的研究和應(yīng)用門檻高,研究人員需要有全面的知識(shí),對(duì)計(jì)算機(jī)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫等都精通,這樣的研究自然需要大筆的經(jīng)費(fèi)支持。
1.4 研究成果與圖書館管理信息系統(tǒng)開發(fā)不緊密聯(lián)系
雖然目前我國的數(shù)字圖書館、高校圖書館以及公共圖書館個(gè)性化管理等都進(jìn)行數(shù)據(jù)挖掘的相關(guān)研究,然而對(duì)于這些研究結(jié)果卻不能結(jié)合到具體的圖書館信息系統(tǒng)建設(shè)工作當(dāng)中。世界上已經(jīng)開發(fā)出了具有數(shù)據(jù)挖掘功能的圖書館管理信息系統(tǒng),這些系統(tǒng)把數(shù)據(jù)挖掘的優(yōu)勢(shì)發(fā)揮出來,真正地應(yīng)用到實(shí)際的圖書館發(fā)展中。但是相對(duì)于外國,我國的圖書館并不能研究開發(fā)出具有操作性強(qiáng)、易于實(shí)現(xiàn)并且能夠指導(dǎo)實(shí)際業(yè)務(wù)的成熟產(chǎn)品。造成這樣的情況發(fā)生很大一部分原因是研究成果與圖書館管理信息系統(tǒng)開發(fā)不緊密聯(lián)系,并且對(duì)于圖形圖像和用戶評(píng)論等非結(jié)構(gòu)化的挖掘不夠深入。
2 加強(qiáng)圖書館數(shù)據(jù)挖掘應(yīng)用的策略
通過加強(qiáng)圖書館數(shù)據(jù)挖掘應(yīng)用,可以優(yōu)化圖書館的管理。圖書館數(shù)據(jù)挖掘的利用展現(xiàn)見圖1。
2.1 進(jìn)行資源建設(shè),館藏優(yōu)化
在圖書館信息資源的建設(shè)中,其文件的采訪是建設(shè)的關(guān)鍵,是否建設(shè)好文獻(xiàn)的采訪直接關(guān)系到文獻(xiàn)的資源共建、共享以及信息服務(wù)水準(zhǔn)的提升。圖書館經(jīng)常是通過學(xué)科的需要及專業(yè)制定購買方案,同時(shí)還需要結(jié)合圖書館藏書學(xué)科專業(yè)分布情況和發(fā)展趨勢(shì)、現(xiàn)有的藏書量來制定購買計(jì)劃,但這樣的購買計(jì)劃并不能很好地進(jìn)行優(yōu)化圖書館的藏書。所以最佳方法是通過數(shù)據(jù)挖掘的方法,客觀分析圖書館的現(xiàn)況,需求以及變化趨勢(shì),再科學(xué)合理地進(jìn)行資源建設(shè),從而優(yōu)化館藏,根據(jù)圖書館數(shù)據(jù)挖掘的應(yīng)用,有針對(duì)性地對(duì)藏書進(jìn)行補(bǔ)充,不斷豐富館藏資源,優(yōu)化館藏的結(jié)構(gòu),進(jìn)一步提高館藏的利用率。
2.2 利用數(shù)據(jù)挖掘提升服務(wù)質(zhì)量
圖書館可以利用數(shù)據(jù)挖掘來提升數(shù)據(jù)資源服務(wù)的質(zhì)量。通過信息服務(wù)的智能化,讓被動(dòng)服務(wù)變成主動(dòng)服務(wù),改變傳統(tǒng)的服務(wù)方式,讓圖書館的服務(wù)質(zhì)量得到提升。通過OPAC的服務(wù)智能化,支持概念檢索、模糊檢索、聯(lián)想檢索等功能,利用數(shù)據(jù)挖掘中的文本挖掘技術(shù)讓檢索結(jié)果質(zhì)量提高。其次應(yīng)用數(shù)據(jù)挖掘技術(shù),在查詢咨詢中發(fā)揮優(yōu)勢(shì),通過對(duì)網(wǎng)絡(luò)信息的挖掘以及網(wǎng)絡(luò)信息的序化、網(wǎng)絡(luò)信息的應(yīng)用加強(qiáng)和優(yōu)化圖書館信息服務(wù)質(zhì)量。圖書館的服務(wù)質(zhì)量直接影響到了圖書館的運(yùn)行效率,發(fā)展方向,所以要充分研究數(shù)據(jù)挖掘在圖書館中的應(yīng)用,并發(fā)揮其優(yōu)勢(shì),幫助圖書館優(yōu)化服務(wù)質(zhì)量,提高各方面的綜合能力。
2.3 挖掘?qū)W科動(dòng)向,發(fā)現(xiàn)學(xué)科之間的隱性關(guān)聯(lián)
各個(gè)學(xué)科的動(dòng)向直接影響到了圖書館的新書購買及藏書的相關(guān)工作,因此學(xué)科動(dòng)向與學(xué)科隱性關(guān)聯(lián)是圖書館文獻(xiàn)使用規(guī)律挖掘的重要方面之一,利用數(shù)據(jù)挖掘中的文本聚類、文本分類以及關(guān)聯(lián)挖掘等功能強(qiáng)化圖書館的購買規(guī)劃,通過挖掘?qū)W科動(dòng)向,發(fā)現(xiàn)學(xué)科之間的隱性關(guān)聯(lián),研究出在海量數(shù)據(jù)中存在的規(guī)則,而這些規(guī)則對(duì)于我們發(fā)現(xiàn)學(xué)科之間的隱性關(guān)聯(lián)很有幫助。有些學(xué)科之間的關(guān)聯(lián)并不容易發(fā)現(xiàn),需要通過內(nèi)在聯(lián)系、內(nèi)涵分析等才能發(fā)現(xiàn)其隱性關(guān)聯(lián)。挖掘出了學(xué)科之間的隱性關(guān)聯(lián),對(duì)于提高圖書館的藏書借閱和電子資源服務(wù)學(xué)科研究等工作的開展都有重大的意義。
3 數(shù)據(jù)挖掘研究熱點(diǎn)及趨勢(shì)
3.1 關(guān)聯(lián)挖掘
在以后的數(shù)據(jù)挖掘在國內(nèi)的圖書館數(shù)據(jù)庫應(yīng)用領(lǐng)域研究中,其研究的熱點(diǎn)以及趨勢(shì)是學(xué)科之間的關(guān)聯(lián)挖掘。通過對(duì)讀者與書籍、書籍與書籍之間的隱性關(guān)聯(lián)的研究,可以為圖書館的藏書建設(shè)提供重要的指導(dǎo)意見。數(shù)據(jù)挖掘技術(shù)在圖書館中最常見的是館藏建設(shè)的優(yōu)化,館藏結(jié)構(gòu)的優(yōu)化以及藏書布局等。通過關(guān)聯(lián)挖掘的研究,可以找出圖書館中的圖書與圖書之間的隱性聯(lián)系,或者讀者與文獻(xiàn)之間的聯(lián)系。比如讀者借閱了文獻(xiàn)A,一段時(shí)間后又借閱了文獻(xiàn)B,通過研究文獻(xiàn)A與文獻(xiàn)B之間的聯(lián)系,不斷優(yōu)化圖書館的藏書,使圖書館更好地服務(wù)于讀者。
3.2 讀者行為分析
圖書館中的讀者行為分析與挖掘?qū)τ趫D書館的發(fā)展有著重要的作用。通過讀者行為的分析,可以優(yōu)化館藏結(jié)構(gòu),提高讀者對(duì)圖書館的信息資源的利用率。比如圖書館挖掘在圖書館中的常活動(dòng)讀者,對(duì)于讀者的身份和讀書習(xí)慣分析,對(duì)于文理科讀書群體的分析等,對(duì)這些讀者行為進(jìn)行跟蹤與分析,通過分析和總結(jié),發(fā)現(xiàn)圖書館存在的問題以及優(yōu)化館藏資源結(jié)構(gòu),并且尋找出相應(yīng)的調(diào)整方案,從而優(yōu)化圖書管理和服務(wù)推送,讓更多的讀者喜歡圖書館,也讓圖書館的管理與發(fā)展更進(jìn)一步。
3.3 個(gè)性化服務(wù)
每一個(gè)讀者的行為習(xí)慣都不同,閱讀的習(xí)慣也各不相同。如果圖書館能夠建立起個(gè)性化服務(wù),并且對(duì)讀者對(duì)信息使用行為習(xí)慣的特定需求建立起完整的個(gè)性化服務(wù)體系,那么就能進(jìn)一步提高圖書館的管理水平。而個(gè)性化服務(wù)也始終貫穿于數(shù)據(jù)挖掘在圖書館數(shù)據(jù)庫應(yīng)用研究過程中。根據(jù)讀者的興趣、愛好、瀏覽模式等研究開發(fā)出適合不同讀者的個(gè)性化服務(wù)。比如閱讀推薦、個(gè)性化公告板、郵件訂閱等根據(jù)讀者的喜好推薦與之相符的書籍供讀者閱讀。
4 結(jié)語
當(dāng)前數(shù)據(jù)挖掘技術(shù)在快速的發(fā)展當(dāng)中,其在多個(gè)領(lǐng)域也得到廣泛的應(yīng)用。數(shù)據(jù)挖掘技術(shù)為圖書館在海量信息資源中檢索有價(jià)值的信息從而為指導(dǎo)圖書館的工作提供了便利。優(yōu)化了圖書館的藏書結(jié)構(gòu),信息管理結(jié)構(gòu)等,它是圖書館革新的重要手段。雖然目前國內(nèi)圖書館的數(shù)據(jù)挖掘應(yīng)用還不夠完善,受到各種條件的制約,但是數(shù)據(jù)挖掘在圖書館中仍然有著廣闊的應(yīng)用前景,有待我們進(jìn)一步的挖掘和研究。
參考文獻(xiàn)
[1] 俞錦梅.數(shù)據(jù)挖掘在國內(nèi)圖書館數(shù)據(jù)庫應(yīng)用領(lǐng)域研究綜述[J].圖書與情報(bào),2015(2):137-141.
[2] 田瑞雪.國內(nèi)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究述評(píng)[J].科技信息,2014(1):167.
[3] 龐天丙.數(shù)據(jù)挖掘技術(shù)在圖書館系統(tǒng)中的研究現(xiàn)狀分析與研究[J].福建電腦,2012,28(2):72-74.endprint