(廣州鐵路職業(yè)技術(shù)學(xué)院圖書館,廣東 廣州510000)
關(guān)鍵詞:高校圖書館;大數(shù)據(jù);應(yīng)用服務(wù)模式;體系建設(shè)
摘要:文章主要針對(duì)高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)模式體系建設(shè)展開探討,對(duì)高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)的現(xiàn)狀作了分析,并系統(tǒng)研究了高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)模式的體系建設(shè),以期能為有關(guān)研究提供參考。
中圖分類號(hào):G258.6文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2017)04-0134-03
1高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)現(xiàn)狀分析
1.1高校圖書館大數(shù)據(jù)研究進(jìn)展
圖書館應(yīng)用大數(shù)據(jù)、服務(wù)需求以及相關(guān)的技術(shù)問題的討論,國外相關(guān)學(xué)者很早就已經(jīng)開始關(guān)注。關(guān)于數(shù)據(jù)服務(wù)方面的討論,韓翠峰對(duì)組織數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)以及數(shù)據(jù)的管理進(jìn)行了相應(yīng)的探究,他認(rèn)為大數(shù)據(jù)時(shí)代的今天面臨的挑戰(zhàn)是多種多樣的,應(yīng)提出相應(yīng)的應(yīng)對(duì)方案[1];秦嘉杭則認(rèn)為在大數(shù)據(jù)環(huán)境下,圖書館更應(yīng)該側(cè)重于挖掘數(shù)據(jù)、發(fā)現(xiàn)知識(shí)以及服務(wù)社區(qū)的數(shù)據(jù)構(gòu)建及服務(wù)[2];關(guān)于應(yīng)用技術(shù)方面,M.Teets和J.Qiu等人依據(jù)時(shí)間的先后順序依次提出了World Cat數(shù)據(jù)庫的應(yīng)用框架和HPC-ABDS大數(shù)據(jù)時(shí)代的圖書館應(yīng)用框架[3]。而近年來,國內(nèi)很多知名學(xué)者也開始注意到大數(shù)據(jù)時(shí)代背景下高校圖書館的服務(wù)與技術(shù)問題,并引發(fā)了相應(yīng)的討論。王顯燕對(duì)國內(nèi)圖書館對(duì)技術(shù)的應(yīng)用、知識(shí)的創(chuàng)新、圖書館的硬件設(shè)施等進(jìn)行了多方面的比較,分析了國內(nèi)高校圖書館面臨的問題與挑戰(zhàn),并根據(jù)問題提出相應(yīng)的應(yīng)對(duì)策略,她認(rèn)為在大數(shù)據(jù)時(shí)代高校圖書館發(fā)揮著重要作用,未來高校圖書館的服務(wù)更加精細(xì)、用戶的行為分析更加準(zhǔn)確、決策更加智能化[4]。不管是國內(nèi)的學(xué)者還是國外的學(xué)者,都是從多個(gè)視角探討了大數(shù)據(jù)背景下高校圖書館面臨的諸多問題與挑戰(zhàn),高校圖書館需要更加明確的創(chuàng)新服務(wù)意識(shí),策劃出合理的應(yīng)對(duì)方案。筆者認(rèn)為,上述很多方案更多的是偏向于對(duì)概念的解釋,缺乏相關(guān)理論以及從技術(shù)角度切入的應(yīng)對(duì)策略。
1.2高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)目前面臨的問題
1.2.1高校圖書館數(shù)據(jù)整合問題。目前,由于受多種因素的限制,在知識(shí)服務(wù)領(lǐng)域中相關(guān)的企業(yè)數(shù)據(jù)開放程度不高,“信息孤島”便由此產(chǎn)生,所以,收集數(shù)據(jù)的難度較大。加上迥異的數(shù)據(jù)關(guān)聯(lián)、風(fēng)格各異的數(shù)據(jù)存儲(chǔ)方式以及不同的數(shù)據(jù)格式,即使是進(jìn)行簡單的數(shù)據(jù)堆砌,也很難挖掘有效的知識(shí)數(shù)據(jù),這給高校圖書館整合大數(shù)據(jù)帶來了難題。除此之外,整合大量數(shù)據(jù)后,應(yīng)使用什么樣的存儲(chǔ)方式,從而確保用戶的訪問速度不受限制,成了一個(gè)新的挑戰(zhàn)[5]。
1.2.2高校圖書館大數(shù)據(jù)技術(shù)問題。大數(shù)據(jù)環(huán)境下,傳統(tǒng)的數(shù)據(jù)挖掘方式已無法滿足對(duì)關(guān)系型數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)挖掘及深度分析的需求,這就需要高性能計(jì)算設(shè)備、軟件平臺(tái)作為支撐,提高處理速度,采用合適的數(shù)據(jù)挖掘算法進(jìn)行知識(shí)挖掘和知識(shí)發(fā)現(xiàn)。目前,我國相關(guān)領(lǐng)域的技術(shù)發(fā)展還不平衡,一些知名互聯(lián)網(wǎng)企業(yè),如阿里巴巴和騰訊等,都已構(gòu)建了上萬節(jié)點(diǎn)的大數(shù)據(jù)計(jì)算集群和軟件平臺(tái),也成功開展了大數(shù)據(jù)應(yīng)用和服務(wù),但由于企業(yè)之間競爭激烈,大數(shù)據(jù)的應(yīng)用和開發(fā)技術(shù)通常技術(shù)水平不高、技術(shù)擴(kuò)散不暢,優(yōu)勢(shì)企業(yè)對(duì)開源社區(qū)的貢獻(xiàn)相對(duì)薄弱,從事圖書情報(bào)工作的研究者難以獲取所需的數(shù)據(jù)資料,造成高校圖書館大數(shù)據(jù)分析面臨技術(shù)壁壘。
1.2.3高校圖書館服務(wù)問題。目前,在大數(shù)據(jù)開放以及知識(shí)共享的時(shí)代背景下,高校圖書館需要進(jìn)行針對(duì)性的知識(shí)服務(wù),及時(shí)了解用戶的需求,通過搜索知識(shí)、組織文字、分析數(shù)據(jù)、重組詞語等搜索方式為用戶提供更為優(yōu)質(zhì)的服務(wù),進(jìn)而推動(dòng)知識(shí)的應(yīng)用與創(chuàng)新。目前,高校的個(gè)性化服務(wù)以及科研項(xiàng)目成為高校圖書館知識(shí)服務(wù)體系的兩個(gè)重要方向,但業(yè)界對(duì)此的研究缺少相應(yīng)的理論支撐及相關(guān)的技術(shù)支持[6]。
1.2.4高校圖書館經(jīng)費(fèi)問題。高校圖書館是為高校教學(xué)和科研服務(wù)的。由于高校對(duì)圖書館計(jì)算機(jī)設(shè)備及資金投入有限,圖書館大數(shù)據(jù)服務(wù)面臨著較大的挑戰(zhàn)。隨著圖書館數(shù)據(jù)量的不斷增加,數(shù)據(jù)存儲(chǔ)及計(jì)算規(guī)模也隨之增大,服務(wù)器硬件設(shè)備及軟件設(shè)施的購置等需要大量的資金投入,對(duì)此,高校圖書館需爭取國家和學(xué)校的重視和支持,并尋求有效的解決方案。
2構(gòu)建高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)模式
2.1大數(shù)據(jù)應(yīng)用模式
“大數(shù)據(jù)應(yīng)用模式”目前還沒有確切的定義。筆者通過互動(dòng)百科搜索“模式”一詞,得到的結(jié)果是:“在生產(chǎn)和生活中產(chǎn)生的經(jīng)驗(yàn),經(jīng)過了人的升華以及核心知識(shí)的提取,形成了一種可以解決問題的方法?!睋?jù)互動(dòng)百科對(duì)“模式”一詞的解釋,筆者將大數(shù)據(jù)應(yīng)用模式解釋為解決了高校圖書館大數(shù)據(jù)應(yīng)用的方法。在大數(shù)據(jù)時(shí)代背景下,高校圖書館的大數(shù)據(jù)服務(wù)體系面臨著很多的難題,但在相關(guān)理論知識(shí)體系以及技術(shù)手段的支撐下,高校圖書館應(yīng)深度分析這些難題并從中提出相關(guān)解決方案,經(jīng)過總結(jié)得出理論,最后形成相關(guān)的知識(shí)理論體系[7]。
2.2大規(guī)模網(wǎng)絡(luò)分析方法
2.2.1網(wǎng)絡(luò)分析的知識(shí)理論。網(wǎng)絡(luò)分析方法需要與知識(shí)管理理論相結(jié)合,以學(xué)科的知識(shí)作為理論依據(jù),通過對(duì)“語義網(wǎng)絡(luò)”模型的構(gòu)建以及“顯性知識(shí)”的挖掘,搭建起分析“社會(huì)網(wǎng)絡(luò)”模型以及“隱性知識(shí)”的表達(dá)平臺(tái),以達(dá)到共享和轉(zhuǎn)移“隱性知識(shí)”的目的,進(jìn)而能夠起到輔助作用,創(chuàng)新知識(shí)理論以及使決策更加智能[8]。
2.2.2個(gè)性化推薦算法。在個(gè)性化推薦算法中,協(xié)同過濾是目前最為廣泛的算法之一,該算法為了給某個(gè)特定用戶進(jìn)行個(gè)性化推薦,可根據(jù)用戶所提供的相關(guān)信息,計(jì)算出與該用戶相似度較高的最近鄰居,再分析最近鄰居的活動(dòng)記錄等數(shù)據(jù),預(yù)測(cè)出該用戶可能對(duì)何種資源比較感興趣,從而對(duì)該用戶進(jìn)行個(gè)性化推薦。
2.3高校圖書館大數(shù)據(jù)應(yīng)用模式
高校圖書館大數(shù)據(jù)應(yīng)用模式框架的構(gòu)建是基于大規(guī)模網(wǎng)絡(luò)分析方法,該框架包含了高校圖書館大數(shù)據(jù)的應(yīng)用模式、應(yīng)用實(shí)現(xiàn)方法、知識(shí)服務(wù)管理理論、支撐技術(shù)以及云計(jì)算支撐環(huán)境(見圖1)。
2.3.1收集、整合和存儲(chǔ)數(shù)據(jù)模式。①高校圖書館的資源存儲(chǔ)結(jié)構(gòu)以及日常服務(wù)的半結(jié)構(gòu)化和非結(jié)構(gòu)化問題,可以采取人工手寫錄入數(shù)據(jù)或通過相關(guān)的軟件平臺(tái)接口存儲(chǔ)相關(guān)數(shù)據(jù)的方法解讀。②高校圖書館可以選擇與知名的文獻(xiàn)資源數(shù)據(jù)庫商簽約,以合作的方式獲得數(shù)據(jù)庫資源的下載、研究和使用權(quán)限。③高校圖書館可將本校的資源優(yōu)勢(shì)以及特色學(xué)科與網(wǎng)絡(luò)數(shù)據(jù)相連接,以獲取有效的數(shù)據(jù)資源及相關(guān)文獻(xiàn),在本校圖書館內(nèi)構(gòu)建學(xué)科數(shù)據(jù)庫,有效地收集學(xué)科的相關(guān)數(shù)據(jù)。
2.3.2大數(shù)據(jù)具備數(shù)據(jù)體量大、數(shù)據(jù)類型多、價(jià)值密度低和處理速度快四大特點(diǎn)。選擇和整合不同的數(shù)據(jù)資源,并對(duì)其采取什么樣的整合方法及整合的方式是這一問題的關(guān)鍵。①從資源整合的角度切入,根據(jù)特定的用戶需求進(jìn)行大數(shù)據(jù)的應(yīng)用研究。對(duì)此,數(shù)據(jù)整合需要考慮其類型的選擇,在整合時(shí)需要建立起相關(guān)性強(qiáng)、內(nèi)容豐富的高質(zhì)量數(shù)據(jù)庫。②從存儲(chǔ)和整合數(shù)據(jù)的方式上看,不同格式的數(shù)據(jù)需要建立起相應(yīng)的數(shù)據(jù)模式,并建立統(tǒng)一、規(guī)范的表現(xiàn)形式,將數(shù)據(jù)存儲(chǔ)在分布式的云平臺(tái)之中,方便用戶通過網(wǎng)絡(luò)快速地檢索和查詢相關(guān)文獻(xiàn)和資料[9]。
蔡洪齊:高校圖書館大數(shù)據(jù)應(yīng)用服務(wù)模式體系建設(shè)研究 2.3.3數(shù)據(jù)處理和分析模式。處理大數(shù)據(jù)有分析數(shù)據(jù)和挖掘數(shù)據(jù)兩種途徑。①分析數(shù)據(jù)是以文件形式或是以單個(gè)數(shù)據(jù)庫的組織方式為基礎(chǔ),分析目標(biāo)極為明確。②挖掘數(shù)據(jù)是需要在數(shù)據(jù)庫或是在分布式的存儲(chǔ)中建立數(shù)據(jù)庫。
2.3.4知識(shí)展現(xiàn)與服務(wù)模式。高校圖書館生存和發(fā)展的立足點(diǎn)是學(xué)科服務(wù),評(píng)估高校圖書館的服務(wù)質(zhì)量應(yīng)依據(jù)其學(xué)科服務(wù)水平的高低,而學(xué)科服務(wù)又是圍繞科研和學(xué)科教學(xué)展開的,用戶能夠快速地獲取科研和教學(xué)資料,既提高了圖書館的知識(shí)服務(wù)水平,也對(duì)創(chuàng)新和應(yīng)用知識(shí)起到了促進(jìn)作用。高校圖書館個(gè)性化服務(wù)應(yīng)針對(duì)用戶的行為習(xí)慣,以用戶的需求為主導(dǎo),對(duì)不同的用戶采取相應(yīng)的服務(wù)方式,具體實(shí)現(xiàn)技術(shù)包括個(gè)性化信息檢索、個(gè)性化信息推薦等。
2.3.5Hadoop大規(guī)模圖計(jì)算的云平臺(tái)。Hadoop大規(guī)模圖計(jì)算的云平臺(tái)破解了計(jì)算設(shè)備和經(jīng)費(fèi)投入等方面受限的難題。近年來,很多知識(shí)服務(wù)機(jī)構(gòu)為了減少計(jì)算成本的支出,多利用中低端硬件設(shè)備集合成大規(guī)模的計(jì)算機(jī)集群,并搭建了相關(guān)的計(jì)算平臺(tái),以此減少購置高端服務(wù)設(shè)備的費(fèi)用。目前市場(chǎng)上出現(xiàn)的云操作系統(tǒng)有微軟公司開發(fā)設(shè)計(jì)的Windows Server2012系統(tǒng)、甲骨文的Solaris11系統(tǒng)以及華為自主知識(shí)產(chǎn)權(quán)的Fusion Sphere云操作系統(tǒng)等,這些操作系統(tǒng)都是由企業(yè)開發(fā)設(shè)計(jì)的,它們的優(yōu)勢(shì)明顯、使用方便、性能穩(wěn)定,但使用時(shí)需要支付相應(yīng)的費(fèi)用。而開源項(xiàng)目Apache下的hadoop系統(tǒng)功能強(qiáng)大且免費(fèi),因此被許多互聯(lián)網(wǎng)公司爭相采用,成為主流的分布式系統(tǒng)。Hadoop系統(tǒng)是運(yùn)行于普通的服務(wù)器和計(jì)算機(jī)集群上的分布式存儲(chǔ)系統(tǒng),它將普通的服務(wù)器與存儲(chǔ)在計(jì)算機(jī)的集群相連接,能夠完成計(jì)算機(jī)的存儲(chǔ)和運(yùn)行調(diào)度。Hadoop系統(tǒng)的軟件開源特性能大幅降低大數(shù)據(jù)應(yīng)用的成本,同時(shí)也使其迅速成為工業(yè)界和學(xué)術(shù)界開展大數(shù)據(jù)應(yīng)用研究的主流平臺(tái)[10]。
3結(jié)語
在大數(shù)據(jù)背景下,高校圖書館的學(xué)科服務(wù)面臨著重大的變革,這既是挑戰(zhàn)又是機(jī)遇。在此背景下,圖書館要充分利用現(xiàn)代科學(xué)技術(shù),不斷改進(jìn)應(yīng)用服務(wù)體系,才能為用戶和讀者提供更為優(yōu)質(zhì)的服務(wù),以此推進(jìn)高校圖書館更好更快地發(fā)展。
參考文獻(xiàn):
[1]韓翠峰.大數(shù)據(jù)時(shí)代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
[2]秦嘉杭.大數(shù)據(jù)架構(gòu)下的高校圖書館資源與服務(wù)建設(shè)研究[J].圖書館研究,2014(5):25-27.
[3]MTeets M,Goldner.Libraries role in curating and exposing bigdata[J].Future Internet,2013(3):429-438.
[4]王顯燕.大數(shù)據(jù)環(huán)境下高校圖書館信息資源建設(shè)與服務(wù)[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2015(10):26-28.
[5]牟靜.大數(shù)據(jù)環(huán)境下的高校圖書館閱讀推廣研究:利益相關(guān)者共贏視角[J].圖書館研究,2015(1):72-75.
[6]欒旭倫.大數(shù)據(jù)環(huán)境下高校圖書館個(gè)性化信息服務(wù)系統(tǒng)研究[J].圖書館學(xué)刊,2014(8):118-121.
[7]高建輝,李全華.移動(dòng)互聯(lián)與大數(shù)據(jù)環(huán)境下高校圖書館在線服務(wù)體系研究[J].圖書館研究,2015(4):73-77.
[8]譚黔林.大數(shù)據(jù)時(shí)代高校圖書館特色數(shù)據(jù)庫建設(shè)研究[J].圖書館界,2014(2):18-20.
[9]曾文雯.大數(shù)據(jù)時(shí)代下高校圖書館的應(yīng)對(duì)策略[J].高校圖書館工作,2014(4):41-43.
[10]胡云霞.大數(shù)據(jù)背景下的高校移動(dòng)圖書館服務(wù)探索:基于在杭高校的實(shí)證研究[J].圖書館理論與實(shí)踐,2015(6):99-101.
(編校:馬懷云)
作者簡介:蔡洪齊(1981—),廣州鐵路職業(yè)技術(shù)學(xué)院圖書館副研究館員。