李旭剛
摘 要:本文首先分析了近年來大數(shù)據(jù)在我國圖書情報(bào)領(lǐng)域的研究現(xiàn)狀,然后說明了大數(shù)據(jù)在我國圖書情報(bào)領(lǐng)域的主要研究內(nèi)容,最后論述了大數(shù)據(jù)在我國圖書情報(bào)領(lǐng)域的研究存在的主要問題。并在此基礎(chǔ)上,對(duì)大數(shù)據(jù)在我國圖書情報(bào)領(lǐng)域的未來發(fā)展情況作了討論與展望。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代 圖書情報(bào)領(lǐng)域 研究現(xiàn)狀
在現(xiàn)代化計(jì)算機(jī)科學(xué)應(yīng)用技術(shù)的環(huán)境下,大數(shù)據(jù)研究已成為重要的組成部分,以互聯(lián)網(wǎng)“云計(jì)算”數(shù)據(jù)管理為核心的圖書情報(bào)領(lǐng)域的大數(shù)據(jù)研究也越來越受到社會(huì)各界的關(guān)注。本文將著重介紹我國圖書情報(bào)領(lǐng)域大數(shù)據(jù)研究熱點(diǎn),希望給圖書情報(bào)領(lǐng)域帶來些許的借鑒意義。
1、我國的圖書館學(xué)情報(bào)學(xué)的發(fā)展現(xiàn)狀
圖書館學(xué)情報(bào)學(xué)在我國的快速發(fā)展的網(wǎng)絡(luò)信息化進(jìn)程中漸漸形成了鮮明的欄目、網(wǎng)站。這極大的促進(jìn)了讀者獲取知識(shí)的能力,還進(jìn)一步的方便了作者、讀者和編者之間的相互經(jīng)驗(yàn)的交流。對(duì)于讀者來說,可以很快地獲取最新的咨詢,其中提供了豐富的內(nèi)容篩選功能,真正的做到了讀者對(duì)信息的“各取所需”。隨著圖書館學(xué)情報(bào)學(xué)的發(fā)展,對(duì)于期刊網(wǎng)絡(luò)信息化來說,不僅要努力滿足國內(nèi)的用戶的使用,還需要進(jìn)一步提升國際知名度。目前我國在國家的統(tǒng)籌規(guī)劃和協(xié)調(diào)處理之下,很大一部分的學(xué)術(shù)期刊形成了比較完備的學(xué)術(shù)期刊編輯部,編輯網(wǎng)絡(luò)的規(guī)范性也得到了一定的保證。以中國期刊網(wǎng)等各大型專業(yè)數(shù)據(jù)庫的協(xié)同運(yùn)作作為我國學(xué)術(shù)信息傳播的優(yōu)良的網(wǎng)絡(luò)發(fā)行平臺(tái),由全國范圍內(nèi)遴選各學(xué)科各專業(yè)權(quán)威專家組成的專門機(jī)構(gòu)作為學(xué)術(shù)成果的評(píng)價(jià)平臺(tái),實(shí)現(xiàn)開放出版、開放獲取,促進(jìn)我國圖書館學(xué)情報(bào)學(xué)期刊穩(wěn)定、可持續(xù)的發(fā)展。
2、我國圖書情報(bào)資源存在的問題
2.1 缺乏統(tǒng)一的管理。因?yàn)槲覈閳?bào)機(jī)構(gòu)分屬的系統(tǒng)不一致,就難免使管理很難統(tǒng)一?,F(xiàn)今我國的圖書情報(bào)機(jī)構(gòu)分別屬于四個(gè)獨(dú)立的管轄機(jī)構(gòu)。分別是,隸屬于中國科學(xué)技術(shù)院的文獻(xiàn)情報(bào)系統(tǒng);隸屬于我國文化部的公共圖書館系統(tǒng);隸屬于教育部的高等院校圖書館系統(tǒng);隸屬于中國科技部的綜合科技情報(bào)系統(tǒng)。這就把圖書管理分割開來,難以統(tǒng)一有效管理,致使我國現(xiàn)今很難確立圖書館網(wǎng)絡(luò)技術(shù)信息資源建設(shè)較為統(tǒng)一的實(shí)施標(biāo)準(zhǔn)和規(guī)范,圖書館的鏈接和共享也受到了一定影響。
2.2 圖書資源數(shù)字化程度有待提升。盡管我國的紙質(zhì)圖書文獻(xiàn)十分豐富,無論是在類別上還是數(shù)量上都很巨大,但是由于網(wǎng)絡(luò)化硬件建設(shè)的基礎(chǔ)還比較薄弱,加之本身的額數(shù)字化程度不高,就很難讓讀者從異地或者本地網(wǎng)絡(luò)上查閱到想查閱的信息資源,尤其是比較早期的一些比較珍貴的文獻(xiàn)資料。
2.3 數(shù)據(jù)對(duì)接的難度大,數(shù)據(jù)庫的建設(shè)缺乏規(guī)范完善的標(biāo)準(zhǔn)?,F(xiàn)今我國的各圖書館的數(shù)據(jù)建設(shè)任然是先自行建設(shè)為主,數(shù)據(jù)庫的類型也是花樣繁多,加之獨(dú)立建庫,就導(dǎo)致了各個(gè)獨(dú)自建立的數(shù)據(jù)庫不能很好的實(shí)現(xiàn)無縫對(duì)接,增加了圖書館網(wǎng)絡(luò)化的成本。
2.4 資源共享共建缺乏統(tǒng)一的完善的建設(shè)規(guī)劃。信息資源建設(shè)是一項(xiàng)長期的系統(tǒng)工程,這就要求各館要高度重視并認(rèn)真的完成,建設(shè)資金的投入要有連續(xù)性不能中斷,圖書館之間要有協(xié)調(diào)性,避免重復(fù)建設(shè)導(dǎo)致的資源浪費(fèi)。但是由于目前尚無至上而下的統(tǒng)一規(guī)劃,致使各館為了達(dá)到評(píng)估要求盲目上項(xiàng)目,使本來就數(shù)目不多的資金也沒有用在刀刃上??傮w上使我國的信息資源建設(shè)處于一種混亂無序的狀況,這都不利于圖書館信息化、網(wǎng)絡(luò)化的發(fā)展。
2.5 版權(quán)問題不能很好解決,信息安全無保障。目前我國的網(wǎng)絡(luò)安全形勢(shì)不容樂觀,網(wǎng)絡(luò)安全是發(fā)展網(wǎng)絡(luò)建設(shè)的重要保障。目前我國沒有建立完整的網(wǎng)絡(luò)信息資源保護(hù)法,導(dǎo)致黑客盛行肆意妄為。網(wǎng)絡(luò)安全問題比較復(fù)雜嚴(yán)峻。今年我國的知識(shí)產(chǎn)權(quán)法進(jìn)一步的完善了,但是這也導(dǎo)致了出版物網(wǎng)絡(luò)化的版權(quán)問題。使得許多圖書館信息資源網(wǎng)絡(luò)化時(shí)存在顧慮。如何在網(wǎng)絡(luò)資源共享與知識(shí)產(chǎn)權(quán)之間尋找一個(gè)平衡點(diǎn)是當(dāng)務(wù)之急。
3、情報(bào)學(xué)領(lǐng)域大數(shù)據(jù)熱點(diǎn)研究
3.1 構(gòu)建高頻關(guān)鍵詞矩陣。高頻關(guān)鍵詞表中“情報(bào)學(xué)”出現(xiàn)的頻次最高,但是其與本研究的內(nèi)容完全重合,故舍棄;圖書情報(bào)學(xué)與圖書館學(xué)情報(bào)學(xué)的意義相同,故將它們合并為圖書情報(bào)學(xué)。在此基礎(chǔ)上共計(jì)得到12個(gè)高頻詞作為共詞分析的原始數(shù)據(jù)。
將這12個(gè)高頻關(guān)鍵詞進(jìn)行兩兩組合,統(tǒng)計(jì)出它們同時(shí)出現(xiàn)在同一篇文獻(xiàn)中的次數(shù),形成共詞矩陣。該矩陣為對(duì)角矩陣,對(duì)角線上的數(shù)字代表任一關(guān)鍵詞自身出現(xiàn)的頻次,非對(duì)角線上的數(shù)字代表兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)的次數(shù)。為了更清晰有效地表示關(guān)鍵詞之間的某些關(guān)系,我們將用Ochiia系數(shù)計(jì)算關(guān)鍵詞相似矩陣,“Ochiia系數(shù)等于AB兩詞共同出現(xiàn)的頻次除以AB各頻次乘積的開方?!?/p>
3.2 因子分析。用少數(shù)幾個(gè)因子來描述解釋原始的很多個(gè)變量因子之間的關(guān)系就是因子分析,因子分析可以反映原始資料里面的大部分有效信息。以下的5個(gè)特點(diǎn)是因子分析固有的,能減少計(jì)算量,因?yàn)橐蜃犹娲嗽械淖兞繀⑴c了數(shù)據(jù)建模;因子分析能反映原有變量的大部分信息;因子有命名解釋性;因子之間的線性關(guān)系不顯著;因子分析中所需提取的因子個(gè)數(shù)小于原有的變數(shù)量。
3.3 聚類分析。俗話說物以類聚,那么在大數(shù)據(jù)研究里也是一個(gè)十分可行的方法?!八膶?shí)質(zhì)是建立一種分類方法,將一批樣本數(shù)據(jù)按照它們?cè)谛再|(zhì)上的親密程度在沒有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行分類,同類間較為相似,不同類之間區(qū)別較大。”具體操作步驟一般分為兩點(diǎn),首先是,異矩陣導(dǎo)入SPSS19.0中,選擇分析系統(tǒng)聚類;其次將所有變量選擇到右邊的變量列表中,依次設(shè)置聚類分析的選項(xiàng),輸出內(nèi)容為統(tǒng)計(jì)量和圖。
在聚類分析中時(shí)常用到樹狀圖加以解釋分析,它能比較完整清晰的展示聚類分析中的每一次類合并的狀況,達(dá)到最終的所有小類合為一類,此時(shí)的類間的距離已經(jīng)十分大了。
4、總結(jié)
近年來,我國圖書情報(bào)學(xué)理論研究成果不斷增多不斷豐富,但是其中存在的問題也較多,這就需要廣大的專業(yè)領(lǐng)域的工作者孜孜不倦的探索,努力做好本職工作。我國圖書情報(bào)領(lǐng)域大數(shù)據(jù)建設(shè)是一項(xiàng)基礎(chǔ)性核心工作,我們應(yīng)必須高度重視,我國圖書情報(bào)領(lǐng)域數(shù)據(jù)管理應(yīng)更多地借鑒國內(nèi)外相關(guān)學(xué)科的研究,從而使圖書情報(bào)資源,盡早實(shí)現(xiàn)共享。
參考文獻(xiàn)
[1] 張文彥,武瑞源,于潔.大數(shù)據(jù)時(shí)代的圖書館初探[J]圖書與情報(bào);2012
[2] 鄧仲華.大數(shù)據(jù)環(huán)境下嵌入科研過程的信息服務(wù)模式研究[J]圖書與情報(bào);2014
[3] 周力青.大數(shù)據(jù)時(shí)代下的圖書館移動(dòng)服務(wù)創(chuàng)新研究[J]圖書與情報(bào);2015
[4] 劉紅霞,白萬豪.大數(shù)據(jù)背景下的應(yīng)用情報(bào)學(xué)研究[J]情報(bào)資料工作;2014