摘要:隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)吸引了包括政府、企業(yè)等在內(nèi)的多方關(guān)注,被稱為是下一個(gè)社會(huì)發(fā)展階段的“金礦”和“石油”,具有催生社會(huì)變革的能量。面對大數(shù)據(jù)的興起為情報(bào)學(xué)領(lǐng)域帶來新機(jī)遇的同時(shí)帶來的極大挑戰(zhàn),傳統(tǒng)的情報(bào)分析已經(jīng)不足以對高速生產(chǎn)的、多種類型的、海量的數(shù)據(jù)進(jìn)行有效處理與分析。本文針對大數(shù)據(jù)時(shí)代情報(bào)學(xué)面臨的挑戰(zhàn)進(jìn)行分析,提出了情報(bào)學(xué)在大數(shù)據(jù)時(shí)代發(fā)展的機(jī)遇。
關(guān)鍵詞:大數(shù)據(jù);情報(bào)學(xué);挑戰(zhàn);機(jī)遇
大數(shù)據(jù),顧名思義是大規(guī)模的數(shù)據(jù)集,但它又不僅僅是一個(gè)簡單的數(shù)量的概念,IBM公司指出,大數(shù)據(jù)的特點(diǎn)是4個(gè)V:Volume(大量)、Velocity(高速)、Variety(多樣)及Veracity(真實(shí)),它提供了在新的和正在出現(xiàn)的數(shù)據(jù)和內(nèi)容中洞悉事物的機(jī)會(huì),使業(yè)務(wù)更加靈活,并回答以往沒有考慮到的問題[1]。Gartner公司的報(bào)告也提出,大數(shù)據(jù)是大容量、高速和多樣化的信息資產(chǎn),它們需要新的處理方式,以提高決策能力、洞察力和流租優(yōu)化[2]。圖書館正在從信息時(shí)代向數(shù)據(jù)時(shí)代進(jìn)行過渡,并伴隨著資源的全面數(shù)字化、富媒體化以及開放共享政策的不斷完善,爆炸式增長的數(shù)據(jù)資源為傳統(tǒng)的情報(bào)分析提出了極其嚴(yán)峻的挑戰(zhàn),新的情報(bào)分析手段亟待解決,從數(shù)據(jù)時(shí)代到計(jì)算時(shí)代的轉(zhuǎn)變已經(jīng)悄然提上議程[3]。21世紀(jì)情報(bào)學(xué)的發(fā)展,離不開多學(xué)科的交叉融合,唯有在理論與實(shí)踐不斷的碰撞中,才能為情報(bào)學(xué)提供創(chuàng)新型的發(fā)展思路與更為廣闊的發(fā)展前景。所以大數(shù)據(jù)時(shí)代對于各個(gè)學(xué)科的要求都提高了很多,對于情報(bào)學(xué)專業(yè) 而言,大數(shù)據(jù)時(shí)代同樣帶來了很多挑戰(zhàn)和機(jī)遇。
一、大數(shù)據(jù)時(shí)代情報(bào)學(xué)面臨的挑戰(zhàn)
大數(shù)據(jù)的研究價(jià)值可以她美“石油”,但如何進(jìn)行挖掘與開采其價(jià)值,一直都是難點(diǎn)。
首先,海量數(shù)據(jù)將會(huì)為情報(bào)分析提供前所木有的有價(jià)值的信息,但與此同時(shí),這些資料之間的關(guān)聯(lián)程度也是海量的。如果有一批更新速度極快的多樣真實(shí)的大量數(shù)據(jù)。將這批數(shù)據(jù)看作一個(gè)整體。每個(gè)單獨(dú)的數(shù)據(jù)看作是整體的一個(gè)組成部分,這些組成部分之間毫不相關(guān),數(shù)據(jù)彼此很孤立,數(shù)據(jù)間的關(guān)系不消晰很難捉摸,看上去并不像一個(gè)整體,相反地更像是一盤散沙。這種零散的海量數(shù)據(jù)之間的關(guān)系斷裂其關(guān)聯(lián)程度很低。也就導(dǎo)致其含金量減少,不能形成所謂的“大數(shù)據(jù)”。如何對龐雜的數(shù)據(jù)進(jìn)行分析,發(fā)掘看似“雜亂無章”的數(shù)據(jù)之間的關(guān)聯(lián),是一大挑戰(zhàn),當(dāng)前情報(bào)分析中僅有極小的一部分?jǐn)?shù)據(jù)被整合、分析、利用并且發(fā)掘出其中內(nèi)涵與價(jià)值,大部分?jǐn)?shù)據(jù)仍是尚未開發(fā)利用的。
其次,大數(shù)據(jù)同時(shí)還具有“高速”的特征,即其生產(chǎn)速度極快,而傳統(tǒng)的情報(bào)分析很大程度上是不能做到完全白動(dòng)分析的,必須要有人工的參與才能進(jìn)行,如何將情報(bào)分析過程實(shí)現(xiàn)完全自動(dòng)化,也是大數(shù)據(jù)對于情報(bào)分析提出的嚴(yán)峻挑戰(zhàn)。
最后,大數(shù)據(jù)的“多樣性”表征除了以前在情報(bào)分析的利用較多的結(jié)構(gòu)化數(shù)據(jù)外,非結(jié)構(gòu)化數(shù)據(jù)也在其中占有相當(dāng)大的比例,例如文本、音頻、視頻等很多形式的數(shù)據(jù),這是未來情報(bào)分析中非常重要且不可忽視的部分,將其他的富媒體化數(shù)據(jù)納入情報(bào)分析的范疇,將會(huì)極大地豐富情報(bào)分析的內(nèi)容與提高情報(bào)分析質(zhì)量,但同時(shí),由于情報(bào)工作者要挖掘的某些規(guī)律可能隱含在各種形式的數(shù)據(jù)中,而同一種形式的數(shù)據(jù)又有可能含有很多規(guī)律,如此一來,大數(shù)據(jù)時(shí)代就要求情報(bào)工作人員的統(tǒng)籌兼顧,不能漏過任何一種類型的數(shù)據(jù)。
二、大數(shù)據(jù)時(shí)代情報(bào)學(xué)的機(jī)遇
大數(shù)據(jù)時(shí)代的來臨,無疑是為情報(bào)學(xué)的學(xué)科發(fā)展創(chuàng)造了契機(jī)。情報(bào)學(xué)還是一個(gè)比較年輕的學(xué)科。大數(shù)據(jù)時(shí)代的到來也顯示出情報(bào)學(xué)的“年輕”之處,如何將情報(bào)學(xué)進(jìn)行完善,如何讓情報(bào)學(xué)走向成熟這都將會(huì)在大數(shù)據(jù)時(shí)代中找到解決的機(jī)遇。
首先,大數(shù)據(jù)環(huán)境下的情報(bào)實(shí)踐將在智慧化、精準(zhǔn)化方面取得重大發(fā)展。傳統(tǒng)的情報(bào)實(shí)踐多在經(jīng)過反復(fù)驗(yàn)證的模型指導(dǎo)下開展,然而環(huán)境的發(fā)展并不能完全保證根據(jù)以往經(jīng)驗(yàn)得到的模型的準(zhǔn)確性,大數(shù)據(jù)環(huán)境下的情報(bào)實(shí)踐則改變這種方式,以數(shù)據(jù)為核心開展,其精準(zhǔn)化將得到空前的發(fā)展。例如,美國政治類輿情分析專家Nate Silver從2008年開始利用大數(shù)據(jù)分析美國總統(tǒng)大選,連續(xù)兩次準(zhǔn)確地預(yù)測了選舉結(jié)果,2012年的大選中NateSilver精準(zhǔn)地預(yù)測了美國50個(gè)州的得票率[4]。
其次,大數(shù)據(jù)環(huán)境下的情報(bào)應(yīng)用價(jià)值將在深度和廣度上取得突破。從情報(bào)應(yīng)用的角度來看,大數(shù)據(jù)工作與“事實(shí)數(shù)據(jù)+工具方法+專家智慧”的情報(bào)方法有很大程度上的相似性,在傳統(tǒng)的情報(bào)研究中,情報(bào)應(yīng)用在范圍上分成了不同的業(yè)務(wù)范圍,科技情報(bào)、競爭情報(bào)、圖書情報(bào)、公共情報(bào)工作之間的界限明顯,政府信息中心、統(tǒng)計(jì)部門、智庫、高校等情報(bào)工作主體之間的情報(bào)研究相互割裂,導(dǎo)致情報(bào)機(jī)構(gòu)和情報(bào)產(chǎn)品存在相互重復(fù)和缺口,影響了情報(bào)應(yīng)用整體效能的提升;雖然情報(bào)應(yīng)用的主要目標(biāo)是服務(wù)于決策,然而在實(shí)際的決策過程中卻難以支撐起有效的決策支持工作。
再次,將完善學(xué)科技術(shù)和方法。大數(shù)據(jù)時(shí)代,無論是數(shù)據(jù)量還是數(shù)據(jù)類型,都要求情報(bào)學(xué)這一學(xué)科對于自身的技術(shù)和研究方法進(jìn)行一次變革和完善,以往的技術(shù)不能解決的問題,在大數(shù)據(jù)時(shí)代的今天將會(huì)得到解決;以往的方法不能研究的問題,在大數(shù)據(jù)時(shí)代也將得到研究,這也是技術(shù)和方法的升華。大數(shù)據(jù)時(shí)代的到來,可以為情報(bào)學(xué)這一學(xué)科提供更強(qiáng)有力的數(shù)據(jù)處理分析工具和方法。
最后,情報(bào)學(xué)將會(huì)更加受到重視。很多人曾經(jīng)認(rèn)為沒有必要設(shè)置情報(bào)學(xué)專業(yè),甚至有人將情報(bào)學(xué)列入 20 個(gè)無用的專業(yè)之一。但是在大數(shù)據(jù)時(shí)代,任何一個(gè)行業(yè)想在海量數(shù)據(jù)中進(jìn)行“淘金”,都需要情報(bào)工作人員的介入,事實(shí)驗(yàn)證情報(bào)學(xué)的一些比較成熟的研究方法是其他專業(yè)不能比擬的,在情報(bào)學(xué)對數(shù)據(jù)挖掘的能力面前,曾經(jīng)看著無用的垃圾信息將會(huì)是揭示某種規(guī)律的關(guān)鍵性信息。情報(bào)學(xué)專業(yè)在大數(shù)據(jù)時(shí)代應(yīng)該抓住機(jī)遇展現(xiàn)自身的優(yōu)勢,順應(yīng)潮流發(fā)展,讓更多的人看到情報(bào)學(xué)專業(yè)的閃光點(diǎn)。進(jìn)一步對學(xué)科建設(shè)進(jìn)行完善、使情報(bào):無分的與數(shù)學(xué)、經(jīng)濟(jì)學(xué)、心理學(xué)等其他學(xué)科結(jié)合起來。從而使情報(bào)學(xué)更為成熟,成為數(shù)據(jù)挖掘和數(shù)據(jù)分析中的領(lǐng)頭羊。
參考文獻(xiàn)
[1]What is big data?[EB/OL.].[2012-09-06].http:/wwwi01.ibm.com/software/data/biglata/.
[2]Big data in little New Zealand[EB/OL].[2012-09-06]http://www.techday.co.nz/itlbriel/news/big-lata-in-litle-new-zealand/24518/.
[3]張曉林.顛覆性變革與后圖書館時(shí)代———推動(dòng)知識服務(wù)的供給側(cè)結(jié)構(gòu)性改[J].中國圖書館學(xué)報(bào),2018 (1):4-16.
[4]Daniel T.Obama’s win a big vindication for Nate Silver,king of the quants[EB/OL].[2016-11-6].https://www.cnet.com/news/obamas-win-a-big-vindication-for-nate-silver-king-of-the-quants/.
作者簡介:郭佳璐(1997-),女,內(nèi)蒙古巴彥淖爾人,河北大學(xué)管理學(xué)院本科在讀,研究方向:信息管理與信息系統(tǒng)。