王 倩,李天柱,劉小琴
(遼寧科技大學(xué)工商管理學(xué)院,遼寧 鞍山 114051)
全球大數(shù)據(jù)研究的歷史演進(jìn):1993—2016年
王 倩,李天柱,劉小琴
(遼寧科技大學(xué)工商管理學(xué)院,遼寧 鞍山 114051)
運(yùn)用CiteSpace軟件對WOS中的3296篇論文進(jìn)行全樣本分析,發(fā)現(xiàn)全球大數(shù)據(jù)研究分為探索期、增長期和爆發(fā)期,具有覆蓋學(xué)科領(lǐng)域廣泛、生命科學(xué)大數(shù)據(jù)研究活躍及人文社會科學(xué)大數(shù)據(jù)研究與科學(xué)和技術(shù)學(xué)科大數(shù)據(jù)研究同步發(fā)展等特征,美國和中國在大數(shù)據(jù)研究中貢獻(xiàn)突出。全球大數(shù)據(jù)研究形成“理論萌芽階段-技術(shù)探索階段-實(shí)踐應(yīng)用階段”的演進(jìn)路徑,未來大數(shù)據(jù)研究會從理論研究向產(chǎn)業(yè)化研究轉(zhuǎn)變,相關(guān)研究會更加注重解決實(shí)際問題。
大數(shù)據(jù);CiteSpace;研究熱點(diǎn)與研究前沿;演進(jìn)路徑;趨勢預(yù)測
大數(shù)據(jù)對經(jīng)濟(jì)社會的深刻影響與巨大價值已經(jīng)得到全球關(guān)注[1],圍繞大數(shù)據(jù)的研究成為各個學(xué)科領(lǐng)域的熱點(diǎn),相關(guān)文獻(xiàn)激增。但是,大數(shù)據(jù)研究在時間和空間(包括學(xué)科領(lǐng)域和研究力量)上如何分布,研究熱點(diǎn)和研究前沿如何變化,是否遵循特定的演進(jìn)路徑,學(xué)術(shù)界對于這些問題仍缺乏相應(yīng)的研究,而這些問題對于大數(shù)據(jù)的技術(shù)預(yù)見,以及企業(yè)、研究機(jī)構(gòu)的研發(fā)決策、戰(zhàn)略規(guī)劃乃至政府政策制定等都具有參考價值。本文運(yùn)用歷史研究的思路回溯大數(shù)據(jù)領(lǐng)域的相關(guān)文獻(xiàn),通過對文獻(xiàn)進(jìn)行計量對上述問題進(jìn)行回答。
具體而言,運(yùn)用文獻(xiàn)計量學(xué)中的可視化研究方法,以“big data”為檢索主題進(jìn)行精確檢索,從Web of Science數(shù)據(jù)庫(包括SCI-E、SSCI、CPCI-S和CPCI-SSH四個子庫)中獲取文獻(xiàn)數(shù)據(jù),檢索的時間跨度為所有年份,文獻(xiàn)類型選擇“article”,下載數(shù)據(jù)方式為“全記錄與引用的參考文獻(xiàn)”,數(shù)據(jù)格式選擇“純文本”,檢索時間為2016年9月19日。最終得到有關(guān)大數(shù)據(jù)的論文題錄信息共3296條,檢索發(fā)現(xiàn)最早的一篇大數(shù)據(jù)論文發(fā)表于1993年,而數(shù)據(jù)庫實(shí)時更新導(dǎo)致2016年的數(shù)據(jù)仍不完整,但2016年已有的文獻(xiàn)數(shù)據(jù)對研究主題仍有重要作用,因此將2016年列入數(shù)據(jù)來源,本文的研究時間跨度也因此被確定為1993—2016年。對文獻(xiàn)數(shù)據(jù)的計量采用CiteSpace軟件,該軟件主要用于科學(xué)文獻(xiàn)數(shù)據(jù)計量和分析、識別及顯示特定學(xué)科或知識領(lǐng)域在一定時期內(nèi)發(fā)展的動向和趨勢,可探測和分析某個領(lǐng)域研究前沿的變化趨勢及研究前沿與其知識基礎(chǔ)之間、不同研究前沿之間的相互關(guān)系[2],發(fā)現(xiàn)前沿領(lǐng)域的演進(jìn)歷程[3],適合本文的研究主題和研究目的。
1.1 時間和學(xué)科領(lǐng)域分布
按照時間序列對檢索得到的3296篇論文進(jìn)行分析,可以將全球大數(shù)據(jù)研究的歷史演進(jìn)劃分為3個主要階段:第一階段為1993—2010年,大數(shù)據(jù)論文發(fā)文量共19篇,對大數(shù)據(jù)研究處于探索期;第二階段為2010—2013年,大數(shù)據(jù)論文發(fā)文量共325篇,對大數(shù)據(jù)研究進(jìn)入增長期;第三階段為2013—2016年,大數(shù)據(jù)論文發(fā)文量共2952篇,對大數(shù)據(jù)研究進(jìn)入爆發(fā)期,其中2015年的發(fā)文量達(dá)到1288篇,2016年前8個月的發(fā)文量就高達(dá)993篇,這與社會各界對大數(shù)據(jù)的熱烈反應(yīng)是高度一致的。進(jìn)一步觀察發(fā)現(xiàn),全球大數(shù)據(jù)研究具有如下特征:①覆蓋領(lǐng)域廣泛,不僅包括計算機(jī)科學(xué)、工程學(xué)、物理、數(shù)學(xué)、生物學(xué)、化學(xué)等科學(xué)和技術(shù)學(xué)科,也包括經(jīng)濟(jì)、管理、科學(xué)學(xué)、情報等社會科學(xué),共涉及89個學(xué)科(排名前25位的學(xué)科如圖1所示)。其中計算機(jī)科學(xué)對大數(shù)據(jù)研究的貢獻(xiàn)最大,共發(fā)表論文1334篇,占全部論文比例近一半。其次是工程學(xué),共發(fā)表論文609篇;②大數(shù)據(jù)研究在生命科學(xué)中具有廣泛應(yīng)用和關(guān)鍵地位,發(fā)文量前25位的學(xué)科領(lǐng)域中出現(xiàn)了計算生物學(xué)、生物化學(xué)和分子生物學(xué)、生物技術(shù)與應(yīng)用微生物學(xué)、神經(jīng)科學(xué)、醫(yī)療信息學(xué)等多個與生命科學(xué)密切相關(guān)的學(xué)科。但最早提出大數(shù)據(jù)理念的天體物理等學(xué)科[4],對大數(shù)據(jù)研究的貢獻(xiàn)卻不是很顯著;③近年來經(jīng)濟(jì)學(xué)、科學(xué)學(xué)、情報學(xué)與管理學(xué)等人文社會科學(xué)對大數(shù)據(jù)研究的貢獻(xiàn)迅速提高,幾乎與科學(xué)和技術(shù)學(xué)科同步發(fā)展。
圖1 大數(shù)據(jù)研究排名前25位的學(xué)科
1.2 研究力量分布
(1)國家分布。大數(shù)據(jù)研究論文發(fā)文量處于前10位的國家如圖2所示。美國在大數(shù)據(jù)研究中占據(jù)絕對優(yōu)勢,共發(fā)表論文1406篇,占全部論文發(fā)文量的42.64%。其次是中國,共發(fā)表論文753篇,占全部論文發(fā)文量的22.85%。處于第三到第五位的分別是英國、澳大利亞和德國。同時,大數(shù)據(jù)研究力量排名前10位的國家其發(fā)文量變化情況與圖1中大數(shù)據(jù)論文的整體增長趨勢高度吻合(見圖3)。
圖2 大數(shù)據(jù)研究處于前10位的國家
圖3 論文發(fā)文量前10位的國家增長趨勢
(2)期刊分布。大數(shù)據(jù)論文發(fā)文量排在前10位的期刊如表1所示。排名第一位的是醫(yī)學(xué)期刊PLOS ONE,發(fā)表的大數(shù)據(jù)論文共59篇,說明醫(yī)學(xué)健康領(lǐng)域?qū)Υ髷?shù)據(jù)研究高度重視。排名第二的是大數(shù)據(jù)???,發(fā)表論文數(shù)49篇。排名前十的期刊中有8個期刊與計算機(jī)研究有關(guān),反映出計算機(jī)科學(xué)是大數(shù)據(jù)研究的基礎(chǔ)。
(3)機(jī)構(gòu)分布。大數(shù)據(jù)研究處于前10位研究機(jī)構(gòu)見表2。中國科學(xué)院發(fā)文量位居全球第一位,共發(fā)表100篇,占全球發(fā)文總量的2.86%,是前十名中唯一的科研院所。從所屬國家來看,美國和中國的研究力量最強(qiáng),排名前十的研究機(jī)構(gòu)中有八所美國大學(xué)上榜,中國科學(xué)院和清華大學(xué)則占據(jù)了前兩名。
表1 論文發(fā)文數(shù)量前10名的期刊
表2 論文發(fā)文數(shù)量前10名的研究機(jī)構(gòu)
2.1 研究熱點(diǎn)
(1)研究熱點(diǎn)識別。關(guān)鍵詞是作者對文章核心內(nèi)容的精煉與概括,如某一關(guān)鍵詞在其領(lǐng)域內(nèi)反復(fù)出現(xiàn)(即高頻關(guān)鍵詞),則可通過該關(guān)鍵詞所表征的主題反映出當(dāng)前的研究熱點(diǎn)[5]。在CiteSpace軟件界面上選擇時間跨度為1993—2016年,時間區(qū)間為1年,節(jié)點(diǎn)類型選擇“Keyword”,主題詞選擇“None Phrases”,抽取數(shù)據(jù)對象為Top30,算法選擇為None,視圖方式選擇聚類視圖(cluster views),用title terms對各個聚類進(jìn)行標(biāo)簽,共得到27個聚類,如圖4所示。
圖4 關(guān)鍵詞聚類標(biāo)簽視圖
對大數(shù)據(jù)研究文獻(xiàn)的關(guān)鍵詞進(jìn)行合并去重處理,得到被引頻次最高的前20個關(guān)鍵詞,如表3所示。從關(guān)鍵詞聚類分析發(fā)現(xiàn),在技術(shù)方面,大數(shù)據(jù)分析、云計算、機(jī)器學(xué)習(xí)、mapreduce、hadoop等技術(shù)模型是當(dāng)前的研究熱點(diǎn);在應(yīng)用方面,大數(shù)據(jù)被廣泛用在人口社會科學(xué)、生物醫(yī)學(xué)、生態(tài)系統(tǒng)、生物基因等領(lǐng)域。本文著重分析排名前10的聚類。
表3 熱點(diǎn)關(guān)鍵詞統(tǒng)計表
①聚類0:big data(大數(shù)據(jù))。包括big data analytics(大數(shù)據(jù)分析)、social media(社會媒體)等45個關(guān)鍵詞,主要集中在大數(shù)據(jù)的分析、社會媒體應(yīng)用等方面。②聚類1:temporal lobe(顳葉,醫(yī)學(xué)術(shù)語)。包括data compression(大數(shù)據(jù)存儲)、high frequency oscillation(高頻震蕩)等17個關(guān)鍵詞,主要集中在大數(shù)據(jù)存儲、高頻震蕩學(xué)習(xí)等方面。③聚類2:dbgap database(數(shù)據(jù)庫)。包括population science(人口科學(xué))、team science(團(tuán)隊科學(xué))等12個關(guān)鍵詞,主要聚焦在人口科學(xué)、團(tuán)隊科學(xué)等方面。④聚類3:virtual screening(虛擬篩選)。包括co-screen(共同篩選)、qsar model(定量構(gòu)效關(guān)系模型)等11個關(guān)鍵詞,主要側(cè)重篩選編碼RNA、定量構(gòu)效關(guān)系模型等方面。⑤聚類4:communication study(通信研究)。包括critical question(關(guān)鍵問題)、presidential adder(總統(tǒng)加法器)等10個關(guān)鍵詞,側(cè)重關(guān)鍵問題及總統(tǒng)加法器方面。⑥聚類5:international geophysical year(國家地球物理年)。包括big science(大科學(xué))、internationalbiological program(國際生物學(xué)計劃)等10個關(guān)鍵詞,集中在數(shù)據(jù)管理、生態(tài)系統(tǒng)、人類基因組等方面。⑦聚類6:application architecture(應(yīng)用程序體系結(jié)構(gòu))。包括componentsof architecture(體系結(jié)構(gòu)組成)、decision support(決策支持)等9個關(guān)鍵詞,主要集中在數(shù)據(jù)挖掘應(yīng)用架構(gòu)、數(shù)據(jù)挖掘方法等方面。⑧聚類7:radio channel(無線信道)。包括fdd mode(FDD模式)、robust non(非)等8個關(guān)鍵詞,主要應(yīng)用在移動無線通信、無線信道方面。⑨聚類8:molecular population genetics(分子群體遺傳學(xué))。包括dna polymorphism analyze(DNA多態(tài)性分析)、natural selection(自然選擇)等7個關(guān)鍵詞,側(cè)重于生物科學(xué)研究。⑩聚類9:social system(社會系統(tǒng))。包括human factor(人為因素)、spatiotemporal correlation(時空相關(guān)性)等7個關(guān)鍵詞,主要應(yīng)用于社會科學(xué)、經(jīng)濟(jì)學(xué)領(lǐng)域。
(2)研究熱點(diǎn)演進(jìn)。為明確大數(shù)據(jù)研究熱點(diǎn)隨時間變化的情況,在聚類視圖的基礎(chǔ)上,視圖方式選擇時區(qū)視圖(time-zone views),生成關(guān)鍵詞聚類時區(qū)視圖,發(fā)現(xiàn)全球大數(shù)據(jù)研究熱點(diǎn)的演進(jìn)明顯分為三個階段:
①數(shù)據(jù)處理研究(1993—2008年)。該階段的熱點(diǎn)主要是云計算、大數(shù)據(jù)分析、hadoop、mapreduce、模型等技術(shù),尤其是hadoop、mapreduce帶來的并行式和分布式算法,為更高效率的管理和處理海量數(shù)據(jù)帶來了可能,同時云計算模式為大數(shù)據(jù)提供了存儲空間和計算能力,是大數(shù)據(jù)處理技術(shù)基礎(chǔ)形成的階段。②數(shù)據(jù)挖掘研究(2008—2011年)。該階段的熱點(diǎn)主要是云計算、社交網(wǎng)絡(luò)、社交媒體、數(shù)據(jù)分析、數(shù)據(jù)挖掘等。社交媒體、社交網(wǎng)絡(luò)的普及產(chǎn)生了海量數(shù)據(jù),而沉睡的數(shù)據(jù)只是一堆低價值密度的垃圾,通過數(shù)據(jù)挖掘才能發(fā)現(xiàn)和創(chuàng)造其潛在的價值[6]。③數(shù)據(jù)應(yīng)用研究(2011—2016年)。該階段的熱點(diǎn)主要是大數(shù)據(jù)應(yīng)用、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等。與傳統(tǒng)數(shù)據(jù)分析相比,大數(shù)據(jù)分析的核心是從類型多樣、動態(tài)產(chǎn)生的海量數(shù)據(jù)中挖掘信息和提取知識并付諸應(yīng)用,從而創(chuàng)造價值,成為當(dāng)前大數(shù)據(jù)研究的重點(diǎn)。
2.2 研究前沿
突現(xiàn)詞(burst terms)能準(zhǔn)確反映某個領(lǐng)域的研究前沿,適合探測某個新興領(lǐng)域的趨勢和突然變化[7]。在CiteSpace軟件界面上,選擇主題詞類型burst terms,gamma值設(shè)為0.2,視圖方式選擇時區(qū)視圖(time-zone views),其他參數(shù)設(shè)置不變,運(yùn)行軟件,生成突現(xiàn)詞時區(qū)視圖(見圖5),從中得到全球大數(shù)據(jù)研究前沿的演變過程。
圖5 突現(xiàn)詞時區(qū)視圖
①第一階段(2008年以前)。data mining(數(shù)據(jù)挖掘)、application architecture(應(yīng)用程序體系結(jié)構(gòu))、components of architecture(建筑構(gòu)件)、application(應(yīng)用)、anomaly(異常)、data analysis(數(shù)據(jù)分析)、adaptive optics(自適應(yīng)光學(xué))、differential reduction(微分還原)、analytic signal(解析信號)這9個關(guān)鍵詞的突變率較高,說明數(shù)據(jù)挖掘、數(shù)據(jù)分析、應(yīng)用程序體系結(jié)構(gòu)等時該階段的研究前沿。②第二階段(2008—2011年)。data compression(數(shù)據(jù)壓縮)、cyclic redundancy code(循環(huán)冗雜碼)、data encryption(數(shù)據(jù)加密)、eeg(腦電圖)、development planning(發(fā)展規(guī)劃)這5個關(guān)鍵詞的突變率較高,表明與大數(shù)據(jù)有關(guān)的數(shù)據(jù)壓縮、數(shù)據(jù)加密、循環(huán)冗雜碼的處理成為此階段的研究前沿。③第三階段(2011—2016年)。bigdata(大數(shù)據(jù))、performance(行為)、mapreduce(分布式計算)、network(網(wǎng)絡(luò))、algorithm(算法)、model(模型)等7個關(guān)鍵詞的突變率最高,尤其performance(行為)是突變率最高的關(guān)鍵詞,說明近年來大數(shù)據(jù)行為管理研究得到了高度重視,可能是未來幾年的研究前沿。
一個研究領(lǐng)域的知識基礎(chǔ)會隨時間的變化而演進(jìn),演進(jìn)過程中必然產(chǎn)生導(dǎo)致研究演進(jìn)的關(guān)鍵節(jié)點(diǎn)文獻(xiàn),探測研究演進(jìn)中的關(guān)鍵節(jié)點(diǎn)文獻(xiàn),可發(fā)現(xiàn)該領(lǐng)域核心理論的演進(jìn)路徑[8]。關(guān)鍵節(jié)點(diǎn)文獻(xiàn)一般指中心度或共被引頻次較高的文獻(xiàn),表示文獻(xiàn)作者對某個領(lǐng)域的研究主題、方法有著重要新理論或重大理論創(chuàng)新[9]。在CiteSpace軟件中節(jié)點(diǎn)類型選擇“Cited Reference”,其他參數(shù)設(shè)置不變,視圖方式選為時區(qū)視圖(time-zone views),得到大數(shù)據(jù)研究文獻(xiàn)共被引時區(qū)視圖,圖譜中共生成252個節(jié)點(diǎn),591條連線(見圖6)。從圖6中選取共引頻次較高的10篇大數(shù)據(jù)關(guān)鍵節(jié)點(diǎn)文獻(xiàn),如表4所示。
圖6 研究文獻(xiàn)共被引時區(qū)視圖
序號共引頻次發(fā)表年份關(guān)鍵節(jié)點(diǎn)文獻(xiàn)12132008MapReduce:simplifieddataprocessingonlargeclusters2532008Bigdata:Thefutureofbiocuration3492009Hadoop:TheDefinitiveGuide4482009Detectinginfluenzaepidemicsusingsearchenginequerydata5562009Lifeinthenetwork:thecomingageofcomputationalsocialscience6992011Bigdata:Thenextfrontierforinnovation,competition,andproductivity71042012Criticalquestionsforbigdata:Provocationforacultural,technological,andscholarlyphenomenon8702012BusinessIntelligenceandAnalytics:Frombigdatatobigimpact91082013BigData:ARevolutionThatWillTransformHowWeLive,WorkandThink10542014TheparableofGoogleFlu:trapsinbigdataanalysis
通過對關(guān)鍵節(jié)點(diǎn)文獻(xiàn)的分析,可將全球大數(shù)據(jù)研究的演進(jìn)路徑歸納如下:
①理論萌芽階段(1993—2008年)。此階段大數(shù)據(jù)的理論基礎(chǔ)較為缺乏,學(xué)術(shù)界研究的主要問題是大數(shù)據(jù)的核心技術(shù)和應(yīng)用前景。如2008年Google公司的Dean發(fā)表了一篇關(guān)于MapReduce算法的論文,該文的共引頻次高達(dá)312次。2008年Howe在Nature大數(shù)據(jù)??习l(fā)表的論文提出“生物文獻(xiàn)數(shù)據(jù)結(jié)構(gòu)化”概念,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),提高生物大數(shù)據(jù)信息的獲取率和利用率。②技術(shù)探索階段(2009—2011年)。此階段隨著對大數(shù)據(jù)核心技術(shù)的深入探索,加入大數(shù)據(jù)研究的學(xué)者和機(jī)構(gòu)不斷增加,研究重點(diǎn)逐漸從技術(shù)層面向應(yīng)用層面擴(kuò)展。如2009年White介紹了開源分布式架構(gòu)Hadoop的核心算法,它能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理并構(gòu)建一種可靠、高效、可伸縮的計算系統(tǒng)。2009年Ginsberg在Nature上發(fā)表論文,采用大數(shù)據(jù)搜索引擎查詢數(shù)據(jù)并對流行性流感活動進(jìn)行檢測。2009年Lazer揭示了在社會科學(xué)基礎(chǔ)上大數(shù)據(jù)的潛在價值及在未來發(fā)展中的障礙。2011年全球麥肯錫研究院(MGI)發(fā)布研究報告Big data:The next frontier for innovation,competition,and productivity,從商業(yè)和經(jīng)濟(jì)角度揭示大數(shù)據(jù)發(fā)展的現(xiàn)狀和潛力,并為生物醫(yī)療、政府管理部門、銷售行業(yè)、制造行業(yè)和地理信息科學(xué)等應(yīng)用領(lǐng)域提出了應(yīng)對大數(shù)據(jù)時代的策略。③實(shí)踐應(yīng)用階段(2012—2016年)。此階段全球大數(shù)據(jù)研究的重點(diǎn)主要是大數(shù)據(jù)理念、云計算,及大數(shù)據(jù)在社會管理、信息管理的應(yīng)用等,呈現(xiàn)出研究和應(yīng)用相互交融的態(tài)勢。如2012年Boyd在Information,communication&society上發(fā)表論文,從文化、科技、學(xué)術(shù)、分析及預(yù)測六個方面,對大數(shù)據(jù)領(lǐng)域的未來發(fā)展進(jìn)行深入探索。2012年Chen在MIS QUARTERLY上發(fā)表Business Intelligence and Analytics:From big data to big impact的論文,為商務(wù)智能分析領(lǐng)域從業(yè)者和研究人員提供了解決數(shù)據(jù)相關(guān)問題的框架,并基于Web 2.0對商務(wù)智能分析的演進(jìn)、應(yīng)用和新興的研究領(lǐng)域進(jìn)行大數(shù)據(jù)分析。2013年,Viktor在Big Data:A Revolution That Will Transform How We Live,Work and Think中提出大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革,并明確指出大數(shù)據(jù)時代的最大轉(zhuǎn)變是由相關(guān)關(guān)系取代因果關(guān)系。2014年Lazer在Science上發(fā)表論文提出對于大數(shù)據(jù)的研究不應(yīng)只專注于“大數(shù)據(jù)革命”,還應(yīng)專注于所有數(shù)據(jù)革命。
本文運(yùn)用科學(xué)計量學(xué)理論,借助CiteSpace軟件對WOS中收錄的大數(shù)據(jù)研究論文進(jìn)行分析,得到如下結(jié)論:①全球大數(shù)據(jù)研究可以劃分為探索期、增長期和爆發(fā)期三個主要階段,并形成研究覆蓋領(lǐng)域廣泛、生命科學(xué)相關(guān)的大數(shù)據(jù)研究活躍,以及人文社會科學(xué)的大數(shù)據(jù)研究與科學(xué)和技術(shù)學(xué)科的大數(shù)據(jù)研究同步發(fā)展等特征;②美國和中國在全球大數(shù)據(jù)研究力量中占據(jù)優(yōu)勢,PLOS ONE、大數(shù)據(jù)??葘W(xué)術(shù)期刊是全球大數(shù)據(jù)研究的主要陣地,而中國科學(xué)院在全球大數(shù)據(jù)研究機(jī)構(gòu)中位居第一位;③全球大數(shù)據(jù)研究的熱點(diǎn)明顯形成了“大數(shù)據(jù)處理技術(shù)-大數(shù)據(jù)挖掘技術(shù)-大數(shù)據(jù)應(yīng)用實(shí)踐”的演進(jìn)路徑,研究前沿則集中在數(shù)據(jù)挖掘、系統(tǒng)模型的構(gòu)建及數(shù)據(jù)管理方面,從大數(shù)據(jù)的理論層面向應(yīng)用層面轉(zhuǎn)變將是未來大數(shù)據(jù)研究的主要趨勢;④全球大數(shù)據(jù)研究具有較為明確的演進(jìn)路徑,經(jīng)歷了“理論萌芽階段-技術(shù)探索階段-實(shí)踐應(yīng)用階段”的過程,未來大數(shù)據(jù)研究會從理論研究向產(chǎn)業(yè)化研究轉(zhuǎn)變,對大數(shù)據(jù)的相關(guān)研究會更加注重解決實(shí)際問題。
[1]Mckinsey Global Institude.Big data:the next frontier for innovation,competition and productivity[R].May,2011.
[2]CHAOMEI C.Searching for intellectual turning points:progressive knowledge domain visualization[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(Suppl.1):5303-5310.
[3]CHEN C.CiteSpaceⅡ:Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American society for information science and technology,2005,57(3):359-377.
[4]維克托·邁爾—舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代——生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
[5]趙蓉英,許麗敏.文獻(xiàn)計量學(xué)發(fā)展演進(jìn)與研究前沿的知識圖譜探析[J].中國圖書館學(xué)報,2010,36(5):60-68.
[6]李天柱,馬佳,呂健露,侯錫林.大數(shù)據(jù)價值孵化機(jī)制研究[J].科學(xué)學(xué)研究,2016,34(3):321-329.
[7]陳超美.CiteSpaceⅡ:科學(xué)文獻(xiàn)中新趨勢與新動態(tài)的識別與可視化[J].陳悅,等譯.情報學(xué)報,2009,28(3):401-421.
[8]劉則淵,等.科學(xué)知識圖譜:方法與應(yīng)用[M].北京:人民出版社,2008.
[9]MOED HF.Citation analysis in research evolution[M].Dordrecht:Springer,2005.
(責(zé)任編輯 劉傳忠)
更正說明
本刊于2017年第5期刊登的文章《物聯(lián)網(wǎng)產(chǎn)業(yè)開放式創(chuàng)新的跨組織知識流動》中,課題基金號應(yīng)為:國家自然科學(xué)基金面上項目(71672095),南開大學(xué)亞洲研究中心資助課題(AS1519)。
特此更正。
《中國科技論壇》編輯部
Historic Evolution of Global Big Data Research:1993—2016
Wang Qian,Li Tianzhu,Liu Xiaoqin
(School of Business Administration,University of Science and Technology Liaoning,Anshan 114051,China)
This paper carried out the whole sample analysis of 3296 papers from the Web of Science by CiteSpace.It found that the research history of the global big data was divided into exploration period,increase period and eruptive period.The researches showed the characteristics such as a wide range of covering subjects,animate big data research of life science,the simultaneous development of big data research on humanities and social sciences and science and technology.The US and China contributed prominently in the big data research.The global data research formed the evolving path of“the theory embryonic stage—the technology exploratory stage—the practical application stage”.And it would change from theory to industry in the future and be paid more attention to solve practical problems.
Big data;CiteSpace;Research hotspots and research frontiers;Evolution path;Trend prediction
國家自然科學(xué)基金項目(71372121、71472080),遼寧省自然科學(xué)基金項目(2015020067),遼寧省社會科學(xué)規(guī)劃基金項目(L15BGL004),遼寧省教育廳科技項目(2016TSZD05)。
2016-10-31 作者簡介:王倩(1992-),女,遼寧鞍山人。遼寧科技大學(xué)工商管理學(xué)院碩士研究生;研究方向:新興技術(shù)管理。
F062.3
A