張爽 劉非凡 羅雙玲 夏昊翔,3
1. 大連理工大學(xué)系統(tǒng)工程研究所 大連 116024;
2. 大連海事大學(xué)航運經(jīng)濟與管理學(xué)院 大連 116026;
3. 大連理工大學(xué)大數(shù)據(jù)與智能決策研究中心 大連 116024
區(qū)塊鏈技術(shù)起源于化名為“中本聰”的黑客于2008年發(fā)表的文章《比特幣:一種點對點的電子現(xiàn)金系統(tǒng)》。作為比特幣的底層技術(shù),區(qū)塊鏈正以其去中心化、不可篡改的特性,重構(gòu)各行各業(yè)的體系架構(gòu),具有顛覆性的應(yīng)用價值。目前,全球都在加快區(qū)塊鏈技術(shù)的發(fā)展和“區(qū)塊鏈+”產(chǎn)業(yè)的布局。2016年中國國務(wù)院將區(qū)塊鏈作為戰(zhàn)略前沿技術(shù)寫入《“十三五”國家信息化規(guī)劃》中,此后從工信部、商業(yè)部和網(wǎng)信辦等各部門到北京、上海和浙江等各地方也陸續(xù)出臺一系列規(guī)劃和意見以推進區(qū)塊鏈創(chuàng)新和應(yīng)用。同年,韓國央行在報告中提出鼓勵探索區(qū)塊鏈技術(shù),并且多家金融和技術(shù)公司共同成立了區(qū)塊鏈協(xié)會。面對世界各國搶占“發(fā)展制高點”的緊迫形勢,學(xué)術(shù)界對區(qū)塊鏈展開了如火如荼的研究。近年來,區(qū)塊鏈研究呈現(xiàn)爆發(fā)增長態(tài)勢,其核心技術(shù)和應(yīng)用都得到了飛速發(fā)展。然而相較于其他技術(shù),區(qū)塊鏈的相關(guān)研究遍布于計算機、通信、金融、管理等多個領(lǐng)域。且目前也缺乏以區(qū)塊鏈這一跨學(xué)科復(fù)合型前沿技術(shù)研究為主的典型核心期刊。這使得學(xué)者難以全面準(zhǔn)確地把握區(qū)塊鏈的研究現(xiàn)狀和發(fā)展歷程,也為創(chuàng)新戰(zhàn)略的制定和區(qū)塊鏈的應(yīng)用普及造成了一定的困難。
基于此,近年來國內(nèi)外學(xué)者紛紛對區(qū)塊鏈技術(shù)進行了綜述性研究和探討。劉碩等[1]詳盡介紹了區(qū)塊鏈的模型、核心技術(shù)、應(yīng)用平臺以及典型公司,并且對比了其和傳統(tǒng)技術(shù)系統(tǒng)的差異,對我國區(qū)塊鏈技術(shù)的發(fā)展提出了優(yōu)化研發(fā)環(huán)境、制定行業(yè)標(biāo)準(zhǔn)和開展應(yīng)用試點等政策建議。朱巖等[2],隆蘇研等[3],袁勇和王飛躍[4]概覽了區(qū)塊鏈的核心機制和算法并且討論了其未來發(fā)展方向和當(dāng)前面臨的挑戰(zhàn)。除了梳理區(qū)塊鏈技術(shù)的架構(gòu)、概念等基礎(chǔ)知識,學(xué)者還分析了區(qū)塊鏈技術(shù)的應(yīng)用現(xiàn)狀。Casino等[5]將區(qū)塊鏈的應(yīng)用分為金融、身份驗證、政府管理、物聯(lián)網(wǎng)、健康管理、工業(yè)應(yīng)用、教育和數(shù)據(jù)管理八方面,并且闡述了各方面的研究現(xiàn)狀和局限。也有學(xué)者探討了區(qū)塊鏈技術(shù)在其研究領(lǐng)域的應(yīng)用進展,包括信息安全[6]、能源交易[7]、教育[8]等領(lǐng)域。比如,徐嘉輝和馬立新[9]總結(jié)了現(xiàn)有基于區(qū)塊鏈的分布式電力交易系統(tǒng)的優(yōu)勢和不足。然而,從上述依賴學(xué)者對區(qū)塊鏈認(rèn)識的綜述研究可獲知其發(fā)展的局部狀況,即理論技術(shù)發(fā)展或技術(shù)在某個具體領(lǐng)域的應(yīng)用模式,而無法把握區(qū)塊鏈的整體研究圖景和發(fā)展過程。于是,有學(xué)者基于專利或論文數(shù)據(jù),運用文獻計量學(xué)方法揭示區(qū)塊鏈的研究現(xiàn)狀。Firdaus等[10]通過分析從Scopus數(shù)據(jù)庫獲得的2013-2018年的1000篇區(qū)塊鏈文獻,發(fā)現(xiàn)區(qū)塊鏈技術(shù)能夠解決物聯(lián)網(wǎng)的安全問題,且逐漸應(yīng)用于健康管理和數(shù)據(jù)分析領(lǐng)域;在當(dāng)前區(qū)塊鏈研究中,中國、美國具有較高的論文產(chǎn)出量,而新加坡和瑞士的論文影響力較高。Ante[11]利用從商業(yè)和經(jīng)濟領(lǐng)域收集到的區(qū)塊鏈文獻,通過耦合引文分析識別出了市場效率、資產(chǎn)定價、匿名交易等五個發(fā)展趨勢。雷孝平等[12]通過統(tǒng)計論文和專利數(shù)量發(fā)現(xiàn)了區(qū)塊鏈領(lǐng)域的主要研發(fā)國家、研究機構(gòu)和研究人員,根據(jù)關(guān)鍵詞和專利分類代碼頻次揭示了研發(fā)熱點和應(yīng)用方向。王發(fā)明和朱美娟[13]以CNKI數(shù)據(jù)庫檢索出的432篇區(qū)塊鏈相關(guān)文獻,使用CiteSpace工具對其進行關(guān)鍵詞共現(xiàn)分析和突發(fā)性檢測,追蹤了我國區(qū)塊鏈研究的熱點和前沿問題。然而這些研究大多以傳統(tǒng)的文獻計量研究為主,聚焦于文獻(或?qū)@┑膰曳植肌C構(gòu)分布、學(xué)科分布以及影響力分析[14-16],以共詞聚類法探究研究熱點和趨勢[17,18]。而且,國內(nèi)大部分研究局限于使用CiteSpcace工具,基于百篇文獻的小規(guī)模數(shù)據(jù)集(或僅利用CNKI數(shù)據(jù))分析研究領(lǐng)域[19-21],而缺少基于較大規(guī)模的區(qū)塊鏈相關(guān)學(xué)術(shù)數(shù)據(jù)的研究主題發(fā)現(xiàn)與領(lǐng)域分析。把握區(qū)塊鏈的發(fā)展趨勢,理解其發(fā)展特征,有助于科技管理者制定發(fā)展政策、理解其他新興領(lǐng)域的發(fā)展模式。然而,當(dāng)前鮮有研究探究領(lǐng)域的發(fā)展態(tài)勢。
因此,本研究擬利用較為完整的區(qū)塊鏈研究的學(xué)術(shù)數(shù)據(jù),借助新興的機器學(xué)習(xí)算法繪制領(lǐng)域地圖,實現(xiàn)從文獻語義層面探究整體研究地貌。并且基于領(lǐng)域語義地圖中文獻聚集性差異,探測區(qū)塊鏈研究的主題結(jié)構(gòu)和發(fā)展特點。本研究所用方法突破了傳統(tǒng)的共詞分析在捕獲文獻語義關(guān)系的局限。相較于共詞網(wǎng)絡(luò)存在邊稠密性的問題,領(lǐng)域語義地圖更加便于觀察主題結(jié)構(gòu)的動態(tài)變化,可直觀地獲知區(qū)塊鏈研究的發(fā)展趨勢。
以Web of Science核心數(shù)據(jù)庫為數(shù)據(jù)源,設(shè)置檢索式TS=(“blockchain” or “block chain” or “block-chain”)、檢索時間跨度為2008-2020年,一共檢索到6,572篇文獻。在化學(xué)領(lǐng)域,根據(jù)以上關(guān)鍵詞能檢出與區(qū)塊鏈無關(guān)其他專門文獻,因此,根據(jù)文獻的期刊來源,去除數(shù)據(jù)集中屬于化學(xué)領(lǐng)域(如高分子、聚合物)的文獻,最終得到5,951篇文獻及其標(biāo)題、摘要、關(guān)鍵詞和年份等題錄信息。盡管所得數(shù)據(jù)集未包含區(qū)塊鏈領(lǐng)域的所有文獻,但是檢索方式和數(shù)據(jù)源保證所得數(shù)據(jù)集包含了與區(qū)塊鏈研究直接相關(guān)的、學(xué)術(shù)質(zhì)量高的科學(xué)文獻數(shù)據(jù),具有較好的覆蓋率與代表性,可用于區(qū)塊鏈研究的文獻計量分析。從圖1的歷年文獻數(shù)量增長態(tài)勢,可以看出區(qū)塊鏈研究目前正處于快速發(fā)展的階段。表1列舉了30個高頻論文關(guān)鍵詞,從中可以得知當(dāng)前研究熱點,如“Smart Contract”(智能合約),“Bitcoin”(比特幣),“Internet Of Things”(物聯(lián)網(wǎng))和“Distributed Ledger”(分布式賬本)等。需要說明的是,為了使結(jié)果更加清晰,在后續(xù)詞云圖分析中去除了高頻詞 “Blockchain”。
為實現(xiàn)從文本語義關(guān)聯(lián)的角度探測區(qū)塊鏈研究領(lǐng)域的發(fā)展過程,本研究借助文檔嵌入表示學(xué)習(xí)和流形學(xué)習(xí)算法,提出了一種新的領(lǐng)域語義地圖構(gòu)建方式。從而,通過繪制區(qū)塊鏈研究的領(lǐng)域地圖可視化其研究地貌,根據(jù)文獻分布密度識別研究主題,結(jié)合文獻時間標(biāo)簽追溯其發(fā)展過程。具體方法流程主要包括文檔向量化、領(lǐng)域可視化、詞云圖映射研究內(nèi)容和累積地圖演化分析等。
圖1 歷年文獻數(shù)量
表1 區(qū)塊鏈研究的高頻關(guān)鍵詞(top30)
(1)首先利用Doc2Vec捕獲區(qū)塊鏈科研文獻的潛在語義特征。Doc2Vec作為一種新興的文檔嵌入表示學(xué)習(xí)算法,基于深度學(xué)習(xí)框架能夠自動學(xué)習(xí)文獻的詞頻、語序和語義信息,將其表示為低維實值向量,有效地解決了語義鴻溝和計算復(fù)雜度問題[22]。近年來在諸如性別偏見分析[23]、文化演化[24]等復(fù)雜的文本分析任務(wù)中都展現(xiàn)出了強大的潛在特征學(xué)習(xí)能力。
在獲得文獻的標(biāo)題和摘要后,本研究首先對其進行預(yù)處理,具體步驟包括:合并標(biāo)題和摘要、轉(zhuǎn)換大小寫、移除符號標(biāo)點和數(shù)字、剔除學(xué)術(shù)停用詞和版權(quán)聲明。接著采用PV-DM框架訓(xùn)練Doc2Vec模型。PV-DM方法的核心思想是根據(jù)某個單詞的上下文可以預(yù)測這個單詞[22]。在Doc2Vec中,每篇文檔被標(biāo)識為一個向量。在訓(xùn)練某個文檔向量時,用滑動窗口的方法產(chǎn)生局部訓(xùn)練集,選取某個詞當(dāng)預(yù)測詞,訓(xùn)練集中的其他詞以及文檔向量作為輸入詞,然后依據(jù)預(yù)測結(jié)果來調(diào)整輸入向量。隨著訓(xùn)練的進行,文檔向量不斷被調(diào)整。接著依據(jù)自相似性原則判定模型是否收斂以及調(diào)整模型參數(shù),即向模型輸入某一文獻的語料,根據(jù)模型輸出的文檔向量計算與該文獻最相似的文獻是否是它本身,并統(tǒng)計這種情況的占比。最終,本研究通過30輪訓(xùn)練,取得98%的自相似度,獲得了語料庫中每篇文獻的100維語義向量。
(2)在高維文檔向量空間中,研究內(nèi)容相近的文獻,其語義向量會彼此相近形成聚類,而研究內(nèi)容不同的則相距較遠(yuǎn)。也就是說,高維文檔語義向量間拓?fù)浣Y(jié)構(gòu)對應(yīng)區(qū)塊鏈相關(guān)研究的知識結(jié)構(gòu)。所以本研究將文獻向量刻畫出的高維知識結(jié)構(gòu)映射為二維語義地圖進行可視化。UMAP是一種基于黎曼幾何理論的流形學(xué)習(xí)算法,它依據(jù)“高維空間相近的點在低維空間中也相近”的假設(shè),將學(xué)習(xí)到的高維數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)進行低維映射[25]。不同于tSNE等其他算法,UMAP的理論架構(gòu)[25]以及近來的實證分析[26]都表明,UMAP具有同時保留數(shù)據(jù)集全局和局部拓?fù)浣Y(jié)構(gòu)的能力。
本研究首先運用UMAP算法將100維文獻語義向量轉(zhuǎn)化為二維坐標(biāo)。運行UMAP算法時,為了度量出各個文獻向量在不同維度上的差異,采用余弦相似度度量文獻向量在高維空間中的距離。UMAP算法以鄰居數(shù)量和最小距離兩個參數(shù)實現(xiàn)對數(shù)據(jù)中局部和全局結(jié)構(gòu)的學(xué)習(xí),本研究參考UMAP開發(fā)者的測試結(jié)果[25,27],將其分別設(shè)置為15和0.1。接著本研究通過計算文獻散點的高斯核密度,并以等高線刻畫文獻在二維語義空間中分布的聚散性,這樣所構(gòu)建出的領(lǐng)域語義地圖即可表征科研數(shù)據(jù)集的知識空間。地圖上特定坐標(biāo)區(qū)域具有特定的語義信息,文獻在地圖上的臨近性反映了其語義層面上知識的相似或相近性。同時,地圖上等高線閉環(huán)又刻畫出了文獻分布的異質(zhì)性,反映了主題結(jié)構(gòu),即閉環(huán)內(nèi)區(qū)域的文獻密度明顯不同于周圍區(qū)域,且密度的高低表明該區(qū)域是研究熱點或是值得深探的研究“藍(lán)?!?。不同于常見基于密度的聚類算法以文獻聚集性最高的區(qū)域為聚類中心劃分主題,本研究依據(jù)文獻聚集的局部異質(zhì)性,通過提取等高線閉環(huán)實現(xiàn)主題識別,即可獲得不同研究熱度的主題?;陬I(lǐng)域地圖的主題劃分可根據(jù)研究目的靈活處理:若了解領(lǐng)域的主要研究內(nèi)容,可按照密度值提取低密度、區(qū)域覆蓋范圍大的等高線作為主題劃分結(jié)果;若探究領(lǐng)域內(nèi)細(xì)粒度的研究主題,可按照等高線閉環(huán)數(shù)量最大化、同時保證一定的文獻覆蓋率的原則進行提取。通過提取等高線內(nèi)文獻的關(guān)鍵詞繪制詞云圖,可獲知該區(qū)域所代表的主要研究內(nèi)容。
(3)在獲得數(shù)據(jù)集的文檔向量后,根據(jù)文獻發(fā)表年份,使用某一年及以前的文獻利用所提方法繪制歷年的累積領(lǐng)域地圖。領(lǐng)域地圖上每塊區(qū)域都具有特定的語義信息,由于文獻向量是同時訓(xùn)練獲得的,所以歷年地圖上相同坐標(biāo)區(qū)域表征的語義是相同的。這意味著通過對比歷年地圖間的地貌差異,可獲悉領(lǐng)域演化過程中的研究范圍的擴增以及主題涌現(xiàn)等現(xiàn)象。
本研究構(gòu)建了領(lǐng)域語義地圖可視化“區(qū)塊鏈”研究概貌,以期能對當(dāng)前主要研究內(nèi)容、研究重點,主題的發(fā)展態(tài)勢和主題間的關(guān)聯(lián)性有更直觀的認(rèn)識。圖2是區(qū)塊鏈領(lǐng)域語義地圖,其中,圖2(a)為文獻分布熱力圖。依據(jù)前述方法可知,該領(lǐng)域地圖是區(qū)塊鏈相關(guān)研究的知識結(jié)構(gòu)在低維空間中的投影,地圖鄰近性映射出各研究主題間的語義相關(guān)性,而地圖上坐標(biāo)區(qū)域顏色的深淺以及等高線的數(shù)值表明了文獻聚集程度,也反映了該區(qū)域被探索的程度。整體來看,該領(lǐng)域地圖周圍分散五個高文獻密度的“山峰”,中央形成密度較低的“平臺”,且“山峰”之間稀疏地分布少量的文獻。這表明區(qū)塊鏈的相關(guān)研究已形成了多個研究主題,而跨主題、交叉主題的研究仍然較少。
圖2(a)中等高線刻畫了閉環(huán)內(nèi)文獻分布與周圍區(qū)域文獻分布的異質(zhì)性,反映了區(qū)塊鏈相關(guān)研究的主題結(jié)構(gòu),也刻畫出了文獻聚類結(jié)果。為了獲得細(xì)粒度的研究主題,本研究依據(jù)最大化主題數(shù)量同時保證較高文獻覆蓋率的原則,主要提取了6個文獻密度顯著高于周圍區(qū)域的和1個密度明顯低于周圍的區(qū)域代表主要研究主題。并且借助這7個區(qū)域內(nèi)文獻的關(guān)鍵詞和其TFIDF值繪制詞云圖表征研究內(nèi)容(如圖2(b))。根據(jù)詞云圖可以看出該領(lǐng)域的研究主要分為兩部分,地圖左側(cè)的四個主題主要關(guān)于區(qū)塊鏈的應(yīng)用研究,地圖右側(cè)則是區(qū)塊鏈的基礎(chǔ)技術(shù)研究。除此之外,可以看到地圖(圖2(a))左側(cè)的文獻核密度大于地圖右側(cè)的三個主題,這意味著目前對區(qū)塊鏈的研究并不平衡。整體上來看,當(dāng)前學(xué)者側(cè)重于區(qū)塊鏈技術(shù)應(yīng)用的研究,而對基礎(chǔ)技術(shù)的發(fā)展關(guān)注較弱。
區(qū)塊鏈基礎(chǔ)架構(gòu)主要由應(yīng)用執(zhí)行層、共識層、網(wǎng)絡(luò)層、數(shù)據(jù)層和硬件設(shè)施層組成。分析發(fā)現(xiàn)目前大多研究聚焦于共識層的共識機制(Consensus)、網(wǎng)絡(luò)層的P2P網(wǎng)絡(luò)(Peer to Peer Network)和應(yīng)用層的智能合約(Smart Contract)等方面。由圖2中文獻分布可知,相較于其他底層技術(shù),當(dāng)前對共識機制的研究較多。共識機制是用以決定如何使異步網(wǎng)絡(luò)中的所有節(jié)點達成共識以增添新的節(jié)點,它是區(qū)塊鏈技術(shù)的核心。當(dāng)前的共識算法主要包括兩類,一類是證明類共識,它需要網(wǎng)絡(luò)中的節(jié)點證明自己比其他節(jié)點更有“資格”增加節(jié)點,常見的算法有工作證明(Proof of Work)、股權(quán)證明(Proof of Stake)以及其他基于PoW和PoS的改進或混合算法。另一類是選舉類共識,即每一輪節(jié)點通過投票確定記賬節(jié)點,該類主流的算法包括有實用拜占庭容錯算法(Byzantine Fault Tolerance)和Raft共識算法。其下方出現(xiàn)了文獻聚集密度低于周圍區(qū)域的特定區(qū)域,通過分析其詞云圖中的高頻詞,如Peer to Peer Network、Client-Server,發(fā)現(xiàn)該區(qū)域是網(wǎng)絡(luò)層的相關(guān)研究。圖2中該主題下文獻核密度較低,這表明當(dāng)前對該主題的探索較淺。網(wǎng)絡(luò)層主要負(fù)責(zé)內(nèi)部節(jié)點間的通信,區(qū)塊鏈采用P2P網(wǎng)絡(luò)(Peer to Peer Network)作為網(wǎng)絡(luò)層的通信協(xié)議,通過令所有節(jié)點共同負(fù)責(zé)網(wǎng)絡(luò)中通信,達到了分布式、去中心化的目的。相鄰的應(yīng)用執(zhí)行層的研究也相對較少,主要涉及各種腳本、交互接口、分布式程序及智能合約,是區(qū)塊鏈可編程的基礎(chǔ)研究。以太坊(Ethereum)是受關(guān)注和應(yīng)用較多的開源底層平臺,它支持由 Solidity語言編寫的智能合約的執(zhí)行。
圖2 區(qū)塊鏈領(lǐng)域地圖
目前區(qū)塊鏈技術(shù)主要應(yīng)用于商業(yè)工業(yè)、能源貿(mào)易、物聯(lián)網(wǎng)和醫(yī)療健康等方面。在所構(gòu)建的領(lǐng)域語義地圖中(圖2),商業(yè)工業(yè)主題的文獻分布最多且“區(qū)域面積”較大,這意味著它是區(qū)塊鏈應(yīng)用的熱門領(lǐng)域,且其研究范圍十分廣泛。通過分析詞云圖發(fā)現(xiàn),商業(yè)工業(yè)主題主要包括區(qū)塊鏈技術(shù)在金融科技(Fintech)、供應(yīng)鏈管理(Supply Chain)和治理(Governance)等方面的應(yīng)用研究。相較而言,能源貿(mào)易方面的研究比較集中,并且和其他應(yīng)用主題的語義相似性較弱。在能源交易(Energy Trading)方面,區(qū)塊鏈技術(shù)由其去中心化和不可纂改的特性,改變了能源(如電力)的供給輸配、交易方式和消費模式,提高了能源電力系統(tǒng)的效率和安全性。如引入?yún)^(qū)塊鏈技術(shù)的微電網(wǎng)(Microgrids)、智能電網(wǎng)系統(tǒng)(Smart Grid)可實時供售電、實現(xiàn)了自我控制。區(qū)塊鏈與物聯(lián)網(wǎng)的融合應(yīng)用也是當(dāng)前關(guān)注的焦點。如,使用區(qū)塊鏈技術(shù)構(gòu)建的分布式物聯(lián)網(wǎng)網(wǎng)絡(luò)和平臺具有較高的擴展性,區(qū)塊鏈邊緣云(Edge Computing)為物聯(lián)網(wǎng)設(shè)備提供了安全且高效的數(shù)據(jù)交換服務(wù)。在醫(yī)療健康(Healthcare)領(lǐng)域,區(qū)塊鏈技術(shù)和智能合約也得到了廣泛應(yīng)用。如,將醫(yī)療數(shù)據(jù)(Medical Data)存儲于區(qū)塊鏈上便于互操與共享,基于智能合約的加密訪問機制加強了對健康檔案(Personal Health Record)的隱私保護。在地圖中,物聯(lián)網(wǎng)、醫(yī)療和商業(yè)工業(yè)應(yīng)用主題之間的也分布了較高密度的文獻,這意味著當(dāng)前研究中存在較多的區(qū)塊鏈技術(shù)的跨行業(yè)場景應(yīng)用研究,尤其是跨物聯(lián)網(wǎng)和醫(yī)療領(lǐng)域的研究。融合區(qū)塊鏈、物聯(lián)網(wǎng)的智慧醫(yī)療也是近來醫(yī)療體系發(fā)展的主要方向。
為了了解區(qū)塊鏈的發(fā)展態(tài)勢以及當(dāng)前研究圖景的形成過程,本研究從關(guān)鍵詞和領(lǐng)域語義地圖兩個角度分析了區(qū)塊鏈研究在2014-2020年間演化過程。
考慮到數(shù)據(jù)集中2014年之前的文獻較少,2020年只有部分?jǐn)?shù)據(jù),所以在本小節(jié)以及后續(xù)的演化研究中,將分別合并2014年前的文獻,2019年和2020年的數(shù)據(jù)進行分析。圖3為2014-2020年每年發(fā)表文獻的關(guān)鍵詞的詞頻詞云圖。根據(jù)圖中高頻詞的變化可知,區(qū)塊鏈研究的發(fā)展大致可以分為三個階段。2008-2015為第一階段,即區(qū)塊鏈1.0時代。該階段的核心概念是“Bitcoin”和“Cryptocurrency”,研究主要以比特幣等加密貨幣的交易為主。2016-2017為區(qū)塊鏈2.0時代。該階段的核心是以“Bitcoin”為代表的“Smart Contract”,研究圍繞著智能合約的開發(fā)和應(yīng)用。其中最突出的技術(shù)開發(fā)是以太坊平臺(Ethereum),技術(shù)應(yīng)用場景主要集中于金融領(lǐng)域。2018-2020是區(qū)塊鏈3.0時代。區(qū)塊鏈技術(shù)應(yīng)用模式升級,已經(jīng)從金融領(lǐng)域擴展到物聯(lián)網(wǎng)、工業(yè)、醫(yī)療等全社會領(lǐng)域。特別的,區(qū)塊鏈和IoT協(xié)同共生,衍生出許多新的研究分支。綜上所述,區(qū)塊鏈研究的發(fā)展迄今經(jīng)歷了從加密貨幣交易到智能合約開發(fā)到區(qū)塊鏈應(yīng)用多元化三個階段。該高頻詞演變分析結(jié)果也印證了現(xiàn)今大眾對區(qū)塊鏈發(fā)展階段的認(rèn)知。
按前文方法所述,所構(gòu)領(lǐng)域語義地圖是區(qū)塊鏈相關(guān)研究形成的知識空間在低維平面上的投影,且歷年累積地圖的同一坐標(biāo)區(qū)域具有相同的語義信息。上一章的整體累積領(lǐng)域語義地圖分析以及詞云圖表征,也進一步明確了地圖不同坐標(biāo)區(qū)域所代表的語義信息或者研究內(nèi)容。于是,本研究繪制了各年累計領(lǐng)域地圖,以期直觀地展現(xiàn)主題的發(fā)展過程。圖4展現(xiàn)了區(qū)塊鏈這一新興領(lǐng)域的生長發(fā)展過程,可以看出區(qū)塊鏈相關(guān)研究的發(fā)展是一個領(lǐng)域范圍由“研究核”不斷向外擴張,同時領(lǐng)域內(nèi)部不斷分化的過程。
圖3 歷年文獻的關(guān)鍵詞詞云圖
圖4 區(qū)塊鏈領(lǐng)域的歷年累積地圖
首先,由圖3可以看出,從2014-2020年,區(qū)塊鏈研究的領(lǐng)域語義地圖的整體輪廓線范圍在不斷擴大,即研究范圍不斷拓增。2014-2017年,研究范圍擴張較為明顯,涌現(xiàn)出新主題。2014年,即在區(qū)塊鏈發(fā)展的初期,研究范圍主要集中于基礎(chǔ)技術(shù)研究(地圖右上方)。到2015、2016年,區(qū)塊鏈研究從基礎(chǔ)技術(shù)研究慢慢向商業(yè)工業(yè)的應(yīng)用研究擴展(地圖右下方)。尤其至2017年,領(lǐng)域擴張出新的研究區(qū)域(區(qū)域1),即能源貿(mào)易主題涌現(xiàn),并且該主題自出現(xiàn)以來持續(xù)發(fā)展。結(jié)合前述關(guān)鍵詞分析可知,智能合約的開發(fā)和應(yīng)用推動了該階段區(qū)塊鏈技術(shù)應(yīng)用的拓展。2017年后,領(lǐng)域輪廓線相對穩(wěn)定,沒有拓展出新方向。然而,隨著研究重點的遷移,領(lǐng)域范圍僅在小幅度調(diào)整。
圖5 商業(yè)工業(yè)主題的演變
其次,伴隨著區(qū)塊鏈“研究面”的擴張,其領(lǐng)域語義地圖內(nèi)部的地貌也在不斷調(diào)整變化。從圖4可以看出在區(qū)塊鏈技術(shù)的發(fā)展過程中存在較多的分化涌現(xiàn)現(xiàn)象,而主題間的融合較少。如2015-2017年商業(yè)工業(yè)應(yīng)用主題的涌現(xiàn)(區(qū)域2)。2017年,區(qū)塊鏈在物聯(lián)網(wǎng)和商業(yè)工業(yè)領(lǐng)域的應(yīng)用研究還為完全分化為兩個研究方向(區(qū)域3),被包圍在同一條密度較高的等高線閉環(huán)內(nèi)。隨著研究的深入,到2018年這兩個領(lǐng)域的研究分裂成兩個主題。2018-2019年,分裂出醫(yī)療健康主題(區(qū)域4)。除此之外,各主題的“區(qū)域形態(tài)”,“區(qū)域重心”也在不斷變化。結(jié)合論文關(guān)鍵詞可以探知各個主題研究內(nèi)容的變遷,如圖5顯示商業(yè)工業(yè)主題(區(qū)域2)在發(fā)展過程中逐漸應(yīng)用了人工智能算法。
圖4所揭示的區(qū)塊鏈研究領(lǐng)域擴張的模式對進一步發(fā)展區(qū)塊鏈學(xué)科領(lǐng)域有所借鑒:后續(xù)發(fā)展一方面將致力于區(qū)塊鏈關(guān)鍵技術(shù)的進一步突破(表現(xiàn)為領(lǐng)域地圖的右側(cè)部分的提升),另一方面致力于新的應(yīng)用領(lǐng)域的拓展(表現(xiàn)為整個領(lǐng)域地圖的擴張和新熱點的涌現(xiàn))。這一領(lǐng)域地圖的快速擴張?zhí)卣饕卜从沉藚^(qū)塊鏈領(lǐng)域近年來的快速發(fā)展。
隨著區(qū)塊鏈技術(shù)日益受到世界各國的重視和關(guān)注,了解區(qū)塊鏈技術(shù)的研究現(xiàn)狀、認(rèn)識其發(fā)展過程對推動技術(shù)發(fā)展、制定科技政策具有重要意義。針對當(dāng)前數(shù)據(jù)范圍以及研究手段方面的局限,本研究基于WOS數(shù)據(jù)庫中收集到的5,951篇文獻,借助新近的文檔嵌入表示學(xué)習(xí)和流形學(xué)習(xí)算法識別了區(qū)塊鏈的主要研究主題,可視化了研究領(lǐng)域圖景,展現(xiàn)并揭示了其演化過程。主要發(fā)現(xiàn):
(1)近來區(qū)塊鏈研究呈現(xiàn)快速增長態(tài)勢,研究主題主要分為基礎(chǔ)技術(shù)研究和應(yīng)用型研究。其中,基礎(chǔ)技術(shù)研究集中于共識層、網(wǎng)絡(luò)層以及應(yīng)用執(zhí)行層;區(qū)塊鏈的應(yīng)用研究已滲透到商業(yè)工業(yè)、醫(yī)療健康、物聯(lián)網(wǎng)以及能源交易等領(lǐng)域。
(2)區(qū)塊鏈領(lǐng)域地圖清晰地展現(xiàn)了研究“地貌”。領(lǐng)域內(nèi)各個主題的研究相對獨立,跨主題研究較少,只有物聯(lián)網(wǎng)和醫(yī)療領(lǐng)域之間的跨行業(yè)應(yīng)用研究相對較多。各個主題被探索的程度不同,當(dāng)前研究多側(cè)重于技術(shù)應(yīng)用方面。
(3)區(qū)塊鏈的研究呈現(xiàn)出應(yīng)用導(dǎo)向的發(fā)展趨勢。其發(fā)展經(jīng)歷了三個階段,即以比特幣交易為主的區(qū)塊鏈1.0時代,以智能合約為代表的區(qū)塊鏈2.0時代,技術(shù)應(yīng)用多元化的區(qū)塊鏈3.0時代。
(4)區(qū)塊鏈領(lǐng)域的發(fā)展過程呈現(xiàn)領(lǐng)域擴張的特征,且該過程伴隨著領(lǐng)域內(nèi)部主題的分化。發(fā)展初期,區(qū)塊鏈領(lǐng)域的研究范圍集中于基礎(chǔ)技術(shù)研究,后來不斷向外拓展涌現(xiàn)新主題,然后領(lǐng)域范圍相對穩(wěn)定。于此同時,隨著研究的深入,各主題內(nèi)部和主題之間的“地貌”不斷變化,比如分裂出醫(yī)療主題。
本研究獲悉了區(qū)塊鏈領(lǐng)域的整體研究概貌、主要研究主題以及發(fā)展趨勢,有望對我國區(qū)塊鏈的發(fā)展提供參考,也有助于進一步理解類似區(qū)塊鏈領(lǐng)域等新興領(lǐng)域的發(fā)展規(guī)律。除此之外,本文在方法上拓展了當(dāng)前的領(lǐng)域主題及演化分析的研究手段。然而本研究未能對區(qū)塊鏈研究演化形態(tài)進行更為精細(xì)的量化分析,后續(xù)將嘗試借助地理時空分析指標(biāo),以期更加客觀準(zhǔn)確地識別主題演化類型。且本研究僅利用了學(xué)術(shù)論文數(shù)據(jù),未來可結(jié)合專利數(shù)據(jù),進一步全方面地分析區(qū)塊鏈技術(shù)在產(chǎn)業(yè)界和學(xué)術(shù)界兩方面的研究現(xiàn)狀以及發(fā)展過程。