馬建威 米萬東 張保平
【摘 要】 文章以2000—2022年間CNKI和WOS數(shù)據(jù)庫中收錄數(shù)據(jù)資產(chǎn)的945篇文獻為數(shù)據(jù)來源,借助文獻計量法和可視化分析軟件CiteSpace,從發(fā)文量、作者及機構(gòu)合作關(guān)系、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞聚類和關(guān)鍵詞突現(xiàn)五個方面,考察國內(nèi)外數(shù)據(jù)資產(chǎn)研究的發(fā)展歷程、熱點主題以及演進趨勢。國內(nèi)外數(shù)據(jù)資產(chǎn)研究熱度近年上升迅速,但作者、機構(gòu)以及不同學科之間的合作研究仍然不足。國內(nèi)的研究主題集中在數(shù)據(jù)資產(chǎn)的產(chǎn)生背景、數(shù)據(jù)資產(chǎn)的理論研究以及應用研究。國外的研究主題集中于加密數(shù)字貨幣研究、線上數(shù)字資源研究以及數(shù)據(jù)資產(chǎn)的安全和管理研究。熱點主題有會計計量、數(shù)據(jù)安全、數(shù)據(jù)交易等話題,研究趨勢從數(shù)據(jù)資產(chǎn)可否確認為一項資產(chǎn)轉(zhuǎn)移到如何更好地利用數(shù)據(jù)資產(chǎn)產(chǎn)生價值。
【關(guān)鍵詞】 數(shù)據(jù)資產(chǎn); 大數(shù)據(jù); CiteSpace; 文獻計量; 可視化分析
【中圖分類號】 F234.3? 【文獻標識碼】 A? 【文章編號】 1004-5937(2023)04-0119-08
一、引言
在“大智移云物”的背景下,大數(shù)據(jù)作為互聯(lián)網(wǎng)發(fā)展進程中的產(chǎn)物之一,數(shù)量呈現(xiàn)爆炸式增長,形式也呈現(xiàn)出結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的多組態(tài)特征。隨著大量的企業(yè)數(shù)字化轉(zhuǎn)型的深入,“一切業(yè)務線上化、一切業(yè)務數(shù)據(jù)化、一切數(shù)據(jù)業(yè)務化”的轉(zhuǎn)型過程,使得企業(yè)在生產(chǎn)經(jīng)營過程中產(chǎn)生并收集到更為體系化的數(shù)據(jù),以全產(chǎn)業(yè)鏈的數(shù)據(jù)代替過去零星的財務數(shù)據(jù),對這些數(shù)據(jù)進行分析利用可為企業(yè)帶來巨大的價值[1]。2022年12月,《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要求作用的意見》指出,數(shù)據(jù)作為新型生產(chǎn)要素,是數(shù)字化、網(wǎng)絡化、智能化的基礎(chǔ),要激活數(shù)字要素潛能,做強做優(yōu)做大數(shù)字經(jīng)濟。數(shù)據(jù)資產(chǎn)是指由個人或企業(yè)擁有或者控制的,能夠為企業(yè)帶來未來經(jīng)濟利益的,以物理或電子方式記錄的數(shù)據(jù)資源。目前對數(shù)據(jù)資產(chǎn)還沒有明確的法律和會計準則規(guī)定,導致數(shù)據(jù)資產(chǎn)的確認計量方法尚未統(tǒng)一,并且尚未納入到資產(chǎn)負債表中進行披露,使得企業(yè)與利益相關(guān)者之間的信息不對稱加劇。數(shù)據(jù)資產(chǎn)的交易領(lǐng)先于理論研究,政府牽頭成立了貴州、上海、巢湖等大數(shù)據(jù)交易中心進行數(shù)據(jù)資產(chǎn)交易,但對于定價、交易模式還處于“一事一議”的狀態(tài),由于確權(quán)不明、定價較難達成共識等問題導致數(shù)據(jù)交易的市場反應不理想,交易規(guī)模普遍較小。數(shù)據(jù)資產(chǎn)的研究需要學界和業(yè)界進行充分的溝通和思考,從經(jīng)濟、管理、法律等不同領(lǐng)域進行探索,早日對數(shù)據(jù)資產(chǎn)在確認計量、披露、交易、管理等方面達成共識,這將對數(shù)據(jù)交易的市場建立、交易規(guī)范以及數(shù)據(jù)參與生產(chǎn)分配等方面有重要作用,使得數(shù)字賦能成為新一輪的經(jīng)濟推動力。為了多維度、全面地分析研究現(xiàn)狀,梳理數(shù)據(jù)資產(chǎn)研究的熱點主題以及趨勢,本文基于CNKI以及WOS數(shù)據(jù)庫搜集相關(guān)中外核心文獻,利用CiteSpace進行可視化分析,從作者、機構(gòu)、國家之間的發(fā)文量和合作關(guān)系,從關(guān)鍵詞的頻率、聚類、突現(xiàn)等方面對文獻進行分析,期望能對數(shù)據(jù)資產(chǎn)的后續(xù)研究提供有力支撐。
二、數(shù)據(jù)來源及研究方法
(一)數(shù)據(jù)來源
中文期刊檢索數(shù)據(jù)來自于中國知網(wǎng)(CNKI)數(shù)據(jù)庫,在高級檢索中用“(主題=數(shù)據(jù)資產(chǎn))OR(主題=數(shù)字資產(chǎn))”為檢索條件,時間范圍為2001年1月至2022年3月31日,來源類別選定“CSSCI”和“北大核心”,經(jīng)過去重和刪除不相關(guān)條目,最終得到409篇文獻。外文期刊檢索數(shù)據(jù)來自于WOS核心合集數(shù)據(jù)庫,用“(Topic=data asset)OR(Topic=digital asset)AND(Language=English)”作為檢索條件,時間范圍為2000年1月至2022年3月31日,經(jīng)過去重和刪除不相關(guān)條目,最終得到536篇文獻。
(二)研究方法
CiteSpace是陳超美教授基于JAVA語言開發(fā)的可視化軟件,利用文獻計量學原理和數(shù)據(jù)挖掘算法,從作者、合作機構(gòu)、關(guān)鍵詞等方面多維度、可視化地呈現(xiàn)文獻之間的內(nèi)在關(guān)系,探尋研究基礎(chǔ)、研究熱點及研究趨勢的一種可視化分析軟件[2]。利用CiteSpace5.8.R3版本對近20年中外文獻進行數(shù)據(jù)資產(chǎn)研究的結(jié)構(gòu)網(wǎng)絡關(guān)系及演進過程進行統(tǒng)計分析和可視化呈現(xiàn),從而展示數(shù)據(jù)資產(chǎn)領(lǐng)域研究的知識全景[3]。
三、數(shù)據(jù)資產(chǎn)研究文獻計量分析
(一)發(fā)文量分析
文獻發(fā)表的數(shù)量在一定程度上可以反映出某個研究領(lǐng)域的發(fā)展速度和研究深度,如圖1所示,從文獻數(shù)量看,呈現(xiàn)增長趨勢,說明專家學者對于數(shù)據(jù)資產(chǎn)的研究愈加關(guān)注。以2015年和2018年兩個時間為節(jié)點,可將數(shù)據(jù)資產(chǎn)的研究從時間跨度上分為三個階段:第一個階段是2001—2014年,這個階段國內(nèi)從2005年開始出現(xiàn)相關(guān)文獻,且年平均發(fā)文量不足3篇,國外年平均發(fā)文量約為10篇,該階段對數(shù)據(jù)資產(chǎn)研究較少。第二個階段是2015—2018年,由于2013年大數(shù)據(jù)之父維克托·邁爾-舍恩伯格出版了《大數(shù)據(jù)時代》一書后,對于大數(shù)據(jù)、數(shù)據(jù)資產(chǎn)的研究明顯增加,這個階段文獻數(shù)量大幅增長,國內(nèi)年平均發(fā)文量達到了30篇,國外文獻達到27篇,年均發(fā)文量大約為2015年前的三倍。第三階段為2019—2021年,國內(nèi)年平均發(fā)文量達到77篇,國外年平均發(fā)文量約為95篇。人工智能、區(qū)塊鏈等新技術(shù)的發(fā)展,國內(nèi)外文獻對于數(shù)據(jù)資產(chǎn)的研究也得到了快速發(fā)展和深入研究。
(二)主要作者及合作關(guān)系
國內(nèi)研究呈現(xiàn)出以部分學者主導的研究氛圍,單篇被引率較高。作者數(shù)量較少且合作關(guān)系較少,多數(shù)作者采用單打獨斗的方式進行研究,合作關(guān)系也多為兩三個作者間的合作。然而數(shù)據(jù)資產(chǎn)涉及經(jīng)濟、管理、會計和法律等多學科的綜合研究,應鼓勵不同學科間的學者合作研究。與國內(nèi)作者關(guān)系“少而集中”相比,國外作者合作呈現(xiàn)“多而分散”的狀態(tài),國外作者間合作較多,且多人合作現(xiàn)象比國內(nèi)常見,單篇被引次數(shù)也少于國內(nèi)文獻被引次數(shù),說明國外研究并非是部分學者引導,而是呈現(xiàn)“去中心化”的特點。
數(shù)據(jù)資產(chǎn)研究領(lǐng)域內(nèi)被引數(shù)最高的10位作者的研究內(nèi)容可認為是國內(nèi)外該領(lǐng)域的主要研究內(nèi)容。其中國內(nèi)學者對數(shù)據(jù)資產(chǎn)會計處理與財務報表列報進行了探討[4],提出了數(shù)據(jù)資產(chǎn)的B-S價值評估模型[5],以及數(shù)字化轉(zhuǎn)型、數(shù)據(jù)資產(chǎn)的統(tǒng)計與核算問題[6]。案例研究方面分析了軍事大數(shù)據(jù)的應用[7],通過數(shù)據(jù)資產(chǎn)作為一種戰(zhàn)略資源對智能制造企業(yè)進行案例研究[8],并對政府數(shù)據(jù)的開放政策進行研究[9]。
從上述分析可以看出,目前數(shù)據(jù)資產(chǎn)的研究重點仍是會計核算問題,確認、計量、和報告是數(shù)據(jù)資產(chǎn)化的基礎(chǔ)。如何從龐雜的企業(yè)數(shù)據(jù)資源提煉出有用的數(shù)據(jù),并通過分析加工形成一項資產(chǎn),對內(nèi)可以優(yōu)化企業(yè)的生產(chǎn)經(jīng)營為企業(yè)提質(zhì)增效,對外可形成數(shù)據(jù)商品進行銷售為企業(yè)帶來收入,數(shù)據(jù)資產(chǎn)價值形成的過程也是研究熱點之一。在解決數(shù)據(jù)資產(chǎn)的會計核算、價值形成這些基礎(chǔ)問題后下一步研究發(fā)方向就是數(shù)據(jù)資產(chǎn)交易問題、管理問題以及作為一項生產(chǎn)要素如何參與到社會分配中,是否能為高質(zhì)量發(fā)展、雙碳目標的達成帶來新的啟示也是新的研究熱點。
國外文獻中被引數(shù)量最高的十名作者中,Lee JS[10]主要研究了利用計算機技術(shù)對數(shù)據(jù)資產(chǎn)進行管理,Corbet et al.[11]對加密貨幣問題進行了研究,Chong[12]討論了數(shù)據(jù)資源重組問題,Kim et al.[13]分析了數(shù)據(jù)資產(chǎn)與網(wǎng)絡安全的關(guān)系及相關(guān)算法,Subramanyam et al.[14]對數(shù)據(jù)資產(chǎn)管理系統(tǒng)進行了設(shè)計與探討,Cao et al.[15]論述了數(shù)據(jù)資產(chǎn)與6G、區(qū)塊鏈等技術(shù)之間的關(guān)系,Czajkowski et al.[16]的研究方向主要為數(shù)據(jù)管理,Hannila et al.[17]則對數(shù)字化和數(shù)據(jù)驅(qū)動的機理進行了探討,與國內(nèi)相比,國外研究更注重計算機技術(shù)層面的研究。
(三)研究機構(gòu)合作分析
從圖2可以看出不同國家和地區(qū)在數(shù)據(jù)資產(chǎn)領(lǐng)域的研究力量,圖中的節(jié)點越大表示該國發(fā)表文獻數(shù)量越多,圈的外環(huán)顏色越深表明近期的研究熱度升高。網(wǎng)絡中節(jié)點數(shù)為86,連線數(shù)為255,網(wǎng)絡密度為0.0698。文獻量最高的十個國家分別是美國(165篇)、英國(66篇)、中國(53篇)、澳大利亞(36篇)、意大利(22篇)、法國(20篇)、德國(20篇)、西班牙(19)、加拿大(17篇)、俄羅斯(16篇),研究熱度持續(xù)升高的四個國家是美國、英國、中國和澳大利亞。由此可以看出,數(shù)據(jù)資產(chǎn)研究的國家以歐美發(fā)達國家為主。中國發(fā)文量第三說明我國對該領(lǐng)域的研究足夠重視,我國的實踐經(jīng)驗和理論研究都處于世界的前沿水平,但與發(fā)達國家相比還有一定的差距,需要進一步加深研究并擴大合作。
數(shù)據(jù)資產(chǎn)研究機構(gòu)分布如表1,國內(nèi)外均以高校研究為主,且高校所在的國家和地區(qū)均為金融、互聯(lián)網(wǎng)等行業(yè)發(fā)展領(lǐng)先地區(qū)。國家電網(wǎng)公司能躋身前十說明集團公司內(nèi)具有較多的數(shù)據(jù)資產(chǎn)相關(guān)問題需要研究,目前電網(wǎng)大數(shù)據(jù)具有實時性強、顆粒度高等優(yōu)點,可得到按時間跨度、按區(qū)域跨度、按行業(yè)跨度的用電數(shù)據(jù),以及家庭用戶和企業(yè)用戶用電情況的全樣本數(shù)據(jù),由電力數(shù)據(jù)可反映出當前的宏觀經(jīng)濟狀況[18]。除電力行業(yè)外,其他行業(yè)數(shù)據(jù)資產(chǎn)的研究較少,例如通信、交通、金融數(shù)據(jù)資產(chǎn)等缺乏理論與實踐層面的研究。從合作機構(gòu)情況分析,目前國內(nèi)外宏觀層面的理論分析和實證研究是研究主流,從微觀層面對公司進行案例研究的文獻較少,數(shù)據(jù)資產(chǎn)的研究需要企業(yè)和學者共同努力,學者應從象牙塔走到企業(yè)中去實地調(diào)研,而企業(yè)也應該拒絕形成數(shù)字孤島,將適當?shù)馁Y源進行分享,例如以互聯(lián)網(wǎng)技術(shù)為支撐的字節(jié)跳動、騰訊、京東等企業(yè),他們擁有大量的數(shù)據(jù)資源,對這些企業(yè)的研究可以更好地推動數(shù)據(jù)資產(chǎn)的發(fā)展。不同行業(yè)的數(shù)據(jù)資產(chǎn)異質(zhì)性較大,需要較多的案例研究分析不同行業(yè)數(shù)據(jù)資產(chǎn)的異同點才能更好地推進數(shù)據(jù)資產(chǎn)的發(fā)展。
四、數(shù)據(jù)資產(chǎn)研究熱點分析
(一)關(guān)鍵詞詞頻分析
關(guān)鍵詞具有對全文高度概括的作用,對所選的文獻關(guān)鍵詞進行分析可大體了解文獻的研究熱點。以關(guān)鍵詞為節(jié)點,時間切片為一年進行關(guān)鍵詞共現(xiàn)分析。關(guān)鍵詞中心性大于0.1的為關(guān)鍵節(jié)點,國內(nèi)中心性關(guān)鍵詞為數(shù)據(jù)資產(chǎn)、大數(shù)據(jù)、數(shù)據(jù)治理、數(shù)字經(jīng)濟、政府數(shù)據(jù)、區(qū)塊鏈、信息披露、人才培養(yǎng)、數(shù)據(jù)安全、智能財務、數(shù)據(jù)管理。國外文獻中心性關(guān)鍵詞為digital asset(數(shù)據(jù)資產(chǎn))、big data(大數(shù)據(jù))、blockchain(區(qū)塊鏈)、model(模型)、system(系統(tǒng))、information security(信息安全)、data governance(數(shù)據(jù)治理)、management(管理)、machine learning(機器學習)等。
(二)關(guān)鍵詞聚類分析
關(guān)鍵詞聚類可以將眾多的關(guān)鍵詞劃分為幾個主題,CiteSpace根據(jù)網(wǎng)絡中關(guān)鍵詞出現(xiàn)的頻率及中心性,并在關(guān)聯(lián)規(guī)則中使用log-likelihood ratio(LLR)作為相似度,將相似含義的關(guān)鍵詞聚類形成不同的研究主題。模型中用Q值(模塊值)和S值(平均輪廓值)來衡量聚類的效果,一般當Q值>0.3可認為聚類結(jié)構(gòu)顯著,S值>0.7可認為聚類效果是令人信服的。
1.國內(nèi)文獻關(guān)鍵詞聚類
如圖3,Q值為0.7247,S值為0.9399,說明聚類結(jié)果中結(jié)構(gòu)合理,并且結(jié)果可信度高。根據(jù)圖譜得出的12個關(guān)鍵詞聚類,可將它們總結(jié)為三大研究主題。
(1)數(shù)據(jù)資產(chǎn)的產(chǎn)生背景
該主題中包含的聚類有#0大數(shù)據(jù)、#11大數(shù)據(jù)時代。主要關(guān)鍵詞有互聯(lián)網(wǎng)化、云計算、物聯(lián)網(wǎng)、數(shù)據(jù)資產(chǎn)、影響因素、數(shù)字出版等。大數(shù)據(jù)是指數(shù)據(jù)的規(guī)模之大,使得在較短時間內(nèi)無法通過主流軟件進行提取和分析,以得到有價值的信息。隨著互聯(lián)網(wǎng)的發(fā)展,產(chǎn)生的數(shù)據(jù)也越來越多,計算機的性能不足以支撐如此海量數(shù)據(jù)的存儲和計算,隨著云計算和機器學習等技術(shù)的出現(xiàn),人們有能力對更多的數(shù)據(jù)進行收集、存儲、分析,進而從數(shù)據(jù)中獲取更大的價值,這使得數(shù)據(jù)資產(chǎn)的研究熱度急劇上升。21世紀為數(shù)據(jù)時代,數(shù)據(jù)被稱為新時代的“石油”。照片墻(Instagram)作為一款社交軟件,由于用戶數(shù)量的激增而獲得了大量的數(shù)據(jù),用戶分享的圖片和文字形成了巨額的數(shù)據(jù)資源,2012年Facebook宣布以10億美元收購Instagram,2018年其估值超過1 000億美元,其中數(shù)據(jù)資產(chǎn)相比于企業(yè)的有形和無形資產(chǎn)更有價值。當意識到數(shù)據(jù)資產(chǎn)的重要性后,如何從海量的數(shù)據(jù)中提煉出有用的信息?這些信息如何為企業(yè)帶來收益?這些收益能否被計量?這些信息能否在財務報表中披露?這些問題的提出使得數(shù)據(jù)資產(chǎn)成為了研究熱點。
(2)數(shù)據(jù)資產(chǎn)的理論研究
該主題包含的聚類有#1數(shù)據(jù)資產(chǎn)、#3數(shù)據(jù)要素、#7信息資產(chǎn)。主要關(guān)鍵詞有資產(chǎn)權(quán)益、科研數(shù)據(jù)、政府數(shù)據(jù)、個人數(shù)據(jù)、數(shù)據(jù)交易、開放數(shù)據(jù)、個人信息、會計計量、信息主體、會計核算等。數(shù)據(jù)資產(chǎn)理論層面首先要解決數(shù)據(jù)確權(quán)的問題,這些數(shù)據(jù)是屬于誰的?葉雅珍等[19]認為數(shù)據(jù)的權(quán)屬理應屬于生產(chǎn)數(shù)據(jù)的人,但一些數(shù)據(jù)權(quán)屬涉及個人隱私等問題,較難斷定。數(shù)據(jù)的來源大體有三種,一是政府大數(shù)據(jù),例如氣象信息、統(tǒng)計年鑒等,這類數(shù)據(jù)資源權(quán)屬明確。經(jīng)由政府部門統(tǒng)計核算后對外公開,但由于統(tǒng)計核算需要大量的人力和時間,政府大數(shù)據(jù)時間滯后性較強。二是企業(yè)在生產(chǎn)經(jīng)營過程中產(chǎn)生的數(shù)據(jù),例如物流企業(yè)產(chǎn)生的物流數(shù)據(jù)、國家電網(wǎng)統(tǒng)計各行業(yè)的用電情況等。三是個人與企業(yè)之間的聯(lián)合數(shù)據(jù),例如電商平臺消費者的購買數(shù)據(jù)、社交軟件采集到的用戶數(shù)據(jù),這類數(shù)據(jù)應當所屬于企業(yè)和用戶共有。共有數(shù)據(jù)會涉及到用戶隱私問題,需要將數(shù)據(jù)進行脫敏處理等操作后使用。
在研究確權(quán)問題后,數(shù)據(jù)如何從數(shù)據(jù)資源確認為一項資產(chǎn)是第二個需要研究的問題。首先數(shù)據(jù)資產(chǎn)是否能確認為一項資產(chǎn)?從會計層面講,資產(chǎn)是一項會計概念,有明確的定義和確認條件,需滿足與該資源有關(guān)的經(jīng)濟利益很有可能流入企業(yè),且該資源的成本或價值可以可靠計量的才可以確認為一項資產(chǎn)。數(shù)據(jù)資產(chǎn)具有一定的特殊性,不同于有形資產(chǎn)與無形資產(chǎn),數(shù)據(jù)資產(chǎn)的成本和價值都具有較大的不確定性。劉國英等通過對2018年IASB《財務報告概念框架》進行研究,認為隨著宏觀經(jīng)濟環(huán)境和企業(yè)經(jīng)濟環(huán)境的復雜性增加,應適當?shù)卮_認和披露一些不確定性經(jīng)濟業(yè)務。在某些情況下,盡管經(jīng)濟資源流入或流出的可能性較小,確認資產(chǎn)或負債仍可以提供有用信息的情況下仍可確定為一項資產(chǎn)或負債[20]。目前我國的會計準則正在向國際趨同,這就從準則層面為數(shù)據(jù)資產(chǎn)的確認計量提供了從概念框架上的可能性。其次,在確認之后需要解決的是計量問題,這方面的研究較為豐富,可參考無形資產(chǎn)的定價方法(有成本法、市場法、收益法),由于數(shù)據(jù)資產(chǎn)的特殊性,三種方法均有一定的局限性,一些學者使用價值和市場評價貢獻(歐陽日輝等,2022)、AHP-FCE(吳江等,2021)、多期產(chǎn)額收益法(陳芳等,2021)、博弈論(趙麗等,2022)等方法研究數(shù)據(jù)資產(chǎn)的定價問題,但目前還沒有形成一種公認的計量方法,仍需要深入研究討論。最后,是數(shù)據(jù)資產(chǎn)入表的問題,大數(shù)據(jù)之父維克托·邁爾-舍恩伯格表示“數(shù)據(jù)資產(chǎn)入表不是是否的問題,而是早晚的問題”,在確認與計量研究的基礎(chǔ)上,秦榮生[21]、張俊瑞等[22]對數(shù)據(jù)資產(chǎn)在財務報表中披露的可能性及方式進行了研究。另一方面從數(shù)據(jù)價值鏈的角度來講,數(shù)據(jù)經(jīng)過采集、存儲、分析和應用四個階段,數(shù)據(jù)可確認為一項資產(chǎn)為公司帶來收益。數(shù)據(jù)資產(chǎn)化是數(shù)據(jù)交易的前提,對完善數(shù)據(jù)交易市場、數(shù)據(jù)參與生產(chǎn)分配具有重要意義。
(3)數(shù)據(jù)資產(chǎn)的應用研究
該主題包含的聚類有:#2元數(shù)據(jù)、#4數(shù)字經(jīng)濟、#5信息生態(tài)、#6數(shù)據(jù)安全、#7信息資產(chǎn)、#8銀行業(yè)、#9區(qū)塊鏈、#10數(shù)字時代。主要關(guān)鍵詞有聯(lián)邦學習、人工智能、電力數(shù)據(jù)、海洋數(shù)據(jù)、數(shù)據(jù)中臺、數(shù)據(jù)體系、財務數(shù)字化、數(shù)據(jù)共享、金融數(shù)據(jù)、風險評估、風險防范、數(shù)據(jù)質(zhì)量管理、交易系統(tǒng)、智能財務、人才培養(yǎng)、高校等。
在應用層面首先需要解決的是傳統(tǒng)數(shù)據(jù)庫的存儲和分析困難的技術(shù)問題,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫在數(shù)據(jù)量較大時搜索速度會急劇下降,分布式存儲方式是將海量的數(shù)據(jù)分開儲存在不同的子節(jié)點上,這樣分級儲存可以較好地解決傳統(tǒng)數(shù)據(jù)庫的查詢速度問題,利用“云盤”的網(wǎng)絡存儲形式代替物理硬盤存儲,有力地解決了存儲空間有限的問題。聯(lián)邦學習是一種在保護數(shù)據(jù)隱私狀況下的數(shù)據(jù)共享計算模式,聯(lián)合云計算等技術(shù)將數(shù)據(jù)樣本分享給不同的參與者進行計算,之后再將計算結(jié)果匯總在一起,這有利于解決大數(shù)據(jù)算力不足的問題。
解決了數(shù)據(jù)資產(chǎn)的存儲和計算問題后,需要研究如何對數(shù)據(jù)資產(chǎn)的價值進行挖掘。企業(yè)中形成數(shù)據(jù)資產(chǎn)的數(shù)據(jù)來源有兩種,第一種是在生產(chǎn)經(jīng)營中采集到的數(shù)據(jù),第二種是通過交易或事項外購來的數(shù)據(jù)。將這些數(shù)據(jù)經(jīng)過統(tǒng)計學、人工智能、機器學習、可視化分析等技術(shù),將蘊含在大數(shù)據(jù)中的信息挖掘出來,為企業(yè)帶來價值。這些數(shù)據(jù)形成企業(yè)的數(shù)據(jù)資產(chǎn)后產(chǎn)生價值的方式也有兩種,一是為自身的經(jīng)營管理決策提供參考意見,優(yōu)化業(yè)務流程提升企業(yè)效益。例如,利用“大智移云物”等技術(shù)建立數(shù)據(jù)中臺、智能財務體系、智能審計系統(tǒng)替代人工操作,既提高了效率又降低了人工成本,把大量的人力資源解放出來進行其他的管理工作;二是通過轉(zhuǎn)讓數(shù)據(jù)資產(chǎn)所有權(quán)或讓渡使用權(quán)來獲得收益,例如在大數(shù)據(jù)交易所進行大數(shù)據(jù)交易。目前大多數(shù)企業(yè)的數(shù)據(jù)還處于數(shù)據(jù)孤島的狀態(tài),數(shù)據(jù)需要流通和運轉(zhuǎn)起來,跨企業(yè)、跨行業(yè)的數(shù)據(jù)共享才能發(fā)掘出更有價值的信息,大數(shù)據(jù)交易所在交易中充當“中介機構(gòu)”的角色,負責收集在數(shù)據(jù)交易中供需兩方的信息,并促使交易完成,目前大數(shù)據(jù)交易所的交易效率較低,在沒有明確的規(guī)定下,每筆交易需要請相關(guān)專家單獨評估,這使得交易成本上升并且難以使交易雙方達成共識,目前仍需要對數(shù)據(jù)資產(chǎn)的基礎(chǔ)會計問題進行研究,早日通過制定完善相關(guān)法律來規(guī)范數(shù)據(jù)交易,這對數(shù)據(jù)市場的建設(shè)和發(fā)展具有重要意義。
數(shù)據(jù)資產(chǎn)應用的推動離不開人才培養(yǎng)問題,需要“財務+互聯(lián)網(wǎng)”等跨學科人才的參與,幫助企業(yè)實施數(shù)據(jù)資產(chǎn)從確認到交易的環(huán)節(jié),故需要各高校在人才培養(yǎng)時幫助學生建立跨學科的知識體系,目前已有部分高校開展“大數(shù)據(jù)會計”等專業(yè),通過以“會計+互聯(lián)網(wǎng)”為體系的課程進行理論和應用培養(yǎng),輸送了可以助力企業(yè)數(shù)字化轉(zhuǎn)型、完善數(shù)據(jù)共享中心的技術(shù)人才,從理論和技能上均能適應時代發(fā)展的人才。
2.國外文獻關(guān)鍵詞聚類
如圖4,Q值為0.8231,S值為0.9393,說明聚類結(jié)果中結(jié)構(gòu)合理,并且結(jié)果可信度高。聚類結(jié)果國外文獻偏向于應用研究,而國內(nèi)文獻研究理論較多,并且就應用層面分析,國內(nèi)研究宏觀層面的應用較多,而國外更注重微觀、具體的研究,國外文獻的關(guān)鍵詞和聚類信息都表現(xiàn)出以技術(shù)方法為主的特征,共得到11個關(guān)鍵詞聚類,可將它們總結(jié)為三大研究主題。
(1)加密數(shù)字貨幣研究
該主題包含的聚類有#0big data、#2digital assets、#3bitcoin。主要的關(guān)鍵詞有digital assets(數(shù)據(jù)資產(chǎn))、blockchain(區(qū)塊鏈)、information technology(信息技術(shù))、smart contracts(智能合約)、6g mobile communication(6g移動通信)、digital twin(數(shù)字孿生)、distributed ledger(分布式賬簿)、facility management(設(shè)備管理)、cryptocurrency(加密貨幣)、investment(投資)。
加密數(shù)字貨幣主題主要研究了數(shù)字貨幣的產(chǎn)生和發(fā)展,在智能合約1995年被提出時,它的意義是“一套以數(shù)字形式定義的承諾”,將合同數(shù)據(jù)化、線上化,可以說是數(shù)據(jù)資產(chǎn)的前身,在2015年區(qū)塊鏈的研究中主要用于在區(qū)塊鏈或分布式分類賬上進行的通用計算。數(shù)字孿生代表著利用數(shù)據(jù)進行模擬仿真的實驗過程,6g技術(shù)則能通過更快的網(wǎng)速幫助大量數(shù)據(jù)的傳輸。
(2)線上數(shù)字資源研究
該主題包含的聚類有#4digital libraries、#9data management、#10model,主要的關(guān)鍵詞有digital storage(數(shù)字存儲)、digital workflow(數(shù)字化流程)、institutional repository(機構(gòu)典藏)、open source software(開源軟件)、digital curation(數(shù)字策展)、digital cultural heritage(數(shù)字文化遺產(chǎn))、3d model(3d模型)。
這類研究起源于數(shù)字圖書館,數(shù)字圖書館是指通過數(shù)字技術(shù)處理、儲存并展示的一種媒介,將圖書、報紙等紙質(zhì)文件上傳到網(wǎng)絡中,可以在線查閱資料。例如一些數(shù)據(jù)庫在取得作者授權(quán)后,將論文、期刊、學術(shù)會議等以電子文檔的形式存儲和展示。該類數(shù)據(jù)庫中的電子文檔是一種電子資源,這種資源的成本可以可靠地計量,未來可帶來收益。文獻資源與專利等固定資產(chǎn)和無形資產(chǎn)不同,不用計提折舊和攤銷,但未來的收益具有較大的不確定性,文獻的價值不一定隨著時間的流逝而降低,故需要確認為數(shù)據(jù)資產(chǎn),更加體現(xiàn)會計信息的可靠性。隨著技術(shù)的發(fā)展,知識資源線上化不僅局限于文字資源,越來越多的音樂、電影等“電子專輯”發(fā)展迅速。在疫情期間,為了滿足廣大群眾的精神需求,各景區(qū)開展“云旅游”“云賞花”等活動,使大家足不出戶便可欣賞到美景,多家博物館開展數(shù)字策展的活動,利用3d模型等技術(shù)的支撐,通過講解和展示可使大家了解到各展品的更多細節(jié)及其包含的歷史文化元素,使觀眾得到高品質(zhì)的文旅融合體驗,這些都是數(shù)據(jù)資產(chǎn)的前沿應用。
(3)數(shù)據(jù)資產(chǎn)的安全和管理研究
該主題包含的聚類有#1edge computing、#5digital rights management、#6information security、#7knowledge management、#8machine learning,主要的關(guān)鍵詞有database security(數(shù)據(jù)庫安全)、access control(訪問控制)、trusted computing(可信計算)、intellectual property(知識產(chǎn)權(quán))、access right management(訪問權(quán)管理)、encrypted domain watermarking(加密水印)、threat intelligence(威脅情報)、feature representation(特征表示)。
大數(shù)據(jù)發(fā)展初期,云計算解決了大數(shù)據(jù)的存儲和運算問題,將請求運算的數(shù)據(jù)上傳至云端,云端將任務分割為眾多的小任務交由網(wǎng)絡中的計算機運算,將運算結(jié)果又回傳到云端進行匯總,最終將結(jié)果發(fā)送至客戶端,在一定的數(shù)據(jù)體量下可以正常運轉(zhuǎn)。隨著5G、物聯(lián)網(wǎng)等的進一步普及,手機、電視、智能穿戴等設(shè)備產(chǎn)生并采集到大量的數(shù)據(jù),這些數(shù)據(jù)首先結(jié)構(gòu)復雜多樣,例如攝像頭拍攝的視頻數(shù)據(jù)、錄音產(chǎn)生的音頻數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù),云端難以處理多種類型的數(shù)據(jù)源。其次,實時業(yè)務要求在規(guī)定時間內(nèi)完成運算,將所有的數(shù)據(jù)傳輸?shù)皆贫诉M行存儲和運算使整個網(wǎng)絡帶寬壓力過大,容易造成網(wǎng)絡時延問題,并且對運算資源是一種極大的浪費。邊緣計算是指數(shù)據(jù)或任務能夠在靠近數(shù)據(jù)源頭進行計算而無需上傳至云端進行運算的服務模式[23]。例如,地鐵車廂內(nèi)安裝攝像頭是為了監(jiān)控車廂內(nèi)的突發(fā)情況,傳統(tǒng)云計算服務模式下,攝像頭只是一個采集數(shù)據(jù)并上傳的設(shè)備,將收集到的視頻持續(xù)地傳輸?shù)皆贫诉M行分析,由于攝像頭數(shù)目較多以及采集到的高清視頻體積較大,云端服務器承擔了過大的存儲和計算壓力,企業(yè)需要付出巨額的成本來解決算力問題,邊緣計算模式下攝像頭是集數(shù)據(jù)采集、數(shù)據(jù)分析及信息上傳于一體的終端設(shè)備,采集到的圖像視頻在攝像頭內(nèi)部進行人臉識別、模式識別等運算,當結(jié)果判定為發(fā)生突發(fā)情況時才將運算結(jié)果上傳至云端并進行警報功能,這樣既提高了效率又解放了云端的運算壓力。
邊緣計算服務模式相比于云計算服務模式具有較大的優(yōu)勢,但由于數(shù)據(jù)的采集和運算都由“邊緣端”處理而不是經(jīng)由“云端”集中處理,運算過程中涉及到多授權(quán)方和新的信任模式,之前的數(shù)據(jù)機密等保障數(shù)據(jù)安全的措施已不再適用。邊緣計算中會出現(xiàn)數(shù)據(jù)丟失、數(shù)據(jù)泄露和違法傳播等安全問題,為了保障身份、位置等隱私信息的安全,基于身份認證、訪問控制為基礎(chǔ)的算法還處于探索階段,仍需深入研究。
五、數(shù)據(jù)資產(chǎn)研究趨勢分析
關(guān)鍵詞突現(xiàn)是以關(guān)鍵詞為基礎(chǔ),分析它出現(xiàn)的時間和被替代的時間,以及這段時間內(nèi)出現(xiàn)的頻率,據(jù)此研究數(shù)據(jù)資產(chǎn)領(lǐng)域研究的演進趨勢。圖5中Year表示數(shù)據(jù)集開始研究的年份;Strength表示強度,某個關(guān)鍵詞的強度越大,表示在某段時間內(nèi)出現(xiàn)的次數(shù)越多;Begin和End分別表示關(guān)鍵詞出現(xiàn)和消失的時間。在CiteSpace中利用Burstness的功能,并將伽馬值設(shè)為1,得到中文文獻中17個突現(xiàn)詞和英文文獻中8個突現(xiàn)詞,從突現(xiàn)詞數(shù)量上看,中文文獻的研究熱點多而分散,英文文獻研究熱點少而集中。
如圖5,中文文獻的研究熱點可分為三個時間段,第一個時間段是2000—2015年左右,11個突現(xiàn)詞根據(jù)凸顯強度由強到弱分別是聯(lián)邦學習、資產(chǎn)權(quán)益、數(shù)據(jù)復用、文本分析、科研數(shù)據(jù)、數(shù)字時代、數(shù)據(jù)利用、數(shù)據(jù)政策、智能財務、人次培養(yǎng)、信息披露,其中強度最大的是聯(lián)邦學習和資產(chǎn)權(quán)益,聯(lián)邦學習是一個為了解決企業(yè)數(shù)據(jù)孤島搭建的機器學習框架,從算法的角度開展了對數(shù)據(jù)資產(chǎn)的研究,權(quán)益資產(chǎn)則從會計角度對數(shù)據(jù)資產(chǎn)進行了探究。第一階段突現(xiàn)詞存在時間最長的是數(shù)字時代,從2000年被提及開始,一直到2016年才逐漸被替代。第二階段是2016—2019年,大數(shù)據(jù)成為了這個階段的研究熱點,這個階段研究熱點是如何通過大數(shù)據(jù)、人工智能、移動互聯(lián)網(wǎng)、云計算等去解決數(shù)據(jù)的存儲和挖掘功能,希望能從海量的數(shù)據(jù)中找到其中蘊含的價值。第三階段是2020—2022年,突現(xiàn)詞有數(shù)字經(jīng)濟、數(shù)據(jù)治理、數(shù)據(jù)中臺、區(qū)塊鏈、數(shù)據(jù)交易。這個階段熱點的第一個特征是研究數(shù)據(jù)作為新的生產(chǎn)要素,如何通過大數(shù)據(jù)等新技術(shù)使數(shù)據(jù)加入社會生產(chǎn)和分配中,使中國經(jīng)濟從高速發(fā)展轉(zhuǎn)向高質(zhì)量發(fā)展的階段,數(shù)字經(jīng)濟的熱點也是對第二階段數(shù)字時代研究熱點的傳承和延續(xù)。第二個特征是研究從“后端”逐漸向“前端”轉(zhuǎn)移,數(shù)據(jù)治理、數(shù)據(jù)中臺、數(shù)據(jù)交易是數(shù)據(jù)資產(chǎn)中更為“前端”的應用,比起數(shù)據(jù)政策等研究更為微觀和具體。
如圖6,英文文獻的研究熱點也可分為三個階段,第一階段為2001—2017年,突現(xiàn)詞分別為digital library(數(shù)字圖書館)和information security(信息安全),與中文文獻不同,隨著計算機和智能手機的出現(xiàn),此階段英文文獻的研究熱點集中于如何將文字、音樂、視頻等非結(jié)構(gòu)化的數(shù)據(jù)通過計算機和網(wǎng)絡展示出來,有助于使用人員擺脫對于媒介的依賴,縮短資源的獲取成本,以及在此基礎(chǔ)上確保數(shù)據(jù)的安全。第二階段為2018—2020年,突現(xiàn)詞為big data(大數(shù)據(jù))、design(設(shè)計)、internet(互聯(lián)網(wǎng)),第二階段的研究熱點在于大數(shù)據(jù)等的研究。根據(jù)國外文獻新的研究趨勢是第三階段,從2021—2022年,突現(xiàn)詞為technology(科技)和knowledge(知識),此階段科技指數(shù)據(jù)安全的相關(guān)算法研究,知識指線上資源的研究,2020年新冠疫情爆發(fā)后,人們的出行受到限制,云旅游作為一種新的商業(yè)模式得到發(fā)展。
六、結(jié)語
通過對比中外文獻在數(shù)據(jù)資產(chǎn)領(lǐng)域的研究,可以發(fā)現(xiàn)從2014年起數(shù)據(jù)資產(chǎn)的關(guān)注度日漸提高,尤其近兩年研究熱度急劇升高。從作者合作關(guān)系可以看出,國外文獻作者呈現(xiàn)多而分散,國內(nèi)文獻作者呈現(xiàn)少而集中的狀態(tài),并且均需加強跨組織、跨領(lǐng)域的研究。從研究機構(gòu)以及國家發(fā)文量可以看出,該領(lǐng)域的研究目前還是以高校研究為主,缺乏校企聯(lián)合的相關(guān)研究,中國在國際上對該領(lǐng)域的研究處于領(lǐng)先地位,但仍需加強合作。國內(nèi)外文獻熱點集中在數(shù)據(jù)資產(chǎn)的確認計量問題,數(shù)據(jù)資產(chǎn)的應用、管理和交易問題,人才培養(yǎng)問題,加密數(shù)字貨幣問題,數(shù)據(jù)資源以及數(shù)據(jù)安全問題。數(shù)據(jù)資產(chǎn)領(lǐng)域的研究趨勢從會計計量等底層邏輯轉(zhuǎn)移到數(shù)據(jù)安全、數(shù)據(jù)交易等應用層面,這些研究是企業(yè)在應用數(shù)據(jù)資產(chǎn)中最需要解決的實際問題。
【參考文獻】
[1] 戚聿東,肖旭.數(shù)字經(jīng)濟時代的企業(yè)管理變革[J].管理世界,2020,36(6):135-152,250.
[2] CHEN C.CiteSpace:A Practical Guide for Mapping Scientific Literature[M].Nova Science Publishers,2016.
[3] 李新根,魏淑艷,劉冬梅.國內(nèi)數(shù)字化治理研究的熱點主題與演進趨勢——基于CiteSpace的知識圖譜分析[J].東南學術(shù),2022(2):61-71,247.
[4] 張俊瑞,危雁麟,宋曉悅.企業(yè)數(shù)據(jù)資產(chǎn)的會計處理及信息列報研究[J].會計與經(jīng)濟研究,2020,34(3):3-15.
[5] 王靜,王娟.互聯(lián)網(wǎng)金融企業(yè)數(shù)據(jù)資產(chǎn)價值評估——基于B—S理論模型的研究[J].技術(shù)經(jīng)濟與管理研究,2019(7):73-78.
[6] 許憲春,唐雅,張鐘文.個人數(shù)據(jù)的統(tǒng)計與核算問題研究[J].統(tǒng)計研究,2022(2):20-34.
[7] 鄭少秋,韓立斌,王靜,等.軍事大數(shù)據(jù)概念內(nèi)涵、發(fā)展挑戰(zhàn)與技術(shù)實踐[J/OL].指揮與控制學報,2021.
[8] 朱國軍,王修齊,張宏遠.智能制造核心企業(yè)如何牽頭組建創(chuàng)新聯(lián)合體——來自華為智能汽車業(yè)務的探索性案例研究[J].科技進步與對策,2022(19):18-25.
[9] 周文泓.面向資產(chǎn)化利用的我國地方政府開放數(shù)據(jù)政策調(diào)查及其啟示[J].情報理論與實踐,2022(6):20,52-58.
[10] LEE J S.Scalable data management modeling and framework for grid computing[C]// Springer Berlin Heidelberg,2004.
[11] CORBET S,et al.Kodakcoin:a blockchain revolution or exploiting a potential cryptocurrency bubble?[J/OL].Social Science Electronic Publishing,2018.
[12] CHONG C,et al.CDAL:A scalable scheme for digital resource reorganization[C].International Conference on Web-Based Learning,2004.
[13] KIM S,KIM S,NAM K H,et al.Cyber security strategy for nuclear power plant through vital digital assets[C]// 2019 International Conference on Computational Science and Computational Intelligence (CSCI),2019.
[14] SUBRAMANYAM A V ,et al.Audio watermarking in partially compressed-encrypted domain[C]// Systems,Man,and Cybernetics(SMC),2012 IEEE International Conference on.IEEE,2012.
[15] CAO L,et al.Special issue on AI and FinTech:the challenge ahead[J].IEEE Intelligent Systems,2020,35(2):3-6.
[16] CZAJKOWSKI K,et al.ERMrest:a web service for collaborative data management[C].The 30th International Conference,2018.
[17] HANNILA H,et al.Product-level profitability current challenges and preconditions for data-driven,fact-based product portfolio management[J].Journal of Enterprise Information Management,2019,33(1):214-237.
[18] 彭放,祁亞茹,任俊達,等.基于電力大數(shù)據(jù)對工業(yè)增加值現(xiàn)時預測研究——基于LSTM的分析[J].價格理論與實踐,2021(7):110-114.
[19] 葉雅珍,劉國華,朱揚勇.數(shù)據(jù)資產(chǎn)相關(guān)概念綜述[J].計算機科學,2019,46(11):20-24.
[20] 劉國英,周冬華.IASB概念框架下數(shù)據(jù)資產(chǎn)準則研究[J].財會月刊,2021(21):66-71.
[21] 秦榮生.企業(yè)數(shù)據(jù)資產(chǎn)的確認、計量與報告研究[J].會計與經(jīng)濟研究,2020,34(6):3-10.
[22] 張俊瑞,危雁麟.數(shù)據(jù)資產(chǎn)會計:概念解析與財務報表列報[J].財會月刊,2021(23):13-20.
[23] 張佳樂,趙彥超,陳兵,等.邊緣計算數(shù)據(jù)安全與隱私保護研究綜述[J].通信學報,2018,39(3):1-21.