劉承煥 馮文婕
(1.桂林電子科技大學(xué) 2.廣西南寧桂電研究院)
XBRL 被稱為可擴(kuò)展的商業(yè)報(bào)告語言,是一種基于XML、開放式并且不限于特定操作平臺(tái)的國際標(biāo)準(zhǔn),目前在金融、財(cái)務(wù)、信息技術(shù)領(lǐng)域都有深入研究。其原理主要為通過計(jì)算機(jī)技術(shù)將各類現(xiàn)代企業(yè)計(jì)算機(jī)語言信息平臺(tái)與其他各種相關(guān)商業(yè)數(shù)據(jù)、財(cái)務(wù)信息技術(shù)應(yīng)用相結(jié)合,充分可靠地實(shí)現(xiàn)各類會(huì)計(jì)財(cái)務(wù)報(bào)告、內(nèi)容與各相關(guān)領(lǐng)域商業(yè)報(bào)告數(shù)據(jù)信息及時(shí)、準(zhǔn)確、高效化的融合,并可高效經(jīng)濟(jì)化地實(shí)現(xiàn)相互數(shù)據(jù)存儲(chǔ)、處理和傳輸功能域的實(shí)時(shí)交流。XBRL 技術(shù)還可以根據(jù)現(xiàn)行財(cái)務(wù)會(huì)計(jì)信息的規(guī)范或披露規(guī)范標(biāo)準(zhǔn)規(guī)定的各種格式要求,將其所有的財(cái)務(wù)信息內(nèi)容全部自動(dòng)地分解成三種完全不同結(jié)構(gòu)形式組成的結(jié)構(gòu)化數(shù)據(jù)源文件(DataElement),并最終能實(shí)現(xiàn)根據(jù)各種最新的計(jì)算機(jī)語言規(guī)范標(biāo)準(zhǔn)。
本文主要采用南開大學(xué)計(jì)算機(jī)系美國德雷塞爾大學(xué)計(jì)算機(jī)及信息系統(tǒng)與技術(shù)情報(bào)學(xué)學(xué)院的陳超美等教授研究的信息可視化分析軟件CiteSpace,來輔助對基于XBRL 的研究報(bào)告主題內(nèi)容進(jìn)行文本語義信息挖掘和建模計(jì)算及文本信息的可視化研究結(jié)果分析。進(jìn)行文獻(xiàn)的計(jì)量檢測及可靠性分析研究采用的最主要的文獻(xiàn)數(shù)據(jù)來源一般來自中國以及中知網(wǎng)等專業(yè)數(shù)據(jù)庫,收集到的文獻(xiàn)資料也主要是可以選擇從XBRL 的主題數(shù)據(jù)庫中進(jìn)行全文的檢索,采集獲取到的文獻(xiàn)數(shù)據(jù)范圍,包括作者、篇名、關(guān)鍵詞、作者單位、文獻(xiàn)來源、刊發(fā)及截止發(fā)稿時(shí)間范圍等資料及文章摘要。檢索任務(wù)完成日期設(shè)定為2022 年3 月24 日,時(shí)間跨度是自2001 年底起到2021 年,檢索任務(wù)收集到的相關(guān)中文原始科技文獻(xiàn)總數(shù)約有1233 篇,將全部以Refworks格式文件導(dǎo)出。
CiteSpace 軟件對所研究領(lǐng)域文獻(xiàn)進(jìn)行可視化分析。分析的理論基礎(chǔ)基于引文分析與共線分析的相互應(yīng)用,其分析數(shù)據(jù)的功能包括但不限于作者、機(jī)構(gòu)、國家地區(qū)的合作網(wǎng)絡(luò)分析;文獻(xiàn)術(shù)語、關(guān)鍵詞點(diǎn)、學(xué)科類別的網(wǎng)絡(luò)分析;作者共被引、文獻(xiàn)共被引、期刊共被引分析以及文獻(xiàn)耦合和共同分析。學(xué)術(shù)領(lǐng)域當(dāng)下研究熱點(diǎn)和未來前沿可運(yùn)用CiteSpace 軟件對文獻(xiàn)關(guān)鍵詞和突現(xiàn)詞匹配銜接進(jìn)行可視化分析;對于深入挖掘?qū)W科領(lǐng)域的熱點(diǎn)文獻(xiàn),可通過分析繪制聚類和時(shí)區(qū)圖譜得出結(jié)論,同時(shí)可以繪制出動(dòng)態(tài)、分時(shí)、多元的科學(xué)熱點(diǎn)圖譜。
在CiteSpace 中可以被設(shè)置為TopN=50,TopN的%=10%,前后中這是三個(gè)時(shí)間段的c、cc、ccv的閾值分別為都是(2,2,20),(4,3,20),(4,3,20),時(shí)間跨度均為從2001—2021 年(TimeSlicing:From2001 年To2021 年底),時(shí)間切片周期為每間隔1 年一次(YearPerSlice1),利用CiteSpace 軟件對XBRL 主題數(shù)據(jù)庫和中國CNKI 全文數(shù)據(jù)庫中收錄的所有作者主題類型數(shù)據(jù)進(jìn)行了聚類與分析,得到結(jié)果與在2001—2021 年期間所進(jìn)行過的相關(guān)的課題相關(guān)研究第一或作者合作完成的核心網(wǎng)絡(luò)圖(圖1),節(jié)點(diǎn)數(shù)537 個(gè)(N=537),線數(shù)207條(E=207),密度為0.0014(Density=0.0014)。
圖1 2001—2021 年“XBRL”研究作者的核心網(wǎng)絡(luò)
根據(jù)圖1,利用CiteSpace 進(jìn)行數(shù)據(jù)導(dǎo)出可以得到關(guān)于XBRL 研究相關(guān)性最強(qiáng)的順序表格。
由圖2 可知,國內(nèi)關(guān)于XBRL 研究相關(guān)性最強(qiáng)的是張?zhí)煳鳎浯问嵌琶澜?,第三是吳忠生,其次還有李吉梅、毛元青等。聯(lián)系圖1 圖2 可以發(fā)現(xiàn),關(guān)于“會(huì)計(jì)”與“高質(zhì)量發(fā)展”研究的作者比較分散,頻數(shù)也較低,線條的數(shù)量較少,說明相互之間基本沒有聯(lián)系。
圖2 研究作者相關(guān)性數(shù)據(jù)導(dǎo)出
關(guān)鍵詞研究是根據(jù)一篇科研論文領(lǐng)域的主要核心概況,對研究論文關(guān)鍵詞進(jìn)行的綜合性分析,可以用來對一篇文章主題框架進(jìn)行綜合分析,也能深入分析歸納出未來該主題領(lǐng)域研究的關(guān)鍵詞主題內(nèi)涵變化特點(diǎn)及其發(fā)展演進(jìn)新路徑。本文主要對關(guān)鍵詞進(jìn)行共歸線類和聚類兩類方法分析。
1.關(guān)鍵詞共線分析
在CiteSpace 中可以被設(shè)置為TopN=50,TopN的%=10%,前后中這是三個(gè)時(shí)間段的c、cc、ccv的閾值分別為都是(2,2,20),(4,3,20),(4,3,20),時(shí)間跨度都設(shè)置為2001—2021 年(TimeSlicing:From2001To2021 年),時(shí)間切片的周期通常為至少每間隔1 年一次(如主題YearPerSlice1),利用CiteSpace 軟件就可以實(shí)現(xiàn)對所有XBRL 主題數(shù)據(jù)和在CNKI 主題全文數(shù)據(jù)表庫中包含的其他所有的關(guān)鍵詞主題類型數(shù)據(jù)進(jìn)行聚類分析,得到2001—2021 年進(jìn)行相關(guān)研究主題的核心網(wǎng)絡(luò)圖(圖3),節(jié)點(diǎn)數(shù)589 個(gè)(N=589),線數(shù)1290 條(E=1290),密度為0.0074(Density=0.0074)。
圖3 關(guān)鍵詞共線知識(shí)圖譜
共線分析法是指利用一個(gè)相關(guān)文獻(xiàn)里集中多個(gè)相關(guān)詞匯短語或單個(gè)相關(guān)名詞短語之間的共線關(guān)系出現(xiàn)和頻率分布的變動(dòng)等情況來綜合研究或確定它們與一個(gè)所選相關(guān)主題文獻(xiàn)集中所選要共同代表的主題詞的或者其他與各有關(guān)的主題詞語之間存在的某些相互關(guān)系。圖3 中所列出的關(guān)鍵詞的構(gòu)成都采取了十字形節(jié)點(diǎn)標(biāo)識(shí),節(jié)點(diǎn)間距的越大即表明該組關(guān)鍵詞的出現(xiàn)頻率越高,研究結(jié)果的熱度效應(yīng)也就會(huì)越強(qiáng)。選取排名在前10 名之內(nèi)的10 個(gè)數(shù)據(jù)節(jié)點(diǎn),主要選擇隨機(jī)排序出現(xiàn)過的10 個(gè)特征比較明顯的數(shù)據(jù)節(jié)點(diǎn),依次排名后分別為XBRL、實(shí)例文檔、會(huì)計(jì)信息化、XBRL 財(cái)務(wù)報(bào)告、可擴(kuò)展商業(yè)報(bào)告語言、網(wǎng)絡(luò)財(cái)務(wù)報(bào)告、信息披露、信息技術(shù),以及財(cái)務(wù)報(bào)告、中國會(huì)計(jì)學(xué)會(huì)。節(jié)點(diǎn)層次數(shù)越多,中心度也越高,起到信息連接作用與網(wǎng)絡(luò)傳遞信息作用之間的節(jié)點(diǎn)關(guān)鍵詞數(shù)越多,在整個(gè)通信網(wǎng)絡(luò)內(nèi)的通信媒介作用功能也應(yīng)越強(qiáng)。為了方便快速準(zhǔn)確顯示知識(shí)圖譜中的所有關(guān)鍵節(jié)點(diǎn),列出了排名前20 位中的高頻檢索詞與高中心度關(guān)鍵詞,如表1 所示。
表1 高頻熱詞與高中心度關(guān)鍵詞列表(前20 位)
由表1 可以發(fā)現(xiàn),在本文所被引用到的文本庫數(shù)據(jù)中,研究熱點(diǎn)主要都圍繞在XBRL、分類標(biāo)準(zhǔn)、財(cái)務(wù)報(bào)告、會(huì)計(jì)信息質(zhì)量、審計(jì)、信息化、大企業(yè)數(shù)據(jù)采集等方面,關(guān)于研究中熱度相對較高的如XBRL、分類標(biāo)準(zhǔn)等、網(wǎng)絡(luò)財(cái)務(wù)報(bào)告這三個(gè)關(guān)鍵詞分別在2004 年、2003 年、2001 年首次顯現(xiàn),此時(shí)期也是XBRL 剛提出的時(shí)間段,研究學(xué)者從那個(gè)階段開始就一直在對分類標(biāo)準(zhǔn)以及XBRL 在網(wǎng)絡(luò)財(cái)務(wù)報(bào)告的應(yīng)用方面進(jìn)行大量研究。排名前19 名的關(guān)鍵詞都在2010 年之前就開始顯現(xiàn)。2010 年以后對策、管理會(huì)計(jì)、云計(jì)算和大數(shù)據(jù)等關(guān)鍵詞開始逐步顯現(xiàn),XBRL 的研究方向開始向這些關(guān)鍵詞傾斜。
2.關(guān)鍵詞聚類分
在建立了關(guān)鍵詞網(wǎng)絡(luò)共軛線知識(shí)圖譜體系框架的基礎(chǔ)上,運(yùn)用了多MI(Multipleinstance)算法從多個(gè)關(guān)鍵詞網(wǎng)絡(luò)節(jié)點(diǎn)中分別隨機(jī)提取標(biāo)簽以顯示網(wǎng)絡(luò)聚類命名,得到了一個(gè)關(guān)鍵詞網(wǎng)絡(luò)聚類網(wǎng)絡(luò)知識(shí)圖譜,如圖4 所示,在聚類網(wǎng)絡(luò)圖示模型中,聚類序號(hào)值越小,代表的網(wǎng)絡(luò)聚類輪廓值也越大,節(jié)點(diǎn)代表性越強(qiáng),網(wǎng)絡(luò)密度值越大。
在數(shù)據(jù)庫中,關(guān)于對“XBRL”的研究選取出10 個(gè)聚類標(biāo)簽:#0“XBRL”、#1“實(shí)例文檔”、#2“ 會(huì)計(jì)信息化”、#3“XBRL 財(cái)務(wù)報(bào)告”、#4“可擴(kuò)展商業(yè)報(bào)告語言”#5“網(wǎng)絡(luò)財(cái)務(wù)報(bào)告”、#6“信息披露”、#7“信息技術(shù)”、#8“財(cái)務(wù)報(bào)告”和#9 中國會(huì)計(jì)學(xué)會(huì),最終,各聚類中出現(xiàn)次數(shù)較多的關(guān)鍵詞如表2 所示。
表2 各聚類出現(xiàn)頻次較高的關(guān)鍵詞
3.關(guān)鍵詞時(shí)間軸與時(shí)區(qū)
利用CiteSpace 軟件對手機(jī)文庫進(jìn)行關(guān)鍵詞共線,在關(guān)鍵詞貢獻(xiàn)基礎(chǔ)上進(jìn)行形象化布局,在Visualizations 中選取時(shí)間軸(TimelineView)與時(shí)區(qū)(TimezoneView)可得到關(guān)鍵詞時(shí)間軸(圖5)與關(guān)鍵詞時(shí)區(qū)(圖6)。
圖5 關(guān)鍵詞時(shí)間軸
圖6 關(guān)鍵詞時(shí)區(qū)
根據(jù)圖5 關(guān)鍵詞時(shí)間軸與圖6 關(guān)鍵詞時(shí)區(qū)圖,可以清晰地看出2001—2021 年中每年的關(guān)鍵詞變化情況,以及在關(guān)鍵詞之間的聯(lián)系情況。在2001年處于起步階段,“會(huì)計(jì)數(shù)據(jù)”等關(guān)鍵詞是該年的核心研究主題。2002 年“網(wǎng)絡(luò)財(cái)務(wù)報(bào)告”“信息披露”“財(cái)務(wù)報(bào)告”這三個(gè)關(guān)鍵詞呈現(xiàn)出較強(qiáng)的中介中心性。2003 年的“分類標(biāo)準(zhǔn)”關(guān)鍵詞的顯現(xiàn),呈現(xiàn)出更強(qiáng)的中介性。2004—2005 年出現(xiàn)了大量的中介中心性強(qiáng)的關(guān)鍵詞,如“xml”“可擴(kuò)展商業(yè)報(bào)告”“信息化”“上市公司”“會(huì)計(jì)信息”等,都與此后的研究呈現(xiàn)較強(qiáng)的共線性。由圖6 關(guān)鍵時(shí)區(qū)可以看出,關(guān)于XBRL 的研究在2015 年之前研究關(guān)鍵詞的中心中介性更高,關(guān)鍵詞之間的共線性也比較高。在2016 年以后,關(guān)于XBRL 的研究的熱度出現(xiàn)一定下降,2016—2019 年間的關(guān)于XBRL的研究關(guān)鍵詞較少,且中介中心性也比較低,2018年處于熱度最低的狀態(tài)。2020 年開始,關(guān)于XBRL的研究出現(xiàn)了“區(qū)塊鏈”“人工智能”等新的關(guān)鍵詞,意味關(guān)于XBRL 的研究出現(xiàn)了新的方向。根據(jù)圖7關(guān)鍵詞突變圖,檢測出14 個(gè)關(guān)鍵詞突變量,可以看出,近些年的研究熱點(diǎn)集中在“大數(shù)據(jù)”“XBRL報(bào)告”“管理會(huì)計(jì)”“持續(xù)審計(jì)”這幾個(gè)關(guān)鍵詞。
圖7 關(guān)鍵詞突變圖
由此,若再分別將關(guān)鍵詞與共聚類線性知識(shí)圖譜(圖3)、高頻詞與頻率較高的中心頻次度的關(guān)鍵詞(表1)等、關(guān)鍵詞與共聚類知識(shí)圖譜(圖4)等、各中心共聚類下出現(xiàn)過的中心頻次度或較次高的中心次數(shù)的關(guān)鍵詞(表2)等、關(guān)鍵詞時(shí)間區(qū)軸(圖5)等與關(guān)鍵詞時(shí)區(qū)(圖6)等綜合到一起來做對比和分析,可以較清楚地看出,目前該細(xì)分學(xué)科領(lǐng)域關(guān)鍵詞研究主題演變的特點(diǎn)及沿關(guān)鍵詞方向演化發(fā)展的基本路徑:如高質(zhì)量發(fā)展和管理會(huì)計(jì)及業(yè)財(cái)融合和會(huì)計(jì)改革與人才培養(yǎng)關(guān)鍵詞等研究的主題特點(diǎn)最為顯著和突出,且都呈現(xiàn)著相互或交叉關(guān)聯(lián)研究的主要?jiǎng)討B(tài)發(fā)展演化過程和路徑。
通過統(tǒng)計(jì)分析XBRL 相關(guān)文章和引文的時(shí)間軸情況,發(fā)現(xiàn)其發(fā)表數(shù)量于2007 年開始大量增長。由于財(cái)務(wù)信息化、財(cái)務(wù)智能化、財(cái)務(wù)共享深入發(fā)展,掀起了以研究XBRL 為代表的信息披露浪潮。隨著大數(shù)據(jù)、人工智能、云計(jì)算、區(qū)塊鏈等新技術(shù)的迅速發(fā)展和廣泛應(yīng)用,自2010 年開始,XBRL 領(lǐng)域研究熱度大增,研究內(nèi)容豐富化。
通過對XBRL 文獻(xiàn)的知識(shí)結(jié)構(gòu)進(jìn)行分析,可以看出,近些年的研究熱點(diǎn)集中在“大數(shù)據(jù)”“XBRL報(bào)告”“管理會(huì)計(jì)”“持續(xù)審計(jì)”這幾個(gè)關(guān)鍵詞。對高頻關(guān)鍵詞點(diǎn)進(jìn)行共現(xiàn)圖譜分析之后可以發(fā)現(xiàn)XBRL 研究熱點(diǎn)主要交叉于幾個(gè)方面:財(cái)務(wù)與審計(jì)轉(zhuǎn)型、集團(tuán)財(cái)務(wù)共享中心、大數(shù)據(jù)管理會(huì)計(jì)與會(huì)計(jì)教育、智能財(cái)務(wù)、區(qū)塊鏈會(huì)計(jì)。
XBRL 研究熱點(diǎn)緊跟新興技術(shù)和經(jīng)濟(jì)發(fā)展,有顯著的需求導(dǎo)向和科技賦能。通過動(dòng)態(tài)演化分析XBRL 研究內(nèi)容和關(guān)鍵詞熱點(diǎn),隨著其不斷發(fā)展,研究主題表現(xiàn)出不斷融合交叉的趨勢,關(guān)鍵詞點(diǎn)聚性逐漸降低,但多角度化程度加深。