齊萱 馬曉慶 李巖 劉樹海
摘 要:收集了2012-2017年深圳證券交易所中小企業(yè)板年度報告,共計3090份有效樣本,從創(chuàng)新意識、創(chuàng)新支持、創(chuàng)新管理、創(chuàng)新實現(xiàn)、創(chuàng)新推廣、創(chuàng)新效果等方面創(chuàng)建中小企業(yè)創(chuàng)新行為自愿性信息披露評價指數(shù),利用深度學習技術(shù)——Word2vec給出科學的評判方法。然后從披露內(nèi)容、行業(yè)類型、產(chǎn)權(quán)性質(zhì)、地理區(qū)域等方面對中小企業(yè)板創(chuàng)新行為自愿性信息披露現(xiàn)狀進行分析評價,結(jié)果表明:中小企業(yè)創(chuàng)新行為自愿性信息6年平均披露程度為50.83%,整體水平雖然不是很高,但是呈現(xiàn)逐年上升的趨勢,未來在創(chuàng)新支持和創(chuàng)新實現(xiàn)方面還有很大的提升空間。
關(guān)鍵詞:創(chuàng)新行為;自愿性信息披露;深度學習;Word2vec
中圖分類號:F23 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2020.02.057
0 引言
目前,中國已進入經(jīng)濟發(fā)展的新常態(tài),創(chuàng)新驅(qū)動已成為加速企業(yè)形成新發(fā)展方式,提高整體質(zhì)量和效益的新動力。在新的創(chuàng)新浪潮中,大量中小企業(yè)積極致力于技術(shù)創(chuàng)新,一些大型企業(yè)也不一定投身于所有的技術(shù)創(chuàng)新,他們可以購買外部技術(shù),通過中小企業(yè)來實現(xiàn)其創(chuàng)新“副產(chǎn)品”的價值。隨著大數(shù)據(jù)、互聯(lián)網(wǎng)等信息技術(shù)的不斷發(fā)展,企業(yè)越來越多的創(chuàng)新內(nèi)容已經(jīng)成為投資者評價企業(yè)發(fā)展的重要決策依據(jù)。中小企業(yè)較高的技術(shù)含量、良好的盈利能力以及快速增長使其成為創(chuàng)新和創(chuàng)業(yè)的重要生力軍。中小企業(yè)充分披露創(chuàng)新行為信息則有利于其獲得外部資金,推動其投資活動,從而達到資源的有效配置。
基于此,本文從創(chuàng)新意識、創(chuàng)新支持、創(chuàng)新管理、創(chuàng)新實現(xiàn)、創(chuàng)新推廣、創(chuàng)新效果等方面研究中小企業(yè)創(chuàng)新行為自愿性信息披露評價問題,本文的貢獻在于:一是創(chuàng)建中小企業(yè)創(chuàng)新行為自愿性信息披露評價指數(shù);二是利用深度學習技術(shù)給出科學的評判方法。
1 文獻回顧
創(chuàng)新行為信息披露最早可以追溯到Allen(1983)的研究,旨在節(jié)約高昂的長期知識保護成本。中國關(guān)于企業(yè)創(chuàng)新行為信息披露的研究起源于對無形資產(chǎn)研發(fā)信息披露的研究。薛云奎(2001)發(fā)現(xiàn)中國上市公司R&D費用信息披露不當或不充分,整體披露水平不高。后續(xù)學者使用內(nèi)容分析法建立R&D或創(chuàng)新的信息披露指標,以評估信息披露的程度:韓鵬和彭韶兵(2012)構(gòu)建R&D信息披露質(zhì)量評價指標體系,然后利用熵值法測量和分析創(chuàng)業(yè)板上市公司2010年度報告中披露的信息質(zhì)量;王娟和張世舉(2014)從基于知識的無形資產(chǎn)、R&D投入、創(chuàng)新資金來源、創(chuàng)新效益和創(chuàng)新激勵分配等方面評價中國信息技術(shù)產(chǎn)業(yè)上市公司技術(shù)創(chuàng)新信息披露發(fā)現(xiàn):技術(shù)創(chuàng)新信息披露質(zhì)量比新準則實施前有較大提高,但還是存在主動自愿披露積極性不高,重形式輕實質(zhì)等問題;韓鵬和岳園園(2016)以我國創(chuàng)業(yè)板2012-2014年上市公司為對象,將創(chuàng)新行為信息披露分為強制性和自愿性,分析創(chuàng)新行為信息披露的經(jīng)濟后果;馮科和杜微(2016)以創(chuàng)業(yè)板市場為研究對象,將企業(yè)創(chuàng)新行為信息分為四個維度:公司戰(zhàn)略規(guī)劃、產(chǎn)品自主創(chuàng)新、新增知識產(chǎn)權(quán)、創(chuàng)新政策受惠,研究發(fā)現(xiàn)創(chuàng)業(yè)板上市公司創(chuàng)新信息披露能夠?qū)е鹿蓛r異動。
還有學者將語料庫語言學中“共現(xiàn)頻率”運用到自愿性信息披露研究中,即相關(guān)關(guān)鍵詞出現(xiàn)的頻率越高,說明企業(yè)對此相關(guān)文本信息的披露意愿越大,表示管理層自愿性披露創(chuàng)新行為信息的傾向越大。Entwistle(1999)使用描述研發(fā)信息的句子數(shù)來衡量研發(fā)信息披露水平,從研發(fā)資源、研發(fā)產(chǎn)出、研發(fā)資金來源、研發(fā)后續(xù)投入保障等角度選取這些句子。王宇峰(2009)提出企業(yè)R&D信息披露的類目,包括:R&D戰(zhàn)略及未來支出、R&D投入、R&D產(chǎn)出、會計問題、會計政策,選取句子數(shù)作為分析R&D信息披露的頻率。James和Shaver(2016)的研究則是將含有研究、研發(fā)、專利、新科技等方面的詞語搭配作為關(guān)鍵詞,從中提取研發(fā)信息。王華(2018)考慮到中文語境語義判斷難度,從表達能力和切分難度視角選擇以“詞”為研究對象,構(gòu)建研發(fā)關(guān)鍵詞庫,以年報中相關(guān)詞頻統(tǒng)計度量研發(fā)文本信息披露程度。
由上述可見,創(chuàng)新行為信息多采用指標評價法人工處理信息,文本信息的搜集、整理和分析多歸于人的主觀判斷,客觀性略顯不足,同時也存在著大樣本研究困難等問題。而在目前我國自愿性信息披露普遍意愿不足的情況下,若將這種指標評價直接用于長時期、全行業(yè)的樣本,則很難形成整體的有效評分。為此,本文則利用深度學習的神經(jīng)網(wǎng)絡(luò)計算技術(shù)自建處理模塊,對中小企業(yè)板上市公司年報進行全樣本提取與計算,使得創(chuàng)新行為自愿性信息披露評價更加科學。
2 基于Word2vec的文本挖掘
文本挖掘是要將文本轉(zhuǎn)化為數(shù)據(jù)以供后續(xù)分析。最典型的方法是基于詞袋的方法(Bag-of-Word,BOW)。所謂“詞袋”就是裝著詞的袋子。該方法就是將一段文本,比如一個句子或一個文檔,用一個裝著詞的袋子來表示。比如說有這樣兩句話,“技術(shù)創(chuàng)新帶動產(chǎn)品創(chuàng)新,機制創(chuàng)新促進自主創(chuàng)新”,那么詞袋里就是:[技術(shù),創(chuàng)新,帶動,產(chǎn)品,機制,促進,自主],用數(shù)組表現(xiàn)這兩句話就是:[1,2,1,1,0,0,0],[0,2,0,0,1,1,1]。這里每組數(shù)據(jù)的維度就是詞袋總數(shù),而每項數(shù)據(jù)值則是各個詞出現(xiàn)的頻率。由此可見,隨著句子增加,數(shù)組的維度將會變得巨大,而且會有大量的稀疏空間,即0的出現(xiàn)。為了解決這個問題,詞向量的概念被引入。
詞向量又稱分布式表示(Distributed representation)。它最初是由Hinton在1986年提出的。詞向量的構(gòu)想是這樣的,將構(gòu)成文本的每個基本元素即單詞,通過一定的訓練,映射到由全部單詞組成的低維向量空間,每個單詞則形成向量空間中對應(yīng)的一個點。因此,向量空間中的向量運算可用于處理單詞與單詞之間的關(guān)系,例如使用向量空間中兩點之間的距離來表示兩個單詞之間的相似性。使用這種單詞表示方式可以很好地克服詞袋法的文本向量維度過大的缺點,因此兩個單詞含義越相似,向量空間中的距離就越近。這就將處理文本內(nèi)容的方法轉(zhuǎn)換為多維向量空間中的向量運算,向量空間上的距離即可表示文本語義相似度。
本文中使用的Word2vec是由Google的Mikolov在2013年提出的基于神經(jīng)網(wǎng)絡(luò)的深度學習算法。該算法將每個單詞表示為實數(shù)值的向量,即所謂的詞向量。Word2vec算法的基本構(gòu)思是基于Bengio三層神經(jīng)網(wǎng)絡(luò)語言模型的改進。它由兩個模型組成:(1)CBOW模型,它通過上下文預(yù)測當前詞;(2)Skip-gram模型,它通過當前詞來預(yù)測上下文。本文的目標是利用所給定的創(chuàng)新行為自愿性信息指標來計算各個上市公司的信息披露程度與其的相關(guān)性,因此采用Skip-gram模型來進行計算。
顧名思義,Skip-gram就是“跳過某些符號”,例如,句子“技術(shù)創(chuàng)新能夠帶動產(chǎn)品創(chuàng)新”有4個3元詞組,分別是“技術(shù)創(chuàng)新能夠”,“創(chuàng)新能夠帶動”,“能夠帶動產(chǎn)品”,“帶動產(chǎn)品創(chuàng)新”,我們發(fā)現(xiàn)這句話的本意是“技術(shù)帶動產(chǎn)品”或“創(chuàng)新帶動產(chǎn)品”。但是,上述四個3元詞組并未反映出此信息。 Skip-gram模型卻允許跳過一些詞,因此它可以形成名為“技術(shù)帶動產(chǎn)品”的3元詞組。如果允許跳過2個詞,即2 Skip-gram,則上述句子組成的3元詞組可以用表1顯示。
由表1可以看出:一方面,Skip-gram反映了句子的真正含義,在新組成的18個3元詞組中,有5個詞組可以正確反映例句的真實含義。另一方面,語料庫得到擴展,3元詞組已從原來的4個擴展到18個,擴展后的語料庫可以提高文本訓練的準確性??梢钥闯?,獲得的詞向量可以更好地反映文本的真實含義。
3 基于Word2vec的創(chuàng)新行為自愿性信息披露指標評價——以中小企業(yè)板為例
中小企業(yè)由于規(guī)模小、信用低、資源短缺、風險大等原因致使其融資相對困難,則促使其更有動機主動多披露自愿性創(chuàng)新行為信息以緩解其融資約束、提高投資效率。但是對中小企業(yè)管理層而言,在考慮市場進入障礙、企業(yè)競爭力以及披露成本和收益等,尚不清楚如何把握創(chuàng)新行為自愿信息的實際披露水平,由此,有必要建立科學的中小企業(yè)創(chuàng)新行為自愿性信息披露評估體系進行量化。
3.1 選擇創(chuàng)新行為的自愿性信息披露指標
本文主要參考Botosan(1997)研究思路,結(jié)合的創(chuàng)新過程視角,構(gòu)建創(chuàng)新行為的自愿信息披露指標。評估指標包括相互獨立的6項內(nèi)容和17項細分指標。披露內(nèi)容涉及中小企業(yè)創(chuàng)新意識、創(chuàng)新支持、創(chuàng)新管理、創(chuàng)新實現(xiàn)、創(chuàng)新推廣、創(chuàng)新效果等方面的情況,細分指標用于在年報中定位采集信息點。
3.2 研究樣本及詞頻采集
本文選取2012年至2017 年深圳證券交易所中小企業(yè)板上市公司年報,分為 16 個行業(yè)類別,剔除金融行業(yè)和數(shù)據(jù)缺失的公司,最終每年獲得515份有效樣本;然后,從有效樣本中篩選和提取創(chuàng)新行為自愿性信息披露相關(guān)詞頻,共計481個,如和創(chuàng)新文化相關(guān)的詞頻有:首先文化建設(shè)、創(chuàng)新思維、技術(shù)創(chuàng)新理念、科創(chuàng)立企、創(chuàng)新變革、崇尚創(chuàng)新、創(chuàng)新為先、改革創(chuàng)新、文化引領(lǐng)、特色企業(yè)文化,自主創(chuàng)新理念等;然后用Word2vec評估創(chuàng)新行為的17個自愿性信息披露指標的相似性,即中小企業(yè)創(chuàng)新行為的自愿性信息披露程度;最后將所有有效樣本的相似度按行業(yè)、地區(qū)、年份等存儲在 Excel表中。
3.3 基于Word2vec的創(chuàng)新行為自愿性信息披露程度評價的過程
本文利用開源軟件包Word2vec以及其它輔助的開源軟件包,在阿里云的配置為CPU64核內(nèi)存128G云服務(wù)器上進行運算,通過以下五個步驟實現(xiàn)創(chuàng)新行為自愿性信息披露程度的自動評價過程(見圖1)。
步驟一:為了方便后續(xù)處理,首先利用JAVA語言調(diào)用開源軟件包PDFBox將采集到的中小企業(yè)板2013-2017年515家上市公司共計2575份年報PDF版轉(zhuǎn)換成TXT文本。
步驟二:利用PYTHON語言調(diào)用開源軟件包JIEBA將TXT文本進行分詞。在此除了JIEBA自帶的詞典之外,還使用了會計專業(yè)詞典以及自定義的詞典以提高分詞的準確率。
步驟三:在分詞之后,利用PYTHON語言構(gòu)建停用詞表,去掉數(shù)字以及多次出現(xiàn)的與評價體系無關(guān)的詞頻,即停用詞,如“情況、報告、適用、項目、董事會、獨立、主要”等,經(jīng)過反復測試,最后本文去掉排名前100個停用詞,以減少機器讀取相關(guān)指標信息的干擾,對文本進行過濾。
步驟四:使用上述預(yù)處理語料庫制作全樣本,使用PYTHON調(diào)用Word2vec并通過Skip-gram模型進行訓練以獲得詞向量模型。對應(yīng)詞向量形式為W=(V1,V2,…,Vn),其中 W 為對應(yīng)詞匯,Vi(1≤i≤n)為詞匯 W的第i個特征維度(一般n的值在100-500之間)。Word2vec提供了20個參數(shù)來調(diào)整訓練過程。不同參數(shù)的選擇對生成的詞向量質(zhì)量及其相應(yīng)的訓練速度有影響。熊富林(2015)的實驗結(jié)果表明:各項指標對應(yīng)的平均相關(guān)度隨著維度的變化而變化,在維度達到250以后趨于平穩(wěn)。由此本文將Word2vec在中文處理中的維度設(shè)置為256。本文使用的Word2vec的參數(shù)如表3所示。
步驟五:依據(jù)人工整理的481個反映創(chuàng)新行為自愿性信息披露詞頻,分17類指標進行文本相似度計算。利用以上訓練得到的詞向量模型,依次計算每份年報與指標之間的相似度, 即該中小企業(yè)創(chuàng)新行為自愿性信息披露的程度并以CSV格式輸出。
3.4 評估中小企業(yè)板創(chuàng)新行為自愿性信息披露程度
總體而言,2012-2017年中國中小企業(yè)板創(chuàng)新行為的自愿性信息披露整體水平不是很高,但正在逐步上升。在樣本期間內(nèi),平均披露程度由2012年的4838%增至2017年5391%(見圖2)。下面分別從披露內(nèi)容、行業(yè)、產(chǎn)權(quán)性質(zhì)和區(qū)域等方面分析。
3.4.1 分析中小企業(yè)創(chuàng)新行為自愿性信息披露內(nèi)容
中小企業(yè)板2012-2017年創(chuàng)新行為自愿性信息披露整體保持增長態(tài)勢,評價結(jié)果發(fā)現(xiàn):(1)創(chuàng)新意識上繼續(xù)提高。其在頭兩年上升,2014年略有下降,然后在2014-2017的三年期間繼續(xù)上升。這表明創(chuàng)新思維等受到重視,在不斷地拓展。(2)創(chuàng)新支持方面雖然穩(wěn)中有升,但披露程度在六項披露內(nèi)容里是最低的,由此,中小企業(yè)還要通過人才激勵、更新創(chuàng)新基礎(chǔ)設(shè)施等措施做好配套的支持創(chuàng)新工作。(3)創(chuàng)新管理表現(xiàn)較好,增長態(tài)勢趨于平緩。從2012年54.83%開始增長,2014年下降,后三年持續(xù)增長。得益于企業(yè)組織管理創(chuàng)新等不斷開展,風險控制不斷完善。(4)創(chuàng)新實現(xiàn)方面前三年處于波動水平,后三年為上升態(tài)勢,2017年達到最高52.16%。創(chuàng)新實現(xiàn)依靠著企業(yè)的研發(fā)方式、制造能力等,通過這些方式使企業(yè)快速地發(fā)展。(5)創(chuàng)新推廣方面表現(xiàn)最好,六年間大幅度提升披露程度。從2012年到2017年的一直上升,高達62.38%。隨著互聯(lián)網(wǎng)、人工智能的普及,營銷創(chuàng)新等的推廣,使企業(yè)的品牌形象等綜合實力逐漸增強。(6)創(chuàng)新效果方面整體保持增長態(tài)勢,除了2014年稍有下降。說明創(chuàng)新終將給企業(yè)帶來良好的經(jīng)濟效益。
3.4.2 分析不同行業(yè)中小企業(yè)創(chuàng)新行為的自愿性信息披露程度
根據(jù)深交所中小企業(yè)板的樣本得到14個一級行業(yè),按照行業(yè)對2012-2017年創(chuàng)新行為自愿性信息披露綜合實力進行對比評價。限于篇幅,本文主要描述和評價位居前三和后三的行業(yè)結(jié)果。住宿和餐飲業(yè)位居第一,前三年為下降趨勢,后三年為上升趨勢,到2017年達到56.82%。這反映出該行業(yè)普遍變動靈活,對創(chuàng)新有快速適應(yīng)能力和把控力。租賃和商務(wù)服務(wù)業(yè)居第二,前兩年披露程度為上漲,2014年稍有下降,接著從2015年的52.59%一路漲到2017年的53.88%;得益于國家的政策支持及產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級的重要作用,該行業(yè)的綜合實力獲得快速提升。信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)位列第三,由于其與新興技術(shù)具有較強的關(guān)聯(lián)性,隨著技術(shù)的迅速發(fā)展,行業(yè)信息披露水平也相應(yīng)提升:2012年披露程度開始上升,2014年略有下滑,但后三年穩(wěn)步上升。
最靠后的三個行業(yè)是交通運輸、倉儲和郵政業(yè),房地產(chǎn)業(yè)和采礦業(yè)。三個行業(yè)的增長態(tài)勢基本相同:前兩年增長、2014年下降后穩(wěn)定上升。由于三個行業(yè)屬于傳統(tǒng)制造業(yè),對自然資源依賴度較高,產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型和升級難度較大,創(chuàng)新行為難以形成行業(yè)核心競爭力。
3.4.3 分析不同產(chǎn)權(quán)下中小企業(yè)創(chuàng)新行為自愿性信息披露程度
根據(jù)上市公司產(chǎn)權(quán)性質(zhì),本文將2012-2017年中小企業(yè)板樣本企業(yè)分為國有企業(yè)與非國有企業(yè)。非國有中小企業(yè)創(chuàng)新行為的自愿性信息披露程度發(fā)生了很大變化,2012年的披露程度為48.55%,然后開始有下滑,雖2015年有所上升,但2016年下降到最低點22.77%,2017年回升。國有中小企業(yè)創(chuàng)新行為的自愿性信息披露程度每年都有所不同,但變化幅度很小,控制在4%之內(nèi),2012年為36.53%,雖然在2013-2016年之間自愿性信息披露程度有增有減,但2017年還是上升到了37.58%,見表4。
從表4可以看出,國有中小企業(yè)創(chuàng)新行為的自愿性信息披露水平高于非國有中小企業(yè),主要與國有中小企業(yè)的企業(yè)性質(zhì)有關(guān)。首先,國有中小企業(yè)信息披露機制比較完善,主動披露意識強;其次,為了向社會傳遞良好的信號,國有中小企業(yè)披露了相對更多關(guān)于創(chuàng)新行為的信息。非國有中小企業(yè)創(chuàng)新行為自愿性信息披露程度不穩(wěn)定與其融資困難相關(guān),該類企業(yè)資金獲取渠道比較狹窄,致使其投入到創(chuàng)新活動的資金相對不充足,導致其創(chuàng)新實現(xiàn)、創(chuàng)新推廣和創(chuàng)新效果不能達到預(yù)期,進而影響到披露程度。
3.4.4 分析中小企業(yè)不同地區(qū)創(chuàng)新行為的自愿性信息披露程度
對2012-2017年中小企業(yè)板樣本數(shù)據(jù)按東部、中部、西部和東北部劃分,發(fā)現(xiàn)披露水平差距較小,排名具體如下(見表5):東部地區(qū)增長最快,從2012年的48.61%上升到2017年的54.79%,增長了11.28%。在樣本期間,總體趨勢在上升,但在2014年略有下降。主要是東部地區(qū)鼓勵創(chuàng)新的政策較多,企業(yè)的創(chuàng)新行為也越來越多。東北地區(qū)排名第二,該地區(qū)從2012年的49.09%開始上升,到2014年有下降,之后三年披露程度呈上升趨勢, 2017年達到54.99%。這說明該地區(qū)的中小企業(yè)較重視企業(yè)創(chuàng)新,而且積極地向外界披露企業(yè)有關(guān)創(chuàng)新的活動。中部地區(qū)排名第三,該地區(qū)的創(chuàng)新行為自愿性信息披露程度從2012年的48.43%一直上升到2017年53.23%。這說明中部地區(qū)企業(yè)越來越重視創(chuàng)新,信息披露制度日益完善,企業(yè)更加主動地披露有關(guān)創(chuàng)新的信息。西部地區(qū)排名最靠后,2012年披露程度是47.83%,2013年有所上升,但2014年又開始下降,隨后在后三年呈上升趨勢。這說明該地區(qū)自身經(jīng)濟發(fā)展慢,創(chuàng)新意識缺乏,相應(yīng)的披露制度不規(guī)范,導致其披露水平落后于其他地區(qū)。
4 基于Word2vec的創(chuàng)新行為自愿性信息披露指標可靠性分析
4.1 Doc2vec模型與Word2vec所得出結(jié)果對比
Doc2vec是Mikolov基于Word2vec模型提出的針對句子以及短文的語言模型。Doc2vec本身也有兩種模型,PV-DM和PV-DBOW,分別對應(yīng)Word2vec的CBOW和Skip-gram。因此本文采用PV-DBOW作為比較。Doc2vec的評價流程與Word2vec完全一致,并選擇同樣的參數(shù)訓練模型以便于對比。最后將利用Word2vec計算的結(jié)果與利用Doc2vec計算的結(jié)果做Pearson相關(guān)分析,得到0.956的結(jié)果。由此可見,這兩種模型具有高度的一致性。
4.2 人工評判與Word2vec所得出結(jié)果對比
為保證評判技術(shù)結(jié)果的可靠性與準確性,本文隨機抽取52家樣本公司的技術(shù)評判結(jié)果與人工評判結(jié)果進行了對比。人工樣本采用里斯特量表,17個指標分別按照披露程度從0-5分打分,不考慮權(quán)重的影響。最后將17個指標的分值做簡單算術(shù)平均,取得中小企業(yè)創(chuàng)新行為自愿性信息披露得分。計算Pearson相關(guān)系數(shù)檢驗52家樣本公司的技術(shù)評判結(jié)果與人工評判結(jié)果的相關(guān)性??煽啃苑治霰砻?,在0.01的顯著水平下,人工評分與技術(shù)評分之間的Pearson相關(guān)系數(shù)為0.907,沒有顯著性差異。由此可以推斷,技術(shù)評分與人工評分對上市公司的自愿性信息的評價結(jié)果較為一致,技術(shù)評分的可信度較高。
5 結(jié)論
本文根據(jù)中小企業(yè)板上市公司創(chuàng)新行為的各項自愿性信息披露指標,提取、收錄和分析年報中是創(chuàng)新行為自愿信息,使用Word2vec進行文本挖掘和分析,判斷中小企業(yè)板上市公司創(chuàng)新行為的自愿信息披露水平。通過技術(shù)評判結(jié)果與人工評判結(jié)果的比較,進一步調(diào)試評判技術(shù),使其有效性達到可信度。本評判方法相對于人工評分,可以很大程度上提高閱讀冗長年報的精確度和效率,減少遺漏問題,克服人為主觀因素影響,使得中小企業(yè)板上市公司創(chuàng)新行為自愿性信息披露質(zhì)量評價更客觀、高效,為投資者的投資決策提供更科學的依據(jù)。但是,由于少部分報告的披露格式、語言風格等與大多數(shù)報告明顯不同,這種評判方法在處理少部分報告時會產(chǎn)生一些誤差,此外,未來上市公司報告語言可能會隨著政策變化而改變,這些問題還有待進一步研究加以克服。
參考文獻
[1]Allen R.Collective Invention[J].Journal of Economic Behavior and Organization.1983,4(1):1-24.
[2]薛云奎,王志臺.R&D的重要性及其信息披露方式的改進[J].會計研究,2001,(03):20-26+65.
[3]韓鵬,彭韶兵.研發(fā)信息披露質(zhì)量測度及制度改進[J].財經(jīng)科學,2012,(07):103-110.
[4]王娟,張世舉.企業(yè)技術(shù)創(chuàng)新信息披露:內(nèi)容、現(xiàn)狀與改進對策[J].河南科技大學學報(社會科學版),2014,32(02):70-75.
[5]韓鵬,岳園園.企業(yè)創(chuàng)新行為信息披露的經(jīng)濟后果研究——來自創(chuàng)業(yè)板的經(jīng)驗證據(jù)[J].會計研究,2016,(01):49-55+95.
[6]馮科,杜微.企業(yè)創(chuàng)新信息披露與中國創(chuàng)業(yè)板市場的有效性研究[J].新經(jīng)濟,2016,(16):26-39+4.
[7]Entwistle G M.Exploring the R&D disclosure environment[J].Accounting Horizons.1999,13(4):321-341.
[8]王宇峰,蘇逶妍.我國上市公司研發(fā)信息披露實證研究[J].中南財經(jīng)政法大學學報,2009,(4):108-113.
[9]James S,Shaver J M.Strategic motivations for voluntary public R&D disclosures[J].Academy of Management Discoveries.2016,2(3):290-312.
[10]王華,劉慧芬.產(chǎn)品市場競爭、代理成本與研發(fā)信息披露[J].廣東財經(jīng)大學學報,2018,33(03):52-64.
[11]Hinton G E.Learning distributed representations of concepts[C].Proceedings of CogSci.1986:1-12.
[12]Mikolov T,Sutskever I,C'hen K,et al.Distributed Representations of Words and Phrases and their Compositionality[J].Advances in Neural Information Processing Systems,2013,(26):3111-3119.
[13]Botosan C.Disclosure level and the cost of equity capital[J].Accounting Review,1997,72(3):323-349.
[14]熊富林,鄧怡豪,唐曉晟.Word2vec的核心架構(gòu)及其應(yīng)用[J].南京師范大學學報(工程技術(shù)版),2015,15(01):43-48.