隨著新一代信息技術(shù)在經(jīng)濟(jì)社會(huì)各領(lǐng)域的深度融入,以及移動(dòng)互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展推動(dòng),社會(huì)信息化進(jìn)程進(jìn)入大數(shù)據(jù)時(shí)代,數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長(zhǎng),數(shù)據(jù)資源已成為國家重要的戰(zhàn)略資源和核心創(chuàng)新要素。據(jù)國際權(quán)威機(jī)構(gòu)Statista調(diào)查和預(yù)測(cè),2020年全球大數(shù)據(jù)市場(chǎng)的收入規(guī)模將達(dá)到560億美元。我國在“十三五”規(guī)劃建議中明確提出:“實(shí)施國家大數(shù)據(jù)戰(zhàn)略,推進(jìn)數(shù)據(jù)資源開放共享?!背浞轴尫藕屠煤A繑?shù)據(jù)資源的價(jià)值,總結(jié)提煉數(shù)據(jù)中蘊(yùn)含的規(guī)律和經(jīng)驗(yàn),預(yù)測(cè)經(jīng)濟(jì)社會(huì)發(fā)展的趨勢(shì)并提供決策輔助,將使社會(huì)經(jīng)濟(jì)發(fā)展發(fā)生重大變革,同時(shí)推動(dòng)新一代信息技術(shù)與各行業(yè)的深度耦合和交叉創(chuàng)新,為國家發(fā)展帶來戰(zhàn)略性機(jī)遇(1)來源于國務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(國發(fā)〔2015〕50號(hào))。。
創(chuàng)新是知識(shí)經(jīng)濟(jì)的重要特征。大數(shù)據(jù)的研究和應(yīng)用通過海量數(shù)據(jù)特征和關(guān)聯(lián)關(guān)系的抽取,可以與不同產(chǎn)業(yè)相融合,挖掘和分析行業(yè)與領(lǐng)域內(nèi)有價(jià)值的數(shù)據(jù),獲得用戶行為信息,發(fā)現(xiàn)市場(chǎng)機(jī)會(huì),提升信息技術(shù)水平,從而促進(jìn)創(chuàng)新,驅(qū)動(dòng)整體經(jīng)濟(jì)良性增長(zhǎng)。鑒于大數(shù)據(jù)對(duì)創(chuàng)新和經(jīng)濟(jì)發(fā)展的潛在影響,美國、日本、歐盟等經(jīng)濟(jì)體都將大數(shù)據(jù)視作戰(zhàn)略資源,并將大數(shù)據(jù)提升為國家戰(zhàn)略。2014年,我國在政府工作報(bào)告中首次提出了“大數(shù)據(jù)戰(zhàn)略”,接著在2015年和2016年分別發(fā)布了《國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》、《國務(wù)院關(guān)于印發(fā)“十三五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃的通知》和《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》等文件,明確指出大數(shù)據(jù)是新一代信息技術(shù)產(chǎn)業(yè)的重要構(gòu)成和基礎(chǔ),并提出要“形成若干創(chuàng)新能力突出的大數(shù)據(jù)骨干企業(yè),培育一批專業(yè)化數(shù)據(jù)服務(wù)創(chuàng)新型中小企業(yè),培育10家國際領(lǐng)先的大數(shù)據(jù)核心龍頭企業(yè)和500家大數(shù)據(jù)應(yīng)用及服務(wù)企業(yè)。形成比較完善的大數(shù)據(jù)產(chǎn)業(yè)鏈,建設(shè)10-15個(gè)大數(shù)據(jù)綜合試驗(yàn)區(qū),創(chuàng)建一批大數(shù)據(jù)產(chǎn)業(yè)集聚區(qū),形成若干大數(shù)據(jù)新型工業(yè)化產(chǎn)業(yè)示范基地”。
政策效應(yīng)是學(xué)術(shù)界的研究熱點(diǎn),例如“營改增”政策對(duì)產(chǎn)業(yè)結(jié)構(gòu)、宏觀經(jīng)濟(jì)(陳釗和王旸,2016)[1]及企業(yè)價(jià)值的影響(王桂軍和曹平,2018)[2],財(cái)政支出政策的社會(huì)經(jīng)濟(jì)效應(yīng)(李娜等,2018)[3],國家生態(tài)工業(yè)示范園政策對(duì)城市工業(yè)部門高質(zhì)量發(fā)展的促進(jìn)作用(周鳳秀和溫湖煒,2019)[4],戰(zhàn)略性新興產(chǎn)業(yè)政策對(duì)企業(yè)創(chuàng)新的促進(jìn)作用(邢會(huì)等,2019)[5]等?,F(xiàn)有對(duì)我國大數(shù)據(jù)戰(zhàn)略效應(yīng)的研究較少,喻煒和王鳳生(2016)[6]構(gòu)建了由企業(yè)、消費(fèi)者和政府組成的三階段子博弈精煉納什均衡模型分析大數(shù)據(jù)戰(zhàn)略問題。此外還有對(duì)主要發(fā)達(dá)國家大數(shù)據(jù)政策的對(duì)比研究(張勇進(jìn)和王璟璇,2014)[7],以及對(duì)大數(shù)據(jù)政策的文本量化研究(周京艷等,2016)[8]。綜上可見,鮮有針對(duì)大數(shù)據(jù)戰(zhàn)略的定量分析,本文擬采用DID和機(jī)器學(xué)習(xí)方法,基于2013-2018年我國宏觀經(jīng)濟(jì)數(shù)據(jù)和上市公司信息,審視大數(shù)據(jù)戰(zhàn)略對(duì)中國企業(yè)創(chuàng)新產(chǎn)出的效應(yīng)和影響機(jī)制,探討大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過程中的關(guān)鍵因素。
2016年,國務(wù)院在《“十三五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》中指出:“未來5到10年是全球新一輪科技革命和產(chǎn)業(yè)變革從蓄勢(shì)待發(fā)到群體迸發(fā)的關(guān)鍵時(shí)期,信息經(jīng)濟(jì)繁榮程度將是國家實(shí)力的重要標(biāo)志,要實(shí)施網(wǎng)絡(luò)強(qiáng)國戰(zhàn)略,加快建設(shè)‘?dāng)?shù)字中國’,推動(dòng)物聯(lián)網(wǎng)、云計(jì)算和人工智能等技術(shù)向各行業(yè)全面融合滲透,構(gòu)建萬物互聯(lián)、融合創(chuàng)新、智能協(xié)同、安全可控的新一代信息技術(shù)產(chǎn)業(yè)體系”。當(dāng)前各國都將產(chǎn)業(yè)數(shù)字化創(chuàng)新作為經(jīng)濟(jì)發(fā)展的高度側(cè)重點(diǎn),互聯(lián)網(wǎng)、人工智能與農(nóng)業(yè)、傳統(tǒng)制造業(yè)、服務(wù)業(yè)深度融合的“全產(chǎn)業(yè)鏈”競(jìng)爭(zhēng)時(shí)代已經(jīng)到來。2019年,全球互聯(lián)網(wǎng)用戶數(shù)量達(dá)到41億,活躍社交媒體用戶達(dá)到37.25億,產(chǎn)業(yè)數(shù)字化在各國的數(shù)字經(jīng)濟(jì)中已占據(jù)主導(dǎo)地位。邊緣計(jì)算、區(qū)塊鏈、物聯(lián)網(wǎng)云計(jì)算和大數(shù)據(jù)等創(chuàng)新技術(shù)不斷涌現(xiàn),推動(dòng)產(chǎn)業(yè)高速迭代、創(chuàng)新模式和業(yè)態(tài)發(fā)展,并不斷出現(xiàn)涌現(xiàn)式創(chuàng)新。
大數(shù)據(jù)對(duì)第一產(chǎn)業(yè)的創(chuàng)新推動(dòng)作用主要體現(xiàn)在通過大數(shù)據(jù)的應(yīng)用來降低現(xiàn)代農(nóng)業(yè)發(fā)展過程中的試錯(cuò)成本,提高決策的準(zhǔn)確性、時(shí)效性。精準(zhǔn)農(nóng)業(yè)不僅帶來高產(chǎn),更重要的是提高生產(chǎn)效率?!掇r(nóng)業(yè)部關(guān)于推進(jìn)農(nóng)業(yè)農(nóng)村大數(shù)據(jù)發(fā)展的實(shí)施意見》中指出:“農(nóng)業(yè)農(nóng)村大數(shù)據(jù)已成為現(xiàn)代農(nóng)業(yè)新型資源要素,是提高農(nóng)業(yè)生產(chǎn)精準(zhǔn)化、智能化水平,推進(jìn)農(nóng)業(yè)資源利用方式轉(zhuǎn)變的重要推手。大數(shù)據(jù)將在生產(chǎn)智能化、自然災(zāi)害預(yù)測(cè)月報(bào)、動(dòng)植物病蟲害監(jiān)測(cè)預(yù)警、農(nóng)業(yè)環(huán)境資源精準(zhǔn)監(jiān)測(cè)、農(nóng)產(chǎn)品質(zhì)量全程追溯、農(nóng)產(chǎn)品產(chǎn)銷信息平臺(tái)等領(lǐng)域發(fā)揮巨大作用,形成新的產(chǎn)業(yè)增長(zhǎng)機(jī)會(huì)”。大數(shù)據(jù)對(duì)第二產(chǎn)業(yè)的創(chuàng)新推動(dòng)作用主要體現(xiàn)在工業(yè)互聯(lián)網(wǎng)領(lǐng)域,《工業(yè)和信息化部關(guān)于工業(yè)大數(shù)據(jù)發(fā)展的指導(dǎo)意見》中明確提出了“貫徹落實(shí)國家大數(shù)據(jù)發(fā)展戰(zhàn)略,促進(jìn)工業(yè)數(shù)字化轉(zhuǎn)型,激發(fā)工業(yè)數(shù)據(jù)資源要素潛力,加快工業(yè)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展”的目標(biāo)。大數(shù)據(jù)與第三產(chǎn)業(yè)的融合已產(chǎn)出眾多創(chuàng)新成果,如電子商務(wù)、電子政務(wù)、網(wǎng)絡(luò)帶貨、網(wǎng)約車等,各種基于大數(shù)據(jù)的電子服務(wù)創(chuàng)新開辟了大量細(xì)分市場(chǎng),拉動(dòng)了內(nèi)需,不斷促進(jìn)經(jīng)濟(jì)發(fā)展。綜上所述,提出假設(shè)H1。
假設(shè)H1:大數(shù)據(jù)戰(zhàn)略正向影響企業(yè)的創(chuàng)新產(chǎn)出。
信息技術(shù)產(chǎn)業(yè)發(fā)展最重要的推動(dòng)力是知識(shí)的學(xué)習(xí)和傳播,對(duì)應(yīng)著信息產(chǎn)業(yè)創(chuàng)新系統(tǒng)的重要功能是促進(jìn)顯性和隱性知識(shí)的學(xué)習(xí)以及有效擴(kuò)散。大數(shù)據(jù)的本質(zhì)是為了能更好地利用海量數(shù)據(jù)揭示出我們不知道的規(guī)律,解釋和說明事物,判斷事物間的聯(lián)系和邏輯,最終形成知識(shí),不斷拓展知識(shí)領(lǐng)域,實(shí)現(xiàn)創(chuàng)新。近年國外研究者提出的“BD2K”概念,就是著眼于大數(shù)據(jù)與知識(shí)之間的聯(lián)系和轉(zhuǎn)換(Bourne et al.,2015[9];Margolis et al.,2014[10]),并引申發(fā)展出大數(shù)據(jù)與知識(shí)工程(Hota et al.,2015)[11]、大數(shù)據(jù)與知識(shí)管理等多個(gè)研究領(lǐng)域(Baoan,2014)[12]。知識(shí)經(jīng)濟(jì)時(shí)代,知識(shí)和技術(shù)等無形資產(chǎn)已成為企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)的重要來源,是企業(yè)的戰(zhàn)略資產(chǎn)(Lai和Lin,2012[13];Stump et al.,2002[14])。創(chuàng)新技術(shù)推動(dòng)了產(chǎn)品和服務(wù)開發(fā),企業(yè)擁有的知識(shí)資源是其技術(shù)創(chuàng)新能否成功的關(guān)鍵影響因素,良好的知識(shí)管理能力已經(jīng)成為企業(yè)的核心能力之一。知識(shí)管理融合了現(xiàn)代信息技術(shù)、知識(shí)經(jīng)濟(jì)理論和企業(yè)現(xiàn)代管理理念,是匹配于知識(shí)經(jīng)濟(jì)時(shí)代的管理思想與方法。Davenport et al.(1998)[15]將知識(shí)管理定義為收集、分配和有效使用知識(shí)資源的過程。Bhatt(2001)[16]認(rèn)為知識(shí)管理是創(chuàng)建、驗(yàn)證、呈現(xiàn)、分發(fā)和應(yīng)用知識(shí)的過程。McDermott 和 O’Connor(2002)[17]指出,企業(yè)可以通過持續(xù)改進(jìn)或根本性創(chuàng)新來促進(jìn)業(yè)務(wù)發(fā)展,這兩種方法都是通過吸收組織內(nèi)部的新知識(shí)和相關(guān)知識(shí)而開展的。郝亞美(2016)[18]認(rèn)為知識(shí)管理的實(shí)施有助于提高研發(fā)型企業(yè)的核心競(jìng)爭(zhēng)力,建立知識(shí)管理體系是研發(fā)型企業(yè)與傳統(tǒng)企業(yè)的本質(zhì)區(qū)別。魏江等(2004[19],2007[20])提出企業(yè)集群功能整合和知識(shí)整合是促進(jìn)集群企業(yè)創(chuàng)新能力躍遷的必要條件,通過知識(shí)嵌入能推動(dòng)企業(yè)形成創(chuàng)新網(wǎng)絡(luò)從而獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。大數(shù)據(jù)是云計(jì)算實(shí)施的基礎(chǔ),云計(jì)算為企業(yè)知識(shí)管理系統(tǒng)提供存儲(chǔ)空間和高性能運(yùn)算能力,公有云的建設(shè)將使得中小型企業(yè)獲得和大型企業(yè)同樣的知識(shí)管理系統(tǒng)能力。此外,大數(shù)據(jù)與可視化以及數(shù)據(jù)挖掘的結(jié)合,使得知識(shí)管理系統(tǒng)更加智能化,運(yùn)行速度更快,知識(shí)的表現(xiàn)形式更加多元化,有利于知識(shí)在組織內(nèi)部的高效傳播,優(yōu)化企業(yè)的知識(shí)結(jié)構(gòu)和使用流程,促進(jìn)創(chuàng)新產(chǎn)出。
2016年,為加快實(shí)施國家大數(shù)據(jù)戰(zhàn)略,貫徹落實(shí)國務(wù)院《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,國家發(fā)展改革委員會(huì)連同工業(yè)與信息化部、中央網(wǎng)信辦,批復(fù)同意貴州省、京津冀、珠江三角洲、上海市、河南省、重慶市、沈陽市、內(nèi)蒙古八大區(qū)域開展國家大數(shù)據(jù)綜合試驗(yàn)區(qū)建設(shè),圍繞不同定位,開展系統(tǒng)性、整體性、協(xié)同性大數(shù)據(jù)綜合試驗(yàn)探索。設(shè)立國家大數(shù)據(jù)綜合試驗(yàn)區(qū)是大數(shù)據(jù)戰(zhàn)略中的一項(xiàng)重要舉措,從大數(shù)據(jù)制度創(chuàng)新、公共數(shù)據(jù)開放共享、大數(shù)據(jù)創(chuàng)新應(yīng)用、大數(shù)據(jù)產(chǎn)業(yè)聚集、大數(shù)據(jù)要素流通、數(shù)據(jù)中心整合利用、大數(shù)據(jù)國際交流合作等方面嘗試推動(dòng)我國大數(shù)據(jù)創(chuàng)新發(fā)展。自設(shè)立以來,綜合試驗(yàn)區(qū)獲得融資的大數(shù)據(jù)創(chuàng)投項(xiàng)目近千個(gè),新申請(qǐng)大數(shù)據(jù)類技術(shù)發(fā)明專利超過8000項(xiàng),并對(duì)上下游產(chǎn)業(yè)、制造業(yè)和服務(wù)業(yè)形成了強(qiáng)大的推動(dòng)力。設(shè)立大數(shù)據(jù)綜合試驗(yàn)區(qū)有助于提高區(qū)域知識(shí)集聚度和隱性知識(shí)的學(xué)習(xí)水平,從而增強(qiáng)企業(yè)的知識(shí)管理能力,提升創(chuàng)新產(chǎn)出。因此,提出假設(shè)H2。
假設(shè)H2:知識(shí)管理能力在大數(shù)據(jù)戰(zhàn)略和中國企業(yè)創(chuàng)新產(chǎn)出之間起正向中介作用。
大數(shù)據(jù)的廣泛深入應(yīng)用,使人類社會(huì)逐漸走向數(shù)據(jù)經(jīng)濟(jì)時(shí)代,提升數(shù)據(jù)存儲(chǔ)、運(yùn)營和應(yīng)用能力成為企業(yè)創(chuàng)新發(fā)展和獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的重要途徑,當(dāng)前主要互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)成本甚至達(dá)到20%-40%。另一方面,大數(shù)據(jù)中心建設(shè)、創(chuàng)新應(yīng)用等措施所帶來的新技術(shù)轉(zhuǎn)型升級(jí)壓力也可能導(dǎo)致企業(yè)數(shù)字化成本明顯提升,據(jù)統(tǒng)計(jì),部分知識(shí)密集型企業(yè)的數(shù)字化成本已占總成本的30%-40%,主要支出為數(shù)據(jù)庫的建設(shè)和維護(hù)費(fèi)用、機(jī)房維護(hù)費(fèi)用、電費(fèi)支出等,成本的增長(zhǎng)使企業(yè)創(chuàng)新意愿受到影響,從而可能影響創(chuàng)新產(chǎn)出,因此進(jìn)一步提出假設(shè)H3。
假設(shè)H3:企業(yè)的數(shù)字化成本在大數(shù)據(jù)戰(zhàn)略和中國企業(yè)創(chuàng)新產(chǎn)出之間起正向中介作用。
圖1 研究假設(shè)
雙重差分法是政策評(píng)估的常用方法,通過監(jiān)測(cè)實(shí)驗(yàn)組和控制組間差距的變化情況來消除不隨時(shí)間變化的不可觀測(cè)因素。應(yīng)用DID方法必須滿足兩個(gè)關(guān)鍵條件:一是必須存在一個(gè)具有試點(diǎn)性質(zhì)的政策沖擊;二是必須具有一個(gè)相應(yīng)的至少兩年(政策實(shí)施前后各一年)的面板數(shù)據(jù)集。劉瑞明和趙仁杰(2015)[21]用雙重差分法驗(yàn)證了國家高新區(qū)政策對(duì)地區(qū)經(jīng)濟(jì)發(fā)展的促進(jìn)效應(yīng);曹平和王桂軍(2018)[22]運(yùn)用DID、PSM-DID和DDD方法,從創(chuàng)新數(shù)量和創(chuàng)新質(zhì)量雙視角研究了“營改增”對(duì)服務(wù)業(yè)企業(yè)技術(shù)創(chuàng)新意愿的影響。參考這些研究的方法,把2016年國家大數(shù)據(jù)綜合試驗(yàn)區(qū)政策的制定視為一次自然實(shí)驗(yàn),采用DID方法評(píng)估前后的政策效應(yīng)變化。具體模型設(shè)計(jì)如下:
Innovit=α0+α1Treati+α2Policyit+α3Treati×Policyit+α4Xit+εi, t
(1)
其中Innovit表示第i個(gè)企業(yè)在第t年的創(chuàng)新水平,虛擬變量Treati是對(duì)樣本企業(yè)的分組,Treati=1代表位于國家大數(shù)據(jù)綜合試驗(yàn)區(qū)的上市企業(yè),即實(shí)驗(yàn)組;Treati=0代表位于國家大數(shù)據(jù)綜合試驗(yàn)區(qū)外其它地區(qū)的上市企業(yè),即控制組;Policyit表示國家大數(shù)據(jù)綜合試驗(yàn)區(qū)政策的影響時(shí)間,政策提出當(dāng)年及以后年份取值為1(2016-2018年),之前的年份取值為0(2013-2015年)。Treatit×Policyit是企業(yè)分組與時(shí)間分組的交互項(xiàng)。
Kleinberg et al.(2015)[23]認(rèn)為,政策問題是一個(gè)預(yù)測(cè)問題,政策效應(yīng)評(píng)估就是依據(jù)現(xiàn)有數(shù)據(jù)預(yù)測(cè)一個(gè)政策能達(dá)到的效果,并與實(shí)際達(dá)到的效果對(duì)比。從這個(gè)角度看,政策可以被視為一種風(fēng)險(xiǎn)嘗試,一種藥物。Varian(2014)[24]通過整合包括訓(xùn)練集、驗(yàn)證范例、修正機(jī)器學(xué)習(xí)中過擬合問題等在內(nèi)的各類特征來改進(jìn)計(jì)量經(jīng)濟(jì)學(xué)模型,實(shí)現(xiàn)大數(shù)據(jù)方法與計(jì)量經(jīng)濟(jì)學(xué)的融合。其研究表明恰當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型預(yù)測(cè)精度可提高50%以上,達(dá)到較好的預(yù)測(cè)效果,并實(shí)現(xiàn)一定程度上的因果推斷。機(jī)器學(xué)習(xí)在政策效應(yīng)和因果推斷已有不少應(yīng)用研究成果,例如運(yùn)用LASSO方法(高華川和白仲林,2019)[25]對(duì)政策進(jìn)行評(píng)估,以及隨機(jī)森林方法(劉衛(wèi)東等,2019)[26]的應(yīng)用。Athey(2017)[27]認(rèn)為機(jī)器學(xué)習(xí)在因果推斷和政策評(píng)估中具有很強(qiáng)的應(yīng)用前景,應(yīng)當(dāng)更多將因果樹和隨機(jī)森林等機(jī)器學(xué)習(xí)技術(shù)與現(xiàn)有的計(jì)量經(jīng)濟(jì)理論相結(jié)合。Chernozhukov et al.(2017)[28]認(rèn)為,機(jī)器學(xué)習(xí)的理論要求相對(duì)于傳統(tǒng)統(tǒng)計(jì)方法較弱,使用隨機(jī)森林、LASSO、Ridge、增強(qiáng)樹等各種現(xiàn)代的機(jī)器學(xué)習(xí)方法,以及這些方法的混合來估計(jì)高維回歸中的參數(shù)具有可行性。Tiffin(2019)[29]使用傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法估計(jì)金融危機(jī)對(duì)經(jīng)濟(jì)增長(zhǎng)的負(fù)面效應(yīng),得到相同的結(jié)論,并認(rèn)為機(jī)器學(xué)習(xí)方法在交互效應(yīng)、非線性效應(yīng)、異質(zhì)性效應(yīng)的研究方面更具優(yōu)勢(shì)。
本文參考已有研究的做法,結(jié)合研究目標(biāo),選擇LASSO方法(特征縮減方法)、因果森林方法(樹型模型方法)和卷積神經(jīng)網(wǎng)絡(luò)三種機(jī)器學(xué)習(xí)方法進(jìn)行對(duì)比研究,各種方法的解釋性(因果性)依次遞減,但是預(yù)測(cè)性遞增。
1.效應(yīng)評(píng)估的機(jī)器學(xué)習(xí)方法
控制組的效應(yīng)為:
實(shí)驗(yàn)組的平均效應(yīng)為:
(2)
(3)
(4)
此時(shí)政策干預(yù)的效應(yīng)估計(jì)為:
平均效應(yīng)估計(jì)為:
(5)
圖2 機(jī)器學(xué)習(xí)的效應(yīng)評(píng)估思路
將樣本按照“訓(xùn)練集-驗(yàn)證集-測(cè)試集”進(jìn)行區(qū)分,其中訓(xùn)練集用于估計(jì)模型,驗(yàn)證集(又稱為開發(fā)/保持集)用于監(jiān)控樣本外預(yù)測(cè)誤差,測(cè)試集用于評(píng)估所選模型的樣本外預(yù)測(cè)誤差。
2.LASSO方法
正則化是避免由于變量和特征過多導(dǎo)致過擬合的有效手段,線性回歸的L1正則化通常被稱為L(zhǎng)ASSO回歸,通過構(gòu)造一個(gè)懲罰函數(shù)得到一個(gè)較為精煉的模型,保留了子集收縮的優(yōu)點(diǎn),是一種處理具有復(fù)共線性數(shù)據(jù)的有偏估計(jì)。LASSO方法的步驟為完成每次機(jī)器學(xué)習(xí)訓(xùn)練后計(jì)算損失Loss值,加入懲罰函數(shù)后采用最小角回歸法計(jì)算損失Loss的極小值,不斷與因變量進(jìn)行擬合,直至收斂至預(yù)設(shè)閾值為止。構(gòu)造懲罰函數(shù)的方式如下:
首先把式(2)的實(shí)驗(yàn)組平均效應(yīng)改寫為線性函數(shù)形式:
(6)
3.因果森林方法
在機(jī)器學(xué)習(xí)領(lǐng)域,回歸樹是利用樹形結(jié)構(gòu)遞歸地將數(shù)據(jù)劃分為不同的子樣本,并將每個(gè)子樣本下yi的平均值作為最終預(yù)測(cè)值的一種統(tǒng)計(jì)方法。本文參考Athey和Imbens(2015)[30]的因果樹方法,把回歸樹方法中重點(diǎn)關(guān)注的預(yù)測(cè)值均方誤差改進(jìn)為處理效應(yīng)的均方誤差。首先在訓(xùn)練集樣本中隨機(jī)選取一部分,用于劃分空間即構(gòu)造樹的結(jié)構(gòu),其他樣本被用來估計(jì)處理效應(yīng),估計(jì)結(jié)果就是每一個(gè)劃分空間中的處理效應(yīng)及其相應(yīng)的置信空間。因果樹的構(gòu)造如下:
(7)
其中K表示樹中的葉子個(gè)數(shù),代表模型的復(fù)雜度,α.K代表懲罰項(xiàng),可以加速分裂和收斂。
基于生成的因果樹,有條件的平均效應(yīng)按以下公式計(jì)算:
(8)
(9)
4.CNN卷積神經(jīng)網(wǎng)絡(luò)
區(qū)別于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)是基于神經(jīng)元局部感受野的概念而設(shè)計(jì)的,通過針對(duì)某個(gè)局部的樣本信息進(jìn)行數(shù)據(jù)挖掘和分析,應(yīng)用卷積(Convolution)操作實(shí)現(xiàn)特征的抽取,在縱向上形成新的“視界”,將一段時(shí)間窗口周期內(nèi)的企業(yè)相關(guān)數(shù)據(jù)作為一個(gè)整體來衡量,通過不同的卷積核和池化進(jìn)行典型化抽取,在保持?jǐn)?shù)據(jù)本身存在的關(guān)聯(lián)性的同時(shí)加快迭代速度并提升運(yùn)算效率,以期獲得更深層次的結(jié)果。
圖3 非線性關(guān)系下的條件平均效應(yīng)評(píng)估
專利內(nèi)化了創(chuàng)新的主要特征“新穎性”,我國的專利分為發(fā)明、實(shí)用新型和外觀設(shè)計(jì)三類,發(fā)明專利是企業(yè)技術(shù)競(jìng)爭(zhēng)優(yōu)勢(shì)的重要構(gòu)成,因此選擇專利申請(qǐng)數(shù)量的自然對(duì)數(shù)和發(fā)明專利申請(qǐng)數(shù)量的自然對(duì)數(shù)作為創(chuàng)新代理變量。
Gold et al.(2011)[31]認(rèn)為,知識(shí)管理包含基礎(chǔ)建設(shè)和管理流程兩部分,管理流程指獲取、轉(zhuǎn)化、應(yīng)用和保護(hù)知識(shí)方面的能力。企業(yè)研發(fā)投入與知識(shí)管理基礎(chǔ)建設(shè)密切相關(guān),而合格的知識(shí)型員工才能執(zhí)行知識(shí)管理流程并承載知識(shí),知識(shí)管理的核心是知識(shí)型員工的管理,企業(yè)研發(fā)人員數(shù)量可以作為知識(shí)型員工的代表變量。本文選擇知識(shí)管理基礎(chǔ)投入(研發(fā)資金投入)、知識(shí)管理流程投入(管理投入)、知識(shí)員工比例(研發(fā)人員數(shù)量)作為研究變量。Tanriverdi(2005)[32]認(rèn)為,企業(yè)要更快地應(yīng)對(duì)高速變化的市場(chǎng)競(jìng)爭(zhēng),必須具備知識(shí)管理能力,包括技術(shù)知識(shí)管理能力、客戶知識(shí)管理能力、產(chǎn)品知識(shí)管理能力和運(yùn)作知識(shí)管理能力。市場(chǎng)是企業(yè)知識(shí)管理能力的最佳衡量標(biāo)準(zhǔn),企業(yè)學(xué)習(xí)和管理知識(shí)是為了快速地進(jìn)行知識(shí)的共享與應(yīng)用,以加快產(chǎn)品更新速度,縮短產(chǎn)品研發(fā)周期并降低成本,最終達(dá)到快速占領(lǐng)市場(chǎng)的目標(biāo)。因此,本文進(jìn)一步加入知識(shí)應(yīng)用投入(市場(chǎng)投入)、知識(shí)累積度(企業(yè)年限)作為知識(shí)管理能力的衡量指標(biāo)。
其他的控制變量包含創(chuàng)新環(huán)境和企業(yè)自身?xiàng)l件兩方面。參考曹平和王桂軍(2018)[22]、曹平和陸松(2020)[33]等的做法,同時(shí)考慮數(shù)據(jù)獲取的難易度,選取區(qū)域經(jīng)濟(jì)實(shí)力(GDP)、區(qū)域人員能力(信息技術(shù)產(chǎn)業(yè)從業(yè)人員數(shù)量)、用戶參與(大專以上學(xué)歷人員數(shù)量)、政府支持(政府補(bǔ)貼)、區(qū)域產(chǎn)學(xué)研協(xié)作能力(高校和科研院所數(shù)量)、金融環(huán)境(外資比例)、盈利能力(營業(yè)利潤率)、成長(zhǎng)能力(所有者權(quán)益比例)、營運(yùn)能力(資產(chǎn)周轉(zhuǎn)率)、資本結(jié)構(gòu)(資產(chǎn)負(fù)債率)、現(xiàn)金流量(總資產(chǎn)現(xiàn)金回收率)和企業(yè)績(jī)效(托賓Q值)作為控制變量。因?yàn)?個(gè)國家大數(shù)據(jù)綜合試驗(yàn)區(qū)包括區(qū)域、省份和城市,因此在數(shù)據(jù)選擇時(shí)進(jìn)行了輻射范圍的推論。首先認(rèn)定京津冀大數(shù)據(jù)綜合試驗(yàn)區(qū)直接輻射京津冀地區(qū)的企業(yè),珠江三角洲大數(shù)據(jù)綜合試驗(yàn)區(qū)直接輻射廣東省的企業(yè),沈陽市大數(shù)據(jù)綜合試驗(yàn)區(qū)直接輻射遼寧省企業(yè),其余貴州、上海、河南、重慶和內(nèi)蒙古均直接輻射本省(直轄市)企業(yè)。不在八大試驗(yàn)區(qū)范圍內(nèi)的省份為間接輻射省份?;谶@個(gè)推論,創(chuàng)新環(huán)境指標(biāo)均選取企業(yè)所在省(直轄市)的相關(guān)指標(biāo)。
變量設(shè)定如表1所示。
表1 變量設(shè)定
本文以國家大數(shù)據(jù)綜合試驗(yàn)區(qū)政策實(shí)施前后3年為時(shí)間窗口,選取2013-2018年數(shù)據(jù)進(jìn)行研究,2016年為效應(yīng)作用點(diǎn),2013-2015年為政策前時(shí)間面板,2016-2018年為政策生效后觀察面板。宏觀數(shù)據(jù)從《中國工業(yè)統(tǒng)計(jì)年鑒》、《中國電子信息產(chǎn)業(yè)統(tǒng)計(jì)年鑒》和《中國信息產(chǎn)業(yè)年鑒》中獲取,專利相關(guān)數(shù)據(jù)通過國家知識(shí)產(chǎn)權(quán)局網(wǎng)站進(jìn)行手工收集,企業(yè)層面數(shù)據(jù)則來自于國泰安和萬德數(shù)據(jù)庫的上市公司數(shù)據(jù)以及部分上市公司的年報(bào),在剔除金融、保險(xiǎn)、ST、*ST及主變量存在嚴(yán)重缺失的公司樣本后,最后得到1107家上市公司的6642條觀測(cè)數(shù)據(jù)。為了消除極端值的影響,對(duì)主要連續(xù)型變量進(jìn)行了1%的Winsorize縮尾處理。主要變量描述性統(tǒng)計(jì)特征分析如表2所示,樣本上市公司專利申請(qǐng)數(shù)量(對(duì)數(shù))和發(fā)明專利申請(qǐng)數(shù)量(對(duì)數(shù))平均值分別為2.756和1.854,中位數(shù)分別為2.113和1.737,最小值均為0,最大值分別為8.341和6.128。
表2 主要變量的統(tǒng)計(jì)特征
表3為DID估計(jì)結(jié)果,列(1)在加入控制變量的同時(shí)對(duì)年份固定效應(yīng)和行業(yè)固定效應(yīng)進(jìn)行了控制,結(jié)果顯示交互項(xiàng)Treat×Policy的回歸系數(shù)為0.625且在1%的水平上顯著。列(2)利用固定效應(yīng)模型(FE)對(duì)企業(yè)固定效應(yīng)進(jìn)行了控制,可以看到Treat×Policy的回歸系數(shù)為0.422,對(duì)比列(1)有所下降,但仍在5%的水平上顯著。因此不能從統(tǒng)計(jì)上拒絕假設(shè)H1。
表3 DID檢驗(yàn)結(jié)果
采用雙重差分方法進(jìn)行政策效應(yīng)評(píng)估需要滿足外生性要求,即政策對(duì)樣本的選擇應(yīng)該是隨機(jī)的,具體到大數(shù)據(jù)綜合試驗(yàn)區(qū)政策上,很顯然被選中的8個(gè)省市不是隨機(jī)的,但是樣本上市公司在注冊(cè)時(shí)并沒有預(yù)見到該政策,因此從企業(yè)層面上看這個(gè)政策是隨機(jī)的。而大數(shù)據(jù)綜合試驗(yàn)區(qū)對(duì)被影響產(chǎn)業(yè)的選擇是非隨機(jī)的,很明顯信息技術(shù)產(chǎn)業(yè)和服務(wù)業(yè)將會(huì)受到更大和更直接的影響,如果各產(chǎn)業(yè)在實(shí)驗(yàn)組和控制組之間分布不均勻,此時(shí)政策變量將存在一定的內(nèi)生性,需要采用工具變量法進(jìn)行處理。
受空調(diào)制冷、UPS不間斷電源和超大用電負(fù)荷等因素的影響,大數(shù)據(jù)中心的能耗非常巨大。根據(jù)統(tǒng)計(jì),2017年,中國數(shù)據(jù)中心耗電量為1221.5億千瓦時(shí)。數(shù)據(jù)中心的巨大能耗受到重點(diǎn)關(guān)注。2019年,工信部、國家機(jī)關(guān)事務(wù)管理局和國家能源局出臺(tái)《關(guān)于加強(qiáng)綠色數(shù)據(jù)中心建設(shè)的指導(dǎo)意見》,要求到2022年,“數(shù)據(jù)中心平均能耗基本達(dá)到國際先進(jìn)水平,新建大型、超大型數(shù)據(jù)中心的電能使用效率值達(dá)到1.4以下”。很明顯在選定大數(shù)據(jù)綜合試驗(yàn)區(qū)時(shí),考慮了向煤炭基地及其他用電資源富余地區(qū)的傾斜,因此可以考慮將自然稟賦作為工具變量。參考鄧明和魏后凱(2016)[34]的做法,加總五大能源工業(yè)的工業(yè)產(chǎn)值,然后除以各省總?cè)藬?shù),得到人均能源工業(yè)總產(chǎn)值,作為自然稟賦的度量標(biāo)準(zhǔn),相關(guān)數(shù)據(jù)從各年度的《中國工業(yè)經(jīng)濟(jì)統(tǒng)計(jì)年鑒》中獲取,計(jì)算2013-2015年窗口期內(nèi)的各省數(shù)據(jù)并進(jìn)行平均??梢哉J(rèn)為,自然稟賦與現(xiàn)代企業(yè)創(chuàng)新之間沒有直接相關(guān)的聯(lián)系,滿足工具變量法的“排他性約束”。
設(shè)置工具變量IV,IV=1表示窗口期內(nèi)自然稟賦指標(biāo)高于平均值的省、市和自治區(qū),IV=0表示其他省、市和自治區(qū),利用兩階段最小二乘法(2SLS)進(jìn)行估計(jì)??梢钥吹揭浑A段回歸中IV和IV×Policy的系數(shù)均在1%水平上顯著,且Kleibergen-Paap Wald統(tǒng)計(jì)量和Kleibergen-Paap LM統(tǒng)計(jì)量所對(duì)應(yīng)的p值均遠(yuǎn)小于1%,說明工具變量具備較好的識(shí)別能力。二階段回歸的結(jié)果顯示,Treat×Policy的系數(shù)值為正,且在5%的水平上顯著,說明在緩解了政策實(shí)施可能存在的內(nèi)生性問題之后結(jié)論保持不變。
表4 工具變量法解決內(nèi)生性問題
表5為機(jī)器學(xué)習(xí)方法的估計(jì)結(jié)果。具體做法是先從控制組樣本中抽取訓(xùn)練集和驗(yàn)證集,進(jìn)行模型訓(xùn)練,并用實(shí)驗(yàn)組在政策實(shí)施之前的樣本作為測(cè)試集進(jìn)行誤差調(diào)整,運(yùn)用構(gòu)造好的模型進(jìn)行實(shí)驗(yàn)組的反事實(shí)推斷,然后評(píng)估在給定限制條件下政策的平均效應(yīng)。將數(shù)據(jù)樣本通過設(shè)計(jì)的模型進(jìn)行訓(xùn)練和測(cè)試,初始學(xué)習(xí)率按照Smith(2015)[35]的方法設(shè)置為0.001。采用不同的算法改變學(xué)習(xí)率,選擇不同的測(cè)試集與訓(xùn)練集比例,分別統(tǒng)計(jì)迭代到500次和迭代1000次以后的Loss值。結(jié)果顯示在初始學(xué)習(xí)率為0.01,隨機(jī)指定測(cè)試集和測(cè)試集(按70%和30%的比例)的情況下收斂較好,1000次迭代的Loss值低于0.01。同時(shí)設(shè)計(jì)了一個(gè)4層BP神經(jīng)網(wǎng)絡(luò)以對(duì)比模型的擬合優(yōu)度。其中輸入層設(shè)置16個(gè)節(jié)點(diǎn);輸出層5個(gè)節(jié)點(diǎn);隱藏層2層,按照經(jīng)驗(yàn)公式估算,第一層設(shè)置14個(gè)節(jié)點(diǎn),第二層設(shè)置7個(gè)節(jié)點(diǎn)。采用同樣的梯度下降方法和激勵(lì)函數(shù),迭代次數(shù)設(shè)置為1000次,運(yùn)行結(jié)果顯示,本文采用的機(jī)器學(xué)習(xí)方法在收斂時(shí)間和擬合優(yōu)度上均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
從表5結(jié)果可以看到,LASSO、因果樹(CT)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)三種方法的RMSE均小于0.1,LASSO方法和因果樹的RMSE小于0.05,模型具有較好的預(yù)測(cè)性能。根據(jù)模型進(jìn)行反事實(shí)推斷計(jì)算出來的條件平均效應(yīng)CATE均為正且大于0.3,參考Athey和Imbens(2016)[30]的研究結(jié)論,不能否定假設(shè)H1。
表5 機(jī)器學(xué)習(xí)的政策效應(yīng)評(píng)估結(jié)果
為了研究知識(shí)管理和數(shù)字化成本在大數(shù)據(jù)戰(zhàn)略和企業(yè)創(chuàng)新之間的作用,進(jìn)一步進(jìn)行中介效應(yīng)檢驗(yàn)。如上文所述,知識(shí)管理(KM)由知識(shí)管理基礎(chǔ)投入(研發(fā)資金投入)、知識(shí)管理流程投入(管理投入)、知識(shí)員工比例(研發(fā)人員數(shù)量)、知識(shí)應(yīng)用投入(市場(chǎng)投入)、知識(shí)累積度(企業(yè)年齡)五個(gè)子項(xiàng)構(gòu)成,采用專家評(píng)分法(Delphi方法)和問卷調(diào)查法進(jìn)行綜合評(píng)分并制定權(quán)值后(AHP方法)即可計(jì)算,得到企業(yè)的知識(shí)管理能力水平。數(shù)字化成本通常包括研發(fā)成本、生產(chǎn)成本、保存成本以及維護(hù)和支持成本,其中后面幾項(xiàng)在統(tǒng)計(jì)數(shù)據(jù)和企業(yè)年報(bào)中均沒有明確的項(xiàng)目對(duì)應(yīng),而研發(fā)成本占據(jù)數(shù)字化成本較大比例,因此本文先將研發(fā)成本和年度變量作為被解釋變量與解釋變量進(jìn)行OLS回歸,估計(jì)出隨機(jī)擾動(dòng)項(xiàng)作為數(shù)字化非預(yù)期成本,研發(fā)成本與數(shù)字化非預(yù)期成本分別除以企業(yè)年度總成本后相加,得到企業(yè)年度數(shù)字化成本支出水平,所有的數(shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化處理。
在式(1)的基礎(chǔ)上構(gòu)建中介效應(yīng)檢驗(yàn)?zāi)P腿缦拢?/p>
Innov(i,t)=α0+α1Treati+α2Policyit+α3Treati×Policyit+α4Xit+μ1
(10)
KM(i,t)=β0+β1Treati+β2Policyit+β3Treati×Policyit+β4Xit+μ2
(11)
DC(i,t)=β0+β1Treati+β2Policyit+β3Treati×Policyit+β4Xit+μ2
(12)
Innov(i,t)=γ0+γ1Treati+γ2Policyit+γ3Treati×Policyit+γ4KMit+γ5Xit+μ3
(13)
Innov(i,t)=γ0+γ1Treati+γ2Policyit+γ3Treati×Policyit+γ4DCit+γ5Xit+μ3
(14)
其中KM(i,t)代表知識(shí)管理中介變量,DC(i,t)為數(shù)字化成本中介變量,μ為隨機(jī)擾動(dòng)項(xiàng)。
中介效應(yīng)采用Sobel檢驗(yàn)方法,由β3×γ4系數(shù)衡量,從表6結(jié)果可以看到,列(1)Treat×Policy的系數(shù)為正,且在1%的水平上顯著,說明大數(shù)據(jù)戰(zhàn)略確實(shí)促進(jìn)了企業(yè)的知識(shí)管理能力,列(2)中知識(shí)管理能力(KM)的系數(shù)為0.335,且在5%的水平上顯著,因此無需再進(jìn)行Sobel檢驗(yàn)。計(jì)算β3×γ4=0.071,表示大數(shù)據(jù)戰(zhàn)略通過知識(shí)管理能力對(duì)企業(yè)創(chuàng)新的間接影響效應(yīng)占總效應(yīng)(0.422)的16.83%,即知識(shí)管理能力有一定的中介效應(yīng)。一方面,說明大數(shù)據(jù)戰(zhàn)略還有其他路徑推動(dòng)企業(yè)創(chuàng)新;另一方面,也說明當(dāng)前企業(yè)的數(shù)字化轉(zhuǎn)型還處于初級(jí)階段,大數(shù)據(jù)戰(zhàn)略推動(dòng)知識(shí)管理能力發(fā)展并最終促進(jìn)企業(yè)創(chuàng)新的效果還有提升空間。對(duì)數(shù)字化成本的檢驗(yàn)結(jié)果顯示,β3為負(fù)且不顯著,γ4不顯著,說明來自數(shù)字化成本的中介效應(yīng)不顯著。
表6 DID中介效應(yīng)檢驗(yàn)結(jié)果
利用Matlab中的靈敏度分析(Sensitivity Analysis)模塊進(jìn)行分析,分別設(shè)置4個(gè)模型,其中模型1和模型2分別衡量Treat×Policy對(duì)知識(shí)管理能力KM和數(shù)字化成本DC的輸出敏感度,模型3和模型4衡量Treat×Policy分別和知識(shí)管理能力KM以及數(shù)字化成本DC聯(lián)合輸入對(duì)企業(yè)創(chuàng)新的輸出敏感度,結(jié)果顯示知識(shí)管理能力KM在模型1中的敏感度為0.195,在模型3中的敏感度為0.359,對(duì)于企業(yè)創(chuàng)新的輸出具有一定影響力。而數(shù)字化成本在模型2和模型4中的檢驗(yàn)結(jié)果均顯示其對(duì)企業(yè)創(chuàng)新輸出的敏感度較低。
表7 機(jī)器學(xué)習(xí)中介效應(yīng)檢驗(yàn)結(jié)果
政策相互干擾是影響DID估計(jì)結(jié)果的一個(gè)重要因素。通過對(duì)這段時(shí)間內(nèi)各級(jí)政府頒發(fā)的各項(xiàng)政策文件進(jìn)行研讀,本文認(rèn)為國家的大數(shù)據(jù)戰(zhàn)略是逐步遞進(jìn)的,前后無不一致之處,前期主要是思路方面的引領(lǐng),最終成型的政策是《大數(shù)據(jù)綜合試驗(yàn)區(qū)推進(jìn)(實(shí)施)方案》的頒布。其次進(jìn)行平行趨勢(shì)檢驗(yàn),參照羅知等(2015)[36]的做法,首先以2016年為政策基準(zhǔn)年,生成政策實(shí)施前后3年時(shí)間的虛擬變量與處理組虛擬變量的交互項(xiàng),將這些交互項(xiàng)作為解釋變量進(jìn)行回歸,交互項(xiàng)系數(shù)反映的就是特定年份實(shí)驗(yàn)組和控制組之間的差異。
(15)
結(jié)果顯示,政策時(shí)點(diǎn)前的虛擬變量與實(shí)驗(yàn)組虛擬變量的交互項(xiàng)系數(shù)均不顯著,政策實(shí)施后二年的系數(shù)顯著為正且數(shù)值逐漸變大(圖4),這表明大數(shù)據(jù)綜合試驗(yàn)區(qū)政策實(shí)施前實(shí)驗(yàn)組和控制組之間不存在顯著差異,政策實(shí)施后對(duì)企業(yè)創(chuàng)新產(chǎn)生了影響,平行趨勢(shì)假設(shè)成立。
圖4 平行趨勢(shì)檢驗(yàn)結(jié)果
進(jìn)一步采用安慰劑效應(yīng)檢驗(yàn)結(jié)果的穩(wěn)健性。具體做法是保持方法和模型不變,改用2010-2015年的數(shù)據(jù)來進(jìn)行安慰劑效應(yīng)測(cè)試,設(shè)定2010-2012年樣本為實(shí)驗(yàn)組,2013-2015年為控制組。DID方法結(jié)果顯示交互項(xiàng)Treat×Policy的系數(shù)不顯著,機(jī)器學(xué)習(xí)方法的結(jié)果顯示CATE值平均為0.0875,出現(xiàn)大幅降低,這進(jìn)一步說明在2016年的政策時(shí)間點(diǎn)之前,實(shí)驗(yàn)組和控制組企業(yè)在趨勢(shì)上不存在顯著差異。
最后,通過改變企業(yè)創(chuàng)新代理變量的方式進(jìn)行穩(wěn)健性檢驗(yàn),采用發(fā)明專利申請(qǐng)數(shù)量來代表企業(yè)創(chuàng)新的質(zhì)量,在DID方法中交互項(xiàng)系數(shù)在5%水平上顯著為正,在機(jī)器學(xué)習(xí)方法中CATE平均值為0.3014,接近用所有專利申請(qǐng)數(shù)量作為代理變量時(shí)的效應(yīng)水平。
為了進(jìn)一步檢驗(yàn)大數(shù)據(jù)綜合試驗(yàn)區(qū)政策對(duì)我國不同類型企業(yè)的影響,按照政策關(guān)聯(lián)性和企業(yè)規(guī)模分樣本進(jìn)行研究。首先,考慮到信息技術(shù)企業(yè)直接受到大數(shù)據(jù)綜合試驗(yàn)區(qū)政策影響,按政策關(guān)聯(lián)性將樣本分為信息技術(shù)企業(yè)和其他企業(yè)進(jìn)行研究。對(duì)信息技術(shù)企業(yè)的DID雙重差分法研究結(jié)果顯示,信息技術(shù)企業(yè)樣本的Treat×Policy系數(shù)在1%水平上顯著為正,其他企業(yè)樣本的Treat×Policy系數(shù)在5%水平上顯著為正,大數(shù)據(jù)綜合試驗(yàn)區(qū)政策對(duì)信息技術(shù)企業(yè)的創(chuàng)新促進(jìn)力度更大。按企業(yè)規(guī)模區(qū)分,結(jié)果顯示大數(shù)據(jù)綜合試驗(yàn)區(qū)政策更能提升大型企業(yè)的創(chuàng)新水平。可能原因在于,大型企業(yè)有更大的動(dòng)力和資源進(jìn)行大數(shù)據(jù)應(yīng)用建設(shè),通過提升整體的信息化和數(shù)字化水平而促進(jìn)創(chuàng)新。
表8 分樣本回歸(DID)
機(jī)器學(xué)習(xí)方法得到同樣的結(jié)論,LASSO、因果樹和CNN方法的模型擬合RMSE均達(dá)到要求,采用機(jī)器學(xué)習(xí)方法得到的信息技術(shù)企業(yè)政策效應(yīng)相較其他企業(yè)多53.78%,大數(shù)據(jù)綜合試驗(yàn)區(qū)政策通過對(duì)信息技術(shù)企業(yè)的直接推動(dòng),帶來新的技術(shù)及促進(jìn)商業(yè)模式和市場(chǎng)模式改變,間接增強(qiáng)了其他企業(yè)的創(chuàng)新意愿。結(jié)論中還可以看到大型企業(yè)的政策效應(yīng)相較中小型企業(yè)更高,和上述DID方法研究得到的結(jié)論一致。因此,政策制定應(yīng)該考慮向信息技術(shù)企業(yè)之外的企業(yè)傾斜,并加大對(duì)中小企業(yè)的扶持力度,以期實(shí)現(xiàn)整個(gè)產(chǎn)業(yè)的迭代升級(jí)。
表9 分樣本回歸(機(jī)器學(xué)習(xí))
根據(jù)2010年發(fā)布的《國務(wù)院關(guān)于加快培育和發(fā)展戰(zhàn)略性新興產(chǎn)業(yè)的決定》和2016年國務(wù)院《“十三五”國家戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃》(國發(fā)〔2016〕67號(hào))中的定義,大數(shù)據(jù)產(chǎn)業(yè)是新一代信息技術(shù)產(chǎn)業(yè)發(fā)展的重要構(gòu)成,也是工業(yè)4.0和其他產(chǎn)業(yè)轉(zhuǎn)型升級(jí)的重要基礎(chǔ),對(duì)數(shù)據(jù)資源的掌控和應(yīng)用已成為重要的國家戰(zhàn)略和創(chuàng)新的核心要素。大數(shù)據(jù)對(duì)于創(chuàng)新知識(shí)發(fā)掘和知識(shí)管理是一種高效率的新技術(shù),會(huì)對(duì)企業(yè)創(chuàng)新產(chǎn)生深刻影響。我國政府也高度關(guān)注大數(shù)據(jù)產(chǎn)業(yè),通過各種政策不斷促進(jìn)其高速發(fā)展。本文分析大數(shù)據(jù)戰(zhàn)略對(duì)企業(yè)創(chuàng)新的促進(jìn)作用,采用傳統(tǒng)的DID方法和近年來發(fā)展較快的機(jī)器學(xué)習(xí)方法開展聯(lián)合研究,將國家2016年頒布大數(shù)據(jù)綜合試驗(yàn)區(qū)政策作為一項(xiàng)自然實(shí)驗(yàn),基于2013-2018年中國上市公司數(shù)據(jù)的實(shí)證結(jié)果表明,政策一定程度上提升了中國企業(yè)尤其是知識(shí)密集型企業(yè)的創(chuàng)新水平,促進(jìn)效應(yīng)部分來自于政策對(duì)于企業(yè)知識(shí)管理能力的影響。但是知識(shí)管理能力的中介效應(yīng)并不是特別突出,原因一方面在于知識(shí)管理能力是一個(gè)漸進(jìn)式的提高過程,并非短期內(nèi)的政策刺激就能實(shí)現(xiàn);另一方面在于大數(shù)據(jù)本身的特性決定了技術(shù)外包和能力租用對(duì)于中小企業(yè)是一個(gè)短期內(nèi)效益較高的選擇,因此忽略自身的知識(shí)管理能力提升。這也是本文發(fā)現(xiàn)大數(shù)據(jù)戰(zhàn)略并未通過提升數(shù)字化成本而影響創(chuàng)新產(chǎn)出的一個(gè)主要原因。分樣本回歸結(jié)果顯示大數(shù)據(jù)戰(zhàn)略對(duì)信息技術(shù)企業(yè)和大型企業(yè)的創(chuàng)新促進(jìn)作用更加突出,政策制定應(yīng)該考慮向其他企業(yè)適當(dāng)傾斜,并加大對(duì)中小企業(yè)的扶持力度,例如設(shè)置大數(shù)據(jù)和數(shù)字化改造的專項(xiàng)扶持資金,以實(shí)現(xiàn)整體產(chǎn)業(yè)的迭代升級(jí)。
在政策效應(yīng)研究方面,DID方法是傳統(tǒng)的優(yōu)秀方法,但是必須嚴(yán)格做好假設(shè),保障平行趨勢(shì)。機(jī)器學(xué)習(xí)是人工智能的重要領(lǐng)域,目的是通過對(duì)樣本特征的深度挖掘,獲得準(zhǔn)確的預(yù)測(cè),并且實(shí)現(xiàn)對(duì)非線性關(guān)系的模擬與趨近,二者在方法論上存在共通之處,且一定程度上能夠互補(bǔ)。機(jī)器學(xué)習(xí)在政策評(píng)估方面主要的應(yīng)用是反事實(shí)模擬,即使用預(yù)處理和對(duì)照觀測(cè)的數(shù)據(jù),預(yù)測(cè)如果沒有政策影響,外源觀測(cè)結(jié)果會(huì)發(fā)生什么變化,將這一預(yù)測(cè)與政策實(shí)施后的實(shí)際結(jié)果進(jìn)行比較,可以得到政策的平均處理效應(yīng)。政策往往帶有明顯傾向性,對(duì)于大數(shù)據(jù)綜合試驗(yàn)區(qū)政策,資源稟賦(電費(fèi))和先發(fā)優(yōu)勢(shì)的影響無法忽視,相較于DID方法,機(jī)器學(xué)習(xí)可以在一定程度上緩解內(nèi)生性并發(fā)掘非線性關(guān)系。本文使用了LASSO、因果樹和CNN卷積神經(jīng)網(wǎng)絡(luò)三種方法進(jìn)行政策效應(yīng)評(píng)估,得到的結(jié)論與DID方法基本一致。但是機(jī)器學(xué)習(xí)目前有實(shí)質(zhì)性的限制,即無法獲得不確定性估計(jì)量,在因果關(guān)系判定上存在缺陷,后續(xù)必須進(jìn)一步做好理論基礎(chǔ)支撐研究,提高置信度。
根據(jù)研究結(jié)論,得到主要的產(chǎn)業(yè)發(fā)展政策含義為:首先,與美國、德國和日本等發(fā)達(dá)國家相比,我國的基礎(chǔ)產(chǎn)業(yè)尤其是制造業(yè)領(lǐng)域仍然處于較為初級(jí)的生產(chǎn)階段,大數(shù)據(jù)是推動(dòng)制造業(yè)智能化水平提升和工業(yè)4.0升級(jí)的基礎(chǔ)支撐手段。大數(shù)據(jù)戰(zhàn)略會(huì)促進(jìn)生產(chǎn)企業(yè)的信息技術(shù)能力和知識(shí)管理能力提升,從而對(duì)整體產(chǎn)業(yè)的創(chuàng)新水平有正向作用,企業(yè)方面應(yīng)以大數(shù)據(jù)綜合試驗(yàn)區(qū)政策頒布為契機(jī)主動(dòng)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,以數(shù)字化帶動(dòng)自主創(chuàng)新。其次,政府方面應(yīng)保障公平的市場(chǎng)競(jìng)爭(zhēng)環(huán)境并加強(qiáng)知識(shí)產(chǎn)權(quán)保護(hù)力度,出臺(tái)相關(guān)政策促進(jìn)產(chǎn)業(yè)間基于大數(shù)據(jù)的數(shù)字化創(chuàng)新,鼓勵(lì)產(chǎn)業(yè)間大數(shù)據(jù)的相互流動(dòng)與協(xié)同創(chuàng)新,對(duì)大數(shù)據(jù)應(yīng)用進(jìn)行有效監(jiān)管,確保信息安全和數(shù)據(jù)安全。同時(shí)還應(yīng)當(dāng)通過政策和有效措施推動(dòng)大數(shù)據(jù)基礎(chǔ)建設(shè)與大數(shù)據(jù)應(yīng)用之間的銜接,確保大數(shù)據(jù)的技術(shù)優(yōu)勢(shì)能夠向傳統(tǒng)工業(yè)和服務(wù)業(yè)轉(zhuǎn)移,推動(dòng)整體產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型升級(jí)和創(chuàng)新發(fā)展。再次,知識(shí)管理能力在大數(shù)據(jù)戰(zhàn)略和企業(yè)創(chuàng)新產(chǎn)出之間起到一定的中介作用,后續(xù)應(yīng)當(dāng)繼續(xù)推動(dòng)高校和研究機(jī)構(gòu)開展大數(shù)據(jù)和云計(jì)算的基礎(chǔ)研究,著重培養(yǎng)數(shù)字化轉(zhuǎn)型人才,激勵(lì)配套技術(shù)創(chuàng)新,進(jìn)一步推進(jìn)產(chǎn)業(yè)發(fā)展。最后,大數(shù)據(jù)產(chǎn)業(yè)的能耗較高,應(yīng)當(dāng)做好電費(fèi)政策配套,在給予電費(fèi)優(yōu)惠推動(dòng)產(chǎn)業(yè)發(fā)展的同時(shí)加強(qiáng)綠色數(shù)據(jù)中心建設(shè)。同時(shí)做好產(chǎn)業(yè)布局規(guī)劃,避免發(fā)展過于粗放,各地盲目投入大數(shù)據(jù)產(chǎn)業(yè)園區(qū)項(xiàng)目造成資源閑置和浪費(fèi)。