于柳箐,高 煜,b
(西北大學(xué)a.經(jīng)濟(jì)管理學(xué)院;b.中國西部經(jīng)濟(jì)發(fā)展研究中心,西安 710127)
在加快建設(shè)“數(shù)字中國”和加快發(fā)展數(shù)字經(jīng)濟(jì)的背景下,充分利用數(shù)據(jù)要素推動中國制造業(yè)增長以及數(shù)字化轉(zhuǎn)型升級對現(xiàn)代化產(chǎn)業(yè)體系的建立尤為重要。數(shù)據(jù)不僅是信息技術(shù)制造業(yè)等新興數(shù)字產(chǎn)業(yè)發(fā)展所必須依賴的要素,還在傳統(tǒng)制造業(yè)數(shù)字化轉(zhuǎn)型與變革過程中發(fā)揮著極其重要的作用??梢哉f,制造業(yè)變革或產(chǎn)業(yè)升級的路徑就是土地、勞動力、資本、知識、數(shù)據(jù)等生產(chǎn)要素主導(dǎo)地位變化的過程。從而,研究數(shù)據(jù)要素對制造業(yè)增長的影響對于正在邁向制造強(qiáng)國的中國而言具有重要意義。當(dāng)前文獻(xiàn)著重考察了數(shù)據(jù)要素對制造業(yè)全要素生產(chǎn)率提升[1]、高質(zhì)量發(fā)展[2]、綠色發(fā)展[3]等的影響,同時探究了企業(yè)增長和效率提升中數(shù)據(jù)要素與勞動力要素的結(jié)合效應(yīng)[4,5]。然而,上述文獻(xiàn)雖然在理論上明確了數(shù)據(jù)要素投入效應(yīng)的發(fā)揮需要結(jié)合勞動力要素,但未進(jìn)一步指明是何種勞動產(chǎn)生作用,且缺少經(jīng)驗證據(jù)。另外,在實證檢驗數(shù)據(jù)要素對制造業(yè)的影響時主要采用固定效應(yīng)模型,雖然解決了部分不可觀測因素對數(shù)據(jù)要素投入效應(yīng)估計一致性的混淆,但是由于僅控制了少數(shù)變量,因此依然可能存在遺漏變量偏差。
作為數(shù)字經(jīng)濟(jì)時代具有關(guān)鍵作用的生產(chǎn)要素,數(shù)據(jù)要素與勞動力要素協(xié)同促進(jìn)制造業(yè)增長的內(nèi)在規(guī)律意義顯著。鑒于此,本文旨在研究數(shù)據(jù)要素如何協(xié)同勞動力要素促進(jìn)制造業(yè)增長。本文基于2012—2019年中國省級面板數(shù)據(jù),利用因果森林這一機(jī)器學(xué)習(xí)異質(zhì)性因果推斷方法估計了數(shù)據(jù)要素影響制造業(yè)增長的效應(yīng),并進(jìn)一步考察了數(shù)據(jù)要素投入效應(yīng)在擁有不同數(shù)據(jù)勞動規(guī)模的地區(qū)制造業(yè)增長中是否存在異質(zhì)性,以及如何呈現(xiàn)異質(zhì)性。相比現(xiàn)有文獻(xiàn),本文以數(shù)據(jù)挖掘機(jī)制為核心深入分析了數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長的調(diào)節(jié)機(jī)制;補(bǔ)充了數(shù)據(jù)勞動如何發(fā)揮調(diào)節(jié)作用的經(jīng)驗證據(jù);利用因果森林高維數(shù)據(jù)擬合和個體處理效應(yīng)(Individual Treatment Effect,ITE)估計能力,在控制眾多投入要素變量的同時進(jìn)行基于個體的非線性異質(zhì)性因果推斷,不僅有效緩解了遺漏變量偏差問題,還使得考察數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長的非線性調(diào)節(jié)模式成為可能。
數(shù)據(jù)要素已經(jīng)成為數(shù)字經(jīng)濟(jì)時代企業(yè)生產(chǎn)、經(jīng)營管理、研發(fā)創(chuàng)新、營銷等決策過程中的必要投入。但是原始數(shù)據(jù)的積累并不能自動轉(zhuǎn)化為用于生產(chǎn)的數(shù)據(jù)資本,與勞動力、資本等實物(有形)生產(chǎn)要素通過直接投入產(chǎn)生經(jīng)濟(jì)物品不同,數(shù)據(jù)是虛擬(無形)的,無法依靠自身的消耗和形變創(chuàng)造價值,必須經(jīng)過一定的轉(zhuǎn)換、分析、處理才能成為促進(jìn)企業(yè)增長的要素投入[6]。作為投入要素的數(shù)據(jù),其本質(zhì)是以0-1(二進(jìn)制)編碼的信息,具有非結(jié)構(gòu)化和價值稀疏的特征,為了充分發(fā)揮數(shù)據(jù)價值,需要通過搜集、存儲、清洗等步驟將低價值的非結(jié)構(gòu)化形態(tài)轉(zhuǎn)換為可供特定場景使用的高價值結(jié)構(gòu)化形態(tài),最后經(jīng)過分析提取出有用的信息[5],這一過程即數(shù)據(jù)挖掘(Data Mining)。對產(chǎn)生于日常生產(chǎn)經(jīng)營活動中數(shù)據(jù)資源①在產(chǎn)品生產(chǎn)、研發(fā)、銷售中,或在人力資源、財務(wù)管理等活動中產(chǎn)生的原始數(shù)據(jù)。的挖掘?qū)⒅浦圃鞓I(yè)企業(yè)形成數(shù)據(jù)-信息驅(qū)動決策范式,有利于優(yōu)化生產(chǎn)技術(shù)、激勵研發(fā)創(chuàng)新、提升管理能力等,進(jìn)而實現(xiàn)制造業(yè)增長。
數(shù)據(jù)要素的供給源于勞動創(chuàng)造,它不是原始的數(shù)據(jù)符號,而是經(jīng)過挖掘后凝結(jié)了人類勞動的數(shù)據(jù)產(chǎn)品[7],形成數(shù)據(jù)要素的成本主要來自人力搜集、處理數(shù)據(jù)的成本[8]。換言之,涵蓋數(shù)據(jù)搜集、存儲、清洗與分析過程的數(shù)據(jù)挖掘的實現(xiàn)需要具備相關(guān)技能的勞動力全程參與,這反映了利用人力資本將數(shù)據(jù)“提純”的邏輯思想[6]。Abis 和Veldkamp(2021)[9]構(gòu)建了包含數(shù)據(jù)要素的兩階段知識生產(chǎn)模型,并指出在將原始的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過程中,需要數(shù)據(jù)管理人員的介入,隨后結(jié)構(gòu)化數(shù)據(jù)集與從事數(shù)據(jù)分析的勞動力將一同作為知識生產(chǎn)中的要素。具體來看,實現(xiàn)數(shù)據(jù)挖掘的勞動(即數(shù)據(jù)勞動)包括對數(shù)據(jù)的搜集、管理和分析,相應(yīng)地,從事數(shù)據(jù)勞動的人員包括進(jìn)行數(shù)據(jù)搜集與記錄的數(shù)據(jù)搜集人員、進(jìn)行數(shù)據(jù)清洗與存儲的數(shù)據(jù)管理人員和進(jìn)行數(shù)據(jù)分析的數(shù)據(jù)分析人員。對數(shù)據(jù)的挖掘能夠促進(jìn)制造業(yè)增長,而數(shù)據(jù)挖掘的實現(xiàn)又依賴于數(shù)據(jù)勞動。因此,在擁有不同數(shù)據(jù)勞動規(guī)模的地區(qū),數(shù)據(jù)要素促進(jìn)制造業(yè)增長的效應(yīng)可能不同。數(shù)據(jù)勞動供給越充足的地區(qū),數(shù)據(jù)挖掘的作用越能充分顯現(xiàn),數(shù)據(jù)資源中的信息越能被充分提取,從而數(shù)據(jù)要素促進(jìn)制造業(yè)增長的效應(yīng)越明顯。據(jù)此,本文提出以下兩個待檢驗的假設(shè):
假設(shè)1:數(shù)據(jù)要素投入可以促進(jìn)中國制造業(yè)增長。
假設(shè)2:數(shù)據(jù)要素對制造業(yè)增長的促進(jìn)效應(yīng)受到數(shù)據(jù)勞動的調(diào)節(jié),數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動規(guī)模地區(qū)的制造業(yè)增長。
傳統(tǒng)回歸模型無法有效擬合高維數(shù)據(jù),可能造成遺漏變量偏差,同時還缺乏有效的異質(zhì)性處理效應(yīng)估計方法。Wager 和Athey(2018)[10]對經(jīng)典隨機(jī)森林(Random Forests)算法的節(jié)點分裂規(guī)則、數(shù)據(jù)擬合模式、處理效應(yīng)估計等方面進(jìn)行了改進(jìn),發(fā)展出因果森林(Causal Forests),不僅能用于高維數(shù)據(jù)因果推斷,還能進(jìn)行個體異質(zhì)性處理效應(yīng)估計。在非混淆假設(shè)下,基于半?yún)?shù)部分線性模型利用殘差回歸的推斷,對于所有的x∈χ,結(jié)合隨機(jī)森林方法可以得到固定的條件平均處理效應(yīng)(τ^):
其中,Wi代表處理變量,Yi代表因變量,e(x)=P[Wi|Xi=x] 是由隨機(jī)森林計算的傾向分?jǐn)?shù),m(x)=E[Yi|Xi=x]是由隨機(jī)森林計算的邊際結(jié)果(marginal outcomes),上標(biāo)(-i) 表示執(zhí)行隨機(jī)森林的袋外(out-of-bag)預(yù)測①對于每個訓(xùn)練示例,所有在訓(xùn)練期間沒有使用此示例的樹都被識別出來,然后僅使用這些樹對測試示例進(jìn)行預(yù)測。。雖然式(1)對處理效應(yīng)的估計是半?yún)?shù)有效的,但只能用于固定處理效應(yīng)的估計,為此,Nie 和Wager(2021)[11]在式(1)的基礎(chǔ)上生成了一個“R-learner”目標(biāo)函數(shù)(objective function),用于異質(zhì)性處理效應(yīng)的估計:
其中,Λn(τ(·))是正則化項,用于控制學(xué)習(xí)到的函數(shù)^(·)的復(fù)雜性。不同于經(jīng)典隨機(jī)森林僅關(guān)注預(yù)測誤差是否因節(jié)點分裂而降低,因果森林通過最大化節(jié)點分裂后處理效應(yīng)的組間差異反映異質(zhì)性處理效應(yīng)。因此,在給定Xi并最小化式(2)后,可為每個個體提供一個相應(yīng)的條件平均處理效應(yīng)估計^(Xi)。具體來看,因果森林通過隨機(jī)森林的袋外預(yù)測得到估計值^(·)和^(·),再利用式(3)可得到條件平均處理效應(yīng)估計值:
其中,αi(x)為數(shù)據(jù)-自適應(yīng)核(data-adaptive kernel),是利用隨機(jī)森林測量的第i個訓(xùn)練示例與測試點x落入同一葉子的頻率。將隨機(jī)森林看作一種基于核的觀點使得用式(1)和式(2)進(jìn)行處理效應(yīng)估計成為可能。式(3)實際上使用羅賓遜變換進(jìn)行了正交化處理[11],即首先訓(xùn)練單獨的隨機(jī)森林和執(zhí)行袋外預(yù)測計算傾向分?jǐn)?shù)和邊際結(jié)果的估計值,然后計算殘差處理W-^(x)和殘差結(jié)果Y-(x),最后在這些殘差上訓(xùn)練一個因果森林。正交化估計量從Wi中剔除了Xi的影響,相當(dāng)于執(zhí)行了工具變量法,因此正交化對于在觀測性研究中獲得準(zhǔn)確的處理效應(yīng)估計必不可少。
因果森林不僅能在具有非混淆性假設(shè)的潛在結(jié)果框架下得到一致的處理效應(yīng)估計量,還能夠有效降低標(biāo)準(zhǔn)誤,提高估計準(zhǔn)確性。更為重要的是,因果森林具備高維數(shù)據(jù)擬合和個體處理效應(yīng)估計能力,彌補(bǔ)了傳統(tǒng)回歸模型的不足[10]。
2.2.1 處理變量
本文所關(guān)注的是數(shù)據(jù)要素投入與制造業(yè)產(chǎn)出的關(guān)系,因此處理變量是數(shù)據(jù)要素投入規(guī)模。雖然現(xiàn)行的統(tǒng)計和國民經(jīng)濟(jì)核算體系中仍然缺少有關(guān)數(shù)據(jù)要素規(guī)模、價值、存量等的記錄,但是可以借鑒以往評估無形資產(chǎn)價值的經(jīng)典方法,比如市場法、收入法和成本法對數(shù)據(jù)要素價值展開測度[5]。然而由于當(dāng)前數(shù)據(jù)要素交易頻率較低,且可參照的相關(guān)資產(chǎn)難以尋找,造成其未來收益、資產(chǎn)壽命、折舊率等難以準(zhǔn)確衡量,使得市場法和收入法在數(shù)據(jù)要素價值測度實踐中無法實現(xiàn)[8],因此只有成本法是目前最具可行性的測度數(shù)據(jù)要素價值的方法,即通過投入在數(shù)據(jù)生產(chǎn)活動中的勞動力和資本成本間接反映數(shù)據(jù)要素價值。鑒于此,徐翔等(2024)[8]基于從事數(shù)據(jù)搜集、處理的就業(yè)人員工資與數(shù)據(jù)資本投資數(shù)據(jù)測度了歷年各省份的數(shù)據(jù)要素規(guī)模存量(datSca)。本文使用這一指標(biāo)作為處理變量。
2.2.2 結(jié)果變量
本文的結(jié)果變量是制造業(yè)產(chǎn)出水平,采用主營業(yè)務(wù)收入(manIn)衡量。
2.2.3 調(diào)節(jié)變量
本文的調(diào)節(jié)變量是數(shù)據(jù)勞動規(guī)模。Nguyen和Paczos(2020)[12]指出,并非所有的行業(yè)都與數(shù)據(jù)生產(chǎn)活動相關(guān),同時與數(shù)據(jù)生產(chǎn)相關(guān)的勞動力也不會將所有的工作時間都用于數(shù)據(jù)生產(chǎn),因此各個行業(yè)或職業(yè)都存在一個“數(shù)據(jù)使用強(qiáng)度”。鑒于此,加拿大統(tǒng)計局對與數(shù)據(jù)生產(chǎn)相關(guān)的職業(yè)均分配了一個數(shù)據(jù)生產(chǎn)工作時間占全部工作時間的比例區(qū)間,隨后與各職業(yè)人數(shù)相乘估算了數(shù)據(jù)勞動規(guī)模。然而這一做法具有較強(qiáng)的主觀性,同時由于缺少中國省級層面的相關(guān)職業(yè)人員數(shù)據(jù),因此本文以行業(yè)就業(yè)人員數(shù)據(jù)為基礎(chǔ)構(gòu)造地區(qū)數(shù)據(jù)勞動規(guī)模指標(biāo)(datLab)。具體地,借鑒許憲春等(2022)[5]提出的“供給法”,本文基于數(shù)據(jù)生產(chǎn)活動中的勞動力與其數(shù)據(jù)生產(chǎn)工作時間占比估算地區(qū)數(shù)據(jù)勞動規(guī)模:第一步,根據(jù)《國民經(jīng)濟(jì)行業(yè)分類》(GB/T 4754-2017)選擇與數(shù)據(jù)生產(chǎn)活動相關(guān)的國民經(jīng)濟(jì)二位數(shù)大類行業(yè)j,包括計算機(jī)、通信和其他電子設(shè)備制造業(yè),儀器儀表制造業(yè),軟件和信息技術(shù)服務(wù)業(yè),互聯(lián)網(wǎng)和相關(guān)服務(wù),電信、廣播電視和衛(wèi)星傳輸服務(wù)①根據(jù)徐翔等(2024)[8]的計算,以上行業(yè)中數(shù)據(jù)生產(chǎn)活動占其總生產(chǎn)活動的比例均接近或超過50%。另外,根據(jù)《國民經(jīng)濟(jì)行業(yè)分類》(GB/T 4754-2017),(63)電信、廣播電視和衛(wèi)星傳輸服務(wù),(64)互聯(lián)網(wǎng)和相關(guān)服務(wù),(65)軟件和信息技術(shù)服務(wù)業(yè)是門類行業(yè)(I)信息傳輸、軟件和信息技術(shù)服務(wù)業(yè)下所包含的二位數(shù)大類行業(yè)。,以及為工業(yè)互聯(lián)網(wǎng)發(fā)展提供所需裝備的通用設(shè)備制造業(yè)和專用設(shè)備制造業(yè)[2]。第二步,使用徐翔等(2024)[8]計算的上述行業(yè)j的數(shù)據(jù)生產(chǎn)活動占其總生產(chǎn)活動的比例αj乘以行業(yè)j在i地區(qū)t年份的就業(yè)人數(shù)Lijt,得到行業(yè)j在各地區(qū)不同年份的數(shù)據(jù)勞動投入αjLijt。第三步,加總t年份i地區(qū)內(nèi)所有行業(yè)j的數(shù)據(jù)勞動投入得到歷年各地區(qū)數(shù)據(jù)勞動規(guī)模指標(biāo),即datLabit=∑jαjLijt。
2.2.4 控制變量
由于因果森林具備高維數(shù)據(jù)擬合能力,因此可以通過控制更多的投入要素變量有效抑制潛在的混淆偏差,進(jìn)而得到數(shù)據(jù)要素影響制造業(yè)增長的一致估計。本文在歐陽志剛和陳普(2020)[13]的研究基礎(chǔ)上增加了數(shù)據(jù)要素類別,同時在物質(zhì)資本中增加了衡量網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)資本的指標(biāo),在人力資本中增加了衡量數(shù)據(jù)勞動的指標(biāo)。最終構(gòu)建了包含7 個投入要素類別、18個一級指標(biāo)、30 個二級指標(biāo)的投入要素指標(biāo)體系(如表1所示)。
表1 投入要素指標(biāo)體系與變量描述性統(tǒng)計
本文所用樣本為2012—2019 年中國31 個省份(不含港澳臺)的面板數(shù)據(jù)。投入要素變量數(shù)據(jù)主要來自中國研究數(shù)據(jù)服務(wù)平臺(CNRDS)以及歷年《中國統(tǒng)計年鑒》《中國科技統(tǒng)計年鑒》《中國勞動統(tǒng)計年鑒》《中國教育統(tǒng)計年鑒》《中國固定資產(chǎn)投資統(tǒng)計年鑒》等,制造業(yè)主營業(yè)務(wù)收入數(shù)據(jù)來自歷年《中國工業(yè)統(tǒng)計年鑒》。需要說明的是,由于新冠肺炎疫情的影響,中國制造業(yè)在2020 年后的發(fā)展遭受重大沖擊,可能波及數(shù)據(jù)要素對制造業(yè)增長的影響效應(yīng)以及數(shù)據(jù)勞動的調(diào)節(jié)作用。與此同時,疫情期間大部分的經(jīng)濟(jì)統(tǒng)計指標(biāo)均出現(xiàn)異常變動,不僅會影響因果森林等機(jī)器學(xué)習(xí)模型的估計效果[14],還會影響數(shù)據(jù)要素規(guī)模存量指標(biāo)測度的精確性。因此,為了確保實證結(jié)果的可信度,參照近期文獻(xiàn)的普遍做法[8,15],設(shè)定2019年為觀察末期。
利用因果森林估計數(shù)據(jù)要素影響中國制造業(yè)增長的效應(yīng)。為了得到更為穩(wěn)健的結(jié)論,本文對因果森林模型參數(shù)(即超參數(shù))進(jìn)行了不同設(shè)置,結(jié)果如表2 所示。其中,列(1)使用R 語言grf 程序包中casual_forest 函數(shù)的默認(rèn)超參數(shù);列(2)、列(3)將基礎(chǔ)決策樹的數(shù)量分別設(shè)置為1000和4000 棵;列(4)進(jìn)行聚類分析,將處理效應(yīng)的估計聚類到省份層面,以控制不可觀測的地區(qū)差異。不同省份具有不隨時間改變的文化、區(qū)位、自然條件等特征,傳統(tǒng)回歸模型通過“固定效應(yīng)”或“隨機(jī)效應(yīng)”模型來捕獲聚類效應(yīng),但是線性可加性假設(shè)限制了非線性聚類效應(yīng)的估計。為解決這一問題,本文使用因果森林聚類分析方法,在模型訓(xùn)練時所有的二次抽樣過程、節(jié)點分裂、森林預(yù)測等均在整個集群上進(jìn)行操作,而不是單個觀測;列(5)使用交叉驗證調(diào)參,即利用機(jī)器學(xué)習(xí)交叉驗證法對因果森林超參數(shù)進(jìn)行自動選擇①具體做法是通過訓(xùn)練擁有不同超參數(shù)設(shè)置的因果森林,得到使式(2)“R-learner”目標(biāo)函數(shù)袋外估計最小化時的超參數(shù),并使用該超參數(shù)設(shè)置生成因果森林模型。;列(6)進(jìn)行聚類分析的同時使用交叉驗證調(diào)參。
表2 數(shù)據(jù)要素影響制造業(yè)增長的效應(yīng)估計
從表2可以看出,在基于不同超參數(shù)設(shè)置的因果森林模型中,datSca 系數(shù)均顯著為正,因此說明數(shù)據(jù)要素對中國制造業(yè)增長具有顯著的促進(jìn)作用,假設(shè)1得到證實。需要說明的是,由于因果森林進(jìn)行聚類分析以及使用交叉驗證調(diào)參時避免了不可觀測因素的干擾和人為主觀設(shè)定超參數(shù)的弊端,因此后文對數(shù)據(jù)勞動調(diào)節(jié)作用的考察以及穩(wěn)健性檢驗均以列(6)為基準(zhǔn)。
3.2.1 異質(zhì)性檢驗
據(jù)前文可知,因果森林通過式(2)在給定Xi時可以為每個個體提供一個相應(yīng)的條件平均處理效應(yīng)(CATE)估計τ^(Xi)?;诖?,本文使用表2 列(6)計算得到各省份數(shù)據(jù)要素影響制造業(yè)增長效應(yīng)的估計值,并使用核密度分布進(jìn)行擬合。擬合圖(略)結(jié)果顯示,CATE估計值的分布并不集中,分散于0.1~0.55,這說明數(shù)據(jù)要素對制造業(yè)增長的促進(jìn)效應(yīng)在不同省份之間存在差異。
為確定樣本中是否存在異質(zhì)性處理效應(yīng),本文使用最佳線性預(yù)測方法進(jìn)行更正式的檢驗。將條件平均處理效應(yīng)的袋外因果森林估計值劃分為兩個部分,分別為其中是袋外處理效應(yīng)估計的平均值,隨后將對Ci和Di進(jìn)行回歸,即設(shè)定如下回歸模型:。Di的系數(shù)β2可解釋為對處理效應(yīng)異質(zhì)性估計質(zhì)量的度量,如果顯著為正,那么表明和τ(Xi)之間存在聯(lián)系,換言之,因果森林能夠發(fā)現(xiàn)數(shù)據(jù)中存在異質(zhì)性處理效應(yīng)的假設(shè)得到了支持。從表3可知,當(dāng)進(jìn)行聚類分析后,Di的系數(shù)β2顯著為正,說明數(shù)據(jù)要素影響制造業(yè)增長的效應(yīng)的確存在地區(qū)差異,同時也體現(xiàn)了聚類分析的有效性。
表3 最佳線性預(yù)測檢驗結(jié)果
3.2.2 調(diào)節(jié)效應(yīng)估計
為揭示數(shù)據(jù)要素影響制造業(yè)增長的效應(yīng)是如何隨著數(shù)據(jù)勞動規(guī)模的變化而變化的,本文利用由表2 列(6)得到的各省份數(shù)據(jù)要素影響制造業(yè)增長效應(yīng)的估計值(CATE)以及相應(yīng)省份的數(shù)據(jù)勞動規(guī)模生成散點圖,并使用線性回歸法與局部多項式回歸法(LOESS)進(jìn)行擬合,如圖1所示。直線擬合顯示,數(shù)據(jù)要素對制造業(yè)增長的促進(jìn)效應(yīng)隨著數(shù)據(jù)勞動規(guī)模的擴(kuò)大而增強(qiáng)。這說明數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動規(guī)模地區(qū)的制造業(yè)增長,假設(shè)2得證。
圖1 數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的調(diào)節(jié)作用
進(jìn)一步地,曲線擬合展現(xiàn)了數(shù)據(jù)勞動邊際處理效應(yīng)(Marginal Treatment Effect,MTE)的變化,可以看到,數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的調(diào)節(jié)呈現(xiàn)“倒U”型態(tài)勢,即隨著數(shù)據(jù)勞動規(guī)模的擴(kuò)大,數(shù)據(jù)要素投入效應(yīng)的增長幅度越來越小。這可能是因為,數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的大小取決于從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的多寡,而從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的數(shù)量不僅取決于進(jìn)行數(shù)據(jù)搜集、管理和分析的數(shù)據(jù)勞動人員數(shù)量,還依賴于他們所應(yīng)用的數(shù)據(jù)抓取、編碼、整合以及機(jī)器學(xué)習(xí)等數(shù)據(jù)挖掘技術(shù)。因而在數(shù)據(jù)挖掘技術(shù)水平的約束下,隨著數(shù)據(jù)勞動規(guī)模的持續(xù)擴(kuò)大,從單位數(shù)據(jù)要素內(nèi)挖掘的有用信息的數(shù)量逐漸到達(dá)上限,進(jìn)而新增數(shù)據(jù)勞動挖掘的有用信息的數(shù)量逐漸下降至零,從而導(dǎo)致新增數(shù)據(jù)勞動對數(shù)據(jù)要素投入效應(yīng)的提升作用越來越小。
(1)更換處理變量。為避免數(shù)據(jù)規(guī)模存量指標(biāo)測度誤差對估計結(jié)果的影響,借鑒徐翔和趙墨非(2020)[6]在研究數(shù)據(jù)資本與經(jīng)濟(jì)增長路徑時的做法,選取省際移動互聯(lián)網(wǎng)接入流量作為反映地區(qū)數(shù)據(jù)要素規(guī)模的指標(biāo),并將其轉(zhuǎn)換為制造業(yè)層面數(shù)據(jù)。
(2)小樣本調(diào)參。由于本文使用的是省級層面的數(shù)據(jù),為避免基于小樣本進(jìn)行因果森林估計時可能存在的偏差,采用兩種方案進(jìn)一步優(yōu)化超參數(shù)設(shè)置,以增強(qiáng)結(jié)果的穩(wěn)健性。一是增加用于調(diào)參的樹的數(shù)量;二是增加基礎(chǔ)決策樹的數(shù)量以及誠實分割部分,同時禁止誠實樹剪枝。
(3)更換機(jī)器學(xué)習(xí)模型。為避免不同機(jī)器學(xué)習(xí)方法對因果森林估計的影響,分別使用廣義回歸森林和廣義提升森林模型計算得到傾向分?jǐn)?shù)^(x)、邊際結(jié)果(x),隨后將其作為超參數(shù)傳遞至因果森林模型。
結(jié)果(略)顯示,在更換處理變量、使用適用于小樣本的超參數(shù)、更換計算傾向分?jǐn)?shù)和邊際結(jié)果的機(jī)器學(xué)習(xí)模型后,因果森林模型對數(shù)據(jù)要素影響制造業(yè)增長效應(yīng)的估計均顯著為正,同時數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的調(diào)節(jié)模式也與前文一致,說明本文的結(jié)論穩(wěn)健。
本文主要研究了數(shù)據(jù)要素能否促進(jìn)制造業(yè)增長以及數(shù)據(jù)勞動如何發(fā)揮調(diào)節(jié)作用的問題。以2012—2019年中國省級面板數(shù)據(jù)為研究樣本,使用因果森林方法展開異質(zhì)性因果推斷,不僅估計了數(shù)據(jù)要素對制造業(yè)增長的影響效應(yīng),還考察了數(shù)據(jù)勞動對數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的調(diào)節(jié)模式。據(jù)此,得到如下結(jié)論:第一,數(shù)據(jù)要素對中國制造業(yè)增長具有顯著的促進(jìn)作用;第二,數(shù)據(jù)要素能更好地促進(jìn)擁有更大數(shù)據(jù)勞動規(guī)模地區(qū)的制造業(yè)增長;第三,隨著數(shù)據(jù)勞動規(guī)模的持續(xù)擴(kuò)大,數(shù)據(jù)要素投入效應(yīng)的增長幅度越來越小。
由以上結(jié)論得出如下啟示:首先,政府需要通過加快數(shù)據(jù)開放、數(shù)據(jù)交易基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)要素市場化改革等舉措,努力提高數(shù)據(jù)要素供給數(shù)量與質(zhì)量,而制造業(yè)企業(yè)則需要重視數(shù)據(jù)要素在生產(chǎn)經(jīng)營活動中的作用,加強(qiáng)數(shù)據(jù)要素投入,并積極融入制造業(yè)的數(shù)字化轉(zhuǎn)型升級;其次,政府需要加強(qiáng)數(shù)據(jù)搜集人員、數(shù)據(jù)管理人員、數(shù)據(jù)分析人員等數(shù)據(jù)勞動力的培育,而制造業(yè)企業(yè)則需要加快數(shù)據(jù)勞動人員的引進(jìn),充分發(fā)揮數(shù)據(jù)挖掘的作用,以提升數(shù)據(jù)要素對制造業(yè)增長的促進(jìn)效應(yīng);最后,制造業(yè)企業(yè)在加強(qiáng)數(shù)據(jù)要素投入時,不僅應(yīng)注意數(shù)據(jù)勞動人員數(shù)量的增加,還要關(guān)注數(shù)據(jù)勞動人員的數(shù)據(jù)搜集、管理、分析等技術(shù)應(yīng)用能力的提高,以進(jìn)一步激發(fā)數(shù)據(jù)挖掘的效用,充分挖掘數(shù)據(jù)資源中的有用信息,從而推動數(shù)據(jù)要素促進(jìn)制造業(yè)增長效應(yīng)的不斷提升。