金勇進 姜天英
規(guī)模以下工業(yè)以其規(guī)模小、數(shù)量多、分布廣、變化快等特點,在增加就業(yè)、促進經(jīng)濟增長與科技創(chuàng)新等方面具有不可替代的作用,對國民經(jīng)濟和社會發(fā)展具有重要的戰(zhàn)略意義。隨著規(guī)模以下工業(yè)數(shù)量的急劇增加以及調(diào)查對象的復(fù)雜變化,規(guī)模以下工業(yè)抽樣調(diào)查已暴露出諸多問題。本文以湖北省為例,通過對規(guī)模以下工業(yè)抽樣調(diào)查的全面評估和實地調(diào)研,總結(jié)了其面臨的突出問題,以期對完善規(guī)模以下工業(yè)調(diào)查提供參考。
國家統(tǒng)計局在1996年開展了工業(yè)統(tǒng)計抽樣調(diào)查試點工作,調(diào)查對象為年工業(yè)總產(chǎn)值500萬元以下的鄉(xiāng)及鄉(xiāng)以上獨立核算法人工業(yè)企業(yè)和工業(yè)活動單位,獲取年度數(shù)據(jù)。之后對調(diào)查方案進行了數(shù)次調(diào)整,主要集中在四個方面:一是規(guī)模限額值。試點調(diào)查時的500萬元,在2011年調(diào)整為2000萬元,并一直沿用至今。二是調(diào)查限額指標(biāo)。1998—2005年,采用的是年產(chǎn)品銷售收入;2006年后,調(diào)整為年主營業(yè)務(wù)收入。三是調(diào)查基本單位。1998—2005年,調(diào)查基本單位調(diào)整為非國有工業(yè)企業(yè)和全部個體工業(yè)單位;2006年后,調(diào)整為工業(yè)企業(yè)和全部個體工業(yè)單位。四是調(diào)查頻率。由年度調(diào)查逐步調(diào)整為季度調(diào)查。
經(jīng)過調(diào)整,目前的調(diào)查范圍為年主營業(yè)務(wù)收入2000萬元以下的工業(yè)法人單位和全部個體經(jīng)營工業(yè)單位。
按照《規(guī)模以下工業(yè)抽樣調(diào)查統(tǒng)計報表制度》,將規(guī)模以下工業(yè)調(diào)查總體劃分為企業(yè)子總體和個體工業(yè)子總體,其中企業(yè)子總體包括目錄企業(yè)和非目錄企業(yè)。依據(jù)調(diào)查范圍,采用按名錄一階段分層隨機抽樣和按行政區(qū)劃分層隨機整群抽樣相結(jié)合的方法進行抽樣調(diào)查。
1.目錄抽樣。目錄抽樣是指依據(jù)企業(yè)名錄庫對目錄企業(yè)的抽樣,企業(yè)名錄庫的初始來源是最新的經(jīng)濟普查結(jié)果,目錄企業(yè)是指規(guī)模以下工業(yè)企業(yè)名錄框中所包含的企業(yè)。目錄抽樣的調(diào)查對象為目錄企業(yè),采用的調(diào)查方法是一階段分層隨機抽樣,從各省企業(yè)名錄庫直接抽取樣本企業(yè)。具體來說,首先,根據(jù)企業(yè)名錄庫,通過整理、過濾、核查等程序,確定目錄企業(yè)抽樣框,并對其賦予永久隨機數(shù)。其次,按照同時滿足以地區(qū)為總體和以行業(yè)分類為總體的抽樣精度要求,確定全國總樣本量,并分配至各地區(qū)各行業(yè),以滿足省級推斷和行業(yè)推斷需要。最后,將行業(yè)作為分層的主要標(biāo)志,依據(jù)分層和最終層的樣本量,采取一階段分層隨機抽樣方法,在最終層抽取樣本企業(yè),并進行相應(yīng)的總量估計。
2.地域抽樣。地域抽樣的調(diào)查對象是非目錄企業(yè)和全部個體工業(yè)單位,其中非目錄企業(yè)是指不在企業(yè)名錄庫中的企業(yè),包括建立名錄庫時遺漏的企業(yè)和新增的企業(yè)。非目錄企業(yè)和個體工業(yè)單位采用的是分層隨機整群抽樣,具體為:首先,以行政村(居委會)為基本記錄單元的名錄庫,代表了全國地域,同時根據(jù)個體工業(yè)單位的分布情況,整理構(gòu)建地域抽樣框。地域抽樣框的初始來源是經(jīng)濟普查的個體工業(yè)經(jīng)營戶數(shù)據(jù)庫。其次,以地區(qū)為總體,按照整群抽樣的樣本量計算公式確定樣本量,并依據(jù)個體規(guī)模對村(居委會)進行分層,確定各層內(nèi)樣本量。最后,采用分層隨機整群抽樣,抽取相應(yīng)樣本量的村(居委會),對樣本村(居委會)內(nèi)的個體工業(yè)單位進行全部調(diào)查,并進行相應(yīng)的總量估計。
非目錄企業(yè)的抽樣調(diào)查方法與個體工業(yè)單位一致,利用的是個體工業(yè)單位的整群樣本,對樣本村(居委會)的規(guī)模以下工業(yè)企業(yè)進行核查,確定最終的非目錄企業(yè)樣本。
總的來說,我國規(guī)模以下工業(yè)抽樣調(diào)查方案可總結(jié)如圖1。進一步地,為了適應(yīng)調(diào)查總體的變化和提高調(diào)查對象的配合度,每5年會依據(jù)最新的經(jīng)濟普查數(shù)據(jù)對規(guī)模以下工業(yè)進行樣本輪換。
圖1 我國規(guī)模以下工業(yè)抽樣調(diào)查方案
從規(guī)模以下工業(yè)調(diào)查方案中可發(fā)現(xiàn),規(guī)模以下工業(yè)調(diào)查包含目錄企業(yè)抽樣框和地域抽樣框兩種。與地域抽樣框相比,目錄企業(yè)的組成單位是有名錄的企業(yè),一方面由于其規(guī)模小,經(jīng)營狀況不穩(wěn)定,停業(yè)、破產(chǎn)、倒閉等現(xiàn)象經(jīng)常發(fā)生;另一方面由于部分行業(yè)市場環(huán)境利好、政策鼓勵等,新增企業(yè)數(shù)量也在不斷增加,以至于總體和樣本變動頻繁?;诖耍疚闹饕懻摰氖悄夸浧髽I(yè)抽樣框,并從總體和樣本上分別說明。
1.總體上的對比。選取2013年和2017年的數(shù)據(jù)進行對比。2013年的數(shù)據(jù)是對湖北省第三次經(jīng)濟普查數(shù)據(jù)進行過濾、核查及更正名錄庫內(nèi)的有關(guān)信息而得到的,用于構(gòu)建新一輪規(guī)模以下工業(yè)企業(yè)調(diào)查的名錄庫。2017年的數(shù)據(jù)是截至2017年底湖北省企業(yè)名錄庫的動態(tài)更新數(shù)據(jù)。2013年湖北省共有34880家規(guī)模以下工業(yè)企業(yè),其中正常營業(yè)企業(yè)數(shù)量占比90.05%;到2017年,規(guī)模以下工業(yè)企業(yè)增至93890家,其中正常營業(yè)企業(yè)數(shù)量占比82.54%。二者比較發(fā)現(xiàn),2013—2017年,湖北省規(guī)模以下工業(yè)數(shù)量有了較大幅度的增長,其間新增企業(yè)的數(shù)量遠遠大于2013年已存在的企業(yè)數(shù)量。雖然在數(shù)量上有較快的增長率,但從正常營業(yè)占比角度看,正常營業(yè)企業(yè)數(shù)量占比是下降的。也就是說,2013—2017年,雖然規(guī)模以下工業(yè)企業(yè)的數(shù)量增長較快,但不容忽視的是企業(yè)消亡的比例也在提高。
2.樣本上的對比。第三次經(jīng)濟普查后,依據(jù)抽樣調(diào)查方案,湖北省的目錄企業(yè)樣本量為865家,樣本村(居委會)的數(shù)量為320個,這個樣本量將用于后續(xù)5年內(nèi)的規(guī)模以下工業(yè)抽樣調(diào)查。從目錄企業(yè)角度看,在2016年的865家目錄企業(yè)中,正常上報的目錄企業(yè)共358家,剩余的目錄企業(yè)中有超過總量一半的比例處于關(guān)閉、停產(chǎn)、轉(zhuǎn)產(chǎn)、被合并的狀態(tài),同時也有部分企業(yè)升入規(guī)模以上工業(yè)企業(yè)中。2017年的865家目錄企業(yè)中,正常上報的目錄企業(yè)共301家,剩余的目錄企業(yè)主要表現(xiàn)狀態(tài)為關(guān)閉和停產(chǎn)。從非目錄企業(yè)角度來看,2016年共有301家非目錄企業(yè),其中正常上報的占比68.77%,不能正常上報的企業(yè)主要原因是關(guān)閉和停產(chǎn)。2017年非目錄企業(yè)共有406家,其中正常上報的占比57.88%,剩余的非目錄企業(yè)主要處于停產(chǎn)狀態(tài)。綜合來說,2016—2017年,正常上報的目錄企業(yè)數(shù)量在逐步降低,遠低于初始樣本量的865家。非目錄企業(yè)主要體現(xiàn)的新增企業(yè),雖然從2016—2017年總量上有所增加,但正常上報的企業(yè)數(shù)量占非目錄企業(yè)的比例卻在減少。由此說明,湖北省規(guī)模以下工業(yè)樣本企業(yè)消亡速度較快。
通過從總體和樣本上的對比,規(guī)模以下工業(yè)企業(yè)總體和樣本都處在不斷變動中,企業(yè)新增和消亡速度較快,使調(diào)查樣本延續(xù)性較低。在5年一次的樣本輪換中,因目標(biāo)總體處在不斷變化中,抽樣框缺乏穩(wěn)定性,由此將導(dǎo)致抽樣框誤差,進而影響對目標(biāo)變量的估計準(zhǔn)確性。同時,在名錄庫的更新中,數(shù)據(jù)來源廣泛,各來源渠道數(shù)據(jù)均不完整且缺乏信息共享,這使更新維護工作量增大,從而導(dǎo)致更新滯后。
對規(guī)模以下工業(yè)企業(yè),一般在經(jīng)濟普查年份獲取總體數(shù)據(jù),而后5年內(nèi),依據(jù)經(jīng)濟普查數(shù)據(jù)制定抽樣框?qū)颖酒髽I(yè)進行調(diào)查。為了比較樣本與總體間的差異,本文選取湖北省2013年核查后的目錄企業(yè)作為總體,選取2013年的樣本企業(yè)作為樣本,分析二者之間的差異。2013年的樣本企業(yè)是按照第二次經(jīng)濟普查數(shù)據(jù)確定的樣本企業(yè),共計984家企業(yè),其中目錄企業(yè)859家,非目錄企業(yè)125家。為了全面評估樣本與總體間的差異,一方面計算相關(guān)變量的樣本與總體的分布檢驗;另一方面,從綜合評估角度出發(fā),計算整體差異率,分析樣本與總體的偏離程度。
1.分布一致性檢驗。采用K-S檢驗對主營業(yè)務(wù)收入、從業(yè)人員數(shù)進行分布一致性檢驗,結(jié)果表明,在99%的置信水平下,這兩個變量在樣本和總體中的分布存在明顯的差異。這說明基于第二次經(jīng)濟普查構(gòu)建的抽樣框,在2013年規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查時,樣本和當(dāng)時實際總體之間的分布已經(jīng)有了較大差異,樣本代表性不高。
2.綜合評估整體差異率。分別計算相關(guān)變量的代表性檢驗系數(shù)。選取主營業(yè)務(wù)收入作為目標(biāo)變量,從業(yè)人員數(shù)和行業(yè)分類作為輔助變量,主營業(yè)務(wù)收入和從業(yè)人員數(shù)的代表性檢驗系數(shù)計算公式為:
其中y指依據(jù)樣本推斷的總量,Y指總體真值,該系數(shù)一般要求控制在3%以內(nèi)。行業(yè)分類的代表性檢驗系數(shù)計算公式為:
通過計算可得,主營業(yè)務(wù)收入的代表性檢驗系數(shù)為19.8%,從業(yè)人員數(shù)的代表性檢驗系數(shù)為5.4%,說明樣本與總體在兩個變量上有一定程度的偏離,且主營業(yè)務(wù)收入的偏離程度較高。相對來說,從業(yè)人員數(shù)的偏離程度較低,一定程度上說明從業(yè)人員數(shù)變化相對穩(wěn)定。行業(yè)分類的代表性檢驗系數(shù)高達60.3%,主要原因是部分企業(yè)由于總體較少,可能全部入樣,使該行業(yè)在全部行業(yè)內(nèi)的結(jié)構(gòu)差異率較大,從而在全部行業(yè)的角度上代表性檢驗系數(shù)較高。
在獲得輔助變量代表性檢驗系數(shù)后,分別計算輔助變量與目標(biāo)變量的相關(guān)系數(shù),將其標(biāo)準(zhǔn)化作為綜合評估的權(quán)重。通過對輔助變量的代表性檢驗系數(shù)加權(quán)求和,得到輔助變量的整體差異率為20.3%。綜合考慮目標(biāo)變量和輔助變量的偏離程度可以發(fā)現(xiàn),偏離程度在20%左右,說明樣本與總體的偏離程度較高,這會導(dǎo)致樣本代表性不足。
在新一輪樣本輪換時抽取樣本企業(yè),具有較高的樣本代表性。隨著時間的推移,目標(biāo)總體在不斷變化,調(diào)查的樣本企業(yè)保持不變,這將導(dǎo)致樣本與總體間產(chǎn)生較大差異,樣本代表性降低,從而一定程度上影響估計精度。
規(guī)模以下工業(yè)調(diào)查的對象是規(guī)模以下工業(yè)企業(yè)和個體工業(yè)單位,實地調(diào)研中發(fā)現(xiàn),其“低、小、散”情況明顯,容易導(dǎo)致管理困難,從而產(chǎn)生諸多抽樣誤差之外的調(diào)查誤差,而調(diào)查誤差一般不能通過增加樣本量來解決,調(diào)查誤差來源總結(jié)為以下幾點:
1.調(diào)查對象配合度不高。一是規(guī)模以下工業(yè)很多是自主經(jīng)營,而提供數(shù)據(jù)是為上級服務(wù),認(rèn)為與己無關(guān),或擔(dān)心“露富”,上報時采取報少不報多、報費用不報利潤的策略,難以取得真實數(shù)據(jù)。二是部分單位對統(tǒng)計調(diào)查工作認(rèn)識不到位,主體責(zé)任意識不強,認(rèn)為調(diào)查是為了多收稅,容易產(chǎn)生抵觸情緒,造成統(tǒng)計誤差的人為因素增大。三是調(diào)查對象對《統(tǒng)計法》認(rèn)知不足,缺乏統(tǒng)計法律法規(guī)知識,擔(dān)心上報會影響后期經(jīng)營和造成信息泄露等,對調(diào)查心存疑慮,難以達到如實填報的要求。
2.規(guī)模以下工業(yè)普遍缺乏核算資料,難以取得精準(zhǔn)的調(diào)查數(shù)據(jù)。一是許多企業(yè)財務(wù)制度不健全,原始記錄、統(tǒng)計臺賬等財務(wù)核算基礎(chǔ)差。部分企業(yè)雖然建立了臺賬,但記錄不完整、不準(zhǔn)確,從賬冊無法找到真實材料。也有許多規(guī)模以下工業(yè)企業(yè)和個體工業(yè)單位沒有生產(chǎn)臺賬、財務(wù)報表等,經(jīng)營時沒有核算票據(jù),或者經(jīng)營收支與家庭生活開支混在一起,所報數(shù)據(jù)難以找到依據(jù),數(shù)據(jù)推算難度大,造成推算數(shù)據(jù)偏離實際。二是規(guī)模以下工業(yè)抽樣調(diào)查中的很多企業(yè)和個體工業(yè)單位沒有專門的會計和統(tǒng)計人員,兼職財務(wù)人員往往不掌握企業(yè)生產(chǎn)與人員變動情況,極易造成報送數(shù)據(jù)與實際情況不相符的問題。即使有統(tǒng)計人員的企業(yè),其統(tǒng)計專業(yè)知識也可能較為缺乏,盡管進行過多次培訓(xùn),但在填報時仍會出現(xiàn)數(shù)據(jù)不合邏輯、亂填亂報的現(xiàn)象。此外,部分企業(yè)沒有規(guī)范的管理制度,人員流動性大、穩(wěn)定性差,統(tǒng)計工作銜接性差,員工業(yè)務(wù)素質(zhì)不高,在一定程度上也很難保證報送數(shù)據(jù)的質(zhì)量。
3.報表時間偏緊,人員配備不足。一是縣級市調(diào)查隊的工業(yè)企業(yè)報表需在每個季度15號前報送上級單位,個體工業(yè)報表需在每個月20號前報送,上報時間相對緊張。由于調(diào)查范圍大、企業(yè)變動快、縣區(qū)統(tǒng)計人員身兼數(shù)職,加之每季度的非目錄核查上報需要消耗大量的核查時間,統(tǒng)計工作量大,統(tǒng)計力量單薄,任務(wù)與力量的矛盾非常突出。二是部分個體企業(yè)的營業(yè)收入較高,達到微型或小型企業(yè)的標(biāo)準(zhǔn),由于各種原因,不愿更改注冊類型,這在一定程度上加重了對個體工業(yè)單位的調(diào)查任務(wù)。三是輔調(diào)員素質(zhì)不高且選聘困難。實際工作中,很難選調(diào)到專業(yè)知識過硬且專職的輔調(diào)員,一般為兼職。由于樣本村輔助調(diào)查員身兼數(shù)職、部分個體戶變動大、上報期工作量大等原因,在任務(wù)繁忙和補貼較少的情況下,其工作積極性不高。
由前文可知,2011年按照年主營業(yè)務(wù)收入2000萬元的標(biāo)準(zhǔn)將工業(yè)企業(yè)劃分為規(guī)模以上工業(yè)企業(yè)和規(guī)模以下工業(yè)企業(yè),并一直沿用至今。其中規(guī)模以上工業(yè)是指年主營業(yè)務(wù)收入2000萬元及以上的工業(yè)法人單位,通過聯(lián)網(wǎng)直報進行全面調(diào)查。隨著經(jīng)濟的快速發(fā)展,年主營業(yè)務(wù)收入2000萬元的劃分標(biāo)準(zhǔn)容易產(chǎn)生如下問題:(1)從湖北省的數(shù)據(jù)看,湖北省規(guī)模以下工業(yè)企業(yè)年主營業(yè)務(wù)收入占所有工業(yè)企業(yè)年主營業(yè)務(wù)收入的比例不到8%,這將會使抽樣調(diào)查失去意義;同時,規(guī)模以上工業(yè)企業(yè)數(shù)量過多,聯(lián)網(wǎng)直報缺乏有效監(jiān)控,易使規(guī)模以上工業(yè)工作量過大,數(shù)據(jù)質(zhì)量堪憂。(2)從全國范圍看,由于各地區(qū)經(jīng)濟發(fā)展不平衡,年主營業(yè)務(wù)收入2000萬元的標(biāo)準(zhǔn)在東西部間的差異過大,容易導(dǎo)致部分地區(qū)規(guī)模以上工業(yè)企業(yè)數(shù)量較少,而部分經(jīng)濟發(fā)達地區(qū)數(shù)量則較多。基于以上兩方面問題,本文認(rèn)為當(dāng)前的劃分標(biāo)準(zhǔn)值偏低,需要適當(dāng)提高,由此引申出需研究的第一個問題:將標(biāo)準(zhǔn)值提高為多少合適?另外,主營業(yè)務(wù)收入變化幅度較大,該指標(biāo)是不是最好的劃分指標(biāo)?這是需要研究的第二個問題。下文將分別針對這兩個問題進行討論。
研究規(guī)模劃分值問題,主要采用邊際理論方法和抽樣誤差分析方法,分別討論最優(yōu)的主營業(yè)務(wù)收入劃分值,也就是將主營業(yè)務(wù)收入提高至多少合適。所用數(shù)據(jù)為湖北省2016年的工業(yè)企業(yè)數(shù)據(jù),共計50852家工業(yè)企業(yè),其中規(guī)模以上工業(yè)企業(yè)15972家。而規(guī)模以下工業(yè)企業(yè)僅有調(diào)查數(shù)據(jù),需要對其進行模擬,得到總體數(shù)據(jù),最終將數(shù)量設(shè)定為34880家(由于未有數(shù)量增長情況的官方數(shù)據(jù),為簡化計算,將其設(shè)定為第三次經(jīng)濟普查的規(guī)模以下工業(yè)企業(yè)數(shù)量)。
1.邊際理論。將主營業(yè)務(wù)收入作為規(guī)模劃分指標(biāo),研究其最優(yōu)劃分值。參考邊際理論思想,分析企業(yè)個數(shù)與工業(yè)企業(yè)年主營業(yè)務(wù)收入之間的關(guān)系。將50852家工業(yè)企業(yè)按年主營業(yè)務(wù)收入降序排序,以年主營業(yè)務(wù)收入的累計比重為縱軸,企業(yè)個數(shù)的累計比重為橫軸,繪制累計分布曲線圖,用來展示隨著企業(yè)個數(shù)的增加,年主營業(yè)務(wù)收入的累計情況,如圖2所示。
圖2 2016年湖北省企業(yè)累積分布曲線圖
按照邊際理論思想,最佳的規(guī)模劃分值應(yīng)該是累計分布曲線與45°平行線的切點,如圖2中圓圈所示。在該切點左邊,企業(yè)個數(shù)增加一個百分比,主營業(yè)務(wù)收入增加的百分比要大于企業(yè)個數(shù)增加百分比;在該切點右邊,企業(yè)個數(shù)增加一個百分比,主營業(yè)務(wù)收入增加的百分比要低于企業(yè)個數(shù)增加的百分比,此時如果對主營業(yè)務(wù)收入較低的企業(yè)進行全面調(diào)查,效率較低。
表1 2016年湖北省全部工業(yè)企業(yè)按年主營業(yè)務(wù)收入分組數(shù)據(jù)分布表
表1展示的是按主營業(yè)務(wù)收入分組,分別計算各組內(nèi)的企業(yè)個數(shù)累計比重和年主營業(yè)務(wù)收入累計比重情況。結(jié)合圖2和表1可得,按主營業(yè)務(wù)收入,湖北省工業(yè)企業(yè)的最佳規(guī)模劃分值大約在工業(yè)企業(yè)年主營業(yè)務(wù)收入累計比重為80%—85%處,此時規(guī)模以上工業(yè)企業(yè)個數(shù)占所有工業(yè)企業(yè)個數(shù)的比重大約為14.0%,相對應(yīng)的最優(yōu)主營業(yè)務(wù)收入的劃分值約為1億元。
2.抽樣誤差。由抽樣理論可知,隨著總體規(guī)模的增加,抽樣效率會隨之提高。將工業(yè)企業(yè)的規(guī)模劃分值提高,規(guī)模以下工業(yè)企業(yè)的總體規(guī)模將變大,這將有助于規(guī)模以下工業(yè)企業(yè)抽樣效率的提高。結(jié)合抽樣調(diào)查成本限制,總體規(guī)模和樣本量不可能無限增大,因此考慮從總體規(guī)?;驑颖玖颗c抽樣效率間的關(guān)系,來選擇最優(yōu)的規(guī)模劃分值。在抽樣調(diào)查中,抽樣誤差可以有效用來反映抽樣效率。抽樣誤差是一個一般概念,可以用估計量方差或估計量標(biāo)準(zhǔn)差來表現(xiàn)。抽樣誤差是不可避免的,但可以加以控制,最根本的方法是改變樣本量,在其他條件相同的情況下,樣本量越大,抽樣誤差越小。抽樣誤差與樣本量的算術(shù)平方根大致呈反比關(guān)系,抽樣誤差在開始時隨著樣本量的增加而顯著降低,但經(jīng)過一定階段后便趨于穩(wěn)定,如果繼續(xù)增大樣本量,抽樣誤差只會有較小程度的降低,從成本角度來說是不合算的?;谠摾碚摚疚膰L試按照不同的劃分值確定規(guī)模以上工業(yè)企業(yè)和規(guī)模以下工業(yè)企業(yè),并對規(guī)模以上工業(yè)企業(yè)實施全面調(diào)查,對規(guī)模以下工業(yè)企業(yè)實行抽樣調(diào)查,此時保持現(xiàn)有抽樣方法和抽樣比不變,選取估計量標(biāo)準(zhǔn)差表示抽樣誤差,分析總樣本量與抽樣誤差之間的關(guān)系,以選擇最優(yōu)的規(guī)模劃分值。為保證抽樣結(jié)果的穩(wěn)定性,每次規(guī)模劃分值調(diào)整后的抽樣都重復(fù)進行500次,抽樣誤差則是500次的平均值。總樣本量與抽樣誤差的關(guān)系見圖3。
圖3 以主營業(yè)務(wù)收入為劃分指標(biāo)的樣本量與誤差的關(guān)系
由圖3可知,本文認(rèn)為最優(yōu)的劃分值應(yīng)在總樣本量與抽樣誤差關(guān)系曲線的“拐點”。在該最佳臨界點的左邊,隨著樣本量的增加,抽樣誤差降低得較快;在該最佳點的右邊,隨著樣本量的增加,抽樣誤差降低的速度在減小。與圖3中最佳臨界點相對應(yīng)的總樣本量約為8500左右,此時對應(yīng)的主營業(yè)務(wù)收入約為1億元,規(guī)模以上工業(yè)企業(yè)數(shù)量占工業(yè)企業(yè)總量的14%左右。
通過以上兩種方法可以發(fā)現(xiàn),二者的結(jié)論基本一致,可考慮將湖北省的規(guī)模劃分標(biāo)準(zhǔn)定為主營業(yè)務(wù)收入1億元,此時規(guī)模以下工業(yè)企業(yè)的調(diào)查變得更有意義,且抽樣效率有明顯改進。同時,標(biāo)準(zhǔn)的提高,有利于集中力量加強規(guī)模以上工業(yè)企業(yè)的數(shù)據(jù)審核,提高聯(lián)網(wǎng)直報的數(shù)據(jù)質(zhì)量。
前文研究了對主營業(yè)務(wù)收入劃分值進行重新調(diào)整的問題,對于提出的第二個問題,主營業(yè)務(wù)收入是不是最佳的劃分指標(biāo),還需進一步討論。由于主營業(yè)務(wù)收入變化快,容易導(dǎo)致部分企業(yè)在規(guī)模以上和規(guī)模以下間頻繁跳動,而且考慮到各地勞動生產(chǎn)率不同,相同人數(shù)的企業(yè),其產(chǎn)值可能存在很大差異。同時,在國外的諸多調(diào)查中,從業(yè)人員數(shù)作為劃分標(biāo)準(zhǔn)已得到廣泛應(yīng)用?;诖?,本文設(shè)想是否可將從業(yè)人員數(shù)量作為劃分指標(biāo),將其與主營業(yè)務(wù)收入進行對比,選擇二者中較穩(wěn)定的指標(biāo),擬分別從離散系數(shù)和指標(biāo)增速兩方面進行比較。
1.離散系數(shù)。通常情況下,一個穩(wěn)定的指標(biāo),其分布的方差較小,分布較集中,離散程度也較低。在統(tǒng)計量中,離散系數(shù)是離散程度的歸一化度量,是一個無量綱量,離散系數(shù)越小說明離散程度越低,因此被廣泛地應(yīng)用于反映變異性。此處的離散系數(shù)討論的是,按照不同的規(guī)模劃分值,對規(guī)模以上工業(yè)企業(yè)進行全面調(diào)查,規(guī)模以下工業(yè)企業(yè)進行抽樣調(diào)查(仍然重復(fù)500次,最終的結(jié)果是500次的平均值),對所得的全部企業(yè)計算離散系數(shù),用來比較兩個指標(biāo)的變異程度,結(jié)果見表2。
表2 不同規(guī)模劃分指標(biāo)的樣本離散系數(shù)
由表2可知,隨著規(guī)模劃分值的提高,主營業(yè)務(wù)收入和從業(yè)人員數(shù)的離散系數(shù)都在逐漸變小,但主營業(yè)務(wù)收入的離散系數(shù)都要大于從業(yè)人員數(shù)的離散系數(shù),說明企業(yè)之間從業(yè)人數(shù)雖有不同,但與主營業(yè)務(wù)收入相比差異要小。因此,從業(yè)人員數(shù)的變異程度較低,更為穩(wěn)定。
2.指標(biāo)增速。為了比較兩個指標(biāo)的穩(wěn)定性,也可以從時間維度分析年主營業(yè)務(wù)收入和從業(yè)人員數(shù)這兩個指標(biāo)隨時間的變化情況。依據(jù)2019年《湖北統(tǒng)計年鑒》,分別計算主營業(yè)務(wù)收入和從業(yè)人員數(shù)的單位指標(biāo)增速,結(jié)果見圖4。
圖4 不同規(guī)模劃分指標(biāo)均值同比增長圖
圖4所示的是主營業(yè)務(wù)收入和從業(yè)人員數(shù)同比增長情況,可以看到主營業(yè)務(wù)收入這一指標(biāo)同比增長率要大于從業(yè)人員數(shù)同比增長率。這說明在時間維度上,主營業(yè)務(wù)收入隨著時間的推移變化幅度較大,相比之下,從業(yè)人員數(shù)表現(xiàn)得則較為穩(wěn)定。
綜合離散系數(shù)和指標(biāo)增速兩種方法,可以發(fā)現(xiàn),從業(yè)人員數(shù)指標(biāo)具有變異小、穩(wěn)定性強、不同區(qū)域間具有相似性的特點,適宜作為工業(yè)企業(yè)規(guī)模劃分指標(biāo)。在將從業(yè)人員數(shù)作為規(guī)模劃分指標(biāo)下,參考前文的最優(yōu)劃分值的方法,可將規(guī)模值設(shè)定在80人左右。
在當(dāng)前的抽樣調(diào)查方案中,采用的是雙框抽樣:目錄企業(yè)抽樣框和地域抽樣框。在前文的問題分析中發(fā)現(xiàn),相比地域抽樣框,目錄企業(yè)抽樣框變動頻繁,無法及時反映企業(yè)新增和消亡的變化情況,而企業(yè)一定是存在于某個地域上的,因此思考能否將雙框歸并為單一的地域框。如果使用單一的地域框,則需要保證單一地域框的抽樣效率要高于現(xiàn)有的雙框抽樣,本文選取樣本量和估計量方差作為評價準(zhǔn)則。
依照2013年第三次經(jīng)濟普查數(shù)據(jù),湖北省規(guī)模以下工業(yè)企業(yè)總計34880家,村(居委會)31674個。按抽樣方案抽取865家目錄企業(yè),這些目錄企業(yè)分布在765個村(居委會);對個體工業(yè)調(diào)查抽取320個村(居委會),將二者匯總,剔除38個相同的村(居委會),湖北省規(guī)模以下工業(yè)的樣本共分布在1047個村(居委會)。如果考慮采用單一的地域框,在估計量方差一樣的情況下,新調(diào)查方案的樣本村(居委會)的數(shù)量應(yīng)小于1047,說明使用單一地域框進行抽樣調(diào)查的設(shè)想成立。
從估計量方差角度,按照現(xiàn)行抽樣方案,估計量的方差為:
srs代表簡單隨機抽樣,cs代表整群抽樣,LE代表目錄企業(yè),UE代表非目錄企業(yè),G代表個體工業(yè)單位。假設(shè)非目錄企業(yè)與個體工業(yè)間相互獨立,則(3)式可以寫成:
而按照本文的思路,采用分層整群抽樣方法的估計量方差為:
假設(shè)目錄企業(yè)、非目錄企業(yè)和個體工業(yè)間相互獨立,則(5)式可以寫成:
如果采用單一地域框也需要對總體分層,為了與現(xiàn)行個體工業(yè)單位分層情況相匹配,也將全部31674個村(居)分為6層,其中,無個體工業(yè)單位的群單位分為1層(層代碼421),2000人以上為必選層(層代碼426),其他群單位按照累計平方根法分4層?,F(xiàn)行個體工業(yè)單位分層結(jié)果如表3。
表3 現(xiàn)行個體工業(yè)單位的地域抽樣分層結(jié)果
考慮將空心層(層代碼421)去掉,從而提高樣本的集中度。類似地,沒有目錄企業(yè)的村也去掉,于是湖北省共有9969個村(居委會)包含目錄企業(yè)。通過樣本量計算公式,抽樣精度與現(xiàn)行抽樣方案相同,即在95%的置信度下,最大相對誤差控制在10%以內(nèi),計算得到的樣本量為660個村(居委會)??梢娫摌颖玖恳陀诂F(xiàn)行抽樣調(diào)查中的1046個村(居委會)。為了對該方法進行全面評估,分別測算了基于三種分層變量、兩種樣本量分配方式的估計精度,具體結(jié)果見表4。
表4 測算結(jié)果匯總
由表4的結(jié)果可得,以群內(nèi)主營業(yè)務(wù)收入為分層變量的內(nèi)曼分配方法在相對誤差和估計量方差上均優(yōu)于其他方法,最主要的是優(yōu)于現(xiàn)行的一階段分層隨機抽樣方法的估計精度,而且該方法分布的村(居委會)的數(shù)量要小于原有865家企業(yè)分布的村(居委會)數(shù)量。因此,我們認(rèn)為對目錄企業(yè)采用單一地域框抽樣時,可以考慮以包含目錄企業(yè)的村(居委會)為抽樣總體,按照該村(居委會)內(nèi)目錄企業(yè)的主營業(yè)務(wù)收入進行分層的內(nèi)曼分配方法。
因前面的討論僅涉及目錄企業(yè),如果考慮對規(guī)模以下工業(yè)企業(yè)和個體工業(yè)單位的調(diào)查采取一套樣本的設(shè)想,則需要從多目標(biāo)問題中入手,討論在一次調(diào)查中同時估計兩個及以上的目標(biāo)變量。在規(guī)模以下工業(yè)調(diào)查中,如果采用單一地域框,將企業(yè)和個體單位同時調(diào)查,則表現(xiàn)為分別估計規(guī)模以下工業(yè)企業(yè)的目標(biāo)變量和個體工業(yè)單位的目標(biāo)變量。而MPPS抽樣,即多變量與規(guī)模成比例的概率抽樣,可以有效地解決多目標(biāo)抽樣的問題。將MPPS抽樣方法與現(xiàn)有的調(diào)查方法進行對比,結(jié)果見表5。
表5 MPPS抽樣結(jié)果與現(xiàn)行抽樣結(jié)果匯總表
由表5可以發(fā)現(xiàn),MPPS抽樣結(jié)果與現(xiàn)行調(diào)查方案的結(jié)果相差不大,而且MPPS抽樣所需的樣本量要小于現(xiàn)行抽樣方案的樣本量之和(即902<1047)。因此,從調(diào)查成本和估計精度的角度出發(fā),可以嘗試對規(guī)模以下工業(yè)調(diào)查采取一套樣本的調(diào)查策略,用MPPS抽樣方法進行多目標(biāo)調(diào)查以獲得對規(guī)模以下工業(yè)企業(yè)和個體工業(yè)單位各自的總體估計。
通過對規(guī)模以下工業(yè)抽樣調(diào)查進行全面回顧,詳細闡述了其發(fā)展歷程和抽樣調(diào)查設(shè)計方案,而后總結(jié)了當(dāng)前規(guī)模以下工業(yè)調(diào)查所存在的三大類問題:抽樣框更新維護滯后、樣本與總體存在差異、存在調(diào)查誤差。同時討論了兩個熱點研究方向:工業(yè)規(guī)模劃分標(biāo)準(zhǔn)和抽樣框設(shè)計討論。
在以上研究的基礎(chǔ)上,對工業(yè)企業(yè)的討論仍面臨一定的挑戰(zhàn),后續(xù)需要進一步討論:一方面,在工業(yè)規(guī)模劃分標(biāo)準(zhǔn)中,雖然對比了主營業(yè)務(wù)收入和從業(yè)人員數(shù)作為規(guī)模劃分指標(biāo)的穩(wěn)定性,認(rèn)為從業(yè)人員數(shù)相對更穩(wěn)定,更適宜作為規(guī)模劃分指標(biāo),但是,在工業(yè)企業(yè)的行業(yè)分類中,高技術(shù)行業(yè)勞動生產(chǎn)率高,勞動密集型行業(yè)勞動生產(chǎn)率低,行業(yè)對規(guī)模劃分標(biāo)準(zhǔn)的影響難以屏蔽;另一方面,在抽樣框設(shè)計的討論中,認(rèn)為可以嘗試采用單一地域框?qū)σ?guī)模以下工業(yè)進行調(diào)查,但地域框的抽樣單元為村(居委會),忽略了現(xiàn)有調(diào)查方案中的行業(yè)分層標(biāo)準(zhǔn),因此該方法對行業(yè)的推斷還需進一步研究。