孫飛 宋向東 鄭陽(yáng)
摘要:文章將Benford 法則與聯(lián)立方程組的計(jì)量經(jīng)濟(jì)學(xué)模型相結(jié)合,從定量角度研究區(qū)域經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量檢驗(yàn)問(wèn)題,改進(jìn)了傳統(tǒng)的以上年統(tǒng)計(jì)數(shù)據(jù)預(yù)測(cè)下年統(tǒng)計(jì)數(shù)據(jù)模型,建立以同一年份指標(biāo)為解釋變量和被解釋量的聯(lián)立方程組計(jì)量經(jīng)濟(jì)學(xué)模型,從而避免了由于宏觀經(jīng)濟(jì)運(yùn)行環(huán)境不穩(wěn)定導(dǎo)致的預(yù)測(cè)偏差,并運(yùn)用2012年實(shí)際數(shù)據(jù)進(jìn)行了模型檢驗(yàn),效果良好。
關(guān)鍵詞:數(shù)據(jù)質(zhì)量;聯(lián)立方程組;Benford法則
一、研究背景
統(tǒng)計(jì)數(shù)據(jù)是一個(gè)國(guó)家或地區(qū)社會(huì)經(jīng)濟(jì)發(fā)展的基本情報(bào),是各級(jí)主管部門正確分析國(guó)民經(jīng)濟(jì)運(yùn)行態(tài)勢(shì)及制定方針政策和宏觀調(diào)控的重要依據(jù)。同時(shí),準(zhǔn)確而充分的統(tǒng)計(jì)信息是決策與科學(xué)研究的基礎(chǔ),直接影響到社會(huì)科學(xué)研究能否產(chǎn)生正確的研究結(jié)果。因此對(duì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量作出科學(xué)的檢驗(yàn),具有重要現(xiàn)實(shí)意義和應(yīng)用價(jià)值。然而由于各地政府為了自身利益過(guò)于追求政績(jī)統(tǒng)計(jì),公布的統(tǒng)計(jì)數(shù)據(jù)往往存在著夸大和水分的情況,使得上報(bào)數(shù)據(jù)存在著嚴(yán)重的質(zhì)量問(wèn)題,使人們對(duì)于統(tǒng)計(jì)數(shù)據(jù)產(chǎn)生信任危機(jī)。在這種情況下,檢驗(yàn)區(qū)域宏觀經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量成為了各級(jí)統(tǒng)計(jì)局的一項(xiàng)重要的任務(wù),引起了政府和學(xué)者的深入研究和廣泛探討。
二、研究指標(biāo)
描述區(qū)域宏觀經(jīng)濟(jì)運(yùn)行的統(tǒng)計(jì)指標(biāo)眾多,為了研究定量診斷模型的典型性,本文只選擇了區(qū)域宏觀經(jīng)濟(jì)運(yùn)行的11個(gè)核心指標(biāo)來(lái)研究統(tǒng)計(jì)數(shù)據(jù)質(zhì)量定量診斷模型,包括地區(qū)生產(chǎn)總值(RP)、財(cái)政收入(CZ)、居民消費(fèi)水平(JZ)、固定資產(chǎn)投資(I)、人口數(shù)(RS)、電力消耗量(DX)、社會(huì)消費(fèi)零售總額(SZ)、區(qū)域貨運(yùn)量(HY)、失業(yè)率(SYL)、就業(yè)工資總額(GZ)和商品零售價(jià)格指數(shù)(SJ)。
地區(qū)生產(chǎn)總值、財(cái)政收入、固定資產(chǎn)投資、全社會(huì)商品零售總額這四個(gè)指標(biāo)與地區(qū)的經(jīng)濟(jì)發(fā)展水平的相關(guān)性較高,能夠反映出一個(gè)地區(qū)政府的政績(jī),也最容易出現(xiàn)質(zhì)量問(wèn)題,而人口數(shù)、電力平均消耗量等七個(gè)其他指標(biāo)相比之下只是間接地體現(xiàn)區(qū)域宏觀經(jīng)濟(jì)的運(yùn)行情況,與地方政府的政績(jī)聯(lián)系沒(méi)那么緊密,數(shù)據(jù)質(zhì)量不那么容易出現(xiàn)問(wèn)題,指標(biāo)數(shù)據(jù)相對(duì)真實(shí)可信。
三、模型構(gòu)建
本文采用聯(lián)立方程組模型研究區(qū)域宏觀經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量診斷問(wèn)題。首先,選擇內(nèi)生變量RP、CZ、JX、I為診斷指標(biāo);其次,假定外生變量RS、DX、SZ、HY、SYL、GZ和SJ為真實(shí)指標(biāo)。
建立的初步靜態(tài)結(jié)構(gòu)型模型為
RP=a■+a■RS+a■DX+a■SZ+a■HY+a■SYL+a■GZ+a■SJ+ε■CZ=b■+b■RS+b■DX+b■SZ+b■HY+b■SYL+b■GZ+b■SJ+ε■JX=c■+c■RS+c■DX+c■SZ+c■HY+c■SYL+c■GZ+c■SJ+ε■I=d■+d■RS+d■DX+d■SZ+d■HY+d■SYL+d■GZ+d■SJ+ε■
四、模型的識(shí)別判斷
上述結(jié)構(gòu)型模型有內(nèi)生變量M=4,前定變量K=7。對(duì)聯(lián)立方程組的識(shí)別性進(jìn)行判斷。
首先,用階條件對(duì)方程組內(nèi)的第一個(gè)方程進(jìn)行判斷:這時(shí)m1=1,k1=7,K-k1=0,m1-1=0,所以K-k1=-1,表明可能為恰好識(shí)別。其次,用秩條件判斷,劃去第一行和非零系數(shù)所在的列,得3行10列矩陣,即
(B0,Γ0)=
1 0 0 -b■ -b■ -b■ -b■ -b■ -b■ -b■0 1 0 -c■ -c■ -c■ ?-c■ -c■ -c■ -c■ 0 0 1 -d■ -d■ -d■ -d■ -d■ -d■ -d■
顯然Rank(B0,Γ0)=3,M-1=3,則由秩條件判斷表明該方程為恰好識(shí)別。再根據(jù)上述階條件可知,此方程可以識(shí)別。
用秩條件和階條件判斷方程組內(nèi)的其他方程也均恰好識(shí)別,可確定該聯(lián)立方程組計(jì)量經(jīng)濟(jì)學(xué)模型是可以識(shí)別的。
五、統(tǒng)計(jì)數(shù)據(jù)的Benford檢驗(yàn)
統(tǒng)計(jì)數(shù)據(jù)呈自然狀態(tài)分布時(shí)存在著特定的分布規(guī)律,這種分布規(guī)律和Benford定律有著一定的聯(lián)系。真實(shí)的數(shù)據(jù)可以非常好地符合Benford定律,那么如果有數(shù)據(jù)和Benford定律相背離,就意味著存在數(shù)據(jù)失真的可能性。
在2006~2011年我國(guó)政府統(tǒng)計(jì)數(shù)據(jù)中選擇地區(qū)生產(chǎn)總值、財(cái)政收入、居民消費(fèi)水平、固定資產(chǎn)投資、總?cè)丝跀?shù)、電力消耗量、社會(huì)消費(fèi)零售總額、區(qū)域貨運(yùn)量、就業(yè)工資總額九項(xiàng)區(qū)域宏觀經(jīng)濟(jì)指標(biāo),以全國(guó)31個(gè)省市(西藏地區(qū)個(gè)別年份無(wú)統(tǒng)計(jì)數(shù)據(jù))為對(duì)象進(jìn)行分析(樣本容量n=1647)??紤]到宏觀經(jīng)濟(jì)指標(biāo)首位數(shù)字出現(xiàn)問(wèn)題概率較小,本文直接對(duì)所有數(shù)據(jù)的第二位數(shù)字分布進(jìn)行Benford定律測(cè)試,整個(gè)過(guò)程應(yīng)用Excel軟件計(jì)算,測(cè)試結(jié)果如圖1、表1所示。
從表1及圖1可以看出第二位數(shù)字的分布與Benford分布基本吻合,兩者之間的差異值的絕對(duì)值都小于0.02,并且觀察頻率與Benford分布一樣都是隨著數(shù)字的變大出現(xiàn)頻率逐漸遞減的趨勢(shì)。但是數(shù)字4和數(shù)字7的頻率差異值高于0.01,這種偏離的程度是否在可以接受的誤差范圍內(nèi),還需要對(duì)其進(jìn)行Benford的檢驗(yàn)。
(一)提出假設(shè)
H0:統(tǒng)計(jì)數(shù)據(jù)的第二位數(shù)中,0~9這10個(gè)自然數(shù)的實(shí)際出現(xiàn)次數(shù)與Benford定律下的期望出現(xiàn)次數(shù)沒(méi)有顯著差別。
H1:統(tǒng)計(jì)數(shù)據(jù)的第二位數(shù)中,0~9這10個(gè)自然數(shù)的實(shí)際出現(xiàn)次數(shù)與Benford定律下的期望出現(xiàn)次數(shù)有顯著差別。
(二)構(gòu)建檢驗(yàn)統(tǒng)計(jì)量
根據(jù)指標(biāo)數(shù)據(jù)的第二位數(shù)中,0~9這10個(gè)自然數(shù)實(shí)際出現(xiàn)的次數(shù)與Benford定律下期望出現(xiàn)的次數(shù)構(gòu)建一個(gè)X2統(tǒng)計(jì)檢驗(yàn)量。
X2擬合優(yōu)度檢驗(yàn)公式為
X2=∑■
式中,Oi和Ei分別是被檢驗(yàn)數(shù)據(jù)的第二位數(shù)字出現(xiàn)的實(shí)際次數(shù)和期望次數(shù)。第二位上出現(xiàn)的數(shù)字是0-9,X2檢驗(yàn)的自由度為9,在0.05置信度下,X2檢驗(yàn)值為9.8415小于16.919時(shí),接受原假設(shè),即統(tǒng)計(jì)數(shù)據(jù)的第二位數(shù)中每個(gè)自然數(shù)的實(shí)際出現(xiàn)次數(shù)與Benford定律下的期望出現(xiàn)次數(shù)沒(méi)有顯著差別。
六、模型的估計(jì)與檢驗(yàn)
利用SAS軟件的SYSLIN過(guò)程對(duì)模型進(jìn)行估計(jì)與檢驗(yàn),數(shù)據(jù)擬合結(jié)果見(jiàn)表2。
通過(guò)表2結(jié)果可以看出各個(gè)方程擬合效果良好,在0.01顯著性水平下模型各方程均能通過(guò)顯著性檢驗(yàn)。但個(gè)別幾個(gè)變量的系數(shù)檢驗(yàn)不能通過(guò),結(jié)合變量系數(shù)經(jīng)濟(jì)意義合理性,對(duì)方程中的變量按系數(shù)不通過(guò)檢驗(yàn)的概率值從大到小逐個(gè)剔除,最終得到方程為
RP=-0.11571RS+2.558542DX+2.135011SZ+0.004580HYCZ=-0.09835RS+0.242938DX+0.136688SZ+24.56903SYL+0.424629GZJX=-1.22027RS+5.522863GZ+72.96371SJI=1.068947SZ+0.032516HY-1.01736GZ+5.467065SJ
數(shù)據(jù)擬合結(jié)果見(jiàn)表3。
通過(guò)表3結(jié)果可以看出各個(gè)方程擬合效果良好,在0.01顯著性水平下本模型各方程均能通過(guò)顯著性檢驗(yàn)。
經(jīng)過(guò)對(duì)模型計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn),聯(lián)立方程組模型不存在異方差檢驗(yàn)性、序列相關(guān)性檢驗(yàn)和多重共線性。
七、統(tǒng)計(jì)數(shù)據(jù)質(zhì)量檢驗(yàn)
為檢驗(yàn)?zāi)P偷脑\斷效果,本文對(duì)河北、湖南和廣西三個(gè)地區(qū)的2012年宏觀經(jīng)濟(jì)的地區(qū)生產(chǎn)總值(RP)、財(cái)政收入(CZ)、居民消費(fèi)水平(JX)和固定資產(chǎn)投資(I)四個(gè)指標(biāo)進(jìn)行檢驗(yàn)分析。把國(guó)家統(tǒng)計(jì)局公布的真實(shí)RS、DX、XZ、HY、SYL、GZ、SJ數(shù)據(jù)代入上述模型得出RP、CZ、JZ、I的診斷結(jié)果見(jiàn)表4。
通過(guò)分析各地區(qū)數(shù)據(jù)APE值,由表4可以看出,模型估計(jì)的河北地區(qū)的財(cái)政收入和固定資產(chǎn)投資、湖南地區(qū)的固定資產(chǎn)投資、廣西地區(qū)的居民消費(fèi)水平與地方提供數(shù)據(jù)出入較大,超過(guò)了10%。一方面,可能是建模時(shí)遺漏了影響這幾個(gè)宏觀經(jīng)濟(jì)指標(biāo)增長(zhǎng)的指標(biāo)變量,也可能是對(duì)不符合要求異常數(shù)據(jù)沒(méi)有進(jìn)行有效技術(shù)處理造成的;另一方面也可能是這幾個(gè)指標(biāo)數(shù)據(jù)質(zhì)量確實(shí)存在問(wèn)題有待診斷。
八、小結(jié)
本文研究的是區(qū)域宏觀經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量問(wèn)題,選取11個(gè)主要的宏觀經(jīng)濟(jì)指標(biāo)構(gòu)建診斷模型。歸納起來(lái)主要有以下幾個(gè)特點(diǎn):第一,文章首先對(duì)2006~2011年31個(gè)省宏觀經(jīng)濟(jì)指標(biāo)的截面統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了Benford法則檢驗(yàn),考察其可靠性,并作為構(gòu)建截面數(shù)據(jù)模型的前置條件;第二,文章首創(chuàng)了以同一年指標(biāo)數(shù)據(jù)建立宏觀經(jīng)濟(jì)數(shù)據(jù)檢驗(yàn)的聯(lián)立方程組的計(jì)量經(jīng)濟(jì)學(xué)組模型的方法,相比以往的結(jié)合上一年度數(shù)據(jù)預(yù)測(cè)本年度經(jīng)濟(jì)數(shù)據(jù)模型有許多優(yōu)點(diǎn)。此外,模型的外生變量指標(biāo)選取還可能優(yōu)化調(diào)整,有些指標(biāo)的統(tǒng)計(jì)數(shù)據(jù)如經(jīng)過(guò)專業(yè)的技術(shù)處理后再應(yīng)用于模型擬合效果可能會(huì)更好。
參考文獻(xiàn):
[1]高鴻業(yè).西方經(jīng)濟(jì)學(xué)[M].北京:中國(guó)經(jīng)濟(jì)出版社,1996.
[2]李子奈,潘文卿.計(jì)量經(jīng)濟(jì)學(xué)(第2版)[M].北京:高等教育出版社,2005.
[3]高惠璇.SAS系統(tǒng)SAS/ETS軟件使用手冊(cè)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998.
*基金項(xiàng)目:全國(guó)統(tǒng)計(jì)科研計(jì)劃項(xiàng)目(2011LY064)。
(作者單位:燕山大學(xué)理學(xué)院)