陳夢(mèng)根,劉 浩
(北京師范大學(xué) 統(tǒng)計(jì)學(xué)院,北京100875)
在信息技術(shù)快速發(fā)展的背景下,大數(shù)據(jù)浪潮正以銳不可當(dāng)之勢(shì)洶涌而來,對(duì)社會(huì)各個(gè)領(lǐng)域都可能帶來巨大影響。政府統(tǒng)計(jì)是社會(huì)一項(xiàng)重要的基礎(chǔ)設(shè)施,大數(shù)據(jù)將給傳統(tǒng)的政府統(tǒng)計(jì)體系帶來沖擊。國(guó)家統(tǒng)計(jì)局局長(zhǎng)馬建堂曾指出,必須充分認(rèn)識(shí)大數(shù)據(jù)給政府統(tǒng)計(jì)帶來的歷史機(jī)遇和重要挑戰(zhàn),開發(fā)擴(kuò)大政企合作渠道,積極主動(dòng)利用海量電子化數(shù)據(jù),加快推進(jìn)統(tǒng)計(jì)現(xiàn)代化[1]179-186。從政府統(tǒng)計(jì)角度看,價(jià)格統(tǒng)計(jì)由于樣本采集范圍廣、統(tǒng)計(jì)頻率高等原因,成為受大數(shù)據(jù)直接影響最為顯著的一個(gè)領(lǐng)域。消費(fèi)者價(jià)格指數(shù)(CPI)作為最重要的一個(gè)價(jià)格統(tǒng)計(jì)指標(biāo),可謂首當(dāng)其沖,成為統(tǒng)計(jì)學(xué)界關(guān)注的焦點(diǎn)之一。
現(xiàn)有文獻(xiàn)中,有關(guān)大數(shù)據(jù)對(duì)CPI統(tǒng)計(jì)的影響研究還很少?;趦r(jià)格采集技術(shù)與交易結(jié)算設(shè)備的發(fā)展,統(tǒng)計(jì)界學(xué)者較早關(guān)注CPI統(tǒng)計(jì)如何利用掃描數(shù)據(jù)的問題,例如,Richardson利用尼爾森公司的掃描數(shù)據(jù)對(duì)美國(guó)紐約大都市谷物類早餐價(jià)格指數(shù)進(jìn)行研究,將初級(jí)掃描指數(shù)和運(yùn)用非掃描總體編制的CPI指數(shù)結(jié)合起來編制實(shí)驗(yàn)性指數(shù)[2]。國(guó)內(nèi)學(xué)者陳相成、喬晗研究了瑞士、挪威與荷蘭利用掃描數(shù)據(jù)編制CPI的經(jīng)驗(yàn),認(rèn)為這些國(guó)家將掃描數(shù)據(jù)作為CPI的價(jià)格采集手段,但未能充分利用描述碼所獲的其他信息[3]。喬晗進(jìn)一步提出了利用掃描數(shù)據(jù)編制中國(guó)CPI的思路,試圖為基于大數(shù)據(jù)的政府統(tǒng)計(jì)源頭數(shù)據(jù)信息化改革提供理論依據(jù)[4]。實(shí)際上,大數(shù)據(jù)技術(shù)有助于改革CPI調(diào)查方法,基于大數(shù)據(jù)編制的CPI可與傳統(tǒng)CPI相互印證,共同促進(jìn)價(jià)格統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的提高,逐步過渡到以大數(shù)據(jù)方法計(jì)算CPI[5]。
目前,大數(shù)據(jù)已成為各界討論的熱點(diǎn),普遍認(rèn)為世界正進(jìn)入一個(gè)大數(shù)據(jù)時(shí)代。針對(duì)大數(shù)據(jù)的內(nèi)涵,鄭京平用4V來形容,即容量巨大、內(nèi)容多樣、流動(dòng)速度快、不穩(wěn)定[6]。具體而言:第一,大數(shù)據(jù)在量上遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)意義的度量范圍,一般認(rèn)為大數(shù)據(jù)的數(shù)量級(jí)應(yīng)該以TB①① 數(shù)據(jù)的存儲(chǔ)單位主要有Byte(字節(jié))、KB(千字節(jié))、MB(兆字節(jié))、GB、TB、PB、EB、ZB。其中,1KB=1 024字節(jié),1MB=1 024KB,1GB=1 024MB,1TB=1 024GB,依此類推。來表示,甚至是以PB、EB為基本單位,目前全球每?jī)商煨纬傻臄?shù)據(jù)量約達(dá)5EB(即5×1018B),相當(dāng)于人類誕生之日至2003年間形成的數(shù)據(jù)量總和;第二,大數(shù)據(jù)的類型多樣,復(fù)雜程度高,包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并且半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)所占份額越來越大;第三,大數(shù)據(jù)的產(chǎn)生頻率快,移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等無時(shí)無刻不在大量生成海量電子化數(shù)據(jù),全球所有數(shù)據(jù)的90%產(chǎn)生于過去兩年;第四,大數(shù)據(jù)來源更加廣泛、時(shí)效性更強(qiáng),海量電子化數(shù)據(jù)生成和存儲(chǔ)的管理者及使用者五花八門,雖然可以更好地反映數(shù)據(jù)的情況,但是具有不穩(wěn)定的特性。
圖1 大數(shù)據(jù)的內(nèi)涵特征(4V框架)圖
大數(shù)據(jù)在統(tǒng)計(jì)中的應(yīng)用剛剛起步,國(guó)際組織、各國(guó)政府以及眾多企業(yè)等已開始探索大數(shù)據(jù)在價(jià)格、交通、氣象、社交、管理、決策等領(lǐng)域的應(yīng)用。大數(shù)據(jù)將對(duì)傳統(tǒng)統(tǒng)計(jì)帶來巨大變革,主要體現(xiàn)在以下兩個(gè)方面:一是統(tǒng)計(jì)思維的變化。大數(shù)據(jù)時(shí)代統(tǒng)計(jì)數(shù)據(jù)的生產(chǎn)與分析必須更加注重效率和時(shí)效性,更快、更有效地應(yīng)用于經(jīng)濟(jì)社會(huì)管理、分析與決策。統(tǒng)計(jì)關(guān)注的重點(diǎn)可能不再是數(shù)據(jù)采集、加工與獲得,而是海量數(shù)據(jù)如何甄別、提取和加工,從而得到有用數(shù)據(jù)。二是統(tǒng)計(jì)方法的變化,傳統(tǒng)統(tǒng)計(jì)中抽樣調(diào)查是最基本、最重要的方法,建立了成熟的科學(xué)理論依據(jù),以確保數(shù)據(jù)的準(zhǔn)確性與可靠性,而大數(shù)據(jù)條件下可能從樣本直接跨越到總體,直接對(duì)總體開展分析。大數(shù)據(jù)時(shí)代的統(tǒng)計(jì)總體、個(gè)體及樣本的定義方式和內(nèi)涵將發(fā)生變化,可以利用一切可利用的、盡量多的數(shù)據(jù)來進(jìn)行分析,而不僅僅局限于抽樣樣本框。當(dāng)然,這也并非意味著放棄抽樣方法,而是結(jié)合現(xiàn)有盡可能多而復(fù)雜的數(shù)據(jù)來獲取抽樣??紤]到效率、成本、技術(shù)等因素,很多情況下可能仍然會(huì)選擇抽樣方法,直到技術(shù)、方法、成本等因素成熟,才可能全面轉(zhuǎn)向基于大數(shù)據(jù)要求的統(tǒng)計(jì)方法。
理論上,大數(shù)據(jù)對(duì)CPI統(tǒng)計(jì)的影響全面而深刻,涉及數(shù)據(jù)采集、計(jì)算公式、質(zhì)量調(diào)整、權(quán)重、數(shù)據(jù)頻率等各個(gè)方面,國(guó)內(nèi)外對(duì)這一問題的研究才剛剛起步,尚無系統(tǒng)性成果。
1.大數(shù)據(jù)與CPI數(shù)據(jù)采集。目前,中國(guó)編制CPI主要采用人工采價(jià)和抽樣調(diào)查方法,通過手持?jǐn)?shù)據(jù)采集器采價(jià)。這種方式使數(shù)據(jù)采集相對(duì)于純手工方式效率大大提高,及時(shí)性也顯著增強(qiáng),而且降低了人為誤差。但是,現(xiàn)行方式仍然存在一些問題,如:抽樣調(diào)查方法不可避免地引入抽樣誤差;采價(jià)成本相對(duì)較高,每一個(gè)基本分類僅選取兩三種商品作為代表,會(huì)造成規(guī)格品選取和替代誤差、獲取成交價(jià)時(shí)的技巧性和記錄數(shù)據(jù)時(shí)的工作誤差等;按固定時(shí)點(diǎn)對(duì)規(guī)格品進(jìn)行采樣得到的樣本數(shù)據(jù)為離散數(shù)據(jù),由此計(jì)算的CPI有高估或低估購(gòu)買商品的平均價(jià)格。為此,英國(guó)、瑞典、荷蘭等發(fā)達(dá)國(guó)家已經(jīng)開始積極尋求用海量的電子信息數(shù)據(jù)替代人工抽樣調(diào)查數(shù)據(jù)。隨著大數(shù)據(jù)技術(shù)的發(fā)展,納入CPI編制的規(guī)格品的價(jià)格與結(jié)構(gòu)和總體非常接近,這與傳統(tǒng)的抽樣數(shù)據(jù)即用少量樣本進(jìn)行研究有著重大差別,不但能夠減少人為的誤差,而且可以減少抽樣誤差。
2.大數(shù)據(jù)與CPI指數(shù)計(jì)算。計(jì)算CPI一般分為兩步:一是計(jì)算單項(xiàng)商品和服務(wù)項(xiàng)目的價(jià)格指數(shù),根據(jù)所屬代表規(guī)格商品的相對(duì)數(shù)采用算術(shù)平均法計(jì)算;二是計(jì)算類別及總指數(shù),目前國(guó)際上通行的指數(shù)計(jì)算公式主要有拉氏(Laspeyres)指數(shù)和派氏(Passche)指數(shù),一般采用拉式指數(shù)公式,即以基期支出比重為權(quán)數(shù)將個(gè)體進(jìn)行算數(shù)平均[7]2-13。從有效性和應(yīng)用性考慮,匯總時(shí)中國(guó)采用拉氏固定加權(quán)算術(shù)平均數(shù)計(jì)算,公式如下:
一是公式中時(shí)間段t的長(zhǎng)短與連續(xù)性問題。傳統(tǒng)的CPI編制過程中采集數(shù)據(jù)一般是定時(shí)定點(diǎn)的,兩個(gè)數(shù)據(jù)點(diǎn)之間一般間隔較長(zhǎng)時(shí)間。事實(shí)上,商家和消費(fèi)者都會(huì)根據(jù)價(jià)格來調(diào)整自己的銷售或者購(gòu)買方式,商品滯銷時(shí)商家可能會(huì)采用打折促銷的方式,而商品打折時(shí)消費(fèi)者有可能會(huì)增加購(gòu)買數(shù)量。固定時(shí)點(diǎn)數(shù)據(jù)可能高估或低估規(guī)格商品的價(jià)格指數(shù),大數(shù)據(jù)時(shí)代可以通過網(wǎng)絡(luò)信息技術(shù)獲取商品價(jià)格和數(shù)量高頻信息,動(dòng)態(tài)計(jì)算CPI指數(shù),降低統(tǒng)計(jì)誤差。
二是公式中產(chǎn)品i的范圍。大數(shù)據(jù)使我們易于獲得近似總體的樣本,CPI計(jì)算公式中產(chǎn)品i不會(huì)僅僅局限于八大類,而是擴(kuò)大到居民消費(fèi)的全部商品。阿里巴巴2011年推出的網(wǎng)絡(luò)零售價(jià)格指數(shù)(iSPI),其成交價(jià)格是淘寶四級(jí)類物品的成交均價(jià),權(quán)重為支付寶的金額,雖然iSPI沒有將淘寶網(wǎng)所有產(chǎn)品的成交價(jià)格納入統(tǒng)計(jì)范圍(這主要是出于統(tǒng)計(jì)效率的考慮),但其均價(jià)來自第一個(gè)四級(jí)分級(jí)項(xiàng)目中所有成交價(jià)的均價(jià)。相比之下,傳統(tǒng)CPI統(tǒng)計(jì)所覆蓋的商品類別較少,對(duì)于目前一些家庭中的重要支出,如教育經(jīng)費(fèi)中的補(bǔ)習(xí)費(fèi)、網(wǎng)上購(gòu)物支出等都未進(jìn)行統(tǒng)計(jì),覆蓋面相對(duì)較窄。
3.大數(shù)據(jù)與CPI權(quán)重更新。權(quán)重選擇是CPI編制中的一個(gè)重要環(huán)節(jié),目前中國(guó)一般每五年做一次大調(diào)整。最近的一次大調(diào)是在2011年,如表1所示,食品類權(quán)重占比下降,居住類權(quán)重占比上升。實(shí)際上,由于中國(guó)經(jīng)濟(jì)正處于轉(zhuǎn)型時(shí)期,發(fā)展迅速,居民消費(fèi)結(jié)構(gòu)變化顯著,權(quán)重更新慢成為CPI數(shù)據(jù)質(zhì)量受到詬病的原因之一。首先,中國(guó)CPI權(quán)重調(diào)整頻率相對(duì)于歐美國(guó)家而言更低,采用大數(shù)據(jù)技術(shù)可以有效解決權(quán)重調(diào)整慢的問題;其次,與發(fā)達(dá)國(guó)家CPI權(quán)重調(diào)整的高度透明性不同,中國(guó)歷次權(quán)重調(diào)整過程中國(guó)家統(tǒng)計(jì)局很少公開各類商品的具體權(quán)重,在大數(shù)據(jù)的支持下,有關(guān)部門可以較為容易的獲得CPI大類商品權(quán)重及下級(jí)分類商品權(quán)重,從而提高CPI權(quán)重的透明度。
表1 新舊CPI權(quán)數(shù)的構(gòu)成表
4.大數(shù)據(jù)與CPI季節(jié)調(diào)整。物價(jià)變化可能受到季節(jié)因素的影響,季節(jié)調(diào)整是編制CPI過程中非常重要的一環(huán)。CPI季節(jié)調(diào)整就是通過統(tǒng)計(jì)手段估計(jì)和剔除季節(jié)性因素在CPI中的影響,使得CPI能更好地反映一般商品價(jià)格總體水平的變化。中國(guó)現(xiàn)行CPI數(shù)據(jù)并沒有剔除季節(jié)性因素的影響,居民消費(fèi)物價(jià)同比指數(shù)不但不具備再加工性,其上漲還受到過去CPI數(shù)值的影響,即“翹尾效應(yīng)”。此外,CPI環(huán)比統(tǒng)計(jì)起步較晚,技術(shù)上還不夠成熟,從而影響CPI的數(shù)據(jù)質(zhì)量,不能及時(shí)有效地反映季節(jié)性的消費(fèi)結(jié)構(gòu)變化。在大數(shù)據(jù)背景下,CPI規(guī)格品采集數(shù)據(jù)的頻率提高、種類擴(kuò)大,使基本規(guī)格品得到的數(shù)據(jù)更加可靠,為采用 X-11-ARIMA 法、改進(jìn)的 X-12-ARIMA法進(jìn)行CPI季節(jié)調(diào)整提供了可能,同時(shí)也為結(jié)合Tramo Seats等季節(jié)性調(diào)整方法編制剔除季節(jié)性因素影響的CPI提供了基礎(chǔ)[8]。
5.大數(shù)據(jù)與CPI質(zhì)量變化調(diào)整。CPI統(tǒng)計(jì)必須針對(duì)以下情形做質(zhì)量變化調(diào)整:一是規(guī)格品的質(zhì)量在報(bào)告期內(nèi)發(fā)生變化,但現(xiàn)行CPI統(tǒng)計(jì)方法無法將質(zhì)量變化與單純的價(jià)格上漲相區(qū)分;二是報(bào)告期內(nèi)出現(xiàn)新產(chǎn)品,而目前統(tǒng)計(jì)的規(guī)格品并未將這些產(chǎn)品納入統(tǒng)計(jì)范圍之內(nèi);三是舊的產(chǎn)品被市場(chǎng)所淘汰,但是由于“一籃子商品”調(diào)整的時(shí)滯,這些產(chǎn)品仍然在規(guī)格品當(dāng)中[9]。
受制于傳統(tǒng)手工采集價(jià)格數(shù)據(jù)信息的不足,中國(guó)的CPI統(tǒng)計(jì)尚未實(shí)施質(zhì)量變化調(diào)整。CPI調(diào)查員為了克服產(chǎn)品更新、不可替代性等問題,經(jīng)常使用一些不規(guī)范的方法來解決產(chǎn)品質(zhì)量變化問題,都是任憑調(diào)查員的主觀判斷。大數(shù)據(jù)時(shí)代可以通過電子化手段獲取各種商品的多方面特征信息,例如掃描數(shù)據(jù)可得到產(chǎn)品不同維度的特征信息,從而為CPI質(zhì)量變化調(diào)整提供了基礎(chǔ)。這些海量的評(píng)價(jià)數(shù)據(jù)使對(duì)商品質(zhì)量提升或下降的評(píng)價(jià)與估計(jì)成為可能,有利于對(duì)CPI質(zhì)量變化調(diào)整系數(shù)的估計(jì)。
6.大數(shù)據(jù)與CPI數(shù)據(jù)質(zhì)量。從規(guī)范流程來看,數(shù)據(jù)質(zhì)量評(píng)估是CPI統(tǒng)計(jì)的重要工作環(huán)節(jié)之一,大數(shù)據(jù)對(duì)傳統(tǒng)CPI統(tǒng)計(jì)體系下CPI數(shù)據(jù)質(zhì)量提出了嚴(yán)峻挑戰(zhàn)。首先,在及時(shí)性方面,與電子商務(wù)、互聯(lián)網(wǎng)搜索、瀏覽指標(biāo)近乎即時(shí)信息相比,傳統(tǒng)市場(chǎng)手工采集的交易量和價(jià)格數(shù)據(jù)及時(shí)性與頻率嚴(yán)重不足。其次,在準(zhǔn)確性和可靠性方面,網(wǎng)絡(luò)社會(huì)居民消費(fèi)行為更為復(fù)雜,消費(fèi)結(jié)構(gòu)多元化,網(wǎng)購(gòu)、打折、促銷、二手市場(chǎng)等更為常見,對(duì)消費(fèi)品價(jià)格影響巨大,但傳統(tǒng)CPI統(tǒng)計(jì)未反映或極少反映這方面信息。大數(shù)據(jù)時(shí)代為更準(zhǔn)確地評(píng)估居民消費(fèi)物價(jià)水平的變化提供了新的契機(jī),但也應(yīng)看到,大數(shù)據(jù)時(shí)代數(shù)據(jù)錯(cuò)綜復(fù)雜、真假難辨,各種“噪音”影響嚴(yán)重,保證CPI的準(zhǔn)確性和可靠性同樣極為困難。再次,在適應(yīng)性和可得性方面,目前中國(guó)現(xiàn)行CPI統(tǒng)計(jì)對(duì)700余個(gè)規(guī)格品進(jìn)行價(jià)格調(diào)查,并根據(jù)居民消費(fèi)的支出對(duì)不同類別賦予不同的權(quán)重,最終計(jì)算得出CPI數(shù)據(jù),但CPI分類指數(shù)體系較為粗糙,相比于美國(guó)等發(fā)達(dá)國(guó)家發(fā)布詳細(xì)的細(xì)類指數(shù)仍然存在明顯不足。在網(wǎng)絡(luò)社會(huì)中,商業(yè)活動(dòng)由傳統(tǒng)渠道向網(wǎng)絡(luò)渠道拓展,由此產(chǎn)生大量數(shù)據(jù),電子數(shù)據(jù)信息產(chǎn)生速度迅速,計(jì)算機(jī)云計(jì)算技術(shù)使得政府在統(tǒng)計(jì)時(shí)可以在短期內(nèi)獲得大量數(shù)據(jù),為細(xì)化指數(shù)和改進(jìn)數(shù)據(jù)可得性提供了可能。
大數(shù)據(jù)為改進(jìn)CPI數(shù)據(jù)采集方法提供了強(qiáng)大的技術(shù)基礎(chǔ),主要體現(xiàn)在數(shù)據(jù)范圍和數(shù)源途徑。一方面,大數(shù)據(jù)極大地拓展了CPI統(tǒng)計(jì)的數(shù)據(jù)范圍。現(xiàn)行CPI調(diào)查制度對(duì)262個(gè)基本分類的每個(gè)類別各采集兩到三種規(guī)格品,與現(xiàn)實(shí)生活中消費(fèi)者購(gòu)買的產(chǎn)品種類數(shù)差距巨大。進(jìn)入大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)部門可以根據(jù)實(shí)際情況,采集海量的各種不同規(guī)格產(chǎn)品信息,獲得接近于總體的樣本。另一方面,大數(shù)據(jù)改變了“定時(shí)、定點(diǎn)”采集數(shù)據(jù)的方式。通過政企合作等方式,與大型連鎖超市、電商銷售平臺(tái)合作,建立高效的數(shù)據(jù)共享機(jī)制,從企業(yè)直接獲得一手資料,提高數(shù)據(jù)的可獲得性、及時(shí)性和準(zhǔn)確性,為改進(jìn)CPI數(shù)據(jù)質(zhì)量提供更堅(jiān)實(shí)的源數(shù)據(jù)基礎(chǔ)。為此,政府統(tǒng)計(jì)部門可以和大型連鎖商場(chǎng)以及利用條形碼進(jìn)行結(jié)算的商戶合作,定期將數(shù)據(jù)發(fā)送到政府部門,或是政府從市場(chǎng)調(diào)研公司處購(gòu)買經(jīng)初步處理的相關(guān)數(shù)據(jù)。
大數(shù)據(jù)使編制CPI可用的樣本數(shù)量急劇擴(kuò)大,樣本獲取時(shí)間點(diǎn)的連續(xù)性加強(qiáng),過去按一籃子規(guī)格品固定權(quán)重計(jì)算CPI的方法已經(jīng)不再適合大數(shù)據(jù)時(shí)代的要求。因此,理論上應(yīng)該摒棄傳統(tǒng)拉氏公式計(jì)算CPI的方法,采用高級(jí)指數(shù)公式(Superlative Index Formulas)來計(jì)算,如高級(jí)的托恩奎斯特價(jià)格指數(shù)(Trailing Torngrist Index)或費(fèi)雪理想指數(shù)(Fisher Ideal Index)。計(jì)算公式如下:
相比于傳統(tǒng)計(jì)算方法,式(2)計(jì)算的CPI具有以下優(yōu)點(diǎn):一是鏈?zhǔn)郊訖?quán)CPI可以反映更多的替代效應(yīng)。傳統(tǒng)CPI計(jì)算公式在發(fā)生提替代變化時(shí),由調(diào)查員選擇同類產(chǎn)品中的替代品,只能反映同類產(chǎn)品的替代效應(yīng),而鏈?zhǔn)紺PI則可以反映類似但不同商品之間的替換,比如牛肉價(jià)格上漲造成消費(fèi)者對(duì)于豬肉的選擇。二是鏈?zhǔn)郊訖?quán)CPI的計(jì)算較為復(fù)雜,需要以當(dāng)期與上一期的消費(fèi)支出來確認(rèn)權(quán)重,因此公布存在滯后,但大數(shù)據(jù)時(shí)代可以快速獲取并處理大量數(shù)據(jù),這個(gè)問題在具有充足數(shù)據(jù)來源以及良好的數(shù)據(jù)處理技術(shù)時(shí)將不再成為困擾CPI計(jì)算的難題。
中國(guó)經(jīng)濟(jì)發(fā)展迅速,居民生活水平以及消費(fèi)結(jié)構(gòu)變化顯著,相對(duì)歐美國(guó)家而言CPI權(quán)重調(diào)整理應(yīng)更加頻繁。特別地,隨著恩格爾系數(shù)的下降,食品權(quán)重高估傾向越來越顯著,住房類、交通類、文化娛樂等消費(fèi)開支不斷提高。英國(guó)、荷蘭、瑞典等歐洲國(guó)家利用掃描數(shù)據(jù)實(shí)現(xiàn)CPI數(shù)據(jù)的電子化采集,并據(jù)此確定CPI的分類權(quán)重,為中國(guó)利用大數(shù)據(jù)設(shè)置CPI權(quán)重提供了思路,避免采用固定權(quán)重計(jì)算價(jià)格指數(shù)產(chǎn)生的誤差。通過掃描數(shù)據(jù)和非掃描數(shù)據(jù)的結(jié)合,可以獲得更為可靠的CPI分類權(quán)重,同時(shí)縮短調(diào)整權(quán)重的周期,以更準(zhǔn)確、及時(shí)地反映消費(fèi)者行為對(duì)物價(jià)的影響以及季節(jié)性因素等對(duì)CPI的影響。
關(guān)于CPI權(quán)重還有另外一個(gè)問題,現(xiàn)行價(jià)格采集方案尚未納入網(wǎng)絡(luò)銷售,未能有效利用各大電商交易過程中產(chǎn)生的海量數(shù)據(jù),可能降低價(jià)格調(diào)查的代表性。僅針對(duì)實(shí)體店采集價(jià)格信息,使CPI并非全口徑調(diào)查,其結(jié)果在一定程度上是有偏的。解決該問題的一個(gè)簡(jiǎn)易方法就是利用電商交易消費(fèi)品價(jià)格指數(shù),如阿里巴巴的iSPI指數(shù),對(duì)同期CPI進(jìn)行修正,并根據(jù)網(wǎng)購(gòu)占社會(huì)消費(fèi)品零售總額的比例分配計(jì)算權(quán)重,具體修正方式如下:
其中,SC表示實(shí)體店社會(huì)消費(fèi)品零售額占比,Si表示網(wǎng)絡(luò)社會(huì)消費(fèi)品零售總額占比,PC表示根據(jù)傳統(tǒng)實(shí)體店調(diào)查數(shù)據(jù)計(jì)算得到的CPI指數(shù),Pi表示iSPI指數(shù)。實(shí)踐中,這些數(shù)據(jù)基本都可以獲得,為修正工作提供了良好的基礎(chǔ)。在大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)部門應(yīng)加強(qiáng)與大型網(wǎng)絡(luò)公司、電商企業(yè)和大數(shù)據(jù)公司合作,利用其技術(shù)、數(shù)據(jù)優(yōu)勢(shì)編制網(wǎng)絡(luò)價(jià)格指數(shù),分配一定的權(quán)重,并與現(xiàn)行官方CPI統(tǒng)計(jì)體系結(jié)合,以得到能夠服務(wù)于各方面的優(yōu)質(zhì)價(jià)格指數(shù)。
國(guó)際上CPI季節(jié)調(diào)整技術(shù)主要有早期的移動(dòng)平均法、經(jīng)濟(jì)平滑法和季節(jié)調(diào)整X-11法。隨著計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,涌現(xiàn)了 X-11-ARIMA法、X-12-ARIMA法和Tramo Seats方法等。目前,國(guó)際通用的調(diào)整方法是X-12-ARIMA方法,由美國(guó)統(tǒng)計(jì)員David Findley在X-11-ARIMA 基礎(chǔ)上做改進(jìn)后提出,能夠根據(jù)新的交易日和節(jié)假日效應(yīng)做出調(diào)整。該方法只是根據(jù)美國(guó)節(jié)假日設(shè)計(jì)的季節(jié)調(diào)整模型,中國(guó)與美國(guó)的假日有所不同,不能直接針對(duì)中國(guó)的固定節(jié)假日(如國(guó)慶節(jié)和春節(jié)等)進(jìn)行調(diào)整。針對(duì)中國(guó)節(jié)日分布,可以對(duì)該方法進(jìn)行適當(dāng)修正,形成所謂改進(jìn)的 X-12-ARIMA-BHZ和 X-12-ARIMA-LZ方法。與此同時(shí),大數(shù)據(jù)條件下通過計(jì)算機(jī)信息技術(shù)每天都能獲得海量數(shù)據(jù),大量無缺失月度數(shù)據(jù)為實(shí)施改進(jìn)的 X-12-ARIMA-BHZ 或者 X-12-ARIMALZ方法進(jìn)行CPI季節(jié)調(diào)整奠定了基礎(chǔ)。
質(zhì)量調(diào)整是CPI統(tǒng)計(jì)的難點(diǎn)之一,中國(guó)編制的CPI尚未進(jìn)行質(zhì)量調(diào)整。CPI質(zhì)量調(diào)整方法眾多,包括加法調(diào)整、乘法調(diào)整、重疊法、總體均值或目標(biāo)均值虛擬、專家判斷、鏈接法和特征價(jià)格法等,其中特征價(jià)格法目前較為流行,即所謂的Hedonic方法[10]。Hedonic方法基本原理是:第一,產(chǎn)品質(zhì)量的變化引起價(jià)格的變化,商品可觀察到的顯性價(jià)格是其隱性特征的函數(shù);第二,質(zhì)量特征集的擴(kuò)大影響價(jià)格的主要特征。Hedonic方法通過經(jīng)濟(jì)計(jì)量模型將產(chǎn)品特征與價(jià)格加以量化,從而得出剔除質(zhì)量變化因素后的價(jià)格指數(shù),代表性公式為半對(duì)數(shù)模型:
其中Zti代表產(chǎn)品i在時(shí)期t價(jià)格的特征組合。依據(jù)上述公式,可以估計(jì)出各個(gè)特征k在t時(shí)期的影子價(jià)格βtk,然后可以利用其作為調(diào)整CPI質(zhì)量變化的依據(jù)。兩種主要的調(diào)整方法分別為:一是將影子價(jià)格作為選取替代商品的依據(jù)。傳統(tǒng)CPI計(jì)算方法選擇替換品時(shí)主要由人工根據(jù)經(jīng)驗(yàn)進(jìn)行判斷,通過計(jì)算影子價(jià)格可以確定何種特征決定產(chǎn)品價(jià)格。二是根據(jù)影子價(jià)格計(jì)算調(diào)整系數(shù),直接利用調(diào)整系數(shù)來計(jì)算CPI,其主要公式如下:
其中,QAt,t-1是i種商品在t期和t-1期的調(diào)整值;βt-1是特征k在t-1期的影子價(jià)格;Ztik是產(chǎn)品i特征k在t時(shí)期的平均值,而Ztik-1是相應(yīng)產(chǎn)品在t-1期的平均值,根據(jù)調(diào)整系數(shù)即可算出CPI變化中質(zhì)量變動(dòng)因素引起的部分。實(shí)踐中,采用Hedonic質(zhì)量調(diào)整方法必須獲得產(chǎn)品特征的全面信息,在傳統(tǒng)數(shù)據(jù)條件下往往難以實(shí)現(xiàn)。大數(shù)據(jù)為Hedonic方法的實(shí)施創(chuàng)造了條件,利用大數(shù)據(jù)的優(yōu)勢(shì),可以獲得銷售商品的特征信息,從而計(jì)算每個(gè)小類的質(zhì)量調(diào)整系數(shù),當(dāng)?shù)玫?62類商品的質(zhì)量調(diào)整系數(shù)之后,即可用于最終匯總CPI指標(biāo)。
現(xiàn)行CPI數(shù)據(jù)發(fā)布制度還存在不少問題,統(tǒng)計(jì)部門應(yīng)逐步轉(zhuǎn)變觀念,強(qiáng)化服務(wù)意識(shí),充分利用大數(shù)據(jù),不斷提高CPI數(shù)據(jù)發(fā)布的詳盡度和精細(xì)化程度,直至對(duì)262個(gè)基本項(xiàng)目的價(jià)格指數(shù)均可獲得。利用大數(shù)據(jù),統(tǒng)計(jì)部門能夠?qū)κ袌?chǎng)價(jià)格進(jìn)行實(shí)時(shí)跟蹤和匯總,提供及時(shí)的價(jià)格統(tǒng)計(jì)信息,通過規(guī)模以上零售機(jī)構(gòu)設(shè)立聯(lián)網(wǎng)直報(bào)機(jī)制,將交易商品價(jià)格及物量數(shù)據(jù)直接從業(yè)務(wù)系統(tǒng)中抓取,由統(tǒng)計(jì)部門迅速匯總、計(jì)算,完全可以大大縮短數(shù)據(jù)發(fā)布時(shí)間,甚至可以做到每周或每天都可以發(fā)布重要的價(jià)格指數(shù)。同時(shí),大數(shù)據(jù)為完善CPI分類指數(shù)的編制發(fā)布提供了基礎(chǔ),甚至使得基本類指數(shù)的連續(xù)發(fā)布成為可能。
正如英國(guó)大數(shù)據(jù)專家維克托·邁爾-舍恩伯格所指出,世界的本質(zhì)就是數(shù)據(jù),大數(shù)據(jù)將開啟一次重大的時(shí)代轉(zhuǎn)型,對(duì)數(shù)據(jù)統(tǒng)計(jì)界帶來前所未有的挑戰(zhàn)與機(jī)遇[11]10-12。當(dāng)前,網(wǎng)絡(luò)交易對(duì)消費(fèi)物價(jià)的影響日益顯著,零售終端采用電子化銷售設(shè)備的普及率也正在明顯上升。根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的《2013年中國(guó)網(wǎng)絡(luò)購(gòu)物市場(chǎng)研究報(bào)告》,2013年網(wǎng)絡(luò)購(gòu)物市場(chǎng)交易金額高達(dá)1.85萬億元,較2012年增長(zhǎng)40.9%,網(wǎng)絡(luò)零售市場(chǎng)交易總額占社會(huì)消費(fèi)品零售總額的7.9%。在這種背景下,針對(duì)銷售商品的信息呈海量式發(fā)展,大數(shù)據(jù)的格局日漸成形,對(duì)CPI統(tǒng)計(jì)的影響日益明顯。從實(shí)踐上看,大數(shù)據(jù)的應(yīng)用必將對(duì)改進(jìn)中國(guó)CPI數(shù)據(jù)質(zhì)量提供有力支持,對(duì)此,提出如下幾點(diǎn)政策建議:
一是要積極拓展CPI統(tǒng)計(jì)數(shù)據(jù)的來源,提高CPI數(shù)據(jù)的可靠性。通過與大型超市、電子商務(wù)平臺(tái)的合作和數(shù)據(jù)共享,擴(kuò)大CPI統(tǒng)計(jì)的樣本范圍,以更準(zhǔn)確地反映真實(shí)的居民消費(fèi)物價(jià)變動(dòng)趨勢(shì)。
二是要大力加強(qiáng)對(duì)大數(shù)據(jù)的開發(fā)研究,不斷發(fā)展CPI統(tǒng)計(jì)方法。大數(shù)據(jù)時(shí)代,改進(jìn)CPI計(jì)算公式和權(quán)重選取方法,積極探索CPI季節(jié)性因素與質(zhì)量調(diào)整方法,提高CPI數(shù)據(jù)質(zhì)量。積極發(fā)展大數(shù)據(jù)技術(shù)和云計(jì)算處理平臺(tái),確保統(tǒng)計(jì)部門能夠真正通過技術(shù)處理從海量數(shù)據(jù)中得到計(jì)算CPI的相應(yīng)數(shù)據(jù),增加CPI的科學(xué)性和客觀性。
三是要努力改進(jìn)CPI統(tǒng)計(jì)的及時(shí)性與頻率,改進(jìn)數(shù)據(jù)發(fā)布制度。增進(jìn)CPI計(jì)算的客觀性和透明性,公開CPI計(jì)算的基本方法和相應(yīng)產(chǎn)品權(quán)重的調(diào)整過程,使公眾減少對(duì)于CPI統(tǒng)計(jì)的相應(yīng)質(zhì)疑,更好地服務(wù)于各類主體的決策。
[1] 馬建堂.大數(shù)據(jù)在政府統(tǒng)計(jì)中的探索與應(yīng)用[M].北京:中國(guó)統(tǒng)計(jì)出版社,2013.
[2] J David Richardson.Scanner Index for the Consumer Price Index[J].University of Chicago Press,2003(1).
[3] 陳相成,喬晗.掃描數(shù)據(jù)支持下CPI編制方法的研究[J].統(tǒng)計(jì)研究,2013(1).
[4] 喬晗.“大數(shù)據(jù)”背景下利用掃描數(shù)據(jù)編制中國(guó)CPI問題研究[J].統(tǒng)計(jì)與信息論壇,2014(2).
[5] 李世超.利用大數(shù)據(jù)改革CPI調(diào)查方法初探[N].中國(guó)信息報(bào),2013-12-17(7).
[6] 鄭京平,王全眾.官方統(tǒng)計(jì)應(yīng)如何面對(duì)Big Data的挑戰(zhàn) [J].統(tǒng)計(jì)研究,2012(12).
[7] ILO,IMF,OECD,Eurostat,United Nations,World Bank.Consumer Price Index Manual:Theory and Practice[M].Geneva:International Labour Organization,2004.
[8] 賀鳳羊,劉建平.如何對(duì)中國(guó)CPI進(jìn)行季節(jié)調(diào)整——基于X-12-ARIMA方法的改進(jìn)[J].?dāng)?shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2011(5).
[9] 高艷云.質(zhì)量調(diào)整的價(jià)格指數(shù)編制中Hedonic插補(bǔ)法的應(yīng)用[J].?dāng)?shù)理統(tǒng)計(jì)與管理,2010(11).
[10]徐強(qiáng).價(jià)格指數(shù)編制中的Hedonic質(zhì)量調(diào)整方法研究[J].財(cái)經(jīng)問題研究,2009(8).
[11]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2012.