胡江
(徐州工程學(xué)院數(shù)學(xué)與物理科學(xué)學(xué)院,江蘇 徐州 221008)
基于距離檢驗(yàn)的江蘇省城市商品房?jī)r(jià)格回歸模型分析
胡江
(徐州工程學(xué)院數(shù)學(xué)與物理科學(xué)學(xué)院,江蘇 徐州 221008)
隨著我國(guó)經(jīng)濟(jì)的不斷發(fā)展,我國(guó)城市商品房的建設(shè)的腳步也不斷加快,商品房?jī)r(jià)格也幾經(jīng)起伏,因此,房?jī)r(jià)也成了現(xiàn)如今人們關(guān)注的焦點(diǎn)。江蘇作為經(jīng)濟(jì)大省,其商品房?jī)r(jià)格有著更突出的代表性。本文通過(guò)2002年到2013年的江蘇省城市商品房銷售面積、江蘇省人均GDP、城市居民消費(fèi)價(jià)格指數(shù)這三個(gè)主要因素對(duì)江蘇省城市商品房平均銷售價(jià)格變動(dòng)的影響來(lái)分析研究江蘇省城市商品房的價(jià)格模型。我們運(yùn)用線性回歸模型和非線性回歸模型對(duì)相關(guān)數(shù)據(jù)進(jìn)行實(shí)際模擬,再運(yùn)用擬合效果可視化,并運(yùn)用了Pena距離和Cook距離這兩種距離分析法來(lái)判斷模型的擬合效果,然后將這兩個(gè)模型進(jìn)行比較,最后得出了非線性模型對(duì)于該數(shù)據(jù)的擬合效果較為理想。
城市商品房;回歸分析;商品房?jī)r(jià)格指數(shù);異常值檢驗(yàn);距離判別
在以往的回歸分析中,通常采用的是顯著性檢驗(yàn)、擬合效果圖等來(lái)檢驗(yàn)?zāi)P偷挠行裕疚脑谝陨戏椒ǖ幕A(chǔ)上更進(jìn)一步地引進(jìn)了Pena距離和Cook距離這兩種距離檢驗(yàn)。通過(guò)這兩種距離的定量計(jì)算,我們不但可以判斷出離群點(diǎn),還可以判斷是否為強(qiáng)影響點(diǎn),從而在檢驗(yàn)?zāi)P偷臄M合性上得到了更好的效果。
對(duì)商品房?jī)r(jià)格影響的因素很多,根據(jù)主成分分析,我們只選取了三個(gè)重要指標(biāo):商品房銷售面積:X1,人均GDP:X2,城市居民消費(fèi)價(jià)格指數(shù):X3。
對(duì)2002年到2013年江蘇省城市商品房?jī)r(jià)格的相關(guān)數(shù)據(jù)整理如表1。其中商品房本年銷售價(jià)格:Y。
(一)商品房?jī)r(jià)格預(yù)測(cè)分析的線性回歸模型假設(shè)
因?yàn)閷?duì)因變量的影響因素超過(guò)了一個(gè),要確定它們之間的關(guān)系十分困難,所以借由已有的關(guān)于城市商品價(jià)格的研究分析,我們假定因變量商品房銷售價(jià)格和商品房銷售面積、人均GDP和城市居民消費(fèi)價(jià)格指數(shù)這三個(gè)變量滿足線性回歸模型:
上式中因變量是yi,自變量是為隨機(jī)誤差。
1.回歸分析檢驗(yàn)
利用R軟件對(duì)樣本數(shù)據(jù)進(jìn)行回歸分析,從輸出的結(jié)果我們可以建立回歸方程:y=-3845+0.11x1+0.08x2+ 4.74x3,并得出變量x1,x2,x3的t統(tǒng)計(jì)量的估計(jì)值分別是1.794、7.319、1.058。從解釋變量的方面來(lái)判斷顯著性:從對(duì)應(yīng)的P值我們可以看出,解釋變量在顯著性水平0.05下很明顯不為0,通過(guò)顯著性檢驗(yàn)。我們進(jìn)一步看出剩余方差估計(jì)值σ^2=280.22,從方程擬合度方面來(lái)觀察:根據(jù)擬合優(yōu)度和修正的擬合優(yōu)度,尤其是修正的擬合優(yōu)度= 0.9752,可以看出方程擬合程度比較理想。對(duì)方程進(jìn)行顯著性檢驗(yàn),其F統(tǒng)計(jì)量的P值0.0000002589遠(yuǎn)遠(yuǎn)小于0.05,從顯著性水平看出線性模型擬合的效果比較理想。但進(jìn)一步地運(yùn)用R軟件將樣本數(shù)據(jù)進(jìn)行圖形展示,發(fā)現(xiàn)有三處突兀點(diǎn),得出的擬合效果圖并不理想。
2.Pena距離及Cook距離的分析檢驗(yàn)
為了進(jìn)一步確定模型的擬合效果,我們引入Pena距離和Cook距離這兩個(gè)檢驗(yàn)異常點(diǎn)的統(tǒng)計(jì)量。我們根據(jù)已有的線性回歸模型的Pena距離的計(jì)算公式對(duì)各個(gè)點(diǎn)Pena距離進(jìn)行詳細(xì)計(jì)算。計(jì)算出各點(diǎn)的Pena距離如下表2。運(yùn)用R軟件計(jì)算出個(gè)點(diǎn)的Cook距離如下表3所示。
經(jīng)過(guò)以上的研究分析,我們可以看出該模型的擬合具有三個(gè)明顯的異常值點(diǎn),占樣本比重25%,擬合效果并不太理想。這三個(gè)異常點(diǎn)分別代表的2008年、2011年、2013年的樣本數(shù)據(jù)。我們查詢資料可以發(fā)現(xiàn):2008年中國(guó)人口結(jié)構(gòu)出現(xiàn)拐點(diǎn),國(guó)際經(jīng)濟(jì)危機(jī)出現(xiàn)。2011年房產(chǎn)企業(yè)品牌化使得房產(chǎn)業(yè)績(jī)?cè)鲩L(zhǎng),市場(chǎng)份額提高。行業(yè)集中度進(jìn)一步提高,土地出讓總量提高。2013年政府加快推進(jìn)商品房市場(chǎng)化的進(jìn)程,相關(guān)部門對(duì)房地產(chǎn)的關(guān)注持續(xù)加強(qiáng),政府房地產(chǎn)市場(chǎng)調(diào)控力度加大。這些因素嚴(yán)重影響了房?jī)r(jià)的三個(gè)因素,進(jìn)而影響了房?jī)r(jià)。
由以上實(shí)際與理論相結(jié)合的分析,我們可以看出線性模型的擬合不是十分理想,以往的線性回歸檢驗(yàn)效果不明顯。我們?cè)龠M(jìn)一步地進(jìn)行模型假設(shè),從而尋找更加適合的模型來(lái)預(yù)測(cè)商品房?jī)r(jià)格。
(二)商品房?jī)r(jià)格預(yù)測(cè)分析的非線性模型假設(shè)
我們假定所列出的影響江蘇省城市商品房?jī)r(jià)格的相關(guān)因素的數(shù)據(jù)滿足非線性回歸模型,那么它可以表達(dá)成
1.回歸分析檢驗(yàn)
將樣本數(shù)據(jù)導(dǎo)入R軟件。根據(jù)假設(shè)我們運(yùn)用R軟件對(duì)樣本數(shù)據(jù)進(jìn)行回歸分析。并對(duì)運(yùn)行結(jié)果按照解釋變量、擬合優(yōu)度和方程整體優(yōu)度三個(gè)方面進(jìn)行詳細(xì)的研究判斷,從而確定非線性模型的表達(dá)式。根據(jù)輸出結(jié)果,我們可以建立如下的回歸模型:
表2 線性模型下各點(diǎn)的Pena距離
表3 線性模型下各點(diǎn)的Cook距離
2.Pena距離及Cook距離的分析檢驗(yàn)
為了能夠更加準(zhǔn)確地判斷該模型的擬合效果,我們進(jìn)一步計(jì)算Pena距離和Cook距離這兩個(gè)檢驗(yàn)異常點(diǎn)的統(tǒng)計(jì)量。根據(jù)已有的非線性模型下的Pena距離的公式,我們計(jì)算出各點(diǎn)的Pena距離如下表4。
表4 非線性回歸模型下的Pena距離
用R軟件根據(jù)上述非線性回歸模型計(jì)算出各點(diǎn)的Cook距離如下表5。
表5 非線性回歸模型下的Cook距離
從上面表3-12的Pena距離的結(jié)果中,我們可以很明顯地看出第12號(hào)點(diǎn)數(shù)值存在明顯異常。然而從表3-13中我們很難明顯發(fā)現(xiàn)異常值,經(jīng)過(guò)認(rèn)真比較后我們發(fā)現(xiàn),12號(hào)點(diǎn)是高杠桿異常點(diǎn),而對(duì)于高杠桿異常點(diǎn)Pena距離比Cook距離檢驗(yàn)效果更好,符合理論結(jié)果。因此,我們斷定12號(hào)點(diǎn)是異常點(diǎn),但我們從Pena距離值看出,它對(duì)模型的偏離程度并不大,屬于弱異常點(diǎn)。
由以上分析我們發(fā)現(xiàn):在線性模型的回歸分析中,各分析成分大都與模型吻合;但從擬合效果圖來(lái)看,有3處突兀較顯著;進(jìn)一步運(yùn)用Pena和Cook距離進(jìn)行量化判斷,則出現(xiàn)了三個(gè)點(diǎn)嚴(yán)重脫離模型曲線,占整體數(shù)據(jù)的25%,擬合效果大打折扣。
從非線性回歸模型的回歸分析出的結(jié)果,可以看出模型中各個(gè)相關(guān)指標(biāo)都十分正常,擬合的效果圖也大體符合模型規(guī)律,運(yùn)用Pena距離和Cook距離對(duì)該模型就行異常值量化檢驗(yàn)。結(jié)果發(fā)現(xiàn),只有第12號(hào)點(diǎn)存在些許異常,偏差也并不太明顯,模型與數(shù)據(jù)點(diǎn)基本都吻合。因此,我們認(rèn)為商品房?jī)r(jià)格預(yù)測(cè)的模型如下:
這一模型能夠更為準(zhǔn)確地描述商品房?jī)r(jià)格走向。
[1]韋博成,林金官,解鋒昌.統(tǒng)計(jì)診斷[M].北京:高等教育出版社,2009.
[2]胡江.基于Pena距離的幾種回歸模型的影響分析[D].東南大學(xué),2012.
[3]王新洲.非線性模型參數(shù)估計(jì)理論與應(yīng)用[M].武漢:武漢大學(xué)出版社,2002.
G718.5
A
1673-0046(2016)7-0010-02