顧沈靖
(江蘇聯(lián)合職業(yè)技術(shù)學(xué)院 南京分院,南京 210019)
改革開放以來,中國房地產(chǎn)業(yè)得到前所未有的發(fā)展.房地產(chǎn)與我們的生活息息相關(guān),而指標(biāo)是社會經(jīng)濟現(xiàn)象在數(shù)量方面的反映,是生產(chǎn)力水平發(fā)展的標(biāo)志.因此,在房地產(chǎn)成為熱門話題的同時,各界人士和學(xué)者也對于房地產(chǎn)行業(yè)的指標(biāo)從不同的研究角度進行了分析.
1996年國家在全國房地產(chǎn)業(yè)統(tǒng)計工作發(fā)展規(guī)劃中首次正式提出建立房地產(chǎn)業(yè)指標(biāo)體系的設(shè)想[1].2001年9月我國開始應(yīng)用“房地產(chǎn)統(tǒng)計指標(biāo)體系研究”成果.隨后,各界學(xué)者更是投入其中,進一步完善房地產(chǎn)指標(biāo)體系的完整性.例如,楊文武撰寫了中國房地產(chǎn)業(yè)指標(biāo)體系建立的多元分析與市政研究[2],王鋒,盧立明等學(xué)者共同研究了關(guān)于構(gòu)筑中國房地產(chǎn)統(tǒng)計指標(biāo)體系的內(nèi)容[3].
隨著中國房地產(chǎn)指標(biāo)的逐步完善,學(xué)者們開始嘗試使用不同的方法來處理分析相關(guān)數(shù)據(jù).統(tǒng)計的思想開始被引入房地產(chǎn)行業(yè)的分析中.李秋紅,李振紅等學(xué)者使用了典型相關(guān)分析的方法來對房地產(chǎn)數(shù)據(jù)進行處理[4],胡潔,潘林采取了基于主成分分析的方法研究房地產(chǎn)行業(yè),分析得出了房地產(chǎn)的強烈地域性[5].本文在已有文獻的基礎(chǔ)上,利用多元回歸的統(tǒng)計方法對房地產(chǎn)指標(biāo)進行數(shù)據(jù)處理分析,來研究房地產(chǎn)的價格影響因素,并就現(xiàn)實背景及分析結(jié)果提出一些有用的建議.希望這些結(jié)果與建議能夠讓我們更加了解現(xiàn)如今的房地產(chǎn)市場,更重要的是能夠保證房地產(chǎn)市場能夠穩(wěn)定健康地發(fā)展.
定義1 如對任何正整數(shù)k(t1 定義2 如果時間序列{xt}存在有窮的二階矩,滿足下面等式: (1)μt=Ext=μ,對于任何t, (2)rs,t=Cov(xt,xs)=E(xt-μ)(xs-μ)=γt-s,記t-s=j,則γt-s=γj 其中γt-s為只與t-s有關(guān)的一元函數(shù).則稱時間序列是弱平穩(wěn)的或?qū)捚椒€(wěn)的.隱含條件:Var(xt)=γt,t=γs,s=Var(xs)即方差不變. 定義3 對于寬平穩(wěn)的時間序列,它的自協(xié)方差函數(shù)和自相關(guān)函數(shù)(ACF)為: (1)自協(xié)方差函數(shù)γj=Cov(xt,xt-j)=E(xt-μ)(xt-j-μ),(Ext=μ) 易見,ρ0=1,γj=γ-j,ρj=ρ-j,?j∈z. 首先,檢驗此時間序列是否為平穩(wěn)時間序列,若不是,則需要通過一些變換將其轉(zhuǎn)換為平穩(wěn)的時間序列,再進行基本的模型識別.[7] 多元線性回歸模型一般形式[8]:對于有k-1個解釋變量的多元線性回歸模型 Yi=β1+β2X2i+β3X3i+…+βkXki+ui(i=1,2,…,n) 注:模型中的βj(j=1,2,…,k)是偏回歸系數(shù),樣本容量為n,偏回歸系數(shù):控制其它解釋變量不變化的前提下,第j個解釋變量的單位變動對被解釋變量平均值的影響,即對Y平均值“直接”或“凈”的影響.多元線性回歸模型中的“線性”是指:對各個回歸系數(shù)而言是“線性”的,對變量則可以線性也可以非線性. 多元總體回歸函數(shù)的條件期望表現(xiàn)形式[9]: 將Y的總體條件期望表示為多個解釋變量的函數(shù),如: E(Yi|X2i,X3i,…,Xki)=β1+β2X2i+β3X3i+…+βkXki(i=1,2,…,n) 注:這時Y總體條件期望的軌跡是K維空間的一條線,對于多元樣本回歸函數(shù),Y的樣本條件均值可以表示為多個解釋變量的函數(shù).多個解釋變量的表現(xiàn)形式是 對時間序列數(shù)據(jù)建模步驟[10]:第一步,模型識別.根據(jù)系統(tǒng)的相關(guān)性質(zhì),以及所提供的時序數(shù)據(jù)的概貌,提出一個合適的類型模型以及模型的定階等.第二步,參數(shù)估計.就是根據(jù)實際的觀測數(shù)據(jù)估計該數(shù)學(xué)模型所包含各項參數(shù)的數(shù)值.第三步,診斷檢驗.包括所建模型的適應(yīng)性檢驗等.第四步,模型應(yīng)用.預(yù)測. 本文選用的數(shù)據(jù)來自中華人民共和國國家統(tǒng)計局統(tǒng)計年鑒,以下各個變量代表指標(biāo)如下: X1t:房屋施工面積(萬平方米)X2t:房屋竣工面積(萬平方米) X3t:房屋竣工價值(億元)X4t:房屋竣工造價(萬/平方米) X5t:房屋銷售面積(萬平方米)X6t:本年完成投資(億元) Yt:房屋銷售凈額(億元) 其中,房屋竣工價值是指在報告期內(nèi)竣工房屋本身的建造價值.本年完成投資是指房地產(chǎn)開發(fā)企業(yè)(單位)開發(fā)建設(shè)的供出售、出租用的商品住宅、廠房、倉庫、飯店、度假村、寫字樓、辦公樓等房屋工程及其配套的服務(wù)設(shè)施所完成的投資額(含拆遷、回遷還建用房). 3.2.1 多重共線性檢驗 多重共線性檢驗[11]指的是線性回歸模型中,解釋變量之間存在精確的相關(guān)關(guān)系或高度相關(guān)關(guān)系,而使模型估計失真或難以估計. 回歸模型牽涉到多個自變量的時候,自變量之間可能會相互關(guān)聯(lián),即他們之間存在有多重共線性.我們目的是建立回歸模型,需要對數(shù)據(jù)進行初步的判斷,選擇有意義的解釋變量,再建立回歸模型,不可以直接建立回歸模型.所以先用Eviews軟件檢驗各個自變量之間是否存在的多重共線性.如果存在多重共線性,還需要對多重共線性進行修正.[12] 造成多重共線性的原因有以下幾種:解釋變量都享有共同的時間趨勢;一個解釋變量是另一個的滯后,二者往往遵循一個趨勢;由于數(shù)據(jù)收集的基礎(chǔ)不夠?qū)挘承┙忉屪兞靠赡軙黄鹱儎?;某些解釋變量間存在某種近似的線性關(guān)系. 處理多重共線性的原則:多重共線性是普遍存在的,輕微的多重共線性問題可不采取措施;嚴(yán)重的多重共線性問題,一般可根據(jù)經(jīng)驗或通過分析回歸結(jié)果發(fā)現(xiàn),如影響系數(shù)符號等,要根據(jù)不同情況采取必要措施. 解決方法:增加數(shù)據(jù);對模型施加某些約束條件;刪除一個或幾個共線性變量;將模型適當(dāng)變形;主成分回歸. 以選取的數(shù)據(jù)為研究對象,先對數(shù)據(jù)進行多重共線性檢驗,剔除相關(guān)性. 利用計量型經(jīng)濟學(xué)軟件Eviews進行操作,輸出結(jié)果發(fā)現(xiàn),可以直接剔除變量X4t,可以得到響應(yīng)變量Yt與各個解釋變量X1t,X2t,X3t,X5t,X6t之間的線性關(guān)系. Yt=5 786.268-0.385 806X1t-0.201 453X2t+1.996 905X3t+0.519 008X5t+2.688 844X6t+et 我們不僅僅需要從理論上剔除X4t,還需要對剔除X4t的現(xiàn)實意義進行解釋.X4t是房屋竣工造價,房屋竣工造價是指不同結(jié)構(gòu)、不同高度的初裝修房屋結(jié)算的平均每平方建筑面積的造價.我們不能說房屋竣工造價對房屋銷售凈額沒有影響,而是應(yīng)該說房屋竣工造價和其他解釋變量X1t,X2t,X3t,X5t,X6t之間存在多重共線性關(guān)系,因而房屋竣工造價與房屋銷售凈額之間的關(guān)系可以由其他的解釋變量代替. 通過以上的分析,確定本文數(shù)據(jù)存在多重共線性.這里我們選擇刪除一個或幾個共線性變量的方法.由于數(shù)據(jù)的來源是國家統(tǒng)計局的統(tǒng)計年鑒,選擇了最多年份的數(shù)據(jù),沒有更多的來源了,因而沒法用增加數(shù)據(jù)來處理多重共線性. 3.2.2 平穩(wěn)性檢驗 ADF檢驗(單位根檢驗)指檢驗序列中是否存在單位根,因為存在單位根就是非平穩(wěn)時間序列了. 我們的目的是對選擇的解釋變量進行回歸分析,以上已經(jīng)進行了多重共線性檢驗,如果數(shù)據(jù)是平穩(wěn)的,就可以直接進行回歸分析,因而這里要確定數(shù)據(jù)是否平穩(wěn),這里選擇ADF檢驗來驗證數(shù)據(jù)是否平穩(wěn). 首先對各個變量原始序列進行平穩(wěn)性檢驗.若原始序列不平穩(wěn),則需要對其一階差分或者二階差分進行平穩(wěn)性檢驗. 先對被解釋變量的原始序列進行平穩(wěn)性檢驗,根據(jù)Eviews操作,經(jīng)ADF檢驗式計算得到平穩(wěn)性檢驗結(jié)果如表1所示. 表1 平穩(wěn)性檢驗結(jié)果 由表1可知,將Yt的原始序列及一階差分序列進行平穩(wěn)性檢驗,并匯總出結(jié)果.結(jié)果顯示,ADF=2.817 113,大于該檢驗水平下的臨界值2.739 965,所以序列Yt是個非平穩(wěn)序列.在此情形下,應(yīng)該對Yt的一階差分序列進行ADF檢驗. 同樣,由匯總結(jié)果得到,對于響應(yīng)變量的一階差分序列,ADF=-2.560 2,小于該檢驗水平下的臨界值-1.859 680,P值為0.015 6,滿足0.05置信水平的條件,所以房屋銷售凈額Yt的一階差分序列是平穩(wěn)序列. 當(dāng)然,我們知道ADF檢驗是為了檢驗變量的平穩(wěn)性.如果解釋變量和被解釋變量存在同階平穩(wěn)的話,則可以選擇對數(shù)據(jù)進行協(xié)整檢驗.在本文中,對我們選擇的各個解釋變量X1t,X2t,X3t,X5t,X6t也進行ADF檢驗,檢驗各個解釋變量的平穩(wěn)性.發(fā)現(xiàn)它們與響應(yīng)變量并不是同階平穩(wěn)的,不存在相應(yīng)的協(xié)整關(guān)系,因此不要進行協(xié)整檢驗. 3.2.3 回歸分析 回歸分析,研究的是總體中解釋變量與被解釋變量之間客觀存在的相互聯(lián)系的規(guī)律.我們的目的是對數(shù)據(jù)進行回歸模型的建立與處理,因而在做完ADF檢驗的前提下,我們繼續(xù)做回歸分析. 利用計量型經(jīng)濟學(xué)軟件Eviews進行操作,可以得到回歸分析的模型: Yt=5 727.569-0.378 036X1t-0.210 989X2t+2.023 562X3t+0.517 531X5t+2.634 576X6t+et 從輸出結(jié)果可以看出,各個變量的P值都在0.05置信度水平之內(nèi),而可決系數(shù)R2為0.999 717,可以確定該回歸擬合效果比較好. 上面對變量進行了ADF檢驗.可知ADF單位根檢驗是為了檢驗序列中是否存在單位根,因為存在單位根就是非平穩(wěn)時間序列了.單位根就是指單位根過程,可以證明,序列中存在單位根過程就會不平穩(wěn).如果一組非平穩(wěn)時間序列之間不存在協(xié)整關(guān)系,則這一組變量構(gòu)造的回歸模型就有可能出現(xiàn)偽回歸.簡而言之,利用非平穩(wěn)時間序列直接建模容易產(chǎn)生偽回歸.由于原數(shù)據(jù)是非平穩(wěn)的,因而構(gòu)造出來的模型存在偽回歸,下一步考慮是否可以進行誤差修正模型. 誤差修正模型指的是,對于非平穩(wěn)時間序列,可以通過差分的方法將其轉(zhuǎn)化為平穩(wěn)時間序列,然后才可以建立經(jīng)典的回歸分析模型.而建立誤差修正模型的前提是進行殘差序列et的平穩(wěn)性檢驗. 3.2.4 殘差平穩(wěn)性檢驗 利用計量型經(jīng)濟學(xué)軟件Eviews進行操作,計算得P值為0.028 1,在0.05的置信度水平下,結(jié)果是顯著的.也就是說,回歸模型的殘差序列et不含有單位根,殘差是平穩(wěn)的,因而可以繼續(xù)建立誤差修正模型. 3.2.5 誤差修正模型 上面進行了殘差平穩(wěn)性檢驗,確定了殘差是平穩(wěn)的.要建立誤差修正模型,首先要通過之前的回歸,計算出誤差項et.然后以誤差項et為參數(shù),繼續(xù)做回歸,就可以得到相應(yīng)的方程. 選擇模型Yt=β0+β1X1t+β2X2t+β3X3t+β5X5t+β6X6t+et,當(dāng)然由于多重共線性已經(jīng)剔除了X4t,便不在考慮范圍之內(nèi).對模型移項變換之后,可以得到: et=Yt-β0-β1X1t-β2X2t-β3X3t-β5X5t-β6X6t 用回歸分析中得到的各個變量的系數(shù)β0,β1,β2,β3,β5,β6,在Excel表格中進行操作變換,得出殘差序列et的數(shù)值,輸入到Eviews中,進行誤差修正模型.[13] 利用計量型經(jīng)濟學(xué)軟件Eviews進行操作求得,可決系數(shù)R2為0.944 250,在0.8以上,擬合效果比較好.也可以得到,模型常數(shù)和殘差的P值分別為0.009 0與0.045 1,在0.05的置信度水平下,結(jié)果是顯著的,所以誤差修正模型選擇合理. 最終得到誤差修正模型的估計結(jié)果:ΔYt=5 128.636+3.140 958et-1. 將ΔYt=Yt-Yt-1帶入其中,整理可以得到被解釋變量Yt與選擇的各個解釋變量X1t,X2t,X3t,X5t,X6t之間的回歸模型: Yt= 128 61.41767+4.140 958Yt-1-1.187 395X1t+0.662 708X2t+6.355 923X3t+ 1.625 543X5t+8.275 093X6t 誤差修正模型的經(jīng)濟意義的解釋[14]: 在本文研究的房地產(chǎn)價格的眾多影響因素中,房屋銷售凈額取決于房屋施工面積、房屋竣工面積、房屋竣工價值、銷售面積、本年完成投資.其中,房屋銷售凈額與房屋竣工面積、房屋竣工價值、房屋銷售面積、本年完成投資成正相關(guān),而與房屋施工面積成負相關(guān). 房屋竣工價值是指在報告期內(nèi)竣工房屋本身的建造價值.竣工房屋價值按房屋設(shè)計和預(yù)算規(guī)定的內(nèi)容計算.包括竣工房屋本身的基礎(chǔ)、結(jié)構(gòu)、屋面、裝修以及水、電、暖、衛(wèi)等附屬工程的建造價值,也包括作為房屋建筑組成部分而列入房屋建筑工程預(yù)算內(nèi)的設(shè)備(如電梯、通風(fēng)設(shè)備等)的購置和安裝費用.因而房屋竣工價值對房屋銷售凈額成正相關(guān)是有現(xiàn)實意義的. 房屋銷售越多,房屋銷售面積越大,房屋銷售凈額也會隨之增大.房屋銷售面積與房屋銷售凈額成正相關(guān).本年完成投資是指房地產(chǎn)開發(fā)企業(yè)(單位)開發(fā)建設(shè)的供出售、出租用的商品住宅、廠房、倉庫、飯店、度假村、寫字樓、辦公樓等房屋工程及其配套的服務(wù)設(shè)施所完成的投資額(含拆遷、回遷還建用房).本年完成的投資額越高,相應(yīng)的房地產(chǎn)行業(yè)的銷售凈額也會比較高.所以說本年完成投資與房地產(chǎn)銷售凈額成正相關(guān). 同時,房屋凈銷售額還取決于上一期房屋銷售凈額對均衡水平的偏離,誤差項et-1估計的系數(shù)3.14 095 8體現(xiàn)了對偏離的修正,上一期偏離越遠,本期修正的量就越大.也就是說,上年的銷售情況同時也無形之中影響著下一年房屋的銷售. 對房地產(chǎn)相關(guān)變量進行統(tǒng)計分析,運用多元回歸分析方法,發(fā)現(xiàn)房屋銷售凈額受諸多因素的影響,而不單純是某一個因素的作用.房屋銷售凈額與房屋竣工面積、房屋竣工價值、房屋銷售面積、本年完成投資成正相關(guān),而與房屋施工面積成負相關(guān).2.2 多元回歸理論建模
3 數(shù)據(jù)分析
3.1 數(shù)據(jù)來源及說明
3.2 建模分析
4 結(jié)語