李 建,莊 健
(安徽工業(yè)大學(xué) 商學(xué)院,安徽 馬鞍山243002)
進(jìn)入21世紀(jì)以來(lái),全國(guó)大部分地區(qū)的房?jī)r(jià)一直呈上升趨勢(shì),其中大中型城市的房?jī)r(jià)上漲趨勢(shì)尤為明顯。政府一直強(qiáng)調(diào)和重視房?jī)r(jià)穩(wěn)定,為此出臺(tái)多項(xiàng)穩(wěn)定房地產(chǎn)市場(chǎng)的政策和措施。要科學(xué)調(diào)控房地產(chǎn)市場(chǎng),穩(wěn)定房地產(chǎn)價(jià)格,最為基礎(chǔ)是要找出房地產(chǎn)價(jià)格變化規(guī)律,加強(qiáng)對(duì)房地產(chǎn)價(jià)格的預(yù)測(cè)。
學(xué)術(shù)界從來(lái)就沒有停止對(duì)房地產(chǎn)價(jià)格規(guī)律的認(rèn)識(shí),許多學(xué)者一直在尋求有效預(yù)測(cè)房地產(chǎn)價(jià)格指數(shù)的方法。房?jī)r(jià)指數(shù)的時(shí)間序列預(yù)測(cè)始于Case和Shiller,他們對(duì)美國(guó)大都會(huì)地區(qū)的房?jī)r(jià)指數(shù)做了預(yù)測(cè),證明了房?jī)r(jià)指數(shù)是可測(cè)的。[1]Muellbauer和 Murphy考察了英國(guó)房?jī)r(jià)的變化,發(fā)現(xiàn)房?jī)r(jià)與天氣、家庭收入和地區(qū)有相互關(guān)聯(lián)的作用,[2]在Ortalo-Magne和Rady開發(fā)的模型中引入了房產(chǎn)制度,從而使模型具有復(fù)雜的非線性動(dòng)態(tài)行為。[3]G.W.Crawford和 M.C.Fratanton嘗試用ARIMA模型、GARCH模型和regime-switch模型對(duì)美國(guó)的五個(gè)地區(qū)的92個(gè)季度房?jī)r(jià)指數(shù)增長(zhǎng)率進(jìn)行了建模和預(yù)測(cè)實(shí)驗(yàn)。結(jié)果發(fā)現(xiàn),在擬合方面,regime-switch模型精度略高,但在預(yù)測(cè)時(shí),簡(jiǎn)單的ARIMA模型更為精確。[4]
我國(guó)房?jī)r(jià)和房?jī)r(jià)指數(shù)時(shí)間序列的預(yù)測(cè)在預(yù)測(cè)模型上呈現(xiàn)多樣性,這里列舉具有代表性的文獻(xiàn)。王婧和田澎用小波神經(jīng)網(wǎng)絡(luò)對(duì)上海的中房住宅指數(shù)的月度數(shù)據(jù)進(jìn)行了預(yù)測(cè)。[5]楊楠和邢力聰用灰色馬爾科夫模型對(duì)中房上海住宅指數(shù)做了預(yù)測(cè)。[6]談萍和史占中基于灰色馬爾科夫模型對(duì)上海房?jī)r(jià)走勢(shì)作了實(shí)證研究。[7]WangY.S.等開發(fā)了一個(gè)將統(tǒng)計(jì)方法,數(shù)據(jù)挖掘和人工智能結(jié)合在一起的集成預(yù)測(cè)方法,[8]閆妍等應(yīng)用這個(gè)算法,對(duì)1998年一季度到2006年三季度的商品房銷售價(jià)格指數(shù)進(jìn)行了短期預(yù)測(cè)。[9]黃鸝用GARCH家族的模型對(duì)商品房銷售價(jià)格指數(shù)做了預(yù)測(cè)分析。[10]陸金鑄和陳紅麗用Kalman濾波和AHP法對(duì)武漢的房?jī)r(jià)進(jìn)行了預(yù)測(cè)。[11]王倩、王瑩、邱繼勤等基于灰色 GM(1,1)和BP神經(jīng)網(wǎng)絡(luò)對(duì)我國(guó)的平均房?jī)r(jià)作了預(yù)測(cè)。[12]縱觀這些文獻(xiàn),可以發(fā)現(xiàn)兩個(gè)特點(diǎn)。一個(gè)是,只采用一個(gè)模型,并且這個(gè)模型是事先預(yù)設(shè)的,因此不能確認(rèn)所采用的模型是否是最佳模型,是否具有普遍性;另一個(gè)是,只就一個(gè)地區(qū)的房?jī)r(jià)指數(shù)和房?jī)r(jià)進(jìn)行預(yù)測(cè),而且這個(gè)地區(qū)也是隨意選擇的,或就全國(guó)平均房?jī)r(jià)和房?jī)r(jià)指數(shù)作預(yù)測(cè),也不能判斷得到的預(yù)測(cè)精度是否也具有普遍意義,因而缺乏全面性和完整性。
筆者以我國(guó)35個(gè)城市的同比房?jī)r(jià)指數(shù)和環(huán)比房?jī)r(jià)指數(shù)為考察對(duì)象,考察的目的在于通過(guò)對(duì)這些城市的同比和環(huán)比房?jī)r(jià)指數(shù)時(shí)間序列進(jìn)行建模與預(yù)測(cè),比較完整和全面地揭示我國(guó)房?jī)r(jià)指數(shù)的客觀屬性,即可預(yù)測(cè)性以及所適合的預(yù)測(cè)模型。鑒于G.W.Crawford和M.C.Fratantoni的研究結(jié)果[4],即在預(yù)測(cè)時(shí),簡(jiǎn)單的ARIMA模型更為精確,我們提出了一個(gè)基于徑向基函數(shù)網(wǎng)絡(luò)及其廣義信息量的判別時(shí)間序列是否服從線性模型的檢驗(yàn)方法。利用這個(gè)方法,首先檢驗(yàn)房?jī)r(jià)指數(shù)是否服從線性模型。如果房?jī)r(jià)指數(shù)時(shí)間序列服從線性模型,那么就采用ARIMA模型來(lái)建模;如果不服從線性模型,就用多層徑向基函數(shù)網(wǎng)絡(luò)來(lái)建模。采用多層徑向基函數(shù)網(wǎng)絡(luò)的理由是這種網(wǎng)絡(luò)有很強(qiáng)的非線性函數(shù)的逼近能力,能高精度地預(yù)測(cè)非線性時(shí)間序列。[13-14]實(shí)際檢驗(yàn)表明,83%的城市的房?jī)r(jià)指數(shù)時(shí)間序列都是線性的,只有17%的城市的數(shù)據(jù)顯示非線性。而在線性模型中,絕大多數(shù)是AR模型,只有個(gè)別是ARMA模型。我們還將不服從線性模型的時(shí)間序列用線性模型進(jìn)行建模和預(yù)測(cè),并將預(yù)測(cè)誤差同多層徑向基函數(shù)網(wǎng)絡(luò)模型的結(jié)果做比較,發(fā)現(xiàn)后者的誤差遠(yuǎn)小于前者,這說(shuō)明了多層徑向基函數(shù)網(wǎng)絡(luò)的有效性。
為了更好地了解房?jī)r(jià)指數(shù)時(shí)間序列的特點(diǎn),檢驗(yàn)它是線性的還是非線性的十分重要,我們提出了基于RBF網(wǎng)絡(luò)及其廣義信息量的檢驗(yàn)方法,具體步驟如下:
1.用AR模型、ARMA模型和ARIMA模型對(duì)時(shí)間序列y1,y2,…,yN進(jìn)行建模,得到最佳線性模型和對(duì)應(yīng)的擬合殘差時(shí)間序列e1,e2,…,eN。
2.對(duì)殘差時(shí)間序列用不帶線性項(xiàng)的單層RBF網(wǎng)絡(luò)進(jìn)行建模得到最佳網(wǎng)絡(luò),記其廣義信息量為GIC1。記網(wǎng)絡(luò)在令其權(quán)重為零時(shí)的廣義信息量為GIC0,這是網(wǎng)絡(luò)不起作用時(shí)網(wǎng)絡(luò)的廣義信息量。[13]如果GIC1<GIC0,則說(shuō)明我們可以進(jìn)一步用非線性模型去擬合殘差時(shí)間序列,原時(shí)間序列為非線性的。如果GIC1≥GIC0,則說(shuō)明該殘差時(shí)間序列不能再用非線性模型去擬合,于是就認(rèn)為原時(shí)間序列是線性的,原來(lái)的線性模型就是最佳模型。在實(shí)際數(shù)據(jù)處理中,如果(GIC0-GIC1)/|GIC0|≤ε,就認(rèn)為模型是非線性的。
采用AR模型、ARMA模型、ARIMA模型以及帶線性項(xiàng)和不帶線性項(xiàng)的多層徑向基函數(shù)網(wǎng)絡(luò)作為房?jī)r(jià)指數(shù)的候選模型,從中選擇最適合的房?jī)r(jià)指數(shù)模型。具體建模步驟如下:
1.用AR模型、ARMA模型和ARIMA模型對(duì)房?jī)r(jià)指數(shù)時(shí)間序列y1,y2,…,yN進(jìn)行建模,根據(jù)AIC的值選擇最佳線性模型,并計(jì)算擬合殘差時(shí)間序列e1,e2,…,eN。
2.檢驗(yàn)房?jī)r(jià)指數(shù)時(shí)間序列是線性的還是非線性的。本研究取ε=0.01。如果是線性的,那么第1步所得到的模型就是該時(shí)間序列的最佳模型,建模結(jié)束。如果是非線性的,則進(jìn)入步驟3。
3.先分別用不帶線性項(xiàng)和帶線性項(xiàng)的單層RBF網(wǎng)絡(luò)對(duì)時(shí)間序列進(jìn)行建模,分別得到它們的最佳網(wǎng)絡(luò),并計(jì)算它們的廣義信息量GIC。如果不帶線性項(xiàng)的網(wǎng)絡(luò)的GIC小于帶線性項(xiàng)的GIC就建立純非線性多層RBF網(wǎng)絡(luò),其模型的數(shù)學(xué)表達(dá)式為:
這是一個(gè)純非線性模型。如果相反,就建立第一層帶線性項(xiàng)的多層RBF網(wǎng)絡(luò),其模型的數(shù)學(xué)表達(dá)式為:
這是一個(gè)線性和非線性的混合模型。網(wǎng)絡(luò)得到后,建模過(guò)程結(jié)束。
從上面的建模過(guò)程可以看到,本研究是在線性模型、非線性模型、線性和非線性的混合模型中挑選最合適的模型。而這些模型幾乎涵蓋了所有的定常時(shí)間序列模型,所以可以認(rèn)為這個(gè)做法是恰當(dāng)?shù)摹?/p>
需要說(shuō)明的是,步驟2和步驟3中的每層RBF網(wǎng)絡(luò)的中心和寬度都用采用浮點(diǎn)小數(shù)編碼的自適應(yīng)遺傳算法得到,而權(quán)重都用正則最小二乘法得到,[14]適應(yīng)度采用廣義信息量GIC的倒數(shù),這樣得到的網(wǎng)絡(luò)更具有泛化能力和良好的預(yù)測(cè)性能。此外多層RBF網(wǎng)絡(luò)中各層的延遲步數(shù)取為第一層網(wǎng)絡(luò)的延遲步數(shù)。
我們采用了我國(guó)35個(gè)城市(見表1)從2005年8月到2012年12月的月度的同比和環(huán)比房?jī)r(jià)指數(shù)數(shù)據(jù)。將2005年8月到2012年9月的數(shù)據(jù)用于建模。用得到的模型對(duì)2012年10月、11月和12月進(jìn)行動(dòng)態(tài)預(yù)測(cè)。而2012年10月到2012年12月的實(shí)際數(shù)據(jù)用于檢驗(yàn)預(yù)測(cè)精度。建模時(shí)對(duì)數(shù)據(jù)進(jìn)行了歸一化處理(見表1)。
同比房?jī)r(jià)指數(shù)時(shí)間序列線性和非線性檢驗(yàn)結(jié)果顯示:長(zhǎng)沙、貴陽(yáng)、合肥、濟(jì)南、青島、鄭州這6個(gè)城市是非線性模型,占17%,其余29個(gè)城市都是線性模型,共占83%。環(huán)比房?jī)r(jià)指數(shù)時(shí)間序列線性非線性檢驗(yàn)結(jié)果顯示:長(zhǎng)春、長(zhǎng)沙、蘭州、青島、太原、武漢這6個(gè)城市是非線性的,占17%,其它29個(gè)城市是線性的,占83%。
需要指出的是,G.W.Crawford和M.C.Fratantoni,是首先將線性模型和非線性模型的預(yù)測(cè)值和實(shí)際值相比較,計(jì)算其均方根誤差,由均方根誤差的大小確定時(shí)間序列是線性的還是非線性的。所以在建模前是不知道房?jī)r(jià)指數(shù)時(shí)間序列是否服從線性模型。我們提出的檢驗(yàn)方法恰好可以彌補(bǔ)這個(gè)缺點(diǎn)。
完成上述檢驗(yàn)后,我們對(duì)房?jī)r(jià)指數(shù)時(shí)間序列進(jìn)行建模,得到最佳模型。表1中列出了最佳模型,其中,LMRBF(p,m)表示第一層帶線性項(xiàng)的多層RBF網(wǎng)絡(luò),PMRBF(p,m)表示純非線性多層RBF網(wǎng)絡(luò),其中p為延遲步數(shù),m為層數(shù);此外“預(yù)測(cè)相對(duì)誤差”按如下公式計(jì)算:
表1 同比房?jī)r(jià)指數(shù)建模和預(yù)測(cè)結(jié)果
續(xù)上表
由表1可知,對(duì)同比數(shù)據(jù),29個(gè)線性模型中,26個(gè)是最簡(jiǎn)單的AR模型,3個(gè)是ARMA模型。
對(duì)于環(huán)比數(shù)據(jù)(圖表類似同比數(shù)據(jù),限于篇幅限制,不在贅述),29個(gè)線性模型中,28個(gè)是最簡(jiǎn)單的AR模型,只有1個(gè)是ARMA模型。
以廣州、上海兩個(gè)城市為例。圖1到圖4列出了廣州、上海兩個(gè)城市的房?jī)r(jià)指數(shù)同比時(shí)間序列的擬合結(jié)果與預(yù)測(cè)結(jié)果。由這些圖可以看到,擬合曲線和預(yù)測(cè)曲線在變化趨勢(shì)上和實(shí)際數(shù)據(jù)是一致的,并且擬合和預(yù)測(cè)的精度大都較高。
此外,我們還對(duì)同比和環(huán)比時(shí)間序列的模型為非線性的序列進(jìn)行了線性建模。同比數(shù)據(jù)的建模結(jié)果列在表2中,環(huán)比數(shù)據(jù)的建模結(jié)果列在表3中。為了便于比較,在表中列出了相應(yīng)的非線性模型的結(jié)果。
圖1 廣州同比房?jī)r(jià)指數(shù)擬合圖
圖2 廣州同比房?jī)r(jià)指數(shù)預(yù)測(cè)圖
圖3 上海同比房?jī)r(jià)指數(shù)擬合圖
圖4 上海同比房?jī)r(jià)指數(shù)預(yù)測(cè)圖
表2 同比時(shí)間序列的線性模型和非線性模型的預(yù)測(cè)誤差比較
表3 環(huán)比時(shí)間序列的線性模型和非線性模型的預(yù)測(cè)誤差比較
從表2可知,非線性模型的預(yù)測(cè)精度遠(yuǎn)高于線性模型。這說(shuō)明對(duì)非線性同比時(shí)間序列,引入多層徑向基函數(shù)網(wǎng)絡(luò)是很有必要的。但從表3知,非線性模型的預(yù)測(cè)精度相比線性模型改善得不多。這說(shuō)明同比房?jī)r(jià)指數(shù)非線性較強(qiáng),環(huán)比房?jī)r(jià)指數(shù)非線性較弱。
總結(jié)本文的研究結(jié)果,我們得到四個(gè)結(jié)論。(1)我國(guó)房?jī)r(jià)指數(shù)是可預(yù)測(cè)的。(2)我國(guó)房?jī)r(jià)指數(shù)的大部分模型都是線性模型,并且是簡(jiǎn)單的AR模型和ARMA模型。(3)房產(chǎn)價(jià)格指數(shù)的同比預(yù)測(cè)精度較高,環(huán)比的精度相對(duì)較差。(4)對(duì)不服從線性模型的房?jī)r(jià)指數(shù),采用多層RBF網(wǎng)絡(luò)可以大幅度提高預(yù)測(cè)精度。
[1]Case,K.and Shiller,R.The Efficiency of the Market for Single-Family Homes[J].AmericanEconomicReview,1989,79(1):125-137.
[2]Muellbauer,J.Murphy,A.Booms and Busts in the U.K.Housing Market[J].EconomicJournal,1997,107(445):1701-1727.
[3]Ortalo-Magne,F(xiàn).,Rady,S..Housing Market Dynamics:On the Contribution of Income Shocks and Credit Constraints[R].DiscussionPaper470,CESIfo.2001.
[4]Crawford,G.W.and Fratantoni,M.C.,Assessing the Forecasting Performance of Regime-Switching,ARIMA and GARCH Models of House Prices[J].RealEstateEconomic,2003,V31(2):223-243.
[5]王婧,田澎.小波神經(jīng)網(wǎng)絡(luò)在房地產(chǎn)價(jià)格指數(shù)預(yù)測(cè)中的應(yīng)用[J].計(jì)算仿真,2005,22(7):96-98.
[6]楊楠,邢力聰.灰色馬爾可夫模型在房?jī)r(jià)指數(shù)預(yù)測(cè)中的應(yīng)用[J].統(tǒng)計(jì)與信息論壇,2006,21(5):52-55.
[7]談萍,史占中.基于灰色-馬爾可夫模型的上海房?jī)r(jià)走勢(shì)實(shí)證研究[J].科學(xué)技術(shù)與工程,2011,11(3):661-663.
[8]Wang Y.S,Yu L,Lai KK.Crude oil price forecasting with TEI@I methodology[J].JournalofSystemsScienceand Complexity,2005,18(2):145-166.
[9]閆妍,許偉,部慧,等.基于TEI@I方法論的房?jī)r(jià)預(yù)測(cè)方法[J],系統(tǒng)工程理論與實(shí)踐,2007(7):1-9.
[10]黃鸝.我國(guó)房屋銷售價(jià)格指數(shù)AR模型的預(yù)測(cè)分析[J],統(tǒng)計(jì)與決策,2013(7):75-78.
[11]陸金鑄,陳紅麗.基于Kalman濾波法與AHP法的房?jī)r(jià)預(yù)測(cè)模型-以武漢市為例[J],科協(xié)論壇,2007(12下):54-55.
[12]王倩,王瑩,邱繼勤.基于灰色 GM(1,1)和BP神經(jīng)網(wǎng)絡(luò)的房?jī)r(jià)預(yù)測(cè)[J],時(shí)代金融,2011(12下):332-233.
[13]Zhuang,Jian,Jiang,Hai-Feng,Wu,Rui-Liu.Multi Layer RBF Network for Real Functions Approximation and nonlinear regression[C]//The2011InternationalConferenceonComputationalIntelligenceandSoftwareEngineering,2011.
[14]盛飛.多層徑向基函數(shù)網(wǎng)絡(luò)的自適應(yīng)遺傳算法[D].馬鞍山:安徽工業(yè)大學(xué),2013.