邱啟榮, 于 婷
?
基于主成分分析的BP神經(jīng)網(wǎng)絡(luò)對房價的預(yù)測研究
邱啟榮, 于 婷
(華北電力大學(xué) 數(shù)理學(xué)院, 北京, 102206)
為了提高房價預(yù)測精度, 采用基于主成分分析的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型. 首先運(yùn)用主成分分析對影響房價指標(biāo)重新組合生成新的綜合指標(biāo), 然后采用非線性預(yù)測能力非常強(qiáng)的BP神經(jīng)網(wǎng)絡(luò)對其進(jìn)行建模, 并對房價進(jìn)行預(yù)測. 仿真結(jié)果表明, 基于主成分分析的BP神經(jīng)網(wǎng)絡(luò)的房價仿真值與歷史值的系統(tǒng)總誤差只有0.52%, 可作為房價預(yù)測的一種行之有效的方法.
BP神經(jīng)網(wǎng)絡(luò); 主成分分析; 房價; 預(yù)測
自1998年以來, 我國房價就逐漸開始增長. 房價的增長是非常復(fù)雜的經(jīng)濟(jì)問題, 使得房價與影響其變化的變量之間無法定量計算. 常用的房價預(yù)測方法有灰色模型、時間序列、BP神經(jīng)網(wǎng)絡(luò)、回歸方法等. 杜道淵利用BP神經(jīng)網(wǎng)絡(luò)對自貢的房地產(chǎn)價格走勢預(yù)測取得了較好地結(jié)果[1], 章偉用粗糙集與BP神經(jīng)網(wǎng)絡(luò)結(jié)合的方法取得了更為精確地結(jié)果[2]. 本文通過主成分分析及BP神經(jīng)網(wǎng)絡(luò)建模的方法對我國近幾年的平均房價進(jìn)行科學(xué)的定量預(yù)測.
房價問題一直都是近幾年的熱點話題, 自從1998年以來, 我國房價就逐漸的開始了增長的步伐, 為了抑制房價以保證社會持續(xù)穩(wěn)定的發(fā)展, 政府出臺了各項政策, 對房地產(chǎn)市場進(jìn)行調(diào)控. 但是由于種種原因, 房價依然只升不降, 房價的不斷攀升給人民尤其是中低收入者生活帶來了很大的不便, 成為社會矛盾的焦點.
我們根據(jù)國內(nèi)外的文獻(xiàn), 選取8個影響房屋銷售價格()的影響因素[3]: 人均國民生產(chǎn)總值(1), 居民消費價格指數(shù)(2)、土地交易價格指數(shù)(3)、房屋租賃價格指數(shù)(4)、全國完成購置土地面積(5)、全國房地產(chǎn)開發(fā)完成額(6)、城鎮(zhèn)人均可支配(7)、竣工房屋造價(8). 通過1999-2009年的《中國統(tǒng)計年鑒》查出全國平均數(shù)據(jù), 具體數(shù)據(jù)見表1.
表1 房屋銷售價格相關(guān)數(shù)據(jù)
人工神經(jīng)網(wǎng)絡(luò)(ANN)具有很強(qiáng)的自學(xué)習(xí)能力, 可以以任意精度逼近非線性函數(shù), 因此特別適合模擬現(xiàn)實中復(fù)雜的非線性問題. 在人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用中, 絕大部分的神經(jīng)網(wǎng)絡(luò)都是采用BP神經(jīng)網(wǎng)絡(luò)及其改進(jìn)模型. 它體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)中最精華的部分[4].
典型的BP神經(jīng)網(wǎng)絡(luò)(Back Propagation)包括3層: 輸入層、隱含層和輸出層. 各層之間實行全連接, 同層之間無連接. 它的學(xué)習(xí)規(guī)則是使用最速下降法, 通過反向傳播來不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值, 使網(wǎng)絡(luò)的誤差平方和最小.
圖1 3層BP網(wǎng)絡(luò)
2.2.1 主成分分析
由于可供參考的影響因子有8個, 我們采用主成分分析的降維方法減少因子數(shù)量.
主成分分析是將原來眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的線性無關(guān)的綜合指標(biāo)[5]. 通常數(shù)學(xué)上的處理就是將原來的多個指標(biāo)作線性組合. 第1個成分具有最大的方差, 后面的成分對方差解釋的比例逐漸變小, 它們相互之間均不相關(guān). 假設(shè)原來有個指標(biāo), 重組后第個成分為:
在此我們將關(guān)于房價的8個影響指標(biāo)做主成分分析, 結(jié)果如表2所示.
表2 方差分解主成分提取分析
由表2可見, 當(dāng)包含3項成分時, 總的成分累計貢獻(xiàn)率已達(dá)到86%以上. 在此將原來的8項指標(biāo)轉(zhuǎn)化為線性無關(guān)的3個成分, 并且各不相關(guān)(表3).
表3 成分相關(guān)系數(shù)
2.2.2 歸一化處理
歸一化就是把指標(biāo)數(shù)值映射到[0, 1]內(nèi). 主要的歸一化方法有線性函數(shù)轉(zhuǎn)換、對數(shù)函數(shù)轉(zhuǎn)換和反正切函數(shù)轉(zhuǎn)換. 在此我們采用第1種方式, 即:
表4 歸一化后的數(shù)據(jù)
2.3.1 神經(jīng)網(wǎng)絡(luò)各層構(gòu)建
大多數(shù)通用的神經(jīng)網(wǎng)絡(luò)都預(yù)先設(shè)定網(wǎng)絡(luò)的層數(shù), 而BP網(wǎng)絡(luò)可以包含不同的隱含層. 在樣本不是很多的情況下,我們選擇常規(guī)3層BP網(wǎng)絡(luò)(只有1個隱含層)就可以了.
2.3.2 參數(shù)設(shè)置
BP網(wǎng)絡(luò)的輸入數(shù)據(jù)為3個歸一化后的成分, 輸出數(shù)據(jù)為房價. 輸入層有3個節(jié)點, 輸出層有1個節(jié)點, 最大訓(xùn)練循環(huán)次數(shù)為5 000, 系統(tǒng)每100步顯示一次訓(xùn)練誤差, 訓(xùn)練目標(biāo)誤差為0.000 1, 學(xué)習(xí)系數(shù)為0.05.
隱含層和輸出層傳遞函數(shù)分別為正切S形函數(shù)和純線性函數(shù), 網(wǎng)絡(luò)訓(xùn)練函數(shù)為梯度下降自適應(yīng)學(xué)習(xí)率訓(xùn)練函數(shù), 學(xué)習(xí)函數(shù)為帶動量的最速下降法.
網(wǎng)絡(luò)訓(xùn)練經(jīng)過318次迭代后, 誤差達(dá)到允許范圍, 符合函數(shù)逼近的需要, 結(jié)果如圖2.
圖2 訓(xùn)練誤差曲線
最后, 我們根據(jù)已有數(shù)據(jù)進(jìn)行仿真, 把得到的結(jié)果做反歸一化處理, 得到預(yù)測房價. 通過對比實際房價發(fā)現(xiàn), 利用神經(jīng)網(wǎng)絡(luò)模型得出的預(yù)測非常準(zhǔn)確, 對最后5年房價預(yù)測的平均誤差率為0.52%, 具有很高的精度.
表5 5年房價誤差率分析
圖3 仿真結(jié)果與歷史數(shù)據(jù)對比圖
BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力, 對于非線性的樣本數(shù)據(jù), 能夠很好的找到其內(nèi)部關(guān)系. 在本文的數(shù)據(jù)預(yù)處理中采用主成分分析的方法把房價因素組合為線性無關(guān)的3類成分, 簡化了輸入成本, 提高了程序的運(yùn)行速度.
通過前面的結(jié)果分析可知, 基于主成分分析的BP神經(jīng)網(wǎng)絡(luò)預(yù)測的房價非常接近原始房價, 模型訓(xùn)練次數(shù)少, 擬合精度高, 可以作為房價預(yù)測的一種可靠的方法. 這種方法不僅在房價預(yù)測中起到了很好的作用, 也可以嘗試作為其它的非線性數(shù)據(jù)預(yù)測方法.
[1] 杜道淵, 杜宏斌, 周鋒. 基于BP神經(jīng)網(wǎng)絡(luò)自貢房地產(chǎn)價格走勢預(yù)測[J]. 四川理工學(xué)院學(xué)報: 自然科學(xué)版, 2011, 24(3): 366-310.
[2] 章偉. 粗糙集BP神經(jīng)網(wǎng)絡(luò)在房地產(chǎn)價格預(yù)測中的應(yīng)用[J]. 計算機(jī)仿真, 2011, 28(7): 365-368.
[3] 劉雙. 房屋銷售價格的統(tǒng)計預(yù)測[D]. 華北電力大學(xué), 2011.
[4] 聞新, 周露, 王丹力, 等. MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計[M]. 北京: 科學(xué)出版社, 2000.
[5] 薛薇. SPSS統(tǒng)計分析方法與應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2009.
[6] 蘇變萍, 王一平. 基于BP神經(jīng)網(wǎng)絡(luò)的信息商品價格預(yù)測模型[J]. 統(tǒng)計與信息論壇, 2007, 22(1): 93-95.
[7] 陳基純, 王楓. 房地產(chǎn)價格時間序列預(yù)測的BP神經(jīng)網(wǎng)絡(luò)方法[J]. 理論新探, 2008, 14: 42-43.
[8] 馮琨, 張永麗. 基于因子分析的BP神經(jīng)網(wǎng)絡(luò)對成都市需水量預(yù)測研究[J]. 水資源研究, 2011, 32(2): 8-11.
[9] 胡六星, 吳結(jié)飛. 基于灰色系統(tǒng)理論的兩種房價預(yù)測方法比較[J]. 統(tǒng)計與決策, 2010, 7: 22-24.
[10] 武秀麗, 張鋒. 時間序列分析法在房價預(yù)測中的應(yīng)用—以廣州市的數(shù)據(jù)為例[J]. 科學(xué)技術(shù)與工程, 2007, 7(21): 5631-5635.
[11] 王海軍, 白玫, 賈兆立, 等. 基于二次優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的期貨價格預(yù)測[J]. 數(shù)學(xué)的實踐與認(rèn)識, 2008, 38(5): 36-40.
BP neural network forecast model based on principal component analysis for the real estate price of prediction
QIU Qi-rong, YU Ting
(College of Mathematics and Physics, North China Electric Power University, Beijing 102206, China)
The BP neural network forecast model based on principal component analysis is used to improve the prediction accuracy. Factors affecting real estate prices is combined by principal component analysis, then it comes out some new fewer indicators. After that, BP neural network model is built which can well do non-linear prediction. Finally, the real estate price can be calculated. The total error between the simulation value through BP neural network based on principal component analysis and the real house price is only 0.52 percent. So it is an effective method for house price forecast.
BP neural network; principal component analysis; the real estate; prediction
10.3969/j.issn.1672-6146.2011.03.008
O 212.1
1672-6146(2011)03-0024-03
2011-08-29
邱啟榮(1966-), 男, 教授, 研究方向為優(yōu)化理論及其應(yīng)用. E-mail: yutw520@163.com
(責(zé)任編校: 劉曉霞)