鄧 英,鄒 璐,田學(xué)澤
(1.長沙理工大學(xué) 經(jīng)濟(jì)與管理學(xué)院, 湖南 長沙 410114;2.長沙理工大學(xué) 交通運(yùn)輸工程學(xué)院, 湖南 長沙 410114)
當(dāng)前城鎮(zhèn)化進(jìn)程的快速推進(jìn)使得商品住宅需求過旺,房地產(chǎn)住宅市場供求結(jié)構(gòu)關(guān)系嚴(yán)重失衡,人民日益增長的住房需求同發(fā)展不平衡的商品住宅市場間的矛盾愈演愈烈。因此,識別影響商品住宅需求的主要因素,構(gòu)建符合房地產(chǎn)住宅市場現(xiàn)狀的商品住宅需求預(yù)測指標(biāo)體系,建立預(yù)測精度高的商品住宅需求預(yù)測模型開展商品住宅需求預(yù)測,對促進(jìn)商品住宅供給科學(xué)決策、恢復(fù)房地產(chǎn)住宅市場供求結(jié)構(gòu)關(guān)系平衡乃至推進(jìn)商品住宅市場走可持續(xù)健康發(fā)展道路具有十分重大的意義。
縱觀當(dāng)前國內(nèi)外學(xué)者在商品住宅需求預(yù)測上的研究現(xiàn)狀,研究內(nèi)容主要有兩個方面——商品住宅需求預(yù)測方法的研究與預(yù)測數(shù)據(jù)的選擇。
關(guān)于商品住宅需求預(yù)測的方法主要分為以下幾種:(1)以計量統(tǒng)計學(xué)為基礎(chǔ)的傳統(tǒng)預(yù)測方法,主要有時間序列分析法[1-2]、多元線性回歸模型、灰色理論模型與馬爾科夫鏈模型等[3-7];(2)以機(jī)器學(xué)習(xí)算法和計算機(jī)技術(shù)為基礎(chǔ)的智能預(yù)測方法,主要有反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)模型、徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)(Support Vector Machine,SVM)模型、基于粒子群優(yōu)化算法改進(jìn)反向傳播(Particle Swarm Optimization-Back Propagation,PSO-BP)神經(jīng)網(wǎng)絡(luò)模型等[8-11]。
關(guān)于預(yù)測數(shù)據(jù)的選擇可分為兩類:一類是選取與商品住宅需求量關(guān)聯(lián)度較高的影響因素作為自變量,并以其歷史數(shù)據(jù)為數(shù)據(jù)源,通過建立線性或非線性模型對其商品住宅需求量進(jìn)行預(yù)測,例如,文獻(xiàn)[12]和文獻(xiàn)[8]分別在采用主成分分析法與鄰域粗糙集提取影響商品住宅需求量主要因素的基礎(chǔ)上,結(jié)合其歷史統(tǒng)計數(shù)據(jù)資料,通過BP神經(jīng)網(wǎng)絡(luò)模型對其商品住宅需求量進(jìn)行了預(yù)測;另一類是直接以商品住宅需求的歷史數(shù)據(jù)為數(shù)據(jù)源,通過建立模型對其商品住宅需求量進(jìn)行時間序列上的預(yù)測,如文獻(xiàn)[13]以石家莊市2000—2012年的商品住宅需求量為數(shù)據(jù)源,采用GM(1,1)模型對其未來5年的商品住宅需求量進(jìn)行了預(yù)測。
由上述分析可知,隨著計算機(jī)技術(shù)與機(jī)器學(xué)習(xí)算法的快速發(fā)展與推廣,采用機(jī)器學(xué)習(xí)算法結(jié)合計算機(jī)技術(shù)開展預(yù)測研究已成為熱潮,以計量統(tǒng)計學(xué)為基礎(chǔ)的傳統(tǒng)預(yù)測方法已失去優(yōu)勢。此外,考慮到以影響商品住宅需求關(guān)鍵因素的歷史數(shù)據(jù)作為預(yù)測數(shù)據(jù)源要優(yōu)于直接以商品住宅需求歷史數(shù)據(jù)作為預(yù)測數(shù)據(jù)源,本文將灰色關(guān)聯(lián)分析法(Grey Relational Analysis,GRA)、遺傳算法(Genetic Algorithm,GA)與BP神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,建立基于GRA和GA-BP神經(jīng)網(wǎng)絡(luò)的商品住宅需求預(yù)測模型;然后以湖北省黃石市為例,結(jié)合房地產(chǎn)住宅市場現(xiàn)狀與2006—2020年統(tǒng)計年鑒數(shù)據(jù)開展實(shí)證研究,以期為科學(xué)合理預(yù)測商品住宅需求量提供新方法。
灰色關(guān)聯(lián)分析法(GRA)是一種適用于在復(fù)雜變量因素系統(tǒng)中以定量研究視角,分析多個變量對目標(biāo)屬性變量影響程度的方法[14]。該算法的核心思想是通過計算各影響因素與目標(biāo)屬性變量之間的關(guān)聯(lián)度值,依據(jù)灰色關(guān)聯(lián)度值來表達(dá)各因素對目標(biāo)屬性變量影響程度的大小,進(jìn)而使分析結(jié)果更為直觀清晰,具體實(shí)施步驟如圖1所示。
圖1 灰色關(guān)聯(lián)分析流程圖
遺傳算法(GA)是一種效仿自然選擇機(jī)制和生物進(jìn)化原理,且具有隨機(jī)性的新型全局搜索算法。該算法的主要機(jī)理是在種群進(jìn)化的過程中以優(yōu)勝劣汰的方式選取適應(yīng)度較高的種群進(jìn)行交叉、重組與變異,以產(chǎn)生新的子種群,如此不斷循環(huán)迭代便可進(jìn)化出最優(yōu)的個體[15]。圖2為遺傳算法基本流程圖。遺傳算法最大的優(yōu)勢在于其不受制于目標(biāo)函數(shù)的類型,具有計算速度快與全局收斂性好等優(yōu)點(diǎn)。
圖2 遺傳算法基本流程圖
圖3 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu) 圖4 BP神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)流程圖
輸出層的誤差可以表示為
(1)
(2)
(3)
本文在建立商品住宅需求預(yù)測模型時,首先,在識別和選取商品住宅需求影響因素的基礎(chǔ)上,運(yùn)用灰色關(guān)聯(lián)分析法(GRA)提取影響商品住宅需求的主要影響因素,并以此構(gòu)建商品住宅需求預(yù)測指標(biāo)體系;其次,將已構(gòu)建的商品住宅需求預(yù)測指標(biāo)體系作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量,商品住宅銷售量作為輸出變量建立預(yù)測模型;但由于BP神經(jīng)網(wǎng)絡(luò)具有收斂速度慢、全局搜索能力弱與易出現(xiàn)局部最小值等缺點(diǎn)。故先引用遺傳算法(GA)對BP神經(jīng)網(wǎng)絡(luò)的各層權(quán)值與閾值進(jìn)行全局尋優(yōu),再運(yùn)用經(jīng)GA優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)開展預(yù)測。GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的基本流程如圖5所示,具體步驟如下:
第1步:種群初始化與個體編碼。隨機(jī)生成初始種群后,以實(shí)數(shù)編碼的方式對個體進(jìn)行編碼,個體編碼的內(nèi)容為BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值。
第2步:選擇適應(yīng)度函數(shù)。依據(jù)對個體進(jìn)行編碼所得到的BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值與閾值,采用訓(xùn)練樣本數(shù)據(jù)對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將網(wǎng)絡(luò)輸出值與真實(shí)值之間的均方根誤差(Root Mean Square Error,RMSE)作為適應(yīng)度函數(shù)。BP神經(jīng)網(wǎng)絡(luò)的適應(yīng)度值與輸入個體的適應(yīng)度值正相關(guān),其適應(yīng)度值與預(yù)測誤差負(fù)相關(guān)。因此,在計算得出所有個體的適應(yīng)度值后,選擇適應(yīng)度值最大的個體作為子種群。
第3步:選擇操作。通常遺傳算法實(shí)施選擇操作的算子有輪盤賭法和錦標(biāo)賽法,本文選擇輪盤賭法作為遺傳算法的選擇算子,其原理是依據(jù)適應(yīng)度比例進(jìn)行選擇,每個個體i被選中的概率為
(4)
其中fi=k2/Fi表示個體i的適應(yīng)度值,k2為常系數(shù),N表示種群個體數(shù)量,F(xiàn)i表示個體i的誤差值。
第4步:交叉操作。采用實(shí)數(shù)交叉法實(shí)施交叉操作,若第k個染色體ak和第i個染色體ai分別與第j個基因進(jìn)行交叉,則交叉操作方法如
(5)
式中b為取值在[0,1]的隨機(jī)數(shù)。
第5步:變異操作。變異操作可利用均勻變異算子實(shí)現(xiàn),如第i個個體的第j個基因可按式(6)和式(7)實(shí)施變異操作:
(6)
(7)
其中amax和amin分別表示基因aij的上下界,g為適應(yīng)度誤差值,gmax為適應(yīng)度誤差的最大值。
第6步:計算適應(yīng)度值。依據(jù)每次迭代所得適應(yīng)度值是否滿足精度或是否已達(dá)到最大迭代次數(shù)判斷是否滿足迭代停止條件,若滿足條件則輸出最優(yōu)權(quán)值與閾值,否則繼續(xù)循環(huán)迭代。
第7步:實(shí)施預(yù)測。將最優(yōu)權(quán)值與閾值輸入BP神經(jīng)網(wǎng)絡(luò)模型,對測試樣本數(shù)據(jù)實(shí)施預(yù)測。
圖5 遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)流程圖
商品住宅需求是指在一定時期內(nèi)消費(fèi)者愿意且能夠購買的商品住宅數(shù)量,通常以商品住宅銷售面積來衡量住宅需求量的大小[20]。商品住宅需求系統(tǒng)是一個復(fù)雜的非線性系統(tǒng),在分析其影響因素時需結(jié)合與之相關(guān)的經(jīng)濟(jì)、政策、人口及社會等因素,因此,本文從經(jīng)濟(jì)性因素和非經(jīng)濟(jì)性因素兩方面識別與選取影響黃石市商品住宅需求的因素,并采用灰色關(guān)聯(lián)分析法篩選與商品住宅需求量關(guān)聯(lián)性強(qiáng)的因素,以此構(gòu)建黃石市商品住宅需求影響指標(biāo)體系。
從經(jīng)濟(jì)性因素和非經(jīng)濟(jì)性因素兩方面識別與選取影響黃石市商品住宅需求因素時,考慮到指標(biāo)因素的可獲取性與可量化性,在分析現(xiàn)有研究成果的基礎(chǔ)上,結(jié)合黃石市房地產(chǎn)發(fā)展現(xiàn)狀與2006—2020年統(tǒng)計年鑒數(shù)據(jù),選取城鎮(zhèn)人口數(shù)量(X1)、城鎮(zhèn)化率(X2)、城鎮(zhèn)居民人均GDP(X3)、城鎮(zhèn)居民儲蓄存款余額(X4)、房地產(chǎn)開發(fā)投資額(X5)、商品住宅銷售均價(X6)、住宅施工面積(X7)、住宅竣工面積(X8)、住宅新開工面積(X9)、城鎮(zhèn)居民人均可支配收入(X10)、城鎮(zhèn)居民人均消費(fèi)性支出(X11)、城鎮(zhèn)居民人均居住面積(X12)、城鎮(zhèn)居民恩格爾系數(shù)(X13)、城鎮(zhèn)居民家庭平均每戶人口數(shù)(X14)、城鎮(zhèn)居民家庭人均住房貸款償還金額(X15)、城鎮(zhèn)居民家庭人均繳納住房公積金金額(X16)共16個指標(biāo)為黃石市商品住宅需求影響因素,且以住宅銷售面積(Y)來表征商品住宅需求量,具體數(shù)據(jù)見表1。
表1 2005—2019年黃石市商品住宅需求影響因素數(shù)據(jù)
考慮到已識別與選取的影響因素間存在量綱差異,會導(dǎo)致關(guān)聯(lián)性分析結(jié)果產(chǎn)生較大誤差,在分析各影響因素與商品住宅需求間關(guān)聯(lián)性的強(qiáng)弱前,先對各影響因素進(jìn)行無量綱處理。通常,采用式(8)對指標(biāo)因素進(jìn)行無量綱化處理:
(8)
運(yùn)用式(8)對表1中的各影響指標(biāo)的數(shù)值進(jìn)行無量綱化處理后,利用灰色關(guān)聯(lián)分析法對商品住宅需求與16個影響因素進(jìn)行相關(guān)性分析,分析結(jié)果見表2和圖6。依據(jù)灰色關(guān)聯(lián)分析原理,若灰色關(guān)聯(lián)度值大于0.7,則表示影響因素與目標(biāo)變量具有強(qiáng)相關(guān)性。
表2 黃石市商品住宅需求與各影響因素間的灰色關(guān)聯(lián)度
圖6 各影響因素灰色關(guān)聯(lián)度結(jié)果
由表2和圖6可知,城鎮(zhèn)居民人均可支配收入(X10)、城鎮(zhèn)居民儲蓄存款余額(X4)、城鎮(zhèn)居民人均消費(fèi)性支出(X11)、住宅施工面積(X7)、城鎮(zhèn)居民家庭人均繳納住房公積金金額(X16)、城鎮(zhèn)居民人均GDP(X3)、商品住宅銷售均價(X6)、房地產(chǎn)開發(fā)投資額(X5)、城鎮(zhèn)居民家庭人均住房貸款償還金額(X15)、城鎮(zhèn)居民人均居住面積(X12)等因素與黃石市商品住宅需求的灰色關(guān)聯(lián)度均大于0.7。因此,本文選取以上10個指標(biāo)為影響黃石市商品住宅需求的主要因素,并以此構(gòu)建黃石市商品住宅需求預(yù)測指標(biāo)體系,詳細(xì)數(shù)據(jù)見表3。
表3 黃石市商品住宅需求預(yù)測指標(biāo)體系
本文運(yùn)用MATLAB軟件實(shí)施仿真實(shí)驗(yàn)研究,BP神經(jīng)網(wǎng)絡(luò)的拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)使用典型的3層結(jié)構(gòu)模式,訓(xùn)練函數(shù)使用L-M優(yōu)化算法trainlm,傳遞函數(shù)使用purelin函數(shù)和logsig函數(shù);遺傳算法(GA)的種群大小設(shè)為20,遺傳代數(shù)設(shè)為100,交叉概率與變異概率分別設(shè)為0.6和0.01,適應(yīng)度函數(shù)為RMSE,BP神經(jīng)網(wǎng)絡(luò)與遺傳算法(GA)的具體參數(shù)設(shè)置見表4。
表4 BP神經(jīng)網(wǎng)絡(luò)與遺傳算法參數(shù)設(shè)置
為了避免由于數(shù)據(jù)量綱的差異給BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效率及預(yù)測精度帶來的不利影響,本文調(diào)用MATLAB R軟件中的mapminmax函數(shù)對表3中的數(shù)據(jù)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)見表5。
表5 預(yù)測指標(biāo)體系歸一化后的數(shù)據(jù)
將表5中的數(shù)據(jù)輸入GA-BP神經(jīng)網(wǎng)絡(luò)模型,隨機(jī)選取10個為訓(xùn)練樣本,其余為測試樣本,并利用訓(xùn)練集樣本對GA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。經(jīng)反復(fù)訓(xùn)練獲得GA-BP神經(jīng)網(wǎng)絡(luò)模型的最優(yōu)迭代誤差曲線變化圖、訓(xùn)練集樣本預(yù)測值與真實(shí)值的對比圖,如圖7所示。
(a)GA-BP模型迭代誤差圖 (b)GA-BP模型訓(xùn)練效果圖圖7 GA-BP神經(jīng)網(wǎng)絡(luò)模型建立
由圖7(a)可知,隨著遺傳算法迭代次數(shù)的增加,適應(yīng)度值不斷趨于穩(wěn)定,當(dāng)?shù)恋?8代時,遺傳算法對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值尋優(yōu)及BP神經(jīng)網(wǎng)絡(luò)模型精度訓(xùn)練結(jié)束,此時適應(yīng)度值為0.015 2,滿足要求。結(jié)合圖7(b)可知,經(jīng)訓(xùn)練集樣本訓(xùn)練后的GA-BP神經(jīng)網(wǎng)絡(luò)模型具有較高的線性擬合精度,且在訓(xùn)練集樣本中的預(yù)測值與真實(shí)值的平均相對誤差為5.32%,均方根誤差(RMSE)為8.964,均滿足要求。GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型建立完成。
為了驗(yàn)證GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型的有效性,將建立并訓(xùn)練完成的網(wǎng)絡(luò)應(yīng)用于黃石市商品住宅需求預(yù)測測試集樣本的仿真預(yù)測,其仿真預(yù)測結(jié)果見表6,測試樣本預(yù)測值與真實(shí)值的結(jié)果對比見圖8。為進(jìn)一步驗(yàn)證GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測能力的優(yōu)越性,基于相同的輸入數(shù)據(jù),分別運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型(Multiple Linear Regression,MLR)、GM(1,1)模型與對黃石市商品住宅需求進(jìn)行仿真預(yù)測,并將仿真預(yù)測結(jié)果與GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行對比分析。各模型預(yù)測結(jié)果及測試樣本預(yù)測值與真實(shí)值的對比圖見表6和圖8,各模型測試樣本預(yù)測結(jié)果平均相對誤差與均方根誤差見表7。
表6 各模型預(yù)測結(jié)果及誤差
(a)GRA和GA-BP模型預(yù)測效果圖 (b)BP模型預(yù)測效果圖
(c)MLR模型預(yù)測效果圖 (d)GM(1,1)模型預(yù)測效果圖圖8 各模型測試樣本預(yù)測結(jié)果對比
表7 各預(yù)測模型的統(tǒng)計誤差
從圖8可得知,GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值曲線與測試樣本真實(shí)值曲線基本吻合,擬合精度最優(yōu),僅在第4個測試樣本處出現(xiàn)了些許偏差;BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值曲線與測試樣本真實(shí)值曲線在前兩個測試樣本處偏差較大,后三個測試樣本處偏差較?。欢嘣€性回歸模型(MLR)預(yù)測值曲線與測試樣本真實(shí)值曲線在后三個測試樣本處擬合相對較好,在其余兩個測試樣本處擬合較差;GM(1,1)模型預(yù)測值曲線與測試樣本真實(shí)值曲線的擬合程度最差。
通過分析表6和表7可知,GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型的測試樣本相對誤差均在2%~8%范圍內(nèi),且其測試樣本的平均相對誤差和均方根誤差皆最小,分別為4.49%和6.14;雖然BP神經(jīng)網(wǎng)絡(luò)模型和多元線性回歸模型(MLR)的測試樣本相對誤差皆位于7%~11%,且兩者的測試樣本平均相對誤差與均方根誤差都大于GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型,但多元線性回歸模型(MLR)預(yù)測精度優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型;GM(1,1)模型預(yù)測精度最差,測試樣本相對誤差位于9%~14%,測試樣本平均相對誤差和均方根誤差分別為10.90%和21.32。因此,通過對比分析可知各模型的預(yù)測精度比較結(jié)果:GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型>多元線性回歸模型(MLR)>BP神經(jīng)網(wǎng)絡(luò)模型>GM(1,1)模型。
綜上所述,遺傳算法用于BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值尋優(yōu)切實(shí)可行,有利于提高BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度;本文構(gòu)建的GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型適用于黃石市商品住宅需求預(yù)測,且預(yù)測精度高于其他預(yù)測模型。
本文結(jié)合黃石市房地產(chǎn)市場現(xiàn)狀與2006—2020年統(tǒng)計年鑒數(shù)據(jù),將建立的GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型用于黃石市商品住宅需求預(yù)測分析,并將預(yù)測結(jié)果與BP神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型(MLR)及GM(1,1)模型進(jìn)行對比,得出以下結(jié)論:
(1)從經(jīng)濟(jì)性因素與非經(jīng)濟(jì)性因素兩個方面識別與選取16個黃石市商品住宅需求影響因素,將其與商品住宅需求進(jìn)行灰色關(guān)聯(lián)度分析。結(jié)果表明城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民儲蓄存款余額、城鎮(zhèn)居民人均消費(fèi)性支出、住宅施工面積、城鎮(zhèn)居民家庭人均繳納住房公積金金額、城鎮(zhèn)居民人均GDP、商品住宅銷售均價、房地產(chǎn)開發(fā)投資額、城鎮(zhèn)居民家庭人均住房貸款償還金額與城鎮(zhèn)居民人均居住面積共10個因素灰色關(guān)聯(lián)度大于0.7,因此,這10個因素為黃石市商品住宅需求的主要影響因素。
(2)在黃石市商品住宅需求測試樣本的預(yù)測中,GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型測試樣本相對誤差的范圍為2%~8%、平均相對誤差為4.49%、均方根誤差為6.14,與BP神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型(MLR)及GM(1,1)模型相比均最??;4種模型的預(yù)測精度比較結(jié)果:GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型>多元線性回歸模型(MLR)>BP神經(jīng)網(wǎng)絡(luò)模型>GM(1,1)模型。
(3)通過對比GRA和GA-BP神經(jīng)網(wǎng)絡(luò)模型與BP神經(jīng)網(wǎng)絡(luò)模型的測試樣本相對誤差所處范圍、平均相對誤差值及均方根誤差值可知,采用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行權(quán)值與閾值尋優(yōu)切實(shí)可行,有利于提高BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度。