谷甜甜,李德智,楊 茜,蔣 英
(1.中國(guó)礦業(yè)大學(xué) 力學(xué)與土木工程學(xué)院,江蘇 徐州 221116,E-mail:gusweet@126.com;2. 東南大學(xué) 土木工程學(xué)院,江蘇 南京 211189;3.江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院 管理工程學(xué)院,江蘇 常州 213147)
當(dāng)前我國(guó)城鎮(zhèn)化進(jìn)行的加速使得商品住宅需求旺盛,總體住房短缺問(wèn)題仍存在[1,2]。因此識(shí)別住房需求的關(guān)鍵影響因素,構(gòu)建合理的預(yù)測(cè)模型分析住宅需求未來(lái)走勢(shì),對(duì)于促進(jìn)住房供給科學(xué)決策、住房建設(shè)合理投資、乃至形成平穩(wěn)健康發(fā)展的房地產(chǎn)市場(chǎng)具有十分重要的意義。
在商品住宅需求及其預(yù)測(cè)的研究上,國(guó)內(nèi)外許多學(xué)者進(jìn)行了深入且積極的探索,發(fā)現(xiàn)國(guó)家、消費(fèi)者、供給方等多方面因素對(duì)城鎮(zhèn)商品住宅需求量產(chǎn)生綜合影響,其預(yù)測(cè)方法也多種多樣。其中,國(guó)家層面的影響因素主要包括GDP、國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率、城鎮(zhèn)化率、房地產(chǎn)開(kāi)發(fā)投資完成額[2~4];消費(fèi)者方面影響因素主要包括人均居民可支配收入、家庭規(guī)模、人均居住面積、居民消費(fèi)價(jià)格指數(shù)等[5,6];住宅市場(chǎng)的供給方主要是指房地產(chǎn)開(kāi)發(fā)商,對(duì)于住宅需求的影響因素包括住宅平均價(jià)格、住宅竣工面積、新開(kāi)工面積等[7,8]。考慮到影響商品住宅需求的因素較多且通常呈現(xiàn)非線(xiàn)性關(guān)系,傳統(tǒng)的線(xiàn)性回歸、主成分分析法(PCA)、德?tīng)柗坪蛯哟畏治龇ǖ葻o(wú)法從本質(zhì)上反映真實(shí)問(wèn)題。近年來(lái)部分學(xué)者在進(jìn)行商品住房需求影響因素分析及未來(lái)趨勢(shì)預(yù)測(cè)上,采用人工神經(jīng)網(wǎng)絡(luò)方法并取得了一定效果,例如葛懷志等[2]應(yīng)用基于PCA-BP模型分析了湖北省城鎮(zhèn)居民住房需求的9個(gè)影響因素,為住房需求的預(yù)測(cè)提供了一定的參考。
然而,國(guó)內(nèi)外在住宅需求影響因素指標(biāo)選取上往往缺乏科學(xué)根據(jù),僅僅考慮少數(shù)幾個(gè)和需求相關(guān)因素的面板數(shù)據(jù)。因此,本文從簡(jiǎn)單且切實(shí)可行角度出發(fā),提出基于鄰域粗糙集(Neighborhood Rough Set,NRS)和“誤差反向傳播”(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的住宅需求預(yù)測(cè)模型,從住宅需求的眾多影響因素中篩選出主要影響因素,利用BP神經(jīng)網(wǎng)絡(luò)方法,預(yù)測(cè)城鎮(zhèn)居民住宅需求的未來(lái)走勢(shì),并選取某市A區(qū)作為算例分析。
在粗糙集理論基礎(chǔ)上,鄰域粗糙集(NRS)作為約簡(jiǎn)方法被提出用于處理混合型屬性值[9],其廣泛地應(yīng)用在決策模型構(gòu)建、評(píng)價(jià)指標(biāo)體系構(gòu)建、影響因素提取等方面[10],然而 NRS無(wú)法對(duì)屬性數(shù)據(jù)進(jìn)行預(yù)測(cè)。BP神經(jīng)網(wǎng)絡(luò)作為人工智能的一種方法,用于對(duì)數(shù)據(jù)進(jìn)行運(yùn)算和規(guī)律識(shí)別,在人力資源需求、能源需求、建設(shè)用地需求等方面具有較好的預(yù)測(cè)能力[11,12]。本文基于NRS-BP構(gòu)建商品住宅需求預(yù)測(cè)模型如圖1所示。
圖1 基于NRS-BP的商品住宅需求預(yù)測(cè)流程
考慮到我國(guó)住宅需求中微觀(guān)層面數(shù)據(jù)難以獲取和政策層面因素難以度量?jī)煞矫媲闆r,從商品住宅需求數(shù)據(jù)的有效性及可得性出發(fā),采用宏觀(guān)經(jīng)濟(jì)時(shí)間序列數(shù)據(jù)來(lái)構(gòu)建預(yù)測(cè)模型,選取城鎮(zhèn)常住人口(a1)、住宅竣工面積(a2)、GDP(a3)、城鎮(zhèn)化率(a4)、住宅投資額(a5)、家庭規(guī)模(a6)、主要年份城鎮(zhèn)非私營(yíng)單位職工年平均工資(a7)、人均居民可支配收入(a8)、人均居住面積(a9)、國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率(a10)、城鎮(zhèn)居民恩格爾系數(shù)(a11)、商品住房均價(jià)(a12)、居民消費(fèi)價(jià)格指數(shù)(a13)、住宅施工面積(a14)、住宅新開(kāi)工面積(a15)等作為商品住宅需求的影響因素。商品住宅需求指的是某一時(shí)期消費(fèi)者能夠并有意愿購(gòu)買(mǎi)的商品住宅產(chǎn)品,通常表征指標(biāo)為商品住宅銷(xiāo)售面積[13],因此本文將商品住宅銷(xiāo)售面積作為決策變量(D),并以時(shí)間為單位對(duì)某地區(qū)商品住宅需求量進(jìn)行預(yù)測(cè)。
利用需求數(shù)據(jù)集構(gòu)建決策信息表,明確商品住宅需求決策系統(tǒng)。針對(duì)表述的需求影響因素約簡(jiǎn)問(wèn)題,將其轉(zhuǎn)化成一個(gè)決策系統(tǒng)。論域U={x1,x2,…,xn}是全部樣本構(gòu)成的集合,其中xi=(i=1,2,…,n)代表某地區(qū) n年的樣本數(shù)據(jù);A={a1,a2,…,am}代表樣本所有因素的集合,其中 ai(i=1,2,…,15)代表 15個(gè)商品住宅需求影響因素;D代表商品住宅需求(分類(lèi)決策屬性)。任意給定N維歐式空間中兩點(diǎn),記作xi和xj,其距離為:
其中,f(x,a)為對(duì)象x在屬性a上的取值。對(duì)于U上任意樣本xi,其δ鄰域?yàn)棣?{x|x∈U,Δ(x,xi)≤δ},其中 δ≥0。N被定義為 A的鄰域關(guān)系,則NDT=(U,N,D)是商品住房需求影響因素鄰域決策系統(tǒng),N個(gè)等價(jià)類(lèi)(因素集)則根據(jù)D對(duì)U劃分而來(lái):{x1,x2,…,xN},B?A,鄰域關(guān)系NB由B得到,那么在決策D中,B的NB下(NBD)、上近似邊界及決策邊界BN(D)分別為:
式中,
對(duì)于條件屬性B,商品住宅需求D的依賴(lài)度為:
對(duì)于商品住宅需求D,條件屬性a的重要性為:
依據(jù)商品住宅需求D計(jì)算的各屬性重要性,由大到小進(jìn)行排列,在約簡(jiǎn)集合中加入選擇重要度大的屬性值,直到屬性重要性Sig(a,B,D)小于重要度下限(通常由?表示,取0.05或者0.01),則剩余屬性不加入約簡(jiǎn)集合,由此得到某一鄰域半徑下的屬性約簡(jiǎn)結(jié)果。之后,按照一定的步長(zhǎng)調(diào)整條件屬性的鄰域半徑δ,計(jì)算δ不同情況下單個(gè)屬性重要度,得到相應(yīng)的屬性約簡(jiǎn)集合。而后,對(duì)每個(gè)約簡(jiǎn)集合構(gòu)建相應(yīng)的訓(xùn)練集和測(cè)試集,并將約簡(jiǎn)集合中的屬性值作為輸入指標(biāo),商品住宅需求(決策屬性)作為輸出指標(biāo),利用weka軟件中的分類(lèi)功能,采用決策樹(shù)(C4.5)算法、支持向量機(jī)(Support Vector Machine,SVM)和樸素貝葉斯(Naive Bayes,NB)分別對(duì)訓(xùn)練集進(jìn)行處理,再利用測(cè)試集計(jì)算在三類(lèi)算法下的分類(lèi)精度。最后根據(jù)約簡(jiǎn)后的分類(lèi)精度及屬性個(gè)數(shù),選取合適的鄰域半徑值,記錄對(duì)應(yīng)的屬性約簡(jiǎn)結(jié)果,完成模型的評(píng)估,輸出最佳約簡(jiǎn)結(jié)果,提取影響商品住宅需求的主要因素。
將約簡(jiǎn)后的商品住宅需求主要影響因素(輸入端)及商品住宅銷(xiāo)售量歷年數(shù)據(jù)(輸出端)放入BP神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,直到擬合優(yōu)度值接近 1,保存訓(xùn)練好的商品住宅需求預(yù)測(cè)訓(xùn)練模型。再基于灰色預(yù)測(cè)模型GM(1,1)預(yù)測(cè)商品住宅需求主要影響因素時(shí)序數(shù)據(jù),并通過(guò)計(jì)算后驗(yàn)差比C(C≤0.65)和小誤差概率p(0.70<p)來(lái)評(píng)定主要影響因素預(yù)測(cè)的精確度,訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)輸入端數(shù)據(jù)則為通過(guò)檢驗(yàn)的主要影響因素時(shí)序數(shù)據(jù),以此來(lái)預(yù)測(cè)未來(lái)年份商品住宅的需求量。
在此基礎(chǔ)上,對(duì)比普通BP預(yù)測(cè)模型(將全部影響因素作為BP神經(jīng)網(wǎng)絡(luò)輸入指標(biāo)預(yù)測(cè)商品住宅需求的模型)和NRS-BP預(yù)測(cè)模型(將約簡(jiǎn)后的關(guān)鍵商品住宅需求影響因素作為BP神經(jīng)網(wǎng)絡(luò)輸入指標(biāo)進(jìn)行商品住宅需求預(yù)測(cè)的模型)的預(yù)測(cè)平均相對(duì)誤差,從可靠性角度分析NRS-BP商品住房需求預(yù)測(cè)模型。
本文將江蘇省某市統(tǒng)計(jì)局有關(guān)商品住宅需求的數(shù)據(jù)作為選用對(duì)象,包括2005~2017年該市A區(qū)商品住宅需求影響因素a1~a15的數(shù)據(jù)和商品住宅銷(xiāo)售面積D等相關(guān)數(shù)據(jù),分析這16項(xiàng)數(shù)據(jù)得到圖2和圖3。
圖2 2005~2017年某市A區(qū)商品住宅需求全部影響因素統(tǒng)計(jì)圖
圖3 2005~2017年某市A區(qū)商品住宅銷(xiāo)售面積統(tǒng)計(jì)圖
由圖 2 可知,a1、a3、a4、a7、a8、a9、a12近年來(lái)持續(xù)增長(zhǎng),a10、a11、a14近年來(lái)逐漸下降,而a2、a5、a6、a13和a15變化不明顯。由圖3可知,某市A區(qū)商品住宅銷(xiāo)售面積在 2009年高達(dá) 490797m2,2009年之后持續(xù)下降,2014年達(dá)到近 5年最低(183817 m2),在此之后略有回升。
由分析模型第二步可知,鄰域δ大小會(huì)影響屬性約簡(jiǎn)的樣本數(shù)量,若δ過(guò)小,劃分到同一鄰域的樣本數(shù)量較少,商品住宅需求過(guò)多依靠該類(lèi)條件屬性,影響因素約簡(jiǎn)分類(lèi)的精度會(huì)變低,無(wú)法實(shí)現(xiàn)約簡(jiǎn)目標(biāo),因此選取適宜的δ有利于需求影響因素的約簡(jiǎn)。李靜等[14]在鄰域半徑的計(jì)算上考慮數(shù)據(jù)標(biāo)準(zhǔn)差,其計(jì)算公式為:
式中,Stdai指的是ai的標(biāo)差;λ為鄰域半徑δ計(jì)算參數(shù)。當(dāng)樣本量較小時(shí),λ取值盡可能在0.5~1.5之間,當(dāng)樣本量較大時(shí),λ取值可調(diào)大為2~4。
考慮到本文僅有 12年的樣本數(shù)據(jù),在實(shí)驗(yàn)的基礎(chǔ)上確定λ取值區(qū)間為0.5~1.15,同時(shí)確定重要度下限?閾值為0.01。在Matlab中運(yùn)算得到商品住宅需求影響因素約簡(jiǎn)結(jié)果(見(jiàn)表1),任意一個(gè)特征集合均可以作為商品住宅需求影響因素集。由表 1可知,當(dāng)λ取值為0.65時(shí),約簡(jiǎn)后的指標(biāo)個(gè)數(shù)最多,為9個(gè)影響因素。當(dāng)λ取值為1.15時(shí),約簡(jiǎn)后指標(biāo)個(gè)數(shù)僅為2個(gè),即認(rèn)為a4城鎮(zhèn)化率和a6家庭規(guī)模主要對(duì)商品住宅需求產(chǎn)生影響。
表1 影響商品住宅需求因素約簡(jiǎn)表
根據(jù)約簡(jiǎn)結(jié)果構(gòu)建14個(gè)決策系統(tǒng){s1,s2,…,s14},Si={Ri,D}(其中i=1,2,…,14),針對(duì)各決策系統(tǒng)Si,劃分訓(xùn)練集(用于建模)和測(cè)試集(用于評(píng)估),輸入指標(biāo)確定為Ri,商品住宅需求D作為輸出指標(biāo)分別輸入到 weka軟件中,選擇分類(lèi)精度和穩(wěn)定性都較好的C4.5、SVM和NB算法進(jìn)行十折交叉檢驗(yàn),分別計(jì)算三類(lèi)算法下的分類(lèi)精度值,各λ值參數(shù)下約簡(jiǎn)前后三類(lèi)算法的正確分類(lèi)比率和屬性約簡(jiǎn)個(gè)數(shù)結(jié)果如圖4和圖5所示。
圖4 ?=0.01下的分類(lèi)精度比較
圖5 ?=0.01下約簡(jiǎn)前后的屬性個(gè)數(shù)
由兩張圖可知,當(dāng)λ值為0.70,0.85和1.05時(shí),基于 C4.5算法分類(lèi)器計(jì)算得到的正確分類(lèi)比率為極值處,均大于64.39%(因素約簡(jiǎn)前平均正確分類(lèi)比率),選中的屬性個(gè)數(shù)分別為8、5和4,尤其當(dāng)λ值為0.70時(shí),正確分類(lèi)率達(dá)到最大為81.79%;當(dāng)λ值為0.70,0.80,0.95和1.10時(shí),基于NB分類(lèi)器的分類(lèi)準(zhǔn)確率均大于70%,選中的屬性個(gè)數(shù)分別為8、6、3和3,其中當(dāng)λ值為0.70時(shí),正確分類(lèi)率達(dá)到最大為76.53%;然而,在各λ取值下,基于SVM分類(lèi)器的正確分類(lèi)比率均小于64.39%(約簡(jiǎn)前平均正確分類(lèi)比率)。通過(guò)對(duì)比圖4和圖5可知,屬性集中的屬性數(shù)量增加并不會(huì)導(dǎo)致分類(lèi)準(zhǔn)確率的提升,例如約簡(jiǎn)后屬性個(gè)數(shù)最多時(shí)(λ值為0.65時(shí)),對(duì)應(yīng)的分類(lèi)準(zhǔn)確率小于基于 C4.5分類(lèi)器的最大正確分類(lèi)率。當(dāng)λ值較小時(shí),屬性值的增加提升了正確分類(lèi)比率,然而隨著屬性個(gè)數(shù)的增加,正確分類(lèi)比率不增反降。綜合考慮正確分類(lèi)比率和條件屬性個(gè)數(shù),決策系統(tǒng)S5在NB分類(lèi)器下的結(jié)果最好,分類(lèi)準(zhǔn)確率最高(81.79%),因素個(gè)數(shù)在約簡(jiǎn)后較少,因此S5為最佳約簡(jiǎn)情況,即商品住宅需求預(yù)測(cè)的關(guān)鍵影響因素為a1、a3、a4、a6、a8、a9、a11、a12。
在確定影響商品住宅需求的關(guān)鍵因素后,將2005~2017年某市A區(qū)8個(gè)關(guān)鍵影響因素?cái)?shù)據(jù)a1、a3、a4、a6、a8、a9、a11、a12作為 BP 神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn),將商品住宅需求作為輸出節(jié)點(diǎn),設(shè)置隱藏層為 3,利用歷年樣本數(shù)據(jù)訓(xùn)練 BP模型。訓(xùn)練結(jié)果顯示,停止時(shí)訓(xùn)練達(dá)到140次,訓(xùn)練過(guò)程中擬合優(yōu)度為0.93698,輸出值與目標(biāo)值相近,BP模型的訓(xùn)練效果良好,將模型進(jìn)行保存。
本文基于灰色預(yù)測(cè) GM(1,1)模型,利用Matlab軟件預(yù)測(cè)了2018~2022年某市A區(qū)商品住宅需求主要影響因素?cái)?shù)據(jù)(見(jiàn)表2)。而后,計(jì)算各影響因素預(yù)測(cè)后驗(yàn)差比C及小誤差概率p,均達(dá)到預(yù)測(cè)要求,各影響因素預(yù)測(cè)結(jié)果較為可靠。
表2 2018~2022年某市A區(qū)住宅需求的影響因素預(yù)測(cè)數(shù)據(jù)
將表2的數(shù)據(jù)作為輸入指標(biāo),輸入訓(xùn)練好的BP模型中,預(yù)測(cè)得到2018~2022年商品住宅銷(xiāo)售面積數(shù),分別為 266382 m2、266939 m2、269470 m2、274208 m2和 281659 m2。
通過(guò)比較普通BP預(yù)測(cè)模型及NRS-BP預(yù)測(cè)模型計(jì)算出的預(yù)測(cè)值與歷史值,二者平均相對(duì)誤差可以直觀(guān)顯示預(yù)測(cè)效果的差異(見(jiàn)表3)。由表可知,普通BP預(yù)測(cè)模型的平均相對(duì)誤差為27.70%,遠(yuǎn)大于NRS-BP預(yù)測(cè)模型的平均相對(duì)誤差7.85%,NRS-BP預(yù)測(cè)模型更接近真實(shí)值。
表3 普通BP預(yù)測(cè)值與NRS-BP預(yù)測(cè)值的結(jié)果匯總表
從模型構(gòu)建上來(lái)看,利用NRS-BP對(duì)因素約簡(jiǎn)可以有效去除原有影響因素之間的信息重疊,最大限度保留BP神經(jīng)網(wǎng)絡(luò)輸入端信息,從而提高預(yù)測(cè)模型的訓(xùn)練速度,進(jìn)一步說(shuō)明本文選取的 NRS-BP商品住宅需求預(yù)測(cè)模型相較于普通BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有更高的精度和效率。
本文基于NRS和BP神經(jīng)網(wǎng)絡(luò)提出一種預(yù)測(cè)商品住宅需求的方法,通過(guò)對(duì)某市A區(qū)算例分析,驗(yàn)證了本文提出的商品住宅需求預(yù)測(cè)模型精度較高且可行性較好。但由于國(guó)家宏觀(guān)調(diào)控政策及住宅需求中微觀(guān)層面因素對(duì)房地產(chǎn)市場(chǎng)的作用,部分年份的預(yù)測(cè)值可能會(huì)出現(xiàn)一定程度的波動(dòng),在今后的住房需求預(yù)測(cè)中,需要進(jìn)一步加強(qiáng)對(duì)政策影響的量化,同時(shí)不斷改進(jìn)微觀(guān)層面數(shù)據(jù)獲取的手段,將對(duì)住宅需求產(chǎn)生影響的各類(lèi)因素充分考慮在內(nèi)。