□浙江省自然資源廳信息中心 屠龍海
中國房地產(chǎn)市場政策是土地市場、金融市場、財稅體系的有機(jī)整體。自1998 年住房制度改革以來,房地產(chǎn)業(yè)經(jīng)過了20多年的飛速發(fā)展,成為中國經(jīng)濟(jì)的重要組成部分。房地資產(chǎn)也成為了政府和個人的重要資產(chǎn)。如何建立健全穩(wěn)健長效的房地產(chǎn)市場調(diào)控政策機(jī)制,確保地產(chǎn)市場平穩(wěn)健康發(fā)展,是一個需要持續(xù)深入研究的課題。國家通過建立地價監(jiān)測網(wǎng),按季度發(fā)布全國主要城市地價監(jiān)測報告,為國家土地市場宏觀調(diào)控提供依據(jù)。但是報告對具體城市的土地供應(yīng)和土地交易來說,因為一個城市的不同地段、不同區(qū)位的地塊在不同的時期都存在價格差異,因而缺乏具體價格指導(dǎo)。當(dāng)一個地塊上市交易時,無論政府一方還是參與交易的企業(yè)一方都想了解地塊的預(yù)期價格,政府通過設(shè)置交易底價保護(hù)國家利益,企業(yè)也會設(shè)定可接受的最高限價來保護(hù)企業(yè)的預(yù)期利益。目前,地價都是通過有經(jīng)驗的專業(yè)人員進(jìn)行評估來了解。專業(yè)人員在評估時存在一定的主觀性,不同人員評估的結(jié)果也可能存在較大的差異。本文探討了基于時空相關(guān)神經(jīng)網(wǎng)絡(luò)的地價預(yù)測模型的可行性,應(yīng)用人工智能技術(shù),建立以城市為單元的地價動態(tài)預(yù)測評估系統(tǒng),為當(dāng)?shù)赝恋厥袌龊暧^調(diào)控和供地地塊價格預(yù)測預(yù)估提供有力工具。
傳統(tǒng)的土地價格表現(xiàn)形式可以分為基準(zhǔn)地價和宗地地價兩種類型,基準(zhǔn)地價是某一期日的不同用途、不同級別的土地使用權(quán)區(qū)域平均價格,該價格僅僅能夠反映不同用途、不同級別的區(qū)域土地使用權(quán)的平均收益能力,而不能反映某一級別內(nèi)具體位置的土地價格。宗地地價是某一地塊在某一期日、某一特定權(quán)利條件下的土地使用權(quán)的價格。宗地地價雖然能夠得到每一塊宗地比較準(zhǔn)確合理的價格,但宗地地價的測算需要投入大量的人力、物力,耗費較多的時間。我們應(yīng)用土地網(wǎng)上交易的成果,以住宅用地的地價預(yù)測為例,將時間和空間作為主要因素,通過建立時空相關(guān)神經(jīng)網(wǎng)絡(luò)的宗地地價預(yù)測模型來探討供地地塊自動化價格預(yù)測預(yù)估的可行性。
影響住宅用地價格的因素包括規(guī)劃因素、商業(yè)因素、交通因素、基礎(chǔ)設(shè)施因素、環(huán)境因素、社會經(jīng)濟(jì)因素、人口因素、容積率、使用年限等等。在傳統(tǒng)的土地價格評估和預(yù)測中,需要選取影響因子組成因素因子指標(biāo)體系。如:在影響地價的商業(yè)因素中,選取商服中心作為影響因子;在交通因素中,選取客運站、主要道路、普通道路、公交站點作為影響因子;在基礎(chǔ)設(shè)施因素中,選取小學(xué)、初中、幼兒園、醫(yī)院作為影響因子;在環(huán)境因素中,選取公園作為影響因子等等。這些影響因素的選取和權(quán)重的制定都帶有人為因素,需要根據(jù)經(jīng)驗來制定。即使這樣,有些影響因素的參數(shù)獲取也十分困難,需要投入大量的人力、物力。
通過對影響地價因素的分析,我們發(fā)現(xiàn)很多因素都是空間相關(guān)的,也就是地塊位置確定了,這些因素的綜合影響也就確定了,我們稱為空間因素,這些空間因素可以打包在一起,用空間位置來表示:
空間因素={所在行政區(qū)政務(wù)服務(wù)因素,商業(yè)因素,交通因素,基礎(chǔ)設(shè)施因素,環(huán)境因素,……}=g(x,y)
(x,y)是地塊質(zhì)心位置坐標(biāo),g 表示函數(shù)關(guān)系。地塊位置確定后,空間因素的綜合影響也就確定了,我們無需了解單個因子的影響力,只要了解空間因素的綜合影響力。
還有一些影響因素是時間相關(guān)的,也就是交易的期日確定,這些因素也就確定了,比如社會經(jīng)濟(jì)因素(GDP、就業(yè)、人均收入等)、人口因素、宏觀調(diào)控因素等,我們稱為交易期日因素:
交易期日因素={GDP,就業(yè),人均收入,人口,宏觀調(diào)控政策,……}
另一類影響因素比較獨立,如:規(guī)劃用途,土地使用年限、容積率、出讓面積等。
我們認(rèn)為,土地網(wǎng)上交易價格是這些因素的綜合反映,當(dāng)然,對已成交的具體地塊的價格還受到參與者多少和參與者的能力的影響,但綜合所有交易地塊,還是能客觀反映土地的使用價值。因此,我們可以建立時空相關(guān)神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)算法,以土地網(wǎng)上交易價格來進(jìn)行訓(xùn)練學(xué)習(xí),獲得地價與影響因素之間的關(guān)系。即:
地塊地價=f(空間因素,土地使用年限,容積率,規(guī)劃用途,出讓面積,交易期日因素)
其中,空間因素隱含了空間相關(guān)的因素,我們用地塊質(zhì)心位置(x,y)變量來表示,而交易期日因素我們用交易期日相對于基期日期的月份差數(shù)來表示,如果以2006 年1 月1 日作為基期日期,則:
月份差數(shù)=DateDiff ("m","2006/1/1",交易日期)
Datediff 函數(shù)用于計算兩個日期之間存在的時間間隔數(shù)目,參數(shù)"m"表示計算月份之差。
地塊容積率反映了地塊可開發(fā)強(qiáng)度;
出讓面積反映了地塊可整體開發(fā)的程度;
地塊的土地使用年限反映了土地使用權(quán)的長短。
如果我們只研究一個城市的住宅用地地價,土地的規(guī)劃用途都是相同的,可以省略,那么單位面積住宅用地地價可表示為:
單位面積住宅用地地價=f(x,y,容積率,出讓面積,(剩余)使用年限,交易月份差數(shù))
這些數(shù)據(jù)在土地網(wǎng)上交易時都是公開的,很容易獲取。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡稱“ANN” )一般是指用計算機(jī)模擬人腦的結(jié)構(gòu),用許多的處理單元模擬生物的神經(jīng)元,用算法實現(xiàn)人腦的識別、記憶、思考過程。反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network,簡稱“BP 網(wǎng)絡(luò)”)不需要任何先驗公式,就能從已有數(shù)據(jù)中自動地歸納出規(guī)則,獲得這些數(shù)據(jù)的內(nèi)在規(guī)律,具有很強(qiáng)的非線性映射能力,能夠以一定的精度逼近復(fù)雜的非線性映射,特別適合于因果關(guān)系復(fù)雜的非確定性推理、判斷、識別和分類等問題的研究。它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差為最小,在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)模型都采用BP 網(wǎng)絡(luò)及其變化形式。而地價和其影響因素之間的復(fù)雜關(guān)系,很難用一定的函數(shù)來描述,因此利用BP 神經(jīng)網(wǎng)絡(luò)以其超強(qiáng)的學(xué)習(xí)和批處理能力作為多維非線性函數(shù)的通用數(shù)學(xué)模型的優(yōu)勢來模擬地價影響因素和地價的函數(shù),從而由地價的影響因素推導(dǎo)出地價。
神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)主要由輸入層、中間隱藏層和輸出層的神經(jīng)元組成。這里輸入層神經(jīng)元個數(shù)即為影響地價的因素,輸出神經(jīng)元即為預(yù)測地價,中間隱藏層層數(shù)和中間隱藏層神經(jīng)元數(shù)的選取很重要,如果神經(jīng)元太少,則網(wǎng)絡(luò)學(xué)習(xí)效果較差,如果太多,則訓(xùn)練時間較長,甚至還會出現(xiàn)網(wǎng)絡(luò)不收斂的情況。
我們要預(yù)測的變量是連續(xù)的地價,因此,這是一個回歸分析類問題。從前述分析可知,地價是一個與時間和空間相關(guān)的目標(biāo)函數(shù),在建立神經(jīng)網(wǎng)絡(luò)模型時,我們要將地塊的交易期日因素和空間位置因素作為輸入層的神經(jīng)元。基本目標(biāo)是將住宅用地地價建模為x 坐標(biāo),y 坐標(biāo),容積率,出讓面積,剩余使用年限,交易月份差的函數(shù)。
輸入層的參數(shù)包括:x 坐標(biāo)、y坐標(biāo)、容積率、出讓面積、(剩余)使用年限、交易月份差數(shù)。
輸出層:單位面積地塊地價:以元/平方米為單位,用作目標(biāo)。
1.數(shù)據(jù)集
第一步是準(zhǔn)備模型學(xué)習(xí)用的數(shù)據(jù)集,從土地交易數(shù)據(jù)中提取相關(guān)字段內(nèi)容,并進(jìn)行預(yù)處理。先去除不合理的數(shù)據(jù),用GIS 提取地塊的質(zhì)心坐標(biāo)。表示地塊位置的坐標(biāo)系統(tǒng)可以是球面坐標(biāo),也可以是平面坐標(biāo),只要能反映地塊的相對位置關(guān)系即可。容積率選取上限值,地塊單價(元/平米)=地塊交易價(萬元)/土地面積(公頃),用Excel輸入編輯處理后,保存為csv 格式文本文件,本例中變量(列)的數(shù)量為 7,實例(行)的數(shù)量為 516,見表1所示。
2.選擇神經(jīng)網(wǎng)絡(luò)架構(gòu)
第二步是選擇正確的神經(jīng)網(wǎng)絡(luò)架構(gòu)。對于宗地地價預(yù)測問題,我們建立一個包含七層的神經(jīng)網(wǎng)絡(luò)模型:輸入層、縮放層、兩個感知器層、取消縮放層、邊界層和輸出層。
自動化地價動態(tài)預(yù)測評估模型開發(fā)分為兩部分:神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)訓(xùn)練部分和地價預(yù)測評估部分。在神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)訓(xùn)練部分,我們基于OpenNN開發(fā),OpenNN是一個用C++編寫的開源類庫,它實現(xiàn)了神經(jīng)網(wǎng)絡(luò)建模。OpenNN 的主要優(yōu)點是其高性能,該庫在執(zhí)行速度和內(nèi)存分配方面表現(xiàn)出色,為神經(jīng)網(wǎng)絡(luò)算法和應(yīng)用的研究開發(fā)提供了一個有效的框架。OpenNN 主要由以下五部分組成。
表1 數(shù)據(jù)集內(nèi)容
數(shù)據(jù)集類:包含處理數(shù)據(jù)的實用程序。
神經(jīng)網(wǎng)絡(luò)類:匯集了所有不同類型的神經(jīng)網(wǎng)絡(luò)模型。
訓(xùn)練策略類:表示神經(jīng)網(wǎng)絡(luò)的訓(xùn)練策略的模型。
模型選擇類:表示 OpenNN 中模型選擇算法。它用于查找具有最大泛化能力的網(wǎng)絡(luò)體系結(jié)構(gòu)。
測試分析類:包含用于在不同學(xué)習(xí)任務(wù)中測試神經(jīng)網(wǎng)絡(luò)的工具。
自動化地價預(yù)測評估模型的神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)訓(xùn)練部分主要功能有裝入原始數(shù)據(jù),自動將數(shù)據(jù)實例(記錄行)按60%、20%和20%的比例隨機(jī)拆分為訓(xùn)練子集、選擇子集和測試子集;構(gòu)建七層神經(jīng)網(wǎng)絡(luò)架構(gòu);設(shè)置中間隱藏層的神經(jīng)元數(shù)量;構(gòu)建訓(xùn)練策略對象,設(shè)置訓(xùn)練策略:損失指數(shù)和優(yōu)化算法,這里損失指數(shù)采用均方差,優(yōu)化算法采用Adam 算法(適應(yīng)性矩估計),并進(jìn)一步設(shè)置優(yōu)化誤差范圍、最大疊代次數(shù)、最大疊代時間等。構(gòu)建測試分析對象,將神經(jīng)網(wǎng)絡(luò)輸出與數(shù)據(jù)集的測試實例中的相應(yīng)目標(biāo)進(jìn)行比較,評估模型,驗證模型的泛化性能;最后以xml 格式保存模型學(xué)習(xí)到的參數(shù)。神經(jīng)網(wǎng)絡(luò)模型在參數(shù)學(xué)習(xí)中,中間隱藏層的神經(jīng)元數(shù)量我們分別用10、20、30、50 和100進(jìn)行了試驗,在設(shè)置100 個神經(jīng)元時預(yù)測結(jié)果較好。
地價預(yù)測評估部分是應(yīng)用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的參數(shù)預(yù)測評估一塊新地的地價,包括在系統(tǒng)中裝入地價預(yù)測神經(jīng)網(wǎng)絡(luò)模型,將模型參數(shù)與地塊屬性字段參數(shù)進(jìn)行匹配,自動計算預(yù)測地價并保存在地塊屬性表中,一次可完成多個地塊的計算,以及地價預(yù)測評估趨勢分析模塊,如圖1 所示,屬性框中最后一列為應(yīng)用神經(jīng)網(wǎng)絡(luò)模型計算出來的預(yù)測地價。
▲圖1 自動化地價預(yù)測評估模型分析界面
▲圖2 地塊價格走向趨勢預(yù)測分析示意圖
地價預(yù)測評估趨勢分析模塊,用于了解地塊交易前后價格的變化,特別是要比較不同時期交易的地塊價格時,可以通過模型將地價歸算到同一時期的價格。圖2 是某一地塊在交易前兩年和交易后兩年的價格走向趨勢預(yù)測分析,圖3 展示了不同區(qū)域七個地塊在交易前兩年和交易后兩年的價格走向預(yù)測。地塊的價格在時空尺度上是有起伏的,不同時期不同區(qū)域的地塊有不同的價格曲線。
我們通過對歷史交易地塊的交易單價和預(yù)測價的分析,56.0%的地塊預(yù)測地價相對誤差在10%以內(nèi),92.4%地塊預(yù)測地價相對誤差在50%以內(nèi),見表2 和表3。
地價預(yù)測的準(zhǔn)確性,很大程度上取決于所收集地價相關(guān)數(shù)據(jù)的準(zhǔn)確性和現(xiàn)勢性,在日常的出讓地塊地價評估操作中,常常會遇到地價資料的不完整、相關(guān)參數(shù)的不易把握、方法確定的主觀性、不同方法估價結(jié)果差異過大等諸多問題,本文研究利用神經(jīng)網(wǎng)絡(luò)模型,通過對交易地價的學(xué)習(xí),實現(xiàn)了以一定的精度逼近復(fù)雜的非線性映射的能力。本模型與同類模型相比,最大的特點是采用時間和空間位置因素取代大量時空相關(guān)的因素,減少了搜集這些影響因子數(shù)據(jù)和權(quán)重評估的工作量,應(yīng)用時空相關(guān)的神經(jīng)網(wǎng)絡(luò)模型預(yù)測評估地價具有良好的效果,而且省時省力,可應(yīng)用于土地估價、出讓地塊的地價評估,對住宅用地監(jiān)測點地價的檢驗、土地市場精準(zhǔn)化調(diào)控也具有較大的參考價值。但由于受樣本數(shù)量的限制,檢驗過程中的控制誤差仍然較大,隨著學(xué)習(xí)樣本數(shù)量的不斷增加,通過神經(jīng)網(wǎng)絡(luò)模型預(yù)測的結(jié)果將會更加準(zhǔn)確。當(dāng)遇到政策調(diào)整,預(yù)測結(jié)果也需要加減政策影響因子,隨著政策調(diào)整后交易地塊價格的加入學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)模型也會學(xué)習(xí)到新的政策因素。因此,模型需要不斷進(jìn)行動態(tài)學(xué)習(xí)與動態(tài)預(yù)測。
▲圖3 多地塊價格走向預(yù)測分析
表2 地塊預(yù)測地價和相對誤差
表3 預(yù)測誤差統(tǒng)計表