樊文廣
摘 要: 成本預(yù)估是建筑工程管理中的一個重要研究方向,傳統(tǒng)模型無法精準(zhǔn)描述建筑工程造價的變化趨勢,導(dǎo)致建筑工程造價成本預(yù)估精度低,為此,設(shè)計了基于數(shù)據(jù)挖掘的建筑工程造價成本預(yù)估模型。建立建筑工程造價成本預(yù)估的數(shù)學(xué)模型,采用最小二乘支持向量機(jī)對建筑工程造價成本預(yù)估數(shù)學(xué)模型進(jìn)行求解,并采用改進(jìn)粒子群算法對模型再優(yōu)化,通過具體建筑工程造價成本預(yù)估實(shí)驗(yàn)對有效性進(jìn)行驗(yàn)證,數(shù)據(jù)挖掘提高了建筑工程造價成本預(yù)估的精度,且建筑工程造價成本預(yù)估性能要優(yōu)于當(dāng)前其他建筑工程造價成本預(yù)估模型。
關(guān)鍵詞: 建筑工程; 質(zhì)量管理; 成本預(yù)估; 數(shù)據(jù)挖掘; 數(shù)學(xué)模型; 工程造價
中圖分類號: TN911.1?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)07?0170?04
Data mining based estimation model of construction project cost
FAN Wenguang1, 2
(1. Tianjin University, Tianjin 300072, China; 2. Inner Mongolia Technical College of Construction, Hohhot 010020, China)
Abstract: The cost estimation is an important research direction in the construction project management. The traditional model can′t accurately describe the change tendency of the construction project cost, and has low estimation accuracy of construction engineering cost. Therefore, a data mining based estimation model of construction project cost was designed. The mathematical model of the construction project cost estimation was established. And then the least square support vector machine (SVM) is adopted to solve the mathematical model of the construction project cost estimation. The improved particle swarm optimization (PSO) algorithm is used to optimize the model. The concrete estimation experiment of construction project cost was performed to verify the effectiveness of the model. The data mining can improve the estimation accuracy of construction project cost, and the performance of the model is higher than that of other construction project cost estimation models.
Keywords: construction engineering; quality management; cost estimation; data mining; mathematical model; project cost
0 引 言
隨著經(jīng)濟(jì)的不斷發(fā)展,人們生活水平不斷提高,而住房水平是其中最為重要的一部分,使得大中小城市的建筑業(yè)發(fā)展迅速。由于材料、人工費(fèi)、管理費(fèi)用的不斷增加,建筑工程造價的成本也相應(yīng)增加,對建筑工程造價成本進(jìn)行預(yù)估,為工程管理者和企業(yè)提供有價值的信息成為當(dāng)前重要研究內(nèi)容[1?3]。
原始建筑工程造價成本預(yù)估主要通過一些管理人員根據(jù)統(tǒng)計學(xué)方法進(jìn)行,該過程十分復(fù)雜,極易出錯,導(dǎo)致建筑工程造價成本預(yù)估的誤差大,很難為建筑工程造價成本的管理者提供有效的信息[4]。多元線性回歸模型根據(jù)建筑工程造價成本的歷史數(shù)據(jù),對相似建筑工程造價成本進(jìn)行回歸和擬合,比人工方法的建筑工程造價成本預(yù)估結(jié)果更加可信,但多元線性回歸模型認(rèn)為建筑工程造價成本是一種固定的線性增加變化趨勢,這與實(shí)際情況不太相符,因?yàn)榻ㄖこ淘靸r成本是一種非線性變化系統(tǒng),不僅有一定的線性變化趨勢,同時具有一定的非線性波動,使得建筑工程造價成本預(yù)估精度有待進(jìn)一步提高[5]。人工神經(jīng)網(wǎng)絡(luò)具有智能學(xué)習(xí)能力,可以對建筑工程造價成本與其影響因素之間的關(guān)系進(jìn)行非線性擬合,從而描述建筑工程造價成本的變化趨勢,預(yù)測精度較高,但人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜,如何合理確定其結(jié)構(gòu)沒有統(tǒng)一的看法,且易得到“過擬合”的建筑工程造價成本預(yù)估結(jié)果[6]。數(shù)據(jù)挖掘技術(shù)是近幾年發(fā)展起來的一種非線性建模方法,其中支持向量機(jī)是一種最為常用的方法,可以對建筑工程造價成本變化趨勢進(jìn)行深度挖掘,準(zhǔn)確估計建筑工程造價成本與影響因素之間的聯(lián)系,泛化能力強(qiáng),成為建筑工程造價成本預(yù)估的主要工具[7?9]。但當(dāng)建筑工程造價成本的數(shù)據(jù)較多時,支持向量機(jī)的缺陷就體現(xiàn)出來了,出現(xiàn)學(xué)習(xí)速度比較慢,有時甚至無法實(shí)現(xiàn)的情況[10]。
最小二乘支持向量機(jī)是一種新型的數(shù)據(jù)挖掘技術(shù),學(xué)習(xí)速度快、泛化能力強(qiáng),針對當(dāng)前模型無法精準(zhǔn)描述建筑工程造價的變化趨勢,預(yù)估精度低的問題,提出基于數(shù)據(jù)挖掘的建筑工程造價成本預(yù)估模型(PSO?LSSVM),通過最小二乘支持向量機(jī)擬合建筑工程造價成本變化趨勢,結(jié)果表明,數(shù)據(jù)挖掘提高了建筑工程造價成本預(yù)估的精度,預(yù)估誤差小于其他建筑工程造價成本預(yù)估模型。
1 建筑工程造價成本預(yù)估的數(shù)學(xué)模型
建筑工程造價成本與許多因素相關(guān),如人工費(fèi)、材料等,設(shè)共有[n]個因素,它們可以表示為[xi,i=1,2,…,n,]建筑工程造價成本為[y],那么兩者之間的變化可以描述為:
式中[f(?)]表示建筑工程造價成本預(yù)估函數(shù),其直接影響到建筑工程造價成績預(yù)估的好壞。
2 數(shù)據(jù)挖掘的建筑工程造價成本預(yù)估模型
2.1 最小二乘支持向量機(jī)
設(shè)建筑工程造價成本的歷史樣本為[xi,yi,][xi∈Rn]為建筑工程造價成本的影響因素,即輸入向量,[yi∈R]表示相應(yīng)的建筑工程造價成本值,采用非線性映射[?(?)]對[xi]進(jìn)行映射,建立如下的建筑工程造價成績預(yù)估的回歸模型:
[y=f(x)=ω?(x)+b] (2)
從式(2)可知,在建立準(zhǔn)確建筑工程造價成績預(yù)估模型時,確定最優(yōu)的權(quán)向量[ω]和偏差[b,]根據(jù)結(jié)構(gòu)風(fēng)險最小化原理,引入松弛變量[ζi]將其變?yōu)榈仁郊s束的優(yōu)化問題,具體如下:
式中[γ]表示正則化參數(shù)。
采用拉格朗日函數(shù)對式(3)求解,建立如下的拉格朗日方程:
式中[αi(i=1,2,…,N)]表示拉格朗日乘子。
由Karush?Kuhn?Tucher條件通過變換能夠得到:
[0STSK+Ic bα=0Y] (5)
式中:[S=[1,1,…,1]Τ;][α=[α1,α2,…,αN];][Y=[y1,y2,…,yN];][K=?Τ(xk)?(xN)=K(xk,xN)]為核函數(shù),本文選擇的核函數(shù)具體如下:
[K(x,xi)=exp-x-xi22σ2] (6)
式中[σ2]表示核函數(shù)的寬度。
對式(6)進(jìn)行求解,得到基于最小二乘支持向量機(jī)的建筑工程造價成本預(yù)估模型為:
[f(x)=i=1NαiK(x,xi)+b] (7)
最小二乘支持向量機(jī)的結(jié)構(gòu)如圖1所示,每個中間節(jié)點(diǎn)對應(yīng)一個支持向量。
對最小二乘支持向量機(jī)的建筑工程造價成績建模過程進(jìn)行分析可知,參數(shù)[γ]和[σ2]影響建筑工程造價成本預(yù)估結(jié)果,為了提高建筑工程造價成本預(yù)估效果,采用粒子群算法確定參數(shù)[γ]和[σ2]的最優(yōu)值。
2.2 粒子群算法
粒子群算法是一種模擬鳥群飛行覓食行為的算法,問題潛在解可采用一個粒子代表,粒子根據(jù)問題的求解目標(biāo)確定適應(yīng)度函數(shù)值,適應(yīng)度函數(shù)值描述粒子位置的好壞,設(shè)[P]個粒子組成種群[s=s1,s2,…,si,…,sP],第[i1≤i≤P]個粒子的位置為[si=si1,si2,…,siD],[D]表示解空間的維數(shù),在第[t]次迭代時刻,速度向量為[vti=][vti1,vti2,…,vtiD],其最優(yōu)位置為[pti=pti1,pti2,…,ptiD],可以記為[pbest;]粒子群的最優(yōu)位置為[ptg=ptg1,ptg2,…,ptgD],可以記為[gbest;]粒子狀態(tài)更新公式為:
式中:[w]表示慣性權(quán)重;[d]表示粒子維數(shù);[c1]和[c2]為加速因子;[r1]和[r2]為[0,1]區(qū)間的隨機(jī)數(shù)。
慣性權(quán)重[w]影響局部和全局的搜索性能,為了提高算法的搜索能力,保證粒子的多樣性,采用自動調(diào)整的[w,]粒子多樣性函數(shù)定義為:
式中[fαi(t)]為第[i]個粒子的適應(yīng)度值。
[Fdiversity(t)]表示粒子的運(yùn)動特性,定義非線性函數(shù)[δt]為:
式中[L]為一常數(shù)。
慣性權(quán)重[w]調(diào)整規(guī)則方式為:
式中,[εti]表示粒子[i]與最優(yōu)粒子之間的距離,計算公式為:
式中[sti]為[t]時刻粒子[i]的位置。
2.3 數(shù)據(jù)挖掘的建筑工程造價成本預(yù)估步驟
數(shù)據(jù)挖掘的建筑工程造價成本預(yù)估步驟如下:
Step1:針對具體的建筑工程,通過相關(guān)資料收集其造價成本的歷史數(shù)據(jù),并對建筑工程造價成本數(shù)據(jù)做如下處理:
[x′i=xi-min(xi)max(xi)-min(xi)] (14)
Step2:初始化粒子的位置和速度,并確定它們的取值范圍,將最小二乘支持向量機(jī)的參數(shù)[γ]和[σ2]映射為粒子位置。
Step3:將建筑工程造價成本預(yù)估的訓(xùn)練樣本輸入到最小二乘支持向量機(jī)學(xué)習(xí),并對粒子位置向量進(jìn)行反編碼得到參數(shù)[γ]和[σ2]的值,通過訓(xùn)練得到每一個粒子的適應(yīng)度值。
Step4:確定每一個粒子的最優(yōu)位置[pti]和種群最優(yōu)位置[ptg]。
Step5:對慣性權(quán)重[w]進(jìn)行更新操作。
Step6:對粒子狀態(tài)進(jìn)行更新操作,產(chǎn)生新的粒子群。
Step7:通過訓(xùn)練樣本和最小二乘支持向量機(jī)對新的粒子群的適應(yīng)度值進(jìn)行計算。
Step8:看是否滿足結(jié)束條件,如不滿足,轉(zhuǎn)Step4繼續(xù)執(zhí)行。
Step9:根據(jù)[ptg]得到參數(shù)[γ]和[σ2]的值的全局最優(yōu)組合,對建筑工程造價成本訓(xùn)練樣本再次進(jìn)行學(xué)習(xí),建立建筑工程造價成本預(yù)估模型。
3 仿真實(shí)驗(yàn)
3.1 數(shù)據(jù)來源
選取某市的建筑工程造價成本數(shù)據(jù)進(jìn)行研究,共采集200組數(shù)據(jù),具體如圖2所示。對圖2的建筑工程造價成本數(shù)據(jù)變化趨勢進(jìn)行分析發(fā)現(xiàn),該數(shù)據(jù)具有明顯線性變化特點(diǎn),同時具有較強(qiáng)的非線性變化特點(diǎn),通過嵌入定理確定建筑工程造價成本數(shù)據(jù)的延遲時間[τ]和嵌入維數(shù)[m,]并建立如下的建筑工程造價成本的預(yù)估數(shù)學(xué)模型:
根據(jù)差分熵確定圖2中的建筑工程造價成本數(shù)據(jù)的延遲時間[τ=12,]嵌入維數(shù)[m=7,]最后50個數(shù)據(jù)作為建筑工程造價成本預(yù)估的測試樣本,其他為建筑工程造價成本預(yù)估的訓(xùn)練樣本。
利用最小二乘支持向量機(jī)構(gòu)建建筑工程造價成本預(yù)估模型之前,先采用粒子群算法確定參數(shù)[γ]和[σ2]的值,它們分別為[γ=100,][σ2=6.725,]粒子的個數(shù)為20,[c1=c2=2,]最大迭代次數(shù)為500。
3.2 結(jié)果及分析
針對相同建筑工程造價成本數(shù)據(jù)集,選擇BP神經(jīng)網(wǎng)絡(luò)(BPNN)、支持向量機(jī)(SVM)進(jìn)行對比測試,它們的建筑工程造價成本預(yù)估結(jié)果如圖3所示。從圖3可以看出,BP神經(jīng)網(wǎng)絡(luò)的建筑工程造價成本預(yù)估性能最差,而支持向量機(jī)和最小二乘支持向量機(jī)的建筑工程造價成本相差不大,兩者都獲得了比較理想的建筑工程造價成本預(yù)估結(jié)果。對BPNN,SVM,PSO?LSSVM的訓(xùn)練時間和測試結(jié)果如表1所示。從表1可以看出,SVM的建筑工程造價成本預(yù)估訓(xùn)練時間相當(dāng)長,建模效率極低,BP神經(jīng)網(wǎng)絡(luò)雖然建筑工程造價成本預(yù)估時間短,但是建筑工程造價成本預(yù)估誤差大,無法滿足建筑工程造價成本管理的實(shí)際應(yīng)用要求,而PSO?LSSVM的建筑工程造價成本預(yù)估速度快,而且建筑工程造價成本預(yù)估效果好,具有明顯的優(yōu)勢。
4 結(jié) 論
為了對建筑工程造價成本進(jìn)行準(zhǔn)確預(yù)測,通過數(shù)據(jù)挖掘技術(shù)對其進(jìn)行建模,并通過仿真實(shí)驗(yàn)得到如下結(jié)論:
1) 傳統(tǒng)方法不能高精度地擬合建筑工程造價成本變化趨勢,導(dǎo)致建筑工程造價成本預(yù)估誤差大。
2) 最小二乘支持向量機(jī)對建筑工程造價成本和影響因素之間的聯(lián)系進(jìn)行學(xué)習(xí),能夠有效挖掘其擬合趨勢,提高了建筑工程造價成本預(yù)估的準(zhǔn)確性。
3) 通過粒子群算法對建筑工程造價成本預(yù)估模型的參數(shù)進(jìn)行優(yōu)化,使得建立的模型更好地描述建筑工程造價成本的變化特點(diǎn),預(yù)估結(jié)果要明顯優(yōu)于其他建筑工程造價成本預(yù)估模型。
4) 該模型通用性強(qiáng),可以應(yīng)用于其他非線性系統(tǒng)中預(yù)測問題的研究,具有較廣的應(yīng)用前景。
參考文獻(xiàn)
[1] 陳鵬,劉亞南.建筑工程造價管理的現(xiàn)狀與對策[J].工業(yè)工程,2015,34(48):33?34.
CHEN Peng, LIU Yanan. Current situation and countermeasures of cost management of construction engineering [J]. Industrial engineering, 2015, 34(48): 33?34.
[2] 梁迅.建筑工程單方造價快速估算方法綜述[J].廣東工業(yè)大學(xué)學(xué)報,2012,9(3):107?110.
LIANG Xun. Review of the new methods of fast estimation of construction engineering unit square cost [J]. Journal of Guangdong University of Technology, 2012, 9(3): 107?110.
[3] 陳小龍,王立光.基于建筑設(shè)計參數(shù)分析模型的工程造價估算[J].同濟(jì)大學(xué)學(xué)報(自然科學(xué)版),2009,37(8):1115?1121.
CHEN Xiaolong, WANG Liguang. A study on estimating approach based on analysis model for design parameters of buildings [J]. Journal of Tongji University (natural science), 2009, 37(8): 1115?1121.
[4] 胡六星.基于時間序列的建筑工程造價預(yù)測研究[J].太原理工大學(xué)學(xué)報,2012,43(6):706?709.
HU Liuxing. Research on prediction of architectural engineering cost based on the time series method [J]. Journal of Taiyuan University of Technology, 2012, 43(6): 706?709.
[5] 牛東曉,乞建勛,邢棉.建筑工程造價預(yù)測的變結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)模型研究[J].華北電力大學(xué)學(xué)報,2001,28(4):1?4.
NIU Dongxiao, QI Jianxun, XING Mian. Researches on varied structure artificial neural network model for estimating building project cost [J]. Journal of North China Electric Power University, 2001, 28(4): 1?4.
[6] 許寧.基于模糊神經(jīng)網(wǎng)絡(luò)的建筑工程造價估計方法[J].江漢石油學(xué)院學(xué)報,2000,22(1):87?88.
XU Ning. Estimation method of construction cost based on fuzzy neural network [J]. Journal of Jianghan Petroleum Institute, 2000, 22(1): 87?88.
[7] 鄭周練,鄧紹江,高師嫻,等.建筑工程造價的模糊確定[J].重慶大學(xué)學(xué)報(自然科學(xué)版),2001,24(1):55?58.
ZHENG Zhoulian, DENG Shaojiang, GAO Shixian, et al. Fuzzy estimation on cost of project [J]. Journal of Chongqing University (natural science edition), 2001, 24(1): 55?58.
[8] 孟俊娜,梁巖,房寧.基于BP神經(jīng)網(wǎng)絡(luò)的民用建筑工程造價估算方法研究[J].建筑經(jīng)濟(jì),2015,36(9):64?68.
MENG Junna, LIANG Yan, FANG Ning. Research on civil construction project cost estimation method based on BP neural network [J]. Construction economy, 2015, 36(9): 64?68.
[9] 胡曉娟.多元線性回歸模型參數(shù)的STLS估計法及其在工程造價預(yù)測中的應(yīng)用[J].四川建筑科學(xué)研究,2016,42(4):142?147.
HU Xiaojuan. Structured total least squares method for multivariable linear regression model and its application in enginee?ring cost prediction [J]. Building science research of Sichuan, 2016, 42(4): 142?147.
[10] 劉繼業(yè),陳西宏,劉強(qiáng),等.基于改進(jìn)粒子群優(yōu)化LSSVM的衛(wèi)星鐘差預(yù)報研究[J].宇航學(xué)報,2013,34(11):1509?1515.
LIU Jiye, CHEN Xihong, LIU Qiang, et al. The improved particle swarm optimization LSSVM satellite clock error prediction based on [J]. Journal of astronautics, 2013, 34(11): 1509?1515.