朱琳 劉春
(四川建筑職業(yè)技術(shù)學(xué)院網(wǎng)絡(luò)管理中心 德陽(yáng) 618000)
造價(jià)預(yù)測(cè)對(duì)工程費(fèi)用、工程計(jì)劃等都有影響,在工程管理領(lǐng)域具有十分重要地位,因此工程造價(jià)預(yù)測(cè)一直是人們關(guān)注的焦點(diǎn)[1]。在工程造價(jià)預(yù)測(cè)過(guò)程中,由于受到多種因素的影響,工程造價(jià)預(yù)測(cè)的建模過(guò)程十分復(fù)雜,因此工程造價(jià)預(yù)測(cè)也是工程管理研究中的一個(gè)難點(diǎn),成為當(dāng)前一個(gè)重要的研究方向[2]。
針對(duì)工程造價(jià)預(yù)測(cè)問(wèn)題,國(guó)內(nèi)外許多學(xué)者和專家進(jìn)行了深入研究,提出許多工程造價(jià)預(yù)測(cè)模型[3~5]。當(dāng)前工程造價(jià)預(yù)測(cè)模型可以劃分為兩大類:傳統(tǒng)模型和現(xiàn)代模型,其中傳統(tǒng)模型主要包括定額法、工程量清單法等[6],其中定額法根據(jù)國(guó)家發(fā)布的預(yù)算定額對(duì)工程造價(jià)進(jìn)行預(yù)測(cè),該模型的工程造價(jià)預(yù)測(cè)結(jié)果不會(huì)過(guò)低或者過(guò)高,預(yù)測(cè)錯(cuò)誤較小,但是該方法沒(méi)有考慮市場(chǎng)競(jìng)爭(zhēng)因素、人為因素以及技術(shù)改進(jìn)因素,而且建模和預(yù)測(cè)的效率十分低,不適應(yīng)大工程的造價(jià)預(yù)測(cè)[7~8]。工程量清單法是針對(duì)定額法的不足提出來(lái)的,實(shí)際應(yīng)用中由于沒(méi)有考慮企業(yè)之間的惡性競(jìng)爭(zhēng),工程造價(jià)預(yù)測(cè)的誤差大,缺陷十分明顯[9~10]?,F(xiàn)代工程造價(jià)預(yù)測(cè)模型又劃分為兩類:線性模型和非線性模型,其中線性模型主要包括模糊數(shù)學(xué)模型、多元線性回歸模型,工程造價(jià)變化具有一定的隨機(jī)性和非線性,而線性模型不能刻畫(huà)工程造價(jià)的非線性變化特點(diǎn),工程造價(jià)預(yù)測(cè)誤差高[11]。非線性模型主要包括各種神經(jīng)網(wǎng)絡(luò)和支持向量機(jī),神經(jīng)網(wǎng)絡(luò)雖然具有很好的非線性擬合能力,但只有在訓(xùn)練樣本數(shù)量大的條件下才能展現(xiàn)出高精度的非線性擬合結(jié)果,當(dāng)訓(xùn)練樣本不足時(shí),工程造價(jià)的預(yù)測(cè)誤差大,同時(shí)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)又十分復(fù)雜,學(xué)習(xí)速度慢[12]。支持向量機(jī)沒(méi)有訓(xùn)練樣本數(shù)量大的限制條件,在訓(xùn)練樣本不足的情況下也可以得到較好的工程造價(jià)預(yù)測(cè)結(jié)果,但存在學(xué)習(xí)速度慢的缺陷[13~14]。最小二乘支持向量機(jī)是一種改進(jìn)的支持向量機(jī),克服了神經(jīng)網(wǎng)絡(luò)要求訓(xùn)練樣本數(shù)量大的缺陷,在許多非線性預(yù)測(cè)領(lǐng)域得到了成功的應(yīng)用,同時(shí)也為工程造價(jià)預(yù)測(cè)提供了一種新的建模工具[15]。
針對(duì)當(dāng)前工程造價(jià)預(yù)測(cè)模型存在的預(yù)測(cè)精度低、建模效率低等不足,提出了基于改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)模型,并采用在Matlab 2014R工具箱實(shí)現(xiàn)了工程造價(jià)預(yù)測(cè)的仿真對(duì)比實(shí)驗(yàn),結(jié)果表明,改進(jìn)支持向量機(jī)大幅度提高了工程造價(jià)預(yù)測(cè)精度,而且工程造價(jià)整體預(yù)測(cè)性能要明顯優(yōu)于對(duì)比模型,具有更高的實(shí)際應(yīng)用價(jià)值。
支持向量機(jī)具有良好的泛化能力,不存在神經(jīng)網(wǎng)絡(luò)等智能優(yōu)化算法存在的過(guò)擬合缺陷,但學(xué)習(xí)速度相當(dāng)慢,建模效率低,為此有學(xué)者提出了一種改進(jìn)的支持向量機(jī)——最小二乘支持向量機(jī)。相對(duì)于支持向量機(jī),最小二乘支持向量機(jī)的優(yōu)勢(shì)主要表現(xiàn)在:1)約束條件改為等式,簡(jiǎn)化了學(xué)習(xí)過(guò)程,學(xué)習(xí)速度明顯加快;2)誤差損失結(jié)果作為訓(xùn)練結(jié)果的評(píng)價(jià)指標(biāo),改善了回歸效果。對(duì)于樣本集:D={(xk,yk)|k=1,2,…N } ,采用徑向基函數(shù)作為最小二乘支持向量機(jī)的核函數(shù)Ψ(?,?),定義為
式中,σ表示核寬度。
從最小二乘支持向量機(jī)的工作過(guò)程可以發(fā)現(xiàn),其需要確定兩個(gè)參數(shù),而支持向量機(jī)回歸過(guò)程中需要確定3個(gè)參數(shù),最小二乘支持向量機(jī)的建模速度大幅度提升。最小二乘支持向量機(jī)的回歸目標(biāo)優(yōu)化函數(shù)為
其中,γ表示懲罰系數(shù),式(2)的約束條件為
為了解決式(2)問(wèn)題,引入拉格朗日乘子法建立如下等式:
式中,αk∈R為拉格朗日乘子。
式(4)優(yōu)化的條件是w,b,ek,αk的偏導(dǎo)數(shù)為零,即有
這樣式(4)可以轉(zhuǎn)變式(6)的求解過(guò)程。
根據(jù)Mercer理論和Ω=ZZT可以得到
最小二乘支持向量機(jī)的最優(yōu)回歸函數(shù)為
受到鳥(niǎo)群捕食行為的啟發(fā),有學(xué)者提出了粒子群優(yōu)化算法。每個(gè)粒子代表解空間中的一個(gè)解,粒子當(dāng)前搜索的最優(yōu)解為個(gè)體極值(pbest),而粒子群當(dāng)前搜索的最優(yōu)解為全局極值(gbest)。在實(shí)際應(yīng)用中,適應(yīng)度函數(shù)的值用于衡量粒子的優(yōu)劣程度,而且每個(gè)粒子均根據(jù)自身和群體極值不斷更新自己狀態(tài),從而產(chǎn)生新一代粒子群。
設(shè)粒子群中的粒子數(shù)為M,第i(i=1,2,…,M)個(gè)粒子的位置為xi,其當(dāng)前最優(yōu)位置為pbest[i],對(duì)應(yīng)的速度為vi,粒子群的當(dāng)前最好位置為g,那么在第t+1時(shí)刻,可以根據(jù)式(9)和(10)更新粒子i的狀態(tài):
式中,c1,c2為學(xué)習(xí)因子,r1和r2是[0,1]上的隨機(jī)數(shù);w為慣性權(quán)重,w的調(diào)整方式為
式中,iter表示迭代次數(shù)。
1)收集工程造價(jià)歷史數(shù)據(jù),由于歷史數(shù)據(jù)變化范圍大,對(duì)工程造價(jià)建模過(guò)程具有一定的干擾,為此做如下處理。
2)將處理后的工程造價(jià)數(shù)據(jù)劃分為兩部分:訓(xùn)練樣本和測(cè)試樣本,訓(xùn)練樣本用于改進(jìn)支持向量機(jī)的學(xué)習(xí),建立工程造價(jià)預(yù)測(cè)模型,測(cè)試樣本用于分析工程造價(jià)模型的泛化性能。
3)將訓(xùn)練樣本輸入到改進(jìn)支持向量機(jī)中進(jìn)行學(xué)習(xí)。
4)采用粒子群算法優(yōu)化改進(jìn)支持向量機(jī)的參數(shù)γ和σ的值,建立工程造價(jià)預(yù)測(cè)的回歸模型。
5)采用建立好的工程造價(jià)預(yù)測(cè)模型對(duì)工程造價(jià)的測(cè)試樣本進(jìn)行預(yù)測(cè),并分析工程造價(jià)預(yù)測(cè)模型的泛化性能。
基于改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)模型的工作流程如圖1所示。
圖1 改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)流程
采用某市2015-2018年的工程造價(jià)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),去掉一些無(wú)用數(shù)據(jù),共得到150個(gè)數(shù)據(jù)點(diǎn),工程造價(jià)數(shù)據(jù)具體如圖2所示。采用Matlab 2014R工具箱實(shí)現(xiàn)了工程造價(jià)預(yù)測(cè)的仿真實(shí)驗(yàn)。
圖2 實(shí)驗(yàn)數(shù)據(jù)
選擇最后50個(gè)樣本作為工程造價(jià)的測(cè)試樣本,其余工程造價(jià)樣本作為訓(xùn)練樣本,采用粒子群優(yōu)化算法確定改進(jìn)支持向量機(jī)的參數(shù)γ=100.175,σ=1.974,建立工程造價(jià)預(yù)測(cè)模型,然后對(duì)工程造價(jià)測(cè)試樣本進(jìn)行預(yù)測(cè),得到如圖3所示的預(yù)測(cè)結(jié)果。工程造價(jià)的預(yù)測(cè)偏差如圖4所示,對(duì)圖3和圖4的預(yù)測(cè)結(jié)果進(jìn)行分析可以清楚看出,改進(jìn)支持向量機(jī)可以描述工程造價(jià)的實(shí)際變化特點(diǎn),可以很好地捕捉工程造價(jià)的變化趨勢(shì),預(yù)測(cè)偏差相當(dāng)小,可以忽略不計(jì),從而得到了十分理想的工程造價(jià)預(yù)測(cè)結(jié)果。
圖3 改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)結(jié)果
圖4 改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)偏差
為了驗(yàn)證改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)結(jié)果優(yōu)越性,設(shè)計(jì)了幾種對(duì)比模型:1)支持向量機(jī)的工程造價(jià)預(yù)測(cè)模型(SVM);2)BP神經(jīng)網(wǎng)絡(luò)的工程造價(jià)預(yù)測(cè)模型(BPNN);3)多元線性回歸的工程造價(jià)預(yù)測(cè)模型(MLR)。全部工程造價(jià)預(yù)測(cè)模型的預(yù)測(cè)精度、預(yù)測(cè)誤差以及平均建模時(shí)間(秒,s)如表1所示,對(duì)表1的實(shí)驗(yàn)結(jié)果進(jìn)行分析,可以知道:
1)MLR的工程造價(jià)預(yù)測(cè)精度最低,預(yù)測(cè)誤差最大,這是因?yàn)镸LR是一種線性建模方法,只能描述工程造價(jià)的線性變化特點(diǎn),而無(wú)法描述工程造價(jià)的非線性變化特點(diǎn),預(yù)測(cè)結(jié)果不理想。
2)BPNN的工程造價(jià)預(yù)測(cè)精度也偏低,這主要是由于BPNN是一種基于大樣本的機(jī)器學(xué)習(xí)算法,預(yù)測(cè)結(jié)果不穩(wěn)定,出現(xiàn)了許多過(guò)擬合的工程造價(jià)預(yù)測(cè)結(jié)果,導(dǎo)致工程造價(jià)預(yù)測(cè)誤差偏大。
3)SVM的工程造價(jià)預(yù)測(cè)精度比較高,而且工程造價(jià)預(yù)測(cè)誤差相當(dāng)?shù)男?,但是平均建模時(shí)間長(zhǎng),使得工程造價(jià)預(yù)測(cè)的建模效率低。
4)改進(jìn)支持向量機(jī)的工程造價(jià)整體預(yù)測(cè)性能最優(yōu),相對(duì)于對(duì)比模型,具有十分明顯的優(yōu)越性,對(duì)比結(jié)果也驗(yàn)證了本文模型用于工程造價(jià)建模和預(yù)測(cè)的優(yōu)越性。
表1 與其它模型的工程造價(jià)預(yù)測(cè)結(jié)果對(duì)比
工程造價(jià)預(yù)測(cè)建模具有重要的實(shí)際應(yīng)用價(jià)值,針對(duì)當(dāng)前模型無(wú)法準(zhǔn)確描述工程造價(jià)非線性變化特點(diǎn)的局限性,提出了基于改進(jìn)支持向量機(jī)的工程造價(jià)預(yù)測(cè)模型,采用最小二乘支持向量機(jī)強(qiáng)大的非線性建模能力對(duì)工程造價(jià)的變化特點(diǎn)進(jìn)行擬合,并引入粒子群算法對(duì)工程造價(jià)預(yù)測(cè)模型的參數(shù)進(jìn)行在線性優(yōu)化,工程造價(jià)預(yù)測(cè)的仿真實(shí)驗(yàn)結(jié)果表明,改進(jìn)支持向量機(jī)可以準(zhǔn)確從工程造價(jià)歷史數(shù)據(jù)中挖掘到工程造價(jià)變化趨勢(shì),能夠獲得了高精度的工程造價(jià)預(yù)測(cè)結(jié)果,同時(shí)提高了工程造價(jià)的建模效率,整體性能要顯著優(yōu)于其它工程造價(jià)預(yù)測(cè)模型,在工程管理中具有廣泛的應(yīng)用前景。