宋曉華,汪 鵬,張 露,寇英芳
(1. 華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 102206;2. 華北電力大學(xué)新能源電力與低碳發(fā)展研究北京市重點(diǎn)實(shí)驗(yàn)室,北京 102206;3. 國網(wǎng)北京市電力公司,北京 100031)
近年來,電網(wǎng)輸電工程建設(shè)的規(guī)模和強(qiáng)度持續(xù)增加,對(duì)工程造價(jià)提出了更為嚴(yán)格的要求[1]。高效、精確地預(yù)測輸電工程造價(jià),對(duì)電網(wǎng)造價(jià)精細(xì)化控制、基建投資效益提升具有重要意義[2]。國內(nèi)針對(duì)輸電工程造價(jià)預(yù)測仍然存在一些不足。文獻(xiàn)[3]從人力運(yùn)輸?shù)慕嵌确治銎鋵?duì)造價(jià)以及各部分工程造價(jià)比例的影響。文獻(xiàn)[4]將地質(zhì)劃分與輸電工程定額對(duì)應(yīng),并開展了地質(zhì)劃分對(duì)造價(jià)影響分析。文獻(xiàn)[5]從風(fēng)速、覆冰等角度對(duì)架空輸電工程造價(jià)敏感因素進(jìn)行了理論分析,但并未考慮不同工程參數(shù)下工程量之間的差異。文獻(xiàn)[6]對(duì)甘肅地區(qū)±800千伏特高壓線路造價(jià)影響因素指標(biāo)進(jìn)行相關(guān)性分析,篩選影響造價(jià)的關(guān)鍵指標(biāo),但并未對(duì)指標(biāo)非線性關(guān)系進(jìn)行深入研究。文獻(xiàn)[7]提出討論K-Means聚類、層次聚類、模糊聚類3種聚類方法,所提出的方法針對(duì)非線性相關(guān)性指標(biāo)聚類效果不佳。文獻(xiàn)[8]構(gòu)建輸電工程造價(jià)指數(shù),采用灰色預(yù)測模型開展預(yù)測,考慮人材機(jī)價(jià)格動(dòng)態(tài)變化,但并未兼顧施工水平對(duì)造價(jià)的影響。文獻(xiàn)[9]提出采用灰關(guān)聯(lián)分析與粒子群優(yōu)化的支持向量回歸模型,對(duì)工程造價(jià)進(jìn)行預(yù)測。綜上所述,目前的研究關(guān)注單一參數(shù)的影響分析,并未考慮構(gòu)建綜合的預(yù)測指標(biāo)體系。針對(duì)指標(biāo)體系重疊信息的處理,多考慮線性指標(biāo)的降維,而未充分考慮如何同時(shí)處理線性、非線性工程量指標(biāo)信息重疊問題。利用灰色關(guān)聯(lián)算法進(jìn)行優(yōu)選時(shí),多采用算數(shù)均值進(jìn)行關(guān)聯(lián)度計(jì)算,未考慮指標(biāo)之間的信息差異及設(shè)備材料價(jià)格隨時(shí)間的動(dòng)態(tài)變化。因此,本文提出基于TSNE及改進(jìn)灰色關(guān)聯(lián)的輸電工程造價(jià)預(yù)測模型。首先,從多元工程參數(shù)、工程量指標(biāo)體系構(gòu)建影響工程造價(jià)的指標(biāo)體系。其次,提出TSNE流行可視化降維方法,將高維工程量指標(biāo)數(shù)據(jù)分布映射到低維流行結(jié)構(gòu)。在此基礎(chǔ)之上,建立改進(jìn)灰色關(guān)聯(lián)度的量價(jià)雙維時(shí)空相似特征優(yōu)選模型:在空間維度上,考慮工程參數(shù)及工程量指標(biāo)的相似程度;在時(shí)間維度上,考慮人材機(jī)及設(shè)備價(jià)格隨時(shí)間的動(dòng)態(tài)變化。此外,考慮到我國輸電工程造價(jià)構(gòu)成主要基于定額體系,兼顧施工生產(chǎn)力水平差異,基于造價(jià)統(tǒng)計(jì)分布特性,采用abm方法對(duì)優(yōu)選后的樣本工程造價(jià)進(jìn)行均值特性強(qiáng)化,使之能更好體現(xiàn)平均造價(jià)水平。最后,進(jìn)行仿真,驗(yàn)證模型的有效性。
輸電工程本體造價(jià)由基礎(chǔ)工程、桿塔工程、接地工程、架線工程、附件工程、輔助工程六個(gè)單位工程構(gòu)成[10]。工程參數(shù)、工程量指標(biāo)共同影響輸電工程造價(jià)。其中,接地工程、輔助工程只占本體工程造價(jià)的2%-4%,費(fèi)用占比較小,對(duì)工程量指標(biāo)進(jìn)行初步篩選,剔除接地土方、排水溝等對(duì)本體工程造價(jià)影響不大的工程量指標(biāo),形成輸電工程造價(jià)預(yù)測指標(biāo)體系,如圖1。
圖1 輸電工程造價(jià)預(yù)測指標(biāo)體系
對(duì)110kV輸電工程造價(jià)指標(biāo)進(jìn)行相關(guān)性分析,結(jié)果如圖2。
圖2 樣本數(shù)據(jù)變量散點(diǎn)圖矩陣圖
從圖2分析,基礎(chǔ)鋼材(V1)、基礎(chǔ)混凝土(V2)、基礎(chǔ)開方(V3)、桿塔鋼材(V4)等指標(biāo)之間存在一定程度的線性相關(guān),其它指標(biāo)存在非線性相關(guān)。因此,需要對(duì)指標(biāo)進(jìn)行降維處理,消除指標(biāo)數(shù)據(jù)的重疊信息。主成分分析(PCA)是一種常見的指標(biāo)降維處理方法,可以解決指標(biāo)之間的共線性問題,但PCA屬于線性降維的方法,對(duì)非線性指標(biāo)處理效果不佳。流行可視化降維算法能夠較好地在低維空間采用可視化的方式表達(dá)高維指標(biāo)數(shù)據(jù)的內(nèi)部結(jié)構(gòu)關(guān)系。典型的流可視化降維方法有隨機(jī)鄰域嵌入(SNE)、T分布隨機(jī)鄰域嵌入(TSNE)等。SNE存在樣本數(shù)部分布擁擠問題,TSNE采用聯(lián)合概率表示點(diǎn)對(duì)應(yīng)的相似度,通過優(yōu)化兩個(gè)分布之間的距離散度,得到低維空間的樣本分布,能夠有效解決數(shù)據(jù)擁擠問題。由此,本文提出基于TSNE的工程量指標(biāo)降維處理算法。
2.2.1 TSNE降維算法的基本原理
1)SNE算法的基本原理
設(shè)工程量指標(biāo)的高維數(shù)據(jù)點(diǎn)為X=(x1,x2…,xn),低維映射Y=(y1,y2…,yn)。
高維空間、低維空間的概率可以表示為pi|j、qj|i,計(jì)算公式如(1)、(2)所示。
(1)
(2)
為衡量高維工程量指標(biāo)空間和低維工程量指標(biāo)空間的相似程度,引入代價(jià)函數(shù)KL散度,計(jì)算公式為:
(3)
將代價(jià)函數(shù)對(duì)低維氣象點(diǎn)進(jìn)行求導(dǎo)得:
(4)
2)TSNE算法的基本原理
TSNE將低維指標(biāo)數(shù)據(jù)Y和原始高維指標(biāo)數(shù)據(jù)X的條件概率改進(jìn)為對(duì)稱的聯(lián)合概率密度,即
pi|j=pj|i,qj|i=qi|j
(5)
計(jì)算高維之間的聯(lián)合概率密度
(6)
低維樣本的聯(lián)合概率密度
(7)
建立新的代價(jià)函數(shù)為
(8)
對(duì)代價(jià)函數(shù)C進(jìn)行尋優(yōu),更新規(guī)則為
(9)
式中,Y(t)是低維空間的樣本數(shù)據(jù),t是迭代次數(shù),η表示學(xué)習(xí)率,α(t)為動(dòng)量因子。
2.2.2 PCA、TSNE仿真
為了驗(yàn)證TSNE對(duì)工程量指標(biāo)的降維效果。對(duì)工程量指標(biāo)分別采用PCA、TSNE算法進(jìn)行降維計(jì)算。
圖3 PCA和TSNE算法仿真對(duì)比
對(duì)比分析圖3,與PCA降維效果相比,TSNE算法對(duì)四個(gè)電壓等級(jí)的樣本工程實(shí)現(xiàn)了較好的分類,各個(gè)電壓等級(jí)的樣本邊界明晰,算法降維效果較好。
基于工程參數(shù)指標(biāo)以及工程量指標(biāo)(不降維、PCA降維、TSNE降維)形成新的預(yù)測體系,新的預(yù)測指標(biāo)體系為
F=(F1,F(xiàn)2,…,F(xiàn)j) (j=1,2,…,p)
(10)
令F=Gi=(gi(1),gi(2),…gi(j)),其中,i=0,1,…n,j=1,2…p。計(jì)算灰色關(guān)聯(lián)系數(shù),如式(11)所示
(11)
其中
Δqj=|g0(j)-gq(j)|
Δmin=minqminjΔqj,Δmax=maxqmaxjΔqj
式(11)中,ρ為分辨系數(shù)。利用熵值法及權(quán)重計(jì)算公式如式(12)、(13)所示。
(12)
(13)
熵權(quán)修正的灰色關(guān)聯(lián)度計(jì)算公式為
(14)
時(shí)間因子權(quán)重系數(shù)計(jì)算方法為
(15)
式(15)中,tq為待預(yù)測工程施工日期與第q個(gè)樣本工程施工日期之間的天數(shù);int為取整運(yùn)算符;α1、α2、α3分別為日衰減、周衰減和年衰減系數(shù);N1、N2、N3為常數(shù)。經(jīng)過時(shí)間因子修正以后的灰色關(guān)聯(lián)度為
R0q=r0qf0q
(16)
將灰色關(guān)聯(lián)度模型優(yōu)選后的樣本造價(jià)進(jìn)行算數(shù)平均處理是常見的一種均值處理方法,考慮到我國輸電工程安裝費(fèi)用計(jì)算基于定額體系,定額消耗量反映的是社會(huì)平均施工生產(chǎn)力水平[10],為兼顧先進(jìn)施工生產(chǎn)力水平與落后施工生產(chǎn)力水平差異,本文提出基于統(tǒng)計(jì)分布的造價(jià)均值強(qiáng)化算法。
2.4.1 輸電工程本體投資統(tǒng)計(jì)分布分析
對(duì)110kV輸電工程造價(jià)進(jìn)行研究,繪制造價(jià)散點(diǎn)圖及高斯分布,如圖4所示。
圖4 110kV輸電工程造價(jià)散點(diǎn)圖及高斯分布
由圖4,可以判別其大致屬于正態(tài)分布。為了進(jìn)一步驗(yàn)證正態(tài)分布假設(shè),本文采用夏皮羅-威爾克進(jìn)行檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量為0.9803、P值為0.0797,統(tǒng)計(jì)量接近于1,P值顯著大于0.05,無法拒絕其符合正態(tài)分布。同理,對(duì)220kV、330kV、500kV輸電工程本體造價(jià)進(jìn)行檢驗(yàn),結(jié)果也表明其服從正態(tài)分布規(guī)律。
2.4.2 abm均值強(qiáng)化算法
將改進(jìn)灰色關(guān)聯(lián)算法優(yōu)選后的工程造價(jià)數(shù)據(jù)按大小順序排列,求出該組數(shù)據(jù)的算術(shù)平均值,此即一般值m,表示樣本集所代表的平均造價(jià)水平。根據(jù)二次平均法的原理,再對(duì)該組數(shù)據(jù)中小于m的值求算數(shù)平均得到x3,對(duì)該組數(shù)據(jù)中大于m的值求平均得到x4。定義先進(jìn)值a為一般值m和平均值x3的算術(shù)平均值,先進(jìn)值表示輸電工程造價(jià)水平較低者的平均水平;同理,保守值b為一般值m和x4和平均值的算術(shù)平均值,表示輸電工程造價(jià)水平較高者的平均水平。
(17)
根據(jù)正態(tài)分布的規(guī)律來分析,先進(jìn)值、一般值、保守值占全部數(shù)據(jù)的比例大致接近1:4:1,均值計(jì)算方法如式(18)所示。
(18)
收集我國各省區(qū)已經(jīng)完成結(jié)算的204項(xiàng)110kV-500kV輸電工程造價(jià)作為數(shù)據(jù)樣本。從三個(gè)方面進(jìn)行仿真分析:1)分析灰色關(guān)聯(lián)與改進(jìn)灰色關(guān)聯(lián)模型預(yù)測誤差,驗(yàn)證改進(jìn)灰色關(guān)聯(lián)模型的預(yù)測效果。2)分析TSNE、PCA與灰色關(guān)聯(lián)、改進(jìn)灰色關(guān)聯(lián)結(jié)合下的預(yù)測誤差,驗(yàn)證TSNE降維算法對(duì)預(yù)測效果提升作用。3)分析不同電壓等級(jí)輸電工程預(yù)測誤差,驗(yàn)證預(yù)測方法針對(duì)不同對(duì)象的預(yù)測效果。
1)灰色關(guān)聯(lián)與改進(jìn)灰色關(guān)聯(lián)模型對(duì)比仿真
將傳統(tǒng)灰色關(guān)聯(lián)模型+算數(shù)均值預(yù)測模型和本文提出的改進(jìn)灰色關(guān)聯(lián)模型+算數(shù)均值、改進(jìn)灰色關(guān)聯(lián)+abm均值模型的預(yù)測效果進(jìn)行對(duì)比分析,研究對(duì)象為110kV輸電工程,改進(jìn)灰色關(guān)聯(lián)輸入的工程量指標(biāo)不作降維處理。由圖5,改進(jìn)灰色關(guān)聯(lián)+abm均值的預(yù)測模型數(shù)據(jù)對(duì)真實(shí)值擬合程度更好。
圖5 灰色關(guān)聯(lián)模型與改進(jìn)灰色關(guān)聯(lián)模型預(yù)測仿真
計(jì)算平均絕對(duì)百分比誤差(tMAPE),計(jì)算結(jié)果如表1所示。
表1 灰色關(guān)聯(lián)與改進(jìn)灰色關(guān)聯(lián)模型仿真誤差結(jié)果
改進(jìn)灰色關(guān)聯(lián)模型+算數(shù)均值誤差較傳統(tǒng)灰色關(guān)聯(lián)模型+算數(shù)均值降低2.81%,表明改進(jìn)灰色關(guān)聯(lián)方法能夠有效提升預(yù)測精度,這得益于改進(jìn)灰色關(guān)聯(lián)方法在工程參數(shù)及工程量相似特征篩選的基礎(chǔ)上,進(jìn)一步挖掘了不同工程之間人工、材料、機(jī)械以及設(shè)備價(jià)格隨時(shí)間的動(dòng)態(tài)變化。
改進(jìn)灰色關(guān)聯(lián)模型+abm均值較改進(jìn)灰色關(guān)聯(lián)模型+算數(shù)均值誤差降低0.82%,表明abm均值較算數(shù)均值能夠提高一定的預(yù)測精度,這是因?yàn)閍bm均值方法基于統(tǒng)計(jì)分布規(guī)律,兼顧了施工生產(chǎn)力水平差異,更符合輸電工程造價(jià)實(shí)際情況。
在工程量指標(biāo)不降維的情況下,改進(jìn)灰色關(guān)聯(lián)+abm均值模型誤差較另外兩種方法最低,預(yù)測效果相對(duì)較好,但部分樣本點(diǎn)的預(yù)測值與結(jié)算實(shí)際值偏差較大,且不滿足輸電工程造價(jià)5%-8%的誤差要求,預(yù)測精度仍有提升空間。
2)不同降維方法下的模型對(duì)比仿真
本節(jié)將PCA、TSNE降維算法與灰色關(guān)聯(lián)模型+算數(shù)均值、改進(jìn)灰色關(guān)聯(lián)模型+算數(shù)均值、改進(jìn)灰色關(guān)聯(lián)+abm均值模型結(jié)合,并進(jìn)行仿真分析,結(jié)果如圖6所示。
圖6 融合降維算法的灰色關(guān)聯(lián)、改進(jìn)灰色關(guān)聯(lián)預(yù)測仿真
計(jì)算各預(yù)測模型的平均絕對(duì)百分比誤差,計(jì)算結(jié)果如表2、表3所示。
表2 PCA+灰色關(guān)聯(lián)、改進(jìn)灰色關(guān)聯(lián)模型仿真誤差結(jié)果
表3 TSNE+灰色關(guān)聯(lián)、改進(jìn)灰色關(guān)聯(lián)模型仿真誤差結(jié)果
對(duì)比分析表1、2、3,采用PCA、TSNE降維算法均能提升預(yù)測精度,這是因?yàn)榻稻S能夠有效降低工程量指標(biāo)中的信息重疊,提升灰色關(guān)聯(lián)或改進(jìn)灰色關(guān)聯(lián)對(duì)多維指標(biāo)向量的適應(yīng)性。同時(shí),由于TSNE對(duì)非線性數(shù)據(jù)的處理效果較佳,降維效果比PCA的更好。
本文提出的TSNE+改進(jìn)灰色關(guān)聯(lián)+abm均值模型預(yù)測誤差為3.19%,且多數(shù)樣本的預(yù)測值與結(jié)算實(shí)際值誤差小于5%,誤差較為集中,模型預(yù)測效果最為理想。
3)220kV、330kV、500kV輸電工程造價(jià)預(yù)測對(duì)比仿真
計(jì)算得到三個(gè)電壓等級(jí)輸電工程造價(jià)預(yù)測平均絕對(duì)百分比誤差分別為2.91%、2.74%、2.56%。結(jié)果表明,本文提出的方法針對(duì)不同電壓等級(jí)的輸電工程也具有較好的預(yù)測效果。
本文構(gòu)建了輸電工程造價(jià)預(yù)測指標(biāo)體系,設(shè)計(jì)了基于TSNE的工程量指標(biāo)降維算法,建立了基于改進(jìn)灰色關(guān)聯(lián)度的量價(jià)雙維時(shí)空相似特征優(yōu)選模型,提出了基于abm的均值強(qiáng)化算法。仿真結(jié)果表明,110kV、220kV、330kV、500kV輸電工程造價(jià)預(yù)測值與結(jié)算實(shí)際值的誤差分別為3.19%、2.91%、2.74%、2.56%,具有較好的預(yù)測效果。