齊 霞, 王綿斌, 張 妍, 王建軍, 張曉曼
(1. 國網(wǎng)冀北電力有限公司 經(jīng)濟技術研究院,北京 100045; 2.華北電力大學 經(jīng)濟與管理學院,北京 102206)
高維小樣本條件下的變電工程造價預測研究
齊 霞1, 王綿斌1, 張 妍1, 王建軍2*, 張曉曼1
(1. 國網(wǎng)冀北電力有限公司 經(jīng)濟技術研究院,北京 100045; 2.華北電力大學 經(jīng)濟與管理學院,北京 102206)
利用因子分析方法對影響輸變電工程的因素進行了篩選,建立適合小樣本條件下的概算估算模型.通過某地區(qū)的實例分析,證實了提出方法的有效性.
輸變電工程;造價預測;小樣本
為應對環(huán)境污染以及全球資源日趨減少等問題,社會對節(jié)能減排、環(huán)境友好型新能源的發(fā)展與探究等要求日益提高,因此,對作為清潔電能運輸保障基礎的輸變電工程的要求也不斷增強.在輸變電工程建設環(huán)節(jié),如何控制輸變電工程造價問題是一個非常重要的問題.然而,由于輸變電工程涉及的因素眾多,使得審核人員在審核輸變電工程造價時,能夠參考的可類比的輸變電工程十分有限.目前的審核中,多是依靠審核人員的相關經(jīng)驗進行主觀上的推測,缺乏科學定量化的手段進行估算.因此,研究高維小樣本條件下的輸變電工程造價估算問題,輔助輸變電工程造價管理控制成為一個研究熱點.在小樣本的條件下,對研究對象進行預測的一個思路是在原有的樣本條件下盡可能地利用已有樣本的信息進行擴展,得到適合統(tǒng)計模型的樣本量,對研究對象進行建模預測.但是有學者研究指出,基于大量統(tǒng)計樣本的預測模型,如線性回歸、神經(jīng)網(wǎng)絡等不再適用,并且在多屬性的情況下首先需要做的工作是降維[1-2].很多學者對小樣本數(shù)據(jù)預測建模進行了研究,如灰色預測模型[3-4],支持向量機模型[5]等.上述研究均取得了不錯的成果,但是目前對于輸變電工程造價的小樣本預測估算問題還很少見到.由于在實際輸變電工程造價時,不同線路電壓等級、地形、出線方式、建設規(guī)模等因素均會造成工程造價的較大偏差,因此,在某工程造價估算審核時,將使得審核人員的可參照類比工程有限,需要建立高維小樣本條件下的估算模型幫助審核人員給出該工程造價的審核參考值.本文以輸變電工程中的變電工程為研究對象,構建了高維小樣本條件下的變電工程造價預測估算模型.首先采用因子分析方法中的主成分分析方法對影響變電工程造價的高維情況進行降維處理,在此基礎上,構建適用于小樣本條件下的支持向量機預測模型對變電工程造價進行估算,為變電工程的造價控制提供借鑒.
1.1 高維小樣本條件下變電工程造價預測思路
輸變電工程造價可以分為兩類,包括輸電線路工程造價數(shù)據(jù)和變電工程造價數(shù)據(jù),其中變電工程指的是在輸變電工程中對變電站進行建設的工程,其造價包括安裝工程費用、建筑工程費用和其他費用三個部分.安裝工程包括主變安裝、配電安裝、無功、控制、通信、遠動、電纜接地等工程,建筑工程包括主變、配電相關建筑、供水系統(tǒng)等.影響整個變電工程的造價環(huán)節(jié)眾多,每個環(huán)節(jié)控制造價的因素眾多.因此,往往在收集一個工程項目數(shù)據(jù)時,其屬性有近百個,加上影響整個變電工程造價的變電規(guī)模、建筑規(guī)模、電壓等級等,影響變電工程的因素更加復雜,對某個變電工程造價進行估算控制時,可類比的工程偏少.在此種情況下,應該首先對變電工程造價的歷史數(shù)據(jù)進行降維處理,然后利用降維后的因素對造價的歷史數(shù)據(jù)進行分類,在分類的基礎上對其進行小樣本條件下的預測建模工作,從而得出預測結果.
1.2 利用主成分分析方法進行降維處理
對影響因素進行分析的方法簡稱為因素分析法,該方法是利用相關方法(多為統(tǒng)計方法)對研究對象和相關影響因素之間的影響程度進行定量化的分析.因素分析法分為單個因素分析法和多因素分析法等,在屬性篩選上應用得較為廣泛.較為常用的因素分析法有主成分分析法.
對數(shù)據(jù)降維處理較為常用的方法是主成分分析法.主成份分析法化繁為簡,借助線性轉換,經(jīng)過投射的方法將高維數(shù)據(jù)轉化到低維空間中去處理,通過轉換能夠刪減重復,并在保留大部分原屬性信息的條件下精簡屬性.主成分分析法在經(jīng)投射形成的坐標中,以原始數(shù)據(jù)方差為依據(jù),將其看成信息貢獻率,依據(jù)信息貢獻率將各個成分進行排序,并作為屬性篩選的參考值.應用主成分分析法進行屬性篩選的步驟如下:
(1) 確定樣本矩陣并標準化. 選取樣本集,構建樣本矩陣X=(xij),1≤i≤m,1≤j≤n.其中xi=(xi1,xi2,…,xim)′表示樣本記錄數(shù),x=(x1,x2,…,xn)表示指標,并將矩陣標準化.
(2) 計算標準化后矩陣的m個指標的協(xié)方差矩陣相關系數(shù)矩陣R,其中矩陣中元素 rij的計算為
(3) 計算特征值λ,并按照大小排列,根據(jù)特征值計算各成分的方差貢獻率αi及累計方差貢獻率bi,其計算方式分別如下:
確定篩選后因素也就是主成分的標準一般有兩個:或者是定義一個累計貢獻度,取達到該累計貢獻度以前的所有因素,一般取為85%;或者是選取特征值大于1的因素.
1.3 支持向量機預測方法
支持向量機繼承了神經(jīng)網(wǎng)絡的優(yōu)點,并且改進了神經(jīng)網(wǎng)絡的全局尋優(yōu)能力,使得使用同樣樣本訓練后的預測值為唯一值,并且在小樣本下表現(xiàn)良好的特性.該方法是目前預測方法中的較新的方法,在小樣本的情況下被認為是能夠完全替代神經(jīng)網(wǎng)絡的智能預測方法.支持向量機的基本原理如下:
假設有訓練樣本集G={(xi,di)},i=1,…,N, xi∈Rn,di∈R1.支持向量機預測模型是將樣本點x映射到高維空間F中,構建下述估計函數(shù)進行線性回歸:
y = f(x)=wψ(x)+b,
其函數(shù)逼近問題等價于如下函數(shù)最?。?/p>
其中‖w‖2/2表示的是函數(shù)的平滑程度, Lε(d,y) 稱為ε-敏感損失函數(shù).通過引入松弛變量ζ、ζ*和拉格朗日公式進行轉換,可將上式變成
利用Karush-Kuhn-Tucker條件和對偶理論求目標函數(shù)的極值,可以將原問題轉化為:
求解上述問題可得到支持向量機回歸函數(shù):
式中K(xi,xj)稱為核函數(shù),需要滿足Mercer條件,一般選取高斯核函數(shù)
K(xi,xj)=exp(-||xi-xj||2/2s2) .
對某區(qū)域變電站工程造價審核后的概算數(shù)據(jù)進行收集,共收集到執(zhí)行新規(guī)定后的具有標準數(shù)據(jù)的變電工程42項,其中500 kV及以上等級3項,220 kV等級9項,35 kV等級及以下7項,110 kV等級的變電工程23項.通過資料的收集情況可以看出,線路工程歷史造價資料主要集中在110 kV等級,其余電壓等級的工程資料樣本量太少,因此選擇110 kV的變電工程作為樣本實驗數(shù)據(jù).110 kV的變電工程對應的屬性指標近百個.歷史資料中,變電工程屬性指標主要有:主變?nèi)萘?、靜態(tài)投資、動態(tài)投資、本期電容器規(guī)模、110 kV本期出線、35 kV本期出線、10 kV本期出線等.
表1 變電工程主成分分析結果表
首先,利用上文中的主成分分析法對變電工程進行降維處理,在降維計算前,為了消除量綱影響,首先利用歸一化將各指標數(shù)據(jù)歸結到[0,1],利用Matlab進行計算,可以得到主成分分析后的結果,如表1所示.通過結果可以看出,篩選后的屬性因素有本期規(guī)模、占地投資、電力電纜投資、控制電纜投資、建筑投資、土石方投資這6個屬性對造價技術經(jīng)濟指標貢獻率達95%以上.
結合得到的屬性篩選結果,對樣本數(shù)據(jù)按照4∶1的比例進行分割,即選擇80%的工程數(shù)據(jù)作為訓練樣本,其余20%左右的工程數(shù)據(jù)做為測試樣本,利用Matlab libsvm工具箱進行支持向量機模型的構建,輸入變量為上述篩選出的6個變量,輸出變量為工程的靜態(tài)投資,利用libsvm中的默認優(yōu)化參數(shù)設置進行預測,其預測結果如圖1所示.
從圖1中可以看出,整個樣本集的預測結果均表現(xiàn)不錯,基本和原值曲線吻合.曲線前半段較后半段擬合效果更好,說明預測結果在訓練集部分表現(xiàn)較測試集部分更好,具體的誤差分析如表2所示.
表2 利用支持向量機給出的最后預測結果及誤差分析
表2中的靜態(tài)投資的數(shù)值是歸一化后的數(shù)據(jù),其中訓練集的平均絕對誤差(MAPE)是1.37%,而測試集的平均絕對誤差是1.8%,所有測試點的誤差不超過3%,最大值為2.78%,結合電力工程造價的誤差標準規(guī)范,在5%以內(nèi)的概算造價均符合實際要求,因此所建模型可以滿足實際工作的需要,表明了模型的有效性.
本文對高維小樣本情況下的變電工程造價預測估算問題進行了研究,針對多因素高維情況,首先利用因素分析法中的主成分分析方法進行降維處理,選取累計貢獻率達95%以上的6個因素作為小樣本下支持向量機預測模型的輸入變量,對工程造價的靜態(tài)投資進行了預測,所得預測結果經(jīng)過測試檢驗能滿足實際工作的需要,可以為輸變電工程造價審核控制提供參考.
[1] 謝力,魏汝祥,蔣國萍. 基于分片逆回歸的小樣本組合預測建模方法[J]. 統(tǒng)計與決策,2013(2):73-76.
[2] 謝力,魏汝祥,蔣國萍,等. 基于局部線性嵌入的小樣本組合預測方法[J]. 統(tǒng)計與決策,2015(9):9-12.
[3] 王正新. 基于傅立葉級數(shù)的小樣本振蕩序列灰色預測方法[J]. 控制與決策,2014(2):270-274.
[4] 曾波,孟偉. 基于灰色理論的小樣本振蕩序列區(qū)間預測建模方法[J]. 控制與決策,2016(7):1311-1316.
[5] 陳保家,陳雪峰,田紅亮,等. 小樣本條件下的設備實時可靠度預測研究[J]. 現(xiàn)代制造工程,2015(1):1-8.
責任編輯:龍順潮
Transmission Project Cost Forecasting under the High-dimension Small Sample Conditions
QIXia1,WANGMian-bin1,ZHANGYan1,WANGJian-jun2*,ZHANGXiao-man1
(1.Electric Power Economic Research Institute in Northern Hebei Technology, State Grid, Beijing 100045; 2. School of Economics and Management,North China Electric Power University, Beijing 102206 China )
This paper uses the factor analysis method to select the important factors from high dimensional conditions at first, and establishes a suitable estimate model under the condition of small sample. Finally, a case study of a certain region is given and the results show that the proposed method is effective.
transmission project; cost estimation; small sample
2016-04-23
國家自然科學基金項目(71401054)
王建軍(1981—),男,吉林 白山人,博士,副教授. E-mail:chgc8@126.com
TP29
A
1000-5900(2016)04-0112-04