王開才
【摘 要】文章討論采用神經(jīng)網(wǎng)絡方法和數(shù)據(jù)挖掘技術來對電力工程造價進行預測及審查。神經(jīng)網(wǎng)絡模糊系統(tǒng)確立電力工程造價的預測方法,數(shù)據(jù)挖掘技術在屬性聚類和優(yōu)選、數(shù)據(jù)預處理方面得到規(guī)則。通過對實例的分析和計算,在電力工程造價的預測和審查方面,該方法達到突出的效果,同時驗證了該方法的收斂性以及預測準確性。
【關鍵詞】預測;電力工程造價;神經(jīng)網(wǎng)絡;數(shù)據(jù)挖掘
對于以往工程項目造價的預測而言,多數(shù)情況下都是依靠經(jīng)驗豐富的工作人員根據(jù)實際經(jīng)驗的積累來進行推測和分析的。其實工程造價是一個非線性、多變量的復雜過程。人們從現(xiàn)有的數(shù)據(jù)中挖掘出隱藏在其中未知的、卻是有用的知識和信息,并且將它變成最終能夠被人們所理解的模式,這個過程就是數(shù)據(jù)挖掘。通過極其完善和豐富的連接,大量神經(jīng)元構成了自適應且非線性的動態(tài)系統(tǒng),該系統(tǒng)就是人工神經(jīng)網(wǎng)絡。其具有良好的非線性映射能力,還具備了傳統(tǒng)建模方法所沒有的許多優(yōu)點。通過學習評價結果以及方案,就能夠得到隱藏在其中的人的知識經(jīng)驗、直覺思維。當評價時,網(wǎng)絡可以對復雜問題做出合理的判斷,在線這些直覺思維、知識與經(jīng)驗等。這樣,既減少了在評價過程中出現(xiàn)的主管因素影響,又充分地利用了以往工程中的知識和經(jīng)驗。為了證實該方法的可行性和有效性,將人工神經(jīng)網(wǎng)絡與數(shù)據(jù)挖掘相結合,以電力線路工程多指標相互作用影響造價這一特點為基礎,對電力工程造價的問題進行研究。
1數(shù)據(jù)的預處理
在數(shù)據(jù)挖掘中,有一項重要的技術便是數(shù)據(jù)預處理。數(shù)據(jù)的預處理與數(shù)據(jù)挖掘過程中的可執(zhí)行性及其合理的結果之間的關系密不可分。在電力線路中,絕緣子、運距、桿塔、檔距、地形、電壓的等級等存在的差異都會給工程造價帶來多個因素的影響。而且,其影響造價的因素都有子因素,我們將其稱之為層次數(shù)據(jù)倉庫,如圖所示。對工程以往數(shù)據(jù)進行預處理時,具體方法有:壓縮數(shù)據(jù)集、平滑噪聲數(shù)據(jù)、填補空缺值等等。這些造價因素不但與數(shù)據(jù)挖掘的任務沒有關系,
還會造成將大量時間浪費在數(shù)據(jù)挖掘的過程中,這種屬性間的重復強化會帶來失真的計算結果。我們需要選擇適合的屬性來減少數(shù)據(jù)存取的時間,與此同時也極大程度上提高了對挖掘結果的可理解性。我們就來看看現(xiàn)在屬性的兩個步驟。①對原始數(shù)據(jù)集進行壓縮時采用屬性轉換及屬性歸約等方式。例如:采用加權平均的方式將平底、丘陵、一般山地、高山大嶺等原統(tǒng)計數(shù)據(jù)對地形的描述屬性轉換成為地形系數(shù)屬性。地形系數(shù)的計算方法為:{W1×高山大嶺比例+W2×一般山地比例+W3×丘陵比例+W4×平地比例}=地形系數(shù)。相關領域的專家可以對公式中的W1,W2,W3,W4對應地形的權系數(shù)進行設定。②更深層次的屬性優(yōu)選需要恰當?shù)乃惴?,例如:過濾算法、包裝算法等的啟發(fā)式搜索算法。我們可以采用包裝算法按照電力線路工程數(shù)據(jù)的特點,通過兩次實驗分別離散化截面和電壓作為類別屬性,截面和電壓是對單位工程造價影響最為明顯的兩個屬性。最終的優(yōu)選子集可以使用兩次實驗的交集。
2神經(jīng)網(wǎng)絡和數(shù)據(jù)挖掘的工程造價預測
針對不同的數(shù)據(jù)結構和類型,作為對象相似性度量標準,K-means聚類方法選擇了不同的距離函數(shù)。常用的度量方法是基于歐式距離的度量法。工程造價的模糊規(guī)則采用聚類方法進行生成。將具備相似性的工程歸納為一組,相似性不是指絕對數(shù)值的大小,二十屬性之間相對大小。余弦距離反映出向量內部元素的變化狀況以及向量之間的相似關系,所以,作為對象相似度的度量標準來說,選用余弦距離符合實驗要求。余弦距離的度量形式為, ,公式中的 和 為 、 的第 個屬性。選擇聚類數(shù)目在聚類分析中也是關鍵,它需要考慮到系統(tǒng)的復雜度和精度。選擇適合的聚類數(shù)目時,要依據(jù)指標所減小的程度,通過觀測平方誤差和的變化來逐步改變聚類數(shù)目。選擇2為聚類數(shù)目,能使模型的精度得以提高,并使系統(tǒng)保持一定的精度且不過于復雜。
在實際的問題中,輸入劃分輸入空間為非線性的,要使模糊規(guī)則數(shù)量急劇上升,就需要對細致劃分輸入空間。因此,以神經(jīng)網(wǎng)絡的模糊系統(tǒng)模型為基礎,通過模糊系統(tǒng)訓練得到多維的非線性的隸屬度函數(shù)是該模型的思想。將樣本用聚類方式分組,每組都是一條模糊規(guī)則。各個樣本通過模糊BP網(wǎng)絡訓練,對于規(guī)則的適應度函數(shù)進行各類輸入、輸出神經(jīng)網(wǎng)絡分別訓練,最后在系統(tǒng)的輸出中合成各網(wǎng)絡的輸出。
BP算法存在一些缺陷:對已學習完成的樣本而言,新加入的樣本會對其產(chǎn)生影響;往往需要依靠經(jīng)驗來選取連接權初值和網(wǎng)絡隱層神經(jīng)元數(shù)目;能量函數(shù)存在局部極小值;反向傳播算法需要成千上萬次的迭代計算,其收斂的速度較慢。為了彌補上述不足,可以采用計算精度高、收斂速度快的Levenberg-Marquardt規(guī)則算法來進行對前向網(wǎng)絡的訓練。Levenberg-Marquardt算法步驟為:選取初始權值;將樣本指標信息輸入所有樣本,包括:a.對隱節(jié)點輸出的計算。b.對輸出節(jié)點輸出進行計算。c.對期望輸出與所有樣本實際輸出的誤差之和進行計算;如果誤差沒有達到期望誤差,標量增加,且向增大方向。如果誤差沒有達到期望值,則標量減小,且向減小的方向。
3分析實例
我們分析了實際線路,來驗證模型的計算精度以及可靠性。訓練兩個BP網(wǎng)絡,并且將每組中的數(shù)據(jù)分為測試集和訓練集。通過實驗的結果我們可以得出:經(jīng)過改進的BP算法比傳統(tǒng)的BP算法更具良好的收斂性。預測值與改進后的BP算法實際值估算誤差比較,負值為預測值小于實際值,正值為預測值大于實際值,如表所示。由此得知,通過改進后,神經(jīng)網(wǎng)絡在對各項造價指標的估算上,已達到較高的精度。尤其是單位靜態(tài)投資,結果很令人滿意,最小誤差絕對值為百分之1.15,而最大誤差的絕對值為百分之3.46。說明在對于送電線路工程造價的快速估算中,運用改進后的神經(jīng)網(wǎng)絡模型的效果非常好,該神經(jīng)網(wǎng)絡具備較高泛化能力。工程預算的快速審查也可運用該
模型。對比設計預算書,把神經(jīng)網(wǎng)絡的快速造價估算值設置為基準值,對各個單位工程造價的預算準確性進行判斷,可實現(xiàn)審查目的。通過審查結果得出,工程單位公里造價、桿塔工程、基礎工程、土石方工程、預算的工地運輸?shù)脑靸r較為準確。
4結束語
文中探討神經(jīng)網(wǎng)絡技術和數(shù)據(jù)挖掘在電力工程造價預測中的應用,利用模糊神經(jīng)網(wǎng)絡建立工程造價模型,對原始數(shù)據(jù)利用數(shù)據(jù)挖掘技術進行預處理,得到了適合的數(shù)據(jù)格式及規(guī)模。神經(jīng)網(wǎng)絡技術和數(shù)據(jù)挖掘在電力工程造價中的應用使評價的結果更客觀、更有效,且減小了工程項目審查、預算過程中人為因素的片面性和主觀性。
參考文獻:
[1]杜爾登,郭迎慶,孫悅,高乃云,王利平.三維熒光結合自組織映射神經(jīng)網(wǎng)絡考察自來水廠有機物去除效果[J].光譜學與光譜分析,2012(7).
[2]孫宇,曾衛(wèi)東,趙永慶,張學敏,馬雄,韓遠飛.基于BP神經(jīng)網(wǎng)絡的置氫TC21合金力學性能預測[J].稀有金屬材料與工程,2012(6).