田 浩,盧 博,楊彥東,卜劍沖,鄧建新,李東昌
(國網(wǎng)寧夏電力有限公司經(jīng)濟(jì)技術(shù)研究院,寧夏 銀川 750011)
社會(huì)經(jīng)濟(jì)進(jìn)步的同時(shí),社會(huì)用電需求急劇增加.為了滿足社會(huì)各界的需求,變電站的規(guī)模和數(shù)量也隨之?dāng)U大[1].但與其他建設(shè)工程不同,變電站的建設(shè)涉及更加復(fù)雜的變電設(shè)備,現(xiàn)場(chǎng)施工極易出現(xiàn)安全事故.在變電站基礎(chǔ)建設(shè)、設(shè)施安裝過程中,設(shè)計(jì)到多個(gè)環(huán)節(jié),一旦建設(shè)過程中出現(xiàn)安全事故,不僅會(huì)影響施工進(jìn)度、造成經(jīng)濟(jì)損失,甚至有可能威脅到相關(guān)人員的安全[2].因此,變電站施工階段需要加強(qiáng)施工現(xiàn)場(chǎng)安全管理,而如何根據(jù)剖析施工安全事故特征,并基于此進(jìn)行事故預(yù)測(cè),成為很多研究人員關(guān)注的重點(diǎn)問題.
國內(nèi)大量學(xué)者對(duì)此展開了研究,如林穿等[3]從歷史施工數(shù)據(jù)入手,提取變電站施工安全事故發(fā)生前后現(xiàn)場(chǎng)數(shù)據(jù)的關(guān)聯(lián)規(guī)則,以此為基礎(chǔ)建立事件鏈.通過熱力圖矩陣,計(jì)算各事件鏈的泛化權(quán)重,形成事故事理圖譜.應(yīng)用圖譜對(duì)當(dāng)前施工現(xiàn)場(chǎng)相關(guān)數(shù)據(jù)進(jìn)行分析,即可得出事故預(yù)測(cè)結(jié)果.然而實(shí)際結(jié)果表明,該方法預(yù)測(cè)結(jié)果準(zhǔn)確率較低.潘靜娟等[4]運(yùn)用數(shù)字孿生技術(shù)搭建變電站施工現(xiàn)場(chǎng)三維模型,并定位高風(fēng)險(xiǎn)的施工區(qū)域.經(jīng)由固定攝像頭采集現(xiàn)場(chǎng)施工圖像,通過觀察圖像提取施工人員行為特征,對(duì)比該特征與作業(yè)條件庫的風(fēng)險(xiǎn)閾值,得出施工安全事故預(yù)測(cè)結(jié)果.然而實(shí)際結(jié)果表明,該預(yù)測(cè)模型的泛化能力有限.梁杰等[5]依托于大數(shù)據(jù)特征采樣方法,提取現(xiàn)場(chǎng)施工數(shù)據(jù)包含的特征信息,而后采用建筑信息模型(building information modeling,BIM)進(jìn)行多元回歸分析,得出變電站施工安全事故預(yù)測(cè)結(jié)果.將其投入實(shí)際工作后發(fā)現(xiàn),該方法預(yù)測(cè)結(jié)果的可靠性不高.
為解決以上方法中存在的問題,得到準(zhǔn)確的變電站施工安全事故預(yù)測(cè)結(jié)果,本次研究提出先對(duì)常見事故進(jìn)行深入分析,了解事故表征信息,在此基礎(chǔ)上建立以分類回歸樹(classification and regression tree,CART)模型為核心的變電站施工安全事故預(yù)測(cè)方法.通過實(shí)驗(yàn)驗(yàn)證可知,該方法預(yù)測(cè)結(jié)果極為準(zhǔn)確,可以作為施工安全風(fēng)險(xiǎn)防范的指導(dǎo).
在變電站施工現(xiàn)場(chǎng)安裝雷達(dá)、視頻等固定監(jiān)測(cè)設(shè)備,實(shí)施固定型采集技術(shù),主動(dòng)獲取現(xiàn)場(chǎng)施工數(shù)據(jù).再應(yīng)用移動(dòng)型采集技術(shù),獲取固定采集設(shè)備忽略的數(shù)據(jù).兩種技術(shù)采集數(shù)據(jù)相結(jié)合,作為后續(xù)施工安全事故預(yù)測(cè)的基礎(chǔ).
考慮到實(shí)時(shí)采集的現(xiàn)場(chǎng)施工數(shù)據(jù)中存在較多噪聲數(shù)據(jù),為了簡(jiǎn)化后續(xù)事故預(yù)測(cè)復(fù)雜度,在分析數(shù)據(jù)主成分的基礎(chǔ)上,增加數(shù)據(jù)降維和篩選的步驟.然后再對(duì)數(shù)據(jù)實(shí)施正交線性變換,將原始數(shù)據(jù)向低維歐氏空間投影[6],再根據(jù)變換結(jié)果了解每個(gè)數(shù)據(jù)的方差,按照方差從大到小的原則排序所有數(shù)據(jù),將方差最大的數(shù)據(jù)稱之為主成分,保留排序靠前的數(shù)據(jù),舍棄排名最后的數(shù)據(jù),保證有效信息不丟失的前提下,完成變電站施工相關(guān)數(shù)據(jù)篩選.針對(duì)現(xiàn)場(chǎng)采集的變電站施工數(shù)據(jù)進(jìn)行處理時(shí),需要先提取數(shù)據(jù)包含的特征值,建立特征矩陣,與非負(fù)對(duì)角矩陣相結(jié)合,進(jìn)行主成分?jǐn)?shù)據(jù)分析.
Y=XW=α×?×W,
(1)
式中:Y為主成分?jǐn)?shù)據(jù);X為現(xiàn)場(chǎng)采集數(shù)據(jù);W為原始數(shù)據(jù)的協(xié)方差特征;α為原始數(shù)據(jù)特征;?為對(duì)角矩陣.
由于數(shù)據(jù)的縮放處理會(huì)影響主成分分析結(jié)果,為了得到質(zhì)量更高的篩選數(shù)據(jù),需要在主成分分析之前,歸一化處理原始數(shù)據(jù),消除不同維度數(shù)據(jù)縮放帶來的負(fù)面影響.
變電站施工過程中,將施工狀態(tài)描述為正常、過渡和危險(xiǎn)三種類型,如圖1所示.
圖1 變電站施工狀態(tài)劃分示意圖Fig.1 Schematic diagram of substation construction state division
在不同的施工狀態(tài)下,現(xiàn)場(chǎng)施工相關(guān)數(shù)據(jù)的表征信息不同,本研究提出針對(duì)變電站施工安全事故進(jìn)行深入分析,提取施工安全事故前兆特征,這也是預(yù)測(cè)施工安全事故的基礎(chǔ)[7].實(shí)際操作過程中,將不同施工狀態(tài)的特征向量表示為:
xi={ti,μi,F(xiàn)i,?i,Hi},
(2)
式中:xi為第i個(gè)特征樣本數(shù)據(jù),且i∈n;t為數(shù)據(jù)采集時(shí)間;μ為施工現(xiàn)場(chǎng)數(shù)據(jù)采集位置;F為平均氣溫;?為天氣狀況;H為施工速度.
由式(2)可知,變電站施工狀態(tài)包含了數(shù)個(gè)特征變量,為了更加準(zhǔn)確、快速地得出變電站施工安全事故預(yù)測(cè)結(jié)果,需要對(duì)特征變量進(jìn)行合理選取,篩選出具有代表性的事故前兆特征[8].分類器錯(cuò)誤率示意圖如圖2所示,以施工狀態(tài)分類錯(cuò)誤率為準(zhǔn)則,描述正常施工狀態(tài)決策區(qū)域和危險(xiǎn)施工狀態(tài)決策區(qū)域,二者相結(jié)合形成整體的決策區(qū)域.
圖2 分類器錯(cuò)誤率示意圖Fig.2 Schematic diagram of classifier error rate
從圖2也可以看出,陰影區(qū)域?qū)儆诜诸愬e(cuò)誤區(qū)域,將數(shù)據(jù)樣本被錯(cuò)誤識(shí)別為正常施工狀態(tài)的可能性,表示為第一類錯(cuò)誤率,其計(jì)算過程如公式(3)所示.
(3)
式中:P′為第一類錯(cuò)誤率;B1為正常施工狀態(tài)決策區(qū)域;η2為危險(xiǎn)施工狀態(tài);λ為先驗(yàn)概率.
與之相對(duì)地,用第二類錯(cuò)誤率,反映危險(xiǎn)施工狀態(tài)決策區(qū)域的特征數(shù)據(jù)樣本,屬于正常施工狀態(tài)的概率,具體計(jì)算公式為:
(4)
式中:P″為第二類錯(cuò)誤率;B2為危險(xiǎn)施工狀態(tài)決策區(qū)域;η1為正常施工狀態(tài).
而后,二者相結(jié)合得出平均錯(cuò)誤率為:
(5)
考慮到直接計(jì)算錯(cuò)誤率的難度較大,文中提出一套與錯(cuò)誤率密切相關(guān)的概率密度函數(shù).
(6)
式中:z為平均值特征;ψ為概率密度函數(shù);Δt為施工數(shù)據(jù)采集周期.
定義概率密度函數(shù)的似然比,作為散度度量,該度量值越大表明當(dāng)前特征條件更加重要,可以更好地反映變電站施工狀態(tài)[9].基于此提出基于概率分布的可分性判據(jù),以此來判斷變電站施工特征分布密度的交疊程度,從而選擇合理的事故前兆特征.
從事故前兆特征入手,文中提出以CART回歸樹模型為基礎(chǔ),建立變電站施工安全事故預(yù)測(cè)決策樹的根節(jié)點(diǎn).首先,運(yùn)用二元切分法、基尼指數(shù)對(duì)數(shù)據(jù)特征進(jìn)行不斷分割,直到當(dāng)前采集施工數(shù)據(jù)的所有特征都清晰展現(xiàn)出來.其中,基尼指數(shù)可以表示為:
(7)
式中:G為基尼指數(shù);D為變電站施工數(shù)據(jù)集;D1、D2分別為D劃分形成的兩個(gè)子數(shù)據(jù)集;J為特征向量.
通過基尼指數(shù)完成變電站施工事故數(shù)據(jù)特征歸類處理后,選擇最優(yōu)特征作為CART回歸樹的根節(jié)點(diǎn),再引入并行化和損失函數(shù),構(gòu)建CART回歸樹基本模型.在此基礎(chǔ)上,確定回歸樹葉節(jié)點(diǎn)[10].回歸樹生成過程中,需要按照樣本屬性差異化,對(duì)原始樣本空間進(jìn)行遞歸劃分[10],如圖3所示.
圖3 樣本空間劃分示意圖Fig.3 Schematic diagram of sample space division
樣本屬性差異化程度可表示為:
(8)
式中:S為樣本屬性差異化程度;ζ(M)為總樣本目標(biāo)屬性的標(biāo)準(zhǔn)差;M為總樣本空間;M1、M2為子樣本空間.
樣本空間劃分結(jié)束后,應(yīng)用支持向量機(jī)(support vector machine,SVM)[11-13]回歸算法構(gòu)建葉節(jié)點(diǎn),定義葉節(jié)點(diǎn)的回歸方程為:
f(xi)=τK(xi)+b,
(9)
式中:f為最優(yōu)分類平面;τ為法向量;K為核函數(shù);b為偏置項(xiàng).
為解決輸入特征向量和評(píng)判指標(biāo)間的非線性關(guān)系,將映射到高維克難攻堅(jiān)轉(zhuǎn)化為線性問題.因此,該模型的優(yōu)化問題可以表示為:
(10)
約束條件為:
(11)
利用拉格朗日函數(shù)求解,考慮非線性可分情況,可以得到最優(yōu)超平面的決策函數(shù):
f(x)=uK(x)+b′,
(12)
式中:u為拉格朗日乘子;b′為優(yōu)化后的偏置項(xiàng).
通過上述操作,構(gòu)建出可用作變電站施工安全事故預(yù)測(cè)的CART回歸樹模型.為了加強(qiáng)預(yù)測(cè)準(zhǔn)確性,需要進(jìn)行修剪操作,從回歸樹底端入手遞歸處理,利用葉節(jié)點(diǎn)代替冗余子樹,從而建立最優(yōu)的決策樹.在剪枝處理后實(shí)施平滑處理,保證相鄰葉節(jié)點(diǎn)的連續(xù)性,應(yīng)用該CART回歸樹模型可以進(jìn)行變電站施工安全事故預(yù)測(cè).
由于變電站施工安全事故包括很多種類型,在實(shí)際預(yù)測(cè)過程中,需要先對(duì) CART回歸樹模型進(jìn)行事故預(yù)測(cè)的多次訓(xùn)練,每次訓(xùn)練都需要提高前一次錯(cuò)分?jǐn)?shù)據(jù)的權(quán)重,從而提升模型梯度,確保事故預(yù)測(cè)模型具有更好的表現(xiàn)[14-15].應(yīng)用損失函數(shù),衡量事故預(yù)測(cè)模型出錯(cuò)概率.在迭代訓(xùn)練時(shí),為使損失函數(shù)保持下降態(tài)勢(shì),將其下降方向定義為梯度方向,由此得到最終變電站施工安全事故預(yù)測(cè)模型的函數(shù)形式如公式(13)所示:
(13)
式中:ζ為預(yù)測(cè)函數(shù);εm為梯度方向;ιm為模型權(quán)重;j為回歸樹節(jié)點(diǎn);m為回歸樹的總數(shù)量;ιj為j節(jié)點(diǎn)回歸樹的權(quán)重;εj為j節(jié)點(diǎn)回歸樹梯度方向.
在每次訓(xùn)練后,都需要獲取預(yù)測(cè)損失函數(shù),并以此為基礎(chǔ)優(yōu)化預(yù)測(cè)模型的每個(gè)參數(shù).再應(yīng)用訓(xùn)練后的模型提取出施工安全事故前兆特征,分析現(xiàn)場(chǎng)施工數(shù)據(jù),生成高精度的施工安全事故預(yù)測(cè)結(jié)果.
本次實(shí)驗(yàn)以泉眼330 kV變電站工程作為依據(jù),泉眼330 kV變電站位于吳忠市同心縣韋州鎮(zhèn)惠新公路北側(cè),總用地面積30 725 m2.該站電壓等級(jí)為330 kV/110 kV/35 kV,主變?nèi)萘勘酒跒?×360 MVA;330 kV出線本期2回;110 kV出線本期10回;35 kV不出負(fù)荷線.
針對(duì)其他已完工的變電站工程進(jìn)行調(diào)查可知,在變電站施工過程中出現(xiàn)的主要安全事故為坍塌、墜落、打擊、觸電、火災(zāi)等.為了保證本變電站的施工安全,將本文所提方法、基于事理圖譜的文獻(xiàn)[3]方法和基于數(shù)字孿生技術(shù)的文獻(xiàn)[4]方法應(yīng)用到該變電站施工過程中,進(jìn)行為期一個(gè)月的安全事故分析和預(yù)測(cè)測(cè)試,驗(yàn)證所提方法的有效性.
考慮到引起變電站施工安全事故發(fā)生原因很多,本次實(shí)驗(yàn)過程中考慮多方面因素,提取出施工安全事故前兆特征,并結(jié)合基尼指數(shù)最小化原則和SVM回歸算法,構(gòu)建可用于變電站施工安全事故預(yù)測(cè)的CART回歸樹模型,經(jīng)過剪枝操作、平滑處理后,最終形成圖4所示的變電站施工安全事故預(yù)測(cè)決策樹結(jié)構(gòu).
圖4 變電站施工安全事故預(yù)測(cè)決策樹結(jié)構(gòu)Fig.4 Decision tree structure of substation construction safety accident prediction
由圖4可知,變電站施工安全事故預(yù)測(cè)決策樹結(jié)構(gòu),本質(zhì)上就是施工事故表征信息指標(biāo)體系,變電站工程等級(jí)、項(xiàng)目施工區(qū)域、天氣情況等多項(xiàng)安全事故誘發(fā)因素,都體現(xiàn)在該決策樹結(jié)構(gòu)中,并且都位于安全事故決策樹的前3層,這也表明這些因素可以對(duì)變電站施工安全事故預(yù)測(cè)結(jié)果產(chǎn)生極大影響.
依托于圖4所示的決策樹模型進(jìn)行回歸分析,即可在測(cè)試期間預(yù)測(cè)變電站出現(xiàn)的所有施工安全事故,并將本文所提方法與基于事理圖譜的文獻(xiàn)[3]方法和基于數(shù)字孿生技術(shù)的文獻(xiàn)[4]方法進(jìn)行施工安全事故預(yù)測(cè)量對(duì)比,結(jié)果如圖5所示.
圖5 不同方法預(yù)測(cè)的施工安全事故量Fig.5 Construction safety accidents predicted by different methods
由圖5的結(jié)果可知,本文所提方法對(duì)于變電站施工過程中的坍塌、工具墜落、物體打擊事故、觸電、火災(zāi)等安全事故能夠更多地預(yù)測(cè)出來.這表明本文基于CART回歸樹模型的變電站施工安全事故的預(yù)測(cè)方法靈敏度更高.主要是由于本文方法以CART回歸樹模型為基礎(chǔ),建立變電站施工安全事故預(yù)測(cè)決策樹的根節(jié)點(diǎn),再使用SVM回歸算法建立葉節(jié)點(diǎn),形成可用于施工安全事故預(yù)測(cè)的最優(yōu)決策樹,使得能預(yù)測(cè)出更多的安全事故.
為了進(jìn)一步驗(yàn)證所提方法的優(yōu)越性,選取受試者工作特征曲線(receiver operating characteristic,ROC)下的面積(area under the curve,AUC)值作為評(píng)估指標(biāo),對(duì)比本文所提方法與文獻(xiàn)[3]方法和文獻(xiàn)[4]方法預(yù)測(cè)結(jié)果的應(yīng)用性能.通常情況下,AUC值的取值在0到1之間,越靠近1表明該方法預(yù)測(cè)結(jié)果更加準(zhǔn)確.從3種方法的施工安全事故預(yù)測(cè)結(jié)果入手,得出不同方法預(yù)測(cè)結(jié)果的ROC曲線,如圖6所示.
圖6 不同方法預(yù)測(cè)結(jié)果的ROC曲線Fig.6 ROC curve of prediction results by different methods
圖6顯示了3種方法下的ROC曲線,該曲線下方面積即為AUC值.本文所提方法預(yù)測(cè)結(jié)果的AUC值為0.91,而文獻(xiàn)[3]方法和文獻(xiàn)[4]方法的AUC值分別為0.82、0.78.綜上所述,本文所提方法相比于文獻(xiàn)[3]方法和文獻(xiàn)[4]方法事故預(yù)測(cè)結(jié)果的AUC值分別提升了9.89%、14.28%.因此,表明本文所提方法預(yù)測(cè)變電站施工安全事故的準(zhǔn)確率更高,主要是由于本文所提方法通過基于概率分布的可分性判據(jù),以此來判斷變電站施工特征分布密度的交疊程度,從而選擇合理的事故前兆特征.說明本文所提方法可以預(yù)先識(shí)別出變電站施工安全事故,輔助現(xiàn)場(chǎng)管理人員制定合理的防范措施,避免施工安全事故的發(fā)生.
在電力系統(tǒng)建設(shè)力度不斷加大的情況下,變電站建設(shè)工程規(guī)模也隨之?dāng)U大,考慮到變電站施工過程較為復(fù)雜,近年來施工事故不斷發(fā)生.為了降低變電站施工過程中面臨的安全壓力,本研究提出針對(duì)施工事故表征信息進(jìn)行深入分析,了解施工安全事故前兆特征,并結(jié)合CART回歸樹模型設(shè)計(jì)新型變電站施工事故預(yù)測(cè)方法,得到高精度的事故預(yù)測(cè)結(jié)果,作為提升變電站施工安全的依據(jù).