侯 慧,陳 希,李 敏,朱 凌,黃 勇,朱韶華
一種Stacking集成結(jié)構(gòu)的臺風(fēng)災(zāi)害下停電空間預(yù)測方法
侯 慧1,陳 希1,李 敏2,朱 凌2,黃 勇3,朱韶華1
(1.武漢理工大學(xué)自動化學(xué)院,湖北 武漢 430070;2.廣東電網(wǎng)有限責(zé)任公司,廣東 廣州 510080;3.廣東電網(wǎng)有限公司電力科學(xué)研究院,廣東 廣州 510080)
為提高電網(wǎng)公司防災(zāi)減災(zāi)能力,考慮電網(wǎng)、氣象、地理等因素,從統(tǒng)計學(xué)習(xí)的角度提出一種臺風(fēng)災(zāi)害下停電空間預(yù)測方法。首先,以1 km×1 km網(wǎng)格為單位收集數(shù)據(jù),并進行標(biāo)準(zhǔn)化、分類變量獨熱編碼處理與篩選、構(gòu)造特征等處理后作為模型輸入數(shù)據(jù)。其次,選取隨機森林、梯度提升決策樹、自適應(yīng)提升、K最近鄰、支持向量機、極限樹、決策樹以及XGBoost等算法,利用Stacking集成技術(shù)構(gòu)造停電空間預(yù)測模型。最后,以廣東省某縣為研究對象,對模型的停電空間預(yù)測性能進行驗證。在臺風(fēng)“彩虹”下的預(yù)測準(zhǔn)確率為0.777 6,召回率為0.914 0。結(jié)果驗證了在臺風(fēng)災(zāi)害下該模型對停電空間預(yù)測的可行性與有效性。
臺風(fēng)災(zāi)害;統(tǒng)計學(xué)習(xí);機器學(xué)習(xí)算法;Stacking;停電空間預(yù)測
外部自然災(zāi)害一直是電網(wǎng)發(fā)生故障的主要原因[1],其中臺風(fēng)會造成電網(wǎng)發(fā)生大范圍故障甚至大停電事故,嚴(yán)重威脅電網(wǎng)安全穩(wěn)定運行,同時造成重大經(jīng)濟損失[2]。因此,開展臺風(fēng)災(zāi)害下的停電預(yù)測研究,對電網(wǎng)公司災(zāi)前風(fēng)險量化評估、制定應(yīng)急抗災(zāi)策略、提高電網(wǎng)公司災(zāi)害應(yīng)急處置能力具有重要現(xiàn)實意義。
臺風(fēng)對電力系統(tǒng)影響的研究主要分為脆弱性建模和統(tǒng)計學(xué)習(xí)兩方面[3]。脆弱性建模是指建立設(shè)備在臺風(fēng)災(zāi)害下的脆弱性曲線模型,基于模型研究臺風(fēng)下的設(shè)備故障風(fēng)險。在脆弱性建模方面,文獻[4]結(jié)合脆弱性曲線與應(yīng)力干涉模型對臺風(fēng)下的輸電線路風(fēng)險進行預(yù)警,但是計算效率不高且不適用于大數(shù)量設(shè)備下的風(fēng)險預(yù)測。文獻[5-6]考慮風(fēng)荷載實時故障率及狀態(tài)的動態(tài)交替特性,建立配網(wǎng)桿塔可靠性評估模型,但是僅考慮了風(fēng)速大小而未考慮其他因素,如風(fēng)向、微地形、老化等因素,顯得模型過于理想。文獻[7]從風(fēng)速和風(fēng)向聯(lián)合的角度出發(fā)對電力斷線倒塔概率預(yù)測模型進行建模,文獻[8]利用蒙特卡洛法模擬風(fēng)速大小和方向,建立輸電線路風(fēng)偏跳閘模型,但同時模型計算也更加復(fù)雜。文獻[9]考慮地理高程信息,結(jié)合風(fēng)荷載下的脆弱曲線提出輸電線路臺風(fēng)下的預(yù)警模型。文獻[10-11]考慮微地形因素,結(jié)合設(shè)備脆弱性曲線建立輸電線路風(fēng)險預(yù)警模型。雖然以上研究從不同角度加入了更多的因素進行考慮,但是同時也加大了模型計算的復(fù)雜性,因此一般僅適用于樣本和變量較少的情況。另一方面,以上研究從建模理論出發(fā),可能導(dǎo)致變量取值過于理想,實際應(yīng)用受限。因此有必要尋找一種能夠考慮多樣本多變量且變量準(zhǔn)確反映實際狀態(tài)的方法,進行臺風(fēng)災(zāi)害下的停電風(fēng)險評估研究。
人工智能算法的發(fā)展為學(xué)者研究極端災(zāi)害下的停電問題提供了另一個研究出發(fā)點,那就是從統(tǒng)計學(xué)習(xí)的角度對災(zāi)害下的電網(wǎng)風(fēng)險進行評估研究,這種方法更靈活、更準(zhǔn)確、更快速。在這方面,文獻[12]利用邏輯回歸建立氣象因素對電力事故的影響模型,文獻[13]基于模糊和相似度對輸電線路可靠性參數(shù)進行預(yù)估,但是僅分析了氣象方面的多因素,且未上升到對系統(tǒng)層面停電預(yù)測問題的研究。文獻[14]利用負(fù)二項回歸模型進行臺風(fēng)下的停電預(yù)測研究,[15-16]分別提出臺風(fēng)下停電預(yù)測的廣義線性混合模型和廣義加性模型,但是由于網(wǎng)格范圍過大,預(yù)測的精度較低。文獻[17]利用隨機森林算法進行停電空間預(yù)測并利用權(quán)重法二次評估提高預(yù)測效果,文獻[18]利用隨機森林算法對停電區(qū)域和數(shù)量進行預(yù)測,雖然以上研究[17-18]都實現(xiàn)了停電區(qū)域的預(yù)測,且預(yù)測精度為1 km×1 km,但是上述模型僅從單一算法出發(fā)。對于停電事件而言,特征數(shù)據(jù)之間的空間結(jié)構(gòu)關(guān)系非常復(fù)雜,單一算法僅從自身算法角度分析數(shù)據(jù),限制了對特征數(shù)據(jù)之間復(fù)雜關(guān)系的充分挖掘,因此有必要采用集成多算法的方式來進行數(shù)據(jù)挖掘。
文獻[19]利用集成的方法對決策樹、隨機森林、增強梯度樹回歸三種模型集成并比較,通過對比表明,集成后的模型比單一模型在停電預(yù)測上具有更優(yōu)異的效果。模型集成的效果在一定程度上取決于集成的方法,Stacking是機器學(xué)習(xí)三大集成方式之一,文獻[20-22]利用Stacking的方法開展研究,結(jié)果表明,利用Stacking構(gòu)建的集成模型能夠在單一模型的基礎(chǔ)上提升預(yù)測性能,因此利用Stacking集成的方法融合多算法,從統(tǒng)計學(xué)習(xí)的角度出發(fā)研究臺風(fēng)對電力系統(tǒng)的影響是一個值得探討研究的方向。
因此,本文提出一種Stacking集成結(jié)構(gòu)的臺風(fēng)災(zāi)害下停電空間預(yù)測方法:利用Stacking技術(shù)對多個算法進行融合,對1 km×1 km網(wǎng)格劃分后的區(qū)域進行停電空間預(yù)測,實現(xiàn)較高的預(yù)測精度。本文方法利用Stacking從不同算法的角度挖掘特征之間的關(guān)系,避免單一算法在特征關(guān)系表現(xiàn)上的單一關(guān)注,從而導(dǎo)致訓(xùn)練時出現(xiàn)偏置性,實現(xiàn)對模型預(yù)測性能的提升。
本文建立的臺風(fēng)災(zāi)害下停電空間預(yù)測框架如圖1所示。
圖1 臺風(fēng)災(zāi)害下停電空間預(yù)測框架
1) 考慮到實際數(shù)據(jù)收集可行性及精度要求,基于1 km×1 km的精度對研究區(qū)域進行網(wǎng)格劃分。
2) 以網(wǎng)格為單位收集樣本數(shù)據(jù),包括電網(wǎng)數(shù)據(jù)、氣象數(shù)據(jù)、地理數(shù)據(jù)等,數(shù)據(jù)來源于電網(wǎng)公司。若存在所提供的數(shù)據(jù)精度與本文精度不相符的情況,利用ArcGIS[23]軟件的插值功能進行轉(zhuǎn)換提取。
3) 對收集的樣本數(shù)據(jù)進行標(biāo)準(zhǔn)化、分類變量處理、構(gòu)造特征變量等一系列預(yù)處理工作,作為模型的輸入數(shù)據(jù)。
4) 基于Stacking技術(shù)構(gòu)造包含基學(xué)習(xí)器層和元學(xué)習(xí)器層的兩層Stacking集成模型,對模型進行訓(xùn)練,利用訓(xùn)練后的模型進行停電空間預(yù)測,最后利用ArcGIS對結(jié)果進行可視化,直觀反映停電網(wǎng)格空間分布趨勢。
臺風(fēng)災(zāi)害下的區(qū)域停電事件是多方面因素作用的結(jié)果,主要涉及電網(wǎng)、氣象、地理三個方面[17],因此,本文將研究區(qū)域進行1 km×1 km網(wǎng)格化劃分后,以網(wǎng)格為單位對這三個方面樣本數(shù)據(jù)進行收集。
1) 電網(wǎng)數(shù)據(jù):臺風(fēng)導(dǎo)致倒塔斷線是造成臺風(fēng)災(zāi)害下停電事件發(fā)生的主要原因之一,因此選擇與倒塔斷線相關(guān)的桿塔數(shù)1、線路長度2作為特征變量。對桿塔采取拉線措施能在一定程度上提升桿塔在臺風(fēng)下的抗風(fēng)能力,進而提升“保電能力”,因此拉線加固桿塔數(shù)3也作為特征變量。另外,在收集數(shù)據(jù)時,電網(wǎng)公司通過網(wǎng)格中的箱變數(shù)、臺變數(shù)來確定網(wǎng)格內(nèi)的用戶數(shù),因此箱變數(shù)4、臺變數(shù)5、以及用戶數(shù)6同樣作為特征變量收集。
2) 氣象數(shù)據(jù):臺風(fēng)災(zāi)害下發(fā)生倒塔斷線的主要原因是構(gòu)件在臺風(fēng)下受到的風(fēng)荷載超過其設(shè)計風(fēng)荷載,因而發(fā)生倒塔斷線導(dǎo)致停電。而風(fēng)偏跳閘停電的主要原因為絕緣子串在大風(fēng)條件下風(fēng)偏角變小發(fā)生跳閘導(dǎo)致停電。這兩類事件都與風(fēng)速有關(guān),因此選取最大陣風(fēng)風(fēng)速7作為特征變量。臺風(fēng)往往會造成降雨,但雨荷載在實際中對桿塔的影響與風(fēng)荷載對桿塔的影響相比很小,且本文重點研究臺風(fēng)災(zāi)害,對于臺風(fēng)導(dǎo)致的山洪等次生災(zāi)害不予考慮,因此本文的氣象數(shù)據(jù)中不考慮降雨量這一特征。
3) 地理數(shù)據(jù):風(fēng)場中的不同位置,其風(fēng)速也不同,經(jīng)緯度信息可以確定某個點的位置信息,因此將經(jīng)度8、緯度9作為特征變量。通過經(jīng)緯度獲取的風(fēng)速僅僅是風(fēng)速的觀測值,但是實際上具體到某根桿塔位置處,其微地形是不同的,而不同微地形對風(fēng)速的影響不同,如典型的“狹管效應(yīng)”[11],因此本文考慮微地形對風(fēng)速的影響,選取海拔10、坡度11、坡向12作為特征變量表征網(wǎng)格內(nèi)的微地形差異。除地形因素外,地表的差異同樣會對風(fēng)速造成影響,文獻[24]已證明地表差異對站點風(fēng)速有較明顯的影響,因此在數(shù)據(jù)收集階段,本文選取地表類型13、下墊面類型14作為特征變量表征不同網(wǎng)格之間的地表差異。
表1 原始樣本數(shù)據(jù)類別與具體變量
在對數(shù)據(jù)進行訓(xùn)練之前,有必要對數(shù)據(jù)進行預(yù)處理。由于收集的數(shù)據(jù)中,不同特征變量歸屬于不同類型,不同變量之間的量綱不同,會對模型預(yù)測的可行性及可靠性產(chǎn)生影響,為了消除特征變量之間的量綱影響,需要對特征變量按式(1)進行標(biāo)準(zhǔn)化處理,使得不同指標(biāo)之間具有可比性。
在所選取的特征變量中,地表類型、下墊面類型屬于分類變量,分類變量僅代表類別或標(biāo)簽,沒有實際數(shù)值上的大小意義,因此需要對分類變量進行處理。本文采用獨熱編碼(One-hot encoding)[25]的方法對其進行處理。另外,在分類變量中,地表類型有25種(0~24),下墊面類型有10種(0~9),對所有樣本數(shù)據(jù)進行地表類型與下墊面類型的樣本數(shù)量統(tǒng)計,如圖2所示。
如圖2所示,地表類型中,類型2(旱地)所占比例最大,下墊面類型中,類型0(水稻土)所占比例最大。過多冗余特征加入會影響模型的預(yù)測性能,因此,為避免引入過多無用特征,同時保留地表類型、下墊面類型這兩個表征地表差異的特征,選擇“旱地”和“水稻土”作為地表類型和下墊面類型的特征變量。
圖2 地表類型與下墊面類型樣本統(tǒng)計
“集成學(xué)習(xí)”是一種建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)之上的多算法融合方法,而Stacking集成是機器學(xué)習(xí)的三大集成方式之一[26],它是指組合多個算法的預(yù)測數(shù)據(jù)以生成新模型的集成技術(shù)。本文利用Stacking集成方法對多個算法進行融合,構(gòu)建包括基學(xué)習(xí)器層和元學(xué)習(xí)器層的兩層Stacking集成模型。
在基學(xué)習(xí)器層的模型算法選擇上,考慮到在常見分類算法中,隨機森林(Random Forest, RF)[27]和梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)[28]有著出色的學(xué)習(xí)能力,自適應(yīng)提升(Adaptive Boosting, AdaBoost)[29]考慮分類器權(quán)重使得其具有較高精度,K最近鄰(K-nearest Neighbors, KNN)[30]精度高、對異常值不敏感、簡單有效,支持向量機(Support Vector Machine, SVM)[31]泛化錯誤率低,因此選擇以上算法作為基學(xué)習(xí)器層的模型算法。除以上模型算法之外,為滿足Stacking對基學(xué)習(xí)器“多且不同”的要求,也將常見的極限樹(Extremely Tree, ET)和決策樹(Decision Tree, DT)[32]作為基學(xué)習(xí)器層的模型算法。
第二層應(yīng)當(dāng)選擇泛化能力較強的模型,能夠?qū)崿F(xiàn)從中歸納并糾正第一層多個基學(xué)習(xí)器對于訓(xùn)練模型的偏執(zhí)情況[33],通過對第一層基模型產(chǎn)生的數(shù)據(jù)進行二次預(yù)測,從而進一步提高預(yù)測表現(xiàn)。XGBoost[34]是GBDT的一種高效實現(xiàn),其中的正則項能夠防止過擬合,并且采用并行優(yōu)化方式,考慮了訓(xùn)練數(shù)據(jù)為稀疏值的情況,可以為缺失值或指定值指定分支的默認(rèn)方向,能大大提升算法的效率,因此本文選擇XGBoost算法作為元學(xué)習(xí)器。
本文構(gòu)建的Stacking集成模型的原理如下:
1) 將原始樣本數(shù)據(jù)劃分為訓(xùn)練集與測試集。對訓(xùn)練集進行折劃分,作為基學(xué)習(xí)器層中每個基模型輸入的基礎(chǔ)數(shù)據(jù);
2) 針對各個基模型,分別進行次訓(xùn)練,每次訓(xùn)練保持1/的樣本作為基模型的驗證數(shù)據(jù),其余的(1-1/)作為訓(xùn)練數(shù)據(jù),一個模型會對應(yīng)個預(yù)測結(jié)果,再將個預(yù)測結(jié)果進行加權(quán)平均;
3) 得到基模型運行次的平均值之后,拼接每一基模型的預(yù)測結(jié)果代入下一層;
4) 將各個基模型得到的預(yù)測結(jié)果,拼接上各個樣本真實的標(biāo)簽,代入第二層模型進行訓(xùn)練,最終得到的預(yù)測結(jié)果便是Stacking集成的最終預(yù)測結(jié)果。
三是實現(xiàn)水利資金運行管理全過程監(jiān)督。從制度建設(shè)、預(yù)算管理、監(jiān)督檢查、廉政風(fēng)險防控等各個方面,全面加強水利資金使用監(jiān)督管理,將各級財政安排的水利資金全部納入監(jiān)督管理范圍。建立多元化監(jiān)督體系,實現(xiàn)水利資金運行管理全過程監(jiān)督,重點加強對資金規(guī)模大、涉及范圍廣、與民生密切相關(guān)的水利項目資金的監(jiān)督管理。
本文的Stacking集成方法實現(xiàn)過程如圖3所示。
混淆矩陣[26]是衡量分類模型結(jié)果中最基本最直觀的一種方式,從混淆矩陣中可以對預(yù)測結(jié)果進行直觀地了解,如表2所示。
圖3 Stacking集成過程示意圖
表2 混淆矩陣
分?jǐn)?shù)(-Score)[26]是綜合考慮兩個指標(biāo)的新指標(biāo),其數(shù)學(xué)定義如式(6)所示。
ROC(Receiver Operating Characteristic)曲線與AUC(Area Under Curve)值是判斷二分類預(yù)測模型優(yōu)劣比較直觀的指標(biāo)[26]。AUC值即ROC曲線下的面積。模型的AUC取值不同,對模型的優(yōu)劣評價也不同。
1)<0.5,說明模型比隨機猜測還差;
3) 0.5<<1時,模型優(yōu)于隨機猜測,具有一定的預(yù)測價值,且越接近1分類器性能越好;
4)=1時,模型具有完美的預(yù)測功能。
本文以廣東省某縣為研究對象,數(shù)據(jù)選取2014年第9號臺風(fēng)“威馬遜”、第15號臺風(fēng)“海鷗”以及2015年第22號超強臺風(fēng)“彩虹”共三個臺風(fēng)的數(shù)據(jù)作為樣本數(shù)據(jù)。三個臺風(fēng)在歷史上都對該縣造成停電影響。
數(shù)據(jù)預(yù)處理部分采用上文所述方法進行處理,然后選取“威馬遜”及“海鷗”兩個臺風(fēng)的數(shù)據(jù)作為訓(xùn)練集,臺風(fēng)“彩虹”的數(shù)據(jù)用于對模型預(yù)測效果的測試。
模型在訓(xùn)練集上的預(yù)測結(jié)果如表3所示。
從表3可以看出,模型訓(xùn)練結(jié)果指標(biāo)幾乎都達到了0.8或以上,總體表現(xiàn)良好。利用混淆矩陣來表示本文模型在該縣總共1 641個網(wǎng)格臺風(fēng)“彩虹”下的整體預(yù)測結(jié)果,如表4所示。
表3 訓(xùn)練集預(yù)測結(jié)果
表4 仿真結(jié)果混淆矩陣
仿真得到在臺風(fēng)“彩虹”上的預(yù)測效果,各項評價指標(biāo)如表5所示。
表5 仿真結(jié)果各項指標(biāo)
結(jié)合表4和表5可以看出:在所有1 641個網(wǎng)格中,準(zhǔn)確預(yù)測網(wǎng)格有936+340=1276個,準(zhǔn)確率達到0.777 6;在所有真實發(fā)生停電的32+340=372個網(wǎng)格中,預(yù)測為停電的網(wǎng)格數(shù)達340個,只有32個網(wǎng)格被錯判,召回率達到0.914 0,分?jǐn)?shù)達到了0.845 6,但是精確率偏低只有0.505 2。說明模型能夠很好地識別已停電網(wǎng)格。在總的網(wǎng)格層面,準(zhǔn)確率較好,但是精確率較低,經(jīng)多次調(diào)試后,發(fā)現(xiàn)模型的精確率仍然不高,其原因可能是考慮的特征不全面。如在2014年的臺風(fēng)過后,網(wǎng)格A中倒塌的桿塔更換為新桿塔,該網(wǎng)格的“抗風(fēng)保電”水平相比原來有所提升,但是在特征上,僅考慮了桿塔數(shù)量以及拉線加固效應(yīng),不能夠反映這一改變。在2015年的數(shù)據(jù)預(yù)測下,網(wǎng)格A可能因為忽視“抗風(fēng)保電”水平的提升而使得模型將其預(yù)測為停電網(wǎng)格,從而導(dǎo)致精確率不高。因此未來的研究需進一步細(xì)化考慮停電影響因素,擴充更多特征。
為了對預(yù)測結(jié)果進行更直觀地體現(xiàn),為后期電網(wǎng)公司制定應(yīng)急策略提供參考,將實際停電網(wǎng)格與預(yù)測結(jié)果在ArcGIS 10.7軟件上進行可視化,實際停電網(wǎng)格分布與預(yù)測停電空間分布對比如圖4和圖5所示。
從圖4與圖5可以看出,實際停電空間分布大致可分左中右三部分,而預(yù)測結(jié)果與實際停電空間左中右的分布趨勢大致相同,幾乎包含了所有真實停電的網(wǎng)格,但同時在停電網(wǎng)格周圍也有未停電的網(wǎng)格被預(yù)測為停電網(wǎng)格。
圖4 實際停電空間分布
圖5 預(yù)測停電空間分布
仿真得到模型的ROC曲線如圖6所示。
圖6 模型的ROC曲線
從圖6的ROC曲線可以看出,其AUC的值達到了0.853,根據(jù)ROC曲線特性,當(dāng)0.7<<0.9時有一定準(zhǔn)確性,表明自變量與因變量的關(guān)聯(lián)緊密,同時說明網(wǎng)格停電情況與所選的評價指標(biāo)具有良好的相關(guān)性,證明本文方法比隨機預(yù)測要好,說明了本文方法是有效的,具有一定的預(yù)測價值。
將Stacking集成模型預(yù)測結(jié)果指標(biāo)與各單一算法預(yù)測指標(biāo)進行比較,如圖7所示。
圖7 Stacking集成與其他單一模型比較
從圖7中可以看到,總體上Stacking集成的結(jié)果比單一算法得到的結(jié)果好,具體表現(xiàn)為:模型準(zhǔn)確率、精確率與召回率都排在前列,圖7中,雖然RF的召回率(0.956 0)與DT算法的召回率(1.000 0)指標(biāo)略高于Stacking集成模型的召回率(0.913 9)指標(biāo),但是在RF與DT算法在精確率(0.467 8、0.285 9)與準(zhǔn)確率(0.743 4、0.433 8)都比Stacking集成模型低,分?jǐn)?shù)與Stacking集成模型相差不大。因此綜合考慮精確率、準(zhǔn)確率、召回率來說,Stacking集成模型是最優(yōu)的,驗證了Stacking集成模型具有算法融合并在融合的基礎(chǔ)上實現(xiàn)進一步改進的功能。
1) 本文基于機器學(xué)習(xí)中的Stacking思想,提出了一種用于臺風(fēng)災(zāi)害下停電空間預(yù)測的方法。仿真結(jié)果表明本文方法在停電空間分布的趨勢上與實際停電網(wǎng)格分布趨勢較為一致,驗證了本文模型在停電預(yù)測上的實際應(yīng)用價值。
2) 本文方法在停電預(yù)測上的預(yù)測準(zhǔn)確率達到0.777 6,在對實際已停電網(wǎng)格預(yù)測方面,成功預(yù)測為停電網(wǎng)格的比例(召回率)達到了0.914 0,說明了本文方法在預(yù)測停電方面的可行性及有效性。
3) 通過對比預(yù)測結(jié)果表明,Stacking集成通過對多個模型的集成融合,對單一模型的預(yù)測性能具有一定的提升。
4) 利用已有數(shù)據(jù),擴大停電預(yù)測研究區(qū)域,進一步驗證模型在不同區(qū)域的適用性,并根據(jù)現(xiàn)有電網(wǎng)系統(tǒng)災(zāi)害下的實時數(shù)據(jù)監(jiān)測接收技術(shù),而停電預(yù)測的實時更新功能將是下一步的重點研究方向。
[1] ??? 徐泰山, 郁琛, 等. 自然災(zāi)害下電網(wǎng)運行風(fēng)險控制策略探討[J]. 電力系統(tǒng)保護與控制, 2019, 47(10): 73-81.
CHANG Kang, XU Taishan, YU Chen, et al. Discussion of power system operation risk control strategy in natural disasters[J]. Power System Protection and Control, 2019, 47(10): 73-81.
[2] 黃偉, 黃廷城, 王立勇, 等. 基于態(tài)勢感知的電網(wǎng)臺風(fēng)預(yù)警防御框架研究綜述[J]. 電力系統(tǒng)保護與控制, 2018, 46(11): 162-169.
HUANG Wei, HUANG Tingcheng, WANG Liyong, et al. Research on typhoon early warning and defense framework of power grid based on situation awareness[J]. Power System Protection and Control, 2018, 46(11): 162-189.
[3] D'AMICO D F, QUIRING S M, MADERIA C M, et al. Improving the hurricane outage prediction model by including tree species[J]. Climate Risk Management, 2019, 25: 1-15.
[4] 黃勇, 魏瑞增, 周恩澤, 等. 臺風(fēng)災(zāi)害下輸電線路損毀預(yù)警方法[J]. 電力系統(tǒng)自動化, 2018, 42(23): 142-147.
HUANG Yong, WEI Ruizeng, ZHOU Enze, et al. Early warning of transmission line damage under typhoon disaster[J]. Automation of Electric Power Systems, 2018, 42(23): 142-147.
[5] 尹超雄, 唐武勤, 溫靈鋒, 等. 臺風(fēng)天氣下配電網(wǎng)可靠性的新型評估算法[J]. 電力系統(tǒng)保護與控制, 2018, 46(4): 138-143.
YIN Chaoxiong, TANG Wuqin, WEN Lingfeng, et al. A new method for reliability evaluation of distribution network considering the influence of typhoon[J]. Power System Protection and Control, 2018, 46(4): 138-143.
[6] 王永明, 殷自力, 李琳, 等. 臺風(fēng)災(zāi)害場景下考慮運行狀態(tài)的配電網(wǎng)風(fēng)險評估方法[J]. 電力系統(tǒng)及其自動化學(xué)報, 2018, 30(12): 60-65.
WANG Yongming, YIN Zili, LI Lin, et al. Risk assessment method for distribution network considering operation state in the scene of typhoon disaster[J]. Proceedings of the CSU-EPSA, 2018, 30(12): 60-65.
[7] 朱凌, 陳濤威, 周晨, 等. 考慮風(fēng)速風(fēng)向聯(lián)合分布的大風(fēng)災(zāi)害下電力斷線倒塔概率預(yù)測[J]. 電力系統(tǒng)保護與控制, 2019, 47(2): 115-122.
ZHU Ling, CHEN Taowei, ZHOU Chen, et al. Probability prediction of transmission line breakage and tower topple over under wind disaster considering the joint distribution of wind speed and wind direction[J]. Power System Protection and Control, 2019, 47(2): 115-122.
[8] 侯慧, 俞菊芳, 黃勇, 等. 臺風(fēng)侵襲下輸電線路風(fēng)偏跳閘風(fēng)險評估[J]. 高電壓技術(shù), 2019, 45(12): 3907-3915.
HOU Hui, YU Jufang, HUANG Yong, et al. Risk assessment of windage yaw trip of transmission lines under the attack of typhoon[J]. High Voltage Engineering, 2019, 45(12): 3907-3915.
[9] 陳瑩, 王松巖, 陳彬, 等. 臺風(fēng)環(huán)境下考慮地理高程信息的輸電通道結(jié)構(gòu)失效故障概率評估方法[J]. 電網(wǎng)技術(shù), 2018, 42(7): 2295-2302.
CHEN Ying, WANG Songyan, CHEN Bin, et al. Evaluation of the failure probability of power transmission corridors during typhoons using digital elevation information[J]. Power System Technology, 2018, 42(7): 2295-2302.
[10]包博, 程韌俐, 熊小伏, 等. 一種計及微地形修正的輸電線臺風(fēng)風(fēng)險預(yù)警方法[J]. 電力系統(tǒng)保護與控制, 2014, 42(14): 79?86.
BAO Bo, CHENG Renli, XIONG Xiaofu, et al. A typhoon risk early warning method for power transmission line considering micro-terrain correction[J]. Power System Protection and Control, 2014, 42(14): 79-86.
[11]王澤斌, 王松巖, 陳瑩, 等. 強臺風(fēng)環(huán)境下考慮微地形因素的輸電通道結(jié)構(gòu)安全概率評估方法[J]. 電力自動化設(shè)備, 2020, 40(1): 184-191.
WANG Zebin, WANG Songyan, CHEN Ying, et al. Safety probability assessment method considering micro-topography for transmission grid under strong typhoon environment[J]. Electric Power Automation Equipment, 2020, 40(1): 184-191.
[12]李彥斌, 韓穎, 張嶸, 等. 氣象因素對電力安全事故影響的模型[J]. 電網(wǎng)技術(shù), 2013, 37(6): 1683-1687.
LI Yanbin, HAN Ying, ZHANG Rong, et al. Research on impact model of meteorological factors on the power accidents[J]. Power System Technology, 2013, 37(6): 1683-1687.
[13]張勇軍, 陳超, 許亮. 基于模糊聚類和相似度的電力系統(tǒng)可靠性原始參數(shù)預(yù)估[J]. 電力系統(tǒng)保護與控制, 2011, 39(8): 1-5.
ZHANG Yongjun, CHEN Chao, XU Liang. Prediction of original reliability parameters of power system based on fuzzy clustering and similarity[J]. Power System Protection and Control, 2011, 39(8): 1-5.
[14] LIU Haibin, DAVIDSON R A, ROSOWSKY D V, et al. Negative binomial regression of electric power outages in hurricanes[J]. Journal of Infrastructure Systems, 2005, 11(4): 258-267.
[15] LIU Haibin, DAVIDSON R A, APANASOVICH T V. Spatial generalized linear mixed models of electric power outages due to hurricanes and ice storms[J]. Reliability Engineering & System Safety, 2008, 93(6): 897-912.
[16] HAN S R, GUIKEMA S D, QUIRING S M. Improving the predictive accuracy of hurricane power outage forecasts using generalized additive models[J]. Risk Analysis, 2009, 29(10): 1443-1453.
[17]侯慧, 耿浩, 肖祥, 等. 臺風(fēng)災(zāi)害下用戶停電區(qū)域預(yù)測及評估[J]. 電網(wǎng)技術(shù), 2019, 43(6): 1948-1954.
HOU Hui, GENG Hao, XIAO Xiang, et al. Research on prediction and evaluation of user power outage area under typhoon disaster[J]. Power System Technology, 2019, 43(6): 1948-1954.
[18] YUAN Shanshui, QUIRING S M, ZHU Ling, et al. Development of a typhoon power outage model in Guangdong, China[J]. International Journal of Electrical Power & Energy Systems, 2020, 117: 1-12.
[19] WANIK D W, ANAGNOSTOU E N, HARTMAN B M, et al. Storm outage modeling for an electric distribution network in Northeastern USA[J]. Natural Hazards, 2015, 79(2): 1359-1384.
[20]葉圣永, 王曉茹, 劉志剛, 等. 基于Stacking元學(xué)習(xí)策略的電力系統(tǒng)暫態(tài)穩(wěn)定評估[J]. 電力系統(tǒng)保護與控制, 2011, 39(6): 12-16, 23.
YE Shengyong, WANG Xiaoru, LIU Zhigang, et al. Power system transient stability assessment based on Stacking meta-learning strategy[J]. Power System Protection and Control, 2011, 39(6): 12-16, 23.
[21]鄧威, 郭釔秀, 李勇, 等. 基于特征選擇和Stacking集成學(xué)習(xí)的配電網(wǎng)網(wǎng)損預(yù)測[J]. 電力系統(tǒng)保護與控制, 2020, 48(15): 108-115.
DENG Wei, GUO Yixiu, LI Yong, et al. Power losses prediction based on feature selection and Stacking integrated learning[J]. Power System Protection and Control, 2020, 48(15): 108-115.
[22]程超鵬, 彭顯剛, 曾勇斌, 等. 相異模型下Stacking集成結(jié)構(gòu)的異常用電用戶識別方法[J]. 電網(wǎng)技術(shù), 2021, 45(12): 4828-4836.
CHENG Chaopeng, PENG Xiangang, ZENG Yongbin, et al. An abnormal power user recognition method for Stacking integrated structures with different models[J]. Power System Technology, 2021, 45(12): 4828-4836.
[23]吳建華. ArcGIS 軟件與應(yīng)用[M]. 北京: 電子工業(yè)出版社, 2017.
[24]鐘繼. 地形與地表類型對臺風(fēng)近地風(fēng)場多尺度模擬的影響研究[D]. 深圳: 哈爾濱工業(yè)大學(xué) (深圳), 2019.
ZHONG Ji. The impact of topography and land use on multi-scale simulation for near ground wind field of typhoon[D]. Shenzhen: Harbin Institute of Technology (Shenzhen), 2019.
[25]趙晨光, 周次明, 龐彥東, 等. 基于獨熱碼有限狀態(tài)機的斐索干涉解調(diào)相位補償方法[J]. 光子學(xué)報, 2020, 49(5): 1-9.
ZHAO Chenguang, ZHOU Ciming, PANG Yandong, et al. Phase compensation method of Fizeau interference demodulation based on one-hot encoded finite state machine[J]. Acta Photonica Sinica, 2020, 49(5): 1-9.
[26]周志華. 機器學(xué)習(xí)[M]. 北京: 清華大學(xué)出版社, 2016.
[27]李焱, 賈雅君, 李磊, 等. 基于隨機森林算法的短期電力負(fù)荷預(yù)測[J]. 電力系統(tǒng)保護與控制, 2020, 48(21): 117-124.
LI Yan, JIA Yajun, LI Lei, et al. Short term power load forecasting based on a stochastic forest algorithm[J]. Power System Protection and Control, 2020, 48(21): 117-124.
[28] YANG Jinshan, ZHAO Chenyue, YU Haotong, et al. Use GBDT to predict the stock market[J]. Procedia Computer Science, 2020, 174: 161-171.
[29]游文霞, 申坤, 楊楠, 等. 基于AdaBoost集成學(xué)習(xí)的竊電檢測研究[J]. 電力系統(tǒng)保護與控制, 2020, 48(19): 151-159.
YOU Wenxia, SHEN Kun, YANG Nan, et al. Research on electricity theft detection based on AdaBoost ensemble learning[J]. Power System Protection and Control, 2020, 48(19): 151-159.
[30]陳招安, 黃純, 張志丹, 等. 基于T型灰色關(guān)聯(lián)度和KNN算法的低壓配電網(wǎng)臺區(qū)拓?fù)渥R別方法[J]. 電力系統(tǒng)保護與控制, 2021, 49(1): 163-169.
CHEN Zhaoan, HUANG Chun, ZHANG Zhidan, et al. Topology identification method of a low voltage distribution network based on T-type grey correlation degree and KNN algorithm[J]. Power System Protection and Control, 2021, 49(1): 163-169.
[31] HOU Kaiyuan, SHAO Guanghui, WANG Haiming, et alResearch on practical power system stability analysis algorithm based on modified SVM[J]. Protection and Control of Modern Power Systems, 2018, 3(2): 119-125.
[32] AHMAD M W, REYNOLDS J, REZGUI Y. Predictive modelling for solar thermal energy systems: a comparison of support vector regression, random forest, extra trees and regression trees[J]. Journal of Cleaner Production, 2018, 203: 810-821.
[33]史佳琪, 張建華. 基于多模型融合Stacking集成學(xué)習(xí)方式的負(fù)荷預(yù)測方法[J]. 中國電機工程學(xué)報, 2019, 39(14): 4032-4041.
SHI Jiaqi, ZHANG Jianhua. Load forecasting based on multi-model by Stacking ensemble learning[J]. Proceedings of the CSEE, 2019, 39(14): 4032-4041.
[34]唐雅潔, 林達, 倪籌帷, 等. 基于XGBoost的雙層協(xié)同實時校正超短期光伏預(yù)測[J]. 電力系統(tǒng)自動化, 2021, 45(7): 18-27.
TANG Yajie, LIN Da, NI Chouwei, et al. XGBoost based bi-layer collaborative real-time calibration for ultra-short-term photovoltaic prediction[J]. Automation of Electric Power Systems, 2021, 45(7): 18-27.
A space prediction method for power outage in a typhoon disaster based on a Stacking integrated structure
HOU Hui1, CHEN Xi1, LI Min2, ZHU Ling2, HUANG Yong3, ZHU Shaohua1
(1. School of Automation, Wuhan University of Technology, Wuhan 430070, China; 2. Guangdong Power Grid Co., Ltd., Guangzhou 510080, China; 3. Electric Power Research Institute of Guangdong Power Grid Co., Ltd., Guangzhou 510080, China)
To improve disaster prevention and the mitigation ability of power grid companies, taking into account the power grid, meteorology and geography, a power outage spatial prediction method in the case of typhoon disasters is proposed from the perspective of statistical learning. First, data are collected in a 1 km×1 km grid, and standardized, classified with variable one-hot encoding and screening, and construction features are processed as input data for the model. Secondly, algorithms such as random forest, gradient boosting decision tree, adaptive boosting, K-nearest neighbor, support vector machine, extreme tree, decision tree, and XGBoost are selected to construct an outage space prediction model using Stacking integration technology. Finally, a city in Guangdong Province is taken as the research object to verify the performance of the model: the prediction accuracy rate for typhoon "Mujigae" is 0.777 6, and the recall rate is 0.914 0. The results verify the feasibility and effectiveness of the model in predicting power outage space in the case of typhoon disasters.
This work is supported by the University-Industry Collaborative Education Program of the Ministry of Education (No. 201902056044).
typhoon disaster; statistical learning; machine learning algorithm; Stacking; outage space prediction
10.19783/j.cnki.pspc.210580
教育部產(chǎn)學(xué)合作協(xié)同育人項目資助(201902056044);中國南方電網(wǎng)有限責(zé)任公司科技項目資助(GDKJXM20198441(036100KK52190053))
2021-05-17;
2021-07-14
侯 慧(1981—),女,博士,副教授,博士生導(dǎo)師,研究方向為電力系統(tǒng)風(fēng)險評估、能源互聯(lián)網(wǎng)、電動汽車與電網(wǎng)互動等;E-mail: houhui@whut.edu.cn
陳 希(1997—),男,通信作者,碩士研究生,研究方向為電力系統(tǒng)風(fēng)險評估。E-mail: 1763854410@qq.com
(編輯 許 威)