劉軍,王健,廖叔洋,李洋
(1.國網(wǎng)安徽省電力公司淮南供電公司,安徽淮南232001;2.國網(wǎng)安徽省電力公司滁州供電公司,安徽滁州239000;3.國網(wǎng)安徽省電力公司檢修公司,安徽合肥230061;4.國網(wǎng)安徽省電力公司亳州供電公司,安徽亳州236800)
電力系統(tǒng)連鎖故障多階段動態(tài)博弈防御模型
劉軍1,王健2,廖叔洋3,李洋4
(1.國網(wǎng)安徽省電力公司淮南供電公司,安徽淮南232001;2.國網(wǎng)安徽省電力公司滁州供電公司,安徽滁州239000;3.國網(wǎng)安徽省電力公司檢修公司,安徽合肥230061;4.國網(wǎng)安徽省電力公司亳州供電公司,安徽亳州236800)
近年來,國內(nèi)外發(fā)生了多起連鎖故障引起的大停電事故,阻止連鎖故障發(fā)展、避免大停電事故發(fā)生對保障電力系統(tǒng)安全穩(wěn)定運行具有重要的現(xiàn)實意義。為了防御由連鎖故障引發(fā)的大停電事故,提出一種考慮參與人有限理性的連鎖故障多階段動態(tài)博弈防御模型。基于故障方的有限理性假設(shè)和故障方行動的關(guān)聯(lián)性假設(shè),綜合考慮元件自身故障、外界環(huán)境、潮流轉(zhuǎn)移和隱性故障等因素對元件停運概率的影響,提出基于實時運行條件的元件停運概率表征有限理性的故障方不完美的選擇能力;根據(jù)可掌握的事故狀態(tài)信息,提出潮流轉(zhuǎn)移嚴重度和系統(tǒng)失負荷嚴重度表征故障方追求自身利益的意識;并進一步基于風(fēng)險分析方法,生成故障方的策略集合。從風(fēng)險理論的角度出發(fā),將運行風(fēng)險作為收益函數(shù),用于定量評估防御方行動的有效性。最后,以IEEE39節(jié)點系統(tǒng)為例,驗證了該模型的合理性。
連鎖故障;有限理性;多階段動態(tài)博弈;策略集合;收益函數(shù);電力系統(tǒng)
近年來,國內(nèi)外電力系統(tǒng)發(fā)生多起連鎖故障導(dǎo)致的大停電事故,造成了巨大的經(jīng)濟損失和災(zāi)難性后果[1-2]。大停電事故的調(diào)查報告指出,安全分析技術(shù)的缺乏和實時狀態(tài)感知能力的不足是導(dǎo)致調(diào)度部門不能阻止單一元件故障引起連鎖反應(yīng)的兩個主要原因[3]。迄今為止,研究人員在連鎖故障防御控制的研究領(lǐng)域做了很多工作。文獻[4]從預(yù)防線路連鎖跳閘角度提出了一種大電網(wǎng)在線分布式計算的多智能體控制方法,通過優(yōu)化切機切負荷控制策略來預(yù)防連鎖故障的發(fā)生。文獻[5]提出一種基于線路相關(guān)集的后備保護控制策略,可以實現(xiàn)后備保護與安全自動裝置的協(xié)調(diào)配合,防止大停電事故的發(fā)生。文獻[6]借鑒多智能體系統(tǒng)理論,提出了基于離線斷面功率傳輸極限分析的廣域協(xié)同預(yù)控制系統(tǒng),防止區(qū)域內(nèi)故障因調(diào)度控制失誤引發(fā)連鎖故障。
博弈論是以參與人之間有針對性的行為產(chǎn)生的互動過程為研究對象的理論。連鎖故障的發(fā)展過程中擾動與控制交替進行,相互影響,共同作用于電網(wǎng),具有互動性和對抗性,這使得博弈論適用于連鎖故障防御的研究。文獻[7]基于完全信息靜態(tài)博弈防御模型,研究預(yù)防針對性攻擊的最優(yōu)防御方案。文獻[8]基于不完全信息靜態(tài)博弈防御模型,研究預(yù)防針對性攻擊的最優(yōu)防御方案。上述博弈防御模型都是建立在假設(shè)故障方具有完全理性的基礎(chǔ)上,即認為故障方總是能夠有效識別并采取對電網(wǎng)影響最大的擾動,而實際上連鎖故障的發(fā)展過程包含了大量的不確定性因素,忽略這些因素會導(dǎo)致故障方生成的策略集合遺漏后果相對較小但風(fēng)險較大的故障,不能涵蓋當(dāng)前運行工況下防御方最需要關(guān)注的潛在危險擾動;此外,博弈過程的收益函數(shù)只考慮了系統(tǒng)的停電損失,未考慮控制措施產(chǎn)生的代價,因此不能準確評估控制措施的有效性。
在上述背景下,提出故障方的有限理性假設(shè)和故障方行動的關(guān)聯(lián)性假設(shè),建立一種考慮參與人有限理性的連鎖故障多階段動態(tài)博弈防御模型。通過風(fēng)險分析方法,生成故障方的策略集合,并從風(fēng)險理論的角度出發(fā),將運行風(fēng)險作為收益函數(shù)。最后,通過算例分析計算驗證了模型對連鎖故障防御的有效性。
多階段動態(tài)博弈是指博弈過程分為多個階段,且參與人的行動有先后順序的博弈,其博弈過程常用博弈樹的形式來表示。博弈樹由節(jié)點和枝組成,其中節(jié)點可分為決策節(jié)點和末端節(jié)點。決策節(jié)點i表示參與人i的行動起點,末端節(jié)點是博弈結(jié)束的地方,末端節(jié)點k唯一對應(yīng)著一個策略組合sk和一個收益組合uk。決策節(jié)點i下的枝j表示參與人i的可選策略sij,所有的枝即構(gòu)成參與人i的策略集合Si;每一條枝都是從一個決策節(jié)點出發(fā),并唯一的指向另一個決策節(jié)點或末端節(jié)點。具有二階段的連鎖故障博弈防御過程的博弈樹如圖1所示。
圖1 具有二階段的博弈樹
當(dāng)電網(wǎng)發(fā)生連鎖故障時,擾動與控制交替進行,如果將電網(wǎng)發(fā)生的擾動假設(shè)為一個“虛擬人”的行動,系統(tǒng)調(diào)度人員會針對其行動采取相應(yīng)的控制措施,并且雙方都力圖選擇對自己最為有利或最為合理的方案,那么連鎖故障的防御過程可表示為故障方和防御方的多階段動態(tài)博弈。多階段動態(tài)博弈包括參與人、策略集合和收益函數(shù),在連鎖故障的多階段動態(tài)博弈防御中:
1)參與人:包括故障方和防御方,將電網(wǎng)擾動定義為故障方,將調(diào)度部門定義為防御方。
2)策略集合:故障方的策略集合包括不同類型的擾動,防御方的策略集合包括調(diào)度部門采取的控制措施。
3)收益函數(shù):故障方的收益為造成的控制代價風(fēng)險和停電風(fēng)險,防御方的收益為付出的控制代價風(fēng)險和停電風(fēng)險,其中故障方的收益非負,防御方的收益非正,兩者收益之和為零。
為了便于分析連鎖故障在多個階段中的博弈過程,用D表示一條路徑中故障方或防御方的決策節(jié)點的個數(shù),即博弈過程的階段總數(shù),用d表示故障方和防御方處于第d個階段。則連鎖故障多階段動態(tài)博弈防御的數(shù)學(xué)模型可表示為
式中:I=(1,2)分別表示故障方和防御方;Sdi表示參與人i在第d個階段的策略集合;Ui是參與人i的收益函數(shù)。
結(jié)合電網(wǎng)中的實際情況,做如下假設(shè):
1)故障方的有限理性假設(shè)。參與人的理性體現(xiàn)在兩個方面,一是參與人決策行為的目標,二是參與人追求目標的能力;完全理性的參與人不僅以個人利益最大化為目標,而且具有準確的判斷選擇能力,也不會“犯錯誤”[9]。在連鎖故障發(fā)展過程中,由于大量不確定因素的影響,電網(wǎng)擾動雖然總會給系統(tǒng)造成負面影響,但每次發(fā)生的擾動卻不一定是當(dāng)前運行狀況下后果最嚴重的那一個。即故障方雖然以自身利益最大化為目標,但它并沒有完美的選擇能力,其選擇的策略可能不能滿足其追求最大利益的目標,因此故障方只具有有限理性。
2)防御方的完全理性假設(shè)。假設(shè)防御方具有完全理性,即其總能針對故障方的行動制定出最好的策略。
2.1 有限理性故障方的行動預(yù)測
2.1.1 故障方行動的概率預(yù)測
1)故障方初始行動的概率。當(dāng)故障方在初始階段采取行動時,即d=1時,故障方初始行動的概率主要受線路自身故障因素和外界環(huán)境因素的影響,取pw表示線路自身故障因素和外界環(huán)境因素引起線路停運的概率。
線路自身故障因素主要考慮線路老化失效,線路單位長度老化失效故障率記為λo;外界環(huán)境因素主要考慮天氣變化引起的線路偶然失效,線路單位長度偶然失效故障率記為λw[10]。綜合考慮線路自身故障因素和外界環(huán)境因素,線路單位長度故障率λ可表示為
在相同的時間內(nèi),線路的停運概率與線路的長度和單位長度故障率成正比[10],將所有線路長度與單位長度故障率乘積的歸一化數(shù)值作為線路停運概率,則故障方在初始階段采取第m個行動的概率為p11m
式中:λm為線路m的單位長度故障率;Lenm為線路m的長度;L為系統(tǒng)所有線路的集合。
2)故障方后續(xù)行動的概率。當(dāng)故障方在后續(xù)階段采取行動時,即d∈[2,D]時,故障方在第d個階段行動的概率會受到故障方在第d-1個階段行動的影響,包括潮流轉(zhuǎn)移和其他不明原因的因素的影響。
當(dāng)線路m嚴重過載時,即線路m的潮流超過其極限值,故障方在后續(xù)階段采取第m個行動的概率為1,即
當(dāng)無線路嚴重過載時,故障方在后續(xù)階段行動的概率主要考慮潮流轉(zhuǎn)移和其他不明因素的影響。
定義線路停運概率pzy,當(dāng)線路潮流F在正常水平時,線路停運概率主要受線路自身隨機故障因素的影響,此時pzy=pw;當(dāng)線路潮流在正常水平上限值與極限值Fmax之間時,假設(shè)pzy隨F的增大而線性增大[11]。潮流轉(zhuǎn)移引起的故障方在后續(xù)階段采取第m個行動的概率為
式中:Fm為線路m當(dāng)前的潮流值;Fnormalmax,m為線路m的潮流正常值上限;Fmax,m為線路m的潮流極限值。
其他不明原因的因素引起的故障方在后續(xù)階段采取第m個行動的概率記為。
綜合以上因素,故障方在后續(xù)階段采取第m個行動的概率pd1m為
2.1.2 故障方行動的后果預(yù)測
防御方能夠獲得故障發(fā)生后的事故狀態(tài)信息,然而大量信息的涌入往往導(dǎo)致調(diào)度人員無所適從或判斷錯誤[12],因此如何篩選出有效信息,并從這些信息中了解故障發(fā)生對電網(wǎng)造成的影響程度,是防御方采取行動的重要前提。為此分別定義潮流轉(zhuǎn)移嚴重度指標和系統(tǒng)失負荷嚴重度指標。
式中:Fm,0為線路m故障前承擔(dān)的有功功率;Fn為線路n在線路m故障后承擔(dān)的有功功率;Fn,0為線路n在線路m故障前承擔(dān)的有功功率;Fm,max為線路m潮流極限值;Fn,max為線路n潮流極限值。
式中:PS為系統(tǒng)總負荷量;PLj為線路m故障后母線j的失負荷量;N為系統(tǒng)所有母線的集合。
式中:omg1、omg2為權(quán)重因子,表示各指標在后果指標中的重要程度,可采用層次分析法求取。
2.1.3 故障方的策略集合
為了充分體現(xiàn)故障方在不確定性條件下追求最大收益的意識和不完美的選擇能力,定義風(fēng)險系數(shù)為
為了減少博弈樹的規(guī)模,故障方可通過設(shè)定閥值,選擇出風(fēng)險系數(shù)較大的故障方行動形成故障方的策略集合。
2.2 完全理性防御方的防御策略
在緩慢相繼開斷階段,連鎖故障的發(fā)展過程主要以線路過載的形式呈現(xiàn)[13]。據(jù)此提出針對潮流過載的過負荷控制。
根據(jù)直流潮流方程,節(jié)點k對線路m的靈敏度ηmk為
式中:ΔPk為節(jié)點k的注入功率變化量;i和j分別為線路m的首節(jié)點和末節(jié)點;ΔFij為線路m的潮流變化量;Δθi、Δθj分別為線路m兩端節(jié)點的相角;xij為線路m的電抗;eik和ejk分別為節(jié)點電納矩陣的逆矩陣中的元素。
在求取靈敏度矩陣后,可根據(jù)各功率注入節(jié)點靈敏度的大小來選擇最佳控制節(jié)點對[14],求取功率調(diào)整量。
2.3 博弈過程的風(fēng)險收益函數(shù)
使用失負荷量來衡量停電損失和控制代價。其中,控制代價為防御方的過負荷控制導(dǎo)致的失負荷量。停電損失主要包括3種類型:線路的連續(xù)開斷導(dǎo)致所有向某個或某幾個負荷供電的線路全部斷開;系統(tǒng)解列后,為保持2個電氣島有功分別平衡而加入控制措施后導(dǎo)致的失負荷量;系統(tǒng)失穩(wěn)后,為了使系統(tǒng)恢復(fù)穩(wěn)定而加入穩(wěn)定控制措施后導(dǎo)致的失負荷量[15]。
由于停電損失和控制代價只有在故障方行動后才會產(chǎn)生,其造成的影響受到行動概率的影響,因此本文從風(fēng)險的角度出發(fā),分別定義停電風(fēng)險、控制代價的風(fēng)險和運行風(fēng)險,將運行風(fēng)險作為博弈過程的收益函數(shù)。針對策略組合sk對應(yīng)的路徑,其停電風(fēng)險、控制代價的風(fēng)險和運行風(fēng)險分別為
進一步,可得到故障方和防御方在該路徑下的收益函數(shù)為
2.4 博弈過程的結(jié)束條件
博弈過程中故障方和防御方交替行動,只要故障方采取行動,防御方就要做出相應(yīng)的調(diào)整,因此只有故障方才能結(jié)束博弈??紤]兩種結(jié)束條件:當(dāng)故障方的行動次數(shù)到達預(yù)先設(shè)定的深度時;當(dāng)故障方的行動造成系統(tǒng)暫態(tài)失穩(wěn)。
2.5 連鎖故障多階段動態(tài)博弈防御流程
綜上所述,考慮參與人有限理性的連鎖故障多階段動態(tài)博弈防御流程為:
1)設(shè)定博弈過程的階段總數(shù)D,將故障方和防御方所處階段數(shù)d初始化為1;
2)預(yù)測故障方的行動,計算故障方采取各行動的概率和故障方行動的后果,并進一步計算故障方采取各行動的風(fēng)險系數(shù),生成故障方的策略集合;
3)故障方在策略集合中選擇風(fēng)險系數(shù)最大的策略并采取行動,判斷系統(tǒng)是否功角失穩(wěn),若失穩(wěn),則進入步驟6);若穩(wěn)定,則進入步驟4);
4)判斷是否有線路過載,若有線路過載,則防御方采取行動,消除線路過載,并進入步驟5);若沒有線路過載,則直接進入步驟5);
5)判斷故障方所處的階段是否達到階段總數(shù)D,若未達到,則d=d+1,并返回步驟2);若達到,則滿足博弈過程的結(jié)束條件,進入步驟6);
6)計算出故障方和防御方的收益函數(shù)u1和u2;
7)多階段動態(tài)博弈防御過程結(jié)束。
連鎖故障多階段動態(tài)博弈防御流程如圖2所示。
圖2 連鎖故障多階段動態(tài)博弈防御流程
仿真計算以IEEE39節(jié)點系統(tǒng)為例。其中各線路的潮流正常值的下限Fnmoirnmal都取0,線路m的潮流正常值的上限Fnmoarxmal取線路m的潮流額定值,線路m的潮流極限值Fmax取線路m潮流額定值的1.4倍,其他不明原因的因素引起的故障方在后續(xù)階段行動的概率記為取0.000 2。
3.1 故障方在初始階段的策略集合
計算故障方在初始階段行動的風(fēng)險系數(shù),按設(shè)定的閥值進行篩選,得到故障方在初始階段的策略集合如表1所示。
表1 故障方初始策略集合
3.2 連鎖故障的多階段動態(tài)博弈防御
選取風(fēng)險系數(shù)最大的線路27故障并退出運行作為故障方在初始階段的行動,分析連鎖故障的多階段動態(tài)博弈防御過程。
線路27開斷后連鎖故障的演化過程如表2所示。
表2 線路27開斷后的連鎖故障演化過程
針對表2的連鎖故障演化過程,根據(jù)圖3中多階段動態(tài)博弈防御流程,生成每個階段針對故障方行動的防御策略,具體如表3所示。
3.3 連鎖故障博弈過程的收益函數(shù)
根據(jù)表2和表3所示的連鎖故障過程,分別計算防御方未采取行動和采取行動時博弈過程的收益函數(shù),計算結(jié)果如表4所示。
表3 線路27開斷后的連鎖故障多階段動態(tài)博弈防御過程
表4 博弈過程的收益函數(shù)對比
文獻[16]指出,如果控制措施可使事件的風(fēng)險降低,并且其控制代價小于風(fēng)險降低的數(shù)值,則該控制可作為應(yīng)對該事件的選項,并具有經(jīng)濟上的可行性。從表4可以看出,防御方采取行動后,故障方的停電風(fēng)險收益降低了17.408,防御方的控制代價風(fēng)險收益只增加了8.142,故障方的運行風(fēng)險收益降低了9.266,因此本文的防御策略具有可行性。
提出連鎖故障多階段動態(tài)博弈防御的要素和假設(shè),構(gòu)造了連鎖故障的多階段動態(tài)博弈防御模型。
綜合考慮元件自身停運因素和潮流轉(zhuǎn)移因素對元件停運概率的影響,提出元件實時停運概率表征有限理性的故障方不完美的選擇能力;根據(jù)可掌握的事故狀態(tài)信息,提出潮流轉(zhuǎn)移嚴重度和系統(tǒng)失負荷嚴重度表征故障方追求自身利益的意識;基于風(fēng)險分析方法,生成有限理性故障方的策略集合,幫助調(diào)度人員了解當(dāng)前運行工況下最需關(guān)注的故障發(fā)展方向。
從風(fēng)險理論的角度出發(fā),將運行風(fēng)險作為收益函數(shù),不僅可以幫助調(diào)度人員了解故障帶來的影響,還可以定量評估出控制措施的有效性。
[1]PSERC.Resources for Understanding the Moscow Blackout of 2005[EB/OL].http://www.pserc.wisc.edu/MoscowBlackowt.htm. 2005(7).
[2]HINES P,BALASUBRAMANIAM K,SANCHEZ E C.Cascading failures in power grids[J].IEEE Potentials,2009,28(5):24-30.
[3]印永華,郭劍波,趙建軍,等.美加“8.14”大停電事故初步分析以及應(yīng)吸取的教訓(xùn)[J].電網(wǎng)技術(shù),2003,27(10):8-11.
[4]丁理杰,江全元,包哲靜,等.基于多智能體技術(shù)的大電網(wǎng)連鎖跳閘預(yù)防控制[J].電力系統(tǒng)自動化,2008,32(17):6-11.
[5]張瑋,潘貞存,趙建國.新的防止大停電事故的后備保護減載控制策略[J].電力系統(tǒng)自動化,2007,31(8):27-31.
[6]許婧,白曉民,黃鑌.應(yīng)對連鎖故障的廣域協(xié)同預(yù)控制系統(tǒng)研究[J].電網(wǎng)技術(shù),2013,37(1):131-136.
[7]HOLMGREN A J,JENELIUS E,WESTIN J.Evaluating strategies for defending electric power networks against antagonistic attacks[J].IEEE Transactions on Power Systems,2007,22(1):76-84.
[8]CHEN G,DONG ZY,HILL D J,et al.Exploring reliable strategies for defending power systems against targeted attacks[J].IEEE Transactions on Power Systems,2011,26(3):1 000-1 009.
[9]吳廣謀,呂周洋.博弈論基礎(chǔ)與應(yīng)用[M].南京:東南大學(xué)出版社,2009.
[10]史慧杰,葛斐,丁明,等.輸電網(wǎng)絡(luò)運行風(fēng)險的在線評估[J].電網(wǎng)技術(shù),2005,29(6):43-48.
[11]吳旭,張建華,吳林偉,等.輸電系統(tǒng)連鎖故障的運行風(fēng)險評估算法[J].中國電機工程學(xué)報,2012,32(34):74-82.
[12]薛禹勝.時空協(xié)調(diào)的大停電防御框架(二)廣域信息、在線量化分析和自適應(yīng)優(yōu)化控制[J].電力系統(tǒng)自動化,2006,30(2):1-10.
[13]王安斯.基于事故鏈的電網(wǎng)脆弱性評估與穩(wěn)定控制[D].武漢:華中科技大學(xué),2010.
[14]姚峰,張保會,周德才,等.輸電斷面有功安全性保護及其快速算法[J].中國電機工程學(xué)報,2006,26(13):31-36.
[15]滕林,劉萬順,貟志皓,等.電力系統(tǒng)暫態(tài)穩(wěn)定實時緊急控制的研究[J].中國電機工程學(xué)報,2003,23(1):64-69.
[16]薛禹勝,肖世杰.綜合防御高風(fēng)險的小概率事件:對日本相繼天災(zāi)引發(fā)大停電及核泄漏事件的思考[J].電力系統(tǒng)自動化,2011,35(8):1-11.
Multi Stage Dynamic Game Defense Model for Cascading Failures in Power System
LIU Jun1,WANG Jian2,LIAO Shuyang3,LI Yang4
(1.State Grid Huainan Power Supply Company,Huainan 232001,China;2.State Grid Chuzhou Power Supply Company,Chuzhou 239000,China;3.State Grid Anhui Maintenance Company,Hefei 230061,China;4.State Grid Bozhou Power Supply Company,Bozhou 236800,China)
Several blackout accidents have taken place both at home and abroad in recent years which caused by cascading failures.It is of great practical significance for the safety and the stable operation of power system to prevent the development of cascading failures and avoid the occurrence of blackouts.A model based on the multistage dynamic games with bounded rationality is proposed to defend against the blackout accident resulting from the cascading failures.Based on the hypothesis of bounded rationality of the fault and the correlation of its action,the component outage probability is proposed to betoken the imperfect selecting ability of the fault side with bounded rationality based on the real-time operating conditions,comprehensively considering the influence of the fault,external environment,power flow transfer,hidden failure and other factors on the component outage probability.Based on the possessed failure-state information,the severity of the power flow transfer and the load loss are proposed to represent consciousness of the fault side to pursue its own interests.The strategy sets are further generated on the basis of the risk analysis method.According to the risk theory,the operational risk is regarded as the payment function to quantify effectiveness of the action of the defense side.Finally,the IEEE 39-bus test system is chosen as an example to validate the rationality of the proposed model.
cascading failure;bounded rationality;multistage dynamic game;strategy set;payment function;power system
TM715
A
1007-9904(2017)05-0014-06
2016-12-07
劉軍(1990),男,從事電力系統(tǒng)繼電保護工作;王健(1990),男,從事電力系統(tǒng)繼電保護工作;廖叔洋(1990),男,從事電力系統(tǒng)繼電保護工作;李洋(1990),男,從事電力系統(tǒng)繼電保護工作。