榮莉莉,李 群,于 振
(1.大連理工大學 系統工程研究所,遼寧 大連 116024;2.全球能源互聯網研究院,北京 102209)
近幾年,隨著我國各類突發(fā)事件的不斷發(fā)生,尤其是造成嚴重人員傷亡、財產損失以及國際不良影響的重特大事故,各級政府與企業(yè)對應急管理水平的不斷提高提出迫切需求,而作為應急管理工作的重要抓手,以應急預案為核心的應急管理體系建設則是重中之重,自2006年國務院頒發(fā)國家突發(fā)事件總體預案以來,全國各地方和企事業(yè)單位相繼開展應急預案的編制工作,初步形成了以“總體預案—專項預案—部門預案—企事業(yè)單位預案”為主線的應急預案體系[1],在近幾年突發(fā)事件應急過程中發(fā)揮了重要作用。但是,在現有應急管理體系中,應急預案可操作性差,應急演練與培訓缺少實戰(zhàn)性,應急處置缺少前瞻性、較為被動的問題在應急管理實踐中不斷暴露出來,為了進一步提升現有應急管理體系的效率,很多學者從不同角度和層面開展相關研究。在應急預案方面,劉鐵民[2]在總結國內外應急預案體系發(fā)展過程與經驗的基礎上,針對現有應急預案的頂層設計需求,分析并提出應急預案體系總體結構、功能分類及其相互關系,并建議在首先完成頂層愿景設計基礎上,再逐漸分階段實現并形成循環(huán)持續(xù)改進機制;薛元杰等[3]探究對照法在應急預案充分性、可行性、完整性、可接受性、符合性評估中的應用,并將應急準備能力提升作為應急預案修訂的目標。在應急準備方面,李湖生[4]提出以定性評估指標為主、定量評估指標為輔,并綜合考慮基礎風險水平差異的區(qū)域應急準備能力評估體系及其歸一化的綜合評分方法;江田漢等[5]建立突發(fā)事件應急準備脆弱性評估指標體系,并引入簡單加權求和法、秩和比法,并最終計算得出突發(fā)事件應急準備脆弱性指數。在情景構建與推演方面,劉鐵民[6]提出適用于我國重大突發(fā)事件情景基本概念、分類矩陣、構建程序、情景框架結構與要素內容等一些理論與方法;王永明[7]設計事故災難類重大突發(fā)事件情景構建概念模型,分析概念模型中的“機會窗”和“準備效益”等重要理念;盛勇等[8]從系統復雜性、開放式預先設想以及序貫性3個主要原則的角度理解突發(fā)事件情景演化的機理,構建了突發(fā)事件情景演化系統模型,并以此為基礎設計了突發(fā)事件情景網絡關鍵要素的提取方法;朱曉寒等[9]從自然災害鏈情景態(tài)勢組合推演框架構建、自然災害鏈情景描述、自然災害情景要素組合推演途徑3方面開展針對性研究。在電網因災(自然災害)受損方面,陳鵬云等[10]根據高壓電網故障統計資料,分析了中國電網中自然災害概況,并結合主要自然災害對電網損毀性影響的特征及其時空分布特征,指出目前中國高電壓主網的安全風險(大范圍冰災、大面積污閃、大面積線路覆冰舞動);門永生等[11]針對典型自然災害對電網重要設施影響的特征,構建了基于8類典型自然災害的電網重要基礎設施脆弱性評價指標體系;王興發(fā)等[12]在分析風災、洪澇、雷害、火燒山、污閃、地質災害和覆冰7類自然災害對電網造成主要影響的基礎上,從電網自然災害預警系統的目標與功能、預警指標體系、系統結構、信息資源的整合、預警事故集的生成5個方面進行系統構思和設計。
綜合以上現有研究成果可知,從應急預案、應急準備、情景構建、情景推演、事故后果模擬等角度開展針對性研究,進而提高整體應急管理水平,是目前業(yè)界的共識,但進一步分析可以發(fā)現,針對突發(fā)事件,尤其是電力突發(fā)事件這種夾雜著大量危險源、承載體與應急響應行為的復雜突發(fā)事件,開展相關演化過程的分析與預測始終是各項工作的前提與基礎,現有研究成果大多從對突發(fā)事件本身的類型和特點入手,借助相關行業(yè)經驗(定性為主),實驗、計算與仿真建模(定量為主)等手段,去總結歸納相關突發(fā)事件的演化規(guī)律,這種方法不但存在由于各種假設條件帶來的誤差,而且對于影響因素種類和數量均較多的復雜突發(fā)事件來說,具有較大的應用局限性。而近幾年,隨著大數據研究領域的快速發(fā)展,以大數據管理與應用為代表的相關方法、技術與工具逐漸成熟,已廣泛應用于各行各業(yè)[13-16]的相關指標分析與預測,本文即在以上業(yè)務與技術背景基礎上,提出將大數據方法與技術應用于電力突發(fā)事件應急情景規(guī)則的分析與發(fā)現上,為電力突發(fā)事件情景演化規(guī)則的獲取提供參考與借鑒。
總結并分析目前應急情景構建方面的研究與應用成果,情景構建的大體過程可以分為如下3個階段:
1)情景的篩選與確定階段:主要是站在安全與應急業(yè)務需求的角度,經過相關資料收集與分解、以事件為中心的收斂與評價、情景的集成與描述等過程[6],最終形成相關的事件情景規(guī)劃。
2)情景的細化與應用階段:主要是在第1階段確定的情景規(guī)劃基礎上,圍繞具體情景開展的細化與應用,側重于“情景-任務-能力”的提煉與對比應用。
3)情景的評估與改進階段:主要是在之前2個階段成果的基礎上,結合實際的事故處置以及應急演練,從情景設置、任務分解、能力準備等多個角度進行針對性評估,進一步完善相關情景構建的成果。
從以上情景構建的技術路線可知,相關“情景-任務-能力”內容是情景構建的主要產出。
一般來說,數據挖掘的算法主要包括分類、預測、聚類、關聯4種類型,而目標變量的類型(離散型或連續(xù)型)則是分類與預測的主要區(qū)別。從對突發(fā)事件應急情景推演的角度來說,大量事故案例數據、應急演練數據等以及情景構建產出的“情景”與“任務”數據,顯然可以作為監(jiān)督學習的訓練集,目前主要的分類算法包括決策樹、邏輯回歸等,預測算法包括線性回歸、SVM、神經網絡等,而以上模型算法在相關數據挖掘工具或平臺下的實現主要包括:IBM SPSS Modeler、Mahout、Spark MLlib等。
近幾年,隨著大數據技術,尤其是相關存儲與管理平臺的快速發(fā)展,大數據與各行各業(yè)的結合速度明顯加快,為了將先進、成熟的大數據技術應用于應急行業(yè),從業(yè)務層面上,構建大數據與情景構建的對接模式,如圖1所示。
圖1 大數據與情景構建間的業(yè)務邏輯說明Fig.1 Business logic illustration between big data and scenario construction
由圖1可知,安全與應急大數據是所有業(yè)務開展的基礎,主要由案例數據、演練數據以及相關“情景構建”數據3方面組成;而經過相關針對性的案例分析、過程評估以及情景分析,生成典型突發(fā)事件案例的情景數據集,每個情景數據集均需從情景的時間順序和情景狀態(tài)2方面進行描述;在經過預處理的情景數據集上,綜合運用相關的數據挖掘方法與技術,最終得出典型突發(fā)事件的情景演化規(guī)則。
基于電力歷史應急大數據的應急情景庫是開展“情景—構建”和“情景—應對”的基礎和前提,也是開展情景規(guī)則發(fā)現的數據基礎和物理前提條件,本文在大量歷史電力應急數據的基礎上,利用相關的數據挖掘和分析技術,實現對電力突發(fā)事件發(fā)展和影響規(guī)律進行分析,進而從事件演化層面(主要指自然災情的變化和發(fā)展)、事件后果層面(主要指電力行業(yè)相關的事故后果)和突發(fā)事件應對層面(包含:應急指令的發(fā)布、應急資源的調度等)進行相關應急情景庫的設計與構建。
應急情景庫的總體架構如圖2所示。
圖2 應急情景庫總體架構Fig.2 Overall architecture of emergency scenario library
由圖2可知,電力突發(fā)事件的應急情景庫主要由“事件演化情景庫”、“事件后果情景庫”和“事件應對情景庫”3部分組成;“事件演化”導致了“事件后果”,而“事件后果”和“事件演化”一同導致了“事件應對”行為的產生;而“情景集成”主要是通過“事件演化”、“事件后果”以及“事件應對”3類數據中的“時間”維度進行關聯,最終得到的“應急情景庫”即是進一步開展“情景規(guī)則發(fā)現”(匯總統計和數據挖掘模型)的對象(輸入),故在數據結構和數據質量2個方面均需符合相關方法和模型的要求。
在明確了應急情景庫的總體架構后,需要在邏輯層面、物理層面分別設計與實現“事件演化情景庫”、“事件后果情景庫”和“事件應對情景庫”,而在此過程中,既需要采用關系模型設計數據“實體—關系”結構,還需要選擇具體的關系數據管理系統(如:SQLSERVER或ORACLE)進行物理實現,同時,有關業(yè)務數據的抽取、轉換與加載(ETL)也是相關實現的關鍵要點,限于篇幅本文給出相關庫表的邏輯結構說明并簡要說明ETL過程。
2.2.1 應急情景庫的邏輯結構說明
1)事件演化情景庫
事件演化情景庫主要描述電力突發(fā)事件的發(fā)生、發(fā)展與結束的全過程,按照時間軸和一定的時間間隔進行存儲和表達,此外,由于本文所指的電力突發(fā)事件主要是指自然災害,故還需要有一定時間區(qū)間、一定空間區(qū)域范圍的氣象監(jiān)測數據,因此,可以概括為“事件演化情景索引表”和“極端天氣事件演化情景信息表”2個表。其中,事件演化情景索引表包括:事件編號、事件名稱、事件類型、事件開始時間、事件結束時間、事件影響區(qū)域等數據項;極端天氣事件演化情景信息表包括:氣象站站點id、最高溫、最低溫、天氣類型、濕度、風力、風向、氣壓、降水量等數據項。
2)事件后果情景庫
事件后果情景庫主要描述電力突發(fā)事件發(fā)生后給電網的正常運行帶來的不良后果,按照后果類型可以大體劃分為:人員傷亡、重要客戶斷電、變電站受損、輸電線路受災等,按照時間軸對某次突發(fā)事件的后果進行存儲和表達,包括:后果發(fā)生時間、后果發(fā)生地點、后果發(fā)生地點坐標、事件后果類型、死亡人員數量、重傷人員數量、輕傷人員數量、斷電重要客戶名稱、受損變電站名稱、故障輸電線路名稱等數據項。
3)事件應對情景庫
事件應對情景庫主要描述電力突發(fā)事件發(fā)生后,各級應急單位(部門)所采取的相應應對措施,具體表現為相應應急指令的下達,按照時間軸對某次突發(fā)事件發(fā)生后的不同應急主體所下達的應急指令進行存儲和表達,這里所說的應急指令涵蓋了應急預案的啟動、應急預警級別的確定和發(fā)布,應急響應級別的確定和發(fā)布,應急資源的調動等所有應對措施,包括:應急指令下達的時間、下達應急指令的主體、接受應急指令的受體、應急指令的內容、應急指令的類型、應急資源調動類型、應急資源調動數量等數據項。
2.2.2 基于應急情景庫的數據抽取、轉換與載入
在應急情景庫的邏輯設計和物理結構實現基礎上,需要在不同來源的數據基礎上進行抽取、轉換,最終得到一定質量標準的集成數據進行批量導入,以氣象監(jiān)測數據為例說明如下。
1)數據準備:電網現行的防臺抗臺業(yè)務系統中,有多個粒度、多個時間區(qū)間、多個地理范圍的氣象信息,為了與相關的臺風信息、電網因災(受損)信息等進行集成,需要確定“地理區(qū)域”和“時間區(qū)間”2個維度的具體取值范圍,為下一步ETL工作提供數據提取的條件,如以2016年9月登陸我國的某臺風為例,選擇的“地理區(qū)域”為“福建省”、“時間區(qū)間”為“2016-09-10 14:00”到“2016-09-16 23:00”。
2)基于Kettle的ETL:在上一步得到的氣象監(jiān)測數據以及“地理區(qū)域”、“時間區(qū)間”的條件基礎上,利用Kettle輔助工具開展相關ETL工作,共獲得126條記錄數據,如圖3所示。
在應急情景庫的構建實現以后,以“時間”為索引的“災情事件—氣象監(jiān)測數據—災損數據—事件應對數據”的數據主線即建立起來,而通過相關的情景規(guī)則發(fā)現方法進一步分析、獲得這些數據之間的邏輯關系(規(guī)則)則是電力應急工作更為迫切需要的。為了更清晰地表達基于應急情景庫的情景規(guī)則發(fā)現方法,本文首先提出1個基礎性的電力應急情景庫整體邏輯視圖,如表1所示。需要說明的是:表1中的氣象監(jiān)測數據、電網災損數據以及應急投入數據等大類下的具體數據項可以根據實際應用過程中掌握的數據進行擴展,如:在進行雨雪冰凍災情的情景規(guī)則發(fā)現時,可能會增加“濕度”、“天氣類型”等氣象監(jiān)測數據項,以及“融冰裝置”等應急投入數據項。
圖3 氣象監(jiān)測數據ETL結果Fig.3 ETL results of meteorological monitoring data
表1 電力應急情景庫整體邏輯視圖Table 1 Overall logical view of electric power emergency scenario library
從表1可以看出,按照表1結構存儲、載入的各類業(yè)務數據在“時間”維度上進行了統一和集成,這些數據往往來自于災后的匯總統計,具有良好的數據質量,這就為后面的情景規(guī)則分析與發(fā)現提供了基礎,本文提出的情景規(guī)則分析與發(fā)現方法主要包括:基于數據統計的規(guī)則發(fā)現和基于數據挖掘的規(guī)則發(fā)現2類。
1)基于數據統計的規(guī)則發(fā)現
基于數據統計的規(guī)則發(fā)現是指在表1結構下存儲的各類業(yè)務數據基礎上,進行多角度的數據匯總和統計,并重點提取各類匯總統計結果在“時間”維度上的實際業(yè)務意義。如:以某次臺風為例,根據收集到的臺風導致的變電站故障數據,可以匯總得到如圖4所示的時序圖,其中,橫軸表示時間距離(起始時間為:2014-07-20 02:01:00),單位:h;縱軸表示變電站故障的總數,單位:個。從圖4可以看出,在最初的80 h左右(以2014-07-20 02:01:00的故障記錄為原點),故障變電站的總數基本在100個左右,且發(fā)展較為緩慢;但從大約80 h以后,故障變電站的數量激增,直至120 h左右的400個故障點,臺風導致的變電站故障數量增長迅速,相應故障點增速可以達到18.69個/h,這種故障點數量的增長速度可以為以后同類、相似強度的臺風應急提供故障點數量的初步預測。
圖4 基于時間序列的變電站故障數量變化(某次臺風影響)Fig.4 Quantity change of fault transformer substations based on time sequence (affected by a certain typhoon)
2)基于數據挖掘的規(guī)則發(fā)現
基于數據挖掘的規(guī)則發(fā)現是指在表1結構下存儲的各類業(yè)務數據基礎上,應用相應的數據挖掘模型和算法,對相應的目標項進行分類和預測。譬如:用聚類分析模型算法進行氣象監(jiān)測數據的分類預測,進而得到相應的災損和應急投入預測,如圖5~7所示。其中,如圖5所示,進行聚類分析的臺風信息數據項包括:登陸時強度等級、登陸最大風力(級)、登陸最大風速(m/s)、持續(xù)時間(h)和過程降雨量(mm)等;如圖6所示,采用的聚類分析模型算法包括“兩步模型算法”和“K-means模型算法”,模型算法的實現借助IBM SPSS Modeler工具實現;如圖7所示為最終的聚類分析結果,從中可以看出,本文假設的“虛擬臺風1”被分類為“聚類-1”,可以參考的臺風包括“云娜”、“麥莎”等臺風。
圖5 用于聚類分析的臺風基本信息數據集Fig.5 Dataset on basic information of typhoon used in cluster analysis
圖6 臺風聚類分析模型構建Fig.6 Construction of cluster analysis model on typhoon
圖7 臺風聚類分析結果Fig.7 Result of cluster analysis on typhoon
1)在充分分析現有情景構建理論與方法的基礎上,提出將電力歷史大數據相關分析與挖掘技術應用于復雜電力突發(fā)事件的情景規(guī)則分析與發(fā)現領域,并從業(yè)務層面給出相關邏輯對接模式。
2)提出基于電力歷史應急大數據的應急情景庫設計與實現方法,并圍繞相關歷史數據的抽取、轉化和加載(ETL)提供了具體技術方案。
3)在電力應急情景庫的基礎上,提出“基于數據統計的規(guī)則發(fā)現”和“基于數據挖掘的規(guī)則發(fā)現”2類情景規(guī)則發(fā)現方法,并分別進行了舉例說明。