劉家軍 劉俊玲 楊瀚鵬
(1. 西安理工大學(xué)電氣工程學(xué)院 西安 710048;2. 浙江華電器材檢測研究所有限公司 杭州 310000)
接觸網(wǎng)是特有的向電力機(jī)車供電的輸電網(wǎng)絡(luò),因其具有無備用、結(jié)構(gòu)復(fù)雜、露天設(shè)置等特點(diǎn)[1],需要對(duì)其進(jìn)行檢修以保證電力機(jī)車安全、高效運(yùn)行。目前電氣化鐵路日常運(yùn)營中缺乏一套靈活有效的檢修方案,現(xiàn)有的接觸網(wǎng)檢修方法都是采用試探法,此方法耗時(shí)長且沒有針對(duì)性,使得接觸網(wǎng)異?;蚬收蠒r(shí)得不到及時(shí)有效的檢修,并且不能給日常定期檢修提供任何參考依據(jù)。
因此,開發(fā)接觸網(wǎng)安全運(yùn)行在線監(jiān)測系統(tǒng)已經(jīng)是現(xiàn)代接觸網(wǎng)技術(shù)發(fā)展的必然趨勢,該系統(tǒng)包含了對(duì)接觸網(wǎng)各參數(shù)的監(jiān)測和基于ID3決策樹算法[2]的接觸網(wǎng)檢修方案等功能。通過利用ID3決策樹算法、ASP.NET網(wǎng)架結(jié)構(gòu)、Web技術(shù)、SQL Server2012數(shù)據(jù)庫技術(shù),實(shí)現(xiàn)對(duì)接觸網(wǎng)進(jìn)行靈活高效地監(jiān)測和檢修。監(jiān)測部分發(fā)現(xiàn)異?;蚬收蠒r(shí),彈窗報(bào)警提醒工作人員進(jìn)行檢修,并把這些異?;蚬收闲畔⒋嫒霐?shù)據(jù)庫,為以后檢修服務(wù)。日常定期檢修時(shí),先查詢故障信息庫,了解相應(yīng)故障發(fā)生類型和頻率,參考基于ID3決策樹算法的接觸網(wǎng)檢修方案對(duì)接觸網(wǎng)進(jìn)行檢修?;贗D3決策樹算法的接觸網(wǎng)檢修方案不僅提高了天窗檢修作業(yè)效率,推動(dòng)了檢修作業(yè)科學(xué)智能化,而且充分利用了接觸網(wǎng)日常運(yùn)行中出現(xiàn)的異?;蚬收闲畔⒁约皺z修所記錄的故障信息,使得檢修更加科學(xué)高效。
目前,接觸網(wǎng)檢修主要有周期檢修和狀態(tài)檢修兩種檢修模式,其中狀態(tài)檢修模式被普遍采用[3]。狀態(tài)檢修是一種預(yù)測性的檢修,它是根據(jù)對(duì)接觸網(wǎng)設(shè)備的檢測、統(tǒng)計(jì)、分析來診斷出設(shè)備的劣化程度,找出相應(yīng)的原因,并進(jìn)行針對(duì)性的檢修。同時(shí),又根據(jù)設(shè)備的使用年限,在達(dá)到使用壽命終極前進(jìn)行一次性的設(shè)備更換或切換[4]。文獻(xiàn)[4]在狀態(tài)檢修的基礎(chǔ)上提出了接觸網(wǎng)精益檢修方法,充分利用生產(chǎn)調(diào)度信息,采用需要原則對(duì)設(shè)備進(jìn)行檢修。文獻(xiàn)[5]提出了使用激光測量儀對(duì)接觸網(wǎng)某些設(shè)備進(jìn)行測量,若有異常則進(jìn)行修復(fù)。文獻(xiàn)[6]提出機(jī)械化檢修方式,該檢修方式明顯提高了勞動(dòng)生產(chǎn)率,縮短了接觸網(wǎng)檢修作業(yè)時(shí)間。文獻(xiàn)[7]提出一種可以帶電作業(yè)檢修的方案,即放電接地保護(hù)裝置檢修方案,此方案能保證接觸網(wǎng)設(shè)備按期檢修,預(yù)防事故的發(fā)生。
接觸網(wǎng)正常運(yùn)行是電氣化鐵路安全運(yùn)營的前提。當(dāng)接觸網(wǎng)某個(gè)裝置出現(xiàn)異?;蚬收蠒r(shí),需要立即對(duì)該裝置進(jìn)行檢修,且無故障時(shí)也要定期檢修。傳統(tǒng)的檢修通常采用試探法,對(duì)相關(guān)設(shè)備逐一進(jìn)行試探,找出異?;蚬收系脑?,使其恢復(fù)正常。該方法耗時(shí)長且準(zhǔn)確度低,當(dāng)某個(gè)異常因沒有及時(shí)檢修而導(dǎo)致故障時(shí),將直接影響牽引供電系統(tǒng)的正常運(yùn)行,嚴(yán)重時(shí)還會(huì)中斷電氣鐵路的行車功能[8]。同時(shí),定期檢修時(shí),要對(duì)整個(gè)接觸網(wǎng)進(jìn)行檢修,此過程仍缺乏科學(xué)靈活性,且很難發(fā)現(xiàn)潛在異常和故障。這些潛在異常,在定期檢修時(shí)是正常的,檢修完后運(yùn)行很短一段時(shí)間后可能會(huì)發(fā)生異?;蚬收?,這將增加檢修工作人員的工作量和不必要的經(jīng)濟(jì)損失。
基于ID3決策樹算法的接觸網(wǎng)檢修方案架構(gòu)分為三層,如圖1所示。第一層是人機(jī)交互的表示層,由故障信息管理、影響故障的因素和檢修方案組成。第二層是業(yè)務(wù)邏輯層,由表示層中所有相關(guān)信息之間的業(yè)務(wù)邏輯組成,實(shí)現(xiàn)邏輯判斷和相應(yīng)處理。第三層是訪問層,完成相關(guān)功能與數(shù)據(jù)庫和文檔之間的數(shù)據(jù)訪問。使用系統(tǒng)的用戶包括相關(guān)工作人員、鐵路技術(shù)總工和系統(tǒng)管理人員。
數(shù)據(jù)挖掘需要先確定挖掘?qū)ο蠹捌淠繕?biāo),選取合適的模型并進(jìn)行數(shù)據(jù)采集,然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理以便實(shí)施選擇的數(shù)據(jù)挖掘算法,最后對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行分析[9],流程如圖2所示?;贗D3決策樹算法的接觸網(wǎng)檢修方案的挖掘?qū)ο笫墙佑|網(wǎng)異常數(shù)據(jù)或故障數(shù)據(jù)。首先對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理,然后對(duì)處理好的數(shù)據(jù)實(shí)施選取好的挖掘算法[10],并對(duì)挖掘的結(jié)果進(jìn)行分析,得出預(yù)測的檢修方案。
目前接觸網(wǎng)異常或故障的主要現(xiàn)象包括:主導(dǎo)電回路電氣節(jié)點(diǎn)過熱、線索自電氣接續(xù)部分?jǐn)喙苫驍嚅_、線夾連接處燒傷、軟橫跨環(huán)流造成承力索懸吊滑輪處燒傷、絕緣子閃絡(luò)放電乃至擊穿、接觸網(wǎng)帶電部分對(duì)接地體放電、外界物體變化造成接觸網(wǎng)對(duì)地放電、弓網(wǎng)故障、接觸網(wǎng)參數(shù)變化等[11]。引起上述異?;蚬收系闹饕虬ǎ菏┕ぜ皺z修質(zhì)量不合格、接觸網(wǎng)部件變形或零件部分脫落、電聯(lián)結(jié)線夾未按規(guī)定安裝、電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng)、電力復(fù)合脂老化、線索、線夾額定載流量不滿足現(xiàn)場實(shí)際的負(fù)荷等。通過SQL Sever2012對(duì)故障數(shù)據(jù)進(jìn)行預(yù)處理,處理好的數(shù)據(jù)將用于 ID3算法構(gòu)建決策樹[12]。如“線索自電氣接續(xù)部分?jǐn)喙苫驍嚅_故障”可分為接觸線斷開、承力索斷開、供電線斷開和回流線斷開等,而引起線索斷開的主要因素包含電聯(lián)結(jié)線夾未按規(guī)定安裝、電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng)、電力復(fù)合脂老化和惡劣的天氣。表1~2是預(yù)處理后關(guān)于線索自電氣接續(xù)部分?jǐn)喙苫驍嚅_故障的部分?jǐn)?shù)據(jù),表1中的屬性均屬于線索故障,表2中的屬性是引起線索斷開故障的因素。屬性M表示電聯(lián)結(jié)線夾未按規(guī)定安裝;屬性R表示電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng);屬性Z表示電力復(fù)合脂老化;屬性L表示惡劣的天氣;屬性J表示線索是否發(fā)生自電氣接續(xù)部分?jǐn)喙苫驍嚅_故障。表中“1”表示“是”,“0”表示“否”。
表1 線索斷開故障訓(xùn)練樣本數(shù)據(jù)表
表2 影響線索斷開主要因素訓(xùn)練樣本數(shù)據(jù)表
ID3算法用于分類預(yù)測,通過構(gòu)建決策樹,得到需要預(yù)測的結(jié)果。ID3決策樹算法的關(guān)鍵是按照遞歸思想進(jìn)行信息增益和熵的計(jì)算?!靶畔㈧亍笔呛诵模?xùn)練集的不確定性越大,則對(duì)應(yīng)的信息熵的值就越大[13]。節(jié)點(diǎn)的測試屬性標(biāo)準(zhǔn)通過選擇最高信息增益的屬性來確定的,訓(xùn)練樣本子集通過該屬性對(duì)信息量分類并同時(shí)建立分支,再由遞歸方法建立各節(jié)點(diǎn)的分支,最終生成決策樹。
假設(shè)S的數(shù)據(jù)集中D為類標(biāo)記的元組訓(xùn)練集,假定類標(biāo)號(hào)的屬性有n個(gè)不同值,定義n個(gè)不同的類,設(shè)Ci中有樣本數(shù)Ci,D,則一個(gè)給定的樣本分類所需要的期望信息如式(1)所示
式中,D是元組的類標(biāo)號(hào);Pi是D中任意元組屬于類的非零概率,。選取屬性中最高信息增益的屬性作為給定集合S的測試屬性,用來計(jì)算每個(gè)屬性不同的信息增益,然后創(chuàng)建一個(gè)結(jié)點(diǎn)并給予標(biāo)記,給這個(gè)屬性的每個(gè)值創(chuàng)建分支,并根據(jù)這些分支進(jìn)行劃分樣本[15-16]。此算法不僅理論清晰,且計(jì)算簡單便捷,在較短時(shí)間內(nèi)就可生成一棵具有科學(xué)依據(jù)的決策樹,并在實(shí)際中得到廣泛應(yīng)用。
通過調(diào)用存儲(chǔ)在數(shù)據(jù)庫中異?;蚬收系臄?shù)據(jù),使用C#來編寫程序,運(yùn)用ID3決策樹算法來構(gòu)造決策樹,算法編程流程圖如圖 3所示,其偽代碼如下。
過程:函數(shù)TG(A,B)。生成node節(jié)點(diǎn);if:A中故障樣本均屬于類別C;將node節(jié)點(diǎn)標(biāo)記為C類節(jié)點(diǎn);end if;利用信息增益,比較屬性集B中各屬性信息增益值,值最大的屬性b*為最優(yōu)劃分屬性;for:b*的每一個(gè)值bv*;為node節(jié)點(diǎn)生成一個(gè)分支,令A(yù)v表示A在b*上取值為bv*的異?;蚬收蠘颖咀蛹?;if:Av為空,將此分支節(jié)點(diǎn)標(biāo)記為葉子結(jié)點(diǎn),類別標(biāo)記為A中樣本最多的類;else;將 TG(Av,B{b*})作為分支節(jié)點(diǎn);end if;end for;輸出:生成以node為根節(jié)點(diǎn)的一棵決策樹[17]。
接觸網(wǎng)運(yùn)行和檢修中出現(xiàn)的設(shè)備異?;蚬收霞捌溆绊懸蛩兀羌螦的數(shù)據(jù)來源。通過ID3算法,可以預(yù)測出接觸網(wǎng)某個(gè)設(shè)備發(fā)生異?;蚬收系脑颍欢ㄆ跈z修時(shí),通過調(diào)用該算法可預(yù)測某個(gè)設(shè)備可能出現(xiàn)某種異?;蚬收霞捌湓?,并對(duì)此進(jìn)行檢修。
接觸網(wǎng)的設(shè)備很多,故障情況也多種多樣,以線索故障為訓(xùn)練樣本,構(gòu)建決策樹。表1~2是從數(shù)據(jù)庫提取的30條某線索故障信息,以此作為訓(xùn)練樣本數(shù)據(jù)表。表1樣本數(shù)據(jù)集合總量N=30條,發(fā)生故障有18條,不發(fā)生故障有12條。假設(shè)P(x1)、P(x2)分別為“是”和“否”目標(biāo)屬性的概率,則P(x1)=18/30;P(x2)=12/30。因此給定樣本的目標(biāo)屬性信息熵由式 (1)可得如式(2)所示
通過計(jì)算得到該訓(xùn)練樣本目標(biāo)信息熵后,再計(jì)算信息增益獲得最優(yōu)的劃分屬性r*,使在此屬性下“是”“否”樣本的差異度最大。樣本各屬性的信息增益計(jì)算公式如式(3)所示
式中,r為樣本H的屬性;V為該屬性值的集合;Ent為信息熵。各屬性的信息增益為樣本H目標(biāo)信息熵與對(duì)應(yīng)屬性r信息熵的差值,通常信息增益值越大,用屬性r劃分得到的“純度提升”越大。因此,樣本H的最優(yōu)劃分屬性如式(4)所示
分別計(jì)算各屬性的信息熵和信息增益,接觸線斷開屬性信息熵和信息增益如式(5)~(6)所示
承力索斷開屬性信息熵和信息增益為如式 (7)~(8)所示
供電線斷開屬性信息熵和信息增益如式(9)~(10)所示
回流線斷開屬性信息熵和信息增益如式(11)~(12)所示
同理可得,表2中樣本的目標(biāo)屬性信息熵為I(P)=0.881 3;“電聯(lián)結(jié)線夾未按規(guī)定安裝”M屬性信息熵為0.836 8,信息增益為0.044 5;“電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng)”R屬性信息熵為0.650 1,信息增益為0.231 2;“電力復(fù)合脂老化”Z屬性信息熵為0.783 8,信息增益為0.097 5;“惡劣的天氣”L屬性信息熵為 0.881 3,信息增益為0。
由以上計(jì)算可得,表1信息增益最大的是“接觸線斷開”屬性,所以該屬性是決策樹的上層,把該屬性作為分裂屬性上層,并以此作為樹根節(jié)點(diǎn),每個(gè)屬性產(chǎn)生一個(gè)分支。此結(jié)果表明線索斷開故障最常發(fā)生的是接觸線斷開。表2信息增益最大的是“電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng)”屬性,以此屬性作為以上決策樹分支的節(jié)點(diǎn),表明該屬性是影響“線索是否發(fā)生自電氣接續(xù)部分?jǐn)喙苫驍嚅_”的最大因素。同時(shí)考慮各屬性之間的聯(lián)系,再通過分支得到相應(yīng)節(jié)點(diǎn),最后得出“線索斷開”故障最常發(fā)生的是“接觸線斷開”,而“電聯(lián)結(jié)線夾運(yùn)行過程中發(fā)生螺栓松動(dòng)”是此故障發(fā)生最大影響因素。因此,應(yīng)優(yōu)先檢查電聯(lián)結(jié)線夾是否發(fā)生螺栓松動(dòng),決策樹如圖4所示。
由以上訓(xùn)練樣本結(jié)果可知,針對(duì)接觸網(wǎng)各種故障,通過計(jì)算對(duì)應(yīng)的信息增益,獲得樣本中最優(yōu)劃分屬性,即獲得了最大限度劃分不同類別的屬性及其取值,由此可確定發(fā)生某種故障的最主要原因。ID3決策樹算法在每次分裂時(shí)選擇信息增益最大的屬性,作為本次分裂屬性。每次分裂就會(huì)使得樹長高一層,這樣逐步生長下去,就可以構(gòu)建一棵決策樹。而信息增益最大的屬性也就是決定發(fā)生某種異?;蚬收系淖畲笠蛩亍.?dāng)接觸網(wǎng)某個(gè)設(shè)備異?;蚬收蠒r(shí),通過調(diào)用ID3決策樹算法,可獲得影響該異常或故障的最大因素,然后工作人員先對(duì)該因素進(jìn)行檢查。如是由該因素引起的,則對(duì)其進(jìn)行相關(guān)維修;反之,對(duì)其他因素進(jìn)行檢查。該方案與對(duì)所有因素逐個(gè)進(jìn)行檢查的傳統(tǒng)方法相比,具有科學(xué)性、優(yōu)先性和快速性,在一定程度上避免了某些異常發(fā)展成故障,從而降低對(duì)牽引供電系統(tǒng)正常運(yùn)行的影響。此外,當(dāng)對(duì)某一段接觸網(wǎng)進(jìn)行定期檢修時(shí),該接觸網(wǎng)相關(guān)設(shè)備很多,影響設(shè)備不正常的原因也多種多樣,如仍采取以往的試探法,不僅耗時(shí)耗力,且準(zhǔn)確度相對(duì)較低。而基于ID3決策樹算法的檢修方案,可獲得各個(gè)設(shè)備發(fā)生某種異常或故障及導(dǎo)致該異?;蚬收系淖畲笥绊懸蛩兀?yōu)先對(duì)該因素進(jìn)行檢修。調(diào)用ID3決策樹算法的運(yùn)行結(jié)果如圖5所示。
本文所提的檢修方案是接觸網(wǎng)安全運(yùn)行在線監(jiān)測系統(tǒng)的一個(gè)功能模塊,從該監(jiān)測系統(tǒng)獲得接觸網(wǎng)主要設(shè)備異?;蚬收霞坝绊懺摦惓;蚬收弦蛩氐挠行?shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行處理分析,運(yùn)用ID3決策樹算法構(gòu)建出決策樹。通過決策樹發(fā)掘接觸網(wǎng)發(fā)生何種異?;蚬收霞捌鋵?dǎo)致此異?;蚬收系闹饕蛩?,從而獲得相對(duì)科學(xué)合理的檢修方案。以接觸網(wǎng)某個(gè)主要設(shè)備的部分歷史故障數(shù)據(jù)為訓(xùn)練樣本,對(duì)ID3決策樹算法構(gòu)建決策樹過程進(jìn)行分析計(jì)算,驗(yàn)證了該方案的可行性。此外,接觸網(wǎng)安全運(yùn)行在線監(jiān)測系統(tǒng)運(yùn)行結(jié)果顯示,基于決策樹 ID3算法接觸網(wǎng)檢修方案不但提高了檢修作業(yè)的靈活高效性和智能化水平,而且為基于數(shù)據(jù)挖掘的接觸網(wǎng)異?;蚬收蠙z修提供有價(jià)值的科學(xué)依據(jù)。該方案將應(yīng)用于西安鐵路局寶雞供電段的接觸網(wǎng)檢修作業(yè)中。