石恒初,楊橋偉,游 昊,楊遠(yuǎn)航,陳曉帆
(云南電力調(diào)度控制中心,昆明 650011)
變電站中二次系統(tǒng)裝置眾多,各類線纜種類繁多,包括繼電保護(hù)裝置、安全自動裝置、故障錄波裝置、繼電保護(hù)故障信息系統(tǒng)子站、網(wǎng)絡(luò)交換機(jī)、智能終端裝置等。變電站內(nèi)的二次接線非常復(fù)雜,而二次接線的準(zhǔn)確與否關(guān)系著電網(wǎng)運(yùn)行安全,因而具有非常重要的地位。如此復(fù)雜的接線結(jié)構(gòu)必將定期對回路接線進(jìn)行校核。面對復(fù)雜龐大的校核,給工作人員造成了巨大的工作量。
當(dāng)前的端子排校核工作中,以人工校核為主,通常以獲取的CAD圖紙(通常為紙質(zhì)文件)為基礎(chǔ),去現(xiàn)場面對實(shí)際端子排接線情況,通過圖紙一一對比現(xiàn)場端子排所在的屏柜、端子號、回路號、電纜編號,以及端子的對向端子情況。在此過程中,圖紙的審查尤為重要,是其基礎(chǔ)工作,此項(xiàng)工作費(fèi)工耗時,往往需要多人多次審核才能避免因?yàn)槿藛T工作疏忽造成的隱患。從工作流程不難看出,二次回路的圖紙的校核工作多是基于固有規(guī)則開展,具有重復(fù)性、機(jī)械性、規(guī)則性的特點(diǎn),這給人工智能技術(shù)的應(yīng)用提供了便利條件。
本文在研究了變電站二次接線圖現(xiàn)有圖紙[1]的繪圖規(guī)則的基礎(chǔ)上[9-10],對將單位信息欄、通用圖紙連接關(guān)系拐角、特殊圖紙A連接管腳等進(jìn)行標(biāo)簽整理[2-6],在分類的數(shù)據(jù)集上用k-means聚類方式得出適合操作檢測的參數(shù),并基于YOLO目標(biāo)檢測算法進(jìn)行目標(biāo)檢測,訓(xùn)練得到最佳的圖形檢測模型,通過圖像檢測檢測圖紙質(zhì)量,基于OCR識別算法進(jìn)行文字識別,訓(xùn)練得到最佳的檢測模型,進(jìn)一步識別獲取圖紙中的端子排號以及端子號。利用語義分割[7-8]判斷出圖紙中的端子間的連接關(guān)系,從而建立圖紙中的端子排信息的數(shù)據(jù)臺賬,為工作人員檢索和現(xiàn)場識別提供了準(zhǔn)確的接線信息,避免了重復(fù)的人工勞動,保障電網(wǎng)接線及校核工作的高效運(yùn)行。
利用AI圖像深度學(xué)習(xí)技術(shù)對二次回路涉及的圖紙(CAD、PDF、圖片、紙質(zhì)等格式的圖紙)進(jìn)行一致性、規(guī)范性檢驗(yàn),其流程圖如圖1所示,以實(shí)現(xiàn)機(jī)器代替部分人力工作,達(dá)到降低工作量的目的,同時提升核對工作質(zhì)量。
圖1 二次回路連接關(guān)系智能識別流程圖
圖2 K均值算法流程圖
圖3 二次回路設(shè)計(jì)圖
圖4 二次回路端子排設(shè)計(jì)圖
圖5 識別準(zhǔn)確率分析圖
步驟1:根據(jù)業(yè)需要,收集電氣二次回路歷史圖紙;
步驟2:根據(jù)歷史電力圖紙,收集歷史電力圖紙,并對歷史電力圖紙進(jìn)行分析;
步驟3:針對變電站內(nèi)圖紙按照繪制方式、所屬設(shè)計(jì)院進(jìn)行統(tǒng)計(jì)分類,根據(jù)所述圖紙類型和/或繪圖方式,對歷史電力圖紙進(jìn)行場景標(biāo)記;
步驟4:將圖紙進(jìn)行冗余切割;
步驟5:將上述數(shù)據(jù)集進(jìn)行標(biāo)簽整理,分別為單位信息欄、通用圖紙連接關(guān)系拐角、特殊圖紙A連接管腳等。在分類的數(shù)據(jù)集上用k-means聚類方式得出適合操作檢測的參數(shù),并基于YOLO[9-12]改進(jìn)目標(biāo)檢測算法進(jìn)行目標(biāo)檢測,訓(xùn)練得到最佳的圖形檢測模型,基于OCR識別算法進(jìn)行文字識別,訓(xùn)練得到最佳的文字檢測模型;
步驟6:對分類后的電力圖紙通過文字識別算法進(jìn)行文字識別,得到圖紙文字?jǐn)?shù)據(jù),且對分類后的電力圖紙通過目標(biāo)檢測算法進(jìn)行目標(biāo)檢測,得到圖紙連接線數(shù)據(jù)和圖紙電氣元件數(shù)據(jù);
步驟7:基于預(yù)訓(xùn)練模型,對所述圖紙文字?jǐn)?shù)據(jù)、圖紙連接線數(shù)據(jù)和圖紙電氣元件數(shù)據(jù)進(jìn)行訓(xùn)練,得到不同圖紙類型和/或繪圖方式的文字檢測模型和圖形檢測模型。
步驟8:根據(jù)所述目標(biāo)檢測模塊,對欲檢測的電力圖紙進(jìn)行分析,提取該電力圖紙所包含的文字信息、電氣元件信息以及連接線信息;
步驟9:根據(jù)所述文字信息、電氣元件以及連接線信息,生成電力圖紙臺賬數(shù)據(jù)。
對圖紙進(jìn)行場景標(biāo)記時,首先對不同設(shè)計(jì)院的圖紙進(jìn)行收集整理,將通用的端子排之間的關(guān)系與不同的圖紙進(jìn)行融合(可包括:針對不同單位的圖紙,實(shí)現(xiàn)圖紙模式與單位關(guān)聯(lián)綁定,并將關(guān)聯(lián)結(jié)果動態(tài)寫入識別算法,然后對圖紙中出現(xiàn)的關(guān)聯(lián)管理鏈接圖像進(jìn)行標(biāo),并進(jìn)行訓(xùn)練,其目的是方法在使用過程中,一旦導(dǎo)入圖紙即可知道該圖紙為某種模板的圖紙,并在后期圖紙解析的方法中調(diào)用該模板對應(yīng)的圖紙解析方法)。
同時,在圖紙中對圖紙中的單位區(qū)域進(jìn)行標(biāo)注。標(biāo)注采用模型檢測標(biāo)注方法,即通過矩形標(biāo)注圖紙中單位出現(xiàn)的位置,例如:設(shè)起始點(diǎn)坐標(biāo)為(x,y),寬度為w,高度為h,從圖紙信息中標(biāo)注此處單位信息欄以及連接關(guān)系進(jìn)行標(biāo)記;提取上述標(biāo)記過程的關(guān)鍵內(nèi)容,包括(x,y,w,h),其中,(x,y)為標(biāo)記邊界框的左上角坐標(biāo),w,h分別為標(biāo)記邊界框的寬和高,經(jīng)過計(jì)算擴(kuò)大后的標(biāo)記邊界框區(qū)域?yàn)?其中,為左上角坐標(biāo),為擴(kuò)大后邊界框的寬和高。至此,關(guān)于不同場景的數(shù)據(jù)集處理完成。
為了更好的對文字進(jìn)行識別,可在根據(jù)所述檢測模型權(quán)重和預(yù)先配置的預(yù)訓(xùn)練模型,在歷史電力圖中進(jìn)行訓(xùn)練之前,將電力圖紙進(jìn)行冗余切割,切割為預(yù)定大小的圖片。具體步驟如下:
1)先將整張圖片進(jìn)行640×640像素的劃分,將一張圖片劃分為多張圖片。
2)為避免在劃分像素后出現(xiàn)的文字不完整的問題,對劃分過程進(jìn)行冗余,即增加像素的冗余寬度和冗余高度,例如:完整圖片的像素為6400×18000。需要對其進(jìn)行640×640像素的切割,冗余像素的寬度和高度分別為40和100,首先切割第一部分的的圖片的起始坐標(biāo)為(0,0),寬度為640,高度為640,切割的第二張圖片的其實(shí)坐標(biāo)為(600,540),寬度和高度分別為640×640;最終得出計(jì)算公式:W0,h0為圖片總寬度,n為當(dāng)前要切割圖片的編號(n>=0),w1,h1為冗余像素,Wa和Ha為切割后每張圖片的大小,由此可得:單張圖片像素切割的起始位置x坐標(biāo):x=(n*Wa)-(n*w1),當(dāng)x>W(wǎng)0時終止;單張圖片像素切割的起始位置y坐標(biāo):y=(n*Ha)-(n*h1),當(dāng)y>h0時終止。
3)圖片冗余切割完成后,將對圖片中的文字進(jìn)行標(biāo)記,標(biāo)記采用通用的標(biāo)記方法進(jìn)行標(biāo)記,即標(biāo)記方式為在圖片中圈定文字,在標(biāo)記完成后將確定的文字正確的輸入到訓(xùn)練集合中;
4)標(biāo)記生成的數(shù)據(jù)信息包括圖片中文字的正確內(nèi)容,以及該段文字在圖片中的位置坐標(biāo)(x,y,w,h),并利用json數(shù)據(jù)結(jié)構(gòu)暫時保存,對于OCR識別,端子排中的圖紙識別是一個特殊領(lǐng)域,由于字體的不同、特殊字符的加入、英文中文數(shù)字的混淆使用,需要對OCR識別對圖紙的場景進(jìn)行重新的訓(xùn)練。
利用Android終端設(shè)備,通過導(dǎo)入pdf文件或者拍攝現(xiàn)場圖紙高清圖片,Android終端設(shè)備會自動將圖片送入圖像分析隊(duì)列。而Android終端設(shè)備內(nèi)置人工智能圖像分析算法,利用場景分類技術(shù)將圖紙輪廓及邊界進(jìn)行范圍標(biāo)定和修正。然后將圖片進(jìn)行冗余切割,記錄下切割位置,利用OCR算法[13]對切割后圖片的文字進(jìn)行識別。包括識別內(nèi)容及識別坐標(biāo)。對上述切割后的圖片通過目標(biāo)檢測手段進(jìn)行連接節(jié)點(diǎn)檢測。并記錄節(jié)點(diǎn)位置坐標(biāo)。依據(jù)切割后檢測所得節(jié)點(diǎn)坐標(biāo),識別所得文字坐標(biāo),結(jié)合切割點(diǎn)坐標(biāo)對坐標(biāo)點(diǎn)進(jìn)行復(fù)原計(jì)算(由于所得是將圖片冗余切割后的實(shí)際信息,其中包含了文本內(nèi)容,以及在切割后圖片的相對坐標(biāo),此時應(yīng)該將單個圖片的相對坐標(biāo)轉(zhuǎn)換為實(shí)際坐標(biāo),轉(zhuǎn)換公式如下:
假設(shè),完整圖片的寬高為W,H,切割圖片的寬高為(Wn,Hn),切割圖片為水平第n張,垂直第m張圖片,圖片的冗余寬高為W0,H0;
所識別文字坐標(biāo)為Xn1,Yn1,寬高為Wn1,Hn1。那么該文字所在完整圖片的坐標(biāo)(x,y)以及寬高(w,h)分別為
x=(n*Wn1)-(W0*n);
y=(m*Hn1)-(H0*n);
w=Wn1*(W/Wn);
h=Hn1*(H/Hn));
對完整圖片利用語義分割算法[14-16]進(jìn)行連接線檢測,結(jié)合上述復(fù)原后文字坐標(biāo)以及節(jié)點(diǎn)坐標(biāo)進(jìn)行匹配運(yùn)算,最終確定對應(yīng)關(guān)系;依據(jù)對應(yīng)關(guān)系分別找出圖紙中端子兩側(cè)的端子排號、端子號、回路號,以及相關(guān)的電纜編號和電纜編號所接對向回路號。
k-means聚類分析(k-means clustering)源于信號處理中的一種向量量化方法,其核心為:以空間中的k個點(diǎn)為聚類中心,對最靠近它們的對象歸類,具體計(jì)算過程通過迭代的方法,逐次更新各聚類中心的值,直到最后收斂得到最優(yōu)的聚類結(jié)果,其目的就是為了使簇內(nèi)數(shù)據(jù)對象之間的相似性盡可能大,而簇間數(shù)據(jù)對象的相似性盡可能小。
傳統(tǒng)的YOLO網(wǎng)絡(luò)中的anchor參數(shù)是通過VOC數(shù)據(jù)集上聚類得到的,其優(yōu)勢是識別種類較多,但是在對特定識別對象是識別效果較差。這里參考文獻(xiàn)所提方法,在圖紙識別中,以YOLO算法為基礎(chǔ),引入了細(xì)粒度特征和殘差網(wǎng)絡(luò)對原有網(wǎng)絡(luò)進(jìn)行改進(jìn)。同時,構(gòu)建基于0OU的評價函數(shù),在聚類過程中,采用類內(nèi)相似度最大差異和類間差異度最大相似度最小的原則進(jìn)行優(yōu)化。
本文選取某地區(qū)實(shí)際電網(wǎng)二次系統(tǒng)設(shè)計(jì)圖、端子設(shè)計(jì)圖為例,根據(jù)紙質(zhì)、電子版圖紙(PDF、CAD、圖片等格式),識別端子號、回路號、電纜編號,利用開發(fā)的智能識別算法進(jìn)行識別校核。
通過識別明確回路圖中所標(biāo)注的三個元素與端子排圖中所標(biāo)注的三個元素對應(yīng)。
在樣本總數(shù)為10、20、40、60和80時,圖紙識別準(zhǔn)確率均取得不錯的結(jié)果,隨著支持集圖片數(shù)量的增加,模型的分類準(zhǔn)確率在不斷提升,模型在支持集圖片在60張時分類準(zhǔn)確率達(dá)到了97.16%,之后再增加樣本數(shù),分類準(zhǔn)確率并沒有明顯的提升。
本文通過目標(biāo)檢測模型檢測獲取圖紙中的端子信息以及連接信息,建立圖紙中的端子排信息的數(shù)據(jù)臺賬,從而實(shí)現(xiàn)了利用人工智能手段對端子排圖紙的自動檢索,大大節(jié)約了工作人員在校核工作中圖紙檢索的時間成本,也規(guī)避了在圖紙檢索中由于人為主觀因素造成的檢索錯誤,為后期的校核工作提供了實(shí)時準(zhǔn)確的一手資料;此外,數(shù)據(jù)臺賬的建立,對于年代久遠(yuǎn)的變電站可能沒有原始文件的情況進(jìn)行了圖紙永久記錄,為后期的圖紙復(fù)原提供了準(zhǔn)確的原始數(shù)據(jù),也對今后的二次回路研究工作提供了可靠的數(shù)據(jù)支撐。