賀月 常永娟
摘? 要:隨著我國電網(wǎng)智能化、信息化的建設(shè)與發(fā)展,電網(wǎng)中的電力設(shè)備通過長期的運(yùn)維、檢修和試驗(yàn),積累了大量的各種形式的電力數(shù)據(jù)。其中,相比于主要以數(shù)值形式存儲的結(jié)構(gòu)化數(shù)據(jù)而言,電力設(shè)備巡檢圖像等非結(jié)構(gòu)化數(shù)據(jù),具有更廣泛的應(yīng)用場景和更高的價(jià)值密度,但由于不能被計(jì)算機(jī)直接識別和處理,其挖掘過程也存在更多的難點(diǎn)。本文提出基于改進(jìn)Faster R-CNN模型的電力設(shè)備圖像目標(biāo)檢測方法。以主變壓器的巡檢圖像為例,考慮了主變壓器各個部件的尺寸差異較大以及部件位置之間存在關(guān)聯(lián)性的特點(diǎn),對Faster R-CNN模型的結(jié)構(gòu)進(jìn)行了改進(jìn),有效提高了主變壓器多部件類別和位置識別的準(zhǔn)確率,為識別不同部件的缺陷和故障現(xiàn)象奠定了基礎(chǔ)。
關(guān)鍵詞:巡檢圖像? 變壓器部件? 改進(jìn)Faster R-CNN模型? 訓(xùn)練? 檢測
中圖分類號:TM73 ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2021)03(a)-0133-04
Research on Image Data Mining of Transformer Inspection Based on Improved FAST R-CNN
HE Yue? CHANG Yongjuan
(Information and Communication Branch of State Grid Hebei Electric Power Co., Ltd., Shijiazhuang, Hebei Province, 050013 China)
Abstract: With the construction and development of China's power grid intelligence and informatization, the power equipment in the power grid has accumulated a large number of various forms of power data through long-term operation and maintenance, maintenance and test. Compared with the structured data mainly stored in numerical form, unstructured data such as inspection images of power equipment have more extensive application scenarios and higher value density. However, because it can not be directly recognized and processed by computer, the mining process also has more difficulties. In this paper, a target detection method based on improved Faster R-CNN model for power equipment image is proposed. Taking the inspection image of main transformer as an example, considering the large size difference of each component of main transformer and the correlation between component positions, the structure of Faster R-CNN model is improved, which effectively improves the accuracy of multi component classification and location identification of main transformer, and lays a foundation for identifying defects and fault phenomena of different components.
Key Words: Inspection image; Transformer parts; Improved Faster R-CNN model; Training; Detection
在智能變電站建設(shè)中,隨著巡檢機(jī)器人的普及和大量變電站圖像數(shù)據(jù)的積累,基于圖像的電力設(shè)備狀態(tài)自動識別方法逐步得到應(yīng)用,例如隔離開關(guān)分合狀態(tài)識別、瓷瓶異物識別等等。采用計(jì)算機(jī)視覺技術(shù)代替?zhèn)鹘y(tǒng)的人力巡檢,可以有效提高巡檢的頻率和效率,并減少人工判斷的主觀性對準(zhǔn)確率的影響。作為變電站最重要的設(shè)備之一,主變壓器的穩(wěn)定運(yùn)行關(guān)系到變電站乃至整個電力系統(tǒng)供電的安全可靠[1]。因此,基于變壓器圖像的缺陷和故障識別有著重要的實(shí)用價(jià)值,而變壓器部件的檢測是其中的一個關(guān)鍵性環(huán)節(jié)。只有在準(zhǔn)確檢測出變壓器各個部件的類別和位置后,才能夠針對不同的部件可能發(fā)生的缺陷和故障類型,如儲油柜滲漏油、呼吸器硅膠變色等,制定相應(yīng)的識別算法,從而實(shí)現(xiàn)變壓器缺陷和故障的自動識別[2]。
對于電力設(shè)備和部件的自動檢測,基本思路是從現(xiàn)場獲得包含待識別目標(biāo)的圖像,并進(jìn)行特征提取和分析,再通過檢測模型檢測出圖像中電力設(shè)備和部件的類別與位置[3]。較為直接的方法是基于模版的匹配算法,即在現(xiàn)場圖像中將待識別目標(biāo)人工框定出來并作為模版,再通過模板與新的圖像各個區(qū)域的相似度計(jì)算,對新的圖像中的目標(biāo)進(jìn)行匹配。這種方法受限于拍攝點(diǎn)的定位和拍攝角度的精度,準(zhǔn)確率和穩(wěn)定性難以保證[4]。本文以檢測準(zhǔn)確性較高的Faster R-CNN為基礎(chǔ),對模型結(jié)構(gòu)進(jìn)行改進(jìn),使模型可以動態(tài)地適應(yīng)部件大小差異,同時充分考慮變壓器部件位置的關(guān)聯(lián)性,加入相對位置特征,進(jìn)一步提高部件檢測準(zhǔn)確率。
1? 用于變壓器部件檢測的改進(jìn)Faster R-CNN
Faster R-CNN分為三個模塊,即特征提取、建議框(proposal)生成和類別與位置檢測。綜合考慮準(zhǔn)確率要求和數(shù)據(jù)集規(guī)模,特征提取部分的卷積神經(jīng)網(wǎng)絡(luò)(即Stage1-Stage5)采用ResNet-50結(jié)構(gòu)。輸入的圖像首先通過ResNet-50網(wǎng)絡(luò)被轉(zhuǎn)化為一張?zhí)卣鲌D(feature map),然后將特征圖輸入?yún)^(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN),生成n個建議框,每個建議框包括2個概率值(分別代表建議框內(nèi)包含和不包含目標(biāo)物體的概率)以及4個代表建議框位置的坐標(biāo)值。最后,將特征圖和從n個建議框中篩選出來的個建議框都輸入興趣區(qū)域池化層(Region of Interest pooling,RoI pooling)、全連接層(Full Connect,F(xiàn)C)以及softmax分類器或bounding-box回歸器,從而輸出每個建議框的k+1個概率值(代表包含k類目標(biāo)的概率和只包含背景的概率)以及4k個坐標(biāo)值(代表k類目標(biāo)的坐標(biāo))[5]。
為了實(shí)現(xiàn)變壓器部件的準(zhǔn)確檢測,在Faster R-CNN的基礎(chǔ)上提出改進(jìn)模型,如圖1所示。改進(jìn)主要包括兩部分:一是將特征提取模塊Stage2輸出的淺層特征圖也輸入類別與位置檢測模塊,以提升對小目標(biāo)的檢測效果,并與原有的Stage5輸出的深層特征圖配合,動態(tài)地適應(yīng)檢測目標(biāo)大小的變化;二是在建議框生成和類別與位置檢測模塊中都引入了部件之間的相對位置信息作為特征,并采用隨機(jī)森林(Random Forest,RF)模型對概率和坐標(biāo)進(jìn)行修正,以提高部件檢測的準(zhǔn)確性[6]。
2? 訓(xùn)練和檢測過程
訓(xùn)練過程分為兩部分。一是對神經(jīng)網(wǎng)絡(luò)部分進(jìn)行訓(xùn)練,主要在所采用的四步訓(xùn)練法基礎(chǔ)上進(jìn)行修改,以適應(yīng)雙特征圖;二是對隨機(jī)森林模型進(jìn)行訓(xùn)練,主要對相對位置特征出現(xiàn)各種缺失的情況進(jìn)行訓(xùn)練,以提高模型對缺失值的魯棒性。
訓(xùn)練完成后,利用改進(jìn)FasterR-CNN進(jìn)行變壓器部件檢測的過程如算法1所示,帶星號部分將在下文進(jìn)一步解釋。
算法1 變壓器部件檢測算法
Input:一張圖像,,置信度閾值*
Output:一個集合,包含k1個,每個包括一個部件類別的1個概率值和4個坐標(biāo)值
將一張圖像輸入ResNet-50,生成特征圖1和特征圖2
初始化集合為空集
While的元素?cái)?shù)目 將特征圖1輸入建議框生成模塊*,生成n1個建議框 將n1個建議框、特征圖1和特征圖2輸入類別與位置檢測模塊*,生成n1×k個box(忽略背景類別),每個box包括一個類別的1個概率值和4個坐標(biāo)值,所有box形成集合boxes 刪除集合boxes中類別已在出現(xiàn)過的box 將boxes中概率值最大的box作為 If的概率值<置信度閾值then Break Else將加入集合 End if End while 帶星號部分解釋如下:(1)變量n1決定了輸入類別與位置檢測模塊的建議框數(shù)量;置信度閾值決定了輸出的的概率閾值;(2)集合里的每個都框定了一個圖像中被檢測到的變壓器部件,包括其類別及概率值;(3)每個建議框在建議框生成模塊和類別與位置檢測模塊中的相對位置特征由該建議框和各個的坐標(biāo)生成。 3? 算例分析 3.1 算例情況 選取某220kV變電站2016—2017年的2000張主變壓器巡檢圖像作為實(shí)驗(yàn)數(shù)據(jù)集,每張圖像的分辨率均為800(寬)×600(高),部分圖像如圖2所示。根據(jù)所采用的數(shù)據(jù)集中變壓器的型式,選取變壓器的本體儲油柜、#1-#9散熱器組、#10-#18散熱器組、本體瓦斯繼電器、本體呼吸器、有載開關(guān)呼吸器共6類尺寸差異較大的部件進(jìn)行檢測,并對所有圖像中6類部件的位置進(jìn)行標(biāo)注。采用10倍交叉驗(yàn)證方法進(jìn)行實(shí)驗(yàn),再將所有測試圖像匯總進(jìn)行統(tǒng)計(jì)。 對于改進(jìn)FasterR-CNN(簡稱FRCNN-improved)模型的神經(jīng)網(wǎng)絡(luò)部分,被選擇輸入類別與位置檢測模塊的建議框數(shù)目(即n1)在訓(xùn)練和測試過程中分別設(shè)置為2000和300,而RPN中采用尺寸分別為82、322、1282和5122的四種anchor,每種尺寸的anchor均包括2:1、1:1和1:2三種長寬比。同時通過參數(shù)尋優(yōu),設(shè)置模型的學(xué)習(xí)率為0.003,每批訓(xùn)練圖像數(shù)量為8張,訓(xùn)練步數(shù)為50000步,由于數(shù)據(jù)集的每張圖像都只包含一臺主變壓器,即每類部件最多只有1個,因此在所有模型中,對于同一張圖像的每類部件,都只取1個概率值最高的檢測框作為最終檢測結(jié)果。評價(jià)變壓器部件檢測準(zhǔn)確性的指標(biāo)之一,采用目標(biāo)檢測任務(wù)中常用的指標(biāo)mAP。雖然mAP能比較全面地評價(jià)模型準(zhǔn)確性,但其計(jì)算比較復(fù)雜,需要通過多次改變置信度閾值獲得多組查準(zhǔn)率和查全率進(jìn)行計(jì)算,工程意義不夠明確。為了更直觀地反映模型在實(shí)際工程應(yīng)用中的效果,經(jīng)過參數(shù)尋優(yōu),設(shè)定置信度閾值等于0.6,并統(tǒng)計(jì)各類部件的查準(zhǔn)率(記為P)和查全率(記為R),以及總體查準(zhǔn)率和查全率。另外,統(tǒng)計(jì)每張圖像的平均檢測耗時,采用Nvidia GeForce GTX 750 Ti GPU 進(jìn)行訓(xùn)練和測試。另外,在判斷某類部件的檢測框是否正確標(biāo)注時,采用檢測框與ground-truth box的交集和并集的面積比(Intersection over Union,IoU)進(jìn)行判定。當(dāng)IoU>0.5時,認(rèn)為檢測框正確框出了部件。 3.2 算例結(jié)果 采用訓(xùn)練集圖像對上述各種模型進(jìn)行訓(xùn)練后,對測試集圖像進(jìn)行部件檢測,對于mAP和總體的查準(zhǔn)率、查全率,總體查準(zhǔn)率和查全率均高于94%。可見,對于FasterR-CNN模型結(jié)構(gòu)的兩點(diǎn)改進(jìn),都有助于提高模型的檢測準(zhǔn)確性。由于在檢測過程中需要通過迭代逐次生成final_box,故FRCNN-improved的檢測耗時最多,但因?yàn)橹髯儔浩鞯难矙z是定期任務(wù),對實(shí)時性的要求不高,而每張圖像2.1s的效率已明顯高于人工對目標(biāo)進(jìn)行標(biāo)定的效率,故模型可以滿足實(shí)際工程的需求。 參考文獻(xiàn) [1] 傅世權(quán).大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用探討[J].信息記錄材料,2019,20(11):128-129. [2] 湯偉,楊鋮.基于數(shù)據(jù)挖掘技術(shù)的電力調(diào)度系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].自動化與儀器儀表,2019(5):55-58. [3] 陳俊星.基于數(shù)據(jù)挖掘技術(shù)的電力設(shè)備狀態(tài)評估[D].北京:北京交通大學(xué),2019. [4] 霍曉峰.數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)故障診斷中的應(yīng)用[D].北京:華北電力大學(xué),2017. [5] 朱克東.智能電網(wǎng)環(huán)境下電力數(shù)據(jù)挖掘研究[D].南京:東南大學(xué),2018. [6] 皇甫漢聰,肖招娣.基于Apriori算法的電力系統(tǒng)二次設(shè)備缺陷數(shù)據(jù)挖掘與分析研究[J].電子設(shè)計(jì)工程,2019,27(5):6-9,15.