周 鑫,周云浩,王 楠,李 昊,韓志超
(國網北京市電力公司電力建設工程咨詢分公司,北京 100021)
施工質量與設備驗收是電網工程建設過程中的重要環(huán)節(jié),隨著工程規(guī)模的不斷擴大,設備數量也隨之增多[1-3]。傳統(tǒng)的驗收方式為人工作業(yè),不僅費時費力,若電網架設在惡劣環(huán)境中,驗收質量也無法得到保證。因此,自動化的電力工程驗收技術受到越來越多的關注。與人工驗收對比,自動化驗收方案可以對無人機、機器人和人工智能算法等進行整合,通過機器采集電力工程的圖像,再使用人工智能算法對圖像加以分析。
在自動化驗收技術中,最重要的技術就是對輸電線、絕緣子及電力塔等電網關鍵部件的識別。然而,由于前端設備的圖像采集能力參差不齊,部分小部件、相似部件的識別準確率較低。同時無人機進行圖像采集時,也會拍攝到電網所處的環(huán)境,導致輸電線路識別時受到背景干擾而出現部件漏檢的情況。因此,文中基于無人機采集的圖像提出了一種小部件與輸電線的準確提取識別技術,能夠高效地自動完成電力工程驗收任務。
卷積神經網絡(Convolutional Neural Networks,CNN)[4-6]是一種以神經元為基礎結構的智能數據訓練算法,模型結構如圖1 所示,其主要由卷積層、池化層及全連接層組成。其中,卷積層負責提取數據的特征;池化層實現數據特征的映射,并對重要數據特征進行聚類;最后通過全連接層對特征信息加權,進而完成分類工作。
圖1 卷積神經網絡結構
隨著對圖像檢測質量需求的不斷提升,檢測準確性較低的單個CNN 結構已無法滿足要求。因此,文中需要對卷積網絡進行組合,而Faster R-CNN 算法[7-9]就是常用組合網絡中的一種。算法結構如圖2所示。
圖2 Faster R-CNN算法結構
該算法結構由特征提取網絡、區(qū)域候選網絡以及檢測網絡組成。
1)特征提取網絡負責對輸入圖像進行訓練,主要操作流程包括卷積與池化。輸入數據經過該網絡可以生成對應的特征圖,即算法對輸入圖像進行了一次特征提取,速度較快。
2)區(qū)域候選網絡的主要作用是生成新的目標候選框,進而對目標進行標定。該網絡本質上是一個二分類器,首先在特征圖中生成固定大小的區(qū)域,通過Softmax 分類器對區(qū)域進行對比,并對網絡加以訓練,然后得到更為準確的目標標定位置。網絡結構如圖3 所示。
圖3 區(qū)域候選網絡結構
3)檢測網絡用于對區(qū)域候選網絡的輸出數據進行訓練并分類。同時利用回歸網絡對分類完成的位置進行修正,最終獲得目標的位置。
文中設計的Faster R-CNN 算法特征提取網絡所采用的卷積網絡模型為VGG16,該模型使用廣泛,且具有良好的訓練準確度及效率。但在檢測電力工程設備時,經常會出現絕緣子等小體積的物體,而VGG16 模型具有全局特征,對小物體識別的準確度偏低。因此,文中引入殘差網絡(Residual Network,ResNet)以增加VGG16 原始網絡的深度,進而提升算法對小型物體識別的準確度。
殘差網絡[10-12]的基本組成結構為殘差單元,文中將其放置在正常網絡的前饋通道中,等同于在輸入網絡及深層次網絡中加入了級聯(lián)通道。殘差單元的結構如圖4 所示。
圖4 殘差單元結構
為了提升算法的局部特征感知能力,設計使用了多尺度殘差網絡代替原有網絡組合。基于殘差網絡組成的新特征提取網絡結構參數如表1所示。
表1 殘差網絡提取結構
Faster R-CNN 的區(qū)域候選網絡中的原始目標候選框是固定的,因此其自適應程度較差,會導致目標候選框的重疊面積也較大,從而引發(fā)模型收斂速度下降的問題。針對這一問題,文中使用K-means 聚類算法[13]對區(qū)域候選網絡進行改進,從輸入數據集合中隨機選擇數據點作為聚類中心c1,并計算該聚類中心與其他數據點的距離;第一輪計算完成后隨機選擇新的聚類中心c2,再繼續(xù)進行分簇;直至所有數據均分類完畢后,算法停止。聚類算法流程如圖5所示。
圖5 聚類算法執(zhí)行流程
改進后的區(qū)域候選網絡執(zhí)行過程如下:
1)根據輸入數據集中的目標進行選定,并將標簽存儲至對應文件中。
2)對不同尺寸大小的目標物特征數據進行提取,且將該數據作為K-means 聚類算法的輸入。同時根據特征數據集合的情況設置聚類中心的數量,之后再進行聚類運算。
3)得到聚類數據后生成目標候選框。
為了進一步提高模型的預測精度,使用深度自編碼器(Deep Auto-encoder,DAE)對預測網絡進行改進。自編碼器是一種映射性的神經網絡,而深度自編碼器[14-16]加入了隱藏層網絡,并通過該層學習數據間的隱含特征。DAE 的網絡結構如圖6 所示。
圖6 深度自編碼器的網絡結構
該網絡由輸入層、隱藏層與編碼層組成,其中輸入層的主要作用是線性映射,并對固定位置進行編碼。首先從區(qū)域候選網絡輸出層得到目標選擇框,提取選擇框參數(ai,bi,wi,hi),同時將目標的種類和區(qū)域信息內嵌至輸入層的輸入向量中,則有:
式中,xi為輸入向量,xclass為x的映射值,表示線性的映射關系,Epos表示位置信息。
編碼器的結構如圖7 所示,其共有L層,且每層均包含注意力機制和全連接層兩個連接層模塊。
圖7 編碼器結構
編碼器的輸入與輸出可表示為:
式中,A表示歸一化數據層,xi1是編碼器的輸入,yo表示編碼器的輸出,Att 為注意力機制激活函數,xl-1則表示第l-1 層注意力模塊的輸出。
文中基于無人機平臺采集到的掃描圖像提出了一種電力工程數字化校核算法,該算法以Faster RCNN 為基礎模型對網絡的三個主要部分進行了改進。針對基礎網絡部分局部特征抓取不足的問題,使用多層殘差網絡加深了網絡的層數;再采用Kmeans 算法對目標種類進行聚類來改善區(qū)域候選網絡精度較低的情況,以得到準確的圖像候選框;最后為了進一步提高預測網絡的精度,利用深度自編碼器對數據特征進行區(qū)域映射。所設計算法模型的總體結構如圖8 所示。
圖8 算法模型結構
實驗數據集使用標準數據集VOC2010 以及無人機采集的圖像,并利用相關三維建模技術對電力工程的線路、桿塔、絕緣子、環(huán)境等進行建模。從數據集中采集了約5 000 張圖像,無人機采集圖像則作為訓練和驗證集合,用來驗證算法在實際復雜場景下的識別能力。同時,實驗硬件配置CPU 選擇Intel Core i9-9900K,內存為128 GB,顯卡使用NVIDIA GTX 1080ti,GPU 加速計算版本為CUDA10.0。軟件選擇深度框架TensorFlow,編程語言為Python3.6,操作系統(tǒng)為Ubuntu 16.02。
首先對運算性能進行綜合評估,使用VOC2010標準數據集驗證算法的性能,評價指標選擇了準確度、召回率以及浮點計算量。此外還使用多種對比算法來衡量所提算法的性能,消融內部算法使用CNN 及Faster R-CNN,外部算法采用YOLO-V3、ResNet以及DenseNet。實驗測試結果如表2 所示。
表2 性能測試結果
從表中可以看出,與原始Faster R-CNN 算法相比,該文算法的準確度、召回率分別提升了3.7%和7.2%,同時由于使用了殘差網絡,模型的浮點計算量也在減少。雖然相比于YOLO-V3,所提算法的準確率和召回率均略低,但YOLO-V3 模型的浮點計算量約為60 GFLOPs,而文中浮點計算量僅為10.2 GFLOPs,這表明該文算法的檢測速度較優(yōu)。
對具有不同關鍵部件的無人機采集圖像進行部件識別,識別結果如圖9 所示。
圖9 關鍵部件識別結果
由圖可知,該文算法可以對電力工程中的關鍵部位進行識別,并使用不同線型的框選中目標。這表明該文算法能夠通過圖像識別對電力工程中的關鍵部件進行識別,進而完成驗收任務,既節(jié)約了時間及人力成本,又提升了效率。
文中針對人工驗收電力工程設備費時費力的問題,基于無人機采集到的圖像,提出了一種數字化驗收校核技術方案。算法對Faster R-CNN 進行了改進,并引入了ResNet 多尺度卷積網絡;再將原算法區(qū)域選擇網絡和K-means 聚類算法相結合,以增強模型的選擇能力;最后使用深度自編碼器對數據特征進行區(qū)域映射,進而提升了算法的綜合性能。實驗結果表明,該文算法性能較原始算法在準確率及召回率上均有所提升。同時其還能對電力工程中的部件進行準確識別,提高了電力工程的驗收效率。