羅浩天 羅錦 嚴智敏 宋曉雪
摘 要 為保證電力系統(tǒng)的穩(wěn)定運行,輸電線路的巡檢是必不可少的。隨著相關技術的發(fā)展,傳統(tǒng)的人工巡檢被無人機遠程拍攝而取代,利用無人機攜帶的高清攝像機可以安全快捷的進行輸電線路的日常巡檢,將采集到的圖像信息傳輸?shù)浇K端并加以處理就可以了解各個輸電塔的狀況。為了便于對無人機采集的數(shù)據(jù)進行處理分析,本文利用深度學習技術對圖片進行處理:首先為生成數(shù)據(jù)集,對圖像進行預處理,并統(tǒng)一大小方便進行訓練;再利用FCN算法,利用制作好的數(shù)據(jù)集,訓練網絡,調整參數(shù);而后進行連通域的標定和絕緣子自爆位置的檢測。通過深度學習算法,可以極大的減少人工成本,減少因疲勞而導致的錯誤
關鍵詞 圖像預處理 語義分割 FCN 連通域算法 目標檢測 YOLO算法
中圖分類號:TM73 文獻標識碼:A 文章編號:1007-0745(2020)02-0001-07
1 基于深度學習的智能絕緣子識別技術
1.1 研究背景及意義
在輸電系統(tǒng)中,輸電塔和高壓線是其中主要的部分。在輸電塔上,絕緣子是維修的關鍵部位。絕緣體通常由陶瓷或玻璃制成,以支撐導體并防止電流返回地面。然而,由于野外環(huán)境的多變,絕緣子極易損壞,常見的原因有污穢,高溫,濕潤,塵土等。若發(fā)生故障則不能保證電力系統(tǒng)的正常運轉。
通過深度學習技術的應用,可以實現(xiàn)在復雜背景下針對絕緣子串的識別分割及絕緣子自爆故障的檢測,有利于保證電力系統(tǒng)的安全穩(wěn)定的運轉。
1.2 研究內容和技術路線
1.2.1 研究內容
電力系統(tǒng)中的傳輸鏈路主要由架空輸電線路實現(xiàn)。輸電塔由若干部件組成:桿塔、電線、絕緣子、避雷針、開關、電纜、及其連接裝置。內容繁多,過程復雜。為了有效完成對電力系統(tǒng)的檢查,采用無人機設備對其進行全方位的拍攝。以完成絕緣子自爆的檢測。利用深度學習技術對無人機采集到的圖像進行分析處理,完成相應的任務要求。
1.2.2 技術路線
本文通過無人機拍攝到的絕緣子圖片,依據(jù)現(xiàn)有國內外對絕緣子的檢測和自爆缺陷的識別發(fā)展現(xiàn)狀,基于深度學習技術對獲得的圖片進行預處理、分割和識別,并檢測出自爆絕緣子的位置。其中分為:
a) 數(shù)據(jù)集的生成。本文使用官方的測試數(shù)據(jù)和Github公開的數(shù)據(jù)集作為絕緣子圖像數(shù)據(jù)集。
b) 絕緣子圖像預處理。為增加數(shù)據(jù)集的圖片量,采用旋轉的方式將現(xiàn)有圖片進行變形。為保證圖片的大小一致,通過縮放方式將圖片統(tǒng)一大小,為之后的深度學習提供數(shù)據(jù)集。
c) 絕緣子的分割。利用FCN算法,利用制作好的數(shù)據(jù)集,訓練網絡。用測試數(shù)據(jù)生成的測試集進行測試,最后通過調參提高分割的成功率。
d) 絕緣子連通域檢測。
e) 絕緣子自爆的識別。通過Yolov3對絕緣子的自爆故障進行定位,流程圖如下:(如圖1)
2 絕緣子圖像數(shù)據(jù)的采集和預處理
2.1 采集數(shù)據(jù)
因為電路中的絕緣子通常建立在環(huán)境惡劣的地方,沒有工具很難到達。大部分由無人機捕獲和存儲。無人機的任務包括自主設定計劃、執(zhí)行任務、對地面的監(jiān)控,并且要對無人機的圖像進行處理。無人機自動總要目標的檢查、飛行控制、圖像捕獲和存儲等一系列操作,最終獲得較好的絕緣子狀況。
2.2 圖像預處理
對圖像進行一定的提取準備,可以減少噪聲,使圖像特征更明顯,使得圖像蘊含的信息得到較好的保存,從而提高后續(xù)處理的準確度。[1]
2.2.1 圖像切分
現(xiàn)有原始圖片分辨率大致為7360×4912-3632×2624,每張圖片大小大約都在7MB上。這些數(shù)據(jù)保存會耗費一定的儲存空間,并且現(xiàn)有分辨率對進行圖像處理和深度學習都過大,會大大增加計算的時間。因此本文采取先將采集到的750張圖片切分為640×480大小,并打亂順序,隨機分布,減少原圖過大帶來的存儲空間和后期計算耗時問題。
2.2.2 基于Keras的圖像變換
Keras封裝了很多高層的神經網絡模塊,例如全連接層(Dense),卷積層(Conv2D),長短時記憶模型(LSTM)等等。利用Keras框架進行數(shù)據(jù)增強,進行上下,鏡像翻轉,以及隨機修剪、色彩抖動、平移變換、尺寸變換,新增樣本圖片,將這些圖片作為后續(xù)語義分割的訓練集。
3 基于語義分割的圖像處理
3.1 神經網絡算法介紹
3.1.1 R-CNN算法
CNN是Region-CNN的縮寫。AlexNet 是卷積神經網絡的一種,主要包含8層,其中前五層為卷積層,后三層為全連接層。雖然R-CNN有著較高的準確度,但是它的識別效率較低,主要原因是它要提取說以的特征,計算的冗余量很大。所以將采用Fast-RCNN模型。Fast-RCNN在原來的基礎上新增了回歸性,將融合的地方化成一個模型。
下方為Faster RCNN結構流程圖:(如圖2)
3.1.2 FCN算法
3.1.4 模型建立
RCNN基本步驟為:
(1)通過對顯著性進行校驗獲得2000個較為重要的位置ROI;
(2)將圖片變化為合適的大小讓它上面小,下面大,再使用卷積層獲得特征;
(3)對于金字塔每個尺度的每個ROI,求圖像在特征圖中的映射,并且統(tǒng)一到相同的尺度;
(4)將結果輸入到并行的兩個全連接層,第一個層針對每個ROI區(qū)域的分類進行概率預測,第二個層針對每個ROI區(qū)域進行位置的偏移優(yōu)化。經過Fast-RCNN對RCNN的優(yōu)化,將分類和窗口放在了統(tǒng)一的框架里面,極大的較少了模型訓練和圖片測試的時間。
FCN的建立:
(1)在上文預處理中分好訓練集和驗證集后,對形成學習機進行如下步驟;
(2)構建FCN-8s模型:根據(jù)全卷積神經網絡原理,在VGG-19(Visual Geometry Group,VGG)網絡模型的基礎上構建FCN-8s模型;
(3)訓練FCN-8s模型:同時將訓練集和驗證集放入構建好的模型進行訓練及驗證, 通過參數(shù)對比調優(yōu),完成模型的訓練;
(4)FCN-8s模型預識別:將測試集輸入訓練好的模型,經計算后輸出FCN-8s梯田影像預識別結果;
(5)DenseCRF模型:輸入梯田預識別結果,構造Dense CRF模型二階勢函數(shù),計算后輸出本文方法的最終識別結果;
(6)精度評價:對比各測試區(qū)的真值圖,對本文方法的實驗結果計算總體精度、F1分數(shù)和Kappa系數(shù)進行精度評價。
流程圖如下圖所示:(如圖3)
BoxSup的訓練流程:
(1)對圖片的bounding box ground-truth使用,Multiscale Combinatorial Grouping (MCG)生成分割mask的候選,并優(yōu)化label選一個與bounding box平均交集最大的mask作為監(jiān)督信息。
(2)利用上述標簽信息更新分割網絡(FCN)的參數(shù)。
(3)基于訓練出的語義分割網絡對物體框中的前景區(qū)域進行預測,提升前景mask 的準確度,再循環(huán)訓練FCN。
3.2 結論分析
FCN是由模型RCN改進而得到,用卷積替換了全連接,相比于R-CNN提高了10%左右;BoxSup的核心就在不斷迭代,迭代次數(shù)越多越準確,但是耗時過長。所以最后選定使用FCN算法。下面為由FCN算法得到部分掩模圖結果如下:
4 基于連通域的絕緣子位置檢測
4.1 算法介紹
4.1.1 基于Tow-Pass算法位置識別
Two-pass就是兩邊掃描,通過將圖片進行兩次掃描,就可以查找得到連通域并且標記它。在第一次掃描的時候,賦予每一個像素位置一個標簽,掃描途中同一個連通區(qū)域的像素可能被賦予一個或者多個標簽,因此需要將這些屬于同一個連通區(qū)域但具有不同的標簽的像素進行合并,記錄其中相等的關系。在第二遍掃描中,將相等關系的標記像素歸為一個連通區(qū)域并賦予相同的標簽。
4.1.2 基于Seed-Filling算法位置識別
種子填充法來源于計算機圖形學,對于某個圖形進行填充。選取一個前景像素作為種子,根據(jù)連通區(qū)域的兩個基本條件將和種子相鄰的前景像素合并到同一個像素集合中,最后得到該像素集合就是一個連通區(qū)域。
4.2 模型建立
本文利用的是二值圖像的連通域標記法。二值圖像是指只有黑和白兩個狀態(tài)的圖像,由于其簡單的模式,像素可以在空間上有很強的表現(xiàn)力。所以利用二值圖像來分析連通域標記是非常方便的。根據(jù)現(xiàn)有的算法思路,對圖片進行逐行的掃描,把每一行中連續(xù)的白色像素組成一個序列并進行標記,記下其中的起始點和終止點以及所在的行號。對于除了第一行中連續(xù)的標記以外,如果其他行的標記都沒有于其之前的標記重合就標定為一個新的標號,如果僅與上一行中的一個標記有重合,則將上一行的標記賦予給它,如果與上一行的2個以上的標記區(qū)域有重疊的部分,則給當前的標記標上最小的標號,并將上一行這幾個標記寫入等價的對,說明是屬于一個類型。將等價對轉換為等價序列,每一個序列需要給一個相同的標號。將每個標號填入標記的圖像中。
4.3 結論分析
通過對連通域進行標定,就可以得到不同的區(qū)域,并將其標定出來。通過程序將不同的顏色填充到不同的連通區(qū)域??梢詫D像進行快速的標定。
5 絕緣子自爆位置識別
5.1 絕緣子自爆特征簡介
玻璃絕緣子自爆的原因可分為產品自身質量原因與外部運行環(huán)境原因兩類。其發(fā)生自爆的特征為:放射狀,魚鱗狀,混合狀。
5.2 算法
5.2.1 基于YOLO算法
Yolo V3作為最優(yōu)秀的目標檢測框架之一,與之前的RCNN、SPP-Net、Fast-RCNN、Faster-RCNN相比有了很大的進步。[3]Yolo的核心思想是使用整個畫面作為輸出,直接返回輸出層中邊界框的位置和類別。首先將一幅圖像劃分為7×7個網格單元,然后檢測目標。如果目標中心落在網格中,網格負責預測目標。預測的候選框還需要預測一個置信度值,以確定目標是否存在。
得到每個分類置信分數(shù)之后,設置閾值將得分低的boxes篩除掉,就得到最終的檢測結果。
5.2.2 基于YOLO算法的改進
目前,大多數(shù)神經網絡的改進趨勢是向更大、更深層次的網絡發(fā)展。一般來說,層次性更強的神經網絡傾向于在現(xiàn)實世界中學習更多的細節(jié)以獲得更好的結果。YOLO v2沒有專注于加深神經網絡的層次,而是采用了批量歸一化、高分辨率分類器、多尺度訓練等方法,在保持原有速度的同時提高了精度。整個網絡采用Darknet-19網絡結構,包括19個卷積層和5個最大池層,與YOLO相比,卷積運算量大大減少。YOLO v3采用 Darknet-53的基礎網絡結構,確保了速度并再次大大提高了精確度。
5.2.3 改進SSD算法
經典 SSD 算法的模型參數(shù)運算繁多,運行時占用內存大,為了在有限的計算資源平臺上完成圖像識別任務并做出及時的反應,對 SSD 算法進行“減重”勢在必行。提出改進的深度可分離卷積網絡作為 SSD 前端特征提取的基礎網絡,避免卷積運算過程所帶來的過大消耗,降低算法運算復雜度,適應未來實時識別車型的應用需求。[4]
(2)反殘差模塊。寬度參數(shù)通過壓縮通道數(shù)進一步減少模型參數(shù)量,但是也造成了特征壓縮的問題。而修正線性單元(ReLU)對于負輸入,全部輸出為零,會導致更多的特征信息丟失,深度卷積DW無法改變輸入通道,這種情況下,特征提取效果不理想會導致目標檢測準確率降低。
研究在 DW 之前引入反殘差(inverted residuals,IR)模塊,輸入為h×w的k維特征圖,將 ReLU 改為 ReLU6 以限制輸出范圍,輸出h/s×w/s的k維特征圖。s 是步長,t 為擴張系數(shù)。首先用一個大小為1×1的擴展核把輸入的低維特征圖擴展到高維,在高維空間進行深度卷積,最后使用點卷積將特征提取結果降維映射到低維空間并用線性激活函數(shù)(linear)進行輸出。對通道數(shù)擴增之后再收縮,提高了模型特征提取的能力,有效防止由于通道數(shù)較小時因非線性激活導致特征信息丟失的情況,可以提高目標檢測準確率。結合反殘差模塊的深度可分離卷積SSD結構.
(2)GMM模型的改進:
i.GMM模型的自適應改進
在對運動的物體進行檢測時,以往的GMM里K值是不發(fā)生變化的,這樣就約束了算法在不同環(huán)境中的魯棒性。如果環(huán)境中沒有移動的物品時,那么不需要以往那么多的資源,只要觀察一個最為重要的分布就可以觀測到全局的分布。當環(huán)境中出現(xiàn)目標物體后,考慮的值會明顯增多,這便需要利用較多的高斯分布來計算。在此基礎上,改進出了不斷適應環(huán)境的高斯算法。過程如下:
(1) 先加入穩(wěn)定數(shù)ρ來修改權和協(xié)方差的分布,并且0<ρ<1。當新得到的權很大、方差很小時,分布會變的更加重要,變得容易成為用于背景構造的元素之一,造成整個模型的質量下降,可能會影響對結果的準確率。為了讓分布更加符合實際情況,所以添加了一個穩(wěn)定系數(shù)ρ,如果檢測圖像的像素點與多個分布都不同時,則按以下規(guī)則重新產生下一個分布:
5.3 結果比對
對于SSD模型來說,它的速度一般,準確度較高,但需人為預設默認邊框的最小值,最大值和縱橫比例值。模型中最初的默認邊框基礎的大小和形狀都不能直接通過模型學習得到也無特定的初始值,必須要人為手工設置。且卷積神經網絡每個卷積層的特征圖使用的默認邊框各類參數(shù)不一,以至于調試參數(shù)過程需要長期積累經驗。
即使pyramdial feature hierarchy這樣的思路,對較小的特征RECALL效果還是不好,并沒有達可以完全替代Faster RCNN。這是由于SSD使用conv4_3低級特征去檢測小目標,而它的卷積層數(shù)少,特征提取也不完整。所以它的使用復雜,不適合在講求效率的工程領域使用。
GMM和K-means還是有很大的相同點的。GMM中數(shù)據(jù)對高斯分量的響應度就相當于K-means中的距離計算,GMM中的根據(jù)響應度計算高斯分量參數(shù)就相當于K-means中計算分類點的位置。然后它們都通過不斷迭代達到最優(yōu)。不同的是:GMM模型給出的是每一個觀測點由哪個高斯分量生成的概率,而K-means直接給出一個觀測點屬于哪一類。所以GMM的模型的迭代次數(shù)多效率低。同樣不適合使用工程領域,同時它的準確度也不具有穩(wěn)定性,在幾次實驗中忽高忽低,使它的數(shù)據(jù)充滿可疑性。
對比以上三個模型,經過各項技術參數(shù)的比對,在對YOLOv3 進行 channel pruning 之后,模型的參數(shù)量、模型大小減少 80% ,F(xiàn)LOPs 降低 70%,前向推斷的速度可以達到原來的 200%,同時可以保持 mAP 基本不變(這個效果只是針對該數(shù)據(jù)集的,不一定能保證在其他數(shù)據(jù)集上也有同樣的效果)。到此為止,YOLO算法的準確度已經達到70%遠高于其他兩個模型。YOLO3借鑒了殘差網絡結構,形成更深的網絡層次,以及多尺度檢測,提升了mAP及小物體檢測效果。如果采用COCO mAP50做評估指標(不是太介意預測框的準確性的話),YOLO3的表現(xiàn)相當驚人,如下圖所示,在精確度相當?shù)那闆r下,YOLOv3的速度是其它模型的3、4倍。
6 總結與展望
6.1 總結
本文主要基于絕緣子圖像數(shù)據(jù)研究不同的方法實現(xiàn)絕緣子“自爆”缺陷的檢測。本文基于國家電網查找給出的圖像,主要以無人機航拍的絕緣子圖像數(shù)據(jù)為研究基本對象,將檢測絕緣子“自爆”作為目標,對其中圖像處理深度學習進行建立模型,結果比對,得出實驗結果。對本文的研究內容和取得成果總結如下:
本文通過使用官方給出的數(shù)據(jù)以及在GitHub公開的數(shù)據(jù)集作為了圖像的基礎數(shù)據(jù)集,最早通過圖像的預處理,將圖片旋轉幾個角度以此來提高識別的準確度,在已有的基礎上擴展數(shù)據(jù)集。
本文使用深度學習,利用FCN算法分割絕緣子,并用已有的數(shù)據(jù)集進行訓練。然后在對連通區(qū)域進行檢查得到較為客觀的掩模圖。最后通過基于Python平臺的YoloV3算法對得到的自爆故障進行定位。在得到的結果中可以發(fā)現(xiàn)模型已經具有較好的效果,可以準確的識別出已經自爆的絕緣子。
本文值得注意的是,本文每一個步驟都選用了多個方法進行比較,保證了結果的準確性,并且同時也帶來的更多的解決方案,以此來適應不同的環(huán)境。
6.2 展望
本文從圖像處理和深度學習兩個角度出發(fā)研究了航拍中絕緣子串的識別和絕緣子“自爆”點的位置識別。由于深度學習繼續(xù)迅速,研究不斷深入,新的模型和算法的提出,在今后的時間針對本文不足進行完善,可完善的地方主要有以下方面:
(1)數(shù)據(jù)的不充足性。由于電力圖像獲取難度大,本文所使用航拍圖像有限?;竟┯谠瓐D應是2000張左右,但是由于獲取數(shù)據(jù)有限,在處理后才剛剛達到深度自主學習所需訓練集,后期可以通過無人機拍攝更多圖像進行加強。
(2) 基于深度學習的檢測算法在未來探索更合適的網絡模型,降低網絡復雜度。以期實現(xiàn)絕緣子檢測的智能化和自動化。
另外在從當下時期來看我國電網面臨著嚴峻挑戰(zhàn),主要包括:西電東送距離遙遠和線路走廊的限制,要實現(xiàn)大規(guī)模的輸電面臨著諸多技術難題:大區(qū)電網強互聯(lián)的格局尚未形成,因而全局的電力資源優(yōu)化配置,優(yōu)化調度還難以實施,南北互供的電量還很少,電網建設滯后,電網中輸電瓶頸增多,其中,電網絕緣子安全可靠性成為電網安全的重要因素。因為,電力網輸配電線路大多建設在野外,長期在惡劣氣候條件下工作,強化輸配電絕緣子安全可靠性,對于線路安全起到重要的作用,輸電網安全運行強調輸電網絕緣子的重要性。更應該加快速度,將商業(yè)化的無人機識別技術投入到電網中。
可以預見在將來本文的技術可以被應用在各個多個領域,并且也具有較大的提升空間,和較好的可塑性。以本文的YoloV3模型為例,本次由于訓練數(shù)據(jù)較少的原因,使識別的精度差強人意,如果可以收集更多的數(shù)據(jù),多模型進行更多的訓練,那么準確度會有一個質的飛躍。
參考文獻:
[1] 王夢.基于絕緣子圖像的缺陷檢測方法研究[D].華中科技大學,2019-05-26.
[2] 段杰,崔志明,沈藝.一種改進 FCN 的肝臟腫瘤 CT 圖像分割方法[J].圖學學報,2020(02).
[3] Zhengxia Zou, Zhenwei Shi. Object Detection in 20 Years: A Survey [J].University of Michigan,2109-07-10.
[4] Wei Liu1 , Dragomir Anguelov2 , Dumitru Erhan2 . SSD: Single Shot MultiBox Detector University of Michigan, Ann-Arbor,2015-12-14.