• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于編碼解碼結(jié)構(gòu)的移動(dòng)端電力線語(yǔ)義分割方法

      2021-11-05 01:29:46黃巨挺高宏力戴志坤
      計(jì)算機(jī)應(yīng)用 2021年10期
      關(guān)鍵詞:電力線電線背景

      黃巨挺,高宏力,戴志坤

      (西南交通大學(xué)機(jī)械工程學(xué)院,成都 610031)

      0 引言

      輸電線路需要日常維護(hù)與故障檢修以保證供電的穩(wěn)定與安全,人工巡檢電力線可能會(huì)比較危險(xiǎn)并且耗費(fèi)大量的時(shí)間。隨著無(wú)人機(jī)技術(shù)的發(fā)展,采用無(wú)人機(jī)巡檢系統(tǒng)取代人工,可以節(jié)省大量時(shí)間、人力和財(cái)力,而電力線的檢測(cè)是系統(tǒng)中最重要的一部分;然而由于缺乏特定的電力線檢測(cè)和預(yù)警系統(tǒng),有大量低空飛行無(wú)人機(jī)或直升機(jī)與輸電線路碰撞的事故發(fā)生[1]。因此實(shí)現(xiàn)飛行器對(duì)于輸電線路的準(zhǔn)確高效識(shí)別是非常有必要的。

      輸電線路識(shí)別可以使用雷達(dá)、紅外傳感、電磁傳感以及機(jī)器視覺(jué)技術(shù)。近幾年機(jī)器視覺(jué)技術(shù)發(fā)展迅速,尤其是深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN)在圖像識(shí)別[2-4]、目標(biāo)檢測(cè)[5-6]以及語(yǔ)義分割[7-9]等領(lǐng)域有著良好性能;另外由于相機(jī)價(jià)格便宜、質(zhì)量輕、易于在飛行器上裝載,因此本文將采用機(jī)器視覺(jué)技術(shù)實(shí)現(xiàn)輸電線路識(shí)別。機(jī)器視覺(jué)技術(shù)是對(duì)于飛行器采集到的圖片進(jìn)行處理,檢測(cè)圖片中是否存在輸電線路。如果識(shí)別到電線,則可以進(jìn)行后續(xù)的電線位置定位并向低空飛行器發(fā)送預(yù)警信息以防止碰撞事故,為無(wú)人機(jī)后續(xù)沿輸電線路巡檢和運(yùn)動(dòng)規(guī)劃做準(zhǔn)備。這些都需要電線識(shí)別有較高的精度和效率,而機(jī)器視覺(jué)中的傳統(tǒng)圖像處理方法存在精度低和受環(huán)境影響大的問(wèn)題;深度學(xué)習(xí)方法則是依賴于豐富的電線數(shù)據(jù)集,在保持較好識(shí)別精度時(shí),由于網(wǎng)絡(luò)結(jié)構(gòu)較深而令檢測(cè)效率會(huì)下降。

      無(wú)論是無(wú)人機(jī)巡檢輸電線路還是搭載在低空飛行器上的電力線檢測(cè)預(yù)警系統(tǒng),都需要飛行器對(duì)電力線的自動(dòng)實(shí)時(shí)識(shí)別,因此需要一種能夠在飛行器移動(dòng)端高效運(yùn)行的電線視覺(jué)識(shí)別方法,以此保證飛行器能夠在低空飛行過(guò)程中及時(shí)識(shí)別飛行器下方的輸電線路,以進(jìn)行運(yùn)動(dòng)規(guī)劃和躲避電線。

      通常無(wú)人機(jī)采集的輸電線圖片中背景復(fù)雜,電線較細(xì),寬度只有5~10個(gè)像素,對(duì)其準(zhǔn)確識(shí)別具有挑戰(zhàn)性。一些背景可能具有與線路類似的形狀和邊緣,比如河流、樹(shù)枝以及房屋邊沿等;另外背景可能與線路顏色相近、對(duì)比度較低,這種情況下,肉眼可能也難以準(zhǔn)確識(shí)別出電線。

      已有的關(guān)于輸電線路識(shí)別的工作分為兩類。

      一類是基于傳統(tǒng)數(shù)字圖像處理技術(shù)的線檢測(cè)方法。Zhu等[10]基于電力線與背景有較大對(duì)比度以及電力線通常為直線且與其他電力線平行等限制條件,使用一種改進(jìn)的雙邊濾波方法來(lái)提高線結(jié)構(gòu)的對(duì)比度,然后使用Radon 變換進(jìn)行直線檢測(cè),最后通過(guò)電力線之間的平行關(guān)系約束條件來(lái)確定電力線;Du 等[11]設(shè)計(jì)了一種新的貝葉斯分類器,將圖像像素顏色作為信息源來(lái)計(jì)算概率,通過(guò)Hough 變換獲得啟發(fā)性知識(shí)來(lái)確定傳統(tǒng)貝葉斯分類器的先驗(yàn)概率與后驗(yàn)概率;Song 等[12]提出一種有序的從局部到整體的電力線檢測(cè)算法,首先用匹配濾波器和高斯一階導(dǎo)數(shù)來(lái)獲得一個(gè)邊緣圖,然后使用形態(tài)學(xué)濾波篩選出所有線性段,最后基于圖論將候選線性段組合成完整的電力線;韋盛[13]采用邊緣繪制(Edge Drawing)算法檢測(cè)圖像邊緣,然后采用邊緣繪制的線提取算法提取輸電線邊緣,最后使用K均值聚類算法去除干擾直線。

      另一類是基于語(yǔ)義分割卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法,現(xiàn)有的語(yǔ)義分割神經(jīng)網(wǎng)絡(luò)為全卷積網(wǎng)絡(luò)(Fully Convolutional Network,F(xiàn)CN)[7]、SegNet[8]、U-Net[14]以 及DeepLab 系 列[15-17]等。針對(duì)輸電線路的語(yǔ)義分割,王栩文[18]在DeepLabV3+基礎(chǔ)上,針對(duì)輸電線細(xì)長(zhǎng)的特點(diǎn)設(shè)計(jì)了更復(fù)雜的解碼器,提出了DeepLabV3+Decoder 網(wǎng)絡(luò)模型,未在移動(dòng)端設(shè)備進(jìn)行實(shí)驗(yàn)。Madaan 等[19]設(shè)計(jì)了適用于移動(dòng)端電力線識(shí)別的網(wǎng)絡(luò)結(jié)構(gòu),使用空洞卷積技術(shù)[17]提取多尺度特征,設(shè)計(jì)多個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)Grid Search 找到準(zhǔn)確率與效率最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。Zhang等[20]實(shí)現(xiàn)了電線邊緣的精細(xì)化檢測(cè),首先使用牛津大學(xué)視覺(jué)幾何組(Visual Geometry Group,VGG)發(fā)布的VGG-16 網(wǎng)絡(luò)作為主干結(jié)構(gòu)提取特征并使用雙線性插值逐層上采樣融合低階特征,然后獲取最后一層特征圖的結(jié)構(gòu)化信息,最后將網(wǎng)絡(luò)輸出的融合結(jié)果與結(jié)構(gòu)化信息結(jié)合獲取更加細(xì)化的電線邊緣。Choi 等[21]提出了一種基于弱監(jiān)督學(xué)習(xí)方法的電線檢測(cè)算法,能夠使用圖像級(jí)別的標(biāo)簽訓(xùn)練像素級(jí)別分割電線的網(wǎng)絡(luò),降低了電線標(biāo)注的人力消耗。該算法分兩個(gè)階段:第一階段是基于塊級(jí)別標(biāo)注進(jìn)行訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),用于生成可能帶有噪聲的標(biāo)注圖像;第二階段則是一個(gè)帶有電線分割精細(xì)化模塊的可迭代訓(xùn)練的FCN 語(yǔ)義分割網(wǎng)絡(luò),最后得到像素級(jí)分割電線圖像。

      傳統(tǒng)檢測(cè)方法檢測(cè)精度低,受環(huán)境干擾很大,在環(huán)境較為復(fù)雜時(shí),很容易漏檢與誤檢,該類方法的很多研究都是在較強(qiáng)限制條件和假設(shè)下進(jìn)行,如閾值等參數(shù)或人工設(shè)計(jì)的濾波器需要隨環(huán)境變化而調(diào)整。卷積神經(jīng)網(wǎng)絡(luò)使用級(jí)聯(lián)的卷積結(jié)構(gòu)提取低層次和高層次特征,擁有強(qiáng)大的學(xué)習(xí)能力。卷積神經(jīng)網(wǎng)絡(luò)的端到端訓(xùn)練方式能夠自動(dòng)從數(shù)據(jù)中學(xué)習(xí)表征,相較依賴于手工制作特征的系統(tǒng)有更好的性能,因此基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法比基于傳統(tǒng)數(shù)字圖像處理技術(shù)的線檢測(cè)方法更加適用于檢測(cè)復(fù)雜背景下的電力線,有更強(qiáng)的泛化能力?,F(xiàn)有的前沿語(yǔ)義分割神經(jīng)網(wǎng)絡(luò)如DeepLabv3+等是針對(duì)多分類目標(biāo)分割,并且擁有很深的卷積網(wǎng)絡(luò)結(jié)構(gòu),因此王栩文的DeepLabv3+Decoder 模型的預(yù)測(cè)速度無(wú)法滿足實(shí)時(shí)電線分割任務(wù)需要。Zhang 等[20]提出的電線邊緣檢測(cè)方法需要額外的算力用于提取結(jié)構(gòu)化信息,尚未在移動(dòng)端平臺(tái)上運(yùn)行;Madaan 等[19]提出的網(wǎng)絡(luò)結(jié)構(gòu)未采用下采樣操作,所有卷積核都是操作于和輸入圖片尺寸相同的特征圖上,所以預(yù)測(cè)效率仍然有提升的空間;Choi 等[21]提出的電線檢測(cè)算法旨在降低電線圖像的標(biāo)注成本,主要采用深層網(wǎng)絡(luò)FCN 進(jìn)行分割,然后在假設(shè)局部電線為直線的基礎(chǔ)上,對(duì)分割結(jié)果進(jìn)行圖像后處理,不適合在移動(dòng)端運(yùn)行。

      針對(duì)上述的傳統(tǒng)電線檢測(cè)方法精度較低、復(fù)雜環(huán)境下容易產(chǎn)生誤檢以及現(xiàn)有的基于神經(jīng)網(wǎng)絡(luò)的電線檢測(cè)算法效率不高等問(wèn)題,本文提出了一種適用于移動(dòng)端高效實(shí)時(shí)識(shí)別輸電線路的語(yǔ)義分割卷積神經(jīng)網(wǎng)絡(luò),命名為WireDetection。整體網(wǎng)絡(luò)為U 型的編碼解碼結(jié)構(gòu),能夠自動(dòng)提取低階和高階的特征,編碼過(guò)程采用了最大池化下采樣,解碼部分逐層上采樣恢復(fù)圖像細(xì)節(jié)。整體網(wǎng)絡(luò)框架只有9 層卷積層,采用最大池化索引的非線性上采樣方式以節(jié)省內(nèi)存空間,所以相比現(xiàn)有前沿的多分類語(yǔ)義分割網(wǎng)絡(luò),WireDetection 整體結(jié)構(gòu)精簡(jiǎn),也不需要額外的特征信息提取操作,能夠在移動(dòng)端平臺(tái)有較好的表現(xiàn)。本文的數(shù)據(jù)集為真實(shí)情況下無(wú)人機(jī)采集的輸電線路圖片,并做了像素級(jí)標(biāo)記。最后分別在同源與不同源的測(cè)試集上驗(yàn)證模型性能,并在一個(gè)移動(dòng)端GPU(Graphics Processing Unit)上測(cè)試模型的運(yùn)行速度。實(shí)驗(yàn)結(jié)果表明本文模型在不同測(cè)試集上相比現(xiàn)有的電線檢測(cè)算法都有更好的分割性能以及更快的識(shí)別速度。

      1 數(shù)據(jù)集

      現(xiàn)有的飛行器采集的已標(biāo)記的輸電線路公開(kāi)數(shù)據(jù)集稀少。目前有ETU(Eski?ehir Technical University)的公開(kāi)數(shù)據(jù)集[22],是從土耳其21個(gè)不同區(qū)域以及不同天氣情況下獲取的錄像中篩選出的較為清晰的幀圖像,但是數(shù)據(jù)量較少只有100 張已經(jīng)標(biāo)記的有效圖片,并且輸電線路圖片背景較單一。還有Zhang 等[20]制作的山地背景與城市背景的電線數(shù)據(jù)集,但是電線的像素標(biāo)記不完整,只有電線邊緣的像素被標(biāo)記。

      本文的輸電線路數(shù)據(jù)集是通過(guò)大疆(Da Jiang Innovations,DJI)無(wú)人機(jī)采集,命名為WireDataset。DJI Mavic Mini 無(wú)人機(jī)以30 frame/s 拍攝分辨率為1 920×1 080 的圖片。無(wú)人機(jī)在電線上方10 m內(nèi)拍攝圖片。如圖1所示,電線在圖片中的方向和位置多樣,圖片背景更加多樣:1)電線與背景對(duì)比度較低;2)背景中包含與電線有相似像素值或相似形狀的物體。

      圖1 WireDataset中的樣例圖片F(xiàn)ig.1 Example images in WireDataset

      原始圖片大小為1 920×1 080,其中包含電線的512×512像素的區(qū)域被截取來(lái)制作數(shù)據(jù)集,數(shù)據(jù)集的標(biāo)記使用公開(kāi)的圖片標(biāo)記工具LabelMe[23]。為了提高模型的泛化能力以及模型的魯棒性,數(shù)據(jù)集進(jìn)行了數(shù)據(jù)增強(qiáng)。在數(shù)據(jù)增強(qiáng)之前,隨機(jī)選取100 張圖片作為測(cè)試集。使用Python 的Augmentor 庫(kù)對(duì)每張圖片在-45°~45°間進(jìn)行隨機(jī)旋轉(zhuǎn),然后隨機(jī)左右翻轉(zhuǎn)、上下翻轉(zhuǎn)。最后擴(kuò)增圖片數(shù)量為原來(lái)的48 倍,總共19 200 張圖片。原始數(shù)據(jù)集包括標(biāo)簽可從鏈接https://github.com/Juting-HUANG/Power-Line-Dataset下載。

      本文使用WireDataset 測(cè)試集評(píng)估提出的模型。另外選取了Zhang等[20]制作的山地背景電線數(shù)據(jù)集中170張圖片,重新標(biāo)記作為測(cè)試集,命名為PLDM(Power Line Dataset of Mountain scene),用來(lái)評(píng)估模型在不同源數(shù)據(jù)集上的性能。

      2 本文方法

      2.1 網(wǎng)絡(luò)結(jié)構(gòu)

      本文提出的模型采用編碼-解碼的U型結(jié)構(gòu),整體結(jié)構(gòu)如圖2 所示,其中編碼部分網(wǎng)絡(luò)參考VGG-16[3]網(wǎng)絡(luò)結(jié)構(gòu),VGG-16 由13 層卷積層、5 層下采樣最大池化層以及3 層全連接層組成。為了適用于移動(dòng)端運(yùn)行,對(duì)整體網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了如下調(diào)整:1)保留了前4 個(gè)模塊;2)去除了第4 個(gè)模塊的下采樣層,并且每個(gè)模塊只保留一個(gè)卷積層;3)減少前3個(gè)模塊中卷積層的通道數(shù)至原來(lái)的1/2 以及第4 個(gè)模塊卷積層的通道數(shù)至原來(lái)的1/4。進(jìn)行這樣的調(diào)整有以下幾個(gè)原因:1)三次下采樣獲取的高階特征能夠滿足輸電線路檢測(cè)的二分類分割;2)為了獲取輸電線路相對(duì)背景的局部特征,通道數(shù)減少的四層卷積網(wǎng)絡(luò)已經(jīng)足夠深[19],并且使整體網(wǎng)絡(luò)參數(shù)量減少為1.96 MB,同時(shí)提高了預(yù)測(cè)速度,適用于移動(dòng)端運(yùn)行;另外在每一個(gè)卷積層后加入批量歸一化層[24],以此提升訓(xùn)練速度和模型性能。

      圖2 WireDetection整體網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Overall network architecture of WireDetection

      解碼部分與編碼部分結(jié)構(gòu)類似,相互對(duì)稱,但是取消了卷積層部分的偏置以及非線性ReLU(Rectified Linear Unit)[25],以提高訓(xùn)練過(guò)程中的優(yōu)化速度[26]。模型參考了SegNet的最大池化索引的上采樣方式進(jìn)行逐層恢復(fù)圖像細(xì)節(jié),利于邊緣分割更加精細(xì)化[8]。

      目前平臺(tái)已承接全國(guó)用戶規(guī)模達(dá)10 000個(gè),300家企業(yè)及代理商接入系統(tǒng)平臺(tái),8個(gè)區(qū)域數(shù)據(jù)中心;全國(guó)合作運(yùn)營(yíng)光纖傳輸網(wǎng)絡(luò)范圍達(dá)到14 000多公里,覆蓋全國(guó)200多個(gè)城市,目前是裝備制造業(yè)中最大的分布云網(wǎng)絡(luò)平臺(tái)綜合服務(wù)提供商和運(yùn)營(yíng)商。

      最后輸出的特征經(jīng)過(guò)一個(gè)1×1 卷積層,獲得一個(gè)2 通道特征圖。經(jīng)過(guò)一個(gè)softmax運(yùn)算獲得一個(gè)2通道的像素級(jí)別概率圖用于計(jì)算加權(quán)交叉熵?fù)p失。

      2.2 最大池化索引上采樣

      本文模型解碼階段采用最大池化索引上采樣的方式。編碼部分每一次進(jìn)行最大池化下采樣操作后,保存池化索引,然后傳遞到對(duì)稱的上采樣層。這種上采樣方式只存儲(chǔ)最大池化索引,占用很少的額外內(nèi)存空間,相比轉(zhuǎn)置卷積[7]的上采樣方式減少了端到端訓(xùn)練的參數(shù)量,適用于內(nèi)存資源有限的移動(dòng)端設(shè)備上運(yùn)行的模型;相比雙線性插值的上采樣方式[17],避免了邊界信息的丟失,有利于電線尺寸較小結(jié)構(gòu)的分割。

      圖3 最大池化索引上采樣Fig.3 Max-pooling indices based up-sampling

      2.3 加權(quán)損失函數(shù)

      輸電線在圖片中通常很細(xì),因此電線像素與背景像素的比例很不平衡。本文數(shù)據(jù)集中的電線像素在圖像中的占比小于10%。需要修改標(biāo)準(zhǔn)的交叉熵?fù)p失公式,使用median frequency balancing 方法[27]對(duì)背景與電線的損失進(jìn)行權(quán)重分配來(lái)解決圖形分割中樣本不平衡問(wèn)題,使得網(wǎng)絡(luò)對(duì)于占比較少的類別給予更多的關(guān)注。損失函數(shù)修改如下:

      其中:C+和C-分別表示電線和背景像素的標(biāo)注集合;P表示像素pc預(yù)測(cè)為相應(yīng)類別的概率;w1和w2分別為電線與背景像素的權(quán)重系數(shù)。通過(guò)如下公式來(lái)計(jì)算:

      其中:H和W分別表示一張圖片的高和寬,N表示訓(xùn)練集中圖片總數(shù)表示第n張圖片的第i個(gè)像素,medianFreq表示所有Freqc的中位值。對(duì)于二分類分割任務(wù),c=0或1,Nc=2 所以medianFreq的計(jì)算如下:

      3 實(shí)驗(yàn)與結(jié)果分析

      3.1 實(shí)驗(yàn)設(shè)置

      實(shí)驗(yàn)中采用tensorflow 框架構(gòu)建WireDetection 模型,采用NVIDIA TitanX GPU 硬件訓(xùn)練模型,GPU NVIDIA JetsonTX2硬件進(jìn)行模型性能的測(cè)試。訓(xùn)練過(guò)程中使用Adam 優(yōu)化算法來(lái)更新網(wǎng)絡(luò)參數(shù),設(shè)置初始學(xué)習(xí)率λ=0.001,模型的所有卷積層使用Xavier 初始化方法來(lái)初始化權(quán)重并設(shè)置偏置為0。批量歸一化層的γ值采用期望值為1、標(biāo)準(zhǔn)差為0.002 的正態(tài)分布初始化,β值初始化為0。訓(xùn)練過(guò)程中,每個(gè)批次大小設(shè)置為4。

      3.2 評(píng)價(jià)指標(biāo)

      本文使用平均交并比(mean Intersection over Union,mIoU)、類平均準(zhǔn)確率(Class Average Accuracy,CA_Acc)、召回率(Recall,R)、精度(Precision,P)、F1 分?jǐn)?shù)以及平均精度(Average Precision,AP)來(lái)定量分析模型的像素級(jí)分割效果。交并比(Intersection over Union,IoU)表示一類真實(shí)值像素集合和預(yù)測(cè)值像素集合的交集與并集的比值;平均交并比mIoU為各類交并比的平均值;召回率是被正確預(yù)測(cè)正例占所有真實(shí)正例的比例;類平均準(zhǔn)確率為不同類別召回率的平均值;精度是被正確預(yù)測(cè)的正例占所有預(yù)測(cè)為正例的比例;F1 分?jǐn)?shù)為召回率和準(zhǔn)確率的調(diào)和平均數(shù),通常用來(lái)衡量一個(gè)二分類模型的準(zhǔn)確性;平均精度通過(guò)計(jì)算PR(Precision-Recall)曲線下的面積來(lái)獲得,適合用來(lái)評(píng)估一個(gè)不平衡分類問(wèn)題中的分類模型性能[19]。假設(shè)類別數(shù)量為n,pij表示類別為i預(yù)測(cè)為j的像素?cái)?shù)量。所有的定量指標(biāo)如下所示:

      其中:TP(True Positive)表示標(biāo)記為電線的像素被正確識(shí)別,F(xiàn)N(False Negative)表示標(biāo)記為電線的像素被錯(cuò)誤識(shí)別為背景,TN(True Negative)表示標(biāo)記為背景的像素被正確識(shí)別,F(xiàn)P(False Positive)表示標(biāo)記為背景的像素被錯(cuò)誤識(shí)別為電線。

      3.3 實(shí)驗(yàn)結(jié)果分析

      Madaan 等[19]設(shè)計(jì)了多個(gè)針對(duì)移動(dòng)端電線檢測(cè)的神經(jīng)網(wǎng)絡(luò)模型,本文復(fù)現(xiàn)了其中運(yùn)行速度最快的模型,并命名為Dilated ConvNet。除了Dilated ConvNet,實(shí)驗(yàn)也將WireDetection 與DeepLabv3+、SegNet 以及FCN-8s 進(jìn)行對(duì)比。這些網(wǎng)絡(luò)結(jié)構(gòu)較深,能夠提取更多特征信息,有較好的分割精度。將WireDetection 與這些網(wǎng)絡(luò)進(jìn)行對(duì)比,側(cè)重于分割精度的對(duì)比,以驗(yàn)證本文模型不僅在移動(dòng)端具有很好的運(yùn)行效率,而且可以達(dá)到較好精度,也可以驗(yàn)證構(gòu)建一個(gè)針對(duì)電線分割的模型是必要的。為了驗(yàn)證最大池化上采樣和加權(quán)損失函數(shù)的效果,增加了對(duì)照實(shí)驗(yàn)。將WireDetection 中的上采樣方式分別替換為雙線性上采樣和反卷積上采樣,以及將損失函數(shù)替換為標(biāo)準(zhǔn)的交叉熵?fù)p失函數(shù),將對(duì)照組分別命名為WDBilinear,WD-Deconv和WD-CrossEntropy。

      3.3.1 定量分析

      首先在WireDataset測(cè)試集上進(jìn)行模型分割性能的評(píng)估,圖4 展示了不同模型的PR 曲線并標(biāo)記了每個(gè)模型的平均精度,WireDetection有最高的平均精度,與FCN-8s的分割性能相近。

      圖4 WireDataset測(cè)試集上的PR曲線Fig.4 PR curves on test set of WireDataset

      不同模型的評(píng)價(jià)指標(biāo)值如表2 所示。為了進(jìn)一步探究本文建立數(shù)據(jù)集的豐富性和模型的泛化性,模型經(jīng)過(guò)WireDataset 訓(xùn)練集訓(xùn)練后,也在PLDM 上進(jìn)行了分割性能的測(cè)試,如圖5和表3所示。

      從圖4和圖5可以看出,所有測(cè)試的模型在不同源數(shù)據(jù)集上的性能有所下降,但是WireDetection 和FCN-8s 相比其他模型依然有更好的分割性能。

      圖5 PLDM上的PR曲線Fig.5 PR curves on PLDM

      從表2 和表3 可以看出,WireDetection 在不同測(cè)試集上達(dá)到的精度、F1 分?jǐn)?shù)和mIoU 均要略低于分割性能最好的FCN-8s。但是如表1所示,F(xiàn)CN-8s模型參數(shù)量為420.75 M,遠(yuǎn)大于WireDetection 的1.47 M 參數(shù)量。DeepLabv3+和FCN-8s 占用過(guò)多內(nèi)存而無(wú)法在Jetson TX2 上運(yùn)行,不適用于移動(dòng)端的電線檢測(cè)任務(wù)。另一方面,相較于針對(duì)電線語(yǔ)義分割的模型Dilated ConvNet,WireDetection 的分割效果更好并且運(yùn)行速度最快,是Dilated ConvNet的兩倍,達(dá)到8.2 frame/s。

      表1 不同模型的預(yù)測(cè)速度和參數(shù)量Tab.1 Detection speed and number of parameter of different models

      表2 不同模型在WireDataset測(cè)試集上的定量評(píng)估Tab.2 Quantitative assessment of different models on test set of WireDataset

      表3 不同模型在PLDM上的定量評(píng)估Tab.3 Quantitative assessment of different models on PLDM

      本文模型相較于采用雙線性插值上采樣和采用標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù),在同源和非同源數(shù)據(jù)集上都有更好的分割表現(xiàn);相較于采用反卷積上采樣,分割性能相近,但是預(yù)測(cè)速度更快且參數(shù)量更少。實(shí)驗(yàn)結(jié)果表明,本文采用的上采樣方式和損失函數(shù)更加適用于輸電線的分割。

      3.3.2 定性分析

      圖6 展示了模型在WireDataset 測(cè)試集上的部分分割結(jié)果。WireDetection 能夠很好地分辨出低對(duì)比背景下或有相似物體如汽車(chē)和房屋邊緣背景下的電線??梢园l(fā)現(xiàn),圖中識(shí)別得到的部分電線出現(xiàn)中斷,這是由于卷積核提取的是局部特征信息,當(dāng)電線某一部分所處的背景對(duì)于電線識(shí)別干擾較大時(shí),比如相近顏色的汽車(chē)或者地面上相似的裂縫在背景中,會(huì)產(chǎn)生局部像素分類的偏差,從而出現(xiàn)電線的部分中斷。

      圖6 WireDetection測(cè)試集分割結(jié)果Fig.6 Segmentation results on test set of WireDetection

      圖7 展示了模型在PLDM 上的部分分割結(jié)果。相較于使用雙線性上采樣的DeepLabv3+以及WD-Bilinear,使用最大池化索引上采樣的WireDetection 和SegNet以及反卷積上采樣的FCN-8s 和WD-Deconv 對(duì)細(xì)小結(jié)構(gòu)的分割更加準(zhǔn)確。因?yàn)閳D片是在無(wú)人機(jī)相距電線上方約30 m 的距離采集的,電線在圖片中很細(xì),但是WireDetection 和FCN-8s 依然能夠較好地識(shí)別出電線。相比Dilated ConvNet,WireDetection 的錯(cuò)誤識(shí)別像素更少。WireDetection 能夠在移動(dòng)端達(dá)到較好的識(shí)別速度的同時(shí),保持較好的分割精度。圖7 能看出,采用標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)訓(xùn)練的WD-CrossEntropy 泛化性能較差,不能在非同源數(shù)據(jù)集上有效分割電線。

      圖7 PLDM分割結(jié)果Fig.7 Segmentation results on PLDM

      但是由于測(cè)試集PLDM 中部分與電線顏色相近的背景如樹(shù)枝等的圖片未在訓(xùn)練集中出現(xiàn),分割結(jié)果中錯(cuò)誤的正例(FP)增加,精度下降。如圖6 所示,WireDetection 能夠很好地區(qū)分WireDataset 的測(cè)試集中與電線相近的背景,表明WireDetection 模型具有較好的學(xué)習(xí)能力。因此,當(dāng)訓(xùn)練集中擴(kuò)充足夠多的學(xué)習(xí)樣本后,WireDetection 模型對(duì)于相似背景的分割精度會(huì)逐漸提升。

      4 結(jié)語(yǔ)

      針對(duì)傳統(tǒng)數(shù)字圖像技術(shù)檢測(cè)電力線精度較低和現(xiàn)有神經(jīng)網(wǎng)絡(luò)電線檢測(cè)方法效率不高的問(wèn)題,本文提出了一個(gè)適用于移動(dòng)端識(shí)別輸電線路的語(yǔ)義分割神經(jīng)網(wǎng)絡(luò)。該模型采用了U型的編碼與解碼結(jié)構(gòu),編碼部分采用最大池化層提取高階特征,解碼部分采用最大池化索引的非線性上采樣方式逐層融合多尺度特征,網(wǎng)絡(luò)整體結(jié)構(gòu)精簡(jiǎn)。采用加權(quán)損失函數(shù)解決電線像素與背景像素不平衡的問(wèn)題,提高模型的優(yōu)化性能。本文構(gòu)建了擁有多種復(fù)雜背景的電線數(shù)據(jù)集WireDataset,重新標(biāo)注了山地背景的公開(kāi)數(shù)據(jù)集作為額外的測(cè)試集。相較于現(xiàn)有的電線語(yǔ)義分割模型,本文模型對(duì)輸入圖片預(yù)測(cè)速度有很大提升,并且有更好的分割性能,可以用于移動(dòng)設(shè)備的實(shí)時(shí)電線分割。本文模型在不同源數(shù)據(jù)集上,分割性能有所下降,接下來(lái)需要進(jìn)一步擴(kuò)充訓(xùn)練集,并開(kāi)展電線的定位工作,將使用多視角定位方法獲取與電線距離。

      猜你喜歡
      電力線電線背景
      “新四化”背景下汽車(chē)NVH的發(fā)展趨勢(shì)
      《論持久戰(zhàn)》的寫(xiě)作背景
      洪水時(shí)遇到電線低垂或折斷該怎么辦
      1000條蛇守衛(wèi)電線
      基于電力線載波通信的智能限電裝置
      電子制作(2017年14期)2017-12-18 07:07:59
      晚清外語(yǔ)翻譯人才培養(yǎng)的背景
      一種壓縮感知電力線信道估計(jì)機(jī)制
      電線
      地上電線不要碰
      電力線載波通信標(biāo)準(zhǔn)PRIME和G3-PLC的研究
      太湖县| 彰化县| 新安县| 周宁县| 轮台县| 罗田县| 江西省| 永嘉县| 宝丰县| 胶州市| 涪陵区| 丰都县| 余江县| 黔江区| 台前县| 蛟河市| 搜索| 隆林| 西吉县| 屯门区| 庄浪县| 福贡县| 平乐县| 米脂县| 达日县| 永仁县| 海南省| 会东县| 普定县| 曲阜市| 凤山县| 广南县| 婺源县| 彰化县| 大冶市| 西峡县| 新建县| 囊谦县| 广丰县| 桃源县| 长乐市|