楊彥利,矯紅巖
(天津工業(yè)大學(xué) 電子與信息工程學(xué)院,天津300387)
絕緣子是輸電線路的重要組成部分[1]。絕緣子長(zhǎng)期暴露在自然環(huán)境中,難免出現(xiàn)自爆、掉串和破損等問(wèn)題。對(duì)絕緣子的巡檢成為保障輸電線路正常工作的必要手段。
目前,絕緣子狀態(tài)監(jiān)測(cè)已發(fā)展到無(wú)人機(jī)自動(dòng)巡檢階段,自動(dòng)采集絕緣子圖像并進(jìn)行故障識(shí)別[2]。借助于深度學(xué)習(xí)來(lái)識(shí)別絕緣子圖像越來(lái)越受到關(guān)注,如卷積神經(jīng)網(wǎng)絡(luò)CNN 用于從紅外圖像[3]和視覺(jué)圖像[4]中檢測(cè)絕緣子,深度卷積神經(jīng)網(wǎng)絡(luò)DCNN 用于識(shí)別絕緣子的自爆[5],基于跨連接卷積神經(jīng)網(wǎng)絡(luò)的絕緣子檢測(cè)方法[6]等。還有識(shí)別與定位故障絕緣的方法[7-9],如基于Mask R-CNN 的方法[10]。這些方法雖在一定程度上提高了絕緣子故障檢測(cè)的智能程度,但基于神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法[11]依賴于大量的訓(xùn)練樣本,其樣本庫(kù)的容量直接決定了神經(jīng)網(wǎng)絡(luò)檢測(cè)方法的性能。
利用深度學(xué)習(xí)來(lái)識(shí)別絕緣子故障需要大數(shù)據(jù)的支撐,絕緣子圖像往往為企業(yè)獨(dú)有,難以建立共享的大樣本庫(kù),嚴(yán)重影響該方法對(duì)絕緣子故障的識(shí)別。在此,研究了故障絕緣子圖像的計(jì)算機(jī)生成方法, 利用生成對(duì)抗網(wǎng)絡(luò)GAN 來(lái)生成故障絕緣子圖像,以模擬真實(shí)的絕緣子圖像,達(dá)到增加故障絕緣子圖像樣本和多樣性的目的。
GAN 生成圖像的基本框架如圖1 所示[12]。
圖1 GAN 生成圖像的示意框圖Fig.1 Diagrammatic sketch of GAN generated image
由圖可見(jiàn),GAN 包含2 個(gè)網(wǎng)絡(luò): 生成網(wǎng)絡(luò)G 和判別網(wǎng)絡(luò)D。生成網(wǎng)絡(luò)G 不斷學(xué)習(xí)訓(xùn)練集中真實(shí)圖像數(shù)據(jù)的概率分布,其目標(biāo)是將輸入的隨機(jī)噪聲轉(zhuǎn)化為能以假亂真的圖像;判別網(wǎng)絡(luò)D 判斷一個(gè)圖像是否為真實(shí)的圖像, 目標(biāo)是將生成網(wǎng)絡(luò)G 產(chǎn)生的“假”圖像與訓(xùn)練集中的“真”圖像樣本分辨開(kāi)。
深度卷積對(duì)抗生成網(wǎng)絡(luò)DCGAN[13](deep convo lution generative adversarial networks),在GAN 網(wǎng)絡(luò)的基礎(chǔ)上引入了卷積操作,利用卷積層強(qiáng)大的特征提取能力來(lái)提高GAN 的效果[14],以期解決GAN訓(xùn)練不穩(wěn)定的問(wèn)題。它雖是訓(xùn)練生成對(duì)抗網(wǎng)絡(luò)的一種更穩(wěn)定的體系結(jié)構(gòu), 但有時(shí)會(huì)進(jìn)入單一振蕩模式。對(duì)此,人們又開(kāi)發(fā)出一些模型[15-17],這些模型從不同角度改進(jìn)了DCGAN,每個(gè)網(wǎng)絡(luò)有各自的特點(diǎn),具體見(jiàn)表1。
由表可知, 網(wǎng)絡(luò)模型的差別主要是損失函數(shù)、判別器最后一層以及優(yōu)化算法的選擇,并且不同的網(wǎng)絡(luò)模型在不同領(lǐng)域具有不同的應(yīng)用效果。
相比于GAN 模型,DCGAN 模型利用了卷積網(wǎng)絡(luò)強(qiáng)大的特征提取能力,可更好地生成圖像。DCGAN可用于螺栓圖像生成[18]、天文圖像生成[19]、SAR 圖像生成[20]等。在此,以DCGAN 模型為基礎(chǔ)生成絕緣子圖像,結(jié)合絕緣子圖像的特點(diǎn),對(duì)DCGAN 模型進(jìn)行適當(dāng)?shù)男薷?,以自?dòng)生成能夠以假亂真的故障絕緣子圖像樣本。
表1 網(wǎng)絡(luò)模型的特點(diǎn)對(duì)比Tab.1 Comparison of characteristics of network models
基于DCGAN 生成絕緣子圖像的流程如圖2 所示。在此采用了均勻分布的隨機(jī)噪聲而非正態(tài)分布的隨機(jī)噪聲。
圖2 絕緣子圖像生成過(guò)程示意圖Fig.2 Diagrammatic sketch of insulator image generation process
由圖可見(jiàn),利用DCGAN 生成絕緣子圖像的過(guò)程如下:將隨機(jī)噪聲輸入生成網(wǎng)絡(luò),生成“假”樣本數(shù)據(jù),再將生成的“假”樣本數(shù)據(jù)與從圖像樣本中的實(shí)際圖像一起輸入到判別網(wǎng)絡(luò)。該過(guò)程與基于GAN的圖像生成方法基本框架類似,差別在于生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)。這也表明,生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)是圖像生成的2 個(gè)核心部分。在此,主要從這2 個(gè)部分來(lái)改進(jìn)DCGAN,以生成高質(zhì)量的絕緣子圖像。
1)修改生成網(wǎng)絡(luò)
首先修改生成網(wǎng)絡(luò),以提高生成絕緣子圖像的分辨率。在原DCGAN 基礎(chǔ)上增加一層卷積網(wǎng)絡(luò),生成網(wǎng)絡(luò)模型結(jié)構(gòu)如圖3 所示,修改后的生成網(wǎng)絡(luò)可以生成大小為128×128 的絕緣子圖像。生成網(wǎng)絡(luò)中除最后一層外,每層均加入BatchNorm[21](批量歸一化)層,其目的是增加學(xué)習(xí)的穩(wěn)定性。
圖3 生成網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of generate network
激活函數(shù)也是神經(jīng)網(wǎng)絡(luò)的一個(gè)重要參量。它的作用是將輸入進(jìn)行非線性映射,使神經(jīng)網(wǎng)絡(luò)可任意逼近任何非線性函數(shù)。常用的有Sigmoid 函數(shù)[22]、Tanh函數(shù)、線性整流函數(shù)ReLU 等,眾所周知,其表達(dá)式分別為
Sigmoid 是將輸入的連續(xù)實(shí)值變換為0~1 之間的輸出;Tanh 函數(shù)取值范圍為[-1,1]。生成網(wǎng)絡(luò)的輸出層采用Tanh 函數(shù),其余層激活函數(shù)是ReLU 函數(shù)。
生成網(wǎng)絡(luò)的輸入為均勻分布的隨機(jī)噪聲,經(jīng)過(guò)reshape 后得到大小為4×4 的512 層圖像,再與卷積核為5,步長(zhǎng)為2,Padding=1 進(jìn)行反卷積,得到256層8×8 的圖像, 依此類推。最終得到3 層128×128的圖像作為判別器的輸入。而Tanh 函數(shù)的取值范圍是[-1,1],目的是使數(shù)據(jù)壓縮到[-1,1]。
2)修改判別網(wǎng)絡(luò)
與原DCGAN 中的判別網(wǎng)絡(luò)相比, 在此增加了一層卷積網(wǎng)絡(luò),其模型如圖4 所示。判別網(wǎng)絡(luò)的輸入有兩部分:真實(shí)的絕緣子樣本圖像數(shù)據(jù)和生成網(wǎng)絡(luò)生成的“假”絕緣子圖像數(shù)據(jù)。判別網(wǎng)絡(luò)是要判斷生成的絕緣子圖像的真實(shí)性,且判斷越準(zhǔn)越好。
圖4 判別網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of discriminant network
判別網(wǎng)絡(luò)使用轉(zhuǎn)置卷積層(transposed convolutional layer),且用≮2 的步長(zhǎng)進(jìn)行上采樣,中間層均加入BatchNorm 層。判別網(wǎng)絡(luò)的最后一層使用Sigmoid 激活函數(shù), 其他層的激活函數(shù)均采用Leak Relu 函數(shù)。
為了使生成網(wǎng)絡(luò)更快的學(xué)習(xí)到樣本的特征,并減緩生成網(wǎng)絡(luò)損失的下降,每訓(xùn)練1 次判別網(wǎng)絡(luò)便訓(xùn)練5 次生成網(wǎng)絡(luò),即每更新1 次判別網(wǎng)絡(luò)的權(quán)重需要更新5 次生成網(wǎng)絡(luò)的權(quán)重。通過(guò)不斷地更新生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的權(quán)重,使生成網(wǎng)絡(luò)持續(xù)學(xué)習(xí)到真實(shí)數(shù)據(jù)的分布,進(jìn)而根據(jù)數(shù)據(jù)的分布生成絕緣子圖像。生成網(wǎng)絡(luò)生成以假亂真的圖像來(lái)欺騙判別網(wǎng)絡(luò),直至判別網(wǎng)絡(luò)不能分清輸入圖像的真?zhèn)?。在?xùn)練過(guò)程中,生成網(wǎng)絡(luò)與判別網(wǎng)絡(luò)互相學(xué)習(xí),并且保持基本相同的學(xué)習(xí)速率, 通過(guò)不斷地互相學(xué)習(xí),最終達(dá)到一個(gè)均衡的效果。
利用改進(jìn)的DCGAN 模型來(lái)生成絕緣子圖像,并與LSGAN,WGAN,WGAN-GP 等模型生成的絕緣子圖像進(jìn)行對(duì)比。通過(guò)多種途徑獲得絕緣子圖像,經(jīng)過(guò)人工篩選得到清晰的絕緣子圖像樣本有988張,圖像分辨率為178×218。使用Python 語(yǔ)言并基于Pycharm 軟件進(jìn)行編程。
在此,通過(guò)IS[23](inception score)指標(biāo)來(lái)評(píng)估生成模型性能。IS 主要評(píng)估生成圖像的清晰度和多樣性,IS 值越高,模型生成圖像的質(zhì)量越好。通過(guò)將生成的圖像放入預(yù)訓(xùn)練的Inception 模型[24]中,計(jì)算目標(biāo)圖像的熵值實(shí)現(xiàn)對(duì)圖像質(zhì)量的評(píng)估。即[23]:
式中:x~pg為生成的圖像;y 為樣本輸入到Inception模型產(chǎn)生的向量;p(y|x)為該圖像在各個(gè)類別的概率分布;p(y)為該圖像的概率分布;DK-L為對(duì)p(y|x)和p(y)求K-L 散度。K-L 散度用以衡量2 個(gè)概率分布的距離,它是非負(fù)的,值越大說(shuō)明這2 個(gè)概率分布越不像。眾所周知,K-L 散度公式為
式中:P(i)為真實(shí)圖像的數(shù)據(jù)分布概率;Q(i)為生成圖像的數(shù)據(jù)分布概率。
為了進(jìn)一步驗(yàn)證改進(jìn)模型的準(zhǔn)確度,采用基于Mask R-CNN 的故障絕緣子識(shí)別中的方法[10]。其中平均準(zhǔn)確率AP 和總平均準(zhǔn)確率MAP 的值代表了模型識(shí)別絕緣子圖像的精準(zhǔn)度,AP 由準(zhǔn)確率和召回率求平均得到。準(zhǔn)確率P 為[10]
式中:TP 為準(zhǔn)確識(shí)別出故障絕緣子的數(shù)量;FP 為將故障絕緣子識(shí)別為正常絕緣子的數(shù)量。召回率R 為[10]
式中:FN 為將正常絕緣子識(shí)別為故障絕緣子的數(shù)量。MAP 為所有的AP 之和求平均值。
經(jīng)過(guò)試驗(yàn)調(diào)試, 發(fā)現(xiàn)學(xué)習(xí)率設(shè)為0.0004 時(shí),生成的絕緣子圖像效果較佳。輸入均勻分布的隨機(jī)噪聲,輸出是分辨率為128×128 的絕緣子圖像。經(jīng)過(guò)10000 次訓(xùn)練,所生成的無(wú)背景、有背景絕緣子圖像如圖5 所示。
圖5 DCGAN 生成的絕緣子圖像Fig.5 Insulator image generated by DCGAN network
由圖可見(jiàn),生成的絕緣子圖像很逼真,而且圖像具有不同的形態(tài)。
作為對(duì)比,在相同輸入條件下,使用不同網(wǎng)絡(luò)模型生成的絕緣子圖像如圖6 所示,每種網(wǎng)絡(luò)均調(diào)到最優(yōu)。
由圖可見(jiàn),WGAN 模型生成的絕緣子圖像幾乎無(wú)法辨認(rèn);WGAN-GP 模型生成的絕緣子圖像相差不大;LSGAN 模型生成的絕緣子圖像效果較好,但其多樣性不是很好。
為便于比較,將4 種模型參數(shù)均調(diào)到最優(yōu),并計(jì)算其IS 值, 結(jié)果見(jiàn)表2。由表可知, 改進(jìn)后的DCGAN 網(wǎng)絡(luò)的IS 值為4.10,高于其他模型IS 值。
為測(cè)試生成圖像的實(shí)用效果,選取并分析改進(jìn)后模型生成的100 張有背景和無(wú)背景的圖像。先用文獻(xiàn)[10]中的模型進(jìn)絕緣子識(shí)別,測(cè)試結(jié)果見(jiàn)表3。由表可知生成的部分絕緣子圖像被正確識(shí)別。作為對(duì)比, 將100 張圖像取50 張進(jìn)行訓(xùn)練, 對(duì)另外50張進(jìn)行測(cè)試,結(jié)果見(jiàn)表3。測(cè)試結(jié)果表明,MAP 值有不同程度的提高, 尤以無(wú)背景圖像的MAP 值大幅提高,這表明所生成的絕緣子圖像可以像真實(shí)絕緣子圖像那樣被有效識(shí)別。
圖6 不同模型生成的絕緣子圖像對(duì)比Fig.6 Comparison of insulator images generated by different models
表2 IS 值的比較Tab.2 Comparison of IS values
表3 MAP 值對(duì)比Tab.3 Comparison of the MAP values
利用DCGAN 模型設(shè)計(jì)了絕緣子圖像生成算法。針對(duì)絕緣子圖像的特點(diǎn),修改了DCGAN 模型的生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò),并設(shè)置了合適的激活函數(shù)和學(xué)習(xí)率等參數(shù),實(shí)現(xiàn)了故障絕緣子圖像的自動(dòng)生成。與基于LSGAN,WGAN,WGAN-GP 等模型生成絕緣子的圖像進(jìn)行對(duì)比,結(jié)果表明本文算法生成的絕緣子圖像效果更好,一些圖像可以達(dá)到真?zhèn)坞y辨的程度。鑒于絕緣子工況的復(fù)雜多變性,生成具有復(fù)雜背景的故障絕緣子圖像尚需在后續(xù)的工作中進(jìn)一步研究。