包建國,邱鵬程,蔣興福,楊 斌
(1.核動力運行研究所,湖北 武漢 430223;2.中國地質(zhì)大學(xué)(武漢),湖北 武漢 430074)
核電站運行過程中,蒸汽發(fā)生器傳熱管外表面因二回路工質(zhì)中的雜質(zhì)和離子濃縮并沉積形成表面結(jié)垢。隨著時間的推移,這種表面結(jié)垢現(xiàn)象愈發(fā)嚴(yán)重,最終造成蒸發(fā)器無法正常運行。所以,保持核電站蒸發(fā)器清潔度優(yōu)異對提高核電站發(fā)電效率起著重要作用[1]。由于蒸發(fā)器內(nèi)部空間結(jié)構(gòu)狹小及核輻射影響,導(dǎo)致無法執(zhí)行人工清洗任務(wù),需先精確定位到傳熱管中心得到位置偏差,進而實現(xiàn)清洗噴嘴定位,最后執(zhí)行清洗任務(wù)。其中,快速精確實現(xiàn)清洗噴嘴的定位,確保清洗噴嘴對準(zhǔn)傳熱管管間中心是清洗流程中的關(guān)鍵。
隨著計算機硬件水平和互聯(lián)網(wǎng)大數(shù)據(jù)的發(fā)展,深度學(xué)習(xí)在自然語言、計算機視覺和模式識別等領(lǐng)域中取得了眾多的應(yīng)用成果。在計算機視覺領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)占據(jù)主導(dǎo)地位,擁有AlexNet[2]、ReseNet[3]、MobileNet[4]和EfficientNet[5]等優(yōu)秀的深度卷積神經(jīng)網(wǎng)絡(luò)框架。其中,EfficientNet框架通過綜合優(yōu)化網(wǎng)絡(luò)寬度、網(wǎng)絡(luò)深度和分辨率,能夠達(dá)到準(zhǔn)確率指標(biāo)和現(xiàn)有分類網(wǎng)絡(luò)相近的情況下,大大減少模型參數(shù)量和計算量,在計算機視覺領(lǐng)域被廣泛應(yīng)用。
由于CNN 在降采樣和全連接過程中會丟失大量的細(xì)節(jié)和空間信息,導(dǎo)致CNN無法在語義分割應(yīng)用中提供良好的定位準(zhǔn)確性和完整性[6]。為解決CNN存在的弊端,Long等[7]基于CNN提出了全卷積網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN),以卷積層代替全連接層,將其應(yīng)用到語義分割任務(wù)中,獲得了更高的分割精度。本文以FCN為主體框架,采用EfficientNet的MBConvBlock架構(gòu)搭建FCN的圖像編碼區(qū),使用全卷積和特征融合搭建FCN的解碼區(qū),快速精確分割出傳熱管輪廓,從而確定傳熱管中心在圖像中的像素坐標(biāo),進而確定定位攝像頭與噴嘴的實際位置偏差,實現(xiàn)了噴嘴的自適應(yīng)定位。
本文提出一種基于圖像分割的方法來實現(xiàn)蒸發(fā)器二次側(cè)管板清洗噴嘴的自適應(yīng)定位,該方法的關(guān)鍵是通過圖像分割準(zhǔn)確獲取傳熱管的輪廓信息,其總體流程如圖1所示,主要包括3個階段:
圖1 總體流程
a.采集傳熱管圖像,制作對應(yīng)的標(biāo)簽圖像生成數(shù)據(jù)集,并根據(jù)標(biāo)簽圖像精確標(biāo)定傳熱管的實際中心像素位置。搭建基于全卷積神經(jīng)網(wǎng)絡(luò)的實例分割模型,載入數(shù)據(jù)集訓(xùn)練并優(yōu)化模型,得到泛化能力最高的網(wǎng)絡(luò)權(quán)重。該階段直接影響傳熱管中心定位的精度和速度,是本研究的關(guān)鍵。
b.輸入新圖像到網(wǎng)絡(luò)模型中進行前向計算獲得概率分布圖像。
c.對概率分布圖像進行預(yù)處理獲得傳熱管的輪廓信息,通過輪廓分析得到傳熱管中心像素位置,建立攝像頭與傳熱管中心線的位置關(guān)系,實現(xiàn)噴嘴的自適應(yīng)定位。
圖2為基于全卷積神經(jīng)網(wǎng)絡(luò)的語義分割模型架構(gòu),網(wǎng)絡(luò)輸入為512×512×3的RGB三通道彩色圖像,網(wǎng)絡(luò)輸出為512×512的概率分布,整個網(wǎng)絡(luò)架構(gòu)實現(xiàn)了端到端的輸出。
圖2 全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
全卷積神經(jīng)網(wǎng)絡(luò)由圖像卷積編碼區(qū)和反卷積特征解碼區(qū)2部分構(gòu)成,在卷積編碼區(qū),輸入圖像經(jīng)卷積不斷降低分辨率和拓?fù)涮卣鲗訉挾?,保留盡可能多的圖像特征信息,編碼結(jié)果在圖2中表示為32×32×80的特征層;在反卷積解碼區(qū),對特征層進行反卷積增大分辨率,同時通過跳層連接融合底層和高層特征信息,獲得與原圖同等分辨率的特征層,在圖2中表示為512×512×16的特征層。最后通過2層卷積將特征層映射至512×512的大小,并采用Sigmoid激活函數(shù)將特征層映射到0~1的概率分布,獲得每個像素點屬于前景的概率值。
2.1.1 卷積降采樣
在圖像卷積編碼過程中,輸入圖像通過步長為2的卷積層進行降采樣,這種降采樣方式可獲得特征圖更大的感受野;通過卷積可提取出重要特征,減少圖像信息的丟失;降低網(wǎng)絡(luò)的復(fù)雜度,減少網(wǎng)絡(luò)的計算量[8]。
卷積降采樣后,首先對特征層進行批標(biāo)準(zhǔn)化,把神經(jīng)網(wǎng)絡(luò)輸入值的分布強行拉回到均值為0方差為1的標(biāo)準(zhǔn)正態(tài)分布[9];然后采用如式(1)所示的修正線性單元對特征層進行激活。這種架構(gòu)使得激活輸入值落在非線性函數(shù)對輸入比較敏感的區(qū)域,保證輸入的微弱變化就會導(dǎo)致?lián)p失函數(shù)的劇烈變化,可避免梯度消失問題的產(chǎn)生,從而加速模型的收斂并防止模型過擬合,達(dá)到一定的正則化效果,最終提升模型的泛化能力。
(1)
2.1.2 MBConvBlock特征提取
EfficientNet采用MBConBlock塊堆疊而成,本文采用EfficientNet中MBConvBlock框架加強圖像特征提取。MBConvBlock加強特征提取流程如圖3所示,包括4個步驟:
圖3 MBConvBlock特征提取流程
a.采用1×1的卷積擴張輸入特征層的維度,卷積后依次進行批標(biāo)準(zhǔn)化和Swish激活。
(2)
b.采用深度可分離卷積對特征層的每個通道進行濾波,卷積后依次進行批標(biāo)準(zhǔn)化和Swish激活,通過深度可分離卷積可有效減少模型的運算量。
c.搭建注意力機制,首先采用全局平均池化(global average pool)將空間信息壓縮;然后由2個1×1的卷積層壓縮和擴張?zhí)卣骶S度,完成通道信息的提??;最后經(jīng)過Sigmoid激活函數(shù)后使用乘操作來提取關(guān)鍵特征,得到注意力機制映射。
d.采用1×1卷積將特征層的維度調(diào)整至與輸入特征層一致,然后加入殘差塊,融合淺層特征和高層特征。
2.2.1 反卷積升維
全卷積網(wǎng)絡(luò)的主要優(yōu)勢是用反卷積層代替?zhèn)鹘y(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的全連接層,全連接層將特征圖映射為一維向量,一維向量的結(jié)果會損失圖像的空間信息,反卷積層具有局部連接和權(quán)值共享特性,不僅可以避免圖像空間信息的損失,而且減少了網(wǎng)絡(luò)的訓(xùn)練參數(shù),提升了模型的計算效率。FCN在反卷積層采用上采樣操作使特征層逐漸恢復(fù)至原圖像的尺寸,反卷積的輸入輸出尺寸關(guān)系為
o=s(i-1)-2p+k
(3)
i為輸入尺寸;o為輸出尺寸;s為反卷積步長;p為填充尺寸;k為卷積核的尺寸。
2.2.2 特征融合
在圖像卷積編碼時,由于降采樣導(dǎo)致特征層丟失了一部分空間信息,若僅通過反卷積上采樣,雖然最終輸出圖像大小與原圖一致,但是分割效果不佳。在卷積神經(jīng)網(wǎng)絡(luò)中,淺層相對于高層具有更多的細(xì)節(jié)邊緣信息,可以提供更精確的邊界與紋理信息,而高層包含更加抽象的語義特征,可以較粗略地反映目標(biāo)區(qū)域的位置與形狀。本文采用跳層連接的方式,融合淺層特征和高層特征來實現(xiàn)修復(fù)空間信息的效果[10],最終獲得圖像的局部與全局信息,得到相對精確的分割邊界。
傳熱管圖像的語義分割包括目標(biāo)傳熱管和背景2個類別,針對傳熱管圖像的每個像素點需要決策是屬于前景還是背景,每個像素點的決策均為二分類問題,故采用二分類交叉熵?fù)p失函數(shù),即
(4)
M為訓(xùn)練時BatchSize的大?。籒為網(wǎng)絡(luò)輸出特征個數(shù),在本文設(shè)計的網(wǎng)絡(luò)中為262 144;yij為標(biāo)簽圖像某一像素值,背景為0,前景為1;pij為網(wǎng)絡(luò)輸出結(jié)果,范圍在0~1之間,大于0.5為前景,小于0.5為背景。
輪廓分析前需對FCN語義分割模型輸出的概率分布圖像進行預(yù)處理,首先以閾值0.5劃分每個像素點的類別,得到標(biāo)準(zhǔn)的二值化輪廓圖;然后采用Canny算法得到傳熱管邊緣信息,完成輪廓分析的預(yù)處理。
傳熱管輪廓是連續(xù)分布的像素集合Q={(x1,y1),(x2,y2),(x3,y3)…(xn,yn)}。本文采用幾何不變矩獲取傳熱管輪廓的中心,幾何不變矩的定義如式(5),其中,n為傳熱管輪廓像素點個數(shù);xi、yi為該輪廓像素點的位置;f(xi,yi)為該像素的像素值,由于邊緣輪廓的像素值均為255,即f(xi,yi)均為255。通過幾何不變矩得到的輪廓質(zhì)心和輪廓中心重合,在式(5)中若p,q同時為0,則為零階矩m00;若p,q中一個變量為0,另一個變量為1,則為一階矩(m10,m01);通過零階矩和一階矩可求出輪廓項心,計算公式如式(6)所示。
(5)
(6)
數(shù)據(jù)集的質(zhì)量對深度學(xué)習(xí)算法的表現(xiàn)起著決定性作用,高質(zhì)量的數(shù)據(jù)集要求圖像數(shù)據(jù)規(guī)模大且復(fù)雜多樣。在不同光照強度環(huán)境下,利用工業(yè)相機采集傳熱管在不同位置和傾斜角度下的圖像數(shù)據(jù)1 106張,采用雙線性插值方法將每張圖像降采樣至521×512大小。為提升模型的泛化能力,在網(wǎng)絡(luò)的訓(xùn)練過程中讀取數(shù)據(jù)時,通過隨機翻轉(zhuǎn)、模糊、亮度調(diào)整、對比度調(diào)整和添加人工噪聲等數(shù)據(jù)增強方法擴增訓(xùn)練集,如圖4所示。數(shù)據(jù)標(biāo)注使用Labelme工具對傳熱管區(qū)域進行手工提取,傳熱管區(qū)域為全白,背景區(qū)域為全黑。
圖4 數(shù)據(jù)增強效果
按7∶3的比例將數(shù)據(jù)集分割為訓(xùn)練集(774張)和測試集(332張),模型的訓(xùn)練以10張圖片為1個批次,采用Adam優(yōu)化器和Ploy學(xué)習(xí)率調(diào)整策略。Poly策略的公式如式(7),其中,lrn為最終學(xué)習(xí)率;lrb為初始學(xué)習(xí)率;e為訓(xùn)練迭代的次數(shù);t為最大迭代次數(shù);p控制曲線的形狀(大于1)。
(7)
本文采取準(zhǔn)確率(accuracy,ACC)、靈敏度(sensitivity,SE)和特異性(specificity,SP)來評估模型的分割性能。準(zhǔn)確率表示類別預(yù)測正確的像素個數(shù)占圖像像素總數(shù)的比例,從整體上反映模型的魯棒性;靈敏度表示正確預(yù)測的前景像素個數(shù)占總體前景像素的比例,反映的是前景像素的漏檢情況;特異性表示被正確預(yù)測的背景像素個數(shù)占總體背景像素的比例,反映的是前景像素的誤檢情況。3個指標(biāo)的計算公式如式(8)~式(10),其中,TP為真陽性,表示正確分類的前景像素個數(shù);TN為真陰性,表示正確分類的背景像素個數(shù);FP為假陽性,表示誤分類為前景像素的個數(shù);FN為假陰性,表示誤分類為背景像素的個數(shù)。
(8)
(9)
(10)
得到網(wǎng)絡(luò)模型后進行傳熱管中心定位測試實驗,與實際標(biāo)定的中心像素位置對比得到定位誤差。本文將模型與去除反卷積的CNN模型、無特征融合模型和基于VGG16的FCN模型,在分割性能、計算資源消耗和定位精度進行比較,在訓(xùn)練集上的實驗結(jié)果如表1所示,在測試集上的實驗結(jié)果如表2所示。
表1 訓(xùn)練集各類算法實驗數(shù)據(jù)
表2 測試集各類算法實驗數(shù)據(jù)
從表1和表2的實驗數(shù)據(jù)分析可得:
a.去除反卷積使用全連接的CNN架構(gòu)不僅使參數(shù)量急劇增加,而且模型分割性能不佳,定位誤差大。
b.去除特征融合后模型參數(shù)量不變,在同等計算量下,模型分割性能略差于本文模型,定位誤差大于本文模型。
c.以VGG16為主干的FCN架構(gòu)與本文模型的分割性能和定位誤差相差無幾,但本文模型能以很低的計算資源實現(xiàn)高精度的定位效果。
本文模型以FCN為主體框架,經(jīng)過多種經(jīng)典方案集成形成一個輕量化和分割性能優(yōu)異的語義分割模型,其在訓(xùn)練集和測試集上的損失值小、分割精度高和計算資源消耗低,可快速精確實現(xiàn)蒸發(fā)器傳熱管的中心定位。
本文基于全卷積神經(jīng)網(wǎng)絡(luò)框架,應(yīng)用EfficientNet的MBConvBlock架構(gòu)、卷積降維、反卷積升維和特征融合組合形成一個輕量化和分割精度高的語義分割模型,并將該模型應(yīng)用到清洗噴嘴在蒸發(fā)器二次側(cè)管板清洗中的自適應(yīng)定位任務(wù)中。實驗結(jié)果表明,在保證傳熱管定位精度的前提下,本模型更好地壓縮參數(shù)量,減少計算資源消耗,提高機器人反饋控制速度和精度。