練睿
(廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東 惠州 516001)
近年來,隨著計算機視覺和深度學(xué)習(xí)等技術(shù)的發(fā)展,自動化的電力設(shè)備圖像識別方法成為一種可行的解決方案。對于現(xiàn)有圖形監(jiān)控系統(tǒng),通常是將多媒體數(shù)據(jù)信息傳輸至云端,無法進行智能數(shù)據(jù)分析,需專業(yè)技術(shù)人員對監(jiān)控下的電力設(shè)備圖形進行分析。圖形儲量過大,對于設(shè)備自動化運行監(jiān)測的效果會產(chǎn)生較大的影響,進而影響工作效率,且人工識別結(jié)果有一定的主觀性,不能夠及時了解設(shè)備實際運行情況。在深度學(xué)習(xí)基礎(chǔ)上,在高低層信號間搭建映射關(guān)系,然后借助人眼視覺效果,進行圖像識別,精準提取數(shù)據(jù)流間的有效特征。在電力設(shè)備圖像識別中,深度學(xué)習(xí)的應(yīng)用具有較大的挖掘空間,并且可以有效解決電網(wǎng)非結(jié)構(gòu)化數(shù)據(jù)依賴人工、利用率不高等問題,也能夠為以后電力設(shè)備狀態(tài)監(jiān)測等提供充足理論基礎(chǔ)。
深度學(xué)習(xí)是一種人工智能的分支,其主要任務(wù)是讓計算機能夠像人類一樣進行智能決策。深度學(xué)習(xí)的核心是多層神經(jīng)網(wǎng)絡(luò),它模擬了人類大腦的神經(jīng)元之間的連接。神經(jīng)網(wǎng)絡(luò)的每層都包含若干個神經(jīng)元,每個神經(jīng)元都有自己的權(quán)重和偏置,它們通過輸入和輸出之間的連接進行信息傳遞。神經(jīng)網(wǎng)絡(luò)可以通過不斷的訓(xùn)練來優(yōu)化權(quán)重和偏置,從而提高分類、識別等任務(wù)的準確率。深度學(xué)習(xí)在多個領(lǐng)域得到了廣泛的應(yīng)用,例如,圖像識別、語音識別、自然語言處理等。在圖像識別領(lǐng)域,深度學(xué)習(xí)可以幫助計算機識別出圖片中的物體、文字等。深度學(xué)習(xí)的優(yōu)勢在于它可以自動學(xué)習(xí)特征,不需要手動設(shè)計特征。這意味著深度學(xué)習(xí)可以在大規(guī)模數(shù)據(jù)上進行訓(xùn)練,并從中自動學(xué)習(xí)特征。此外,深度學(xué)習(xí)還可以處理非線性問題,甚至可以處理高維數(shù)據(jù)。這些優(yōu)勢使得深度學(xué)習(xí)在許多領(lǐng)域中都能夠取得優(yōu)異的表現(xiàn)。
電力設(shè)備圖像處理的重要前提就是保證圖像質(zhì)量合格,如果圖像質(zhì)量不佳,則不利于之后目標的提出。成像設(shè)備不同,對于圖像所產(chǎn)生的影響也存在一定的差異。所以,對于電力設(shè)備特征的提取,需要對已經(jīng)獲取的圖像質(zhì)量進行增強、復(fù)原。
對于拍攝設(shè)備的角度,關(guān)鍵在于應(yīng)用條件。在使用飛行設(shè)備進行巡回時,若航線高低不一樣,那么,設(shè)備就會產(chǎn)生振動的現(xiàn)象,對所獲取的圖像質(zhì)量也會產(chǎn)生一定的影響,導(dǎo)致圖像出現(xiàn)震點,部分圖像會模糊,或者與背景融合的情況。在拍攝期間,若拍攝的光線比較暗,或者遇到惡劣天氣時,如霧霾,那么圖像的對比度、灰度就會變得比較低,陰影范圍較大,對于變壓器、絕緣子等一些高光設(shè)備,則不能有效定位,圖像識別的難度大大增加。在圖像特征提取時,可以將圖像設(shè)為作用域,過濾其線性濾波。對于圖像中的噪聲,在超高、超低頻次子塊中,通過對帶有噪聲的圖像進行小波轉(zhuǎn)換,便可以獲得迭代數(shù)據(jù),其高頻數(shù)據(jù)為零。對于超低頻次數(shù)據(jù),可以起到抑制作用,有效去噪。如果圖像中高光設(shè)備受到灰度影響,那么,就可以對小波頻次進行轉(zhuǎn)換,將其轉(zhuǎn)為均值濾波,在其中一個像素的周邊,通過設(shè)置多個像素灰值均數(shù),以此來替代之前的灰度值。對于單位距離至中心半徑距離,設(shè)定集臨近平滑,在噪聲灰度的轉(zhuǎn)移期間,臨近的4個區(qū)域,其灰度像素會進行轉(zhuǎn)換,即為八個區(qū)域,在這樣的情況下,即可提取電力設(shè)備特征。
電力系統(tǒng)設(shè)備類型具有多樣化特點,大多數(shù)設(shè)備的外觀比較相似,其顏色較為單一,再加上變電站環(huán)境具有一定的復(fù)雜性,最終獲取的圖像背景也會變得十分復(fù)雜。深度學(xué)習(xí)在圖像、語音等多個領(lǐng)域得到了較大突破,但其效果并不能將傳統(tǒng)學(xué)習(xí)理論否定。基于此,提出基于深度學(xué)習(xí)的隨機森林法,對于決策,以投票方式選擇,從而確定預(yù)測結(jié)果這一功能,不僅具有較高的預(yù)測精度,還具有較強的抗噪能力。通過采用隨機森林分類器,產(chǎn)生多個隨機選擇的樣本子集,以及特征子空間形成的決策樹,綜合形成“森林”,在分類環(huán)節(jié),以投票方式得到分類的結(jié)果。分類的方法可以分為兩部分,其一,為訓(xùn)練階段;其二,為測試階段。訓(xùn)練階段是先在圖像數(shù)據(jù)庫中選定圖像,并提取特征,然后對其進行分析,根據(jù)具體結(jié)果選擇特征。由于低層卷積層所提取的特征并未有十分豐富的語義信息,若運用這些特征,那么,就會增加圖像特征的表示維度。所以,僅選取并分析DCNN全連接層以及混合層的特征,以此對隨機森林訓(xùn)練。
在隨機森林(RF)訓(xùn)練中,應(yīng)從輸入空間根節(jié)點開始,在每一節(jié)點,對于每個分區(qū),應(yīng)確定分割的規(guī)則,以及預(yù)測的模型,以最大程度降低損失。由于DCNN提取圖像特征具有較高的維度,所以,選擇常數(shù)分割模型進行訓(xùn)練。
在隨機森林中,對于樹的每個節(jié)點應(yīng)該測試其深度特征,然后選出最佳特征。若圖像維度比較大,相應(yīng)的測試搜索空間也會比較大,其分割效果則不佳。為了以最少維度保證圖像特征,并增強其分辨能力,采取線性判別的方式,有效評估深度特征。線性判別的應(yīng)用主要是為了保證有效分離不同類型的特征,并且確保相同類型特征能夠緊湊分布。在特征選擇中,對于圖像表示維度,進行獨立處理。
由于電力設(shè)備受到多種因素的影響,在圖像處理中,不僅包括其原本應(yīng)有的特征,還出現(xiàn)了一些偽裝色彩因子,對于復(fù)雜程度較高的環(huán)境背景,很難高效獲取圖像的目標值。對于相對特征相似的圖像特征提取中,在臨近的圖像中,標出P個錨點,對于每組圖像的置信度,其區(qū)間為ω∈[0,1)。通過搭建邊框數(shù)值網(wǎng)絡(luò)層級,在每個描述點,計算出誤差、分類誤差,并有效控制所提取的圖像特征范圍,確保其處于特定閾值內(nèi)。在網(wǎng)絡(luò)模型中,依據(jù)深度選擇模塊,對于候選區(qū)域的電力設(shè)備,將其分為不同主干網(wǎng)絡(luò)層級,通常情況下,層級越多,那么,網(wǎng)絡(luò)結(jié)構(gòu)就會變得越復(fù)雜,相應(yīng)的目標區(qū)域也就會變得越多。所以,選取標準的兩個層級,以防擬合結(jié)果過多,在模型正負訓(xùn)練中,生成相應(yīng)的區(qū)域,以待識別,并獲取目標的候選圖像。
基于深度學(xué)習(xí)網(wǎng)絡(luò)模型,將需要識別的電力設(shè)備進行連接,然后借助紅外設(shè)備,按照特定順序掃描電力設(shè)備,并對圖像數(shù)據(jù)信息進行正負訓(xùn)練,經(jīng)過訓(xùn)練,標記相應(yīng)的目標區(qū)域。對電力設(shè)備的紅外圖像,將其導(dǎo)入模型中,然后經(jīng)過RN網(wǎng)絡(luò)層級錨框映射區(qū)間,最終獲得最為原始的圖像。對于樣本的目標框取值,如果設(shè)定超出0.1時,那么,其框架則被判斷為正樣本,如果設(shè)定不超過0.1時,就將其歸為負樣本區(qū)域。對于每組的圖像,合理把控其采集比例,最好控制在1:4以內(nèi)。在轉(zhuǎn)換期間,對其和真正的目標框區(qū)域交并比值進行測量,然后根據(jù)其實際大小,以此來判定正負訓(xùn)練的具體次數(shù)。同時,依據(jù)模型中的判別策略指標,在特定流程基礎(chǔ)上,合理設(shè)定每組圖像的訓(xùn)練判別。
對于需要識別的區(qū)域,在標記期間,應(yīng)先劃分出紅外設(shè)備掃描出的圖像,以此作為候選的區(qū)域。同時,依據(jù)錨框前景目標概率比值,合理排列RN網(wǎng)絡(luò)層級。對于錨框生成的回歸向量參數(shù),對其進行合理篩選,并改正初步的錨框位置。對于候選區(qū)域,在保留其最大極值外,將所剩下的抑制數(shù)據(jù)比值,全部再次放入候選區(qū)域。在不同候選集合內(nèi),多次進行采樣,然后根據(jù)候選區(qū)域當(dāng)中的圖像,有效判別真實的目標,在每組的樣本中,依據(jù)最大的目標值,合理排列目標框選值。如果所選的正負樣本集合在相同區(qū)域內(nèi),那么,標定的目標框,其所在范圍也就是目標識別的區(qū)域范圍,通過識別顯示,完成最終的圖像識別。
在深度學(xué)習(xí)基礎(chǔ)上,為了驗證其在電力設(shè)備圖像識別中的應(yīng)用效果,設(shè)計相應(yīng)的實驗進行驗證分析。
(1)數(shù)據(jù)收集。從現(xiàn)有的電力設(shè)備運行數(shù)據(jù)中收集大量的圖像數(shù)據(jù),這些圖像數(shù)據(jù)包括各種類型的電力設(shè)備,并且包含不同角度、不同光照條件下的圖像。同時,使用數(shù)據(jù)增強技術(shù)來擴充數(shù)據(jù)集,例如,旋轉(zhuǎn)、翻轉(zhuǎn)、縮放等。以電線塔桿、變壓器為例,借助紅外設(shè)備采集8000張圖像,各4000張,每種設(shè)備的正常、異常圖像各2000張,其中,正常圖像為設(shè)備工作狀態(tài)下的圖像,異常圖像為設(shè)備故障或損壞狀態(tài)下的圖像。
(2)模型選擇。使用基于CNN架構(gòu)的多分類模型,該模型包含三個卷積層和三個全連接層,最后通過Softmax函數(shù)對輸出進行分類。其中,卷積層用于提取圖像的特征,全連接層用于將卷積層提取的特征進行分類預(yù)測。
(3)模型訓(xùn)練。對于數(shù)據(jù)集,將其分為訓(xùn)練集、驗證集和測試集。在訓(xùn)練過程中,使用隨機梯度下降法(SGD)來優(yōu)化模型。為了防止過擬合,使用正則化技術(shù),包括L2正則化和Dropout,并使用學(xué)習(xí)率衰減技術(shù)來提高模型的性能。
(4)模型評估。對于模型性能的評估,使用準確率、精確率、召回率和F1分數(shù)等指標來評估,通過使用測試集來評估模型在新數(shù)據(jù)上的表現(xiàn)。
(5)實驗結(jié)果。經(jīng)過實驗,模型在測試集上的準確率達到了90%,精確率達到了92%,召回率達到了88%,F(xiàn)1分數(shù)達到了90%。這意味著模型可以準確地識別電力設(shè)備的類型,并能夠快速發(fā)現(xiàn)設(shè)備的異常狀況。同時,在該實驗中發(fā)現(xiàn)變壓器圖像特征的顯示比較明顯,而電線桿塔由于其自身地理位置的影響,受到樹木遮擋,其圖像特征比較模糊。在圖像特征提取中,因為單位神經(jīng)元的數(shù)量對其有較大的影響,所以,在采取本文方法的同時,還采用隨機森林、歸一處理這兩種方法提取設(shè)備的神經(jīng)元,并對比其神經(jīng)元個數(shù)選值。
如表1所示,為不同方法下的圖像輸出神經(jīng)元選值。通過分析,發(fā)現(xiàn)在不同的特征值區(qū)域內(nèi),基于深度學(xué)習(xí)的電力設(shè)備識別方法獲得的神經(jīng)元單元個數(shù)整體變化不大。而其他兩個方法的特征值在大于2.0時,其神經(jīng)元選值呈現(xiàn)出下降的趨勢。由此可見,本文采取的方法在圖像全局特征提取中具有較好的效果,并且適用于復(fù)雜環(huán)境的識別。
表1 采集圖像輸出神經(jīng)元選值
電力設(shè)備的安全運行對于整個電力系統(tǒng)的穩(wěn)定運行至關(guān)重要,然而,由于電力設(shè)備通常需要長時間運行,其磨損和老化等問題也隨之而來。因此,及時發(fā)現(xiàn)和處理這些問題非常必要。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的電力設(shè)備圖像識別得到了廣泛應(yīng)用。本文研究基于深度學(xué)習(xí)的電力設(shè)備圖像識別方法,通過搭建模型,對電力設(shè)備的圖像進行分類識別,并對不同特征值區(qū)域內(nèi)多個方法的神經(jīng)元單元個數(shù)進行對比分析,實驗結(jié)果表明,該方法具有較高的準確率和魯棒性,可以在復(fù)雜環(huán)境內(nèi)高效識別電力設(shè)備,在電力設(shè)備管理與維護領(lǐng)域具有廣闊的應(yīng)用前景。未來可以進一步探索該方法在更多電力設(shè)備領(lǐng)域的應(yīng)用,并提高模型的實時性和穩(wěn)定性,提升電力設(shè)備的識別效果,推動電力企業(yè)的安全穩(wěn)定運行。