郝建華
(山西汾西礦業(yè)(集團(tuán))有限責(zé)任公司 供用電分公司, 山西 介休 032000)
?
煤礦變電所數(shù)顯儀表字符識別研究
郝建華
(山西汾西礦業(yè)(集團(tuán))有限責(zé)任公司 供用電分公司, 山西 介休032000)
針對煤礦變電所數(shù)顯式儀表存在巡檢自動化程度低和識別可靠性差等問題,提出了一種基于改進(jìn)遺傳算法和支持向量機算法的字符識別算法。該算法采用Harr-Like特征作為字符識別特征,通過改進(jìn)的遺傳算法對分類器支持向量機的參數(shù)進(jìn)行尋優(yōu),利用主元分析法進(jìn)行降維處理,并使用支持向量機識別數(shù)顯式儀表字符。實驗驗證了該算法的有效性和可行性。
煤礦變電所; 數(shù)顯式儀表; 字符識別;Harr-Like特征; 改進(jìn)遺傳算法
網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/32.1627.TP.20160902.1018.015.html
煤礦變電所中大量使用數(shù)顯式儀表用于顯示電力系統(tǒng)的電壓、電流、功率等參數(shù),其優(yōu)點是讀數(shù)簡單且不需要估計。但在一般情況下,數(shù)顯式儀表并不和測量系統(tǒng)進(jìn)行數(shù)據(jù)傳輸,僅僅顯示當(dāng)前的測量結(jié)果,而測量結(jié)果需要通過人工抄寫記錄,并將其錄入計算機內(nèi),以對這些數(shù)據(jù)作進(jìn)一步處理。這種檢測方式不僅費時費力,而且可靠性易受檢測員的影響變得不穩(wěn)定。本文將機器視覺技術(shù)引入煤礦變電所,用于采集數(shù)顯式儀表的圖像,并進(jìn)行處理和識別。常用的字符識別法有穿線識別法、模板匹配法、支持向量機法等。穿線識別法易于實現(xiàn),但對定位區(qū)域要求較高。模板匹配法簡單,但運算量較大。另外,上述2種方法對字符扭曲、變形抵抗能力不強。故本文提出一種基于Harr-Like特征及改進(jìn)遺傳算法支持向量機的字符識別算法,并進(jìn)行了實驗研究。
1.1Harr-Like特征
Harr-Like特征庫有3種類型、4種形式。利用這些特征可以從字符中提取斜向邊緣特征、斜向灰度特征等有用信息[1-2]。
假設(shè)圖像高為H,寬為W,如果特征量滿足式(1),則五元組(x,y,p,h,θ)能夠表示擴(kuò)展Harr-Like特征中的旋轉(zhuǎn)矩陣特征及豎直矩陣特征。
(1)
式中:x,y表示矩形的位置;p,h分別為矩形的寬和高;θ為矩形的傾斜角度。
每個特征在實際訓(xùn)練中的個數(shù)是不相同的,一個大小為p×h的正面特征,在一幅大小為W×H的圖像中的個數(shù)為
(2)
式中:N為θ=0°對應(yīng)的特征數(shù);X=W/h;Y=H/h。
對于θ=45°的特征量,在W×H的圖像中個數(shù)為
(3)
式中z=p+h。
1.2支持向量機
尋求支持向量機最優(yōu)分類超平面可轉(zhuǎn)化為求解如下的約束優(yōu)化問題:
(4)
式中:(xi,yi)代表第i個樣本;w,b分別為超平面的法向量和截距;l為樣本個數(shù)。
這是一個凸二次規(guī)劃問題,原約束優(yōu)化問題可以轉(zhuǎn)化為對偶問題:
(5)
式中αi為拉格朗日乘子。
在線性分類問題中,有時可能會出現(xiàn)一些噪聲樣本點,導(dǎo)致原線性可分的樣本數(shù)據(jù)變得線性不可分,此時需使其能夠忽略一定的誤差,引入一個評估誤差損失的懲罰權(quán)重對訓(xùn)練誤差進(jìn)行考量,從而使分類器的分類效果更好,具體目標(biāo)函數(shù)可以定義為
(6)
式中:C為懲罰因子,表示對訓(xùn)練誤差的重視程度;ξi為松弛因子。
對于某空間中線性不可分的數(shù)據(jù),往往可先使用映射函數(shù)Φ(x)將訓(xùn)練樣本從低維空間轉(zhuǎn)換到高維空間,這個函數(shù)被稱為核函數(shù)。使用核函數(shù)后,原優(yōu)化問題可寫為
(7)
決策函數(shù)可以寫為
(8)
式中β*為分類閾值。
常用的核函數(shù)包括多項式核函數(shù)、高斯徑向基核函數(shù)及Sigmoid核函數(shù)[3]。本文采用高斯基核函數(shù)。
(9)
式中γ為高斯徑向基核函數(shù)的半徑。
使用遺傳算法對支持向量機進(jìn)行參數(shù)尋優(yōu)時,先在設(shè)定區(qū)間內(nèi)隨機選點進(jìn)行搜索,其方向由適應(yīng)度函數(shù)決定,流程如圖1所示。
圖1 基于遺傳算法參數(shù)尋優(yōu)流程
使用二進(jìn)制符號串d1,d2,…,da,da+1,…,dg對支持向量機中的C和γ編碼,其中,C對應(yīng)d1,d2,…,da,γ對應(yīng)da+1,da+2,…,dg;a為C的編碼長度(位數(shù)),g為γ的編碼長度(位數(shù))。自變量編碼與支持向量機參數(shù)相互對應(yīng)。
支持向量機參數(shù)尋優(yōu)過程中的適應(yīng)度函數(shù)一般為交叉驗證函數(shù),但在遺傳算法中很難保證種群多樣性,容易導(dǎo)致局部最優(yōu)現(xiàn)象,因此,需要對適應(yīng)度函數(shù)進(jìn)行調(diào)整。適應(yīng)度函數(shù)為
(10)
式中:F*(x)為調(diào)整后的適應(yīng)度函數(shù);F(x)為原適應(yīng)度函數(shù),即交叉驗證函數(shù);B為最佳適應(yīng)度;A為平均適應(yīng)度[4];s≥1且為整數(shù),一般為2;k由交叉驗證函數(shù)確定,若F(x)≥1,則k>1且為整數(shù),若F(x)<1,則k∈(0,1);n為現(xiàn)遺傳代數(shù);M為最大遺傳代數(shù)[5]。
通常遺傳算法的交叉概率Pc=0.6~1,變異概率Pm=0.001~0.1。在初期階段個體適應(yīng)度差異較大,較大的交叉概率及較小的變異概率可以更好地保存有用遺傳信息;而在后期,個體適應(yīng)度差異較小,相反的交叉概率和變異概率能夠增加種群多樣性。查閱相關(guān)資料后,本文使用的交叉概率和變異概率如下:
(11)
(12)
式中n1為第一代遺傳代數(shù)。
支持向量機中核函數(shù)選用高斯徑向基函數(shù),其中參數(shù)分別使用經(jīng)驗法、遺傳算法和改進(jìn)遺傳算法獲得。在經(jīng)驗法中,C=1 000,γ=0.01,遺傳算法和改進(jìn)遺傳算法中核函數(shù)C的搜索范圍設(shè)為[2-2,24],γ的搜索范圍設(shè)為[2-4,24],種群數(shù)量設(shè)置為20,最大遺傳進(jìn)化數(shù)為100次。
實驗采用自建字符圖像庫進(jìn)行測試,字符庫包含10種字符,每種字符選取110張圖像,其中有些字符表面受到光照、薄膜影響。部分字符圖像如圖2所示,每種字符選取35幅圖像用作測試,剩余圖像作為訓(xùn)練圖像。
圖2 部分字符圖像
對字符圖像進(jìn)行二值化處理后,部分字符受噪聲干擾明顯,如圖3所示。
分別檢驗采用穿線法、模板匹配法和不同參數(shù)支持向量機方法的識別結(jié)果。使用支持向量機識別字符時提取特征并使用主元分析法進(jìn)行數(shù)據(jù)降維,選取主成分貢獻(xiàn)率大于90%。對其中一幅字符圖像使用遺傳算法優(yōu)化參數(shù),得到的適應(yīng)度曲線如圖4所示。得到的支持向量機最優(yōu)參數(shù)為C=13.792 6,γ=0.007 9。
圖3 部分受噪聲干擾的字符二值化圖像
圖4 遺傳算法適應(yīng)度曲線
采用改進(jìn)遺傳算法優(yōu)化參數(shù)得到的適應(yīng)度曲線如圖5所示。得到的支持向量機最優(yōu)參數(shù)為C=39.960 3,γ=0.007 5。
圖5 改進(jìn)遺傳算法適應(yīng)度曲線
使用遺傳算法進(jìn)行參數(shù)尋優(yōu)在開始階段選擇的種群具有隨機性,因此,對于相同訓(xùn)練數(shù)據(jù),每次參數(shù)尋優(yōu)的結(jié)果并不一致,對數(shù)據(jù)進(jìn)行5組實驗,遺傳算法參數(shù)尋優(yōu)結(jié)果見表1。改進(jìn)遺傳算法參數(shù)尋優(yōu)結(jié)果見表2。
表1 遺傳算法參數(shù)尋優(yōu)結(jié)果
表2 改進(jìn)遺傳算法參數(shù)尋優(yōu)結(jié)果
對每個字符分別進(jìn)行8組實驗,對結(jié)果求平均值,得到不同方法的識別率見表3。
表3 不同方法的識別率 %
通過實驗結(jié)果可以看出,采用Harr-Like提取字符特征,然后基于改進(jìn)遺傳算法支持向量機分類,對字符圖像有較好的識別率,在樣本不是很大的情況下,分類速度較快,滿足時效性要求。
介紹了基于改進(jìn)遺傳算法支持向量機的字符識別算法,并將其應(yīng)用于煤礦變電所數(shù)顯式儀表的圖像處理和識別。該算法采用Harr-Like特征作為字符識別特征,相比穿線法、模板匹配法、支持向量機法等傳統(tǒng)的字符識別算法,其參數(shù)優(yōu)化效率高、分類速度快、準(zhǔn)確率高,具有更好的識別效果。
[1]ZHANGC,LIUJ,LIANGC,etal.ImageclassificationusingHarr-liketransformationoflocalfeatureswithcodingresiduals[J].SignalProcessing, 2013,93(8):2111-2118.
[2]邵平,楊路明,曾耀榮.計算旋轉(zhuǎn)Harr型特征的積分圖像算法改進(jìn)[J].計算機技術(shù)與發(fā)展,2006(11):146-147.
[3]黃瓊英.支持向量機多類分類算法的研究及應(yīng)用[D].天津:河北工業(yè)大學(xué),2005.
[4]劉虎,羅斌,吳晟,等.改進(jìn)的遺傳算法在SVM參數(shù)優(yōu)化中的應(yīng)用[J].云南師范大學(xué)學(xué)報(自然科學(xué)版),2012(4):47-51.
[5]楊旭,紀(jì)玉波,田雪.基于遺傳算法的SVM參數(shù)選取[J].遼寧石油化工大學(xué)學(xué)報,2004(1):54-58.
Study of character recognition of digital display instrument in coal mine substation
HAO Jianhua
(BranchofPowerSupplyandConsuption,ShanxiFenxiMining(Group)Co.,Ltd.,Jiexiu032000,China)
Inviewofproblemsoflowautomationdegreeandrecognitionreliabilityofdigitaldisplayinstrumentincoalminesubstation,akindofcharacterrecognitionalgorithmbasedonimprovedgeneticalgorithmandsupportvectormachinealgorithmwasproposed.ThealgorithmadoptsHarr-Likefeaturesascharacterrecognitionfeatures,improvedgeneticalgorithmwaschosentosearchtheoptimalparametersofthesupportvectormachineclassifier,andusesprincipalcomponentanalysismethodtoconductthedimensionreducingprocess,thenappliessupportvectormachinetoidentifycharacterofthedigitaldisplayinstrument.Theeffectivenessandfeasibilityofthealgorithmwasvalidatedbyexperiments.
coalminesubstation;digitaldisplayinstrument;characterrecognition;Harr-Likefeatures;improvedgeneticalgorithm
1671-251X(2016)09-0064-04DOI:10.13272/j.issn.1671-251x.2016.09.015
2016-06-29;
2016-07-28;責(zé)任編輯:張強。
江蘇省自然科學(xué)基金項目(BK20130207)。
郝建華(1963-),男,山西太古人,工程師,現(xiàn)主要從事煤礦供電安全研究及管理等工作,E-mail:200510322@163.com。
TD611
A網(wǎng)絡(luò)出版時間:2016-09-02 10:18
郝建華.煤礦變電所數(shù)顯儀表字符識別研究[J].工礦自動化,2016,42(9):64-67.