孫兆光
(莒縣青峰嶺水庫管理服務(wù)中心,山東 莒縣 276500)
農(nóng)田水利灌溉分流機械是提升農(nóng)田灌溉的關(guān)鍵設(shè)備。該設(shè)備可提高灌區(qū)排灌的整體水平,以滿足農(nóng)業(yè)的發(fā)展需求,通過合理布置和調(diào)整灌溉系統(tǒng)可以提高節(jié)水率[1]??紤]到灌區(qū)的灌排需求和飲水需求,優(yōu)化灌溉設(shè)施能夠降低設(shè)施養(yǎng)護費用、縮短灌溉周期,提高灌溉效率[2]。在上述方式中,需要借助灌溉分流機械完成。當(dāng)灌溉分流機械出現(xiàn)異常時,將影響整個灌區(qū)的灌溉效果,因此,研究農(nóng)田水利灌溉分流機械運行異常檢測方法具有重要意義。
張聰?shù)萚3]針對機械變量之間存在的耦合關(guān)系,通過趨勢互相關(guān)分析方法,構(gòu)建變量耦合關(guān)系網(wǎng)絡(luò)。采用無監(jiān)督學(xué)習(xí)方法,根據(jù)變量耦合關(guān)系網(wǎng)絡(luò)構(gòu)建變分圖自編碼模型,獲取機械運行特征,將提取的特征輸入圖卷積網(wǎng)絡(luò)中,完成機械運行異常檢測,該方法ROC曲線檢測結(jié)果不理想,存在檢測性能差的問題。王昱棟等[4]通過感知哈希算法獲取機械圖像,利用直方圖均衡化方法增強機械圖像,結(jié)合Canny邊緣檢測算法和雙邊濾波算法獲取機械運行特征,實現(xiàn)異常檢測。該方法在異常檢測過程中容易出現(xiàn)漏檢現(xiàn)象,存在檢測率低問題。張西寧等[5]將邊界軟化率引入格雷厄姆掃描法中,通過射線法構(gòu)成數(shù)據(jù)集,將其輸入隨機森林模型中,完成異常檢測,該方法檢測異常所用的時間較長,存在檢測效率低的問題。
為了解決上述方法中存在的問題,提出基于支持向量機的農(nóng)田水利灌溉分流機械運行異常檢測方法。
為實現(xiàn)農(nóng)田水利灌溉分流機械運行異常檢測,采用自組織映射算法聚類灌溉分流機械運行數(shù)據(jù),作為研究的基礎(chǔ)數(shù)據(jù),為后續(xù)的檢測實現(xiàn)奠定基礎(chǔ)。
自組織映射算法由輸入層和競爭層構(gòu)成,屬于層次性神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[6-7]。其中,輸入層主要作用是將接收的輸入信息傳遞到下一層中,競爭層主要目的是比較神經(jīng)網(wǎng)絡(luò)細胞元和輸入信息,根據(jù)比較結(jié)果分類信息。采用自組織映射算法處理水利灌溉分流機械運行數(shù)據(jù)的具體過程如下所述。
a.用C表示灌溉分流機械運行數(shù)據(jù),用ξj表示神經(jīng)元在自組織映射網(wǎng)絡(luò)競爭層中的加權(quán)向量,歸一化處理C、ξj的表達式為
(1)
(2)
c.根據(jù)競爭學(xué)習(xí)法可知,在自組織映射網(wǎng)絡(luò)中獲勝神經(jīng)元的輸出為
(3)
ui為輸出的神經(jīng)元結(jié)果;t為輸出的當(dāng)前時刻;j為神經(jīng)元的加權(quán)向量;j*為神經(jīng)元的一般向量。
獲勝的神經(jīng)元在自組織映射網(wǎng)絡(luò)中可以根據(jù)下述規(guī)則對加權(quán)向量ξj調(diào)整:
(4)
β為在區(qū)間[0,1]內(nèi)取值的學(xué)習(xí)效率,在不斷的迭代過程中學(xué)習(xí)效率不斷減小。
采用自組織映射算法聚類處理水利灌溉分流機械運行數(shù)據(jù)的具體流程如圖1所示。
圖1 農(nóng)田水利灌溉分流機械數(shù)據(jù)聚類流程
在上述灌溉分流機械運行數(shù)據(jù)聚類基礎(chǔ)上,采用尺度不變特征變換SIFT方法[8-9]提取水利灌溉分流機械數(shù)據(jù)的運行特征。該方法可獲取水利灌溉分流機械的局部信息,提取的運行特征點可反映農(nóng)田水利灌溉分流機械的運行狀態(tài)。
在固定尺寸中水利灌溉分流機械運行的局部特征信息具有不變特點,用Q(x,y,ζ)表示分流機械運行圖像O(x,y)中存在的空間信息,其計算式為
Q(x,y,ζ)=O(x,y)*H(x,y,ζ)
(5)
ζ為幅度可變因子;*為卷積;(x,y)為特征點位置;H(x,y,ζ)為高斯函數(shù),其表達式為
(6)
構(gòu)建高斯平方差函數(shù)F(x,y,ζ),在不同幅度狀態(tài)下提取農(nóng)田水利灌溉分流機械運行的特征點,即
F(x,y,ζ)=[G(x,y,μζ)2-G(x,y,ζ)2]*g(x,y)
(7)
μ為檢測閾值參數(shù)。
在提取灌溉分流機械運行特征的基礎(chǔ)上,本文借助支持向量機完成農(nóng)田水利灌溉分流機械運行異常檢測。在支持向量機中引入免疫算法[10-11]實現(xiàn)農(nóng)田水利灌溉分流機械運行的異常檢測。
設(shè)g(u)為支持向量機的誤差上限值,通過免疫算法優(yōu)化g(u),使其最小,具體步驟如下所述。
a.抗體二進制編碼通常情況下由3個部分構(gòu)成,分別為支持向量機的樣本特征、誤差懲罰因子V和核函數(shù)參數(shù)η[12-13]。A=[a1,a2,…,al],A為參數(shù)集合,其中,l為參數(shù)編碼對應(yīng)長度,編碼通常情況下由0或1構(gòu)成。
農(nóng)田水利灌溉分流機械運行異常檢測方法將核函數(shù)參數(shù)η設(shè)定在[0.000 1,20 000]內(nèi),將誤差懲罰因子V設(shè)定在[1,200]內(nèi)。用G=[g1,g2,…,gd]表示水利灌溉分流機械運行數(shù)據(jù)的特征集,d表示該集合的大小,通過二進制編碼表示機械運行數(shù)據(jù)的特征選擇,D=[d1,d2,…,dd],D為機械運行數(shù)據(jù)特征選擇的總集合。通過上述分析可知,可通過參數(shù)和特征的組合表示抗體的二進制編碼S=[A,D]。
b.通過匹配灌溉分流機械運行異常檢測問題的特征和記憶細胞庫中存在的結(jié)構(gòu)信息構(gòu)成初始抗體群。
c.將支持向量機的誤差上限值g(u)作為標(biāo)準(zhǔn),獲得抗體與抗原之間的親和力Sv,即
(8)
k為抗體v選擇的特征總數(shù);f為特征數(shù)量。
d.更新群體后,在抗體記憶細胞庫中引入與抗原存在最大親和力的抗體,下次在遇到相同問題時,直接在記憶細胞庫中獲得答案,縮短尋找答案所用的時間。
e.抗體之間的相似度可通過抗體濃度描述,抗體產(chǎn)生的抑制與刺激可通過相似度度量得以控制,進而實現(xiàn)抗體多樣性的控制,設(shè)Nvw為抗體之間存在的相似度,其計算式為
(9)
R(2)為抗體v、w之間存在的平均信息熵。
根據(jù)相似度計算結(jié)果獲得抗體v的濃度cv,其表達式為
(10)
f.抗體進入下一代的過程具有隨機性,親和力會影響克隆的概率,即當(dāng)抗體與其他抗體親和力低、與抗原親和力高時,克隆的幾率較大。用av表示抗體選擇的概率,即
(11)
β、χ均為加權(quán)系數(shù);M為抗原數(shù)量;vv為濃度抑制概率。
g.新抗體是原始抗體做變異和交叉操作生成,抗體交換信息可描述新抗體生成過程。農(nóng)田水利灌溉分流機械運行異常檢測方法通過高斯變異[14-15]和單點交叉生成新個體。
h.為避免算法出現(xiàn)局部最優(yōu)解問題,需要對抗體集合做更新處理,記憶細胞集中存在的記憶細胞通過不斷迭代構(gòu)成抗體群。
i.將提取的特征輸入支持向量機中,設(shè)置終止條件,滿足條件的個體即為最佳個體,獲得農(nóng)田水利灌溉分流機械運行的異常檢測結(jié)果。
結(jié)合支持向量機和免疫算法實現(xiàn)農(nóng)田水利灌溉分流機械運行異常檢測的具體流程如圖2所示。
圖2 異常檢測流程
為驗證本文方法的整體有效性,將文獻[3]方法和文獻[4]方法作為對比方法,進行實驗測試。
在農(nóng)田水利灌溉分流機械運行異常檢測時,實驗中以某地大型農(nóng)田水利灌溉分流機械為研究對象進行實驗分析。本次實驗中評價指標(biāo)選取接收者操作特征曲線ROC下面積,即AUC概率,對本文方法、文獻[3]方法和文獻[4]方法的有效性進行檢測。真陽率和假陽率分別為ROC曲線的縱坐標(biāo)和橫坐標(biāo),真陽率越高、假陽率越低,曲線下面積越大,即方法的性能越好,設(shè)TP為真陽率,其計算式為
(12)
nT為判定正常狀態(tài)為正常狀態(tài)的次數(shù);nF為判定正常狀態(tài)為異常狀態(tài)的次數(shù)。
設(shè)FP為假陽率,其計算式為
(13)
nR為判定異常狀態(tài)為正常狀態(tài)的次數(shù);nN為判定異常狀態(tài)為異常狀態(tài)的次數(shù)。
本文方法、文獻[3]方法和文獻[4]方法的ROC曲線如圖3所示。
圖3 不同方法的ROC曲線
由圖3可知,與其他2種方法相比,本文方法構(gòu)成的ROC曲線面積較大,表明本文方法的真陽率高于假陽率,在農(nóng)田水利灌溉分流機械運行異常檢測過程中具有較好的性能。
在2種典型實驗環(huán)境下采用本文方法、文獻[3]方法和文獻[4]方法檢測農(nóng)田水利灌溉分流機械運行狀態(tài),對比不同方法的檢測率,測試結(jié)果如圖4所示。
由圖4可知,隨著時間和樣本數(shù)量的增加,本文方法、文獻[3]方法和文獻[4]方法的檢測率均有所下降, 表明樣本數(shù)量和機械運行時間會影響上述方法的檢測率。上述方法在實驗環(huán)境2中的檢測率明顯高于實驗環(huán)境1中的檢測率,對比測試結(jié)果發(fā)現(xiàn),在相同時間和相同樣本數(shù)量下,本文方法的檢測率在不同實驗環(huán)境中均高于文獻[3]方法和文獻[4]方法的檢測率,這是由于本文方法對機械運行狀態(tài)檢測之前通過自組織映射算法對機械的運行狀態(tài)數(shù)據(jù)進行聚類,提高了方法的檢測率。
圖4 不同方法的檢測率
將檢測時間作為指標(biāo),采用上述方法檢測農(nóng)田水利灌溉分流機械運行的狀態(tài),對比不同方法的檢測效率,結(jié)果如表1所示。
表1 不同方法的檢測效率
表1(續(xù))
由表1中的數(shù)據(jù)可知,在多次異常檢測測試中本文方法的檢測時間均控制在0.1 s左右,遠低于文獻[3]方法和文獻[4]方法的檢測時間,表明本文方法具有較高的檢測效率。
檢測農(nóng)田水利灌溉分流機械的運行狀態(tài),可以提高灌溉工程的用水效率、有利于管道的施工和管理。針對異常檢測方法存在檢測性能差、檢測率低和檢測效率低等問題,提出基于支持向量機的農(nóng)田水利灌溉分流機械運行異常檢測方法。該方法借助支持向量機完成農(nóng)田水利灌溉分流機械運行的異常檢測,提升了農(nóng)田水利灌溉分流機械的運行效率,具有一定可行性。