李漢漢
(廣東青創(chuàng)環(huán)境檢測有限公司,廣東 江門 529000)
水質(zhì)自動(dòng)監(jiān)測儀可以實(shí)現(xiàn)水質(zhì)的自動(dòng)實(shí)時(shí)監(jiān)測,檢測基本水質(zhì)參數(shù)和各種重金屬的濃度,將連續(xù)的自動(dòng)采樣技術(shù)與云技術(shù)相結(jié)合,將監(jiān)測的水質(zhì)結(jié)果自動(dòng)回傳到云服務(wù)器,解決了人工采樣在采樣頻率和采樣強(qiáng)度方面進(jìn)行實(shí)時(shí)監(jiān)測的困難。但是水質(zhì)自動(dòng)檢測儀設(shè)備需要進(jìn)行定期的故障檢測,以便維護(hù)設(shè)備的正常工作。
在設(shè)備的故障檢測研究過程中,有以傅里葉變換為代表的信號(hào)處理方式,通過提取時(shí)域特征來檢測設(shè)備出現(xiàn)故障的部件[1],但是只使用傅里葉變換的信號(hào)處理方式會(huì)出現(xiàn)信號(hào)損失等問題,進(jìn)一步影響檢測的精度。韓金鵬[2]采用粒子群算法優(yōu)化隨機(jī)森林,結(jié)合LightGBM(Light Gradient Boosting Machine)設(shè)計(jì)了一種故障檢測方法,主要運(yùn)用了隨機(jī)森林用于特征選擇的思想。張建永[3]在物聯(lián)網(wǎng)環(huán)境系統(tǒng)中采用BP神經(jīng)網(wǎng)絡(luò),提出了一種物聯(lián)網(wǎng)系統(tǒng)故障診斷方案[4]。由以上的研究方法中可以得知,數(shù)據(jù)挖掘方式的故障檢測方案可以提高預(yù)測分類和故障分類的準(zhǔn)確率,基于數(shù)據(jù)挖掘的故障監(jiān)測方案逐漸成為研究的主流方向。
本方案將對(duì)振動(dòng)數(shù)據(jù)進(jìn)行分析,以識(shí)別故障部件。水質(zhì)自動(dòng)檢測儀的常見故障主要有:蠕動(dòng)泵損壞、多通道閥漏液、光電計(jì)量器損壞、外接泵堵塞、高壓閥漏氣和測量室損壞。
在實(shí)際環(huán)境中,水質(zhì)自動(dòng)監(jiān)測儀的數(shù)據(jù)可能會(huì)有一些雜亂的無效數(shù)據(jù),或者有些數(shù)據(jù)丟失,這都會(huì)對(duì)診斷和預(yù)測模型的建立產(chǎn)生影響[5],因此收集到監(jiān)測數(shù)據(jù),需要進(jìn)行預(yù)處理。本研究中使用的數(shù)據(jù)是由NREL提供的,共同目標(biāo)是提高監(jiān)測儀的總體可靠性。本研究中使用的監(jiān)測儀額定功率為750 kW,數(shù)據(jù)在高頻(即40 kHz)下采樣,并在受控測試條件下記錄10 min。
首先,通過計(jì)算Jerk來確定振動(dòng)對(duì)不同傳感器位置的影響?!癑erk”被定義為加速度的變化速率。數(shù)學(xué)上,Jerk近似表示如式(1)所示:
(1)
使用10 min過程中12 個(gè)振動(dòng)傳感器數(shù)據(jù)的平均Jerk值,初始40 kHz數(shù)據(jù)的平均間隔超過15 s。對(duì)振動(dòng)波形進(jìn)行統(tǒng)計(jì)分析,計(jì)算了如RMS、CF和峰度(Ku)等指標(biāo)。
從傳感器AN4獲得的數(shù)據(jù)在頻域內(nèi)進(jìn)行了分析,快速傅里葉變換(FFT)已被用來產(chǎn)生振動(dòng)的頻譜。頻譜顯示位于給定頻率的振幅部分(以g表示),在高速軸上測量的基線光譜如圖1所示。
圖1展示了在36.45 Hz下的低能量(<0.035 g)成分,由于HSS包含高達(dá)20 kHz的光譜,因此只顯示低頻分量(即0~100 Hz),以更好地說明信號(hào)功率。
圖1 正常狀態(tài)的基線頻譜
圖2顯示了整個(gè)測試運(yùn)行(第1~10 min)的功率譜趨勢,該功率譜在不斷增加,表明了故障的進(jìn)展情況。
圖2 振幅的趨勢
基于可用的數(shù)據(jù),開發(fā)了4 種場景。方案1稱為單參數(shù)預(yù)測模型,其中加速度值是目標(biāo)輸出,而輸入?yún)?shù)包括歷史加速度值。在場景2 中,來自AN4 以外的傳感器的數(shù)據(jù)被用作輸入來預(yù)測AN4的加速度。場景3 和場景4 與場景1 和場景2 相同,除了Jerk是目標(biāo)輸出。統(tǒng)計(jì)指標(biāo)(即平均值、最大值、標(biāo)準(zhǔn)差、波峰因子、峰度、RMS、間隙因子)也被包含在輸入?yún)?shù)中,以預(yù)測目標(biāo)輸出。為了降低數(shù)據(jù)集的維數(shù),將初始高頻數(shù)據(jù)(即40 kHz)轉(zhuǎn)換為10 Hz的數(shù)據(jù)。對(duì)于每個(gè)模型,80%的數(shù)據(jù)點(diǎn)用于構(gòu)建模型,然后在接下來的10%上進(jìn)行測試,利用在測試數(shù)據(jù)集上證明最佳結(jié)果的算法對(duì)最后10%的數(shù)據(jù)進(jìn)行預(yù)測。
采用不同的參數(shù)選擇算法來識(shí)別預(yù)測水質(zhì)監(jiān)測儀振動(dòng)的相關(guān)參數(shù),本方案選擇提升樹(Boosting Tree)、Relief Attribute(k=10)和子集評(píng)估器3種算法進(jìn)行分析[6~8]。增強(qiáng)樹算法根據(jù)誤差的平方和生成參數(shù)排序,并在輸入?yún)?shù)的每次分割處計(jì)算,計(jì)算所有分割的誤差的平均平方和,具有最佳分割的參數(shù)值為1,以此類推。在提升樹算法中,參數(shù)的相對(duì)影響采用公式(2)進(jìn)行計(jì)算:
(2)
符號(hào)AANi表示神經(jīng)網(wǎng)絡(luò)預(yù)測加速度,而JANi表示神經(jīng)網(wǎng)路預(yù)測Jerk,i是傳感器位置下標(biāo)。對(duì)于單參數(shù)模型(即場景1和場景3),(t-k)表示目標(biāo)輸出的歷史值,k表示時(shí)間指數(shù)。利用參數(shù)選擇算法生成的參數(shù)集,輸入?yún)?shù)包括目標(biāo)輸出的存儲(chǔ)器參數(shù)和在AN4 以外的傳感器位置記錄的參數(shù)。針對(duì)場景1~4的數(shù)據(jù)的初始維度為60,使用參數(shù)選擇算法,將場景1、2、3和4的維數(shù)分別降至14、16、18和18。
由于各種傳感器之間的功能關(guān)系是未知的,因此對(duì)具有不同參數(shù)設(shè)置的多層感知器(MLP)進(jìn)行了優(yōu)化,以獲得4 種模型的最佳網(wǎng)絡(luò)。不同的神經(jīng)網(wǎng)絡(luò)被用于訓(xùn)練,而隱藏單元的數(shù)量在5~25 個(gè)之間變化。分析了隱藏節(jié)點(diǎn)和輸出節(jié)點(diǎn)的激活函數(shù),即Tanh、指數(shù)節(jié)點(diǎn)、恒等式和邏輯節(jié)點(diǎn)。在本研究中,用了絕對(duì)誤差(AE)、平均絕對(duì)誤差(MAE)、相對(duì)誤差(RE)和平均相對(duì)誤差(MRE)等指標(biāo)來選擇最佳的神經(jīng)網(wǎng)絡(luò),相關(guān)指標(biāo)計(jì)算公式如下。
(3)
(4)
(5)
(6)
分析了神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法,如梯度下降(GD)、共軛梯度(CG)和徑向基函數(shù)(RBF)。加速度數(shù)據(jù)(場景1)用于評(píng)估這些神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法的性能。測試表明,相比于其他神經(jīng)網(wǎng)絡(luò)算法,BFGS-NN(Broyden-Fletcher-Goldfarb-Shanno)算法與實(shí)際輸出具有更高的相關(guān)性[9~11]。
與GD、CG和RBF神經(jīng)網(wǎng)絡(luò)等算法相比,BFGS神經(jīng)網(wǎng)絡(luò)在MAE方面分別提高了17.39%、12.63%和17.7%。而在MRE方面,分別提高了16.6%、12.22%和17.00%。這就證明了使用BFGS作為神經(jīng)網(wǎng)絡(luò)算法來構(gòu)建模型的合理性[12]。
BFGS使用一種近似搜索方案來提高計(jì)算速度并實(shí)現(xiàn)全局收斂,它包括以下四個(gè)基本步驟:①設(shè)置搜索方向;②沿著搜索方向確定步長;③更新Hessian矩陣;④使用指定的標(biāo)準(zhǔn)檢查收斂速度。
通過改變神經(jīng)元數(shù)量、隱藏激活函數(shù)和輸出激活函數(shù),隨機(jī)選擇100 個(gè)神經(jīng)網(wǎng)絡(luò)。所有100 個(gè)NNs都采用BFGS算法進(jìn)行訓(xùn)練、。該過程重復(fù)5 次,每次迭代時(shí)選擇最佳的NN,使用測試數(shù)據(jù)進(jìn)行性能比較。在隱藏層和輸出層中具有Tanh函數(shù)的MLP14-5-1 最適合場景1。以Tanh為例的MLP16-18-1,Tanh作為隱藏激活函數(shù),邏輯函數(shù)作為輸出激活,最適合場景2。對(duì)于基于Jerk數(shù)據(jù)的模型,以Tanh和指數(shù)函數(shù)分別為隱藏函數(shù)的MLP18-22-1 最適合場景3;而以指數(shù)和身份函數(shù)為隱藏和輸出激活的MLP18-22-1適用于場景4。
Jerk模型中的神經(jīng)網(wǎng)絡(luò)比基于加速數(shù)據(jù)的模型產(chǎn)生更好的結(jié)果。這說明Jerk更適合于構(gòu)建不同時(shí)間戳下的預(yù)測模型。在Jerk模型中,模型4的結(jié)果優(yōu)于模型3,說明了其他傳感器在預(yù)測振動(dòng)中的重要性[13]。
使用性能最好的神經(jīng)網(wǎng)絡(luò)模型(MLP-18-22-1)進(jìn)行預(yù)測,該模型使用來自傳感器位置AN1-AN3和AN5-AN12的數(shù)據(jù)來預(yù)測Jerk(由傳感器AN4測量)[14]。因?yàn)楸狙芯恐惺褂玫臄?shù)據(jù)記錄時(shí)間很短(例如,10 min),Jerk預(yù)測15 個(gè)時(shí)間戳,數(shù)據(jù)間隔為0.1 s采樣。MAE的范圍在0.021~0.345 之間,而MRE的范圍為5.21%~8.32%(圖3)。
圖3 不同時(shí)間戳的MAE值和MRE值
圖3顯示了15個(gè)時(shí)間戳的MAE和MRE值,MAE和MRE的值隨著時(shí)間的推移而增加。前期預(yù)測的結(jié)果離散度較小,而在后期的時(shí)間戳預(yù)測中,結(jié)果離散度較大[15]。圖3所示的結(jié)果表明,所提出的方法能夠準(zhǔn)確預(yù)測對(duì)部件故障影響最大的Jerk值。
本文提出了一種識(shí)別和預(yù)測水質(zhì)監(jiān)測儀故障的方法。利用Jerk和加速數(shù)據(jù),用數(shù)據(jù)挖掘算法生成模型?;趩蝹€(gè)傳感器(AN4)和多個(gè)傳感器(AN1-AN3和AN5-AN12)的數(shù)據(jù),分析了4 種不同的模型,單個(gè)傳感器模型假設(shè)只安裝了一個(gè)傳感器,而多個(gè)傳感器模型預(yù)測了選定的傳動(dòng)系位置的振動(dòng)。使用Jerk數(shù)據(jù)開發(fā)的數(shù)據(jù)挖掘模型(場景3和4)比基于加速數(shù)據(jù)(場景1和2)生成的模型具有更好的精度,利用基于多個(gè)傳感器數(shù)據(jù)開發(fā)的模型(方案4)進(jìn)行Jerk預(yù)測,使用BFGS學(xué)習(xí)方法的神經(jīng)網(wǎng)絡(luò)的性能優(yōu)于CG、GD和RBF等算法。BFGS神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確預(yù)測了不同時(shí)間間隔的Jerk,MAE在0.021~0.345范圍內(nèi),MRE在5.21%~8.32%范圍內(nèi)。