梁紹東,陳彰怡
(東蘭縣中等職業(yè)技術(shù)學(xué)校,廣西河池 547000)
機(jī)電設(shè)備運(yùn)行識(shí)別的精準(zhǔn)化,一直是機(jī)電設(shè)備需要考慮的主要因素之一。正常且高效的機(jī)電設(shè)備可以為優(yōu)化產(chǎn)品帶來(lái)更多的便利,機(jī)電設(shè)備運(yùn)行狀態(tài)的識(shí)別包括對(duì)有無(wú)故障以及故障類型等設(shè)備運(yùn)行狀態(tài)的識(shí)別。目前,識(shí)別的方式的主要流程是在前期通過(guò)信號(hào)采集得到機(jī)電設(shè)備的運(yùn)行狀態(tài)信息,對(duì)信息做處理,根據(jù)處理的信號(hào)進(jìn)行特征的選擇,最后將提取處理的機(jī)電設(shè)備的異常運(yùn)行狀態(tài)信息做智能識(shí)別。在這個(gè)過(guò)程中,特征的選擇與提取主要是根據(jù)信號(hào)分析的結(jié)果。傳統(tǒng)的機(jī)電設(shè)備異常運(yùn)行狀態(tài)的識(shí)別過(guò)程,在特征的選擇和提取上,嚴(yán)重依賴以往的經(jīng)驗(yàn)知識(shí),很容易出現(xiàn)不熟悉識(shí)別情況,并且在剔除和分揀原始信息的過(guò)程中,很容易造成丟失有效信息[1]。
機(jī)電設(shè)備異常運(yùn)行狀態(tài)的識(shí)別有很多方法,例如經(jīng)驗(yàn)?zāi)J椒纸夥ǖ龋毡榇嬖谔卣鬟x擇困難的問(wèn)題,只能以高維信息為直接對(duì)象,在現(xiàn)有程序的基礎(chǔ)上,設(shè)計(jì)運(yùn)行數(shù)據(jù)上傳至上機(jī)位的通信流程,通過(guò)對(duì)機(jī)電設(shè)備運(yùn)行信息的特征進(jìn)行提取并分析。對(duì)機(jī)電設(shè)備異常運(yùn)行過(guò)程中的故障問(wèn)題進(jìn)行直接診斷,才能從根本上解決原始信息特征選擇的問(wèn)題。隨機(jī)森林算法作為一種監(jiān)督學(xué)習(xí)算法,主要通過(guò)對(duì)算法數(shù)據(jù)的輸入進(jìn)行大量的模擬計(jì)算,并通過(guò)迭代處理完成算法的優(yōu)化。目前的隨機(jī)森林算法主要分為分類和回歸兩種類型,通過(guò)對(duì)訓(xùn)練數(shù)據(jù)的二次處理,對(duì)數(shù)據(jù)進(jìn)行回歸擬合,同時(shí),通過(guò)隨機(jī)選取森林的變量,將分類的節(jié)點(diǎn)生成多種分類樹,從而產(chǎn)生不同的分類結(jié)果。
為了實(shí)現(xiàn)機(jī)電設(shè)備異常運(yùn)行狀態(tài)的識(shí)別,對(duì)機(jī)電設(shè)備異常運(yùn)行狀態(tài)特征進(jìn)行提取。對(duì)信息的較高的維度進(jìn)行學(xué)習(xí)機(jī)器的訓(xùn)練,用較小的維度表示機(jī)電設(shè)備異常的運(yùn)行狀態(tài),以此獲取機(jī)電設(shè)備異常運(yùn)行信息的特征子向量[2]。根據(jù)特征的子向量,可以得到機(jī)電設(shè)備運(yùn)行信息訓(xùn)練子集的矩陣模型,用函數(shù)公式表示為:
其中,Am為類別機(jī)電設(shè)備運(yùn)行信息的散度矩陣,Cm為類別機(jī)電設(shè)備運(yùn)行信息的維特征向量,m 為類別數(shù)值,n 為機(jī)電設(shè)備運(yùn)行的特征的維度。根據(jù)機(jī)電設(shè)備的訓(xùn)練子集的矩陣模型函數(shù)模型,可以得到機(jī)電設(shè)備運(yùn)行的散度的矩陣計(jì)算式,利用高維信息進(jìn)行學(xué)習(xí)機(jī)器的訓(xùn)練,對(duì)數(shù)據(jù)進(jìn)行降維處理,將散度的比值進(jìn)行處理,可以根據(jù)機(jī)電設(shè)備異常運(yùn)行的訓(xùn)練子集均值向量數(shù)值,得到散度的矩陣模型,用公式表示為:
其中,Bm為類別機(jī)電設(shè)備運(yùn)行信息的樣本集矩陣,g 為運(yùn)行的維特征均值向量,l 為類別的樣本個(gè)數(shù)。根據(jù)散度的矩陣模型,可以得到評(píng)價(jià)特征子集辨別力的標(biāo)注函數(shù):
其中,d 為機(jī)電設(shè)備異常狀態(tài)的評(píng)價(jià)特征子集類特征辨別力,根據(jù)評(píng)價(jià)特征子集辨別力,對(duì)于特征的子向量,若樣本的方差很小并且相似性不大,則說(shuō)明機(jī)電設(shè)備異常運(yùn)行的特征子向量的辨別力強(qiáng),根據(jù)標(biāo)注函數(shù)的判斷,將樣本的類型分為較純的子集以及相關(guān)性較小的子集,根據(jù)子集的特征,完成對(duì)機(jī)電設(shè)備異常運(yùn)行狀態(tài)的特征提取[3]。
在機(jī)電設(shè)備異常運(yùn)行狀態(tài)提取特征的基礎(chǔ)上,根據(jù)隨機(jī)森林算法,將提取的特征進(jìn)行狀態(tài)分類,提取的機(jī)電設(shè)備異常運(yùn)行的狀態(tài)特征信息分為多個(gè)維度,主要是信息的數(shù)量以及樣本內(nèi)變量的信息,生成多個(gè)分類的參數(shù)閾值,從而根據(jù)閾值生成決策樹模型[4]。根據(jù)決策樹的模型,使用改進(jìn)的隨機(jī)森林算法,從機(jī)電設(shè)備的運(yùn)行數(shù)據(jù)中隨機(jī)選取不同的樣本數(shù)的參數(shù),將參數(shù)進(jìn)行組合,形成眾多的隨機(jī)決策樹,在決策樹的分類節(jié)點(diǎn)上,對(duì)數(shù)據(jù)集的信息熵進(jìn)行計(jì)算,從邏輯關(guān)系的角度,根據(jù)信息熵得出機(jī)電設(shè)備異常運(yùn)行狀態(tài)的信息熵計(jì)算模型,用公式表示為:
其中,hi表示數(shù)據(jù)集的節(jié)點(diǎn)的信息熵,ei表示數(shù)據(jù)集的節(jié)點(diǎn)的機(jī)電設(shè)備運(yùn)行的數(shù)據(jù)集的熵值,f 表示機(jī)電設(shè)備運(yùn)行數(shù)據(jù)集節(jié)點(diǎn)之間的信息熵值。根據(jù)節(jié)點(diǎn)之間的信息熵的數(shù)值,得出機(jī)電設(shè)備異常運(yùn)行之間聯(lián)合的熵值。根據(jù)聯(lián)合的熵值,以下降率為主要標(biāo)準(zhǔn)生成下降值最大數(shù)值模型,在這樣隨機(jī)選取樣本變量的組合下,生成可以并行處理的機(jī)電設(shè)備異常運(yùn)行狀態(tài)信息的決策模型。通過(guò)決策模型構(gòu)建機(jī)電設(shè)備運(yùn)行信息識(shí)別流程(圖1)。
圖1 機(jī)電設(shè)備狀態(tài)信息識(shí)別流程
根據(jù)狀態(tài)信息的識(shí)別流程,在隨機(jī)算法的基礎(chǔ)上,對(duì)初始參數(shù)較小的參數(shù)閾值,通過(guò)逐次遞增選出最優(yōu)的參數(shù)組合閾值,利用機(jī)電設(shè)備狀態(tài)的信息訓(xùn)練數(shù)值進(jìn)行隨機(jī)數(shù)值的變量重要性的度量,包括機(jī)電設(shè)備群點(diǎn)的剔除,以及對(duì)訓(xùn)練數(shù)據(jù)的構(gòu)建[5]。使用平均算法對(duì)機(jī)電設(shè)備狀態(tài)運(yùn)行的權(quán)重系數(shù)進(jìn)行選擇提取。同時(shí),在此基礎(chǔ)上根據(jù)采樣的節(jié)點(diǎn),得到不同加權(quán)系數(shù)下的提取函數(shù)模型,其函數(shù)表達(dá)為:
其中,t 為節(jié)點(diǎn)機(jī)電設(shè)備的平滑數(shù)值,u(k)表示為滑動(dòng)加權(quán)處理參數(shù),r 為機(jī)電設(shè)備的平滑采樣點(diǎn)。根據(jù)得到的加權(quán)系數(shù)提取函數(shù),得出機(jī)電設(shè)備的平滑數(shù)值參數(shù),將平滑數(shù)值參數(shù)設(shè)置為固定采樣點(diǎn)的參數(shù)數(shù)值,進(jìn)行統(tǒng)一的歸一化處理,得到歸一化后的機(jī)電設(shè)備異常運(yùn)行信息的數(shù)據(jù)信息。為了減少數(shù)據(jù)與節(jié)點(diǎn)之間的相互影響,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,作為算法的輸入數(shù)據(jù),根據(jù)最后的輸入數(shù)值,得到最后的機(jī)電設(shè)備運(yùn)行信息歸一公式:
其中,o 表示機(jī)電設(shè)備異常運(yùn)行加權(quán)參數(shù)。通過(guò)式(6)得到平均濾波的數(shù)據(jù)處理數(shù)值,通過(guò)數(shù)據(jù)處理數(shù)值得到最終的數(shù)值,從而完成對(duì)機(jī)電設(shè)備運(yùn)行數(shù)據(jù)的識(shí)別。
為了驗(yàn)證本文設(shè)計(jì)的機(jī)電設(shè)備異常狀態(tài)識(shí)別方法的有效性,進(jìn)行實(shí)驗(yàn)論證。在相同的訓(xùn)練樣本條件下,采用機(jī)電設(shè)備中的一個(gè)重要斷面安全裕度作為指標(biāo)的歷史數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。
將訓(xùn)練樣本的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),實(shí)驗(yàn)采用全體機(jī)電設(shè)備的數(shù)據(jù)作為模型的輸入數(shù)據(jù),為了保證實(shí)驗(yàn)的適用性,使用隨機(jī)取樣來(lái)選擇實(shí)驗(yàn)的主要樣本,并將主要樣本分為6 個(gè)編碼類別,在6個(gè)編碼類別分別設(shè)置對(duì)應(yīng)的樣本比例(表1)。
表1 機(jī)電設(shè)備運(yùn)行的樣本比例
選取合適的初始參數(shù),根據(jù)初始參數(shù)的不同,將樣本數(shù)據(jù)分為不同的分類結(jié)果,采用初始參數(shù)值的最小的值為初始值,并篩選出訓(xùn)練誤差最小的數(shù)值來(lái)組合參數(shù)。為保證本文提出的基于隨機(jī)森林算法的機(jī)電設(shè)備異常運(yùn)行識(shí)別方法的有效性,從訓(xùn)練樣本的數(shù)據(jù)集中隨機(jī)挑選機(jī)電設(shè)備運(yùn)行的數(shù)據(jù)信息進(jìn)行深度的特征提取,不同卷積層下的輸入與輸出特征如圖2 所示。
圖2 卷積層機(jī)電設(shè)備的輸入特征
從輸入特征圖中可以清晰地看清機(jī)電設(shè)備卷積層的輪廓,區(qū)分性的局部信息明顯,抽象的程度較高,滿足實(shí)驗(yàn)的基本要求。使用隨機(jī)森林的分類器,對(duì)單獨(dú)的連接層的輸出特征進(jìn)行測(cè)試,在測(cè)試中實(shí)驗(yàn)的隨機(jī)個(gè)數(shù)為200。對(duì)200 個(gè)參數(shù)進(jìn)行特征組合,得到特征提取的結(jié)果如圖3 所示。
圖3 數(shù)據(jù)特征提取結(jié)果
根據(jù)提取的數(shù)據(jù)特征,使用森林算法識(shí)別技術(shù)以及其他兩種方法進(jìn)行機(jī)電設(shè)備異常運(yùn)行精準(zhǔn)度的識(shí)別。
采用相同的訓(xùn)練樣本,引入不同的識(shí)別方法,在6 個(gè)編碼類別下進(jìn)行精度測(cè)試實(shí)驗(yàn),用UA 表示輸入端的節(jié)點(diǎn)的精度,PA表示輸出端節(jié)點(diǎn)的精度,則不同方法下的機(jī)電設(shè)備運(yùn)行的異常運(yùn)行識(shí)別精度對(duì)比如表2 所示。
表2 不同方法的異常樣本識(shí)別精度
通過(guò)三種方法異常運(yùn)行識(shí)別精度的比較,可以看出,隨機(jī)森林算法的識(shí)別精度明顯高于其他方法,不論是在輸入?yún)^(qū)域的精準(zhǔn)識(shí)別還是在輸出的精準(zhǔn)識(shí)別方面,其精準(zhǔn)度都高于其他兩種方法。隨機(jī)森林算法下的識(shí)別方法對(duì)運(yùn)行數(shù)據(jù)做了精準(zhǔn)分類并進(jìn)行了異常數(shù)據(jù)特征的提取,能夠?qū)崿F(xiàn)機(jī)電設(shè)備異常運(yùn)行狀態(tài)的精準(zhǔn)識(shí)別。
本文以機(jī)電設(shè)備的運(yùn)行狀態(tài)識(shí)別作為研究?jī)?nèi)容,在改進(jìn)隨機(jī)森林算法的基礎(chǔ)上,分析了自動(dòng)化的機(jī)電設(shè)備的典型工作流程。使用隨機(jī)森林算法完善數(shù)據(jù)的識(shí)別功能,通過(guò)集中存儲(chǔ)機(jī)電設(shè)備的正常運(yùn)行狀態(tài)信息,并對(duì)異常可疑狀態(tài)進(jìn)行簡(jiǎn)單分析,實(shí)現(xiàn)設(shè)備故障自動(dòng)化識(shí)別以及軟件的故障引導(dǎo)識(shí)別,從而實(shí)現(xiàn)了機(jī)電設(shè)備的高精度運(yùn)行識(shí)別。