陳 旭
(眉山職業(yè)技術(shù)學(xué)院,四川 眉山 620010)
在信息技術(shù)、通信技術(shù)和物聯(lián)網(wǎng)的推動(dòng)下,全球工業(yè)已經(jīng)邁入了4.0時(shí)代[1],工業(yè)設(shè)備朝著大型化、連續(xù)化、高速化和智能化的方向發(fā)展[2-4]。旋轉(zhuǎn)類機(jī)械設(shè)備在工業(yè)領(lǐng)域的應(yīng)用較為廣泛,但其結(jié)構(gòu)較為復(fù)雜且設(shè)備的工作周期長,也更容易產(chǎn)生故障。為了避免由于旋轉(zhuǎn)類設(shè)備突然出現(xiàn)故障,而造成更大停機(jī)損失或人員傷亡,工業(yè)企業(yè)大都對(duì)該類設(shè)備實(shí)施在線實(shí)時(shí)監(jiān)控與故障診斷,以保障旋轉(zhuǎn)機(jī)械的穩(wěn)定運(yùn)行[5]。針對(duì)旋轉(zhuǎn)類機(jī)械結(jié)構(gòu)的故障分析與診斷,現(xiàn)有研究主要從對(duì)故障信號(hào)的時(shí)頻分析[6]、特征識(shí)別[7]、模式識(shí)別[8]等角度展開。陳仁祥等[9]提出基于離散小波變換的旋轉(zhuǎn)機(jī)械故障診斷方案,對(duì)連續(xù)的故障信號(hào)進(jìn)行離散化處理和多尺度變換,更準(zhǔn)確地提取故障信號(hào)的視頻特征。但此種算法下,離散小波基選取難度較大,算法復(fù)雜度也較高;郭煜敬等[10]提出基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的故障診斷方法,EMD處理故障信號(hào)的效果更直接,且具有較強(qiáng)的自適應(yīng)能力,能夠更好地處理非線性、非平穩(wěn)性的故障信號(hào)。但由于在應(yīng)用EMD方法時(shí)無法保證全部IMF分量的正交性,而且還存在一定程度的模態(tài)混疊現(xiàn)象,影響最終的旋轉(zhuǎn)機(jī)械結(jié)構(gòu)故障診斷精度;昝濤等[11]提出基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的故障診斷方法。人工智能算法的優(yōu)勢(shì)在于自適應(yīng)能力強(qiáng),能夠處理規(guī)模較大的故障集,在故障信息存儲(chǔ)和故障數(shù)據(jù)訓(xùn)練方面具有優(yōu)勢(shì)。但ANN的結(jié)構(gòu)設(shè)計(jì)與參數(shù)選擇會(huì)在一定程度上依賴先驗(yàn)知識(shí),具有一定的主觀性,利用ANN算法在全局范圍內(nèi)迭代更容易陷入局部最優(yōu)化,影響到對(duì)故障狀態(tài)的判斷。近些年,仿生算法[12]和啟發(fā)式算法[13]開始在機(jī)械故障診斷領(lǐng)域嶄露頭角,仿生算法和啟發(fā)式算法在計(jì)算求解過程中不依賴于梯度信息和先驗(yàn)知識(shí),且能夠應(yīng)對(duì)大規(guī)模的數(shù)據(jù)集。本文提出一種基于布谷鳥搜索算法(CS)特征數(shù)據(jù)啟發(fā)算法的故障診斷方法,基于仿生學(xué)理論啟發(fā)算法,提升旋轉(zhuǎn)機(jī)械設(shè)備故障診斷的精度。
旋轉(zhuǎn)機(jī)械故障診斷的核心工作是從采集到的機(jī)械振動(dòng)信號(hào)中提取出故障特征。隨著旋轉(zhuǎn)機(jī)械設(shè)計(jì)復(fù)雜程度的不斷提高,故障數(shù)據(jù)集的規(guī)模越來越大,不利于故障特征的識(shí)別與提取。傳統(tǒng)基于信號(hào)分析的淺層故障特征提取方法,無法有效應(yīng)對(duì)和處理大規(guī)模數(shù)據(jù)集,為此本文基于深度卷積神經(jīng)網(wǎng)絡(luò)算法,自適應(yīng)提取特征參數(shù)并進(jìn)行模式識(shí)別,應(yīng)對(duì)大規(guī)模數(shù)據(jù)集的特征處理問題。深度卷積神經(jīng)網(wǎng)絡(luò)是一種深層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),與ANN相比,其具有更強(qiáng)的數(shù)據(jù)處理性能。借助卷積運(yùn)算一方面能夠降低系統(tǒng)噪聲和環(huán)境噪聲的干擾,另一方面還可以增強(qiáng)原始信號(hào)的特征值,深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)見圖1。
圖1 深度卷積網(wǎng)絡(luò)結(jié)構(gòu)簡圖
卷積神經(jīng)網(wǎng)絡(luò)的卷積層被視為一組數(shù)量為n線性濾波器組:
(1)
(2)
激活函數(shù)表示為
(3)
下采樣層選用均值采樣的方式,得到特征矩陣的局部匯總集合,深度卷積網(wǎng)絡(luò)的輸出層配備了Softmax函數(shù)以獲取特征參數(shù),輸出結(jié)果在0~1之間,分類器模型可以描述為
(4)
其中,τp表示故障數(shù)據(jù)分類輸出過程中獲取的特征參數(shù)。
深度卷積神經(jīng)網(wǎng)絡(luò)是一種深層次的網(wǎng)絡(luò)學(xué)習(xí)算法模型,具有更強(qiáng)的大規(guī)模故障數(shù)據(jù)處理能力,通過實(shí)時(shí)調(diào)整與匹配各層次之間的最優(yōu)連接權(quán)值,確保卷積和采樣之后的信號(hào)重構(gòu)差異最小化。深度卷積神經(jīng)網(wǎng)絡(luò)模型在結(jié)構(gòu)設(shè)計(jì)上更復(fù)雜,同時(shí)也具有更強(qiáng)的故障數(shù)據(jù)處理能力,為降低算法的復(fù)雜度引入前向傳播原則,降低總體上的連接權(quán)值數(shù)量。在獲取到與卷積層相對(duì)應(yīng)的樣本特征向量后,再利用激活函數(shù)反向調(diào)整權(quán)值偏置,得到故障樣本數(shù)據(jù)的分布特征。
深度卷積神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的自學(xué)習(xí)能力和數(shù)據(jù)泛化處理能力,但隨著故障樣本規(guī)模的增大,學(xué)習(xí)速度下降且容易陷入局部最優(yōu)解,甚至導(dǎo)致故障數(shù)據(jù)集訓(xùn)練的失敗。為保證在大故障數(shù)據(jù)集條件下的故障診斷精度,彌補(bǔ)深度卷積神經(jīng)網(wǎng)絡(luò)算法的不足,本文引入CS仿生算法提升深度卷積神經(jīng)網(wǎng)絡(luò)的泛化能力、全局搜索能力和大規(guī)模故障數(shù)據(jù)集的處理能力。CS仿生算法是一種模仿布谷鳥飛行、繁殖等生物學(xué)特征行為的啟發(fā)式搜索算法。在尋找最優(yōu)解的過程中將布谷鳥在宿主巢穴中所產(chǎn)的卵視為一個(gè)新的最優(yōu)解。設(shè)定宿主鳥巢的固定值為m,宿主能夠識(shí)別出新解的概率是P,P∈[0,1],如果概率P值被替代,在新的宿主鳥巢位置會(huì)出現(xiàn)新解。布谷鳥個(gè)體zi通過飛行活動(dòng)更新當(dāng)前位置,尋找新的宿主巢穴,過程描述如下:
(5)
(6)
其中,u和v為服從正態(tài)分布的步長函數(shù)參數(shù)。
個(gè)體位置不斷更新以后,均勻分布的隨機(jī)數(shù)φ(取值范圍為[0,1])也發(fā)生改變,CS仿生算法的優(yōu)化模擬過程如(7)所示:
(7)
經(jīng)典CS仿生算法中布谷鳥個(gè)體移動(dòng)步長具有隨機(jī)性,種群個(gè)體只能通過飛行過程中的隨機(jī)遷移持續(xù)地更新位置。由于布谷鳥個(gè)體之間缺乏種群交流機(jī)制,模型中也沒有其他參數(shù)供對(duì)比分析,導(dǎo)致搜索能力下降,不利于算法的快速收斂。因此本文對(duì)經(jīng)典的CS仿生啟發(fā)算法進(jìn)行步長優(yōu)化,在經(jīng)典CS算法中引入牽引分量(種群中最優(yōu)和最差適應(yīng)度分量)和隨機(jī)函數(shù)值?;谶m應(yīng)度函數(shù)值自適應(yīng)調(diào)整移動(dòng)步長,避免隨機(jī)移動(dòng)而導(dǎo)致全局范圍內(nèi)搜索精度的降低,在t+1時(shí)刻步長分布函數(shù)的自適應(yīng)調(diào)整過程描述如下:
(8)
(9)
其中,Fw表示種群中的最差適應(yīng)度分量;Fb表示種群中的最佳適應(yīng)度分量。
此時(shí)布谷鳥個(gè)體zi的位置更新過程描述如下:
(10)
根據(jù)適應(yīng)度函數(shù)值的變化趨勢(shì)調(diào)整布谷鳥個(gè)體的移動(dòng)步長,避免了由于個(gè)體隨機(jī)移動(dòng)而導(dǎo)致全局搜索精度降低。在搜索前期加大步長,擴(kuò)大最優(yōu)解的搜索范圍,而在搜索后期逐漸根據(jù)需求減小步長,避免了由于個(gè)體移動(dòng)步長過大而導(dǎo)致個(gè)體在最優(yōu)解搜索中陷入局部最優(yōu)化。
通過優(yōu)化的CS啟發(fā)算法,能夠提升深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的全局搜索性能和數(shù)據(jù)訓(xùn)練性能,全面改善機(jī)器學(xué)習(xí)在旋轉(zhuǎn)機(jī)械故障中的應(yīng)用效果。數(shù)據(jù)訓(xùn)練時(shí)首先確定深度卷積神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu),基于網(wǎng)絡(luò)的復(fù)雜程度、閾值、權(quán)值等指標(biāo)確定搜索空間的維數(shù);其次構(gòu)建種群個(gè)體坐標(biāo)與卷積網(wǎng)絡(luò)之間的映射關(guān)系。在訓(xùn)練中由于適應(yīng)度函數(shù)和移動(dòng)步長均可調(diào)整,則通過調(diào)節(jié)權(quán)重比例wi控制網(wǎng)絡(luò)誤差的偏差?;趦?yōu)化CS算法的故障數(shù)據(jù)訓(xùn)練流程見圖2。
圖2 基于優(yōu)化CS算法的故障數(shù)據(jù)訓(xùn)練流程
CS特征數(shù)據(jù)啟發(fā)算法的應(yīng)用步驟如下:
Step1 根據(jù)旋轉(zhuǎn)機(jī)械結(jié)構(gòu)故障集的規(guī)模設(shè)定布谷鳥種群的初始規(guī)模,同時(shí)設(shè)置優(yōu)化算法的最大迭代次數(shù)、自適應(yīng)步長參數(shù)、新解概率及深度卷積神經(jīng)網(wǎng)絡(luò)的各層權(quán)值與閾值。
Step2 在分析是否滿足終止搜索條件前計(jì)算迭代次數(shù),如果達(dá)到最優(yōu)解則停止搜索;如果沒有達(dá)到最優(yōu)解,則繼續(xù)計(jì)算自適應(yīng)步長,進(jìn)入下一步尋優(yōu)階段。
Step3 根據(jù)種群中布谷鳥個(gè)體位置的具體更新情況,計(jì)算個(gè)體的適應(yīng)度函數(shù)值、最優(yōu)適應(yīng)度分量、最差適應(yīng)度分量。
Step4 基于貪婪策略擇優(yōu)選擇最佳的新解,對(duì)各代個(gè)體的適應(yīng)度函數(shù)值進(jìn)行比較,避免在迭代過程中出現(xiàn)個(gè)體退化現(xiàn)象。
Step5 比較迭代尋優(yōu)過程中的新解概率與隨機(jī)數(shù)的大小,篩選出最優(yōu)位置。每一個(gè)更新后的布谷鳥位置對(duì)應(yīng)一個(gè)目標(biāo)函數(shù)的維度,通過個(gè)體飛行重新產(chǎn)生新解,并通過自適應(yīng)步長尋優(yōu)傳遞到下一代,且保證了算法的收斂性能。在基于深度卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練故障數(shù)據(jù),在提取故障特征過程中,將布谷鳥位置更新值作為調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)值和編碼閾值的一個(gè)分量。優(yōu)化CS啟發(fā)算法的應(yīng)用,一方面提升了深度卷積神經(jīng)網(wǎng)絡(luò)算法的特征提取性能和收斂性能,另一方面適應(yīng)度函數(shù)值的引入,在很大程度上避免了最優(yōu)解搜索過于隨機(jī)而導(dǎo)致故障數(shù)據(jù)訓(xùn)練與檢測(cè)精度降低。
本實(shí)驗(yàn)從University of California Irvine數(shù)據(jù)庫中選擇三種不同規(guī)模的數(shù)據(jù)集,用于旋轉(zhuǎn)機(jī)械結(jié)構(gòu)故障檢測(cè),數(shù)據(jù)集規(guī)模、特征數(shù)、標(biāo)記數(shù)等信息如表1所示。
表1 實(shí)驗(yàn)用故障數(shù)據(jù)集相關(guān)信息
應(yīng)用CS特征數(shù)據(jù)啟發(fā)算法對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)算法的數(shù)據(jù)訓(xùn)練過程進(jìn)行優(yōu)化,相關(guān)參數(shù)設(shè)置如表2所示。
表2 算法參數(shù)設(shè)置
基于深度卷積神經(jīng)網(wǎng)絡(luò)提取故障特征時(shí),隨著故障數(shù)據(jù)集規(guī)模的增加,算法訓(xùn)練的學(xué)習(xí)效率和迭代效率降低,算法的總平方誤差收斂效率降低,進(jìn)而影響故障識(shí)別的精度。而引入CS啟發(fā)算法后提取故障特征的總平方誤差的收斂速度更快,以Sonar故障數(shù)據(jù)集為例,發(fā)現(xiàn)概率值設(shè)定為0.35,比例因子調(diào)整為0.40,并利用Matlab仿真軟件得出優(yōu)化前后總平方誤差控制效果,如圖3和圖4所示。
圖3 CS算法優(yōu)化前算法總平方誤差收斂效果仿真
圖4 CS算法優(yōu)化后算法總平方誤差收斂效果仿真
對(duì)比結(jié)果顯示,在優(yōu)化前訓(xùn)練迭代次數(shù)達(dá)到600才能夠收斂到最佳,而經(jīng)過CS算法優(yōu)化后,迭代次數(shù)減少到290次,收斂性能和學(xué)習(xí)效率得到明顯改善。
面向不同規(guī)模的故障數(shù)據(jù)集,運(yùn)用CS分類算法得到的分類準(zhǔn)確率和數(shù)據(jù)降維率,與引入傳統(tǒng)的離散小波算法、EMD算法和ANN算法參與對(duì)比,數(shù)據(jù)計(jì)算和統(tǒng)計(jì)結(jié)果見表3至表5。
表3 小規(guī)模數(shù)據(jù)集的特征分類性能對(duì)比
表4 中等規(guī)模數(shù)據(jù)集的特征分類性能對(duì)比
表5 大規(guī)模數(shù)據(jù)集的特征分類性能對(duì)比
在處理小規(guī)模的旋轉(zhuǎn)機(jī)械結(jié)構(gòu)數(shù)據(jù)集時(shí),經(jīng)過CS算法優(yōu)化后的深度卷積神經(jīng)網(wǎng)絡(luò)的分類性能,要優(yōu)于三種傳統(tǒng)算法,但差距較小,但故障特征數(shù)據(jù)的降維性能要明顯好于三種傳統(tǒng)算法。這主要是由于CS算法具有更強(qiáng)的步長控制能力和全局尋優(yōu)能力,能夠在全局范圍內(nèi)識(shí)別出更多的最優(yōu)新解。隨著數(shù)據(jù)集規(guī)模的不斷增大,各種算法的分類準(zhǔn)確率與數(shù)據(jù)降維率都在不斷降低,但CS算法的性能衰減相對(duì)于其他算法更慢。以Sonar數(shù)據(jù)集為例,CS算法的數(shù)據(jù)分類準(zhǔn)確率和數(shù)據(jù)降維率分別達(dá)到了93.26%和90.12%,遠(yuǎn)高于三種傳統(tǒng)特征數(shù)據(jù)分類算法。
六類故障數(shù)據(jù)集中實(shí)例數(shù)對(duì)應(yīng)的故障特征比例如表6所示。
表6 各故障數(shù)據(jù)集中包含的故障特征比例
統(tǒng)計(jì)分析在不同規(guī)模數(shù)據(jù)集條件下本文算法與三種傳統(tǒng)算法的故障診斷精度,如圖5至圖7所示。
圖5 大規(guī)模數(shù)據(jù)集故障診斷精度對(duì)比
圖6 中等規(guī)模數(shù)據(jù)集故障診斷精度對(duì)比
圖7 小規(guī)模數(shù)據(jù)集故障診斷精度對(duì)比
旋轉(zhuǎn)機(jī)械結(jié)構(gòu)故障診斷分析結(jié)果顯示,在三種不同規(guī)模的數(shù)據(jù)集條件下,基于CS特征數(shù)據(jù)的優(yōu)化算法的故障診斷精度都能保持在95%以上,當(dāng)故障特征比例較低時(shí),CS啟發(fā)算法的故障診斷性能也并未衰減。這表明經(jīng)過CS算法強(qiáng)化故障數(shù)據(jù)訓(xùn)練后,無論是算法的分類性能、降維性能、檢測(cè)性能,還是收斂性能都得到本質(zhì)上的改善。
隨著旋轉(zhuǎn)機(jī)械結(jié)構(gòu)復(fù)雜程度的不斷提高,故障數(shù)據(jù)集的規(guī)模不斷增大。深度卷積神經(jīng)網(wǎng)絡(luò)算法在處理大規(guī)模故障數(shù)據(jù)集時(shí),相對(duì)于傳統(tǒng)算法具有一定優(yōu)勢(shì),但算法的全局搜索性能和收斂能力需要加強(qiáng)。為此,本文利用優(yōu)化的CS算法模型提升卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的數(shù)據(jù)訓(xùn)練能力與泛化能力,保證故障特征提取和分類的準(zhǔn)確性。實(shí)驗(yàn)結(jié)果表明,本文提出的優(yōu)化算法具有更強(qiáng)的算法總平方誤差控制能力,故障診斷精度明顯優(yōu)于傳統(tǒng)算法。