梁毅峰
(淮北職業(yè)技術(shù)學(xué)院 機(jī)電工程系,安徽 淮北 235000)
工業(yè)是國(guó)民經(jīng)濟(jì)的基礎(chǔ)產(chǎn)業(yè)之一,關(guān)系到國(guó)計(jì)民生。隨著機(jī)械加工技術(shù)及制造水平的提高及精加工需求總量的不斷攀升,加工產(chǎn)業(yè)的機(jī)械化、自動(dòng)化程度也在持續(xù)提高[1-2]。大型機(jī)械化加工企業(yè)為了提高生產(chǎn)效率,多采用流水生產(chǎn)線,加工機(jī)械出現(xiàn)了大型化、復(fù)雜化的發(fā)展趨勢(shì)[3],但同時(shí)也增加了機(jī)械設(shè)備出現(xiàn)故障的概率。與其他類別的產(chǎn)品生產(chǎn)加工不同,加工機(jī)械對(duì)于溫度、壓力、加工時(shí)間等指標(biāo)的要求更為嚴(yán)格,如果加工機(jī)械因出現(xiàn)故障,導(dǎo)致不合格產(chǎn)品流入市場(chǎng),就會(huì)嚴(yán)重影響消費(fèi)者的身心健康。預(yù)防出現(xiàn)因設(shè)備故障而導(dǎo)致的大規(guī)模加工質(zhì)量問(wèn)題,最好的方法是對(duì)加工生產(chǎn)線、設(shè)備等實(shí)施在線監(jiān)控[4-5],一旦出現(xiàn)異常就可以及時(shí)預(yù)警并處理,避免出現(xiàn)更大損失。就設(shè)備在線監(jiān)控而言,目前主要有基于無(wú)線傳感器的動(dòng)態(tài)測(cè)試技術(shù)[6]和以小波變換技術(shù)為代表的信號(hào)處理技術(shù)[7-8],這兩種方案都是較為成熟的在線監(jiān)控方法,但隨著設(shè)備復(fù)雜程度的提高,監(jiān)控故障數(shù)據(jù)總量增加,對(duì)故障信號(hào)識(shí)別與處理的精度會(huì)不斷下降,并不能完全排除故障風(fēng)險(xiǎn)。近些年,人工智能[9]和機(jī)器學(xué)習(xí)[10]技術(shù)得到了空前的發(fā)展,二者在處理海量故障數(shù)據(jù)、故障特征分類與提取的過(guò)程中具有傳統(tǒng)方法無(wú)法比擬的優(yōu)勢(shì)。為更加準(zhǔn)確地定位機(jī)械故障位置,確定設(shè)備的故障類別,并提取出加工機(jī)械的故障特征,本文提出一種基于智能支持向量機(jī)(SVM)算法的故障分析方案,以提高加工機(jī)械故障在線分類與特征提取的精度,及時(shí)排除運(yùn)轉(zhuǎn)中設(shè)備的故障。
生產(chǎn)加工生產(chǎn)線設(shè)計(jì)通常為復(fù)雜的流水線,個(gè)別設(shè)備的機(jī)械故障容易導(dǎo)致整條生產(chǎn)線停機(jī)。在線機(jī)械故障檢測(cè)所面對(duì)的主要難題是海量的原始故障信號(hào)源與復(fù)雜的噪聲干擾,在較短的時(shí)間內(nèi)剔除噪聲干擾、提取故障特征并對(duì)故障特征進(jìn)行準(zhǔn)確分類的難度極大。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是在線處理海量數(shù)據(jù)與提取故障信號(hào)特征的有效方法,SVM是人工智能與機(jī)器學(xué)習(xí)技術(shù)的基本算法之一。作為一種非線性的數(shù)據(jù)處理模式,SVM算法具有強(qiáng)大的數(shù)據(jù)處理能力和泛化性能,尤其適用于復(fù)雜故障樣本和高維數(shù)據(jù)樣本的分類與尋優(yōu)求解。拓展到三維內(nèi)積空間T,用戶故障特征分類的超平面表示為
{(η·xi)+ζ=0|xi∈T,η∈T,ζ},
(1)
其中:xi為故障數(shù)據(jù)點(diǎn);向量η為決定數(shù)據(jù)點(diǎn)xi到超平面的距離系數(shù),與SVM超平面垂直;ζ是R集范圍內(nèi)的實(shí)數(shù)。η參數(shù)和ζ決定超平面的曲率。
為了避免模型參數(shù)乘以非零常數(shù)造成平面不變,對(duì)經(jīng)典SVM算法進(jìn)行深度優(yōu)化。引入規(guī)范化超平面的概念,即用不同的參數(shù)來(lái)限定超平面。規(guī)范化超平面可以表示為
{(η·x)+ζ=0|x∈T,(η,ζ)∈T×R}。
(2)
式(2)中設(shè)定規(guī)范化超平面是相對(duì)于故障數(shù)據(jù)點(diǎn)集X={x1,x2,…,xn}的超平面,滿足條件X∈T。在最優(yōu)解條件限定下,規(guī)范化超平面滿足條件:
(3)
S={(xi,yi)|xi∈T,yi∈[-1,1]}。
(4)
受規(guī)范平面的限制,縱坐標(biāo)值yi被限定在[-1,1]之間,此時(shí)用于確定故障點(diǎn)到分類超平面距離的分類幾何間隔τη,ζ為
(5)
在確定不同機(jī)械故障類別數(shù)據(jù)點(diǎn)時(shí),全部測(cè)試點(diǎn)都被認(rèn)為具有較小擾動(dòng),如果用幾何間隔τη,ζ劃分訓(xùn)練集合,那么依據(jù)規(guī)范化超平面的最優(yōu)限定條件,就能夠準(zhǔn)確地分開(kāi)兩類故障。針對(duì)維數(shù)較高的非線性超平面劃分問(wèn)題,還需要在二維超平面分割的基礎(chǔ)上對(duì)全部高維訓(xùn)練樣本作內(nèi)積運(yùn)算,并旋轉(zhuǎn)與高維數(shù)據(jù)相匹配的SVM模型核函數(shù)。核函數(shù)選擇也是優(yōu)化SVM算法的核心步驟之一??紤]到加工機(jī)械故障數(shù)據(jù)集的復(fù)雜程度及對(duì)故障檢測(cè)精度要求較高,本文在SVM模型構(gòu)建基礎(chǔ)上選擇高斯徑向基函數(shù)作為算法模型核函數(shù),即:
ζ(xi,yi)=exp{-κ|xi-yi|2}。
(6)
相對(duì)于其他類別的核函數(shù),高斯徑向基函數(shù)更適用于處理海量、復(fù)雜、高維的故障數(shù)據(jù)集,而經(jīng)過(guò)優(yōu)化后的SVM分類模型的規(guī)范化超平面具有更強(qiáng)的故障數(shù)據(jù)分類處理能力,有助于提升對(duì)多類別機(jī)械故障點(diǎn)的定位與診斷。
由終端傳感器采集到的加工機(jī)械的原始故障數(shù)據(jù)集不僅規(guī)模較大,而且包含大量系統(tǒng)噪聲與環(huán)境噪聲,含噪信號(hào)只有經(jīng)過(guò)預(yù)處理才能準(zhǔn)確提取故障特征和進(jìn)行特征分類,流程如圖1所示。
噪聲信號(hào)與振動(dòng)信號(hào)在物理頻率及MEL頻率上都存在差異,分幀降噪原理是通過(guò)對(duì)混合信號(hào)的預(yù)加重分幀加窗,濾除頻率差異的噪聲信號(hào)。對(duì)分幀后的振動(dòng)信號(hào)進(jìn)行傅里葉變換,改變?cè)泄收闲盘?hào)的振動(dòng)區(qū)間和振動(dòng)頻率。經(jīng)過(guò)分幀降噪后的原始振動(dòng)信號(hào)為x(t),經(jīng)過(guò)傅里葉變換后原始振動(dòng)信號(hào)的頻率會(huì)產(chǎn)生變化,頻域范圍和振動(dòng)頻率改變后的信號(hào)為
(7)
基于MEL濾波器的二次處理振動(dòng)信號(hào),一方面濾除殘余環(huán)境噪聲的干擾,另一方面還能夠達(dá)到故障數(shù)據(jù)降維的目的。復(fù)雜機(jī)械故障信號(hào)具有非線性和非平穩(wěn)性特征,需要在時(shí)頻域范圍統(tǒng)計(jì)時(shí)域信號(hào)的稀疏表征,具體的特征類別包括峰值、峭度、波形因子、均方根值等。在針對(duì)去噪故障信號(hào)的特征提取方面,本文基于樣本熵排列提取故障信號(hào)特征,去噪后的信號(hào)用1組時(shí)間序列表示:
{x′(t)}={x(1),x(2),…,x(m)}。
(8)
樣本熵的提取過(guò)程如下:
(1)從第j個(gè)故障數(shù)據(jù)點(diǎn)開(kāi)始提取連續(xù)的k個(gè)故障數(shù)據(jù)點(diǎn)構(gòu)建向量Xk(1),…,Xk(m-k+1);
(2)計(jì)算向量Xk(i)和Xk(j)所對(duì)應(yīng)元素的最大差值絕對(duì)值d[Xk(i),Xk(j)];
(3)在給定空間閾值δ范圍內(nèi),計(jì)算向量Xk(i)中空間距離小于閾值范圍δ的向量數(shù)量所占比例;
(4)將數(shù)據(jù)集的維數(shù)從m增加到m+1,分析序列中平均熵參數(shù)的變化趨勢(shì)。
由于截取的故障點(diǎn)所構(gòu)建的向量對(duì)非線性、非平穩(wěn)信號(hào)有著更高敏感度,可以用一種更為清晰和簡(jiǎn)潔的方式反映出每一種故障信號(hào)的復(fù)雜沖擊過(guò)程。在復(fù)雜的故障數(shù)據(jù)集系統(tǒng)中,每個(gè)故障向量都可能受到已知故障向量的影響,而在樣本熵模式下基于每一種向量距離出現(xiàn)的概率比重確定向量的類別,能夠更準(zhǔn)確地得到故障數(shù)據(jù)集的復(fù)雜度特征。
計(jì)算故障特征向量之間的相關(guān)性,以相關(guān)性取值概率大于0.85的變量作為目標(biāo)特征向量,對(duì)得到特征數(shù)據(jù)進(jìn)行歸一化處理,縱坐標(biāo)值yi的取值區(qū)間被限定在[0,1]之間,SVM模型構(gòu)建及基于SVM算法模型的故障診斷與分析流程如圖2所示。
選取與SVM模型規(guī)范超平面相關(guān)性概率大于0.85的特征值,組建新特征向量,在特征選取時(shí)就可以降低數(shù)據(jù)總體規(guī)模和數(shù)據(jù)集的高維特征?;赟VM算法的數(shù)據(jù)分類方案就是要找出輸入控件與輸出控件之間的映射關(guān)系,并在高維空間內(nèi)實(shí)現(xiàn)對(duì)故障數(shù)據(jù)的分類及高階線性回歸。針對(duì)非線性數(shù)據(jù)集的特征選擇問(wèn)題,引入最優(yōu)回歸函數(shù)和懲罰因子來(lái)有效地規(guī)避經(jīng)驗(yàn)風(fēng)險(xiǎn)值,回歸函數(shù)r(t)為
(9)
其中,C為模型的懲罰因子。在模型回歸函數(shù)的預(yù)估中,還要引入模型損失函數(shù):
L(y,f(x,η))=(y-f(x,η))2。
(10)
在利用規(guī)范超平面的故障數(shù)據(jù)分類過(guò)程中,對(duì)于支持向量而言,所對(duì)應(yīng)的拉格朗日乘子要滿足不為零的先決條件,才能解決數(shù)據(jù)集的非線性回歸問(wèn)題。選用高斯徑向基函數(shù)做高維替代的內(nèi)積計(jì)算,實(shí)現(xiàn)對(duì)函數(shù)值的準(zhǔn)確預(yù)估。SVM算法模型中的核心參數(shù)設(shè)定,包括懲罰因子C和高斯徑向基參數(shù)κ,如果核心參數(shù)的取值過(guò)大則容易導(dǎo)致過(guò)學(xué)習(xí),如果核心參數(shù)取值過(guò)小則容易導(dǎo)致欠學(xué)習(xí),無(wú)論是過(guò)學(xué)習(xí)還是欠學(xué)習(xí)都會(huì)導(dǎo)致故障類別的分類精度降低。本文用交叉驗(yàn)證法對(duì)核心參數(shù)進(jìn)行優(yōu)化選擇,將全部故障數(shù)據(jù)集以隨機(jī)方式劃分為M個(gè)子集,子集規(guī)模相近且互補(bǔ)相交,即全部子集的交集為空集,全部子集的并集為整個(gè)故障數(shù)據(jù)集。將劃分完成的子集進(jìn)行M訓(xùn)練與檢驗(yàn),從子集集合中選取第i次迭代的子集作為測(cè)試集,將其余子集作為訓(xùn)練集,一次檢驗(yàn)之后復(fù)制上述方法交叉檢驗(yàn),使懲罰因子C和高斯徑向基參數(shù)κ在全部數(shù)據(jù)集網(wǎng)格中得到遍歷和驗(yàn)證,最終得到均方誤差最低的1組參數(shù)值組合。
在線性可分空間范圍內(nèi),SVM算法只需要找到1個(gè)超平面就可以對(duì)兩類機(jī)械故障樣本的最大間隔做出劃分,在N維空間內(nèi)規(guī)范化的超平面F(x)為
F(x)=(ηN·x)+ζ=0。
(11)
任意兩個(gè)故障樣本集支持向量到超平面的和是最大間隔的兩倍,即滿足條件為
(12)
考慮到分類過(guò)程中的故障類別數(shù)量遠(yuǎn)遠(yuǎn)高于兩種,因此在樣本集劃分中應(yīng)盡量減少誤差值,如果當(dāng)待檢測(cè)故障樣本呈現(xiàn)出線性分布特征時(shí),則故障分類過(guò)程描述如圖3所示。
當(dāng)加工機(jī)械的故障樣本呈現(xiàn)出非線性分布的特征時(shí),需要將原有的非線性分布映射到高維線性可分空間,并求解出規(guī)范化的超平面。在線性不可分空間內(nèi)的故障分類過(guò)程如圖4所示。
故障數(shù)據(jù)訓(xùn)練中核函數(shù)主要負(fù)責(zé)將高維不可分空間的內(nèi)積運(yùn)算轉(zhuǎn)換為低維核函數(shù)運(yùn)算,降低算法復(fù)雜度,同時(shí)提高故障分類準(zhǔn)確率。當(dāng)涉及多分類場(chǎng)景時(shí),需要先將多分類場(chǎng)景拆分為多個(gè)二分類場(chǎng)景,構(gòu)造多個(gè)SVM分類器再進(jìn)行組合,以便能夠適應(yīng)多分類場(chǎng)景需要。
在實(shí)驗(yàn)室仿真環(huán)境下,借助旋轉(zhuǎn)實(shí)驗(yàn)臺(tái)模擬旋轉(zhuǎn)類加工機(jī)械設(shè)備的工作狀態(tài),提取500組訓(xùn)練故障樣本和20組測(cè)試數(shù)據(jù),每組數(shù)據(jù)包括4種故障類型:不同軸、偏磨、斷齒及齒面磨損。用Matlab仿真軟件對(duì)原始故障代碼進(jìn)行數(shù)值模擬,所形成的20組故障測(cè)試集如表1和表2所示。
表1 1~10組測(cè)試故障集
表2 11~20組測(cè)試故障集
驗(yàn)證文中提出加工機(jī)械故障檢測(cè)算法,在故障分類時(shí)的PBPA(概率賦值函數(shù))指標(biāo)值變化情況。PBPA可視為支持某一個(gè)變量θ子集的信念測(cè)度,定義為PBPA:→[0,1],且滿足條件
(13)
信念測(cè)度歸屬度(BPA)指標(biāo)值越高表明算法的數(shù)據(jù)融合性能越好,可以帶來(lái)更高數(shù)據(jù)分類精度。BPA指標(biāo)值的統(tǒng)計(jì)結(jié)果如圖5所示。
統(tǒng)計(jì)結(jié)果顯示,基于優(yōu)化SVM算法控制下的BPA指標(biāo)值平穩(wěn),未出現(xiàn)較大波動(dòng);而在其余兩種分類算法[6-8]下,不僅平均BPA值更低,且從各測(cè)試集指標(biāo)隨機(jī)分布情況來(lái)看,穩(wěn)定性較差,這表明在數(shù)據(jù)集規(guī)模較大及故障類別較多條件下,傳統(tǒng)故障分析方案的數(shù)據(jù)融合效果較差,最終會(huì)導(dǎo)致故障分類精度降低。故障的分類結(jié)果如圖6所示。
當(dāng)測(cè)試集的數(shù)量規(guī)模由1增加到20時(shí),各算法的分類精度指標(biāo)都呈現(xiàn)出下降的趨勢(shì),但優(yōu)化SVM控制算法的性能衰減較慢,當(dāng)數(shù)據(jù)集的規(guī)模達(dá)到20時(shí),故障分類精度仍能夠保證在95%以上;而動(dòng)態(tài)測(cè)試方法和信號(hào)處理方法,隨著數(shù)據(jù)規(guī)模的增長(zhǎng)性能衰減過(guò)快,當(dāng)測(cè)試集的數(shù)據(jù)規(guī)模為20時(shí),故障分類精度甚至低于了80%,故障分類精度將直接影響到最終的故障定位與檢測(cè)精度。
為檢測(cè)優(yōu)化SVM故障檢測(cè)算法在工廠的實(shí)際應(yīng)用性能,以B市W企業(yè)的數(shù)控車床軸承偏磨故障為研究對(duì)象,進(jìn)行跟蹤檢測(cè)與調(diào)查,測(cè)試周期為8周(2020年5月—6月),各周的檢測(cè)結(jié)果統(tǒng)計(jì)如表3所示。
表3 車床軸承偏磨故障率結(jié)果統(tǒng)計(jì)
在8周統(tǒng)計(jì)期內(nèi),W企業(yè)的平均設(shè)備故障檢測(cè)率水平達(dá)到98.06%,而該企業(yè)2019年的年均故障檢測(cè)率為82.41%(數(shù)據(jù)來(lái)源于W企業(yè)的設(shè)備管理部門和財(cái)務(wù)部門)。由此可見(jiàn),優(yōu)化SVM算法分析具有良好的實(shí)際應(yīng)用效果。
人工智能、機(jī)器學(xué)習(xí)技術(shù)的發(fā)展與成熟,為機(jī)械故障檢測(cè)提供了一條全新途徑。加工企業(yè)對(duì)于設(shè)備穩(wěn)定運(yùn)行的要求越來(lái)越高,為此本文對(duì)經(jīng)典SVM算法進(jìn)行了深度優(yōu)化,改善設(shè)備故障數(shù)據(jù)的分類性能和模型的泛化性能,在核函數(shù)選擇與懲罰因子的賦值方面,采用交叉驗(yàn)證法提高模型參數(shù)的選擇與匹配精度。仿真結(jié)果與實(shí)際應(yīng)用結(jié)果都顯示:基于優(yōu)化SVM算法的分析方法在數(shù)據(jù)分類精度、故障檢測(cè)精度方面均優(yōu)于傳統(tǒng)方法。