周曉敏, 郝勇凱, 叢文韜, 魏志彬, 溫國(guó)棟
(北京科技大學(xué) 機(jī)械工程學(xué)院, 北京 100083)
軋機(jī)顫振是世界范圍內(nèi)板帶軋制生產(chǎn)過(guò)程中普遍存在并難于解決的問(wèn)題[1],對(duì)生產(chǎn)效率以及產(chǎn)品質(zhì)量造成了極大的影響。軋機(jī)工作機(jī)座以及輥系經(jīng)常發(fā)生垂直振動(dòng)即顫振,按軋機(jī)振動(dòng)頻率分為低頻、中頻和高頻振動(dòng)。造成顫振的原因非常復(fù)雜,Yarita等[2-3]最早開(kāi)始對(duì)軋機(jī)振動(dòng)問(wèn)題進(jìn)行理論建模和機(jī)理探索,建立了四自由度對(duì)稱彈簧質(zhì)量阻尼模型研究輥縫剛度對(duì)振動(dòng)的影響,認(rèn)為減小壓下量和摩擦因數(shù)能夠抑制軋機(jī)的振動(dòng)。Tamiya等[4]簡(jiǎn)化了模型,建模時(shí)忽略了工作輥,并認(rèn)為軋機(jī)系統(tǒng)上下對(duì)稱。經(jīng)過(guò)分析作者認(rèn)為軋機(jī)的三倍頻顫振是由軋機(jī)間張力的變化和軋輥輥縫變化之間的相位差導(dǎo)致的自激振動(dòng)。Niziol等[5]利用自激振動(dòng)和參數(shù)激勵(lì)模型研究軋機(jī)系統(tǒng)的顫振現(xiàn)象,并推導(dǎo)了帶鋼的運(yùn)動(dòng)方程,結(jié)果表明,軋件速度對(duì)振動(dòng)的激勵(lì)和強(qiáng)度起著至關(guān)重要的作用。隨著數(shù)值計(jì)算能力和理論研究方法的發(fā)展,針對(duì)多模態(tài)耦合振動(dòng)[6]、非線性因素[7]、塑形變形過(guò)程[8]、界面摩擦與潤(rùn)滑[9]、連續(xù)軋制[10]等結(jié)構(gòu)與工藝問(wèn)題的考慮,從理論分析、數(shù)值計(jì)算、試驗(yàn)?zāi)M及工程驗(yàn)證等多方面進(jìn)行了研究。
目前,我國(guó)鋼鐵行業(yè)的主要生產(chǎn)方式多為多機(jī)架連續(xù)軋制方式。連軋過(guò)程是典型的復(fù)雜工業(yè)流程,具有長(zhǎng)流程、多設(shè)備、多工況、難以獲得準(zhǔn)確機(jī)理模型、過(guò)程數(shù)據(jù)具有海量高維異構(gòu)等大數(shù)據(jù)特性,給軋制系統(tǒng)建模仿真、質(zhì)量預(yù)測(cè)、故障診斷帶來(lái)了很多挑戰(zhàn)。工業(yè)4.0時(shí)代,數(shù)據(jù)成為能夠創(chuàng)造價(jià)值的“生產(chǎn)資料”,這些數(shù)據(jù)蘊(yùn)涵著軋機(jī)生產(chǎn)過(guò)程中設(shè)備所有運(yùn)行和控制包括振動(dòng)在內(nèi)的規(guī)律,通過(guò)對(duì)這些過(guò)程數(shù)據(jù)的分析挖掘,有助于理解連軋線軋制過(guò)程的運(yùn)行規(guī)律和控制操作,從而識(shí)別出振動(dòng)發(fā)生的規(guī)律以及條件,進(jìn)一步實(shí)現(xiàn)軋制生產(chǎn)過(guò)程的優(yōu)化決策以及生產(chǎn)過(guò)程的智能制造。
冷連軋機(jī)組顫振機(jī)理及影響因素非常復(fù)雜,難以實(shí)現(xiàn)精確建模。機(jī)器學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)善于從原始輸入數(shù)據(jù)中挖掘出具有抽象和泛化的特征表示,擺脫專家知識(shí)和先驗(yàn)知識(shí)等限制,正在軋鋼預(yù)測(cè)領(lǐng)域開(kāi)始廣泛應(yīng)用。如文獻(xiàn)[11]提出基于BPAdaBoost和POS-SVM兩種軋機(jī)振動(dòng)預(yù)測(cè)模型,利用某鋼廠實(shí)測(cè)數(shù)據(jù)通過(guò)數(shù)據(jù)挖掘技術(shù),對(duì)兩種模型進(jìn)行訓(xùn)練和測(cè)試。文獻(xiàn)[12]建立了冷軋機(jī)垂直系統(tǒng)的動(dòng)態(tài)軋制力模型,為分析振動(dòng),此模型中包含振動(dòng)因素。文獻(xiàn)[13]通過(guò)結(jié)合分析近幾年軋機(jī)垂直振動(dòng)問(wèn)題的研究成果,提出運(yùn)用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘。
某鋼廠1420冷連軋機(jī)組目前已在軋機(jī)上部署了軋機(jī)振動(dòng)在線監(jiān)測(cè)系統(tǒng)[14],在振動(dòng)發(fā)生后發(fā)出報(bào)警信息再采取抑振措施,從而避免發(fā)生劇烈振動(dòng)?;谡駝?dòng)在線監(jiān)測(cè)系統(tǒng)采集的振動(dòng)數(shù)據(jù)和生產(chǎn)過(guò)程記錄數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)整理和預(yù)處理建立數(shù)據(jù)樣本庫(kù),并建立梯度提升決策樹(shù)振動(dòng)回歸模型,采用實(shí)際生產(chǎn)過(guò)程數(shù)據(jù)進(jìn)行模型驗(yàn)證,結(jié)果表明,利用模型選擇的重要特征作為輸入建立的回歸模型能準(zhǔn)確跟蹤振動(dòng)能量的變化趨勢(shì)。
所用數(shù)據(jù)包括某鋼廠1420冷連軋機(jī)組的在線振動(dòng)監(jiān)測(cè)數(shù)據(jù)和實(shí)際生產(chǎn)過(guò)程數(shù)據(jù)。實(shí)際生產(chǎn)過(guò)程數(shù)據(jù)主要包括1#~5#機(jī)架的工藝參數(shù)如軋制速度、出口張力、入口張力、軋制力、壓下量、輥縫等;軋件參數(shù)如帶鋼寬度、厚度、材質(zhì)等;設(shè)備參數(shù)如軋輥相關(guān)信息等。振動(dòng)在線監(jiān)測(cè)系統(tǒng)如圖1所示。軋機(jī)的振動(dòng)信號(hào)通過(guò)安裝在1#~5#軋機(jī)機(jī)架上的振動(dòng)加速度傳感器來(lái)實(shí)時(shí)采集,并將采集的信號(hào)經(jīng)過(guò)處理后分解為低、中、高頻能量數(shù)據(jù),根據(jù)計(jì)算與設(shè)定的報(bào)警模型進(jìn)行對(duì)比判斷軋機(jī)是否振動(dòng)。顫振信號(hào)數(shù)據(jù)中主要包括:1#~5#機(jī)架的軋制速度,1#~5#機(jī)架低頻、中頻、高頻能量值和能量限值。
圖1 振動(dòng)監(jiān)測(cè)系統(tǒng)結(jié)構(gòu)圖
由于生產(chǎn)過(guò)程記錄數(shù)據(jù)和振動(dòng)能量數(shù)據(jù)存儲(chǔ)周期不同,此外由于這兩部分屬于不同的系統(tǒng),數(shù)據(jù)記錄的生成絕對(duì)時(shí)間不同,將生產(chǎn)過(guò)程記錄數(shù)據(jù)進(jìn)行下采樣并按照5#機(jī)架速度進(jìn)行匹配。按照該方法提取出以卷為單位的25卷鋼的數(shù)據(jù)。
對(duì)25卷鋼的樣本進(jìn)行數(shù)據(jù)清洗,如樣本中存在的缺失值、亂碼等錯(cuò)誤,考慮到參數(shù)存在階梯狀跳躍,故直接對(duì)殘缺樣本進(jìn)行剔除,確保樣本集中每個(gè)樣本的正確性。認(rèn)為超過(guò)報(bào)警值即發(fā)生能量超限現(xiàn)象即可認(rèn)為發(fā)生顫振,對(duì) 25卷鋼的數(shù)據(jù)處理后的樣本條數(shù)進(jìn)行統(tǒng)計(jì),其結(jié)果如表1所示。
表1 25卷鋼的數(shù)據(jù)樣本條數(shù)統(tǒng)計(jì)
由表1可知,25卷鋼的數(shù)據(jù)共提取出118 048條樣本數(shù),其中1#~3#機(jī)架沒(méi)有發(fā)生過(guò)顫振信號(hào)能量超限,顫振信號(hào)能量超限主要發(fā)生在4#和5#機(jī)架中頻,5#機(jī)架的中頻超限發(fā)生次數(shù)明顯高于4#機(jī)架,因此針對(duì)5#機(jī)架中頻能量建立回歸預(yù)測(cè)模型。
通過(guò)統(tǒng)計(jì)的信息對(duì)數(shù)據(jù)進(jìn)行再次處理,因?yàn)?#~3#機(jī)架沒(méi)有發(fā)生過(guò)顫振,再結(jié)合經(jīng)驗(yàn)知識(shí),建模時(shí)只考慮4#和5#機(jī)架參數(shù)對(duì)顫振的影響,故將1#機(jī)架~3#機(jī)架的參數(shù)剔除;此外認(rèn)為生產(chǎn)過(guò)程記錄數(shù)據(jù)中的參考值和某一整列不變的值對(duì)結(jié)果無(wú)影響,也將其剔除,再結(jié)合參數(shù)的實(shí)際物理意義進(jìn)行人工挑選,把無(wú)實(shí)際物理意義的參數(shù)進(jìn)行剔除。
經(jīng)過(guò)現(xiàn)場(chǎng)經(jīng)驗(yàn)知識(shí)確認(rèn),剩余參數(shù)中很多參數(shù)具有線性強(qiáng)相關(guān),比如4#機(jī)架軋制速度和5#機(jī)架軋制速度等,線性強(qiáng)相關(guān)的參數(shù)具有同等作用,故需將其中的冗余參數(shù)進(jìn)行去除,利用皮爾遜相關(guān)系數(shù)法對(duì)參數(shù)進(jìn)行線性相關(guān)計(jì)算,結(jié)合實(shí)際參數(shù)物理意義和經(jīng)驗(yàn)知識(shí)有選擇地剔除具有線性強(qiáng)相關(guān)的冗余參數(shù),認(rèn)為當(dāng)兩個(gè)特征之間的相關(guān)系數(shù)絕對(duì)值大于等于0.95、顯著性系數(shù)小于0.01時(shí),這兩個(gè)特征具有線性強(qiáng)相關(guān)關(guān)系。
由于所有的數(shù)據(jù)都具有實(shí)際物理意義,其取值受到單位的影響,為消除不同特征取值量級(jí)不同的影響,對(duì)數(shù)據(jù)利用min-max歸一化方法進(jìn)行歸一化處理。
通過(guò)對(duì)生產(chǎn)過(guò)程數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理及統(tǒng)計(jì)分析,結(jié)合機(jī)理和經(jīng)驗(yàn)知識(shí),最終確定數(shù)據(jù)樣本集的輸入變量為123個(gè),輸出變量為第5#機(jī)架中頻能量值。
梯度提升決策樹(shù)(gradient boosting decision tree,GBDT)算法最初是由FreidMan[15-16]在1999年提出來(lái)的。
GBDT屬于一種迭代算法,以決策樹(shù)為弱學(xué)習(xí)器的梯度提升算法,并且決策樹(shù)是回歸樹(shù),而不是分類樹(shù),每棵樹(shù)是從先前所有樹(shù)的殘差中來(lái)學(xué)習(xí),每一次新的訓(xùn)練都是為了改進(jìn)上一次的結(jié)果,所有樹(shù)的結(jié)論累加起來(lái)做最終答案。GBDT通過(guò)組合弱學(xué)習(xí)器形成一個(gè)強(qiáng)學(xué)習(xí)器,使其具有天然優(yōu)勢(shì)可以發(fā)現(xiàn)多種有區(qū)分性的特征以及特征組合,所以它在剛提出時(shí)就被認(rèn)為泛化能力較強(qiáng)的算法。
用GBDT做回歸分析,其所用的損失函數(shù)為Huber函數(shù)
L(y,f(x))=
(1)
式中:L(y,f(x))為損失函數(shù);x、y分別為實(shí)際樣本數(shù)據(jù)的輸入和輸出值;f(x)為擬合值;δ為分位數(shù)。
假設(shè)共訓(xùn)練M棵數(shù),其算法步驟為
(1) 輸入:訓(xùn)練數(shù)據(jù)集
D={(x1,y1),(x2,y2),…,(xN,yN)},
xi∈X?Rn,yi∈Y?R
(2)
(2) 初始化
(3)
(3) 對(duì)m=1,2,…,M
(a) 求殘差
rm-1(xi)=yi-Fm-1(xi),i=1,…,N
(4)
(b) 求分位數(shù)
(5)
(c) 計(jì)算負(fù)梯度
i=1,…,N
(6)
(d) 利用負(fù)梯度訓(xùn)練出第m棵回歸樹(shù),得到其葉節(jié)點(diǎn)劃分的區(qū)域?yàn)?/p>
(7)
其中J為葉子節(jié)點(diǎn)數(shù)。
(e) 對(duì)于回歸樹(shù)的每一個(gè)葉節(jié)點(diǎn)j=1,2,…,J,計(jì)算輸出值
(8)
(9)
(f) 更新
(10)
式中:I(x∈Rjm)為指示函數(shù),當(dāng)回歸樹(shù)判定x屬于Rjm時(shí),其值為1,否則為0;α稱為步長(zhǎng)(學(xué)習(xí)率),一般地,0<α≤1。
(4) 循環(huán)結(jié)束,得到梯度提升回歸樹(shù)
(11)
利用25卷帶鋼共計(jì)118 048條記錄的數(shù)據(jù)建立數(shù)據(jù)樣本集,將23卷帶鋼合并作為訓(xùn)練集,另外2卷帶鋼數(shù)據(jù)建立整卷帶鋼的振動(dòng)回歸模型測(cè)試集。
對(duì)回歸模型,評(píng)價(jià)分類器性能的指標(biāo)一般是均方誤差(mean square error,MSE),由構(gòu)建的樣本集可知,超過(guò)報(bào)警線的能量值樣本數(shù)量極少,樣本大部分處于振動(dòng)不超限狀態(tài),在學(xué)習(xí)模型時(shí)利用平方損失函數(shù)作為誤差函數(shù)容易把超限能量值當(dāng)作噪聲點(diǎn)作平滑處理導(dǎo)致尖峰值不能很好地?cái)M合,可結(jié)合擬合的曲線進(jìn)行判斷選擇,每個(gè)模型重復(fù)5次,取其中結(jié)果較平均的一個(gè)作為該模型結(jié)果。如圖2所示。
圖2 模型誤差和測(cè)試集結(jié)果
可以發(fā)現(xiàn),圖2中模型趨于穩(wěn)定,整體擬合的MSE達(dá)到了0.000 015,模型無(wú)過(guò)擬合現(xiàn)象,回歸擬合的趨勢(shì)反映了實(shí)際能量的變化趨勢(shì)。由于測(cè)試數(shù)據(jù)是實(shí)際軋制過(guò)程中的一整卷帶鋼數(shù)據(jù)集,在采樣點(diǎn)數(shù)4 000附近的最后一個(gè)尖峰值是由于帶鋼甩尾瞬間而并非工藝原因造成的振動(dòng),因此模型未擬合到尖峰值。
GBDT方法本身是依據(jù)決策樹(shù)集成的方法,而決策樹(shù)在構(gòu)建時(shí)會(huì)根據(jù)特征重要度來(lái)構(gòu)建分枝節(jié)點(diǎn),所以GBDT會(huì)對(duì)重要的特征進(jìn)行選擇,利用這一特性,對(duì)GBDT選出的特征進(jìn)行排序。經(jīng)過(guò)特征選擇得到特征的排序,從第一個(gè)特征開(kāi)始,每次增加一個(gè)特征,進(jìn)行循環(huán)建模,將每次建模得到評(píng)價(jià)標(biāo)準(zhǔn)MSE作圖,如圖3所示。
圖3 特征個(gè)數(shù)和評(píng)價(jià)標(biāo)準(zhǔn)圖
由圖3可知,特征個(gè)數(shù)在10個(gè)的時(shí)候就能得到較好效果,為了排除偶然等因素,分別以輸入為排序前10、15、20、25的特征數(shù)量進(jìn)行建模,結(jié)果如圖4所示。
(a) 輸入為排序前10個(gè)特征的模型結(jié)果
由圖4結(jié)果分析可知,圖4(a)中的MSE最大,為0.000 013,但已具有較好的尖峰值預(yù)測(cè)效果,圖4(b)中的MSE最小,為0.000 010,圖4(c)中的MSE為0.000 011,稍大于圖4(b),但是對(duì)尖峰值的預(yù)測(cè)效果更好,圖4(d)中的MSE與4(c)相同,擬合效果接近。
綜合考慮模型精度和復(fù)雜度,選擇輸入特征為特征排序的前20個(gè)特征。圖5為20個(gè)輸入特征的重要度排序,圖中m1xp為主令速度定位位置,s4s為4#機(jī)架實(shí)際前滑,s5v為5#機(jī)架實(shí)際速度,sl為實(shí)際軋制帶鋼長(zhǎng)度,m1a為主令加速度,s5vg為5#機(jī)架附加速度增益,g5hod為5#機(jī)架HGC驅(qū)動(dòng)側(cè)補(bǔ)償,z5p為5#機(jī)架輥縫附加位置,s5s為5#機(jī)架實(shí)際前滑,s5p為5#機(jī)架實(shí)際輥縫位置,p4cr為4#機(jī)架竄輥?zhàn)兓?,g5hoo為5#機(jī)架HGC操作側(cè)補(bǔ)償,s5bf為5#機(jī)架支撐輥平衡壓力, scs4為4#機(jī)架速度補(bǔ)償,p5sc為5#機(jī)架竄輥伺服閥輸出,s5irbp為5#機(jī)架中間輥彎輥,g5hpo為5#機(jī)架HGC位置控制輸出,s4rf為4#機(jī)架實(shí)際軋制力,s4pd為4#機(jī)架軋制線偏差,s5pd為5#機(jī)架軋制線偏差。
圖5 特征重要度結(jié)果
輸入為選擇的20個(gè)特征時(shí),訓(xùn)練耗時(shí)為33.92 s,預(yù)測(cè)耗時(shí)為0.003 34 s。輸入為123個(gè)特征的模型訓(xùn)練耗時(shí)為185.35 s,預(yù)測(cè)耗時(shí)為0.005 98 s。可以看出,經(jīng)過(guò)特征選擇后的模型有效降低了模型復(fù)雜度和模型訓(xùn)練時(shí)間。
為解決工業(yè)實(shí)際問(wèn)題,結(jié)合現(xiàn)場(chǎng)記錄的生產(chǎn)數(shù)據(jù),提出了梯度提升決策樹(shù)模型的冷軋顫振研究,取得了以下的結(jié)論:
(1) 建立冷連軋機(jī)組第5機(jī)架中頻能量的GBDT模型,能夠準(zhǔn)確擬合軋制過(guò)程中的振動(dòng)能量變化尖峰,擬合趨勢(shì)準(zhǔn)確反映了實(shí)際能量變化趨勢(shì)。
(2) 結(jié)合GBDT自身算法特性和機(jī)理知識(shí)進(jìn)行特征選擇,選擇重要度排序前20個(gè)特征作為輸入特征,降低了模型復(fù)雜度,且與123個(gè)輸入特征模型具有相近的預(yù)測(cè)精度。
通過(guò)建立冷連軋機(jī)組振動(dòng)的GBDT機(jī)器學(xué)習(xí)模型,對(duì)一些難以建立精確機(jī)理模型的工業(yè)實(shí)際問(wèn)題提供了建模思路,對(duì)人工智能化和數(shù)據(jù)化在工業(yè)上的應(yīng)用進(jìn)行了一次有意義的探索。