蘇 楠,任 彥,高曉文,楊 靜
(內(nèi)蒙古科技大學(xué)信息工程學(xué)院,內(nèi)蒙古 包頭 014010)
熱軋板帶鋼在家用電器、車輛制造、船舶制造等多個(gè)行業(yè)廣泛應(yīng)用[1],高品質(zhì)的帶鋼產(chǎn)品越來越受深加工制造者及制造廠商青睞,但下游生產(chǎn)企業(yè)對(duì)帶鋼產(chǎn)品的厚度、寬度、凸度等指標(biāo)要求越來越高。當(dāng)前軋機(jī)普遍采用了自動(dòng)板型控制系統(tǒng)[2]來解決板型的控制問題提高了熱軋帶鋼產(chǎn)品產(chǎn)出品質(zhì)。熱連軋生產(chǎn)主要包括粗軋、精軋、層流冷卻、卷曲四個(gè)部分,其中精軋環(huán)節(jié)決定了最終帶鋼板型的好壞。由于熱軋環(huán)節(jié)設(shè)備設(shè)定變量較多、執(zhí)行機(jī)構(gòu)數(shù)量多且檢測環(huán)節(jié)存在時(shí)延,使得板形控制變得更加復(fù)雜。板形控制中輥縫與彎輥力直接影響最終產(chǎn)出帶鋼的板形,而軋制力的設(shè)定值影響了輥縫與彎輥力設(shè)定值的求解[3]。在軋制過程中,軋制參數(shù)相互之間耦合嚴(yán)重,軋制力受來料厚度、變形抗力及板帶張力等多種生產(chǎn)過程關(guān)鍵參數(shù)的制約。
熱軋生產(chǎn)過程存在參數(shù)種類多、強(qiáng)耦合、非線性等問題,傳統(tǒng)數(shù)學(xué)機(jī)理模型制約了軋制力控制精度的進(jìn)一步提高。近些年來,大數(shù)據(jù)技術(shù)的蓬勃發(fā)展為解決該問題提供了可能,越來越多的學(xué)者將人工智能技術(shù)應(yīng)用于熱軋控制過程中。馬威等采用多層感知器(Multi-Layer Perceptron,MLP)模型對(duì)寶鋼1880熱連軋機(jī)組軋制力進(jìn)行預(yù)測[4]。吳倩等采用了GA-BP神經(jīng)網(wǎng)絡(luò)與敏感性分析對(duì)帶鋼厚度進(jìn)行了預(yù)測[5]。王春華等使用支持向量回歸(Support Vector Regression,SVR)模型對(duì)軋制力進(jìn)行了預(yù)測[6]。冀秀梅等使用極限學(xué)習(xí)機(jī)在中厚板軋制中對(duì)軋制力進(jìn)行預(yù)測[7]。Parvizi Ali等采用人工神經(jīng)網(wǎng)絡(luò)對(duì)負(fù)荷和轉(zhuǎn)矩進(jìn)行預(yù)測[8]。Jingyi Liu等采用多層極限學(xué)習(xí)機(jī)模型對(duì)熱連軋軋制力進(jìn)行預(yù)測[9]。
本文以某鋼鐵企業(yè)板材廠熱連軋生產(chǎn)過程為對(duì)象開展軋制力預(yù)測模型的研究,該廠二級(jí)控制系統(tǒng)軋制力采用傳統(tǒng)軋制力機(jī)理模型[10]。該模型滿足了當(dāng)前熱軋生產(chǎn)過程的要求,但是受生產(chǎn)過程環(huán)境變化、檢測干擾等因素的影響,機(jī)理模型仍存在預(yù)測精度較差、解算耗時(shí)、預(yù)測結(jié)果波動(dòng)大等缺點(diǎn)。隨著生產(chǎn)過程增質(zhì)增效的提出,軋制力模型預(yù)測精度需進(jìn)一步提升。
考慮熱軋生產(chǎn)過程不確定性、模型預(yù)測精度、生產(chǎn)實(shí)時(shí)性等因素,本文采用了隨機(jī)森林回歸(Random Forest Regressor,RFR)算法建立了軋制力預(yù)測模型,利用粒子群算法(Particle Swarm Optimization,PSO)優(yōu)化了RFR模型中的超參數(shù),解決了RFR中超參數(shù)設(shè)定復(fù)雜的問題。實(shí)驗(yàn)結(jié)果表明,在軋制力預(yù)測中RFR模型相較SVR模型和MLP模型預(yù)測精度與速度都有所提高。
軋制生產(chǎn)中在采集記錄數(shù)據(jù)時(shí),由于通信系統(tǒng)故障、電磁干擾、數(shù)據(jù)堵塞等原因會(huì)使采集數(shù)據(jù)中包含少量的異常值。孤立森林算法是由周志華等提出[11],是一種基于集成學(xué)習(xí)的連續(xù)數(shù)據(jù)無監(jiān)督異常值檢測方法。該算法無需計(jì)算距離或密度,具有運(yùn)算快、抗噪能力強(qiáng)、穩(wěn)定性好的優(yōu)點(diǎn),適用于海量數(shù)據(jù)的異常值檢測。該算法通過檢測樣本中的孤立點(diǎn)來確定異常值,算法分為訓(xùn)練和檢測兩個(gè)階段,其具體實(shí)現(xiàn)過程如下:
1)訓(xùn)練階段:使用數(shù)據(jù)集樣本構(gòu)建孤立樹,構(gòu)建過程具體步驟如下所示:
①從原始數(shù)據(jù)中隨機(jī)選取m個(gè)樣本作為數(shù)據(jù)集;
②從數(shù)據(jù)集中隨機(jī)選取一個(gè)特征,在該特征最大值與最小值間隨機(jī)選取一個(gè)切割點(diǎn)p;
③在p點(diǎn)形成一個(gè)超平面,將數(shù)據(jù)集進(jìn)行二分割,數(shù)據(jù)集中小于p的數(shù)據(jù)劃分至左側(cè)子節(jié)點(diǎn),大于等于的數(shù)據(jù)劃分至右側(cè)子節(jié)點(diǎn);
④分別在新分割的左右兩側(cè)子節(jié)點(diǎn)數(shù)據(jù)重復(fù)②③步驟,直至數(shù)據(jù)不可分或達(dá)到最大分割深度;
⑤重復(fù)上述過程,構(gòu)建t棵孤立樹。
2)檢測階段:將被測樣本x代入孤立樹中,并計(jì)算由根節(jié)點(diǎn)到樣本所在節(jié)點(diǎn)的路徑長度,遍歷t棵樹得出平均路徑長度h(x)。對(duì)所有被測樣本點(diǎn)的平均路徑長度做歸一化,得到一個(gè)0~1之間的異常分?jǐn)?shù),越接近1異常的可能性越高。異常值分?jǐn)?shù)計(jì)算公式如下所示
(1)
式中:n表示孤立樹分化的節(jié)點(diǎn)個(gè)數(shù),E(h(x)為樣本x的路徑長度的期望值,h(x)表示樣本x的平均路徑長度
(2)
式中:c(n)表示n個(gè)樣本構(gòu)建的孤立樹的平均路徑長度。H(i)=ln(i)+γ,γ是歐拉常數(shù)。
在軋制環(huán)節(jié)中影響軋制力的相關(guān)因素較多,主要有軋機(jī)的軋制速度、精軋入口厚度、精軋出口厚度,精軋入口寬度、精軋出口寬度、軋輥半徑和精軋入口溫度等23個(gè)主要參數(shù)。為了降低模型計(jì)算復(fù)雜程度及提高預(yù)測精度,采用相關(guān)系數(shù)方法[12]分析影響軋制力的主要參數(shù),選取軋制速度,精軋入口厚度,精軋出口厚度,精軋入口寬度,精軋出口寬度,變形抗力,精軋入口溫度,精軋出口溫度作為軋制力預(yù)測模型的輸入。
軋制力數(shù)學(xué)機(jī)理模型公式為
(3)
式(3)中:P為機(jī)理模型計(jì)算出的軋制力,kN;km為變形抗力,MPa;αP,βP為前后張力系數(shù);tf,tb為前后張力;Ld為接觸弧長度,mm;BF為精軋目標(biāo)寬度,mm,QP外摩擦影響系數(shù)。
軋輥與鋼帶的接觸弧弧長
(4)
式(4)中:Rd為工作輥?zhàn)冃伟霃?,mm;H,h為軋機(jī)入口和出口厚度,mm。
摩擦系數(shù)為
(5)
該機(jī)理模型已應(yīng)用于實(shí)際的軋制力計(jì)算,然而在推導(dǎo)過程中存在一些假設(shè)與簡化,因此其預(yù)測精度在生產(chǎn)中仍有提升的空間。
隨機(jī)森林回歸算法是由Leo Breiman提出的一種由多個(gè)決策樹集成的集成學(xué)習(xí)算法[13]。RFR算法是使用Bagging方法集成CART回歸決策樹的強(qiáng)學(xué)習(xí)算法。RFR使用Bootstrap重抽樣從原始訓(xùn)練集中有放回抽取多個(gè)子訓(xùn)練集,并使用每個(gè)子訓(xùn)練集構(gòu)建其決策樹。RFR算法的預(yù)測結(jié)果由所有決策樹預(yù)測結(jié)果取平均所得。RFR模型結(jié)構(gòu)如圖1所示。
RFR模型的具體實(shí)現(xiàn)過程如下:
2)使用CART算法構(gòu)造q棵決策樹(X,Sθ1n),(X,Sθ2n),…,(X,Sθqn)。構(gòu)建過程不進(jìn)行剪枝操作使每棵決策樹都能在限定范圍內(nèi)最大延伸。單個(gè)回歸樹的預(yù)測值1=(X,Sθ1n),2=(X,Sθ2n),…,q=(X,Sθqn)。
3)隨機(jī)森林回歸模型的輸出可由構(gòu)建的q棵決策樹預(yù)測結(jié)果求取平均值得出。如式(6)所示
=1q∑qk=1k=1q∑qk=1(X,Sθkn)
(6)
圖1 隨機(jī)森林回歸結(jié)構(gòu)圖
軋制力作為熱連軋板型控制的重要指標(biāo),其設(shè)定值會(huì)影響初始輥縫的設(shè)定,因此準(zhǔn)確預(yù)測軋制力對(duì)熱軋的板型控制至關(guān)重要。RFR模型需設(shè)定決策樹數(shù)量和決策樹的最大深度,決策樹的數(shù)量和深度會(huì)影響算法的預(yù)測速度和擬合能力,因而存在因非最佳參數(shù)導(dǎo)致RFR模型預(yù)測精度受影響。本文采用PSO算法搜尋最優(yōu)的決策樹棵樹q和最大深度n_deep,確保RFR算法具有最優(yōu)的預(yù)測速度和預(yù)測結(jié)果。
PSO是一種啟發(fā)式群智算法,是由EBERHART和KENNEDY通過模擬鳥群捕食行為所提出[14]。算法將鳥群簡化為一群粒子,每一個(gè)粒子都被視為搜索空間中的一個(gè)個(gè)體,粒子所處位置即對(duì)應(yīng)優(yōu)化問題的解,粒子在空間中的運(yùn)動(dòng)即為搜索最優(yōu)解的過程。粒子飛行的速度可由個(gè)體歷史最優(yōu)位置和種群歷史最優(yōu)位置動(dòng)態(tài)調(diào)整,通過不斷迭代與更新得到滿足條件的最終解。
算法流程如下:
1)設(shè)置最大迭代次數(shù)m、種群規(guī)模n,隨機(jī)初始化速度和位置,粒子的最大速度和位置為整個(gè)搜索空間。
2)定義適應(yīng)度函數(shù),個(gè)體最優(yōu)解pbesti為每個(gè)粒子根據(jù)適應(yīng)度值搜尋到的最優(yōu)解,從個(gè)體最優(yōu)解中找到當(dāng)前代數(shù)的全局最優(yōu)解gbesti,與歷史數(shù)據(jù)對(duì)比并更新pbesti和gbesti。
3)迭代過程中粒子根據(jù)局部最優(yōu)和全局最優(yōu)解更新粒子速度與位置,更新公式如下所示
(7)
(8)
4)終止條件:①達(dá)到最大迭代次數(shù);②滿足相鄰代數(shù)之間誤差小于定值。
基于PSO-RFR模型的軋制力預(yù)測流程如圖2所示。
圖2 PSO-RFR軋制力預(yù)測流程圖
本文數(shù)據(jù)源于某板材廠2250mm熱軋產(chǎn)線,選取了2019年3月6日到8月20日的SPCC鋼種數(shù)據(jù)進(jìn)行分析處理。為驗(yàn)證本文所提方法的合理性及有效性,以2250mm熱連軋生產(chǎn)現(xiàn)場采集的2873組SPCC帶鋼的軋制數(shù)據(jù)為樣本。
經(jīng)過孤立森林異常值處理后得到2675組軋制數(shù)據(jù)。由于模型輸入?yún)?shù)量綱不一致會(huì)影響模型預(yù)測性能,因此對(duì)模型訓(xùn)練數(shù)據(jù)進(jìn)行歸一化處理。再使用相關(guān)系數(shù)法確定RFR模型的輸入數(shù)據(jù)。熱連軋生產(chǎn)中采集部分相關(guān)數(shù)據(jù)見表1。
表1 軋機(jī)部分主要參數(shù)
將預(yù)處理后的數(shù)據(jù)分為兩部分,將70%的樣本數(shù)據(jù)作為訓(xùn)練集,將30%的樣本數(shù)據(jù)作為測試集。訓(xùn)練集用于構(gòu)建預(yù)測模型,測試集用于測試構(gòu)建的預(yù)測模型的預(yù)測能力。
本文采用Python語言,構(gòu)建了基于PSO-RFR的軋制力預(yù)測模型。粒子群算法中粒子個(gè)數(shù)n=20,粒子代數(shù)m=50,適應(yīng)度函數(shù)為均方誤差函數(shù)。經(jīng)過粒子群優(yōu)化后得到RFR模型的最佳棵數(shù)q=91與最佳深度n_deep=252,使用該參數(shù)構(gòu)建RFR模型并對(duì)軋制力進(jìn)行預(yù)測。
圖3為PSO-RFR軋制力預(yù)測值、實(shí)測值與機(jī)理模型計(jì)算值對(duì)比圖,為了便于觀察,選取了前50組數(shù)據(jù)進(jìn)行繪制。由圖中可知,本文提出的PSO-RFR模型相比基于數(shù)學(xué)機(jī)理模型,本文提出的PSO-RFR模型在軋制力預(yù)測中預(yù)測精度更優(yōu)。對(duì)測試集中802塊樣本數(shù)據(jù)的預(yù)測結(jié)果進(jìn)行分析,發(fā)現(xiàn)預(yù)測誤差在±5%內(nèi)的命中率為97.7%。PSO-RFR的預(yù)測曲線與實(shí)測曲線基本吻合,能夠滿足生產(chǎn)中對(duì)軋制力預(yù)測的需求。一般而言,測試集在模型構(gòu)建中并沒有參與參數(shù)尋優(yōu),所以測試集的預(yù)測結(jié)果更能反映預(yù)測模型的預(yù)測性能。
圖3 PSO-RFR軋制力預(yù)測值、實(shí)測值與機(jī)理模型計(jì)算值對(duì)比圖
為了驗(yàn)證本文所提方法的有效性,將PSO-RFR模型與支持向量回歸(SVR)模型和多層感知器(MLP)模型進(jìn)行了對(duì)比。
SVR軋制力模型懲罰值設(shè)為39.23、松弛因子設(shè)為1.83、使用多項(xiàng)式核函數(shù)。由圖4可知,黑色虛線所夾區(qū)域中數(shù)據(jù)的誤差范圍在±5%以內(nèi),本文所構(gòu)建PSO-RFR預(yù)測模型預(yù)測結(jié)果中97.7%落在±5%內(nèi),SVR預(yù)測模型的誤差89.8%落在該范圍內(nèi)。通過散點(diǎn)圖與誤差統(tǒng)計(jì)體現(xiàn)了PSO-RFR模型在熱連軋軋制力預(yù)測中的優(yōu)勢。
圖4 PSO-RFR與SVR軋制力預(yù)測對(duì)比圖
MLP軋制力模型有2層隱層,激活函數(shù)使用ReLU函數(shù)。由圖5可知,MLP模型的預(yù)測效果弱于PSO-RFR模型預(yù)測效果。經(jīng)統(tǒng)計(jì)MLP模型誤差90.9%落在±5%范圍中,更進(jìn)一步體現(xiàn)了PSO-RFR模型在軋制力預(yù)測中的優(yōu)勢。
圖5 PSO-RFR與MLP軋制力預(yù)測對(duì)比圖
為評(píng)估預(yù)測模型的預(yù)測性能,選用平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和決定系數(shù)(R2)三項(xiàng)性能指標(biāo)對(duì)所建立的PSO-RFR、MLP、SVR預(yù)測模型進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果如表2所示。R2表明了模型的擬合能力,越接近1表明模型擬合程度越高。PSO-RFR模型的R2指標(biāo)均優(yōu)于其它兩種預(yù)測方法,表明該方法具有較好的擬合能力。MAE與RMSE都小于其它預(yù)測方法,表明了PSO-RFR模型改善了小樣本數(shù)據(jù)在軋制力預(yù)測中存在的不足,即小樣本數(shù)據(jù)中樣本數(shù)據(jù)分布不均衡導(dǎo)致訓(xùn)練模型在新數(shù)據(jù)預(yù)測時(shí)性能變差的問題。PSO-RFR相較于其它兩種方法預(yù)測時(shí)間最短,相較其它方法適用于高速的連軋生產(chǎn)。本文構(gòu)建的RFR預(yù)測模型提高了預(yù)報(bào)模型的準(zhǔn)確率,為熱軋操作者生產(chǎn)控制提供了參考依據(jù)。
表2 三種建模方法的預(yù)測結(jié)果對(duì)比
軋制力是熱軋環(huán)節(jié)中的重要參數(shù),對(duì)最終板形有很大的影響。本文采用孤立森林算法對(duì)現(xiàn)場生產(chǎn)數(shù)進(jìn)行預(yù)處理,提出了RFR軋制力預(yù)測模型,并采用了PSO算法對(duì)RFR模型中超參數(shù)進(jìn)行優(yōu)化。結(jié)果表明,本文所提模型預(yù)測誤差在±5%內(nèi)的命中率為97.7%,單次預(yù)測耗時(shí)1ms,相較于SVR,MLP模型具有預(yù)測精度高、預(yù)測時(shí)間短的優(yōu)點(diǎn)。該模型能很好地預(yù)測軋制力的變化規(guī)律,并滿足生產(chǎn)過程在線預(yù)測軋制力的要求。本文的研究對(duì)傳統(tǒng)機(jī)理模型不能處理非線性、多變量軋制力預(yù)測問題提供了新的研究方法。