摘 要:針對傳統(tǒng)軋制力預(yù)測模型存在的假設(shè)多、計算誤差大、泛化性能差的問題,提出一種利用蜣螂優(yōu)化算法(DBO)優(yōu)化深度極限學(xué)習(xí)機(DELM)的冷連軋軋制力預(yù)測模型(DBO-DELM)?;贐land-Ford-Hill軋制力模型分析,針對冷連軋各機架分別選取DELM軋制力預(yù)測模型的特征參數(shù);采用國內(nèi)某四機架冷連軋機組的實際生產(chǎn)數(shù)據(jù),在用蜣螂優(yōu)化算法優(yōu)化確定DELM的偏置和權(quán)重參數(shù)的基礎(chǔ)上,訓(xùn)練生成各機架的DBO-DELM軋制力預(yù)測模型。測試結(jié)果表明,DBO-DELM軋制力預(yù)測模型預(yù)測相對誤差在±5%以內(nèi)均可達77%以上,比現(xiàn)有MA-SVM、ELM-AE等模型在第二、第三機架上提高6%以上,第一、第四機架上提高10%以上。DBO-DELM軋制力預(yù)測模型在多個機架上相比于現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型在預(yù)測精度上有明顯的提高,并展現(xiàn)出良好的泛化能力,為冷連軋軋制力預(yù)測提供了一種有效的方法。
關(guān)鍵詞:冷軋;數(shù)據(jù)驅(qū)動模型;蜣螂優(yōu)化算法;深度極限學(xué)習(xí)機;軋制力預(yù)測
DOI:10.15938/j.jhust.2024.06.011
中圖分類號: TP183
文獻標志碼: A
文章編號: 1007-2683(2024)06-0112-12
DBO-DELM Method for Predicting Rolling Forces in Cold Rolling
LI Xiaoyang1,4, PIAO Chunhui1,4, WANG Xuelei2, ZHANG Mingzhi3,4
(1.School of Information Science and Technology, Shijiazhuang Tiedao University, Shijiazhuang 050043, China;
2.Shijiazhuang Yangwang Electromechanical Technology Co., Ltd., Shijiazhuang 051432, China;
3.Beijing National Railway Research amp; Design Institute of Signal amp; Communication Co., Ltd., Beijing 100070, China;
4.Hebei Key Laboratory for Electromagnetic Environmental Effects and Information Processing, Shijiazhuang 050043, China)
Abstract:Aiming at the problems of many assumptions, large computational errors and poor generalisation performance of the traditional rolling force prediction model, a cold rolling force prediction model (DBO-DELM) using the dung beetle optimizer algorithm (DBO) to optimise the deep extreme learning machine (DELM) is proposed. Based on the Bland-Ford-Hill rolling force model, the characteristic parameters of the DELM rolling force prediction model are selected for each frame of cold continuous rolling. Using the actual production data of a four- frame cold continuous rolling unit in China, the DBO-DELM rolling force prediction model for each frame is generated based on the optimisation of the bias and weight parameters of DELM by the dung beetle optimizer algorithm. The test results show that the relative error of the DBO-DELM rolling force prediction model can reach more than 77% within ±5%, which is more than 6% higher than that of the existing MA-SVM, DBN, ELM-AE models in the second and third frame, and more than 10% higher than that of the first and fourth frame. In summary, the DBO-DELM rolling force prediction model has obvious improvement in prediction accuracy compared with the existing neural network model in multiple frames and shows good generalisation ability, which provides an effective method for the rolling force prediction in cold continuous rolling.
Keywords:cold rolling; data-driven modelling; dung beetle optimizer; deep extreme learning machine; rolling force prediction
收稿日期: 2023-06-30
基金項目: 河北省重點研發(fā)計劃項目(21355902D).
作者簡介:
李曉陽(1999—),男,碩士研究生;
王雪雷(1985—),男,碩士.
通信作者:
樸春慧(1964—),女,博士,教授,E-mail:pchls2011@126.com.
0 引 言
隨著工業(yè)化的快速發(fā)展,越來越多的行業(yè)對帶鋼質(zhì)量的要求日益提升,如基礎(chǔ)設(shè)施建設(shè)、汽車制造、機械加工、電子電氣、航空航天等,因此提升帶鋼質(zhì)量成為冷軋生產(chǎn)過程中的首要任務(wù)[1]。其中,軋制力預(yù)測精度對軋制成品的質(zhì)量和效率有著直接影響,是影響帶鋼質(zhì)量的重要因素之一[2]。然而,傳統(tǒng)軋制力模型為簡化計算流程,往往需要設(shè)置較多的假設(shè)和簡化,如假設(shè)軋輥彈性壓扁后接觸弧仍保持圓弧形等,這些假設(shè)和簡化只能夠提供初步的估算和理論基礎(chǔ),用于設(shè)計和分析冷軋軋制過程中的力學(xué)行為。實際軋制過程會受到諸多復(fù)雜因素的影響,如材料的非線性行為和輥縫摩擦等,這些因素可能需要更復(fù)雜的模型進行分析和計算。同時,傳統(tǒng)軋制力計算模型存在非線性、強耦合和不確定性等特點,如摩擦系數(shù)和變形抗力難以實時測量,并且難以用理論模型精確描述。因此,傳統(tǒng)軋制力計算模型的計算精度有限,適用范圍較窄,難以滿足工廠在實際軋制過程中對多規(guī)格產(chǎn)品高質(zhì)量化生產(chǎn)的需求[3]。
近年來,隨著神經(jīng)網(wǎng)絡(luò)、智能優(yōu)化算法等人工智能方法的不斷發(fā)展,越來越多的學(xué)者開始嘗試利用神經(jīng)網(wǎng)絡(luò)來預(yù)測軋制力[4]。相比于傳統(tǒng)軋制力計算模型,神經(jīng)網(wǎng)絡(luò)可以快速高效地處理大量數(shù)據(jù),并從中學(xué)習(xí)模式和規(guī)律,預(yù)測結(jié)果更為準確。建立適當?shù)纳窠?jīng)網(wǎng)絡(luò)模型可以提高軋制工藝的效率和質(zhì)量,同時減少對經(jīng)驗和人力的依賴,具有重要的實際意義[5]。魏立新等[6]提出一種基于非監(jiān)督學(xué)習(xí)的改進深度信念網(wǎng)絡(luò)預(yù)測模型,該模型對軋制力預(yù)測的平均相對誤差控制在4.5%以內(nèi)。章順虎等[7]通過將理論模型與神經(jīng)網(wǎng)絡(luò)模型相結(jié)合,構(gòu)建了一種高精度的GA-BP模型,將最大預(yù)測誤差降至3.95%。張海霞等[8]設(shè)計實現(xiàn)了一種通過分層提取和目標相關(guān)特征來實現(xiàn)的比例損失堆疊去噪自編碼器,將模型預(yù)測結(jié)果控制在±3%誤差內(nèi)。孫浩等[9]提出了一種基于循環(huán)自編碼網(wǎng)絡(luò)的軋制力預(yù)測模型,通過引入小批量訓(xùn)練方法和高斯過程回歸模型,使得模型預(yù)測精度可達3%以內(nèi)。李京棟等[10]將軋制力計算模型的計算值作為T-S模糊神經(jīng)網(wǎng)絡(luò)的輸入,以此構(gòu)建了一種組合軋制力預(yù)測模型,進一步提高了軋制力的計算精度和可靠性。陳樹宗等[11]提出了一種基于蜉蝣算法優(yōu)化支持向量機的冷軋軋制力預(yù)測模型,使得模型軋制力預(yù)測值與實際值誤差在±5%的準確率為98.5%。王曉東等[12]提出了一種利用廣義回歸GRNN神經(jīng)網(wǎng)絡(luò)構(gòu)建軋制力預(yù)測模型的方法,使得預(yù)測結(jié)果相對偏差的標準差在12%左右。以上的神經(jīng)網(wǎng)絡(luò)模型往往因其結(jié)構(gòu)較為復(fù)雜,易出現(xiàn)過擬合、訓(xùn)練時間長和易陷入局部最優(yōu)解等問題。
極限學(xué)習(xí)機(extreme learning machine,ELM)是一種高效的機器學(xué)習(xí)算法,具有快速、靈活、避免維數(shù)災(zāi)難和泛化能力強等優(yōu)點[13]。張志強等[14]提出一種基于改進ELM-AE冷軋軋制力預(yù)測方法,預(yù)測結(jié)果中85%的數(shù)據(jù)在±5%的誤差范圍內(nèi)。魏立新等[15]提出一種改進OS-ELM的冷連軋在線軋制力預(yù)報方法,其中使用ELM構(gòu)建變形抗力模型,并采用CDOS-ELM建立了軋制力模型,使得模型預(yù)測誤差在2%以內(nèi)。冀秀梅等[16]提出一種基于極限學(xué)習(xí)機的綜合神經(jīng)網(wǎng)絡(luò)軋制力預(yù)報模型,該模型預(yù)測軋制力相對誤差±10%以內(nèi)占比為94.52%,比傳統(tǒng)軋制力模型提高了15.61%。劉悅等[17]設(shè)計實現(xiàn)了一種具有拓撲結(jié)構(gòu)自組織的極限學(xué)習(xí)機(TSO-ELM)算法,使得80%的軋制力預(yù)測數(shù)據(jù)在±5%誤差線內(nèi)。郭城等[18]建立了一種基于粒子群算法優(yōu)化極限學(xué)習(xí)機的軋制力預(yù)測模型,將軋制力預(yù)測的平均相對誤差控制在2.2%以內(nèi)。陳樹宗等[19]提出了一種基于遺傳算法優(yōu)化反饋極限學(xué)習(xí)機算法的冷軋軋制力預(yù)測模型,使得85%以上的樣本點的相對誤差控制在±5%誤差帶之內(nèi),預(yù)測絕對誤差位于±30 t以內(nèi)。
但上述優(yōu)化算法和模型在實際應(yīng)用時均存在一定的不足,如設(shè)置參數(shù)復(fù)雜、訓(xùn)練時間長、易陷入局部最優(yōu)等,而蜣螂優(yōu)化算法(dung beetle optimizer,DBO)[20]相較于之前的優(yōu)化算法,通過模仿蜣螂的5種行為,來確保對搜索空間的充分探索和局部地區(qū)的開發(fā),可以及時跳出局部最優(yōu)值,加快模型訓(xùn)練時間。因此,本文采用DBO算法對DELM模型中的偏置與權(quán)重進行全局尋優(yōu),來訓(xùn)練生成DBO-DELM軋制力預(yù)測模型, 以檢驗DBO算法在冷軋軋制力預(yù)測上精度高、泛化能力強等優(yōu)點。
1 軋制力計算模型
典型的軋制力計算模型有斯通模型、采利柯夫模型、柯洛遼夫模型和布蘭特-福特(Bland-Ford)模型等[21]。其中,斯通模型近似將薄板的軋制過程簡化為兩平板之間的壓縮過程,并假設(shè)接觸表面上的摩擦力符合干摩擦定律,但未將彈性變形納入考慮范圍[22]。柯洛遼夫認為對冷軋可認為接觸弧為直線,用接觸弧的弦來代替弧??侣暹|夫簡化張力影響的采利柯夫公式,其將張力因素分離出來。Bland-Ford軋制力數(shù)學(xué)模型在斯通模型的基礎(chǔ)上,全面考慮了外摩擦、前后張力、軋輥彈性壓扁等因素對軋制力計算精度的影響[23],但在計算壓扁后的外摩擦應(yīng)力狀態(tài)系數(shù)時,需要通過數(shù)值積分計算多個積分項,計算過程復(fù)雜且無法保證得出高精度結(jié)果。Hill等[24]通過大量的實驗對壓扁后的外摩擦應(yīng)力狀態(tài)系數(shù)進行簡化得到Bland-Ford-Hill模型。Bland-Ford-Hill模型將前后張力、軋輥的彈性變形、軋件的塑性變形等納入影響軋制力的因素中,更加接近真實的軋制情況,于是被廣泛應(yīng)用。其一般形式表示為
P=BlcQpKTK(1)
其中:P為軋制力;B為帶鋼寬度;lc為壓扁后變形區(qū)接觸弧長;Qp為壓扁后的外摩擦應(yīng)力狀態(tài)系數(shù);KT為張力影響系數(shù);K為變形抗力。
lc=R′Δh(2)
R′=(1+C0PBΔh)R(3)
Δh=h0-h(huán)1
其中:R為軋輥半徑;R′為壓扁后軋輥半徑;C0為軋輥壓扁系數(shù),一般取2.2×10-5;h0為入口厚度;h1為出口厚度。
Qp=1.08+1.79με1-εR′h1-1.02ε(5)
其中:ε為壓下率;r=1-h(huán)1/h0;μ為摩擦系數(shù)。
KT=(1-tbK)(1.05+0.1×1-tfK1-tbK-0.15×1-tbK1-tfK)(6)
其中:tf、tb分別為入口張力和出口張力。
根據(jù)上述公式推導(dǎo),計算軋制力時需要考慮壓扁后軋輥半徑,然而,在計算壓扁后軋輥半徑時又需要知道軋制力,這兩者相互依賴。同時,軋制力計算模型所需的摩擦系數(shù)和變形抗力是通過回歸分析實測數(shù)據(jù)得出的,而實測數(shù)據(jù)則是一些服從正態(tài)分布的隨機變量,回歸方程本身也存在誤差。在軋制過程中,許多因素是不斷變化的,例如隨著軋制進行,軋輥表面的光潔度會因磨損而降低,從而增加摩擦系數(shù),同時軋輥直徑也會逐漸減小。相反地,金屬的變形和由摩擦產(chǎn)生的熱量會導(dǎo)致軋輥直徑逐漸增大,然而,摩擦系數(shù)無法直接測量,而軋輥半徑在軋制過程中也無法進行實時測量,因此通常將它們視為常數(shù)進行處理。這種處理方式導(dǎo)致數(shù)學(xué)模型無法準確反映軋制過程中的狀態(tài)變化,從而產(chǎn)生預(yù)測誤差。因此,本文提出了基于DBO-DELM模型的方法,通過學(xué)習(xí)歷史軋制數(shù)據(jù),試圖將軋制過程中存在的因素融入軋制力計算模型中?;诖耍槍γ總€機架分別訓(xùn)練生成冷連軋DBO-DELM軋制力預(yù)測模型,以提高軋制力計算的效率。
2 相關(guān)理論
2.1 深度極限學(xué)習(xí)機
極限學(xué)習(xí)機是Huang等[25]根據(jù)廣義逆矩陣理論提出的一種新型的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)算法。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,ELM通過隨機產(chǎn)生或人為設(shè)定隱藏層節(jié)點權(quán)重,在學(xué)習(xí)過程中僅需計算輸出權(quán)重,顯著提高了模型的學(xué)習(xí)速率和泛化能力[26]。
由于ELM是單隱藏層結(jié)構(gòu),當原始數(shù)據(jù)中存在較大噪聲或數(shù)據(jù)維度過高時,則會出現(xiàn)無法捕捉到數(shù)據(jù)有效特征的情況。針對此類問題,Kasun等[27]提出將自編碼器(auto encoder, AE)與極限學(xué)習(xí)機相結(jié)合,組成極限學(xué)習(xí)機-自編碼器(ELM-AE),然后將多個ELM-AE模塊堆棧組成深度極限學(xué)習(xí)機(DELM),從而進一步提高模型的預(yù)測精度和泛化能力。具體結(jié)構(gòu)如圖1所示。
根據(jù)輸入數(shù)據(jù)的維度和隱藏層神經(jīng)元個數(shù)的不同,ELM-AE可以實現(xiàn)壓縮表示、稀疏表示和等維表示[28]。
當ELM-AE的輸入層節(jié)點數(shù)量為m,隱藏層神經(jīng)元個數(shù)為n時,若m=n,則實現(xiàn)等維表示,隱藏層輸出權(quán)值β可表示為
β=H-1T(7)
式中:H為隱藏層輸出矩陣;T為目標輸出矩陣。
若mgt;n,則實現(xiàn)壓縮表示;若mlt;n,則實現(xiàn)稀疏表示。對于壓縮表示和稀疏表示,隱藏層輸出權(quán)值β可表示為
β=(EC+HTH)-1HTX(8)
式中:E為單位矩陣;X為輸入矩陣;C為正則化系數(shù)。
在模型訓(xùn)練時,首先需要用輸入數(shù)據(jù)訓(xùn)練第1層隱藏層,通過第1個ELM-AE得到輸出權(quán)重矩陣,然后,將輸出權(quán)重矩陣作為第2個ELM-AE的輸入,以此類推。前一層ELM-AE的隱藏層輸出作為后一層ELM-AE的輸入,依次逐層訓(xùn)練,最終得到最后一層的輸出權(quán)值矩陣。
2.2 蜣螂優(yōu)化算法
蜣螂優(yōu)化算法由東華大學(xué)的沈波教授于2022年底提出,是一種全新群體智能優(yōu)化算法,其基本思想主要受蜣螂滾球、跳舞、覓食、偷竊和繁殖行為的啟發(fā),以此設(shè)計實現(xiàn)了5種不同的更新規(guī)則,來進行全局搜索和局部利用。DBO算法主要由以下部分組成:
1)滾球行為
在自然界中,蜣螂的滾球行為往往需要通過天體線索來保持糞球在直線上滾動,假設(shè)光源的強度會影響蜣螂的路徑,所以在滾球過程中,蜣螂的位置更新如公式(9)所示:
xi(t+1)=xi(t)+αkxi(t-1)+bΔx,
Δx=|xi(t)-Xw|(9)
其中:t為當前迭代次數(shù);xi(t)為第i只蜣螂在第t次迭代時的位置;k∈(0,0.2]為偏轉(zhuǎn)系數(shù);b∈(0,1);α隨機初始化為-1或1,1表示無偏差,-1表示偏離原方向;Xw為全局最差位置;|xi(t)-Xw|用于模擬光強的變化。
2)跳舞行為
當蜣螂在滾球時如遇到障礙物,則會通過跳舞來調(diào)整方向,以獲得新的路線。通過使用切線函數(shù)來模仿蜣螂的跳舞行為,如公式(10)所示:
xi(t+1)=xi(t)+tan(θ)|xi(t)-xi(t-1)|(10)
當θ=0,π2或π時,tan(θ)為0或沒有意義,蜣螂的位置不會更新,此處假設(shè)θ∈[0,π]。
3)產(chǎn)卵行為
在自然界中,雌性蜣螂將糞球滾到適合產(chǎn)卵的安全區(qū)域并將其隱藏,來為后代提供一個安全環(huán)境,以式(11)模擬雌性蜣螂的產(chǎn)卵區(qū)域:
L*b=max(X*(1-R),Lb)
U*b=min(X*(1+R),Ub)(11)
其中:R=1-t/T,T為最大迭代次數(shù);Lb和Ub為優(yōu)化問題的下界和上界;L*b和U*b為產(chǎn)卵蜣螂活動區(qū)域的下界和上界;X*為當前局部最優(yōu)位置。
隨著迭代的進行,卵球的位置一直在更新,如公式(12)所示:
Bi(t+1)=X*+b1(Bi(t)-L*b)+b2(Bi(t)-U*b)(12)
其中:Bi(t)為第i個卵球在第t次迭代時的位置;b1和b2為一個1×D的隨機向量,D表示優(yōu)化問題的維數(shù)。
4)覓食行為
針對小蜣螂的覓食行為,基于式(13)設(shè)置最優(yōu)覓食區(qū)域:
Lbb=max(Xb(1-R),Lb)
Ubb=min(Xb(1+R),Ub)(13)
其中:Xb為全局最佳位置;Lbb和Ubb為小蜣螂活動區(qū)域的下界和上界。
小蜣螂的移動位置如式(14)所示:
xi(t+1)=xi(t)+C1(xi(t)-Lbb)+C2(xi(t)-Ubb)(14)
其中:C1∈(0,1),且服從正態(tài)分布,C2∈(0,1)是一個1×D的隨機向量。
5)偷竊行為
在種群中,會有一些蜣螂從其他蜣螂那里偷糞球,將偷竊蜣螂的位置更新如式(15)所示:
xi(t+1)=Xb+Sg(|xi(t)-X*|+|xi(t)-Xb|)(15)
其中:g為一個1×D的隨機向量,且服從正態(tài)分布;S為一個常數(shù)。
3 DBO-DELM軋制力預(yù)測模型
冷連軋生產(chǎn)是一種多鋼種、多規(guī)格混雜的帶鋼連續(xù)軋制過程,傳統(tǒng)機器學(xué)習(xí)方法雖然具有較強的擬合能力和快速學(xué)習(xí)速度,但由于是淺層模型,無法進行深層次的特征提取,導(dǎo)致部分有用信息丟失,從而無法達到理想的預(yù)測與泛化效果,也無法滿足高精度預(yù)測的需求。為了解決這一問題,提出采用深度極限學(xué)習(xí)機(DELM)模型。DELM結(jié)合了機器學(xué)習(xí)和深度學(xué)習(xí)的優(yōu)點,具有快速學(xué)習(xí)速度,并且能夠很好地擬合非線性關(guān)系。
根據(jù)原理部分的介紹,DELM由多個ELM-AE部分疊加而成,其權(quán)重和偏置采用了隨機初始化的方式,導(dǎo)致了DELM的預(yù)測效果可能會不穩(wěn)定。為了提高整體模型的泛化性能,提出了一種基于蜣螂優(yōu)化算法的自適應(yīng)參數(shù)調(diào)整方法,以優(yōu)化DELM模型的關(guān)鍵參數(shù)。蜣螂優(yōu)化算法將問題參數(shù)轉(zhuǎn)化為可優(yōu)化的形式,使得DELM模型能夠根據(jù)輸入數(shù)據(jù)的不同特性自動調(diào)整參數(shù),從而提高預(yù)測效果。以訓(xùn)練集的均方誤差(MSE)作為適應(yīng)度函數(shù)來指導(dǎo)蜣螂優(yōu)化算法的搜索過程,確保每次迭代都朝著更好的預(yù)測方向前進。
3.1 數(shù)據(jù)預(yù)處理階段
將原始軋制數(shù)據(jù)按照實際生產(chǎn)時間,將前80%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,后20%的數(shù)據(jù)作為測試數(shù)據(jù)集,并以訓(xùn)練數(shù)據(jù)集的特征集和標簽集的均值和標準差作為參考,分別對訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集進行Z-score 函數(shù)標準化,函數(shù)如下所示:
z=x-uσ(16)
其中:z為標準化結(jié)果;x為樣本的數(shù)據(jù);u為x所在列的均值;σ為x所在列的標準差。
3.2 DBO-DELM模型訓(xùn)練階段
在本研究中,設(shè)計實現(xiàn)了DBO-DELM軋制力預(yù)測模型,該模型的訓(xùn)練階段整體流程如圖2所示,其詳細步驟如下:
步驟1:模型參數(shù)設(shè)定與種群初始化
設(shè)定DBO最大迭代次數(shù)、種群數(shù)量、蜣螂類別比例和邊界參數(shù),DELM模型的輸入層神經(jīng)元數(shù)量、輸出層神經(jīng)元數(shù)量、隱藏層層數(shù)、每個隱藏層的神經(jīng)元數(shù)量等網(wǎng)絡(luò)拓撲結(jié)構(gòu)參數(shù),以及DELM模型的正則化系數(shù)和激活函數(shù),并基于DELM網(wǎng)絡(luò)拓撲結(jié)構(gòu)參數(shù)對蜣螂優(yōu)化算法進行種群初始化。
步驟2:計算DBO初始種群適應(yīng)度值
根據(jù)步驟1預(yù)設(shè)的網(wǎng)絡(luò)拓撲結(jié)構(gòu),初始化DELM模型并將DBO初始種群位置逐層賦值給每個ELM-AE模塊。然后,使用訓(xùn)練數(shù)據(jù)集利用無監(jiān)督學(xué)習(xí)的方法逐層預(yù)訓(xùn)練每個ELM-AE模塊,得到ELM-AE模型的輸出權(quán)重矩陣。接著,通過訓(xùn)練數(shù)據(jù)集的標簽集來求解DELM模型的輸出層權(quán)重矩陣。在此基礎(chǔ)上,計算訓(xùn)練數(shù)據(jù)集的軋制力預(yù)測值,并基于軋制力的均方誤差計算DBO初始種群適應(yīng)度值,最后計算DBO初始種群的全局最小適應(yīng)度值及其最優(yōu)位置。
步驟3:基于DBO算法思想更新蜣螂個體位置
利用式(9)和式(10)更新滾球蜣螂位置,利用式(12)更新產(chǎn)卵蜣螂位置,利用式(14)更新覓食蜣螂位置,利用式(15)更新偷竊蜣螂位置。
步驟4:計算迭代更新中的DBO種群適應(yīng)度值
將更新后的DBO種群位置分配給每個ELM-AE模塊,進行逐層無監(jiān)督預(yù)訓(xùn)練,得到ELM-AE模型的輸出權(quán)重矩陣,再通過訓(xùn)練數(shù)據(jù)集的標簽集更新DELM模型的輸出層權(quán)重矩陣。在此基礎(chǔ)上,更新訓(xùn)練數(shù)據(jù)集的軋制力預(yù)測值,根據(jù)軋制力預(yù)測值和實際值的均方誤差計算當前迭代的DBO種群的適應(yīng)度值。如果當前迭代中的DBO種群適應(yīng)度值小于上一輪迭代中保存的DBO種群適應(yīng)度值,則更新當前種群的適應(yīng)度值和位置參數(shù);否則,保留上一輪的信息。最后,記錄當前種群信息中的最小適應(yīng)度值以及最優(yōu)位置參數(shù)。
步驟5:終止條件控制
檢查是否滿足終止條件,此處一般通過設(shè)置迭代次數(shù)作為終止條件[29]。若當前迭代次數(shù)達到最大迭代次數(shù),則終止迭代并輸出DBO種群的全局最優(yōu)位置;否則,則繼續(xù)進行步驟3和步驟4,以進一步優(yōu)化模型參數(shù)。
步驟6:DELM模型輸出預(yù)測結(jié)果
使用步驟5中獲得的DBO種群的全局最優(yōu)位置,逐層分配給DELM模型的每個ELM-AE模塊,然后在訓(xùn)練數(shù)據(jù)集的特征集上進行逐層無監(jiān)督預(yù)訓(xùn)練,以獲得每個ELM-AE模塊的輸出權(quán)重矩陣。接著,通過使用訓(xùn)練數(shù)據(jù)集的標簽集,求解DELM模型的輸出層權(quán)重矩陣,生成DBO-DELM模型的輸出層權(quán)重矩陣。
4 模型預(yù)測與分析
本文以國內(nèi)某四機架冷連軋機組生產(chǎn)線軋制過程中連續(xù)50天的4184條高速數(shù)據(jù)作為樣本數(shù)據(jù),鋼種號均為Q195,部分數(shù)據(jù)如表1所示。針對數(shù)據(jù)中存在的異常值數(shù)據(jù),采用3σ原則對相同帶鋼寬度和來料厚度的數(shù)據(jù)進行異常值處理。
針對多輸入單輸出的DBO-DELM軋制力預(yù)測模型,通過對Bland-Ford-Hill軋制力計算模型分析,按照機架號分別選取對應(yīng)的帶鋼寬度、來料厚度、入口厚度、出口厚度、軋制速度、入口張力、出口張力、軋輥直徑、軋制里程這9個變量作為模型的輸入特征,對應(yīng)機架的軋制力作為模型的輸出。
對多輸入單輸出的各機架DBO-DELM軋制力預(yù)測模型均設(shè)置蜣螂優(yōu)化算法的最大迭代次數(shù)為100,種群規(guī)模為30,滾球蜣螂、產(chǎn)卵蜣螂、小蜣螂和偷竊蜣螂的比例為6∶6∶7∶11。深度極限學(xué)習(xí)機采用兩層隱藏層,其網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置為9-12-7-1,選取Relu函數(shù)作為激活函數(shù),避免了Sigmoid等激活函數(shù)由于飽和非線性特性造成的梯度彌散現(xiàn)象。基于上述參數(shù),針對各機架的DBO-DELM軋制力預(yù)測模型進行訓(xùn)練和測試。其中,各機架的DBO-DELM模型在訓(xùn)練過程中利用DBO算法進行適應(yīng)度迭代的情況如圖3所示,在測試過程中預(yù)測的軋制力與實際軋制力相比,處于±10%誤差線以內(nèi)的效果如圖4所示。
由圖3可得,蜣螂優(yōu)化算法在做單一機架優(yōu)化時,迭代次數(shù)在60次左右時,DELM模型得到最優(yōu)權(quán)重和偏置參數(shù),各機架最優(yōu)種群的適應(yīng)度值分別為0.1290、0.1399、0.1291、0.1771,且后續(xù)均未發(fā)生變化。由此可得,針對各機架的DBO-DELM軋制力預(yù)測模型設(shè)置的蜣螂優(yōu)化算法參數(shù)均較為合適,可以使DELM模型實現(xiàn)收斂。
由圖4可得,DBO-DELM軋制力預(yù)測模型在各機架上預(yù)測效果均較為理想預(yù)測,相對誤差在±10%以內(nèi)均可達96%以上,只有少量數(shù)據(jù)在±10%誤差線以外。其中,第一、第三機架相對于第二、第四機架在±10%誤差線以內(nèi)的數(shù)據(jù)更多,主要原因為第一、第三機架軋制力數(shù)據(jù)相對分布更集中,第二、第四機架軋制力數(shù)據(jù)相對分布更為分散,使得DBO-DELM軋制力預(yù)測模型對第一、第三機架的效果更好。
與此同時,為證明DBO-DELM模型在冷連軋軋制力預(yù)測的實際應(yīng)用中的優(yōu)勢,本文與現(xiàn)有的冷軋計算模型MA-SVM[11]、POS-ELM[18]、DBN[6]、ELM-AE[14]和Bland-Ford-Hill[24]進行對比實驗分析。同時,添加DBO-ELM和ELM模型來輔助證明深度極限學(xué)習(xí)機具有更好的特征提取能力。為保證實驗結(jié)果的可對比性,對比模型均使用與DBO-DELM模型相同的訓(xùn)練集與測試集。選取相對誤差≤5%、相對誤差≤10%、均方根誤差RMSE/kN和平均絕對百分比誤差MAPE/%作為模型評價指標。各模型的實驗結(jié)果如表2、3、4、5所示。
由表2可得,在第1機架上,DBO-DELM、DBO-ELM、POS-ELM和DBN在相對誤差≤10%時,模型準確率相近,但在評價指標相對誤差≤5%和MAPE上,DBO-DELM模型遠優(yōu)于其他模型。次優(yōu)模型ELM-AE在評價指標相對誤差≤5%、相對誤差≤10%和MAPE上相對于DBN和POS-ELM較差,但在評價指標RMSE上優(yōu)于DBN和POS-ELM,說明ELM-AE模型在進行整體數(shù)據(jù)預(yù)測較好,但在處理每條數(shù)據(jù)時,
模型的預(yù)測性能相對于DBN和POS-ELM較差。
由表3可得,在第2機架上,DBO-DELM模型在每個評價指標上均遠優(yōu)于其他模型,在相對誤差≤5%和≤10%分別為77.78%和96.30%,在準確性要求較高的相對誤差≤5%的情況下仍保持著較高的準確率。次優(yōu)模型ELM-AE與第1機架相同,在評價指標相對誤差≤5%和相對誤差≤10%上,較DBO-ELM 、POS-ELM和ELM模型表現(xiàn)較差,但在評價指標RMSE上優(yōu)于其他模型。
由表4可得,在第3機架上,數(shù)據(jù)相對較為平穩(wěn),各模型相對于其他3個機架均表現(xiàn)較好,但DBO-DELM模型在每個評價指標上仍較優(yōu)于其他模型,在評價指標相對誤差≤5%和≤10%上分別為84.47%和97.25%。次優(yōu)模型MA-SVM相對其他機器學(xué)習(xí)模型更突出。這歸因于SVM模型的核函數(shù)在處理平穩(wěn)數(shù)據(jù)時具有優(yōu)勢,有助于更好地捕捉數(shù)據(jù)內(nèi)在結(jié)構(gòu),提高了預(yù)測準確性。
由表5可得,因第4機架的軋制變化較為復(fù)雜, DBN、MA-SVM、ELM-AE和ELM均表現(xiàn)較差,但DBO-DELM、DBO-ELM和POS-ELM模型的預(yù)測效果遠優(yōu)于其他模型,證明了利用智能優(yōu)化算法優(yōu)化極限學(xué)習(xí)機可以為復(fù)雜的冷軋軋制力預(yù)測提供較好的泛化性能,當其他模型在測試集上表現(xiàn)不佳時,此類模型仍可表現(xiàn)出較好的泛化能力。
由表2~5可得,DBO-DELM軋制力預(yù)測模型在各機架上表現(xiàn)均優(yōu)于對比實驗。相對于現(xiàn)有MA-SVM、POS-ELM和ELM-AE模型,DBO-DELM模型的預(yù)測相對誤差≤5%,在第2和第3機架上提高6%以上,在第1和第4機架上提高10%以上。主要原因是在四機架冷連軋機組中,第1、4機架作為主要軋制機架,負責(zé)板厚控制,第2、3機架負責(zé)板形控制,而DBO-DELM軋制力預(yù)測模型在第1、4機架上效果更為優(yōu)異,說明其在冷連軋實際應(yīng)用具有良好的適用性。通過對比DBO-DELM、DBO-ELM、POS-ELM和ELM模型可得,深度極限學(xué)習(xí)機相比于極限學(xué)習(xí)機具有更好的數(shù)據(jù)特征提取能力,預(yù)測精度更高,以及蜣螂優(yōu)化算法優(yōu)化極限學(xué)習(xí)機的效果要優(yōu)于粒子群算法優(yōu)化極限學(xué)習(xí)機和未經(jīng)智能算法優(yōu)化的極限學(xué)習(xí)機,進一步證明了本文選取蜣螂優(yōu)化算法優(yōu)化深度極限學(xué)習(xí)機的原因。
通過對比DBO-DELM模型和傳統(tǒng)的Bland-Ford-Hill軋制力計算模型,發(fā)現(xiàn)DBO-DELM模型在各機架上取得了較高的提升效果。相對于Bland-Ford-Hill模型,DBO-DELM模型在第1機架上將相對誤差≤5%提高了25%,相對誤差≤10%提高了12%;在第2機架上將相對誤差≤5%提高了25%,相對誤差≤10%提高了8%;在第3機架上將相對誤差≤5%提高了14%,相對誤差≤10%提高了5%;在第4機架上將相對誤差≤5%提高了64%,相對誤差≤10%提高了56%。主要原因是因為傳統(tǒng)軋制力模型計算時,需要依賴于摩擦系數(shù)模型、變形抗力模型和張力模型。而摩擦系數(shù)和變形抗力模型是基于數(shù)據(jù)構(gòu)建的,本身就存在一定誤差,隨著機架越靠后,預(yù)測軋制力的誤差就越會被放大,導(dǎo)致軋制力預(yù)測精度就會越低。而DBO-DELM模型通過神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的學(xué)習(xí)能力,成功彌補了傳統(tǒng)軋制力模型的這一不足,進一步提高了模型的精度,可以更好地適應(yīng)不同機架下板帶的變形特性,從而提供更準確的軋制力預(yù)測結(jié)果。
5 結(jié) 論
針對傳統(tǒng)軋制力預(yù)測模型存在的假設(shè)多、計算誤差大、泛化性能差的問題,本文提出了一種改進方法,即通過引入蜣螂優(yōu)化算法來解決深度極限學(xué)習(xí)機中的偏置與輸入權(quán)重問題,從而提高了DELM模型的收斂精度。在此基礎(chǔ)上,針對冷連軋的各個機架,分別訓(xùn)練了DBO-DELM軋制力預(yù)測模型。由于深度極限學(xué)習(xí)機具有較深的網(wǎng)絡(luò)層次,增強了數(shù)據(jù)的特征提取能力,因此相較于對比模型,DBO-DELM模型在預(yù)測精度和泛化能力方面表現(xiàn)出顯著優(yōu)勢。綜合考慮,本文的DBO-DELM軋制力預(yù)測模型在冷連軋領(lǐng)域具有一定的應(yīng)用價值,并為冷連軋的工藝優(yōu)化和生產(chǎn)效率提升提供了一種可行的工具和方法。
在未來工作中需進一步探討的問題:當預(yù)測樣本與訓(xùn)練樣本存在較大差異時,需定期訓(xùn)練模型或采用增量學(xué)習(xí)的方法來訓(xùn)練新數(shù)據(jù)。
參 考 文 獻:
[1] 康永林. “十三五”中國軋鋼技術(shù)進步及展望[J].鋼鐵, 2021, 56(10): 1.
KANG Yonglin. China Steel Rolling Technology Progress in the 13th Five-year Plan and Prospection[J]. Iron amp; Steel, 2021, 56(10): 1.
[2] 賈曉飛, 薛為林. 冷軋板帶材生產(chǎn)技術(shù)現(xiàn)狀及發(fā)展方向[J].產(chǎn)業(yè)創(chuàng)新研究, 2022, 91(14): 142.
JIA Xiaofei, XUE Weilin. Cold Rolled Plate and Strip Production Technology Status and Development Direction[J]. Industrial Innovation, 2022, 91(14): 142.
[3] 王濤, 齊艷陽, 劉江林, 等. 金屬層合板軋制復(fù)合工藝國內(nèi)外研究進展[J].哈爾濱工業(yè)大學(xué)學(xué)報, 2020, 52(6): 42.
WANG Tao, QI Yanyang, LIU Jianglin, et al.Research Progress of Metal Laminates Roll Bonding Process at Home and Abroad[J]. Journal of Harbin Institute of Technology, 2020, 52(6): 42.
[4] 魏志鵬, 崔桂梅, 皮理想, 等. DE-RF與模糊模型在熱軋帶鋼板坯彎曲控制中的應(yīng)用[J].哈爾濱理工大學(xué)學(xué)報, 2023, 28(2): 51.
WEI Zhipeng, CUI Guimei, PI Lixiang, et al. Application of DE-RF and Fuzzy Model in Camber Control of Hot Rolled Strip[J]. Journal of Harbin University of Science and Technology, 2023, 28(2): 51.
[5] 王楷, 梅瑞斌. “人工智能+有限元”模型在軋制領(lǐng)域的研究進展[J].材料導(dǎo)報, 2022, 36(13): 137.
WANG Kai, MEI Reibin. On the Research and Application of “Artificial Intelligence Plus Finite Element” Models in the Field of Rolling[J]. Materials Reports, 2022, 36(13): 137.
[6] 魏立新,王恒,孫浩,等.基于改進深度信念網(wǎng)絡(luò)訓(xùn)練的冷軋軋制力預(yù)報[J].計量學(xué)報, 2021, 42(7): 906.
WEI Lixin, WANG Heng, SUN Hao, et al. Research on Cold Rolling Force Prediction Model Based on Improved Deep Belief Network[J]. Acta Metrologica Sinica, 2021, 42(7): 906.
[7] ZHANG Shunhu, DENG Lei, CHE Lizhi. An Integrated Model of Rolling Force for Extra-thick Plate by Combining Theoretical Model and Neural Network Model[J]. Journal of Manufacturing Processes, 2022, 75: 100.
[8] 張海霞,李燦.基于比例損失去噪自編碼器的冷連軋軋制力預(yù)測分析[J].鍛壓技術(shù), 2022, 47(4): 190.
ZHANG Haixia, LI Can. Rolling Force Prediction Analysis of Tandem Cold Rolling Based on Proportional Loss Denoising Autoencoder[J]. Forging amp; Stamping Technology, 2022, 47(4): 190.
[9] 孫浩, 葉國良, 翟博豪, 等.基于循環(huán)自編碼網(wǎng)絡(luò)的冷軋軋制力建模方法[J].計量學(xué)報, 2022, 43(9): 1172.
SUN Hao, YE Guoliang, ZHAI Bohao, et al. Research on Cold Rolling Force Modeling Method Based on AEGRU Network[J]. Acta Metrologica Sinica, 2022, 43(9): 1172.
[10]LI Jingdong, WANG Xiaochen, YANG Quan, et al. Rolling Force Prediction in Cold Rolling Process Based on Combined Method of TS Fuzzy Neural Network and Analytical Model[J]. The International Journal of Advanced Manufacturing Technology, 2022, 121(5/6): 4087.
[11]陳樹宗, 侯佳琦, 白蕓松, 等. 基于MA-SVM算法的冷軋軋制力預(yù)測模型[J/OL].燕山大學(xué)學(xué)報:1.
CHEN Shuzong, HOU Jiaqi, BAI Yunsong, et al. Rolling Force Prediction Model for Cold Rolling Based on MA-SVM[J/OL]. Journal of Yanshan University:1.
[12]王曉東. 基于生產(chǎn)大數(shù)據(jù)的薄帶鋼平整機軋制力設(shè)定計算模型[J].塑性工程學(xué)報, 2023, 29(8): 209.
WANG Xiaodong. Roll Force Setting Calculation Models of Temper Rolling Mill for Thin Strip Steel Based on Big Data of Production[J]. Journal of Plasticity Engineering, 2023, 29(8): 209.
[13]嵇文路, 趙曉龍, 張明, 等. 基于小波包全頻帶分析和OS-ELM的小電流單相接地故障選線[J].哈爾濱理工大學(xué)學(xué)報, 2021, 26(2): 110.
JI Wenlu, ZHAO Xiaolong, ZHANG Ming, et al. Fault Line Selection of Single Phase Grounding Based on Wavelet Packet Full Frequency Analysis and OS-ELM[J]. Journal of Harbin University of Science and Technology, 2021, 26(2): 110.
[14]張志強, 尚猛, 張宇. 基于改進ELM-AE冷軋軋制力預(yù)測[J].鍛壓技術(shù), 2019, 44(12): 192.
ZHANG Zhiqiang, SHANG Meng, ZHANG Yu. Prediction on Cold Rolling Force Based on Improved ELM-AE[J]. Forging amp; Stamping Technology, 2019, 44(12): 192.
[15]魏立新, 張宇, 孫浩, 等. 基于改進OS-ELM的冷連軋在線軋制力預(yù)報[J].計量學(xué)報, 2019, 40(1): 111.
WEI Lixin, ZHANG Yu, SUN Hao, et al. Online Cold Rolling Prediction Based on Improved OS-ELM[J]. Acta Metrologica Sinica, 2019, 40(1): 111.
[16]冀秀梅, 王龍, 高克偉, 等. 極限學(xué)習(xí)機在中厚板軋制力預(yù)報中的應(yīng)用[J].鋼鐵研究學(xué)報, 2020, 32(5): 393.
JI Xiumei, WANG Long, GAO Kewei, et al. Application of ELM to Predict Plate Rolling Force[J]. Journal of Iron and Steel Research, 2020, 32(5): 393.
[17]劉悅, 崔丹丹. 基于結(jié)構(gòu)自組織ELM的鋁熱連軋軋制力預(yù)測[J].湖南科技大學(xué)學(xué)報(自然科學(xué)版), 2020, 35(1): 77.
LIU Yue, CUI Dandan. Aluminum Hot Rolling Force Prediction Based on Structural Self Organizing ELM[J]. Journal of Hunan University of Science amp; Technology(Natural Science Edition), 2020, 35(1): 77.
[18]郭城, 劉新忠, 苗宇. 基于粒子群優(yōu)化極限學(xué)習(xí)機的軋制力預(yù)測[J].冶金自動化, 2021, 45(S1): 329.
GUO Cheng, LIU Xinzhong, MIAO Yu.Rolling Force Prediction Based on Particle Swarm Optimised Extreme Learning Machine[J]. Metallurgical Industry Automation, 2021, 45(S1): 329.
[19]陳樹宗, 白蕓松, 侯佳琦, 等. 基于GA-FELM算法的冷軋軋制力預(yù)測模型[J].燕山大學(xué)學(xué)報, 2022, 46(3): 224.
CHEN Shuzong, BAI Yunsong, HOU Jiaqi, et al. Rolling Force Prediction Model for Cold Rolling Based on GA-FELM[J]. Journal of Yanshan University, 2022, 46(3): 224.
[20]XUE Jiankai, SHEN Bo. Dung Beetle Optimizer: A New Meta-heuristic Algorithm for Global Optimization[J]. The Journal of Supercomputing, 2023, 79(7): 7305.
[21]孫一康. 帶鋼冷連軋計算機控制[M].北京:冶金工業(yè)出版社, 2002.
SUN Yikang. Computerized Control of Cold Strip Rolling[M]. Metallurgical Industry Press, 2002.
[22]劉曉波, 袁光前, 熊珍艷. 冷軋銅板帶斯通軋制力模型研究[J].機械設(shè)計與制造, 2015(1): 62.
LIU Xiaobo, YUAN Guangqian, XIONG Zhenyan. Study on Cold Rolled Copper Strips Rolling Force Model of Stone[J]. Machinery Design amp; Manufacture, 2015(1): 62.
[23]王曉東, 任新意. 薄帶鋼平整機軋制力預(yù)測模型及應(yīng)用分析[J].冶金自動化, 2020, 265(6): 66.
WANG Xiaodong, REN Xinyi. Roll Force Prediction Models and Application Analysis of Temper Rolling Mill for Thin Gauge Steel Strip[J]. Metallurgical Industry Automation, 2020, 265(6): 66.
[24]HILL R. The Mathematical Theory of Plasticity[M]. Oxford University Press, 1998.
[25]HUANG G B, ZHU Q Y, SIEW C K. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks[C]//2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No. 04CH37541). Ieee, 2004, 2: 985.
[26]葛興來,張鑫.采用奇異能量譜與改進ELM的軸承故障診斷方法[J].電機與控制學(xué)報, 2021, 25(5): 80.
GE Xinglai, ZHANG Xin. Bearing Fault Diagnosis Method Using Singular Energy Spectrum and Improved ELM[J]. Electric Machines and Control, 2021, 25(5): 80.
[27]KASUN L L C, ZHOU H, HUANG G B, et al. Representational Learning with Extreme Learning Machine for Big Data[J]. 2013.
[28]徐睿, 梁循, 齊金山, 等. 極限學(xué)習(xí)機前沿進展與趨勢[J].計算機學(xué)報, 2019, 42(7): 1640.
XU Rui, LIANG Xun, QI JinShan, et al. Advances and Trends in Extreme Learning Machine[J]. Chinese Journal of Computers, 2019, 42(7): 1640.
[29]張坤勇, 蘇政凱, 聶美軍, 等. 基于ISSA-ELM的土體參數(shù)反演與變形預(yù)測方法[J/OL].應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報:1.
ZHANG Kunyong, SU Zhengkai, NIE Meijun, et al. Soil Parameter Inversion and Deformation Prediction Method Based on ISSA-ELM[J]. Journal of Basic Science and Engineering:1.
(編輯:溫澤宇)