王俊成,鄒 斌
(山東大學(xué)機械工程學(xué)院,濟南 250061)
由于金屬切削過程中切削力的影響因素很多,很難建立一個包含所有影響因素的完整切削力預(yù)測模型。幸運的是,神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展為解決這一問題提供了一個很好的思路。神經(jīng)網(wǎng)絡(luò)模型可以方便地從數(shù)據(jù)集中學(xué)習(xí)一組輸入輸出參數(shù)之間的隱式關(guān)系,并有效地捕捉它們之間的非線性關(guān)系,對加工過程中切削力的預(yù)測具有重要意義。在切削數(shù)據(jù)充足的情況下,神經(jīng)網(wǎng)絡(luò)可以用來預(yù)測切削力,而不必考慮各種影響因素對切削力的影響。
神經(jīng)網(wǎng)絡(luò)最常用的方法是在加工信息和加工結(jié)果之間建立一個綜合預(yù)測模型[1-2]。Jurkovic Z等[3]比較了神經(jīng)網(wǎng)絡(luò)、支持向量機和多項式回歸三種機器學(xué)習(xí)方法在高速車削加工中的性能;研究表明,三種方法在不同參數(shù)和范圍內(nèi)各有優(yōu)缺點。Vaishnav S等[4]利用銑削力模型生成的數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型預(yù)測瞬時切削力,驗證了模型的有效性。此外,神經(jīng)網(wǎng)絡(luò)在機械加工領(lǐng)域的研究也取得了許多成果[5-6]。Salimiasl A等[7]介紹了SAE4140鋼車削過程刀具磨損在線監(jiān)測的幾種方法,包括人工神經(jīng)網(wǎng)絡(luò)、模糊邏輯和最小二乘法;結(jié)果表明,神經(jīng)網(wǎng)絡(luò)對刀具磨損的預(yù)測更為精確,但在實驗數(shù)據(jù)較少的情況下,模糊邏輯更為精確。由于實際加工過程中加工周期長、材料成本高、機床維護成本高,獲取大量數(shù)據(jù)樣本往往意味著較高的經(jīng)濟和時間成本,這限制了神經(jīng)網(wǎng)絡(luò)在加工領(lǐng)域的應(yīng)用。
遷移學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域的一個分支。Pan S J等[8]提出了遷移學(xué)習(xí)的定義:給定一個源域DS和學(xué)習(xí)任務(wù)TS,一個目標(biāo)域DT和學(xué)習(xí)任務(wù)TT,遷移學(xué)習(xí)的目的是利用DS和TS中的知識來提高DT中目標(biāo)預(yù)測函數(shù)fT(·)的學(xué)習(xí),其中DS≠DT或TS≠TT。在實際場景中,獲取完美的數(shù)據(jù)樣本是一項昂貴且耗時的操作。遷移學(xué)習(xí)是解決機器學(xué)習(xí)訓(xùn)練數(shù)據(jù)不足的重要工具之一。Yosinski J等[9]率先開展了深層神經(jīng)網(wǎng)絡(luò)的可遷移性研究,提出了神經(jīng)網(wǎng)絡(luò)的微調(diào)方法。然而,這種方法并不適用于所有的遷移任務(wù)。當(dāng)源域和目標(biāo)域數(shù)據(jù)集相似度很低時,這種方法很難獲得滿意的結(jié)果。隨后,許多研究者在Yosinski J工作的基礎(chǔ)上,對神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和損失函數(shù)進行了改進,從而建立了一系列的遷移方法,如[10-11]所述。
本文以兩組切削力數(shù)據(jù)為研究對象,采用遷移學(xué)習(xí)方法,研究了在一組切削力數(shù)據(jù)和已訓(xùn)練好的網(wǎng)絡(luò)的基礎(chǔ)上,使用遷移學(xué)習(xí)方法訓(xùn)練的新網(wǎng)絡(luò)與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的性能進行了對比。研究結(jié)果表明,遷移學(xué)習(xí)的方法在一定范圍內(nèi)能夠有效的提升神經(jīng)網(wǎng)絡(luò)的性能。
遷移學(xué)習(xí)理論認(rèn)為,源域和目標(biāo)域的數(shù)據(jù)存在一定差異,但也存在一定的相關(guān)性。由此,本研究進行了1500 r/min和3000 r/min轉(zhuǎn)速的切削實驗,收集了切削力數(shù)據(jù),并將數(shù)據(jù)分別劃分為A、B兩組。采用直徑φ12 mm的整體硬質(zhì)合金立銑刀,工件材料為鋁合金2A14,加工方式為端銑,機床為大宇A(yù)CE-V500加工中心,采用Kistler9257B三向動態(tài)壓電式測力儀采集切削力信號。兩個實驗組均為120組參數(shù),實驗中的可變參數(shù)及其變化范圍見表1。
表1 切削參數(shù)范圍
以下將以主軸轉(zhuǎn)速1500 r/min、每刀進給量0.15 mm、徑向深度1.1 mm、軸向深度1.6 mm的切削參數(shù)對應(yīng)的X軸力切削信號為例,描述切削力信號的數(shù)據(jù)處理流程。
由切削試驗得到的原始切削力信號如圖1a所示。首先,使用低通濾波器對原始信號進行濾波,濾波器頻率為:(5×z×n)/60,其中z為刀具齒數(shù),n為主軸轉(zhuǎn)速(r/min)。刀具切入切出時,切削力信號會有一定的波動,因此,在切削力信號的兩邊各截去大約五分之一的總長度。剩余部分將根據(jù)刀具每轉(zhuǎn)的時間進行分割,取各小段內(nèi)數(shù)值點的最大值,計算所有最大值的平均值,得到該組參數(shù)對應(yīng)的X軸力的切削力值提取出的切削力數(shù)值如表2所示。
表2 切削力數(shù)據(jù)示例
圖1 切削力信號處理流程
在遷移學(xué)習(xí)中,MMD幾乎是最常用的距離測量方法。這是一個分析和比較的框架,用來衡量兩個樣本是否來自同一個分布。MMD首先被提出用于兩樣本測試問題,以確定兩個數(shù)據(jù)分布是否相同[12]。設(shè)p和q為空間χ上的概率分布,MMD可以定義為:
MMD(ξ,p,q)=supfεξ(Ex~p[f(x)]-Ey~q[f(y)])
(1)
其中,ξ表示一類函數(shù):f : χ →R。通過定義f為再生核希爾伯特空間H上的函數(shù)集合,當(dāng)MMD(ξ,p,q)=0時,表示兩個概率分布完全相同[13]。
(2)
其中,κ(·,·)表示方程中使用的核函數(shù),如高斯核函數(shù)。
根據(jù)上述方法和理論,本部分將描述切削力數(shù)據(jù)預(yù)測神經(jīng)網(wǎng)絡(luò)的構(gòu)建過程。在切削力數(shù)據(jù)中,使用的每個樣本包含6個維度,包括每齒進給量、軸向切削深度、徑向切削深度、X軸力、Y軸力和Z軸力,其中前3個是輸入單元,后3個是輸出單元其構(gòu)建過程如圖3所示。
圖2 遷移網(wǎng)絡(luò)訓(xùn)練流程圖
網(wǎng)絡(luò)采用 4層隱藏層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。首先,利用A組實驗組樣本組對神經(jīng)網(wǎng)絡(luò)進行預(yù)訓(xùn)練。隨后,將訓(xùn)練網(wǎng)絡(luò)的隱藏層作為目標(biāo)域網(wǎng)絡(luò)的初始值,并使用B組實驗組樣本對網(wǎng)絡(luò)進行訓(xùn)練。在這里,我們遷移和微調(diào)4層。在神經(jīng)網(wǎng)絡(luò)的損耗函數(shù)中,加入了兩個實驗組數(shù)據(jù)的MMD距離。整個網(wǎng)絡(luò)的優(yōu)化目標(biāo)包括實驗數(shù)據(jù)的預(yù)測誤差和兩個領(lǐng)域的判別誤差,可以寫成:
(3)
遷移模型的對照組是僅由轉(zhuǎn)速B組實驗組樣本訓(xùn)練的傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò),這里稱之為普通網(wǎng)絡(luò),其優(yōu)化目標(biāo)是:
(4)
本實驗旨在使用不同的樣本數(shù)量分別建立預(yù)測模型,探討不同樣本數(shù)量下遷移學(xué)習(xí)方法的效果。以下是以“n”個實驗樣本為訓(xùn)練集的遷移網(wǎng):
(1)建立4層隱藏層神經(jīng)網(wǎng)絡(luò)并隨機初始化。它由80%的A實驗組樣本進行訓(xùn)練,網(wǎng)絡(luò)的性能由剩余的仿真樣本進行測試。
(2)從B組實驗組樣本中提取出n個樣本構(gòu)建訓(xùn)練集。
(3)以A組實驗組樣本訓(xùn)練的網(wǎng)絡(luò)為初值,利用訓(xùn)練集對網(wǎng)絡(luò)進行訓(xùn)練,保存完整的訓(xùn)練模型。
(4)重復(fù)上述步驟,取“n”為不同值。
(5)使用驗證集對所有模型進行評估,并提取與每個“n”值相對應(yīng)的最優(yōu)模型;使用所選模型對測試集上的錯誤率進行評估,得到實驗結(jié)果。
其中n∈{5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100}。在遷移網(wǎng)絡(luò)的訓(xùn)練過程中,實驗樣本的提取不是完全隨機的。
除了優(yōu)化目標(biāo)不同外,普通網(wǎng)絡(luò)和遷移網(wǎng)絡(luò)在訓(xùn)練過程中也存在差異。普通網(wǎng)絡(luò)的訓(xùn)練過程相對簡單,初始網(wǎng)絡(luò)結(jié)構(gòu)直接由實驗樣本進行訓(xùn)練。在訓(xùn)練過程中,普通網(wǎng)絡(luò)和遷移網(wǎng)絡(luò)所使用的實驗樣本和學(xué)習(xí)率、迭代次數(shù)等參數(shù)是一致的。在使用n個樣本建立訓(xùn)練數(shù)據(jù)集時,樣本的選取應(yīng)遵循一定的原則。所有B組實驗組樣本的前100個樣本作為訓(xùn)練集,后40個樣本分為驗證集和測試集。提取“n”樣本意味著選擇訓(xùn)練集的前n個樣本,當(dāng)n選擇為100時,所有的訓(xùn)練樣本都將被使用。在整個訓(xùn)練過程中,將整個數(shù)據(jù)集隨機分為5次。網(wǎng)絡(luò)的初值往往對網(wǎng)絡(luò)的收斂結(jié)果有一定的影響。為了消除網(wǎng)絡(luò)初始值對實驗結(jié)果的影響,本文對遷移網(wǎng)絡(luò)和普通網(wǎng)絡(luò)各進行了10次隨機初始化。其中,遷移網(wǎng)絡(luò)初始化是指預(yù)先訓(xùn)練好的網(wǎng)絡(luò)的初始化過程。也就是說,對應(yīng)每一個n值,遷移和普通網(wǎng)絡(luò)都將訓(xùn)練50個模型。然后,利用相應(yīng)的測試集對訓(xùn)練模型的預(yù)測精度進行評價。
使用測試集對普通網(wǎng)絡(luò)和遷移網(wǎng)絡(luò)模型的性能進行評估。根據(jù)訓(xùn)練中使用的實驗樣本數(shù),在測試集上對每組兩個模型進行評估,并對預(yù)測誤差進行平均。根據(jù)實驗結(jié)果,驗證了傳遞學(xué)習(xí)方法對神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度的影響。兩個模型的比較數(shù)據(jù)如圖3所示。
(a) x軸向力誤差對比
(b) y軸向力誤差對比圖3 遷移網(wǎng)絡(luò)與普通網(wǎng)絡(luò)軸向力誤差率對比
表3 遷移網(wǎng)絡(luò)在各個階段的性能優(yōu)勢
表3顯示了遷移網(wǎng)絡(luò)和普通網(wǎng)絡(luò)在不同樣本數(shù)量范圍內(nèi)的預(yù)測誤差比較。表中的數(shù)值計算方法是在相應(yīng)的軸向切削力作用下,普通網(wǎng)絡(luò)的預(yù)測誤差減去遷移網(wǎng)絡(luò)。
從圖4所示的實驗結(jié)果可以看出,遷移網(wǎng)絡(luò)在不同的采樣階段具有不同的效果。當(dāng)訓(xùn)練樣本數(shù)大于等于80時,遷移網(wǎng)絡(luò)與普通網(wǎng)絡(luò)的性能沒有顯著差異;當(dāng)訓(xùn)練樣本數(shù)小于80時,遷移網(wǎng)絡(luò)具有明顯的性能優(yōu)勢,其在X、Y軸向力上的平均誤差分別比普通網(wǎng)絡(luò)小 5.82%、6.32%。
在80~100樣本數(shù)量范圍內(nèi),遷移網(wǎng)絡(luò)與普通網(wǎng)絡(luò)的預(yù)測誤差相差小于1%,這說明在這個范圍內(nèi),遷移學(xué)習(xí)的方法對神經(jīng)網(wǎng)絡(luò)的預(yù)測性能沒有顯著影響。當(dāng)樣本數(shù)量為25~75時,遷移網(wǎng)絡(luò)的在X、Y軸向力上的平均誤差分別為18.76%和19.17%,其平均誤差比普通網(wǎng)絡(luò)相比分別小4.36%、5.92%,此時遷移網(wǎng)絡(luò)的誤差率與普通網(wǎng)絡(luò)相比明顯降低,且其誤差率處于較低水平,在此范圍內(nèi)是遷移網(wǎng)絡(luò)較為合適的應(yīng)用范圍。在5~20樣本數(shù)量范圍內(nèi),遷移網(wǎng)絡(luò)的預(yù)測誤差明顯小于普通網(wǎng)絡(luò),預(yù)測性能明顯提高,但預(yù)測誤差值仍較高,這在實際應(yīng)用中是難以接受的,此時兩種方法都難以滿足實際使用要求。
在整個樣本范圍內(nèi),遷移網(wǎng)絡(luò)的預(yù)測誤差大多小于普通網(wǎng)絡(luò)的預(yù)測誤差,其性能優(yōu)勢逐漸減小并最終消失。實驗表明,隨著樣本數(shù)的增加,遷移學(xué)習(xí)方法對神經(jīng)網(wǎng)絡(luò)性能的影響將逐漸減小。當(dāng)樣本數(shù)大于80時,遷移學(xué)習(xí)對神經(jīng)網(wǎng)絡(luò)的性能不再產(chǎn)生顯著影響。
綜上所述,當(dāng)樣本數(shù)量為0~20時遷移網(wǎng)絡(luò)和普通網(wǎng)絡(luò)的預(yù)測誤差都較大,都不適合實際應(yīng)用。當(dāng)樣本數(shù)量為25~75時,遷移網(wǎng)絡(luò)的預(yù)測精度明顯提高,優(yōu)于普通網(wǎng)絡(luò),滿足實際應(yīng)用要求。當(dāng)樣本數(shù)量為80~100時,隨著樣本數(shù)量的增加,遷移網(wǎng)絡(luò)與普通網(wǎng)絡(luò)的預(yù)測誤差沒有明顯區(qū)別。無論如何,在不同樣本數(shù)量階段遷移網(wǎng)絡(luò)具有不同性能優(yōu)勢;但是在任意階段內(nèi),遷移學(xué)習(xí)方法都不會對模型的性能產(chǎn)生負(fù)面影響。
本文提出了一種切削加工切削力遷移網(wǎng)絡(luò)訓(xùn)練方法。與普通網(wǎng)絡(luò)相比,遷移網(wǎng)絡(luò)預(yù)測性能具有明顯優(yōu)勢,可以應(yīng)用于切削加工領(lǐng)域,能夠解決切削力預(yù)測等實際問題。主要結(jié)論如下:
(1)在訓(xùn)練樣本數(shù)相同的情況下,遷移網(wǎng)絡(luò)的預(yù)測性能普遍優(yōu)于普通網(wǎng)絡(luò),即樣本數(shù)較少時遷移方法仍可以獲得高的預(yù)測精度,一定程度上可以減少神經(jīng)網(wǎng)絡(luò)預(yù)測切削力所需的實驗數(shù)據(jù)量;
(2)隨著樣本數(shù)的增加,遷移學(xué)習(xí)方法的效果會逐漸減弱。當(dāng)樣本數(shù)足夠時,遷移網(wǎng)絡(luò)與普通網(wǎng)絡(luò)的預(yù)測性能基本一致,沒有發(fā)現(xiàn)遷移學(xué)習(xí)方法對網(wǎng)絡(luò)性能的負(fù)面影響。