李晟,周超
(福州大學(xué) 機(jī)械工程及自動(dòng)化學(xué)院,福建 福州 350116)
鈦及其合金具有耐腐蝕、導(dǎo)熱率低及生物相容性好等特點(diǎn),在航天、航空、醫(yī)療等領(lǐng)域廣泛應(yīng)用,是具有特殊戰(zhàn)略意義的高性能金屬材料[1]。采用不同工藝加工的鈦合金表面具有不同的幾何形貌,其對(duì)零部件的摩擦、磨損、潤滑等性能的影響越來越大,已成為決定零部件性能的重要因素之一[2-3]。
不同工藝加工的零件表面形貌存在結(jié)構(gòu)性差異,正確選用評(píng)定參數(shù)對(duì)定量表征加工表面質(zhì)量從而進(jìn)一步指導(dǎo)改進(jìn)加工工藝具有重要意義。由于粗糙表面的三維本質(zhì),傳統(tǒng)的二維輪廓評(píng)定參數(shù)不能全面表征表面質(zhì)量,越來越多的研究工作者選用三維參數(shù)評(píng)價(jià)表面質(zhì)量[4]。ISO 25178-2: 2012給出了5類共40多個(gè)三維參數(shù),必須針對(duì)特定應(yīng)用從中選取合適的參數(shù)集,方能準(zhǔn)確、全面地評(píng)定表面質(zhì)量。例如,吳乙萬等[5]利用三維參數(shù)分析超精密光學(xué)表面,認(rèn)為Sq、Sdr、Sdq能很好地表征光學(xué)表面性能。楊潔等[6]基于機(jī)器視覺對(duì)不同工藝處理的金屬樣塊進(jìn)行研究,認(rèn)為Sq、Ssk、Sds可作為三維表面粗糙度評(píng)價(jià)的可靠參數(shù);趙登超等[7]選取三維參數(shù)中的高度類、空間類和混合類中的12個(gè)參數(shù)進(jìn)行聚類分析,發(fā)現(xiàn)Sa、Sq對(duì)于識(shí)別不同拋光工藝的紫銅表面的貢獻(xiàn)度最大。
本文采用超聲滾壓、車削、磨削、拋光、銑削5種不同工藝加工鈦樣本表面,使用三維輪廓儀測(cè)量表面幾何形貌;基于機(jī)器學(xué)習(xí)中的隨機(jī)森林算法,以表面的三維參數(shù)Sa、Sq、Ssk、Sku、Sp、Sv、Sz、Sal、Str作為研究特征,進(jìn)行表面的自動(dòng)分類、特征篩選(上述表征參數(shù)的意義及算法,參見文獻(xiàn)[5]),發(fā)現(xiàn)Sa(算術(shù)平均高度)、Sq(均方根高度)和Ssk(偏斜度)組成的參數(shù)集具有表征表面質(zhì)量的最高重要性,并可精準(zhǔn)區(qū)分不同加工表面。
隨機(jī)森林(random forest,RF)算法由LEO Breiman[8]提出,將CART決策樹與Bagging算法相結(jié)合,形成一種集成學(xué)習(xí)算法(ensemble learning)。CART決策樹是二元分類器[9],其通過兩個(gè)隨機(jī)過程進(jìn)行構(gòu)建:1)有放回地從訓(xùn)練樣本數(shù)據(jù)集中隨機(jī)抽取固定數(shù)目的樣本作為訓(xùn)練樣本集合;2)每棵樹使用的特征集是從總數(shù)據(jù)集中隨機(jī)選取的少數(shù)特征。通過組合多棵決策樹,最終求平均值獲得預(yù)測(cè)結(jié)果。
CART決策樹的構(gòu)建由非葉節(jié)點(diǎn)開始,選擇特征的隨機(jī)子集中的最佳分割點(diǎn)將數(shù)據(jù)二分類,且不斷生長,當(dāng)數(shù)據(jù)到達(dá)葉節(jié)點(diǎn)后不再劃分。為將特征元素更合理地分布在非葉節(jié)點(diǎn)上,CART決策樹通常采用基尼系數(shù)使信息增益最大化:
(1)
式中:IG為基尼系數(shù);s為待分類特征;Dp為父節(jié)點(diǎn);Nl為左子節(jié)點(diǎn)樣本數(shù)量;Np表示父節(jié)點(diǎn)中樣本數(shù)量;Nr為右子節(jié)點(diǎn)樣本數(shù)量;Dl為左子節(jié)點(diǎn);Dr為右子節(jié)點(diǎn)。
對(duì)于特征s,在決策樹生長過程中,利用式(1)計(jì)算出節(jié)點(diǎn)劃分前后的不純度之差,便得到不純度衰減量。平均所有決策樹得到的平均不純度衰減量,最終得到該特征的重要性[10]。對(duì)每個(gè)特征進(jìn)行此操作,便得到所有特征的重要性,從而進(jìn)行排序、篩選。
本文選用直徑為20 mm的鈦棒,分別采用車削、超聲滾壓、銑削、磨削以及拋光5種工藝加工其圓端面,每種工藝加工2個(gè)試樣,總計(jì)10個(gè)試樣。車削使用外圓車刀,轉(zhuǎn)速為300 r/min,進(jìn)給量為80 mm/min,背吃刀量為0.2 mm;球頭超聲滾壓的加工深度為0.2 mm,進(jìn)給量為250 mm/min;銑削使用球頭銑刀,轉(zhuǎn)速為10 000 r/min,進(jìn)給速度為550 mm/min,切削深度為0.15 mm;磨削使用1500號(hào)砂紙;拋光使用絲絨拋光布,粒度為1.5 μm的鉆石膏,拋盤轉(zhuǎn)速為1 400 r/min。采用三維輪廓儀測(cè)量樣品表面中范圍為10 mm×10 mm的區(qū)域,采樣間隔為4 μm,每個(gè)表面測(cè)得2 500×2 500個(gè)高度點(diǎn)數(shù)據(jù)。
對(duì)測(cè)量的原始數(shù)據(jù)做預(yù)處理。根據(jù)文獻(xiàn)[11],經(jīng)小波變換濾除測(cè)量基準(zhǔn)面、高頻噪聲和異常值點(diǎn);在每個(gè)測(cè)量表面隨機(jī)選取50個(gè)128×128個(gè)采樣點(diǎn)組成的正方形區(qū)域,總計(jì)500個(gè)表面樣本。
編寫相關(guān)粗糙表面三維參數(shù)的計(jì)算程序。為適用模型訓(xùn)練,將計(jì)算所得所有三維參數(shù)制成數(shù)據(jù)集。表1給出了表面三維參數(shù)Sa(算術(shù)平均高度)、Sq(均方根高度)、Ssk(偏斜度)、Sku(峰態(tài))、Sv(最大谷深度)、Sz(最大高度)、Sp(最大峰高度)、Sal(自相關(guān)長度)和Str(紋理特征比),具體幾何定義見文獻(xiàn)[4],并展示了數(shù)據(jù)集中部分?jǐn)?shù)據(jù),每一行代表一個(gè)樣本表面。
表1 鈦棒加工表面三維參數(shù)
在數(shù)據(jù)集中,包含500個(gè)樣本表面及其9個(gè)三維參數(shù),記作500×9維的矩陣,即X∈R500×9:
(2)
其中每一個(gè)xi(j)代表三維參數(shù)的具體值。
類似地,用1個(gè)500維的列向量表示5種加工工藝的類形標(biāo)記:
(3)
其中每一個(gè)y(i)代表1個(gè)樣本的類標(biāo),取值分別為1—超聲滾壓;2—車削;3—磨削;4—拋光;5—銑削。
將數(shù)據(jù)集按照3∶7的比例分為訓(xùn)練集和測(cè)試集,保證兩者同分布。為得出合理、可靠的結(jié)果,需優(yōu)化算法模型,因此繪制決策樹數(shù)量的驗(yàn)證曲線,分析最佳決策樹數(shù)量取值,如圖1所示。
圖1 決策樹數(shù)量的驗(yàn)證曲線
由圖1(灰色部分為方差)可見,隨著決策樹數(shù)量上升,模型預(yù)測(cè)準(zhǔn)確率總體上升直至平坦。決策樹數(shù)量上升,雖然預(yù)測(cè)準(zhǔn)確率上升,但模型復(fù)雜度升高,過擬合愈加嚴(yán)重,同時(shí)選用不同決策樹數(shù)量帶來的分類以及重要度的計(jì)算成本隨之增加。因此需在計(jì)算成本與降低過擬合之間權(quán)衡。利用K折交叉驗(yàn)證法對(duì)算法進(jìn)行評(píng)估,選擇合理的決策樹數(shù)量,量化預(yù)測(cè)準(zhǔn)確率與泛化性能,如圖2所示。
圖2 決策樹數(shù)量得分曲線
由圖2可知,當(dāng)決策樹數(shù)量<10,準(zhǔn)確率高但方差也高,說明過擬合程度較高;>60時(shí),預(yù)測(cè)準(zhǔn)確率下降而方差卻升高,說明過擬合程度也較高;而在30~40之間時(shí),準(zhǔn)確率與方差的差別很小。因此考慮到計(jì)算效率與計(jì)算成本,選擇30棵決策樹較為合理。
利用優(yōu)化好的隨機(jī)森林模型對(duì)數(shù)據(jù)進(jìn)行擬合并繪制學(xué)習(xí)曲線,分析模型性能如圖3所示。
圖3 學(xué)習(xí)曲線
由圖3可見,隨著訓(xùn)練樣本數(shù)增加,模型在訓(xùn)練集上擬合良好,而在驗(yàn)證集上則是初始準(zhǔn)確率上升較快,而后趨于平穩(wěn)上升,在樣本數(shù)250之后趨于穩(wěn)定;模型的泛化性能穩(wěn)步提升,最后與訓(xùn)練準(zhǔn)確率只相差2.23%,說明模型對(duì)訓(xùn)練數(shù)據(jù)有輕微過擬合。
利用優(yōu)化好的模型,計(jì)算9種三維參數(shù)對(duì)分類表面的重要度并排序,得到圖4所示結(jié)果。
圖4 特征重要性及排序
由圖4可知,Sa的重要性得分最高,為0.23,其次是Sq和Ssk,分別為0.15和0.14。從得分情況看,選擇Sa、Sq和Ssk作為評(píng)定參數(shù)集較為合理。為驗(yàn)證合理性,以Sa、Sq和Ssk作為空間三坐標(biāo)軸,對(duì)分類結(jié)果做可視化展示,分析合理性,詳見圖5。
圖5 三維參數(shù)分類結(jié)果
由圖5可知:對(duì)于超聲滾壓、拋光、銑削及車削、磨削、銑削,數(shù)據(jù)在Sa、Sq和Ssk組成的三維空間中呈線性可分態(tài),說明分類效果良好;滾壓和車削呈線性不可分態(tài),可能是由于滾壓在車削后加工,未能完全去除殘余特征;拋光和磨削之間參數(shù)差距較小,可能是因?yàn)閽伖獾那邢魃疃刃。瑑烧吡粝碌奶卣鬏^為接近。從表面分類來看,Sa、Sq和Ssk有良好的分類效果,作為評(píng)定參數(shù)集是合理的;從樣品表面分析,由于128×128個(gè)點(diǎn)組成的正方形區(qū)域面積較小,表面紋理特征較為簡單,因此Sa、Sq和Ssk可以更好地評(píng)定表面質(zhì)量,同時(shí)有計(jì)算簡便的優(yōu)勢(shì)。
本文提出采用隨機(jī)森林算法篩選三維參數(shù)用以評(píng)定鈦加工表面的方法。結(jié)果表明:只需向隨機(jī)森林算法提供加工試樣表面的小部分區(qū)域和部分三維參數(shù),就能自動(dòng)、準(zhǔn)確分辨不同表面;隨機(jī)森林算法能夠定量計(jì)算三維參數(shù)在分類表面過程中的貢獻(xiàn)度大小,對(duì)于5種加工工藝而言,Sa、Sq和Ssk有最大的重要性,分別達(dá)到了0.23、0.15和0.14;由Sa、Sq和Ssk組成的空間中,超聲滾壓、拋光、銑削(車削、磨削、銑削)工藝的整體區(qū)分效果良好,說明此3種參數(shù)即可分類不同加工工藝,因此選用Sa、Sq和Ssk參數(shù)集定量評(píng)定鈦加工表面質(zhì)量是合理的,并可為提高加工質(zhì)量、優(yōu)化加工工藝提供定量依據(jù)。