段玉聰,王學(xué)德,周鑫,*,張佩宇,郭西洋,成星,,樊軍偉
1. 空軍工程大學(xué) 航空等離子體動(dòng)力學(xué)重點(diǎn)實(shí)驗(yàn)室,西安 710038 2. 西安空天機(jī)電智能制造有限公司,西安 710100
航空裝備的備件保障是世界各國空軍面臨的共性難題,金屬增材制造由于其快速、靈活、小批量生產(chǎn)、個(gè)性化定制等諸多優(yōu)點(diǎn),在零部件的快速反應(yīng)制造和現(xiàn)場(chǎng)修復(fù)中具有巨大優(yōu)勢(shì)。金屬增材制造一般包括定向能量沉積成形(Directed Energy Deposition,DED)和粉末床熔融成形(Powder Bed Fusion,PBF)兩類方法。激光粉末床熔融成形適合制備航空裝備中的中小尺寸帶內(nèi)部結(jié)構(gòu)的復(fù)雜零件,空軍工程大學(xué)已將其應(yīng)用在現(xiàn)場(chǎng)保障中,未來將向高性能、高批次穩(wěn)定性、成形過程與后(熱)處理復(fù)合等方向發(fā)展,并需解決過程回溯和質(zhì)量追溯難題??刂瞥尚芜^程、提高成形質(zhì)量的關(guān)鍵是更好地理解原材料粉末參數(shù)、成形工藝參數(shù)及部件微觀組織結(jié)構(gòu)和機(jī)械性能之間的復(fù)雜關(guān)系。但激光粉末床熔融成形是典型的多物理、多尺度過程,包括微觀尺度的激光-粉末相互作用、介觀尺度的熔池動(dòng)力學(xué)和柱狀晶生長及宏觀尺度的熱力耦合等,工藝參數(shù)與最終質(zhì)量之間的關(guān)系過于復(fù)雜而難以直接理解。
實(shí)施過程在線監(jiān)控是保障成形質(zhì)量的關(guān)鍵技術(shù)手段。在線監(jiān)控可從多個(gè)傳感器獲取數(shù)據(jù)得到成形過程的最直接信息,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行實(shí)時(shí)、準(zhǔn)確分析,可實(shí)現(xiàn)對(duì)成形質(zhì)量的閉環(huán)控制。但由于光斑(熔池)尺寸小、移動(dòng)速度快、監(jiān)測(cè)信息量大、信號(hào)理解不明晰等原因,建立熔池監(jiān)測(cè)信號(hào)(輻射強(qiáng)度、形貌、溫度場(chǎng))與材料科學(xué)現(xiàn)象(凝固組織、缺陷、表面粗糙)的直接聯(lián)系也較為困難。
對(duì)缺陷的在線監(jiān)測(cè)和質(zhì)量的在線分析,未來可能有兩條主要的技術(shù)路線:一是采用較為先進(jìn)的成像技術(shù),在成形過程中直接觀察熔池內(nèi)氣泡的演化、識(shí)別缺陷形成,這要求較高的空間分辨和時(shí)間分辨能力;二是采集熔池溫度、輻射強(qiáng)度和光強(qiáng)信息,上述信息能反應(yīng)熔池穩(wěn)定性狀態(tài)和缺陷產(chǎn)生傾向,但相互聯(lián)系不直觀,什么樣的熔池信息特征變化代表缺陷一定會(huì)產(chǎn)生,目前還不十分清楚。熔池信息與成形質(zhì)量(致密度、表面粗糙度、強(qiáng)度等)存在某種高維特征聯(lián)系。近年來,機(jī)器學(xué)習(xí)算法(Machine Learning,ML)在計(jì)算機(jī)視覺、自然語言處理、自動(dòng)駕駛等領(lǐng)域發(fā)展迅速,可識(shí)別數(shù)據(jù)之間潛在的復(fù)雜模式,表征數(shù)據(jù)之間非線性、高維度、高復(fù)雜度的關(guān)系,因此機(jī)器學(xué)習(xí)在挖掘激光增材制造過程參量與成形質(zhì)量之間的復(fù)雜聯(lián)系方面具有巨大潛力。
在諸多過程參量中,熔池輻射強(qiáng)度信號(hào)由激光作用于粉床時(shí)形成的熔池及其周圍物質(zhì)輻射而形成,蘊(yùn)含了豐富的熔池動(dòng)態(tài)特征信息,反映工藝過程的穩(wěn)定性和最終成形質(zhì)量,國內(nèi)外諸多學(xué)者對(duì)其進(jìn)行了研究。比利時(shí)魯汶大學(xué)Clijsters等采用光電二極管采集到的熔池輻射強(qiáng)度信號(hào)和圖像處理技術(shù),在原理上實(shí)現(xiàn)了對(duì)熔池特征的在線監(jiān)控,但采樣率和系統(tǒng)穩(wěn)定性較低,難以應(yīng)用于實(shí)際生產(chǎn)。Montazeri等使用光電二極管采集到的激光粉末床成形過程數(shù)據(jù),對(duì)過程中的粉床污染進(jìn)行了監(jiān)測(cè),但不能根據(jù)數(shù)據(jù)對(duì)污染類型及污染的嚴(yán)重程度進(jìn)行分類。Coeck等采用離軸監(jiān)測(cè)方式,將熔池輻射強(qiáng)度信號(hào)與內(nèi)部缺陷關(guān)聯(lián)起來,但只適用于監(jiān)測(cè)樣件局部固定尺寸的缺陷,局限性較大。上述研究均對(duì)熔池輻射強(qiáng)度數(shù)據(jù)有一定的分析與利用,但由于采樣頻率較低、沒有對(duì)數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理及特征提取,造成信息采集不充分、數(shù)據(jù)處理效率低下和精確度不高等問題,難以在實(shí)際生產(chǎn)中進(jìn)行工藝參數(shù)的實(shí)時(shí)調(diào)整及對(duì)樣件總體質(zhì)量進(jìn)行分類識(shí)別。
針對(duì)上述問題,本文設(shè)置不同的工藝參數(shù)(部分偏離工藝窗口)開展粉末床激光成形實(shí)驗(yàn),成形過程中采集熔池輻射強(qiáng)度信號(hào)。通過數(shù)據(jù)分割、特征提取和特征選擇對(duì)信號(hào)數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建用于機(jī)器學(xué)習(xí)的數(shù)據(jù)集。使用21種不同的機(jī)器學(xué)習(xí)算法,一是將熔池輻射強(qiáng)度數(shù)據(jù)按工藝參數(shù)(如激光功率、掃描速度高、中、低)進(jìn)行準(zhǔn)確分類,實(shí)現(xiàn)熔池輻射強(qiáng)度偏離最佳參數(shù)窗口時(shí)的異常識(shí)別;二是將熔池輻射強(qiáng)度數(shù)據(jù)按照最終成形塊體的質(zhì)量(密度、表面粗糙度)進(jìn)行分類,以期實(shí)現(xiàn)根據(jù)熔池輻射強(qiáng)度數(shù)據(jù)識(shí)別樣件質(zhì)量。
成形實(shí)驗(yàn)采用北京易加三維科技有限公司的EP-M250設(shè)備,設(shè)備由激光光學(xué)掃描系統(tǒng)(激光光學(xué)系統(tǒng)、掃描振鏡)、工作艙、氣體流通分析系統(tǒng)(氣體循環(huán)系統(tǒng)、氧氣分析報(bào)警系統(tǒng))及控制系統(tǒng)(計(jì)算機(jī)、軟件系統(tǒng))組成;成形材料選擇霍爾流速為18.8 s/50 g、松裝密度為4.02 g/cm的316L不銹鋼粉末,粉末粒徑分布=20 μm,=32.7 μm,=53.4 μm,其中、、分別表示粒度分布數(shù)達(dá)10%、50%、90%時(shí)對(duì)應(yīng)的粒徑。
根據(jù)設(shè)備廠商提供的標(biāo)準(zhǔn)數(shù)據(jù)包,致密成形的參數(shù)窗口為功率250~280 W、速度950~1 000 mm/s、掃描間距0.1 mm、每層鋪粉厚度40 μm。在較大范圍內(nèi)改變激光功率、激光掃描速度等參數(shù)設(shè)置。具體參數(shù)設(shè)置詳見表1,掃描策略按標(biāo)號(hào)順序以長直線單向掃描,見圖1。最終成形的每個(gè)樣塊尺寸為15 mm×15 mm×60 mm,最終成形樣品見圖2。根據(jù)參數(shù)不同分5組,樣塊3、8處于最佳參數(shù)窗口,其余樣件的參數(shù)偏離最佳窗口。
圖1 激光掃描平面Fig.1 Laser scan plan
圖2 成形樣品Fig.2 Manufactured samples
打印完成后,使用線切割將樣件從基板上切下,使用OHAUS公司的AX223ZH電子天平,在25 ℃的測(cè)試水溫下,每個(gè)樣件采用排水法測(cè)試5次密度并記錄,最終使用5次密度的均值表示每個(gè)樣件的實(shí)際密度。用表面粗糙度測(cè)試儀檢測(cè)表面粗糙度,當(dāng)樣件粗糙度在上表面分布差異較大時(shí),采取不同位置多次采樣取平均值作為最終值并記錄,密度和表面粗糙度實(shí)驗(yàn)結(jié)果見表1。
表1 打印樣件參數(shù)取值范圍分布和測(cè)量結(jié)果
光電二極管可在激光粉末床成形過程中將熔池輻射的光信號(hào)轉(zhuǎn)化為電信號(hào)。使用Thorlabs公司的PDA10A2光電二極管可收集來自熔池輻射200~1 100 nm波段的光信號(hào)。光電二極管的響應(yīng)率可定義為在給定時(shí)刻產(chǎn)生的光電流與入射光功率的比值。熔池輻射強(qiáng)度采集系統(tǒng)工作原理如圖3所示。
圖3 熔池輻射強(qiáng)度監(jiān)測(cè)系統(tǒng)Fig.3 Molten pool emission intensity monitoring system
在成形過程中,激光器發(fā)射出激光,經(jīng)掃描振鏡將激光照射到成形缸內(nèi)與粉末發(fā)生相互作用,形成熔池及周圍物質(zhì),發(fā)出光輻射,而后熔池輻射光經(jīng)掃描振鏡反射通過增透鏡。由于熔池和周圍材料的輻射光在各個(gè)波段分布且各個(gè)波段輻射強(qiáng)度不同,為避免引入太寬波段影響分析、排除反射激光(波長為(1 024±10) nm)及環(huán)境照明光的干擾,設(shè)置700~950 nm的帶通濾光片,將處于輻射強(qiáng)度峰值附近的近紅外波段光傳輸?shù)焦怆姸O管,光電二極管進(jìn)一步將光信號(hào)轉(zhuǎn)化為電信號(hào)進(jìn)行存儲(chǔ),實(shí)現(xiàn)熔池輻射強(qiáng)度信號(hào)的監(jiān)控。
上述監(jiān)控系統(tǒng)數(shù)據(jù)采樣率=50 kHz,打印過程中數(shù)據(jù)采集卡及自主研發(fā)的數(shù)據(jù)采集程序會(huì)實(shí)時(shí)獲取打印機(jī)控制系統(tǒng)的層數(shù)同步信息,并在每層打印完成之后,自動(dòng)將同一激光掃描層的熔池輻射強(qiáng)度數(shù)據(jù)儲(chǔ)存為一個(gè)文件。
圖4展示了一層熔池輻射強(qiáng)度數(shù)據(jù)的波形圖,其中包含了一層中10個(gè)樣件的熔池輻射強(qiáng)度信息。每層掃描時(shí)間約為27 s,采集到數(shù)據(jù)量約為40 MB,由于激光粉末床熔融過程通常耗時(shí)長、打印層數(shù)多,造成監(jiān)控總數(shù)據(jù)量巨大。若直接使用原始數(shù)據(jù)進(jìn)行計(jì)算,會(huì)耗費(fèi)大量的計(jì)算資源及儲(chǔ)存空間,實(shí)時(shí)分類十分困難,因此需對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的數(shù)據(jù)處理、特征提取和特征選擇。
圖4 一層熔池輻射強(qiáng)度數(shù)據(jù)Fig.4 Emission intensity data of a layer of molten pool
將數(shù)據(jù)輸入機(jī)器學(xué)習(xí)模型前需進(jìn)行數(shù)據(jù)預(yù)處理,首先將采集到的每段數(shù)據(jù)與樣件對(duì)應(yīng)起來(數(shù)據(jù)分割);隨后將每個(gè)熔化道對(duì)應(yīng)熔池輻射強(qiáng)度數(shù)據(jù)的數(shù)據(jù)特征作為一個(gè)數(shù)據(jù)樣本(特征提取和特征選擇),用相應(yīng)分類標(biāo)簽進(jìn)行標(biāo)定,構(gòu)成用于機(jī)器學(xué)習(xí)的數(shù)據(jù)集(數(shù)據(jù)集的標(biāo)定與劃分)。與原始數(shù)據(jù)相比,特征提取和特征選擇后形成數(shù)據(jù)集的數(shù)據(jù)量被壓縮為原始數(shù)據(jù)量的3%以下。有效減少了監(jiān)測(cè)數(shù)據(jù)冗余,提高了數(shù)據(jù)處理效率。
首先將原始文件的一層數(shù)據(jù)分割為每個(gè)熔化道對(duì)應(yīng)的數(shù)據(jù),然后根據(jù)熔化道之間的時(shí)間先后順序?qū)⒚慷螖?shù)據(jù)與樣件對(duì)應(yīng)起來。
由于一層數(shù)據(jù)包含了10個(gè)不同工藝參數(shù)下樣件的熔池輻射數(shù)據(jù),因此首先需將一層數(shù)據(jù)的10段數(shù)據(jù)與打印的10個(gè)樣品對(duì)應(yīng)起來,對(duì)此提出了一種數(shù)據(jù)分割算法,解決熔池輻射數(shù)據(jù)與樣件的對(duì)應(yīng)問題。算法原理如圖5所示。圖5橫坐標(biāo)為時(shí)間軸,由于采樣是在時(shí)間域上進(jìn)行的,因此數(shù)據(jù)點(diǎn)的先后位置與時(shí)間點(diǎn)一一對(duì)應(yīng),相鄰兩個(gè)數(shù)據(jù)點(diǎn)之間的時(shí)間差即采樣時(shí)間,為采樣頻率的倒數(shù):
=1=002 ms
(1)
圖5 數(shù)據(jù)分割原理Fig.5 Principles of data segmentation
圖5中Δ定義為數(shù)據(jù)序列的第個(gè)數(shù)據(jù)脈沖(激光掃描線段也即一個(gè)熔化道對(duì)應(yīng)熔池輻射強(qiáng)度)的下降沿對(duì)應(yīng)位置d,與第個(gè)數(shù)據(jù)脈沖的上升沿對(duì)應(yīng)位置u,的差值:
Δ=d,-u,
(2)
Δ={Δ,Δ,…,Δ,…}
(3)
則Δ即對(duì)應(yīng)第個(gè)激光脈沖的掃描時(shí)間,截取Δ對(duì)應(yīng)的數(shù)據(jù),就得到了第個(gè)數(shù)據(jù)脈沖。由Δ序列組成的數(shù)集Δ對(duì)應(yīng)所有數(shù)據(jù)脈沖掃描時(shí)間,如此一層的原始數(shù)據(jù)就被分割為以激光脈沖(單個(gè)熔化道)為單位的大量分段數(shù)據(jù),按照掃描策略及先后順序即可與樣件一一對(duì)應(yīng)起來,每個(gè)分段數(shù)據(jù)將作為一個(gè)數(shù)據(jù)樣本,進(jìn)行特征提取與特征選擇。
采用數(shù)據(jù)特征提取算法提取數(shù)據(jù)特征,相關(guān)特征量如圖6所示。圖中數(shù)據(jù)特征具體定義及其物理意義參照附錄A。從每道激光脈沖數(shù)據(jù)中提取上述特征,這樣即可用圖6中的一組數(shù)據(jù)特征表征一道激光數(shù)據(jù)脈沖(每個(gè)熔化道),不同樣件對(duì)應(yīng)的脈沖數(shù)據(jù)特征按標(biāo)定分類存儲(chǔ)即可得到熔池輻射強(qiáng)度數(shù)據(jù)集。
圖6 數(shù)據(jù)特征Fig.6 Data features
在特征提取過程中,難免會(huì)提取到一些與分類結(jié)果無關(guān)或相關(guān)性很小的特征,這些特征對(duì)于分類結(jié)果沒有明顯的影響,因此會(huì)造成特征的冗余及數(shù)據(jù)量的增加,刪除這些特征有利于進(jìn)一步清晰特征與分類結(jié)果之間的關(guān)系,去掉數(shù)據(jù)冗余。
使用MRMR(Max-Relevance and Min-Redundancy)算法選擇特征,其原理為:在原始具有個(gè)特征的特征集合中找到一個(gè)特征子集,使子集中的特征與最終輸出結(jié)果的相關(guān)性最大,但是特征彼此之間相關(guān)性最小。首先將最大相關(guān)性和最小冗余度結(jié)合起來,通過前向加法方案對(duì)特征進(jìn)行排序,使用啟發(fā)式算法量化特征的重要性,并返回每個(gè)特征所得分?jǐn)?shù),較大的分?jǐn)?shù)表明相應(yīng)的特征更加重要,然后給定特征數(shù)量找到一個(gè)最優(yōu)集合。算法原理流程參考文獻(xiàn)[23-24]中具體說明。
使用MRMR算法對(duì)提取的特征進(jìn)行評(píng)分和排名,當(dāng)以工藝參數(shù)為響應(yīng)變量時(shí),特征值重要性評(píng)分-排名柱狀圖如圖7所示,不同響應(yīng)變量對(duì)應(yīng)的特征重要性評(píng)分如表2所示。
圖7 工藝參數(shù)為響應(yīng)時(shí)特征重要性評(píng)分及排名Fig.7 Feature importance score and ranking when response is a process parameter
表2 不同響應(yīng)的特征重要性評(píng)分及排名Table 2 Feature importance score and ranking for different responses
在此基礎(chǔ)上,在訓(xùn)練模型時(shí)根據(jù)響應(yīng)變量選擇對(duì)應(yīng)重要性較高的特征子集,刪除不必要的特征可更高效地求解問題。
在構(gòu)建數(shù)據(jù)集時(shí),刪除由于設(shè)備原因采集到損壞的無效數(shù)據(jù),再從無損的數(shù)據(jù)中進(jìn)行抽樣,使每個(gè)樣件對(duì)應(yīng)數(shù)據(jù)樣本數(shù)盡量一致。得到7 575 組數(shù)據(jù)樣本;再根據(jù)2.3節(jié)結(jié)果,選擇每組重要性評(píng)分前10的特征構(gòu)建對(duì)應(yīng)數(shù)據(jù)集。因研究熔池輻射強(qiáng)度分類和樣件質(zhì)量預(yù)測(cè)分類兩個(gè)問題,所以建立兩個(gè)數(shù)據(jù)集。
熔池輻射強(qiáng)度分類數(shù)據(jù)集
將最佳工藝參數(shù)下的數(shù)據(jù)樣本標(biāo)記為“參數(shù)正常”(樣件3、8)。將掃描功率小于和大于最佳值參數(shù)的數(shù)據(jù)樣本分別標(biāo)記為“功率過小”(樣件1、2)和“功率過大”(樣件4、5);將掃描速度小于和大于最佳速度參數(shù)下的數(shù)據(jù)樣本分別標(biāo)記為“速度過小”(樣件6、7)和“速度過大”(樣件9、10),得到用于工藝參數(shù)異常識(shí)別的訓(xùn)練數(shù)據(jù)集。
質(zhì)量預(yù)測(cè)分類數(shù)據(jù)集
將測(cè)得樣件的密度與表面粗糙度按數(shù)值大小進(jìn)行分類,描述打印樣件的質(zhì)量。316L不銹鋼的密度為7.980 g/cm,將致密度大于95%(密度大于7.581 g/cm)樣件的密度標(biāo)記為“正?!保粗畼?biāo)記為“缺陷”;樣件的標(biāo)記為“正?!薄捌蟆薄斑^大”。相應(yīng)分類標(biāo)準(zhǔn)如表3和表4所示,以此標(biāo)記對(duì)應(yīng)樣件的數(shù)據(jù)樣本構(gòu)成用于質(zhì)量預(yù)測(cè)的數(shù)據(jù)集。
表3 密度取值范圍及其對(duì)應(yīng)標(biāo)簽Table 3 Density value range and its corresponding labels
表4 表面粗糙度Ra取值范圍及其對(duì)應(yīng)標(biāo)簽
在數(shù)據(jù)集1、2中隨機(jī)抽取900組數(shù)據(jù)作為測(cè)試集,不參與模型訓(xùn)練過程,只用于模型訓(xùn)練完成后測(cè)試模型性能,其余6 675組數(shù)據(jù)作為訓(xùn)練集對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。
常用的有監(jiān)督機(jī)器學(xué)習(xí)分類模型有以下5類:決策樹模型、判別分析模型、樸素貝葉斯分類器(Naive Bayesian Classifier)、支持向量機(jī)(Support Vector Machine,SVM)分類、最鄰近(-Nearest Neighbor,KNN)分類,每一類又可根據(jù)算法復(fù)雜度不同分為具體的算法模型。采用的相關(guān)21種具體機(jī)器學(xué)習(xí)算法模型及其特點(diǎn)見附錄B。
由于各種分類器的特點(diǎn)不同,模型復(fù)雜度不同,因此對(duì)不同數(shù)據(jù)的適用性也不同,采用21種機(jī)器學(xué)習(xí)模型逐一對(duì)構(gòu)建的兩個(gè)數(shù)據(jù)集進(jìn)行分類和預(yù)測(cè),比較不同分類器的分類準(zhǔn)確度和算法模型性能,分別得出異常識(shí)別和性能預(yù)測(cè)的最佳模型。
首先對(duì)工藝異常種類進(jìn)行識(shí)別可有針對(duì)性地實(shí)時(shí)調(diào)控,確保加工穩(wěn)定性和成形質(zhì)量。將數(shù)據(jù)集1中的訓(xùn)練集逐一輸入不同模型進(jìn)行訓(xùn)練,對(duì)工藝參數(shù)的異常類型進(jìn)行識(shí)別和分類,為減少數(shù)據(jù)過擬合、提高模型的泛化能力,在訓(xùn)練過程中采用五折交叉驗(yàn)證方法進(jìn)行模型訓(xùn)練,步驟如下:
1) 不重復(fù)抽樣,將6 675組數(shù)據(jù)隨機(jī)分為5份。
2) 每次挑選其中1份作為驗(yàn)證集,其余4份作為訓(xùn)練集訓(xùn)練模型。
3) 第2)步重復(fù)5次,使每個(gè)子集都有一次作為驗(yàn)證集,其余作為訓(xùn)練集。
4) 保存5次訓(xùn)練的驗(yàn)證結(jié)果,計(jì)算5組驗(yàn)證結(jié)果的平均值作為最終精度,以此作為五折交叉驗(yàn)證下模型的性能指標(biāo)。
訓(xùn)練完成后比較每個(gè)模型的分類準(zhǔn)確度,結(jié)論如表5所示??煽闯鰩追NSVM模型對(duì)熔池輻射強(qiáng)度的分類準(zhǔn)確度最高。表5中識(shí)別準(zhǔn)確度最高的二次SVM、三次SVM通過核方法(Kernel Method)對(duì)數(shù)據(jù)集進(jìn)行非線性分類。使用非線性函數(shù)將非線性可分問題從原始的特征空間映射至更高維的希爾伯特空間(Hilbert Space),即特征空間存在超曲面(Hyper Surface)將各個(gè)類別分開。由此可說明熔池輻射強(qiáng)度數(shù)據(jù)與其工藝異常類別之間存在高維度的聯(lián)系,只有使用SVM模型對(duì)數(shù)據(jù)樣本的最大邊距超平面決策邊界進(jìn)行求解才能獲得最高準(zhǔn)確度。
表5 加工參數(shù)異常識(shí)別準(zhǔn)確度
相比于支持向量機(jī)模型,準(zhǔn)確度最低的一類分類器屬于最鄰近法,其算法結(jié)構(gòu)較為簡(jiǎn)單,無法準(zhǔn)確表征數(shù)據(jù)內(nèi)部的復(fù)雜結(jié)構(gòu),因此準(zhǔn)確度相對(duì)較低。
3.2.1 模型優(yōu)化
使用隨機(jī)梯度下降法對(duì)二次SVM的分類問題進(jìn)行優(yōu)化,圖8展示了一次優(yōu)化過程的準(zhǔn)確度曲線,優(yōu)化過程可理解為在空間中尋找一個(gè)最優(yōu)化的超平面,使訓(xùn)練集上不同類別間離其最近的點(diǎn)到此超平面的距離最大化,這些點(diǎn)被稱為支持向量。具體步驟為:先使用數(shù)據(jù)集1中的訓(xùn)練集訓(xùn)練模型,將訓(xùn)練集全部輸入模型得到一個(gè)輸出,將此輸出標(biāo)簽與真實(shí)標(biāo)簽對(duì)比,計(jì)算準(zhǔn)確度;再根據(jù)輸出結(jié)果與真實(shí)值之間的差異,使用隨機(jī)梯度下降方法修正模型參數(shù),接著進(jìn)行下一輪迭代。如此進(jìn)行20萬次訓(xùn)練,每1 000次記錄一次準(zhǔn)確度得到圖8,可知在隨機(jī)梯度下降的過程中,準(zhǔn)確度曲線先隨訓(xùn)練次數(shù)增加而上升,直至約13萬次之后逐漸收斂,最終達(dá)到了93%以上并趨于平緩。
圖8 隨機(jī)梯度下降法下二次SVM模型的準(zhǔn)確度曲線Fig.8 Accuracy curve of quadratic SVM model with stochastic gradient descent method
3.2.2 結(jié)果分析
在高維空間中,每個(gè)特征維度都對(duì)應(yīng)一個(gè)坐標(biāo)軸,數(shù)據(jù)點(diǎn)在每個(gè)坐標(biāo)軸上的投影即為數(shù)據(jù)點(diǎn)相應(yīng)特征值。高維空間難以展示,所以用其中兩個(gè)特征為軸將這些數(shù)據(jù)點(diǎn)投影到二維平面以便于觀察。對(duì)比發(fā)現(xiàn)以平均值和波形因子分別作為橫、縱坐標(biāo)時(shí),同類數(shù)據(jù)點(diǎn)聚集性及不同類數(shù)據(jù)的區(qū)分度最佳,因此選擇平均值和波形因子為軸畫出散點(diǎn)圖。
圖9為將留出的900組測(cè)試集數(shù)據(jù)輸入訓(xùn)練后的二次SVM分類模型得出的熔池輻射強(qiáng)度分類散點(diǎn)圖。圖9中一個(gè)點(diǎn)即代表對(duì)應(yīng)橫縱坐標(biāo)數(shù)值下的一個(gè)樣本,不同顏色代表不同樣本的原始類別。由圖9可看出激光功率過小類別的樣本點(diǎn)均值特征明顯較小,此類樣本呈現(xiàn)明顯的聚集性。這表明激光功率的異常變化最直接地影響了熔池輻射強(qiáng)度數(shù)據(jù)特征變化,使數(shù)據(jù)特征在數(shù)值上出現(xiàn)了明顯差異。對(duì)于圖9中其余異常強(qiáng)度下的樣本,相同種類的樣本也呈現(xiàn)出一定的聚集性,但不同種類樣本點(diǎn)之間的重疊性較大,說明這些數(shù)據(jù)樣本具有在原始特征空間觀察不到的高維空間聚集性。
圖9 基于二次SVM分類模型的工藝參數(shù)異常識(shí)別散點(diǎn)圖Fig.9 Scatter plot of abnormality identification of process parameters based on quadratic SVM classification model
圖10為混淆矩陣,展示的是二次SVM分類模型性能指標(biāo),矩陣中的數(shù)據(jù)為將第類樣本判別為第類的樣本點(diǎn)百分比,所以對(duì)角線上越大表示分類模型的準(zhǔn)確度越高。圖10中TPR(True Positive Rate)為召回率,定義為
(4)
圖10 基于二次SVM分類模型的工藝參數(shù)識(shí)別混淆矩陣Fig.10 Confusion matrix for process parameter identification based on quadratic SVM classification model
式中:TP為真正例數(shù)(True Positive);FN為假負(fù)例數(shù)(False Negative)。
TPR可以理解為所有正類中預(yù)測(cè)正確的比例,即真正例數(shù)與假負(fù)例數(shù)之和中真正例數(shù)的比例。FNR(False Negative Rate)為正類中預(yù)測(cè)錯(cuò)誤的比例,定義為
(5)
從混淆矩陣中可看到功率過小和速度過小時(shí)識(shí)別準(zhǔn)確度達(dá)100.0%,分類器的準(zhǔn)確度非常高。在功率過大時(shí)TPR為83.3%,是幾個(gè)類別中最低的,說明在激光功率過大時(shí)容易出現(xiàn)錯(cuò)誤分類。分析原因認(rèn)為功率過大時(shí)熔池輻射強(qiáng)度容易超出采用的光電二極管量程,從而使傳感器采集到更多的錯(cuò)誤數(shù)據(jù),進(jìn)而影響識(shí)別準(zhǔn)確度。
經(jīng)過大量不同數(shù)據(jù)集的測(cè)試證明在使用熔池輻射強(qiáng)度數(shù)據(jù)進(jìn)行預(yù)測(cè)和分類時(shí),通常二次SVM模型準(zhǔn)確度最高,因此選用二次SVM模型分別對(duì)樣件密度和表面粗糙度進(jìn)行識(shí)別。
3.3.1 對(duì)密度的識(shí)別
由于10個(gè)樣件中標(biāo)記為“缺陷”的樣件只有1個(gè),使分類問題中不同類別數(shù)據(jù)樣本不均衡,易造成訓(xùn)練模型對(duì)大樣本類別過擬合而對(duì)小樣本類別欠擬合,為解決此問題,在構(gòu)建數(shù)據(jù)集時(shí)對(duì)小樣本類別進(jìn)行過采樣(over-sampling),即增加部分樣本,對(duì)大樣本類別進(jìn)行欠采樣(under-sampling),即刪除部分樣本,以此達(dá)到數(shù)據(jù)集的均衡。使用以密度作為分類標(biāo)簽經(jīng)過特征選擇、均衡處理之后的數(shù)據(jù)集(2 000組數(shù)據(jù))輸入二次SVM模型,以數(shù)據(jù)特征作為預(yù)測(cè)變量,以密度分類標(biāo)簽作為響應(yīng)訓(xùn)練模型,以五折交叉驗(yàn)證法訓(xùn)練模型,訓(xùn)練完成后將900組測(cè)試集的數(shù)據(jù)輸入,得到測(cè)試集數(shù)據(jù)樣本的密度預(yù)測(cè)結(jié)果,準(zhǔn)確度達(dá)99.6%,其識(shí)別結(jié)果散點(diǎn)圖如圖11所示。
圖11中被分類為缺陷的數(shù)據(jù)點(diǎn)明顯分布在均值較低的區(qū)域,集中度很高,且在縱坐標(biāo)波形因子分布上相對(duì)較高。而密度正常的樣本點(diǎn)集中程度較低,整體分布區(qū)域跨度較大,說明在形成致密樣件時(shí)存在一定的參數(shù)窗口,熔池輻射只要在此參數(shù)窗口下,樣件致密度均可處于較高水平。比較密度正常樣本與缺陷樣本可發(fā)現(xiàn)密度正常樣本通常聚集在均值較大區(qū)域,說明熔池輻射強(qiáng)度均值較小時(shí)更易出現(xiàn)致密度較低的情況,原因是此時(shí)不能充分熔化粉末。
圖11 基于二次SVM分類模型的密度預(yù)測(cè)散點(diǎn)圖Fig.11 Scatter plot of density prediction based on quadratic SVM classification model
3.3.2 對(duì)表面粗糙度的識(shí)別
同樣使用二次SVM模型,以表面粗糙度作為標(biāo)簽的訓(xùn)練數(shù)據(jù)集輸入模型進(jìn)行訓(xùn)練,使用測(cè)試集對(duì)訓(xùn)練結(jié)果進(jìn)行測(cè)試,得出對(duì)表面粗糙度的預(yù)測(cè)準(zhǔn)確度為97.0%,分類結(jié)果散點(diǎn)圖如圖12所示??煽闯鐾槐砻娲植诙阮愋椭g在一定程度上聚集在不同區(qū)域,其分散程度也有所不同,如過大時(shí)的數(shù)據(jù)點(diǎn)聚集在兩個(gè)不同的區(qū)域,正常的數(shù)據(jù)點(diǎn)有一部分較為集中,另一部分較為分散。分析其原因認(rèn)為與成形密度不同,在熔池輻射強(qiáng)度過大和過小時(shí)都會(huì)出現(xiàn)較大的表面形貌缺陷;而在輸入激光的功率和速度分別變化時(shí),不同的參數(shù)可產(chǎn)生相同的表面粗糙度,情況較為復(fù)雜,導(dǎo)致表面粗糙度相同類型的數(shù)據(jù)點(diǎn)呈現(xiàn)不同的分散程度。
圖12 二次SVM分類模型預(yù)測(cè)Ra散點(diǎn)圖Fig.12 Scatter plot of Ra predicted by quadratic SVM classification model
首先設(shè)計(jì)實(shí)驗(yàn),使用熔池輻射強(qiáng)度數(shù)據(jù)采集系統(tǒng)對(duì)粉末床激光成形中的強(qiáng)度數(shù)據(jù)進(jìn)行了采集;然后對(duì)其進(jìn)行數(shù)據(jù)分割、特征提取和特征選擇,使用工藝參數(shù)的異常類型及相應(yīng)密度、表面粗糙度進(jìn)行數(shù)據(jù)標(biāo)定;最后構(gòu)建了用于機(jī)器學(xué)習(xí)分類模型的數(shù)據(jù)集,并對(duì)模型進(jìn)行了訓(xùn)練。
1) 提出的熔池輻射強(qiáng)度數(shù)據(jù)特征提取方法可大幅減少過程監(jiān)控的數(shù)據(jù)量,提高數(shù)據(jù)計(jì)算和存儲(chǔ)效率。
2) 解決了監(jiān)測(cè)數(shù)據(jù)有效利用問題,對(duì)采集到的大量數(shù)據(jù)進(jìn)行了有效分析,建立了工藝參數(shù)-監(jiān)測(cè)數(shù)據(jù)-樣件質(zhì)量之間的關(guān)聯(lián)。機(jī)器學(xué)習(xí)分類模型對(duì)于制造過程中工藝參數(shù)的異常識(shí)別準(zhǔn)確度很高,可實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)熔池輻射強(qiáng)度數(shù)據(jù),進(jìn)行工藝參數(shù)異常識(shí)別,為實(shí)時(shí)反饋調(diào)整參數(shù)提供依據(jù),進(jìn)而達(dá)到提高產(chǎn)品質(zhì)量的目的。
3) 使用機(jī)器學(xué)習(xí)模型預(yù)測(cè)產(chǎn)品質(zhì)量,建立了監(jiān)測(cè)數(shù)據(jù)與最終質(zhì)量的聯(lián)系,對(duì)密度、表面粗糙度預(yù)測(cè)準(zhǔn)確度很高?;谌鄢剌椛鋸?qiáng)度監(jiān)測(cè)手段可一定程度上替代傳統(tǒng)人工復(fù)雜的質(zhì)量檢測(cè)方法,節(jié)省儀器和時(shí)間成本,從而實(shí)現(xiàn)實(shí)時(shí)預(yù)測(cè)質(zhì)量,對(duì)樣件進(jìn)行智能分類。