任黎明,石宇強,王俊佳
(西南科技大學(xué) 制造科學(xué)與工程學(xué)院,綿陽 621010)
“中國制造2025”,“美國工業(yè)互聯(lián)網(wǎng)”,“德國工業(yè)4.0”等制造戰(zhàn)略等促使工業(yè)革命已經(jīng)開啟向4.0時代邁進(jìn)的嶄新步伐[1]。新一代信息技術(shù)(如大數(shù)據(jù),物聯(lián)網(wǎng),云計算,移動互聯(lián),5G等)與制造業(yè)的融合愈加密切,這對于大型及批量加工生產(chǎn)的傳統(tǒng)制造業(yè)無疑提出了巨大的機遇與挑戰(zhàn)[2]。產(chǎn)品質(zhì)量作為制造業(yè)最靚麗的名片,且智能制造發(fā)展規(guī)劃中也明確提出我國制造業(yè)要最終實現(xiàn)從制造強國向質(zhì)量強國的邁進(jìn)[3]。
復(fù)雜多階段產(chǎn)品制造過程中,由于5M1E等各種因素的影響,當(dāng)制品經(jīng)過該生產(chǎn)階段時,其可能還要用額外的時間去加工前一生產(chǎn)階段造成的質(zhì)量不足[4]。故對復(fù)雜多階段產(chǎn)品質(zhì)量溯源時會較為困難[5~7]。因此,當(dāng)制品從當(dāng)前階段進(jìn)入新的生產(chǎn)階段之前,精準(zhǔn)識別引起質(zhì)量的異常工藝參數(shù)和加工狀態(tài)參數(shù),并將其進(jìn)行數(shù)據(jù)分析優(yōu)化,是提高最終產(chǎn)品的質(zhì)量的重要方式[8]。
目前,復(fù)雜多階段產(chǎn)品質(zhì)量預(yù)測的主要方法有:Shi等[9]應(yīng)用變異流分析方法來控制各變量對質(zhì)量的影響。Bera[10]利用多元多項式回歸模型預(yù)測產(chǎn)品質(zhì)量。Ding等[11]應(yīng)用黑盒機器學(xué)習(xí)模型預(yù)測最終產(chǎn)品質(zhì)量,然而,這些模型在預(yù)測的高精度和易解釋方面存在一定的不足。王等[12]提出一種對于增量學(xué)習(xí)策略,對關(guān)鍵質(zhì)量階段進(jìn)行轉(zhuǎn)移學(xué)習(xí)以提高預(yù)測性能,但其把整個生產(chǎn)過程視為一個階段,這對于各階段的質(zhì)量累計誤差考慮有點欠缺。Kao等[13]提出將主成分分析法(PCA)與關(guān)聯(lián)規(guī)則挖掘算法(ID3)相結(jié)合的方法預(yù)測多階段制造最終產(chǎn)品質(zhì)量。J Sreedhara等[14]使用灰色關(guān)聯(lián)分析和主成分分析方法對多階段順序塑料注射成型的多目標(biāo)優(yōu)化問題進(jìn)行研究。數(shù)據(jù)驅(qū)動的方法對產(chǎn)品質(zhì)量進(jìn)行預(yù)測及控制以實現(xiàn)質(zhì)量問題實時溯源及相關(guān)工藝參數(shù)優(yōu)化,以保障最終的產(chǎn)品質(zhì)量,減少殘次品是傳統(tǒng)工業(yè)轉(zhuǎn)型升級的重要趨勢[15]。
綜上,本文提出一種數(shù)據(jù)驅(qū)動的復(fù)雜多階段產(chǎn)品質(zhì)量預(yù)測方法,即應(yīng)用RBDBN方法對各階段質(zhì)量屬性對應(yīng)的工藝參數(shù)進(jìn)行質(zhì)量規(guī)則挖掘及形成質(zhì)量判別網(wǎng)絡(luò),再應(yīng)用Catboost算法預(yù)測各階段產(chǎn)品質(zhì)量及最終產(chǎn)品質(zhì)量,將該方法應(yīng)用于注塑制品的質(zhì)量預(yù)測,結(jié)果表明該方法具有較強的預(yù)測效果。
復(fù)雜多階段制造產(chǎn)品質(zhì)量數(shù)據(jù)有高維,小樣本,數(shù)據(jù)類別嚴(yán)重不平衡的特征。各個階段對應(yīng)的工藝參數(shù)及質(zhì)量指標(biāo)不同,其對最終產(chǎn)品質(zhì)量的影響也各有差異。因此,每個階段需要有該階段的質(zhì)量特征動態(tài)自適應(yīng)預(yù)測模型,通過數(shù)據(jù)驅(qū)動方法對歷史數(shù)據(jù)深度分析,挖掘出各階段質(zhì)量相關(guān)的參數(shù)特征對應(yīng)的質(zhì)量規(guī)則,以實時預(yù)測下一階段質(zhì)量屬性并且根據(jù)該階段的質(zhì)量異常進(jìn)行相關(guān)工藝參數(shù)優(yōu)化,以制造出最終高質(zhì)量的復(fù)雜多階段產(chǎn)品及最小化次品率。
該模型主要根據(jù)前i,i-1,…1階段的產(chǎn)品質(zhì)量狀態(tài)及其工藝參數(shù)預(yù)測第i+1階段的質(zhì)量指標(biāo)直至預(yù)測最終的產(chǎn)品質(zhì)量是否合格,以便最早發(fā)現(xiàn)復(fù)雜多階段制造產(chǎn)品的質(zhì)量問題,并實時溯源工藝參數(shù)以及時優(yōu)化導(dǎo)致產(chǎn)品不良的工藝參數(shù)。對于多階段制造產(chǎn)品,其質(zhì)量特性可能不僅僅用一種指標(biāo)來判定。如產(chǎn)品的重量,翹曲率,尺寸等質(zhì)量指標(biāo)。各階段產(chǎn)品質(zhì)量指標(biāo)可用式(1)表示:
式中,Ysi表示第i階段的產(chǎn)品第s個質(zhì)量指標(biāo),wij表示第i階段的第j個工藝參數(shù)特性對Ysi的影響權(quán)重,ei表示隨機誤差。
階段轉(zhuǎn)移誤差:
式中,xij表示第i階段的第j個工藝特征,Ai-1,jxi-1,j表示從i-1階段到i階段第j個工藝參數(shù)導(dǎo)致的質(zhì)量轉(zhuǎn)移誤差,Bi,jei,j表示第i階段制造過程誤差,Wi表示第i階段的系統(tǒng)誤差。i=1…M,表示階段數(shù),j=1…n,表示該階段的工藝參數(shù)特征,s=1,2…S,表示質(zhì)量屬性數(shù)。
最終產(chǎn)品質(zhì)量可用式(3)表示:
通過對最終產(chǎn)品質(zhì)量Ysf進(jìn)行歸一化處理,式(4)表示:
即Ysf∈{0,1},0表示不合格,1表示合格,故其為二分類問題預(yù)測。
建立基于規(guī)則的深度置信網(wǎng)絡(luò)(RBDBN)形成一個自適應(yīng)的多階段質(zhì)量規(guī)則分類模型;以動態(tài)的反映整個復(fù)雜產(chǎn)品多階段制造過程實時產(chǎn)品質(zhì)量。以注塑過程的重量、翹曲率和尺寸作為各階段制品質(zhì)量預(yù)測指標(biāo)。隨著產(chǎn)品在各階段的制造,各階段的制造工藝參數(shù)對這三個指標(biāo)的影響程度不同,且各工藝參數(shù)與質(zhì)量特征有不同的關(guān)聯(lián)性。因此,建立各階段質(zhì)量指標(biāo)預(yù)測及優(yōu)化模型優(yōu)于在產(chǎn)品制造的最終階段對質(zhì)量預(yù)測,也利于對質(zhì)量異常進(jìn)行溯源和工藝參數(shù)的實時優(yōu)化。深度置信網(wǎng)絡(luò)(DBN)作為深度學(xué)習(xí)的常用模型之一,其由多個受限玻爾茲曼(RBM)組成,如圖2所示。將多階段制造過程質(zhì)量分類標(biāo)簽融入到深度置信網(wǎng)絡(luò)DBN的分類層,形成基于規(guī)則的深度置信網(wǎng)絡(luò)(RBDBN)以得到各階段不同工藝參數(shù)及質(zhì)量指標(biāo)的分類結(jié)果。該模型中加入動態(tài)預(yù)測模型,可以實時反饋調(diào)控異常工藝參數(shù)及更新質(zhì)量規(guī)則。同時,也提高了深度置信網(wǎng)絡(luò)的作為“黑箱模型”的可解釋性。
圖1 復(fù)雜多階段產(chǎn)品制造流程
圖2 RBDBN質(zhì)量分類規(guī)則
工業(yè)互聯(lián)網(wǎng)和5G技術(shù)在制造業(yè)的應(yīng)用將復(fù)雜多階段產(chǎn)品制造過程工藝參數(shù)及質(zhì)量數(shù)據(jù)低延遲傳輸至質(zhì)量參數(shù)數(shù)據(jù)庫,根據(jù)實時數(shù)據(jù)與歷史訓(xùn)練集數(shù)據(jù)的分析優(yōu)化,形成動態(tài)自適應(yīng)的預(yù)測模型,再根據(jù)優(yōu)化后的數(shù)據(jù)對異常工藝參數(shù)進(jìn)行調(diào)整及更新質(zhì)量數(shù)據(jù)集,再應(yīng)用RBDBN算法獲得更優(yōu)異的質(zhì)量分類規(guī)則。
動態(tài)自適應(yīng)預(yù)測模型:
轉(zhuǎn)移誤差最小化:
Ω(eu)表示第u階段的動態(tài)誤差,u=1…M,Y1,su表示第u階段的第s個質(zhì)量指標(biāo)及其工藝參數(shù)的實時數(shù)據(jù),Y2,su表示第u階段的第s個質(zhì)量分類規(guī)則提取的質(zhì)量指標(biāo)及工藝參數(shù)的訓(xùn)練集數(shù)據(jù),將式(6)作為DBN隱藏層的目標(biāo)函數(shù)進(jìn)行最優(yōu)質(zhì)量分類規(guī)則挖掘。
詳細(xì)算法規(guī)則如表1所示,此處只引用本文所需的質(zhì)量標(biāo)簽的規(guī)則分類,其他規(guī)則的詳細(xì)推導(dǎo)進(jìn)定義可參閱[16]。
表1 RBDBN算法細(xì)則
在該算法中,使用IF-THEN 方法即if(X ij>V1)∧...∧(xi<Vi)thenYsi=Q的分類規(guī)則方法對輸入算法的工藝參數(shù)特征及對應(yīng)的質(zhì)量屬性數(shù)據(jù)集進(jìn)行分析,形成質(zhì)量分類規(guī)則。Ri分類規(guī)則標(biāo)簽,xij為該規(guī)則提取到的參數(shù)特征,Ysi為被賦予的類型值(0為不合格,1為合格),Q為質(zhì)量標(biāo)簽,V1…Vi為設(shè)定的閾值,類型值用適應(yīng)度函數(shù):
來檢驗生成規(guī)則的對此類特征的敏感度,以確保較高的分類精度。其中隱藏層的激活函數(shù)為Sigmod函數(shù)。如一個注塑產(chǎn)品重量合格區(qū)間為(20~30mg),則提取規(guī)則如表2所示:
表2 分類規(guī)則及F檢驗
通過RBDBN模型對各階段制造過程參數(shù)及質(zhì)量屬性應(yīng)用質(zhì)量最優(yōu)規(guī)則進(jìn)行階段內(nèi)的制造過程工藝參數(shù)優(yōu)化。再應(yīng)用Catboost算法對各階段質(zhì)量指標(biāo)預(yù)測,將最優(yōu)預(yù)測模型輸出的質(zhì)量屬性及最佳工藝參數(shù)返回至歷史數(shù)據(jù)庫,應(yīng)用RBDBN模型不斷進(jìn)行工藝參數(shù)優(yōu)化及質(zhì)量規(guī)則的深度挖掘,不斷更新質(zhì)量規(guī)則庫,為后續(xù)生產(chǎn)階段提供優(yōu)質(zhì)的質(zhì)量預(yù)判網(wǎng)絡(luò)。再將新階段的加工工藝參數(shù)輸入Catboost模型以完成對新階段的復(fù)雜多階段多質(zhì)量指標(biāo)產(chǎn)品質(zhì)量的預(yù)測,復(fù)雜多階段產(chǎn)品質(zhì)量預(yù)測流程如表3和圖3所示。具體Catboost相關(guān)參數(shù)推導(dǎo)及算法細(xì)則參閱[17]。
圖3 數(shù)據(jù)驅(qū)動的復(fù)雜多階段產(chǎn)品質(zhì)量動態(tài)自適應(yīng)預(yù)測流程
表3 Catboost算法細(xì)則
本文對西南A工廠的注塑制品進(jìn)行分析,其制造過程主要包含3個關(guān)鍵階段(填充,保壓,冷卻)及相關(guān)關(guān)鍵工藝參數(shù)和質(zhì)量特性如表4所示。通過數(shù)據(jù)驅(qū)動和基于規(guī)則的深度置信網(wǎng)絡(luò)(RBDBN)的方法進(jìn)行工藝參數(shù)數(shù)據(jù)(注射時間,溫度,壓力等參數(shù))及質(zhì)量數(shù)據(jù)(重量,翹曲率,表面尺寸等)進(jìn)行各制造階段的規(guī)則挖掘。對于不合格的工藝參數(shù)應(yīng)用NSGAII算法進(jìn)行工藝參數(shù)的優(yōu)化及控制,以實現(xiàn)制造高質(zhì)量注塑產(chǎn)品各階段工藝參數(shù)的自適應(yīng)優(yōu)化[18],再應(yīng)用Catboost分類算法進(jìn)行新階段及最終制品的質(zhì)量預(yù)測。
表4 注塑制品關(guān)鍵工藝參數(shù)及質(zhì)量指標(biāo)
將A工廠MES中存儲的1000個制品樣本數(shù)據(jù)進(jìn)行關(guān)鍵工藝參數(shù)特征提取及歸一化處理,應(yīng)用Scikit-Learn進(jìn)行訓(xùn)練集和測試集劃分,其中800個作為預(yù)測模型的訓(xùn)練樣本,200個作為測試集進(jìn)行驗證模型的性能指標(biāo),對文中涉及的模型使用GridSearch CV進(jìn)行參數(shù)尋優(yōu)且模型的其余參數(shù)都相同。
由圖4可知,重量指標(biāo)(Q1)重要參數(shù)有(X7),(X3),(X4),(X1),故保壓階段和冷卻階段對該質(zhì)量屬性影響較大;翹曲率(Q2)重要參數(shù)有(X2),(X4),(X5),(X6),故注射階段和冷卻階段對該質(zhì)量屬性影響較大;尺寸(Q3)重要參數(shù)有(X5),(X6),故注射階段對該質(zhì)量屬性影響最大。針對不同的質(zhì)量屬性可以制定相關(guān)關(guān)鍵階段的工藝參數(shù)優(yōu)化方案,當(dāng)有某個質(zhì)量屬性有異常時,可以實時優(yōu)化相關(guān)階段的某些關(guān)鍵工藝參數(shù)以提高各階段的產(chǎn)品質(zhì)量。
圖4 工藝參數(shù)與質(zhì)量相關(guān)性分析
將經(jīng)RBDBN規(guī)則處理過的各工藝參數(shù)特征輸入CatboostClassifier分類模型中,和SVN,決策樹,XGBoost和Lightgbm算法進(jìn)行分析對比。由于本文的案例數(shù)據(jù)集合在質(zhì)量類別比例差別很大,所以本文使用AUC(Area Under Curve)被定義為ROC(受試者工作特征曲線)曲線下的面積,這個評價指標(biāo)在類別分類較大的情況下比準(zhǔn)確率等評價指標(biāo)評估分類模型更具有可信度。
圖5表示對重量屬性(Q1)的AUC指標(biāo)進(jìn)行對比分析,從圖中分析得知Catboost分類算法在多屬性及類別差異性較大的情況下具有較強的分類能力。
圖5 Q1(重量)各預(yù)測模型AUC值
圖6,圖7分別表示對翹曲率屬性(Q2)和尺寸變化屬性(Q3)的AUC指標(biāo)對比分析,由圖可知Catboost分類算法有較強的分類能力。
圖6 Q2(翹曲率)各預(yù)測模型AUC值
圖7 Q3(尺寸)各預(yù)測模型AUC值
應(yīng)用Catboost算法對50個已知新制品工藝參數(shù)及質(zhì)量屬性的產(chǎn)品進(jìn)行多質(zhì)量指標(biāo)的預(yù)測,不同產(chǎn)品質(zhì)量預(yù)測指標(biāo)代表該產(chǎn)品在不同生產(chǎn)階段重要性。橫坐標(biāo)表示注塑制品ID,縱坐標(biāo)表示質(zhì)量標(biāo)簽,0表示不合格,1表示合格。
圖8和圖9表示使用該算法對最終產(chǎn)品的Q1(重量)和Q3(尺寸變化屬性)屬性進(jìn)行預(yù)測。圖中結(jié)果表明Catboost分類算法對類別差異較大的數(shù)據(jù)有分類具有較好的預(yù)測能力,其預(yù)測值與真實值相差不大,其預(yù)測正確率為98.56%,即使將某些合格產(chǎn)品預(yù)測失誤,經(jīng)簡單復(fù)檢可以獲得高質(zhì)量的產(chǎn)品。
圖8 重量(Q1)預(yù)測與真實值
圖9 尺寸(Q3)預(yù)測與真實值
圖10表示使用Catboost算法對最終產(chǎn)品Q2(翹曲率)屬性進(jìn)行預(yù)測。圖中結(jié)果表明該分類算法的預(yù)測值與真實值完全一致,測試結(jié)果正確率為100%,表明該預(yù)測模型預(yù)測精度較高。
圖10 翹曲率(Q2)預(yù)測與真實值
復(fù)雜多階段產(chǎn)品的各階段制造工藝參數(shù)對各階段制品質(zhì)量及最終產(chǎn)品質(zhì)量影響差異大,對異常工藝參數(shù)無法實時溯源及優(yōu)化的難題。通過對復(fù)雜產(chǎn)品生產(chǎn)的全生命周期數(shù)據(jù)自動實時采集,提出一種數(shù)據(jù)驅(qū)動的 復(fù)雜多階段產(chǎn)品質(zhì)量預(yù)測模型,即應(yīng)用RBDBN(基于規(guī)則的深度置信網(wǎng)絡(luò))算法以實時優(yōu)化各階段異常工藝參數(shù)以更好預(yù)測最終產(chǎn)品質(zhì)量及基于Catboost算法對復(fù)雜多階段多質(zhì)量屬性產(chǎn)品進(jìn)行預(yù)測,通過注塑制造產(chǎn)品質(zhì)量預(yù)測案例結(jié)果驗證所提模型的有效性及較高預(yù)測精度。