楊 辰,郭 宇,黃少華,崔世婷
(南京航空航天大學(xué)機電學(xué)院,江蘇 南京 210016)
面向多品種、變批量生產(chǎn)的離散制造系統(tǒng)具有典型的動態(tài)性和不確定性特點,設(shè)備故障、物料短缺、緊急任務(wù)插入等生產(chǎn)異常往往不可預(yù)測[1]。傳統(tǒng)生產(chǎn)中,當(dāng)異常發(fā)生時,由于缺乏及時、準(zhǔn)確的生產(chǎn)制造信息,生產(chǎn)異常會逐漸蔓延,對生產(chǎn)進(jìn)度造成重大影響。隨著物聯(lián)網(wǎng)技術(shù)在生產(chǎn)制造中的應(yīng)用發(fā)展,生產(chǎn)要素的實時信息得以被感知采集[2],使得管理者能夠及時、準(zhǔn)確地掌握車間生產(chǎn)狀態(tài)信息。由此,如何通過分析車間生產(chǎn)狀態(tài)數(shù)據(jù),使管理者能夠及時發(fā)現(xiàn)和分析異常信息,成為了提高車間生產(chǎn)效率不可避免的研究問題之一。
文獻(xiàn)[3]通過建立基于在制品加工工序的事件監(jiān)控模型,實現(xiàn)了對離散制造車間全周期的生產(chǎn)狀態(tài)監(jiān)控。文獻(xiàn)[4]為挖掘生產(chǎn)過程中的生產(chǎn)異常對離散制造過程中的復(fù)雜事件進(jìn)行了提煉和推理。異常事件的發(fā)現(xiàn)可以使管理人員直觀地觀測到生產(chǎn)過程中發(fā)生的異常,但無法從整個生產(chǎn)系統(tǒng)層面了解到由異常事件引起的生產(chǎn)異常持續(xù)時間和嚴(yán)重程度,而如果頻繁處理異常事件易導(dǎo)致生產(chǎn)系統(tǒng)震蕩而影響生產(chǎn)順利進(jìn)行。針對生產(chǎn)系統(tǒng)層面上的異常發(fā)現(xiàn)問題,當(dāng)前采用的研究方法大都是依據(jù)某一屬性的影響因素取值預(yù)測該屬性未來的狀態(tài)或取值。文獻(xiàn)[5]對微車后橋關(guān)鍵生產(chǎn)工序的生產(chǎn)異常事件進(jìn)行了系統(tǒng)分類,并通過徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對生產(chǎn)過程中關(guān)鍵工序生產(chǎn)異常損失進(jìn)行了預(yù)測。文獻(xiàn)[6]為預(yù)測離散制造車間在加工準(zhǔn)備階段以及執(zhí)行階段存在的異常對訂單質(zhì)量和交付期的影響,并建立了基于多決策樹預(yù)測模型。文獻(xiàn)[7]提出基于時間加權(quán)的深度神經(jīng)網(wǎng)絡(luò)模型,通過影響訂單完成時間的特征因素與其計劃的偏離程度來預(yù)測訂單完成時間。上述學(xué)者采用不同的機器學(xué)習(xí)方法來構(gòu)建預(yù)測模型,以挖掘不同生產(chǎn)異常衡量指標(biāo)與其所有影響因素之間的映射規(guī)律,但大都未關(guān)注引發(fā)生產(chǎn)異常衡量指標(biāo)異常的具體影響因素及其自身造成的生產(chǎn)異常程度。
基于以上分析,對上述兩類方法進(jìn)行有效結(jié)合,提出一種物聯(lián)網(wǎng)環(huán)境下的車間生產(chǎn)異常發(fā)現(xiàn)與分析方法。以物聯(lián)網(wǎng)技術(shù)為支撐,通過構(gòu)建在制品信息采集模型,定義在制品異常事件類型,實時監(jiān)測在制品異常事件,實現(xiàn)生產(chǎn)過程中的異常發(fā)現(xiàn)。在此基礎(chǔ)上,通過構(gòu)建生產(chǎn)異常衡量指標(biāo)并對其影響因素進(jìn)行分析,建立基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的剩余完工時間預(yù)測模型,實現(xiàn)異常事件對生產(chǎn)影響程度的定量分析。
生產(chǎn)異常發(fā)現(xiàn)與分析的具體運作模式,如圖1所示。
圖1 生產(chǎn)異常發(fā)現(xiàn)與分析運作模式Fig.1 Operational Mode of the Production Abnormality Discovery and Analysis
在基于物聯(lián)網(wǎng)的制造環(huán)境中,可實時感知車間生產(chǎn)狀態(tài)數(shù)據(jù),并基于企業(yè)上層系統(tǒng)(MES∕ERP)針對當(dāng)前生產(chǎn)任務(wù)所制定的產(chǎn)品加工計劃和異常事件判斷規(guī)則,對在制品實時狀態(tài)信息進(jìn)行分析,判斷是否存在在制品異常事件。若不存在,則繼續(xù)進(jìn)行判斷。若存在,則從上層系統(tǒng)中提取影響生產(chǎn)任務(wù)剩余完成時間的因素的實時狀態(tài)信息作為預(yù)測模型輸入,動態(tài)觸發(fā)以歷史數(shù)據(jù)集訓(xùn)練的生產(chǎn)任務(wù)剩余完成時間預(yù)測模型的執(zhí)行,通過預(yù)測結(jié)果與計劃剩余完成時間的偏差,即生產(chǎn)任務(wù)延遲完成時間,來量化當(dāng)前存在的異常事件對車間生產(chǎn)的影響程度。最后,由車間管理人員根據(jù)發(fā)現(xiàn)的異常事件和影響程度進(jìn)行實時調(diào)度管控。
離散制造車間中所有資源發(fā)生的異常最終都能映射到生產(chǎn)過程中與在制品相關(guān)的事件上,通過對在制品的異常事件的監(jiān)測可以達(dá)到生產(chǎn)異常發(fā)現(xiàn)的目的。在離散制造過程中,可以將在制品的異常事件概括為在制品在不同加工工序上與加工計劃不匹配的狀態(tài)改變。在物聯(lián)網(wǎng)環(huán)境下,在制品可實現(xiàn)整個加工過程的狀態(tài)監(jiān)測,以在制品j在設(shè)備m上進(jìn)行某道工序加工的狀態(tài)信息采集為例,如圖2所示。
圖2 在制品的實時狀態(tài)信息采集模型Fig.2 The Real-time State Acquisition Model of WIP
根據(jù)采集模型描述,將在制品的異常事件概括分為:(1)與生產(chǎn)業(yè)務(wù)邏輯相關(guān)的異常事件,例如某個在制品的加工順序不符合工藝流程等;(2)與生產(chǎn)過程時間相關(guān)的異常事件,例如某個在制品在某個位置停留時間過長(或過短)等異常事件;基于以上分析,對所監(jiān)測的異常事件及判斷條件進(jìn)行定義,如表1所示。
表1 在制品異常事件Tab.1 Abnormal Events of WIP
當(dāng)在制品在生產(chǎn)過程中發(fā)生異常事件時,隨著生產(chǎn)加工的連續(xù)進(jìn)行,其產(chǎn)生的干擾會在一段時間內(nèi)持續(xù)影響當(dāng)前車間生產(chǎn)任務(wù)剩余部分的正常執(zhí)行,即可認(rèn)為異常事件對生產(chǎn)過程造成的異常影響會反映在生產(chǎn)任務(wù)的實際剩余完成時間上。由此,可通過生產(chǎn)任務(wù)的實際剩余完成時間與計劃剩余完成時間的偏差,即生產(chǎn)任務(wù)延遲完成時間D,來衡量異常事件對于后續(xù)生產(chǎn)任務(wù)執(zhí)行的影響程度,表達(dá)如下:
式中:D P E—生產(chǎn)任務(wù)的計劃剩余完成時間,為確定值;DPA—實際剩余完成時間,將D P A作為預(yù)測模型輸出,以獲得生產(chǎn)任務(wù)延遲完成時間。
假設(shè)當(dāng)前時刻為T n,DP A取值的影響因素[8]主要包括T n時刻的車間生產(chǎn)狀態(tài)(車間所有在制品的加工狀態(tài))以及當(dāng)前生產(chǎn)任務(wù)的組成。由上節(jié)描述所知,T n時刻的車間生產(chǎn)狀態(tài)可由T n時刻車間每臺設(shè)備的入緩存區(qū)狀態(tài)I S、設(shè)備加工區(qū)狀態(tài)M S、出緩存區(qū)狀態(tài)O S以及從此出緩存區(qū)出去的在制品的轉(zhuǎn)運狀態(tài)RS構(gòu)成。因此,D P A可表達(dá)為:
式中:h(·)—DPA與其影響因素的映射函數(shù);Q k—第k種類型在制品的數(shù)量;IS T n、M S T n、O S T n、RS T n—T n時刻車間所有設(shè)備的入緩存區(qū)狀態(tài)、設(shè)備加工區(qū)狀態(tài)、出緩存區(qū)狀態(tài)和轉(zhuǎn)運狀態(tài);在基于車間物聯(lián)感知環(huán)境下,以設(shè)備m為例,對上述四類狀態(tài)的組成和量化方式進(jìn)行描述,如表2所示。
表2 車間生產(chǎn)狀態(tài)描述Tab.2 Workshop Production Status Description
為了對異常事件的影響程度進(jìn)行分析,需將上節(jié)描述的D P A影響因素作為數(shù)據(jù)輸入,并對D P A進(jìn)行預(yù)測。離散制造過程中產(chǎn)生的生產(chǎn)狀態(tài)數(shù)據(jù)特征繁多且復(fù)雜,而CNN所具有的權(quán)值共享技術(shù)降低了神經(jīng)網(wǎng)絡(luò)所需的參數(shù)數(shù)量,能使其在處理多特征數(shù)據(jù)方面具有較強優(yōu)勢。結(jié)合離散制造數(shù)特征,采用的網(wǎng)絡(luò)模型結(jié)構(gòu),如圖3所示。
圖3 CNN網(wǎng)絡(luò)模型Fig.3 Convolutional Neural Networks Model
由于生產(chǎn)狀態(tài)數(shù)據(jù)常以列表形式存儲且長度較長,為了便于CNN對其進(jìn)行處理分析,在數(shù)據(jù)輸入到網(wǎng)絡(luò)進(jìn)行訓(xùn)練前,將原始數(shù)據(jù)轉(zhuǎn)化為二維特征圖。轉(zhuǎn)化步驟為:(1)假定輸入數(shù)據(jù)的長度為L;(2)根據(jù)L決定二維特征圖的尺寸大?。簈×p。其中,L≤q×p;(3)將輸入數(shù)據(jù)的前q個數(shù)據(jù)作為二維特征圖的第一行,接下來的q個數(shù)據(jù)作為第二行,以此類推。最后缺少的數(shù)據(jù)以0填充。
CNN[9]的特征提取部分由卷積層和下采樣層兩層交替組成。卷積層通過在輸入特征圖上滑動權(quán)值矩陣并與被覆蓋局部子矩陣進(jìn)行卷積操作以提取局部特征,公式如下:
式中:—第l層中的第j個卷積輸出特征子圖—第l-1層的第i個輸入特征子圖—在第l層用來連接第i個輸入特征子圖與第j個輸出特征子圖的權(quán)值矩陣;—第l層第j個輸出特征子圖的偏置;f(?)—激活函數(shù),采用ReLU函數(shù),可有效解決梯度彌散問題,使梯度得以有效傳播。
在學(xué)習(xí)過程中,為了減小網(wǎng)絡(luò)每一層特征值的分布波動帶來的影響,引入批量歸一化[10],將卷積神經(jīng)網(wǎng)絡(luò)每一層卷積操作后的特征值進(jìn)行歸一化操作后再進(jìn)行激活操作,以保證特征值的方差為1,均值為0,大大減少了特征值的差異性,提升了卷積神經(jīng)網(wǎng)絡(luò)的魯棒性和訓(xùn)練速度。計算過程如下:
式中:n—批量化尺寸;x i—輸入(卷積操作后的輸出);y i—輸出;μb—均值和方差;γ、β—重構(gòu)參數(shù),用來保持特征分布不變,須通過學(xué)習(xí)確定;ε—微常量。
為解決卷積操作后造成的特征維數(shù)增加問題,對特征圖進(jìn)行最大下采樣操作,可在減少數(shù)據(jù)處理量的同時,仍較好地保留有用信息。
原始特征圖經(jīng)由特征提取部分后,提取出若干有效特征,最終由全連接層進(jìn)行回歸預(yù)測。假設(shè)第l+2層為全連接層,和分別表第l+2層的特征j與上層的特征i的連接權(quán)值和偏置,則其計算如下:
由于這種全連接關(guān)系易造成過擬合現(xiàn)象,引入隨dropout技術(shù),對特征以相同的概率值進(jìn)行丟棄,一方面可以簡化連接關(guān)系,加快網(wǎng)絡(luò)訓(xùn)練。另一方面,每次訓(xùn)練出現(xiàn)的特征不完全相同,使參數(shù)更新不再受限于固定的特征連接關(guān)系,減小了過擬合的發(fā)生。
在回歸預(yù)測過程中,采用Adam優(yōu)化器[11]反向傳播,以更新網(wǎng)絡(luò)參數(shù),使代價函數(shù)達(dá)到極小化。傳統(tǒng)反向傳播算法采用固定的學(xué)習(xí)率更新參數(shù),學(xué)習(xí)率對網(wǎng)絡(luò)模型的性能有顯著的影響,往往難以設(shè)置,而Adam可以使學(xué)習(xí)率根據(jù)參數(shù)自適應(yīng)地更新,從而避免網(wǎng)絡(luò)陷入局部最優(yōu)值。以第t次迭代更新過程為例:
式中:E—代價函數(shù),這里采用均方誤差;θ—網(wǎng)絡(luò)中的所有權(quán)值和偏置;ρ1、ρ2—在區(qū)間[0,1)內(nèi)的固定參數(shù);m(t)和v(t)—梯度的一階矩估計和二階矩估計,由于v(0)=0,m(0)=0,為避免其接近零向量,對上式進(jìn)行偏差修正。
修正后,m?(t)和v?(t)對學(xué)習(xí)率α進(jìn)行動態(tài)調(diào)整。最終,權(quán)值和偏置的更新公式如下:
式中:ε—用于數(shù)值穩(wěn)定的常數(shù),取值為10-8。
以某航天企業(yè)的精密機加車間為例,該車間由13臺設(shè)備組成,主要加工8種類型的零件,每臺設(shè)備出緩存區(qū)與入緩存區(qū)容量大小固定且同一時刻只能加工一個在制品,并遵循先到先加工原則。隨機選取特征維數(shù)為629的8745組車間樣本數(shù)據(jù)作為網(wǎng)絡(luò)訓(xùn)練和測試數(shù)據(jù)集,比例為8:2。經(jīng)過反復(fù)對比試驗后,對網(wǎng)絡(luò)參數(shù)進(jìn)行設(shè)置,其中訓(xùn)練過程學(xué)習(xí)率為0.0005,迭代次數(shù)為200,批量化尺寸為256,dropout保留率為0.93,詳細(xì)參數(shù),如表3所示。
表3 網(wǎng)絡(luò)模型參數(shù)Tab.3 Parameters of Network Model
為驗證所訓(xùn)練的CNN網(wǎng)絡(luò)模型的預(yù)測精度,從測試集中隨機抽取200組樣本數(shù)據(jù)進(jìn)行測試,測試結(jié)果,如圖4所示。圖中紅色點表示實際的DP A值,藍(lán)色點表示預(yù)測的D P A值??梢钥闯?,大部分對應(yīng)的藍(lán)色點與紅色點呈重合狀態(tài),存在較小部分呈偏離狀態(tài)但偏離程度較小,能較為精確地通過車間實時生產(chǎn)狀態(tài)數(shù)據(jù)對生產(chǎn)任務(wù)的剩余加工時間進(jìn)行預(yù)測。
圖4 CNN預(yù)測結(jié)果對比圖Fig.4 Comparison of Actual and Predicted DPA Values Using CNN
同時,將其與本領(lǐng)域使用過的稀疏自編碼器[7](SAE,Sparse Autoencoder)、BP神經(jīng)網(wǎng)絡(luò)[12]進(jìn)行實驗比較,兩者的預(yù)測效果,如圖5、圖6所示。對比可見,CNN的預(yù)測精度明顯優(yōu)于BP(500-313-20)和SAE,后兩者的藍(lán)色預(yù)測值與紅色真實值呈重合狀態(tài)的部分較少且其中絕大部分的偏離程度較大。
圖5 SAE預(yù)測結(jié)果對比圖Fig.5 Comparison of Actual and Predicted DPA Values Using SAE
圖6 BP(500-313-20)預(yù)測結(jié)果對比圖Fig.6 Comparison of Actual and Predicted DPA Values Using BP(500-313-20)
在實驗中,選取根均方差(RMSE,root mean square error)來度量上述三種模型預(yù)測值同真實值之間的偏差以作為測量過程精度的標(biāo)準(zhǔn),如圖7所示。CNN模型的RMSE測試訓(xùn)練曲線收斂下降速度較快,最后呈現(xiàn)的RMSE值較低,可達(dá)到15.67。同時,測試與訓(xùn)練曲線收斂速度與方向一致,表明模型可有效地避免過擬合現(xiàn)象的發(fā)生。對三個模型進(jìn)行200次迭代的RMSE測試對比,如圖8所示。圖中,BP(200-313-20)神經(jīng)網(wǎng)絡(luò)的收斂下降速度較慢且RMSE值最小只有36.2。SAE的收斂下降速度較快,過程也較為平穩(wěn),但達(dá)到最小RMSE值為27.33,偏差遠(yuǎn)遠(yuǎn)大于CNN模型。
圖7 CNN訓(xùn)練測試收斂曲線Fig.7 Convergence Curves on Train Set and Test Set Using CNN
圖8 三種模型收斂曲線Fig.8 Convergence Curves of Three Models
為驗證整個異常發(fā)現(xiàn)與分析方法的可行性,以車間某一時刻的異常狀態(tài)為例進(jìn)行具體實驗分析。某一時刻的部分在制品異常事件,如表4所示。由表可知在制品k170648在設(shè)備3的加工異常和k170386、k170396在設(shè)備3出緩存區(qū)排隊超時,引發(fā)了其設(shè)備后續(xù)生產(chǎn)的停滯和在制品本身后續(xù)工序的正常執(zhí)行。將異常事件發(fā)生時刻10:58時的車間生產(chǎn)狀態(tài)數(shù)據(jù)從數(shù)據(jù)庫中進(jìn)行提取,設(shè)備3在10:58時刻的生產(chǎn)狀態(tài)數(shù)據(jù),如表5所示。將10:58時刻的生產(chǎn)狀態(tài)數(shù)據(jù)以及生產(chǎn)任務(wù)的組成輸入到上述CNN預(yù)測模型中,預(yù)測可得車間在當(dāng)前時刻異常事件發(fā)生的生產(chǎn)狀態(tài)下,當(dāng)前生產(chǎn)任務(wù)的剩余完成時間為227h,而計劃剩余219h,當(dāng)前異常事件的發(fā)生會導(dǎo)致生產(chǎn)任務(wù)存在9h的延遲。車間調(diào)度員則需根據(jù)延遲時間來衡量車間此時的異常程度,并重點關(guān)注導(dǎo)致設(shè)備3發(fā)生加工異常事件的原因,根據(jù)異常程度對其采取相應(yīng)的調(diào)整措施。
表4 在制品異常事件Tab.4 Abnormal Events of WIP
表5 10:58時刻設(shè)備3的生產(chǎn)狀態(tài)數(shù)據(jù)Tab.5 Production Status Data of Equipment 3 at 10:58
(1)當(dāng)在制品異常事件發(fā)生時,通過改進(jìn)CNN實時預(yù)測生產(chǎn)任務(wù)的剩余完成時間,以生產(chǎn)任務(wù)延遲完成時間來量化當(dāng)前異常事件對車間生產(chǎn)的影響程度,最后將在制品異常事件以及其影響程度共同作為車間調(diào)度依據(jù)。相比傳統(tǒng)生產(chǎn)異常預(yù)測方法,可在準(zhǔn)確評估生產(chǎn)異常程度的同時,對具體異常原因進(jìn)行定位。
(2)結(jié)合制造數(shù)據(jù)特征,將離散制造過程中的一維數(shù)據(jù)轉(zhuǎn)化為二維特征圖,降低了CNN應(yīng)用場景的特殊性。同時在CNN的特征提取階段引入批量歸一化和ReLU、回歸預(yù)測階段引入drop‐out,提高了模型的泛化能力和運行速度,減少了過擬合現(xiàn)象。
綜上所述,該方法可以有效地解決離散制造過程中生產(chǎn)異常難以及時發(fā)現(xiàn)和準(zhǔn)確評估的問題,提高車間的生產(chǎn)效率。