李廣,楊欣
1. 電子科技大學大數(shù)據研究中心,四川 成都 611731;2. 成都數(shù)之聯(lián)科技有限公司,四川 成都 610041
智能制造( intelligent manufacturing)是指集成知識工程、制造軟件系統(tǒng)與機器人視覺等技術,在無人工干預下由智能機器人獨立實現(xiàn)的生產過程[1]。 智能制造系統(tǒng)是一種融合智能機器與智能行為,在訂單制作、產品設計、生產、營銷、銷售等制造過程的各個方面都可以集成,用一種靈活的方式充分發(fā)揮先進生產系統(tǒng)的制造能力的系統(tǒng)[2-3]。隨著云計算、物聯(lián)網、大數(shù)據、人工智能等新一代信息技術的發(fā)展,智能制造的內涵有了突飛猛進的變化。目前,智能制造已經成為每個工業(yè)發(fā)達國家的國家戰(zhàn)略。
在工業(yè)智能制造中,李杰[4]提出將智能制造體系分為3個階段。首先,把問題變成數(shù)據,也就是傳統(tǒng)的信息化過程,利用數(shù)據對問題進行建模,把過去老工人的經驗變成可挖掘、可量化的持續(xù)價值,從而不會因為人的原因而失去知識。然后,把數(shù)據變成知識,從“解決顯而易見的問題”延伸到“探索不可見的隱藏問題”,不僅要明白“怎么解決問題”,還要理解“為什么會出現(xiàn)問題”。最后,把知識再變成數(shù)據,這里的數(shù)據指的是生產中用到的設備指令、機械加工的工藝參數(shù)、可執(zhí)行的決策等所有能夠量化的指標,用從知識得來的量化數(shù)據修正和完善制造過程,從根本上避免問題的出現(xiàn)。
作為智能制造最重要的技術之一,大數(shù)據技術對傳統(tǒng)工業(yè)制造業(yè)的影響是巨大的。智能制造的基礎是將工業(yè)生產中的問題數(shù)據化,利用獲取的數(shù)據對問題解決方法進行數(shù)據建模,當類似的問題出現(xiàn)的時候,能夠根據模型提出解決問題的方法。這樣,將知識固化于數(shù)據與算法模型中。通過對大數(shù)據的深入挖掘,獲取產品的需求感知,基于大數(shù)據分析實現(xiàn)制造業(yè)“需求—制造—需求”的全流程生命周期管理,實現(xiàn)數(shù)字化、網絡化、智能化的生產優(yōu)化、流行預測、精準匹配、供應鏈優(yōu)化、營銷推送等眾多智能制造核心應用,進而驅動產品設計和產業(yè)發(fā)展。大數(shù)據技術對制造業(yè)的影響主要有兩個方面:一是在制造和管理流程中運用大數(shù)據技術提高產品質量和生產效率;二是在現(xiàn)有產品與服務中融入大數(shù)據技術,以進行顛覆式的革新。簡而言之,融入大數(shù)據技術的智能制造關心的兩大重點分別是制造流程技術和制造出的產品技術。
深度學習是機器學習研究中的一個新的熱門領域,作為人工智能領域的熱門技術,近年來發(fā)展迅猛[5]。隨著深度學習技術的流行,使用人工智能技術在各行各業(yè)進行創(chuàng)新應用成為發(fā)展趨勢。不同于傳統(tǒng)的機器學習技術,深度學習對于圖像處理具有先天優(yōu)勢,因此大部分在智能制造中的深度學習技術應用案例是在計算機視覺領域的,例如通過 圖像對產品外觀進行檢測,以發(fā)現(xiàn)殘次品[6]。在工業(yè)的制造過程中,使用深度學習技術的 自動光學檢測(automatic optic inspection,AOI)設備也開始替代傳統(tǒng)檢測設備。
本文通過一個智能制造的實際案例,驗證了使用深度學習技術對數(shù)控機床進行刀具壽命檢測的可行性。從實際應用效果來看,在制造生產過程中,結合了大數(shù)據技術的方法比過去采用傳統(tǒng)的方法獲得了更好的性能提升,同時也節(jié)約了成本。
本文將深度學習技術運用到了制造業(yè)最重要的環(huán)節(jié)——使用數(shù)控機床(或數(shù)控加工中心)進行加工制造,用人工智能代替生產工人對數(shù)控機床加工中用到的數(shù)控刀具(又稱工具)進行壽命監(jiān)控。通過采集、測量機床電流負載數(shù)據的方式,證實了數(shù)控機床主軸電流負載的變化與刀具的磨損程度之間存在一定的相關性。例如,當?shù)毒吣p等異常狀況(如刀具的崩缺)出現(xiàn)時,電流負載在極短時間內會劇烈波動。然后,進一步采集某一類刀具從正常使用到崩刃的全生命周期的電流數(shù)據,從中找到能夠反映刀具磨損趨勢的特征。經過驗證,筆者構建的卷積神經網絡(convolutional neural network,CNN)可以使刀具異常狀態(tài)檢測的準確率達到96%。
根據實際生產制造中的數(shù)據統(tǒng)計得知,20%以上的數(shù)控機床停工是由刀具的過度磨損引起的。及時更換刀具能夠將機床的利用率提高至150%,并且節(jié)約30%以上的成本。為了及時更換過度磨損的刀具,防止過度磨損的刀具對機床部件造成損壞,傳統(tǒng)的辦法主要有兩種:一種是計數(shù)法,根據經驗對刀具設定極限加工次數(shù),在刀具達到這個加工次數(shù)之后,無論好壞都將其廢棄,這種方法的優(yōu)點在于對刀具壽命進行了管理,缺點在于有些刀具在達到設定的極限加工次數(shù)后還能夠繼續(xù)使用,從而造成浪費,或者有些刀具在達到極限次數(shù)之前就已經損壞,從而影響生產質量;另一種方法是通過對加工完的工件進行質檢來判斷機床的刀具是否正常,這種方法的優(yōu)點是能夠克服刀具壽命管理“一刀切”的問題,但缺點在于質檢滯后于生產,在檢測出廢件的時候往往已經有一批廢件產生了。
為了解決傳統(tǒng)方法的不足,一個更加科學的方式是在刀具發(fā)生異常的極短時間內進行響應:提醒工人換新刀,或者機床自動換新刀。實際上,在加工過程中直接測量刀具的磨損程度幾乎是不可能的,但是,刀具的磨損狀況是可以從聲音、振動、切削力,甚至從電流負載變化反映出來的[7-9]。
本文采取測量機床電流負載的方式,證實數(shù)控機床主軸電流負載的變化與刀具磨損程度之間的相關性是存在的。主流數(shù)控系統(tǒng)對主軸變速系統(tǒng)進行了閉環(huán)設計,即刀具在加工時能夠通過傳感器將轉速恒定在設定數(shù)值。假定數(shù)控機床主軸夾載的刀具會根據磨損狀況影響主軸轉速,而主軸負載電流則能夠通過調整來穩(wěn)定主軸轉速。于是筆者猜想,通過觀測主軸電流變化能夠預測出刀具的磨損程度。因此,需要研究以下幾個問題。
(1)負載電流能否反映出刀具磨損度的變化
筆者希望在刀具磨損以及出現(xiàn)異常狀況(如刀具崩缺)的過程中,在電流負載上找到能夠反映出刀具磨損度變化的趨勢,于是在機床電氣箱內部加裝了高精度的霍爾傳感器(電流傳感器),用來采集機床的主軸電流信號,再通過時域、小波域等特征進行分析。
(2)電流負載和刀具磨損程度之間的聯(lián)系能否實時檢測出刀具的磨損程度
筆者將采集某一特定種類的數(shù)控刀具從正常使用到異常(例如崩刃)過程中的電流數(shù)據,并用“刀具崩刃”“刀具正?!边@兩個標簽將數(shù)據進行分類。在這個過程中,需要確定一些能夠反映刀具磨損趨勢的特征。筆者構建了一個簡單的卷積神經網絡,并用這些特征數(shù)據做訓練測試,從而計算模型對刀具崩刃檢測的準確率。刀具實時性檢測主要由數(shù)據的實時性決定,筆者采用的霍爾傳感器采樣率為每秒20000個數(shù)據點,足以識別出極短時間內的電流變化,達到實時檢測的目的。而模型檢測存在一定的延時,這主要是受特征數(shù)據的時間跨度(即輸入數(shù)據的大小)、計算機的運算速度的影響。
通過測量數(shù)控機床主軸電流數(shù)據,對機床刀具出現(xiàn)的異常狀況進行建模,從而挖掘出這些電流數(shù)據中的潛在價值。在實驗中,主要解決3個問題:證明電流分析刀具磨損的可行性;找出能夠反映刀具磨損的特征;通過神經網絡的方法檢測刀具崩刃。
在實驗中,筆者抓取到的原始電流信號往往雜亂無章,因此在證實電流分析方法可行性之前,需要在原始電流信號上進行特征處理,找出能夠反映刀具磨損變化趨勢的特征,并且保證該特征在大多數(shù)的刀具電流信號上能夠反映出變化趨勢。另外,一個特征往往是不夠的,不具備可靠性,因此需要從多個角度進行多個特征的分析。最后,將找出的特征作為模型輸入,訓練筆者設計的算法模型。
該實驗使用霍爾傳感器和NI數(shù)據采集卡對數(shù)控機床的主軸電流信號進行采集,采集頻率為每秒20000個數(shù)據點,機床的主要加工信息見表1。
因為采集到的電流信號是一種時序信號,常見的時域、頻域信號分析方法有均值、方差、峰峰值、偏度、峰度、快速傅里葉變化、短時傅里葉變化、能量百分比分析、小波變換等。筆者發(fā)現(xiàn)電流信號在時域特征上有著明顯的變化,并且從均值、方差、峰峰值、峰度、偏度上進行了特征分析。
電流的均值往往表征了一段時間內電流的穩(wěn)定性和信號的變化中心,通常對電流的分析是基于電流有效值進行的,從計算效率上考慮,本文通過計算電流值的絕對值求解電流在一段時間內的均值,從而進行分析,如式(1)所示。
電流的方差描述了數(shù)據偏離平均值的程度,同時還揭露了數(shù)據之間的波動程度,其計算式如下:
電流的峰峰值描述了信號中最大值和最小值之差,也往往被用于檢測整個信號段的波動大小,如式(3)所示。
峰度描述了頻率分布曲線的峰值和數(shù)據分布的平坦程度。峰度通??梢栽诋惓z測問題中取得良好的結果,高峰度意味著方差的增加是由低頻率大于或者小于平均值的極端差值引起的,如式(4)所示。
偏度描述了實際隨機變量概率分布的不對稱性。偏度為0,意味著數(shù)據均勻分布在平均值兩側;偏度為負,意味著大多數(shù)數(shù)據在平均值的右側;偏度為正,表明大多數(shù)數(shù)據在平均值的左側。偏度的計算式如下:
本文分別對5把數(shù)控刀具的全生命周期電流信號以1 s、1 min為時間跨度進行了時域分析,實驗中5把數(shù)控刀具的分析結果是平行的,考慮到信息冗余,本文以1把刀具的特征分析為例,取得的分析結果如圖1、圖2、圖3所示。
去除不必要的電流數(shù)據之后,筆者分析了均值、方差、峰峰值、峰度、偏度等在數(shù)控刀具的全生命周期上的特征表現(xiàn)情況??梢钥闯?,在時間跨度為1 s的時域分析中只能發(fā)現(xiàn)在生命周期的尾部有一個突變,而對于刀具磨損的趨勢卻反映得不太明顯,這可能是因為圖中的數(shù)據點仍然很多(原始圖像中每分鐘120萬個數(shù)據點),于是將時間跨度改為1 min,又進行了時域分析。
通過對比可以看出,時間跨度為1 min的圖像更平滑,并且趨勢變化更明顯,這也是很容易理解的,因為時間跨度的提升相當于對信號做了一種類似于平滑處理的操作。在時間跨度為1 min的時域分析中,不僅在尾部出現(xiàn)了較大的波動,并且也體現(xiàn)出了明顯的上升趨勢,這與刀具磨損的物理現(xiàn)象是吻合的。普通銑刀在加工過程中,隨著表面磨損的增加,其與工件的接觸面也增加,從而造成機床負載的增加,并最終反饋于電流上,電流呈現(xiàn)逐步上升的趨勢。在刀具嚴重磨損到崩刃的時候,刀具在物理形態(tài)上出現(xiàn)了變化,大多數(shù)情況是崩缺,刀具上缺了一小塊,使得刀具與工件的接觸面突然少了,這使得機床負載也突然減少,但是現(xiàn)代機床具有負載補償?shù)墓δ?,在刀具崩刃之后,機床會開始補償,于是負載在驟然下降后又會上升,而負載上的變化又會反映在電流信號中。通過檢查現(xiàn)場工作人員記錄的加工情況表(見表2)與實驗的時域分析圖的對應情況,進一步驗證了本文的結果。
表1 機床的主要加工信息
圖1 原始數(shù)據
圖2 時間跨度為1 s的時域分析
圖3 時間跨度為1 min的時域分析
表2展示了數(shù)控刀具在加工過程中的切削聲音情況。由于現(xiàn)場加工環(huán)境惡劣且復雜,在加工過程中用儀器直接測量刀具磨損狀況十分困難,故在實驗中由現(xiàn)場工作人員根據經驗記錄當前機床加工的聲音。在時間跨度為1 min的實驗中,發(fā)生驟變的時間點是加工到58 min時,這與加工情況表中機床切削出現(xiàn)尖銳切削聲表明刀具崩刃的時間在同一個區(qū)間。
通過監(jiān)測刀具的整個生命周期可以看出,刀具磨損在電流信號上的表現(xiàn)趨勢與刀具磨損在物理意義上的變化是相符的。本文在同等加工情況下進行了5次實驗(即5把刀的全生命周期),都得到了類似的變化趨勢,由此證明了電流方法的可行性,同時也提取出了能夠很好地反映刀具磨損的特征:均值、方差、峰峰值、峰度、偏度。峰度和偏度從兩個不同的角度展示了刀具崩刃的驟變情況,呈現(xiàn)出了與均值、方差、峰峰值類似的變化趨勢,因此也將其作為神經網絡的輸入,以幫助網絡進行數(shù)據擬合。
小波包變換是在小波變換的基礎上發(fā)展起來的,具有多分辨特性,可以由粗到精逐步地對信號進行分解分析。利用小波包分析技術進行時頻域分析,將原始信號正交地分解到精細的、相互獨立的頻帶上,可以同時獲得時間和頻率上的局部特征以及通過多分辨率分析得到的特征。將各個頻帶內的信號能量作為相應的特征量。小波包變換效果經常受到小波基和分解層數(shù)的影響,本文使用db5作為小波基,同時對信號進行了5層分解,分析結果如圖4所示。
從圖4可以看出,信號能量主要集中在第31頻帶(0~312.5 Hz)和第32頻帶(312.5~625 Hz)內。本文對整個刀具生命周期中這兩個頻帶的能量進行了分析,分析結果如圖5所示。
從圖5可以看出,這兩個頻帶都表現(xiàn)出了明顯的變化趨勢:第31頻帶隨著加工時間的增加,能量逐漸下降,在刀具崩刃之后,能量又逐漸上升;第32頻帶隨著加工時長的增加,能量逐步增加,并在刀具崩刃后下降。
通過對電流信號進行頻域、時頻特征分析,從多個特征域中發(fā)現(xiàn)了電流隨刀具磨損變化而產生的上升趨勢或下降趨勢的特征,在模型訓練和檢測中,本文選取了均值、方差、峰峰值、峰度4個特征作為網絡的輸入特征。
經過驗證,神經網絡往往比傳統(tǒng)機器學習算法具有更好的頑健性、表達能力和學習能力,筆者期望神經網絡的這些優(yōu)點可以穩(wěn)定、準確地檢測出刀具崩刃。筆者從CNN和傳統(tǒng)的反向傳播(back propagation,BP)神經網絡著手,對電流信號進行擬合訓練測試,并對比兩種網絡的表現(xiàn)能力。神經網絡相關參數(shù)見表3。
表2 現(xiàn)場加工情況
圖4 數(shù)控刀具初始加工的頻率帶能量分布
圖5 第31頻帶、第32頻帶的能量分布
表3 神經網絡相關參數(shù)
其中,CNN的具體框架如圖6所示。
受計算資源和數(shù)據的限制,5層神經網絡參數(shù)(神經元權重參數(shù)接近5億)已經具備擬合訓練數(shù)據的能力,實際上也正是如此,本文設計的網絡在訓練集上已經達到了過擬合,具有足夠小的偏差,此時更需要做的是使用一些正則化方法來減少網絡的方差。本文在網絡的1、2、3層的卷積層后添加了批標準化層以減小過擬合,并認為小卷積核能夠提取更細致的特征,Adam方法可以幫助網絡更快速、安全地到達網絡最優(yōu)點。本文共有404個數(shù)據樣本,52080000個數(shù)據點,在每次網絡的輸入批次中,隨機抽取了正常加工數(shù)據和刀具斷刀數(shù)據,并且比例為1:1。最后,通過對網絡的訓練和測試得出的實驗結果見表4。
本文將準確率作為度量標準,CNN取得了96.46%的準確率,BP神經網絡取得了86%的準確率。CNN的96.46%準確率在正樣本(正常加工樣本)中表現(xiàn)很好,正樣本預測全部正確,剩余的3.54%錯誤率主要表現(xiàn)在對負樣本(斷刀數(shù)據樣本)的預測上。筆者分析,主要有兩方面原因:一是負樣本與正樣本之間分布差異較大,并且不同的刀具負樣本之間分布差異也較大;二是負樣本數(shù)據量少,網絡的參數(shù)大部分用于擬合正樣本數(shù)據,而對負樣本數(shù)據的擬合情況較差,因為在加工生產中負樣本獲取的成本較高,所以在實際中獲取大量可利用的負樣本數(shù)據從而減少網絡的方差,也是不太符合實際的。但是網絡96.46%的準確率依然表現(xiàn)出了神經網絡的優(yōu)勢,達到了較為滿意的效果,并驗證了通過神經網絡的方法檢測刀具崩刃的可行性與應用前景。
圖6 卷積神經網絡的設計框架
從異常檢測[10]的角度來看,負樣本少、樣本奇異是異常檢測問題的特征之一,刀具崩刃是一種典型的異常檢測問題。在異常檢測中,異常點與正常點通常有著較大的差異,因此,閾值法是異常檢測問題中一種常用的方法。筆者發(fā)現(xiàn),同一個加工環(huán)境下不同刀具的正常加工往往類似,但是刀具發(fā)生崩刃的異常情況卻各不相同,因為沒有包含所有斷刀形式的數(shù)據集,所以使用普通CNN很難擬合負樣本情況。針對這類問題,提出了一種不同于一般CNN方法的異常檢測卷積神經網絡(convolutional neural network using anomaly detection,CNN-AD)方法。在訓練階段,CNN-AD只使用正常樣本訓練,而在測試階段,通過設定閾值判斷網絡的損失值是正樣本還是負樣本。在實驗中,CNN-AD的結構與之前設計的CNN結構相同,不同的是在網絡的訓練集中只有正樣本,即CNN-AD訓練階段只對正樣本進行擬合。在測試階段,CNN通過softmax層輸出的是概率,而CNN-AD取消了softmax層,最終的輸出為網絡的損失函數(shù)值。本文設定了一個閾值(如設置閾值為1),用以根據損失值劃分正負樣本。
在測試階段,加工前期的正常樣本輸入網絡中產生的損失函數(shù)的值極低,接近于0;而加工后期,刀具崩刃的異常樣本輸入網絡中產生的損失函數(shù)的值與正常樣本的差異巨大,通過閾值很容易將其區(qū)分開。在訓練階段,網絡只對正樣本進行訓練,因此所有參數(shù)都用于擬合正樣本數(shù)據。在測試階段,異常樣本與正樣本差異較大,網絡沒有訓練負樣本的“經驗”,從而產生較大的損失函數(shù)的值。這樣就可以使用閾值很好地將正負樣本區(qū)分開。
表4 實驗結果
除了對CNN-AD進行測試以外,本文還構建了其他網絡作為比較,包括CNN、BP、SVM。其中BP和CNN的架構和模型數(shù)據與第3.4節(jié)中的一樣,不同的是通過PCA方法SVM的輸入數(shù)據維度從7200×4降到了1×4。同樣使用準確率作為主要度量標準,但是引入了召回率和F1-Score作為參考,其實驗結果見表5。
刀具破損檢測是典型的異常檢測問題。因此,選擇召回率和F1-Score作為評估標準更為合適。從表5可以看出,CNNAD表現(xiàn)最佳,準確率為100%,這可能是由正樣本與負樣本差異較大并且數(shù)據集不全面導致的。CNN、BP和SVM的性能不如CNN-AD,這可能是由正負樣本比引起的。因為與正常加工相比,刀具崩刃的時間非常短,1把刀具的完整生命周期中往往只有少數(shù)幾個負樣本,但是卻有幾十個正樣本。另外,每把刀具崩刃在電流信號中的表現(xiàn)(例如電流幅度的差異或變化趨勢)不同。這些原因使得網絡不能很好地擬合負樣本。SVM在正樣本判斷中表現(xiàn)良好,但在異常情況檢測中表現(xiàn)不佳,負樣本檢測全部錯誤,筆者分析可能是因為正樣本和負樣本之間的差異不足以讓SVM找到最佳分割點。
表54種模型性能對比
在實驗中,CNN-AD收斂速度最快,BP次之,CNN需要花費更多的迭代次數(shù)才能完成收斂。CNN-AD只用了不到10次的迭代就完成了收斂,這是因為CNN-AD只使用正樣本進行訓練,而不需要考慮對負樣本的擬合,不同正樣本之間差異不大,網絡不需要太多的參數(shù)就可以完成擬合,因此只需要很少的迭代次數(shù)就達到擬合收斂。BP收斂速度快于CNN,但BP的測試結果卻在波動,其準確性有時超過80%,有時卻低于60%,這是由于BP的參數(shù)較少,不能很好地提取出崩刃和正常樣本之間的關鍵特征。相比BP的結果,CNN較為穩(wěn)定,CNN在網絡收斂之后,準確率穩(wěn)定在95%以上。這是由于CNN更復雜且參數(shù)數(shù)量超過BP,能夠擬合更多的數(shù)據情況,而BP的結構相對簡單,易于收斂。負樣本,同時也將是筆者進一步的研究方向。
(1)生成模型
生成式對抗網絡(generative adversarial network,GAN)[12]是目前機器學習領域的研究熱點之一,GAN得到了很大的擴展,例如:CGAN[13]、InfoGAN[14]、DCGAN[15]、WGAN[16]等,學術界已經出現(xiàn)了GAN變種方法,能夠取得很好的生成效果。筆者期望通過GAN生成類似于負樣本分布的數(shù)據,從而間接地增加負樣本數(shù)量,使網絡更好地擬合負樣本。
(2)遷移學習
遷移學習[17-18]主要包括同構遷移[19]和異構遷移[20],而很多方法采用的將源域分布空間與目標域分布空間映射到一個共同潛在空間,或者使源域映射空間與目標域映射空間優(yōu)化,使其盡可能相似的思想,也被稱為對稱變換和非對稱變換。對于不同的加工環(huán)境,電流數(shù)據的分布也不同,這也叫作數(shù)據集偏差,直接使用這些數(shù)據有可能使網絡效果更差。筆者希望通過遷移學習將不同的機床數(shù)據變?yōu)榭衫玫臄?shù)據,這樣就間接增加了數(shù)據量,也增強了網絡的頑健性和適應性。
在CNN的方法中,網絡的準確率主要表現(xiàn)在對正樣本的識別效果很好,而對負樣本的識別效果不佳,于是本文提出了CNN-AD,利用正負樣本之間的差異,不使用負樣本進行訓練,以這種方式減少負樣本對預測準確率的影響,但是該方法依賴于正負樣本之間的差異性,因此該方法存在局限性。神經網絡的效果依然還有較大的提升空間,而這些提升空間主要表現(xiàn)在減小網絡方差上。從目前機器學習領域內可以了解到有兩個方向有助于網絡擬合
本文介紹了大數(shù)據與智能制造的概況,并且通過一個智能制造的實際案例讓大家認識到在實際工業(yè)場景中使用深度學習進行智能化的生產制造是可行的。筆者發(fā)現(xiàn),對于過去需要依靠工人的知識與經驗進行判斷的場景,現(xiàn)在可以用大數(shù)據技術來代替,可擁有更高的性能提升并節(jié)約成本。雖然本文的研究仍然有進一步提升的空間,但是本文的研究邁出了深度學習在智能制造運用中的重要一步,為智能制造的發(fā)展提供了新的研發(fā)思路。