張明宇,王琦,2,于洋
半導(dǎo)體器件作為現(xiàn)代電子設(shè)備的關(guān)鍵零部件,被廣泛應(yīng)用于軍工、通信、自動化和航空等領(lǐng)域,其健康狀況直接影響著設(shè)備的運(yùn)行性能和運(yùn)行精度. 傳統(tǒng)的依照可靠性手冊對半導(dǎo)體器件進(jìn)行評估鑒定,是基于“正?!焙汀笆А钡亩卸?,已經(jīng)不能滿足當(dāng)前發(fā)展對壽命評估的要求,開展半導(dǎo)體器件的故障預(yù)測和健康管理(Prog?nostic and Health Management,PHM)研究、建立產(chǎn)品使用壽命與故障機(jī)理之間的關(guān)系是十分必要的.
國內(nèi)外主要從故障診斷[1,2]、狀態(tài)評估[3~5]和壽命預(yù)測[6~9]三個方面開展PHM 技術(shù)研究,取得了較好的成果. 考慮到現(xiàn)有研究方法主要集中于對單一監(jiān)測變量進(jìn)行分析,且少有將狀態(tài)評估和壽命預(yù)測結(jié)合起來研究,存在退化因素考慮不全和信息挖掘不充分的問題,本文面向電子領(lǐng)域PHM 技術(shù),提出了一種基于LSTMDHMM 的MOSFET 器件故障時間預(yù)測方法,該方法可對器件狀態(tài)進(jìn)行預(yù)估并預(yù)測故障時間,為科學(xué)評估器件健康狀態(tài)、最大限度地降低故障影響奠定基礎(chǔ).
LSTM 算法是一種深度學(xué)習(xí)理論,能夠?qū)W習(xí)數(shù)據(jù)中暗含的復(fù)雜規(guī)則,其具備的長期記憶能力,使之處理半導(dǎo)體器件性能退化這種較長距離的時序依賴關(guān)系時更具優(yōu)勢;而半導(dǎo)體器件在故障演化過程中經(jīng)歷的衰退狀態(tài)在現(xiàn)實(shí)中是觀測不到的,只能根據(jù)狀態(tài)觀測值表現(xiàn)出來的征兆去感知器件的衰退狀態(tài),DHMM 可根據(jù)觀測值反映研究對象內(nèi)在狀態(tài),具有較強(qiáng)的狀態(tài)描述特性與自學(xué)習(xí)能力,正適合處理半導(dǎo)體器件健康狀態(tài)識別的問題.
基于LSTM-DHMM 的MOSFET 器件故障時間預(yù)測流程如圖1 所示. 首先,對原始數(shù)據(jù)進(jìn)行預(yù)處理;其次,采用LSTM 算法對二維離散時域信號進(jìn)行時間序列回歸預(yù)測;再次,利用AR 模型對得到的時間序列進(jìn)行故障特征信息提?。唤又?,利用DHMM 算法構(gòu)建健康狀態(tài)識別分類器,建立特征向量與退化等級間的映射關(guān)系,實(shí)現(xiàn)MOSFET 器件退化狀態(tài)的識別;最后,根據(jù)識別結(jié)果,結(jié)合失效閾值,進(jìn)行虛警排除并實(shí)現(xiàn)MOSFET 器件的故障時間預(yù)測.
由于原始時域監(jiān)測信號中存在的干擾因素,會影響模型輸出結(jié)果的真實(shí)性和精確度. 因此,在預(yù)測前需進(jìn)行數(shù)據(jù)預(yù)處理.
數(shù)據(jù)預(yù)處理包括去噪、數(shù)據(jù)壓縮和歸一化.
圖1 LSTM-DHMM預(yù)測流程
首先,使用加權(quán)滑動平均濾波法濾除訓(xùn)練集和測試集中的高低頻噪音. 加權(quán)滑動平均濾波法如式(1)所示.
式(1)中,yi為原始時域數(shù)據(jù);yˉi為濾波后的數(shù)據(jù);wk為線性權(quán)系數(shù),其表達(dá)式如式(2)所示.
wk=N+1-k(2)
半導(dǎo)體器件狀態(tài)的改變是極其緩慢的過程,當(dāng)對半導(dǎo)體器件全壽命周期進(jìn)行監(jiān)測時,數(shù)據(jù)量將呈爆炸式增長. 為加快模型收斂,減少預(yù)測耗費(fèi)的時間,需對濾波后的數(shù)據(jù)進(jìn)行壓縮處理. 本文選用一階預(yù)測器數(shù)據(jù)壓縮算法剔除重復(fù)、冗余數(shù)據(jù). 具體操作如下:
式(3)~(5)中,x(t1)、x(t2)為樣本中相鄰點(diǎn),kL為x(t1)和x(t2)定義的直線的斜率. 設(shè)置一個可變閾值,如果t3時刻的采樣點(diǎn)在閾值范圍內(nèi),則去除,反之則留用. 以“MOSFET Thermal Overstress Aging Data Set”14 號實(shí)驗(yàn)器件第五次實(shí)驗(yàn)數(shù)據(jù)為例,數(shù)據(jù)壓縮前后對比見下圖2.
圖2 數(shù)據(jù)壓縮前后對比圖
在時間序列預(yù)測階段,采用二維離散時域信號作為樣本輸入,而二維離散時域信號具有不同的量綱和數(shù)量級,為消除量綱和數(shù)量級對模型訓(xùn)練結(jié)果的干擾,同時加快模型收斂,需進(jìn)行壓縮后數(shù)據(jù)的歸一化處理.具體見式(6).
MOSFET 器件的健康狀態(tài)識別與故障時間預(yù)測模型分為時間序列預(yù)測和健康狀態(tài)識別兩部分. 時間序列預(yù)測部分?jǐn)M合應(yīng)力作用下器件故障特征向量的變化趨勢,健康狀態(tài)識別部分建立故障特征向量和退化等級之間的映射關(guān)系,結(jié)合兩者的預(yù)測結(jié)果,判斷器件健康狀態(tài)、預(yù)測器件發(fā)生故障的時間. 時間序列預(yù)測部分采用堆疊結(jié)構(gòu),由LSTM單元、Dropout層、全連接層和回歸層組成. 健康狀態(tài)識別部分包括特征提取、建立模式庫、模式匹配與狀態(tài)識別四個子部分. 模型架構(gòu)如圖3 所示,圖中Xt表示t時刻的樣本輸入,Dense代表全連接層,Re?gression代表回歸層.
在時間序列預(yù)測階段,由二維離散時域信號構(gòu)成關(guān)于同一器件不同參數(shù)的時間序列訓(xùn)練集Xt,將多個器件的訓(xùn)練集分別代入LSTM 單元,經(jīng)LSTM 單元處理后將輸出導(dǎo)入全連接層,其中,t時刻Xt的訓(xùn)練標(biāo)簽為t+1時刻的輸入Xt+1. 為防止過擬合現(xiàn)象,在全連接層前加入Dropout 層. 全連接層的輸出為后續(xù)回歸層的輸入,回歸層的輸出即為時間序列預(yù)測結(jié)果. 在模型訓(xùn)練過程中,采用BPTT 算法和模型權(quán)重優(yōu)化算法調(diào)整模型參數(shù),選用的模型權(quán)重優(yōu)化算法將在3.2 節(jié)中進(jìn)行介紹.選取均方根誤差(Root Mean Square Error,RMSE)作為時間序列預(yù)測模型精確度的評價標(biāo)準(zhǔn),其計(jì)算式為:為預(yù)測值,yk為目標(biāo)值.RMSE 數(shù)值越小,表示預(yù)測的時間序列效果越好.
圖3 LSTM-DHMM模型框架
在狀態(tài)識別前,為找出時域信號的本質(zhì)特征,需要提取時序序列的特征參數(shù). 常用的平穩(wěn)時間序列模型有自回歸模型、移動平均(Moving Average,MA)模型和自回歸滑動平均(AutoRegressive Moving Average,AR?MA)模型. 根據(jù)序列的自相關(guān)函數(shù)(AutoCorrelation Function,ACF)和偏自相關(guān)系數(shù)函數(shù)(Partical Autocorre?lation Coefficient Function,PACF)確定三種模型的使用場合:自相關(guān)系數(shù)拖尾,偏自相關(guān)系數(shù)截尾,則選用AR模型;自相關(guān)系數(shù)截尾,偏自相關(guān)系數(shù)拖尾,則選用MA模型;自相關(guān)系數(shù)和偏自相關(guān)系數(shù)都拖尾,選用ARMA模型[10,11]. 根據(jù)選用的模型類型,確定相關(guān)算法提取模型特征參數(shù).
觀察特征參數(shù)變化趨勢,根據(jù)特征參數(shù)的特點(diǎn),將半導(dǎo)體器件的壽命周期劃分為若干階段:器件在有效壽命期間發(fā)生故障的概率很小,為偶發(fā)故障,此階段特征參數(shù)變化較平穩(wěn),前后幅值相差不大,設(shè)此階段為正常損耗期;當(dāng)器件的性能開始退化時,特征參數(shù)較正常損耗期會有較大起伏,設(shè)此階段為衰退期;當(dāng)退化逐步累積,器件在此階段發(fā)生故障的概率增加,特征向量前后會有較大變化,設(shè)此階段為嚴(yán)重退化期.
根據(jù)特征值變化趨勢將器件壽命周期劃分為正常
式(7)中,N為預(yù)測的時間序列中數(shù)據(jù)的個數(shù)損耗期、衰退期和嚴(yán)重退化期后,便可進(jìn)入狀態(tài)識別階段. 由于DHMM 的觀測矢量需要在有限的離散符號集合內(nèi),因此,在狀態(tài)識別階段,使用通訊領(lǐng)域信源編碼技術(shù)中的Lloyds 算法將提取到的故障特征信息轉(zhuǎn)為離散碼本,再利用式(8)將碼本化為觀察值序號序列.
式(8)中,partition 為標(biāo)量量化參數(shù),index(x)為量化索引. 此時,便可利用DHMM 算法訓(xùn)練樣本序列,建立狀態(tài)識別模型庫.
在健康狀態(tài)識別階段,將碼本化的故障特征信息值作為觀測值序列輸入到初始模型中,利用Baum-Welch 算法可求得一組新的參數(shù),同時獲得新的模型,觀測序列在新模型下的輸出概率要大于在初始模型的輸出概率. 重復(fù)此過程,逐步優(yōu)化DHMM 模型參數(shù)直到輸出概率滿足預(yù)設(shè)的收斂條件,此時的模型便是所求的DHMM狀態(tài)識別模型.
本文利用NASA Ames Research Center 提供的“MOSFET Thermal Overstress Aging Data Set”作為實(shí)驗(yàn)數(shù)據(jù)對基于LSTM-DHMM 的MOSFET 器件健康狀態(tài)識別與故障時間預(yù)測模型進(jìn)行分析. 該數(shù)據(jù)集中包含柵-源電壓、漏-源電壓、漏電流和殼溫等參數(shù)的監(jiān)測數(shù)據(jù).
半導(dǎo)體器件的健康狀態(tài)在運(yùn)行中很難直接觀測,只能通過器件表現(xiàn)出的信號征兆判斷半導(dǎo)體器件的狀態(tài).為了便于觀測實(shí)驗(yàn)器件狀態(tài)隨溫度的變化趨勢,本文選用單一退化特征向量作為狀態(tài)觀測值,通過計(jì)算數(shù)據(jù)集中漏-源電壓與漏極電流的比值求出實(shí)驗(yàn)器件的漏-源導(dǎo)通電阻RDS(on),以RDS(on)參數(shù)作為監(jiān)測量反應(yīng)實(shí)驗(yàn)器件的狀態(tài). 五次實(shí)驗(yàn)的RDS(on)隨實(shí)驗(yàn)條件的變化如圖4所示.
圖4 五次實(shí)驗(yàn)RDS(on)變化趨勢圖
圖4(a)顯示,在前四次實(shí)驗(yàn)中,器件的RDS(on)隨殼溫的降低而下降;而圖4(b)顯示,在殼溫低于第4 次實(shí)驗(yàn)的情況下,第5次實(shí)驗(yàn)的RDS(on)要高于第4次實(shí)驗(yàn). 綜上分析,可知RDS(on)參數(shù)同時受殼溫和加速老化累計(jì)時長的影響.
在時間序列預(yù)測階段,本文選取殼溫及加速老化累計(jì)時長作為樣本輸入,預(yù)測器件RDS(on)值.
選取數(shù)據(jù)集中8 號、11 號、12 號、14 號器件五次實(shí)驗(yàn)的全壽命數(shù)據(jù)作為訓(xùn)練集,9號器件五次實(shí)驗(yàn)的全壽命數(shù)據(jù)作為測試集進(jìn)行模型驗(yàn)證.
劃分好訓(xùn)練集和測試集后,利用LSTM 算法進(jìn)行時間序列預(yù)測. 預(yù)測前使用2.2節(jié)介紹的方法對原始時域監(jiān)測信號進(jìn)行預(yù)處理,去除信號中存在的干擾因素. 超參數(shù)的設(shè)置直接影響著模型的訓(xùn)練結(jié)果,在時間序列預(yù)測階段,LSTM模型的初始參數(shù)在均值為0、方差為2/(m+n)的均勻分布中抽取,其中,m為輸入數(shù)量,n為輸出數(shù)量. 常用的模型權(quán)重優(yōu)化算法有Adam、SGDM 和RM?SProp三種[15]. 五次實(shí)驗(yàn),三種優(yōu)化算法訓(xùn)練的模型均方根誤差見表1 所示. 可見,三種優(yōu)化算法中,Adam 作為自適應(yīng)優(yōu)化算法的預(yù)測誤差最小,五次實(shí)驗(yàn)預(yù)測誤差均小于1%,因此,本文使用Adam優(yōu)化器進(jìn)行梯度優(yōu)化,訓(xùn)練得到最優(yōu)的模型參數(shù),具體步驟參見文獻(xiàn)[12].
表1 三種優(yōu)化算法的均方根誤差
在模型測試階段,以9 號實(shí)驗(yàn)器件的實(shí)驗(yàn)數(shù)據(jù)為例,將殼溫和實(shí)驗(yàn)累計(jì)時長作為輸入向量輸入到已訓(xùn)練好的LSTM 時間序列預(yù)測模型中,預(yù)測9 號實(shí)驗(yàn)器件的RDS(on)值. 五次實(shí)驗(yàn)的模型預(yù)測值與模型目標(biāo)值(實(shí)驗(yàn)器件實(shí)際RDS(on)值)的擬合結(jié)果如圖5所示,綠色曲線代表模型預(yù)測值,紅色曲線代表模型目標(biāo)值.
從圖5中可以看出,模型較好地?cái)M合了樣本參數(shù)的變化趨勢,輸出結(jié)果和目標(biāo)值較吻合,模型計(jì)算結(jié)果作為預(yù)測值可信度高.
將9號實(shí)驗(yàn)器件的預(yù)測值留取待用,待完成DHMM健康狀態(tài)識別分類器的訓(xùn)練后,將9號實(shí)驗(yàn)器件預(yù)測值中的故障特征信息作為DHMM模型的輸入值.
圖5 模型擬合結(jié)果
在狀態(tài)識別階段,根據(jù)器件狀態(tài)退化單向前進(jìn)演變的特點(diǎn),DHMM 模型采用左右型馬爾科夫鏈. 隨著現(xiàn)代半導(dǎo)體設(shè)計(jì)、制造工藝和控制過程技術(shù)的發(fā)展,半導(dǎo)體器件的早期失效率和偶然失效率已接近于零,可保證器件在初始工作時刻狀態(tài)是正常的,因此,把初始概率分布π設(shè)為(1,0,0). 前文已將半導(dǎo)體器件的壽命周期劃分為正常損耗階段、衰退階段和嚴(yán)重退化階段. 那么,狀態(tài)數(shù)N可確定為3,狀態(tài)所對應(yīng)的觀測值的數(shù)目M由故障特征信息提取情況確定.
以9號實(shí)驗(yàn)器件第一次實(shí)驗(yàn)數(shù)據(jù)為例,計(jì)算序列的ACF與PACF,判斷序列的模型類型. 計(jì)算結(jié)果見表2所示.
從表2 中可以看出,此序列ACF 拖尾,PACF 截尾.由前節(jié)所述可知,此種情況適合選用AR 模型.AR 模型可探究時域信號復(fù)雜的內(nèi)在結(jié)構(gòu),具有良好的時頻分辨率,其表達(dá)式為:
式(9)中,x(n)表示時間序列;ak、p分別為模型的參數(shù)和階次;εn為白噪聲.
表2 ACF與PACF值
時間序列類型確定后,便可采用與序列類型相關(guān)的特征提取方法提取故障特征值. 由于五次實(shí)驗(yàn)RDS(on)參數(shù)幅值很小,為更顯著的反映溫度環(huán)境應(yīng)力及實(shí)驗(yàn)累計(jì)時長對RDS(on)參數(shù)的影響,采用趨勢分析法,提取RDS(on)針對上一時刻的變化量,再利用Burg 算法對AR模型提取參數(shù),Burg算法具體求解步驟見文獻(xiàn)[13].
圖6(a)~(e)依次代表第1 次~第5 次實(shí)驗(yàn)的AR 模型參數(shù). 根據(jù)前文對器件壽命周期的劃分,結(jié)合器件RDS(on)參數(shù)在前三次實(shí)驗(yàn)中改變較小且在第5 次實(shí)驗(yàn)中陸續(xù)失效的結(jié)果,將前三次實(shí)驗(yàn)歸為一類,設(shè)定為正常損耗期,設(shè)定器件在第四次實(shí)驗(yàn)中處于衰退期,第五次實(shí)驗(yàn)中的器件處于嚴(yán)重退化期.
規(guī)定了DHMM 模型參數(shù)的初始值、劃分好器件狀態(tài)后,便可使用Baum-Welch 算法對模型參數(shù)不斷迭代重估,構(gòu)建健康狀態(tài)識別分類器,反映特征向量和退化等級之間的關(guān)系.DHMM訓(xùn)練迭代曲線如圖7所示.
由圖7的迭代曲線可以看出,DHMM 模型具有很強(qiáng)的學(xué)習(xí)能力. 雖然衰退期與嚴(yán)重退化期的迭代曲線距離較近,但三種退化狀態(tài)依然具有不同的收斂值.
MOSFET 器件退化DHMM 庫建好后,便可以用來識別器件所處的狀態(tài). 識別方法為使用前向-后向算法計(jì)算測試集數(shù)據(jù)在各模型下的輸出概率值,選取輸出最大概率值的模型作為實(shí)驗(yàn)器件所處的狀態(tài). Baum-Welch 算法和前向-后向算法的具體計(jì)算步驟見文獻(xiàn)[14]. 三種MOSFET 器件退化狀態(tài)在DHMM 分類器下的輸出對數(shù)似然概率與識別結(jié)果見表3所示.
圖6 五次實(shí)驗(yàn)AR模型參數(shù)
圖7 三種狀態(tài)的DHMM迭代曲線
從表3 可以看出,按照前文已劃分的器件退化狀態(tài),DHMM 健康狀態(tài)識別分類器正確識別出第2~第5次實(shí)驗(yàn)的結(jié)果,識別準(zhǔn)確率為80%.
表3 DHMM分類器下三種狀態(tài)的對數(shù)似然概率與識別結(jié)果
為了進(jìn)一步驗(yàn)證本文提出的LSTM-DHMM 預(yù)測方法的有效性和優(yōu)越性,設(shè)置其他方案與本文所提預(yù)測方法進(jìn)行對比分析,以增強(qiáng)比較效果.
GRU 引入更新門和重置門控制信息的更新,是一種比LSTM 網(wǎng)絡(luò)更加簡單的循環(huán)神經(jīng)網(wǎng)絡(luò),和LSTM 網(wǎng)絡(luò)一樣,通常也用于時間序列的預(yù)測. 本文使用GRU網(wǎng)絡(luò)和單以溫度環(huán)境應(yīng)力為輸入的LSTM 網(wǎng)絡(luò)作為時間序列預(yù)測模型LSTM的對比方案.
由于數(shù)據(jù)驅(qū)動類算法存在多次預(yù)測不穩(wěn)定的問題,本文引入均方差作為模型穩(wěn)定性的比對指標(biāo). 均方差用來衡量數(shù)據(jù)的波動性. 均方差越大,說明模型預(yù)測數(shù)據(jù)偏離期望的程度越大;其值越小,說明模型預(yù)測數(shù)據(jù)波動性越小,預(yù)測算法的穩(wěn)定性越好[15]. 均方差計(jì)算式見(10)所示.
式(10)中,N為預(yù)測的時間序列中數(shù)據(jù)的個數(shù)為模型預(yù)測值,E為預(yù)測時間序列的期望. 三種時間序列預(yù)測方法的均方差如表4所示.
表4 三種時間序列預(yù)測方法的均方差
從表4可以看出,以二維離散時域信號建模的GRU網(wǎng)絡(luò)和LSTM 網(wǎng)絡(luò)除第五次實(shí)驗(yàn)的均方差大于單應(yīng)力LSTM 網(wǎng)絡(luò)外,其余四次實(shí)驗(yàn)兩者的均方差均小于單應(yīng)力LSTM 網(wǎng)絡(luò). 可以說,就整體預(yù)測而言,二維離散時域信號GRU 網(wǎng)絡(luò)與二維離散時域信號LSTM 網(wǎng)絡(luò)的模型穩(wěn)定性要優(yōu)于單應(yīng)力LSTM網(wǎng)絡(luò).
接下來對比二維離散時域信號LSTM 網(wǎng)絡(luò)與二維離散時域信號GRU 網(wǎng)絡(luò)的穩(wěn)定性. 除第1 次、第5 次實(shí)驗(yàn)LSTM 網(wǎng)絡(luò)的均方差要略大于GRU 網(wǎng)絡(luò)外,其余三次實(shí)驗(yàn)LSTM 網(wǎng)絡(luò)的均方差均小于GRU 網(wǎng)絡(luò),但相差不大. 綜上分析,就單次實(shí)驗(yàn)而言,二維離散時域信號LSTM 網(wǎng)絡(luò)與二維離散時域信號GRU 網(wǎng)絡(luò)的穩(wěn)定性各有優(yōu)劣,但二維離散時域信號LSTM 網(wǎng)絡(luò)的模型整體穩(wěn)定性要比二維離散時域信號GRU網(wǎng)絡(luò)略勝一籌.
對比完三種時間序列預(yù)測方法的穩(wěn)定性后,再對比三種方法的預(yù)測精確性. 采用均方根誤差作為模型預(yù)測精確性的對比指標(biāo). 均方根誤差越大,模型預(yù)測精確度越低;均方根誤差越小,模型預(yù)測精確度越高. 三種方法的均方根誤差如表5所示.
從表5 中可以看出,在五次實(shí)驗(yàn)中,單應(yīng)力LSTM的均方根誤差最大,即三種時間序列預(yù)測方法中,單應(yīng)力LSTM 網(wǎng)絡(luò)法的模型預(yù)測精確度最差. 可見相對于單應(yīng)力時間序列預(yù)測模型,使用二維離散時域信號建模,能夠充分考慮影響器件的退化因素,可更好地?cái)M合器件的變化趨勢.
表5 三種時間序列預(yù)測方法的均方根誤差
對于同樣以二維離散時域信號建模的GRU 網(wǎng)絡(luò)和LSTM 網(wǎng)絡(luò),在前三次實(shí)驗(yàn)中,雖然GRU 網(wǎng)絡(luò)的預(yù)測誤差要略小于LSTM 網(wǎng)絡(luò),但相差并不大. 對于第4次、第5 次實(shí)驗(yàn),GRU 網(wǎng)絡(luò)的預(yù)測誤差要遠(yuǎn)大于LSTM 網(wǎng)絡(luò),尤其是在第五次實(shí)驗(yàn)中,GRU 網(wǎng)絡(luò)的預(yù)測誤差是LSTM網(wǎng)絡(luò)預(yù)測誤差的2 倍之多. 綜上,對于五次實(shí)驗(yàn),GRU網(wǎng)絡(luò)與LSTM 網(wǎng)絡(luò)的預(yù)測精確度各有優(yōu)劣,但于整體預(yù)測而言,LSTM網(wǎng)絡(luò)更具優(yōu)勢.
通過三種時間序列預(yù)測方法的均方差、均方根誤差的對比分析可知,單以溫度環(huán)境應(yīng)力為輸入的LSTM網(wǎng)絡(luò)法在模型穩(wěn)定性、預(yù)測誤差方面都要遜色于二維離散時域信號GRU 網(wǎng)絡(luò)法. 因此,選用GRU 網(wǎng)絡(luò)法作為時間序列預(yù)測方法,選擇識別領(lǐng)域內(nèi)研究較充分且常用的SVM 方法進(jìn)行健康狀態(tài)識別,組成對比方案,以驗(yàn)證LSTM-DHMM 模型在本學(xué)習(xí)任務(wù)中的優(yōu)勢. 對比方案具體構(gòu)成見表6.
表6 對比方案構(gòu)成與本文所提預(yù)測方法
按照本文所提二維離散時域信號LSTM-DHMM 方法的預(yù)測流程,計(jì)算對比方案的預(yù)測結(jié)果,結(jié)果見表7.
從表7 中可以看出,GRU-SVM 模型的識別率最低,僅為40%. 雖然GRU-DHMM 模型和LSTM-SVM 模型的識別率能達(dá)到60%,但相較于LSTM-DHMM 模型80%的識別率,仍然偏低. 對比結(jié)果表明,LSTM-DHMM 模型相較于GRU-DHMM 模型、GRU-SVM 模型和LSTMSVM模型,識別準(zhǔn)確率更高,更適用于本學(xué)習(xí)任務(wù).
綜合本節(jié)的分析可知,二維離散時域信號LSTM網(wǎng)絡(luò)法在模型穩(wěn)定性、預(yù)測準(zhǔn)確性方面均要優(yōu)于單應(yīng)力LSTM網(wǎng)絡(luò)法. 就整體預(yù)測而言,二維離散時域信號LSTM網(wǎng)絡(luò)法的穩(wěn)定性、準(zhǔn)確性也要略勝于二維離散時域信號GRU網(wǎng)絡(luò)法. 引入GRU-DHMM、GRU-SVM、LSTM-SVM 與LSTM-DHMM 方法相比較,結(jié)果表明LSTM-DHMM 方法識別率更高. 因此,本文所提方法在模型穩(wěn)定性、預(yù)測準(zhǔn)確性和識別率方面均表現(xiàn)良好,具有優(yōu)越性.
表7 對比方案的識別結(jié)果
按照LSTM-DHMM 預(yù)測流程,當(dāng)DHMM 預(yù)測器件處于嚴(yán)重退化階段時,應(yīng)結(jié)合失效閾值,預(yù)測器件的故障時間. 選取殼溫穩(wěn)定后RDS(on)參數(shù)20%的漂移作為器件故障閾值[16]. 計(jì)算表4 中第1 次和第5 次實(shí)驗(yàn)RDS(on)參數(shù)的漂移量,見表8所示.
表8RDS(on)參數(shù)漂移百分比
第1次實(shí)驗(yàn)的RDS(on)參數(shù)預(yù)測值漂移量低于故障閾值,可判斷器件并沒有發(fā)生故障,此次預(yù)警為虛警,器件可以正常工作,不需更換,繼續(xù)進(jìn)行監(jiān)測便可;第5次實(shí)驗(yàn)的RDS(on)參數(shù)漂移量超過故障閾值,計(jì)算其故障發(fā)生時間,如表9所示.
表9 預(yù)測故障時間與實(shí)際故障時間
由此可見,LSTM-DHMM 模型能夠提前預(yù)測故障的發(fā)生,模型預(yù)測誤差小于10%,具有較高的預(yù)測精度.
在應(yīng)用LSTM-DHMM 模型時,如經(jīng)健康狀態(tài)識別分類器判斷,器件處于正常損耗期,證明器件處于整個壽命周期的早期,性能參數(shù)緩慢下降,但不影響正常工作,器件可以放心使用,繼續(xù)監(jiān)測器件狀態(tài)即可;如果判斷器件處于衰減期,此時器件性能參數(shù)下降速度加劇,需加強(qiáng)對器件的關(guān)注,并采取降溫等措施,減緩材料老化、延長器件使用時間;如果判斷器件處于嚴(yán)重退化階段,代表器件材料已經(jīng)嚴(yán)重老化,器件已瀕臨失效,根據(jù)故障閾值計(jì)算器件故障時間,以便提前更換器件,最大限度降低器件突然失效造成的損失.
本文提出了一種面向半導(dǎo)體PHM技術(shù)的二維離散時域信號驅(qū)動MOSFET 器件故障時間預(yù)測方法,通過LSTM 算法擬合應(yīng)力作用下器件故障特征向量的變化趨勢,采用DHMM 算法反映特征向量與退化等級間的映射關(guān)系,結(jié)合故障閾值排除虛警,最終實(shí)現(xiàn)故障發(fā)生時間的預(yù)測. 將本文所提方法與多種不同方法進(jìn)行對比分析,結(jié)果顯示,本文所提方法在預(yù)測準(zhǔn)確性、預(yù)測精確性和識別準(zhǔn)確率方面均取得了較好的效果. 在今后的工作中,我們將優(yōu)化模型結(jié)構(gòu),進(jìn)一步深入分析多種信號特征融合策略,以提高模型的判別能力.