田昕怡,牛 彬,鐘睿君,孫淑嫻
(國(guó)網(wǎng)天津市電力公司營(yíng)銷(xiāo)服務(wù)中心,天津 300000)
隨著計(jì)量設(shè)備的推廣普及,計(jì)量設(shè)備在運(yùn)行過(guò)程中出現(xiàn)的可靠性問(wèn)題與電子行業(yè)發(fā)展聯(lián)系較為密切,且不容忽視。對(duì)集成電路、電子計(jì)算機(jī)、雷達(dá)等電子設(shè)備而言,一旦發(fā)生計(jì)量失誤,可能會(huì)導(dǎo)致設(shè)備損壞,甚至威脅到人身安全,后果將不堪設(shè)想,因此對(duì)于計(jì)量設(shè)備系統(tǒng)來(lái)說(shuō),可靠性的評(píng)估與預(yù)測(cè)具有深遠(yuǎn)的意義[1]。
本文將計(jì)量設(shè)備的可靠性測(cè)試或?qū)嶋H運(yùn)行中得出的失效數(shù)據(jù)(故障間隔時(shí)間、故障次數(shù)等)視為—個(gè)時(shí)間序列,即為一組依賴(lài)于時(shí)間t的隨機(jī)變量序列。這些變量之間有一定的依存性和相關(guān)性,而且表現(xiàn)出了一定的規(guī)律性,如果能根據(jù)這些失效數(shù)據(jù)建立盡可能合理的統(tǒng)計(jì)模型,就能用這些模型來(lái)解釋數(shù)據(jù)的規(guī)律性,就可以利用已得到的失效數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)數(shù)據(jù),也就能據(jù)此來(lái)預(yù)估計(jì)量設(shè)備的可靠性[2]。
本文從可靠性基礎(chǔ)出發(fā),基于計(jì)量設(shè)備指定模塊的失效,討論計(jì)量設(shè)備模塊的失效,建立失效數(shù)據(jù)分布數(shù)學(xué)模型,以便對(duì)失效進(jìn)行評(píng)價(jià)。本文的研究成果可為提高計(jì)量設(shè)備的可靠性、改善智能計(jì)量設(shè)備壽命提供支持,對(duì)實(shí)際使用過(guò)程中的運(yùn)行維護(hù)有一定的參考價(jià)值。
不同模型對(duì)數(shù)據(jù)信息提取的側(cè)重點(diǎn)不同,單一模型的預(yù)測(cè)效果往往受到質(zhì)疑,利用組合模型對(duì)設(shè)備可靠性進(jìn)行預(yù)測(cè)一度成為熱點(diǎn)。一些研究表明,利用分解技術(shù)提取時(shí)間序列中的不同特征成分,對(duì)不同特征的數(shù)據(jù)分別采用不同的模型,有助于提高可靠性預(yù)測(cè)的精度。本文關(guān)注于基于機(jī)器學(xué)習(xí)的設(shè)備可靠性預(yù)測(cè),旨在利用失效數(shù)據(jù)的變化規(guī)律,實(shí)現(xiàn)對(duì)設(shè)備可靠性的預(yù)測(cè)。本文以上述失效數(shù)據(jù)為研究對(duì)象,構(gòu)造出基于ARIMA(Autoregressive Integrated Moving Average Model)模型[3]和GRU(Gate Recurrent Unit)模型[4]的設(shè)備可靠性預(yù)測(cè)方法。實(shí)驗(yàn)表明,本文所提出的算法取得了較好的效果,實(shí)用性也較好。
計(jì)量設(shè)備的可靠性是一個(gè)復(fù)雜的非線(xiàn)性動(dòng)力學(xué)系統(tǒng),具有顯著的非線(xiàn)性、時(shí)變性特征[5],導(dǎo)致根據(jù)設(shè)備的已有數(shù)據(jù)對(duì)可靠性進(jìn)行預(yù)測(cè)成為一大難題。
近年來(lái),有一些研究者利用神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)間序列進(jìn)行了大量的預(yù)測(cè)研究。潘曉明等[6]利用不同的神經(jīng)網(wǎng)絡(luò)算法產(chǎn)生神經(jīng)網(wǎng)絡(luò)集成個(gè)體,用遺傳算法動(dòng)態(tài)求解集成個(gè)體的非負(fù)權(quán)重系數(shù),進(jìn)行最優(yōu)組合集成建模,相對(duì)傳統(tǒng)的簡(jiǎn)單平均集成模型具有預(yù)測(cè)精度高、穩(wěn)定性好、易于操作的特點(diǎn)。劉磊[7]提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型。智晶等[8]提出了一種基于主成分的遺傳神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,其有以下2個(gè)特點(diǎn):利用主成分方法選取輸入變量和利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù)。吳華星對(duì)基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法進(jìn)行了研究,他分析了傳統(tǒng)的BP(Back Propagation)算法,通過(guò)引入調(diào)節(jié)參數(shù)ρ解決了要同時(shí)調(diào)整算法中學(xué)習(xí)速率η和動(dòng)量參數(shù)α的問(wèn)題。陳嶷瑛等[9]提出了一種基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,從他們的研究成果來(lái)看,關(guān)注點(diǎn)主要集中在對(duì)輸入數(shù)據(jù)的處理、對(duì)神經(jīng)網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)及對(duì)神經(jīng)網(wǎng)絡(luò)的集成方法方面。
但這些傳統(tǒng)預(yù)測(cè)方法有諸多前提假設(shè),常見(jiàn)的有設(shè)備的可靠性數(shù)據(jù)為平穩(wěn)時(shí)間序列、可靠性數(shù)據(jù)與其影響因素之間為線(xiàn)性關(guān)系等。但此類(lèi)數(shù)據(jù)普遍存在非線(xiàn)性、非平穩(wěn)特征,因此這些方法在實(shí)際應(yīng)用中很難達(dá)到理性的預(yù)測(cè)效果。人們對(duì)機(jī)器學(xué)習(xí)的不斷深入挖掘、了解,使它在設(shè)備的可靠性數(shù)據(jù)預(yù)測(cè)方面發(fā)揮了重要的作用,它對(duì)所研究的數(shù)據(jù)沒(méi)有假設(shè)限制,更不受人為先驗(yàn)知識(shí)的影響。
此外,國(guó)內(nèi)外學(xué)者還提出通過(guò)時(shí)間序列分析方法來(lái)處理設(shè)備可靠性分析的問(wèn)題,該方法是將失效數(shù)據(jù)作為時(shí)間相關(guān)序列,根據(jù)過(guò)去和現(xiàn)在的數(shù)據(jù)來(lái)對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。該方法不需要對(duì)故障過(guò)程做任何先前的假設(shè)就可以對(duì)數(shù)據(jù)進(jìn)行分析,與傳統(tǒng)的一些可靠性預(yù)測(cè)模型相比具有一定的優(yōu)勢(shì),同時(shí)還可以發(fā)現(xiàn)那些被假設(shè)條件所隱藏的數(shù)據(jù)特性。如LU等[10]用時(shí)間序列方法對(duì)部件實(shí)時(shí)可靠性進(jìn)行建模,以反映單一部件的實(shí)時(shí)可靠性;JAYARAM等[11]在假設(shè)退化量分布為正態(tài)時(shí),給出了基于性能退化數(shù)據(jù)的半似然可靠性預(yù)計(jì)方法;金光等[12]采用Bootstrap仿真方法建立了動(dòng)量輪壽命分布的模型,評(píng)價(jià)其可靠性水平,合理的時(shí)間序列模型可以對(duì)數(shù)據(jù)的發(fā)展趨勢(shì)進(jìn)行有效預(yù)測(cè)。目前相關(guān)分析人員已經(jīng)將雙指數(shù)平滑法應(yīng)用在該領(lǐng)域,但是該方法的應(yīng)用面比較狹窄,有一定的局限性。
本文提出了一種基于ARIMA和GRU的設(shè)備可靠性預(yù)測(cè)模型,該模型利用ARIMA獲取數(shù)據(jù)的線(xiàn)性特征,利用GRU獲取數(shù)據(jù)的非線(xiàn)性特征,通過(guò)調(diào)整合適的參數(shù)使模型的學(xué)習(xí)能力強(qiáng),預(yù)測(cè)精度比較高。
ARIMA模型的全稱(chēng)為自回歸移動(dòng)平均模型,是統(tǒng)計(jì)模型(Statistic Model)中最常見(jiàn)的一種用來(lái)進(jìn)行時(shí)間序列預(yù)測(cè)的模型。差分自回歸移動(dòng)平均模型ARIMA是將自回歸模型(AR)、移動(dòng)平均模型(MA)和差分法結(jié)合,從而得到了差分自回歸移動(dòng)平均模型ARIMA(p,d,q),其中d是需要對(duì)數(shù)據(jù)進(jìn)行差分的階數(shù)[13]。在該模型中,本文定義變量如表1所示。
表1 變量定義
表1 (續(xù))
2.1.1 數(shù)據(jù)預(yù)處理
首先對(duì)無(wú)效數(shù)據(jù)進(jìn)行重采樣,原數(shù)據(jù)中時(shí)間不是連續(xù)的,為了更好地達(dá)到預(yù)測(cè)效果,需要進(jìn)行插值處理,插值處理可以對(duì)數(shù)據(jù)中的缺失進(jìn)行合理的補(bǔ)償,可以對(duì)數(shù)據(jù)進(jìn)行放大或者縮小。根據(jù)找到的這個(gè)規(guī)律,來(lái)對(duì)其中尚未有數(shù)據(jù)記錄的點(diǎn)進(jìn)行數(shù)值估計(jì)。本模型采用的是線(xiàn)性插值方法[14]。根據(jù)數(shù)據(jù)序列中需要插值的點(diǎn)的左右鄰近2個(gè)數(shù)據(jù)點(diǎn)來(lái)進(jìn)行數(shù)值的估計(jì)。
2.1.2 平穩(wěn)性檢測(cè)
ARIMA模型對(duì)時(shí)間序列的要求是平穩(wěn)性,做出的數(shù)據(jù)的趨勢(shì)圖如圖1所示,從圖中可以看出,該設(shè)備的可靠性數(shù)據(jù)具有波動(dòng)性。通過(guò)平穩(wěn)性檢驗(yàn),得出p>0.05,可以判斷為非平穩(wěn)序列。該無(wú)效數(shù)據(jù)屬于非平穩(wěn)時(shí)間序列,需要運(yùn)用差分法,轉(zhuǎn)化成平穩(wěn)時(shí)間序列,因此,首先要做的就是做時(shí)間序列的差分,直到得到一個(gè)平穩(wěn)時(shí)間序列。一般情況下,差分次數(shù)不超過(guò)2次,就能達(dá)到相關(guān)要求[15]。
圖1 原始數(shù)據(jù)的趨勢(shì)圖
進(jìn)行一階差分后的結(jié)果如圖2所示,此時(shí),p<0.05,符合平穩(wěn)序列的要求,因此d取1。
圖2 一階差分結(jié)果圖
2.1.3模型參數(shù)確定
建立模型必須要確定p、d、q這3個(gè)參數(shù)的值,這里主要是確定p和q的值。這里用平穩(wěn)序列的自相關(guān)圖(Autocorrelation Function,ACF)和偏自相關(guān)圖(Partial Autocorrelation Function,PACF)來(lái)對(duì)這2個(gè)參數(shù)進(jìn)行確定[16],如圖3、圖4所示。
圖3 自相關(guān)圖(ACF)
圖4 偏自相關(guān)圖(PACF)
自相關(guān)函數(shù)ACF描述的是時(shí)間序列觀測(cè)值與其過(guò)去的觀測(cè)值之間的線(xiàn)性相關(guān)性,計(jì)算公式如下:
式(1)中:k為滯后期數(shù),如果k=2,則為yt和yt-2。
偏自相關(guān)函數(shù)PACF描述的是在給定中間觀測(cè)值的條件下,時(shí)間序列觀測(cè)值預(yù)期過(guò)去的觀測(cè)值之間的線(xiàn)性相關(guān)性[17]。提出了中間k-1個(gè)隨機(jī)變量X(t-1)、X(t-2)、…、X(t-k+1)的干擾之后X(t-k+1)對(duì)X(t)的影響程度。
p和q取值的一般規(guī)則如表2所示[18]??煽啃灶A(yù)測(cè)數(shù)據(jù)描述可靠性數(shù)據(jù)時(shí)間序列觀測(cè)值與其過(guò)去的觀測(cè)值之間的線(xiàn)性相關(guān)性的ACF值和PACF值,最后確定模型里的p、q參數(shù)分別為1、1。
表2 模型識(shí)別表
2.1.4 模型評(píng)估
嘗試建立若干個(gè)模型,根據(jù)赤池信息量(Akaike Information Criterion,AIC)或貝葉斯信息量(Bayesian Information Criterion,BIC)來(lái)衡量模型的復(fù)雜度,從而選擇出更簡(jiǎn)單的模型[19]。AIC的計(jì)算表達(dá)式為:
式(2)中:L為極大似然函數(shù);N為未知參數(shù)數(shù)量。
AIC同時(shí)考慮了模型的擬合程度和簡(jiǎn)單性,BIC是對(duì)AIC的改進(jìn)。BIC的表達(dá)式為:
AIC和BIC的值越低越好,其值越低,模型越簡(jiǎn)單,即k、N取值越小,L取值越大,模型越好。
2.1.5 模型檢驗(yàn)
通過(guò)對(duì)模型進(jìn)行殘差白噪聲檢驗(yàn)和參數(shù)性檢驗(yàn),來(lái)判斷所建模型是否可取,如果殘差序列不是白噪聲序列,則返回2.1.3的步驟,重新建立模型,直至通過(guò)參數(shù)檢驗(yàn)和模型的殘差白噪聲檢驗(yàn)[20]。通過(guò)檢驗(yàn)可得,已通過(guò)參數(shù)檢驗(yàn)和殘差白噪聲檢驗(yàn)的ARIMA模型。
傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)模型相鄰層之間是全連接的[21],但是每層的各個(gè)節(jié)點(diǎn)是無(wú)連接的,樣本的處理在各個(gè)時(shí)刻獨(dú)立,使其不能對(duì)時(shí)間序列上的變化建模。而循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)中隱藏層之間的節(jié)點(diǎn)不再無(wú)連接而是有連接的,并且隱藏層的輸入不僅包括輸入層的輸出,還包括上一時(shí)刻隱藏層的輸出,使得循環(huán)神經(jīng)網(wǎng)絡(luò)最大的特點(diǎn)是具有記憶功能[22]。GRU在傳統(tǒng)RNN的基礎(chǔ)上加了更新門(mén)和重置門(mén),既保留了“記憶”這個(gè)功能,又使LSTM(Long Short-Term Memory)在BPTT(Back-Propagation Through Time)的過(guò)程中避免了梯度爆炸或者消失的缺點(diǎn)[23]。更新門(mén)和重置門(mén)的作用在于:更新門(mén)用于控制前一時(shí)刻的狀態(tài)信息被帶入到當(dāng)前狀態(tài)中的程度,更新門(mén)的值越大說(shuō)明前一時(shí)刻的狀態(tài)信息帶入越多;重置門(mén)用于控制忽略前一時(shí)刻的狀態(tài)信息的程度,重置門(mén)的值越小說(shuō)明忽略得越多。GRU遞歸神經(jīng)網(wǎng)絡(luò)的示意圖如圖5所示。
圖5 GRU遞歸神經(jīng)網(wǎng)絡(luò)
GRU的向前傳播公式如下:式(4)中:()中為2個(gè)向量相連接,表示矩陣元素相乘。
從式(4)中可以看到,GRU訓(xùn)練需要學(xué)習(xí)的參數(shù)是Wr、Wz、Wh、Wo權(quán)重參數(shù),這些權(quán)重參數(shù)都是拼接的,所以在學(xué)習(xí)時(shí)需要分割出來(lái),即:
在GRU模型中,本文用的是Python的Keras庫(kù),GRU模塊的激活函數(shù)為tanh,確定接收GRU輸出的完全連接人工神經(jīng)網(wǎng)絡(luò)的激活函數(shù)為linear。
計(jì)量設(shè)備的可靠性因受到各種因素的影響,變化規(guī)律復(fù)雜多變,其中既含有線(xiàn)性趨勢(shì),又包含非線(xiàn)性規(guī)律,僅使用單一模型進(jìn)行預(yù)測(cè)難以完全擬合。本文基于這樣的思想構(gòu)建組合模型,設(shè)備可靠性的歷史數(shù)據(jù)首先經(jīng)過(guò)ARIMA模型過(guò)濾掉序列數(shù)據(jù)中的線(xiàn)性趨勢(shì),那么非線(xiàn)性規(guī)律則包含在ARIMA模型的殘差中;其次,將殘差輸入GRU模型以提取其中的非線(xiàn)性規(guī)律;最后,將ARIMA模型的預(yù)測(cè)結(jié)果與GRU模型的預(yù)測(cè)結(jié)果相疊加得到最終的預(yù)測(cè)結(jié)果。組合模型的流程框架如圖6所示。
圖6 ARIMA-GRU組合模型流程圖
本文實(shí)驗(yàn)所用的數(shù)據(jù)集是由實(shí)驗(yàn)室計(jì)量設(shè)備使用過(guò)程或測(cè)試過(guò)程中記錄的數(shù)據(jù),包括設(shè)備出現(xiàn)故障發(fā)生次數(shù)和故障時(shí)間間隔,選取前150組數(shù)據(jù)來(lái)訓(xùn)練構(gòu)建模型,用后面45組數(shù)據(jù)對(duì)模型進(jìn)行模型測(cè)試和預(yù)測(cè)。對(duì)于數(shù)據(jù)集中的失效數(shù)據(jù),本文通過(guò)對(duì)數(shù)據(jù)中的故障發(fā)生數(shù)和故障發(fā)生時(shí)間間隔等變量進(jìn)行處理分析,分別利用ARIMA模型和GRU模型2種數(shù)據(jù)分析方案對(duì)數(shù)據(jù)的線(xiàn)性特征和非線(xiàn)性特征進(jìn)行抓取,從而對(duì)計(jì)量設(shè)備的可靠性進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)中需利用數(shù)據(jù)分析技術(shù)精準(zhǔn)刻畫(huà)數(shù)據(jù)變動(dòng)規(guī)律,將分析結(jié)果用圖表進(jìn)行可視化展示,針對(duì)所給數(shù)據(jù),區(qū)分訓(xùn)練集和測(cè)試集,對(duì)比分析預(yù)測(cè)模型,并對(duì)模型進(jìn)行評(píng)估。
為了能全面表現(xiàn)模型的性能,本文使用平均絕對(duì)誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)作為性能衡量指標(biāo)進(jìn)行效果評(píng)估,二者都是測(cè)量2個(gè)向量(預(yù)測(cè)向量和目標(biāo)值向量)之間的距離的方法,且值越小,則說(shuō)明模型的性能越好[24],公式如下:
式(6)(7)中:RMSE(X,h)為使用假設(shè)h在示例上測(cè)量的成本函數(shù);X為數(shù)據(jù)集中所有實(shí)例的所有特征值的矩陣(標(biāo)記特征除外);h為系統(tǒng)的預(yù)測(cè)函數(shù),也稱(chēng)為一個(gè)假設(shè);m為在測(cè)量RMSE時(shí)所使用的數(shù)據(jù)集中實(shí)例的數(shù)量;X(i)為數(shù)據(jù)集中第i個(gè)實(shí)例的所有特征值的向量(標(biāo)簽特征除外);y(i)為標(biāo)簽,即為該實(shí)例的真實(shí)值。
所有的實(shí)驗(yàn)都是在一個(gè)搭載NVIDIA Geforce RTX 3090顯卡、型號(hào)為AMD Ryzen 9 5900X處理器以及內(nèi)存為64 G的服務(wù)器上進(jìn)行的。在實(shí)驗(yàn)中,使用Python3.6開(kāi)發(fā)平臺(tái)、Tensorflow1.4.0學(xué)習(xí)框架和CUDA11.0來(lái)實(shí)現(xiàn)本文的方法。
為了防止過(guò)度擬合,本文確定每一層網(wǎng)絡(luò)節(jié)點(diǎn)的舍棄率為默認(rèn)值0.2,模型訓(xùn)練的Epoch為100,Batch Size為1,學(xué)習(xí)率設(shè)置為2×10-5,權(quán)值衰減設(shè)置為1×10-6。
為了體現(xiàn)出模型預(yù)測(cè)效果的優(yōu)越性,實(shí)驗(yàn)在相同數(shù)據(jù)集上與使用單一模型的方法進(jìn)行了對(duì)比,即只使用ARIMA模型和僅使用GRU模型的方法,并將對(duì)比結(jié)果匯總,如表3所示。
表3 模型對(duì)比結(jié)果
由表3可以看出,本文提出的方法在評(píng)價(jià)指標(biāo)上是有一定優(yōu)勢(shì)的,本文所使用的ARIMA模型和GRU模型結(jié)合的計(jì)量設(shè)備可靠性預(yù)測(cè)方法比單一模型的MAE值和RMSE值要小,例如,對(duì)比單一使用GRU模型,分別在MAE和RMSE指標(biāo)上優(yōu)化了32.25%和30.06%。本文方法不僅關(guān)注了線(xiàn)性數(shù)據(jù),還對(duì)非線(xiàn)性數(shù)據(jù)進(jìn)行了抓取,從而使模型對(duì)數(shù)據(jù)信息的獲取更加全面,所以在設(shè)備可靠性預(yù)測(cè)的任務(wù)上表現(xiàn)出一定的優(yōu)越性,具有較好的實(shí)用性。
此外,本文還在實(shí)驗(yàn)中通過(guò)數(shù)據(jù)分析技術(shù)來(lái)準(zhǔn)確畫(huà)出可靠性數(shù)據(jù)的變化走向,并將實(shí)際走向和實(shí)驗(yàn)預(yù)測(cè)的結(jié)果可視化展示,如圖7、圖8、圖9所示。
圖7 ARIMA模型的預(yù)測(cè)結(jié)果
圖8 GRU模型的預(yù)測(cè)結(jié)果
圖9 本文方法的預(yù)測(cè)結(jié)果
由上圖可以看出,預(yù)測(cè)結(jié)果均從第150組數(shù)據(jù)開(kāi)始進(jìn)行,ARIMA模型預(yù)測(cè)的結(jié)果都和歷史的平均值比較接近,當(dāng)真實(shí)值波動(dòng)不是很劇烈時(shí),ARIMA模型的預(yù)測(cè)效果會(huì)較好一些,但是通??煽啃缘脑紨?shù)據(jù)變化比較大,ARIMA模型的預(yù)測(cè)效果就比較差了;相比較來(lái)看,GRU模型不是只簡(jiǎn)單看一個(gè)平均,所以預(yù)測(cè)可能會(huì)激進(jìn)偏頗一點(diǎn),當(dāng)原始數(shù)據(jù)波動(dòng)比較大時(shí),預(yù)測(cè)的效果更好;在同時(shí)使用ARIMA模型和GRU模型時(shí),對(duì)原始數(shù)據(jù)的使用更加全面,同時(shí)關(guān)注了波動(dòng)較大和較小的數(shù)據(jù),所以此方法的預(yù)測(cè)效果更好。
通過(guò)實(shí)驗(yàn)所得的圖和表均可以看出,本文提出的ARIMA和GRU的計(jì)量設(shè)備可靠性預(yù)測(cè)模型在預(yù)測(cè)結(jié)果上,效果相對(duì)來(lái)說(shuō)都比較理想。單獨(dú)使用ARIMA模型進(jìn)行預(yù)測(cè)時(shí),雖然模型十分簡(jiǎn)單,只需要內(nèi)生變量而不需要借助其他外生變量,但是采用ARIMA模型預(yù)測(cè)時(shí)序數(shù)據(jù),必須是穩(wěn)定的,不穩(wěn)定的數(shù)據(jù)是無(wú)法捕捉到規(guī)律的,對(duì)于可靠性數(shù)據(jù)預(yù)測(cè)走勢(shì)情況,用ARIMA預(yù)測(cè)效果不是太好的原因是該數(shù)據(jù)是非穩(wěn)定的,所以需要處理轉(zhuǎn)化成平穩(wěn)序列進(jìn)行預(yù)測(cè)。單獨(dú)使用GRU模型進(jìn)行預(yù)測(cè)時(shí),由于GRU是LSTM的一種變體,將LSTM中遺忘門(mén)與輸入門(mén)合二為一為更新門(mén),模型比LSTM模型更簡(jiǎn)單了[25],非常適合用于處理與時(shí)間序列高度相關(guān)的問(wèn)題。如本文所處理的設(shè)備可靠性預(yù)測(cè)問(wèn)題,通過(guò)調(diào)整神經(jīng)個(gè)數(shù)、網(wǎng)絡(luò)層數(shù)等GRU的具體參數(shù),理論上使預(yù)測(cè)精度達(dá)到很高的水準(zhǔn),但是GRU網(wǎng)絡(luò)訓(xùn)練時(shí)間過(guò)長(zhǎng),運(yùn)行硬件要求高。對(duì)于時(shí)間跨度過(guò)長(zhǎng)的數(shù)據(jù)集來(lái)說(shuō),當(dāng)?shù)螖?shù)達(dá)到一定數(shù)量級(jí)后,實(shí)際運(yùn)行速率比較緩慢,對(duì)于實(shí)驗(yàn)所設(shè)計(jì)的100次迭代,2位數(shù)神經(jīng)元的輕量級(jí)網(wǎng)絡(luò),訓(xùn)練時(shí)間可以達(dá)到1 h。而從實(shí)驗(yàn)結(jié)果可以看出,輕量級(jí)網(wǎng)絡(luò)的實(shí)際預(yù)測(cè)精度并不超過(guò)ARIMA方法,這也說(shuō)明GRU在通常網(wǎng)絡(luò)構(gòu)建和運(yùn)行環(huán)境下難以展現(xiàn)其所具有的優(yōu)勢(shì)。
針對(duì)基于過(guò)往計(jì)量設(shè)備無(wú)效數(shù)據(jù)的設(shè)備可靠性預(yù)測(cè)工作中很少有使用多個(gè)模型來(lái)處理不同類(lèi)型的數(shù)據(jù),大多還只是使用單一的模型來(lái)進(jìn)行數(shù)據(jù)處理和預(yù)測(cè),本文提出了一個(gè)基于ARIMA和GRU的設(shè)備可靠性預(yù)測(cè)模型,該模型分別利用ARIMA模型和GRU模型來(lái)處理可靠性數(shù)據(jù)中的線(xiàn)性數(shù)據(jù)和非線(xiàn)性數(shù)據(jù),從而比較全面地抓取數(shù)據(jù)信息。通過(guò)在同一數(shù)據(jù)集中執(zhí)行可靠性預(yù)測(cè)任務(wù),對(duì)比了單一使用ARIMA模型和GRU模型的方法,實(shí)驗(yàn)證明,本文所使用的基于ARIMA和GRU的計(jì)量設(shè)備可靠性預(yù)測(cè)模型性能比較好,更具有實(shí)用性。
在未來(lái)的工作中,將繼續(xù)探索新方法和新思路,比如加入其他模型來(lái)更有針對(duì)性地處理數(shù)據(jù),從而使原始數(shù)據(jù)的抓取更加全面豐富,進(jìn)而提升模型性能。