蔡博偉,陳江平,施駿業(yè),2
(1-上海交通大學(xué)制冷與低溫工程研究所,上海 200240; 2-上海高效冷卻系統(tǒng)工程技術(shù)研究中心,上海 200240)
焓差試驗(yàn)臺性能試驗(yàn)是空調(diào)系統(tǒng)優(yōu)化過程中不可或缺的一環(huán)。焓差試驗(yàn)臺是一個(gè)復(fù)雜的系統(tǒng),包括壓縮機(jī)、冷凝器、蒸發(fā)器、膨脹閥、連接管路等元器件。系統(tǒng)零部件和傳感器的可靠性對空調(diào)系統(tǒng)臺架試驗(yàn)的結(jié)果會產(chǎn)生重要影響。一旦系統(tǒng)發(fā)生故障,輕則影響臺架試驗(yàn)結(jié)果精度,重則需要重新進(jìn)行臺架試驗(yàn),并且可能存在安全隱患。狀態(tài)監(jiān)測與故障預(yù)測技術(shù)是降低焓差臺故障率、保證試驗(yàn)順利進(jìn)行的有效手段。
焓差試驗(yàn)臺常見的故障包括壓縮機(jī)故障、風(fēng)機(jī)電壓異常、控制器故障、元件溫度過高、氣體壓力過高、氣體壓力過低、水箱液位過高等[1]。目前的焓差試驗(yàn)臺故障處理主要是依賴于操作與檢修人員的經(jīng)驗(yàn),在故障發(fā)生后進(jìn)行處理。該方法存在如下3 方面的問題。
1)外部依賴強(qiáng)。依賴于少數(shù)專家經(jīng)驗(yàn),成本比較高,且缺少成體系化的故障預(yù)測與處理能力。
2)預(yù)測能力弱。大多數(shù)故障處理方法的目標(biāo)是在故障發(fā)生后能夠快速響應(yīng),缺乏提前預(yù)測故障發(fā)生的能力。
3)缺乏通用型。不同專家經(jīng)驗(yàn)?zāi)軌蛱幚淼墓收项愋褪遣煌?,缺乏能預(yù)測或處理通用故障的能力[2]。
以前的焓差臺試驗(yàn)主要關(guān)心系統(tǒng)在穩(wěn)定狀態(tài)下的參數(shù),試驗(yàn)數(shù)據(jù)積累較少。隨著大數(shù)據(jù)技術(shù)的發(fā)展和相關(guān)狀態(tài)監(jiān)控設(shè)備的完善,焓差試驗(yàn)臺積累的狀態(tài)數(shù)據(jù)迅速增加。基于大數(shù)據(jù)找到一種數(shù)據(jù)驅(qū)動、準(zhǔn)確率高、實(shí)用性強(qiáng)、不需要額外增加傳感器的故障預(yù)測模型,成為工業(yè)界與學(xué)術(shù)界關(guān)注的一個(gè)熱點(diǎn)[3]。
目前大多數(shù)相關(guān)的研究集中在兩方面。一方面的研究是以神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)技術(shù)在故障預(yù)測方面的應(yīng)用。東南大學(xué)的錢宇寧[4]將基于一個(gè)三層BP 神經(jīng)網(wǎng)絡(luò)的粒子平滑算法用于機(jī)械系統(tǒng)旋轉(zhuǎn)部件的故障預(yù)測,達(dá)到了遠(yuǎn)小于傳統(tǒng)粒子濾波算法的平均誤差。袁玥等[5]采用主成分分析和神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法診斷制冷劑充注量故障,達(dá)到了97%以上的正確率??到〉萚6]將神經(jīng)網(wǎng)絡(luò)用于發(fā)動機(jī)故障預(yù)測,使用15 個(gè)輸入特征,獲得了與實(shí)測計(jì)算值吻合的預(yù)測結(jié)果。尋惟德等[7]利用離散型Hopfield 神經(jīng)網(wǎng)絡(luò)提出制冷劑充注量故障預(yù)測新策略,使用18 個(gè)特征變量,達(dá)到了超過70%的總體故障診斷率。禹法文等[8]使用主成因分析(Principal Component Analysis,PCA)這一機(jī)器學(xué)習(xí)方法對多聯(lián)機(jī)系統(tǒng)壓縮機(jī)排氣感溫包漂移、脫落、精度下降以及完全失效故障進(jìn)行診斷,其中對完全失效故障的檢測率達(dá)到了100%。GEBRAEEL 等[9]基于軸承的歷史退化數(shù)據(jù)建立神經(jīng)網(wǎng)絡(luò)模型,成功預(yù)測了軸承的退化軌跡。LIUKKONEN 等[10]使用神經(jīng)網(wǎng)絡(luò)與專家系統(tǒng)的復(fù)合模型分析電子產(chǎn)品的質(zhì)量并診斷可能發(fā)生的故障,并分析了輸入特征的變化對模型性能的影響。上海交通大學(xué)[11]、華東科技大學(xué)[12]等也進(jìn)行著使用支持向量機(jī)機(jī)器學(xué)習(xí)技術(shù)進(jìn)行故障預(yù)測的研究。另一方面的研究是以神經(jīng)網(wǎng)絡(luò)為代表的機(jī)器學(xué)習(xí)技術(shù)在熱系統(tǒng)性能分析和預(yù)測方面的應(yīng)用。韓國首爾大學(xué)的YANG 等[13]通過建立人工神經(jīng)網(wǎng)絡(luò)模型,預(yù)測不同環(huán)境和不同目標(biāo)溫度下室內(nèi)熱系統(tǒng)的最優(yōu)啟動時(shí)間,從而更好地控制熱系統(tǒng)的啟停,達(dá)到節(jié)能的目的。也研究了不同學(xué)習(xí)率、不同慣性系數(shù)、不同隱藏層數(shù)目、不同隱藏層節(jié)點(diǎn)數(shù)以及不同偏差參數(shù)對模型性能的影響。香港中文大學(xué)的ZHU 等[14]利用神經(jīng)網(wǎng)絡(luò)模型預(yù)測再生式換熱器的出入口空氣溫度變化,達(dá)到了4%左右的誤差水平,并基于模型分析了入口空氣溫度、入口空氣相對濕度、入口空氣速度等對系統(tǒng)性能的影響。魏崢等[15]比較了神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)模型和多元多項(xiàng)式模型、半經(jīng)驗(yàn)公式模型在冷水機(jī)組能耗模型辨識上的性能差異,結(jié)果表明機(jī)器學(xué)習(xí)模型具備較高的計(jì)算精度,且可以在線實(shí)時(shí)建模。這些研究證明了基于數(shù)據(jù)驅(qū)動的神經(jīng)網(wǎng)絡(luò)模型對于系統(tǒng)狀態(tài)的分析和預(yù)測能力。系統(tǒng)狀態(tài)的異常往往與故障有著緊密的聯(lián)系[16]。
本文基于焓差試驗(yàn)臺長期運(yùn)行數(shù)據(jù)和故障日志,提出了數(shù)據(jù)驅(qū)動的焓差試驗(yàn)臺故障預(yù)測策略,并使用前饋神經(jīng)網(wǎng)絡(luò)模型建立了故障預(yù)測模型,并在測試集上驗(yàn)證了該模型對焓差試驗(yàn)臺故障預(yù)測的有效性。
基于模型的焓差試驗(yàn)臺數(shù)據(jù)從2015年11月30日開始記錄,到2017年3月24日結(jié)束。在這期間,共有618 條故障報(bào)警日志,每一條日志可能包括多個(gè)類別并發(fā)的報(bào)警,一共獲得968 條的報(bào)警數(shù)據(jù),包括55 類不同的報(bào)警信息。
從圖1的報(bào)警數(shù)據(jù)分析可以看出,焓差試驗(yàn)臺的故障報(bào)警主要集中在風(fēng)源水箱液位警告和公共水箱機(jī)組蒸發(fā)壓力過低,共占了總報(bào)警數(shù)量的51.96%。此外,試驗(yàn)間壓差過大、風(fēng)源等溫電加熱溫度過高、壓縮機(jī)排氣溫度過高等也是較為常見的故障,其報(bào)警數(shù)均在30 以上。
圖1 焓差試驗(yàn)臺故障報(bào)警統(tǒng)計(jì)
深度前饋神經(jīng)網(wǎng)絡(luò)是多層神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)組成金字塔形的層級結(jié)構(gòu)。每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的權(quán)重基于反向傳播算法更新,從訓(xùn)練集數(shù)據(jù)中學(xué)習(xí)得來。隨著訓(xùn)練次數(shù)的增加,模型精度也會逐步提高,直到趨于穩(wěn)定。前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 前饋神經(jīng)網(wǎng)絡(luò)模型示意圖
2.1.1 基本結(jié)構(gòu)
每一個(gè)神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)是類感知機(jī)結(jié)構(gòu)的單一神經(jīng)元,如圖3所示。
其中x為輸入特征,w為對應(yīng)特征的權(quán)重,b為偏置量,σ為激活函數(shù)。
多層神經(jīng)元組成金字塔形的層級結(jié)構(gòu),即深度前饋神經(jīng)網(wǎng)絡(luò)。在本模型中,每個(gè)時(shí)間節(jié)點(diǎn)的54個(gè)數(shù)據(jù)特征作為輸入特征,經(jīng)過第一層的神經(jīng)元后,其輸出又作為第二層神經(jīng)元的輸入特征,以此類推,直到神經(jīng)網(wǎng)絡(luò)的最后一層。這是神經(jīng)網(wǎng)絡(luò)的前向傳播過程。
圖3 神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)結(jié)構(gòu)
2.1.2 激活函數(shù)的選擇
在神經(jīng)網(wǎng)絡(luò)單元中,權(quán)重與偏移量只能產(chǎn)生線性變化。需要引入激活函數(shù),對節(jié)點(diǎn)進(jìn)行非線性變換,使得神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)和泛化能力。
人工神經(jīng)網(wǎng)絡(luò)常用的激活函數(shù)有以下3 種。
1)Sigmoid 函數(shù)
Sigmoid 函數(shù)的公式如下:
Sigmoid 函數(shù)的輸出映射范圍為(0,1)的實(shí)數(shù)域,單調(diào)連續(xù),輸出范圍有限,可以達(dá)到比較穩(wěn)定的優(yōu)化。
2)Tanh 函數(shù)
Tanh 函數(shù)的公式如下:
Tanh 函數(shù)比Sigmoid 函數(shù)收斂速度更快。其輸出映射范圍為(-1,1)之間的實(shí)數(shù)域。
3)Relu 函數(shù)
Relu 函數(shù)的公式如下:
即當(dāng)x>0 時(shí),取值為x;否則取值為0。
前兩種激活函數(shù)在層數(shù)較多的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中都容易產(chǎn)生梯度消失的現(xiàn)象。即因?yàn)樘幱诤瘮?shù)飽和性區(qū)間導(dǎo)致在誤差的反向傳播過程中梯度過小,影響網(wǎng)絡(luò)的優(yōu)化效果。Relu 函數(shù)是一種非飽和的函數(shù),可以有效地解決梯度消失的問題。
模型采用Relu 函數(shù)作為輸入層和隱藏層的激活函數(shù),輸出層則采用Sigmoid 函數(shù)。在神經(jīng)網(wǎng)絡(luò)層數(shù)增加時(shí),這樣的激活函數(shù)組合可以防止梯度消失,也能將最終的輸出映射到(0,1)之間,實(shí)現(xiàn)故障的二值化預(yù)測。
2.1.3 代價(jià)函數(shù)與反向傳播算法
模型需要一個(gè)代價(jià)函數(shù)作為最優(yōu)化問題的目標(biāo)函數(shù)。定義交叉熵函數(shù)作為神經(jīng)網(wǎng)絡(luò)模型的代價(jià)函數(shù):
式中:
x(i)——第i 個(gè)輸入樣本;
y(i)——第i 個(gè)輸出樣本;
m——樣本數(shù)量;
?θ——基于參數(shù)θ的神經(jīng)網(wǎng)絡(luò)模型。
模型建立起來后,關(guān)鍵是基于訓(xùn)練集數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)權(quán)重進(jìn)行優(yōu)化,降低代價(jià)函數(shù)值。權(quán)重優(yōu)化和迭代采用的是反向傳播算法。
神經(jīng)網(wǎng)絡(luò)最后一層的輸出值與真實(shí)值之間的誤差,通過神經(jīng)網(wǎng)絡(luò)從輸出層向隱藏層反向傳播,直至傳播到輸入層。在誤差信息反向傳播的過程中,神經(jīng)網(wǎng)絡(luò)可以利用誤差更新網(wǎng)絡(luò)內(nèi)部的各種參數(shù),不斷迭代這個(gè)訓(xùn)練過程,直至代價(jià)函數(shù)收斂。這也是神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)能力的核心所在。
誤差在兩層之間反向傳播的計(jì)算公式為:
式中:
δl——第l層的誤差;
w——對應(yīng)特征的權(quán)重參數(shù);
σ——激活函數(shù);
zl——第l層的帶權(quán)輸入;
T——矩陣轉(zhuǎn)置符號;
⊙——向量點(diǎn)乘符號。
故障預(yù)測的準(zhǔn)確與否是一種可以標(biāo)準(zhǔn)化的離散值。對于這樣的二值問題,如果使用準(zhǔn)確率作為模型評價(jià),能考察測試集中預(yù)測結(jié)果符合真實(shí)結(jié)果的樣本比例,但并未能區(qū)分假正例與假反例的不同影響。特別是對于正反例數(shù)量不均衡的樣本,準(zhǔn)確率對模型實(shí)際性能的指示作用并不明顯。
引入查準(zhǔn)率、查全率與F1系數(shù)3 個(gè)模型評價(jià)指標(biāo)[17]。其計(jì)算公式如下。
查準(zhǔn)率:
查全率:
F1系數(shù):
式中:
nTP——預(yù)測結(jié)果中真正例樣本數(shù);
nFP——預(yù)測結(jié)果中假正例樣本數(shù);
nFN——預(yù)測結(jié)果中假反例樣本數(shù)。
查準(zhǔn)率表征模型預(yù)測的正例中準(zhǔn)確的比例,查全率表征實(shí)際的正例樣本中模型預(yù)測準(zhǔn)確的比例,F(xiàn)1值是這兩者的調(diào)和平均。模型參數(shù)評估以F1系數(shù)為最重要的評價(jià)標(biāo)準(zhǔn),同時(shí)也參考查準(zhǔn)率和查全率。
數(shù)據(jù)基于某冷熱產(chǎn)品試驗(yàn)設(shè)備高新技術(shù)企業(yè)的焓差試驗(yàn)臺,包括從2015年12月24日到2017年3月28日間的試驗(yàn)臺架數(shù)據(jù)記錄和報(bào)警日志,存在部分?jǐn)?shù)據(jù)缺失。原始數(shù)據(jù)共有54 個(gè)輸入特征,包括風(fēng)源送風(fēng)和出風(fēng)的干球溫度、濕球溫度、相對濕度、噴嘴壓差、進(jìn)口容積風(fēng)量,以及蒸發(fā)器、冷凝器的空氣側(cè)和制冷劑側(cè)換熱量、進(jìn)出口溫度和壓力、出口過熱度等。取每一天焓差試驗(yàn)臺最早的4 組數(shù)據(jù)作為數(shù)據(jù)樣本,樣本間隔時(shí)間≤1 min,預(yù)測當(dāng)天運(yùn)行過程中是否發(fā)生故障報(bào)警。隨機(jī)地取其中的75%的數(shù)據(jù),作為訓(xùn)練集與驗(yàn)證集輸入樣本,采用5 折交叉驗(yàn)證策略訓(xùn)練與優(yōu)化模型。剩余的25%數(shù)據(jù)作為測試集輸入樣本,用于測試模型的最終性能。原始數(shù)據(jù)輸入特征統(tǒng)計(jì)結(jié)果如表1所示。
表1 焓差試驗(yàn)臺數(shù)據(jù)輸入特征統(tǒng)計(jì)
如圖4所示,首先對焓差試驗(yàn)臺原始數(shù)據(jù)和故障日志進(jìn)行數(shù)據(jù)預(yù)處理和標(biāo)準(zhǔn)化,生成原始數(shù)據(jù)集。將數(shù)據(jù)集劃分成兩個(gè)部分,一部分是供每一個(gè)模型訓(xùn)練和優(yōu)化的訓(xùn)練集和驗(yàn)證集,另一部分是供模型性能評估的測試集。之后基于訓(xùn)練集和驗(yàn)證集,搭建和訓(xùn)練神經(jīng)網(wǎng)絡(luò),并采用多種策略進(jìn)行優(yōu)化與迭代。最終在測試集上進(jìn)行模型的性能評估。
3.3.1 缺失特征與異常特征的處理
焓差試驗(yàn)臺中由于傳感器的不穩(wěn)定,可能會產(chǎn)生一些缺失的數(shù)據(jù),但占總體數(shù)據(jù)的比例較小。對于這樣的缺失數(shù)據(jù),一般有2 種處理方法:一種是刪除含有缺失數(shù)值的數(shù)據(jù)行;另一種是采用其他邏輯合理的數(shù)值補(bǔ)全。模型中采用后者,使用該特征的平均值替代缺失的特征數(shù)據(jù)。
原始數(shù)據(jù)中可能存在少部分脫離合理范圍的數(shù)值,比如溫度、壓力數(shù)據(jù)超出合理范圍。對于多數(shù)機(jī)器學(xué)習(xí)模型,需要移除掉這些異常數(shù)值,但是我們的模型就是對試驗(yàn)臺架故障進(jìn)行預(yù)測,這些異常值可能也是臺架故障的一種指示性預(yù)測特征。因此,這部分異常數(shù)值對于我們預(yù)測故障的模型來說就是有效的特征,應(yīng)該保留。
報(bào)警日志是簡單的非結(jié)構(gòu)化的文本日志,主要記錄報(bào)警時(shí)間和故障內(nèi)容。采用Python 文本處理腳本對日志進(jìn)行處理,映射成結(jié)構(gòu)化的數(shù)據(jù),包括時(shí)間信息和序列化后不同類型的報(bào)警信息。
圖4 基于前饋神經(jīng)網(wǎng)絡(luò)的故障預(yù)測流程圖
3.3.2 數(shù)據(jù)歸一化
原始數(shù)據(jù)中,不同數(shù)值的波動范圍是差別很大的。溫度數(shù)據(jù)可能波動只有幾十度,如果其他數(shù)據(jù)數(shù)值波動范圍遠(yuǎn)遠(yuǎn)大于溫度數(shù)據(jù),會極大地降低模型初始化后梯度下降求最優(yōu)解的速度,也會損害最終模型的精度,更容易陷入到局部最小值的次優(yōu)解中。因此,需要采用合適的歸一化方法,將數(shù)據(jù)放縮到相近的數(shù)據(jù)范圍內(nèi)。
常見的歸一化方法有2 種。一種是最小-最大值線性歸一化方法。同特征數(shù)值被放縮到[0,1]的有理數(shù)空間內(nèi)。其計(jì)算公式如下:
式中:
x——輸入特征值;
xmax——特征最大值;
xmin——特征最小值;
x?——修正后的數(shù)值。
另一種為標(biāo)準(zhǔn)差歸一化方法,同特征數(shù)值轉(zhuǎn)化為均值為0,標(biāo)準(zhǔn)差為1 的標(biāo)準(zhǔn)正態(tài)分布。其計(jì)算公式如下:
式中:
μ——樣本數(shù)據(jù)的均值;
σ——樣本數(shù)據(jù)的標(biāo)準(zhǔn)差;
x?——修正后的數(shù)值。
模型輸入采用最小-最大值線性歸一化方法,對原始數(shù)據(jù)進(jìn)行歸一化。
不同的網(wǎng)絡(luò)結(jié)構(gòu)對神經(jīng)網(wǎng)絡(luò)的性能會產(chǎn)生巨大的影響。一個(gè)理想的網(wǎng)絡(luò)應(yīng)該既滿足性能目標(biāo),又不會有過高的計(jì)算能力要求。
關(guān)于網(wǎng)絡(luò)結(jié)構(gòu),對比了2 種不同的方案。方案一為初始方案,使用最簡單的2 層神經(jīng)網(wǎng)絡(luò)。即只有輸入層、一層隱藏層與一層輸出層,輸入層不計(jì)入總層數(shù),隱藏層節(jié)點(diǎn)數(shù)為10,即54-10-1 的網(wǎng)絡(luò)結(jié)構(gòu)。改良后的方案二采用5 層神經(jīng)網(wǎng)絡(luò),即包括輸入層、4 層隱藏層與一層輸出層,網(wǎng)絡(luò)呈現(xiàn)54-22-14-7-5-1 的結(jié)構(gòu)。
不同方案的性能比較如圖5。在網(wǎng)絡(luò)層數(shù)加深后,模型的各項(xiàng)性能明顯提升。5 層深度的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)比較合適目前的焓差臺故障預(yù)測模型。
圖5 網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化前后性能對比
初始模型使用的是常規(guī)的隨機(jī)參數(shù)初始化方案。優(yōu)化方案采用He 初始化方案[20],其數(shù)學(xué)公式如下:
式中:
W——修正后的初始化數(shù)值;
W0——原隨機(jī)初始化的數(shù)值;
nin——神經(jīng)網(wǎng)絡(luò)上一層節(jié)點(diǎn)數(shù)。
初始化優(yōu)化前后的模型性能比較如圖6。
圖6 初始化優(yōu)化前后性能對比
神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練是一個(gè)最優(yōu)化問題,即尋找神經(jīng)網(wǎng)絡(luò)模型的誤差在整個(gè)數(shù)據(jù)集狀態(tài)空間內(nèi)的最小值。每一次訓(xùn)練,神經(jīng)網(wǎng)絡(luò)都會使用反向傳播算法更新網(wǎng)絡(luò)的所有權(quán)重,直到收斂于極小值。最基本的做法是采用批量梯度下降法,每一次迭代時(shí)使用所有樣本來進(jìn)行權(quán)重的更新,這樣能保證每一次權(quán)重更新后整個(gè)模型在訓(xùn)練集上的誤差是減小的,能逐步趨近于最小值。
然而,基于整個(gè)訓(xùn)練集的誤差計(jì)算和反向傳播計(jì)算量比較大,會顯著地降低模型的更新速度。因此,可以采用小批量梯度下降的方法,每一次訓(xùn)練一定數(shù)量的樣本來對參數(shù)進(jìn)行更新。這樣可以極大地減小每一次模型訓(xùn)練的時(shí)間。雖然每一次更新不能保證模型在整個(gè)訓(xùn)練集上的誤差減小,但是在多次訓(xùn)練中,模型能夠快速地趨近于極小值。
模型采用每一批次100 樣本量的樣本進(jìn)行小批量梯度下降更新。
評價(jià)神經(jīng)網(wǎng)絡(luò)性能的一個(gè)重要方面就是泛化能力[19]。一個(gè)神經(jīng)網(wǎng)絡(luò)可能在訓(xùn)練集上有著極好的表現(xiàn),但是在測試集上的表現(xiàn)就會顯著下降。這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)將訓(xùn)練集數(shù)據(jù)獨(dú)有的局部特征也學(xué)習(xí)進(jìn)去,造成了過擬合。這表明訓(xùn)練過程中僅僅以模型在訓(xùn)練集上的誤差進(jìn)行衡量是不夠的。越復(fù)雜的模型,能學(xué)到越多的局部特征,尤其是訓(xùn)練集數(shù)據(jù)的獨(dú)有特征。越簡單的模型,其泛化能力越好。
因此需要在代價(jià)函數(shù)中引入正則項(xiàng)來對抑制訓(xùn)練過程中對復(fù)雜模型的偏好。常見的正則化有一次正則項(xiàng)與二次正則項(xiàng)。模型采用二次正則項(xiàng),其代價(jià)函數(shù)公式如下:
式中:
J0——原代價(jià)函數(shù)值;
w——權(quán)重系數(shù);
α——正則化系數(shù)。
當(dāng)權(quán)重系數(shù)越大,其代價(jià)函數(shù)值會顯著變大。而神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的過程就是通過更新權(quán)重降低代價(jià)函數(shù)值,因此在訓(xùn)練過程中模型會趨向于權(quán)重值約接近0、越簡單的模型。
模型使用反向傳播算法更新神經(jīng)網(wǎng)絡(luò)的權(quán)重,學(xué)習(xí)率越小,每次權(quán)重更新變化幅度也就越小,學(xué)習(xí)速度也會更慢。如果學(xué)習(xí)率過大,可能會使得神經(jīng)網(wǎng)絡(luò)的權(quán)值變化量不穩(wěn)定,陷入振蕩。因此,可以在權(quán)重更新方程中引入動量項(xiàng)[20]來加速學(xué)習(xí)過程,同時(shí)保持穩(wěn)定。
其公式如下:
式中:
Wn——模型第n次更新時(shí)的權(quán)重;
J——代價(jià)函數(shù);
η——學(xué)習(xí)率;
α——?jiǎng)恿宽?xiàng)系數(shù)。
引入動量前后的前饋神經(jīng)網(wǎng)絡(luò)模型性能對比如圖7。
圖7 引入動量前后性能對比
經(jīng)過多次的優(yōu)化與迭代,最終的模型是一個(gè)54-22-14-7-5-1 的5 層前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),使用He初始化方案[20],具有2 次正則項(xiàng)和動量項(xiàng),并采用小批量梯度下降方案的模型。
在基于真實(shí)數(shù)據(jù)的焓差試驗(yàn)臺測試集上進(jìn)行性能測試,模型達(dá)到了93.33%的查準(zhǔn)率與95.02%的查全率,以及94.14%的F1系數(shù)。模型整體性能較好,具有進(jìn)一步應(yīng)用于焓差試驗(yàn)臺故障預(yù)測的潛力。
本文針對焓差試驗(yàn)臺故障預(yù)測問題,基于真實(shí)的空調(diào)系統(tǒng)焓差試驗(yàn)臺的長期運(yùn)行數(shù)據(jù),建立了一種基于人工神經(jīng)網(wǎng)絡(luò)的焓差試驗(yàn)臺故障預(yù)測模型,并定義了查準(zhǔn)率、查全率與F1系數(shù)作為模型的評判依據(jù)。根據(jù)以上分析結(jié)果,得到以下結(jié)論:
1)該前饋神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)簡單,層數(shù)適中,算法具有較好的實(shí)用性;
2)該前饋神經(jīng)網(wǎng)絡(luò)模型在一年的實(shí)驗(yàn)工況下,焓差臺故障達(dá)到了93.33%的查準(zhǔn)率與95.02%的查全率、以及94.14%的F1 系數(shù)。模型已經(jīng)達(dá)到了較好的性能參數(shù),為焓差臺故障預(yù)測提供了一種基于機(jī)器學(xué)習(xí)和數(shù)據(jù)驅(qū)動的解決思路;
3)目前焓差臺具有多種類型的故障。可以在模型的基礎(chǔ)上進(jìn)一步優(yōu)化模型的預(yù)測粒度,實(shí)現(xiàn)不同類型的焓差臺故障預(yù)測。