張弘韜,陳煥新*,郭亞賓,李冠男,申利梅
(1-華中科技大學(xué)能源與動(dòng)力工程學(xué)院,湖北武漢 430074;2-鄭州大學(xué)土木工程學(xué)院,河南鄭州 450001;3-武漢科技大學(xué)城市建設(shè)學(xué)院,湖北武漢 430081)
傳感器是工業(yè)自動(dòng)控制系統(tǒng)實(shí)施各種優(yōu)化的控制策略和實(shí)現(xiàn)運(yùn)行目標(biāo)所必須的基本組件[1-2]。在常規(guī)的工業(yè)控制循環(huán)中,傳感器持續(xù)輸出的測(cè)量信號(hào)是循環(huán)正常工作的第一個(gè)環(huán)節(jié),也是重要的前提,其測(cè)量信號(hào)及時(shí)反映系統(tǒng)當(dāng)前運(yùn)行狀態(tài)的信息,并通過(guò)反饋?zhàn)饔脗鬟f至控制中心,由控制中心經(jīng)過(guò)適當(dāng)計(jì)算發(fā)出相應(yīng)指令給執(zhí)行部件,以維持運(yùn)行參數(shù)的相對(duì)穩(wěn)定并實(shí)現(xiàn)各種控制優(yōu)化策略。所以當(dāng)傳感器發(fā)生故障,導(dǎo)致其讀數(shù)不準(zhǔn)確時(shí),控制中心錯(cuò)誤的指令可能會(huì)影響各種優(yōu)化的控制策略和運(yùn)行目標(biāo)的實(shí)現(xiàn),這就很可能顯著增加能耗與運(yùn)行費(fèi)用,甚至由于系統(tǒng)長(zhǎng)期處于高負(fù)荷高能耗狀態(tài)而降低系統(tǒng)部件的使用壽命。
傳感器的軟故障表現(xiàn)形式主要為偏移、漂移和精度下降,其結(jié)果均為出現(xiàn)不同程度的測(cè)量偏差,偏差通常在初期不易檢測(cè)到,而隨著時(shí)間的推移和故障信號(hào)在控制循環(huán)中的傳遞[3],有可能發(fā)展為較嚴(yán)重的程度。尤其是對(duì)于大型空調(diào)系統(tǒng),其具有復(fù)雜且耦合的控制關(guān)聯(lián),故障經(jīng)過(guò)累積或傳遞后可能使各設(shè)備或部件無(wú)法高效運(yùn)行,增加額外能耗。此外,為了滿足某些空調(diào)系統(tǒng)傳感器持續(xù)高精度輸出以完成如性能檢測(cè)及能耗計(jì)量的要求,一套能夠及時(shí)地自動(dòng)檢測(cè)出傳感器故障并隔離故障源的故障檢測(cè)及診斷(Fault Detection and Diagnosis,F(xiàn)DD)系統(tǒng)顯得尤為必要。
近年來(lái),學(xué)者們?cè)谥评淇照{(diào)傳感器故障診斷方面有較為廣泛的研究,主要有3 類(lèi)典型的診斷方法,分別是基于知識(shí)、模型與數(shù)據(jù)驅(qū)動(dòng)的方法?;谥R(shí)的診斷方法[4-6]的基本原理是首先對(duì)系統(tǒng)的各種運(yùn)行狀況進(jìn)行學(xué)習(xí)訓(xùn)練(不管是否有故障),然后針對(duì)某一實(shí)際的運(yùn)行狀況,應(yīng)用各種啟發(fā)式的推理推斷故障是否存在;基于模型的方法[7-8]是先獲得由數(shù)學(xué)模型計(jì)算而來(lái)的參數(shù)預(yù)測(cè)值,然后得到實(shí)際過(guò)程的輸出值和預(yù)測(cè)值之間的某種關(guān)系并將其作為用于故障診斷的指標(biāo)。而數(shù)據(jù)驅(qū)動(dòng)即依據(jù)數(shù)據(jù)處理的方法[9-10],不用構(gòu)建物理模型,僅僅是借助大量的各種運(yùn)行工況下的歷史數(shù)據(jù),包括正常數(shù)據(jù)和故障數(shù)據(jù),來(lái)掌握變量和參量之間的固有聯(lián)系,通過(guò)這樣的機(jī)器語(yǔ)言學(xué)習(xí)過(guò)程建立的數(shù)學(xué)模型可以用于判別新數(shù)據(jù)中的故障情況并隔離故障源。
近來(lái),數(shù)據(jù)挖掘技術(shù)被廣泛應(yīng)用于檢測(cè)和診斷空調(diào)系統(tǒng)的傳感器故障,這些應(yīng)用通常是通過(guò)采集數(shù)據(jù)、機(jī)器學(xué)習(xí)、歸納演繹、識(shí)別故障或能耗模式來(lái)提取變量數(shù)據(jù)間的關(guān)聯(lián)或系統(tǒng)的隱藏特征[11-15]。其中,主元分析[16-17](Principal Component Analysis,PCA)作為一種典型的在多種制冷空調(diào)系統(tǒng)[11,18-21]中成功得以用于建立純數(shù)學(xué)模型的故障檢測(cè)方法,在其理論研究取得較大進(jìn)展的背后,是許多研究者在其應(yīng)用于故障診斷領(lǐng)域做出的積極貢獻(xiàn):WANG等[18]利用主元分析方法進(jìn)行了冷水機(jī)組的傳感器故障檢測(cè)和診斷工作;DU 等[3,10]則利用Fisher 判別分析法(Fisher Discrimination Analysis,F(xiàn)DA)和聯(lián)合角度法(Joint Angel Analysis,JAA)優(yōu)化了變風(fēng)量(Variable Air Volume,VAV)空調(diào)系統(tǒng)中傳感器故障檢測(cè)與診斷( Fault Detection and Diagnosis,F(xiàn)DD)過(guò)程的PCA 模型,改進(jìn)了PCA法應(yīng)用于傳感器故障的診斷水平;XU 等[22]和DU等[23]采用小波分析(Wavelet Analysis)方法對(duì)于PCA 建模數(shù)據(jù)質(zhì)量問(wèn)題進(jìn)行了探究,從而進(jìn)一步改善了傳統(tǒng)PCA 應(yīng)用于制冷空調(diào)故障診斷的性能。此外,DU 等[24]利用神經(jīng)網(wǎng)絡(luò)(Neural Network)、聚類(lèi)分析(Clustering Analysis)等數(shù)據(jù)挖掘技術(shù)來(lái)診斷空調(diào)系統(tǒng)中的常見(jiàn)故障。這些方法都在一定程度上提高了基于PCA 的傳感器FDD 過(guò)程的性能,但實(shí)際的傳感器監(jiān)測(cè)數(shù)據(jù)往往體現(xiàn)了大型空調(diào)系統(tǒng)中的高度復(fù)雜非線性的控制關(guān)聯(lián)和隨著環(huán)境狀態(tài)多變的運(yùn)行工況特征,而基于傳統(tǒng)PCA 的故障檢測(cè)方法適用于動(dòng)態(tài)系統(tǒng)的穩(wěn)態(tài)過(guò)程[25],利用某一穩(wěn)定工況下的運(yùn)行數(shù)據(jù)建立起來(lái)的主元模型并不能直接應(yīng)用到另外的工況條件。在實(shí)際應(yīng)用時(shí),必須考慮PCA 模型的工況適應(yīng)性問(wèn)題。
本文以一個(gè)實(shí)際的水源熱泵空調(diào)系統(tǒng)為研究對(duì)象,針對(duì)傳感器常見(jiàn)的小幅值偏移和漂移故障,提出一種基于融合聚類(lèi)和改進(jìn)PCA 方法的傳感器FDD 策略??紤]到傳統(tǒng)PCA 模型的工況適應(yīng)性問(wèn)題,采用將減法聚類(lèi)及K-Means 聚類(lèi)結(jié)合的聚類(lèi)方法對(duì)各種運(yùn)行工況的建模數(shù)據(jù)進(jìn)行識(shí)別與分類(lèi)。主元分析主要用于提取特征變量間的固有關(guān)聯(lián)并按照不同運(yùn)行工況建立統(tǒng)計(jì)學(xué)模型。選擇T2和平方預(yù)測(cè)誤差(Square Prediction Error,SPE)統(tǒng)計(jì)量作為FDD 檢測(cè)指標(biāo),向溫度和其他類(lèi)型傳感器引入典型的傳感器故障如固定和漂移故障,此外,還采用交叉運(yùn)行工況的模型來(lái)研究運(yùn)行工況的變化對(duì)統(tǒng)計(jì)量指標(biāo)變化敏感度的影響。
設(shè)原始數(shù)據(jù)集為矩陣X0,X0∈Rm×n(m為樣本數(shù),n為變量數(shù))。
首先得到X0的標(biāo)準(zhǔn)化矩陣X。根據(jù)矩陣論原理,標(biāo)準(zhǔn)化矩陣X的協(xié)方差矩陣R可以作為主元分析的對(duì)象。協(xié)方差矩陣定義為:
對(duì)協(xié)方差矩陣R進(jìn)行特征值分解,分別得到特征值和對(duì)應(yīng)的特征向量。特征值按λ1>λ2>…>λn>0的形式排列,而其所對(duì)應(yīng)的特征向量也對(duì)應(yīng)組成特征值矩陣U,U是一個(gè)n維方陣,[p1,p2,… ,pn]。
本研究采用累計(jì)貢獻(xiàn)率法[26]選取主元個(gè)數(shù)l。因此,根據(jù)特征值分解和主元數(shù)的確定,可將測(cè)量空間劃分為兩個(gè)正交子空間:產(chǎn)生正常數(shù)據(jù)變化的主元子空間(Principal Component Subspace,PCS)和產(chǎn)生不正常變化或者噪音的殘差子空間(Residual Subspace,RS)。任意一個(gè)采樣數(shù)據(jù)x,都可分別投影在兩個(gè)子空間,得到其投影為主元向量和殘差向量e,如圖1所示。
圖1 采樣數(shù)據(jù)x 在PCA 模型下的投影關(guān)系
式中,p為載荷矩陣,是主元分析的投影矩陣,p的列是協(xié)方差矩陣R的前l(fā)個(gè)最大特征值對(duì)應(yīng)的特征向量,即p=[p1,p2,…pn],p∈Rn×l。
1.1.1 故障檢測(cè)指標(biāo)
通常用平方預(yù)測(cè)誤差和Hotelling′sT2(簡(jiǎn)稱(chēng)T2統(tǒng)計(jì)量)來(lái)檢測(cè)傳感器數(shù)據(jù)是否發(fā)生異常。Q統(tǒng)計(jì)量表征樣本點(diǎn)到主元子空間的距離,其數(shù)值等于殘差向量e在殘差空間上的歐氏距離的平方。
當(dāng)有傳感器發(fā)生故障導(dǎo)致測(cè)量數(shù)據(jù)間相關(guān)關(guān)系的變化,殘差可能顯著增加,導(dǎo)致其Q統(tǒng)計(jì)量大于一個(gè)固定范圍。
當(dāng)存在故障工況時(shí),會(huì)出現(xiàn):
式中,Qα為SPE 的閾值,可根據(jù)后n-l個(gè)特征值計(jì)算得到[26]。
T2統(tǒng)計(jì)量分析的是原始樣本點(diǎn)在主元空間中投影的分布情況,其數(shù)值等于樣本點(diǎn)在主元子空間的投影點(diǎn)到樣本點(diǎn)的均值點(diǎn)的距離,可表示為:
式中,Λ1,l= diag(λ1,λ2,...,λl)表示前l(fā)個(gè)特征值組成的對(duì)角矩陣。
T2統(tǒng)計(jì)量服從F分析,其檢測(cè)閾值為:
式中,m為樣本數(shù);l為所保留的主元數(shù);Fl,m-l,α為自由度為l和m-l、置信度為α的F分布的臨界值。
1.1.2 故障診斷指標(biāo)
Q貢獻(xiàn)率[27]被廣泛用于采用Q統(tǒng)計(jì)量作為判斷依據(jù)的故障源診斷分析中。從計(jì)算原理上分析,Q統(tǒng)計(jì)量表征了殘差向量e的各個(gè)分量在殘差空間各維度上投影的平方。
殘差向量e所在的n維殘差空間中,每個(gè)維度對(duì)Q統(tǒng)計(jì)量的貢獻(xiàn)率定義為:
當(dāng)采樣數(shù)據(jù)的第i個(gè)分量出現(xiàn)故障變化,導(dǎo)致該數(shù)據(jù)的殘差向量e在第i維的維度上出現(xiàn)偏差。該偏差會(huì)導(dǎo)致所在維度的貢獻(xiàn)率增大。因此,通過(guò)確定最大貢獻(xiàn)率所在的維度i,可以確定第i個(gè)傳感器為故障源所在。
考慮到PCA 模型的工況適應(yīng)性問(wèn)題,本文將提出一種結(jié)合減法聚類(lèi)和K-means 聚類(lèi)方法的數(shù)據(jù)預(yù)處理策略,減法聚類(lèi)方法可快速確定較準(zhǔn)確的初始聚類(lèi)中心,并可自動(dòng)確定具有較好聚類(lèi)效果的最大聚類(lèi)數(shù)目,這兩點(diǎn)彌補(bǔ)了K-means 聚類(lèi)方法的兩點(diǎn)不足:聚類(lèi)數(shù)目的事先給定很難估計(jì);初始聚類(lèi)中心的選擇對(duì)聚類(lèi)結(jié)果有較大的影響。
1.2.1 減法聚類(lèi)
減法聚類(lèi)是一種爬山法[28],是將所有的樣本點(diǎn)作為聚類(lèi)中心的候選點(diǎn)。它是一種快速而獨(dú)立的近似的聚類(lèi)方法,其計(jì)算量與樣本點(diǎn)的數(shù)目成簡(jiǎn)單的線性關(guān)系,而且與所考慮問(wèn)題的維數(shù)無(wú)關(guān)。
減法聚類(lèi)首先計(jì)算每個(gè)樣本點(diǎn)的密度指標(biāo)[29],如果該樣本點(diǎn)周?chē)狞c(diǎn)多,則密度指標(biāo)就大,然后將密度指標(biāo)最大的樣本點(diǎn)選為第一個(gè)聚類(lèi)中心;選定第一個(gè)聚類(lèi)中心后,其它樣本點(diǎn)的密度指標(biāo)根據(jù)樣本點(diǎn)距離第一個(gè)聚類(lèi)中心的距離做相應(yīng)的調(diào)整,離第一個(gè)聚類(lèi)中心越近的樣本點(diǎn),其密度指標(biāo)減小得越多,下一個(gè)聚類(lèi)中心選在調(diào)整后的密度指標(biāo)最大的樣本點(diǎn)上;然后再對(duì)所有樣本點(diǎn)的密度指標(biāo)進(jìn)行調(diào)整,不斷尋找下一個(gè)聚類(lèi)中心,直到最后一個(gè)聚類(lèi)中心的密度指標(biāo)值和第一個(gè)聚類(lèi)中心的密度指標(biāo)值之比小于一個(gè)參數(shù)δ值,δ≥0.5 時(shí)有較好的聚類(lèi)效果,且當(dāng)δ=0.5 時(shí)所獲得的聚類(lèi)數(shù)目最多,因此,在自動(dòng)設(shè)定聚類(lèi)數(shù)時(shí),以δ=0.5 時(shí)所獲得的聚類(lèi)數(shù)為最大上限Cmax。
1.2.2 K-Means 聚類(lèi)
K-Means 聚類(lèi)算法[30]是一種以平均值作為聚類(lèi)中心的分割聚類(lèi)方法,簡(jiǎn)單易操作而且快速是其最大的優(yōu)點(diǎn),在處理大數(shù)據(jù)集時(shí),也能表現(xiàn)較高的效率和相對(duì)可伸縮性。因此它成為數(shù)據(jù)挖掘算法中一類(lèi)基礎(chǔ)且重要的聚類(lèi)方法。
K-Means 算法首先需要選取初始聚類(lèi)中心,然后對(duì)所有數(shù)據(jù)點(diǎn)進(jìn)行分類(lèi),最后計(jì)算每個(gè)聚類(lèi)的平均值調(diào)整聚類(lèi)中心,不斷的迭代循環(huán)。最終使同一聚類(lèi)內(nèi)數(shù)據(jù)間的距離最小,不同聚類(lèi)數(shù)據(jù)間的距離最大[31]。
圖2所示為基于數(shù)據(jù)驅(qū)動(dòng)方法的傳感器故障檢測(cè)流程。
圖2 基于數(shù)據(jù)驅(qū)動(dòng)方法的傳感器故障檢測(cè)流程
主要分為3 個(gè)部分:模型適應(yīng)性預(yù)處理(訓(xùn)練和測(cè)試數(shù)據(jù))、模型訓(xùn)練(訓(xùn)練數(shù)據(jù))和模型檢測(cè)(測(cè)試數(shù)據(jù))。
1)模型適應(yīng)性預(yù)處理
此部分主要是考慮到前文提出的PCA 模型的工況適應(yīng)性問(wèn)題,對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行聚類(lèi)分析,以得到適用于PCA 建模的各子訓(xùn)練數(shù)據(jù)庫(kù)和匹配于相應(yīng)子訓(xùn)練數(shù)據(jù)庫(kù)的子測(cè)試數(shù)據(jù)集。
2)模型訓(xùn)練
通過(guò)對(duì)各子訓(xùn)練數(shù)據(jù)集的學(xué)習(xí),可以得到多個(gè)子PCA 模型。
3)模型測(cè)試
對(duì)新的測(cè)試數(shù)據(jù)矩陣進(jìn)行標(biāo)準(zhǔn)化處理后,再計(jì)算相應(yīng)的Q統(tǒng)計(jì)量和T2統(tǒng)計(jì)量,并分別與訓(xùn)練模型的閾值Qα和T2α作比較,以判斷是否產(chǎn)生故障或發(fā)生工況變化。
2.1.1 系統(tǒng)及數(shù)據(jù)對(duì)象
圖3所示為某辦公大樓水源熱泵系統(tǒng)結(jié)構(gòu)簡(jiǎn)圖。該水源熱泵系統(tǒng)包含3 個(gè)子系統(tǒng):室外的水源換熱系統(tǒng)、機(jī)房冷水機(jī)組系統(tǒng)和室內(nèi)末端的空調(diào)系統(tǒng)。機(jī)組的啟停及壓縮機(jī)的頻率均為人為控制,一般運(yùn)行時(shí)間為周一至周五08:00—17:30。機(jī)組運(yùn)行監(jiān)測(cè)過(guò)程中,以10 min 的采集頻率采集各種實(shí)際運(yùn)行數(shù)據(jù)。監(jiān)測(cè)時(shí)間覆蓋整個(gè)夏季工況和冬季工況。冬夏季工況由管路中閥門(mén)切換控制,夏季冷水供回水溫度設(shè)計(jì)為7 ℃/12 ℃,冬季熱水供回水溫度為45 ℃/40 ℃,空調(diào)末端設(shè)備均采用風(fēng)機(jī)盤(pán)管。
圖3 測(cè)試的水源熱泵系統(tǒng)結(jié)構(gòu)簡(jiǎn)圖
該系統(tǒng)中主要采用溫度和流量傳感器來(lái)監(jiān)測(cè)各種工況下的性能及能耗情況,其中主要包括直接測(cè)量得到的室內(nèi)環(huán)境溫度Tin、冷凍水供水溫度Tsw、冷凍水回水溫度Trw、冷凍水瞬時(shí)流量Fi、冷水機(jī)運(yùn)行數(shù)量N、室外空氣溫度Tout等傳感器,還有間接計(jì)算得到的可反映系統(tǒng)性能和能耗情況的制冷/供暖量Qi、機(jī)組功率P等。本研究選取該系統(tǒng)2016年7月和8月的實(shí)測(cè)運(yùn)行數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),并將7月數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,8月數(shù)據(jù)集作為原始測(cè)試數(shù)據(jù)集,其中7月的數(shù)據(jù)量為1,856,8月的數(shù)據(jù)量為1,161。
2.1.2 傳感器故障
常見(jiàn)的傳感器故障[25],包括偏移、漂移、精度下降和失效故障。其中,偏移故障是指測(cè)量值和真值的差值是一個(gè)定值,故障測(cè)量值與無(wú)故障測(cè)量值是平行的;漂移故障是指差值是時(shí)變的,比如線性變化的,有故障測(cè)量值與無(wú)故障測(cè)量值之間的差距隨時(shí)間的推移而不斷加大;精度下降故障指差值是隨機(jī)變化產(chǎn)生的隨機(jī)噪聲,故障測(cè)量值與無(wú)故障測(cè)量值混雜在一起;而失效故障指測(cè)量值趨于一定常數(shù),通常這一恒定值是0 或者最大讀數(shù)。
2.1.3 故障分析模型
基于PCA 模型的傳感器的FDD 分析,本質(zhì)上來(lái)說(shuō),是采用監(jiān)測(cè)空調(diào)系統(tǒng)過(guò)程中采集的多個(gè)數(shù)據(jù)信號(hào)進(jìn)行數(shù)據(jù)分析的過(guò)程。這些數(shù)據(jù)信號(hào)之間相關(guān)性高,該相關(guān)性被能量守恒定律、熱平衡原理等基本規(guī)律所制約[26]。因此必須建立相關(guān)測(cè)量數(shù)據(jù)的關(guān)系模型,再運(yùn)用基于數(shù)據(jù)的方法來(lái)分析其相關(guān)性。
根據(jù)所研究系統(tǒng)的能量守恒關(guān)系以及相關(guān)的控制關(guān)聯(lián),可以建立如下包含8 個(gè)變量的PCA 統(tǒng)計(jì)模型。
本研究擬采用Q統(tǒng)計(jì)量和T2統(tǒng)計(jì)量的雙重檢測(cè)標(biāo)準(zhǔn)實(shí)現(xiàn)對(duì)傳感器測(cè)試數(shù)據(jù)的故障檢測(cè),對(duì)應(yīng)可能出現(xiàn)的4 種故障檢測(cè)結(jié)果:SPE 和T2統(tǒng)計(jì)量均沒(méi)有超過(guò)閾值;SPE 超過(guò),T2沒(méi)有超過(guò);SPE 和T2均超過(guò),通常認(rèn)為這4 種結(jié)果和傳感器故障和工況擾動(dòng)有關(guān)[32]。本研究將著重于這4 種檢測(cè)結(jié)果下的異常行為變化分析,為此需要對(duì)原始測(cè)試數(shù)據(jù)集分別進(jìn)行適當(dāng)處理。因此,為了探究將SPE 和T2統(tǒng)計(jì)量對(duì)傳感器故障和工況變化兩種異常數(shù)據(jù)狀態(tài)的指標(biāo)變化,可以采用以下研究方法:
1)向劃分工況的原始測(cè)試集引入故障,如表1所示,其中漂移程度設(shè)定為測(cè)試樣本集的最后一個(gè)樣本漂移至最大的偏差程度;此時(shí)主要是檢驗(yàn)傳感器故障對(duì)Q統(tǒng)計(jì)量檢驗(yàn)標(biāo)準(zhǔn)的影響;
表1 引入的傳感器故障類(lèi)型及大小
2)不向原始測(cè)試集引入故障,將屬于B 工況的測(cè)試集來(lái)測(cè)試?yán)肁 工況建立的PCA 模型,此時(shí)主要是模擬工況的變化對(duì)T2統(tǒng)計(jì)量檢驗(yàn)標(biāo)準(zhǔn)分布的影響。
本文分別采用故障檢測(cè)率和故障診斷率[22]來(lái)量化基于PCA 的傳感器多測(cè)量樣本的FDD 的能力。故障檢測(cè)率是指Q統(tǒng)計(jì)量超過(guò)閾值的樣本數(shù)與測(cè)試數(shù)據(jù)的總樣本數(shù)之比。當(dāng)檢測(cè)率高于20%時(shí),認(rèn)為故障檢測(cè)才是成功的。此外,故障診斷率是正確診斷故障(Q統(tǒng)計(jì)量最大貢獻(xiàn)率所在的維度與引入故障的維度相同)的樣本數(shù)與Q統(tǒng)計(jì)量超過(guò)閾值的樣本數(shù)之比。當(dāng)診斷率低于50%時(shí),認(rèn)為故障診斷是錯(cuò)誤的,即發(fā)生了故障誤報(bào)。“Q診斷率”的故障診斷結(jié)果的表示方式是Q貢獻(xiàn)率圖[33]的數(shù)字直觀表示,不僅定量分析故障診斷的效果,而且還較好地結(jié)合了故障檢測(cè)率的概念,即認(rèn)為只有檢測(cè)到故障的產(chǎn)生(Q統(tǒng)計(jì)量超過(guò)閾值),才有可能實(shí)施故障診斷,即識(shí)別故障傳感器,此時(shí)故障診斷的正確性判斷更具有科學(xué)性。
根據(jù)聚類(lèi)原理關(guān)系,考慮到本實(shí)驗(yàn)對(duì)象非穩(wěn)態(tài)運(yùn)行工況的存在,指定減法聚類(lèi)參數(shù)δ=0.5,得到最大聚類(lèi)數(shù)目Cmax=10,對(duì)訓(xùn)練集和原始測(cè)試集利用減法聚類(lèi)和K-means 聚類(lèi)方法同時(shí)進(jìn)行分類(lèi)預(yù)處理,由此得到的子訓(xùn)練集和子測(cè)試集的分類(lèi)情況如表2所示。
表2 訓(xùn)練集和原始測(cè)試集中每一聚類(lèi)中的樣本數(shù)
由于聚類(lèi)3 只有一個(gè)數(shù)據(jù),故不予討論其驗(yàn)證結(jié)果。以下對(duì)聚類(lèi)2、聚類(lèi)4 和聚類(lèi)9 子測(cè)試數(shù)據(jù)集進(jìn)行處理,得到多種傳感器故障或交叉工況的數(shù)據(jù)基于Q統(tǒng)計(jì)量和T2統(tǒng)計(jì)量檢測(cè)標(biāo)準(zhǔn)的FDD結(jié)果。
3.1.1 溫度類(lèi)傳感器的FDD 結(jié)果匯總
表3所示為聚類(lèi)4 子測(cè)試數(shù)據(jù)集和沒(méi)有進(jìn)行聚類(lèi)處理的原始測(cè)試集的供水溫度傳感器的故障診斷率。表4所示為聚類(lèi)2、聚類(lèi)4 和聚類(lèi)9 子測(cè)試數(shù)據(jù)集和未進(jìn)行聚類(lèi)處理的原始總測(cè)試集的溫度類(lèi)傳感器引入表3所示故障的基于Q統(tǒng)計(jì)量和T2雙重檢測(cè)標(biāo)準(zhǔn)的故障檢測(cè)效率。
表3 引入故障的各子測(cè)試集的故障診斷率匯總表(%)
表4 引入故障的各測(cè)試集的基于Q 和T2 統(tǒng)計(jì)量的故障檢測(cè)率匯總表(%)
3.1.2 其他類(lèi)傳感器的FDD 結(jié)果匯總
表5所示為聚類(lèi)2、聚類(lèi)4 和聚類(lèi)9 子測(cè)試數(shù)據(jù)集和未進(jìn)行聚類(lèi)處理的原始測(cè)試集的其他類(lèi)傳感器(除溫度傳感器外)的基于Q統(tǒng)計(jì)量和T2雙重檢測(cè)標(biāo)準(zhǔn)的故障檢測(cè)效率。表6所示為聚類(lèi)2 子測(cè)試數(shù)據(jù)集和未進(jìn)行聚類(lèi)處理的原始測(cè)試集的機(jī)組功率傳感器的故障診斷率。
表5 引入故障的各測(cè)試集的基于Q 和T2 統(tǒng)計(jì)量的故障檢測(cè)率匯總表(%)
表6 引入故障的各測(cè)試集的故障診斷率匯總表(%)
3.1.3 引入故障的FDD 結(jié)果分析
為了研究聚類(lèi)2 的原始測(cè)試集驗(yàn)證,利用聚類(lèi)4 的訓(xùn)練集建立的PCA 模型的FDD 特性,用以作為交叉模型的FDD 分析的例子。
由此計(jì)算可得基于Q統(tǒng)計(jì)量的故障檢測(cè)效率為100%。此時(shí)各變量的Q貢獻(xiàn)率如圖4所示,圖中各區(qū)域從上至下分別代表的變量為:室外空氣溫度、冷水機(jī)運(yùn)行數(shù)量、機(jī)組功率、瞬時(shí)熱量、冷凍水瞬時(shí)流量、冷凍水回水溫度、冷凍水供水溫度和室內(nèi)環(huán)境溫度。
圖4 交叉工況驗(yàn)證的Q 貢獻(xiàn)率
由圖4可知,各變量對(duì)Q統(tǒng)計(jì)量的貢獻(xiàn)率相當(dāng)。說(shuō)明此時(shí)各傳感器未發(fā)生明顯故障使某一個(gè)變量的Q統(tǒng)計(jì)量貢獻(xiàn)率偏大,這是符合預(yù)計(jì)的結(jié)果。
基于T2統(tǒng)計(jì)量的檢測(cè)效率達(dá)到100%,和3.1節(jié)的驗(yàn)證內(nèi)容相比,這是最明顯的區(qū)別,此時(shí)交叉工況模型的統(tǒng)計(jì)量驗(yàn)證的目的達(dá)成,但同時(shí),基于Q統(tǒng)計(jì)量檢測(cè)標(biāo)準(zhǔn)的故障檢測(cè)效率也較高,這可能是和數(shù)據(jù)質(zhì)量問(wèn)題有關(guān)。
本文以水源熱泵系統(tǒng)的傳感器為對(duì)象,在建立該對(duì)象的變量故障分析統(tǒng)計(jì)模型的基礎(chǔ)上,利用將減法聚類(lèi)及K-Means 結(jié)合的聚類(lèi)分析方法,對(duì)歷史正常運(yùn)行數(shù)據(jù)進(jìn)行分類(lèi)預(yù)處理,從而建立分類(lèi)的歷史正常運(yùn)行數(shù)據(jù)的數(shù)據(jù)庫(kù),分別訓(xùn)練各個(gè)分類(lèi)下的正常數(shù)據(jù)以建立PCA 模型;對(duì)新的測(cè)試數(shù)據(jù)進(jìn)行歸類(lèi),分別向?qū)崪y(cè)傳感器數(shù)據(jù)的各類(lèi)傳感器采取引入故障或交叉工況的數(shù)據(jù)處理手段,再利用對(duì)應(yīng)的PCA 模型分析測(cè)試數(shù)據(jù)的基于Q統(tǒng)計(jì)量和T2統(tǒng)計(jì)量的FDD 性能,得到如下結(jié)論:
1)融合減法聚類(lèi)及K-Means 聚類(lèi)的綜合聚類(lèi)方法彌補(bǔ)了單一K-Means 聚類(lèi)方法的不足,實(shí)現(xiàn)了對(duì)建模及測(cè)試數(shù)據(jù)的分類(lèi)預(yù)處理過(guò)程,由此建立的多個(gè)PCA 模型改善了傳統(tǒng)PCA 對(duì)多樣工況傳感器故障的檢測(cè)性能,表現(xiàn)為對(duì)傳感器漂移故障的檢測(cè)效率約提升50%,在其他故障條件下也能顯著提高測(cè)試數(shù)據(jù)的故障檢測(cè)率和故障診斷率;
2)SPE 統(tǒng)計(jì)量和T2統(tǒng)計(jì)量故障檢測(cè)指標(biāo)對(duì)于同一傳感器變量的同一故障過(guò)程的故障檢測(cè)能力表現(xiàn)出不同的敏感度,相對(duì)而言,基于SPE 統(tǒng)計(jì)量的故障檢測(cè)指標(biāo)對(duì)引入偏移、漂移等傳感器故障的測(cè)試過(guò)程的檢測(cè)能力更強(qiáng),而基于T2統(tǒng)計(jì)量的故障檢測(cè)指標(biāo)對(duì)發(fā)生工況擾動(dòng)或變化的測(cè)試過(guò)程的檢測(cè)能力更強(qiáng);
3)基于SPE 統(tǒng)計(jì)量和T2統(tǒng)計(jì)量的故障檢測(cè)結(jié)果體現(xiàn)了將PCA 應(yīng)用于FDD 流程的特點(diǎn):基于PCA 的FDD 能力高低很大程度上取決于數(shù)據(jù)質(zhì)量的好壞,能夠獲取大量無(wú)故障歷史運(yùn)行數(shù)據(jù)是PCA進(jìn)行優(yōu)化建模的前提;同一傳感器變量在不同處理?xiàng)l件下,檢測(cè)效率差異較大,體現(xiàn)在工況變化較偏移和漂移等傳感器故障的檢測(cè)效率高,可達(dá)到完全檢測(cè)(100%);而對(duì)于不同大小程度的傳感器故障,一般來(lái)說(shuō),其故障檢測(cè)率隨著偏差的增大而提高,且對(duì)同一大小的正負(fù)偏差的檢測(cè)能力相近。