李前舸,薛揚帆,張帥,朱旭,杜志敏
(上海交通大學制冷與低溫工程研究所,上海 200240)
冷水機組通常分為水冷式冷水機組與風冷式冷水機組兩種。其中水冷式機組結(jié)構(gòu)緊湊、制冷量大,往往被應用為大型公共建筑的中央空調(diào)供冷設備[1]。而相對應的,一旦大型冷水機組發(fā)生故障,其影響區(qū)域也往往較大。且空調(diào)系統(tǒng)耗能在建筑能耗中占有很大的比重[2],因此對于發(fā)生故障的冷水機組進行快速檢測與診斷尤為重要。有調(diào)查表明,制冷劑泄漏是發(fā)生頻率僅次于電控設備故障的高發(fā)故障。制冷劑泄漏或充注過量所導致的相應故障令冷水機組性能系數(shù)降低,額外增加能耗,進而造成建筑物室內(nèi)舒適度下降等問題。但是,當前冷水機組的制冷劑泄漏問題,在實際應用中仍然是難點問題。
故障檢測與診斷技術(shù)在減少設備失效時間、降低能耗與運行成本等方面有良好的應用前景。對于制冷劑泄漏故障,已有的研究主要包括利用決策樹算法[3]、劃分網(wǎng)格優(yōu)化遺傳算法以及支持向量機等進行分類的方法[4],其他機器學習算法則包括離散型神經(jīng)網(wǎng)絡[5]或前饋神經(jīng)網(wǎng)絡等。該類方法所訓練神經(jīng)網(wǎng)絡較為復雜,因此也有研究通過配合主成分分析降維后提取主元降低訓練復雜度[6]。其中,有監(jiān)督支持向量機訓練過程相對簡單,且對于制冷劑泄漏故障的檢測與診斷有較為良好的表現(xiàn)。但是,該方法對于訓練初始化的參數(shù)選擇依賴性較強。工業(yè)故障診斷往往具有樣本偏斜、樣本小以及問題非線性等特點,而支持向量機在該類問題上有著良好的表現(xiàn)[7]。
本文提出基于縱橫交叉算法優(yōu)化的支持向量機模型,用于冷水機組制冷劑充注量故障的檢測與診斷。通過嵌套使用縱橫交叉算法對支持向量機進行參數(shù)優(yōu)化,進而判斷離心式冷水機組的制冷劑充注情況,對不同故障等級進行判斷;使用ASHRAE-1043-RP[7]的冷水機組運行數(shù)據(jù)進行驗證。
離心式冷水機組主要由離心式壓縮機、蒸發(fā)器、冷凝器、閥件及控制柜組成。因其制冷量大、效率高等優(yōu)點在大型工程項目中得到廣泛應用。但由于其系統(tǒng)較為復雜,維護成本偏高,并不適用于所需制冷量較小的場合。因此當離心式冷水機組發(fā)生故障時,難以確定具體故障部件。加之其使用場所為大型公共建筑或工程項目,故障往往會造成較大的影響。
制冷劑泄漏是制冷系統(tǒng)的常見故障之一,主要發(fā)生在閥門連接處以及管道焊接處,且該故障發(fā)生頻率較高。制冷劑泄漏是一個較為緩慢的過程,在運行的過程中隨著制冷劑泄漏量的增加,機組性能會不斷下降。但與其他突然發(fā)生的故障不同,往往在泄漏量較大、機組性能低于一定的臨界值時才會被診斷為發(fā)生故障。而在此之前機組已經(jīng)在制冷劑不足的情況下運行了較長時間,具有較大的延遲性。與之相對應的制冷劑充注量過多故障則易發(fā)生在補充制冷劑時段。
特征選取是使用機器學習方法進行故障診斷中對數(shù)據(jù)預處理很重要的一個環(huán)節(jié)。根據(jù)一定的評價標準從眾多傳感器中選擇對所測量故障較為敏感的傳感器,在最大程度減少計算量的同時保證較高的診斷正確率。文獻[8]根據(jù)常見冷水機組故障發(fā)生頻率,按降序排序,對64 個可供選擇的傳感器特征進行計算。對于制冷劑充注量故障,從1043-RP項目在實驗系統(tǒng)布置的多個傳感器中選取8 個特征(表1)作為制冷劑故障診斷指標。
表1 診斷用符號說明
支持向量機由于出色的分類能力被廣泛應用于工業(yè)故障檢測與診斷中,研究者通常嘗試將不同優(yōu)化的支持向量機融合到一個通用的框架中,提高故障檢測和診斷效果[9]。支持向量機是一種二分類模型,基本原理是一個定義在樣本特征空間上的間隔最大的線性分類器。通過訓練超平面ωx+b=0對樣本進行劃分。在分類問題中,通過給定輸入數(shù)據(jù)與學習目標,其中輸入數(shù)據(jù)的每個樣本都包含多個特征并由此構(gòu)成特征空間;而學習目標為二元變量。圖1中,對特征空間中的所有樣本進行劃分時,超平面將特征空間中的所有點分成A、B 兩類,此時支撐分割線的平面上的點被稱為為支持向量。
圖1 支持向量機示意圖
對于支持向量機的求解可以轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解,支持向量機的訓練算法是求解一個最優(yōu)化凸二次規(guī)劃的算法。對于線性不可分的數(shù)據(jù),支持向量機通過引入核函數(shù)將特征向量映射到更高維特征空間,并在映射后的高維空間內(nèi)求解超平面劃分數(shù)據(jù),所得到的分類器形式為:
訓練目標是最大化樣本間隔,即:
式中,ξi為第i個樣本點分類錯誤帶來的損失,分類正確時ξi=0。C是懲罰因子,C趨向于無窮時,表示不允許出現(xiàn)分類錯誤的樣本,所得到的分類器泛化能力較差;C趨向于0 時,表示分類結(jié)果無意義而僅要求最大化間隔,此時算法不收斂。當選取高斯核為核函數(shù)時,參數(shù)γ定義單個樣本對超平面的影響。γ較小時,單個樣本對超平面的影響較小,支持向量較少;γ較大時,單個樣本對超平面的影響較大,更容易被選為支持向量,支持向量較多。
縱橫交叉算法[10](Crisscrossed Optimization,CSO)是一種新型求解最優(yōu)解的搜索算法。類似于遺傳算法,但通過不同維度特征之間的交叉使得其數(shù)據(jù)突變更為充分,有利于擺脫整體陷入局部最優(yōu)的情況。CSO 的每一次迭代包含一次橫向交叉、縱向交叉以及一次競爭淘汰。每一次迭代時CSO 都會從橫向與縱向分別對種群內(nèi)數(shù)據(jù)交叉產(chǎn)生子代,子代數(shù)值介于父代之間。競爭淘汰中,新產(chǎn)生的子代與父代進行適應能力的對比,劣者淘汰,優(yōu)者取代劣者位置,被稱為占優(yōu)解。占優(yōu)解在下一次迭代過程中重新成為父代,并與其他父代進行交叉。即在算法的迭代中,CSO 始終用貪心法把當前最優(yōu)個體保留在種群內(nèi),從而保證算法的收斂。
2.2.1 橫向交叉
橫向交叉即從種群內(nèi)隨機抽取個體兩兩配對,將配對的個體在所有維度內(nèi)進行一次算術(shù)交叉產(chǎn)生兩個子代個體。假設抽取個體FiFi,F(xiàn)j為父代,對第d維數(shù)據(jù)進行交叉,則產(chǎn)生的兩個子代的第d維數(shù)據(jù)為:
式中,r1,r2為[0,1]上的隨機數(shù);C1,C2為[-1,1]上的隨機數(shù);Si,d為子代i的第d維數(shù)值。上式表明,子代數(shù)值以父代數(shù)值為基礎(chǔ),并在該基礎(chǔ)值附近以C1為放縮倍數(shù)進行探索,即小范圍突變,該搜索機制能夠縮小搜索過程中的盲點區(qū)域,有利于子代跳出局部最優(yōu)解。
2.2.2 縱向交叉
縱向交叉與橫向交叉對兩個父代個體交叉產(chǎn)生兩個子代個體不同,縱向交叉是對一個父代個體內(nèi)部不同維度之間進行交叉,以進行突變、避免陷入局部最優(yōu),一次產(chǎn)生一個子代個體。假設抽取個體Fi為父代,對第d、e維數(shù)據(jù)進行交叉,則產(chǎn)生的子代數(shù)據(jù)為:
式中,r1,r2為[0,1]上的隨機數(shù)。由于不同維度數(shù)據(jù)之間量綱不同,因此在進行縱向交叉之前需要先對數(shù)據(jù)矩陣進行歸一化,得到子代數(shù)據(jù)后需要進行逆歸一化,再同父代個體進行競爭淘汰。遺傳算法在迭代過程中易陷入局部最優(yōu)解,而CSO 的縱向交叉使個體的不同維度之間進行信息交叉,即每一次迭代過程中都對個體進行“強制突變”,若個體在全局最優(yōu)解附近,由于CSO 總會將最優(yōu)個體保留,因而經(jīng)數(shù)次迭代后CSO 仍會收斂于全局最優(yōu)解;若個體在局部最優(yōu)解,則強制突變會使個體跳出局部最優(yōu),并迅速通過隨機橫向交叉擴散至全部個體。這是CSO 區(qū)別于遺傳算法的一個重要特征。
圖2所示為優(yōu)化支持向量機診斷流程。為了消除變量間量綱與數(shù)量級的影響,標準化實驗得到過充和泄漏數(shù)據(jù),并將所有維度數(shù)據(jù)的均值化為0,標準差化為1。隨機抽取總實驗數(shù)據(jù)的30%作為測試集,剩余70%作為訓練集訓練SVM 模型。
圖2 優(yōu)化支持向量機診斷流程
在CSO 模型中,初始化多組不同C和γ作為初始種群,計算適應度并開始在CSO 中迭代。當滿足終止條件(適應度增加量足夠小或達到終止迭代次數(shù)),輸出適應度最高的C和γ即得到最優(yōu)支持向量機模型。最后使用測試集數(shù)據(jù)驗證該模型,計算分類正確率并與經(jīng)驗參數(shù)計算得到的模型對比。
本文使用ASHRAE-1043-RP 的離心式冷水機組實驗數(shù)據(jù)。該實驗使用制冷量為90 冷噸的離心式冷水機組,對于每種故障情況,故障嚴重程度從重到輕劃分為4 個等級。
制冷劑泄漏通常是由于系統(tǒng)的氣密性失效所導致,機組外空氣等成分通過漏點進入機組,較輕微的制冷劑泄漏會導致機組制冷劑流量下降,進而使機組制冷量下降無法滿足冷量需求,較為嚴重時會使機組頻繁停機,無法正常使用。當制冷劑由于充注不當?shù)葐栴}過量時,在蒸發(fā)器內(nèi)可能存在少量制冷劑無法完全蒸發(fā),對壓縮機造成液擊,損害壓縮機。
對于制冷劑泄漏與制冷劑過充兩種故障,實驗數(shù)據(jù)被分為9 種情況,制冷劑由少至多。以無故障情況制冷量為100%計,實驗數(shù)據(jù)分為制冷劑泄漏40%、30%、20%、10%、無故障、制冷劑過充10%、20%、30%、40%。
相關(guān)研究表明,當訓練集較大時,SVM 訓練結(jié)果不會隨著訓練集增大而進一步提高[11],原因在于支持向量機結(jié)果由支持向量構(gòu)成,分類依據(jù)為訓練集中的樣本所提供的支持向量最大間隔。圖3所示為參數(shù)優(yōu)化前分類結(jié)果混淆矩陣。
圖3 參數(shù)優(yōu)化前分類結(jié)果混淆矩陣
實驗使用9 種情況共18,003 組數(shù)據(jù),用正確率衡量訓練SVM 性能,即包含無故障情況在內(nèi)的9種制冷劑充注情況下樣本被正確分類的概率。如“RL1”代表制冷劑泄漏10%,“RO1”代表制冷劑過充10%,“N”代表無故障。未優(yōu)化前使用經(jīng)驗參數(shù),將懲罰因子設為1,核參數(shù)選為0.056[12]。結(jié)果表明對于較為嚴重的制冷劑泄漏或過充,使用經(jīng)驗參數(shù)進行訓練,分類正確率較高,但是當故障等級較輕微時,SVM 易將其與無故障情況誤分類。下圖是測試集數(shù)據(jù)混淆矩陣,縱軸為實際故障等級,橫軸為SVM 所診斷的故障等級。使用經(jīng)驗參數(shù)訓練SVM 在制冷劑泄漏20%時的測試集分類正確率高達100%,但相對應的,制冷劑輕微泄漏或過充時分類正確率較低,總體分類正確率為76.28%。
與網(wǎng)格搜索等劃分區(qū)域?qū)?yōu)不同,由于CSO 算法是一種智能搜索算法,不需要人為劃分網(wǎng)格反復比較參數(shù)優(yōu)劣,因此可以在一個較大范圍內(nèi)進行尋優(yōu)。實驗將種群初始化為含有20 個樣本的種群,在(0,40]范圍內(nèi)使用Python 中Numpy 模塊隨機抽取C與γ的值作為初始化種群。由于1/18003≈0.000055,設置迭代終止條件為分類正確率增加量小于0.000054,即只要上一次迭代增加至少一個分類正確樣本,則算法繼續(xù)迭代尋優(yōu),最大迭代次數(shù)選為50。經(jīng)CSO 迭代后所得優(yōu)化后參數(shù)C=27.52,γ=1.60。優(yōu)化后所得SVM 應用于測試集上的結(jié)果混淆矩陣如圖5所示,總體分類正確率為97.52%。
圖4 參數(shù)優(yōu)化后分類結(jié)果混淆矩陣
上述結(jié)果表明通過CSO-SVM 方法所訓練得到的最優(yōu)支持向量機與經(jīng)驗參數(shù)支持向量機相比,分類準確率顯著提高,尤其是對于輕微故障(制冷劑泄漏或過充10%)的情況。
未優(yōu)化前參考文獻中所給經(jīng)驗參數(shù)不能很好適應實驗用離心式冷水機組,因而無法對輕微故障與正常狀況有效區(qū)分。而優(yōu)化后SVM 模型對該幾類情況區(qū)分效果顯著提升,最低分類正確率為92.7%,對應于過充20%的工況。除此之外,其余分類準確率均為95%以上,其中四種工況的測試集分類正確率高于99%。參數(shù)優(yōu)化前后診斷結(jié)果對比如圖5所示。因此通過CSO 算法優(yōu)化SVM 能夠有效地提升SVM 分類正確率。
圖5 優(yōu)化前后各級別故障診斷結(jié)果對比
本文研究了一種縱橫交叉算法優(yōu)化支持向量機方法用于進行制冷系統(tǒng)的制冷劑充注故障診斷,通過在一定范圍內(nèi)隨機初始化訓練支持向量機所需參數(shù)連續(xù)迭代與更新進行優(yōu)化,分析了不同參數(shù)對于最后尋優(yōu)結(jié)果的影響,得出如下結(jié)論:
1)經(jīng)驗參數(shù)訓練支持向量機對于制冷劑充注過量或泄漏較為嚴重時,具有較高的區(qū)分度,但對于正常與輕微故障不能做到有效區(qū)分,部分情況甚至低于50%;
2)不同制冷系統(tǒng)差別較大,經(jīng)驗參數(shù)對于不同制冷系統(tǒng)適應性較差;參考文獻中C=1、γ=0.056不適用于離心式機組;對于實驗用離心式冷水機組,實際優(yōu)化后最佳參數(shù)為C和γ分別為27.52和1.60;
3)參數(shù)優(yōu)化后制冷劑故障診斷總體準確率由76.28%上升至97.52%,特別對于未優(yōu)化前支持向量機不能有效區(qū)分的輕微故障情況有明顯提升。