徐加軍,張元法,李永強(qiáng),李榮權(quán)
中石化勝利油田分公司勝利采油廠,山東 東營
注水站,卷積神經(jīng)網(wǎng)絡(luò),故障診斷
勝利采油廠建有注水泵站17座,其中離心泵站8座,裝泵臺數(shù)36臺,擔(dān)負(fù)著全廠每天13.7萬方的注水任務(wù)。離心泵站規(guī)模大,一旦停產(chǎn)影響大,要求高可靠性、高時率運行。已完成信息化建設(shè),實現(xiàn)了壓力、溫度、液位等生產(chǎn)參數(shù)的實時采集,在SCADA、PCS和PLC系統(tǒng)部署了故障報警、視頻監(jiān)控和連鎖停泵等功能,從硬件上,已經(jīng)具備無人值守條件。
最近幾年,信號處理技術(shù)、計算機(jī)技術(shù)與現(xiàn)代測試技術(shù)發(fā)展迅速,設(shè)備的故障診斷技術(shù)取得了巨大的進(jìn)展[1]。但是,在設(shè)備實際工作的過程中,仍然存在儀器突發(fā)性故障、儀器細(xì)節(jié)缺陷無法監(jiān)測等問題[2],傳統(tǒng)的解決方式對此并不能取得突出的成效,具體表現(xiàn)為:第一、專家的知識技能無法徹底地貫徹實現(xiàn);第二、在推理能力方面有著巨大的欠缺;第三、學(xué)習(xí)機(jī)制的薄弱以及無法做到與時俱進(jìn);第四、對于設(shè)備儀器的可維護(hù)性差,理論依據(jù)支撐性不強(qiáng)[3]。所以系統(tǒng)的智能故障診斷涵蓋了多項技術(shù),目前仍在存在很多技術(shù)上的短板以及理論的強(qiáng)力支持,針對此課題的注水站應(yīng)急處置聯(lián)動模型需要進(jìn)行系統(tǒng)完備地研究是一項困難艱巨的工作。
油田地面注水系統(tǒng)為油田注水提供了強(qiáng)有力的基礎(chǔ),它主要由注水站、水源地、增壓站等部分組成。油田注水站是該系統(tǒng)的核心部分。在為整個供水系統(tǒng)提供超額注水價值的同時,它還具有注水儲存、增壓、水量分配和水質(zhì)監(jiān)測等關(guān)鍵功能。因此,它也是油田地面注水系統(tǒng)能耗的一個關(guān)鍵來源[4]。勝利采油廠有17個注水泵站。油田注水泵包括離心式注水泵和往復(fù)式注水泵。它廣泛用于油田或采油廠,具有較大的電機(jī)功率。它是油田開發(fā)系統(tǒng)中的主要能源消耗設(shè)備之一。注水泵的能耗占很大比例,因此具有十分可觀的節(jié)能潛質(zhì)[5]。注水站應(yīng)急處置預(yù)測模型的框架設(shè)計如圖1所示。
通過調(diào)研分析了注水站異常數(shù)據(jù)診斷邊界條件,整理出離心泵參數(shù)診斷邊界條件、污水罐參數(shù)診斷邊界條件、高架油箱參數(shù)診斷邊界條件、地下油箱參數(shù)診斷邊界條件、潤滑油泵參數(shù)診斷邊界條件、冷卻水參數(shù)診斷邊界條件以及其它設(shè)備參數(shù)診斷邊界條件等[6]。綜合傳統(tǒng)注水站異常數(shù)據(jù)診斷模型,給出相應(yīng)計算方法,結(jié)合現(xiàn)有工具,利用奇異數(shù)據(jù)濾波模型給出了注水站異常數(shù)據(jù)處理方法。
Figure 1. Design of emergency response prediction model for water injection station圖1. 注水站應(yīng)急處置預(yù)測模型設(shè)計
奇異數(shù)據(jù)過濾模型被用來處理注水站的異常數(shù)據(jù)。其目的是確定數(shù)據(jù)是否有嚴(yán)重的誤差。目前基于統(tǒng)計學(xué)的方法被用來過濾測量數(shù)據(jù)和過濾奇異數(shù)據(jù)。判斷準(zhǔn)則有拉依達(dá)準(zhǔn)則、格拉布斯準(zhǔn)則、t檢驗準(zhǔn)則[7]。
拉依達(dá)準(zhǔn)則:當(dāng)測量次數(shù)N足夠大且測量結(jié)果服從正態(tài)分布時,若某次測量值X所對應(yīng)的剩余誤差V > 3σ,則認(rèn)為該X為壞值,予以清除[8]。
具體步驟如下:
求N次測量值X至X的算術(shù)平均值:
求各項的剩余誤差Vi:
計算標(biāo)準(zhǔn)差σ:
若Vi>3σ,則對應(yīng)的Xi認(rèn)為是壞值,予以剔除。
式(5)中,x是n次獲取的AD值的平均值[9],g (n,a)是根據(jù)測量次數(shù)n和顯著性水平a (相當(dāng)于犯“棄真”錯誤的概率系數(shù))決定的,a普遍取0.01或0.05 [10]。
式(6)中,σ(X )是測量數(shù)據(jù)組的標(biāo)準(zhǔn)差,根據(jù)格拉布斯準(zhǔn)則,當(dāng)≥K,則判斷該值具有很大的誤差,應(yīng)以被過濾[11]。
具體步驟如下:
第一步:排列數(shù)據(jù);
第二步:求平均值、標(biāo)準(zhǔn)差
第三步:計算Gi值:每個數(shù)據(jù)與平均數(shù)的殘差/標(biāo)準(zhǔn)差;
第四步:用這個Gi值與格拉布斯臨界表表中的臨界值比較,越大,越異常,需剔除[12]。
t檢驗準(zhǔn)則:設(shè)x進(jìn)行的是兩列等精度測量(即兩列數(shù)據(jù)是在完全相同情況下取得的),因而它們應(yīng)具有同樣的標(biāo)準(zhǔn)差,σ1 = σ2 = 0。根據(jù)貝塞爾公式,最佳估值為[13]:
式(9)中:n1是x1的測量次數(shù);n2是x2的測量次數(shù)。
由于n1和n2均為有限的測量次數(shù),所以平均值x1和x2本身仍然為隨機(jī)變量,和的標(biāo)準(zhǔn)差(即算術(shù)平均值的標(biāo)準(zhǔn)差)分別為[14]:
概率密度分布函數(shù)為[16]:
式(9)中:v=n?1是自由度[17]。
步驟如下:
第一步:首先將實驗數(shù)據(jù)按大小排列;
注水站中的數(shù)據(jù)清洗表現(xiàn)為將正常數(shù)據(jù)樣本中的能夠被找到的異常數(shù)據(jù)進(jìn)行過濾,主要包含檢測數(shù)據(jù)是否一致、是否存在無效的值等方面。
1) 一致性檢查
一致性檢查(consistency check)通過變量的正常的取值范圍和變量間的相互關(guān)系,查看數(shù)據(jù)是否符合規(guī)范,找出不符合規(guī)范、超出正常閾值的異常數(shù)據(jù)[20]。當(dāng)前諸多計算機(jī)軟件都可以依據(jù)數(shù)據(jù)的閾值進(jìn)行范圍設(shè)置,正確而快速的找出閾值范圍外的異常值。同時對于出現(xiàn)的邏輯混亂的數(shù)據(jù),要有針對性的進(jìn)行梳理、整合[21]。
2) 無效值和缺失值的處理
因為可能在進(jìn)行實際調(diào)查與編碼的過程中存在錄入誤差,所以數(shù)據(jù)中心經(jīng)常會有缺失值與空值,此時我們就需要對這些值進(jìn)行完備的處置。當(dāng)前普遍的解決思路為估算,整例刪除,變量刪除和成對刪除等方式[22]。
估算(estimation)。當(dāng)前最長用的方法為使用樣本的均值、中間值等替換異常數(shù)據(jù)值。此方法雖然操作簡單,但是可能存在較大的誤差。另外的解決思路就是通過樣本數(shù)據(jù)中的關(guān)聯(lián)域隱藏邏輯進(jìn)行估計[23]。
整例刪除(case wise deletion)就是直接對缺失的數(shù)據(jù)值進(jìn)行完全刪除。但是這種方式也同樣存在缺陷,即會令樣本急劇減少,對辛苦收集到的數(shù)據(jù)無法得到充分地利用,同時還可能遺漏掉重要的數(shù)據(jù)[24]。所以該方法只適合非關(guān)鍵數(shù)據(jù)的處理或者缺失樣本較少的情形。
變量刪除(variable deletion)。當(dāng)樣本中的某個特征參數(shù)缺失非常嚴(yán)重并且屬于非重要變量,那么可以對此特征進(jìn)行去除,這樣整體可用的變量數(shù)目雖然有所減少,但沒有改變樣本量,同時也削減了工作量[25]。
成對刪除(pairwise deletion)是指使用特殊的編碼來代替樣本中的缺失或者非正常值,這樣做到處理異常數(shù)據(jù)的同時還保留了樣本的完整性[26]。但是在實際使用過程中,采用不同的數(shù)據(jù)樣本進(jìn)行分析其結(jié)果也會存在些許的差異。因此該方法屬于保守的做法,但是對于保護(hù)樣本的完整性方面是可靠的。
使用上述不同的解決方式,那么結(jié)果也會有差異,尤其是在特征參數(shù)之間存在強(qiáng)關(guān)聯(lián)或者確實的為關(guān)鍵變量時。因此,在實際情況中要盡可能的避免重要參數(shù)的缺失,在保持樣本數(shù)據(jù)完整方面盡可能做好。
數(shù)據(jù)清洗原理:使用諸如數(shù)理統(tǒng)計、數(shù)據(jù)挖掘或預(yù)定義等相關(guān)技術(shù)的清理規(guī)則把異常數(shù)據(jù)清洗為符合規(guī)定的異常數(shù)據(jù),根據(jù)數(shù)據(jù)清洗的操作方法與范圍,分為以下四種形式:
1) 手工實現(xiàn),采用人工實時檢查的方式,該方法雖然存在效率不高且具有嚴(yán)重資源浪費的隱患,但是在長期的投入中對異常數(shù)據(jù)也能發(fā)現(xiàn)并處理。
2) 有針對性地用專有的編寫程序,該方法在針對特定的特征處理效果較好,但是也同樣喪失了靈活性,尤其是在數(shù)據(jù)清洗的過程中需要對數(shù)據(jù)進(jìn)行反復(fù)的操作、導(dǎo)致數(shù)據(jù)結(jié)構(gòu)以及程序變得復(fù)雜。因此在數(shù)據(jù)異常清洗的過程中,在工作量上相較來說增加了不少并且時效也存在嚴(yán)重的缺失。而且這種方法也沒有充分利用目前數(shù)據(jù)庫提供的強(qiáng)大數(shù)據(jù)處理能力。
3) 對于某些特定域的問題的解決,比如通過概率統(tǒng)計學(xué)的原理來尋求數(shù)據(jù)異常的記錄,這是目前進(jìn)行的研究中取得效果較為可觀的一部分。
4) 與特定應(yīng)用領(lǐng)域相關(guān)性不強(qiáng)的異常數(shù)據(jù)情況,目前對于這一模塊的探索主要為清理重復(fù)的記錄。
這4種數(shù)據(jù)清理的方法,因為后兩種方式在某種程度上相通,在實際應(yīng)用上具有很好的效果,收到的關(guān)注越來越廣泛。上述的這些方法大體上基本由三個階段所構(gòu)成:① 數(shù)據(jù)分析、定義錯誤類型;② 搜索、識別錯誤記錄;③ 修正錯誤。
在第一階段,雖然有很多數(shù)據(jù)分析工具和軟件,但還是以人工為主。錯誤類型主要有單一數(shù)據(jù)源和多個數(shù)據(jù)源,可分為結(jié)構(gòu)級錯誤和記錄級錯誤。上述分類對數(shù)據(jù)樣本有很好的清洗效果。
在第二階段,識別錯誤有兩種解決方案:一種是找到數(shù)據(jù)中的模式,然后根據(jù)模式對數(shù)據(jù)進(jìn)行清洗;另一種是根據(jù)預(yù)定的清洗規(guī)則找到不匹配的數(shù)據(jù)。
在第三階段,在一些具有特殊模式的領(lǐng)域,通過編寫程序或借助外部標(biāo)準(zhǔn)源文件和數(shù)據(jù)字典,在一定程度上糾正異常值;對于數(shù)字領(lǐng)域,可以通過數(shù)學(xué)和統(tǒng)計知識進(jìn)行自我修復(fù),但通常更復(fù)雜的領(lǐng)域仍然需要依靠人為干預(yù)。
當(dāng)前大部分的異常數(shù)據(jù)清洗需要依賴接口用于編制清理程序。一般包括很多耗時的排序、比較、匹配過程,并且這些步驟都十分復(fù)雜,需要耗費用戶非常長的時間等待。在一個交互式的數(shù)據(jù)清理方案,系統(tǒng)把異常檢測和數(shù)據(jù)清洗相互結(jié)合,用戶通過交互式界面能夠清晰明了的懂得如何進(jìn)行數(shù)據(jù)清理,并且耗時短,用戶能夠在極短的時間就得到結(jié)論,不滿意清理效果時還能撤銷上一步的操作,最后將所有清理操作編譯執(zhí)行。
注水站設(shè)備故障診斷規(guī)則可信度推理算法模型構(gòu)建方法如下所述:
1) 計算初始證據(jù)可信度
對于確定性條件,用戶只要給出1或者0的回答,對于不確定性條件,則需要計算其隸屬度值。
2) 計算規(guī)則前提條件的真值
3) 計算診斷結(jié)論的可信度CF(H)
CF(H) = CF?T(E),其中CF為規(guī)則的可信度,當(dāng)T(E) ≥ λ時規(guī)則成立,T(E) ≤ λ時規(guī)則不成立。
當(dāng)CF = 1且T(E) = 1,CF(H) = 1,即規(guī)則可以得到確定的結(jié)論;
當(dāng)CF < 1或T(E) < 1,CF(H) < 1,即規(guī)則得到不確定的結(jié)論;
當(dāng)CF = 0或T(E) = 0,CF(H) = 0,即規(guī)則得不到的結(jié)論。
如圖2所示,系統(tǒng)自動獲取設(shè)備的時域、頻域以及其他特征來判斷設(shè)備是否出現(xiàn)故障,若無法獲取則手動輸入故障特征。如果存在模糊特征,則調(diào)用模糊隸屬度函數(shù)計算可信度。當(dāng)特征輸入完畢后,把輸入的特征寫入綜合數(shù)據(jù)庫,當(dāng)有匹配規(guī)則時,激活特征對應(yīng)的規(guī)則并寫入綜合數(shù)據(jù)庫。然后在計算規(guī)則前檢驗真值,若真值大于規(guī)則閾值,則計算診斷結(jié)果的可信度,最后輸出故障名、可信度、故障原因以及維修策略。注水站設(shè)備故障診斷模型在實現(xiàn)時,考慮到故障點在時間上與先前的運行狀態(tài)存在關(guān)聯(lián),并且某一種故障可能與多個類型的數(shù)據(jù)存在關(guān)系。使用一段時間(T)內(nèi)的所有字段(N個字段)的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入,即輸入數(shù)據(jù)時(T, N)的二維數(shù)據(jù)。樣本數(shù)據(jù)的輸出標(biāo)簽采用獨熱碼的形式表示,存在M種類型的分類則標(biāo)簽表示為包含M個數(shù)據(jù)的一維向量。神經(jīng)網(wǎng)絡(luò)模型首先將輸入數(shù)據(jù)展平為(TxN,0)的一維數(shù)據(jù),中間添加若干層全連接層(DNN)或者卷積、池化層(CNN),最后一層使用全連接層將輸出壓縮為包含M個數(shù)據(jù)的一維向量。DNN神經(jīng)網(wǎng)絡(luò)模型如圖,CNN神經(jīng)網(wǎng)絡(luò)模型如下圖3所示。
Figure 2. Flow chart of fault diagnosis and reasoning of equipment in water injection station圖2. 注水站設(shè)備故障診斷推理流程圖
Figure 3. CNN model for equipment fault diagnosis of water injection station圖3. 注水站設(shè)備故障診斷CNN模型
提供了神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練操作,可選模型有DNN模型和CNN模型。
研究的試驗中對各種故障進(jìn)行了模擬,系統(tǒng)能夠通過不同故障判斷結(jié)果綜合的方法來給出結(jié)論,同時根據(jù)系統(tǒng)內(nèi)部配置的故障應(yīng)急聯(lián)動處置規(guī)范進(jìn)行友好提示。
針對泵供水不足故障、電機(jī)運行故障以及潤滑系統(tǒng)故障作為研究案例進(jìn)行處置:
案例一、泵供水不足故障
本例中檢測到1號泵的供水壓力不足,系統(tǒng)立即提出了報警,并提示了值班人員檢查供水壓力,后期就可以啟動相應(yīng)的控制實現(xiàn)自動聯(lián)動處理,如圖4所示。
Figure 4. Prediction window of insufficient water supply failure圖4. 供水不足故障預(yù)測窗口
案例二、潤滑系統(tǒng)故障
潤滑系統(tǒng)由于管漏等原因引起了系統(tǒng)檢測到了潤滑系統(tǒng)故障,并發(fā)出了潤滑系統(tǒng)故障的報警提示,聯(lián)動處置模型會根據(jù)引起故障的原因文字引導(dǎo)值班人員進(jìn)行針對性的觀察與人工處理,未來經(jīng)過設(shè)備改造,用PLC控制單元去執(zhí)行,其故障預(yù)測如圖5所示。
Figure 5. Prediction window of pump lubrication failure圖5. 泵潤滑故障預(yù)測窗口
案例三、電機(jī)運行故障
電機(jī)系統(tǒng)由于電機(jī)供電、電機(jī)機(jī)械故障、電機(jī)冷卻水壓力、潤滑油壓力等原因引起了系統(tǒng)檢測到了電機(jī)運行故障,并發(fā)出了電機(jī)運行故障的報警提示,聯(lián)動處置模型會根據(jù)引起故障的原因文字引導(dǎo)值班人員進(jìn)行針對性的觀察與人工處理,去檢查供電系統(tǒng)、電機(jī)的機(jī)械狀態(tài)、冷卻水系統(tǒng)以及潤滑油系統(tǒng)。一旦設(shè)備升級改造后這些人為的工作可以由PLC控制單元去自動完成,其故障預(yù)測如圖6所示。
Figure 6. Emergency handling window of motor operation failure圖6. 電機(jī)運行故障應(yīng)急處置窗口
研究中使用的數(shù)據(jù)包含300個故障(包含了泵供水不足、泵潤滑故障、電機(jī)運行故障等故障),采用上述的技術(shù)檢測到了300個故障,其中基于規(guī)則的方法檢測到了243個故障,基于神經(jīng)網(wǎng)絡(luò)的方法檢測到了291個故障,二者聯(lián)動使用故障識別率達(dá)到100%。
本研究對于實驗中測試的故障點能達(dá)到100%的準(zhǔn)確率,在具備plc執(zhí)行功能的能夠根據(jù)不同的情況做出相應(yīng)的聯(lián)動控制達(dá)到100%的正確處理。
通過對注水站應(yīng)急處置聯(lián)動條件的分析,構(gòu)建了注水站應(yīng)急處置聯(lián)動模型,針對現(xiàn)有數(shù)據(jù)分析,給出了離心泵壓力應(yīng)急處置實施方案、泵溫度應(yīng)急處置實施方案、電機(jī)運行電異常應(yīng)急處置實施方案、冷卻水泵應(yīng)急處置實施方案、潤滑油泵應(yīng)急處置實施方案。利用研究的算法模型,通過Python編程實現(xiàn)了泵供水不足故障監(jiān)測軟件、電機(jī)運行故障監(jiān)測軟件以及潤滑系統(tǒng)故障監(jiān)測軟件,作為研究案例進(jìn)行了分析和實現(xiàn)。通過對注水站設(shè)備故障診斷分析,研究其診斷邊界條件值,采用知識庫故障樹判別方法,建立了注水站設(shè)備故障診斷模型。通過對注水站設(shè)備故障原因分析,設(shè)計了設(shè)備故障診斷規(guī)則可信度推理算法模型。基于注水站設(shè)備故障特征值分析,設(shè)計注水站設(shè)備故障診斷規(guī)則。最后利用Python編程、實現(xiàn)了注水站設(shè)備故障診斷模型軟件。
創(chuàng)新點:通過對注水站數(shù)據(jù)分析與處理,利用神經(jīng)網(wǎng)絡(luò)算法實現(xiàn)了一套基于DNN模型和CNN模型的注水站設(shè)備故障監(jiān)測綜合模型。研究內(nèi)容中對常見故障進(jìn)行了模擬,系統(tǒng)能夠通過不同故障判斷結(jié)果綜合的方法來給出結(jié)論,同時根據(jù)系統(tǒng)內(nèi)部配置的故障應(yīng)急聯(lián)動處置規(guī)范進(jìn)行友好提示、實現(xiàn)應(yīng)急處置聯(lián)動效果。