唐 明
(齊魯石化勝利煉油廠 自動化信息所,淄博 255434)
隨著實時數(shù)據(jù)庫廣泛的應(yīng)用,實時數(shù)據(jù)采集系統(tǒng)受到的關(guān)注度也在不斷升高。數(shù)據(jù)采集接口能否正常運行將直接關(guān)系到實時數(shù)據(jù)的應(yīng)用效果,如何高效地維護各數(shù)據(jù)采集接口正常運行尤為重要。實時數(shù)據(jù)采集接口平穩(wěn)率以數(shù)字化的方式直接反應(yīng)采集接口運行維護的質(zhì)量與效率。如果每月要將接口平穩(wěn)率維持在99%以上,需要提高實時接口的運行維護效率,發(fā)現(xiàn)問題能夠及時判斷出問題所在及原因,盡快處理,使實時接口平穩(wěn)率能夠始終運行在一個較高水平,以滿足用戶對實時數(shù)據(jù)關(guān)注及分析的需要。
實時數(shù)據(jù)采集接口平穩(wěn)率采用的計算公式:
實時數(shù)據(jù)采集接口平穩(wěn)率 =(接口實際正常運行時間 / 接口理論正常運行時間)* 100%
實時數(shù)據(jù)采集系統(tǒng)是一個復雜的網(wǎng)絡(luò)在線運行系統(tǒng),影響整個系統(tǒng)平穩(wěn)率因素可能來自網(wǎng)絡(luò)質(zhì)量、采集程序自身、采集設(shè)備、集散控制系統(tǒng)(DCS)等。以上的任一方面出現(xiàn)故障,都會減少“接口實際正常運行時間”,從而直接影響最終的平穩(wěn)率結(jié)果。
由于接口平穩(wěn)率直接反應(yīng)實時數(shù)據(jù)采集接口的運行狀況,客觀上也反應(yīng)了維護工作的質(zhì)量與效率。既然影響接口平穩(wěn)率的因素眾多,系統(tǒng)維護人員就會產(chǎn)生將故障類型與發(fā)生頻率做相應(yīng)的統(tǒng)計,分析故障高發(fā)環(huán)節(jié)和原因,及時處理,避免同類故障頻繁發(fā)生的需求。相應(yīng)的接口平穩(wěn)率也應(yīng)該細化,將故障類型、故障放生時間、故障持續(xù)時間、分類平穩(wěn)率等分別記錄并計算。
通常實時數(shù)據(jù)庫除了記錄數(shù)據(jù)的實際值與時間戳,還會記錄該數(shù)據(jù)的數(shù)據(jù)質(zhì)量信息,我們的研究就是基于數(shù)據(jù)質(zhì)量信息結(jié)合實際情況中故障出現(xiàn)的現(xiàn)象,作為不同故障點的判斷依據(jù)。
數(shù)據(jù)質(zhì)量信息一般被劃分為3個等級:Good、Suspect、Bad。我們常見的狀態(tài)信息有以下9種:Unavai labl、Rep Fai ld、Good、Bad、No status、Bad tag、Initial、Suspect、Scan of f。
表1對9種狀態(tài),分別做了測試研究后總結(jié)出的故障點分布情況。
表1 故障點分布
通過對數(shù)據(jù)庫中數(shù)據(jù)的不同質(zhì)量信息,結(jié)合采集時間,綜合判斷出采集鏈路中的故障點,并對每個故障點做出平穩(wěn)率分析。
圖1 接口平穩(wěn)率設(shè)計
數(shù)據(jù)質(zhì)量分類判斷,根據(jù)常見的9種數(shù)據(jù)質(zhì)量,將故障點作5方面(網(wǎng)絡(luò)、采集設(shè)備、采集程序、DCS系統(tǒng)、其它)判斷分類。對于每種故障點進行故障狀態(tài)賦值、故障發(fā)生時間記錄、計算故障持續(xù)時間。根據(jù)理論正常運行時間與實際正常運行時間進行平穩(wěn)率計算。
在表1中“No status”作為數(shù)據(jù)質(zhì)量比較特殊,通常是因為采集程序與實時數(shù)據(jù)庫不匹配,造成數(shù)據(jù)質(zhì)量無法確認。此時單純利用數(shù)據(jù)質(zhì)量方式判斷顯然不夠準確。所以這類接口判斷需要開發(fā)程序,利用網(wǎng)絡(luò)診斷方法和數(shù)據(jù)更新時間共同判斷故障點。
數(shù)據(jù)庫采用Infoplus.21實時數(shù)據(jù)庫,利用數(shù)據(jù)庫的存儲和計算功能,分別建立能夠反應(yīng)各類故障的編碼,設(shè)計如表2。
表2 各類故障的編碼
根據(jù)以5種故障編碼,分別建立相關(guān)的過程數(shù)據(jù),如:采集狀態(tài)、采集平穩(wěn)率、故障發(fā)生時間、故障持續(xù)時間等;因數(shù)據(jù)采集的結(jié)果只有在裝置處于連續(xù)運行狀態(tài)下才有意義,所以在數(shù)據(jù)庫設(shè)計時還要考慮到裝置運行狀態(tài)的信息存儲,以便分析程序根據(jù)裝置運行狀態(tài)合理計算采集接口的平穩(wěn)率。
表3 數(shù)據(jù)庫設(shè)計
首先開發(fā)網(wǎng)絡(luò)通訊診斷程序,用于判斷服務(wù)器至采集站(歷史站)網(wǎng)絡(luò)通訊狀況,程序每3 min掃描一次,將通訊狀況,寫入實時數(shù)據(jù)庫
“GETSTATUS_NET”位號,以O(shè)N/OFF表示通/斷狀態(tài)。其他程序編寫將在實時數(shù)據(jù)庫內(nèi)進行。
故障代碼設(shè)計如下:
I f GETSTATUS_故障編碼=“OFF”and GETOPR_DCS編碼 = 1 then
//記錄故障發(fā)生時間,累加故障次數(shù)
GETOFF_TM_故障編碼=位號.IP_INPUT_TIME
GETOFF_TMS_故障編碼= GETOFF_TMS_故障編碼+ 1
End if
//故障持續(xù)時間為同一次故障中累計次數(shù)*3(程序每3 min掃描一次)
GETOFF_DURA_故障編碼= GETOFF_故障編碼* 3
月累計故障次數(shù)、時間:
GETOFF_TMS_M_故障編碼=SUM(GETOFF_TMS_故障編碼)
GETOFF_DURA_M_故障編碼=SUM(GETOFF_DURA_故障編碼)
接口平穩(wěn)率:
GETPWL_故障編碼=(1-(GETOFF_TMS_M_故障編碼/ GETSUM))*100%
年累計故障次數(shù)、時間:
GETOFF_TMS_Y_DCS編碼 = GETOFF_TMS_Y_DCS編碼 + GETOFF_TMS_M_DCS編碼
GETOFF_DURA_Y_DCS編碼 = GETOFF_DURA_Y_DCS編碼 + GETOFF_DURA_M_DCS編碼
對實時數(shù)據(jù)采集接口平穩(wěn)率進行細化分析,有利于系統(tǒng)管理員對故障進行分類統(tǒng)計,及時掌握系統(tǒng)中存在的薄弱環(huán)節(jié),有的放矢提出各項事故處理預案,為提高系統(tǒng)的運維效率提供了幫助,也為基于實時數(shù)據(jù)庫系統(tǒng)的各項應(yīng)用提供了數(shù)據(jù)支持。