梅昌利
摘 要:計算機作為控制系統(tǒng)輸入及輸出設(shè)備,運行維護及故障處理關(guān)系著控制系統(tǒng)及生產(chǎn)裝置的安全平穩(wěn)運行。從設(shè)備選型、日常維護、故障快速處理等方面著手提高控制系統(tǒng)計算機的可靠性。
關(guān)鍵詞:控制系統(tǒng);計算機;故障;恢復
中圖分類號: TP309.1 文獻標識碼: A 文章編號: 1673-1069(2016)22-106-2
0 引言
滄州煉化焦化裝置控制系統(tǒng)主要有DCS系統(tǒng)ECS-700一套,帶3臺工程師站,5臺操作站;SIS系統(tǒng)TRICON一套,帶1臺工程師站、2臺操作站;順控系統(tǒng)AB SLC5000系統(tǒng)1套,帶1臺工程師站、1臺操作站;除焦系統(tǒng)AB SLC5000系統(tǒng)1套,帶1臺工程師站、1臺操作站。共17臺計算機,型號皆為DELL T5500系列工作站。
自2009年大修改擴建以來已7年,各控制系統(tǒng)操作站/工程師站已出現(xiàn)多臺計算機軟/硬件故障。計算機硬件故障部位主要有:主板/硬盤/電源/顯示器/網(wǎng)卡等。軟件故障主要有:系統(tǒng)文件丟失、系統(tǒng)不能正常運行等。處理故障時一般要至少半天時間,若計算機主板故障則時間更長。計算機硬盤故障后要重裝系統(tǒng)及軟件,對于比較復雜的軟件安裝及配置則要依托廠家到廠解決。對于組態(tài)數(shù)據(jù)、歷史趨勢、操作記錄等數(shù)據(jù)丟失,沒有很好的解決辦法。
這些問題一直對裝置平穩(wěn)操作、安全生產(chǎn)造成了很大威脅。特別是有一些單操作站/單工程師站配置的控制系統(tǒng)影響最大。
1 影響控制系統(tǒng)計算機平穩(wěn)運行的因素
①焦化裝置因生產(chǎn)焦炭的原因,環(huán)境比較差,焦碳粉容易進入計算機內(nèi)部,對計算機的平穩(wěn)運行造成很大影響。
②這些計算機已經(jīng)至少工作6年以上,已出了質(zhì)保期,硬件故障后不能快速、便捷、低成本的維修。配置為:DELL T5500/5600系列,CPU 至強Xeon E5506,主板 Intel 5520,內(nèi)存 2G,硬盤容量 320G,顯卡芯片 英偉達nVIDIA Quadro NVS295,網(wǎng)卡 Broadcom 5754,支持操作系統(tǒng) Windows Vista/7/Red Hat Enterprise Linux WS v.5.3.0,購置時間 2009年,質(zhì)保3年。
③這批計算機官方不對Windows XP系統(tǒng)進行支持(現(xiàn)有控制系統(tǒng)計算機因控制組態(tài)軟件兼容問題,全部裝Windows XP),無官方硬件驅(qū)動,只能找兼容驅(qū)動,容易造成工作不穩(wěn)定。
④這批計算機因成本問題,只配了單硬盤,未配置成RAID1(獨立磁盤冗余陣列,數(shù)據(jù)安全性高),數(shù)據(jù)損壞后不可恢復。
⑤一些控制系統(tǒng)安裝、組態(tài)復雜,且操作不夠人性化;同時還存在軟件、組態(tài)有缺陷等問題。
除了國產(chǎn)的ECS-700和研華Advantech外,其他系統(tǒng)都是英文界面,組態(tài)都是廠家直接完成的,且廠家對維護人員的培訓不到位。控制系統(tǒng)軟件要求長期穩(wěn)定運行,基本整個壽命周期都不需要更新,造成維護人員缺少練習機會,組態(tài)培訓后,維護能力逐漸下降。
2 針對以上問題制定的措施
2.1 加強控制系統(tǒng)計算機日常管理
控制系統(tǒng)計算機一般不停機運行一個大修周期,所以日常巡檢、維護很關(guān)鍵。焦化裝置計算機故障頻發(fā)后,加強了對計算機的日常巡檢。重點工作主要包含:
①檢查計算機硬件情況。計算機CPU、顯卡溫度, CPU使用率、內(nèi)存占用率、各硬件運行情況。
②控制柜用過濾網(wǎng)封堵,減少粉塵進入。若設(shè)備積灰嚴重,則要交替停機清灰。
③嚴格控制操作室及工程師站溫度、濕度及靜電。溫度18℃~24℃,相對濕度45%~70%,操作室門口豎立防靜電柱消除靜電。
2.2 建立每臺控制系統(tǒng)計算機檔案信息
控制系統(tǒng)計算機很多關(guān)鍵信息需要記錄并及時更新。主要記錄了控制系統(tǒng)計算機各類信息:裝置、控制系統(tǒng)型號、計算機配置、軟件配置、用戶密碼、備份方式、保存方式、備份日志等。這些信息基本包含了控制系統(tǒng)計算機的大部分信息,為維護工作打下了堅實基礎(chǔ)。
2.3 準備備用計算機及配件
為了能及時、快速地恢復損壞計算機運行,那么準備備用計算機和易損件的備件是必要的。按近期實際運行統(tǒng)計,計算機易損件一般有:電源、硬盤、主板、顯示器、網(wǎng)卡等。其中硬盤、網(wǎng)卡因通用性強,全廠各機型基本都能替換,可提前儲備。
因計算機硬件更新很快,電源、主板一般為系列專用產(chǎn)品,這個不用儲備,到時直接返廠維修。更節(jié)省的方案是選用工況好的淘汰的計算機作為備用機,可作為應急使用。同時應準備一些可讀寫光盤,作為系統(tǒng)和軟件工具載體。一些移動硬盤或3.5寸硬盤盒,保存?zhèn)浞菸募?/p>
注意:備用計算機和配件一定要確認在原操作系統(tǒng)下具有完整驅(qū)動程序,否則不能使用。
2.4 嘗試快速備份、還原數(shù)據(jù)
根據(jù)控制系統(tǒng)計算機的長期基本不用變更軟件配置的特點,嘗試將整個計算機硬盤全部鏡像復制,并保存在同型號硬盤上。硬盤最好準備一個3.5寸硬盤盒,便于隨時外接到USB口備份。當然,這個工作需要在每次修改了組態(tài)后,再執(zhí)行。當出現(xiàn)硬盤故障后,可馬上更換上新硬盤,即可馬上恢復計算機正常運行。當然可能損失各類歷史數(shù)據(jù)。
當出現(xiàn)主板、電源等故障后,可將原硬盤換到備用機上,即可馬上恢復計算機正常運行。
當備用機與原計算機配置不同時(即使一個大型號的設(shè)備不同批次也可能不同配置),可用帶異機還原這種功能的軟件,比如ATIH。ATIH是一個強大的備份還原工具,主要有以下特點:
①唯一支持開機熱備份(包含操作系統(tǒng)盤)。這樣就可不停機隨時備份,對控制系統(tǒng)穩(wěn)定運行有利。
②支持不間斷備份。可保護關(guān)鍵數(shù)據(jù),當數(shù)據(jù)損壞或進行了錯誤操作可及時恢復。
③支持異機還原。這樣即使硬件完全不同也能實現(xiàn)完整備份與還原。
④支持windows系統(tǒng)備份文件轉(zhuǎn)換,適應性更強。
⑤支持多核多線程備份還原等功能,備份還原操作更快,對系統(tǒng)影響更小。
備份完成后,對每個硬盤進行標記并登記,這樣原計算機不管軟件還是硬件故障都能簡單、快速恢復,確保數(shù)據(jù)萬無一失。
按照以上幾點執(zhí)行后,控制計算機故障率逐步下降。控制系統(tǒng)廠家需要來廠服務(wù)的次數(shù)大大減少了。維護工程師基本能處理控制計算機各類故障,節(jié)省了不少維護費用。最關(guān)鍵的是即使發(fā)生硬件和軟件故障后,都能及時、簡單的恢復系統(tǒng)運行。一般此項步驟現(xiàn)在只需要花1到2小時即可完成。減少了停機時間,確保裝置穩(wěn)定。