神東煤炭集團公司寸草塔二礦 梁志鵬
通過對寸草塔二礦一體化管控平臺系統(tǒng)使用中出現(xiàn)的數(shù)據(jù)故障進行分析,提出了故障處理的方法,進一步提高系統(tǒng)的安全可靠性,希望能給使用的單位提供借鑒,遇到類似的問題能夠盡快處理,確保數(shù)據(jù)通暢,保證系統(tǒng)安全可靠運行。
煤礦一體化管控平臺是實現(xiàn)智能化礦井的重要環(huán)節(jié)之一,在該系統(tǒng)投入運行過程中,如果出現(xiàn)采集數(shù)據(jù)故障,將會給安全生產(chǎn)管控增加困難,如何快速發(fā)現(xiàn)并及時處理故障是運維工作者的重要職責之一。針對數(shù)據(jù)采集存在的軟、硬件故障,通過使用替換方法、分段診斷等解決方案,達到處理數(shù)據(jù)通訊障礙的目的。
使用一體化管控平臺是實現(xiàn)智能化礦井的發(fā)展趨勢,目前神東公司寸草塔二礦利用國產(chǎn)軟件平臺自主建成大數(shù)據(jù)存儲、查詢、分析的統(tǒng)一平臺系統(tǒng),該系統(tǒng)從開發(fā)到投用已有一年有余,截至目前采集數(shù)據(jù)點超十萬之多,逐漸日臻完善,可實現(xiàn)礦井所有子系統(tǒng)的集中展示、集中遠程控制、移動監(jiān)測、關聯(lián)分析、故障診斷與決策、智能報警、生產(chǎn)系統(tǒng)優(yōu)化、智能感知、GIS巡檢、大數(shù)據(jù)分析等功能。
一體化管控平臺的基本組成層次結構應當包含終端物理層、數(shù)據(jù)傳輸層、數(shù)據(jù)管理層、數(shù)據(jù)應用層。具體在動態(tài)監(jiān)測與識別礦井空間環(huán)境數(shù)據(jù)的全過程中,平臺主要依靠智能傳感器來跟蹤獲取數(shù)據(jù),然后運用自動化的礦井數(shù)據(jù)分析措施方法來歸納得出結論。
為實現(xiàn)礦井各項分散信息系統(tǒng)數(shù)據(jù)的統(tǒng)一管理,應用統(tǒng)一的模型、數(shù)據(jù)源,進而實現(xiàn)數(shù)據(jù)的快速收集、分析,并且最終實現(xiàn)數(shù)據(jù)共享。該系統(tǒng)分為四層設計。(1)在終端物理層中。就是有計算能力而且能聯(lián)網(wǎng)的設備終端,例如新型磁力啟動器、變頻器、饋電開關、移動變電站、智能控制器、各類傳感器等。(2)在數(shù)據(jù)傳輸層中,井下可以通過萬兆環(huán)網(wǎng)輻射到各個配電點的綜合分站、千兆網(wǎng)絡交換機設備使用支持modbusRTU串口、modbusTCP傳輸方式,將基礎數(shù)據(jù)上傳至服務器中。(3)在數(shù)據(jù)管理層中,要進行連接管理和通道管理,確保眾多設備的無掉線穩(wěn)定連接,同時還要確保通道的暢通性,能夠高效的進行數(shù)據(jù)交換。(4)在數(shù)據(jù)應用層中,是整個系統(tǒng)最核心的部分,也是最能體現(xiàn)數(shù)據(jù)價值的層面,根據(jù)數(shù)據(jù)運用的深度,可劃分為三個階段,第一階段,遠程監(jiān)測監(jiān)控階段。第二階段,大數(shù)據(jù)的分析應用階段。第三階段,人工智能應用階段。在第一階段中,井下要能夠?qū)崿F(xiàn)實時數(shù)據(jù)向地面上傳,地面數(shù)據(jù)平臺人員可以遠程監(jiān)控井下的設備運行情況。第二階段中,要能夠?qū)崿F(xiàn)從海量數(shù)據(jù)中提取出有規(guī)律性的和可預見性的經(jīng)驗,從而為決策者提供決策輔助。第三階段能實現(xiàn)海量數(shù)據(jù)的機器學習和無人參與的自動調(diào)控。該系統(tǒng)目前可以實現(xiàn)B/S,C/S和移動端三種展示方式,可以隨時隨地查看礦井生產(chǎn)數(shù)據(jù),掌握生產(chǎn)狀況,遠程控制干預,內(nèi)容更加全面、豐富和詳細。
寸草塔二礦一體化管控平臺所采集設備主要有北京朗威達移動變電站、南京雙京饋電、淮南萬泰饋電、電光饋電、南京雙京磁力啟動器、淮南萬泰磁力啟動器、華寧控制器等,不同的廠家的數(shù)傳方式各有不同,電光廠家的設備使用的是偶校驗和RS232方式傳輸,華寧控制器和礦壓OPC采用TCP方式傳輸,但是大多數(shù)設備使用的是RS485兩線制方式進行數(shù)傳。
(1)終端設備與數(shù)傳服務器通訊不暢,一是終端設備的物理地址與實際不符;二是交換機或者串口服務器IP地址、網(wǎng)關設置、波特率設置不當。
(2)通訊規(guī)約使用錯誤,不同終端設備有著不同的通訊規(guī)約,比如初始寄存器地址、起始位、停止位、CRC校驗等參數(shù)存在差異,一定要多查看設備說明書或者多與廠家技術人員溝通。
(3)OPC服務器因軟件運行時間長或數(shù)據(jù)量過大而死機。這種情況會造成同子系統(tǒng)數(shù)據(jù)大面積卡死。
(4)未按照云臺帳設置IP地址、設備地址,造成地址沖突,導致數(shù)據(jù)傳輸中斷。
(5)遠程控制設備發(fā)送命令下寫執(zhí)行成功,但是返回錯誤的確認幀,可能存在I/O點表存在編輯錯誤、數(shù)據(jù)類型編輯錯誤、執(zhí)行機構未動作等問題導致。
(6)全雙工/半雙工不匹配導致丟包嚴重。存在這種情形對網(wǎng)絡性能造成很大的影響。雖然這種問題在多數(shù)情況下容易被運維人員忽視,當遇到網(wǎng)絡流量較大時,就會造成堵塞,造成丟包率高的原因。
(1)終端設備通訊模塊或保護器存在故障,這種故障往往發(fā)生在通訊接口接觸不良、內(nèi)部系統(tǒng)故障、極性接反等,都會造成通訊中斷。
(2)同類設備型號不統(tǒng)一,更換設備后,存在設備通訊規(guī)約不一致,比如掘進工作面搬家之前使用的是南京雙京饋電給掘錨機供電,搬家之后使用淮南萬泰的同類設備,如果不及時在KIO服務器和開發(fā)后臺更改模型和點表,這會導致該供電設備保護器點表不一致,無法數(shù)傳。另外同一廠家不同版本的保護器通訊規(guī)約可能有所不同,比如淮南萬泰2.0保護器與淮南萬泰3.0保護器的點表也有所不同。
(3)交換機、串口服務器和采集模塊損壞,如電源、主板、后備電池等故障,造數(shù)據(jù)交換設備不能正常運行,不能收、發(fā)數(shù)據(jù)。
(4)有的設備終端采用RS232接口,與之通訊要用到RS232轉(zhuǎn)RS485轉(zhuǎn)接器。若轉(zhuǎn)接器損壞,則無法正常識別收發(fā)數(shù)據(jù)。
(5)RS485通信最佳接線方式是采用串接,若使用其它接法,則會影響數(shù)據(jù)傳輸。如果使用非屏蔽的通訊線,在電磁場較大的配電點受到較為嚴重的干擾現(xiàn)象,導致無法正常收發(fā)數(shù)據(jù)。
(6)傳感器電池虧電,造成數(shù)傳中斷。尤其是依靠無線傳輸方式的傳感器由于周期性檢查不到位導致虧電,造成數(shù)據(jù)采集中斷。
一是部分設備數(shù)據(jù)不能上傳,問題可能出在千兆交換機、串口服務器、通訊設置設置等方面;二是個別設備數(shù)據(jù)不能上傳,問題可能出在上級電源無計劃斷電、保護器故障、RS485通信接口故障、RS232轉(zhuǎn)RS485轉(zhuǎn)接器故障、終端設備通訊設定等方面。三是數(shù)據(jù)刷新速度慢或數(shù)據(jù)不準確,問題可能出在信號受到干擾或多臺設備采用星接的錯誤方式等方面。四是子系統(tǒng)數(shù)據(jù)通訊故障,問題更有可能出現(xiàn)在數(shù)據(jù)上傳服務器的該子系統(tǒng)KIO應用運行卡死、無響應等故障。
首先應查看存在問題設備的鏈路是否正常,PING一下串口服務器的地址,若地址長時間接受不到信號,數(shù)據(jù)包完全丟失,說明物理鏈路出現(xiàn)故障,一是檢查供電是否正常,登陸后備電源管理系統(tǒng)查看設備狀態(tài),向責任區(qū)隊了解情況,盡快恢復供電。二是檢查該處千兆交換器光纖是否完好,對損壞光纜進行熔接。三是檢查串口服務器的網(wǎng)線是否插好,并檢查3180MOXA模塊、3480MOXA模塊或者交換機是否損壞等等,最直觀的方法就是查看模塊通訊信號燈,使用替換法及時更換板卡或者模塊。四是通訊設置,嚴格參照設備廠家通訊規(guī)約進行設置。五是RS485、RS232及TCP通訊接口存在故障,特別是RS485串口,從左到右分別是GND/T/R-、T/R+、DC+,作為數(shù)據(jù)傳輸時,只需要用到GND/T/R-和T/R+,分別連接RS485設備的GND/A/B即可連接通訊。六是接線問題,使用萬用表測量各接線端子電壓,排除是否虛接線。RS232/RS485轉(zhuǎn)接器可用替代法進行測試,要注意極性,通過模塊上的收、發(fā)指示燈判斷通信情況。七是采用合理的接線結構,使用“手拉手”串接,盡量避免星形接線。使用合格的屏蔽雙絞線。八是如果下發(fā)命令返回錯誤或者無響應,應到KIO對應系統(tǒng)應用中查看數(shù)傳命令歷史記錄,找到異步下寫命令的報文,回溯至故障點位進行修改,有的設備一條指令可能存在連續(xù)性的邏輯下發(fā)控制,過程中某處異常就會造成整個控制命令下發(fā)失敗。依照系統(tǒng)架構思路,不斷縮小范圍,沿線排查、直至查出故障點,根據(jù)實際情況處理,恢復鏈路通暢。
根據(jù)寸草塔二礦一體化管控平臺系統(tǒng)數(shù)據(jù)傳輸方面中出現(xiàn)的一些故障,進行了梳理、分析及找出解決方法,遇到類似問題能夠第一時間處理故障,提升鏈路系統(tǒng)的可靠性,保障礦井一體化管控平臺的正常運行。