劉靜敏
(國家新聞出版廣電總局無線電臺管理局2021臺中控機房,黑龍江 齊齊哈爾161000)
【摘 要】針對轉(zhuǎn)動天線遠程控制系統(tǒng)存在問題,進行了全面系統(tǒng)分析,并提出解決方案。
【關(guān)鍵詞】自動化;串口通訊
一、概述
由于我臺中控機房進行集總控制,各機房端只進行設(shè)備維護、必要的巡視和應急故障處理工作,所以相關(guān)設(shè)備的遠程控制系統(tǒng)穩(wěn)定與否直接影響全臺的安全播音工作,本文就新系統(tǒng)運行以來發(fā)生的一些典型故障進行了總結(jié)分析,并提出有針對性的解決辦法。
二、典型故障
類型一:
中控機房遠程控制系統(tǒng)執(zhí)行倒頻操作時出現(xiàn)參數(shù)無法切換,“Power on” 異常打開故障。A:轉(zhuǎn)動天線頻率、組態(tài)和角度無法切換。天線本地控制柜屏幕提示“Power on”打開狀態(tài),天線本地觸摸屏被屏蔽無法進行操作,發(fā)射機端顯示天線互鎖閉合,如重啟天線本地控制系統(tǒng)后現(xiàn)象依舊。此種情況采用升落高壓的方法處理“Power on” 異常打開故障,然后可以進行后續(xù)正常的遠程或本地操作。B:轉(zhuǎn)動天線頻率、組態(tài)切換到位,但角度無法切換。天線本地控制柜屏幕提示“Power on”打開狀態(tài),天線本地觸摸屏被屏蔽無法進行操作,發(fā)射機端顯示天線互鎖開,如重啟天線本地控制系統(tǒng)后會額外出現(xiàn)ATU水冷故障和ATU控制故障。此種情況需要的復位轉(zhuǎn)動天線四層B4R1柜控制系統(tǒng)中的相關(guān)故障,之后天線互鎖閉合,再采用升落高壓的方法處理“Power on” 異常打開故障后,可以進行后續(xù)正常的遠程或本地操作。
類型二:
中控機房遠程自動倒頻時,預設(shè)值已經(jīng)設(shè)置成功,但轉(zhuǎn)動天線頻率、組態(tài)和角度無法切換,無法自動進行后續(xù)執(zhí)行操作,遠程切換為手動仍無法進行操作。此時可倒本地進行手動天線倒頻操作。
三、分析及處理
對類型一的故障進行原因分析:
天線控制系統(tǒng)判定天線是否在加高壓狀態(tài),完全依靠于遠程控制系統(tǒng)反饋的“Power on”信號,此信號級別最高,保證在天線加高壓狀態(tài)下禁止天線的任何本地或遠程操作。
A:倒頻過程中遠程控制系統(tǒng)異常給出“Power on”播音指示信號的激活命令,將造成天線本地控制系統(tǒng)進入異常狀態(tài),會立刻禁止所有正在進行(或準備進行)的操作。直至“Power on”解除。此時天線控制系統(tǒng)處于既不執(zhí)行倒頻操作又無法給出天線到位的閉鎖信號的狀態(tài)。遠程控制系統(tǒng)后續(xù)指令處于隊列中,無法執(zhí)行。機房端本地控制全部屏蔽,也同樣無法執(zhí)行。
B:落高壓過程中遠程控制系統(tǒng)沒有關(guān)閉“Power on”信號,由于“Power on”一直存在,造成遠程控制端操作受限,無法倒頻,并且使后續(xù)指令處于隊列中,無法執(zhí)行。機房端本地控制全部屏蔽也無法進行相關(guān)操作。
類型一故障的解決辦法:
由于轉(zhuǎn)動天線遠程通訊接口DF1協(xié)議在通訊過程中校驗不足,可能在通訊過程中發(fā)生錯碼,誤激活“Power on”播音指示信號位,造成意外“Power on”播音指示信號激活。解決辦法:在遠程控制端采取措施,與開發(fā)人員聯(lián)系,修改遠程控制端程序,去掉實際意義不大的“Power on”信號指示功能,系統(tǒng)不去激活使用該功能,同時增加關(guān)閉“Power on”的獨立按鈕,在特殊情況下可以強制關(guān)閉。同時檢查整改通訊鏈路設(shè)備的可靠性,強化光貓等設(shè)備的接地和抗干擾措施。
其中一次故障出現(xiàn)在自動播音狀態(tài)下,遠程端手動落高壓,然后手動輸入進行倒頻操作過程中,可能存在程序未知bug,導致切換后手動操作時程序處于不穩(wěn)定狀態(tài),或此過程中其他未知因素出現(xiàn),結(jié)果導致異?!癙ower on”激活。此隱藏bug排查起來十分困難,且找不到相關(guān)影響因素。需要積極與開發(fā)人員聯(lián)系,查找遠程控制端程序bug,排除潛在隱患,增加設(shè)備可靠性。
本地控制系統(tǒng)設(shè)備老化造成的可能性較小,首先本地控制核心器件plc處理器,之前進行過更換,且羅克韋爾的PLC具有高度穩(wěn)定性。為了排除相關(guān)可能性,可以更換新的SLC5/03板、SLC5/04板核心處理器板卡。
對于附加的天線系統(tǒng)水冷故障解決方案是進行轉(zhuǎn)動天線ATU冷卻系統(tǒng)加裝水流接點延時裝置,解決ATU水冷系統(tǒng)啟動初期60秒左右時間內(nèi),純凈水逐漸充滿整個冷卻管線和器件過程中,流量計浮子大幅度波動,造成接點頻繁開閉,進而導致控制系統(tǒng)出現(xiàn)水冷故障,避免此故障同時出現(xiàn)具有重要意義,可以大幅度縮短異態(tài)處理時長,減少停播時間。
對類型二的故障進行原因分析:
倒頻操作由二條寫命令和對應的返回確認數(shù)據(jù)組成,第一條為遠程發(fā)送的預置數(shù)據(jù)寫命令,天線本地端返回確認數(shù)據(jù),然后第二條為根據(jù)返回的確認數(shù)據(jù)發(fā)出執(zhí)行命令,天線本地再次返回確認數(shù)據(jù),天線同時開始動作。如果遠程第一條指令發(fā)出后,收不到返回確認指令,或返回指令傳輸過程中發(fā)生錯誤,會導致系統(tǒng)一直處于等待狀態(tài)。
是否會進入異常處理分支程序及如何處理,這完全依賴于程序設(shè)計。如果沒有及時有效異常處理機制和串口通信管理機制,由于通訊口指令隊列中原(寫)指令未完成,會導致后續(xù)對串口操作(包括手動)指令一直處于后續(xù)隊列排隊中,無法執(zhí)行。進而遠程無法操作。
解決辦法:
由于轉(zhuǎn)動天線遠程通訊接口DF1協(xié)議在通訊過程中校驗機制不足,可能在通訊過程中受到干擾發(fā)生錯碼,導致回傳確認數(shù)據(jù)格式錯誤,被遠程控制端丟棄忽略。在遠程控制端采取措施,與開發(fā)人員聯(lián)系,修改遠程控制端程序,完善通信異常處理機制,采用定時重發(fā)和執(zhí)行結(jié)果確認方式,同時完善串口管理程序,采用優(yōu)先級管理,保證重要操作優(yōu)先執(zhí)行。同時檢查整改通訊鏈路設(shè)備的可靠性,強化光貓等設(shè)備的接地和抗干擾措施。加強機房監(jiān)測平臺的監(jiān)測功能,監(jiān)測倒頻時的設(shè)備運行狀態(tài),如未在規(guī)定時間內(nèi)動作,及時給出告警提示。
其他可能因素:
通訊速率也是影響系統(tǒng)穩(wěn)定性關(guān)鍵問題之一,由于PLC系統(tǒng)通訊處理能力有限,過短的刷新周期將有可能造成系統(tǒng)不能及時響應,特別是當PLC處于進行復雜運算狀態(tài),此時PLC一個掃描周期將變長,此時通訊內(nèi)容可能沒有被執(zhí)行前就被后一條刷新,如果遠程端沒有完善的異態(tài)處理機制,將會造成未知的故障,為此,可在保障通訊時效性基礎(chǔ)上,將通訊速率降低,避免此類問題發(fā)生。
四、小結(jié)
自動化系統(tǒng)改變了原有的運行方式,提高了運行效率,把值班人員從繁重操作中解放出來,但隨著自動技術(shù)的發(fā)展,設(shè)備的穩(wěn)定運行越來越依賴于自動化系統(tǒng),這對自動化系統(tǒng)提出了更高的要求,而自動化系統(tǒng)必然會存在漏洞和不足,這就要求我們在工作中善于發(fā)現(xiàn)問題,及時總結(jié)分析,對系統(tǒng)不斷進行完善,以便使自動化系統(tǒng)更加穩(wěn)定的運行,更好的服務(wù)于安全播音工作。