摘 要:羅德施瓦茨甚高頻監(jiān)控系統(tǒng)是一套對(duì)羅德施瓦茨甚高頻電臺(tái)設(shè)備狀態(tài)進(jìn)行數(shù)據(jù)采集、顯示和遠(yuǎn)程控制的監(jiān)控軟件。此套監(jiān)控系統(tǒng)簡(jiǎn)稱ARCEMIS系統(tǒng),是一套基于網(wǎng)絡(luò)構(gòu)建的監(jiān)控系統(tǒng)。支持主控端和客戶端接入方式,應(yīng)用軟件被稱為RSCC。
關(guān)鍵詞:羅德施瓦茨;故障分析;故障研究
1 羅德施瓦茨甚高頻監(jiān)控系統(tǒng)介紹
該套系統(tǒng)通過羅德施瓦茨公司生產(chǎn)的多鏈路控制器、傳輸路由、主控電腦及后臺(tái)的數(shù)據(jù)庫(kù)實(shí)現(xiàn)其功能性(系統(tǒng)鏈接圖如圖1所示)。
該套系統(tǒng)能夠?qū)崿F(xiàn)對(duì)羅德施瓦茨設(shè)生產(chǎn)的甚高頻電臺(tái)數(shù)據(jù)的實(shí)時(shí)監(jiān)控,其中包括發(fā)射機(jī)的輸出功率、調(diào)制度、駐波比等設(shè)備參數(shù),接收機(jī)狀態(tài)等。同時(shí),該系統(tǒng)還可以對(duì)電臺(tái)進(jìn)行遠(yuǎn)程控制,包括主備機(jī)切換、開關(guān)機(jī)、發(fā)射等功能。能夠確保在電臺(tái)發(fā)生故障時(shí)第一時(shí)間確定故障原因,排除故障,保障飛行安全。進(jìn)而實(shí)現(xiàn)對(duì)電臺(tái)的24小時(shí)不間斷的管理。是保障電臺(tái)正常工作的重要監(jiān)控及保障手段,在甚高頻地空通信系統(tǒng)中占有舉足輕重的地位。
2 監(jiān)控?cái)?shù)據(jù)庫(kù)介紹
ARCEMIS系統(tǒng)是基于后臺(tái)數(shù)據(jù)庫(kù)監(jiān)控甚高頻電臺(tái)的狀態(tài)、參數(shù)和進(jìn)行遠(yuǎn)程控制,所以后臺(tái)數(shù)據(jù)庫(kù)的穩(wěn)定運(yùn)行就成為了該套監(jiān)控系統(tǒng)的關(guān)鍵,由于早期羅德施瓦茨公司生產(chǎn)的甚高頻電臺(tái)較多應(yīng)用于國(guó)外,其監(jiān)控方式與我國(guó)存在差異,在我國(guó)早期應(yīng)用時(shí),為滿足我國(guó)的需求,特意對(duì)后臺(tái)數(shù)據(jù)庫(kù)進(jìn)行了研發(fā),該數(shù)據(jù)庫(kù)并非使用的目前較常用的SQL SERVER等軟件,而是一套由德國(guó)廠家自行開發(fā)的程序,而后期因?yàn)樵撎紫到y(tǒng)應(yīng)用的局限性,該套開發(fā)軟件已無(wú)更新及使用,造成了目前對(duì)于該套監(jiān)控的后臺(tái)數(shù)據(jù)庫(kù)的源代碼無(wú)法查詢和修改的可能,進(jìn)而無(wú)法對(duì)該數(shù)據(jù)庫(kù)進(jìn)行修改,為后續(xù)的數(shù)據(jù)庫(kù)改進(jìn)造成了障礙,技術(shù)人員只能通過現(xiàn)有的數(shù)據(jù)庫(kù),對(duì)已有的配置信息進(jìn)行修改,才能提高數(shù)據(jù)庫(kù)的穩(wěn)定性及功能性。
3 監(jiān)控系統(tǒng)數(shù)據(jù)庫(kù)故障分析
近年來(lái),隨著華北地區(qū)甚高頻系統(tǒng)的建設(shè)規(guī)模不斷增加,甚高頻電臺(tái)數(shù)量也與日俱增,早期搭建的ARCEMIS系統(tǒng)數(shù)據(jù)庫(kù)對(duì)電臺(tái)數(shù)量的冗余度下降,多次出現(xiàn)系統(tǒng)癱瘓的故障,進(jìn)而對(duì)設(shè)備正常運(yùn)行產(chǎn)生了安全隱患。前期的解決辦法為搭建備用系統(tǒng)對(duì)甚高頻電臺(tái)實(shí)時(shí)監(jiān)控,但由于主備用系統(tǒng)切換過程較復(fù)雜,時(shí)間較長(zhǎng),且需要手動(dòng)調(diào)整,增加了值班員的工作負(fù)荷,并存在相應(yīng)風(fēng)險(xiǎn),為解決上述問題,開展了專項(xiàng)的故障原因分析調(diào)查。
技術(shù)人員首先對(duì)系統(tǒng)進(jìn)行了研究分析,發(fā)現(xiàn)該套系統(tǒng)是實(shí)時(shí)對(duì)設(shè)備參數(shù)進(jìn)行數(shù)據(jù)采集,但各個(gè)設(shè)備之間采取的是輪詢方式,所以系統(tǒng)對(duì)于硬件要求不是很高,一般的計(jì)算機(jī)均能滿足上述要求,所以基本排除了硬件原因造成系統(tǒng)癱瘓的可能性。
技術(shù)人員進(jìn)而對(duì)傳輸路由進(jìn)行了分析,因?yàn)楦鱾€(gè)設(shè)備不同屬于同一地點(diǎn),傳輸路由也不同,且每條路由均有其他不用業(yè)務(wù),而系統(tǒng)癱瘓時(shí),其他業(yè)務(wù)均正常,所以也基本排除了傳輸路由造成系統(tǒng)癱瘓的可能性。
基于上述兩點(diǎn),技術(shù)人員將可能性基本鎖定為監(jiān)控主控端故障。經(jīng)研究發(fā)現(xiàn),該套ARCEMIS系統(tǒng)是通過數(shù)據(jù)庫(kù)實(shí)時(shí)對(duì)設(shè)備發(fā)送指令,并收集設(shè)備送回的信息存儲(chǔ)于數(shù)據(jù)庫(kù)內(nèi),且該數(shù)據(jù)庫(kù)在ARCEMIS系統(tǒng)參數(shù)變化(包含設(shè)備數(shù)量、設(shè)備異常狀態(tài),ARCEMIS系統(tǒng)重啟等)時(shí)自動(dòng)對(duì)其數(shù)據(jù)庫(kù)參數(shù)設(shè)置進(jìn)行安全文件備份,該安全文件也存儲(chǔ)于數(shù)據(jù)庫(kù)中。技術(shù)人員對(duì)崩潰的系統(tǒng)數(shù)據(jù)庫(kù)進(jìn)行了分析,發(fā)現(xiàn)所有崩潰的數(shù)據(jù)庫(kù)的安全文件均已達(dá)到上限值,且無(wú)法進(jìn)行刪除與修改,進(jìn)而判斷導(dǎo)致ARCEMIS系統(tǒng)崩潰的故障點(diǎn)應(yīng)該是安全文件達(dá)到上限值引起的。在該套數(shù)據(jù)庫(kù)早期建設(shè)中,由于未考慮到后期電臺(tái)數(shù)量的增加所產(chǎn)生的ARCEMIS系統(tǒng)參數(shù)變化,所以在對(duì)該文件的大小進(jìn)行設(shè)置時(shí)設(shè)定值較小,進(jìn)而導(dǎo)致當(dāng)備份次數(shù)增加,該文件存儲(chǔ)空間沒有空余時(shí),安全文件溢出,導(dǎo)致數(shù)據(jù)庫(kù)癱瘓的現(xiàn)象發(fā)生,最終造成ARCEMIS系統(tǒng)崩潰,無(wú)法完成監(jiān)控和控制功能。
4 解決辦法
為解決安全文件備份溢出的故障,首先對(duì)該數(shù)據(jù)自動(dòng)安全備份功能進(jìn)行了分析研究。研究發(fā)現(xiàn)該備份功能主要目的是使技術(shù)人員在ARCEMIS系統(tǒng)故障發(fā)生后恢復(fù)其數(shù)據(jù)庫(kù)參數(shù)設(shè)置提供依據(jù)。在實(shí)際使用過程中,不會(huì)發(fā)生數(shù)據(jù)庫(kù)參數(shù)設(shè)置發(fā)生變化?;谏鲜隼碛?,將該數(shù)據(jù)庫(kù)的安全文件備份功能關(guān)閉,就可以避免數(shù)據(jù)庫(kù)安全文件溢出進(jìn)而導(dǎo)致ARCEMIS系統(tǒng)崩潰的故障發(fā)生。但是在關(guān)閉安全文件備份功能后,系統(tǒng)將無(wú)法對(duì)參數(shù)修改的情況進(jìn)行監(jiān)控與記錄,雖然不影響該套系統(tǒng)的正常運(yùn)行,但是卻存在了潛在的運(yùn)行風(fēng)險(xiǎn),一旦數(shù)據(jù)庫(kù)的參數(shù)修改發(fā)生變化,系統(tǒng)仍存在崩潰的可能,而且無(wú)法查證原先的正常參數(shù)配置,導(dǎo)致整個(gè)監(jiān)控系統(tǒng)無(wú)法還原,那樣做后只能將整個(gè)監(jiān)控系統(tǒng)重新安裝并調(diào)試,對(duì)運(yùn)行造成無(wú)法監(jiān)控的重大隱患。在查找方法的同時(shí),技術(shù)人員也考慮到數(shù)據(jù)庫(kù)維護(hù)人員不能做到24小時(shí)對(duì)該系統(tǒng)進(jìn)行監(jiān)控,為避免誤操作造成的數(shù)據(jù)庫(kù)參數(shù)設(shè)置發(fā)生變化又無(wú)相關(guān)記錄的事情發(fā)生,維護(hù)人員進(jìn)一步對(duì)安全文件備份進(jìn)行了研究,發(fā)現(xiàn)在數(shù)據(jù)庫(kù)的參數(shù)配置中,可以對(duì)安全文件的數(shù)量、大小、路徑進(jìn)行修改,為解決問題提供了新思路。技術(shù)人員開始對(duì)每次安全文件備份的字節(jié)數(shù)及頻次進(jìn)行了統(tǒng)計(jì),同時(shí)結(jié)合設(shè)備的使用年限,計(jì)算出在使用年限內(nèi)可能的最大備份數(shù)量,同時(shí)適當(dāng)增加其冗余度,最終設(shè)定了新的安全文件數(shù)量及大小,這樣保證了即使打開安全文件備份功能,也不會(huì)造成文件溢出的故障。此舉既可以記錄數(shù)據(jù)庫(kù)參數(shù)設(shè)置發(fā)生的變化,又不會(huì)造成安全文件溢出的故障發(fā)生。為ARCEMIS系統(tǒng)正常運(yùn)行提供了更深層次的保護(hù)。
5 結(jié)束語(yǔ)
ARCEMIS系統(tǒng)是基于該系統(tǒng)數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn)甚高頻電臺(tái)的數(shù)據(jù)監(jiān)控及遠(yuǎn)程控制,所以該系統(tǒng)數(shù)據(jù)庫(kù)是該套系統(tǒng)的運(yùn)行之本。保證數(shù)據(jù)庫(kù)的正常運(yùn)行才是該套系統(tǒng)運(yùn)行正常的根本,目前,除華北地區(qū)外仍有許多該套系統(tǒng)運(yùn)行的單位及部門,而且,在今后的中小機(jī)場(chǎng)設(shè)備運(yùn)行中,該套ARCEMIS系統(tǒng)仍然可能成為主力運(yùn)行設(shè)備,為保障系統(tǒng)的正常運(yùn)行,文章中提及的解決辦法對(duì)其他應(yīng)用本套ARCEMIS系統(tǒng)的單位提供了一個(gè)研究方向。同時(shí),由于缺少對(duì)該套數(shù)據(jù)庫(kù)的認(rèn)識(shí),其數(shù)據(jù)庫(kù)內(nèi)的更多功能及隱患也有待相關(guān)人員的繼續(xù)研究。所以,該套數(shù)據(jù)庫(kù)的穩(wěn)定,冗余度將直接影響設(shè)備的正常運(yùn)行,維護(hù)人員應(yīng)該更多的去尋求技術(shù)的探索,保證數(shù)據(jù)庫(kù)的穩(wěn)定性,并增加其功能性,進(jìn)而保證甚高頻地空通信的正常運(yùn)行。同時(shí)也讓技術(shù)人員有所反思,就是對(duì)于目前包括監(jiān)控系統(tǒng)在內(nèi)的各套系統(tǒng)中,計(jì)算機(jī)、數(shù)據(jù)庫(kù)及網(wǎng)絡(luò)已經(jīng)成為了系統(tǒng)運(yùn)行的根基,技術(shù)人員應(yīng)更多的考慮其作用,開發(fā)潛在功能,這樣才能為各類系統(tǒng)的正常運(yùn)行提供保障。
作者簡(jiǎn)介:黃云鵬(1988,12-),男,漢族,上海市,助理工程師,大學(xué)本科,研究方向:地空通信設(shè)備。