李保東,董思騰
(北京衛(wèi)星導(dǎo)航中心,北京 100094)
單點現(xiàn)象對衛(wèi)星地面站的影響分析
李保東,董思騰
(北京衛(wèi)星導(dǎo)航中心,北京 100094)
本文結(jié)合衛(wèi)星地面站組成及運行原理,分析了主要分系統(tǒng)拓?fù)浣Y(jié)構(gòu)之間、主用備用設(shè)備之間,在設(shè)備集成、供配電保障、信號驅(qū)動、數(shù)據(jù)鏈等方面存在的單點現(xiàn)象,給出了熱備、多路、輪詢、鏡像等解決單點現(xiàn)象的方法措施,為在現(xiàn)有設(shè)計基礎(chǔ)上優(yōu)化衛(wèi)星站性能提升系統(tǒng)穩(wěn)定運行的可靠性,以及下一步衛(wèi)星地面站可靠性設(shè)計提供了一定的借鑒作用。
單點現(xiàn)象;輪詢運行;鏡像運行;單體運行
衛(wèi)星地面站在衛(wèi)星應(yīng)用系統(tǒng)中主要承擔(dān)實時監(jiān)測、接收和提供原始觀測數(shù)據(jù)任務(wù),其布設(shè)范圍、分布數(shù)量及不間斷穩(wěn)定運行,對大系統(tǒng)效能發(fā)揮起到了至關(guān)重要的作用。所以,衛(wèi)星地面站可靠性直接影響了衛(wèi)星系統(tǒng)是否能夠發(fā)揮應(yīng)有的效能。然而,由于受到系統(tǒng)冗余設(shè)計、設(shè)備組成等客觀影響,衛(wèi)星地面站在分系統(tǒng)之間、鏈路之間、設(shè)備之間,不可避免的會存在著一定的單點現(xiàn)象,這些單點一旦中斷,勢必會導(dǎo)致部分功能指標(biāo)退化、部分集群設(shè)備癱瘓。這些影響衛(wèi)星地面站可靠性的單點現(xiàn)象,如果要徹底解決必然需要更加龐大復(fù)雜的系統(tǒng)來保障,甚至?xí)霈F(xiàn)更多的單點現(xiàn)象,這是不現(xiàn)實的,所以從宏觀意義上來講單點現(xiàn)象是不可避免,但可以通過一定的可靠性設(shè)計和運行管理手段降低單點現(xiàn)象帶來的影響。
本文結(jié)合衛(wèi)星地面站運行實際,分析了系統(tǒng)結(jié)構(gòu)之間、主用備用設(shè)備之間存在的部分單點現(xiàn)象,通過對不同程度存在主備同套、主備同源、主備同出、主備同電等現(xiàn)象描述,提供了部分解決的方法措施,并簡要提出了下一步重點工作建議。
對于復(fù)雜的衛(wèi)星應(yīng)用工程,衛(wèi)星地面站實際應(yīng)用中的單點現(xiàn)象是不可完全避免的,只能從可靠性的角度進(jìn)行優(yōu)化,但仍然在一定程度上客觀存在。
2.1 拓?fù)浣Y(jié)構(gòu)中的單點現(xiàn)象
2.1.1 星形結(jié)構(gòu)
表現(xiàn)為多系統(tǒng)、多設(shè)備、多鏈路共用一個關(guān)鍵節(jié)點。如圖1所示,遠(yuǎn)端站可與中心進(jìn)行數(shù)據(jù)通信,遠(yuǎn)端站之間不能進(jìn)行通信,多個遠(yuǎn)端站與主站構(gòu)成典型的星形網(wǎng)絡(luò)結(jié)構(gòu)。如圖2所示,多個分系統(tǒng)或設(shè)備通過核心交換機構(gòu)成星形鏈路結(jié)構(gòu)。結(jié)構(gòu)中的中心站、核心交換機如果存在單路由接入或單設(shè)備交互,即備用路由源頭仍為同一路由或備用設(shè)備狀態(tài)不一致,形成星形結(jié)構(gòu)中的單點現(xiàn)象。
圖1 中心站與遠(yuǎn)端站的星形連接
圖2 多系統(tǒng)多設(shè)備間的星形連接
2.1.2 橋式結(jié)構(gòu)
表現(xiàn)為某設(shè)備作為兩個系統(tǒng)或設(shè)備之間的橋梁節(jié)點。如圖3所示,橋設(shè)備作為兩個分系統(tǒng)之間的數(shù)據(jù)交換或處理設(shè)備,雖然由兩條或兩條以上的交互鏈路,但此設(shè)備作為惟一設(shè)備,形成橋式結(jié)構(gòu)中的單點現(xiàn)象。
圖3 多系統(tǒng)多設(shè)備間的橋形連接
2.1.3 關(guān)口結(jié)構(gòu)
表現(xiàn)為數(shù)據(jù)交互的唯一接口。如圖4所示,遠(yuǎn)端數(shù)據(jù)通過設(shè)備提供的單接口接入并與各系統(tǒng)/設(shè)備交互,接口無冗余或設(shè)置信息不能完全一致,形成單接口的單點現(xiàn)象。
圖4 多系統(tǒng)多設(shè)備間的關(guān)口連接
2.2 組成結(jié)構(gòu)中的單點現(xiàn)象
2.2.1 硬件組成
突出表現(xiàn)為以下單路由鏈路、單設(shè)備運行等現(xiàn)象。
只有一條路由:專用數(shù)據(jù)傳輸鏈路只有一條,分系統(tǒng)/設(shè)備關(guān)鍵信息路由只有一條,鏈路故障易引發(fā)相應(yīng)系統(tǒng)數(shù)據(jù)交互中斷,關(guān)鍵信息突變易引發(fā)分系統(tǒng)/設(shè)備運行狀態(tài)失效。
只有一套在線:備份設(shè)備實際處于加電離線狀態(tài),或無備份鏈路接入系統(tǒng)實際處于離線狀態(tài),遇有緊急情況,只能臨時轉(zhuǎn)接線路啟用,可能會造成一定時長數(shù)據(jù)中斷,并沒有起到熱備份作用。
備份設(shè)備長期離線狀態(tài)難以保持:備份設(shè)備由于不在線或開機未接入,由于系統(tǒng)狀態(tài)固化其相關(guān)配置及性能難以定期檢測和維護(hù),如需啟用,不能確保狀態(tài)正常。
2.2.2 軟件組成
突出表現(xiàn)在管理控制系統(tǒng)或中心處理軟件負(fù)責(zé)處理該分系統(tǒng)或某項業(yè)務(wù),雖然有備份服務(wù)器備份系統(tǒng)/軟件運行,但在使用策略上存在優(yōu)選主用系統(tǒng)或軟件,在某些節(jié)點異常時不能選用備用系統(tǒng)/軟件進(jìn)行處理,客觀上造成一定的單點現(xiàn)象。
2.3 單體設(shè)備中的單點現(xiàn)象
單體設(shè)備存在不同程度的下列現(xiàn)象。
(1)主備同套現(xiàn)象:主用設(shè)備和備用設(shè)備集成配置在一個機箱。
(2)主備同電現(xiàn)象:主用設(shè)備和備用設(shè)備共用一套電源系統(tǒng)或模塊。
(3)主備同源現(xiàn)象:主用設(shè)備和備用設(shè)備共用一個信號源/數(shù)據(jù)源。
(4)主備同出現(xiàn)象:主用設(shè)備和備用設(shè)備輸出一個數(shù)據(jù)流。
以上情況雖然主備在線互為熱備,實際維護(hù)中設(shè)備一旦需要檢測,須整設(shè)備停機或下線,造成該設(shè)備功能缺失,形成實際運行中的單點現(xiàn)象。
衛(wèi)星地面站通常采取高可靠設(shè)計、高冗余備份、高余量參數(shù)等,解決其鏈路中的單點問題,基本原則是單個分系統(tǒng)失效、部分設(shè)備故障、冗余數(shù)據(jù)退化時,由于客觀上存在多系統(tǒng)服務(wù)、備份設(shè)備在線切換、數(shù)據(jù)參數(shù)冗余,一般不會影響系統(tǒng)正常運行和功能的實現(xiàn)。解決單點現(xiàn)象的關(guān)鍵是節(jié)點之間連接與動作的遷移,設(shè)備/數(shù)據(jù)相連的鏈接與設(shè)備/數(shù)據(jù)本身及其它相連節(jié)點之間的動作或者行為,需要在發(fā)生宕機時或無效時及時遷移到有效地正常節(jié)點上。
3.1 熱備運行
方法:主用設(shè)備在設(shè)為主節(jié)點的節(jié)點逾越邊界后,由設(shè)為副節(jié)點的備用設(shè)備接替,當(dāng)備用設(shè)備完成一系列操作后,還要選擇一個新的節(jié)點作為新的副節(jié)點,用以主用設(shè)備的新切換節(jié)點。
(1)準(zhǔn)確設(shè)定邊界節(jié)點:此節(jié)點可以由參數(shù)閾值或失效時刻等組成。
(2)準(zhǔn)確設(shè)置節(jié)點觸發(fā)機制:當(dāng)系統(tǒng)/設(shè)備檢測到邊界節(jié)點后,能夠立即觸發(fā)啟用備用設(shè)備實現(xiàn)“無縫”切換。
(3)準(zhǔn)確進(jìn)行一致性驗證:設(shè)定節(jié)點對主備設(shè)備狀態(tài)進(jìn)行同步,如果在節(jié)點范圍內(nèi)沒有收到某個狀態(tài)的同步信息,就認(rèn)為此驗證失效,系統(tǒng)/設(shè)備啟動數(shù)據(jù)恢復(fù)操作,或告警人工進(jìn)行狀態(tài)一致性設(shè)置。
3.2 多路運行
方法:對輸入數(shù)據(jù)源或輸出數(shù)據(jù)流,盡可能實現(xiàn)雙路或多路并行運行,從物理層確?;閭浞?。
(1)準(zhǔn)確設(shè)置接口文件:確保數(shù)據(jù)表達(dá)的一致性。
(2)準(zhǔn)確設(shè)置并行方式:對主用鏈路與備用鏈路之間的關(guān)系映射,進(jìn)行定期切換或檢測。
(3)準(zhǔn)確設(shè)置使用策略:按照優(yōu)先級使用對應(yīng)鏈路,對電源、頻標(biāo)信號、數(shù)據(jù)信息等不同性質(zhì)鏈路配置相應(yīng)切換器,依據(jù)策略啟用自動/手動切換。
3.3 輪詢運行
方法:對主備系統(tǒng)、主備設(shè)備、雙路/多路鏈路、星形鏈路等進(jìn)行節(jié)點輪詢管理、握手管理,按照數(shù)據(jù)可用性或負(fù)載均衡原則,設(shè)置基礎(chǔ)數(shù)據(jù)副本量值并達(dá)到主副節(jié)點數(shù)據(jù)負(fù)載一致。
(1)準(zhǔn)確設(shè)置輪詢/握手節(jié)點:確保原始數(shù)據(jù)在不同系統(tǒng)/設(shè)備/鏈路的完整程度。
(2)準(zhǔn)確設(shè)置基礎(chǔ)數(shù)據(jù)副本量值:根據(jù)原始數(shù)據(jù)的重要程度,確定數(shù)據(jù)包量值、個數(shù)、位置等。
(3)準(zhǔn)確設(shè)置輪詢/握手策略:對主備系統(tǒng)、主備設(shè)備、雙路/多路鏈路、星形鏈路等,按主備節(jié)點進(jìn)行輪詢或握手,直到對應(yīng)數(shù)據(jù)包達(dá)到系統(tǒng)/設(shè)備/鏈路指定值,并即時送達(dá)指定位置。
3.4 鏡像運行
方法:對于單鏈路或單節(jié)點,設(shè)置熱備份節(jié)點,在該節(jié)點確定合理鏡像周期,對數(shù)據(jù)信息、狀態(tài)信息進(jìn)行覆蓋性或合并性鏡像,以鏡像日志等形式進(jìn)行存儲。
(1)準(zhǔn)確設(shè)置鏡像節(jié)點:此節(jié)點要保證恢復(fù)信息不丟失及對于系統(tǒng)/鏈路/設(shè)備的可用性。
(2)準(zhǔn)確設(shè)置鏡像信息:尤其是包括位置、時間等空間信息。
(3)準(zhǔn)確設(shè)置鏡像恢復(fù)策略:當(dāng)在下一節(jié)點(或失效節(jié)點)失效或宕機時,啟用鏡像信息恢復(fù)系統(tǒng)/鏈路/設(shè)備狀態(tài)。
3.5 單體運行
方法:對核心設(shè)備進(jìn)行分體式設(shè)計、分布式使用,構(gòu)建多交叉節(jié)點并行運行的系統(tǒng)狀態(tài)。
(1)準(zhǔn)確進(jìn)行研制設(shè)備集成:主備設(shè)備進(jìn)行分體式設(shè)計和研制,確保電源模塊、信號接入、數(shù)據(jù)輸出等方面絕對獨立;不同廠家、不同時期研制的同類設(shè)備在設(shè)備主要結(jié)構(gòu)、外部接口、操作系統(tǒng)等方面的表現(xiàn)形式要一致。
(2)準(zhǔn)確進(jìn)行成品設(shè)備采購:對同型替代/換代產(chǎn)品要進(jìn)行通用選型或標(biāo)準(zhǔn)化選型。
(3)準(zhǔn)確進(jìn)行交叉節(jié)點設(shè)置:確保符合在線熱備需求。
衛(wèi)星地面站中的單點現(xiàn)象暴露出解決隱患與實際在線系統(tǒng)的矛盾,即單點現(xiàn)象可以部分解決或減弱,實際不可完全避免而客觀存在,解決了一個單點現(xiàn)象勢必會引發(fā)下一個單點現(xiàn)象或出現(xiàn)下一個單點現(xiàn)象,追溯極限乃至一個分系統(tǒng)或者大系統(tǒng)就是一個單點現(xiàn)象。根據(jù)衛(wèi)星地面站實際運行中存在的單點現(xiàn)象,可以從頂層設(shè)計進(jìn)一步優(yōu)化提升系統(tǒng)性能,具體包括以下幾方面。
(1)提升自我復(fù)制能力。系統(tǒng)/鏈路/設(shè)備按照預(yù)期節(jié)點進(jìn)行原始基礎(chǔ)數(shù)據(jù)的復(fù)制、存儲,以達(dá)到期望的狀態(tài)一致性。
(2)提升自我發(fā)現(xiàn)能力。節(jié)點失效后系統(tǒng)/設(shè)備/鏈路能夠即時發(fā)現(xiàn),并即時觸發(fā)下一步行動。
(3)提升自我遷移能力。解決單點問題基本方法是增加系統(tǒng)/鏈路/設(shè)備的遷移能力,即當(dāng)主節(jié)點失效時遷移到相應(yīng)副節(jié)點上繼續(xù)保持良好運行狀態(tài),同時會產(chǎn)生新的副節(jié)點或主節(jié)點恢復(fù)后又作為新的副節(jié)點存在。
(4)提升自我恢復(fù)能力。失效節(jié)點啟用原始基礎(chǔ)數(shù)據(jù)進(jìn)行自我恢復(fù),從而達(dá)到正常運行狀態(tài)。
綜上所述,本文僅對衛(wèi)星地面站中的單點現(xiàn)象進(jìn)行了概略分析,針對不同的單點現(xiàn)象提出了方法設(shè)想,尚未形成完整的解決方案。下一步工作中,可以從系統(tǒng)自動處理角度,在保證系統(tǒng)穩(wěn)定性、可靠性并簡化復(fù)雜性基礎(chǔ)上,進(jìn)一步深化研究解決方案。
[1] 譚述森.衛(wèi)星導(dǎo)航定位工程.北京:國防工業(yè)出版社,2010.07
[2] 秘金鐘.GNSS完備性監(jiān)測理論與應(yīng)用.北京:測繪出版社,2012.07
[3] 王磊.一種高性能HDFS存儲平臺的研究與實現(xiàn)[D].西安電子科技大學(xué),2013
[4] 張大洋.基于云存儲的分布式文件系統(tǒng)研究與優(yōu)化[D].西安電子科技大學(xué),2013
[5] 田熾.基于HDFS的高可擴展性云存儲的研究與實現(xiàn)[D].華南理工大學(xué),2012
[6] 董昌坤.基于HDFS的分布式云存儲系統(tǒng)的設(shè)計與實現(xiàn)[D].北京郵電大學(xué),2013
[7] 翟永東.Hadoop分布式文件系統(tǒng)(HDFS)可靠性的研究與優(yōu)化[D].華中科技大學(xué),2011
Commvault榮膺2017年NetworkWorld Asia大獎
Commvault宣布在近日頒布的2017年Network World Asia信息管理大獎中,Commvault數(shù)據(jù)管理解決方案榮獲“備份和恢復(fù)解決方案”類別的信息管理大獎。NWA的信息管理獎于2012年啟動,旨在表彰過去幾年在信息安全、存儲與數(shù)據(jù)管理領(lǐng)域取得巨大進(jìn)步的杰出公司。評委組由擁有豐富知識儲備的業(yè)內(nèi)資深編輯指導(dǎo)團隊與信息管理領(lǐng)域擁有深刻行業(yè)洞察的首席信息官評審團隊組成。該獎項既是對Commvault在服務(wù)客戶承諾方面給予的認(rèn)可,也是對Commvault備份和恢復(fù)解決方案的廣度與深度的認(rèn)可。
Analysis on the Influence of Single Point Phenomenon on Satellite Ground Station
Li Baodong, Dong Siteng
(Beijing Satellite Navigation Center, Beijing, 100094)
This paper combines the composition and operation principle of satellite ground station, analyzes the single point phenomenon between the main subsystems, the main equipment and the backup equipment, and the existence of equipment integration, power supply and distribution protection, signal driving and data link. It gives the hot standby, multi-channel, polling, mirroring and other methods to solve a single point phenomenon. It also provides a reference for optimizing the performance of satellite stations on the basis of existing design, improving the reliability of stable operation of the system and the reliability design of satellite ground stations in the future.
Single Point Phenomenon; polling running; mirror running; monomer running
10.3969/J.ISSN.1672-7274.2017.06.004
TN96,TN927+.21文獻(xiàn)標(biāo)示碼:A
1672-7274(2017)06-0012-04