劉文靜
摘 要:AFC系統(tǒng)中的車站服務器(SC)是與終端設(shè)備緊密相連的設(shè)備,其主要功能是對車站終端設(shè)備進行狀態(tài)監(jiān)控、收集終端產(chǎn)生的交易和審計數(shù)據(jù),規(guī)范系統(tǒng)的數(shù)據(jù)管理、運營管理及系統(tǒng)維護管理的技術(shù)要求。服務中的車站服務器向下提供正確的服務模式、參數(shù)分發(fā)、時鐘同步等,向上提供交易數(shù)據(jù)、運行狀態(tài)、客流報表等,起到了承上啟下的關(guān)鍵作用,所以,車站服務器的正常運行是終端設(shè)備(TVM、GATE、POST)給乘客提供優(yōu)質(zhì)服務的保證。本文從增設(shè)硬件備份、應用虛擬化技術(shù)、既有設(shè)備復用的不同實現(xiàn)方式進行對比,研究了車站服務器在故障時如何能夠快速恢復其功能,保證車站前后臺正常運行。
關(guān)鍵詞:AFC;SC;服務器;在線式容災
中圖分類號:U231 文獻標識碼:A
0 引言
隨著地鐵建設(shè)的發(fā)展,郊區(qū)線路的建設(shè),使得線路呈分散、里程增長的趨勢,在車站服務器出現(xiàn)故障時尤其在夜間,技術(shù)人員并不能夠在第一時間趕赴現(xiàn)場維修解決故障,加上故障類型的不確定性,影響數(shù)據(jù)采集的時效性和終端設(shè)備的穩(wěn)定性,基于此種情況,需研究SC故障后如何做到快速恢復其功能。為確保在車站服務器故障時終端設(shè)備能夠繼續(xù)為乘客提供服務,南京地鐵準備通過建立一套容災備份系統(tǒng),在車站服務器無法正常工作時實現(xiàn)原服務器的部分功能,對終端設(shè)備進行接管,確保終端設(shè)備繼續(xù)穩(wěn)定運營。
1 實現(xiàn)方式探究
容災系統(tǒng)是在各種災難損害發(fā)生后, 仍然能夠最大限度地提供正常應用服務的計算機信息系統(tǒng)。在發(fā)生災難時,為了能夠保證業(yè)務的連續(xù)性, 必須能夠?qū)崿F(xiàn)系統(tǒng)透明的遷移。國內(nèi)AFC系統(tǒng)普遍采用在車站機房放置一臺車站服務器的建設(shè)方式,通過星型網(wǎng)或者環(huán)網(wǎng)將SC與終端設(shè)備進行連接,SC與線路中心通過通信上層網(wǎng)相連,見圖1AFC系統(tǒng)五層架構(gòu)。此種設(shè)計層次清晰,明確各個層級分工協(xié)作,能夠在線路里程不長的基礎(chǔ)上保證維護的高效性。但是,隨著城市軌道交通的發(fā)展以及郊區(qū)線路的建設(shè),運營維護的問題逐步凸顯,當SC出現(xiàn)故障,技術(shù)人員并不能夠在第一時間趕赴現(xiàn)場維修解決故障,影響設(shè)備監(jiān)控、實時客流數(shù)據(jù)等車站服務。
根據(jù)AFC系統(tǒng)五層架構(gòu),如果想實現(xiàn)SC在線式容災備份系統(tǒng)的建立,可以采用以下兩種方式:一是SC采取雙機熱備。雙機熱備是應用于服務器的一種解決方案,其主要實現(xiàn)方式是為服務器設(shè)置一主一備形式,主機和備機通過網(wǎng)絡連接,正常情況下主機處于工作狀態(tài),備機處于監(jiān)視狀態(tài),一旦主機出現(xiàn)異常,備機將會迅速代替主機,完全實現(xiàn)主機的功能。這種形式確實可以解決SC故障時功能受到影響的問題,這就需要為每個車站的SC增加備機,無疑要增加大量的硬件成本,性價比過低,這也是線路在設(shè)計和新建時期沒有采用雙機熱備形式的重要原因。二是應用虛擬化技術(shù)。隨著信息化的飛速發(fā)展,IT方面的投入在不斷增加,服務器越來越多,機房空間越來越小,技術(shù)人員的管理難度也在不斷提升,傳統(tǒng)“一機一應用”的模式已跟不上時代的步伐,迫切地需要通過更為高效的信息化手段來實現(xiàn)。虛擬化技術(shù)能有效地實現(xiàn)物理資源的整合,通過共享資源的模式提高現(xiàn)有資源的利用率,減少了數(shù)據(jù)中心的投入,減少了空間需求硬件投入。但是虛擬化技術(shù)的應用通常適用于線路中心的各類服務器整合以取代原有的雙機熱備模式,若應用在SC上需要改變既有的架構(gòu)設(shè)計,在線路中心為各SC增設(shè)集中共享設(shè)備,還需要突破車站局域網(wǎng)的限制,存在帶來模式分發(fā)異常的隱患。
2 南京地鐵的實現(xiàn)路徑
通過上一章對SC容災實現(xiàn)方式的分析,雙機熱備的形式無論對于既有運營線路的改造還是新建都不太現(xiàn)實,虛擬化技術(shù)作為新興技術(shù)也需要投入大量的硬件成本,后期還需要投入長期維護的成本,不適用于既有線路對SC進行容災??紤]到對乘客服務的優(yōu)質(zhì)要求及維護成本的控制,南京地鐵從不更改原有架構(gòu)設(shè)計、不花費大量成本投入的角度,考慮通過設(shè)計一套AFC車站服務器在線式容災備份系統(tǒng),在SC出現(xiàn)故障無法提供服務時,實現(xiàn)SC功能的臨時接管。
(1)在線容災系統(tǒng)的設(shè)計?;谝陨闲枨螅@就需要在既有架構(gòu)中尋求可以替代SC接管其功能的合適的設(shè)備,由于容災備份系統(tǒng)的目的是臨時接替原SC的功能,因此對設(shè)備性能和長時間保存數(shù)據(jù)的要求相對較低,最終通過在車站工作站上安裝虛擬機,在虛擬系統(tǒng)中部署容災備份應用的所有功能,形成一臺容災系統(tǒng)計算機(如圖2)。這樣原工作站功能不受影響,并且應用程序都可以在相互獨立的空間內(nèi)運行而互不干擾,一旦SC發(fā)生故障,容災備份系統(tǒng)可以立即接管,實現(xiàn)在線式容災功能。
(2)容災系統(tǒng)的切換。SC發(fā)生故障時,技術(shù)人員只需遠程斷開SC與AFC系統(tǒng)的連接,在替代工作站上啟動虛擬機業(yè)務接入AFC系統(tǒng),該工作站將全面接管故障SC的業(yè)務功能,實現(xiàn)設(shè)備監(jiān)控、客流監(jiān)控、交易管理、數(shù)據(jù)管理、通信服務、時鐘管理、參數(shù)管理、設(shè)備管理、日始日終管理,同時可以實現(xiàn)客流數(shù)據(jù)實時銜接、交易文件斷點續(xù)傳、監(jiān)控狀態(tài)瞬間切換,真正實現(xiàn)在線容災,為車站設(shè)備繼續(xù)提供后臺服務。設(shè)備故障時,若存在部分交易文件未正常上傳的情況,容災備份系統(tǒng)還對設(shè)備交易文件提供補傳機制,確保交易文件上傳。SC故障修復后,技術(shù)人員只需將在線式容災系統(tǒng)斷開,SC開機后即可繼續(xù)工作,災備系統(tǒng)轉(zhuǎn)正常系統(tǒng)進行服務。若要保證SC交易文件和數(shù)據(jù)庫中交易的完整性,只需災備系統(tǒng)在故障期間的交易恢復至SC,對原系統(tǒng)不產(chǎn)生影響。
(3)容災系統(tǒng)的維護。在線容災系統(tǒng)的日常維護至關(guān)重要,為了在SC故障時能順利接管,必須確保容災系統(tǒng)中的業(yè)務功能與SC保持完全一致,這就需要在SC的業(yè)務軟件功能包括配置發(fā)生變化時,容災系統(tǒng)均需及時進行相應更新,與SC保持同步。而更新方式只需要遠程連接容災備份系統(tǒng)進行文件的替換即可實現(xiàn),操作便捷。
3 結(jié)束語
通過研究SC在線式容災系統(tǒng),實現(xiàn)了利用車站工作站接管故障SC所有業(yè)務功能的方式進行容災備份,確?,F(xiàn)場服務質(zhì)量和后臺數(shù)據(jù)統(tǒng)計不受影響,也為故障排查爭取足夠的時間,緩解了故障處置的壓力,真正實現(xiàn)了故障處理的“先通后復”,為“網(wǎng)絡化運營”新形勢下SC故障快速搶修探索了一種的新模式。
參考文獻:
[1]李輝.基于Vmware虛擬化技術(shù)的服務器集群的架構(gòu)與應用[D].湖南大學,2017.
[2]張金波.容災備份與恢復平臺的設(shè)計與實現(xiàn)[D].大連理工大學,2015.