楊建偉
(成都雙流國際機場股份有限公司機電設(shè)備中心, 四川 成都 610202)
機場信息系統(tǒng)搬遷過程的風(fēng)險控制研究
楊建偉
(成都雙流國際機場股份有限公司機電設(shè)備中心, 四川 成都 610202)
機場信息系統(tǒng)是核心生產(chǎn)系統(tǒng), 涉及面廣, 設(shè)備眾多, 相互聯(lián)系復(fù)雜,機場遷址、擴(kuò)建等項目中都可能需要對信息系統(tǒng)進(jìn)行整體搬遷, 需要保證業(yè)務(wù)系統(tǒng)在規(guī)定的搬遷時間窗口內(nèi)恢復(fù)正常運行. 分析了機場信息系統(tǒng)機房搬遷過程的各種風(fēng)險, 提出預(yù)防措施及風(fēng)險發(fā)生后的應(yīng)對措施, 以及實施這些應(yīng)對措施所需要的成本, 時間.
機場信息系統(tǒng); 機房搬遷; 風(fēng)險控制
機場信息系統(tǒng)搬遷過程涉及機場內(nèi)外部很多方面, 在搬遷過程有很多不確定因素, 不可能規(guī)避所有的風(fēng)險.因此, 我們需要識別所有的風(fēng)險; 分析每種風(fēng)險發(fā)生的可能性以及風(fēng)險發(fā)生后對業(yè)務(wù)系統(tǒng)造成的損失; 制訂措施預(yù)防風(fēng)險事件的發(fā)生, 及發(fā)生風(fēng)險后的應(yīng)對; 估算實施這些措施需要的成本和時間, 在有限的經(jīng)費、人力資源和停機時間的情況下尋求一個風(fēng)險最小的搬遷方案.
1.1 機場信息系統(tǒng)搬遷項目的生命周期
通常情況下, 一個完整的機場信息系統(tǒng)搬遷過程主要體現(xiàn)在四個階段[1], 包括“識別搬遷需求、提出搬遷解決方案、執(zhí)行搬遷、結(jié)束搬遷”, 這四個階段構(gòu)成了機場信息系統(tǒng)搬遷過程的整個生命周期. 如圖1所示.
圖1 機場信息系統(tǒng)搬遷生命周期Figure 1 Life Cycle of the Airport Information System during the Relocation
識別需求階段是搬遷生命周期的初始階段, 需要明確搬遷的任務(wù), 制定出信息系統(tǒng)搬遷的細(xì)節(jié)計劃; 方案解決階段是在識別需求基礎(chǔ)上所進(jìn)行的一系列有針對性的搬遷實施計劃; 執(zhí)行搬遷階段是對搬遷的解決方案的具體實施; 而搬遷結(jié)束階段則需要對搬遷過程中產(chǎn)生的文檔、試運行情況進(jìn)行總結(jié), 完成搬遷的決算等.
由此分析可見, 機場信息系統(tǒng)搬遷的整個生命周期內(nèi)任一階段的重大缺陷或失敗, 都將導(dǎo)致整個搬遷任務(wù)的失敗. 這種串聯(lián)的特點決定了其風(fēng)險控制的過程也具備流程的特點.
1.2 機場信息系統(tǒng)搬遷過程的風(fēng)險控制模型
為了降低機場信息系統(tǒng)在搬遷過程中的風(fēng)險, 最有效的方法就是對信息系統(tǒng)搬遷過程的整個生命周期內(nèi)的每一環(huán)節(jié)進(jìn)行風(fēng)險的有效控制與管理[2]. 系統(tǒng)搬遷后可能會發(fā)生硬件、網(wǎng)絡(luò)、操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用軟件等故障. 風(fēng)險管理的第一件事就是識別系統(tǒng)的脆弱性[3]. 系統(tǒng)搬遷中常見風(fēng)險如1表所示[4]:
表1 機場信息系統(tǒng)搬遷中常見風(fēng)險Chart 1 Common Risk during the Relocation of Airport Information System
3 系統(tǒng)故障 無法進(jìn)入系統(tǒng) 鍵盤、鼠標(biāo)、顯示器、網(wǎng)絡(luò)、文件系統(tǒng)、丟失密碼 中 大4 集群故障 無法啟動集群 網(wǎng)絡(luò)、存儲、串口、邏輯卷、配置 小 小5 數(shù)據(jù)故障 數(shù)據(jù)庫異常 磁盤、邏輯卷、文件系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)丟失 小 大6 軟件故障 應(yīng)用軟件無法啟動或工作異常 文件系統(tǒng)、網(wǎng)絡(luò) 小 小7 超時 無法在規(guī)定的時間窗口內(nèi)完成搬遷, 或沒有回退時間弱電系統(tǒng)不能按期完工, 備份、恢復(fù)和拆裝占用過多時間 小 大
為了降低以上風(fēng)險的發(fā)生, 需要加強各階段的風(fēng)險控制, 具體分析如下:
機場信息系統(tǒng)主要包括地面信息系統(tǒng)、離港系統(tǒng)、航顯系統(tǒng)、廣播系統(tǒng)、安檢系統(tǒng)、安檢信息系統(tǒng)、客戶系統(tǒng)、POS系統(tǒng)數(shù)據(jù)、安防系統(tǒng)[5]. 涉及不同生產(chǎn)廠家的不同產(chǎn)品, 不同的系統(tǒng)可能是由不同的應(yīng)用軟件商開發(fā),不同的系統(tǒng)集成商實施. 因此, 在識別需求階段, 除了做好這些系統(tǒng)的搬遷需求分析外, 還要加強搬遷的責(zé)任心教育、做好搬遷的各項論證、編制科學(xué)合理的搬遷預(yù)算;在提出解決方案階段, 根據(jù)搬遷的信息系統(tǒng)特點, 關(guān)注導(dǎo)致風(fēng)險產(chǎn)生的技術(shù)因素, 審核承擔(dān)搬遷的單位資質(zhì)、搬遷流程的監(jiān)控環(huán)節(jié), 以減少搬遷持續(xù)過程中的各種風(fēng)險;在搬遷執(zhí)行階段, 要重點關(guān)注對搬遷的現(xiàn)場管理. 由于搬遷中技術(shù)難度大、專業(yè)分工多, 需要搬遷管理人員統(tǒng)籌安排, 減少由于人員帶來的風(fēng)險; 在搬遷結(jié)束階段, 關(guān)注搬遷的決算, 避免增加成本, 加強對搬遷文檔的管理[6].
綜上, 對機場信息系統(tǒng)搬遷過程的風(fēng)險控制模型如圖2所示:
圖2 機場信息系統(tǒng)搬遷過程的風(fēng)險控制模型Figure 2 The Risk Control Model during the Relocation of Airport Information System
根據(jù)上述風(fēng)險控制模型, 具體分析機場信息系統(tǒng)搬遷過程中可能出現(xiàn)的風(fēng)險, 從搬遷的生命周期思想出發(fā),提出風(fēng)險發(fā)生后的應(yīng)對措施以及這些措施的成本、實施需要消耗多少搬遷窗口時間, 目的是回避風(fēng)險、轉(zhuǎn)移風(fēng)險、減少風(fēng)險造成的損失、降低風(fēng)險的等級[7]. 主要的故障及其預(yù)防措施分析如下:
2.1 硬件故障及預(yù)防措施
(1)灰塵導(dǎo)致設(shè)備損壞
在系統(tǒng)搬運過程中, 由于震動, 一些灰塵可能進(jìn)入插槽、光纖或設(shè)備的光口、, 導(dǎo)致搬遷后故障. 應(yīng)對措施是在設(shè)備拆卸后, 重新安裝前進(jìn)行機箱內(nèi)部清潔. 一般采用毛刷、吸塵器、鼓風(fēng)機等工具, 也可能會使用一些清潔劑. 需要占用停機窗口的時間, 需要高水平硬件工程師實施, 額外的成本很小.
(2)搬運過程導(dǎo)致設(shè)備損壞
如果在搬運過程中失手摔壞, 或在樓梯、墻角上碰撞, 都有可能造成設(shè)備損壞, 預(yù)防措施是精選強壯的搬運工, 并安排人手在搬運線路上指揮調(diào)度. 該應(yīng)對措施不會多消耗搬遷時間窗口, 需要人員占用, 沒有額外的開銷.
(3)運輸過程導(dǎo)致設(shè)備損壞
在汽車運輸過程中由于顛簸或車禍對設(shè)備造成損壞. 預(yù)防措施是購買海綿墊子, 鋪設(shè)在貨車上, 用繩子捆
綁牢實, 并派遣IT管理人員隨車押運, 隨時提醒司機慢行或選擇平坦路面. 極其關(guān)鍵的設(shè)備還可購買單次運輸保險. 該預(yù)防措施可能會略多消耗搬遷時間窗口, 需要人員占用, 額外的開銷就是包裝材料和保險費用.
(4)環(huán)境變化導(dǎo)致設(shè)備損壞
老機房溫度非常低, 運輸途中濕度非常高, 導(dǎo)致水蒸汽在電路板凝結(jié), 重新通電導(dǎo)致?lián)p壞. 應(yīng)對措施是調(diào)高新機房的溫度, 調(diào)低濕度, 并在通電前靜置一段時間, 靜置時間越長風(fēng)險越小, 靜置24小時后將這項風(fēng)險徹底消失. 需要占用搬遷時間窗口, 一般不可能有24小時的靜置時間.
2.2 系統(tǒng)故障及預(yù)防措施
(1)設(shè)備裝配錯誤導(dǎo)致系統(tǒng)不能正常啟動
系統(tǒng)重新裝配后, 可能不是100%還原, 導(dǎo)致系統(tǒng)找不到指定的設(shè)備, 系統(tǒng)啟動不正常, 排查和修復(fù)故障需要消耗搬遷時間窗口. 預(yù)防措施是搬遷前對系統(tǒng)進(jìn)行標(biāo)識, 按事先設(shè)計的編碼對設(shè)備貼標(biāo)簽, 包括設(shè)備名稱, 每一個端口及電纜、光纖都需要標(biāo)識.
(2)網(wǎng)絡(luò)環(huán)境不同導(dǎo)致系統(tǒng)異常
預(yù)防措施是在搬遷前對新機房網(wǎng)絡(luò)環(huán)境進(jìn)行全面的測試, 確保網(wǎng)絡(luò)環(huán)境一致. 緊急情況下需要應(yīng)急備機.不占用搬遷時間窗口, 需要網(wǎng)絡(luò)工程師, 租用或購買應(yīng)急備機可能產(chǎn)生額外費用.
2.3 集群故障及預(yù)防措施
集群故障可能是由于硬件故障、或配置引起的. 預(yù)防措施是在健康檢查時進(jìn)行集群切換測試, 確保集群配置沒有問題. 需要數(shù)據(jù)庫管理人員實施, 不占用搬遷時間窗口, 沒有其它人員和費用.
2.4 數(shù)據(jù)庫故障及預(yù)防措施
(1)數(shù)據(jù)庫系統(tǒng)故障
導(dǎo)致數(shù)據(jù)庫故障的原因很多, 可能因磁盤損壞, 邏輯卷錯誤、文件系統(tǒng)故障、開關(guān)機過程中的錯誤操作、數(shù)據(jù)中錯誤的設(shè)置等原因造成的. 預(yù)防措施:搬遷前進(jìn)行健康檢查, 關(guān)機前先確認(rèn)數(shù)據(jù)庫已經(jīng)正常關(guān)閉, 搬遷后不要急于啟動雙機或數(shù)據(jù), 再進(jìn)行一次系統(tǒng)級健康檢查, 確保硬件、網(wǎng)絡(luò)和操作系統(tǒng)一切正常后再啟動數(shù)據(jù). 需要系統(tǒng)管理人員、數(shù)據(jù)庫管理人員參與, 健康檢查需要占用搬遷時間窗口, 沒有其它費用[8].
(2)數(shù)據(jù)損壞
由于磁盤、陣列等損壞導(dǎo)致數(shù)據(jù)損壞, 數(shù)據(jù)丟失, 應(yīng)對措施是在搬遷前對數(shù)據(jù)庫進(jìn)行備份, 一旦發(fā)生數(shù)據(jù)庫損壞, 可通過恢復(fù)操作修復(fù)數(shù)據(jù). 要消耗停機窗口時間, 以及數(shù)據(jù)庫管理人員操作.
2.5 應(yīng)用軟件系統(tǒng)故障及預(yù)防措施
(1)網(wǎng)絡(luò)設(shè)置錯誤導(dǎo)致應(yīng)用系統(tǒng)異常
可能是由于IP地址改變、路由設(shè)置、防火墻設(shè)置不正確、中間件服務(wù)器變化、負(fù)載均衡器設(shè)置不正確等因素引起. 預(yù)防措施是盡量不要在搬遷項目中修改網(wǎng)絡(luò)設(shè)置.
(2)客戶端設(shè)置錯誤導(dǎo)致應(yīng)用系統(tǒng)異常
一般情況應(yīng)盡量避免修改客戶端配置, 在服務(wù)器端修改量很小, 而客戶端修改量非常大.
2.6 超時故障及預(yù)防措施
超時故障是指不能在規(guī)定的時間窗口內(nèi)完成搬遷工作, 系統(tǒng)不能提供服務(wù)導(dǎo)致業(yè)務(wù)中斷. 超時造成的損失與業(yè)務(wù)有關(guān), 如果機場關(guān)閉, 業(yè)務(wù)損失巨大, 建議采用一些技術(shù)手段盡量減少停機時間. 超時主要是因為意外、太多故障處理、備份及恢復(fù)導(dǎo)致的[9].
通過對可能發(fā)生風(fēng)險的分析評估, 我們發(fā)現(xiàn)所有的風(fēng)險都可以通過采取一些預(yù)防措施進(jìn)行規(guī)避、轉(zhuǎn)移、降低風(fēng)險. 有些預(yù)防控制措施需要很多人力資源, 有些措施耗資巨大, 但跟停產(chǎn)造成的業(yè)務(wù)損失來比就太小了, 所以需要決策人員智慧的選擇.
我們采用的風(fēng)險控制措施主要在3個方面:組織措施、技術(shù)措施、安全措施.
3.1 組織措施
成立搬遷項目指揮部, 建議由副總裁以上的組織能力超強的人員擔(dān)任指揮長, 由機場、航信、系統(tǒng)集成商、軟件開發(fā)商、各子系統(tǒng)供貨商、服務(wù)商、搬運公司聯(lián)合成立搬遷項目組, 另外聘請首都機場有豐富搬遷經(jīng)驗的專家擔(dān)任顧問. 為簡化管理, 與軟件開發(fā)商、各子系統(tǒng)供貨商、服務(wù)商之間的協(xié)調(diào)由系統(tǒng)集成商負(fù)責(zé).
選擇合適的搬遷時機, 制訂完整的總體搬遷計劃, 繪制橫道圖和網(wǎng)絡(luò)圖. 各分系統(tǒng)責(zé)任單位通過編制次級進(jìn)度計劃, 通過專家會議論證進(jìn)行評審, 確定總進(jìn)度計劃; 系統(tǒng)集成商負(fù)責(zé)細(xì)化次級進(jìn)度計劃, 進(jìn)一步明確各分項工作所需的資源, 以及完成該項所需的時間, 并驗證總計劃的合理性.
根據(jù)搬遷進(jìn)度計劃確定各種資源需求計劃, 具體的計劃總量及進(jìn)場時間, 并保存“資源需求計劃”編制的依據(jù)和基礎(chǔ)數(shù)據(jù), 以備查詢和滿足施工過程中持續(xù)改進(jìn)的需要[10].
3.2 技術(shù)措施
通過制定完整的搬遷方案, 細(xì)化每個搬遷環(huán)節(jié)和預(yù)防措施的詳細(xì)步驟, 確保搬遷過程能正確實施. 根據(jù)有限的人力、物力、財力、時間等資源, 選擇實施各種風(fēng)險控制的技術(shù)措施, 使搬遷風(fēng)險降到最低[11].
3.3 安全措施
成立機場搬遷安全小組, 由副指揮長擔(dān)任安全小組的組長, 安全小組負(fù)責(zé)制訂安全防范措施及要求, 在搬遷現(xiàn)場設(shè)置警戒, 對搬遷現(xiàn)場安全進(jìn)行監(jiān)督與檢查, 規(guī)范檢修行為, 制止違章操作, 保證搬遷和周圍安全生產(chǎn)安全進(jìn)行. 落實搬遷現(xiàn)場安全防范. 搬遷作業(yè)前對所有參與搬遷人員進(jìn)行安全培訓(xùn)[12].
徹底評估搬遷工程的重點、難點, 成立攻關(guān)小組, 提前進(jìn)行調(diào)查研究, 及早提出解決方案. 規(guī)避風(fēng)險, 確保工程順利完成.
本文提出一個機場信息系統(tǒng)搬遷的生命周期風(fēng)險控制思想, 對風(fēng)險控制與搬遷過程管理整合提供了一種有效的管理與控制方法, 為實際的機場信息系統(tǒng)搬遷過程的規(guī)范化實施提供了參考.
[1] 郭捷. 項目風(fēng)險管理[M]. 北京: 國防工業(yè)出版社, 2007.
[2] 沈建明. 項目風(fēng)險管理[M]. 北京: 機械工業(yè)出版社, 2009.
[3] 馬丁魯斯摩爾. 項目中的風(fēng)險管理[M].北京:中國建筑工業(yè)出版社2011.
[4] 包金玉. 定量和定性風(fēng)險評價方法分析 [J]. 大連海事大學(xué)學(xué)報: 英文版, 2008(增刊2): 5-8.
[5] 傅鴻源. 工程項目風(fēng)險評價方法的研究[J]. 系統(tǒng)工程理論與實踐, 2003, 10-17.
[6] 孫軍. 工程項目風(fēng)險的特點與識別[J]. 科技咨詢導(dǎo)報, 2007(10): 172-175.
[7] 趙濤, 李英. 多目標(biāo)整數(shù)規(guī)劃在環(huán)境風(fēng)險控制模型中的應(yīng)用[J]. 科學(xué)技術(shù)與工程, 2011, 11(34): 8649-8652.
[8] 盧加元. 基于可靠性理論的信息化項目建設(shè)風(fēng)險控制模型[J]. 科技管理研究, 2009, 4: 136-138.
[9] 梁新弘. 論信息技術(shù)(IT)外包的動因、風(fēng)險及防范[J]. 科技管理研究, 2004(1): 64-66.
[10] 蔣敏, 胡奇英. 一種風(fēng)險值最優(yōu)控制模型[J]. 西安電子科技大學(xué)學(xué)報: 自然科學(xué)版, 2006, 33(1): 142-144.
[11] 梁麗琴, 邵培基. 國內(nèi)外信息技術(shù)外包研究現(xiàn)狀及趨勢對比分析[J]. 中國管理科學(xué), 2008,10(16): 486-491.
[12] 鄭新定, 王紅衛(wèi). 考慮人為因素的盾構(gòu)隧道風(fēng)險分析和控制模型研究[J]. 隧道建設(shè), 2013, 33(9): 720-724.
Risk control during the relocation of airport information system
YANG Jian-wei
(Mechanic and Electrical Equipment Center, Chengdu Shuangliu International Airport Company LTD, Chengdu 610202, P.R.C.)
Airport information system, which involves a wide range of, numerous equipment, in complex relationships with other system, is the core of production system. When the information system must be moved for things such as airport relocation or extension, it should recover to work in fixed time. This paper analyzes various risks in the process of the information system relocation, points out the prevention measures before and after the risk occurs, the cost and time it needs.
airport information system; computer room relocation; risk control
TP309
: A
: 1003-4271(2014)03-0461-04
10.3969/j.issn.1003-4271.2014.03.25
2014-03-06
楊建偉(1969-), 男, 四川都江堰人, 工程師, 碩士, 研究方向: 信息技術(shù).
西南民族大學(xué)學(xué)報(自然科學(xué)版)2014年3期