◆高明星 劉忠東 李淳 李士紅 劉旭
中國(guó)鐵路主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維風(fēng)險(xiǎn)管理研究
◆高明星1劉忠東2李淳3李士紅3劉旭3
(1.中國(guó)鐵路信息科技集團(tuán)有限公司 北京 100844;2.中國(guó)國(guó)家鐵路集團(tuán)有限公司 北京 100844;3.中鐵信大數(shù)據(jù)科技有限公司 天津 301700)
本文運(yùn)用ERM風(fēng)險(xiǎn)管理相關(guān)理論,從戰(zhàn)略管理目標(biāo)、風(fēng)險(xiǎn)管理要素、管理層級(jí)三個(gè)維度,對(duì)中國(guó)鐵路主數(shù)據(jù)中心的基礎(chǔ)設(shè)施運(yùn)維進(jìn)行全方位風(fēng)險(xiǎn)影響分析,構(gòu)建持續(xù)改進(jìn)的風(fēng)險(xiǎn)管理機(jī)制,保障運(yùn)維決策的合理性和準(zhǔn)確性,不斷排除風(fēng)險(xiǎn)隱患,提高運(yùn)維質(zhì)量。
數(shù)據(jù)中心;基礎(chǔ)設(shè)施;運(yùn)行維護(hù);風(fēng)險(xiǎn)管理
中國(guó)鐵路主數(shù)據(jù)中心(以下簡(jiǎn)稱“主數(shù)據(jù)中心”)是國(guó)鐵集團(tuán)業(yè)務(wù)應(yīng)用系統(tǒng)生產(chǎn)運(yùn)行中心,承載著國(guó)鐵集團(tuán)和全路集中應(yīng)用系統(tǒng)部署及數(shù)據(jù)資源存儲(chǔ)的主要功能,肩負(fù)著鐵路核心業(yè)務(wù)安全穩(wěn)定運(yùn)行的重要使命。本文引入ERM風(fēng)險(xiǎn)管理相關(guān)理論,構(gòu)建主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管理框架模型,根據(jù)基礎(chǔ)設(shè)施運(yùn)維全生命周期特點(diǎn),進(jìn)行風(fēng)險(xiǎn)管理要素分析,挖掘潛在風(fēng)險(xiǎn)點(diǎn),制定風(fēng)險(xiǎn)應(yīng)對(duì)措施。同時(shí)引入質(zhì)量控制中PDCA相關(guān)技術(shù)方法,構(gòu)建持續(xù)改進(jìn)的風(fēng)險(xiǎn)管理機(jī)制,確保運(yùn)維質(zhì)量的持續(xù)改進(jìn)與高效可靠。
主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維管理的核心是通過各項(xiàng)合理的運(yùn)維決策,使基礎(chǔ)設(shè)施能夠持續(xù)實(shí)現(xiàn)各自功能,從而為部署在主數(shù)據(jù)中心的應(yīng)用系統(tǒng)提供可靠的外部條件。在基礎(chǔ)設(shè)施協(xié)同運(yùn)行過程中,存在著設(shè)備種類繁多、配置復(fù)雜、維護(hù)保養(yǎng)差異性大等情況,為科學(xué)合理地開展運(yùn)維工作,尤其是在風(fēng)險(xiǎn)面前做出正確決策,提高風(fēng)險(xiǎn)應(yīng)對(duì)能力,風(fēng)險(xiǎn)管理應(yīng)運(yùn)而生。精細(xì)化的基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管控策略,能夠促進(jìn)決策科學(xué)化,降低決策風(fēng)險(xiǎn),提升基礎(chǔ)設(shè)施的安全性、可靠性和穩(wěn)定性。
數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維的全生命周期大致分為建設(shè)轉(zhuǎn)運(yùn)維期、運(yùn)行穩(wěn)定期和磨損老化期三個(gè)階段。每個(gè)運(yùn)維階段存在的主要問題不同,所面臨的運(yùn)維風(fēng)險(xiǎn)也不盡相同。
在建設(shè)轉(zhuǎn)運(yùn)維期,風(fēng)險(xiǎn)主要來自:設(shè)計(jì)、施工質(zhì)量等造成的工程遺留問題;設(shè)備投產(chǎn)后,隨著加載過程變化,設(shè)備性能參數(shù)未能調(diào)試到最佳運(yùn)行模式;圖紙、設(shè)備手冊(cè)等資料不完整或與現(xiàn)場(chǎng)不一致;運(yùn)維管理制度不健全、不系統(tǒng)等。建設(shè)轉(zhuǎn)運(yùn)維期的主要風(fēng)險(xiǎn)整改完成后,會(huì)進(jìn)入運(yùn)行穩(wěn)定期。數(shù)據(jù)中心基礎(chǔ)設(shè)施長(zhǎng)久運(yùn)行后會(huì)不斷老化,部分設(shè)備設(shè)施也會(huì)因磨損等原因接近其使用壽命,此階段的風(fēng)險(xiǎn)主要體現(xiàn)在設(shè)備設(shè)施的性能和可靠性持續(xù)降低。
主數(shù)據(jù)中心基礎(chǔ)設(shè)施ERM風(fēng)險(xiǎn)管理框架包括戰(zhàn)略管理目標(biāo)、風(fēng)險(xiǎn)管理要素和管理層級(jí)三個(gè)維度。
主數(shù)據(jù)中心基礎(chǔ)設(shè)施的戰(zhàn)略管理目標(biāo)分別是合規(guī)、安全、報(bào)告、綠色。其中“合規(guī)”體現(xiàn)在遵守國(guó)家法律法規(guī)以及行業(yè)相關(guān)設(shè)計(jì)、驗(yàn)收、運(yùn)維標(biāo)準(zhǔn)要求;“安全”體現(xiàn)在以保障主數(shù)據(jù)中心基礎(chǔ)設(shè)施整體安全為根本;“報(bào)告”體現(xiàn)在確保風(fēng)險(xiǎn)管理過程可測(cè)量可監(jiān)控;“綠色”體現(xiàn)在以建設(shè)綠色節(jié)能型數(shù)據(jù)中心為目標(biāo)。主數(shù)據(jù)中心基礎(chǔ)設(shè)施的管理層級(jí)包括政府監(jiān)管部門、上級(jí)單位、公司本身和供應(yīng)商,各個(gè)管理層級(jí)在基礎(chǔ)設(shè)施運(yùn)維管理過程中持續(xù)開展風(fēng)險(xiǎn)管理工作,每個(gè)層級(jí)都構(gòu)筑了主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管理的防線。
主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管理八要素包括內(nèi)部環(huán)境、目標(biāo)設(shè)定、風(fēng)險(xiǎn)識(shí)別、風(fēng)險(xiǎn)評(píng)估、風(fēng)險(xiǎn)應(yīng)對(duì)、控制活動(dòng)、信息和交流、監(jiān)控。這八個(gè)要素相互獨(dú)立、相互聯(lián)系又相互制約,共同構(gòu)成了主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管理的有機(jī)整體。
3.2.1內(nèi)部環(huán)境
在開展風(fēng)險(xiǎn)管理工作時(shí),必須對(duì)主數(shù)據(jù)中心所處的內(nèi)部環(huán)境進(jìn)行充分識(shí)別和了解,該環(huán)境是管理并確?;A(chǔ)設(shè)施協(xié)同運(yùn)轉(zhuǎn)、系統(tǒng)穩(wěn)定高效運(yùn)行的前提。內(nèi)部環(huán)境包含:戰(zhàn)略定位及目標(biāo)規(guī)劃、規(guī)章制度要求、服務(wù)內(nèi)容輸出要求、運(yùn)維管理組織架構(gòu)設(shè)計(jì)及人員配置情況等。
3.2.2目標(biāo)設(shè)定
主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維的核心是保證“風(fēng)、火、水、電”等各項(xiàng)設(shè)備設(shè)施功能的正常運(yùn)行,因此按照電氣、暖通、消防、弱電、房建五大專業(yè)以及綜合安全共六個(gè)維度對(duì)風(fēng)險(xiǎn)管理的目標(biāo)設(shè)定進(jìn)行分解,對(duì)每個(gè)專業(yè)或維度進(jìn)一步按其細(xì)分子系統(tǒng)分門別類進(jìn)行風(fēng)險(xiǎn)管理。
3.2.3風(fēng)險(xiǎn)識(shí)別
主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)識(shí)別以行業(yè)內(nèi)外歷史事件經(jīng)驗(yàn)教訓(xùn)、運(yùn)維過程中發(fā)現(xiàn)的問題和內(nèi)外部相關(guān)檢查評(píng)價(jià)報(bào)告為風(fēng)險(xiǎn)分析基礎(chǔ),運(yùn)用定性和定量風(fēng)險(xiǎn)分析相結(jié)合的方法,對(duì)基礎(chǔ)設(shè)施安全現(xiàn)狀以及各專業(yè)系統(tǒng)功能的潛在失效情況,進(jìn)行系統(tǒng)性分析。
定性風(fēng)險(xiǎn)分析:主數(shù)據(jù)中心在設(shè)計(jì)、建造、驗(yàn)收以及運(yùn)維過程中,要嚴(yán)格遵守國(guó)家法律法規(guī)、行業(yè)規(guī)范等相關(guān)要求,采用合規(guī)性檢查的方法,開展內(nèi)部檢查及外部評(píng)測(cè)等工作,對(duì)主數(shù)據(jù)中心基礎(chǔ)設(shè)施相關(guān)環(huán)境、人員、管理等進(jìn)行定性風(fēng)險(xiǎn)分析?;A(chǔ)設(shè)施的現(xiàn)存隱患是合規(guī)性檢查的結(jié)果,輸入內(nèi)容主要包括A級(jí)機(jī)房測(cè)試報(bào)告、消防安全評(píng)估報(bào)告、安全現(xiàn)狀評(píng)價(jià)報(bào)告、運(yùn)維事件資料庫、工程遺留問題清單等。
定量風(fēng)險(xiǎn)分析:主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)行高度自動(dòng)化,過程變量多來自于設(shè)備設(shè)施本身,因此定量風(fēng)險(xiǎn)分析的關(guān)注點(diǎn)在設(shè)備設(shè)施上?;诖颂攸c(diǎn),借鑒運(yùn)用FEMA分析方法,以各專業(yè)系統(tǒng)的關(guān)鍵設(shè)備設(shè)施為主要分析對(duì)象,以其運(yùn)行邏輯為分析主線,用風(fēng)險(xiǎn)賦值的方式進(jìn)行風(fēng)險(xiǎn)分析,剖析設(shè)備設(shè)施功能失效對(duì)系統(tǒng)的影響。其主要分析形式是衡量風(fēng)險(xiǎn)權(quán)重、計(jì)算風(fēng)險(xiǎn)指數(shù)、確定風(fēng)險(xiǎn)等級(jí)及處置原則。
3.2.4風(fēng)險(xiǎn)評(píng)估
根據(jù)定性分析結(jié)果,確定不符合項(xiàng)和建議整改項(xiàng)。根據(jù)定量分析中風(fēng)險(xiǎn)指數(shù)情況,按照風(fēng)險(xiǎn)承受能力、經(jīng)濟(jì)性等原則,進(jìn)行風(fēng)險(xiǎn)等級(jí)劃分,確定應(yīng)對(duì)原則。
本次定性風(fēng)險(xiǎn)評(píng)估共分析出252個(gè)風(fēng)險(xiǎn)點(diǎn),主要體現(xiàn)在主數(shù)據(jù)中心基礎(chǔ)設(shè)施存在的作業(yè)風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)、自然環(huán)境風(fēng)險(xiǎn)、社會(huì)環(huán)境風(fēng)險(xiǎn)、合規(guī)風(fēng)險(xiǎn)、人身安全風(fēng)險(xiǎn)等綜合性風(fēng)險(xiǎn)。其中,作業(yè)風(fēng)險(xiǎn)共147個(gè)風(fēng)險(xiǎn)點(diǎn),主要是人員作業(yè)及巡視存在的問題因素等;管理風(fēng)險(xiǎn)共62個(gè)風(fēng)險(xiǎn)點(diǎn),主要包括運(yùn)維管理制度不健全、操作流程不規(guī)范、標(biāo)識(shí)標(biāo)簽不完善等;合規(guī)風(fēng)險(xiǎn)共18個(gè)風(fēng)險(xiǎn)點(diǎn),主要是設(shè)計(jì)、建設(shè)階段造成的工程遺留問題;人身安全風(fēng)險(xiǎn)共12個(gè)風(fēng)險(xiǎn)點(diǎn),主要是火災(zāi)、跌落、觸電等;社會(huì)環(huán)境風(fēng)險(xiǎn)共8個(gè)風(fēng)險(xiǎn)點(diǎn),主要是恐襲、治安、外部停水?dāng)嚯姷龋蛔匀画h(huán)境風(fēng)險(xiǎn)共5個(gè)風(fēng)險(xiǎn)點(diǎn),主要是地震、強(qiáng)風(fēng)、極寒天氣等。
本次定量風(fēng)險(xiǎn)評(píng)估共分析出759個(gè)風(fēng)險(xiǎn)點(diǎn),其中中等以上風(fēng)險(xiǎn)點(diǎn)88個(gè),主要體現(xiàn)在主數(shù)據(jù)中心基礎(chǔ)設(shè)施存在的部分技術(shù)和質(zhì)量風(fēng)險(xiǎn)。電氣系統(tǒng)風(fēng)險(xiǎn)主要包括設(shè)備自身絕緣、斷路器可靠性等;暖通系統(tǒng)風(fēng)險(xiǎn)主要包括各類蝶閥、浮球閥是否正常等;消防系統(tǒng)風(fēng)險(xiǎn)主要包括FAS報(bào)警主機(jī)或氣體滅火控制盤誤動(dòng)作、閥門銹蝕導(dǎo)致無法打開等;弱電系統(tǒng)風(fēng)險(xiǎn)點(diǎn)主要包括DCIM系統(tǒng)不定期掉線、BAS系統(tǒng)自動(dòng)控制穩(wěn)定性差等;房建系統(tǒng)風(fēng)險(xiǎn)主要包括防屋面水層破損造成雨水滲入機(jī)房、屋面馬道或爬梯等銹蝕造成人身傷害等。
依照以上風(fēng)險(xiǎn)評(píng)估情況,對(duì)主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維整體風(fēng)險(xiǎn)情況進(jìn)行分析匯總,得出風(fēng)險(xiǎn)分布情況如圖1所示。
圖1 主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維整體風(fēng)險(xiǎn)分布情況
3.2.5風(fēng)險(xiǎn)應(yīng)對(duì)
依據(jù)風(fēng)險(xiǎn)分析結(jié)果,梳理風(fēng)險(xiǎn)應(yīng)對(duì)原則和措施,明確改進(jìn)問題方向。應(yīng)對(duì)措施主要從管理措施、工程技術(shù)措施、個(gè)人防護(hù)措施和風(fēng)險(xiǎn)轉(zhuǎn)嫁措施等四方面進(jìn)行制定?;诒敬物L(fēng)險(xiǎn)分析結(jié)果,考慮采取標(biāo)準(zhǔn)化運(yùn)維、定期維保、日常值班巡檢、集中監(jiān)控、人員培訓(xùn)、搭建運(yùn)維平臺(tái)等方式進(jìn)行優(yōu)化。
3.2.6控制活動(dòng)
風(fēng)險(xiǎn)控制活動(dòng)的核心是建立主數(shù)據(jù)中心基礎(chǔ)設(shè)施風(fēng)險(xiǎn)管理體系,明確管理核心及目標(biāo),識(shí)別風(fēng)險(xiǎn)點(diǎn),明確責(zé)任人及應(yīng)對(duì)措施。同時(shí),將風(fēng)險(xiǎn)管理理念的實(shí)施由點(diǎn)到面滲透,培養(yǎng)員工風(fēng)險(xiǎn)意識(shí)和行為習(xí)慣,重視經(jīng)驗(yàn)積累,定期評(píng)審風(fēng)險(xiǎn)管理情況,建立長(zhǎng)期運(yùn)行機(jī)制。
3.2.7信息溝通
通過定期檢查、定期召開安全生產(chǎn)例會(huì)等形式分析當(dāng)前運(yùn)維情況,更新風(fēng)險(xiǎn)識(shí)別評(píng)價(jià)表,跟蹤計(jì)劃執(zhí)行情況。通過安全教育、技術(shù)培訓(xùn)將風(fēng)險(xiǎn)管理工作落實(shí)到執(zhí)行層,確保全員參與。
3.2.8監(jiān)控
堅(jiān)持對(duì)風(fēng)險(xiǎn)管理工作進(jìn)行持續(xù)性管理審計(jì)和風(fēng)險(xiǎn)監(jiān)控。監(jiān)控的范圍從風(fēng)險(xiǎn)管理制度本身到執(zhí)行過程,從宏觀到局部。改進(jìn)評(píng)估制度的適用性,并進(jìn)行風(fēng)險(xiǎn)管理經(jīng)驗(yàn)復(fù)盤。
建設(shè)轉(zhuǎn)運(yùn)維期,通過系統(tǒng)性的風(fēng)險(xiǎn)管理,及早識(shí)別并處置工程遺留問題、設(shè)備功能調(diào)試、圖紙資料欠缺、制度流程不完善等問題,促使主數(shù)據(jù)中心基礎(chǔ)設(shè)施提早進(jìn)入穩(wěn)定運(yùn)行階段。穩(wěn)定運(yùn)行期,通過對(duì)規(guī)章制度流程、設(shè)備維護(hù)保養(yǎng)、人員技能培訓(xùn)、例行巡檢等運(yùn)維過程的風(fēng)險(xiǎn)管理,不斷優(yōu)化完善,持續(xù)改進(jìn),從而延長(zhǎng)主數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維生命周期。磨損老化期,通過對(duì)設(shè)備設(shè)施運(yùn)行性能的風(fēng)險(xiǎn)分析,能夠提早發(fā)現(xiàn)設(shè)備設(shè)施故障發(fā)生前的征兆,進(jìn)行提前預(yù)警,避免突然的運(yùn)行中斷。
風(fēng)險(xiǎn)管理是一個(gè)動(dòng)態(tài)變化的過程,外部條件的變化或分析對(duì)象自身的變化,都可能需要重新進(jìn)行風(fēng)險(xiǎn)評(píng)估。通過定期評(píng)估、觸發(fā)式評(píng)估等方式,對(duì)風(fēng)險(xiǎn)管控措施進(jìn)行緊密跟蹤、及時(shí)完善、確保落實(shí),形成PDCA的持續(xù)改進(jìn)風(fēng)險(xiǎn)管理機(jī)制。
根據(jù)鄧寧-克魯格效應(yīng):“人在能力不足時(shí),作出的判斷往往是不周全的結(jié)論,但是人又無法正確認(rèn)識(shí)到自身的能力不足,來辨別這種錯(cuò)誤的行為,這種現(xiàn)象是一種認(rèn)知偏差?!币虼?,隨著人員的經(jīng)驗(yàn)不斷積累和技術(shù)能力不斷提升,對(duì)運(yùn)維風(fēng)險(xiǎn)點(diǎn)的分析也必將是一個(gè)周而復(fù)始、持續(xù)提升的過程。
[1]施衛(wèi)忠. 鐵路數(shù)據(jù)中心建設(shè)與規(guī)劃研究[J]. 中國(guó)鐵路,2021(01).
[2]楊陽,李印,孫麗玫,等. 數(shù)據(jù)中心基礎(chǔ)設(shè)施認(rèn)證體系研究綜述[J]. 工程建設(shè)標(biāo)準(zhǔn)化,2020(01).
[3]周平春. 數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)的規(guī)劃階段管理分析[J]. 工程建設(shè)(重慶),2020(06).
[4]朱林,李程貴,侯曉雯. 超大型數(shù)據(jù)中心基礎(chǔ)設(shè)施全生命周期維護(hù)模式的研究與應(yīng)用[J]. 信息通信,2019(09).
中國(guó)國(guó)家鐵路集團(tuán)有限公司科研項(xiàng)目專項(xiàng)基金(N2019S009)
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2021年11期