魏 豐,操張進(jìn),程 炎,吳傳杰
(中國移動通信集團安徽有限公司,安徽 合肥 230009)
政務(wù)云成為重要的新型信息基礎(chǔ)設(shè)施,承載著各類關(guān)鍵的民生、政務(wù)類應(yīng)用及數(shù)據(jù),其規(guī)劃、建設(shè)、運維、服務(wù)、安全管理標(biāo)準(zhǔn)遠(yuǎn)高于傳統(tǒng)云平臺。三大電信運營商近年來全向發(fā)力政務(wù)云業(yè)務(wù),目前市場占比37.6%。如何應(yīng)對政務(wù)云運行中的行業(yè)安全風(fēng)險,探索和統(tǒng)一安全運維標(biāo)準(zhǔn),提升資源池的整體安全穩(wěn)定性,以及如何統(tǒng)籌管理分散于各地區(qū)的云資源池,優(yōu)化貫通業(yè)務(wù)與運維的流程和系統(tǒng),提升運維響應(yīng)與接維效率,成為運營商云改過程中迫切需要解決的內(nèi)在訴求與難點。安徽移動探索與建立了省市一體化的政務(wù)云運維支撐體系,全面提升政務(wù)云的安全管理與服務(wù)水平,支持行業(yè)云的發(fā)展。
做好平臺性能與客戶需求的數(shù)據(jù)收集與匹配,針對電子政務(wù)系統(tǒng)業(yè)務(wù)架構(gòu)類型多、需求多樣化的問題:
面向業(yè)務(wù)前端,建立業(yè)務(wù)上云需求信息對接機制,制定通用云上業(yè)務(wù)場景匹配與資源評估表,重點從資源、性能、功能及應(yīng)用結(jié)構(gòu)等方面協(xié)助業(yè)務(wù)支撐部門收集上云業(yè)務(wù)的特點及業(yè)務(wù)量數(shù)據(jù),合理評估資源池承載能力,提前協(xié)調(diào)準(zhǔn)備資源工程并開展業(yè)務(wù)平臺適配工作。
面向平臺自身,梳理平臺服務(wù)目錄、產(chǎn)品能力及兼容性信息。獨立部署生產(chǎn)測試環(huán)境,重點針對平臺性能,搭建模擬化的客戶業(yè)務(wù)場景,從公網(wǎng)、平臺內(nèi)網(wǎng)兩大場景,針對不同網(wǎng)絡(luò)層次開展端到端性能壓力測試,收集驗證云平臺關(guān)鍵網(wǎng)元的不同場景下的業(yè)務(wù)適配性能指標(biāo)數(shù)據(jù)。
面向客戶側(cè),關(guān)注業(yè)務(wù)上云的條件與工具手段,針對早期的煙囪式架構(gòu)客戶,提供云平臺兼容性數(shù)據(jù),輔助客戶進(jìn)行業(yè)務(wù)改造;對于無需改造的業(yè)務(wù)架構(gòu),例如客戶側(cè)無遷云團隊的情況,提供CloudBus 等集成商遷云工具輔助客戶遷云。
面向內(nèi)部做好響應(yīng)標(biāo)準(zhǔn)落地與跨部門的工程及業(yè)務(wù)流程對接,面向客戶做好業(yè)務(wù)資源發(fā)放、配置變更收集與業(yè)務(wù)上線測試工作。
制定云資源申請、變更及回收流程處理時限指標(biāo),提升流程響應(yīng)支撐效率。拉通與數(shù)據(jù)中心管理系統(tǒng)、信息備案系統(tǒng)與監(jiān)控平臺的流程,編制云產(chǎn)品配置信息收集表,在上云過程中實現(xiàn)網(wǎng)絡(luò)訪問及產(chǎn)品策略、域名及服務(wù)信息備案、業(yè)務(wù)告警監(jiān)控閾值的統(tǒng)一收集與配置,提升關(guān)聯(lián)服務(wù)支撐效率。配合客戶執(zhí)行業(yè)務(wù)上線測試,同步關(guān)注功能性與安全性,強制執(zhí)行應(yīng)用及系統(tǒng)漏洞掃描與基線檢查。
確保業(yè)務(wù)穩(wěn)定運行,重點關(guān)注運行監(jiān)控、可用性與應(yīng)急保障。
業(yè)務(wù)運行監(jiān)控層面,除運營商負(fù)責(zé)的云及安全設(shè)施、網(wǎng)絡(luò)鏈路、系統(tǒng)平臺層面的性能及容量的巡檢與監(jiān)控以外,針對客戶業(yè)務(wù)層面的運行狀態(tài),建立與引入全流量鏡像分析工具,觀察匹配業(yè)務(wù)端口,實時關(guān)注會話質(zhì)量;針對頁面類的應(yīng)用,協(xié)同客戶收集訪問目標(biāo)鏈接及應(yīng)用地址,統(tǒng)籌利用三網(wǎng)(移動、電信、聯(lián)通)撥測探針模擬客戶端執(zhí)行主動撥測,確保端到端監(jiān)控。
數(shù)據(jù)及業(yè)務(wù)可用性上,定期針對云上客戶執(zhí)行可用性風(fēng)險評估,依據(jù)客戶使用的云產(chǎn)品類型、業(yè)務(wù)架構(gòu)、保障需求、容量性能監(jiān)控數(shù)據(jù),結(jié)合資源池的能力,面向業(yè)務(wù)前端研究制訂與推薦優(yōu)化方案,協(xié)助業(yè)務(wù)的可用性提升與持續(xù)發(fā)展。面向客戶,梳理建立通知與發(fā)布的流程規(guī)則,確保信息通報與各類服務(wù)、故障、可用性、安全等報告的質(zhì)量、時效與合規(guī)性。
應(yīng)急與保障方面,根據(jù)上云業(yè)務(wù)特點,制定與匹配覆蓋硬件、網(wǎng)絡(luò)、系統(tǒng)、存儲及安全層面的應(yīng)急保障流程,協(xié)同業(yè)務(wù)側(cè)開展可用性應(yīng)急演練,定制與落實運維作業(yè)計劃,指定告警、客戶需求與投訴的響應(yīng)時限,確保問題需求的實時處置和清零。
除滿足政務(wù)行業(yè)所需的網(wǎng)絡(luò)安全等級保護2.0標(biāo)準(zhǔn)外,以ISO27001體系為基礎(chǔ),CSASTAR 為主體,融合ISO27018數(shù)據(jù)隱私保護及ISO20000服務(wù)管理標(biāo)準(zhǔn)構(gòu)建云上安全管理框架,確保安全管理覆蓋基礎(chǔ)環(huán)境、云上設(shè)施、數(shù)據(jù)接口、人員操作及應(yīng)用服務(wù)等各環(huán)節(jié)。
整體通過態(tài)勢感知系統(tǒng),匯集資源池主機、網(wǎng)絡(luò)及安全等全網(wǎng)元日志信息,實現(xiàn)云上安全統(tǒng)一態(tài)勢分析、安全信息預(yù)警與安全聯(lián)動處置。
(1)人員管理方面:運維人員上崗前執(zhí)行安全意識宣貫與培訓(xùn),通過安全考核并簽署安全生產(chǎn)及數(shù)據(jù)隱私保密條款;重要崗位配備AB 角,定期執(zhí)行交叉培訓(xùn)與職責(zé)輪換,降低人員安全風(fēng)險。
(2)設(shè)備管理層面:云上設(shè)備全量接入4A 管控平臺,通過角色授權(quán)機制,確保權(quán)限最小化分配。針對特權(quán)賬戶及重要設(shè)備,定期執(zhí)行操作與日志的安全審計。采取默認(rèn)拒絕原則,嚴(yán)格限制訪問目標(biāo)及路徑,實現(xiàn)數(shù)據(jù)訪問的精細(xì)化管控。
(3)操作與作業(yè)管理上:基于風(fēng)險的評估,制定云上維護操作分級分類表。針對不同級別的操作,規(guī)定特定的執(zhí)行時段、流程與標(biāo)準(zhǔn):重要變更配置類操作要求提供標(biāo)準(zhǔn)化的計劃、執(zhí)行與回滾方案,通過正式流程申請操作時間窗口,經(jīng)過技術(shù)及管理側(cè)評審授權(quán)后方可進(jìn)行,執(zhí)行時要求一人操作一人審核,完成后進(jìn)行業(yè)務(wù)驗證、信息發(fā)布與歸檔閉環(huán);普通維護類操作通過簡化流程記錄、執(zhí)行與歸檔,以兼顧安全合規(guī)與運維效率。落實平臺運行健康檢查,常態(tài)化執(zhí)行云上業(yè)務(wù)及系統(tǒng)漏洞與配置掃描,開展?jié)B透測試,向業(yè)務(wù)側(cè)推送安全報告及預(yù)警通知,確保云上安全防御水平。常態(tài)化開展安全及故障推演,挖掘與分析云上風(fēng)險點及影響范圍,針對性地制定應(yīng)急響應(yīng)與處置措施。
(1)統(tǒng)一云資源:制定標(biāo)準(zhǔn)資源目錄與資源拓補框架,對接地市資源池,將多池的硬件設(shè)備、云基礎(chǔ)設(shè)施、云產(chǎn)品、業(yè)務(wù)以及賬號等資源信息進(jìn)行整合、分析與呈現(xiàn)。同時北向與集團云網(wǎng)平臺互通,實現(xiàn)省內(nèi)政務(wù)云資源的上報與網(wǎng)資源信息的獲取同步功能。
(2)統(tǒng)一云告警與性能庫:實現(xiàn)個體設(shè)備與資源池級別的告警及運行監(jiān)控數(shù)據(jù)的匯聚、分析、處理與呈現(xiàn),解決了各政務(wù)云資源池部分三方安全設(shè)備的告警及監(jiān)控數(shù)據(jù)無法集中管理的問題。充分利用運營商優(yōu)勢,北向?qū)邮〖壉O(jiān)控中心,形成省市二級監(jiān)控保障機制。
(3)統(tǒng)一云運營管控:北向連接云網(wǎng)中心、業(yè)務(wù)工單系統(tǒng),提供資源容量上報及云業(yè)務(wù)流聯(lián)通,南向?qū)痈髟瀑Y源池進(jìn)行云業(yè)務(wù)編排,實現(xiàn)云上業(yè)務(wù)全生命周期管理。提供業(yè)務(wù)視圖,實現(xiàn)業(yè)務(wù)容量、用量計量的統(tǒng)一管理。提供運營分析與服務(wù)報告,綜合提升用戶感知。
(4)統(tǒng)一運維管理:推進(jìn)省市運維協(xié)同。融合ITIL管理框架,實現(xiàn)云平臺性能、容量、質(zhì)量、安全、故障、服務(wù)、投訴事件及問題的快速響應(yīng)與流程化處置;實現(xiàn)工程、操作、配置及作業(yè)的規(guī)范化審核、執(zhí)行、歸檔與審計。
(5)統(tǒng)一客戶服務(wù)入口:建立客戶自服務(wù)門戶,作為傳統(tǒng)熱線與郵箱的補充手段,為云上客戶提供便捷、安全、多樣化的服務(wù)入口與信息交互渠道。開放云業(yè)務(wù)運營視圖、云產(chǎn)品自動化運維與配置變更、問題投訴的辦理窗口,提升業(yè)務(wù)上云后的服務(wù)效率。安徽移動自2020年政務(wù)云省市一體化運維支撐體系推行以來,已陸續(xù)應(yīng)用于安徽省級政務(wù)云以及包含合肥、滁州等5個地市政務(wù)云資源池。面向客戶,為安康碼、網(wǎng)上政務(wù)等在內(nèi)的100余重要民生及政務(wù)應(yīng)用提供了安全穩(wěn)定的運行環(huán)境、標(biāo)準(zhǔn)統(tǒng)一的運維支撐服務(wù)。面向內(nèi)部,解決了云改過程中政務(wù)云服務(wù)支撐過度集中省公司的問題,極速提升地市級政務(wù)云高效平穩(wěn)接維能力,有效提高面向客戶及業(yè)務(wù)的服務(wù)支撐能力,云上業(yè)務(wù)安全閉環(huán)處置效率大幅增強。
綜上所述,文中運維支撐體系面向運營商省市政務(wù)云資源池統(tǒng)一化納管、建設(shè)與維護場景,從客戶服務(wù)支撐、云上安全構(gòu)建與平臺手段建設(shè)三個方面,提供高效的服務(wù)支撐與安全運維管理框架體系,助力運營商云改戰(zhàn)略落地,為運營商政務(wù)云建設(shè)運營提供實踐案例。后續(xù)將重點圍繞云網(wǎng)協(xié)同,探索云平臺智能化運維管理與服務(wù)支撐手段,持續(xù)提升云智能化運維、一體化支撐、端到端安全管控能力。