摘 ?要:基于中國電信集中MSS系統(tǒng)運營維護背景,規(guī)范運營操作,從權限最小化控制、操作和審核權限分離控制、高危操作自動阻斷控制、敏感數(shù)據(jù)表訪問權限控制和操作記錄日志審計控制出發(fā),分析數(shù)據(jù)維護審計平臺的總體設計思路,并對系統(tǒng)技術架構進行分析,最后從日常操作模塊和日志管理模塊入手,簡要說明了系統(tǒng)功能架構和實踐成效,以期為相關單位提供借鑒。
關鍵詞:IT運營;數(shù)據(jù)維護;審計
中圖分類號:TP391 ? ? 文獻標識碼:A 文章編號:2096-4706(2021)06-0115-04
Design and Application of Data Maintenance Audit Platform
——Take Operation in IT industry of China Telecom as an Example
ZHANG Xiaofeng
(China Telecom MSS Centralized Operation Jiangsu Support Center,Nanjing ?210037,China)
Abstract:Based on the operation and maintenance background of the centralized MSS system of China Telecom,standardize operation,starting from permission minimization control,operation and audit permission separation control,high risk operation automatic blocking control,access permission control of sensitive data sheet,audit control of operation log,analyze the overall design idea of data maintenance audit platform,and analyze the system technical architecture. Finally,starting with the daily operation module and log management module,briefly explain the system functional architecture and practical results,in order to provide reference for relevant units.
Keywords:IT operation;data maintenance;audit
0 ?引 ?言
中國電信集中MSS系統(tǒng)是全國范圍內建立的一個集中、規(guī)范、統(tǒng)一的管理支撐系統(tǒng)。通過統(tǒng)一透明的數(shù)據(jù)規(guī)范促進企業(yè)內部數(shù)據(jù)、信息的共享以及集中管理;通過及時、準確、透明的業(yè)務管理報告有效滿足對外信息披露和對內管理控制的要求;通過提供更加準確的成本、收益等信息,為實現(xiàn)管理數(shù)字化夯實基礎;通過建立集團級企業(yè)管理信息數(shù)據(jù)倉庫、總裁桌面,為業(yè)務部門和管理層提供實時準確的業(yè)務和決策支持信息[1]。為規(guī)范支撐該大型集中IT系統(tǒng)的運營,已建立標準的數(shù)據(jù)維護流程,由用戶在集團ITSM系統(tǒng)上發(fā)起數(shù)據(jù)維護工單申請,經業(yè)務部門及IT主管審批同意后,工單最終流轉至二線運維顧問進行處理。數(shù)據(jù)維護內容涉及更改業(yè)務數(shù)據(jù)及狀態(tài)、導出導入數(shù)據(jù)及檢查核對數(shù)據(jù)等。通過搭建數(shù)據(jù)維護審計平臺,一方面滿足日常數(shù)據(jù)維護作業(yè)需求,另一方面提升IT系統(tǒng)運營效率及整體運維管理水平[2]。
1 ?建設背景
中國電信集中MSS系統(tǒng)運營維護階段,除了滾動業(yè)務需求開發(fā)及系統(tǒng)問題修復外,大多為日常運營維護事項,其中數(shù)據(jù)維護又是比較經常且比較重要的維護事項,包括數(shù)據(jù)修改、數(shù)據(jù)查詢統(tǒng)計、數(shù)據(jù)提取。現(xiàn)系統(tǒng)在數(shù)據(jù)維護方面雖然已經嚴格控制必須通過堡壘機操作,但仍存在以下幾個問題:
(1)維護人員多,維護權限不清晰。
(2)維護操作審核規(guī)則不足,規(guī)則調整不靈活,存在數(shù)據(jù)違規(guī)修改風險。
(3)維護操作事后審計不足,結合現(xiàn)有的堡壘機訪問日志,追溯審計耗時費力。
(4)需要維護的數(shù)據(jù)庫節(jié)點多,維護效率低。
(5)缺少前臺可視化、可配置化維護平臺。
這些問題對于IT系統(tǒng)的整體運營存在一定風險,需要進行優(yōu)化處理。
2 ?建設目標
通過搭建數(shù)據(jù)維護審計平臺,做到事前預防,事中控制及事后溯源,從而來全面解決企業(yè)的IT系統(tǒng)運維安全問題,進行提高企業(yè)的IT運維管理水平。
系統(tǒng)總體架構如圖1所示。
3 ?設計思路
3.1 ?權限最小化控制
梳理數(shù)據(jù)庫維護權限視圖,最小化使用原則,權限做到“三權分立”[3],通過限制對數(shù)據(jù)資產的訪問操作,防止非法用戶的侵入、用戶越權、合法用戶的不慎操作而造成的數(shù)據(jù)泄露、篡改、損毀,保證數(shù)據(jù)資產受控地、合法地使用。分別為:
(1)開發(fā)運維式支撐權限。使用者:支撐運維的開發(fā)人員。權限范圍:具有數(shù)據(jù)庫表數(shù)據(jù)增、刪、改、查權限,具有數(shù)據(jù)庫視圖、函數(shù)、存儲過程對象的執(zhí)行、調試權限,具有創(chuàng)建備份表權限。使用場景:處理數(shù)據(jù)維護單、生產數(shù)據(jù)庫對象問題跟蹤調試。
(2)數(shù)據(jù)維護類權限。使用者:運維人員。權限范圍:具有數(shù)據(jù)庫表數(shù)據(jù)增、刪、改、查權限,具有數(shù)據(jù)庫視圖查詢權限,具有數(shù)據(jù)庫函數(shù)執(zhí)行權限。使用場景:生產數(shù)據(jù)維護。
(3)運維查詢類權限。使用者:需求、測試人員。權限范圍:具有數(shù)據(jù)庫表查詢權限,具有數(shù)據(jù)庫視圖查詢權限,具有數(shù)據(jù)庫函數(shù)執(zhí)行權限。使用場景:生產數(shù)據(jù)查詢、核對確認及導出。
3.2 ?操作、審核權限分離控制
風險操作控制規(guī)則增加調整流程:針對系統(tǒng)核心配置調整,如敏感數(shù)據(jù)表管理、核心操作管理,由配置人員完成配置后提交審核主管審核后才可生效。
風險操作審批流程:首先,運營支撐人員因統(tǒng)計取數(shù)、批量業(yè)務操作需要進行客戶敏感信息查詢、變更操作時必須有業(yè)務管理部門審批通過的ITSM工單,并經過運營主管審核。其次,運營支撐人員因系統(tǒng)維護需要進行客戶敏感信息的數(shù)據(jù)遷移(包括數(shù)據(jù)導入、導出、備份)時,必須填寫操作申請ITSM工單,并經過運營主管審核[4]。
3.3 ?高危操作自動阻斷控制
非訪問權限內的數(shù)據(jù)禁止訪問:運營支撐人員操作過程中如訪問權限范圍外的敏感數(shù)據(jù),系統(tǒng)自動阻斷攔截操作命令,系統(tǒng)記錄操作記錄送管理員審計。
DDL操作自動攔截阻斷:針對系統(tǒng)配置的核心數(shù)據(jù)表,如運營支撐人員的操作中涉及create、drop、truncate等DDL操作,如運營支撐人員進行超閾值大批量更新等操作,系統(tǒng)自動阻斷攔截操作命令,系統(tǒng)記錄操作記錄送管理員審計。
3.4 ?敏感數(shù)據(jù)表訪問權限控制
將數(shù)據(jù)庫中的各類表分別敏感級、較敏感級、低敏感級,并為每個級別配置可訪問的系統(tǒng)角色。
3.5 ?操作記錄日志審計控制
對所有的增、刪、改類SQL操作,記錄日志,記錄操作人、操作IP、MAC地址、操作時間及操作內容關鍵信息。
系統(tǒng)根據(jù)審計模型自動生成審計預警事件,由管理員進行預警確認,主要預警場景舉例為:
(1)非工作時間段訪問審計:建立賬號的用戶畫像和登錄時間基線,業(yè)務系統(tǒng)使用情況識別非工作時間登錄或敏感操作行為的賬號。
(2)共享賬號審計:通過對賬號登錄數(shù)據(jù)的監(jiān)控,可發(fā)現(xiàn)賬號共享情況,管控不規(guī)范的運維操作行為。
(3)敏感操作非授權訪問審計:針對非授權范圍內的操作命令進行預警。
4 ?系統(tǒng)技術架構
數(shù)據(jù)庫維護審計平臺為基于J2EE的B/S開發(fā)技術架構,采用前后端分離技術架構,前端為HTML頁面+JavaScript,后端為SpringBoot應用。系統(tǒng)采用Oracle關系型數(shù)據(jù)庫作為持久化存儲,采用Redis KEY-VALUE組件作為緩存,采用FTP服務器作為文件類數(shù)據(jù)存儲,采用Tomcat作為應用中間件,可適配在虛擬化主機或Docker容器下部署應用。系統(tǒng)技術架構分為應用/展示層、存儲層、處理層、數(shù)據(jù)交換層、采集層、資源層等六層:應用/展示層最貼近用戶,承載了靜態(tài)頁面、樣式和腳本;存儲層將業(yè)務、流程、日志等結構化信息存儲在Oracle,將常用的配置和權限數(shù)據(jù)緩存在Redis,可提升數(shù)據(jù)交互的效率,同時降低Oracle的壓力;處理層主要包含了校驗引擎、權限引擎、流程引擎、日志處理等公共能力;數(shù)據(jù)交換層實現(xiàn)信息數(shù)據(jù)的共享,可選的服務有PI系統(tǒng)、接口平臺等;采集層主要通過ETL工具對操作日志、接口日志、數(shù)據(jù)庫日志等數(shù)據(jù)進行采集;資源層包括服務器、軟件資源、應用模塊等,通過網絡為應用系統(tǒng)提供硬件支持[5]。系統(tǒng)通過統(tǒng)一認證協(xié)議實現(xiàn)門戶單點登錄集成,訪問請求采用LVS+Nginx方式實現(xiàn)負載均衡,系統(tǒng)集成關系如圖2所示。
5 ?系統(tǒng)功能架構
系統(tǒng)主要分為日常操作、日志管理及系統(tǒng)管理3大模塊,功能架構圖如圖3所示。
5.1 ?日常操作模塊
日常操作模塊主要包括數(shù)據(jù)源切換、數(shù)據(jù)事務管理、數(shù)據(jù)導入導出、數(shù)據(jù)檢索合并、風險事務提醒/攔截、SQL日志埋點/記錄6個方面:
(1)數(shù)據(jù)源切換。支持按Database及Schema維度切換到不同數(shù)據(jù)庫實例以及不同數(shù)據(jù)庫,列表化顯示所有納管數(shù)據(jù)庫,并能根據(jù)所選數(shù)據(jù)庫自動級聯(lián)顯示該庫下的所有Schema。
(2)數(shù)據(jù)事務管理。支持事務的回滾及提交確認操作,實現(xiàn)類似C/S客戶端工具功能。
(3)數(shù)據(jù)導出導入。支持單庫、單表數(shù)據(jù)導出操作,支持多庫同表數(shù)據(jù)合并導出操作,支持在前臺化導入Excel數(shù)據(jù)。
(4)數(shù)據(jù)檢索合并。支持對多庫同表數(shù)據(jù)進行檢索后合并,以Grid表格方式顯示,支持分頁。
(5)風險事務攔截/提醒。支持對高風險的Drop表及Truncate表數(shù)據(jù)進行攔截阻止,并記錄日志。
(6)SQL日志埋點/記錄。支持記錄SQL運行時長,支持對數(shù)據(jù)更改操作類SQL語句附加強制記錄ITSM單據(jù)號來源信息。
5.2 ?日志管理模塊
日志管理模塊包含操作日志查詢和風險日志查詢兩塊功能:
(1)操作日志查詢。支持按省份范圍、日期范圍、特定操作人、特定業(yè)務類型等維度進行運維日志查詢。
(2)風險日志查詢。支持按省份范圍、日期范圍、特定操作人、特定業(yè)務類型等維度進行風險日志查詢。
5.3 ?系統(tǒng)管理模塊
系統(tǒng)管理模塊主要包括組織人員配置、角色權限配置、數(shù)據(jù)源配置:
(1)組織人員配置。支持前臺化維護組織、人員基礎數(shù)據(jù),支持人員狀態(tài)信息修改(有效、無效)等。
(2)角色權限配置。支持定義角色及權限,支持按角色配置查詢類操作或運維更新類操作權限,支持按模塊關聯(lián)配置涉及系統(tǒng)以及省份庫權限。
(3)數(shù)據(jù)源配置。支持前臺化配置納管數(shù)據(jù)庫信息,支持對數(shù)據(jù)庫敏感配置非明文顯示。
6 ?實踐成效
通過該數(shù)據(jù)維護審計平臺的應用,不但提升了中國電信集中MSS運營的規(guī)范性,防范了運營風險,還提升了運營效率,主要包括以下幾點成效:
(1)實現(xiàn)運營維護事前控制:規(guī)范了運維授權,實現(xiàn)權限最小化,已完成某專業(yè)IT系統(tǒng)23人權限管理,其中開發(fā)維護權限6人,數(shù)據(jù)庫維護權限7人,運維查詢權限10人,全年支撐數(shù)據(jù)運維類需求2 000余單,未出現(xiàn)非授權訪問,防范了運維操作風險,系統(tǒng)權限配置頁面如圖4所示。
(2)實現(xiàn)運營維護過程中控制、阻斷:全年實現(xiàn)未授權訪問阻斷10次,高危操作阻斷1次,有效確保了數(shù)據(jù)安全,執(zhí)行操作頁面如圖5所示。
(3)實現(xiàn)運營效率提升:在運營過程中,實現(xiàn)應用多節(jié)點數(shù)據(jù)庫一點申請,并行處理,如圖6所示。批量統(tǒng)計類工作提升效率超50%。
(4)實現(xiàn)運營操作審計能力提升:全年實現(xiàn)各類運營審計200余次,保障了運營操作合規(guī)可控。
7 ?結 ?論
數(shù)據(jù)維護是企業(yè)IT系統(tǒng)日常運營的主要事項之一,傳統(tǒng)的數(shù)據(jù)庫維護方式存在數(shù)據(jù)庫用戶共用,維護操作缺乏審核,維護風險極大,需要借助系統(tǒng)平臺實現(xiàn)事前預防、事中控制和事后溯源數(shù)據(jù)庫運維操作的全生命周期管理,全面解決企業(yè)的運維安全問題,進而達到提高企業(yè)的IT運維管理水平,降低可能存在的數(shù)據(jù)泄漏、越權訪問及數(shù)據(jù)誤操作等風險目標。集中MSS為全國性集中IT系統(tǒng),涉及大量企業(yè)生產關鍵數(shù)據(jù),尤其需要實現(xiàn)運維授權管理、運維風險管控、運維安全審計。該系統(tǒng)可推廣至各領域IT系統(tǒng)運營維護中,提升運營的規(guī)范性和安全性。
參考文獻:
[1] 蓋國強.Oracle DBA手記4:數(shù)據(jù)安全警示錄 [M].北京:電子工業(yè)出版社,2019.
[2] 程小丹,李崇輝,曹潔,等.從運維菜鳥到大咖,你還有多遠:數(shù)據(jù)中心設施運維指南 [M].北京:電子工業(yè)出版社,2016.
[3] 何偉娜,常建功.Oracle數(shù)據(jù)庫管理與維護實戰(zhàn) [M].北京:人民郵電出版社,2014.
[4] 李真,孫雙林,張優(yōu)敏,等.Oracle數(shù)據(jù)庫管理與開發(fā) [M].重慶:重慶大學出版社,2019.
[5] 彭燦華,韋曉敏,魏士偉.J2EE項目開發(fā)與設計:第2版 [M].北京:中國鐵道出版社,2016.
作者簡介:張曉峰(1985.03—),男,漢族,江蘇興化人,通信工程師,工學學士,研究方向:IT系統(tǒng)運營、網絡與信息安全。