周一波+++陳捷
【 摘 要 】 隨著云時代的到來,金融集團數(shù)據(jù)中心產(chǎn)生了重大變化,一是所有IT資源均是以服務(wù)的形式提供給用戶;二是IT資源變得龐大,通過人工方式難以實現(xiàn)安全高效的運維管理;三是產(chǎn)生了大量的虛擬化IT基礎(chǔ)資源,如虛擬機、容器、SDN網(wǎng)絡(luò)、分布式存儲,資源需進行靈活調(diào)配。針對以上問題,文章設(shè)計了金融集團云數(shù)據(jù)中心營運支撐平臺,用于云計算環(huán)境下的金融集團數(shù)據(jù)中心安全運行及統(tǒng)一調(diào)度管理。
【 關(guān)鍵詞 】 云計算;云支撐平臺;安全運維
Cloud Computing Datacenter Operation and Management System Platform Design for Financial Group
Zhou Yi-bo Chen Jie
(1.State Grid Yingda International Holdings Co.,ltd. Beijing 100005;
2.Beijing Huitong Financial Information Technology Co.,ltd. Beijing 100053)
【 Abstract 】 There are three significant changes of data center of financial group with the advent of the era of the cloud computing.First, all IT resources are given in the form of services to users; Second, IT resources scale becoming large, by artificial way is difficult to achieve safe and efficient operations management; Third, virtualization resourcessuchas virtual machine, containers, SDN network, distributed storage need flexible deployment on demand. We designed a kind ofcloud computing datacenter operation and management system platform for safe operation and unified management in financial group computing data center.
【 Keywords 】 cloud computing;virtualization resources operation;safe management
1 引言
在云環(huán)境下金融集團數(shù)據(jù)中心存在四個主要特點:一是業(yè)務(wù)復(fù)雜、業(yè)務(wù)安全性要求高;二是IT基礎(chǔ)龐大,各類IT資源經(jīng)過復(fù)雜的封裝、關(guān)聯(lián)、調(diào)度后以服務(wù)的方式提供給業(yè)務(wù)系統(tǒng)使用;三是運維難度增大,海量的、存在復(fù)雜關(guān)聯(lián)的IT資源運維管理復(fù)雜;四是云數(shù)據(jù)中心需要滿足業(yè)務(wù)高可用性,能夠提供高安全性、高質(zhì)量水平的云服務(wù)。正是由于存在以上的特點,金融集團可通過設(shè)計一個涵蓋云數(shù)據(jù)中全方位的安全營運支撐平臺,通過安全營運支撐平臺來屏蔽底層云數(shù)據(jù)中心IT基礎(chǔ)資源的復(fù)雜性、多樣性,降低資源的管理難度,實現(xiàn)海量IT基礎(chǔ)資源的安全調(diào)度、高效運維,并以高質(zhì)量的云服務(wù)形式支撐金融集團業(yè)務(wù)系統(tǒng)運行。
2 金融集團云數(shù)據(jù)中心概述
2.1 金融集團云數(shù)據(jù)中心架構(gòu)
金融集團已經(jīng)完成云數(shù)據(jù)中心的基礎(chǔ)設(shè)施建設(shè),主要包括網(wǎng)絡(luò)資源池、存儲資源池、計算資源池、操作系統(tǒng)資源池、數(shù)據(jù)庫資源池、中間件資源池。通過云數(shù)據(jù)中心基礎(chǔ)設(shè)施提供IaaS層的服務(wù)能力,支撐金融集團公司ERP、財務(wù)管理系統(tǒng)、互聯(lián)網(wǎng)金融等相關(guān)業(yè)務(wù)系統(tǒng)。如圖1所示。
操作系統(tǒng)資源池:主要包括Windows、Linux、SUSE、ESXI、Fusion Sphere等系統(tǒng)。
數(shù)據(jù)庫資源池:主要使用MySQL和Oracle關(guān)系型數(shù)據(jù)庫。
中間件資源池:主要包括Weblogic、Nginx、Apache、Tomcat等中間件。
計算資源池:以開放的X86架構(gòu)服務(wù)器為主,以及部分小型機在數(shù)據(jù)中心內(nèi)提供計算服務(wù)能力。
存儲資源池:在數(shù)據(jù)中心部署集中式存儲和分布式存儲,提供塊存儲、對象存儲、文件存儲等多樣化的存儲服務(wù)。
網(wǎng)絡(luò)資源池:以軟件定義網(wǎng)絡(luò)(SDN)及傳統(tǒng)路由交換網(wǎng)絡(luò)的方式在數(shù)據(jù)中心提供高性能、靈活的網(wǎng)絡(luò)訪問服務(wù)。
2.2 云數(shù)據(jù)中心運行過程中存在的問題
在獲得云數(shù)據(jù)中心帶來的低成本、彈性伸縮、高效率的IT環(huán)境的同時,也帶來了一些新的問題。
(1)設(shè)備管理復(fù)雜。金融集團云數(shù)據(jù)中心內(nèi)具備軟硬件系統(tǒng)數(shù)量多、品牌多、型號多、管理界面多等特點,缺乏統(tǒng)一的管理手段。
(2)虛擬化資源多。金融集團云數(shù)據(jù)中心采用了大量的虛擬化技術(shù),如虛擬機、容器、軟負載、虛擬防火墻、分布式存儲、虛擬網(wǎng)絡(luò),大量的虛擬化資源看不見,摸不著,邏輯關(guān)系梳理困難。
(3)運維復(fù)雜。缺乏統(tǒng)一的資源的運維監(jiān)控手段,各種資源的運維主要依靠自帶的管理系統(tǒng)進行,缺乏統(tǒng)一、高效、集中、安全、自動化程度高的監(jiān)控運維工具。
(4)資源調(diào)度缺乏靈活性。主要體現(xiàn)在無統(tǒng)一資源調(diào)度手段,缺乏按需進行彈性伸縮手段,資源分配過程環(huán)節(jié)多、復(fù)雜、緩慢。
(5)資產(chǎn)統(tǒng)計困難。軟硬件設(shè)備臺賬主要依靠手工登記,存在資產(chǎn)清單更新不及時、臺賬信息不準確、管理繁瑣等問題,缺乏自動化的資產(chǎn)生命周期管理手段。
(6)難以優(yōu)化資源配置。主要體現(xiàn)在資源使用情況難以量化,無法對資源情況進行多維度分析,缺乏趨勢預(yù)測及分析能力,富裕的資源難以向外界提供服務(wù),業(yè)務(wù)下線后,資源很難及時恢復(fù)。
3 云數(shù)據(jù)中心安全營運支撐平臺設(shè)計
3.1 設(shè)計目標
通過云數(shù)據(jù)中心安全營運支撐平臺(以下簡稱“營運支撐平臺”),對金融集團公司云數(shù)據(jù)中心內(nèi)的所有系統(tǒng)軟硬件資源進行統(tǒng)一管理、安全調(diào)度、全面監(jiān)控,實現(xiàn)各種資源的動態(tài)按需調(diào)度和全生命周期管理,滿足云數(shù)據(jù)中心的運營、安全運維的需求,通過對云數(shù)據(jù)中心整體服務(wù)能力的規(guī)劃與服務(wù)化封裝,健全云數(shù)據(jù)中心完整的服務(wù)目錄,提供完整的云數(shù)據(jù)中心基礎(chǔ)設(shè)施即服務(wù),實現(xiàn)云數(shù)據(jù)中心資源管理集中化、服務(wù)流程標準化、作業(yè)自動化、日常運營專業(yè)化、運維操作安全化,推動云數(shù)據(jù)中心由粗放式硬件導(dǎo)向的基礎(chǔ)管理向服務(wù)驅(qū)動的專業(yè)化運營模式轉(zhuǎn)變,更好地提升數(shù)據(jù)中心資源利用率,實現(xiàn)平臺資源的優(yōu)化整合配置,提升金融集團云數(shù)據(jù)中心附加值,如圖2所示。
3.2 云數(shù)據(jù)中心安全營運支撐平臺功能設(shè)計
營運支撐平臺主要由門戶展現(xiàn)、業(yè)務(wù)編排、資源控制與管理、資源監(jiān)控與告警、自動化運維、運維流程管理、身份/權(quán)限管理、集成接口等功能模塊構(gòu)成,如圖3所示。
3.2.1 門戶展現(xiàn)模塊設(shè)計
門戶展現(xiàn)模塊負責(zé)向用戶以圖形化等直觀的方式展示平臺資源與服務(wù)的運行動態(tài)效果以及平臺實時運營狀況。展示內(nèi)容包括:整個平臺的實時資源運行情況、一段時間的任務(wù)執(zhí)行統(tǒng)計、資源的展示(包括資源的總量、剩余量、執(zhí)行的任務(wù)量、變化趨勢、實時狀態(tài)等),幫助IT管理員通過門戶模塊方便工作。
3.2.2業(yè)務(wù)編排模塊
(1)自動化部署。自動化部署模塊負責(zé)將軟件部署過程的每一個步驟都自動化,可以帶來包括效能在內(nèi)的顯著的好處。自動化部署包含軟件部署、軟件配置、集群部署等。
(2)營運管理。能夠全面、直觀、多維度的對現(xiàn)有云數(shù)據(jù)中心運營情況進行統(tǒng)計分析,多維度主要包含但不限于:面向云數(shù)據(jù)中心、云服務(wù)以及用戶的成本與效益分析;面向資源池、用戶、業(yè)務(wù)系統(tǒng)的資源使用情況分析以及用戶行為分析等,并可以通過運營數(shù)據(jù)自定義分析決策模型從而提升整體運營維度與決策依據(jù)。其主要功能點包括幾個方面。
運營分析——在云數(shù)據(jù)中心運營數(shù)據(jù)的基礎(chǔ)上,定義多種不同維度的運營分析,每類運營分析對應(yīng)多種運營分析模型,各個模型將不同類型的數(shù)據(jù)、算法、可視化顯示等參數(shù)進行不同組合將產(chǎn)生不同的模板提供給云數(shù)據(jù)中心運營人員使用。
成本分析——利用成本核算及其他有關(guān)資料,分析成本構(gòu)成及變動情況,研究影響成本升降的各種因素及其變動原因,尋找降低成本的途徑的分析方法。成本分析內(nèi)容包含但不限于:云數(shù)據(jù)中心投資成本、運營成本、用戶分攤成本等。考慮維度包括但不限于:服務(wù)器投資、存儲投資、軟件系統(tǒng)投資、網(wǎng)絡(luò)投資、數(shù)據(jù)中心基礎(chǔ)環(huán)境投資、運維人員成本、管理成本、帶寬成本、維保成本、電費成本等。
資源分析——提供云數(shù)據(jù)中心資源池各類資源、服務(wù)及營運支撐平臺各類信息的數(shù)據(jù)搜集、存儲以及展示等功能,生成各種資源統(tǒng)計報表和分析報告。
用戶分析——提供用戶相關(guān)的各維度分析指標的數(shù)據(jù)搜集、存儲以及展示等功能,并通過用戶業(yè)務(wù)系統(tǒng)評估模型配置相關(guān)的服務(wù)等級,實現(xiàn)平臺的差異化服務(wù),實現(xiàn)精細化運營。
收益分析——收益分析是通過對平臺資源按照其整體總成本進行定價,采取超賣、運維效率提升、運營策略調(diào)整、資源回收等措施實現(xiàn)有限資源的收入效益提升,通過收益對比調(diào)整優(yōu)化資源配置分配策略,從而實現(xiàn)數(shù)據(jù)驅(qū)動的云數(shù)據(jù)中心運營,做大整體云數(shù)據(jù)中心效益。
(3)虛擬數(shù)據(jù)中心。虛擬數(shù)據(jù)中心管理對應(yīng)的是虛擬化環(huán)境中的集群或資源池,虛擬數(shù)據(jù)中心通過虛擬化技術(shù)將計算、存儲、網(wǎng)絡(luò)資源進行池化管理,動態(tài)進行資源分配和調(diào)度,實現(xiàn)數(shù)據(jù)中心的自動化部署,可以大大降低數(shù)據(jù)中心的運維成本。支持虛擬數(shù)據(jù)中心的創(chuàng)建、修改、刪除、利舊等功能,對虛擬數(shù)據(jù)中心進行性能監(jiān)控,通過基于虛擬數(shù)據(jù)中心的動態(tài)資源調(diào)度策略,實現(xiàn)業(yè)務(wù)的高可用性。
(4)重點業(yè)務(wù)保障。提供重點保障業(yè)務(wù)的全面檢查、資源傾斜、監(jiān)控推送等功能。
(5)統(tǒng)計分析。運行分析管理包括實時運行情況整合展示、統(tǒng)一的報表展示和運行趨勢分析和預(yù)測。
實時運行情況整合展示是以統(tǒng)一的業(yè)務(wù)視圖展示各類應(yīng)用系統(tǒng)的業(yè)務(wù)數(shù)據(jù)狀態(tài)、應(yīng)用運行狀況、基礎(chǔ)設(shè)施運行狀況,并可根據(jù)運維管理層和執(zhí)行層人員的不同需求顯示不同內(nèi)容。
統(tǒng)一的報表展示是設(shè)計面向管理視角和執(zhí)行視角的運行分析報表,并進行統(tǒng)一展示。
運行趨勢分析和預(yù)測是依托內(nèi)建的分析模型對云數(shù)據(jù)中心運行趨勢預(yù)測,例如:服務(wù)器資源容量分析、存儲資源容量分析、網(wǎng)絡(luò)資源容量分析、機房容量分析、系統(tǒng)負載分析等等。
(6)服務(wù)等級。提供多樣化、差異化的服務(wù),保證服務(wù)質(zhì)量。管理員可以根據(jù)實際情況,調(diào)整服務(wù)等級的配置參數(shù),以滿足不同用戶的需求,可以提供服務(wù)等級分為金牌、銀牌、銅牌三個級別;通過資源配置參數(shù),定義服務(wù)等級。服務(wù)等級體現(xiàn)在符合不同配置參數(shù)的資源分區(qū),并在服務(wù)等級的基礎(chǔ)上創(chuàng)建虛擬數(shù)據(jù)中心。資源配置參數(shù)包括CPU核數(shù)、CPU主頻、內(nèi)存、網(wǎng)卡數(shù)量、網(wǎng)絡(luò)QOS、存儲類型、數(shù)據(jù)庫類型等。
(7)資源調(diào)配。資源調(diào)配根據(jù)服務(wù)申請單、資源現(xiàn)有使用率以及剩余量等規(guī)則策略設(shè)置調(diào)度規(guī)則,并且調(diào)用底層相關(guān)資源接口實現(xiàn)對資源池資源的策略調(diào)度。
(8)服務(wù)目錄。通過服務(wù)目錄,云數(shù)據(jù)中心使用者可以自助完成日常服務(wù)工作,如:服務(wù)申請(可以通過服務(wù)目錄,查看能夠提供的服務(wù),然后提交服務(wù)申請,提交服務(wù)申請時,可以配置該服務(wù)的服務(wù)時長、規(guī)格等服務(wù)參數(shù),服務(wù)申請審批通過后就可根據(jù)服務(wù)模板,快速部署應(yīng)用);服務(wù)釋放(可以自助釋放不再使用的服務(wù)資源,當服務(wù)到期后,可以通過人工方式或自動來釋放資源);服務(wù)變更(可以根據(jù)實際需求,對已使用的服務(wù)提出服務(wù)變更,以滿足實際的業(yè)務(wù)需求);服務(wù)維護(對已使用的服務(wù)可以進行自維護)。通過服務(wù)目錄還可以為用戶提供多種類型服務(wù)配置模板,如虛擬機模板服務(wù)、網(wǎng)絡(luò)配置模板、數(shù)據(jù)庫配置模板、存儲配置模板等。
3.2.3 資源封裝與管理模塊
資源封裝與管理模塊主要是通過各種虛擬化技術(shù)將底層軟硬件資源進行集成整合,根據(jù)其資源特點形成不同類型的資源池,然后在資源管理層將底層各種類型的資源池按照服務(wù)類型構(gòu)建相關(guān)服務(wù)的管理模塊。該管理模塊對上提供統(tǒng)一安全的服務(wù)接口,主要完成云數(shù)據(jù)中心底層資源到上層服務(wù)的封裝、調(diào)度,使得底層的異構(gòu)平臺對上層透明,上層管理平臺在統(tǒng)一運營的過程中,無需關(guān)心底層架構(gòu)的具體實現(xiàn)計算資源。
(1)計算資源。通過虛擬化技術(shù)對物理計算資源(CPU、內(nèi)存、磁盤、網(wǎng)卡)進行封裝,按需提供虛擬化計算資源。
(2)存儲資源。實現(xiàn)對云數(shù)據(jù)中心對象存儲、塊存儲、文件存儲資源的統(tǒng)一封裝及管理。對象存儲主要通過分布式存儲提供對象存儲空間,提供對象存儲接口;塊存儲主要通過集中式存儲提供塊存儲空間,提供ISCSI、FC等塊存儲接口;文件存儲主要通過分布式存儲提供文件存儲空間,提供NFS,HDFS等文件存儲接口。
(3)網(wǎng)絡(luò)資源。提供云數(shù)據(jù)中心SDN網(wǎng)絡(luò)資源的管理,通過營運支撐平臺可以調(diào)用SDN網(wǎng)絡(luò)相關(guān)功能,對SDN Overlay進行業(yè)務(wù)編排,部署虛擬機時SDN網(wǎng)絡(luò)自動配置虛擬機VXLAN及IP。
(4)數(shù)據(jù)庫資源。提供云數(shù)據(jù)中心數(shù)據(jù)庫資源的統(tǒng)一管理,接口封裝、任務(wù)執(zhí)行。
(5)操作系統(tǒng)資源。提供操作的系統(tǒng)的統(tǒng)一管理,統(tǒng)一封裝、統(tǒng)一鏡像,可通過支撐平臺分發(fā)、安裝、卸載指定的操作系統(tǒng)。
(6)中間件資源。提供中間件資源的統(tǒng)一管理,統(tǒng)一封裝,統(tǒng)一鏡像,可通過支撐平臺分發(fā)、安裝、卸載中間件。
(7) 基礎(chǔ)資源。提供云數(shù)據(jù)中心機房機柜、線纜資源同一管理。
3.2.4 資源監(jiān)控告警模塊
(1)性能監(jiān)控。提供資源池、平臺、硬軟件設(shè)備、中間件等組件的性能監(jiān)控,監(jiān)控指標包括但不限于CPU使用率、內(nèi)存使用率、網(wǎng)絡(luò)帶寬、數(shù)據(jù)表等。
(2)拓撲發(fā)現(xiàn)。以拓撲的方式對平臺已有設(shè)備與虛擬機等要素進行拓撲展現(xiàn)。
(3)狀態(tài)監(jiān)控。對虛擬機、網(wǎng)絡(luò)、存儲、操作系統(tǒng)、服務(wù)器等軟硬件管理對象進行狀態(tài)監(jiān)控。
(4)異常告警。告警管理可以在物理資源、虛擬資源、應(yīng)用出現(xiàn)故障時,發(fā)出告警信息,管理員可以第一時間發(fā)現(xiàn)告警并及時處理。提供告警策略配置管理,通過設(shè)定的策略,可以對所管理的物理資源、虛擬資源、應(yīng)用服務(wù)進行監(jiān)控和故障檢查,發(fā)現(xiàn)故障后系統(tǒng)會分為一般、嚴重、緊急等告警級別進行上報,上報方式有管理頁面顯示、郵件告警、短信告警、語音告警。通過訂閱重要的告警,管理員即使在無人值守的情況下,仍然可以充分掌握整個云數(shù)據(jù)中心運行狀況。
(5)日志管理。日志管理主要包括審計日志、系統(tǒng)日志、操作日志三種日志類型的統(tǒng)一記錄與管理,系統(tǒng)會記錄用戶對資產(chǎn)的各種操作,日常訪問情況,實現(xiàn)操作行為追溯和日志記錄,以規(guī)范用戶的操作。用戶可以根據(jù)時間、資產(chǎn)、操作類型等信息,查詢?nèi)罩拘畔ⅰ?/p>
3.2.5自動化運維模塊
(1)自動巡檢。通過預(yù)置的自動巡檢腳本引擎對某對象情況進行定時執(zhí)行檢測。
(2)故障自愈。實現(xiàn)在系統(tǒng)在出現(xiàn)故障時以主備切換、業(yè)務(wù)遷移、自動啟動等方式進行自我修復(fù),保障業(yè)務(wù)運行的連續(xù)性。
(3)自動升級。實現(xiàn)對云數(shù)據(jù)中心內(nèi)相關(guān)系統(tǒng)以及營運支撐平臺自身模塊的自動升級與模塊更新。
(4)自動發(fā)布。將應(yīng)用系統(tǒng)以虛擬機的方式進行封裝后,通過對相關(guān)虛擬機的克隆與啟動運行從而實現(xiàn)應(yīng)用系統(tǒng)/軟件的自動發(fā)布。
(5)配置管理。配置管理數(shù)據(jù)庫作為金融集團云數(shù)據(jù)中心運維管理的核心數(shù)據(jù)源,需要嚴格保證數(shù)據(jù)的準確性,并在數(shù)據(jù)變化后利用有效地手段進行更新,因此需要利用自動發(fā)現(xiàn)工具、手工錄入和流程控制手段持續(xù)保證配置管理數(shù)據(jù)庫的信息準確。
自動發(fā)現(xiàn)工具:自動抓取標準的系統(tǒng)信息及關(guān)聯(lián)關(guān)系,將信息存入配置管理數(shù)據(jù)庫中。在系統(tǒng)配置數(shù)據(jù)改變后,自動發(fā)現(xiàn)工具能夠自動比對配置信息,并進行配置管理數(shù)據(jù)庫的更新。
手工錄入:將無法自動發(fā)現(xiàn)但又需要收集的配置項信息和關(guān)系,通過手工錄入的方式進行信息填充。
流程控制:通過嚴格的變更管理流程,所有對于配置項的更新操作進行嚴格控制,以避免跳過流程進行配置調(diào)整的情況發(fā)生。
3.2.6運行管理模塊
(1)事件管理。對平臺運行過程中所遇到的運行事件、故障事件、告警事件等事件進行統(tǒng)一管理,支持相關(guān)的生命周期操作。
(2)流程管理。對平臺業(yè)務(wù)流轉(zhuǎn)以及工單審批流程等方面進行統(tǒng)一管理和配置。
(3)知識庫。知識管理的目的是建立共享的知識數(shù)據(jù)庫,主要包含服務(wù)知識數(shù)據(jù),運維案例庫、操作手冊等。知識管理一般分為幾種角色:知識提交者、知識審批者、知識管理者、知識使用者。知識提交者負責(zé)將知識的信息歸納總結(jié)提交;知識審批者負責(zé)根據(jù)審批規(guī)則,將知識提交者所提交的知識進行審批;知識管理者負責(zé)監(jiān)視知識庫中知識的提交情況、使用情況,以決定是否需要進行知識的更新淘汰等工作;知識使用者負責(zé)查詢和使用知識庫中的知識,并對知識的有效性進行反饋。
(4)審批管理。用戶提供提交工單或者資源申請單后,通過流程周轉(zhuǎn),相關(guān)負責(zé)人對申請進行審核后確認,實現(xiàn)跨部門審批與各部門內(nèi)部審批業(yè)務(wù)的無縫對接,提高整體效率。
(5)資產(chǎn)管理。提供軟硬件資產(chǎn)管理系統(tǒng),刻畫企業(yè)資產(chǎn)地圖,對資產(chǎn)進行全生命周期管理,并通過資產(chǎn)間關(guān)系進行影響面分析。
3.2.7 身份認證/權(quán)限管理
提供統(tǒng)一認證模塊,通過一次登錄,實現(xiàn)整個營運支撐平臺安全訪問。營運支撐平臺提供默認角色,包括管理員、項目經(jīng)理、開發(fā)、測試、運維、運營角色,根據(jù)角色控制各系統(tǒng)菜單權(quán)限。提供身份識別與訪問管理系統(tǒng),用于調(diào)用的接入認證,實現(xiàn)營運支撐平臺的統(tǒng)一權(quán)限管理。系統(tǒng)后端支持與第三方認證對接,也支持相關(guān)權(quán)限數(shù)據(jù)的同步,實現(xiàn)管理員、用戶身份認證與識別;業(yè)務(wù)、資源訪問、使用賬戶管理服務(wù)的內(nèi)外部調(diào)用全部通過統(tǒng)一的認證服務(wù)進行控制,提高安全性。
3.2.8 統(tǒng)一集成接口
營運支撐平臺提供統(tǒng)一安全的第三方調(diào)用接口從而方便第三方系統(tǒng)進行功能集成,具備良好的擴展性。
3.3 云數(shù)據(jù)中心營運支撐平臺典型應(yīng)用場景介紹
3.3.1 重點業(yè)務(wù)保障應(yīng)用場景介紹
場景假設(shè):月底財務(wù)系統(tǒng)需要出具報表,需要對財務(wù)系統(tǒng)進行重點保障,通過營運支撐平臺可以自動實現(xiàn)對財務(wù)系統(tǒng)的全面保障,保障方式如圖4所示。
①通過營運支撐平臺實現(xiàn)對業(yè)務(wù)系統(tǒng)使用的網(wǎng)絡(luò)、虛擬機、服務(wù)器、數(shù)據(jù)庫進行自動全面的檢查,提前發(fā)現(xiàn)問題。
②-⑤通過網(wǎng)絡(luò)帶寬保障業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)QoS;通過計算管理增加業(yè)務(wù)系統(tǒng)的計算資源如CPU及內(nèi)存;通過存儲管理優(yōu)化存儲讀寫能力;通過數(shù)據(jù)庫管理保障數(shù)據(jù)庫處理能力。
⑥將業(yè)務(wù)系統(tǒng)相關(guān)IT資源監(jiān)控狀態(tài)情況數(shù)據(jù)在支撐平臺顯著界面顯示,同時除必要的管理員賬號開放外,暫時鎖定其他賬號,防止人為誤操作。
3.3.2資源動態(tài)調(diào)配應(yīng)用場景介紹
場景假設(shè):集團資金結(jié)算系統(tǒng)每月1-25日為正常訪問時間段,所需計算資源為CPU 16C 內(nèi)存128G,每月26-30日為高峰訪問時間段,所需計算資源為CPU 32C 內(nèi)存256GB,通過營運支撐平臺資源調(diào)配功能可以實現(xiàn)集團資金結(jié)算系統(tǒng)資源的自動調(diào)整,實現(xiàn)示意如圖5所示。
①集團資金結(jié)算系統(tǒng)每月1-25日計算資源為正常訪問。
②-③每月26-30日資金結(jié)算系統(tǒng)為高峰訪問,通過預(yù)置的配置模板,將資金結(jié)算系統(tǒng)計算資源池自動調(diào)整為CPU 32C內(nèi)存256GB,以滿足業(yè)務(wù)系統(tǒng)的使用。
④-⑤次月1-25日資金結(jié)算系統(tǒng)恢復(fù)平穩(wěn),通過支撐平臺將其計算資源自動恢復(fù)為CPU 16C 內(nèi)存128GB。
3.3.3服務(wù)等級配置應(yīng)用場景介紹
場景假設(shè):集團需要新上線兩套業(yè)務(wù)系統(tǒng)為:核心業(yè)務(wù)系統(tǒng)(需要高性能計算資源、高性能集中式存儲資源、網(wǎng)絡(luò)帶寬需要優(yōu)先保障);文檔管理系統(tǒng)(需要普通性能計算資源、大容量分布式存儲資源、普通網(wǎng)絡(luò)帶寬),集團IT管理員通過營運支撐平臺對兩個系統(tǒng)劃分不同等級的IT資源,示意圖如圖6所示。
① 業(yè)務(wù)部門向集團IT管理部門發(fā)起資源請求。
②集團IT管理部門通過營運支撐平臺統(tǒng)計分析功能查詢富裕資源情況。
③確認資源滿足要求后,集團IT管理部門通過服務(wù)等級功能劃分金牌服務(wù)及銀牌服務(wù),金牌服務(wù)劃分為4路X86服務(wù)器、高QoS網(wǎng)絡(luò),集中式存儲;銀牌服務(wù)2路X86服務(wù)器、中QoS網(wǎng)絡(luò)、分布式存儲。
④資源分配后營運支撐平臺自動對資源進行統(tǒng)一的監(jiān)控。
⑤營運支撐平臺配置管理功能自動更新配置管理數(shù)據(jù)庫。
3.3.4統(tǒng)計分析應(yīng)用場景介紹
通過營運支撐平臺統(tǒng)計分析功能,可以迅速、直觀的統(tǒng)計分析出云數(shù)據(jù)中心整個IT資源的情況,部分統(tǒng)計分析應(yīng)用場景如表1所示。
4 結(jié)束語
通過云數(shù)據(jù)中心安全營運支撐平臺,金融集團IT管理員可以將云數(shù)據(jù)中心基礎(chǔ)資源封裝整合成一個擁有計算、網(wǎng)絡(luò)、存儲、操作系統(tǒng)、中間件、數(shù)據(jù)庫集合的資源池,利用直觀、可視化的操作界面按需提供相關(guān)資源服務(wù),為金融集團不同部門、不同業(yè)務(wù)系統(tǒng)提供高性能、可彈性擴縮、安全隔離的私有云服務(wù),實現(xiàn)云數(shù)據(jù)中心基礎(chǔ)資源的營運管理,持續(xù)優(yōu)化提升資源的利用效率,降低TCO,實現(xiàn)智能運維。
參考文獻
[1] Gary Lee著,唐富年,譯.云數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)[M].北京:人民郵電出版社.
[2] 楊歡,著.云數(shù)據(jù)中心構(gòu)建實踐[M].北京:機械工業(yè)出版社.
[3] 《智慧云數(shù)據(jù)中心》編委會著.智慧云數(shù)據(jù)中心[M].北京:電子工業(yè)出版社.
[4] 卓蘇拉,著.云計算與數(shù)據(jù)中心自動化[M].北京:人民郵電出版社.
[5] 張文科,劉桂芬.云計算數(shù)據(jù)安全和隱私保護研究[J].2012.(11)38-40.
作者簡介:
周一波(1980-),男,漢族,湖南新化人,畢業(yè)于加拿大溫莎大學(xué),碩士研究生,國網(wǎng)英大國際控股集團公司信息化工作部,主任助理,高級工程師;主要研究方向和關(guān)注領(lǐng)域:信息安全與數(shù)據(jù)中心建設(shè)。
陳捷(1985-),男,漢族,江蘇淮安人,畢業(yè)于中央財經(jīng)大學(xué),碩士研究生,北京匯通金財信息科技有限公司集成業(yè)務(wù)部,副主任,中級工程師;主要研究方向和關(guān)注領(lǐng)域:云計算、信息系統(tǒng)集成。