• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)的研究與設(shè)計

    2018-09-12 07:56:06李兢
    電信工程技術(shù)與標準化 2018年9期
    關(guān)鍵詞:子系統(tǒng)數(shù)據(jù)中心運維

    李兢

    (廣西電子政務(wù)外網(wǎng)管理中心,南寧 530000)

    1 前言

    廣西電子政務(wù)外網(wǎng)云計算中心位于廣西南寧市,面積為25 000 m2,建設(shè)級別為A級,機架數(shù)為2 800個。該項目是廣西政府系統(tǒng)電子政務(wù)“十二五”規(guī)劃重點項目,項目采用云計算、大數(shù)據(jù)等新一代信息技術(shù),建設(shè)廣西統(tǒng)一的政務(wù)云計算中心。目標是要建成全國一流的綜合性云計算中心,為廣西乃至西南中南地區(qū)的電子政務(wù)建設(shè)應(yīng)用及信息化建設(shè)提供國內(nèi)一流的云計算技術(shù)支撐服務(wù)。通過項目建設(shè)切實推動廣西壯族自治區(qū)實現(xiàn)電子政務(wù)集約化節(jié)約化建設(shè)與應(yīng)用,提高投資效益和質(zhì)量,全面提升各級政府公共服務(wù)水平和社會管理能力。

    數(shù)據(jù)中心基礎(chǔ)設(shè)施作為承載信息系統(tǒng)運行的物理環(huán)境,其穩(wěn)定性、可靠性、安全性決定了IT業(yè)務(wù)的持續(xù)性。如何做好運維工作,實時掌控基礎(chǔ)設(shè)施運行情況,及時發(fā)現(xiàn)隱患、故障,降低運維管理成本,控制數(shù)據(jù)中心能耗,提高基礎(chǔ)設(shè)施利用率,掌握基礎(chǔ)設(shè)施容量情況,提升運營水平和服務(wù)成熟度,成為未來工作重點。

    針對這些情況,需建立數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)(DCIM)。系統(tǒng)要能全面管理基礎(chǔ)設(shè)施、智能輔助分析決策、高效有序運維團隊,保障基礎(chǔ)設(shè)施可用性,主動消除故障隱患風險,縮短故障修復(fù)時間,降低能源消耗和運維成本,提高基礎(chǔ)設(shè)施利用率,加強流程化管理服務(wù)水平,保障數(shù)據(jù)中心穩(wěn)定、安全、高效運行。本文以廣西電子照政務(wù)外網(wǎng)云計算中心的DCIM為例,簡述實現(xiàn)思路與過程。

    2 系統(tǒng)的架構(gòu)體系

    2.1 總體架構(gòu)設(shè)計

    平臺總體架構(gòu)圖如圖1所示。平臺分為5個邏輯層:監(jiān)控設(shè)備層、采集層、數(shù)據(jù)處理層、基礎(chǔ)服務(wù)層、應(yīng)用層。各層之間相互獨立,從上往下相互依賴,各個功能和業(yè)務(wù)應(yīng)用以組建的方式進行設(shè)計和開發(fā),使層內(nèi)各功能耦合度最小。

    監(jiān)控設(shè)備層:覆蓋了數(shù)據(jù)中心動力系統(tǒng)、環(huán)境系統(tǒng)、安防系統(tǒng)等所有基礎(chǔ)設(shè)施設(shè)備。

    采集層:由各種I/O采集模塊、串口服務(wù)器等組成,連接所有傳感器和被監(jiān)控設(shè)備,實現(xiàn)監(jiān)控平臺與被監(jiān)控對象的數(shù)據(jù)通訊。所有硬件采用模塊化架構(gòu),I/O模塊采集傳感器數(shù)據(jù)后通過系統(tǒng)配置實現(xiàn)對所有傳感器的數(shù)據(jù)匹配對應(yīng);各種智能設(shè)備直接接入現(xiàn)場監(jiān)控層。

    數(shù)據(jù)處理層:基于大數(shù)據(jù)架構(gòu),對各子系統(tǒng)的數(shù)據(jù)進行統(tǒng)一篩選、整合并加以關(guān)聯(lián)分析、聚類分析、分類、預(yù)測、時序模式和偏差分析。以為規(guī)劃、調(diào)優(yōu)、預(yù)測和變更等多個維度的綜合數(shù)據(jù)支撐,為決策與運維奠定數(shù)據(jù)基礎(chǔ)。

    基礎(chǔ)服務(wù)層:由動環(huán)監(jiān)控服務(wù)器、熱場管理服務(wù)器、資產(chǎn)容量管理服務(wù)器、IT一體化監(jiān)控服務(wù)器等組成。服務(wù)器負責收集各子系統(tǒng)的監(jiān)控的實時數(shù)據(jù),進行本地處理、存儲,并將數(shù)據(jù)經(jīng)過濾后上傳至集中管理服務(wù)器,進行統(tǒng)一監(jiān)控和管理。

    應(yīng)用層:應(yīng)用層是直接與用戶交互到系統(tǒng)功能層,根據(jù)用戶需求到不同構(gòu)建不同到交互界面。包括資產(chǎn)管理、能耗管理、容量管理、運維管理等子系統(tǒng)。

    2.2 大數(shù)據(jù)平臺架構(gòu)

    大數(shù)據(jù)平臺架構(gòu)如圖2所示。

    2.2.1 大數(shù)據(jù)接入子系統(tǒng)

    利用事件驅(qū)動的架構(gòu)(Evnet-Driven Architecture)支持數(shù)據(jù)中心各垂直子系統(tǒng)大規(guī)模TCP/IP鏈接的高并發(fā)處理,使用消息隊列模式的發(fā)布方式。利用均衡負載、反向映射等技術(shù),構(gòu)建接入服務(wù)器集群,實現(xiàn)高容錯。

    圖1 系統(tǒng)平臺架構(gòu)圖

    圖2 DCIM大數(shù)據(jù)平臺架構(gòu)

    2.2.2 流數(shù)據(jù)處理子系統(tǒng)

    面對海量數(shù)據(jù)實時處理需求,采用“流處理”(Stream processing)系統(tǒng),一方面接受接入子系統(tǒng)傳入的數(shù)據(jù)流,另一方面完成對海量數(shù)據(jù)流的連續(xù)查詢、混合查詢、多條件查詢。

    2.2.3 復(fù)雜事件處理子系統(tǒng)

    在對監(jiān)控數(shù)據(jù)處理的過程中,會產(chǎn)生大量有關(guān)聯(lián)性的事件。為更智能的分析處理海量事件,采用智能的復(fù)雜事件處理引擎(Complex Event Process)。復(fù)雜事件處理引擎接受從流數(shù)據(jù)平臺過來的數(shù)據(jù)輸入,解釋業(yè)務(wù)規(guī)則,并根據(jù)業(yè)務(wù)規(guī)則作出業(yè)務(wù)決策,實現(xiàn)事件過濾、合并、分流、定位、告警等服務(wù)。

    2.2.4 分布式存儲子系統(tǒng)

    DCIM采集到的數(shù)據(jù)經(jīng)過流數(shù)據(jù)平臺處理后必須做存儲處理。存儲方式采用分布式數(shù)據(jù)庫和分布式文件系統(tǒng)技術(shù),將可靠的PC服務(wù)器存儲設(shè)備集合起來協(xié)調(diào)工作,行程一個分布式、高容錯的云存儲平臺。

    2.2.5 大數(shù)據(jù)分析子系統(tǒng)

    系統(tǒng)在采用分布式并行計算技術(shù)、復(fù)雜事件處理技術(shù)和機器學習的基礎(chǔ)上,利用聚類、分類、推薦過濾、頻繁子項挖掘等手段,發(fā)現(xiàn)數(shù)據(jù)的相關(guān)性和規(guī)律。對采集到的歷史數(shù)據(jù)做智能處理和分析,對未來可能發(fā)生的故障做預(yù)測分析。

    2.3 數(shù)據(jù)庫設(shè)計

    廣西電子政務(wù)外網(wǎng)云計算中心監(jiān)測參數(shù)項至少為300 000個,每2 s進行數(shù)據(jù)采集并存儲,每日處理數(shù)量將高達上百億規(guī)模。數(shù)據(jù)形式是為多樣性,包括結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化的數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)。面對海量數(shù)據(jù),平臺既要支持傳感器數(shù)據(jù)流到實時分析與處理又要支持復(fù)雜查詢與深度分析所需到高性能、低延遲需求。傳統(tǒng)的數(shù)據(jù)庫存儲方式已不能滿足需求,采用大數(shù)據(jù)Hadoop YARN架構(gòu)存儲如圖3所示。

    圖3 大數(shù)據(jù)存儲混合模式

    底層由傳統(tǒng)關(guān)系型數(shù)據(jù)庫和Hadoop集群組成,系統(tǒng)配置信息存儲在關(guān)系數(shù)據(jù)庫,海量歷史數(shù)據(jù)存儲在分布式存儲系統(tǒng)上。通過Hive數(shù)據(jù)倉庫、HBase數(shù)據(jù)庫與上層進行交互。為便于高效數(shù)據(jù)查詢、分析、計算,采用分布式計算、并行計算和實時計算承擔完成。

    中間層采用了計算節(jié)點集群方式,運行的程序既包括傳統(tǒng)應(yīng)用服務(wù)器和Web服務(wù)器,Hadoop應(yīng)用協(xié)作的分析服務(wù)器。

    頂層主要用來呈現(xiàn),從承載方式看:主要包括Web瀏覽器、移動設(shè)備以及桌面應(yīng)用等;從展示內(nèi)容看,既包括傳統(tǒng)的報表表格也包括組態(tài)和3D等新式交互體驗。

    3 系統(tǒng)功能設(shè)計

    圖4 系統(tǒng)功能圖

    各子系統(tǒng)之間采用分布式集散結(jié)構(gòu),各子系統(tǒng)相對獨立,一個子系統(tǒng)發(fā)生故障,不影響其他子系統(tǒng)的正常運作;DCIM系統(tǒng)平臺發(fā)生故障,各子系統(tǒng)仍能正常工作。同時各子系統(tǒng)之間又可通過在DCIM系統(tǒng)平臺上定義各自的聯(lián)動策略,并可實現(xiàn)跨子系統(tǒng)的策略聯(lián)動。系統(tǒng)主要包括四大部分:基礎(chǔ)設(shè)施管理、運維管理、大數(shù)據(jù)分析、系統(tǒng)維護管理。平臺主要功能模塊,詳見圖4所示。

    3.1 容量管理

    對機房、機柜、基礎(chǔ)設(shè)施設(shè)備等對象,綜合空間、U位、供電、制冷、承重、電力口、光口、網(wǎng)口等因素構(gòu)建容量模型。采用有線標簽U位管理技術(shù)自動實現(xiàn)對機柜空間管理,結(jié)合CFD技術(shù)模擬數(shù)據(jù)中心發(fā)熱量數(shù)據(jù)。容量管理具有規(guī)劃部署功能,提供可用機位、機柜位的搜索、預(yù)占、審核和上線功能。對于已經(jīng)預(yù)占的機位和空間,管理員可根據(jù)優(yōu)先級,審核、取消、編輯和再分配。容量管理與資產(chǎn)管理、基礎(chǔ)設(shè)施監(jiān)控有緊密數(shù)據(jù)聯(lián)系,能根據(jù)資產(chǎn)變更和基礎(chǔ)設(shè)施運行狀態(tài)自動更新容量數(shù)據(jù)。與能耗系統(tǒng)有關(guān)聯(lián)性分析,根據(jù)IT設(shè)備實際能耗,對設(shè)備放置位置做建議。

    3.2 能耗管理

    對數(shù)據(jù)中心生命周期內(nèi)連續(xù)供應(yīng)的能源進行品質(zhì)監(jiān)測、效率提升、運營成本優(yōu)化的過程,是對資源消耗持續(xù)計量、統(tǒng)計、分析、診斷、控制及優(yōu)化提升的過程。能實時計算PUE、PPUE、CLF、RER等數(shù)值。結(jié)合能效數(shù)據(jù),采用大數(shù)據(jù)分析各系統(tǒng)能耗使用分布,梳理系統(tǒng)運行過程中的能耗消耗點,根據(jù)匹配的能耗知識庫,關(guān)聯(lián)出相應(yīng)的節(jié)能改進建議措施;支持查看能耗基準線、為數(shù)據(jù)中心擴容提供容量規(guī)劃;根據(jù)采集的數(shù)據(jù),繪制出數(shù)據(jù)中心的能耗圖。

    3.3 運維管理

    對數(shù)據(jù)中心的所有工作進行規(guī)范化、流程化、標準化信息化、自動化管理。運維管理基于ITIL、ISO20000國際標準理論框,內(nèi)置標準流程、分析報表、服務(wù)臺、配置項管理、績效考核、事件管理等一整套專業(yè)的服務(wù)臺運營模型。通過工單管理流程,記錄各種信息故障申報請求,并對故障處理的過程進行跟蹤和處理,通過SLA(服務(wù)水平協(xié)議)完成績效考核指標;建立知識庫,提高故障排除效率;建立庫存信息,對備品備件、工具進行統(tǒng)一管理;對設(shè)備供應(yīng)商進行管理,為運維人員提供有效的設(shè)備參考信息。系統(tǒng)具備關(guān)聯(lián)影響分析功能,對于運維工作的運行影響和業(yè)務(wù)影響進行風險評估,結(jié)合3D可視化進行展示。

    3.4 變更管理

    對維護過程中基礎(chǔ)設(shè)施、系統(tǒng)或服務(wù)所作出的各種改變進行管理。建立變更管理流程,流程可自定義,主要包括:變更角色、變更內(nèi)容分類、關(guān)聯(lián)影響分析、變更審核、變更實施、變更保障、變更驗證、回退/補救、配置備份等步驟。系統(tǒng)規(guī)范了變更工作順序、記錄工作詳情、智能分析隱患、模擬變更結(jié)果,減少意外狀況,節(jié)省時間與成本,改善服務(wù)質(zhì)量。

    3.5 資產(chǎn)管理

    采用標簽綁定采集條方式實現(xiàn)設(shè)備一對一高效管理,每臺設(shè)備通過標簽連接到機柜資產(chǎn)信息采集條,精確到U位。集成3D技術(shù),多圖層展示資產(chǎn)所在位置。建立資產(chǎn)全生命周期管理流程,對資產(chǎn)出入庫態(tài)、上下架、變更、折舊、報廢等進行跟蹤。提供豐富的統(tǒng)計分析圖標及可視化輔助決策、提供可定制化的變更管理流程。資產(chǎn)管理與財務(wù)管理進行資產(chǎn)數(shù)據(jù)交互,通過財務(wù)審核和財務(wù)賬表,對IT資產(chǎn)進行監(jiān)督。系統(tǒng)能自動生成IT資產(chǎn)總賬、分類賬、明細賬。

    3.6 線纜連接管理

    管理有兩種內(nèi)容:第一對IT設(shè)備之間及機電設(shè)備之間的物理端口連線。第二基礎(chǔ)物理連接上對IT設(shè)備訪問,操作與控制。系統(tǒng)采用智能電子配線架,為系統(tǒng)管理員提供所有連接的狀態(tài)信息,通過對主干鏈路或重要物理連接實時監(jiān)控,使管理員能夠更快的發(fā)現(xiàn)和解決網(wǎng)絡(luò)中出現(xiàn)的問題。電子配線架與DCIM系統(tǒng)進行集成,共享設(shè)備連接信息,DCIM系統(tǒng)結(jié)合容量數(shù)據(jù)、能耗數(shù)據(jù)、IT設(shè)備運行數(shù)據(jù)等,對容量優(yōu)化、能耗提升決策、機架空間優(yōu)化等給出建議。

    3.7 基礎(chǔ)設(shè)施管理

    管理范圍包括動力監(jiān)控系統(tǒng)、安防監(jiān)控系統(tǒng)、環(huán)境監(jiān)控系統(tǒng)等。使用傳感器、電控裝置、智能儀表、控制器等設(shè)備,對基礎(chǔ)設(shè)施各子系統(tǒng)和設(shè)施進行實時監(jiān)測和控制,能模擬仿真基礎(chǔ)設(shè)施系統(tǒng)架構(gòu)、運行狀態(tài)。采用統(tǒng)一接口,對各子系統(tǒng)報警信息進行監(jiān)視、過濾、分級,匯總,建立故障關(guān)聯(lián)模型,預(yù)見或及時感知直接故障和間接故障、提前決策。提供各類數(shù)據(jù)統(tǒng)計與分析。

    3.8 大數(shù)據(jù)分析系統(tǒng)

    在分布式并行計算技術(shù)、復(fù)雜事件處理技術(shù)和機器學習的基礎(chǔ)上,采用機器學習、人工智能、神經(jīng)網(wǎng)絡(luò)等先進技術(shù),深度挖掘數(shù)據(jù)的相關(guān)性和規(guī)律,研究跨系統(tǒng)關(guān)聯(lián)模型,實現(xiàn)智能故障管理分析。掌握設(shè)備和子系統(tǒng)運行趨勢,前瞻性發(fā)現(xiàn)設(shè)備和各子系統(tǒng)可預(yù)見非突發(fā)性故障。建立能耗和電費成本模型,結(jié)合數(shù)據(jù)中心運行參數(shù),計算動態(tài)成本,為經(jīng)濟性提供參考。實時分析數(shù)據(jù)中心運行參數(shù),結(jié)合系統(tǒng)配置信息,智能預(yù)警系統(tǒng)運行狀態(tài)。

    上述的8個子系統(tǒng)是相輔相成,不可分割的,系統(tǒng)關(guān)系如圖5所示。運維管理是DCIM核心部分,通過它對數(shù)據(jù)中心所有工作進行監(jiān)督和管理。變更管理既是為資產(chǎn)的數(shù)據(jù)操作提供需求,也是資產(chǎn)數(shù)據(jù)維護、更新、分析的依據(jù)和來源,資產(chǎn)管理以價值來體現(xiàn)整個系統(tǒng)的應(yīng)用?;A(chǔ)設(shè)施管理為數(shù)據(jù)中心運行提供設(shè)備保證。容量管理、能耗管理、線纜連接管理對維護工作起到重要支撐作用。大數(shù)據(jù)分析系統(tǒng)匯聚各個系統(tǒng)數(shù)據(jù),通過數(shù)據(jù)匯聚、流數(shù)據(jù)處理、復(fù)雜事件處理等手段,從而實現(xiàn)數(shù)據(jù)中心管理智能化、自動化、流程化。8個子系統(tǒng)形成一個高效、規(guī)范和充滿活力工作流程。因此,平臺在設(shè)計上沒有將各個功能模塊孤立出來,而是以操作人員基礎(chǔ),以工作流程為鎖鏈,以權(quán)限為安全機制,將各個功能模塊的功能集成在不同的工位操作界面上,使各個功能在工作流轉(zhuǎn)的過程中融會貫通,形成一個有機的整體具體的系統(tǒng)關(guān)系描述。

    圖5 系統(tǒng)關(guān)系圖

    4 結(jié)束語

    隨著廣西電子政務(wù)外網(wǎng)業(yè)務(wù)向云架構(gòu)、云計算技術(shù)等不斷應(yīng)用,數(shù)據(jù)中心基礎(chǔ)設(shè)施作為最大的物理載體,規(guī)模將不斷的增大。利用DCIM系統(tǒng)對數(shù)據(jù)中心日常運營工作進行管理,可提高數(shù)據(jù)中心的可用性、效率、運營管理水平和成熟度,達到最終的管理目標。在這個系統(tǒng)的基礎(chǔ)上,可采用云服務(wù)的方式,將DCIM軟件系統(tǒng)的能力云化,使DCIM系統(tǒng)以軟件+智能硬件的方式實現(xiàn)SaaS服務(wù),對區(qū)內(nèi)其他電子政務(wù)外網(wǎng)節(jié)點的數(shù)據(jù)基礎(chǔ)設(shè)施進行管理。

    猜你喜歡
    子系統(tǒng)數(shù)據(jù)中心運維
    不對中轉(zhuǎn)子系統(tǒng)耦合動力學特性研究
    酒泉云計算大數(shù)據(jù)中心
    GSM-R基站子系統(tǒng)同步方案研究
    運維技術(shù)研發(fā)決策中ITSS運維成熟度模型應(yīng)用初探
    駝峰測長設(shè)備在線監(jiān)測子系統(tǒng)的設(shè)計與應(yīng)用
    風電運維困局
    能源(2018年8期)2018-09-21 07:57:24
    民航綠色云數(shù)據(jù)中心PUE控制
    電子測試(2018年11期)2018-06-26 05:56:24
    雜亂無章的光伏運維 百億市場如何成長
    能源(2017年11期)2017-12-13 08:12:25
    基于ITIL的運維管理創(chuàng)新實踐淺析
    基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應(yīng)用
    珲春市| 昌平区| 凤山市| 武宁县| 宜君县| 津南区| 宣城市| 泰顺县| 泸西县| 独山县| 桂东县| 井研县| 康保县| 稻城县| 万荣县| 大埔区| 礼泉县| 穆棱市| 建湖县| 谢通门县| 望都县| 太仓市| 临武县| 化隆| 长治县| 太湖县| 宁安市| 盐山县| 汪清县| 西青区| 兴和县| 瓮安县| 黎川县| 都昌县| 威海市| 大宁县| 大新县| 天柱县| 太谷县| 杭锦后旗| 彭泽县|