許國(guó)棟
摘 要:業(yè)務(wù)的發(fā)展日新月異,對(duì)IT基礎(chǔ)架構(gòu)的支撐能力造成了很大壓力,需尋求更好的方法來(lái)規(guī)劃和管理IT資源,在控制運(yùn)營(yíng)成本的同時(shí),既能有效保障服務(wù),又能適應(yīng)新業(yè)務(wù)的快速發(fā)展。本文介紹了一種IT 系統(tǒng)容量規(guī)劃方法,并總結(jié)了進(jìn)行容量規(guī)劃的基本過(guò)程,為企業(yè)信息化管理提供參考和借鑒。
關(guān)鍵詞:容量預(yù)測(cè) 性能建模 預(yù)測(cè)模型
中圖分類號(hào):TP30 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2018)05(c)-0032-02
容量管理一直是信息化管理中的難點(diǎn),也是一門平衡的藝術(shù)。在信息技術(shù)領(lǐng)域,容量是指特定軟硬件系統(tǒng)能夠提供的最大能力。容量規(guī)劃是一種用來(lái)評(píng)估將來(lái)某一段時(shí)間內(nèi)系統(tǒng)所需資源的技術(shù),包括計(jì)算機(jī)軟硬件和網(wǎng)絡(luò)帶寬等。
如何做好容量管理是普遍存在的困惑。對(duì)于IT規(guī)劃部門,需考慮如何準(zhǔn)確評(píng)估、合理制定IT預(yù)算,以便為業(yè)務(wù)的發(fā)展提供良好支撐。對(duì)于IT采購(gòu)和建設(shè)部門,一方面需要考慮軟硬件采購(gòu)的合理性,力求以合理的支出產(chǎn)生最大的效益;另一方面,需要有足夠的預(yù)見(jiàn)性,制定合適的采購(gòu)方案以便滿足業(yè)務(wù)發(fā)展的需要。
對(duì)于IT運(yùn)維部門,關(guān)注日常運(yùn)維過(guò)程中的容量指標(biāo)變化趨勢(shì),及時(shí)發(fā)現(xiàn)容量瓶頸,甚至提前預(yù)警潛在的性能和容量問(wèn)題。
業(yè)務(wù)部門作為資源需求方,如何對(duì)基礎(chǔ)架構(gòu)和配置提出合理需求,滿足產(chǎn)品上線要求,確保系統(tǒng)性能可靠,長(zhǎng)期穩(wěn)定運(yùn)行。
1 概述
容量管理的目的在于定義、跟蹤和控制業(yè)務(wù)系統(tǒng)的容量,確保業(yè)務(wù)負(fù)載能夠滿足客戶的需求和對(duì)應(yīng)的服務(wù)級(jí)別。容量管理的最終目標(biāo)是理解IT運(yùn)維現(xiàn)狀、IT架構(gòu)和業(yè)務(wù)需求,確保能夠在有限的成本前提下有效的滿足當(dāng)前和未來(lái)業(yè)務(wù)發(fā)展需求中容量和性能的要求。
容量管理覆蓋IT系統(tǒng)的整個(gè)生命周期。在需求階段,即在構(gòu)建產(chǎn)品前就需要對(duì)所需IT基礎(chǔ)架構(gòu)資源進(jìn)行評(píng)估。在測(cè)試階段在系統(tǒng)開發(fā)或試運(yùn)行階段,通過(guò)測(cè)試工具和方法,仿真生產(chǎn)系統(tǒng)推測(cè)系統(tǒng)性能容量。在系統(tǒng)運(yùn)維階段,即系統(tǒng)上線后,根據(jù)實(shí)際業(yè)務(wù)工作負(fù)載變化情況,分析趨勢(shì),透視增長(zhǎng)率來(lái)規(guī)劃系統(tǒng)的擴(kuò)容和升級(jí),以滿足業(yè)務(wù)發(fā)展需求。
2 容量預(yù)測(cè)模型
常用的容量預(yù)測(cè)方法有趨勢(shì)外推法,其方法特點(diǎn)是給予監(jiān)控歷史數(shù)據(jù)進(jìn)行趨勢(shì)外推,一般采用灰色預(yù)測(cè)模型或回歸測(cè)試模型,預(yù)測(cè)精度可達(dá)80%~90%。另一種常用的預(yù)測(cè)方法是業(yè)務(wù)組件相關(guān)分析,一方面通過(guò)監(jiān)控運(yùn)行數(shù)據(jù),找到各類業(yè)務(wù)指標(biāo)在IT基礎(chǔ)架構(gòu)上的資源開銷,推導(dǎo)不同類型業(yè)務(wù)組合下IT基礎(chǔ)架構(gòu)容量的變化。常用的預(yù)測(cè)模型包括逐步回歸模型、因子分析、聚類分析和可能性場(chǎng)景分析等,預(yù)測(cè)精度相對(duì)接較高,可達(dá)90%~95%。
其他常用的負(fù)載預(yù)測(cè)技術(shù)還包括移動(dòng)平均、指數(shù)型平滑和線性回歸等。
(1)移動(dòng)平均。
移動(dòng)平均的基本思路是,下一時(shí)間段的負(fù)載用前n個(gè)時(shí)間段的負(fù)載平均值來(lái)預(yù)測(cè)。其中,f表示預(yù)測(cè)值,y表示實(shí)際值。
表達(dá)式如下:。
(2)指數(shù)平滑。
指數(shù)平滑的方法與移動(dòng)平均類似,也是用歷史數(shù)據(jù)的平均值來(lái)進(jìn)行預(yù)測(cè),但是它對(duì)最近的一個(gè)數(shù)據(jù)給予更多的權(quán)重。α(0<α<1)表示平滑權(quán)重。
表達(dá)式如下:。
(3)線性回歸。
回歸模型是將一個(gè)變量的值看成是其他一組變量的函數(shù),在數(shù)學(xué)上有很多種表現(xiàn)形式,最常見(jiàn)的是線性回歸。
表達(dá)式如下:
(1)
其中b的值:
(2)
其中a的值: (3)
3 建模方法
首先針對(duì)單交易資源開銷計(jì)算,比如Web端、App端和DB端交易資源的開銷情況。其次,對(duì)混合交易資源開銷計(jì)算,爆款校驗(yàn)各個(gè)交易之間的信念相關(guān)性,以及評(píng)估性能模型的準(zhǔn)確性,然后對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行處理,即對(duì)目前的運(yùn)行時(shí)系統(tǒng)及其計(jì)算環(huán)境有一個(gè)全面的了解。系統(tǒng)的全面信息、企業(yè)需求和性能關(guān)鍵點(diǎn)等在這一階段都應(yīng)該被關(guān)注,從而完成系統(tǒng)容量的分析,擴(kuò)容策略分析以及擴(kuò)容時(shí)間點(diǎn)預(yù)測(cè)。最后模型建立和驗(yàn)證,通過(guò)采集運(yùn)行數(shù)據(jù),比較計(jì)算數(shù)據(jù)和真實(shí)數(shù)據(jù)運(yùn)行數(shù)據(jù),不斷調(diào)整模型參數(shù),矯正模型誤差,如圖1所示。
4 建?;具^(guò)程
數(shù)據(jù)建模首先需要了解當(dāng)前應(yīng)用系統(tǒng)和計(jì)算環(huán)境,容量規(guī)劃的數(shù)據(jù)建模的基本過(guò)程主要包括以下四個(gè)步驟。
(1)收集目標(biāo)系統(tǒng)業(yè)務(wù)、負(fù)載數(shù)據(jù)。
歷史數(shù)據(jù)的精度和模式對(duì)預(yù)測(cè)方法的選擇影響很大。趨勢(shì)模式反映了負(fù)載有增加或減少的趨勢(shì),平穩(wěn)模式則無(wú)法看出增減。周期和季節(jié)性周期模式比較類似,都是遵循一定的變化規(guī)律。常用的負(fù)載預(yù)測(cè)技術(shù)包括移動(dòng)平均、指數(shù)型平滑和線性回歸。
明確性能建模目標(biāo)。
獲取系統(tǒng)應(yīng)用和負(fù)載列表。
根據(jù)模型精度需要設(shè)置監(jiān)控的采集信息的粒度。一般而言,粒度越小模型精度越高。
通過(guò)性能測(cè)試,或收集數(shù)周的業(yè)務(wù)和系統(tǒng)負(fù)載數(shù)據(jù)。
(2)數(shù)據(jù)預(yù)處理與加工。
對(duì)原始數(shù)據(jù)按時(shí)間先后順序排序,確定數(shù)據(jù)有效性:刪除重復(fù)數(shù)據(jù),對(duì)空值處理(一般采用拉格朗日插值法進(jìn)行插值)。
將業(yè)務(wù)和資源消耗的采集值轉(zhuǎn)化為小時(shí)均值,并將業(yè)務(wù)量數(shù)據(jù)與資源負(fù)荷相對(duì)應(yīng)。
通過(guò)統(tǒng)計(jì)方法,計(jì)算業(yè)務(wù)量與資源負(fù)荷的相關(guān)性指標(biāo),并進(jìn)行相關(guān)性分析。
噪點(diǎn)濾除:根據(jù)百分位計(jì)算法則,剔除資源利用率樣本中位于95%法則以外的數(shù)據(jù)點(diǎn)。
(3)建立模型。
將預(yù)處理后的數(shù)據(jù)代入公式計(jì)算得出業(yè)務(wù)與資源消耗因子的數(shù)學(xué)模型。
(4)模型驗(yàn)證。
將業(yè)務(wù)數(shù)據(jù)代入數(shù)學(xué)模型,得出相應(yīng)的資源消耗情況。
計(jì)算模型精確度。
通過(guò)性能測(cè)試或歷史數(shù)據(jù)進(jìn)行驗(yàn)證,判定建立的模型是否有效。
預(yù)測(cè)驗(yàn)證。
5 結(jié)論
信息系統(tǒng)性能容量管理致力于預(yù)測(cè)業(yè)務(wù)發(fā)展需求,以合理的成本及時(shí)提供必需的IT資源,是企業(yè)精益化管理中不可或缺的重要組成部分。通過(guò)建立業(yè)務(wù)與資源利用率的性能模型,可及時(shí)了解數(shù)據(jù)中心中各個(gè)系統(tǒng)的資源使用情況,及時(shí)發(fā)現(xiàn)系統(tǒng)的性能瓶頸。根據(jù)業(yè)務(wù)的發(fā)展情況科學(xué)的規(guī)劃IT系統(tǒng)的容量,動(dòng)態(tài)整合資源,對(duì)于保障系統(tǒng)的安全、穩(wěn)定、高效運(yùn)行,保障信息系統(tǒng)的敏捷交付能力至關(guān)重要。
參考文獻(xiàn)
[1] 張小慶.基于云計(jì)算環(huán)境的資源提供優(yōu)化方法研究[D].武漢理工大學(xué),2013.
[2] 梁芝賢,邱小耕,安然.智能電網(wǎng)對(duì)通信的影響與需求[J].電力系統(tǒng)通信,2010(9).
[3] 周靜,呂天光,陳希,等.省級(jí)電力調(diào)度數(shù)據(jù)網(wǎng)帶寬分析與容量規(guī)劃研究[J].電網(wǎng)技術(shù),2012,36(5):173-177.
[4] 文必龍,趙晶浩,張璇,等.IT系統(tǒng)運(yùn)維管理研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013(3):1-5.