管理實踐的目的是確保服務達到商定的績效,以成本效益的方式滿足當前和未來的需求。
服務性能關聯(lián)兩個方面:服務行為的數(shù)量和所需的時間。
服務能力是指配置項或服務所能夠提供的最大產(chǎn)量。
管理實踐涉及到對服務本身及其所依賴的資源,如基礎架構、應用程序、第三方服務,以及人員能力等方面的分析、建模、需求預測、資源規(guī)劃,以及事件處理等。
如果說前面的業(yè)務分析是保障服務質(zhì)量的前提,那么能力和性能管理則起到了承前啟后的作用,它能夠為后面馬上要提到的變更管理實踐提供參考與依據(jù)。
為了實現(xiàn)目標與成本的平衡,也就是俗稱的“花得值”,我們應當主要著眼于:提供方能夠在恰當?shù)臅r間,提供恰當?shù)姆账健?/p>
具體而言,它涉及到如下管理實踐:
通過適當?shù)慕?,對現(xiàn)有的流程予以掌控,進而精準地錨定業(yè)務性能的預期、并做好前期的規(guī)劃。
充分了解當前服務的交付能力、以及整體的技術走勢。根據(jù)現(xiàn)有的SLA 和OLA,建立各項服務的現(xiàn)狀基線、與閥值警報機制,進而為可能出現(xiàn)的性能問題,提供可參考的診斷依據(jù)。
通過監(jiān)控、記錄、分析、報告各類資源的使用情況,發(fā)現(xiàn)配給的不足、找到不同應用場景下的臨界點、以及可能出現(xiàn)的資源閑置狀況,進而在成本最優(yōu)的前提下,實現(xiàn)供求的平衡。
與此同時,能力與性能管理也能夠為企業(yè)帶來一定的為前瞻性,通過監(jiān)視當前服務中的所有組件,評審各項運能指標,以確保出現(xiàn)服務質(zhì)量拐點,但尚未構成嚴重故障或中斷時,就能夠被及時地發(fā)現(xiàn)并予以解決。
由于我們企業(yè)的IT 服務架構具有地理上分布較廣的特點,因此我們曾經(jīng)碰到過:局部調(diào)整對于整體服務性能產(chǎn)生影響的問題。
當時,我們有一個云計費模塊,持續(xù)判斷并記錄著,那些由各個用戶所觸發(fā)的、滿足計費條件的打印與復印作業(yè)。
然而,在某一次局部升級調(diào)整之后,它出乎意料地影響到了全球各地辦公站點的打印與復印服務的輸出性能與速度。由于我們?nèi)狈Υ蛴∷俣鹊谋O(jiān)控,因此直至造成了一定規(guī)模的影響后,才發(fā)現(xiàn)并予以糾正。
另外,為了避免出現(xiàn)以往對于物理資源,所采取的死板預分配以及對網(wǎng)絡帶寬的被動管理模式,我們在云服務的“彈性伸縮”特點上“做足功課”。通過與云服務商的協(xié)作,我們對現(xiàn)有的云服務資源,實施了全面的端到端式的狀態(tài)監(jiān)控。有了第一手的數(shù)據(jù)指標,我們就能夠及時地了解業(yè)務方的需求、實際的消費狀況以及當前的安全態(tài)勢。
籍此,我們能夠在兼顧成本績效的前提下,動態(tài)調(diào)整容量,實時改進運能,進而修正監(jiān)控基線,從而形成了正反饋。