賴慧敏
摘要:隨著我國經濟和科技的不斷提高與發(fā)展,大數據的時代早已經步入到人們的日常生活之中,數據中心也隨著我國的發(fā)展而進行轉型了,除此之外,小型的數據中心也已經慢慢的向著托管這一方面轉型了。我們國家的數據中心正在慢慢呈現集約化的特點改進。所以就導致了運維管理層次現在面臨著巨大的變化和挑戰(zhàn).
關鍵詞:大數據時代;自動化運維管理;實踐思考
引言;隨著電網信息系統處于高速發(fā)展階段,復雜程度以及操作難度等都越來越高,運維管理的難度也越來越大,存在的問題也逐漸顯現出來。這其中包括:運維管理混亂、運維人員水平較低、運維過程的高成本低投入,這些都制約著運維效率和質量的提高和自動化的實現。電網信息系統運維管理自動化難以實現,會直接導致電網的整體運行自動化以及穩(wěn)定性無法實現提升,影響電能輸送的穩(wěn)定性、高質量性、高效率性以及安全性。因此,電力部門以及企業(yè)需要深刻地認知到這一現狀,以及這一現狀改變的迫切性,投入精力和成本,深入地研究實現電網信息系統運維管理自動化的具體措施.
1自動化運維管理的構建思路是什么
在我國以前數據規(guī)模不大,較為小規(guī)模的時候,出現某一些故障的概率也比較小,所出現的問題較不明顯,但是隨著我國經濟科技發(fā)展,集群和業(yè)務的規(guī)模也在不斷的擴大,所以故障出現的概率也在不斷的增加。例如網絡的設備不斷增多,在網絡的傳輸過程中經過的路線也在不斷的增加,逐漸變得復雜,環(huán)節(jié)也在逐漸的增多,所以就導致出現故障的概率也隨之變大。所以在實際的運維中,工作量的激增,導致相關的操作人員也在軟件和硬件的配置等方面容易出現問題或是錯誤,還有操作的軟件和硬件環(huán)境變得復雜,使得我們對于工具的穩(wěn)定性要求大大提高,例如有部分機器無法接收到指令,就容易在操作的過程中出現了問題,增大的操作的風險。我們一直強調自動化的運行,就是為了提高執(zhí)行命令的效率以及增加機器的穩(wěn)定性??偠灾?,人為的操作容易導致故障頻發(fā),降低了效率,而且那些簡單的,一直在重復的工作,用程序來執(zhí)行更容易提高效率。自動化運維管理模式有很多好處,那么我們如何進行自動化的行為模式呢,在大數據時代下,我們可以從問題的排查、軟硬件的修復、還有交付和維護這四個方面來進行1.1日志數據
在傳統的數據管理中,我們雖然已經有了配置管理的相關概念,把不同種類的CI運用不同的規(guī)則緊密的聯系在一起,但是在傳統的數據業(yè)務中沒有清楚的體現這個優(yōu)勢,所以我們可以先通過服務器上的Agent來依據配置的不同規(guī)則來對日志信息進行收集,我們還可以通過對一些相關的過濾信息進行查詢,這些信息不僅可以進入到計算的平臺上進行計算和數據的分析,還可以把這些計算結果都存到RDS數據庫里。
1.2我們要做好配置的管理工作
在集群上面,我們要加強不同軟件,對于配置的分理工作。我們還要通過一定的設計,對配置管理過程中的CI來進行設計,在業(yè)務運行的基礎上,CI的關系勾勒出來。并形成運維的基本素質,這就是自動化運維管理的基本也是我們國家進行數據推動的前提要素。這種工作打破了,以往的不同種類,CI都是分散的局面,相互之間的聯系變得更加基礎,還可以反映了CI的技術地圖。
2運維管理的發(fā)展歷程有哪些
通過以上的數據,我們可以看到在我們國家,我們都是以大型的運行數據來做基本支撐的,所以自動化運維的重點就是在數據的把握這方面,通過很多的實驗可以得出我們所提供的數據越豐富就對運維的驅動化越精細,例如在資源調度器,里面有很多用戶資料的申請信息以及申請之后的消耗值對比,通過這兩個數據的比對,在滿載百分之一百里面進行對比。而最終的結果就是對調度模型的資源使用情況有一個大體的展示,然后我們再進一步的對這個結果進行分析和優(yōu)化來對資源實現有效的利用。我們在利用構架對于作業(yè)的情況來進行分析,接下來就仔細盤點資源的使用方向有哪些,最終我們運用連續(xù)不同的數據就可以判斷出在一定的時間內資源所進行使用的最高值是哪些,以便我們更好的掌握系統優(yōu)化的方向,還可以提醒自己進行應用的優(yōu)化還有平臺層次的優(yōu)化來更加接近資源使用的最優(yōu)值,以此來達到節(jié)省資金成本到最終目的。還有從另一個方面來說,傳統的運維管理工作方面?zhèn)戎氐氖顷P于平臺的安全性還有穩(wěn)定性,從而忽略了平臺的質量和用戶的體驗性,因為管理與應用是緊密聯系的,所以因為管理往深層次方面走,這就是運營的日常思路,對于運維管理來說,他們的重點就是如何構建持的信息庫。
3運維管理自動化實現難點
3.1運維管理的模式問題
現階段,自動化信息系統運維管理自動化主要采用的模式為多頭管理,即根據企業(yè)的實際情況,確定運維管理的實際開展,這一模式的特點就是能夠排除重復的工作,而存在的問題就是運用效率低,以及維護管理效果不佳,同時工作人員的操作難度較大,在運維管理層面的人工費也較高,對于自動化的進一步推進是極為不利的,同時也是一種相對不科學的運維管理模式。
3.2運維管理自動化程度低
信息系統運維管理自動化實現的難點包括技術的相對落后,運維管理觀念的優(yōu)待升級,具體表現為:運維管理運維管理自動化程度低.往往是作用在信息系統出現問題之后,造成一定損失,對于信息系統運行的穩(wěn)定性作用較弱,信息系統運行的潛在危險因素無法有效地規(guī)避,出現意外以及事故的概率較高,企業(yè)損失無法有效控制,企業(yè)的發(fā)展也受到嚴重的負面影響和阻滯。在此過程中所遵循的運維管理觀念就是處理為主,預防為輔。因此,整體的自動化水平相對較低,無法實現有效及時地檢測,導致部分潛在的問題不能及時地控制解決和采取相應的預防措施,運維管理的質量效率也無法有效提升,運維管理的價值和作用也無法體現。
4運維管理自動化實現策略
4.1數據資產管理子系統和運維支撐子系統
在電網信息系統運維管理過程中,數據信息較為龐大,數據資產管理子系統能夠對數據進行及時的收集,同時對數據進行管理,保證數據的穩(wěn)定性以及數據的完整性安全性。運維支撐子系統通過對運維整個流程的分析管理實現運維運行過程中對整個流程以及系統的控制支撐
4.2業(yè)務監(jiān)控子系統
在信息系統管理自動化結構中,業(yè)務監(jiān)控子系統是極為重要的組成部分,業(yè)務監(jiān)控子系統能夠監(jiān)控信息系統的整體運行正常性以及運行速度等,通過對信息系統運行過程中的各類數據及時捕捉、處理分析,呈現一個較為具體、立體、清晰的運行狀態(tài)模型,呈現一個較為具體化的監(jiān)控狀態(tài),能夠有效地規(guī)避風險,有效地降低運行危險性,實現信息系統的風險承受能力提升。并且通過對這些數據的處理分析提前確定風險因素和潛在危險等,能夠進一步地確定風險的發(fā)生概率、風險的種類、風險發(fā)生因素等,給予警報提醒,并及時地分析,提出控制防范的措施方案,有效規(guī)避風險,提升信息系統的整體業(yè)務能力。也能夠實質性地推動信息系統管理自動化的進一步發(fā)展完善
結語:在這篇文章中,提到了自動化的運維管理,著重強調的是數據的不斷驅動,并對于自動化的運維管理提出了自己的見解和看法,例如運維效率向著運維價值的不斷變化。
參考文獻:
[1]郝昱,李楊,申雙奎.智能城市電網多源信息系統融合應用[J].成都工業(yè)學院學報,2016,19(4):45-49,66.DOI:10.13542/j.cnki.51-1747/tn.2019.04.012.
[2]李妍.基于云計算技術的電力系統虛擬辦公自動化系統的設計與實現[D].天津:天津大學,2019.
[3]孟鳴岐,田兵,嚴文濤,等.能源互聯網控制系統的安全、閉環(huán)、智能平臺的研究與應用[Z].國網山東省電力公司信息通信公司,2019.