鄧曉蕾
東軟云計算提出了“上云三步走”的解決方案,涵蓋了私有云環(huán)境的建設和管理方案、原有系統(tǒng)云化改造方案,以及云應用性能分析和決策支持方案,解決了不同階段遇到的不同問題,最符合城區(qū)云化改造建設的需求。
全面提升信息化水平,形成信息化與城市經(jīng)濟社會各方面深度融合的發(fā)展態(tài)勢,從“數(shù)字城區(qū)”向“智慧城區(qū)”全面躍升。
上云是必經(jīng)之路
北京市某城區(qū)原有的各個業(yè)務系統(tǒng),最初都是基于傳統(tǒng)“煙囪式”的架構建立的,以物理機環(huán)境為主,業(yè)務資源不能實現(xiàn)有效共享。隨著業(yè)務的快速發(fā)展,IT資源成了業(yè)務的掣肘,這是政務信息化發(fā)展中普遍存在的一個問題。如果不從基礎架構層面打破原來的管理模式和方法,智慧城區(qū)的工作將很難開展。
目前該城區(qū)已有獨立的數(shù)據(jù)中心,但是2015年~2016年,服務器的數(shù)量猛增到200多臺,機柜容量趨近飽和,而且機房的散熱和電力供應壓力較大。那么,是在原有機房的基礎上擴容,修修補補,還是來一次徹底的云化?權衡之后,城區(qū)政府決定將業(yè)務遷移到云上,這樣不僅可以保證以后業(yè)務的連續(xù)性,而且可以讓整體基礎設施長久、健康的發(fā)展
上云或者不上云,這對城區(qū)政府來說并不是一個選擇題。從促進業(yè)務的角度出發(fā),上云的大方向是確定的。
上云按部就班
城區(qū)政府若希望借上云契機,將全部業(yè)務流程云化,涉及服務器、存儲、網(wǎng)絡和不同的負載,這就需要一個整套的云化解決方案。
東軟云計算提出了“上云三步走”的解決方案,涵蓋了私有云環(huán)境的建設和管理方案、原有系統(tǒng)云化改造方案,以及云應用性能分析和決策支持方案,解決了不同階段遇到的不同問題,最符合城區(qū)云化改造建設的需求。
第一步,用好云環(huán)境(SaCa Aclome)。私有云的基礎環(huán)境建設都大同小異,但是在IaaS資源層建設完成后,如何有效地實現(xiàn)對云環(huán)境整體運行情況的監(jiān)控,如何快速創(chuàng)建云主機,以及自動安裝常用的中間件,如何在云主機創(chuàng)建后自動完成相關防火墻、負載均衡和堡壘機的規(guī)則配置,如何屏蔽底層多種虛擬化軟件來的技術差異,這些才是能否用好云環(huán)境的關鍵。東軟提供的SaCa Aclome敏捷云管理平臺是一款專為私有云構建的企業(yè)級云計算管理平臺,提供對數(shù)據(jù)中心全方位的監(jiān)控運維能力,還可快速交付和管理基礎架構和云應用,可為VMware、OpenStack、CloudStack、Docker和公有云等云平臺提供一整套全面的管理體系,實現(xiàn)統(tǒng)一的管理體驗。城區(qū)政府在部署SaCa Aclome云管理平臺之后,不僅實現(xiàn)了底層多個國產(chǎn)化虛擬軟件的統(tǒng)一管理,還通過自定可視化展示和云服務目錄管理功能,不僅實現(xiàn)了對云數(shù)據(jù)中心的監(jiān)控,還搭建私有云服務門戶,讓業(yè)務人員自助申請云資源。并且云平臺提供應用倉庫和軟件自動安裝功能,從而讓業(yè)務人員快速獲得主機和軟件自動安裝部署功能,而且還提供自動化腳本配置功能,可以自動完成防火墻和堡壘機的配置,減少了人工的參與,有效提升了云資源交付的效率,為后續(xù)的應用上云提供了強有力的支撐。
第二步,建好云應用(SaCa ACAP)。基礎設施云化,已經(jīng)使得整個系統(tǒng)邁入了云化的大門。建好適合于云環(huán)境的、可以充分利用云環(huán)境特征的應用,才是整個改造的核心目標。云環(huán)境資源具有隨需即取的特性,可以實現(xiàn)應用規(guī)模的彈性伸縮,實現(xiàn)快速應用部署及交付,提升整個城區(qū)應用系統(tǒng)的服務質量,但云環(huán)境的這些優(yōu)勢,需要有相配合的應用架構進行支撐。
采用微服務架構構建適合于云環(huán)境的應用,無疑是上佳選擇。所謂微服務架構,是指將一個應用系統(tǒng)拆分為多個微小、具有獨立功能的小的應用,這些小的應用可以獨立地編譯及部署,并通過各自的API接口相互通信,它們彼此相互協(xié)作,作為一個整體為用戶提供功能,又可以獨立地進行擴容的一種應用構建方式。微服務架構應用,每一部分都可以獨立彈性伸縮,獨立地部署上線,可以很好地利用云環(huán)境的資源。但瑕不掩瑜,采用微服務架構也會為應用構建帶來麻煩。微服務架構涉及技術眾多、涉及面廣,對開發(fā)人員技術能力要求很高,使得測試難度較傳統(tǒng)應用更為困難,微服務使得系統(tǒng)部署規(guī)模急劇增大,管理運維難度較高,這些問題,成了云應用系統(tǒng)構建的攔路虎。
智慧城區(qū)采用了SaCa ACAP(敏捷云應用支撐平臺)來應對這個難題。SaCa ACAP提供一整套成熟的微服務開發(fā)框架、開發(fā)工具及運行支撐的中間件。通過開發(fā)框架及工具,屏蔽了絕大部分構建微服務應用需要了解的底層技術,使得開發(fā)人員可以專注于業(yè)務邏輯開發(fā),而不必將精力浪費在了解各種底層框架、進行大量復雜配置。SaCa ACAP的微服務測試工具,可以自動分析待測試微服務應用外部依賴,生成模擬的外部依賴對象及測試模板,提供與傳統(tǒng)應用開發(fā)一致的測試體驗。SaCa ACAP還提供了微服務網(wǎng)關、服務注冊中心、服務配置中心、服務治理監(jiān)控中心等等一系列運行中間件,在保障微服務應用穩(wěn)定運行同時,極大地降低了微服務應用管控運維的難度。
通過使用SaCa ACAP平臺,智慧城區(qū)實現(xiàn)了應用云化的核心目標,應用構建、上線及響應業(yè)務需求的速度也獲得了極大的提升,實現(xiàn)了建好云應用的目標。
第三步,管好云應用(RealSight APM)。經(jīng)過前面的上云兩步走,順利地將原有業(yè)務系統(tǒng)遷移到云上,但是這些應用的性能分析、決策支持目前還依賴于手工統(tǒng)計、人工計算的方式,缺乏科學有效的手段,一旦決策失誤,造成的影響是長遠的、重大的??茖W決策的重要前提是對各類信息的廣泛和精確地掌握,以及能夠見微知著,發(fā)現(xiàn)這些信息和數(shù)據(jù)的內(nèi)在聯(lián)系。
“互聯(lián)網(wǎng)+”在各領域的快速推進使得軟件滲入了業(yè)務的方方面面,所有公司都在考慮應用軟件性能對業(yè)務的影響。任何應用軟件性能波動將直接影響用戶體驗和工作效率。政府、企業(yè)對應用軟件依賴程度逐漸提高,使得對應用性能及其依賴(中間件、數(shù)據(jù)庫、云環(huán)境、服務器等)的監(jiān)管比以往更加重要。企業(yè)在應用性能管理方面的投入逐年升高。
根據(jù) Forrest的統(tǒng)計數(shù)據(jù),有57%的企業(yè)IT運維部反饋至少每周會發(fā)生一次影響應用性能和可用性的問題;每天發(fā)生問題的比例占到28%。對于愈加依賴應用面向客戶實現(xiàn)企業(yè)價值、提升工作效率的當今企業(yè)來說,這種問題越來越無法忍受。
雖然政府、企業(yè)投入很大,但在應用性能管理方面獲得的收益卻并不明顯。通常企業(yè)構建部署的應用管理系統(tǒng)采集管理的大量應用性能指標數(shù)據(jù)僅服務于運維人員基礎統(tǒng)計查詢及告警機制觸發(fā)。隨著政府、企業(yè)部署應用數(shù)量迅速增加,以及新技術(如混合云、虛擬化、大數(shù)據(jù)等)、新需求(如支持移動終端、信息主動推送等)促使應用系統(tǒng)復雜化、多樣化,使得穩(wěn)定性、性能保障更加困難。
城區(qū)云面臨的應用性能管理被動的局面,首先需要變被動解決風險告警為主動發(fā)現(xiàn)潛在問題和風險。然而,并非每個政府部門都擁有經(jīng)驗豐富、響應迅速的應用性能管理、運維團隊。除此之外,政府內(nèi)應用數(shù)量,以及應用架構復雜度的增加,監(jiān)控指標及單位時間產(chǎn)生的監(jiān)控數(shù)據(jù)量成倍增長,加之運維數(shù)據(jù)本身有價值的信息密度較低,人工篩選分析工作量巨大,運維人員難堪重負。如何通過更加智能的方式實現(xiàn)應用性能管理(APM),是當前應用性能管理面臨解決的關鍵問題之一,需要建立應用性能管理平臺,才能長期解決這些問題。
圍繞核心需求,城區(qū)云應用系統(tǒng)基于東軟RealSight APM應用性能管理平臺產(chǎn)品規(guī)劃、建設一站式云應用性能管理平臺,實現(xiàn)了云環(huán)境下海量應用系統(tǒng)的集中監(jiān)控及運維管理。相比傳統(tǒng)應用運維方式,該平臺的核心優(yōu)勢有以下幾點。
更簡單的運維管理模式。簡化海量監(jiān)控指標數(shù)據(jù)分析工作, 以聚合指標指示應用性能,將海量基礎指標轉換為容易理解的應用健康狀態(tài)聚合指標,并實時更新,避免人工篩查海量數(shù)據(jù),簡化告警策略,提升管理效率。
主動防御應用性能風險。變被動解決風險告警為主動發(fā)現(xiàn)預防問題及風險。在給定預期負載條件下分析預測潛在問題及風險,使企業(yè)能夠提前發(fā)現(xiàn)風險,防患未然。降低由應用穩(wěn)定性、性能問題帶來的經(jīng)濟損失。
自動化的應用容量規(guī)劃。預測應用性能及負載變化趨勢, 提前發(fā)現(xiàn)應用資源配置存在的問題,定位應用資源超配或資源配置不足,幫助運維人員找到最優(yōu)資源配置方案,提升資源利用率,節(jié)約成本。
智能化風險根源問題分析。以更加自動、智能的方式分析應用性能異常,生成指定時間段內(nèi)的詳細診斷分析報告,輔助快速排查、定位根源問題,將運維人員從繁雜的海量運維數(shù)據(jù)分析工作中解放出來。
客戶價值
將部分業(yè)務遷移到城區(qū)云后,數(shù)據(jù)中心資源利用率整體提升至70%,總體能耗降低30%,業(yè)務部署周期從月級縮減到小時級;全自動監(jiān)控,降低運維人員90%以上的工作量;業(yè)務運行全程預警,快速定位根源問題;完美大屏展現(xiàn)方案,滿足參觀、檢查、驗收等需求;業(yè)務性能與資源動態(tài)匹配,提升了IT系統(tǒng)服務水平。
截至目前,城區(qū)政府已經(jīng)把部分政務系統(tǒng)遷到了云上,預計到明年年底之前,會按照從非核心業(yè)務系統(tǒng)到核心業(yè)務系統(tǒng)的順序,陸續(xù)將所有政務系統(tǒng)遷移到云平臺上。