陸小銘 ,曹維華 ,蘇志勝 ,許 彤
(1.中國電信股份有限公司廣東研究院 廣州 510630;2.中國電信集團(tuán)公司 北京 100032)
電信運營商的運維支撐系統(tǒng)(OSS)在電信網(wǎng)體系架構(gòu)中屬于支撐網(wǎng)范疇,承擔(dān)著網(wǎng)絡(luò)運營支撐、業(yè)務(wù)開通和質(zhì)量監(jiān)控、客戶服務(wù)保障等重要功能,在電信運營商內(nèi)部的地位與作用和網(wǎng)絡(luò)、終端、業(yè)務(wù)平臺一樣,是運營商核心資產(chǎn)的重要部分,在網(wǎng)絡(luò)建設(shè)和業(yè)務(wù)開通開始就被列入統(tǒng)一的規(guī)劃和建設(shè)中。電信IP網(wǎng)管系統(tǒng)(以下簡稱IP網(wǎng)管)是OSS體系的一部分,負(fù)責(zé)IP數(shù)據(jù)網(wǎng)絡(luò)的管理、維護(hù)和保障。
IP網(wǎng)管是以“集中管理、集中監(jiān)控、集中維護(hù)”為原則進(jìn)行建設(shè)的,在近年的發(fā)展中不斷向面向網(wǎng)絡(luò)、面向業(yè)務(wù)和面向客戶的發(fā)展方向演進(jìn)。目前IP網(wǎng)管支持普通和優(yōu)質(zhì)承載網(wǎng),支持固定和移動互聯(lián)網(wǎng)業(yè)務(wù),支持互聯(lián)網(wǎng)和大客戶VPN業(yè)務(wù)。
隨著運營商IP網(wǎng)絡(luò)的不斷擴(kuò)大、業(yè)務(wù)種類的增多以及運營要求的精細(xì)化,IP網(wǎng)管需要處理的數(shù)據(jù)越來越多,IT基礎(chǔ)設(shè)施面臨著負(fù)載不均衡、設(shè)備管理困難、IT設(shè)備被動擴(kuò)容等諸多問題。云計算作為一種有效的優(yōu)化IT基礎(chǔ)設(shè)施的手段,也提上了IP網(wǎng)管的發(fā)展日程。
IP骨干網(wǎng)網(wǎng)管管理著運營商多張網(wǎng)絡(luò)的骨干部分(如公眾互聯(lián)網(wǎng)、精品承載網(wǎng)、專用承載網(wǎng)等),具體功能一般包括資源配置管理、故障管理、性能管理、流量管理、路由管理、安全管理、業(yè)務(wù)質(zhì)量監(jiān)測、流量監(jiān)測、互聯(lián)網(wǎng)維護(hù)統(tǒng)計分析、VPN業(yè)務(wù)管理、移動互聯(lián)網(wǎng)管理等。
IP骨干網(wǎng)網(wǎng)管結(jié)構(gòu)如圖1所示。IP網(wǎng)管在邏輯結(jié)構(gòu)上采用信息處理的分層原則,可以分為以下3個層面。
·數(shù)據(jù)采集層:負(fù)責(zé)系統(tǒng)與被管網(wǎng)元設(shè)備和網(wǎng)元管理系統(tǒng)之間的通信,通過對各種網(wǎng)絡(luò)管理協(xié)議接口的封裝,提供協(xié)議服務(wù)層的應(yīng)用。通過SNMP、Trap、xflow、Syslog、Telnet、XML、Corba 等網(wǎng)管協(xié)議,采集各種網(wǎng)元設(shè)備、網(wǎng)絡(luò)端到端的管理信息并對這些信息進(jìn)行一定的數(shù)據(jù)預(yù)處理和加工,然后通過軟件總線傳遞給上層數(shù)據(jù)處理層的應(yīng)用功能模塊,處理的結(jié)果通常存放于網(wǎng)管數(shù)據(jù)庫中,如拓?fù)?、資源、故障、性能、流量數(shù)據(jù)庫等。
·數(shù)據(jù)處理層:從數(shù)據(jù)采集層獲取信息,對各種管理應(yīng)用進(jìn)行封裝處理,各模塊之間也可以通過軟件總線交互信息。數(shù)據(jù)處理層根據(jù)系統(tǒng)功能的分層需求又分為網(wǎng)絡(luò)管理應(yīng)用層、業(yè)務(wù)管理應(yīng)用層、事務(wù)管理應(yīng)用層和客戶管理應(yīng)用層,下層為上層應(yīng)用提供服務(wù)。
·數(shù)據(jù)發(fā)布層:系統(tǒng)通過數(shù)據(jù)發(fā)布層向使用用戶提供各種網(wǎng)管應(yīng)用。用戶通過瀏覽器或?qū)S玫目蛻舳藶g覽、查看并執(zhí)行各種網(wǎng)管操作。
IP骨干網(wǎng)網(wǎng)管的部署現(xiàn)狀:數(shù)據(jù)采集層的設(shè)備實現(xiàn)分片區(qū)部署,每個片區(qū)的設(shè)備匯聚到指定的數(shù)據(jù)采集節(jié)點;數(shù)據(jù)處理層和數(shù)據(jù)發(fā)布層的設(shè)備部署在兩個主節(jié)點,主節(jié)點中的設(shè)備實現(xiàn)高可用性保障,兩個主節(jié)點之間采用專用鏈路相連,用于數(shù)據(jù)同步和備份,實現(xiàn)異地容災(zāi)功能;各省設(shè)置省級網(wǎng)管工作站,各省網(wǎng)管人員分權(quán)分域使用網(wǎng)管系統(tǒng)。
IP網(wǎng)管的管理功能復(fù)雜,工單流程管理、業(yè)務(wù)開通、維護(hù)、排障等流程都較好地納入了整體架構(gòu)中,但有部分功能以獨立運行的軟件或子系統(tǒng)的方式存在,如IP地址管理、互聯(lián)網(wǎng)質(zhì)量測試、Netflow數(shù)據(jù)采集與分析、統(tǒng)一認(rèn)證管理等。這些獨立運行的軟件和子系統(tǒng),都是走傳統(tǒng)的IT建設(shè)的流程,獨立占用物理的服務(wù)器、網(wǎng)絡(luò)和存儲等設(shè)備,這種“煙囪式”的設(shè)計和部署必然導(dǎo)致IT基礎(chǔ)設(shè)施整體的利用率偏低。
同時,隨著網(wǎng)絡(luò)的發(fā)展,IP網(wǎng)管還面臨著以下需求和問題。
·網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大,網(wǎng)絡(luò)設(shè)備、鏈路和端口的數(shù)量不斷增長,同時,單臺設(shè)備規(guī)模不斷增大(集群設(shè)備),端口的速率也越來越大(40 Gbit/s、100 Gbit/s),IP 網(wǎng)管要采集和處理的信息越來越多。
·由于精細(xì)化運營的要求,網(wǎng)管對設(shè)備信息的采集密度越來越大,數(shù)據(jù)呈幾何級增長。
圖1 IP骨干網(wǎng)網(wǎng)管結(jié)構(gòu)
·由于安全管理的要求,重要設(shè)備都要求實現(xiàn)冗余備份,IT設(shè)備的數(shù)量逐漸增多。
·IT系統(tǒng)的擴(kuò)容遇到瓶頸,小型機的升級成本高,部分小型機已經(jīng)沒有升級的空間,部分新購設(shè)備與舊設(shè)備面臨著不兼容的情況,如不能實現(xiàn)高可用性。
·Netflow采集和處理的數(shù)據(jù)量快速增長,而流量流向分析設(shè)備的處理能力遠(yuǎn)遠(yuǎn)沒有跟上。
以上問題在大企業(yè)的IT系統(tǒng)發(fā)展中也同樣存在,而電信IP網(wǎng)管作為一個需要根據(jù)網(wǎng)絡(luò)和業(yè)務(wù)的發(fā)展持續(xù)開發(fā)、永沒有最終版的系統(tǒng),表現(xiàn)得更為強烈。云計算的出現(xiàn)為這些問題的解決提供了一個值得研究的方向。
按照NIST對云計算的定義,云計算模式能以按需方式通過網(wǎng)絡(luò)方便地訪問云系統(tǒng)的可配置計算資源共享池(如網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用程序和服務(wù)),同時以最少的管理開銷及與供應(yīng)商的交互迅速配置、提供或釋放資源。
從部署模式上看,云計算有3種模式:公有云、私有云和混合云。其中,私有云比較符合IP網(wǎng)管的需求,IP網(wǎng)管是運營商維護(hù)IP數(shù)據(jù)網(wǎng)絡(luò)的支撐系統(tǒng),其管理的數(shù)據(jù)屬于企業(yè)機密,同時,在私有云環(huán)境中,可以按照實際情況動態(tài)增加或減少運行實例,控制應(yīng)用程序使用資源池的指定部分(包括服務(wù)器、網(wǎng)絡(luò)和磁盤),也可以決定允許哪些用戶使用基礎(chǔ)設(shè)施。
回顧近10年來網(wǎng)絡(luò)的發(fā)展,從固定到移動互聯(lián)網(wǎng),從普通互聯(lián)網(wǎng)到大客戶VPN網(wǎng)絡(luò),網(wǎng)絡(luò)容量以每年50%的速率擴(kuò)張,網(wǎng)管要處理的數(shù)據(jù)不斷增加,要管理的業(yè)務(wù)逐漸增多,還要面臨不同角色的使用人群,如果還按照傳統(tǒng)IT資源的發(fā)展模式,網(wǎng)管系統(tǒng)的IT資源將會慢慢陷入無序發(fā)展和不可控的管理狀態(tài)。設(shè)計人員在進(jìn)行擴(kuò)容設(shè)計時,很難有效地調(diào)配已有的IT資源,只能不斷增加新設(shè)備。同時,為了管理越來越多的IT資源,運營商要不斷地增加相應(yīng)的維護(hù)人員,而不同的維護(hù)人員所管理的內(nèi)容相對獨立,缺乏有效的溝通。
IP網(wǎng)管系統(tǒng)引入云計算的必要性可以歸納為以下幾點。
·云計算的虛擬化和彈性資源調(diào)配:能提高資源利用的有效性,可以在不增加投資的前提下,承載更多業(yè)務(wù)。
·云計算的標(biāo)準(zhǔn)化和自動化資源調(diào)配:快速部署,按需即供,可以在不增加人力投資的前提下,大幅提升效率。
·可靠性:提供冗余容錯能力,可以提升服務(wù)質(zhì)量。
IP網(wǎng)管系統(tǒng)部署私有云符合當(dāng)今IT資源池化的趨勢,同時IP網(wǎng)管要處理的信息屬于數(shù)據(jù)密集型任務(wù),很適合在云計算環(huán)境中運行,具備以下可行性條件。
·從IaaS的角度看,云計算為網(wǎng)管系統(tǒng)提供一個穩(wěn)定、可持續(xù)發(fā)展、性價比高的計算平臺。
·基于x86的PC服務(wù)的資源池擴(kuò)展能力強,擴(kuò)容成本比小型機低。
·并行任務(wù)(如報表查詢)能實現(xiàn)平行處理,系統(tǒng)能容納更多的用戶,提升處理速度。
·云計算所具備的分布式處理能力,為Netflow的分析提供良好的計算平臺。
·從SaaS的角度看,云計算能為網(wǎng)管維護(hù)人員提供虛擬桌面、虛擬應(yīng)用的服務(wù),能方便發(fā)布網(wǎng)管應(yīng)用,同時易于實現(xiàn)訪問權(quán)限的控制,提升用戶訪問網(wǎng)管系統(tǒng)的安全性。
·虛擬化桌面和虛擬化應(yīng)用能支持多種終端類型,包括平板電腦、手機等終端,能方便地實現(xiàn)移動辦公和移動網(wǎng)管的功能。
IP網(wǎng)管屬于重要的生產(chǎn)網(wǎng)支撐系統(tǒng),在引入云計算技術(shù)的過程中,為盡量避免對現(xiàn)網(wǎng)的影響,建議按照由小而大、由淺入深的步驟逐漸鋪開,并在一開始就要做好云計算統(tǒng)一管理的設(shè)計規(guī)劃。引入云計算技術(shù)方案的目的可以概括為:建設(shè)跨區(qū)域的私有云平臺,實現(xiàn)集中管理和靈活調(diào)度,網(wǎng)管功能和應(yīng)用逐步有序地進(jìn)行遷移,基于云環(huán)境進(jìn)行應(yīng)用創(chuàng)新。
從云計算的3種服務(wù)模式看,對應(yīng)的網(wǎng)管應(yīng)用分析如圖2所示。
圖2 云計算的服務(wù)模式對應(yīng)的網(wǎng)管應(yīng)用分析
建議IP網(wǎng)管以IaaS和SaaS的服務(wù)模式為切入點。云計算平臺可以為采集層和數(shù)據(jù)處理層(主應(yīng)用功能軟件和Netflow流量流向分析軟件)提供可持續(xù)擴(kuò)展的有冗余保障的計算能力,同時,在數(shù)據(jù)發(fā)布層,虛擬桌面和虛擬應(yīng)用能為網(wǎng)管使用人員提供多種形式的訪問途徑,并能提升網(wǎng)管訪問的安全性,而Netflow流量流向分析軟件可以為網(wǎng)管使用者提供基于不同對象的分析功能,因此也可以視為SaaS的應(yīng)用功能。
·分析IP網(wǎng)管內(nèi)服務(wù)器的負(fù)載和軟件運行情況:分析各硬件平臺的運行現(xiàn)狀以及運行軟件的情況;梳理各子系統(tǒng)、模塊之間的關(guān)系以及各軟件邏輯圖;各軟件資源占用情況(包括CPU、磁盤、內(nèi)存、I/O等)調(diào)研;各軟件使用數(shù)據(jù)庫情況以及數(shù)據(jù)總量和增長情況調(diào)研。
·分析現(xiàn)有軟件哪些可以直接遷移到私有云中,哪些需要改造后才能遷移。
目前,主應(yīng)用服務(wù)器(數(shù)據(jù)處理層)軟件融合了所有的資源管理和業(yè)務(wù)管理功能,對業(yè)務(wù)進(jìn)行開通、維護(hù)、保障等全程的支撐。隨著所管理的資源和業(yè)務(wù)的增多,目前數(shù)據(jù)處理層軟件
·分析使用私有云的人員數(shù)量,如需要向多少人提供虛擬桌面或虛擬應(yīng)用,從而決定資源池的大小和應(yīng)用軟件的License問題。
·分析引入私有云技術(shù)是否會對維護(hù)人員的使用習(xí)慣造成影響。
在分析評估的基礎(chǔ)上,建議從實現(xiàn)IT資源虛擬化和管理自動化兩方面進(jìn)行改造。
虛擬化是通過軟件或固件管理程序把物理資源映射為虛擬資源,這些虛擬資源在使用上和物理資源的特性相差很少或沒有差別。通過虛擬化,可以進(jìn)一步簡化IT基礎(chǔ)架構(gòu)、整合IT資源、提高資源利用率,有助于降低IT基礎(chǔ)設(shè)施的能耗。
對虛擬化進(jìn)行統(tǒng)一管理是云計算管理的關(guān)鍵,自動化的目標(biāo)是實現(xiàn)對物理資源和虛擬機資源的自動識別、資源分配流程的自動化、負(fù)載遷移的自動化等,使私有云的管理者可以方便地提供和回收虛擬機資源,同時系統(tǒng)能對資源池負(fù)載進(jìn)行優(yōu)化分配。
互聯(lián)網(wǎng)期刊出版主要分為兩大類,一是傳統(tǒng)期刊的數(shù)字化并在互聯(lián)網(wǎng)上出版;另一類是期刊在線數(shù)據(jù)庫出版。順應(yīng)時代與市場的需求,傳統(tǒng)期刊正在經(jīng)歷數(shù)字化,而隨著網(wǎng)絡(luò)的發(fā)展,光盤、磁盤等形式出版的數(shù)字期刊已逐漸被網(wǎng)絡(luò)出版所替代,大多數(shù)期刊在線數(shù)據(jù)庫已轉(zhuǎn)變?yōu)槠诳瘮?shù)字出版平臺,發(fā)揮平臺集成性優(yōu)勢向消費者提供海量內(nèi)容與定制化服務(wù),因此大多數(shù)期刊選擇在互聯(lián)網(wǎng)期刊數(shù)據(jù)庫進(jìn)行網(wǎng)絡(luò)出版,由中國知網(wǎng)出版的《中國學(xué)術(shù)期刊(網(wǎng)絡(luò)版)》就是中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版官方平臺。據(jù)了解目前國內(nèi)傳統(tǒng)期刊選擇的互聯(lián)網(wǎng)出版平臺主要有《中國學(xué)術(shù)期刊(光盤版)》、“中國期刊網(wǎng)”、“萬方數(shù)據(jù)——數(shù)字化期刊群”、《中文科技期刊數(shù)據(jù)庫》等。
在虛擬化軟件的選擇上,建議著重考慮以下幾點功能。
·可虛擬化服務(wù)器兼容能力:虛擬化軟件能在哪些服務(wù)器上安裝。
·高可用性能力:包括物理資源的動態(tài)調(diào)整、宿主機間的HA、虛擬機間的HA、HA成熟度、虛擬機的在線遷移、動態(tài)存儲遷移。
·成本:不同的虛擬化軟件公司按照不同的方式(如CPU數(shù)量或虛擬機數(shù)量)計算License費用,其差別會很大。
針對網(wǎng)管硬件分散部署的現(xiàn)狀,建議采用如圖3所示的部署方式,整個IP網(wǎng)管的IT設(shè)備都納入私有云的體系中進(jìn)行統(tǒng)一管理,中心節(jié)點和每個片區(qū)的服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)都是網(wǎng)管云的一部分。每個片區(qū)的采集服務(wù)器和冗余備份服務(wù)器都落在該片區(qū)的物理資源上,不去調(diào)用其他片區(qū)的物理資源。每個片區(qū)的IT資源在提供給數(shù)據(jù)采集層服務(wù)器的同時,還承載網(wǎng)絡(luò)測試代理、Netflow數(shù)據(jù)分析等其他功能。不斷變龐大,不可能從小型機直接遷移到以x86 PC服務(wù)器為主的私有云環(huán)境下。對此,需要對數(shù)據(jù)處理層的軟件系統(tǒng)進(jìn)行適當(dāng)?shù)母脑?,將適合在云計算環(huán)境運營的功能剝離出來,實現(xiàn)模塊化改造。
數(shù)據(jù)處理層中存在很多并發(fā)處理的任務(wù),這些任務(wù)的特征是:如果有很多用戶同時調(diào)用這些任務(wù),網(wǎng)管程序首先會通過負(fù)載均攤分配流程把任務(wù)分給不同的處理進(jìn)程,然后不同的處理流程分別處理上報結(jié)果,這些處理流程在運行過程中并沒有直接的聯(lián)系。并發(fā)處理的任務(wù)是最適合部署在云計算環(huán)境下的,而且具有很好的擴(kuò)展性,可以按照任務(wù)的并發(fā)數(shù)靈活調(diào)整所需要的資源。目前,IP網(wǎng)管中的并發(fā)型任務(wù)有以下種類。
·地址查詢接口。
·資源查詢接口:根據(jù)用戶的查詢條件返回相應(yīng)的內(nèi)容。
·VPN業(yè)務(wù)開通:網(wǎng)管下發(fā)VPN業(yè)務(wù)的開通和變更數(shù)據(jù),判斷每一步返回的結(jié)果并執(zhí)行相應(yīng)的操作。
·路由追蹤服務(wù):用戶可實現(xiàn)從POP點到用戶主機的路由跟蹤。測試發(fā)起點支持POP點路由器,也支持分布在省內(nèi)的互聯(lián)網(wǎng)質(zhì)量評測測試代理。
·路由查看服務(wù):查看某個設(shè)備或某個VPN客戶的路由情況。
軟件的改造和遷移需要重點觀察以下3方面內(nèi)容。
·軟件的運行狀況:軟件運行是否正常,如采集機程序運行在一個利用率相對較高的虛擬機時,是否能滿足要求。
圖3 IP網(wǎng)管私有云拓?fù)?/p>
·自動切換功能:當(dāng)在用的虛擬機發(fā)生故障時,云計算平臺是否能實現(xiàn)自動切換,保證軟件的中斷時間在一個合理的范圍之內(nèi)。
·多用戶的并發(fā)請求能否比較均勻合理地分配到不同的虛擬機上。
通過私有云向網(wǎng)管維護(hù)人員提供虛擬桌面和虛擬應(yīng)用,IP網(wǎng)管系統(tǒng)的使用者包括集團(tuán)層面、省層面、支撐單位以及廠商等多方面,采用虛擬桌面和虛擬應(yīng)用可以帶來以下好處。
·桌面的存儲和執(zhí)行(包括操作系統(tǒng)、應(yīng)用程序和用戶數(shù)據(jù))都集中在數(shù)據(jù)中心的虛擬機上,可以解決安全訪問問題。
·數(shù)據(jù)集中存儲:避免機密數(shù)據(jù)泄露,防止病毒木馬等惡意軟件入侵。
·快速集中化部署:快速的patch和應(yīng)用程序安裝,顯著減少采購時間和維護(hù)成本。
·隨時用各種終端訪問:Win/Linux/iPhone、iPad。
·支持多種客戶端系統(tǒng):Linux、Win、MAC、Ubuntu、CenOS。
·系統(tǒng)/產(chǎn)品自動升級:檢測下載,安裝系統(tǒng)以及補丁。
·集中系統(tǒng)管理和VDI監(jiān)測:集中管理虛擬桌面、用戶、備份恢復(fù)、網(wǎng)絡(luò)設(shè)置、系統(tǒng)升級。
·問題檢測和修復(fù)系統(tǒng):繼承問題檢測、報警和修復(fù)功能,輔助用戶快速解決問題。
在云計算環(huán)境下,Netflow分析功能是可以預(yù)見的一個典型應(yīng)用。Netflow系統(tǒng)可以采用分布式架構(gòu),并通過增加采集和計算節(jié)點數(shù)量適應(yīng)網(wǎng)絡(luò)流量規(guī)模的增長;系統(tǒng)采用x86 PC服務(wù)器降低成本,同時采用網(wǎng)絡(luò)包處理性能優(yōu)化技術(shù)提升單臺采集節(jié)點的處理能力;系統(tǒng)采用Hadoop云計算技術(shù)實際計算負(fù)載的彈性分配,并通過HDFS文件系統(tǒng)提供低成本的flow原始數(shù)據(jù)冗余存儲方案。
隨著網(wǎng)絡(luò)和業(yè)務(wù)的發(fā)展,IP網(wǎng)管也在不斷地更新和發(fā)展,云計算在整合和調(diào)度IT系統(tǒng)資源方面有獨特的優(yōu)勢。同時,IP網(wǎng)管執(zhí)行的大部分屬于數(shù)據(jù)密集型的并發(fā)任務(wù),特別適合在云計算的環(huán)境中部署,因此IP網(wǎng)管引入云計算技術(shù)具備必要性和可行性。由于運營商較為看重IP網(wǎng)管系統(tǒng)的穩(wěn)定性和安全性,因此引入云計算時要循序漸進(jìn),并關(guān)注云計算的保護(hù)切換能力,同時要充分發(fā)揮云計算在分布式處理上的優(yōu)勢,將網(wǎng)管系統(tǒng)中并行處理的軟件模塊逐步移植到云計算平臺上,使網(wǎng)管能力能跟隨云計算平臺的擴(kuò)展不斷增強。
1 黃挺,謝文旭,王燕川.云計算在電信網(wǎng)絡(luò)管理系統(tǒng)中的應(yīng)用與實踐.電信科學(xué),2011,27(4):119~122
2 張云勇,楊光,陳清金等.電信OSS應(yīng)用云計算技術(shù)的研究.電信科學(xué),2010,26(11):43~48
3 楊志豪,趙太銀,姚興苗等.一種適應(yīng)數(shù)據(jù)與計算密集型任務(wù)的私有云系統(tǒng)實現(xiàn)研究.計算機應(yīng)用研究,2011(2)