[摘 要] 網(wǎng)絡(luò)所提供的信息服務(wù)在高度數(shù)據(jù)處理影響下顯得越來越重要,網(wǎng)絡(luò)服務(wù)中斷以及網(wǎng)絡(luò)性能大幅度下降,這些對于業(yè)務(wù)正常運(yùn)行的影響巨大。網(wǎng)絡(luò)維護(hù)管理人員應(yīng)該做到能夠快速發(fā)現(xiàn)網(wǎng)絡(luò)故障,使其網(wǎng)絡(luò)性能效率大幅度提高,本文結(jié)合實(shí)際情況,主要針對網(wǎng)絡(luò)故障診斷和性能分析進(jìn)行探討,希望能夠?qū)τ谄髽I(yè)網(wǎng)絡(luò)管理發(fā)展具有一定幫助。
[關(guān)鍵詞] 網(wǎng)絡(luò)故障診斷;性能分析;設(shè)備;方法
1、網(wǎng)絡(luò)故障診斷和性能分析探討
網(wǎng)絡(luò)故障診斷和性能分析相關(guān)方法和特點(diǎn),分析如下:
1.1置換法。這種最為簡單的方法需要耗費(fèi)大量時間,但不需要進(jìn)行設(shè)備更換,這種方法不能在根本上找到網(wǎng)絡(luò)故障的原因。
1.2設(shè)備監(jiān)控和日志,在人員對于設(shè)備具有一定熟悉程度的基礎(chǔ)上,能夠基本掌握網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),通過并不復(fù)雜的算法,在需要的數(shù)據(jù)只能在海量的信息中,而耗費(fèi)較大時間。
1.3使用網(wǎng)絡(luò)測試儀,盡管使用此方法能夠取得較為全面的分析結(jié)果,但是,其實(shí)用過程較為復(fù)雜,在利用網(wǎng)絡(luò)測試儀實(shí)現(xiàn)網(wǎng)絡(luò)故障診斷有效性方面還存在一定問題。
1.4使用網(wǎng)絡(luò)管理和監(jiān)控軟件,在使用網(wǎng)絡(luò)管理和監(jiān)控軟過程中存在一定問題,比如用戶端的應(yīng)用性能分析和網(wǎng)絡(luò)設(shè)備的傳輸性能都存在一定困難。
1.5使用網(wǎng)絡(luò)流量監(jiān)控設(shè)備,為了保證網(wǎng)絡(luò)故障的確認(rèn),從而更為有效提升網(wǎng)絡(luò)性能,采用有效的網(wǎng)絡(luò)流量監(jiān)控能有實(shí)現(xiàn),但是,對于用戶端應(yīng)用性能和網(wǎng)絡(luò)設(shè)備的傳輸性能方面的問題,網(wǎng)絡(luò)流量監(jiān)控也不能解決。
1.6協(xié)議分析工具。對于有效的網(wǎng)絡(luò)故障診斷和性能分析工具來說,協(xié)議分析方法對于使用人員的要求比較高,應(yīng)具有較為深厚的網(wǎng)絡(luò)理論。同時,由于一次性分析的數(shù)據(jù)量方面存在一定限制,應(yīng)用具有一定局限性。
為了更好快速診斷網(wǎng)絡(luò)故障,應(yīng)該考慮各個工具和方法的特點(diǎn)而進(jìn)行選擇,這是由網(wǎng)絡(luò)維護(hù)管理人員所需要解決的重要問題。
2、本單位信息化建設(shè)分析
2.1 網(wǎng)絡(luò)設(shè)備數(shù)量眾多,結(jié)構(gòu)層繁雜。根據(jù)本單位的情況,在不同建筑里的服務(wù)器和網(wǎng)絡(luò)設(shè)備眾多,其型號和品牌也存在不統(tǒng)一的問題,為更好進(jìn)行網(wǎng)絡(luò)故障的排查問題,并能夠及時提出相應(yīng)的解決方案,這才是網(wǎng)絡(luò)管理人員所關(guān)注的重點(diǎn)問題。同時,這種情況也容易造成投資浪費(fèi),后期網(wǎng)絡(luò)優(yōu)化困難。
2.2 缺少量化的實(shí)時分析系統(tǒng)。要想對于網(wǎng)絡(luò)性能進(jìn)行快速地、準(zhǔn)確地了解和掌握,就需要通過準(zhǔn)確的數(shù)據(jù),那種僅僅依靠用戶的感受而判斷方法準(zhǔn)確性很低。為了保證網(wǎng)絡(luò)服務(wù)的穩(wěn)定性和高可用性,應(yīng)該通過有效的自動化分析工具來實(shí)現(xiàn)。
2.3 監(jiān)控中心缺乏簡單有效的協(xié)議分析工具
縮短平均故障恢復(fù)時間(MTTR),以及提高運(yùn)行效率這是網(wǎng)絡(luò)管理和維護(hù)工作的主要目的,使得各個業(yè)務(wù)的穩(wěn)定性和可用性不斷得以加強(qiáng),能夠做好網(wǎng)絡(luò)優(yōu)化工作,從而保證業(yè)務(wù)系統(tǒng)滿足企業(yè)正常運(yùn)轉(zhuǎn)需要。在協(xié)議分析工具的基礎(chǔ)上,能夠深層次分析各個網(wǎng)絡(luò)數(shù)據(jù)的傳遞過程,這樣,根本原因也就相應(yīng)容易發(fā)現(xiàn),可有效避免類似事故發(fā)生。
2.4 網(wǎng)絡(luò)、服務(wù)器、客戶端、軟件系統(tǒng)責(zé)任界定困難。為了對于網(wǎng)絡(luò)故障進(jìn)行定位分析,往往需要進(jìn)行多次的排查工作,在網(wǎng)絡(luò)、服務(wù)器、客戶端、軟件系統(tǒng)中間,往往很難明確責(zé)任的歸屬情況,其所在的層次的協(xié)議標(biāo)準(zhǔn)都是相互獨(dú)立的,一般往往很難講這些測試結(jié)果進(jìn)行相互的印證和分析。
3、本單位網(wǎng)絡(luò)系統(tǒng)分析
城市的整體面貌通過正在運(yùn)行的城市監(jiān)控系統(tǒng)正在逐步改善,監(jiān)、控、存、查、管等綜合應(yīng)用在系統(tǒng)的多點(diǎn)聯(lián)網(wǎng)的情況下而逐漸形成,能夠?yàn)橥ㄐ拧⑾?、治安、交通、農(nóng)業(yè)等方面提供相應(yīng)的基礎(chǔ)數(shù)據(jù),對于該系統(tǒng)的基本要求,主要包括:(1)網(wǎng)絡(luò)數(shù)據(jù)的監(jiān)視;(2)網(wǎng)絡(luò)中多點(diǎn)部署并聯(lián)網(wǎng)分析;(3)網(wǎng)絡(luò)數(shù)據(jù)的查詢及存取功能;(4)網(wǎng)絡(luò)數(shù)據(jù)的控制問題;(5)網(wǎng)絡(luò)數(shù)據(jù)的管理等方面。在多次調(diào)研和設(shè)備測試的基礎(chǔ)上,考慮上述分析要求,我單位采用某知名品牌的海量在線分析系統(tǒng),其實(shí)現(xiàn)的主要功能和特點(diǎn)如下:
3.1網(wǎng)絡(luò)中多點(diǎn)部署并聯(lián)網(wǎng)分析,在一定的條件捕獲數(shù)據(jù)中,設(shè)備接入不同的網(wǎng)絡(luò)匯點(diǎn),分布不同不捕獲點(diǎn)的數(shù)據(jù),還能具有自動匯報分析結(jié)果功能。
3.2網(wǎng)絡(luò)數(shù)據(jù)的監(jiān)視,對于當(dāng)前時間網(wǎng)絡(luò)的整體情況可以通過系統(tǒng)的實(shí)時監(jiān)視頁面獲取,主要包括網(wǎng)絡(luò)利用率、網(wǎng)絡(luò)發(fā)包頻率、總的流量、網(wǎng)絡(luò)的單播、多播、廣播等情況,還能包括相關(guān)的重要鏈路的實(shí)時分析、頁面應(yīng)用的整體分析等等。
3.3網(wǎng)絡(luò)數(shù)據(jù)的查詢功能,主要包括私有協(xié)議的添加、數(shù)據(jù)查詢過濾條件的設(shè)定以及相應(yīng)的圖形顯示等。
第四,網(wǎng)絡(luò)數(shù)據(jù)的管理則包括數(shù)據(jù)及音視頻相關(guān)編輯等方面內(nèi)容。
4、該系統(tǒng)的故障診斷和性能分析原理及方式
4.1 海量數(shù)據(jù)線速全采集。該系統(tǒng)為了能滿足連續(xù)長期捕獲并記錄的要求,具有大容量的存儲空間(8TB),10/100/Gigab 網(wǎng)絡(luò)4個網(wǎng)段(通道)的數(shù)據(jù)(<=4Gbps)則可以進(jìn)行全線速100%捕獲,具有高精度和高性能的特點(diǎn)。
4.2 網(wǎng)絡(luò)異常發(fā)現(xiàn)。(1)為了能夠更好對于各個時段變化進(jìn)行掌握,對于應(yīng)用業(yè)務(wù)數(shù)據(jù)采用7*24 小時長期監(jiān)控網(wǎng)絡(luò),以便能夠及時發(fā)覺網(wǎng)絡(luò)趨勢變化;(2)在自身網(wǎng)絡(luò)的實(shí)際情況的基礎(chǔ)上,各種參數(shù)的門限值、嚴(yán)重級別可以經(jīng)過設(shè)置,方便于及時察覺網(wǎng)絡(luò)中的各種異常情況,并及時通知管理員;(3)各種應(yīng)用的分布及應(yīng)用情況,可以通過趨勢變化,還有相應(yīng)的不同時段的響應(yīng)快慢變化進(jìn)行探討,以及相關(guān)的資源占用情況等,這都有助于網(wǎng)絡(luò)異常的發(fā)現(xiàn)。
4.3 異常數(shù)據(jù)提取。(1)實(shí)時過濾、切片功能。為了保證在磁盤陣列中,能夠在其中捕獲到將需要的數(shù)據(jù),應(yīng)該設(shè)置多個過濾器級別;為了方便分析,在跟蹤文件中應(yīng)該包括利用額外的過濾器提取的數(shù)據(jù);最后,數(shù)據(jù)包的范圍可以利用另外過濾器進(jìn)行縮小。在獨(dú)特的切片/過濾器組合情況下,為了更好自定義過濾器標(biāo)準(zhǔn)匹配的關(guān)鍵應(yīng)用程序,存儲在磁盤陣列中的數(shù)據(jù)包類型可以進(jìn)一步改進(jìn);(2)過濾條件。通過一定的時間及各種過濾條件進(jìn)行相互組合,可以更好對于網(wǎng)絡(luò)中的各種流量進(jìn)行過濾,這種靈活多樣的方式,能夠有助于快速便捷的對于異常數(shù)據(jù)進(jìn)行提取。
參考文獻(xiàn):
[1]王進(jìn), 陽小龍, 隆克平. 基于大偏差統(tǒng)計模型的Http-Flood DDoS檢測機(jī)制及性能分析[J].軟件學(xué)報,2013(5).
[2]張順利, 邱雪松, 孟洛明. 網(wǎng)絡(luò)虛擬化環(huán)境下的服務(wù)故障診斷算法[J].軟件學(xué)報,2012,23(10).
作者簡介:黃健 李金勇,國網(wǎng)重慶市電力公司信息通信分公司。