湖南工業(yè)大學現(xiàn)代教育技術(shù)中心 郭兆宏
流量監(jiān)控可以根據(jù)流量數(shù)據(jù)判斷網(wǎng)絡(luò)是否正常運行,根據(jù)流量數(shù)據(jù)來調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)從而保障網(wǎng)絡(luò)的正常運行,也為其它應用提供流量監(jiān)測數(shù)據(jù)等。
單位的網(wǎng)絡(luò)拓撲圖如圖1,從學生核心交換機到三臺學生宿舍路由器是4條線路,經(jīng)常有學生反映在晚高峰時網(wǎng)絡(luò)總有些卡,去年在2臺學生路由器上增加了SIP5-X線卡ENM-4XS,有120GB 線速轉(zhuǎn)發(fā)能力,并擴充了出口總量由50GB 擴大到60GB,即學生聯(lián)通出口又增加一條10GB線路。通過PRTG 流量監(jiān)控發(fā)現(xiàn)學生聯(lián)通路由器與學生移動路由器到學生核心交換機的2條線路峰值時基本跑滿了都有9GB 多,于是決定增加2條線路,即從學生核心交換機到學生聯(lián)通路由器和學生移動路由器各增加一條10GB 的線路,可學生核心交換機已經(jīng)沒有空白萬兆端口,千兆端口有40個左右,2臺路由器還有空白萬兆端口,就把學生核心交換機上的2個鏡像端口取消了,把2條要鏡像的線路再轉(zhuǎn)接到另外一臺萬兆交換機上,在此臺萬兆交換機再做端口鏡像,在學生核心交換機用2個端口做聚合,學生聯(lián)通路由器和學生移動路由器也是在SIP5-X 線卡找2個萬兆端口做路由聚合,把原來的接口數(shù)據(jù)配置在聚合口上。
圖1 單位網(wǎng)絡(luò)拓撲圖
配置改完后再通過PRTG流量監(jiān)控發(fā)現(xiàn)新的聚合口的流量是比以前增加了一點,但效果不明顯,可能是因為增加線路的時侯在6月中下旬大四畢業(yè)班的學生已經(jīng)開始離校學生總上網(wǎng)人數(shù)在減少,當然也有其它原因如部分學生宿舍樓到學生核心交換機只有千兆口,還有學生越來越喜歡用無線校園網(wǎng),且無線網(wǎng)在AC 上限速每IP只有8MB 等,可能要到9月份開學后學生總上網(wǎng)人數(shù)上升后流量帶寬上升的效果會明顯些。圖2 是某接口在線路擴增前后的流量監(jiān)控,端口聚合后原來端口的流量帶寬下降了。圖3 是新擴增后聚合端口的流量監(jiān)控。
6月份大學英語考試時要對考場錄像,有100 多個考場,且有70個考場更換了高清攝像頭,考前測試時通過PRTG 流量監(jiān)控發(fā)現(xiàn)到主考場的公共樓多媒體網(wǎng)的端口基本時時在700MB 左右,而此接口只有千兆的,當時發(fā)現(xiàn)此接口所在匯聚交換機的10.X.X.1 控制板溫度有59 度,而報警溫度是50 度,不斷在高溫報警,想關(guān)機吹下灰塵,但因此臺交換機已經(jīng)在線運行12年了,而第二天就要考試,且沒有備用交換機可換,馬上調(diào)低空調(diào)溫度,只得硬挺完考試,考完后周一立即對此臺交換機就關(guān)機吹灰塵,吹灰塵后交換機運行正常,溫度也降到41 度,正常值。在考試時發(fā)現(xiàn)此臺交換機到公共樓多媒體網(wǎng)的端口出站跑到965MB,流量合計1020MB,而此接口只是千兆的,可能會出現(xiàn)丟包現(xiàn)象,立即把監(jiān)控數(shù)據(jù)反饋給相關(guān)部門,相關(guān)部門說錄像正常。
圖2 某接口在線路擴增前后的流量監(jiān)控
圖3 新擴增后聚合端口的流量監(jiān)控
圖4 10.X.X.1 交換機給到多媒體網(wǎng)的接口流量監(jiān)控
考前就建議過從10.X.X.1 交換機到多媒體網(wǎng)的線路擴容,一個簡單立即可行的方法增加線路,復雜點是換兩邊的交換機到萬兆板卡這個需要經(jīng)費申請,整個過程時間較長且不確定,此條線路的光纜有多個空白蕊可用,兩邊的交換機也有多個空白光口可用,只增加光跳線和光模塊改下配置即可,所需東西全有,可因為多媒體網(wǎng)絡(luò)不歸我們管,是相關(guān)部門的負責的,可他們不想改動多媒體網(wǎng)絡(luò),鏈接線路又不可能只改一頭的另一頭不動,沒辦法只能維持現(xiàn)狀。
這是重大隱患,此接口只有千兆,重要時期數(shù)據(jù)可以跑到單向數(shù)據(jù)接近千兆了,可能會出現(xiàn)丟包影響數(shù)據(jù)安全,但因管理權(quán)限的原因只能等以后再說。如圖4,考試錄像時峰值984MB,凸起線是關(guān)機清理灰塵時間,24小時時時在錄像流量帶寬平穩(wěn)地維持在700MB 左右。
每學期的校公選課時教務(wù)系統(tǒng)總會死機,學生意見較大,所以校公選課時也是網(wǎng)絡(luò)運維監(jiān)測的重點時間,在本學期的校公選課時通過PRTG 流量監(jiān)控發(fā)現(xiàn)教務(wù)系統(tǒng)接口流量并不大,上行峰值只有34MB(當時監(jiān)控數(shù)據(jù)顯示近100MB,等寫文章時再查看30天數(shù)據(jù)峰值只有34MB了,但概述里流量合計最大值有158MB,可圖中無法顯示出來,如圖5 所示)。
通過ORION 監(jiān)控的流量帶寬上行峰值有90MB,如圖6。而辦公出口有電信600MB+聯(lián) 通300MB,34MB 或90MB 的上行峰值對辦公出口影響有限,基本是一瞬時的,當時監(jiān)控過時時出口情況出口帶寬沒有增加多少,此接口的平時峰值基本只幾MB。
圖5 教務(wù)系統(tǒng)接口的PRTG 流量監(jiān)控
圖6 教務(wù)系統(tǒng)接口ORION 流量監(jiān)控
但通過上網(wǎng)行為日志發(fā)現(xiàn)校公選課這一天教務(wù)系統(tǒng)訪問量達到47萬次,一個小時峰值訪問量是22萬次。因教務(wù)系統(tǒng)有自己的安全設(shè)備、交換機、服務(wù)器組、應用系統(tǒng)等等足有2個機柜的設(shè)備,對校園網(wǎng)來說只管到接口,接口以下是教務(wù)處負責的,而這個接口上行峰值只有34MB 或90MB,一天47萬次訪問量峰值,且峰值只維持一個小時左右,而辦公出口主要是下行數(shù)據(jù),上行數(shù)據(jù)不大,這些數(shù)據(jù)對有線校園網(wǎng)來說是沒任何問題的完全可以抗得住,至于教務(wù)系統(tǒng)一時反應慢或服務(wù)中斷可能跟教務(wù)整個系統(tǒng)有關(guān)。在選課這幾天不定時將流量監(jiān)控數(shù)據(jù)發(fā)給教務(wù)處,給他們做教務(wù)系統(tǒng)運行的參考。
單位的辦公教學區(qū)的有線校園網(wǎng)有300 多臺交換機,通過流量監(jiān)控軟件可以時時監(jiān)控所有交換機的運行情況,尤其是某臺或某棟樓斷網(wǎng)時立即顯示紅色報警,可以馬上知道此臺交換機或此樓的網(wǎng)絡(luò)機運行情況,有了流量監(jiān)控在用戶反映網(wǎng)絡(luò)故障時就知道是交換機問題還是只是接口或是用戶電腦問題了。上班時時查看流量監(jiān)控和網(wǎng)絡(luò)運行情況是日常網(wǎng)絡(luò)運維最重要的工作。
通過流量帶寬監(jiān)控可以隨時知道網(wǎng)絡(luò)設(shè)備的運行情況是在線還是斷網(wǎng),通過接口流量監(jiān)控數(shù)據(jù)可以指導網(wǎng)絡(luò)結(jié)構(gòu)、線路的改造,通過流量帶寬監(jiān)控為其它應用提供參考數(shù)據(jù)。