引言:?jiǎn)挝幌聦僬军c(diǎn)機(jī)房搬遷,與總部的網(wǎng)絡(luò)連接關(guān)系保持不變,只是由本單位維護(hù)的2M線(xiàn)路改為租用電信公司的2M線(xiàn)路。這項(xiàng)工作并不復(fù)雜,只要將設(shè)備搬至目的機(jī)房安裝完畢,正確連接線(xiàn)路后,設(shè)備加電,網(wǎng)絡(luò)即可連通。然而,由于搬遷工作人多手雜,一點(diǎn)兒小小的疏忽,導(dǎo)致該站點(diǎn)與總部之間的網(wǎng)絡(luò)遲遲無(wú)法連通。本文介紹故障的排查過(guò)程。
我單位因?yàn)闃I(yè)務(wù)拓展需求,要搬遷其中一個(gè)下屬站點(diǎn)機(jī)房??偛颗c該站點(diǎn)之間的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示(為簡(jiǎn)潔起見(jiàn),未畫(huà)出兩個(gè)機(jī)房的光端機(jī))。搬遷后,該站點(diǎn)與總部之間的網(wǎng)絡(luò)連接關(guān)系保持不變,只是原來(lái)由本單位維護(hù)的2M線(xiàn)路改為租用電信公司的2M線(xiàn)路。這就意味著,線(xiàn)路兩端的路由器不需要修改參數(shù)配置。這項(xiàng)工作并不復(fù)雜,設(shè)備搬至目的機(jī)房,正確連接后加電,網(wǎng)絡(luò)即可連通。
由于這項(xiàng)工作相對(duì)簡(jiǎn)單,且工作量不大,起初沒(méi)有引起足夠的重視。新機(jī)房整治完畢,2M線(xiàn)路調(diào)通,搬遷工作開(kāi)始。設(shè)備正確連接后加電,然而,網(wǎng)絡(luò)卻未能如愿連通。單位領(lǐng)導(dǎo)先后兩次派人排查未果。
圖1 網(wǎng)絡(luò)拓?fù)鋱D
圖2 總部機(jī)房2M線(xiàn)路打環(huán)示意圖
筆者帶領(lǐng)搶修小組,再次進(jìn)行故障排查。首先通過(guò)Ping命令檢查總部局域網(wǎng)及外網(wǎng)之間的連通性,局域網(wǎng)內(nèi)部暢通;外網(wǎng)除該站點(diǎn)外均暢通。經(jīng)該站點(diǎn)工作人員檢查,此站點(diǎn)內(nèi)部局域網(wǎng)暢通,說(shuō)明問(wèn)題出在總部與該站點(diǎn)之間的網(wǎng)絡(luò)互連設(shè)備或線(xiàn)路上。
接下來(lái),我們把排查重點(diǎn)放在網(wǎng)絡(luò)互連設(shè)備和線(xiàn)路上。登錄到總部路由器,檢查該站點(diǎn)對(duì)應(yīng)端口的參數(shù)(包括網(wǎng)間網(wǎng)地址、封裝協(xié)議、以及路由協(xié)議等),未發(fā)現(xiàn)問(wèn)題;在總部機(jī)房的2M配線(xiàn)架對(duì)應(yīng)線(xiàn)路上打環(huán)(如圖2),在路由器輸入命令show ip interface serialX brief,顯示 :serialX is up,line protocol is up(looped)。總部機(jī)房2M配線(xiàn)架到路由器對(duì)應(yīng)端口的線(xiàn)路形成環(huán)路,說(shuō)明路由器對(duì)應(yīng)的端口硬件無(wú)故障;2M配線(xiàn)架到路由器之間的線(xiàn)路也沒(méi)有問(wèn)題。由此判斷故障不在總部機(jī)房。
總部機(jī)房2M配線(xiàn)架拆環(huán)恢復(fù)后,與該站點(diǎn)協(xié)同,在其2M配線(xiàn)架打環(huán)(如圖3),總部路由器仍然顯示形成環(huán)路,說(shuō)明租用的2M線(xiàn)路及兩個(gè)機(jī)房的光端機(jī)工作正常。推斷故障部位應(yīng)該在該站點(diǎn)2M配線(xiàn)架以?xún)?nèi)。搶修小組決定到現(xiàn)場(chǎng)進(jìn)行排查。
到達(dá)現(xiàn)場(chǎng)后,發(fā)現(xiàn)2M配線(xiàn)架對(duì)內(nèi)打環(huán)時(shí),路由器LINK REM SYNC LOSS(E1遠(yuǎn)端同步丟失告警)紅燈亮,說(shuō)明并未形成環(huán)路。自此,斷定故障就在2M配線(xiàn)架與路由器之間的同軸線(xiàn)纜或本地路由器上。
我們先檢查了2M同軸線(xiàn)纜的四個(gè)接頭,焊點(diǎn)牢固并未發(fā)現(xiàn)異常。然后,把懷疑重點(diǎn)放在路由器上。反復(fù)檢查了路由器參數(shù),確認(rèn)設(shè)置正確。是不是路由器硬件故障?更換備份路由器,重新配置參數(shù),故障仍未解決。此時(shí),搶修小組有些茫然。
待冷靜下來(lái),回顧了整個(gè)排查過(guò)程,可以確定總部路由器和光端機(jī)正常,租用電信公司的2M線(xiàn)路也沒(méi)有問(wèn)題,該站點(diǎn)也更換了新的路由器。那么,故障可能就在該站點(diǎn)2M配線(xiàn)架到路由器之間的同軸線(xiàn)纜上。于是,在2M配線(xiàn)架對(duì)內(nèi)打環(huán)的情況下,用萬(wàn)用表歐姆檔測(cè)量,發(fā)現(xiàn)同軸纜屏蔽網(wǎng)形成回路,但芯線(xiàn)開(kāi)路。
從電纜槽中取出兩根同軸線(xiàn)纜仔細(xì)檢查,終于發(fā)現(xiàn)其中一根有一處被壓扁。剝開(kāi)線(xiàn)纜,發(fā)現(xiàn)芯線(xiàn)已被壓斷,屏蔽網(wǎng)未被壓斷。我們推測(cè),在機(jī)房搬遷過(guò)程中人多手雜,這根75-2細(xì)同軸線(xiàn)纜受到重物擠壓所致,而人們恰恰又沒(méi)有注意到這一點(diǎn),為后續(xù)工作留下了隱患。重新制作了一根同軸線(xiàn)纜,連接后故障排除。
搶修小組在整個(gè)故障排查過(guò)程中,采用分段排查法,逐步將故障范圍縮小。通過(guò)打環(huán),將故障部位壓縮在該站點(diǎn)2M配線(xiàn)架以?xún)?nèi)的線(xiàn)路或設(shè)備上。故障排查總體思路是對(duì)的,采取的排查方法也是恰當(dāng)?shù)?。但是,在觀察到該站點(diǎn)對(duì)內(nèi)打環(huán),路由器LINK REM SYNC LOSS(E1遠(yuǎn)端同步丟失告警)紅燈亮后,憑借慣性思維,覺(jué)得電纜中間不會(huì)出問(wèn)題,檢查了線(xiàn)纜接頭后,轉(zhuǎn)去懷疑路由器,而與真正的故障點(diǎn)擦肩而過(guò)。
如果當(dāng)時(shí)對(duì)同軸線(xiàn)纜認(rèn)真排查,就會(huì)及早發(fā)現(xiàn)故障部位,縮短故障排查時(shí)間。值得慶幸的是,雖然走了一點(diǎn)彎路,但是經(jīng)過(guò)冷靜的思考后,終于定位了故障點(diǎn),故障得以排除。
網(wǎng)絡(luò)連通性發(fā)生問(wèn)題時(shí),故障原因都不盡相同。但通??蓺w納為三類(lèi)原因引起,即:設(shè)備硬件故障、軟件參數(shù)設(shè)置故障、線(xiàn)路故障。遇到故障,不要慌亂,只要思路清晰、方法得當(dāng),就能快速定位并排除故障。
機(jī)房搬遷工作,頭緒多、人手雜。人們往往比較重視各類(lèi)設(shè)備的安全,而忽視了線(xiàn)纜的安全。本案例告誡我們,在機(jī)房搬遷過(guò)程中線(xiàn)纜安全也同樣重要。