◇開(kāi)封市氣象局 霍繼超
河南省氣象災(zāi)害防御技術(shù)中心 孫 欣
網(wǎng)絡(luò)技術(shù)的普遍應(yīng)用有力提高了氣象服務(wù)質(zhì)量水平,但網(wǎng)絡(luò)運(yùn)行中出現(xiàn)的故障也越來(lái)越多樣化,可表現(xiàn)為一個(gè)故障現(xiàn)象有多種原因,多個(gè)故障現(xiàn)象只有一個(gè)原因,所以診斷和排除工作相對(duì)復(fù)雜。本文綜合筆者工作實(shí)例,分析歸類(lèi)氣象業(yè)務(wù)網(wǎng)絡(luò)運(yùn)行種的不同種類(lèi),且給出相應(yīng)解決辦法,以供參考。
氣象業(yè)務(wù)網(wǎng)絡(luò)是實(shí)現(xiàn)氣象、氣候、衛(wèi)星、觀測(cè)、信息網(wǎng)絡(luò)等氣象業(yè)務(wù)系統(tǒng)的中樞和紐帶、是現(xiàn)代氣象業(yè)務(wù)體系的基礎(chǔ)支撐,氣象資料為各種天氣預(yù)報(bào)服務(wù)產(chǎn)品提供依據(jù),是做好糧食安全、生態(tài)安全等氣象保障的基礎(chǔ)數(shù)據(jù)資源,而氣象資料的傳輸存儲(chǔ)載體是氣象業(yè)務(wù)網(wǎng)絡(luò)。局域網(wǎng)應(yīng)用在氣象業(yè)務(wù)中會(huì)出現(xiàn)某些突發(fā)故障,這就需要及時(shí)檢測(cè)和排查,盡快定位故障位置和原因,冷靜妥善處理問(wèn)題。
氣象業(yè)務(wù)網(wǎng)絡(luò)的物理故障是硬件設(shè)備故障導(dǎo)致網(wǎng)絡(luò)無(wú)法正常使用。原本能正常通信的電腦終端無(wú)法與交換機(jī)相連接時(shí),可以用網(wǎng)絡(luò)線儀測(cè)試線路,各信號(hào)燈顯示連接正常但在末端接入另一網(wǎng)絡(luò)交換機(jī)實(shí)現(xiàn)信號(hào)放大情況下數(shù)據(jù)通信才恢復(fù)正常,這種現(xiàn)象一般是因線路阻值發(fā)生變化導(dǎo)致網(wǎng)絡(luò)通信異常。利用萬(wàn)用表對(duì)計(jì)算機(jī)接入端口測(cè)量,發(fā)現(xiàn)期信號(hào)電平值低于正常通信狀態(tài)下電平值,再用萬(wàn)用表對(duì)每對(duì)線檢測(cè),會(huì)出現(xiàn)線纜阻礙交流電流作用部分值偏大,此時(shí)打開(kāi)墻壁模塊盒并檢查接合處,發(fā)現(xiàn)因墻壁受潮導(dǎo)致網(wǎng)絡(luò)模塊上卡線刀片氧化情況嚴(yán)重,尤其是線纜接觸點(diǎn),更換網(wǎng)絡(luò)模塊后即可恢復(fù)正常。計(jì)算機(jī)之間的連接出現(xiàn)時(shí)斷時(shí)續(xù),而主控制臺(tái)和主機(jī)連接無(wú)問(wèn)題,發(fā)現(xiàn)雙絞線有破損,更換新的雙絞線即可。因線路遭受物理破壞而導(dǎo)致線路中斷,可采用網(wǎng)絡(luò)測(cè)線儀對(duì)雙絞線接頭測(cè)試,必要時(shí)以雙端雙絞線離開(kāi)線架水晶頭直接確診,沿網(wǎng)絡(luò)路由人工查找故障點(diǎn),線路斷開(kāi)點(diǎn)以銅芯一一對(duì)應(yīng)纏繞連接后以焊接方式外包密封處理,或?qū)⑿揪€解開(kāi)分別壓制進(jìn)水晶頭后用對(duì)接模塊連接。若無(wú)法查找斷電或焊接則在保證芯線不大于4根情況下調(diào)整芯線順序,保證信號(hào)傳輸,在具備條件時(shí)重新布設(shè)雙絞線,但比較繁瑣耗時(shí)。
在氣象網(wǎng)絡(luò)中,網(wǎng)卡是上網(wǎng)通行的第一道手續(xù),一旦網(wǎng)卡設(shè)置沖突,電腦會(huì)拒絕登錄信息。網(wǎng)卡與網(wǎng)速不匹配會(huì)造成自適應(yīng)網(wǎng)卡不能應(yīng)用于氣象網(wǎng)絡(luò),網(wǎng)卡和交換機(jī)自適應(yīng)模式不相兼容則網(wǎng)卡速率無(wú)法被識(shí)別,安裝網(wǎng)卡前需確認(rèn)與網(wǎng)卡相接的交換機(jī)端口速率值。安裝具有網(wǎng)絡(luò)喚醒功能的網(wǎng)卡后計(jì)算機(jī)可能會(huì)死機(jī),一般是WOL線沒(méi)有正確連接,拔下WOL線即可。機(jī)房?jī)?nèi)計(jì)算機(jī)會(huì)出現(xiàn)PING不通現(xiàn)象,但網(wǎng)卡和主板均無(wú)問(wèn)題,可能是計(jì)算機(jī)周邊存在強(qiáng)大電磁干擾,也可能干擾源來(lái)自計(jì)算機(jī)內(nèi)部,檢查機(jī)箱內(nèi)部網(wǎng)卡是否同其他擴(kuò)展卡安裝距離過(guò)近,其中顯卡和獨(dú)立聲卡最易干擾網(wǎng)卡。安裝網(wǎng)卡后整個(gè)局域網(wǎng)連接時(shí)斷時(shí)續(xù)而且上網(wǎng)速度變慢,而內(nèi)部顯卡、聲卡和主板等均無(wú)問(wèn)題,則考慮計(jì)算機(jī)電源故障導(dǎo)致網(wǎng)卡無(wú)法正常工作,產(chǎn)生的放電干擾信號(hào)會(huì)影響網(wǎng)卡輸出端口,進(jìn)入網(wǎng)絡(luò)后占用大量重發(fā)幀和無(wú)效幀進(jìn)而干擾網(wǎng)絡(luò)運(yùn)行,解決方法是更換電源。
對(duì)于星型拓?fù)浣Y(jié)構(gòu)而言,集線器是整個(gè)網(wǎng)絡(luò)中樞指揮,一旦集線器出現(xiàn)故障則波及整個(gè)網(wǎng)絡(luò)無(wú)法工作。氣象信息傳輸時(shí)明顯感到速率較慢,比如集線器連接的是10Mps以太網(wǎng),但傳輸速率只有700~800 kb/s,排除計(jì)算量的方式,網(wǎng)絡(luò)無(wú)法達(dá)到標(biāo)準(zhǔn)速度原因主要有三:第一是集線器自身限制,若共享寬帶為20Mps,所有端口均處于通信狀態(tài),每個(gè)端口得到的傳輸速率必然無(wú)法達(dá)到極致,必須用交換機(jī)作為集線設(shè)備。第二是網(wǎng)卡原因,網(wǎng)卡質(zhì)量較次則發(fā)出的數(shù)據(jù)通信包會(huì)出現(xiàn)錯(cuò)誤,一旦有誤必會(huì)重發(fā),出現(xiàn)錯(cuò)誤過(guò)多拷貝文件速度自然下降。第三是網(wǎng)線原因,信號(hào)衰減度會(huì)隨網(wǎng)線長(zhǎng)度增加而增加,或距離雖近但網(wǎng)線質(zhì)量不好也無(wú)法達(dá)到理論值。出現(xiàn)Internet和局域網(wǎng)都不正常,此種故障原因可能有三:一是路由器死機(jī),重啟即可;二是交換機(jī)故障,某些交換機(jī)也會(huì)出現(xiàn)偶爾假死導(dǎo)致網(wǎng)絡(luò)癱瘓,重啟計(jì)算機(jī)即可;三是網(wǎng)絡(luò)連接錯(cuò)誤造成的,檢查發(fā)現(xiàn)某一集線器連接出現(xiàn)問(wèn)題,此集線器級(jí)聯(lián)是兩個(gè)端口,需人工根據(jù)相連交換設(shè)備端口接到中一個(gè),另一個(gè)則連到計(jì)算機(jī),這兩個(gè)端口均是以太網(wǎng)端口,不同的是輸出和輸入對(duì)線位置改變。再者,連接路由器的線纜破損或計(jì)算機(jī)被病毒感染都會(huì)導(dǎo)致故障。
在規(guī)劃氣象局域網(wǎng)時(shí),考慮到多媒體傳輸需要使用兩個(gè)速率不同的自適應(yīng)交換機(jī)作為集線設(shè)備,在組建局域網(wǎng)時(shí)發(fā)現(xiàn)計(jì)算機(jī)之間無(wú)法通信,但交換機(jī)連接并無(wú)錯(cuò)誤提示。此時(shí)先將交換機(jī)的線全部卸除,以網(wǎng)線測(cè)試儀檢測(cè)交叉線通否,若每一根都通則依次把線插好。再于計(jì)算機(jī)之間執(zhí)行PING操作,仍然無(wú)法接通。則觀察交換機(jī)Uplink接口,做兩根直通線測(cè)試無(wú)誤后將一臺(tái)交換機(jī)Uplink端口和另一臺(tái)交換機(jī)普通端口連接就會(huì)接通。
一個(gè)有權(quán)限的堆疊矩陣模塊、堆疊接口模塊或堆疊表會(huì)導(dǎo)致交換機(jī)堆疊起后網(wǎng)絡(luò)變緩慢,此時(shí)需改變堆疊模塊。當(dāng)為了實(shí)現(xiàn)快速以太網(wǎng)通道的功能將兩臺(tái)交換機(jī)兩對(duì)端口以兩條線同時(shí)相連卻發(fā)現(xiàn)每個(gè)交換機(jī)僅一個(gè)端口正常,另一個(gè)顯示紅燈。這是因?yàn)閮啥丝谙噙B導(dǎo)致交換機(jī)認(rèn)為是循環(huán)存在,便會(huì)斷掉其中一根將其相應(yīng)端口關(guān)掉則顯示紅燈,此時(shí)秩序打開(kāi)Spanning tree,讓交換機(jī)認(rèn)為這個(gè)端口是FEC功能,在邏輯上是一個(gè)端口即可。
路由器作為氣象網(wǎng)絡(luò)中重要的節(jié)點(diǎn)設(shè)備處在OSI模型中的第三層,其利用網(wǎng)絡(luò)層定義的邏輯上的IP地址來(lái)分辨不同類(lèi)型的網(wǎng)絡(luò),以實(shí)現(xiàn)網(wǎng)絡(luò)間的互聯(lián)和隔離,保持網(wǎng)絡(luò)獨(dú)立性。常見(jiàn)路由器故障有兩種:一是網(wǎng)絡(luò)擁堵,氣象資料無(wú)法及時(shí)傳輸,一般市局路由器配置兩個(gè)快速以太網(wǎng)通道口和一個(gè)以太口,兩個(gè)快速通道口對(duì)接內(nèi)部局域網(wǎng)和所轄縣級(jí)氣象局,一個(gè)以太口對(duì)接省氣象局,縣氣象局則有一個(gè)快速以太網(wǎng)通道口和一個(gè)以太口,快速以太口對(duì)接內(nèi)部局域網(wǎng),以太口對(duì)接市氣象局。隨著氣象服務(wù)精細(xì)化推進(jìn),需展示在網(wǎng)絡(luò)上的資料越來(lái)越多,端口配置錯(cuò)誤會(huì)造成網(wǎng)絡(luò)堵塞,此時(shí)應(yīng)按照正確方法配置各接口,同時(shí)爭(zhēng)分奪秒恢復(fù)正常網(wǎng)絡(luò)功能,可將對(duì)下級(jí)站的計(jì)算機(jī)設(shè)置為本級(jí)IP地址,如為市氣象局布置網(wǎng)絡(luò)格局時(shí),酌情將本網(wǎng)段最后幾個(gè)IP地址作為備用IP地址,當(dāng)縣站路由器故障時(shí),利用測(cè)報(bào)用、通信用、自動(dòng)站采集用計(jì)算機(jī)收集資料,將傳輸用機(jī)IP地址變?yōu)槭芯謧溆肐P地址,網(wǎng)關(guān)改為市局路由器地址,將本級(jí)端口本來(lái)與VLAN端口聯(lián)接的雙絞線改接到交換機(jī)其他不用端口上,此時(shí)下級(jí)站計(jì)算機(jī)則被是為本級(jí)遠(yuǎn)程終端,即可順利實(shí)現(xiàn)上下級(jí)網(wǎng)絡(luò)互聯(lián)。二是路由器死機(jī),當(dāng)縣氣象局無(wú)法通上省氣象局網(wǎng)絡(luò),遠(yuǎn)程登錄市局路由器不能運(yùn)行查看命令則可能是路由器自身軟件有BUG,導(dǎo)致運(yùn)行時(shí)系統(tǒng)資源被無(wú)端消耗無(wú)法有效釋放最終內(nèi)存耗盡無(wú)法處理轉(zhuǎn)發(fā)請(qǐng)求。解決方法是遠(yuǎn)程登錄至故障路由器,輸入“reboot”命令符重啟,需注意輸入命令符前不能執(zhí)行其他任何操作,否則可能會(huì)喪失與主機(jī)聯(lián)系。
保障氣象網(wǎng)絡(luò)順暢運(yùn)行是確保高質(zhì)量氣象服務(wù)的前提,需要技術(shù)人員在日常工作中多注意經(jīng)常出現(xiàn)的典型故障和非典型表現(xiàn),分析出背后的原因,以便在日后出現(xiàn)類(lèi)似問(wèn)題時(shí)快速處理,不延誤氣象資料傳輸。