摘要:該文首先介紹了氣象業(yè)務(wù)網(wǎng)絡(luò)故障診斷分析的一般方法,然后對(duì)氣象業(yè)務(wù)網(wǎng)絡(luò)中可能出現(xiàn)的一些故障進(jìn)行了分析,包括故障現(xiàn)象及相應(yīng)的處理方法等,為排除類似故障提供了一定的參考和指導(dǎo)。
關(guān)鍵詞:氣象;網(wǎng)絡(luò)故障;解決方法
中圖分類號(hào): TP393 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)04-0956-03
Analysis of Frequent Faults and Solutions of Meteorological Network
XU Xiang-rong1, LI Wei-quan2, GUO Lin-jing1, CHEN Ying-hua2
(1. Huizhou Meteorological Bureau, Guangdong, Huizhou, 516001;2.Longmen Meteorological Station, Guangdong, Longmen, 516008)
Abstract: In this article we first introduce the common method of fault diagnosis of meteorological network, and then analyze the possible faults and the corresponding solutions in meteorological work, which may be some reference or guidance on similar circumstances.
Key words: meteorology; network fault; solution
1 引言
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,氣象部門對(duì)業(yè)務(wù)網(wǎng)絡(luò)(簡稱網(wǎng)絡(luò))的依賴程度越來越高。資料的收集與分發(fā)、信息共享平臺(tái)的建成和高性能計(jì)算機(jī)、視頻會(huì)商系統(tǒng)的應(yīng)用等,都與網(wǎng)絡(luò)息息相關(guān)??梢哉f,任何時(shí)刻的網(wǎng)絡(luò)中斷,都會(huì)影響氣象業(yè)務(wù)的正常進(jìn)行;同時(shí)越來越多的先進(jìn)技術(shù)和服務(wù)產(chǎn)品應(yīng)用到網(wǎng)絡(luò)中,網(wǎng)絡(luò)管理和維護(hù)的工作變得越來越復(fù)雜。因此,本文結(jié)合網(wǎng)絡(luò)維護(hù)工作中積累的經(jīng)驗(yàn),以典型網(wǎng)絡(luò)故障實(shí)例為基礎(chǔ),探討了常見網(wǎng)絡(luò)故障處理判斷步驟與排除方法。
2 網(wǎng)絡(luò)故障診斷分析
網(wǎng)絡(luò)一旦出現(xiàn)故障,都會(huì)對(duì)氣象業(yè)務(wù)工作造成很大的影響,因此,必須及時(shí)排除故障。網(wǎng)絡(luò)故障排除方法的總體思路是系統(tǒng)地將產(chǎn)生故障可能的原因所構(gòu)成的一個(gè)大集合縮減成一個(gè)小的子集合或者直接確定故障起因。以下為網(wǎng)絡(luò)故障排除的一般步驟:
2.1判定故障
觀察相關(guān)的總體故障現(xiàn)象,參考網(wǎng)絡(luò)正常時(shí)的各項(xiàng)指標(biāo),確定是否是網(wǎng)絡(luò)故障。記錄這一故障所影響的網(wǎng)絡(luò)功能,詳細(xì)描述故障。依最終用戶報(bào)告的情況判斷產(chǎn)生故障的原因并記錄。
2.2搜集故障信息
向用戶及相關(guān)人員了解相關(guān)的問題。確認(rèn)是否有人已做出改動(dòng)。要依簡單到復(fù)雜的順序,首先明確標(biāo)志判斷,如利用路由器、交換機(jī)、網(wǎng)卡上的指示燈判斷是否有物理連接?再選用診斷軟件如Windows診斷工具或網(wǎng)絡(luò)管理軟件等,收集更多的信息。
2.3分析原因
利用搜集的信息和網(wǎng)絡(luò)管理技術(shù)知識(shí),進(jìn)一步確定出故障范圍。
2.4制定排除故障步驟
依可能性最大的原因制定和實(shí)施一個(gè)行動(dòng)計(jì)劃,然后觀察其結(jié)果,盡量做到不在同一時(shí)間更改太多的變量。
2.5確認(rèn)實(shí)施方案
如果故障現(xiàn)象沒有排除,可嘗試另一項(xiàng)操作計(jì)劃(或搜集額外的情況),這是一個(gè)不斷縮小故障范圍的過程。如果故障已排除,應(yīng)記錄并整理排除故障的方法,這些記錄可為今后解決類似問題提供方便。
故障診斷分析步驟雖然很費(fèi)時(shí)間,但是隨著網(wǎng)絡(luò)管理員故障排除技術(shù)的成熟,這個(gè)過程會(huì)變得很簡單,有利于培養(yǎng)有序故障排除的思維方式[1]。
3 常見故障與解決方法
3.1 路由器故障
現(xiàn)有的氣象網(wǎng)絡(luò)硬件主要由交換機(jī)、幀網(wǎng)轉(zhuǎn)換設(shè)備及路由器構(gòu)成,路由器是網(wǎng)絡(luò)中的主要節(jié)點(diǎn)設(shè)備。路由器工作在OSI模型中的第3層,即網(wǎng)絡(luò)層。路由器利用網(wǎng)絡(luò)層定義的“邏輯”上的網(wǎng)絡(luò)地(即IP地址)來區(qū)別不同的網(wǎng)絡(luò),實(shí)現(xiàn)網(wǎng)絡(luò)的互連和隔離,保持各個(gè)網(wǎng)絡(luò)的獨(dú)立性。路由器不轉(zhuǎn)發(fā)廣播消息,而把廣播消息限制在各自的網(wǎng)絡(luò)內(nèi)部。發(fā)送到其他網(wǎng)絡(luò)的數(shù)據(jù)先被送到路由器,再由路由器轉(zhuǎn)發(fā)出去。它的主要作用是連通不同的網(wǎng)絡(luò)以及選擇信息傳送的最佳傳輸途徑。選擇通暢快捷的傳輸途徑,能大大提高通信速度,減輕網(wǎng)絡(luò)系統(tǒng)通信負(fù)荷,節(jié)約網(wǎng)絡(luò)系統(tǒng)資源,提高網(wǎng)絡(luò)系統(tǒng)暢通率,從而讓網(wǎng)絡(luò)系統(tǒng)發(fā)揮更大的效益。在現(xiàn)有的氣象網(wǎng)絡(luò)中,路由器主要起到不同網(wǎng)段之間連接的作用。在氣象網(wǎng)絡(luò)中,常見的路由器故障主要有以下兩種:
1)路由器端口配置錯(cuò)誤
故障現(xiàn)象:網(wǎng)絡(luò)堵塞,資料傳輸受阻。
故障分析:一般來說,各市氣象局路由器配有兩個(gè)快速以太口和一個(gè)以太口,兩個(gè)快速以太口連接局域網(wǎng)和轄縣氣象局,另一個(gè)以太口連接省氣象局??h氣象局路由器有一個(gè)快速以太口和一個(gè)以太口,以太口連接市氣象局,快速以太口連接本地局域網(wǎng)。如用10Mbit/s交換口作為匯聚端口,有多于5個(gè)連接時(shí),會(huì)造成搶帶寬資源的現(xiàn)象,影響寬帶網(wǎng)絡(luò)的速度。隨著電子政務(wù)和精細(xì)化預(yù)報(bào)的開展,網(wǎng)絡(luò)上傳輸?shù)馁Y料越來越多,端口配置錯(cuò)誤后很容易造成網(wǎng)絡(luò)堵塞。
處理方法:首先,按照規(guī)定正確配置各個(gè)網(wǎng)絡(luò)接口。同時(shí),為恢復(fù)網(wǎng)絡(luò)運(yùn)行爭取時(shí)間,可以采用對(duì)縣站的計(jì)算機(jī)設(shè)置為市局的IP地址。以市、縣之間氣象網(wǎng)絡(luò)為例,具體設(shè)置辦法介紹如下:在做網(wǎng)絡(luò)規(guī)劃時(shí)預(yù)留市局所用網(wǎng)段最后的30個(gè)IP地址作為備用IP地址,當(dāng)縣站路由器出現(xiàn)故障時(shí),可將測報(bào)用機(jī)、通信用機(jī)、自動(dòng)站采集用機(jī)等用于資料采集、傳輸?shù)臉I(yè)務(wù)用機(jī)的IP地址改為市局的備用IP地址,網(wǎng)關(guān)改為市局的路由器地址。將市局端原與之對(duì)應(yīng)相連在VLAN端口上的雙絞線直接接到交換機(jī)的其它接口上,這時(shí)可將縣站的計(jì)算機(jī)看成市局的遠(yuǎn)程終端,從而實(shí)現(xiàn)市、縣網(wǎng)絡(luò)互連,如圖1所示。
2)市級(jí)氣象局路由器死機(jī)
故障現(xiàn)象:縣氣象局連不通省氣象局網(wǎng)絡(luò),遠(yuǎn)程登陸到市氣象局路由器上不能運(yùn)行查看和配置等命令。
故障分析:由于路由器軟件的缺陷,運(yùn)行中系統(tǒng)內(nèi)存資源不斷消耗而不能有效釋放,造成內(nèi)存資源耗盡。路由器資源耗盡后,無法處理路由轉(zhuǎn)發(fā)請求,造成網(wǎng)絡(luò)連接不通,各縣局不能通過市局路由器連通省氣象局的網(wǎng)絡(luò)。表現(xiàn)為,從本地局域網(wǎng)中的任何一臺(tái)計(jì)算機(jī)登陸到路由器上運(yùn)行“show run”命令,屏幕出現(xiàn)“Connection closed by remote host”提示,同時(shí)連接自動(dòng)斷開。
處理方法:遠(yuǎn)程登陸到該路由器中運(yùn)行“reboot”命令重新啟動(dòng)路由器。運(yùn)行“reboot”命令前不運(yùn)行其他命令,否則會(huì)失去與主機(jī)的連接,需要重新連接。
3.2服務(wù)器常見故障
1)開機(jī)無顯示。
引起這種故障的原因較多,其通用的解決步驟是:首先,用代換法排除顯示器故障;其次檢查顯卡是否正常,有的機(jī)型顯卡是獨(dú)立的,可直接用代換法判斷,若顯卡是集成的,在關(guān)機(jī)情況下拔下所有的插卡,重開機(jī),若還無顯示,說明主板有故障,在決定更換主板前,若主板上有SWITCH開關(guān)或接線端子將其用來屏蔽板載顯卡,用獨(dú)立顯卡代替即可排除主板上顯卡故障,否則只能更換主板以恢復(fù)系統(tǒng)正常。
2)開機(jī)時(shí)出現(xiàn)“NVRAM ERROR”的提示后啟動(dòng)不再繼續(xù)。
這種故障現(xiàn)象容易使網(wǎng)絡(luò)維護(hù)人員想到是RAM出了問題,但往往關(guān)機(jī)查看后,再開機(jī)時(shí)又正常了。這是因?yàn)殡娫措妷翰环€(wěn)定造成NVRAM中的數(shù)據(jù)出錯(cuò),只要重啟就能恢復(fù)正常,不必更換硬件。如果經(jīng)常出現(xiàn)這種錯(cuò)誤提示,應(yīng)該仔細(xì)檢查機(jī)器的電源系統(tǒng)否則問題使出在RAM上。
3)在WINDOWS 2000 Server系統(tǒng)的機(jī)器中啟動(dòng)ORACLE數(shù)據(jù)庫時(shí),提示有錯(cuò)而不能啟動(dòng)數(shù)據(jù)庫。出現(xiàn)這種故障,網(wǎng)絡(luò)維護(hù)人員首先會(huì)懷疑數(shù)據(jù)庫配置出了問題,或系統(tǒng)出了問題,或計(jì)算機(jī)受到病毒破壞,如果通過反復(fù)查看配置又沒發(fā)現(xiàn)問題,就需要重裝操作系統(tǒng)和數(shù)據(jù)庫系統(tǒng),這種辦法雖然繁瑣但十分有效。
4)遺忘或被篡改密碼而無法登陸,造成系統(tǒng)無法啟動(dòng)。排除這類故障的方法有很多種,筆者在WINDOWS 2000 Server系統(tǒng)下摸索出一種非常簡單的方法。首先,拆下硬盤,將其安裝到另一臺(tái)機(jī)器上設(shè)為第二硬盤,開機(jī)啟動(dòng)完畢之后,找到該硬盤當(dāng)前對(duì)應(yīng)的盤符,將該盤符下路徑為\\Documents and settings\\Administrator中的Cookies文件夾刪掉;然后關(guān)機(jī),拆下該硬盤重新安裝回原機(jī)器中,啟動(dòng)系統(tǒng)即可以空密碼快速登陸了。
5)受病毒侵害,計(jì)算機(jī)頻繁自動(dòng)啟動(dòng)而無法正常工作。這種故障現(xiàn)象是系統(tǒng)感染沖擊波病毒的典型征兆。實(shí)際上,網(wǎng)絡(luò)系統(tǒng)中的服務(wù)器一般都至少安裝有一種當(dāng)前流行的殺毒軟件,且運(yùn)行了各類補(bǔ)丁程序。排除這種故障現(xiàn)象,首先考慮的是對(duì)殺毒軟件的版本進(jìn)行升級(jí),同時(shí)查看是否有了新的補(bǔ)丁程序。若殺毒軟件經(jīng)升級(jí)后其故障依舊,則可判斷故障是一種變異型沖擊波病毒所致。一般情況下,殺毒軟件版本滯后于新病毒的出現(xiàn)。因此,盡量選用有主動(dòng)修復(fù)漏洞、主動(dòng)實(shí)時(shí)升級(jí)、搶先啟動(dòng)防病毒系統(tǒng)等功能的殺毒軟件[2]。
3.3 其它故障分析
線路故障
故障現(xiàn)象:路由器工作正常,本地局域網(wǎng)到路由器連接正常,到省局(市局)的連接不通。
故障分析:局域網(wǎng)到路由器的連接很少出現(xiàn)故障,主要是路由器到移動(dòng)基站之間出現(xiàn)線路故障。這種故障既可能出現(xiàn)在路由器與光纖收發(fā)器之間,也可能出現(xiàn)在光纖收發(fā)器與移動(dòng)網(wǎng)絡(luò)之間。遠(yuǎn)程登陸到路由器上運(yùn)行“show interface”命令,屏幕如果顯示:
Router# show interface FastEthernet0/1.2
FastEthernet0/1.2 is down, line protocol is down
…………
“FastEthernet0/1.2 is down”,說明路由器快速以太口沒有工作,故障在路由器到光纖收發(fā)器之間,應(yīng)檢查路由器到光纖收發(fā)器間的交叉線是否連接好,交叉線的水晶頭與雙絞線是否接觸牢靠,交叉線的線序是否符合標(biāo)準(zhǔn)。如果在路由器上運(yùn)行“show interface”命令,屏幕顯示“FastEthernet0/1.2 is up, line protocol is down”,則故障在光纖收發(fā)器和移動(dòng)基站間。檢查光纖收發(fā)器各指示燈狀態(tài)是否正常。如果指示燈都正常,則故障在移動(dòng)網(wǎng)絡(luò)上。
處理方法:路由器和光纖收發(fā)器之間的交叉線連接故障,用符合標(biāo)準(zhǔn)線且接觸牢靠的交叉線連接好光纖收發(fā)器和路由器;移動(dòng)網(wǎng)絡(luò)故障,應(yīng)及時(shí)電話通知移動(dòng)公司處理故障。
4 結(jié)語
隨著科學(xué)技術(shù)的迅速發(fā)展,更多高性能、高穩(wěn)定性的專業(yè)服務(wù)器等設(shè)備也將應(yīng)用于氣象部門業(yè)務(wù)網(wǎng)絡(luò)。從氣象信息網(wǎng)絡(luò)系統(tǒng)維護(hù)的角度來看,如何保障系統(tǒng)持續(xù)穩(wěn)定運(yùn)行、減少故障發(fā)生,這是系統(tǒng)維護(hù)人員必須認(rèn)真對(duì)待和深入思考的問題。
在實(shí)際的氣象業(yè)務(wù)工作中,系統(tǒng)維護(hù)人員不能等故障發(fā)生后再去被動(dòng)地對(duì)服務(wù)器作維護(hù)或維修,應(yīng)從多個(gè)方面加以防范與處理:一是加強(qiáng)對(duì)電子技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)新知識(shí)的學(xué)習(xí),全面掌握系統(tǒng)的功能結(jié)構(gòu)、數(shù)據(jù)流程、任務(wù)進(jìn)程等;二是熟悉系統(tǒng)參數(shù)配置,密切關(guān)注系統(tǒng)運(yùn)行狀態(tài),定期對(duì)系統(tǒng)進(jìn)行漏洞檢測和殺毒,并注意經(jīng)常更新殺毒軟件;三是維護(hù)系統(tǒng)環(huán)境,定期清潔系統(tǒng)塵埃,查看插件是否松動(dòng)、變形等;四是勤于記錄故障現(xiàn)象,善于總結(jié)故障原因,學(xué)習(xí)借鑒相關(guān)文獻(xiàn)上的維護(hù)技巧,豐富自身的維護(hù)與維修經(jīng)驗(yàn)。
參考文獻(xiàn):
[1] 孫鵬. 氣象市縣寬帶網(wǎng)絡(luò)建設(shè)的交換機(jī)[J]. 廣東氣象,2006(3):58-60.
[2] 黎連業(yè),張維. 路由器及其應(yīng)用技術(shù)[M]. 北京:清華大學(xué)出版社,2004.
徐向榮,男,助理工程師,大專,主要從事氣象業(yè)務(wù)開發(fā)及服務(wù)工作。