李晶晶
(中通服咨詢?cè)O(shè)計(jì)研究院有限公司,江蘇 南京 210019)
相較于傳統(tǒng)網(wǎng)際互連協(xié)議(Internet Protocol,IP)網(wǎng)絡(luò)故障檢測(cè)方面的不足,在IP承載網(wǎng)中應(yīng)用雙向轉(zhuǎn)發(fā)檢測(cè)(Bidirectional Forwarding Detection,BFD)技術(shù)能有效建立雙向轉(zhuǎn)發(fā)檢測(cè)模式,更迅速地完成鏈路故障的檢測(cè)分析,縮減網(wǎng)絡(luò)故障響應(yīng)時(shí)長(zhǎng),提升IP承載網(wǎng)的可靠性和運(yùn)行穩(wěn)定性。
BFD技術(shù)本身是一種獨(dú)立的檢測(cè)模式,能有效承載檢測(cè)數(shù)據(jù),并將其直接傳輸?shù)絽f(xié)議體系中,利用多種協(xié)議層和傳輸處理方式就能對(duì)相關(guān)內(nèi)容進(jìn)行管理。此外,BFD技術(shù)支持的檢測(cè)時(shí)間和經(jīng)濟(jì)成本都能結(jié)合實(shí)際需求展開(kāi)合理性調(diào)控,維持協(xié)議靈活性的同時(shí)提升調(diào)控的精準(zhǔn)性。
本文以BFD技術(shù)為例,對(duì)控制分組和定義等內(nèi)容予以介紹。BFD技術(shù)系統(tǒng)的主要組成部分如下:(1)狀態(tài)字段,在實(shí)際發(fā)端系統(tǒng)中能有效完成BFD技術(shù)的狀態(tài)分析工作,并配合技術(shù)操作過(guò)程進(jìn)行會(huì)話狀態(tài)的分析;(2)輪詢比特處理分析,主要完成鏈路連接性分析,并及時(shí)捕捉參數(shù)變化動(dòng)態(tài)信息,完成相關(guān)內(nèi)容的匯總[1];(3)響應(yīng)比特,在置位端完成控制分組的響應(yīng);(4)控制平面的獨(dú)立比特,若將BFD技術(shù)應(yīng)用在平面控制方面,一旦控制面失效,則錯(cuò)誤的狀態(tài)信息會(huì)得到及時(shí)的修正處理,運(yùn)行狀態(tài)隨之恢復(fù)常態(tài);(5)認(rèn)證比特,建立會(huì)話后,對(duì)2個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)之間展開(kāi)BFD檢測(cè)。
1.2.1 基礎(chǔ)模式
首先,BFD支持在2個(gè)端點(diǎn)之間的一條鏈路上建立BFD會(huì)話,結(jié)合實(shí)際需求完成BFD技術(shù)檢測(cè)分組的劃分和發(fā)送。其次,若2個(gè)端點(diǎn)之間的鏈路不止1條,結(jié)合本端系統(tǒng)完成遠(yuǎn)端系統(tǒng)命令指導(dǎo),實(shí)時(shí)性發(fā)送或者是停止BFD控制分組指令,并在每一條鏈路上均設(shè)置BFD會(huì)話。最后,對(duì)整個(gè)會(huì)話模式進(jìn)行驗(yàn)證,和遠(yuǎn)端系統(tǒng)展開(kāi)BFD控制分組通信處理,配合靜默狀態(tài)就能實(shí)現(xiàn)數(shù)據(jù)的匯總分析。
1.2.2 主動(dòng)模式和被動(dòng)模式
(1)主動(dòng)模式。在建立BFD會(huì)話前,操作人員要對(duì)BFD指令信息有初步了解,無(wú)論是否能收到接收端發(fā)出的BFD控制報(bào)文,都要結(jié)合實(shí)際情況進(jìn)行主動(dòng)發(fā)送報(bào)文信息[2]。(2)被動(dòng)模式。建立對(duì)話前不會(huì)主動(dòng)發(fā)送BFD控制報(bào)文,一直到已經(jīng)收到接收端發(fā)送的報(bào)文信息為止。
基于會(huì)話初始分析要求,通信雙方至少一方要選取主動(dòng)模式才能為后續(xù)會(huì)話的建立和開(kāi)展提供基礎(chǔ)傳輸內(nèi)容,以保證對(duì)應(yīng)信息傳遞的合理性和科學(xué)性。與此同時(shí),在BFD會(huì)話建立后,也可以添加查詢模式,確認(rèn)連接系統(tǒng)后選取顯示驗(yàn)證連接,在報(bào)文得到回應(yīng)后完成對(duì)話。
結(jié)合網(wǎng)絡(luò)應(yīng)用環(huán)境的具體要求,在網(wǎng)絡(luò)信息傳遞和處理工作中,BFD技術(shù)要和控制協(xié)議聯(lián)合應(yīng)用,主要是由于BFD技術(shù)無(wú)法直接提供特定控制協(xié)議的連接性內(nèi)容,僅僅能為控制協(xié)議提供相應(yīng)的服務(wù)項(xiàng)目。在不同應(yīng)用環(huán)境內(nèi),為便于建立完整且合理的傳送管理模式,提高信息傳遞的及時(shí)性和規(guī)范性,要整合IP承載網(wǎng)技術(shù)處理環(huán)節(jié)的規(guī)范性,減少傳送信息丟失等問(wèn)題,保證傳送工作都能順利展開(kāi)[3]。
與此同時(shí),BFD技術(shù)應(yīng)用服務(wù)端口較為簡(jiǎn)單,在會(huì)話參數(shù)提供后就能進(jìn)行通路狀態(tài)結(jié)果的搜索和匯總,以評(píng)估通路狀態(tài)的實(shí)時(shí)性運(yùn)行狀態(tài),這就大大提升了檢測(cè)的時(shí)效性和規(guī)范性,確保網(wǎng)絡(luò)故障檢測(cè)工作的有序開(kāi)展[4]。
2.1.1 BFD技術(shù)與IGP搭配
在網(wǎng)絡(luò)應(yīng)用環(huán)境中,信息需求量較大,因此網(wǎng)絡(luò)環(huán)境涉及較多的路由器,而路由器的路由控制都需要借助內(nèi)部網(wǎng)關(guān)協(xié)議(Interior Gateway Protocol,IGP)模塊。較為常見(jiàn)的IGP協(xié)議包括開(kāi)放式最短路徑優(yōu)先(Open Shortest Path First,OSPF)模塊和ISIS模塊等。
在傳統(tǒng)的故障檢測(cè)處理環(huán)節(jié)中,一般是借助路由器發(fā)送“Hello”進(jìn)行分組評(píng)測(cè),從而了解對(duì)應(yīng)通路的實(shí)際信息數(shù)據(jù)傳輸情況,以此作為后續(xù)評(píng)估的基礎(chǔ)。盡管這種方式能完成測(cè)定分析,但是檢測(cè)周期較長(zhǎng)。故障發(fā)生后,OSPF最短的檢測(cè)時(shí)間約為2 s,而ISIS最短的檢測(cè)時(shí)間為1 s[5]。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和進(jìn)步,這種級(jí)別的檢測(cè)時(shí)間已經(jīng)無(wú)法滿足實(shí)際需求?;诖耍柚鶥FD技術(shù)進(jìn)行故障評(píng)測(cè)和協(xié)同處理,檢測(cè)周期可結(jié)合實(shí)際需求予以設(shè)定分析,故障發(fā)現(xiàn)時(shí)間一般會(huì)控制在30 ms以內(nèi)。配合IGP協(xié)議,就能大大提升故障響應(yīng)檢測(cè)的準(zhǔn)確性和時(shí)效性。
將OSPF和ISIS進(jìn)行融合,在配合處理的基礎(chǔ)上與BFD技術(shù)予以調(diào)用,能大大提升實(shí)時(shí)性控制水平。例如,ISPF和ISIS會(huì)借助技術(shù)本身需要發(fā)送“Hello”的模式完成協(xié)議的傳輸,相鄰模塊發(fā)現(xiàn)后,結(jié)合發(fā)現(xiàn)的結(jié)果啟動(dòng)BFD技術(shù)會(huì)話框,此時(shí)就能實(shí)現(xiàn)無(wú)縫連接,確保鏈路和通路檢測(cè)工作的順利展開(kāi)。值得一提的是,一旦運(yùn)行中鏈路BFD技術(shù)會(huì)話失效,則證明整個(gè)鏈路存在故障點(diǎn),配合OSPF和ISIS就能落實(shí)故障處理措施,維持故障檢測(cè)分析工作的平衡。
另外,OSPF本身是在IP層運(yùn)行,能實(shí)現(xiàn)單一數(shù)據(jù)協(xié)議的路由控制處理,所以在與BFD技術(shù)聯(lián)用的過(guò)程中僅能完成IP協(xié)議鏈路故障檢測(cè)。而ISIS能實(shí)現(xiàn)數(shù)據(jù)鏈路層以上信息的檢測(cè)分析,支持多數(shù)據(jù)傳送協(xié)議,因此基于多拓?fù)浣Y(jié)果的ISIS能更好地滿足BFD技術(shù)多個(gè)對(duì)話框啟動(dòng)的需求[6]。
2.1.2 BFD技術(shù)與FRR搭配
快速重路由(Fast Reroute,F(xiàn)RR)技術(shù)一般應(yīng)用在網(wǎng)絡(luò)體系中,完成路由備份的工作。一旦整個(gè)線路出現(xiàn)了網(wǎng)絡(luò)故障,此時(shí)要在收斂前進(jìn)行路由的快速切換處理。一般而言,收斂作用下的路由重新計(jì)算和路由狀態(tài)廣播較為關(guān)鍵,也正是因?yàn)楦采w范圍較大且結(jié)構(gòu)較為復(fù)雜,要借助FRR技術(shù)實(shí)現(xiàn)快速的切換處理,避免丟包問(wèn)題對(duì)信息數(shù)據(jù)交互產(chǎn)生影響。
實(shí)際應(yīng)用環(huán)境中,F(xiàn)RR借助物理接口作為另一個(gè)接口備份的基礎(chǔ),在主用接口的下一個(gè)鏈路上部署B(yǎng)FD,主用接口失效后就能結(jié)合BFD技術(shù)會(huì)話狀態(tài)的變化完成路由表路由到目標(biāo)網(wǎng)絡(luò)的評(píng)估工作[7]。例如,借助BFD技術(shù)完成雙路由平面結(jié)構(gòu)的通路檢測(cè),具體如圖1所示。
圖1 雙路由平面結(jié)構(gòu)檢測(cè)
由圖1可知,在IP承載網(wǎng)中,R1a、R2a、R3a以及R4a組成了基礎(chǔ)的平面業(yè)務(wù)系統(tǒng),搭建了對(duì)應(yīng)的系統(tǒng)信息交互和匯總通路,R1b、R2b、R3b以及R4b實(shí)現(xiàn)了B平面保護(hù)通路的應(yīng)用控制體系。配合R1a、R2a、R3a、R4a建立端對(duì)端通路BFD檢測(cè),在任1個(gè)鏈路或者是節(jié)點(diǎn)出現(xiàn)異常故障問(wèn)題后,BFD會(huì)話即刻失效,此時(shí)就會(huì)直接切換到FRR通路。正是借助BFD和FRR技術(shù)融合的處理方式,大大提升故障檢測(cè)的實(shí)效性,切換速度能控制在50 ms以內(nèi)[8]。
在網(wǎng)絡(luò)信息交互管理的過(guò)程中,上層業(yè)務(wù)平臺(tái)或者是網(wǎng)管會(huì)借助多種設(shè)備共同參與。為有效減少網(wǎng)絡(luò)設(shè)備的端口數(shù)量,進(jìn)一步提升平臺(tái)訪問(wèn)過(guò)程的可控化效果,就要保證設(shè)備在統(tǒng)一的局域網(wǎng)內(nèi),借助出口交換機(jī)或者是路由器維持網(wǎng)絡(luò)的接入處理,在提升網(wǎng)絡(luò)可靠性的同時(shí),更好地完成工作,確保虛擬路由器冗余協(xié)議等都能落實(shí)到位?;诖耍⑻摂M路由器冗余協(xié)議(Virtual Router Redundancy Protocol,VRRP),結(jié)合IP網(wǎng)絡(luò)的運(yùn)行過(guò)程,有效達(dá)成冗余備份協(xié)議。
在局域網(wǎng)運(yùn)行過(guò)程中,主機(jī)的路由器設(shè)備一旦出現(xiàn)故障,就能借助VRRP技術(shù)進(jìn)行下聯(lián)業(yè)務(wù)系統(tǒng)路由的實(shí)時(shí)性管理,維持通信的連續(xù)性以及可靠性。在傳統(tǒng)的VRRP技術(shù)體系中,1臺(tái)路由器出現(xiàn)了鏈路異常,其所對(duì)應(yīng)的備份路由器要3 s才能實(shí)現(xiàn)對(duì)應(yīng)系統(tǒng)的切換處理,而在應(yīng)用BFD技術(shù)后,能大大提升時(shí)效性,將主備路由器倒換時(shí)間控制在1 s以內(nèi)[9]。具體的通路檢測(cè)方式見(jiàn)圖2。
圖2 通路檢測(cè)
結(jié)合圖1,R1a、R2b、R3a、R4a表示的是承載網(wǎng)的基礎(chǔ)接入路由器設(shè)備,對(duì)應(yīng)的R1b、R2b、R3b、R4b表示的是業(yè)務(wù)系統(tǒng)在局域網(wǎng)應(yīng)用環(huán)境中的出口交換機(jī)設(shè)備,按照標(biāo)準(zhǔn)化流程完成相應(yīng)設(shè)備的連接處理,并按照規(guī)范要求落實(shí)后續(xù)處理工作,以維持實(shí)際應(yīng)用控制的規(guī)范性標(biāo)準(zhǔn)。首先,A平面和B平面之間部署VRRP協(xié)議,A平面表示的是Master、B平面表示的是Backup。其次,要整合具體的鏈路內(nèi)容,并且系統(tǒng)能結(jié)合實(shí)際應(yīng)用環(huán)境有效開(kāi)啟BFD會(huì)話模式,以維持?jǐn)?shù)據(jù)傳遞的及時(shí)性。最后,若是系統(tǒng)出現(xiàn)鏈路故障,則對(duì)應(yīng)的節(jié)點(diǎn)會(huì)迅速顯示,并借助VRRP協(xié)議依據(jù)BFD檢測(cè)結(jié)果完成主備切換。正是基于技術(shù)融合處理的合理性,才能有效減少VRRP檢測(cè)故障損耗的時(shí)長(zhǎng),及時(shí)進(jìn)行業(yè)務(wù)流實(shí)時(shí)性評(píng)估,保證系統(tǒng)能在最短時(shí)間內(nèi)恢復(fù)常態(tài),維持網(wǎng)絡(luò)應(yīng)用運(yùn)行的規(guī)范效果,也能為IP承載網(wǎng)運(yùn)行安全提供支持[10]。
基于IP基礎(chǔ)的承載網(wǎng)建設(shè)工作要想突破IP協(xié)議的瓶頸,就要整合技術(shù)內(nèi)容,建立完整的技術(shù)融合管理體系,維持IP承載網(wǎng)BFD技術(shù)應(yīng)用控制的平衡,保證技術(shù)運(yùn)維管理工作順利展開(kāi),并更好地提升故障檢測(cè)、鏈路維護(hù)等工作的效率,實(shí)現(xiàn)統(tǒng)籌管理的目標(biāo),為IP承載網(wǎng)的可持續(xù)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。