朱新義
摘要:在互聯(lián)網(wǎng)網(wǎng)絡(luò)技術(shù)數(shù)據(jù)中心技術(shù)及網(wǎng)絡(luò)虛擬化技術(shù)持續(xù)發(fā)展與更新的背景下,網(wǎng)絡(luò)的工作模式發(fā)生了非常深刻的改變。多媒體技術(shù)的應(yīng)用對(duì)提升工作效率,改進(jìn)用戶體驗(yàn),完善系統(tǒng)性能均具有非常重要的意義。本文嘗試研究一種基于堆疊技術(shù)的核心交換機(jī)設(shè)計(jì)方案,對(duì)交換機(jī)堆疊的基本概念進(jìn)行分析,并就交換機(jī)堆疊的性能、可靠性、可維護(hù)性及發(fā)展趨勢(shì)展開研究,僅供各方參考。
關(guān)鍵詞:核心交換機(jī);冗余設(shè)計(jì);堆疊技術(shù);轉(zhuǎn)方面堆疊;控制面堆疊
一、交換機(jī)堆疊
交換機(jī)堆疊是指將兩臺(tái)或多臺(tái)交換機(jī)的虛擬成一臺(tái)交換機(jī),與集中式控制一樣,對(duì)外呈現(xiàn)出一個(gè)控制面,一方面能夠在空間有限的前提下提供盡可能充分的端口支持,增加系統(tǒng)交換帶寬,另一方面通過一個(gè)控制平臺(tái)下發(fā)全局成員的配置,便于網(wǎng)絡(luò)的管理維護(hù)。在交換機(jī)堆疊相關(guān)性能指標(biāo)中,最大可堆疊數(shù)是指一個(gè)獨(dú)立堆疊單元中可支持的組合交換機(jī)數(shù)量最大值,它代表一個(gè)堆疊系統(tǒng)所能提供的最大端口密度。目前技術(shù)條件支持下,按交換機(jī)組網(wǎng)的拓?fù)鋪矸郑谝皇擎準(zhǔn)蕉询B,多臺(tái)交換機(jī)組成一個(gè)鏈,為了提供網(wǎng)絡(luò)的可靠性,也可以組成環(huán)形堆疊;第二則是星型堆疊,目前多見于端口密度較高且效率要求較高的局域網(wǎng)網(wǎng)絡(luò)中。按交換機(jī)的業(yè)務(wù)層面來分,又分為控制面堆疊,即有系統(tǒng)主管理所有成員設(shè)備的加入、退出等;與控制面對(duì)應(yīng)的是轉(zhuǎn)方面堆疊,由主設(shè)備管理各成員設(shè)備的轉(zhuǎn)發(fā)業(yè)務(wù),如主設(shè)備進(jìn)行轉(zhuǎn)發(fā)拓?fù)溆?jì)算并下轉(zhuǎn)發(fā)表。通常說的堆疊是指轉(zhuǎn)方面與業(yè)務(wù)面都組成堆疊,堆疊管理鏈路與堆疊轉(zhuǎn)發(fā)鏈路可以合一,也可以分開。如果僅僅轉(zhuǎn)發(fā)面堆疊,控制面不堆疊,通常叫mlag。為了適應(yīng)數(shù)據(jù)中心的組網(wǎng)拓?fù)?,有演化出混堆,即spine-leaf模型,spine即父節(jié)點(diǎn),可單臺(tái),也可以多臺(tái)交換機(jī)組成堆疊,下掛leaf節(jié)點(diǎn)。
二、堆疊實(shí)現(xiàn)原理
先介紹幾個(gè)堆疊的背景知識(shí),堆疊成員設(shè)備根據(jù)堆疊角色分為系統(tǒng)主,堆疊系統(tǒng)的管理者;系統(tǒng)備,系統(tǒng)主退出后升系統(tǒng)主;系統(tǒng)從,即成員設(shè)備,系統(tǒng)主設(shè)備與系統(tǒng)備設(shè)備都退出后,成員設(shè)備重啟。堆疊端口,很多廠商都實(shí)現(xiàn)了靈活堆疊,不用專門的堆疊模塊,用于堆疊的端口也是普通的端口,需要做工作模式切換,當(dāng)被用作堆疊口時(shí)則將該端口配置為堆疊端口模式。插在堆疊端口上的光模塊線纜也是普通的光模塊與線纜,將普通口配置為堆疊口,插上線纜,就可以組建堆疊。管理報(bào)文的優(yōu)先級(jí)高于業(yè)務(wù)報(bào)文,所以就是出現(xiàn)廣播風(fēng)暴,管理報(bào)文也不受影響,堆疊報(bào)文與業(yè)務(wù)報(bào)文一起轉(zhuǎn)發(fā)沒有可靠性問題。
以華為的數(shù)據(jù)中心交換機(jī)設(shè)備為例,介紹下交換機(jī)堆疊實(shí)的現(xiàn)原理。對(duì)于盒式備堆疊,管理通道與轉(zhuǎn)發(fā)通道是合一的,也就是說管理消息與業(yè)務(wù)流量承載在相同的鏈路上。堆疊建立過程與通常的網(wǎng)絡(luò)協(xié)議一樣,相鄰設(shè)備基于堆疊端口互發(fā)鏈路探測(cè)報(bào)文;探測(cè)到鏈路后再基于堆疊邏輯口互發(fā)鄰居發(fā)現(xiàn)報(bào)文;鄰居發(fā)現(xiàn)后再堆疊系統(tǒng)內(nèi)部成員設(shè)備發(fā)送堆疊競(jìng)爭(zhēng)報(bào)文,成員設(shè)備收到優(yōu)先級(jí)高的競(jìng)爭(zhēng)報(bào)文則自己停止發(fā)送競(jìng)爭(zhēng)報(bào)文,最后只有系統(tǒng)主發(fā)送堆疊競(jìng)爭(zhēng)報(bào)文;系統(tǒng)主再選一個(gè)成員設(shè)備作為系統(tǒng)備。
框式設(shè)備的堆疊又分為帶內(nèi)堆疊與帶外堆疊。帶內(nèi)堆疊就是管理報(bào)文承載在轉(zhuǎn)發(fā)通道,也就是管理通道與轉(zhuǎn)發(fā)通道合一,反之就是帶外堆疊。盒式設(shè)備都是帶內(nèi)堆疊,框式設(shè)備由主控板、網(wǎng)板及轉(zhuǎn)發(fā)板等單板組成。主控板是整框的管理者,堆疊主要部署在主控板上??蚴皆O(shè)備的帶內(nèi)堆疊缺點(diǎn)多,如由于依賴業(yè)務(wù)板,堆疊建立特別慢,可靠性差,應(yīng)用相對(duì)較少。只有交換機(jī)距離太大才會(huì)用到。帶外堆疊,根據(jù)前面的概念介紹,自然就是有專門的管理通道。這個(gè)時(shí)候管理通道與轉(zhuǎn)發(fā)通道分別建立堆疊,管理通道確定最終的成員設(shè)備信息,轉(zhuǎn)發(fā)通道要與管理通道保持一致。
為了適應(yīng)數(shù)據(jù)中心的三級(jí)網(wǎng)絡(luò)模型,即接入層、匯聚層與核心層,演化出混堆技術(shù)。其中又分框式混堆設(shè)備與盒式設(shè)備混堆。性能較低的設(shè)備部署在接入層做leaf;性能較強(qiáng)的設(shè)備部署在匯聚層做spine?;於呀⒌倪^程與堆疊類似,但是leaf設(shè)備不需要發(fā)送競(jìng)爭(zhēng)報(bào)文。為了提高系統(tǒng)的可靠性,一臺(tái)設(shè)備故障了也不影響其他設(shè)備還能有堆疊的優(yōu)點(diǎn),就有了控制面不組建堆疊,僅僅轉(zhuǎn)發(fā)面組建堆疊mlag技術(shù)。
三、堆疊技術(shù)分析
堆疊技術(shù)的優(yōu)點(diǎn)分析,不改變硬件的前提下實(shí)現(xiàn)擴(kuò)容,一般盒式設(shè)備堆疊都能支持9機(jī)堆疊。比如36個(gè)40GE端口的設(shè)備,一臺(tái)設(shè)備轉(zhuǎn)發(fā)帶寬1.44T,9機(jī)堆疊接近13T,具體還看網(wǎng)絡(luò)規(guī)劃中橫向流量大小,預(yù)留多少帶寬。框式設(shè)備支持2臺(tái)設(shè)備堆疊,帶寬基本擴(kuò)大一倍。管理方便,整個(gè)堆疊系統(tǒng)共用一份配置,不需要對(duì)每臺(tái)設(shè)備都下一次配置;維護(hù)也方便,比如升級(jí),一次升級(jí)一個(gè)系統(tǒng),不用逐臺(tái)升級(jí);混堆的時(shí)候,只需要升級(jí)spine的版本。
堆疊技術(shù)的不足,增加系統(tǒng)延時(shí),比如9機(jī)堆疊,即便環(huán)形堆疊,系統(tǒng)主將轉(zhuǎn)發(fā)表下發(fā)到最遠(yuǎn)的成員設(shè)備上,要經(jīng)過4跳,勢(shì)必會(huì)導(dǎo)致時(shí)延大、流量切換性能差。所以用得比較多的還是雙機(jī)堆疊或四機(jī)堆疊。
堆疊技術(shù)同時(shí)也會(huì)降低系統(tǒng)的可靠性,多級(jí)堆到一起時(shí),帶寬翻倍,可靠性也是成比例降低。堆疊設(shè)備間耦合大,不同的業(yè)務(wù)特效耦合也很大,實(shí)現(xiàn)復(fù)雜,容易出問題。比如電信級(jí)的設(shè)備可靠性要求是5個(gè)9,穩(wěn)定性要求很高,不太會(huì)用9機(jī)堆疊。中間一臺(tái)設(shè)備異常復(fù)位或鏈路故障,成員設(shè)備聯(lián)系不到系統(tǒng)主,就會(huì)導(dǎo)致設(shè)備重啟,高可靠性場(chǎng)景下,核心交換機(jī)堆疊應(yīng)用要慎重。
Mlag技術(shù)只對(duì)轉(zhuǎn)發(fā)面堆疊,所以不會(huì)一臺(tái)設(shè)備故障而影響另外一臺(tái)。不僅能對(duì)帶寬擴(kuò)容,而且還能提高設(shè)備的可靠性,應(yīng)用得非常廣泛。Mlag只支持兩臺(tái)設(shè)備,所以用于雙活備份場(chǎng)景。
四、結(jié)束語
本文上述分析中嘗試引入堆疊技術(shù)對(duì)核心交換機(jī)進(jìn)行冗余設(shè)計(jì)與實(shí)現(xiàn),并對(duì)各類故障狀態(tài)下核心交換機(jī)的冗余性能進(jìn)行研究與分析。與傳統(tǒng)基于路由器的交換機(jī)冗余方案對(duì)比,基于堆疊技術(shù)的核心交換機(jī)冗余性能更為確切,大幅度提升了數(shù)據(jù)吞吐量;堆疊系統(tǒng)共用一個(gè)控制面,通過一臺(tái)設(shè)備管理整個(gè)堆疊系統(tǒng),配置是在堆疊系統(tǒng)內(nèi)全局有效,大幅降低了設(shè)備的管理與運(yùn)營成本。
參考文獻(xiàn):
[1]陶恒韜,陶智勇.基于ISS堆疊系統(tǒng)MAD機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)[J].自動(dòng)化技術(shù)與應(yīng)用,2020,39(1):70-73,113.
[2]吳智理,曾彪,魯旭蔚, 等.基于堆疊技術(shù)的放療網(wǎng)絡(luò)系統(tǒng)改造和升級(jí)[J].醫(yī)療衛(wèi)生裝備,2016,37(3):65-67,83.