本刊編輯 余健儀
數(shù)據(jù)中心對于當(dāng)代互聯(lián)網(wǎng)的發(fā)展極為重要。目前,數(shù)據(jù)中心內(nèi)的交換設(shè)備正在面臨更新?lián)Q代。老式的交換設(shè)備將在未來幾年內(nèi),被更加快速、更加靈活的新一代交換設(shè)備所取代。服務(wù)器虛擬化,光纖存儲與IP交換設(shè)備的直連以及企業(yè)云計算正成為推動這場變革的主要力量。以往的變革只是單一地依靠提高接口的吞吐能力,但現(xiàn)在我們還需要通過創(chuàng)造更低的延時、取消生成樹以及支持新的存儲協(xié)議這些改革來構(gòu)造更加靈活、更低成本的數(shù)據(jù)中心。未來,網(wǎng)絡(luò)將融合為統(tǒng)一的交換結(jié)構(gòu),數(shù)據(jù)、計算及存儲“三網(wǎng)合一”將是數(shù)據(jù)中心的發(fā)展方向。
服務(wù)器虛擬化能夠極大地提高服務(wù)器的利用率、節(jié)約服務(wù)器的購置成本和管理成本,這是眾所周知的,但服務(wù)器虛擬化也為眼下的數(shù)據(jù)中心交換環(huán)境帶來了不少難題,驅(qū)使交換技術(shù)作出變革。
首先,由于每臺物理服務(wù)器都有很多虛擬機(jī),每個虛擬機(jī)又都有自己的MAC地址,這將導(dǎo)致包發(fā)送變得很混亂,影響虛擬機(jī)之間的通信。最簡單的解決方法是在虛擬機(jī)中設(shè)置軟交換。設(shè)置了軟交換的服務(wù)器對網(wǎng)絡(luò)交換機(jī)來說它只有一個MAC地址,而對服務(wù)器內(nèi)的虛擬機(jī)來說,它又起著交換機(jī)的作用。不過,軟交換需要強(qiáng)制執(zhí)行各種安全策略,也需要訪問控制列表(ACL),以確保各個VLAN的安全。例如,如果安全策略不允許被破壞的虛擬機(jī)與同一個服務(wù)器上其它虛擬機(jī)通信,那么一旦某個虛擬機(jī)被破壞,將禁止它與其它虛擬機(jī)通信自由通信。如果各個虛擬機(jī)并不在同一個物理服務(wù)器中,網(wǎng)絡(luò)也要求確保這些安全策略和協(xié)議得到遵守。
另一種解決辦法就是需要由服務(wù)器和軟交換的維護(hù)人員來保證所有網(wǎng)絡(luò)的跟蹤和控制都得到執(zhí)行。這就需要服務(wù)器管理員和交換設(shè)備管理員之間有良好的協(xié)作,同時服務(wù)器管理員還需要了解網(wǎng)絡(luò)方面的配置。當(dāng)然,如果采用同一家廠商提供的軟交換機(jī)作為網(wǎng)絡(luò)交換機(jī),協(xié)調(diào)會更容易些。Cisco正與VMware一起合作致力于解決這樣的問題。
第三種方案是讓虛擬服務(wù)器的所有通信消息都發(fā)送到網(wǎng)絡(luò)交換機(jī),這可以簡化虛擬機(jī)的軟交換配置,使此時的軟交換機(jī)不具備安全策略和標(biāo)記數(shù)據(jù)包的能力,而把這部分功能轉(zhuǎn)嫁到網(wǎng)絡(luò)交換機(jī)上。從網(wǎng)絡(luò)交換機(jī)的角度來說,虛擬機(jī)就像是直接連到物理服務(wù)器上。這個方法具有一定的吸引力,因為它無需改變已有的工作流程,每個管理人員所應(yīng)承擔(dān)的職責(zé)也沒有改變。但由于生成樹不允許交換機(jī)在一個端口接收和返回同一個數(shù)據(jù)包,因此需要消除生成樹的這一限制。
虛擬化的第二個難題是要在保證服務(wù)器有足夠的吞吐量的同時,確保數(shù)據(jù)包沿著最佳路徑到達(dá)目的地。隨著物理服務(wù)器上處理器數(shù)目的不斷增多,虛擬機(jī)也越來越多,導(dǎo)致進(jìn)出服務(wù)器的數(shù)據(jù)流量激增,解決方法是部署萬兆甚至十萬兆的網(wǎng)絡(luò),但這只能在一定程度上使問題有所緩解。由于數(shù)據(jù)中心需要創(chuàng)建非常低的延遲和無阻塞多路徑結(jié)構(gòu),因此還需要采用兩個適配器連接到不同的交換機(jī)讓整個路由實現(xiàn)多條路徑發(fā)送,有助于解決低延遲問題。這時生成樹問題再次出現(xiàn),解決方法是取消生成樹,以保證兩個適配器都可同時使用。事實上,新一代的兩層交換機(jī)越來越像路由器,在第二層執(zhí)行各自的鏈路狀態(tài)路由協(xié)議版本。
多年來,存儲網(wǎng)絡(luò)正逐步走向IP化,大量的存儲已經(jīng)通過NAS,iSCSI等設(shè)備來完成。目前正實現(xiàn)光纖通道與IP交換機(jī)的直連,獨立的光纖通道存儲區(qū)域網(wǎng)絡(luò)逐漸退出市場。此舉通過減少每個服務(wù)器中的適配器的數(shù)量能達(dá)到成本節(jié)約的目的。目前,服務(wù)器都需要設(shè)置一臺以太網(wǎng)適配器和一臺光纖存儲適配器。為提高可用性,每種適配器都需要配備2臺,導(dǎo)致每臺服務(wù)器共有4臺適配器。而采用統(tǒng)一的IP網(wǎng)絡(luò)后,IP網(wǎng)絡(luò)數(shù)據(jù)、光纖通道數(shù)據(jù),或是iSCSI數(shù)據(jù)都可以共用一臺適配器,這就能將適配器數(shù)目減少到2臺。適配器減半意味著交換接口和電纜數(shù)目也將減少,最終達(dá)到運(yùn)營和維護(hù)成本的降低。
支持光纖通道存儲是升級交換機(jī)的一個重要原因。交換機(jī)需要支持存儲數(shù)據(jù)通過IP網(wǎng)絡(luò)訪問NAS、ISCSI和FCoE等設(shè)備。除了增加FCoE協(xié)議以外,必須提供更高的跨區(qū)域帶寬支持,以及取消生成樹。因為光纖通道要求兩個適配器都是活動的,并能同時傳輸數(shù)據(jù)。如果交換機(jī)仍然采用生成樹算法將無法滿足這些要求。
數(shù)據(jù)中心的交換技術(shù)變革第三個推動因素是企業(yè)云。過去當(dāng)應(yīng)用程序收到一個請求時,一般是由應(yīng)用程序本身或服務(wù)器獨立執(zhí)行完成。多年來,這種應(yīng)用實施方式已經(jīng)發(fā)生改變。當(dāng)越來越多的請求到達(dá)服務(wù)器,應(yīng)用程序只需承擔(dān)小部分任務(wù),更多的是將任務(wù)提交給數(shù)據(jù)中心的其它應(yīng)用共同完成。這樣數(shù)據(jù)中心就形成一個龐大的內(nèi)部云。直接將存儲建立到IP云中會增加流經(jīng)交換機(jī)的關(guān)鍵數(shù)據(jù)流的數(shù)量,這就要求交換機(jī)提供低延遲且保證數(shù)據(jù)包零丟棄。之所以要求低延遲的原因是:如果程序的執(zhí)行發(fā)生在服務(wù)器內(nèi),每次存儲只需要幾納秒到幾微秒的時間來完成,而隨著企業(yè)逐漸過渡到虛擬數(shù)據(jù)中心,并開始采用基于云的服務(wù),交換機(jī)要獲取企業(yè)云數(shù)據(jù)可能需要50~100微秒(具體取決于造成延遲的程序調(diào)用的次數(shù)),如果交換機(jī)丟棄數(shù)據(jù)包,延遲時間將變得更長,唯一的辦法是企業(yè)云計算要求低延遲且不丟包。
無可否認(rèn),現(xiàn)有的數(shù)據(jù)中心交換機(jī)具有延遲低、丟棄數(shù)據(jù)包少,以及支持10G以太網(wǎng)連接的特點。但為什么仍然無法應(yīng)對虛擬化,存儲和云計算帶來的沖擊呢?根本原因在于新的挑戰(zhàn)不論在延遲性、可靠性還是吞吐能力上都對交換機(jī)提出了更高的性能要求。
首先是延遲性。目前的交換機(jī)主要基于存儲轉(zhuǎn)發(fā)模式,該模式適用于像電子郵件這類應(yīng)用。郵件服務(wù)器先將接收到的郵件保存在緩沖區(qū)中,經(jīng)過校驗后轉(zhuǎn)發(fā)到指定地址。最常見的存儲轉(zhuǎn)發(fā)實現(xiàn)是消息隊列。當(dāng)交換機(jī)收到一個數(shù)據(jù)包后會將其存放于隊列中,當(dāng)數(shù)據(jù)包移到隊列首位時就會被發(fā)送出去。這種方式的顯著優(yōu)點是交換機(jī)能處理大并發(fā)量的數(shù)據(jù)而無需丟棄任何數(shù)據(jù)。因而新一代的交換機(jī)都以此作為賣點。
然而,隊列的存在使數(shù)據(jù)包在一個三層數(shù)據(jù)中心中傳輸需要花費約80微秒的時間。如果發(fā)生丟包,這個過程可能增加至100微秒。如果是在響應(yīng)時間以秒來衡量的過去,80微秒的延時是可以接受的。但對于期望亞秒級響應(yīng)目標(biāo)的今天,這將遠(yuǎn)遠(yuǎn)滿足不了要求。例如,一個涉及大量數(shù)據(jù)的應(yīng)用程序在這種性能條件下則需要長時間才能獲取所需數(shù)據(jù),這不僅僅延長了響應(yīng)時間,還導(dǎo)致了每次處理用時的增加,降低服務(wù)器的工作效率。
新一代交換技術(shù)要求大大縮短隊列等候的時間,加速處理進(jìn)程,從而克服過去較大延時的缺點。新技術(shù)的第一大變化體現(xiàn)在數(shù)據(jù)包發(fā)送方式的設(shè)計上:采用直通交換方式彌補(bǔ)存儲轉(zhuǎn)發(fā)模式的不足,縮短或消除了交換機(jī)內(nèi)部的隊列,使交換時間可從15-50微秒降低到2-4微秒。這種方式其實不算新穎,但實施起來也會比較復(fù)雜和昂貴,因此只有在要求非常低延時情況下開發(fā)商才會使用。
第二大變化是放棄了數(shù)據(jù)中心的生成樹。新一代的交換機(jī)采用多條路徑發(fā)送數(shù)據(jù)包,他們不斷監(jiān)測潛在的擁塞點或隊列,選擇最佳的包發(fā)送路徑。目前,所有二層交換機(jī)都運(yùn)用生成樹算法來判定唯一的最佳路徑,即發(fā)往目的地址的數(shù)據(jù)包只能利用一條路徑,其它路徑處于備份狀態(tài)或無效狀態(tài)。只有當(dāng)最佳路徑失效時,其它路徑才會被考慮。該算法雖然能夠很好地應(yīng)用到二層網(wǎng)絡(luò)的互聯(lián)中,但在取消隊列和不丟包的新要求下,這種只選唯一路徑的算法已經(jīng)無法滿足。因此需要取消生成樹,采用多路徑的方法。但目前多路徑方法仍存在著相關(guān)標(biāo)準(zhǔn)不統(tǒng)一等問題,各個供應(yīng)商都“八仙過海”,各有各的解決方案?!皵?shù)據(jù)中心橋接”(DCB)等新型數(shù)據(jù)中心標(biāo)準(zhǔn)化項目已經(jīng)啟動,標(biāo)準(zhǔn)的問題將得到有效解決。
第三大變化是傳送速度。速度問題是所有交換機(jī)必須的考慮因素之一。新型交換機(jī)是專門針對10G,40G,100G密集型以太網(wǎng)部署的,速度得到極大提升,延時可以從80微秒縮減到不到10微秒,滿足了光纖通道和云計算所需的延時和吞吐量需求。
相對于傳統(tǒng)數(shù)據(jù)中心使用的交換機(jī)產(chǎn)品,新一代交換機(jī)實現(xiàn)了跨越性的性能突破,為平滑升級到40G和100G以太網(wǎng)接入做好了準(zhǔn)備,尤其是在未來數(shù)據(jù)中心三網(wǎng)融合成為大勢所趨的情況下,這一場技術(shù)變革將推動整個新一代數(shù)據(jù)中心的加速發(fā)展。
參考資料:
http://www.networkworld.
com/news/2009/091709-remaking-data-center.html