袁敬實(shí) 陳琰 王蓓蓓
【摘要】? ? 隨著“互聯(lián)網(wǎng)+”戰(zhàn)略的推進(jìn),信息消費(fèi)正在加速滲透進(jìn)各行各業(yè)與千家萬戶,給社會發(fā)展與信息化建設(shè)帶來了巨大發(fā)展機(jī)遇和發(fā)展空間。在“互聯(lián)網(wǎng)+”實(shí)現(xiàn)過程中,我們將目光鎖定在大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等熱點(diǎn)應(yīng)用領(lǐng)域,這些領(lǐng)域與“互聯(lián)網(wǎng)+”的內(nèi)容實(shí)質(zhì)有很強(qiáng)相關(guān)性。也正是因?yàn)檫@樣,由于信息化所主導(dǎo)的新興業(yè)務(wù)領(lǐng)域才會有更好的發(fā)展空間,對“互聯(lián)網(wǎng)+”戰(zhàn)略的部署和實(shí)現(xiàn)也是一種很好的促進(jìn)。本文首先對分布式存儲和分布式存儲的特點(diǎn)進(jìn)行了簡要闡述;然后以POD方案和混合POD方案為例,對分布式存儲在大數(shù)據(jù)中心建設(shè)中的具體部署情況進(jìn)行了詳細(xì)分析和描述;最后從資源利用和管理能力等六個方面出發(fā),對云數(shù)據(jù)中心建設(shè)優(yōu)勢進(jìn)行了總結(jié)。
【關(guān)鍵詞】? ? 分布式存儲? ? 大數(shù)據(jù)? ? 建設(shè)策略
一、分布式存儲及其特點(diǎn)
1.1分布式存儲
分布式存儲的擴(kuò)展性更強(qiáng),其架構(gòu)能夠?qū)崿F(xiàn)跨設(shè)備數(shù)據(jù)分發(fā),同時能夠做到多個服務(wù)器間共享存儲負(fù)載。分布式存儲一般分為塊存儲、文件存儲和對象存儲。
1.1.1分布式塊存儲
在物理機(jī)與虛擬機(jī)應(yīng)用中,塊存儲可作為一種長期存儲設(shè)備來使用,對軟件導(dǎo)出和提供本地磁盤使用很有幫助。與此同時,像備份和快照等多樣化高級服務(wù)也會被提供。
1.1.2分布式文件存儲
在“客戶端—服務(wù)器”模型的支持下,分布式文件系統(tǒng)設(shè)計(jì)更具實(shí)用性和現(xiàn)實(shí)意義。其功能在信息資源傳遞方式上表現(xiàn)出很強(qiáng)靈活性,比如基于物理設(shè)備進(jìn)行存儲的信息資源可在網(wǎng)絡(luò)環(huán)境支持下完成虛擬化存儲,這樣便在客戶端層面極大節(jié)省了存儲空間,也降低了投入資金。
1.1.3分布式對象存儲
相比分布式塊存儲和分布式文件存儲,分布式對象存儲要更復(fù)雜些,但所實(shí)現(xiàn)的功能更多,優(yōu)點(diǎn)也更加明顯,比如網(wǎng)絡(luò)附加存儲優(yōu)勢、存儲區(qū)域網(wǎng)絡(luò)優(yōu)勢等,均是分布式塊存儲和分布式文件存儲無法比擬的,這些與分布式對象存儲的結(jié)構(gòu)豐富性有直接關(guān)系。除了對象和對象存儲設(shè)備外,系統(tǒng)客戶端和元數(shù)據(jù)服務(wù)器在功能和優(yōu)勢實(shí)現(xiàn)過程中也發(fā)揮了重要作用,比如高安全性和可靠性。
1.2分布式存儲產(chǎn)品的主要特點(diǎn)
1.2.1高彈性和擴(kuò)展性
分布式存儲產(chǎn)品的高彈性和高擴(kuò)展性主要體現(xiàn)在應(yīng)用層面的負(fù)載均衡特性上,且每個硬件資源均具有這樣的特性。加之在多卷共享支持下,共享資源池功能也得到了最大限度發(fā)揮,使產(chǎn)品的高彈性特點(diǎn)得到了更好體現(xiàn)。而這一切均是在數(shù)據(jù)分片技術(shù)的支持來完成的,使數(shù)據(jù)能夠被均勻地分配到資源池中。
1.2.2高性能
分布式存儲通過動態(tài)智能分區(qū)、靜態(tài)選盤算法以及 EC 算法,采用小 IO 聚合、大 IO 直通等技術(shù),在實(shí)現(xiàn)了業(yè)務(wù)均衡分布和保證了存儲高可靠的同時,也保證了存儲的高性能。在使用 HDD 作為主存時,采用分布式 SSD Cache 加速方案,將各個 存儲節(jié)點(diǎn)上的 SSD 組建成為一個共享的分布式 Cache 資源池,供所有的業(yè)務(wù)共同所 用,實(shí)現(xiàn) HDD 主存的性能加速。
1.2.3高可靠性
分布式存儲采用分布式集群管理方式,系統(tǒng)全冗余部署,無單點(diǎn)故障。支持 多副本和 EC(Erasure Coding)兩種數(shù)據(jù)冗余保護(hù)機(jī)制,支持設(shè)置靈活的數(shù)據(jù)可靠性策略,支持DIF、后臺數(shù)據(jù)一致性校驗(yàn)等數(shù)據(jù)完整性校驗(yàn)功能。
二、分布式存儲在大數(shù)據(jù)中心建設(shè)中的部署方案
基于分布式存儲的大數(shù)據(jù)中心建設(shè)中的部署方案,在硬件方面需要X86和架頂交換機(jī)或大型數(shù)據(jù)中心交換機(jī)做支持,在不同網(wǎng)絡(luò)機(jī)構(gòu)、網(wǎng)絡(luò)規(guī)模,以及不同的應(yīng)用需求下,對設(shè)備的應(yīng)用和組網(wǎng)方法也是有所區(qū)別的。
2.1存儲獨(dú)立POD方案
POD方案是指物理基礎(chǔ)設(shè)施資源池,該方案一般用在物理機(jī)房無法滿足和承載數(shù)據(jù)中心建設(shè)要求的情況下,方案應(yīng)用宗旨是將存儲與業(yè)務(wù)和管理服務(wù)器分開。當(dāng)前我們對“物理機(jī)房無法滿足和承載數(shù)據(jù)中心建設(shè)要求”的理解是,數(shù)據(jù)中心機(jī)房的服務(wù)器要達(dá)到千臺以上規(guī)模。
POD的劃分與建設(shè)主要依據(jù)業(yè)務(wù)內(nèi)容和屬性。假如平均每一個機(jī)柜放置10臺服務(wù)器,那么1500臺服務(wù)器就需要100多個機(jī)柜,按照業(yè)務(wù)內(nèi)容來進(jìn)行劃分,可能我們需要劃分出20-30個POD。圖1是具體POD組網(wǎng)結(jié)構(gòu)圖,假設(shè)數(shù)據(jù)中心的每臺服務(wù)器以2×10GE上聯(lián)一對TOR(接入交換機(jī))上,每臺TOR以4×40GE上聯(lián)匯聚層交換機(jī),并接入數(shù)據(jù)中心網(wǎng)絡(luò)。比如,在大數(shù)據(jù)計(jì)算節(jié)點(diǎn)每對接入交換機(jī)下掛載48臺服務(wù)器,那么從接入到匯聚就會采用1:3的收斂比。需要指出的是,無論是計(jì)算節(jié)點(diǎn)還是存儲節(jié)點(diǎn),又或是管理節(jié)點(diǎn),它們本身就是一個POD,有時獲取是多個POD,其主要任務(wù)是負(fù)責(zé)協(xié)調(diào)其它各個POD之間的業(yè)務(wù)互訪。
2.2采用混合POD組網(wǎng)方案
存儲獨(dú)立POD組網(wǎng)方案主要用來解決大型機(jī)房空間和資源利用率問題,而對于中小型機(jī)房來說,由于對空間和資源的要求并不是很高,所以采用存儲獨(dú)立POD方案難免會浪費(fèi)掉多余的空間和資源。在這樣的情況下,我們可以采用混合POD組網(wǎng)方案。圖2為混合POD組網(wǎng)結(jié)構(gòu)圖。
混合POD組網(wǎng)方案主要分兩種,一是按業(yè)務(wù)分區(qū)部署方案,二是機(jī)架混合部署方案。
2.2.1按業(yè)務(wù)分區(qū)部署方案
在空間部署方面,匯聚層交換機(jī)一般會被安置在機(jī)房物理中心位置,這樣便于其它設(shè)備連接。至于對交換機(jī)類型的選擇,主要還看具體業(yè)務(wù)需求。一般情況下,計(jì)算接入交換機(jī)、管理接入交換機(jī)、存儲接入交換機(jī)、IPMI管理交換機(jī)都會被置于機(jī)柜上層,一般在34U-38U這段距離之間,每個機(jī)柜所盛放的服務(wù)器數(shù)量需要控制在10-14臺,并需要在同一個機(jī)柜部署相同業(yè)務(wù)的服務(wù)器。
2.2.2機(jī)架混合部署方案
前面所講,混合POD組網(wǎng)方案一般用于中小型機(jī)房建設(shè),但每個中小型機(jī)房的具體情況還是不同的,混合POD組網(wǎng)方案下的按業(yè)務(wù)分區(qū)部署方案多用于承載服務(wù)器數(shù)量較多的機(jī)房,而對于那些服務(wù)器數(shù)量少的機(jī)房來說,需要采用另一種方案,即機(jī)架混合部署方案。該方案與前一種方案相比,最大的不同就是計(jì)算和存儲共用一個交換機(jī)來協(xié)調(diào)業(yè)務(wù)之間互訪,而不是通過匯聚交換機(jī)來實(shí)現(xiàn)協(xié)調(diào)業(yè)務(wù)之間互訪。在此方案下,一個機(jī)柜既要承載計(jì)算服務(wù)器,也要容納存儲服務(wù)器,這樣做可以節(jié)省更多的空間資源,減少走線架線纜布放。
在同一個機(jī)柜中,計(jì)算接入交換機(jī)、管理接入交換機(jī)、存儲接入交換機(jī)和IPMI管理交換機(jī)的安置位置與按業(yè)務(wù)分區(qū)部署方案下的安置位置相同,但最頂層交換機(jī)位置不可超過40U。
三、與傳統(tǒng)IDC相比,云數(shù)據(jù)中心建設(shè)的優(yōu)勢
3.1充分利用資源
云數(shù)據(jù)中心建設(shè)優(yōu)勢主要體現(xiàn)在提高了資源使用效率,縮短了信息反映時間,提升了設(shè)備運(yùn)行維護(hù)質(zhì)量,簡化了信息管理流程,增強(qiáng)了IDC擴(kuò)展靈活性,以及降低了資源擴(kuò)充難度。這些內(nèi)容全部是云計(jì)算管理通過進(jìn)行動態(tài)監(jiān)控、調(diào)度和部署虛擬化資源池中的各種資源來實(shí)現(xiàn)的。
3.2減少用戶初期投資與運(yùn)營成本
相比重構(gòu)購買符合應(yīng)用需求的硬件設(shè)備和軟件產(chǎn)品,根據(jù)用戶實(shí)際業(yè)務(wù)需求來調(diào)整租賃資源,對幫助用戶減少初期投資成本,以及運(yùn)營成本是十分有效的。特別需要強(qiáng)調(diào)的是,用戶可根據(jù)自身使用情況進(jìn)行付費(fèi),這一極具人性化的投資特征對于中小型企業(yè)及其自身發(fā)展來說無疑是十分有利的。
3.3直接滿足并實(shí)現(xiàn)了眾多IDC業(yè)務(wù)需求
云數(shù)據(jù)中心建設(shè)具有很強(qiáng)開放性,應(yīng)用平臺可將所有實(shí)際業(yè)務(wù)需求的相關(guān)內(nèi)容整個在一起提供了用戶。同時,極具創(chuàng)新性的服務(wù)業(yè)實(shí)現(xiàn)了IDC業(yè)務(wù)服務(wù)的縱深發(fā)展。
3.4促進(jìn)IDC管理水平提高
規(guī)范化和規(guī)?;窃茢?shù)據(jù)中心建設(shè)的主要特征,這一特征,或與之相關(guān)特征,對實(shí)現(xiàn)IDC自動化管理,以及具有統(tǒng)一性的流程化管理有著重要幫助,直接促進(jìn)了IDC管理水平的提高。
3.5綠色成長
對云數(shù)據(jù)中心建設(shè)來說,綠色成長即指節(jié)能減排的實(shí)現(xiàn),以及對有限信息資源的高效利用。云數(shù)據(jù)中心的建設(shè)和應(yīng)用,將不斷推動信息化環(huán)保事業(yè)的發(fā)展。
3.6業(yè)務(wù)多樣化的實(shí)現(xiàn)
業(yè)務(wù)多樣化只是相對而言,與傳統(tǒng)IDC相比,云計(jì)算支持下的IDC正在實(shí)現(xiàn)這一特征,這與移動終端業(yè)務(wù)的支持有直接關(guān)系。
四、結(jié)束語
應(yīng)用分布式存儲技術(shù)于大數(shù)據(jù)中心建設(shè)中,需要我們能夠結(jié)合實(shí)際情、環(huán)境和需求還選擇合適的部署方案。建設(shè)空間和資源是當(dāng)前我們比較關(guān)注的兩方們問題,對于如何去解決這些問題,還需要我們能靈活運(yùn)用好相應(yīng)的技術(shù)和方案。希望本文的建議能給大家?guī)韼椭?/p>
參? 考? 文? 獻(xiàn)
[1]辛宇.網(wǎng)絡(luò)安全的分布式異構(gòu)存儲網(wǎng)絡(luò)安全技術(shù)分析[J].電子世界,2021(01):170-171.
[2]張恒均.分布式存儲——數(shù)據(jù)中心建設(shè)解決策略研究[J].數(shù)碼世界,2020(10):54-55.
[3]王晶晶.分布式存儲——大數(shù)據(jù)中心建設(shè)解決方案研究[J].電腦知識與技術(shù),2017,13(11):14-16.