鄭朋飛 高淼 鄭朋舉
摘 要:隨著信息技術(shù)的快速發(fā)展及公司業(yè)務(wù)逐漸走向快速、靈活、多變,河南中煙對于存儲解決方案的要求也更加靈活。通過對現(xiàn)有存儲系統(tǒng)的整合,構(gòu)建能夠支撐河南中煙未來業(yè)務(wù)發(fā)展的核心存儲系統(tǒng),通過雙活數(shù)據(jù)存儲系統(tǒng)的建設(shè),初步形成本地高業(yè)務(wù)連續(xù)性解決方案,保障煙草生產(chǎn)調(diào)度指揮體系的安全運轉(zhuǎn)。
關(guān)鍵詞:存儲虛擬化;雙活;異構(gòu)存儲
中圖分類號:TP308 文獻標識碼:A 文章編號:1671-2064(2017)22-0023-02
1 虛擬化存儲系統(tǒng)建設(shè)的背景
根據(jù)建設(shè)時期和年代不同,以及一些歷史原因,不同的系統(tǒng)分別部署在不同的集群。每個集群都有相對獨立的服務(wù)器集群系統(tǒng)、SAN網(wǎng)絡(luò)及存儲系統(tǒng)。由于業(yè)務(wù)系統(tǒng)的不斷發(fā)展,管理水平的不斷增強,隨著與計算技術(shù)的不斷應(yīng)用,IT系統(tǒng)集中化進程的加快,現(xiàn)有的存儲環(huán)境,已經(jīng)無法滿足現(xiàn)有業(yè)務(wù)系統(tǒng)的發(fā)展的需要,主要問題如下:
1.1 現(xiàn)有存儲容量擴展性不高
現(xiàn)有存儲系統(tǒng)都為各個廠商的中端存儲,存儲容量擴展性不高,且在應(yīng)對大數(shù)據(jù)量和復(fù)雜的容災(zāi)架構(gòu)的時候能力較弱,無法滿足未來數(shù)據(jù)中心的大數(shù)據(jù)量需求。
1.2 存儲孤島不利于數(shù)據(jù)統(tǒng)一管理
目前,雖然在兩臺AMS2500上實現(xiàn)了重要業(yè)務(wù)系統(tǒng)相對集中存儲,但仍存在現(xiàn)有存儲系統(tǒng)各自形成孤立的數(shù)據(jù)孤島,在資源統(tǒng)一管理上捉襟見肘。每套存儲系統(tǒng)只能利用自身的空間,而無法利用其它存儲的空間,造成很大的存儲資源浪費和重復(fù)投資。
1.3 異構(gòu)存儲整合問題
現(xiàn)有存儲系統(tǒng)由不同廠商的不同存儲系統(tǒng)構(gòu)成,擴容成本大,不同業(yè)務(wù)應(yīng)用和廠商的設(shè)備獨立擴容,無法集中選擇性價比更高和服務(wù)更優(yōu)的產(chǎn)品;共享難,各業(yè)務(wù)系統(tǒng)獨立使用存儲資源,即使其他存儲設(shè)備有閑置容量也無法加以利用,導致額外的容量浪費;管理難,各廠商的存儲管理軟件互不兼容,無法統(tǒng)一管理,導致運維難度大;業(yè)務(wù)和數(shù)據(jù)保護難,各廠商數(shù)據(jù)保護技術(shù)多樣,部署新功能困難,成本高昂。
1.4 缺乏業(yè)務(wù)連續(xù)性
目前存儲系統(tǒng)的部署方式存沒有實現(xiàn)高可用性架構(gòu),存在單點故障,不能夠有效的保護數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性。
2 雙活虛擬化存儲系統(tǒng)技術(shù)的設(shè)計與實現(xiàn)
針對目前存儲系統(tǒng)存在的問題,通過構(gòu)建雙活存儲系統(tǒng)實現(xiàn)存儲系統(tǒng)的高可用性,并利用存儲虛擬化技術(shù)對存儲孤島和異構(gòu)存儲進行整合,實現(xiàn)存儲資源的統(tǒng)一管理。
2.1 整體架構(gòu)設(shè)計
雙活存儲系統(tǒng)其中一臺使用智能異構(gòu)虛擬化功能,將現(xiàn)網(wǎng)兩臺磁盤陣列進行接管,并通過LUN遷移功能,在保證原有上層業(yè)務(wù)無感知的情況下,把磁盤陣列中核心生產(chǎn)系統(tǒng)的LUN遷移到新購高端存儲上,利用新購存儲更好的性能,提升業(yè)務(wù)質(zhì)量,同時將非核心業(yè)務(wù)系統(tǒng)的LUN部署在原磁盤陣列上,實現(xiàn)數(shù)據(jù)分級存儲,使得整體資源合理利用。這樣通過存儲異構(gòu)虛擬化技術(shù),接管現(xiàn)有存儲,實現(xiàn)存儲資源的大整合,通過建立虛擬存儲資源池,統(tǒng)一為業(yè)務(wù)提供存儲空間服務(wù),實現(xiàn)基于虛擬化的統(tǒng)一存儲平臺,完成存儲整合任務(wù)。
2.2 存儲虛擬化詳細設(shè)計
異構(gòu)虛擬化技術(shù)就是著眼于客戶的存量設(shè)備,為異構(gòu)設(shè)備提供豐富的異構(gòu)虛擬化功能。通過異構(gòu)接管功能降低用戶管理不同異構(gòu)陣列的復(fù)雜度并提升異構(gòu)LUN性能;通過提供異構(gòu)LUN在線遷移實現(xiàn)在不斷業(yè)務(wù)的情況下實現(xiàn)異構(gòu)LUN之間數(shù)據(jù)平滑的遷移;通過提供異構(gòu)遠程復(fù)制技術(shù)實現(xiàn)異構(gòu)LUN間的容災(zāi);通過提供異構(gòu)快照技術(shù)實現(xiàn)異構(gòu)LUN的快速備份。
2.3 雙活存儲詳細設(shè)計
雙活存儲解決方案指兩個存儲均處于運行狀態(tài),可以同時承擔生產(chǎn)業(yè)務(wù),從而提高數(shù)據(jù)中心的整體服務(wù)能力和系統(tǒng)資源利用率。
雙活數(shù)據(jù)中心解決方案為AA雙活架構(gòu),以業(yè)界領(lǐng)先的OceanStor V3 HyperMetro功能為基礎(chǔ),與Web、數(shù)據(jù)庫集群、負載均衡、傳輸設(shè)備和網(wǎng)絡(luò)等組件相結(jié)合,為客戶提供100km內(nèi)的端到端雙活數(shù)據(jù)中心解決方案,確保業(yè)務(wù)系統(tǒng)發(fā)生設(shè)備故障、甚至單數(shù)據(jù)中心故障時,業(yè)務(wù)無感知,自動切換,實現(xiàn)RPO(Recovery Point Objective)=0,RTO(Recovery Time Objective)=0(RTO與應(yīng)用系統(tǒng)及部署方式有關(guān))。
2.3.1 存儲層雙活架構(gòu)
(1)并行結(jié)構(gòu)。HyperMetro特性基于兩套存儲陣列實現(xiàn)AA(Active-Active)雙活,兩端陣列的雙活LUN數(shù)據(jù)實時同步,且雙端能夠同時處理應(yīng)用服務(wù)器的I/O讀寫請求,面向應(yīng)用服務(wù)器提供無差異的AA并行訪問能力。當任何一臺磁盤陣列故障時,業(yè)務(wù)自動無縫切換到對端存儲訪問,業(yè)務(wù)訪問不中斷。
(2)免網(wǎng)關(guān)設(shè)計。HyperMetro雙活架構(gòu)無需額外部署虛擬化網(wǎng)關(guān)設(shè)備,直接使用兩套存儲陣列組成跨站點集群系統(tǒng)。最大支持32個存儲控制器,即兩套16控存儲陣列組建雙活關(guān)系。
(3)I/O訪問路徑。HyperMetro在應(yīng)用主機側(cè),通過Ultra Path主機多路徑軟件,將兩臺存儲陣列上的雙活成員LUN聚合為一個雙活LUN,以多路徑vdisk方式對應(yīng)用程序提供I/O讀寫能力。應(yīng)用程序訪問vdisk時,Ultrapath根據(jù)選路模式,選擇最佳的訪問路徑,將I/O請求下發(fā)到存儲陣列。
2.3.2 高可靠技術(shù)
HyperMetro在繼承OceanStor存儲系統(tǒng)高可靠設(shè)計的基礎(chǔ)上,全新設(shè)計了一些解決方案級高可靠技術(shù),最大化提高了存儲雙活方案的可靠性。
(1)跨磁盤陣列集群。兩套獨立的存儲陣列組建成本地高可用集群,提供雙活存儲架構(gòu),向應(yīng)用服務(wù)器提供無差異的并行訪問,處理應(yīng)用服務(wù)器的I/O請求。集群節(jié)點具有并發(fā)訪問能力。當出現(xiàn)單個控制器故障時,其承接的業(yè)務(wù)將被切換到本陣列的其它工作控制器;當陣列的工作控制器全故障時,則切換至另一個陣列。在跨磁盤陣列集群基礎(chǔ)上,HyperMetro以雙活Pair或雙活一致性組為單位提供服務(wù)和進行狀態(tài)管理。
(2)數(shù)據(jù)實時鏡像。HyperMetro 通過實時鏡像功能,保證兩個存儲陣列之間數(shù)據(jù)的實時同步。主機寫操作通過實時鏡像技術(shù)同時寫入兩個數(shù)據(jù)中心的雙活成員LUN,保持數(shù)據(jù)實時一致。
HyperMetro支持斷點續(xù)傳功能。當某些故障場景(如單套存儲故障)導致雙活Pair關(guān)系異常斷開時,HyperMetro通過記錄日志的方式,記錄主機新產(chǎn)生的寫I/O。當故障恢復(fù)時,HyperMetro將自動恢復(fù)雙活Pair關(guān)系,并且將所記錄的增量數(shù)據(jù)自動同步到遠端,無需全量同步所有數(shù)據(jù),整個過程對主機“透明”,不會影響主機業(yè)務(wù)。
(3)跨磁盤陣列壞塊修復(fù)。硬盤在使用過程中可能因為掉電等異常情況出現(xiàn)壞塊,如果是可修復(fù)錯誤但是本端已經(jīng)無法修復(fù)時,HyperMetro將自動從遠端陣列獲取數(shù)據(jù),修復(fù)本地數(shù)據(jù)盤的壞塊,進一步提高系統(tǒng)的可靠性。
(4)沖裁設(shè)計。當提供雙活LUN的兩套陣列之間的鏈路故障時,陣列已經(jīng)無法實時鏡像同步,此時只能由其中一套陣列繼續(xù)提供服務(wù)。為了保證數(shù)據(jù)一致性,HyperMetro通過仲裁機制決定由哪套存儲繼續(xù)提供服務(wù)。
2.3.3 高性能技術(shù)
在雙活鏡像數(shù)據(jù)的初始同步或者恢復(fù)過程中的增量同步過程中,差異數(shù)據(jù)塊通常有大量的零數(shù)據(jù)塊,無需逐塊復(fù)制,通過硬件芯片,對數(shù)據(jù)拷貝源端進行快速識別,找出零數(shù)據(jù),在拷貝過程中,對全零數(shù)據(jù)特殊標識,只傳輸一個較小的特殊頁面到對端,不再全量傳輸。該技術(shù)可有效減少同步數(shù)據(jù)量,減少帶寬消耗,縮短同步時間。
2.4 原有存儲系統(tǒng)利舊使用
對于原有的存儲系統(tǒng)可以分兩類來用:對于購置時間較長和性能不高的存儲系統(tǒng)用來組件集中備份系統(tǒng)。對于性能較好的2臺原核心存儲,用新購置的華為OceanStor 18500 V3存儲系統(tǒng)的異構(gòu)存儲虛擬化功能進行接管,繼續(xù)作為生產(chǎn)存儲使用,可以存儲一些非關(guān)鍵應(yīng)用的數(shù)據(jù)。
3 實施效果
通過本項目的實施,利用雙活存儲解決方案提供了存儲系統(tǒng)的高可用性架構(gòu),雙活存儲的高可用性架構(gòu)消除了數(shù)據(jù)中心存儲系統(tǒng)的單點故障,當任一存儲系統(tǒng)發(fā)生故障時,另一存儲系統(tǒng)可自動接管業(yè)務(wù),能夠充分保證業(yè)務(wù)系統(tǒng)連續(xù)性,任意單個存儲系統(tǒng)發(fā)生故障時,業(yè)務(wù)數(shù)據(jù)無丟失,業(yè)務(wù)系統(tǒng)不會中斷。雙活存儲解決方案還提供了全自動的故障處理機制,故障切換無需人工干預(yù),大幅降低容災(zāi)系統(tǒng)維護成本,使得維護與管理變得更加規(guī)范。并通過對現(xiàn)有存儲系統(tǒng)的整合,充分利用現(xiàn)有資源,構(gòu)建能夠支撐河南中煙未來業(yè)務(wù)發(fā)展的核心存儲系統(tǒng),初步形成本地高業(yè)務(wù)連續(xù)性解決方案,保障河南中煙應(yīng)用系統(tǒng)的安全運行。