◆賓 璐
淺析信息系統(tǒng)數(shù)據(jù)遷移的方法
◆賓 璐
(中車株洲電力機車有限公司 湖南 412000)
信息系統(tǒng)數(shù)據(jù)遷移有幾個基本原則,也有一些基本的方式方法。在實際操作中,如何選擇合適方法來完成數(shù)據(jù)遷移任務,是所有IT運維人員繞不開的話題,本文研究了信息系統(tǒng)數(shù)據(jù)遷移的方法,供相關讀者參考。
數(shù)據(jù)遷移;存儲;備份;恢復
信息系統(tǒng)運行的所有結(jié)果,都以數(shù)據(jù)的形式留存了下來。信息系統(tǒng)的運維人員,因為各種各樣的原因,比如服務器及存儲系統(tǒng)等保存數(shù)據(jù)的設備損壞或更換、業(yè)務重構(gòu)等,都會遇到不得不進行數(shù)據(jù)存放位置轉(zhuǎn)移——數(shù)據(jù)遷移的情況,如何在人員、時間甚至工具都有限的情況下,完成業(yè)務系統(tǒng)的數(shù)據(jù)遷移任務,是一個繞不開的話題。
信息系統(tǒng)數(shù)據(jù)遷移有幾個基本的原則:
(1)保證數(shù)據(jù)遷移前后的一致性和完整性;
(2)信息系統(tǒng)服務應盡可能不中斷;
(3)數(shù)據(jù)遷移過程可以重入重遷。
在滿足基本原則要求的前提下,現(xiàn)階段常見的數(shù)據(jù)遷移方式基本覆蓋了信息系統(tǒng)組成的各個層面,包括存儲、文件系統(tǒng)、應用等。
基于存儲的數(shù)據(jù)遷移是指將數(shù)據(jù)從一臺存儲設備上轉(zhuǎn)移至另一臺存儲設備上的過程。該方式完全基于硬件層面,大多情況下業(yè)務無感知。
基于存儲的數(shù)據(jù)遷移主要涉及相同存儲和異構(gòu)存儲兩種場景。
對于兩套同廠商同系列的磁盤陣列,可以通過遠程鏡像來實現(xiàn)數(shù)據(jù)遷移。遠程鏡像是一種基于塊的遠程備份,即通過網(wǎng)絡將備份的塊數(shù)據(jù)傳輸?shù)疆惖卣军c,這有同步復制和異步復制兩種實現(xiàn)方式,一般都在存儲設備底層進行,不耗費主機資源,對應用透明。目前,主流存儲廠商產(chǎn)品都能提供此功能,例如IBM的PPRC、EMC的SRDF、HDS的TureCopy、NetAPP的SnapMirror等。
對于不同廠商不同系列的磁盤陣列,可以借用存儲虛擬化網(wǎng)關來實現(xiàn)數(shù)據(jù)遷移(圖1)。虛擬化設備對其連接的存儲設備進行虛擬抽象后,通過前端的接口,向最終使用它的主機進行通告。換句話說,虛擬化設備面對后端存儲時,它是主機,而面對前端主機時,它就是存儲。這看上去有一點無賴,但確實幫上了大忙:它將一種存儲設備的資源通過“裝修”,“出租”給了主機。這樣,不同存儲設備間的數(shù)據(jù)經(jīng)過虛擬化設備倒騰后,能實現(xiàn)鏡像、快照、遠程復制能功能。主流的產(chǎn)品有EMC的VPLEX、IBM的SVC等。
圖1 虛擬化網(wǎng)關數(shù)據(jù)遷移示意
基于文件系統(tǒng)的數(shù)據(jù)遷移,一般指使用特定工具軟件,將數(shù)據(jù)從一個文件系統(tǒng)轉(zhuǎn)移至另一個文件系統(tǒng)的過程(圖2)。該方式由于需要保持數(shù)據(jù)遷移前后的一致性,多需要業(yè)務停機來完成數(shù)據(jù)同步,從而造成業(yè)務的中斷。
文件系統(tǒng)的復制技術由來已久,常見的CIFS/NFS文件共享拷貝、X-Copy等都屬于文件系統(tǒng)復制技術。這種復制技術簡單快捷,對環(huán)境幾乎沒有任何復雜要求,可以快速地完成文件系統(tǒng)的整體拷貝操作,但并不符合數(shù)據(jù)遷移的基本原則。
目前,比較常用工具是RSYNC。這是一款免費開源的跨平臺數(shù)據(jù)同步軟件,基于RSYNC算法實現(xiàn)文件的快速同步;支持Unix、Linux、Mac以及Windows等多種操作系統(tǒng);在對文件進行備份/鏡像時,只傳輸文件集中被更改的部分,能盡可能地縮小業(yè)務停機時間。
圖2 文件系統(tǒng)同步復制示意
基于應用的數(shù)據(jù)遷移,是指通過應用系統(tǒng)自帶的功能,實現(xiàn)其管理的數(shù)據(jù)在其識別的存儲空間之間的轉(zhuǎn)移過程。
常見的應用數(shù)據(jù)遷移一般為通用平臺本身具備的功能,例如數(shù)據(jù)庫的同步復制、虛擬化平臺復制或在線遷移等,也有一些應用本身設計支持數(shù)據(jù)遷移功能。
數(shù)據(jù)遷移的根本目的,是實現(xiàn)應用在其他底層設備上的正常運行。因此,在條件允許的情況下,基于應用的數(shù)據(jù)遷移,是最經(jīng)濟、最安全的數(shù)據(jù)遷移方式。
基于數(shù)據(jù)備份和恢復技術的數(shù)據(jù)遷移,一般指先通過備份系統(tǒng)對源數(shù)據(jù)進行完全備份后,再恢復至目標存儲空間的過程(圖3)。整個過程耗時相對較長,且在業(yè)務系統(tǒng)不停機的情況下,很難保證遷移前后的數(shù)據(jù)一致性。幾乎所有的備份軟件都能完成此操作,但非必要,一般不采用。
圖3 數(shù)據(jù)備份恢復示意
數(shù)據(jù)遷移是IT運維人員經(jīng)常會遇到的問題,在實際操作中,在遵循數(shù)據(jù)遷移原則的前提下,可供選擇的方式方法比較多,不同的選擇帶來時間消耗和數(shù)據(jù)安全風險完全不同。
因此,實際問題還需實際分析,數(shù)據(jù)遷移前進行充分論證,確保使用已有人員、時間、工具完成任務,保障系統(tǒng)數(shù)據(jù)安全。
[1]冬瓜頭.大話存儲Ⅱ[M].北京:清華大學出版社,2011.
[2]Linux日常運維—rsync同步工具[EB/OL].https://my.oschina.net/ccLlinux/blog/1859116.