賈生寧
數(shù)據(jù)分級存儲是指將數(shù)據(jù)存放在不同級別的存儲設備(磁盤陣列、磁帶庫、光盤庫)中,并通過分級存儲管理軟件實現(xiàn)數(shù)據(jù)在存儲設備之間的自動遷移。用戶可以根據(jù)數(shù)據(jù)的訪問頻率、保留時間、容量、性能要求等因素確定最佳存儲策略。
數(shù)據(jù)分級存儲的工作原理是基于信息生命周期管理(ILM),通過將不經常訪問的數(shù)據(jù)自動遷移到存儲層次中較低的層次,從而釋放高成本、高能耗的存儲空間給更頻繁訪問的數(shù)據(jù),這樣可以獲得更好的性價比。
另外,通過將訪問頻率較低的數(shù)據(jù)備份到離線的存儲介質(如磁帶)中,可以更有效地利用有限的資源,顯著降低維護這些數(shù)據(jù)帶來的開銷,同時又可以滿足相關法規(guī)的規(guī)定。
通常情況下,多級存儲系統(tǒng)可分為三個層次,即在線存儲、近線存儲和離線存儲。
提高資源使用率
將使用率低的數(shù)據(jù)遷移到功耗低的設備上,尤其是將數(shù)據(jù)遷移到大容量的離線設備上,可以釋放這部分數(shù)據(jù)占用的系統(tǒng)資源,提高資源使用率,減少相關存儲設備的數(shù)量,從而有效減少存儲設備的電力需求,保證重要在線業(yè)務的能源需要,同時減少降噪、冷卻帶來的額外能源開銷。
采用不同存儲設備
在線存儲、近線存儲和離線存儲對系統(tǒng)的性能要求各不相同。
在線存儲對性能要求較高,可以采用高速的磁盤設備。但采用高速磁盤作為在線存儲設備時,其能耗要高于低速的磁盤設備(如SATA磁盤等)。比如,FC磁盤正常工作時的功耗為27.73W,但大容量的SATA磁盤正常工作時的功耗僅為12.8W。如果保存100TB的數(shù)據(jù),需要的FC磁盤與SATA磁盤的數(shù)量分別為334個(以每個FC磁盤容量300GB計算)和100個(以每個SATA磁盤容量1TB計算)。為保證這些磁盤的運行,FC磁盤與SATA磁盤的電力需求分別為9262W和1280W(不包括RAID等額外的磁盤開銷)。從這一點可以看出,在近線存儲設備中,采用高容量的低速磁盤來存儲不經常訪問的數(shù)據(jù),可以大幅降低能源的消耗,達到節(jié)能的目標。
與磁帶設備相比,近線存儲采用磁盤設備,可以大幅提高系統(tǒng)的備份與恢復速度。以華為賽門鐵克公司的VTL3605虛擬磁帶庫為例,其備份速度可以達到1.5TB/h,但離線存儲的備份速度只有288GB/h。僅從這一點來衡量,虛擬磁帶庫的備份速度遠遠高于磁帶設備。
在實際應用中,用戶可以綜合考慮性能與業(yè)務的需求,將對實時性要求較高的關鍵業(yè)務放到高速、高能耗的在線設備上,而將對實時性要求較低的數(shù)據(jù)遷移到低能耗的近線設備上,從而有效降低能源的開銷。
固態(tài)硬盤(SSD)兼顧了性能與環(huán)保的要求,可用于在線存儲,以降低系統(tǒng)能耗,并提高系統(tǒng)的性能。但由于SSD的成本較高,目前還沒有得到普及。
減少設備占用空間
為了滿足日益增長的數(shù)據(jù)存儲需求,用戶不得不購買更多的物理磁盤。高速的SAS磁盤最多只能提供300GB的存儲空間,而低速的SATA磁盤則可以提供高達1TB的存儲空間。用戶可以將訪問頻率較低的數(shù)據(jù)從在線的高速磁盤遷移到大容量的存儲設備上,釋放寶貴的在線資源給關鍵業(yè)務。此外,近線系統(tǒng)可以采用大容量的低速存儲設備以及空間利用率較高的RAID 5算法,并對數(shù)據(jù)進行及時歸檔,從而減少磁盤使用量,減少機房的設備占用空間,避免擴容的風險。
隨時釋放存儲資源
分級存儲是根據(jù)信息生命周期管理策略對數(shù)據(jù)進行管理的。將那些過期無用的數(shù)據(jù)及時從設備中刪除,也可以達到節(jié)約資源的目的。華為賽門鐵克綜合考慮數(shù)據(jù)的屬性,在條件允許的情況下盡量采用數(shù)據(jù)分級存儲的方式保存數(shù)據(jù),從而達到節(jié)能的目標。