張 翅,唐 謙(通訊作者),王曜暉,李妍君,盧 陽
(遵義醫(yī)科大學 貴州 遵義 563000)
隨著教育行業(yè)逐步信息化,高校實驗室對數(shù)據(jù)存儲的技術需求日益增高,高校實驗室在各類國家級考試與多種日常教學情景中的切換和使用存在操作便捷度低、技術實現(xiàn)難度較高等難題,對高校實驗室數(shù)據(jù)存儲能力提出更高要求[1]。據(jù)文獻統(tǒng)計,目前市面上應用較為主流的存儲方式有傳統(tǒng)存儲、分布式存儲、云存儲等,但國內許多高校機房依然采用傳統(tǒng)存儲方式,存在數(shù)據(jù)不落地、數(shù)據(jù)副本遺失、計算與存儲介質分離等問題[2]。因此,為更好地滿足當前高校實驗室使用需求,可采用傳輸速率更快、數(shù)據(jù)可靠性更高的存儲架構,提升高校實驗室場景的兼容度,解決傳統(tǒng)存儲系統(tǒng)成本高、模式單一等問題。
傳統(tǒng)存儲主要指硬件廠商的SAN和NAS存儲,由控制器搭配磁盤組對外提供文件服務,存儲性能與出廠時控制器的數(shù)量、配置等密切相關[3]。在數(shù)據(jù)可靠性方面,傳統(tǒng)存儲主要依靠RAID技術進行保護,該技術故障域相對有限,若有硬盤損壞,很可能就導致數(shù)據(jù)丟失,恢復過程無法控制且速度較慢;其維護工作對于普通使用者來說相對專業(yè),通常由廠家負責完成;在擴展性方面,主要受限于控制器性能,一般只能擴展到PB級,不過傳統(tǒng)存儲技術已在生產環(huán)境中檢驗了幾十年,就其穩(wěn)定性而言,是值得肯定的[4]。
分布式存儲是通過分布式存儲軟件將若干個服務器的內置硬盤組合成一個大的存儲空間,對外提供文件、對象、塊存儲服務。在性能上,隨著服務器臺數(shù)增加,其IOPS、數(shù)據(jù)吞吐等參數(shù)可以遠超出傳統(tǒng)存儲;在數(shù)據(jù)副本可靠性上,分布式存儲容錯率高,且恢復較快,恢復過程可以控制,慢速恢復的情景下甚至可以同時進行業(yè)務操作,互不影響;分布式存儲可橫向擴展,一般可擴展至EB級[5],見圖1。
云存儲是一種線上存儲方式,主要分為公有云、私有云和混合云3類,具備虛擬化、智能配置、海量存儲、強拓展性、低成本、低能耗等特點[6]。相較傳統(tǒng)存儲專用的硬件架構,云存儲的設計遵從SOA原則,消除了單點存儲等劣勢,且擴展性可到PB級以上,理論上沒有擴展上限。云存儲無需購買專用設備或是租賃存儲介質,計費使用,用戶按需購買,即買即用,快速交付。
高校實驗室進行日常教學的技術前提就是提供穩(wěn)定、高效的存儲基礎,合理的存儲方式有利于順利開展教學活動、提升使用體驗、流暢切換各類考試情景等,在日常管理和故障維護方面更是可以節(jié)約大量的時間精力,以下幾個方面為比較重要的存儲技術需求[7]。
桌面云構建了一套高集成度的桌面架構,借助自動化備份和集中式運維,簡化終端硬件管理,使故障恢復時間從傳統(tǒng)的幾小時縮短至幾分鐘,無需擔心因客戶端故障或丟失導致工作中斷。學校的數(shù)據(jù)和應用程序均存儲在數(shù)據(jù)中心,即便設備發(fā)生故障或丟失,管理員依然可以從其他設備登錄,并快速銜接中斷的工作[8-9]。傳統(tǒng)模式核心數(shù)據(jù)及辦公文檔分散存儲于每臺終端上,硬盤故障或誤操作易導致重要文件丟失。隨著終端數(shù)量越多,其數(shù)據(jù)丟失風險越大,分布式存儲則可以規(guī)避該問題,最大限度地保護數(shù)據(jù)[10-11]。
SSD緩存技術可利用SSD+HDD磁盤混合實現(xiàn),包括1塊SSD硬盤和多塊SATA/SAS硬盤,其中SSD的IO性能較高,作為緩存盤,用于緩存學校經常訪問的熱點數(shù)據(jù)[12];機械硬盤的IO性能較低,作為數(shù)據(jù)盤,用于存儲學校虛擬機和個人數(shù)據(jù)。一體化服務器的緩存命中率高于60%,這樣就可以實現(xiàn)以較低的成本獲得非常高的IO性能,提升桌面啟動速度和操作流暢度[13]。
引入分布式虛擬存儲技術,使用雙副本方式保障數(shù)據(jù)安全。桌面云具備前端、傳輸端、后端多層次的安全存儲體系,包括多種認證方式、傳輸層加密、數(shù)據(jù)硬盤加密等加密方式,有效防止數(shù)據(jù)泄露,規(guī)避軟硬件故障所導致的數(shù)據(jù)丟失等問題[14-16]。分布式存儲的全集群架構設計,使主機和硬盤均有冗余機制,能夠實現(xiàn)故障自動遷移,以確保桌面業(yè)務穩(wěn)定運行。
學校云平臺使用過程中可負載近600臺終端,本次測試以云機房和傳統(tǒng)獨立終端實現(xiàn)軟硬件及使用環(huán)境為基礎,對存儲性能的重要參數(shù)進行了實機測試。
運行tometer程序,選中Worker1,勾選DiskTargets標簽頁下Targets列表中的裸磁盤作為測試目標盤;在DiskTargets標簽頁下設置測試目標盤的扇區(qū)數(shù)量(一個扇區(qū)512字節(jié))。由于新掛載的裸磁盤里面沒有數(shù)據(jù),為了保證讀IO測試準確,需要優(yōu)先按照1M順序寫的模型進行數(shù)據(jù)預寫入,否則測試時可能會從底層虛擬化系統(tǒng)內存返回數(shù)據(jù),導致讀IO偏高。按如下順序進行測試:
512B_ 100%Read:0%random
512B_ 75%Read:0%random
4K_ 100%Read:0%random
4K_ 75%Read:0%random
16K_ 100%Read:0%random
4K_ 75%Read:0%random
32K_ 100%Read:0%random
32K_ 75%Read:0%random
3.2.1 測試參數(shù):512B_ 100%Read:0%random
該參數(shù)下傳統(tǒng)終端平均響應時間約為云桌面的2.32倍,最大讀取響應時間約為云桌面的20倍,每秒傳輸量約為云桌面的1/37,見表1。
3.2.2 測試參數(shù):4K_ 100%Read:0%random
該參數(shù)下傳統(tǒng)終端平均響應時間約為云桌面的4.39倍,最大讀取響應時間約為云桌面的31.05倍,每秒傳輸量約為云桌面的1/70,見表2。
3.2.3 測試參數(shù):32K_ 75%Read:0%random
該參數(shù)下傳統(tǒng)終端平均響應時間約為云桌面的5.62倍,最大讀取響應時間約為云桌面的26.05倍,每秒傳輸量約為云桌面的1/95,見表3。
虛擬桌面系統(tǒng)需要合理的存儲子系統(tǒng)設計,以支撐操作系統(tǒng)和用戶環(huán)境的負載[17-18]。通過表2可以看出,傳統(tǒng)終端的最大讀取響應時間與云平臺的差距最大可達31倍,表1和表3平均響應時間和傳輸量對比可觀察出,測試負載越大,傳統(tǒng)終端短板越明顯,傳統(tǒng)終端數(shù)據(jù)存儲及傳輸緩慢,容易造成數(shù)據(jù)丟失;虛擬桌面存儲系統(tǒng)可以較為充裕地滿足云平臺的存儲吞吐能力,滿足平臺各類系統(tǒng)的正常運行條件,輔以高效、便捷、易擴展的虛擬存儲架構,極大地提升了用戶側的綜合體驗,達到了預期效果。
表1 512B_ 100%Read:0%random測試表
表2 4K_ 100%Read:0%random測試表
表3 32K_ 75%Read:0%random測試表
學校云機房主要搭設了虛擬仿真系統(tǒng)和國家級考試平臺兩類應用場景,在每種場景下根據(jù)不同的具體使用環(huán)境又分設了不同的系統(tǒng)配置和模板,可根據(jù)需求切換使用。這兩類場景對數(shù)據(jù)的實時存儲速度、數(shù)據(jù)完整度、數(shù)據(jù)恢復能力等都有著很高的要求,分布式存儲技術可在這類應用場景下對數(shù)據(jù)安全提供保障。
虛擬仿真實驗教學系統(tǒng)是高校培養(yǎng)學生實驗、實踐和創(chuàng)新能力的重要平臺,該系統(tǒng)在遵義醫(yī)科大學得到了廣泛應用。對于在教學實踐過程中存在的數(shù)據(jù)存儲量大、存儲速率低下、存儲數(shù)據(jù)易丟失等問題,可利用云桌面分布式存儲系統(tǒng),讓學生流暢體驗模擬交互,滿足操作過程中多人協(xié)作的數(shù)據(jù)需求,在教學過程中實時產生的數(shù)據(jù),通過分布式存儲技術存放于不同的云主機內,使數(shù)據(jù)的存儲更加安全、高效。
該校國家級考試應用平臺包含全國計算機等級考試系統(tǒng)、全國司法考試系統(tǒng)、全國CET4/6英語考試系統(tǒng)。對比傳統(tǒng)獨立終端,在云桌面VDI架構下,學生端數(shù)據(jù)不保存在本地,而是存于云端數(shù)據(jù)中心,通過本地局域網,考試系統(tǒng)在服務器中劃分虛擬磁盤空間用于存放用戶數(shù)據(jù),提升數(shù)據(jù)穩(wěn)定性。每一個考生終端的實時數(shù)據(jù),也通過分布式存儲技術存儲于云計算主機內,所以可能出現(xiàn)的任何學生端的網絡異常、物理故障等,都不會對數(shù)據(jù)存儲造成影響,從而保障考試的正常進行。
通過分布式存儲,可以滿足不同的需求場景,容量隨需可擴,資源彈性擴展,架構無性能和容量瓶頸,數(shù)據(jù)存儲安全可靠,切換場景快速高效[19-20],提升了高校實驗室資源利用率,在實際使用和管理上也更加便捷,是一種行之有效的高校實驗室整合解決方案。