• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向PMEM優(yōu)化的閃存存儲系統(tǒng)

      2021-01-05 11:37:31陳正華
      科技風 2021年36期
      關(guān)鍵詞:性能

      摘?要:隨著制造工藝的發(fā)展,NAND閃存顆粒的存儲容量越來越大,固態(tài)驅(qū)動器(SSD)的價格得以降低,全閃存存儲逐漸成為主流。但在容量提升的同時,閃存顆粒的性能越來越低,使用壽命也越來越短,存儲系統(tǒng)中的數(shù)據(jù)損壞風險直線上升。另一方面,新型的持久內(nèi)存(PMEM)介質(zhì)和設備不斷出現(xiàn),其擁有持久性、字節(jié)尋址、高性能、低延遲的特性,使用壽命和性能都遠大于SSD。通過合理的系統(tǒng)設計,可以充分發(fā)揮二者的優(yōu)勢,利用PMEM優(yōu)化閃存的性能和壽命,構(gòu)建高性價比的全閃存存儲系統(tǒng)。

      關(guān)鍵詞:SSD;PMEM;持久內(nèi)存;閃存;耐久度;性能

      隨著技術(shù)的發(fā)展,主流固態(tài)驅(qū)動器(SSD)使用的閃存顆粒從SLC、MLC、TLC逐步過渡到QLC,加之3D NAND堆疊工藝,使得閃存顆粒的容量越來越大,容量型SSD具有較高的性價比,可用于取代傳統(tǒng)機械硬盤(HDD),構(gòu)建全閃存存儲。但隨之而來的是,QLC閃存顆粒的性能和耐久度遠低于TLC,主流的QLC只能擦除500~1000次,更適合用來構(gòu)建溫數(shù)據(jù)或冷數(shù)據(jù)存儲。當用于存儲需要頻繁修改的熱數(shù)據(jù)時,閃存磨損過快,SSD損壞的風險直線上升。QLC的性能降低也導致數(shù)據(jù)訪問延遲上升,故而無法承載諸如OLTP數(shù)據(jù)庫等對性能要求較高的在線業(yè)務。

      與此同時,以電阻式存儲器(ReRAM)、磁阻式存儲器(MRAM)、相變存儲器(PCM)等為代表的持久內(nèi)存(PMEM)技術(shù)近年來得到了大幅的發(fā)展,其擁有持久性、字節(jié)尋址、高性能、低延遲的特性。持久內(nèi)存的性能與易失性內(nèi)存(DRAM)接近,可擦寫次數(shù)和延遲都大幅優(yōu)于TLC、QLC等閃存介質(zhì)。

      Intel在2019年發(fā)布傲騰數(shù)據(jù)中心持久內(nèi)存Optane DCPMM,容量有128GB、256GB、512GB三種規(guī)格。雖然持久內(nèi)存具有很多的優(yōu)秀特性,但相比SSD來說,其價格仍然較高、容量也較小。

      QLC SSD容量大,價格低,但壽命較短,PMEM性能高,壽命長,但容量偏小,二者具有較強的互補性。如何針對二者的特征,設計面向高負載場景的閃存存儲,是本文要解決的問題。

      基于持久內(nèi)存的高性能和字節(jié)尋址特性,本文提出了一種面向PMEM優(yōu)化的閃存存儲系統(tǒng),通過將PMEM與閃存設備同時使用,優(yōu)化數(shù)據(jù)讀寫的策略,極大地降低了閃存的讀寫次數(shù),從而延長其使用壽命;同時,發(fā)揮PMEM的高性能特征,降低請求延遲,提升系統(tǒng)的并發(fā)IOPS。相比于使用TLC SSD搭建閃存存儲,基于PMEM和QLC SSD搭建的閃存存儲,在性能和成本上都具備較為明顯的優(yōu)勢。

      1 系統(tǒng)設計

      本系統(tǒng)基于PMEM和SSD搭建混合存儲,通過識別頻繁讀寫的熱點數(shù)據(jù),以及對SSD不友好的小粒度IO,將其存儲到PMEM中,從而優(yōu)化SSD壽命和系統(tǒng)整體性能。

      基于QLC SSD搭建本系統(tǒng)時,能達到最好的性價比。TLC SSD的壽命問題沒有QLC SSD突出,但基于TLC SSD搭建本存儲系統(tǒng)時仍然可以獲得更好的系統(tǒng)性能表現(xiàn),降低滿足同等性能要求時所花費的硬件成本。

      系統(tǒng)整體架構(gòu)如圖1所示。一方面,本系統(tǒng)根據(jù)讀寫請求的數(shù)據(jù)大小,確定其寫入位置;另一方面,根據(jù)數(shù)據(jù)的讀寫頻度識別熱點數(shù)據(jù),并按需將冷熱數(shù)據(jù)在持久內(nèi)存和SSD之間遷移,可以達到優(yōu)化性能和閃存壽命的目的。

      1.1 小粒度IO寫策略

      小粒度IO指小于4KB的請求。SSD的page(更新操作的最小粒度)大小通常都是4KB,對于小于4KB的寫請求將通過Read-Modify-Write完成寫入,即首先讀取4KB的原始內(nèi)容設備的緩存中,然后將修改的數(shù)據(jù)合并到緩存,最后重新寫入完整的4KB數(shù)據(jù)。此時,更新操作的性能較低,寫放大也較大。

      由于PMEM是字節(jié)尋址的,當小粒度IO寫入PMEM時,可以直接寫入存儲介質(zhì),而無需執(zhí)行Read-Modify-Write過程。無論從性能還是耐久度方面考慮,將小粒度IO寫入PMEM都是一個更優(yōu)的選擇??梢赃_到優(yōu)化性能和SSD壽命的雙重目的。

      1.2 中等粒度IO寫策略

      中等粒度IO指介于4KB和2MB之間的請求。對于此類請求,同樣優(yōu)先寫入PMEM。此策略主要是考慮到減少閃存中數(shù)據(jù)的移動和擦除操作,以優(yōu)化閃存的壽命。

      雖然SSD的更新操作以page為粒度,但FTL(Flash Translation Layer)層執(zhí)行擦除操作時,需要以block為單位進行。一個block中包含若干個page,典型的block大小為2MB。當4KB-2MB大小的隨機數(shù)據(jù)寫入閃存時,會分配新的page進行存儲,同時將舊的page標記為無效。此時,無效數(shù)據(jù)在block的連續(xù)空間上形成空洞。隨著數(shù)據(jù)的不斷寫入,F(xiàn)TL需要執(zhí)行垃圾收集(GC)操作,將有效數(shù)據(jù)塊進行移動,然后擦除和回收完整的block空間。

      本系統(tǒng)對于4KB-2MB大小的數(shù)據(jù)直接寫入持久內(nèi)存中,并將邏輯上連續(xù)的數(shù)據(jù)不斷的合并成2MB大小的數(shù)據(jù)塊,然后按需將其遷移到SSD中。這樣既減少了SSD的數(shù)據(jù)寫入,也減少了FTL層執(zhí)行垃圾收集時數(shù)據(jù)的移動和擦除操作,從而減少了閃存的磨損。同時,因為持久內(nèi)存優(yōu)秀的性能,將數(shù)據(jù)直接寫入持久內(nèi)存也提高了系統(tǒng)的整體性能表現(xiàn)。

      1.3 大粒度IO寫策略

      大粒度IO指2MB以上的IO,對于此類數(shù)據(jù)會直接寫入閃存中。一方面,現(xiàn)有的PMEM設備在大粒度IO的吞吐率上優(yōu)勢不明顯;另一方面,由于中小粒度IO已寫入PMEM,故此時數(shù)據(jù)寫入閃存時大概率是順序存儲的,閃存block中出現(xiàn)空洞的概率較小,從而減輕了FTL層執(zhí)行垃圾收集的頻率和開銷。

      1.4 熱點數(shù)據(jù)

      除了按照數(shù)據(jù)粒度進行區(qū)分之外,本系統(tǒng)還針對數(shù)據(jù)讀寫頻度進行統(tǒng)計,并將熱點數(shù)據(jù)優(yōu)先存儲到PMEM中。一方面,對于與頻繁讀取的數(shù)據(jù),將其存儲到PMEM中可以顯著降低讀取延遲,提升訪問性能;另一方面,對于頻繁更新的數(shù)據(jù),將寫操作轉(zhuǎn)移到PMEM,也可以進一步優(yōu)化SSD的壽命。

      2 數(shù)據(jù)放置策略

      對于上述4類數(shù)據(jù),在寫入時根據(jù)類型不同,優(yōu)先寫入PMEM或SSD,并根據(jù)PMEM的空間容量,以及數(shù)據(jù)熱點的識別情況進行遷移。

      當PMEM剩余空間不足時,需要將數(shù)據(jù)刷寫到SSD中,以釋放存儲空間。當熱點數(shù)據(jù)變更時,則需要將SSD中的數(shù)據(jù)緩存到PMEM,以提升訪問性能。

      2.1 中小粒度IO寫流程

      小粒度IO和中等粒度IO的寫入流程相同,即優(yōu)先寫入PMEM。具體步驟為:

      (1)從索引獲取數(shù)據(jù)在持久內(nèi)存中的地址;

      (2)若該地址有效,轉(zhuǎn)到步驟5;

      (3)否則,在持久內(nèi)存中分配存儲空間;成功申請空間后,跳轉(zhuǎn)到步驟5;

      (4)否則,觸發(fā)持久內(nèi)存空間回收機制;然后重新申請分配存儲空間,即跳轉(zhuǎn)回步驟3;

      (5)將數(shù)據(jù)寫入持久內(nèi)存;

      (6)更新索引信息。

      需要指出的是,隨著PMEM使用空間的增加,當中小粒度IO再次寫入時,可能實際已遷移到SSD中。此時,仍然可以通過上述流程將新數(shù)據(jù)寫入PMEM,同時回收SSD存儲空間。

      由于SSD實際總是執(zhí)行異地寫入,故保留該SSD空間以用于后續(xù)可能的PMEM空間回收(此時該數(shù)據(jù)被再次遷移到SSD)并不會產(chǎn)生實際收益。立即回收該空間,同時向SSD發(fā)送TRIM或UNMAP指令反而更加有利于優(yōu)化SSD的垃圾收集。

      2.2 大粒度IO寫流程

      大粒度IO優(yōu)先寫入SSD,但仍然應當先在空間索引中查詢其是否存儲在PMEM中,因為大粒度IO可能被識別為熱點數(shù)據(jù)而遷移到PMEM中。

      如果數(shù)據(jù)不在PMEM中,則按如下流程處理:

      (1)獲取數(shù)據(jù)在SSD中的空間地址;

      (2)若該地址已存在且有效,轉(zhuǎn)到步驟5;

      (3)在SSD中分配存儲空間地址;

      (4)將數(shù)據(jù)寫入SSD地址對應的數(shù)據(jù)存儲空間;

      (5)更新索引信息。

      與PMEM空間不同,當無法分配SSD存儲空間時,則意味著整個系統(tǒng)的可用容量不足,寫流程將會返回失敗信息,提示用戶進行清理或擴容操作。

      2.3 PMEM空間回收

      隨著數(shù)據(jù)的寫入,PMEM剩余空間逐步減少。當達到設定的閾值時,觸發(fā)持久內(nèi)存空間回收機制。根據(jù)數(shù)據(jù)放置的策略,持久內(nèi)存中的數(shù)據(jù)可能包括讀寫熱點數(shù)據(jù)、中等粒度數(shù)據(jù),以及小粒度數(shù)據(jù)。其中,熱點數(shù)據(jù)可能是大粒度數(shù)據(jù),也可能是中小粒度數(shù)據(jù)。

      執(zhí)行空間回收時,需要按恰當?shù)膬?yōu)先級處理上述各類數(shù)據(jù),以達到最佳效果。具體而言,按照熱點數(shù)據(jù)(大粒度)、中等粒度數(shù)據(jù)、小粒度數(shù)據(jù)、熱點數(shù)據(jù)(中小粒度)的順序進行回收。這樣排序的目的是盡快釋放更多的持久內(nèi)存空間,此外,將更大粒度的數(shù)據(jù)寫入SSD時,寫放大更低,對垃圾收集的影響也更小。

      當PMEM剩余空間滿足預定比例后,回收即告終止。

      2.4 熱點數(shù)據(jù)遷移

      對于頻繁訪問的熱點數(shù)據(jù),可以將其從閃存空間遷移到持久內(nèi)存空間,即對數(shù)據(jù)按熱度進行分級存儲。熱點數(shù)據(jù)從SSD遷移到PMEM的具體步驟如下:

      (1)根據(jù)熱點數(shù)據(jù)識別算法識別閃存中的熱點數(shù)據(jù);

      (2)申請熱點數(shù)據(jù)的持久內(nèi)存的空間地址;若持久內(nèi)存不足導致申請失敗,則直接結(jié)束;

      (3)將熱點數(shù)據(jù)寫入持久內(nèi)存中對應的地址;

      (4)更新熱點數(shù)據(jù)的索引信息,講閃存空間地址替換為持久內(nèi)存空間地址。

      當PMEM空間申請失敗時,可以認為PMEM空間回收操作正在進行,故無須在本流程中實現(xiàn)額外的空間回收機制。

      結(jié)語

      通過在閃存存儲中引入持久內(nèi)存設備,并針對持久內(nèi)存和閃存的IO特征優(yōu)化數(shù)據(jù)讀寫策略,本系統(tǒng)提升了閃存存儲的性能和壽命。尤其是QLC閃存介質(zhì)的SSD,其使用場景得到了擴展,使得基于低成本的容量型SSD搭建高性能閃存存儲成為可能,有效地降低了系統(tǒng)的整體擁有成本。

      大多數(shù)系統(tǒng)中的IO都是中小粒度的IO,故而,使用PMEM優(yōu)化閃存存儲的好處顯而易見,在獲得極大的IOPS提升的同時,SSD的寫入次數(shù)也相應降低,有效延長了SSD的使用壽命。

      隨著RDMA技術(shù)的普及,通過高速網(wǎng)絡訪問持久內(nèi)存的技術(shù)和規(guī)范也日趨成熟,在低延遲網(wǎng)絡上搭建基于持久內(nèi)存和SSD的分布式閃存存儲也成為可能,大容量、高性能的分布式存儲有著廣泛的應用前景,是未來主要的技術(shù)發(fā)展方向。

      參考文獻:

      [1]陸游游,舒繼武.閃存存儲系統(tǒng)綜述[J].計算機研究與發(fā)展,2013,50(01):49-59.

      [2]鄧傲松.閃存友好型文件系統(tǒng)性能優(yōu)化技術(shù)的設計[D].重慶大學,2018.

      [3]石亮.閃存存儲系統(tǒng)的性能優(yōu)化研究[D].中國科學技術(shù)大學,2013.

      [4]曾祥偉.基于閃存特性的固態(tài)盤緩存算法研究[D].暨南大學,2020.

      [5]李棋.基于閃存文件系統(tǒng)的存儲技術(shù)研究[D].重慶大學,2019.

      [6]韓書楷,熊子威,蔣德鈞,熊勁.基于持久化內(nèi)存的索引設計重新思考與優(yōu)化[J].計算機研究與發(fā)展,2021,58(02):356-370.

      [7]徐遠超.面向新型非易失存儲的文件系統(tǒng)研究綜述[J].計算機應用研究,2021,38(06):1601-1610.

      [8]肖仁智,馮丹,胡燏翀,張曉祎,程良鋒.面向非易失內(nèi)存的數(shù)據(jù)一致性研究綜述[J].計算機研究與發(fā)展,2020,57(01):85-101.

      [9]王佰平.基于新型非易失存儲的混合內(nèi)存數(shù)據(jù)頁交換算法研究[D].重慶大學,2019.

      基金項目:國家重點研發(fā)計劃(2018YFB1003302);廣東省科研事業(yè)單位重點領域研發(fā)計劃項目(2020B010139 0001)

      作者簡介:陳正華(1983—?),男,工程師,CCF會員,研究方向:分布式存儲、持久內(nèi)存、高性能網(wǎng)絡。

      猜你喜歡
      性能
      UIO-66熱解ZrO2負載CoMoS對4-甲基酚的加氫脫氧性能
      分子催化(2022年1期)2022-11-02 07:10:56
      復合型SBS在改性瀝青中的應用性能研究
      石油瀝青(2022年4期)2022-09-03 09:29:56
      CoN-I高模量改性瀝青制備及性能研究
      石油瀝青(2022年1期)2022-04-19 13:10:30
      提供將近80 Gbps的帶寬性能 DisplayPort 2.0正式發(fā)布
      20MnMoNb抗HIC性能及焊接接頭抗SSCC性能的研究
      純電動汽車性能仿真
      電子制作(2017年20期)2017-04-26 06:57:35
      PP—g—GMA的制備及其增容PP/PA6共混物的性能
      中國塑料(2016年5期)2016-04-16 05:25:39
      Al-Se雙元置換的基于LGPS的thio-LISICON的制備與性能表征
      580 MPa 級熱軋高擴孔鋼的組織與性能
      上海金屬(2015年1期)2015-11-28 06:01:09
      強韌化PBT/PC共混物的制備與性能
      中國塑料(2015年4期)2015-10-14 01:09:28
      长武县| 定南县| 太保市| 双江| 海晏县| 迁安市| 莫力| 宣化县| 扶余县| 富阳市| 昌邑市| 遵义市| 凤庆县| 和田县| 白沙| 武定县| 铜陵市| 磐安县| 织金县| 眉山市| 衡阳市| 巴南区| 景德镇市| 青州市| 汉阴县| 茂名市| 浏阳市| 漳浦县| 临城县| 琼结县| 沂南县| 丰县| 乌鲁木齐市| 台山市| 宁国市| 汉川市| 进贤县| 加查县| 东乡族自治县| 红安县| 大洼县|