• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      電力視頻大數(shù)據(jù)的動態(tài)自適應(yīng)復(fù)合存儲策略*

      2018-12-18 10:26:54王曉濤劉晨曦王一丁
      科技與創(chuàng)新 2018年23期
      關(guān)鍵詞:冗余度存儲系統(tǒng)分塊

      王曉濤,劉晨曦,王一丁

      ?

      電力視頻大數(shù)據(jù)的動態(tài)自適應(yīng)復(fù)合存儲策略*

      王曉濤1,劉晨曦1,王一丁2

      (1.國網(wǎng)四川省電力公司阿壩供電公司,四川 阿壩藏族羌族自治州 624000;2.中國科學(xué)院成都分院,四川 成都 610041)

      針對電力視頻監(jiān)控數(shù)據(jù)總體量大、不同監(jiān)控視頻點擊熱度不同的特點,提出了結(jié)合復(fù)制策略讀取速度快與編碼冗余策略數(shù)據(jù)冗余度低特點的電力視頻監(jiān)控數(shù)據(jù)動態(tài)自適應(yīng)復(fù)合存儲方案,并設(shè)計了客戶端參與譯碼過程的輔助數(shù)據(jù)重構(gòu)策略。對構(gòu)建的復(fù)合存儲原型系統(tǒng)進行了性能測試與分析,結(jié)果表明,該復(fù)合方案能夠?qū)崿F(xiàn)數(shù)據(jù)的動態(tài)冗余調(diào)整,存儲數(shù)據(jù)最少僅需要0.32倍的數(shù)據(jù)冗余,便可保證具有“6個9”的高可靠度。系統(tǒng)在高可靠性的要求下,數(shù)據(jù)冗余度會隨著存儲時間的延長而持續(xù)下降。因此,該系統(tǒng)適用于數(shù)據(jù)量不斷增加的電力視頻監(jiān)控大數(shù)據(jù)的存儲。

      糾刪碼;復(fù)合存儲;視頻數(shù)據(jù);冗余

      1 概述

      近年來,隨著無人值守變電站、無人機巡線和智能電網(wǎng)的建設(shè)[1],視頻監(jiān)控數(shù)據(jù)已成為電力大數(shù)據(jù)中重要組成部 分[2]。每年,僅無人巡線模式采集的紫外、紅外圖像就已達TB級,而且采集的視頻數(shù)據(jù)量有大幅增加的趨勢[3]。同時,電力視頻大數(shù)據(jù)具有采集節(jié)點多、節(jié)點分布廣泛、數(shù)據(jù)存儲量大、訪問不均等特點。因此,在實際的視頻監(jiān)控存儲系統(tǒng)運行中,為了實現(xiàn)存儲視頻的價值與存儲資源消耗之間的平衡,一般采取設(shè)置固定存儲時長、定期刪除歷史視頻數(shù)據(jù)的手段,以減緩電力視頻監(jiān)控數(shù)據(jù)給存儲系統(tǒng)帶來的壓力。

      2 數(shù)據(jù)的存儲策略

      近些年,雖然隨著云計算技術(shù)的發(fā)展,一些電力數(shù)據(jù)逐漸從本地遷移到云端[4-5],但針對電力視頻數(shù)據(jù)存儲方面的研究,仍然采用復(fù)制備份策略保證數(shù)據(jù)的可靠性與可用性[6],并未針對電力視頻數(shù)據(jù)的特征進行基礎(chǔ)存儲架構(gòu)上的改進與優(yōu)化。隨著數(shù)據(jù)量的持續(xù)增加,備份策略將大大增加整個系統(tǒng)的數(shù)據(jù)冗余量,同時,增加了硬件設(shè)施、電力消耗、占地面積與支出成本。

      針對持續(xù)增加的數(shù)據(jù)存儲規(guī)模,為了降低存儲硬件與能耗成本,利用糾刪碼對數(shù)據(jù)進行低冗余度存儲,已經(jīng)逐漸被學(xué)術(shù)界和企業(yè)界所重視[7]。微軟的云存儲系統(tǒng)Azure采用了LRC(12,2,2)編碼方法[8],F(xiàn)acebook的存儲體系中也從早期RS(10,4)發(fā)展到LRC(10,6,5)[9]。Google將RS(6,3)編碼引入到其Colossus系統(tǒng)中,由于技術(shù)保密,并未對外公布技術(shù)細節(jié)。百度也將糾刪碼方法引入其存儲系統(tǒng)中[10]。有研究者將糾刪碼應(yīng)用于Apache Hadoop開源項目,以減小系統(tǒng)的數(shù)據(jù)冗余[11]。國內(nèi)亦有學(xué)者根據(jù)糾刪碼特點提出了針對性的存儲架構(gòu)與高性能的編碼方案[12-13]。

      雖然采用糾刪碼技術(shù)具有低于復(fù)制備份策略的數(shù)據(jù)冗余,提供了更高的數(shù)據(jù)可靠性,但如何在保證系統(tǒng)數(shù)據(jù)可靠性與客戶訪問響應(yīng)速率的前提下,降低系統(tǒng)數(shù)據(jù)冗余,仍是構(gòu)建低冗余度、高可靠性電力視頻大數(shù)據(jù)存儲系統(tǒng)需要深入研究的問題。對于電力視頻數(shù)據(jù)而言,不同時段的監(jiān)控視頻數(shù)據(jù)的價值也不盡相同。如相關(guān)人員對智能變電站設(shè)備進行檢查和維護、電力系統(tǒng)出現(xiàn)異常時的視頻監(jiān)控數(shù)據(jù)則需要進行長時間高可靠性保存,用于后期經(jīng)常性的調(diào)用分析。這些時段的視頻數(shù)據(jù)與其他時間段視頻數(shù)據(jù)相比,應(yīng)該具有更高的冗余度與可用度。因此,視頻監(jiān)控數(shù)據(jù)具有不同時段訪問與可靠性要求不同的特點。所以,需要更加精準的電力視頻大數(shù)據(jù)的存儲管理方案。隨著時間的推移,不同時段視頻數(shù)據(jù)價值會發(fā)生變化。因此,有必要對其進行不同冗余度的存儲,以最低的成本提供適當(dāng)級別的可靠度,從而以最低的成本實現(xiàn)數(shù)據(jù)價值最大化。

      為此,本文針對電力視頻大數(shù)據(jù)的存儲特征與不同時段重要性不同的特點,提出了兼顧編碼冗余與備份策略優(yōu)點的自適應(yīng)動態(tài)復(fù)合存儲方案,設(shè)計了系統(tǒng)冗余數(shù)據(jù)隨時間變化而動態(tài)變化的存儲策略,實現(xiàn)了一個海量電力視頻數(shù)據(jù)存儲原型系統(tǒng),并驗證了方案的可行性。

      3 電力視頻數(shù)據(jù)復(fù)合存儲方案

      本文針對電力視頻數(shù)據(jù)的價值特點與讀取特征設(shè)計了復(fù)合存儲方案。本方案利用糾刪碼冗余策略保證電力視頻數(shù)據(jù)的基礎(chǔ)可靠性,而對點擊頻率較高時段視頻數(shù)據(jù)進行附加備份,從而保證電力視頻數(shù)據(jù)整體的低冗余度和重要時段視頻數(shù)據(jù)的高可用性。存儲系統(tǒng)由若干存儲子集構(gòu)成,可以按照存儲子集進行規(guī)模擴展。存儲子集中的存儲節(jié)點個數(shù)由系統(tǒng)所選擇使用的糾刪碼的碼字確定。存儲節(jié)點包括文件存儲節(jié)點和校驗存儲節(jié)點。

      實施時,存儲子集按照時間段對監(jiān)控視頻文件進行均勻分塊,視頻塊是多幀連續(xù)視頻圖像的集合。系統(tǒng)按照2備份策略,對文件分塊進行存儲,然后對分塊按照順序進行校驗計算獲取校驗塊。視頻文件分塊存儲到文件存儲節(jié)點NF上,校驗塊存儲到校驗存儲節(jié)點NR上。在系統(tǒng)運行過程中,利用視頻文件分塊的被讀取頻率將被統(tǒng)計,如果外部讀取該文件分塊所需帶寬大于本文件塊所在節(jié)點的輸出帶寬,則將增加該文件分塊備份到文件存儲節(jié)點NF上。當(dāng)系統(tǒng)中存在多個原文件分塊備份時,備份文件分塊的讀取頻率長時間低于被設(shè)定值,則該備份分塊將被刪除,系統(tǒng)僅保留單個原視頻文件塊與校驗冗余數(shù)據(jù)塊。因此,存儲系統(tǒng)內(nèi)的復(fù)制文件塊也會隨著時間的推移、數(shù)據(jù)塊熱度的消退而被刪除,僅保留編碼冗余來保證數(shù)據(jù)整體的低冗余度、高可靠性存儲。

      3.1 視頻數(shù)據(jù)編碼存儲算法

      本電力視頻存儲原型系統(tǒng)在運行前,需要根據(jù)存儲子集節(jié)點、可靠性需求構(gòu)造出如式(1)所示的存儲編碼矩陣:

      編碼矩陣其可分為上下兩個部分,其中為(×)×(×)的單位陣,′為由“0”“1”元素組成的規(guī)模為(×)×(×)的矩陣,其中,1≤≤;1≤≤。m為×的單位陣,i,j為規(guī)模為×的由“0”“1”構(gòu)成的方陣。在編碼過程中,行向量元素個數(shù)將與文件分塊個數(shù)相同,行向量中元素為“1”的所有位置所對應(yīng)的文件分塊之間將進行異或運算,計算出該行向量所對應(yīng)的校驗數(shù)據(jù)塊,則有:

      ·=. (2)

      式(2)中:為原始數(shù)據(jù)塊順序集合;為原始數(shù)據(jù)塊與校驗數(shù)據(jù)塊的順序集合。

      譯碼過程則根據(jù)矩陣構(gòu)造出聚合矩陣,有·(+)·=0,其中,用下式表示:

      3.2 恢復(fù)數(shù)據(jù)的驗證機制

      實現(xiàn)時,客戶端首先計算已經(jīng)重構(gòu)出電力視頻文件塊的哈希函數(shù)值,將哈希值上傳到源文件服務(wù)器,并與源文件服務(wù)器中已經(jīng)存儲的該文件塊的哈希值進行比較。如果哈希值相同,則允許上傳該電視視頻文件分塊;如果哈希值不同,則說明客戶端重構(gòu)出的數(shù)據(jù)塊并不正確,則系統(tǒng)會啟動內(nèi)部恢復(fù)機制對該數(shù)據(jù)塊進行恢復(fù),并將恢復(fù)出的文件塊提供給客戶端使用。同時,為了增加系統(tǒng)的安全性驗證,客戶端提供的文件分塊也可能是已經(jīng)被惡意篡改的文件塊,因此,源文件服務(wù)器也將拒絕該文件塊的上傳。如果系統(tǒng)接收了該文件塊,待文件塊接收完畢后,源文件服務(wù)器將對該文件再次進行哈希值驗證,以免在數(shù)據(jù)塊上傳過程中出現(xiàn)未知錯誤。本系統(tǒng)利用SHA-512算法計算哈希值[14]。將整個文件的哈希值作為該文件的代表指紋。系統(tǒng)將每個文件的代表指紋放在存儲節(jié)點內(nèi)存中,文件分塊所產(chǎn)生的哈希值將放在磁盤中,這樣可以加快文件的查詢與使用效率。系統(tǒng)將文件塊哈希值、存儲路徑、文件信息等摘要信息統(tǒng)一放在一張表中,這樣可以提高系統(tǒng)驗證速率。

      4 性能測試與結(jié)果分析

      作者根據(jù)本文所述編譯碼流程與算法以及系統(tǒng)體系架構(gòu)構(gòu)建了電力視頻大數(shù)據(jù)自適應(yīng)動態(tài)復(fù)合存儲原型系統(tǒng),使用編碼參數(shù)為(6,3,4)的二進制RS碼,即系統(tǒng)共有6個存儲節(jié)點,其中3個數(shù)據(jù)存儲節(jié)點,3個校驗數(shù)據(jù)存儲節(jié)點,且系統(tǒng)容許任意3個存儲節(jié)點出現(xiàn)損毀,而系統(tǒng)仍然能夠重構(gòu)出原文件。本原型系統(tǒng)中6個節(jié)點為普通計算機,CPU為Intel(R)Celeron M@2.0 GHz,1.5 GB內(nèi)存,惠普ST336753LW磁盤,標稱帶寬為80 MB/s,32位Windows7操作系統(tǒng)。存儲節(jié)點內(nèi)部利用1 000 Mbps網(wǎng)絡(luò)進行鏈接。即系統(tǒng)存儲節(jié)點并發(fā)磁盤I/O帶寬小于網(wǎng)絡(luò)帶寬。客戶端所選配置同上,客戶端與存儲系統(tǒng)也通過1 000 Mbps網(wǎng)絡(luò)連接。測試電力視頻為阿壩電網(wǎng)某監(jiān)控數(shù)據(jù),數(shù)據(jù)格式為RMVB格式,數(shù)據(jù)量為1 138 MB,監(jiān)控時長為7 227 s。

      4.1 編譯碼時關(guān)鍵性能分析

      本研究首先對編譯碼與文件塊校驗過程中CPU的利用率進行了測試,以確定本復(fù)合方案給系統(tǒng)帶來的計算負載。本研究對在文件復(fù)制、編碼、譯碼、HASH計算過程中客戶端CPU的利用率進行了監(jiān)測。在對測試視頻文件進行磁盤級復(fù)制時,CPU平均利用率為4.8%;而測試視頻文件產(chǎn)生等數(shù)據(jù)量的校驗數(shù)據(jù)時,CPU平均利用率為9.3%;對丟失視頻文件塊進行重構(gòu)時,CPU平均利用率為9.7%.客戶端利用SHA-512對一份丟失數(shù)據(jù)塊進行哈希值計算時[15],CPU利用率為25%,達到單核極限。因此,編碼校驗冗余策略的引入,并不會降低系統(tǒng)的I/O性能,反而大大降低了系統(tǒng)的數(shù)據(jù)冗余。顯然,本復(fù)合存儲方案是可行的。

      4.2 數(shù)據(jù)可靠性比較分析

      本存儲系統(tǒng)每個存儲節(jié)點是獨立同分布的。如果為單節(jié)點的可用性,數(shù)據(jù)塊的可用概率為1-,數(shù)據(jù)可用性的正態(tài)分布標準差記為ε,且原文件分塊個數(shù)為,為復(fù)制策略的數(shù)據(jù)冗余度,則有下式成立[15]:

      在編碼冗余策略中,數(shù)據(jù)冗余度記為,則有下式成立:

      本系統(tǒng)單個存儲節(jié)點在運行365 d時間里,如果有一天不可用,則存儲節(jié)點可靠度= 0.997.如果要求數(shù)據(jù)具有“6個9”的高可靠度,則數(shù)據(jù)的不可用概率= 0.000 001,則數(shù)據(jù)可用性的正態(tài)分布的標準方差ε為5.由式(4)可知,利用復(fù)制策略若保證“6個9”的數(shù)據(jù)可靠度,則需要2.378倍的數(shù)據(jù)冗余,如圖1所示。由式(5)可知,而利用糾刪碼策略最大需要1.32倍的數(shù)據(jù)冗余,只需要產(chǎn)生0.32倍的原始文件大小的冗余數(shù)據(jù)量即可保證“6個9”的高文件可用度,如圖2所示。

      圖1 復(fù)制策略冗余度分析圖

      圖2 編碼策略冗余度分析圖

      由于編碼方法是將文件分塊均勻分布在不同存儲節(jié)點上,增加了系統(tǒng)對外服務(wù)的并發(fā)性,減少了因為客戶端集中讀取而給系統(tǒng)造成的讀取分布不均的情況。顯然,當(dāng)存儲節(jié)點規(guī)模不斷擴大時,利用糾刪碼冗余策略能夠在保證系統(tǒng)數(shù)據(jù)高可用度的同時,明顯降低了其數(shù)據(jù)冗余。因此,這對于日益增長的電力視頻數(shù)據(jù)存儲來講具有重要的意義。

      5 結(jié)束語

      本文介紹了一種針對電力視頻大數(shù)據(jù)特征的海量數(shù)據(jù)存儲架構(gòu)。該種存儲架構(gòu)兼具了數(shù)據(jù)訪問的可用性與系統(tǒng)存儲的高效性。本存儲系統(tǒng)根據(jù)電力數(shù)據(jù)隨時間變化訪問頻度不同的特征,以水平陣列糾刪編碼作為數(shù)據(jù)可靠性保證策略的基礎(chǔ)存儲方案。作者實現(xiàn)了該電力視頻大數(shù)據(jù)存儲系統(tǒng)平臺原型系統(tǒng),并對核心指標進行了性能測試,驗證了存儲策略的有效性,且本存儲體系結(jié)構(gòu)具有通用性,適用于不同結(jié)構(gòu)類型海量數(shù)據(jù)存儲。因此,本文提出的自適應(yīng)動態(tài)復(fù)合存儲策略對于構(gòu)建低冗余度、高可靠性電力視頻大數(shù)據(jù)存儲系統(tǒng)具有較強的現(xiàn)實意義。

      [1]張東霞,苗新,劉麗平,等.智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J].中國電機工程學(xué)報,2015,35(01):2-12.

      [2]李志海,張?zhí)毂?,彭啟偉,?基于同一平臺的電力視頻數(shù)據(jù)網(wǎng)絡(luò)建設(shè)及組網(wǎng)策略[J].電力科學(xué)與技術(shù)學(xué)報,2012,27(04):64-69.

      [3]宋亞奇,周國亮,朱永利,等.云平臺下輸變電設(shè)備狀態(tài)監(jiān)測大數(shù)據(jù)存儲優(yōu)化與并行處理[J].中國電機工程學(xué)報,2015,35(02):255-267.

      [4]宋愛波,萬雨桐,貢歡,等.海量多維數(shù)據(jù)的存儲與查詢研究[J].計算機工程與應(yīng)用,2016,52(13):25-28.

      [5]陳德軍,高曉軍,王義飛.基于AHP的云存儲負載均衡研究[J].計算機工程與應(yīng)用,2015,51(07):56–59.

      [6]楊俊杰,廖卓凡,馮超超,等.大數(shù)據(jù)存儲架構(gòu)和算法研究綜述[J].計算機應(yīng)用,2016,36(09):2465-2471.

      [7]劉海波,董玉杰.基于MooseFS的糾刪碼存儲方法設(shè)計和實現(xiàn)[J].計算機工程與應(yīng)用,2017,53(06):91-96.

      [8]HUANG C,SIMITCI H,XU Y,et al.Erasure coding in Windows Azure storage[C]//2012 USENIX Annual Technical Conference,Boston,USA,2012:15-26.

      [9]MAHESWARAN S,MEGASTHENIS A,DIMITRIS P. XORing Elephants:Novel Erasure Codes for Big Data [C]//The 39th International Conference on Very Large Data Bases,Trento,Italy,2013:6(05):325-336.

      [10]LAI C, JIAN S, YANG L,et al.Atlas:Baidu's key-value storage system for cloud data.Proceedings of the 31st symposium on mass storage systems and technologies[J]. Santa Clara USA,2015.

      [11]XIA M,SAXENA M,BLAUM M,et al.A table of two erasure codes in HDFS[C]//Proceedings of the 13th USENIX Conference on File and Storage Technologies, Santa Clara,USA,2015:213-226.

      [12]陳崢.一類新的陣列糾刪碼理論及應(yīng)用研究[D].北京:中國科學(xué)院研究生院,2009.

      [13]唐聃,楊昊澎,王福超.基于多斜率碼鏈的陣列糾刪碼[J].計算機應(yīng)用,2017,37(04):936-940.

      [14]李鴻強,苗長云,石博雅,等.單向散列函數(shù)SHA-512的優(yōu)化設(shè)計[J].計算機工程,2007,33(07):130-165.

      [15]劉剛.分布式存儲系統(tǒng)中基于糾錯碼的容錯機制研究[D].武漢:華中科技大學(xué),2007.

      王曉濤(1981—),男,碩士,工程師,研究領(lǐng)域為電力數(shù)據(jù)存儲、智能電網(wǎng)。劉晨曦(1983—),女,碩士,高級工程師,研究領(lǐng)域為智能電網(wǎng)、存儲系統(tǒng)。王一?。?983—),男,博士,CCF會員,副研究員,研究領(lǐng)域為編碼理論、大數(shù)據(jù)、海量數(shù)據(jù)存儲。

      四川省科技支撐計劃(No.2017KZ0026)

      2095-6835(2018)23-0037-03

      TM76

      A

      10.15913/j.cnki.kjycx.2018.23.037

      〔編輯:張思楠〕

      猜你喜歡
      冗余度存儲系統(tǒng)分塊
      一種航天測控冗余跟蹤弧段處理方法
      上海航天(2024年1期)2024-03-08 02:52:28
      分布式存儲系統(tǒng)在企業(yè)檔案管理中的應(yīng)用
      哈爾濱軸承(2020年2期)2020-11-06 09:22:36
      分塊矩陣在線性代數(shù)中的應(yīng)用
      天河超算存儲系統(tǒng)在美創(chuàng)佳績
      上海某基坑工程考慮冗余度的支撐體系設(shè)計
      山西建筑(2017年29期)2017-11-15 02:04:38
      橋梁設(shè)計的冗余度分析
      反三角分塊矩陣Drazin逆新的表示
      橋梁設(shè)計的冗余度
      基于自適應(yīng)中值濾波的分塊壓縮感知人臉識別
      基于多分辨率半邊的分塊LOD模型無縫表達
      驻马店市| 霍林郭勒市| 长武县| 梧州市| 龙胜| 宜春市| 呼伦贝尔市| 故城县| 吉安市| 余庆县| 东阳市| 商丘市| 扶风县| 泰兴市| 偃师市| 锡林浩特市| 古交市| 永兴县| 华亭县| 南康市| 横山县| 犍为县| 东乡族自治县| 中卫市| 阿鲁科尔沁旗| 松江区| 横山县| 平塘县| 襄樊市| 炎陵县| 洱源县| 吉水县| 彰化县| 乌兰浩特市| 天峻县| 文昌市| 江陵县| 依兰县| 屏南县| 霸州市| 灵璧县|