• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于分布式key—value的水文大數(shù)據(jù)可信存儲

    2018-12-31 00:00:00蔡暉章玉琴馬永良
    水能經(jīng)濟 2018年9期

    【摘要】數(shù)據(jù)已經(jīng)滲透到當今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長浪潮的到來。 我國已經(jīng)全面進入大數(shù)據(jù)時代,我國已經(jīng)進入了大數(shù)據(jù)時代, 大數(shù)據(jù)(Big data)通常指行業(yè)業(yè)務(wù)所創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。水文行業(yè)作為水利系統(tǒng)數(shù)據(jù)核心,經(jīng)過近幾十年的自動化建設(shè)及數(shù)據(jù)監(jiān)測,獲得了大量豐富的數(shù)據(jù),形成了大量分析成果,但距離大數(shù)據(jù)的應(yīng)用和認識還存在著巨大的差異。

    【關(guān)鍵詞】分布式key-value;水文大數(shù)據(jù);可信存儲

    尤其是近幾年,國家大力投入水利基礎(chǔ)行業(yè)建設(shè),不僅水文遙測站點、山洪預警站點、墑情站點大量投入使用,監(jiān)測的項目大大增加,隨著自動化遙測遙感技術(shù)的廣泛應(yīng)用,監(jiān)測頻率也極大提高,可以說近幾年各水文測站監(jiān)測到的水文數(shù)據(jù)量,甚至比建國以來至2010年所有的水文數(shù)據(jù)量還要巨大。

    水文遙測遙感數(shù)據(jù)具備集中式高并發(fā),報文小、條數(shù)多的特點,如何滿足低延時、高并發(fā)、高吞吐量的水文數(shù)據(jù)接收及可信存儲要求,成為擺在我們面前的問題。針對水文大數(shù)據(jù)的特點,我們設(shè)計了一個分布式key-value可信存儲系統(tǒng)。

    1、設(shè)計思路

    為了節(jié)約成本,充分利舊,利用現(xiàn)有的單機存儲系統(tǒng),在其上增加自動化運維、數(shù)據(jù)自動分布的功能,考慮到目前的需求具有一定的特殊性,那就是單個庫的尺寸不大,可以假設(shè)能夠完全存放在一臺機器上,系統(tǒng)維護的最小單元是一個完整的庫,這使得問題簡化了很多,工作量也隨之減小。結(jié)合實際需求和開發(fā)熟練程度,我們選用了mysql作為存儲引擎。整個系統(tǒng)由四個部分組成:

    存儲服務(wù):負責數(shù)據(jù)的存儲,每個存儲服務(wù)負責存儲多個庫,對外提供更新、查詢服務(wù),所有的庫增加、刪除信息來自元數(shù)據(jù)管理服務(wù),更新信息來自更新控制服務(wù)。

    元數(shù)據(jù)管理服務(wù):負責庫的管理,這里記錄了所有的庫信息。

    更新控制服務(wù):負責庫的更新,接受來自外部的更新命令,向庫的所有副本發(fā)送更新命令,更新控制服務(wù)揉合了傳統(tǒng)cm和傳輸?shù)墓δ?,這是因為更新控制服務(wù)需要支持動態(tài)的增加庫和庫的副本的功能,這樣也更加容易支持級聯(lián)傳輸?shù)墓δ?。在本系統(tǒng)中,為了保證命令的時序性,一個庫的更新命令只由一組更新控制服務(wù)來負責。

    仲裁控制器:用于支持自動化單點切換。

    2、可信存儲總體架構(gòu)

    元數(shù)據(jù)管理有三臺機器,同一時刻只有其中一個是主庫并對外提供服務(wù),主庫所做的所有修改均發(fā)送到兩個從庫,并且等待到某個從庫返回成功。如果主庫宕機,則由仲裁控制器發(fā)起一次投票,決定新的主庫。數(shù)據(jù)更新服務(wù)主從備份機制與元數(shù)據(jù)管理服務(wù)相似,不同之出在于,其備份采用非實時方式。

    3、自動化運維設(shè)計

    自動化線上運維,應(yīng)該避免手工OP,包括庫橫向擴展、單點切換、數(shù)據(jù)修復、新增節(jié)點等。

    單點切換:引入自動化的單點切換機制,提高其可維護性,在系統(tǒng)中元數(shù)據(jù)服務(wù)器和更新服務(wù)器都是單點,都需要支持單點切換機制,每個單點模塊都有至少三個備份。單點備份分為實時和非實時兩種類型,實時備份可以保證數(shù)據(jù)不丟失但效率較低,非實時備份僅僅能保證數(shù)據(jù)的一致性,有可能丟失數(shù)據(jù),但效率高。在系統(tǒng)中元數(shù)據(jù)管理服務(wù)的備份采用實時方式,存儲服務(wù)的備份采用非實時方式。

    橫向擴展:支持自動化的新增副本,其過程是:停止某個副本的更新,由該副本自我拷貝一份到一臺新的機器,隨后在chunk-server增加向該機器上的庫發(fā)送更新命令。這個過程由元數(shù)據(jù)管理服務(wù)控制,不需要外部介入。

    損壞數(shù)據(jù)修復:采取刪除壞庫、新增副本的方式完成壞數(shù)據(jù)修復。數(shù)據(jù)損壞通常由宕機引發(fā),一臺機器宕機,OP只需要將該機器從系統(tǒng)中刪除,這臺機器上的庫自動的會被刪除,需要新增的副本會自動的分布到其他機器上。

    宕機處理:宕機處理分為單點模塊處理和非單點模塊處理,對于單點模塊,如果宕機數(shù)量少于系統(tǒng)能夠正常工作的界限,則修復后再加入系統(tǒng)即可,如果宕機數(shù)量過多導致系統(tǒng)無法正常工作,則由OP介入。對于非單點模塊,如果發(fā)生宕機,則由OP向系統(tǒng)發(fā)送刪除機器命令,由系統(tǒng)完成其余工作。

    負載均衡:負載均衡包括庫的分布調(diào)整、根據(jù)訪問量增加、減少庫的副本數(shù)量。負載均衡由元數(shù)據(jù)管理服務(wù)完成,元數(shù)據(jù)管理服務(wù)記錄每個庫的所有副本的訪問量。

    4、工作效率設(shè)計:

    數(shù)據(jù)存儲采用MYSQL引擎,其效率由單機上存儲的數(shù)據(jù)量決定,我們將盡可能減少機器上的庫分布,以提高執(zhí)行效率。數(shù)據(jù)存儲采用追加寫的策略,需要定期進行重寫以回收空間,空閑空間的回收有兩種方式:1、在本機完成定期空間重整;2、利用系統(tǒng)增加/刪除副本的功能,將一個需要重整的庫副本重新寫入一臺新機器,將舊庫刪除,完成重整工作。項目啟示階段單庫的數(shù)據(jù)量不大,采用本機定期空間重整,在重寫的時候控制速度,以避免重寫對整機造成的影響。

    5、具體應(yīng)用和實施

    根據(jù)水文信息化系統(tǒng)的網(wǎng)絡(luò)現(xiàn)狀,目前、部信息中心、各省水文局、地市勘測局

    已經(jīng)建成了水利專網(wǎng),我們可在部信息中心、各省水文局、地市勘測局分布部署至少三臺存儲服務(wù)節(jié)點,即可保證同一時刻只有主庫并對外提供高可信存儲服務(wù)。

    隨著水文網(wǎng)絡(luò)規(guī)模建設(shè)的高速發(fā)展,水文觀測數(shù)據(jù)管理、再分析資料管理、數(shù)值預報管理、非結(jié)構(gòu)化資料管理(衛(wèi)星云圖管理、雷達數(shù)據(jù)管理、傳真圖管理、報文資料管理)、統(tǒng)計數(shù)據(jù)管理、分析預報保障產(chǎn)品管理、背景信息管理、遙感數(shù)據(jù)管理、地理信息數(shù)據(jù)管理、元數(shù)據(jù)管理會越來越龐大,采用基于分布式key-value數(shù)據(jù)庫技術(shù),利用其高存儲、高可用、高擴展等特點對海量氣象水文和地理數(shù)據(jù)進行存儲,同時利用對大數(shù)據(jù)隨機讀寫訪問、可擴展、多版本等特點,對水文數(shù)據(jù)和地理信息數(shù)據(jù)進行分類存儲和管理。

    万年县| 泸水县| 大丰市| 建阳市| 合阳县| 苗栗县| 榆林市| 伊川县| 凉城县| 白玉县| 民勤县| 张北县| 泰宁县| 龙州县| 霍林郭勒市| 门源| 邵东县| 英吉沙县| 昌图县| 永丰县| 蒙城县| 枝江市| 富锦市| 婺源县| 丘北县| 钟山县| 阳朔县| 双牌县| 方城县| 肥城市| 濉溪县| 金乡县| 修水县| 绍兴县| 芦溪县| 卓资县| 延边| 砚山县| 天全县| 武穴市| 徐汇区|