• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺談電力大數(shù)據(jù)平臺關鍵技術研究與應用

      2016-12-28 23:25:48付盼劉曉龍
      中國科技博覽 2016年24期
      關鍵詞:數(shù)據(jù)整合數(shù)據(jù)存儲大數(shù)據(jù)平臺

      付盼++劉曉龍

      [摘 ?要]近年來,經過SG186工程、SG-ERP建設,國家電網(wǎng)公司積累了豐富的數(shù)據(jù)資源,但隨著公司業(yè)務系統(tǒng)數(shù)據(jù)量的不斷增大,數(shù)據(jù)價值挖掘需求的增長,電力大數(shù)據(jù)平臺需要橫向擴張,進一步整合優(yōu)化數(shù)據(jù)資源。本文研究探討了電力大數(shù)據(jù)平臺關鍵技術研究與應用,充分分析現(xiàn)有數(shù)據(jù)中心平臺組件待優(yōu)化點基礎上,開展公司大數(shù)據(jù)平臺基礎組件的研究,以實現(xiàn)統(tǒng)一為公司各類應用建設提供海量數(shù)據(jù)采集處理、存儲處理、計算處理、分析挖掘等基礎性支撐功能。

      [關鍵詞]大數(shù)據(jù)平臺;關鍵技術;數(shù)據(jù)整合;數(shù)據(jù)存儲

      中圖分類號:F426.61 文獻標識碼:A 文章編號:1009-914X(2016)24-0194-01

      1 引言

      隨著國網(wǎng)公司“三集五大”管理體系和調控、運監(jiān)、客服三中心的全面建設,信息系統(tǒng)已全面融入公司生產經營管理業(yè)務的各個方面,積累了大量的結構化數(shù)據(jù)、非結構化數(shù)據(jù)、海量歷史準實時數(shù)據(jù)和地理信息數(shù)據(jù)。按照“統(tǒng)籌規(guī)劃、協(xié)同推進、統(tǒng)一平臺、規(guī)范建設”的總體策略,在充分繼承現(xiàn)有信息化建設成果和一期大數(shù)據(jù)平臺試點建設經驗的基礎上,2016年公司將全面推廣大數(shù)據(jù)平臺建設工作,以提升公司內外部數(shù)據(jù)資源整合處理和價值挖掘水平,促進管理提升和業(yè)務創(chuàng)新。

      2 關鍵技術研究

      1)關系數(shù)據(jù)與分布式存儲同步技術

      關系數(shù)據(jù)庫與分布式存儲同步技術是指可以將關系數(shù)據(jù)庫的數(shù)據(jù)抽取到分布式存儲中,又可以將分布式存儲中的數(shù)據(jù)回寫到關系數(shù)據(jù)庫中。

      大數(shù)據(jù)平臺中的數(shù)據(jù)通常采取分布式存儲技術進行海量數(shù)據(jù)存儲,數(shù)據(jù)主要來源于公司現(xiàn)有的關系數(shù)據(jù)庫、數(shù)據(jù)倉庫。在數(shù)據(jù)進行傳輸?shù)倪^程當中,既需要保障數(shù)據(jù)能在關系型數(shù)據(jù)庫和分布式存儲之間無縫傳輸,又需要保障大規(guī)模數(shù)據(jù)的傳輸與流轉效率,不能影響業(yè)務系統(tǒng)正常運行。而傳統(tǒng)的ETL抽取工具一般只具有關系數(shù)據(jù)庫、文件、服務等數(shù)據(jù)源之間同步功能,缺少關系數(shù)據(jù)庫與分布式存儲之間數(shù)據(jù)同步能力。因此需要利用關系數(shù)據(jù)庫與分布式存儲同步技術實現(xiàn)不同存儲機制下的數(shù)據(jù)雙向同步。

      2)文件采集與處理技術

      數(shù)據(jù)平臺的數(shù)據(jù)來源除了傳統(tǒng)的數(shù)據(jù)中心、數(shù)據(jù)倉庫之外,更多的數(shù)據(jù)是來自之前無法有效處理的各類文件,如系統(tǒng)日志、數(shù)據(jù)交換文件、現(xiàn)場檢修照片、遠程監(jiān)視的視頻等。這些文件數(shù)據(jù)結構不明確、清晰,變化頻繁,數(shù)量巨大。通過大數(shù)據(jù)平臺的分布式存儲可以低成本存儲文件,也可以將其中的數(shù)據(jù)解析成結構化或半結構化的數(shù)據(jù)存儲在大數(shù)據(jù)平臺中。

      3)分布式文件系統(tǒng)

      分布式文件系統(tǒng)是指基于客戶機/服務器模式,文件系統(tǒng)管理的物理資源不一定直接連接在本地節(jié)點上,而是通過計算機網(wǎng)絡與節(jié)點相連。分布式文件系統(tǒng)表現(xiàn)為文件數(shù)據(jù)存儲在分散的低成本存儲介質上,對外提供一致的文件訪問接口,具有良好的容錯性。分布式文件系統(tǒng)的引入,解決了海量數(shù)據(jù)存儲的難題,其所具備的全分布式架構、數(shù)據(jù)塊粒度切分、在線擴容減容、復制備份及普通PC硬件適用性等關鍵技術,支撐了安全的PB級以上規(guī)模數(shù)據(jù)在線存儲,使安全、低成本、可任意擴容的大數(shù)據(jù)存儲成為可能。

      3 平臺架構內容

      大數(shù)據(jù)平臺為業(yè)務系統(tǒng)大數(shù)據(jù)應用開發(fā)、運行提供統(tǒng)一的平臺支撐。其架構內容主要包括數(shù)據(jù)整合、數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)分析、平臺服務、安全管理、配置管理等模塊,并提供各種形式的服務對業(yè)務應用提供支撐。架構圖如下圖1所示。

      數(shù)據(jù)整合:通過數(shù)據(jù)抽取、實時數(shù)據(jù)采集、文件數(shù)據(jù)采集、數(shù)據(jù)庫實時復制等多種技術從外部數(shù)據(jù)源抽取和采集結構化數(shù)據(jù)(關系數(shù)據(jù)庫記錄)、半結構化數(shù)據(jù)(日志、郵件等)、非結構化數(shù)據(jù)(文件、視頻、音頻、網(wǎng)絡數(shù)據(jù)流等),同時,實現(xiàn)數(shù)據(jù)的實時、非實時采集。

      數(shù)據(jù)存儲:負責進行大數(shù)據(jù)的存儲,針對全數(shù)據(jù)類型和多樣計算需求,以海量規(guī)模存儲、快速查詢讀取為特征,存儲來自外部數(shù)據(jù)源的各類數(shù)據(jù),支撐數(shù)據(jù)處理層的高級應用。

      數(shù)據(jù)計算:對多樣化的大數(shù)據(jù)提供流計算、批量計算、內存計算、查詢計算等計算功能,允許對分布式存儲的數(shù)據(jù)文件或內存數(shù)據(jù)進行查詢和計算。通過流計算技術提供實時分析處理的計算能力,實現(xiàn)實時決策、預警等。通過離線計算提供落地數(shù)據(jù)的計算能力,實現(xiàn)數(shù)據(jù)的批量處理。

      數(shù)據(jù)分析:對多樣化的大數(shù)據(jù)進行加工、處理、分析、挖掘,產生新的業(yè)務價值,發(fā)現(xiàn)業(yè)務發(fā)展方向,提供業(yè)務決策依據(jù)。

      平臺服務:將底層數(shù)據(jù)分析工具、組件等能力封裝后為業(yè)務系統(tǒng)的大數(shù)據(jù)應用提供平臺服務支撐,包含存儲服務、計算服務、分析服務、展現(xiàn)服務等。

      安全:解決從大數(shù)據(jù)環(huán)境下的數(shù)據(jù)采集、存儲、分析、應用等過程中產生的諸如身份驗證、授權過程和輸入驗證等大量安全問題。由于在數(shù)據(jù)分析、挖掘過程中涉及企業(yè)各業(yè)務的核心數(shù)據(jù),防止數(shù)據(jù)泄露,控制訪問權限等安全措施在大數(shù)據(jù)應用中尤為關鍵。

      管理配置:實時監(jiān)測大數(shù)據(jù)處理全過程中的整體運行狀態(tài)、資源使用情況和接口調用情況等性能指標并對關鍵系統(tǒng)險情進行告警,支持大數(shù)據(jù)組件安裝、配置和狀態(tài)管理,可快速擴展應用功能和能力,可實時性監(jiān)控和調度任務計劃,可對大數(shù)據(jù)集群的計算資源和存儲資源進行配置和管理。

      4 總結

      對電力大數(shù)據(jù)平臺關鍵技術的研究與應用的成功實施,為公司各類應用建設提供海量數(shù)據(jù)采集處理、存儲處理、計算處理、分析挖掘等基礎性支撐功能,提升公司內外部數(shù)據(jù)資源整合處理和價值挖掘水平,促進管理提升和業(yè)務創(chuàng)新。

      猜你喜歡
      數(shù)據(jù)整合數(shù)據(jù)存儲大數(shù)據(jù)平臺
      Hadoop性能測試自動化研究
      軟件導刊(2016年12期)2017-01-21 14:43:14
      基于大數(shù)據(jù)的智能停車場管理系統(tǒng)設計
      基于大數(shù)據(jù)分析的智慧倉儲運營支撐平臺設計
      開源數(shù)據(jù)庫數(shù)據(jù)存儲的實現(xiàn)路徑分析
      基于Android開發(fā)的APP數(shù)據(jù)存儲研究
      高等院校實驗中心共享教學資源庫建設研究與設計
      哈希算法在物聯(lián)網(wǎng)數(shù)據(jù)存儲中的應用
      襪業(yè)行業(yè)大數(shù)據(jù)平臺的應用研究
      基于數(shù)據(jù)挖掘的網(wǎng)絡營銷系統(tǒng)研究
      大型在線式UPS及監(jiān)控系統(tǒng)在中控機房的應用
      科技視界(2016年4期)2016-02-22 13:10:37
      永嘉县| 大方县| 右玉县| 万荣县| 自贡市| 兴山县| 和硕县| 新津县| 噶尔县| 麻城市| 科技| 闽清县| 宿迁市| 石嘴山市| 怀来县| 巧家县| 济阳县| 黄浦区| 平乡县| 濮阳县| 海丰县| 黑山县| 紫阳县| 十堰市| 肃南| 长沙市| 青海省| 炎陵县| 河北区| 衡阳县| 绥宁县| 湛江市| 嘉义县| 麦盖提县| 万载县| 两当县| 上栗县| 清新县| 红原县| 左贡县| 朔州市|