• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    支持模型復用的通用大數(shù)據(jù)分析平臺

    2020-09-14 08:31:14崔曉龍邊勝琴張德政
    實驗室研究與探索 2020年7期
    關(guān)鍵詞:數(shù)據(jù)處理用戶模型

    崔曉龍, 郭 茜,b, 邊勝琴, 張德政,b

    (北京科技大學a.計算機與通信工程學院;b.材料領(lǐng)域知識工程北京市重點實驗室,北京100083)

    0 引 言

    大數(shù)據(jù)時代,數(shù)據(jù)已經(jīng)成為各企業(yè)的重要資產(chǎn),利用大數(shù)據(jù)進行主題分析挖掘,不僅可以對數(shù)據(jù)進行宏觀監(jiān)控,還可以幫助企業(yè)降低成本、提高效率、開發(fā)新產(chǎn)品,做出更加科學、準確的業(yè)務決策。隨著數(shù)據(jù)量的增多,企業(yè)面對多方面的主題分析時往往將其視為獨立的項目,即每次進行主題分析時均需重新獲取數(shù)據(jù)、重新進行數(shù)據(jù)預處理、重新構(gòu)建模型。在進行多主題分析時,這種方式往往導致主題間數(shù)據(jù)源及算法模型重用性差等問題。同時在可預見的未來,互聯(lián)網(wǎng)的發(fā)展必然帶來數(shù)據(jù)量爆炸式的增長,數(shù)據(jù)分析人員對數(shù)據(jù)的預處理能力落后與數(shù)據(jù)快速增長之間的矛盾將會更加突出,同時也伴隨著數(shù)據(jù)分析性能遇到瓶頸,缺少數(shù)據(jù)分析挖掘的高級方法,數(shù)據(jù)分析人員無法直觀查看數(shù)據(jù)分布并進行預處理等問題的發(fā)生,這些問題制約著大數(shù)據(jù)分析的發(fā)展[1-3]。本文建立一個集多主題構(gòu)建于一體的通用大數(shù)據(jù)分析平臺,實現(xiàn)多個主題構(gòu)建,各類型大數(shù)據(jù)存儲與抽取,主題間的數(shù)據(jù)共享,主題間算法模型共享,大數(shù)據(jù)自動分析并給出相應處理建議是解決以上問題的一個可行方案[4]。

    1 相關(guān)技術(shù)

    1.1 數(shù)據(jù)分析

    數(shù)據(jù)分析流程主要包括:確定分析主題、獲取數(shù)據(jù)、數(shù)據(jù)描述、數(shù)據(jù)預處理、構(gòu)建算法模型5個步驟。確定分析主題需結(jié)合業(yè)務背景來分析需求,確定分析及研究方向;通過爬蟲技術(shù)、ETL技術(shù)、日志采集工具可分別獲得網(wǎng)絡數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、日志數(shù)據(jù);通過查看數(shù)據(jù)基本描述屬性可查看數(shù)據(jù)分布,如中心趨勢度量(均值、中位數(shù)、眾數(shù))、數(shù)據(jù)分布度量(極差、四分位數(shù)、方差和標準差)、統(tǒng)計描述可視化(分位數(shù)圖、直方圖)對數(shù)據(jù)進行描述;通過數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換等方法對數(shù)據(jù)進行預處理[5];結(jié)合數(shù)據(jù)特點構(gòu)建相應的算法模型,如分類算法、聚類算法、關(guān)聯(lián)規(guī)則算法等。

    1.2 大數(shù)據(jù)

    針對海量的數(shù)據(jù),一味提高硬盤容量和內(nèi)存只會導致成本提高以及數(shù)據(jù)處理效率遇到瓶頸等問題發(fā)生。為解決海量數(shù)據(jù)分布式存儲及計算問題,Google在2006年前公布了GFS、MapReduce,這也直接支持了Apache Hadoop 項目的誕生[6]。

    Hadoop的分布式文件系統(tǒng)為HDFS(Hadoop Distributed File System)[7-9],它是一個高度容錯性的系統(tǒng),解決了分布式計算中數(shù)據(jù)存儲管理問題,適合部署在廉價的機器上。隨著數(shù)據(jù)種類的增多,非關(guān)系型數(shù)據(jù)庫受到更多關(guān)注。如MongoDB是基于分布式文件存儲的數(shù)據(jù)庫,旨在為WEB應用提供可擴展的高性能數(shù)據(jù)存儲解決方案;HBase是一種構(gòu)建在HDFS之上的分布式、面向列的存儲系統(tǒng),利用Hadoop MapReduce來處理HBase中的海量數(shù)據(jù)。

    大數(shù)據(jù)算法庫需具備大數(shù)據(jù)的批量計算、流式計算能力,其中批量計算主要針對靜態(tài)數(shù)據(jù)的離線計算,吞吐量好,但是不能保證實時性;流計算主要針對動態(tài)數(shù)據(jù)的在線實時計算,時效性好,但是難以獲取數(shù)據(jù)全貌[10]。針對不同的數(shù)據(jù)類型,平臺需具備可結(jié)合各類業(yè)務邏輯的算法、海量數(shù)據(jù)的離線分析與處理能力。目前存在的多種大數(shù)據(jù)算法庫中以Mahout、Spark下的Spark MLlib較為流行。

    Mahout是一個基于Hadoop的機器學習和數(shù)據(jù)挖掘的分布式計算框架,在MapReduce模式下封裝實現(xiàn)了大量數(shù)據(jù)挖掘經(jīng)典算法,為Hadoop開發(fā)人員提供了數(shù)據(jù)建模的標準,從而大大降低了大數(shù)據(jù)應用中并行挖掘產(chǎn)品的開發(fā)難度[11]。

    Spark是UC Berkeley AMP Lab開發(fā)的開源集群計算平臺,是以內(nèi)存計算為基礎(chǔ)的集群計算框架[12]。Spark MLlib是Spark中可擴展的機器學習庫,它由一系列機器學習算法和實用程序組成,包括分類、回歸、聚類、協(xié)同過濾、降維,還包括一些底層的優(yōu)化方法[13]。

    2 平臺總體設計

    2.1 平臺架構(gòu)

    基于目前各企業(yè)分析主題時的難點和痛點,對大數(shù)據(jù)分析平臺的總體設計如圖1所示。硬件層采用商業(yè)PC服務器,可靠性和性能均能滿足通用大數(shù)據(jù)平臺要求;經(jīng)濟方面采用商業(yè)PC服務器也是可行的;系統(tǒng)硬件是可擴展的,可以通過增加服務器的數(shù)量提升對大量數(shù)據(jù)的處理能力。

    圖1 平臺總體架構(gòu)圖

    存儲/計算引擎層采用流行的Hadoop/Spark大數(shù)據(jù)處理引擎,同時采用NoSQL數(shù)據(jù)庫(MongoDB、HBase)負責非結(jié)構(gòu)化數(shù)據(jù)的存儲;結(jié)構(gòu)化數(shù)據(jù)采用MySQL進行存儲;批處理數(shù)據(jù)采用HDFS進行存儲。該層以硬件層為基礎(chǔ)負責為應用層為提供數(shù)據(jù)存儲和計算服務[14-15]。

    應用層包含主題管理模塊、數(shù)據(jù)探索模塊、數(shù)據(jù)預處理模塊、大數(shù)據(jù)算法模塊。主要負責調(diào)動存儲/計算引擎的存儲資源和計算資源,同時也為展示層進行互動并提供計算結(jié)果。

    展示層主要負責數(shù)據(jù)分析人員與系統(tǒng)的交互,如數(shù)據(jù)分析人員可通過Web頁面或命令行請求數(shù)據(jù),應用層可基于展示層的請求調(diào)動資源對數(shù)據(jù)進行處理并呈現(xiàn)給展示層。

    2.2 數(shù)據(jù)架構(gòu)

    大數(shù)據(jù)分析平臺各層之間均需要接口進行銜接,數(shù)據(jù)架構(gòu)關(guān)系著整個平臺是否能夠按照預期需求運行,其數(shù)據(jù)架構(gòu)整體設計如圖2所示。外部系統(tǒng)對數(shù)據(jù)存放路徑或IP地址進行配置生成配置文件,數(shù)據(jù)采集接口通過讀取配置文件來訪問數(shù)據(jù),通過數(shù)據(jù)采集對數(shù)據(jù)進行轉(zhuǎn)換并加載,為數(shù)據(jù)處理提供服務。數(shù)據(jù)可分為少量數(shù)據(jù)、大量數(shù)據(jù)、實時數(shù)據(jù)3種,不同種類的數(shù)據(jù)處理策略不同,針對少量數(shù)據(jù),可將其存儲到單機節(jié)點,利用本地內(nèi)存進行計算;離線批量數(shù)據(jù),則需進行分布式存儲,可利用集群進行并行計算;在線實時數(shù)據(jù),可利用集群進行流式計算。數(shù)據(jù)處理過程需記錄到歷史版本庫,同時加載模型庫及已處理好的文件進行模型構(gòu)建,最終將結(jié)果文件傳遞給外部系統(tǒng)如Web頁面、客戶端或交互終端如API請求等。

    圖2 數(shù)據(jù)架構(gòu)設計概圖

    3 功能模塊設計

    大數(shù)據(jù)分析平臺分為主題管理模塊、數(shù)據(jù)探索模塊、數(shù)據(jù)預處理模塊、算法模型模塊,如圖3所示。

    圖3 平臺功能架構(gòu)圖

    3.1 主題管理模塊

    主題管理主要為解決數(shù)據(jù)安全性而設計的,數(shù)據(jù)分析人員基于業(yè)務對主題進行描述,選擇相應數(shù)據(jù)源,最終確定主題,每個主題對應一套針對自己業(yè)務的數(shù)據(jù)集以及數(shù)據(jù)處理流程。由于同一數(shù)據(jù)分析人員業(yè)務背景相同,其分析不同的主題可能用到相同的數(shù)據(jù),而不同的數(shù)據(jù)分析人員可能用到相同的算法模型,主題管理模塊便于對數(shù)據(jù)分析人員復用權(quán)限的管理,復用權(quán)限表如表1所示。

    同一用戶可構(gòu)建不同主題,主題之間可共享數(shù)據(jù)源、數(shù)據(jù)半自動處理流程、數(shù)據(jù)半自動化處理結(jié)果以及該用戶所有模型;不同用戶之間可共享公開的數(shù)據(jù)模型。這就避免了重復上傳數(shù)據(jù)和重復構(gòu)建數(shù)據(jù)預處理過程,同時也便于用戶管理自己的模型。

    表1 復用權(quán)限表

    3.2 數(shù)據(jù)探索模塊

    主題分析中,數(shù)據(jù)分析人員需根據(jù)數(shù)據(jù)特征的分布來判定如何對數(shù)據(jù)進行預處理、選擇什么樣的特征以及如何構(gòu)建合適模型,當加載數(shù)據(jù)源后,針對不同數(shù)據(jù)類型,數(shù)據(jù)分析人員往往看重的分析的指標又不盡相同。此時,該模塊可根據(jù)數(shù)據(jù)列類型給出基本的數(shù)據(jù)描述字段,數(shù)據(jù)列類型主要包括離散型和數(shù)值型,對不同類型可展示數(shù)據(jù)分析人員關(guān)心的指標。離散型主要展示頻次、數(shù)據(jù)條數(shù)、空值個數(shù)等統(tǒng)計描述,同時以柱狀圖、餅圖、表格等可視化手段進行輔助展示;數(shù)值型主要展示標準差、均值、最大值、最小值、四分位點、中位數(shù)、總條數(shù)、空值個數(shù)等統(tǒng)計描述,以盒圖、折線圖等圖表進行輔助展示。該模塊可使數(shù)據(jù)分析人員更清楚地認識數(shù)據(jù),為數(shù)據(jù)預處理和模型構(gòu)建做準備。

    3.3 數(shù)據(jù)預處理模塊

    數(shù)據(jù)預處理模塊可對待分析數(shù)據(jù)進行半自動化預處理,之所以稱為半自動化預處理,主要是由于數(shù)據(jù)處理與業(yè)務緊密結(jié)合,而該平臺又可構(gòu)建不同業(yè)務的主題,由于無法學習各個主題對應的業(yè)務背景,系統(tǒng)只能通過數(shù)據(jù)分布提出相應的數(shù)據(jù)處理建議,處理建議最終執(zhí)行權(quán)交給數(shù)據(jù)分析人員來判定。如平臺對某一列給出填充的建議,但具體填充0、最大值還是最小值,則需要數(shù)據(jù)分析人員結(jié)合業(yè)務來確認。

    該模塊主要包含數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換4個功能,功能結(jié)構(gòu)圖如圖4所示。

    圖4 數(shù)據(jù)預處理模塊

    數(shù)據(jù)清洗主要包括對缺失值的處理,可按照行、列來區(qū)分,通過后臺程序制定的策略算法,根據(jù)缺失值的缺失程度給出相應處理操作建議;數(shù)據(jù)集成主要包括冗余特征發(fā)現(xiàn)與多表合并,冗余特征發(fā)現(xiàn)主要找出冗余的特征并建議刪除,如果是離散型則使用卡方檢驗算法求相似度,如果是數(shù)值型則使用皮爾遜相關(guān)系數(shù)求相似度;數(shù)據(jù)規(guī)約包括維度規(guī)約和數(shù)據(jù)離散化,維度歸約主要通過特征選擇或特征提取來減少數(shù)據(jù)集中的維數(shù)(變量)數(shù)量,而不會顯著損失信息,而數(shù)據(jù)離散化主要是將連續(xù)屬性的特征切分為若干“段”來減少給定連續(xù)屬性值的個數(shù);數(shù)據(jù)變換主要實現(xiàn)屬性構(gòu)造,可以選擇多個屬性并構(gòu)建新屬性的公式,并通過后臺程序識別公式進行新屬性的構(gòu)造。

    為避免對同一數(shù)據(jù)源進行重復的數(shù)據(jù)預處理操作,平臺可記錄數(shù)據(jù)預處理過程,并將新的數(shù)據(jù)預處理結(jié)果記錄到版本庫中供數(shù)據(jù)分析人員直接使用。如圖5所示。對于同一數(shù)據(jù)集,平臺可記錄不同的數(shù)據(jù)預處理過程并將最終的預處理結(jié)果存儲為相應版本。數(shù)據(jù)分析人員可重用數(shù)據(jù)處理操作并可基于現(xiàn)有版本庫對數(shù)據(jù)繼續(xù)進行預處理。

    圖5 歷史版本庫操作

    3.4 算法模型模塊

    數(shù)據(jù)分析人員可以通過該模塊進行算法模型的定義并上傳已實現(xiàn)的算法模型文件,其余數(shù)據(jù)分析人員可輸入指定的參數(shù)來調(diào)用模型,最終平臺按照輸出類型將結(jié)果輸出。

    數(shù)據(jù)分析人員可上傳自定義模型,其中模型名稱以及相應的參數(shù)字段約定如表2所示。

    表2 算法模型上傳字段約定

    當調(diào)用模型時需要利用算法引擎進行處理,其中算法引擎設計如圖6所示。數(shù)據(jù)分析人員通過API或交互平臺來構(gòu)建輸入?yún)?shù),主要包括選用的模型、模型類型、模型的相應參數(shù)以及選擇的數(shù)據(jù)。算法引擎通過輸入?yún)?shù)來加載算法模型和數(shù)據(jù),首先通過依賴包調(diào)用引擎判斷是否已加載所有的包,如果沒有,則加載相應的包;根據(jù)數(shù)據(jù)存儲位置(本地存儲或集群存儲)來加載數(shù)據(jù)。當兩者均準備就緒后,根據(jù)模型類型選擇SparkMLlib或單機算法調(diào)用引擎來進行模型運算;將執(zhí)行結(jié)果返回到模型輸出引擎,該引擎通過判斷模型輸出類型(字典、數(shù)組或json字符串)將結(jié)果輸出到平臺。

    圖6 算法引擎設計圖

    4 平臺實現(xiàn)與應用

    4.1 平臺實現(xiàn)

    大數(shù)據(jù)分析平臺涉及大量的數(shù)據(jù)處理,而目前數(shù)據(jù)分析挖掘中較常使用Python語言,同時有大量的數(shù)據(jù)操作基礎(chǔ)庫是基于Python開發(fā)的,因此選用Python作為大數(shù)據(jù)分析平臺的主要開發(fā)語言。

    平臺選擇基于Python的Web框架,這有利于與底層語言的結(jié)合??紤]到Django具有文檔最完善、強大的URL路由配置、容易數(shù)據(jù)遷移等特點,最終選擇Django框架作為平臺的Web框架。

    前臺展示以Bootstrap作為前端框架、Echarts作為圖表展示、Jquery Ajax異步請求與后臺action進行交互。底層以MySQL數(shù)據(jù)庫作為大數(shù)據(jù)分析平臺的信息存儲數(shù)據(jù)庫、以Hadoop HDFS集群作為大數(shù)據(jù)存儲、以Spark MLlib算法庫作為大數(shù)據(jù)分析平臺的算法庫。

    整體技術(shù)架構(gòu)可將系統(tǒng)分為不同的邏輯塊,通過相應的組件相互訪問,如圖7所示。其中展示層只接受Json格式數(shù)據(jù),可作為API供第三方或Web直接解析;ORM可將關(guān)系型數(shù)據(jù)庫和業(yè)務實體進行映射供控制層直接使用;由于涉及到大數(shù)據(jù)的分布式存儲,本平臺需利用python進行HDFS的訪問,可利用pyhdfs對HDFS內(nèi)容進行操作;同理,對于大數(shù)據(jù)算法模型的計算,可利用pyspark與Spark對接進行操作。這種方式將數(shù)據(jù)訪問和邏輯操作進行分離,增強了系統(tǒng)的復用性及系統(tǒng)的擴展性,同時也大大降低了應用系統(tǒng)開發(fā)和維護的成本。

    圖7 各層間訪問接口

    4.2 平臺的部署

    平臺部署環(huán)境如表3所示,Web服務器僅負責維護平臺系統(tǒng),配置相對較低。平臺使用Hadoop2.7.0以及Spark1.6.1構(gòu)建的16個節(jié)點集群對數(shù)據(jù)進行存儲和計算,配置相對較高,可根據(jù)業(yè)務需求對硬件進行調(diào)整。該平臺部署在linux系統(tǒng)中,需安裝表3所示的Python包用于數(shù)據(jù)處理及集群的操作。

    4.3 應用案例

    以2016年電網(wǎng)大數(shù)據(jù)助力2016CCF大數(shù)據(jù)競賽的兩個分析主題為例,一個為客戶畫像;另一個為客戶用電異常行為分析。

    表3 平臺所需軟硬件環(huán)境

    客戶畫像以電力用戶的95598工單數(shù)據(jù)、電量電費營銷數(shù)據(jù)等為基礎(chǔ),綜合分析電費敏感客戶特征,建立客戶電費敏感度模型,對電費敏感用戶的敏感程度進行量化評判,幫助供電企業(yè)快速、準確的識別電費敏感客戶,從而對應地提供有針對性的電費、電量提醒等精細化用電服務??蛻粲秒姰惓P袨榉治龌趪译娋W(wǎng)公司提供的關(guān)于用戶用電量、電能表停走、電流失流、計量門打開燈計量異常情況、竊電行為等相關(guān)數(shù)據(jù),以及經(jīng)過現(xiàn)場電工人員現(xiàn)場確認的竊電用戶清單,希望參賽者利用大數(shù)據(jù)分析算法與技術(shù),發(fā)現(xiàn)竊電用戶的行為特征,形成竊電用戶行為畫像,準確識別竊電用戶,以幫助系統(tǒng)更快速、準確地識別竊電用戶,提高竊電監(jiān)測效率,降低竊電損失。其中應收電費信息部分信息如表4所示,各列代表含義分別為應收年月、用戶編號、供電單位編號、用戶類別、用電類別、電費金額、總電量,其余信息數(shù)據(jù)格式與之類似,在此不展開詳述。

    盡管兩者屬于同一行業(yè)不同主題分析,但分析步驟相同。

    客戶畫像的一種分析步驟如下:將現(xiàn)有數(shù)據(jù)按照用戶編號進行合并,根據(jù)業(yè)務對數(shù)據(jù)進行預處理,構(gòu)建相關(guān)特征,利用Kmeans算法或其余聚類算法對用戶進行群分,利用決策樹算法或其余分類算法構(gòu)建評價模型對客戶構(gòu)建評價標簽,利用該標構(gòu)建用戶畫像。

    客戶用電異常行為的一種分析步驟如下:將現(xiàn)有數(shù)據(jù)按照用戶編號進行合并,根據(jù)業(yè)務對數(shù)據(jù)進行預處理,構(gòu)建相關(guān)特征,利用決策樹算法或其余分類算法構(gòu)建用電行為識別模型,利用該模型識別異??蛻?。

    表4 應收電費信息表數(shù)據(jù)展示

    由于兩個主題會用到相同的數(shù)據(jù),如用電客戶信息、電能表相關(guān)信息、電量相關(guān)信息;同時兩者會用到相同的算法模型,如決策樹算法,因此可以利用該系統(tǒng)進行數(shù)據(jù)數(shù)據(jù)處理的重用及模型的重用。

    4.3.1 客戶畫像

    (1)基于平臺創(chuàng)建客戶畫像主題,上傳相應數(shù)據(jù)并進行數(shù)據(jù)展示與描述,如圖8所示,其中字符型可看到頻次最高列、頻次、數(shù)據(jù)總條數(shù)、空值個數(shù)、非空個數(shù);數(shù)值型可看到類型、標準差、均值、最小值等數(shù)據(jù)分布。

    圖8 數(shù)據(jù)描述

    (2)數(shù)據(jù)預處理。根據(jù)平臺給出的對行和列的處理建議,數(shù)據(jù)分析人員可進行數(shù)據(jù)預處理操作,平臺默認將數(shù)據(jù)處理記錄到版本庫中,這樣就能保證當該數(shù)據(jù)源再次被用到時,其數(shù)據(jù)處理過程可被復用。如圖9所示,系統(tǒng)根據(jù)各列數(shù)據(jù)的分布,給出刪除和填充的建議,并給出理由,當缺失率高達80%時,建議刪除,存在部分缺失值時建議填充,同時給出數(shù)據(jù)的分布,便于數(shù)據(jù)分析人員結(jié)合業(yè)務選擇填充的具體值。

    圖9 針對于列的預處理

    (3)算法模塊的構(gòu)建。該主題需要構(gòu)建決策樹算法模型,如圖10所示,數(shù)據(jù)分析人員輸入算法模塊名稱,算法描述,選擇模塊類型為單機-分類算法,選擇公開可被其余用戶調(diào)用,上傳算法文件并配置輸入輸出參數(shù)。

    圖10 構(gòu)建決策樹模型

    4.3.2 客戶用電異常行為分析

    (1)基于平臺創(chuàng)建客戶用電異常行為主題,選擇已存在的數(shù)據(jù)源,避免重復上傳數(shù)據(jù),該主題復用了客戶畫像主題中的用戶基本信息,電量信息等數(shù)據(jù)源。

    (2)選擇數(shù)據(jù)源時可選擇相應的版本以及相應的數(shù)據(jù)處理操作進行數(shù)據(jù)處理的重用。如圖11所示,用戶基本信息目前有4個版本,每個版本記錄詳細的數(shù)據(jù)處理過程,可直接使用v2版本的數(shù)據(jù)集,同時也可以應用該版本下的某個操作。

    圖11 重用數(shù)據(jù)預處理模型

    (3)該主題直接復用客戶畫像主題構(gòu)建的決策樹算法,避免了算法模型的重寫,利用已構(gòu)建好的特征及客戶異常預測目標進行決策樹模型訓練,選擇相應的訓練集和測試集,最終返回一個json字符串顯示預測結(jié)果,其中1代表竊電用戶,0代表正常用戶,預測準確度約為0.802。決策樹算法模型復用和預測結(jié)果分別如圖12和圖13所示。

    圖12 決策樹模型調(diào)用

    圖13 決策樹預測結(jié)果

    客戶用電異常行為分析主題重用了客戶畫像主題的用戶基本信息數(shù)據(jù)、預處理結(jié)果及處理過程,減少了數(shù)據(jù)分析人員重復上傳相同數(shù)據(jù)并進行數(shù)據(jù)預處理的操作。同時,客戶用電異常行為分析主題重用了客戶畫像的決策樹算法模型,避免了數(shù)據(jù)分析人員對同一種算法的重復構(gòu)建,實現(xiàn)了算法模型的重用。基于該平臺實現(xiàn)的兩個主題有力地證明了數(shù)據(jù)重用、預處理過程重用及算法模型重用的可行性。

    5 結(jié) 語

    通過構(gòu)建通用大數(shù)據(jù)分析平臺初步解決了數(shù)據(jù)以及模型的復用,對大數(shù)據(jù)分析流程、大數(shù)據(jù)存儲技術(shù)、大數(shù)據(jù)算法庫等技術(shù)展開研究,對主題模塊、數(shù)據(jù)探索模塊、數(shù)據(jù)預處理模塊、大數(shù)據(jù)分析算法模塊進行了詳細設計,提出了相應的數(shù)據(jù)清洗策略、數(shù)據(jù)集成策略、數(shù)據(jù)規(guī)約策略、數(shù)據(jù)變換策略,制定了算法自定義規(guī)范并設計了算法引擎。借助平臺對真實數(shù)據(jù)集數(shù)據(jù)進行了分析和展示,對該數(shù)據(jù)的處理和分析過程及結(jié)果證明了數(shù)據(jù)重用、預處理過程重用及模型重用的可行性,減少了數(shù)據(jù)分析人員在主題分析中的重復操作,有利于企業(yè)在較短的時間內(nèi)構(gòu)建多個主題分析,幫助企業(yè)提高主題分析效率,以便其更加快速、科學地做出業(yè)務決策。

    ·名人名言·

    任何人都承認實驗是科學之母,這是確定不移的真理,誰也不會否認。

    ——米丘林

    猜你喜歡
    數(shù)據(jù)處理用戶模型
    一半模型
    認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
    心理學報(2022年4期)2022-04-12 07:38:02
    ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    關(guān)注用戶
    商用汽車(2016年11期)2016-12-19 01:20:16
    3D打印中的模型分割與打包
    關(guān)注用戶
    商用汽車(2016年6期)2016-06-29 09:18:54
    關(guān)注用戶
    商用汽車(2016年4期)2016-05-09 01:23:12
    基于希爾伯特- 黃變換的去噪法在外測數(shù)據(jù)處理中的應用
    日韩欧美一区二区三区在线观看| 亚洲在线自拍视频| 国产v大片淫在线免费观看| 18禁黄网站禁片午夜丰满| 亚洲成a人片在线一区二区| 久久久国产成人精品二区| 国产精品久久视频播放| 午夜免费激情av| 中亚洲国语对白在线视频| 日韩高清综合在线| 国产精华一区二区三区| 国产精品久久久久久人妻精品电影| 成人午夜高清在线视频| av视频在线观看入口| 九色成人免费人妻av| 久久亚洲精品不卡| 哪里可以看免费的av片| 免费高清视频大片| 国产欧美日韩精品亚洲av| 国产亚洲欧美在线一区二区| 亚洲国产欧美人成| 91成年电影在线观看| 国产精品一区二区三区四区久久| 国产精品一区二区三区四区久久| 51午夜福利影视在线观看| 黄色视频不卡| 黄色视频,在线免费观看| 日本免费a在线| 国内毛片毛片毛片毛片毛片| 香蕉丝袜av| 69av精品久久久久久| 黄片大片在线免费观看| 一边摸一边抽搐一进一小说| 国产亚洲av嫩草精品影院| 久久香蕉激情| 久99久视频精品免费| 很黄的视频免费| 久久伊人香网站| 亚洲欧洲精品一区二区精品久久久| 怎么达到女性高潮| 天天一区二区日本电影三级| 全区人妻精品视频| 身体一侧抽搐| 亚洲成人免费电影在线观看| 国产精品综合久久久久久久免费| 久久久国产欧美日韩av| 他把我摸到了高潮在线观看| 亚洲18禁久久av| 欧美黑人欧美精品刺激| 亚洲人成77777在线视频| 黄频高清免费视频| 啪啪无遮挡十八禁网站| 高清毛片免费观看视频网站| 国产真实乱freesex| 很黄的视频免费| 国产激情久久老熟女| 夜夜躁狠狠躁天天躁| 91在线观看av| 国产精品一区二区精品视频观看| 国产高清视频在线播放一区| 2021天堂中文幕一二区在线观| 国产一区在线观看成人免费| 午夜福利在线观看吧| 熟女少妇亚洲综合色aaa.| www日本在线高清视频| 欧美av亚洲av综合av国产av| 国产精品久久久久久人妻精品电影| 成人国语在线视频| 日韩大尺度精品在线看网址| 啦啦啦观看免费观看视频高清| 国产av麻豆久久久久久久| 欧美绝顶高潮抽搐喷水| 亚洲国产精品合色在线| 国产精品98久久久久久宅男小说| av免费在线观看网站| 黑人巨大精品欧美一区二区mp4| 亚洲精品在线美女| 欧美日本亚洲视频在线播放| 久久中文看片网| 国产欧美日韩精品亚洲av| 91av网站免费观看| 日韩av在线大香蕉| 两性夫妻黄色片| 免费看日本二区| 中文字幕最新亚洲高清| 看免费av毛片| 99国产精品一区二区三区| 三级国产精品欧美在线观看 | www.熟女人妻精品国产| 一本大道久久a久久精品| 一区二区三区高清视频在线| 久久久国产欧美日韩av| 亚洲中文av在线| 大型av网站在线播放| 久久久久久亚洲精品国产蜜桃av| 国产高清videossex| 真人做人爱边吃奶动态| 免费无遮挡裸体视频| 成人国产一区最新在线观看| 亚洲成人中文字幕在线播放| 一进一出好大好爽视频| 国产亚洲av嫩草精品影院| 欧美3d第一页| 亚洲 欧美一区二区三区| 搡老熟女国产l中国老女人| 亚洲成人国产一区在线观看| 美女黄网站色视频| 美女黄网站色视频| av视频在线观看入口| 夜夜夜夜夜久久久久| 窝窝影院91人妻| ponron亚洲| 亚洲成人国产一区在线观看| 欧美成人一区二区免费高清观看 | 最近在线观看免费完整版| 可以免费在线观看a视频的电影网站| 久久国产精品人妻蜜桃| 欧美激情久久久久久爽电影| 欧美三级亚洲精品| 日韩欧美国产一区二区入口| 国产精品av视频在线免费观看| 女生性感内裤真人,穿戴方法视频| 亚洲aⅴ乱码一区二区在线播放 | 熟女电影av网| 午夜福利在线在线| 男女床上黄色一级片免费看| 亚洲欧美一区二区三区黑人| 成年人黄色毛片网站| 国产区一区二久久| 91老司机精品| 国产精品乱码一区二三区的特点| 99热只有精品国产| 国产精品美女特级片免费视频播放器 | 久久久久久亚洲精品国产蜜桃av| 熟女电影av网| 丝袜美腿诱惑在线| 制服人妻中文乱码| 午夜福利18| 啪啪无遮挡十八禁网站| 久久久久久久久免费视频了| 欧美+亚洲+日韩+国产| 午夜亚洲福利在线播放| 国产成人av激情在线播放| 亚洲av成人不卡在线观看播放网| 国产成人精品久久二区二区91| 亚洲第一电影网av| 精品电影一区二区在线| 久久久久久久精品吃奶| 黄色a级毛片大全视频| 久久久久亚洲av毛片大全| 欧美zozozo另类| 黑人欧美特级aaaaaa片| 美女免费视频网站| 99在线视频只有这里精品首页| 亚洲国产欧美网| 在线观看一区二区三区| 久久午夜亚洲精品久久| 亚洲国产精品合色在线| 久久久久久久午夜电影| 亚洲男人的天堂狠狠| 动漫黄色视频在线观看| 亚洲av第一区精品v没综合| 亚洲第一电影网av| 波多野结衣高清无吗| 欧美成人性av电影在线观看| 国产精品电影一区二区三区| 婷婷六月久久综合丁香| 国产成人一区二区三区免费视频网站| av福利片在线观看| 久久中文字幕一级| 精品第一国产精品| 精华霜和精华液先用哪个| 国产成人影院久久av| 丁香六月欧美| 色综合亚洲欧美另类图片| 国产熟女午夜一区二区三区| 99国产精品一区二区三区| 久久中文看片网| 非洲黑人性xxxx精品又粗又长| 天天一区二区日本电影三级| 变态另类丝袜制服| 校园春色视频在线观看| 大型黄色视频在线免费观看| 又大又爽又粗| 欧美乱色亚洲激情| 亚洲熟妇熟女久久| 法律面前人人平等表现在哪些方面| 悠悠久久av| 男女之事视频高清在线观看| 中文字幕久久专区| 日本 av在线| 午夜精品久久久久久毛片777| 一本大道久久a久久精品| 国产精品,欧美在线| 精品一区二区三区四区五区乱码| 妹子高潮喷水视频| 亚洲aⅴ乱码一区二区在线播放 | 国产精品 国内视频| 日日爽夜夜爽网站| 一区福利在线观看| 久久久久久亚洲精品国产蜜桃av| 久久久久久人人人人人| 久久天躁狠狠躁夜夜2o2o| 国产激情偷乱视频一区二区| 丰满的人妻完整版| 99热6这里只有精品| 亚洲专区国产一区二区| 极品教师在线免费播放| 看免费av毛片| 1024香蕉在线观看| 校园春色视频在线观看| 午夜影院日韩av| 日韩高清综合在线| 激情在线观看视频在线高清| av在线天堂中文字幕| 日韩欧美免费精品| 亚洲 欧美一区二区三区| 国产真人三级小视频在线观看| 亚洲欧美日韩高清专用| 变态另类成人亚洲欧美熟女| 久久精品国产亚洲av高清一级| 亚洲在线自拍视频| 国产精品久久久人人做人人爽| 免费在线观看黄色视频的| 曰老女人黄片| 97碰自拍视频| 国产精华一区二区三区| 国产精品99久久99久久久不卡| 欧美性猛交黑人性爽| 亚洲国产精品久久男人天堂| 丁香欧美五月| 精品无人区乱码1区二区| 亚洲真实伦在线观看| 国模一区二区三区四区视频 | 亚洲av成人不卡在线观看播放网| 黄片大片在线免费观看| 老熟妇乱子伦视频在线观看| 久久久精品欧美日韩精品| 最新美女视频免费是黄的| 欧美av亚洲av综合av国产av| 久久久久性生活片| 成人特级黄色片久久久久久久| 香蕉丝袜av| 人妻丰满熟妇av一区二区三区| 日韩精品免费视频一区二区三区| 女人被狂操c到高潮| 精品不卡国产一区二区三区| 俄罗斯特黄特色一大片| 久久久精品大字幕| 久久精品aⅴ一区二区三区四区| 非洲黑人性xxxx精品又粗又长| 在线观看免费视频日本深夜| 亚洲国产精品成人综合色| 午夜日韩欧美国产| 床上黄色一级片| 日本三级黄在线观看| 人人妻,人人澡人人爽秒播| 在线观看午夜福利视频| 精品福利观看| 性色av乱码一区二区三区2| 国产av麻豆久久久久久久| 色综合亚洲欧美另类图片| 欧美3d第一页| av中文乱码字幕在线| 国产av又大| 国产精品一区二区精品视频观看| 大型av网站在线播放| 久久久久久久久中文| 88av欧美| 精品第一国产精品| 久久精品国产清高在天天线| 亚洲国产精品久久男人天堂| 国产一区二区在线观看日韩 | 国产精品自产拍在线观看55亚洲| 淫妇啪啪啪对白视频| 日本 av在线| 亚洲一区高清亚洲精品| 男人舔奶头视频| 久久午夜亚洲精品久久| 日本黄色视频三级网站网址| 日韩高清综合在线| 国产精品免费视频内射| 人成视频在线观看免费观看| 超碰成人久久| 欧美日韩亚洲综合一区二区三区_| 日日夜夜操网爽| 香蕉av资源在线| 婷婷丁香在线五月| 欧美av亚洲av综合av国产av| 成人国语在线视频| 男女午夜视频在线观看| 精品熟女少妇八av免费久了| 国产一级毛片七仙女欲春2| 亚洲五月天丁香| 少妇熟女aⅴ在线视频| 天天添夜夜摸| netflix在线观看网站| 哪里可以看免费的av片| 看免费av毛片| АⅤ资源中文在线天堂| 日韩欧美国产在线观看| 久久99热这里只有精品18| 久久草成人影院| 婷婷精品国产亚洲av在线| 国产熟女午夜一区二区三区| 亚洲人成网站在线播放欧美日韩| 亚洲精华国产精华精| 天天一区二区日本电影三级| 亚洲九九香蕉| 亚洲国产日韩欧美精品在线观看 | 久久久久久久久免费视频了| 精品久久久久久久久久久久久| 久久精品91蜜桃| 最近最新中文字幕大全免费视频| 欧美极品一区二区三区四区| 国产精品亚洲一级av第二区| 免费看美女性在线毛片视频| 国产精品 欧美亚洲| 国产高清视频在线播放一区| 国产伦人伦偷精品视频| 麻豆成人午夜福利视频| tocl精华| 成年版毛片免费区| 亚洲人成77777在线视频| 亚洲人成网站高清观看| 精华霜和精华液先用哪个| 女警被强在线播放| 免费无遮挡裸体视频| 亚洲中文av在线| 亚洲第一电影网av| 亚洲精品在线观看二区| 香蕉国产在线看| 黄色毛片三级朝国网站| 香蕉av资源在线| 久久久久性生活片| 日本成人三级电影网站| or卡值多少钱| www.熟女人妻精品国产| 国产精品影院久久| 在线观看午夜福利视频| 9191精品国产免费久久| 国产蜜桃级精品一区二区三区| 日本一区二区免费在线视频| 国产黄片美女视频| 女生性感内裤真人,穿戴方法视频| 欧美极品一区二区三区四区| 动漫黄色视频在线观看| 舔av片在线| www.熟女人妻精品国产| 人人妻人人澡欧美一区二区| 久久午夜亚洲精品久久| 曰老女人黄片| 久久中文字幕人妻熟女| 亚洲欧洲精品一区二区精品久久久| www.自偷自拍.com| 两性夫妻黄色片| 99久久99久久久精品蜜桃| 国产主播在线观看一区二区| 国产激情久久老熟女| 国产一区二区在线观看日韩 | 亚洲精品色激情综合| 久久国产精品人妻蜜桃| 亚洲精品美女久久久久99蜜臀| 精品第一国产精品| 老汉色av国产亚洲站长工具| 国产精品野战在线观看| 舔av片在线| 久久精品国产综合久久久| 舔av片在线| 黑人操中国人逼视频| a级毛片a级免费在线| 亚洲av片天天在线观看| 亚洲九九香蕉| 又黄又爽又免费观看的视频| 国产精品久久视频播放| 亚洲精品在线美女| 日日干狠狠操夜夜爽| 久久人妻av系列| 91字幕亚洲| 国产精品 国内视频| 国产成人精品久久二区二区免费| 亚洲国产看品久久| bbb黄色大片| 亚洲一区二区三区不卡视频| 18禁国产床啪视频网站| 欧美丝袜亚洲另类 | 丰满人妻熟妇乱又伦精品不卡| 亚洲精品一区av在线观看| 禁无遮挡网站| 不卡av一区二区三区| 19禁男女啪啪无遮挡网站| 亚洲国产中文字幕在线视频| 又粗又爽又猛毛片免费看| 十八禁人妻一区二区| 免费在线观看完整版高清| 亚洲欧美激情综合另类| 亚洲精品一卡2卡三卡4卡5卡| 久久香蕉国产精品| 久久久精品大字幕| 琪琪午夜伦伦电影理论片6080| 亚洲av中文字字幕乱码综合| 亚洲人成77777在线视频| 久久久久免费精品人妻一区二区| 岛国在线免费视频观看| 变态另类成人亚洲欧美熟女| 欧美乱妇无乱码| 日韩欧美 国产精品| 欧美日韩福利视频一区二区| 国产男靠女视频免费网站| 国产精品亚洲av一区麻豆| 天天躁狠狠躁夜夜躁狠狠躁| 日本三级黄在线观看| 午夜免费观看网址| 人妻丰满熟妇av一区二区三区| 黄色视频不卡| 香蕉久久夜色| 大型av网站在线播放| 变态另类成人亚洲欧美熟女| 亚洲欧美日韩高清专用| 人人妻,人人澡人人爽秒播| 亚洲一区高清亚洲精品| 久久亚洲精品不卡| 精品久久久久久久久久免费视频| 亚洲国产欧美人成| 欧美乱色亚洲激情| 国产精品 国内视频| 全区人妻精品视频| 在线观看免费午夜福利视频| 村上凉子中文字幕在线| 欧美另类亚洲清纯唯美| 岛国视频午夜一区免费看| 99精品在免费线老司机午夜| 国产精品自产拍在线观看55亚洲| 成人国产综合亚洲| 男插女下体视频免费在线播放| 亚洲熟女毛片儿| 免费搜索国产男女视频| 日韩国内少妇激情av| 琪琪午夜伦伦电影理论片6080| 久久久久久久久免费视频了| 久久婷婷人人爽人人干人人爱| 最新美女视频免费是黄的| 变态另类丝袜制服| 成人永久免费在线观看视频| 精品久久久久久久末码| 999精品在线视频| 美女 人体艺术 gogo| 成人三级黄色视频| 伦理电影免费视频| 麻豆国产97在线/欧美 | 国产一区二区激情短视频| 欧美高清成人免费视频www| 亚洲av第一区精品v没综合| 国产精品免费视频内射| 欧美日韩一级在线毛片| 可以在线观看毛片的网站| 亚洲无线在线观看| 亚洲va日本ⅴa欧美va伊人久久| 亚洲五月天丁香| 国产一级毛片七仙女欲春2| 午夜激情福利司机影院| www日本黄色视频网| 一本精品99久久精品77| 亚洲无线在线观看| 欧美不卡视频在线免费观看 | 午夜福利在线在线| 亚洲国产中文字幕在线视频| 老汉色av国产亚洲站长工具| 无限看片的www在线观看| 夜夜爽天天搞| 12—13女人毛片做爰片一| 国产亚洲欧美98| 亚洲精品久久成人aⅴ小说| 91老司机精品| 免费看美女性在线毛片视频| 黑人巨大精品欧美一区二区mp4| 国产真实乱freesex| 久久人人精品亚洲av| 精品久久久久久成人av| 亚洲精品美女久久久久99蜜臀| 久久精品国产综合久久久| 99久久无色码亚洲精品果冻| 老汉色∧v一级毛片| 亚洲免费av在线视频| 99久久精品热视频| 99精品在免费线老司机午夜| 亚洲七黄色美女视频| 一边摸一边做爽爽视频免费| 狂野欧美白嫩少妇大欣赏| 一级a爱片免费观看的视频| 国产又黄又爽又无遮挡在线| 久久精品综合一区二区三区| 欧美精品啪啪一区二区三区| 午夜福利视频1000在线观看| 国产三级在线视频| 一本精品99久久精品77| 天天添夜夜摸| 黑人巨大精品欧美一区二区mp4| 亚洲成人久久爱视频| www日本黄色视频网| 村上凉子中文字幕在线| 亚洲国产精品久久男人天堂| 床上黄色一级片| 亚洲欧美日韩东京热| 十八禁人妻一区二区| 欧美又色又爽又黄视频| 欧美中文综合在线视频| 亚洲精品粉嫩美女一区| 亚洲最大成人中文| 欧美色视频一区免费| 日韩欧美精品v在线| 一本精品99久久精品77| 成在线人永久免费视频| 国产亚洲av高清不卡| 亚洲人成伊人成综合网2020| 男女做爰动态图高潮gif福利片| 日日摸夜夜添夜夜添小说| 欧美成人性av电影在线观看| 两个人的视频大全免费| 成熟少妇高潮喷水视频| 亚洲精品粉嫩美女一区| 免费无遮挡裸体视频| 欧美日韩一级在线毛片| 午夜a级毛片| 国产av麻豆久久久久久久| 国产成人精品无人区| 色哟哟哟哟哟哟| 久久精品国产99精品国产亚洲性色| 精品乱码久久久久久99久播| 国产成+人综合+亚洲专区| 男插女下体视频免费在线播放| 女人高潮潮喷娇喘18禁视频| 91大片在线观看| 国产精品av久久久久免费| 麻豆成人av在线观看| aaaaa片日本免费| 久久婷婷人人爽人人干人人爱| 一级毛片高清免费大全| 最近最新中文字幕大全免费视频| 一区二区三区高清视频在线| 美女扒开内裤让男人捅视频| 国产一区二区激情短视频| 国产黄片美女视频| 非洲黑人性xxxx精品又粗又长| 日韩欧美一区二区三区在线观看| 91在线观看av| 国产精华一区二区三区| 97人妻精品一区二区三区麻豆| 欧美一级a爱片免费观看看 | 身体一侧抽搐| 亚洲av电影不卡..在线观看| 国产一区二区在线av高清观看| 亚洲一区中文字幕在线| 狂野欧美白嫩少妇大欣赏| 少妇被粗大的猛进出69影院| 亚洲av片天天在线观看| 嫁个100分男人电影在线观看| 色在线成人网| 亚洲av成人精品一区久久| 日本免费a在线| 每晚都被弄得嗷嗷叫到高潮| 欧洲精品卡2卡3卡4卡5卡区| 90打野战视频偷拍视频| 熟女电影av网| 老司机午夜福利在线观看视频| 亚洲精品美女久久av网站| 国内精品一区二区在线观看| 欧美日韩福利视频一区二区| 国产精品久久久人人做人人爽| 韩国av一区二区三区四区| 久久性视频一级片| 巨乳人妻的诱惑在线观看| 黄色毛片三级朝国网站| 在线观看午夜福利视频| 日韩成人在线观看一区二区三区| 欧美最黄视频在线播放免费| 老鸭窝网址在线观看| 精品人妻1区二区| xxx96com| 亚洲av电影在线进入| 老司机深夜福利视频在线观看| 99久久无色码亚洲精品果冻| 黑人巨大精品欧美一区二区mp4| 给我免费播放毛片高清在线观看| 免费无遮挡裸体视频| 久久精品91无色码中文字幕| 日韩中文字幕欧美一区二区| 国产熟女午夜一区二区三区| 欧美又色又爽又黄视频| 色综合欧美亚洲国产小说| 午夜免费观看网址| 精品国内亚洲2022精品成人| 天天添夜夜摸| 成年版毛片免费区| 成年人黄色毛片网站| 亚洲精品在线观看二区| 欧美另类亚洲清纯唯美| 亚洲av美国av| 欧美高清成人免费视频www| 69av精品久久久久久| 亚洲电影在线观看av| bbb黄色大片| 99re在线观看精品视频| 欧美久久黑人一区二区| 国产精品九九99| 欧美精品啪啪一区二区三区| 亚洲五月婷婷丁香| 国产三级中文精品| 熟女少妇亚洲综合色aaa.| 亚洲成人国产一区在线观看| 欧美成人性av电影在线观看| 国产精品一区二区精品视频观看| 国产成人一区二区三区免费视频网站| 欧美黄色片欧美黄色片| 老熟妇乱子伦视频在线观看|