摘要:常規(guī)的電力營銷數(shù)據(jù)集群融合方法以數(shù)據(jù)分類為主,存在忽視數(shù)據(jù)一致性的問題,融合后的數(shù)據(jù)出現(xiàn)數(shù)據(jù)冗余現(xiàn)象。因此,文章設(shè)計了基于大數(shù)據(jù)分析的電力營銷數(shù)據(jù)集群融合方法,基于大數(shù)據(jù)分析構(gòu)建營銷數(shù)據(jù)集群融合模型,將電力營銷數(shù)據(jù)進(jìn)行歸一化處理,縮小數(shù)據(jù)區(qū)間分布范圍,使數(shù)據(jù)集群融合更加高效。計算電力營銷數(shù)據(jù)集群并行融合粒度,將集群融合營銷數(shù)據(jù)重疊的問題考慮在內(nèi),實現(xiàn)更加理想的融合模式。對比實驗證明該方法的集群融合效果更佳。
關(guān)鍵詞:大數(shù)據(jù)分析;電力營銷;營銷數(shù)據(jù);數(shù)據(jù)集群;數(shù)據(jù)融合
中圖分類號:TP391" 文獻(xiàn)標(biāo)志碼:A
0 引言
電力營銷數(shù)據(jù)較為復(fù)雜且數(shù)據(jù)量較大,數(shù)據(jù)集群融合,能夠提高數(shù)據(jù)處理效率,增強電力營銷數(shù)據(jù)的可用性。針對電力營銷數(shù)據(jù)集群問題,研究人員設(shè)計了多種融合方法。其中,陶迎松[1]提出了基于X-means優(yōu)化聚類的電力營銷數(shù)據(jù)集群融合方法,主要是利用X-means確定最佳的聚類數(shù)量,有效地處理大規(guī)模電力營銷數(shù)據(jù),從而提高融合效果。然而,該方法在復(fù)雜數(shù)據(jù)處理方面能力有限,X-means算法無法捕捉數(shù)據(jù)內(nèi)在特征,影響集群融合效果。王志成等[2]提出了基于CIM和動態(tài)交通分析的電力營銷數(shù)據(jù)集群融合方法,主要是利用共同信息模型整合電力營銷數(shù)據(jù)結(jié)構(gòu),再通過動態(tài)交通分析技術(shù)分析電力需求,確定電力營銷數(shù)據(jù)的動態(tài)變化規(guī)律,從而實現(xiàn)數(shù)據(jù)集群高效融合。但是,該方法對數(shù)據(jù)質(zhì)量要求較高,一旦出現(xiàn)數(shù)據(jù)冗余問題,將會影響最終的融合效果。因此,本文結(jié)合大數(shù)據(jù)分析的優(yōu)勢,設(shè)計了電力營銷數(shù)據(jù)集群融合方法。
1 電力營銷大數(shù)據(jù)集群融合方法設(shè)計
1.1 基于大數(shù)據(jù)分析構(gòu)建營銷數(shù)據(jù)集群融合模型
大數(shù)據(jù)分析是針對大規(guī)模數(shù)據(jù)進(jìn)行分析的過程。通過分析數(shù)據(jù)量、速度、類型、價值、真實性,能夠提取出電力營銷有效數(shù)據(jù),從而提高集群融合的準(zhǔn)確性[3]。將電力營銷數(shù)據(jù)進(jìn)行歸一化處理,縮小數(shù)據(jù)區(qū)間分布范圍,使數(shù)據(jù)集群融合更加高效。在電力營銷數(shù)據(jù)集群融合過程中,數(shù)據(jù)以非線性特征為主,輸入輸出值對集群融合結(jié)果存在一定影響。將電力營銷數(shù)據(jù)的各屬性值歸一化處理,轉(zhuǎn)換為標(biāo)準(zhǔn)輸入與輸出,從而確保最終融合的準(zhǔn)確性[4]。在數(shù)據(jù)處理過程中引入激勵函數(shù),調(diào)節(jié)數(shù)據(jù)集群的權(quán)值,公式如下:
Pi=x+y(pi-minpi)/(maxpi-minpi)(1)
其中,Pi為第i類電力營銷數(shù)據(jù)集群的歸一化處理結(jié)果;x為數(shù)據(jù)層輸出數(shù)據(jù);y為激勵函數(shù);pi為待輸入數(shù)據(jù);minpi、maxpi分別為融合模型中待輸入數(shù)據(jù)的最小、最大值。將電力營銷數(shù)據(jù)按照融合層次分類,每個層次存在多個融合節(jié)點。一個集群存在的融合節(jié)點數(shù)量表示為:
n′=n+m+aPi(2)
其中,n′為一個集群存在的融合節(jié)點數(shù)量;n為集群融合層次;m為決策層輸出的融合節(jié)點數(shù)量。在數(shù)據(jù)層、特征層、決策層中的數(shù)據(jù)融合過程中,通過y能夠決定集群融合效果。y連續(xù)可靠,反映輸入數(shù)據(jù)與輸出數(shù)據(jù)的映射關(guān)系。當(dāng)n′較多時,電力營銷數(shù)據(jù)類別較多,通過傳遞函數(shù)深入分析集群內(nèi)的營銷數(shù)據(jù),避免出現(xiàn)數(shù)據(jù)冗余問題[5]。激勵函數(shù)表示為:
y=11+e-x(3)
其中,e為底數(shù)。在(x,y)區(qū)間內(nèi),電力營銷數(shù)據(jù)集群的輸入、輸出滿足線性關(guān)系,能夠達(dá)到數(shù)據(jù)準(zhǔn)確融合的目的。大數(shù)據(jù)分析能夠根據(jù)激勵函數(shù)的激勵,獲取電力營銷數(shù)據(jù)集群融合的最優(yōu)權(quán)值,在非線性逼近、學(xué)習(xí)精度、計算速度等方面,均能夠符合電力營銷數(shù)據(jù)集群融合對大數(shù)據(jù)分析的實時性要求。在(x,y)區(qū)間內(nèi),y=1,閾值為0,構(gòu)建電力營銷數(shù)據(jù)集群融合模型,公式如下:
E=12∑mi=1y-∑n-1x=0wpψp(Pi)(4)
其中,E為電力營銷數(shù)據(jù)集群融合模型表達(dá)式;wp為電力營銷數(shù)據(jù)集群融合的最優(yōu)權(quán)值;ψp為激勵矩陣。在集群融合過程中,大數(shù)據(jù)分析包括5個V,分別為Volume、Velocity、Variety、Value、Veracity。根據(jù)5V特征,形成一個完整的E結(jié)構(gòu)。將輸入pi設(shè)定為多維數(shù)組,對應(yīng)營銷數(shù)據(jù)的各個屬性參數(shù)。當(dāng)x=1時,n′=1,此時集群融合完成,能夠根據(jù)集群情況規(guī)劃后續(xù)決策。當(dāng)x>1時,n′>1,此時集群融合節(jié)點相對較多,融合效果不佳,重復(fù)上述步驟,直至n′=1,滿足集群融合需求。
1.2 計算電力營銷數(shù)據(jù)集群并行融合粒度
電力營銷數(shù)據(jù)集群融合就是在一個集群內(nèi),并行融合、處理數(shù)據(jù)的過程,能夠?qū)⒏黝悢?shù)據(jù)通過合理劃分、分配,形成有效的數(shù)據(jù)集,為后續(xù)決策提供保障[5-6]。本文將集群融合營銷數(shù)據(jù)重疊的問題考慮在內(nèi),在n′=1條件下,對E融合粒度進(jìn)行計算,實現(xiàn)更加理想的融合模式。融合冗余分析模式如圖1所示。
一次融合的開銷遠(yuǎn)遠(yuǎn)大于一次并行計算的開銷。通過并行融合的方式,降低融合開銷,找出融合重疊區(qū)域,從而提高集群融合效率。在集群融合時,并行融合粒度表示為:
Sij=1r∑rn=1δ(ψp(E))(5)
其中,Sij為電力營銷i、j類數(shù)據(jù)并行融合粒度;r為同一類營銷數(shù)據(jù)的融合次數(shù);δ為共識函數(shù)。各個并行部分為異步執(zhí)行的狀態(tài),只要降低融合次數(shù),調(diào)整δ,就能夠提高并行融合粒度,從而實現(xiàn)高效率的集群融合。并行融合的電力營銷數(shù)據(jù),具有遠(yuǎn)距離、低功耗、少節(jié)點、低成本的特性,通過并行融合粒度的調(diào)整,可以增強數(shù)據(jù)集群融合的高效性,真正意義上實現(xiàn)電力營銷數(shù)據(jù)的準(zhǔn)確融合。
2 實驗
2.1 實驗過程
本次實驗在實驗室內(nèi)進(jìn)行,數(shù)據(jù)集群融合環(huán)境由8個普通電腦設(shè)備連接內(nèi)部交換機,搭建成電力營銷數(shù)據(jù)局域網(wǎng)。8臺設(shè)備作為8個節(jié)點,8個節(jié)點共同形成一個集群,能夠滿足本次實驗需求。采用Linux操作系統(tǒng),通過MPI實現(xiàn)MPICH2-1.0.4,以并行融合的方式,提高集群融合效率。通過大數(shù)據(jù)分析技術(shù),將集群1—8的數(shù)據(jù)進(jìn)行歸一化處理,提高集群融合效率。本次實驗數(shù)據(jù)采用UCI提供的經(jīng)典電力營銷數(shù)據(jù)集,分為setosa、versicolor和virginica 3個類別。在營銷數(shù)據(jù)集群融合過程中,通過AUC-ROC的值判斷集群融合模型的泛化能力。在上述實驗條件下,本文隨機選取12組電力營銷數(shù)據(jù)類別,分別分析了集群融合的泛化能力、數(shù)據(jù)處理能力。
2.2 實驗結(jié)果
對比方法為基于X-means的優(yōu)化聚類融合方法(方法1)、基于CIM和動態(tài)交通分析的融合方法(方法2),結(jié)果如表1所示。
如表1所示,使用本文方法后,AUC-ROC值在0.95以上,并行融合粒度在240條/s以上,集群融合時間在20 s以內(nèi),融合后資源利用率在95%以上,均優(yōu)于其他方法。
3 結(jié)語
本文利用大數(shù)據(jù)分析,設(shè)計了電力營銷數(shù)據(jù)集群融合方法,從融合層次、融合模型、并行融合等方面,分析客戶行為,為客戶提供更具個性化的電力服務(wù)。通過建立大數(shù)據(jù)多維度融合模型,能夠統(tǒng)一各個集群的電力營銷數(shù)據(jù)格式,提高數(shù)據(jù)分析的準(zhǔn)確性。利用數(shù)據(jù)可視化技術(shù),將融合后的電力營銷數(shù)據(jù)呈現(xiàn)出來,幫助電力企業(yè)做出更正確的決策。
參考文獻(xiàn)
[1]陶迎松.云計算環(huán)境下基于X-means優(yōu)化聚類的海量多源異構(gòu)數(shù)據(jù)分類[J].北部灣大學(xué)學(xué)報,2024(2):40-46.
[2]王志成,張玉一,巴天星,等.面向CIM和動態(tài)交通分析的多源異構(gòu)數(shù)據(jù)融合技術(shù)研究[J].電子設(shè)計工程,2024(8):68-72.
[3]郭麗,孫華.基于K-means和支持向量機SVM的電力數(shù)據(jù)通信網(wǎng)絡(luò)流量分類方法[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2024(4):64-66.
[4]葉旺,梁健釗,吳天磊.基于樸素貝葉斯算法的電力數(shù)據(jù)合規(guī)風(fēng)險智能監(jiān)督方法[J].電腦編程技巧與維護(hù),2024(2):113-116.
[5]奚增輝,王衛(wèi)斌,屈志堅,等.基于電力大數(shù)據(jù)的行業(yè)發(fā)展監(jiān)測方法研究[J].自動化技術(shù)與應(yīng)用,2024(1):170-173.
[6]陳艷霞,李鑫明,王志勇,等.基于LSTM-CNN-Attention模型的電力設(shè)施非周期巡視決策方法[J].計算機應(yīng)用,2023(增刊2):291-297.
(編輯 沈 強編輯)
Power marketing data cluster fusion method based on big data analysis
JIANG" Tianming
(Sichuan Kelide Power Communication Technology Co., Ltd., Chengdu 610000, China)
Abstract:" The conventional method of integrating power marketing data clusters mainly focuses on data classification, neglecting the issue of data consistency, resulting in data redundancy in the fused data. Therefore, a data cluster fusion method for power marketing based on big data analysis is designed. The article builds a marketing data cluster fusion model based on big data analysis, normalizing power marketing data, narrowing the distribution range of data intervals, and making data cluster fusion more efficient. It calculates the parallel fusion granularity of power marketing data clusters, taking into account the issue of overlapping marketing data in cluster fusion, to achieve a more ideal fusion mode. Through comparative experiments, it is verified that the cluster fusion effect of this method is better.
Key words: big data analysis; power marketing; marketing data; data cluster; data fusion