高嘉偉,劉濱,韓峰,翟雨茜,賈嘉
(國(guó)網(wǎng)天津市電力公司營(yíng)銷服務(wù)中心,天津 300120)
農(nóng)電服務(wù)渠道主要包括線下營(yíng)業(yè)廳、郵儲(chǔ)銀行、超市網(wǎng)點(diǎn),以及線上的網(wǎng)上國(guó)網(wǎng)、支付寶、微信等渠道,農(nóng)電用戶包括農(nóng)村地區(qū)的居民用電、家庭農(nóng)場(chǎng)及規(guī)模種植戶用電、養(yǎng)殖戶用電、村辦企業(yè)用電、灌溉用電等。因?yàn)檗r(nóng)村地區(qū)的用電用戶分布范圍較廣,單用戶用電量較少,所以關(guān)鍵用戶的用電量是農(nóng)電系統(tǒng)的主要利潤(rùn)來(lái)源。農(nóng)電服務(wù)過(guò)程中,優(yōu)選出優(yōu)勢(shì)用戶并對(duì)其用電特征進(jìn)行分析,同時(shí)優(yōu)化智能服務(wù)渠道,以提升用電市場(chǎng)的營(yíng)銷效率。
粒子群算法又稱作PSO算法,是利用模型化的粒子在數(shù)學(xué)投影空間中的移動(dòng)過(guò)程對(duì)數(shù)據(jù)進(jìn)行歸類分析的常用算法。農(nóng)電用戶的GIS地理坐標(biāo)、電表戶ID、歷史用電量記錄等數(shù)據(jù),構(gòu)成農(nóng)電營(yíng)銷渠道數(shù)據(jù)的基礎(chǔ)。GIS地理坐標(biāo)指在地球地理信息數(shù)據(jù)庫(kù)(GIS)上對(duì)用戶的電表安裝位置進(jìn)行標(biāo)記的數(shù)據(jù),包括其經(jīng)緯度坐標(biāo)(一般采用GB2000坐標(biāo)系)。對(duì)上述數(shù)據(jù)進(jìn)行分析,可以得到其粒子群的基函數(shù)如公式(1):
式(1)中:Xi(t)為第i個(gè)輸入數(shù)據(jù)在第t個(gè)變化周期內(nèi)的表現(xiàn);Vi(t)為第i個(gè)輸入數(shù)據(jù)在第t個(gè)變化周期內(nèi)的修正系數(shù),如公式(2):
式(2)中:w代表粒子移動(dòng)速度,也控制著迭代效率,當(dāng)w=0.4時(shí),粒子迭代效率最高;此時(shí)設(shè)定迭代條件如公式(3):
當(dāng)式(3)中條件滿足時(shí),認(rèn)為數(shù)據(jù)迭代已經(jīng)完成。不同w值時(shí)的PSO算法收斂曲線如圖1所示。
圖1 不同w值時(shí)的PSO算法收斂曲線
圖1中,使用常規(guī)PSO算法的條件下,粒子群的收斂過(guò)程在不同w值的驅(qū)動(dòng)下并不穩(wěn)定,且因?yàn)閷?duì)農(nóng)電用戶數(shù)字化模型的構(gòu)建過(guò)程無(wú)法從邏輯上確認(rèn)w值的營(yíng)銷學(xué)含義,所以需要對(duì)PSO算法進(jìn)行進(jìn)一步優(yōu)化,以實(shí)現(xiàn)更高的數(shù)據(jù)收斂效率。本文方案是在其中加入收斂因子的方式對(duì)PSO算法進(jìn)行強(qiáng)制收斂,加速其收斂過(guò)程,增加模型的統(tǒng)計(jì)學(xué)穩(wěn)定性。
收斂因子的表達(dá)式如公式(4):
公式(4)為公式(2)的增強(qiáng)版,使用公式(4)取代公式(2),即在公式(2)的基礎(chǔ)上引入收斂因子φ,其表達(dá)式如公式(5):
式(5)中:C 為修正系數(shù),C=c1+c2,C>4;
對(duì)PSO算法使用此改進(jìn)策略后,其改進(jìn)PSO算法的收斂曲線圖如圖2所示。
圖2 改進(jìn)PSO算法的收斂曲線圖
圖2中2~3次迭代后,數(shù)據(jù)基本實(shí)現(xiàn)收斂,較圖1中10次左右迭代才發(fā)生完全收斂的效果進(jìn)行比對(duì),改進(jìn)算法的計(jì)算效率顯著提升。
在農(nóng)電營(yíng)銷渠道數(shù)據(jù)的分析需求目標(biāo)下,發(fā)現(xiàn)需要重點(diǎn)服務(wù)的優(yōu)勢(shì)用戶,即擁有穩(wěn)定大負(fù)荷的用電用戶,以及發(fā)現(xiàn)出現(xiàn)用電問(wèn)題的用電用戶,包括竊電用戶和電表故障用戶等,均是該分析過(guò)程的目標(biāo)。所以使用上述改進(jìn)粒子群算法,以某縣區(qū)農(nóng)電公司實(shí)際服務(wù)的2.8萬(wàn)戶農(nóng)電用戶在2018年1月至2019年12月的實(shí)際用電量數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)進(jìn)行試分析,分析平臺(tái)為構(gòu)建在MySQL數(shù)據(jù)庫(kù)平臺(tái)上的Python數(shù)據(jù)分析軟件。
傳統(tǒng)優(yōu)勢(shì)用戶的篩選方法是利用Excel軟件對(duì)用戶用電數(shù)據(jù)求取均值,然后對(duì)均值進(jìn)行倒序排序,選出用電負(fù)荷最高的前100名用戶;傳統(tǒng)PSO算法是利用上述公式(1)(2)(3)描述的粒子群算法,對(duì)優(yōu)勢(shì)用電用戶進(jìn)行篩選,最終獲得充分迭代收斂后的高負(fù)荷用戶數(shù)據(jù)群;改進(jìn)PSO算法是指使用上述加速收斂因子后的數(shù)據(jù)分析算法。比較項(xiàng)目中最小負(fù)荷是指2年考察期內(nèi)選入優(yōu)勢(shì)用戶的用電負(fù)荷最小用戶的平均用電負(fù)荷,平均負(fù)荷指2年考察期內(nèi)選入優(yōu)勢(shì)用戶的全部用戶的平均用電負(fù)荷;標(biāo)準(zhǔn)偏差率指計(jì)算平均負(fù)荷時(shí)的標(biāo)準(zhǔn)偏差率計(jì)算結(jié)果。詳見(jiàn)表1。
表1 優(yōu)勢(shì)用戶篩選效果
表1中,傳統(tǒng)PSO算法和改進(jìn)PSO算法的數(shù)據(jù)篩選效率均高于傳統(tǒng)的排序法獲得的數(shù)據(jù)量。其核心原因?yàn)镻SO算法在計(jì)算過(guò)程中幾乎不丟失用戶特征信息,而排序法在求取用戶用電均值時(shí),會(huì)丟失大量的用戶用電細(xì)節(jié)信息。而改進(jìn)PSO算法較傳統(tǒng)PSO算法主要有以下特征:①后者篩選用戶量遠(yuǎn)小于前者,標(biāo)志其篩選容忍度更低;②入選用戶的最小負(fù)荷和平均負(fù)荷遠(yuǎn)大于前者,標(biāo)志著其選入用戶的用電負(fù)荷更高;③標(biāo)準(zhǔn)偏差率更小,標(biāo)志著其入選用戶的特異化特征不明顯。
電力營(yíng)銷數(shù)據(jù)分析過(guò)程中,發(fā)現(xiàn)竊電及電表故障,是保障供需雙方合法利益、提升服務(wù)效率和企業(yè)窗口形象、實(shí)現(xiàn)更高的電力大營(yíng)銷管理效能的有效途徑。特別是有效區(qū)分竊電行為和電表故障,可以有效避免電力營(yíng)銷過(guò)程影響農(nóng)電公司形象的重要分析需求點(diǎn)。
如表2所示的發(fā)現(xiàn)量指數(shù)據(jù)分析中發(fā)現(xiàn)竊電行為和電表故障的例數(shù),發(fā)現(xiàn)周期指數(shù)據(jù)分析中竊電行為或電表故障發(fā)生后,數(shù)據(jù)分析結(jié)果展現(xiàn)出明確數(shù)據(jù)特征的時(shí)間,單位為月。
表2 問(wèn)題用戶篩選效果
表2中改進(jìn)PSO算法對(duì)竊電行為和電表故障的發(fā)現(xiàn)量顯著高于傳統(tǒng)PSO算法,其中對(duì)竊電行為的發(fā)現(xiàn)量達(dá)到1.5倍,電表故障的發(fā)現(xiàn)量達(dá)到2.3倍,且改進(jìn)PSO算法的發(fā)現(xiàn)周期顯著短于傳統(tǒng)PSO算法。
引入收斂因子的改進(jìn)PSO算法并非單純從粒子群數(shù)據(jù)迭代收斂效率上高于傳統(tǒng)PSO算法,其實(shí)際的數(shù)據(jù)應(yīng)用端表現(xiàn)也顯著優(yōu)于后者。其中表現(xiàn)在對(duì)優(yōu)勢(shì)用戶和問(wèn)題用戶的數(shù)據(jù)特征提取方面,改進(jìn)PSO算法表現(xiàn)出較強(qiáng)的數(shù)據(jù)挖掘結(jié)果可用性。同時(shí),與傳統(tǒng)的基于Excel軟件系統(tǒng)的數(shù)據(jù)排序法相比,傳統(tǒng)PSO算法和改進(jìn)PSO算法均表達(dá)出數(shù)據(jù)適應(yīng)性。