張 智,王韻楚,林振智,馬愿謙,盧 峰,楊 莉
(1.浙江大學(xué)電氣工程學(xué)院,浙江省杭州市 310027;2.國網(wǎng)遼寧省電力有限公司電力科學(xué)研究院,遼寧省沈陽市 110055;3.浙江理工大學(xué)信息科學(xué)與工程學(xué)院,浙江省杭州市 310018)
新一輪電力體制改革以來,中國電力市場開放程度不斷加深。2021 年,國家發(fā)改委發(fā)布《關(guān)于進(jìn)一步深化燃煤發(fā)電上網(wǎng)電價市場化改革的通知》[1],要求有序推動工商業(yè)用戶全部進(jìn)入電力市場,加快培育合格售電主體。競爭性電力市場中,用戶選擇權(quán)的放開催生了各具特色的零售電價套餐[2],相關(guān)學(xué)者也從用戶的用能特性[3]、需求響應(yīng)[4]與購電決策[5-6]等角度對電力零售套餐設(shè)計開展了廣泛研究。然而,從國外電力市場運營經(jīng)驗來看,過于復(fù)雜和多樣化的零售套餐也給用戶帶來了理解上的困難,影響了用戶尋找更優(yōu)套餐的積極性。
電力套餐推薦作為一種雙贏的售電公司增值服務(wù),能夠破解用戶尋求售電代理過程中的售電公司繁多、電費機(jī)制復(fù)雜等問題,同時幫助售電公司提高用戶黏性、吸引潛在用戶,正成為電力零售市場的研究熱點?,F(xiàn)有電力套餐推薦方法多采用“用戶特征提取-相似用戶判定-套餐評分預(yù)測-電力套餐推薦”的協(xié)同過濾(collaborative filtering,CF)邏輯結(jié)構(gòu)。例如,文獻(xiàn)[7]提出了基于差異化特征提取的用戶分層聚類方法,按用戶用能水平與用電行為是否多變對其進(jìn)行分類,為不同類型用戶定向推送套餐。文獻(xiàn)[8]設(shè)計了基于加權(quán)遞增項目覆蓋率的用戶特征子集篩選算法,以用戶對套餐的已知評分判定用戶相似性,進(jìn)而采用協(xié)同過濾推薦算法在特征子集內(nèi)預(yù)測目標(biāo)用戶對套餐的評分。文獻(xiàn)[9]考慮用戶對套餐容量電價、峰谷電價等不同屬性的偏好,提出了基于用戶行業(yè)負(fù)荷特征和多屬性效用的電力套餐混合推薦方法。文獻(xiàn)[10]以用戶在不同季節(jié)與工作日/非工作日的用電量構(gòu)建用戶畫像,采用模糊C均值法對用戶進(jìn)行分類,將相似用戶購買頻次最高的套餐推薦給目標(biāo)用戶。相比之下,文獻(xiàn)[11]提出了基于負(fù)荷特征標(biāo)簽與雙層鄰近傳播聚類的相似用戶判別方法,采用多粒度猶豫模糊語言集與差異化權(quán)重模型量化用戶對套餐多屬性的評價信息,為目標(biāo)用戶推薦綜合滿意度最大的電力套餐。文獻(xiàn)[12]以家用電器使用時長作為居民用戶的用電特征,根據(jù)相似用戶的套餐價格評分為目標(biāo)用戶推薦電力套餐;在此基礎(chǔ)上,文獻(xiàn)[13]提出了基于貝葉斯混合協(xié)同過濾的套餐推薦方法,采用貝葉斯概率矩陣分解算法應(yīng)對用戶家用電器使用數(shù)據(jù)缺失的問題??梢?現(xiàn)有研究多以用電量、電器使用信息或套餐評分提取用戶特征。然而,根據(jù)國家發(fā)改委和能源局印發(fā)的《售電公司管理辦法》[14],售電公司獲得代理用戶授權(quán)后方可查詢其歷史用電數(shù)據(jù)。對潛在電力客戶,考慮到數(shù)據(jù)隱私與用戶意愿,售電公司獲取其歷史用電數(shù)據(jù)或用戶對特定套餐的顯式評分存在現(xiàn)實難度。如何通過用戶方便提供的數(shù)據(jù)信息發(fā)掘其負(fù)荷需求與消費偏好,已成為售電公司在套餐推薦過程中亟須解決的問題。
對此,本文提出了基于套餐隱式評分與用戶畫像的電力套餐推薦方法。首先,以套餐特征標(biāo)簽與用戶的套餐歷史購買行為表征其消費偏好,構(gòu)建計及偏好衰減的用戶-套餐標(biāo)簽畫像模型。然后,以皮爾遜相關(guān)系數(shù)和歐氏距離表征用戶的分時負(fù)荷和總負(fù)荷水平特征,提出基于雙尺度負(fù)荷聚類與輪廓系數(shù)(silhouette coefficient,SC)的套餐標(biāo)簽差異化賦權(quán)方法,量化套餐標(biāo)簽與用戶負(fù)荷的關(guān)聯(lián)關(guān)系。在此基礎(chǔ)上,構(gòu)建基于加權(quán)歐氏距離與標(biāo)簽畫像的用戶相似度評價模型,根據(jù)相似用戶的負(fù)荷數(shù)據(jù)預(yù)估目標(biāo)用戶的套餐電費,實現(xiàn)電力套餐的協(xié)同過濾推薦。
國外電力零售市場的網(wǎng)上售電平臺或套餐比價網(wǎng)站多以標(biāo)簽的形式對零售套餐進(jìn)行標(biāo)記。如英國售電公司Scottish Power 推出的Green-Fixed 套餐在比價網(wǎng)站上標(biāo)有固定電能價格、無退出費以及100%綠色能源等標(biāo)簽[15]。美國得州電力市場用戶通過網(wǎng)上平臺Powertochoose[16]查詢不同套餐的電力事實標(biāo)簽(electricity fact label,EFL),并獲得詳細(xì)的套餐各項屬性。部分典型電力套餐特征標(biāo)簽如表1 所示。
表1 典型電力套餐特征對比Table 1 Comparison of features of typical electricity plans
考慮到用戶的套餐購買行為受套餐電能價格、售電公司轉(zhuǎn)換成本、用戶環(huán)保偏好與套餐品牌效應(yīng)等因素的影響[17],本文從如下6 個維度提取套餐特征標(biāo)簽:
1)定價方式標(biāo)簽:以美國得州電力市場為例,套餐定價方式一般包括固定費率、可變費率和指數(shù)費率3 種模式。固定費率套餐適用于季節(jié)性用電量差異較大且電價波動承受能力較低的用戶;可變費率套餐多為短期套餐,電能價格呈月度變化;指數(shù)費率套餐則較為少見。例如,美國休斯敦某區(qū)域用戶可選擇的174 種套餐中,固定費率套餐達(dá)152 種,其余均為可變費率套餐。
2)分時價格標(biāo)簽:根據(jù)峰谷時段的電能價格差異可將固定或可變費率套餐進(jìn)一步劃分為分時電價(time-of-use price,TOU)和統(tǒng)一電價套餐兩類,部分實行夜間或周末用電折扣的統(tǒng)一電價套餐,如東京電力公司實行的周末優(yōu)惠套餐[18],也可視作分時電價套餐。對可靈活調(diào)整生產(chǎn)安排或折扣時段負(fù)荷水平較高的用戶,選擇分時電價套餐更為經(jīng)濟(jì)。
3)平均電價標(biāo)簽:用戶在給定電力套餐下的平均電價與其用電量、峰谷時段價格、輸配電費和固定電費等屬性相關(guān),是影響用戶的套餐購買意愿的關(guān)鍵因素。考慮到不同電力套餐在定價方式、分時價格和固定電費等屬性上的差異,套餐比價網(wǎng)站多以500、1 000、2 000 kW·h 等典型用電量分檔下的套餐預(yù)期平均電價為標(biāo)簽,向用戶展示不同套餐的經(jīng)濟(jì)性差異,如表1 所示。對同一電力套餐,其預(yù)期平均電價隨用戶用電量的變化而變化,因而可從用戶的套餐歷史購買行為中發(fā)掘用戶的用電需求。
4)綠電比例標(biāo)簽:全球“碳達(dá)峰?碳中和”的發(fā)展目標(biāo)提升了用戶的可再生能源電力使用意愿與需求,例如制造業(yè)用戶可通過獲取“綠色電力”標(biāo)簽達(dá)到產(chǎn)品標(biāo)準(zhǔn)或提高品牌溢價,擴(kuò)大市場份額。為此,售電公司提供的電力套餐通常承諾不同比例的可再生能源電能份額以吸引用戶,以提供零碳、無污染綠色電力為主旨的售電公司更是提供100%可再生能源套餐以滿足特定用戶的消費需求。套餐綠電比例正成為影響用戶購買決策的重要因素。
5)退出費標(biāo)簽:為保障自身的合理收益、提高市場占有率,售電公司普遍為長周期的固定費率套餐設(shè)定套餐退出費。例如,美國YEP Energy 公司為其固定費率套餐設(shè)定了175 美元的套餐退出費;TXU Energy 公司按套餐的合同周期設(shè)定退出費,3 年期固定費率套餐的退出費最高可達(dá)395 美元。用戶購買的套餐的退出費越高,其合同周期內(nèi)的套餐轉(zhuǎn)換意愿越低。套餐退出費既反映了用戶對售電公司或套餐屬性的認(rèn)可程度,也反映了該用戶的消費惰性。
6)售電公司排名:售電公司品牌效應(yīng)引發(fā)的信任感知是用戶選擇不同售電公司的重要影響因素。對此,套餐比價網(wǎng)站Energyhelpline 提供知名供應(yīng)商“Big Name Suppliers”選項供用戶篩選套餐,網(wǎng)上售電平臺Powertochoose 則按半年內(nèi)用戶的投訴情況對售電公司進(jìn)行星級排名,排名靠前的售電公司提供的電力套餐更容易獲得小型工商業(yè)和居民用戶的青睞。此外,電力套餐付費方式、合同周期等屬性也可對用戶的套餐購買行為產(chǎn)生影響。為簡化模型且不失一般性,本文中僅以上述套餐標(biāo)簽構(gòu)建用戶畫像模型。
用戶畫像是根據(jù)用戶人口屬性、行為習(xí)慣和興趣偏好等信息抽象出的標(biāo)簽化的用戶模型,可用于提供個性化服務(wù),如信息推送、購物推薦等[19]。用戶歷史購買的消費品屬性特征能夠反映其需求與偏好[20],因而在電力套餐推薦領(lǐng)域,通過套餐特征標(biāo)簽構(gòu)建用戶畫像具有可行性。
套餐推薦系統(tǒng)可通過顯式評分和隱式評分兩種方式獲取用戶對套餐屬性的偏好信息,建立基于套餐標(biāo)簽的用戶畫像。顯式評分通過對用戶的問卷調(diào)查獲取其對套餐屬性/標(biāo)簽的評分,結(jié)果解釋性較強(qiáng),但實際中用戶通常不愿意花費時間與精力提供反饋[21];相比之下,隱式評分是指用戶對套餐的購買、點擊、收藏等實際行為[22],更容易被售電公司獲取并用于用戶消費偏好辨識。因此,本文以用戶歷史套餐購買行為衡量其對套餐屬性的偏好,通過可量化評分的套餐標(biāo)簽構(gòu)建用戶畫像。
套餐標(biāo)簽可按數(shù)據(jù)類型分為標(biāo)稱型、數(shù)值型和序數(shù)型[9]。為使所構(gòu)建基于套餐特征標(biāo)簽的用戶畫像具備可比性,首先采用標(biāo)準(zhǔn)化評分的方式對不同數(shù)據(jù)類型的標(biāo)簽進(jìn)行預(yù)處理。數(shù)值型套餐標(biāo)簽可劃分為成本型和效益型兩類:成本型標(biāo)簽的值越小越有利,如套餐平均電價與退出費;綠電比例等效益型標(biāo)簽則與之相反。因此,對數(shù)值-成本型標(biāo)簽j按標(biāo)簽值進(jìn)行標(biāo)準(zhǔn)化的表達(dá)式為:
標(biāo)稱型標(biāo)簽僅有0-1 兩種狀態(tài),固定費率、統(tǒng)一電價標(biāo)簽評分取Lmin,可變費率、分時電價標(biāo)簽評分取Lmax。序數(shù)型標(biāo)簽如售電公司排名等,可按比價網(wǎng)站提供的星級評分等比例計算得到。
用戶u在n個可選套餐中購買套餐i,則其獲得套餐i對應(yīng)標(biāo)簽j的標(biāo)準(zhǔn)化評分。根據(jù)用戶的套餐歷史購買行為,其獲取套餐標(biāo)簽j的累計評分越高,表明該用戶偏好套餐對應(yīng)屬性的可信度越高。在此基礎(chǔ)上,考慮到零售市場初期用戶對套餐的認(rèn)知變化與消費偏好轉(zhuǎn)變[23],構(gòu)建計及偏好隨時間衰減的用戶-套餐標(biāo)簽畫像模型,表示為:
式中:Pu,j為用戶u標(biāo)簽j的畫像評分;Te為用戶提供的套餐歷史購買信息數(shù);hi,u,t為0-1 變量,表示用戶u在第t次購買套餐時對套餐i的購買決策,hi,u,t=1表示用戶u當(dāng)次購買套餐i;Li,j為套餐i標(biāo)簽j的標(biāo)準(zhǔn)化評分;β為用戶偏好的時間衰減系數(shù),β≥0 且β越大表明用戶近期的套餐購買行為對用戶畫像的重要性越高。
式(3)考慮了用戶在不同時期購買相同套餐時所獲套餐標(biāo)簽評分的差異性,從而避免用戶當(dāng)前的負(fù)荷需求或消費偏好被早期的套餐購買行為所掩蓋,實現(xiàn)了套餐歷史購買信息數(shù)量與質(zhì)量的平衡。
本文所提基于協(xié)同過濾的套餐推薦方法通過用戶群體的畫像匹配發(fā)掘目標(biāo)用戶的用電偏好,進(jìn)而篩選出最優(yōu)套餐完成推薦。所述方法包括套餐推薦模型的離線構(gòu)建與目標(biāo)用戶的套餐在線推薦兩個階段,如圖1 所示。
圖1 基于協(xié)同過濾算法的電力套餐推薦實施框架Fig.1 Implementation framework of electricity plan recommendation based on collaborative filtering algorithm
離線階段構(gòu)建套餐推薦模型。其中,樣本集用戶源于已與售電公司建立零售服務(wù)關(guān)系的電力用戶,售電公司可根據(jù)用戶授權(quán)掌握其歷史用電信息。由售電公司通過其他合理方式獲得歷史用電信息及套餐購買信息的用戶也可視為樣本集用戶。在離線階段,售電公司根據(jù)樣本集用戶的歷史用電信息與套餐購買信息構(gòu)建用戶-套餐標(biāo)簽畫像,按負(fù)荷曲線對用戶進(jìn)行分類,并根據(jù)用戶簇中套餐標(biāo)簽的分布特征對標(biāo)簽進(jìn)行差異化賦權(quán)。套餐標(biāo)簽權(quán)重與樣本集用戶畫像被輸入套餐在線推薦系統(tǒng)。
套餐在線階段以目標(biāo)用戶提供的套餐歷史購買信息構(gòu)建用戶標(biāo)簽畫像,并據(jù)此匹配樣本集中的相似用戶。在此基礎(chǔ)上,根據(jù)樣本集中相似用戶的歷史負(fù)荷信息預(yù)測目標(biāo)用戶在不同套餐下的預(yù)期電費,最終為目標(biāo)用戶推薦電費最省的套餐。
由于具備相似用能習(xí)慣的用戶對套餐屬性的偏好相近,所提套餐推薦方法的核心是根據(jù)用戶畫像篩選目標(biāo)用戶的相似用戶,進(jìn)而通過相似用戶的負(fù)荷信息預(yù)測目標(biāo)用戶的套餐電費。為此,首先對樣本集用戶的用電行為進(jìn)行聚類分析。
現(xiàn)有研究對用戶用電行為的分析多關(guān)注于負(fù)荷曲線形狀[3],具備相似負(fù)荷曲線形狀的用戶對分時定價方式或電費折扣形式表現(xiàn)出一致偏好。然而,考慮到固定電費與電能價格,用戶的預(yù)期電費還受到總負(fù)荷水平的影響。這就要求對用戶負(fù)荷曲線的聚類須兼顧曲線形態(tài)與幅度兩方面的差異性,以反映用戶的分時負(fù)荷與總負(fù)荷水平特征。
對此,本文采用基于雙尺度相似性的用戶負(fù)荷聚類算法[24],分別以皮爾遜相關(guān)系數(shù)和歐氏距離衡量不同用戶在負(fù)荷曲線形態(tài)和負(fù)荷水平這兩方面尺度的相似性,其表達(dá)式分別為:
綜合考慮用戶負(fù)荷曲線的形態(tài)和整體負(fù)荷水平的雙尺度特征,構(gòu)造用戶負(fù)荷曲線的綜合相似距離,其表達(dá)式為:
在此基礎(chǔ)上,采用基于密度的有噪空間聚類應(yīng)用(density-based spatial clustering of application with noise,DBSCAN)算法[25]對用戶負(fù)荷曲線進(jìn)行分類,得到樣本用戶的典型負(fù)荷曲線及用戶分類結(jié)果。
進(jìn)一步,為建立套餐標(biāo)簽與用戶負(fù)荷的關(guān)聯(lián)關(guān)系,考慮套餐標(biāo)簽在以負(fù)荷曲線為基礎(chǔ)的樣本用戶聚類簇中的分布特征,以用戶簇中標(biāo)簽j的輪廓系數(shù)[26]反映其重要程度。用戶u的畫像標(biāo)簽j與同簇其他用戶的畫像標(biāo)簽j的評分差異越小、與其他簇用戶畫像標(biāo)簽j的評分差異越大,則套餐標(biāo)簽j的輪廓系數(shù)越大。
以U表示樣本集用戶集合,Uu表示用戶u所屬的用戶聚類簇,Uv表示任意其他用戶v所屬的聚類簇,則基于雙尺度負(fù)荷聚類的套餐標(biāo)簽j的輪廓系數(shù)可表示為:
套餐標(biāo)簽j的輪廓系數(shù)sj越大,表明該標(biāo)簽與用戶負(fù)荷的關(guān)聯(lián)度越高,在用戶畫像相似性評估中的權(quán)重越大,則套餐標(biāo)簽j的權(quán)重可表示為:
式中:ωj為套餐標(biāo)簽j的標(biāo)準(zhǔn)化權(quán)重;J為套餐標(biāo)簽個數(shù);定義為套餐標(biāo)簽的量化權(quán)重;ωmin為套餐標(biāo)簽的量化權(quán)重下限。
電力用戶訪問套餐在線推薦系統(tǒng)獲取套餐推薦方案。根據(jù)用戶提供的套餐歷史購買記錄等信息,推薦系統(tǒng)構(gòu)建目標(biāo)用戶-套餐標(biāo)簽畫像??紤]到套餐標(biāo)簽與用戶負(fù)荷關(guān)聯(lián)程度的差異性,采用加權(quán)歐氏距離衡量目標(biāo)用戶與離線階段生成的樣本集用戶畫像的相似性,其表達(dá)式為:
式中:Su,v為用戶u與v的相似度。
套餐推薦系統(tǒng)篩選與目標(biāo)用戶相似度最高的k個樣本用戶,根據(jù)其歷史用電負(fù)荷數(shù)據(jù)預(yù)測目標(biāo)用戶的負(fù)荷需求,則目標(biāo)用戶u在τ時刻的負(fù)荷可表示為
式中:Uu,k為與用戶u相似度最高的k個用戶構(gòu)成的集合。
在此基礎(chǔ)上,目標(biāo)用戶u購買套餐i的預(yù)期電費可表示為:
套餐推薦系統(tǒng)計算目標(biāo)用戶在不同套餐下的預(yù)期電費并排序,為其推薦電費最省的Top-N套餐。若目標(biāo)用戶對套餐屬性有明確需求,可在過濾對應(yīng)套餐屬性后,從剩余可選套餐集合中篩選套餐進(jìn)行推薦。
為驗證所提基于套餐隱式評分與用戶畫像的電力套餐推算方法的有效性,以推薦的Top-N套餐經(jīng)濟(jì)性評分均方根誤差(root-mean-squared error,RMSE)和推薦準(zhǔn)確率[12]評估套餐推薦結(jié)果。定義用戶u對套餐i的經(jīng)濟(jì)性評分為套餐電費的標(biāo)準(zhǔn)值,其表達(dá)式為:
式中:ru,i為用戶u對套餐i的經(jīng)濟(jì)性評分;I為用戶可選電力套餐總數(shù)。
推薦Top-N套餐的經(jīng)濟(jì)性評分的RMSE 可表示為:
式中:IR為推薦Top-N套餐經(jīng)濟(jì)性評分的RMSE值;UT為測試集用戶集合;為按目標(biāo)用戶u預(yù)期負(fù)荷計算得到的套餐i的經(jīng)濟(jì)性評分;Ru,N為向目標(biāo)用戶u推薦的Top-N套餐構(gòu)成的集合。
套餐推薦準(zhǔn)確率定義為所推薦的Top-N套餐中用戶實際電費最省的N個套餐的所占比例,其表達(dá)式為:
式中:IP為Top-N最經(jīng)濟(jì)套餐的推薦準(zhǔn)確率;Tu,N為用戶u實際負(fù)荷數(shù)據(jù)下的Top-N最經(jīng)濟(jì)套餐集合。Top-N套餐經(jīng)濟(jì)性評分的RMSE 越小、推薦準(zhǔn)確率越高,則推薦算法的性能越強(qiáng)。
為獲取用戶的套餐歷史購買信息用于仿真驗證,首先對不同用電和消費習(xí)慣的用戶的套餐選購行為進(jìn)行合理假設(shè)[10]。在滿足套餐屬性需求的基礎(chǔ)上,理性用戶應(yīng)購買預(yù)期電費最省的套餐。然而,考慮到套餐信息搜集成本以及用戶對套餐屬性的主觀偏好,其套餐購買行為可能偏離理論上的最優(yōu)經(jīng)濟(jì)決策。為此,以效用函數(shù)衡量用戶購買套餐的滿意度,用戶獲得套餐效用越高,其選購該套餐的傾向性就越大[27]。以套餐預(yù)期電費為基礎(chǔ),定義用戶u購買套餐i獲得的效用為:
式中:ηu,i為用戶u選購套餐i獲得的效用;C*u,i為用戶u在套餐i下的標(biāo)準(zhǔn)化電費;φu,i,j為用戶u對套餐i標(biāo)簽j的偏好修正系數(shù),具體如下。
1)定價方式偏好:僅考慮固定、可變費率套餐,假定月用電量隨季節(jié)變化較大的用戶更愿意購買固定費率套餐,從而規(guī)避電價高峰季節(jié)的電費波動風(fēng)險。則用戶對套餐定價方式標(biāo)簽的偏好修正系數(shù)可表示為:
2)分時電價偏好:設(shè)定分時電價套餐為峰-谷分時模式,低谷時段(22:00—次日07:00)用電量較大的用戶更傾向于購買分時電價套餐,從而降低套餐電費。則用戶對套餐的分時價格標(biāo)簽的偏好修正系數(shù)可表示為:
3)綠電比例偏好:用戶對套餐綠電比例的偏好主要受到其行業(yè)特點與綠電消費意愿的影響。為簡化模型,考慮工商業(yè)與居民用戶的負(fù)荷水平差異,以年用電量模擬用戶的行業(yè)分類。假設(shè)工商業(yè)比居民用戶具有更高的綠電偏好,同時考慮不同用戶的綠電比例偏好的隨機(jī)性,則用戶對套餐綠電比例的偏好系數(shù)可表示為:
4)售電公司品牌偏好:考慮用戶電費與其信息搜集成本的差異性,負(fù)荷水平較低的居民或小型工商業(yè)用戶更容易受到品牌效應(yīng)的影響,偏好購買知名售電公司提供的套餐,而大用戶對套餐電價更為敏感,受售電公司品牌效應(yīng)的影響較低。則用戶對售電公司排名標(biāo)簽的偏好修正系數(shù)可表示為:
式中:Qcu為用戶u的成本型標(biāo)準(zhǔn)化年度用電量。
5)套餐退出費偏好:從國外電力零售市場的實際情況來看,中小型用戶實行購電選擇權(quán)的比例普遍不高,如英國居民用戶更換售電公司的年平均比例僅為13%,其中約30%用戶更換售電公司的目的是購買長期供電套餐[28]。據(jù)此,本文假定用戶具有消費惰性,在所購套餐合同周期內(nèi)不更改套餐或轉(zhuǎn)換售電公司;套餐退出費標(biāo)簽作為擾動信息,用于驗證所提基于雙尺度負(fù)荷聚類和輪廓系數(shù)的套餐標(biāo)簽差異化賦權(quán)方法的有效性,即φu,i,j=0。
在此基礎(chǔ)上,采用基于效用最大化理論的離散選擇模型仿真用戶的套餐購買行為[4],且假設(shè)當(dāng)套餐預(yù)期效用小于平均套餐效用時該套餐不會被用戶u選擇。則用戶u選購套餐i的概率可表示為:
為驗證所提套餐推薦方法的有效性,對上述套餐屬性進(jìn)行分檔枚舉設(shè)計。模擬4 類典型用戶的月度負(fù)荷曲線(雙峰、峰平、晚峰和避峰),用戶負(fù)荷曲線聚類結(jié)果如圖2 所示。其中,雙峰型和晚峰型用戶以小型工商業(yè)和居民用戶為代表;避峰型用戶以夜間錯峰用電的工商業(yè)用戶為代表;峰平型用戶多為商場寫字樓用戶,并細(xì)分為3 個子類,聚類中心用戶的月平均用電量分別為2 179 kW·h、1 530 kW·h和937 kW·h。其他參數(shù)取值為:Lmax=5,Lmin=1,Te=6,β=0.2,αP=0.5,αE=0.5,ωmin=0.2,k=10,φj,max=0.05,φj,min=0,μm=20,N=5。
給定參數(shù)下仿真得到套餐標(biāo)簽重要性權(quán)重ωj如表2 所示。由于同簇用戶對套餐分時價格、不同用電量下的平均電價等屬性表現(xiàn)出一致偏好,對應(yīng)套餐標(biāo)簽的重要性權(quán)重較高(≥0.123)。相比之下,套餐退出費標(biāo)簽則難以用于區(qū)分用戶的負(fù)荷水平,標(biāo)簽權(quán)重較低。由此可知,所提基于雙尺度負(fù)荷聚類與輪廓系數(shù)的套餐標(biāo)簽賦權(quán)方法能夠?qū)崿F(xiàn)套餐標(biāo)簽的差異化賦權(quán),支撐套餐推薦系統(tǒng)篩選用戶套餐歷史購買記錄中的有效信息,生成用戶-套餐標(biāo)簽畫像支撐電力套餐推薦。
表2 套餐特征標(biāo)簽的重要性權(quán)重Table 2 Importance weight of electricity plan feature label
所提套餐推薦方法下典型用戶的套餐推薦結(jié)果如表3 所示。表中所涉套餐僅考慮定價方式與分時價格屬性差異,且將固定費率的統(tǒng)一電價(記為FU,fixed-uniform)套餐劃分為FU-base 至FU-2000共7 個分檔,分別適用于月用電量0~750 kW?h 至2 000 kW?h 以上的用戶;固定費率的分時電價(記為FT,fixed-TOU)套餐采用相同的分檔模式。如表3所示,在所提套餐推薦方法下,不同用戶的套餐推薦結(jié)果與其負(fù)荷曲線及月用電量等用電特征相匹配,用戶選購所推薦的套餐有利于降低其電費支出。此外,對比用戶U1、U4和U5的套餐推薦結(jié)果可知,當(dāng)用戶的月用電量相近時,所提推薦方法能夠辨識用戶的負(fù)荷曲線特征,若為雙峰型用戶U1與峰平型用戶U4推薦FU-750 套餐,為晚峰型用戶U5推薦FT-750 套餐,從而實現(xiàn)對不同分時負(fù)荷需求用戶的差異化套餐推薦。
表3 典型用戶的電力套餐推薦結(jié)果Table 3 Result of electricity plan recommendation for typical users
電力套餐推薦系統(tǒng)根據(jù)用戶提供的有限的套餐歷史購買信息構(gòu)建用戶-套餐標(biāo)簽畫像。用戶偏好時間衰減系數(shù)β越大,則用戶近期購買的套餐對用戶畫像標(biāo)簽評分的影響越大,從而影響到所提套餐推薦算法的推薦精度。
圖3 對比了不同偏好時間衰減系數(shù)β下的套餐推薦精度??梢?隨著β逐步提高,套餐推薦準(zhǔn)確率指標(biāo)IP先增大后減小,均方根誤差指標(biāo)IR先減小后增大。當(dāng)不考慮用戶偏好衰減時(β=0),用戶在不同時期購買的套餐對其畫像標(biāo)簽評分的影響相同,而實際上用戶早期的套餐選購行為與其真實偏好的偏差較大,故套餐推薦精度較低;當(dāng)用戶偏好時間衰減系數(shù)β較大時,可視為按用戶最近購買的套餐生成用戶畫像,考慮到用戶消費行為存在隨機(jī)性,該畫像將無法全面反映用戶對套餐屬性的具體偏好,同樣使套餐推薦精度下降。當(dāng)模型中用戶偏好時間衰減系數(shù)β取0.2 時,套餐推薦精度達(dá)到最大值,Top-N最經(jīng)濟(jì)套餐的經(jīng)濟(jì)性評分的最小均方根誤差為0.015,最大推薦準(zhǔn)確率達(dá)88.8%。
圖3 不同偏好衰減系數(shù)下的套餐推薦精度對比Fig.3 Comparison of electricity plan recommendation accuracy with different preference attenuation coefficients of users
套餐推薦系統(tǒng)根據(jù)用戶提供的套餐歷史購買信息與樣本集用戶的負(fù)荷信息實現(xiàn)目標(biāo)用戶的最經(jīng)濟(jì)套餐推薦。圖4 對比了所提方法在不同的套餐歷史購買信息數(shù)Te和相似用戶個數(shù)k下的套餐推薦精度變化。隨著用戶提供的套餐歷史購買信息增多,基于套餐隱式評分的用戶畫像能夠更加準(zhǔn)確地反映用戶的負(fù)荷需求與消費偏好,從而提高電力套餐的推薦精度。當(dāng)目標(biāo)用戶可提供的套餐選購記錄增多時,所推薦套餐的經(jīng)濟(jì)性評分均方根誤差指標(biāo)IR由0.076(Te=1)下降至0.013(Te=6),平均套餐推薦準(zhǔn)確率由64.8%提高至89.6%。
圖4 不同相似用戶個數(shù)與套餐歷史購買信息下的套餐推薦精度對比Fig.4 Comparison of electricity plan recommendation accuracy with different number of similar users and historical purchase information of electricity plans
相比之下,若用戶提供的套餐歷史購買信息有限,則可能造成用戶畫像失真。此時,適當(dāng)增加相似用戶數(shù)量k能夠提高套餐推薦精度。如圖4 所示,當(dāng)用戶僅能提供單次套餐購買記錄(Te=1)時,套餐推薦準(zhǔn)確率首先隨k增大而提高,并在k=6 時取得最大值65.7%;隨著k進(jìn)一步增大,樣本集相似用戶與目標(biāo)用戶的畫像偏差逐步增大,所推薦的套餐將逐漸偏離用戶實際的最經(jīng)濟(jì)套餐,導(dǎo)致套餐推薦準(zhǔn)確率下降。此外,對比圖4 中Te=1 和Te=6 的仿真結(jié)果可知,隨著用戶提供的套餐歷史購買信息增多,用戶標(biāo)簽畫像更加精準(zhǔn),能夠在一定程度上緩解相似用戶個數(shù)k增大導(dǎo)致的套餐推薦準(zhǔn)確率下降問題。據(jù)此,售電公司應(yīng)根據(jù)用戶提供的套餐歷史購買記錄靈活調(diào)整相似用戶個數(shù)k等模型參數(shù),從而保障套餐推薦精度。
為驗證所提基于套餐隱式評分與用戶畫像的套餐推薦方法的有效性,圖5 對比了不同推薦方法下的套餐推薦準(zhǔn)確率。套餐標(biāo)簽賦權(quán)方面,本文所提基于雙尺度負(fù)荷聚類與輪廓系數(shù)的套餐標(biāo)簽賦權(quán)方法縮寫為DSM(double scale clustering and SCbased method);熵 權(quán) 法(entropy weight method,EWM)按用戶簇內(nèi)畫像標(biāo)簽的信息熵確定權(quán)重[29],標(biāo)簽信息熵越大則表明用戶簇內(nèi)標(biāo)簽評分的離散程度越小、標(biāo)簽與用戶負(fù)荷的關(guān)聯(lián)程度越大;均一權(quán)重法(uniform weight method,UWM)對套餐標(biāo)簽采用相同的權(quán)重ω=0.125。在所提套餐標(biāo)簽賦權(quán)方法下,對樣本用戶負(fù)荷曲線分別采用歐氏距離聚類(Euclidean distance clustering,EDC)和余弦距離聚類(cosine distance clustering,CDC),得到差異化的套餐標(biāo)簽權(quán)重用于套餐推薦。以標(biāo)簽化畫像為基礎(chǔ),基于內(nèi)容的推薦(content-based recommendation,CBR)方法將用戶與套餐視作同質(zhì)的標(biāo)簽評分向量,通過解決基于標(biāo)簽評分的用戶-套餐分類問題,向用戶推薦具有相似標(biāo)簽評分的電力套餐。
圖5 不同方法下的電力套餐推薦精度對比Fig.5 Comparison of electricity plan recommendation accuracy for different methods
由圖5 可知,所提套餐推薦方法與對比方法的套餐推薦準(zhǔn)確率IP依次為90.6%、88.5%、88.4%、90.1%、90.3% 和59.8%。一方面,相比于CBR 方法,基于套餐隱式評分與用戶畫像的協(xié)同過濾推薦方法能夠準(zhǔn)確地識別用戶的用電需求,推薦準(zhǔn)確率更高;另一方面,所提方法在用戶負(fù)荷曲線聚類與套餐標(biāo)簽賦權(quán)方面也更具優(yōu)勢,相比于EWM、UWM、EDC 以及CDC 等方法,所提方法的套餐經(jīng)濟(jì)性評分均方根誤差指標(biāo)IR分別下降了20.4%、21.4%、3.2%和4.7%。仿真結(jié)果表明,所提基于套餐隱式評分與用戶畫像的電力套餐推薦方法能夠?qū)崿F(xiàn)面向差異化用能需求用戶的套餐推薦,且相比于其他推薦方法具有更高的套餐推薦精度。
售電公司可根據(jù)用戶的套餐歷史購買行為等隱式評分發(fā)掘用戶的負(fù)荷需求與消費偏好,進(jìn)而推薦電力套餐。為此,本文考慮用戶偏好隨時間衰減的特點,構(gòu)建了基于套餐隱式評分的用戶-套餐標(biāo)簽畫像模型,并提出了基于雙尺度負(fù)荷聚類和輪廓系數(shù)的套餐標(biāo)簽差異化賦權(quán)方法。在此基礎(chǔ)上,采用標(biāo)簽加權(quán)歐氏距離衡量用戶畫像的相似度,通過相似用戶的歷史負(fù)荷信息預(yù)測目標(biāo)用戶的套餐電費,為其推薦最經(jīng)濟(jì)的電力套餐,提高了售電公司的套餐推薦精度。此外,從仿真結(jié)果也可以看出,所述套餐推薦算法仍受限于用戶能夠提供的套餐歷史購買信息數(shù)量,且暫未考慮除經(jīng)濟(jì)因素以外的用戶套餐屬性偏好。因此,下一步的研究可以考慮通過完善套餐標(biāo)簽體系、調(diào)整套餐推薦目標(biāo)等方式對售電公司電力套餐推薦方法進(jìn)行改進(jìn)。