何勝利,劉現(xiàn)濤,張?zhí)?,陳?/p>
(1.南瑞集團(tuán)(國網(wǎng)電力科學(xué)研究院)有限公司,江蘇 南京 211106;2.國電南瑞南京控制系統(tǒng)有限公司,江蘇 南京 211106;3.東南大學(xué)電氣工程學(xué)院,江蘇 南京 210096)
截至2020年底,中國電動汽車(electrical vehicle,EV)保有量已達(dá)約500萬輛。規(guī)?;疎V的發(fā)展推動了交通與能源行業(yè)的融合[1—3],這不僅拓寬了電網(wǎng)的業(yè)務(wù)范圍[4—5],也為含高比例可再生能源電力系統(tǒng)的隨機(jī)性平抑提供了優(yōu)質(zhì)的用戶側(cè)資源[6—8]。
EV與電力系統(tǒng)融合的優(yōu)化調(diào)度策略研究主要集中在2個層面:(1)合理調(diào)整EV充電的地點(diǎn)、時間和功率,減小規(guī)?;疎V充電對配電系統(tǒng)負(fù)面影響,降低用戶及運(yùn)營商的用電成本[9—11]。(2)視EV群為分布式的儲能系統(tǒng),設(shè)計相應(yīng)的調(diào)度及通信架構(gòu)、優(yōu)化算法和激勵措施,為電網(wǎng)提供移峰填谷、頻率調(diào)節(jié)等服務(wù)[12—14]。
用戶行為對EV與電網(wǎng)融合有著深入影響,將成為信息-物理-社會融合系統(tǒng)中的重要環(huán)節(jié)[15]。在建模與優(yōu)化控制的過程中,必須對非完全理性用戶的決策行為進(jìn)行研究[16]。期望效用理論(expected utility theory,EUT)是風(fēng)險狀態(tài)下用戶決策的經(jīng)典規(guī)范性理論,建立了不確定條件下對理性人選擇進(jìn)行分析的框架[17]。而前景理論(prospect theory,PT)將心理學(xué)研究應(yīng)用在經(jīng)濟(jì)學(xué)中,由諾貝爾獎得主丹尼爾·卡內(nèi)曼及其合作伙伴共同提出[18],是面向非完全理性人決策的描述性模型。
EV充電與分布式新能源(distributed renewable generation,DRG)具有潛在的協(xié)同性[19,且目的地充電是用作日常通勤的EV充電的主要方式之一[20],文中以含有DRG、常規(guī)負(fù)荷、儲能的多元充電站(multi-element charging station,MCS)為研究場景。當(dāng)前的研究中[21],往往將用戶的充電需求作為約束條件,而對用戶充電決策的主觀性考慮不足。面向用戶的激勵機(jī)制較為復(fù)雜,缺乏直觀性。
針對上述問題,文中設(shè)計了面向用戶自主選擇的價格機(jī)制,通過價格激勵,引導(dǎo)用戶為充電站的調(diào)節(jié)提供靈活性。并分別建立了基于EUT和PT的用戶決策行為模型。同時考慮充電站運(yùn)行經(jīng)濟(jì)性和面向電網(wǎng)的調(diào)節(jié)靈活性2個目標(biāo),采用模型預(yù)測控制(model predict control,MPC)方法,使得充電站運(yùn)行優(yōu)化能夠兼容用戶決策的隨機(jī)性?;诤献鞑┺姆椒ㄇ蠼舛叩钠胶恻c(diǎn),并通過虛擬變量的設(shè)置,將雙層優(yōu)化轉(zhuǎn)化為單層二次優(yōu)化。
用戶最終充電費(fèi)用C決定方式如下。充電開始時,用戶選擇期望充電電量Q和能夠接受的充電時長T,并計算預(yù)期的充電費(fèi)用,如式(1)所示。
(1)
在用戶離開前進(jìn)行結(jié)算,設(shè)用戶實(shí)際的充電持續(xù)時長為Tactual,則用戶最終的充電費(fèi)用為:
(2)
EUT為規(guī)范性理論,即從客觀角度出發(fā),用戶按此種方式進(jìn)行決策能夠?qū)崿F(xiàn)利益最優(yōu)。用戶抵達(dá)充電站后,若選擇T作為其充電時長,期望效用E(T)為風(fēng)險條件下付出的充電成本的負(fù)值,可由式(3)進(jìn)行計算。
(3)
式中:f(t)為充電持續(xù)時長的概率密度函數(shù);E1(T),E2(T)分別為用戶在設(shè)定時長達(dá)到之前、之后離開時所付出的充電成本的負(fù)值,二者之和為期望效用。用戶選擇使其期望效用最大的T作為其充電持續(xù)時長。
PT是用戶在不確定性條件下進(jìn)行決策的描述性模型。在PT的框架下,用戶做出的決策未必是最優(yōu)的。用戶將選擇前景值最大而非期望值最大的T,基于PT建立用戶決策模型的主要步驟可以表示如下。
(1)參照點(diǎn)依賴。用戶決策的載體是相對于參照點(diǎn)的收益或損失。用戶選擇Q,T后,將產(chǎn)生的C作為參考點(diǎn)。若用戶提前離開,產(chǎn)生的損失為:
Lbefore=Qs(1-β(Q,T))
(4)
若用戶推遲離開,產(chǎn)生的損失為:
Lafter=Qs(β(Q,T)-β(Q,Tactual))
(5)
(2)框架效應(yīng)。用戶決策系統(tǒng)性的依賴前景的描述方式。選取Tactual,0,Tactual,1和Tactual,2作為用戶可能離開的典型場景,Tactual,0 (6) 設(shè)L1 V(T)=L2ω(1-F(Tactual,2))+ (7) 式中:F(T),F(xiàn)(Tactual,1),F(xiàn)(Tactual,2)分別為用戶在T,Tactual,1,Tactual,2前離開的累積概率密度;ω為概率的非線性變換函數(shù)。 (3)非線性偏好。PT框架下,用戶會為小概率的事件賦予較大權(quán)重,而對中間概率事件p的變化不敏感,采用加權(quán)函數(shù)對概率進(jìn)行非線性變換: (8) 式中:δ為損失規(guī)避系數(shù),一般取值為0.2。 基于MPC的充電站調(diào)度優(yōu)化的基本流程如圖1所示,設(shè)每次優(yōu)化的時間尺度為ΔT,執(zhí)行時間步長為Δt,主要包括預(yù)測、優(yōu)化、執(zhí)行與滾動3個步驟。 圖1 基于MPC充電站優(yōu)化調(diào)度流程Fig.1 Optimization scheduling process of charging station based on MPC 首先,以Δt為步長,采用自回歸滑動平均模型對DRG和常規(guī)負(fù)荷在當(dāng)前優(yōu)化時段Ti的值進(jìn)行滾動預(yù)測;同時,對充電站未來時段的充電需求進(jìn)行滾動預(yù)測,并根據(jù)用戶行為決策模型預(yù)測用戶選擇的充電方案;然后,以當(dāng)前優(yōu)化時段Ti經(jīng)濟(jì)性最優(yōu)、下一執(zhí)行時段t2可用功率最大等為目標(biāo),以Δt為步長,計算當(dāng)前時段Ti儲能及EV的最優(yōu)功率;得到最優(yōu)功率計劃后,僅執(zhí)行時段t1的計劃。并以Δt為步長向前滾動。 (1)優(yōu)化目標(biāo)。MCS的目標(biāo)之一為其自身運(yùn)行的經(jīng)濟(jì)性,而運(yùn)營收入與MPC的效果無關(guān),故在優(yōu)化的過程中,采用運(yùn)營成本代表其經(jīng)濟(jì)性目標(biāo): (9) 式中:Cobj(Ti)為當(dāng)前優(yōu)化時段充電站的運(yùn)行成本;Ptotal(tj)為tj時段充電站的總功率;Eprice(tj)為tj時段的購電電價;βBE為儲能充/放單位電量的損耗成本;PBEc(tj),PBEd(tj)分別為tj時段儲能的充/放電功率。在短時間尺度的經(jīng)濟(jì)性優(yōu)化中不考慮DRG的出力成本。 MCS的目標(biāo)之二為其下一執(zhí)行時段可上調(diào)功率,即其相對于計劃功率可增加吸收的值最大化,反映了上級電網(wǎng)對充電站靈活調(diào)節(jié)能力的要求,可表示為: maxPobj(Ti)=max(Pt,max(t2)-Ptotal(t2)) (10) 式中:Pobj(Ti)為在下一執(zhí)行時段的可上調(diào)功率;Pt,max(t2)為當(dāng)前運(yùn)行方案下時段t2能達(dá)到的最大功率;Ptotal(t2)為時段t2的原計劃功率。 (2)約束條件。與EV相關(guān)的約束可表示為: (11) 式中:uEV,k(tj)為0-1變量,為1時代表第k輛EV在時段tj正在充電;UEV,k(tj)為時段tj的可充電狀態(tài),為1時代表其在時段tj可以充電,根據(jù)對用戶充電行為的預(yù)測及用戶的實(shí)際選擇情況得到;PEV,k,min,PEV,k,max分別為第k輛EV的最小、最大充電功率;PEV,k(tj)為其在時段tj的充電功率;CEV,k,min(Ti),CEV,k,max(Ti)分別為時段Ti結(jié)束后的最小、最大充電電量。 與儲能相關(guān)的約束可表示為: (12) 式中:uBEc(tj),uBEd(tj)均為0-1變量,uBEc(tj)為1代表儲能處于充電狀態(tài),uBEd(tj)為1代表儲能處于放電狀態(tài);PBEc,max,PBEc,min分別為儲能充電功率的最大值、最小值;PBEd,max,PBEd,min分別代表儲能放電功率的最大值、最小值;EB(tj)為時段tj儲能的荷電狀態(tài);EB,max,EB,min分別為儲能的最大、最小荷電量。 新能源出力與總功率相關(guān)的約束為: (13) 式中:Pnew(tj)為新能源出力;Pnew,predict(tj)為預(yù)測得到的新能源出力最大值;Pload(tj)為常規(guī)負(fù)荷的預(yù)測值;Ptotal,max為MCS受容量限制能夠吸收的最大功率,設(shè)置Ptotal(tj)≥0。 MPC的目標(biāo)1和目標(biāo)2存在如下關(guān)系:目標(biāo)2的優(yōu)化是在已有運(yùn)行計劃基礎(chǔ)上再次進(jìn)行的,且僅當(dāng)上級電網(wǎng)下發(fā)響應(yīng)指令時才會執(zhí)行,只影響之后的運(yùn)行計劃,而對目標(biāo)1進(jìn)行優(yōu)化的時候,需考慮優(yōu)化結(jié)果對目標(biāo)2的影響。因此該優(yōu)化是雙層優(yōu)化問題,為減少計算時間,滿足在線滾動需求,文中采用如下方法處理目標(biāo)1和目標(biāo)2之間的關(guān)系。 記X(tj)為當(dāng)前優(yōu)化問題的控制變量,增設(shè)虛擬變量X′(tj),虛擬變量除滿足式(11)—式(13)外,還需滿足約束條件X(t1)=X′(t1)以保證下一執(zhí)行時段調(diào)度計劃的一致性。 同時,將優(yōu)化目標(biāo)2修改為: maxPobj(Ti)=maxP′total(t2)-Ptotal(t2) (14) 通過增設(shè)虛擬變量及相應(yīng)約束條件,將雙層優(yōu)化問題轉(zhuǎn)換為單層雙目標(biāo)優(yōu)化問題進(jìn)行求解。 由于MCS和電網(wǎng)處于長期穩(wěn)定的合作關(guān)系之中,故可基于合作博弈的思想求該雙目標(biāo)優(yōu)化的帕累托最優(yōu)解。 (1)記目標(biāo)1為Ψ1,目標(biāo)2為Ψ2,分別求解Ψ1的最大值Ψ1,max和最小值Ψ1,min,Ψ2的最大值Ψ2,max,Ψ2的最小值記為0; (2)將目標(biāo)1改寫為: (15) 目標(biāo)2改寫為: (16) (3)加入權(quán)重變量d,將總目標(biāo)記為: maxφ=max[(1-d)φ2-Cφ1] (17) 通過步驟(1)、(2)對目標(biāo)函數(shù)進(jìn)行規(guī)格化,并將權(quán)重作為優(yōu)化變量以尋求最佳的配比。由此,將雙目標(biāo)線性優(yōu)化轉(zhuǎn)換為單目標(biāo)二次優(yōu)化,可通過成熟的求解器進(jìn)行計算。 開展面向真實(shí)人的實(shí)驗(yàn)測試。受試者分為2組,分別由20名具備一定駕駛經(jīng)驗(yàn)的學(xué)生和20名專業(yè)司機(jī)組成。實(shí)驗(yàn)流程如圖2所示。 圖2 面向真實(shí)人的充電行為決策實(shí)驗(yàn)Fig.2 Experiment of charging decision making for real people 首先設(shè)定實(shí)驗(yàn)人初始獎勵。根據(jù)預(yù)設(shè)規(guī)律自動生成充電開始時刻、Q和預(yù)期離開時刻及其概率分布并告知實(shí)驗(yàn)人。有限時間內(nèi),實(shí)驗(yàn)人被鼓勵按直覺設(shè)置T。之后,系統(tǒng)根據(jù)規(guī)則抽取Tactual并結(jié)算C。將初始獎勵扣除C,作為本次實(shí)驗(yàn)的最終獎勵發(fā)放給用戶。開展2組對照實(shí)驗(yàn)。一組充電開始于日間,Q較少,T較短;另一組充電開始于傍晚或夜間,Q較多。β0取0.6,s取1.2元/(kW·h)。初始獎勵為50元。 圖3展示了PT和EUT的預(yù)測結(jié)果與實(shí)驗(yàn)人實(shí)際選擇的對比。相較EUT,PT更為貼切地描述了用戶的決策:EUT的預(yù)測結(jié)果平均相對誤差為14.23%,而PT的預(yù)測結(jié)果平均相對誤差為4.81%。面向?qū)I(yè)司機(jī)和學(xué)生的實(shí)驗(yàn)結(jié)果沒有明顯差異。EUT在夜間長時間充電場景下的預(yù)測準(zhǔn)確度明顯提升,原因可能在于,用戶對時間跨度較長的決策的風(fēng)險敏感性有所降低。 圖3 面向真實(shí)人的實(shí)驗(yàn)結(jié)果Fig.3 Results of experiments for real people EV進(jìn)站流量、充電開始時刻、持續(xù)時長和充電電量等參數(shù)根據(jù)文獻(xiàn)[22]中的方法生成。DRG容量為40 kW·h,常規(guī)負(fù)荷峰值為200 kW,采用文獻(xiàn)[23]中的方法預(yù)測其出力及功率曲線。ΔT,Δt分別取1.5 h和15 min。充電樁數(shù)量為30,額定功率為21 kW。儲能容量為20 kW·h,最大和最小的充放電功率分別為10 kW和1.4 kW,初始電量為容量的50%。峰(08:00—12:00,17:00—21:00)、谷(00:00—08:00)、平(12:00—17:00,21:00—24:00)等時段的電價分別設(shè)為1.07元/(kW·h)、0.31元/(kW·h)和0.64元/(kW·h)。采用PT預(yù)測用戶的充電決策,根據(jù)3.1節(jié)的實(shí)驗(yàn)結(jié)果,以4.81%為平均值隨機(jī)生成預(yù)測誤差。基于Matlab平臺,采用Yalmip工具箱調(diào)用Mosek求解器對模型進(jìn)行求解,相關(guān)的運(yùn)行環(huán)境為Intel(R)Core(TM)i7-9700 CPU@3.00 GHz RAM 32.0 GB。計算該充電站在工作日、非工作日2種場景下的調(diào)度結(jié)果,并與無序充電情況下的運(yùn)行結(jié)果對比,如表1、表2所示。 表1 優(yōu)化及仿真結(jié)果(工作日)Table 1 Optimization and simulation results on weekdays 表2 優(yōu)化及仿真結(jié)果(非工作日)Table 2 Optimization and simulation results at weekends 無序充電情況下僅對儲能運(yùn)行進(jìn)行優(yōu)化。文中提出的優(yōu)化調(diào)度策略在不同場景下均能有效降低運(yùn)行成本達(dá)20%左右,并提供一定的功率靈活調(diào)節(jié)能力。特別是在非工作日,由于用戶出行彈性大,優(yōu)化調(diào)度策略的效果更為顯著。 表1中,優(yōu)化值是根據(jù)光伏、常規(guī)負(fù)荷和用戶行為預(yù)測進(jìn)行優(yōu)化得到的結(jié)果,而仿真值是計及預(yù)測誤差情況下執(zhí)行決策變量優(yōu)化值得到的結(jié)果。文中基于MPC的調(diào)度策略能夠顯著的抑制誤差和隨機(jī)性導(dǎo)致的優(yōu)化結(jié)果劣化,仿真值與優(yōu)化值的偏差控制在1%左右。 為進(jìn)一步驗(yàn)證文中優(yōu)化調(diào)度策略的效果,研究如下對比算例: (1)基于EUT預(yù)測用戶的充電行為。工作日場景下充電站總功率優(yōu)化值及仿真值如圖4所示。對比算例中,由于未能較為準(zhǔn)確的預(yù)測用戶選擇,總功率的優(yōu)化值與仿真值之間存在較大偏差,優(yōu)化得到的充電站日運(yùn)行成本為4 701.65元,而運(yùn)行成本的仿真值則為5 081.47元,文中調(diào)度策略下運(yùn)行成本的仿真值則為4 817.04元。 圖4 不同調(diào)度方法下充電站的運(yùn)行情況Fig.4 The operation of charging station under different scheduling strategies 模擬上級調(diào)度于03:45下發(fā)功率上調(diào)指令,上調(diào)量為60 kW。文中調(diào)度策略下,充電站總功率準(zhǔn)確跟蹤了上級調(diào)度指令。而未考慮用戶非完全理性行為的調(diào)度策略則未能完全滿足上級調(diào)度需求。 (2)以站級經(jīng)濟(jì)性為單一目標(biāo)進(jìn)行優(yōu)化調(diào)度。不同場景下,充電站運(yùn)行成本對比如圖5所示。單一優(yōu)化目標(biāo)下,工作日和非工作日運(yùn)行成本分別為4 678.61元和4 461.34元。當(dāng)采用文中的雙目標(biāo)優(yōu)化方法時,增加運(yùn)行成本小于4.0%,能夠在經(jīng)濟(jì)性犧牲較小的情況下,提供站級調(diào)節(jié)靈活性。 圖5 充電站運(yùn)行成本對比Fig.5 Comparison of operating cost for charging stations (3)在雙目標(biāo)求解時,采用上下層迭代的方式進(jìn)行。單次計算時間與文中所用方法的對比如圖6所示。采用迭代方法時,單次計算時間在20 s以上,相同環(huán)境下,文中的求解算法大幅降低了求解時間,單次計算時間在1~2 s間,且在不同場景下保持了計算速度的穩(wěn)定性,可滿足在線優(yōu)化的需求。 圖6 計算時間對比Fig.6 Comparison of calculation time 文中將包含常規(guī)負(fù)荷、DRG及儲能的MCS作為研究對象。設(shè)計了充電價格激勵機(jī)制,在保證用戶自由選擇的基礎(chǔ)上,挖掘其調(diào)節(jié)靈活性。并分別采用EUT和PT,建立了用戶充電決策預(yù)測模型?;贛PC方法,通過合作博弈以及虛擬變量設(shè)置,對EV充電和儲能的調(diào)度策略進(jìn)行了多目標(biāo)優(yōu)化。真實(shí)人參與的實(shí)驗(yàn)結(jié)果表明,在面向不同對象時,考慮用戶非完全理性的PT在描述用戶選擇上均更具優(yōu)勢。仿真實(shí)驗(yàn)結(jié)果表明,文中所提調(diào)度方法在不同場景下均能顯著降低充電站運(yùn)行成本,并以較小的經(jīng)濟(jì)代價為上級電網(wǎng)提供靈活調(diào)節(jié)能力,同時具備能夠滿足在線應(yīng)用要求的模型求解速度。 與電力系統(tǒng)傳統(tǒng)的調(diào)度對象不同,EV用戶是分散的、具有非完全理性的個體。在進(jìn)行EV與電網(wǎng)互動等工作時,應(yīng)考慮社會-物理融合的模型。未來擬進(jìn)一步開展面向城市級、多層次的EV充電優(yōu)化調(diào)度研究。
L0(ω(1-F(Tactual,2)+F(T))-ω(F(T)))+
L1(ω(1-F(Tactual,1)+F(T))-ω(1-F(Tactual,2)+F(T)))2 基于MPC的充電站優(yōu)化調(diào)度策略
2.1 調(diào)度優(yōu)化的基本流程
2.2 優(yōu)化目標(biāo)與約束條件
2.3 求解方法
3 實(shí)驗(yàn)及算例分析
3.1 理性人模型與非完全理性人模型的對比
3.2 調(diào)度策略的有效性
4 結(jié)語