黃柳強,黃飛,秦麗娟,凡華,商云龍
(廣西電力交易中心有限責(zé)任公司,廣西 南寧 530023)
我國電力中長期交易[1]有雙邊協(xié)商交易和集中交易2種方式,其中雙邊協(xié)商交易是主要采用的交易方式[2]。該交易方式由售電方和購電方自愿協(xié)商交易電量和價格,達成一致后成交,完全體現(xiàn)了雙方的交易意愿。大體量、周期長的交易品種[3-4],如年度長協(xié)交易等,都采用雙邊協(xié)商交易方式。研究雙邊協(xié)商交易,特別是市場主體的交易策略、交易過程,對指導(dǎo)市場主體交易行為[5-6]、預(yù)測交易結(jié)果[7]、監(jiān)控市場主體市場力[8]、防控市場風(fēng)險[9]都有一定的指導(dǎo)作用。
國內(nèi)外學(xué)者就電力市場雙邊協(xié)商交易建模作了一些研究,采用博弈論[10-12]中的魯賓斯坦討價還價理論[13]建模是其中一種思路。例如,文獻[14]構(gòu)建了火電商和風(fēng)電商之間關(guān)于綠證交易和雙邊儲備市場的博弈模型;文獻[15]利用博弈均衡解探討協(xié)商交易的形成條件;文獻[16]分析了售電公司壟斷零售市場后與發(fā)電企業(yè)討價還價的博弈過程;文獻[17]通過尋找發(fā)電廠電價和大用戶的等效電能定價間的博弈關(guān)系,將大用戶生產(chǎn)的產(chǎn)品定價納入了博弈的過程當(dāng)中;文獻[18]結(jié)合博弈風(fēng)險展開研究;文獻[19]考慮源荷雙方的利益,并兼顧風(fēng)電消納實現(xiàn)有效博弈;文獻[20]則對魯賓斯坦理論的貼現(xiàn)因子進行深入的泛化分析。
上述文獻對魯賓斯坦理論在電力市場的應(yīng)用做了有益的嘗試,但仍不太符合實際中市場主體的交易行為。市場主體在雙邊協(xié)商交易中的出價或讓步不僅依據(jù)自身的成本和收益,而且會追逐其理想的目標(biāo)價格,結(jié)合對方的出價情況進行思考、學(xué)習(xí),猜測其報價底線,綜合判斷后給出合理的價格;因此,應(yīng)協(xié)同學(xué)習(xí)方法,將傳統(tǒng)的魯賓斯坦模型改進成具備學(xué)習(xí)能力的出價模型,才能更好地模擬交易行為。
本文運用魯賓斯坦討價還價理論,結(jié)合實際交易出價重點考慮的因素設(shè)計模型的貼現(xiàn)因子,引入貝葉斯學(xué)習(xí)理論,構(gòu)造出電力市場雙邊協(xié)商交易中售電方、購電方的學(xué)習(xí)型出價策略,對比未采用貝葉斯學(xué)習(xí)理論的出價策略,分析成交價格的分布和演進,驗證學(xué)習(xí)型出價策略的優(yōu)越性。
經(jīng)濟學(xué)家阿里爾·魯賓斯坦針對雙邊交易提出了一種討價還價動態(tài)博弈模型[13]:市場上2個參與者分享利益,雙方輪流提出分配方案。假定一方提出利益分配比例,另一方可以選擇接受或者拒絕,接受則博弈結(jié)束,拒絕則由另一方提出新的利益分配比例;同理,一方也可以選擇接受或者拒絕新的利益分配比例。如此往復(fù),直到得出一個雙方都認(rèn)可的利益分配比例。
但是,如果提出的比例步進很小,而且雙方一直都不接受對方的方案,那么討價還價將一直進行下去,理論上可無限期拖延,無法成交。因此模型提出貼現(xiàn)因子δ(0<δ<1)來模擬談判過程中的消耗成本,從而得到唯一的關(guān)于貼現(xiàn)因子的市場均衡。
在實際交易的談判過程中,購售雙方常常不會按照孤立的策略機械地出價,而是根據(jù)每次對方的報價進行學(xué)習(xí)、評估,預(yù)測對方的出價底線并結(jié)合自身的收益目標(biāo)來修改、決定自己的下一輪出價,使得討價還價過程更為合理地進行下去。本文采用貝葉斯學(xué)習(xí)理論[21]模擬出價的學(xué)習(xí)行為。基本做法是市場主體根據(jù)每次獲得的對方出價信息,利用貝葉斯公式對對方的先驗知識進行修正,預(yù)測對方的出價底線,從而作出決策。
貝葉斯公式描述為:假設(shè)某市場主體預(yù)測對方的出價底線X有I種可能性,其中第i種可能性的出價底線為Xi;對方的報價有J種可能性,其中第j種可能性的報價為πj;對于該市場主體而言,其先驗知識包括關(guān)于對方出價底線的概率分布估計P(Xi)以及關(guān)于對方出價的概率分布估計P(πj︱Xi)(表示對方出價底線為Xi時報價為πj的概率分布)。
該市場主體對對方出價底線的數(shù)學(xué)期望
(1)
在獲取對方的出價πj后,經(jīng)過貝葉斯學(xué)習(xí),更新對方出價底線的概率分布估計
(2)
由此得到對方出價底線的數(shù)學(xué)期望
(3)
市場主體在討價還價過程中將根據(jù)每一輪對方的出價不斷動態(tài)更新對對方出價底線的估計,然后在自身出價決策中統(tǒng)籌考慮,科學(xué)出價,使得討價還價更為穩(wěn)定、合理。
本文基于以上2個理論的基本思想,構(gòu)造一種電力市場雙邊協(xié)商交易的學(xué)習(xí)型出價策略。
市場主體在出價前應(yīng)遵循一定的交易原則。為便于分析且不失一般性,本文首先對雙邊協(xié)商交易的基本原則作如下設(shè)定:
設(shè)定1:雙方輪流出價,如一方放棄出價則以另一方當(dāng)前已出價格成交。
設(shè)定2:為提高效率和保證交易持續(xù)進展,各方的出價是單調(diào)變化的,即售電方每次出價均比自己的上一次出價低,購電方每次出價均比自己的上一次出價高。
設(shè)定3:當(dāng)售電方出價低于購電方下一輪的出價意向時,購電方將不再出價,即以售電方出價成交;同理,當(dāng)購電方出價高于售電方下一輪的出價意向時,售電方將不再出價,即以購電方出價成交。
在上述交易原則的框架下,交易時購售電雙方在一定的價格區(qū)間范圍內(nèi)出價。以廣西電力市場的政策和規(guī)則要求為例,售電方(發(fā)電企業(yè))交易價格的上限一般是政府核準(zhǔn)的上網(wǎng)電價;下限則是發(fā)電企業(yè)的發(fā)電成本。購電方(電力用戶、售電公司)交易價格的上限一般是參與電力市場的發(fā)電企業(yè)由政府核準(zhǔn)的上網(wǎng)電價最大值,或是根據(jù)自身生產(chǎn)經(jīng)營成本等確定;下限雖然可以為0(對于購電方而言價格越低越好),但交易時購電方不可能按0向售電方壓價,而是結(jié)合歷史經(jīng)驗預(yù)計一個下限值,以便合理出價。
電力市場交易中,市場主體一般會制訂簡單或復(fù)雜的交易策略,并據(jù)此出價。簡單策略如線性策略,即以固定的讓步幅度出價;復(fù)雜策略的讓步幅度是變化的,呈現(xiàn)非線性出價曲線,需要綜合考慮各種因素,如交易規(guī)則限定、企業(yè)成本、交易時間成本甚至個人偏好等,既有客觀因素,也有主觀色彩。復(fù)雜策略是市場中更常見、更普遍的交易策略。本文提煉一些主要因素,基于魯賓斯坦討價還價理論和貝葉斯學(xué)習(xí)理論對市場主體的復(fù)雜交易策略建模。
3.2.1 魯賓斯坦理論應(yīng)用的一般式
根據(jù)設(shè)定2,售電方首次出價是后續(xù)歷次出價中最高的,每次出價呈遞減趨勢,直至下限,則售電方出價pG的函數(shù)設(shè)計為:
(4)
式中:t為出價輪次;pG,t為售電方的第t輪出價;pG1為售電方首次出價;δG為售電方的貼現(xiàn)因子;pGmin為售電方的出價下限,可看作是售電方的發(fā)電成本。
同理,購電方首次出價是后續(xù)歷次出價中最低的,每次出價呈遞增趨勢,直至上限,則購電方出價pC的函數(shù)設(shè)計為:
(5)
式中:pC,t為購電方的第t輪出價;pC1為購電方首次出價;δC為購電方的貼現(xiàn)因子;pCmax為購電方的出價上限,可看作是購電方的購電成本。
3.2.2 首次出價設(shè)計
如市場主體未采用學(xué)習(xí)型出價策略(以下簡稱“自決策策略”),則售電方首次出價一般按其交易價格上限pGmax(通常是政府核準(zhǔn)的上網(wǎng)電價)出價;購電方首次出價一般按其交易價格下限pCmin(通常不會是0,而是根據(jù)歷史交易經(jīng)驗報一個較低的價格)出價。即:
(6)
但這樣出價較為刻板,對于學(xué)習(xí)型模型,交易雙方特別是售電方,會根據(jù)經(jīng)驗對談判對象、市場行情等綜合判斷,提出較為合理的首次出價。
在本文構(gòu)造的模型中,市場主體可根據(jù)先驗知識里對方交易底線的概率分布估計來預(yù)測,并結(jié)合自身交易底線,得出合理的首次出價,即
(7)
式中:EC1為售電方首次預(yù)測購電方交易底線的數(shù)學(xué)期望;EG1為購電方首次預(yù)測售電方交易底線的數(shù)學(xué)期望。
3.2.3 貼現(xiàn)因子分析
貼現(xiàn)因子的構(gòu)造直接決定出價特性。在考慮貼現(xiàn)因子的影響因素中,本文主要選取出價輪次和目標(biāo)價格,并關(guān)注對方的讓步幅度,同時設(shè)置調(diào)節(jié)系數(shù)作為模型微調(diào)。
3.2.3.1 出價輪次
交易時間是有限的,出價輪次體現(xiàn)了交易的時間成本。市場主體通常默認(rèn)一個最大出價輪次,隨著交易的進行,一般市場主體的成交欲望將變強烈,則貼現(xiàn)因子隨之越來越大。
3.2.3.2 目標(biāo)價格
市場主體交易時根據(jù)出價偏離目標(biāo)價格的程度不斷調(diào)整讓步幅度。對于自決策策略,以能使自身的交易利潤最大化的價格作為目標(biāo)價格,如售電方的價格上限、購電方的價格下限分別作為其各自的目標(biāo)價格。而對于學(xué)習(xí)型策略,市場主體將根據(jù)對方出價情況,預(yù)測對方出價底線(購電方的出價上限、售電方的出價下限)的數(shù)學(xué)期望作為目標(biāo)價格,期望能按該價格成交。當(dāng)然,對售電方而言不可低于出價下限,否則將以后者作為目標(biāo)價格;對購電方而言不可高于出價上限,否則將以后者為目標(biāo)價格。為追求目標(biāo)價格,貼現(xiàn)因子將隨著其偏離目標(biāo)價格的程度而呈現(xiàn)反向變化。
3.2.3.3 對方讓步情況
在討價還價的過程中,市場主體一般還關(guān)注對方還價的讓步情況,若對方讓步幅度較大,則己方也可適當(dāng)擴大讓步,以便交易可以合理開展下去;因此,貼現(xiàn)因子將隨著對方讓步變大而變大。
3.2.3.4 調(diào)節(jié)系數(shù)
調(diào)節(jié)系數(shù)在技術(shù)上可用于調(diào)節(jié)模型的準(zhǔn)確性,同時可以體現(xiàn)市場主體的出價特點。
3.2.4 貼現(xiàn)因子設(shè)計
根據(jù)以上分析,雙邊協(xié)商交易各方的貼現(xiàn)因子表達式設(shè)計如下。
對于售電方:
(8)
式中:tmax為最大出價輪次;kG為售電方貼現(xiàn)因子的調(diào)節(jié)系數(shù);EC(Xi︱πj)為售電方對購電方價格底線的數(shù)學(xué)期望;pGO為售電方的目標(biāo)價格。
對于購電方:
(9)
式中:kC為購電方貼現(xiàn)因子的調(diào)節(jié)系數(shù);pCO為購電方的目標(biāo)價格;EG(Xi︱πj)為購電方對售電方價格底線的數(shù)學(xué)期望。
根據(jù)式(8)、(9)可知:當(dāng)調(diào)節(jié)系數(shù)較小時,市場主體的出價讓步幅度較大,屬激進型;而調(diào)節(jié)系數(shù)較大時則讓步幅度較小,屬保守型。因此調(diào)節(jié)系數(shù)體現(xiàn)了市場主體不同的出價風(fēng)格,這與企業(yè)成交意愿的迫切程度、自身讓利空間、甚至交易員的個人性格等都有關(guān)系。
綜上所述,電力市場雙邊協(xié)商交易的學(xué)習(xí)型出價策略流程如圖1所示。
圖1 學(xué)習(xí)型出價策略流程
為驗證模型的合理性,探討其對市場運營的啟示,下面開展仿真分析。仿真暫不考慮電量博弈。
借鑒廣西電力中長期交易市場近年來的交易情況,以及廣西區(qū)內(nèi)火電企業(yè)的上網(wǎng)電價情況,對購售雙方的模型參數(shù)設(shè)置見表1。
表1 購售雙方參數(shù)設(shè)置
對于貝葉斯學(xué)習(xí)所需參數(shù),售電方關(guān)于購電方出價底線的先驗概率分布見表2。
表2 購電方出價底線的概率分布
售電方根據(jù)先驗知識得到關(guān)于購電方的出價概率分布估計見表3,如購電方出價底線在[35, 37)分/kWh的區(qū)間時,其出價落在[34, 35)分/kWh的概率是0.40。
表3 購電方出價的概率分布
購電方關(guān)于售電方出價底線的先驗概率分布見表4。
表4 售電方出價底線的概率分布
購電方根據(jù)先驗知識得到關(guān)于售電方的出價概率分布估計見表5,如售電方出價底線在[35, 36)分/kWh的區(qū)間時,其出價落在[36, 37)分/kWh的概率是0.10。
5.2.1 第1輪出價(雙方首次出價)
表5 售電方出價的概率分布
售電方獲得購電方的出價后,同理進行貝葉斯學(xué)習(xí),按照式(8)和式(4)繼續(xù)第2輪的出價;而購電方則按照式(9)和式(5)進行還價。
5.2.2 成交結(jié)果
經(jīng)過多輪出價后,雙方出價曲線如圖2所示??梢钥闯觯p方出價曲線在第13輪后相交,但由于第14輪售電方的出價(約為37.08分/kWh)低于第13輪中購電方的出價(約為37.60分/kWh),因此售電方將決定不再出價,按照第13輪中購電方出價成交,即成交價格約為37.60分/kWh。
圖2 出價曲線
本文提出的學(xué)習(xí)型策略主要特點是基于對市場行情和對手出價的經(jīng)驗進行貝葉斯學(xué)習(xí),得出己方更合理、更有利的出價。下面就此對學(xué)習(xí)型策略和自決策策略進行比較分析。
5.3.1 場景設(shè)計
如前文所述,自決策策略的第一次出價按式(6)計算,由于缺少了貝葉斯學(xué)習(xí),貼現(xiàn)因子表達式﹝式(8)、(9)﹞中的目標(biāo)價格將分別調(diào)整為pGmax和pCmin?;诒?參數(shù),設(shè)計3個交易場景進行對比:場景1——售電方和購電方均采用自決策策略;場景2——售電方采用學(xué)習(xí)型策略,購電方采用自決策策略;場景3——售電方和購電方均采用學(xué)習(xí)型策略。
為便于更廣泛地考查,令售電方、購電方的貼現(xiàn)因子調(diào)節(jié)系數(shù)kG、kC均在[1.5, 3]范圍內(nèi)變化,變化幅度為0.3,得到kG、kC各6個數(shù)據(jù),分別代表了由激進型向保守型變化的6個售電方和6個購電方。經(jīng)任意兩兩組合,形成36對交易,可看作構(gòu)造了一個小型的雙邊交易市場(簡稱“小市場”),涵蓋了不同出價風(fēng)格的市場主體。
5.3.2 價格分布分析
計算得到小市場在3個場景的成交價格分布如圖3所示??梢钥闯?,3種場景的價格曲面圖雖高低不一,但均呈現(xiàn)了相同的價格分布走勢,并體現(xiàn)了如下特點:kG越小,售電方的出價風(fēng)格由保守趨于激進,成交價格越低;kC越大,購電方的出價風(fēng)格由激進趨于保守,成交價格越低。對于小市場上的交易組合,最保守的售電方(kG最大)與最激進的購電方(kC最小)交易的成交價格最高,這是因為售電方讓步幅度最小,而購電方讓步幅度最大所致;反之,最激進的售電方(kG最小)與最保守的購電方(kC最大)交易的成交價格最低,這是因為售電方讓步幅度大,而購電方讓步幅度小所致。
圖3 3種場景的成交價格分布曲面
5.3.3 價格演進分析
進一步分析成交價格的場景演進:場景1的成交價格具體見表6;場景2的成交價格較場景1的變化情況見表7,場景3的成交價格較場景2的變化情況見表8,其中負(fù)數(shù)表示價格降低,正數(shù)表示價格提高。
表6 場景1的成交價格分布
表7 場景2的成交價格變化分布(對比場景1)
表8 場景3的成交價格變化分布(對比場景2)
從表7可以看出,場景2的售電方學(xué)習(xí)后,成交價格均有提高,這是有利于售電方的;但場景2是不穩(wěn)定的,因為場景3的成交價格均比場景2低,故購電方必將也采取學(xué)習(xí)型策略,最終雙方均采用學(xué)習(xí)型策略進行交易。
構(gòu)造場景4(購電方采用學(xué)習(xí)型策略,售電方采用自決策策略),按上述步驟與場景1和場景3對比(受篇幅所限本文不再羅列具體數(shù)據(jù)),可發(fā)現(xiàn)場景4的成交價格均比場景1低,場景3的成交價格均比場景4高。分析可知場景3是博弈的最終穩(wěn)定狀態(tài),且無論哪一方均不會放棄轉(zhuǎn)而采用自決策策略,否則成交價格將偏向?qū)Ψ?,己方獲利減少;因此,采用學(xué)習(xí)型策略是對雙方最為有利的結(jié)果。
針對電力市場雙邊協(xié)商交易,本文基于魯賓斯坦討價還價理論搭建交易模型框架,綜合考慮交易輪次、目標(biāo)價格、對方讓步情況和出價風(fēng)格來設(shè)計出價策略模型的貼現(xiàn)因子,結(jié)合貝葉斯學(xué)習(xí)理論形成市場主體的學(xué)習(xí)型出價策略。與傳統(tǒng)的雙邊協(xié)商交易模型相比,本策略可以模擬市場主體在交易中結(jié)合先驗經(jīng)驗綜合考慮合理出價的行為。仿真結(jié)果表明:單方采用學(xué)習(xí)型策略可使成交價格向己方有利的方向傾斜,而雙方均采用學(xué)習(xí)型策略將是博弈的穩(wěn)定形態(tài);不同出價風(fēng)格的市場主體開展交易將影響最終成交價格。
本文的研究工作可為市場主體制訂交易決策、市場交易行為仿真等提供一定參考,其中關(guān)于出價風(fēng)格的量化分類仍有待深入探討。如要貼近實際電力市場運行情況,還可在貼現(xiàn)因子泛化、交易中斷、信息互通等方面作進一步研究。