謝敬東,魯思薇,黃溪瀅,孫波,孫欣,陸池鑫
(1. 上海電力大學(xué),上海200082;2 國(guó)網(wǎng)上海市電力公司市南供電公司,上海200030)
中發(fā)〔2015〕9號(hào)文及其配套相關(guān)文件頒布以來(lái),中國(guó)電力市場(chǎng)開(kāi)始了新一輪的改革,提出要以現(xiàn)貨市場(chǎng)發(fā)現(xiàn)價(jià)格,建立交易品種齊全、功能完善的電力市場(chǎng)[1]。2020年7月,國(guó)家發(fā)展改革委、國(guó)家能源局聯(lián)合印發(fā)了《關(guān)于做好電力現(xiàn)貨市場(chǎng)試點(diǎn)連續(xù)試結(jié)算相關(guān)工作的通知》(發(fā)改辦能源規(guī)〔2020〕245號(hào))[2],進(jìn)一步推進(jìn)電力現(xiàn)貨市場(chǎng)建設(shè)。隨著市場(chǎng)改革的不斷深入,社會(huì)各界也更加重視市場(chǎng)風(fēng)險(xiǎn)防范問(wèn)題。在市場(chǎng)交易的過(guò)程中,市場(chǎng)主體為了獲取高額利潤(rùn),利用市場(chǎng)規(guī)則漏洞濫用市場(chǎng)力,嚴(yán)重?fù)p害現(xiàn)貨市場(chǎng)發(fā)現(xiàn)價(jià)格的能力[3 - 5]。其中,串謀是濫用市場(chǎng)力的主要方式之一,嚴(yán)重危害了市場(chǎng)的有效性,因此,建立一套現(xiàn)貨市場(chǎng)發(fā)電企業(yè)串謀識(shí)別的辦法,對(duì)于維護(hù)電力市場(chǎng)的安全、穩(wěn)定、可靠運(yùn)行,具有積極意義。
目前,國(guó)內(nèi)外關(guān)于電力市場(chǎng)串謀行為已經(jīng)進(jìn)行了大量的研究,文獻(xiàn)[6]對(duì)發(fā)電側(cè)電力市場(chǎng)二級(jí)委托代理機(jī)制下發(fā)電商的串謀行為和我國(guó)電力市場(chǎng)規(guī)制串謀行為的法律依據(jù)進(jìn)行了研究,提出了一種負(fù)激勵(lì)機(jī)制來(lái)有效抑制串謀行為的方法。文獻(xiàn)[7]應(yīng)用委托代理理論,構(gòu)建博弈論模型,分析了發(fā)電商采用串謀行為的動(dòng)機(jī)。文獻(xiàn)[8]對(duì)市場(chǎng)主體對(duì)于風(fēng)險(xiǎn)的厭惡特性進(jìn)行分析,設(shè)計(jì)了一套針對(duì)中長(zhǎng)期電量集中競(jìng)價(jià)市場(chǎng)通過(guò)二次分配出清量來(lái)抑制市場(chǎng)主體串謀的方法。這些文獻(xiàn)主要采用定性分析的方法,考慮了串謀形成的因素、抑制串謀的方法,但未對(duì)串謀行為進(jìn)行識(shí)別。文獻(xiàn)[9]提出了一種基于物理潮流分析的市場(chǎng)力分層評(píng)價(jià)指標(biāo)體系。文獻(xiàn)[10]提出了基于模糊集理論和層次分析法的電力市場(chǎng)綜合評(píng)價(jià)方法。文獻(xiàn)[11]設(shè)計(jì)了一種發(fā)電商報(bào)高價(jià)的不正當(dāng)合謀競(jìng)標(biāo)行為識(shí)別的綜合評(píng)判算法。這些文獻(xiàn)通過(guò)構(gòu)建評(píng)價(jià)指標(biāo),利用綜合評(píng)價(jià)評(píng)估市場(chǎng)中的串謀行為,但該方法不能隨著市場(chǎng)的發(fā)展進(jìn)行自我學(xué)習(xí)。文獻(xiàn)[12]提出基于AdaBoost-DT算法的串謀行為智能識(shí)別方法,將AdaBoost-DT集成分類算法用于串謀識(shí)別中,解決了串謀行為難以量化識(shí)別的問(wèn)題;文獻(xiàn)[13]構(gòu)建基于排序多元 Logit模型的卡特爾類機(jī)組串謀識(shí)別。文獻(xiàn)[14]利用模式識(shí)別的辦法,提出基于云模型與模糊Petri網(wǎng)的電力市場(chǎng)濫用市場(chǎng)力識(shí)別方法。上述文獻(xiàn)利用有監(jiān)督的智能算法實(shí)現(xiàn)了串謀行為的自我識(shí)別和自我適應(yīng),但目前我國(guó)電力市場(chǎng)正處于起步階段,市場(chǎng)中沒(méi)有明確的串謀機(jī)組樣本,而有監(jiān)督的算法需要較多的訓(xùn)練樣本,利用少量有標(biāo)簽數(shù)據(jù)訓(xùn)練出的模型,泛化能力差,難以適用新鮮樣本。而無(wú)監(jiān)督的方法利用無(wú)標(biāo)簽數(shù)據(jù),根據(jù)建立的模型評(píng)估未知數(shù)據(jù),一旦模型建立錯(cuò)誤,就會(huì)造成很大的偏差。
針對(duì)以上問(wèn)題,本文考慮我國(guó)電力現(xiàn)貨市場(chǎng)運(yùn)營(yíng)時(shí)間短、運(yùn)營(yíng)模式仍處于探索時(shí)期的現(xiàn)狀,結(jié)合專家經(jīng)驗(yàn)知識(shí),提出采用半監(jiān)督支持向量機(jī)算法,同時(shí)利用有標(biāo)簽樣本和無(wú)標(biāo)簽樣本進(jìn)行訓(xùn)練,根據(jù)樣本間的內(nèi)在聯(lián)系,訓(xùn)練出更為可靠的分類器。
半監(jiān)督支持向量機(jī)作為一種半監(jiān)督方法,已經(jīng)應(yīng)用于多個(gè)領(lǐng)域。在電力領(lǐng)域,文獻(xiàn)[15]提出了一種基于半監(jiān)督支持向量機(jī)的電壓暫降源定位方法,并表明在少量標(biāo)簽數(shù)據(jù)下,該方法定位準(zhǔn)確率高,能可靠定位出各類電壓暫降源位置。文獻(xiàn)[16]提出了一種基于半監(jiān)督支持向量機(jī)的電壓暫降源識(shí)別方法,在少量標(biāo)簽數(shù)據(jù)下半監(jiān)督支持向量機(jī)比傳統(tǒng)支持向量機(jī)具有更高的識(shí)別精度。文獻(xiàn)[17]提出了一種基于模糊C均值和支持向量機(jī)的半監(jiān)督支持向量機(jī)分類算法,評(píng)估供電企業(yè)的安全性。在圖像分類領(lǐng)域,文獻(xiàn)[18]提出了一種基于均值漂移的meanS3VM圖像分類方法。文獻(xiàn)[19]提出了一種新的圖像分類方法,將基于最優(yōu)標(biāo)號(hào)和次優(yōu)標(biāo)號(hào)的主動(dòng)學(xué)習(xí)和帶約束條件的自學(xué)習(xí)引入到基于支持向量機(jī)分類器的圖像分類算法中,獲得較高的準(zhǔn)確率和較好的魯棒性。文獻(xiàn)[20]提出了一種協(xié)同主動(dòng)學(xué)習(xí)和半監(jiān)督學(xué)習(xí)方法用于海冰遙感圖像分類,獲得較高的分類精度。文獻(xiàn)[21]提出了基于半監(jiān)督徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)自組織臨界態(tài)辨識(shí)方法,用時(shí)少、正確率高,滿足在線辨識(shí)電力系統(tǒng)自組織臨界態(tài)的要求。
綜上所述,本文提出了一種基于半監(jiān)督支持向量機(jī)的電力現(xiàn)貨市場(chǎng)發(fā)電企業(yè)串謀識(shí)別方法。首先,分析現(xiàn)貨市場(chǎng)發(fā)電企業(yè)串謀的特點(diǎn),建立串謀識(shí)別指標(biāo)體系;其次,利用Delphi法修正后的Topsis模型,對(duì)機(jī)組進(jìn)行初步判定,將機(jī)組串謀的可能性分為“高”、“中等”和“低”3種可能,構(gòu)成機(jī)組串謀識(shí)別模型的訓(xùn)練集;然后,利用訓(xùn)練集訓(xùn)練基于半監(jiān)督支持向量機(jī)的串謀識(shí)別模型,并利用訓(xùn)練好的模型對(duì)現(xiàn)貨市場(chǎng)中大量未知數(shù)據(jù)進(jìn)行識(shí)別;最后,將該方法應(yīng)用于某地區(qū)現(xiàn)貨市場(chǎng),對(duì)方法進(jìn)行驗(yàn)證。
串謀是指參與市場(chǎng)的主體通過(guò)主體間的協(xié)商、簽訂合同等方式,締結(jié)為一個(gè)“聯(lián)盟”,以獲得更高的利潤(rùn)[22]。在電力市場(chǎng)中,串謀的途徑大致分為兩類,一類是通過(guò)私下簽訂合同的方式,將雙方綁定為一個(gè)利益整體。另一類是通過(guò)默契串謀,聯(lián)盟內(nèi)成員通過(guò)對(duì)市場(chǎng)規(guī)則以及市場(chǎng)成員報(bào)價(jià)行為的掌握,經(jīng)過(guò)一段時(shí)間后,形成有利于提高聯(lián)盟整體利潤(rùn)的報(bào)價(jià)方式[23]。在現(xiàn)階段,現(xiàn)貨市場(chǎng)正處于起步,市場(chǎng)成員對(duì)市場(chǎng)規(guī)則不夠熟悉,對(duì)市場(chǎng)成員的報(bào)價(jià)方式也不夠了解,因此參與串謀的成員往往以等報(bào)價(jià)或者等報(bào)價(jià)變化的簡(jiǎn)單方式進(jìn)行串謀[24]。
在現(xiàn)貨市場(chǎng)中,發(fā)電企業(yè)的串謀是通過(guò)其控制的發(fā)電機(jī)組進(jìn)行的,并且串謀往往是發(fā)生在兩臺(tái)或兩臺(tái)以上的機(jī)組之間的。因此,本文將兩臺(tái)機(jī)組作為一個(gè)機(jī)組對(duì),構(gòu)建基于機(jī)組對(duì)的指標(biāo)體系,旨在通過(guò)觀察機(jī)組對(duì)的關(guān)聯(lián)性,識(shí)別機(jī)組潛在的串謀行為。同時(shí),本文認(rèn)為當(dāng)機(jī)組a和機(jī)組b發(fā)生串謀,機(jī)組a和機(jī)組c發(fā)生串謀,則認(rèn)為機(jī)組a、機(jī)組b和機(jī)組c之間屬于同一個(gè)串謀聯(lián)盟。
串謀識(shí)別指標(biāo)體系基于系統(tǒng)性、科學(xué)性和可操作性原則,將所有指標(biāo)分為判斷報(bào)價(jià)相似性的報(bào)價(jià)相似情況指標(biāo)類、判斷報(bào)價(jià)變化同步性的報(bào)價(jià)變化同步情況指標(biāo)類,以及判斷機(jī)組參與市場(chǎng)結(jié)果的中標(biāo)情況指標(biāo)3大類。報(bào)價(jià)相似指標(biāo)和報(bào)價(jià)改變同步性指標(biāo)主要是考察發(fā)電機(jī)組在市場(chǎng)中的行為,可以反映機(jī)組是否采用相同的報(bào)價(jià)策略,即反映機(jī)組是否串通報(bào)價(jià);中標(biāo)情況指標(biāo)用來(lái)衡量機(jī)組報(bào)價(jià)策略的成功度,通過(guò)中標(biāo)情況指標(biāo)判定機(jī)組是否串謀成功。
下面給出指標(biāo)的具體定義及其計(jì)算方式。
1.1.1 報(bào)價(jià)一致性
報(bào)價(jià)一致性指標(biāo)表示機(jī)組i和機(jī)組j的報(bào)價(jià)一致性情況,其計(jì)算方式如式(1)所示。
(1)
1.1.2 報(bào)量一致性
報(bào)量一致性指標(biāo)表示機(jī)組i和機(jī)組j的報(bào)量一致性情況,其計(jì)算方式如式(2)所示。
(2)
1.1.3 報(bào)價(jià)曲線差異度[12]
機(jī)組報(bào)價(jià)曲線差異度定義為機(jī)組i的報(bào)價(jià)曲線及機(jī)組j的報(bào)價(jià)曲線之間的陰影面積,如圖1所示。
圖1 報(bào)價(jià)曲線差異度Fig.1 Difference degree of quotation curve
機(jī)組報(bào)價(jià)曲線差異度的計(jì)算公式為:
(3)
(4)
1.2.1 報(bào)價(jià)變化一致性
機(jī)組對(duì)報(bào)價(jià)變化一致性定義為機(jī)組i和機(jī)組j報(bào)價(jià)變化的一致性,機(jī)組i的報(bào)價(jià)變化是指機(jī)組i本次申報(bào)的價(jià)格與其前一次申報(bào)的價(jià)格的差值,機(jī)組j的報(bào)價(jià)變化是指機(jī)組j本次申報(bào)的價(jià)格與其前一次申報(bào)的價(jià)格的差值,其計(jì)算公式如下。
Pc,i=[(pi,1,t-pi,1,t-1),…,(pi,h,t-pi,h,t-1),
…,(pi,H,t-pi,H,t-1)]
(5)
(6)
1.2.2 報(bào)量變化一致性
機(jī)組對(duì)報(bào)量變化一致性定義為機(jī)組i和機(jī)組j申報(bào)容量變化的一致性,機(jī)組i的報(bào)量變化是指機(jī)組i本次申報(bào)的申報(bào)容量與其前一次申報(bào)的申報(bào)容量的差值,機(jī)組j的報(bào)量變化是指機(jī)組j本次申報(bào)的申報(bào)容量與其前一次申報(bào)的申報(bào)容量的差值,其計(jì)算公式如下。
Qc,i=[(qi,1,t-qi,1,t-1),…,(qi,h,t-qi,h,t-1),
…,(qi,H,t-qi,H,t-1)]
(7)
(8)
1.2.3 報(bào)價(jià)變化曲線差異度
機(jī)組報(bào)價(jià)變化曲線差異度定義為機(jī)組i的報(bào)價(jià)變化曲線及機(jī)組j的報(bào)價(jià)變化曲線之間的陰影面積,機(jī)組報(bào)價(jià)變化曲線差異度的計(jì)算公式為:
(9)
在現(xiàn)實(shí)生活中,發(fā)電機(jī)組的發(fā)電成本是發(fā)電企業(yè)私有的,機(jī)組參與市場(chǎng)所獲得的利潤(rùn)是不可知的,因此,本文用機(jī)組中標(biāo)率來(lái)判斷機(jī)組間串謀的可能性。
1.3.1 中標(biāo)率
機(jī)組對(duì)中標(biāo)率定義為機(jī)組i的總中標(biāo)量與總申報(bào)量的比值,其計(jì)算方式如下:
(10)
1.3.2 高價(jià)中標(biāo)率
機(jī)組高價(jià)中標(biāo)率定義為機(jī)組報(bào)高價(jià)且中標(biāo)電量占報(bào)高價(jià)的有效申報(bào)電量的比例。高價(jià)中標(biāo)率通過(guò)發(fā)電商成交情況與申報(bào)情況的比較反映發(fā)電商的競(jìng)標(biāo)策略與自身實(shí)力的配合情況,用于評(píng)價(jià)發(fā)電商策略的成功率與所具有的市場(chǎng)力。其計(jì)算公式為:
(11)
機(jī)組動(dòng)態(tài)市場(chǎng)份額定義為機(jī)組的中標(biāo)量占市場(chǎng)總中標(biāo)量的比例,其計(jì)算公式為:
(12)
通過(guò)計(jì)算機(jī)組市場(chǎng)份額,可以評(píng)估該機(jī)組的市場(chǎng)力,若該機(jī)組的市場(chǎng)份額過(guò)高,說(shuō)明機(jī)組報(bào)價(jià)策略較為成功。
智能識(shí)別算法可以實(shí)現(xiàn)對(duì)大規(guī)模數(shù)據(jù)的快速判斷,但需要一定量的訓(xùn)練樣本。對(duì)于現(xiàn)階段的電力市場(chǎng)而言,并沒(méi)有足夠的串謀機(jī)組樣本來(lái)進(jìn)行模型的訓(xùn)練。因此,本文先對(duì)機(jī)組進(jìn)行初步判定,借助專家的經(jīng)驗(yàn)知識(shí),結(jié)合數(shù)據(jù)本身特點(diǎn),利用上文建立的指標(biāo)體系,利用Delphi法修正后的Topsis模型,對(duì)現(xiàn)貨市場(chǎng)的串謀行為進(jìn)行初步判定,為下一階段模型的訓(xùn)練提供數(shù)據(jù)。文獻(xiàn)[25]使用不同的方法研究發(fā)電商串謀,但都考慮了機(jī)組通過(guò)串謀獲得超額利潤(rùn)的特性,因此,參考以上文獻(xiàn),本文采用“漏斗式”分析方法,如圖2所示。首先,重點(diǎn)考察機(jī)組的中標(biāo)情況,并將其作為判斷機(jī)組是否串謀的重要因素,通過(guò)判斷中標(biāo)情況,對(duì)機(jī)組進(jìn)行初步劃分,當(dāng)機(jī)組中標(biāo)情況評(píng)估分值S1低于閾值W1時(shí),認(rèn)定機(jī)組為“低串謀可能性”。然后判斷機(jī)組是否有串謀的行為動(dòng)作,即考察機(jī)組報(bào)價(jià)相似情況和報(bào)價(jià)變化同步情況,對(duì)機(jī)組劃分結(jié)果進(jìn)行修正,對(duì)修正后的機(jī)組進(jìn)行再一次的劃分。
圖2 機(jī)組串謀判定整體流程Fig.2 Process of unit collusion judgment
步驟1:利用現(xiàn)貨市場(chǎng)數(shù)據(jù),計(jì)算相應(yīng)指標(biāo),對(duì)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理;
步驟2:隨機(jī)選取機(jī)組對(duì)如機(jī)組i和機(jī)組j;
步驟3:判斷機(jī)組i和機(jī)組j的中標(biāo)情況,若機(jī)組i和機(jī)組j的中標(biāo)情況綜合評(píng)價(jià)結(jié)果S1低于閾值W1, 則認(rèn)為機(jī)組間有“低串謀可能性”;否則轉(zhuǎn)向步驟2;
步驟4:判斷機(jī)組i和機(jī)組j的報(bào)價(jià)相似情況和報(bào)價(jià)改變情況,利用報(bào)價(jià)相似情況和報(bào)價(jià)改變同步情況,對(duì)中標(biāo)情況的綜合評(píng)價(jià)結(jié)果進(jìn)行修正,若機(jī)組i和機(jī)組j報(bào)價(jià)相似或報(bào)價(jià)改變同步,則認(rèn)為機(jī)組i和機(jī)組j更有可能進(jìn)行串謀,應(yīng)對(duì)評(píng)價(jià)結(jié)果進(jìn)行放大,當(dāng)修正后的評(píng)價(jià)結(jié)果超過(guò)閾值W3時(shí),則認(rèn)為機(jī)組i和機(jī)組j之間有“高串謀可能性”;當(dāng)修正后的評(píng)價(jià)結(jié)果在閾值W2之間時(shí),則認(rèn)為機(jī)組i和機(jī)組j之間有“中等串謀可能性”;當(dāng)修正后的評(píng)價(jià)結(jié)果低于閾值W2時(shí),則認(rèn)為機(jī)組i和機(jī)組j之間有“低串謀可能性”;
步驟5:重復(fù)步驟1至步驟4,直至所有機(jī)組對(duì)判斷完畢。
Delphi法作為一種主觀賦權(quán)方法,能夠較好適應(yīng)現(xiàn)貨市場(chǎng)的發(fā)展階段,其本質(zhì)上是一種反饋匿名函詢法。其大致流程為:在對(duì)所要預(yù)測(cè)的問(wèn)題征得專家的意見(jiàn)之后,進(jìn)行整理、歸納、統(tǒng)計(jì),再匿名反饋給各專家,再次征求意見(jiàn),再集中,再反饋,直至得到一致的意見(jiàn)。
Topsis(優(yōu)劣距離法)是常用的綜合評(píng)價(jià)方法,能充分利用原始數(shù)據(jù)的信息,精確反映各個(gè)評(píng)價(jià)方案之間的優(yōu)劣。其基本思路是,在一個(gè)評(píng)價(jià)方案的集合中,分別找出一個(gè)最優(yōu)解(每個(gè)屬性值都是該屬性的最優(yōu)值)和最劣解(每個(gè)屬性值都是該屬性的最差值),并將評(píng)價(jià)方案集合中的每一個(gè)方案與最優(yōu)解、最劣解的距離進(jìn)行比較,既靠近最優(yōu)解又遠(yuǎn)離最劣解的方案,就是方案集中的最優(yōu)方案。
在利用Topsis模型進(jìn)行評(píng)價(jià)的過(guò)程中,引入Delphi法確定的主觀權(quán)重,具體步驟如下。
經(jīng)過(guò)正規(guī)手術(shù)及合理的治療后,兒童及青少年甲狀腺癌預(yù)后良好,治療后長(zhǎng)期生存率很高,分化型甲狀腺癌長(zhǎng)期生存率超過(guò)90%;甲狀腺髓樣癌的5年和15年生存率均超過(guò)85%。但與成人相比,其復(fù)發(fā)比例仍較高,可達(dá)10%~35%[28-29],故定期的隨訪很重要,包括超聲以及檢測(cè)血清Tg水平,超聲隨訪方案為初次手術(shù)后至少6個(gè)月內(nèi)需進(jìn)行頸部超聲檢查,之后每6~12個(gè)月復(fù)查1次[5]。
步驟1:對(duì)于歸一化后的指標(biāo)進(jìn)行正向化處理。
步驟2:利用專家打分法確定指標(biāo)權(quán)重,m個(gè)指標(biāo)的權(quán)重分別為{α1,…,αm}。
步驟3:構(gòu)造加權(quán)矩陣如下。
(13)
式中znm為第n個(gè)機(jī)組對(duì)的第m個(gè)指標(biāo)。
步驟4:尋找最優(yōu)解z+和最劣解z-如下。
(14)
步驟5:求解每個(gè)方案到最優(yōu)解解z+和最劣解z-的距離。
(15)
步驟6: 求解每個(gè)方案與最優(yōu)解相對(duì)接近程度。
(16)
式中:Ci為第i個(gè)評(píng)價(jià)方案與最優(yōu)解的相對(duì)接近程度,Ci越大,表明評(píng)價(jià)對(duì)象越接近最優(yōu)值。
根據(jù)2.1節(jié)內(nèi)容,先利用2.2節(jié)的Topsis模型求得中標(biāo)情況的綜合評(píng)價(jià)結(jié)果S1, 對(duì)于S1大于W1的機(jī)組進(jìn)行下一步判斷。在S1的基礎(chǔ)上,結(jié)合報(bào)價(jià)相似情況和報(bào)價(jià)變化同步情況的綜合評(píng)價(jià)結(jié)果得到S2, 計(jì)算公式如式(17)所示。
S2=S1×eγ+θ-1
(17)
式中:γ為報(bào)價(jià)相似和報(bào)價(jià)變化同步情況綜合評(píng)價(jià)結(jié)果的歸一化值;θ為縮放因子,可以根據(jù)電力市場(chǎng)實(shí)際運(yùn)行情況取值,當(dāng)縮放因子取值較大時(shí),對(duì)S1的放大程度越大,反之越小。
表1 某地區(qū)現(xiàn)貨市場(chǎng)報(bào)價(jià)數(shù)據(jù)Tab.1 Quotation data of spot market in a region
由第2節(jié)可以得到初步判定的串謀機(jī)組,利用初步判定的串謀機(jī)組進(jìn)行模型的訓(xùn)練。
支持向量機(jī)是一種二分類模型,它的目的是尋找一個(gè)平面對(duì)樣本進(jìn)行分割。設(shè)有標(biāo)記的樣本數(shù)據(jù)為{(xi,yi)},i=1,2,…,N, 其中xi∈RP為特征數(shù)據(jù)集,yi∈{-1,1}為類別標(biāo)簽。SVM的判別模型為:
f(X)=sign(ωTX+b)
(18)
式中:ω和b為系數(shù)向量。
設(shè)最優(yōu)分界面為ωTx+b=0, SVM的目標(biāo)是求解其最優(yōu)解,求解問(wèn)題最終可以轉(zhuǎn)化為式(19)的帶約束的凸二次規(guī)劃問(wèn)題。
(19)
式中:ξi=1-yi(ωTxi+b)為損失函數(shù);C為懲罰參數(shù),C越大表示對(duì)錯(cuò)誤分類的懲罰越大,C越小表示對(duì)錯(cuò)誤分類的懲罰越小。根據(jù)凸優(yōu)化理論,借助拉格朗日乘子將約束問(wèn)題轉(zhuǎn)換為無(wú)約束問(wèn)題。
βi≥0,μi≥0
(20)
式中β、μ為拉格朗日乘子。
根據(jù)拉格朗日對(duì)偶原理,將式(20)化為其對(duì)偶問(wèn)題。
(21)
解式(21)求優(yōu)化函數(shù)對(duì)ω,b,ξ的極小值,令:
(22)
代入拉格朗日函數(shù)中,可以得到:
(23)
則問(wèn)題最終轉(zhuǎn)化為:
(24)
基于半監(jiān)督支持向量機(jī)的串謀識(shí)別模型訓(xùn)練集由有標(biāo)簽機(jī)組樣本和無(wú)標(biāo)簽機(jī)組樣本組成,兩者符合獨(dú)立同分布的假設(shè),有標(biāo)簽機(jī)組樣本集為:
(25)
無(wú)標(biāo)簽機(jī)組樣本集為:
Unlab={xN+1,xN+2,…,xN+M},xi∈RP
(26)
則基于半監(jiān)督支持向量機(jī)串謀識(shí)別模型的求解問(wèn)題為:
s.t.yi(ωTxi+b)≥1-ξi,i=1,2,…,N
(27)
半監(jiān)督支持向量機(jī)的求解是從無(wú)標(biāo)記機(jī)組樣本中,找到使分類超平面的分類間隔最大的標(biāo)記,作為無(wú)標(biāo)記機(jī)組樣本的最終標(biāo)記。該方法可以得到全局最優(yōu)解,具有較好的性能。
本文采用某地區(qū)現(xiàn)貨市場(chǎng)報(bào)價(jià)數(shù)據(jù),選取其中166臺(tái)發(fā)電機(jī)組,共計(jì)13 695條樣本。在該地區(qū)現(xiàn)貨市場(chǎng)中,采用十段報(bào)價(jià)形式,參與市場(chǎng)的機(jī)組在日前市場(chǎng)中申報(bào)一組價(jià)格,同時(shí)用于日前市場(chǎng)出清和實(shí)時(shí)各時(shí)段的出清,部分機(jī)組報(bào)價(jià)數(shù)據(jù)表1所示。串謀機(jī)組的初步判定針對(duì)指標(biāo)權(quán)重問(wèn)題,詢問(wèn)3位專家,對(duì)專家的反饋意見(jiàn)進(jìn)行整理、歸納、統(tǒng)計(jì);然后匿名反饋給專家,再次征求意見(jiàn),直至意見(jiàn)統(tǒng)一,確定的最終權(quán)重如表2和表3所示。
表2 中標(biāo)情況指標(biāo)權(quán)重Tab.2 Index weights of bidding situation
表3 報(bào)價(jià)相似和報(bào)價(jià)變化同步情況指標(biāo)權(quán)重Tab.3 Index weights of similar quotation and synchronous quotation change
表4 中標(biāo)情況評(píng)估的最優(yōu)最劣方案Tab.4 The best and worst cases of bid winning
圖3 不同θ下,修正前后結(jié)果對(duì)比Fig.3 Comparison of results before and after correction under different θ
由計(jì)算得到的串謀識(shí)別指標(biāo)體系,分別對(duì)各項(xiàng)指標(biāo)進(jìn)行同向化處理,將所有指標(biāo)轉(zhuǎn)化為極大型指標(biāo),然后進(jìn)行標(biāo)準(zhǔn)化處理,可以得到如表4所示的最優(yōu)最劣方案。
根據(jù)最優(yōu)和最劣方案計(jì)算相對(duì)接近度,得到最終的評(píng)估結(jié)果S1, 同理,可以得到報(bào)價(jià)相似和報(bào)價(jià)變化同步情況的綜合評(píng)價(jià)結(jié)果S′2, 利用式(17)對(duì)S1的值進(jìn)行修正,即利用報(bào)價(jià)相似和報(bào)價(jià)變化同步情況對(duì)S1值進(jìn)行縮放,對(duì)于報(bào)價(jià)相似性高和報(bào)價(jià)變化同步性也高的,通過(guò)修正,放大S1的值;對(duì)于報(bào)價(jià)相似性低和報(bào)價(jià)變化同步性也低的機(jī)組,縮小S1的值,最終得到S2的值,再次對(duì)機(jī)組進(jìn)行劃分。10臺(tái)機(jī)組對(duì)在不同的縮放因子θ下,修正前后的對(duì)比如圖3所示。
由圖3中,機(jī)組對(duì)1和機(jī)組對(duì)2可以看出,當(dāng)S1的值較小,S′2值較大時(shí),通過(guò)修正,最終的S2值變大,即當(dāng)機(jī)組中標(biāo)情況評(píng)價(jià)結(jié)果較低,報(bào)價(jià)相似和報(bào)價(jià)變化同步情況評(píng)價(jià)較高時(shí),最終的評(píng)價(jià)分值也會(huì)變高,此時(shí)修正前的分值小于修正后的分值,且θ值越大修正后的評(píng)價(jià)分值越高;由機(jī)組對(duì)7和機(jī)組對(duì)8可以看出,當(dāng)S1的值較大,S′2值較小時(shí),通過(guò)修正(θ取值合適,例如上圖中的θ=0.5),最終的S2值變小,即當(dāng)機(jī)組中標(biāo)情況評(píng)價(jià)結(jié)果較高,報(bào)價(jià)相似和報(bào)價(jià)變化同步情況評(píng)價(jià)較低,且θ取值合適時(shí),最終的評(píng)價(jià)分值也會(huì)變低。
最后,通過(guò)對(duì)串謀機(jī)組的初步判定,“高串謀可能性”的機(jī)組樣本共有1 068條樣本,“中等串謀可能性”的機(jī)組樣本共有1 515條樣本,“低串謀可能性”的樣本共有11 112條樣本,如圖4所示。
圖4 樣本分類Fig.4 Sample classification
為了驗(yàn)證半監(jiān)督支持向量機(jī)在串謀識(shí)別中的有效性。本文將所有樣本分為兩類,強(qiáng)串謀機(jī)組樣本作為正樣本,較強(qiáng)串謀機(jī)組樣本和無(wú)串謀機(jī)組樣本作為負(fù)樣本,由于正負(fù)樣本數(shù)相差巨大,嚴(yán)重影響識(shí)別的精度,且本文的目的是正確識(shí)別強(qiáng)串謀機(jī)組樣本即正確識(shí)別正樣本,因此對(duì)負(fù)樣本進(jìn)行隨機(jī)分組,分為10組,每組有負(fù)樣本1 263條,將正樣本分別和10組負(fù)樣本進(jìn)行組合,構(gòu)成10個(gè)包含正負(fù)樣本的樣本集。
本文采用準(zhǔn)確率、召回率及F-Measure對(duì)串謀識(shí)別模型進(jìn)行評(píng)價(jià),準(zhǔn)確率表示所有被識(shí)別為正樣本的樣本中,真正的正樣本的比率;召回率是指所有正樣本中被識(shí)別為正樣本的比率;F-Measure是對(duì)準(zhǔn)確率與召回率的一個(gè)綜合指標(biāo),3個(gè)評(píng)價(jià)指標(biāo)的計(jì)算公式如下。
(28)
(29)
(30)
式中:Rpre為識(shí)別模型的準(zhǔn)確率,準(zhǔn)確率越大,被評(píng)價(jià)模型越好;Rrec為識(shí)別模型的召回率,召回率越大,被評(píng)價(jià)模型越好;F為識(shí)別模型的F-Measure,越接近于1越好;QTP為被正確識(shí)別的正樣本數(shù)量;QFP表示被識(shí)別成正樣本的負(fù)樣本數(shù)量;QFN為被識(shí)別為負(fù)樣本的正樣本數(shù)量。
不斷改變有標(biāo)簽樣本數(shù)據(jù)的占比,用綜合指標(biāo)F評(píng)價(jià)來(lái)評(píng)價(jià)模型,對(duì)10個(gè)樣本集分別進(jìn)行測(cè)試,10組數(shù)據(jù)分別訓(xùn)練模型得出的機(jī)組串謀識(shí)別結(jié)果統(tǒng)計(jì)如表5所示。
表5 機(jī)組串謀識(shí)別結(jié)果統(tǒng)計(jì)Tab.5 Statistics of unit collusion identification results
由表5可以看出,在10組樣本集進(jìn)行模型訓(xùn)練中,基于半監(jiān)督支持向量機(jī)的串謀識(shí)別模型的識(shí)別效果明顯優(yōu)于基于支持向量機(jī)的串謀識(shí)別模型。
表6 半監(jiān)督支持向量機(jī)模型的識(shí)別結(jié)果Tab.6 Recognition results of semi supervised SVM model
圖5為有標(biāo)簽數(shù)據(jù)占比不同的模型結(jié)果。由圖5可以看出,隨著有標(biāo)簽數(shù)據(jù)樣本的增多,模型的F值越近于1,模型越好。但當(dāng)有標(biāo)簽數(shù)據(jù)占比超過(guò)30%,模型的F值增加速度變慢,并趨于穩(wěn)定。因此,本文采用30%的數(shù)據(jù)為有標(biāo)簽數(shù)據(jù)來(lái)進(jìn)行模型訓(xùn)練。
圖5 有標(biāo)簽數(shù)據(jù)占比不同的模型結(jié)果Fig.5 Model results with different proportion of labeled data
對(duì)于每一個(gè)包含正負(fù)樣本的樣本集,其中30%為測(cè)試集,30%為有標(biāo)簽的樣本,40%為無(wú)標(biāo)簽的樣本,進(jìn)行模型的訓(xùn)練。并且將本文的半監(jiān)督支持向量機(jī)方法和傳統(tǒng)支持向量機(jī)方法進(jìn)行對(duì)比,其中第1組樣本集的結(jié)果展示如圖6所示。所有10組樣本集訓(xùn)練的模型效果統(tǒng)計(jì)如表6所示。
表6對(duì)于市場(chǎng)中大量的未知數(shù)據(jù),利用訓(xùn)練完成的模型進(jìn)行識(shí)別,識(shí)別出“高串謀可能性”機(jī)組。由表6可以看出,機(jī)組對(duì)1的中標(biāo)率為1,說(shuō)明其百分百中標(biāo),且其報(bào)價(jià)和報(bào)價(jià)變化均較為相似;機(jī)組對(duì)2中標(biāo)率較大,且高價(jià)中標(biāo)率指標(biāo)大,報(bào)價(jià)和報(bào)價(jià)變化均較為相似;機(jī)組對(duì)5雖然其中標(biāo)率和高價(jià)中標(biāo)率指標(biāo)較低,但其報(bào)價(jià)和報(bào)價(jià)變化非常相似,通過(guò)評(píng)估分值修正后,依然能夠達(dá)到較高的分值,以上機(jī)組被識(shí)別出,驗(yàn)證了半監(jiān)督支持向量機(jī)模型的正確性。
本文在分析現(xiàn)貨市場(chǎng)機(jī)組串謀特點(diǎn)的基礎(chǔ)上,構(gòu)建了新的機(jī)組對(duì)串謀識(shí)別指標(biāo)體系。并根據(jù)機(jī)組串謀特征,將機(jī)組串謀狀態(tài)進(jìn)行分類。在電力現(xiàn)貨市場(chǎng)無(wú)串謀機(jī)組樣本的情況下,利用Delphi法修正后的Topsis模型,對(duì)機(jī)組進(jìn)行初步判別,形成模型的訓(xùn)練集,然后提出了基于半監(jiān)督支持向量機(jī)的串謀識(shí)別模型,經(jīng)實(shí)例計(jì)算證明,該方法對(duì)現(xiàn)貨市場(chǎng)串謀機(jī)組的識(shí)別有較高的準(zhǔn)確性。得到如下結(jié)論。
1)本文對(duì)現(xiàn)貨市場(chǎng)串謀機(jī)組的初步判定,是出于構(gòu)建訓(xùn)練集的目的。在判定的過(guò)程中,考慮了專家經(jīng)驗(yàn),只適用于現(xiàn)貨市場(chǎng)建設(shè)初期,串謀機(jī)組樣本缺少的情況。當(dāng)市場(chǎng)運(yùn)營(yíng)發(fā)展過(guò)程中發(fā)現(xiàn)了明確的串謀機(jī)組,就可利用市場(chǎng)中明確發(fā)現(xiàn)的機(jī)組作為訓(xùn)練集。
2)綜合考慮現(xiàn)貨市場(chǎng)機(jī)組串謀特征以及串謀識(shí)別指標(biāo)體系,將機(jī)組串謀狀態(tài)分為“強(qiáng)串謀”狀態(tài)、“較強(qiáng)串謀”狀態(tài)和“無(wú)串謀”狀態(tài),有助于串謀機(jī)組的快速識(shí)別。
3)基于半監(jiān)督支持向量機(jī)的串謀識(shí)別模型同時(shí)利用市場(chǎng)中的有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練,提高了串謀識(shí)別的準(zhǔn)確率,有助于防范現(xiàn)貨市場(chǎng)機(jī)組間的串謀行為。