張滸+王敏+黃心漢
收稿日期:2013-06-20
作者簡(jiǎn)介:張 滸(1982—),男,湖北武漢人,博士研究生,研究方向:模式識(shí)別與智能系統(tǒng)。
通訊聯(lián)系人,E-mail:batigooal@gmail.com
文章編號(hào):1003-6199(2014)03-0027-04
摘 要:根據(jù)鉛酸蓄電池在放電過程中內(nèi)部電化學(xué)反應(yīng)導(dǎo)致外部電特性變化的特點(diǎn),提出一種基于支持向量機(jī)原理的電解液密度辨識(shí)模型。利用支持向量機(jī)理論非線性回歸的特性,簡(jiǎn)化測(cè)量電解液密度的過程,在惡劣環(huán)境下檢測(cè)動(dòng)力電池的電解液密度更顯其優(yōu)越性。預(yù)測(cè)實(shí)驗(yàn)表明,采用改進(jìn)的交叉驗(yàn)證預(yù)測(cè)模型具有泛化能力強(qiáng)、穩(wěn)定性好的特點(diǎn),并且在小樣本的條件下能達(dá)到預(yù)期的辨識(shí)精度。
關(guān)鍵詞:電解液密度;支持向量機(jī);交叉驗(yàn)證;參數(shù)辨識(shí)
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A
Parameter Identification of Power Battery
with Support Vector Regression
ZHANG Hu,WANG Min,HUANG Xin-han
(University of Science & Technology, School of Automation,Wuhan,Hubei 430074,China)
Abstract:This paper presents an identification model of electrolyte density, which based on the Support Vector Machine Theory, according to the feature that the chemical reaction of interior electrics leading to the characteristic change of exterior electrics in the discharge process of the lead-acid battery. This model simplifies the process of measuring the electrolyte density by using the nonlinear regression characteristics of the Support Vector Machine Theory, and it works better when measuring the electrolyte density of power battery in severe environment. Prediction experiment shows that the improved cross-validation pridiction model is featured by good generalization capability and stability, and can reach the expected identifying accuracy on small sample.
Key words:electrolyte density;support vector machine;cross validation;parameter identification
1 引 言
鉛酸蓄電池的電解液密度是決定鉛酸蓄電池剩余容量的重要指標(biāo),它表示電解液中參加化學(xué)反應(yīng)的活性物質(zhì)的數(shù)量。檢測(cè)電解液密度的傳統(tǒng)方法有很多,比較常見的有諧振法[1]、超聲波測(cè)量和γ射線法[2]等。γ射線法的缺點(diǎn)在于使用了放射性物質(zhì),適用場(chǎng)合受到極大限制;諧振法雖然精度高、結(jié)構(gòu)簡(jiǎn)單,但是成本也很高,價(jià)格昂貴,體積較大,維護(hù)較難[3];超聲波法受到溫度的影響較大[4]。本文將統(tǒng)計(jì)學(xué)理論中的支持向量回歸原理應(yīng)用到電解液密度測(cè)量中,以某品牌鉛酸蓄電池的八組放電數(shù)據(jù)為基礎(chǔ),建立了電解液密度的預(yù)測(cè)模型,并對(duì)采用不同方法建立的支持向量回歸模型進(jìn)行了測(cè)試和比較。
2 電解液密度與極板電勢(shì)的關(guān)系
鉛酸蓄電池放電過程的化學(xué)方程為:
Pb+PbO2+2H++2HSO-4放電
2PbSO4+2H2O (1)
由上式可看出,放電過程中硫酸根離子參與反應(yīng)變成了硫酸鉛和水,隨著電解液中的硫酸根離子的減少,電解液的密度和濃度都會(huì)相應(yīng)的下降[5]。全放電過程測(cè)出的數(shù)據(jù)表明:電解液的密度一般會(huì)從1.16g/cm3下降到1.06 g/cm3,同時(shí),硫酸溶液的濃度從22.2%下降到9.3%。
鉛酸蓄電池的正、負(fù)極極板電勢(shì)是構(gòu)成蓄電池端電壓的主要因素,它們是相互獨(dú)立的,分別取決于各自極板上電化學(xué)物質(zhì)的反應(yīng)規(guī)律和反應(yīng)程度。因此,正負(fù)極板的電勢(shì)在放電過程中的變化與電解液的密度之間必然存在著對(duì)應(yīng)的關(guān)系。通過正負(fù)極板的電勢(shì)大小預(yù)測(cè)電解液密度的方法已經(jīng)廣泛的應(yīng)用于實(shí)踐中并取得了良好的效果[6]。
另一方面,當(dāng)放電倍率越高時(shí),放電電流密度越大,電流在電極上分布不均勻,電解液不能夠提供給正負(fù)電極所需要的足夠的反應(yīng)物質(zhì),即反應(yīng)物質(zhì)的利用率下降,導(dǎo)致電解液密度所能達(dá)到的最大值下降,蓄電池所能釋放的容量減小。所以,在放電電流不同的時(shí)候,電解液密度的變化率以及變化區(qū)間都是不相同的[7]。
綜上所述,影響電解液密度的參數(shù)包含正、負(fù)極板樣本數(shù)據(jù)使用八組不同放電倍率下鉛酸蓄電池的放電數(shù)據(jù),任取七組數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型。在訓(xùn)練方法上,分別應(yīng)用兩種不同的驗(yàn)證方法來尋找模型的最優(yōu)參數(shù)并用第八組數(shù)據(jù)測(cè)試這兩組最優(yōu)參數(shù)所構(gòu)建的模型的泛化能力。
3 回歸預(yù)測(cè)模型的原理與構(gòu)建
3.1 支持向量回歸的預(yù)測(cè)原理
支持向量機(jī)(Support Vector Machine)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論的VC維的概念以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理之上的。VC維表示擬合函數(shù)的復(fù)雜程度。結(jié)構(gòu)風(fēng)險(xiǎn)包括經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)。置信風(fēng)險(xiǎn)表示預(yù)測(cè)結(jié)果的可信程度。置信風(fēng)險(xiǎn)與樣本數(shù)量和擬合函數(shù)的VC維有關(guān),樣本數(shù)量越多,擬合函數(shù)的VC維數(shù)越低,那么置信風(fēng)險(xiǎn)就越小[8]。
支持向量回歸理論同樣能很好的應(yīng)用于回歸問題。通過將ε不敏感損失函數(shù)引入到SVM中,使得訓(xùn)練集數(shù)據(jù)在一定程度上逼近擬合函數(shù),即ε-SVR (ε-Support Vector Regression)法。ε-SVR將非線性回歸問題轉(zhuǎn)化為下面的約束優(yōu)化問題[9]:
min wf(w)=12‖w‖2+C∑li=1(ξi+ξ*i)(2)
subject to:yi-wΦ(x)-b≤ε+ξ*i
wΦ(x)+b-yi≤ε+ξi
ξi,ξ*≥0,i=1,…,l(3)
其中C是懲罰因子,ξ,ξ*是松弛變量,ε是不敏感損失函數(shù)。通過拉格朗日乘子可以求出上述優(yōu)化問題的對(duì)偶問題如下:
min α,α*W(α,α*)=12(α-α*)TQ(α-α*)+
ε∑li=1(αi+α*i)+∑li=1yi(αi-α*i) (4)
subject to:∑li=1(αi-α*i)=0
0≤αi,α*i≤C,i=1,…,l (5)
其中,Q是半正定的矩陣,矩陣中每個(gè)元素Qij的表達(dá)式:
Qij=K(xi,xj)=φ(xi)Tφ(xj)(6)
其中,K(xi,xj)是核函數(shù)。核函數(shù)可以采用線性核函數(shù)、d階多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)或者無限節(jié)點(diǎn)的樣條核函數(shù)。本文的預(yù)測(cè)模型采用徑向基(RBF)函數(shù)作為核函數(shù),其數(shù)學(xué)表達(dá)式如下[10]:
K(xi,xj)=exp (-g‖xi-xj‖2),g>0(7)
解對(duì)偶問題得到回歸模型的預(yù)測(cè)函數(shù)表達(dá)式為:
f(x)=∑li=1(αi-α*i)K(xi,x)+b (8)
針對(duì)非線性回歸問題,首先通過核函數(shù)K(xi,xj)將數(shù)據(jù)映射到高維空間,在高維空間中做線性回歸擬合,最后獲得原低維空間的非線性回歸效果。
3.2 電解液預(yù)測(cè)模型的構(gòu)建
核函數(shù)的引入是為了使低維空間數(shù)據(jù)映射到高維空間的同時(shí)能夠屏蔽復(fù)雜的非線性映射的具體方式,避免了求解特征空間下的向量?jī)?nèi)積。一旦非線性數(shù)據(jù)映射到線性空間后,在線性空間中成立的原理和方法都能應(yīng)用到非線性數(shù)據(jù)中,可以方便地推導(dǎo)出非線性空間上的各種結(jié)論。對(duì)于徑向基函數(shù)而言,選擇合適的寬度參數(shù)g是映射過程的關(guān)鍵。
除了核函數(shù)及其參數(shù)的選擇外,構(gòu)建支持向量回歸模型還需要選擇合適的懲罰參數(shù)C,它決定了支持向量回歸模型的預(yù)測(cè)精度、模型的復(fù)雜度以及泛化能力等。在建模過程中,本文分別用傳統(tǒng)的K-CV交叉驗(yàn)證法和根據(jù)樣本數(shù)據(jù)組自身規(guī)律所修改的交叉驗(yàn)證法尋找最優(yōu)的寬度參數(shù)g和懲罰參數(shù)C。
3.2.1 傳統(tǒng)的K-CV交叉驗(yàn)證法
傳統(tǒng)的K-CV交叉驗(yàn)證法的思想是將訓(xùn)練集數(shù)據(jù)分成K等份,依次用其中每一份數(shù)據(jù)作為測(cè)試集,其他K-1份作為訓(xùn)練集仿真得到K個(gè)模型以及K組參數(shù)(g, C)。通過比較K個(gè)模型對(duì)測(cè)試集預(yù)測(cè)結(jié)果的均方差得到最小均方差的那組參數(shù)作為最佳參數(shù)。
傳統(tǒng)的K-CV交叉驗(yàn)證法(以下稱為方法一)將七組訓(xùn)練數(shù)據(jù)組合并隨機(jī)分為7等份,做交叉驗(yàn)證尋找最佳的C和g。
圖1是不同的C和g組合的均方差等高圖。從圖中可以得到,當(dāng)C=3.031,g=0.020617時(shí),預(yù)測(cè)值的均方差達(dá)到最小,即MSE=2.3361×10-4。
3.2.2 根據(jù)樣本數(shù)據(jù)規(guī)律改進(jìn)后的交叉驗(yàn)證法
訓(xùn)練數(shù)據(jù)是七組鉛酸蓄電池放電過程中的采樣數(shù)據(jù),傳統(tǒng)的K-CV交叉驗(yàn)證是將所有訓(xùn)練集數(shù)據(jù)合并之后再隨機(jī)等分成K份,它忽略了成組的樣本數(shù)據(jù)內(nèi)部的聯(lián)系與時(shí)序關(guān)系。根據(jù)樣本數(shù)據(jù)自身特點(diǎn)而改進(jìn)的交叉驗(yàn)證方法(以下稱為方法二)把每組放電過程的完整數(shù)據(jù)當(dāng)做一個(gè)子集,將整個(gè)訓(xùn)練數(shù)據(jù)分為七個(gè)子集,每次取一個(gè)作為測(cè)試集,其余作為訓(xùn)練集得到7組不同的C和g,對(duì)測(cè)試集數(shù)據(jù)預(yù)測(cè)的均方差最小的那組參數(shù)即為最優(yōu)參數(shù)組合。
圖2是方法二下不同的C和g組合預(yù)測(cè)值的均方差等高圖,從圖中可知,當(dāng)C=0.37893,g=194.012時(shí),模型預(yù)測(cè)的均方差最小,即MSE=6.732×10-5。
3.3 結(jié)果分析
根據(jù)上面兩種參數(shù)尋優(yōu)方法建立了兩個(gè)對(duì)應(yīng)的回歸預(yù)測(cè)模型,為了檢驗(yàn)?zāi)P偷男阅?,將它們分別應(yīng)用于同一組全新的測(cè)試集數(shù)據(jù)。
圖3是兩種方法所建模型的預(yù)測(cè)輸出與真實(shí)輸出的對(duì)比圖。由圖3可見,方法二能夠建立泛化能力更強(qiáng)的預(yù)測(cè)模型,在應(yīng)用于測(cè)試數(shù)據(jù)時(shí),有較好的跟蹤能力。
從圖3中可以看出,方法一的最大誤差超過0.05 g/cm3,誤差帶的寬度超過0.1 g/cm3。而方法二的最大誤差在0.03 g/cm3左右,并且誤差帶的寬度僅為0.035 g/cm3,即說明預(yù)測(cè)值普遍小于真實(shí)值,這可以通過對(duì)模型輸出給予一個(gè)固定的補(bǔ)償值來獲得更好的預(yù)測(cè)效果。由于方法一的預(yù)測(cè)誤差在正負(fù)方向上誤差范圍相近,導(dǎo)致其平方相關(guān)系數(shù)遠(yuǎn)低于方法二。但是方法二的均方差僅為6.732×10-5,而方法一的均方差達(dá)到2.336 1×10-4,遠(yuǎn)高于方法二。
圖4是兩種方法預(yù)測(cè)結(jié)果的相對(duì)誤差對(duì)比圖。從圖中可以看出,方法一的預(yù)測(cè)相對(duì)誤差高達(dá)±5%,而方法二的預(yù)測(cè)相對(duì)誤差在-2.5%~0.5%之間。
盡管從圖1和圖2的搜索結(jié)果可以看出,使用K-CV交叉驗(yàn)證(K=7)時(shí)得到的最佳參數(shù)可以使預(yù)測(cè)樣本數(shù)據(jù)自身的最小均方差達(dá)到6.732×10-5,低于按樣本分組做交叉驗(yàn)證時(shí)所能達(dá)到的最小均方差2.3361×10-4。但是,從對(duì)測(cè)試集數(shù)據(jù)的預(yù)測(cè)結(jié)果對(duì)比來看,根據(jù)原有分組做交叉驗(yàn)證尋找到的最佳參數(shù)所建立的模型泛化能力更強(qiáng),預(yù)測(cè)值跟蹤真實(shí)值的效果更好。
4 結(jié)束語
本文建立了一種基于支持向量機(jī)原理的動(dòng)力電池參數(shù)預(yù)測(cè)模型,并在傳統(tǒng)的K-CV交叉驗(yàn)證法的基礎(chǔ)上提出一種基于放電數(shù)據(jù)自身規(guī)律的改進(jìn)交叉驗(yàn)證方法。兩種參數(shù)尋優(yōu)方法所建立的最優(yōu)預(yù)測(cè)模型的實(shí)際應(yīng)用效果表明,基于放電數(shù)據(jù)自身規(guī)律而改進(jìn)的交叉驗(yàn)證法與傳統(tǒng)的K-CV交叉驗(yàn)證法相比,能夠得到更優(yōu)的懲罰因子C和核函數(shù)寬度g。將改進(jìn)方法建立的預(yù)測(cè)模型應(yīng)用于全新的實(shí)驗(yàn)數(shù)據(jù)時(shí)可以看出,該模型能夠較精確地預(yù)測(cè)輸出值,預(yù)測(cè)誤差低于±1.5%,且模型具有更好的泛化能力。
參考文獻(xiàn)
[1] 沈建國,常風(fēng)云,孟凡友.鉛酸蓄電池電解液密度測(cè)量裝置的研究[J].海軍工程大學(xué)學(xué)報(bào),2008,20(4):66-68.
[2] 侯躍新,李鋼,宋常青,等.蓄電池電解液密度測(cè)量?jī)x的研制[J].核電子學(xué)與探測(cè)技術(shù),2006,26(6):735-736.
[3] 王松,吳杰長(zhǎng),郭朝有.基于諧振法和數(shù)學(xué)模型的電解液密度監(jiān)測(cè)技術(shù)[J].機(jī)電工程技術(shù),2010,10:17-19.
[4] 劉珊珊,譚躍,邱赤東.基于超聲波的鉛酸蓄電池電解液密度測(cè)量方法的研究[J].中國儀器儀表,2007,01:30-32.
[5] 王玉翔.蓄電池的電解液密度是否越高越好[J].汽車實(shí)用技術(shù),2003,08:23-28.
[6] 李震.基于CAN總線的鉛酸蓄電池參數(shù)采集模塊的設(shè)計(jì)[D].大連:大連海事大學(xué),2006.
[7] 熊文強(qiáng).鉛酸蓄電池電解液密度超聲波測(cè)量方法研究[D].大連:大連理工大學(xué),2010.
[8] VAPNIK V. The Nature of Statistical Learning Theory[M]. USA: Springer Verlag,1995.
[9] VAPNIK V. Statistical Learning Theory[M]. USA: John Wiley & Sons,1998.
[10]SCHI KOPF B,SMOLA A.J. Learning with Kernels[M]. USA: MIT Press,2002.
3.1 支持向量回歸的預(yù)測(cè)原理
支持向量機(jī)(Support Vector Machine)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論的VC維的概念以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理之上的。VC維表示擬合函數(shù)的復(fù)雜程度。結(jié)構(gòu)風(fēng)險(xiǎn)包括經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)。置信風(fēng)險(xiǎn)表示預(yù)測(cè)結(jié)果的可信程度。置信風(fēng)險(xiǎn)與樣本數(shù)量和擬合函數(shù)的VC維有關(guān),樣本數(shù)量越多,擬合函數(shù)的VC維數(shù)越低,那么置信風(fēng)險(xiǎn)就越小[8]。
支持向量回歸理論同樣能很好的應(yīng)用于回歸問題。通過將ε不敏感損失函數(shù)引入到SVM中,使得訓(xùn)練集數(shù)據(jù)在一定程度上逼近擬合函數(shù),即ε-SVR (ε-Support Vector Regression)法。ε-SVR將非線性回歸問題轉(zhuǎn)化為下面的約束優(yōu)化問題[9]:
min wf(w)=12‖w‖2+C∑li=1(ξi+ξ*i)(2)
subject to:yi-wΦ(x)-b≤ε+ξ*i
wΦ(x)+b-yi≤ε+ξi
ξi,ξ*≥0,i=1,…,l(3)
其中C是懲罰因子,ξ,ξ*是松弛變量,ε是不敏感損失函數(shù)。通過拉格朗日乘子可以求出上述優(yōu)化問題的對(duì)偶問題如下:
min α,α*W(α,α*)=12(α-α*)TQ(α-α*)+
ε∑li=1(αi+α*i)+∑li=1yi(αi-α*i) (4)
subject to:∑li=1(αi-α*i)=0
0≤αi,α*i≤C,i=1,…,l (5)
其中,Q是半正定的矩陣,矩陣中每個(gè)元素Qij的表達(dá)式:
Qij=K(xi,xj)=φ(xi)Tφ(xj)(6)
其中,K(xi,xj)是核函數(shù)。核函數(shù)可以采用線性核函數(shù)、d階多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)或者無限節(jié)點(diǎn)的樣條核函數(shù)。本文的預(yù)測(cè)模型采用徑向基(RBF)函數(shù)作為核函數(shù),其數(shù)學(xué)表達(dá)式如下[10]:
K(xi,xj)=exp (-g‖xi-xj‖2),g>0(7)
解對(duì)偶問題得到回歸模型的預(yù)測(cè)函數(shù)表達(dá)式為:
f(x)=∑li=1(αi-α*i)K(xi,x)+b (8)
針對(duì)非線性回歸問題,首先通過核函數(shù)K(xi,xj)將數(shù)據(jù)映射到高維空間,在高維空間中做線性回歸擬合,最后獲得原低維空間的非線性回歸效果。
3.2 電解液預(yù)測(cè)模型的構(gòu)建
核函數(shù)的引入是為了使低維空間數(shù)據(jù)映射到高維空間的同時(shí)能夠屏蔽復(fù)雜的非線性映射的具體方式,避免了求解特征空間下的向量?jī)?nèi)積。一旦非線性數(shù)據(jù)映射到線性空間后,在線性空間中成立的原理和方法都能應(yīng)用到非線性數(shù)據(jù)中,可以方便地推導(dǎo)出非線性空間上的各種結(jié)論。對(duì)于徑向基函數(shù)而言,選擇合適的寬度參數(shù)g是映射過程的關(guān)鍵。
除了核函數(shù)及其參數(shù)的選擇外,構(gòu)建支持向量回歸模型還需要選擇合適的懲罰參數(shù)C,它決定了支持向量回歸模型的預(yù)測(cè)精度、模型的復(fù)雜度以及泛化能力等。在建模過程中,本文分別用傳統(tǒng)的K-CV交叉驗(yàn)證法和根據(jù)樣本數(shù)據(jù)組自身規(guī)律所修改的交叉驗(yàn)證法尋找最優(yōu)的寬度參數(shù)g和懲罰參數(shù)C。
3.2.1 傳統(tǒng)的K-CV交叉驗(yàn)證法
傳統(tǒng)的K-CV交叉驗(yàn)證法的思想是將訓(xùn)練集數(shù)據(jù)分成K等份,依次用其中每一份數(shù)據(jù)作為測(cè)試集,其他K-1份作為訓(xùn)練集仿真得到K個(gè)模型以及K組參數(shù)(g, C)。通過比較K個(gè)模型對(duì)測(cè)試集預(yù)測(cè)結(jié)果的均方差得到最小均方差的那組參數(shù)作為最佳參數(shù)。
傳統(tǒng)的K-CV交叉驗(yàn)證法(以下稱為方法一)將七組訓(xùn)練數(shù)據(jù)組合并隨機(jī)分為7等份,做交叉驗(yàn)證尋找最佳的C和g。
圖1是不同的C和g組合的均方差等高圖。從圖中可以得到,當(dāng)C=3.031,g=0.020617時(shí),預(yù)測(cè)值的均方差達(dá)到最小,即MSE=2.3361×10-4。
3.2.2 根據(jù)樣本數(shù)據(jù)規(guī)律改進(jìn)后的交叉驗(yàn)證法
訓(xùn)練數(shù)據(jù)是七組鉛酸蓄電池放電過程中的采樣數(shù)據(jù),傳統(tǒng)的K-CV交叉驗(yàn)證是將所有訓(xùn)練集數(shù)據(jù)合并之后再隨機(jī)等分成K份,它忽略了成組的樣本數(shù)據(jù)內(nèi)部的聯(lián)系與時(shí)序關(guān)系。根據(jù)樣本數(shù)據(jù)自身特點(diǎn)而改進(jìn)的交叉驗(yàn)證方法(以下稱為方法二)把每組放電過程的完整數(shù)據(jù)當(dāng)做一個(gè)子集,將整個(gè)訓(xùn)練數(shù)據(jù)分為七個(gè)子集,每次取一個(gè)作為測(cè)試集,其余作為訓(xùn)練集得到7組不同的C和g,對(duì)測(cè)試集數(shù)據(jù)預(yù)測(cè)的均方差最小的那組參數(shù)即為最優(yōu)參數(shù)組合。
圖2是方法二下不同的C和g組合預(yù)測(cè)值的均方差等高圖,從圖中可知,當(dāng)C=0.37893,g=194.012時(shí),模型預(yù)測(cè)的均方差最小,即MSE=6.732×10-5。
3.3 結(jié)果分析
根據(jù)上面兩種參數(shù)尋優(yōu)方法建立了兩個(gè)對(duì)應(yīng)的回歸預(yù)測(cè)模型,為了檢驗(yàn)?zāi)P偷男阅?,將它們分別應(yīng)用于同一組全新的測(cè)試集數(shù)據(jù)。
圖3是兩種方法所建模型的預(yù)測(cè)輸出與真實(shí)輸出的對(duì)比圖。由圖3可見,方法二能夠建立泛化能力更強(qiáng)的預(yù)測(cè)模型,在應(yīng)用于測(cè)試數(shù)據(jù)時(shí),有較好的跟蹤能力。
從圖3中可以看出,方法一的最大誤差超過0.05 g/cm3,誤差帶的寬度超過0.1 g/cm3。而方法二的最大誤差在0.03 g/cm3左右,并且誤差帶的寬度僅為0.035 g/cm3,即說明預(yù)測(cè)值普遍小于真實(shí)值,這可以通過對(duì)模型輸出給予一個(gè)固定的補(bǔ)償值來獲得更好的預(yù)測(cè)效果。由于方法一的預(yù)測(cè)誤差在正負(fù)方向上誤差范圍相近,導(dǎo)致其平方相關(guān)系數(shù)遠(yuǎn)低于方法二。但是方法二的均方差僅為6.732×10-5,而方法一的均方差達(dá)到2.336 1×10-4,遠(yuǎn)高于方法二。
圖4是兩種方法預(yù)測(cè)結(jié)果的相對(duì)誤差對(duì)比圖。從圖中可以看出,方法一的預(yù)測(cè)相對(duì)誤差高達(dá)±5%,而方法二的預(yù)測(cè)相對(duì)誤差在-2.5%~0.5%之間。
盡管從圖1和圖2的搜索結(jié)果可以看出,使用K-CV交叉驗(yàn)證(K=7)時(shí)得到的最佳參數(shù)可以使預(yù)測(cè)樣本數(shù)據(jù)自身的最小均方差達(dá)到6.732×10-5,低于按樣本分組做交叉驗(yàn)證時(shí)所能達(dá)到的最小均方差2.3361×10-4。但是,從對(duì)測(cè)試集數(shù)據(jù)的預(yù)測(cè)結(jié)果對(duì)比來看,根據(jù)原有分組做交叉驗(yàn)證尋找到的最佳參數(shù)所建立的模型泛化能力更強(qiáng),預(yù)測(cè)值跟蹤真實(shí)值的效果更好。
4 結(jié)束語
本文建立了一種基于支持向量機(jī)原理的動(dòng)力電池參數(shù)預(yù)測(cè)模型,并在傳統(tǒng)的K-CV交叉驗(yàn)證法的基礎(chǔ)上提出一種基于放電數(shù)據(jù)自身規(guī)律的改進(jìn)交叉驗(yàn)證方法。兩種參數(shù)尋優(yōu)方法所建立的最優(yōu)預(yù)測(cè)模型的實(shí)際應(yīng)用效果表明,基于放電數(shù)據(jù)自身規(guī)律而改進(jìn)的交叉驗(yàn)證法與傳統(tǒng)的K-CV交叉驗(yàn)證法相比,能夠得到更優(yōu)的懲罰因子C和核函數(shù)寬度g。將改進(jìn)方法建立的預(yù)測(cè)模型應(yīng)用于全新的實(shí)驗(yàn)數(shù)據(jù)時(shí)可以看出,該模型能夠較精確地預(yù)測(cè)輸出值,預(yù)測(cè)誤差低于±1.5%,且模型具有更好的泛化能力。
參考文獻(xiàn)
[1] 沈建國,常風(fēng)云,孟凡友.鉛酸蓄電池電解液密度測(cè)量裝置的研究[J].海軍工程大學(xué)學(xué)報(bào),2008,20(4):66-68.
[2] 侯躍新,李鋼,宋常青,等.蓄電池電解液密度測(cè)量?jī)x的研制[J].核電子學(xué)與探測(cè)技術(shù),2006,26(6):735-736.
[3] 王松,吳杰長(zhǎng),郭朝有.基于諧振法和數(shù)學(xué)模型的電解液密度監(jiān)測(cè)技術(shù)[J].機(jī)電工程技術(shù),2010,10:17-19.
[4] 劉珊珊,譚躍,邱赤東.基于超聲波的鉛酸蓄電池電解液密度測(cè)量方法的研究[J].中國儀器儀表,2007,01:30-32.
[5] 王玉翔.蓄電池的電解液密度是否越高越好[J].汽車實(shí)用技術(shù),2003,08:23-28.
[6] 李震.基于CAN總線的鉛酸蓄電池參數(shù)采集模塊的設(shè)計(jì)[D].大連:大連海事大學(xué),2006.
[7] 熊文強(qiáng).鉛酸蓄電池電解液密度超聲波測(cè)量方法研究[D].大連:大連理工大學(xué),2010.
[8] VAPNIK V. The Nature of Statistical Learning Theory[M]. USA: Springer Verlag,1995.
[9] VAPNIK V. Statistical Learning Theory[M]. USA: John Wiley & Sons,1998.
[10]SCHI KOPF B,SMOLA A.J. Learning with Kernels[M]. USA: MIT Press,2002.
3.1 支持向量回歸的預(yù)測(cè)原理
支持向量機(jī)(Support Vector Machine)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論的VC維的概念以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理之上的。VC維表示擬合函數(shù)的復(fù)雜程度。結(jié)構(gòu)風(fēng)險(xiǎn)包括經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信風(fēng)險(xiǎn)。置信風(fēng)險(xiǎn)表示預(yù)測(cè)結(jié)果的可信程度。置信風(fēng)險(xiǎn)與樣本數(shù)量和擬合函數(shù)的VC維有關(guān),樣本數(shù)量越多,擬合函數(shù)的VC維數(shù)越低,那么置信風(fēng)險(xiǎn)就越小[8]。
支持向量回歸理論同樣能很好的應(yīng)用于回歸問題。通過將ε不敏感損失函數(shù)引入到SVM中,使得訓(xùn)練集數(shù)據(jù)在一定程度上逼近擬合函數(shù),即ε-SVR (ε-Support Vector Regression)法。ε-SVR將非線性回歸問題轉(zhuǎn)化為下面的約束優(yōu)化問題[9]:
min wf(w)=12‖w‖2+C∑li=1(ξi+ξ*i)(2)
subject to:yi-wΦ(x)-b≤ε+ξ*i
wΦ(x)+b-yi≤ε+ξi
ξi,ξ*≥0,i=1,…,l(3)
其中C是懲罰因子,ξ,ξ*是松弛變量,ε是不敏感損失函數(shù)。通過拉格朗日乘子可以求出上述優(yōu)化問題的對(duì)偶問題如下:
min α,α*W(α,α*)=12(α-α*)TQ(α-α*)+
ε∑li=1(αi+α*i)+∑li=1yi(αi-α*i) (4)
subject to:∑li=1(αi-α*i)=0
0≤αi,α*i≤C,i=1,…,l (5)
其中,Q是半正定的矩陣,矩陣中每個(gè)元素Qij的表達(dá)式:
Qij=K(xi,xj)=φ(xi)Tφ(xj)(6)
其中,K(xi,xj)是核函數(shù)。核函數(shù)可以采用線性核函數(shù)、d階多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)或者無限節(jié)點(diǎn)的樣條核函數(shù)。本文的預(yù)測(cè)模型采用徑向基(RBF)函數(shù)作為核函數(shù),其數(shù)學(xué)表達(dá)式如下[10]:
K(xi,xj)=exp (-g‖xi-xj‖2),g>0(7)
解對(duì)偶問題得到回歸模型的預(yù)測(cè)函數(shù)表達(dá)式為:
f(x)=∑li=1(αi-α*i)K(xi,x)+b (8)
針對(duì)非線性回歸問題,首先通過核函數(shù)K(xi,xj)將數(shù)據(jù)映射到高維空間,在高維空間中做線性回歸擬合,最后獲得原低維空間的非線性回歸效果。
3.2 電解液預(yù)測(cè)模型的構(gòu)建
核函數(shù)的引入是為了使低維空間數(shù)據(jù)映射到高維空間的同時(shí)能夠屏蔽復(fù)雜的非線性映射的具體方式,避免了求解特征空間下的向量?jī)?nèi)積。一旦非線性數(shù)據(jù)映射到線性空間后,在線性空間中成立的原理和方法都能應(yīng)用到非線性數(shù)據(jù)中,可以方便地推導(dǎo)出非線性空間上的各種結(jié)論。對(duì)于徑向基函數(shù)而言,選擇合適的寬度參數(shù)g是映射過程的關(guān)鍵。
除了核函數(shù)及其參數(shù)的選擇外,構(gòu)建支持向量回歸模型還需要選擇合適的懲罰參數(shù)C,它決定了支持向量回歸模型的預(yù)測(cè)精度、模型的復(fù)雜度以及泛化能力等。在建模過程中,本文分別用傳統(tǒng)的K-CV交叉驗(yàn)證法和根據(jù)樣本數(shù)據(jù)組自身規(guī)律所修改的交叉驗(yàn)證法尋找最優(yōu)的寬度參數(shù)g和懲罰參數(shù)C。
3.2.1 傳統(tǒng)的K-CV交叉驗(yàn)證法
傳統(tǒng)的K-CV交叉驗(yàn)證法的思想是將訓(xùn)練集數(shù)據(jù)分成K等份,依次用其中每一份數(shù)據(jù)作為測(cè)試集,其他K-1份作為訓(xùn)練集仿真得到K個(gè)模型以及K組參數(shù)(g, C)。通過比較K個(gè)模型對(duì)測(cè)試集預(yù)測(cè)結(jié)果的均方差得到最小均方差的那組參數(shù)作為最佳參數(shù)。
傳統(tǒng)的K-CV交叉驗(yàn)證法(以下稱為方法一)將七組訓(xùn)練數(shù)據(jù)組合并隨機(jī)分為7等份,做交叉驗(yàn)證尋找最佳的C和g。
圖1是不同的C和g組合的均方差等高圖。從圖中可以得到,當(dāng)C=3.031,g=0.020617時(shí),預(yù)測(cè)值的均方差達(dá)到最小,即MSE=2.3361×10-4。
3.2.2 根據(jù)樣本數(shù)據(jù)規(guī)律改進(jìn)后的交叉驗(yàn)證法
訓(xùn)練數(shù)據(jù)是七組鉛酸蓄電池放電過程中的采樣數(shù)據(jù),傳統(tǒng)的K-CV交叉驗(yàn)證是將所有訓(xùn)練集數(shù)據(jù)合并之后再隨機(jī)等分成K份,它忽略了成組的樣本數(shù)據(jù)內(nèi)部的聯(lián)系與時(shí)序關(guān)系。根據(jù)樣本數(shù)據(jù)自身特點(diǎn)而改進(jìn)的交叉驗(yàn)證方法(以下稱為方法二)把每組放電過程的完整數(shù)據(jù)當(dāng)做一個(gè)子集,將整個(gè)訓(xùn)練數(shù)據(jù)分為七個(gè)子集,每次取一個(gè)作為測(cè)試集,其余作為訓(xùn)練集得到7組不同的C和g,對(duì)測(cè)試集數(shù)據(jù)預(yù)測(cè)的均方差最小的那組參數(shù)即為最優(yōu)參數(shù)組合。
圖2是方法二下不同的C和g組合預(yù)測(cè)值的均方差等高圖,從圖中可知,當(dāng)C=0.37893,g=194.012時(shí),模型預(yù)測(cè)的均方差最小,即MSE=6.732×10-5。
3.3 結(jié)果分析
根據(jù)上面兩種參數(shù)尋優(yōu)方法建立了兩個(gè)對(duì)應(yīng)的回歸預(yù)測(cè)模型,為了檢驗(yàn)?zāi)P偷男阅?,將它們分別應(yīng)用于同一組全新的測(cè)試集數(shù)據(jù)。
圖3是兩種方法所建模型的預(yù)測(cè)輸出與真實(shí)輸出的對(duì)比圖。由圖3可見,方法二能夠建立泛化能力更強(qiáng)的預(yù)測(cè)模型,在應(yīng)用于測(cè)試數(shù)據(jù)時(shí),有較好的跟蹤能力。
從圖3中可以看出,方法一的最大誤差超過0.05 g/cm3,誤差帶的寬度超過0.1 g/cm3。而方法二的最大誤差在0.03 g/cm3左右,并且誤差帶的寬度僅為0.035 g/cm3,即說明預(yù)測(cè)值普遍小于真實(shí)值,這可以通過對(duì)模型輸出給予一個(gè)固定的補(bǔ)償值來獲得更好的預(yù)測(cè)效果。由于方法一的預(yù)測(cè)誤差在正負(fù)方向上誤差范圍相近,導(dǎo)致其平方相關(guān)系數(shù)遠(yuǎn)低于方法二。但是方法二的均方差僅為6.732×10-5,而方法一的均方差達(dá)到2.336 1×10-4,遠(yuǎn)高于方法二。
圖4是兩種方法預(yù)測(cè)結(jié)果的相對(duì)誤差對(duì)比圖。從圖中可以看出,方法一的預(yù)測(cè)相對(duì)誤差高達(dá)±5%,而方法二的預(yù)測(cè)相對(duì)誤差在-2.5%~0.5%之間。
盡管從圖1和圖2的搜索結(jié)果可以看出,使用K-CV交叉驗(yàn)證(K=7)時(shí)得到的最佳參數(shù)可以使預(yù)測(cè)樣本數(shù)據(jù)自身的最小均方差達(dá)到6.732×10-5,低于按樣本分組做交叉驗(yàn)證時(shí)所能達(dá)到的最小均方差2.3361×10-4。但是,從對(duì)測(cè)試集數(shù)據(jù)的預(yù)測(cè)結(jié)果對(duì)比來看,根據(jù)原有分組做交叉驗(yàn)證尋找到的最佳參數(shù)所建立的模型泛化能力更強(qiáng),預(yù)測(cè)值跟蹤真實(shí)值的效果更好。
4 結(jié)束語
本文建立了一種基于支持向量機(jī)原理的動(dòng)力電池參數(shù)預(yù)測(cè)模型,并在傳統(tǒng)的K-CV交叉驗(yàn)證法的基礎(chǔ)上提出一種基于放電數(shù)據(jù)自身規(guī)律的改進(jìn)交叉驗(yàn)證方法。兩種參數(shù)尋優(yōu)方法所建立的最優(yōu)預(yù)測(cè)模型的實(shí)際應(yīng)用效果表明,基于放電數(shù)據(jù)自身規(guī)律而改進(jìn)的交叉驗(yàn)證法與傳統(tǒng)的K-CV交叉驗(yàn)證法相比,能夠得到更優(yōu)的懲罰因子C和核函數(shù)寬度g。將改進(jìn)方法建立的預(yù)測(cè)模型應(yīng)用于全新的實(shí)驗(yàn)數(shù)據(jù)時(shí)可以看出,該模型能夠較精確地預(yù)測(cè)輸出值,預(yù)測(cè)誤差低于±1.5%,且模型具有更好的泛化能力。
參考文獻(xiàn)
[1] 沈建國,常風(fēng)云,孟凡友.鉛酸蓄電池電解液密度測(cè)量裝置的研究[J].海軍工程大學(xué)學(xué)報(bào),2008,20(4):66-68.
[2] 侯躍新,李鋼,宋常青,等.蓄電池電解液密度測(cè)量?jī)x的研制[J].核電子學(xué)與探測(cè)技術(shù),2006,26(6):735-736.
[3] 王松,吳杰長(zhǎng),郭朝有.基于諧振法和數(shù)學(xué)模型的電解液密度監(jiān)測(cè)技術(shù)[J].機(jī)電工程技術(shù),2010,10:17-19.
[4] 劉珊珊,譚躍,邱赤東.基于超聲波的鉛酸蓄電池電解液密度測(cè)量方法的研究[J].中國儀器儀表,2007,01:30-32.
[5] 王玉翔.蓄電池的電解液密度是否越高越好[J].汽車實(shí)用技術(shù),2003,08:23-28.
[6] 李震.基于CAN總線的鉛酸蓄電池參數(shù)采集模塊的設(shè)計(jì)[D].大連:大連海事大學(xué),2006.
[7] 熊文強(qiáng).鉛酸蓄電池電解液密度超聲波測(cè)量方法研究[D].大連:大連理工大學(xué),2010.
[8] VAPNIK V. The Nature of Statistical Learning Theory[M]. USA: Springer Verlag,1995.
[9] VAPNIK V. Statistical Learning Theory[M]. USA: John Wiley & Sons,1998.
[10]SCHI KOPF B,SMOLA A.J. Learning with Kernels[M]. USA: MIT Press,2002.