屈新懷, 馬文強, 丁必榮, 牛 乾
(合肥工業(yè)大學(xué) 機械工程學(xué)院,安徽 合肥 230009)
經(jīng)銷商銷售渠道是整車營銷的核心環(huán)節(jié)之一。由于大部分經(jīng)銷商屬于中小企業(yè),汽車整車廠商對于汽車的銷售主要采取信用賒銷的形式。因此建立經(jīng)銷商的信用模型,對汽車整車廠商減小應(yīng)收賬款風(fēng)險、保證信貸資金安全具有重要的現(xiàn)實意義[1]。
在信用評價模型方面,傳統(tǒng)的信用評價模型常使用統(tǒng)計學(xué)方面的知識。文獻[2-3]使用層次分析法和模糊評價法的組合模型;文獻[4]通過將統(tǒng)計抽樣理論中分層思想與邏輯回歸模型相結(jié)合,構(gòu)造基于分層邏輯回歸的小企業(yè)信用評價模型。隨著智能算法的發(fā)展,決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機等算法逐漸運用于信用評價領(lǐng)域。文獻[5]使用反向傳播(back-propagation,BP)神經(jīng)網(wǎng)絡(luò)建立信用度的基本概率分配函數(shù),為信用風(fēng)險的決策提供依據(jù);文獻[6]提出了一種結(jié)合遺傳規(guī)劃(genetic programming,GP)和BP神經(jīng)網(wǎng)絡(luò)的信用評估模型,對受評目標的信用分類具有較高的準確度;文獻[7]使用正交支持向量機解決信用評分中數(shù)據(jù)維度災(zāi)難問題。針對信用數(shù)據(jù)的連續(xù)性、信用狀態(tài)的動態(tài)性情況,文獻[8-9]基于多維時間序列數(shù)據(jù)觀察受評目標信用等級的狀態(tài)趨勢及“波動”情況,但未從定量的角度考慮受評目標的信用情況。
考慮到經(jīng)銷商信用數(shù)據(jù)樣本少以及數(shù)據(jù)的連續(xù)性特點,本文從受評經(jīng)銷商的歷史業(yè)務(wù)數(shù)據(jù)出發(fā),使用多維時間序列數(shù)據(jù)建立支持向量回歸(support vector regression,SVR)模型,動態(tài)地預(yù)測經(jīng)銷商對應(yīng)的信用額度,為更好地管理經(jīng)銷商提供一定的依據(jù)。
(1) 相空間重構(gòu)原理。記有m維時間序列{X1,X2,…,Xm},其中Xi=[xi,1xi,2…xi,n],i=1,2,…,m,變量n為時間序列的長度,m為時間序列的個數(shù)。
Vi=[v1,iv2,i…vm,i]
(1)
其中,i=1,2,…,L;j=1,2,…,m;vj, i=[xj,ixj,i+τj…xj,i+(dj-1)τj],τj、dj分別為第j個變量時間序列的延遲時間和嵌入維數(shù),xj,i為數(shù)據(jù)序列中第j個變量在序列中第i個位置上的數(shù)值。
(2) 延遲時間和嵌入維數(shù)的確定。選擇延遲時間τ一般使用自相關(guān)法,即通過計算變量的自相關(guān)函數(shù),選擇自相關(guān)函數(shù)第1次為0時所對應(yīng)的τ為相空間重構(gòu)的延遲時間。確定嵌入維數(shù)使用飽和關(guān)聯(lián)維數(shù)法,且嵌入維數(shù)d和飽和關(guān)聯(lián)維數(shù)D滿足d≥2D+1。
關(guān)聯(lián)維數(shù)Dd定義為:
(2)
(3)
其中,‖Xi-Xj‖為兩時間序列向量的歐氏距離;r為介于歐氏距離最大值和最小值之間的變量;H(x)為:
(4)
通過適當(dāng)調(diào)整r,可計算出一組lnr、lnC(r)的值,從而根據(jù)(2)式計算關(guān)聯(lián)維數(shù)Dd。隨著嵌入維數(shù)d增加到一定程度,關(guān)聯(lián)維數(shù)Dd趨于穩(wěn)定。取飽和值D作為飽和關(guān)聯(lián)維數(shù),根據(jù)公式d≥2D+1確定合適的相空間嵌入維數(shù)d。
(1) SVR原理。SVR是從建立在統(tǒng)計理論的VC維理論和結(jié)構(gòu)風(fēng)險最小理論的基礎(chǔ)上發(fā)展的分類支持向量機拓展而來的[11]。對n維空間Rn上線性數(shù)據(jù)回歸的基本思路如下:給定一組訓(xùn)練數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xn,yn)},在數(shù)據(jù)集中xi∈Rn,yi∈R,求解Rn中的超平面線性函數(shù)為g(x)=ω·x+b,使用函數(shù)y=g(x)對任一輸入x預(yù)估對應(yīng)的輸出值y。
根據(jù)對偶理論并引入Lagrange函數(shù),對于線性ε-支持向量回歸機,使回歸問題轉(zhuǎn)化為凸二次規(guī)劃問題,即
(5)
i=1,2,…,n
(6)
(7)
從而構(gòu)造的決策函數(shù)如下:
(8)
對非線性數(shù)據(jù),SVR處理的基本思路是通過引入核函數(shù)代替(8)式中的內(nèi)積運算,即將樣本空間中非線性低維數(shù)據(jù)映射為特征空間中的高維線性數(shù)據(jù),即
(9)
其中,K(xi,x)為核函數(shù)。
(2) 預(yù)測方法。從整車廠商的經(jīng)銷商管理系統(tǒng)(dealer management system,DMS)中獲取有關(guān)數(shù)據(jù):① 按月份匯總數(shù)據(jù),整理成多維時間序列的形式;② 根據(jù)1.1節(jié)所述對經(jīng)銷商多維時間序列信用數(shù)據(jù)進行相空間重構(gòu),對于確定的經(jīng)銷商信用數(shù)據(jù)序列,其相空間重構(gòu)的參數(shù)一般比較穩(wěn)定,不必每次預(yù)測都進行更新計算,可以根據(jù)實際應(yīng)用需要按照季度進行更新;③ 選取相空間中的相點與對應(yīng)的信用額度組成SVR模型的訓(xùn)練樣本,進行SVR模型參數(shù)的尋優(yōu);④ 選取剩余的相點與對應(yīng)的信用額度組成預(yù)測樣本,利用訓(xùn)練好的SVR模型進行預(yù)測;⑤ 根據(jù)預(yù)測數(shù)據(jù)和實際數(shù)據(jù)的均方根誤差ERMES來評價模型的預(yù)測效果。
均方根誤差形式如下:
(10)
預(yù)測流程如圖1所示。
圖1 信用額度預(yù)測流程
本文選取某經(jīng)銷商業(yè)務(wù)數(shù)據(jù)中影響信用額度較大的2個變量,即開票金額和回款金額。根據(jù)其業(yè)務(wù)情況,選取2013—2017年的記錄數(shù)據(jù),時間間隔為1個月,共計60個月,即n=60。
現(xiàn)給出某經(jīng)銷商在2017年的業(yè)務(wù)數(shù)據(jù)以及整車廠商給予經(jīng)銷商的信用額度數(shù)值,具體見表1所列。
表1 某經(jīng)銷商2017年業(yè)務(wù)數(shù)據(jù)與信用額度 萬元
因為不同月份間的數(shù)據(jù)變化較大,為減少誤差,分別對原數(shù)據(jù)的各變量進行0-1歸一化處理,即
(11)
其中,X*為映射后的數(shù)據(jù);x為原始數(shù)據(jù);xmax、xmin為原始數(shù)據(jù)中的最大值和最小值。經(jīng)過預(yù)處理后的數(shù)據(jù)將作為相空間重構(gòu)的來源。
開票金額與回款金額的相關(guān)系數(shù)計算公式為:
ρ=
(12)
其中,n為序列的長度,n=60;xi、yi分別為歸一化后信用數(shù)據(jù)序列中第i點的開票金額和回款金額。
計算得到ρ=0.892 5,表明2個變量具有極強的相關(guān)性,因此考慮2個變量在重構(gòu)相空間時擁有相同的延遲時間與嵌入維數(shù)。
在確定合適的延遲時間τ時,若τ過大,則會導(dǎo)致相空間中兩相鄰時刻的動力學(xué)形態(tài)變化劇烈,使系統(tǒng)信號失真,產(chǎn)生不相關(guān)誤差,因此本文結(jié)合經(jīng)銷商信用數(shù)據(jù)情況,選擇2個變量的延遲時間τ1=τ2=1。
根據(jù)1.1節(jié)介紹的飽和關(guān)聯(lián)維數(shù)G-P法,依據(jù)經(jīng)銷商的回款數(shù)據(jù)計算出在不同維數(shù)下lnr、lnC(r)的值,繪制嵌入維數(shù)d為2~12情況下的曲線,如圖2所示。圖2中曲線從左至右對應(yīng)的維數(shù)為2~12。
圖2 某經(jīng)銷商回款數(shù)據(jù)ln r -ln C(r)關(guān)系曲線
求取每條曲線所包含的直線區(qū)域斜率,作為各嵌入維數(shù)對應(yīng)的關(guān)聯(lián)維數(shù),結(jié)果見表2所列。
表2 嵌入維數(shù)與關(guān)聯(lián)維數(shù)的關(guān)系數(shù)值
Vi=[xixi+1…xi+5yiyi+1…yi+5]
(13)
其中,i=1,2,…,55;xi、yi分別為信用時間序列中第i點的開票金額和回款金額。
對應(yīng)的額度輸出Z=[z1z2…z60],zi為第i個月的信用額度。根據(jù)嵌入維數(shù)及實際預(yù)測情況,本文構(gòu)建的數(shù)據(jù)集為{(V1,z7),(V2,z8),…,(V54,z60)}。
選取數(shù)據(jù)集中的前40個點作為SVR模型的訓(xùn)練數(shù)據(jù)集{(V1,z7),(V2,z8),…,(V40,z46)},在本例SVR預(yù)測模型中選用高斯徑向基核函數(shù)(radial basis function,RBF),其核函數(shù)形式如下:
(14)
使用網(wǎng)格搜索和交叉驗證法對(6)式中懲罰參數(shù)C和(14)式中核參數(shù)σ進行尋優(yōu),計算得到C=0.353 5,σ=2.828 4。數(shù)據(jù)集的后14個點組成預(yù)測數(shù)據(jù)集{(V41,z47),…,(V54,z60)}。
使用預(yù)測數(shù)據(jù)集對模型進行效果分析,并采用Matlab進行算法仿真,計算的歸一化后均方根誤差ERMSE=0.91%,預(yù)測曲線如圖3所示。
圖3 多維時間序列SVR預(yù)測模型的預(yù)測效果
為了驗證構(gòu)建的時間序列信用數(shù)據(jù)在經(jīng)銷商信用額度預(yù)測中的有效性,使用該經(jīng)銷商在孤立時間點上的信用數(shù)據(jù)進行SVR預(yù)測信用額度,經(jīng)過同樣的歸一化預(yù)處理和SVR預(yù)測后,計算得到均方根誤差ERMSE=4.98%。通過對比均方根誤差ERMSE可知,使用多維時間序列數(shù)據(jù)進行的預(yù)測效果較好。
針對整車廠商授予經(jīng)銷商信用額度的問題,本文提出了一種基于多維時間序列支持向量機的預(yù)測方法,從時間序列的角度考察經(jīng)銷商信用額度的變化趨勢,并運用SVR算法對經(jīng)銷商信用額度進行預(yù)測。
本文使用預(yù)測值與實際值的均方根誤差作為評估標準,將結(jié)果與孤立時間下的多維變量信用額度預(yù)測結(jié)果相比較,驗證了本文方法具有較高的預(yù)測精度。