鄔建平
(嶺南師范學(xué)院 商學(xué)院,廣東 湛江 524048)
基于主成分分析與最小二乘支持向量機(jī)的電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分
鄔建平
(嶺南師范學(xué)院商學(xué)院,廣東湛江524048)
在國內(nèi)外文獻(xiàn)研究的基礎(chǔ)上,建立電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分指標(biāo)體系,運(yùn)用主成分分析法(PCA)對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的核心指標(biāo)進(jìn)行提取,從19個(gè)指標(biāo)中提取8個(gè)主成分作為電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分指標(biāo),采用粒子群算法(PSO),選擇合適的最小二乘支持向量機(jī)(LSSVM)的懲罰因子C和RBF核函數(shù)參數(shù)σ,接著利用PCA-PSO-LSSVM組合模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的8個(gè)主成分13家電子商務(wù)企業(yè)的訓(xùn)練集進(jìn)行訓(xùn)練,再用測(cè)試集對(duì)信用風(fēng)險(xiǎn)指標(biāo)進(jìn)行預(yù)測(cè),通過對(duì)5家電子商務(wù)企業(yè)的信用風(fēng)險(xiǎn)進(jìn)行測(cè)試和驗(yàn)證,可得到較為滿意的效果。實(shí)驗(yàn)結(jié)果證明:通過對(duì)LSSVM、PSO-LSSVM和PCA-PSO-LSSVM預(yù)測(cè)的精度進(jìn)行比較,PCA-PSO-LSSVM預(yù)測(cè)精度高,模型的組合是合理的、有效的。
主成分分析;粒子群算法;最小二乘支持向量機(jī);電子商務(wù);信用風(fēng)險(xiǎn);綜合評(píng)分
Key wors: PCA; PSO; LSSVM; e-commerce; credit risk; comprehensive evaluation
近年來,我國電子商務(wù)行業(yè)發(fā)展迅猛,2015年我國電子商務(wù)交易額達(dá)7.63萬億元,比2014年增長(zhǎng)30.4%。與此同時(shí),電子商務(wù)欺詐現(xiàn)象嚴(yán)重,人均損失超過5 000元。隨著我國電子商務(wù)行業(yè)的進(jìn)一步發(fā)展,這種損失仍將上升,這將在一定程度上限制電子商務(wù)企業(yè)健康持續(xù)發(fā)展。因此,對(duì)電子商務(wù)企業(yè)的信用風(fēng)險(xiǎn)準(zhǔn)確評(píng)分成為當(dāng)前理論和學(xué)術(shù)界關(guān)注的焦點(diǎn)之一。
目前,對(duì)于電子商務(wù)信用風(fēng)險(xiǎn)評(píng)分的相關(guān)文獻(xiàn)還沒有,都是借用其它評(píng)分說明電子商務(wù)信用風(fēng)險(xiǎn)的評(píng)分問題。姜明輝[1]等用BP神經(jīng)網(wǎng)絡(luò)對(duì)個(gè)人信用評(píng)分進(jìn)行分析,經(jīng)logistic回歸、BP神經(jīng)網(wǎng)絡(luò)、優(yōu)化CBR進(jìn)行比較研究,CBR模型對(duì)個(gè)人信用評(píng)分效果最好;王磊等[2]用數(shù)據(jù)挖掘方法,采用10種模型對(duì)小企業(yè)主信用評(píng)分進(jìn)行應(yīng)用比較,收到了良好的效果;董曉林[3]等采用多元線性回歸模型對(duì)江蘇縣域小微企業(yè)信貨融資進(jìn)行信用評(píng)分,收到了較好的效果;陸愛國等[4]用改進(jìn)的SVM學(xué)習(xí)方法,對(duì)學(xué)習(xí)庫中的數(shù)據(jù)集進(jìn)行信用評(píng)分,與其它模型比較,準(zhǔn)確率最高。從電子商務(wù)信用風(fēng)險(xiǎn)評(píng)分的角度分析,還存在兩個(gè)主要的缺陷:第一,電子商務(wù)信用風(fēng)險(xiǎn)評(píng)分所選用的指標(biāo)體系維度過高,存在大量信息冗余;第二,現(xiàn)有評(píng)分方法多以線性方法為主,易造成多元線性問題,并對(duì)電子商務(wù)信用風(fēng)險(xiǎn)評(píng)分的非線性特征刻畫不夠。
為了解決以上兩個(gè)問題,采用組合評(píng)分方法,可有效地提高評(píng)分的精度,對(duì)于缺陷1,用主成分析法(PCA)可去掉奇異點(diǎn)的干擾,從原始數(shù)據(jù)空間開始,通過構(gòu)造一組新的潛隱變量以降低原始數(shù)據(jù)空間的維數(shù),提取主成分,減少電子商務(wù)信用風(fēng)險(xiǎn)的數(shù)據(jù)冗余;對(duì)于缺陷2,用最小二乘支持向量機(jī)(LSSVM)計(jì)算,可對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的非線性特征進(jìn)行刻畫,用粒子群算法(PSO),選擇合適的最小二乘支持向量機(jī)(LSSVM)的懲罰因子C和RBF核函數(shù)參數(shù)σ,構(gòu)建PCA-PSO-LSSVM組合模型,對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分進(jìn)行研究。
2.1PCA原理
1901年,Pearson率先引入主成分析析法(Principle Component Analysis,PCA),1933年,由Hotelling作了進(jìn)一步的發(fā)展。主成分析析法是利用降維的思想,從多個(gè)數(shù)值變量(指標(biāo))之間的相互關(guān)系入手,得到少數(shù)幾個(gè)不相關(guān)的綜合變量(指標(biāo))的統(tǒng)計(jì)方法。在電子商務(wù)信用風(fēng)險(xiǎn)評(píng)估中,為了全面客觀地分析問題,常常要記錄多個(gè)觀察指標(biāo)并考慮更多的影響因素,這樣的數(shù)據(jù)雖然可以提供豐富的信息,但有時(shí)也使得數(shù)據(jù)分析工作更趨復(fù)雜化。怎樣利用這類指標(biāo)的多指標(biāo)數(shù)據(jù)對(duì)電子商務(wù)信用風(fēng)險(xiǎn)進(jìn)行評(píng)分呢?采用所有指標(biāo)進(jìn)行評(píng)價(jià),然后再綜合各指標(biāo)的評(píng)價(jià)結(jié)論,這樣可能會(huì)出現(xiàn)各指標(biāo)評(píng)價(jià)的結(jié)論不一致,甚至?xí)嗷_突;用單一指標(biāo)評(píng)價(jià),其結(jié)果顯然是片面的,最好的辦法是從給定指標(biāo)的關(guān)系入手,尋找少數(shù)綜合指標(biāo)以概括原始指標(biāo)信息的多元統(tǒng)計(jì)方法[5]。
設(shè)電子商務(wù)信用風(fēng)險(xiǎn)有m個(gè)指標(biāo)X1,X2,···,Xm,欲尋找可以概括這m個(gè)指標(biāo)主要信息的綜合指標(biāo)為Z1,Z2,···,Zm。從數(shù)學(xué)上講,就是尋找一組常數(shù)αi1,αi2,···,αim,其中i=1,2,···,m,是這m個(gè)指標(biāo)的線性組合,應(yīng)用主成分分析法的操作步驟如下:
(1)對(duì)原始指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,先按式(1)計(jì)算。
式(1)中,sj代表某個(gè)指標(biāo)的和代表某個(gè)指標(biāo)的平均值,用標(biāo)準(zhǔn)化后的數(shù)據(jù)計(jì)算主成分。為方便起見,仍用X表示標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣,則有:
式(2)中,X為標(biāo)準(zhǔn)化后的矩陣,xij為矩陣中的元素。
(2)求出X的相關(guān)矩陣R。標(biāo)準(zhǔn)化后,X的相關(guān)矩陣即為協(xié)方差矩陣Cov(x)。
式(3)中,R為相關(guān)矩陣,Cov(x)為協(xié)方差矩陣。
(3)求出相關(guān)矩陣的特征值所對(duì)應(yīng)的特征向量。由于R為半正定矩陣,則R的特征方程為||R-λI=0,求得m個(gè)非負(fù)特征值,將這些特征值按從大到小的順序排列為λ1≥λ2≥…≥0,則有:
式(4)中,求解得到每一個(gè)特征值λi對(duì)應(yīng)的單位特征向量從而求得各主成分:
式(5)中,Zi為主成分為特征向量。
(4)計(jì)算相關(guān)系數(shù)矩陣
式(6)中,各主成分互不相關(guān),即Zi與Zj的相關(guān)系數(shù)為0,于是,各主成分間的相關(guān)系數(shù)矩陣為單位矩陣。
(5)求主成分的貢獻(xiàn)率和累積貢獻(xiàn)率
從式(7)可以看出,各原始指標(biāo)Xi,X2,···,Xm的方差和與各主成分Z1,Z2,···,Zm的方差和相等。
第i個(gè)主成分的貢獻(xiàn)率為:
式(8)中,λi為特征值為主成分的方差和,i=1,2,···,m。
前k個(gè)主成分的累積貢獻(xiàn)率為:
(6)主成分個(gè)數(shù)的選取。選取主成分時(shí),一般不需要全部的主成分,只用其中的前幾個(gè),一般來說保留個(gè)數(shù)按以下原則來確定。①以累計(jì)貢獻(xiàn)率來確定,當(dāng)前k個(gè)主成分的累積貢獻(xiàn)率達(dá)到某一特定值時(shí)(一般以85%為宜),則保留前k個(gè)主成分。②以特征值大小來確定,即若主成分Zi的特征值λi≥1,則保留Zi,否則就去掉該主成分。
(7)求因子載荷。為了解各主成分與各原始指標(biāo)之間的關(guān)系,用第i個(gè)主成分Zi的特征值的平方根與第 j個(gè)原始指標(biāo)Xj的系數(shù)αij的乘積,可得∶
式(10)中,αij稱為因子載荷,由因子載荷所構(gòu)成的矩陣為:
式(11)中,Q為因子載荷矩陣,因子載荷qij就是第i主成分Zi與第 j原始指標(biāo)Xj之間的相關(guān)系數(shù),它反映了主成分Zi與原始指標(biāo)Xj之間聯(lián)系的密切程度與作用的方向[6]。
2.2PSO原理
粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種新的基于群體智能的全局優(yōu)化算法,它源于對(duì)鳥捕食的模擬。該算法在1995年由Eberbart博士和kemedg博士提出。對(duì)于PSO來說,每個(gè)優(yōu)化問題的解決都是搜索空間的一只鳥,稱之為“粒子”。PSO算法最終通過迭代找到最優(yōu)解,起初要初始化為一群隨機(jī)粒子,則所有粒子都有一個(gè)被優(yōu)化函數(shù)決定的飛行方向與飛行距離的速度和適應(yīng)度值。在優(yōu)化過程中,在解空間中進(jìn)行有效搜索,且每個(gè)粒子追隨、記憶當(dāng)前的最優(yōu)粒子[7]。粒子群算法的數(shù)學(xué)描述為:假設(shè)在一個(gè)m維的搜索空間中,由n個(gè)粒子組成的種群x=(x1,x2,···,xn)T,其中第 i個(gè)粒子位置為 xi=(xi,1,xi,2,···,xi,n)T,其速度為vi=(vi,1,vi,2,···,vi,n)T。其中,它的個(gè)體極值為 pi=(pi,1,pi,2,···,pi,n)T,種群的全局極值為 pg=(pg,1,pg,2,···,pg,n)T,粒子在找到上述值后,就根據(jù)下面兩個(gè)公式來更新自己的速度與位置:
式(12)、(13)中,c1和c2為學(xué)習(xí)因子或加速數(shù),通常設(shè)表示第k次迭代中第d維的速度和位置,rand()為介于[0,1]的隨機(jī)數(shù)為粒子i在第d維的全局值的位置為粒子i在第d維的個(gè)體極值的位置。
粒子根據(jù)三條原則來更新自身狀態(tài),其一是,保持自身的慣性,其二是按自身的最優(yōu)位置改變自身的狀態(tài),其三是按群體的最優(yōu)位置改變狀態(tài)。
PSO算法的步驟為:
步驟1:每個(gè)粒子代表解空間的一個(gè)候選解。
步驟2:由適應(yīng)度函數(shù)決定解是優(yōu)解或劣解。
步驟3:在算法的每次迭代中,粒子總是跟蹤自身當(dāng)前找到的最優(yōu)解。
步驟4:粒子群找到當(dāng)前的全局最優(yōu)解進(jìn)行搜索,直到得到最后的最優(yōu)解[8]。
2.3LSSVM原理
支持向量機(jī)的復(fù)雜度與輸入空間維數(shù)無關(guān),并依賴于樣本數(shù)據(jù)數(shù)量,且當(dāng)樣本較多時(shí),訓(xùn)練時(shí)間就相當(dāng)長(zhǎng)。針對(duì)以上缺陷,Suykens等提出了LSSVM算法,把不等式約束改成等式約束,將支持向量機(jī)的損失函數(shù)設(shè)定成誤差平方和,加快了訓(xùn)練時(shí)間,待優(yōu)化參數(shù)減少,降低問題的計(jì)算復(fù)雜度。用最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)指標(biāo)進(jìn)行綜合評(píng)分。
式(14)中,非線性函數(shù)φ(·)的作用是將輸入的非線性樣本映射到高維特征空間的線性輸出,f(x)為描述函數(shù),內(nèi)積為描述函數(shù)的復(fù)雜度,它表示原低維空間到F空間的非線性映射;b表示常數(shù),其中b∈R,ω表示權(quán)向量,根據(jù)風(fēng)險(xiǎn)最小化原理,可得到LSSVM的最優(yōu)化回歸模型為:
式(14)、(15)中,εi為松馳變量,γ為懲罰因子,ω∈Rn為權(quán)向量,φ(·)為非線收斂空間的映射函數(shù)。
為求解優(yōu)化函數(shù)的最小值,當(dāng)常數(shù)λ>0時(shí),構(gòu)造如下拉格朗日函數(shù)為∶
式(16)中,αi為拉格朗日乘子,αi∈R。
根據(jù)KKT(Karush-Kuhn-Tucker)最優(yōu)條件,令L對(duì)ω、b、ε、α的偏導(dǎo)數(shù)等于0,則有:
式(17)中,對(duì)于i=1,2,···,n,消除ω和εi后,得到線性方程組為:
式(18)中,α=[α1,α2,···,αn]T,1v=[1,1,···,1]T,y=[y1,y2,···,yl]T,Ω為l×l為非負(fù)正定矩陣,I為1階單位矩陣,滿足Mercer條件:Ωij=K(xi,xj)=φ(xi)Tφ(xj),i,j=1,2,···,l,K(·)為支持向量機(jī)的核函數(shù),對(duì)于任一個(gè)函數(shù),可以確定一個(gè)Ω,并由以上線性方程組求解α,b,可得LSSVM的預(yù)測(cè)函數(shù)為:
式(19)中,本文LSSVM的核函數(shù)采用徑向基核函數(shù),徑向基核函數(shù)定義如下:
式(20)中,σ表示徑向基核寬度。其中,K(xi,xj)為滿足Mercer條件的支持向量機(jī)的核函數(shù)RBF,它可以解決在未知非線性變換具體條件下實(shí)現(xiàn)算法的非線性化,這就是支持向量機(jī)算法的一個(gè)非常明顯的特點(diǎn),它能較好地捕捉時(shí)間序列的非線性特征[9]。
2.4組合模型
根據(jù)電子商務(wù)信用風(fēng)險(xiǎn)評(píng)分的特點(diǎn),構(gòu)建PCAPSO-LSSVM組合模型,對(duì)電子商務(wù)信用風(fēng)險(xiǎn)進(jìn)行綜合評(píng)分,其組合模型流程圖如圖1所示。
圖1 PCA-PSO-LSSVM組合模型流程圖
組合模型操作步驟:
(1)數(shù)據(jù)準(zhǔn)備和預(yù)處理。將電子商務(wù)信用風(fēng)險(xiǎn)的各指標(biāo)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,構(gòu)建標(biāo)準(zhǔn)化后的矩陣。
(2)數(shù)據(jù)標(biāo)準(zhǔn)化后,將電子商務(wù)信用風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行主元分析,計(jì)算協(xié)方差的特征值。
(3)特征向量的選取。采用PCA方法,對(duì)輸入的特征向量進(jìn)行線性降維,降維的標(biāo)準(zhǔn)是選取包含85%以上信息的主元特征向量,即累計(jì)貢獻(xiàn)率占85%。
(4)選取支持最小二乘法的參數(shù)。對(duì)于最小二乘近似支持向量回歸模型的核函數(shù)設(shè)為RBF函數(shù),懲罰因子c和RBF核函數(shù)參數(shù)σ采用PSO算法的適應(yīng)度函數(shù)來選擇。
(5)利用最佳參數(shù)訓(xùn)練LSSVM(訓(xùn)練集)。用PSO選取后的懲罰參數(shù)C和σ訓(xùn)練LSSVM訓(xùn)練集。
(6)驗(yàn)證測(cè)試集。用以上決策函數(shù)對(duì)測(cè)試集進(jìn)行評(píng)分,將電子商務(wù)企業(yè)的數(shù)據(jù)一部分用于訓(xùn)練,一部分用于預(yù)測(cè),對(duì)前面訓(xùn)練的結(jié)果進(jìn)行測(cè)試,檢驗(yàn)選擇的懲罰因子c和RBF核函數(shù)參數(shù)σ是否合理。
(7)誤差檢驗(yàn)。用LSSVM、PSO-LSSVM和PCAPSO-LSSVM模型比較平均絕對(duì)相對(duì)誤差(Mean Absolute Percent Error,MAPE)和均方根誤差(Root Mean Squre Error,RMSE),檢查模型的合理性。
本文采用文獻(xiàn)[10]的數(shù)據(jù)來進(jìn)行電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分的實(shí)證研究,首先要構(gòu)建電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分的指標(biāo)體系,然后,利用PCA-PSO-LSSVM組合模型進(jìn)行綜合評(píng)分。
3.1指標(biāo)體系構(gòu)建
電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分指標(biāo)體系的建立,要遵循代表性、全面性和可驗(yàn)證性原則,指標(biāo)確定的研究對(duì)象為電子商務(wù)企業(yè),對(duì)企業(yè)的資金、人才、技術(shù)、品牌、市場(chǎng)的能力要通過相關(guān)指標(biāo)反映出來,構(gòu)建綜合評(píng)分指標(biāo)體系要符合電子商務(wù)企業(yè)的實(shí)際情況。建立電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分指標(biāo)體系,見表1。
表1 電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分指標(biāo)體系
3.2模型評(píng)分預(yù)測(cè)
根據(jù)表1的指標(biāo),通過專家論證、數(shù)據(jù)獲取的難易,剔除掉不易計(jì)算和數(shù)據(jù)不易獲取的部分指標(biāo),確定19個(gè)指標(biāo)為電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分指標(biāo)體系,其指標(biāo)為:銷售利潤(rùn)率X1、總資產(chǎn)報(bào)酬率X2、凈資產(chǎn)收益率X3、成本費(fèi)用利潤(rùn)率X4、總資產(chǎn)周轉(zhuǎn)率X5、流動(dòng)資產(chǎn)周轉(zhuǎn)率X6、存貨周轉(zhuǎn)率X7、應(yīng)收賬款周轉(zhuǎn)率X8、數(shù)字證書的等級(jí)X9、已獲利息倍數(shù)X10、流動(dòng)比率X11、速動(dòng)比率X12、平臺(tái)服務(wù)商信用X13、資本積累率X14、總資產(chǎn)增長(zhǎng)率X15、固定資產(chǎn)更新率X16、貨款逾期率X17、毀約率X18、貿(mào)易額增長(zhǎng)率X19,以上19個(gè)指標(biāo)為電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分指標(biāo)。用以上18家電子商務(wù)企業(yè)的信用風(fēng)險(xiǎn)綜合評(píng)分指標(biāo)的原始數(shù)據(jù)進(jìn)行歸一化處理,求出指標(biāo)體系的相關(guān)系數(shù)矩陣,確定主成分累積貢獻(xiàn)率為85%以上具有代表性的指標(biāo),見表2。
表2 特征值與累積貢獻(xiàn)率
從表2可以看出,累積貢獻(xiàn)率在85%以上的指標(biāo)為8個(gè)指標(biāo),實(shí)際貢獻(xiàn)率為87.879%,指標(biāo)分別為X1、X2、X3、X4、X5、X6、X7、X8,這些指標(biāo)能代表所有的指標(biāo),進(jìn)行電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分。
為了利用PCA-PSO-LSSVM組合模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)進(jìn)行綜合評(píng)分,將18家企業(yè)的前13家設(shè)為訓(xùn)練樣本,后5家設(shè)為測(cè)試樣本,驗(yàn)證PCA-PSO-LSSVM組合模型的可靠性,將8個(gè)主成分作為自變量,作為最小二乘近似支持向量回歸模型的輸入,將模型得分作為最小二乘近似支持向量回歸模型的輸出,利用最小二乘向量機(jī)回歸的主要目的是尋找綜合評(píng)分與13個(gè)評(píng)分指標(biāo)之間的非線性關(guān)系,從而進(jìn)行外推評(píng)分。一般情況下,最小二乘近似支持向量回歸模型的核函數(shù)為RBF函數(shù),懲罰因子子為c,RBF核函數(shù)的參數(shù)為σ,利用PSO方法來優(yōu)化確定其參數(shù)的大小,再利用Matlab12.0語言進(jìn)行編程,可以對(duì)樣本進(jìn)行訓(xùn)練和測(cè)試,運(yùn)用PCAPSO-LSSVM組合模型進(jìn)行訓(xùn)練,選用前13家企業(yè)的指標(biāo)數(shù)據(jù)來做為模型的訓(xùn)練樣本,其對(duì)應(yīng)的模型評(píng)分見表3。
表3 最小二乘支持向量模型評(píng)分表(訓(xùn)練集)
從表3可以看出,模型評(píng)分與實(shí)際評(píng)分進(jìn)行比較,是匹配的,證明模型具有較好的擬合效果,為了測(cè)試模型對(duì)上市電子商務(wù)企業(yè)信用風(fēng)險(xiǎn)評(píng)分的預(yù)測(cè)能力,本文在已有訓(xùn)練樣本之外,選取了剩余5家電子商務(wù)企業(yè)測(cè)試樣本進(jìn)行檢測(cè)和驗(yàn)證,預(yù)測(cè)的結(jié)果見表4。
表4 最小二乘支持向量模型評(píng)分測(cè)試表(測(cè)試集)
從表4可以看出,5家電子商務(wù)企業(yè)的模型預(yù)測(cè)結(jié)果比較吻合實(shí)際評(píng)分結(jié)果,說明PCA-PSO-LSSVM組合模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的評(píng)分有較強(qiáng)的預(yù)測(cè)能力。
3.3模型組合的擬合性檢測(cè)
為了檢驗(yàn)PCA-PSO-LSSVM模型的優(yōu)越性,選擇LSSVM、PSO-LSSVM和PCA-PSO-LSSVM進(jìn)行比較,模型性能評(píng)價(jià)標(biāo)準(zhǔn)為:平均絕對(duì)誤差(Mean Absolute Percent Error,MAPE)和均方根誤差(Root Mean Squre Error,RMSE)[8],它們的定義如下:
對(duì)于式(21)、(22),xi為電子商務(wù)信用風(fēng)險(xiǎn)指標(biāo)的實(shí)測(cè)值為某指標(biāo)的預(yù)測(cè)值,i為測(cè)試期數(shù),i=1,2,···,n,MAPE、RMSE的值越小,模型的預(yù)測(cè)精度越高,模型的擬合效果越好。各種方法的預(yù)測(cè)效果見表5。
表5 三種預(yù)測(cè)方法誤差比較
從表4可以看出,PCA-PSO-LSSVM模型的RMSE、MAPE值最小,說明PCA-PSO-LSSVM模型比單個(gè)的模型預(yù)測(cè)評(píng)分精度要高,PSO-LSSVM比LSSVM的評(píng)分精度要高,PCA-PSO-LSSVM的評(píng)分精度最高,說明PCAPSO-LSSVM的擬合度最好,同時(shí)也說明本文提出的PCA-PSO-LSSVM模型是科學(xué)合理的。
為了提高電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分能力,本文提出了PCA-PSO-LSSVM組合模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)進(jìn)行綜合評(píng)分,并利用18家電子商務(wù)企業(yè)的19個(gè)指標(biāo)的相關(guān)樣本數(shù)據(jù)進(jìn)行了實(shí)證分析。實(shí)證結(jié)果顯示:PCA-PSO-LSSVM組合模型對(duì)電子商務(wù)信用風(fēng)險(xiǎn)的綜合評(píng)分有較強(qiáng)的預(yù)測(cè)評(píng)分能力,與其他電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分模型相比,基于PCA-PSO-LSSVM組合模型的電子商務(wù)信用風(fēng)險(xiǎn)綜合評(píng)分模型具有參數(shù)少、計(jì)算速度快、預(yù)測(cè)準(zhǔn)確等優(yōu)點(diǎn),然而,由于樣本收集較為因難。建議評(píng)分在60以下的企業(yè)要加強(qiáng)信用風(fēng)險(xiǎn)的防范,改進(jìn)工作,提高抗風(fēng)險(xiǎn)能力;評(píng)分在60分以上的企業(yè),說明該電子商務(wù)企業(yè)風(fēng)險(xiǎn)小,有抗風(fēng)險(xiǎn)的能力要優(yōu)化風(fēng)險(xiǎn)調(diào)控結(jié)構(gòu),提高風(fēng)險(xiǎn)防范意識(shí)。
[1]姜明輝,許佩,韓旖桐,等.基于優(yōu)化CBR的個(gè)人信用評(píng)分研究[J].中國軟科學(xué),2014,(12)∶148-156.
[2]王磊,范超,解明明.數(shù)據(jù)挖掘型在小企業(yè)主信用評(píng)分領(lǐng)域的應(yīng)用[J].統(tǒng)計(jì)研究,2014,31(10)∶89-97.
[3]董曉林,陶月琴,程超.信用評(píng)分技術(shù)在縣域小微企業(yè)信貨融資中的應(yīng)用[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2015,(10)∶107-116.
[4]陸愛國,王玨,劉紅衛(wèi).基于改進(jìn)的SVM學(xué)習(xí)算法及其在信用評(píng)分中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2012,32(3)∶515-522.
[5]Wei-Li Qin,Wen-Jin Zhang,Chen Lu.A Method for Aileron Actuator Fault Diagnosis Based on PCA and PGC-SVM[J]. Journal of Economics and Business,2016,25∶254-261.
[6]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京∶人民衛(wèi)生出版社,2002.
[7]龍文,梁昔明,龍祖強(qiáng),等.PSO-LSSVM灰色組合模型在地下水埋深預(yù)測(cè)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2013,33(1)∶243-248.
[8]朱幫助,魏一鳴.基于GMDH-PSO-LSSVM的國際碳市場(chǎng)價(jià)格預(yù)測(cè)[J].系統(tǒng)工程理論與實(shí)踐,2011,31(12)∶2 264-2 271.
[9]余樂安.基于最小二乘法近似支持向量回歸模型的電子商務(wù)信用風(fēng)險(xiǎn)預(yù)警[J].系統(tǒng)工程理論與實(shí)踐,2012,32(3)∶508-514.
[10]王新輝.基于BP神經(jīng)網(wǎng)絡(luò)的國際電子商務(wù)信用風(fēng)險(xiǎn)預(yù)警模型研究[D].沈陽∶沈陽工業(yè)大學(xué),2006.
Evaluation of E-commerce Credit Risks Based on Kernel PCA and Neural Network
Wu Jianping
(School of Business, Lingnan Normal University, Zhanjiang 524048, China)
In this paper, in order to reinforce the classification of the e- commerce credit risks and reduce the complexity of the ecommercecategorization, we established the e- commerce credit risk classification model using the kernel PCA, PSO and neural networkalgorithm. More specifically, we pre- treated the data, had its eigenvalue and eigenvector extracted using the kernel PCA to reduce thedimensionality of the data, next, using the modified PSO, searched and determined the inertial weight and threshold value of the BP neuralnetwork, using the BP neural network to train the data of 13 enterprises and then tested and forecast the data of another five, and finallyclassified the results of the 18 enterprises. Through the application, we verified the merit of the KPCA-MPSO-ANN based model in thisrespect.
F713.36;F224
A
1005-152X(2016)03-0087-07
10.3969/j.issn.1005-152X.2016.03.020
2016-02-15
國家級(jí)星火計(jì)劃項(xiàng)目(2013GA780086);湛江市第一批財(cái)政資金科技專項(xiàng)備用經(jīng)費(fèi)項(xiàng)目(湛科[2013]120號(hào));南海絲綢之路協(xié)同創(chuàng)新中心資助
鄔建平(1962-),男,湖北仙桃人,博士,高級(jí)實(shí)驗(yàn)師,研究方向:電子商務(wù)智能管理、電子商務(wù)綜合評(píng)價(jià)。