榮飛瓊,郭夢(mèng)飛
(蘭州財(cái)經(jīng)大學(xué) 信息工程學(xué)院,甘肅 蘭州 730020)
近年來,在中國(guó)國(guó)內(nèi)傳統(tǒng)貿(mào)易增速放緩的形勢(shì)下,跨境電子商務(wù)卻持續(xù)保持著高速增長(zhǎng)的態(tài)勢(shì),其發(fā)展?jié)摿薮?,必將成為中?guó)對(duì)外貿(mào)易新的重要增長(zhǎng)點(diǎn)??缇畴娚唐脚_(tái)作為新型的貿(mào)易中間商,其本身可以直接參與交易,也可以不直接參與交易,即只為買賣雙方提供貿(mào)易磋商的平臺(tái),由交易主體自行達(dá)成交易。目前,國(guó)內(nèi)主要以間接參與交易的跨境電商平臺(tái)為主,由于這種間接參與交易的方式,導(dǎo)致平臺(tái)上的注冊(cè)會(huì)員(即跨境電商交易中的供應(yīng)商)的信用失去了保障,由此引發(fā)諸多交易糾紛,也限制了跨境電商平臺(tái)的發(fā)展。因此,跨境電商平臺(tái)中供應(yīng)商信用評(píng)估問題的研究具有很強(qiáng)的緊迫性和必要性。本文試圖從跨境電商平臺(tái)中供應(yīng)商信用評(píng)估的角度出發(fā),尋求完善中國(guó)跨境電商平臺(tái)質(zhì)量擔(dān)保功能的方法。
國(guó)內(nèi)針對(duì)企業(yè)信用評(píng)估的研究成果豐富。張德棟等用量化離散數(shù)據(jù)的方法和歸一法處理指標(biāo)數(shù)據(jù),設(shè)計(jì)了一個(gè)企業(yè)信用評(píng)估的指標(biāo)體系,并根據(jù)該指標(biāo)體系建立了基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用3層神經(jīng)網(wǎng)絡(luò)評(píng)估模型[1];何躍等實(shí)現(xiàn)了基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用評(píng)估模型,并使用了改進(jìn)BP神經(jīng)網(wǎng)絡(luò)算法[2];陳鑫銘等設(shè)計(jì)了一套基于基本信用、職業(yè)信用、交易信用的信用評(píng)估體系以及基于AHP方法的C2C電子商務(wù)信用評(píng)估模型[3];冷沙沙等結(jié)合網(wǎng)下靜態(tài)指標(biāo)和網(wǎng)上動(dòng)態(tài)指標(biāo),運(yùn)用層次分析法確定指標(biāo)權(quán)重并建立信用評(píng)估指標(biāo)體系,定義了B2B企業(yè)信用評(píng)估模型[4];郭亦涵等認(rèn)為在進(jìn)行商家信用評(píng)估時(shí),應(yīng)該以產(chǎn)品質(zhì)量、信息質(zhì)量、服務(wù)質(zhì)量為核心建立信用評(píng)價(jià)指標(biāo)體系,同時(shí)綜合考慮評(píng)價(jià)機(jī)構(gòu)信用水平、交易金額和交易時(shí)間等指標(biāo),并運(yùn)用模糊評(píng)價(jià)法確定了指標(biāo)權(quán)重[5];馬曉青等使用Logistic模型與因子分析相結(jié)合的方法構(gòu)建了小企業(yè)信用評(píng)估模型和指標(biāo)體系,其數(shù)據(jù)來源是某商業(yè)銀行信貸數(shù)據(jù)[6];付永貴等以B2C電子商務(wù)為例,提出網(wǎng)絡(luò)供應(yīng)商信用評(píng)估數(shù)據(jù)的來源及數(shù)據(jù)處理流程,使用逐步回歸法建立了B2C網(wǎng)絡(luò)供應(yīng)商的信用評(píng)估指標(biāo)體系,構(gòu)建基于部分調(diào)整模型及帶權(quán)重的徑向基神經(jīng)網(wǎng)絡(luò)模型的B2C供應(yīng)商信用評(píng)估模型[7]。使用大數(shù)據(jù)技術(shù),很大程度上解決了數(shù)據(jù)來源單一的問題,這是電子商務(wù)交易中企業(yè)信用評(píng)估的一個(gè)新思路,非常值得借鑒。
對(duì)上述研究成果進(jìn)行分析發(fā)現(xiàn):第一,大部分評(píng)估模型的數(shù)據(jù)來源不夠豐富,主要以交易系統(tǒng)中交易主體的交易數(shù)據(jù)為主;第二,由于數(shù)據(jù)來源單一,導(dǎo)致信用評(píng)價(jià)指標(biāo)體系不夠全面;第三,缺乏有效的模型評(píng)估方法,模型精確度和穩(wěn)健性缺乏量化依據(jù)。
同時(shí),國(guó)內(nèi)關(guān)于跨境電商及跨境電商平臺(tái)方面的研究也比較多。呂雪晴等對(duì)中國(guó)跨境電商行業(yè)發(fā)展中存在的問題進(jìn)行了分析,提出確定品牌化發(fā)展、供應(yīng)鏈管控和服務(wù)縱深化的發(fā)展路徑[8];陶濤等提出跨境電商平臺(tái)作為新型貿(mào)易中間商,一要解決跨境電商平臺(tái)的信用和質(zhì)量擔(dān)保問題,以真正實(shí)現(xiàn)跨境電商平臺(tái)的在線B2B交易,二要向行業(yè)細(xì)分的在線交易平臺(tái)方向發(fā)展[9];徐碩提出中國(guó)中小企業(yè)要結(jié)合自身實(shí)際情況選擇跨境電商平臺(tái)的原則和方法[10]。從以上研究可以發(fā)現(xiàn),針對(duì)跨境電商平臺(tái)的研究主要集中在發(fā)展戰(zhàn)略和路徑選擇上[11],對(duì)跨境電商企業(yè)的研究則主要集中在傳統(tǒng)企業(yè)向跨境電商企業(yè)轉(zhuǎn)型、跨境電商平臺(tái)選擇戰(zhàn)略和跨境電商企業(yè)發(fā)展戰(zhàn)略等方面,而對(duì)跨境電商平臺(tái)中涉及的企業(yè)信用評(píng)估問題還鮮有涉及。
信用問題是關(guān)乎跨境電商交易頻率和效率的關(guān)鍵因素,也是制約跨境電商發(fā)展的主要原因,而研究跨境電商平臺(tái)中供應(yīng)商的信用評(píng)估問題,是完善跨境電商平臺(tái)質(zhì)量擔(dān)保功能的重要保障。本文致力于從跨境電商平臺(tái)中供應(yīng)商的特點(diǎn)出發(fā),在大數(shù)據(jù)環(huán)境中分析供應(yīng)商的相關(guān)數(shù)據(jù),構(gòu)建跨境電商平臺(tái)中供應(yīng)商的信用評(píng)估指標(biāo)體系和信用評(píng)估模型,以解決跨境電商平臺(tái)中供應(yīng)商信用評(píng)估缺陷。
跨境電商平臺(tái)中的供應(yīng)商有三點(diǎn)特殊性:第一,跨境電商平臺(tái)供應(yīng)商本質(zhì)上是網(wǎng)絡(luò)供應(yīng)商,與傳統(tǒng)供應(yīng)商面臨的交易環(huán)境不同;第二,他們從事的是進(jìn)出口貿(mào)易,交易流程和內(nèi)容與其他網(wǎng)絡(luò)供應(yīng)商不同;第三,跨境電商平臺(tái)供應(yīng)商的企業(yè)規(guī)??缍却???缇畴娚棠J街凶畛醢l(fā)展起來的是跨境 B2B 模式,這種模式的參與者主要是大中型企業(yè),其率先嘗試跨境電商模式,從中獲利,吸引了很多中小企業(yè)加入其中,所以跨境電商平臺(tái)中的供應(yīng)商,從大中型企業(yè)到小微企業(yè)一應(yīng)俱全。要針對(duì)跨境電商平臺(tái)供應(yīng)商進(jìn)行信用評(píng)估,評(píng)價(jià)指標(biāo)的選擇就要充分考慮供應(yīng)商的特殊性,結(jié)合其自身特點(diǎn)來進(jìn)行。
本文在一般網(wǎng)絡(luò)供應(yīng)商信用評(píng)估指標(biāo)體系的基礎(chǔ)上[12-14],結(jié)合跨境電商平臺(tái)供應(yīng)商的特征,經(jīng)過分析、研究、討論,給出如下備選指標(biāo)集合(Ia):線上發(fā)展規(guī)模(I1)、供應(yīng)商從事跨境電商時(shí)間(I2)、供應(yīng)商提供信息的完整度(I3)、供應(yīng)商產(chǎn)品質(zhì)量(I4)、供應(yīng)商聲譽(yù)(I5)、供應(yīng)商提供產(chǎn)品類型總數(shù)(I6)、供應(yīng)商資產(chǎn)狀況(I7)、供應(yīng)商負(fù)債狀況(I8)、售后服務(wù)水平(I9)、供應(yīng)商產(chǎn)品質(zhì)量提升意愿(I10)、供應(yīng)商對(duì)經(jīng)營(yíng)流程的熟悉程度(I11)、工作人員專業(yè)水平(I12)、品牌知名度(I13)、供應(yīng)商產(chǎn)品價(jià)格(I14)、產(chǎn)品自主知識(shí)產(chǎn)權(quán)水平(I15)、決策人員跨境電商意識(shí)(I16)。
需要說明的是,備選指標(biāo)的選擇是基于三方面因素考慮的:
第一,結(jié)合跨境電商平臺(tái)中供應(yīng)商特點(diǎn),客戶群體對(duì)供應(yīng)商的關(guān)注點(diǎn)及跨境電商平臺(tái)自身需求進(jìn)行大方向上的選擇。本文借鑒了傳統(tǒng)企業(yè)信用評(píng)估指標(biāo)選擇的方法和原則,主要從產(chǎn)品、人員、技術(shù)、資金、管理等五個(gè)方面來進(jìn)行指標(biāo)選擇。
第二,考慮指標(biāo)數(shù)據(jù)獲取來源,有針對(duì)性地確定備選指標(biāo)。要擴(kuò)大數(shù)據(jù)來源,不能讓數(shù)據(jù)的不充足限制指標(biāo)體系的完整性,所以本文通過網(wǎng)絡(luò)爬蟲程序有目標(biāo)地抓取數(shù)據(jù),在大數(shù)據(jù)環(huán)境下自由獲取豐富數(shù)據(jù)。
(1)
本文充分考慮可獲得數(shù)據(jù)的種類,運(yùn)用線性、非線性的數(shù)據(jù)處理方法,得出了最終的指標(biāo)構(gòu)建方法。
1.數(shù)據(jù)獲取。在大數(shù)據(jù)環(huán)境下,可自由獲取的數(shù)據(jù)非常豐富,通過編寫網(wǎng)絡(luò)爬蟲程序有目標(biāo)地抓取數(shù)據(jù)也是比較輕松的,但是由于大數(shù)據(jù)具有非結(jié)構(gòu)化特征,產(chǎn)生的數(shù)據(jù)多樣化明顯,同時(shí)還伴有大量噪音和缺失值,使得清洗數(shù)據(jù)的工作異常耗時(shí)耗力。為了獲取充足的指標(biāo)取值,本文分別從跨境電商平臺(tái)、第三方信息系統(tǒng)以及供應(yīng)商自建網(wǎng)站中抓取數(shù)據(jù)。在抓取數(shù)據(jù)的過程中,采用了廣度優(yōu)先遍歷策略,將程序模塊化和結(jié)構(gòu)化。在評(píng)估指標(biāo)基本確定的情況下,實(shí)現(xiàn)了全部數(shù)據(jù)從來源到數(shù)據(jù)庫(kù)的自動(dòng)化,最大限度減少人工干預(yù),有效保證了數(shù)據(jù)的時(shí)效性和一致性。在大數(shù)據(jù)環(huán)境下,只有完全實(shí)現(xiàn)數(shù)據(jù)采集“自動(dòng)化”,數(shù)據(jù)量的“大”才有保證,才能把握待評(píng)估供應(yīng)商在每個(gè)評(píng)估指標(biāo)上的整體變化趨勢(shì)。
數(shù)據(jù)抓取過程中,爬蟲算法具體流程分為五個(gè)階段:供應(yīng)商選擇、核心網(wǎng)頁(yè)源解析、數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)存儲(chǔ)。供應(yīng)商選擇階段:程序?qū)⒐?yīng)商主頁(yè)網(wǎng)址作為爬蟲入口,并將所有待爬取供應(yīng)商主頁(yè)的網(wǎng)址都入棧;核心網(wǎng)頁(yè)源解析階段:將爬取到的主頁(yè)進(jìn)行解析,解析出含有待爬取信息的網(wǎng)頁(yè)的鏈接,并抽取主頁(yè)中所需信息;數(shù)據(jù)清洗階段:用默認(rèn)值填充缺失值,刪除臟數(shù)據(jù),將數(shù)據(jù)做結(jié)構(gòu)化調(diào)整;數(shù)據(jù)集成階段:在已經(jīng)結(jié)構(gòu)化的數(shù)據(jù)中擇取和計(jì)算評(píng)估指標(biāo);數(shù)據(jù)存儲(chǔ)階段:將指標(biāo)數(shù)據(jù)存儲(chǔ)到提前建好的關(guān)系數(shù)據(jù)庫(kù)中。上述五個(gè)階段在程序中形成一條指標(biāo)數(shù)據(jù)生產(chǎn)線,通過清晰的階段劃分可使程序的構(gòu)建組件化。
2.數(shù)據(jù)標(biāo)準(zhǔn)化處理。在進(jìn)行指標(biāo)構(gòu)建之前,需要對(duì)抓取的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,使指標(biāo)中的各個(gè)數(shù)據(jù)構(gòu)成作用同趨化。本文采用z-score 標(biāo)準(zhǔn)化法進(jìn)行數(shù)據(jù)處理,標(biāo)準(zhǔn)化公式如下:
(2)
3.指標(biāo)構(gòu)建方法。指標(biāo)具體構(gòu)建方法見表1。
采用神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)系統(tǒng)對(duì)不同類型的企業(yè)進(jìn)行信用評(píng)估,是近年來常見的信用評(píng)估方法。因?yàn)榛谏窠?jīng)網(wǎng)絡(luò)的信用評(píng)估模型具有比較高的可信度,很少受到分析人員的主觀好惡影響,完全以企業(yè)的信用資料為基礎(chǔ),其中BP神經(jīng)網(wǎng)絡(luò)因其可容納高度復(fù)雜的非線性映射關(guān)系而更受歡迎。BP神經(jīng)網(wǎng)絡(luò)在無事前描述映射關(guān)系的數(shù)學(xué)方程的情況下,就可以學(xué)習(xí)和存儲(chǔ)大量輸入-輸出模式的映射關(guān)系,只要有足夠多的隱層和隱結(jié)點(diǎn),就可以逼近任意的非線性映射關(guān)系[16-18]。
表1 指標(biāo)構(gòu)建方法
BP神經(jīng)網(wǎng)絡(luò)能通過輸入、隱層和輸出層將任意的N維輸入映射到M維輸出,具體結(jié)構(gòu)見圖1。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
結(jié)合本文所探討的問題,將模型簡(jiǎn)化為N維輸入和1維輸出。大致計(jì)算步驟可分為前向傳播和誤差反向傳播兩個(gè)方面,整個(gè)訓(xùn)練過程采用基于梯度的誤差反饋訓(xùn)練算法,具體描述如下:
1.前向傳播階段。
(3)
2.誤差反向傳播階段。
1)為計(jì)算神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與真實(shí)目標(biāo)值的誤差,計(jì)算二者的均方誤差,其計(jì)算公式如下:
(4)
其中Pi和Pi′分別代表了第i個(gè)樣本的神經(jīng)網(wǎng)絡(luò)輸出值和真實(shí)目標(biāo)值(也稱作期望值)。
2)為使均方誤差最小化,采用梯度下降算法來調(diào)節(jié)權(quán)值,權(quán)值的調(diào)節(jié)公式如下:
(5)
其中α代表了學(xué)習(xí)速率,為防止模型不收斂,α一般取0.01左右;k代表了第k次迭代。通過對(duì)偏導(dǎo)數(shù)部分計(jì)算,得出最終計(jì)算公式:
Wk+1-Wk=ΔWijk=
(6)
其中ΔWijk代表了第i層第j個(gè)神經(jīng)元與第i+1層第k個(gè)神經(jīng)元的權(quán)值增量,Ni+2代表第i+2層的節(jié)點(diǎn)數(shù),Oij代表了第i層第j個(gè)神經(jīng)元輸出。
δik=
(7)
3)通過上述計(jì)算,使梯度從輸出層回流至輸入層,并不斷迭代步驟1~3,最終使整個(gè)網(wǎng)絡(luò)權(quán)值達(dá)到最優(yōu)。
一般來講,基于梯度的誤差反饋訓(xùn)練算法有兩個(gè)方面的局限性:第一,在高維空間中空間曲面存在很多的馬鞍面,也就是趨于平坦的曲面,造成梯度在這些局部趨于無窮小;第二,算法的loss函數(shù)存在較多局部極小值?;诖耍跇?gòu)建BP神經(jīng)網(wǎng)絡(luò)信用評(píng)估模型的時(shí)候,本文采用了兩種典型的改進(jìn)算法:增加動(dòng)量項(xiàng)和學(xué)習(xí)速率自適應(yīng)調(diào)節(jié)算法[19]28-33。
1.增加動(dòng)量項(xiàng)。標(biāo)準(zhǔn)BP 算法在調(diào)整權(quán)值時(shí),只按t時(shí)刻誤差的梯度下降方向調(diào)整,沒有考慮t時(shí)刻以前的梯度方向,使得在搜索某些參數(shù)空間時(shí)(如位于馬鞍面、極值點(diǎn)構(gòu)成的面等)梯度會(huì)變得相當(dāng)小,訓(xùn)練進(jìn)入相當(dāng)慢甚至停滯的狀態(tài)。為了提高訓(xùn)練速度,可以在權(quán)值調(diào)整公式中加一動(dòng)量項(xiàng):
Δw(t)=ηδo+αΔw(t-1)
(8)
2.學(xué)習(xí)速率的自適應(yīng)調(diào)節(jié)。學(xué)習(xí)速率η是神經(jīng)網(wǎng)絡(luò)中一個(gè)非常重要的超參數(shù),在實(shí)際應(yīng)用中需要經(jīng)常調(diào)整,具體原因是:在誤差曲面中,平坦區(qū)內(nèi)η太小會(huì)使訓(xùn)練次數(shù)增加,此時(shí)就需要將η值調(diào)整得大一些;而在誤差變化劇烈的區(qū)域,過大的η使訓(xùn)練出現(xiàn)振蕩,導(dǎo)致迭代次數(shù)增加,此時(shí)就需要將其調(diào)整得小一些。為了使收斂過程不斷加速,最好能實(shí)現(xiàn)學(xué)習(xí)速率η的自適應(yīng)調(diào)整,也就是說需要大的時(shí)候大,需要小的時(shí)候小,具體做法是根據(jù)網(wǎng)絡(luò)總誤差來調(diào)整:在網(wǎng)絡(luò)經(jīng)過一次權(quán)值更新后,若E總↑,則本次調(diào)整無效,且:
η=βη0<β<1
(9)
若E總↓,則有效,且:
η=αηα>1
(10)
本文以國(guó)內(nèi)幾家獨(dú)立第三方外貿(mào)企業(yè)間(B2B)或者外貿(mào)企業(yè)對(duì)個(gè)人零售電子商務(wù)(B2C)交易平臺(tái),如敦煌網(wǎng)、全球速賣通、阿里巴巴國(guó)際市場(chǎng)等作為大數(shù)據(jù)源,從中選取大量的供應(yīng)商樣本進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,判斷信用評(píng)估模型的準(zhǔn)確性,并給出供應(yīng)商信用評(píng)估結(jié)果。
1)使用網(wǎng)絡(luò)爬蟲從幾個(gè)跨境電商平臺(tái)中采集各供應(yīng)商的相關(guān)信用數(shù)據(jù)。
2)明確最終確定的指標(biāo)集合{i1,i2,…,i16}中各個(gè)指標(biāo)的含義及計(jì)算方法,確定各樣本在不同指標(biāo)中的取值。
3)將供應(yīng)商信用評(píng)估等級(jí)分為差、中、良和優(yōu),對(duì)應(yīng)標(biāo)稱值分別為0,1,2和3。在MATLAB自帶的BP神經(jīng)網(wǎng)絡(luò)中,輸出值是一個(gè)連續(xù)值而非離散值,因此對(duì)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)輸出值作四舍五入的處理,使每個(gè)供應(yīng)商最終的分類結(jié)果值保持在離散取值上。另外,當(dāng)輸出值小于0時(shí),處理的最終值為0;輸出值大于3時(shí),處理的最終值為3。最終值的處理函數(shù)如下:
(11)
式(11)中ypre是MATLAB自帶BP神經(jīng)網(wǎng)絡(luò)的直接輸出結(jié)果,output代表了最終的分類取值。
4)將選取的供應(yīng)商樣本分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),測(cè)試集用來測(cè)試BP神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確度。在信用評(píng)估模型準(zhǔn)確率較高的前提下,給出所有樣本的信用評(píng)估等級(jí)。
基于以上步驟,共選取得到了547個(gè)樣本,其中供應(yīng)商行業(yè)主要以服裝類行業(yè)為主。由于本文所采用的指標(biāo)評(píng)估體系基于“減少專家評(píng)估”的指標(biāo)建設(shè)原則,故只需對(duì)這547個(gè)樣本進(jìn)行l(wèi)abel評(píng)估,即評(píng)估出該樣本的最終信用評(píng)估等級(jí),這樣就減少了人工干預(yù)的可能,最大限度地排除了主觀因素。另外,BP神經(jīng)網(wǎng)絡(luò)中模型復(fù)雜度非常高,只有使用“真正大量”的樣本才能做到更具泛化性和準(zhǔn)確性。本文盡可能地降低了人工工作量,使樣本數(shù)量得到了很大擴(kuò)充,保證了模型的泛化能力和準(zhǔn)確性。同時(shí),為了使模型訓(xùn)練更穩(wěn)定、更快收斂,又對(duì)所有指標(biāo)進(jìn)行了二次統(tǒng)一標(biāo)準(zhǔn)化處理。
本文建立了BP神經(jīng)網(wǎng)絡(luò)信用評(píng)估模型,實(shí)現(xiàn)了供應(yīng)商信用自動(dòng)化評(píng)估。首先,將樣本隨機(jī)分為訓(xùn)練集和測(cè)試集,這樣處理是為了保證測(cè)試結(jié)果的客觀性和準(zhǔn)確性,其中:90%的樣本作為訓(xùn)練集,專門用于訓(xùn)練BP神經(jīng)網(wǎng)絡(luò);10%的樣本作為測(cè)試集,專門用于測(cè)試神經(jīng)網(wǎng)絡(luò)的泛化性和擬合效果。其次,通過對(duì)模型的不斷優(yōu)化和調(diào)試,得到如下BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖(圖2),其中14個(gè)輸入變量,20個(gè)隱藏層神經(jīng)元,1個(gè)輸出神經(jīng)元,隱藏層激活函數(shù)采用tanh函數(shù),以保證神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到非線性規(guī)律,輸出層激活函數(shù)采用直線函數(shù)。為防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)在局部來回震蕩,學(xué)習(xí)速率值確定為0.000 01,整個(gè)神經(jīng)網(wǎng)絡(luò)訓(xùn)練經(jīng)過6次迭代后停止。這里采用的Levenberg-Marquardt算法迭代,是本文之前談到的梯度下降算法的具體應(yīng)用,只是學(xué)習(xí)速率和動(dòng)量項(xiàng)略有調(diào)整。神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成后,其誤差的直方圖如圖3所示。
圖2 調(diào)整后的BP網(wǎng)絡(luò)結(jié)構(gòu)圖
圖3 誤差直方圖
由圖3可知,在MATLAB神經(jīng)網(wǎng)絡(luò)工具箱自動(dòng)劃分的訓(xùn)練集、驗(yàn)證集和測(cè)試集下,誤差多數(shù)集中在0的附近,表示出較好的擬合效果;通過對(duì)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)調(diào)整,實(shí)現(xiàn)了在訓(xùn)練集上92%的正確率,在測(cè)試集上89%的正確率;雖然測(cè)試集上表現(xiàn)出輕微的過擬合現(xiàn)象,但總體模型精度仍在可接受范圍內(nèi)。
需要說明的是,本文在建立BP神經(jīng)網(wǎng)絡(luò)模型時(shí),大部分參數(shù)調(diào)整都有相應(yīng)的理論支撐,而隱藏層神經(jīng)元個(gè)數(shù)的選擇目前還沒有明確的理論指導(dǎo),多數(shù)采用經(jīng)驗(yàn)公式或者通過嘗試不同數(shù)值來求得最佳值。所以,本文以程序自動(dòng)化的方式實(shí)現(xiàn)不同數(shù)值試驗(yàn),最終確定了最優(yōu)神經(jīng)元個(gè)數(shù)。
通過對(duì)手動(dòng)劃分的訓(xùn)練集和測(cè)試集的模擬預(yù)測(cè),本文得到的結(jié)果見圖4。
圖4 準(zhǔn)確率示意圖
由圖4可知,每個(gè)樣本都得到了準(zhǔn)確評(píng)級(jí),評(píng)級(jí)取值分別為0、1、2、3,依次代表信用評(píng)估等級(jí)差、中、良和優(yōu)。在訓(xùn)練集中,評(píng)級(jí)為“中”和“良”的樣本數(shù)量居多,大約只有10%的樣本散落在“優(yōu)”和“差”的取值范圍內(nèi)。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果和真實(shí)評(píng)估結(jié)果的吻合率達(dá)到了0.92。在訓(xùn)練集準(zhǔn)確率可接受的前提下,本文對(duì)測(cè)試集樣本進(jìn)行了信用評(píng)估,信用評(píng)級(jí)結(jié)果和訓(xùn)練集相似,大部分樣本評(píng)級(jí)結(jié)果為“中”和“良”,只有極少數(shù)樣本評(píng)級(jí)結(jié)果為“優(yōu)”或“差”。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果和真實(shí)評(píng)估結(jié)果的吻合率達(dá)到了0.89,這說明無論是訓(xùn)練集還是測(cè)試集,模型預(yù)測(cè)結(jié)果準(zhǔn)確率都在90%左右。
為進(jìn)一步確認(rèn)模型在實(shí)際應(yīng)用中的可靠性,本文采用主流的機(jī)器學(xué)習(xí)模型驗(yàn)證方法K-折交叉驗(yàn)證和混淆矩陣進(jìn)行驗(yàn)證。
1.K-折交叉驗(yàn)證。
1)算法概述。K-折交叉驗(yàn)證法將數(shù)據(jù)集分為k份,進(jìn)行k次模型驗(yàn)證。在第i次驗(yàn)證中,將第i份數(shù)據(jù)作為驗(yàn)證集,其余作為訓(xùn)練集。每一次訓(xùn)練都在訓(xùn)練集上訓(xùn)練,并在驗(yàn)證集上進(jìn)行評(píng)估。K-折交叉驗(yàn)證法對(duì)所有數(shù)據(jù)都進(jìn)行了訓(xùn)練,并且對(duì)所有數(shù)據(jù)進(jìn)行了評(píng)估,能有效地檢驗(yàn)?zāi)P偷姆夯芰?。另外,k一般取10時(shí)能達(dá)到較好的驗(yàn)證效果。
2)驗(yàn)證結(jié)果。在對(duì)模型進(jìn)行十次交叉驗(yàn)證的基礎(chǔ)上,又計(jì)算了模型的精確度。精確度在二分類問題上的計(jì)算公式如下:
(12)
其中TP代表了正確分成正類的樣本數(shù)量,TN代表了正確分成負(fù)類樣本數(shù)量,F(xiàn)P和FN分別代表了錯(cuò)誤分成正類的樣本數(shù)量和錯(cuò)誤分成負(fù)類的樣本數(shù)量。基于此,本文得到的精確度驗(yàn)證結(jié)果見圖5,其均值為0.866 5。
圖5 十次交叉驗(yàn)證精確度圖
2.混淆矩陣?;煜仃噷㈩A(yù)測(cè)值與真實(shí)值集中在一個(gè)矩陣?yán)?,通過對(duì)預(yù)測(cè)值和實(shí)際類別計(jì)數(shù)的方法,集中反映模型的準(zhǔn)確率、召回率等指標(biāo)。由混淆矩陣的性質(zhì)可知,當(dāng)混淆矩陣的數(shù)據(jù)越集中于矩陣對(duì)角線時(shí),表示模型越具有穩(wěn)健性。研究中十次交叉驗(yàn)證的每一次驗(yàn)證都生成了對(duì)應(yīng)的混淆矩陣,其中一折驗(yàn)證的示例圖見圖6。
圖6 交叉驗(yàn)證混淆矩陣結(jié)果示例圖
從圖6可以看出,只有少量的樣本不在對(duì)角線上,即絕大部分驗(yàn)證集被正確分類。
本文又對(duì)十次交叉驗(yàn)證的所有混淆矩陣進(jìn)行了精確度評(píng)估,得出評(píng)估結(jié)果見表2。
表2 十次交叉驗(yàn)證下多類精確度均值
表2中的精確度矩陣代表了多類任務(wù)下基于混淆矩陣的精確度評(píng)估,其中每行代表實(shí)際類別,每列代表預(yù)測(cè)類別,矩陣中每一元素對(duì)應(yīng)著該行所代表的類別預(yù)測(cè)為該列所代表類別的概率。對(duì)角線上元素代表了該行代表的類被正確預(yù)測(cè)的概率,即精確度,且每一行加總為1。評(píng)估結(jié)果表明,模型對(duì)后三類樣本分類的預(yù)測(cè)準(zhǔn)確度較高,這與后三類樣本數(shù)量較多有關(guān)??梢姡嗟臉颖緮?shù)量會(huì)使訓(xùn)練結(jié)果更具泛化能力。綜合K-折交叉驗(yàn)證和混淆矩陣驗(yàn)證的結(jié)果來看,模型具有較好的穩(wěn)健性和泛化性,是可靠的信用評(píng)估模型。
本文從跨境電商平臺(tái)供應(yīng)商信用評(píng)估問題入手,在傳統(tǒng)供應(yīng)商信用評(píng)估指標(biāo)體系的基礎(chǔ)上,結(jié)合跨境電商平臺(tái)中供應(yīng)商的特征,著重考慮指標(biāo)數(shù)據(jù)獲取來源等因素,構(gòu)建了較為完善的跨境電商平臺(tái)供應(yīng)商信用評(píng)估指標(biāo)體系和基于BP神經(jīng)網(wǎng)絡(luò)的信用評(píng)估模型,并進(jìn)行了實(shí)證研究。在實(shí)證研究中,本文在547個(gè)樣本中隨機(jī)選取10%的樣本作為測(cè)試集,分別得到了每個(gè)樣本的信用等級(jí)預(yù)測(cè)結(jié)果,預(yù)測(cè)結(jié)果和真實(shí)評(píng)估結(jié)果的吻合率達(dá)到了90%。最后,采用機(jī)器學(xué)習(xí)驗(yàn)證方法——K-折交叉驗(yàn)證和混淆矩陣對(duì)模型進(jìn)行了評(píng)價(jià),證明其評(píng)估結(jié)果準(zhǔn)確,模型穩(wěn)健可靠,可以推廣至實(shí)際應(yīng)用中去。
結(jié)合本文的研究結(jié)果及跨境電商平臺(tái)的功能特征,對(duì)跨境電商平臺(tái)供應(yīng)商信用評(píng)價(jià)的實(shí)際應(yīng)用給出以下兩方面的建議。
其一,建議在跨境電商平臺(tái)供應(yīng)商信用評(píng)估指標(biāo)體系中,進(jìn)一步完善和細(xì)化供應(yīng)商資金要素方面的指標(biāo)。這部分?jǐn)?shù)據(jù)關(guān)乎企業(yè)商業(yè)機(jī)密,又對(duì)供應(yīng)商信用評(píng)級(jí)結(jié)果影響比較大,但是除非上市公司,否則無法取得關(guān)于供應(yīng)商資產(chǎn)和負(fù)債狀況的財(cái)務(wù)數(shù)據(jù)。在實(shí)際應(yīng)用中,跨境電商平臺(tái)可以通過多種渠道獲取簽約供應(yīng)商的財(cái)務(wù)數(shù)據(jù),對(duì)于非簽約的供應(yīng)商,也可以依據(jù)以往的交易數(shù)據(jù)來分析判斷,所以跨境電商平臺(tái)是有條件對(duì)資金要素方面的指標(biāo)進(jìn)行完善和細(xì)化的。
其二,神經(jīng)網(wǎng)絡(luò)模型對(duì)樣本敏感度很高,即樣本本身對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果有較大影響。一旦樣本數(shù)量偏小時(shí),極易引發(fā)模型過擬合,從而導(dǎo)致模型泛化能力差,所以在模型的實(shí)際應(yīng)用中,可以使用本文提供的網(wǎng)絡(luò)爬蟲算法,對(duì)樣本數(shù)量再擴(kuò)大,保證評(píng)級(jí)結(jié)果的可靠性。
其三,神經(jīng)網(wǎng)絡(luò)模型需要手動(dòng)設(shè)置的超參數(shù)較多,在實(shí)際運(yùn)用中為了達(dá)到較好的訓(xùn)練效果,最好采用隨機(jī)搜索或者網(wǎng)格搜索的辦法搜索參數(shù)。
其一,跨境電商平臺(tái)要建立一個(gè)科學(xué)、準(zhǔn)確的供應(yīng)商信用評(píng)價(jià)體系,對(duì)供應(yīng)商進(jìn)行全面、有效的信用評(píng)估??缇畴娚唐脚_(tái)因其強(qiáng)大的信息共享和交易撮合功能,有力促進(jìn)了中小規(guī)模企業(yè)出口及零售產(chǎn)品的進(jìn)出口貿(mào)易發(fā)展,但是在大宗商品出口及專業(yè)化程度高的復(fù)雜商品出口方面沒有明顯的促進(jìn)作用。跨境電商平臺(tái)缺乏專業(yè)化優(yōu)勢(shì)和質(zhì)量擔(dān)保功能是引發(fā)上述問題的原因之一。另外,交易中各參與方信息不對(duì)稱也是原因之一,而建立一個(gè)針對(duì)平臺(tái)供應(yīng)商的信用評(píng)價(jià)體系,可以有效解決跨境電商平臺(tái)缺乏質(zhì)量擔(dān)保功能及客戶和供應(yīng)商之間信息不對(duì)稱的問題。
其二,跨境電商平臺(tái)可依照本文所建立的信用評(píng)估指標(biāo)體系和評(píng)估模型對(duì)平臺(tái)上的供應(yīng)商進(jìn)行信用等級(jí)評(píng)估。目前,很多跨境電商平臺(tái)供應(yīng)商的信用評(píng)價(jià)還停留在依賴買賣雙方在訂單交易完成后對(duì)對(duì)方信用狀況進(jìn)行評(píng)價(jià)的階段,這其中摻雜了很多干擾因素和主觀因素,不能綜合、客觀地評(píng)價(jià)一個(gè)供應(yīng)商的信用水平。因此,可以本文研究成果為依據(jù),有針對(duì)性地選擇信用等級(jí)高的供應(yīng)商與平臺(tái)簽約,有效提高平臺(tái)的產(chǎn)品質(zhì)量和售后服務(wù)水平。同時(shí),跨境電商平臺(tái)交易中的購(gòu)買方也可以此為依據(jù)進(jìn)行采購(gòu)決策,避免了信息不對(duì)稱引發(fā)的交易失敗和交易糾紛。
其三,建議跨境電商平臺(tái)建立供應(yīng)商分類信用評(píng)估機(jī)制,滿足不同方向的信用評(píng)價(jià)需求。如:針對(duì)平臺(tái)質(zhì)量擔(dān)保功能,建立專門的供應(yīng)商質(zhì)量信用等級(jí);針對(duì)客戶對(duì)供應(yīng)商服務(wù)水平信息的需求,建立專門的供應(yīng)商服務(wù)水平評(píng)級(jí)制度等。當(dāng)然,這需要構(gòu)建專門的信用評(píng)價(jià)指標(biāo)體系和評(píng)估模型,但是評(píng)估模型的基本算法并未發(fā)生變化,本文的研究成果依然有參考價(jià)值。
[1] 張德棟,張強(qiáng).基于神經(jīng)網(wǎng)絡(luò)的企業(yè)信用評(píng)估模型[J].北京理工大學(xué)學(xué)報(bào),2004(11).
[2] 何躍,蔣國(guó)銀,劉學(xué)生.基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)信用評(píng)估模型[J].經(jīng)濟(jì)數(shù)學(xué),2005(3).
[3] 陳鑫銘,馮艷.C2C電子商務(wù)信用評(píng)估體系研究[J].圖書情報(bào)工作,2009,3(14).
[4] 冷沙沙,高厚禮.B2B企業(yè)信用評(píng)估模型的研究[J].山東理工大學(xué)學(xué)報(bào),2010(3).
[5] 郭亦涵,鄭植.C2C電子商務(wù)網(wǎng)站信用評(píng)價(jià)模型研究[J].北京郵電大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011,13(4).
[6] 馬曉青,劉莉亞,胡乃紅,等.小企業(yè)信用評(píng)估的模型構(gòu)建與實(shí)證分析[J].財(cái)經(jīng)研究,2012(5).
[7] 付永貴,朱建明.基于大數(shù)據(jù)的網(wǎng)絡(luò)供應(yīng)商信用評(píng)估模型[J].中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2016(8).
[8] 呂雪晴,周梅華.我國(guó)跨境電商平臺(tái)發(fā)展存在的問題與路徑[J].經(jīng)濟(jì)縱橫,2016(3).
[9] 陶濤,郭宇宸.跨境電商平臺(tái)作為新型貿(mào)易中間商的理論基礎(chǔ)與現(xiàn)實(shí)發(fā)展[J].新視野,2016(2).
[10] 徐碩.淺析中小企業(yè)跨境電商平臺(tái)選擇問題與對(duì)策[J].財(cái)經(jīng)界:學(xué)術(shù)版,2016(11).
[11] 方燦,杭言勇.我國(guó)跨境電商平臺(tái)的運(yùn)營(yíng)模式探討[J].時(shí)代金融,2015,606(11).
[12] 彭麗芳,陳中,李琪.網(wǎng)絡(luò)交易中信用評(píng)價(jià)方法研究[J].南開管理評(píng)論,2007,10(2).
[13] 柳向東,李鳳.大數(shù)據(jù)背景下網(wǎng)絡(luò)借貸的信用風(fēng)險(xiǎn)評(píng)估——以人人貸為例[J].統(tǒng)計(jì)與信息論壇,2016(5).
[14] 李毅,姜天英,劉亞茹.基于不平衡樣本的互聯(lián)網(wǎng)個(gè)人信用評(píng)估研究[J].統(tǒng)計(jì)與信息論壇,2017(2).
[15] 傅德印,張旭東.EXCEL與多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2007.
[16] Li Rongzhou,Pang Sulin,Xu Jianmin.Neural Network Credit-risk Evaluation Model Based on Back-propagation Algorithm[J].Machine Learning and Cybernetics,2002(4).
[17] Wisniewski.Behavioral Data Start up Combines Big Data with Credit ‘Traffic School’[J].American Banker,2013,178(186).
[18] 張道宏,張璇,尹成果.基于BP神經(jīng)網(wǎng)絡(luò)的個(gè)人信用評(píng)估模型[J].情報(bào)雜志,2006(3).
[19] 朱大奇,史慧.人工神經(jīng)網(wǎng)絡(luò)原理及應(yīng)用[M].北京:科學(xué)出版社,2006.