• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于C2C交易的賣方信用增長(zhǎng)模式分析*

    2014-01-24 06:55:44蔣建洪
    關(guān)鍵詞:賣方信用聚類

    蔣建洪,羅 玫

    (1.桂林電子科技大學(xué)商學(xué)院,廣西 桂林 541004;2.桂林理工大學(xué),廣西 桂林 541004)

    基于C2C交易的賣方信用增長(zhǎng)模式分析*

    蔣建洪1,羅 玫2

    (1.桂林電子科技大學(xué)商學(xué)院,廣西 桂林 541004;2.桂林理工大學(xué),廣西 桂林 541004)

    針對(duì)目前缺乏有效區(qū)分賣方信用增長(zhǎng)類型的問題,提出了一種賣方交易數(shù)據(jù)轉(zhuǎn)換的方法,并提出了C2C交易信用增長(zhǎng)模式分類算法。通過引入監(jiān)督的XYF網(wǎng)絡(luò)方法對(duì)電子商務(wù)交易數(shù)據(jù)進(jìn)行分析,能夠?qū)μ幱谕恍袠I(yè)中、具有不同信用增長(zhǎng)模式的賣方分類,為賣方的虛假信用識(shí)別提供了一種有效的途徑,也為賣方的交易模式進(jìn)行分類識(shí)別提供了一種新的思路。

    電子商務(wù);C2C交易;賣方信用;神經(jīng)網(wǎng)絡(luò);模式

    1 引言

    C2C為電子商務(wù)中的客戶對(duì)客戶交易形式,目前國(guó)內(nèi)很多從事C2C交易的賣方為了短期的利益,通過虛擬的買賣行為提高在電子商務(wù)網(wǎng)站中的交易信用。賣方可以通過這種虛假的高信用獲得買方的信任,提高銷售額,從而達(dá)到銷售業(yè)績(jī)和利潤(rùn)的提升。這種行為對(duì)正常的市場(chǎng)秩序造成了非常惡劣的影響,也增加了買賣雙方交易糾紛的可能性。因此,有效鑒別投機(jī)的賣方對(duì)于買方的合法利益與整個(gè)市場(chǎng)的良性發(fā)展是非常有必要的。

    關(guān)于影響信用的因素和虛假信用的問題,目前有較多的研究。Shen Zhi-hao等[1]基于信任關(guān)系的特性分析,提出了C2C電子商務(wù)中的信任評(píng)價(jià)原則,認(rèn)為分析包括交易時(shí)間、交易額、商品類別和個(gè)人的關(guān)系等因素往往被忽視。You Wei-jia等[2]在C2C市場(chǎng)研究中發(fā)現(xiàn),銷售商可以操縱自己的聲譽(yù),雇用大量的傀儡購買人提供虛假交易的積極反饋。Zhang Yu等[3]通過時(shí)間衰減系數(shù)等因素,建立信用欺詐檢測(cè)模型。此外,不少學(xué)者通過歷史數(shù)據(jù)或者時(shí)間序列數(shù)據(jù)對(duì)用戶行為進(jìn)行分析,Zhang Li-fang等[4]認(rèn)為,平臺(tái)的信用機(jī)制和歷史交易對(duì)消費(fèi)者決策有著重要的影響。在分析方法上,Jiang Yuan-tao等[5]研究采用數(shù)據(jù)挖掘的原理,通過各種電子商務(wù)網(wǎng)站的 Web日志使用KMeans算法分類客戶群。Nasraoui O等[6]研究了發(fā)現(xiàn)和跟蹤不斷變化的用戶行為的方法,以及從Web日志數(shù)據(jù)中提取的搜索查詢中如何發(fā)現(xiàn)用戶行為,使用遺傳算法原理來進(jìn)行分析。Fu Takchung等[7]提出了從時(shí)間序列模式中發(fā)現(xiàn)聚類的方法。Halawani S M[8]的研究中,通過序列模式挖掘的幫助來提升銷量和分析客戶行為,為網(wǎng)絡(luò)購物管理提供快速的分析,提供更高效的決策支持管理。張洪祥和毛志忠[9]提出了基于多維時(shí)間序列數(shù)據(jù)的信用評(píng)價(jià)方法,在上市公司的一個(gè)長(zhǎng)期經(jīng)營(yíng)周期中對(duì)其信用狀態(tài)進(jìn)行分析。在對(duì)人群行為分類的研究中,陳伯成等[10]對(duì)自組織神經(jīng)網(wǎng)絡(luò)在客戶分類中的應(yīng)用進(jìn)行了探討,討論了客戶分類的概念、指標(biāo)選取、分類方法選取,給出了一種基于自組織映射SOM(Self-Organizing Map)的客戶分類方法。李綱等[11]使用SOM聚類方法分析電子商務(wù)賣家的自身特點(diǎn)與其銷售商品之間的匹配程度對(duì)交易活躍程度的影響。Melssen W等[12]使用X-Y融合的網(wǎng)絡(luò)來解決分類問題。

    從現(xiàn)有的研究來看,對(duì)于賣方的交易數(shù)據(jù)的研究主要集中在通過交易歷史數(shù)據(jù)分析用戶的行為,國(guó)外主要偏向基于拍賣的C2C交易分析,對(duì)于類似于一口價(jià)交易的方式所關(guān)聯(lián)的信用狀況研究較少;在國(guó)內(nèi)的研究中,對(duì)通過交易歷史所反映出的賣方信用增長(zhǎng)特點(diǎn),特別是從賣方信用增長(zhǎng)趨勢(shì)的角度來進(jìn)行分析的還較少。本文首先通過對(duì)Web頁面中的賣方交易歷史數(shù)據(jù)進(jìn)行獲取和轉(zhuǎn)換,然后試圖通過監(jiān)督的XYF神經(jīng)網(wǎng)絡(luò)對(duì)交易數(shù)據(jù)進(jìn)行分析,最終得到具有不同信用增長(zhǎng)模式的賣方類別,為區(qū)分可能具有虛假信用的賣方提供有效的參考。

    2 賣方交易信用數(shù)據(jù)來源及轉(zhuǎn)換

    賣方交易的數(shù)據(jù)來源通常有兩個(gè)渠道,一是電子商務(wù)平臺(tái)提供的數(shù)據(jù),二是電子商務(wù)網(wǎng)站頁面的數(shù)據(jù),前者由于不同的平臺(tái)提供商的隱私政策而難以獲得,后者可以自定義網(wǎng)絡(luò)數(shù)據(jù)抓取工具從Web頁面中獲取信息,具有較好的靈活性。本文的研究采用了第二種途徑,使用Web挖掘工具獲得賣方的交易評(píng)價(jià)數(shù)據(jù)。在賣方的交易行為數(shù)據(jù)里,評(píng)價(jià)意見、評(píng)價(jià)人、評(píng)價(jià)人信用、商品名稱、商品價(jià)格對(duì)于賣方的交易行為數(shù)據(jù)來說,包含的信息量過多,因此只保留評(píng)價(jià)和評(píng)價(jià)時(shí)間兩項(xiàng)信息。通過抓取頁面所獲得的評(píng)價(jià)和評(píng)價(jià)時(shí)間信息,便能夠得到在固定的時(shí)間周期內(nèi)賣方所得到的信用評(píng)價(jià)數(shù)。在實(shí)際數(shù)據(jù)中還需要考慮到買方的評(píng)價(jià)是否有效,這一約束與電子商務(wù)平臺(tái)相關(guān),例如淘寶網(wǎng)評(píng)價(jià)規(guī)則的規(guī)定,買方可能存在對(duì)信用沒有影響的評(píng)價(jià)。必須過濾掉無效的評(píng)價(jià),這些評(píng)價(jià)不計(jì)入賣方的累計(jì)信用好評(píng)中。

    下面對(duì)一些概念進(jìn)行形式化描述:

    定義1時(shí)間周期Ti為[ti-1,ti],為從ti-1時(shí)刻到ti時(shí)刻的時(shí)間段。

    定義2每一賣方交易的信用時(shí)間序列集合S={〈T1,R1〉,〈T2,R2〉,…,〈Tn,Rn〉},為從時(shí)間T1到時(shí)間Tn賣方的信用交易記錄,其中Ri為第Ti個(gè)時(shí)間周期內(nèi),賣方交易累計(jì)的有效信用值。

    定義3時(shí)間節(jié)點(diǎn)的信用序列S′={〈T1′,〉,,〉,…,〈,〉},為這一時(shí)間節(jié)點(diǎn)上,累計(jì)的所有信用值,其取值可以通過下面的公式求出:

    例如,從1月1日開始,賣方在1月1日,時(shí)間周期T為1月1日零時(shí)到23:59分,得到了十位買方的評(píng)價(jià),有八個(gè)好評(píng)(其中七個(gè)是有效評(píng)價(jià))、一個(gè)中評(píng)、一個(gè)差評(píng),而1月2日得到了三位買方的評(píng)價(jià),有三個(gè)好評(píng)。那么1日的有效信用值R為7,累計(jì)信用值R′為7,中評(píng)和差評(píng)不計(jì)入信用評(píng)價(jià);2日的信用值R為3,累計(jì)信用值R′為前一天的評(píng)價(jià)值累加當(dāng)天的評(píng)價(jià)值即7+3=10,依此類推。

    根據(jù)不同賣方的評(píng)價(jià)和獲得評(píng)價(jià)時(shí)間的數(shù)據(jù),依據(jù)信用增長(zhǎng)的公式計(jì)算出不同時(shí)間節(jié)點(diǎn)的信用值R′,繪制出賣方信用增長(zhǎng)曲線圖。如圖1a所示,只列出四個(gè)典型賣方的信用增長(zhǎng)曲線,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為賣方的累計(jì)好評(píng)數(shù)量??梢钥闯觯煌馁u方獲得信用評(píng)價(jià)的時(shí)間也不同,賣方A獲得信用評(píng)價(jià)的時(shí)間最早,賣方D獲得的時(shí)間最晚。通過分析查看原始數(shù)據(jù)可知,A的開店時(shí)間早于后三者,因此A獲得好評(píng)的時(shí)間也早于其它賣方。而賣方B和C雖然開店時(shí)間較晚,但是信用增長(zhǎng)明顯快于賣方A。而賣方D開店時(shí)間較晚,因此在信用增長(zhǎng)曲線圖中曲線長(zhǎng)度較短,其信用增長(zhǎng)也不明顯。分析原始信用增長(zhǎng)曲線,由于獲得信用的時(shí)間不一致,到達(dá)某一信用值的時(shí)間也不同,無法通過數(shù)據(jù)進(jìn)行分析,因此需要對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步的處理。選取每一個(gè)賣方的第一筆信用增長(zhǎng)作為該賣方曲線的原點(diǎn),以固定的間隔天數(shù)作為橫坐標(biāo),以買方好評(píng)總數(shù)作為縱坐標(biāo),將不同的賣方曲線作平移,從而得到新的曲線,如圖1b所示,B1、C1、D1為賣方B、C、D根據(jù)時(shí)間點(diǎn)平移后的新曲線。平移之后,不同賣方之間的信用增長(zhǎng)趨勢(shì)比之前的曲線圖更為完整。

    Figure 1 Curve of seller’s credit growth圖1 賣方信用增長(zhǎng)曲線圖

    為了獲取賣方交易的特征,必須依據(jù)時(shí)間節(jié)點(diǎn)獲取賣方的信用評(píng)價(jià)數(shù)量,如果以較短的時(shí)間間隔來統(tǒng)計(jì),如每小時(shí)統(tǒng)計(jì)信用評(píng)價(jià)數(shù)量,會(huì)造成在凌晨時(shí)段取到的信用評(píng)價(jià)幾乎不發(fā)生變化,而在傍晚的高峰時(shí)段信用評(píng)價(jià)可能會(huì)有很大的增長(zhǎng)。同時(shí),由于時(shí)間粒度太小會(huì)使得信用分析所需要的計(jì)算量變大,因此最小時(shí)間周期應(yīng)不低于24小時(shí)。

    通過上文的分析,數(shù)據(jù)轉(zhuǎn)換的步驟是首先取得該賣方的所有評(píng)價(jià)數(shù)據(jù),初始化評(píng)價(jià)信息數(shù)組;按時(shí)間順序,查詢當(dāng)天的信用評(píng)價(jià);如果信用評(píng)價(jià)的間隔時(shí)間大于某個(gè)間隔閾值,則放棄獲取該賣方數(shù)據(jù);逐條判斷是否是有效好評(píng),如果是則買方信用評(píng)價(jià)數(shù)加1,存入評(píng)價(jià)數(shù)組中。令總時(shí)間長(zhǎng)度為L(zhǎng),時(shí)間間隔為P,tk為一次有效交易的時(shí)間,則這次交易對(duì)應(yīng)的時(shí)間節(jié)點(diǎn)標(biāo)號(hào)為:

    其中ceil為下取整運(yùn)算。然后,通過遍歷所有的歷史記錄,根據(jù)交易對(duì)應(yīng)的時(shí)間節(jié)點(diǎn)標(biāo)號(hào),就可以得到在時(shí)間節(jié)點(diǎn)上的總信用值,將其轉(zhuǎn)為二維點(diǎn)數(shù)據(jù),這些轉(zhuǎn)換后的數(shù)據(jù)可作為分析的基本數(shù)據(jù)。數(shù)據(jù)轉(zhuǎn)換方法如公式(3)所示:

    3 基于XYF神經(jīng)網(wǎng)絡(luò)的信用模式分類算法

    自組織映射SOM網(wǎng)絡(luò)是由Kohonen T最早提出的一種人工神經(jīng)元網(wǎng)絡(luò)[13],隨后得到了廣泛的應(yīng)用研究。它是對(duì)生物神經(jīng)系統(tǒng)進(jìn)化過程的計(jì)算機(jī)模擬,能把任意維的輸入信號(hào)變換到一維或二維的離散網(wǎng)格上。

    常用的聚類方法如劃分和層次的聚類方法,在處理高維的數(shù)據(jù)集時(shí),由于數(shù)據(jù)集具有分布稀疏和存在大量無關(guān)屬性的特點(diǎn),聚類的效果通常較差。與常用的聚類分析方法K-Means比較,當(dāng)樣本量不足夠大時(shí),K-Means聚類要比SOM網(wǎng)絡(luò)聚類的效果好。但是,在高維的聚類分析時(shí),K-Means難以處理高維度數(shù)據(jù)。因此,在大數(shù)據(jù)集和高維數(shù)據(jù)中采用基于SOM的算法較為適用。本文對(duì)數(shù)據(jù)處理的思路是使用監(jiān)督的Kohonen網(wǎng)絡(luò)方法,對(duì)交易數(shù)據(jù)進(jìn)行分析訓(xùn)練,得出相對(duì)準(zhǔn)確的訓(xùn)練集,再以此訓(xùn)練集對(duì)新的數(shù)據(jù)集進(jìn)行分析,以實(shí)現(xiàn)交易模式分類的功能[14]。

    在建模探索研究階段,需要得到輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的聯(lián)系,本文引入監(jiān)督的Kohonen網(wǎng)絡(luò)SKN(Supervised Kohonen Network)技術(shù)來解決輸入輸出數(shù)據(jù)的聯(lián)系問題,對(duì)賣方的信用模式進(jìn)行分類分析。該網(wǎng)絡(luò)的特點(diǎn)是能夠以直接和簡(jiǎn)潔的方式處理與數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)和相應(yīng)的類成員之間的關(guān)系(非線性)。監(jiān)督的Kohonen網(wǎng)絡(luò)(SKN)的缺點(diǎn)是使用者必須事先在輸入和輸出對(duì)象的影響之間確定適當(dāng)?shù)钠胶?。一般來說,正確的縮放輸入輸出變量最為重要。此外,輸入和輸出對(duì)象的數(shù)量比在很大程度上決定了SKN網(wǎng)絡(luò)是否能夠被輸入和(或)輸出對(duì)象支配。輸入和輸出之間的不平衡可能導(dǎo)致性能不佳甚至是錯(cuò)誤的預(yù)測(cè)模型。為了解決這些問題,目前可以應(yīng)用X-Y融合的網(wǎng)絡(luò) 算 法 (XY-Fused),該 算 法 利 用 了 Xmap 和Ymap中的相似性。XYF網(wǎng)絡(luò)(X指輸入空間,Y指輸出空間)由兩個(gè)獨(dú)立的Kohonen映射組成,一個(gè)是模型的輸入映射,其嵌入了輸入空間的結(jié)構(gòu);另一個(gè)是輸出映射,獲取在輸出中的拓?fù)浣Y(jié)構(gòu)。XYF算法能夠用簡(jiǎn)單的方式來處理數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)和相對(duì)應(yīng)的類成員之間的(非線性)關(guān)系。如果輸入和輸出對(duì)象之間具有明顯的非線性關(guān)系或無序的拓?fù)潢P(guān)系,會(huì)導(dǎo)致建模失敗,當(dāng)數(shù)據(jù)包含相當(dāng)數(shù)量的離群點(diǎn)時(shí)也會(huì)出現(xiàn)問題。

    在SOM相關(guān)的算法中,網(wǎng)絡(luò)包含輸入層和輸出層。輸入層對(duì)應(yīng)一個(gè)高維的輸入向量,輸出層由一系列組織在二維網(wǎng)格上的有序節(jié)點(diǎn)構(gòu)成,輸入節(jié)點(diǎn)與輸出節(jié)點(diǎn)通過權(quán)重向量連接。學(xué)習(xí)過程中找到與之距離最短的輸出層單元(獲勝單元)并對(duì)其更新,同時(shí)將鄰近區(qū)域的權(quán)值更新,使輸出節(jié)點(diǎn)保持輸入向量的拓?fù)涮卣鳎?5]。輸入層只有一個(gè)節(jié)點(diǎn),對(duì)應(yīng)于輸入矢量x:

    其中,d為輸人數(shù)據(jù)維數(shù)。輸出層由一系列組織在低維網(wǎng)格(通常是一維或者二維)上的有序節(jié)點(diǎn)組成。每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)權(quán)矢量m:

    基本的SOM網(wǎng)絡(luò)訓(xùn)練步驟描述如下[16]:

    步驟1給輸出層每個(gè)節(jié)點(diǎn)賦予初始權(quán)值。定義訓(xùn)練結(jié)束條件,采用兩次訓(xùn)練的權(quán)值誤差限,或者預(yù)定義一個(gè)訓(xùn)練長(zhǎng)度。

    步驟2從訓(xùn)練數(shù)據(jù)集中選取一個(gè)樣本x,計(jì)算樣本與每個(gè)輸出節(jié)點(diǎn)之間的距離,距離函數(shù)可以選用歐氏距離、曼哈頓距離等,對(duì)于只有連續(xù)數(shù)值屬性的數(shù)據(jù)集通常采用歐氏距離。選出與樣本x距離最近的節(jié)點(diǎn),該節(jié)點(diǎn)稱為輸入樣本的最匹配節(jié)點(diǎn)BMU(Best-Match Unit),記為mc:

    步驟3根據(jù)預(yù)先定義的鄰域函數(shù)確定處于BMU鄰域內(nèi)的節(jié)點(diǎn),調(diào)整BMU及鄰域內(nèi)節(jié)點(diǎn)的權(quán)值:

    其中,mi(t)代表第t步的i節(jié)點(diǎn)的權(quán)值,a(t)為第t步的學(xué)習(xí)率,hci(t)為鄰域函數(shù)。學(xué)習(xí)率通常隨著訓(xùn)練的進(jìn)行而逐漸減小,可以選擇按線性減小、指數(shù)減小等;鄰域函數(shù)選用高斯函數(shù),如公式(4)所示:

    其中,rc、ri分別為獲勝節(jié)點(diǎn)與節(jié)點(diǎn)的位置,σ(t)為核的寬度。

    步驟4如果未達(dá)到最大訓(xùn)練長(zhǎng)度,則返回步驟2繼續(xù)訓(xùn)練。

    XYF網(wǎng)絡(luò)可以由X映射與Y映射的相似性直接反映。X與Xmap中的所有單元相似性記為S(X,Xmap),Y與Ymap中的所有單元相似性記為S(Y,Ymap),融合相似性是通過S(X,Xmap)與S(Y,Ymap)的加權(quán)組合來度量。X與Y的獲勝單元由融合相似性SFused(i,k)來確定。融合相似性度量SFused(i,k),對(duì)象組合(Xi,Yi)以及在Xmap與Ymap中的單元k可以表示如下[17]:

    相似度S(X,Xmap)通過歐氏距離計(jì)算:由于XYF應(yīng)用是歸類的問題,因此S(Y,

    Ymap)可以通過Tanimoto距離計(jì)算得到:Xmap、Ymap的權(quán)值調(diào)整計(jì)算公式如下所示,

    選擇按指數(shù)減小的學(xué)習(xí)率。

    其中,t為訓(xùn)練次數(shù),T為最大訓(xùn)練次數(shù),DB、DE為常數(shù),這里分別定為1和23。

    Ymap的計(jì)算公式與Xmap相同。普通的獲勝單元通過SFused(i,k)的最小值所在位置確定。參數(shù)α(t)調(diào)節(jié)相似度S(X,Xmap)與S(Y,Ymap)之間的相對(duì)權(quán)重。α(t)中的t表示在訓(xùn)練過程中的迭代次數(shù),一次訓(xùn)練就是將數(shù)據(jù)集中包含的所有對(duì)象X(或Y)傳入XYF網(wǎng)絡(luò)。α(t)為學(xué)習(xí)率,隨時(shí)間的增加而線性遞減。公式定義如下:

    對(duì)于XYF訓(xùn)練算法來說,α(t)在一段時(shí)間內(nèi)線性減小,說明在訓(xùn)練初始階段,對(duì)象X與Xmap中單元的相似度將主要影響普通獲勝單元的確定。在訓(xùn)練結(jié)束階段,S(X,Xmap)以及S(Y,Ymap)對(duì)確定共享的獲勝單元的貢獻(xiàn)是相同的。原始數(shù)據(jù)經(jīng)過公式(1)~公式(3)進(jìn)行處理得到所示的曲線集合,再根據(jù)XYF網(wǎng)絡(luò)訓(xùn)練的步驟,最終得到信用增長(zhǎng)模式分類。算法如下:

    算法 信用增長(zhǎng)模式分類算法

    輸入:數(shù)據(jù)庫數(shù)據(jù)。

    輸出:聚類結(jié)果數(shù)組。

    步驟1抽取數(shù)據(jù);

    步驟2數(shù)據(jù)轉(zhuǎn)換,去除無效信用值;

    步驟3網(wǎng)絡(luò)初始化,對(duì)輸出層每個(gè)節(jié)點(diǎn)權(quán)重賦初值;

    步驟4在輸入樣本中隨機(jī)選取輸入向量,找到與輸入向量距離最小的權(quán)重向量;

    步驟5定義獲勝單元,在獲勝單元的鄰近區(qū)域調(diào)整權(quán)重使其向輸入向量靠攏;

    步驟6提供新樣本、進(jìn)行訓(xùn)練;

    步驟7收縮鄰域半徑、減小學(xué)習(xí)率;

    步驟8跳轉(zhuǎn)步驟4,直到學(xué)習(xí)率小于允許值;

    步驟9輸出聚類結(jié)果。

    Figure 2 9different growth mode of seller’s credit圖2 九種不同的賣方信用增長(zhǎng)模式

    4 結(jié)果分析

    從已有的賣方交易網(wǎng)頁信息數(shù)據(jù)庫中抽取符合條件的類似的8 234條數(shù)據(jù)。然后從數(shù)據(jù)中找到部分具有相似特征的賣方,也就是經(jīng)營(yíng)的行業(yè)相同或相近,沒有較大的差別,將這些賣方單獨(dú)抽取出來作為研究對(duì)象。首先抽取賣方數(shù)據(jù)中的一部分作為訓(xùn)練數(shù)據(jù)集,抽取出8 034條賣方數(shù)據(jù)。本文將網(wǎng)格設(shè)置為10×10,訓(xùn)練長(zhǎng)度設(shè)為500。然后將剩余的200條賣方信用數(shù)據(jù)導(dǎo)入訓(xùn)練數(shù)據(jù)集中進(jìn)行預(yù)測(cè),將預(yù)分類結(jié)果與預(yù)測(cè)結(jié)果相對(duì)應(yīng),預(yù)測(cè)矩陣如表1所示。

    Table 1 Prediction matrix表1 預(yù)測(cè)矩陣

    如表1所示,將正確結(jié)果與預(yù)測(cè)映射到矩陣中,行標(biāo)號(hào)表示正確的類別,列標(biāo)號(hào)表示預(yù)測(cè)的類別,對(duì)角線中的數(shù)值表示預(yù)測(cè)與正確類別相符的數(shù)量。如第一行第一列數(shù)值為6,表示預(yù)測(cè)正確為類別1的賣方數(shù)量為6;而第4行第一列數(shù)值為1,表示賣方的正確類別為第4類,而預(yù)測(cè)類別為第1類的次數(shù)為1次。圖2為提取出的9種典型的信用增長(zhǎng)模式類別,每個(gè)小圖的橫坐標(biāo)為累計(jì)天數(shù),縱坐標(biāo)為累計(jì)信用。從圖像上分析,分別為前中期快速增長(zhǎng)、中期快速增長(zhǎng)、平緩增長(zhǎng)、階段性增長(zhǎng)、階段性快速增長(zhǎng)、穩(wěn)步增長(zhǎng)、前期高速增長(zhǎng)后期平緩型增長(zhǎng)模式以及階梯式增長(zhǎng)模式等。通常情況下增長(zhǎng)速度過快的賣方,其制造虛假信用的可能性越大,所以1、7、8、9類的賣方是在購買前需要買方重點(diǎn)檢查的對(duì)象。如第8類其信用增長(zhǎng)在初期的時(shí)間段增長(zhǎng)速度非???,很短的時(shí)間內(nèi)就增長(zhǎng)到了一定程度,而后期的增長(zhǎng)呈階梯形。該賣方有可能在前期的經(jīng)營(yíng)采用了一些虛假信用手段如虛擬的交易,提高了成功交易的數(shù)量,使信用以一個(gè)很快的速度增長(zhǎng)。因此,該類賣方應(yīng)作為虛假信用的懷疑對(duì)象,消費(fèi)者需要對(duì)其提高防范意識(shí)。

    由于這200條賣方數(shù)據(jù)在事先已經(jīng)對(duì)其進(jìn)行了分類,因此只需要分析使用XYF方法預(yù)測(cè)所得到的結(jié)果和原分類結(jié)果進(jìn)行比較確定其分類預(yù)測(cè)的正確率。通過常用的聚類算法K-Means與Hclust層次聚類與監(jiān)督的XYF方法的聚類結(jié)果作為比較,統(tǒng)計(jì)正確聚類的數(shù)量,結(jié)果如表2所示。

    Table 2 Result comparison表2 分析結(jié)果比較

    從分析結(jié)果可以看到,200條測(cè)試數(shù)據(jù)中有161條數(shù)據(jù)符合原來的分類結(jié)果,準(zhǔn)確率為80.5%。與SOM分類結(jié)果比較,在SOM分類結(jié)果中,劃分正確的類別為133條,正確率為66.5%。從分類的效果來看,XYF的方法與參照的類別更為接近,使用XYF監(jiān)督的方法明顯優(yōu)于SOM,其他聚類方法在某些類如第三類的差別較大,沒有XYF方法準(zhǔn)確。XYF方法更適宜于分析高維的數(shù)據(jù)。

    5 結(jié)束語

    本文從賣方信用增長(zhǎng)模式的角度出發(fā),對(duì)賣方的信用增長(zhǎng)的行為和途徑進(jìn)行了探討,對(duì)具有相同經(jīng)營(yíng)類型的賣方進(jìn)行分析。在分析賣方交易特征的基礎(chǔ)上,建立了基于XYF網(wǎng)絡(luò)的賣方信用模式分類算法,對(duì)C2C電子商務(wù)網(wǎng)站中賣方的信用數(shù)據(jù)進(jìn)行識(shí)別。該算法能夠發(fā)現(xiàn)具有相同或相似交易信用增長(zhǎng)模式的賣方,以及可能有虛假信用的賣方。最后,結(jié)合實(shí)際數(shù)據(jù)做出了相關(guān)的測(cè)試分析,與常用的聚類分析方法K-Means和層次分析法相比,本文方法是有效的,在分析高維數(shù)據(jù)方面分析結(jié)果更為準(zhǔn)確;同時(shí),也存在著一些不足,該方法只是反映了增長(zhǎng)類別不正常的一類,相對(duì)于其他的類別具有更大的可能性參與虛假信用操作,對(duì)于分析的準(zhǔn)確率還需要在今后的研究中進(jìn)一步地提高和完善。

    [1] Shen Zhi-hao,Shen Bei-jun.Trust evaluation method handling multi-factors for C2Ce-commerce[C]∥Proc of 2010 IEEE International Conference on Progress in Informatics and Computing(PIC),2011:1236-1240.

    [2] You Wei-jia,Lu Liu,Mu Xia,et al.Reputation inflation detection in a Chinese C2Cmarket[J].Electronic Commerce Research and Applications,2011,10(5):510-519.

    [3] Zhang Y,Bian J,Zhu W.Trust fraud:A crucial challenge for China’s e-commerce market[J].Electronic Commerce Research and Applications,2013,12(5):299-308.

    [4] Shandan Z,Dan F,Yunyun X,et al.Influencing factors of credibility in C2Cecommerce web sites[J].Procedia Engineering,2012,29:509-513.

    [5] Jiang Yuan-tao,Yu Si-qin.Mining e-commerce data to analyze the target customer behavior[C]∥Proc of the 1st International Workshop on Knowledge Discovery and Data Mining,2008:406-409.

    [6] Nasraoui O,Soliman M,Saka E,et al.A web usage mining framework for mining evolving user profiles in dynamic web sites[J].IEEE Transactions on Knowledge and Data Engineering,2008,20(2):202-215.

    [7] Fu Tak-chung,Chung Fu-lai,Ng V,et al.Pattern discovery from stock time series using self-organizing maps[C]∥Workshop Notes of KDD2001Workshop on Temporal Data Mining,2001:26-29.

    [8] Halawani S M,Shaik S,Prasad E V.Sales promotions system in e-commerce using data mining techniques[C]∥International Journal of Computer Science and Network Security,2010,10(5):103-109.

    [9] Zhang Hong-xiang,Mao Zhi-zhong.Research of multidimensional time series credit evaluation based on gray-fuzz analysis model[J].Journal of Management Sciences in China,2011,14(1):28-37.(in Chinese)

    [10] Chen Bo-Cheng,Liang Bing,Zhou Yue-bo,et al.An appli-cation of SOM neural network in customer classification[J].Systems Engineering—Theory &Practice,2004,24(3):8-14.(in Chinese)

    [11] Li Gang,An Lu.Clustering analysis of e-commerce transactions with self-organizing map[J].New Technology of Library and Information Service,2008(9):70-77.(in Chinese)

    [12] Melssen W,üstün B,Buydens L.Sompls:A supervised self-organising map--partial least squares algorithm for multivariate regression problems[J].Chemometrics and Intelligent Laboratory Systems,2007,86(1):102-120.

    [13] Kohonen T.The self-organizing map[J].Proceedings of the IEEE,1990,78(9):1464-1480.

    [14] Jiang Jian-hong.Research on seller’s credit data mining of C2Ce-commerce[D].Xi’an:Northwestern Polytechnical University,2012.(in Chinese)

    [15] Faber V.Clustering and the continuous k-means algorithm[J].Los Alamos Science,1994(22):138-144.

    [16] Yang Li-gang,Su Hong-ye,Zhang Ying,et al.A method of data mining based on SOM clustering and its application[J].Computer Engineering&Science,2007,29(8):133-136.(in Chinese)

    [17] Melssen W,Wehrens R,Buydens L.Supervised kohonen networks for classification problems[J].Chemometrics and Intelligent Laboratory Systems,2006,83(2):99-113.

    附中文參考文獻(xiàn)

    [9] 張洪祥,毛志忠.基于多維時(shí)間序列的灰色模糊信用評(píng)價(jià)研究[J].管理科學(xué)學(xué)報(bào),2011,14(1):28-37.

    [10] 陳伯成,梁冰,周越博,等.自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)在客戶分類中的一種應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2004,24(3):8-14.

    [11] 李綱,安璐.基于SOM的手機(jī)電子商務(wù)交易聚類分析[J].現(xiàn)代圖書情報(bào)技術(shù),2008(9):70-77.

    [14] 蔣建洪.C2C電子商務(wù)網(wǎng)站賣方信用數(shù)據(jù)挖掘研究[D].西安:西北工業(yè)大學(xué),2012.

    [16] 楊黎剛,蘇宏業(yè),張英,等.基于SOM聚類的數(shù)據(jù)挖掘方法及其應(yīng)用研究[J].計(jì)算機(jī)工程與科學(xué),2007,29(8):133-136.

    Growth pattern analysis of seller’s credit based on C2Ctransactions

    JIANG Jian-hong1,LUO Mei2
    (1.Business College,Guilin University of Electronic Technology,Guilin 541004;2.Guilin University of Technology,Guilin 541004,China)

    For the current problem of lack of a valid distinction between the seller credit growth patterns,a seller transaction data conversion method is proposed,and the classification model of C2Ctrading credit growth pattern is proposed.By analyzing the E-commerce transaction data through the supervision XYF network,the different seller’s credit growth patterns in the same category can be classified.It provides an effective way to identify the seller's fake credit,and also provides a new thought of classifying the seller’s transaction mode.

    e-commerce;C2Ctransactions;seller’s credit;neural network;pattern

    TP391

    A

    10.3969/j.issn.1007-130X.2014.04.032

    2012-10-24;

    2013-01-24

    廣西壯族自治區(qū)教育廳人文社科研究項(xiàng)目(SK13YB036);桂林電子科技大學(xué)博士啟動(dòng)基金資助項(xiàng)目(US12010Y)

    通訊地址:541004廣西桂林市金雞路1號(hào)桂林電子科技大學(xué)商學(xué)院

    Address:Business College,Guilin University of Electronic Technology,1Jinji Rd,Guilin 541004,Guangxi,P.R.China

    1007-130X(2014)04-0758-07

    蔣建洪(1982-),男,廣西桂林人,博士,研究方向?yàn)樾畔⑾到y(tǒng)和電子商務(wù)。E-mail:jjhome@guet.edu.cn

    JIANG Jian-hong,born in 1982,PhD,his research interests include information system,and e-commerce.

    羅玫(1982-),女,陜西漢中人,博士,研究方向?yàn)樾畔⑾到y(tǒng)。E-mail:aubrey.luo@gmail.com

    LUO Mei,born in 1982,PhD,her research interest includes information system.

    猜你喜歡
    賣方信用聚類
    第十七屆(2023)賣方分析師水晶球獎(jiǎng)總榜單
    第十六屆(2022)賣方分析師水晶球獎(jiǎng)總榜單
    為食品安全加把“信用鎖”
    信用收縮是否結(jié)束
    基于DBSACN聚類算法的XML文檔聚類
    二手房買賣之賣方違約糾紛解析
    信用中國(guó)網(wǎng)
    信用消費(fèi)有多爽?
    實(shí)物與宣傳不符,賣方擔(dān)責(zé)嗎?
    基于改進(jìn)的遺傳算法的模糊聚類算法
    宁都县| 宽城| 八宿县| 迭部县| 固原市| 黄山市| 襄城县| 汝南县| 淮阳县| 锡林郭勒盟| 大名县| 寿光市| 利津县| 平昌县| 娄底市| 阿巴嘎旗| 桃江县| 新巴尔虎左旗| 太仓市| 全南县| 磐石市| 杨浦区| 昌平区| 梁平县| 盱眙县| 通州市| 安吉县| 泽州县| 千阳县| 江华| 龙川县| 临夏县| 常山县| 泗水县| 宜章县| 正蓝旗| 永新县| 东辽县| 梨树县| 三穗县| 延安市|