曹洪銣
對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)
電子商務(wù)管理活動(dòng)是Web數(shù)據(jù)挖掘技術(shù)合適的應(yīng)用領(lǐng)域,Web服務(wù)器數(shù)據(jù)、客戶登記信息、代理服務(wù)器數(shù)據(jù)、業(yè)務(wù)往來數(shù)據(jù)等為Web數(shù)據(jù)挖掘提供了豐富的數(shù)據(jù)資源。只要在電子商務(wù)管理中遵循一定的Web數(shù)據(jù)挖掘流程,就有可能促進(jìn)企業(yè)決策優(yōu)化管理、客戶關(guān)系管理、協(xié)同商務(wù)管理、營(yíng)銷模式管理、網(wǎng)站維護(hù)管理和風(fēng)險(xiǎn)控制管理。
隨著Internet的飛速發(fā)展,網(wǎng)上的數(shù)據(jù)資源空前豐富。但是Web頁面過于復(fù)雜、而且是無結(jié)構(gòu)的、動(dòng)態(tài)的,導(dǎo)致人們難以迅速、方便地在Web上找到所需要的數(shù)據(jù)和信息。數(shù)據(jù)資源中蘊(yùn)涵的知識(shí)未能得到充分的挖掘和利用,“數(shù)據(jù)豐富而知識(shí)貧乏”的問題非常嚴(yán)重。搜索引擎(SearchEngine)在一定程度上解決了人們對(duì)信息的需求,但卻沒有達(dá)到客戶的滿意。因?yàn)樗阉饕娲蟛糠只陉P(guān)鍵字的查詢,命中率較低,不能對(duì)特定客戶給出特殊的服務(wù)。近年來興起的數(shù)據(jù)挖掘技術(shù)為解決這個(gè)問題帶來了一線曙光。而通過數(shù)據(jù)挖掘在Web上的應(yīng)用,企業(yè)還可以分析和預(yù)測(cè)顧客的將來行為。通過Web數(shù)據(jù)挖掘技術(shù),企業(yè)利用有效的顧客信息,可以大大降低運(yùn)營(yíng)的成本。web數(shù)據(jù)挖掘(webMining)是從大量的Web文檔集合和在站點(diǎn)內(nèi)進(jìn)行瀏覽的相關(guān)數(shù)據(jù)中發(fā)現(xiàn)蘊(yùn)涵的、未知的、有潛在應(yīng)用價(jià)值的、非平凡的模式的過程。
Web數(shù)據(jù)挖掘是輔助電子商務(wù)管理的綜合分析工具,運(yùn)行在電子商務(wù)網(wǎng)站的用戶數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)之上,包括以下功能模塊:a.過濾器。用來從Web數(shù)據(jù)庫(kù)中抽取相關(guān)數(shù)據(jù),進(jìn)行二義性分析,消除不一致性。b.挖掘綜合器。它是一個(gè)挖掘驅(qū)動(dòng)引擎,根據(jù)挖掘要求和挖掘方法的知識(shí)庫(kù)到Web數(shù)據(jù)挖掘算法庫(kù)中去選擇合適的挖掘方法,并且使用該方法去執(zhí)行挖掘任務(wù)。c.方法選擇專家系統(tǒng)及知識(shí)庫(kù)。它是Web數(shù)據(jù)挖掘的/大腦0,是一個(gè)規(guī)則集合,能夠根據(jù)不同的挖掘要求來選擇最有效的挖掘算法或幾種算法的序列組合,并且隨著應(yīng)用的深人,該知識(shí)庫(kù)可以不斷融入新的規(guī)則,以增加專家系統(tǒng)的智能性。d.Web數(shù)據(jù)挖掘算法庫(kù)。它是一個(gè)數(shù)據(jù)挖掘分析方法的綜合性算法庫(kù)。e.用戶評(píng)估界面。提供一個(gè)和分析人員交互的友好界面。如果本次的挖掘結(jié)果不能滿足分析人員的需要,就可以再次從這里輸人挖掘需求。f.方法驅(qū)動(dòng)模塊。它利用挖掘出來的有益信息,去進(jìn)行相應(yīng)統(tǒng)計(jì)與分析的工作。
隨著市場(chǎng)經(jīng)濟(jì)國(guó)際化、區(qū)域經(jīng)濟(jì)全球化、業(yè)務(wù)處理數(shù)字化、消費(fèi)需求個(gè)性化的市場(chǎng)競(jìng)爭(zhēng)環(huán)境的形成,企業(yè)將面臨更多的競(jìng)爭(zhēng)對(duì)手和不確定的信息,需要借助于數(shù)據(jù)挖掘技術(shù)對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù),來控制成本、提高效益。電子商務(wù)本身是一種商務(wù)活動(dòng),數(shù)據(jù)挖掘技術(shù)最初也是為了商業(yè)應(yīng)用而開發(fā)出來的。實(shí)踐證明,電子商務(wù)管理活動(dòng)是Web數(shù)據(jù)挖掘技術(shù)適合的應(yīng)用領(lǐng)域,主要是因?yàn)殡娮由虅?wù)可以很容易地滿足數(shù)據(jù)挖掘所必需的因素(豐富的數(shù)據(jù)語言、自動(dòng)收集可靠的數(shù)據(jù)),并且可將挖掘結(jié)果轉(zhuǎn)化為商業(yè)行為。
當(dāng)客戶訪問Web服務(wù)器時(shí)就會(huì)在服務(wù)器上產(chǎn)生相應(yīng)的服務(wù)器數(shù)據(jù),這些數(shù)據(jù)可以分為日志文件、查詢數(shù)據(jù)兩種。a.日志文件。日志文件是Web服務(wù)器上用以記錄用戶訪問頁面情況的文件,分為server logs、error logs和cookie logs。用戶每訪問一個(gè)頁面,Web服務(wù)器的日志中就會(huì)增加一條記錄。不同的Web服務(wù)器的產(chǎn)品日志格式不同,但通常都包括訪問者的IP地址、訪問時(shí)間、訪問方式、訪問頁面、協(xié)議、錯(cuò)誤代碼以及傳輸?shù)淖止?jié)數(shù)信息。服務(wù)器日志數(shù)據(jù)是使用Web數(shù)據(jù)挖掘技術(shù)的重要數(shù)據(jù)來源。b.查詢數(shù)據(jù)。查詢數(shù)據(jù)是電子商務(wù)站點(diǎn)在服務(wù)器上產(chǎn)生的一種典型數(shù)據(jù),它是在線客戶在查詢所需信息時(shí)生成的,這些查詢信息通過Cookie或是登記信息連接到服務(wù)器的訪問日志上。
代理服務(wù)器相當(dāng)于在客戶瀏覽器和Web服務(wù)器之間提供了緩存功能的中介服務(wù)器,它的緩存功能減少了Web服務(wù)器的網(wǎng)絡(luò)流量,加快了網(wǎng)頁的運(yùn)行速度,同時(shí)將大量的用戶訪問信息通過代理日志的形式保存起來。
企業(yè)內(nèi)部之間、企業(yè)與上游企業(yè)和下游企業(yè)之間,因?yàn)闃I(yè)務(wù)往來關(guān)系,其中也產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)對(duì)于電子商務(wù)的經(jīng)營(yíng)決策、營(yíng)銷機(jī)制具有重要的參考價(jià)值。因此,這些業(yè)務(wù)往來數(shù)據(jù)也是Web數(shù)據(jù)挖掘技術(shù)需要分析的數(shù)據(jù)。
它是指客戶通過Web頁在屏幕上輸入的要提交給服務(wù)器的相關(guān)信息,包括注冊(cè)信息、登錄信息、網(wǎng)上留言等。在Web數(shù)據(jù)挖掘中,客戶登記信息必須和訪問日志集成,以提高數(shù)據(jù)挖掘的準(zhǔn)確度。通過對(duì)用戶登記信息和日志信息的綜合,能夠更好地了解客戶的行為,并針對(duì)不同的客戶制定不同的政策。
隨著 Web 使用挖掘在網(wǎng)站設(shè)計(jì)優(yōu)化中的應(yīng)用,綜合各種挖掘技術(shù)出現(xiàn)了許多數(shù)據(jù)挖掘工具。這些工具是輔助各類網(wǎng)站開發(fā)的綜合分析工具,運(yùn)行在網(wǎng)站的用戶數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)之上。依據(jù) Web 挖掘流程設(shè)計(jì)的各功能模塊能夠解決網(wǎng)站設(shè)計(jì)優(yōu)化和運(yùn)營(yíng)過程中的許多實(shí)際問題,如:優(yōu)化站點(diǎn)鏈接結(jié)構(gòu)、改進(jìn)站點(diǎn)內(nèi)容結(jié)構(gòu)、聚類訪問用戶等問題。但在 Web 使用挖掘技術(shù)的預(yù)處理算法方面,由于用戶與機(jī)器的不對(duì)應(yīng)性,以及代理服務(wù)器等網(wǎng)絡(luò)“中間環(huán)節(jié)”,使得只通過日志來識(shí)別用戶的效果并不理想。
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)客戶關(guān)系管理中的應(yīng)用在企業(yè)管理客戶生命周期的各個(gè)階段都會(huì)用到數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘能夠幫助企業(yè)確定客戶的特點(diǎn),從而可以為客戶提供有針對(duì)性的服務(wù)。通過數(shù)據(jù)挖掘,可以發(fā)現(xiàn)使用某一業(yè)務(wù)的客戶的特征,從而可以向那些也同樣具有這些特征卻沒有使用該業(yè)務(wù)的客戶進(jìn)行有目的推銷;還可以找到流失的客戶特征,在那些具體相似特征的客戶還未流失之前,采取針對(duì)性的措施。
4.2.1 客戶細(xì)分
客戶細(xì)分就是把大量的客戶分成不同的類,在每一個(gè)類里的客戶具有相似的屬性,而不同類里的客戶的屬性也不同。細(xì)致而切實(shí)可行的客戶分類對(duì)企業(yè)的經(jīng)營(yíng)策略有很大益處。在客戶細(xì)分算法模型研究方面,基于聚類和決策樹的客戶細(xì)分模型,采用聚類方法對(duì)具有相似購(gòu)買行為的用戶進(jìn)行聚類,再利用決策樹分析根據(jù)各類客戶的屬性的差別將客戶細(xì)分為不同的類別,取得了很好的效果。
4.2.2 客戶保持
當(dāng)前行業(yè)競(jìng)爭(zhēng)日益激烈,獲得新的客戶的成本越來越大,是保留一個(gè)老客戶成本的5 倍。因此保持原有客戶,尤其是優(yōu)質(zhì)客戶對(duì)企業(yè)來說顯得越來越重要??蛻舯3职▽?duì)客戶流失和客戶忠誠(chéng)度的分析,而客戶流失某種程度上反映的客戶忠誠(chéng)度,所以本節(jié)著重研究客戶流失問題,以對(duì)客戶保持提供對(duì)策。要解決客戶流失問題,可以使用數(shù)據(jù)挖掘方法對(duì)已經(jīng)流失客戶進(jìn)行分類,并對(duì)每類流失客戶的特征進(jìn)行描述。找出客戶流失的根本原因,并加以解決,對(duì)于最有可能流失的客戶群體,有針對(duì)性地采用客戶挽留方案,避免流失現(xiàn)象的持續(xù)發(fā)生。
4.2.3 客戶滿意度分析
有調(diào)查表明,對(duì)企業(yè)十分滿意的客戶再次購(gòu)買產(chǎn)品意向?yàn)闈M意客戶的 6 倍。企業(yè)只有將有價(jià)值客戶長(zhǎng)期保持在高滿意度范圍之內(nèi),才能更好的保證持續(xù)的盈利能力。客戶的滿意度是一種主觀的感覺狀態(tài),它涉及到企業(yè)、產(chǎn)品以及客戶自身的許多因素(如:產(chǎn)品質(zhì)量,產(chǎn)品外觀,企業(yè)品牌,交貨時(shí)間、顧客投訴處理、客戶喜好等等)。由于客戶滿意度又有很強(qiáng)的主觀性,很難具體數(shù)據(jù)化,因此當(dāng)前只能大致的分為“十分滿意”、“比較滿意”、“滿意”、“不滿意”、“很不滿意”5 個(gè)標(biāo)準(zhǔn)。利用數(shù)據(jù)挖掘的分類功能,可以將客戶群體根據(jù)滿意度進(jìn)行分類,對(duì)于分類結(jié)果聯(lián)系客戶的價(jià)值度的高低,調(diào)整企業(yè)同各客戶群體關(guān)系建設(shè)的投入成本,保證高價(jià)值客戶的滿意度在一個(gè)很高的水平。與此同時(shí),利用數(shù)據(jù)挖掘技術(shù)可以找出影響客戶滿意度的因素,以及各個(gè)因素之間的重要性,指導(dǎo)企業(yè)提高整體客戶服務(wù)水平。
經(jīng)過對(duì)網(wǎng)絡(luò)營(yíng)銷中數(shù)據(jù)的分類以及數(shù)據(jù)挖掘在網(wǎng)絡(luò)營(yíng)銷中的實(shí)施過程可以看出,數(shù)據(jù)挖掘在網(wǎng)絡(luò)營(yíng)銷中的應(yīng)用對(duì)大量的數(shù)據(jù)進(jìn)行分析,透過大量看似無關(guān)的數(shù)據(jù),數(shù)據(jù)挖掘能夠過發(fā)現(xiàn)隱藏在這些數(shù)據(jù)中對(duì)網(wǎng)絡(luò)營(yíng)銷有意義的信息以及它們之間的聯(lián)系。對(duì)這些信息進(jìn)行深入的分析,能夠發(fā)現(xiàn)市場(chǎng)需求、具有相似購(gòu)買行為的客戶群體等信息,及時(shí)發(fā)現(xiàn)這些信息能夠幫助企業(yè)對(duì)市場(chǎng)變化做出迅速的反映,進(jìn)行客戶預(yù)期,從而制定切實(shí)有效的營(yíng)銷計(jì)劃。
數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為電子商務(wù)活動(dòng)系統(tǒng)提供了數(shù)據(jù)分析強(qiáng)大的技術(shù)支持。數(shù)據(jù)挖掘是面向應(yīng)用的,也只有將數(shù)據(jù)挖掘技術(shù)應(yīng)用到大量的、復(fù)雜的數(shù)據(jù)中去,對(duì)數(shù)據(jù)挖掘技術(shù)研究的價(jià)值才能得到最佳體現(xiàn)。電子商務(wù)的發(fā)展使得越來越多的企業(yè)開始網(wǎng)上交易,電子商務(wù)網(wǎng)站的服務(wù)器日志、后臺(tái)數(shù)據(jù)庫(kù)中客戶相關(guān)的數(shù)據(jù)以及大量的交易記錄等數(shù)據(jù)資源中所蘊(yùn)涵的大量的有益信息有待于充分地挖掘和利用。
[1]譚春輝.電子商務(wù)管理與Web數(shù)據(jù)挖掘技術(shù)的契合探析[J].情報(bào)雜志,2006(12).
[2]李霏.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用價(jià)值探析[J].電子技術(shù)與軟件工程,2016(2).
[3]張潤(rùn),周大鐲.電子商務(wù)中Web數(shù)據(jù)挖掘技術(shù)應(yīng)用探討[J].中國(guó)西部科技,2010(20).