淄博職業(yè)學(xué)院 馬寧
淺議Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
淄博職業(yè)學(xué)院 馬寧
隨著電子計(jì)算機(jī)和網(wǎng)絡(luò)通訊技術(shù)的不斷發(fā)展,作為當(dāng)今世界最大的信息傳播和網(wǎng)絡(luò)營銷媒介,互聯(lián)網(wǎng)在社會的各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用,進(jìn)而全面帶動了電子商務(wù)的興起。電子商務(wù)已成為當(dāng)前全球經(jīng)濟(jì)范圍內(nèi)發(fā)展迅速的一種新型的現(xiàn)代商業(yè)模式。作為電子商務(wù)中的先進(jìn)信息處理技術(shù),Web數(shù)據(jù)挖掘可以有效獲取客戶的訪問信息并對其進(jìn)行高層次的分析和處理,從而為企業(yè)做出正確的電子商務(wù)策略提供科學(xué)有效的依據(jù)。本文闡述了Web數(shù)據(jù)挖掘的方法和過程,并分析了Web數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用。
Web 數(shù)據(jù)挖掘 電子商務(wù)
經(jīng)濟(jì)全球化、貿(mào)易自由化、計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,以及Internet在社會各個(gè)領(lǐng)域的普及應(yīng)用,全面推動了電子商務(wù)的興起。作為一種新興的商務(wù)模式,電子商務(wù)徹底改變了人們傳統(tǒng)的經(jīng)營理念、支付手段以及管理方式,給整個(gè)社會的商業(yè)領(lǐng)域帶來了革命性的改變。然而,信息技術(shù)的迅猛發(fā)展使得企業(yè)在網(wǎng)上的商務(wù)信息被淹沒于鋪天蓋地的信息之中。面對如此巨大的數(shù)據(jù),企業(yè)不得不每天都搜集和處理大量的數(shù)據(jù)信息。為此,企業(yè)需要更高層次的數(shù)據(jù)分析功能,以更有效地幫助其對網(wǎng)上的信息進(jìn)行分析并提取有效的數(shù)據(jù),進(jìn)而為企業(yè)的營銷策略及決策工作提供支持,從而為客戶提供更優(yōu)質(zhì)的個(gè)性化服務(wù)。于是,Web數(shù)據(jù)挖掘技術(shù)出現(xiàn)了。
數(shù)據(jù)挖掘,是指從大量的隨機(jī)數(shù)據(jù)中分析并提取隱含于其中的有潛在價(jià)值且先前不為人們所知的信息和知識的過程。Web數(shù)據(jù)挖掘正是應(yīng)用于Web環(huán)境下的數(shù)據(jù)挖掘技術(shù),是一項(xiàng)涉及互聯(lián)網(wǎng)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、人工智能等多個(gè)科學(xué)領(lǐng)域的綜合性技術(shù)。它能從大量的Web文檔集合以及Web站點(diǎn)內(nèi)的訪問活動中發(fā)現(xiàn)潛在且有用的數(shù)據(jù)信息。
Web數(shù)據(jù)挖掘主要分為Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘以及Web使用挖掘等三大類型。
當(dāng)前,基于Internet的Web數(shù)據(jù)挖掘主要有以下幾種方法。
Web數(shù)據(jù)挖掘通過路徑分析技術(shù)對Web服務(wù)器中客戶訪問站點(diǎn)所產(chǎn)生的日志文件進(jìn)行分析,并從中找出最頻繁的訪問路徑以及其他相關(guān)的路徑信息。從而為商家改進(jìn)頁面設(shè)計(jì)和優(yōu)化網(wǎng)站結(jié)構(gòu)提供科學(xué)有效的依據(jù)。
Web數(shù)據(jù)挖掘通過關(guān)聯(lián)規(guī)則分析對隱藏于客戶訪問信息數(shù)據(jù)中的相互關(guān)系進(jìn)行挖掘。從而幫助企業(yè)和商家更好地組織站點(diǎn)結(jié)構(gòu),以減少用戶過濾信息的負(fù)擔(dān)。
Web數(shù)據(jù)挖掘中的序列模式分析技術(shù),就是對客戶訪問Web服務(wù)器所產(chǎn)生的有時(shí)間序列的事務(wù)進(jìn)行挖掘分析。這些序列能直接反映客戶的訪問行為,進(jìn)而為商家預(yù)測客戶的訪問模式提供可靠的參照,以便對客戶提供更優(yōu)質(zhì)、更富個(gè)性化的服務(wù)。
在Web數(shù)據(jù)挖掘中,分類規(guī)則的發(fā)現(xiàn)是基于數(shù)據(jù)庫所描述的某些公共屬性,對客戶群的訪問特征進(jìn)行挖掘。而聚類分析則根據(jù)一定的規(guī)則,合理聚合具有高度相似瀏覽行為的客戶。從而對分類后的客戶群體的特點(diǎn)開展商業(yè)活動,并提供具有較強(qiáng)針對性的優(yōu)質(zhì)服務(wù)。
電子商務(wù)中的Web數(shù)據(jù)挖掘過程主要有以下幾個(gè)階段。
準(zhǔn)備數(shù)據(jù)在Web數(shù)據(jù)挖掘過程中主要分為收集數(shù)據(jù)、選擇數(shù)據(jù)和預(yù)處理數(shù)據(jù)等三個(gè)階段。Web數(shù)據(jù)挖掘通過收集Web服務(wù)器端的數(shù)據(jù),以記錄用戶的訪問行為于Web日志文件中,并對其進(jìn)行必要的選擇和整理以過濾無用的數(shù)據(jù)。預(yù)處理數(shù)據(jù),是為了進(jìn)一步精簡所選數(shù)據(jù)的有效部分而除去Web日志文件中與挖掘無關(guān)的冗余性和模糊性數(shù)據(jù)。
在Web數(shù)據(jù)挖掘過程中,挖掘數(shù)據(jù)是通過模式識別中的數(shù)據(jù)挖掘算法對用戶的日志文件進(jìn)行分析及加工,從而發(fā)現(xiàn)用戶訪問站點(diǎn)的瀏覽模式與習(xí)慣,以便于企業(yè)更有效地制定市場目標(biāo)與改進(jìn)決策。挖掘數(shù)據(jù)階段所要進(jìn)行的實(shí)際操作有:首先要決定如何產(chǎn)生假設(shè);其次,要選擇合適的工具;再次,要發(fā)掘知識的操作;最后,證實(shí)發(fā)現(xiàn)的知識。
這一階段不僅要把結(jié)果表述出來,而且還要對所提取的信息進(jìn)行分析和選擇處理,把最有價(jià)值的信息區(qū)分開來,并通過決策支持工具提交給決策者,假如不能使決策者滿意,還需要重復(fù)上述操作過程。最后,通過可視化技術(shù)以圖形界面的方式將挖掘的成果顯示出來。
企業(yè)盈利的關(guān)鍵之一是節(jié)約成本?;赪eb數(shù)據(jù)挖掘技術(shù),可以全面、實(shí)時(shí)且準(zhǔn)確地掌握企業(yè)的資源信息,從而對企業(yè)的歷史庫存數(shù)據(jù)、交易數(shù)據(jù)和財(cái)務(wù)數(shù)據(jù)進(jìn)行分析,為企業(yè)的資源優(yōu)化配置及決策提供重要的依據(jù)。Web數(shù)據(jù)挖掘在電子商務(wù)中的廣泛應(yīng)用,不僅可以極大地提高企業(yè)獲取信息及分析和處理信息的能力,以便為客戶提供更優(yōu)質(zhì)、更有針對性的服務(wù),同時(shí)還可以優(yōu)化企業(yè)資源,并為企業(yè)及時(shí)開拓市場渠道,進(jìn)而提高企業(yè)的經(jīng)營效率。Web數(shù)據(jù)挖掘在電子商務(wù)中的具體應(yīng)用主要有以下幾個(gè)方面。
企業(yè)盈利的關(guān)鍵是降低經(jīng)營成本。通過Web數(shù)據(jù)挖掘可以及時(shí)獲取可靠的商業(yè)信息,以便企業(yè)準(zhǔn)確地掌握市場動態(tài)并開展有針對性的商務(wù)活動,這不僅極大地提高了企業(yè)對市場變化的適應(yīng)能力,同時(shí)還能使企業(yè)對物質(zhì)資源、人力資源以及信息資源的利用達(dá)到最大化。從而大大地降低企業(yè)的經(jīng)營成本,提高企業(yè)的市場競爭力。
了解和關(guān)注已有的客戶對于電子商務(wù)而言是十分重要的。然而,從大量的新訪問者中發(fā)掘潛在客戶也同樣重要,因?yàn)樵L問者在網(wǎng)上的瀏覽行為反映了其興趣和意向。利用Web數(shù)據(jù)挖掘技術(shù)對Web服務(wù)器中用戶訪問站點(diǎn)所產(chǎn)生的日志文件進(jìn)行分析,并將訪問者進(jìn)行分類,進(jìn)而判斷訪問者是否屬于有利可圖的客戶群,以決定是否要把訪問者作為潛在的客戶。
為客戶制定優(yōu)質(zhì)的個(gè)性化服務(wù),不僅能有效地解決用戶的“信息迷失”困境,而且還能極大地加深企業(yè)與客戶的友好關(guān)系。通過Web數(shù)據(jù)挖掘?qū)蛻舻脑L問信息進(jìn)行收集并分析,進(jìn)而了解用戶的滿意度、興趣和需求等,以便企業(yè)及時(shí)調(diào)整Web頁面內(nèi)容和商務(wù)策略,為客戶制定個(gè)性化服務(wù)。從而最大限度地滿足客戶的需求。
在電子商務(wù)中,企業(yè)的站點(diǎn)內(nèi)容及結(jié)構(gòu)是提高用戶點(diǎn)擊率的關(guān)鍵。因此,利用Web數(shù)據(jù)挖掘技術(shù)對訪問者的網(wǎng)上行為記錄和反饋情況進(jìn)行挖掘,從而為優(yōu)化Web站點(diǎn)組織結(jié)構(gòu)和外觀設(shè)計(jì)提供科學(xué)有效的依據(jù)。除此之外,Web數(shù)據(jù)挖掘還可以獲取并統(tǒng)計(jì)分析網(wǎng)站上的各種數(shù)據(jù),這不僅有利于企業(yè)優(yōu)化站點(diǎn)系統(tǒng)的性能,以增強(qiáng)系統(tǒng)的安全性,而且還有助于企業(yè)進(jìn)行商業(yè)決策。
隨著電子商務(wù)的不斷發(fā)展,網(wǎng)上的經(jīng)濟(jì)詐騙與犯罪現(xiàn)象層出不窮,商業(yè)信用危機(jī)已成為當(dāng)前擾亂商業(yè)秩序的突出問題,嚴(yán)重阻礙了電子商務(wù)的健康發(fā)展,并已引起人們的廣泛關(guān)注。Web數(shù)據(jù)挖掘技術(shù)可以全程監(jiān)控和跟蹤企業(yè)的經(jīng)營狀況,從而為企業(yè)的資產(chǎn)評估、效益分析以及發(fā)展?jié)摿Φ念A(yù)測等構(gòu)建完善的安全保障體系,進(jìn)而有效地提高企業(yè)防范和化解信用風(fēng)險(xiǎn)的能力。
隨著時(shí)代的進(jìn)步,電子商務(wù)是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)通訊技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)發(fā)展的必然趨勢。Web數(shù)據(jù)挖掘在電子商務(wù)中,不僅具有廣闊的應(yīng)用前景,同時(shí)還對社會經(jīng)濟(jì)的發(fā)展具有重要而深遠(yuǎn)的現(xiàn)實(shí)意義,并已成為當(dāng)今世界各國研究的熱門領(lǐng)域之一。通過Web數(shù)據(jù)挖掘,可以幫助企業(yè)從各種繁亂復(fù)雜的信息數(shù)據(jù)中挖掘出有潛在價(jià)值的商業(yè)信息,從而使企業(yè)的資源配置和利用都更加合理,為企業(yè)做出正確的商務(wù)決策提供強(qiáng)有力的支持和可靠的保障,進(jìn)一步提高企業(yè)在商業(yè)競爭中的地位。
[1]凌傳繁.Web挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報(bào)雜志,2006,(1).
[2]郝先臣,張德干,尹國成.用于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[J].小型微型計(jì)算機(jī)系統(tǒng),2001.
[3]曹英存,李永亮.面向電子商務(wù)的Web挖掘技術(shù)[J].中國信息導(dǎo)報(bào),2005.
[4]林瑞娟,侯德文.Web挖掘及其在電子商務(wù)中的應(yīng)用研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006.
F590
A
1005-5800(2011)01(c)-119-02