庚煬
【摘 要】隨著電子商務(wù)的不斷發(fā)展,線上線下電子商務(wù)模式被廣泛應(yīng)用,本文從電子商務(wù)平臺、電子商務(wù)用戶和電子商務(wù)經(jīng)營商的角度研究,分析基于大數(shù)據(jù)的環(huán)境下,線上線下電子商務(wù)用戶數(shù)據(jù)資料的特點,針對這些特點提出線上線下電子商務(wù)用戶數(shù)據(jù)的挖掘流程和對電子商務(wù)用戶數(shù)據(jù)的挖掘方法。
【關(guān)鍵詞】電子商務(wù);線上線下;用戶數(shù)據(jù);挖掘方法
目前,電子商務(wù)已經(jīng)進入到大數(shù)據(jù)時代,電子商務(wù)的用戶數(shù)每年都在快速增加,但是電子商務(wù)企業(yè)對用戶的數(shù)據(jù)信息利用率卻很低,用戶的數(shù)據(jù)信息作為線上線下電子商務(wù)的有效資源還未被有效的開發(fā)。在大數(shù)據(jù)的環(huán)境下,對線上線下電商用戶數(shù)據(jù)挖掘研究具有重要意義。
一、大數(shù)據(jù)的線上線下電商用戶數(shù)據(jù)的特點
與以往的電子商務(wù)用戶數(shù)據(jù)相比,線上線下用戶的數(shù)據(jù)不僅僅是交易數(shù)據(jù),還包括用戶所使用的移動終端數(shù)據(jù)、用戶的地理位置信息等,電商可以根據(jù)線上線下電子商務(wù)用戶數(shù)據(jù),對這些數(shù)據(jù)進行分析研究,通過對用戶的交易數(shù)據(jù)、地理位置研究電子商務(wù)用戶以下幾個特點:
1.規(guī)模大
許多線上線下電商企業(yè)每天積累的用戶數(shù)據(jù)已經(jīng)達到了TB等級。如今的線上線下電子商務(wù)已經(jīng)有移動互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的加入,線上線下電商用戶數(shù)據(jù)不再是以往的單純的交易數(shù)據(jù),其中還包含著許多電商用戶信息。線上線下電商用戶的數(shù)據(jù)規(guī)模會從TB上升到PB,甚至可以上升到EB,線上線下電商企業(yè)可以通過這些數(shù)據(jù)進行商務(wù)智能分析。
2.種類多
線上線下電子商務(wù)用戶數(shù)據(jù)多,種類復(fù)雜,它不僅局限于線上線下電商用戶的基本信息,用戶的消費記錄和電子商務(wù)企業(yè)內(nèi)部的大量信息,其中包括用戶對電商的評價和用戶在線上線下平臺的操作記錄、使用的移動終端數(shù)據(jù)和其他非結(jié)構(gòu)的用戶數(shù)據(jù)。
3.速度快
線上線下電子商務(wù)模式對用戶的數(shù)據(jù)進行及時處理有嚴格的要求。用戶的數(shù)據(jù)信息,是依據(jù)用戶在電子商務(wù)的操作行為產(chǎn)生的,這些數(shù)據(jù)都是傳輸速度極快的數(shù)據(jù)流,如電子商務(wù)用戶在線下商家的實際消費情況,用戶的購買情況和地理位置都有記錄,電商可以根據(jù)具體的信息對電子商務(wù)用戶進行分析,從而實現(xiàn)更好的服務(wù)。
二、線上線下電子商務(wù)用戶數(shù)據(jù)挖掘的整體思路
線上線下電子商務(wù)用戶數(shù)據(jù)具有大數(shù)據(jù)特征,所以電子商務(wù)企業(yè)在對傳統(tǒng)的數(shù)據(jù)僅挖掘分析時就會遇到很多困難,不能對這些數(shù)據(jù)進行很好的利用,大數(shù)據(jù)信息的挖掘與傳統(tǒng)數(shù)據(jù)信息的挖掘雖然都是為了實現(xiàn)對信息數(shù)據(jù)的有效使用,但是這兩者之間還存在著本質(zhì)上的區(qū)別,主要有以下幾點:
1.數(shù)據(jù)量不同
大數(shù)據(jù)分析的數(shù)據(jù)量是以TB級為主,或者是PB級等更大的數(shù)據(jù)量級;而傳統(tǒng)的數(shù)據(jù)分析主要是對數(shù)據(jù)資料庫或者是系統(tǒng)文件中的數(shù)據(jù)進行分析處理。
2.數(shù)據(jù)類型不同
大數(shù)據(jù)主要分析挖掘的用戶數(shù)據(jù)不僅是結(jié)構(gòu)數(shù)據(jù)等還包括非結(jié)構(gòu)數(shù)據(jù)等實時有效的數(shù)據(jù),而傳統(tǒng)的用戶數(shù)據(jù)分析主要是對靜態(tài)的、結(jié)構(gòu)化的數(shù)據(jù)進行分析研究為主。
3.方法不同
大數(shù)據(jù)分析用戶數(shù)據(jù)不僅需要統(tǒng)計學(xué)知識的運用,還要使用人工智能的運算方法,甚至需要計算機的應(yīng)用,而傳統(tǒng)的用戶數(shù)據(jù)分析主要以統(tǒng)計學(xué)為基礎(chǔ),對用戶數(shù)據(jù)進行分類和預(yù)測,包括探索性數(shù)據(jù)分析和驗證性數(shù)據(jù)分析兩種分析方法。
對傳統(tǒng)數(shù)據(jù)分析時運用的統(tǒng)計學(xué)方法很難在大數(shù)據(jù)環(huán)境下有效使用的,主要有兩方面的原因:一方面在傳統(tǒng)用戶數(shù)據(jù)分析中需要假設(shè)檢驗,需要對問題進行明確的假設(shè)后進行數(shù)據(jù)的分析,因此傳統(tǒng)的數(shù)據(jù)分析法會對數(shù)據(jù)分析人員和分析過程過分依賴,如果數(shù)據(jù)分析人員不能對數(shù)據(jù)進行有效的分析和準確的理解,傳統(tǒng)的數(shù)據(jù)分析方法就很難承擔(dān)線上線下電子商務(wù)用戶數(shù)據(jù)挖掘的任務(wù)。另一方面,傳統(tǒng)數(shù)據(jù)分析方法只適合對結(jié)構(gòu)數(shù)據(jù)的分析,難以集成和分析地理、視頻、文本等非結(jié)構(gòu)的數(shù)據(jù)。而且傳統(tǒng)數(shù)據(jù)分析時效性差,很難準確的分析出成本獲得可接受的時間,這會導(dǎo)致在傳統(tǒng)數(shù)據(jù)分析過程中會投入較高的成本,不能及時有效的獲得管理部門需要的分析結(jié)果。
三、大數(shù)據(jù)的線上線下電商用戶數(shù)據(jù)挖掘的流程和方法
1.線上線下電子商務(wù)用戶數(shù)據(jù)挖掘流程
線上線下電子商務(wù)用戶數(shù)據(jù)挖掘流程中,傳統(tǒng)數(shù)據(jù)挖掘相對簡單,挖掘的數(shù)據(jù)主要是文件或數(shù)據(jù)庫的數(shù)據(jù),通過分類和預(yù)測的算法對用戶數(shù)據(jù)進行分散類別和連續(xù)取值。而大數(shù)據(jù)挖掘不同于傳統(tǒng)數(shù)據(jù)的挖掘,線上線下電子商務(wù)用戶數(shù)據(jù)挖掘流程主要是通過計算機對數(shù)據(jù)進行模型分析,實現(xiàn)對龐大的數(shù)據(jù)進行觀測和挖掘。線上線下電子商務(wù)用戶數(shù)據(jù)挖掘能夠?qū)Υ髷?shù)據(jù)中電商用戶的個人特點和詳細的個人信息進行挖掘,分析獲取有價值的信息。
2.線上線下電子商務(wù)用戶數(shù)據(jù)挖掘方法
通過對線上線下電子商務(wù)用戶數(shù)據(jù)挖掘,實現(xiàn)對電商的發(fā)展趨勢的把握,根據(jù)情況及時作出調(diào)整,實現(xiàn)對線上線下電子商務(wù)用戶數(shù)據(jù)的有效利用。線上線下電子商務(wù)用戶數(shù)據(jù)挖掘方法主要有兩種,分別是:
(1)關(guān)聯(lián)規(guī)則分析,在對線上線下電子商務(wù)用戶數(shù)據(jù)挖掘時,運用關(guān)聯(lián)分析方法可以對大量的用戶數(shù)據(jù)進行挖掘,發(fā)現(xiàn)數(shù)據(jù)中有關(guān)聯(lián)的地方,挖掘出影響用戶行為的因素,對這些因素進行分析然后做出決策。
(2)社會網(wǎng)絡(luò)分析,主要是對線上線下等不同單位所構(gòu)成的關(guān)系結(jié)構(gòu)進行分析,通過對用戶之間的關(guān)系網(wǎng)絡(luò)挖掘用戶的信息和有效資源。
四、結(jié)論
隨著科學(xué)技術(shù)的進步,電子商務(wù)中的用戶信息更容易被挖掘和利用,通過對線上線下電商用戶數(shù)據(jù)挖掘流程和方法的研究,可以為線上線下電子商務(wù)企業(yè)用戶數(shù)據(jù)挖掘提供參考價值。
參考文獻:
[1]馮芷艷,郭迅華,曾大軍,陳煜波,陳國青.大數(shù)據(jù)背景下商務(wù)管理研究若干前沿課題[J].管理科學(xué)學(xué)報,2013,01:1-9
[2]王佳秋.基于用戶行為及關(guān)系的微博電商企業(yè)影響力度量[D].哈爾濱商業(yè)大學(xué),2013