符萍
摘 要:通過數(shù)據(jù)挖掘技術和商務解析方法之間的關系入手,說明二者之間的隸屬關系。介紹數(shù)據(jù)挖掘技術的數(shù)據(jù)準備、尋找模式、數(shù)據(jù)解釋和建模和依據(jù)結果制定計劃的運作步驟,并指出各步驟的關鍵事項。討論了數(shù)據(jù)挖掘和文本挖掘技術在商務解析中的作用和應用現(xiàn)狀和進一步發(fā)展商務解析能力的促進因素,更多的了解商務解析能力在企業(yè)中應用的潛力和限制。說明了商務解析在企業(yè)實際制定計劃和決策時的關鍵作用,利用商務解析能力能夠提升企業(yè)的業(yè)績和競爭能力。
關鍵詞:數(shù)據(jù)挖掘;商務解析;文本挖掘;電子商務
中圖分類號:F27
文獻標識碼:A
文章編號:16723198(2015)03011903
推薦系統(tǒng)出現(xiàn)改變了顧客的選購模式,系統(tǒng)自動記錄顧客的購買偏好,在下次購買時,將相關商品自動推薦給顧客,推薦系統(tǒng)的出現(xiàn)減少了顧客選購時間,增加了公司獲利可能性,得到雙贏效果。系統(tǒng)背后的基礎是數(shù)據(jù)整理能力,收集好商業(yè)活動中數(shù)據(jù)并加工出能夠準確有效的信息,提升企業(yè)競爭力和商業(yè)效率。新商務模式也為消費者帶來便利,增加了消費者生活多樣性,消費者的購買已經(jīng)主要發(fā)生在因特網(wǎng)上。因此,在龐大的網(wǎng)絡交易中,如何增加企業(yè)利潤,發(fā)現(xiàn)業(yè)務市場潛力,都要以數(shù)據(jù)為基礎來挖掘有效信息,提升企業(yè)分析和決策能力。夏國恩等以SCI、EI、CNKI相關數(shù)據(jù)庫為基礎,系統(tǒng)的分析了商務智能的研究趨勢和研究進展,并集中研究了商務智能在我國的研究現(xiàn)狀并提出建議。張巧從商務智能的核心概念和框架入手,分析我們商務智能的發(fā)展現(xiàn)狀,介紹主流軟件產(chǎn)品和廠商,并對未來的發(fā)展做了預測。胡翠華等以商務智能為研究視角,分析適合發(fā)展的行業(yè)和在我國的市場規(guī)模,針對發(fā)展趨勢制定了相關政策。夏維力等從戰(zhàn)略管理的角度討論商務智能在戰(zhàn)略決策中的作用,分析了戰(zhàn)略決策中信息獲取及處理方法和決策者洞察力等問題,介紹SWOT專家系統(tǒng)和智能網(wǎng)的情況。葉瓊偉等介紹了商務智能在我國電子商務企業(yè)中的應用,從時間、價值信息和技術三個維度對商務智能進行了分析,并結合案例討論其應用的好處。李振國等介紹了商務智能的含義和技術,討論商務智能在供應鏈管理中的具體應用,指出了應用應遵循的原則和指導。田新等介紹了BPM的歷史背景,BPM和BI之間的關系,描述了基于商務智能平臺的企業(yè)績效管理框架。
國內(nèi)研究數(shù)據(jù)挖掘和商務智能的文獻已有很多,但是針對商務解析的研究較少。商務解析過程的表現(xiàn)形式為商務智能,商務智能化需要了解商務解析過程和數(shù)據(jù)挖掘能力。分析企業(yè)已有數(shù)據(jù),理解企業(yè)所處的商業(yè)環(huán)境,提高企業(yè)的競爭力,都要以商務解析能力為基礎。商務解析是利用技術、規(guī)則、技能和實踐經(jīng)驗分析和開發(fā)過去商業(yè)數(shù)據(jù),在此基礎上得出洞察力和有效商業(yè)機會。商務解析是基于數(shù)據(jù)和統(tǒng)計方法來了解企業(yè)過去的績效、建立一種新的洞察力。商務解析廣泛利用大數(shù)據(jù)、統(tǒng)計和計量方法、預測模型等來實現(xiàn)決策。
1 數(shù)據(jù)挖掘與商務解析的關系
從技術角度來看,在很多應用領域都將數(shù)據(jù)挖掘和商務解析等同,因為商務解析現(xiàn)在大多依靠數(shù)據(jù)挖掘技術來實現(xiàn)其功能。但是,在理論上兩者有本質的區(qū)別。
數(shù)據(jù)挖掘技術為在企業(yè)數(shù)據(jù)庫中將大量數(shù)據(jù)中隱含的、未知的、有價值的信息挖掘出來的技術。數(shù)據(jù)挖掘也是一個價值發(fā)現(xiàn)過程,主要利用統(tǒng)計方法、智能優(yōu)化、人工智能、機器學習、數(shù)據(jù)庫技術等方法自動分析企業(yè)數(shù)據(jù),歸納、推理出潛在的價值信息,幫助企業(yè)發(fā)現(xiàn)價值、減少不必要的浪費、做出準確的決策。理論上,數(shù)據(jù)挖掘主要是識別企業(yè)數(shù)據(jù)集的模式,數(shù)據(jù)集可以來源企業(yè)數(shù)據(jù)庫和公共數(shù)據(jù)庫。能夠利用數(shù)據(jù)庫找出不同數(shù)據(jù)之間的相互聯(lián)系和一般模式,得到不同的關聯(lián)關系。
商務解析主要指利用數(shù)據(jù)收集方法和數(shù)據(jù)挖掘技術產(chǎn)生有價值信息的過程,要將數(shù)據(jù)呈現(xiàn)為標準的、可讀性的文件用來指導決策者決策和管理活動。商務解析是一個過程,在這個過程前期主要進行信息收集整理和確定可執(zhí)行文件的度量標準,后期根據(jù)數(shù)據(jù)挖掘技術處理數(shù)據(jù),提取有價值信息??梢哉f,數(shù)據(jù)挖掘過程是商務解析過程的一部分。企業(yè)如果能夠準確、有效的利用商務解析功能,將會提高決策過程,提高運作效率,實現(xiàn)商務智能化。圖1說明了數(shù)據(jù)挖掘和商務解析之間的關系。
圖1 商務解析過程
2 數(shù)據(jù)挖掘運作步驟
數(shù)據(jù)挖掘的正確使用能夠提升企業(yè)競爭力,有效運用數(shù)據(jù)挖掘技術主要包括以下四個過程:
(1)數(shù)據(jù)準備。數(shù)據(jù)準備是從一個或多個數(shù)據(jù)源中構造數(shù)據(jù)集,為以后數(shù)據(jù)建模做準備。通常包括數(shù)據(jù)清理、數(shù)據(jù)轉換和數(shù)據(jù)整理。數(shù)據(jù)清理主要是如何處理丟失的數(shù)據(jù),數(shù)據(jù)轉換是通過標準化、映射和聚集等方法轉換數(shù)據(jù)價值,數(shù)據(jù)整理是將數(shù)據(jù)整合到更小的數(shù)據(jù)集中。數(shù)據(jù)準備是一個很長的過程,要有對數(shù)據(jù)的敏感度,知道什么樣的數(shù)據(jù)是企業(yè)需要的數(shù)據(jù)。對選擇好的數(shù)據(jù)也可能存在數(shù)據(jù)質量問題,要設定一系列標準來對待所選擇的數(shù)據(jù)。數(shù)據(jù)的有效性、完整性和規(guī)范性能夠導致在數(shù)據(jù)分析之后的結果輸出時,錯誤的得出企業(yè)實際結果,造成不必要損失。
(2)在數(shù)據(jù)集尋找模式。數(shù)據(jù)挖掘的模式選擇有很多類型,主要依據(jù)不同的企業(yè)目的和要求。從挖掘任務的角度可以分成概念/類描述,挖掘頻繁模式、關聯(lián)和相關,分類和預測,聚類分析,離群點分析和演變分析等。實現(xiàn)以上模式的挖掘工具有關聯(lián)規(guī)則、聚類分類算法等,每一種不同的算法都可以找出不同的數(shù)據(jù)模式。企業(yè)如果要尋找下一個業(yè)務的增長點,就要在已有顧客信息的基礎上,利用預測算法分析出顧客潛在的相關需求。
(3)數(shù)據(jù)解釋和建模。通過找出的某一類型的數(shù)據(jù),就要建立分析模型。利用模型進行準確、有效的數(shù)據(jù),如果數(shù)據(jù)不符合開始的要求,那么將利用算法從更大的樣本數(shù)據(jù)進行挖掘或更換數(shù)據(jù)屬性。數(shù)據(jù)結果的解釋要求準確和恰當,這對數(shù)據(jù)結果要按照目的和要求進行,不同的數(shù)據(jù)屬性設置會造成數(shù)據(jù)結果的誤差,這種誤差會影響到后期的商務計劃的制定和執(zhí)行過程。
(4)根據(jù)結果制定計劃。數(shù)據(jù)挖掘產(chǎn)生的結果被評估后是準確和可行的,就可以制定相關的商業(yè)計劃,商業(yè)計劃的制定也不能完全按照挖掘的結果制定,要綜合分析企業(yè)的現(xiàn)狀和人員素質,這樣可以保證企業(yè)運用技術的合理性。如果某個商場發(fā)現(xiàn)兩種平時不相關的商品存在一種購買關系,那么,就可以將它們放到相近的位置進行銷售?;ヂ?lián)網(wǎng)公司利用文本挖掘技術能夠從相關網(wǎng)站挖掘出潛在的顧客,根據(jù)顧客的信息開發(fā)相關的網(wǎng)站模塊或相關應用產(chǎn)品,到達公司發(fā)展的目的。
3 數(shù)據(jù)挖掘在商務解析中的作用
數(shù)據(jù)挖掘技術或知識發(fā)現(xiàn)是商務解析的基礎,商務解析對數(shù)據(jù)進行篩選、甄別,了解企業(yè)過去與現(xiàn)狀的實際狀況,通過數(shù)據(jù)挖掘技術創(chuàng)造有價值的信息,預測企業(yè)將來的方向。數(shù)據(jù)挖掘技術利用算法挖掘海量數(shù)據(jù)集中的數(shù)據(jù)模式,在數(shù)據(jù)模式的基礎上建立有價值的信息。該過程為利用預測、關聯(lián)規(guī)則、聚類和分類一些數(shù)學方法,將數(shù)據(jù)之間的關系明確,發(fā)現(xiàn)企業(yè)產(chǎn)品之間的關系,顧客購買的一些行為模式,通過企業(yè)更好的了解產(chǎn)品和客戶的需求,為客戶更好的服務。很多公司利用文本數(shù)據(jù)挖掘技術,在博客、Twitter、Facebook等網(wǎng)站信息中找出顧客品牌的偏好,根據(jù)技術提取有價值信息指導企業(yè)在客戶關系管理中如何行動。
數(shù)據(jù)查詢是很多數(shù)據(jù)庫軟件的主要功能之一,數(shù)據(jù)查詢通過已有的數(shù)據(jù)庫中的數(shù)據(jù)查詢出企業(yè)想得到的信息,但是在進行查詢之前,企業(yè)已經(jīng)設定好查詢的目的和內(nèi)容。而數(shù)據(jù)挖掘技術是在企業(yè)的數(shù)據(jù)庫中進行沒有設置目的的查詢,找出一些企業(yè)無知的信息,通常將這個過程稱為知識發(fā)現(xiàn)。這種知識發(fā)現(xiàn)是商務解析的基礎,能夠為商務解析過程提供豐富的信息源泉。數(shù)據(jù)挖掘技術最早在沃爾瑪?shù)玫胶芎玫膽茫闶凵痰漠a(chǎn)品銷售主要是陳列各種產(chǎn)品,沃爾瑪從顧客的消費記錄中挖掘出啤酒和尿不濕之間有一定的關系,通過將兩種產(chǎn)品就近陳列促進了銷售。零售商的商務解析過程叫做市場籃子分析,利用數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則,找出商品之間的購買關聯(lián)度,增加產(chǎn)品的交叉銷售,指導商品的陳設方式。
鋼鐵企業(yè)根據(jù)客戶的購買記錄可以將其分類,利用數(shù)據(jù)挖掘技術的聚類分析找出相關客戶之間屬性的一致性分為不同的客戶等級。很多客戶在購買產(chǎn)品時將預付一定的款項,等商品收到后再支付其余貨款,但是往往存在一定的違約現(xiàn)象,這類現(xiàn)象就可以利用聚類分析找出優(yōu)良客戶和不良客戶之間的分界線,在不良客戶中采用全額支付后發(fā)貨的決策。這種技術的應用屬于風險管理范疇,在銀行或保險等金融行業(yè),數(shù)據(jù)挖掘能夠起到檢測的作用,將信用不好的顧客分類,采取措施防范違約現(xiàn)象的發(fā)生。
4 促進商務解析發(fā)展的因素分析
雖然利用數(shù)據(jù)挖掘技術能夠增強商務解析的分析能力,但是如果要更好的發(fā)展商務解析方法,要求問題求解邏輯、技術水平、系統(tǒng)整合等方面得到更好的提升。提高商務解析方法發(fā)展的因素主要包括以下方面:
(1)垂直一體化。由于不同客戶和市場的要求,相關商務解析的應用程序和軟件要求要縮短知識發(fā)現(xiàn)的時間,明確的客戶問題和目標的確定,能夠依據(jù)行業(yè)的特點制定詳細的商業(yè)計劃,這種要求促進了垂直一體化的產(chǎn)生。將專業(yè)的行業(yè)知識和行業(yè)目標包含到商務解析過程中,設計出準確分析客戶的數(shù)據(jù)。在這一過程中,不單單利用數(shù)據(jù)挖掘技術挖掘信息,挖掘出的信息的評價也很重要。
(2)易理解模型和轉換。商務解析后的結果往往不能被使用者讀懂,需要數(shù)據(jù)挖掘專家來分析出輸出結果的意義,這樣會帶來使用不便。構建易理解的模型和容易掌握的轉換結果是客戶的需求,客戶要求能夠用簡單的圖形或文字來表示最終的結果,這樣有利于其他業(yè)務部門的專家直接得到結果,制定更詳盡的商業(yè)計劃。
(3)增強系統(tǒng)能力。系統(tǒng)的數(shù)據(jù)分析部分是很重要的部分,系統(tǒng)分析什么取決于收集到什么樣的數(shù)據(jù),擴大數(shù)據(jù)收集的范圍能夠為系統(tǒng)分析提供更多的素材。在擴大數(shù)據(jù)收集范圍的同時,要考慮存儲的安全性,設定唯一的標示來接受數(shù)據(jù)的存儲。要擴大數(shù)據(jù)收集的來源渠道,例如需要客戶信息時,要從網(wǎng)站、尋呼中心、無線接口等途徑獲得需要的數(shù)據(jù)。另外,提高系統(tǒng)運行的硬件設備和所在的網(wǎng)絡環(huán)境,也同樣有利于系統(tǒng)分析。
(4)應用新領域。越來越多的管理理念和方法的誕生為商務解析提供更多的應用空間,供應鏈管理、產(chǎn)品價格管理和員工管理是直接的應用方向。供應鏈管理利用數(shù)據(jù)的分析和解析能力,能夠更好的建立供應鏈上企業(yè)的關系,按照準確的市場需求供應產(chǎn)品,減少不必要的庫存成本和生產(chǎn)能力。企業(yè)制定產(chǎn)品價格時,可以從多個渠道收集產(chǎn)品相關價格,及時調(diào)整自身的價格,加快產(chǎn)品的流通速度。利用商務解析更多了解員工的實際情況和偏好,及時調(diào)整對企業(yè)員工的管理方法。
5 結論
數(shù)據(jù)挖掘技術的提高和發(fā)展,會不斷加強商務解析能力。企業(yè)越來越需要數(shù)據(jù)挖掘和文本挖掘技術在商務解析中應用,成為企業(yè)發(fā)展的戰(zhàn)略工具,提高企業(yè)競爭力。通過了解和熟悉數(shù)據(jù)挖掘技術的運作步驟,了解各步驟中的關鍵因素,結合企業(yè)實際情況,將數(shù)據(jù)挖掘技術引入商務解析方法之中,同時,了解企業(yè)商務解析發(fā)展的主要影響因素,努力在各影響因素中尋找突破口,加強影響因素對商務解析的正面作用,使企業(yè)都能夠快速、準確的擁有商務解析能力,鞏固企業(yè)供應鏈管理、客戶關系管理和內(nèi)部員工管理等方面的效率。
參考文獻
[1]夏恩國,金煒東,張葛祥.商務智能在中國的現(xiàn)狀和發(fā)展研究[J].科技進步與對策,2006,(1):173176.
[2]張巧.商務智能發(fā)展現(xiàn)狀與趨勢研究[J].中國證券期貨,2009,(2):1417.
[3]胡翠華,陳登科.商務智能在我國的發(fā)展現(xiàn)狀、問題及其對策[J].科技管理研究,2007,(10):5052.
[4]夏維力,許昌元.商務智能技術在企業(yè)戰(zhàn)略決策中的支持作用及方法研究[J].軟科學,2004,18(3):1521.
[5]葉瓊偉,宋光興,譚繼江.商務智能(BI)在電子商務企業(yè)中應用的實證研究以YNYY藥業(yè)連鎖企業(yè)為例[J].科技進步與對策,2010,27(21):112115.
[6]李振國,朱杰.商務智能在供應鏈管理中的應用[J].物流技術,2007,26(2):145147.
[7]田新,張玉峰,夏恩德等.基于商務智能平臺的企業(yè)績效管理框架研究[J].科技管理研究,2013,(1):235240.
[8]Mostafa M M. More than words: Social networks text mining for consumer brand sentiments [J]. Expert Systems with Applications,2013,40(10):42414251.
[9]Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large database[J].Proceedings of the ACM Sigmoid International Conference on Management of Data,New York,1993.