江疆
【摘 要】社交網(wǎng)站具備快捷的信息反饋能力,形成了對(duì)社會(huì)輿論巨大的影響力,網(wǎng)絡(luò)言論一定程度上反映一個(gè)企業(yè)的社會(huì)認(rèn)可度。如何通過對(duì)社交網(wǎng)站海量客戶評(píng)論進(jìn)行識(shí)別和分析,從而判斷企業(yè)形象已經(jīng)成為網(wǎng)絡(luò)時(shí)代背景下企業(yè)改善自身形象的重要挑戰(zhàn)和機(jī)遇。本研究以國內(nèi)某電網(wǎng)公司為例,以用戶對(duì)電網(wǎng)相關(guān)的微博評(píng)論作為研究對(duì)象,采用文本挖掘技術(shù)和情感分析相結(jié)合的方法,構(gòu)建基于微博情感分析的企業(yè)形象評(píng)分算法,為供電企業(yè)判斷自身形象并有針對(duì)性的采取解決措施提供技術(shù)手段。
【關(guān)鍵詞】社交網(wǎng)絡(luò) 情感分析 輿情挖掘 企業(yè)形象
1 引言
隨著互聯(lián)網(wǎng)和移動(dòng)技術(shù)的廣泛應(yīng)用,人們?cè)絹碓蕉嗟脑谏缃痪W(wǎng)站上發(fā)表自己對(duì)于企業(yè)產(chǎn)品和服務(wù)的觀點(diǎn)和看法,而這些言論的快速大范圍傳播不可避免的影響到相應(yīng)企業(yè)的社會(huì)形象。如何通過對(duì)社交網(wǎng)站用戶言論的分析得到對(duì)企業(yè)形象的量化評(píng)價(jià)是本文的主要研究內(nèi)容?,F(xiàn)階段對(duì)于網(wǎng)絡(luò)言論的使用主要集中在抱怨處理[1],而沒有對(duì)這些網(wǎng)絡(luò)言論造成的企業(yè)形象的整體變化進(jìn)行量化。本文提出一種基于微博情感分析的企業(yè)形象評(píng)價(jià)算法,通過獲取微博相關(guān)言論和傳播信息,計(jì)算一段時(shí)間內(nèi)的企業(yè)形象得分,從而可以從宏觀上把握網(wǎng)絡(luò)輿論對(duì)企業(yè)形象造成的影響,了解企業(yè)在競爭同行中的位置,進(jìn)一步的可以更深入的鉆取和判斷是哪些方面的因素造成的影響,為企業(yè)決策提供輔助支持[2]。在計(jì)算機(jī)領(lǐng)域,輿情挖掘和情感分析主要考察如何運(yùn)用自然語言處理、文本挖掘、機(jī)器學(xué)習(xí)、人工智能、自動(dòng)化內(nèi)容分析等信息技術(shù)方法對(duì)社交網(wǎng)絡(luò)上個(gè)體評(píng)論信息進(jìn)行情感分類及體系構(gòu)建[3-5]。處于對(duì)企業(yè)日常工作指導(dǎo)的價(jià)值,這類研究針對(duì)的主要是客戶抱怨評(píng)論,通過加強(qiáng)對(duì)顧客抱怨信息的識(shí)別、搜集及反饋能力,優(yōu)化企業(yè)決策。本文通過將用戶評(píng)論內(nèi)容(正面與負(fù)面)與企業(yè)運(yùn)營業(yè)務(wù)分類相關(guān)聯(lián),獲取各業(yè)務(wù)關(guān)注點(diǎn)情感分值與對(duì)企業(yè)形象的貢獻(xiàn)度。
傳統(tǒng)的企業(yè)形象評(píng)價(jià)[6]一般采取問卷調(diào)查的方式進(jìn)行企業(yè)形象評(píng)價(jià)。而隨著大數(shù)據(jù)時(shí)代的來臨,企業(yè)通過網(wǎng)絡(luò)獲取用戶行為數(shù)據(jù)變得越來越容易。因此,基于真實(shí)情境大樣本數(shù)據(jù)的實(shí)證分析更能夠?qū)ζ髽I(yè)形象管理提供科學(xué)合理的優(yōu)化策略啟示。對(duì)于不同產(chǎn)業(yè)和行業(yè)類型的企業(yè)來說,通常需要采取不同的企業(yè)形象管理策略,例如電信行業(yè)與能源行業(yè)對(duì)企業(yè)形象的關(guān)注點(diǎn)與管理策略是不同的。本文以國內(nèi)某電網(wǎng)公司為例,以客戶對(duì)供電服務(wù)的微博評(píng)論作為研究對(duì)象,在構(gòu)建客戶評(píng)論分類體系基礎(chǔ)上對(duì)進(jìn)行企業(yè)形象評(píng)價(jià)算法的構(gòu)建。
2 研究方法及算法
本文研究的主要目標(biāo)為基于客戶微博言論構(gòu)建企業(yè)形象評(píng)價(jià),主要步驟為:(1)收集微博客戶信息;(2)構(gòu)建電網(wǎng)相關(guān)微博關(guān)鍵詞庫;(3)計(jì)算微博情感分值并判斷微博言論情感傾向類型;(4)劃分微博言論類型,關(guān)聯(lián)匹配企業(yè)服務(wù)事件;(5)計(jì)算企業(yè)形象評(píng)分。
2.1 微博客戶信息收集
通過計(jì)算機(jī)爬蟲程序模擬人工搜索和瀏覽實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)抓取[7],所有抓取數(shù)據(jù)都是微博博主對(duì)外公開的信息,不涉及隱私信息。本文收集的微博客戶信息主要包括用戶身份、微博內(nèi)容以及用戶行為信息。其中,用戶身份信息包括用戶名、用戶行業(yè)、用戶性別、賬號(hào)類別,微博內(nèi)容數(shù)據(jù)包括微博發(fā)布時(shí)間和文本內(nèi)容,用戶行為數(shù)據(jù)包括關(guān)注數(shù)、粉絲數(shù)、評(píng)論數(shù)量、轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量。
2.2 構(gòu)建電網(wǎng)相關(guān)微博關(guān)鍵詞庫
關(guān)鍵詞庫即是客戶對(duì)電網(wǎng)相關(guān)評(píng)論的關(guān)鍵“詞語庫”,包括停電、來電、95598客服態(tài)度好、鋪設(shè)電纜擾民等,能夠在一定程度上反映對(duì)電網(wǎng)的評(píng)價(jià)。根據(jù)某電網(wǎng)業(yè)務(wù)范圍,在客戶重點(diǎn)關(guān)注領(lǐng)域構(gòu)建微博關(guān)鍵詞庫。本文使用的關(guān)鍵詞庫主要包含以下方面:竊電、抄電表出錯(cuò)、95598、營業(yè)廳人員、錯(cuò)峰、詐騙、電壓不穩(wěn)等21類。
2.3 獲取客戶言論情感分值
客戶評(píng)論情感傾向可以劃分為正面、負(fù)面和中立三類[4-7]。目前存在三種識(shí)別顧客評(píng)論情感傾向的方法:基于詞庫、基于語料和基于層面[5]。本文采取詞庫法[8]開展客戶評(píng)論情感傾向判斷,具體工作步驟為:隨機(jī)篩選部分相關(guān)微博,由供電服務(wù)專家進(jìn)行人工分類和情感標(biāo)定;隨機(jī)選取部分微博作為樣本,利用分詞技術(shù)和計(jì)算機(jī)統(tǒng)計(jì)算法初步建立情感詞庫,并賦予每個(gè)詞一定情感極性權(quán)重—權(quán)重分正負(fù),越大表示正面感情越強(qiáng)烈,無感情則情感值為0;供電服務(wù)專家對(duì)詞庫中所有詞進(jìn)行人工校對(duì),確保準(zhǔn)確性,減少評(píng)判誤差;一條微博包含詞庫中某類詞的權(quán)重之和為本條微博情感分值,當(dāng)情感分值達(dá)到一定臨界值,則可以對(duì)客戶言論中包含的情感進(jìn)行判別(正面或者負(fù)面)。
2.4 劃分微博言論類型
本文運(yùn)用基于分詞技術(shù)的微博分類算法[9],將通過搜索關(guān)鍵詞庫獲取的微博經(jīng)過分類關(guān)鍵詞識(shí)別,從而進(jìn)一步判斷該條微博所描述內(nèi)容的類別,將每條微博的類別對(duì)應(yīng)到相應(yīng)的業(yè)務(wù)分類能夠更精準(zhǔn)的輔助業(yè)務(wù)提升。
2.5 計(jì)算企業(yè)形象評(píng)分
本文基于以下兩條假設(shè)形成企業(yè)形象評(píng)分算法。首先,每一條正面或負(fù)面的微博都從積極或消極的方面影響著一個(gè)企業(yè)的形象評(píng)分;其次,微博轉(zhuǎn)發(fā)、評(píng)論、點(diǎn)贊數(shù)和博主身份、粉絲數(shù)都對(duì)一條微博的影響力有著貢獻(xiàn),而影響力越大對(duì)企業(yè)形象造成的波動(dòng)也越大。因此,我們可以通過前一步驟獲取的每一條微博情感企業(yè)形象得分和微博影響力的大小計(jì)算企業(yè)形象得分,具體步驟如下:
(1)將情感分值歸一化。通過分析大量微博數(shù)據(jù),發(fā)現(xiàn)所有微博情感分值為 的時(shí)候已經(jīng)可以表達(dá)極強(qiáng)烈的正面和負(fù)面情緒,因此對(duì)任意一條情感分為 的微博,將其情感分歸一化為 。
(2)計(jì)算單條微博的影響力。單條微博影響力 的計(jì)算公式為: 。其中 為此微博博主身份,在本文中普通用戶設(shè)為1,VIP用戶設(shè)為10; 分別為粉絲數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)和點(diǎn)贊數(shù),權(quán)重 按經(jīng)驗(yàn)分別設(shè)為0.3,0.2,0.2,0.3。
(3)計(jì)算單條微博對(duì)企業(yè)的形象評(píng)價(jià)分值。 。
(4)計(jì)算一類微博對(duì)企業(yè)的形象評(píng)價(jià)分值。 ,為屬于類別j的所有微博形象評(píng)價(jià)分值之和經(jīng)過歸一化之后的結(jié)果。
(5)計(jì)算企業(yè)形象評(píng)價(jià)分值。為所有微博形象評(píng)價(jià)分值之和經(jīng)過歸一化后的結(jié)果,公式如下:
3 算法結(jié)果
3.1 樣本和數(shù)據(jù)收集
新浪微博是中國最受歡迎的社交網(wǎng)絡(luò),截止2015年第三季度,新浪微博在中國網(wǎng)民中的注冊(cè)用戶已經(jīng)超過4億用戶,日活躍用戶數(shù)達(dá)1億。本文以新浪微博客戶評(píng)論開展算法研究。本次計(jì)算時(shí)間區(qū)間為2015年10月07日至2015年11月03日共四周時(shí)間,共獲取6312個(gè)用戶的基礎(chǔ)信息,共計(jì)24167條微博。
3.2 結(jié)果分析
通過對(duì)某電網(wǎng)企業(yè)形象得分繪制隨時(shí)間變化曲線圖1所示,可以看到微博網(wǎng)絡(luò)言論主要以附件輿論為主,與人們對(duì)服務(wù)類企業(yè)的期望吻合。人們總是希望服務(wù)型企業(yè)能有更好的服務(wù),因此在網(wǎng)絡(luò)上也主要是以抱怨等負(fù)面情緒為主。通過進(jìn)一步對(duì)每類微博言論對(duì)企業(yè)形象評(píng)分的貢獻(xiàn)可以進(jìn)一步分析出哪一類言論是對(duì)企業(yè)形象有負(fù)面影響的,這一類言論對(duì)應(yīng)的業(yè)務(wù)是需要重點(diǎn)關(guān)注并改進(jìn)的,哪一類言論是對(duì)企業(yè)形象有促進(jìn)作用的,這一類言論對(duì)應(yīng)的業(yè)務(wù)是可以更好的進(jìn)行宣傳和擴(kuò)散的。更進(jìn)一步,各類微博中對(duì)企業(yè)形象分值影響較大的微博需要重點(diǎn)關(guān)注,一般這類微博博主影響力較大,傳播速度快、范圍廣,因此應(yīng)單獨(dú)列出進(jìn)行后續(xù)的處理,例如聯(lián)系微博博主了解情況、進(jìn)行安撫等等。通過層層深入的挖掘,可以實(shí)現(xiàn)對(duì)某電網(wǎng)公司業(yè)務(wù)的精益化管理。
4 結(jié)語
本文以國內(nèi)某電網(wǎng)公司為例,通過對(duì)微博言論進(jìn)行分析構(gòu)建企業(yè)形象評(píng)價(jià)指標(biāo),通過對(duì)該指標(biāo)的監(jiān)控可以總體把握企業(yè)輿論形象的變化情況,進(jìn)一步的通過層層深入分析各類別言論貢獻(xiàn)度大小從而定位需要重點(diǎn)關(guān)注的業(yè)務(wù)類別,最終可以定位到影響力較大的單條微博,進(jìn)行差異化的客戶服務(wù)與公關(guān)管理。后續(xù)需要進(jìn)一步研究怎樣實(shí)時(shí)監(jiān)控企業(yè)形象評(píng)價(jià),從而對(duì)突發(fā)情況及時(shí)響應(yīng)。
參考文獻(xiàn):
[1] Johnston, R. & Mehra, S. Best-practice complaint management[J].Academy of Management Executive,2002(4):145-154.
[2] 郭秀英,劉先濤.企業(yè)形象評(píng)價(jià)方法研究[J].商業(yè)研究,2004(20):86-87.
[3] Liu, B. Sentiment Analysis and Opinion Mining[M].Morgan &Claypool Publishers,2012.
[4] 何建民,劉明星.面向特定主題的客戶抱怨文本分類識(shí)別方法[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010(12):1884-1888.
[5] 王洪偉,鄭麗娟,尹裴.基于句子情感分析的中文網(wǎng)絡(luò)評(píng)論的情感極性分類[J].管理科學(xué)學(xué)報(bào),2013(9):64-74.
[6] 王紅杰.企業(yè)形象評(píng)價(jià)研究[D].河海大學(xué),2000.
[7] 羅一紓.微博爬蟲的相關(guān)技術(shù)研究[D].哈爾濱工業(yè)大學(xué),2013.
[8] Pang, B., L. Lee. Opinion mining and sentiment analysis[J]. Foundations and Trends in Information Retrieval,2008(1-2): 1-135.
[9] 韓忠明,張玉沙,張慧,等.有效的中文微博短文本傾向性分類算法[J].計(jì)算機(jī)應(yīng)用與軟件,201210):89-93.