孫育華
摘要:本文設計并實現(xiàn)了一個面向微博的品牌評價系統(tǒng)。用戶可以通過系統(tǒng)方便地獲取網(wǎng)絡上相關的品牌信息,挖掘出網(wǎng)友對該品牌口碑評價的信息,并獲得這些評價信息的好評、差評相關結果,了解某個品牌在網(wǎng)絡上的聲譽度。
Abstract: This paper designs and implements a brand evaluation system for micro-blog. Users can easily access the relevant brand information on the network through the system, dig out the information about the brand reputation evaluation of netizens, and obtain the positive and negative evaluation results of these evaluation information, so as to understand the reputation of a brand on the network.
關鍵詞:品牌評價;網(wǎng)絡爬蟲;微博;情感分類
Key words: brand evaluation;web crawler;micro-blog;sentiment classification
中圖分類號:TP391.3? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2019)24-0234-02
1? 概述
消費者對一個品牌的認識,早先主要是來源于街巷、報紙、電視新聞、廣播等。Internet的飛速發(fā)展,不斷地影響人們生活和獲取信息的方式,貼吧、個人空間、論壇、博客、在線社區(qū)、微博等通訊平臺已成為人們展示生活、分享體驗的主流方式。在這眾多交流平臺中,微博“靈活、快速、簡短”的特點無疑成為網(wǎng)民發(fā)布信息、交流個人觀點的主要平臺,而且微博的發(fā)布可以通過移動端和PC端等多種方式進行發(fā)布、分享140字以內(nèi)的文本信息。這樣的社交方式使人們對微博越來越青睞,且其用戶數(shù)量與日俱增。
由于微博數(shù)量巨大,難以被人為控制,以微博作為品牌評價的數(shù)據(jù)源,在一定程度上保證了數(shù)據(jù)的可靠性。通過對微博文本進行情感分析,對相關品牌進行判斷分析,能更直觀地感受到微博上相關的品牌聲譽,而不是被部分輿論所誤導。企業(yè)也可以從中了解用戶的情感信息,便于對產(chǎn)品滿意度進行調(diào)研,以此有針對性的完善產(chǎn)品和相關的服務體系,以助于企業(yè)更好的發(fā)展,同時也可以讓用戶有一個更好的選擇。它還可以運用于輿情監(jiān)控、心理學等不同領域的研究。因此對于面向微博的品牌評價分析不僅可以用于企業(yè)調(diào)研用戶對企業(yè)品牌的滿意度,通過分析負面評價的內(nèi)容,方便企業(yè)更好的了解用戶需求。因此面向微博的品牌評價系統(tǒng)設計與實現(xiàn)對于企業(yè)和用戶具有十分重要的意義。
本文以微博作為數(shù)據(jù)來源,以自然語言處理、信息檢索、情感傾向性分析等相關技術為核心,設計并實現(xiàn)了一個面向微博的品牌評價系統(tǒng)。
2? 系統(tǒng)分析
2.1 業(yè)務需求分析
面向微博的品牌評價系統(tǒng)面向的對象是互聯(lián)網(wǎng)上的輿情信息,其中包括互聯(lián)網(wǎng)上各大論壇、貼吧、社區(qū)、網(wǎng)絡新聞、博客、空間、微博等等。微博具有即時、交流量大、短文本的特點是本文選取作為系統(tǒng)數(shù)據(jù)來源的原因。微博文本分析不僅是品牌評價分析的參考元素,對品牌的分析起至關重要的作用,而且可以對分析結果單獨使用,從中可以分析網(wǎng)民在某個事件的情感傾向,以供管理者總體的了解網(wǎng)絡的評價信息,同時也可以根據(jù)當前的口碑結果來評估一個品牌的聲譽度。所以,面向微博的品牌評價系統(tǒng)需要能夠適應微博的短文本分析,并且準確率要求較高,以供后續(xù)進行一個品牌評價。
根據(jù)上述的需求背景,可以總結出下業(yè)務需求分析:
①能夠從網(wǎng)絡上抓取微博相關的頁面并從中提取相關的文本信息。
②能夠對抓取下來的文本信息進行準確的情感傾向性分析。
③直觀的將分析結果進行顯示。
④具有友好的用戶使用界面。
2.2 功能需求分析
針對上述的系統(tǒng)總體業(yè)務需求分析,進而可以對系統(tǒng)的功能進行分析,可以將系統(tǒng)分為前臺和后臺,其中前臺負責展示業(yè)務,后臺負責主要的相關計算邏輯,系統(tǒng)前后臺的交互,共同組成一個完整的系統(tǒng)。
前臺的功能模塊具備用戶從搜索某個品牌開始到系統(tǒng)響應結束時,系統(tǒng)將處理結果展現(xiàn)給用戶,用戶可以通過結果整體了解品牌的聲譽度,并且可以通過好評、差評相關信息進一步地了解目標品牌的口碑評價信息。
系統(tǒng)的前臺系統(tǒng)結構功能主要分為七部分,品牌展示首頁為系統(tǒng)的首頁,展示的是多個已經(jīng)分析好的品牌信息。前臺的功能中,微博爬蟲入口主要是填寫爬蟲程序啟動所需的信息,通過填寫微博名稱、爬取頁數(shù)、是否官博下的評論、是否用戶微博信息來啟動爬蟲程序,完成爬蟲程序后主頁面會新增一個品牌的展示位,并且這個展示位的圖標為此官博的頭像。品牌聲譽評價的結果顯示分為官方微博下的用戶評論情感分析結果和新浪用戶發(fā)表微博的文本信息的情感分析結果,前臺的顯示區(qū)分官博和用戶微博的統(tǒng)計頁面,并且可以進行相互跳轉查看。同時在統(tǒng)計的數(shù)據(jù)報表頁面上,有詞云展示、條形圖展示、餅狀圖展示,其中數(shù)據(jù)報表統(tǒng)計的內(nèi)容為:統(tǒng)計文本信息的差評、好評的文本總數(shù)、差評文本高頻詞語數(shù)量、好評文本的高頻詞語數(shù)量、統(tǒng)計某個性別對某個品牌的評論情感類型為好評或者差評的文本數(shù)量、統(tǒng)計某個地區(qū)對某個品牌的評論情感類型為差評或者好評的文本數(shù)量。在查看數(shù)據(jù)報表時,用戶可以點擊條形圖、餅狀圖、詞云的某一個屬性進行跳轉至一個關聯(lián)這個屬性的句子信息頁面。頁面有全屏顯示的按鈕,用戶可以通過點擊全屏的按鈕進入全屏模式,讓用戶有良好的視覺體驗。