王 威
(成都航空職業(yè)技術(shù)學院圖書館,四川 成都 610100)
用戶體驗是人們對已使用的客體的主觀感受、認知印象和回應,是衡量產(chǎn)品質(zhì)量或服務質(zhì)量的重要標準之一。同時,用戶體驗分析還是開展用戶研究、發(fā)現(xiàn)用戶需求與提出方法的有效策略,是開展改進型創(chuàng)新和顛覆性創(chuàng)新的重要手段[1]。但是受限于用戶體驗的主觀性和分散性,產(chǎn)品或服務的供給方通常難以便捷、準確地感知潛在的用戶痛點,難以挖掘隱藏在眾多用戶體驗中的用戶需求。因此,高效、準確地進行用戶體驗分析對推進產(chǎn)品或服務創(chuàng)新具有重要意義。
為挖掘用戶意見、感知用戶態(tài)度,從而了解用戶需求,研究設計了一種融合主題挖掘與情感分析的用戶體驗分析方法。該方法主要分為3步:數(shù)據(jù)收集與預處理、主題挖掘和主題情感分析,其技術(shù)路線如圖1所示。
圖1 用戶體驗分析方法技術(shù)路線圖
數(shù)據(jù)收集與預處理是用戶體驗分析的基礎,通常分為3個步驟:
(1)用戶意見收集是指通過各種渠道征集回收用戶對產(chǎn)品或服務的評價、建議等描述信息。常見的用戶意見回收方法有互聯(lián)網(wǎng)平臺UGC(用戶生成內(nèi)容:User-generated Content)爬?。ㄈ珉娚唐脚_和網(wǎng)絡論壇等)、用戶意見反饋表收集和用戶回訪等。
(2)數(shù)據(jù)清洗是指對收集到的用戶意見進行篩選、去重、整理,降低無意義數(shù)據(jù)干擾,使數(shù)據(jù)具有良好的可操作性,以便后續(xù)處理。
(3)文本分詞是指將文本語言切分成詞語的過程,也是中文自然語言處理的重要過程。根據(jù)不同精度分為基于詞典匹配分詞法、基于理解的分詞法和基于統(tǒng)計的分詞法,常用工具有結(jié)巴分詞、HanLP和FoolNLTK等。得到分詞結(jié)果后還需結(jié)合停用詞表(如哈工大停用詞表和百度停用詞表等)去除無實際意義的詞。去除停用詞時也可根據(jù)實際需要補充完善或自建停用詞表,并適當合并同義詞。
主題挖掘技術(shù)是文本挖掘領(lǐng)域中新興的一種用于對具有代表性的詞、短語或句子進行自動標注和抽取的技術(shù)[2],主要用于處理和分析海量信息,發(fā)現(xiàn)文檔中的核心主題,實現(xiàn)對信息的有效處理和深層次利用[3]。首先,在數(shù)據(jù)收集與預處理的基礎上,對用戶意見進行主題挖掘需要提取文本特征詞。文本特征提取是通過量化文本中提取的特征詞以描述文本信息的過程,是文本挖掘的重要環(huán)節(jié)[4],常用的文本特征提取方法有詞頻法、TF-IDF(Term Frequency-Inverse Document Frequency)法和Word2Vec詞向量法等。其次,將提取的文本特征詞進行聚類,常用的文本特征詞聚類方法有共詞網(wǎng)絡法(如CiteSpace、Vosviewer、Ucine和Pajek等工具)和基于主題概率模型法(如LDA主題模型)。在主題聚類時應注意最佳聚類主題數(shù)量的確定,確保每個聚類塊具有較高的內(nèi)聚性、各聚類塊間具有較低的耦合性。最后,分析聚類結(jié)果、歸納解釋聚類主題。
進行主題情感分析前,應先將用戶意見文本切分為單句(通常以標點符號為標志),再依據(jù)主題挖掘結(jié)果將單句劃分至主題,然后對每個主題進行情感分析。情感分析是利用自然語言處理、數(shù)據(jù)挖掘算法等對文本語言進行情感判斷,從而把握文本意見觀點、態(tài)度的計算研究[5]。目前,情感分析方法主要包括基于機器學習的情感分類法和基于情感詞典的語義分析法[6]。通過對各個主題的用戶意見進行情感分析,可以清晰地感知用戶在各個主題上的情感傾向,從而了解用戶對不同主題的滿意程度。
為驗證文章所提出的用戶體驗分析方法,選取天貓商城“國家圖書館旗艦店”文創(chuàng)產(chǎn)品作為研究對象。通過挖掘用戶評論主題、分析用戶情感傾向,為國家圖書館文創(chuàng)產(chǎn)品的開發(fā)和運營提出建議。
研究利用Python編程語言,通過網(wǎng)絡爬蟲技術(shù),從天貓平臺“國家圖書館旗艦店”收集到174種文創(chuàng)產(chǎn)品在線評論7 869條。由于評論文本中存在重復、無關(guān)、信息量少等無效信息,無法直接挖掘和分析,研究對原始數(shù)據(jù)進行了預處理。首先,通過Python編程和人工剔除重復評論和無關(guān)評論;其次,使用結(jié)巴分詞對評論進行分詞和詞性標注;最后,通過構(gòu)建和完善停用詞典、詞性判斷去除無意義評論。最終得到有效評論5 140條、有效詞匯5 134個、總詞頻20 749次。
研究選用的主題聚類方法是詞頻統(tǒng)計、共詞聚類和人工歸納相結(jié)合,主要分為3步:文本特征詞提取、文本特征詞聚類、文本主題歸納。首先,使用TFIDF法提取評論集的特征詞;其次,將評論文本特征詞看作文獻關(guān)鍵詞,將其轉(zhuǎn)換為Web of Science導出格式(特征詞填入“DE”字段),利用CiteSpace軟件的關(guān)鍵詞聚類功能進行在線評論特征詞聚類;最后,結(jié)合高頻特征詞和聚類結(jié)果人工歸納在線評論主題。
2.2.1 文本特征提取
TF-IDF法提取文本特征詞,是以某個詞對文本的重要性來判斷該詞是否能夠成為文本的特征詞。具體計算方法如下:
經(jīng)計算,得到國家圖書館文創(chuàng)產(chǎn)品用戶在線評論文本特征詞表,詞頻前20的特征詞見表1。表1中,特征詞主要集中在產(chǎn)品質(zhì)量、做工、設計、用途(如“朋友”“送給”等詞)、價格、物流、賣家、客服和體驗(如“感覺”“很好”“好看”等詞)等主題,表明用戶對國家圖書館文創(chuàng)產(chǎn)品的評價主要圍繞這些話題展開。
表1 國家圖書館文創(chuàng)產(chǎn)品用戶在線評論高頻特征詞Top20
2.2.2 主題聚類
文章將詞頻在10 以上的高頻特征詞應用CiteSpace關(guān)鍵詞聚類功能進行聚類并繪制高頻特征詞聚類圖譜,如圖2所示。CiteSpace聚類結(jié)果的合理性通常通過Modularity(模塊值Q)和Silhouette(輪廓值S)來評估,一般當Q>0.3時,認為聚類結(jié)構(gòu)是顯著的,當S>0.5時,認為聚類就是合理的。研究中的Q=0.854 4>0.3,S=0.962 2>0.5,表明文章的高頻特征詞聚類顯著且合理。
圖2 國家圖書館文創(chuàng)產(chǎn)品用戶在線評論高頻特征詞聚類圖譜
聚類共提取出包括“#0送給”“#1適合”“#2材料”“#3客服”“#4質(zhì)量”“#5更好”“#6退貨”“#7產(chǎn)品”“#8質(zhì)感”“#9朋友”“#10顏色”“#11入手”“#12打開”和“#13設計”14個聚類標簽。聚類圖譜中,每個聚類標簽都由多個緊密聯(lián)系的特征詞組成,且各類之間互相聯(lián)系。為方便對圖2聚類圖譜進行分析解讀,導出各聚類模塊規(guī)模、輪廓值和主要主題詞,詳細信息見表2。
表2 國家圖書館文創(chuàng)產(chǎn)品用戶在線評論高頻特征詞聚類信息
2.2.3 主題歸納
為進一步歸納國家圖書館文創(chuàng)產(chǎn)品用戶在線評論主題分布,還需對特征詞聚類結(jié)果進行梳理和總結(jié)。首先,由于聚類“#7產(chǎn)品”側(cè)重于用戶對國家圖書館文創(chuàng)產(chǎn)品的整體描述,因此,將該主題下“材質(zhì)”“外觀”“品質(zhì)”“物流”等核心特征詞劃分至相應聚類中;其次,將聚類主題詞表(表2)中部分詞特征詞進行適當調(diào)整,修正聚類結(jié)果;最后,在聚類主題詞表中補入相關(guān)主題的高頻特征詞。最終,文章結(jié)合特征詞聚類結(jié)果和高頻特征詞將國家圖書館文創(chuàng)產(chǎn)品在線評論主題歸納為3類:產(chǎn)品設計、產(chǎn)品品質(zhì)和商家服務,如圖3所示。
圖3 國家圖書館文創(chuàng)產(chǎn)品用戶在線評論主題歸納
(1)產(chǎn)品設計。結(jié)合主題聚類和評論文本分析發(fā)現(xiàn),用戶對國家圖書館文創(chuàng)產(chǎn)品在產(chǎn)品設計方面的討論主要圍繞在5個話題展開:①文化寓意。作為國家圖書館文化創(chuàng)意產(chǎn)品,文化內(nèi)涵不可避免地成為用戶關(guān)注焦點。②產(chǎn)品用途。產(chǎn)品實用性是用戶對國家圖書館文創(chuàng)產(chǎn)品購買意愿的重要影響因素之一。③產(chǎn)品細節(jié)。內(nèi)容、尺寸和裝幀等產(chǎn)品細節(jié)既是國家圖書文創(chuàng)產(chǎn)品設計的重要體現(xiàn),也是其作為一般商品的評價指標。④社交屬性。在產(chǎn)品設計中融合文化內(nèi)涵的國家圖書館文創(chuàng)產(chǎn)品經(jīng)常作為禮品出現(xiàn)在社交場景中。⑤顏色外觀。用戶對國家圖書館文創(chuàng)產(chǎn)品文化屬性的感知通常源于其極具藝術(shù)性的顏色或外觀。綜合來看,用戶對國家圖書館文創(chuàng)產(chǎn)品設計的總體期待是——兼具文化內(nèi)涵與實用價值。
(2)產(chǎn)品品質(zhì)。在國家圖書館文創(chuàng)產(chǎn)品的用戶在線評論中,關(guān)于產(chǎn)品品質(zhì)的評價主要集中在4個主題:①質(zhì)量與價格。用戶對國家圖書館文創(chuàng)產(chǎn)品的質(zhì)量、價格和做工進行評價,衡量該產(chǎn)品是否值得購買或再次購買。②產(chǎn)品材料。部分用戶關(guān)注國家圖書館文創(chuàng)產(chǎn)品材料、材質(zhì)等影響產(chǎn)品品質(zhì)的因素。③產(chǎn)品工藝。部分用戶關(guān)注國家圖書館文創(chuàng)產(chǎn)品的制作工藝。④產(chǎn)品質(zhì)感。產(chǎn)品質(zhì)感是國家圖書館文創(chuàng)產(chǎn)品設計和制作的綜合體現(xiàn),是用戶對國家圖書館文創(chuàng)產(chǎn)品整體樣式、檔次和風格的主觀感受。綜合以上4個主題的特點,在產(chǎn)品設計的基礎上,用戶更關(guān)注國家圖書館文創(chuàng)產(chǎn)品設計的完成度及最終呈現(xiàn)的品質(zhì)。
(3)商家服務。用戶在該主題中的討論主要表現(xiàn)在4個方面:客服服務、物流服務、營銷策略、開箱體驗。其中,客服服務和物流服務是電商評論中較為常見的主題,前者主要包括客服回復的及時性、態(tài)度和解答問題的專業(yè)性等話題;后者主要包含物流的服務態(tài)度、時效性、包裝質(zhì)量和運輸?shù)确矫??!盃I銷策略”主題下用戶評論主要反映了用戶對國家圖書館文創(chuàng)產(chǎn)品在產(chǎn)品描述和營銷活動等經(jīng)營策略方面的關(guān)注。而“開箱體驗”主題表現(xiàn)了用戶在收到國家圖書館文創(chuàng)產(chǎn)品實物的第一感官體驗,反映的是實物和用戶期待之間的落差感,是商家服務帶給用戶的特殊購物體驗。綜上,用戶對國家圖書館文創(chuàng)產(chǎn)品商家服務的評價范圍與一般電商評論較為相似。
文章選擇經(jīng)評論數(shù)據(jù)預訓練的SnowNLP庫進行在線評論情感分析。SnowNLP庫的情感分析取值表達為“這句話代表正面情感的概率”[7],情感分值分布在區(qū)間[0,1]內(nèi),分值越接近于1,表示該評論情感傾向越積極,反之則越消極。首先,以標點符號為標識將國家圖書館文創(chuàng)產(chǎn)品用戶在線評論切分成短句,并劃分至相應主題;其次,使用SnowNLP分別計算“產(chǎn)品設計”“產(chǎn)品品質(zhì)”和“商家服務”3個主題用戶情感分值;最后,分別計算各主題0.5分上下的評論比例和平均情感分值(表3),并繪制各主題情感分值區(qū)間圖,如圖4所示。
表3 用戶在線評論主題情感分值分布
圖4 國家圖書館文創(chuàng)產(chǎn)品主題情感分布區(qū)間圖
在產(chǎn)品設計方面,由表3可知,用戶對國家圖書館文創(chuàng)產(chǎn)品滿意度較高,平均情感分值達到0.745分,其中超過0.5分的評論占86.4%。在圖4中,情感分值分布于(0.5,1.0]的評論數(shù)量占比隨情感分值上漲而增加,且情感分值大于0.8的評論比例較高,說明大多數(shù)用戶對國家圖書館文創(chuàng)產(chǎn)品的產(chǎn)品設計比較滿意,愿意給予積極評價。
在產(chǎn)品品質(zhì)方面,用戶評論的平均情感分值為0.683,其中75.3%評論情感分值超過0.5分。盡管整體上看,用戶評論文本情感呈積極傾向,但是消極評價(24.7%)的比例較“產(chǎn)品設計”主題(13.6%)高出近1倍。結(jié)合產(chǎn)品品質(zhì)特征詞來看,用戶評論中出現(xiàn)頻次較高的消極評價詞語為:“瑕疵”“壞了”和“褪色”等,說明國家圖書館文創(chuàng)產(chǎn)品在產(chǎn)品品質(zhì)控制方面有待提升。
在商家服務方面,用戶評論的平均情感分值遠低于另外兩個主題,僅為0.531分,其中超過0.5分的評論僅占相關(guān)評論的56.6%。此外,圖4中關(guān)于商家服務的評論情感分值分布更加直觀地表明國家圖書館文創(chuàng)產(chǎn)品商家服務用戶滿意度較低,且兩極分化嚴重。結(jié)合評論文本發(fā)現(xiàn),關(guān)于“商家服務”主題的消極評價主要集中在3個方面:一是商家在與用戶溝通過程中未能及時滿足用戶需求,如咨詢和退換貨等問題;二是用戶對產(chǎn)品實物與商家描述存在的差異表示不滿;三是物流服務質(zhì)量不高,如服務態(tài)度、時效性和快遞包裝等。
基于以上用戶體驗分析,文章從產(chǎn)品設計、產(chǎn)品品質(zhì)和商家服務3個方面對國家圖書館文創(chuàng)產(chǎn)品提升用戶體驗提出改進建議。
(1)優(yōu)化產(chǎn)品設計,塑造品牌價值。當前國內(nèi)公共圖書館文創(chuàng)產(chǎn)品與其他文化機構(gòu)文創(chuàng)產(chǎn)品相比,種類極為相似、產(chǎn)品類型趨于同質(zhì)化,產(chǎn)品的功能和外觀形態(tài)缺少創(chuàng)新性,具有深層次內(nèi)涵和意蘊式設計的產(chǎn)品數(shù)量較少。因此,國家圖書館在進行文創(chuàng)產(chǎn)品設計時,應以文化價值為主導,充分發(fā)揮自身文化職能優(yōu)勢,借鑒現(xiàn)代設計學理念,注重文化內(nèi)涵和實用價值的統(tǒng)一,致力于打造圖書館文創(chuàng)精品、塑造圖書館品牌價值。
(2)嚴控產(chǎn)品品質(zhì),提升用戶體驗。在主題挖掘和情感分析中,國家圖書館文創(chuàng)產(chǎn)品用戶重視文創(chuàng)產(chǎn)品質(zhì)量、材料、工藝和質(zhì)感等影響產(chǎn)品品質(zhì)的因素,尤其是產(chǎn)品質(zhì)量,評論中出現(xiàn)了部分負面評價。因此,要確保文創(chuàng)產(chǎn)品品質(zhì),國家圖書館必須做好“守門員”,扼守影響產(chǎn)品品質(zhì)的重要關(guān)口,嚴格控制文創(chuàng)產(chǎn)品品質(zhì),切實提升用戶體驗,確保產(chǎn)品設計中的文化內(nèi)涵能以最好的狀態(tài)呈現(xiàn),保護國家圖書館品牌的口碑。
(3)提升服務水平,回應用戶訴求。在國家圖書館文創(chuàng)產(chǎn)品用戶在線評論“商家服務”主題情感分析中,消極評價較多,口碑兩極分化嚴重。因此,國家圖書館文創(chuàng)產(chǎn)品運營團隊應切實提升服務水平,將圖書館“用戶為中心”的服務理念引入文創(chuàng)產(chǎn)品運營服務中,主動融入市場環(huán)境,積極響應用戶訴求,扎實推進服務質(zhì)量提升,發(fā)揚圖書館人的服務精神。
如今,創(chuàng)新已經(jīng)成為社會發(fā)展和進步的重要驅(qū)動力之一。應用創(chuàng)新要求“以用戶為中心”,不斷挖掘用戶需求、優(yōu)化用戶體驗,為用戶提供更優(yōu)質(zhì)的產(chǎn)品和服務。文章以天貓平臺“國家圖書館旗艦店”為例,通過挖掘用戶評論主題,分析用戶對各個主題的情感傾向,剖析了用戶對國家圖書館文創(chuàng)產(chǎn)品的需求點和期待點。經(jīng)過驗證,融合主題挖掘與情感分析的用戶體驗分析方法在感知用戶體驗、挖掘用戶需求方面具有良好的效果,對商家的創(chuàng)新活動具有指導意義,對其他用戶體驗研究具有借鑒價值。