摘要:【目的】通過對用戶在線評論數(shù)據(jù)進(jìn)行分析,幫助企業(yè)準(zhǔn)確識別并深入理解用戶需求?!痉椒ā繕?gòu)建了基于在線評論和量化Kano模型的用戶需求識別方法,首先運(yùn)用LDA模型對用戶在線評論進(jìn)行主題聚類,然后分別利用BosonNLP和文本挖掘技術(shù)計(jì)算用戶滿意度和用戶關(guān)注度指標(biāo),最后基于這2個(gè)指標(biāo)構(gòu)建量化Kano模型實(shí)現(xiàn)對用戶不同需求的識別與分類?!窘Y(jié)果】以小米社區(qū)為案例進(jìn)行實(shí)驗(yàn)。結(jié)果表明,用戶在不同產(chǎn)品屬性的關(guān)注度和滿意度上存在顯著差異,屏幕大小和應(yīng)用生態(tài)兼容性屬于必備型需求,電池續(xù)航屬于魅力型需求,系統(tǒng)流暢屬于期望型需求,拍照清晰度和外觀顏色屬于無差異型需求?!窘Y(jié)論】本方法突破了傳統(tǒng)調(diào)研主觀性較強(qiáng)的局限,為企業(yè)提升用戶滿意度和優(yōu)化資源配置提供了數(shù)據(jù)驅(qū)動的決策依據(jù)。
關(guān)鍵詞:在線評論;用戶需求;LDA模型;Kano模型
DOI編碼:10.3969/j.issn.1674-5698.2025.06.006
0引言
隨著市場競爭的日益激烈和消費(fèi)者需求的不斷升級,企業(yè)必須轉(zhuǎn)變傳統(tǒng)的產(chǎn)品導(dǎo)向思維,轉(zhuǎn)而以客戶為中心,深入了解消費(fèi)者的真實(shí)需求?;ヂ?lián)網(wǎng)和信息技術(shù)的不斷發(fā)展,使在線評論成為企業(yè)了解消費(fèi)者訴求的重要途徑[1]。這些評論不僅包含了用戶對產(chǎn)品的直觀評價(jià),還反映了用戶的實(shí)際需求和期望。然而,面對在線社區(qū)海量用戶數(shù)據(jù),企業(yè)在用戶需求的挖掘、識別與轉(zhuǎn)化過程中面臨多重挑戰(zhàn)。例如,傳統(tǒng)需求提取方法(如問卷調(diào)查、焦點(diǎn)小組等)受限于樣本規(guī)模小、主觀性強(qiáng)等因素,難以有效捕捉評論中潛在的用戶需求信息[2-3]。此外,隨著市場環(huán)境的快速變化,用戶需求日益呈現(xiàn)個(gè)性化、多樣化的特征,進(jìn)一步加劇了需求識別的復(fù)雜度,從而限制了企業(yè)對用戶需求的全面理解與高效轉(zhuǎn)化。因此,如何基于在線評論挖掘并識別用戶潛在需求,從而提升用戶滿意度和忠誠度,增強(qiáng)企業(yè)競爭力成為企業(yè)亟待解決的重要問題。
現(xiàn)有用戶需求識別研究中,基于Kano模型的需求分類方法得到了廣泛地應(yīng)用[4-6]。Kano模型能夠?qū)⒂脩粜枨髣澐譃椴煌悇e,從而幫助企業(yè)和組織更好地理解用戶期望、優(yōu)化產(chǎn)品和服務(wù)。然而,傳統(tǒng)Kano模型因依賴問卷調(diào)查而存在主觀性較強(qiáng)、假設(shè)條件較多的局限性。面對海量的在線評論數(shù)據(jù),傳統(tǒng)方法難以有效處理非結(jié)構(gòu)化文本信息和準(zhǔn)確識別用戶需求。針對這一問題,既有研究嘗試將Kano模型與情感分析、主題模型和文本挖掘等技術(shù)結(jié)合,從在線評論中提取結(jié)構(gòu)化需求信息。例如,李賀等[7]運(yùn)用主題模型對在線評論展開聚類分析,以此挖掘產(chǎn)品特征。在此基礎(chǔ)上,他們借助Kano模型設(shè)計(jì)調(diào)查問卷,有效識別出了用戶需求要素。王軍等[8]以用戶在線評論為基礎(chǔ),利用模糊Kano模型對需求文本進(jìn)行分類,再結(jié)合逼近理想解排序法(TOPSIS)對魅力型需求指標(biāo)重要度進(jìn)行優(yōu)先級排序,從而得到合理的設(shè)計(jì)依據(jù)。盡管Kano模型能夠從在線評論中有效獲取用戶需求信息,但上述研究本質(zhì)上是基于Kano問卷的假設(shè),即能夠獲取用戶在缺少某產(chǎn)品屬性時(shí)的滿意度水平。然而在實(shí)際應(yīng)用中,由于用戶對產(chǎn)品的需求和期望是動態(tài)且復(fù)雜的,研究者很難直接獲取用戶在完全缺失某產(chǎn)品屬性時(shí)的真實(shí)滿意度水平。
鑒于此,為了突破傳統(tǒng)Kano模型依賴假設(shè)的局限性,本文提出一種基于在線評論和量化Kano模型的用戶需求識別方法。首先,利用隱含狄利克雷分布(LatentDirichletAllocation,LDA)模型對用戶評論進(jìn)行聚類,提取需求維度;其次,基于BosonNLP深度學(xué)習(xí)模型的情感分析方法,通過其特有的領(lǐng)域自適應(yīng)能力和語義理解優(yōu)勢,提升情感分析中用戶滿意度估計(jì)的準(zhǔn)確性,通過用戶滿意度和需求關(guān)注度2個(gè)指標(biāo)構(gòu)建Kano模型,實(shí)現(xiàn)Kano模型的量化;最后,將該方法運(yùn)用于小米社區(qū)手機(jī)產(chǎn)品的用戶需求的識別中,實(shí)現(xiàn)對必備型、期望型、魅力型和無差異型用戶需求的分類和理解。通過該方法的應(yīng)用,以期幫助企業(yè)制定優(yōu)先順序,從而合理分配資源,優(yōu)化產(chǎn)品和服務(wù),增強(qiáng)市場競爭力,推動持續(xù)創(chuàng)新。
1Kano模型相關(guān)研究
Kano模型[9]是日本著名質(zhì)量管理專家狩野紀(jì)昭(NoriakiKano)于1984年建立的產(chǎn)品質(zhì)量特性滿足狀況與用戶滿意程度的雙維度認(rèn)知模型。Kano模型是一種對用戶需求分類和優(yōu)先排序的工具,以分析用戶需求對用戶滿意的影響為基礎(chǔ),體現(xiàn)了產(chǎn)品性能與用戶滿意之間的非線性關(guān)系[10]。Kano模型通過探究用戶需求與滿意度之間的關(guān)系能夠?qū)崿F(xiàn)對用戶需求的分類。如圖1所示,Kano模型將需求劃分為5類,分別是期望型需求、魅力型需求、必備型需求、無差異型需求和反向型需求。
利用Kano模型進(jìn)行用戶需求識別的過程需要結(jié)合問卷調(diào)查的方法來實(shí)現(xiàn)。首先,通過針對每個(gè)功能點(diǎn)設(shè)計(jì)正向和負(fù)向2個(gè)問題。正向問題測量的是提供某屬性時(shí)用戶的滿意程度,負(fù)向問題測量的是不提供某屬性時(shí)用戶產(chǎn)生的不滿。問卷中一般采用5級選項(xiàng),按照喜歡、理應(yīng)如此、無所謂、勉強(qiáng)接受、不喜歡進(jìn)行評價(jià)。其次,收集用戶對各個(gè)功能點(diǎn)的評價(jià),并將用戶的回答按照Kano模型的分類標(biāo)準(zhǔn)進(jìn)行編碼,根據(jù)Kano模型評價(jià)結(jié)果分類對照表判斷需求類別,如表1所示。最后,基于表1給出的評價(jià)結(jié)果分類對照表,結(jié)合式(1)和式(2)計(jì)算出Better-Worse系數(shù),用于表示某屬性能夠增加滿意或者消除不滿意的程度,確定各屬性的優(yōu)先級。Better-Worse系數(shù)計(jì)算公式如下:
Better(SI)=(A+O)/(A+O+M+I)(1)
Worse(DSI)=-(O+M)/(A+O+M+I)(2)
式中:A、O、M、I分別代表魅力型需求、期望型需求、必備型需求和無差異型需求的數(shù)量占比;Better系數(shù)代表增加后的滿意系數(shù),Better值越大表示對用戶滿意的影響越大;Worse系數(shù)代表消除后的不滿意系數(shù),其數(shù)值通常為負(fù),Worse值越接近-1,表明對用戶不滿意造成的影響最大。根據(jù)Better-Worse系數(shù),可以將各個(gè)需求分為4個(gè)象限進(jìn)行分析,Better-Worse系數(shù)分析如圖2所示。
Kano模型常用于識別用戶需求屬性,能夠幫助團(tuán)隊(duì)更深入地了解用戶需求,找出影響用戶滿意度的最核心需求要素。例如,熊回香等[11]利用Kano模型設(shè)計(jì)調(diào)查問卷對健康網(wǎng)站進(jìn)行用戶需求獲取與分析,采用Better-Worse系數(shù)分析法進(jìn)行用戶需求關(guān)鍵信息服務(wù)質(zhì)量要素提取。譚春輝等[12]通過設(shè)計(jì)Kano問卷,分別采用Kano模型歸類、混合類分析和Better-Worse系數(shù)分析,實(shí)現(xiàn)對用戶需求類型的界定。Kano模型適用范圍廣泛,能夠幫助企業(yè)更好地管理和解決用戶需求的沖突。然而,傳統(tǒng)Kano模型由于依賴問卷而對調(diào)查設(shè)計(jì)要求高,并且在一定程度上存在主觀性缺陷[13]。隨著互聯(lián)網(wǎng)和社交媒體的普及,在線評論作為一種新興的用戶反饋形式,已經(jīng)成為企業(yè)了解用戶需求、獲取產(chǎn)品設(shè)計(jì)創(chuàng)意和提升產(chǎn)品質(zhì)量的重要數(shù)據(jù)來源[14]。
為突破傳統(tǒng)Kano模型問卷調(diào)查方法在數(shù)據(jù)規(guī)模和主觀性方面的局限性,近年來,學(xué)者們開始探索將海量在線評論文本數(shù)據(jù)與經(jīng)典Kano模型相融合的創(chuàng)新方法,為用戶需求的識別與分類提供新的可能性。例如,Bi等[15]提出一種基于集成神經(jīng)網(wǎng)絡(luò)和基于效果的Kano模型的在線評論數(shù)據(jù)挖掘方法,通過支持向量機(jī)(SVM)對用戶需求進(jìn)行情感分析,在此基礎(chǔ)上利用Kano模型將用戶需求劃分為不同類別。王克勤等[16]提出基于在線評論挖掘的用戶需求識別與演化分析模型,將SnowNLP模型、Kano模型與LDA模型相結(jié)合,為用戶需求分析與預(yù)測以及后續(xù)的產(chǎn)品改進(jìn)研究提供參考價(jià)值。
綜上所述,基于在線評論與Kano模型的融合方法已經(jīng)在用戶需求識別領(lǐng)域取得顯著進(jìn)展。這一方法不僅通過自然語言處理技術(shù)實(shí)現(xiàn)了非結(jié)構(gòu)化評論文本向結(jié)構(gòu)化需求特征的轉(zhuǎn)換,還突破了傳統(tǒng)Kano模型的主觀假設(shè),使需求識別過程具備數(shù)據(jù)規(guī)模性與客觀性。然而,現(xiàn)有研究對用戶情感的測量仍存在一定局限性。例如,傳統(tǒng)情感詞典方法難以適應(yīng)動態(tài)變化的網(wǎng)絡(luò)表達(dá)。網(wǎng)絡(luò)用語不斷涌現(xiàn),情感詞典需要不斷更新擴(kuò)展以提高分類的準(zhǔn)確率[17]。而機(jī)器學(xué)習(xí)模型通常需要大量標(biāo)注數(shù)據(jù)來訓(xùn)練與評估,導(dǎo)致其過度依賴特定領(lǐng)域或標(biāo)注者的主觀判斷,限制其在其他領(lǐng)域或不同群體中的泛化能力[18]。這些弊端可能降低用戶情感分析的準(zhǔn)確性,從而影響結(jié)果的可靠性。因此,本文基于BosonNLP構(gòu)建情感分析模型,結(jié)合其基于大規(guī)模語料訓(xùn)練的語義理解能力,以提升情感分類的準(zhǔn)確性和適應(yīng)性。同時(shí)借助BosonNLP的領(lǐng)域自適應(yīng)調(diào)整進(jìn)一步優(yōu)化情感詞典和特征權(quán)重,彌補(bǔ)現(xiàn)有研究在用戶情感分析方面的不足,使情感分析結(jié)果更為細(xì)致精準(zhǔn),為構(gòu)建數(shù)據(jù)驅(qū)動的用戶需求識別提供方法論支撐。
2研究方法
本文提出基于在線評論和量化Kano模型的用戶需求識別方法。首先,利用LDA模型從非結(jié)構(gòu)化文本中發(fā)現(xiàn)潛在主題,初步提取2類用戶的需求;其次,構(gòu)建用戶滿意度與用戶關(guān)注度2個(gè)指標(biāo)為用戶需求分析提供基礎(chǔ);最后,利用量化Kano模型實(shí)現(xiàn)對用戶需求分類。
2.1LDA主題模型
主題模型是一種無監(jiān)督學(xué)習(xí)方法,能夠從大量文本數(shù)據(jù)中識別出潛在的主題結(jié)構(gòu)。該模型認(rèn)為:1篇文檔的生成需要通過一定的概率選取某個(gè)主題,并在該主題下以一定的概率選取某個(gè)詞匯,進(jìn)而生成該文檔的第1個(gè)詞,不斷重復(fù)這個(gè)過程就生成了整篇文章。在某篇文檔中,每個(gè)詞匯出現(xiàn)概率的計(jì)算公式如下:
在現(xiàn)有的主題模型中,Blei[19]于2003年提出的LDA模型因在處理大規(guī)模文本數(shù)據(jù)上的優(yōu)勢,成為文本主題識別的首選方法之一。LDA模型在PLSA的基礎(chǔ)上加入了Dirichlet先驗(yàn)分布,是1種無監(jiān)督的三層貝葉斯概率模型,能夠有效地識別和提取文本中的主題信息,其結(jié)構(gòu)如圖3所示。
LDA模型的生成過程主要包含以下兩步:
(1)根據(jù)Dirichlet先驗(yàn)參數(shù)α和β,分別生成每個(gè)文檔的主題分布θm和每個(gè)主題的詞匯分布φk;
(2)對于各文檔中的每個(gè)詞匯,先從文檔的主題分布θm中選擇1個(gè)主題Zm,n,再從該主題的詞匯分布φk中選擇1個(gè)詞Wm,n。通過上述過程的不斷迭代直至遍歷文檔中的每一個(gè)詞,可以學(xué)習(xí)到文檔集中的主題結(jié)構(gòu)和每個(gè)主題的詞匯分布,從而實(shí)現(xiàn)對文本數(shù)據(jù)的語義分析和主題建模。LDA模型的基本實(shí)現(xiàn)過程如圖4所示。
圖4中,α和β分別為“文檔-主題”和“主題-詞匯”分布的Dirichlet先驗(yàn)參數(shù),是基于經(jīng)驗(yàn)給出的。θm為第m個(gè)文檔中各個(gè)主題的概率分布,φk為第k個(gè)主題下各詞匯的概率分布,Zm,n為第m個(gè)文檔中第n個(gè)詞匯Wm,n的主題,Nm為第m個(gè)文檔中詞的數(shù)量,M為文檔數(shù),K為主題數(shù)。
2.2量化Kano模型
假設(shè)P為產(chǎn)品屬性集合,定義為P={1,2,…,n};Q為用戶評論集合,定義為Q={1,2,…,m}。用戶滿意度Si為用戶對第i個(gè)產(chǎn)品屬性的平均情感度值,Qi為用戶對第i個(gè)產(chǎn)品屬性的評論總數(shù)。Si計(jì)算公式為:
式中:Sij為第i條評論中對第j個(gè)產(chǎn)品屬性的情感度值,j=1,2,…,m;Si為用戶對不同產(chǎn)品屬性的整體滿意程度,值越大說明第i個(gè)屬性上用戶的整體滿意度高,反之,用戶對第i個(gè)產(chǎn)品屬性上整體滿意度低。
本文使用BosonNLP對用戶的在線評論進(jìn)行情感分析。BosonNLP是1個(gè)專門為社交媒體情感分析設(shè)計(jì)的詞庫,其基于深度學(xué)習(xí)技術(shù)構(gòu)建,擁有強(qiáng)大的語言理解能力和高效的運(yùn)算性能,特別適合大規(guī)模文本數(shù)據(jù)的處理[20]。同時(shí),該詞庫來源于社交媒體文本,經(jīng)過精心整理和標(biāo)注,適用于處理基于在線評論的情感分析任務(wù)。因此,本文基于BosonNLP構(gòu)建情感分析模型來計(jì)算用戶的情感度,情感分析過程如圖5所示。
從圖5的情感分析過程可知,本文將用戶評論數(shù)據(jù)轉(zhuǎn)化為用戶的情感度值。當(dāng)情感度值大于0時(shí),表明用戶具有正向情感;反之,用戶具有負(fù)向情感。用戶對于產(chǎn)品屬性的改進(jìn)需求不僅依賴于用戶的情感傾向和滿意程度,還應(yīng)考慮用戶對屬性的關(guān)注度[21]。在線社區(qū)中,用戶對產(chǎn)品屬性評論數(shù)量的多少可用來反映其對該屬性的關(guān)注程度,提及屬性的頻次越高,用戶關(guān)注度越高。由此,本文構(gòu)建關(guān)注度指標(biāo)Gi,計(jì)算公式為:
式中:QA為評論總數(shù)。通過計(jì)算用戶對第i個(gè)產(chǎn)品屬性的評論數(shù)量占評論總數(shù)的比例,可以了解該產(chǎn)品屬性在用戶中的受關(guān)注水平。
基于此,本文引入用戶滿意度指標(biāo)和用戶關(guān)注度指標(biāo)構(gòu)建量化Kano模型,通過對這2個(gè)指標(biāo)的量化分析能夠?qū)崿F(xiàn)對用戶需求的分類,分類結(jié)果如表2所示。
(1)必備型需求(M),用戶滿意度高且關(guān)注度高。用戶認(rèn)為這類屬性是產(chǎn)品必須具備的基本功能,構(gòu)成了滿意度的基礎(chǔ),因此其滿意度一般較高,通常高于產(chǎn)品屬性的平均滿意度。這類屬性的用戶滿意度提升空間有限,但如果這類屬性缺失或表現(xiàn)不佳,用戶的滿意度會急劇下降。而即便這些需求得到滿足,用戶滿意度也不會顯著提高。同時(shí),產(chǎn)品的必備屬性也是用戶關(guān)注的焦點(diǎn),往往會被大多數(shù)用戶提及。
(2)期望型需求(O),用戶關(guān)注度高但滿意度低。用戶對這類屬性抱有較高期待,所以具有較高的關(guān)注度,但現(xiàn)有產(chǎn)品未能達(dá)到用戶內(nèi)心預(yù)期,導(dǎo)致其滿意度低于平均水平。用戶對此類屬性的滿意狀況與需求的滿足程度線性相關(guān)。企業(yè)提供產(chǎn)品的這類屬性實(shí)施得越好,用戶就越滿意;反之,若這些需求未被滿足,則會導(dǎo)致滿意度下降。
(3)魅力型需求(A),用戶滿意度高但關(guān)注度低。魅力屬性是令用戶超出預(yù)期、意想不到的功能,其存在與否對用戶滿意度的影響呈現(xiàn)出顯著的不對稱性。滿足此類需求能夠激發(fā)用戶強(qiáng)烈的情感滿足感和對產(chǎn)品的積極情緒,但不提供此需求,用戶滿意度也不會顯著下降。這類屬性往往給用戶帶來出乎意料的驚喜,但因?yàn)槠洳⒎怯脩糁鲃雨P(guān)注的重點(diǎn),因此被提及的次數(shù)較少。
(4)無差異型需求(I),用戶滿意度和關(guān)注度均較低。這類產(chǎn)品屬性對用戶滿意度幾乎沒有影響,用戶對此類屬性的存在感到無關(guān)緊要。雖然這類屬性在理論上存在一定的滿意度提升空間,但由于用戶本身并不特別在意,因此優(yōu)化這類屬性對整體用戶滿意度的提升作用有限。至此,本文構(gòu)建了基于用戶在線評論的量化Kano模型,通過計(jì)算用戶滿意度與用戶關(guān)注度能夠?qū)崿F(xiàn)對不同用戶需求的分類和分析。
3基于小米社區(qū)的用戶需求識別研究
小米社區(qū)是小米公司推出的一個(gè)在線社區(qū)平臺,旨在為用戶提供一個(gè)交流、分享和學(xué)習(xí)的平臺,于2011年8月1日正式對外上線,目前有注冊用戶超過3000萬人。小米社區(qū)包括多個(gè)板塊,涵蓋小米產(chǎn)品的使用、維修、購買等方面的內(nèi)容,同時(shí)也包括了用戶交流、分享心得、提出問題等方面的內(nèi)容。小米公司通過每天、每周、每月面向社區(qū)中不同的用戶群體迭代不同MIUI系統(tǒng)版本的形式,獲取大量用戶需求、反饋和建議等信息,提升其產(chǎn)品迭代創(chuàng)新的速度[22]。作為一個(gè)在線社區(qū),小米社區(qū)不僅為用戶提供了一個(gè)交流和學(xué)習(xí)的平臺,同時(shí)也為小米公司提供了一個(gè)與用戶溝通和互動的渠道,從而更好地了解用戶需求和反饋。本文以小米社區(qū)為例,對提出的用戶需求識別方法和框架進(jìn)行驗(yàn)證。
3.1數(shù)據(jù)挖掘情況
采用網(wǎng)絡(luò)爬蟲技術(shù),系統(tǒng)采集小米社區(qū)各產(chǎn)品板塊的用戶評論數(shù)據(jù),數(shù)據(jù)采集時(shí)間跨度為2024年1月至2024年12月。在數(shù)據(jù)預(yù)處理階段,首先對原始數(shù)據(jù)進(jìn)行為期2個(gè)月的觀察與分析,隨后剔除無效用戶發(fā)布的評論內(nèi)容,并過濾廣告等非實(shí)質(zhì)性評論信息。經(jīng)過上述數(shù)據(jù)清洗過程,最終獲得有效評論樣本6246條。本文收集的用戶在線評論數(shù)據(jù)如表3所示。
3.2基于LDA模型的主題聚類
根據(jù)2.1節(jié)中LDA主題建模方法,對收集到的6246條手機(jī)產(chǎn)品用戶評論數(shù)據(jù)進(jìn)行主題聚類,提取每個(gè)主題最具有代表性的10個(gè)詞。聚類結(jié)果及每個(gè)主題下的關(guān)鍵詞如表4所示。
由表4主題聚類分析結(jié)果中的“主題-關(guān)鍵詞”矩陣可知,用戶需求主要被分為6類。主題1的關(guān)鍵詞為折疊、直屏、技術(shù)、屏幕等,主要表達(dá)了消費(fèi)者對于屏幕的需求。主題2的關(guān)鍵詞為系統(tǒng)、開源、支持、功能、內(nèi)測等,主要表達(dá)了消費(fèi)者對于手機(jī)性能和操作系統(tǒng)的需求。主題3的關(guān)鍵詞為玩游戲、輕薄、追劇、視頻等,主要表達(dá)了消費(fèi)者對豐富的應(yīng)用程序生態(tài)系統(tǒng)的期望。主題4的關(guān)鍵詞為電池、續(xù)航等,主要表達(dá)了用戶對電池壽命的需求。主題5的關(guān)鍵詞為顏色、手感、時(shí)尚等,主要反映了用戶對外觀的需求。主題6的關(guān)鍵詞為拍、徠卡等,主要表達(dá)了用戶對手機(jī)相機(jī)和拍攝的需求。
根據(jù)上述主題聚類的結(jié)果,不僅可以快速了解用戶評論文本數(shù)據(jù)的整體結(jié)構(gòu),還能夠直觀地理解每個(gè)主題所關(guān)注的具體內(nèi)容,幫助深入了解不同用戶的具體關(guān)注點(diǎn),從而制定更個(gè)性化的產(chǎn)品策略。
3.3基于量化Kano模型的用戶需求分類
(1)為了更準(zhǔn)確地識別用戶需求,根據(jù)小米社區(qū)中給出的產(chǎn)品屬性相關(guān)信息,結(jié)合表4中的主題關(guān)鍵詞進(jìn)行歸類。然后提取出用戶在使用時(shí)經(jīng)常感知到對6類產(chǎn)品屬性上的需求:屏幕大小、系統(tǒng)流暢、拍照清晰度、電池續(xù)航、外觀顏色、應(yīng)用生態(tài)兼容性。用戶需求及表述詞如表5所示。
(2)借助Python中的jieba工具處理6246條用戶在線評論數(shù)據(jù)。經(jīng)過分詞、詞性標(biāo)注、去除停用詞等步驟,得到表6所示的用戶評論中與用戶需求相關(guān)的關(guān)鍵詞及詞頻信息。
(3)為了計(jì)算用戶關(guān)注度Gi和用戶滿意度Si,本文進(jìn)一步統(tǒng)計(jì)了各產(chǎn)品屬性上的評論單句數(shù)量及情感度值。
1)用戶關(guān)注度(Gi)根據(jù)表5中定義的用戶需求及表述詞集合,本文對每條評論進(jìn)行人工分類標(biāo)注。在標(biāo)注過程中,每條評論單句被分配到1個(gè)與之相關(guān)的需求類別中,最終本文標(biāo)注用戶評論4642條,去除部分重復(fù)評論后共有效標(biāo)注評論4636條,標(biāo)注結(jié)果如表7所示。
根據(jù)表7標(biāo)注結(jié)果對評論數(shù)據(jù)進(jìn)行統(tǒng)計(jì),并結(jié)合式(5)計(jì)算每個(gè)屬性下的評論占比,以反映消費(fèi)者對不同產(chǎn)品屬性的關(guān)注程度。
2)用戶滿意度(Si)考慮到單條評論可能涉及多個(gè)產(chǎn)品屬性,首先對評論文本進(jìn)行切分處理,以確保切分后的評論單句僅包含單一用戶需求。然后,基于情感分析模型對用戶評論進(jìn)行情感分析,情感分析結(jié)果如表8所示。
(4)根據(jù)情感分析的結(jié)果,結(jié)合式(4)分別計(jì)算用戶對不同產(chǎn)品屬性的平均情感度值,以反映用戶對不同產(chǎn)品屬性的整體滿意度。至此,計(jì)算得到了用戶對不同產(chǎn)品屬性的關(guān)注度和滿意度,計(jì)算結(jié)果如表9所示。
將表9中計(jì)算得到的用戶滿意度和關(guān)注度值代入量化Kano模型,對用戶需求進(jìn)行分類,分類結(jié)果在圖6中,Gi和Si分別代表用戶關(guān)注度和滿意度的平均值。屏幕大小和應(yīng)用生態(tài)兼容性的Gi和Si都處于較高的區(qū)域,用戶對手機(jī)屏幕和應(yīng)用非常關(guān)注,且滿意度也較高,屬于必備型需求(M)。這表明當(dāng)前產(chǎn)品在屏幕和應(yīng)用上的表現(xiàn)已經(jīng)較好地滿足了用戶需求,提供該屬性不會對用戶滿意度造成顯著的影響。反之,未能提供此屬性的產(chǎn)品將會使用戶產(chǎn)生強(qiáng)烈的不滿。屏幕和應(yīng)用是用戶最關(guān)注且滿意度較高的特性,企業(yè)應(yīng)繼續(xù)保持高標(biāo)準(zhǔn)的設(shè)計(jì)和制造工藝,以維持用戶對這一特性的高滿意度。電池續(xù)航的Gi較高而Si較低,是1個(gè)魅力型需求(A)。用戶可能認(rèn)為優(yōu)秀的電池性能是1個(gè)超出他們基本期望的特性,在電池續(xù)航方面有很大的提升空間。企業(yè)可以考慮采用更大容量的電池或更高效的電源管理系統(tǒng)來提升電池續(xù)航,從而有效地提升用戶滿意度。系統(tǒng)流暢的Si較高而Gi較低,是1個(gè)期望型需求(O)。用戶認(rèn)為優(yōu)秀的操作系統(tǒng)是手機(jī)的基本要求,系統(tǒng)性能與用戶滿意度呈線性關(guān)系。如果系統(tǒng)表現(xiàn)不佳,會顯著降低他們的滿意度。對于手機(jī)系統(tǒng)的優(yōu)化,企業(yè)可以通過軟件更新、優(yōu)化系統(tǒng)資源管理等方式提高系統(tǒng)流暢性和穩(wěn)定性。除上述產(chǎn)品屬性之外的其余2個(gè)屬性拍照清晰度和外觀顏色是無差異型屬性(I),這些屬性的Gi和Si都較低,這些特性不是用戶的首要考慮因素。用戶可能對這些屬性不太關(guān)心,這些特性的改進(jìn)或惡化不會對用戶體驗(yàn)造成顯著影響。
4結(jié)語
針對現(xiàn)有用戶需求識別相關(guān)研究中存在數(shù)據(jù)來源局限于問卷和訪談等傳統(tǒng)形式、模型設(shè)定過度依賴假設(shè)條件和人為經(jīng)驗(yàn)的缺陷,本文提出了1種基于在線評論和量化Kano模型的用戶需求分類方法。首先,利用LDA模型從用戶在線評論中提取出用戶的真實(shí)需求;其次,本文基于BosonNLP深度學(xué)習(xí)模型的領(lǐng)域自適應(yīng)能力與大規(guī)模語料訓(xùn)練的語義理解優(yōu)勢,提升情感分析過程中用戶滿意度估計(jì)的準(zhǔn)確性;再次,通過關(guān)注度和滿意度2個(gè)指標(biāo)構(gòu)建了量化Kano模型,突破了傳統(tǒng)Kano問卷在“獲取不提供某屬性時(shí)用戶滿意度”的假設(shè)局限。最后,應(yīng)用小米社區(qū)的真實(shí)數(shù)據(jù)進(jìn)行案例研究。實(shí)驗(yàn)結(jié)果表明,用戶在不同屬性的關(guān)注度和滿意度上存在顯著差異,本文所提出的方法能夠有效挖掘用戶需求并區(qū)分需求類型,為企業(yè)精準(zhǔn)定位用戶需求提供了方法支持。
隨著人工智能和大數(shù)據(jù)技術(shù)的不斷發(fā)展,用戶需求識別的方法需要更加智能化和精準(zhǔn)化。在未來的研究中,企業(yè)應(yīng)進(jìn)一步細(xì)分用戶群體,根據(jù)不同用戶的需求特點(diǎn)來調(diào)整產(chǎn)品特性和營銷策略,提供定制化的產(chǎn)品和服務(wù)以滿足不同用戶的需求,從而更好地把握市場動態(tài),優(yōu)化產(chǎn)品設(shè)計(jì)和服務(wù)策略,在激烈的市場競爭中占據(jù)優(yōu)勢地位。
參考文獻(xiàn)
翟運(yùn)開,衛(wèi)東樂,路薇,等.考慮在線評論用戶關(guān)注度的產(chǎn)品改進(jìn)需求識別與分析:基于KANO-IPA模型[J].科技管理研究,2023,43(9):95-104.
趙宇晴,阮平南,劉曉燕,等.基于在線評論的用戶滿意度評價(jià)研究[J].管理評論,2020,32(3):179-189.
ZHANGM,SUNL,WANGGA,etal.Usingneutralsentimentreviewstoimprovecustomerrequirementidentificationandproductdesignstrategies[J].InternationalJournalofProductionEconomics,2022,254:108641.
申彥,劉春華.基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘[J].計(jì)算機(jī)技術(shù)與發(fā)展,2024,34(2):23-31.
趙華翠,劉偉豪,李秀琳,等.基于改進(jìn)KANO模型的5G智能手機(jī)顧客滿意影響因素分析[J].標(biāo)準(zhǔn)科學(xué),2021(6):69-75.
張立,張雪,文紀(jì)元.基于Kano模型的突發(fā)公共事件政務(wù)微博回應(yīng)與公眾信息需求適配性研究[J].情報(bào)探索,2024(2):33-40.
李賀,曹陽,沈旺,等.基于LDA主題識別與Kano模型分析的用戶需求研究[J].情報(bào)科學(xué),2021,39(8):3-11+36.
王軍,劉思邑.采用在線評論文本驅(qū)動的產(chǎn)品設(shè)計(jì)方法[J].機(jī)械設(shè)計(jì)與研究,2022,38(4):1-5+11.KANON.Attractivequalityandmust-bequality[J].TheJournalofJapaneseSocietyforQualityControl,1984,14(2):147-156.
王雪,董慶興,張斌.面向在線評論的用戶需求分析框架與實(shí)證研究:基于KANO模型[J].情報(bào)理論與實(shí)踐,2022,45(2):160-167.
熊回香,詹曉敏,鄭曉威.基于KANO-QFD集成方法的健康網(wǎng)站信息服務(wù)質(zhì)量優(yōu)化研究[J].情報(bào)理論與實(shí)踐,2024,47(8):160-170+179.
譚春輝,李玥澎.基于用戶評論與Kano模型的虛擬學(xué)術(shù)社區(qū)優(yōu)化策略研究[J].情報(bào)理論與實(shí)踐,2021,44(11):108-115.
孟慶良,鄒農(nóng)基,陳曉君,等.基于KANO模型的客戶隱性知識的顯性化方法及應(yīng)用[J].管理評論,2009,21(12):86-93.
張振剛,羅泰曄.基于在線評論數(shù)據(jù)挖掘和Kano模型的產(chǎn)品需求分析[J].管理評論,2022,34(11):109-117.
BIJW,LIUY,F(xiàn)ANZP,etal.Modellingcustomersatisfactionfromonlinereviewsusingensembleneuralnetworkandeffect-basedKanomodel[J].InternationalJournalofProductionResearch,2019,57(22):7068-7088.
王克勤,高智姣,喬亞楠,等.在線評論中的用戶需求識別及其演化趨勢挖掘[J].機(jī)械科學(xué)與技術(shù),2023,42(7):1070-1080.
鐘佳娃,劉巍,王思麗,等.文本情感分析方法及應(yīng)用綜述[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021,5(6):1-13.
王欽煬,施水才,王洪俊.文本情感分析綜述[J].軟件導(dǎo)刊,2025,24(1):193-202.
BLEID,NGA,JORDANM.LatentDirichletAllocation[J].JournalofMachineLearningResearch,2003(3):993-1022.
KERM,MACG,ZHAOTM,etal.BosonNLP:AnensembleapproachforwordsegmentationandPOStagging[C]//ProceedingsoftheInternationalConferenceonNaturalLanguageProcessingandChineseComputing.SwissConfederation:Springer,2015:520-526.
吳東勝,王忠群,蔣勝,等.基于評論的商品改進(jìn)需求獲取方法研究[J].長江大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,14(5):44-48+86.
劉嘉玲,魏江,陳俠飛.在線社區(qū)對企業(yè)創(chuàng)新管理影響研究回顧與展望[J].管理學(xué)報(bào),2022,19(8):1251-1260.