摘要:【目的】為改進(jìn)消費(fèi)品質(zhì)量和服務(wù)、提升消費(fèi)者滿意度和品牌競爭力提供依據(jù),助力消費(fèi)品市場(chǎng)有序健康發(fā)展?!痉椒ā恳?016—2021年從政府官方平臺(tái)獲取的23,736條投訴文本為基礎(chǔ),應(yīng)用BERTopic模型進(jìn)行主題挖掘,識(shí)別主要主題及演化趨勢(shì),并借助投訴主題網(wǎng)絡(luò)分析缺陷特征之間的關(guān)聯(lián)性。【結(jié)果】消費(fèi)品投訴主要集中在電子產(chǎn)品的質(zhì)量缺陷和售后服務(wù)不足,消費(fèi)者對(duì)手機(jī)電池問題導(dǎo)致的自動(dòng)關(guān)機(jī)關(guān)注度較高,投訴主題網(wǎng)絡(luò)揭示了投訴內(nèi)容之間的復(fù)雜關(guān)系,維修、售后等問題在網(wǎng)絡(luò)中占據(jù)橋梁地位,消費(fèi)者重視品牌,并對(duì)品牌和產(chǎn)品類別的投訴表現(xiàn)出顯著差異?!窘Y(jié)論】所構(gòu)建的主題模型能夠較好地識(shí)別投訴的類別、品牌、缺陷特征等,并詳細(xì)展示了各投訴內(nèi)容之間的關(guān)聯(lián)性。后續(xù)將進(jìn)一步擴(kuò)大研究樣本范圍,從更廣泛的渠道獲得投訴文本并進(jìn)行信息挖掘。
關(guān)鍵詞:消費(fèi)品缺陷;BERTopic模型;文本挖掘;投訴主題網(wǎng)絡(luò)
DOI編碼:10.3969/j.issn.1674-5698.2025.06.016
0引言
中國提出構(gòu)建以國內(nèi)大循環(huán)為主體、國內(nèi)國際雙循環(huán)相互促進(jìn)的新發(fā)展格局,進(jìn)一步加強(qiáng)內(nèi)需對(duì)經(jīng)濟(jì)增長的推動(dòng)力。2023年1月31日,習(xí)近平主持中共中央政治局第二次集體學(xué)習(xí)并發(fā)表重要講話,習(xí)近平總書記強(qiáng)調(diào),建立和完善擴(kuò)大居民消費(fèi)長效機(jī)制,使居民有穩(wěn)定收入能消費(fèi)、沒有后顧之憂敢消費(fèi)、消費(fèi)環(huán)境優(yōu)獲得感強(qiáng)愿消費(fèi)。消費(fèi)品的量質(zhì)齊增是擴(kuò)大內(nèi)需戰(zhàn)略的關(guān)鍵[1],在經(jīng)濟(jì)運(yùn)行中扮演著“市場(chǎng)調(diào)節(jié)器”與“宏觀經(jīng)濟(jì)運(yùn)行指示器”的重要角色,保證消費(fèi)品質(zhì)量安全對(duì)于保障和改善民生有重要作用[2]。國家市場(chǎng)監(jiān)督管理總局印發(fā)的《市場(chǎng)監(jiān)督管理投訴信息公示暫行規(guī)則》[3],要求消費(fèi)品投訴信息公開化,公示成為常態(tài),不公示才是特例,遵循“誰處理、誰公示”的原則,提升消費(fèi)市場(chǎng)的透明度,保護(hù)消費(fèi)者知情權(quán)。
投訴是消費(fèi)者對(duì)質(zhì)量缺陷表達(dá)不滿的重要途徑[4-5],投訴信息是消費(fèi)者在使用后對(duì)消費(fèi)品或服務(wù)表達(dá)不滿的載體[6],包含負(fù)面缺陷信息的投訴比正面營銷信息更能獲得潛在購買者的關(guān)注。投訴會(huì)引起政府介入、誘發(fā)企業(yè)輿情危機(jī),對(duì)企業(yè)品牌聲譽(yù)造成致命打擊[7]??诒疇I銷對(duì)品牌帶來的正面效應(yīng)往往經(jīng)不起一次負(fù)面投訴的沖擊[8-9]。投訴產(chǎn)生的負(fù)面口碑通過社交媒體的傳播擴(kuò)大了影響人群范圍[10],從而更大范圍地削減消費(fèi)者對(duì)品牌的忠誠度[11]。投訴比差評(píng)需要消費(fèi)者投入更多的精力,只有在嚴(yán)重質(zhì)量缺陷并損害權(quán)益時(shí),消費(fèi)者才會(huì)進(jìn)行投訴[12]。不同于第三方平臺(tái)或社交媒體上進(jìn)行情緒宣泄的差評(píng)[13],投訴是消費(fèi)者向政府部門尋求維權(quán)的重要信號(hào),表明差評(píng)已經(jīng)無法滿足消費(fèi)者的訴求。對(duì)投訴文本進(jìn)行挖掘是發(fā)現(xiàn)消費(fèi)品質(zhì)量缺陷的重要方式,為消費(fèi)者進(jìn)行購買決策提供參考,同時(shí)幫助企業(yè)正視缺陷,降低消費(fèi)市場(chǎng)信息不對(duì)稱程度[14],維護(hù)消費(fèi)者的合法權(quán)益。
在此背景下,本文基于國家市場(chǎng)監(jiān)督管理總局獲得的消費(fèi)者投訴文本,研究消費(fèi)品存在的質(zhì)量缺陷問題。本文數(shù)據(jù)具有如下優(yōu)勢(shì):第一,數(shù)據(jù)的可靠性。數(shù)據(jù)來自政府部門及其官方平臺(tái),不同于第三方投訴平臺(tái)(如黑貓投訴)中包含較多的噪聲信息。第二,數(shù)據(jù)的相關(guān)性。相比前人研究,本研究數(shù)據(jù)擁有較高的缺陷信息含量和較低的消費(fèi)者情緒傾向,能夠準(zhǔn)確定位品牌及其缺陷情況。
1文獻(xiàn)綜述
1.1消費(fèi)者投訴研究現(xiàn)狀
投訴作為消費(fèi)者表達(dá)不滿、維護(hù)自身權(quán)益的重要渠道,其對(duì)企業(yè)經(jīng)營、市場(chǎng)表現(xiàn)及消費(fèi)者保護(hù)機(jī)制等方面具有重要影響?,F(xiàn)有研究圍繞消費(fèi)者投訴的影響機(jī)制、檢測(cè)與分析方法、企業(yè)應(yīng)對(duì)策略等方面展開,取得了豐富的研究成果。在消費(fèi)者投訴的影響機(jī)制方面,研究發(fā)現(xiàn)消費(fèi)者投訴對(duì)企業(yè)的銷售、運(yùn)營及市場(chǎng)表現(xiàn)具有顯著影響。消費(fèi)者投訴不僅可能直接導(dǎo)致銷量下降,還可能通過影響企業(yè)聲譽(yù)和品牌形象間接作用于市場(chǎng)表現(xiàn)。在消費(fèi)者投訴的檢測(cè)與分析方法方面,研究者利用自然語言處理(NLP)方法對(duì)非結(jié)構(gòu)化投訴文本進(jìn)行了深入探索,包括基于社交媒體評(píng)論的缺陷識(shí)別系統(tǒng)[4]、基于圖論的半監(jiān)督學(xué)習(xí)方法[15],以及結(jié)合句子和單詞級(jí)別的注意力機(jī)制的投訴識(shí)別模型[16],有效提升了消費(fèi)者投訴的自動(dòng)化檢測(cè)與分析能力。企業(yè)采取積極的召回措施有助于降低因缺陷產(chǎn)品投訴引發(fā)的市場(chǎng)損失[17],引入基于人工智能的智能客服系統(tǒng)能減少投訴量并提升客服績效[10]。此外,企業(yè)對(duì)負(fù)面投訴的回應(yīng)方式需慎重選擇,幽默回應(yīng)可以在一定程度上提升品牌知名度,但也可能損害消費(fèi)者對(duì)品牌的信任[18]。
1.2主題模型研究現(xiàn)狀
主題模型作為一種無監(jiān)督的機(jī)器學(xué)習(xí)方法,在文本分析中發(fā)揮了重要作用,能夠通過構(gòu)建詞共線矩陣來識(shí)別文本中的潛在主題,幫助研究者完成文本分類、信息關(guān)聯(lián)和整合[19]。當(dāng)前,學(xué)術(shù)界廣泛應(yīng)用的主題模型主要包括LDA和BERTopic模型。LDA模型是經(jīng)典的主題挖掘方法,通過引入狄利克雷先驗(yàn)分布對(duì)詞語進(jìn)行向量化并計(jì)算其概率,構(gòu)建主題的詞語分布[20]。該模型已在用戶內(nèi)容與行為分析中取得較多成果,如Jia[21]利用LDA分析中美顧客評(píng)論以揭示文化差異,Kirilenko等[22]利用LDA提取游客負(fù)面評(píng)論中的不滿主題。
基于Transformer架構(gòu)的BERTopic模型通過預(yù)訓(xùn)練方式學(xué)習(xí)文本的語言特征。BERTopic模型先在無標(biāo)簽的語料庫中進(jìn)行訓(xùn)練,然后通過有標(biāo)簽的數(shù)據(jù)進(jìn)行微調(diào)[23],利用經(jīng)過預(yù)訓(xùn)練的句子嵌入模型將文本向量化,以向量聚類方式學(xué)習(xí)文本中的語言特征[24],從而挖掘潛在主題。Grootendorst[25]提出了BERTopic模型,使用預(yù)訓(xùn)練語言模型生成文檔嵌入,并對(duì)嵌入進(jìn)行聚類,最后基于c-TF-IDF生成主題。Wang等[26]利用BERTopic分析圖書館與信息科學(xué)領(lǐng)域的發(fā)展趨勢(shì)。Sanchez-Franco等[27]應(yīng)用該模型挖掘消費(fèi)者評(píng)論中的主觀體驗(yàn)信息。
2研究設(shè)計(jì)
2.1數(shù)據(jù)獲取與預(yù)處理
本文數(shù)據(jù)來自國家市場(chǎng)監(jiān)督管理總局、缺陷產(chǎn)品管理中心、中國政府網(wǎng)等官方網(wǎng)站及公眾號(hào),以及郵件、電話、信訪獲得的投訴文本,時(shí)間跨度為2016—2021年,在去掉部分重復(fù)投訴信息后共獲取投訴文本23,736條。圖1展示了主題挖掘與分析流程。
借助Python對(duì)投訴文本進(jìn)行數(shù)據(jù)清洗和預(yù)處理,將重復(fù)及無意義的投訴文本剔除。使用中文分詞工具jieba對(duì)文本進(jìn)行分詞,借助哈工大停用詞表清洗掉部分無研究價(jià)值的符號(hào)、語氣詞等。除此之外,對(duì)文本先進(jìn)行數(shù)十次訓(xùn)練,記錄對(duì)于主題聚類無意義的詞匯,例如時(shí)間信息詞“2016”“上旬”“十月”,網(wǎng)站信息詞“comhttps”,程度信息詞“經(jīng)?!薄安坏健薄翱赡堋钡龋尤胪S迷~表,最大程度降低無意義詞對(duì)模型訓(xùn)練結(jié)果的影響。
2.2BERTopic模型
BERTopic模型是1種先進(jìn)的深度學(xué)習(xí)算法[25],可以對(duì)大批量文本進(jìn)行計(jì)算并提取其中的關(guān)鍵信息,挖掘文本背后的隱藏問題,助力決策者制定科學(xué)的戰(zhàn)略規(guī)劃[28-29]。BERTopic基于BidirectionalEncoderRepresentationsfromTransformers(BERT)語句嵌入模型,利用Transformer和c-TF-IDF創(chuàng)建聚類,對(duì)主題進(jìn)行畫像并保留關(guān)鍵含義的詞語。使用BERTopic模型進(jìn)行主題建模會(huì)經(jīng)歷以下4個(gè)階段:詞嵌入(SentenceTransformer)、詞向量降維(UMAP[30])、聚類(HDBSCAN[31])、主題詞獲?。╟-TF-IDF)。與LDA、LSA等主題模型相比,BERTopic模型主要有以下優(yōu)點(diǎn):1)可以與不同的嵌入模型相結(jié)合;2)通過HDBSCAN,BERTopic模型能夠有效處理噪聲文本;3)非常適合處理時(shí)間序列數(shù)據(jù);4)在結(jié)合降維算法(UMAP)和高效聚類算法(HDBSCAN)時(shí),BERTopic模型擅長處理大規(guī)模文本數(shù)據(jù);5)很好地解決密度聚類與中心采樣之間不兼容的問題[32]。
本文涉及BERTopic模型的具體過程如下:
(1)詞嵌入。使用Sentence-Transformer深度學(xué)習(xí)模型將分詞得到的詞語進(jìn)行編碼并計(jì)算詞語之間的相似度,通過自注意力機(jī)制和位置編碼來生成高維詞向量,選擇支持中文文本嵌入的多語言模型paraphrase-multilingual-MiniLM-L12-v2實(shí)現(xiàn)文本嵌入,并保留詞語位于原投訴文本中的語義關(guān)聯(lián)信息。
(2)詞向量降維。由于獲得的詞向量處于高維空間,很難被聚類算法處理。UMAP算法在降維過程中對(duì)于保留詞向量的全局結(jié)構(gòu)方面表現(xiàn)良好,使得降維后的詞向量仍保留原有意義。因此本文借助降維算法UMAP對(duì)高維詞向量進(jìn)行降維并獲得新的低維詞向量。
(3)聚類。使用無監(jiān)督算法HDBSCAN對(duì)降維后的詞向量進(jìn)行聚類,形成語義相近的文本聚類結(jié)果。
(4)主題詞獲取。采用c-TF-IDF算法計(jì)算聚類的整體詞頻,提取每個(gè)聚類的特征詞,從而識(shí)別每個(gè)聚類的主題。
2.3社會(huì)網(wǎng)絡(luò)分析
通過BERTopic模型獲得的主題詞構(gòu)建投訴主題網(wǎng)絡(luò),借助主題詞之間的共線關(guān)系發(fā)現(xiàn)投訴的關(guān)聯(lián)性。將主題詞作為網(wǎng)絡(luò)節(jié)點(diǎn),同一條投訴文本中各主題詞之間的共線關(guān)系作為網(wǎng)絡(luò)的邊,從而形成投訴主題網(wǎng)絡(luò)。對(duì)投訴主題網(wǎng)絡(luò)的分析可以揭示投訴文本中不同主題內(nèi)容之間的聯(lián)系強(qiáng)度、結(jié)構(gòu)特征等,并發(fā)現(xiàn)關(guān)鍵投訴主題詞在網(wǎng)絡(luò)中的中心性等信息。投訴主題網(wǎng)絡(luò)將幫助識(shí)別消費(fèi)者重點(diǎn)關(guān)注的投訴領(lǐng)域,挖掘出各缺陷之間的聯(lián)系,為改進(jìn)消費(fèi)品質(zhì)量提供支持。
3結(jié)果分析
利用BERTopic模型對(duì)投訴文本進(jìn)行主題建模,在多次實(shí)驗(yàn)的基礎(chǔ)上調(diào)整參數(shù)獲得最終模型。為使得每個(gè)主題能夠盡可能多地包含更多信息,設(shè)置最小主題大小為100,共識(shí)別獲得17個(gè)主要投訴主題(Topic0~Topic16),涵蓋了消費(fèi)者投訴信息中的19,676條投訴文本,另外有4060條投訴文本被歸為噪聲主題(Topic-1)。噪聲數(shù)據(jù)中除了少部分離群投訴文本外,絕大多數(shù)都是聚類規(guī)模沒有達(dá)到100(即該主題所包含的投訴文本lt;100條)的投訴主題。
3.1投訴主題識(shí)別
表1展示了識(shí)別獲得的17個(gè)主要主題的基本情況。從表1中可以看出,噪聲主題Topic-1擁有4060條文本數(shù)量,占全部文本的比例超過1/6,這部分投訴文本并沒有被歸入主要主題內(nèi)進(jìn)行研究,但不可忽視的是,噪聲主題重點(diǎn)關(guān)注了售后問題。主題4所占比例最高,擁有超過6500條投訴文本,占全部投訴量的27.77%,這表明關(guān)于手機(jī)、售后的問題受到消費(fèi)者的廣泛關(guān)注;主題4、2、12文本數(shù)量超過3000,共占全部投訴量的58.89%,主題4和主題2重點(diǎn)關(guān)注2款品牌手機(jī)問題,品牌X的缺陷集中于主板故障導(dǎo)致的售后問題,而品牌A則存在電池問題而導(dǎo)致自動(dòng)關(guān)機(jī),主題12關(guān)注空調(diào)等家電的售后維修問題,顯示出消費(fèi)者對(duì)傳統(tǒng)家電行業(yè)售后維修的重視;主題0、8、9、10、14、16的投訴文本數(shù)量在400~1000,這些主題關(guān)注“自動(dòng)關(guān)機(jī)”“電量”“電動(dòng)車”“電腦”“屏幕”等存在的缺陷,說明與電相關(guān)的消費(fèi)品受到關(guān)注,這可能與該類型消費(fèi)品的單位價(jià)值高、安全隱患大有關(guān);主題1、3、5、6、7、11、15的文本數(shù)量在400以下,主要關(guān)注“電池電量”“顯示屏”“充電”等問題??傊M(fèi)者投訴對(duì)象集中于以手機(jī)和電腦為代表的電子消費(fèi)品領(lǐng)域,并且重點(diǎn)關(guān)注電池電量導(dǎo)致的自動(dòng)關(guān)機(jī)問題,而空調(diào)等電器設(shè)備則更重視消費(fèi)品售后與維修服務(wù)。
3.2投訴大類識(shí)別
根據(jù)3.1節(jié)識(shí)別出的主題,得到主要主題的聚類結(jié)果。如圖2所示,每個(gè)氣泡代表一個(gè)主題,氣泡的大小代表主題所包含的投訴文本數(shù)量,氣泡間的距離代表主題近似程度。Topic12的氣泡包含了Topic3和Topic10的氣泡,這些主題氣泡在距離上接近,主題含義也較為接近。Topic4的氣泡包含了Topic2的氣泡,這2個(gè)氣泡最大,距離也最為接近,主要是關(guān)于手機(jī)存在的質(zhì)量缺陷問題。Topic0和Topic14距離接近,且有大部分重合,它們位于左下象限靠近D2軸線的位置,這2個(gè)主題都與電腦缺陷相關(guān)。Topic16包含Topic15,并與Topic13大部分相交,這一部分主要描述的是電子消費(fèi)品的屏幕存在的缺陷。而位于左下象限的Topic1、Topic5、Topic6、Topic7、Topic8、Topic9、Topic11集中分布于左下角,氣泡較小并且混雜在一起,這些主題都是與電池電量、充電及自動(dòng)關(guān)機(jī)相關(guān)的部分。
表2為聚類結(jié)果的類別劃分表。依據(jù)聚類結(jié)果,將17個(gè)主題劃分為手機(jī)、電池、電腦、屏幕及其他投訴大類。手機(jī)投訴大類包括主題2和4,手機(jī)是遭投訴最多的消費(fèi)品,共擁有10,837條投訴文本,達(dá)到總投訴量的45.66%,這表明消費(fèi)者十分重視手機(jī)的質(zhì)量,對(duì)手機(jī)存在缺陷容忍度較低,傾向于向政府尋求投訴維權(quán)。電池投訴大類包括主題1、5、6、7、8、9和11,共包含7個(gè)主題,是擁有主題數(shù)最多的投訴大類,表明關(guān)于電池缺陷導(dǎo)致的問題較為復(fù)雜,包括自動(dòng)關(guān)機(jī)、閃屏、電池鼓包、電量不足、手機(jī)開裂及開關(guān)機(jī)問題。電池問題不僅涉及手機(jī)也涉及對(duì)電池依賴度較高的電腦。電腦投訴大類包括主題0和14,涉及其中的1322條投訴文本,占比為5.57%,主要是對(duì)電腦屏幕和售后維修的投訴。屏幕投訴大類包括主題13、15和16,共擁有1028條投訴文本,占比為4.33%,針對(duì)屏幕的投訴主要來自電視機(jī)、顯示器及手環(huán)。其他投訴大類包括主題3、10和12,共擁有4165條投訴文本,占比為17.55%,包含了耳機(jī)、電動(dòng)車、空調(diào)等消費(fèi)品,針對(duì)耳機(jī)的投訴主要為佩戴造成的耳道發(fā)炎問題,針對(duì)電動(dòng)車投訴主要為行駛過程中輪胎的質(zhì)量問題,針對(duì)空調(diào)的投訴主要為售后維修問題。
手機(jī)是消費(fèi)者最為關(guān)切的消費(fèi)品,投訴量占比超過40%。為此,本研究針對(duì)手機(jī)品牌信息進(jìn)行識(shí)別,發(fā)現(xiàn)10,050條文本中含有手機(jī)品牌信息,并對(duì)品牌信息進(jìn)行匿名處理。表3展示了中國市場(chǎng)銷售的主要手機(jī)品牌投訴量,其中品牌A收到的投訴最多,超過5000條投訴與之相關(guān),其次是品牌X,超過2000條。考慮到銷量情況對(duì)投訴量的影響,本文對(duì)2016—2021年間占據(jù)銷量排名前9的手機(jī)品牌進(jìn)行了統(tǒng)計(jì),銷量數(shù)據(jù)包括了該品牌旗下的子品牌。為此,計(jì)算投訴率以評(píng)價(jià)不同品牌手機(jī)質(zhì)量,并對(duì)銷售量排名前5品牌的銷售量和投訴率進(jìn)行了分析。如圖3所示,投訴量與銷量情況并不一致,投訴率最高的為品牌A手機(jī)。該品牌手機(jī)存在的電池問題被廣泛詬病,并且在中國市場(chǎng)售價(jià)普遍偏高,消費(fèi)者對(duì)其質(zhì)量預(yù)期要高于其他品牌,當(dāng)出現(xiàn)質(zhì)量缺陷時(shí),更容易遭遇用戶投訴。國產(chǎn)手機(jī)品牌V、O、H和X投訴率較低,顯示出國產(chǎn)手機(jī)質(zhì)量受中國消費(fèi)者的認(rèn)可。式(1)為投訴率的計(jì)算公式,根據(jù)2016—2021年間該品牌的總銷售量和總投訴文本數(shù)來計(jì)算。
3.3投訴主題網(wǎng)絡(luò)
為探尋各投訴內(nèi)容之間的關(guān)聯(lián)性,在社會(huì)網(wǎng)絡(luò)視角下,根據(jù)BERTopic模型獲得的主題(剔除Topic-1)中包含的主題特征詞,將詞頻數(shù)大于100的特征詞作為主題網(wǎng)絡(luò)節(jié)點(diǎn),該網(wǎng)絡(luò)包含108個(gè)節(jié)點(diǎn),663條無向邊。主題特征詞提取、投訴主題網(wǎng)絡(luò)構(gòu)建借助Python,網(wǎng)絡(luò)可視化使用Gephi0.10.1。利用投訴主題網(wǎng)絡(luò)分析投訴內(nèi)容之間的關(guān)系,特征詞聯(lián)系越緊密,即2類缺陷投訴之間的相關(guān)性越高[33],特征詞之間無共線關(guān)系,表明2類缺陷投訴之間無關(guān)聯(lián)。
投訴主題網(wǎng)絡(luò)如圖4所示,圖4中節(jié)點(diǎn)大小代表特征詞數(shù)量多少,即度數(shù)中心度,連線粗細(xì)代表各主題特征詞之間的相關(guān)性大小,連線越粗相關(guān)性越強(qiáng)。由圖4可知發(fā)現(xiàn)2個(gè)聚類集群,一個(gè)是以“開機(jī)”“電量”“電池”等為核心的聚類集群,由電池問題引發(fā)的一系列質(zhì)量缺陷,并且這些缺陷與手機(jī)聯(lián)系密切。另一個(gè)是以“維修”“售后”“屏幕”等節(jié)點(diǎn)為核心的聚類集群,由售后問題導(dǎo)致的服務(wù)不滿,與售后要求較高的消費(fèi)品聯(lián)系密切,如“電視”“電腦”等。這些節(jié)點(diǎn)面積較大,表明它們的度數(shù)中心性較高。2個(gè)聚類集群都聚焦于電子消費(fèi)品的缺陷,表明消費(fèi)者對(duì)以手機(jī)為代表的電子消費(fèi)品缺陷容忍度較低,可能與電子消費(fèi)品單位價(jià)格高有關(guān)。
消費(fèi)者對(duì)電子消費(fèi)品的重要零部件也保持重點(diǎn)關(guān)注,如電池、充電器、屏幕、硬盤、主板等。零部件的缺陷對(duì)消費(fèi)品整體質(zhì)量管理十分重要。消費(fèi)者很多情況下是針對(duì)消費(fèi)品出現(xiàn)缺陷的零部件進(jìn)行投訴,并不是針對(duì)整件消費(fèi)品進(jìn)行投訴。例如電池電量不足導(dǎo)致手機(jī)自動(dòng)關(guān)機(jī),手環(huán)屏幕亮度不夠?qū)е略谑彝夂茈y看清。在投訴主題網(wǎng)絡(luò)的左下部分,關(guān)于電動(dòng)車的聚類集群獨(dú)立于主體網(wǎng)絡(luò),說明關(guān)于電動(dòng)車的缺陷投訴與其他消費(fèi)品的缺陷投訴無關(guān)聯(lián)。電動(dòng)車缺陷特征包括“剎車”“輪胎”“行駛里程”等。在投訴主題網(wǎng)絡(luò)的右下部分,對(duì)手環(huán)投訴的問題主要為亮度不高。除此之外,本文發(fā)現(xiàn)當(dāng)電池電量位于50%時(shí),部分消費(fèi)者就陷入電量焦慮狀態(tài)。
3.4網(wǎng)絡(luò)結(jié)構(gòu)分析
表4展示了投訴主題網(wǎng)絡(luò)的基本結(jié)構(gòu)特征。網(wǎng)絡(luò)密度用于衡量整體網(wǎng)絡(luò)特征,反映各節(jié)點(diǎn)之間聯(lián)系的緊密程度,為網(wǎng)絡(luò)的連接數(shù)與可能連接數(shù)之間的比值,值越接近1,表示網(wǎng)絡(luò)連結(jié)越緊密。該網(wǎng)絡(luò)的密度為0.1147,涉及的消費(fèi)品缺陷特征覆蓋面廣,可以較好地反映消費(fèi)者投訴關(guān)注的缺陷全貌。連接數(shù)代表網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連線數(shù)量,該網(wǎng)絡(luò)連接數(shù)為663,網(wǎng)絡(luò)中各節(jié)點(diǎn)之間存在大量連接,各投訴節(jié)點(diǎn)之間聯(lián)系廣泛。聚類系數(shù)用來衡量節(jié)點(diǎn)與鄰近節(jié)點(diǎn)的緊密程度,值越接近1,節(jié)點(diǎn)聯(lián)系越緊密。該網(wǎng)絡(luò)的聚類系數(shù)為0.8831,表明各節(jié)點(diǎn)之間的聯(lián)系緊密,缺陷特征的集中度較高。同時(shí),該網(wǎng)絡(luò)的平均度為12.2778,反映網(wǎng)絡(luò)的平均連接數(shù)和節(jié)點(diǎn)的整體連結(jié)情況。除電動(dòng)車外,各投訴聚類集群之間存在普遍的關(guān)聯(lián)性。由于該網(wǎng)絡(luò)為非連通圖,因此,僅計(jì)算最大連通分量下的直徑和平均路徑長度,分別為4和2.3280。
表5展示了主題網(wǎng)絡(luò)度中心性排名前20節(jié)點(diǎn)的特征。該表展示了節(jié)點(diǎn)的度中心性、加權(quán)度、接近中心性和中介中心性。度中心性為一個(gè)節(jié)點(diǎn)的度數(shù)與網(wǎng)絡(luò)中總節(jié)點(diǎn)數(shù)(減去1)之間的比值,用來識(shí)別網(wǎng)絡(luò)中的重要節(jié)點(diǎn)。由表5可知,“維修”“售后”“客服”“屏幕”“自動(dòng)關(guān)機(jī)”等節(jié)點(diǎn)度中心性不低于0.2,是網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn),表明消費(fèi)者對(duì)售后維修服務(wù)存在較大不滿,對(duì)“屏幕”“自動(dòng)關(guān)機(jī)”關(guān)注度較高,是投訴的重點(diǎn)內(nèi)容。同時(shí),加權(quán)度指的是節(jié)點(diǎn)與其鄰近節(jié)點(diǎn)連接邊的權(quán)重之和,同樣用于評(píng)估節(jié)點(diǎn)的重要性。上述5個(gè)節(jié)點(diǎn)的加權(quán)度也較大,顯示在投訴主題網(wǎng)絡(luò)中占據(jù)重要位置。網(wǎng)絡(luò)中節(jié)點(diǎn)的接近中心性指該節(jié)點(diǎn)到其他所有節(jié)點(diǎn)的平均距離的倒數(shù),反映節(jié)點(diǎn)在網(wǎng)絡(luò)中的相對(duì)地位。節(jié)點(diǎn)的接近中心性越高,該節(jié)點(diǎn)越核心。投訴主題網(wǎng)絡(luò)中,“售后”“維修”“客服”“自動(dòng)關(guān)機(jī)”4個(gè)節(jié)點(diǎn)的接近中心性均超過0.4,在連接其他節(jié)點(diǎn)中具有關(guān)鍵作用。中介中心性衡量一個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的中介作用,反映節(jié)點(diǎn)在網(wǎng)絡(luò)中扮演的橋梁作用,只有“售后”“維修”“自動(dòng)關(guān)機(jī)”3個(gè)節(jié)點(diǎn)的中介中心性大于0.1。
從表5中可以發(fā)現(xiàn),“維修”“售后”是消費(fèi)者反映較多的內(nèi)容,它們的度中心性、加權(quán)度、接近中心性和中介中心性在所有節(jié)點(diǎn)中是最高的,表明商家提供的售后維修服務(wù)無法滿足消費(fèi)者的要求。同時(shí)“維修”“售后”連接較多種類消費(fèi)品的投訴內(nèi)容,在一定程度上反映售后維修問題是困擾消費(fèi)者的重要共性問題。值得注意的是,圖4中共線頻率較高的“開機(jī)”“電量”“屏幕”等節(jié)點(diǎn)并沒有出現(xiàn)在表5中,它們的度中心性、加權(quán)度、接近中心性及中介中心性值并不高,表明其只是以手機(jī)為代表的電子消費(fèi)品的獨(dú)有缺陷,并非被投訴消費(fèi)品的共性問題。
4結(jié)論
消費(fèi)者投訴是反映消費(fèi)品缺陷最直觀的證據(jù),品牌信息、缺陷特征、負(fù)面情緒都包含在消費(fèi)者投訴文本中,借助自然語言處理技術(shù)能夠剔除消費(fèi)者情緒化表達(dá)的干擾,獲得消費(fèi)品真實(shí)的缺陷信息。本文基于BERTopic模型對(duì)來自官方投訴平臺(tái)的投訴文本進(jìn)行主題挖掘與缺陷發(fā)現(xiàn),通過構(gòu)建投訴主題網(wǎng)絡(luò)探究各投訴主題之間的關(guān)聯(lián)性,得出以下結(jié)論:
(1)電子消費(fèi)品的質(zhì)量缺陷是投訴的重點(diǎn)對(duì)象。手機(jī)、電腦、手環(huán)、耳機(jī)等被消費(fèi)者重點(diǎn)關(guān)注,自動(dòng)關(guān)機(jī)、黑屏等問題在消費(fèi)者投訴中被多次提及,電池、屏幕等零部件質(zhì)量問題是電子消費(fèi)品產(chǎn)生缺陷的重要原因。(2)消費(fèi)品質(zhì)量缺陷和售后服務(wù)不滿高度相關(guān)。消費(fèi)品缺陷問題無法得到售后的及時(shí)回應(yīng)和解決,使得消費(fèi)者尋求投訴途徑以獲得自身權(quán)益保障,消費(fèi)品缺陷和售后不滿的疊加因素導(dǎo)致了投訴的發(fā)生。(3)不同消費(fèi)品領(lǐng)域的投訴差異明顯。手機(jī)的投訴集中于電池不足和自動(dòng)關(guān)機(jī)問題,電腦的投訴則集中在電池鼓包、屏幕故障等方面,而電動(dòng)車投訴則相對(duì)獨(dú)立,主要關(guān)注剎車、輪胎等問題,與其他消費(fèi)品投訴主題聯(lián)系較弱。(4)投訴以品牌為基準(zhǔn)。消費(fèi)者投訴普遍提及品牌信息,直接反映了品牌在質(zhì)量控制和消費(fèi)品體驗(yàn)方面的不足,消費(fèi)者容易形成對(duì)品牌的刻板負(fù)面印象。
企業(yè)應(yīng)建立動(dòng)態(tài)投訴監(jiān)測(cè)與分析機(jī)制,重視消費(fèi)者訴求。以往研究表明,企業(yè)聲譽(yù)和品牌影響力十分重要[34-36],零部件供應(yīng)鏈管理是消費(fèi)品質(zhì)量管理的關(guān)鍵,企業(yè)要重視售后服務(wù),確保消費(fèi)品全生命周期內(nèi)的使用體驗(yàn)。雖然本文借助自然語言技術(shù)對(duì)投訴文本進(jìn)行主題挖掘具有一定的客觀性,但由于投訴文本來自政府平臺(tái),與來自第三方平臺(tái)有關(guān)的投訴相比,樣本量較小,具有一定的局限性。
參考文獻(xiàn)
馬勝男,王旭華,孫錫敏,等.適應(yīng)新發(fā)展階段的中國消費(fèi)品標(biāo)準(zhǔn)化戰(zhàn)略轉(zhuǎn)型研究[J].中國科學(xué)院院刊,2022,37(9):1248-1258.
陳明華,史楠,王山,等.邁向消費(fèi)品統(tǒng)一大市場(chǎng):基于價(jià)格溢出視角的消費(fèi)品市場(chǎng)一體化水平測(cè)度與分析[J].
中國軟科學(xué),2024(11):87-99.
中國政府網(wǎng).市場(chǎng)監(jiān)督管理投訴信息公示暫行規(guī)則[Z].2023
ABRAHAMSAS,JIAOJ,WANGGA,etal.Vehicledefectdiscoveryfromsocialmedia[J].DecisionSupportSystems,2012,54(1):87-97.
PASCUAL-NEBREDAL,CABANELASP,BLANCO GONZALEZA.CriticalincidentsanddissatisfactioninB2Brelationships:anappraisaltheoryanalysis[J].JournalofBusinessamp;IndustrialMarketing,2023,38(7):1574-1586.
蔡衛(wèi)星,蒲雨琦,李浩民.顧客至上:消費(fèi)者在線投訴的基本面預(yù)測(cè)能力研究[J].管理世界,2024,40(5):139-154.
施文,渠玉杰,蔣國銀.基于隨機(jī)Kriging的汽車品牌質(zhì)量序貫主題比較研究[J].中國管理科學(xué),2023,31(11):114-127.
孫瑾,苗盼.口碑效價(jià)因人而異:調(diào)節(jié)定向與社會(huì)距離對(duì)消費(fèi)者口碑效價(jià)的影響[J].南開管理評(píng)論,2021,24(5):202-214.
黃敏學(xué),王峰,謝亭亭.口碑傳播研究綜述及其在網(wǎng)絡(luò)環(huán)境下的研究初探[J].管理學(xué)報(bào),2010,7(1):138-146.
WANGL,HUANGN,HONGY,etal.Voice-basedAIincallcentercustomerservice:Anaturalfieldexperiment[J].ProductionandOperationsManagement,2023,32(4):1002-1018.
URUENAA,HIDALGOA.Successfulloyaltyine-complaints:FsQCAandstructuralequationmodelinganalyses[J].JournalofBusinessResearch,2016,69(4):1384-1389.
HUN,ZHANGT,GAOB,etal.Whatdohotelcustomerscomplainabout?Textanalysisusingstructuraltopicmodel[J].TourismManagement,2019,72:417-426.
張公讓,鮑超,王曉玉,等.基于評(píng)論數(shù)據(jù)的文本語義挖掘與情感分析[J].情報(bào)科學(xué),2021,39(5):53-61.
SCOTTJE,GREGGDG,CHOIJH.Lemoncomplaints:Whenonlineauctionsgosour[J].InformationSystemsFrontiers,2015,17(1):177-191.
SINGHA,SAHAS,HASANUZZAMANM,etal.
Identifyingcomplaintsbasedonsemi-supervisedmincuts[J].ExpertSystemswithApplications,2021,186:115668.
DASS,SINGHA,SAHAS,etal.NegativeRevieworComplaint?ExploringInterpretabilityinFinancialComplaints[J].IEEETransactionsonComputationalSocialSystems,2024,11(3):3606-3615.
SHAOQ,LIYN,WEIJ,etal.Apunishmentsharedisapunishmenthalved:Concurrentrecallsreduceproducts'marketshareloss[J].Psychologyamp;Marketing,2024,41(8):1715-1734.
SARKARS,RAJAGOPALANB.Consumersafetycomplaintsandorganizationallearning:evidencefromtheautomotiveindustry[J].InternationalJournalofQualityamp;ReliabilityManagement,2018,35(10):2094-2118.
曹麗娜,唐錫晉.基于主題模型的BBS話題演化趨勢(shì)分析[J].管理科學(xué)學(xué)報(bào),2014,17(11):109-121.
韓亞楠,劉建偉,羅雄麟.概率主題模型綜述[J].計(jì)算機(jī)學(xué)報(bào),2021,44(6):1095-1139.
JIASS.MotivationandsatisfactionofChineseandUStouristsinrestaurants:Across-culturaltextminingofonlinereviews[J].TourismManagement,2020,78:104071.
KIRILENKOAP,STEPCHENKOVASO,DAIX.
Automatedtopicmodelingoftouristreviews:DoestheAnnaKareninaprincipleapply?[J].TourismManagement,2021,83:104241.
DEVLINJ,CHANGMW,LEEK,etal.BERT:Pre trainingofDeepBidirectionalTransformersforLanguageUnderstanding;proceedingsoftheConferenceoftheNorth-American-ChapteroftheAssociation for-Computational-Linguistics-HumanLanguageTechnologies(NAACL-HLT),Minneapolis,MN,F(xiàn)Jun02-07,2019[C].2019.
陸偉,李鵬程,張國標(biāo),等.學(xué)術(shù)文本詞匯功能識(shí)別:基于BERT向量化表示的關(guān)鍵詞自動(dòng)分類研究[J].情報(bào)學(xué)報(bào),2020,39(12):1320-1329.
GROOTENDORSTM.BERTopic:Neuraltopicmodelingwithaclass-basedTF-IDFprocedure[J].arXivpreprintarXiv:220305794,2022.
WANGZ,CHENJ,CHENJ,etal.IdentifyinginterdisciplinarytopicsandtheirevolutionbasedonBERTopic[J].Scientometrics,2023,129(11):7359-7384.
SANCHEZ-FRANCOMJ,REY-MORENOM.Dotravelers'reviewsdependonthedestination?Ananalysisincoastalandurbanpeer-to-peerlodgings[J].Psychologyamp;Marketing,2022,39(2):441-459.
聶亞青,吳庭璋,王若佳,等.基于BERTopic模型的健康信息學(xué)主題挖掘與發(fā)展演化研究[J].情報(bào)科學(xué),2024,42(4):98-110.
徐漢青,滕廣青.機(jī)遇與挑戰(zhàn):基于BERTopic的AI環(huán)境下圖書館主題文本挖掘[J].情報(bào)科學(xué),2024,42(4):119-128.
MCINNESL,HEALYJ,MELVILLEJ.Umap:Uniformmanifoldapproximationandprojectionfordimensionreduction[J].arXivpreprintarXiv:180203426,2018.
RAHMANMF,LIUW,SUHAIMSB,etal.Hdbscan:Densitybasedclusteringoverlocationbasedservices[J].arXivpreprintarXiv:160203730,2016.
胡凱茜,李欣,王龍騰.基于BERTopic模型的網(wǎng)絡(luò)暴力事件衍生輿情探測(cè)[J].情報(bào)雜志,2024,43(7):146-153.
蘇敬勤,許昕傲,李曉昂.基于共詞分析的我國技術(shù)創(chuàng)新政策結(jié)構(gòu)關(guān)系研究[J].科技進(jìn)步與對(duì)策,2013,30(9):110-115.
LAIC-S,CHIUC-J,YANGC-F,PAID-C.TheEffectsofCorporateSocialResponsibilityonBrandPerformance:
TheMediatingEffectofIndustrialBrandEquityandCorporateReputation[J].JournalofBusinessEthics,2010,95(3):457-469.
DELLAROCASC.Thedigitizationofwordofmouth:Promiseandchallengesofonlinefeedbackmechanisms[J].ManagementScience,2003,49(10):1407-1424.
VELOUTSOUC.Enlighteningthebrandbuilding audienceresponselink[J].JournalofBrandManagement,2023,30(6):550-566