摘要:以煙臺(tái)蘋(píng)果為研究對(duì)象,利用Python爬取相關(guān)商品下用戶(hù)的評(píng)論數(shù)據(jù)作為語(yǔ)料庫(kù),引入百度AI平臺(tái)的自然語(yǔ)言處理技術(shù),利用訓(xùn)練好的模型對(duì)于評(píng)論文本進(jìn)行情感分析,并構(gòu)建LDA主題分類(lèi)模型提取文本主題與關(guān)鍵詞,對(duì)在線評(píng)論進(jìn)行文本挖掘與量化分析。結(jié)果表明,評(píng)論文本中,對(duì)于煙臺(tái)蘋(píng)果的正向評(píng)價(jià)占96.1%,中性評(píng)價(jià)占0.3%,負(fù)向評(píng)價(jià)占3.6%;根據(jù)主題一致性指標(biāo),評(píng)論文本內(nèi)容可以聚類(lèi)為品種認(rèn)同、服務(wù)感知、產(chǎn)品質(zhì)量、營(yíng)銷(xiāo)感知以及物流質(zhì)量5個(gè)主題。消費(fèi)者對(duì)于煙臺(tái)蘋(píng)果的總體滿意度較高,加強(qiáng)消費(fèi)者的品種認(rèn)同是未來(lái)的重要改進(jìn)方向,并為進(jìn)一步提升消費(fèi)者滿意度提出了建議。
關(guān)鍵詞:在線評(píng)論;農(nóng)產(chǎn)品消費(fèi)者滿意度;煙臺(tái)蘋(píng)果;情感分類(lèi);LDA
中圖分類(lèi)號(hào):F323.5;F724.6" " " " "文獻(xiàn)標(biāo)識(shí)碼:A" " " " " "文章編號(hào):0439-8114(2025)02-0214-06
DOI:10.14088/j.cnki.issn0439-8114.2025.02.034 開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Abstract: Taking Yantai Apple as the research object, the Python was used to crawl the user’s comment data under relevant products as the corpus, the natural language processing technology of Baidu AI platform was introduced, and the trained model was used to analyze the comment text. LDA theme classification model was built to extract text themes and keywords, and conduct text mining and quantitative analysis for online comments. The results showed that in the comment text, the positive evaluation for Yantai Apple accounted for 96.1%, neutral evaluation for 0.3%, and negative evaluation for 3.6%. According to the theme consistency index, the comment text content could be clustered into five themes: variety identification, service perception, product quality, marketing perception and logistics quality. Consumers’ overall satisfaction with Yantai Apple was high. Strengthening the variety identification of consumers was an important improvement direction in the future, and suggestions for further improving consumers’ satisfaction were put forward.
電子商務(wù)通過(guò)擴(kuò)大消費(fèi)者可選擇的產(chǎn)品范圍、促進(jìn)競(jìng)爭(zhēng)和提高購(gòu)物便利性,正在改變?nèi)藗兊馁?gòu)物方式[1]。隨著冷鏈物流技術(shù)的不斷進(jìn)步,電子商務(wù)在農(nóng)產(chǎn)品領(lǐng)域也取得了顯著發(fā)展。2019年,新冠疫情在全球暴發(fā),由于人們需要保持社交距離并確保安全購(gòu)物,線上購(gòu)買(mǎi)食品尤其是生鮮食品的行為顯著增加,特別是在中國(guó)等實(shí)施了嚴(yán)格封鎖措施的國(guó)家和地區(qū)[2,3]。事實(shí)上,隨著互聯(lián)網(wǎng)的發(fā)展,電子商務(wù)已成為推動(dòng)中國(guó)農(nóng)業(yè)產(chǎn)業(yè)結(jié)構(gòu)升級(jí)的重要趨勢(shì),并為解決“三農(nóng)”問(wèn)題提供了新的視角和助力?!吨袊?guó)電子商務(wù)報(bào)告(2021)》的數(shù)據(jù)顯示,2021年全國(guó)農(nóng)村網(wǎng)絡(luò)零售額2.05萬(wàn)億元,同比增長(zhǎng)11.3%;全國(guó)農(nóng)產(chǎn)品網(wǎng)絡(luò)零售額4 221億元,同比增長(zhǎng)2.8%。然而,農(nóng)業(yè)電子商務(wù)給中國(guó)農(nóng)業(yè)發(fā)展帶來(lái)機(jī)遇的同時(shí),也存在著風(fēng)險(xiǎn)與挑戰(zhàn)。市場(chǎng)信息的不對(duì)稱(chēng)成為阻礙農(nóng)業(yè)電子商務(wù)持續(xù)發(fā)展的重要原因,如何獲取市場(chǎng)上有指導(dǎo)性、針對(duì)性的顧客信息以提升消費(fèi)者滿意度,成為領(lǐng)域內(nèi)亟待解決的關(guān)鍵問(wèn)題。目前,學(xué)者對(duì)于消費(fèi)者購(gòu)買(mǎi)農(nóng)產(chǎn)品滿意度的研究方法主要集中于問(wèn)卷調(diào)查。王冠寧[4]通過(guò)問(wèn)卷分析,基于因子分析模型構(gòu)建農(nóng)產(chǎn)品滿意度影響因素體系,發(fā)現(xiàn)服務(wù)質(zhì)量與產(chǎn)品質(zhì)量是影響消費(fèi)者滿意度的關(guān)鍵因素;李蕾等[5]通過(guò)調(diào)查問(wèn)卷建立結(jié)構(gòu)模型,探究顧客價(jià)值及服務(wù)質(zhì)量對(duì)于消費(fèi)者滿意度與忠誠(chéng)度的影響機(jī)制;吳欣霞等[6]通過(guò)問(wèn)卷調(diào)查數(shù)據(jù),建立改進(jìn)的ACSI模型,引入心理變量,以贛南臍橙為例分析消費(fèi)者網(wǎng)購(gòu)地理標(biāo)志農(nóng)產(chǎn)品滿意度的決定因素;李萬(wàn)斌等[7]結(jié)合經(jīng)典理論顧客滿意度指數(shù)模型(CCSI),通過(guò)因子分析對(duì)青州蜜桃的顧客滿意度進(jìn)行實(shí)證分析。多數(shù)研究認(rèn)為,消費(fèi)者的質(zhì)量感知與服務(wù)感知是影響其滿意度的關(guān)鍵因素。結(jié)合上述分析,現(xiàn)有學(xué)者對(duì)于農(nóng)產(chǎn)品消費(fèi)者網(wǎng)購(gòu)滿意度分析的信息來(lái)源主要為問(wèn)卷調(diào)查所得數(shù)據(jù),而對(duì)于產(chǎn)品在線評(píng)論的分析較為缺乏。傳統(tǒng)的問(wèn)卷分析方法存在信息反饋滯后、成本與準(zhǔn)確性間不平衡等難以克服的缺陷[8],與之相比,在線評(píng)論作為消費(fèi)者感受的直觀反映,對(duì)于不同商品的分析更加具有針對(duì)性,也有利于保證數(shù)據(jù)樣本搜集的大體量與全面性[9,10]。利用用戶(hù)直接回饋使用感知的渠道,基于在線評(píng)論進(jìn)行文本挖掘,對(duì)于提取影響農(nóng)產(chǎn)品顧客滿意度的相關(guān)因素具有重要意義[11]。本研究以京東電商平臺(tái)的煙臺(tái)蘋(píng)果在線評(píng)論文本作為數(shù)據(jù)源進(jìn)行文本挖掘,通過(guò)機(jī)器學(xué)習(xí)的LDA主題學(xué)習(xí)與情感分析算法,探索影響消費(fèi)者滿意度的相關(guān)因素。
1 資料與方法
1.1 數(shù)據(jù)來(lái)源
為了獲取進(jìn)行研究的在線評(píng)論文本,利用Python爬蟲(chóng),以京東商城作為數(shù)據(jù)源,根據(jù)關(guān)鍵詞“煙臺(tái)蘋(píng)果”選擇銷(xiāo)量最高的9家店鋪,爬取其顧客評(píng)論文本。經(jīng)過(guò)剔除“此用戶(hù)未填寫(xiě)評(píng)價(jià)內(nèi)容”等無(wú)意義文本與重復(fù)文本,共獲取有效評(píng)論9 480條。
1.2 研究方法
1.2.1 分詞與停用詞處理
在利用Python對(duì)文本進(jìn)行同類(lèi)詞合并處理的基礎(chǔ)上,使用Jieba分詞工具進(jìn)行分詞,并借助哈爾濱工業(yè)大學(xué)停用詞表進(jìn)行停用詞處理。
1.2.2 情感分析
引用百度AI開(kāi)放平臺(tái)的自然語(yǔ)言處理(Natural language processing,NLP)技術(shù)[12],對(duì)所得評(píng)論文本進(jìn)行情感傾向分析。該深度學(xué)習(xí)模塊的NLP技術(shù)包括情感分析、評(píng)論觀點(diǎn)抽取等,通過(guò)對(duì)電商評(píng)論進(jìn)行情感傾向性分析,將不同用戶(hù)對(duì)同一商品的評(píng)論內(nèi)容按情感極性予以分類(lèi)展示[13]。通過(guò)利用Python軟件調(diào)用百度API,在NLP通用模型的基礎(chǔ)上,利用上傳的特定場(chǎng)景的正/負(fù)向語(yǔ)料文本對(duì)模型進(jìn)行訓(xùn)練,從而對(duì)經(jīng)過(guò)處理后待評(píng)估的評(píng)論文本的情感極性及其置信度做出判斷。在此基礎(chǔ)上,對(duì)經(jīng)過(guò)分類(lèi)的正面情感文本與負(fù)面情感文本構(gòu)建語(yǔ)義網(wǎng)絡(luò)圖,分別進(jìn)行分析。
1.2.3 主題提取模型
LDA(Latent dirichlet allocation)主題提取模型是由“文檔-主題-詞”組成的三層貝葉斯概率模型,屬于無(wú)監(jiān)督學(xué)習(xí)方法,由Blei等[14]于2003年首次提出。目前,LDA主題模型被廣泛應(yīng)用于文本主題識(shí)別、文本分類(lèi)等自然語(yǔ)言處理領(lǐng)域[15,16]。該模型認(rèn)為,可以把每篇文檔表示為在不同主題上的概率分布,每一主題又可以看作詞語(yǔ)的概率分布,其形成的貝葉斯網(wǎng)絡(luò)模型如圖1所示。其具體過(guò)程[17]如下:①根據(jù)超參數(shù)[α],生成文檔在主題下的分布[θ],[θ]服從于以[α]為參數(shù)的迪利克雷分布;②根據(jù)超參數(shù)[β],生成詞語(yǔ)在主題下的分布[ψ],[ψ]服從于以[β]為參數(shù)的迪利克雷分布;③從文檔-主題多項(xiàng)分布中提取文檔單詞的主題分布[Z],基于主題分布和詞的多項(xiàng)分布,采樣生成最終的詞W;④將上述3步重復(fù)M次,生成長(zhǎng)度為M的文檔;⑤將上述4步重復(fù)N次,生成N個(gè)文檔。
運(yùn)用該模型時(shí),主題數(shù)量K作為該模型中的一個(gè)重要參數(shù),需要被預(yù)先設(shè)定。關(guān)于最優(yōu)主題數(shù)量的確定,目前主要有兩種方法:困惑度(Perplexity)和主題一致性(Coherence value)??紤]到困惑度指標(biāo)計(jì)算時(shí),由于其隨著主題數(shù)量的增多逐漸減少,會(huì)出現(xiàn)過(guò)擬合的問(wèn)題,本研究將主題一致性作為主要參考指標(biāo)。
2 結(jié)果與分析
2.1 在線評(píng)論文本的高頻詞與詞頻
從表1可以看出,在線文本詞句中,剔除“蘋(píng)果” “水果”等無(wú)意義基礎(chǔ)詞匯后,“好吃”“包裝”“口感”等詞語(yǔ)出現(xiàn)頻率最高,體現(xiàn)了消費(fèi)者對(duì)農(nóng)產(chǎn)品品質(zhì)的關(guān)注,結(jié)合表中其他高頻詞匯,可以看出消費(fèi)者對(duì)產(chǎn)品品質(zhì)的評(píng)定主要通過(guò)蘋(píng)果的包裝、外表以及口感三方面進(jìn)行感知;“物流”“快遞”“發(fā)貨”等涉及物流服務(wù)的詞匯也在評(píng)論文本中經(jīng)常出現(xiàn),說(shuō)明物流質(zhì)量同樣是影響消費(fèi)者對(duì)產(chǎn)品評(píng)價(jià)的重要因素。
2.2 煙臺(tái)蘋(píng)果在線評(píng)論情感分析
為了進(jìn)一步探究消費(fèi)者對(duì)該農(nóng)產(chǎn)品的情感傾向與原因,采用基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù)對(duì)所得評(píng)論文本進(jìn)行情感分析。利用Python軟件,通過(guò)API接口引入百度AI開(kāi)放平臺(tái),基于自然語(yǔ)言處理技術(shù)的基礎(chǔ)模型,選取評(píng)論文本中正向與負(fù)向語(yǔ)料各200條對(duì)模型進(jìn)行訓(xùn)練。訓(xùn)練結(jié)果顯示,優(yōu)化后的模型準(zhǔn)確率達(dá)97.62%。借助該模型得出的情感分析結(jié)果示例如表2所示,感情極性為2的表示正向,1表示中性,0表示負(fù)向,具體參數(shù)說(shuō)明見(jiàn)表3。
利用優(yōu)化后的模型,本研究得出了所有評(píng)論文本的情感分析結(jié)果,其描述性統(tǒng)計(jì)見(jiàn)表4。對(duì)于煙臺(tái)蘋(píng)果的正向評(píng)價(jià)占96.1%,中性評(píng)價(jià)占0.3%,負(fù)向評(píng)價(jià)占3.6%,說(shuō)明消費(fèi)者對(duì)于產(chǎn)品的總體滿意度較高。
在對(duì)評(píng)論文本進(jìn)行情感分類(lèi)的基礎(chǔ)上,分別針對(duì)正面與負(fù)面評(píng)論文本,利用Rost CM6軟件,在統(tǒng)計(jì)高頻詞的基礎(chǔ)上構(gòu)建語(yǔ)義網(wǎng)絡(luò)圖。語(yǔ)義網(wǎng)絡(luò)圖利用放射圖中的節(jié)點(diǎn)代表高頻詞,節(jié)點(diǎn)間的連線表示詞語(yǔ)間的共線語(yǔ)義關(guān)系,將特征詞間的關(guān)系可視化[18,19]。如圖2所示,消費(fèi)者對(duì)于產(chǎn)品正面評(píng)價(jià)的網(wǎng)絡(luò)圖以“蘋(píng)果”“京東”為核心向四周輻射,“口感”“水分”“包裝”“新鮮”“好吃”“個(gè)頭”以及“物流”等特征詞均屬于核心區(qū)域,具有較高的共線頻率,體現(xiàn)了消費(fèi)者對(duì)于產(chǎn)品口感、外表、包裝以及物流四方面的關(guān)注,與前文得出的消費(fèi)者關(guān)注的維度具有較高的一致性;其中包裝與物流因素存在一定的關(guān)聯(lián)性,對(duì)于蘋(píng)果外表因素的評(píng)價(jià)主要集中于其大小及表皮的均勻程度,對(duì)于口感因素的評(píng)價(jià)則更多地關(guān)注是否新鮮以及水分含量。而通過(guò)分析負(fù)面評(píng)論語(yǔ)義網(wǎng)絡(luò)圖(圖3),可得口感因素對(duì)于導(dǎo)致蘋(píng)果負(fù)面評(píng)論的作用并不顯著,致使消費(fèi)者對(duì)于產(chǎn)品不滿的原因主要在于物流、包裝以及售后等服務(wù)因素,具體表現(xiàn)為包裝簡(jiǎn)陋、運(yùn)輸出現(xiàn)破損、售后處理不當(dāng)?shù)仍?。在?duì)于負(fù)面評(píng)論文本人工深度閱讀的基礎(chǔ)上,結(jié)合網(wǎng)絡(luò)圖中“上次”“這次”“超市”等關(guān)鍵詞,還可以發(fā)掘很大一部分消費(fèi)者對(duì)于產(chǎn)品的不滿情緒來(lái)源于比較,即將本次購(gòu)物經(jīng)歷與先前網(wǎng)購(gòu)經(jīng)歷或與超市實(shí)體購(gòu)物經(jīng)歷進(jìn)行比較,認(rèn)為本次購(gòu)物與之相比存在差距,而產(chǎn)生失望的情緒。
2.3 LDA主題分類(lèi)
為了進(jìn)一步對(duì)評(píng)論文本進(jìn)行分析,采用無(wú)監(jiān)督學(xué)習(xí)的LDA模型對(duì)評(píng)論文本進(jìn)行主題分類(lèi),并提取各主題下的關(guān)鍵字。不同主題數(shù)目的一致性得分如圖4所示。可知主題數(shù)為5時(shí)一致性得分達(dá)到最大,所以將預(yù)先設(shè)定的分類(lèi)的主題數(shù)定為5。
最終求得的主題分類(lèi)及各主題前20個(gè)關(guān)鍵詞如表5所示,并使用pyLDAvis可視化,結(jié)果如圖5所示。評(píng)論文本的5個(gè)主題分別歸納為品種認(rèn)同(占比21.9%),服務(wù)感知(占比21.1%),產(chǎn)品質(zhì)量(占比21.1%),營(yíng)銷(xiāo)感知(占比19.5%)以及物流質(zhì)量(占比16.4%),5個(gè)主題在評(píng)論文本中的占比差異性較小。
結(jié)合各主題的關(guān)鍵詞,在品種認(rèn)同主題下,消費(fèi)者主要關(guān)注所購(gòu)產(chǎn)品的產(chǎn)地、品種,以及產(chǎn)品的口感、色澤等特質(zhì)是否符合自己已有的對(duì)于同種產(chǎn)品的認(rèn)知,通俗而言即是否正宗問(wèn)題;在服務(wù)感知主題下,除產(chǎn)品自身質(zhì)量外,發(fā)貨速度、客服、快遞小哥等服務(wù)人員的態(tài)度都是影響消費(fèi)者評(píng)價(jià)的主要因素;對(duì)于物流質(zhì)量,考慮到果蔬的易損性,是否有泡沫填充等包裝問(wèn)題成為消費(fèi)者關(guān)注的重點(diǎn),而相對(duì)削弱了對(duì)于送達(dá)速度的關(guān)注;在產(chǎn)品質(zhì)量主題下,對(duì)于產(chǎn)品的外觀,消費(fèi)者的主要評(píng)價(jià)維度為大小、重量以及色澤,對(duì)于產(chǎn)品的口感,消費(fèi)者的主要評(píng)價(jià)維度為水分、甜度以及清爽度,同時(shí)消費(fèi)者還會(huì)關(guān)注產(chǎn)品的氣味;在營(yíng)銷(xiāo)感知主題下,商家的優(yōu)惠活動(dòng)、折扣的力度成為消費(fèi)者關(guān)注的重點(diǎn),結(jié)合原始文本還可以發(fā)現(xiàn),疫情防控條件下,無(wú)法去實(shí)體水果店購(gòu)買(mǎi)而被線上購(gòu)物宣傳所吸引,成為消費(fèi)者消費(fèi)的重要原因。
基于LDA主題分類(lèi)的結(jié)果,對(duì)隸屬于5個(gè)主題的評(píng)論文本分別進(jìn)行情感分析,其負(fù)面評(píng)論文本比例如圖6所示。由圖6可知,5個(gè)主題中,消費(fèi)者對(duì)于品種認(rèn)同的消極情緒較為突出,對(duì)于服務(wù)感知的積極情緒較突出,另外3個(gè)主題的評(píng)論情感性質(zhì)差異較小,但對(duì)于所有主題的評(píng)論總體趨向于正面。因而,加強(qiáng)消費(fèi)者對(duì)于品種的認(rèn)同是該產(chǎn)品商家的主要改進(jìn)方向。
3 建議
基于上述分析,提出如下提升農(nóng)產(chǎn)品消費(fèi)者滿意度的建議。
1)打響招牌,建立與維護(hù)品牌與品種認(rèn)同。地理標(biāo)志與品種標(biāo)志的信譽(yù)是吸引煙臺(tái)蘋(píng)果等農(nóng)產(chǎn)品購(gòu)買(mǎi)者的重要因素。對(duì)于已經(jīng)形成區(qū)域品牌標(biāo)志的產(chǎn)品,消費(fèi)者往往具有較高的期望與積極的地理特質(zhì)印象。煙臺(tái)蘋(píng)果由于其悠久的栽種歷史、品種質(zhì)量的優(yōu)越性,建立了廣泛的市場(chǎng)口碑。一方面,商家需要從源頭把控,保證產(chǎn)品的真材實(shí)料,使得產(chǎn)品符合消費(fèi)者對(duì)于“煙臺(tái)蘋(píng)果”“富士品種”的預(yù)期認(rèn)知,確保產(chǎn)品的“正宗”問(wèn)題,并通過(guò)維持、提升產(chǎn)品質(zhì)量,不斷鞏固品牌與品種聲譽(yù);另一方面,電商平臺(tái)方、國(guó)家有關(guān)市場(chǎng)部門(mén)需要加強(qiáng)對(duì)網(wǎng)店的監(jiān)管,加大對(duì)于假冒偽劣、產(chǎn)品侵權(quán)等擾亂市場(chǎng)秩序的不法行為的打擊力度,并通過(guò)建立溯源數(shù)據(jù)平臺(tái)、推廣防偽二維碼等行為為消費(fèi)者提供購(gòu)買(mǎi)保證,保護(hù)煙臺(tái)蘋(píng)果的品牌聲譽(yù)與消費(fèi)者忠誠(chéng)度。
2)提升服務(wù)與物流質(zhì)量,改善消費(fèi)者購(gòu)物體驗(yàn)。網(wǎng)店服務(wù)質(zhì)量與物流質(zhì)量是影響消費(fèi)者購(gòu)物體驗(yàn)的重要因素。關(guān)于服務(wù)提升,除了清晰友好的門(mén)店頁(yè)面設(shè)計(jì)、禮貌專(zhuān)業(yè)的客服回復(fù)等通用要求,考慮到農(nóng)蔬產(chǎn)品的特殊性質(zhì),損壞、腐壞現(xiàn)象難以避免,高效、符合消費(fèi)者利益的售后處理成為提升消費(fèi)者滿意度的關(guān)鍵手段;物流運(yùn)輸方面,除了下單后的發(fā)貨與運(yùn)送速度,例如店家是否用泡沫進(jìn)行保護(hù)等對(duì)于蘋(píng)果外包裝的選擇也直接影響消費(fèi)者對(duì)于本次購(gòu)物的評(píng)價(jià)。
3)品質(zhì)為先,質(zhì)量為基。產(chǎn)品質(zhì)量是支撐顧客滿意度的核心要素,對(duì)于煙臺(tái)蘋(píng)果質(zhì)量的評(píng)定,外觀、口感、氣味都是消費(fèi)者關(guān)注的重要維度。從產(chǎn)地抓起、從源頭抓起,實(shí)現(xiàn)對(duì)種植、采摘、運(yùn)輸、包裝全過(guò)程管理,加強(qiáng)對(duì)產(chǎn)品質(zhì)量的檢驗(yàn)與監(jiān)督。采取精細(xì)化種植,保證果實(shí)的自然成熟,積極推廣無(wú)公害綠色產(chǎn)品。面對(duì)不同消費(fèi)者群體,采取明確的分級(jí)標(biāo)準(zhǔn),并按照標(biāo)準(zhǔn)如實(shí)分類(lèi),杜絕小果、劣果偽冒充數(shù)行為,保證產(chǎn)品質(zhì)量合格、數(shù)量達(dá)標(biāo)。
4)找準(zhǔn)市場(chǎng)定位,創(chuàng)新?tīng)I(yíng)銷(xiāo)形式。結(jié)合“脆甜多汁”“霜降成熟”“現(xiàn)摘現(xiàn)發(fā)”等產(chǎn)品特點(diǎn)與競(jìng)爭(zhēng)優(yōu)勢(shì),制定相應(yīng)的宣傳營(yíng)銷(xiāo)策略,并通過(guò)商品標(biāo)題、首頁(yè)圖片、文案介紹等方式將信息準(zhǔn)確傳遞給目標(biāo)消費(fèi)者;與時(shí)俱進(jìn),適應(yīng)網(wǎng)絡(luò)營(yíng)銷(xiāo)新模式,利用網(wǎng)絡(luò)購(gòu)物節(jié)、直播帶貨、大V推薦、免費(fèi)試吃等方式,拓寬農(nóng)產(chǎn)品營(yíng)銷(xiāo)渠道,利用數(shù)字經(jīng)濟(jì)為實(shí)體經(jīng)濟(jì)發(fā)展賦能。
4 小結(jié)
隨著互聯(lián)網(wǎng)經(jīng)濟(jì)的發(fā)展,電商平臺(tái)越來(lái)越成為農(nóng)產(chǎn)品銷(xiāo)售的重要渠道。不同于傳統(tǒng)的線下銷(xiāo)售,電商平臺(tái)上龐大的在線評(píng)論文本數(shù)據(jù)不僅能夠?yàn)橄M(fèi)者的決策提供參考依據(jù),而且為商家與其現(xiàn)實(shí)消費(fèi)者間搭建起直接的交互渠道。商家可以利用評(píng)論文本獲取消費(fèi)過(guò)的客戶(hù)的觀點(diǎn)與建議,從而改進(jìn)產(chǎn)品的質(zhì)量、完善門(mén)店的服務(wù)、提升自己的營(yíng)銷(xiāo)策略,最終獲取更大利潤(rùn)。本研究以京東電商平臺(tái)作為數(shù)據(jù)源,利用Python爬蟲(chóng)技術(shù)爬取煙臺(tái)蘋(píng)果商品下用戶(hù)的評(píng)論數(shù)據(jù)作為語(yǔ)料庫(kù)。在對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理的基礎(chǔ)上,引入百度AI平臺(tái)的自然語(yǔ)言處理技術(shù),對(duì)于評(píng)論文本進(jìn)行情感分析,并對(duì)分類(lèi)好的正面評(píng)論文本與負(fù)面評(píng)論文本分別進(jìn)行研究。結(jié)果表明,評(píng)論文本中,對(duì)于煙臺(tái)蘋(píng)果的正向評(píng)價(jià)占96.1%,中性評(píng)價(jià)占0.3%,負(fù)向評(píng)價(jià)占3.6%;同時(shí),采用LDA主題提取模型,根據(jù)主題一致性指標(biāo),評(píng)論文本內(nèi)容可以聚類(lèi)為品種認(rèn)同、服務(wù)感知、產(chǎn)品質(zhì)量、營(yíng)銷(xiāo)感知以及物流質(zhì)量5個(gè)主題。消費(fèi)者對(duì)于煙臺(tái)蘋(píng)果的總體滿意度較高,加強(qiáng)消費(fèi)者的品種認(rèn)同是未來(lái)的重要改進(jìn)方向。總體而言,本研究為農(nóng)產(chǎn)品電商銷(xiāo)售的顧客滿意度信息獲取提供了新的思路,且方法具有合理性與普適性。
參考文獻(xiàn):
[1] SAPHORES J D, XU L. E-shopping changes and the state of E-grocery shopping in the US-Evidence from national travel and time use surveys[J]. Research in transportation economics,2021,87(C):1-13.
[2] MCGUIRT J T,JILCOTT PITTS S B,LABBAN J D,et al. Evidence of geospatial and socioeconomic disparities in access to online grocery shopping for fresh and frozen produce in North Carolina[J]. Journal of the academy of nutrition and dietetics, 2022,122(11): 2106-2114.
[3] ALAIMO L S, FIORE M, GALATI A. Measuring consumers’ level of satisfaction for online food shopping during COVID-19 in Italy using POSETs[J]. Socio-economic planning sciences, 2021, 82: 101064.
[4] 王冠寧.消費(fèi)者網(wǎng)購(gòu)生鮮農(nóng)產(chǎn)品滿意度影響因素實(shí)證研究[J].商業(yè)經(jīng)濟(jì)研究,2018(6):47-49.
[5] 李 蕾,林家寶,黃 士.農(nóng)產(chǎn)品電子商務(wù)顧客滿意度和忠誠(chéng)度的形成機(jī)制研究——基于感知價(jià)值和服務(wù)質(zhì)量的視角[J].世界農(nóng)業(yè),2017(11):97-103.
[6] 吳欣霞,李連英.消費(fèi)者網(wǎng)購(gòu)地理標(biāo)志農(nóng)產(chǎn)品滿意度影響因素研究——以贛南臍橙為例[J].農(nóng)村經(jīng)濟(jì)與科技,2019,30(3):146-147,219.
[7] 李萬(wàn)斌,郭瑾瑜,黃 鈺,等.農(nóng)產(chǎn)品區(qū)域公用品牌顧客滿意度提升探究——以青州蜜桃為例[J].農(nóng)業(yè)工程,2022,12(5):143-148.
[8] GROVES R M. Nonresponse rates and nonresponse bias in household surveys[J].Public opinion quarterly,2006,70(5):646-675.
[9] JIN J, LIU Y, JI P, et al. Review on recent advances in information mining from big consumer opinion data for product design[J].Journal of computing and information science in engineering,2019," " "19(1):010801.
[10] FAN Z P,CHE Y J,CHEN Z Y. Product sales forecasting using online reviews and historical sales data:A method combining the Bass model and sentiment analysis[J]. Journal of business research,2017,74(5):90-100.
[11] 徐德華,張心怡.基于網(wǎng)絡(luò)購(gòu)物平臺(tái)的在線評(píng)論研究綜述[J].情報(bào)探索,2022(5):118-124.
[12] 百度大腦. 百度 AI 開(kāi)發(fā)平臺(tái)[EB/OL]. https://ai.baidu.com,2021-02-01.
[13] 王 琴,劉 毅.基于網(wǎng)絡(luò)評(píng)論情感分析和QFD的產(chǎn)品改進(jìn)設(shè)計(jì)[J].包裝工程,2021,42(24):169-174.
[14] BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of machine learning research, 2003, 3(4-5):993-1022.
[15] 俞紅海,范思妤,吳良鈺,等.科創(chuàng)板注冊(cè)制下的審核問(wèn)詢(xún)與IPO信息披露——基于LDA主題模型的文本分析[J].管理科學(xué)學(xué)報(bào),2022,25(8):45-62.
[16] 曹樹(shù)金,曹茹燁.情報(bào)學(xué)論文創(chuàng)新性評(píng)價(jià)研究——LDA和SVM融合方法的應(yīng)用[J].圖書(shū)情報(bào)知識(shí),2022,39(4):56-67.
[17] 翟君偉,瞿 英,郭 菲,等.基于LDA主題模型的文獻(xiàn)特征項(xiàng)多重共現(xiàn)可視化方法[J].河北科技大學(xué)學(xué)報(bào),2022,43(2):182-193.
[18] 張公讓?zhuān)U 超,王曉玉,等.基于評(píng)論數(shù)據(jù)的文本語(yǔ)義挖掘與情感分析[J].情報(bào)科學(xué),2021,39(5):53-61.
[19] 譚 熒,張 進(jìn),夏立新.語(yǔ)義網(wǎng)絡(luò)發(fā)展歷程與現(xiàn)狀研究[J].圖書(shū)情報(bào)知識(shí),2019(6):102-110.
收稿日期:2023-04-11
基金項(xiàng)目:2020年度河南省哲學(xué)社會(huì)科學(xué)規(guī)劃辦公室決策咨詢(xún)項(xiàng)目(2020JC29)
作者簡(jiǎn)介:丁健莉(2002-),女,河南南陽(yáng)人,在讀本科生,專(zhuān)業(yè)方向?yàn)檗r(nóng)業(yè)經(jīng)濟(jì),(電話)18262261735(電子信箱)2609783896@qq.com;通信作者,周青?。?973-),男,河南內(nèi)鄉(xiāng)人,教授,碩士,主要從事公司財(cái)務(wù)和區(qū)域經(jīng)濟(jì)研究,(電話)13703458800(電子信箱)685099zhouqingfu@163.com。