• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    顧客網(wǎng)絡(luò)購物滿意度影響因素的文本挖掘與主題提取研究

    2022-06-28 02:56:16何有世溫玉美
    軟件導(dǎo)刊 2022年6期
    關(guān)鍵詞:詞頻文檔購物

    何有世,溫玉美

    (江蘇大學(xué)管理學(xué)院,江蘇鎮(zhèn)江 212013)

    0 引言

    近年來,隨著電子商務(wù)與互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)購物已成為消費者購物的主要方式之一。2021 年中國互聯(lián)網(wǎng)信息中心發(fā)布的第47 次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,2020 年我國網(wǎng)上零售額達11.76 萬億元,同比增長10.9%,其中實物商品的網(wǎng)上零售額達9.76 萬億元,占社會消費品零售總額的24.9%[1]。由此可見,我國網(wǎng)絡(luò)購物的市場規(guī)模在不斷擴大,電子商務(wù)成為眾多企業(yè)和商家必選的營銷渠道,競爭日益激烈。然而,用戶滿意度是消費者購買的決定性因素[2],因此研究影響顧客網(wǎng)絡(luò)購物滿意度因素則顯得愈發(fā)重要。

    據(jù)2021 年《中國電子商務(wù)用戶體驗與投訴數(shù)據(jù)報告》顯示,退款問題、商品質(zhì)量、網(wǎng)絡(luò)欺詐、售后服務(wù)、網(wǎng)絡(luò)售假、虛假促銷等是零售商被投訴的主要原因[3]。由此可見,網(wǎng)絡(luò)購物中存在諸多影響顧客購物滿意度的問題。消費者負面的網(wǎng)購體驗,一方面影響了其回購的可能性,另一方面易于使其產(chǎn)生負面影響。當顧客購物滿意度較高時,極可能向周圍朋友推薦產(chǎn)品,從而間接宣傳了產(chǎn)品和商家[4]。因此,研究顧客購物滿意度與何種因素相關(guān),并進一步分析其中的核心因素,可幫助企業(yè)、商家獲取消費者的信任,制定相應(yīng)的營銷策略,對提高市場競爭力具有重要意義。

    隨著城市化和工業(yè)化進程的加快,農(nóng)村大量年輕勞動力涌向城鎮(zhèn),常住居民中老年人口數(shù)量相對較多,人口老齡化現(xiàn)象嚴重。尤其是丘陵山區(qū)村莊,常住人口以老年人為主,亟待建設(shè)養(yǎng)老設(shè)施[8]。此外,村級日間照料中心設(shè)置較少,沒有形成一定的規(guī)模。

    實驗不僅是生命觀念和科學(xué)思維的實踐,也是培養(yǎng)社會責任的途徑?!澳M尿糖的檢測”中有一個問題: 醫(yī)生僅憑一份尿液樣本就能斷定某人患糖尿病嗎?意在引導(dǎo)學(xué)生基于生物學(xué)的認識,參與個人與社會事物的討論,并作出理性解釋和判斷。教師可引導(dǎo)學(xué)生進行充分討論,并達成統(tǒng)一認識: 僅憑一份尿液樣本不能斷定某人患糖尿病,食糖過多使血糖暫時過高,也會導(dǎo)致尿液中暫時出現(xiàn)葡萄糖。從而理解任何確診或治療決策都不能基于某一單項檢測結(jié)果。此外,通過關(guān)注糖尿病,鼓勵學(xué)生宣傳關(guān)愛生命的觀念和知識,崇尚健康的生活方式。再如在“種群的特征”的教學(xué)中,引導(dǎo)學(xué)生從年齡結(jié)構(gòu)的角度解讀全面二胎政策,關(guān)注社會議題。

    目前,各網(wǎng)絡(luò)購物平臺都具有用戶評論功能,消費者會對網(wǎng)購后的購買經(jīng)歷、產(chǎn)品質(zhì)量、售前服務(wù)、物流、售后服務(wù)等方面進行評論[5]。這些評論客觀反映消費者網(wǎng)購體驗]的同時,提供了海量數(shù)據(jù)[6-7。隨著文本挖掘技術(shù)的不斷發(fā)展,學(xué)者們開始運用LDA(Latent Dirichlet Alloca?tion)模型識別在線評論的主題,挖掘消費者的真實需求。通過LDA 模型提取評論主題不但體現(xiàn)了消費者的偏好特征[8-9],并且反映了消費者在消費體驗過程中的關(guān)注重點[10],因此部分學(xué)者將在線評論主題作為影響顧客滿意度的重要因素。Guo 等[11]運用LDA 模型從在線評論中提取酒店顧客滿意度影響因素。Situmean 等[12]通過LDA 模型挖掘影響餐廳顧客滿意度的重要因素。馮坤等[13]將LDA模型提取在線評論主題作為影響生鮮電商滿意度的重要因素。此外,相較于傳統(tǒng)顧客滿意度調(diào)查方法,采集在線評論不受時間、人工成本等因素影響。鑒于此,本文通過采集顧客的在線評論,運用LDA 模型識別顧客在線評論主題,提取網(wǎng)絡(luò)購物滿意度的影響因素。

    1 相關(guān)工作

    目前關(guān)于網(wǎng)絡(luò)購物顧客滿意度影響因素的研究中,大多從實證研究角度,通過問卷調(diào)查、文獻調(diào)研、訪談等方式收集數(shù)據(jù)開展研究。例如,Agnihotri 等[14]通過問卷調(diào)查方式搜集在線客服的相關(guān)數(shù)據(jù),研究在線客服與客戶之間的溝通對顧客滿意度的影響。孫永波等[15]采用小組座談和文獻分析法總結(jié)消費者對網(wǎng)絡(luò)商店滿意度的影響因素。然而,隨著互聯(lián)網(wǎng)和電子商務(wù)的不斷發(fā)展,在線評論系統(tǒng)成為了企業(yè)與客戶交流的重要工具[16-17],逐漸被學(xué)術(shù)界所重視。少部分學(xué)者通過不同研究方法,從顧客在線評論中提取影響顧客滿意度因素。例如,李玉萍等[18]通過內(nèi)容分析法對顧客的在線評論進行編碼分析,提取了影響顧客滿意度因素包括質(zhì)量、顧客期望、顧客成本、產(chǎn)品描述、尺碼、賣家服務(wù)、物流服務(wù)和社會價值。

    綜上所述,目前相關(guān)研究僅從理論角度出發(fā)研究影響顧客網(wǎng)購滿意度因素,忽視了顧客在線評論往往直接反映了顧客網(wǎng)絡(luò)購物滿意度。雖有學(xué)者采用內(nèi)容分析法對顧客在線評論進行編碼分析,研究影響顧客購物滿意度因素。但在大數(shù)據(jù)時代背景下,面對海量在線顧客評論,該方法需要耗費大量的人力和時間,效率較低。而LDA 模型可將非結(jié)構(gòu)化的文本轉(zhuǎn)化為數(shù)字信息,易于文本建模,提高了數(shù)據(jù)處理效率,因此采用LDA 文本挖掘方法,從顧客網(wǎng)購評論中提取影響顧客滿意度的相關(guān)因素。

    2 LDA主題模型應(yīng)用原理

    在Hofmann[19]提出概率潛在語義分析(Probabilistic Latent Semantic Analysis,PLSA)模型的基礎(chǔ)上,Blei 等[20]于2003 年提出了LDA 主題模型,推測文檔的主題分布。目前主題模型已成為文本挖掘的重要技術(shù)之一,并廣泛應(yīng)用于數(shù)據(jù)挖掘、文本分類聚類、自然語言處理等領(lǐng)域。該模型將主題作為單詞的概率分布,通過提取單詞在文檔的共現(xiàn)信息與文檔語義相關(guān)的主題,并將所有文檔主題以概率分布的形式顯示,然后抽取部分文檔主題進行聚類。在該過程中,LDA 主題模型實現(xiàn)了從高維單詞空間到低維主題空間的映射[21],可有效實現(xiàn)文本降維,提取文本主題內(nèi)容,生成文檔——主題矩陣與主題——詞匯矩陣,為客觀研究顧客滿意度影響因素提供了技術(shù)支撐,同時企業(yè)或商家能夠深入了解顧客的消費偏好。LDA 主題模型的圖模型如圖1所示。

    Fig.1 Graph model of LDA topic model圖1 LDA主題模型的圖模型

    ②高壓水泵用于將清水壓入孔內(nèi),啟動壓力大于20pa。向缺陷中從頂部到底部噴射水流。噴管提升速度為10cm/min,轉(zhuǎn)速為20r/min。處理長度應(yīng)為缺陷處上下50cm,高壓水流將灌樁的缺陷部分切割成泥漿狀。當切開一個孔而另一個孔溢出時,可以確定缺陷處已經(jīng)被擊通。然后換另個一孔直到全部打通位置,在所有鉆孔連通后,通過水循環(huán)從樁體排出內(nèi)部廢渣。當所有孔中的水流變成清水時,表明完成廢渣的清洗工作。

    一般將困惑度(perplexity)作為主題模型泛化能力的評價標準[20],困惑度較低表明該模型具有良好的泛化能力,效果較好。假設(shè)文本語料庫中有M個測試文檔,其中文檔d中含有Nd個單詞,測試集中每個單詞出現(xiàn)的概率為p(w),則模型的困惑度計算公式如式(1)所示:

    3 研究思路

    在自然語言處理中,連詞、助詞、介詞等統(tǒng)稱為停用詞。由圖3 可見,“這個”“而且”“還是”的字體較大,表明該類詞的詞頻較高,不僅占用了大量的存儲空間,還影響數(shù)據(jù)的處理效率。因此,需要去除高頻且有效信息較少的詞語。本文通過對哈工大停用詞詞庫、百度停用詞詞表、四川大學(xué)機器學(xué)習智能實驗室停用詞庫等常見停用詞詞庫進行整合,提取了一個較為全面的停用詞詞表。

    本文采用結(jié)巴中文分詞工具對采集的評論數(shù)據(jù)進行分詞處理,然而結(jié)巴自帶的字典僅適用于普通文本,由于電商評論存在領(lǐng)域內(nèi)的特殊詞匯,導(dǎo)致結(jié)巴分詞的準確度下降。為此構(gòu)建了自定義詞典,其中添加了“京東物流”“服務(wù)態(tài)度”“運行速度”等特殊詞語。然而顧客在評論時,通常會使用口語化的表述,例如:“物流特別快”“特別給力”等,此時分詞器將無法進行識別,因此要將該類詞手工添加到詞典中,并對評論文本中意思相近的詞進行整合。例如,將“商家”“店家”“店鋪”“賣家”統(tǒng)稱為“商家”,將“快遞員”“快遞小哥”“小哥”“配送員”統(tǒng)稱為“快遞員”等。分詞后通過如圖3 所示的詞云形式對詞頻排列在前50 的詞語進行展示。其中,詞云中字體大小代表詞頻大小,字體越大,表示詞頻越高。

    其中,M為文檔集合中的文檔個數(shù),N為文檔中包含的詞匯個數(shù)。假定文檔集合含有K個主題,則LDA 模型參數(shù)β的Dirichlet 分布可生成K個多項分布。文檔的主題概率分布同樣由Dirichlet 分布產(chǎn)生,其中α為產(chǎn)生文檔主題概率的模型參數(shù),θ為文檔主題的概率分布,z為文檔主題詞匯的多項分布,w為主題詞匯的多項分布。

    1.1 對象 選擇2011年1—12月在我院行前列腺電切術(shù)患者40例為觀察組,年齡53~79歲,平均年齡68.0歲,實施臨床護理路徑方法;以2010年1—12月在我院行前列腺電切術(shù)患者40例為對照組,年齡在56~81歲,平均年齡71.0歲,采用常規(guī)護理方法。入選條件:診斷明確,沒有嚴重的合并癥,且患者能配合完成各項治療和護理。兩組患者在年齡、文化程度等比較差異無統(tǒng)計學(xué)意義(P>0.05),具有可比性。

    步驟2:運用LDA 模型提取評論主題,需要完成以下任務(wù):①確定主題數(shù)(主題數(shù)值過大或過小都會影響分析結(jié)果的準確性);②利用LDA 模型尋找主題,構(gòu)建主題詞匯矩陣。

    步驟3:通過詞頻統(tǒng)計與LDA 模型結(jié)果分析,探析顧客網(wǎng)購滿意度影響因素。

    Fig.2 Technology road圖2 技術(shù)路線

    4 在線顧客評論數(shù)據(jù)采集與預(yù)處理

    京東購物平臺自動過濾了一部分無效評論(顧客進行了評分但未進行評論),相較于其它購物平臺,該平臺評論語句較長,評論數(shù)據(jù)的整體質(zhì)量較高。因此,本文選取了京東商城消費者評價數(shù)據(jù)作為挖掘顧客網(wǎng)購滿意度影響因素的數(shù)據(jù)源。

    4.1 數(shù)據(jù)采集

    京東商城允許采集一定數(shù)量的評論,每款產(chǎn)品最多采集1 000 條評論,于是選取每種類型中銷量最靠前的2 款產(chǎn)品進行評論采集。本文利用Python 爬蟲技術(shù)采集京東商城中部分商品評論,為了避免評論數(shù)據(jù)采集片面化而影響研究結(jié)果的客觀性,實驗共采集了10 款商品的評論數(shù)據(jù),共計10 000 條。分別從家用電器、生活日用、手機、母嬰及食品這5 種類別中選取兩個銷量靠前的京東自營商品,具體數(shù)據(jù)見表1。

    Table 1 Collection list of commodity reviews表1 商品評論采集列

    通過數(shù)據(jù)清洗后,整理了9 785 條顧客評論數(shù)據(jù)作為數(shù)據(jù)集,其中評論數(shù)據(jù)的基本特征如表2所示。

    Table 2 Basic characteristics of review data表2 評論數(shù)據(jù)的基本特征

    4.2 數(shù)據(jù)預(yù)處理

    4.2.2 數(shù)據(jù)分詞

    教育是農(nóng)業(yè)不是工業(yè),實施學(xué)校教育的目的不是把學(xué)生們都培養(yǎng)成機械、木訥的工業(yè)復(fù)制品,而是要給學(xué)生們其成長所需要的陽光和養(yǎng)分,讓學(xué)生們能夠充分按照其成長藍圖茁壯健康成長。因此,在小學(xué)數(shù)學(xué)教學(xué)過程中,我們應(yīng)該充分注重數(shù)學(xué)課堂的個性化建設(shè),關(guān)注學(xué)生們的個性化發(fā)展。

    4.2.1 數(shù)據(jù)清洗

    步驟1:通過爬蟲采集京東商城的顧客評論,并根據(jù)預(yù)處理后的評論數(shù)據(jù)繪制詞云圖與詞頻統(tǒng)計圖。

    Fig.3 Word cloud圖3 詞云圖

    4.2.3 去停用詞

    由此可見,盡管人文主義者們崇尚古典智慧,歌頌古人的生活方式,但他們并非對任何時代的思想和理念全盤接受。他們更多的是“借古諷今”,運用古人智慧來解決現(xiàn)世社會中的“問題”。

    由于采集的評論數(shù)據(jù)中包含表情、英文字符等無關(guān)數(shù)據(jù),還存在評論內(nèi)容重復(fù)或為空,因此需要對采集的初始數(shù)據(jù)進行清洗。為了便于實驗,本文在數(shù)據(jù)清洗中只保留漢字字符。

    本文通過爬蟲采集顧客評論對評論文本依次進行去重、分詞及去停用詞處理,并利用Python 中的matplotlib 工具包繪制詞頻統(tǒng)計圖,最后使用LDA 主題模型提取評論主題。研究技術(shù)路線如圖2所示。

    5 顧客評論數(shù)據(jù)分析

    5.1 詞頻統(tǒng)計分析

    分詞后對顧客評論的結(jié)果進行詞頻統(tǒng)計,按照詞頻大小從高到低進行排序,通過Python 的matplotlib 工具繪制排列位于前20 的高頻詞,如圖4 所示。高頻關(guān)鍵詞是指顧客在線購物評論中出現(xiàn)頻率較高,在一定程度上反映顧客網(wǎng)購關(guān)注重點的詞語。由圖4 可見,出現(xiàn)頻率較高的褒義詞,例如“喜歡”“不錯”“滿意”“好看”“好吃”等,表明消費者對網(wǎng)購產(chǎn)品的整體感受較為滿意。其次,描述產(chǎn)品屬性詞的詞頻較高,例如“品牌”“產(chǎn)品”“質(zhì)量”“功能”“外觀”等均位居前十。除此之外,產(chǎn)品價格和服務(wù)也是消費者網(wǎng)購時所關(guān)注的重點,例如“價格”“物流”“速度”“包裝”“服務(wù)”等。

    Fig.4 Statistical of word frequency圖4 詞頻統(tǒng)計

    5.2 LDA模型分析

    (1)確定主題數(shù)。LDA 模型可有效降維文本數(shù)據(jù),挖掘潛在主題,但難以確定LDA 模型的主題數(shù)。當主題數(shù)過大時,會導(dǎo)致主題語義信息不明確;主題數(shù)較小時,會導(dǎo)致單個主題蘊含多層語義信息,因此確定主題數(shù)至關(guān)重要[22-23]。目前通常使用Perplexity 函數(shù)[24]確定主題數(shù),理論上困惑度的大小與模型生成文檔的能力和泛化能力成反比,因此最優(yōu)主題個數(shù)K為最小困惑度對應(yīng)的主題數(shù)。困惑度隨模型主題數(shù)變化的趨勢如圖5所示。

    由圖5 可見,隨著主題數(shù)不斷增加,模型困惑度呈現(xiàn)先減少后增加的趨勢。當主題數(shù)K=5 或6 時,模型的困惑度達到最小,表示此時模型的效果較好。通過比較K=5 與K=6 時LDA 模型的結(jié)果,發(fā)現(xiàn)K=5 時每個主題含有多層語義信息,而K=6 時每個主題的語義信息更為明確,因此本文LDA 模型的主題數(shù)目K取值為6。

    Fig.5 The trend of confusion degree changing with the number of model topics圖5 困惑度隨模型主題數(shù)變化的趨勢

    (2)LDA 模型結(jié)果分析。確定參數(shù)后對LDA 模型進行訓(xùn)練,輸出每個主題詞匯。如表3 所示,提取位于前10 的詞作為該主題代表詞,并按照具體內(nèi)容進行分類。

    4.物聯(lián)網(wǎng)企業(yè)融資困難。作為戰(zhàn)略新興產(chǎn)業(yè),物聯(lián)網(wǎng)產(chǎn)業(yè)屬于高風險、投資大的產(chǎn)業(yè),需要巨額的資金投入,尤其在企業(yè)發(fā)展的初期,這往往令一般的中小企業(yè)投資者望而生畏。如果能有效解決物聯(lián)網(wǎng)企業(yè)發(fā)展過程中企業(yè)的融資難問題,使資金能順暢進入物聯(lián)網(wǎng)企業(yè),無疑,可加速物聯(lián)網(wǎng)企業(yè)的發(fā)展。目前來看,以戰(zhàn)略性新興中小企業(yè)為例,其銀行信貸的比例極低,僅占全部中小企業(yè)的10%左右,而在美國這一比例高達33%,資金不足成為物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展過程中無法回避的問題。

    通過分析每個主題代表詞,最終得到5 個主題(見表3)。實驗結(jié)果表明,產(chǎn)品質(zhì)量(A)、產(chǎn)品設(shè)計、產(chǎn)品質(zhì)量(B)、物流服務(wù)、產(chǎn)品價格及品牌信譽是顧客網(wǎng)購時最為關(guān)注的主題。通過具體分析發(fā)現(xiàn),在主題編號一與三中,“質(zhì)量”“材質(zhì)”“性能”等詞的權(quán)重較大,表明顧客對產(chǎn)品質(zhì)量要求較高。在產(chǎn)品設(shè)計方面,“外觀”“設(shè)計”“功能”“容量”等詞擁有較高權(quán)重,表明顧客較為看重產(chǎn)品設(shè)計。在物流服務(wù)方面,“物流”“服務(wù)”“速度”等詞所占權(quán)重較高,表明物流服務(wù)是影響消費者網(wǎng)絡(luò)購物滿意度的重要因素。在產(chǎn)品價格方面,“產(chǎn)品”“價格”等詞語的權(quán)重較大,表明產(chǎn)品價格是消費者網(wǎng)絡(luò)購物時著重考慮的因素之一。另外,品牌信譽同樣也是消費者線上購買產(chǎn)品時考慮的重要因素之一。

    Table 3 LDA model results表3 LDA模型結(jié)果

    6 結(jié)語

    本文基于LDA 模型對影響顧客網(wǎng)購滿意度因素進行研究,從大量顧客評論中挖掘產(chǎn)品設(shè)計這一新的影響因素。表明消費者在關(guān)注產(chǎn)品質(zhì)量、產(chǎn)品價格、物流服務(wù)及品牌信譽的同時,也在關(guān)注產(chǎn)品的外觀設(shè)計。良好的外觀設(shè)計能為消費者帶來視覺上的享受,簡單易操作的功能設(shè)計可便于消費者使用,因此企業(yè)可從外觀與功能設(shè)計方面對產(chǎn)品進行提升。

    相較于以往研究,依據(jù)顧客個體意見表達的大數(shù)據(jù)文本集,運用LDA 主題模型提取影響顧客網(wǎng)購滿意度因素,并通過實驗驗證該模型能夠有效挖掘顧客在線評論的潛在信息具有顯著的優(yōu)勢。

    該項目致力于將“高遠”貧苦地區(qū)的綠色食材和美食文化從山野田間推廣到城市餐桌。其中,“高遠”泛指以云南、新疆、西藏等深度貧困地區(qū),重點關(guān)注上海對口幫扶的“高遠”地區(qū),即云南、新疆喀什、西藏日喀則、青海果洛、貴州遵義、重慶萬州、湖北夷陵等7個省區(qū)市20個地州市101個縣市區(qū),涉及貧困人口近300萬。

    但該模型需要通過困惑度確定最優(yōu)主題數(shù)K,后續(xù)將通過實驗,嘗試多種智能方法確定最佳主題數(shù)K,并結(jié)合情感分析技術(shù)探究消費者的情感傾向,為企業(yè)和商家提供更優(yōu)質(zhì)的服務(wù)。

    猜你喜歡
    詞頻文檔購物
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    有人一聲不吭向你扔了個文檔
    圣誕購物季
    基于RI碼計算的Word復(fù)制文檔鑒別
    快樂六一,開心購物!
    不可錯過的“購物”APP
    Coco薇(2015年5期)2016-03-29 23:34:28
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    詞頻,一部隱秘的歷史
    云存儲中支持詞頻和用戶喜好的密文模糊檢索
    以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報》學(xué)術(shù)研究特色
    圖書館論壇(2014年8期)2014-03-11 18:47:59
    罗山县| 渭南市| 江城| 本溪| 海口市| 麦盖提县| 德州市| 灵川县| 米林县| 尤溪县| 东丰县| 北流市| 拜泉县| 临澧县| 石嘴山市| 龙川县| 定安县| 泌阳县| 沾化县| 金寨县| 本溪| 巩义市| 哈尔滨市| 江口县| 云林县| 本溪市| 普兰店市| 绥化市| 永修县| 高密市| 安徽省| 海林市| 绥芬河市| 理塘县| 神农架林区| 丰县| 安平县| 江达县| 昆明市| 娱乐| 雷山县|