張文杰 肖茜 張繼娟*
(中南林業(yè)科技大學(xué)家具與藝術(shù)設(shè)計(jì)學(xué)院,湖南 長(zhǎng)沙 410004)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,人們的消費(fèi)方式逐漸從線下轉(zhuǎn)到線上,各種電商平臺(tái)里的商品琳瑯滿目,用戶可以在購(gòu)買商品后根據(jù)自己的使用體驗(yàn)發(fā)表自己對(duì)產(chǎn)品的評(píng)價(jià),這些評(píng)論可以幫助其他消費(fèi)者更好地了解產(chǎn)品質(zhì)量,幫助他們甄別商品,同時(shí)也能幫助廠商更好地了解消費(fèi)者的需求以及產(chǎn)品需要改進(jìn)的地方。家具行業(yè)作為傳統(tǒng)制造業(yè),在轉(zhuǎn)型電商的過程中會(huì)遇到許多困難和挑戰(zhàn)。目前涉足家具領(lǐng)域的線上電商平臺(tái)主要有京東、天貓、亞馬遜、淘寶、蘇寧易購(gòu)等,受疫情影響,宅家線上辦公成為上班族常態(tài),人們對(duì)居家辦公環(huán)境有了更高的需求,一張舒適的辦公椅往往能給予他們生理和心理上的慰藉,辦公椅作為家具電商中最熱門的家具產(chǎn)品之一,不僅銷量實(shí)現(xiàn)了顯著的增長(zhǎng),還吸引了越來越多人的關(guān)注。本文以京東購(gòu)物平臺(tái)的某款熱銷辦公椅為實(shí)例,運(yùn)用大數(shù)據(jù)的思維對(duì)用戶的在線評(píng)論進(jìn)行大量有效的挖掘,并對(duì)獲取到的信息進(jìn)行處理并分析,協(xié)助辦公椅產(chǎn)品的創(chuàng)新設(shè)計(jì)。
大數(shù)據(jù)是一種在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合。大數(shù)據(jù)通過結(jié)合新系統(tǒng)、新工具、新模型對(duì)大量、動(dòng)態(tài)、持續(xù)的數(shù)據(jù)進(jìn)行挖掘,從而獲得具有洞見力和全新價(jià)值的東西[1]。對(duì)于家居用品創(chuàng)新設(shè)計(jì)而言,家具設(shè)計(jì)師們?nèi)绻荒芎芎玫卣?、分析、利用這些大數(shù)據(jù)帶來的有用的信息,將導(dǎo)致他們的設(shè)計(jì)偏離消費(fèi)者的真實(shí)需求,這將不利于產(chǎn)品的設(shè)計(jì)創(chuàng)新。
研究以京東購(gòu)物平臺(tái)某款熱銷的辦公椅為例(圖1),該辦公椅的商品評(píng)論有20 萬條之多,因此在該辦公椅的用戶評(píng)論中蘊(yùn)含著大量的信息,利用Python 編寫爬蟲程序代碼,獲取用戶評(píng)論并進(jìn)行分析,然而受技術(shù)、數(shù)據(jù)庫(kù)以及服務(wù)器的限制,只選取了該購(gòu)物網(wǎng)站中這款辦公椅的前100 頁(yè)的商品評(píng)論內(nèi)容、評(píng)論創(chuàng)建時(shí)間、產(chǎn)品顏色、用戶昵稱、評(píng)分、點(diǎn)贊數(shù)等[2]。爬蟲程序的流程如圖2 所示。
圖1 辦公椅
圖2 爬蟲程序流程
首先使用 requests 庫(kù)向該網(wǎng)頁(yè)發(fā)送網(wǎng)絡(luò)請(qǐng)求,同樣也可以運(yùn)用代理 IP 加上用戶代理池隨機(jī)選擇與搭配的方法,并設(shè)置爬取網(wǎng)頁(yè)的時(shí)間間隔“time.sleep(random.randint(3,5))”,以便能夠更加流暢地爬取信息。網(wǎng)頁(yè)解析JSON 格式數(shù)據(jù),將獲取到的頁(yè)面數(shù)據(jù)轉(zhuǎn)換為字典類型“json_data=response.json()”,以便更好地提取數(shù)據(jù)內(nèi)容。在評(píng)論內(nèi)容中選擇商品評(píng)論內(nèi)容、評(píng)論創(chuàng)建時(shí)間、產(chǎn)品顏色、用戶昵稱、評(píng)分以及點(diǎn)贊數(shù)的數(shù)據(jù)并保存為csv 格式,方便后續(xù)對(duì)數(shù)據(jù)進(jìn)行分析[3]。
利用python 編寫的爬蟲程序從京東購(gòu)物網(wǎng)站中獲取了某辦公椅從2015 年11 月14 日17:34 至2022 年2 月10 日22:33的部分用戶評(píng)論(共999 條)數(shù)據(jù),通過Jieba 庫(kù)對(duì)讀取到的數(shù)據(jù)進(jìn)行分詞處理,將評(píng)論內(nèi)容中的語(yǔ)句進(jìn)行精準(zhǔn)的切分[4]。例如:將“產(chǎn)品外觀設(shè)計(jì)美觀,材質(zhì)挺好,安裝簡(jiǎn)單,很舒適”劃分為“產(chǎn)品”“外觀設(shè)計(jì)”“美觀”“材質(zhì)”“挺”“好”“安裝簡(jiǎn)單”“很”“舒適”,再利用現(xiàn)有的停用詞詞典對(duì)數(shù)據(jù)進(jìn)行清理,去除無意義的詞語(yǔ)以及標(biāo)點(diǎn)符號(hào)[5]。
詞頻— 反轉(zhuǎn)文件頻率 (term frequency-inverse document frequency,TF-IDF)是一種用于情報(bào)檢索與文本挖掘的常用加權(quán)技術(shù),用以評(píng)估一個(gè)詞對(duì)于一個(gè)文件或者一個(gè)語(yǔ)料庫(kù)中的一個(gè)領(lǐng)域文件集的重要程度[6]。通過TF-IDF 對(duì)數(shù)據(jù)進(jìn)行好詞、差詞詞頻的統(tǒng)計(jì)(表1、表2),剔除文本中的非關(guān)鍵詞,協(xié)助后續(xù)構(gòu)建詞云圖分析。
表1 好詞詞頻統(tǒng)計(jì)
表2 差詞詞頻統(tǒng)計(jì)
在對(duì)高頻詞進(jìn)行統(tǒng)計(jì)后,需要利用共詞矩陣的方式來統(tǒng)計(jì)文本中兩兩詞組之間共同出現(xiàn)的次數(shù),通過這種方式來描述詞組之間的關(guān)聯(lián)度[7],利用python 中的pandas 庫(kù)和numpy 庫(kù)進(jìn)行共詞矩陣的構(gòu)建(表3)[8],從表3 可以看出“質(zhì)量”“安裝”“服務(wù)”“調(diào)節(jié)”與辦公椅的關(guān)聯(lián)度較高,例如“椅子”和“安裝”的共現(xiàn)次數(shù)有303 次,“質(zhì)量”和“安裝”共現(xiàn)次數(shù)有210 次,表明這些都是消費(fèi)者比較關(guān)注的地方。
表3 該辦公椅的在線評(píng)論共詞矩陣
語(yǔ)義網(wǎng)絡(luò)分析是以高頻詞兩兩之間的共現(xiàn)關(guān)系為基礎(chǔ),將其進(jìn)行數(shù)值化處理,再以圖形化的方式揭示兩個(gè)詞組之間的關(guān)系[9]。利用python 中的networks 庫(kù)繪制語(yǔ)義網(wǎng)絡(luò)圖(圖3)[10],從圖4可以看到“安裝”“質(zhì)量”“服務(wù)”“外觀”“調(diào)節(jié)”是該辦公椅在線評(píng)論語(yǔ)義網(wǎng)絡(luò)中的核心特征詞,這些特征詞是最容易影響消費(fèi)者滿意度的,同樣也是左右消費(fèi)者購(gòu)買決策的重要影響因素,因此在后續(xù)的產(chǎn)品創(chuàng)新中需要格外關(guān)注。此外,從圖3 還可以看出“物流”“商家”“樣式”“扶手”等重要節(jié)點(diǎn),這些節(jié)點(diǎn)是語(yǔ)義網(wǎng)絡(luò)中的“橋”,它們的存在使得整個(gè)語(yǔ)義網(wǎng)絡(luò)相互貫通,將不同評(píng)論觀點(diǎn)中最重要的部分銜接了起來[11],同時(shí)也是消費(fèi)者在購(gòu)買產(chǎn)品時(shí)的重要影響因素。
圖3 語(yǔ)義網(wǎng)絡(luò)圖
3.2.1 詞云圖 “詞云”就是對(duì)網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過濾掉大量的文本信息,使瀏覽網(wǎng)頁(yè)者只要一眼掃過文本就可以領(lǐng)略文本的主旨[12]。利用WordCloud庫(kù)分別對(duì)好評(píng)評(píng)論以及差評(píng)評(píng)論進(jìn)行詞云圖的構(gòu)建[13],通過詞云圖來展示消費(fèi)者對(duì)產(chǎn)品的關(guān)注點(diǎn)和滿意度。
3.2.2 好詞詞云分析 在好評(píng)詞云中(圖4),可以看到“舒服”“結(jié)實(shí)”“方便”等積極詞匯占了大多數(shù),同時(shí)出現(xiàn)了“安裝”“客服”“服務(wù)”等詞匯,表明大部分顧客不僅對(duì)產(chǎn)品的質(zhì)量感到滿意,同時(shí)對(duì)該平臺(tái)的服務(wù)也表示滿意。
圖4 好詞詞云
3.2.3 差詞詞云分析 在差評(píng)詞云中(圖5),可以看到“扶手”“靠背”“頭枕”“螺絲”等詞匯,可以看出差評(píng)中購(gòu)買者對(duì)商品零部件質(zhì)量存在不滿的態(tài)度以及在產(chǎn)品的安裝方面存在問題;“快遞”“發(fā)貨”等詞匯表明購(gòu)買者對(duì)平臺(tái)物流方面的關(guān)注。
圖5 差詞詞云
對(duì)差詞詞云中提到的詞匯進(jìn)一步分析,定位到具體的用戶評(píng)論中,再對(duì)用戶提出的意見與該辦公椅的產(chǎn)品宣傳進(jìn)行對(duì)比總結(jié)(表4)。從用戶評(píng)論中可以看出,該辦公椅在靠背、頭枕、扶手的安裝方面存在問題,同時(shí)坐墊、腰枕存在舒適性的問題。針對(duì)該辦公椅存在的這些短板與不足,設(shè)計(jì)師需要以產(chǎn)品安裝和舒適性為重點(diǎn),提出相應(yīng)的改進(jìn)策略和措施。例如,在安裝方面,對(duì)安裝視頻進(jìn)行詳細(xì)的講解,告知用戶安裝的注意事項(xiàng),增加安裝說明書,在保證產(chǎn)品結(jié)構(gòu)穩(wěn)定性的提下,盡量減少零部件在安裝時(shí)需要過多的配件,同時(shí)提升配件質(zhì)量,使得安裝更加簡(jiǎn)易化。在舒適性的問題上,主要是對(duì)材質(zhì)的選取是否合適,坐墊和腰枕的材料應(yīng)選取軟硬度較為適宜的,避免壓力集中帶來的壓迫感,同時(shí)還需要考慮材料的透氣性和導(dǎo)熱性[14]。此外,還需要優(yōu)化靠背的支撐形式,讓使用者腰背部的肌肉得到更好的放松,增加靠背、頭枕的可調(diào)節(jié)范圍以滿足不同使用場(chǎng)景的需求。
表4 產(chǎn)品宣傳與用戶意見對(duì)比
利用python 軟件對(duì)京東購(gòu)物平臺(tái)中某款辦公椅的用戶評(píng)論進(jìn)行文本數(shù)據(jù)挖掘,通過分詞處理的方式對(duì)數(shù)據(jù)中的有效信息進(jìn)行篩選,再將篩選好的數(shù)據(jù)利用共詞矩陣和語(yǔ)義網(wǎng)絡(luò)分析的方法進(jìn)行可視化處理并制作成詞云圖分析,把該辦公椅產(chǎn)品在線評(píng)論中潛藏的重要信息挖掘出來。從詞云圖中可以看出,這款辦公椅的質(zhì)量、樣式、功能、材質(zhì)等產(chǎn)品特征是用戶選購(gòu)產(chǎn)品時(shí)的主要關(guān)注點(diǎn)。此外,用戶對(duì)產(chǎn)品的包裝以及物流方面也有關(guān)注。通過這些數(shù)據(jù)分析反映出來的問題能夠幫助設(shè)計(jì)師找到消費(fèi)者的隱形需求,找到產(chǎn)品優(yōu)化設(shè)計(jì)的方向與創(chuàng)新設(shè)計(jì)點(diǎn)。例如用戶對(duì)產(chǎn)品結(jié)構(gòu)的穩(wěn)定性、安裝的便捷性以及材料的舒適性等方面存在期待,因此在迭代升級(jí)設(shè)計(jì)下一代辦公椅時(shí)需要加強(qiáng)零部件的質(zhì)量,同時(shí)改善產(chǎn)品的包裝,在造型上同樣需要優(yōu)化。通過這種方法讓新產(chǎn)品能保持市場(chǎng)活力,同時(shí)設(shè)計(jì)師通過用戶評(píng)論來改善辦公椅的缺點(diǎn),對(duì)產(chǎn)品進(jìn)行創(chuàng)新設(shè)計(jì),這種方式也是讓客戶參與設(shè)計(jì)的方法之一,用戶最有發(fā)言權(quán)。
研究?jī)H選取了京東購(gòu)物平臺(tái)上的一款熱銷辦公椅進(jìn)行文本數(shù)據(jù)挖掘,數(shù)據(jù)來源較為單一,因此分析結(jié)果存在一定的局限性。未來研究中可以針對(duì)同一產(chǎn)品進(jìn)行多平臺(tái)的對(duì)比分析,進(jìn)一步提高分析結(jié)果的真實(shí)性、可靠性。