• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于用戶畫像的卷煙消費(fèi)者特征識別和價(jià)值評估

      2023-02-21 06:08:30金吉瓊王文俊
      煙草科技 2023年1期
      關(guān)鍵詞:卷煙聚類消費(fèi)

      金吉瓊,居 雷,張 易,斯 勇,王文俊*

      1. 上海牡丹香精香料有限公司技術(shù)中心,上海市浦東新區(qū)孫橋路1067 號 201210

      2. 上海煙草集團(tuán)有限責(zé)任公司技術(shù)中心,上海市浦東新區(qū)秀浦路3733 號 201315

      用戶畫像也稱消費(fèi)者畫像,其概念最早于20 世紀(jì)80年代提出并應(yīng)用于商業(yè)分析領(lǐng)域,企業(yè)通過收集消費(fèi)者個(gè)人基礎(chǔ)信息、經(jīng)歷背景以及性格特征等信息刻畫重構(gòu)消費(fèi)者形象,深入剖析消費(fèi)者特征和識別目標(biāo)消費(fèi)群體及終端用戶,從而有利于企業(yè)形成商業(yè)決策[1-2]。受益于互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子商務(wù)、社交媒體和智能終端所產(chǎn)生的海量消費(fèi)數(shù)據(jù),促使用戶畫像分析從原來扁平化的數(shù)據(jù)整合逐步發(fā)展為以數(shù)據(jù)驅(qū)動的智能、靈活且具有交互性的消費(fèi)者研究方法,結(jié)合用戶推薦、決策樹和文本挖掘等算法廣泛應(yīng)用于電子商務(wù)、產(chǎn)品營銷、商業(yè)設(shè)計(jì)和健康醫(yī)療等領(lǐng)域[3-5]。百度通過在線獲取用戶屬性信息和操作行為提取用戶特征數(shù)據(jù),通過模型訓(xùn)練得到用戶畫像的興趣標(biāo)簽,從而構(gòu)建用戶畫像以實(shí)現(xiàn)產(chǎn)品定向推薦[3]。Uber基于用戶畫像識別消費(fèi)者在交通出行中的關(guān)鍵痛點(diǎn),創(chuàng)新建立動態(tài)定價(jià)和在線打車的商業(yè)模式進(jìn)而獲得商業(yè)成功[6]。因此,基于用戶畫像分析的消費(fèi)者洞察可有效識別用戶特征、消費(fèi)偏好和市場熱點(diǎn),從而有利于形成用戶導(dǎo)向的產(chǎn)品設(shè)計(jì)和商業(yè)決策。

      卷煙作為一種特殊的消費(fèi)類產(chǎn)品,限于法律政策等因素影響,國內(nèi)煙草行業(yè)較難以營銷方式大范圍直接觸達(dá)卷煙消費(fèi)者。隨著卷煙市場競爭加劇和經(jīng)濟(jì)水平的提高,近年來消費(fèi)者對卷煙產(chǎn)品需求逐漸呈高端化、個(gè)性化和多元化發(fā)展,各地?zé)煵莨静粩嘭S富品牌結(jié)構(gòu)和產(chǎn)品規(guī)格以滿足各類消費(fèi)者需求。為更加深入地剖析消費(fèi)者對卷煙產(chǎn)品的消費(fèi)偏好和潛在需求,及時(shí)獲知市場熱點(diǎn),目前煙草企業(yè)多以線下市場調(diào)研和新品品鑒等方式獲取少量消費(fèi)者信息和產(chǎn)品評價(jià)數(shù)據(jù),但上述方法存在數(shù)據(jù)獲取成本高、樣本量少和時(shí)效性短等缺點(diǎn),難以快速構(gòu)建基于大數(shù)據(jù)、代表性強(qiáng)且較全面的卷煙消費(fèi)者畫像。目前行業(yè)內(nèi)對消費(fèi)者畫像分析多以卷煙零售戶為研究對象建立分類評價(jià)模型,以實(shí)現(xiàn)精準(zhǔn)營銷和質(zhì)量管控,而對于終端卷煙消費(fèi)者的畫像分析研究則相對較少[7-8]。為此,通過線上消費(fèi)者調(diào)研,采用分層采樣方法獲取消費(fèi)者基礎(chǔ)信息和消費(fèi)行為數(shù)據(jù),基于大數(shù)據(jù)集構(gòu)建不同區(qū)域市場消費(fèi)者畫像,并以聚類和判別分析識別消費(fèi)者特征,建立消費(fèi)者價(jià)值分析模型,以期評估潛在消費(fèi)群體和目標(biāo)市場價(jià)值,為實(shí)現(xiàn)以需求為導(dǎo)向的產(chǎn)品優(yōu)化和精準(zhǔn)營銷提供支持。

      1 研究方法

      1.1 消費(fèi)者樣本采集

      通過分層采樣方法,以城市地域?yàn)榉謱幼兞浚C合考慮2021 年全國各省份卷煙銷量、省份內(nèi)各城市地域位置、經(jīng)濟(jì)和人口總量4類因素,選取全國卷煙銷量排名前8 個(gè)省份中銷量最高的重點(diǎn)城市以及4個(gè)直轄市,共計(jì)12個(gè)城市作為消費(fèi)者數(shù)據(jù)采集目標(biāo)區(qū)域。其中,各省份包括南部、中部、北部和內(nèi)陸4個(gè)區(qū)域,基本涵蓋了全國不同氣候環(huán)境、地域位置、經(jīng)濟(jì)水平和消費(fèi)偏好的卷煙消費(fèi)人群。采用互聯(lián)網(wǎng)社群向卷煙消費(fèi)者定向推送線上調(diào)研問卷,分別在12 個(gè)城市中隨機(jī)抽取3 000名卷煙消費(fèi)者的調(diào)研問卷,獲取其基礎(chǔ)屬性及卷煙消費(fèi)行為數(shù)據(jù),共計(jì)獲得36 000 份消費(fèi)者樣本數(shù)據(jù),數(shù)據(jù)采集時(shí)間為2021年6—8月。12個(gè)城市及對應(yīng)消費(fèi)者樣本量見表1。

      表1 不同省份城市及消費(fèi)者樣本量Tab.1 Selected cities and corresponding amount of consumer samples

      線上調(diào)研問卷采集的信息主要包括消費(fèi)者基礎(chǔ)屬性和消費(fèi)行為兩類數(shù)據(jù)。其中,消費(fèi)者基礎(chǔ)屬性包含消費(fèi)者年齡、性別、煙齡、職業(yè)、收入和教育程度6個(gè)維度。消費(fèi)行為則主要采集消費(fèi)者主吸品牌、品牌偏好、消費(fèi)場景、購買因素、購買頻率、月均消費(fèi)、消費(fèi)渠道、品牌黏性和消費(fèi)需求等相關(guān)信息及數(shù)據(jù)。具體問卷調(diào)研內(nèi)容見表2。

      1.2 調(diào)研數(shù)據(jù)預(yù)處理

      在線上調(diào)研過程中,卷煙消費(fèi)者可能由于理解偏差或錄入錯誤等原因而產(chǎn)生異常數(shù)據(jù)。為提高消費(fèi)者樣本數(shù)據(jù)質(zhì)量,對調(diào)研問卷完成時(shí)間低于10 min和消費(fèi)金額計(jì)算邏輯(Q15~Q19)錯誤的異常樣本進(jìn)行剔除,并將不同城市的消費(fèi)者特征整合為消費(fèi)者年齡、收入、煙齡、職業(yè)、月均消費(fèi)額、主吸卷煙價(jià)格、月均購買量、品牌黏性和消費(fèi)決策因素,共計(jì)9個(gè)消費(fèi)者基礎(chǔ)屬性和消費(fèi)行為指標(biāo)。由于消費(fèi)者樣本中連續(xù)型數(shù)值變量(如年齡、收入、煙齡、消費(fèi)頻率和金額等)量綱不同,且問卷中包含名義變量(如性別、職業(yè)和卷煙品牌等),因此在建立消費(fèi)者價(jià)值評估模型前需要對數(shù)值變量按公式(1)進(jìn)行標(biāo)準(zhǔn)歸一化,名義變量則以次序變量進(jìn)行量化表征。

      式中:μ為某消費(fèi)者的特征變量均值;σ為特征變量標(biāo)準(zhǔn)差。

      1.3 聚類分析

      聚類分析是對多維數(shù)據(jù)集的無監(jiān)督分類方法,其原理是計(jì)算各數(shù)據(jù)樣本間的距離用于表征樣本間相似性,從而實(shí)現(xiàn)同一數(shù)據(jù)簇內(nèi)樣本相似度較高,而不同數(shù)據(jù)簇間相異性較高的分類目的。常用的聚類分析包括層次聚類、K-means 和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等方法,相較于其他分類算法,K-means具有聚類復(fù)雜度低、收斂速度快和降低小樣本聚類不確定性等優(yōu)點(diǎn)[9]。因此,本研究中采用歐氏距離計(jì)算不同城市消費(fèi)者樣本間差異性,根據(jù)聚類性能指標(biāo)類內(nèi)平方誤差優(yōu)化分類K 值,對不同區(qū)域市場消費(fèi)者進(jìn)行聚類分析。消費(fèi)者樣本間歐式距離計(jì)算公式為:

      式中:dik為兩消費(fèi)者樣本xi和xk間距離;xij為消費(fèi)者樣本xi中第j項(xiàng)特征變量;xkj為消費(fèi)者樣本xk中第j項(xiàng)特征變量。

      1.4 線性判別模型

      判別分析屬于有監(jiān)督分類方法,主要包括線性判別、距離判別、二次判別和Bayes 判別等分析方法。線性判別分析(Linear Discriminant Analysis,LDA)根據(jù)已標(biāo)記類別的n維特征樣本數(shù)據(jù),通過線性變換將n維特征變量投影至某一方向,并以多元方差分析判定線性變換后不同組間差異,從而能夠最大限度地區(qū)分樣本類別[10-12]。為此,根據(jù)不同城市消費(fèi)群聚類結(jié)果標(biāo)定消費(fèi)群類別,基于消費(fèi)者基礎(chǔ)屬性、消費(fèi)行為和城市指標(biāo)等變量,建立LDA 判別模型Y{y1,…, yn}:

      式中:Cip為第i個(gè)判別模型第p個(gè)特征維度系數(shù);Xp為數(shù)據(jù)樣本中p維特征值。

      通過LDA 判別模型Y 使不同組間離差最大、組內(nèi)離差最小,從而有效識別不同城市消費(fèi)者特征差異,形成不同區(qū)域市場消費(fèi)者價(jià)值評估模型。

      1.5 數(shù)據(jù)分析及建模環(huán)境

      消費(fèi)者調(diào)研數(shù)據(jù)處理、分析模型構(gòu)建及可視化輸出均采用R語言實(shí)現(xiàn)。

      2 結(jié)果與分析

      2.1 各城市卷煙消費(fèi)者畫像

      2.1.1 消費(fèi)者基礎(chǔ)屬性

      12個(gè)城市卷煙消費(fèi)者的年齡和煙齡統(tǒng)計(jì)分布見圖1??梢?,消費(fèi)者年齡和煙齡分布基本分為3個(gè)區(qū)間。其中,廣州、北京、天津和重慶4個(gè)城市的消費(fèi)者平均年齡和煙齡分別為34.8~35.8 歲和6~8 年,消費(fèi)者整體年輕化。上海、南京、成都、武漢、長沙和杭州6 個(gè)城市的消費(fèi)者平均年齡和煙齡分別為37.6~38.1 歲和 9~10 年,消費(fèi)者以中青年為主,40 歲以上消費(fèi)人群顯著增加。而鄭州和沈陽2個(gè)城市消費(fèi)者平均年齡和煙齡均高于其他城市,分別為39~40 歲和10~11年,消費(fèi)者主體呈老齡化趨勢。由此表明,經(jīng)濟(jì)發(fā)展快、人口密度高以及地處沿海的重點(diǎn)市場區(qū)域消費(fèi)者普遍以中青年為主,平均年齡低于經(jīng)濟(jì)增速慢、人口總量低的內(nèi)陸及北部市場。

      圖1 不同城市卷煙消費(fèi)者年齡和煙齡分布Fig.1 Age and smoking history distribution of cigarette consumers in different cities

      12 個(gè)城市卷煙消費(fèi)者職業(yè)和收入占比調(diào)研結(jié)果見圖2。將消費(fèi)者職業(yè)分為學(xué)生、私營雇主、企業(yè)中高級職員和一般職員4 類,收入等級分為1 萬元/月以下,1~1.5 萬元/月、1.5~2.5 萬元/月和 2.5 萬元以上4 個(gè)等級。統(tǒng)計(jì)結(jié)果表明,所有城市中近七成消費(fèi)者為企業(yè)一般員工,工作收入為1 萬元/月收入以下。由于市場區(qū)位優(yōu)勢和經(jīng)濟(jì)發(fā)展水平等因素,北京、廣州、天津和上海4 個(gè)城市的私營業(yè)主和企業(yè)中高級職員占比相對較高,且廣州、上海和北京3個(gè)城市消費(fèi)者中高收入群體占比顯著高于其他城市。

      圖2 不同城市卷煙消費(fèi)者職業(yè)及收入占比Fig.2 Career and income proportions of cigarette consumers in different cities

      2.1.2 消費(fèi)者消費(fèi)行為

      消費(fèi)者消費(fèi)行為調(diào)研內(nèi)容主要反映各目標(biāo)城市卷煙消費(fèi)者的消費(fèi)水平、消費(fèi)頻率、市場品牌偏好度、主吸產(chǎn)品忠誠度以及影響卷煙產(chǎn)品購買決策的主要因素等內(nèi)容。12個(gè)城市消費(fèi)者主吸卷煙平均價(jià)格及月均消費(fèi)額統(tǒng)計(jì)結(jié)果見圖3??梢?,各城市消費(fèi)者月均卷煙消費(fèi)為400~600元/月,主吸產(chǎn)品均價(jià)為250~370 元/條;各城市消費(fèi)者月均購買量差異較小,為1.5~2 條/月。其中,成都、廣州和上海3 個(gè)城市消費(fèi)者主吸卷煙均價(jià)為320~370元/條,以普一類和中高端卷煙為主,在12 個(gè)城市中消費(fèi)水平較高。而沈陽、天津和南京3個(gè)城市消費(fèi)者主吸卷煙均價(jià)為250~270 元/條,二至五類卷煙消費(fèi)群體占比約40%,消費(fèi)能力相對低于其他城市。

      圖3 不同城市卷煙消費(fèi)者主吸卷煙均價(jià)及月均消費(fèi)額Fig.3 Average prices of cigarettes most frequently smoked and monthly consumption of consumers

      消費(fèi)者在偏好品牌缺失情況下,轉(zhuǎn)而購買其他品牌的意愿強(qiáng)烈程度可反映出消費(fèi)者對該卷煙產(chǎn)品的品牌黏度,12 個(gè)城市消費(fèi)者選擇其他品牌的意愿程度量化結(jié)果見圖4??梢?,不同城市消費(fèi)者的品牌黏度規(guī)律基本一致,消費(fèi)者對卷煙產(chǎn)品的品牌黏度隨價(jià)格增加而明顯提升。其中,消費(fèi)者對300 元/條以上中高價(jià)類卷煙產(chǎn)品的品牌忠誠度為0.70~0.83,呈極強(qiáng)偏好性,表明該類消費(fèi)者不容易受品牌營銷和市場因素影響而選擇嘗試其他品牌。而普一類和三至五類卷煙消費(fèi)者的品牌忠誠度較低,這可能與近年我國卷煙市場同價(jià)類產(chǎn)品上市數(shù)量增加而導(dǎo)致產(chǎn)品選擇多樣、產(chǎn)品同質(zhì)化以及年輕消費(fèi)者未形成品牌固定偏好等因素有關(guān)。

      圖4 不同價(jià)位卷煙產(chǎn)品消費(fèi)忠誠度Fig.4 Consumer loyalty to cigarette products with different prices

      影響卷煙消費(fèi)者購買決策的主要因素分為產(chǎn)品口味、品控質(zhì)量、品牌影響力和社交檔次4項(xiàng),各因素對不同城市消費(fèi)者購買決策的影響程度見圖5??梢姡a(chǎn)品口味是多數(shù)消費(fèi)者購買卷煙產(chǎn)品時(shí)最關(guān)注的決定性因素,其次為產(chǎn)品質(zhì)量穩(wěn)定性。沈陽和上海2個(gè)城市消費(fèi)者對產(chǎn)品社交檔次較為關(guān)注,而天津消費(fèi)者對產(chǎn)品品牌影響力較為關(guān)注。

      圖5 消費(fèi)者購買決策影響因素及影響程度Fig.5 Influential degrees of factors affecting cigarette purchasing

      2.2 消費(fèi)者特征聚類分析

      選取消費(fèi)者基礎(chǔ)屬性(年齡、煙齡、收入和職業(yè))、消費(fèi)者消費(fèi)行為屬性(產(chǎn)品偏好、月均消費(fèi)量、主吸卷煙價(jià)格、月均購買量和購買決策關(guān)注點(diǎn))以及市場屬性(人口總量和生產(chǎn)總值),共11 個(gè)變量作為特征維度進(jìn)行聚類分析,以深入了解不同城市消費(fèi)者的特征差異。由圖6可見,當(dāng)K-means聚類類別K值>3 時(shí),各類別總組內(nèi)方差和下降趨勢逐漸減弱。為此,將12 個(gè)城市分為3 類,其聚類結(jié)果見圖7??梢姡孩偕虾?、廣州和北京3個(gè)城市被歸為群類1,表明這3個(gè)城市消費(fèi)者和城市特征相近,均以中青年群體為主,收入水平和職業(yè)級別較高,消費(fèi)能力和主吸卷煙價(jià)格明顯高于其他城市群,但購買量相對較少,關(guān)注產(chǎn)品口味、品控和社交檔次,中高價(jià)值消費(fèi)群體占比偏高。②群類2將天津、杭州、武漢、南京、沈陽、鄭州和長沙這7個(gè)內(nèi)陸北部及沿海二線城市聚為一類,該城市群卷煙消費(fèi)者以中年群體為主,人口密度和消費(fèi)能力均低于群類1,產(chǎn)品偏好集中于70~200元/條,購買頻次較高,關(guān)注產(chǎn)品口味和社交檔次,以中低價(jià)值消費(fèi)群體為主。③群類3 表明重慶和成都2個(gè)城市消費(fèi)者的消費(fèi)行為和城市特征相近,均以中青年為主,收入水平中等,但人口密度、消費(fèi)能力和消費(fèi)頻率均較高,關(guān)注產(chǎn)品口味和品控,消費(fèi)群體價(jià)值成長性相對較高。

      圖6 聚類K值梯度圖Fig.6 Clustering K-value gradient diagram

      圖7 不同城市消費(fèi)者特征K-means聚類圖Fig.7 K-means clustering diagram of characters of consumers in different cities

      2.3 消費(fèi)者特征識別及判別模型

      根據(jù)各城市聚類結(jié)果,基于不同城市卷煙消費(fèi)者的基礎(chǔ)屬性、消費(fèi)行為和市場屬性變量建立LDA判別模型,通過模型系數(shù)可深入剖析各變量以區(qū)分不同城市群體消費(fèi)者特征的貢獻(xiàn)度。判別模型及判別結(jié)果見表3和圖8。可見,通過線性模型LD1和LD2可有效識別不同城市群消費(fèi)者特征,對判別城市群消費(fèi)者特征差異的解釋率分別為83.59%和16.41%。其中,城市生產(chǎn)總值、人口總量、月均消費(fèi)額和消費(fèi)者年齡是LD1 模型的主要特征維度,模型系數(shù)分別為-7.282、4.686、4.175 和-3.001,表明城市經(jīng)濟(jì)社會指標(biāo)、消費(fèi)者消費(fèi)水平和年齡是區(qū)分12個(gè)城市消費(fèi)者的關(guān)鍵特征,3類城市群消費(fèi)者在上述4個(gè)維度存在顯著差異。人口總量、產(chǎn)品偏好及月均消費(fèi)額是LD2 模型的主要特征維度,模型系數(shù)分別為-2.043、1.177和-1.121,表明12個(gè)城市間消費(fèi)者對不同價(jià)位卷煙產(chǎn)品的購買偏好存在一定差異。綜上,城市經(jīng)濟(jì)社會指標(biāo)、消費(fèi)者消費(fèi)水平、年齡和不同價(jià)位卷煙產(chǎn)品偏好是區(qū)分12個(gè)城市消費(fèi)者的4個(gè)關(guān)鍵特征。

      表3 不同城市消費(fèi)者特征LDA判別分析模型系數(shù)Tab.3 LDA models coefficients for characters of consumers in different cities

      圖8 不同城市消費(fèi)者特征LDA判別圖Fig.8 LDA diagram of consumer characters in different cities

      3 結(jié)論

      通過線上消費(fèi)者調(diào)研和分層采樣獲取全國卷煙市場12個(gè)重點(diǎn)目標(biāo)城市消費(fèi)者基礎(chǔ)屬性和消費(fèi)行為數(shù)據(jù),比較不同城市卷煙消費(fèi)者畫像差異。基于K-means 聚類方法識別具有相似消費(fèi)者和城市屬性特征的城市群,并以此建立LDA判別模型量化表征不同城市群的消費(fèi)者關(guān)鍵特征和城市特征。研究結(jié)果表明,由于經(jīng)濟(jì)水平、人口密度和區(qū)位優(yōu)勢不同,各城市消費(fèi)者畫像存在明顯差異。上海、廣州和北京消費(fèi)者年齡和煙齡結(jié)構(gòu)較年輕化,職業(yè)級別、收入水平、消費(fèi)水平和偏好品牌價(jià)格顯著高于其他城市消費(fèi)者。消費(fèi)者品牌黏度隨卷煙價(jià)格升高而有所增加,各地消費(fèi)者普遍將產(chǎn)品口味和品控質(zhì)量作為影響消費(fèi)決策的兩個(gè)關(guān)鍵因素。聚類結(jié)果表明,12 個(gè)城市消費(fèi)者可分為3類,分別為中青年消費(fèi)者和中高價(jià)值消費(fèi)群體占比偏高的群類1,中年消費(fèi)者和中低價(jià)值消費(fèi)群體為主的內(nèi)陸北部及沿海二線城市群類2,以及消費(fèi)群體價(jià)值成長性較高,人口密度、消費(fèi)能力和消費(fèi)頻率均較高的群類3。LDA模型判別結(jié)果表明,城市經(jīng)濟(jì)社會指標(biāo)、消費(fèi)者消費(fèi)水平、年齡和不同價(jià)位卷煙產(chǎn)品偏好是區(qū)分12個(gè)城市消費(fèi)者的4個(gè)關(guān)鍵特征,該模型可用于評估各類潛在市場及相應(yīng)消費(fèi)者價(jià)值類型,為卷煙產(chǎn)品市場投放策略提供參考。

      猜你喜歡
      卷煙聚類消費(fèi)
      國內(nèi)消費(fèi)
      新的一年,準(zhǔn)備消費(fèi)!
      小康(2021年1期)2021-01-13 04:56:24
      40年消費(fèi)流變
      商周刊(2018年23期)2018-11-26 01:22:20
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      新消費(fèi)ABC
      大社會(2016年6期)2016-05-04 03:42:21
      基于改進(jìn)的遺傳算法的模糊聚類算法
      一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
      卷煙包裝痕跡分析
      自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
      我國卷煙需求預(yù)測研究述評
      平乐县| 邵东县| 砀山县| 五莲县| 威信县| 弥勒县| 济源市| 三台县| 大姚县| 增城市| 康马县| 伽师县| 临湘市| 东安县| 桐庐县| 汽车| 永川市| 尼木县| 红河县| 杨浦区| 多伦县| 焉耆| 边坝县| 台中县| 荥阳市| 金阳县| 平乡县| 都兰县| 铜鼓县| 池州市| 云和县| 体育| 周宁县| 酉阳| 大理市| 博客| 缙云县| 台江县| 福州市| 静宁县| 巴彦县|