唐義杰
(安徽工商職業(yè)學院 會計學院,安徽 合肥 231131)
近幾年隨著我國經(jīng)濟發(fā)展和人們對于高質量生活的要求,健康飲食觀念逐漸影響人們的選購行為,對于營養(yǎng)豐富的水產(chǎn)品的消費也逐漸增加。水產(chǎn)品作為居民消費的主要膳食之一,其消費和生產(chǎn)主要還是在沿海省份。目前對蝦養(yǎng)殖尤其是淡水養(yǎng)殖遍布全國,早在2003年我國產(chǎn)量就已是世界第一,但因各地自然條件不同,產(chǎn)量分布比較集中,東南部沿海地區(qū)的廣東、廣西、海南、江蘇、浙江、福建、山東等7省份為主要生產(chǎn)基地,內陸地區(qū)逐漸開始養(yǎng)殖。在此背景下,國內外很多學者都做了大量實證研究。高金田等人利用面板數(shù)據(jù)對我國水產(chǎn)品市場的消費需求和供給進行了預測,結果顯示水產(chǎn)品作為一種生活必需品,未來其消費市場會進一步增長。蔡孟沿等人選取了三座具有代表性的城市根據(jù)調查數(shù)據(jù)分析了2007—2012年三地區(qū)的消費變化。利用描述性統(tǒng)計方法分析了三地區(qū)的消費差異,并解釋了變化的原因。上述研究都是基于時間序列數(shù)據(jù),重點在于分析水產(chǎn)品消費發(fā)展變化過程及解釋原因。劉瑞新等人將水產(chǎn)品安全問題引入了研究中,同樣根據(jù)調查數(shù)據(jù),分析了江蘇省揚州市居民選購水產(chǎn)品時主要考慮安全性和鮮活度。杜卓君以青島市為例,利用調查數(shù)據(jù)分析了水產(chǎn)品銷售和消費情況后,認為水產(chǎn)品市場需要培養(yǎng)市場認知、強化渠道管理、保證產(chǎn)品質量和提供多元化產(chǎn)品形式。梅新芝以購買行為理論作為基礎,通過Logistic回歸模型對對蝦消費行為數(shù)據(jù)做了細致的分析,結果表明消費者的個體特征、對產(chǎn)品的了解程度、購買場所及購買頻率和購買目的都會對消費者的購買行為產(chǎn)生顯著影響。
以上對我國水產(chǎn)品消費市場的研究分析,主要是運用了描述性統(tǒng)計和回歸等方法;主要調查對象是沿海主要城市,少有研究內陸省份水產(chǎn)品消費市場。文章主要針對東部新一線城市合肥的水產(chǎn)品消費市場,選定對蝦這一特定消費品種,利用設計好的調查問卷,分別走訪了合肥市內4個市轄區(qū)的主要街道和小區(qū),針對合肥市民進行了抽樣調查。主要目的是分析消費者選購冷凍蝦制品和鮮蝦的行為特征和影響因素,利用R軟件通過決策樹模型分析了一些顯性的影響因素。針對不可觀測的潛在影響因素,文章通過因子分析結合聚類分析的方法,找出了5個潛在的影響因子,根據(jù)因子得分利用K-means算法將消費者大致分成了5個類別,并結合實際消費行為分析了這5類消費者的不同特征。對了解合肥市水產(chǎn)品消費者行為特點,進一步推動合肥市水產(chǎn)品市場可持續(xù)發(fā)展具有重要意義。
本次調查共收集了500份問卷,剔除填寫不完整樣本后還剩349份調查問卷,回收率69.8%。
其中一個因變量選購種類,自變量圍繞被調查者設計了基本信息、消費習慣和消費評價三個變量類型,共計19個自變量,如表1所示。
調查樣本數(shù)據(jù)分布情況如圖1、圖2所示??梢钥吹奖敬沃饕{查的是30~40歲的青壯年人群,其中城鎮(zhèn)人群各收入層級樣本量差別不明顯,農村戶籍的人口中,較低收入人群占比較大。
表1 模型中變量定義
圖1 樣本數(shù)據(jù)年齡性別分布
圖2 樣本數(shù)據(jù)月收入戶籍分布
合肥市市場上銷售的水產(chǎn)品眾多,這里主要研究合肥市居民在選購對蝦時,選購鮮蝦或冷凍蝦的主要決策依據(jù)。對于消費者購買行為決策的分析主要選擇機器學習中的CART決策樹算法。決策樹模型是基于樹結構進行決策的,一般一棵樹由根節(jié)點、狀態(tài)節(jié)點和若干葉子節(jié)點構成。CART決策樹是使用基尼指數(shù)計算純度進而劃分屬性的。首先根據(jù)目標變量“購買種類”的不同取值,分別在不同類別中按照比例抽取調查數(shù)據(jù)的75%作為訓練集數(shù)據(jù),剩下的25%作為測試集數(shù)據(jù)。為了便于解釋,決策樹的深度設置為4,然后在訓練集中訓練出模型后應用于測試集中。分別檢查訓練集的預測錯誤率為19.847%,測試集的預測錯誤率為16.092%,說明決策樹模型分類效果比較優(yōu)秀。決策樹分析結果如圖3所示。
由決策樹分析結果可以得出下列規(guī)則:①不常在外就餐的人群中,收入較低的女性在大型超市或者網(wǎng)上,一般購買冷凍蝦,在海鮮市場或者農貿市場,一般購買鮮蝦;②不常在外就餐的人群中,收入較低的男性,一般購買鮮蝦;③不常在外就餐的人群中,收入較高者,一般購買鮮蝦;④經(jīng)常在外就餐的人群中,對于價格變化敏感者,在大型超市,一般買冷凍蝦,在其他市場買鮮蝦;⑤經(jīng)常在外就餐的人群中,對于價格變化不敏感者,一般購買鮮蝦。
圖3 決策樹分析結果
綜合以上規(guī)則,消費頻率、月收入、性別、購買場所和購買意愿這幾個變量對消費者選購行為具有重要影響。決策樹的一級決策根節(jié)點變量是消費頻率,可見當前消費者的消費行為仍受到消費習慣的影響,消費對蝦的頻率直接影響消費者的購買行為。二級狀態(tài)節(jié)點變量分別是消費者的月收入和購買意愿,可見當前對蝦產(chǎn)品對于合肥市居民而言還是可選產(chǎn)品,購買需要綜合考慮收入和價格等因素。三級狀態(tài)節(jié)點變量是性別和購買場所,在選購商品中男性更易購買鮮蝦,女性則需要考慮其他因素且很容易選擇冷凍蝦制品。而作為內陸城市——合肥,海鮮水產(chǎn)的購買行為與購買的場所直接相關,大型超市由于完備的冷鏈物流和保鮮技術,冷凍蝦制品更受青睞,而其他海鮮市場人們更加傾向選擇鮮蝦。
就決策樹最終的效果而言,模型最終將調查數(shù)據(jù)分成了七個組別。通過比較分類結果可知,分類最好的是第一、四、六、七組,占總體樣本的64%;分類不是特別好的是第二、三、五組,占總體樣本的36%??梢姏Q策樹模型輸出的規(guī)則可以適用比較多的樣本數(shù)據(jù)。就決策樹最終分類的類別而言,決策樹分析的結果中選擇購買鮮蝦【類別2】的規(guī)則數(shù)量有5條,選擇購買冷凍蝦制品的規(guī)則數(shù)量有2條,說明消費者在同等條件下選擇購買鮮蝦的可能性更大。就決策樹最終分類結果的決策狀態(tài)節(jié)點個數(shù)而言,購買鮮蝦的平均狀態(tài)節(jié)點數(shù)為2.5個,購買鮮蝦的平均狀態(tài)節(jié)點數(shù)為1.8個,說明消費者在選購時購買鮮蝦的平均思考時間更短,更容易作出決策。綜合而言,合肥市居民更偏好購買鮮蝦產(chǎn)品。
為了研究其他影響消費者購買偏好的潛在因子,這里選擇因子分析方法對調查數(shù)據(jù)進行分析。因子分析是一種數(shù)據(jù)簡化技術,可以用少數(shù)幾個假想變量表示原始數(shù)據(jù)基本的數(shù)據(jù)結構。這幾個假想變量能夠反映原來眾多變量的主要信息,原始的變量是可觀測的顯性變量,而假想變量是不可觀測的潛在變量,稱為因子。通過圖4,可以看到這里選擇4個或5個因子對數(shù)據(jù)進行降維是比較合適的。還可以看出,第1個特征值較大,第2個特征值次之,減小幅度很大,形成一個“陡峭的山坡”,第4個特征值以后都很小,圖形趨于平緩,因此選擇5個公因子作為變量的降維結果。
圖4 因子分析碎石圖
這里的因子分析法選擇回歸方法計算因子得分,選擇公因子數(shù)量為5,默認使用方差最大化對因子得分進行旋轉。經(jīng)過計算,得到5個公因子在所有19個變量上的因子載荷矩陣,如表2所示。
表2 因子載荷矩陣
通過因子分析,可以得到5個通過變量無法觀測到的潛在影響因子,通過因子載荷可以將這5個因子分別命名為認知因子、行為因子、基本因子、習慣因子、愛好因子。進一步還可以根據(jù)各因子載荷和方差貢獻率計算所有樣本的因子得分。根據(jù)因子得分的結果,使用K-means聚類分析方法將因子得分矩陣數(shù)據(jù)大致聚類成了5個類別,如圖5所示。
通過觀察這5個類別分別在五個因子上的得分情況,其中類1人群在認知因子上最大,在基本因子上最??;類2人群在基本因子上最大,在行為、愛好因子上最??;類3人群在行為因子上最大,在愛好因子上最?。活?人群在基本、習慣、愛好因子上最大;類5人群在認知、行為因子上最小。這里定義最大或最小得分的因子為優(yōu)勢因子,其他因子為劣勢因子。結果如表3所示。
圖5 聚類分析各類別中心蜘蛛網(wǎng)
表3 消費人群特征描述
由上述消費人群特征描述表可以看出,第一類人群的類中心在認知因子上得分較高,說明這類人對蝦制品有較清楚的認識,實際消費中對生鮮產(chǎn)品有明確的要求。但基礎因子得分較低,說明此類人群一般收入較低或月收入不高,此類用戶需要保持關注。第二類人群的類中心在基本因子上得分較高,說明其基本條件較好,有著較高收入和較好的教育背景。但其行為、愛好因子得分不高,說明此類人群沒有養(yǎng)成消費蝦制品的習慣和愛好,需要重點挽留。第三類人群的類中心在行為因子上得分較高,說明此類人群精通挑選和網(wǎng)購。但其在愛好因子上得分偏低,說明此類人群還沒有形成消費蝦制品的愛好,消費頻率不高,需要重點發(fā)展。第四類人群的類中心在基本、愛好和習慣因子上得分都較高,說明這類人挑選蝦制品時更看重自己的愛好和購買習慣,需要繼續(xù)保持對此類消費者的關注。第五類人群的類中心在認知、習慣、行為因子上得分是最低的,說明此類消費者基本沒有意識到蝦制品的營養(yǎng)價值,所以在日常消費中幾乎不消費蝦制品。但是愛好因子得分較高,說明此類用戶基本使用蝦類即食產(chǎn)品,對鮮蝦和冷凍蝦幾乎不選購。
最后,通過繪制分組堆積柱形圖對比五類人群在不同選購人群中的分布情況,如圖6所示??梢悦黠@看出,就選購冷凍蝦和鮮蝦兩種不同的選購行為而言,選購冷凍蝦的人群更有特點。在選購冷凍蝦的人群中,第一類的人群占有較大比重,其他四類人群占比不顯著,說明購買凍蝦的人群對對蝦有更清楚的認知,更清楚自己的實際需求,低收入消費者占有較大比重,可能是相對于鮮蝦,凍蝦更具價格優(yōu)勢。而購買鮮蝦的人群中第一類人群占比也是最大的,但第二、三、四類人群占比顯著高于選購冷凍蝦的人群,說明選購鮮蝦的人群大多有吃鮮蝦的習慣、愛好,或是精通網(wǎng)購挑選的人群。
圖6 不同購買選擇分組堆積柱形
文章根據(jù)調查數(shù)據(jù),首先運用機器學習算法——決策樹模型,計算得出了兩類選購人群的不同選購規(guī)則。其一,同等條件下,合肥市居民更偏愛購買鮮蝦。選購冷凍蝦制品的消費者需要思考更多的因素,購買鮮蝦制品的消費者反而更容易做出選購決策。上述結果和合肥市居民的消費習慣有很大關系,人們普遍更喜歡消費新鮮蝦。其二,文章研究發(fā)現(xiàn)消費頻率、月收入、性別、購買場所和購買意愿五個變量對消費者選購行為起到了重要影響。消費頻率直接影響人們的選購行為,可見培養(yǎng)用戶消費習慣的重要性。另外收入和購買意愿也對選購產(chǎn)生了較大影響,這與合肥市居民的家庭收入關系較大。其次運用探索性因子分析找到了5個潛在的影響因子,分別是認知因子、行為因子、基本因子、習慣因子、愛好因子。最后根據(jù)因子得分數(shù)據(jù)運用聚類算法,大致將總體分成了5個類別。得出結論:挑選鮮蝦的消費者中構成更加多樣化,五類消費者相對于冷凍蝦更喜歡鮮蝦。選購冷凍蝦制品的消費者多是因為其價格更具優(yōu)勢。購買鮮蝦的消費者占相當大比重,是需要重點發(fā)展和重點挽留的人群。所以,合肥市場的鮮蝦仍然需要加大宣傳力度和宣傳手段。