張 瑞,李晶茹
(太原工業(yè)學(xué)院,山西太原 030008)
“雙十一”購物狂歡節(jié),從2009年開始興起,越來越多的人加入這場“一年只有一次”的購物狂潮。據(jù)天貓公布的數(shù)據(jù)顯示,2020 年“雙十一”訂單創(chuàng)建峰值達(dá)每秒58.3 萬筆,成交額達(dá)4982 億元,再攀新高。在“雙十一”來臨之前,商家就發(fā)起預(yù)熱活動,人們每天都被提醒著“雙十一”的到來。此外,天貓“雙十一”晚會和主播直播帶貨都為這一網(wǎng)造購物節(jié)增添了節(jié)日狂歡的氣氛。研究表明,與日常購物相比,購物狂歡節(jié)添加了折扣、價錢、氛圍等影響因素,從而使得影響消費者決策的因素與日常購買決策有明顯不同[1]。特別是節(jié)日氛圍提高了顧客的預(yù)期,增加了消費者購物的興奮水平,同時也激發(fā)起了消費者沖動購買的意向,這種沖動購買意愿是造成促銷期間銷量大增的主要原因[2]。
在“雙十一”這股大熱潮中,大學(xué)生扮演了重要角色,展現(xiàn)出驚人的購買力。在本次調(diào)查中,有消費的大學(xué)生占96%,消費300 元以上的大學(xué)生占48%,消費700 以上的大學(xué)生占12%。大學(xué)生的經(jīng)濟(jì)來源較為單一,主要來自家庭,這樣的購買力與自己經(jīng)濟(jì)實力并不相符,這可能導(dǎo)致大學(xué)生陷入畸形消費怪圈,具體表現(xiàn)為好勝攀比、情緒化、盲目從眾、追求享樂及高檔消費[3]。部分同學(xué)會進(jìn)行校園網(wǎng)絡(luò)貸款,無論是主流電商平臺提供的貸款或分期付款(螞蟻花唄、借唄、京東白條等)還是非法借貸的“校園貸”,都會因為借貸過于頻繁或者借貸額度過高而給生活帶來負(fù)面影響,甚至休學(xué)、抑郁、自殺[4]。
鑒于如上存在的問題,有必要深入探討大學(xué)生“雙十一剁手”現(xiàn)象,倡導(dǎo)合理消費,避免過度消費,幫助學(xué)生建立精神層面的更高追求。與大學(xué)生“雙十一”消費相關(guān)的文獻(xiàn)較少。習(xí)明明等(2016,2020)以大學(xué)生為研究對象進(jìn)行了“雙十一”消費調(diào)查,分析了大學(xué)生消費者的從眾行為及其特征[5?6];張梓琪等(2019)論述了消費主義思潮在大學(xué)生群體中的滲透和流行,導(dǎo)致了大學(xué)生在“雙十一”網(wǎng)購狂歡節(jié)中展現(xiàn)出符號消費、攀比消費、過度消費、和超前消費的心理和行為[7]。
擬從大學(xué)生消費群體出發(fā),定量研究“雙十一”消費的影響因素,以期為高校思想政治工作提供思路。第二部分介紹Logistic 回歸、定序Pro?bit 回歸、隨機森林等模型。第三部分基于調(diào)查數(shù)據(jù)進(jìn)行描述性分析和建模分析。第四部分給出相應(yīng)的討論與結(jié)語。
大學(xué)生是否在“雙十一”消費從本質(zhì)上為二分類問題,Logistic 回歸模型不需要調(diào)節(jié)超參數(shù),且最終模型易于解釋,故選擇Logistic 回歸分析該問題。將因變量設(shè)置為二分類變量,其中1表示有消費,0表示沒有消費。模型定義如下:
P(Y=1)為因變量取1 的概率,xi為第i 個自變量,βi為對應(yīng)自變量的系數(shù),i=1,2,…p,其中p為自變量的個數(shù)。從模型可以估計學(xué)生是否消費的可能性大小。
在“雙十一”進(jìn)行消費的學(xué)生中,消費水平存在明顯差異,劃分為三個水平,其中1代表低消費水平、2 代表中消費水平,3 代表高消費水平。消費水平高低從本質(zhì)上為三分類問題,但存在明顯的順序關(guān)系,因此考慮建立定序Probit 回歸來分析消費水平的影響因素。模型定義如下:引入潛在變量Z=β0+β1x1+…+βpxp+ε,Z為3個自然數(shù)的等級,每個等級對應(yīng)因變量Y的某個狀態(tài),有
其中,c1,c2為內(nèi)隱的消費水平閾值,假定誤差項服從正態(tài)分布,則因變量Y處于某一狀態(tài)的概率為
其中,Φ(x)為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù),k 為消費水平的取值。從模型可以估計學(xué)生“雙十一”各個消費水平的可能性大小。
相對于回歸模型,機器學(xué)習(xí)的相關(guān)方法雖然在解釋性上稍差,但是靈活度更高,精準(zhǔn)率也更高。采用隨機森林方法對大學(xué)生“雙十一”消費水平進(jìn)行分類。隨機森林可以同時生成多個決策樹模型,并將模型的結(jié)果匯總從而提高分類準(zhǔn)確率。具體算法如下:
設(shè)數(shù)據(jù)集中共有n個樣本,p個變量。(1)從數(shù)據(jù)集中隨機有放回地抽取n1 隨機森林方法有兩大優(yōu)勢。第一,無法獲取驗證集時,可用袋外預(yù)測誤差評價模型的擬合程度。生成樹時沒有用到的樣本點為袋外樣本點,袋外樣本點所對應(yīng)的類別由樹估計得到預(yù)測類別,與真實類別比較可得到袋外預(yù)測誤差。第二,可度量變量重要性。變量相對重要性是指分割該變量時,節(jié)點不純度(異質(zhì)性)的下降總量對所有樹取平均,節(jié)點不純度由Gini系數(shù)定義[8]。 為分析大學(xué)生“雙十一”消費特點及影響因素,選取太原工業(yè)學(xué)院本科學(xué)生為調(diào)查對象,采用隨機抽樣的方式,在不同年級、專業(yè)發(fā)放調(diào)查問卷,最終收回834 份有效問卷。由調(diào)查問卷構(gòu)造9 個自變量,全部為定性變量,依次為性別、年級、戶口所在地、父母最高學(xué)歷等。因變量為“雙十一”消費水平。依據(jù)本次調(diào)查,無消費的學(xué)生占比4%;消費300元以下的人最多,占比48%;消費300~ 700 元占比36%;消費700~ 1 100 元占比9%;消費1 100~ 1 500 元占比2%;消費1 500 以上的人占比1%。消費水平是指單個消費者在一定時期內(nèi)消費的商品和服務(wù)所達(dá)到的規(guī)模和水平[9]。為方便模型分析,結(jié)合實際數(shù)據(jù),將因變量劃分為四個消費水平,即無消費、低消費、中消費和高消費,其中低消費指300 元以下,中消費為300~ 700 元,高消費為700 元以上。具體如表1 所示。 表1 變量及說明 首先,針對大學(xué)生是否在“雙十一”消費建立Lo?gistic 回歸模型。將因變量設(shè)置為0/1二分類變量,其中1 表示有消費,0 表示沒有消費?;貧w結(jié)果如表2所示,由于自變量較多,表中僅列出系數(shù)非零且統(tǒng)計差異顯著(P<0.05)的變量。可以看出,全模型以及通過AIC、BIC進(jìn)行變量選擇的模型結(jié)果類似,均有三個顯著變量,估計系數(shù)接近,正負(fù)號一致。 表2 Logistic回歸結(jié)果 為探討模型的擬合程度,繪制ROC 曲線,如圖1所示。ROC 曲線的橫坐標(biāo)為特異度,縱坐標(biāo)為靈敏度。從圖中可以看出,三種模型對應(yīng)的ROC 曲線凸起明顯。進(jìn)一步計算AUC 值,全模型、AIC 模型、BIC模型分別對應(yīng)0.93、0.92、0.83,擬合程度較好。 圖1 ROC曲線 依據(jù)ROC 曲線和AUC 值對比可知,全模型和AIC 模型的擬合程度優(yōu)于BIC 模型。選取AIC 回歸結(jié)果進(jìn)行解讀。固定其他條件不變,相對于男生,女生在“雙十一”進(jìn)行消費的幾率更高;相對于月消費為1 000~ 1 500 元的同學(xué),月消費500 元以下的同學(xué)在“雙十一”進(jìn)行消費的幾率明顯低;相對于生活費部分來自家庭的同學(xué),全部來自家庭的同學(xué)在“雙十一”進(jìn)行消費的幾率比部分來自家庭的同學(xué)更高。 在“雙十一”進(jìn)行消費的同學(xué)中,消費水平存在明顯差異。為進(jìn)一步考察消費水平高低的影響因素,建立定序Probit 回歸。將因變量設(shè)置為消費水平,共三個水平,即低消費(300 元以下)、中消費(300~ 700 元)和高消費(700 元以上)?;貧w結(jié)果如表3 所示,模型篩選出9 個自變量,其系數(shù)非零且差異顯著(P<0.05)??梢钥闯?,全模型、AIC 模型、BIC 模型結(jié)果類似,僅有省會、月消費500~ 1 000 元這兩個變量有所差別,其他系數(shù)取值相近,正負(fù)號一致。 表3 定序Probit回歸結(jié)果 計算混淆矩陣討論三個模型的擬合程度,結(jié)果如表4 所示,揭示了預(yù)測結(jié)果與實際結(jié)果的符合程度。三種模型準(zhǔn)確率相差在1%以內(nèi),故擬合能力相近,選取AIC模型對結(jié)果進(jìn)行解讀。固定其他條件不變,相對于戶口所在地為地級市的同學(xué),戶口所在地為省會的同學(xué)“雙十一”消費水平更高;相對于父母中最高學(xué)歷為初中的同學(xué),父母最高學(xué)歷為中專、高中、大學(xué)及以上的同學(xué)“雙十一”消費水平更高;相對于月消費為1 000~ 1 500 元的同學(xué),月消費1 500 元以上的同學(xué)在“雙十一”水平更高;相對于生活費部分來自家庭的同學(xué),全部來自家庭的同學(xué)“雙十一”消費水平更低;相對于不使用花唄等的同學(xué),使用花唄等的同學(xué)消費水平更高;相對沒有計劃的同學(xué),有計劃的同學(xué)消費水平更高。 從表4 可以看出,綜合準(zhǔn)確率在73%左右,有待提高?;谶@種考慮,嘗試用機器學(xué)習(xí)中的方法——隨機森林進(jìn)行分析?;煜仃嚱Y(jié)果如表5 所示,模型的綜合準(zhǔn)確率為80%,中消費和高消費的準(zhǔn)確率明顯有所提升,分別從70%、62%提升至76%、89%。計算袋外預(yù)測誤差為16.79%。由此可見相對于定序Probit回歸,隨機森林方法的分類效果更佳。 表4 三種模型的混淆矩陣 表5 隨機森林的混淆矩陣 隨機森林方法可度量變量重要性,結(jié)果顯示,父母中最高學(xué)歷是最重要的變量,且明顯高于其他變量,其次是月消費、是否使用過花唄、戶口所在地、生活費來源。大學(xué)生在家庭中完成了其個體社會化過程的開端,家庭深深影響著消費心理和行為。實證分析也驗證了這一點,定序回歸和隨機森林方法都顯示,社會化因素變量(父母中最高學(xué)歷、口所在地)在統(tǒng)計意義下具有顯著作用。 范曉光提出的社會經(jīng)濟(jì)地位量表中,綜合選用了父親職業(yè)、父母最高學(xué)歷和家庭收入來衡量家庭社會地位[13],父母中最高學(xué)歷在一定程度上反映了家庭所處社會階層。不同家庭社會階層的消費行為有明顯差異,比如在家庭教育消費、體育消費等方面[14?15]。我國是一個典型的“二元”社會,城鄉(xiāng)發(fā)展水平差距懸殊,消費行為存在較大差異,這種差異性具體表現(xiàn)在相鄰期間消費關(guān)聯(lián)性,自發(fā)消費,邊際消費傾向和消費行為穩(wěn)定性這四個方面[16]。不同社會結(jié)構(gòu)中人們的差異也會以社會化方式傳遞給年輕一代,故大學(xué)生在“雙十一”消費方面也烙印著自己家鄉(xiāng)的痕跡。 基于調(diào)查數(shù)據(jù)定量研究了大學(xué)生“雙十一”消費的影響因素。針對大學(xué)生是否在“雙十一”消費建立Logistic 回歸模型,結(jié)果表明:性別、月消費和生活費來源在統(tǒng)計意義下具有顯著性,相比較而言,男生、月消費500元以下同學(xué)、生活費部分來自家庭的同學(xué)在“雙十一”消費的意愿偏低。為分析“雙十一”消費水平高低的影響因素,采用定序Probit 回歸進(jìn)行建模。結(jié)果表明,相比較而言,戶口所在地為省會、父母最高學(xué)歷為中專及以上、生活費部分來自家庭、月消費1 500 元以上、使用花唄等、有消費計劃的同學(xué)消費水平更高。定序Probit 回歸進(jìn)行分類的綜合準(zhǔn)確率僅為73%左右,進(jìn)一步采用隨機森林方法分類,計算得袋外預(yù)測誤差為16.79%,分類效果有明顯提升。隨機森林方法可度量變量重要性,結(jié)果顯示父母中最高學(xué)歷是最重要的變量。 結(jié)合定序Probit 回歸和隨機森林方法的結(jié)果,發(fā)現(xiàn)社會化因素變量(父母中最高學(xué)歷、戶口所在地)對大學(xué)生“雙十一”消費有重要影響作用。大學(xué)生在家庭中完成了其個體社會化過程的開端,家庭也深深地影響著消費心理和行為。高??梢詫Σ煌彝ケ尘暗拇髮W(xué)生提出有針對性地引導(dǎo)方案。比如,針對父母學(xué)歷較高或者戶籍所在地為省會的學(xué)生,高??梢蕴岣邔W(xué)生理財能力,避免過度消費,倡導(dǎo)學(xué)生不僅追求物質(zhì)上的富足,更要追求精神上的富有;針對父母學(xué)歷較低或者來自農(nóng)村的學(xué)生,高??梢詡魇诨窘鹑谥R和法律知識,倡導(dǎo)學(xué)生不攀比,不進(jìn)行校園貸,培養(yǎng)學(xué)生正確的世界觀、價值觀和人生觀。 不足之處在于僅對一所大學(xué)的“雙十一”消費狀況進(jìn)行了分析。太原工業(yè)學(xué)院是以工程應(yīng)用為特色,涵蓋八大學(xué)科門類,多學(xué)科相互支撐、協(xié)調(diào)發(fā)展的全日制普通本科高校。因此結(jié)論可能未必適用于師范類、醫(yī)學(xué)類等高校。此外,文中缺少大學(xué)生的同伴朋友信息,未將從眾效應(yīng)引入模型中考慮。未來可以從調(diào)查對象和調(diào)查因素方面進(jìn)行改進(jìn),進(jìn)而得到更加具有普適性的結(jié)論。2 實證分析
2.1 數(shù)據(jù)來源與變量說明
2.2 模型分析
3 結(jié)語