摘要:隨著現(xiàn)代科學(xué)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)購(gòu)物蓬勃興起并廣泛普及,銷(xiāo)售額穩(wěn)步增長(zhǎng)。構(gòu)建網(wǎng)絡(luò)購(gòu)物大數(shù)據(jù)分析預(yù)測(cè)模型,以分析和預(yù)測(cè)消費(fèi)者行為趨勢(shì),對(duì)網(wǎng)絡(luò)購(gòu)物平臺(tái)及供應(yīng)商提前制定營(yíng)銷(xiāo)策略具有指導(dǎo)意義。文章構(gòu)建了一種長(zhǎng)短期記憶網(wǎng)絡(luò)結(jié)構(gòu)(LSTM)模型,應(yīng)用于某電商平臺(tái)交易數(shù)據(jù)的初步分析和預(yù)測(cè),并通過(guò)實(shí)際數(shù)據(jù)驗(yàn)證了模型的有效性。基于原始數(shù)據(jù)與模型預(yù)測(cè)數(shù)據(jù)的對(duì)比分析,為電商平臺(tái)及供應(yīng)商合理把握網(wǎng)絡(luò)購(gòu)物消費(fèi)高峰期、擴(kuò)大網(wǎng)絡(luò)銷(xiāo)售規(guī)模提供了建議。
關(guān)鍵詞:LSTM模型;網(wǎng)絡(luò)購(gòu)物;大數(shù)據(jù);分析預(yù)測(cè);循環(huán)神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào):TP183 " " " 文獻(xiàn)標(biāo)識(shí)碼:A " " "文章編號(hào):1674-0688(2024)10-0055-05
0 引言
根據(jù)2024年3月中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第53次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2023年12月,我國(guó)網(wǎng)民規(guī)模達(dá)10.92億人,較2022年12月增長(zhǎng)了2 480萬(wàn)人;互聯(lián)網(wǎng)普及率達(dá)77.5%,較2022年提高了1.9%。隨著網(wǎng)絡(luò)普及程度的持續(xù)提升,互聯(lián)網(wǎng)應(yīng)用不斷深化,用戶(hù)規(guī)模持續(xù)增長(zhǎng)。其中,網(wǎng)絡(luò)購(gòu)物類(lèi)應(yīng)用的用戶(hù)規(guī)模在2023年12月達(dá)到9.15億人,同比增長(zhǎng)8.2%;2022年網(wǎng)上零售額達(dá)到15.4萬(wàn)億元,同比增長(zhǎng)11%,連續(xù)11年穩(wěn)居全球第一位。面對(duì)國(guó)內(nèi)市場(chǎng)的蓬勃發(fā)展及網(wǎng)絡(luò)購(gòu)物市場(chǎng)的快速增長(zhǎng),準(zhǔn)確把握消費(fèi)者網(wǎng)絡(luò)購(gòu)物習(xí)慣、預(yù)判消費(fèi)高峰時(shí)期,對(duì)于網(wǎng)絡(luò)購(gòu)物平臺(tái)和電商而言非常重要,這要求平臺(tái)和電商必須做好充分準(zhǔn)備,通過(guò)制定有效的營(yíng)銷(xiāo)策略擴(kuò)大銷(xiāo)售額。因此,基于網(wǎng)絡(luò)購(gòu)物交易數(shù)據(jù)的深入分析,對(duì)未來(lái)交易數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測(cè),為決策提供參考,具有重要的現(xiàn)實(shí)意義。
目前,數(shù)據(jù)分析預(yù)測(cè)領(lǐng)域存在多種算法模型,包括ARIMA(自回歸差分移動(dòng)平均)模型、MLR(多元線(xiàn)性回歸)模型、卡爾曼濾波模型及非參數(shù)回歸模型等。近年來(lái),深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)分析研究中發(fā)揮了重要作用,深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等模型相繼涌現(xiàn),成為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域的先進(jìn)方法[1-2]。循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠更好地處理時(shí)間序列問(wèn)題,在交通數(shù)據(jù)、客流數(shù)據(jù)分析預(yù)測(cè)等方面發(fā)揮了重要作用。甘萍等[3] 針對(duì)交通預(yù)測(cè)中的復(fù)雜時(shí)空相關(guān)性問(wèn)題,提出了一種時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)模型,通過(guò)結(jié)合自適應(yīng)圖卷積網(wǎng)絡(luò)和時(shí)空長(zhǎng)短期記憶網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)交通數(shù)據(jù)空間特征和時(shí)間特征的聯(lián)合提取,提高了交通預(yù)測(cè)的準(zhǔn)確性和可靠性。曹陽(yáng)等[4]針對(duì)傳統(tǒng)預(yù)測(cè)模型難以挖掘交通流數(shù)據(jù)中強(qiáng)非線(xiàn)性特征方面的問(wèn)題,通過(guò)優(yōu)化GCN(圖卷積網(wǎng)絡(luò))結(jié)構(gòu),并分析交通流間的動(dòng)態(tài)時(shí)空關(guān)系,提出了一種基于時(shí)域圖卷積神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)模型,該模型采用時(shí)域卷積網(wǎng)絡(luò)獲取時(shí)間依賴(lài)關(guān)系,同時(shí)緩解了梯度爆炸問(wèn)題,從而有效提高了交通流預(yù)測(cè)模型的性能。張金雷等[5]將深度學(xué)習(xí)的基礎(chǔ)理論和算法相應(yīng)用于軌道交通刷卡數(shù)據(jù)、共享單車(chē)軌跡數(shù)據(jù)、出租車(chē)軌跡數(shù)據(jù)、私家車(chē)軌跡數(shù)據(jù)及空中交通運(yùn)行等5個(gè)具體場(chǎng)景,詳細(xì)闡述了實(shí)現(xiàn)方法,并提供了詳盡的代碼示例。網(wǎng)絡(luò)購(gòu)物消費(fèi)數(shù)據(jù)具有非線(xiàn)性特征,并且具備時(shí)間序列特性。因此,本文基于網(wǎng)絡(luò)購(gòu)物消費(fèi)大數(shù)據(jù),構(gòu)建長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)結(jié)構(gòu)模型,對(duì)交易數(shù)據(jù)進(jìn)行分析預(yù)測(cè),并繪制了預(yù)測(cè)數(shù)據(jù)圖表,以分析數(shù)據(jù)模式,為電商平臺(tái)及電商企業(yè)提供直觀反饋與合理建議。
1 研究方法
1.1 數(shù)據(jù)來(lái)源
本文基于某電商平臺(tái)后臺(tái)單位職工購(gòu)買(mǎi)農(nóng)副產(chǎn)品的交易數(shù)據(jù)展開(kāi)分析。首先,對(duì)該平臺(tái)2020—2023年的每日交易數(shù)據(jù)進(jìn)行預(yù)處理,生成按時(shí)間序列展示的單一維度數(shù)據(jù)(見(jiàn)表1)。接著,分析基礎(chǔ)交易額數(shù)據(jù),全年中網(wǎng)絡(luò)購(gòu)物交易額的最高峰是第三季度中秋國(guó)慶時(shí)段,其次是第四季度11月中旬的“雙十一”期間,再次是第一季度元旦和春節(jié)前后的時(shí)間段??傮w來(lái)看,第一、二季度的網(wǎng)絡(luò)購(gòu)物交易額相對(duì)較低,僅在元旦和春節(jié)前后出現(xiàn)較高的交易量;而下半年的交易更為活躍,尤其是第四季度的平均日交易額有了顯著提升?;A(chǔ)交易額數(shù)據(jù)反映出該電商平臺(tái)的交易額具有明顯的季節(jié)性波動(dòng)及節(jié)假日集中消費(fèi)的特征。圖1至圖4分別展示了這4個(gè)集中交易時(shí)段在2020—2023年的交易額情況。
1.2 預(yù)測(cè)方法
1.2.1 分析交易高峰期
詳細(xì)分析元旦、春節(jié)、國(guó)慶(含中秋)以及“雙十一”這4個(gè)高峰期的交易額及其歷年變動(dòng)情況。具體而言,觀察每個(gè)時(shí)間段內(nèi)交易額峰值和低谷的變化趨勢(shì)。例如,國(guó)慶(含中秋)選取節(jié)前20天至節(jié)后10天的交易數(shù)據(jù);“雙十一”選取活動(dòng)前后各10天的交易數(shù)據(jù);而元旦與春節(jié)則分別考察其前后各10天的交易數(shù)據(jù)。
1.2.2 建立LSTM模型
將歷史數(shù)據(jù)輸入模型,針對(duì)元旦、春節(jié)、國(guó)慶(含中秋)及“雙十一”這4個(gè)階段的數(shù)據(jù)進(jìn)行深度學(xué)習(xí)訓(xùn)練,并預(yù)測(cè)2024年各階段的銷(xiāo)售額。LSTM模型作為循環(huán)神經(jīng)網(wǎng)絡(luò)的一種,特別適用于處理時(shí)間序列問(wèn)題,其基本的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、一個(gè)隱藏層和一個(gè)輸出層組成。在此結(jié)構(gòu)中,t時(shí)刻接收到輸入數(shù)據(jù)Xt后,隱藏層的值是St,輸出值是Ot。 St的值不僅由Xt決定,還受前一時(shí)刻隱藏層狀態(tài)St-1的影響,使得當(dāng)前時(shí)刻的信息能在下一時(shí)刻被輸入網(wǎng)絡(luò)應(yīng)用,從而形成了時(shí)間相關(guān)性。神經(jīng)網(wǎng)絡(luò)模型通過(guò)學(xué)習(xí),將知識(shí)隱含在權(quán)值W中[5]。循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖見(jiàn)圖5。
與傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不同,LSTM模型設(shè)置了獨(dú)特的記憶單元,能在一定程度上緩解長(zhǎng)期信息傳遞中的信息失能和衰減等情況。LSTM的記憶單元結(jié)構(gòu)復(fù)雜,它通過(guò)單元狀態(tài)C保存長(zhǎng)期信息,并利用3個(gè)控制門(mén)[即遺忘門(mén)(決定前一時(shí)刻單元狀態(tài)Ct-1保留至當(dāng)前時(shí)刻Ct的程度)、輸入門(mén)(決定當(dāng)前時(shí)刻網(wǎng)絡(luò)輸入Xt保存到單元狀態(tài)C中的程度)、輸出門(mén)(決定當(dāng)前單元狀態(tài)Ct輸出至LSTM當(dāng)前輸出值ht的程度)]來(lái)篩選、保存和輸出長(zhǎng)期信息,從而實(shí)現(xiàn)長(zhǎng)期信息的合理保留與利用。LSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖見(jiàn)圖6。
1.2.3 訓(xùn)練預(yù)測(cè)模型
本文對(duì)2024年元旦、春節(jié)期間的實(shí)際網(wǎng)絡(luò)購(gòu)物數(shù)據(jù)與LSTM模型的預(yù)測(cè)數(shù)據(jù)進(jìn)行對(duì)比,以驗(yàn)證模型預(yù)測(cè)的準(zhǔn)確性。雖然實(shí)驗(yàn)數(shù)據(jù)量有限,預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)間存在誤差率,但是兩者反映的變動(dòng)趨勢(shì)基本一致,表明該模型對(duì)未來(lái)階段網(wǎng)絡(luò)消費(fèi)額的預(yù)測(cè)具有一定的參考價(jià)值。
2 預(yù)測(cè)結(jié)果分析
2.1 元旦期間網(wǎng)絡(luò)交易額預(yù)測(cè)
元旦期間交易額預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)對(duì)比結(jié)果見(jiàn)圖7。預(yù)測(cè)交易峰值為43.68萬(wàn)元,而實(shí)際交易值為40.62萬(wàn)元,差異率為7.53%。預(yù)測(cè)數(shù)據(jù)顯示交易峰值出現(xiàn)在元旦后第二天,與實(shí)際數(shù)據(jù)相差1天,基本一致,表明預(yù)測(cè)數(shù)據(jù)具有較好的參考性。從業(yè)務(wù)實(shí)際情況分析,元旦后新一年度的采購(gòu)計(jì)劃開(kāi)始實(shí)施,推動(dòng)了消費(fèi)增長(zhǎng),預(yù)測(cè)數(shù)據(jù)體現(xiàn)了這一趨勢(shì)。
根據(jù)預(yù)測(cè)數(shù)據(jù)和變動(dòng)情況,電商平臺(tái)及供應(yīng)商應(yīng)提前掌握簽約機(jī)構(gòu)的全年計(jì)劃,盡早規(guī)劃,利用元旦假期擴(kuò)大銷(xiāo)售規(guī)模,為全年銷(xiāo)售額增長(zhǎng)奠定良好基礎(chǔ)。
2.2 春節(jié)期間網(wǎng)絡(luò)交易額預(yù)測(cè)
春節(jié)期間交易額預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)對(duì)比結(jié)果見(jiàn)圖8。預(yù)測(cè)交易峰值為35.52萬(wàn)元,實(shí)際交易峰值為34.91萬(wàn)元,差異率僅為1.75%,并且峰值出現(xiàn)的日期一致,表明預(yù)測(cè)數(shù)據(jù)具有較高的參考性。預(yù)測(cè)數(shù)據(jù)顯示,春節(jié)期前6~10天為交易額高峰期,這與消費(fèi)者節(jié)前集中采購(gòu)年節(jié)禮物的習(xí)慣相符合。自春節(jié)前一周起,購(gòu)物額迅速下降,直至春節(jié)前2天至假期結(jié)束,每日交易額維持在低位,假期結(jié)束后才有所恢復(fù)。這一現(xiàn)象反映了消費(fèi)者春節(jié)期間忙于休假,以及供應(yīng)商歇業(yè)、物流延遲等春節(jié)特有因素導(dǎo)致的交易量減少。
根據(jù)預(yù)測(cè)數(shù)據(jù)和變動(dòng)情況,電商平臺(tái)及供應(yīng)商應(yīng)把握節(jié)奏,力爭(zhēng)在春節(jié)前一周左右完成銷(xiāo)售目標(biāo),以契合消費(fèi)者購(gòu)物習(xí)慣,同時(shí)確保春節(jié)期間運(yùn)營(yíng)平穩(wěn)。
2.3 中秋國(guó)慶期間網(wǎng)絡(luò)交易額預(yù)測(cè)
中秋國(guó)慶期間交易額預(yù)測(cè)結(jié)果見(jiàn)表9。全年網(wǎng)絡(luò)消費(fèi)交易最活躍且交易額最高的時(shí)段為中秋國(guó)慶雙節(jié)期間。預(yù)測(cè)顯示,2024年中秋國(guó)慶將出現(xiàn)兩個(gè)交易峰值,分別位于中秋與國(guó)慶前夕,均超過(guò)60萬(wàn)元,較2023年增長(zhǎng)20%。其中,2024年中秋節(jié)為9月17日,交易高峰將提前3天于中秋節(jié)前出現(xiàn),國(guó)慶前交易高峰則提前7天。由于雙節(jié)間隔近兩周,因此形成了兩個(gè)交易高峰??傮w來(lái)看,交易高峰出現(xiàn)在國(guó)慶前15天左右,與2020—2023年實(shí)際情況基本一致。此外,國(guó)慶節(jié)前2天至假期結(jié)束,預(yù)測(cè)交易額將快速下降,假期后逐步恢復(fù),這反映了消費(fèi)者的消費(fèi)習(xí)慣。
根據(jù)預(yù)測(cè)數(shù)據(jù)和變動(dòng)情況,電商平臺(tái)及供應(yīng)商應(yīng)一方面緊抓中秋國(guó)慶熱點(diǎn),精心策劃營(yíng)銷(xiāo)活動(dòng),為擴(kuò)大全年銷(xiāo)售額奠定堅(jiān)實(shí)基礎(chǔ);另一方面,合理安排營(yíng)銷(xiāo)節(jié)奏,提前預(yù)熱,在中秋前和國(guó)慶前兩周左右集中開(kāi)展,以契合消費(fèi)者習(xí)慣,提升營(yíng)銷(xiāo)效率。
2.4 “雙十一”期間網(wǎng)絡(luò)交易額預(yù)測(cè)
“雙十一”期間交易額預(yù)測(cè)結(jié)果見(jiàn)圖10。“雙十一”為全年網(wǎng)絡(luò)購(gòu)物交易額的第二高峰,預(yù)測(cè)2024年“雙十一”交易峰值將達(dá)到45.19萬(wàn)元,同比增長(zhǎng)18%。預(yù)測(cè)數(shù)據(jù)顯示,“雙十一”期間集中消費(fèi)趨勢(shì)不明顯,整體交易保持活躍,日均交易額達(dá)28.25萬(wàn)元。這主要是因?yàn)椤半p十一”消費(fèi)熱潮已在社會(huì)上產(chǎn)生廣泛影響,使得11月整體處于優(yōu)惠時(shí)段,導(dǎo)致交易數(shù)據(jù)集中度不高,但日均交易金額較高。
基于預(yù)測(cè),電商平臺(tái)及供應(yīng)商應(yīng)主動(dòng)順應(yīng)“雙十一”消費(fèi)優(yōu)惠趨勢(shì),合理規(guī)劃的營(yíng)銷(xiāo)活動(dòng),以促進(jìn)消費(fèi)額增長(zhǎng)。
3 結(jié)論
本文利用LSTM模型對(duì)某電商平臺(tái)近年來(lái)的交易數(shù)據(jù)進(jìn)行了深度學(xué)習(xí),旨在預(yù)測(cè)元旦、春節(jié)、中秋國(guó)慶、“雙十一”這4個(gè)高峰時(shí)段的網(wǎng)絡(luò)購(gòu)物交易金額,并分析了消費(fèi)高峰的變動(dòng)模式,結(jié)論如下。
(1)LSTM模型的預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的變動(dòng)趨勢(shì)一致,驗(yàn)證了LSTM模型在預(yù)測(cè)網(wǎng)絡(luò)購(gòu)物變動(dòng)趨勢(shì)方面的可行性,為電商平臺(tái)提供了網(wǎng)絡(luò)購(gòu)物數(shù)據(jù)預(yù)測(cè)的有效參考方法。
(2)全年網(wǎng)絡(luò)購(gòu)物呈現(xiàn)出明顯的節(jié)假日集中特點(diǎn),電商平臺(tái)及供應(yīng)商應(yīng)充分利用關(guān)鍵節(jié)假日,以實(shí)現(xiàn)消費(fèi)額的快速增長(zhǎng),從而提高全年銷(xiāo)售額,因此建議將更多的營(yíng)銷(xiāo)資源投向節(jié)假日。
(3)在中秋國(guó)慶和春節(jié)這兩個(gè)高峰時(shí)段,消費(fèi)者網(wǎng)絡(luò)購(gòu)物的高峰值通常出現(xiàn)在節(jié)假日前的1~2周,隨后消費(fèi)意愿急劇下降。針對(duì)這一特點(diǎn),電商平臺(tái)應(yīng)在節(jié)假日前的兩周內(nèi)集中開(kāi)展多樣化的營(yíng)銷(xiāo)活動(dòng),以高效地將消費(fèi)者流量轉(zhuǎn)化為銷(xiāo)售額。
4 參考文獻(xiàn)
[1]劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2014,31(7):1921-1930,1942.
[2]路思恒,尹紅.基于BP神經(jīng)網(wǎng)絡(luò)的居民消費(fèi)水平的預(yù)測(cè)模型:以安徽省為例[J].現(xiàn)代電子技術(shù),2022,45(21):83-87.
[3]甘萍,林基明,農(nóng)麗萍,等.一種用于交通預(yù)測(cè)的自適應(yīng)時(shí)空?qǐng)D神經(jīng)網(wǎng)絡(luò)[J].桂林電子科技大學(xué)學(xué)報(bào),2023,43(1):7-13.
[4]曹陽(yáng),朱镕琦,沈琴琴,等.基于時(shí)域圖卷積神經(jīng)網(wǎng)絡(luò)的交通流預(yù)測(cè)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2023,44(12):3700-3706.
[5]張金雷,楊立興,高自友.深度學(xué)習(xí)與交通大數(shù)據(jù)實(shí)戰(zhàn)[M].北京:清華大學(xué)出版社,2022:132-134.