摘要:當(dāng)前,電子商務(wù)發(fā)展迅速,競爭愈發(fā)激烈,準(zhǔn)確的銷量預(yù)測對企業(yè)降低庫存成本、優(yōu)化營銷策略至關(guān)重要。付費(fèi)流量成為電商平臺商家追捧的對象,但關(guān)于付費(fèi)流量對銷量影響的研究較少,且不同渠道付費(fèi)流量對銷量影響的細(xì)分研究仍然空白,如何判斷渠道流量優(yōu)劣仍缺少解決方案。為了細(xì)化研究不同渠道的付費(fèi)流量對銷量的影響并提高銷量預(yù)測的準(zhǔn)確性,本文提出DCA-OLSTM模型。利用淘寶平臺的真實(shí)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果表明,加入付費(fèi)流量特征可以提高銷量預(yù)測準(zhǔn)確性,且不同渠道付費(fèi)流量對銷量預(yù)測的影響程度不同,商家可選擇高權(quán)重值的付費(fèi)流量渠道,僅供參考。
關(guān)鍵詞:付費(fèi)流量;電子商務(wù);銷量預(yù)測;LSTM;渠道流量
中圖分類號:F724.6;F713.36文獻(xiàn)標(biāo)識碼:A文章編號:2096-0298(2025)01(a)--05
1引言
準(zhǔn)確的銷量預(yù)測對于彌合供需缺口至關(guān)重要[1]。通過及時(shí)、準(zhǔn)確的銷量預(yù)測,可以制定有效的庫存管理策略以降低成本[2],同時(shí)還能優(yōu)化營銷活動[3]。傳統(tǒng)的預(yù)測方法包括自回歸綜合移動平均線(ARIMA)[4]、指數(shù)平滑方法、支持向量回歸(SVR)[5]等。這些方法主要依賴于歷史銷量數(shù)據(jù),可能導(dǎo)致一定的滯后性。與傳統(tǒng)算法相比,深度學(xué)習(xí)模型在捕捉復(fù)雜非線性關(guān)系[6]和自動特征提取方面表現(xiàn)出色。對于多變量時(shí)序數(shù)據(jù),數(shù)據(jù)中不同變量之間可能存在復(fù)雜的動態(tài)相互依賴關(guān)系,而且不同影響因素對目標(biāo)變量的影響大小也不盡相同。
輸入特征也直接影響著模型的預(yù)測效果[1]?,F(xiàn)有文獻(xiàn)中影響電子商務(wù)產(chǎn)品銷量預(yù)測的特征包括歷史銷量、產(chǎn)品特征、促銷活動等變量[7]。當(dāng)前,流量已成為線上營銷策略的關(guān)鍵組成部分[8],付費(fèi)流量對電商產(chǎn)品銷量的影響日益增加。但現(xiàn)有文獻(xiàn)主要集中在免費(fèi)流量的優(yōu)化和管理,例如搜索引擎優(yōu)化(SEO)[9]、社交媒體分享[10]、口碑推廣等。雖然一些研究也探討了付費(fèi)流量的基本概念和理論研究[11-12],但關(guān)于付費(fèi)流量對銷量影響的研究較少,不同渠道付費(fèi)流量對銷量影響的細(xì)分研究仍然空白。電子商務(wù)平臺能夠吸引海量用戶訪問,形成巨大的流量資源[13],入駐平臺的商戶可以向平臺企業(yè)購買用戶流量,把流量轉(zhuǎn)化為訂單來提升商品銷量[14]。這種方式可以幫助商家快速獲取大量流量。然而,不同的付費(fèi)流量渠道對銷量的影響各不相同,且隨著付費(fèi)流量的成本上漲[15],分析和管理付費(fèi)流量投入產(chǎn)出比難度加大,產(chǎn)品的銷售環(huán)境隨之更加復(fù)雜,產(chǎn)品銷量的不確定性也隨之增加。受到付費(fèi)流量的渠道、成本、時(shí)效性等影響的銷量呈現(xiàn)出不穩(wěn)定、復(fù)雜多變的特點(diǎn),現(xiàn)實(shí)中電商企業(yè)做出的預(yù)測往往與實(shí)際值存在較大偏差。銷量預(yù)測過低或過高可能會帶來缺貨成本、庫存成本增加以及資源的浪費(fèi)[16]。因此,探索付費(fèi)流量及其細(xì)分渠道對銷量預(yù)測的影響,不僅可以幫助商家擇優(yōu)選擇渠道流量,還能提高銷量預(yù)測準(zhǔn)確性,有利于電商企業(yè)制定庫存管理策略、優(yōu)化營銷活動和持續(xù)向上發(fā)展。
本文旨在探討付費(fèi)流量對銷量預(yù)測的影響,同時(shí)深入分析不同渠道的付費(fèi)流量在銷量預(yù)測中發(fā)揮的作用,基于此提出了一個(gè)組合預(yù)測模型DCA-OLSTM(DilatedConvolutionAttention-OptimizedLSTM)以實(shí)現(xiàn)電商產(chǎn)品銷量的精準(zhǔn)預(yù)測。本文提出DCA注意力機(jī)制,能在較低計(jì)算成本下獲取更優(yōu)特征表達(dá),賦予重要變量更高影響權(quán)重。利用并行的LSTM模型并結(jié)合門控機(jī)制提出OLSTM優(yōu)化模型,使其更適合多變量單目標(biāo)預(yù)測。在預(yù)測過程中,將注意力模型權(quán)重可視化,便于分析各類特征及不同渠道付費(fèi)流量對銷量的影響。最后,在真實(shí)的電子商務(wù)數(shù)據(jù)集上進(jìn)行對比實(shí)驗(yàn),驗(yàn)證模型的準(zhǔn)確性。
2研究方法
2.1方法框架
本文所提模型框架如下:(1)DCA注意力機(jī)制,提高外部特征的提取效率和更優(yōu)的特征表達(dá)、獲取目標(biāo)序列自身的歷史變化規(guī)律;(2)OLSTM模塊,利用兩個(gè)并行的LSTM模型分別學(xué)習(xí)目標(biāo)序列的時(shí)間依賴性和注意力模型獲得外部序列的時(shí)間依賴性,以保持不同序列時(shí)間記憶的一致性[20],最后通過一個(gè)融合門來平衡兩部分的信息沖突。結(jié)合兩部分模塊,得到DCA-OLSTM模型。圖1所示為DCA-OLSTM模型的整體框架,圖2為注意力DCA的模型結(jié)構(gòu)。
圖1DCA-OLSTM模型結(jié)構(gòu)圖
2.2DCA模塊
DCA是基于ECA(EfficientChannelAttention)改進(jìn)的一種注意力機(jī)制。ECA是一種高效通道注意力機(jī)制,其在多種計(jì)算機(jī)視覺任務(wù)中取得良好的效果,并且具有較低的計(jì)算和參數(shù)成本,因此受到廣泛的關(guān)注和應(yīng)用[21]。本文所提出注意力模型(DCA),其構(gòu)建思路為:利用高效通道注意力(ECA)機(jī)制,在常規(guī)卷積后引入了膨脹卷積層,擴(kuò)大感受野,保留較低計(jì)算成本優(yōu)勢的同時(shí),更好地捕捉輸入特征的全局信息。這一方法針對特征數(shù)量較多的情況下凸顯出其優(yōu)勢,在眾多數(shù)據(jù)中抓取有效特征,提升特征的表征能力。針對時(shí)序數(shù)據(jù)具有較多數(shù)據(jù)特征的情況,優(yōu)化特征表達(dá)有助于提升數(shù)據(jù)預(yù)測性能。
2.3OLSTM模塊
將目標(biāo)序列和注意力獲得的外部序列特征分別輸入LSTM模型,得到輸出結(jié)果h1和h2,通過門控權(quán)重加權(quán)后求和拼接,得到最終的預(yù)測結(jié)果。計(jì)算公式如下:
式(1)(2)中:ω表示門控權(quán)重,σ表示sigmoid激活函數(shù),W是連接權(quán)重矩陣,b是偏置項(xiàng)。在模型的訓(xùn)練過程中,通過反向傳播算法和梯度下降優(yōu)化算法,優(yōu)化門控權(quán)重的值,使模型能夠自適應(yīng)地學(xué)習(xí)到融合兩個(gè)LSTM輸出的最佳權(quán)重,從而減輕信息沖突,增強(qiáng)關(guān)鍵特征的記憶能力。
3實(shí)驗(yàn)數(shù)據(jù)
3.1數(shù)據(jù)集概述
本文以阿里巴巴旗下電商平臺淘寶為研究對象,數(shù)據(jù)集來源于阿里云天池,數(shù)據(jù)名稱為菜鳥-需求預(yù)測與分倉規(guī)劃天池大賽,本文采用全國電商銷售數(shù)據(jù)集。實(shí)驗(yàn)使用編號32084產(chǎn)品的銷售數(shù)據(jù),數(shù)據(jù)采樣間隔為1天,共計(jì)332條數(shù)據(jù)。時(shí)間跨度為2015年1月30日至2015年12月27日。初始數(shù)據(jù)包括31個(gè)特征,涵蓋產(chǎn)品的分類信息、用戶行為、交易特征、付費(fèi)流量、歷史銷量等。
3.2數(shù)據(jù)預(yù)處理
為剔除購物節(jié)(雙十一、雙十二)帶來的大量自然流量對銷量的影響,本文使用替換法將購物節(jié)當(dāng)日數(shù)據(jù)替換為臨近日期的數(shù)據(jù)值,以便分析付費(fèi)流量對銷量的影響。
為篩選重要特征,本文使用皮爾遜相關(guān)性分析法驗(yàn)證外部特征與目標(biāo)特征的相關(guān)性,選擇相關(guān)性大于0.3且對任務(wù)具有顯著影響的特征,經(jīng)過篩選保留21條外部特征及1條目標(biāo)特征,數(shù)據(jù)集共22條特征。篩選后的數(shù)據(jù)說明詳見表1,其中歷史銷量為目標(biāo)特征。最后,對數(shù)據(jù)進(jìn)行歸一化,確保不同特征的數(shù)值范圍一致,以避免某些特征對模型訓(xùn)練的影響過大,用于模型訓(xùn)練和測試的樣本比例為8∶2。
3.3評價(jià)指標(biāo)
為了衡量所提模型的預(yù)測性能,使用平均絕對誤差(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)作為評估指標(biāo)。
3.4實(shí)驗(yàn)設(shè)置
本文使用以下實(shí)驗(yàn)設(shè)置來訓(xùn)練和評估模型。所有實(shí)驗(yàn)均基于Python3.9.15和TensorFlow2.15.0實(shí)現(xiàn),實(shí)驗(yàn)平臺為合肥工業(yè)大學(xué)高性能計(jì)算平臺A40容器資源池,資源配置為3核CPU,30GB內(nèi)存,0.5卡GPU。優(yōu)化器和激活函數(shù)分別采用Adam和ReLU。模型的學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練50個(gè)epoch,每個(gè)步驟的批處理大小為3。
4實(shí)驗(yàn)結(jié)果及評價(jià)
4.1付費(fèi)流量權(quán)重分析
將外部特征數(shù)據(jù)輸入DCA注意力模塊中,使輸出的注意力權(quán)重可視化,得到注意力權(quán)重?zé)崃D如圖3所示。該熱力圖展示了DCA-OLSTM模型在不同時(shí)間步長(TimeSteps)和不同特征(Features)上的平均注意力權(quán)重。圖3中的橫軸代表特征,縱軸代表時(shí)間步長。顏色越深表示注意力權(quán)重越高,顏色越淺則表示注意力權(quán)重越低。
圖3顯示,特征12、13、15、16的權(quán)重值均大于0.1,在所有時(shí)間步長中均表現(xiàn)出較高的注意力權(quán)重,這意味著該部分付費(fèi)流量特征對模型的決策具有重要影響。不過,特征14和特征17的權(quán)重值相較其他付費(fèi)流量特征顯著降低,表明特征14、17對應(yīng)的聚劃算渠道的付費(fèi)流量對模型輸出的影響較小,說明該渠道流量質(zhì)量可能較低,商家需要慎重考慮是否采用聚劃算渠道獲得付費(fèi)流量,而淘寶客和搜索引導(dǎo)渠道獲得的付費(fèi)流量對銷量影響更大,商家可優(yōu)先考慮此類渠道。
計(jì)算平均每時(shí)間步各類特征總權(quán)重,其中付費(fèi)流量平均總權(quán)重為0.624,用戶行為特征平均總權(quán)重為0.260,交易特征平均總權(quán)重為0.116。對比發(fā)現(xiàn),付費(fèi)流量權(quán)重值最大、影響力最高,表明付費(fèi)流量特征在模型決策中起到了顯著作用。
4.2實(shí)驗(yàn)結(jié)果與分析
為了客觀評價(jià)所提模型的預(yù)測能力,本文使用六種基線模型進(jìn)行對比實(shí)驗(yàn)?;€模型包括:SARIMA[19]、LSTM、GRU[20]、TKAN[21]、TSD[22],以及SelfAttention-LSTM的組合模型。
本文將所提出算法與基線模型進(jìn)行對比,預(yù)測結(jié)果如表2所示,其中對比方法為將本文模型與其他基線模型預(yù)測結(jié)果求差值后,計(jì)算差值同基線模型的占比。顯而易見,DCA-OLSTM模型的MAE、MAPE和RMSE值均為最低,優(yōu)于其他六個(gè)基線模型。其中,機(jī)器學(xué)習(xí)算法SARIMA僅使用歷史銷量數(shù)據(jù)作為輸入和輸出,綜合三個(gè)評價(jià)指標(biāo),預(yù)測性能最差。與SARIMA相比,GRU、LSTM的MAE、MAPE、RMSE值均有較大幅度降低,而LSTM和GRU的預(yù)測結(jié)果相差較小,其MAE、RMSE差距均小于0.2。加入注意力機(jī)制的模型則進(jìn)一步提升了預(yù)測精度,使用自注意力的SelfAttention-LSTM模型的MAPE值下降為85.97%。同時(shí)與兩種最新模型TKAN和TSD進(jìn)行對比,本文所提模型具有更低的損失,表明所提模型預(yù)測效果更好。
4.3分析與討論
與經(jīng)典機(jī)器學(xué)習(xí)算法相比,深度學(xué)習(xí)模型在時(shí)序預(yù)測的準(zhǔn)確性方面顯著提高。組合模型集合兩種算法的優(yōu)點(diǎn),處理多元時(shí)序數(shù)據(jù)時(shí),其預(yù)測準(zhǔn)確性相較單一深度學(xué)習(xí)模型又有進(jìn)一步提升。與其他組合模型相比,所提方法在電商產(chǎn)品銷量預(yù)測方面表現(xiàn)出較好的性能。改進(jìn)后的DCA注意力模型通過兩步卷積操作極大減少了計(jì)算量,在較低計(jì)算成本下進(jìn)一步優(yōu)化了時(shí)間序列數(shù)據(jù)的特征表達(dá),算法的預(yù)測準(zhǔn)確性也有所提升,這是算法最大的貢獻(xiàn)和創(chuàng)新。將注意力模塊的權(quán)重可視化,得到的熱力圖可以直接明了的展示不同渠道的付費(fèi)流量的重要性,能夠幫助商家更快地選擇效果最好的付費(fèi)流量渠道,減少試錯(cuò)成本的同時(shí)提高銷量。實(shí)際應(yīng)用中,電商環(huán)境復(fù)雜多變,付費(fèi)流量應(yīng)用情景會越來越復(fù)雜,圍繞產(chǎn)品銷量產(chǎn)生的特征也會增加,使用改進(jìn)后的算法,可以在較低計(jì)算成本下獲得更好的預(yù)測效果,為商家提供選擇的依據(jù)。
5結(jié)論與展望
本文對付費(fèi)流量對銷量預(yù)測的影響進(jìn)行了深入分析,并構(gòu)建了DCA-OLSTM模型,以提高銷量預(yù)測的準(zhǔn)確性和穩(wěn)定性。
5.1付費(fèi)流量的重要性
本文發(fā)現(xiàn)付費(fèi)流量對銷量預(yù)測有著不可忽視的影響,而現(xiàn)有的銷量預(yù)測研究往往忽視了這一點(diǎn),且不同渠道的付費(fèi)流量對銷量影響各不相同,權(quán)重值高的渠道付費(fèi)流量對銷量影響越大,商家可據(jù)此選擇合適的渠道付費(fèi)流量,以減少試錯(cuò)成本。
5.2DCA-OLSTM模型的有效性
本文提出的DCA-OLSTM模型在銷量預(yù)測任務(wù)中表現(xiàn)出顯著優(yōu)勢。通過DCA模塊和OLSTM模塊,該模型能夠更有效地捕獲時(shí)間序列數(shù)據(jù)的特征,并提高預(yù)測精度和穩(wěn)定性。
5.3實(shí)驗(yàn)驗(yàn)證結(jié)果
本文的實(shí)驗(yàn)結(jié)果證明DCA-OLSTM模型相對傳統(tǒng)方法在銷量預(yù)測中的優(yōu)越性。該模型在真實(shí)數(shù)據(jù)集上取得較好的預(yù)測性能,驗(yàn)證了其在實(shí)際應(yīng)用中的可行性和有效性。
本文的研究主要集中在電商平臺內(nèi)不同渠道的付費(fèi)流量對銷量的影響,針對其他渠道如第三方平臺廣告、直播等方式的影響未做研究,未來可將模型應(yīng)用于直播電商平臺,并進(jìn)行更廣泛的驗(yàn)證,以評估其在直播場景中的效果和可靠性。綜上所述,隨著進(jìn)一步的研究和探索,相信付費(fèi)流量對銷量預(yù)測的影響將會得到更深入地理解,而本文提出的DCA-OLSTM模型也將在電商行業(yè)的實(shí)際應(yīng)用中發(fā)揮重要作用。
參考文獻(xiàn)
CHENS,KES,HANS,etal.Whichproductdescriptionphrasesaffectsalesforecasting:AnexplainableAIframeworkbyintegratingWaveNetneuralnetworkmodelswithmultipleregression[J].DecisionSupportSystems,2024,176:114065.
CUIL,CHENY,DENGJ,etal.AnovelattLSTMframeworkcombiningtheattentionmechanismandbidirectionalLSTMfordemandforecasting[J].ExpertSystemswithApplications,2024,254:124409.
HICHAMN,KARIMS.MachineLearningandMarketingCampaign:InnovativeApproachesandCreativeTechniquesforIncreasingEfficiencyandProfit;proceedingsoftheAdvancesonIntelligentComputingandDataScience,Cham,F(xiàn)2023//,2023[C].SpringerInternationalPublishing.
ZHANGGP.TimeseriesforecastingusingahybridARIMAandneuralnetworkmodel[J].Neurocomputing,2003,50:159-75.
CHENY,XUP,CHUY,etal.Short-termelectricalloadforecastingusingtheSupportVectorRegression(SVR)modeltocalculatethedemandresponsebaselineforofficebuildings[J].AppliedEnergy,2017,195:659-70.
JINM,ZHENGY,LIYF,etal.MultivariateTimeSeriesForecastingWithDynamicGraphNeuralODEs[J].IEEETransactionsonKnowledgeandDataEngineering,2023,35(9):9168-80.
ZHUANGQ,ZHANGX,WANGP,etal.ANeuralNetworkModelforChinaB2CE-CommerceSalesForecastBasedonPromotionalFactorsandHistoricalData;proceedingsofthe2019InternationalConferenceonEconomicManagementandModelEngineering(ICEMME),F(xiàn),2019[C].IEEE.
MHIMEDR,BELKHIRM.Theroleofcontentmarketingstrategiesintrafficgeneration:Aconceptualmodeldevelopment;proceedingsoftheDigitalEconomyEmergingTechnologiesandBusinessInnovation:ThirdInternationalConference,ICDEc2018,Brest,F(xiàn)rance,May3-5,2018,Proceedings3,F(xiàn),2018[C].Springer.
BAYEMR,DELOSSANTOSB,WILDENBEESTMR.SearchEngineOptimization:WhatDrivesOrganicTraffictoRetailSites?[J].2016,25(1):6-31.
DOLEGAL,ROWEF,BRANAGANEJJOR,etal.Goingdigital?Theimpactofsocialmediamarketingonretailwebsitetraffic,ordersandsales[J].2021,60:102501.
張芬芬.流量思維導(dǎo)向下企業(yè)電商精準(zhǔn)營銷的邏輯、困境及策略[J].天津中德應(yīng)用技術(shù)大學(xué)學(xué)報(bào),2023(2):79-84.
胡志鵬,許柏鳴.互聯(lián)網(wǎng)流量經(jīng)濟(jì)背景下定制家具品牌推廣研究[J].家具與室內(nèi)裝飾,2023,30(2):79-83.
ROCHETJ-C,TIROLEJ.Platformcompetitionintwo-sidedmarkets[J].Journaloftheeuropeaneconomicassociation,2003,1(4):990-1029.
王勇,劉樂易,遲熙,等.流量博弈與流量數(shù)據(jù)的最優(yōu)定價(jià):基于電子商務(wù)平臺的視角[J].管理世界,2022,38(8):116-32.
陸玥妍.電商平臺、私域流量與第三方商業(yè)策略選擇研究[D].南京:東南大學(xué),2022.
滕玥.B2C電商平臺商品促銷銷量的預(yù)測方法[D].大連:大連理工大學(xué),2022.
GENGX,HEX,XUL,etal.Graphcorrelatedattentionrecurrentneuralnetworkformultivariatetimeseriesforecasting[J].InformationSciences,2022,606:126-42.
YUE,XUG,HANY,etal.Anefficientshort-termwindspeedpredictionmodelbasedoncross-channeldataintegrationandattentionmechanisms[J].Energy,2022,256:124569.
KORSTANJEJ.TheSARIMAModel[M].AdvancedForecastingwithPython:WithState-of-the-Art-ModelsIncludingLSTMs,F(xiàn)acebook’sProphet,andAmazon’sDeepAR.Berkeley,CA;Apress.2021:115-22.
CHUNGJ,GüL?EHRE?,CHOK,etal.EmpiricalEvaluationofGatedRecurrentNeuralNetworksonSequenceModeling[J].2014,abs/1412.3555.
GENETR,INZIRILLOH.TKAN:TemporalKolmogorov-ArnoldNetworks[J].arXive-prints,2024:arXiv:2405.07344.
DUONG-TRUNGN,NGUYEND-M,etal.TemporalSaliencyDetectionTowardsExplainableTransformer-BasedTimeseriesForecasting;proceedingsoftheArtificialIntelligenceECAI2023InternationalWorkshops,Cham,F(xiàn)2024//,2024[C].SpringerNatureSwitzerland.