劉 存
(安徽商貿職業(yè)技術學院,安徽 蕪湖 241000)
隨著互聯網在各行業(yè)滲透力的提升,網絡貨運平臺應運而生,該平臺通過互聯網,對線下的車源、貨源進行整合,并利用有關軟件對二者進行匹配,以此解決信息不對稱等問題[1]。因此,只有對網絡貨運平臺車貨匹配進行精準的預測,根據預測結果合理配置各方資源,才能提升車貨匹配效率與成功率,幫助企業(yè)提高推送率,改善供需不平衡的問題。機器學習是人工智能發(fā)展的重要體現,是通過機器直接從經驗(或數據)中學習如何解決復雜的問題,善于處理大量數據,具有學習性強、效率高的特點[2]。因此本文提出基于機器學習算法的網絡貨運平臺車貨匹配預測方法,對網絡貨運平臺車貨匹配進行精準、有效的預測,實用性強。
關于網絡貨運平臺車貨匹配的特征提取就是將網絡貨運平臺車貨匹配的原始數據利用有關方法轉換為特征的過程。對網絡貨運平臺車貨匹配原始數據進行特征提取,首先應了解影響車貨匹配的有關指標,然后根據實際業(yè)務情況,把采集的原始數據轉換為符合實際業(yè)務特點的特征。
1.1.1 網絡貨運平臺車貨匹配特征集構建
網絡貨運平臺車貨匹配,主要是指在網絡貨運平臺的作用下,將車主和貨主聯系在一起,完成貨物與車輛的配載。因此,車貨匹配成功與否的關鍵就是車貨雙方。本文依據影響網絡貨運平臺車貨匹配的指標及其相關內容對特征集進行構建。車貨匹配的幾個主要指標如下:
(1) 載荷量。載荷量即運送本次貨物所需運輸車的數量。根據該指標可以判斷出是否存在超載或多次多輛運輸的情況。關于載荷量的公式可以描述為式(1):
(1)
(2) 車長相似度。如果單獨分析貨主對車輛長度的要求或車主擁有車輛的長度沒有實際意義,所以應將二者聯系在一起進行分析,通過車長相似度指標便可以實現二者的聯系,描述為式(2):
(2)
(3) 車型相似度。該指標主要表現為貨主對車型的要求,可分為以下幾類,如表1所示。
表1 車型相似度類型
(4) 貨主與車主熟識程度。通常情況下,車主對熟悉的貨主發(fā)出的承運申請具有一定的偏好,該指標可以通過二者在上一年度交易的單量來衡量。
(5) 貨物類型。通過該指標可以判斷適合運輸本次貨物的車型以及車主對運送貨物種類的喜好。通常情況下這種喜好由收益水平決定,可以利用貨物每公里單位運輸價格如式(3):
貨物每公里單位運輸價格=
訂單總價格/運輸距離/貨物重量
(3)
(6) 貨物運送地址。該指標關系到貨物運輸的路線,并與車主喜好有著重要聯系。對運輸路線進行匹配時,不需要做到精準匹配,可以利用常用的網絡地圖(如百度地圖)進行粗匹配。
根據上述指標并結合具體業(yè)務的實際情況便可以構建出網絡貨運平臺車貨匹配初始特征集。
1.1.2 網絡貨運平臺車貨匹配特征篩選
特征篩選可以通過包裝篩選的方式實現,即把網絡貨運平臺車貨匹配的所有特征,包裝在特定的算法中進行篩選。Lasso回歸模型可以將價值不高的特征對應的回歸系數壓縮為零,所以該模型具有稀疏性,根據這個特性可以挑選出品質較好的車貨匹配特征,其模型描述為式(4):
S(w)=‖y-Xw‖2/n+γ‖w‖1
(4)
式(4)中,特征向量用X描述,響應變量用y描述,樣本數量用n描述,調節(jié)參數用γ描述,回歸系數用w描述,L1范數用‖w‖1描述,并將其做為懲罰約束。通過改變不同的γ值,可得到不同的回歸系數,當γ足夠大時,回歸系數就會趨于零,可以將這些趨于零的回歸系數對應的特征舍掉,達到網絡貨運平臺車貨匹配特征篩選的目的。
1.1.3 網絡貨運平臺車貨匹配特征相關性分析
為了得到更為簡練且精準的特征,采用皮爾森相關系數分析網絡貨運平臺車貨匹配特征相關性,該系數的作用是衡量兩個變量之間的線性關系,描述為式(5):
ζXY=cov(X,Y)/(σXσY)
(5)
式(5)中,連續(xù)特征變量(X,Y)的協方差用cov(X,Y)描述,標準差用σX和σY描述。
ζXY的取值范圍為[1,-1],當ζXY接近0時,其對應兩個特征變量的相關性較弱;當ζXY接近1或-1時,其對應兩個特征變量的相關性較強。如果兩個網絡貨運平臺車貨匹配特征具有較高相關性,則說明二者表達的意思相近,可將其中之一舍去。
通過上述方法對網絡貨運平臺車貨匹配特征進行相關性分析后,便能夠得到最佳特征集,可將其作為網絡貨運平臺車貨匹配預測模型的輸入,進行車貨匹配預測。
1.2.1 Stacking集成學習預測模型構建
對于單獨一個模型來說,在預測精度方面通常會出現邊際效用遞減的現象[3],為了避免這個現象的發(fā)生,本文采用Stacking集成學習模型對網絡貨運平臺車貨匹配進行預測,該模型將多種預測方法融合在一起,進而形成一個新的預測模型,這樣會得到比單獨模型更為優(yōu)質的性能。關于網絡貨運平臺車貨匹配預測的Stacking集成學習模型如圖1所示。
圖1 Stacking集成學習模型
該模型首先對獲取的網絡貨運平臺車貨匹配特征集進行劃分,并對第一層模型的基學習器進行訓練與測試,得到所有基學習器的預測結果,通過這些結果生成新的數據集,輸入至位于第二層模型的元學習器中再次進行訓練與測試,最后通過第二層的模型輸出關于網絡貨運平臺車貨匹配的預測結果。
關于網絡貨運平臺車貨匹配預測的Stacking集成學習模型中,第一層模型選擇的基學習器分別為長短時記憶網絡算法、最小二乘支持向量回歸機算法和輕型梯度提升樹算法;第二層元學習器采用線性回歸算法。各個學習器原理如下:
(1)長短時記憶網絡(LSTM)算法
LSTM是一種深度學習的神經網絡算法,由輸入、輸出及隱含三個層次構成,其優(yōu)勢在于可以較好地管控信息存儲狀態(tài)。LSTM擁有多個記憶單元,利用輸入門、遺忘門以及輸出門完成對記憶單元的閱讀與編輯,并通過相關函數獲取隱含層的狀態(tài),在預測問題中較為常用。設定t時刻網絡貨運平臺車貨匹配的輸入特征分別為LSTM單元輸入向量xt、輸出向量ht-1和神經元狀態(tài)向量ct-1。LSTM各個門利用輸入特征,通過邏輯推理與非線性變換方法獲取預測值,各網絡貨運平臺車貨匹配特征之間的關系可以描述為式(6):
(6)
式(6)中,輸入門、遺忘門和輸出門的激活向量分別用pt,qt和ot描述;權重矩陣用V,U描述,偏置向量用b描述,V,U,b三者下標p,q和o分別對應輸入、遺忘、輸出門,tanh函數與sigmoid函數分別用?g和?c描述。
對LSTM的結構進行設計后,通過誤差反向傳播方法訓練LSTM,損失函數則采用均方誤差。
(2)最小二乘支持向量回歸機(LS-SVR)模型
LS-SVR是支持向量機的擴展,可以將二次優(yōu)化問題轉換成線性方程組求解問題,具有計算簡單、收斂速度快的優(yōu)點,在各類預測問題中均有較好表現。設定網絡貨運平臺車貨匹配特征樣本集為z={(x1,y1),…,(xm,ym)},(xi,yi)∈Zi=1,2,…,m,該樣本的最小二乘向量機回歸描述為式(7):
(7)
式(7)中,超平面法向量用v描述,懲罰系數用C描述,偏置向量用l描述,松弛系數用e描述,轉置用T描述,映射用φ描述。
為獲取目標函數最小值,建立拉格朗日函數描述為式(8):
(8)
式(8)中,回歸系數用α=(α1,…,αi,…,αm)描述。
為了求取最優(yōu)解,將上述優(yōu)化問題轉換為線性方程組的求解問題,描述為式(9):
(9)
式(9)中,y=(y1,y2,…,ym)T,Q=(1,…,1)T,H=φT(x)φ(x′),單位矩陣用I描述。
通過對式(9)進行求解,可以得到α和l值,在此基礎上構建關于LS-SVR的預測模型,用于預測網絡貨運平臺車貨匹配情況,描述為式(10):
(10)
式(10)中,核函數用k(xi,xj)描述。
(3)輕型梯度提升樹(LGBM)算法
LGBM算法在傳統(tǒng)梯度提升樹算法基礎上進行了完善,在存儲與運算速率上更具優(yōu)勢。該算法中尋找最佳分裂節(jié)點是關鍵,運用直方圖的方法便可以對該節(jié)進行獲取。首先把輸入的連續(xù)網絡貨運平臺車貨匹配特征數據進行離散化操作,使其成為數量是E的整數,隨之建立邊長是E的直方圖,在對特征數據進行遍歷時,只需計算所有離散值在該直方圖中累積的量即可。LGBM在尋求分裂節(jié)點時,會將直方圖內全部節(jié)點根據權重進行降序排列,這樣可以迅速且精準地找到最佳分裂節(jié)點,通過該分裂節(jié)點建立提升樹,進而對網絡貨運平臺車貨匹配問題進行預測。
(4)線性回歸算法
線性回歸主要通過數理統(tǒng)計中的回歸分析,確定自變量及預測量之間相互依賴的程度,根據二者的依賴程度對相關問題進行預測。為了更好地解決實際問題,通常采用具有多個自變量的多元線性回歸模型來解決問題,其一般表達式可以描述為式(11):
(11)
由于網絡貨運平臺車貨匹配預測樣本中包含的特征較多,因此可以通過矩陣的方式對多元線性回歸模型進行描述式(12):
(12)
1.2.2 網絡貨運平臺車貨匹配預測實現
基于Stacking集成學習模型的網絡貨運平臺車貨匹配預測流程如下:
(1) 確定Stacking集成學習模型結構。選擇LSTM,LS-SVR和LGBM作為Stacking集成學習模型中第一層模型的基學習器,選擇線性回歸算法作為第二層模型的元學習器。
(2 )將輸入至Stacking集成學習模型中的網絡貨運平臺車貨匹配預測特征集分成原始訓練集 與測試集T二部分。
(3) 通過K折交叉驗證方法對Stacking集成學習預測模型中的基學習器進行訓練,即將D平均分為K份,表示為(D1,D2,…,DK),每一個基學習器將其中的一份當作K折測試集,其余K-1份當作K折訓練集。利用K折訓練集,對各個基學習器進行訓練,利用K折測試集獲得預測結果,并將各個基學習器得出的預測結果進行整合,形成新的數據集,作為元學習器的訓練集 。
(4) 利用所有基學習器對 進行預測,并求取預測結果的平均值,獲取到集合(T1,T2,…,TK),將該集合當作元學習器的測試集T′。
(5) 第二層模型中的元學習器對訓練集D′和測試集T′分別進行訓練與測試,進而得到最終的網絡貨運平臺車貨匹配預測結果。
承運訂單成交量是衡量車貨匹配情況的主要指標,為了驗證本文方法的有效性,實驗對某網絡貨運平臺未來一周內承運訂單成交量進行了預測。實驗首先利用本文方法對網絡貨運平臺車貨匹配特征進行了提取,提取的結果如表2所示。由表2可知,本文方法對網絡貨運平臺車貨匹配特征進行了準確提取,且較為全面,可以較好地對原始數據進行描述,為后續(xù)網絡貨運平臺車貨匹配的預測打好基礎。
表2 網絡貨運平臺車貨匹配特征
圖2 網絡貨運平臺車貨匹配預測結果
圖3 運輸車輛空駛率
圖4 預測值與實際值對比結果
根據提取的特征建立特征數據集,輸入至Stacking集成學習模型中,最后得出的結果如圖2所示。由圖2可知,利用本文方法對該網絡貨運平臺承運訂單成交量進行了預測,從曲線走勢可以看出,前4d的訂單成交量相對較低且起伏較大;由于該平臺從貨主處獲悉,在本周的第5d至第7d會有大批量貨物需要運輸,因此預測后3d訂單成交量呈逐漸上升趨勢。由此可以看出,本文方法可以對網絡貨運平臺車貨匹配情況進行有效預測。
從根本上說,車貨匹配就是為了提升物流資源的利用率,而減少車輛的空駛率,盡可能地利用返程車輛就近運送貨物,是合理配置資源的有效方法。空駛率指的是車輛空駛里程與總行駛里程的比率。實驗利用本文方法對網絡貨運平臺車貨匹配進行預測后,根據預測結果對隨機三輛回程的運輸車輛與就近的貨物進行匹配,得到的實驗結果如圖3所示。由圖3可知,根據本文方法獲取的網絡貨運平臺車貨匹配預測結果,對返程的運輸車輛與就近貨源進行匹配,有效地降低運輸車輛的空駛率。在實驗一周之內,隨機選取的三輛運輸車輛空駛率均未超過10%,尤其是第6d和第7d,空駛率已在3%以下,說明各方資源得到了合理利用,本文方法具有較好的應用價值。
為了衡量本文方法對網絡貨運平臺車貨匹配預測的準確性,實驗從該網絡貨運平臺選取近6個月的歷史數據進行測試,經過測試得出的結果,如圖4所示。由圖4可知,利用本文方法可以對該網絡貨運平臺車貨匹配情況進行精準預測,尤其是1月、4月和6月訂單成交量的預測值與實際值基本吻合,即使是在2月、3月和5月產生了差異,但差異也較小,對整體結果沒有太大影響,由此說明,本文方法對于網絡貨運平臺車貨匹配的預測較為精準。
在"互聯網+物流"的大環(huán)境下,網絡貨運平臺已在貨物運輸市場占據著較大份額,為了精準地預測網絡貨運平臺車貨匹配情況,合理配置物流資源,本文提出一種基于機器學習算法的網絡貨運平臺車貨匹配預測問題方法。該方法采用具有雙層模型的Stacking集成學習模型對網絡貨運平臺車貨匹配情況進行了預測,對比單一模型來說,Stacking集成學習模型具有更好的預測性能。通過實驗證明,本文方法比較適合用于網絡貨運平臺車貨匹配的預測。