摘 要:車貨匹配平臺中存在著大量的車貨信息,通過對歷史數(shù)據(jù)的分析和處理,能夠預(yù)測司機(jī)點(diǎn)擊貨物的概率(司機(jī)點(diǎn)擊率預(yù)測),從而為司機(jī)推薦貨物。據(jù)了解,目前還沒有研究項(xiàng)目將點(diǎn)擊率預(yù)測與車貨匹配結(jié)合起來,更不要說基于此來考慮車貨信息中的興趣序列和特征交互問題。因此,在車貨匹配的背景下,文章提出了一種考慮興趣序列和特征交互的司機(jī)點(diǎn)擊率預(yù)測模型——深度興趣交互網(wǎng)絡(luò)(Deep Interest Interaction Network,DIIN)。一方面,在司機(jī)興趣抽取模塊中利用Bi-GRU和SENet從司機(jī)的歷史行為中推斷出司機(jī)的興趣點(diǎn);另一方面,在車貨特征交互模塊中利用FM和ResNet同時建模低階和高階特征交互。通過對某車貨匹配平臺的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),結(jié)果表明模型DIIN與基準(zhǔn)模型相比具有更好的性能,即使與DIEN模型相比,在AUC和LogLoss兩個評價指標(biāo)上,模型DIIN分別提升了3.5個百分點(diǎn)和1.8個百分點(diǎn)。這不僅證明了將深度學(xué)習(xí)和點(diǎn)擊率預(yù)測用于車貨匹配的可行性,也證明了挖掘歷史數(shù)據(jù)中的序列關(guān)系和特征交互有助于預(yù)測車貨匹配中司機(jī)點(diǎn)擊貨物的概率。
關(guān)鍵詞:車貨匹配;深度學(xué)習(xí);點(diǎn)擊率預(yù)測;雙向門控循環(huán)單元;擠壓和激勵網(wǎng)絡(luò)
中圖分類號:F5;TP391.1 文獻(xiàn)標(biāo)志碼:A DOI:10.13714/j.cnki.1002-3100.2024.06.017
Abstract: There is a large amount of vehicle cargo information in the vehicle cargo matching platform. By analyzing and processing historical data, it is possible to predict the probability of drivers clicking on goods (driver click-through rate prediction), thereby recommending goods to drivers. It is understood that there is currently no research combining click-through rate prediction with vehicle cargo matching, let alone considering the issue of interest sequences and feature interactions in vehicle cargo information based on this. Therefore, in the context of vehicle cargo matching, the paper proposes a driver click-through rate prediction model that considers interest sequences and feature interactions—Deep Interest Interaction Network (DIIN). On the one hand, in the driver interest extraction module, Bi-GRU and SENet are used to infer driver interest points from the driver's historical behavior. On the other hand, in the vehicle cargo feature interaction module, FM and ResNet are used to simultaneously model low order and high-order feature interactions. Through experiments on a dataset of a vehicle cargo matching platform, the results show that the model DIIN has better performance compared to the benchmark mode. Compared with the DIEN model, the AUC and LogLoss evaluation indicators have increased by 3.5 percentage points and 1.8 percentage points, respectively. This not only proves the feasibility of using deep learning and click-through rate prediction for vehicle cargo matching, but also proves that mining sequence relationships and feature interactions in historical data can help predict the probability of drivers clicking on goods in vehicle cargo matching.
Key words: vehicle-cargo matching; deep learning; click-through rate prediction; bidirectional gated recurrent unit; squeeze-and-excitation networks
0" " 引" " 言
車貨匹配是基于車貨匹配平臺對車源和貨源的合理調(diào)控,目的是在滿足雙方需求的情況下,為每一個貨源找到最合適的車源,為每一個車源找到最合適的貨源[1]。隨著車源和貨源數(shù)量的急劇增加,車貨匹配面臨著越來越大的挑戰(zhàn)。點(diǎn)擊率預(yù)測在廣告系統(tǒng)中發(fā)揮著至關(guān)重要的作用,通過預(yù)測用戶點(diǎn)擊廣告的概率,可以為用戶推薦合適的廣告。廣告系統(tǒng)中存在著大量的用戶及廣告,而在車貨匹配系統(tǒng)中也存在著大量的司機(jī)和貨物。在廣告系統(tǒng)中運(yùn)用點(diǎn)擊率預(yù)測可以為用戶推薦合適的廣告,因此在車貨匹配系統(tǒng)中利用點(diǎn)擊率預(yù)測也可以為司機(jī)推薦合適的貨物。將點(diǎn)擊率預(yù)測與車貨匹配相結(jié)合是一個新穎且可行的研究方向,對于探索新的車貨匹配方法、推動車貨匹配平臺發(fā)展具有重要意義。
傳統(tǒng)的車貨匹配方法是建立以優(yōu)化思想為主的車貨匹配模型,但是其在面對大規(guī)模數(shù)據(jù)集時表現(xiàn)不佳[2-3]。因此,少數(shù)學(xué)者以大規(guī)模數(shù)據(jù)為核心,開展了對車貨匹配方法的研究。黃美華等利用C4.5決策樹算法建立車貨匹配模型,利用中國物通網(wǎng)的真實(shí)數(shù)據(jù)證明所建模型達(dá)到較高的匹配精確度[4];在此基礎(chǔ)上,黃美華等進(jìn)一步運(yùn)用最小二乘支持向量機(jī)建立車貨信息匹配模型,在保持匹配精確度的同時,縮短了一半的計(jì)算時間[5]。上述研究利用機(jī)器學(xué)習(xí)對大規(guī)模的數(shù)據(jù)進(jìn)行了處理,對提出的車貨匹配方法進(jìn)行了驗(yàn)證,取得了較好的效果。周夏利用集成學(xué)習(xí)方法建立了車貨匹配預(yù)測模型,利用P平臺中的真實(shí)數(shù)據(jù)驗(yàn)證了集成學(xué)習(xí)方法在車貨匹配預(yù)測方面的可行性[6]。2018年,運(yùn)滿滿舉辦了YMM-TECH算法大賽,對用戶和用戶上下文進(jìn)行有效的嵌入,然后映射到貨源向量空間,尋找與貨主和當(dāng)前上下文的“最相近貨源”[7]。從司機(jī)的歷史行為數(shù)據(jù)中挖掘司機(jī)潛在的興趣,從而將貨源推薦給相應(yīng)的司機(jī),這對于探索新的車貨匹配方法是很好的啟發(fā),也是強(qiáng)有力的現(xiàn)實(shí)支撐,但是相關(guān)的學(xué)術(shù)研究卻很少。
受運(yùn)滿滿車貨匹配基本思路和點(diǎn)擊率預(yù)測在廣告系統(tǒng)中的優(yōu)越表現(xiàn)的啟發(fā),本文將點(diǎn)擊率預(yù)測和車貨匹配結(jié)合起來,提出了一種考慮興趣序列和特征交互的司機(jī)點(diǎn)擊率預(yù)測模型——DIIN,旨在為司機(jī)推薦合適的貨源。
1" " 基于DIIN的司機(jī)點(diǎn)擊率預(yù)測
車貨匹配平臺中的歷史數(shù)據(jù)可以充分反映司機(jī)對貨物的興趣,其中司機(jī)點(diǎn)擊過的歷史貨物中也隱藏著序列關(guān)系,除了原始特征外,通過捕捉特征之間的交互能夠產(chǎn)生新的特征,也能反映出司機(jī)對貨物的興趣。因此,為了提升車貨匹配的效率和準(zhǔn)確度,本研究將深度學(xué)習(xí)和點(diǎn)擊率預(yù)測應(yīng)用到車貨匹配中,提出了深度興趣交互網(wǎng)絡(luò)DIIN。這一模型充分利用了車貨匹配平臺中的大規(guī)模數(shù)據(jù),不僅挖掘了其中的序列關(guān)系,還加強(qiáng)了原始特征之間的交互,從大規(guī)模貨源中發(fā)現(xiàn)司機(jī)點(diǎn)擊概率較高的貨物,充分挖掘司機(jī)對貨物的興趣。下文首先對車貨匹配問題進(jìn)行形式化描述,然后詳細(xì)介紹DIIN模型。
1.1" " 車貨匹配問題描述
對于司機(jī)和貨物,共選取四大特征:司機(jī)行為特征、目標(biāo)貨物特征、上下文特征和司機(jī)畫像特征。以司機(jī)D為例,對于司機(jī)行為特征,選取其點(diǎn)擊過的n個歷史貨物,用X=[x1,x2,...,xn-1,xn]表示;對于其他三類特征,共選取m個特征,用X=[x10,...,xi0,...,xm0]表示。所以,整個網(wǎng)絡(luò)的總輸入為[x0,x1,x2,...,xn-1,xn]。通過將上述特征輸入到網(wǎng)絡(luò)中,訓(xùn)練司機(jī)與貨物之間的隱藏關(guān)系,最終輸出司機(jī)點(diǎn)擊貨物的概率。定義司機(jī)點(diǎn)擊貨物的標(biāo)簽為y,其中,y=1表示司機(jī)點(diǎn)擊了貨物,y=0表示司機(jī)未點(diǎn)擊貨物。綜上所述,本研究的目標(biāo)是預(yù)測司機(jī)點(diǎn)擊貨物的概率。
1.2" " DIIN模型
DIIN模型如圖1所示,共由四個模塊組成,分別是車貨特征嵌入層、司機(jī)興趣抽取模塊、車貨特征交互模塊和點(diǎn)擊率輸出層。底部模塊是車貨特征嵌入層,輸入的數(shù)據(jù)通過獨(dú)熱編碼(one-hot)被映射為稀疏向量,然后經(jīng)過嵌入層被轉(zhuǎn)換為密集的低維向量。圖1的左部是司機(jī)興趣抽取模塊,使用Bi-GRU來模擬司機(jī)點(diǎn)擊貨物之間的依賴性,并進(jìn)一步通過SENet來捕捉不同貨物的重要程度,然后通過平均池化得到司機(jī)的興趣表示。圖1的右部是車貨特征交互模塊,一是利用FM捕捉低階特征的交互,二是利用ResNet捕捉高階特征的交互,以達(dá)到同時建模低階和高階特征交互的目的。上方模塊是點(diǎn)擊率輸出模塊,將兩個模塊的輸出拼接后輸入到MLP中,從而計(jì)算司機(jī)點(diǎn)擊貨物的概率。
1.2.1" " 車貨特征嵌入層
對于司機(jī)行為特征,選取貨物ID和貨物所屬類別的ID進(jìn)行輸入,統(tǒng)一使用one-hot編碼后通過嵌入層映射到低維、稠密的向量空間中進(jìn)行拼接。以貨物ID為例,設(shè)該特征有k種取值,其第i項(xiàng)取值的one-hot向量oig_id與權(quán)重矩陣Wig_id進(jìn)行點(diǎn)乘得到嵌入結(jié)果g_idi,以特征取第4個可能取值為例,其嵌入向量記為g_id4,原理如式(1)所示,d表示希望得到的低維向量維度,0的不同下標(biāo)是為了說明其所在位置。
類似地,仍以第i項(xiàng)為例,我們也可以得到貨物所屬類別ID的嵌入向量,設(shè)為c_idi,c_idi∈Rd,然后將g_idi和c_idi進(jìn)行拼接,可以得到第i個貨物的嵌入向量x'i=(g_idi,c_idi),x'i∈R2d。將從司機(jī)行為特征中選取的n個貨物按照司機(jī)點(diǎn)擊行為的先后順序進(jìn)行排序,可以得到序列X '=[x'1,x'2,...,x'n-1,x'n],以司機(jī)D為例,司機(jī)D的司機(jī)行為特征X 'D可表示為式(2)。
對于其他三類特征,處理方式與上文類似,也是通過one-hot編碼后進(jìn)行嵌入,每個特征的維度均為M維,具體表示為式(3)。
1.2.2" " 司機(jī)興趣抽取模塊
司機(jī)興趣抽取模塊可以被分為三個部分:Bi-GRU、SENet和平均池化。
Bi-GRU可以被看作是兩層GRU,能夠從兩個方向捕獲司機(jī)點(diǎn)擊行為的關(guān)系,如圖2所示。首先,按點(diǎn)擊順序排列的歷史貨物數(shù)據(jù)被用作Bi-GRU的輸入,同時被輸入到兩個方向相反的GRU隱層。由此,兩個GRU隱層可以捕獲隱藏在輸入數(shù)據(jù)中的綜合信息,然后通過前向和后向GRU提取隱藏層特征和,式(4)—(7)說明了點(diǎn)擊貨物i隱藏狀態(tài)的計(jì)算過程。
其中,x'i為當(dāng)前的輸入,hi為當(dāng)前的輸出,hi-1為前一個隱藏狀態(tài)的輸出,zi和ri分別代表更新門和重置門,為要更新的信息,W和U是權(quán)重矩陣,b是偏置向量,σ是sigmoid函數(shù),tanh為激活函數(shù)。
最后,Bi-GRU的輸出為前向和后向GRU輸出的和。以上述貨物i為例,此時的輸出為hi=+,那么,對于整個Bi-GRU的輸出,我們可以得到H=[h1,h2,...,hn-1,hn]。
對于Bi-GRU的輸出,我們可以將其看作n個貨物的綜合信息表示。對于這n個貨物特征向量來說,其所包含的特征種類是相同的,但是所包含的具體內(nèi)容是有差異的,對于推測司機(jī)興趣所起到的作用也不同。具體來講,在這n個貨物特征向量中,有的特征向量能夠充分顯示出司機(jī)的興趣,有的則關(guān)聯(lián)不大,所以我們想要突出前者的貢獻(xiàn),淡化后者的作用。對于特定的點(diǎn)擊率預(yù)測任務(wù),可以通過SENet機(jī)制動態(tài)地增加重要特征的權(quán)重,減少無信息特征的權(quán)重。受此啟發(fā),為了達(dá)到研究目的,我們通過SENet機(jī)制動態(tài)增加了重要貨物特征向量的權(quán)值,減少了非重要貨物特征向量的權(quán)值,如圖3所示。SENet共分為三步:擠壓、激勵、再稱重,具體計(jì)算過程如下。
通過Bi-GRU和SENet的計(jì)算,我們得到了新的貨物向量H',H'可以被看作是司機(jī)興趣向量的表示。為了使其更方便地與其他向量進(jìn)行拼接,我們采用平均池化將n個向量壓縮為1個向量。假設(shè)最終的輸出為VI,則VI=(v1,v2,...,vi,...,v2d-1,v2d),其中vi,i∈[1,...,2d]是標(biāo)量值,vi的具體計(jì)算過程如下。
其中h'ti是h't第i維所對應(yīng)的值。
1.2.3" " 車貨特征交互模塊
車貨特征交互模塊可以被分為兩部分:FM和ResNet。
以特征x'i0和x'j0為例,對應(yīng)的隱向量分別為wi和wj,設(shè)FM的輸出為VL,表示其他三類特征的二階特征交互向量,VL具體計(jì)算過程如下。
其中wi,wj∈Rk。
ResNet結(jié)構(gòu)如圖4所示,輸入為其他三類特征x'0,可以包含多個殘差塊,每一個殘差塊包括兩個隱藏層,每一個隱藏層具有相同數(shù)量的節(jié)點(diǎn),用mL表示。每個節(jié)點(diǎn)的激活函數(shù)均用ReLU表示,相鄰隱藏層之間的節(jié)點(diǎn)為全連接。以第一個殘差塊為例,第一個隱藏層的輸出如下式所示。
第二個隱藏層的輸出如下式所示。
在上述公式中,W0(W0∈RmL×m)表示從嵌入層到第一層隱藏層的權(quán)重矩陣,b0(b0∈RmL)是第一層隱藏層的偏置向量;類似地,W1(W1∈RmL×mL)是第一層隱藏層到第二層隱藏層的權(quán)重矩陣,b1(b1∈RmL)是第二層隱藏層的偏置向量。在計(jì)算完第二個隱藏層的輸出后,整個殘差塊的輸出為x'0和j2的元素加和(element-wise sum),為了使x'0和j2能夠相加,需要保證兩者的節(jié)點(diǎn)數(shù)相同,因此需要對x'0做進(jìn)一步的轉(zhuǎn)換,使
則殘差塊的輸出為:
ResNet中包含多個殘差塊,設(shè)最后一個殘差塊的輸出為VH(VH∈RmL),VH表示其他三類特征的高階特征交互向量。
1.2.4" " 點(diǎn)擊率輸出層
最后,將司機(jī)興趣抽取模塊和車貨特征交互模塊的輸出拼接在一起,表示為Vfinal=[V1;V2;VH]。雖然之前已經(jīng)進(jìn)行了特征交互,但是VI并沒有與其他特征進(jìn)行交互,所以Vfinal會被輸入到用ReLU函數(shù)激活的全連接層中,然后用sigmoid函數(shù)計(jì)算司機(jī)點(diǎn)擊貨物的概率。具體計(jì)算過程如下。
點(diǎn)擊率預(yù)測是一個經(jīng)典的二元分類問題,所以,選擇負(fù)對數(shù)似然函數(shù)作為目標(biāo)函數(shù),具體計(jì)算公式如下。
其中S表示總訓(xùn)練集,x和y分別是網(wǎng)絡(luò)的輸入和標(biāo)簽,P(x)是網(wǎng)絡(luò)的輸出,表示司機(jī)點(diǎn)擊貨物的概率。
2" " 實(shí)" " 驗(yàn)
本節(jié)描述了為評估DIIN方法的性能而進(jìn)行的實(shí)驗(yàn),其中包括實(shí)驗(yàn)使用的數(shù)據(jù)集、評價指標(biāo)、對比方法和實(shí)驗(yàn)流程。
2.1" " 數(shù)據(jù)集
上述實(shí)驗(yàn)所使用的數(shù)據(jù)集是某車貨匹配平臺所提供的非公開的司機(jī)行為數(shù)據(jù)集,該數(shù)據(jù)集包括667名司機(jī),2 208 579件貨物和1 751 673條司機(jī)行為,其中司機(jī)行為包括瀏覽貨物、點(diǎn)擊貨物和打電話。由于瀏覽貨物是經(jīng)常發(fā)生且無意識的行為,因此本實(shí)驗(yàn)認(rèn)為點(diǎn)擊貨物和打電話屬于點(diǎn)擊行為。為了保證實(shí)驗(yàn)的真實(shí)性,對數(shù)據(jù)進(jìn)行了處理。具體來說,刪除了歷史行為不超過100次和點(diǎn)擊行為次數(shù)不超過10次的司機(jī),因此最終的實(shí)驗(yàn)數(shù)據(jù)集包括582名司機(jī)、1 105 719件貨物和1 735 993條司機(jī)行為。
2.2" " 評價指標(biāo)
選擇了兩種評價指標(biāo)來評估本實(shí)驗(yàn)方法,如下所示。
AUC是點(diǎn)擊率預(yù)測領(lǐng)域中常用的評價指標(biāo),將樣本根據(jù)預(yù)測點(diǎn)擊率由大到小進(jìn)行排列,然后隨機(jī)抽取一個正樣本和一個負(fù)樣本,正樣本排在負(fù)樣本前的概率即為AUC。
LogLoss用交叉熵來度量每個樣本的預(yù)測概率和實(shí)際標(biāo)簽之間的距離。計(jì)算公式如式(19)所示,LogLoss值越低,表明與實(shí)際標(biāo)簽的偏差越小,性能越好。
2.3" " 對比方法
為了驗(yàn)證所提出的DIIN模型的性能是否科學(xué),將其與LR、FM、DNN、ResNet、Wideamp;Deep、DeepFM、DIN、DIEN等方法進(jìn)行了比較。其中,LR和FM是非DNN方法,其他則是基于DNN的方法。具體來講,DNN和ResNet是單模型,Wideamp;Deep和DeepFM是雙組合模型,DIN和DIEN則可以被看作是興趣模型。
2.4" " 實(shí)驗(yàn)流程
使用PyTorch來試驗(yàn)本文提出的方法和所有對比方法,采用60%的數(shù)據(jù)集作為訓(xùn)練集來學(xué)習(xí)參數(shù),20%的數(shù)據(jù)集作為驗(yàn)證集來調(diào)整超參數(shù),20%的數(shù)據(jù)集作為測試集來評估性能。
3" " 討" " 論
本節(jié)將所提出的方法DIIN與對比方法進(jìn)行比較,以評估其性能。為了探索SENet和ResNet的貢獻(xiàn),本文還進(jìn)行了消融研究。
3.1" " 結(jié)" " 果
實(shí)驗(yàn)結(jié)果如表1所示。根據(jù)實(shí)驗(yàn)結(jié)果,應(yīng)注意以下幾個方面。
非DNN模型在結(jié)果方面均差于基于DNN的模型,這是因?yàn)楹笳叩谋磉_(dá)能力更強(qiáng),能夠挖掘出更多潛藏在數(shù)據(jù)中的模式,而且其具有更靈活的模型結(jié)構(gòu)。在非DNN模型中,LR的結(jié)果要比FM差,這說明LR的泛化能力和表達(dá)能力有限。而FM不僅包括LR對單一特征做簡單加權(quán)的部分,還包括對所有特征進(jìn)行兩兩交叉,有效地捕捉了低階特征交互。
相比于非DNN模型,單DNN模型在結(jié)果上也有一定的進(jìn)步。這是因?yàn)榉荄NN模型在特征交互方面的能力是有限的,而單DNN模型能夠捕捉高階特征交互。具體來說,DNN是一個標(biāo)準(zhǔn)的深度神經(jīng)網(wǎng)絡(luò),只包括用于預(yù)測的嵌入和MLP層。DNN的出現(xiàn)是一個新的突破,同時也是其他DNN模型的原型。但是隨著網(wǎng)絡(luò)深度的不斷增加,不可避免地出現(xiàn)了梯度消失問題,而ResNet使用跳躍連接緩解了該問題,能夠更有效地捕捉高階特征交互。
相比于單DNN模型,雙組合DNN模型可以被看作是非DNN模型和單DNN模型的結(jié)合,能夠同時捕捉低階和高階特征,在結(jié)果方面也取得了更好的成效。具體來說,Wideamp;Deep將線性模塊和DNN模塊組合起來平衡了模型的記憶能力和泛化能力。DeepFM對其進(jìn)行了改進(jìn),用FM代替了線性模塊,加強(qiáng)了淺層網(wǎng)絡(luò)部分特征組合的能力。
與雙組合DNN模型相比,興趣DNN模型考慮了通過顯示交互關(guān)系來分析用戶的偏好,充分利用了用戶的歷史行為關(guān)系,取得了更好的效果。具體來說,DIN引入了注意力機(jī)制,能夠自適應(yīng)地從歷史行為中學(xué)習(xí)用戶興趣的表示;而DIEN則是在此基礎(chǔ)上,用序列模型模擬了用戶興趣的進(jìn)化過程,更好地捕捉了行為中隱藏的時間信息。
與結(jié)果最好的DIEN模型相比,本研究所提出的DII模型在AUC和LogLoss方面各有2.15%和1.82%的提升。由于本實(shí)驗(yàn)加強(qiáng)了特征的交互,同時對序列模型和注意力機(jī)制進(jìn)行了改進(jìn),使得該模型能夠更有效地提取司機(jī)興趣。
3.2" " SENet的有效性
在DIIN中,SENet的作用在于動態(tài)地表示不同貨物的重要程度。為了驗(yàn)證SENet的有效性,進(jìn)行了SENet的消融研究。首先,考慮在DIIN中移除SENet,將該方法命名為DIIN-1;然后,將SENet作為注意力機(jī)制中的一種,考慮用attention機(jī)制替換SENet,將該方法命名為DIIN-2。圖5是DIIN方法與這兩種方法的性能比較。從圖5中可以觀察到,與DIIN-1相比,DIIN-2和DIIN均取得了較高的AUC結(jié)果和較低的LogLoss結(jié)果,說明注意力機(jī)制的使用是非常必要且有效的。與DIIN-2相比,DIIN在AUC和LogLoss方面各得到了1.29%和1.26%的提升,說明SENet能夠更加準(zhǔn)確地表示不同貨物的重要性。
3.3" " ResNet的有效性
在DIIN中,ResNet的作用是捕捉高階特征的交互。為了驗(yàn)證ResNet的有效性,進(jìn)行了ResNet的消融研究。首先,考慮在DIIN中移除ResNet,將該方法命名為DIIN-3。其次,在傳統(tǒng)點(diǎn)擊率預(yù)測方法中,DNN常被用來捕捉高階特征交互,因此考慮用DNN替換ResNet,將該方法命名為DIIN-4。圖6為DIIN方法與這兩種方法的性能比較情況。從圖6中可以觀察到,與DIIN-3相比,DIIN-4和DIIN在AUC結(jié)果上各有0.48%和1.92%的提升,在LogLoss結(jié)果上各有0.37%和1.43%的提升,說明了深度模塊捕捉高階特征交互的必要性。與DIIN-4相比于DIIN-3的漲幅相比,DIIN相比于DIIN-4的漲幅在AUC方面是其3倍,在LogLoss方面是其2.86倍,說明在捕捉高階交互上,ResNet具有更好的效果。
4" " 結(jié)" " 論
本文以車貨匹配平臺中大規(guī)模的數(shù)據(jù)為出發(fā)點(diǎn),將車貨匹配問題轉(zhuǎn)化為司機(jī)對候選貨物的點(diǎn)擊率預(yù)測問題,并提出了一種基于深度學(xué)習(xí)的司機(jī)點(diǎn)擊率預(yù)測模型DIIN,該模型能夠捕捉司機(jī)興趣表示、加強(qiáng)特征交互。本文充分利用司機(jī)歷史行為日志中的信息,利用Bi-GRU和SENet抽取司機(jī)的興趣,同時利用FM和ResNet進(jìn)行特征交互,在某車貨匹配平臺數(shù)據(jù)集的支持下所得到的實(shí)驗(yàn)結(jié)果也驗(yàn)證了該方法的有效性。相比于之前的研究,本文利用深度學(xué)習(xí)來解決車貨匹配問題,同時將其與點(diǎn)擊率預(yù)測問題相結(jié)合,具有一定的創(chuàng)新性。此外,DIIN模型在車貨匹配場景中取得了成功,可以考慮將其推廣到其他點(diǎn)擊率預(yù)測場景中。在未來可以繼續(xù)考慮數(shù)據(jù)和車貨匹配場景這兩方面的內(nèi)容,探索更加有效的模型,以更好地解決車貨匹配問題。未來的研究不僅要從數(shù)據(jù)源中挖掘更多的隱藏關(guān)系,還要充分利用車貨匹配場景中的專業(yè)知識,使所提出的模型更切合實(shí)際。
參考文獻(xiàn):
[1] 肖斌.基于深度學(xué)習(xí)的車貨匹配問題研究[D].成都:西南交通大學(xué),2020.
[2] 倪少權(quán),羅軒,肖斌.考慮三方利益的車貨匹配優(yōu)化[J].西南交通大學(xué)學(xué)報,2023,58(1):48-57.
[3] 楊濱舟,葉欣揚(yáng),王睿,等.基于直覺模糊優(yōu)化的車貨雙邊公平匹配方法[J].計(jì)算機(jī)集成制造系統(tǒng),2023,29(5):1696-1707.
[4] 黃美華,李君,馬煒,等.基于數(shù)據(jù)挖掘的車貨信息匹配研究[J].浙江萬里學(xué)院學(xué)報,2017,30(6):66-71.
[5] 黃美華,李君,吳耀輝,等.基于最小二乘支持向量機(jī)的車貨匹配實(shí)現(xiàn)研究[J].浙江萬里學(xué)院學(xué)報,2018,31(2):87-92.
[6] 周夏.基于Stacking算法的貨運(yùn)平臺車貨匹配預(yù)測研究[D].南京:南京大學(xué),2021.
[7] 運(yùn)滿滿.物流極客出爐|運(yùn)滿滿首屆YMM-TECH算法大賽冠軍誕生[EB/OL].(2018-9-12)[2023-11-14].https://www."ymm56.com/article4153.html.