• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)降噪自動(dòng)編碼器的點(diǎn)擊率預(yù)測(cè)①

      2021-06-28 06:28:14王洪波王富豪李亞峰
      關(guān)鍵詞:點(diǎn)擊率冷啟動(dòng)編碼器

      劉 勐,王洪波,2,3,王富豪,李亞峰

      1(復(fù)旦大學(xué) 工程與應(yīng)用技術(shù)研究院,上海200433)

      2(復(fù)旦大學(xué) 上海智能機(jī)器人工程技術(shù)研究中心,上海 200433)

      3(復(fù)旦大學(xué) 智能機(jī)器人教育部研究中心,上海 200433)

      信息爆炸與大數(shù)據(jù)技術(shù)的普及,促進(jìn)了個(gè)性化推薦技術(shù)的快速發(fā)展[1].作為廣告推薦系統(tǒng)一項(xiàng)重要任務(wù),點(diǎn)擊率預(yù)測(cè)(CTR)對(duì)于許多互聯(lián)網(wǎng)公司來(lái)說(shuō)都是必不可少的.例如,YouTube 每天的視頻播放時(shí)間已超過(guò)10 億小時(shí).其推薦系統(tǒng)需要根據(jù)用戶(hù)需求、興趣等,通過(guò)推薦算法通過(guò)從海量數(shù)據(jù)中高效準(zhǔn)確的預(yù)測(cè)用戶(hù)感興趣項(xiàng)目,并將結(jié)果以個(gè)性化列表的形式推薦給用戶(hù)[2].

      用戶(hù)與項(xiàng)目數(shù)據(jù)的特征通常是離散和稀疏的,因此CTR 預(yù)測(cè)任務(wù)的關(guān)鍵挑戰(zhàn)是如何有效學(xué)習(xí)特征之間的交互來(lái)建模這種數(shù)據(jù).過(guò)去,已有許多學(xué)者提出相關(guān)算法來(lái)解決此問(wèn)題,如邏輯回歸(LR)[3]、基于樹(shù)的模型[4]、貝葉斯模型[5]、基于張量的模型[6]和基于因子分解的模型[7,8]等.這些模型通過(guò)學(xué)習(xí)成對(duì)特征之間的低階交互提高特征表示能力,但同時(shí)會(huì)帶來(lái)了與任務(wù)無(wú)關(guān)的特征交互組合.近年來(lái),依靠強(qiáng)大特征表示能力,深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)[9,10]和自然語(yǔ)言處理[11,12]等許多領(lǐng)域開(kāi)始大放光彩.最近幾年深度學(xué)習(xí)模型也開(kāi)始逐步在推薦領(lǐng)域得到應(yīng)用,例如基于神經(jīng)網(wǎng)絡(luò)的因子分解模型(FNN)[13],基于注意力機(jī)制的因式化機(jī)模型(AFM)[14],Wide &Deep[15],DeepFM[16]等.當(dāng)前絕大多數(shù)解決點(diǎn)擊率預(yù)測(cè)問(wèn)題的深度學(xué)習(xí)算法大致分為3 個(gè)步驟.首先,利用嵌入表示模型將用戶(hù)和項(xiàng)目高維稀疏特征映射為低維稠密向量.然后,對(duì)得到的嵌入向量使用內(nèi)積、外積或者哈達(dá)瑪積等運(yùn)算獲得特征交叉表示.最后,基于隱向量使用多層感知器(MLP)預(yù)測(cè)用戶(hù)對(duì)于項(xiàng)目的評(píng)分或者偏好.

      在實(shí)際應(yīng)用中,由于相當(dāng)大比例的用戶(hù)和項(xiàng)目屬性通常是離散和稀疏的,CTR 模型會(huì)使用嵌入操作來(lái)處理輸入數(shù)據(jù).但是,常見(jiàn)的嵌入表示模型在處理數(shù)據(jù)集出現(xiàn)頻率較低的樣本時(shí),很難學(xué)習(xí)到合適的特征表征,在系統(tǒng)冷啟動(dòng)時(shí)性能表現(xiàn)較差.MLP 在深度學(xué)習(xí)模型中起到了基于bit-wise 層級(jí)的特征交互和非線(xiàn)性變換的作用,但在vector-wise 層次的特征交互上表現(xiàn)較差.同時(shí),隨著MLP 的深度和寬度的增加,在增加學(xué)習(xí)能力的同時(shí)也增加了參數(shù)量和過(guò)擬合的風(fēng)險(xiǎn).

      基于上述問(wèn)題,本文提出了一種基于改進(jìn)降噪自動(dòng)編碼器(DAE)[17]的點(diǎn)擊率預(yù)測(cè)模型ADVAE (ADditional Variational AutoEncoder).該方法通過(guò)添加噪聲來(lái)生成嵌入信息來(lái)學(xué)習(xí)稀疏和高維輸入特征的稠密低維表示,提高了模型在bit-wise和vector-wise 層次的特征交互能力,改善由于數(shù)據(jù)稀疏性引起的特征不平衡問(wèn)題.同時(shí),ADVAE 模塊使得模型即使在數(shù)據(jù)樣本特征稀疏甚至缺失情況下,也可以產(chǎn)生有效的嵌入表示,有效緩解了推薦系統(tǒng)中常見(jiàn)的冷啟動(dòng)問(wèn)題.同時(shí),該模型的ADVAE模塊可以針對(duì)不同任務(wù)動(dòng)態(tài)地應(yīng)用于到其他模型,具有很強(qiáng)的靈活性.

      1 點(diǎn)擊率預(yù)測(cè)

      點(diǎn)擊率預(yù)測(cè)利用用戶(hù)與項(xiàng)目之間的二元關(guān)系,基于用戶(hù)歷史行為記錄或者相似性關(guān)系幫助發(fā)現(xiàn)用戶(hù)可能感興趣的項(xiàng)目,對(duì)用戶(hù)的點(diǎn)擊行為進(jìn)行預(yù)測(cè).

      1.1 點(diǎn)擊率預(yù)測(cè)模型

      點(diǎn)擊率預(yù)測(cè)模型主要包含傳統(tǒng)模型和深度學(xué)習(xí)模型兩種,其中傳統(tǒng)的推薦方法主要分為以下3 種[18]:基于內(nèi)容的推薦(content-based recommendtion)[19]、協(xié)同過(guò)濾推薦(collabortive filtering recommendation)[20]和混合推薦(hybrid recommendation)[21],深度學(xué)習(xí)通過(guò)組合低階特征形成稠密的高階語(yǔ)義信息,從而自動(dòng)發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示,解決了傳統(tǒng)機(jī)器學(xué)習(xí)手工設(shè)計(jì)特征的問(wèn)題.常見(jiàn)的深度學(xué)習(xí)模型除了包含上述3 種傳統(tǒng)方法外還有基于社交網(wǎng)絡(luò)[22]、場(chǎng)景感知[23]等方法的推薦模型.

      1.2 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)在推薦系統(tǒng)中有著較為廣泛的應(yīng)用,主要用于從圖像、文本、音頻等信息中提取數(shù)據(jù)的隱藏特征.相比較多層感知機(jī),卷積神經(jīng)網(wǎng)絡(luò)使用權(quán)重共享結(jié)構(gòu)降低模型復(fù)雜度,有著更好的泛化能力.

      在目前的CTR 模型中,ConvNCF[24]模型應(yīng)用CNN 來(lái)改進(jìn)NCF,NCF 使用外積而不是點(diǎn)積來(lái)建模用戶(hù)-項(xiàng)目交互模式.此外,CCPM[25]使用對(duì)齊方式對(duì)相鄰字段執(zhí)行卷積,學(xué)習(xí)多個(gè)卷積層的相鄰特征間的依存關(guān)系.FGCNN[26]使用卷積層來(lái)代替?zhèn)鹘y(tǒng)的交互方式,使用多層卷積生成新的嵌入向量.上述卷積神經(jīng)網(wǎng)絡(luò)均在點(diǎn)擊率預(yù)測(cè)任務(wù)上取得了不錯(cuò)表現(xiàn),但是忽略了特征嵌入和交互的關(guān)系.

      1.3 降噪自動(dòng)編碼器

      自編碼器(Auto Encoder,AE)[27]通過(guò)一個(gè)編碼器和一個(gè)解碼器來(lái)重構(gòu)輸入數(shù)據(jù),學(xué)習(xí)數(shù)據(jù)的隱層表示.但是如果僅僅通過(guò)最小化輸入輸出的誤差來(lái)對(duì)模型訓(xùn)練,自編碼器常會(huì)學(xué)到一個(gè)恒等函數(shù).為解決這個(gè)問(wèn)題,降噪自編碼器[17]通過(guò)在自動(dòng)編碼器的輸入數(shù)據(jù)中加入噪聲得到,這樣降噪自編碼器在重構(gòu)輸入數(shù)據(jù)時(shí),就被迫去除這種噪聲來(lái)學(xué)習(xí)到更加魯棒的輸入數(shù)據(jù)的表達(dá),降噪自編碼器通過(guò)這種方式提升了泛化能力以及在稀疏數(shù)據(jù)下的表現(xiàn).

      2 ADVAE

      考慮到數(shù)據(jù)的稀疏性和不平衡性,本文提出了一種改進(jìn)的降噪自動(dòng)編碼器ADVAE.如圖1所示,該模型通過(guò)特征嵌入和特征交互合并為統(tǒng)一操作動(dòng)態(tài)獲取嵌入向量的方式提高在點(diǎn)擊率預(yù)測(cè)任務(wù)上的表現(xiàn),主要包括普通Embedding模塊、ADVAE Embedding 模塊、低階特征交叉模塊以及高階特征交叉模塊.其中,ADVAE 模塊解決了特征稀疏嵌入的問(wèn)題,生成的特征可以與原始特征嵌入向量融合,為其他分類(lèi)模型靈活地提供更為豐富的特征輸入,是該模型的關(guān)鍵部分.

      圖1 ADVAE 網(wǎng)絡(luò)結(jié)構(gòu)圖

      2.1 輸入層與嵌入層

      大多數(shù)點(diǎn)擊率模型的數(shù)據(jù)輸入采用one-hot 的形式,使用嵌入操作將高維稀疏數(shù)據(jù)映射為低維特征向量.假設(shè)user與item 的輸入數(shù)據(jù)表示為:

      其中,si表示在第i個(gè)域的輸入數(shù)據(jù)的one-hot 表示,f表示輸入數(shù)據(jù)域的總數(shù),在不同的數(shù)據(jù)集上會(huì)有所變化.在域i(1≤i≤f)中,嵌入操作后的向量表示為ei∈?f×D,其中D是嵌入向量的維度.因此,每個(gè)輸入可以表示為矩陣E=(e1;e2;e3;···;ef),其中E∈?f×D.

      2.2 隨機(jī)噪聲

      在受模型復(fù)雜度、訓(xùn)練集數(shù)據(jù)量以及數(shù)據(jù)噪音等問(wèn)題的影響下,通過(guò)編碼器得到的初始模型往往存在過(guò)擬合的風(fēng)險(xiǎn).在本文中,輸入數(shù)據(jù)的部分使用噪聲替代,這種加入同源隨機(jī)噪聲的方式一定程度上減輕了訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)的差異性,可以提高模型的有效性和魯棒性,增加模型的泛化能力.其中,對(duì)于每個(gè)噪聲向量ei∈?1×D使用高斯分布進(jìn)行隨機(jī)初始化,并將普通Embedding 模塊得到的向量與噪聲向量拼接作為ADVAE 模塊卷積操作的輸入.

      其中,concat表示矩陣級(jí)聯(lián),E∈?f×D是嵌入層的輸出,N∈?(D?f)×D是噪聲矩陣.

      2.3 ADVAE 模塊

      如圖2所示,ADAVE 模塊主要包含3 個(gè)卷積層和3 個(gè)轉(zhuǎn)置卷積層.卷積操作不僅可以學(xué)習(xí)到pair-wise層次的特征交互,而且學(xué)習(xí)到多個(gè)域之間的交互.在對(duì)隱向量進(jìn)行上采樣的過(guò)程中,轉(zhuǎn)置卷積的引入,一方面還原原始特征信息,另一方面過(guò)濾掉了原始特征中對(duì)任務(wù)不相關(guān)特征,使得模型更關(guān)注于與任務(wù)相關(guān)的特征,上采樣過(guò)程中相關(guān)特征則會(huì)被賦予更大的權(quán)重,起到了數(shù)據(jù)特征在位置維度上的注意力機(jī)制作用.同時(shí),ADAVE 模塊進(jìn)行的全局特征交互是bit-wise 層次的,而不僅是pair-wise 層次的.此外,添加噪聲輸入可以克服嵌入向量稀疏和數(shù)據(jù)不平衡的缺點(diǎn),同時(shí),這些額外的噪聲即可以捕獲內(nèi)部關(guān)系,也可以生成有利于交互的新向量.

      圖2 ADVAE 模塊

      編碼器由三層卷積層構(gòu)成,每經(jīng)過(guò)一層卷積層,卷積核的寬度減少一倍,編碼器的輸入為嵌入向量與噪聲向量組成的特征矩陣E′∈?1×D×D,卷積輸出為X0=?C×N×N.在卷積層最后使用兩層全連接網(wǎng)絡(luò)得到隱向量的均值和方差,計(jì)算過(guò)程如下所示.

      其中,Xo表示輸入,Wm和Wl是兩層全連接網(wǎng)絡(luò)的權(quán)重矩陣,bm和bl是偏差,φ是激活函數(shù),則隱變量Z~(μ,diag(σ))∈?N×N.

      解碼器使用與編碼器同數(shù)量的轉(zhuǎn)置卷積層,通過(guò)對(duì)隱變量的上采樣還原原始特征矩陣.同時(shí),在編碼器部分加入了一個(gè)判別器,幫助提高ADVAE 對(duì)點(diǎn)擊率預(yù)測(cè)任務(wù)的特征學(xué)習(xí).

      2.4 損失函數(shù)

      該模型的損失函數(shù)共由4 部分組成,分別是編碼器重構(gòu)損失LM,判別器的分類(lèi)交叉熵?fù)p失LB、MLP 分類(lèi)器的交叉熵?fù)p失LC以及編碼器隱變量的KL 損失KL,其中:

      降噪自動(dòng)編碼器一種具有降噪功能的特征提取器,目的是將一個(gè)包含噪聲的輸入數(shù)據(jù)轉(zhuǎn)化為一個(gè)干凈的數(shù)據(jù)輸出.在損失函數(shù)中,重構(gòu)損失和編碼器隱變量的KL損失保證了ADVAE 模型盡可能在引入噪聲條件下仍能還原出原始數(shù)據(jù)的輸入分布.其中,重構(gòu)損失使用均方誤差損失,以誤差的平方和作為損失,其函數(shù)易于求導(dǎo),保證模型對(duì)原始數(shù)據(jù)的生成能力;KL損失函數(shù)通過(guò)計(jì)算KL散度估計(jì)兩個(gè)分布的相似度,對(duì)編碼后隱變量進(jìn)行優(yōu)化,保證模型的編碼能力.

      模型在對(duì)點(diǎn)擊結(jié)果預(yù)測(cè)上使用了兩部分的損失,一是使用解碼器多層級(jí)特征作為預(yù)測(cè)判別器的輸入的分類(lèi)損失LB,二是模型使用原始數(shù)據(jù)以及生成數(shù)據(jù)作為輸入構(gòu)造的MLP 分類(lèi)器的損失Lc,兩部分損失均使用交叉熵?fù)p失函數(shù),由于具有非常強(qiáng)的概率分布表征能力,交叉熵?fù)p失函數(shù)常用于分類(lèi)任務(wù).

      3 實(shí)驗(yàn)分析

      本文在公開(kāi)數(shù)據(jù)集Ctriteo、Avazu和Movielen-20M 上分別在點(diǎn)擊率預(yù)測(cè)效果以及系統(tǒng)冷啟動(dòng)性能兩個(gè)方面與現(xiàn)有模型進(jìn)行了對(duì)比實(shí)驗(yàn),詳細(xì)說(shuō)明如表1.參與對(duì)照實(shí)驗(yàn)的CTR 模型包括僅使用初始化特征的線(xiàn)性方法LR、考慮二階特征交互的分解機(jī)方法(FM、FFM)以及高階交互的深度學(xué)習(xí)模型(DCN、Wide &Deep、AFM、Autoint、xDeepFM、FibiNet).

      表1 數(shù)據(jù)集說(shuō)明

      3.1 實(shí)驗(yàn)設(shè)置

      本文的實(shí)驗(yàn)基于PyTorch 框架實(shí)現(xiàn),在3 個(gè)數(shù)據(jù)集上,模型的訓(xùn)練參數(shù)如表2所示,其中超參數(shù) λ1=1、λ2=0.1、λ3=0.5、λ4=1.所有對(duì)照模型與ADVAE 方法均使用相同的MLP 訓(xùn)練參數(shù).

      表2 模型訓(xùn)練參數(shù)

      本文選取AUC和LogLoss 值作為模型性能評(píng)估指標(biāo),AUC 值通過(guò)計(jì)算ROC 曲線(xiàn)下的面積得到,LogLoss通過(guò)計(jì)算預(yù)測(cè)結(jié)果與標(biāo)簽的交叉熵得到.

      3.2 點(diǎn)擊率預(yù)測(cè)實(shí)驗(yàn)

      表3反映了各個(gè)模型在Ctriteo、Avazu和Movielen-20M 數(shù)據(jù)集上的性能表現(xiàn).可以看出,AVDAE 在各個(gè)數(shù)據(jù)集上的表現(xiàn)均優(yōu)于現(xiàn)有模型.在實(shí)驗(yàn)中,我們發(fā)現(xiàn)使用多層感知器(MLP)往往會(huì)導(dǎo)致過(guò)度擬合,如圖3所示對(duì)于Wide &Deep,xDeepFM和DNN 之類(lèi)的幾種模型,通過(guò)使用多層感知器(MLP)訓(xùn)練約4 個(gè)epoch時(shí)的準(zhǔn)確率開(kāi)始下降.但是,在使用ADVAE 模塊后時(shí),在Criteo 數(shù)據(jù)集上訓(xùn)練10 個(gè)epoch 以及Avazu 數(shù)據(jù)集上訓(xùn)練8 個(gè)epoch 之后,準(zhǔn)確率仍有所提高,實(shí)驗(yàn)結(jié)果說(shuō)明,這種動(dòng)態(tài)嵌入方式極大地減輕了MLP 的過(guò)度擬合的問(wèn)題.

      圖3 準(zhǔn)確率變化曲線(xiàn)

      表3 點(diǎn)擊率預(yù)測(cè)實(shí)驗(yàn)?zāi)P托阅鼙憩F(xiàn)

      3.3 冷啟動(dòng)實(shí)驗(yàn)

      冷啟動(dòng)在推薦系統(tǒng)中表示該系統(tǒng)積累數(shù)據(jù)量較少,無(wú)法為新用戶(hù)提供個(gè)性化推薦的問(wèn)題,是推薦系統(tǒng)的一個(gè)難題.

      在冷啟動(dòng)實(shí)驗(yàn)中,本文通過(guò)將輸入特征的值置零來(lái)屏蔽一定數(shù)量的屬性去模擬冷啟動(dòng)情況.其中,K值表示特定屬性被屏蔽的概率.如表4所示,K值分別設(shè)置為20%、40%和60%.可以得到,在K值等于20%、40%、60%的冷啟動(dòng)條件下,ADVAE 方法優(yōu)于所有現(xiàn)有模型.特別是在K值等于20%、40%的情況下,與AutoInt和xDeepFM 相比,ADVAE 性能有較明顯的提升.

      表4 冷啟動(dòng)實(shí)驗(yàn)?zāi)P托阅鼙憩F(xiàn)

      在Criteo和Avazu 數(shù)據(jù)集這兩個(gè)數(shù)據(jù)集中存在缺失值,xDeepFM、AutoInt 等算法更關(guān)注于數(shù)據(jù)嵌入后的特征交互,但沒(méi)有注意之前的嵌入操作是否合理.而ADVAE 模型通過(guò)引入噪聲生成特征去動(dòng)態(tài)修復(fù)原始嵌入,使得模型在處理數(shù)據(jù)缺失問(wèn)題時(shí)更加魯棒.

      結(jié)果表明,在系統(tǒng)冷啟動(dòng)情況下,ADVAE 模型仍可以找出最合適的預(yù)測(cè)結(jié)果.

      4 結(jié)論與展望

      本文提出了一種基于改進(jìn)降噪編碼器的點(diǎn)擊率預(yù)測(cè)模型,通過(guò)引入噪聲數(shù)據(jù)生成新的嵌入特征來(lái)學(xué)習(xí)特征嵌入與特征交互的關(guān)系,然后分別進(jìn)行低階和高階的特征交互來(lái)預(yù)測(cè)用戶(hù)點(diǎn)擊行為.本文和常見(jiàn)點(diǎn)擊率預(yù)測(cè)模型,如線(xiàn)性回歸(LR)、FFM、xDeepFM 等,進(jìn)行了比較.實(shí)驗(yàn)結(jié)果表明,本文提出的點(diǎn)擊率預(yù)測(cè)算法在AUC、LogLoss 等指標(biāo)上顯著優(yōu)于現(xiàn)有模型,同時(shí),在數(shù)據(jù)稀疏及系統(tǒng)冷啟動(dòng)條件下,仍有較好的性能表現(xiàn),有效緩解過(guò)擬合現(xiàn)象.

      本文提出的模型主要應(yīng)用于當(dāng)前互聯(lián)網(wǎng)點(diǎn)擊率預(yù)測(cè)任務(wù),其中ADVAE 模塊可以動(dòng)態(tài)應(yīng)用到各類(lèi)點(diǎn)擊率預(yù)測(cè)模型中,具有很強(qiáng)的靈活性.但是在實(shí)際應(yīng)用中,實(shí)際場(chǎng)景對(duì)算法的實(shí)時(shí)性要求較高.所以,如何在保證算法預(yù)測(cè)性能的同時(shí)降低模型復(fù)雜度是本文后續(xù)研究的重要工作之一.

      猜你喜歡
      點(diǎn)擊率冷啟動(dòng)編碼器
      輕型汽油車(chē)實(shí)際行駛排放試驗(yàn)中冷啟動(dòng)排放的評(píng)估
      基于學(xué)習(xí)興趣的冷啟動(dòng)推薦模型
      客聯(lián)(2021年2期)2021-09-10 07:22:44
      基于FPGA的同步機(jī)軸角編碼器
      基于特征工程的視頻點(diǎn)擊率預(yù)測(cè)算法
      基于PRBS檢測(cè)的8B/IOB編碼器設(shè)計(jì)
      JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
      電子器件(2015年5期)2015-12-29 08:42:24
      喜報(bào)!萌寶大賽參賽者660名,投票321657人次,點(diǎn)擊率超60萬(wàn)!
      海峽姐妹(2015年8期)2015-02-27 15:12:30
      多總線(xiàn)式光電編碼器的設(shè)計(jì)與應(yīng)用
      軍事技能“冷啟動(dòng)”式訓(xùn)練理念初探
      徹底消失
      虎林市| 林口县| 安陆市| 聂荣县| 岳池县| 田林县| 尼勒克县| 汶上县| 永定县| 吴忠市| 周口市| 龙岩市| 印江| 通许县| 太和县| 南部县| 镇安县| 南投县| 新化县| 巩留县| 滦平县| 洛川县| 太和县| 盐城市| 汤阴县| 湘乡市| 塘沽区| 甘谷县| 裕民县| 甘洛县| 松原市| 丰城市| 麦盖提县| 嘉禾县| 霍邱县| 封开县| 武平县| 四子王旗| 沂南县| 循化| 仁寿县|