• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于相關(guān)修正的無偏排序?qū)W習(xí)方法

    2022-12-16 02:43:24王奕婷蘭艷艷郭嘉豐程學(xué)旗
    計算機研究與發(fā)展 2022年12期
    關(guān)鍵詞:對偶文檔排序

    王奕婷 蘭艷艷 龐 亮 郭嘉豐 程學(xué)旗

    1(中國科學(xué)院網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點實驗室(中國科學(xué)院計算技術(shù)研究所) 北京 100190)2(中國科學(xué)院大學(xué) 北京 100049)3(清華大學(xué)智能產(chǎn)業(yè)研究院 北京 100084)4(中國科學(xué)院計算技術(shù)研究所數(shù)據(jù)智能系統(tǒng)研究中心 北京 100190)(wangyiting211@mails.ucas.ac.cn)

    排序?qū)W習(xí)是信息檢索領(lǐng)域的關(guān)鍵技術(shù),它運用機器學(xué)習(xí)方法訓(xùn)練模型并根據(jù)查詢請求返回候選文檔的預(yù)測得分.真實場景中的網(wǎng)絡(luò)信息隨時間更新變化,若采用傳統(tǒng)的排序?qū)W習(xí)方法則需不斷對新產(chǎn)生的數(shù)據(jù)進行人工標注,這需要消耗人力且不利于模型的實時更新.相較文檔相關(guān)標簽,用戶瀏覽留下的點擊數(shù)據(jù)規(guī)模大、易于獲取[1]且更能反映用戶偏好和興趣[2].將點擊數(shù)據(jù)作為標簽?zāi)軌蛴行Ы档蜆俗⒊杀綶3].因此,面向點擊數(shù)據(jù)訓(xùn)練模型具有重要意義.

    用戶點擊[4]包含偏差和噪聲[5-6],如位置靠前的文檔更容易被用戶點擊,因此直接將是否點擊作為文檔相關(guān)的判據(jù)會導(dǎo)致次優(yōu)的模型訓(xùn)練效果[7].目前主要有2類方法利用點擊數(shù)據(jù)訓(xùn)練模型:一類為點擊模型,它通過研究用戶行為特點從用戶點擊推測文檔相關(guān)性,從而得到去除偏差后的數(shù)據(jù)用于訓(xùn)練.這類方法將偏差去除和排序任務(wù)作為2個分開的任務(wù).由于2步驟優(yōu)化的目標不一致,往往不能達到很好的訓(xùn)練效果,且在長尾稀疏數(shù)據(jù)場景表現(xiàn)不佳.另一類為近年來提出的無偏排序?qū)W習(xí)方法,它的基本思路是利用逆傾向加權(quán)方法進行反事實因果推斷,對不同文檔進行點擊傾向估計并對損失加權(quán),最終得到無偏模型.這類方法需要較為準確的點擊傾向估計,結(jié)果隨機呈現(xiàn)是較常見的思路.它將候選文檔打亂排列次序并呈現(xiàn)給用戶,根據(jù)用戶的實際點擊情況估計點擊傾向,但呈現(xiàn)給用戶的文檔順序被打亂進而會導(dǎo)致用戶體驗不佳.

    基于回歸的期望最大化方法是通過極大似然估計計算點擊概率和傾向概率,但該方法對初值敏感且每當有數(shù)據(jù)更新時都需重新執(zhí)行算法,因此適用范圍有限.

    對偶學(xué)習(xí)方法是目前較為主流的無偏排序方法,適用范圍較廣且在多個數(shù)據(jù)集上表現(xiàn)較優(yōu)[8].在已知用戶點擊的情況下,用戶是否觀察到文檔以及文檔是否與該項查詢相關(guān)未知.對偶學(xué)習(xí)將這2個概率估計問題看作對偶任務(wù),利用逆傾向加權(quán)和逆相關(guān)加權(quán)聯(lián)合訓(xùn)練排序模型和傾向模型.但該方法僅當排序模型和傾向模型的損失函數(shù)均為凸函數(shù)時收斂到最優(yōu).實際神經(jīng)網(wǎng)絡(luò)包含多個隱藏層導(dǎo)致?lián)p失函數(shù)非凸,模型可能收斂得到次優(yōu)解.

    針對上述問題,本文提出一種新的無偏排序?qū)W習(xí)方法,利用現(xiàn)有小規(guī)模標注數(shù)據(jù)對排序模型預(yù)訓(xùn)練,并利用其對對偶去偏過程進行相關(guān)修正.由于對偶學(xué)習(xí)方法中越精準的排序模型會促使傾向模型輸出的傾向得分越貼近真實用戶點擊傾向,而越準確的傾向模型會促使訓(xùn)練的排序模型更接近無偏模型,故本文方法利用現(xiàn)有的小規(guī)模樣本訓(xùn)練排序模型能使得模型在聯(lián)合訓(xùn)練前有較好的初始值從而避免訓(xùn)練中錯誤的累積,進而得到更優(yōu)的無偏模型.模擬不同程度的點擊偏差并在真實點擊數(shù)據(jù)場景下測試,結(jié)果表明本文方案能夠有效提升無偏排序方法表現(xiàn).

    1 相關(guān)工作

    利用用戶點擊反饋訓(xùn)練模型有點擊模型和無偏排序?qū)W習(xí)2類方法.

    1.1 點擊模型

    點擊模型從已知的用戶點擊中反向推斷文檔與查詢的相關(guān)性,再將其結(jié)果用于訓(xùn)練.基于用戶瀏覽行為特點,研究者提出了不同的點擊模型[9-13],從帶偏的點擊數(shù)據(jù)中推測實際文檔相關(guān)性.如位置模型(position based model, PBM)假設(shè)用戶是否點擊由文檔吸引用戶程度以及是否被用戶檢驗所決定.在此基礎(chǔ)上Craswell等人[10]作進一步假設(shè),認為用戶自上而下瀏覽網(wǎng)頁、返回結(jié)果、并逐個判定是否點擊該文檔、直到需求被滿足,構(gòu)建了級聯(lián)模型(cascade model, CM).級聯(lián)模型在一次搜索過程中只出現(xiàn)一次點擊,某位置文檔被點擊的概率與之前的文檔是否被點擊有關(guān),而位置模型中各文檔被點擊的概率相互獨立.用戶瀏覽模型[11](user browsing model, UBM)可看作上述模型的拓展,它既考慮了用戶對某一位置文檔是否點擊與該位置之前的文檔是否被點擊之間的關(guān)聯(lián)關(guān)系;又考慮了文檔排列的先后位置順序與用戶對該位置文檔進行檢驗的概率之間的關(guān)聯(lián)關(guān)系.

    在上述不同假設(shè)條件下,可以通過用戶點擊來推測文檔的相關(guān)性,從而訓(xùn)練排序模型.然而,這類方法要求每一查詢-文檔對多次呈現(xiàn)給用戶,因此難以適用于稀疏數(shù)據(jù)場景.此外,由于點擊模型去偏和訓(xùn)練排序模型2步驟的優(yōu)化目標不一致,最終模型能夠達到的效果有限.

    1.2 無偏排序?qū)W習(xí)

    對點擊數(shù)據(jù)去除偏差并得到文檔的真實相關(guān)性的任務(wù)存在難以適用于稀疏長尾數(shù)據(jù)的真實場景以及前后任務(wù)優(yōu)化目標不一致等諸多難點,因此近年來研究人員提出無偏排序?qū)W習(xí)這一新的研究方向,將點擊數(shù)據(jù)作為標簽訓(xùn)練無偏模型.Wang等人[14]和Joachims等人[15]提出采用逆傾向評分加權(quán)的方法來訓(xùn)練無偏排序?qū)W習(xí)模型,利用結(jié)果隨機呈現(xiàn)的方法來估計點擊傾向.然而上述方法需要將結(jié)果隨機展示給用戶,導(dǎo)致用戶體驗下降.因此,2018年Wang等人[16]探討了結(jié)果隨機呈現(xiàn)帶來的不良影響并提出基于回歸的期望最大化方法用于個性化搜索場景.該方法可以提升用戶體驗,并從一定程度上解決個性化搜索中的點擊數(shù)據(jù)稀疏的問題,但每當有點擊數(shù)據(jù)更新時都需要重新進行計算.

    Ai等人[17]將排序?qū)W習(xí)模型和傾向模型的訓(xùn)練看作對偶任務(wù),對2個模型同時訓(xùn)練.在此基礎(chǔ)上,Hu等人[18]將逆傾向得分加權(quán)方法擴展為成對去偏方法,并結(jié)合LambdaMART實現(xiàn)位置偏差估計和排序模型的共同訓(xùn)練.這類方法用戶體驗相對較好,然而當相關(guān)性模型估計不準確時會引入新的偏差.由于傾向估計表現(xiàn)依賴于排序模型效果,因此需要構(gòu)建較為準確的相關(guān)估計模型以提升效果.

    2 問題描述

    2.1 無偏排序任務(wù)

    無偏排序旨在利用用戶反饋數(shù)據(jù)訓(xùn)練模型,對給定查詢q和文檔d的特征信息給出對應(yīng)的文檔相關(guān)得分,按照從高到低將排序結(jié)果返回并呈現(xiàn)給用戶,系統(tǒng)記錄用戶點擊候選列表中的某一文檔并更新模型,其流程如圖1所示:

    對于每一查詢-文檔對,無偏排序?qū)W習(xí)方法將點擊數(shù)據(jù)作為標簽,通過設(shè)計有效的損失函數(shù)盡可能消除點擊數(shù)據(jù)偏差,使模型向相關(guān)標簽訓(xùn)練的排序模型收斂.

    為統(tǒng)一本文表達方式,列出本文使用符號參數(shù)及其含義如表1所示.令用戶輸入的查詢集合為Q,查詢q∈Q.系統(tǒng)針對查詢q返回呈現(xiàn)給用戶的文檔列表πq,文檔用d表示.>

    Table 1 Symbols and Their Meanings表1 使用符號及其含義

    2.2 對偶學(xué)習(xí)及問題

    現(xiàn)有無偏排序?qū)W習(xí)算法中,對偶學(xué)習(xí)方法在多個數(shù)據(jù)集上表現(xiàn)較佳且適用范圍較廣,其流程如圖2所示:

    Fig. 2 Core ideas of dual learning algorithm圖2 對偶學(xué)習(xí)核心思路

    假設(shè)對每一文檔d,用戶點擊某一文檔當且僅當該文檔被觀察到且與查詢相關(guān),如式(1)所示:

    P(cd=1)=P(od=1)×P(rd=1).

    (1)

    對于查詢集合Q,傾向估計的目標是找到傾向模型P,使得損失函數(shù)達到最?。?/p>

    (2)

    類似地,對文檔進行正確排序的方法是找到排序模型R使得損失函數(shù)達到最?。?/p>

    (3)

    對偶學(xué)習(xí)方法將傾向估計和相關(guān)估計看作對偶問題,聯(lián)合訓(xùn)練傾向模型和相關(guān)模型并得到最終模型參數(shù).對于點擊傾向模型,對檢索記錄被觀察到的概率估計問題定義逆相關(guān)加權(quán)(inverse relevance weighting, IRW)損失函數(shù)lIRW(P,c)如式(4)所示:

    (4)

    其中Δ(P,cd|πq)代表文檔序列πq中文檔d的損失.可以證明逆相關(guān)加權(quán)后lIRW(P,c)是傾向模型的無偏估計,如式(5)所示.類似也可證明逆傾向加權(quán)后lIPW(P,c)是排序模型的無偏估計.

    (5)

    訓(xùn)練過程中,傾向模型對每一位置的文檔輸出其估計的用戶點擊傾向;相關(guān)模型對每一文檔輸出其計算出的相關(guān)概率;對用戶點擊分別乘以逆傾向權(quán)重和逆相關(guān)權(quán)重來計算相關(guān)模型和傾向模型的損失值并更新參數(shù).經(jīng)過多輪迭代直到模型收斂并得到最終的模型參數(shù).

    該方法的收斂條件是排序模型和傾向模型的目標函數(shù)為凸函數(shù),但實際神經(jīng)網(wǎng)絡(luò)含有多個隱藏層,導(dǎo)致其損失函數(shù)非凸不能保證結(jié)果最優(yōu).

    3 基于相關(guān)修正的對偶去偏方法

    3.1 模型架構(gòu)

    針對上述模型收斂得到次優(yōu)解的問題,本文設(shè)計一種基于相關(guān)修正的無偏排序?qū)W習(xí)方法,利用現(xiàn)有小規(guī)模相關(guān)標簽訓(xùn)練模型并利用其對對偶學(xué)習(xí)進行調(diào)整和修正,從而得到更優(yōu)的無偏排序模型.方案流程如圖3所示:

    Fig. 3 Unbiased learning to rank based on relevance correction圖3 基于相關(guān)修正的無偏排序?qū)W習(xí)方法

    在小規(guī)模標簽上預(yù)先排序模型可以對對偶去偏過程賦予更優(yōu)的初始參數(shù),因此在訓(xùn)練過程中,尤其是訓(xùn)練初期,排序模型和傾向模型輸出的文檔相關(guān)得分和點擊傾向得分更加準確.這防止了對偶訓(xùn)練過程中文檔相關(guān)得分和點擊傾向得分在相互輸出并計算損失時由于相關(guān)得分和傾向得分估計不準確導(dǎo)致迭代過程中錯誤的累積,從而促使最終模型收斂得到更優(yōu)結(jié)果.

    該方案包括以下步驟:階段1.先在少量標注的相關(guān)標簽上進行排序模型預(yù)訓(xùn)練;階段2.利用排序模型輸出的相關(guān)得分訓(xùn)練點擊傾向模型;階段3.利用訓(xùn)練好的模型對對偶去偏過程賦予初值并聯(lián)合訓(xùn)練.

    3.1.1 排序模型預(yù)訓(xùn)練

    為統(tǒng)一輸入的候選文檔維度并減少計算量,在預(yù)訓(xùn)練數(shù)據(jù)輸入之前先進行粗排.選用少量的訓(xùn)練數(shù)據(jù)訓(xùn)練模型并利用其返回排在前k位的文檔,作為預(yù)訓(xùn)練排序模型的訓(xùn)練數(shù)據(jù).

    利用帶有相關(guān)標簽的訓(xùn)練數(shù)據(jù),找到能夠使得指定損失函數(shù)L(y,f(x))最小的函數(shù)f*:

    (6)

    其中,f(x)代表排序模型輸出得分,y代表對應(yīng)的相關(guān)標簽.理論上任何可以輸出候選文檔分值的排序模型都可以作為該模型的實現(xiàn)方式.

    對每一查詢q的候選文檔列表,按照式(7)計算損失:

    (7)

    其中,i表示候選列表πq中第i個文檔,yi為第i個文檔的相關(guān)標簽值,wyi為對每一文檔分配的權(quán)重,其計算公式如式(8)所示:

    (8)

    文檔與查詢的相關(guān)程度越大,對應(yīng)的權(quán)重wyi越高,該文檔占損失的比重越大.在小規(guī)模相關(guān)標簽上訓(xùn)練完成后,返回預(yù)訓(xùn)練得到的排序模型參數(shù)θ0.

    3.1.2 對偶去偏

    在執(zhí)行對偶學(xué)習(xí)去偏過程之前,利用訓(xùn)練好的排序模型對每一查詢-文檔對輸出文檔相關(guān)得分.利用點擊數(shù)據(jù)和相關(guān)得分,采用逆相關(guān)加權(quán)方法訓(xùn)練傾向模型P,返回其參數(shù)γ0.

    將排序模型的參數(shù)θ0和傾向模型的參數(shù)γ0作為對偶去偏過程的初始值,并面向點擊數(shù)據(jù)聯(lián)合訓(xùn)練實現(xiàn)對偶模型的參數(shù)更新,得到收斂程度更好的最終模型.

    能夠有效利用經(jīng)偏差校正后的損失函數(shù)均可用于本文提出的方案.為便于方法有效性驗證和效果對比,選用與文獻[17]相同的基于softmax交叉熵的損失函數(shù)如式(9)(10)所示:

    (9)

    (10)

    用戶點擊傾向概率和文檔相關(guān)概率是通過傾向模型和排序模型對每一查詢-文檔對輸出的分值gd(γ)和fd(θ)經(jīng)過softmax變換后得到.

    (11)

    (12)

    因此,經(jīng)過逆傾向加權(quán)和逆相關(guān)加權(quán)后的損失函數(shù)如式(13)(14)所示.式中rk代表第k個位置的文檔是否相關(guān),ok代表第k個位置的文檔是否被觀察到.

    (13)

    (14)

    對數(shù)據(jù)集中的查詢集合Q,按照式(15)(16)計算傾向模型P和排序模型R的損失:

    (15)

    (16)

    綜上,本文提出的基于相關(guān)修正的對偶去偏方法如算法1.

    算法1.基于相關(guān)修正的對偶去偏方法.

    輸入:查詢集合Q,對q∈Q有集合{q,πq,cq};

    輸出:排序模型R的參數(shù)θ,傾向模型P的參數(shù)γ.

    ① 利用預(yù)訓(xùn)練的排序模型f*,對排序模型R的參數(shù)θ進行初始化賦值;

    ② 固定排序模型R的參數(shù)θ0,利用用戶點擊數(shù)據(jù)訓(xùn)練傾向模型P,得到參數(shù)γ0;

    ③ 隨機抽取部分查詢樣本,利用式(11)(12)對每一查詢計算展示列表中每個文檔被觀察到和被點擊的概率;

    ④ 按照式(15)(16)計算傾向模型和相關(guān)模型的損失;

    ⑤ 根據(jù)損失計算梯度并更新模型參數(shù)θ和γ;

    ⑥ 重復(fù)步驟③~⑤,直到收斂.

    3.2 有效性驗證

    令fi代表文檔列表πq中第i個文檔的相關(guān)性得分,將排序模型的參數(shù)固定,當滿足式(17)時,基于相關(guān)修正的對偶去偏模型收斂.

    (17)

    模型收斂時,最終得到

    P(od=1|πq)=

    (18)

    此時,位置i處的逆傾向權(quán)重為

    (19)

    由上可知,通過賦予較好的參數(shù)初始值可以避免迭代過程中錯誤的累積,從而得到更優(yōu)的無偏排序?qū)W習(xí)模型.因此,本文提出的無偏排序?qū)W習(xí)方法能夠有效促進系統(tǒng)的性能提升.

    3.3 計算速度

    在線計算速度方面,由于本文提出的基于相關(guān)修正的對偶去偏方法通過預(yù)訓(xùn)練的排序模型和傾向模型對對偶去偏過程賦予較好的初始值,并未改變部署的對偶去偏模型的參數(shù)量,因此在模型上線部署后,計算速度與原有對偶學(xué)習(xí)方法一致.

    離線訓(xùn)練時間方面,由于本文使用小規(guī)模的人工標注相關(guān)標簽預(yù)訓(xùn)練排序模型,因此需在原有基礎(chǔ)上會增加排序模型預(yù)訓(xùn)練的時間.然而實際場景下,系統(tǒng)往往已有預(yù)先訓(xùn)練好的表現(xiàn)較優(yōu)的排序模型可直接用于參數(shù)賦值,且離線訓(xùn)練時間不影響用戶體驗與模型上線效果,故該因素可以忽略.

    因此本文提出方法不影響模型的上線計算速度,能夠應(yīng)用于在線學(xué)習(xí)場景.

    4 實驗分析

    4.1 基準數(shù)據(jù)集實驗

    實驗選用公開數(shù)據(jù)集Yahoo! Learn to Rank Challenge[19]version 2.0 set1,該數(shù)據(jù)集總共包含29 921個查詢和其對應(yīng)的709 877個文檔,每一查詢文檔對有700維度的特征向量及其對應(yīng)的5分類水平(0~4)的相關(guān)標簽.其數(shù)據(jù)特征如表2所示:

    Table 2 Data Characteristics of Yahoo Dataset表2 Yahoo數(shù)據(jù)集數(shù)據(jù)特征

    仿照文獻[15,17]的方法,采用以下方法生成用戶點擊數(shù)據(jù).首先,隨機選取1%的訓(xùn)練數(shù)據(jù)和相關(guān)性標簽訓(xùn)練Ranking SVM模型[20],得到對每一查詢q的初始的結(jié)果序列πq,將該模型稱作初始排序模型,設(shè)置參數(shù)c=200.然后模擬用戶瀏覽檢索結(jié)果的過程,引入?yún)?shù)控制偏差和噪聲,計算點擊概率并生成點擊數(shù)據(jù),步驟如下:假設(shè)用戶在僅當文檔被觀察到并且與查詢相關(guān)時點擊該文檔.按照式(20)通過文獻[9]基于眼動追蹤實驗估計的展示偏差ρ計算觀察傾向概率.

    (20)

    其中,η∈[0,+∞]是控制展示偏差程度的超參數(shù),本文設(shè)置η的默認值為1.仿照文獻[21]按照式(21)的方法計算文檔相關(guān)概率.

    (21)

    其中,y為文檔的相關(guān)標簽,ymax是數(shù)據(jù)集中相關(guān)標簽的最大值,參數(shù)ε引入噪聲故而不相關(guān)文檔(yd=0)有一定概率被點擊.實驗設(shè)置ε=0.1.本文選用數(shù)據(jù)集的標簽是5分類,因此ymax=4.對于每一查詢,按照Ranking SVM模型輸出的得分對文檔進行排序,設(shè)置截止文檔個數(shù)為10.

    對偶學(xué)習(xí)方法的實現(xiàn)仿照論文設(shè)置學(xué)習(xí)率為0.05,批量大小(batch size)設(shè)置為256,網(wǎng)絡(luò)迭代13 000次后結(jié)束訓(xùn)練.本文方法中傾向模型的迭代次數(shù)設(shè)置為3 000,學(xué)習(xí)率為0.05,批量大小設(shè)為256,對偶去偏網(wǎng)絡(luò)迭代10 000次結(jié)束.不同比例的查詢數(shù)據(jù)實驗設(shè)置參數(shù)值如表3所示:

    Table 3 Parameter Settings of the Pre-trained Ranking Model表3 預(yù)訓(xùn)練排序模型參數(shù)設(shè)置

    4.1.1 可行性驗證

    為驗證本文提出方法的可行性,對上述Yahoo數(shù)據(jù)集進行劃分和構(gòu)造.將訓(xùn)練集分成2部分:一部分通過隨機抽取少量數(shù)據(jù)作為排序模型預(yù)訓(xùn)練的集合;另一部分查詢-文檔對通過模擬用戶行為生成用戶點擊并用于無偏排序模型的訓(xùn)練,2集合的劃分比例為2∶8.實驗選用的驗證集和測試集與Yahoo原始數(shù)據(jù)集相同.

    由于相關(guān)標簽有5個等級,因此選用多分類等級評估指標NDCG(normalized discounted cumulative gain)和ERR(expected reciprocal rank)展示其在第1,3,5,10位置上的結(jié)果,實驗結(jié)果如表4所示.另外選用較常用的AUC(area under curve)和MAP(mean average precision)指標進行評估.表4中數(shù)據(jù)顯示本文提出方法在各項指標上均優(yōu)于對比方法,說明該方法能夠有效提升現(xiàn)有方法的表現(xiàn).

    Table 4 Experimental Results on the Yahoo Dataset表4 在Yahoo數(shù)據(jù)集上的實驗結(jié)果

    4.1.2 偏差程度影響

    表4結(jié)果表明點擊數(shù)據(jù)偏差一定時,本文提出方法優(yōu)于基準方法.然而真實情況下用戶行為不斷變化.選用不同的η值模擬不同程度的點擊偏差,η值越大代表生成點擊數(shù)據(jù)的偏差越嚴重,比較對偶學(xué)習(xí)方法和本文方法訓(xùn)練結(jié)果如圖4所示.圖中展示的本文方法是隨機抽取20%查詢訓(xùn)練排序模型并進行相關(guān)修正的結(jié)果,令η值分別為0.5,1.0,1.5,2.0并繪制NDCG和ERR在第1,3,5,10位置的結(jié)果.

    Fig. 4 Results of different degrees of bias圖4 不同偏差程度結(jié)果

    圖4中可以看到,在不同η值模擬的用戶點擊偏差場景下,本文提出方法效果均優(yōu)于對偶學(xué)習(xí)方法.因此在不同程度的用戶點擊偏差場景下,本文方案能夠有效去除偏差.

    4.1.3 抗噪性能分析

    為進一步驗證方法的魯棒性,在不同噪聲場景下對比分析本文方法的性能,如圖5所示.通過控制ε值的大小來模擬不同程度的噪聲,其中ε值越大代表噪聲程度越大.ε=0.3時表明用戶有59.8%的概率點擊不相關(guān)的文檔.圖5中結(jié)果說明在不同噪聲程度下本文方法均有優(yōu)越的表現(xiàn).

    Fig. 5 Results of different degrees of noise圖5 不同噪聲程度結(jié)果

    4.2 真實點擊實驗

    為驗證真實用戶點擊數(shù)據(jù)場景下本文提出方法的有效性,選用Tiangong-ULTR[17,22]數(shù)據(jù)集進行實驗.該訓(xùn)練集包含3 449個查詢、333 813個文檔及其對應(yīng)的真實用戶點擊數(shù)據(jù);測試集包含100個查詢和10 000個文檔.按照2∶8對測試集進行劃分,其中20%含有相關(guān)標簽的數(shù)據(jù)作為排序模型預(yù)訓(xùn)練的數(shù)據(jù),另外的數(shù)據(jù)用于模型評估與比較.

    與現(xiàn)有點擊模型方法級聯(lián)模型CM、用戶瀏覽模型UBM、位置模型PBM和對偶學(xué)習(xí)方法進行比較,結(jié)果如圖6所示.可以看到,圖6中展示的各指標表明本文方法均優(yōu)于基準方法,證明了真實點擊數(shù)據(jù)場景下該方案具有優(yōu)異的性能表現(xiàn).

    Fig. 6 Results of the real click experiment圖6 真實點擊實驗結(jié)果

    5 總結(jié)展望

    針對對偶學(xué)習(xí)方法存在的問題,本文提出一種新的通用無偏排序?qū)W習(xí)方法.利用現(xiàn)有小規(guī)模標注數(shù)據(jù)訓(xùn)練排序模型,對候選文檔進行較精準的相關(guān)性判定,并對對偶去偏過程進行相關(guān)修正.通過預(yù)先訓(xùn)練的排序模型參數(shù)賦值操作避免損失函數(shù)非凸造成的次優(yōu)解.該方法將無偏排序問題轉(zhuǎn)化為在小規(guī)模標注數(shù)據(jù)上的排序?qū)W習(xí)問題,使得以往的排序模型能夠應(yīng)用于大規(guī)模點擊數(shù)據(jù).在模擬和真實用戶點擊場景下測試結(jié)果表明:本文方法能夠有效提升現(xiàn)有方法表現(xiàn).

    未來可以將本文提出方法應(yīng)用于大規(guī)模真實用戶點擊數(shù)據(jù)場景,并嘗試不同種類的排序?qū)W習(xí)方法作為預(yù)訓(xùn)練模型以進一步提升無偏排序模型的性能表現(xiàn).

    作者貢獻聲明:王奕婷為論文主要完成人,負責(zé)實驗設(shè)計與實施、文章撰寫;蘭艷艷對文稿提出針對性修改意見,完善課題思路和實驗設(shè)計,負責(zé)文章審校;龐亮提供專業(yè)知識等方面幫助,負責(zé)文章實驗部分的技術(shù)性指導(dǎo);郭嘉豐對文章的知識性內(nèi)容作批評性審閱并提出意見,提供工作支持;程學(xué)旗對所用方法缺陷提出改進意見.

    猜你喜歡
    對偶文檔排序
    排序不等式
    有人一聲不吭向你扔了個文檔
    恐怖排序
    節(jié)日排序
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    基于RI碼計算的Word復(fù)制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    對偶平行體與對偶Steiner點
    對偶均值積分的Marcus-Lopes不等式
    對偶Brunn-Minkowski不等式的逆
    国产三级黄色录像| 成人无遮挡网站| 午夜精品在线福利| 国产 一区 欧美 日韩| 国产成+人综合+亚洲专区| 老汉色∧v一级毛片| 国内揄拍国产精品人妻在线| 91久久精品国产一区二区成人 | 性欧美人与动物交配| 亚洲在线自拍视频| 动漫黄色视频在线观看| 国产免费av片在线观看野外av| 51午夜福利影视在线观看| 国产淫片久久久久久久久 | 免费人成视频x8x8入口观看| 欧美中文综合在线视频| 久久久久国产精品人妻aⅴ院| 99国产极品粉嫩在线观看| 亚洲av成人av| 精品熟女少妇八av免费久了| 看免费av毛片| 欧美日韩黄片免| 1024香蕉在线观看| 亚洲av日韩精品久久久久久密| 最近最新中文字幕大全免费视频| 亚洲性夜色夜夜综合| 97人妻精品一区二区三区麻豆| 国产野战对白在线观看| 两性午夜刺激爽爽歪歪视频在线观看| 久久久久国产精品人妻aⅴ院| 欧美日韩瑟瑟在线播放| 婷婷亚洲欧美| 不卡一级毛片| 中文亚洲av片在线观看爽| 九九在线视频观看精品| 免费av不卡在线播放| or卡值多少钱| 一个人观看的视频www高清免费观看 | 国产亚洲欧美在线一区二区| 国产av不卡久久| 精品乱码久久久久久99久播| 亚洲国产欧美一区二区综合| 国产人伦9x9x在线观看| 久久国产精品影院| 亚洲av美国av| 国产亚洲av嫩草精品影院| 日本在线视频免费播放| 亚洲国产高清在线一区二区三| 日韩欧美一区二区三区在线观看| 亚洲五月婷婷丁香| 99热这里只有是精品50| 色老头精品视频在线观看| 九九在线视频观看精品| 免费高清视频大片| 麻豆成人午夜福利视频| 精品一区二区三区av网在线观看| 91九色精品人成在线观看| 伊人久久大香线蕉亚洲五| 人人妻人人澡欧美一区二区| 国产亚洲欧美在线一区二区| 亚洲人与动物交配视频| 国产熟女xx| 最好的美女福利视频网| 午夜亚洲福利在线播放| 成年女人毛片免费观看观看9| 搡老熟女国产l中国老女人| 亚洲 国产 在线| 淫秽高清视频在线观看| 久久精品国产99精品国产亚洲性色| 欧美乱码精品一区二区三区| 精华霜和精华液先用哪个| 在线观看美女被高潮喷水网站 | 香蕉丝袜av| 精品一区二区三区四区五区乱码| 国产午夜精品论理片| 午夜影院日韩av| 成在线人永久免费视频| 久久久久国产一级毛片高清牌| 久久精品亚洲精品国产色婷小说| 一a级毛片在线观看| 91在线精品国自产拍蜜月 | 免费在线观看视频国产中文字幕亚洲| 人人妻人人澡欧美一区二区| 亚洲黑人精品在线| 亚洲欧洲精品一区二区精品久久久| h日本视频在线播放| 国产精品香港三级国产av潘金莲| 又大又爽又粗| 丁香六月欧美| 久久久久亚洲av毛片大全| 露出奶头的视频| 无人区码免费观看不卡| 熟妇人妻久久中文字幕3abv| 天天躁狠狠躁夜夜躁狠狠躁| 国产精品 国内视频| 日本三级黄在线观看| 国产乱人伦免费视频| 久久精品夜夜夜夜夜久久蜜豆| 最近最新免费中文字幕在线| 亚洲在线观看片| 身体一侧抽搐| 女生性感内裤真人,穿戴方法视频| 久99久视频精品免费| 国产精品野战在线观看| 久久国产乱子伦精品免费另类| 日本免费a在线| 欧美中文日本在线观看视频| 亚洲va日本ⅴa欧美va伊人久久| 少妇丰满av| 99久久无色码亚洲精品果冻| 日本一本二区三区精品| 亚洲av成人不卡在线观看播放网| 亚洲aⅴ乱码一区二区在线播放| 女人被狂操c到高潮| 欧美日韩瑟瑟在线播放| 天堂动漫精品| 老司机午夜十八禁免费视频| 亚洲va日本ⅴa欧美va伊人久久| av欧美777| 又大又爽又粗| 国产 一区 欧美 日韩| 老司机在亚洲福利影院| 免费看十八禁软件| 欧美又色又爽又黄视频| 91av网一区二区| 免费高清视频大片| 免费人成视频x8x8入口观看| 日本黄色片子视频| 国产精品电影一区二区三区| 在线十欧美十亚洲十日本专区| 999精品在线视频| 12—13女人毛片做爰片一| 美女免费视频网站| 精品国产美女av久久久久小说| 久久久久久大精品| 18美女黄网站色大片免费观看| 国产淫片久久久久久久久 | 国产免费男女视频| 成年女人看的毛片在线观看| 色在线成人网| 亚洲熟妇熟女久久| 天天躁日日操中文字幕| 给我免费播放毛片高清在线观看| 精品久久久久久成人av| 国产精品国产高清国产av| 日韩人妻高清精品专区| 我的老师免费观看完整版| 日本黄色片子视频| 欧美中文日本在线观看视频| 国产探花在线观看一区二区| 超碰成人久久| 999久久久精品免费观看国产| 久久久国产欧美日韩av| 亚洲18禁久久av| 日本精品一区二区三区蜜桃| 琪琪午夜伦伦电影理论片6080| 欧美zozozo另类| 18禁黄网站禁片午夜丰满| 伦理电影免费视频| 99国产精品一区二区三区| 12—13女人毛片做爰片一| 亚洲熟妇熟女久久| 色综合欧美亚洲国产小说| 在线观看66精品国产| 哪里可以看免费的av片| 色综合欧美亚洲国产小说| 一区二区三区激情视频| 一夜夜www| 国产av一区在线观看免费| 三级国产精品欧美在线观看 | 久久热在线av| 又粗又爽又猛毛片免费看| 国内毛片毛片毛片毛片毛片| 精品99又大又爽又粗少妇毛片 | 亚洲成人久久爱视频| 亚洲一区二区三区不卡视频| 亚洲av美国av| 99久久综合精品五月天人人| 一区二区三区高清视频在线| 欧美成人性av电影在线观看| 一级毛片女人18水好多| av中文乱码字幕在线| av视频在线观看入口| 真实男女啪啪啪动态图| 免费看a级黄色片| 老鸭窝网址在线观看| 国产又黄又爽又无遮挡在线| 国产高清视频在线播放一区| 国产精品 国内视频| 看免费av毛片| 亚洲美女视频黄频| 无人区码免费观看不卡| 亚洲人成网站在线播放欧美日韩| 国产精品av久久久久免费| 99热这里只有精品一区 | 一个人观看的视频www高清免费观看 | 日韩欧美 国产精品| 成人特级av手机在线观看| 国产黄色小视频在线观看| 亚洲精品一卡2卡三卡4卡5卡| 欧美日韩精品网址| 麻豆成人av在线观看| 九九久久精品国产亚洲av麻豆 | 日本免费a在线| 一进一出抽搐动态| 日韩欧美在线二视频| 亚洲va日本ⅴa欧美va伊人久久| 国产男靠女视频免费网站| 国产黄a三级三级三级人| 国产成人影院久久av| 亚洲av电影不卡..在线观看| 韩国av一区二区三区四区| 99久久久亚洲精品蜜臀av| 香蕉av资源在线| 免费人成视频x8x8入口观看| 精品午夜福利视频在线观看一区| 日韩欧美在线乱码| 好男人电影高清在线观看| 国产黄a三级三级三级人| 国产成人av教育| 久久久久国产精品人妻aⅴ院| 日本精品一区二区三区蜜桃| svipshipincom国产片| 日韩免费av在线播放| 免费人成视频x8x8入口观看| 日日摸夜夜添夜夜添小说| 国产三级在线视频| 午夜精品久久久久久毛片777| 一个人看视频在线观看www免费 | av女优亚洲男人天堂 | 午夜福利视频1000在线观看| 欧美日韩瑟瑟在线播放| 亚洲性夜色夜夜综合| 最新美女视频免费是黄的| 色在线成人网| 最近在线观看免费完整版| 又黄又爽又免费观看的视频| 国产精品av久久久久免费| 男女那种视频在线观看| 一a级毛片在线观看| 亚洲人与动物交配视频| 日本黄大片高清| 69av精品久久久久久| 成人精品一区二区免费| 亚洲精品色激情综合| 婷婷丁香在线五月| 午夜视频精品福利| 给我免费播放毛片高清在线观看| 免费看光身美女| 国产黄a三级三级三级人| 亚洲国产精品久久男人天堂| 亚洲自拍偷在线| 亚洲欧美日韩高清专用| 全区人妻精品视频| 99国产精品一区二区蜜桃av| 亚洲专区字幕在线| 欧美日韩中文字幕国产精品一区二区三区| 观看免费一级毛片| 国产免费av片在线观看野外av| 日本撒尿小便嘘嘘汇集6| 精品国产亚洲在线| a级毛片在线看网站| 搡老熟女国产l中国老女人| 天堂动漫精品| 久久热在线av| 色综合亚洲欧美另类图片| 欧美黄色淫秽网站| 欧美+亚洲+日韩+国产| 久久久久九九精品影院| 黄色日韩在线| 亚洲av熟女| 亚洲国产欧美网| 日本精品一区二区三区蜜桃| 久久午夜综合久久蜜桃| 国产免费av片在线观看野外av| 色视频www国产| 12—13女人毛片做爰片一| 亚洲七黄色美女视频| 亚洲国产精品久久男人天堂| 久久精品亚洲精品国产色婷小说| 男插女下体视频免费在线播放| 精品一区二区三区视频在线 | 国产亚洲精品久久久com| 国产久久久一区二区三区| 亚洲国产精品合色在线| 少妇人妻一区二区三区视频| 免费观看人在逋| 很黄的视频免费| 精品久久久久久久人妻蜜臀av| 国产av在哪里看| 性色av乱码一区二区三区2| 午夜福利成人在线免费观看| 18禁黄网站禁片午夜丰满| 一个人看视频在线观看www免费 | 欧美日韩中文字幕国产精品一区二区三区| 欧美中文日本在线观看视频| 亚洲色图av天堂| 亚洲熟妇中文字幕五十中出| 国产69精品久久久久777片 | 成年人黄色毛片网站| 欧美绝顶高潮抽搐喷水| 女同久久另类99精品国产91| 最新中文字幕久久久久 | 三级毛片av免费| 久久精品国产综合久久久| 美女免费视频网站| 禁无遮挡网站| 国产亚洲精品av在线| 在线永久观看黄色视频| 国产欧美日韩一区二区精品| 超碰成人久久| 99在线人妻在线中文字幕| 亚洲欧美精品综合久久99| 国产精品98久久久久久宅男小说| 欧美日韩中文字幕国产精品一区二区三区| 人妻久久中文字幕网| 伊人久久大香线蕉亚洲五| 久久久久久久精品吃奶| 国产精品亚洲av一区麻豆| 中文字幕av在线有码专区| 国产三级在线视频| 日韩欧美免费精品| 国产成人啪精品午夜网站| 婷婷精品国产亚洲av| 99在线人妻在线中文字幕| 热99re8久久精品国产| 老司机深夜福利视频在线观看| 草草在线视频免费看| 国产成人影院久久av| 波多野结衣巨乳人妻| 日韩成人在线观看一区二区三区| 岛国在线免费视频观看| 夜夜躁狠狠躁天天躁| 日韩人妻高清精品专区| 叶爱在线成人免费视频播放| 国产成人精品久久二区二区免费| a级毛片a级免费在线| 夜夜躁狠狠躁天天躁| 1024香蕉在线观看| 真实男女啪啪啪动态图| 88av欧美| 国产探花在线观看一区二区| 变态另类丝袜制服| 久久久精品大字幕| 国产精品免费一区二区三区在线| 欧美大码av| 久久亚洲精品不卡| 亚洲第一电影网av| 久久久成人免费电影| 色av中文字幕| 国内少妇人妻偷人精品xxx网站 | 色综合站精品国产| 久久久久九九精品影院| 免费一级毛片在线播放高清视频| 老汉色∧v一级毛片| 成人特级av手机在线观看| 色视频www国产| 色老头精品视频在线观看| 久久99热这里只有精品18| 亚洲国产色片| 久久国产精品影院| a级毛片a级免费在线| 欧美极品一区二区三区四区| 日韩免费av在线播放| 国产精品久久视频播放| 日日摸夜夜添夜夜添小说| 国产爱豆传媒在线观看| 琪琪午夜伦伦电影理论片6080| 欧美黄色淫秽网站| 亚洲精品一卡2卡三卡4卡5卡| 亚洲精品美女久久久久99蜜臀| 成人性生交大片免费视频hd| 波多野结衣巨乳人妻| 少妇丰满av| 国产亚洲av嫩草精品影院| 中文资源天堂在线| 亚洲美女视频黄频| 久久性视频一级片| 亚洲国产欧美网| av欧美777| 亚洲国产色片| 午夜日韩欧美国产| 天天添夜夜摸| 久久精品亚洲精品国产色婷小说| 国产高清有码在线观看视频| 欧美日韩精品网址| 十八禁人妻一区二区| 日本成人三级电影网站| 十八禁人妻一区二区| 国产精品久久久久久久电影 | 国产单亲对白刺激| 五月伊人婷婷丁香| 国产精品 欧美亚洲| 久久99热这里只有精品18| 黄色丝袜av网址大全| 91麻豆精品激情在线观看国产| 亚洲第一电影网av| 五月玫瑰六月丁香| 精品久久久久久久人妻蜜臀av| 成人特级av手机在线观看| 国产成人av激情在线播放| 久久精品夜夜夜夜夜久久蜜豆| 亚洲 国产 在线| 在线观看美女被高潮喷水网站 | 91在线观看av| 国产真人三级小视频在线观看| 久久久久国内视频| 91老司机精品| 欧美日本亚洲视频在线播放| 免费看十八禁软件| 久久精品国产综合久久久| 少妇丰满av| 亚洲人成伊人成综合网2020| 亚洲色图av天堂| 国产欧美日韩精品亚洲av| 国内久久婷婷六月综合欲色啪| 97碰自拍视频| 日韩高清综合在线| 不卡av一区二区三区| 波多野结衣高清作品| 成熟少妇高潮喷水视频| 18禁观看日本| 性色av乱码一区二区三区2| 成人一区二区视频在线观看| 老司机福利观看| 日本熟妇午夜| 日韩 欧美 亚洲 中文字幕| 国产成人aa在线观看| 欧美绝顶高潮抽搐喷水| 久久久久久国产a免费观看| 国产单亲对白刺激| 日韩欧美 国产精品| 91久久精品国产一区二区成人 | 99在线视频只有这里精品首页| 天堂av国产一区二区熟女人妻| 在线视频色国产色| bbb黄色大片| av天堂中文字幕网| 久久中文字幕一级| 国产精品女同一区二区软件 | 欧美又色又爽又黄视频| 成年人黄色毛片网站| 九色国产91popny在线| 国产精品久久电影中文字幕| 9191精品国产免费久久| 亚洲av美国av| 老司机午夜十八禁免费视频| 两个人的视频大全免费| 亚洲 欧美一区二区三区| 村上凉子中文字幕在线| 国产真实乱freesex| 在线a可以看的网站| 免费大片18禁| 中文字幕高清在线视频| 色综合亚洲欧美另类图片| 人妻久久中文字幕网| 欧美又色又爽又黄视频| 女警被强在线播放| 国产极品精品免费视频能看的| 啪啪无遮挡十八禁网站| 香蕉久久夜色| 美女大奶头视频| 俄罗斯特黄特色一大片| 香蕉av资源在线| 制服人妻中文乱码| 美女高潮喷水抽搐中文字幕| 中文在线观看免费www的网站| 精品国产美女av久久久久小说| 亚洲欧洲精品一区二区精品久久久| 色综合亚洲欧美另类图片| 亚洲av电影不卡..在线观看| 男人舔女人下体高潮全视频| 国产精品久久电影中文字幕| 久久99热这里只有精品18| 色尼玛亚洲综合影院| 亚洲国产看品久久| 一卡2卡三卡四卡精品乱码亚洲| 亚洲美女黄片视频| 首页视频小说图片口味搜索| 在线视频色国产色| 99久国产av精品| 日韩欧美精品v在线| 久久草成人影院| 国产真人三级小视频在线观看| 少妇的丰满在线观看| 五月伊人婷婷丁香| 欧美极品一区二区三区四区| 九九久久精品国产亚洲av麻豆 | 黑人操中国人逼视频| 久久久久久大精品| 色综合婷婷激情| 免费大片18禁| 国产亚洲精品一区二区www| 九九热线精品视视频播放| 夜夜躁狠狠躁天天躁| 色吧在线观看| 伦理电影免费视频| 国产精品久久久人人做人人爽| 日本三级黄在线观看| 午夜福利欧美成人| 性欧美人与动物交配| 日韩欧美精品v在线| 首页视频小说图片口味搜索| 人人妻人人澡欧美一区二区| 欧美色欧美亚洲另类二区| 此物有八面人人有两片| 在线免费观看不下载黄p国产 | 亚洲中文av在线| 小蜜桃在线观看免费完整版高清| 午夜福利免费观看在线| 成人欧美大片| 最近视频中文字幕2019在线8| 国产精品一区二区精品视频观看| av女优亚洲男人天堂 | 久久人妻av系列| 亚洲狠狠婷婷综合久久图片| 国产精品一区二区精品视频观看| 女警被强在线播放| 日本 av在线| 怎么达到女性高潮| 国产伦人伦偷精品视频| 全区人妻精品视频| 最新在线观看一区二区三区| 欧美黄色片欧美黄色片| 欧美乱色亚洲激情| 欧美成狂野欧美在线观看| 日韩欧美精品v在线| 久久人妻av系列| av在线天堂中文字幕| 九九在线视频观看精品| e午夜精品久久久久久久| 1024香蕉在线观看| 欧美日韩国产亚洲二区| 免费观看的影片在线观看| 国产野战对白在线观看| 日本一本二区三区精品| 性色av乱码一区二区三区2| 国产午夜福利久久久久久| 首页视频小说图片口味搜索| 深夜精品福利| 又黄又粗又硬又大视频| 精品欧美国产一区二区三| 亚洲自拍偷在线| 精品久久久久久久久久免费视频| 18禁美女被吸乳视频| 精品国产超薄肉色丝袜足j| 少妇的丰满在线观看| 波多野结衣高清作品| 亚洲欧美日韩东京热| tocl精华| 国产精品香港三级国产av潘金莲| 精品久久久久久久人妻蜜臀av| 色精品久久人妻99蜜桃| 婷婷精品国产亚洲av在线| 日本在线视频免费播放| 嫩草影院精品99| 亚洲中文字幕日韩| 女人被狂操c到高潮| 国产精品一区二区三区四区久久| 免费在线观看视频国产中文字幕亚洲| 最近在线观看免费完整版| 国产不卡一卡二| 真人做人爱边吃奶动态| 欧美黑人巨大hd| 午夜福利在线在线| 久久国产精品人妻蜜桃| 91av网站免费观看| 悠悠久久av| 日韩欧美在线二视频| 国产黄a三级三级三级人| 国产午夜精品论理片| 嫩草影院入口| 三级国产精品欧美在线观看 | 国产精品av久久久久免费| 老熟妇乱子伦视频在线观看| 国产成人精品无人区| 国产精品国产高清国产av| 嫩草影院入口| 每晚都被弄得嗷嗷叫到高潮| e午夜精品久久久久久久| 少妇丰满av| 国产又黄又爽又无遮挡在线| 国产精品av视频在线免费观看| 国产成人欧美在线观看| 18禁黄网站禁片免费观看直播| 亚洲第一欧美日韩一区二区三区| 亚洲成人中文字幕在线播放| 欧美中文综合在线视频| 国产不卡一卡二| 黄色丝袜av网址大全| 丰满的人妻完整版| 伦理电影免费视频| 午夜福利免费观看在线| 一个人看的www免费观看视频| 国产精品美女特级片免费视频播放器 | 国产乱人视频| www国产在线视频色| 国产伦精品一区二区三区视频9 | 性欧美人与动物交配| 亚洲片人在线观看| 99精品在免费线老司机午夜| 中文字幕熟女人妻在线| 亚洲自偷自拍图片 自拍| 亚洲精华国产精华精| 亚洲国产高清在线一区二区三| 国产亚洲欧美98| 黄片小视频在线播放| 日日夜夜操网爽| 欧美一区二区国产精品久久精品| 中文字幕高清在线视频| 一个人免费在线观看的高清视频| 麻豆一二三区av精品| 90打野战视频偷拍视频| 9191精品国产免费久久| 精品国产乱码久久久久久男人|