• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于反事實推理的事實驗證去偏方法

    2024-01-20 05:29:18陳建貴張儒清郭嘉豐范意興
    中文信息學報 2023年10期
    關(guān)鍵詞:效應(yīng)方法模型

    陳建貴,張儒清,郭嘉豐,范意興

    (1. 中國科學院 計算技術(shù)研究所 網(wǎng)絡(luò)數(shù)據(jù)科學與技術(shù)重點實驗室,北京 100190;2. 中國科學院大學,北京 100190)

    0 引言

    隨著互聯(lián)網(wǎng)的發(fā)展,虛假信息(如假新聞、政治欺騙和網(wǎng)上謠言等)不斷增加并能在短時間內(nèi)迅速傳播,這給公共安全帶來了極大的隱患。如何自動核查信息的完整性是當前社會迫切需要的一項技術(shù)。因此,最近的許多研究工作[1-6]都致力于事實驗證(Fact Verification,FV)任務(wù),其目標是使用來自可靠語料庫(如百度百科、維基百科等)的多個證據(jù)句子自動驗證文本聲明的真實性。

    為了促進研究,一些事實驗證數(shù)據(jù)集[7-9](如FEVER等)被提出。這些數(shù)據(jù)集通常采用眾包機制構(gòu)建,這種數(shù)據(jù)收集方法通常會引入特殊偏差,以意想不到的方式影響性能。例如,Schuster等人[8]發(fā)現(xiàn)聲明中的某些語言模式會對模型的預(yù)測造成影響,甚至只用聲明的分類器與證據(jù)感知的分類器的性能相當。如表1所示,該聲明為“北京冬季奧運會在2021年舉辦”,由于“北京”與“冬季奧運會”共現(xiàn)的頻率較高,模型在訓練時容易將其與“SUPPORT”標簽聯(lián)系。因此,在預(yù)測時,即使在提供證據(jù)的情況下模型也更容易將該聲明判斷成“SUPPORT”。這種聲明對結(jié)果的偏差會極大地影響模型的性能。

    表1 事實驗證數(shù)據(jù)中的偏差

    盡管現(xiàn)有的事實驗證方法取得了巨大的成功,但它們大多關(guān)注如何建模聲明和證據(jù)的交互信息,忽略聲明對結(jié)果帶來的偏差影響[5,7,10-13]。例如,Zhou等人[10]設(shè)計圖模型來增強聲明和證據(jù)之間的交互信息;Liu等人[5]更進一步使用kernel信息來挖掘聲明和證據(jù)之間的內(nèi)在關(guān)聯(lián)。這些工作都在回答一個問題,“如果模型得到聲明和驗證以及它們的交互信息,那么模型的輸出是什么?”沒有關(guān)注如何消除聲明偏差。為了解決這個問題,一些事實驗證去偏工作被提出[14-17],大致可分為基于數(shù)據(jù)增強的方法和基于權(quán)重正則化的方法。其中,基于數(shù)據(jù)增強的方法極大依賴于額外生成的訓練數(shù)據(jù)來去偏[14-16],然而獲得高質(zhì)量的數(shù)據(jù)代價較大,導(dǎo)致此類方法不靈活,泛化性較差;基于權(quán)重正則化的方法的主要思想是將有偏數(shù)據(jù)對損失函數(shù)的影響權(quán)重降低,該類方法需要構(gòu)建有偏模型和無偏模型。然而,訓練時無偏模型的輸出不準確且不穩(wěn)定,可能會錯誤地導(dǎo)致對無偏樣本的權(quán)重降低。

    最近,反事實推理在許多任務(wù)上得到了廣泛應(yīng)用[18-20]。這些工作結(jié)合因果推理技術(shù),以獲得更無偏的模型。例如,Qiu等人[20]運用反事實推理解決推薦系統(tǒng)中的曝光偏差。具體的,該工作采用因果圖來描述推薦過程中的重要因果關(guān)系,并基于因果圖設(shè)計訓練框架;Niu等人[18]基于因果效應(yīng)提出反事實推理框架,該框架能將語言偏差捕獲為問題對答案的直接因果效應(yīng),并通過從總因果效應(yīng)中減去直接語言效應(yīng)來減少語言偏差。

    受反事實推理和因果效應(yīng)的啟發(fā),本文提出一種新的基于反事實推理的事實驗證去偏框架。與以往工作不同的是,本文考慮的問題是關(guān)于事實驗證的反事實問題,即“如果只獲得聲明的信息,卻無法得到證據(jù)以及聲明和證據(jù)的交互信息,那么模型的輸出是什么?”。根據(jù)反事實推理理論,聲明對結(jié)果的影響可以通過想象場景來估計,在這個場景中,證據(jù)和交互信息被丟棄,模型只能得到聲明信息。

    基于上述理論,本文首先設(shè)計了事實驗證中的因果圖,建模聲明、證據(jù)以及它們之間的交互和預(yù)測結(jié)果的因果關(guān)系。接著,我們根據(jù)因果圖設(shè)計事實驗證去偏方法,通過總間接效應(yīng)去除聲明帶來的偏差影響。我們使用多任務(wù)學習的方式來訓練模型。在FEVER數(shù)據(jù)集的有偏和無偏測試集上的實驗結(jié)果表明,本文方法能夠超過基準方法,去除聲明對結(jié)果的負面影響,有效提高聲明驗證的質(zhì)量。

    本文的主要貢獻如下:

    (1) 從因果視角解釋事實驗證聲明偏差,并提出對應(yīng)的因果圖;

    (2) 提出基于反事實推理的事實驗證去偏框架,該框架可以根據(jù)因果圖訓練事實驗證模型,以消除聲明對證據(jù)的偏差影響;

    (3) 本文進行了詳盡的實驗和分析,證明所提方法的有效性和合理性。

    1 相關(guān)工作

    本節(jié)將簡要回顧兩個方面工作,即事實驗證和去偏方法。

    1.1 事實驗證

    事實驗證要求在證據(jù)的上下文評估聲明的有效性,判斷的結(jié)果可以是支持(Support)、反駁(Refutes)或信息不足(Not Enough Info)[7,21-23]。目前主流的事實驗證框架是一個三步流水線系統(tǒng),即文檔檢索、句子檢索和聲明驗證[3,5,7,10]。對于文檔檢索,現(xiàn)有的方法一般可以分為三類,即基于mention的方法[2,3,5,12,24]、基于關(guān)鍵詞的方法[13,21-22]和基于特征的方法[4,11,25]。對于句子檢索,通常有三種方法,包括傳統(tǒng)的概率排序模型[2,6,26]、神經(jīng)排序模型[3,11,25]和預(yù)訓練模型[5,24]。對于聲明驗證,早期工作[7,27]將事實驗證視為自然語言推理任務(wù),并直接應(yīng)用其方法設(shè)計事實驗證模型。為了獲得聲明和證據(jù)之間更細粒度的語義一致性,后續(xù)工作又提出了一系列方法,通過將聲明和證據(jù)表述為圖結(jié)構(gòu)數(shù)據(jù)來促進聲明-證據(jù)的交互[10]。此外,受預(yù)訓練語言模型[28]強大表示能力的啟發(fā),一些工作[29-30]嘗試在事實檢查數(shù)據(jù)集上微調(diào)預(yù)訓練語言模型,并取得有競爭力的結(jié)果。最近,研究人員更加關(guān)注可解釋的事實驗證[31],這需要一個模型來產(chǎn)生準確性預(yù)測及其相應(yīng)解釋。

    然而,已有方法僅關(guān)注如果更好建模聲明和證據(jù)之間的交互信息,無法去除數(shù)據(jù)集中的偏差,缺乏穩(wěn)健性。為此,本文圍繞去偏事實驗證模型開展研究,不同于之前的工作,本文關(guān)注聲明對結(jié)果的偏差影響?;诜词聦嵧评?本文方法能有效消除聲明的偏差,在性能上得到提升。

    1.2 去偏方法

    為了增強事實驗證模型的魯棒性,一些無偏和對抗數(shù)據(jù)集被提出來評估模型的推理能力[8,32]?,F(xiàn)有的去偏方法可以分為兩類,基于數(shù)據(jù)增強的方法和基于權(quán)重正則化的方法。

    基于數(shù)據(jù)增強的去偏方法的主要思想是在訓練數(shù)據(jù)中增加足夠數(shù)量的無偏樣本,以降低有偏樣本的比例,從而產(chǎn)生更無偏的模型[8,14-15,17,33-35]。其中,無偏樣本可以通過對原始數(shù)據(jù)進行變換操作和釋義生成得到。例如,Wei和Zou[14]使用同義詞替換、隨機插入、隨機交換和隨機刪除等四種操作來獲取新的訓練數(shù)據(jù)。Lee等人[15]提出CrossAug模型,利用交叉對比策略以增加數(shù)據(jù),具體地,該工作使用生成模型BART[16]將原始聲明修改為負面聲明,并通過片段替換來改變證據(jù),以支持此類負面聲明?;跈?quán)重正則化的去偏方法期望通過減少有偏樣本對最終損失計算的貢獻,讓模型更關(guān)注無偏數(shù)據(jù)。例如,Schuster等人[8]提出Re-weighting策略,用局部互信息獲得與特定標簽高度相關(guān)的詞組信息,并將包含該詞組的聲明權(quán)重調(diào)低,迫使模型將重點放在困難例子上。Mahabadi等人[17]采用有偏模型來捕捉聲明中的偏差,并假設(shè)產(chǎn)出標簽分布的不均勻性與偏差實例的置信度正相關(guān)。Xiong等人[33]提出兩種校準器(Temperature變化和Dirichlet校準器)來調(diào)整有偏模型的預(yù)測類分布。

    最近,其他領(lǐng)域(包括推薦系統(tǒng)、計算機視覺等)涌現(xiàn)出了一批新的工作,即利用因果推理技術(shù)獲得更無偏的模型[18-20,35-37]。例如,Qiu等人[20]運用反事實推理解決推薦系統(tǒng)中普遍存在的曝光偏差。Niu等人[18]在視覺問答任務(wù)上提出反事實推理框架,通過從總因果效應(yīng)中減去直接語言效應(yīng)有效減少語言偏差所帶來的影響。受這些工作啟發(fā),我們基于反事實推理構(gòu)建了新的事實驗證去偏方法,增強模型的去偏能力。

    2 背景知識

    本節(jié)首先介紹關(guān)于反事實推理的概念。下文將隨機變量表示為大寫字母(如X),并將其觀察值表示為小寫字母(如x)。

    2.1 因果圖

    因果圖反映變量之間的因果關(guān)系,用有向無環(huán)圖G={V,E}表示,其中,V表示變量集,E表示因果關(guān)系。圖1顯示了由三個變量組成的因果圖示例。如果變量X對變量Y有直接影響,我們說Y是X的子元素,即X→Y。如果X通過變量M間接影響Y,我們說M在X和Y之間起中介作用,即X→M→Y。

    圖1 因果圖及反事實符號

    2.2 反事實符號

    反事實符號用于將因果假設(shè)從圖表轉(zhuǎn)換為公式。如果X取值為x,M取值為m,則Y的取值表示如式(1) 所示。

    Yx,m=Y(X=x,M=m)

    (1)

    在實際情況中,有m=Mx=M(X=x)。在反事實場景中,對于M和Y,X可以取不同值。例如,Yx,Mx*表示為X取值為x,而M的取值僅當X取值為x*的時候,也就是,Yx,Mx*=Y(X=x,M=M(X=x*))。注意,這里X只能在反事實場景中同時設(shè)置為不同的值x和x*。

    2.3 因果效應(yīng)

    因果效應(yīng)反映了同一個變量在兩種不同干預(yù)下的兩種潛在結(jié)果之間的比較。 假設(shè)X=x表示“干預(yù)條件下”,X=x*表示“未干預(yù)條件下” 。 干預(yù)X=x對Y的總效應(yīng) (Total Effect, TE)比較了兩種假設(shè)情況X=x和X=x*,表示如式(2)所示。

    TE=Yx,Mx-Yx*,Mx*

    (2)

    總效應(yīng)可分解為自然直接效應(yīng)(Natural Direct Effect, NDE)和總間接效應(yīng)(Total Indirect Effect, TIE)。NDE表示當中介M被阻斷時,X對Y的影響。具體的,NDE表示當X從x變化到x*,M設(shè)置在X=x*時獲得的值時,Y的增加量如式(3)所示。

    NDE=Yx,Mx*-Yx*,Mx*

    (3)

    TIE是TE和NDE之間的差值如式(4)所示。

    TIE=TE-NDE=Yx,Mx-Yx,Mx*

    (4)

    TE還可以分解為自然間接效應(yīng)(Natural Indirect Effect, NIE)和總直接效應(yīng)(Total Direct Effect, TDE)。 類似地,NIE通過中介M反映X對Y的影響,即X→M→Y,而通過將X設(shè)置為x*來阻止對X→Y的直接影響。NIE表示如式(5)所示。

    NIE=Yx*,Mx-Yx*,Mx*

    (5)

    3 事實驗證去偏方法

    本節(jié)介紹事實驗證去偏方法,其中包括因果效應(yīng)、模型實現(xiàn)、模型訓練和反事實推斷。

    3.1 因果效應(yīng)

    針對事實驗證的因果圖如圖2(a)所示。該因果圖有四個變量,分別是聲明(C)、證據(jù)(E)、聲明與證據(jù)的交互信息(K),以及驗證的結(jié)果(Y)。其中,C→Y和E→Y捕獲到聲明和證據(jù)對結(jié)果的直接影響,C,E→K→Y則捕獲到聲明和證據(jù)通過交互信息對結(jié)果的間接影響。在本文中,我們希望消除C→Y的直接影響,從而去除聲明對結(jié)果帶來的偏差。

    圖2 針對事實驗證的因果圖

    假設(shè)當C取值為c,E取值為e時,Y為y,即:

    Yc,e(y)=Y(y;C=c,E=e)

    (6)

    不失一般性,為了簡潔,我們將y省去,即Yc,e=Y(C=c,E=e)。相似的,K的反事實符號為Kc,e=K(C=c,E=e)。

    如圖2所示,存在三條路徑到Y(jié),分別為C→Y,E→Y,K→Y。因此Yc,e可以表示如式(7)所示。

    Yc,e=Zc,e,k=Z(C=c,E=e,K=k)

    (7)

    其中,k=Kc,e。根據(jù)2.3節(jié)的因果效應(yīng),我們可以得到當C取值為c,E取值為e時,對于結(jié)果y的總效應(yīng)如式(8)所示。

    TE=Yc,e-Yc*,e*=Zc,e,k-Zc*,e*,k*

    (8)

    其中,c*和e*表示為未干預(yù)情況下C和E的取值,k*=Kc*,e*。

    為了消除聲明對結(jié)果的直接影響,我們需要先得到聲明對結(jié)果的作用。這里,我們通過阻斷E和K對結(jié)果的影響來估計C→Y的作用,自然直接效應(yīng)可表示如式(9)所示。

    NDE=Zc,e*,k*-Zc*,e*,k*

    (9)

    因為C在K上的影響被阻隔,所以NDE能夠捕獲到聲明C對結(jié)果Y的影響。如圖2(b)所示,去偏的模型可以表示為總間接效應(yīng):

    TIE=TE-NDE=Zc,e,k-Zc,e*,k*

    (10)

    3.2 模型實現(xiàn)

    基于3.1節(jié)中的討論,我們提出了基于反事實推斷的事實驗證去偏模型CFFV,模型的整體架構(gòu)如圖3所示。

    圖3 CFFV模型整體架構(gòu)圖

    該模型主要包含三個部分,分別是聲明模型FC、證據(jù)模型FE以及交互模型FEC,模型的輸出分別為Zc=FC(c)、Ze=FE(e)、Zk=FEC(c,e)。

    未干預(yù)條件定義為將聲明或證據(jù)的信號進行阻隔,即聲明或證據(jù)未給定。因此,我們設(shè)定未干預(yù)條件為C=c*=φ和E=e*=φ。由于模型無法處理空輸入,將每個類別賦予相同的概率作為模型當前的輸出。

    受Niu等人[18]啟發(fā),我們設(shè)計了兩種非線性分數(shù)融合操作,也就是Harmonic和SUM。Harmonic操作表示如式(11)所示。

    (11)

    其中,ZHM=σ(Zc)*σ(Ze)(σ(Zk)。SUM操作則是將三部分的分數(shù)相加起來得到最終的融合分數(shù),即:

    Zc,e,k=h(zc,ze,zk)=logσ(ZSUM)

    (12)

    其中,ZSUM=Zc+Ze+Zk。

    3.3 模型訓練

    給定一個訓練對(c,e,y),其中y是標簽,c和e是聲明-證據(jù)對。對于每個部分,我們使用交叉熵來計算損失。例如,聲明模型的損失函數(shù)如式(13)所示。

    (13)

    其他部分的損失函數(shù)與上述公式一致。本文中,我們使用多任務(wù)學習方式得到最終的損失函數(shù),如式(14)所示。

    L=LC(c,y)+LE(e,y)+LC,E(c,e,y)

    (14)

    3.4 反事實推斷

    如3.1節(jié)所述,在訓練完模型后,我們使用去偏的因果效應(yīng)進行推斷,如式(15)所示。

    (15)

    通過總間接效應(yīng)公式,利用總效應(yīng)減去代表聲明對結(jié)果影響的自然直接效應(yīng),我們就能將聲明對結(jié)果的偏差有效去除,得到一個無偏的預(yù)測結(jié)果。

    4 實驗和分析

    本節(jié)介紹實驗和分析。我們進行了一系列實驗來驗證本文方法的有效性。

    4.1 數(shù)據(jù)集

    本文在事實驗證基準數(shù)據(jù)集FEVER[7]上進行實驗。具體地,該數(shù)據(jù)集由185 455個標注的聲明和5 416 537個維基百科文檔組成。標注者將所有聲明歸類為支持(SUPPORT)、反駁(REFUTES)或信息不足(NOT ENOUGH INFO)。對于前兩類,系統(tǒng)和標注者還需要返回構(gòu)成支持或反駁該聲明的必要證據(jù)的句子組合。這些聲明是由標注者從維基百科中提取并以各種方式對其進行變異而產(chǎn)生的。每個聲明要求的驗證都是由標注者在單獨的標注過程中進行的,標注者知道該文檔,但不知道原始聲明要求的句子。因此,有31.75%的聲明需要一句以上的句子當作證據(jù)。在16.82%的數(shù)據(jù)中,聲明要求從多個句子中組合證據(jù)。此外,在12.15%的聲明中,證據(jù)取自多個維基百科文檔。該數(shù)據(jù)集的基本信息如表2所示。

    表2 數(shù)據(jù)集基本信息統(tǒng)計

    除此之外,我們還使用Schuster等人基于FEVER構(gòu)造的無偏數(shù)據(jù)集Fever-Symmetric[8]作為額外的測試集(1)包含兩個版本,記作Symm.V1和Symm.V2。

    4.2 實驗設(shè)置

    本文實驗主要基于PyTorch框架編寫代碼,并在Tesla 32GB V100 GPU上訓練。為了公平比較[14-17,33],我們使用BERT模型的Base版本作為主干模型進行實驗。我們在BERT模型的[CLS]上加了一層前向反饋層進行預(yù)測。在進行參數(shù)調(diào)整優(yōu)化后,我們將訓練輪數(shù)設(shè)置為5輪,優(yōu)化器為Adam[36],使用具有線性Warmup的指數(shù)衰減學習率,學習率為2e-5,梯度剪裁的閾值設(shè)置為5,我們將實驗數(shù)據(jù)分為32個一組的小批量進行訓練,限制最長的輸入為128。

    4.3 評價指標

    我們采用準確率(Accuracy)來評估各方法的性能效果,計算方法如式(16)所示。

    (16)

    其中,TP是預(yù)測為該類別且真實為該類別的樣本數(shù)目,TN是預(yù)測為不是該類別且真實不是該類別的樣本數(shù)目,FP是預(yù)測為該類別且真實不是該類別的樣本數(shù)目,FN是預(yù)測為不是該類別且真實為該類別的樣本數(shù)目。

    4.4 對比模型

    本文對比模型主要有兩類基準方法,包括基于數(shù)據(jù)增強的方法以及基于權(quán)重正則化的方法。

    4.4.1 基于數(shù)據(jù)增強的方法

    首先和基于數(shù)據(jù)增強的方法進行比較,這類方法主要包括:

    (1)EDA[14]該方法由四個操作組成: 同義詞替換、隨機插入、隨機交換和隨機刪除,通過對原始數(shù)據(jù)進行四種操作來增加新的訓練數(shù)據(jù)。

    (2)Paraphrasing[14]使用GPT-2[37]模型對回譯數(shù)據(jù)進行微調(diào),以釋義原始文本。對于每個原始聲明-證據(jù)對,通過使用該方法轉(zhuǎn)換聲明來創(chuàng)建一個保持相同關(guān)系的新樣本對,從而使擴增數(shù)據(jù)與原始數(shù)據(jù)的擴增比為1∶1。

    (3)CrossAug[15]該方法設(shè)計了兩階段的增強形式,從現(xiàn)有樣本中生成新的聲明和證據(jù)。然后,將生成的樣本與原始樣本交叉配對,形成對比樣本,以幫助模型減少對偏差模式的依賴,并學習更穩(wěn)健的表示。

    4.4.2 基于權(quán)重正則化的方法

    我們還考慮了基于權(quán)重正則化的方法模型。這些方法包括:

    (1)Re-weighting[8]是一種樣本權(quán)重加權(quán)方法,該方法針對的是來自單詞的偏差。通過重新權(quán)衡包含這些詞的聲明的重要性,迫使模型將重點放在依賴偏差導(dǎo)致錯誤預(yù)測的困難例子上。

    (2)PoE[17]計算基本模型和有偏模型的集合中的訓練損失。與Re-weighting類似,它根據(jù)對每個樣本的有偏模型的預(yù)測來控制基礎(chǔ)模型的損失。

    (3)MoCaD[33]提出一種校準方法來調(diào)整有偏模型中不準確的預(yù)測類分布。具體而言,本文工作使用了兩種校準器(即Temperature變化和Dirichlet校準器)。我們利用這些方法進一步優(yōu)化模型PoE,形成兩個變體,即PoETempS和PoEDirichlet。

    4.5 實驗結(jié)果分析

    我們的模型和對比模型的性能比較結(jié)果如表3所示。

    表3 CFFV模型和對比模型的Accuracy性能對比 (單位: %)

    從表中可以觀察到:

    (1) 有偏模型BERT在Dev上性能表現(xiàn)較好,但是在無偏測試集上性能下降得非常厲害。這可能是因為這些有偏模型在訓練的過程中學習到數(shù)據(jù)集本身的偏差,因此無法很好地泛化到無偏測試集上。

    (2) 已有去偏方法不僅能在有偏數(shù)據(jù)集Dev上達到和基礎(chǔ)模型相當?shù)男阅?還能在無偏數(shù)據(jù)集上有較大性能提升。這說明精心設(shè)計的去偏方法可以一定程度上去除模型的偏差。

    (3) 整體上,基于權(quán)重正則化的方法優(yōu)于基于數(shù)據(jù)增強的方法。一方面,EDA和Paraphrasing在對稱數(shù)據(jù)集上的性能改進微不足道。這些結(jié)果表明,簡單地使用更多數(shù)據(jù)進行訓練并不一定有助于緩解數(shù)據(jù)中的偏差。另一方面,基于權(quán)重正則化的方法通過改變樣本的權(quán)重能顯著增加模型對無偏樣本的學習能力。值得注意的是,基于數(shù)據(jù)增強的方法CrossAug表現(xiàn)非常亮眼,是現(xiàn)有去偏方法中性能最好的。CrossAug的增強方法生成的對比樣本通過學習更穩(wěn)健的特征表示,增強了事實推理能力,展現(xiàn)出良好的泛化性。

    (4) 我們的CFFV模型在各個測試集上都比其他模型表現(xiàn)更好。例如,在有偏數(shù)據(jù)集Dev上,本文模型進一步提高了性能,而其他的去偏方法都有不同程度的下降。這可能是因為我們在訓練階段能有效地將有偏預(yù)測和無偏預(yù)測分隔開,更好地消除偏差帶來的影響。同時,在兩個無偏數(shù)據(jù)集Symm.V1和Symm.V2上也達到了最高的性能,對比CrossAug分別提升了2.28%和3.06%。這說明從因果效應(yīng)的角度看待事實驗證偏差問題是可行的,通過構(gòu)建因果圖,利用反事實推理來消除聲明帶來的偏差,可以有效提升事實驗證的性能。

    4.6 消融實驗

    為了更好地分析模型中不同分數(shù)融合操作對最后性能的影響,我們首先構(gòu)建了模型的兩個變體,然后在基準數(shù)據(jù)集上對它們進行評估。構(gòu)造的變體如下:

    (1)CFFV(HM): 使用Harmonic操作來融合分數(shù);

    (2)CFFV(SUM): 使用Sum操作來融合分數(shù)。

    性能結(jié)果如表3所示。從表中可以看出Sum操作的性能比Harmonic操作更好,這可能是因為各個部分的分數(shù)都對最后的結(jié)果有類似的影響,Sum操作由于平等對待各部分的影響,可以強化這一特性。

    4.7 樣例分析

    為了進一步探究各個方法對實例的影響,我們從無偏數(shù)據(jù)集Symm.1中選取了一個代表性示例,并將我們的方法與基線模型CrossAug和PoE進行比較。

    如表4所示,對于表中的示例,兩個經(jīng)典去偏模型CrossAug和PoE都預(yù)測錯誤,只有我們的模型CFFV能成功地預(yù)測出正確類別。該示例中的偏差主要是由單詞“was”引起的,它與標簽“SUPPORTS”

    表4 樣例分析

    高度相關(guān),因此有偏模型很容易將該聲明預(yù)測成“SUPPORTS”。一方面,基于數(shù)據(jù)增強的方法CrossAug簡單對原始聲明進行詞變換,例如,將“was”轉(zhuǎn)換為“is”。這種方式無法捕獲到聲明和證據(jù)之間的真實關(guān)聯(lián)信息,很難起到有效去偏作用。另一方面,基于權(quán)重正則化的方法PoE,因為在訓練目標中僅根據(jù)聲明模型會導(dǎo)致性能下降的偏差程度將聲明對損失影響的權(quán)重值降低,因而預(yù)測錯誤。本文方法則直接捕獲了聲明-證據(jù)交互信息和聲明偏差。因此,CFFV模型中的有偏預(yù)測分布得到了糾正,讓錯誤預(yù)測概率進一步降低。

    5 總結(jié)

    本文提出了一種基于反事實推理的去偏事實驗證方法。具體的,我們首先針對事實驗證任務(wù)設(shè)計了因果效應(yīng)圖,從因果關(guān)系出發(fā)設(shè)計事實驗證中的因果圖,從而消除聲明對結(jié)果的偏差。訓練時,我們采用多任務(wù)學習的方式建模各個因素的影響,分別在有偏和無偏基準測試集上進行評估性能。實驗結(jié)果表明,本文模型對比基準方法在性能上取得一致的提升,驗證了本文模型的有效性。

    未來的工作可以進一步探索將反事實推理運用到其他自然語言理解任務(wù)上,例如,問答系統(tǒng)、對話任務(wù)等。此外,如何進一步運用因果相關(guān)理論去偏也是一個極大的挑戰(zhàn)。

    猜你喜歡
    效應(yīng)方法模型
    一半模型
    鈾對大型溞的急性毒性效應(yīng)
    懶馬效應(yīng)
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    應(yīng)變效應(yīng)及其應(yīng)用
    可能是方法不對
    3D打印中的模型分割與打包
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    如何舔出高潮| 久久精品夜色国产| 久久久久人妻精品一区果冻| 亚洲精品乱久久久久久| 一本色道久久久久久精品综合| 亚洲精品日韩在线中文字幕| 精品国产露脸久久av麻豆| 国产成人精品福利久久| 日韩欧美一区视频在线观看| 国产精品国产三级国产专区5o| 免费不卡的大黄色大毛片视频在线观看| 汤姆久久久久久久影院中文字幕| 你懂的网址亚洲精品在线观看| 国产一区二区三区综合在线观看 | 一本久久精品| 国产综合精华液| 精品少妇久久久久久888优播| 嫩草影院入口| 2021少妇久久久久久久久久久| 亚洲婷婷狠狠爱综合网| 久久韩国三级中文字幕| 婷婷色综合www| 亚洲欧美中文字幕日韩二区| 中文字幕av电影在线播放| 亚洲伊人久久精品综合| 人体艺术视频欧美日本| 国产一区有黄有色的免费视频| 亚洲色图综合在线观看| 99热网站在线观看| 日本免费在线观看一区| 少妇被粗大的猛进出69影院 | 色婷婷av一区二区三区视频| 狠狠婷婷综合久久久久久88av| 亚洲少妇的诱惑av| 女性被躁到高潮视频| 国产视频内射| 久久精品国产亚洲网站| 久久综合国产亚洲精品| av免费在线看不卡| 日韩av不卡免费在线播放| 久久人妻熟女aⅴ| 欧美老熟妇乱子伦牲交| 亚洲精品一区蜜桃| 久久精品夜色国产| 大香蕉97超碰在线| 青春草亚洲视频在线观看| www.色视频.com| 男女啪啪激烈高潮av片| 免费av不卡在线播放| 自线自在国产av| 欧美少妇被猛烈插入视频| 亚洲av二区三区四区| av专区在线播放| 飞空精品影院首页| 在现免费观看毛片| 久久久久久久精品精品| 一本色道久久久久久精品综合| 大话2 男鬼变身卡| 国产在线视频一区二区| 男人添女人高潮全过程视频| 婷婷色av中文字幕| 春色校园在线视频观看| 国国产精品蜜臀av免费| 亚洲美女视频黄频| 伊人亚洲综合成人网| 九草在线视频观看| 国产又色又爽无遮挡免| 99久久人妻综合| 国产69精品久久久久777片| 精品一区二区三区视频在线| 精品国产国语对白av| 久久影院123| 97超视频在线观看视频| 看非洲黑人一级黄片| 男女啪啪激烈高潮av片| 大话2 男鬼变身卡| 波野结衣二区三区在线| 尾随美女入室| 亚洲av成人精品一区久久| 久热久热在线精品观看| 少妇人妻精品综合一区二区| 婷婷色综合www| 高清不卡的av网站| av天堂久久9| 一级片'在线观看视频| 美女主播在线视频| 黄片播放在线免费| 99久久中文字幕三级久久日本| 一级,二级,三级黄色视频| 肉色欧美久久久久久久蜜桃| 久久久久国产网址| 欧美激情 高清一区二区三区| 国产视频内射| a 毛片基地| 曰老女人黄片| av在线播放精品| 国产精品一区二区在线不卡| 国产精品人妻久久久影院| 婷婷色综合大香蕉| 亚洲精品日韩在线中文字幕| 天堂中文最新版在线下载| 欧美激情极品国产一区二区三区 | 欧美日韩亚洲高清精品| 秋霞在线观看毛片| 国产老妇伦熟女老妇高清| 2021少妇久久久久久久久久久| 国产精品欧美亚洲77777| 日韩大片免费观看网站| 精品国产乱码久久久久久小说| 亚洲精品日韩在线中文字幕| 国产精品久久久久久久电影| 国产在线免费精品| 日韩成人伦理影院| 国产色婷婷99| 午夜福利视频在线观看免费| 国产69精品久久久久777片| 水蜜桃什么品种好| 国产免费一区二区三区四区乱码| 一级二级三级毛片免费看| 一边亲一边摸免费视频| 菩萨蛮人人尽说江南好唐韦庄| 亚洲精品久久久久久婷婷小说| 老司机影院毛片| 全区人妻精品视频| 全区人妻精品视频| 欧美+日韩+精品| 成人综合一区亚洲| 黑人巨大精品欧美一区二区蜜桃 | 国精品久久久久久国模美| 亚洲av电影在线观看一区二区三区| 最近最新中文字幕免费大全7| 18在线观看网站| 纵有疾风起免费观看全集完整版| 蜜桃在线观看..| 另类精品久久| 国产成人a∨麻豆精品| 国产黄片视频在线免费观看| 成人漫画全彩无遮挡| 一级毛片电影观看| 日日撸夜夜添| www.色视频.com| 久久久久久伊人网av| 成人国产麻豆网| 日本午夜av视频| 街头女战士在线观看网站| 国产极品天堂在线| 91久久精品电影网| 大话2 男鬼变身卡| 免费观看av网站的网址| 成人亚洲欧美一区二区av| 国产精品久久久久久久电影| 色网站视频免费| 岛国毛片在线播放| 岛国毛片在线播放| 黄色一级大片看看| 一个人看视频在线观看www免费| 久久久a久久爽久久v久久| 午夜福利视频在线观看免费| 精品人妻一区二区三区麻豆| 国产高清三级在线| 精品99又大又爽又粗少妇毛片| 97精品久久久久久久久久精品| 欧美 亚洲 国产 日韩一| 色婷婷久久久亚洲欧美| 熟女人妻精品中文字幕| 99久久精品国产国产毛片| 国产免费一区二区三区四区乱码| 天堂8中文在线网| 久久久久久久精品精品| 啦啦啦中文免费视频观看日本| 久久ye,这里只有精品| 欧美国产精品一级二级三级| 午夜久久久在线观看| 国产亚洲欧美精品永久| 97在线视频观看| 有码 亚洲区| 高清av免费在线| 久久久久久久久久久免费av| 亚洲性久久影院| 亚洲在久久综合| 在线精品无人区一区二区三| 国产成人freesex在线| 亚洲精品美女久久av网站| 波野结衣二区三区在线| 久久国产精品大桥未久av| 久久久久久久久久人人人人人人| 久久鲁丝午夜福利片| 性高湖久久久久久久久免费观看| 亚洲国产日韩一区二区| 日本黄色日本黄色录像| 久久久国产精品麻豆| 精品国产露脸久久av麻豆| 你懂的网址亚洲精品在线观看| 亚洲欧美一区二区三区黑人 | 18禁在线无遮挡免费观看视频| videossex国产| 人妻人人澡人人爽人人| 51国产日韩欧美| 性色av一级| 亚洲人成网站在线播| 十八禁高潮呻吟视频| 伊人久久国产一区二区| 黄色欧美视频在线观看| a级片在线免费高清观看视频| 国产在线免费精品| 男女免费视频国产| 亚洲精品自拍成人| 国产一区二区三区av在线| 在线观看免费日韩欧美大片 | av不卡在线播放| 国产老妇伦熟女老妇高清| 建设人人有责人人尽责人人享有的| 欧美成人精品欧美一级黄| 久久精品国产鲁丝片午夜精品| 欧美成人午夜免费资源| 男女无遮挡免费网站观看| 伦精品一区二区三区| 伦理电影大哥的女人| 欧美日韩一区二区视频在线观看视频在线| 欧美日韩综合久久久久久| 最黄视频免费看| 黑人猛操日本美女一级片| 国产免费视频播放在线视频| 婷婷色综合www| 在线亚洲精品国产二区图片欧美 | 2022亚洲国产成人精品| 国产极品粉嫩免费观看在线 | 91精品伊人久久大香线蕉| 春色校园在线视频观看| 麻豆乱淫一区二区| 狠狠精品人妻久久久久久综合| 欧美丝袜亚洲另类| 高清毛片免费看| 日韩电影二区| 91精品三级在线观看| 五月开心婷婷网| 久久国产精品大桥未久av| 亚洲国产精品999| 欧美激情国产日韩精品一区| 一个人免费看片子| 久久久欧美国产精品| www.av在线官网国产| 亚洲av日韩在线播放| 在线观看免费日韩欧美大片 | 夜夜骑夜夜射夜夜干| 黄色视频在线播放观看不卡| 香蕉精品网在线| 少妇精品久久久久久久| 欧美变态另类bdsm刘玥| 欧美激情极品国产一区二区三区 | 男女无遮挡免费网站观看| a级片在线免费高清观看视频| 80岁老熟妇乱子伦牲交| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 国产探花极品一区二区| 肉色欧美久久久久久久蜜桃| 超色免费av| 18禁裸乳无遮挡动漫免费视频| 最近最新中文字幕免费大全7| 国产精品成人在线| 亚洲一级一片aⅴ在线观看| 男女高潮啪啪啪动态图| xxxhd国产人妻xxx| 国产免费一区二区三区四区乱码| 亚洲国产最新在线播放| 女性被躁到高潮视频| 国产乱来视频区| av在线app专区| 国产精品不卡视频一区二区| 亚洲久久久国产精品| 久久国产精品大桥未久av| 母亲3免费完整高清在线观看 | www.色视频.com| 日本猛色少妇xxxxx猛交久久| 国产色爽女视频免费观看| 亚洲欧美色中文字幕在线| 欧美变态另类bdsm刘玥| 国产白丝娇喘喷水9色精品| 天天操日日干夜夜撸| 制服诱惑二区| 在线观看三级黄色| 视频中文字幕在线观看| 亚洲欧美清纯卡通| 国产亚洲一区二区精品| 日日啪夜夜爽| 欧美日本中文国产一区发布| 三级国产精品欧美在线观看| 欧美日韩在线观看h| av又黄又爽大尺度在线免费看| 亚洲精品乱久久久久久| 久久 成人 亚洲| 狂野欧美白嫩少妇大欣赏| 国产欧美日韩一区二区三区在线 | 黄片无遮挡物在线观看| 国产一区二区在线观看av| 欧美另类一区| 久久韩国三级中文字幕| 久久精品夜色国产| 自线自在国产av| 在线观看免费视频网站a站| 女性生殖器流出的白浆| 午夜福利网站1000一区二区三区| 欧美三级亚洲精品| 国产黄频视频在线观看| 国产欧美另类精品又又久久亚洲欧美| 亚洲精品色激情综合| av天堂久久9| 欧美 亚洲 国产 日韩一| 亚洲国产欧美日韩在线播放| 人妻 亚洲 视频| 天堂中文最新版在线下载| 视频区图区小说| 狂野欧美激情性xxxx在线观看| 国产视频首页在线观看| 我要看黄色一级片免费的| 国产精品99久久99久久久不卡 | av国产精品久久久久影院| 在现免费观看毛片| 久久久久久人妻| 国产毛片在线视频| 69精品国产乱码久久久| 国产成人av激情在线播放 | 男人爽女人下面视频在线观看| 亚洲国产精品成人久久小说| 免费黄网站久久成人精品| 考比视频在线观看| 九九在线视频观看精品| 午夜av观看不卡| 大片电影免费在线观看免费| 热re99久久国产66热| 婷婷色av中文字幕| 欧美一级a爱片免费观看看| 国产成人精品在线电影| 男女啪啪激烈高潮av片| 色哟哟·www| 高清欧美精品videossex| 晚上一个人看的免费电影| 午夜视频国产福利| 女人久久www免费人成看片| 欧美亚洲 丝袜 人妻 在线| 各种免费的搞黄视频| 大片免费播放器 马上看| 日日爽夜夜爽网站| 老司机影院成人| 十八禁高潮呻吟视频| 久久精品国产鲁丝片午夜精品| 高清毛片免费看| 精品亚洲成a人片在线观看| 国产成人午夜福利电影在线观看| 美女脱内裤让男人舔精品视频| 国产精品一国产av| av天堂久久9| 最近2019中文字幕mv第一页| 天天影视国产精品| 国产av码专区亚洲av| 26uuu在线亚洲综合色| 美女xxoo啪啪120秒动态图| 婷婷色综合www| 久久久a久久爽久久v久久| 免费av不卡在线播放| 欧美bdsm另类| 国产高清有码在线观看视频| 韩国av在线不卡| 久久久久久久久久成人| 国产精品偷伦视频观看了| 久久久久人妻精品一区果冻| 在线 av 中文字幕| 亚洲av成人精品一区久久| 亚洲欧美精品自产自拍| 久久久久久久久大av| 最后的刺客免费高清国语| 精品亚洲成a人片在线观看| 国产av精品麻豆| www.色视频.com| 中文字幕最新亚洲高清| 狂野欧美激情性bbbbbb| 秋霞伦理黄片| 2022亚洲国产成人精品| 狂野欧美激情性xxxx在线观看| 卡戴珊不雅视频在线播放| 18禁观看日本| 欧美激情国产日韩精品一区| 汤姆久久久久久久影院中文字幕| 日韩三级伦理在线观看| 在线 av 中文字幕| 日本欧美视频一区| 人成视频在线观看免费观看| 久久久精品94久久精品| 97精品久久久久久久久久精品| 99久久精品一区二区三区| 免费高清在线观看日韩| 成人国产av品久久久| 18禁观看日本| 久久久国产精品麻豆| 一区二区av电影网| 能在线免费看毛片的网站| 蜜桃久久精品国产亚洲av| 大香蕉久久网| 视频区图区小说| 插阴视频在线观看视频| 亚洲三级黄色毛片| 欧美精品一区二区大全| 青青草视频在线视频观看| 国产69精品久久久久777片| 久久鲁丝午夜福利片| 国产精品秋霞免费鲁丝片| 一级毛片我不卡| 日韩一区二区视频免费看| 久久久久久久久久久久大奶| 亚洲欧洲精品一区二区精品久久久 | 国产一区有黄有色的免费视频| 人人妻人人爽人人添夜夜欢视频| 男女边摸边吃奶| 搡老乐熟女国产| 999精品在线视频| 国产在线视频一区二区| 亚洲欧洲国产日韩| av电影中文网址| 精品人妻在线不人妻| 2022亚洲国产成人精品| 免费观看无遮挡的男女| 国产精品麻豆人妻色哟哟久久| 99国产精品免费福利视频| www.色视频.com| 插阴视频在线观看视频| 青春草视频在线免费观看| 亚洲av国产av综合av卡| 国产高清有码在线观看视频| 丝袜喷水一区| 精品人妻偷拍中文字幕| 国产精品欧美亚洲77777| 国产69精品久久久久777片| 岛国毛片在线播放| 大片电影免费在线观看免费| 久久精品国产亚洲网站| 大香蕉久久网| 精品午夜福利在线看| 久久精品国产亚洲网站| 久久鲁丝午夜福利片| www.色视频.com| 2021少妇久久久久久久久久久| 日本91视频免费播放| 最新的欧美精品一区二区| 热re99久久国产66热| 成年女人在线观看亚洲视频| av免费观看日本| 2021少妇久久久久久久久久久| 国产色爽女视频免费观看| 欧美日韩成人在线一区二区| 欧美性感艳星| 丝瓜视频免费看黄片| 大话2 男鬼变身卡| 免费大片黄手机在线观看| 久久久久精品久久久久真实原创| 9色porny在线观看| 亚洲精品乱码久久久v下载方式| 秋霞伦理黄片| 国产熟女午夜一区二区三区 | 三上悠亚av全集在线观看| 少妇高潮的动态图| 国产亚洲午夜精品一区二区久久| 婷婷成人精品国产| a级毛片在线看网站| 插阴视频在线观看视频| av黄色大香蕉| 日本-黄色视频高清免费观看| 桃花免费在线播放| 麻豆乱淫一区二区| 亚洲经典国产精华液单| 又粗又硬又长又爽又黄的视频| 下体分泌物呈黄色| av有码第一页| 欧美国产精品一级二级三级| 高清毛片免费看| 久久久亚洲精品成人影院| 午夜免费鲁丝| 亚洲国产毛片av蜜桃av| av播播在线观看一区| 人妻人人澡人人爽人人| 亚洲精华国产精华液的使用体验| 美女大奶头黄色视频| 日日爽夜夜爽网站| h视频一区二区三区| 九九久久精品国产亚洲av麻豆| av电影中文网址| 伊人久久精品亚洲午夜| 色哟哟·www| 99热这里只有精品一区| 男女边摸边吃奶| 最后的刺客免费高清国语| 91精品三级在线观看| 日韩中文字幕视频在线看片| 飞空精品影院首页| 91久久精品电影网| 国产免费一区二区三区四区乱码| 黑人巨大精品欧美一区二区蜜桃 | 久久亚洲国产成人精品v| 日韩三级伦理在线观看| 国产一级毛片在线| 欧美精品人与动牲交sv欧美| 91精品国产国语对白视频| 日韩欧美一区视频在线观看| 少妇人妻 视频| 国产精品一二三区在线看| 国产女主播在线喷水免费视频网站| 国产国拍精品亚洲av在线观看| 免费黄色在线免费观看| 99精国产麻豆久久婷婷| 一级二级三级毛片免费看| 免费少妇av软件| 男女国产视频网站| 亚洲少妇的诱惑av| 国产精品国产三级专区第一集| 日韩强制内射视频| 免费黄网站久久成人精品| 久久99一区二区三区| 美女福利国产在线| 在线播放无遮挡| 免费不卡的大黄色大毛片视频在线观看| 狂野欧美激情性bbbbbb| 欧美日韩综合久久久久久| 亚洲国产精品一区三区| 十八禁高潮呻吟视频| 如日韩欧美国产精品一区二区三区 | 欧美精品一区二区免费开放| 插阴视频在线观看视频| 国产毛片在线视频| 大片电影免费在线观看免费| 久久精品国产a三级三级三级| 高清午夜精品一区二区三区| 色视频在线一区二区三区| 精品视频人人做人人爽| 欧美bdsm另类| 大片免费播放器 马上看| 尾随美女入室| 啦啦啦在线观看免费高清www| 男人爽女人下面视频在线观看| 考比视频在线观看| 久久精品国产自在天天线| 亚洲精品成人av观看孕妇| 亚洲av日韩在线播放| 99九九在线精品视频| 久久久久久久久久成人| 亚洲内射少妇av| 国产成人精品一,二区| 美女国产视频在线观看| 国产深夜福利视频在线观看| 22中文网久久字幕| 人妻人人澡人人爽人人| 日本黄色日本黄色录像| 亚洲精品国产色婷婷电影| 亚洲第一av免费看| 搡女人真爽免费视频火全软件| 人妻人人澡人人爽人人| 色5月婷婷丁香| 亚洲av.av天堂| 18禁观看日本| 精品久久久久久久久亚洲| 久久人人爽人人片av| 熟女电影av网| 春色校园在线视频观看| 久久人妻熟女aⅴ| 亚洲欧美清纯卡通| 免费av不卡在线播放| 久久久久久久精品精品| 国产精品人妻久久久久久| av又黄又爽大尺度在线免费看| 亚洲五月色婷婷综合| 男的添女的下面高潮视频| 亚洲四区av| 黑丝袜美女国产一区| 最后的刺客免费高清国语| 成年美女黄网站色视频大全免费 | 久久鲁丝午夜福利片| 丝袜美足系列| 波野结衣二区三区在线| 亚洲国产最新在线播放| 男女免费视频国产| 一边摸一边做爽爽视频免费| 欧美精品一区二区免费开放| 纯流量卡能插随身wifi吗| 亚洲天堂av无毛| 亚洲精品456在线播放app| 国产一区二区在线观看日韩| 国产亚洲精品第一综合不卡 | 亚洲av欧美aⅴ国产| 国产精品久久久久久精品电影小说| 亚洲经典国产精华液单| 国产免费视频播放在线视频| 亚洲成色77777| 午夜福利影视在线免费观看| 精品国产露脸久久av麻豆| 春色校园在线视频观看| 国产熟女欧美一区二区| 国产亚洲精品久久久com| 亚洲av日韩在线播放| 国产成人aa在线观看| 精品人妻偷拍中文字幕| 97精品久久久久久久久久精品| 看十八女毛片水多多多| 亚洲精品av麻豆狂野| 伦精品一区二区三区| 国产国拍精品亚洲av在线观看| 久久精品国产亚洲网站| 国产永久视频网站| 精品人妻熟女av久视频| 亚洲欧美一区二区三区黑人 | 亚洲美女搞黄在线观看| 男女啪啪激烈高潮av片| 最近手机中文字幕大全| 国产成人精品在线电影| 免费大片18禁| 欧美变态另类bdsm刘玥| 欧美另类一区| 国产av一区二区精品久久|