• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于配對排序損失的文本多標(biāo)簽學(xué)習(xí)算法

    2020-10-21 00:57:58顧天飛彭敦陸
    關(guān)鍵詞:排序標(biāo)簽損失

    顧天飛,彭敦陸

    (上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海200093)

    1 引 言

    文本分類是自然語言處理領(lǐng)域中的一項(xiàng)重要任務(wù),是構(gòu)建信息檢索、對話機(jī)器人等復(fù)雜系統(tǒng)的基礎(chǔ).多分類假設(shè)類別之間是互斥的,即一篇文檔有且只能歸屬于單個(gè)類別.而事實(shí)上,對象是多語義的,比如一篇新聞能同時(shí)標(biāo)注上“體育”和“足球”標(biāo)簽.所以,多標(biāo)簽更適合用來對現(xiàn)實(shí)問題進(jìn)行建模,并有其實(shí)際的應(yīng)用背景和學(xué)術(shù)價(jià)值.

    多標(biāo)簽學(xué)習(xí)存在多標(biāo)簽分類和標(biāo)簽排序兩類任務(wù)[11],前者將標(biāo)簽集劃分為與樣本相關(guān)和不相關(guān)兩部分,后者則預(yù)測標(biāo)簽之間的前后關(guān)系.上述兩項(xiàng)任務(wù)存在共通性,多標(biāo)簽分類和標(biāo)簽排序之間是可以相互轉(zhuǎn)換的,文獻(xiàn)引入校準(zhǔn)標(biāo)簽對排序的標(biāo)簽進(jìn)行劃分[14],而采用判別模型完成多標(biāo)簽分類時(shí),樣本對標(biāo)簽的后驗(yàn)概率天然具有可排序性[5].故而,學(xué)界和業(yè)界開始嘗試將兩項(xiàng)任務(wù)聯(lián)合起來進(jìn)行解決,并運(yùn)用于不同的應(yīng)用領(lǐng)域[6,9,16].大體上,這類方法基于以下思想,得分較高的標(biāo)簽更能體現(xiàn)樣本的語義,模型應(yīng)使正標(biāo)簽集排在負(fù)標(biāo)簽集之前,這樣篩選出來的標(biāo)簽也更加精準(zhǔn)[16],從這一角度看,標(biāo)簽排序考慮到了標(biāo)簽的相對關(guān)系.

    對于文本處理,過去的研究普遍采用文本特征手工提取的方式[19,20].得益于深度學(xué)習(xí)的發(fā)展,端到端的深度表征模型已成為當(dāng)今的主流[1-5,7,8,15].與此同時(shí),深度模型的性能受到標(biāo)注數(shù)據(jù)缺失和語義提取不足的限制.為此,本研究引入遷移學(xué)習(xí),將BERT[1]作為模型的特征提取部分,將多標(biāo)簽分類和排序共同納入考慮,利用標(biāo)簽之間的相對關(guān)系來增強(qiáng)多標(biāo)簽預(yù)測的有效性.文獻(xiàn)普遍采用錯誤排序統(tǒng)計(jì)[10]和鉸鏈損失[9]刻畫多標(biāo)簽排序誤差,但這些損失函數(shù)通常難以優(yōu)化,尤其在深度模型的背景下.故本文采用一種替代的配對排序損失,該損失函數(shù)在實(shí)數(shù)域上可微,同時(shí)也是鉸鏈損失的邊界.此外,為了更準(zhǔn)確地獲得文本實(shí)例對應(yīng)的標(biāo)簽集,標(biāo)簽的篩選被看作為一項(xiàng)二值分類,用一個(gè)輔助網(wǎng)絡(luò)構(gòu)建篩選標(biāo)簽的閾值.

    本文的貢獻(xiàn)如下:1)將遷移模型BERT運(yùn)用于文本多標(biāo)簽學(xué)習(xí);2)提出配對排序目標(biāo)函數(shù)對標(biāo)簽排序任務(wù)進(jìn)行建模,并給出了相應(yīng)的理論分析.最后,為了決斷出精準(zhǔn)的標(biāo)簽集,算法引入額外的輔助網(wǎng)絡(luò)進(jìn)行閾值預(yù)測.

    2 相關(guān)工作

    一般地,解決多標(biāo)簽任務(wù)存在兩類思路,問題轉(zhuǎn)換和算法適應(yīng)[11].前者將多標(biāo)簽學(xué)習(xí)轉(zhuǎn)化為二值分類[11]、多分類[12]或標(biāo)簽排序[14],后者則修改現(xiàn)有的學(xué)習(xí)算法以適應(yīng)多標(biāo)簽領(lǐng)域[13].上述技術(shù)主要集中于傳統(tǒng)機(jī)器學(xué)習(xí),往往存在嚴(yán)重的性能瓶頸,計(jì)算規(guī)模和標(biāo)簽空間呈正比[10-14].如今,神經(jīng)網(wǎng)絡(luò)在模式識別領(lǐng)域獲得了巨大的成功,其中很大一部分運(yùn)用到了多標(biāo)簽學(xué)習(xí)中[3,5-9].

    傳統(tǒng)的文本分類算法受限于語義和句法信息提取能力的不足,深度模型已經(jīng)成為了該領(lǐng)域的主流.文獻(xiàn)[15]率先采用詞向量word2vec[17]進(jìn)行詞嵌入和卷積神經(jīng)網(wǎng)絡(luò)作為特征提取器,獲得了顯著的性能提升.該模型奠定了深度文本分類的一種范式,即模型一般由詞嵌入層、銜接模型和分類器三部分組成.如何通過海量的語料庫無監(jiān)督學(xué)習(xí)到詞的表示是一項(xiàng)熱門研究,Word2vec[17]通過對詞語上下文和語義關(guān)系進(jìn)行建模,將詞語嵌入到稠密的歐式空間中.BERT[1]由多層Transformer[4]構(gòu)建而成,能解析出更深層的語義,并能適用于各項(xiàng)下游任務(wù).

    文本多標(biāo)簽學(xué)習(xí)需要考慮到兩方面,文本信息的提取和標(biāo)簽之間的相關(guān)性,現(xiàn)有的研究基本上是圍繞這兩方面展開的.一部分研究構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的模型[5,7,8],文獻(xiàn)[3]采用了二值交叉損失對多標(biāo)簽進(jìn)行建模,文獻(xiàn)[8]引入指示神經(jīng)元對標(biāo)簽共現(xiàn)進(jìn)行建模,以利用標(biāo)簽的信息,文獻(xiàn)[5]將標(biāo)簽預(yù)測看作為序列生成,引入循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建標(biāo)簽之間的關(guān)系.文本序列的各個(gè)位置對標(biāo)簽的影響是不同的,SGM[3]利用注意力機(jī)制加強(qiáng)模型的關(guān)注性.

    排序?qū)W習(xí)的目的是通過機(jī)器學(xué)習(xí)算法對項(xiàng)目進(jìn)行排序,在信息檢索、推薦系統(tǒng)中運(yùn)用極為廣泛.多標(biāo)簽學(xué)習(xí)存在以下假設(shè),與樣本相關(guān)的標(biāo)簽在排序上高于不相關(guān)的標(biāo)簽,所以排序任務(wù)能很好的刻畫這種標(biāo)簽關(guān)系.文獻(xiàn)[16]最早將文本多標(biāo)簽分類看作為一項(xiàng)排序任務(wù),并利用配對排序損失刻畫誤差,但文獻(xiàn)僅在多層感知機(jī)模型上驗(yàn)證了損失函數(shù)的有效性.配對排序損失也可以應(yīng)用于圖像檢測領(lǐng)域[6,9],但研究中普遍采用的鉸鏈損失存在訓(xùn)練困難的問題.為了彌補(bǔ)上述缺點(diǎn),本研究在深度文本多標(biāo)簽學(xué)習(xí)背景下,嘗試了語言模型的遷移學(xué)習(xí),并著重了探討了配對損失的使用.

    3 本文工作

    本章將首先給出問題的定義,然后提出結(jié)合BERT的文本特征提取模型,最后給出配對排序和標(biāo)簽閾值預(yù)測的設(shè)計(jì),以及相關(guān)的目標(biāo)函數(shù).

    3.1 問題描述

    定義1.多標(biāo)簽排序任務(wù),給定樣本x,若s*為理想的映射函數(shù),則需滿足以下性質(zhì):

    (1)

    3.2 多標(biāo)簽文本學(xué)習(xí)模型

    在深度自然語言處理中,一個(gè)端到端模型一般由以下幾個(gè)步驟組成,首先將原始文本序列嵌入至稠密的表征詞嵌入h1,h2,…,hl,其次通過銜接模型將詞嵌入序列轉(zhuǎn)化為定長的表征向量,最終輸入到文本分類器中.對詞嵌入表征的研究和應(yīng)用向來受到學(xué)界和業(yè)界的廣泛關(guān)注,通過預(yù)訓(xùn)練詞向量使詞嵌入涵蓋語義和語法信息.然而,類似于Word2vec詞向量模型存在無法解析一詞多義,上下文信息缺失等缺點(diǎn),往往對性能的提升并不明顯.BERT作為一種語言遷移模型,可以較好地彌補(bǔ)上述缺陷.

    在詞嵌入階段,bert(·)將原始文本序列x中的每個(gè)元素映射到固定尺寸的嵌入,映射方式如下:

    h1,h2,…,hl=bert(w1,w2,…,wl)

    (2)

    這里,h∈d,d>L的維度由bert(·)決定.銜接模型用于對嵌入進(jìn)行整合,文獻(xiàn)中,通常會壘砌大量模型[5,15],對于這一環(huán)節(jié)本研究不做過多地復(fù)雜化,采用均值操作mean(·)將嵌入序列轉(zhuǎn)化為d維的特征向量f:

    (3)

    接下來,考慮標(biāo)簽相關(guān)性得分的建模,由d維特征向量向L維向量映射,形式化為:

    s=relu(Wsf+bs)

    (4)

    其中,Ws∈L×d為權(quán)重矩陣,bs∈L為偏置向量.式(4)中的relu(·)為神經(jīng)網(wǎng)絡(luò)的激活函數(shù).至此,對某個(gè)輸入樣本x,便能得到模型對各個(gè)類別的打分s,即為類別對樣本的相關(guān)性.多標(biāo)簽和多類別分類在判決函數(shù)上存在一定差異.多類別假設(shè)類別之間是相互獨(dú)立的,故而往往取得分最大的類別作為輸出標(biāo)簽.在多標(biāo)簽分類中,每個(gè)實(shí)例對應(yīng)的標(biāo)簽數(shù)是不同的.簡單的做法是取前k最大得分或設(shè)置全局閾值(將得分大于某一閾值的標(biāo)簽篩選出來),這些方法會造成額外的預(yù)測誤差.本研究將采取一種更靈活的做法,即讓g(·)作為一項(xiàng)可學(xué)習(xí)的函數(shù),為每個(gè)標(biāo)簽自動地學(xué)習(xí)得到適應(yīng)于樣本特征f的閾值.閾值建模類似于標(biāo)簽相關(guān)性得分模型:

    θ=relu(Wthrf+bthr)

    (5)

    模型的預(yù)測同時(shí)依賴于式(4)和式(5):

    (6)

    上式中,si,k表示樣本與標(biāo)簽的相關(guān)性得分si的第k分量,θi,k表示閾值的第k分量.圖1為模型的整體框架.

    3.3 多標(biāo)簽配對排序損失

    上節(jié)介紹了結(jié)合語言遷移模型的多標(biāo)簽分類模型,本節(jié)將引出如何對模型參數(shù)進(jìn)行優(yōu)化.形式上,需要解決如下優(yōu)化問題:

    (7)

    這里,l為每個(gè)樣本上的損失項(xiàng),R為模型參數(shù)的正則項(xiàng),Φs=[Ws,bs]為標(biāo)簽相關(guān)性得分模型的參數(shù).在訓(xùn)練式(7)時(shí),解凍bert,對其進(jìn)行參數(shù)微調(diào).由定義1可得,屬于Y的標(biāo)簽得分需盡可能地大,反之亦然.借鑒三元損失,易對損失進(jìn)行建模:

    圖1 算法框架Fig.1 Architecture of algorithm

    (8)

    式(8)采用了鉸鏈損失,α是一項(xiàng)超參數(shù),用來設(shè)定相關(guān)與不相關(guān)標(biāo)簽之間的邊界.該損失函數(shù)是非光滑的,在x=0處不可微,從而造成了優(yōu)化的困難.為解決上述問題,本研究考慮引入替代損失:

    (9)

    圖2 損失函數(shù)ls的性質(zhì)Fig.2 Property of loss function ls

    上式中,β是常系數(shù).替代損失式(9)是式(8)光滑的近似.由圖2中實(shí)線可見,該損失函數(shù)為實(shí)數(shù)域上處處可微的凸函數(shù),在+上為鉸鏈損失的邊界,當(dāng)且僅當(dāng),β=ea-1.此外,β值越小,則實(shí)線越接近y=0.章節(jié)4給出了相應(yīng)的梯度求解,并且從經(jīng)驗(yàn)誤差最小化和貝葉斯最優(yōu)預(yù)測角度進(jìn)行理論分析.

    (10)

    3.4 閾值模型損失

    式(5)為閾值回歸模型,根據(jù)樣本特征為每個(gè)標(biāo)簽學(xué)習(xí)篩選閾值θ,并通過式(6)得到最終的預(yù)測標(biāo)簽集.對某個(gè)標(biāo)簽來說,預(yù)測可以轉(zhuǎn)換為一項(xiàng)二值問題,得分大于閾值為正樣本,反之作為負(fù)樣本.于是,閾值參數(shù)的目標(biāo)函數(shù)可以寫成以下形式:

    (11)

    4 理論分析

    本章首先對優(yōu)化目標(biāo)函數(shù)進(jìn)行梯度計(jì)算,考慮式(10)對sm和sn的梯度為:

    (12)

    (13)

    整合式(12)和式(13)可以得到:

    (14)

    這里,ξn,m為L維向量,其中第n項(xiàng)為+1,第m項(xiàng)為-1,其余項(xiàng)為0,以上計(jì)算結(jié)果說明說明了目標(biāo)函數(shù)在實(shí)數(shù)域上式處處可微的.文獻(xiàn)[18]從經(jīng)驗(yàn)誤差最小化和貝葉斯最優(yōu)預(yù)測角度,證明了排序統(tǒng)計(jì)的有效性.相同地,對損失函數(shù)式(9)進(jìn)行理論分析,式(10)作為簡化版本同理可得.考慮貝葉斯預(yù)測準(zhǔn)則:

    sk(x)=p(k∈Y|x)=∑Y∈y,k∈Yp(Y|x)

    (15)

    上式?jīng)Q定了標(biāo)簽λk的得分即相應(yīng)的排序,p(k∈Y|x)為標(biāo)簽域中所有可能的標(biāo)簽集的邊際分布.

    定理1.采用損失函數(shù)式(9)能達(dá)到經(jīng)驗(yàn)損失最小化.

    證明:考慮損失函數(shù)經(jīng)驗(yàn)誤差最小化:

    R(s)=[ls(s(x),Y)]

    (16)

    將式(16)改寫成條件經(jīng)驗(yàn)損失的形式:

    R(s|x)=[ls(s(x),Y)|x]

    (17)

    這里,γm,n=ln (1+esTξm,n).現(xiàn)需找到使經(jīng)驗(yàn)損失最小化的得分函數(shù)s*,即盡可能滿足定義1.計(jì)算式(17)的一階和二階導(dǎo):

    (18)

    (19)

    (20)

    (21)

    替換式(21)中的(n,m),得到:

    (22)

    (23)

    (24)

    式(24)易得p(m∈Y|x)>p(n∈Y|x),基本滿足貝葉斯預(yù)測準(zhǔn)則.綜上,以式(9)作為排序損失,能達(dá)到經(jīng)驗(yàn)損失最小化.

    5 實(shí)驗(yàn)評估

    本章節(jié)將在真實(shí)的中文文本數(shù)據(jù)集上驗(yàn)證本文所提算法的性能,實(shí)驗(yàn)首先對比了不同的標(biāo)簽決斷方法和損失函數(shù)的表現(xiàn),最后與一些主流的方法進(jìn)行比較.

    5.1 實(shí)驗(yàn)數(shù)據(jù)

    本實(shí)驗(yàn)選用了法研杯比賽CAIL2018(1)https://github.com/thunlp/CAIL罪名預(yù)測任務(wù),來進(jìn)行算法驗(yàn)證.為減少訓(xùn)練時(shí)間,選取了187100份樣本,并根據(jù)8∶1∶1的比例將數(shù)據(jù)集劃分為訓(xùn)練集,測試集和驗(yàn)證集.多標(biāo)簽數(shù)據(jù)集存在額外的性質(zhì),表1給出相關(guān)的信息.在文獻(xiàn)中,Card和Dens分別表示樣本所屬標(biāo)簽平均數(shù)量和標(biāo)簽密度.標(biāo)簽集數(shù)量較大說明存在大量標(biāo)簽共現(xiàn)的情況,如何利用上標(biāo)簽的關(guān)系顯得額外重要.

    表1 多標(biāo)簽信息Table 1 Data set information

    5.2 實(shí)驗(yàn)設(shè)置

    1)實(shí)驗(yàn)平臺:本研究中所有的代碼都由Python編寫,模型基于Tensorflow搭建.采用哈工大提供的BERT(2)https://github.com/ymcui/Chinese-BERT-wwm預(yù)訓(xùn)練模型,該版本在海量的中文語料庫上完成訓(xùn)練,并在各項(xiàng)中文任務(wù)驗(yàn)證了其有效性.設(shè)備系統(tǒng)為Ubuntu16.04,配備兩塊NVIDIA GeForce 1080Ti顯卡,內(nèi)存為64G.

    2)數(shù)據(jù)預(yù)處理:原始文本數(shù)據(jù)已經(jīng)做了脫敏處理,本實(shí)驗(yàn)將作進(jìn)一步地優(yōu)化,去除了文檔中的特殊符號,西文字符等.由于文書是存在格式的,其中有些子句實(shí)際上是無用的,比如“人民檢察院指控”,“公訴機(jī)關(guān)指控”或者文書審理日期等,實(shí)驗(yàn)中將上述字符串從文檔中剔除.為處理數(shù)據(jù)集存在的多標(biāo)簽不平衡問題,這里首先按照50:50的比例將標(biāo)簽集劃分為多數(shù)類和少數(shù)類,并對少數(shù)類進(jìn)行上采樣處理.

    3)實(shí)驗(yàn)參數(shù)設(shè)置:第一階段對標(biāo)簽得分模型進(jìn)行優(yōu)化,該階段解凍bert的參數(shù),做參數(shù)微調(diào).第二階段凍結(jié)bert,僅對閾值模型進(jìn)行優(yōu)化.兩個(gè)階段皆采用ADAM優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001.BERT模型輸入序列的尺寸上存在限制,最大輸入為512,訓(xùn)練中將長文本按200字符為單位進(jìn)行分割,模型預(yù)測過程中,將由各個(gè)劃分的特征均值作為完整文本的特征.式(10)配對子采樣的數(shù)量為120.由式(14)可知,超參數(shù)β是一項(xiàng)平滑參數(shù),對梯度的尺度和訓(xùn)練的收斂性存在一定影響,與學(xué)習(xí)率的功能是相似的.β過大會使損失函數(shù)趨向于線性,過小則趨向于為零,在超參數(shù)調(diào)優(yōu)過程中,嘗試了區(qū)間0.1至2都能使訓(xùn)練收斂,故方便起見這里設(shè)置為1.

    4)評價(jià)指標(biāo):本研究同時(shí)考慮到了多標(biāo)簽的分類和排序兩方面,所以實(shí)驗(yàn)也將從這兩方面對預(yù)測結(jié)果進(jìn)行評估.下面所闡述的評價(jià)指標(biāo)都參考自文獻(xiàn)[11],采用宏觀和微觀F1得分衡量分類性能:

    (25)

    (26)

    這里,eval=2·prec·recall/(prec+recall)為F1得分,用于調(diào)和準(zhǔn)確率prec=TP/(TP+FP),召回率recall=TP/(TP+FN).在以上式子中,TP表示為真正樣本,F(xiàn)P為假正樣本,TN為真負(fù)樣本,F(xiàn)N為假負(fù)樣本.用排序誤差衡量排序性能:

    RankL=

    (27)

    排序損失RankL統(tǒng)計(jì)預(yù)測結(jié)果中的對誤排標(biāo)簽對,數(shù)值越小越好.

    5.3 實(shí)驗(yàn)結(jié)果分析

    本章節(jié)將通過實(shí)驗(yàn)評估本文所提算法的有效性.

    實(shí)驗(yàn)1.不同標(biāo)簽決斷方法

    在章節(jié)3.2中提到了其它兩種標(biāo)簽決斷方法,Top-k和全局閾值,在使用中,k值取1、3和5,閾值從0.05-0.95按照0.01為間隔,表2展示測試集上最優(yōu)得分.值得注意的是,本文提出的得分模型其輸出是映射到實(shí)數(shù)域上的,所以通過sigmoid將其約束到概率空間中.相對來說,宏觀和微觀指標(biāo)衡量了模型的整體分類性能,對標(biāo)簽的誤選較為敏感,Top-k和全局閾值是靜態(tài)的刷選策略,而沒有考慮到了樣本特征本身所攜帶的信息,從而造成得分上的下滑.并且,在使用這些算法的時(shí)候往往會遇到超參的優(yōu)化問題.表2中的結(jié)果說明在多標(biāo)簽領(lǐng)域,標(biāo)簽決斷對最終預(yù)測結(jié)果的影響非常大.相比于全局閾值,閾值預(yù)測方法在分類指標(biāo)上能提供2%的提升,排序指標(biāo)上也是表現(xiàn)最優(yōu)的.

    表2 標(biāo)簽決斷技術(shù)的對比Table 2 Comparison of label decision

    實(shí)驗(yàn)2.不同訓(xùn)練方式

    本實(shí)驗(yàn)將配對排序損失和其它幾種目標(biāo)函數(shù)進(jìn)行比較:

    1)二值交叉損失[5](BCE):

    (28)

    BCE相當(dāng)于標(biāo)簽轉(zhuǎn)換,類似于參數(shù)共享的二值分類模型;

    2)鉸鏈損失式(8);

    3)BP-MLL[8]基于指數(shù)損失.為了確保方法之間的可對比性,實(shí)驗(yàn)采用同一套數(shù)據(jù)預(yù)處理技術(shù),并且默認(rèn)采用閾值預(yù)測技術(shù).表3展示了各種訓(xùn)練方式之間的性能對比.可以看到BCE在微觀指標(biāo)上的表現(xiàn)略微占有,但在其余指標(biāo)上,文本的算法存在競爭性的優(yōu)勢.這是由于BCE注重整體的分類誤差,配對排序損失則考慮錯誤的排序?qū)?宏觀指標(biāo)是標(biāo)簽F1得分的平均,本文的算法在MacroF1上的優(yōu)勢也體現(xiàn)了數(shù)據(jù)不平衡對配對排序損失的影響較低.

    表3 訓(xùn)練方式之間的對比Table 3 Comparison of training approaches

    實(shí)驗(yàn)3.不同模型進(jìn)行對比

    前兩項(xiàng)實(shí)驗(yàn)分別從標(biāo)簽決斷和訓(xùn)練方式做了對比,本實(shí)驗(yàn)將選取一些常用的多標(biāo)簽算法進(jìn)行完整的對比:

    1)二值相關(guān)BR[11]為每個(gè)標(biāo)簽訓(xùn)練一個(gè)SVM分類器;

    2)ML-KNN[13]將KNN拓展到多標(biāo)簽領(lǐng)域,是一種惰性學(xué)習(xí)器;

    3)卷積神經(jīng)網(wǎng)絡(luò)CNN[5]是最常用的深度文本模型;

    4)CNN-RNN[7]采用循環(huán)神經(jīng)網(wǎng)絡(luò)對標(biāo)簽之間的關(guān)系進(jìn)行建模.

    接下來將對上述算法的執(zhí)行流程做一定闡述,對于詞級模型,首先中文文書進(jìn)行分詞,算法1)2)采用TF-IDF算法進(jìn)行特征提取,算法3)4)則將詞嵌入至定長向量.

    表4 不同算法性能對比Table 4 Performance comparison of different algorithms

    表4展示了在全數(shù)據(jù)上,不同算法之間的性能比較.圖3展示了在不同比例數(shù)據(jù)集上的分類性能.實(shí)驗(yàn)結(jié)果顯示,隨著數(shù)據(jù)規(guī)模的增大,深度學(xué)習(xí)算法能獲得更好的表現(xiàn).相比于另兩種深度模型CNN和CNN-RNN,本文提出的算法的整體性能都較優(yōu).這是由于研究在文本特征提取和標(biāo)簽決斷上都做了考慮.遷移的BERT模型能提供數(shù)據(jù)集之外的語義知識并且具有更多的參數(shù)量,由圖3可見,模型表現(xiàn)受到數(shù)據(jù)集尺寸的波動較小.配對排序損失能鋪?zhàn)降綐?biāo)簽之間的排序關(guān)系,使相關(guān)度較高的標(biāo)簽?zāi)塬@得更大的得分,同時(shí),自適應(yīng)的標(biāo)簽閾值學(xué)習(xí)能幫助算法得到更精準(zhǔn)的預(yù)測結(jié)果.

    圖3 不同比例數(shù)據(jù)集上的對比Fig.3 Comparison with different dataset proportion

    6 總 結(jié)

    多標(biāo)簽文本學(xué)習(xí)能幫助用戶對文檔進(jìn)行有效管理,加強(qiáng)多媒體系統(tǒng)的可用性.傳統(tǒng)的,基于機(jī)器學(xué)習(xí)的算法受限于特征提取和模型容量,存在嚴(yán)重性能瓶頸.本文提出的算法利用中文BERT預(yù)訓(xùn)練語言模型對文書進(jìn)行特征提取,模型架構(gòu)上更精煉且高.算法選用配對排序損失作為目標(biāo)函數(shù),以鋪?zhàn)降綐?biāo)簽之間的關(guān)系.此外,為了更精準(zhǔn)地得到結(jié)果,引入輔助的閾值預(yù)測模型,對標(biāo)簽預(yù)測進(jìn)行建模.實(shí)驗(yàn)在法條預(yù)測和罪名推薦兩項(xiàng)任務(wù)上驗(yàn)證了算法的有效性.作為自然語言處理的一項(xiàng)子任務(wù),BERT對多標(biāo)簽文本分類也是適用的,將閾值預(yù)測看作一項(xiàng)學(xué)習(xí)任務(wù),相比Top-k和全局閾值,在測試集上表現(xiàn)更優(yōu)異.未來我們將在更多的多標(biāo)簽數(shù)據(jù)集上對算法進(jìn)行驗(yàn)證,并將對標(biāo)簽之間的相關(guān)性做進(jìn)一步探討.

    猜你喜歡
    排序標(biāo)簽損失
    少問一句,損失千金
    排序不等式
    胖胖損失了多少元
    恐怖排序
    節(jié)日排序
    玉米抽穗前倒伏怎么辦?怎么減少損失?
    無懼標(biāo)簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    標(biāo)簽化傷害了誰
    此物有八面人人有两片| 亚洲成av人片在线播放无| 免费看日本二区| 日本 欧美在线| 久久久久久国产a免费观看| avwww免费| 亚洲欧美日韩无卡精品| 国产精品1区2区在线观看.| netflix在线观看网站| 国产v大片淫在线免费观看| 亚洲欧美清纯卡通| 18禁在线播放成人免费| 国产男人的电影天堂91| 91午夜精品亚洲一区二区三区 | 97人妻精品一区二区三区麻豆| 网址你懂的国产日韩在线| 天堂网av新在线| 国产69精品久久久久777片| 免费观看的影片在线观看| 天堂√8在线中文| 2021天堂中文幕一二区在线观| 免费av不卡在线播放| 欧美中文日本在线观看视频| videossex国产| 在线观看免费视频日本深夜| 午夜久久久久精精品| 99在线视频只有这里精品首页| 波多野结衣高清作品| 亚洲综合色惰| 久久精品人妻少妇| 日日摸夜夜添夜夜添av毛片 | 日本-黄色视频高清免费观看| 成人欧美大片| 精品99又大又爽又粗少妇毛片 | 国产精品永久免费网站| 可以在线观看的亚洲视频| 99久久无色码亚洲精品果冻| 久久人人爽人人爽人人片va| 老熟妇仑乱视频hdxx| 天天一区二区日本电影三级| 99精品在免费线老司机午夜| xxxwww97欧美| 亚洲精品影视一区二区三区av| 中文字幕熟女人妻在线| 99久久精品热视频| 国产三级中文精品| 国产高清不卡午夜福利| 99久久精品一区二区三区| 国产精品久久久久久久久免| 人妻少妇偷人精品九色| www.www免费av| 淫秽高清视频在线观看| 深夜精品福利| 国产精品久久久久久精品电影| 国产精品福利在线免费观看| 欧美日韩黄片免| 成人国产综合亚洲| 亚洲成av人片在线播放无| 久久久精品大字幕| 国产精品久久电影中文字幕| 中出人妻视频一区二区| 一级黄片播放器| 国产淫片久久久久久久久| 久久久久国内视频| 一夜夜www| 春色校园在线视频观看| 精品欧美国产一区二区三| 亚洲精华国产精华精| 观看美女的网站| 我要看日韩黄色一级片| 亚洲无线在线观看| 99在线人妻在线中文字幕| 亚洲精品色激情综合| 日本 av在线| 免费高清视频大片| 午夜亚洲福利在线播放| 国产免费av片在线观看野外av| 亚洲在线观看片| 亚洲欧美日韩高清在线视频| 午夜视频国产福利| 麻豆成人av在线观看| 成人欧美大片| 91狼人影院| 国产精品国产高清国产av| 精品一区二区三区人妻视频| 99国产极品粉嫩在线观看| av.在线天堂| 美女免费视频网站| 国产午夜精品论理片| 亚洲一区高清亚洲精品| 国产精品美女特级片免费视频播放器| 国产亚洲av嫩草精品影院| 国内精品宾馆在线| 男人和女人高潮做爰伦理| a在线观看视频网站| av视频在线观看入口| 欧美zozozo另类| 一夜夜www| 免费看美女性在线毛片视频| 中文字幕熟女人妻在线| 亚洲精品粉嫩美女一区| 天堂动漫精品| 高清日韩中文字幕在线| 久久久成人免费电影| 国产蜜桃级精品一区二区三区| 九九久久精品国产亚洲av麻豆| 一a级毛片在线观看| 91av网一区二区| 日本与韩国留学比较| 亚洲成人精品中文字幕电影| 日本色播在线视频| 婷婷色综合大香蕉| 国产高清激情床上av| 国产精品av视频在线免费观看| 一a级毛片在线观看| 欧美xxxx黑人xx丫x性爽| 啪啪无遮挡十八禁网站| 久久天躁狠狠躁夜夜2o2o| www.www免费av| 麻豆成人午夜福利视频| 日本撒尿小便嘘嘘汇集6| 成人二区视频| 久久草成人影院| 亚洲国产精品久久男人天堂| av黄色大香蕉| 亚洲人成网站高清观看| 美女被艹到高潮喷水动态| 在线国产一区二区在线| 国产成人一区二区在线| 99久久九九国产精品国产免费| 在线a可以看的网站| 精品一区二区三区视频在线观看免费| 国产极品精品免费视频能看的| 99久久久亚洲精品蜜臀av| 神马国产精品三级电影在线观看| 2021天堂中文幕一二区在线观| 国产主播在线观看一区二区| 免费av毛片视频| 有码 亚洲区| 18禁在线播放成人免费| 一区二区三区四区激情视频 | 午夜精品一区二区三区免费看| 国产伦精品一区二区三区四那| 在线播放无遮挡| 国产精品98久久久久久宅男小说| 亚洲第一区二区三区不卡| 男人舔奶头视频| 18禁黄网站禁片免费观看直播| 高清日韩中文字幕在线| 国产精品爽爽va在线观看网站| 男女之事视频高清在线观看| 男人的好看免费观看在线视频| 1024手机看黄色片| 亚洲人成伊人成综合网2020| 精品99又大又爽又粗少妇毛片 | 久久精品国产亚洲av香蕉五月| 亚洲熟妇熟女久久| 免费大片18禁| 色精品久久人妻99蜜桃| 亚洲四区av| 成人鲁丝片一二三区免费| 欧洲精品卡2卡3卡4卡5卡区| 乱码一卡2卡4卡精品| 看黄色毛片网站| 亚洲最大成人中文| 日本-黄色视频高清免费观看| av在线观看视频网站免费| 深夜a级毛片| 97超视频在线观看视频| a级毛片免费高清观看在线播放| 岛国在线免费视频观看| 99久久精品国产国产毛片| 成年免费大片在线观看| 蜜桃久久精品国产亚洲av| 国产欧美日韩精品一区二区| 又黄又爽又免费观看的视频| 夜夜看夜夜爽夜夜摸| 午夜福利在线在线| 日本 av在线| 国产精品爽爽va在线观看网站| 久久久久国内视频| 干丝袜人妻中文字幕| 亚洲av成人精品一区久久| 中国美白少妇内射xxxbb| 波野结衣二区三区在线| 精品人妻1区二区| www.色视频.com| 免费看美女性在线毛片视频| 春色校园在线视频观看| 91精品国产九色| 久久久精品大字幕| 伊人久久精品亚洲午夜| 1000部很黄的大片| 亚洲美女视频黄频| 91久久精品国产一区二区三区| 久久亚洲真实| 春色校园在线视频观看| 亚洲人与动物交配视频| 两人在一起打扑克的视频| 国产精品伦人一区二区| 九九爱精品视频在线观看| 久久久精品大字幕| 中国美白少妇内射xxxbb| 精品不卡国产一区二区三区| 国产乱人视频| 国产免费av片在线观看野外av| 久久久久久国产a免费观看| 69人妻影院| 春色校园在线视频观看| 99热这里只有是精品在线观看| av黄色大香蕉| 欧美绝顶高潮抽搐喷水| 在线观看免费视频日本深夜| 亚洲专区中文字幕在线| 午夜福利欧美成人| 亚洲熟妇熟女久久| 亚洲精品影视一区二区三区av| 免费在线观看成人毛片| 欧洲精品卡2卡3卡4卡5卡区| 日韩一区二区视频免费看| 欧美激情久久久久久爽电影| 12—13女人毛片做爰片一| 在线播放国产精品三级| 国产亚洲精品综合一区在线观看| 国产精品乱码一区二三区的特点| 夜夜看夜夜爽夜夜摸| 亚洲精品在线观看二区| 少妇丰满av| 男女边吃奶边做爰视频| 亚洲av第一区精品v没综合| 国产美女午夜福利| 亚洲不卡免费看| 亚洲av中文字字幕乱码综合| 老熟妇乱子伦视频在线观看| 三级国产精品欧美在线观看| 精华霜和精华液先用哪个| 国产高清视频在线观看网站| 免费观看人在逋| 国产亚洲精品久久久com| xxxwww97欧美| 尤物成人国产欧美一区二区三区| 成人精品一区二区免费| 欧美不卡视频在线免费观看| 99久久久亚洲精品蜜臀av| 午夜福利欧美成人| 久久精品影院6| 一区二区三区四区激情视频 | 免费无遮挡裸体视频| 99久久久亚洲精品蜜臀av| 男女下面进入的视频免费午夜| 国产一区二区激情短视频| 日本a在线网址| 亚洲四区av| 亚洲avbb在线观看| 成人精品一区二区免费| 成人特级黄色片久久久久久久| 美女免费视频网站| a级毛片免费高清观看在线播放| 一边摸一边抽搐一进一小说| 日本撒尿小便嘘嘘汇集6| 欧美一级a爱片免费观看看| 成人高潮视频无遮挡免费网站| 精品一区二区三区人妻视频| 草草在线视频免费看| 九九热线精品视视频播放| 毛片女人毛片| 精品久久久久久成人av| 国产精品不卡视频一区二区| 久久精品人妻少妇| 在线免费观看的www视频| 日本a在线网址| 亚洲欧美激情综合另类| 欧美一级a爱片免费观看看| h日本视频在线播放| 精品久久久久久,| 国产一区二区在线av高清观看| 中亚洲国语对白在线视频| 精品久久久久久成人av| 免费av不卡在线播放| 久久久久久伊人网av| 99久久无色码亚洲精品果冻| 亚洲欧美激情综合另类| 99热这里只有是精品50| 日韩精品中文字幕看吧| 成人国产一区最新在线观看| 免费av毛片视频| 天美传媒精品一区二区| av女优亚洲男人天堂| 校园春色视频在线观看| 人人妻人人看人人澡| 亚洲中文字幕一区二区三区有码在线看| 搡老岳熟女国产| 国产精品日韩av在线免费观看| 国模一区二区三区四区视频| 如何舔出高潮| 欧美高清成人免费视频www| 免费在线观看影片大全网站| 国产精品久久久久久精品电影| 欧美一区二区亚洲| 国产成人aa在线观看| 国产又黄又爽又无遮挡在线| 欧美激情久久久久久爽电影| 人人妻人人澡欧美一区二区| 久久精品影院6| 亚洲最大成人手机在线| 直男gayav资源| 亚洲av二区三区四区| 国产高清激情床上av| 毛片一级片免费看久久久久 | 亚洲成av人片在线播放无| 大型黄色视频在线免费观看| 十八禁网站免费在线| 亚洲av免费高清在线观看| 国产在线精品亚洲第一网站| 亚洲成人免费电影在线观看| 亚洲av免费在线观看| 国产欧美日韩一区二区精品| 成人美女网站在线观看视频| 国产午夜福利久久久久久| 十八禁网站免费在线| 久9热在线精品视频| av黄色大香蕉| 在线a可以看的网站| 国产蜜桃级精品一区二区三区| 欧美xxxx黑人xx丫x性爽| 中文字幕人妻熟人妻熟丝袜美| 国产精品98久久久久久宅男小说| 一区福利在线观看| 欧美成人a在线观看| 日本在线视频免费播放| 国产白丝娇喘喷水9色精品| 国产高清激情床上av| 成人无遮挡网站| 久久精品国产鲁丝片午夜精品 | 日日干狠狠操夜夜爽| 精品午夜福利视频在线观看一区| 老熟妇乱子伦视频在线观看| 国产主播在线观看一区二区| 日本 欧美在线| 99热这里只有是精品50| 亚洲成人久久性| 亚洲av日韩精品久久久久久密| 在线国产一区二区在线| 亚洲中文字幕一区二区三区有码在线看| 亚洲国产欧洲综合997久久,| 乱系列少妇在线播放| 免费av观看视频| 日韩精品青青久久久久久| 黄色视频,在线免费观看| 久久久国产成人精品二区| 亚洲av五月六月丁香网| 成人国产麻豆网| 99riav亚洲国产免费| 中文字幕久久专区| 波多野结衣高清无吗| 国产精品精品国产色婷婷| 女的被弄到高潮叫床怎么办 | 深爱激情五月婷婷| 特大巨黑吊av在线直播| 亚洲精品一卡2卡三卡4卡5卡| 在线免费观看的www视频| 成人av在线播放网站| 赤兔流量卡办理| 久久人人精品亚洲av| 欧美性猛交黑人性爽| 久久精品国产亚洲网站| 国产伦一二天堂av在线观看| 在线观看av片永久免费下载| 麻豆国产97在线/欧美| x7x7x7水蜜桃| 欧美日本视频| 久久国产乱子免费精品| 国模一区二区三区四区视频| 免费观看精品视频网站| 国产av在哪里看| 岛国在线免费视频观看| 国产色爽女视频免费观看| 老熟妇仑乱视频hdxx| 国产高清有码在线观看视频| 成人一区二区视频在线观看| 婷婷色综合大香蕉| 嫁个100分男人电影在线观看| 亚洲中文日韩欧美视频| 亚洲乱码一区二区免费版| 色精品久久人妻99蜜桃| 国产伦精品一区二区三区四那| 精品人妻视频免费看| 成人无遮挡网站| 小蜜桃在线观看免费完整版高清| 久久国产乱子免费精品| videossex国产| 日韩一区二区视频免费看| 久久精品久久久久久噜噜老黄 | 一个人免费在线观看电影| 国产人妻一区二区三区在| 看免费成人av毛片| 91久久精品电影网| 少妇的逼好多水| 国产单亲对白刺激| 在线观看免费视频日本深夜| 九色成人免费人妻av| 精品久久久久久成人av| 两个人的视频大全免费| 成人午夜高清在线视频| 国产精品一区二区免费欧美| 神马国产精品三级电影在线观看| videossex国产| 99精品在免费线老司机午夜| 国产不卡一卡二| 亚洲国产色片| av天堂中文字幕网| 成人特级av手机在线观看| 国产亚洲欧美98| 亚洲精品一卡2卡三卡4卡5卡| 精品久久国产蜜桃| 99热这里只有是精品在线观看| 小说图片视频综合网站| 色综合站精品国产| 免费看日本二区| 国产精品久久久久久久电影| 狂野欧美激情性xxxx在线观看| 成人亚洲精品av一区二区| 亚洲电影在线观看av| 国产黄色小视频在线观看| 又黄又爽又刺激的免费视频.| 国产男靠女视频免费网站| 97热精品久久久久久| 成人精品一区二区免费| 久久精品国产亚洲av香蕉五月| 能在线免费观看的黄片| 亚洲国产精品合色在线| 国产国拍精品亚洲av在线观看| 国产精品伦人一区二区| 我的老师免费观看完整版| 啪啪无遮挡十八禁网站| 国产伦精品一区二区三区四那| 搡女人真爽免费视频火全软件 | 久久久精品欧美日韩精品| 精品久久久久久成人av| 22中文网久久字幕| videossex国产| 久久久久久久久中文| 午夜福利欧美成人| 真人一进一出gif抽搐免费| 国产探花极品一区二区| 女人被狂操c到高潮| 久久久久久久久久成人| 国产伦精品一区二区三区视频9| 久久久色成人| 黄色配什么色好看| 精品久久国产蜜桃| 成人亚洲精品av一区二区| 91午夜精品亚洲一区二区三区 | 国产伦一二天堂av在线观看| 我的女老师完整版在线观看| 麻豆精品久久久久久蜜桃| 日本成人三级电影网站| 国产精品精品国产色婷婷| 天堂网av新在线| 久久精品久久久久久噜噜老黄 | 国产在线精品亚洲第一网站| eeuss影院久久| 三级毛片av免费| 成人特级黄色片久久久久久久| 天美传媒精品一区二区| 久久久精品大字幕| 欧美日韩精品成人综合77777| 男人的好看免费观看在线视频| 两性午夜刺激爽爽歪歪视频在线观看| 国产国拍精品亚洲av在线观看| 亚洲avbb在线观看| 三级毛片av免费| 欧美绝顶高潮抽搐喷水| 国产高清视频在线观看网站| 蜜桃久久精品国产亚洲av| 亚洲精品一区av在线观看| 一本一本综合久久| 一个人看的www免费观看视频| 黄色视频,在线免费观看| 免费观看精品视频网站| 久久婷婷人人爽人人干人人爱| 国产69精品久久久久777片| 人妻夜夜爽99麻豆av| av视频在线观看入口| av在线亚洲专区| 国产黄a三级三级三级人| 极品教师在线视频| 日韩精品青青久久久久久| 午夜免费激情av| 黄色一级大片看看| 国内毛片毛片毛片毛片毛片| 日日摸夜夜添夜夜添小说| 免费电影在线观看免费观看| 又爽又黄无遮挡网站| 日本黄大片高清| 国产精品久久视频播放| 国产精品乱码一区二三区的特点| 国产一区二区三区在线臀色熟女| 亚洲在线观看片| 久久99热这里只有精品18| 又爽又黄无遮挡网站| 嫩草影视91久久| 俺也久久电影网| 免费av不卡在线播放| 成人特级av手机在线观看| 国产在视频线在精品| avwww免费| 亚洲精品456在线播放app | 日韩亚洲欧美综合| 熟妇人妻久久中文字幕3abv| 女生性感内裤真人,穿戴方法视频| 淫妇啪啪啪对白视频| 亚州av有码| 国产av一区在线观看免费| 免费看a级黄色片| 国产真实乱freesex| 亚洲第一区二区三区不卡| 最近最新免费中文字幕在线| 九九在线视频观看精品| 欧美激情在线99| 欧美+日韩+精品| 欧美一区二区国产精品久久精品| 窝窝影院91人妻| 五月玫瑰六月丁香| 久久久精品大字幕| 亚州av有码| 一卡2卡三卡四卡精品乱码亚洲| 日本五十路高清| 国产中年淑女户外野战色| 国产女主播在线喷水免费视频网站 | 亚洲人成伊人成综合网2020| 一区二区三区激情视频| 性插视频无遮挡在线免费观看| 最近最新中文字幕大全电影3| 国产三级中文精品| bbb黄色大片| 中国美白少妇内射xxxbb| 一区福利在线观看| 极品教师在线视频| 亚洲乱码一区二区免费版| 午夜激情福利司机影院| 日本免费一区二区三区高清不卡| 午夜老司机福利剧场| 久久精品国产亚洲av涩爱 | 婷婷亚洲欧美| 99九九线精品视频在线观看视频| 久久久久久久久中文| 亚洲性夜色夜夜综合| 免费一级毛片在线播放高清视频| 波多野结衣高清作品| 午夜精品一区二区三区免费看| 国产国拍精品亚洲av在线观看| 一本精品99久久精品77| 国产成年人精品一区二区| 老女人水多毛片| 精品午夜福利在线看| 一本精品99久久精品77| 亚洲综合色惰| 中文在线观看免费www的网站| 香蕉av资源在线| 又爽又黄a免费视频| 久久久久久伊人网av| 九色国产91popny在线| 亚州av有码| 亚洲欧美日韩高清在线视频| 91麻豆精品激情在线观看国产| 午夜久久久久精精品| 亚洲av美国av| 日本一本二区三区精品| 久久久久久久久久黄片| 欧美一级a爱片免费观看看| 国产成年人精品一区二区| 中文字幕久久专区| 国产一区二区亚洲精品在线观看| 成人一区二区视频在线观看| 国产黄a三级三级三级人| 成人精品一区二区免费| a级毛片a级免费在线| 亚洲国产日韩欧美精品在线观看| 国产精品精品国产色婷婷| 伦精品一区二区三区| 日韩欧美免费精品| 欧美+日韩+精品| 日本a在线网址| 看免费成人av毛片| 久久午夜福利片| 精品一区二区三区视频在线观看免费| 午夜福利视频1000在线观看| 亚洲中文字幕一区二区三区有码在线看| 午夜精品在线福利| 我的老师免费观看完整版| 亚洲国产色片| 中文字幕av成人在线电影| 久99久视频精品免费| 神马国产精品三级电影在线观看| 欧美3d第一页| 男女下面进入的视频免费午夜| 亚洲国产精品久久男人天堂| 久久99热这里只有精品18| 国产色爽女视频免费观看| 亚洲内射少妇av| 尾随美女入室| 亚洲av熟女| 国产乱人伦免费视频| 成人无遮挡网站| 国产一区二区三区视频了| 成人性生交大片免费视频hd| 午夜福利在线在线| 久久99热6这里只有精品| 18禁黄网站禁片免费观看直播| 国产久久久一区二区三区| 久久久久久久久大av| 欧美最黄视频在线播放免费| 中文字幕熟女人妻在线| 欧美激情国产日韩精品一区|