• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    子字粒度切分在蒙漢神經(jīng)機(jī)器翻譯中的應(yīng)用

    2019-02-25 05:31:50侯宏旭吉亞圖武子玉白天罡
    中文信息學(xué)報(bào) 2019年1期
    關(guān)鍵詞:蒙古文蒙漢漢文

    任 眾,侯宏旭,吉亞圖,武子玉,白天罡,雷 穎

    (內(nèi)蒙古大學(xué) 計(jì)算機(jī)學(xué)院,內(nèi)蒙古 呼和浩特 010021)

    0 引言

    蒙古語(yǔ)是中國(guó)少數(shù)民族蒙古族的語(yǔ)言,也是蒙古國(guó)的官方語(yǔ)言,所以蒙漢機(jī)器翻譯對(duì)于民族團(tuán)結(jié)以及中蒙交流都有著重要意義和價(jià)值。近年來(lái),統(tǒng)計(jì)機(jī)器翻譯[1]的發(fā)展進(jìn)入瓶頸期,深度學(xué)習(xí)[2]成為研究熱潮,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯成為機(jī)器翻譯研究的重要方向。

    蒙古語(yǔ)屬于黏著語(yǔ),其構(gòu)詞規(guī)則如圖1所示,一個(gè)蒙古語(yǔ)詞由一個(gè)詞根與多個(gè)詞綴組成。蒙漢機(jī)器翻譯存在雙語(yǔ)對(duì)齊語(yǔ)料不足、資源稀少等問(wèn)題。這使得數(shù)據(jù)稀疏問(wèn)題更加凸顯。因此本文想要通過(guò)對(duì)蒙漢雙語(yǔ)使用子字粒度的切分,來(lái)緩解數(shù)據(jù)稀疏問(wèn)題,以提升翻譯質(zhì)量。與此同時(shí),子字粒度切分縮小了雙語(yǔ)詞典的大小,降低了神經(jīng)網(wǎng)絡(luò)模型的計(jì)算復(fù)雜度,可以大大減少訓(xùn)練周期。

    圖1 蒙古文詞匯構(gòu)成

    本文使用CWMT2009[3]和CWMT2017蒙漢雙語(yǔ)語(yǔ)料,并在基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)的蒙漢神經(jīng)機(jī)器翻譯系統(tǒng)上進(jìn)行了子字粒度切分的多方面對(duì)比實(shí)驗(yàn)。

    1 蒙漢神經(jīng)翻譯模型

    1.1 RNN模型概述

    1.2 CNN模型概述

    在本文中,CNN系統(tǒng)采用Gehring等提出的架構(gòu)[8-9]的開(kāi)源CNN模型。該模型依然是由編碼器、解碼器和注意力機(jī)制三個(gè)部分組成,如圖2所示,其中編碼器和解碼器由多層卷積層組成,且每個(gè)卷積層之間加入線性門(mén)控單元(GLU)[10]和一個(gè)殘差連接[11]。該模型利用CNN卷積核獲取局部信息,并通過(guò)增加CNN卷積層數(shù)來(lái)獲取長(zhǎng)距離依賴信息,因此編碼器和解碼器均為多層的深層CNN,每層解碼器配備一個(gè)注意力機(jī)制。

    2 子字粒度切分

    在機(jī)器翻譯任務(wù)中,對(duì)語(yǔ)料的切分是語(yǔ)料預(yù)處理過(guò)程中非常重要的一步。句子所包含的特征,由多個(gè)局部特征共同組成。而在語(yǔ)料預(yù)處理階段,句子切分粒度越大,切分結(jié)果越能夠保存更完整的局部特征,但是加重了數(shù)據(jù)稀疏問(wèn)題;切分粒度越小,其包含局部特征越少,但是數(shù)據(jù)稀疏問(wèn)題會(huì)得到緩解。尤其在雙語(yǔ)資源相對(duì)匱乏的蒙漢機(jī)器翻譯任務(wù)中,切分粒度的把控尤為重要。

    子字粒度切分是將句子切分成介于詞和字之間的粒度大小,這樣的做法可以在一定程度上保留局部特征,同時(shí)盡可能減小粒度,從而緩解數(shù)據(jù)稀疏問(wèn)題,提高翻譯效果,同時(shí)縮小詞典規(guī)模,減少訓(xùn)練周期。

    2.1 子字切分算法(BPE)

    Sennrich等人[12]在2016年提出了一種使用Byte Pair Encoding(BPE)編碼[13]來(lái)處理文本切分粒度的方法。

    BPE算法的基本思路:首先將語(yǔ)料以最小單元(蒙古文是指蒙古文字母,漢文是指漢字)切分;然后統(tǒng)計(jì)語(yǔ)料中所有相鄰最小單元組合出現(xiàn)的頻數(shù);再找出頻數(shù)最大的組合;將最大組合合并后替換語(yǔ)料庫(kù)中原來(lái)組合;循環(huán)上面操作。

    傳統(tǒng)的中文分詞法是利用一個(gè)第三方詞典切分句子,而B(niǎo)PE算法切分子字,是通過(guò)統(tǒng)計(jì)自身語(yǔ)料中詞頻,獲得自身的詞典,再根據(jù)詞典切分句子。相較于傳統(tǒng)分詞處理,首先切分使用的詞典來(lái)源于自身訓(xùn)練集,因此在對(duì)測(cè)試集的切分粒度也會(huì)與訓(xùn)練集保持一致,從而間接減少集外詞的數(shù)量;更重要的是,BPE允許出現(xiàn)多粒度切分,即詞頻高的詞會(huì)被切分成詞,詞頻低的詞則會(huì)被切分成字,這樣可以在保留一部分局部信息的前提下,縮小詞典大小,間接緩解了數(shù)據(jù)稀疏問(wèn)題。

    BPE算法有兩種應(yīng)用方法:一是獨(dú)立BPE,即構(gòu)建兩個(gè)獨(dú)立詞典:一個(gè)源語(yǔ)言詞典,一個(gè)目標(biāo)語(yǔ)言詞典;二是聯(lián)合BPE,兩個(gè)語(yǔ)言放一塊,共同生成一個(gè)詞典。理論上后者效果好一點(diǎn),可以保證源語(yǔ)言和目標(biāo)語(yǔ)言分割的一致性。尤其表現(xiàn)在擁有共享字母表的兩種語(yǔ)言及同源詞和外來(lái)詞上。

    2.2 蒙漢子字切分

    蒙漢機(jī)器翻譯模型非常適合使用子字切分來(lái)提升翻譯效果。在子字切分時(shí),我們往往需要在目標(biāo)端語(yǔ)言中加入標(biāo)記符號(hào),用來(lái)還原詞,但是漢文中字、詞、短語(yǔ)的界限非常模糊,且最小單位字也能作為獨(dú)立的切分模塊,因此省去了標(biāo)記符號(hào),降低了噪聲;蒙古文是一種純粹的拼音文字[14],它是由蒙古文字母組成蒙古文詞,再組成蒙古文句子,因此子字粒度可以大大緩解數(shù)據(jù)稀疏,從而提升整體的翻譯效果。

    如表1所示,因?yàn)槠涿晒盼淖帜阜N類相對(duì)較少,因此在兩種切分粒度下(操作數(shù)指相鄰最小單元組合合并次數(shù),可以間接影響切分粒度,操作數(shù)越大,粒度相對(duì)越大)與原文比較變化不明顯;漢文可以明顯看到傳統(tǒng)分詞與BPE切分子字結(jié)果不同。子字粒度切分使得高頻詞得以保留,低頻詞切分為更小粒度的蒙文字母或高頻字母組合,緩解了數(shù)據(jù)稀疏問(wèn)題。

    表1 使用子字粒度切分蒙漢雙語(yǔ)對(duì)比

    同樣,如表2所示,我們?cè)贑WMT2009提供的6萬(wàn)句對(duì)的蒙漢雙語(yǔ)語(yǔ)料和CWMT2017蒙漢評(píng)測(cè)提供的26萬(wàn)句對(duì)的雙語(yǔ)語(yǔ)料上分別統(tǒng)計(jì)了不同切分粒度的詞典大小。蒙古文切詞處理,漢文分別切字(*_char)和切詞(*_word)處理對(duì)比使用BPE算法進(jìn)行蒙漢子字切分(*_BPE)處理,可以明顯看出蒙漢兩端詞典大小均有明顯減小;同時(shí),當(dāng)我們使用較大訓(xùn)練語(yǔ)料時(shí),詞典規(guī)模也會(huì)變大,從而增加了計(jì)算量。而子字切分的方式可以大大縮小詞典規(guī)模,來(lái)緩解這個(gè)問(wèn)題。

    表2 使用子字粒度切分蒙漢雙語(yǔ)詞典大小統(tǒng)計(jì)

    2.3 兩種BPE在蒙漢雙語(yǔ)上的應(yīng)用

    本文在2.1節(jié)介紹了使用BPE算法實(shí)現(xiàn)子字粒度切分有兩種方式:獨(dú)立BPE和聯(lián)合BPE。我們?cè)贑WMT2009的蒙漢雙語(yǔ)對(duì)齊語(yǔ)料上分別進(jìn)行了兩種切分,分析在蒙漢神經(jīng)機(jī)器翻譯任務(wù)中哪種子字切分方式更適合。

    圖3 CWMT2009不同操組數(shù)聯(lián)合詞典占比圖

    如圖3所示,我們分別進(jìn)行了操作數(shù)為5 000、20 000和40 000的聯(lián)合BPE切分實(shí)驗(yàn)。理論上,聯(lián)合BPE可以盡可能地保持源語(yǔ)言和目標(biāo)語(yǔ)言分割的一致性。但是我們看到操作數(shù)不同的情況下,聯(lián)合詞典中蒙漢的占比差距較大。蒙漢占比不相近,使得蒙漢在切分子字粒度時(shí)粒度不一致。我們分析認(rèn)為這與聯(lián)合BPE的優(yōu)勢(shì)并不矛盾,詞典占比不均的原因主要是蒙漢語(yǔ)言差異大,蒙古文是典型的拼音文字,而漢文字、詞、短語(yǔ)沒(méi)有明確分割界限,且作為蒙古文最小切分單元的蒙古文字母的數(shù)量遠(yuǎn)遠(yuǎn)少于漢文字。經(jīng)統(tǒng)計(jì)我們得知,蒙古文單詞平均由5個(gè)蒙古文字母組成,而漢文中絕大多數(shù)是二字詞。在BPE計(jì)算共現(xiàn)頻數(shù)時(shí),蒙古文字母組合頻數(shù)大,會(huì)優(yōu)先組合蒙古文。因此隨著操作數(shù)的增加,蒙古文高頻組合結(jié)合完成后,越來(lái)越多的漢文字組合才被加入到詞典中,蒙漢占比也越來(lái)越趨近于相等。

    我們將蒙漢占比較為平衡的40 000操作數(shù)的切分結(jié)果與原文進(jìn)行了對(duì)比,如表3所示。我們發(fā)現(xiàn)蒙古文中存在大量與原文一致的句子,而漢文中粒度卻參差不齊。因此,我們分析認(rèn)為使用聯(lián)合BPE進(jìn)行子字粒度切分,在蒙漢雙語(yǔ)語(yǔ)料上無(wú)法體現(xiàn)自身的優(yōu)勢(shì),而使用獨(dú)立BPE進(jìn)行子字粒度切分可以人為控制蒙漢雙語(yǔ)各自的切分粒度,達(dá)到最優(yōu)的切分結(jié)果,這樣子字粒度切分才會(huì)發(fā)揮出其應(yīng)有的效果。

    表3 40 000操作數(shù)蒙漢子字切分結(jié)果

    3 實(shí)驗(yàn)

    3.1 實(shí)驗(yàn)數(shù)據(jù)配置

    實(shí)驗(yàn)數(shù)據(jù)均基于CWMT2009的蒙漢雙語(yǔ)語(yǔ)料(6萬(wàn)句)和CWMT2017蒙漢評(píng)測(cè)提供的雙語(yǔ)語(yǔ)料(26萬(wàn)句)。漢文語(yǔ)料分詞處理采用中科院計(jì)算所開(kāi)發(fā)的ICTCLAS[15]中文分詞系統(tǒng)進(jìn)行切分,蒙古文和漢文均使用tokenizer[16]進(jìn)行詞語(yǔ)切分處理。BPE子字切分操作數(shù)均為最優(yōu)結(jié)果的經(jīng)驗(yàn)值。在本文中采用BLEU4[17]作為翻譯效果的評(píng)測(cè)指標(biāo)。

    由于蒙漢機(jī)器翻譯雙語(yǔ)語(yǔ)料有限,詞典本身就較小,因此我們的實(shí)驗(yàn)不限制詞典大小。本文想要通過(guò)對(duì)比子字粒度切分處理后詞典大小變化,并結(jié)合最終翻譯模型的BLEU值的提升,來(lái)驗(yàn)證子字粒度可以通過(guò)緩解數(shù)據(jù)稀疏問(wèn)題來(lái)提高模型翻譯質(zhì)量。

    本文使用CWMT2009的蒙漢雙語(yǔ)語(yǔ)料分別訓(xùn)練RNN和CNN兩個(gè)模型,且分別進(jìn)行了分詞和子字粒度切分等對(duì)比實(shí)驗(yàn),用來(lái)驗(yàn)證子字切分粒度的普適性,以及對(duì)模型的提升。其次,我們使用CWMT2017的語(yǔ)料訓(xùn)練RNN模型,與使用CWMT2009訓(xùn)練的RNN進(jìn)行對(duì)比,以驗(yàn)證子字粒度切分對(duì)數(shù)據(jù)稀疏的緩解和縮短訓(xùn)練周期的作用。

    實(shí)驗(yàn)使用的RNN和CNN模型是此前調(diào)優(yōu)的結(jié)果,本文所有實(shí)驗(yàn)均使用以下參數(shù):

    ① RNN模型,使用的Google 開(kāi)源的seq2seq系統(tǒng)作為RNN系統(tǒng)。系統(tǒng)參數(shù)如下:編碼器和解碼器均為4層的雙向LSTM循環(huán)單元[18],隱藏層節(jié)點(diǎn)數(shù)512,batchsize 128,dropout 0.3。

    ② CNN模型,使用的是Facebook AI Research 開(kāi)源系統(tǒng)fairseq作為CNN翻譯系統(tǒng)。系統(tǒng)參數(shù)如下:編碼器不少于5層和解碼器不少于9層,解碼器的每一層均配備一個(gè)注意力機(jī)制,編碼器和解碼器的核寬度不小于3,詞向量維度500,隱層單元數(shù)量不少于500,batchsize 32,訓(xùn)練算法Nesterov’s accelerated gradient (NAG)[19]。

    3.2 蒙漢雙語(yǔ)子字切分

    3.2.1 蒙古文子字粒度切分

    由于BPE操作數(shù)是個(gè)經(jīng)驗(yàn)值,不同的語(yǔ)言種類、語(yǔ)料大小最優(yōu)操作數(shù)也不同。

    本實(shí)驗(yàn)設(shè)置操作數(shù)為5 000、10 000、15 000、17 500和20 000,將蒙古文切分成子字粒度、漢文分詞,分別訓(xùn)練RNN模型,測(cè)試集BLEU值如圖4所示(橫坐標(biāo)為操作數(shù),縱坐標(biāo)為BLEU值)。最終得出該語(yǔ)料蒙古文的最優(yōu)操作數(shù)的經(jīng)驗(yàn)值為17 500。

    如表4所示,通過(guò)原文與最優(yōu)切分結(jié)果的對(duì)比,本文發(fā)現(xiàn),蒙古文子字切分粒度還是比較大的,與分詞差別不大。蒙古文詞構(gòu)成通常是由詞干和多個(gè)詞綴構(gòu)成[20]。結(jié)合蒙古文形態(tài)分析,我們認(rèn)為子字粒度切分其實(shí)相當(dāng)于蒙古文詞綴的切分,而最優(yōu)的切分結(jié)果能夠使得切分的蒙古文子字片段既保留了較為完整的局部信息,又提高出現(xiàn)頻率,從而緩解數(shù)據(jù)稀疏問(wèn)題。

    同理,經(jīng)過(guò)大量實(shí)驗(yàn),得到CWMT2017蒙古文獨(dú)立BPE的最優(yōu)操作數(shù)的經(jīng)驗(yàn)值為35 000左右。

    3.2.2 漢文子字粒度切分

    漢文與蒙古文差異較大,尤其是蒙古文有明確的分詞邊界,而漢文字、詞、短語(yǔ)界限模糊。因此我們想到兩種子字粒度切分方式,如圖5所示:一是漢文直接使用BPE算法切分子字;二是模擬蒙古文子字粒度切分方法,先進(jìn)行中文分詞處理,人為加入詞邊界,再使用BPE算法切分子字。

    圖5 漢文子字切分方法

    兩者相比,前者切分結(jié)果存在大于分詞的粒度,可能包含更多的局部特征,也可能破壞原本詞的局部特征。例如,“大學(xué) 生活”→“大學(xué)生活”或者“大學(xué)生”+“活”;后者切分結(jié)果的粒度一定小于分詞,不會(huì)破壞分詞前后信息。例如,“大學(xué) 生活”→“大學(xué)”+“生活”或者“大學(xué)”+“生”+“活”。

    如圖6所示,在保持蒙古文獨(dú)立BPE操作數(shù)為最優(yōu)操作數(shù)不變的基礎(chǔ)上,漢文使用第一種子字切分方法,操作數(shù)設(shè)置為500、1 000、1 500、2 000、2 500和5 000,分別訓(xùn)練RNN模型。當(dāng)操作數(shù)為1 000時(shí),模型效果最佳,BLEU值達(dá)到32.83。同理,我們使用第二種方法,操作數(shù)分別設(shè)置為1 000、2 000、3 000、5 000、7 000和10 000,可以看到當(dāng)操作數(shù)為5 000時(shí)模型效果最佳,BLEU值達(dá)到34.16。

    圖6 漢文兩種子字切分方法對(duì)比

    通過(guò)對(duì)比實(shí)驗(yàn)可以明顯看出漢文先進(jìn)行中文分詞,再進(jìn)行子字粒度切分的效果更好。同理,我們得到CWMT2017漢文獨(dú)立BPE的最優(yōu)操作數(shù)的經(jīng)驗(yàn)值為15 000左右。

    3.2.3 詞綴切分與BPE子字切分對(duì)比

    根據(jù)蒙古文形態(tài)分析發(fā)現(xiàn),理論上對(duì)蒙古文切分后綴也可以減小粒度,緩解數(shù)據(jù)稀疏問(wèn)題,因此通過(guò)規(guī)則和字典對(duì)蒙古文進(jìn)行了詞綴分析,用來(lái)作為子字切分的對(duì)比實(shí)驗(yàn)。根據(jù)蒙古文構(gòu)詞規(guī)則,得知改變構(gòu)詞后綴一般會(huì)改變?cè)撛~的詞義和語(yǔ)義,而改變構(gòu)形后綴只會(huì)改變?cè)~性,因此我們通過(guò)蒙古文構(gòu)詞規(guī)則和后綴字典對(duì)構(gòu)形后綴和結(jié)尾后綴進(jìn)行切分。

    如表5所示,從后綴切分與子字粒度切分實(shí)例對(duì)比可以發(fā)現(xiàn):子字粒度切分結(jié)果與兩種后綴切分結(jié)果相似。

    表5 子字切分與詞綴切分實(shí)例對(duì)比

    如表6所示,我們統(tǒng)計(jì)了CWMT2009語(yǔ)料上兩種后綴切分后詞典大小。可以看到,與原始語(yǔ)料相比,詞典大小明顯縮小,但是比子字粒度切分的詞典大。

    表6 子字切分與詞綴切分詞典大小統(tǒng)計(jì)

    如表7所示,因?yàn)樽幼至6惹蟹趾秃缶Y切分結(jié)果相近,因此在CWMT2009上的表現(xiàn)兩者也互有輸贏。我們分析認(rèn)為:兩者相比,后綴切分的優(yōu)勢(shì)在于切分準(zhǔn)確,不會(huì)破壞蒙古文詞本身。但是子字粒度切分優(yōu)勢(shì)在于它完全根據(jù)共現(xiàn)頻率來(lái)切分,不需要外部的規(guī)則和字典,且粒度可控,應(yīng)用更廣泛(漢文也可以使用)。

    表7 CWMT2009上的表現(xiàn)對(duì)比

    3.3 實(shí)驗(yàn)結(jié)果與分析

    表8可以看出,同為RNN模型,無(wú)論小語(yǔ)料庫(kù)(6w)還是大語(yǔ)料庫(kù)(26萬(wàn)),漢文分詞均不如漢文分字的模型效果好,但是隨著語(yǔ)料庫(kù)的擴(kuò)大,兩種粒度的差距從3.68縮小到了0.39。我們結(jié)合表2認(rèn)為,漢文分詞效果較差的原因并不是較大粒度本身帶來(lái)的,而是大粒度切分會(huì)放大小語(yǔ)料庫(kù)數(shù)據(jù)稀疏問(wèn)題,致使翻譯結(jié)果不理想。語(yǔ)料庫(kù)的擴(kuò)大,直接緩解數(shù)據(jù)稀疏問(wèn)題,因此漢文分詞與分字效果差距并不明顯。

    表8 RNN中不同語(yǔ)料大小與不同粒度結(jié)果對(duì)比

    如表9所示,蒙漢雙語(yǔ)均使用子字粒度切分的RNN模型效果最好,BLEU值達(dá)到了34.16,相比于蒙漢均分詞和蒙古文分詞,漢文分字的模型分別提升了4.81和1.13。

    表9 CWMT2009在RNN模型上的表現(xiàn)

    由于語(yǔ)料較小,訓(xùn)練周期本身不長(zhǎng),因此子字粒度切分雖然使得RNN模型訓(xùn)練周期縮短,但效果并不顯著。其中蒙漢雙語(yǔ)均使用子字粒度切分的模型訓(xùn)練周期最短。

    如表10所示,相同語(yǔ)料下,CNN模型對(duì)比效果與RNN模型相近,依然是蒙漢雙語(yǔ)均使用子字粒度切分的模型效果最好,BLEU值達(dá)到了35.28。因此子字粒度切分在不同模型中都能提高翻譯效果,且縮短訓(xùn)練周期,其普適性較高。

    表10 CWMT2009在CNN模型上的表現(xiàn)

    如表11所示,RNN模型在CWMT2017的26萬(wàn)語(yǔ)料下的表現(xiàn)。由于測(cè)試集使用的是日常用語(yǔ)領(lǐng)域的語(yǔ)料,而CWMT2017在日常用語(yǔ)的基礎(chǔ)上加入了大量政府文獻(xiàn)、法律等領(lǐng)域的語(yǔ)料,使得最終翻譯效果沒(méi)有CWMT2009上的理想。因此我們只能做同語(yǔ)料下不同處理方法之間的對(duì)比。

    表11 CWMT2017在RNN模型上的表現(xiàn)

    因此我們可以看到,蒙漢均使用子字粒度切分的模型翻譯效果提升依然顯著,且訓(xùn)練周期縮短更為明顯,縮短了三分之二。由此可見(jiàn)子字粒度切分隨著語(yǔ)料的擴(kuò)大,縮短訓(xùn)練周期的效果越來(lái)越顯著。

    4 總結(jié)

    實(shí)驗(yàn)從同語(yǔ)料不同模型和同模型不同語(yǔ)料兩個(gè)角度進(jìn)行驗(yàn)證,使用子字粒度切分,將低頻詞切分成相對(duì)高頻的子字片段,緩解數(shù)據(jù)稀疏問(wèn)題,可以使得多種模型翻譯效果得到顯著提升,且通過(guò)縮小詞典大小,顯著縮短訓(xùn)練周期。

    子字粒度切分技術(shù)在語(yǔ)料相對(duì)匱乏的前提下,主要是通過(guò)切分低頻詞,來(lái)緩解語(yǔ)料匱乏帶來(lái)的嚴(yán)重?cái)?shù)據(jù)稀疏問(wèn)題,從而提高蒙漢神經(jīng)機(jī)器翻譯的效果。詞典規(guī)模和網(wǎng)絡(luò)模型的訓(xùn)練周期隨著語(yǔ)料規(guī)模的增大而增加。我們通過(guò)限制詞典的大小來(lái)減少計(jì)算復(fù)雜度,但這會(huì)使得一部分原本在詞典中的低頻詞成為集外詞,影響翻譯質(zhì)量。子字粒度切分會(huì)將低頻詞切分成更小單元,這樣集外詞可以由粒度較小的子字單元拼接而成。因此子字粒度切分在大語(yǔ)料限制詞典大小的前提條件下,可以充分體現(xiàn)其減少集外詞的能力,來(lái)提高模型的翻譯效果。

    因此,在蒙漢神經(jīng)機(jī)器翻譯任務(wù)中,子字粒度切分技術(shù)無(wú)論在現(xiàn)在還是未來(lái)都是一個(gè)很有應(yīng)用價(jià)值的技術(shù)。

    猜你喜歡
    蒙古文蒙漢漢文
    《內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版)》征稿簡(jiǎn)則
    《內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版)》征稿簡(jiǎn)則
    樂(lè)器名稱漢文譯名小議
    《內(nèi)蒙古藝術(shù)》(蒙漢刊)首屆作者培訓(xùn)班掠影
    簡(jiǎn)論蒙漢蛇文化比較研究
    關(guān)于新發(fā)現(xiàn)的《字母匯編》(蒙古文)
    淺析關(guān)于蒙漢章回小說(shuō)的結(jié)構(gòu)
    《黑城出土漢文遺書(shū)敘錄》中TK133敘錄辨正
    西夏學(xué)(2017年1期)2017-10-24 05:32:10
    關(guān)于蒙古文在各種瀏覽器上顯示方法的探討
    略論Khandjamts夫人(基里爾蒙古文)
    婷婷精品国产亚洲av| 国产成人freesex在线| 欧美高清成人免费视频www| 长腿黑丝高跟| 99久久中文字幕三级久久日本| 可以在线观看毛片的网站| 成年女人永久免费观看视频| 爱豆传媒免费全集在线观看| 床上黄色一级片| 亚洲国产欧洲综合997久久,| 91av网一区二区| 精品人妻视频免费看| 免费看a级黄色片| 有码 亚洲区| 99久国产av精品国产电影| 精品久久久久久久久久久久久| 大香蕉久久网| 国产精品久久久久久精品电影| 最近中文字幕高清免费大全6| а√天堂www在线а√下载| 少妇熟女欧美另类| 国产伦在线观看视频一区| 91午夜精品亚洲一区二区三区| 精品午夜福利在线看| 久久午夜福利片| 三级毛片av免费| 嫩草影院新地址| 插阴视频在线观看视频| 一边亲一边摸免费视频| 国产精品人妻久久久影院| 天堂√8在线中文| 嫩草影院精品99| 国产一区二区三区在线臀色熟女| 乱系列少妇在线播放| 国产日韩欧美在线精品| 国产爱豆传媒在线观看| 舔av片在线| 亚洲欧美日韩高清专用| 亚洲成a人片在线一区二区| 欧美日韩乱码在线| 亚洲av中文字字幕乱码综合| 99久久中文字幕三级久久日本| 欧美bdsm另类| 久久精品国产自在天天线| 在线观看免费视频日本深夜| 一个人观看的视频www高清免费观看| 欧美成人a在线观看| 久久综合国产亚洲精品| 亚洲av熟女| 日本欧美国产在线视频| 久久人人爽人人片av| 久久久久久久久久久丰满| 99久久九九国产精品国产免费| 五月伊人婷婷丁香| 色播亚洲综合网| 中文字幕制服av| 99久久九九国产精品国产免费| avwww免费| 嫩草影院新地址| 嘟嘟电影网在线观看| 亚洲最大成人中文| 少妇丰满av| 卡戴珊不雅视频在线播放| 晚上一个人看的免费电影| 欧美激情国产日韩精品一区| 日韩欧美一区二区三区在线观看| 色播亚洲综合网| 亚洲久久久久久中文字幕| 免费无遮挡裸体视频| 最新中文字幕久久久久| 99riav亚洲国产免费| 国产大屁股一区二区在线视频| 女同久久另类99精品国产91| 国产精品三级大全| 亚洲一区高清亚洲精品| 国产精品99久久久久久久久| 亚洲欧洲国产日韩| av卡一久久| 久久精品国产亚洲av天美| av天堂中文字幕网| 天堂√8在线中文| 能在线免费观看的黄片| 不卡视频在线观看欧美| 亚洲av男天堂| 久久久国产成人免费| 国产激情偷乱视频一区二区| 亚洲自拍偷在线| 嫩草影院新地址| 午夜精品国产一区二区电影 | 99久久久亚洲精品蜜臀av| 又粗又硬又长又爽又黄的视频 | 成人亚洲欧美一区二区av| 美女国产视频在线观看| 国产黄色视频一区二区在线观看 | 日产精品乱码卡一卡2卡三| 嫩草影院精品99| 国产精品伦人一区二区| 国产精品一区二区三区四区免费观看| 国产精品人妻久久久影院| 国产人妻一区二区三区在| 99久久精品一区二区三区| 亚洲精品久久久久久婷婷小说 | 春色校园在线视频观看| 午夜视频国产福利| 少妇丰满av| 一级毛片我不卡| 精品久久久久久久久久免费视频| 久久99精品国语久久久| 成人无遮挡网站| 亚洲在线自拍视频| 日本免费一区二区三区高清不卡| 激情 狠狠 欧美| 久久久国产成人精品二区| 久久鲁丝午夜福利片| 亚洲欧美成人综合另类久久久 | 久久久久久久久久久丰满| 欧美成人免费av一区二区三区| 长腿黑丝高跟| 国国产精品蜜臀av免费| 国产黄色视频一区二区在线观看 | 99久国产av精品国产电影| 亚洲精品乱码久久久v下载方式| 大又大粗又爽又黄少妇毛片口| 亚洲,欧美,日韩| 亚洲成人av在线免费| 久久欧美精品欧美久久欧美| 草草在线视频免费看| 99久久中文字幕三级久久日本| 国产国拍精品亚洲av在线观看| av视频在线观看入口| 在线免费十八禁| 蜜桃亚洲精品一区二区三区| 日韩欧美在线乱码| www.色视频.com| 久久午夜亚洲精品久久| 欧美+日韩+精品| 黄片wwwwww| 97热精品久久久久久| 亚洲欧美日韩高清在线视频| 91av网一区二区| videossex国产| 免费观看精品视频网站| www日本黄色视频网| 日韩高清综合在线| 91精品一卡2卡3卡4卡| 26uuu在线亚洲综合色| 性色avwww在线观看| av专区在线播放| 人人妻人人澡欧美一区二区| 欧美激情在线99| 真实男女啪啪啪动态图| 最好的美女福利视频网| 日韩高清综合在线| 午夜视频国产福利| 国产精品久久久久久精品电影| 国产淫片久久久久久久久| 亚洲欧美成人精品一区二区| 日韩欧美一区二区三区在线观看| 人妻系列 视频| 九草在线视频观看| 麻豆国产97在线/欧美| 国产探花在线观看一区二区| 亚洲真实伦在线观看| 成人午夜高清在线视频| 大又大粗又爽又黄少妇毛片口| 国产三级在线视频| 久久九九热精品免费| 中文字幕av在线有码专区| 日韩欧美精品v在线| 精品久久久久久久末码| 久久久欧美国产精品| 久久精品国产自在天天线| 久久九九热精品免费| 日韩成人伦理影院| 午夜a级毛片| 99久久精品国产国产毛片| 啦啦啦观看免费观看视频高清| 国产午夜精品久久久久久一区二区三区| 少妇猛男粗大的猛烈进出视频 | av在线天堂中文字幕| 久久人人爽人人片av| 赤兔流量卡办理| 国产伦一二天堂av在线观看| 一进一出抽搐动态| 日本三级黄在线观看| 亚洲欧美成人精品一区二区| 成人亚洲欧美一区二区av| 亚洲欧美成人综合另类久久久 | 我要看日韩黄色一级片| 丝袜喷水一区| 男人舔女人下体高潮全视频| 亚洲四区av| 97超碰精品成人国产| 成人国产麻豆网| 国产亚洲av嫩草精品影院| 免费av观看视频| 亚洲美女视频黄频| 乱系列少妇在线播放| 国产亚洲精品av在线| 黄色一级大片看看| 美女 人体艺术 gogo| 午夜爱爱视频在线播放| 又爽又黄a免费视频| 国产精品一区二区在线观看99 | 免费av毛片视频| 天美传媒精品一区二区| 国产亚洲欧美98| 久久久久久久久中文| 久久精品人妻少妇| 男女边吃奶边做爰视频| 级片在线观看| 少妇人妻一区二区三区视频| 人妻少妇偷人精品九色| 日本成人三级电影网站| 欧美日韩乱码在线| 精品久久久久久久人妻蜜臀av| 看非洲黑人一级黄片| 熟女人妻精品中文字幕| 成人特级黄色片久久久久久久| 乱人视频在线观看| 日韩视频在线欧美| avwww免费| 国产麻豆成人av免费视频| 少妇高潮的动态图| 欧美性感艳星| 久久这里有精品视频免费| 热99在线观看视频| 嘟嘟电影网在线观看| 国产免费一级a男人的天堂| 校园人妻丝袜中文字幕| 精品久久久久久久人妻蜜臀av| 搡女人真爽免费视频火全软件| 最近的中文字幕免费完整| 网址你懂的国产日韩在线| 亚洲最大成人av| 亚洲国产精品国产精品| 免费观看a级毛片全部| 久久久久网色| 夜夜看夜夜爽夜夜摸| 一夜夜www| 日韩大尺度精品在线看网址| 99久久精品热视频| 人妻久久中文字幕网| 91午夜精品亚洲一区二区三区| 免费搜索国产男女视频| 国产又黄又爽又无遮挡在线| 99在线视频只有这里精品首页| 亚洲欧美清纯卡通| 女的被弄到高潮叫床怎么办| 国产激情偷乱视频一区二区| 久久精品人妻少妇| 91久久精品国产一区二区三区| 热99re8久久精品国产| 久久人妻av系列| 又粗又爽又猛毛片免费看| 中国美女看黄片| 内射极品少妇av片p| 99在线人妻在线中文字幕| 校园春色视频在线观看| 日韩欧美精品v在线| 在线免费十八禁| 变态另类成人亚洲欧美熟女| 卡戴珊不雅视频在线播放| 中国美白少妇内射xxxbb| 亚州av有码| 如何舔出高潮| 成人亚洲欧美一区二区av| 午夜亚洲福利在线播放| 91精品一卡2卡3卡4卡| 亚洲自偷自拍三级| 最近最新中文字幕大全电影3| 亚洲精品成人久久久久久| 男人和女人高潮做爰伦理| 精品久久久久久久人妻蜜臀av| 日日摸夜夜添夜夜添av毛片| 秋霞在线观看毛片| 真实男女啪啪啪动态图| 天堂中文最新版在线下载 | 亚洲国产精品合色在线| 亚洲国产精品sss在线观看| 精品免费久久久久久久清纯| 内地一区二区视频在线| 久久草成人影院| 亚洲人成网站在线播放欧美日韩| 亚洲18禁久久av| 中文字幕精品亚洲无线码一区| 欧美+日韩+精品| 99久久中文字幕三级久久日本| 欧美xxxx性猛交bbbb| 内射极品少妇av片p| 18禁黄网站禁片免费观看直播| 黄色视频,在线免费观看| 国产视频内射| 亚洲国产精品合色在线| 91麻豆精品激情在线观看国产| 久久国内精品自在自线图片| 欧美成人a在线观看| 久久99热6这里只有精品| 亚洲无线观看免费| av.在线天堂| 午夜福利在线观看免费完整高清在 | 一级毛片aaaaaa免费看小| 成人特级黄色片久久久久久久| 国产成人福利小说| 国产精品伦人一区二区| 免费看光身美女| 99在线人妻在线中文字幕| 国产一级毛片在线| 国产亚洲精品av在线| 日本色播在线视频| 亚洲va在线va天堂va国产| 午夜精品一区二区三区免费看| 国产精品一区二区性色av| 欧美一区二区国产精品久久精品| 国产视频内射| 赤兔流量卡办理| 此物有八面人人有两片| 亚洲精品国产成人久久av| 99久国产av精品| .国产精品久久| 国产高清视频在线观看网站| 欧美xxxx性猛交bbbb| 伦理电影大哥的女人| 亚洲国产欧美在线一区| 国产亚洲精品久久久com| 精品国内亚洲2022精品成人| 免费看a级黄色片| 亚洲aⅴ乱码一区二区在线播放| 日本一本二区三区精品| 男人舔奶头视频| 亚洲av熟女| 男女那种视频在线观看| 国产精品久久久久久亚洲av鲁大| 日本免费a在线| АⅤ资源中文在线天堂| 日韩亚洲欧美综合| 麻豆一二三区av精品| 欧美日韩精品成人综合77777| 一级毛片久久久久久久久女| 国产精品伦人一区二区| 黄色日韩在线| 国产黄a三级三级三级人| 亚洲精品久久国产高清桃花| 午夜视频国产福利| av国产免费在线观看| 国产老妇伦熟女老妇高清| 午夜免费男女啪啪视频观看| 亚洲欧美日韩无卡精品| 国产精品日韩av在线免费观看| 久久久久性生活片| 国产精品野战在线观看| 国产精品一区二区性色av| 久久精品综合一区二区三区| 欧美成人免费av一区二区三区| 人妻夜夜爽99麻豆av| 国产精品女同一区二区软件| 国产日本99.免费观看| 一个人看的www免费观看视频| 99热只有精品国产| 99热全是精品| 天天一区二区日本电影三级| 久久久久久久久久黄片| 久久国内精品自在自线图片| 中国美白少妇内射xxxbb| 91麻豆精品激情在线观看国产| 老司机影院成人| 国产成人freesex在线| 亚洲国产欧洲综合997久久,| 99热6这里只有精品| 天堂中文最新版在线下载 | 国产综合懂色| 在线免费观看的www视频| 国产高清三级在线| 亚洲内射少妇av| 国产精品野战在线观看| 狂野欧美激情性xxxx在线观看| 成人午夜精彩视频在线观看| 成人漫画全彩无遮挡| 91狼人影院| 天美传媒精品一区二区| 成年版毛片免费区| 六月丁香七月| 免费观看在线日韩| 人妻少妇偷人精品九色| 只有这里有精品99| 精品日产1卡2卡| av免费观看日本| 中文字幕制服av| 亚洲美女视频黄频| 国产高清三级在线| 色哟哟·www| 免费人成在线观看视频色| 亚洲av成人av| kizo精华| 嫩草影院新地址| 国产毛片a区久久久久| 国产精品久久久久久av不卡| 女同久久另类99精品国产91| 99在线视频只有这里精品首页| 男的添女的下面高潮视频| 狂野欧美白嫩少妇大欣赏| 亚洲精品久久久久久婷婷小说 | 天堂影院成人在线观看| 日韩三级伦理在线观看| 国产在线男女| 日本免费a在线| www.av在线官网国产| 天天躁日日操中文字幕| 中文亚洲av片在线观看爽| 99久久精品国产国产毛片| 成人毛片60女人毛片免费| 亚洲国产色片| 自拍偷自拍亚洲精品老妇| 国产v大片淫在线免费观看| avwww免费| 中文字幕人妻熟人妻熟丝袜美| 深夜精品福利| 人人妻人人看人人澡| 18禁在线播放成人免费| 黄色配什么色好看| 插阴视频在线观看视频| 欧美一区二区精品小视频在线| 在线免费观看不下载黄p国产| 自拍偷自拍亚洲精品老妇| 国产精品蜜桃在线观看 | 久久久国产成人精品二区| 看非洲黑人一级黄片| 在线播放国产精品三级| 国产男人的电影天堂91| 国产亚洲精品av在线| 国产黄片视频在线免费观看| 精品不卡国产一区二区三区| 国产老妇伦熟女老妇高清| 成人亚洲欧美一区二区av| 日日干狠狠操夜夜爽| 国产精品.久久久| 亚洲aⅴ乱码一区二区在线播放| 中国美白少妇内射xxxbb| 亚洲精品粉嫩美女一区| 97超碰精品成人国产| 国产黄片视频在线免费观看| 亚洲人成网站在线播放欧美日韩| 国产精品美女特级片免费视频播放器| 国产三级在线视频| 亚洲不卡免费看| 国产精品国产三级国产av玫瑰| 可以在线观看毛片的网站| 欧美性感艳星| 夫妻性生交免费视频一级片| 国产真实乱freesex| 最好的美女福利视频网| 国产久久久一区二区三区| 日韩三级伦理在线观看| kizo精华| 国产精品久久久久久av不卡| 悠悠久久av| 成人永久免费在线观看视频| 深夜精品福利| 精品人妻一区二区三区麻豆| 国内揄拍国产精品人妻在线| 色视频www国产| 神马国产精品三级电影在线观看| 男人和女人高潮做爰伦理| 亚洲成人av在线免费| 色播亚洲综合网| 国内精品一区二区在线观看| 人体艺术视频欧美日本| 在线免费观看的www视频| 人妻久久中文字幕网| 99国产极品粉嫩在线观看| 人妻少妇偷人精品九色| 中文字幕av成人在线电影| 美女 人体艺术 gogo| 99国产极品粉嫩在线观看| 韩国av在线不卡| 波多野结衣高清无吗| 美女 人体艺术 gogo| av在线蜜桃| 人妻少妇偷人精品九色| 91久久精品电影网| 可以在线观看的亚洲视频| 日韩欧美 国产精品| 久久久国产成人免费| 日本免费一区二区三区高清不卡| 最近的中文字幕免费完整| 亚洲激情五月婷婷啪啪| 欧美xxxx性猛交bbbb| 22中文网久久字幕| 国产老妇伦熟女老妇高清| 天堂中文最新版在线下载 | 国产黄片视频在线免费观看| 伦精品一区二区三区| 欧美日韩乱码在线| 久久久久久久久久成人| 偷拍熟女少妇极品色| 国产在线男女| 久久久久久久午夜电影| 99久久精品一区二区三区| 有码 亚洲区| 成人一区二区视频在线观看| 99热只有精品国产| 国产精品麻豆人妻色哟哟久久 | 少妇熟女aⅴ在线视频| 日韩成人av中文字幕在线观看| 成人永久免费在线观看视频| 欧美一区二区亚洲| av在线亚洲专区| 少妇裸体淫交视频免费看高清| 伦理电影大哥的女人| videossex国产| 亚洲电影在线观看av| 麻豆成人午夜福利视频| 欧美+亚洲+日韩+国产| 99热这里只有是精品在线观看| 免费看a级黄色片| 国产精品蜜桃在线观看 | 久99久视频精品免费| 大型黄色视频在线免费观看| 亚洲欧美日韩高清专用| 日韩人妻高清精品专区| 一级黄片播放器| 国产 一区精品| 欧美成人精品欧美一级黄| 人人妻人人澡欧美一区二区| 欧美色欧美亚洲另类二区| 亚洲乱码一区二区免费版| 99热6这里只有精品| 亚洲精品日韩在线中文字幕 | 男的添女的下面高潮视频| 日韩 亚洲 欧美在线| 日韩精品青青久久久久久| 人妻系列 视频| 日韩欧美精品v在线| 如何舔出高潮| 国产蜜桃级精品一区二区三区| 国产高清三级在线| 少妇裸体淫交视频免费看高清| 亚洲电影在线观看av| 性欧美人与动物交配| 国产一区亚洲一区在线观看| 亚洲在久久综合| 欧美色视频一区免费| 国产一区二区在线观看日韩| 国产伦精品一区二区三区四那| 免费搜索国产男女视频| 国产三级中文精品| 中文在线观看免费www的网站| a级毛片a级免费在线| 国产老妇女一区| 美女高潮的动态| av又黄又爽大尺度在线免费看 | 全区人妻精品视频| 国产69精品久久久久777片| 日韩欧美三级三区| 国产成人freesex在线| 国产片特级美女逼逼视频| 国产一区二区在线观看日韩| 免费一级毛片在线播放高清视频| 亚洲高清免费不卡视频| 久久99精品国语久久久| 亚洲人成网站高清观看| а√天堂www在线а√下载| 一区二区三区高清视频在线| 亚洲国产精品久久男人天堂| 听说在线观看完整版免费高清| 国产老妇女一区| 又爽又黄无遮挡网站| 99在线人妻在线中文字幕| 久久久久久久久久久免费av| 麻豆乱淫一区二区| 深夜精品福利| 欧美激情久久久久久爽电影| 久久精品夜色国产| 国产精品免费一区二区三区在线| av在线亚洲专区| 好男人在线观看高清免费视频| avwww免费| 亚洲成av人片在线播放无| 嫩草影院入口| 国产亚洲5aaaaa淫片| 国产日韩欧美在线精品| 丝袜美腿在线中文| 2022亚洲国产成人精品| 亚洲av成人精品一区久久| 两个人视频免费观看高清| 亚洲激情五月婷婷啪啪| 国产又黄又爽又无遮挡在线| 69人妻影院| 久久热精品热| 国产大屁股一区二区在线视频| 嫩草影院新地址| 中文字幕av成人在线电影| 午夜久久久久精精品| 免费看美女性在线毛片视频| 国产高潮美女av| 尤物成人国产欧美一区二区三区| 一级二级三级毛片免费看| 1000部很黄的大片| 欧美高清性xxxxhd video| 一级二级三级毛片免费看| 亚洲成人久久性| 在线播放国产精品三级| 天美传媒精品一区二区| 日韩av不卡免费在线播放| 中文在线观看免费www的网站| 91在线精品国自产拍蜜月| 日韩一本色道免费dvd| 十八禁国产超污无遮挡网站| 色播亚洲综合网| 村上凉子中文字幕在线| 亚洲三级黄色毛片| 99久久无色码亚洲精品果冻| 日本与韩国留学比较| 成人欧美大片| 夜夜爽天天搞|