• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于目標(biāo)語(yǔ)言預(yù)訓(xùn)練和聯(lián)合解碼的低資源語(yǔ)言端到端語(yǔ)音翻譯

    2023-02-04 08:22:48朱麗平趙小兵仁曾卓瑪王燕敏
    中文信息學(xué)報(bào) 2023年12期
    關(guān)鍵詞:語(yǔ)言模型

    李 寧,朱麗平,趙小兵,仁曾卓瑪,王燕敏

    (1. 中央民族大學(xué) 信息工程學(xué)院,北京 100081;2. 中央民族大學(xué) 國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究少數(shù)民族語(yǔ)言中心,北京 100081;3. 中央民族大學(xué) 民族語(yǔ)言智能分析與安全治理教育部重點(diǎn)實(shí)驗(yàn)室,北京 100081)

    0 引言

    自動(dòng)語(yǔ)音翻譯(Automatic Speech Translation,AST)可以將源語(yǔ)言語(yǔ)音轉(zhuǎn)換為目標(biāo)語(yǔ)言文字[1],促進(jìn)世界各地不同語(yǔ)言的人的交流。目前,AST有兩種實(shí)現(xiàn)方式: 級(jí)聯(lián)方式和端到端方式。級(jí)聯(lián)方式使用自動(dòng)語(yǔ)音識(shí)別(Automatic Speech Recognition,ASR)模塊級(jí)聯(lián)機(jī)器翻譯(Machine Translation,MT)模塊構(gòu)建AST系統(tǒng),其中ASR模塊將源語(yǔ)言語(yǔ)音轉(zhuǎn)換為源語(yǔ)言文字,后續(xù)MT模塊將源語(yǔ)言文字轉(zhuǎn)換為目標(biāo)語(yǔ)言文字[2],進(jìn)而實(shí)現(xiàn)語(yǔ)音翻譯。級(jí)聯(lián)方式不需要專用的AST數(shù)據(jù)集,即源語(yǔ)言語(yǔ)音到目標(biāo)語(yǔ)言文字?jǐn)?shù)據(jù)集,就可實(shí)現(xiàn)語(yǔ)音翻譯。ASR和MT的技術(shù)現(xiàn)在都很成熟,具有很高的準(zhǔn)確率。但是級(jí)聯(lián)語(yǔ)音翻譯容易發(fā)生誤差傳播現(xiàn)象[3],同時(shí)級(jí)聯(lián)方式不適用于沒(méi)有書(shū)面形式的口語(yǔ),因?yàn)樗枰凑Z(yǔ)言文字作為中間數(shù)據(jù)[4]。端到端方式直接將源語(yǔ)言語(yǔ)音轉(zhuǎn)換為目標(biāo)語(yǔ)言文本,解決了誤差傳播的問(wèn)題,并且具有較低的延遲[3]。此外,它繞過(guò)了級(jí)聯(lián)法所需的平行源語(yǔ)言文本的要求,是語(yǔ)音翻譯的新趨勢(shì)。與級(jí)聯(lián)方式相比,端到端方式在數(shù)據(jù)量足夠的情況下具有更好的語(yǔ)音翻譯結(jié)果[5]。

    目前端到端AST的研究主要集中在多任務(wù)[2,6-7]、多語(yǔ)言[8-10]、預(yù)訓(xùn)練[6,11-15]、數(shù)據(jù)增強(qiáng)[16]、元學(xué)習(xí)[17-18],使用其他聲音表示[19-20],添加額外的副語(yǔ)言信息,如押韻[21]、強(qiáng)調(diào)[22]、情感等方法上。雖然使用端到端方式原則上不需要源語(yǔ)言文本,但目前語(yǔ)音翻譯數(shù)據(jù)集太小,數(shù)據(jù)稀缺嚴(yán)重,因此使用上述大多數(shù)方法往往需要源語(yǔ)言ASR數(shù)據(jù)集來(lái)提供必要的信息,有些還需要包含副語(yǔ)言信息的特定數(shù)據(jù)集。源語(yǔ)言ASR數(shù)據(jù)或副語(yǔ)言信息數(shù)據(jù)集的缺乏,限制了這些方法在低資源語(yǔ)言中的應(yīng)用。

    對(duì)于AST中使用的預(yù)訓(xùn)練方法,大多數(shù)端到端研究都預(yù)訓(xùn)練ASR模塊和MT模塊以獲得ASR信息和MT信息,這些信息用于為AST提供良好的初始參數(shù),從而提高AST的性能。MSperber指出,預(yù)訓(xùn)練方法優(yōu)于多任務(wù)[23]。

    上述方法不適用于稀缺語(yǔ)言的語(yǔ)音翻譯。端到端語(yǔ)音翻譯需要大量數(shù)據(jù)來(lái)訓(xùn)練模型,但是對(duì)于稀缺語(yǔ)言來(lái)說(shuō)可用的語(yǔ)音數(shù)據(jù)量有限。

    本論文的貢獻(xiàn)主要有以下幾點(diǎn):

    第一,使用目標(biāo)語(yǔ)言ASR數(shù)據(jù)集預(yù)訓(xùn)練模型,與使用端到端數(shù)據(jù)直接訓(xùn)練翻譯模型相比,提高了AST的性能,促進(jìn)了模型收斂。目標(biāo)語(yǔ)言領(lǐng)域的語(yǔ)音識(shí)別數(shù)據(jù)集用于預(yù)訓(xùn)練模型,模型可以學(xué)習(xí)到目標(biāo)語(yǔ)言的語(yǔ)言信息,與源語(yǔ)言預(yù)訓(xùn)練相比,無(wú)須添加額外的語(yǔ)言模型。同時(shí),目標(biāo)語(yǔ)言預(yù)訓(xùn)練模型可以使用相同的預(yù)訓(xùn)練模型快速開(kāi)展多種源語(yǔ)言到目標(biāo)語(yǔ)言的研究任務(wù),縮短開(kāi)發(fā)時(shí)間。這使得模型能夠適應(yīng)多種稀缺語(yǔ)言到目標(biāo)語(yǔ)言的翻譯需求,提高了實(shí)用性。

    第二,使用目標(biāo)語(yǔ)言預(yù)訓(xùn)練的端到端模型作為基線模型,用映射模塊替代端到端模型中的編碼器結(jié)構(gòu),使源語(yǔ)言特征與目標(biāo)語(yǔ)言特征建立聯(lián)系,模型學(xué)習(xí)到從源語(yǔ)言語(yǔ)音到目標(biāo)語(yǔ)言文字的關(guān)聯(lián),改進(jìn)了語(yǔ)音翻譯效果。本文方法在20h的維吾爾語(yǔ)-漢語(yǔ)數(shù)據(jù)集上實(shí)現(xiàn)了61.45的BLEU值。

    第三,受端到端語(yǔ)音識(shí)別的啟發(fā),本文使用CTC和注意力機(jī)制解碼器聯(lián)合解碼,強(qiáng)制對(duì)齊語(yǔ)音和標(biāo)簽,進(jìn)一步提高BLEU值。

    1 數(shù)據(jù)集構(gòu)建

    數(shù)據(jù)集是端到端AST的基礎(chǔ)。目前,AST領(lǐng)域存在嚴(yán)重的數(shù)據(jù)集稀缺問(wèn)題。國(guó)際AST數(shù)據(jù)集主要集中在英語(yǔ)上,例如,英語(yǔ)語(yǔ)音到中文文本數(shù)據(jù)集。盡管中國(guó)對(duì)中國(guó)少數(shù)民族語(yǔ)言的語(yǔ)音翻譯需求很大,但相關(guān)的AST數(shù)據(jù)集幾乎是空白。

    本文使用機(jī)器翻譯和人工校對(duì)相結(jié)合的半自動(dòng)化方法,基于現(xiàn)有的公開(kāi)數(shù)據(jù)集THUYG-20[24]構(gòu)建了一個(gè)包含20h維吾爾語(yǔ)語(yǔ)音的維吾爾語(yǔ)-漢語(yǔ)AST數(shù)據(jù)集。半自動(dòng)數(shù)據(jù)集構(gòu)建流程如圖1所示。與通過(guò)現(xiàn)有ASR數(shù)據(jù)集的機(jī)器轉(zhuǎn)錄或現(xiàn)有MT數(shù)據(jù)集的語(yǔ)音合成的全自動(dòng)方法相比,專家校驗(yàn)步驟確保了數(shù)據(jù)質(zhì)量,提高了可靠性。

    圖1 維漢數(shù)據(jù)集構(gòu)建流程

    2 預(yù)訓(xùn)練模型

    2.1 預(yù)訓(xùn)練方法

    預(yù)訓(xùn)練AST模型的常規(guī)方法如圖2所示。首先,如圖2(a)所示使用源語(yǔ)言的ASR數(shù)據(jù)集對(duì)ASR編碼器和解碼器進(jìn)行預(yù)訓(xùn)練。然后如圖2(b)所示,使用從源語(yǔ)言文本到目標(biāo)語(yǔ)言文本的MT數(shù)據(jù)集對(duì)MT編碼器和解碼器進(jìn)行預(yù)訓(xùn)練。最后,如圖2(c)所示,將預(yù)訓(xùn)練的ASR編碼器、ASR解碼器、MT編碼器和MT解碼器全部或部分作為初始AST模型框架,使用AST數(shù)據(jù)集對(duì)其進(jìn)行微調(diào),將源語(yǔ)言語(yǔ)音作為AST模型的輸入,將目標(biāo)語(yǔ)言文本作為輸出。例如,MSperber使用ASR編碼器、ASR解碼器、MT編碼器和MT解碼器的結(jié)構(gòu)構(gòu)建了端到端的AST模型[5],而Kano使用ASR編碼器和MT解碼器的組合結(jié)構(gòu)訓(xùn)練了AST模型[4]。

    圖2 預(yù)訓(xùn)練語(yǔ)音翻譯模型

    上述預(yù)訓(xùn)練方法在ASR模型和MT模型的訓(xùn)練過(guò)程中都需要使用大規(guī)模的源語(yǔ)言數(shù)據(jù)集。采用這種方法構(gòu)建AST端到端模型,需要提前構(gòu)建ASR和MT模型,需要大規(guī)模的源語(yǔ)言數(shù)據(jù)集和大量的計(jì)算資源進(jìn)行訓(xùn)練,不適合低資源語(yǔ)言。使用源語(yǔ)言語(yǔ)音識(shí)別數(shù)據(jù)集訓(xùn)練ASR模型來(lái)構(gòu)建AST模型,AST模型提前學(xué)習(xí)到的是源語(yǔ)言語(yǔ)言模型。在源語(yǔ)言預(yù)訓(xùn)練的端到端語(yǔ)音翻譯模型中,翻譯模型是基于源語(yǔ)言的,因此在翻譯時(shí),模型可能無(wú)法處理目標(biāo)語(yǔ)言中的一些復(fù)雜語(yǔ)法或特定語(yǔ)言結(jié)構(gòu),導(dǎo)致翻譯不準(zhǔn)確,需要添加額外的語(yǔ)言模型。

    使用目標(biāo)語(yǔ)言預(yù)訓(xùn)練模型可以提高翻譯的準(zhǔn)確率,因?yàn)槟P蜁?huì)對(duì)目標(biāo)語(yǔ)言中的語(yǔ)法和結(jié)構(gòu)有更好的理解,更容易捕捉到語(yǔ)言之間的差異。此外,由于目標(biāo)語(yǔ)言是翻譯的最終目的地,因此該方法更注重目標(biāo)語(yǔ)言的質(zhì)量。目標(biāo)語(yǔ)言數(shù)據(jù)集通常規(guī)模大、質(zhì)量高,對(duì)語(yǔ)音翻譯模型更有幫助。

    以維吾爾語(yǔ)和漢語(yǔ)為例,源語(yǔ)言與目標(biāo)語(yǔ)言之間在語(yǔ)言學(xué)上存在差距。維吾爾語(yǔ)和漢語(yǔ)屬于不同的語(yǔ)系,對(duì)語(yǔ)境的依賴程度不同。從語(yǔ)境來(lái)看,維吾爾語(yǔ)屬于阿爾泰-突厥語(yǔ)系,構(gòu)詞和構(gòu)詞的附加成分非常豐富。名詞有數(shù)、人稱、格等語(yǔ)法范疇,動(dòng)詞有語(yǔ)氣、肯定否定、時(shí)態(tài)、人稱、數(shù)、動(dòng)詞、動(dòng)名詞、副詞等語(yǔ)法范疇,表達(dá)各種情態(tài)的助動(dòng)詞也很發(fā)達(dá)。詞匯本身可以傳達(dá)足夠的信息,較少依賴上下文。漢語(yǔ)屬于漢藏語(yǔ)系,漢語(yǔ)單詞的語(yǔ)音、語(yǔ)義和語(yǔ)法的確定在很大程度上取決于語(yǔ)境,需要結(jié)合語(yǔ)境才能準(zhǔn)確理解。沒(méi)有特定的語(yǔ)境,不僅無(wú)法確定詞的讀音,也無(wú)法確定詞的語(yǔ)義[25]。

    使用目標(biāo)語(yǔ)言預(yù)訓(xùn)練已經(jīng)包含了目標(biāo)語(yǔ)言的語(yǔ)言信息,無(wú)須添加額外的語(yǔ)言模型,減少了計(jì)算資源的消耗。與源語(yǔ)言預(yù)訓(xùn)練模型相比,目標(biāo)語(yǔ)言預(yù)訓(xùn)練模型更容易調(diào)整以滿足特定場(chǎng)景或用戶需求。同時(shí)可以針對(duì)特定領(lǐng)域或術(shù)語(yǔ)進(jìn)行優(yōu)化,提高翻譯質(zhì)量和可用性,使用相同的預(yù)訓(xùn)練模型,只需要在不同的AST數(shù)據(jù)集上進(jìn)行微調(diào)即可實(shí)現(xiàn)高質(zhì)量的語(yǔ)音翻譯。目標(biāo)語(yǔ)言預(yù)訓(xùn)練模型只需要預(yù)訓(xùn)練一種語(yǔ)言,與源語(yǔ)言預(yù)訓(xùn)練模型相比,訓(xùn)練所需的計(jì)算資源和時(shí)間會(huì)減少。

    2.2 映射結(jié)構(gòu)

    如圖3所見(jiàn),在遷移學(xué)習(xí)之前,使用目標(biāo)語(yǔ)言ASR數(shù)據(jù)集預(yù)訓(xùn)練的端到端模型,編碼器-解碼器結(jié)構(gòu)充分學(xué)習(xí)目標(biāo)語(yǔ)言語(yǔ)音知識(shí)。其中編碼器結(jié)構(gòu)學(xué)習(xí)目標(biāo)語(yǔ)言語(yǔ)音知識(shí),解碼器結(jié)構(gòu)學(xué)習(xí)目標(biāo)語(yǔ)言語(yǔ)言學(xué)知識(shí)。在新構(gòu)建的AST端到端語(yǔ)音模型中,期望學(xué)習(xí)到源語(yǔ)言語(yǔ)音知識(shí)以及目標(biāo)語(yǔ)言語(yǔ)言學(xué)知識(shí)。由此可見(jiàn),在使用目標(biāo)語(yǔ)言ASR數(shù)據(jù)集預(yù)訓(xùn)練的端到端模型中,編碼器結(jié)構(gòu)對(duì)于構(gòu)建AST端到端語(yǔ)音翻譯模型作用較小,因其無(wú)法提供源語(yǔ)言語(yǔ)音知識(shí),而解碼器結(jié)構(gòu)則很有用,因其包含了目標(biāo)語(yǔ)言文本信息。為此,需要添加一個(gè)映射模塊來(lái)學(xué)習(xí)源語(yǔ)言語(yǔ)音知識(shí),從而使源語(yǔ)言語(yǔ)音和目標(biāo)語(yǔ)言文本相關(guān)聯(lián)。保留ASR預(yù)訓(xùn)練模型中的解碼器,并添加學(xué)習(xí)了源語(yǔ)言語(yǔ)音的映射模塊,就可以實(shí)現(xiàn)端到端的源語(yǔ)言語(yǔ)音到目標(biāo)語(yǔ)言文本的語(yǔ)音翻譯模型。

    圖3 語(yǔ)音翻譯模型

    令X為輸入語(yǔ)音數(shù)據(jù)。在語(yǔ)音識(shí)別模型中,X通過(guò)ASR Encoder成為語(yǔ)音高級(jí)表示X1,X1通過(guò)ASR Decoder得到語(yǔ)音識(shí)別輸出YASR。在語(yǔ)音翻譯模型中,X通過(guò)AST Encoder轉(zhuǎn)化為語(yǔ)音高級(jí)表示X2,X2通過(guò)ASR Decoder得到語(yǔ)音翻譯輸出YAST。AST編碼器使用Conformer模塊,AST解碼器使用Transformer[26]模塊。

    2.3 聯(lián)合解碼

    受端到端語(yǔ)音識(shí)別混合模型[27-28]的啟發(fā),基于鏈接時(shí)序性(Connectionist Temporal Classification,CTC)和基于注意力的編碼器-解碼器(Attention-based Encoder-Decoder, AED)模型的聯(lián)合訓(xùn)練,相對(duì)于單一的注意力模型,CTC的前向-后向算法被用來(lái)進(jìn)行語(yǔ)音和標(biāo)簽之間的強(qiáng)制對(duì)齊,加速了對(duì)齊過(guò)程,可以改善注意力機(jī)制在長(zhǎng)文本上的效果。注意力機(jī)制關(guān)注的目標(biāo)是字符集,CTC的目標(biāo)在序列層面,注意力機(jī)制與CTC聯(lián)合有助于提高CTC目標(biāo)的準(zhǔn)確率。如圖4所示,模型結(jié)構(gòu)由三部分組成: 共享編碼器、CTC解碼器和Attention解碼器。共享編碼器由多個(gè)Transformer層組成,只需要有限地考慮上下文即可保持平衡的延遲。CTC解碼器由一個(gè)線性層組成,通過(guò)CTC激活對(duì)共享編碼器的輸出進(jìn)行變換,而注意力解碼器由多個(gè)Transformer解碼器層組成。使用交叉損失標(biāo)準(zhǔn)對(duì)分?jǐn)?shù)進(jìn)行聯(lián)合評(píng)分,從而提高了魯棒性。

    圖4 聯(lián)合解碼

    L(X,Y)=λLCTC(X,Y)+(1-λ)LAED(X,Y)

    (5)

    其中,X是語(yǔ)音特征,Y是相應(yīng)的標(biāo)簽,LCTC(X,Y)和LAED(X,Y)分別是CTC和AED損失,λ是平衡CTC和AED損失重要性的超參數(shù)。

    3 實(shí)驗(yàn)

    本文分別使用第2節(jié)中構(gòu)建的維吾爾語(yǔ)-漢語(yǔ)數(shù)據(jù)集以及圖3和圖4中所示的端到端AST模型進(jìn)行語(yǔ)音翻譯實(shí)驗(yàn)。本文使用了AMD EPYC 7402 @2.8 GHz CPU和NVIDIA RTX3090的24 GB GPU訓(xùn)練。微調(diào)模型迭代次數(shù)僅僅只需16次左右就可完全收斂,在4 h內(nèi)即可完成訓(xùn)練。

    3.1 模型參數(shù)

    實(shí)驗(yàn)中采用的端到端AST模型的參數(shù)如下: 使用12個(gè)編碼器層,編碼器嵌入維度為2 048,4個(gè)注意力頭,6個(gè)解碼器層,解碼器嵌入維度為2 048,dropout為0.1。該模型使用Fbank特征,初始學(xué)習(xí)率為0.002。

    3.2 Conformer

    與Transformer相比,Conformer結(jié)合了Transformer和CNN的優(yōu)點(diǎn)。前者擅長(zhǎng)利用注意力機(jī)制捕捉基于內(nèi)容的全局交互,而后者則有效地利用了局部特征的建模能力。它在ASR領(lǐng)域的LibriSpeech數(shù)據(jù)集上取得了非常好的結(jié)果,在小模型上也取得了很好的結(jié)果,例如,參數(shù)為10M數(shù)量級(jí)的模型,顯示了Conformer結(jié)構(gòu)的優(yōu)勢(shì)[29]。因此,將其應(yīng)用于AST領(lǐng)域。

    3.3 實(shí)驗(yàn)結(jié)果

    本文發(fā)現(xiàn),用小規(guī)模的AST數(shù)據(jù)集(包含20 h源語(yǔ)音)直接訓(xùn)練如圖3所示的端到端AST模型,則模型效果極差,因其無(wú)法學(xué)習(xí)到有價(jià)值的知識(shí),無(wú)法執(zhí)行端到端AST任務(wù)。因此,對(duì)不使用目標(biāo)語(yǔ)言直接訓(xùn)練、基于目標(biāo)語(yǔ)言預(yù)訓(xùn)練的端到端模型、添加了映射模塊的端到端模型和聯(lián)合解碼端到端模型進(jìn)行了對(duì)比實(shí)驗(yàn),分別記錄為傳統(tǒng)Conformer、遷移學(xué)習(xí)Conformer、Conformer-add和Conformer-combined。同時(shí)引入了M2M模型[8]作為對(duì)比實(shí)驗(yàn),并在M2M基礎(chǔ)上對(duì)其基于目標(biāo)語(yǔ)言進(jìn)行了遷移學(xué)習(xí),分別記錄為M2M和遷移學(xué)習(xí)M2M。在實(shí)驗(yàn)中,使用了兩個(gè)評(píng)估指標(biāo)CER和BLEU,來(lái)比較AST在數(shù)據(jù)集上的性能。

    表1展示了使用目標(biāo)語(yǔ)言預(yù)訓(xùn)練模型取得的優(yōu)異成績(jī),在20 h的維漢數(shù)據(jù)集上,使用遷移學(xué)習(xí)Conformer,獲得了28.63的CER值和61.45的BLEU 4分?jǐn)?shù),相較于不使用遷移,學(xué)習(xí)有了提升。同時(shí)在M2M模型中使用目標(biāo)語(yǔ)言遷移學(xué)習(xí),也可以改善語(yǔ)音翻譯效果。

    表1 預(yù)訓(xùn)練實(shí)驗(yàn)結(jié)果

    圖5是預(yù)訓(xùn)練和微調(diào)后解碼器結(jié)構(gòu)中Attention模塊公共部分權(quán)重差異的熱力圖。將預(yù)訓(xùn)練和微調(diào)后的模型取出相同的注意力模型權(quán)重,相減得到熱力圖。本文發(fā)現(xiàn)圖中熱力圖的顏色大多偏淺,說(shuō)明兩個(gè)模型的解碼器結(jié)構(gòu)中Attention層的權(quán)重相差不大。相似的權(quán)重表明端到端模型在預(yù)訓(xùn)練和微調(diào)后具有相似的語(yǔ)言模型,解碼器主要學(xué)習(xí)的是目標(biāo)語(yǔ)言的語(yǔ)言模型。通過(guò)預(yù)訓(xùn)練目標(biāo)語(yǔ)言數(shù)據(jù)集,解碼器已經(jīng)可以學(xué)習(xí)到目標(biāo)語(yǔ)言的語(yǔ)言模型。與級(jí)聯(lián)語(yǔ)音翻譯和源語(yǔ)言預(yù)訓(xùn)練語(yǔ)音翻譯相比,無(wú)須添加額外的語(yǔ)言模型,所需數(shù)據(jù)量更小,節(jié)省計(jì)算資源。

    圖5 部分模型參數(shù)的熱圖

    表2顯示了所提出的預(yù)訓(xùn)練方法(傳統(tǒng)Conformer)、映射模塊(Conformer-add)和聯(lián)合解碼(Conformer-combined)方法在數(shù)據(jù)集上的性能比較。

    表2 實(shí)驗(yàn)結(jié)果

    后兩種方法在維吾爾語(yǔ)-漢語(yǔ)數(shù)據(jù)集上取得了更好的結(jié)果。使用Conformer-add,在CER上降低了7.24個(gè)百分點(diǎn),在BLEU上提高了3.7個(gè)百分點(diǎn)。使用Conformer-combined,CER值和BLEU 4分?jǐn)?shù)分別為19.78和67.36,從CER和BLEU 4的聯(lián)合角度來(lái)看,Conformer-add效果最好。

    表3顯示,Conformer-combined比Conformer-add在長(zhǎng)文本數(shù)據(jù)上取得了更好的翻譯效果。當(dāng)實(shí)際結(jié)果為“盡 管 外 面 寒 風(fēng) 凜 冽 大 門 前 的 兩 棵 云 杉 被 冰 雪 覆 蓋 大 廳 里 呼 嘯 燃 燒 的 奧 蘭 德 式 火 爐 和 六 個(gè) 人 參 加 黨 組 織 召 開(kāi) 的 追 悼 會(huì) 的 人 都 感 到 熱 乎 乎 的”時(shí),使用Conformer-combined與實(shí)際結(jié)果一致,而使用Conformer-add則漏掉了“寒風(fēng)凜冽”中的“凜冽”,“熱乎乎的”中漏掉了一個(gè)“乎”。說(shuō)明使用Attention機(jī)制軟對(duì)齊時(shí),音頻邊界分割不清,與其他輸出標(biāo)簽混在一起,導(dǎo)致遺漏字現(xiàn)象。

    表3 長(zhǎng)文本實(shí)際效果對(duì)比

    3.4 交叉檢驗(yàn)

    為了評(píng)估預(yù)訓(xùn)練方法的準(zhǔn)確性和穩(wěn)定性,采用了K折交叉驗(yàn)證(K-fold Cross-Validation,KCV),這是一種常用于機(jī)器學(xué)習(xí)的統(tǒng)計(jì)分析方法。KCV將原始數(shù)據(jù)分成K組,抽取1個(gè)不重復(fù)的子集作為初級(jí)驗(yàn)證集,將剩余的K-1個(gè)數(shù)據(jù)子集組合在一起作為訓(xùn)練集[30]。在實(shí)驗(yàn)中的維吾爾語(yǔ)-漢語(yǔ)數(shù)據(jù)集上選擇了K=5。如表4所示,將數(shù)據(jù)集分為F1、F2、F3、F4和F5五個(gè)部分,其中一個(gè)依次作為驗(yàn)證集,其余四個(gè)作為訓(xùn)練集來(lái)訓(xùn)練AST模型??偣采闪宋鍌€(gè)交叉驗(yàn)證數(shù)據(jù)集D1、D2、D3、D4和D5。

    表4 交叉驗(yàn)證數(shù)據(jù)集

    表5顯示了預(yù)訓(xùn)練方法在五個(gè)交叉驗(yàn)證數(shù)據(jù)集上的語(yǔ)音翻譯結(jié)果。CER和BLEU的平均值分別為38.44和60.44,CER和BLEU的標(biāo)準(zhǔn)差分別為3.61和2.59,這表明預(yù)訓(xùn)練方法在多個(gè)實(shí)驗(yàn)中表現(xiàn)穩(wěn)定。

    表5 語(yǔ)音翻譯結(jié)果

    4 結(jié)論

    本文提出了一種構(gòu)建語(yǔ)音翻譯數(shù)據(jù)集的方法來(lái)解決數(shù)據(jù)稀缺問(wèn)題。使用目標(biāo)語(yǔ)言ASR數(shù)據(jù)集預(yù)訓(xùn)練端到端AST模型,獲取目標(biāo)語(yǔ)言信息,然后使用AST數(shù)據(jù)集微調(diào)模型參數(shù)?;谒岢龅念A(yù)訓(xùn)練方法,端到端AST模型取得了較好的性能。此外,只需在預(yù)訓(xùn)練后替換映射模塊以及聯(lián)合解碼,就可以進(jìn)一步提高模型性能。實(shí)驗(yàn)證明與同規(guī)模語(yǔ)音翻譯相比,本文所提出的預(yù)訓(xùn)練方法、替換映射模塊以及聯(lián)合解碼可以顯著提高語(yǔ)音翻譯效果。后續(xù)將進(jìn)一步探索該方法的應(yīng)用,構(gòu)建多語(yǔ)言語(yǔ)音翻譯系統(tǒng)。

    猜你喜歡
    語(yǔ)言模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    語(yǔ)言是刀
    文苑(2020年4期)2020-05-30 12:35:30
    讓語(yǔ)言描寫搖曳多姿
    多向度交往對(duì)語(yǔ)言磨蝕的補(bǔ)正之道
    累積動(dòng)態(tài)分析下的同聲傳譯語(yǔ)言壓縮
    3D打印中的模型分割與打包
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    我有我語(yǔ)言
    久久人人爽人人片av| 最近中文字幕2019免费版| 日本一本二区三区精品| 国产大屁股一区二区在线视频| 中文字幕人妻熟人妻熟丝袜美| 内地一区二区视频在线| 男人狂女人下面高潮的视频| 亚洲精品第二区| 久久精品国产亚洲网站| 美女视频免费永久观看网站| 久久久久国产精品人妻一区二区| 日韩 亚洲 欧美在线| 国产 一区 欧美 日韩| 九草在线视频观看| 久久99蜜桃精品久久| 国产亚洲午夜精品一区二区久久 | 男女那种视频在线观看| 成年版毛片免费区| av在线观看视频网站免费| 有码 亚洲区| 18禁在线无遮挡免费观看视频| 成人鲁丝片一二三区免费| 秋霞伦理黄片| 看十八女毛片水多多多| 一级a做视频免费观看| 自拍偷自拍亚洲精品老妇| 亚洲国产日韩一区二区| 97在线人人人人妻| 亚洲不卡免费看| 国产爽快片一区二区三区| 日本三级黄在线观看| av黄色大香蕉| 国产大屁股一区二区在线视频| 新久久久久国产一级毛片| 老女人水多毛片| 久久久久久久亚洲中文字幕| 联通29元200g的流量卡| 久久久久久久久久成人| 男人添女人高潮全过程视频| 成人午夜精彩视频在线观看| 国产免费一级a男人的天堂| 99热网站在线观看| 毛片一级片免费看久久久久| 又爽又黄a免费视频| 看十八女毛片水多多多| 亚州av有码| 能在线免费看毛片的网站| 国产91av在线免费观看| 久久久久久久久久人人人人人人| 国产精品久久久久久精品电影| 亚洲欧美中文字幕日韩二区| 日本黄色片子视频| 欧美zozozo另类| 嘟嘟电影网在线观看| 尤物成人国产欧美一区二区三区| 黄色配什么色好看| 精品人妻偷拍中文字幕| 国产精品秋霞免费鲁丝片| 久久影院123| 亚洲欧美清纯卡通| 特大巨黑吊av在线直播| 少妇的逼水好多| 久久热精品热| 一本色道久久久久久精品综合| 欧美性感艳星| 好男人在线观看高清免费视频| 色视频www国产| 国产精品麻豆人妻色哟哟久久| 特级一级黄色大片| 午夜福利在线在线| 少妇的逼好多水| 午夜福利视频精品| 国产乱来视频区| 男女那种视频在线观看| 国产伦在线观看视频一区| 久久99蜜桃精品久久| 亚洲国产欧美在线一区| 丝袜美腿在线中文| av国产久精品久网站免费入址| 久久人人爽人人片av| 男女那种视频在线观看| 成年版毛片免费区| 爱豆传媒免费全集在线观看| 欧美激情在线99| 亚洲成人久久爱视频| 欧美成人精品欧美一级黄| 亚洲国产日韩一区二区| 亚洲一区二区三区欧美精品 | 在现免费观看毛片| 男女那种视频在线观看| 大陆偷拍与自拍| 亚洲精品乱码久久久久久按摩| 久久久久久久午夜电影| 水蜜桃什么品种好| 国产亚洲av片在线观看秒播厂| 免费看光身美女| 人妻夜夜爽99麻豆av| 91aial.com中文字幕在线观看| av一本久久久久| 王馨瑶露胸无遮挡在线观看| 亚洲最大成人手机在线| 国产精品99久久99久久久不卡 | 日日摸夜夜添夜夜爱| 国产亚洲一区二区精品| 亚洲国产精品999| 制服丝袜香蕉在线| 一本色道久久久久久精品综合| 一级二级三级毛片免费看| 日韩亚洲欧美综合| 又黄又爽又刺激的免费视频.| 可以在线观看毛片的网站| av网站免费在线观看视频| 美女国产视频在线观看| 色播亚洲综合网| 国产爽快片一区二区三区| 亚洲欧美成人精品一区二区| 男女边摸边吃奶| 亚洲精品乱久久久久久| av国产精品久久久久影院| 18禁动态无遮挡网站| 亚洲精品一二三| 黄色日韩在线| 免费不卡的大黄色大毛片视频在线观看| 国产人妻一区二区三区在| 插阴视频在线观看视频| 99久久人妻综合| 日本熟妇午夜| 国产永久视频网站| 黄色怎么调成土黄色| 免费黄色在线免费观看| 国产精品国产av在线观看| 日产精品乱码卡一卡2卡三| 在线观看三级黄色| 免费观看的影片在线观看| 久久久久久久国产电影| 欧美人与善性xxx| 在线天堂最新版资源| 搡女人真爽免费视频火全软件| 我要看日韩黄色一级片| 麻豆成人午夜福利视频| 丝袜喷水一区| 在线精品无人区一区二区三 | 午夜福利在线在线| av网站免费在线观看视频| 精品少妇久久久久久888优播| 日韩制服骚丝袜av| 亚洲精品国产成人久久av| 综合色av麻豆| 亚洲美女视频黄频| 日本与韩国留学比较| 另类亚洲欧美激情| 国产成人精品一,二区| 国产爽快片一区二区三区| 晚上一个人看的免费电影| 色视频www国产| 久久久久久久大尺度免费视频| 18禁动态无遮挡网站| 国产成人精品一,二区| 国产成人午夜福利电影在线观看| 十八禁网站网址无遮挡 | 波野结衣二区三区在线| 插逼视频在线观看| 国产女主播在线喷水免费视频网站| 精品人妻偷拍中文字幕| 国产精品av视频在线免费观看| 美女xxoo啪啪120秒动态图| 黄色视频在线播放观看不卡| 国产伦精品一区二区三区四那| 国产亚洲5aaaaa淫片| 色哟哟·www| 久久久久网色| 免费少妇av软件| 人妻一区二区av| 国产永久视频网站| 嫩草影院精品99| 能在线免费看毛片的网站| 一区二区三区四区激情视频| 天堂网av新在线| 国产老妇女一区| 26uuu在线亚洲综合色| av在线天堂中文字幕| 久久精品夜色国产| 尾随美女入室| 汤姆久久久久久久影院中文字幕| av一本久久久久| 最近的中文字幕免费完整| 国产 一区 欧美 日韩| 男女啪啪激烈高潮av片| a级毛片免费高清观看在线播放| 女人被狂操c到高潮| 91精品一卡2卡3卡4卡| 亚洲精品自拍成人| 亚洲精品久久午夜乱码| 亚洲久久久久久中文字幕| h日本视频在线播放| 久久精品国产自在天天线| 亚洲精品久久午夜乱码| 熟妇人妻不卡中文字幕| 欧美激情国产日韩精品一区| 国产精品国产三级专区第一集| 深爱激情五月婷婷| 女人被狂操c到高潮| 另类亚洲欧美激情| 色吧在线观看| 麻豆成人午夜福利视频| 亚洲国产精品999| 99热国产这里只有精品6| 99久久中文字幕三级久久日本| 可以在线观看毛片的网站| 日韩在线高清观看一区二区三区| 中文字幕久久专区| 99久久九九国产精品国产免费| 国产成人一区二区在线| 国产成人freesex在线| 成人亚洲精品一区在线观看 | 免费在线观看成人毛片| 在线播放无遮挡| 亚洲成人精品中文字幕电影| 天美传媒精品一区二区| 亚洲图色成人| 国内精品美女久久久久久| 国产欧美另类精品又又久久亚洲欧美| 偷拍熟女少妇极品色| 国产亚洲av片在线观看秒播厂| 成年女人看的毛片在线观看| 色哟哟·www| 99热6这里只有精品| 97超碰精品成人国产| 亚洲成人精品中文字幕电影| 一区二区三区免费毛片| 中文字幕亚洲精品专区| www.av在线官网国产| 又大又黄又爽视频免费| 午夜福利视频1000在线观看| 成人欧美大片| 欧美日韩在线观看h| 精品少妇久久久久久888优播| 午夜精品国产一区二区电影 | 精品久久久久久久久亚洲| 亚洲最大成人手机在线| 另类亚洲欧美激情| 久久国产乱子免费精品| 久久97久久精品| 一级av片app| 内射极品少妇av片p| 黄片wwwwww| 午夜福利视频精品| 中文在线观看免费www的网站| 你懂的网址亚洲精品在线观看| 高清日韩中文字幕在线| 啦啦啦中文免费视频观看日本| 亚洲精品乱码久久久v下载方式| 夫妻性生交免费视频一级片| 久久人人爽人人爽人人片va| 最近2019中文字幕mv第一页| 久久久精品免费免费高清| 婷婷色麻豆天堂久久| 嫩草影院精品99| 丝袜脚勾引网站| 夜夜爽夜夜爽视频| 日本午夜av视频| 嫩草影院入口| 汤姆久久久久久久影院中文字幕| 亚洲欧美精品自产自拍| 99热国产这里只有精品6| 亚洲成人久久爱视频| 国产在线一区二区三区精| 亚洲人成网站在线观看播放| 网址你懂的国产日韩在线| 日产精品乱码卡一卡2卡三| 久久久国产一区二区| 日本色播在线视频| 国产黄a三级三级三级人| 国产视频首页在线观看| 大香蕉97超碰在线| 免费看av在线观看网站| 精品久久久噜噜| 看免费成人av毛片| av在线蜜桃| 日日撸夜夜添| 精品少妇久久久久久888优播| 久久久色成人| 内地一区二区视频在线| av专区在线播放| 国产毛片在线视频| 三级国产精品欧美在线观看| 亚洲欧洲国产日韩| 国模一区二区三区四区视频| 国产 一区 欧美 日韩| 在线观看av片永久免费下载| 天美传媒精品一区二区| 观看免费一级毛片| 久久99精品国语久久久| 欧美性感艳星| 国产精品久久久久久精品电影小说 | 免费av不卡在线播放| 亚洲自偷自拍三级| 免费在线观看成人毛片| .国产精品久久| 国产精品成人在线| 午夜福利视频精品| 岛国毛片在线播放| 欧美精品国产亚洲| 青春草国产在线视频| 国产毛片a区久久久久| 99久久精品热视频| 中文乱码字字幕精品一区二区三区| 人妻 亚洲 视频| 免费观看a级毛片全部| 能在线免费看毛片的网站| 秋霞伦理黄片| 亚洲怡红院男人天堂| 六月丁香七月| 麻豆乱淫一区二区| 乱码一卡2卡4卡精品| 99久久精品热视频| 少妇人妻一区二区三区视频| 国产精品秋霞免费鲁丝片| 狂野欧美激情性xxxx在线观看| 日本一二三区视频观看| 在现免费观看毛片| 亚洲精品一区蜜桃| 欧美日本视频| 永久网站在线| 免费av毛片视频| 18禁在线播放成人免费| 丝袜脚勾引网站| 中文在线观看免费www的网站| 国产爽快片一区二区三区| 午夜视频国产福利| 99热国产这里只有精品6| 高清av免费在线| 噜噜噜噜噜久久久久久91| 男男h啪啪无遮挡| 日韩强制内射视频| 男人爽女人下面视频在线观看| 国产久久久一区二区三区| 精品久久久噜噜| 国产老妇女一区| 99久久精品热视频| 色播亚洲综合网| 欧美日韩亚洲高清精品| 欧美+日韩+精品| 中文天堂在线官网| 免费观看a级毛片全部| 一本一本综合久久| 国产亚洲av片在线观看秒播厂| av.在线天堂| 亚洲国产精品专区欧美| 国产av国产精品国产| 国产爽快片一区二区三区| 在线精品无人区一区二区三 | 亚州av有码| 好男人视频免费观看在线| 男人爽女人下面视频在线观看| 麻豆成人午夜福利视频| 欧美97在线视频| av天堂中文字幕网| 天天躁夜夜躁狠狠久久av| 久久精品综合一区二区三区| 下体分泌物呈黄色| 欧美潮喷喷水| av网站免费在线观看视频| 搡老乐熟女国产| 狂野欧美白嫩少妇大欣赏| 国产免费又黄又爽又色| 亚洲欧美日韩东京热| 街头女战士在线观看网站| 插阴视频在线观看视频| 日韩视频在线欧美| 黄色日韩在线| 午夜亚洲福利在线播放| 久久精品久久久久久久性| 免费大片黄手机在线观看| 国产av不卡久久| 国产淫片久久久久久久久| 久热这里只有精品99| 男人舔奶头视频| 国产国拍精品亚洲av在线观看| 久久久久久久精品精品| 中文字幕人妻熟人妻熟丝袜美| 欧美三级亚洲精品| 欧美+日韩+精品| 2022亚洲国产成人精品| 搡老乐熟女国产| 午夜精品国产一区二区电影 | 新久久久久国产一级毛片| 国产午夜福利久久久久久| 国产成人精品婷婷| 五月天丁香电影| 日日摸夜夜添夜夜添av毛片| 色综合色国产| 亚洲精品日韩av片在线观看| 天美传媒精品一区二区| 久久久久久久大尺度免费视频| 成人亚洲精品一区在线观看 | 99热全是精品| 欧美激情国产日韩精品一区| 欧美bdsm另类| 亚洲色图综合在线观看| 亚洲精品第二区| 午夜视频国产福利| 国产爱豆传媒在线观看| 九色成人免费人妻av| 大片免费播放器 马上看| 99热这里只有精品一区| 岛国毛片在线播放| 久久精品久久久久久噜噜老黄| videossex国产| 欧美3d第一页| 欧美激情国产日韩精品一区| 精品国产乱码久久久久久小说| 亚洲高清免费不卡视频| 真实男女啪啪啪动态图| 在线看a的网站| 国产精品久久久久久精品电影| 青春草国产在线视频| 国产免费福利视频在线观看| 久久精品久久精品一区二区三区| 国产欧美日韩精品一区二区| 久久久久久久久大av| 三级国产精品片| 久久99蜜桃精品久久| 亚洲国产色片| 国产精品一区二区在线观看99| 国产视频首页在线观看| 国产精品麻豆人妻色哟哟久久| 黄片wwwwww| 最近的中文字幕免费完整| 九九在线视频观看精品| 欧美性感艳星| 岛国毛片在线播放| 国产精品精品国产色婷婷| 国产高清三级在线| 免费播放大片免费观看视频在线观看| 国产精品国产三级国产专区5o| 免费观看av网站的网址| av在线播放精品| 国产 一区 欧美 日韩| 免费观看a级毛片全部| 少妇人妻精品综合一区二区| 欧美三级亚洲精品| 国产免费视频播放在线视频| 欧美高清成人免费视频www| 国产精品国产三级国产av玫瑰| 国产v大片淫在线免费观看| 亚洲av欧美aⅴ国产| 亚洲欧美中文字幕日韩二区| 九九在线视频观看精品| 国产成人免费无遮挡视频| 国产伦理片在线播放av一区| 日本猛色少妇xxxxx猛交久久| 国产乱人偷精品视频| 五月伊人婷婷丁香| 久久人人爽人人片av| 午夜福利在线观看免费完整高清在| 中文乱码字字幕精品一区二区三区| 黄色日韩在线| 免费观看无遮挡的男女| 熟女av电影| 亚洲一级一片aⅴ在线观看| 日本黄色片子视频| 国产极品天堂在线| 一二三四中文在线观看免费高清| 99热这里只有是精品在线观看| 欧美三级亚洲精品| 97精品久久久久久久久久精品| 亚洲精品一二三| 国产黄片视频在线免费观看| 亚洲欧美成人精品一区二区| 校园人妻丝袜中文字幕| 亚洲精品视频女| 一级毛片黄色毛片免费观看视频| 日日啪夜夜撸| 久久精品久久精品一区二区三区| 亚洲av在线观看美女高潮| 在线天堂最新版资源| 午夜激情久久久久久久| 视频中文字幕在线观看| 国产欧美日韩一区二区三区在线 | 国产成年人精品一区二区| 国产 精品1| 久久久欧美国产精品| 成人毛片a级毛片在线播放| 性色avwww在线观看| 日韩电影二区| 自拍欧美九色日韩亚洲蝌蚪91 | av播播在线观看一区| 欧美 日韩 精品 国产| 国产精品成人在线| 直男gayav资源| 国内揄拍国产精品人妻在线| 欧美 日韩 精品 国产| 免费不卡的大黄色大毛片视频在线观看| 国产综合精华液| 可以在线观看毛片的网站| 丰满人妻一区二区三区视频av| 99热6这里只有精品| 婷婷色麻豆天堂久久| 一二三四中文在线观看免费高清| 欧美xxⅹ黑人| 午夜福利视频1000在线观看| 神马国产精品三级电影在线观看| 精品人妻熟女av久视频| 美女高潮的动态| 免费高清在线观看视频在线观看| 国产 精品1| av.在线天堂| 99热这里只有是精品在线观看| 汤姆久久久久久久影院中文字幕| 99热全是精品| 交换朋友夫妻互换小说| 国产精品久久久久久精品电影小说 | 日韩成人av中文字幕在线观看| 国产伦在线观看视频一区| 偷拍熟女少妇极品色| 中文资源天堂在线| 精品久久国产蜜桃| 波多野结衣巨乳人妻| 97超视频在线观看视频| 丝袜喷水一区| 最近最新中文字幕免费大全7| 国产v大片淫在线免费观看| 精华霜和精华液先用哪个| 晚上一个人看的免费电影| 精华霜和精华液先用哪个| 晚上一个人看的免费电影| 亚洲精品aⅴ在线观看| 69av精品久久久久久| 亚洲av日韩在线播放| 成人鲁丝片一二三区免费| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 97人妻精品一区二区三区麻豆| 99久久人妻综合| 97在线视频观看| 国产精品国产av在线观看| 欧美性感艳星| 国产欧美亚洲国产| 最后的刺客免费高清国语| av.在线天堂| 狂野欧美白嫩少妇大欣赏| 日韩中字成人| 国产欧美日韩精品一区二区| 日韩强制内射视频| 久久久久久久久久人人人人人人| 婷婷色综合www| 免费看a级黄色片| a级毛色黄片| 国产精品一及| 欧美成人午夜免费资源| 久久人人爽人人爽人人片va| 免费看光身美女| 亚洲高清免费不卡视频| 久久精品人妻少妇| 又爽又黄无遮挡网站| 色5月婷婷丁香| 在线观看国产h片| 大香蕉久久网| 少妇人妻精品综合一区二区| 日韩制服骚丝袜av| 亚洲精品乱码久久久v下载方式| 男女无遮挡免费网站观看| 亚洲欧美日韩无卡精品| 99热全是精品| 日韩中字成人| 97精品久久久久久久久久精品| 晚上一个人看的免费电影| 久久久亚洲精品成人影院| 亚洲国产精品成人综合色| 免费黄频网站在线观看国产| 亚洲精品自拍成人| 成人黄色视频免费在线看| 久久久久精品性色| 亚洲第一区二区三区不卡| 91久久精品国产一区二区成人| 欧美 日韩 精品 国产| 国产精品偷伦视频观看了| 高清欧美精品videossex| 国产精品.久久久| 亚洲av一区综合| 国产淫语在线视频| 亚洲国产精品专区欧美| 免费看日本二区| 白带黄色成豆腐渣| 日韩大片免费观看网站| 老司机影院成人| 久久久久精品性色| 久久久久久久久久成人| 国产一区二区亚洲精品在线观看| 99热这里只有是精品在线观看| 日本免费在线观看一区| 精品少妇久久久久久888优播| 亚洲在线观看片| 中文字幕av成人在线电影| 成人特级av手机在线观看| 国产v大片淫在线免费观看| 亚洲精品久久久久久婷婷小说| 久久久久网色| 日本与韩国留学比较| 国产爽快片一区二区三区| 欧美日韩精品成人综合77777| 亚洲av免费高清在线观看| 蜜臀久久99精品久久宅男| a级毛色黄片| 久久精品国产自在天天线| 免费大片18禁| 精品少妇黑人巨大在线播放| 国产视频首页在线观看| 久久久久久久久久成人| 国产成人a∨麻豆精品| 亚洲欧美日韩东京热| 欧美成人一区二区免费高清观看| 国产精品国产av在线观看| 69人妻影院| 在线精品无人区一区二区三 |