• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于word2vec的語音識(shí)別后文本糾錯(cuò)

    2020-11-17 06:55:56張佳寧嚴(yán)冬梅
    關(guān)鍵詞:語義文本實(shí)驗(yàn)

    張佳寧,嚴(yán)冬梅,王 勇

    (天津財(cái)經(jīng)大學(xué) 理工學(xué)院,天津 300222)

    0 引 言

    隨著在線會(huì)議、慕課及自媒體視頻等的興起,離線長(zhǎng)音頻生成字幕的需求呈現(xiàn)爆炸式增長(zhǎng),傳統(tǒng)的以人為主的技術(shù)已經(jīng)不能滿足需求,將語音識(shí)別技術(shù)(automatic speech recognition,ASR)運(yùn)用于字幕制作是大勢(shì)所趨。然而實(shí)際應(yīng)用中,由于環(huán)境噪音、語音質(zhì)量、方言和說話方式以及ASR系統(tǒng)詞匯量等多因素的影響,會(huì)不可避免地導(dǎo)致ASR的錯(cuò)誤[1]。

    許多研究人員為降低語音識(shí)別錯(cuò)誤率做了大量研究。Graves A[2]通過增加詞與詞之間的停頓提高正確率;Fujiwara K[3]通過提出一種更適于人發(fā)音的語音字母表改進(jìn)了語音輸入;Che J等通過分析語音識(shí)別錯(cuò)誤的案例,提出一種特有的基于漢語語音、語言特征的文本校正和意圖識(shí)別方法[4]。但這些研究[2-4]都聚焦在短句實(shí)時(shí)識(shí)別,與長(zhǎng)音頻的ASR結(jié)果有很大不同。

    Ogawa A等[5,6]提出一種使用深度雙向回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行ASR誤差檢測(cè)和識(shí)別率估計(jì)的方法;Rahhal Errattahi等[7]利用變量神經(jīng)網(wǎng)絡(luò)(V-RNN)模型進(jìn)行錯(cuò)誤檢測(cè)和錯(cuò)誤類型分類。但這些研究[5-7]都是針對(duì)分類任務(wù)的,用有限的規(guī)則去約束復(fù)雜多變的語言顯然不合理。

    Geonwoo Park等[8]提出一種用于常規(guī)ASR系統(tǒng)的拼寫錯(cuò)誤校正后處理模型,但由于誤識(shí)別詞的候選集僅由語音識(shí)別產(chǎn)生的備選詞構(gòu)成,導(dǎo)致該方法嚴(yán)重依賴ASR的識(shí)別結(jié)果。

    針對(duì)上述研究中存在的問題,本文提出一種基于word2vec的糾錯(cuò)方法,即利用word2vec建立語義和語境詞典,使用百度公開的深度語言模型,解決語音識(shí)別后得到的文本與原始音頻不符的問題。

    1 基于word2vec的語音識(shí)別后文本糾錯(cuò)

    1.1 基于word2vec的語義相似度

    計(jì)算機(jī)在處理詞語時(shí)會(huì)用一種數(shù)學(xué)化的形式表示詞語,稱為詞語的向量化。word2vec與獨(dú)熱編碼(One-Hot Encoder)的目的都是把詞映射到n維空間。但不同于One-Hot Encoder,為了防止因?yàn)閿?shù)據(jù)稀疏帶來的維數(shù)災(zāi)難問題,word2vec將詞轉(zhuǎn)化成了稠密向量。

    word2vec由Tomas Mikolov等提出[9,10],它是在神經(jīng)網(wǎng)絡(luò)語言模型(neural network language model,NNLM)基礎(chǔ)上建立的。word2vec用Huffman樹作為最后一層輸出層,僅考慮“局部上下文”來學(xué)習(xí)有意義的詞向量。

    詞在轉(zhuǎn)化為向量時(shí),意思相近的詞會(huì)被映射到空間中相近的位置。word2vec根據(jù)這一特性,使用夾角余弦[11]來反映詞語間的關(guān)聯(lián)程度。夾角余弦的計(jì)算方法如式(1)所示,空間中的兩個(gè)詞的語義越相似,它們的夾角余弦值也就越接近于1

    (1)

    式中:W1,W2為詞向量,W1i,W2i分別表示W(wǎng)1,W2的各分量。

    在語義上越接近的詞,出現(xiàn)在同一語境的可能性越大,因此本文在進(jìn)行語境檢測(cè)時(shí)使用了基于word2vec的語義相似度計(jì)算方法。

    1.2 語境關(guān)鍵詞的提取

    情景語境指說話人說話當(dāng)時(shí)當(dāng)?shù)厮幍沫h(huán)境。無論在何種環(huán)境中,某一時(shí)刻的說話內(nèi)容總是圍繞一個(gè)特定主題展開的,本文稱之為語境核心詞(簡(jiǎn)稱核心詞)。如“指針”是C語言的代表,若再提到“繼承”、“友元”、“類”就會(huì)聯(lián)想到C++語言。關(guān)鍵詞是指在特定語境含有特定意義的詞,范圍大于核心詞。

    考慮到算法的擴(kuò)展性、用戶友好性,本文參考李躍鵬等[12]的方法,使用預(yù)訓(xùn)練好的word2vec模型結(jié)合少量語境核心詞構(gòu)建關(guān)鍵詞集。

    語義相似度表明了詞與詞在語義上的相關(guān)程度,與核心詞在語義上距離比較近的詞,也是對(duì)于整個(gè)語境比較重要的詞。因此,關(guān)鍵詞集由與核心詞語義相似度相近的詞組成。具體計(jì)算方法如式(2)和式(3)

    (2)

    n_c表示cores中詞的總數(shù),corei表示核心詞集cores中的第i個(gè)核心詞,wordj表示語料庫中第j個(gè)詞,tmp_KeyScorej表示wordj與核心詞集cores語義相似度的均值

    retention_factorsj=tmp_KeyScorej-β

    (3)

    retention_factorsj表示wordj的保留因子;β是一個(gè)可調(diào)閾值參數(shù),它限制著retention_factorsj。當(dāng)β值比較大時(shí),retention_factorsj相應(yīng)就比較小,所對(duì)應(yīng)的wordj被保留在關(guān)鍵詞集的概率也就比較??;反之,則wordj被保留在關(guān)鍵詞集的概率就比較大。

    求得詞集后,對(duì)詞集tmp_keys進(jìn)行排序,并將結(jié)果保存到最終的關(guān)鍵詞詞集keyword_set。關(guān)鍵詞詞集keyword_set可以分成兩部分,第一部分由出現(xiàn)在當(dāng)前語境的詞組成,第二部分由未出現(xiàn)在當(dāng)前語境的詞組成。第一部分按照對(duì)糾錯(cuò)的貢獻(xiàn)性又可以劃分成兩組,第一組為對(duì)糾錯(cuò)有貢獻(xiàn)的,第二組為對(duì)糾錯(cuò)沒有貢獻(xiàn)的。關(guān)鍵詞詞集keyword_set中最后真正有用的,只有第一部分中的第一組中所含的詞。在每次查找時(shí),如果不對(duì)關(guān)鍵詞詞集keyword_set加以約束,詞集中所有詞就都會(huì)被遍歷。這不僅沒有提高糾錯(cuò)正確率,還產(chǎn)生了較高時(shí)間代價(jià)。為了提高查詢關(guān)鍵詞集的效率,參考Salihefendic A等[13]的方法,本文對(duì)關(guān)鍵詞進(jìn)行了排名,在糾錯(cuò)時(shí)對(duì)keyword_set中的詞投票,具體計(jì)算方法如式(4)和式(5)

    (4)

    其中,wi表示待修改文本中第i個(gè)詞,w_pyi表示wi的拼音,keyword_seti表示keyword_set中與w_pyi對(duì)應(yīng)的詞,xi表示待修改文本中第i個(gè)詞的拼音的貢獻(xiàn)度

    (5)

    其中,word_frei表示keyword_set中的第i個(gè)詞wordi的詞頻;α1、α2是可調(diào)的參數(shù),表示隨著連續(xù)語音的識(shí)別,word_frei隨著時(shí)間的變化。

    更新keyword_set中詞的詞頻后,對(duì)keyword_set中詞進(jìn)行約束,規(guī)定將小于某一閾值的詞停用。

    1.3 最終混淆集的生成

    1.3.1 深度語言模型

    語言模型描述的是在語言學(xué)中詞與詞在數(shù)學(xué)上的關(guān)系,它在文本糾錯(cuò)中起著至關(guān)重要的作用。在過去的自然語言處理中,N-Gram模型因其簡(jiǎn)單、易用、有效的特點(diǎn),一直發(fā)揮著重要的作用[14]。但是隨著N元文法的增加,模型參數(shù)會(huì)變得很大,對(duì)于長(zhǎng)距離的語境信息不能很好地利用。此外,數(shù)據(jù)稀疏也一直是N-Gram不可避免的問題。DNNLM則是在深度學(xué)習(xí)的基礎(chǔ)上建立的,它不僅比 N-Gram 能利用更多的上下文信息,而且在訓(xùn)練中采用了詞向量,減少了數(shù)據(jù)稀疏性對(duì)于模型的影響。

    訓(xùn)練一個(gè)好的語言模型需要十分龐大的正確語料以及一定軟硬件支持。過去這項(xiàng)工作在國(guó)內(nèi)一直由研究者或者相關(guān)領(lǐng)域的企業(yè)所有,市場(chǎng)上很難獲得一個(gè)訓(xùn)練好的模型的接口。2017年百度免費(fèi)開放了依托海量?jī)?yōu)質(zhì)數(shù)據(jù)和最新技術(shù)訓(xùn)練的DNNLM,為研究者提供了一個(gè)實(shí)用便捷的工具。本文在模型中使用DNNLM對(duì)輸入文本中的詞進(jìn)行判斷,從而得出該詞出現(xiàn)在當(dāng)前文本中的概率。

    1.3.2 混淆集的縮減

    考慮到語音識(shí)別時(shí)一些字的音會(huì)發(fā)生變化,混淆集中的替換詞不能只包含同音詞,初始混淆集需要采用PYCN生成。在采用PYCN生成混淆集時(shí),由于原始詞拼音的不確定性,使得生成的初始混淆集tmp_con中詞的數(shù)量眾多。例如:使用“雞蛋”生成混淆集時(shí),最終會(huì)得到“幾單”、“忌憚”等100多個(gè)搜索結(jié)果。而DNNLM為了覆蓋范圍更全面、結(jié)果更合理,模型一般都很大,如果將這些結(jié)果都輸入到模型中進(jìn)行查詢,時(shí)間開銷將會(huì)非常大。為了解決這一問題,本文利用語境知識(shí)縮減混淆集中詞的數(shù)量。本文先從測(cè)試集中選取了85個(gè)測(cè)試實(shí)例,然后又從3個(gè)領(lǐng)域中選取了85個(gè)詞進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如圖1和圖2所示。

    圖1 使用NNLM計(jì)算句子得分時(shí)間開銷

    圖2 使用word2vec計(jì)算詞語間相似度時(shí)間開銷

    圖1是使用DNNLM計(jì)算句子得分的時(shí)間開銷,橫坐標(biāo)表示輸入句子的數(shù)量,縱坐標(biāo)表示使用的時(shí)間,單位為s。圖2是使用word2vec計(jì)算詞語間相似度的時(shí)間開銷,橫坐標(biāo)表示輸入詞的數(shù)量,縱坐標(biāo)表示使用的時(shí)間,單位為ms。

    由圖1、圖2可知,使用word2vec計(jì)算80個(gè)詞與詞的語義相似度花費(fèi)的時(shí)間僅為0.0020 s,使用DNNLM查詢80句話的時(shí)間開銷已經(jīng)達(dá)到25 s,計(jì)算語義相似度的時(shí)間開銷要遠(yuǎn)遠(yuǎn)小于計(jì)算語句語言模型得分的。核心詞表示了當(dāng)前語境的主要內(nèi)容,語境中出現(xiàn)的其它詞在理論上不應(yīng)該與核心詞在語義上相距太遠(yuǎn)??梢?,利用語義詞典查詢?cè)~與詞的語義相似度,將混淆集中與語境相距太遠(yuǎn)的詞篩除,來縮小混淆集中詞的數(shù)量,不僅不影響糾錯(cuò)結(jié)果,還減少了查詢語言模型的次數(shù),提高了糾錯(cuò)效率。因此,為了減小模糊集的數(shù)量,可以對(duì)tmp_con中的詞與核心詞進(jìn)行語義相似度計(jì)算,從而排除一些不合語境的詞。計(jì)算語境得分的計(jì)算方法如式(6)所示

    (6)

    tmp_conj表示文本詞集tmp_con中的第j個(gè)元素,con_scorej表示tmp_conj的在當(dāng)前語境的得分。

    只要con_scorej的得分小于閾值ε,就認(rèn)為tmp_conj出現(xiàn)在當(dāng)前文本不合理,將tmp_conj從混淆集tmp_con中移除。重復(fù)這一過程,得到最終的混淆集confusion_set,將候選詞依次帶入DNNLM中計(jì)算文本得分,重排序,選出最合適的文本。

    1.4 整體流程

    整體流程如下。

    步驟1 對(duì)輸入的音頻進(jìn)行預(yù)處理,將處理后的音頻輸入語音識(shí)別系統(tǒng)中,將音頻轉(zhuǎn)化成文字。

    步驟2 將語音識(shí)別后待處理的文本輸入到糾錯(cuò)檢錯(cuò)系統(tǒng),對(duì)文本進(jìn)行第一次處理,去除無意義的語氣詞、口頭禪和一些使用語音識(shí)別工具常見的錯(cuò)誤。

    步驟3 對(duì)第一次處理后的文本進(jìn)行第二次處理,利用關(guān)鍵詞進(jìn)行檢錯(cuò)糾錯(cuò),并且更新關(guān)鍵詞詞表。

    步驟4 對(duì)第二次處理的結(jié)果進(jìn)行處理,然后利用NNLM對(duì)句子中的每個(gè)詞進(jìn)行打分,將分?jǐn)?shù)明顯區(qū)別于其它詞語的詞添加到“誤識(shí)別”的列表中,對(duì)誤識(shí)別的詞進(jìn)行糾錯(cuò)。

    2 實(shí)驗(yàn)與結(jié)果分析

    2.1 語義相似度詞庫

    訓(xùn)練基于word2vec的語義相似度模型,需要大量語義上正確的文本。語義的基礎(chǔ)詞庫方面,本文使用了維基百科提供的中文語料和網(wǎng)上爬取的新聞?wù)Z料,共有3 G。對(duì)語料進(jìn)行預(yù)處理,使用NLPIR漢語分詞系統(tǒng)進(jìn)行分詞。調(diào)用了Gensim的word2vec模型[15]進(jìn)行訓(xùn)練,得到語義的基礎(chǔ)詞庫。

    2.2 評(píng)價(jià)指標(biāo)

    在對(duì)算法性能的評(píng)價(jià)中,采用了召回率(Recall,又稱查全率),準(zhǔn)確率[16](Precision,又稱查準(zhǔn)率)和F1值作為評(píng)價(jià)標(biāo)準(zhǔn),來判斷模型中算法的有效性。計(jì)算公式見式(7)、式(8)和式(9)

    (7)

    (8)

    (9)

    2.3 實(shí) 驗(yàn)

    2.3.1 語音識(shí)別

    實(shí)驗(yàn)中語音識(shí)別的音頻包括有3個(gè)來源:①現(xiàn)場(chǎng)教學(xué)錄音,《管理學(xué)原理》中“控制”一章的教學(xué)視頻,時(shí)長(zhǎng)為1個(gè)小時(shí);②遠(yuǎn)程錄播課,“學(xué)習(xí)強(qiáng)國(guó)”和“馬克思主義大講堂”中關(guān)于馬克思主義原理的內(nèi)容,時(shí)長(zhǎng)為50 min;③有聲圖書,《錢不要存在銀行》中的第一、二章內(nèi)容,時(shí)長(zhǎng)為1 h 10 min。語音識(shí)別工具調(diào)用了百度語音的SDK。

    如表1語音識(shí)別結(jié)果所示:實(shí)驗(yàn)中把誤識(shí)別詞分成3類:第一類,識(shí)別后詞語拼音沒有發(fā)現(xiàn)變化;第二類,識(shí)別后詞語長(zhǎng)度發(fā)生變化;第三類,識(shí)別后詞語長(zhǎng)度不變,但拼音發(fā)生變化。所選的音頻一是教師在課堂上直接錄制的,雖然語音聽上去吐字清晰,語速也適當(dāng),但從視頻中分離的音頻仍然含有各種雜音,比如老師的翻書聲、話筒的嘶嘶聲、學(xué)生的竊竊私語聲。語音識(shí)別的最終結(jié)果吞音、吐音現(xiàn)象很明顯,在誤識(shí)別的詞集中,僅有26.24%是替換錯(cuò)誤,例如“就是所有的活動(dòng)、所有的工作都是需要受到控制的,所有的人都需要受到控制,不是說你是領(lǐng)導(dǎo)就不受控制,你是部門主管就不受控制,那不行?!北蛔R(shí)別成了“活動(dòng),所有的工作是需要適當(dāng)控制的,所有的人都說你是領(lǐng)導(dǎo)就不受控制,你是部門主管就不行。”。所選的第二個(gè)和第三個(gè)音頻則雖然是在安靜環(huán)境下錄制的,但也存在一定雜音。

    表1 語音識(shí)別結(jié)果

    2.3.2 檢錯(cuò)糾錯(cuò)

    實(shí)驗(yàn)中,為了使用核心詞擴(kuò)展關(guān)鍵詞,每個(gè)音頻都選取了5個(gè)對(duì)于它所處語境具有代表意義的詞來構(gòu)建核心詞庫,將每個(gè)核心詞代入word2vec模型中,選擇與核心詞語義最相近的詞,排序去重后構(gòu)建出關(guān)鍵詞集。例如,音頻②的核心詞與部分關(guān)鍵詞見表2。

    表2 核心詞與關(guān)鍵詞

    為了驗(yàn)證本文所提出方法的有效性,實(shí)驗(yàn)中采用了3種方法進(jìn)行對(duì)比。方法一,傳統(tǒng)2_Gram+3_Gram糾錯(cuò)方法;方法二,沒有使用語境的DNNLM方法;方法三,本文提出的使用語境的DNNLM方法。實(shí)驗(yàn)結(jié)果見表3。

    表3 3種方法的準(zhǔn)確率、召回率以及F1值/%

    由表3中3種方法的準(zhǔn)確率、召回率以及F1值可知,本文提出的方法在3個(gè)測(cè)試集上的準(zhǔn)確率、召回率和F1值都要明顯優(yōu)于傳統(tǒng)N-Gram和未使用語境知識(shí)的DNNLM方法。

    通過對(duì)比傳統(tǒng)N-Gram、未使用語境的DNNLM和使用語境的DNNLM得到的實(shí)驗(yàn)數(shù)據(jù),驗(yàn)證了本文中使用的深度語言模型在檢錯(cuò)糾錯(cuò)方法的明顯有效性,在此不再分析。對(duì)比使用語境與未使用語境的DNNLM方法,可以驗(yàn)證語境詞對(duì)檢錯(cuò)糾錯(cuò)效果。對(duì)表3的實(shí)驗(yàn)結(jié)果進(jìn)行計(jì)算,(方法三數(shù)據(jù)-方法二數(shù)據(jù))/方法二數(shù)據(jù),得到見表4。

    使用語境的糾錯(cuò)方法對(duì)比未使用語境的,其準(zhǔn)確率、召回率、F1值都有了較大提高。由表4結(jié)果可得:在使用語境知識(shí)后,測(cè)試集中語句的原始結(jié)構(gòu)被打亂,進(jìn)一步定位了句子的范圍,為后續(xù)使用深度語言模型進(jìn)行檢錯(cuò)奠定了基礎(chǔ),從而提高了算法檢錯(cuò)糾錯(cuò)能力。

    表4 使用語境與未使用語境的DNNLM實(shí)驗(yàn)結(jié)果對(duì)比/%

    為了驗(yàn)證利用語境詞典可以提高糾錯(cuò)效率,分別對(duì)使用了語境詞典和沒有使用語境詞典兩種情況的時(shí)間進(jìn)行了差值計(jì)算,時(shí)間提高的計(jì)算方法見式(10)

    Time_difference=no_use_time-use_time

    (10)

    no_use_time表示沒有使用語境詞典查錯(cuò)糾錯(cuò)花費(fèi)的時(shí)間,use_time表示使用了語義詞典查錯(cuò)糾錯(cuò)花費(fèi)的時(shí)間。

    實(shí)驗(yàn)中隨機(jī)從測(cè)試集中選取了86個(gè)例子。圖3為有、無語境知識(shí)進(jìn)行文本糾錯(cuò)的時(shí)間差,橫坐標(biāo)表示輸入句子的數(shù)量,縱坐標(biāo)表示沒有使用語境知識(shí)和使用語境知識(shí)進(jìn)行文本糾錯(cuò)的時(shí)間差,單位是s。從圖3中可知,在利用DNNLM檢錯(cuò)糾錯(cuò)時(shí),利用語境知識(shí)比沒有利用語境知識(shí)快了600 s。對(duì)3個(gè)測(cè)試集進(jìn)行計(jì)算效率的測(cè)試,音頻①、音頻②和音頻③的時(shí)間差分別為721 s,367 s,541 s。語境知識(shí)可以有效地提高檢錯(cuò)糾錯(cuò)效率,尤其在語句比較長(zhǎng)的情況下,語境知識(shí)可以很好地縮減混淆集的規(guī)模,從而將文本糾錯(cuò)的速度大幅提高。

    圖3 有無語境知識(shí)的時(shí)間差

    2.4 實(shí)驗(yàn)結(jié)果分析

    在2.3的實(shí)驗(yàn)中,使用了最新的ASR技術(shù)對(duì)長(zhǎng)音頻文件進(jìn)行語音識(shí)別后文本糾錯(cuò)。實(shí)驗(yàn)結(jié)果表明:對(duì)于上文中現(xiàn)場(chǎng)教學(xué)、遠(yuǎn)程錄播和有聲圖書音頻在ASR下產(chǎn)生的文本,本文提出的基于word2vec的糾錯(cuò)方法,相比于使用傳統(tǒng)語言模型的方法和不使用語境信息的糾錯(cuò)方法,不僅能夠提高糾錯(cuò)的準(zhǔn)確率、召回率和F1值,還能通過縮減混淆集中詞的數(shù)量,提高計(jì)算的效率。

    在實(shí)驗(yàn)中,還發(fā)現(xiàn)以下3種情況。第一,說話人在講課、演講、發(fā)言時(shí)的說話方式與朗讀新聞或者文學(xué)著作時(shí)是有差別的。在識(shí)別這些偏口語化的長(zhǎng)音頻時(shí),在查錯(cuò)階段,語言模型會(huì)查出許多本身不是錯(cuò)誤,但不是很書面的詞的“錯(cuò)”。第二,說話人在說話時(shí),其語速、音調(diào)在不同時(shí)刻可能是不一樣的,致使語音識(shí)別時(shí)會(huì)因?yàn)橐纛l信號(hào)的突然改變而出現(xiàn)吞音、吐音的現(xiàn)象,從而使識(shí)別后的詞與原始詞存在較大差別,使得測(cè)試集中很多錯(cuò)誤實(shí)驗(yàn)方法檢測(cè)不出來。這為后期文本糾錯(cuò)帶來了一定的挑戰(zhàn)。第三,不同地域語言發(fā)音存在差異,相同詞語在不同地域的讀音也會(huì)略有差異。

    由于存在以上3種情況,即使使用最新的ASR技術(shù),識(shí)別后的文本也已經(jīng)和原始文本有了很大出入,而本文的實(shí)驗(yàn)分析是采用原始文本作為正確文本的對(duì)比樣本,所以,雖然與其它方法相比,準(zhǔn)確率與召回率都有了較大提高,但其絕對(duì)值仍然比較低,需要繼續(xù)提高ASR水平。

    3 結(jié)束語

    本文從現(xiàn)有ASR技術(shù)出發(fā),提出一種基于word2vec的語音識(shí)別后文本糾錯(cuò)方法。主要貢獻(xiàn)點(diǎn):①提出使用公開深度語言模型進(jìn)行檢錯(cuò);②提出結(jié)合少量語境核心詞利用word2vec生成關(guān)鍵詞集;③提出使用word2vec縮減混淆詞集數(shù)量。實(shí)驗(yàn)結(jié)果表明:本文提出的方法,對(duì)不同類型、不同領(lǐng)域的長(zhǎng)音頻語音識(shí)別后文本糾錯(cuò)是有效的,對(duì)實(shí)際應(yīng)用中長(zhǎng)語音的語音識(shí)別有一定現(xiàn)實(shí)意義。

    盡管如此,長(zhǎng)音頻的語音識(shí)別后文本糾錯(cuò)仍然有很大提升空間,今后的研究可以將個(gè)人化發(fā)音特色加入PYCN方法中,考慮個(gè)性化的混淆集生成方法。

    猜你喜歡
    語義文本實(shí)驗(yàn)
    記一次有趣的實(shí)驗(yàn)
    語言與語義
    在808DA上文本顯示的改善
    做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
    實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
    太空探索(2016年5期)2016-07-12 15:17:55
    “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    認(rèn)知范疇模糊與語義模糊
    久久久久久久久久人人人人人人| 国内少妇人妻偷人精品xxx网站| 老司机影院成人| 国产精品一区二区三区四区免费观看| 亚洲国产欧美人成| 免费看不卡的av| 美女内射精品一级片tv| 成人亚洲精品一区在线观看 | 国产真实伦视频高清在线观看| 精品99又大又爽又粗少妇毛片| 亚洲精品色激情综合| 看免费成人av毛片| 国产成人aa在线观看| 啦啦啦在线观看免费高清www| 亚洲av成人精品一二三区| 成年av动漫网址| 菩萨蛮人人尽说江南好唐韦庄| 精品少妇黑人巨大在线播放| 啦啦啦中文免费视频观看日本| 身体一侧抽搐| 亚洲婷婷狠狠爱综合网| 99国产精品免费福利视频| 国产69精品久久久久777片| 人人妻人人添人人爽欧美一区卜 | 欧美精品人与动牲交sv欧美| 如何舔出高潮| a级毛片免费高清观看在线播放| 人人妻人人爽人人添夜夜欢视频 | 成人高潮视频无遮挡免费网站| 成人影院久久| 国产黄片美女视频| 美女视频免费永久观看网站| 久久97久久精品| 交换朋友夫妻互换小说| 国产免费又黄又爽又色| 欧美成人一区二区免费高清观看| 亚洲av中文av极速乱| 日韩一区二区三区影片| 一本色道久久久久久精品综合| 亚洲av成人精品一区久久| 亚洲一级一片aⅴ在线观看| 一个人免费看片子| 嫩草影院入口| 日韩制服骚丝袜av| 国产探花极品一区二区| 18禁动态无遮挡网站| 啦啦啦在线观看免费高清www| 伦理电影大哥的女人| 免费看日本二区| 亚洲av福利一区| 日韩成人伦理影院| 三级国产精品片| 99热国产这里只有精品6| 精品人妻一区二区三区麻豆| 亚洲精品国产av成人精品| 菩萨蛮人人尽说江南好唐韦庄| av在线蜜桃| 另类亚洲欧美激情| 99久久综合免费| av国产免费在线观看| 成人高潮视频无遮挡免费网站| 韩国高清视频一区二区三区| 欧美精品国产亚洲| 日日摸夜夜添夜夜添av毛片| 日韩 亚洲 欧美在线| av又黄又爽大尺度在线免费看| 国产午夜精品一二区理论片| 久久人人爽人人片av| 青青草视频在线视频观看| 欧美日韩视频精品一区| 色综合色国产| 免费在线观看成人毛片| 亚洲欧洲日产国产| 欧美日韩综合久久久久久| 狠狠精品人妻久久久久久综合| 狂野欧美激情性xxxx在线观看| 亚洲国产日韩一区二区| 99久久精品国产国产毛片| 欧美亚洲 丝袜 人妻 在线| 日本欧美视频一区| 免费观看的影片在线观看| 久久久久人妻精品一区果冻| 亚洲电影在线观看av| 亚洲av不卡在线观看| 欧美zozozo另类| 一区在线观看完整版| 久久热精品热| 成人黄色视频免费在线看| 一个人看的www免费观看视频| 联通29元200g的流量卡| 欧美3d第一页| 午夜激情久久久久久久| 国产爱豆传媒在线观看| 成人美女网站在线观看视频| av国产久精品久网站免费入址| 亚洲自偷自拍三级| 国产精品无大码| 黄色日韩在线| 精品视频人人做人人爽| 欧美成人午夜免费资源| 下体分泌物呈黄色| 少妇猛男粗大的猛烈进出视频| 在线观看一区二区三区| 色视频www国产| 亚洲av福利一区| 亚洲激情五月婷婷啪啪| 青春草视频在线免费观看| 国产精品99久久99久久久不卡 | 女人久久www免费人成看片| 国产精品不卡视频一区二区| 亚洲国产日韩一区二区| 波野结衣二区三区在线| 日韩国内少妇激情av| 久久国产精品大桥未久av | 亚洲不卡免费看| 亚洲第一av免费看| 国产精品一二三区在线看| 我要看黄色一级片免费的| 欧美成人a在线观看| 日本爱情动作片www.在线观看| 99久久中文字幕三级久久日本| 99久久中文字幕三级久久日本| 精品国产乱码久久久久久小说| 男人舔奶头视频| 欧美精品一区二区大全| 国产av码专区亚洲av| 久久久久久久久久人人人人人人| 久久久久久久久久成人| 午夜视频国产福利| 国产免费又黄又爽又色| 新久久久久国产一级毛片| 色视频www国产| 久久久久国产精品人妻一区二区| 春色校园在线视频观看| 中文字幕精品免费在线观看视频 | 搡老乐熟女国产| 美女内射精品一级片tv| av不卡在线播放| 欧美精品亚洲一区二区| 男人狂女人下面高潮的视频| 成人美女网站在线观看视频| 十八禁网站网址无遮挡 | 欧美激情极品国产一区二区三区 | 九草在线视频观看| 看十八女毛片水多多多| 网址你懂的国产日韩在线| av福利片在线观看| 在线看a的网站| 国产黄色免费在线视频| 街头女战士在线观看网站| 少妇人妻一区二区三区视频| 国产精品秋霞免费鲁丝片| 爱豆传媒免费全集在线观看| 国产精品欧美亚洲77777| 中国国产av一级| 亚洲国产精品一区三区| 91久久精品国产一区二区成人| 性色avwww在线观看| 久久久久精品性色| 欧美成人精品欧美一级黄| 直男gayav资源| 国产日韩欧美在线精品| 亚洲av中文字字幕乱码综合| 麻豆成人av视频| 你懂的网址亚洲精品在线观看| 大话2 男鬼变身卡| 日韩中字成人| 欧美精品国产亚洲| 女人十人毛片免费观看3o分钟| 一级毛片我不卡| 18禁裸乳无遮挡免费网站照片| 国产老妇伦熟女老妇高清| 97精品久久久久久久久久精品| 国产爽快片一区二区三区| 18+在线观看网站| av在线蜜桃| 国产亚洲午夜精品一区二区久久| 欧美日韩国产mv在线观看视频 | 蜜桃在线观看..| 日日摸夜夜添夜夜添av毛片| 岛国毛片在线播放| 日本黄大片高清| 一区二区三区精品91| 亚洲怡红院男人天堂| 欧美另类一区| 午夜老司机福利剧场| 国产亚洲一区二区精品| 亚洲三级黄色毛片| 老司机影院毛片| 亚洲一区二区三区欧美精品| 九九久久精品国产亚洲av麻豆| 黑人猛操日本美女一级片| 一二三四中文在线观看免费高清| 我要看黄色一级片免费的| 日本黄色片子视频| 国产亚洲av片在线观看秒播厂| 久久99热这里只有精品18| 亚洲内射少妇av| 亚洲aⅴ乱码一区二区在线播放| 国产成人aa在线观看| 亚洲图色成人| 国产午夜精品一二区理论片| 黑丝袜美女国产一区| 日本vs欧美在线观看视频 | 国产国拍精品亚洲av在线观看| 亚洲国产精品一区三区| 日韩欧美精品免费久久| 妹子高潮喷水视频| 精品亚洲成国产av| 岛国毛片在线播放| 国产永久视频网站| 99久久中文字幕三级久久日本| 亚洲aⅴ乱码一区二区在线播放| a级毛色黄片| 又爽又黄a免费视频| 亚洲在久久综合| 精品熟女少妇av免费看| 免费人妻精品一区二区三区视频| 国产精品秋霞免费鲁丝片| 激情 狠狠 欧美| 我要看黄色一级片免费的| 最近2019中文字幕mv第一页| 中文字幕制服av| 五月开心婷婷网| 最黄视频免费看| 黑人猛操日本美女一级片| 女人十人毛片免费观看3o分钟| 精品人妻熟女av久视频| 国产欧美日韩一区二区三区在线 | 亚洲av电影在线观看一区二区三区| 亚洲高清免费不卡视频| 丰满少妇做爰视频| 麻豆精品久久久久久蜜桃| 蜜桃久久精品国产亚洲av| 秋霞伦理黄片| 亚洲欧美成人精品一区二区| 国产精品.久久久| 午夜福利网站1000一区二区三区| 深夜a级毛片| 一本色道久久久久久精品综合| 久久久国产一区二区| a级毛片免费高清观看在线播放| 91久久精品国产一区二区成人| 热99国产精品久久久久久7| 99热全是精品| 亚洲精品成人av观看孕妇| 香蕉精品网在线| 久久精品国产鲁丝片午夜精品| 联通29元200g的流量卡| 亚洲久久久国产精品| 国产黄片美女视频| 两个人的视频大全免费| 国产精品成人在线| 草草在线视频免费看| 亚洲国产精品一区三区| 亚洲av免费高清在线观看| 啦啦啦啦在线视频资源| 国产精品国产av在线观看| 午夜福利在线观看免费完整高清在| 久久久久精品久久久久真实原创| 在线观看国产h片| 亚洲精品日本国产第一区| 高清在线视频一区二区三区| 国产精品久久久久久久电影| 日韩伦理黄色片| 国产精品爽爽va在线观看网站| 成人无遮挡网站| 亚洲成人一二三区av| 国产淫语在线视频| 制服丝袜香蕉在线| 久久久国产一区二区| 毛片女人毛片| 欧美丝袜亚洲另类| 免费人成在线观看视频色| 黄色日韩在线| 亚洲伊人久久精品综合| 国产高清有码在线观看视频| 天堂俺去俺来也www色官网| 精品亚洲成a人片在线观看 | 菩萨蛮人人尽说江南好唐韦庄| 爱豆传媒免费全集在线观看| 观看美女的网站| 精品一区二区三区视频在线| 嘟嘟电影网在线观看| 亚洲第一av免费看| 中文字幕av成人在线电影| 啦啦啦在线观看免费高清www| 色婷婷久久久亚洲欧美| 国产精品久久久久久精品古装| 在线观看一区二区三区激情| 亚洲久久久国产精品| av在线蜜桃| 成人国产麻豆网| 亚洲高清免费不卡视频| 老熟女久久久| 黑丝袜美女国产一区| 搡女人真爽免费视频火全软件| 少妇猛男粗大的猛烈进出视频| 在线亚洲精品国产二区图片欧美 | 成人特级av手机在线观看| 超碰97精品在线观看| 国产在线男女| 中文天堂在线官网| 啦啦啦在线观看免费高清www| 丰满少妇做爰视频| 成年av动漫网址| 国产探花极品一区二区| 免费高清在线观看视频在线观看| 啦啦啦中文免费视频观看日本| 日日摸夜夜添夜夜爱| 欧美丝袜亚洲另类| 人人妻人人看人人澡| 午夜福利网站1000一区二区三区| 亚洲国产精品专区欧美| 女人十人毛片免费观看3o分钟| 婷婷色av中文字幕| 国产成人freesex在线| 自拍偷自拍亚洲精品老妇| 高清av免费在线| 亚洲精品日本国产第一区| 国产深夜福利视频在线观看| 久久鲁丝午夜福利片| 日产精品乱码卡一卡2卡三| 自拍欧美九色日韩亚洲蝌蚪91 | 日韩精品有码人妻一区| 国产精品爽爽va在线观看网站| 高清欧美精品videossex| 精品亚洲成国产av| 波野结衣二区三区在线| 国产欧美另类精品又又久久亚洲欧美| 欧美成人一区二区免费高清观看| 久久久久性生活片| 老师上课跳d突然被开到最大视频| 欧美激情国产日韩精品一区| 国产有黄有色有爽视频| 国产亚洲欧美精品永久| av女优亚洲男人天堂| 国产精品麻豆人妻色哟哟久久| av.在线天堂| 国产精品一及| 国模一区二区三区四区视频| 丝瓜视频免费看黄片| 成人亚洲欧美一区二区av| 亚洲国产av新网站| 天天躁日日操中文字幕| 国产91av在线免费观看| 国产一区二区三区综合在线观看 | 男女边摸边吃奶| 多毛熟女@视频| 亚洲欧美中文字幕日韩二区| 少妇丰满av| 日本vs欧美在线观看视频 | 激情五月婷婷亚洲| 国产精品99久久99久久久不卡 | 人人妻人人看人人澡| 亚洲精品日韩在线中文字幕| 中国三级夫妇交换| 2021少妇久久久久久久久久久| 精品亚洲成国产av| 日本免费在线观看一区| 亚洲国产精品专区欧美| 99久久综合免费| 久久精品国产a三级三级三级| 三级经典国产精品| 成人黄色视频免费在线看| 国产精品伦人一区二区| 不卡视频在线观看欧美| 久久精品国产亚洲网站| 高清在线视频一区二区三区| 香蕉精品网在线| 伦精品一区二区三区| 亚洲av欧美aⅴ国产| 97热精品久久久久久| 亚洲最大成人中文| 国产av国产精品国产| 亚洲无线观看免费| 日韩伦理黄色片| 极品教师在线视频| 最黄视频免费看| 久久精品久久久久久久性| 亚洲精品自拍成人| 国产中年淑女户外野战色| 全区人妻精品视频| 欧美日韩国产mv在线观看视频 | 国产成人a∨麻豆精品| 精品一品国产午夜福利视频| 日韩一本色道免费dvd| 日韩av免费高清视频| 秋霞在线观看毛片| 性高湖久久久久久久久免费观看| 少妇丰满av| 色婷婷久久久亚洲欧美| 欧美老熟妇乱子伦牲交| 又大又黄又爽视频免费| 亚洲国产最新在线播放| 80岁老熟妇乱子伦牲交| 国产精品偷伦视频观看了| 久久久久久久精品精品| 三级国产精品片| 中国美白少妇内射xxxbb| 亚洲熟女精品中文字幕| 毛片女人毛片| 国产伦在线观看视频一区| 久久99精品国语久久久| 午夜免费鲁丝| 国产色爽女视频免费观看| 亚洲av国产av综合av卡| 欧美zozozo另类| 日日啪夜夜爽| 国产高潮美女av| 日本爱情动作片www.在线观看| 国产亚洲av片在线观看秒播厂| 亚洲一区二区三区欧美精品| 啦啦啦视频在线资源免费观看| 又爽又黄a免费视频| 日韩av不卡免费在线播放| 99九九线精品视频在线观看视频| 九九爱精品视频在线观看| 制服丝袜香蕉在线| 国产精品精品国产色婷婷| 亚洲欧美成人精品一区二区| 亚洲精品久久午夜乱码| 亚洲成色77777| 丰满少妇做爰视频| 人妻夜夜爽99麻豆av| 国产精品99久久99久久久不卡 | 五月开心婷婷网| 亚洲婷婷狠狠爱综合网| 身体一侧抽搐| 午夜激情福利司机影院| 91aial.com中文字幕在线观看| 欧美日韩亚洲高清精品| 日韩精品有码人妻一区| 久久久a久久爽久久v久久| 久久人人爽人人爽人人片va| 蜜桃在线观看..| 国产综合精华液| 人妻制服诱惑在线中文字幕| 国产免费一区二区三区四区乱码| 永久网站在线| 亚洲精品成人av观看孕妇| 亚洲美女黄色视频免费看| 久久久久久久大尺度免费视频| 秋霞伦理黄片| 欧美另类一区| 日韩国内少妇激情av| 亚洲aⅴ乱码一区二区在线播放| 国产男女超爽视频在线观看| 日韩免费高清中文字幕av| 大话2 男鬼变身卡| 亚洲欧美日韩另类电影网站 | 在线 av 中文字幕| 婷婷色麻豆天堂久久| 一级av片app| 最新中文字幕久久久久| 观看免费一级毛片| 亚洲精品国产色婷婷电影| 久久久久久久久久成人| 亚洲婷婷狠狠爱综合网| 亚洲精品aⅴ在线观看| 99热全是精品| 最新中文字幕久久久久| 欧美一级a爱片免费观看看| 黑人猛操日本美女一级片| 精品少妇黑人巨大在线播放| 王馨瑶露胸无遮挡在线观看| 人妻夜夜爽99麻豆av| 青春草国产在线视频| 国产一区二区在线观看日韩| av在线老鸭窝| 我要看日韩黄色一级片| 久久女婷五月综合色啪小说| 男人爽女人下面视频在线观看| 这个男人来自地球电影免费观看 | 秋霞在线观看毛片| 日韩精品有码人妻一区| 美女中出高潮动态图| 一本—道久久a久久精品蜜桃钙片| 国产精品麻豆人妻色哟哟久久| 国产精品三级大全| 99国产精品免费福利视频| 美女内射精品一级片tv| 国产女主播在线喷水免费视频网站| 国产精品一二三区在线看| 欧美日韩精品成人综合77777| av在线app专区| 一级a做视频免费观看| 国产伦在线观看视频一区| 王馨瑶露胸无遮挡在线观看| 天天躁夜夜躁狠狠久久av| 干丝袜人妻中文字幕| 日日撸夜夜添| 亚洲精品一二三| 91精品国产国语对白视频| 亚洲电影在线观看av| 久久久久国产精品人妻一区二区| 最黄视频免费看| 精品久久久噜噜| 亚洲国产精品一区三区| .国产精品久久| 亚洲国产色片| 日本色播在线视频| 一级毛片 在线播放| 久久久精品免费免费高清| 午夜免费鲁丝| 欧美xxⅹ黑人| 欧美3d第一页| 成人国产av品久久久| 亚洲欧美日韩另类电影网站 | 日本黄色片子视频| 99热网站在线观看| 国产午夜精品一二区理论片| 亚洲aⅴ乱码一区二区在线播放| 亚洲av日韩在线播放| 少妇 在线观看| 26uuu在线亚洲综合色| 国产成人a区在线观看| 深爱激情五月婷婷| 欧美日韩综合久久久久久| 国产成人aa在线观看| 精华霜和精华液先用哪个| 久久久久久久国产电影| 免费观看a级毛片全部| 超碰97精品在线观看| 精品人妻偷拍中文字幕| 亚洲va在线va天堂va国产| 内射极品少妇av片p| 男女边吃奶边做爰视频| 国产大屁股一区二区在线视频| 日韩不卡一区二区三区视频在线| 久久久久精品性色| 免费大片黄手机在线观看| 国产精品一区二区在线不卡| 另类亚洲欧美激情| xxx大片免费视频| 尤物成人国产欧美一区二区三区| 街头女战士在线观看网站| 亚洲成人一二三区av| 日本午夜av视频| 欧美高清性xxxxhd video| 又大又黄又爽视频免费| 中文字幕亚洲精品专区| 一本色道久久久久久精品综合| 亚洲性久久影院| 国产在视频线精品| 在线观看免费日韩欧美大片 | 91精品国产九色| 日韩中文字幕视频在线看片 | 日本一二三区视频观看| 欧美精品一区二区免费开放| 免费少妇av软件| av国产精品久久久久影院| 亚洲av日韩在线播放| 亚洲av不卡在线观看| 国产成人精品婷婷| 国产精品.久久久| 水蜜桃什么品种好| 精品国产三级普通话版| 小蜜桃在线观看免费完整版高清| 欧美成人a在线观看| 国产乱人视频| 久久精品国产a三级三级三级| 国产亚洲最大av| 国产av码专区亚洲av| 99热这里只有是精品在线观看| 日日撸夜夜添| 99国产精品免费福利视频| 国产片特级美女逼逼视频| 黄片wwwwww| 国产在线男女| 97热精品久久久久久| 国产精品成人在线| 精品一区二区三卡| 欧美成人a在线观看| 欧美亚洲 丝袜 人妻 在线| 国产一区有黄有色的免费视频| 色视频在线一区二区三区| 亚洲精品aⅴ在线观看| 久久精品国产亚洲av天美| 噜噜噜噜噜久久久久久91| 全区人妻精品视频| 久热久热在线精品观看| 日本猛色少妇xxxxx猛交久久| 性高湖久久久久久久久免费观看| 秋霞在线观看毛片| 国产欧美另类精品又又久久亚洲欧美| 不卡视频在线观看欧美| 国产成人aa在线观看| av免费在线看不卡| 日韩,欧美,国产一区二区三区| av女优亚洲男人天堂| 日本wwww免费看| 人人妻人人爽人人添夜夜欢视频 | 免费观看无遮挡的男女| 欧美区成人在线视频| 国产黄色视频一区二区在线观看| 精品久久久久久久久亚洲| 国产在线男女| 中文字幕精品免费在线观看视频 | 在线观看一区二区三区激情| 久久精品久久精品一区二区三区| 久久热精品热| av在线app专区| 久久精品久久精品一区二区三区| 91午夜精品亚洲一区二区三区| 新久久久久国产一级毛片| 观看美女的网站| 日韩欧美 国产精品| av线在线观看网站| 欧美一区二区亚洲| 三级国产精品欧美在线观看| 免费黄网站久久成人精品| 日韩强制内射视频| 亚洲第一区二区三区不卡| 精品99又大又爽又粗少妇毛片|