• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    維吾爾語機器翻譯研究綜述

    2024-01-18 13:56:46哈里旦木阿布都克里木侯鈺濤姚登峰阿布都克力木阿布力孜陳吉尚
    計算機工程 2024年1期
    關(guān)鍵詞:語言方法模型

    哈里旦木·阿布都克里木,侯鈺濤,姚登峰,阿布都克力木·阿布力孜,陳吉尚

    (1.新疆財經(jīng)大學信息管理學院,新疆烏魯木齊 830012;2.北京聯(lián)合大學信息服務工程重點實驗室, 北京 100101)

    0 引言

    機器翻譯是自然語言處理(NLP)領(lǐng)域重要的研究內(nèi)容,其借助計算機程序自動地將源語言文本翻譯為具有相同語義的目標語言文本。近年來,機器翻譯發(fā)展迅速,尤其是神經(jīng)機器翻譯(NMT)方法被提出之后[1-3],該領(lǐng)域得到了空前的發(fā)展。

    維吾爾語是中華人民共和國新疆維吾爾自治區(qū)的法定官方語言之一,廣泛分布于中國新疆維吾爾自治區(qū)及周邊國家和地區(qū),語系隸屬于阿爾泰語系突厥語族葛邏祿語支[4]。新疆地區(qū)作為我國國際貿(mào)易的活躍口岸,機器翻譯模型的應用為維吾爾族人民提供了更好的漢語及其他語言的學習工具,進一步促進不同地區(qū)和民族之間的文化交流和貿(mào)易往來。

    本文旨在考察維吾爾語與其他語言之間機器翻譯的研究現(xiàn)狀,從基于規(guī)則和實例、基于統(tǒng)計以及基于神經(jīng)網(wǎng)絡等方面詳細梳理了維吾爾語機器翻譯相關(guān)研究。同時,總結(jié)歸納了維吾爾語機器翻譯的相關(guān)資源,此外使用ChatGPT 模型對維吾爾語-漢語(后文簡稱維-漢)機器翻譯任務進行了初步探索,最后對維吾爾語機器翻譯未來的研究方向進行了展望,為進一步研究提供借鑒和參考。

    1 維吾爾語機器翻譯相關(guān)研究

    20 世紀90 年代末,王世杰等[5]對漢語-維吾爾語(后文簡稱漢-維)機器翻譯面臨的主要問題進行初步探索,開啟了維吾爾語機器翻譯領(lǐng)域的研究,早期多數(shù)學者將基于規(guī)則和基于實例的維吾爾語機器翻譯方法進行結(jié)合討論,后續(xù)的發(fā)展同樣分為基于統(tǒng)計和基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯兩個階段。表1 匯總了維吾爾語機器翻譯的方法及其優(yōu)缺點。

    表1 維吾爾語機器翻譯方法優(yōu)缺點Table 1 Advantages and disadvantages of Uyghur machine translation methods

    迄今為止,主流語言的機器翻譯研究主要經(jīng)歷了基于規(guī)則的機器翻譯(RBMT)、基于實例的機器翻譯(EBMT)、基于統(tǒng)計的機器翻譯(SMT)以及基于神經(jīng)網(wǎng)絡的機器翻譯4 個發(fā)展階段。然而,維吾爾語作為一種形態(tài)結(jié)構(gòu)復雜多變的語言,其語義通過有限的詞干和詞綴的不同組合表達,主要在詞干后面首先添加構(gòu)詞詞綴,然后添加構(gòu)形詞綴而成,具體信息見表2。維吾爾語詞干“???”(“看”)通過添加構(gòu)詞詞綴“??”生成具有不同語義的新詞匯——動名詞“?????”(“看著”),該動名詞后面繼續(xù)添加動詞過去式構(gòu)詞詞綴可以派生新的詞匯“????????”(“見過面”),然后添加名詞復數(shù)構(gòu)形詞綴“???”來構(gòu)成新的詞“???????????”(“見過的人”),最后可以添加構(gòu)形詞綴“??”(“呢”)構(gòu)成“?????????????.”(“見過面的人呢”)。由此可見,維吾爾語詞干后面添加構(gòu)詞和構(gòu)形詞綴可派生出新的詞匯和詞的不同形態(tài)形式。在理論上,維吾爾語可以通過此方式產(chǎn)生無限多的詞匯,但也因此會產(chǎn)生更多的未登錄詞(OOV),從而導致嚴重的數(shù)據(jù)稀疏性問題。由于維吾爾語具有形態(tài)復雜、語料稀缺等問題,導致其發(fā)展相對緩慢。

    表2 維吾爾語語言特性實例Table 2 Examples of Uyghur language features

    1.1 基于規(guī)則和實例的維吾爾語機器翻譯

    在機器翻譯領(lǐng)域最早進行基于規(guī)則的機器翻譯研究,該方法首先對語言進行分析,然后利用人工抽取的規(guī)則將源語言轉(zhuǎn)換為目標語言,但規(guī)則的撰寫需要耗費大量的成本,因此在實際應用中受到一定限制。之后,文獻[6]提出基于實例的機器翻譯方法,受益于計算機處理性能的逐步提升以及雙語平行語料庫規(guī)模的不斷擴大,越來越多的語言學信息被直接用于機器翻譯的實例,從而逐漸取代了基于規(guī)則的機器翻譯方法[7]。在此發(fā)展階段,規(guī)則撰寫(規(guī)則庫)、語言相似度算法、電子詞典等直接影響翻譯的性能。圖1 所示為基于規(guī)則和實例的維吾爾語機器翻譯結(jié)構(gòu)(以維-漢為例)。

    圖1 基于規(guī)則和實例的維吾爾語機器翻譯Fig.1 Rule-and example-based Uyghur machine translation

    在維吾爾語機器翻譯發(fā)展的初期階段,研究人員主要采用規(guī)則驅(qū)動的方法,文獻[8-11]針對維吾爾語人名、專有名詞、動詞后綴等介紹了基于規(guī)則的翻譯方法。鑒于維吾爾語和日語在句法結(jié)構(gòu)和詞素等方面具有一定的相似性,文獻[12-13]介紹了維吾爾語和日語詞規(guī)則庫的構(gòu)建,在此基礎(chǔ)上進行維吾爾語-日語機器翻譯任務的探索。在基于詞匯層面的規(guī)則基礎(chǔ)上,文獻[14-15]介紹了句子級相似度衡量方法,然而該方法對較長的句子或組成詞頻低的句子存在相似度計算偏差較大等問題。為了解決這些問題,文獻[16]利用單詞信息計算語言相似度來進行改進。電子詞典是基于規(guī)則和實例機器翻譯方法的基礎(chǔ),通過構(gòu)建維吾爾語詞典[17-18]來探索與漢語、英語[19]以及日語[20]之間的翻譯。為了取得更佳的翻譯效果,文獻[21-24]介紹了將規(guī)則、翻譯記憶庫以及詞典相結(jié)合的方法。

    1.2 基于統(tǒng)計的維吾爾語機器翻譯

    隨著機器翻譯技術(shù)和計算機性能的不斷發(fā)展,機器翻譯逐步邁入基于統(tǒng)計的發(fā)展階段,維吾爾語統(tǒng)計機器翻譯研究的主要思想是基于維吾爾語雙語語料庫,通過概率算法挖掘平行語料中詞語對應的翻譯關(guān)系,尋找將源語言序列轉(zhuǎn)換為生成概率最高的目標語言序列[25]。圖2 所示為基于統(tǒng)計的維吾爾語機器翻譯結(jié)構(gòu)(以維-漢為例)。

    圖2 基于統(tǒng)計的維吾爾語機器翻譯Fig.2 Statistical-based Uyghur machine translation

    基于統(tǒng)計的維吾爾語機器翻譯研究主要以短語[26]和句法[27]的統(tǒng)計機器翻譯為主要研究方法;部分研究融入了詞典[28]和詞級別的語法信息[29-30]等外部知識。由于維吾爾語具有主語、賓語、謂語(SOV)的詞序結(jié)構(gòu)以及從右到左的書寫順序等特點,文獻[31-33]介紹了漢語句子重排以及優(yōu)化解碼時的調(diào)序方法來緩解維吾爾語和漢語的句法結(jié)構(gòu)差異,使得兩者在形態(tài)上更加相近,以此提升了翻譯性能。文獻[34]介紹了影響漢-維翻譯效果的多種因素(詞對齊、句法結(jié)構(gòu)差異、翻譯調(diào)序、翻譯一致性和未登錄詞),并提出了改善翻譯性能的建議。然而,由于基于統(tǒng)計的翻譯方法沒有考慮到語義之間的關(guān)系,因此文獻[35-36]介紹了統(tǒng)計機器翻譯與規(guī)則和翻譯記憶相結(jié)合的方法,以此來改善翻譯效果?;诮y(tǒng)計的方法在維吾爾語機器翻譯研究中發(fā)揮了重要作用,但仍需要進一步提升翻譯質(zhì)量。

    1.3 基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯

    神經(jīng)機器翻譯方法已在維吾爾語機器翻譯任務中占據(jù)主導地位,其主體結(jié)構(gòu)由編碼器-解碼器兩部分構(gòu)成。首先使用編碼器將輸入的源語言文本轉(zhuǎn)化為固定向量,然后使用解碼器對向量逐次解碼,從而輸出目標語言文本。神經(jīng)機器翻譯的目標是在給定源語言文本x的情況下,找出翻譯概率最大的目標語言文本如式(1)、式(2)所示:

    其中:x=(x1,x2,…,xm) 表示源語言文本;y=(y1,y2,…,ym)表示目標語言文本;y

    圖3 維吾爾語NMT 訓練框架Fig.3 Uyghur NMT training framework

    在神經(jīng)機器翻譯發(fā)展前期,研究人員使用循環(huán)神經(jīng)網(wǎng)絡(RNN)、卷積神經(jīng)網(wǎng)絡(CNN)以及門控循環(huán)單元(GRU)等網(wǎng)絡進行機器翻譯的初步探索。文獻[37]介紹了6 種經(jīng)典的神經(jīng)機器模型在維吾爾語-漢語的翻譯效果,為基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯工作帶來了啟發(fā)。由于維吾爾語存在形態(tài)復雜和語料稀缺等問題導致譯文效果不佳是目前研究人員面臨的嚴峻挑戰(zhàn)?;谏窠?jīng)網(wǎng)絡的維吾爾語機器翻譯針對此問題采用不同方法解決,本節(jié)主要從以下3 個方面對其進行歸類整理:注意力機制,Transformer 模型和基于預訓練模型的維吾爾語機器翻譯方法。

    1.3.1 注意力機制

    自從注意力機制[38-39]被提出以來,研究人員將注意力機制與雙向LSTM、RNN 以及GRU 等網(wǎng)絡相結(jié)合,構(gòu)建維吾爾語神經(jīng)機器翻譯模型,如圖4所示。

    圖4 基于注意力機制的維吾爾語機器翻譯模型Fig.4 Model of Uyghur machine translation based on attention mechanisms

    同時,充分考慮維吾爾語的語言特點,融入詞級別以及句子級別的語法知識,分別研究了維吾爾語-英語[40]和漢語[41-42]的翻譯;此外,文獻[43]介紹了維-漢人名翻譯數(shù)據(jù)集的構(gòu)建,并在此數(shù)據(jù)集上研究人名翻譯中的不雅詞和譯文不當?shù)膯栴}。為了更好地學習源語言和目標語言的語言理解與生成能力,文獻[44-45]介紹了基于注意力機制的多編碼器-多解碼器結(jié)構(gòu)的大型神經(jīng)機器翻譯模型,用于研究維吾爾語機器翻譯,該方法明顯優(yōu)于基于統(tǒng)計的方法和基本的神經(jīng)機器翻譯模型。

    1.3.2 Transformer 模型

    Transformer 模型[46]是完全使用注意力機制構(gòu)建的序列到序列的模型,相較之前神經(jīng)機器翻譯模型中使用的循環(huán)神經(jīng)網(wǎng)絡而言,具有計算復雜度小、并行度高等優(yōu)點。文獻[47]在Transformer 模型基礎(chǔ)上提出一種雙編碼器結(jié)構(gòu),分別對維吾爾語的單詞和語言特征進行編碼,旨在有效地整合語言特征并提升源語言知識的挖掘效果,從而改善維-漢翻譯的質(zhì)量。

    1)不同粒度切分

    為了解決維吾爾語形態(tài)復雜性對機器翻譯質(zhì)量的影響,研究人員探索適用于維吾爾語機器翻譯的不同粒度單元,以更有效地利用有限的平行語料資源。文獻[48]給出了維-漢和漢-維組織名(ONs)翻譯任務的對比分析,探討了字符、音節(jié)、BPE、標記字符和單詞5 種粒度單元的分詞方法對翻譯結(jié)果的影響。文獻[49]介紹了多層次分段粒度訓練方法,包括音節(jié)、標記音節(jié)、單詞和音節(jié)-單詞融合,實驗結(jié)果表明,多翻譯粒度訓練優(yōu)于其他粒度分段的翻譯系統(tǒng)。此外,基于多頭自注意力機制的Transformer 模型也被證明優(yōu)于基于自注意力機制的RNN 翻譯模型。文獻[50]將維吾爾語單詞切分成音節(jié)粒度,并融入BME 標記,結(jié)果顯示,音節(jié)標記方法明顯優(yōu)于基于單詞和BPE 切分粒度的方法。

    2)數(shù)據(jù)增強

    由于維吾爾語平行語料資源的稀缺性,NMT 模型的訓練受到限制,無法獲得足夠的訓練數(shù)據(jù)以實現(xiàn)更優(yōu)的翻譯性能,因此大多數(shù)研究者采用各種數(shù)據(jù)增強技術(shù)來解決數(shù)據(jù)不足的問題,從而提高翻譯質(zhì)量和性能[51]。反向翻譯[52]是機器翻譯領(lǐng)域一種典型的數(shù)據(jù)增強技術(shù),其核心思想是利用額外的目標端單語數(shù)據(jù)構(gòu)建偽平行語料庫,并與原始語料庫按比例混合,以增加訓練數(shù)據(jù)量,具體流程如圖5 所示。然而,反向翻譯并非完美方法,當原始平行語料庫規(guī)模較小時,通過反向翻譯生成的偽平行語料質(zhì)量往往不佳,而且將其混合則難以有效利用原始平行語料庫。因此,研究人員通常將反向翻譯技術(shù)與其他方法結(jié)合使用。

    圖5 基于反向翻譯的維吾爾語機器翻譯Fig.5 Uyghur machine translation based on back translation

    文獻[53]利用反向翻譯技術(shù)構(gòu)建偽平行語料庫,并通過增量訓練和模型融合生成最終譯文。文獻[54]通過改進的反向翻譯技術(shù)將漢語單語數(shù)據(jù)轉(zhuǎn)化為不同領(lǐng)域的相似數(shù)據(jù),然后分段訓練偽平行語料,利用模型平均和集成方法提高翻譯性能。文獻[55-56]介紹了反向翻譯、數(shù)據(jù)篩選和知識蒸餾等策略相結(jié)合的方法。文獻[57-58]提出了基于回譯和集成學習的方法(BTEM)以及集成修剪算法來緩解維吾爾語語料稀缺、傳統(tǒng)集成方法計算資源消耗大等問題。此外,文獻[59]介紹了基于知識蒸餾的數(shù)據(jù)增強方法,將教師模型的知識傳遞給學生模型,有效提升了翻譯性能。

    3)遷移學習

    遷移學習最早被用于機器翻譯任務[60],該方法首先在大規(guī)模平行語料庫上訓練一個“父”模型,然后使用“父”模型初始化“子”模型權(quán)重,最后在低資源語言上訓練“子”模型作為最終的翻譯模型,從而有效提升了低資源機器翻譯性能,如圖6 所示。

    圖6 基于遷移學習的維吾爾語機器翻譯Fig.6 Uyghur machine translation based on transfer learning

    文獻[60]提出應在資源豐富的語言上訓練“父”模型,而文獻[61]提出了與其相反的方法,利用相似的低資源語言訓練“父”模型和“子”模型,兩種語言均為突厥語(使用烏茲別克語訓練“父”模型,使用土耳其語和維吾爾語訓練“子”模型)。雖然文獻[61]利用了同類型語言句法相似性的優(yōu)勢,但在低資源語言上訓練的效果遠不及高資源語言的訓練效果。文獻[62]比較了數(shù)據(jù)量和語言相似性對遷移學習方法的影響,發(fā)現(xiàn)高資源語言的數(shù)據(jù)量比語言的相似性更重要。相反,文獻[63]介紹了語言相似性對遷移學習的影響,他們認為選擇與低資源語言更相似的語言效果更好。為了平衡這兩個問題,文獻[64]提出了分層遷移學習方法,通過添加中間層,結(jié)合高資源語言的數(shù)據(jù)量優(yōu)勢和相似語言的句法相似性優(yōu)勢。NMT 模型依次在不相關(guān)的高資源語言對(英語-漢語)、相似中間語言對(土耳其語-英語)和低資源語言對(維吾爾語-漢語)上進行訓練,并逐層傳遞和微調(diào)參數(shù),與傳統(tǒng)遷移學習方法相比,該方法在維-漢翻譯任務中的性能有所提高。

    數(shù)據(jù)增強和遷移學習是解決低資源機器翻譯任務的有效方法,文獻[65]介紹了反向翻譯技術(shù)與不同的遷移學習體系結(jié)構(gòu)相結(jié)合的方法,探索了預處理和訓練方法的差異,并證明了聯(lián)合反向翻譯和遷移學習方法的有效性。

    1.3.3 預訓練模型

    預訓練模型的基本思想是在大規(guī)模訓練語料上預先訓練神經(jīng)網(wǎng)絡模型,從中學習通用的語言學知識,然后通過微調(diào)來適應下游任務。在主流語言中,預訓練模型已廣泛應用于機器翻譯領(lǐng)域,研究主要集中在以下2 個方面:1)將現(xiàn)有的預訓練模型與NMT 融合在一起[66-72];2)針對機器翻譯任務設計特有的端到端的預訓練模型[73-81]。

    在維吾爾語機器翻譯領(lǐng)域,為了利用預訓練模型中的豐富語言學知識,文獻[82]介紹了基于BERT-fused[66]模型的漢語-維吾爾語的機器翻譯方法,并提出一種兩段式微調(diào)的策略進一步提高模型性能,如圖7所示。文獻[83]提出一種新的預訓練方法,其主要思想是對輸入序列掩碼時,不僅對源語言的Token 進行掩碼處理,而且將未掩碼詞按一定比例來替換成目標語言的待翻譯詞,該研究將這種預訓練方法與預訓練模型(XLM 和MASS)相結(jié)合,在維-漢和漢-維翻譯任務上實現(xiàn)了明顯的性能提升。

    圖7 基于BERT-fused 的維吾爾語機器翻譯Fig.7 Uyghur machine translation based on BERT-fused

    隨著機器翻譯領(lǐng)域的不斷發(fā)展,低資源機器翻譯受到學者廣泛的關(guān)注。2022 年,文獻[81]提出了支持202 種語言之間任意互譯的大規(guī)模機器翻譯模型(NLLB),202 種語言中的大部分屬于低資源語言,其中包含維吾爾語語料。NLLB 模型主體架構(gòu)是在pre-LN 結(jié)構(gòu)的Transformer 模型基礎(chǔ)上融入稀疏門控混合專家(MoE)模塊,MoE 是一種條件計算模型,以最小化不相關(guān)語言之間的干擾。此外,文獻[84]提出了針對中國少數(shù)民族語言(維吾爾語、蒙古語、藏語)的生成式預訓練語言模型(CMPT),并將其開源,為中國少數(shù)民族語言的發(fā)展奠定了堅實的基礎(chǔ)。

    1.4 基于統(tǒng)計和基于神經(jīng)網(wǎng)絡的機器翻譯的結(jié)合

    基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯發(fā)展早期,其效果不如基于統(tǒng)計的機器翻譯模型[37],為了改善翻譯質(zhì)量,文獻[85-88]介紹了NMT 模型與SMT 模型相結(jié)合的方法,有效提高了維-漢的翻譯質(zhì)量。此外,在模型結(jié)合過程中,引入詞素[89]、詞干詞綴[90]等特征有助于緩解翻譯過程中的數(shù)據(jù)稀疏問題。另外,文獻[91]提出了基于記憶結(jié)構(gòu)的神經(jīng)機器翻譯模型(M-NMT),該模型由基于注意力機制的神經(jīng)網(wǎng)絡和內(nèi)存組件兩部分構(gòu)成,使用了SMT 產(chǎn)生的單詞映射,該方法旨在處理維-漢翻譯過程中的未登錄詞問題。

    1.5 基于統(tǒng)計的維吾爾語機器翻譯總結(jié)

    綜上所述,傳統(tǒng)的維吾爾語機器翻譯研究主要采用了基于規(guī)則和實例、基于統(tǒng)計兩種方法。其中,基于規(guī)則和實例的方法在特定領(lǐng)域和任務中表現(xiàn)出色,例如醫(yī)學、法律、金融等,具有特定術(shù)語和短語。規(guī)則可以針對這些領(lǐng)域中的特殊術(shù)語進行優(yōu)化,以提高翻譯質(zhì)量,但基于規(guī)則和實例方法存在人工編寫成本高、詞典維護困難以及通用領(lǐng)域的適用性差等局限。相比之下,基于統(tǒng)計的方法則對大規(guī)模數(shù)據(jù)有較好的適應性,通過學習大量的雙語平行語料,能夠自動捕捉語言之間的轉(zhuǎn)換規(guī)律。對于較短的句子,基于統(tǒng)計的方法通常能夠提供較好的翻譯質(zhì)量,因為它們能夠更快地學習到句子中的短程依賴關(guān)系。然而,在數(shù)據(jù)稀缺的情況下,這些方法可能會面臨困難,因為它們的性能很大程度上依賴于可用的訓練數(shù)據(jù)。此外,需要強調(diào)的是,大多數(shù)早期研究都是在自行構(gòu)建的語料庫(未公開)上進行訓練與測試的,這在一定程度上限制了傳統(tǒng)方法的推廣和泛化能力。

    隨著深度學習技術(shù)的迅猛發(fā)展,神經(jīng)機器翻譯方法逐漸成為機器翻譯任務的核心方法,該方法在大規(guī)模平行語料庫下表現(xiàn)優(yōu)異,能夠從海量數(shù)據(jù)中自動學習語言之間的轉(zhuǎn)換規(guī)律,適用于處理各種語言對和領(lǐng)域,在高資源語言對中表現(xiàn)更優(yōu),但在數(shù)據(jù)稀缺的情況下性能有所下降。然而,在各種數(shù)據(jù)增強以及模型優(yōu)化方法的加成下,神經(jīng)機器翻譯方法逐漸成為維吾爾語機器翻譯任務的核心方法,這種趨勢也得益于更加規(guī)范和客觀的評價標準,如全國機器翻譯大會(CCMT)可以保證評價的客觀性和可比性,為維吾爾語機器翻譯研究奠定了堅實基礎(chǔ),如表3 所示,基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯研究大多使用CCMT 提供的語料庫進行訓練和評估,不同年份提供的語料不完全相同。近年來興起的預訓練模型憑借其強大的表示學習能力和高質(zhì)量的翻譯輸出受到廣泛關(guān)注,但也需要面對計算資源成本高、模型可解釋性差等挑戰(zhàn)。

    表3 基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯實驗結(jié)果Table 3 Experimental results of Uyghur machine translation based on neural network

    總之,任何一項技術(shù)都有其優(yōu)勢和局限,對于維吾爾語機器翻譯而言,并沒有一種絕對最優(yōu)的翻譯方法。當前機器翻譯領(lǐng)域正處于不斷發(fā)展和變革之中,目前已出現(xiàn)具有通用能力的大語言模型(LLM),如ChatGPT、GPT-4[92]等,這些模型在各項NLP 任務中取得了重大突破,同時也為低資源機器翻譯研究提供了新的可能性?;谶@一背景,第3 節(jié)主要分析目前典型的大語言模型ChatGPT 在維-漢機器翻譯任務上的能力。

    2 維吾爾語機器翻譯相關(guān)資源

    2.1 相關(guān)學術(shù)活動

    本世紀以來,國內(nèi)外機構(gòu)針對維吾爾語機器翻譯進行了大量研究,國外主要是ACL、EMNLP、COLING 等國際頂級會議,國內(nèi)有關(guān)維吾爾語機器翻譯的相關(guān)學術(shù)活動,如表4 所示,在國內(nèi)學術(shù)會議中,全國機器翻譯大會(CCMT)在維吾爾語機器翻譯領(lǐng)域作出了巨大貢獻,該會議舉辦了維-漢、蒙-漢等雙語翻譯任務以及其他以中文為核心的翻譯任務,為研究人員提供了實踐平臺。此外,CCMT 免費開源了17 萬左右的語料供學術(shù)界研究,這些語料的共享不僅促進了學術(shù)界的合作與交流,也為維吾爾語機器翻譯技術(shù)的發(fā)展奠定了堅實的基礎(chǔ)。

    表4 維吾爾語機器翻譯相關(guān)學術(shù)活動Table 4 Academic activities related to Uyghur machine translation

    2.2 語料庫

    語料庫是指收集并科學加工后的電子語言材料[93]。維吾爾語作為一種低資源語言,語料稀缺,而神經(jīng)機器翻譯的發(fā)展需要大量語料的支撐。因此,構(gòu)建大規(guī)模、高質(zhì)量的平行語料庫對維吾爾語機器翻譯研究至關(guān)重要。目前維吾爾語平行語料涉及到的語言主要為漢語[94-96]和英語[81,97],也有部分其他低資源語言[98],相關(guān)語料資源具體情況如表5 所示。基于規(guī)則和實例以及統(tǒng)計的維吾爾語機器翻譯研究大多使用自建的語料庫,并沒有公開相關(guān)語料庫,后續(xù)的基于神經(jīng)網(wǎng)絡的維吾爾語機器翻譯大多使用CCMT 提供的語料庫進行維漢機器翻譯研究,不同年份提供的語料不完全相同,具體結(jié)果對比見表3。NLLB 模型中維吾爾語訓練語料使用的是TIL 語料庫,測試語料是FLORES-200,漢-維翻譯的最好結(jié)果ChrF++值為37.3%,spBLEU(spm-200)值為22%,維-漢翻譯的最好結(jié)果ChrF++值為17.7%,spBLEU(spm-200)值為20.4%。

    3 基于ChatGPT 的維-漢機器翻譯評估

    當前大模型技術(shù)發(fā)展迅速,以ChatGPT 為代表的通用型人工智能模型的出現(xiàn)為低資源機器翻譯帶來了新的可能性。ChatGPT 基于GPT-3.5 模型,通過人類反饋強化學習(RLHF)微調(diào)而成。本文實驗主要采用GPT-3.5-turbo 模型進行研究,該模型價格實惠且對話能力較強,適用于大多數(shù)任務。實驗旨在多維度挖掘ChatGPT 模型在維-漢機器翻譯任務上的能力,使用上下文學習(ICL)和思維鏈(CoT)方法對維吾爾語機器翻譯任務進行初步探索。

    3.1 評估指標

    實驗采用自動評價的方法進行評估,使用scareBLEU 開源的機器雙語互譯評估(BLEU[99])、ChrF++[100]以及COMET 3種評價指標分別從詞級、字符級和語義方面進行綜合評估。

    BLEU[99]評估方法是使用最廣泛的機器翻譯評價指標,從單詞級對翻譯結(jié)果進行評估,它使用n-gram 匹配方法對機器翻譯生成的文本與參考譯文之間的相似性進行度量,n-gram 取值通常為4,表示1~4 個連續(xù)單詞組成的單元,BLEU 值分數(shù)越高,翻譯質(zhì)量越好,計算方式如式(3)、式(4)所示:

    其中:BBP是短句懲罰因子,防止機器翻譯的文本較短而導致不合理分數(shù),因此對短句進行懲罰;c為機器翻譯的文本長度;r為參考譯文的長度;p n為n-gram 準確率。

    CChrF是一種從字符級對機器翻譯的文本質(zhì)量進行評估的方法,計算方式如式(5)所示:

    其中:CChrP為精確率(查準率),表示機器翻譯生成的文本和參考譯文相匹配的字符級n-gram 在機器翻譯生成的文本中所占比例;CChrR為召回率(查全率),表示機器翻譯生成的文本和參考譯文相匹配的字符級n-gram 在參考譯文中所占比例,是調(diào)節(jié)查準率和查全率之間的權(quán)重參數(shù)。

    ChrF++[100]是ChrF 的一種改進版本,在上述基礎(chǔ)上加入單詞級評估,取平均值,文中提出字符級n-gram 中n取值為6,詞級n-gram 中n取值為2。本文實驗使用ChrF++進行評估。

    COMET[101]是一種基于神經(jīng)網(wǎng)絡模型的評價指標,更貼合人類的評測,該方法將機器翻譯生成的譯文、源語言文本和參考譯文的信息三者相結(jié)合進行預測,并且能捕捉翻譯文檔中微弱的差異。實驗使用COMET-22[102](wmt22-comet-da)進行度量。

    3.2 實施細節(jié)

    實驗使用CCMT2021 維-漢驗證數(shù)據(jù)集中的前100 條數(shù)據(jù)進行評估,通過調(diào)用GPT-3.5-turbo 模型的API 完成,溫度參數(shù)設置為0℃,對于ChatGPT 模型而言,溫度參數(shù)越高,生成的句子多樣性越強,溫度參數(shù)越低,生成的句子越準確。在ICL 實驗中,Zeroshot 實驗主要評估不同的模板對維-漢翻譯任務的影響,并選擇其中最好的模板進行Few-shot 實驗,受ChatGPT 模型最大Token 數(shù)限制,ICL 的Few-shot 實驗最大進行20-shot;在CoT 實驗中,Zero-shot 實驗同樣先評估哪種模板效果最好,效果最好的模板進行后續(xù)的Few-shot 實驗,CoT 的Few-shot 實驗最大進行12-shot,實驗代碼將被公開發(fā)布于Github 平臺,以供廣泛查閱與使用。

    3.3 ICL 實驗結(jié)果

    3.3.1 Zero-shot

    在機器翻譯任務中,Prompt 的格式直接影響LLM 對任務的理解能力[103]。為更好地激發(fā)ChatGPT 在低資源語言上的翻譯潛力,本節(jié)探討4 種典型模板,分為任務提示和答案提示兩種類型,如表6 所示。

    表6 Prompt 模板Table 6 Prompt templates

    任務提示型模板(T1 和T2)在輸入過程中明確指示ChatGPT 模型要對輸入的句子進行翻譯任務。答案提示型模板(T3 和T4)雖不直接提示任務,但通過Prompt 的設計能引導出問題的答案。在表6 中,{input_text}表示輸入文本,{src}表示源語言,{tgt}表示目標語言,T1~T4 表示不同的模板。不同Prompt 模板在維-漢翻譯任務上的實驗結(jié)果如表7 所示(其中加粗數(shù)字表示最優(yōu)值,下同)。

    表7 不同Prompt 模板的實驗結(jié)果Table 7 Experimental results of different Prompt templates %

    根據(jù)表7 所示結(jié)果,綜合3 種評價指標,T1 取得了最好的翻譯結(jié)果。因此,在后續(xù)Few-shot 的實驗中將選取T1 作為主要的Prompt 模板。

    3.3.2 Few-shot

    本節(jié)主要探討ICL 方法在Few-shot 情況下對維-漢機器翻譯任務的影響,實驗結(jié)果如表8 所示。

    表8 ICL Few-shot 實驗結(jié)果Table 8 Experimental results of ICL Few-shot %

    從表8 可以看出,隨著示例數(shù)的增加,翻譯效果呈現(xiàn)先升高后下降的趨勢,在10-shot 情況下達到最佳效果。在Few-shot 翻譯過程中,有時會在輸出翻譯結(jié)果的同時輸出示例句子,因此需要手動刪除多余的示例,確保輸出結(jié)果的準確性。此外,隨著示例數(shù)的增多,模型可能更容易過度擬合,導致在Few-shot 情況下出現(xiàn)性能下降。然而,在10-shot 時模型能夠更好地利用示例信息,獲得更準確的翻譯結(jié)果。因此,找到適當?shù)氖纠龜?shù)量對于實現(xiàn)高質(zhì)量的Few-shot 翻譯至關(guān)重要。

    3.4 CoT 實驗結(jié)果

    3.4.1 Zero-shot

    受文獻[104-106]中CoT Prompting 模板的啟發(fā),本節(jié)選取了3 種典型的CoT 策略,如表9所示。

    表9 CoT Prompting 模板Table 9 CoT Prompting templates

    從表10 的實驗結(jié)果來看,與ICL 的實驗結(jié)果相比,CoT 并未取得更好的翻譯性能,反而導致了性能下降。這可能是因為CoT 的逐字逐句翻譯方式反而削弱了翻譯模型的表現(xiàn)能力。

    表10 不同CoT Prompting 模板實驗結(jié)果Table 10 Experimental results of different CoT Prompting templates %

    在翻譯過程中,相較于CoT1,其他兩種模板更容易出現(xiàn)以下問題:1)只翻譯英文而不生成最終的完整譯文;2)一步一步地翻譯出單詞、短語或部分句子的譯文而沒有進行整體翻譯。此外,還可能出現(xiàn)“讓我們逐步思考”等類似語句的輸出,或者直接輸出維吾爾語而不進行翻譯,這些問題導致了翻譯效果的不佳。

    3.4.2 Few-shot

    本節(jié)主要評估CoT 方法在Few-shot 情況下對維-漢機器翻譯任務的影響。受ChatGPT 模型最大Token 數(shù)限制,本節(jié)最多進行到12-shot 的實驗,分別設定了1、3、5、10、12 共5 種Few-shot 情況,實驗結(jié)果如表11 所示。從表11 可知,10-shot 獲得了最佳結(jié)果,12-shot 出現(xiàn)了下降趨勢,然而并沒有超越ICL 實驗的最佳結(jié)果。與其他NLP 任務不同,在維-漢機器翻譯任務中,CoT 方法沒能更好地挖掘大模型的潛力。這可能是由于維吾爾語在ChatGPT 的訓練語料中相對較為稀缺,同時中文也非ChatGPT 的主要語言。

    表11 CoT Few-shot 實驗結(jié)果Table 11 Experimental results of CoT Few-shot %

    本文實驗僅是對CoT 方法在維-漢機器翻譯任務上的初步探索,未來的研究將從CoT Prompting 模板的設計入手,并結(jié)合維吾爾語的特性,如詞典、語法規(guī)則等外部知識,進一步深入研究和優(yōu)化翻譯性能。

    4 未來展望

    盡管維吾爾語機器翻譯相關(guān)研究已取得一定進展,但是由于維吾爾語存在構(gòu)詞復雜、詞序和書寫順序特殊以及語料稀缺等問題,其發(fā)展相對滯后,仍面臨著許多挑戰(zhàn)亟待解決。例如:如何進一步緩解維吾爾語機器翻譯中存在的形態(tài)復雜、語料稀缺等問題;如何構(gòu)建融入更多維吾爾語特色的機器翻譯模型等。

    此外,隨著LLM 的出現(xiàn),為機器翻譯領(lǐng)域帶來了新的可能性。與以往的NMT 方法不同,LLM 在訓練過程中不再嚴重依賴于大規(guī)模的平行語料庫。相反,LLM 僅需利用小規(guī)模但高質(zhì)量的語料,通過指令微調(diào)和ICL 等技術(shù),便能獲得出色的翻譯效果。然而,在一些類似維吾爾語到漢語這樣的低資源機器翻譯任務中,雖然LLM 在翻譯質(zhì)量上有所表現(xiàn),但仍難以與傳統(tǒng)的NMT 模型相媲美。因此,基于LLM 的低資源機器翻譯仍需進一步深入研究和探索。本節(jié)主要從5 個方面進行展望。

    1)構(gòu)建高質(zhì)量維吾爾語平行語料庫

    在LLM 時代,機器翻譯已不再過度依賴于龐大的語料庫,而對語料質(zhì)量的要求愈發(fā)突顯。然而,當前公開可用的維吾爾語語料資源仍相對匱乏,在CCMT2023 提供的語料中,藏漢、蒙漢有100 多萬條,而維漢語料僅有17 萬條。此外,目前可供使用的維吾爾語公開語料庫主要集中在新聞領(lǐng)域,缺乏其他領(lǐng)域(如日常生活、醫(yī)學等)的語料庫。因此,構(gòu)建維吾爾語平行語料庫亟需完成,通過自動或半自動的手段構(gòu)建,并邀請相關(guān)語言學專家參與糾錯和提升質(zhì)量的工作。通過提供更加豐富和準確的訓練數(shù)據(jù),幫助改善維吾爾語機器翻譯的質(zhì)量,并推動其在實際應用中的發(fā)展。

    2)引入多模態(tài)信息

    多模態(tài)翻譯是當前機器翻譯領(lǐng)域的研究熱點之一,支持文字、圖像、語音等多種模態(tài)之間相互翻譯。因此,維吾爾語機器翻譯在未來發(fā)展中可以此為切入點進行研究,通過引入圖像和語音等多種信息,可以豐富翻譯模型的輸入,增強其對上下文的理解和表達能力,從而提高維吾爾語機器翻譯的準確性和流暢性。這種方法可以有效緩解維吾爾語機器翻譯中的語料稀缺問題,并更好地滿足實際生活需求。

    3)LLM 融入語法知識

    LLM 本身積累了大量的多語言知識,然而,其主要在以英文為中心的語料上進行訓練,包含低資源語言(如維吾爾語、蒙古語等)的數(shù)據(jù)非常有限。因此,在將LLM 應用于低資源機器翻譯任務時,可以考慮在Prompt 設計中引入詞典、句法結(jié)構(gòu)等語言學知識,以幫助模型更好地學習低資源語言的語言學特性,從而提高翻譯性能。

    4)構(gòu)建以中文為核心的多語言機器翻譯模型

    新疆作為中國“絲綢之路經(jīng)濟帶”核心區(qū),擁有獨特地理位置和資源優(yōu)勢,通過構(gòu)建以中文為核心的多語言機器翻譯模型(涵蓋維吾爾語、中亞語言等低資源語言)可以更好地促進“一帶一路”倡議的實施,并通過深入挖掘漢語與維吾爾語等語言之間的聯(lián)系,優(yōu)化翻譯性能。

    5)基于LLM 的機器翻譯

    LLM 參數(shù)量巨大,小型研究團隊難以承擔如此龐大的計算資源需求。此外,NMT 蒸餾、剪枝、壓縮等模型小型化技術(shù)在LLM 上同樣適用,因此,探索LLM 的參數(shù)高效微調(diào)方法以及探索大模型的小型化技術(shù),將是未來低資源機器翻譯研究的重要發(fā)展道路。

    5 結(jié)束語

    維吾爾語機器翻譯是一項具有重要價值的研究工作,不僅僅局限于簡單的文本翻譯,而是承載著不同地區(qū)和民族之間文化、生活、經(jīng)濟等交流的重要橋梁。本文回顧了維吾爾語機器翻譯的相關(guān)研究,并匯總了相關(guān)學術(shù)活動和語料庫資源。此外,采用ChatGPT 模型對維-漢機器翻譯任務進行了初步探索,為后續(xù)學者的研究奠定了一定基礎(chǔ)。最后對維吾爾語機器翻譯未來的發(fā)展趨勢進行了展望??傮w而言,神經(jīng)機器翻譯的持續(xù)發(fā)展為維吾爾語機器翻譯帶來了巨大突破。然而,在語料庫構(gòu)建、方法創(chuàng)新、語言特色以及翻譯廣度等方面仍存在欠缺,需要進一步進行創(chuàng)新和研究。

    猜你喜歡
    語言方法模型
    一半模型
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    語言是刀
    文苑(2020年4期)2020-05-30 12:35:30
    讓語言描寫搖曳多姿
    累積動態(tài)分析下的同聲傳譯語言壓縮
    可能是方法不對
    3D打印中的模型分割與打包
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    乱系列少妇在线播放| 一级,二级,三级黄色视频| 精品一区二区免费观看| 99久久精品一区二区三区| 在线精品无人区一区二区三| av免费观看日本| 国产日韩一区二区三区精品不卡 | 夫妻午夜视频| 一级毛片我不卡| 亚洲精品国产av蜜桃| 国产毛片在线视频| 最新的欧美精品一区二区| 九色成人免费人妻av| 久久午夜福利片| 青春草国产在线视频| 久久婷婷青草| 中文字幕人妻丝袜制服| 又粗又硬又长又爽又黄的视频| 一本久久精品| 国产日韩欧美在线精品| 伊人亚洲综合成人网| 啦啦啦在线观看免费高清www| 亚洲成人手机| 蜜桃久久精品国产亚洲av| 免费大片黄手机在线观看| 亚洲美女黄色视频免费看| 成人影院久久| 91精品国产九色| 亚洲国产精品999| 婷婷色麻豆天堂久久| 日本vs欧美在线观看视频 | 大话2 男鬼变身卡| 男女边吃奶边做爰视频| 青春草国产在线视频| 国产又色又爽无遮挡免| 91aial.com中文字幕在线观看| 午夜久久久在线观看| 亚洲国产色片| 国产又色又爽无遮挡免| 五月伊人婷婷丁香| videossex国产| 亚洲精品乱码久久久v下载方式| 黄色一级大片看看| 久久久久久伊人网av| 六月丁香七月| 国产深夜福利视频在线观看| 亚洲第一区二区三区不卡| 色吧在线观看| 人妻少妇偷人精品九色| 日韩成人伦理影院| 少妇被粗大猛烈的视频| 午夜福利视频精品| 国产日韩欧美在线精品| freevideosex欧美| 一区二区三区四区激情视频| 九九爱精品视频在线观看| 成人免费观看视频高清| 一本色道久久久久久精品综合| 精品久久久精品久久久| 成人综合一区亚洲| 日产精品乱码卡一卡2卡三| 国产精品一区二区在线不卡| 国产精品蜜桃在线观看| 大陆偷拍与自拍| 极品人妻少妇av视频| 18禁在线无遮挡免费观看视频| 亚洲不卡免费看| 久久女婷五月综合色啪小说| 亚洲国产欧美在线一区| 久久精品夜色国产| 免费看光身美女| 看非洲黑人一级黄片| 久久6这里有精品| 国产欧美日韩一区二区三区在线 | 又大又黄又爽视频免费| 一区二区三区乱码不卡18| 亚洲不卡免费看| 99精国产麻豆久久婷婷| 国产欧美另类精品又又久久亚洲欧美| 狂野欧美激情性bbbbbb| 不卡视频在线观看欧美| 菩萨蛮人人尽说江南好唐韦庄| 成人无遮挡网站| 91成人精品电影| 在线天堂最新版资源| 免费不卡的大黄色大毛片视频在线观看| 美女cb高潮喷水在线观看| 免费少妇av软件| 午夜福利网站1000一区二区三区| 青春草亚洲视频在线观看| 一级黄片播放器| 国产毛片在线视频| 亚洲国产精品专区欧美| 国产片特级美女逼逼视频| 80岁老熟妇乱子伦牲交| 日韩中字成人| 一本大道久久a久久精品| 精品久久久噜噜| 国产女主播在线喷水免费视频网站| 有码 亚洲区| 欧美xxxx性猛交bbbb| 在线播放无遮挡| 日本av免费视频播放| 亚洲欧美日韩卡通动漫| 久久久久久久亚洲中文字幕| 天天操日日干夜夜撸| 男女边吃奶边做爰视频| 亚洲av不卡在线观看| 看十八女毛片水多多多| 最近最新中文字幕免费大全7| 亚洲av免费高清在线观看| 亚洲丝袜综合中文字幕| 免费观看a级毛片全部| 久久 成人 亚洲| 精品亚洲乱码少妇综合久久| 国产精品久久久久久久电影| 成人影院久久| 亚洲国产精品国产精品| 日韩av不卡免费在线播放| 在线观看国产h片| 男人狂女人下面高潮的视频| 夜夜看夜夜爽夜夜摸| 日韩三级伦理在线观看| 国产 精品1| 成年av动漫网址| 欧美激情极品国产一区二区三区 | 国产在线免费精品| 国产亚洲欧美精品永久| 超碰97精品在线观看| 国产白丝娇喘喷水9色精品| 搡女人真爽免费视频火全软件| 性色avwww在线观看| 青春草视频在线免费观看| 男人舔奶头视频| 日韩成人av中文字幕在线观看| 久久久久久人妻| 国产精品久久久久久久电影| 777米奇影视久久| 亚洲av免费高清在线观看| 两个人免费观看高清视频 | 免费黄网站久久成人精品| 全区人妻精品视频| 一级二级三级毛片免费看| 精品99又大又爽又粗少妇毛片| 人体艺术视频欧美日本| 一级二级三级毛片免费看| 自线自在国产av| 亚洲第一区二区三区不卡| 亚洲欧洲精品一区二区精品久久久 | 九色成人免费人妻av| 亚洲欧美日韩另类电影网站| 大香蕉久久网| 多毛熟女@视频| 成人二区视频| 亚洲国产精品一区二区三区在线| 国产黄片视频在线免费观看| 久久精品熟女亚洲av麻豆精品| 国产精品偷伦视频观看了| 美女福利国产在线| 国产午夜精品一二区理论片| 国产熟女午夜一区二区三区 | 亚洲国产毛片av蜜桃av| 亚洲激情五月婷婷啪啪| 性色avwww在线观看| 人妻 亚洲 视频| 黄片无遮挡物在线观看| 久久午夜福利片| 国产欧美日韩精品一区二区| 一区二区av电影网| 亚洲欧美日韩另类电影网站| 性高湖久久久久久久久免费观看| 成人特级av手机在线观看| 18禁动态无遮挡网站| 国产熟女欧美一区二区| 青青草视频在线视频观看| 久久精品国产鲁丝片午夜精品| 两个人的视频大全免费| 91精品伊人久久大香线蕉| 日本91视频免费播放| 国产黄色免费在线视频| 男男h啪啪无遮挡| 夜夜爽夜夜爽视频| 视频区图区小说| 久久久久精品性色| 国产精品一区二区在线观看99| 日本猛色少妇xxxxx猛交久久| 丝袜在线中文字幕| 日韩av不卡免费在线播放| 日日摸夜夜添夜夜爱| 国产免费又黄又爽又色| 视频区图区小说| 曰老女人黄片| 色网站视频免费| 激情五月婷婷亚洲| 亚洲av成人精品一区久久| av播播在线观看一区| 国模一区二区三区四区视频| 十八禁网站网址无遮挡 | 日日摸夜夜添夜夜添av毛片| 日韩三级伦理在线观看| 欧美成人午夜免费资源| 亚洲精品,欧美精品| 一级毛片我不卡| a级片在线免费高清观看视频| 极品人妻少妇av视频| 在线免费观看不下载黄p国产| av有码第一页| 日韩av免费高清视频| 如何舔出高潮| 久久久午夜欧美精品| 精品国产国语对白av| 欧美变态另类bdsm刘玥| 777米奇影视久久| 如何舔出高潮| 久久99精品国语久久久| 午夜福利影视在线免费观看| 伦精品一区二区三区| 日韩大片免费观看网站| 一级av片app| 国产免费福利视频在线观看| 色视频在线一区二区三区| 欧美一级a爱片免费观看看| 精华霜和精华液先用哪个| 亚洲国产色片| 国产精品久久久久久久电影| 国产精品久久久久久av不卡| 午夜视频国产福利| 国产一区亚洲一区在线观看| 亚洲精品国产av蜜桃| a级毛片在线看网站| 99久久综合免费| 久久久欧美国产精品| 久久久久久久久大av| 国产精品国产三级国产专区5o| 欧美区成人在线视频| 成人漫画全彩无遮挡| 少妇精品久久久久久久| 国产极品粉嫩免费观看在线 | 国产91av在线免费观看| 日本av免费视频播放| 中文乱码字字幕精品一区二区三区| www.av在线官网国产| 国产亚洲午夜精品一区二区久久| 久久久久久久亚洲中文字幕| 亚洲伊人久久精品综合| 美女视频免费永久观看网站| 日日啪夜夜撸| 国产精品一区www在线观看| 欧美最新免费一区二区三区| 亚洲,一卡二卡三卡| 少妇的逼水好多| 丰满人妻一区二区三区视频av| 国产69精品久久久久777片| 人妻夜夜爽99麻豆av| 啦啦啦视频在线资源免费观看| 久久这里有精品视频免费| 极品人妻少妇av视频| 国产69精品久久久久777片| 人妻夜夜爽99麻豆av| 亚洲成人手机| 五月开心婷婷网| 国产精品一区二区在线不卡| 国产在线男女| 国产精品免费大片| 成人综合一区亚洲| 亚洲一级一片aⅴ在线观看| 欧美 日韩 精品 国产| 亚洲激情五月婷婷啪啪| a 毛片基地| 国产有黄有色有爽视频| 好男人视频免费观看在线| 人妻一区二区av| 午夜久久久在线观看| 涩涩av久久男人的天堂| 亚洲美女视频黄频| 中文字幕亚洲精品专区| 国产真实伦视频高清在线观看| 熟女人妻精品中文字幕| 成人毛片60女人毛片免费| 好男人视频免费观看在线| 一个人看视频在线观看www免费| 九色成人免费人妻av| 97在线人人人人妻| 日本色播在线视频| 热re99久久精品国产66热6| 91久久精品电影网| 麻豆成人午夜福利视频| 日本免费在线观看一区| 性色avwww在线观看| 黄色一级大片看看| 亚洲,一卡二卡三卡| 熟女av电影| 国产精品免费大片| 国产一区有黄有色的免费视频| 欧美bdsm另类| 亚洲国产成人一精品久久久| 婷婷色综合大香蕉| 欧美成人精品欧美一级黄| 亚洲国产精品一区二区三区在线| 插阴视频在线观看视频| 欧美日韩综合久久久久久| 日韩成人av中文字幕在线观看| 人人妻人人看人人澡| 一级片'在线观看视频| 新久久久久国产一级毛片| 美女主播在线视频| 女性被躁到高潮视频| 久久久久久久久久人人人人人人| 免费观看性生交大片5| 亚洲精品一二三| 日本猛色少妇xxxxx猛交久久| 国产高清三级在线| 国产欧美另类精品又又久久亚洲欧美| 少妇精品久久久久久久| 亚州av有码| 国产乱人偷精品视频| 欧美bdsm另类| 99热这里只有精品一区| 日韩精品有码人妻一区| 成年av动漫网址| 日本午夜av视频| 国产视频内射| 欧美精品一区二区免费开放| 日本欧美国产在线视频| 美女脱内裤让男人舔精品视频| 91久久精品国产一区二区成人| 亚洲人成网站在线观看播放| 多毛熟女@视频| 国产色爽女视频免费观看| 亚洲av成人精品一二三区| 亚洲av综合色区一区| 亚洲av中文av极速乱| 在现免费观看毛片| 日本免费在线观看一区| 能在线免费看毛片的网站| 久久鲁丝午夜福利片| 狂野欧美激情性xxxx在线观看| 国产免费又黄又爽又色| 777米奇影视久久| av黄色大香蕉| 亚洲综合色惰| 精品人妻一区二区三区麻豆| 菩萨蛮人人尽说江南好唐韦庄| 国产一级毛片在线| 日本与韩国留学比较| 亚洲欧美中文字幕日韩二区| 国产女主播在线喷水免费视频网站| 亚洲欧美清纯卡通| 大陆偷拍与自拍| 免费观看无遮挡的男女| 大香蕉久久网| 午夜福利视频精品| 成人亚洲精品一区在线观看| 亚洲欧美日韩卡通动漫| 岛国毛片在线播放| 高清不卡的av网站| 久久久久国产网址| 久久97久久精品| 欧美+日韩+精品| 噜噜噜噜噜久久久久久91| 在线观看免费视频网站a站| 五月玫瑰六月丁香| 亚洲第一av免费看| xxx大片免费视频| 91成人精品电影| 草草在线视频免费看| 在线亚洲精品国产二区图片欧美 | 国产精品免费大片| 久久这里有精品视频免费| 大码成人一级视频| 精品久久久噜噜| 爱豆传媒免费全集在线观看| 中文在线观看免费www的网站| 九九久久精品国产亚洲av麻豆| 国产欧美日韩一区二区三区在线 | 一级a做视频免费观看| 免费少妇av软件| 最近最新中文字幕免费大全7| 久久精品国产鲁丝片午夜精品| 久久精品国产自在天天线| 亚洲精品456在线播放app| 国产黄频视频在线观看| 男人狂女人下面高潮的视频| 3wmmmm亚洲av在线观看| 蜜桃久久精品国产亚洲av| 最新中文字幕久久久久| 丝瓜视频免费看黄片| 久久精品久久久久久噜噜老黄| 婷婷色av中文字幕| 国产真实伦视频高清在线观看| 妹子高潮喷水视频| 日韩中字成人| 精品人妻一区二区三区麻豆| av又黄又爽大尺度在线免费看| 日本欧美视频一区| 免费av中文字幕在线| 国产精品人妻久久久久久| 18禁在线播放成人免费| 国产成人精品福利久久| 能在线免费看毛片的网站| 一级毛片黄色毛片免费观看视频| 国产精品久久久久久精品电影小说| 精品人妻偷拍中文字幕| 青春草国产在线视频| 午夜av观看不卡| 极品教师在线视频| www.色视频.com| av在线老鸭窝| 免费av中文字幕在线| 日韩成人伦理影院| 一二三四中文在线观看免费高清| 色网站视频免费| 国内精品宾馆在线| 久久久久久久久久久久大奶| 久久精品久久久久久久性| 亚洲天堂av无毛| 精品99又大又爽又粗少妇毛片| 日韩制服骚丝袜av| 久久国产精品男人的天堂亚洲 | 18禁裸乳无遮挡动漫免费视频| 黄色欧美视频在线观看| 国产高清国产精品国产三级| 国产成人freesex在线| 国产精品久久久久久av不卡| 久久人妻熟女aⅴ| av女优亚洲男人天堂| 男女边摸边吃奶| 国产亚洲一区二区精品| a级片在线免费高清观看视频| 欧美日韩视频高清一区二区三区二| 久久久久国产网址| 亚洲精品国产av成人精品| 两个人的视频大全免费| 丰满饥渴人妻一区二区三| 精华霜和精华液先用哪个| 亚洲av在线观看美女高潮| 各种免费的搞黄视频| 久久狼人影院| 青青草视频在线视频观看| av有码第一页| 男人和女人高潮做爰伦理| 久久免费观看电影| 欧美成人精品欧美一级黄| 精品一区二区免费观看| 在线观看免费视频网站a站| 成人18禁高潮啪啪吃奶动态图 | 久久99一区二区三区| 久久精品夜色国产| 最黄视频免费看| 国产日韩欧美亚洲二区| 97在线视频观看| 麻豆成人av视频| av卡一久久| 一级毛片黄色毛片免费观看视频| 最近的中文字幕免费完整| 如日韩欧美国产精品一区二区三区 | 人妻系列 视频| 亚洲天堂av无毛| 国产乱人偷精品视频| 久久人人爽人人爽人人片va| 麻豆成人av视频| 热re99久久国产66热| 免费观看av网站的网址| 麻豆乱淫一区二区| 一区二区av电影网| 成年女人在线观看亚洲视频| 校园人妻丝袜中文字幕| 全区人妻精品视频| 少妇熟女欧美另类| 又大又黄又爽视频免费| 夜夜骑夜夜射夜夜干| 午夜福利网站1000一区二区三区| 热re99久久精品国产66热6| 草草在线视频免费看| 成人综合一区亚洲| 色视频在线一区二区三区| av天堂中文字幕网| 水蜜桃什么品种好| 26uuu在线亚洲综合色| 国产色爽女视频免费观看| 欧美少妇被猛烈插入视频| 日本黄色日本黄色录像| 高清欧美精品videossex| 亚洲av中文av极速乱| 亚洲精品国产av蜜桃| 国产精品人妻久久久影院| 欧美老熟妇乱子伦牲交| 王馨瑶露胸无遮挡在线观看| 美女大奶头黄色视频| 高清毛片免费看| 少妇的逼好多水| 在线精品无人区一区二区三| 最近手机中文字幕大全| 久久99精品国语久久久| 又爽又黄a免费视频| √禁漫天堂资源中文www| 国产成人freesex在线| 夜夜骑夜夜射夜夜干| 这个男人来自地球电影免费观看 | www.av在线官网国产| 大香蕉97超碰在线| av在线观看视频网站免费| 老熟女久久久| 成人特级av手机在线观看| 精品酒店卫生间| 国产片特级美女逼逼视频| 日本av免费视频播放| 中文在线观看免费www的网站| 91久久精品国产一区二区三区| 国产成人精品福利久久| 国产淫片久久久久久久久| 成人黄色视频免费在线看| 日本91视频免费播放| 在线观看国产h片| 国产男女超爽视频在线观看| 最近的中文字幕免费完整| 人人妻人人澡人人看| 午夜影院在线不卡| 亚洲情色 制服丝袜| 久久国产精品大桥未久av | 久久精品久久久久久噜噜老黄| 成人美女网站在线观看视频| 久久久久久久精品精品| 男女免费视频国产| 嘟嘟电影网在线观看| 大码成人一级视频| 亚洲欧美日韩东京热| 国产老妇伦熟女老妇高清| av免费观看日本| 成人综合一区亚洲| 免费观看无遮挡的男女| 国产永久视频网站| 精品99又大又爽又粗少妇毛片| 一级a做视频免费观看| 女人久久www免费人成看片| 亚洲欧美中文字幕日韩二区| 国内揄拍国产精品人妻在线| 久久久精品免费免费高清| 亚洲,一卡二卡三卡| 成人毛片a级毛片在线播放| 国产欧美日韩一区二区三区在线 | 免费黄色在线免费观看| 少妇人妻久久综合中文| 国产成人午夜福利电影在线观看| 最后的刺客免费高清国语| 亚洲精品,欧美精品| 少妇精品久久久久久久| 日本爱情动作片www.在线观看| 在线看a的网站| 女的被弄到高潮叫床怎么办| 国产亚洲欧美精品永久| 伦理电影大哥的女人| 国产黄色视频一区二区在线观看| 国产伦精品一区二区三区视频9| 久久毛片免费看一区二区三区| 久久午夜福利片| 国产亚洲5aaaaa淫片| 91成人精品电影| 国产综合精华液| 在线看a的网站| 久久久久久久国产电影| a级毛片免费高清观看在线播放| 久久久久久久久久人人人人人人| 久久99热6这里只有精品| 日韩三级伦理在线观看| 久久久久国产网址| 狂野欧美激情性bbbbbb| 久久久久久久久大av| 伦精品一区二区三区| 亚洲精品日本国产第一区| 免费播放大片免费观看视频在线观看| 欧美变态另类bdsm刘玥| 插阴视频在线观看视频| 亚洲天堂av无毛| 午夜免费观看性视频| videossex国产| 中文欧美无线码| 美女中出高潮动态图| 在线观看免费高清a一片| 日韩av在线免费看完整版不卡| 十八禁高潮呻吟视频 | 高清午夜精品一区二区三区| 婷婷色av中文字幕| 九色成人免费人妻av| 欧美最新免费一区二区三区| 欧美丝袜亚洲另类| 又粗又硬又长又爽又黄的视频| 成人免费观看视频高清| 国产精品国产三级国产专区5o| 亚洲精品色激情综合| www.av在线官网国产| 久久人人爽人人片av| 一本色道久久久久久精品综合| 免费大片黄手机在线观看| 久久久久国产精品人妻一区二区| 桃花免费在线播放| 久久精品国产亚洲av涩爱| 麻豆成人午夜福利视频| 日本vs欧美在线观看视频 | 我要看黄色一级片免费的| av免费观看日本| 国产午夜精品一二区理论片| 免费观看的影片在线观看| 少妇被粗大猛烈的视频| 亚洲欧美成人精品一区二区| 老司机影院成人| 国产一区二区在线观看av| 欧美+日韩+精品| 日韩 亚洲 欧美在线| 97超视频在线观看视频| 少妇高潮的动态图| 国产精品一二三区在线看| 九色成人免费人妻av| 精品国产露脸久久av麻豆| 中文字幕亚洲精品专区|