• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    不同語義認知視角下交互式智能翻譯方法研究

    2021-04-16 01:17:22何春燕
    宿州學(xué)院學(xué)報 2021年1期
    關(guān)鍵詞:短語語義語法

    何春燕

    甘肅醫(yī)學(xué)院外語教研室,甘肅平?jīng)?744000

    交互智能翻譯的技術(shù)難度主要是由于語序不一致和虛詞類型過多等原因所致,在句子翻譯過程中主要依賴虛詞的來源、時間和狀態(tài)等因素,從而增加了交互智能翻譯的難度[1]。交互式智能翻譯的研究對象是語言的生成問題,理解句意是語言生成的前提,通過對句法的深入分析和理解,可以提高翻譯的準確性[2]。

    文獻[3]提出基于雙語短語約束的交互式機器翻譯方法,交互式機器翻譯是通過機器翻譯系統(tǒng)與譯員之間的交互作用來引導(dǎo)計算機解碼的一種技術(shù)。目前主流的翻譯方法是用解釋器確定的前綴作為引導(dǎo)解碼的唯一標準,但交互作用有限,交互效率較低。采用短語表的多樣性排序算法,提升候選短語的多樣性,雙語短語和前綴一起約束解碼過程進行解碼,可減少翻譯時間。文獻[4]提出基于Transfer和Triangulation融合的中介語統(tǒng)計機器翻譯方法,這是一種以英語為介質(zhì)語言的德—漢翻譯方法,將Transfer方法與Triangulation方法的優(yōu)勢相融合,形成新的翻譯方法,采用解碼中介短語改善短語表,提升翻譯性能。在基于中介語的翻譯過程中,通過對中介語短語進行解碼,結(jié)合傳統(tǒng)中介語翻譯方法及其特點,可以改善短語翻譯方法。文獻[5]提出基于實例相似度檢測的蒙漢機器翻譯方法,提出了一種基于詞匯的多樣性排序算法來改進短語的候選詞,根據(jù)譯者的翻譯認知過程設(shè)計交互界面,提高翻譯過程中的用戶體驗。在翻譯算法方面,利用雙語短語和前綴作為約束,引導(dǎo)源語言短語的解碼,提高翻譯假設(shè)評估和過濾的準確性。

    盡管以上研究取得了相應(yīng)的研究成果,但由于不適合不同的語義認知角度的智能翻譯,而且在翻譯過程中準確率較低,因此本研究提出不同語義認知視角下交互式智能翻譯方法。以英漢翻譯為例,把語義單元理解和語義單元合成的句義理解結(jié)合起來,即一個語義單元存在于一個系統(tǒng)中,系統(tǒng)和被理解的對象形成了一種對應(yīng)關(guān)系,表示這個系統(tǒng)理解這個語義單元,理解一個句子中所有的語義單元就表示這個系統(tǒng)理解這個句義,并且這個系統(tǒng)還能理解整個句子中所有的語義單元之間的相互代入關(guān)系。基于不同語義構(gòu)建翻譯模型,計算短語相似度,完成交互式智能翻譯方法。人們?yōu)g覽不同語言資料時,可通過交互式智能翻譯方法實現(xiàn)實時翻譯,為以不同語言為母語的人們提供交流便利。

    1 不同語義認知視角下的翻譯方法

    根據(jù)語義信息的機器翻譯特征,構(gòu)建語義語法樹,實現(xiàn)交互式智能翻譯[6],具體步驟如下:

    步驟1:根據(jù)語義信息列舉語義單元;

    步驟2:基于語義語法樹獲取語義語法模式;

    步驟3:詞語對齊;

    步驟4:計算翻譯模型處理后的單詞翻譯概率,采用詞匯化加權(quán)公式計算該翻譯概率,獲取短語相似度,并作為新特征[7];

    步驟5:將新特征加入解碼器,輸出翻譯結(jié)果;圖1為不同語義認知視角下的翻譯技術(shù)路線圖。

    圖1 不同語義認知視角下的翻譯技術(shù)路線圖

    如圖1所示,列舉語義單元、獲取語義語法模式和詞語對齊在翻譯模型中占有重要地位。不同語義認知視角下的交互智能翻譯問題可以借鑒翻譯技術(shù)路線來實現(xiàn)[8]。

    1.1 列舉語義單元

    不同語言里的字與詞之間并非存在明顯的對應(yīng)關(guān)系,在不同語言里均有表述一致語義的句子,表示不同語言能夠互相翻譯[9]。每種語言的語義單元合成對應(yīng)語言的句子,字、詞、詞組與變量構(gòu)成語義單元。

    首先,分別從文本編碼器和圖像編碼器學(xué)習(xí)獨立的上下文向量的基礎(chǔ)上,列出語義單元需要考慮的文本和圖像[10];其次,在為文本和圖像學(xué)習(xí)共享空間時,要約束句子,使它們更接近共享空間中句子的意義,即語義一致。最終建立語義單元,并用語義單元表示概念,具體表示為:

    設(shè)置K種語言組成的語言合集Q={I-不同語言|I=1,2,…,G},式中,G=1。語言包括:漢語與英語等。其中,I-不同語言的一個句子的語義為句義(CC),I-不同語言∈Q。

    句義表示(PICC)是在每個I-不同語言中句義一致的句子,即該句義在每個I-不同語言中的句義。

    語義單元CV是在每個I-不同語言中表示意思一致的單元,(PICV)為在每個I-不同語言中的語義單元表示。

    句義(CC)即語義單元(CV)。(PICV)為I-不同語言中的語義單元表示,同時是I-不同語言中的句子。

    舉例說明:“王女士是營養(yǎng)師”的四個語義單元如表1所示,與其相應(yīng)的四個語義單元寫法如表2所示。

    表1 語義單元表

    表2 語義單元寫法

    1.2 語義語法模式

    1.2.1 語義語法樹

    語義語法樹表示不同概念之間的語義語法層次結(jié)構(gòu)。特指語義語法分類總稱為根節(jié)點S,即樹的頂端;語法分類名為枝節(jié)點,即第二層節(jié)點[11];語義分類名為第三層以下節(jié)點。將產(chǎn)生大量的單語義語法內(nèi)容,如配有文字說明的圖片等。圖像描述生成模型對輸入圖像進行自然語言描述,并對其進行標注,使圖像與語言相關(guān)聯(lián),即此種模式為語義語法樹的表現(xiàn)形式。

    根據(jù)同義詞詞林,綜合考慮其余語義概念層次結(jié)構(gòu)設(shè)置語義類別名稱。圖2、圖3分別是部分英語與漢語語義語法樹。

    圖2 英語語義語法樹

    圖3 漢語語義語法樹

    圖2與圖3中,路徑中也許存在其他節(jié)點,用虛線代表。不同類型的詞語語義語法表現(xiàn)形式不同,英語語義語法樹和漢語語義語法樹也有所不同。

    1.2.2 獲取語義語法模式

    需要解釋的詞為B,語義語法模式T部從存在B的句子(短語)的相同部分獲取,語義語法模式V部從一個句子(短語)的不同部分獲取。最后的s,d變量名為Gen(s,d),s到d的最短路徑為Genscore(s,d),詞、詞語與變量名均可用s,d表示。

    設(shè)定Genscore(s,ε)或Genscore(ε,d)=2,空字符為ε。則有

    Genscore(s1…sn,d1…dn)=Genscore(s1,d1)+…+Genscore(sn,dn)

    語義語法模式的算法:

    (1)初始化S1S2S3…SN-1SNSN+1單詞,按照從左至右順序形成的英語句子,與其相應(yīng)的E1E2E3…EM-1EMEM+1漢字按照從左至右順序形成的漢語句子;

    (2)英語與漢語語義語法模式T部從句子的相同部分獲??;英語與漢語語義語法模式L部從句子的不同部分獲??;

    (3)如果s,d為姐妹,Gen(s,d)是s,d的父節(jié)點,或者Gen(s,d)是s的父節(jié)點,Gen(s,d)也是d的父節(jié)點,將最后結(jié)果輸出;

    (4)如果不同部分并非兩個單個詞s,d,為不同部分詞語(s1…sn,d1…dm)分配指定搭配集;

    (5)計算詞語長度,其中各個指定搭配集長度以一個詞的長度計算;

    (6)Gen(s1…sn,d1…dm)=Gen(s1,d1)…Gen(sn,dm),再按照(3)的過程獲取Gen(s1,d1)…Gen(sn,dm)的結(jié)果。

    (7)如果計算長度不同,通過搭配空字符與詞語(指定搭配集)形成Gen(s1…sn,d1…dm)的更多可能性;

    (8)計算全部可能性Genscore(s1…sn,d1…dm);

    (9)Gen(s1…sn,d1…dm)的最后結(jié)果是Genscore的最小情況,再按照(3)的過程獲取Gen(s1,d1),…,Gen(sn,dm)的結(jié)果。

    以“我是陌生的面孔=I am a strange face”與“他是陌生的面孔=He is a strange face”作為兩句翻譯實例,按照語義語法模式的算法,得出語義語法模式T部是從兩個句子中存在face的相同部分獲取,語義語法模式L部從兩個句子中的不同部分獲取。兩個英語句子的不同部分為(I,He),兩個漢語句子的不同部分為(我,他),剩下部分則為兩個句子的相同部分,保留相同部分,利用語義語法樹將不同部分更改成語義語法變量名,即N{pronoun}be*a strange face=N{代表}陌生的面孔,If N{pronoun}=N{代表}I=我、he=他。

    1.3 詞語對齊

    伯克利對準器可用于機器翻譯工具[12]。在翻譯之前,伯克利首先訓(xùn)練英語和漢語的平行語料,然后再進行翻譯。以英語詞為標準,使?jié)h語詞與英語詞對齊,出現(xiàn)英語詞時都會出現(xiàn)相應(yīng)的漢語翻譯[13-14]。然后,根據(jù)源語言和目標語言、短語和句子之間的關(guān)系顯式,優(yōu)化評價兩個句子的語義一致性,正式地把翻譯任務(wù)轉(zhuǎn)化為強化學(xué)習(xí)問題。

    作為空白處,同一語料里一個英語詞的兩種漢語對比形式通過最大似然概率獲取,使各個漢語詞均精準出現(xiàn)在英語詞后[15]。

    1.4 短語翻譯相似度

    1.4.1 獲取單詞翻譯概率

    目標語言端的語義k近鄰詞是通過雙語語義向量映射辦法將翻譯模型處理后的單詞映射到目標語言端獲取。以語義k近鄰詞為基準,計算翻譯模型翻譯后的單詞和標準語言單詞翻譯概率,公式如下:

    (1)

    (2)

    式中,y(h|f)表示翻譯模型處理后的單詞與目標語言端單詞間的翻譯概率;h′表示在目標語言端中單詞f的映射向量;O(h′)表示在目標語言端中單詞f的語義k近鄰詞集合;sim(h|hk)表示語義k近鄰詞hk與單詞h的語義相似度,通過歸一化向量余弦相似度得出語義相似度;x(hk|f)表示單詞f和目標語言端語義k近鄰詞hk間的互譯度,通過softmax函數(shù)歸一化處理映射向量與k近鄰詞向量的語義相似度獲取互譯度。

    1.4.2 短語翻譯相似度計算

    短語翻譯相似度依據(jù)短語的詞匯化加權(quán)公式進行計算。依據(jù)單詞翻譯概率,采用詞匯化加權(quán)公式計算得到正反向短語翻譯相似度,將正反向的短語翻譯相似度當作新特征加入解碼器,輸出翻譯結(jié)果。計算正向短語翻譯相似度公式如下:

    (3)

    式中,f表示翻譯模型翻譯后的短語,h表示標準語言短語,a表示詞對齊,len(f)表示f短語的長度,x(hj|fi)表示hj與fi的正向翻譯概率。

    同理,計算反向短語翻譯相似度的公式如下:

    (4)

    式中,len(h)表示短語的長度,x(fi|hj)表示fi與hj的反向翻譯概率。

    2 實驗分析

    選取新聞領(lǐng)域的600句英語材料為實驗對象,找出600句英語材料中的有關(guān)人體單詞的基本信息,如表3所示。

    表3 有關(guān)人體詞的基本信息

    根據(jù)四種不同情況測試本文方法翻譯英文的準確率與召回率,四種情況分別如下:

    第一種:成功輸出翻譯結(jié)果且翻譯準確,與原本漢語譯文一致;

    第二種:成功輸出翻譯結(jié)果,與原本漢語譯文不同,但意思一致,屬于準確翻譯;

    第三種:成功輸出翻譯結(jié)果,翻譯錯誤;

    第四種:翻譯失敗表示沒有輸出翻譯結(jié)果。

    準確率P的計算公式如下:

    (5)

    召回率R的計算公式如下:

    (6)

    本文方法準確率與召回率的測試結(jié)果見表4。

    表4 本文方法英譯漢的準確率與召回率的測試結(jié)果

    (續(xù)表)

    根據(jù)表4可知,本文方法英譯漢的平均準確率為97.9%,平均召回率為96.4%。實驗證明:本文方法能夠有效翻譯目標單詞,且準確率高。

    采用本文方法與基于雙語短語約束的交互式機器翻譯方法(文獻[3]方法)、基于Transfer和Triangulation融合的中介語統(tǒng)計機器翻譯方法(文獻[4]方法)對所選取新聞領(lǐng)域的600句英語句子進行翻譯,分別統(tǒng)計句中小于等于20詞與大于20詞的情況下正確翻譯句子的數(shù)量,表5為三種方法的測試結(jié)果。

    表5 三種方法的翻譯正確數(shù)量統(tǒng)計結(jié)果

    由表5發(fā)現(xiàn),本文方法翻譯正確的句子數(shù)量高于其余兩種方法。在對準器小于等于20詞的句子中,本文方法翻譯正確率為96%,其余兩種方法的翻譯正確率分別為82%與79%,在對準器大于20詞的句子中,本文方法翻譯正確率為98%,其余兩種方法的翻譯正確率分別為83%與81%。實驗證明:本文方法在翻譯句子時的準確率更高,可為交互式智能翻譯提供重要參考。

    3 結(jié) 語

    本文從語義認知的角度探討了不同語義認知視角下交互式智能翻譯方法,分析了翻譯中需要翻譯的句義信息,提高了翻譯的準確性。實驗結(jié)果表明,該方法有效可行,翻譯準確率高于其他兩種對比方法。

    鑒于今后的研究方向,單語料的發(fā)展規(guī)律可進一步加以探討。在當前普遍采用的單語料開發(fā)方法中,訓(xùn)練成本和時間成本較大,如何更有效、快速地開發(fā)使用單語料是值得深入研究的問題。

    猜你喜歡
    短語語義語法
    語言與語義
    跟蹤導(dǎo)練(二)4
    KEYS
    Keys
    Book 5 Unit 1~Unit 3語法鞏固練習(xí)
    “上”與“下”語義的不對稱性及其認知闡釋
    認知范疇模糊與語義模糊
    語義分析與漢俄副名組合
    津南区| 崇仁县| 二手房| 杭锦旗| 壤塘县| 蒙阴县| 璧山县| 应用必备| 花莲市| 贵州省| 康定县| 安阳县| 衡南县| 涞水县| 当阳市| 瓦房店市| 青岛市| 宽甸| 盘锦市| 香格里拉县| 鹤庆县| 深州市| 荔波县| 遂川县| 武山县| 浦东新区| 乃东县| 杂多县| 安塞县| 浦北县| 文登市| 澳门| 砚山县| 绥中县| 乌鲁木齐市| 乌兰县| 蓝田县| 乳山市| 凉山| 新田县| 泰顺县|