石旺君
摘 要:為了提高機器翻譯中英語語言轉(zhuǎn)換的自動化和智能化水平,提出了一種基于深度學習和語言轉(zhuǎn)換錯誤特征提取的機器翻譯錯誤消除方法,其核心差分語義修正方法。建立了英語語言轉(zhuǎn)換翻譯中錯誤排除的語義相關(guān)檢測模型,并通過語法分析,建立了英語語言轉(zhuǎn)換翻譯中錯誤排除的語義樹。提取了英語語言轉(zhuǎn)換的語義相似度特征。根據(jù)語義相似度的不同組合,對英語語言轉(zhuǎn)換中的語義分配和機器翻譯錯誤特征進行了分析。采用深度學習方法建立了英語轉(zhuǎn)換的樹形主題詞表,并根據(jù)樹形主題詞表中的語義修改目標調(diào)整了英語轉(zhuǎn)換的句子結(jié)構(gòu)。為了消除英語轉(zhuǎn)換過程中的翻譯錯誤,計算出每個小句的最佳語義相關(guān)特征,并采用深度學習算法對英語轉(zhuǎn)換過程中的翻譯錯誤進行自動優(yōu)化。仿真結(jié)果表明,該方法精度高。
關(guān)鍵詞:深度學習;語言翻譯;英語;語義學;英語機器翻譯;翻譯錯誤;錯誤消除
中圖分類號:TP 391
文獻標志碼:A
文章編號:1007-757X(2020)11-0055-04
Abstract:In order to improve the level of automation and intelligence of English language conversion in machine translation, a machine translation error elimination method based on deep learning and language conversion error feature extraction is proposed. Its core bit difference semantic correction method establishes a semantic correlation detection model for error elimination in English language translation. Through grammatical analysis, it establishes a semantic tree for error elimination in English language translation. The semantic similarity features of English language conversion are extracted. According to different combinations of semantic similarity, the semantic distribution and machine translation error features in English language conversion are analyzed. A deep-learning method is used to establish a tree-shaped thesaurus in English conversion, and the sentence structure of English conversion is adjusted according to the semantic modification target in the tree-shaped thesaurus. In order to eliminate translation errors during the English conversion process, the best semantically relevant features of each clause are calculated, and deep learning algorithms are used to automatically optimize the translation errors during the English conversion process. Simulation results show that the method has high accuracy.
Key words:deep learning;language translation;English;semantics;English machine translation;translation errors;error elimination
0?引言
隨著自動翻譯軟件的發(fā)展和成熟,對機器翻譯軟件的翻譯和校準的準確性要求更高。在機器翻譯環(huán)境中,語義分析需要與自動翻譯軟件的上下文特征結(jié)合起來[1-2]。根據(jù)語義相似度,進行自動翻譯和標定,以提高自動翻譯的語義分配精度。在語義異構(gòu)的條件下,機器翻譯的自動校準主要通過語義相似度的概念分析來實現(xiàn)[3-4]。摘要自動翻譯文本的相關(guān)性特征和語義相似性特征,根據(jù)相似語義對存在的語義異構(gòu)性進行消除,實現(xiàn)英語翻譯過程中的知識結(jié)構(gòu)圖分析,并構(gòu)建語義概念樹[5-6]。提高翻譯錯誤消除能力。機器翻譯錯誤消除方法的研究對于提高機器翻譯的智能水平具有重要意義。機器翻譯錯誤消除方法的相關(guān)研究引起了廣泛關(guān)注。
在傳統(tǒng)方法中,粒子群優(yōu)化和遺傳進化主要用于消除英漢翻譯中的翻譯錯誤[7]。由于本體模型之間的普遍差異,標定的準確性不高,語義異質(zhì)性問題嚴重。提出了一種基于深度學習和語言變換錯誤特征提取的機器翻譯錯誤消除方法。運用差異化語義修飾法構(gòu)建了英語轉(zhuǎn)換翻譯中錯誤排除的語義相關(guān)檢測模型,并通過語法分析構(gòu)建了英語轉(zhuǎn)換翻譯中錯誤排除的語義樹。通過深度學習的方法建立了英語轉(zhuǎn)換的樹主題詞表,并根據(jù)樹主題詞表中的語義修飾目標對英語轉(zhuǎn)換的句結(jié)構(gòu)進行了調(diào)整。實現(xiàn)了英語轉(zhuǎn)換翻譯錯誤的消除和主題詞的注冊。采用深度學習算法進行自動優(yōu)化,實現(xiàn)了英語轉(zhuǎn)換翻譯錯誤的消除。最后,對實驗結(jié)果進行了測試和分析得出了結(jié)論。
1?英語翻譯中語義本體模型及消錯映射關(guān)系
1.1?英語轉(zhuǎn)換翻譯中錯誤消除的語義本體模型
為了構(gòu)建一種基于深度學習的方法,采用語義相似度分析和自適應(yīng)模板注冊技術(shù),構(gòu)建了一種基于語義相似度分析和自適應(yīng)模板注冊的英語轉(zhuǎn)換翻譯錯誤消除語義本體模型[8]。利用關(guān)聯(lián)維映射的方法,分析了英語轉(zhuǎn)換中翻譯錯誤消除語義本體模型中關(guān)聯(lián)詞匯信息的特點,建立了基于深度學習的語義本體結(jié)構(gòu)模型。利用主題詞和介詞的包含映射方法,構(gòu)建了機器翻譯中上下文本體的映射機制。在英語語言轉(zhuǎn)換過程中,利用機器語言的自適應(yīng)學習方法構(gòu)建語義本體的映射模型,如圖1所示。
在上述語義本體模型的基礎(chǔ)上,構(gòu)建了詞典數(shù)據(jù)庫。基于大規(guī)模本體擴散映射方法,建立了一個英語語言轉(zhuǎn)換過程中翻譯錯誤消除的詞典數(shù)據(jù)庫。為消除英語轉(zhuǎn)換中的翻譯錯誤,提出了一種綜合評價模糊決策函數(shù)如式(1)、式(2)。
式中,ρ是領(lǐng)域知識(Domain knowledge,DK)模型之間的相似性特征,ρ∈[0,1]和ρ=0.23。
語義泛化映射關(guān)系由兩組相似的結(jié)構(gòu)片段建立。如果GD表示本體間的語義關(guān)聯(lián)規(guī)則特征,則將英語轉(zhuǎn)換翻譯消錯的泛化映射函數(shù)M表示為M:C*C′→圖像,并在相關(guān)映射過程中建立語義交叉映射。選擇機器翻譯語義注冊的可靠性特征,構(gòu)造一種可行的語義映射關(guān)系分析方案。在本體結(jié)構(gòu)中,采用語義互操作方法分析語義泛化特征[9]。結(jié)合本體模型的定義,利用概念節(jié)點的深度學習方法,建立了英語轉(zhuǎn)換翻譯中消錯的語義本體模型。用于構(gòu)造上下文模糊推理的元組O={C,HC,R,I,A}使用兩組本體片段θ來解釋翻譯錯誤排除概念在英語語言轉(zhuǎn)換中的擴展,如式(3)。
因此,采用概念編輯的方法構(gòu)建了中文翻譯過程中的模糊語義本體映射,并采用差分語義修改的方法構(gòu)建了英語翻譯錯誤排除的語義相關(guān)檢測模型。通過語法分析,建立了英語轉(zhuǎn)換翻譯中的語義消錯樹,結(jié)合模糊相關(guān)匹配方法,建立了機器翻譯的概念格,并對兩種異構(gòu)本體進行了深入研究。英語語言轉(zhuǎn)換中的關(guān)系本體映射關(guān)系由以下元組表示:O=
表示語義信息之間的特征提取關(guān)系模型,當Cs和Ct′之間存在最大相關(guān)特征集時,Cs和Ct′之間的語義信息的特征提取關(guān)系模型可以由表示。根據(jù)上述映射關(guān)系,構(gòu)建了語義映射本體和概念樹模型,以消除英語轉(zhuǎn)換翻譯中的錯誤。
1.2?語義映射關(guān)系
根據(jù)語義相似度的不同組合,分析了英語語言轉(zhuǎn)換中的語義分配和機器翻譯錯誤,并采用深入學習的方法建立了英語語言轉(zhuǎn)換的樹形主題詞表。構(gòu)建了一個用于英語翻譯中排除錯誤的語義映射模型[10],如圖2所示。
在圖2所示的英語轉(zhuǎn)換翻譯消錯語義映射關(guān)系模型中,根據(jù)兩個異構(gòu)本體中的每個概念信息,進行關(guān)聯(lián)規(guī)則映射,并采用模糊特征分析方法。建立了語義概念分析的結(jié)構(gòu)映射關(guān)系,利用語義實現(xiàn)了英語語言轉(zhuǎn)換過程
概念名的分詞是通過詞與專業(yè)名詞的連接來表示的一個區(qū)間概念。在最優(yōu)標定模式下,通過關(guān)聯(lián)規(guī)則分析實現(xiàn)概念詞的自組織映射。詞庫中的詞匯分布如式(5)。
給出概念上下文的形式映射集,提取目標子句中關(guān)聯(lián)規(guī)則的特征量。在詞匯語義計算中,利用語義相關(guān)特征分析方法,建立了最大語義相關(guān)度的映射模型。英語目標詞匯轉(zhuǎn)換的自動選擇與模糊控制。
2?英語轉(zhuǎn)換中翻譯錯誤消除算法的優(yōu)化
2.1?語義相似度特征分析
在利用差分語義修正方法構(gòu)建英語轉(zhuǎn)換翻譯中消錯語義相關(guān)檢測模型的基礎(chǔ)上,對機器翻譯中的消錯方法進行了優(yōu)化,在此基礎(chǔ)上設(shè)計了語義相關(guān)檢測模型和相關(guān)映射關(guān)系
模型。本研究提出了一種基于深度學習和語言轉(zhuǎn)換錯誤特征提取的機器翻譯錯誤消除方法,并通過語法分析建立了英語轉(zhuǎn)換翻譯錯誤消除的語義樹。提取了英語語言轉(zhuǎn)換的語義相似度特征,并將語義關(guān)聯(lián)度模糊決策函數(shù)描述如式(6)。
基于語義相關(guān)值分析方法,建立了英語語言轉(zhuǎn)換邏輯詞典數(shù)據(jù)庫模型。選取語義關(guān)聯(lián)度最大的詞作為連接詞,采用逗號等效約束分析法對目標子句進行分析。在計算最大語義關(guān)聯(lián)度的過程中,簡單語義單元的相對貼近度函數(shù),如式(7)。
設(shè)(sk,ak)表示為二進制語義。根據(jù)語義相似度的不同組合,進行了英語語言轉(zhuǎn)換中的語義賦值和機器翻譯錯誤特征分析,并采用深度學習方法建立了英語語言轉(zhuǎn)換的樹形主題詞表。關(guān)聯(lián)規(guī)則特征集用sk表示,語義原語集用S表示,關(guān)聯(lián)關(guān)系,如式(8)。
計算出目標子句的語義規(guī)則集,并將介詞表示為語義相似度的組合形式。在最優(yōu)語法分析模型下,得到了分句的權(quán)重系數(shù)。采用分詞邏輯表示方法,對英語轉(zhuǎn)換翻譯中的糾錯過程進行了全局優(yōu)化。相似性特征表示為β∈[0,T],如式(9)。
根據(jù)語義相似度的不同組合,對英語語言轉(zhuǎn)換中的語義分配和機器翻譯錯誤特征進行了分析。例如:-Fi(Semanticassignment)=Abstract#1∨Area#2,為了提高英語語言轉(zhuǎn)換中消除翻譯錯誤的能力,在每個語法分析方案中測量語義關(guān)聯(lián)度,并進行復合表達以提高英語語言轉(zhuǎn)換中消除翻譯錯誤的能力。結(jié)合以上分析,得到語義相似度特征提取過程,如圖3所示。
從圖中可知,在樹狀圖中,任意兩個節(jié)點之間的路徑只有一條。所以路徑的長度可以看成一種為兩個詞語之間的相似度的度量。隨著路徑的變長,所包含的語義信息也越豐富,所以詞語間語義相似度越小。
2.2?深度學習與翻譯錯誤消除的自適應(yīng)控制
采用深度學習的方法,建立了英語語言轉(zhuǎn)換的樹形主題詞表。根據(jù)樹形主題詞列表中的語義修改目標,調(diào)整英語語言轉(zhuǎn)換的句子結(jié)構(gòu),選擇目標從句。定義機器翻譯誤差
消除的標簽?zāi)P捅硎緸椋╯1,a1),(s2,a2),…,(sn,an),將目標從句推廣到詞匯表中,得到英語語言轉(zhuǎn)換中從句的權(quán)重系數(shù)為KS=1,并利用深度學習方法對簡單句進行自動優(yōu)化。根據(jù)深度學習的方法,通過最佳語法分析的中心向量C(Y)得到關(guān)聯(lián)規(guī)則的相似度,關(guān)聯(lián)規(guī)則的相似度如式(12)。
假設(shè)普通實詞的語義修飾結(jié)構(gòu)為L→AAPDAB,根據(jù)樹形主題詞表中的語義修飾目標,調(diào)整英語轉(zhuǎn)換的句子結(jié)構(gòu),提高英語轉(zhuǎn)換中翻譯錯誤的消除率。下面介紹一種基于深度學習的消除陰影翻譯錯誤的方法。
(1) 通過語法分析方案確定了英語語言轉(zhuǎn)換中翻譯錯誤排除的語義規(guī)則集O,并采用模糊相關(guān)匹配方法得到了主題詞在語義單元中的特征量。選擇語義關(guān)聯(lián)度最大的特征作為連接詞;
(2) 對目標子句進行特征分解,用S,V,O分解英語轉(zhuǎn)換的語義塊,根據(jù)詞匯語義修改不同的關(guān)聯(lián)規(guī)則集,確定上下文的模糊匹配集;
(3) 計算模糊語義特征。根據(jù)名詞和介詞短語的詞義修飾,計算出最佳語義相關(guān)值,定義為f(I):={o∈O|A∈I,oKR};
(4) 考慮到詞的上下文,假設(shè)L的語義結(jié)構(gòu)為:L→AAPDAB,根據(jù)樹型主題詞表中的語義修改目標調(diào)整英語轉(zhuǎn)換的句子結(jié)構(gòu),得到最佳的語義匹配集;
(5) 根據(jù)深度學習調(diào)整收斂性;
(6) 當滿足約束條件時,結(jié)束。
3?實驗測試分析
為了驗證該方法在消除英語轉(zhuǎn)換中翻譯錯誤方面的效果,進行了實驗。實驗采用Matlab進行設(shè)計,用OAEI語言表示英語語言轉(zhuǎn)換的關(guān)聯(lián)規(guī)則集。簡單語義單元集為2000,樣本訓練量集為120,迭代次數(shù)為200,語義屬性集為85,相似度語義特征分布實例數(shù)為120,深度學習次數(shù)為200,收斂步長為30,以查全率和查準率為檢驗標準指標計算如式(13)、式(14)。
根據(jù)上述仿真環(huán)境和參數(shù)設(shè)置,消除了英語轉(zhuǎn)換中的翻譯錯誤,并測試了語義特征的分布,如圖4所示。
根據(jù)圖4所示語義特征分布的測試結(jié)果,進行了英語語言轉(zhuǎn)換的翻譯誤差消除優(yōu)化控制,如圖5所示。
該方法的精度和校正能力對消除英語轉(zhuǎn)換翻譯中的錯誤是很好的。英語語言轉(zhuǎn)換的翻譯誤差消除精度較高,且翻譯校準的相關(guān)性強。
進一步測試了機器翻譯中的錯誤消除率,如表1所示。
本研究所提的機器翻譯的消錯率高于傳統(tǒng)文獻中所提的機器翻譯方法。
4?總結(jié)
為了消除英語轉(zhuǎn)換中的翻譯錯誤和主題詞的錯誤,提出了一種基于深度學習和語言轉(zhuǎn)換錯誤特征提取的機器翻譯錯誤消除方法。利用差異化語義修飾方法,構(gòu)建了英語轉(zhuǎn)換翻譯中錯誤排除的語義相關(guān)檢測模型,并通過語法分析構(gòu)建了英語轉(zhuǎn)換翻譯中錯誤排除的語義樹。提取了英語轉(zhuǎn)換的語義相似性特征。通過深度學習的方法建立了英語轉(zhuǎn)換的樹主題詞表,并根據(jù)樹主題詞表中的語義修飾目標對英語轉(zhuǎn)換的句結(jié)構(gòu)進行了調(diào)整。計算每個子句的最佳語義相關(guān)性,并使用深度學習算法自動優(yōu)化英語轉(zhuǎn)換中的錯誤。仿真結(jié)果表明,該方法準確度高,翻譯標定的相關(guān)性強。該方法在機器翻譯的智能化設(shè)計中具有良好的應(yīng)用價值。
但本研究仍然存在一些不足之處,如算法運行時間較長,在對于某些稀有詞翻譯以及一詞多義等特定情況時,仍然存在翻譯錯誤,導致結(jié)果的準確度不高。因此這也是未來工作方向之一。
參考文獻
[1] 李暉.語義分析在翻譯中的應(yīng)用研究[J].海外英語,2018(19):125-126.
[2]?王曉雷,陳云杰,王琛,等.基于Q-learning的虛擬網(wǎng)絡(luò)功能調(diào)度方法[J].計算機工程,2019,45(2):64-69.
[3]?黃登嫻.英語翻譯軟件翻譯準確性矯正算法設(shè)計[J].現(xiàn)代電子技術(shù),2018,41(14):170-172.
[4]?哈斯高娃. 蒙漢神經(jīng)機器翻譯中的未登錄詞處理研究[D].呼爾浩特:內(nèi)蒙古師范大學,2019.
[5]?季春元,熊澤金,侯艷芳,等.基于人機交互的網(wǎng)絡(luò)化智能翻譯系統(tǒng)設(shè)計[J].自動化與儀器儀表,2019(8):25-28.
[6]?吳承鳳,劉濤.機器翻譯中的多模糊語義自動判斷方法研究[J].現(xiàn)代電子技術(shù),2017,40(14):75-77.
[7]?張鋒. 基于粒子群優(yōu)化算法的漢英語句對齊研究[D].重慶:重慶大學,2012.
[8]?王琳. 知網(wǎng)機器翻譯系統(tǒng)的分析與知識庫擴展[D].沈陽:沈陽航空航天大學,2017.
[9]?賈君枝,李捷佳.基于關(guān)聯(lián)數(shù)據(jù)的語義互操作研究[J].情報理論與實踐,2017,40(8):131-134.
[10]?梁娟.英語翻譯器語音識別系統(tǒng)的設(shè)計及功能實現(xiàn)[J].微型電腦應(yīng)用,2018,34(12):46-48.
(收稿日期:2020.04.27)