高夢璐
【摘要】目前單一策略的機(jī)器翻譯系統(tǒng)發(fā)展過程中遇到瓶頸,譯文質(zhì)量并沒有獲得較大提高。該文章從共享經(jīng)濟(jì)中得到啟示,提出融合多種策略的方法來提升機(jī)器翻譯系統(tǒng)的性能,促進(jìn)多種策略和語料庫的有效利用,在目前較為有效的三種融合方法基礎(chǔ)上,根據(jù)客戶實際需求可以選擇便利的單一策略或者有多重譯文選擇的多種策略融合方式。對多策略的機(jī)器翻譯系統(tǒng)的研究有助于促進(jìn)機(jī)器翻譯系統(tǒng)的突破瓶頸,提供更符合不同用戶需求的譯文。
【關(guān)鍵詞】機(jī)器翻譯;融合策略;語料庫;對癥下藥
一、引言
在當(dāng)今機(jī)器翻譯領(lǐng)域,語義句法知識的欠缺始終難以使基于規(guī)則的翻譯系統(tǒng)獲得突破。雖然基于語料庫的翻譯系統(tǒng)已能達(dá)到較理想的程度,滿足小部分人的需求,但是語言研究的忽視和僅靠計算機(jī)學(xué)者付出的努力,還是難以使機(jī)器翻譯質(zhì)量取得較大的發(fā)展。近年來出現(xiàn)的共享型經(jīng)濟(jì)也為機(jī)器翻譯系統(tǒng)的進(jìn)一步發(fā)展提供了新思路,即機(jī)器翻譯系統(tǒng)也可以共享多個語料庫并且同時使用多種策略。因此,對于多策略融合的機(jī)器翻譯策略研究,有助于促進(jìn)機(jī)器翻譯領(lǐng)域開啟合作共享模式,幫助機(jī)器翻譯獲得更令人滿意的譯文。
二、多策略融合的機(jī)器翻譯系統(tǒng)的未來發(fā)展
1.發(fā)展多策略融合機(jī)器翻譯系統(tǒng)的必要性。當(dāng)今社會中,共享型經(jīng)濟(jì)頗為盛行,共享式發(fā)展體現(xiàn)的是一種資源的有效利用,合作共贏。在基于某一種方式的機(jī)器翻譯系統(tǒng)發(fā)展陷入停滯時,選擇“合作”也未嘗不是一個好的選擇。從概念上來講,“共享型經(jīng)濟(jì)”是將個體所擁有的資源作為一種沉沒成本的閑置資源進(jìn)行社會化利用的一種商業(yè)模式。這實際上是將特定物品在不同需求者間實現(xiàn)使用權(quán)移轉(zhuǎn)。如果是對機(jī)器翻譯系統(tǒng)的多種策略系統(tǒng)和語料資源進(jìn)行“共享”,這實質(zhì)上是一種無形資產(chǎn)的分享,將大大促進(jìn)對資源的高效利用,使得機(jī)器譯文質(zhì)量獲得更高的滿意度,從而滿足更多使用者的需求。共享經(jīng)濟(jì)關(guān)鍵在于如何實現(xiàn)最優(yōu)匹配,解決技術(shù)和制度問題。反觀機(jī)器翻譯系統(tǒng)的融合也有很多類似的困難要克服。如融合多種策略時能否將多種策略實現(xiàn)“最優(yōu)配置”,多策略融合時帶來的時間增加和性能消耗的技術(shù)問題,如何能夠使語料庫等資源充分流動起來同時又能保護(hù)各自資源所有者的合法權(quán)益等。
2.多策略機(jī)器翻譯融合方法的探究。盡管目前對多策略融合的機(jī)器翻譯系統(tǒng)表示懷疑的學(xué)者很多,但目前已有學(xué)者融合多種翻譯策略生成了更為優(yōu)質(zhì)的多策略翻譯系統(tǒng),并且得出的譯文質(zhì)量比單一策略翻譯系統(tǒng)得到的結(jié)果有明顯提升,這都表明了機(jī)器翻譯系統(tǒng)策略融合的可行性和有效性。多策略機(jī)器翻譯的主要功能是揚(yáng)長避短,同時使不同的策略協(xié)調(diào)運作。目前有三種較為有效的融合方法有,
(1)模塊級策略融合。模塊級策略融合指以一種翻譯系統(tǒng)為主,在一個系統(tǒng)中融合不同翻譯系統(tǒng)的模型。例如,同時融合基于規(guī)則的分析模塊,基于統(tǒng)計的后編輯模塊等多種翻譯系統(tǒng)中性能最好的部分。
(2)系統(tǒng)級策略融合。系統(tǒng)級融合策略又稱混合機(jī)器翻譯,主要是在譯文后處理或整個翻譯過程中,融合多個機(jī)器翻譯引擎的譯文,從中組合出更好的譯文。按照融合的階段可分為后處理系統(tǒng)融合和模型間融合。后處理融合,可以在句子、短語或者詞層面上進(jìn)行,也可以在三個層面中同時進(jìn)行。模型間融合是把兩個優(yōu)勢互補(bǔ)的翻譯模型結(jié)合在一起,以提高機(jī)器翻譯的性能。
(3)人機(jī)交互融合。交互式機(jī)器翻譯可以使人工譯員參與機(jī)翻譯過程并起到“決策”作用。人工譯員可以采用、修改或者直接舍棄機(jī)器翻譯得到的譯文,之后機(jī)器會從人工譯文中學(xué)習(xí)并不斷完善自己的譯文,經(jīng)過幾次循環(huán),機(jī)器翻譯便可“自己學(xué)習(xí)”從而提升自己的翻譯質(zhì)量,直至符合人工譯員的評判標(biāo)準(zhǔn)。
3.翻譯策略融合要“對癥下藥”。融合多種策略對機(jī)器的性能要求會變高,時間的消耗也會成冪式增長,在融合過程中,這些弊端都亟待解決。因此筆者認(rèn)為,考慮到不同客戶的實際需要并且能夠使多種策略融合的翻譯系統(tǒng)具有更廣的適用性,因此是否選擇融合多種策略可以考慮兩種方案,一是根據(jù)用戶目的為用戶自動選取最快捷的單一策略,二是為無特殊需求的用戶提供多種策略的譯文供用戶選擇。
以翻譯記憶庫為例。翻譯記憶庫是基于語料庫的機(jī)器翻譯系統(tǒng)中的一種,這種翻譯記憶庫對專家和專業(yè)學(xué)者來說更為適用。因為該系統(tǒng)可根據(jù)歷史翻譯資源“記憶”譯文。此類學(xué)者在撰寫學(xué)術(shù)論文時,用到的較生僻的詞匯,能在用戶的使用過程中被迅速添加到記憶庫中,當(dāng)用戶再次翻譯相同或相似的內(nèi)容時,翻譯記憶庫中的譯文就會顯現(xiàn)在用戶面前,供用戶參考。用戶也可以在參考譯文中進(jìn)行編輯修改,這樣的源語言和目標(biāo)語言翻譯資源又會再次存入記憶庫中,因此這種翻譯記憶就能夠“輔助”某一方向或者領(lǐng)域的專業(yè)學(xué)者記錄該學(xué)者或該領(lǐng)域的專業(yè)對應(yīng)譯文,節(jié)省許多高頻詞的翻譯時間,而多策略融合的機(jī)器翻譯系統(tǒng)則會消耗更多的內(nèi)存和時間。此時這樣的翻譯記憶庫則是最適合這些專家學(xué)者的翻譯系統(tǒng)工具。
如果說提供單一策略的方案適合具體領(lǐng)域的專家學(xué)者,那么基于共享型語料庫的多策略融合機(jī)器翻譯系統(tǒng)則具有更好的普適性。既汲取各系統(tǒng)模型之長,又擁有更豐富的語料庫資源,這樣的基于共享型語料庫的多策略融合機(jī)器翻譯系統(tǒng)能夠適應(yīng)不同文體不同語境下的翻譯任務(wù)。
三、結(jié)語
目前我們看到,多策略融合的機(jī)器翻譯已成為未來機(jī)器翻譯的重要研究方向。在眾多對多策略翻譯系統(tǒng)表示不贊成的學(xué)者看來,多種翻譯引擎融合后得到的譯文質(zhì)量參差不齊。但筆者認(rèn)為,雖然譯文由于多種策略提供的組合結(jié)果會導(dǎo)致句子的連貫性被打破,但不代表這樣的譯文在質(zhì)量上并沒有絲毫的提升。所以,在未來機(jī)器翻譯系統(tǒng)發(fā)展的同時,譯文的評測方法也需進(jìn)一步加深探究。此外,在未來的多策略融合機(jī)器翻譯系統(tǒng)中,筆者認(rèn)為還有如下幾個方面需要重點關(guān)注:
在選擇翻譯模型時要避免選擇相似性較大的翻譯模型或者翻譯質(zhì)量較差的模型,而應(yīng)該選擇在不同的方面表現(xiàn)卓越但又存在明顯弊端的多個翻譯系統(tǒng)進(jìn)行互補(bǔ)融合。
在某一系統(tǒng)中融合多個翻譯策略雖能提升譯文的質(zhì)量水平但占用內(nèi)存和時間消耗的明顯弊端也需要合適的解決方案。因此,如何能夠做到既兼顧效率又提高系統(tǒng)的魯棒性就顯得尤為重要。
目前的翻譯系統(tǒng)中缺乏上下文、語篇文本分析功能等問題,應(yīng)從語言研究中入手,從根基上找到解決機(jī)器翻譯系統(tǒng)無“語法語義”思想的方法。
然而,雖然多種策略的融合目前還存在很多問題,但是多種語料庫的共享和更多的翻譯引擎的融合必將為機(jī)器翻譯的發(fā)展注入新的動力,促進(jìn)譯文質(zhì)量實現(xiàn)質(zhì)的飛躍的同時獲得更多用戶的青睞。
參考文獻(xiàn):
[1]汪云,周大軍.基于語料庫的機(jī)器翻譯的現(xiàn)狀與展望[J].考試與評價(大學(xué)英語教研版),2017(05):45-50.
[2]杜金華,張萌,宗成慶,等.中國機(jī)器翻譯研究的機(jī)遇與挑戰(zhàn)——第八屆全國機(jī)器翻譯研討會總結(jié)與展望[J].中文信息學(xué)報,2013, 27(4):1-8.
[3]張亞鵬,葉娜,蔡東風(fēng).利用句法信息改進(jìn)交互式機(jī)器翻譯[J].中文信息學(xué)報,2017,31(02):42-48.
[4]李業(yè)剛,黃河燕,史樹敏.多策略機(jī)器翻譯研究綜述[J].中文信息學(xué)報,2015,29(2):1-9.
[5]郭俊博,張喜媛,杜金華.N-Best句法知識增強(qiáng)的統(tǒng)計機(jī)器翻譯預(yù)調(diào)序模型[J].計算機(jī)工程與應(yīng)用,2016,52(17):160-165.
[6]劉群.機(jī)器翻譯研究新進(jìn)展[J].當(dāng)代語言學(xué),2009,11(02):147-158+190.