尹瑞程,葉 娜,蔡?hào)|風(fēng)
(沈陽(yáng)航空航天大學(xué) 人機(jī)智能研究中心,沈陽(yáng) 110136)
?
基于用戶(hù)反饋的統(tǒng)計(jì)機(jī)器翻譯短語(yǔ)表優(yōu)化方法
尹瑞程,葉娜,蔡?hào)|風(fēng)
(沈陽(yáng)航空航天大學(xué) 人機(jī)智能研究中心,沈陽(yáng) 110136)
近年來(lái),統(tǒng)計(jì)機(jī)器翻譯技術(shù)取得了長(zhǎng)足進(jìn)展,然而在譯文質(zhì)量要求較高的領(lǐng)域,機(jī)器翻譯系統(tǒng)產(chǎn)生的譯文仍不夠理想。隨著計(jì)算機(jī)輔助翻譯和交互式機(jī)器翻譯技術(shù)的出現(xiàn),研究人員開(kāi)始利用用戶(hù)反饋,從中學(xué)習(xí)翻譯知識(shí),對(duì)翻譯系統(tǒng)的各項(xiàng)參數(shù)進(jìn)行優(yōu)化。由于不同用戶(hù)的翻譯經(jīng)驗(yàn)不同,所以他們反饋翻譯知識(shí)的置信度也不同。通過(guò)分析影響用戶(hù)置信度的特征,得到用戶(hù)置信度評(píng)價(jià)模型,并利用該模型將不同用戶(hù)反饋的翻譯知識(shí)進(jìn)行區(qū)分,實(shí)時(shí)調(diào)整更新短語(yǔ)表的參數(shù)。修改的參數(shù)包括正向短語(yǔ)翻譯概率、正向詞匯化翻譯概率、逆向短語(yǔ)翻譯概率、逆向詞匯化翻譯概率。實(shí)驗(yàn)結(jié)果表明,對(duì)不同用戶(hù)反饋的翻譯知識(shí)進(jìn)行區(qū)分,改進(jìn)短語(yǔ)表的參數(shù),得到的譯文質(zhì)量比不區(qū)分用戶(hù)得到的譯文質(zhì)量更好。
統(tǒng)計(jì)機(jī)器翻譯;用戶(hù)反饋;用戶(hù)置信度;短語(yǔ)表;參數(shù)優(yōu)化
目前,統(tǒng)計(jì)機(jī)器翻譯技術(shù)取得了長(zhǎng)足進(jìn)展,然而在譯文質(zhì)量要求較高的領(lǐng)域(例如技術(shù)出版物或?qū)@g等),翻譯系統(tǒng)產(chǎn)生的譯文仍不夠理想。在這樣的應(yīng)用背景下,大部分的機(jī)器翻譯系統(tǒng)仍然采用譯后編輯獲得高質(zhì)量的譯文。在統(tǒng)計(jì)機(jī)器翻譯方面的研究領(lǐng)域,利用用戶(hù)反饋的學(xué)習(xí)方法,對(duì)用戶(hù)進(jìn)行譯后編輯得到的譯文進(jìn)行驗(yàn)證和校改并反饋給系統(tǒng)一直是國(guó)內(nèi)外研究熱點(diǎn)。系統(tǒng)對(duì)用戶(hù)反饋的翻譯知識(shí)充分利用,能有效地修改對(duì)數(shù)線(xiàn)性模型的各項(xiàng)參數(shù),不斷完善翻譯系統(tǒng)內(nèi)的翻譯知識(shí)體系,提高翻譯性能[1]。
由于不同翻譯人員的翻譯經(jīng)驗(yàn)不同,擅長(zhǎng)的翻譯領(lǐng)域不同,導(dǎo)致他們翻譯的譯文質(zhì)量也會(huì)不同。因此利用用戶(hù)反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)的性能時(shí),對(duì)不同用戶(hù)進(jìn)行區(qū)分具有重要意義。
本文通過(guò)分析影響用戶(hù)置信度的因素,引入用戶(hù)的基本特征和用戶(hù)的翻譯狀態(tài)特征。用戶(hù)的基本特征包括用戶(hù)從事翻譯領(lǐng)域的工作時(shí)間和在翻譯公司的職位等。用戶(hù)的翻譯狀態(tài)特征包括對(duì)一個(gè)句子的用戶(hù)翻譯平均時(shí)間、用戶(hù)翻錯(cuò)單詞平均數(shù)、用戶(hù)譯文校驗(yàn)的平均次數(shù)等。根據(jù)不同用戶(hù)的相似度分析,我們?cè)O(shè)計(jì)出用戶(hù)置信度評(píng)價(jià)函數(shù)。并利用該函數(shù),得到用戶(hù)置信度評(píng)價(jià)模型,將不同用戶(hù)反饋的翻譯知識(shí)區(qū)別對(duì)待,重新修改短語(yǔ)表的各項(xiàng)參數(shù),包括正向短語(yǔ)翻譯概率、正向詞匯化翻譯概率、逆向短語(yǔ)翻譯概率、逆向詞匯化翻譯概率等。
為了驗(yàn)證本文提出方法的有效性,在英漢航空技術(shù)出版物的語(yǔ)料上進(jìn)行實(shí)驗(yàn),利用20 000句帶有校驗(yàn)人員標(biāo)注信息的語(yǔ)料,統(tǒng)計(jì)出不同用戶(hù)的翻譯狀態(tài)特征,用以構(gòu)建用戶(hù)置信度評(píng)價(jià)模型。用10萬(wàn)句平行語(yǔ)料,訓(xùn)練出了對(duì)應(yīng)的短語(yǔ)表,每次加入5 000句不同用戶(hù)反饋的譯文,進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,構(gòu)建用戶(hù)置信度評(píng)價(jià)模型,對(duì)不同用戶(hù)反饋的翻譯知識(shí)區(qū)別對(duì)待,能夠有效提高翻譯系統(tǒng)的優(yōu)化效果。
目前國(guó)內(nèi)外利用用戶(hù)反饋改進(jìn)翻譯系統(tǒng)的研究主要集中在兩方面:一種是基于規(guī)則的方法,另一種是基于機(jī)器學(xué)習(xí)的方法。
基于規(guī)則的方法是一種將用戶(hù)譯后編輯的修改作為反饋,以模板或者規(guī)則的形式表示翻譯知識(shí),修改譯文的方法。Guzman[2]等人利用用戶(hù)譯后編輯的信息,人工制定一些規(guī)則用以修改譯文。Groves[3]等人利用機(jī)器翻譯生成的譯文和譯后編輯的結(jié)果,記錄達(dá)到正確譯文時(shí)需要修改最小編輯距離,從中自動(dòng)提取規(guī)則。該方法能夠提高用戶(hù)譯后編輯的工作效率。由于受到規(guī)則形式的限制,所以對(duì)翻譯系統(tǒng)的優(yōu)化程度有限。
利用機(jī)器學(xué)習(xí)方法改進(jìn)翻譯系統(tǒng)的研究上,Simard[4]等人將譯后編輯結(jié)果作為目標(biāo)語(yǔ)言,翻譯系統(tǒng)生成的譯文為源語(yǔ)言,訓(xùn)練出一個(gè)自動(dòng)譯后編輯系統(tǒng)。利用該系統(tǒng)對(duì)得到的譯文進(jìn)行再翻譯,而該方法對(duì)譯文的調(diào)序錯(cuò)誤作用不太明顯。Llitjos[5]等人通過(guò)實(shí)時(shí)查找譯文中錯(cuò)誤的位置,對(duì)原機(jī)器翻譯系統(tǒng)中的規(guī)則庫(kù)和詞典進(jìn)行修改并優(yōu)化翻譯引擎。Martinez[6]等人提出,利用在線(xiàn)學(xué)習(xí)的技術(shù),對(duì)譯后編輯的譯文進(jìn)行處理,實(shí)時(shí)調(diào)整和更新統(tǒng)計(jì)機(jī)器翻譯模型的各項(xiàng)參數(shù),如語(yǔ)言模型中的歷史計(jì)數(shù)N1+(*ω)等。通過(guò)用戶(hù)數(shù)據(jù)的不斷加入,實(shí)現(xiàn)翻譯系統(tǒng)內(nèi)各項(xiàng)參數(shù)的優(yōu)化。
然而,研究人員利用用戶(hù)反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)時(shí),忽略了用戶(hù)的差異性。不同用戶(hù)的翻譯狀態(tài)和翻譯水平都會(huì)有所不同。因此,建立用戶(hù)置信度評(píng)價(jià)模型,對(duì)不同用戶(hù)進(jìn)行區(qū)分,可以更好地融合多名用戶(hù)的翻譯知識(shí),提高翻譯系統(tǒng)的優(yōu)化效果。
本文挖掘出多個(gè)特征用以構(gòu)建用戶(hù)置信度評(píng)價(jià)模型,并將這些特征分成兩大類(lèi):基礎(chǔ)特征和翻譯特征。其中基礎(chǔ)特征是指用戶(hù)自身具備的屬性,如用戶(hù)從事翻譯工作的時(shí)間等。而翻譯狀態(tài)特征是校驗(yàn)人員對(duì)不同用戶(hù)后編輯的結(jié)果進(jìn)行標(biāo)注的語(yǔ)料中記錄的信息,從中統(tǒng)計(jì)能夠影響用戶(hù)翻譯狀態(tài)的變量,如翻譯一個(gè)句子的平均時(shí)間等。在本文中我們對(duì)這些特征進(jìn)行分析處理,利用用戶(hù)置信度的評(píng)價(jià)函數(shù)得到用戶(hù)置信度評(píng)價(jià)模型。
2.1特征
(1)用戶(hù)基礎(chǔ)特征
針對(duì)用戶(hù)固有的屬性,挖掘出用戶(hù)的基礎(chǔ)特征,包括用戶(hù)從事翻譯工作的時(shí)間,用戶(hù)在翻譯公司的職位,可以從翻譯公司記錄下來(lái)的翻譯人員的信息獲得。
(2)用戶(hù)的翻譯特征
(a)用戶(hù)翻譯平均時(shí)間如式(1)所示:
(1)
通過(guò)譯后編輯語(yǔ)料中記錄的信息,得到用戶(hù)翻譯每個(gè)句子的起始時(shí)間和結(jié)束時(shí)間,這里Si代表用戶(hù)翻譯當(dāng)前句子的起始時(shí)間,Ei表示翻譯該句子的結(jié)束時(shí)間,n表示該用戶(hù)翻譯句子的總數(shù)。
(b)用戶(hù)翻錯(cuò)單詞平均數(shù)如式(2)所示:
(2)
通過(guò)譯后編輯語(yǔ)料中校驗(yàn)人員的批注,統(tǒng)計(jì)出用戶(hù)翻譯當(dāng)前句子中錯(cuò)誤單詞的個(gè)數(shù)Ri,以及該用戶(hù)翻譯句子的數(shù)目n,最終得到對(duì)應(yīng)某個(gè)用戶(hù)每個(gè)句子翻錯(cuò)單詞的平均個(gè)數(shù)。
(c)用戶(hù)譯文校驗(yàn)的平均次數(shù)如式(3)所示:
(3)
通過(guò)在譯后編輯語(yǔ)料中得到某個(gè)用戶(hù)翻譯句子時(shí)批注人修改的次數(shù)Ci,以及該用戶(hù)翻譯句子的數(shù)目n,可以得到用戶(hù)翻譯修改次數(shù)的平均數(shù)。
(d)用戶(hù)翻譯每句錯(cuò)誤率的方差如式(4)所示:
(4)
(e)用戶(hù)的翻譯總量
選取標(biāo)注有用戶(hù)姓名的大批量語(yǔ)料,該語(yǔ)料記錄的是不同用戶(hù)翻譯一個(gè)月的總量,得到每個(gè)用戶(hù)翻譯句子的總數(shù)。利用不同特征向量描述用戶(hù)翻譯狀態(tài),對(duì)特征向量進(jìn)行歸一化,其中計(jì)算公式如式(5)所示:
(5)
在這里,T代表某個(gè)用戶(hù)的某項(xiàng)翻譯特征,Min代表所有用戶(hù)在該對(duì)應(yīng)特征下的最小值,Max代表所有用戶(hù)在該對(duì)應(yīng)特征下的最大值。此處用于構(gòu)建用戶(hù)置信評(píng)價(jià)模型的用戶(hù)特征向量如公式(6)所示:
(6)
2.2用戶(hù)置信度的評(píng)價(jià)函數(shù)
人工選取最好的用戶(hù),認(rèn)為該用戶(hù)的置信度最高,通過(guò)計(jì)算該用戶(hù)與其他用戶(hù)特征向量的相似度,設(shè)置不同用戶(hù)的置信區(qū)間,最終得到用戶(hù)置信度評(píng)價(jià)模型,其中用戶(hù)相似度如式(7)所示:
C(PUseri,PUserj)=cosθ=
(7)
利用該公式得到不同用戶(hù)的特征向量與人工選定用戶(hù)的特征向量相似度的計(jì)算結(jié)果。由于進(jìn)行譯后編輯工作的用戶(hù)多數(shù)都是專(zhuān)業(yè)翻譯人員,他們反饋的譯文質(zhì)量差別并不是很大,因此我們根據(jù)相似度水平,把用戶(hù)分成三類(lèi):相似度在(0.7,1.0]的用戶(hù)我們?cè)O(shè)定為A檔,是置信度高的用戶(hù)群體;相似度在(0.3,0.7]的用戶(hù)設(shè)定為B檔,是置信度較高的用戶(hù)群體;而相似度在(0,0.3]的用戶(hù)為C檔,是置信度一般的用戶(hù)群體。
通過(guò)用戶(hù)置信度評(píng)價(jià)模型得到分類(lèi)的結(jié)果,對(duì)不同用戶(hù)設(shè)置不同的權(quán)重,優(yōu)化翻譯系統(tǒng)中短語(yǔ)表的各項(xiàng)參數(shù),提高譯文質(zhì)量。
3.1用戶(hù)權(quán)重的設(shè)定
通過(guò)計(jì)算,我們依據(jù)置信度將用戶(hù)分為A、B、C三個(gè)用戶(hù)群體,下一步還需為不同用戶(hù)群體賦予不同的權(quán)重,以表示用戶(hù)反饋的翻譯知識(shí)的重要程度。由于用戶(hù)都是專(zhuān)業(yè)翻譯人員,總體上反饋的翻譯知識(shí)都有一定的參考價(jià)值,所以將用戶(hù)權(quán)重范圍設(shè)定在(1,2]之間。通過(guò)在開(kāi)發(fā)集上的反復(fù)實(shí)驗(yàn),最后將A、B、C三個(gè)用戶(hù)群體的權(quán)重系數(shù)分別設(shè)定為1.8、1.6、1.2。
3.2短語(yǔ)表參數(shù)的優(yōu)化
短語(yǔ)表的質(zhì)量是影響機(jī)器翻譯系統(tǒng)性能的重要因素,短語(yǔ)表的獲取大多都是建立在雙語(yǔ)句對(duì)詞對(duì)齊關(guān)系上的,按照一定的規(guī)則抽取出短語(yǔ)對(duì)。短語(yǔ)表的結(jié)構(gòu)形式如表1所示:
表1 短語(yǔ)表的結(jié)構(gòu)形式
下面將介紹短語(yǔ)表的四個(gè)翻譯概率的計(jì)算及優(yōu)化方法。
(1)正向短語(yǔ)翻譯概率如式(8)所示:
(8)
(2)正向詞匯化翻譯概率如式(9)所示:
(9)
(10)
即源語(yǔ)言到目標(biāo)語(yǔ)言詞匯化加權(quán)概率,將源語(yǔ)言和目標(biāo)語(yǔ)言的短語(yǔ)對(duì)拆分成詞匯,通過(guò)詞匯化概率公式的計(jì)算,得出短語(yǔ)對(duì)中詞匯化的匹配程度。
公式(9)是一個(gè)二重循環(huán)問(wèn)題:在外層循環(huán)中,從目標(biāo)語(yǔ)言端第一個(gè)詞匯遍歷至最后一個(gè)詞匯,將概率值進(jìn)行連乘;在內(nèi)層循環(huán)中,當(dāng)前目標(biāo)語(yǔ)言端詞匯為ei,計(jì)算不同fj翻譯為ei的概率和的均值。在這里a表示的是雙語(yǔ)平行語(yǔ)料中對(duì)應(yīng)的詞對(duì)齊關(guān)系。從公式(10)中看出詞匯化概率中count(fj,ei)表示短語(yǔ)對(duì)中源語(yǔ)言與目標(biāo)語(yǔ)言(fj,ei)詞匯化對(duì)在大規(guī)模平行語(yǔ)料中出現(xiàn)的次數(shù),∑eicount(fj,ei)表示以fj為源語(yǔ)言端詞匯化在大規(guī)模平行語(yǔ)料中出現(xiàn)的次數(shù)。與前面介紹的計(jì)算方式類(lèi)似,這里countuserk(fj,ei)表示不同的用戶(hù)群體翻譯的平行句對(duì)中詞對(duì)(fj,ei)出現(xiàn)的次數(shù)?!芿icountuserk(fj,ei)表示以fj為源語(yǔ)言端在用戶(hù)翻譯的平行句對(duì)出現(xiàn)的次數(shù)。對(duì)應(yīng)的權(quán)重系數(shù)與之前介紹的相同。
(3)逆向短語(yǔ)翻譯概率如式(11)所示:
(11)
(4)逆向詞匯化翻譯概率如式(12)所示:
(13)
即目標(biāo)語(yǔ)言到源語(yǔ)言詞匯化加權(quán)概率,將短語(yǔ)拆分成詞匯,通過(guò)雙語(yǔ)詞對(duì)齊結(jié)果統(tǒng)計(jì)出詞匯化的概率,此處具體計(jì)算方式的解釋與前面的正向詞匯化翻譯概率類(lèi)似,在此不再贅述。
由于短語(yǔ)翻譯概率系統(tǒng)大多都是基于對(duì)數(shù)線(xiàn)性模型進(jìn)行建模,因此將以上四個(gè)翻譯概率作為特征加入到對(duì)數(shù)線(xiàn)性模型中。
4.1實(shí)驗(yàn)數(shù)據(jù)
構(gòu)建用戶(hù)置信度評(píng)價(jià)模型時(shí),我們采集翻譯公司內(nèi)翻譯人員的基本個(gè)人信息作為基礎(chǔ)特征向量。我們得到20 000句標(biāo)注有校驗(yàn)人員修改信息的語(yǔ)料,這部分語(yǔ)料記錄了用戶(hù)在翻譯過(guò)程的各種信息,語(yǔ)料的結(jié)構(gòu)形式如表2所示:
表2 語(yǔ)料的結(jié)構(gòu)形式
在這里原文的語(yǔ)言是中文,譯文的語(yǔ)言是英語(yǔ),作者是該譯文翻譯人員的姓名,翻譯時(shí)間記錄翻譯當(dāng)前句子的時(shí)間,形式如“201307020812”,意思是2013年7月2日8點(diǎn)12分開(kāi)始翻譯該句子。批注人是修改人員的姓名,批注的形式如<螺桿,翻譯成threaded rod,應(yīng)改為 screw rod>,最終譯文是經(jīng)過(guò)修改后的標(biāo)準(zhǔn)譯文。在這里批注人有多個(gè),而對(duì)應(yīng)的批注為當(dāng)前批注人修改的信息,同樣該批注也會(huì)有多個(gè)。
本文評(píng)價(jià)優(yōu)化算法的語(yǔ)料來(lái)源于航空技術(shù)出版物,該語(yǔ)料中的主要信息如表3所示。利用該語(yǔ)料得到對(duì)應(yīng)的詞對(duì)齊模型、翻譯概率模型、語(yǔ)言模型、調(diào)序模型等。在這里詞匯數(shù)為雙語(yǔ)平行句對(duì)中不同單詞的數(shù)目。
表3 評(píng)價(jià)語(yǔ)料的統(tǒng)計(jì)
另外再抽取6萬(wàn)對(duì)平行句對(duì)用于優(yōu)化短語(yǔ)表,該語(yǔ)料記錄翻譯人員的姓名,用以區(qū)分不同的翻譯人員;分詞工具采用的是中科院的ICTCLAS;詞對(duì)齊工具采用GIZA++[8];翻譯概率模型的生成來(lái)自于東北大學(xué)研發(fā)的NiuTrans工具包[9]。
4.2實(shí)驗(yàn)結(jié)果及分析
為了驗(yàn)證提出方法的有效性,本文做了兩組實(shí)驗(yàn),分別為翻譯概率模型直接優(yōu)化實(shí)驗(yàn)(基線(xiàn)方法)和加入用戶(hù)權(quán)重的翻譯概率模型優(yōu)化實(shí)驗(yàn)(本文方法)。
圖1為加入用戶(hù)權(quán)重和直接改進(jìn)翻譯概率模型時(shí)得到的兩組BLEU值[10]的變化情況。圖2為對(duì)應(yīng)的NIST值[11]的變化情況。通過(guò)觀察實(shí)驗(yàn)數(shù)據(jù)可以看到,利用60 000對(duì)中英文平行句對(duì),改進(jìn)翻譯概率模型時(shí),加入用戶(hù)權(quán)重對(duì)應(yīng)的 BLEU值提升9.56%,NIST值提升1.87%。而直接利用用戶(hù)反饋的翻譯知識(shí)改進(jìn)翻譯概率模型時(shí),對(duì)應(yīng)的BLEU值提升8.24%,NIST值提升0.92%。
圖1 加入不同用戶(hù)權(quán)重和不加用戶(hù)權(quán)重時(shí)BLEU值的變化情況
圖2 加入不同用戶(hù)權(quán)重和不加用戶(hù)權(quán)重時(shí)NIST值的變化情況
從圖1和圖2的實(shí)驗(yàn)結(jié)果可以看出,利用用戶(hù)反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)時(shí),譯文質(zhì)量得到了提高,原因是該語(yǔ)料的翻譯人員都是專(zhuān)業(yè)的,對(duì)應(yīng)的譯文質(zhì)量都比較高,反饋的翻譯知識(shí)都是正向有價(jià)值的。無(wú)論有沒(méi)有用戶(hù)權(quán)重,翻譯系統(tǒng)的引擎都得到優(yōu)化。而加入用戶(hù)權(quán)重,譯文質(zhì)量得到更大的提升,原因是不同用戶(hù)的翻譯經(jīng)驗(yàn)不同,而A、B、C三檔用戶(hù)翻譯的譯文確實(shí)有所差別,A檔用戶(hù)翻譯的譯文要更準(zhǔn)確一些。對(duì)不同用戶(hù)進(jìn)行分類(lèi),能夠更加有效地利用用戶(hù)反饋的翻譯知識(shí)來(lái)改進(jìn)翻譯系統(tǒng)。隨著用戶(hù)反饋數(shù)據(jù)量的增加,譯文質(zhì)量的提升速度變慢了,這是因?yàn)橄到y(tǒng)性能的提升受到了其他因素的制約。本文提出的方法側(cè)重于短語(yǔ)表的優(yōu)化,而調(diào)序模型、語(yǔ)言模型等模型參數(shù)的優(yōu)化問(wèn)題還無(wú)法得到有效的解決。
當(dāng)前統(tǒng)計(jì)機(jī)器翻譯的譯文質(zhì)量仍然不夠理想,人們開(kāi)始關(guān)注如何利用用戶(hù)反饋的翻譯知識(shí)改進(jìn)翻譯系統(tǒng)。不同用戶(hù)的翻譯經(jīng)驗(yàn)不同,本文通過(guò)深入分析影響用戶(hù)翻譯狀態(tài)的因素,挖掘不同用戶(hù)的特征,得到用戶(hù)置信度評(píng)價(jià)模型,實(shí)現(xiàn)對(duì)不同用戶(hù)分類(lèi),并利用分類(lèi)結(jié)果修改翻譯系統(tǒng)內(nèi)短語(yǔ)表的參數(shù)。實(shí)驗(yàn)結(jié)果表明,對(duì)用戶(hù)進(jìn)行區(qū)分,改進(jìn)翻譯概率模型比直接改進(jìn)翻譯概率模型得到的譯文質(zhì)量要高。
未來(lái)的工作將進(jìn)一步深入探討用戶(hù)置信度模型及用戶(hù)權(quán)重的優(yōu)化方法,也將尋找更多能夠描述用戶(hù)翻譯狀態(tài)的特征,實(shí)現(xiàn)對(duì)用戶(hù)的更精確描述。
[1]A ARUN,P KOEHN.Online learning methods for discriminative training of phrase based statistical machine translation[J].Machine Translation,2007,XI:15-20.
[2]RGUZMAN.Automating MT Post-editing using Regular Expressions[J].Multilingual Computing,2007,18(6):49-52.
[3]D GROVES,D SCHMIDTKE.Identification and Analysis of Post-Editing Patterns for MT[C].Proceedings of MT Summit XII,2009,Ottawa,Canada.
[4]MSIMARD,CGOUTTE,PISABELLE.Statistical Phrase-based Post-Editing[C].Proceedings of NAACL,2007,2007:508-515,Rochester,USA.
[5]AFLLITJOS,JGCARBONELL.Automating Post-Editing to Improve MT Systems[C].Proceedings of the AMTA Automated Post-Editing Technique and Applications Workshop,2006,Cambridge,USA.
[6]DORTIZ-MARTINEZ,IGARCIA-VAREA,FCASACUBERTA.Online Learning for Interactive Statistical Machine Translation[C].Proceedings of NAACL,2010,2010:546-554,Los Angeles,USA.
[7]P KOEHN,FJ OCH,D MARCU.Statistical Phrase-Based Translation[C].Proceedings of HLT/NAACL,2003,2003:127-133,Edmonton,Canada.
[8]FJ OCH,H Ney.A systematic comparison of various statistical alignment models[J].Computational Linguistics,29(1):19-51.
[9]T XIAO,J ZHU,H ZHANG,QLI.Niutrans:An open source toolkit for phrase-based and syntax-based machine translation[C].Proceedings of ACL,2012,2012:19-24,Jeju,Korea.
[10]KPAPINENI,S ROUKOS,T WARD.BLEU:a method for automatic evaluation of machine translation[C].Proceedings of ACL,2002,2002:311-318,Philadelphia,USA.
[11]G DODDINGTON.Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics[C].Proceedings of HLT,2002,2002:138-145,San Diego,USA.
(責(zé)任編輯:劉劃英文審校:趙亮)
Optimization method for statistical machine translation of phrase table based on user feedback
YIN Rui-cheng,YE Na,CAI Dong-feng
(Human-computer Intelligence Research Center,Shenyang Aerospace University,Shenyang 110136,China)
In recent years,a substantial progress is achieved in the study of statistical machine translation.However,in the domains with high translationquality requirements,the machine translation output still cannotbe satisfied.With the advent of computer-assisted translation and interactive machine translation technology,researchers begin to learn translation from users′ feedback to optimize the parameters of the machine translation systems.Since users′ translation experiences are different,the confidences of the translation knowledge learned from users are different.This paper analyzed the factors that influence the user′s confidence and proposed a model to evaluate it.This model can be used to distinguish the translation knowledge from different users,and update the parameters of phrase table in real time.The modified parameters included the probabilityof forward phrase translation,forward lexical translation,reverse phrase translation and reverse lexical translation.Experimental results show that by distinguishing the translation knowledge from different users′ feedback,an optimized performance is achieved compared to non-distinguishing users.
statistical machine translation;user feedback;user confidence;phrase table;parameter optimization
2095-1248(2016)03-0073-06
2016-01-25
國(guó)家自然科學(xué)基金(項(xiàng)目編號(hào):61402299)
尹瑞程(1988-),男,河南洛陽(yáng)人,碩士研究生,主要研究方向:機(jī)器翻譯,E-mail:925910322@qq.com;葉娜(1981-),女,遼寧沈陽(yáng)人,講師,主要研究方向:機(jī)器翻譯,E-mail:yena_1@126.com;蔡?hào)|風(fēng)(1958-),男,遼寧沈陽(yáng)人,教授,主要研究方向:人工智能、自然語(yǔ)言處理,E-mail:caidf@vip.163.com。
TP391.7
A
10.3969/j.issn.2095-1248.2016.03.012