劉啟源
【摘要】機(jī)器翻譯在近三十年興起并被廣泛運(yùn)用,但機(jī)器翻譯的結(jié)果卻差強(qiáng)人意,尤其是其準(zhǔn)確性和可讀性往往令人失望。為了從語(yǔ)言學(xué)的角度更具體地發(fā)現(xiàn)和分析機(jī)器翻譯的問(wèn)題,筆者設(shè)計(jì)了12句英文被動(dòng)句,運(yùn)用谷歌翻譯(Google translation)和美商系統(tǒng)翻譯(SYSTRAN translation)兩種機(jī)器翻譯軟件進(jìn)行英漢翻譯對(duì)比。
【關(guān)鍵詞】機(jī)器翻譯 被動(dòng)語(yǔ)態(tài) 翻譯對(duì)比
【中圖分類號(hào)】G64 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2016)10-0123-02
一、被動(dòng)語(yǔ)態(tài)和機(jī)器翻譯
在被動(dòng)句或被動(dòng)短語(yǔ)中,主語(yǔ)是動(dòng)作的承受者而非執(zhí)行者,且語(yǔ)句的重點(diǎn)是動(dòng)作。被動(dòng)語(yǔ)態(tài)在英語(yǔ)中使用率極高,英語(yǔ)被動(dòng)語(yǔ)態(tài)有多種結(jié)構(gòu),最常見(jiàn)的結(jié)構(gòu)為:主語(yǔ)+be動(dòng)詞+動(dòng)詞過(guò)去分詞。然而,被動(dòng)語(yǔ)態(tài)在中文里使用率并沒(méi)有如此高,且其語(yǔ)法結(jié)構(gòu)也和英語(yǔ)中的有所不同。
本文將使用谷歌翻譯和商英翻譯進(jìn)行被動(dòng)語(yǔ)態(tài)的英漢翻譯對(duì)比。谷歌翻譯是當(dāng)今最流行的機(jī)器翻譯軟件之一。谷歌翻譯屬于統(tǒng)計(jì)機(jī)器翻譯,它的運(yùn)行包括了兩種不同的、單獨(dú)進(jìn)行的過(guò)程——瞄準(zhǔn)和解譯,其翻譯主要依靠分析大量人為翻譯的文本。
商英翻譯創(chuàng)建于1968年,是最老的機(jī)器翻譯公司之一。其運(yùn)行屬于基于規(guī)則系統(tǒng),主要基于不同的語(yǔ)法規(guī)則進(jìn)行翻譯。2006年,該公司開(kāi)發(fā)了混合翻譯引擎,將基于規(guī)則系統(tǒng)和統(tǒng)計(jì)機(jī)器翻譯相結(jié)合,統(tǒng)計(jì)機(jī)器翻譯的功能主要是后期編輯。
二、對(duì)比方法
為了更全面的說(shuō)明機(jī)器翻譯在翻譯被動(dòng)語(yǔ)態(tài)時(shí)出現(xiàn)的問(wèn)題,筆者將測(cè)試內(nèi)容分成四類,這四類包含了英語(yǔ)被動(dòng)語(yǔ)態(tài)中的主要語(yǔ)法結(jié)構(gòu):
1.含有動(dòng)作執(zhí)行者的被動(dòng)句(通常由介詞“by”引導(dǎo))
2.不含動(dòng)作執(zhí)行者的被動(dòng)句
3.get+過(guò)去分詞
4.非人稱被動(dòng)語(yǔ)態(tài)
根據(jù)以上四類被動(dòng)句,筆者創(chuàng)建了本次對(duì)比的測(cè)試集,測(cè)試集中的部分被動(dòng)句是筆者自己創(chuàng)作的,其余則是通過(guò)語(yǔ)法書(shū)或網(wǎng)上搜集的,每個(gè)種類分別含有三測(cè)試句。翻譯結(jié)果分為三個(gè)層次——準(zhǔn)確、可理解和錯(cuò)誤。準(zhǔn)確意味著翻譯的意思和語(yǔ)法都正確;可理解意味著翻譯的意思可接受,但可能存在一些語(yǔ)法問(wèn)題或者表達(dá)方式不夠地道;而錯(cuò)誤則說(shuō)明翻譯的結(jié)果完全不能令人理解、語(yǔ)句完全不符合正確的語(yǔ)法構(gòu)成。
測(cè)試集和翻譯結(jié)果如下:
三、對(duì)比結(jié)果分析
由對(duì)比結(jié)果表可見(jiàn),雖然谷歌翻譯和商英翻譯所輸入的測(cè)試句是一樣的,他們輸出的翻譯內(nèi)容卻有很大差異。第一組測(cè)試為1到3句,均為含有動(dòng)作執(zhí)行者的被動(dòng)句。從結(jié)果中可看出,谷歌翻譯無(wú)法識(shí)別1句的被動(dòng)語(yǔ)態(tài),其翻譯為顛倒了動(dòng)作執(zhí)行者和承受者的中文主動(dòng)語(yǔ)態(tài),使得輸出句毫無(wú)邏輯。根據(jù)Hearne and Way的理論可得出推論,谷歌翻譯的程序中擁有所輸入單詞的正確翻譯模型,但它無(wú)法正確地分析輸入句的語(yǔ)法結(jié)構(gòu),也沒(méi)有此類英文被動(dòng)句足夠的翻譯模型。谷歌翻譯識(shí)別出了2句和3句的被動(dòng)語(yǔ)態(tài)并正確翻譯了2句,但在翻譯3句時(shí),卻沒(méi)有譯出“written”一詞,導(dǎo)致最后的輸出句子在意義和語(yǔ)法結(jié)構(gòu)上都不完整。因此,谷歌翻譯在第一組測(cè)試中1句和3句的評(píng)分檔次為“錯(cuò)誤”,2句的評(píng)分為“正確”。商英翻譯在此組測(cè)試中的表現(xiàn)則明顯略勝一籌。它用正確的語(yǔ)法轉(zhuǎn)換了輸入句中的被動(dòng)語(yǔ)態(tài)、譯出了準(zhǔn)確的意思。商英翻譯在本組測(cè)試中的精確度可能要?dú)w功于其大量的、正確的語(yǔ)法規(guī)則和其成熟的篩選技術(shù)。但是,在3句的翻譯中還是出現(xiàn)了一個(gè)語(yǔ)法錯(cuò)誤。在翻譯副詞“usually”(通常)時(shí),它將副詞的位置按照原句的英文習(xí)慣放在了動(dòng)詞“寫(xiě)”的前面,但中文里正確的表達(dá)方式應(yīng)該放在介詞“由”的前面。由此可見(jiàn),商英翻譯所運(yùn)用的混合引擎中的統(tǒng)計(jì)機(jī)器翻譯沒(méi)有起到很好的后期編輯作用。商英翻譯在1句和2句的測(cè)試中的評(píng)分為“準(zhǔn)確”,3句的評(píng)分為“可理解”。
第二組為不含執(zhí)行者的被動(dòng)句,包括4、5、6三句,其測(cè)試結(jié)果與第一組相比大有不同。谷歌翻譯在第二組測(cè)試中可識(shí)別出所有輸入句的被動(dòng)語(yǔ)態(tài),并用正確的中文語(yǔ)法表達(dá)出準(zhǔn)確的意思。 值得一提的是,它在翻譯第二組句子時(shí)將原句的被動(dòng)語(yǔ)態(tài)全部譯為中文的主動(dòng)語(yǔ)態(tài),這是中文的慣用表達(dá)方式。谷歌翻譯在第二組測(cè)試中的表現(xiàn)說(shuō)明此類被動(dòng)語(yǔ)態(tài)的語(yǔ)言模型已經(jīng)比較成熟了,其評(píng)分均為“準(zhǔn)確”。商英英語(yǔ)雖識(shí)別出的了本組的被動(dòng)語(yǔ)態(tài)但將其翻譯成了中文被動(dòng)語(yǔ)態(tài),而此類被動(dòng)語(yǔ)態(tài)一般不會(huì)在中文里用被動(dòng)句表達(dá),不符合習(xí)慣用語(yǔ)。因此,商英英語(yǔ)在本組的得分均為“可理解”。
第三組的被動(dòng)語(yǔ)態(tài)結(jié)構(gòu)為“get+過(guò)去分詞”,兩個(gè)機(jī)器翻譯在本組的表現(xiàn)都可圈可點(diǎn)。谷歌翻譯識(shí)別出了7、8、9句中“get+過(guò)去分詞”的被動(dòng)語(yǔ)態(tài)形式并將其正確地翻譯成中文主動(dòng)語(yǔ)態(tài),再一次證明了谷歌翻譯對(duì)于此類被動(dòng)語(yǔ)態(tài)語(yǔ)言模型的成熟,并說(shuō)明其刷選最佳表達(dá)方式的能力。因此,谷歌翻譯在第三組測(cè)試的評(píng)分均為“準(zhǔn)確”。商英翻譯在第三組的測(cè)試中雖然識(shí)別出了“get+過(guò)去分詞”的被動(dòng)語(yǔ)態(tài)并將其譯成了中文主動(dòng)語(yǔ)態(tài),但是在最后輸出語(yǔ)言時(shí)形成的卻不是慣用的表達(dá)方式,比如7句和8句的翻譯“誰(shuí)是否受到了傷害”和“請(qǐng)趕緊并且換衣服”,雖然這兩句在理解意思上沒(méi)有問(wèn)題,但卻不是最準(zhǔn)確和地道的表達(dá)方式,說(shuō)明商英在后期的文字編輯上任然有所欠缺。所以,商英翻譯在本組測(cè)試的得分均為“可理解”。
最后一組的測(cè)試句為非人稱被動(dòng)語(yǔ)態(tài)句,其語(yǔ)法結(jié)構(gòu)是:it+is+過(guò)去分詞+that…,在英文中運(yùn)用較廣泛。中文中雖沒(méi)有相對(duì)應(yīng)的語(yǔ)法結(jié)構(gòu),但也有意思相同的表達(dá)方式,比如“據(jù)說(shuō)”、“據(jù)報(bào)道”等等。谷歌翻譯成功識(shí)別出了10-12三個(gè)測(cè)試句的被動(dòng)語(yǔ)態(tài),并用“據(jù)推測(cè)”、“據(jù)認(rèn)為”等進(jìn)行了正確的翻譯。所以,此組的評(píng)分均為“正確”。商英翻譯在本組的表現(xiàn)則遜色不少,雖然它用“據(jù)說(shuō)”正確翻譯出了10句的被動(dòng)語(yǔ)態(tài),但把“男人”譯成了“人”,把“長(zhǎng)壽”譯成了“長(zhǎng)期活”,這兩個(gè)詞語(yǔ)的翻譯都不準(zhǔn)確;另外,它沒(méi)有識(shí)別出11句的被動(dòng)語(yǔ)態(tài),而在12句的翻譯中,將被動(dòng)語(yǔ)態(tài)直接逐字的翻譯成“被相信”放在句首,也是不符合中文語(yǔ)法規(guī)則的。由此可見(jiàn), 商英翻譯在本組測(cè)試時(shí)所使用的語(yǔ)言轉(zhuǎn)換器和語(yǔ)法規(guī)則都是錯(cuò)誤的,其在本組的評(píng)分都為“錯(cuò)誤”。
四、結(jié)論
由測(cè)試結(jié)果可得出結(jié)論,谷歌翻譯的結(jié)果好壞主要取決于其翻譯模型是否成熟,對(duì)于含有動(dòng)作執(zhí)行者的被動(dòng)句的翻譯模型還不夠成熟,但其他測(cè)試的被動(dòng)句類型都可被識(shí)別并正確翻譯成中文慣用表達(dá)方式;商英翻譯的結(jié)果則取決于其語(yǔ)言規(guī)則是否完善、后期語(yǔ)言編輯是否正確,商英翻譯針對(duì)第一組到第三組被動(dòng)語(yǔ)態(tài)的語(yǔ)法規(guī)則都較充足,都可正確識(shí)別出,但其無(wú)法識(shí)別第四組“非人稱被動(dòng)語(yǔ)態(tài)”、語(yǔ)法規(guī)則不夠完善。另外,商英翻譯在四組測(cè)試中都出現(xiàn)了選詞不當(dāng)、排序錯(cuò)誤和表達(dá)方式不夠地道等后期編輯問(wèn)題,說(shuō)明其后期編輯水平還有待提高。
參考文獻(xiàn):
[1]Hearne, M. Way, A. (2011) ‘Statistical Machine Translation: A Guide for Linguists and Translators. Language and Linguistics Compass.
[2]Arnold, D.(2003) Why translation is difficult for computers. In Somers, H.(ed.).Computers and Translations : A translators guide. Amsterdam/ Philadelphia: John Benjamins Publishing.
[3]White, J. S. (2003) How to evaluate machine translation. In Somers, H. (ed.).Computers and Translations: A translators guide. Amsterdam/ Philadelphia: John Benjamins Publishing.