王欣欣
(商洛學(xué)院 人文學(xué)院, 陜西 商洛 726000)
人們之間的信息傳遞是依靠語(yǔ)言和文字進(jìn)行的。許多國(guó)家和種族都擁有自己的語(yǔ)言和文字,造成語(yǔ)言不同的人們之間無(wú)法順暢地進(jìn)行交流[1]。網(wǎng)絡(luò)信息技術(shù)的出現(xiàn)和發(fā)展拉近了世界各國(guó)之間的距離,隨著各個(gè)領(lǐng)域翻譯工作量的持續(xù)增加,人工翻譯工作已經(jīng)難以應(yīng)對(duì)大量的需求。英語(yǔ)是國(guó)際通用語(yǔ)言,是多數(shù)翻譯軟件的目標(biāo)語(yǔ)言。因此,從事翻譯系統(tǒng)研發(fā)的專(zhuān)業(yè)人員越來(lái)越注重能將多種語(yǔ)言翻譯成英語(yǔ)的在線輔助系統(tǒng)的研究[2]。
當(dāng)前同類(lèi)的系統(tǒng)有很多種,但有的系統(tǒng)存在模塊功能實(shí)現(xiàn)率低、翻譯時(shí)間較長(zhǎng)的缺陷,也有系統(tǒng)存在發(fā)音成功率低、多語(yǔ)言翻譯有偏差等問(wèn)題。本文所設(shè)計(jì)的在線翻譯輔助系統(tǒng)將針對(duì)上述問(wèn)題進(jìn)行改進(jìn),以保證系統(tǒng)的功能優(yōu)越性。
本系統(tǒng)為在多語(yǔ)言交互的基礎(chǔ)上進(jìn)行英語(yǔ)翻譯在線輔助,系統(tǒng)主要功能及其設(shè)計(jì)方案如下。
(1) 聚合多種翻譯規(guī)則優(yōu)勢(shì)實(shí)現(xiàn)多語(yǔ)言交互
各種語(yǔ)言的語(yǔ)法規(guī)則都具有一定的復(fù)雜性,且隨著社會(huì)的發(fā)展會(huì)產(chǎn)生一定的變化,因此進(jìn)行多語(yǔ)言翻譯必須建立聚合大量規(guī)則的體系,很多種同類(lèi)系統(tǒng)為了實(shí)現(xiàn)多語(yǔ)言交互,均設(shè)置了其自有規(guī)則[3]。基于多語(yǔ)言交互的英語(yǔ)翻譯,將各種機(jī)制的優(yōu)勢(shì)集中在一起,多種翻譯方式同時(shí)處理目標(biāo)內(nèi)容,將已經(jīng)得到優(yōu)化的多項(xiàng)結(jié)果再進(jìn)行擇優(yōu)選取,以提高翻譯效率并保證翻譯的準(zhǔn)確性。
(2) 翻譯結(jié)果的語(yǔ)句編輯和更正
由計(jì)算機(jī)將多種語(yǔ)言翻譯成英文,常存在以下問(wèn)題。
① 英文釋義與實(shí)際表達(dá)不符;
② 英文譯文的語(yǔ)法使用不得當(dāng),語(yǔ)序不連貫、不正確;
③ 英文譯文中的修飾用語(yǔ)選擇不準(zhǔn)確,詞不達(dá)意。
鑒于上述問(wèn)題,本文所設(shè)計(jì)的在線翻譯輔助系統(tǒng)必須能夠?qū)⒊跏甲g文進(jìn)行正?;木庉嫼透?,以保證輸出的譯文釋義準(zhǔn)確、語(yǔ)法得當(dāng)、修飾關(guān)系清楚。
(3) 英文知識(shí)庫(kù)的維護(hù)
在本文所設(shè)計(jì)的系統(tǒng)中單獨(dú)設(shè)立英文知識(shí)庫(kù),用于儲(chǔ)存大量的多語(yǔ)言翻譯英文規(guī)則、多語(yǔ)言專(zhuān)業(yè)術(shù)語(yǔ)、多語(yǔ)言用語(yǔ)實(shí)例等知識(shí),對(duì)數(shù)據(jù)庫(kù)的維護(hù)主要包括詞句添加、翻譯處理、內(nèi)容更新、已翻譯內(nèi)容保存等工作。
本文所設(shè)計(jì)的英語(yǔ)翻譯在線輔助系統(tǒng),正常運(yùn)行情況下的功能實(shí)現(xiàn)流程為多語(yǔ)言交互轉(zhuǎn)換英文準(zhǔn)備、在線翻譯、譯文編輯與處理,與這些環(huán)節(jié)相對(duì)應(yīng)的工作模塊及其性能應(yīng)滿足以下要求。
(1) 系統(tǒng)收發(fā)模塊
系統(tǒng)收發(fā)模塊是本系統(tǒng)與用戶直接交互的部分,通過(guò)該模塊系統(tǒng)接收客戶所提交的原文,翻譯完成后發(fā)送給用戶,因此在該模塊中設(shè)置了文本接收、文本處理、文本發(fā)送3個(gè)子模塊。
(2) 智能翻譯模塊
智能翻譯引擎與歷史翻譯數(shù)據(jù)庫(kù)二者串聯(lián)組成了智能翻譯模塊,翻譯引擎輸出的直譯譯文由數(shù)據(jù)庫(kù)進(jìn)行編輯和更正。
(3) 人工翻譯模塊
專(zhuān)業(yè)翻譯人員通過(guò)該模塊接收工作任務(wù),對(duì)系統(tǒng)智能翻譯的譯文進(jìn)行專(zhuān)業(yè)校對(duì)和修正。
(4) 系統(tǒng)任務(wù)管理模塊
從系統(tǒng)接受翻譯任務(wù)開(kāi)始,直到翻譯完成并將結(jié)果返回給用戶,整個(gè)過(guò)程都由任務(wù)管理模塊進(jìn)行全程記錄,同時(shí),該模塊輔助監(jiān)督每一個(gè)環(huán)節(jié)是否正常進(jìn)行。
(5) 系統(tǒng)記憶庫(kù)維護(hù)模塊
系統(tǒng)記憶庫(kù)維護(hù)的主要工作是語(yǔ)料的審核和語(yǔ)料的輸出。多語(yǔ)言?xún)?nèi)容的語(yǔ)料被采集后由管理者進(jìn)行審核,通過(guò)后錄入系統(tǒng)生成系統(tǒng)指定格式的文件,系統(tǒng)更新時(shí)將所有新的語(yǔ)料儲(chǔ)存到系統(tǒng)記憶庫(kù)中。
英語(yǔ)在線翻譯輔助系統(tǒng)的所有功能實(shí)現(xiàn)流程都是在系統(tǒng)的客戶端和服務(wù)端中完成的。系統(tǒng)管理、用戶管理、基于多語(yǔ)言交互的詞庫(kù)使用、多語(yǔ)言交互英語(yǔ)翻譯輔助、英語(yǔ)譯文管理等功能都由系統(tǒng)客戶端實(shí)現(xiàn),基于多語(yǔ)言交互的數(shù)據(jù)庫(kù)更新、知識(shí)文件保存和系統(tǒng)自身維護(hù)等功能都由系統(tǒng)服務(wù)端實(shí)現(xiàn)。由此可見(jiàn),系統(tǒng)主要功能大部分是由服務(wù)端完成的,客戶端完成的則是在線翻譯輔助與用戶進(jìn)行交互的部分。
(1) 基于多語(yǔ)言交互融合的系統(tǒng)流程
基于多語(yǔ)言交互融合的系統(tǒng)流程如圖1所示。
圖1 基于多語(yǔ)言交互融合的系統(tǒng)工作具體流程
(2) 為項(xiàng)目而進(jìn)行的英語(yǔ)在線翻譯輔助工作流程
為項(xiàng)目而進(jìn)行的英語(yǔ)在線翻譯系統(tǒng)流程如圖2所示。
圖2 為項(xiàng)目而進(jìn)行的英語(yǔ)在線翻譯輔助工作流程
項(xiàng)目翻譯輔助工作必須在團(tuán)隊(duì)協(xié)作的條件下進(jìn)行,在翻譯工作進(jìn)行的過(guò)程中,專(zhuān)業(yè)翻譯人員的分工、翻譯原文的分配、翻譯工作進(jìn)度的協(xié)調(diào)、翻譯輸出英文文本的審核等工作都是由系統(tǒng)完成的。如果用戶需要翻譯的多語(yǔ)言文本包含大量?jī)?nèi)容,則系統(tǒng)會(huì)基于XML格式文件的特性,根據(jù)語(yǔ)言文本的大綱或目錄將其分解為若干份文件交由翻譯人員進(jìn)行處理,翻譯工作完成后再由系統(tǒng)進(jìn)行合并,最后返回至用戶。
進(jìn)行系統(tǒng)功能測(cè)試的計(jì)算機(jī)硬件配置為:戴爾3980MT臺(tái)式機(jī),Intel?Core(TM)i5雙核處理器,主頻2.4 GHz,內(nèi)存4 GB,1TB容量硬盤(pán);軟件配置為Windows 8操作系統(tǒng),安裝XEclipse集成軟件,IE核心瀏覽器。在以上軟硬件環(huán)境下,通過(guò)向系統(tǒng)提交多語(yǔ)言原文范本完成全文在線翻譯進(jìn)行系統(tǒng)的性能測(cè)試,記錄不同原文數(shù)量條件下翻譯完成所消耗的時(shí)間,將系統(tǒng)輸出結(jié)果與正確的結(jié)果進(jìn)行比較,分別計(jì)算短文收發(fā)、自動(dòng)翻譯、記憶庫(kù)管理、任務(wù)管理、人工校正各單項(xiàng)功能的實(shí)現(xiàn)率,通過(guò)語(yǔ)音輸出與譯文內(nèi)容的比對(duì)結(jié)果計(jì)算英語(yǔ)發(fā)音準(zhǔn)確率,通過(guò)與正確結(jié)果的比較計(jì)算多語(yǔ)言翻譯的準(zhǔn)確性。測(cè)試數(shù)據(jù)為經(jīng)過(guò)多次測(cè)試后,在確認(rèn)數(shù)據(jù)變化趨勢(shì)一致的情況下所計(jì)算的數(shù)據(jù)均值,數(shù)值結(jié)果真實(shí)可靠。本文基于上述指標(biāo)驗(yàn)證本系統(tǒng)是否實(shí)現(xiàn)了系統(tǒng)設(shè)計(jì)的預(yù)期目標(biāo)。
以其他兩個(gè)同類(lèi)系統(tǒng)為參照系統(tǒng),將單項(xiàng)功能實(shí)現(xiàn)率(%)、在線翻譯時(shí)間(b/s)、英語(yǔ)發(fā)音準(zhǔn)確率(%)、多語(yǔ)言翻譯準(zhǔn)確率(%)列為系統(tǒng)性能的考核指標(biāo),通過(guò)與其他兩種系統(tǒng)的考核結(jié)果對(duì)比來(lái)評(píng)定本系統(tǒng)的性能是否達(dá)標(biāo)。各功能模塊性能對(duì)比結(jié)果如圖3所示。
圖3 各功能模塊性能對(duì)比結(jié)果
由圖3可見(jiàn),本文所設(shè)計(jì)的系統(tǒng)各單項(xiàng)功能實(shí)現(xiàn)率均達(dá)到100%,翻譯流程中的每個(gè)環(huán)節(jié)均全部完成,而其他兩種同類(lèi)系統(tǒng)的實(shí)現(xiàn)率均低于100%。
在線翻譯效率對(duì)比結(jié)果如圖4所示。
圖4 在線翻譯效率對(duì)比結(jié)果
由圖4可見(jiàn),3種不同系統(tǒng)在翻譯使用時(shí)間方面具有明顯的差異,2種參照系統(tǒng)對(duì)多語(yǔ)言原文范本進(jìn)行在線翻譯時(shí),如果持續(xù)向系統(tǒng)輸入待翻譯文本,則翻譯時(shí)間隨之延長(zhǎng),翻譯效率降低。在待翻譯文本分別為100篇和500篇時(shí),其他兩種系統(tǒng)與本文所設(shè)計(jì)輔助系統(tǒng)的差異最為明顯,100篇持續(xù)時(shí)間分別為24b/s(本系統(tǒng))、31b/s(文獻(xiàn)[4]系統(tǒng))、38b/s,文獻(xiàn)[5](系統(tǒng)),500篇持續(xù)時(shí)間分別為18b/s(本系統(tǒng))、24b/s(文獻(xiàn)[4]系統(tǒng))、43b/s(文獻(xiàn)[5]系統(tǒng)),可見(jiàn)本系統(tǒng)的在線翻譯效率最高,且隨篇幅的增長(zhǎng)在翻譯時(shí)間上不存在很大差距。
本系統(tǒng)與其他兩種系統(tǒng)的英語(yǔ)發(fā)音準(zhǔn)確率對(duì)比結(jié)果如圖5所示。
圖5 翻譯系統(tǒng)發(fā)音準(zhǔn)確率對(duì)比
從圖5中可以看出,同等翻譯字符數(shù)條件下文獻(xiàn)[4]系統(tǒng)的發(fā)音準(zhǔn)確率最低,且不同字符數(shù)時(shí)準(zhǔn)確率波動(dòng)較大,文獻(xiàn)[5]系統(tǒng)雖然在同等翻譯字符數(shù)條件下準(zhǔn)確率較文獻(xiàn)[4]系統(tǒng)高,但總體上仍低于本文所設(shè)計(jì)的系統(tǒng)。
本系統(tǒng)與其他兩種系統(tǒng)的翻譯成功率對(duì)比結(jié)果如圖6所示。
圖6 三種系統(tǒng)的英語(yǔ)翻譯成功率對(duì)比
從圖6中可以看出,在不同語(yǔ)種翻譯成英文的成功率方面,本文所設(shè)計(jì)的系統(tǒng)均高于其它兩種系統(tǒng)。
在上述實(shí)驗(yàn)結(jié)果及對(duì)比結(jié)果的基礎(chǔ)上可以得出結(jié)論,本文所設(shè)計(jì)的基于多語(yǔ)言在線翻譯輔助系統(tǒng)性能完全達(dá)標(biāo),且相較于同類(lèi)系統(tǒng)具有更為明顯的性能優(yōu)勢(shì)。
項(xiàng)目說(shuō)明:本系統(tǒng)系“陜西一流應(yīng)用型本科院校大學(xué)英語(yǔ)在線課程建設(shè)模式研究”項(xiàng)目研究?jī)?nèi)容之一。該項(xiàng)目以提高大學(xué)英語(yǔ)在線教學(xué)效果、提升學(xué)生自主學(xué)習(xí)能力為指標(biāo),以建立完善的大學(xué)英語(yǔ)在線課程體系為最終成果,共8人參與項(xiàng)目的研究,其中包括3名博士研究生和5名碩士研究生,本人負(fù)責(zé)該項(xiàng)目的資料收集和英語(yǔ)翻譯在線平臺(tái)的開(kāi)發(fā)。該項(xiàng)目預(yù)期2020年底結(jié)題,相關(guān)驗(yàn)收?qǐng)?bào)告正在撰寫(xiě)過(guò)程中。項(xiàng)目研究過(guò)程中得到商洛學(xué)院數(shù)學(xué)與計(jì)算機(jī)應(yīng)用學(xué)院、語(yǔ)言文化傳播學(xué)院教授及教師的技術(shù)支持。目前,該系統(tǒng)已在數(shù)學(xué)與計(jì)算機(jī)應(yīng)用學(xué)院、語(yǔ)言文化傳播學(xué)院英語(yǔ)課程中投入運(yùn)行。運(yùn)行初期,該系統(tǒng)發(fā)音準(zhǔn)確率和翻譯成功率與文獻(xiàn)[5]系統(tǒng)相當(dāng),經(jīng)過(guò)對(duì)智能翻譯模塊的改進(jìn),并引入人工翻譯模塊,對(duì)系統(tǒng)進(jìn)行優(yōu)化,使其能達(dá)到最終應(yīng)用效果。
本文所設(shè)計(jì)的基于多語(yǔ)言在線翻譯輔助系統(tǒng)解決了其他同類(lèi)系統(tǒng)存在的模塊功能實(shí)現(xiàn)率低、翻譯時(shí)間較長(zhǎng)、發(fā)音成功率低、多語(yǔ)言翻譯有偏差等問(wèn)題,設(shè)計(jì)方案切實(shí)可行,具有很高的實(shí)用性。