高軍 劉國聰
摘要:用戶生成內(nèi)容的在線翻譯質(zhì)量好壞直接影響到讀者的閱讀體驗?;赑DCA循環(huán)理論的四個階段——計劃(plan)、執(zhí)行(do)、檢查(check)和改進(jìn)(action),結(jié)合用戶生成內(nèi)容的在線翻譯實例,通過在上述階段分別采取預(yù)翻譯譯文檢測、術(shù)語管理、譯前編輯和譯后編輯等手段進(jìn)行在線翻譯質(zhì)量管理,有效提升譯文的翻譯質(zhì)量,并據(jù)此提出可操作的用戶生成內(nèi)容在線翻譯質(zhì)量管理流程圖。
關(guān)鍵詞:PDCA循環(huán);用戶生成內(nèi)容;在線翻譯;翻譯質(zhì)量管理
中圖分類號:?H?059?文獻(xiàn)標(biāo)志碼:?A
文章編號:?1009-895X(2019)03-0213-05
DOI:?10.13256/j.cnki.jusst.sse.2019.03.003
The?PDCAbased?Online?Translation?Quality?Management?of?Usergenerated?Content
GAO?Jun,LIU?Guocong
(College?of?Foreign?Languages,University?of?Shanghai?for?Science?and?Technology,Shanghai?200093,China)
Abstract:
The?online?translation?quality?of?usergenerated?content(UGC)?will?affect?the?reading?experience?of?its?readers.Based?on?the?PDCA?cycle?of?P(plan),D(do),C(check),A(action)?and?the?online?translation?of?a?UGC?sample?text,this?paper?discusses?the?translation?quality?management?of?UGC?by?application?of?pretranslation?quality?assessment,term?management,preediting?and?postediting?in?the?process?of?online?translation,which?effectively?improves?the?translation?quality.This?paper?also?suggests?a?flow?chart?of?translation?quality?management?of?usergenerated?content.
Keywords:
PDCA?cycle;usergenerated?content;online?translation;translation?quality?management
用戶生成內(nèi)容(usergenerated?content,UGC)是由業(yè)余人士以非專業(yè)渠道制作的、包含一定的創(chuàng)作性勞動并在網(wǎng)絡(luò)上公開可用的內(nèi)容[1]。用戶在臉書、推特、維基和博客等社交媒體網(wǎng)絡(luò)平臺上發(fā)表觀點、交流意見和分享經(jīng)驗,由此貢獻(xiàn)生成的網(wǎng)站相關(guān)內(nèi)容都屬于用戶生成內(nèi)容。
隨著經(jīng)濟(jì)全球化的推進(jìn),世界知名公司和產(chǎn)品服務(wù)商意識到用戶生成內(nèi)容對產(chǎn)品宣傳推廣的重要性,對用戶生成內(nèi)容的翻譯服務(wù)需求越來越大。值得指出的是,用戶生成內(nèi)容數(shù)量大、更新快,如此龐大的翻譯工作量由人工完成顯然耗時低效。因此,在線機(jī)器翻譯以其便捷性成為眾多語言服務(wù)商使用的翻譯工具,在線翻譯的質(zhì)量管理也隨之變得愈發(fā)重要,因為翻譯質(zhì)量的好壞將直接影響到讀者的閱讀體驗。本文擬根據(jù)PDCA循環(huán)理論,借助在線翻譯工具——谷歌翻譯工具包(Google?Translator?Toolkit),結(jié)合用戶生成內(nèi)容的在線翻譯實例,即某旅游評論網(wǎng)站上海希爾頓酒店客戶的英文點評的在線翻譯質(zhì)量管理,探討如何設(shè)計可操作的在線翻譯質(zhì)量管理流程,提升用戶生成內(nèi)容的在線翻譯質(zhì)量。
一、PDCA循環(huán)理論
PDCA循環(huán)是能使任何一項活動有效進(jìn)行的一種合乎邏輯的工作程序,最早由統(tǒng)計質(zhì)量管理之父休哈特提出,后由美國質(zhì)量管理專家戴明博士于1950年再度挖掘并在質(zhì)量管理中得到了廣泛的應(yīng)用。P,D,C,A分別是plan(計劃)、do(執(zhí)行)、check(檢查)和action(改進(jìn))4個英文單詞的首字母,即代表質(zhì)量管理的4個階段。具體而言,計劃階段包括方針和目標(biāo)的確定以及活動計劃的制定;執(zhí)行階段是根據(jù)已知的信息,設(shè)計具體的方法、方案和計劃布局,再根據(jù)設(shè)計和布局,進(jìn)行具體運作,實現(xiàn)計劃中的內(nèi)容;檢查階段總結(jié)執(zhí)行計劃的結(jié)果,分清哪些對了,哪些錯了,明確效果,找出問題;改進(jìn)階段對檢查的結(jié)果進(jìn)行處理,成功的經(jīng)驗加以肯定,并予以標(biāo)準(zhǔn)化,失敗的教訓(xùn)也要引起重現(xiàn)。對于沒有解決的問題,應(yīng)進(jìn)入下一個PDCA循環(huán)中去解決。
PDCA循環(huán)的四個階段不是運行一次就完結(jié),而是周而復(fù)始地進(jìn)行。一個循環(huán)結(jié)束了,解決了一部分問題,沒有解決或新出現(xiàn)的問題,則進(jìn)行下一個PDCA循環(huán),依此類推,產(chǎn)品、服務(wù)或工作質(zhì)量隨之呈階梯上升。PDCA循環(huán)應(yīng)用了科學(xué)的統(tǒng)計觀念和處理方法,是全面質(zhì)量管理所應(yīng)遵循的科學(xué)程序。PDCA循環(huán)不僅在質(zhì)量管理體系中運用,也適用于一切循序漸進(jìn)的管理工作,包括翻譯質(zhì)量管理。
二、文本來源及翻譯工具介紹
創(chuàng)立于2000年的貓途鷹網(wǎng)站(TripAdvisor.com)是一個大型的在線旅行數(shù)據(jù)平臺,收錄了全世界各地的海量旅行信息,包括逾5.35億條旅游點評及建議,平均每分鐘就有290多條新的用戶生成內(nèi)容。本研究選取該網(wǎng)站上海希爾頓酒店客戶的英文點評為文本對象,時間跨度為2014—2015年,按點評打分星級分別選取5星到1星點評各5條(每條點評大約80~90個單詞),共計170個句子,2?110個單詞。
選擇的在線翻譯工具——谷歌翻譯工具包,是由谷歌公司2009年推出的一個比較成熟的在線翻譯輔助系統(tǒng)。該工具包的最大亮點是將谷歌自動翻譯融入其中,為用戶提供了實時翻譯的便利。將翻譯文檔上傳至谷歌翻譯工具包賬戶后,谷歌翻譯對文檔進(jìn)行預(yù)翻譯,用戶在此基礎(chǔ)上可以逐句修改譯文[2]。
谷歌翻譯工具包操作簡單,翻譯記憶庫和術(shù)語庫等一目了然。翻譯記憶庫可自行保存譯文,當(dāng)遇到相近或相同的文字或句段時,翻譯記憶就會自動搜索、比對和匹配,選出系統(tǒng)設(shè)定值范圍內(nèi)的譯文作為參考譯文。而譯員也可發(fā)揮主觀能動性,選擇接受或修改譯文,改譯的文字隨即被存入記憶庫中,以備下次參考之用。與其他計算機(jī)輔助翻譯工具不同的是,谷歌翻譯工具包的翻譯記憶庫可以全球共享,也支持譯者對推薦的例句進(jìn)行評分,因而高質(zhì)量的譯文被推薦的機(jī)率就會加大,翻譯也就愈加精準(zhǔn)。此外,用戶可提取術(shù)語并上傳至術(shù)語庫,還能邀請他人共同使用術(shù)語庫。譯員在翻譯過程中若發(fā)現(xiàn)了新術(shù)語,可通過即時通信功能,討論并確定新術(shù)語,添加到已有術(shù)語庫,從而更新和充實術(shù)語庫。
三、翻譯質(zhì)量管理流程
(一)計劃階段
計劃階段首先應(yīng)明確翻譯質(zhì)量標(biāo)準(zhǔn),從而確定質(zhì)量目標(biāo)并制定質(zhì)量計劃;其次,與人工翻譯不同,機(jī)器翻譯可以直接、快速地進(jìn)行預(yù)翻譯,因此可以先對預(yù)翻譯譯文進(jìn)行抽樣檢測,評估預(yù)翻譯的翻譯質(zhì)量,為執(zhí)行階段作好準(zhǔn)備。
1.確定翻譯質(zhì)量標(biāo)準(zhǔn)
翻譯質(zhì)量標(biāo)準(zhǔn)的選擇和制定是翻譯質(zhì)量管理中很重要的一環(huán)。國內(nèi)外行業(yè)協(xié)會先后頒布了翻譯服務(wù)譯文質(zhì)量的基本要求、質(zhì)量評定和檢測方法,為翻譯行業(yè)服務(wù)管理的規(guī)范化提供依據(jù)。但是,“隨著文本類型的增加和變化,推特和論壇等用戶生成內(nèi)容等文本在翻譯生產(chǎn)中扮演著越來越重要的角色,當(dāng)前基于企業(yè)的翻譯質(zhì)量評估模型已不大適用,新文本類型的翻譯需要新的質(zhì)量評估方式”[3]。
O’Brien[3]認(rèn)為,推特和論壇等用戶在線生成內(nèi)容屬于“客戶對客戶”的交流模式,其翻譯質(zhì)量要求一般低于“商家對客戶”,可采用充分性(Adequacy)和流暢度(Fluency)兩個參數(shù)對此類在線翻譯譯文進(jìn)行動態(tài)翻譯質(zhì)量評估。當(dāng)不存在參考譯文時,充分性可用來表示原文內(nèi)容被傳遞的情況,根據(jù)內(nèi)容傳遞的程度可以分為5個等級;流暢度用來表示譯文的流暢程度、語法是否正確以及用詞是否地道等,也分為5個等級,詳見表1。
2.預(yù)翻譯及其譯文質(zhì)量檢測
首先,使用谷歌翻譯工具包對選取的文本進(jìn)行在線預(yù)翻譯;其次,從預(yù)翻譯譯文中隨機(jī)抽取5星到1星點評各一條,共計38個句子和420個單詞,邀請5名專業(yè)翻譯人士根據(jù)充分性和流暢度兩個參數(shù)對預(yù)翻譯質(zhì)量進(jìn)行評分,結(jié)果取5個評分的平均值。結(jié)果顯示,充分性為3.10分,介于“較多”和“大部分”之間;流暢度為2.67分,介于“不地道”和“不通順”之間。由此可見,在線翻譯譯文基本能夠傳遞原文較多內(nèi)容,但在句子流暢度方面表現(xiàn)不夠理想,大部分句子不夠通順。酒店的顧客點評旨在傳達(dá)信息,幫助其他用戶了解酒店設(shè)施和顧客體驗。而預(yù)翻譯評測結(jié)果表明,譯文沒有完全傳達(dá)原文的信息,在流暢度方面也存在問題,因此需要對用戶生成內(nèi)容的在線翻譯進(jìn)行有效的質(zhì)量管理。
3.分析問題并制定計劃
翻譯過程一般分為譯前、譯中和譯后三個階段。而在機(jī)器翻譯過程中,人機(jī)交互主要體現(xiàn)在譯前和譯后,通過對這兩個階段進(jìn)行分析,找出影響譯文質(zhì)量的因素。
在譯前階段,不僅要檢查原文的詞匯以及語法結(jié)構(gòu),還要檢查原文的語言錯誤和語言歧義現(xiàn)象[4]。經(jīng)分析,發(fā)現(xiàn)原文存在一些機(jī)器翻譯經(jīng)常誤譯的人名、地名和酒店領(lǐng)域相關(guān)術(shù)語,而且有較多的語法和拼寫錯誤,部分句子過于口語化,且存在一些長句和復(fù)雜句,因此有必要進(jìn)行術(shù)語管理和譯前編輯。
Vasconcello?&?Bostad[5]認(rèn)為,在譯后編輯階段,應(yīng)盡量保留機(jī)器翻譯輸出的譯文,有針對性地修改,而不是重新翻譯。因此,為確保譯文準(zhǔn)確流暢,在譯后編輯中需要修改明顯的語言錯誤、詞匯和句子的漏譯及誤譯,并調(diào)整語序,保證句子通順。
此外,為了檢測和把控翻譯質(zhì)量改進(jìn)情況,還需要再次運用充分性和流暢度兩個評估參數(shù)對譯前、譯中和譯后三個階段的譯文進(jìn)行進(jìn)一步的語言質(zhì)量檢測,從中發(fā)現(xiàn)問題,總結(jié)經(jīng)驗,進(jìn)入下一個質(zhì)量管理循環(huán)。
(二)執(zhí)行階段
執(zhí)行階段主要涉及術(shù)語管理、譯前編輯和譯后編輯三個過程。
1.術(shù)語管理
術(shù)語漏譯和誤譯是機(jī)器翻譯的常見問題。例如,在預(yù)翻譯譯文檢測中,筆者發(fā)現(xiàn)“Wifi”漏譯,人名“Crystal”誤譯為“水晶”,因此譯前的術(shù)語整理是翻譯順利執(zhí)行的關(guān)鍵。首先查找原文,完成術(shù)語編輯,將術(shù)語保存成符合規(guī)范的UTF8編碼的CSV格式文件,然后點擊谷歌翻譯工具包的術(shù)語庫,再點擊上傳,即可進(jìn)入上傳術(shù)語庫的界面,選擇文件,為文件命名,最后點擊上傳至術(shù)語庫。當(dāng)翻譯至帶有術(shù)語的句段時,工具包欄就會提示相應(yīng)的術(shù)語,并且會在句段中圈出該術(shù)語。整理的部分術(shù)語如表2所示?。
2.譯前編輯
譯前編輯過程中,首先要糾正原文語言錯誤。只有提高原文語言質(zhì)量,才能改進(jìn)機(jī)器翻譯譯文質(zhì)量。此外,由于谷歌翻譯工具包對長句和復(fù)雜句的處理能力較差,需要根據(jù)相關(guān)改寫規(guī)則對原文進(jìn)行譯前編輯。表3列出了在譯前編輯中的主要修改類型。
筆者再次對經(jīng)譯前編輯后的機(jī)器翻譯譯文進(jìn)行抽樣評估,并與之前的預(yù)翻譯譯文進(jìn)行比較,詳見表4。
表4顯示,經(jīng)譯前編輯后的譯文質(zhì)量相比之前有了較大提升,基本傳遞了原文大部分內(nèi)容,流暢度也較理想。
3.譯后編輯
鑒于機(jī)器翻譯譯文質(zhì)量的不確定性,譯后編輯成為提高譯文質(zhì)量的必要環(huán)節(jié)。谷歌翻譯工具包的譯后編輯功能十分方便,用戶可在預(yù)翻譯的基礎(chǔ)上逐句修改譯文。
譯后編輯分為輕度譯后編輯(Light?PostEditing)和完全譯后編輯(Full?PostEditing)。輕度譯后編輯傾向于調(diào)整自動翻譯輸出的結(jié)果,盡量忠實于機(jī)器產(chǎn)出的譯文,修改明顯的語義誤譯、增添漏譯和刪除多譯等。該方式效率高、成本低,但譯文質(zhì)量提升效果有限。完全譯后編輯不僅要確保詞義和句義準(zhǔn)確無誤,對譯文的流暢度和風(fēng)格也有一定要求。該方式能大大提升譯文質(zhì)量,使其盡可能地貼近人工譯文質(zhì)量,但成本高,效率低。根據(jù)翻譯自動化用戶協(xié)會(TAUS),譯后編輯方式的選擇要基于機(jī)器譯文質(zhì)量狀況和最終譯文質(zhì)量標(biāo)準(zhǔn)的要求。當(dāng)機(jī)器譯文質(zhì)量較高而且最終譯文質(zhì)量標(biāo)準(zhǔn)較低(不需要達(dá)到出版要求)時,可選擇輕度譯后編輯。由于用戶生成內(nèi)容對翻譯質(zhì)量的要求不是很高,譯文只要達(dá)到信息準(zhǔn)確、句子通順即可,因此,筆者選擇了輕度譯后編輯,部分修改信息見表5。
(三)檢查階段
為了檢查執(zhí)行階段的效果,分別從每個評分星級中各抽取1條評論(樣本字?jǐn)?shù)約400字,占總字?jǐn)?shù)的20%)作為樣本,對樣本的前期、中期和后期譯文,即預(yù)翻譯譯文、經(jīng)譯前編輯后的譯文和經(jīng)輕度譯后編輯后的譯文進(jìn)行了翻譯質(zhì)量抽樣檢測,三種譯文的充分性和流暢度結(jié)果如圖1所示(上方為充分性,下方為流暢度)。
圖1顯示,譯前編輯、術(shù)語管理和譯后編輯等措施能有效提升譯文的充分性和流暢度(分別提升了1.70分和2.07分),其中流暢度整整提高了2個分?jǐn)?shù)檔。此外筆者還發(fā)現(xiàn)譯前編輯和術(shù)語管理對在線機(jī)器翻譯的質(zhì)量提升有著不錯的效果,充分性和流暢度分別提升了0.68分和0.83分;譯后編輯對譯文流暢度的改善更為明顯,提升了1.24分。
(四)改進(jìn)階段
根據(jù)PDCA循環(huán)法,需要對檢查結(jié)果進(jìn)行分析,成功的經(jīng)驗加以肯定,并予以標(biāo)準(zhǔn)化,失敗的教訓(xùn)也要引起重視。沒解決的問題進(jìn)入下一個PDCA循環(huán)中予以解決。
1.總結(jié)經(jīng)驗并標(biāo)準(zhǔn)化
上述分析表明,運用全面質(zhì)量管理PDCA循環(huán)法對在線機(jī)器翻譯出現(xiàn)的幾大問題采取相應(yīng)改進(jìn)措施之后,譯文質(zhì)量有了較大提升。為了對成功經(jīng)驗進(jìn)行總結(jié)和標(biāo)準(zhǔn)化,筆者歸納了用戶生成內(nèi)容的在線翻譯質(zhì)量管理的流程圖,見圖2。
翻譯質(zhì)量管理流程大致可分為兩個環(huán)節(jié):譯文生產(chǎn)和質(zhì)量監(jiān)控[6]。根據(jù)本研究的文本特征、采取的質(zhì)量改進(jìn)措施和相應(yīng)的譯文提升情況,我們認(rèn)為運用谷歌翻譯工具包的用戶生成內(nèi)容的譯文生產(chǎn)環(huán)節(jié)應(yīng)包括機(jī)器預(yù)翻譯、譯前編輯、術(shù)語管理、機(jī)器翻譯、譯后編輯和審閱等若干個階段;質(zhì)量監(jiān)控環(huán)節(jié)則采取機(jī)器翻譯質(zhì)量檢測參數(shù)對各個生產(chǎn)環(huán)節(jié)進(jìn)行翻譯質(zhì)量抽樣檢測,為譯前編輯、譯后編輯和審閱提供指導(dǎo)。兩個環(huán)節(jié)處于并行狀態(tài),協(xié)同保證翻譯質(zhì)量達(dá)到預(yù)期目標(biāo)。
2.待解決問題
在質(zhì)量全面管理中,成本控制,尤其是時間成本控制十分重要。而上述翻譯質(zhì)量控制流程中未設(shè)置時間控制環(huán)節(jié),沒有對譯前和譯后編輯的使用時間進(jìn)行監(jiān)測。如果譯前和譯后編輯所花費的時間與人工翻譯所用時間相差無幾甚至更多,那么機(jī)器翻譯就得不償失了。因此在下一個PDCA循環(huán)中,將對譯前和譯后編輯的時間進(jìn)行監(jiān)測,并設(shè)置人工翻譯對照組,進(jìn)一步探討譯前和譯后編輯效率問題。
四、結(jié)束語
本研究運用PDCA循環(huán)理論,以“貓途鷹”上海希爾頓酒店客戶的英文點評的在線機(jī)器翻譯為例,從翻譯質(zhì)量管理的計劃、執(zhí)行、檢查和改進(jìn)四個階段分別針對用戶生成內(nèi)容的在線翻譯執(zhí)行了包括譯前編輯、術(shù)語管理、譯后編輯和翻譯質(zhì)量檢測等質(zhì)量管理措施,從而使譯文質(zhì)量在內(nèi)容傳遞和流暢度上都有顯著提升。此外,從譯文生產(chǎn)和翻譯質(zhì)量監(jiān)控兩個環(huán)節(jié)探討和制定了用戶生成內(nèi)容的在線翻譯質(zhì)量管理流程圖。最后,提出該流程仍未解決的時間成本問題,并投入下一個循環(huán)進(jìn)行解決,不斷完善翻譯質(zhì)量管理流程,提升譯文質(zhì)量。
參考文獻(xiàn):
[1]?Vickery?G,WunschVincent?S.Participative?web?and?usercreated?content:web?2.0,wikis?and?social?networking[R].Paris:OCDE?Publishing,2007.
[2]?徐彬.翻譯新視野:計算機(jī)輔助翻譯研究[M].濟(jì)南:山東教育出版社,2010.
[3]?O’Brien?S.Towards?a?dynamic?quality?evaluation?model?for?translation[J].Journal?of?Specialized?Translation,2012(17):55-775.
[4]?Gross?A.Limitations?of?computers?as?translation?tools[J].Translation?Directory?on?Line,1992:96-130.
[5]?Vasconcellos?M,Bostad?D?A.Machine?translation?in?highvolume?translation?environment[J].Computers?in?Translation:A?Practical?Appraisal,1992:58-77.
[6]?王華偉,王華樹.翻譯項目管理實務(wù)[M].北京:中國對外翻譯出版公司,2013.
(編輯:?朱渭波)