楊小璽
(晉中學(xué)院 山西 晉中 030600)
對(duì)話行為具體指的是對(duì)話語句的言外力,又可以看成是淺層話語結(jié)構(gòu)的內(nèi)容。對(duì)話行為充分反映出對(duì)話語句還有對(duì)話人的目的,比如可以通過陳述、解釋、許諾或者是疑問等形式。不同的對(duì)話行為必然為對(duì)話理解創(chuàng)設(shè)了語言中不同的信息內(nèi)容,在處理自然語言的過程中也有著十分廣泛地應(yīng)用,比如常見的口語翻譯系統(tǒng)、口語對(duì)話系統(tǒng)以及自動(dòng)摘要等。
如今,隨著國內(nèi)外諸多學(xué)者對(duì)于對(duì)話行為理論地不斷深入研究和探討,先后有眾多學(xué)者嘗試著將對(duì)話意圖的相關(guān)描述應(yīng)用到傳統(tǒng)的機(jī)器翻譯當(dāng)中。比如,JANUS 系統(tǒng)、Verbmobil 系統(tǒng)以及 Sridhar 等。
現(xiàn)對(duì)JANUS 翻譯系統(tǒng)進(jìn)行研究,此研究系統(tǒng)主要用于完成德語到英語還有德語到日語的翻譯。從這個(gè)系統(tǒng)的運(yùn)作程序來看,源語言的語義最初被解析成了一個(gè)個(gè)單獨(dú)的中間語言,接著從中間語言進(jìn)行轉(zhuǎn)換成了目標(biāo)語言,實(shí)現(xiàn)不同語言之間的互譯。此外,JANUS 系統(tǒng)采取的是C-STAR 所定義的中間轉(zhuǎn)換格式,但是對(duì)話行為只是作為IF 格式中十分重要的一種。所以,對(duì)此類建立在中間語言轉(zhuǎn)換基礎(chǔ)之上的翻譯系統(tǒng)而言,對(duì)話行為只是作為一種語義呈現(xiàn)參與到整個(gè)翻譯階段中。
Verbmobil 是上個(gè)世紀(jì)九十年代德國聯(lián)邦教育部研發(fā)的語言技術(shù)項(xiàng)目之一,迄今也是十分重大的一項(xiàng)創(chuàng)新。在這個(gè)Verdmobil 語音翻譯系統(tǒng)中,對(duì)于對(duì)話行為的應(yīng)用具體體現(xiàn)在如下模塊當(dāng)中:其一,語音識(shí)別模塊。這個(gè)模塊的主要作用是對(duì)對(duì)話行為進(jìn)行預(yù)測(cè),也就是對(duì)語言模型實(shí)施動(dòng)態(tài)過濾,目的是為了提升詞語的語音識(shí)別準(zhǔn)確率;其二,語義評(píng)價(jià)模塊。在這個(gè)模塊中主要是通過已知的獲取的對(duì)話行為中囊括的信息內(nèi)容聚焦算法,用于確定下一語句采取何種對(duì)話行為;其三,上下文信息抽取模塊,主要是用作Verbmobil 中各個(gè)模塊中的上下文信息提供,目的是為了取得較佳的翻譯結(jié)果。事實(shí)上,采用Verbmobil 系統(tǒng)進(jìn)行翻譯,對(duì)話行為并沒有直接應(yīng)用到翻譯模塊。
Sridhar 翻譯系統(tǒng)主要提供了一種對(duì)話行為和建立在短語統(tǒng)計(jì)翻譯模型二者相結(jié)合的應(yīng)用方法。此系統(tǒng)的主要應(yīng)用思路是首先建立在源語言對(duì)話行為基礎(chǔ)之上把訓(xùn)練語言進(jìn)行劃分成不同的類別,接著對(duì)不同的語言類別進(jìn)行訓(xùn)練使之形成翻譯模型??紤]到數(shù)據(jù)稀疏方面的問題,Sridhacr 等人選擇把基線系統(tǒng)當(dāng)中所訓(xùn)練出的短語翻譯概率表,同時(shí)加入到不同的對(duì)話行為分類語言當(dāng)中,接著加入?yún)?shù)使之形成對(duì)短語概率實(shí)施數(shù)據(jù)平滑操作的目的。
從這可以看出,在翻譯系統(tǒng)當(dāng)中,對(duì)話行為信息不僅僅可以應(yīng)用到語音識(shí)別功能模塊,目的是為了提升翻譯系統(tǒng)的運(yùn)作性能,同時(shí)還可以應(yīng)用在建立在中間語言基礎(chǔ)之上的統(tǒng)計(jì)翻譯模型。
當(dāng)前國際上比較常用的口語翻譯實(shí)現(xiàn)系統(tǒng)使用的翻譯機(jī)制是不同的,主要可以劃分成以下三種:其一是傳統(tǒng)翻譯方法;其二是非傳統(tǒng)翻譯方法;其三是人機(jī)互助混合式翻譯方法。下面將對(duì)這三種翻譯方法進(jìn)行詳細(xì)論述。
傳統(tǒng)翻譯方法具體指的是下面四種比較常見的翻譯方法:其一是基于原則的語音翻譯方法;其二是基于事例以及模板的語音翻譯方法;其三是基于中間語言的語音方法;其四是基于傳統(tǒng)模型的翻譯方法。以上所列舉的四種翻譯方法都可以在文本機(jī)器當(dāng)中翻譯出來,而且還可以應(yīng)用到眾多商業(yè)化翻譯軟件以及實(shí)驗(yàn)系統(tǒng)當(dāng)中。所以,我們也可以把它們稱作是最為主流的幾種翻譯方法。
非傳統(tǒng)翻譯方法具體指的是除了以上列舉的四種傳統(tǒng)翻譯方法之外,最近數(shù)年來常被提起以及經(jīng)常被嘗試的幾種全新的翻譯方法。雖然此類翻譯方法相比較傳統(tǒng)的翻譯方法而言沒有被得到廣泛地采用,然而卻是研究人員朝著如何更加高效、實(shí)用的方向不斷努力的研究成果。早在1997年,Wakita 等眾多研究人員曾經(jīng)提出了可以實(shí)現(xiàn)局部抽取且正確翻譯的一種語音翻譯方法,主要思想是建立在事例基礎(chǔ)之上的口語翻譯,翻譯模塊需要對(duì)所輸入的語句實(shí)施句法以及語義分析,接著在解析結(jié)果當(dāng)中找到符合既定長度以及結(jié)構(gòu)的句法,和事例庫當(dāng)中的某一個(gè)片段或者是例句的語義距離遠(yuǎn)遠(yuǎn)小于實(shí)現(xiàn)給定的語塊或者是片段,最終還需要通過建立在事例基礎(chǔ)之上的翻譯方法對(duì)符合條件的語塊以及片斷進(jìn)行翻譯。此種方法方法也是比較常用的“回避困難”的一種做法。從這可以看出,翻譯方法不是單單只從輸入整句話來達(dá)到切分片斷或者是語塊的目的,往往是局部地對(duì)片斷進(jìn)行切割和計(jì)算,此種做法有可能獲得的翻譯片斷和事先輸入的語句之間存在含義不相吻合的現(xiàn)象。此外,很多情況下,輸入整個(gè)語句之后抽取不出可用于翻譯的片斷,以至于在整個(gè)翻譯系統(tǒng)中無法輸入任何內(nèi)容。不僅如此,采取此種口語翻譯方法和語義計(jì)算之間有著十分密切的關(guān)系。所以,必須借助高質(zhì)量的語義詞典方可充分反映出不同片斷之間存在的語義距離測(cè)度模型。例如,日本德島大學(xué)任福繼教授曾經(jīng)提出過一種有效的超函數(shù)翻譯方法,主要是解決當(dāng)前大部分機(jī)器翻譯無法實(shí)現(xiàn)“信、達(dá)、雅”標(biāo)準(zhǔn)的情況下使用的,當(dāng)用戶已經(jīng)無法再對(duì)翻譯機(jī)器提出更多關(guān)于正確率以及可讀性的前提之下方可使用這種翻譯方法。超函數(shù)翻譯方法是建立在原語言輸入以及目標(biāo)語言輸出二者之間充分地映射關(guān)系基礎(chǔ)之上的實(shí)現(xiàn)思路??傮w來說,此類方法和傳統(tǒng)的建立在分析基礎(chǔ)之上的機(jī)器翻譯系統(tǒng)需要對(duì)原句子進(jìn)行十分徹底的句法以及語義分析是完全不同的,這是一種需要借助構(gòu)造 SF 達(dá)到創(chuàng)建原語句模板以及目標(biāo)語句模板二者的對(duì)應(yīng)關(guān)系的。所以在翻譯的過程中必然需要做到獲取原句SF。
此種翻譯方法具體指的是同時(shí)使用多種翻譯方法的多引擎式交互口語翻譯方法。當(dāng)前大部分從事口語翻譯研究的工作人員偏向于采取推進(jìn)式對(duì)話方法,也就是兩個(gè)說著不同語言的人之間通過對(duì)話實(shí)現(xiàn)彼此之間的信息傳遞,也指的是當(dāng)其中某一方說完之后,則翻譯系統(tǒng)會(huì)將這個(gè)說話人所說的語句進(jìn)行翻譯并且將其發(fā)送到對(duì)方,此時(shí)另一方需要通過完全聽完來自另外一方說話人所翻譯之后的語音并發(fā)音。面對(duì)這種情況,對(duì)于翻譯人員而言完全可以和說話人進(jìn)行溝通,也就是說在進(jìn)行翻譯之前是可以和說話人進(jìn)行對(duì)話的,可以事先弄清說話人具體使用了哪些詞匯,明確對(duì)方的說話意圖。此種對(duì)話翻譯系統(tǒng),對(duì)于中間翻譯角色而言必須具備的是能夠和對(duì)話人事先對(duì)話的能力,也就是說翻譯者需要和說話人之間形成交互式對(duì)話關(guān)系,而不是簡單的單向式對(duì)話傳遞。然而,當(dāng)前除了比較常用的JANUS系統(tǒng)之外,難以看到人機(jī)交互式口語翻譯系統(tǒng),大部分人通常會(huì)選擇在原語言識(shí)別以及分析技術(shù)基礎(chǔ)之上,通過改進(jìn)傳統(tǒng)的識(shí)別技術(shù)以及翻譯策略達(dá)到提升系統(tǒng)翻譯的可讀性以及經(jīng)準(zhǔn)確,然而這種做法顯然是徒勞無獲的。主要原因在于無法預(yù)料說話人具體誰說什么以及他的表達(dá)方式是什么等等,而且說話人在說話過程中無法將標(biāo)點(diǎn)符號(hào)說出來,人們說話往往是想到什么說什么,不會(huì)像書面語必須經(jīng)過長期的深思熟慮,因此在整個(gè)過程中必然會(huì)出現(xiàn)說話人需要對(duì)前面說過的話做出修正的情況,面對(duì)這種情況應(yīng)該讓系統(tǒng)不管是“聽懂”或者是“聽不懂”都必須做出翻譯,不會(huì)給機(jī)器任何提問的機(jī)會(huì),因此這種做法顯然是不合情理的。
總體而言,在過去的相當(dāng)長一段歷史中,人們國內(nèi)外學(xué)者對(duì)于語音翻譯的研究顯然取得了較大的進(jìn)步,然而,不管是在理論上,或者是在技術(shù)上,依然存在諸多問題需要做出進(jìn)一步研究。此外,在進(jìn)行口語翻譯的過程中,傳統(tǒng)的口語翻譯方法顯然占據(jù)較大的比重,而且具有較強(qiáng)的科學(xué)研究意義以及實(shí)用價(jià)值。即使現(xiàn)如今我國及國外學(xué)者對(duì)于口語翻譯的研究還存在諸多沒有得到解決的問題,然而必要的定位口語翻譯系統(tǒng)也可以應(yīng)用到實(shí)際應(yīng)用場(chǎng)合當(dāng)中,尤其是可以在使用方式以及應(yīng)用領(lǐng)域方面進(jìn)行創(chuàng)新。切實(shí)做到從現(xiàn)實(shí)需求出發(fā),做到合理利用目前已有的較為成熟的技術(shù),突出人機(jī)交互的障礙,在未來必將大有作為。
山東農(nóng)業(yè)工程學(xué)院學(xué)報(bào)2019年8期