易綿竹 劉伍穎 劉萬義 王 琳
(1.解放軍外國語學院,河南洛陽 471003;2.軍械工程學院,河北石家莊 050003)
20世紀40年代以來,在國際政治、軍事和科技領域大量涌現縮略術語,主要由于縮寫能使語言簡練緊湊,節(jié)省篇幅,便于相關專業(yè)領域人員交流,如“二戰(zhàn)”后用GI(government issue)指代派駐世界各國的美國兵,凸顯了其雇傭特色[1]。20世紀70年代以后,在社會生活各個領域縮略術語空前劇增,大有泛濫成災之虞,百姓對層出不窮的縮略術語不知所云,有礙于正常的交際。我國著名語言學家王宗炎先生曾撰文將縮略術語比喻為英語詞匯中的暴發(fā)戶[2]。
目前,縮略術語作為國防科技領域各種新事物、新概念和新知識核心載體,呈爆炸式劇增之勢,這既是在新軍事變革背景下世界主要軍事大國調整軍事戰(zhàn)略、創(chuàng)新軍事理論、更新武器裝備和革新體制編制的結果,也是以美國為代表的西方國家軍隊文化的一種體現,更是信息網絡時代復雜概念的簡化組合以及新思想和新觀念的高度濃縮。當前,包括縮略術語知識庫在內的術語知識管理體系建設已納入許多國家的發(fā)展戰(zhàn)略,計算術語學和術語知識工程學等跨學科綜合研究術語知識庫的構建被擺在信息化建設的優(yōu)先位置。然而,與西方發(fā)達軍事大國相比,我軍在術語知識管理體系建設方面還相對滯后,尚未完成具有中國特色且能有效滿足各種需求的術語知識庫建設,存在術語不統(tǒng)一、翻譯不標準、譯出多門等混亂現象,這已成為嚴重制約我軍多語言信息處理能力提升的瓶頸。
本文擬就國防科技領域的縮略術語構成機制和規(guī)律進行探索研究,旨在構建多語種國防縮略術語查詢系統(tǒng),以期為我國國防科技工作者和多語言軍事信息處理研究者提供一種行業(yè)化服務。
本文所指的國防縮略術語主要以軍事縮略術語為主,它是軍事術語詞、詞組或句子經過壓縮或簡略而形成的一種特殊詞語形式。
目前,專就軍事縮略術語應用研究而論,國內最新出版的雙語詞典主要有:(1)李寧主編的《英漢軍事縮略術語大辭典》收錄20萬詞條,內容涵蓋外軍軍事思想和軍事戰(zhàn)略、戰(zhàn)役和戰(zhàn)術以及航空航天、電子信息、生物核能等高、新、精、尖科技領域,涉及外軍編制體制、作戰(zhàn)指揮、訓練教育、軍兵種運用、后勤保障、維和行動、軍控與裁軍、反恐、非正規(guī)戰(zhàn)爭等方面,反映近年來具有一定戰(zhàn)略意義的最新尖端武器項目和裝備研發(fā)狀況;(2)張漢寬主編的《俄漢軍事縮略術語大詞典》收錄32 330詞條,兼具俄漢雙向對照檢索之功能,其主要特色是所收錄的縮略術語涵蓋軍事理論、信息技術、作戰(zhàn)指揮、武器裝備、體制編制、教育訓練與后勤保障等領域;力圖體現信息化戰(zhàn)爭、聯(lián)合軍事演習、國際維和與反恐行動等領域的新概念、新知識、新技術,所有詞條引文有據,注釋簡明,釋義準確;(3)潘永樑主編的《英漢軍事術語大詞典》收錄24萬詞條,每條英語軍事術語包括全稱和縮略術語,所有條目統(tǒng)一按照字母順序排列,并配備英漢、漢英雙向檢索電子詞典,實現縮略術語和全稱的相互查找,具有精確檢索、模糊檢索和全文檢索等功能。
近年來,我國開始重視國防科技用戶信息的知識化組織問題,從“大資源觀”研究用戶信息的管理問題,重點關注如何利用知識組織的理念和方法管理用戶信息資源,并明確提出了用戶信息知識化組織的內容架構及其重點任務[3]。2006年我國7個國家級情報研究機構聯(lián)合開通中國國防科技信息網站,匯聚國防科技工業(yè)領域多年積累的資源,嵌入了DPS國防術語智能定位系統(tǒng),并提供國防術語的在線翻譯服務[4]。
出于加強反恐作戰(zhàn)和信息作戰(zhàn)的戰(zhàn)略需求,我國與世界主要國家的軍事交流日趨頻繁,特別是上海合作組織成員國之間定期舉行軍事技術合作、聯(lián)合軍事演習等活動,我軍外事部門和各業(yè)務單位已積聚含有大量縮略術語的多語種軍事素材,僅僅依靠傳統(tǒng)的手工查詢方式,遠遠不能滿足日益增長的海量信息處理的現實與潛在需求。有鑒于此,在以網絡中心戰(zhàn)為最新表現形式的一體化聯(lián)合作戰(zhàn)背景下,我們探究多語種國防縮略術語的基礎理論和應用技術,合理利用靜態(tài)與動態(tài)知識源,研發(fā)可實時更新的國防縮略術語庫,不僅能夠推動國防縮略術語使用進入標準化和規(guī)范化軌道,而且對于面向網絡空間的國防科技信息自動化與智能化處理,具有重要的學術探索意義和實際應用價值。
由于國防科技和軍事素材具有使用場合特殊、保密性高、信息傳遞速度快等特點,因此在不影響內容真實性的前提下,使用縮略術語能夠壓縮文件篇幅,提高信息傳速率。與其他領域相比較而言,國防和軍事領域不僅大量使用現成的縮略術語,而且往往需要對新出現的術語詞組進行縮略從而產生新縮略術語,比如美國防部的軍事及相關術語詞典(The Department of Defense Dictionary of Military and Associated Terms)[5]所附縮略術語詞表(abbreviations and acronyms)每隔幾年就修訂更新一次,足見該領域的縮略術語產生和使用頻率之高。
在國防和軍事領域,縮略術語使用的主要特點有:
1.使用密度高。在某些軍用文函和素材中,縮略術語的覆蓋率超過一半,有的甚至高達90%以上。
2.縮略范圍廣。在軍事素材中不僅使用比較固定的縮略術語詞組,而且還對大量單詞和少量句子乃至段落進行縮略。
3.隱蔽性大。軍事素材所用縮略術語不容易被理解,讀者需要根據經驗進行判斷,由此造成理解難度大,且有的縮略術語常用作代字僅在一定范圍內使用,對局外人具有保密性。
4.語義確定。盡管軍事縮略術語構成不夠規(guī)律,同一縮略術語可代表兩個及兩個以上母體,但在某一具體文本中,其母體及所表達的意義是確定的,不可能產生歧義。試舉例說明,如:Hey,the CO wants to see the PFC down at the MP shack abut a DWI in a POV.(喂,指揮官要在憲兵處召見一等兵,因為他酒后駕駛私人汽車。)在該句中出現5個縮略術語,通過詞典查詢CO對應著Commander或Commanding Officer(指揮官)、 Course(航線)、Cut Out(阻斷)、Current Order(即時指令)、Commando Operations(突擊作戰(zhàn))、Conscientious Objector(非戰(zhàn)主義者)、Crystal Oscillator(晶體振蕩器)等10多個全稱形式,但在一定的語境條件下,CO只能理解為指揮官。
5.新詞生成快。國防科技文獻和軍事素材中的新詞匯、新詞組一經面世,相應的縮略術語隨即生成,比如在一次軍事行動開始之前,一批新的軍事縮略術語便已出現[6]。
可見,在國防科技和軍事素材中出現頻率極高的縮略術語具有專業(yè)性強、隱蔽性大、新詞生成快等特點,使翻譯處理人員常常面對層出不窮的縮略術語而感到無所適從。國防縮略術語的翻譯處理并非簡單的雙語解碼,有時一條縮略術語的表現形式相同,內涵卻相差甚遠,難以查明其根源,有時由于缺乏必要的背景知識資源作支撐,難以獲得準確的釋義。
因此,合理整合利用各類多語種國防縮略術語數據資源,將其轉化為計算機可理解、可操作的縮略術語知識庫系統(tǒng),可有效解決自然語言處理中詞性標注、詞義判定與歧義排除、命名實體識別和實體共指消解等諸多難題。
研究國防縮略術語的構成機制和規(guī)律涉及縮略形式與全稱形式關系確定、縮略術語預測、縮略術語歧義消解等各個方面,其中每項研究都具有廣泛的應用價值,比如縮略術語預測就可應用于信息檢索,在加入縮略術語作為關鍵詞擴展查詢時,能夠大大降低漏檢率。
一般認為,縮略術語構成應遵循美國學者齊夫(G.K.Zipf)提出的“省力原則”(the principle of least effort),其基本思想是以最小的代價換取最大的收益。法國語言學家馬丁內特(A.Martinet)認為“省力原則”和“交際需要”(the requirements of communication)是構成語言經濟的兩個主要因素。一方面,言者需要傳遞自己的信息;另一方面,又要盡可能地減少自己的腦力和體力付出。據此,有學者在討論縮略術語的理據時提出了言者的省力原則——最簡化原則和聽者的省力原則——鄰近性原則,后者包括詞首要素優(yōu)先、語義凸顯性、區(qū)別性和習俗性等幾個次原則[7]。馮志偉先生提出的術語形成經濟律是揭示語言經濟機制的一種重要規(guī)律,術語形成的經濟律可用“FEL公式”表示為:F=EL。其中F表示單詞的術語構成頻率,E表示術語系統(tǒng)的經濟指數,L表示術語的平均長度[8]。
國防和軍事縮略術語的構成規(guī)律與其他領域大致相同,但在某些方面有其特色。根據文獻[6]可以總結出三條規(guī)律,簡述如下:
1.單詞縮略規(guī)律。主要采用截成法(如SUB— submarine/潛水艇)、取輔音法(如FLT— fleet/艦隊,SKDN—shakedown/試航)和諧音法(如VQ— vehicle/潛水艇)。
2.詞組縮略規(guī)律。主要采用首取法(如MAF— marine air force/陸戰(zhàn)航空隊)、混成法(如BOMRON—bomber squadron/轟炸機中隊)。
3.句子縮略規(guī)律。如句子(We)have not yet begun tof ight(尚未開戰(zhàn))可縮略為HOTBUN。
通過對國防和軍事縮略術語構成機制與規(guī)律的深入研究,可以發(fā)掘多語種國防和軍事縮略術語的語言特性和認知基礎,尋繹縮略術語生成與還原、編碼與解碼、猜證與理解的新途徑,制定合理實用的釋義標準和翻譯規(guī)范。
構建國防縮略術語查詢系統(tǒng)所要解決的關鍵技術包括網絡環(huán)境下多語種縮略術語的自動抽取與自動識別技術,縮略術語數據資源整合化、規(guī)模擴大化和漢譯規(guī)范化技術,縮略術語流通度調查與動態(tài)更新技術等,唯此方可使縮略術語查詢系統(tǒng)能夠滿足有效管理、有助開發(fā)、有利擴充、快捷實用的要求,進而形成“基于網絡、流程驅動、面向服務”的國防縮略術語信息管理新體系。
多語種國防縮略術語查詢系統(tǒng)構建是語言信息處理應用研究的一項基礎工程,它也可從術語知識工程學中吸取營養(yǎng)、獲得啟示。作為近年來興起的一門交叉學科,術語知識工程學涵蓋兩個領域:一是術語學在人工智能應用中的角色作用;二是在術語學應用領域和術語管理中知識的組成部分。術語知識工程學是術語學和知識工程學的結合,而語言工程學和計算語言學則是該學科的重要基礎。應用信息技術,術語知識工程學將傳統(tǒng)的術語庫與知識庫結合起來,可使之成為一種術語知識庫(Terminological Knowledge Base, TKB)[9]。
馮志偉先生通過介紹計算術語學這一新學科,討論了術語發(fā)現、術語充實、術語受控標引、術語自由標引等問題,對于我們設計構建多語種國防縮略術語查詢系統(tǒng)具有重要的指導意義。我們嘗試采用計算術語學的理論方法和技術,設計并實現多語種國防縮略術語查詢系統(tǒng)。計算術語學研究的問題主要有[10]:(1)如何抽取術語以滿足信息檢索的需要;(2)如何抽取術語以便使用雙語語料庫來進行翻譯;(3)如何進一步完善原有術語抽取的工作(例如,如何建立概念層級網絡,如何搜索語義信息或概念信息)。
在多語種國防縮略術語查詢系統(tǒng)的功能設計上,力求凸顯其集成化、自動化和交互性的特點,采用基于在線相同使用的模式,以實現分布式、可路由、更新快等功能。
總之,研究多語種國防縮略術語構成的機制性和規(guī)律性問題,開發(fā)縮略術語查詢系統(tǒng),可為國防科技工作者和軍事信息處理人員提供一種實用化的工具,為我國與世界主要國家的國防科技交流合作提供統(tǒng)一的縮略術語翻譯標準及交換格式。以此為基礎,還可研發(fā)一系列信息增值服務產品,如多語種軍事信息檢索系統(tǒng)、機器輔助翻譯系統(tǒng)、軍事語言教學系統(tǒng)等。
在下一步工作中,我們將多語種國防縮略術語作為一種重要的知識源,從“大資源觀”和“大數據觀”著眼,注重采用面向網絡空間的本體工程技術對縮略術語數據資源進行挖掘研究[11],為推進國防科技信息處理共享平臺建設和縱深發(fā)展貢獻一份力量。
[1]韓常省.縮略語及其查找[J].科技文獻信息管理,2001(3):28-31.
[2]王宗炎.回春樓談英語[M].西安:陜西人民出版社,1983.
[3]周倩,孫穎,劉勇.關于國防科技用戶信息的知識化組織問題研究[J].情報理論與實踐,2011(1):51-54.
[4]國防領域首家門戶網站開通[N].每周電腦報,2006-08-31.
[5]Department of Defense Dictionary of Military and Associated Terms[M].Joint Publication ,2001.
[6]金經國,魏孟宏.軍事素材中的縮略語[J].解放軍外國語學院學報,1995(1):30-34.
[7]黃元龍,劉宇紅.試論縮略語的理據:省力原則[J].河南理工大學學報,2009(3):442-447.
[8]童毅見.也談術語形成的經濟律[J].中國科技術語,2012 (2):17-21.
[9]梁愛林.論術語知識工程學的發(fā)展[J].術語標準化與信息技術,2007(2):4-12.
[10]馮志偉.一個新興的術語學科——計算術語學[J].術語標準化與信息技術,2008(4):4-9.
[11]Suárez Figueroa M C, Gómez Pórez A, Motta E,eds.Ontology Engineering in a Networked World[M].Berlin Heidelberg:Springer-Verlag,2012.