丁自華
(江蘇海事職業(yè)技術(shù)學(xué)院,南京 211170)
自20世紀60年代,美國布朗語料庫的建成使用標(biāo)志著世界上第一個機器可讀語料庫的問世,并且隨著計算機技術(shù)和互聯(lián)網(wǎng)的發(fā)展,語料庫的研究日益深入、規(guī)模越來越大,其在語言研究、語言教學(xué)和語言工程等方面也得到了廣泛的應(yīng)用。語料庫語言學(xué)研究的一項重大成果就是語境共現(xiàn)(concordance),它是語料庫最基本的分析手段之一。語境共現(xiàn)最常用的形式KW IC (Key-Words in Context,帶語境的關(guān)鍵詞搜索)技術(shù)為每個搜索到的關(guān)鍵詞提供所在行固定數(shù)量的語境詞,并以該關(guān)鍵詞為中心在屏幕上顯示出來。
ESP (English for Special Purpose,專門用途英語或?qū)I(yè)英語)不同于EGP (English for General Purposes,通用英語或公共英語)。ESP是與某種特定行業(yè)和學(xué)科相關(guān)的英語, 是語言學(xué)的分支。因此, ESP理論與語言學(xué)發(fā)展息息相關(guān),那么專業(yè)英語語料庫的開發(fā)運用將使大規(guī)模、多學(xué)科的專業(yè)英語研究成為可能,并且可以有效地促進專業(yè)英語研究。
由于歷史原因以及ESP在大學(xué)英語教學(xué)中的定位不明確,導(dǎo)致我國的ESP教學(xué)曾經(jīng)出現(xiàn)了很多問題,尤其在“文革”期間甚至中斷,根本談不上相關(guān)研究。改革開放以后,隨著國家經(jīng)濟和科技事業(yè)的發(fā)展,國際交流的日益頻繁,切實提高大學(xué)生特別是理工類院校大學(xué)生及工程技術(shù)人員的專業(yè)英語水平和直接使用英語從事科研的能力已成為各高校英語教學(xué)改革的主要任務(wù)。
每個學(xué)科由于其自身的專業(yè)性太強及所涉及的詞匯極其豐富等,均具有其相應(yīng)的專業(yè)英語。以航海類專業(yè)英語為例,由于航海行業(yè)的特點,要求從事航海工作的人員不但要具有扎實的專業(yè)理論知識和技能,而且還要具備良好的專業(yè)英語綜合運用能力,其涉及航海、儀器、設(shè)備、氣象、積載、法規(guī)、船舶操縱、避碰、主輔機、防污染等多學(xué)科。
通過對江蘇海事職業(yè)技術(shù)學(xué)院114名相關(guān)專業(yè)教師進行問卷調(diào)查,結(jié)果發(fā)現(xiàn)專業(yè)英語教學(xué)與運用的實際效果與教學(xué)的預(yù)期目標(biāo)存在一定的差距(見表1,表2)。他們對專業(yè)英語的運用有較高的希望,且對專業(yè)英語的學(xué)習(xí)有一定的目標(biāo);然而詞匯、語匯的限制導(dǎo)致對語篇的理解存在很大的局限性。他們認為如果有一套完整的詞匯或語匯系統(tǒng),對于專業(yè)英語學(xué)習(xí)將會有極大的幫助。
表1 ESP教學(xué)的預(yù)期目標(biāo)(可以多選)
表2 ESP教學(xué)實際效果(可以多選)
此外,目前各高校,特別是理工類院校,外語教學(xué)往往被忽視和被邊緣化,不能融入學(xué)校的學(xué)科群建設(shè)中,只是服務(wù)于其他學(xué)科,在課程安排上常產(chǎn)生脫節(jié)。如專業(yè)英語課程在相應(yīng)的專業(yè)課之前開課,學(xué)員對相應(yīng)的專業(yè)語匯還不了解,導(dǎo)致教學(xué)難度加大。而ESP教學(xué)最終目的是培養(yǎng)學(xué)生良好的專業(yè)語言運用能力,教會學(xué)生用活專業(yè)英語,以便更好地運用英語進行實際工作。ESP教學(xué)是大學(xué)英語教學(xué)改革的大勢所趨,因此,克服ESP詞匯、語匯及語篇理解等方面所存在的缺陷,就使得專業(yè)英語語料庫的開發(fā)運用顯得尤為迫切。
1.語料庫在專業(yè)英語運用中的主要作用
語料庫最早運用于語言數(shù)據(jù)的頻率統(tǒng)計方面,如字頻、詞頻、詞類等的統(tǒng)計。目前已發(fā)展成為一個由大量在真實情況下使用的語言信息集成的、可供計算機檢索的、專門做研究使用的巨型資料庫。它不僅涉及詞匯、語言結(jié)構(gòu)、語篇結(jié)構(gòu)、話語行為、文學(xué)作品分析等各個層次,而且與語法、口語、寫作、翻譯等具體教學(xué)密切相關(guān)。語料庫以其容量大、語料真實、檢索快捷準(zhǔn)確等優(yōu)勢在現(xiàn)代語言學(xué)研究和語言教育中日益發(fā)揮著越來越重要的作用?;谡Z料庫的學(xué)習(xí)活動有利于培養(yǎng)語料庫的使用者發(fā)揮他們的主觀能動性進行探究型學(xué)習(xí)。使用者可以圍繞一個問題,對其所涉及的語料所呈現(xiàn)的語境共現(xiàn)進行觀察、思考、分析、歸納,從而獨立自主地完成對某一語言現(xiàn)象的探索和研究,有利于其多層次、多角度地分析問題,提高分析問題和解決問題的能力。學(xué)習(xí)者可以親自參與解決問題的全部過程, 使其在對問題的探究中找到問題的答案,充分表現(xiàn)出現(xiàn)代學(xué)習(xí)方式的體驗性,從而解決問題。因此,開發(fā)運用專業(yè)英語語料庫對專業(yè)英語教學(xué)與研究,培養(yǎng)專業(yè)人士語言認知能力和自主學(xué)習(xí)能力勢在必行,特別是對突破專業(yè)詞匯瓶頸、彌補專業(yè)知識匱乏及提高語言理解和應(yīng)用極其重要。
2.專業(yè)英語語料庫的開發(fā)應(yīng)用
D.Biber,S.Conrad,R.Reppen在Corpus Linguistics一書中指出語料庫的規(guī)模分為詞次(tokens)、庫文本數(shù)量(number of texts)、層間樣本數(shù)量 (number of samples)和庫樣本容量(sample size)四個層次,各層次間比例要合理,并且要對各層次的語料信息如專業(yè)領(lǐng)域、難度及來源等作出詳細標(biāo)注。因此,專業(yè)英語語料庫(ESPC)的開發(fā)運用,首先,要確定其語料庫建設(shè)目標(biāo)、標(biāo)本分布原則和采樣途徑;其次,要確定其規(guī)模、庫容,使其可以滿足該專業(yè)英語教學(xué)及語言運用與研究的需要;再次,要考慮語料的針對性、代表性、采樣的隨機性和各種語體比例的合理性及檢索軟件的使用性等。在語料搜集完成后,對于所涉及的語料文本進行編目,并設(shè)計該詞意義及詞性標(biāo)注程序進行機器自動分詞和詞性標(biāo)注;然后進行人工校對,形成附碼語料庫。
(1)語料采集。語料采集對于任何語料庫來說都是至關(guān)重要的。語料庫的建設(shè)要有針對性、代表性和一定的規(guī)模性。作為專業(yè)英語語料庫應(yīng)該包括標(biāo)注語料庫(annotated corpora)、詞匯語料庫、句法樹庫、語篇語料庫、口語語料庫、語音語料庫及語料庫相關(guān)軟件。為保證語料的真實性,根據(jù)Krashen(1981)的輸入假說, 在選擇最佳語言輸入時, 可理解性尤為重要。因此語料要符合“可理解輸入”或“i+1”原則(i指習(xí)得者的能力水平)。同時要考慮到專業(yè)英語語料庫的使用對象主要是從事專業(yè)英語教育的英語教師、學(xué)生以及該行業(yè)的工作人員。所以該語料庫要兼顧知識性、時效性、教育性;語料采集還應(yīng)針對不同層次的使用者突出它的平衡性,并且能夠充分體現(xiàn)專業(yè)語言的語域特點。
因此,語料的選擇要以專業(yè)文獻為主,如航海類專業(yè)英語語料庫的語料主要從專業(yè)英語教材、IMO國際航海英語示范教程、工具書及詞典、航海專業(yè)期刊或著作、與航海行業(yè)相關(guān)的國際公約、IMO組織的相關(guān)規(guī)定及相關(guān)的專業(yè)教材等資料中采集,同時兼顧專業(yè)基礎(chǔ)文獻。該語料庫的宗旨是向?qū)W員介紹相關(guān)語料在行業(yè)領(lǐng)域的具體運用,所以內(nèi)容要盡可能貼近專業(yè),覆蓋整個行業(yè)的所有具有代表性的詞匯、語句及語篇,并且確保語料能不斷更新擴展,反映時代變化,貼近生活,使之具有開放性和時效性的特點。
(2)高頻專業(yè)詞匯的提取及運用。將所收集的專業(yè)英語相關(guān)語料轉(zhuǎn)換成文本形式。如,首先使用最常用的WELC TOOLSV1.0語料庫分析軟件對其進行分析處理。將出現(xiàn)頻率較高的詞匯(如設(shè)定出現(xiàn)20次以上為有效次數(shù))組成生詞表,然后使用該軟件分析CLAWS賦碼的語料文件,使其能夠方便準(zhǔn)確地從語料文件中提取數(shù)十種統(tǒng)計數(shù)據(jù),并實現(xiàn)檢索和數(shù)據(jù)匯總功能,排除那些語料庫之間差異性極弱的功能詞,收集那些專業(yè)核心詞匯,使之對專業(yè)文章的語境理解具有極為重要的幫助作用。然后,由資深的專業(yè)人員或相關(guān)專家根據(jù)經(jīng)驗進行人工篩選、提取、合并,再按照研究目的對其進行附碼(tagging)或分割(parsing),進一步提取和翻譯語料庫內(nèi)的專業(yè)類詞匯及相關(guān)資料,注明其在專業(yè)英語中以及在通用英語中的含義和運用,使之不僅能保證文本信息提取的準(zhǔn)確性,也使語料庫的使用變得更加方便快捷。這樣才能幫助英語教師、學(xué)員以及從事具體行業(yè)的工作人員進行對比學(xué)習(xí),盡快掌握并理解該詞的運用,更有效地突破專業(yè)詞匯和專業(yè)知識匱乏的瓶頸,同時確保被篩選出來的詞匯和語句具有一定的典型性和專業(yè)代表性。軟件還提供數(shù)據(jù)導(dǎo)出和打印功能,為使用者保存數(shù)據(jù)和將分析數(shù)據(jù)與其他軟件相結(jié)合進行二次分析提供了極大方便。
如航海英語語料系統(tǒng)所生成的語匯必須既要符合語言學(xué)的基本要求,又要符合該課程教學(xué)大綱及國家海事局制定的《中華人民共和國海船船員適任考試、評估和發(fā)證規(guī)則》及STCW公約對船員對英語語言能力的要求,同時還必須符合各級各類職務(wù)船員英語運用的具體要求。因此,該語料庫應(yīng)根據(jù)行業(yè)對英語語言的要求和目標(biāo)并結(jié)合人工篩選的經(jīng)驗,將各語料中最重要的指標(biāo)根據(jù)需要可歸納為意義(meanings)、知識點編號(knowledge)、難度系數(shù)(difficulty)、區(qū)分度(distinction)、詞性(vocabulary)、詞源(etymology)、歧義對比(ambiguity)、語料使用頻率(frequency)等多個基本指標(biāo)。一張語料由m個指標(biāo)組成,每個語料存在多個屬性,那么該語料文本就構(gòu)成了一個m×x的矩陣。
(3)檢索軟件的開發(fā)和應(yīng)用。語料庫建設(shè)以計算機技術(shù)為基礎(chǔ),因此具有一定的計算機技術(shù)和相應(yīng)的檢索軟件才能對大量的航海專業(yè)語匯和文本信息進行分析處理。目前,檢索工具被大量開發(fā),出現(xiàn)了很多成功的共享軟件,如Wordsmith Tols v4,Concordance v3,Monooncord 和Wordcruncher等;還有很多免費軟件如Mireooncord,Tact 2.1(基于DOS平臺),Wconcord,Concapp,Mlet-concordancer,Word.pilot,Antconc,Pamconc等。
語料庫索引利用計算機技術(shù)和專用軟件,通過在語料庫電子文本中進行關(guān)鍵詞搜索,檢索以關(guān)鍵詞為中心,即以KWIC索引技術(shù)為核心功能,以該詞所處的行為為場景,按預(yù)定設(shè)計在屏幕上顯示出來。同時具有詞表的詞性、意義統(tǒng)計和搭配統(tǒng)計等功能,適合基于詞匯的(word-based analysis)分析研究。該類軟件可直接檢索生成語料,進行詞串、短語、語言學(xué)等屬性檢索,亦可進行詞頻統(tǒng)計,檢索方式靈活,檢索快速準(zhǔn)確,檢索結(jié)果可以多種方式排序。然后,使用工具軟件(如Acrobat)提取出PDF文件中的圖片,并將文字材料轉(zhuǎn)換為純文本或Word格式,再編程或使用文本處理工具去除文字材料中的雜碼。還可以對處理好的文本材料進行簡單的信息標(biāo)注,如內(nèi)容、分類、意義、日期、主題等。這樣就基本建成了一個語料庫。
可以借鑒相關(guān)語料庫的成功經(jīng)驗,如BNC,COBUILD,LOB,JDEST,CLEC,還有許多如Cambridge Learners’ Corpus,English Translation Corpus、HKUST Learner Corpus,SWECCL等, 自主開發(fā)研究適合航海專業(yè)英語的語料庫檢索軟件,如 Maritime ESP小助手等,以幫助語料庫的使用者盡快理解并掌握該語料的核心詞匯、語境、語言特點、語言風(fēng)格及同一詞匯在不同語境中的不同含義等。在設(shè)計Maritime ESP小助手等檢索軟件時,可以采用KWIC語料檢索或CLAWS 賦碼檢索。如以航海專業(yè)英語中的disengage一詞為例,首先輸入或點擊該詞,語料庫中就能顯示該詞、相關(guān)的短語意義以及例句及該詞在某些特定語境中的意義;同時在在下方附近位置顯示以該詞為中心的短語并以其所使用的頻次多少為序顯示,如disengaged channel (切斷通道),disengaged side(下風(fēng)舷),disengaged vapor(釋放汽),disengaging hooks(脫纜鉤),disengaging latch (分離鍵),disengaging shaft(分離軸)等,并且要充分利用語料庫標(biāo)注工具的作用,采用計算機自動處理和人工校對相結(jié)合,這樣,在語料庫的建立過程中既可以提高軟件工具的標(biāo)注精度,又可以節(jié)約資源。同時還可以設(shè)計一個用于鏈接的友好界面,便于專業(yè)術(shù)語及其語境搭配的瞬間查找。
通過語料庫檢索來確定該專業(yè)領(lǐng)域的常用詞匯、語匯并將統(tǒng)計所得的信息,包括專業(yè)語匯的重復(fù)、搭配、出現(xiàn)頻率、文章常用的特定句法與篇章結(jié)構(gòu)、文體及修辭風(fēng)格等告訴語料庫的使用者,以此提高他們的專業(yè)語言綜合運用能力。如,在編寫專業(yè)英語教材過程中,也可以利用先進的語料庫檢索手段對教材中可以根據(jù)大規(guī)模的ESP語料對專業(yè)詞匯根據(jù)上下文逐一進行KWIC語料檢索或CLAWS 賦碼檢索,對出現(xiàn)較多的專業(yè)詞匯進行詞頻統(tǒng)計(frequency counts)和定位索引(concordance)。這樣就能科學(xué)地判斷語篇的難度和題材以取舍語料,并在教材編寫中體現(xiàn)高頻語言現(xiàn)象優(yōu)先原則,克服以往教材編寫基本上根據(jù)編寫者的直覺和教學(xué)經(jīng)驗進行編寫,缺乏客觀的科學(xué)依據(jù)的缺陷。還可以利用其進行備課、講課以及根據(jù)語料庫中的語料提供的例句或語境編寫習(xí)題和測試題。語料庫不僅可以為試題的編寫提供依據(jù),而且可以對試題的難易程度作評估和調(diào)整。用語料庫來分析和評估試題客觀準(zhǔn)確,易于調(diào)整、修補,穩(wěn)定、可靠、安全和易于操作。如上海交通大學(xué)在楊惠中教授的主持下建成了JDEST(上海交大科技英語語料庫),JDEST文件夾由檔案學(xué)等41個子文件夾組成,每個子文件夾中有若干個TXT文件。通過該軟件來檢索JDEST中包含program一詞的所有索引行。具體操作步驟為:打開Tool菜單中Con—cord后選中待檢索的語料文件,然后輸入program關(guān)鍵詞開始檢索,出現(xiàn)對話界面,然后根據(jù)對話框進行操作,這便于學(xué)員查閱學(xué)習(xí)。它是國際上第一代語料庫,為我國大學(xué)英語教學(xué)大綱的制定和詞表統(tǒng)計作出了積極的貢獻。
(4)語料庫應(yīng)用效果的評估分析。對已建成的語料庫的應(yīng)用效果要進行跟蹤評估,分析其所存在的問題,并為修改完善該語料庫提供科學(xué)依據(jù)。對語料庫的評估主要針對以下幾個方面進行:一是通過檢索母語來選擇合適的表達或判斷學(xué)習(xí)者的理解,并且能激發(fā)學(xué)生批判性思維的學(xué)習(xí)活動。學(xué)生可以借助語料庫的大量語言實例,根據(jù)語境特征異同進行分類和歸納,逐步發(fā)現(xiàn)其語言特點。這種通過分析歸類自主學(xué)習(xí)的方法,可以激發(fā)學(xué)生的好奇心、批判精神和反思精神,符合現(xiàn)代教育提倡發(fā)展的方向。二是通過尋找語料庫存在的問題并進行分析、評估語料庫語匯的深度、廣度。讓學(xué)習(xí)者根據(jù)語料庫的評判參照標(biāo)準(zhǔn)進行語言失誤標(biāo)注,可以使學(xué)習(xí)者在自我標(biāo)注過程中增進語料意識,提高對語言失誤的分析。三是評估分析所使用的檢索工具,確保該檢索工具能使語料庫正常運行,做到有效提高學(xué)習(xí)者的使用效率。
隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)的發(fā)展和語料庫開發(fā)應(yīng)用方面的資源共享與橫向合作,語料庫的建設(shè)速度有了很大的提高。語料庫的研究和建設(shè)使可共享的語料資源、網(wǎng)絡(luò)語料資源和語料分析工具軟件越來越豐富。專業(yè)英語語料庫的開發(fā)應(yīng)用不僅標(biāo)志著ESP研究手段已獲得重大技術(shù)進步,而且標(biāo)志著ESP研究思想的可喜轉(zhuǎn)變。
存儲于計算機的充分、真實的語料并可利用計算機進行檢索、查詢、分析語料總體是最重要的語言研究資源?;趯I(yè)英語語料庫的分析方法是對傳統(tǒng)基于規(guī)則的語言分析方法的一個重要補充,并為專業(yè)英語研究提供大量真實、準(zhǔn)確、形象的素材。充分利用語料庫“大規(guī)模”和“真實”兩大特點,使其直接成為服務(wù)于語言文字的最理想的語言知識資源。在具體開發(fā)應(yīng)用的過程中要盡量使語言運用和專業(yè)能力有效融合。借鑒國內(nèi)外一些語料庫建設(shè)的經(jīng)驗,揚長避短,建設(shè)適合本行業(yè)的專業(yè)英語語料庫。總之, 充分開發(fā)與運用語料庫,使其在專業(yè)英語運用及研究中發(fā)揮日益強大的作用,同時也成為語料庫語言學(xué)研究的有益補充。
參考文獻:
[1] BIBER D,CONRAD S,REPPEN R.Corpus linguistics[M].Cambridge: Cambridge University Press,1998:26.
[2] HUSTON S.Corpora in applied linguistics[M].北京:世界圖書出版社,2006.
[3] Stephen D Krashen Second Language Acquisition and Second Language Learning Pergamom [M].Press Inc. 1981.
[4] 桂詩春,楊惠中.中國學(xué)習(xí)者英語語料庫[M].上海:上海外語教育出版社,2003.
[5] 何安平.語料庫語言學(xué)與英語教學(xué)[M].北京:北京外語教學(xué)與研究出版社,2007.
[6] 教育部高等教育司.大學(xué)英語教學(xué)要求[M].北京:北京外語教學(xué)與研究出版社,2007.
[7] 教育部語言文字應(yīng)用研究所計算語言學(xué)研究室.國家語委語料庫科研成果簡介[EB/OL].(2011-04-01).http://www.docin.com/p-35035164.html.
[8] 靳光瑾.基于語料庫的辭書編纂平臺的應(yīng)用[C]//對外漢語學(xué)習(xí)詞典學(xué)國際研討會論文集.香港:香港城市大學(xué)出版社,2005.
[9] 靳光瑾,肖航,富麗,等.現(xiàn)代漢語語料庫建設(shè)及深加工[J].語言文字應(yīng)用,2005(2):111-120.
[10] 李文中,濮建忠,衛(wèi)乃興.2003上海語料庫語言學(xué)國際會議述評[J].解放軍外國語學(xué)院學(xué)報,2004(1):56-59.
[11] 王建平,李新江.航海英語[M].大連:大連海事大學(xué)出版社,2001.
[12] 楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002:170.
[13] 張濟華,王蓓蕾,高欽.基于語料庫的大學(xué)基礎(chǔ)階段ESP教學(xué)探討[J].外語電化教學(xué),2009(4):38-42.