林敏 劉志國(guó)
摘 要 本文主要研究通過(guò)使用Python編寫爬蟲從中國(guó)軍網(wǎng)英文版爬取語(yǔ)料,建立軍事英語(yǔ)語(yǔ)料庫(kù),進(jìn)行例句批量檢索和保存,根據(jù)大學(xué)英語(yǔ)實(shí)際教學(xué)需要,將例句融入大學(xué)英語(yǔ)詞匯教學(xué)。檢索詞匯為大學(xué)英語(yǔ)詞匯表,在增加詞匯軍事例句的同時(shí),最大限度地減輕學(xué)員學(xué)習(xí)負(fù)擔(dān);通過(guò)引入軍事英語(yǔ)例句,實(shí)現(xiàn)單詞學(xué)習(xí)中的語(yǔ)境凸顯,激發(fā)學(xué)員學(xué)習(xí)興趣,提升學(xué)習(xí)效果;使大學(xué)英語(yǔ)教學(xué)更具時(shí)效性,有效提升學(xué)員的跨文化交流能力;為通用英語(yǔ)教學(xué)和軍事英語(yǔ)ESP課程的銜接打好堅(jiān)實(shí)的基礎(chǔ),充分體現(xiàn)了軍校大學(xué)英語(yǔ)教學(xué)的軍味。
關(guān)鍵詞 軍事英語(yǔ) 大學(xué)英語(yǔ) Python 自然語(yǔ)言處理 語(yǔ)料庫(kù)
中圖分類號(hào):G424 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A ? ?DOI:10.16400/j.cnki.kjdks.2020.07.066
Abstract This paper mainly studies how to use Python to compile crawlers to crawl the corpus from the English version of the Chinese military network, build the military English corpus, retrieve and save the sample sentences in batches, and integrate the example sentences into the college English vocabulary teaching according to the actual needs of college English teaching. The retrieval vocabulary is a college English vocabulary, which not only increases the vocabulary of military examples, but also reduces the learning burden of the students to the maximum extent. By introducing military examples, the context in the vocabulary learning can be highlighted, the learning interest of the students can be aroused, and the learning effect can be improved; the college English teaching can be more timely, and the intercultural communication ability of the students can be effectively improved; the general English teaching and the connection of military English ESP courses has laid a solid foundation and fully embodies the military flavor of Military college English teaching.
Keywords Military English; college English; Python natural language processing; corpus
新軍事變革和大學(xué)英語(yǔ)教學(xué)改革對(duì)軍校大學(xué)英語(yǔ)教學(xué)提出了新的要求。隨著國(guó)內(nèi)外軍事交流與合作的日益頻繁,軍校學(xué)員既要精通軍事專業(yè)技能,同時(shí)又要具備扎實(shí)的外語(yǔ)交流能力。目前,軍校學(xué)員一般在大學(xué)的前兩個(gè)學(xué)年進(jìn)行通用英語(yǔ)教學(xué),在高年級(jí)進(jìn)行ESP軍事英語(yǔ)教學(xué)。而如何做好通用英語(yǔ)和軍事英語(yǔ)教學(xué)的銜接,既滿足學(xué)員參加大學(xué)四、六級(jí)英語(yǔ)考試的需要,又能提升學(xué)員的軍事英語(yǔ)能力和英語(yǔ)綜合應(yīng)用能力就顯得尤為重要。本文從軍事英語(yǔ)例句如何融入大學(xué)英語(yǔ)詞匯教學(xué)出發(fā),力圖為軍校大學(xué)英語(yǔ)教學(xué)特色的凸顯,通用英語(yǔ)教學(xué)和軍事英語(yǔ)教學(xué)的有機(jī)銜接提供新的思路和操作方法。
1 “注意”假設(shè)理論在詞匯教學(xué)中的運(yùn)用
施密特(Schmidt)提出的“注意”假設(shè)理論為軍事英語(yǔ)例句在大學(xué)英語(yǔ)詞匯教學(xué)上的應(yīng)用提供了理論基礎(chǔ)?!白⒁狻奔僭O(shè)理論認(rèn)為:語(yǔ)言輸入并非都是等價(jià)的,真正被吸納的信息必須是被有效“注意”到并且經(jīng)過(guò)加工處理的信息。影響“注意效果”的因素包括頻率、凸顯、教學(xué)、學(xué)習(xí)者個(gè)體在注意和提取信息等方面的差異、中介與系統(tǒng)的現(xiàn)狀和任務(wù)要求。斯凱恩認(rèn)為:“施密特的理論強(qiáng)調(diào)了‘注意在語(yǔ)言習(xí)得中的重要性,只有學(xué)習(xí)者真正注意到的語(yǔ)言信息才會(huì)被理解和吸收?!盵1]在大學(xué)英語(yǔ)的詞匯教學(xué)中,相當(dāng)一部分詞匯既有日常用語(yǔ)的涵義,也有軍事英語(yǔ)的特定涵義。通過(guò)對(duì)比同一個(gè)詞匯在兩個(gè)語(yǔ)域中的例句,提供兩種迥然不同的語(yǔ)境,起到互相凸顯的效果,從而引起學(xué)員的注意和思考,進(jìn)一步激發(fā)學(xué)員學(xué)習(xí)興趣,最終使學(xué)員能夠內(nèi)化和應(yīng)用所學(xué)詞匯。
2 軍事英語(yǔ)語(yǔ)料庫(kù)建設(shè)和例句搜索
本文使用的軍事英語(yǔ)語(yǔ)料庫(kù)語(yǔ)料由自主編寫的爬蟲從網(wǎng)絡(luò)爬取。http://eng.chinamil.com.cn是中國(guó)軍網(wǎng)的英文版,內(nèi)容以新聞報(bào)道為主,包含各個(gè)軍種的新聞報(bào)道、外交部發(fā)言、以及國(guó)內(nèi)外最新的軍事新聞等。進(jìn)行文本處理所使用的第三方庫(kù)為NLTK(Natural Language Toolkit)。NLTK是由賓夕法尼亞大學(xué)的Steven Bird和Edward Loper基于Python開發(fā)的第三方庫(kù),主要應(yīng)用于科研和教學(xué),是自然語(yǔ)言處理較為常用的模塊。
2.1 Python爬蟲編寫和使用
自主編寫爬蟲從網(wǎng)站獲取需要的信息,在本文研究范圍內(nèi)主要獲取的是文本信息,如文章的標(biāo)題,發(fā)布時(shí)間和正文等。獲取文本信息后保存為文本文件,作者本次共爬取近期文章文本約20萬(wàn)字。使用Python自主編寫爬蟲可以定期爬取語(yǔ)料,保證了以新聞文本為主的語(yǔ)料庫(kù)具有較強(qiáng)的時(shí)效性。語(yǔ)料庫(kù)的內(nèi)容便于根據(jù)需要定制和拓展,可以進(jìn)一步獲取文章的圖片信息,甚至是聲音視頻等多媒體信息,與文本信息相結(jié)合,構(gòu)成多媒體語(yǔ)料庫(kù)。
2.2 單詞例句批量搜索和文本保存
與傳統(tǒng)的語(yǔ)料庫(kù)軟件Antconc和WordSmith等相比,用計(jì)算機(jī)語(yǔ)言自主編寫語(yǔ)料庫(kù)搜索引擎具有更大的靈活性,語(yǔ)料庫(kù)的使用可以根據(jù)教學(xué)內(nèi)容進(jìn)行量身定制。針對(duì)本文所研究的例句搜索,具體步驟為:(1)首先獲得本單元的單詞詞表,以文本文件格式保存;(2)通過(guò)自主編寫的程序讀取文件,在語(yǔ)料庫(kù)中自動(dòng)為每個(gè)單詞查找匹配到的例句,并合并為一個(gè)文本文件保存,便于進(jìn)一步根據(jù)教學(xué)需要進(jìn)行篩選、簡(jiǎn)化和翻譯。部分代碼如下:
自主編寫代碼進(jìn)行例句搜索的優(yōu)勢(shì)是:可以更方便地批量導(dǎo)入生詞表,對(duì)生詞表的單詞數(shù)量沒(méi)有限制;可以進(jìn)一步拓展例句篩選功能,如設(shè)置例句長(zhǎng)度、選擇高頻詞匯例句、設(shè)置例句數(shù)量、文本時(shí)間、制作雙語(yǔ)例句等;例句本文可以自動(dòng)保存為文本,便于進(jìn)一步語(yǔ)料處理。
3 在大學(xué)英語(yǔ)教學(xué)中使用軍事英語(yǔ)例句應(yīng)當(dāng)注意的問(wèn)題
軍校大學(xué)英語(yǔ)教學(xué)在補(bǔ)充軍事英語(yǔ)的同時(shí),仍應(yīng)堅(jiān)持以通用英語(yǔ)教學(xué)為主體,例句篩選應(yīng)當(dāng)體現(xiàn)因材施教原則。大學(xué)英語(yǔ)課程作為軍校軍事語(yǔ)言教育的基礎(chǔ)課程,主要學(xué)習(xí)的是通用英語(yǔ)課程,為學(xué)員學(xué)習(xí)高年級(jí)軍事英語(yǔ)課程打下堅(jiān)實(shí)基礎(chǔ)。因此,在補(bǔ)充軍事英語(yǔ)例句時(shí)應(yīng)當(dāng)注重適量和適度,應(yīng)以通用英語(yǔ)教學(xué)為主,不能喧賓奪主,影響到通用英語(yǔ)教學(xué)的完整性和原版英文課文賞析的美感。
在例句的篩選過(guò)程中,應(yīng)充分體現(xiàn)因材施教的原則,軍校學(xué)員在大學(xué)一年級(jí)剛開始大學(xué)英語(yǔ)學(xué)習(xí),往往語(yǔ)言基礎(chǔ)比較薄弱,而軍事英語(yǔ)新聞例句往往結(jié)構(gòu)比較復(fù)雜,詞匯難度較大。如果直接引入難度過(guò)大的例句,雖然保持了例句的原汁原味,但是過(guò)多的新概念和詞義可能會(huì)讓學(xué)生產(chǎn)生畏難情緒,起到適得其反的效果。因此,教員應(yīng)當(dāng)充分做好學(xué)情分析,在最大程度上保證文本信息完整性的同時(shí),對(duì)原版例句進(jìn)行大膽的簡(jiǎn)化和縮寫,用更容易理解的表達(dá),保留例句的核心含義和語(yǔ)境,減少修飾性成分,保留數(shù)量和難度適宜的專業(yè)術(shù)語(yǔ),并進(jìn)行對(duì)照翻譯和適當(dāng)處理,確保例句語(yǔ)境凸顯和有效信息輸入。隨著學(xué)員英語(yǔ)水平的提高,可以逐漸減少或無(wú)需對(duì)句子進(jìn)行簡(jiǎn)化和縮寫,直到能夠完全適應(yīng)實(shí)際使用的軍事英語(yǔ)表達(dá)。
應(yīng)當(dāng)注重翻譯語(yǔ)料的整理和保存。網(wǎng)絡(luò)獲取和自主翻譯的雙語(yǔ)對(duì)照例句以及術(shù)語(yǔ),可以進(jìn)一步制作成TRADOS翻譯記憶庫(kù)和術(shù)語(yǔ)庫(kù),利用機(jī)輔翻譯逐漸加快翻譯的速度和準(zhǔn)確性,進(jìn)一步減輕備課負(fù)擔(dān),提升備課效率。
4 結(jié)語(yǔ)
在信息技術(shù)蓬勃發(fā)展的今天,應(yīng)當(dāng)充分利用現(xiàn)代信息技術(shù),在保持外語(yǔ)教學(xué)材料經(jīng)典性的同時(shí),又能確保外語(yǔ)教學(xué)材料時(shí)效性,緊跟時(shí)代步伐,及時(shí)補(bǔ)充相關(guān)領(lǐng)域最新的發(fā)展趨勢(shì)和語(yǔ)言材料。自主編寫代碼搜索語(yǔ)料,使用自然語(yǔ)言處理工具可以更方便地對(duì)文本進(jìn)行批量處理和量化分析,極大地提升了文本分析效率。自然語(yǔ)言處理中復(fù)雜的語(yǔ)言模型在外語(yǔ)教學(xué)和翻譯上,還有廣闊的應(yīng)用和發(fā)展空間,值得進(jìn)一步的研究和探索。
參考文獻(xiàn)
[1] Skehan,P. A Cognitive Approach to Language Learning[M].Oxford University Press.1998:48-51.