毛懷周梁 鳴
(1.昌吉學(xué)院外語(yǔ)系 新疆 昌吉 831100;2.新疆農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 新疆 昌吉 831100)
新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)研究
毛懷周1梁 鳴2
(1.昌吉學(xué)院外語(yǔ)系 新疆 昌吉 831100;2.新疆農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 新疆 昌吉 831100)
新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的設(shè)計(jì)研究是建立在數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)理論的構(gòu)建上進(jìn)行的。我們首先通過(guò)對(duì)研究的基本框架、思路、工具和步驟的論證,闡明了建立新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)方案,并通過(guò)實(shí)驗(yàn)語(yǔ)音學(xué)語(yǔ)音錄音、語(yǔ)音分析軟件的操作程序和分析層面和Delphi7.0語(yǔ)音語(yǔ)料庫(kù)管理系統(tǒng),提出構(gòu)建新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的可行性,以便能更好的把新疆少數(shù)民族學(xué)生語(yǔ)音語(yǔ)料庫(kù)運(yùn)用到外語(yǔ)教學(xué)和研究中去。
新疆少數(shù)民族學(xué)生;英語(yǔ)語(yǔ)音語(yǔ)料庫(kù);設(shè)計(jì)
新疆屬于邊遠(yuǎn)少數(shù)民族地區(qū),主要有維、哈和蒙等少數(shù)民族,因此能掌握和基本掌握本族語(yǔ)、漢語(yǔ)和英語(yǔ)的少數(shù)民族學(xué)生較多。這為我們開(kāi)展新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)(Corpora)研究提供了良好的基礎(chǔ)。對(duì)少數(shù)民族地區(qū)英語(yǔ)語(yǔ)音的規(guī)律和存在的問(wèn)題進(jìn)行系統(tǒng)而深入的研究,不僅有助于改進(jìn)英語(yǔ)語(yǔ)音教學(xué)的方法,還有利于保護(hù)這些少數(shù)民族地區(qū)瀕危民族語(yǔ)言。
要對(duì)新疆少數(shù)民族英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)進(jìn)行研究,就必須涉及到語(yǔ)料庫(kù)的問(wèn)題。語(yǔ)料庫(kù)是依設(shè)定標(biāo)準(zhǔn),為某一具體語(yǔ)料庫(kù)(如語(yǔ)音語(yǔ)料庫(kù))而建立的語(yǔ)言資料集合群(Granger,1998;李文中, 1999)。[1]電子計(jì)算機(jī)貯存的豐富、真實(shí)的語(yǔ)言語(yǔ)料庫(kù),再加上它強(qiáng)有力的分析和語(yǔ)料庫(kù)研究軟件(如praat語(yǔ)音錄音和分析軟件、云龍國(guó)際音標(biāo)輸入法、漢語(yǔ)方言計(jì)算機(jī)處理系統(tǒng)和Word Smith3.0)相得益彰,使我們?cè)緹o(wú)法實(shí)現(xiàn)的研究變得唾手可得。我們主要依據(jù)電子計(jì)算機(jī)語(yǔ)料庫(kù)的原理技術(shù),討論并設(shè)計(jì)新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建設(shè)的具體設(shè)想,并依據(jù)數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)理論(DDL)(Tim Johns,1991;2009)[2]基礎(chǔ)模型,為新疆少數(shù)民族學(xué)生的英語(yǔ)學(xué)習(xí)提供基礎(chǔ)的保障,拓展教師教育科學(xué)和研究的新領(lǐng)域。
創(chuàng)建新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)能為少數(shù)民族學(xué)生的英語(yǔ)語(yǔ)音研究搭建科研平臺(tái),讓更多的研究者和學(xué)習(xí)者了解學(xué)習(xí)者英語(yǔ)語(yǔ)音的特點(diǎn),并使之與本族語(yǔ)者語(yǔ)音語(yǔ)料庫(kù)的對(duì)比研究和學(xué)習(xí)成為可能。借助實(shí)驗(yàn)語(yǔ)音學(xué)科研方法能夠?qū)W(xué)習(xí)者的英語(yǔ)語(yǔ)音特征和語(yǔ)音發(fā)展進(jìn)行全面而系統(tǒng)的對(duì)比分析,從中揭示新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音教學(xué)中的薄弱環(huán)節(jié)和問(wèn)題,有助于師生認(rèn)識(shí)和克服英語(yǔ)語(yǔ)音的學(xué)習(xí)難點(diǎn),對(duì)提高新疆乃至我國(guó)英語(yǔ)語(yǔ)音教學(xué)的質(zhì)量具有指導(dǎo)作用。所以,新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的建成為第二語(yǔ)言習(xí)得研究提供了有力的平臺(tái),為研究者提供了大規(guī)模英語(yǔ)語(yǔ)音研究的持續(xù)性發(fā)展的空間。
目前國(guó)際上最有代表性的英語(yǔ)本族語(yǔ)國(guó)家語(yǔ)料庫(kù)(BNC)存儲(chǔ)了近1億多詞匯的英語(yǔ)語(yǔ)料。最大的是Bank of English語(yǔ)料庫(kù)(5億詞匯),還有
在二十世紀(jì)七十年代建成的第一個(gè)計(jì)算機(jī)化的英語(yǔ)和蘭德英語(yǔ)口語(yǔ)語(yǔ)料庫(kù)約有43.5萬(wàn)詞匯。這些語(yǔ)料庫(kù)使研究者對(duì)語(yǔ)言形式的變化及特點(diǎn)有了前所未有的認(rèn)識(shí)。倫敦的蘭德語(yǔ)料庫(kù)在口語(yǔ)文本上進(jìn)行了語(yǔ)調(diào)單位、調(diào)核、(nucleus)重音和停頓等的韻律標(biāo)注。(Prosodic annotation)由于其嚴(yán)密的設(shè)計(jì)成為英語(yǔ)口語(yǔ)計(jì)算機(jī)語(yǔ)音語(yǔ)料庫(kù)的基礎(chǔ)標(biāo)準(zhǔn)。自從2004年起,該語(yǔ)料庫(kù)利用計(jì)算機(jī)標(biāo)注分析軟件對(duì)語(yǔ)音的聲音文件進(jìn)行文本的語(yǔ)音標(biāo)注工作取得了重大的突破。
同時(shí),國(guó)際外語(yǔ)學(xué)界意識(shí)到建立學(xué)習(xí)者語(yǔ)料庫(kù)對(duì)分析學(xué)習(xí)者中介語(yǔ)(Interlanguage)的語(yǔ)言特點(diǎn)和語(yǔ)誤現(xiàn)象的迫切性。于是就出現(xiàn)了20世紀(jì)80年代末建立的朗文學(xué)習(xí)者語(yǔ)料庫(kù)、劍橋?qū)W習(xí)者語(yǔ)料庫(kù)(1,500萬(wàn)詞)和國(guó)際公認(rèn)的二十世紀(jì)九十年代建設(shè)的國(guó)內(nèi)外英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)。但這些語(yǔ)料庫(kù)的語(yǔ)料基本都來(lái)自學(xué)習(xí)者的筆語(yǔ),這為我們研究新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的設(shè)計(jì)和建設(shè)提供了必要性。
在我國(guó),多數(shù)學(xué)習(xí)者口語(yǔ)語(yǔ)料庫(kù)目前還在設(shè)計(jì)和建設(shè)之中。新疆少數(shù)民族的語(yǔ)音語(yǔ)料庫(kù)主要有“維吾爾語(yǔ)綜合語(yǔ)音數(shù)據(jù)庫(kù)系統(tǒng)”(王昆侖,1998)和“新疆大學(xué)維吾爾語(yǔ)語(yǔ)音合成系統(tǒng)”(2004),[3]但都基于維吾爾族語(yǔ)言語(yǔ)音語(yǔ)料庫(kù)。國(guó)內(nèi)最典型的學(xué)習(xí)者語(yǔ)料庫(kù)主要有上海交大與廣外聯(lián)合開(kāi)發(fā)的以CET-4和CET-6考試語(yǔ)料為主要來(lái)源的CLEC和南京大學(xué)創(chuàng)建的英語(yǔ)專(zhuān)業(yè)學(xué)生TEM-4口試語(yǔ)料庫(kù)(SWECCL)。(王立非,孫曉坤,2005)[4]這些語(yǔ)料庫(kù)雖然主要以漢族學(xué)生為主,其作用促成了大量的有關(guān)研究成果的出現(xiàn),從而使人們對(duì)學(xué)習(xí)者英語(yǔ)語(yǔ)音的口語(yǔ)特征有了深刻的了解。自2001年以來(lái),雖然基于上述學(xué)習(xí)者語(yǔ)料庫(kù)關(guān)于學(xué)習(xí)者語(yǔ)料庫(kù)文本語(yǔ)言特征、詞匯、句法和語(yǔ)用等方面的研究成果有10篇之多,但基于語(yǔ)音語(yǔ)料的研究只有2例,主要的原因是噪音較大。(陳樺,李?lèi)?ài)軍,2008)[5]
面對(duì)計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)如此迅猛的今天,語(yǔ)料庫(kù)語(yǔ)言學(xué)已經(jīng)成為語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)研究不可或缺的領(lǐng)域。針對(duì)傳統(tǒng)英語(yǔ)語(yǔ)音教學(xué)中學(xué)生語(yǔ)料攝入?yún)T乏,利用網(wǎng)絡(luò)技術(shù)建立的英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)能最大限度地彌補(bǔ)傳統(tǒng)語(yǔ)音教學(xué)的不足,使語(yǔ)音教學(xué)多樣化、語(yǔ)境化和個(gè)性化,促進(jìn)學(xué)生的自主學(xué)習(xí)能力,從而提高學(xué)生的英語(yǔ)語(yǔ)音習(xí)得能力。新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建設(shè)中最重要的部分是英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的基礎(chǔ)建設(shè),如圖所示。
語(yǔ)音訓(xùn)練的基礎(chǔ)知識(shí)和內(nèi)容建設(shè)是保證語(yǔ)料庫(kù)質(zhì)量的關(guān)鍵,是語(yǔ)音語(yǔ)料庫(kù)建庫(kù)的基礎(chǔ)形式。根據(jù)英語(yǔ)語(yǔ)音教學(xué)大綱的目標(biāo)和要求,應(yīng)遵循以學(xué)習(xí)者練習(xí)為主體、從聽(tīng)辨音調(diào)能力著手,把聽(tīng)力、發(fā)音與口語(yǔ)表達(dá)三方面的訓(xùn)練密切地結(jié)合起來(lái)的原則。既要強(qiáng)調(diào)基本功的訓(xùn)練,又要注意活用練習(xí)。英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的基礎(chǔ)知識(shí)和內(nèi)容包括英語(yǔ)音素、詞及句重音、英語(yǔ)語(yǔ)流的節(jié)奏規(guī)律等應(yīng)用型聽(tīng)練。
我們擬借助新疆師范大學(xué)建立的“維吾爾語(yǔ)綜合語(yǔ)音語(yǔ)料庫(kù)”(王昆侖,1998)和新疆大學(xué)的“維吾爾語(yǔ)語(yǔ)音合成系統(tǒng)”,建立新疆少數(shù)民族學(xué)
生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)和管理系統(tǒng)(2004),[6]新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)首次在新疆地區(qū)分層次建立新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)系統(tǒng)。在全疆范圍內(nèi)建立南北疆少數(shù)民族語(yǔ)音語(yǔ)料庫(kù)、烏魯木齊地區(qū)少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)子系統(tǒng)和少數(shù)民族不同年級(jí)英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)系統(tǒng),為今后的持續(xù)性橫向研究做好前期準(zhǔn)備。
朗讀言語(yǔ)、流暢言語(yǔ)和自發(fā)式言語(yǔ)這三類(lèi)是目前國(guó)際上連續(xù)語(yǔ)音數(shù)據(jù)庫(kù)蘭德言語(yǔ)類(lèi)型的分類(lèi)。流暢言語(yǔ)和自發(fā)式言語(yǔ)的區(qū)別在于言語(yǔ)內(nèi)容是否有準(zhǔn)備,都包括了音段和韻律等語(yǔ)音學(xué)要解決的問(wèn)題。下面是我們建設(shè)新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的一般規(guī)范。對(duì)現(xiàn)有國(guó)內(nèi)外有代表性的口語(yǔ)語(yǔ)料庫(kù)進(jìn)行回顧之后,結(jié)合我國(guó)的特點(diǎn),再借助陳樺等人的設(shè)計(jì),提出如下建設(shè)新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的一般規(guī)范。
表1 制作語(yǔ)音語(yǔ)料庫(kù)的一般規(guī)范
總體而言,就是確定發(fā)音人、確定語(yǔ)料收集地點(diǎn)、確定發(fā)音素材、控制實(shí)地錄音條件、語(yǔ)音標(biāo)注和實(shí)施數(shù)據(jù)庫(kù)管理。語(yǔ)音語(yǔ)料庫(kù)是語(yǔ)音的物理性質(zhì)和文本描述參數(shù),在語(yǔ)言學(xué)上的意義仍需用戶去做進(jìn)一步的分析和研究。這種英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)既是一個(gè)描述性的非評(píng)價(jià)性的數(shù)據(jù)庫(kù),也是一個(gè)可進(jìn)行后續(xù)的補(bǔ)充和修正的開(kāi)放數(shù)據(jù)庫(kù)。(戴煒棟,張愛(ài)玲,1999)[8]
具體來(lái)說(shuō),(1)選擇發(fā)音人時(shí)兩個(gè)最重要的參考因素是本族語(yǔ)語(yǔ)言特點(diǎn)和少數(shù)民族的目的語(yǔ)第二外語(yǔ)和第三外語(yǔ)水平(漢語(yǔ)和英語(yǔ))。(王韞佳,李吉梅,2001)[9]新疆地區(qū)地域較大,考慮母語(yǔ)特點(diǎn)時(shí)需兼顧新疆各個(gè)地區(qū)方言的區(qū)域。因?yàn)樾陆贁?shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)旨在研究學(xué)生的英語(yǔ)語(yǔ)音學(xué)習(xí)的甄別性特點(diǎn),目的語(yǔ)水平應(yīng)以正規(guī)在校學(xué)習(xí)者為對(duì)象,如新疆高校民考民、民考漢、特培生、免費(fèi)師范生和雙語(yǔ)教育學(xué)生等為主。
(2)確定語(yǔ)料收集地點(diǎn)應(yīng)以新疆地理位置為主、以方言區(qū)為點(diǎn),創(chuàng)建有一定覆蓋面和代表性的新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)。地理區(qū)域以天山為界限可劃分為南疆、北疆和東疆等地。英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)兼顧新疆方言區(qū)的優(yōu)點(diǎn)在于,可以為后續(xù)進(jìn)行少數(shù)民族本族語(yǔ)方言在學(xué)習(xí)者英語(yǔ)語(yǔ)音中的遷移比對(duì)研究提供原始基礎(chǔ)材料。
(3)英語(yǔ)語(yǔ)音的發(fā)音材料類(lèi)型應(yīng)盡量多樣化,才能客觀地反映少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音特點(diǎn)并從中進(jìn)行系統(tǒng)的分析和概括。英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)中應(yīng)包含朗讀和自發(fā)式言語(yǔ)在內(nèi)的所有語(yǔ)料。朗讀語(yǔ)音語(yǔ)料可以為科研工作者提供少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音特征的基礎(chǔ)研究;自發(fā)式言語(yǔ)不僅可研究在自然狀態(tài)下學(xué)習(xí)者的英語(yǔ)語(yǔ)音特點(diǎn),也可以研究英語(yǔ)口語(yǔ)的副語(yǔ)言的現(xiàn)象。
(4)語(yǔ)料收集時(shí)要對(duì)實(shí)地錄音條件下的噪音進(jìn)行嚴(yán)格控制。麥克風(fēng)錄入信號(hào)的振幅一般適宜控制在46dB以下;在消聲室內(nèi)錄音時(shí),非語(yǔ)聲的振幅值調(diào)整到20dB采樣值以下,這些錄音值在語(yǔ)音學(xué)界較為普遍地采用。(祖漪清,1998)[10]。
(5)錄音結(jié)束后對(duì)聲音文件進(jìn)行基本標(biāo)注時(shí),要依據(jù)目前國(guó)際上通用標(biāo)注系統(tǒng)ToBI進(jìn)行標(biāo)注,標(biāo)注層級(jí)至少要涵蓋正則、邊界指數(shù)、語(yǔ)調(diào)、雜類(lèi)等層級(jí)。
(6)錄音結(jié)束后要對(duì)英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)實(shí)施數(shù)據(jù)庫(kù)管理。首先要對(duì)收集到被錄音人的所有背景信息和實(shí)際語(yǔ)音語(yǔ)料庫(kù)錄音的信息源加以賦值和標(biāo)識(shí),如說(shuō)話人的ID碼和錄音采樣率等;其次要對(duì)英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)進(jìn)行分類(lèi)建庫(kù)。如按照語(yǔ)料的任務(wù)類(lèi)型建立詞匯、句子、故事和對(duì)話朗讀等英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)子庫(kù);按學(xué)生生源地的地區(qū)方言類(lèi)型建立英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)方言子庫(kù);還有就是按照收集到的英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的時(shí)間年代建立英語(yǔ)語(yǔ)音縱向語(yǔ)料庫(kù)子庫(kù)等。(李?lèi)?ài)軍,2001)[11]
(一)語(yǔ)音標(biāo)注層
研究設(shè)計(jì)主要包括對(duì)新疆少數(shù)民族學(xué)生進(jìn)行英語(yǔ)語(yǔ)音標(biāo)注、語(yǔ)音音段標(biāo)注(第1、2層為語(yǔ)音庫(kù)的音段標(biāo)注層,對(duì)應(yīng)于ToBI中的正則層,第一層和第二層是描述學(xué)習(xí)者的實(shí)際發(fā)音和發(fā)音的標(biāo)準(zhǔn)層)、英語(yǔ)語(yǔ)音超音段標(biāo)注(標(biāo)注的第3層等同于ToBI系統(tǒng)的間斷指數(shù)層;第4層主要標(biāo)識(shí)句中的重讀音節(jié);第5、6兩層對(duì)應(yīng)于ToBI系統(tǒng)中的語(yǔ)調(diào)層;第6層為美式的ToBI層)、英語(yǔ)語(yǔ)音頻譜分析(利用Praat軟件制作語(yǔ)圖和頻譜圖,從窄帶語(yǔ)圖的片段分析對(duì)象中提取基頻的方法等)、英語(yǔ)語(yǔ)音基頻分析、英語(yǔ)語(yǔ)音強(qiáng)度分析和英語(yǔ)語(yǔ)音共振峰分析(基于LPC對(duì)象分析共振峰數(shù)據(jù)、語(yǔ)圖分析、聲學(xué)元音圖和共振峰圖等)。
(二)研究工具及語(yǔ)音處理
(1)Cool Edit Pro錄音軟件主要包括采樣、采樣率、精度、聲道、信噪比等幾個(gè)關(guān)鍵的執(zhí)行程序。錄音操作步驟主要有打開(kāi)軟件、按“文件”菜單下的“新建…”按鈕,會(huì)彈出下面對(duì)話框、連接并設(shè)置好您的麥克風(fēng)及錄音音量等、開(kāi)始錄音和保存錄音。
(2)Praat語(yǔ)音軟件進(jìn)行語(yǔ)音的聲學(xué)收集和分析。Praat([pra:t])(荷蘭,保羅·博爾斯馬和戴維·威寧克)的主要功能是對(duì)自然語(yǔ)言的語(yǔ)音信號(hào)進(jìn)行采集、分析和標(biāo)注等多種處理任務(wù),多用于實(shí)驗(yàn)語(yǔ)音學(xué)的研究和分析。對(duì)語(yǔ)音信號(hào)的分析和標(biāo)注是Praat的基本功能。根據(jù)錄入的語(yǔ)音生成的文字和語(yǔ)圖,能夠輸出精確的有關(guān)語(yǔ)音向量圖,供語(yǔ)言學(xué)聲學(xué)研究者使用。還廣泛用于語(yǔ)音或聲音合成、統(tǒng)計(jì)分析語(yǔ)言學(xué)的有關(guān)數(shù)據(jù)以及輔助語(yǔ)音教學(xué)測(cè)試等各個(gè)教育領(lǐng)域。
語(yǔ)音信號(hào)處理程序是Praat語(yǔ)音軟件的核心。根據(jù)語(yǔ)音信號(hào)處理程序和用戶的要求,在錄音或讀取音頻文件后,可以顯示三維語(yǔ)圖、頻譜切片、音高(基頻)曲線、共振峰曲線和音強(qiáng)曲線等多種語(yǔ)音語(yǔ)圖。以Praat錄音具體步驟生成波形圖為例:點(diǎn)擊Praatpicture界面,拖曳粉紅色框框決定你希望生成圖的大小。回編輯界面,按File-Draw visible sound把vertical range兩個(gè)空都調(diào)成5.5按OK。波形圖出來(lái)了,選左上角Filewrite to windows metafile再選擇保存位置,波形圖的文件就生成了如下圖。
圖2 PRAAT錄音分析工具波形圖
生成寬帶圖的方法是回初始界面sound record,點(diǎn)spectrum-to spectrogram,按ok。多了一個(gè)寬帶圖文件再選擇它,按draw-paint出現(xiàn)一個(gè)框frequency range。dynamic range一欄是決定生成圖深淺的,初始為50,越大越深,反之越淺。最后按OK寬帶圖就出現(xiàn)了,再次點(diǎn)選左上角file-write to windows metafile保存位置進(jìn)行保存。圖例(略)
新疆少數(shù)民族英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的建設(shè)和規(guī)劃主要數(shù)據(jù)來(lái)源和分析借助于上述兩個(gè)語(yǔ)音錄制和分析軟件,特別是Praat語(yǔ)音制作和分析軟件能夠處理許多新疆少數(shù)民族英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的語(yǔ)音基礎(chǔ)成分。
(3)Delphi7.0英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)管理系統(tǒng)
Delphi7.0語(yǔ)音語(yǔ)料庫(kù)管理系統(tǒng)是將語(yǔ)音的文字描述與語(yǔ)音數(shù)據(jù)有機(jī)地結(jié)合起來(lái)綜合管理語(yǔ)音數(shù)據(jù)庫(kù)。(熱依曼·吐?tīng)栠d,2011:234-237)[12]選擇了ADO(activeX Databases Objects)空間作為主要的訪問(wèn)控件。ADO就是指ActiveX數(shù)據(jù)對(duì)象,是Microsoft提出的應(yīng)用程序接口(APD)用以實(shí)現(xiàn)訪問(wèn)關(guān)系或非關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)。像Microsoft的其他系統(tǒng)接口一樣,ADO是面向?qū)ο蟮?,它是Microsoft全局?jǐn)?shù)據(jù)訪問(wèn)(UDA)的一部分。
Delphi7.0中的ADO控件有連接、命令和數(shù)據(jù)集等對(duì)象。利用ADO數(shù)據(jù)對(duì)象進(jìn)行數(shù)據(jù)存取的好處是可以簡(jiǎn)單地連接遠(yuǎn)程和本地的各種不同的數(shù)據(jù)庫(kù),同時(shí)利用統(tǒng)一的OLEDB的數(shù)據(jù)庫(kù)引擎,所以不用攜帶龐大的BDF數(shù)據(jù)庫(kù)引擎的支持。
(三)被試及任務(wù)
來(lái)自新疆幾所學(xué)校的各個(gè)年級(jí)受教育層次的少數(shù)民族學(xué)生應(yīng)邀朗讀若干組對(duì)話并錄音,另外還須完成2分鐘左右的自發(fā)式對(duì)話任務(wù)。學(xué)習(xí)者從20多個(gè)題目中隨機(jī)抽取一個(gè),準(zhǔn)備15分鐘,兩人一組展開(kāi)對(duì)話并且錄音。
朗讀語(yǔ)料內(nèi)容淺顯易懂,是錄音人十分熟悉的日常會(huì)話,難度符合少數(shù)民族學(xué)生的基礎(chǔ)英語(yǔ)
水平;對(duì)話包含各種基本句型和豐富的韻律等基本知識(shí)點(diǎn)。自發(fā)式言語(yǔ)主要對(duì)少數(shù)民族學(xué)生限時(shí)進(jìn)行語(yǔ)音表達(dá),以期提取他們最真實(shí)的英語(yǔ)語(yǔ)音數(shù)據(jù)。錄音前登記錄音人的姓名、性別、籍貫和信息代碼等。錄音在密閉的語(yǔ)音實(shí)驗(yàn)室進(jìn)行,采用錄音軟件Cool Edit Pro2.1進(jìn)行英語(yǔ)語(yǔ)音錄音,錄音采樣率為16kHz)(祖漪清,1998)[13]實(shí)例主要有簡(jiǎn)單陳述句、賓語(yǔ)從句、定語(yǔ)從句、選擇問(wèn)句和一般疑問(wèn)句等各個(gè)層面。
對(duì)錄制好的語(yǔ)音聲音文件,根據(jù)新疆少數(shù)民族學(xué)生的地域分布、受教育層次和任務(wù)類(lèi)型等進(jìn)行分類(lèi)。利用軟件Praat語(yǔ)音分析軟件對(duì)朗讀語(yǔ)料和自發(fā)式言語(yǔ)的語(yǔ)音數(shù)據(jù)進(jìn)行多層語(yǔ)音標(biāo)注。英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)朗讀部分的標(biāo)注結(jié)合英國(guó)(調(diào)冠等)和美國(guó)(ToBI)兩大標(biāo)注系統(tǒng)進(jìn)行標(biāo)注。
當(dāng)然,要設(shè)計(jì)好新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù),還需對(duì)少數(shù)民族學(xué)生的英語(yǔ)能力進(jìn)行潛能檢測(cè),還涉及到時(shí)間、場(chǎng)地和軟件操作人員的專(zhuān)業(yè)性知識(shí)的問(wèn)題,特別是語(yǔ)音語(yǔ)料庫(kù)錄音前的原材料的選取都直接制約著新疆少數(shù)名族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建設(shè)的質(zhì)量。
我們主要基于“數(shù)據(jù)驅(qū)動(dòng)”(DDL)理論嘗試構(gòu)建前期新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)的設(shè)計(jì)。特別是通過(guò)實(shí)驗(yàn)語(yǔ)音學(xué)語(yǔ)音軟件聲學(xué)的操作程序和分析層面和Delphi7.0少數(shù)民族英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)管理系統(tǒng),提出構(gòu)建新疆少數(shù)民族學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建庫(kù)的具體方法,但在實(shí)施中還有很多困難和困惑,在以后的研究中是一項(xiàng)具有挑戰(zhàn)性的研究。
[1]Chafe,W.The Importance of Corpus Linguistics to Understanding the Nature of Language[C].MJ.Svartvik.1992.Directions in Corpus Linguistics.Berlin/NewYork:Moutonde Gruyter.
[2]Granger,S.Learner Englishon Computer[M].London/NewYork:Longman,1998.
[3]Johansson,S.Computer Corpora in English Language Research[M].Bergen:Norwegian Computer Center for the Humanities,1982.
[4]Johns,Tim.“Microconcord:a language learner’sresearch tool”[J].System,1986/14(2).151-162.
[5]Johns,Tim.Data-driven learning:Perpetual challenge[A].Kettemann,B.&Marko(Eds.).Teaching and learning by doing corpus analysis[C].北京:北京圖書(shū)出版公司.2009:111.
[6]陳樺,李?lèi)?ài)軍.創(chuàng)建中國(guó)英語(yǔ)學(xué)習(xí)者英語(yǔ)語(yǔ)音庫(kù)的必要性及構(gòu)想[J].外語(yǔ)研究,2008,(5):50-54.
[7]陳樺,文秋芳,李?lèi)?ài)軍.語(yǔ)音研究的新平臺(tái):中國(guó)英語(yǔ)學(xué)習(xí)者語(yǔ)音數(shù)據(jù)庫(kù)[J].外語(yǔ)學(xué)刊,2010,(1):95-100.
[8]戴煒棟,張愛(ài)玲.語(yǔ)料庫(kù)、計(jì)算機(jī)、語(yǔ)言學(xué)[J].外國(guó)語(yǔ),1999,(6).
[9]李?lèi)?ài)軍.口語(yǔ)對(duì)話語(yǔ)音語(yǔ)料庫(kù)CADCC和其語(yǔ)音研究[C].第五屆全國(guó)語(yǔ)音學(xué)會(huì)論文集.2001.
[10]李凱.語(yǔ)音識(shí)別在新疆“雙語(yǔ)”教學(xué)軟件中的應(yīng)用[D].中國(guó)科學(xué)院新疆理化技術(shù)研究所,2009.
[11]李文中.語(yǔ)料庫(kù)、學(xué)習(xí)者語(yǔ)料庫(kù)與外語(yǔ)教學(xué)[J].外語(yǔ)界,1999,(1).
[12]熱依曼·吐?tīng)栠d,依皮提哈爾·買(mǎi)買(mǎi)提.維吾爾語(yǔ)語(yǔ)音語(yǔ)料庫(kù)管理軟件的研究與實(shí)現(xiàn)[J].新疆大學(xué)學(xué)報(bào),2011,(5): 243-247.
[13]王立非,孫曉坤.國(guó)內(nèi)外英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)的發(fā)展:現(xiàn)狀與方法[J].外語(yǔ)電化教學(xué),2005,(5).
[14]王昆侖.維吾爾語(yǔ)綜合語(yǔ)音數(shù)據(jù)庫(kù)系統(tǒng)[C].第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集.1998.
[15]祖漪清.實(shí)現(xiàn)語(yǔ)音數(shù)據(jù)庫(kù)科學(xué)性的重要環(huán)節(jié)[J].語(yǔ)言文字應(yīng)用,1998,(1).
G642.6
:A
:1671-6469(2013)05-0056-05
2013-05-28
昌吉學(xué)院2012年“新疆少數(shù)民族大學(xué)生英語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建設(shè)研究”科學(xué)研究基金階段性成果(2012YJYB010)。
毛懷周(1966-),男,甘肅天水市人,昌吉學(xué)院外語(yǔ)系,副教授,研究方向:英語(yǔ)課程與教學(xué)論,二語(yǔ)習(xí)得,英語(yǔ)寫(xiě)作測(cè)試。