馬曉霞
【摘要】小學(xué)語文教學(xué)語料庫收集了小說、詩詞、戲劇、散文等類別的文章和一些趣味性比較強的寓言、通話、兒歌、謎語等,提供了根據(jù)作者、標題、體裁、內(nèi)容等檢索,方便教師快速的查找所需要的文獻。為教師的教學(xué)和學(xué)生的學(xué)習(xí)都提供了方便。
【關(guān)鍵詞】語料庫 小學(xué)語文 教學(xué) 設(shè)計開發(fā)
【中圖分類號】G623.2 【文獻標識碼】A 【文章編號】2095-3089(2013)07-0045-02
小學(xué)語文教學(xué)語料庫主要是借鑒了前人提出的建設(shè)原則和檢索功能,使用ASP程序設(shè)計語言,SQL SEKVER2000數(shù)據(jù)庫服務(wù)器來采集、加工語料以及開發(fā)語料庫檢索功能等,并規(guī)定小學(xué)語文語料庫的建設(shè)目的和樣本大小等,來解決語文閱讀資源中的篇章檢索、詞語檢索和句子檢索所存在的問題。
一、概念
小學(xué)語文教學(xué)的教學(xué)語料庫是為了研究和應(yīng)用于小學(xué)教學(xué)而搜集的并且用電子數(shù)據(jù)的形式保存下來的語言材料,這些內(nèi)容主要是由書面語或者口語的樣本匯集起來的,它代表著小學(xué)語文中的語言。在這一語料庫有了足夠的規(guī)模時,能夠反映和記錄小學(xué)的語言在實際使用中的情況。這有利于相關(guān)人員對于語料庫的把握和研究,借助語料庫可以分析小學(xué)學(xué)習(xí)的語言系統(tǒng)的規(guī)律。它無論對教學(xué)還是對研究都是極其有利的。
二、建庫注意項
小學(xué)語文教學(xué)語料庫的建立是有特定的目的,就這個目的和一些專家的觀點,對語料庫的建立原則和方法做出以下總結(jié):
2.1首先就是要明確小學(xué)語文教學(xué)語料庫的建庫目的。它屬于專型語料庫,專門為小學(xué)語文的教學(xué)和研究服務(wù)的,這種語料庫主要有兩個特點,選擇名家大作和突出趣味性。它收錄的大都是寓言、童話、詩歌、謎語等,對一些政治、文學(xué)和經(jīng)濟方面的內(nèi)容牽涉較少。
2.2關(guān)于語料庫的容量方面的問題。由于我們所建立的語料庫是小學(xué)語文的教學(xué)語料庫,所以它主要采集的是整個原始文本作為樣本的形式比較合理,可以另外建立數(shù)據(jù)庫存儲由原始文本分解得來的句子樣本。這樣比采取把原始語料切分為片段的方式要好。
2.3建立小學(xué)語文教學(xué)語料庫的時候,要注意語料庫樣本的多樣性,因為小學(xué)語料庫屬于文科門類,文學(xué)類的樣本的多樣性主要是文學(xué)門類下的子門類的多樣性。
2.4做好小學(xué)語文教學(xué)語料庫的預(yù)料樣本處理,一定要根據(jù)小學(xué)語文語料庫的教學(xué)和研究的需求。建立比較適合的預(yù)料庫檢索方式和存儲方式。
2.4.1要把每個語料庫的樣本都當作一條數(shù)據(jù)記錄存放在數(shù)據(jù)表中,這樣有利于查找擴展閱讀所需要的篇章,方式是通過關(guān)鍵詞來進行全文的檢索。
2.4.2把需要處理的所有預(yù)料劃分為句子,再把每個句子當作數(shù)據(jù)記錄放在數(shù)據(jù)表中。這樣做的好處是利用字串、句子和詞語來進行檢索,方式是利用關(guān)鍵詞進行句子檢索。
三、開發(fā)和研究
小學(xué)語文教學(xué)語料庫主要是采用的ASP語言寫程序,采用SQL SE1KVE1K2000數(shù)據(jù)庫服務(wù)器做數(shù)據(jù)存儲服務(wù)以及采用IIS60 Web服務(wù)器發(fā)布語料庫檢索網(wǎng)站。這個過程主要有:語料采集、原料庫加工和開發(fā)語料庫的檢索功能等環(huán)節(jié)。
3.1語料一般都是來源于互聯(lián)網(wǎng)上的一些讀書網(wǎng)站,這是主要來源。
3.2在小學(xué)語文教學(xué)語料庫設(shè)計時肯定會碰到難點,在建設(shè)資料庫時需要收集的資料并不是匯集在一起的,需要設(shè)計者進行搜集,要把這些結(jié)構(gòu)多樣的資源轉(zhuǎn)化為結(jié)構(gòu)統(tǒng)一的語料庫并不是一件簡單的事,而且很多資源都是網(wǎng)頁形式的,而語料庫的全文卻是文本形式的,這樣就要求設(shè)計者進行處理,這也是一項比較困難繁雜的工作。
3.3對于小學(xué)語文教學(xué)語料庫所遇到問題的解決方法,大多數(shù)網(wǎng)站的資源格式基本上都是一樣的。這樣我們就可以利用這些相同點來進行解決,我們可以去發(fā)現(xiàn)各個網(wǎng)站對于文章的作者、標題等的標記的規(guī)則,將其轉(zhuǎn)化為我們需要的文本格式,運用到我們的語料庫中。但是在有些情況下某個網(wǎng)站的不同的頁面中對文章的同一部分所用的標記也不相同,這些地方我們的解決方法是尋找兩者之間的共性,尤其是在標記部分的共性,利用這些共性對這兩種標記方式進行統(tǒng)一的表達。
3.4注意結(jié)果的統(tǒng)計。小學(xué)的語料庫中共收集了一萬零六百六十五篇,這些結(jié)果的收集對教學(xué)和研究是非常有益的。小學(xué)語文教學(xué)語料庫的加工要注意句子層次的加工和篇章層次的加工,句子 層次的加工主要是將篇章分割成若干句子,同時確定每句話的長度, 而后將這些句子數(shù)據(jù)存入句子數(shù)據(jù)表中。篇章層次的加工在語料采集 過程已經(jīng)部分的完成,包括對標題、作者、體裁和字數(shù)等屬性。
四、開發(fā)重點
在小學(xué)語文教學(xué)語料庫的開發(fā)中最為重要的一點就是檢索功能,下面就這以重點進行詳細的分析。
4.1句子檢索
可進行關(guān)鍵詞居中(KWIC)檢索,關(guān)鍵詞為簡體中文的任意字符串,通過設(shè)定跨距(span)來限定檢索關(guān)鍵詞的左右語境范圍,跨距要一漢字為單位。返回的檢索結(jié)果以原始預(yù)料的句子為最大話語單位,作為檢索的上下文語境的最大范圍。如果需要查看更大范圍的上下文語境可以更進一步查看該句子所在的篇章,允許對檢測的結(jié)果進行復(fù)制和保存。句子檢索功能可實現(xiàn)基于連續(xù)字串、短語和復(fù)句句型的句子檢索,方便課件制作人員查找關(guān)于某個詞語多種應(yīng)用情景的句子。
4.2篇章檢索
篇章檢索的檢索項有:作者、標題、體裁、語體等,對作者、標題等檢索提高模糊匹配功能。對體裁和語體等則提供全文檢索,檢索全文內(nèi)容中包含的一項或多項內(nèi)容。
結(jié)語
小學(xué)語文教學(xué)語料庫的開發(fā)以篇章為單位,收集了適合小學(xué)語文教學(xué)的各類體裁的文獻,在保證知識性、思想性的基礎(chǔ)上,突出了一定的趣味性。收集了一些名家的散文、詩詞、小說、戲劇等。提供了基于作者、題目、體裁、出處等以及全文內(nèi)容檢索的功能方式,以方便教師快速查找教學(xué)所需的文獻和資料,為教學(xué)提供了方便。
參考文獻:
[1]何克航.兒童思維發(fā)展新論和語文教育的深化改革—對皮亞杰“兒童認知發(fā)展階段論”的質(zhì)疑[J].教育研究,2009,07(02):135—138.
[2]魏順平,何克抗.小學(xué)語文教學(xué)語料庫的設(shè)計與開發(fā)[B].中國化教育—學(xué)習(xí)資源,2009,06(245):148—151.