• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      藏語言的定性分析與定量研究

      2015-03-18 11:01:36格桑多吉扎西加
      西藏大學學報(社會科學版) 2015年1期
      關鍵詞:藏語文藏語語料

      格桑多吉 扎西加

      (西藏大學藏文信息技術研究中心 西藏拉薩 850000)

      藏語言的定性分析與定量研究

      格桑多吉 扎西加

      (西藏大學藏文信息技術研究中心 西藏拉薩 850000)

      隨著信息技術和計量方法的迅速發(fā)展,社會科學研究領域定量研究和定性分析方法得到迅速推廣,獲得了公認的學術地位,“拿數(shù)據(jù)說話”已成為學術界的主流方法。尤其在語言研究領域計量研究法的運用是現(xiàn)代詞匯研究的一個趨勢。文章采用定量研究和定性分析的方法,對藏語基礎詞匯的總詞量、文本數(shù)、詞種數(shù)、詞頻、詞性、頻次、詞長等方面進行研究,觀察藏語基礎詞匯的同時,為藏語語言習得及教材編寫提供了依據(jù),也為字詞教學制定量化的教學目標提供了較為科學的思路。同時,這種計量方法的引入有助于開拓新的研究領域,有助于重新審視、考察、印證現(xiàn)有的詞匯理論和觀點。也就是說通過定量解決“有多少”的藏語基礎詞匯的數(shù)量問題,通過定性解決“是什么詞匯”、“有沒有這種詞匯”的性質(zhì)問題。

      藏語教學;藏語基礎詞匯;藏語語料;定量方法;定性方法

      一、詞匯計量與語言習得

      我國學者多年前就開始重視語言學的計量研究。著名教育學家陳鶴琴編寫的《語體文應用字匯》于1925年完成,1928年由商務印書館出版,應該算是第一部權威的漢字計量研究成果。馮志偉先生曾估測漢字熵值,并提出術語形成經(jīng)濟率和生詞增幅遞減率,同時和劉海濤一起提出了概率配價模型;周有光先生提出了漢字效用遞減率,并利用漢語語料庫的數(shù)據(jù)來計算依存距離;范鳳祥分析了英語文本隨機詞匯的覆蓋率等,他們都使用計量的方法,來探索語言的某些數(shù)學特性。這些研究都是對于語言本身內(nèi)在規(guī)律的探討。什么是語言“定量研究”?因研究側(cè)重不同出現(xiàn)了多個定義,如蘇新春認為:“計量研究,又叫定量研究,通過對語料進行數(shù)的反映,以達到認識語言規(guī)律和特點的目的?!盵1]趙家祥等認為:“在科學研究中,對事物進行數(shù)量分析,稱作定量研究。”[2]唐鈺明則認為:“所謂定量方法,就是將處于隨機狀態(tài)的某種語言現(xiàn)象給予一定的數(shù)量統(tǒng)計,然后通過頻率、頻度、頻度鏈等量化形式來揭示這類隨機現(xiàn)象背后所隱藏的規(guī)律性?!盵3]

      詞匯作為句子最基本的構(gòu)成單位在語言應用中有著舉足輕重的作用,詞匯、句子、文章之間是點、線、面的關系,如果沒有詞匯也就談不上用句子和文章來傳遞信息、表達情感和溝通交流,因此,“語言說到底是由詞語組合而成的,語音是詞語的具體讀音的綜合,語法是詞語的具體的用法的概括,離開了詞語也就沒有語言而言”[4]。任何語言學習都不可能拋開詞匯的學習,在藏語中詞匯同樣是最基本的表意單位?!罢Z言是語法化的詞匯,而不是詞匯化的語法,教師與學生應以詞匯作為教學中心構(gòu)建語言知識體系?;谕瑯拥恼Z言建構(gòu)機制,我們在母語基礎教學中,也應重視詞匯的重要意義”[5],藏區(qū)中小學的母語教學是一個以藏語文為基礎,融合了其他各種資源的綜合性體系,將字詞作為基礎教學內(nèi)容的主導思想始終貫穿其中。因此,通過對學生所掌握藏語詞匯量進行統(tǒng)計的方式來考察其實際語言能力是很有必要的。

      在語言教學中,“詞語教學貫穿于中小學語文教學階段的全過程,從概念的理解、語句的表達和段意的概括,到文章內(nèi)容的歸納,以及中心思想的領會,都離不開詞語這個要素?!盵6]在以母語為主導語言的義務教育階段,詞匯教學不僅要貫穿始終,而且是重中之重。按照藏語文學習的傳統(tǒng)習慣,詞匯的識記誦讀作為一項基本功自古以來就備受重視,這是后續(xù)進行篇章閱讀理解以及撰文寫作的前提和基礎。因此,詞匯教學是藏語教學中極為重要的組成部分,對于義務教育階段的學生而言更是如此。而詞匯教學中的層級問題即“什么階段應該教什么詞匯,什么階段需要教多少詞匯”,對于詞匯教學的科學發(fā)展以及構(gòu)建實用性強、識記率高的學生詞匯平臺有著非同尋常的理論指導意義。

      二、藏語基礎詞匯的統(tǒng)計

      語言學應當屬于實驗科學,計量研究是語言研究中的一種重要手段,是通過對語言的結(jié)構(gòu)、分布、使用等要素進行數(shù)量分析來揭示語言的狀態(tài)、性質(zhì)與特點的一種方法。它在實踐上具有鮮明的可操作性和直觀性,以及實驗過程的記錄性,與語言性質(zhì)上的通用性與生僻性、普遍性與具體性等密切地相呼應。因此,計量方法的運用也就愈來愈受到學界的重視和普遍使用。本文依據(jù)藏語詞匯學、計量語言學和對比語言學的相關理論,建立語文教材語料庫,對教材詞匯進行了全面的計量研究。由于《藏語文》數(shù)據(jù)庫內(nèi)容豐富,計量研究以專題的形式進行。進行專題研究時,對該專題范圍內(nèi)的語料要做到準確、封閉與窮盡。準確是指必須真實地反映《藏語文》的本來語言面貌,不能有訛誤?!胺忾]是將專題研究做到純化,不將無關的問題摻雜其中。窮盡是保證語料不出現(xiàn)缺損、遺漏,使計量研究反映出來的頻率、比例等數(shù)據(jù)真實可靠”[7]。根據(jù)研究內(nèi)容的情況,本文確定的工作方案具體見藏文詞匯計量分析的基本流程圖(圖1)。

      圖1 藏文詞匯計量分析的基本流程

      語料庫包括了小學《藏語文》教材12本,語料規(guī)模為76680萬詞次構(gòu)成,其中參與計量研究的課文數(shù)共為230篇。

      三、詞匯計量與文本分布

      課文體裁在一定程度上反映了整套教材的語言風格和面貌,體現(xiàn)了教材編寫者的教育理念。各類體裁的分布及用詞情況,可以反映出教材各體裁的詞量分布情況。本調(diào)查將藏語文教材的文章體裁分為記敘文、說明文、議論文、散文、詩歌、小說、童話、戲劇、格言、諺語、謎語、寫作、辭藻8類,分布如圖2所示。

      圖2顯示:說明文篇數(shù)最多,為54篇,占文章總數(shù)的23.5%;小說、兒歌、辭藻的篇數(shù)最少,各為1篇,占文章總數(shù)的0.4%。按文章體裁分類的課文數(shù)排序為:說明文>敘事文>故事>散文>教誨>格言>語法>寫作>謎語>民歌>成語>小說等。從各冊文章體裁分布表來看,各冊文章體裁的分布較為分散,體現(xiàn)了分散教學的理念。各冊均以說明文為主,小說和議論文各只出現(xiàn)了1篇,說明文主要分布在第5冊-10冊,詩歌和散文在各冊分布較為均勻。另外,隨著冊號的增加,課文數(shù)量整體呈現(xiàn)下降趨勢。

      圖2 文本分布圖

      四、藏語詞匯的定性分析

      語料的計量分析是定量研究中非常重要的一環(huán),但這只是它的外部表現(xiàn),不能以為語料庫量的統(tǒng)計就完成了所有的研究工作。語料的計量工作并不意味著自動獲得研究意義和顯示內(nèi)在的價值,它只是理論研究的一種手段。定量研究中的語料選取、語料標注、量化分析,每一個環(huán)節(jié)都只有依靠理論的指導,才會使定量數(shù)據(jù)獲得生命力。

      (一)詞類分布

      對從語料庫中提取出來的詞語及詞頻,應該如何處理才更為合理,更能真實地反映詞語的存在狀況,這也是研究者特別注意的地方。反映詞語通用度的最直觀的方法就是看它在調(diào)查對象語料中出現(xiàn)的次數(shù),通常稱之為“詞次”。這確實是反映詞語使用程度的一個重要標志。但如果調(diào)查對象數(shù)量龐大,類型眾多,且性質(zhì)相差較大時,這時考慮到詞語是出現(xiàn)于局部還是整體,也就成為一個重要的參考依據(jù)。把“詞次”的因素加上“分布”的因素,也就成為正確反映該詞分布情況的“通用度”了。

      根據(jù)藏語自動詞性標注的實際需要,依照“功能分類”思想,擬提出信息處理用藏語的分類方案,并擬定了相應的標記符號:一般名詞(n)、動名詞(nv)、及物動詞(vi)、不及物動詞(vt)、判斷動詞(vp)、助動詞(ux)、形容詞(a)、副詞(d)、否定副詞(df)、數(shù)詞(m)、量詞(q)、目的助詞(um)、時態(tài)助詞(us)、原因助詞(uy)、語氣助詞(yy)、祈愿助詞(uq)、終結(jié)助詞(uz)、狀態(tài)詞(z)、擬聲詞(e)、嘆詞(o)、成語(x)、格助詞(p)、連詞(c)等共15類[8],在此基礎上,對詞類分布進行了統(tǒng)計。(見表1)

      表1 藏語詞語分類及出現(xiàn)頻次

      圖3 詞類分布圖

      表1顯示:名詞數(shù)最多,出現(xiàn)9767次,占總詞類的45.8%,數(shù)量最少的是目的助詞,為43次,占總詞類的0.1%。按詞類的出現(xiàn)次數(shù)的高低可以排序為:名詞>動詞>形容詞>連詞>格助詞等,具體數(shù)據(jù)如圖3所示。

      (二)高頻詞分布

      根據(jù)語料庫語言學的理論和研究方法對語言的各個考查項進行了抽取、統(tǒng)計和分析。比如:對總詞量、文本數(shù)、詞種數(shù)、詞頻、詞性、頻次、詞長等分布特征方面全面、細致地計量分析,得出教材語料庫的詞匯信息表(見表2)。表2數(shù)據(jù)表明,10個高頻詞中9個是虛詞,因此,藏語字詞教學量化中虛詞的研究和描述極為重要,具體詳細數(shù)據(jù)如表2所示。

      通過以上數(shù)據(jù)范例,我們對小學藏語文教材有了一個全面而深入的了解,量化研究了教材的各個方面,獲得了大量的數(shù)據(jù)。從語料顯示小學全部課本的詞種數(shù)為9373詞,76680萬詞次,其中低頻率詞占總詞匯的87.23%,單音節(jié)和雙音節(jié)占87.5%,三音節(jié)和成語、習語等占22.5%。這些數(shù)據(jù)為之后藏語詞匯研究及藏語文教材的編寫提供理論依據(jù),另一方面也為字詞教學制定量化的教學目標提供較為科學的思路。

      五、總結(jié)與展望

      在中小學漢語文教學中,詞匯統(tǒng)計及分級工作已比較成熟,要求九年義務教育階段的中小學生“至6年級應累計認識常用漢字3000個,其中2500個左右會寫,至9年級累計認識常用漢字3500個,其中3000個左右會寫”。[9]作為基礎教育階段母語教學的主要載體,小學藏語文教材摘錄了大量體現(xiàn)藏民族悠久的歷史和民族傳統(tǒng)文化的文章,詞匯是教材的重要組成部分,但是藏語教學研究中缺乏常用詞和教材詞匯的計量分析,使得藏語文教材欠缺較為科學的組織方法。本文的研究不僅對中小學教材的編寫提供了科學的參照依據(jù),同時為藏語自然語言處理的研究奠定了一定的基礎。

      表2 高頻詞分布

      與此同時,我們也認識到藏語母語學習是一個將習得與學得有機結(jié)合的過程,而中小學生對書面語系統(tǒng)地掌握主要靠學得而非習得。在學得的過程中,藏語文課本成為了最主要的信息載體,課本中的字、詞、句又形成了一個相對獨立的知識體系,是中小學生詞匯學習的主要對象,無論是數(shù)量、類別還是難易程度,對詞匯層級工作而言都具有一定的代表性。因此,以中小學藏語文課本為基礎建立語料庫的工作蘊含著極大的研究價值,一直以來都備受關注。

      綜上所述,本文既對藏語詞匯本身進行了研究,如藏語詞匯的平均長度、基本詞匯的數(shù)量及其覆蓋率等,又從教學的角度出發(fā),統(tǒng)計了通用課本詞匯的頻率、頻次和分布度等數(shù)據(jù),并由此大致推測出我國藏區(qū)具備小學文化水平的學生對藏語文詞匯的掌握情況。上述數(shù)據(jù)和結(jié)論為評價和修訂現(xiàn)行通用教材提供了客觀依據(jù),若能將語料庫統(tǒng)計方法應用于今后的教材編寫中,教材質(zhì)量必將得到質(zhì)的飛躍,我國藏區(qū)中小學藏語文教學水平和質(zhì)量也將隨之大幅提升。

      [1]蘇新春.詞匯計量及實現(xiàn)[M].北京:商務印書館,2010:7.

      [2]趙家祥,聶錦芳,張立波.馬克思主義哲學教程[M].北京:北京大學出版社,2011:159.

      [3]唐鈺明.定量方法與古文字資料的詞匯語法研究[J].海南師范學院學報,1991(4).

      [4]胡明揚.對外漢語教學中詞匯教學的若干問題[J].語言文字應用,1997,21(1):12-17.

      [5][9]陸清.試論中小學語文課本詞匯計量研究[J].語文學刊,2004,45(6):23-25.

      [6]袁冉.對外漢語教材與漢語母語語文教材詞匯層級性對比研究[D].廈門:廈門大學,2008:2.

      [7]蘇新春.關于《現(xiàn)代漢語詞典》詞匯計量研究的思考[J].世界漢語教學,2001,58(4):39-47.

      [8]扎西加,索南尖措.基于藏語信息處理的詞類體系研究[J].西藏大學學報,2008,23(1):36-41.

      The Qualitative Analysis and Quantitative Study of Tibetan Language

      Gyesang Dorji Tashi Gyal

      (Tibetan Information Technology Research Center,Tibet University Lhasa,Tibet 850000)

      Along with the rapid development of information technology and metering methods,the method of qualitative analysis and quantitative study has been wildly promoted in the field of social science study.“Speaking with the data”is now becoming a new mainstream in the academic world.Particularly,it has become a new trend to apply the metering study method in the field of modern language study.This article employed the method of quantitative study and qualitative analysis to study the basic Tibetan words in following aspects:the total number of words,the number of texts,the number of word types,word frequencies,word types,and word length of the basic Tibetan words and so on.By observing the basic language units of Tibetan,the article built a foundation for compiling and producing Tibetan language study materials and curriculums,and it also provided scientific thoughts for formulating a quantification teaching objectives in the language teaching system.Meanwhile,applying this type of metering methods would definitely expand the on-going researches into new fields,and also would contribute to review,observe and testify the current word theories again from a very fresh angel.In another words,It means that we could use the quantitative analysis to solve the question of“how many basic words are there in Tibetan language?”and use the qualitative study to solve the question of“what type of word is it?”and“Is there this type of the word?”.

      Tibetan teaching;Tibetan basic vocabulary,Tibetan corpus;quantitative method;qualitative method

      10.16249/j.cnki.1005-5738.2015.01.018

      H214

      A

      :1005-5738(2015)01-131-05

      [責任編輯:周曉艷]

      2014-10-14

      2011年度國家自然科學基金項目“基于群體智能涌現(xiàn)的藏文網(wǎng)絡輿情分析及突發(fā)事件預警機制研究”(項目號:61165013),2011年度國家自然科學基金項目“藏語依存樹庫的構(gòu)建”(項目號:61163043),2012年度國家自然科學基金項目“基于Ontology的藏文語料庫檢索關鍵技術研究”(項目號:61262053)階段性成果。

      格桑多吉,男,藏族,西藏亞東人,西藏大學藏文信息技術研究中心副教授,主要研究方向為藏文信息處理。

      猜你喜歡
      藏語文藏語語料
      淺談藏語中的禮儀語
      客聯(lián)(2022年2期)2022-04-29 22:05:07
      漢藏語及其音樂
      中國音樂學(2020年2期)2020-12-14 03:07:24
      藏語拉達克話的幾個語音特征
      西藏研究(2017年3期)2017-09-05 09:44:58
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      藏語地理分布格局的形成原因
      西藏研究(2016年5期)2016-06-15 12:56:42
      華語電影作為真實語料在翻譯教學中的應用
      藏語文信息監(jiān)測關鍵技術初探
      西藏科技(2015年12期)2015-09-26 12:13:42
      通過電影和網(wǎng)絡來普及與傳承藏語文知識的平臺設計
      西藏科技(2015年4期)2015-09-26 12:13:01
      如何提高高中藏語文教學質(zhì)量
      西藏科技(2015年3期)2015-09-26 12:11:05
      《苗防備覽》中的湘西語料
      拉萨市| 阳春市| 桦川县| 罗城| 麻阳| 长沙市| 大埔县| 延川县| 湘阴县| 密山市| 黔西县| 河北区| 南昌县| 特克斯县| 奉新县| 德庆县| 太谷县| 吴江市| 华安县| 开平市| 柳州市| 揭西县| 余江县| 当涂县| 高雄市| 新兴县| 枣阳市| 聂荣县| 东阿县| 龙州县| 建宁县| 靖远县| 赫章县| 凯里市| 全南县| 德令哈市| 上虞市| 东兴市| 新蔡县| 崇文区| 吉木乃县|