• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于獨(dú)有屬性特征的情態(tài)與語境互動(dòng)關(guān)系數(shù)據(jù)挖掘研究

      2019-11-11 01:08:06于建平付繼林白塔娜李少輝洪文學(xué)
      燕山大學(xué)學(xué)報(bào) 2019年5期
      關(guān)鍵詞:情態(tài)句法詞義

      于建平,付繼林,白塔娜,李少輝,洪文學(xué)

      (1.燕山大學(xué) 外國語學(xué)院,河北 秦皇島 066004;2.燕山大學(xué) 里仁學(xué)院,河北 秦皇島 066004;3.燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004)

      0 引言

      情態(tài)動(dòng)詞詞義具有很大不確定性,其具體含義在很大程度上受到其出現(xiàn)的語境影響[1],這給自然語言理解和處理以及機(jī)器翻譯帶來了很大的困難。因此,開展情態(tài)動(dòng)詞詞義與語境特征之間的互動(dòng)限制關(guān)系研究很重要。它對(duì)揭示情態(tài)動(dòng)詞詞義與語境特征之間的數(shù)據(jù)結(jié)構(gòu)關(guān)系和發(fā)現(xiàn)識(shí)別情態(tài)動(dòng)詞詞義的重要語境特征都具有重要的意義,為情態(tài)動(dòng)詞詞義消歧和自然語言處理研究提供重要理論和實(shí)踐依據(jù)。由于情態(tài)動(dòng)詞一直是語言學(xué)、哲學(xué)和自然語言處理研究的熱點(diǎn),引起很多學(xué)者的關(guān)注。傳統(tǒng)語言學(xué)領(lǐng)域?qū)η閼B(tài)意義研究主要集中在情態(tài)動(dòng)詞的語義分類和語法功能描述上[2-3]。近年來,學(xué)者們更關(guān)注情態(tài)動(dòng)詞句法和語義演變[4-5],語義和語用功能[6-7],語法和語義范疇[8],語義特征及主觀化[9]和情態(tài)語法化過程[10]等。在詞義與語境關(guān)系方面,黃廣芳和倪豪杰[11]研究了新聞報(bào)道語境對(duì)情態(tài)動(dòng)詞詞義的限制作用??店慬12]分析了語境對(duì)情態(tài)的作用,發(fā)現(xiàn)構(gòu)成語境的各因素都會(huì)影響情態(tài)動(dòng)詞詞義,話語意義受其所處語境制約,語境對(duì)于話語生成和理解都有限制作用。范文芳[13]研究了情態(tài)在不同語境中意義,指出情態(tài)動(dòng)詞意義取決于其所處語境。陳海霞[14]證實(shí)了語境與情態(tài)動(dòng)詞詞義的互動(dòng)限制作用。

      從以上研究可以看出,學(xué)者們從不同角度研究了情態(tài)意義以及語境對(duì)情態(tài)意義的約束作用。然而,以往研究主要是基于觀察例句表面句法特征的分析。而且,所考慮的語境因素只包括語篇內(nèi)部語境因素(語義特征和句法特征),未考慮語外特征(語用和話題特征)。由于所列舉例句的數(shù)量和句法特征有限,而且所考慮的語境因素也有限,導(dǎo)致研究結(jié)果具有局限性和不科學(xué)性。本課題組前期研究[15-19]發(fā)現(xiàn),對(duì)于情態(tài)動(dòng)詞這類語義復(fù)雜而且對(duì)語境高度敏感的詞類而言,僅考慮共現(xiàn)語義和句法特征有很大局限性,難以全面揭示和發(fā)現(xiàn)情態(tài)語義與語境之間的本質(zhì)互動(dòng)關(guān)系,所以,需要考慮多維度、更全面的語境特征。Turdakov[20]也強(qiáng)調(diào)了語義排歧中考慮不同語境特征的重要性。

      隨著情態(tài)語義研究的不斷深入,學(xué)者們更關(guān)注情態(tài)與語境的互動(dòng)關(guān)系和對(duì)情態(tài)語義有更大限制力的語境特征等。因此,本文采用獨(dú)有屬性特征提取方法開展英語情態(tài)動(dòng)詞詞義與多維度語境特征的互動(dòng)關(guān)系研究,揭示它們之間的互動(dòng)限制關(guān)系,旨在為情態(tài)語義學(xué)、自然語言處理和智能語義識(shí)別特征選擇研究提供理論和實(shí)踐依據(jù)。

      本文的創(chuàng)新點(diǎn)在于:1)融合數(shù)學(xué)、信息科學(xué)和語言學(xué)知識(shí),借助相應(yīng)的計(jì)算機(jī)軟件,研究情態(tài)動(dòng)詞詞義與語境特征的互動(dòng)關(guān)系,挖掘語言數(shù)據(jù)結(jié)構(gòu)中隱藏的知識(shí);2)采用基于形式概念分析的獨(dú)有屬性特征提取方法挖掘語義概念結(jié)構(gòu)數(shù)據(jù)之間的關(guān)系。由于該方法可以挖掘出比其他方法更簡(jiǎn)潔的詞義分類規(guī)則和獨(dú)有屬性特征,因此能更直接、更清晰地反映情態(tài)與語境的互動(dòng)關(guān)系;3)克服了語言學(xué)現(xiàn)有研究方法的不足,采用形式化語義分析方法和計(jì)算機(jī)技術(shù),分析情態(tài)動(dòng)詞詞義與語境特征的互動(dòng)限制關(guān)系,研究結(jié)果更科學(xué)、合理、有效。

      1 理論基礎(chǔ)和方法概述

      本文研究基于形式概念分析理論和基于形式背景的獨(dú)有屬性特征提取方法。形式概念分析[21]是應(yīng)用數(shù)學(xué)的一個(gè)分支。概念格是其核心數(shù)據(jù)結(jié)構(gòu)。概念格的每個(gè)節(jié)點(diǎn)被稱作一個(gè)形式概念,由外延和內(nèi)涵兩部分構(gòu)成。外延表示屬于這個(gè)概念的所有對(duì)象的集合;內(nèi)涵表示所有這些對(duì)象所共有的屬性的集合。反映對(duì)象和屬性之間關(guān)系的形式背景是生成概念格的基礎(chǔ)。形式背景也是知識(shí)發(fā)現(xiàn)和數(shù)據(jù)分析的一種有效數(shù)學(xué)工具,它已經(jīng)被成功運(yùn)用到知識(shí)發(fā)現(xiàn)、語義排歧和可視化等多個(gè)領(lǐng)域。

      1.1 關(guān)于形式背景和獨(dú)有屬性的理論描述

      本文研究基于以下關(guān)于形式背景(定義1[21])和一些獨(dú)有屬性特征(定義2~4[22-23])的理論描述:

      定義1.形式背景:一個(gè)三元組K=(O,A,I)稱為形式背景,其中,O={o1,o2,…,oj}為非空有限對(duì)象集合,A={a1,a2,…,ai}為非空有限屬性集合,I為笛卡爾積O×A上的二元關(guān)系,(o,a)∈I表示對(duì)象o擁有屬性a。

      定義2.簡(jiǎn)單獨(dú)有屬性:在形式背景K=(O,A,I)中,如果屬性ai∈A滿足|g(ai)|=1,則稱屬性特征ai為形式背景K的簡(jiǎn)單獨(dú)有屬性,式中,g(ai)為具有屬性ai的對(duì)象集合,|g(ai)|表示具有屬性ai的對(duì)象基數(shù)。

      定義3.決策形式背景:一個(gè)決策形式背景可表示成五元組K=(O,A,I,D,J),其中(O,A,I)是條件背景,(O,D,J)是決策背景,且條件屬性集A與決策屬性集D無交集。J為笛卡爾積O×D上的二元關(guān)系。

      定義4.類獨(dú)有屬性:在決策形式背景K=(O,A,I,D,J)中,設(shè)O1?O為一類對(duì)象的集合,a∈A為一個(gè)條件屬性,如果對(duì)于除O1之外的任何類對(duì)象集合Op,都有:g(a)?O1,g(a)∩Op=?,則稱屬性a為O1的類獨(dú)有屬性。

      定義5.類獨(dú)有復(fù)合屬性:在決策形式背景K=(O,A,I,D,J)中,設(shè)O1?O為一類對(duì)象的集合,A1?A為一個(gè)條件屬性子集,如果對(duì)于除O1以外的任何類對(duì)象集合Op,都有:g(A1)?O1,g(A1)∩Op=?,則稱屬性A1為O1的類獨(dú)有復(fù)合屬性。

      1.2 獨(dú)有屬性計(jì)算方法

      基于以上給出的形式背景和不同獨(dú)有屬性特征的定義,下面給出獨(dú)有屬性、類獨(dú)有屬性和類獨(dú)有復(fù)合屬性的計(jì)算方法和步驟:

      1)確定不同類別的決策屬性集合D1,D2,…,Dp(p≥2);

      2)初始化i=1;

      3)計(jì)算決策屬性的對(duì)象集合g(Di)=Oi;

      4)設(shè)對(duì)象集合Oi包含有n個(gè)對(duì)象,Ac為一類對(duì)象的條件屬性集合。對(duì)Oi計(jì)算條件屬性集合:

      P(Aci)={aci1,aci2,…,acik},k≥1為Aci的冪集,其中,acij為Aci的第j個(gè)子集(j=1,2,…,k);

      5)初始化t=1;

      6)計(jì)算acit∈P(Aci)的對(duì)象集合g(acik)=Ocik;

      7)如果Ocik?Oi,則進(jìn)入下一步,否則,t=t+1,返回到第6步;

      8)如果此時(shí)|acik|=1,則acik中的屬性為類獨(dú)有屬性;如果|acik|>1,則acik中的屬性為獨(dú)有復(fù)合屬性;

      9)如果t=k,則進(jìn)入下一步,否則,t=t+1,返回到第6步;

      10)如果i=p,則結(jié)束;否則,i=i+1,返回到第3步。

      該方法的流程圖見圖1。

      圖1 獨(dú)有屬性計(jì)算方法流程圖

      Fig.1 Flow chart of calculating exclusive attributes

      舉例:已知表1中的形式背景。按照以上步驟可以算出,決策屬性D1的對(duì)象集合g(D1)=O1={o1,o4,o8};D1類的類獨(dú)有復(fù)合屬性有:{a1,a2,a3,a4,a8};{a1,a2,a3,a5,a7,a8};{a1,a6,a8},沒有類獨(dú)有屬性;D2的對(duì)象集合g(D2)=O2={o6,o7},D2類的類獨(dú)有復(fù)合屬性有{a1,a2,a6,a7},沒有類獨(dú)有屬性;D3的對(duì)象集合g(D3)=O3={o2,o3,o5};D3類的類獨(dú)有復(fù)合屬性有{a1,a2,a3,a4,a7},類獨(dú)有屬性有{a9}。

      表1 一個(gè)決策形式背景

      Tab.1 A formal context for decision

      a1a2a3a4a5a6a7a8a9D1D2D3o1111100010100o2111100000001o3111100100001o4111010110100o5111010101001o6111010100010o7110001100010o8100001010100

      2 數(shù)據(jù)準(zhǔn)備

      本文研究所采用數(shù)據(jù)來源于一個(gè)基于150萬字的多體裁語料庫的公開數(shù)據(jù)集。語料來源見表2。

      表2 語料來源

      Tab.2 Sources of the data in the corpus

      體裁網(wǎng)址法律https://www.copyright.gov/文學(xué)小說http://www.eastoftheweb.com/新聞報(bào)道http://www.bbc.com/學(xué)術(shù)論文https://link.springer.com/科普讀物http://www.nature.com/科幻小說http://novel.tingroom.com/公司介紹http://www.petrobras.com/大學(xué)介紹http://www.upenn.edu/訪談http://transcripts.cnn.com/電影字幕http://subscene.com/subtitles

      以英語情態(tài)動(dòng)詞must為目標(biāo)詞,構(gòu)建must不同詞義對(duì)象與共現(xiàn)語境特征之間關(guān)系的形式背景?;诖诵问奖尘?,采用獨(dú)有屬性特征計(jì)算方法獲取must呈現(xiàn)不同詞義時(shí)的簡(jiǎn)單獨(dú)有屬性特征,類獨(dú)有屬性特征和類獨(dú)有復(fù)合屬性特征,以這些特征作為詞義分類規(guī)則,通過比較分析這些詞義分類規(guī)則,發(fā)現(xiàn)情態(tài)動(dòng)詞must詞義與不同語境特征的互動(dòng)關(guān)系。

      2.1 Must的詞義劃分

      英語語法學(xué)家們[1-4]通常把must劃分為3個(gè)主要詞義,見表3。本文研究將采用該劃分方法。

      表3 Must的詞義劃分及舉例

      Tab.3 Senses of must and examples

      must的詞義舉例must(obligation,責(zé)任、義務(wù)、命令)We must obey the laws.我們必須遵守法律。must(necessity,必要性) We must learn from him.我們應(yīng)該向他學(xué)習(xí)。must(inference,推測(cè))The light is on,he must be in the office.燈亮著,他一定在辦公室。

      2.2 Must的樣本例句抽取和語境特征提取

      基于表3中must的詞義劃分,在語料庫中隨機(jī)提取了150個(gè)樣本例句。其中,must(obligation)50個(gè),must(necessity)50個(gè),must(inference)50個(gè)?;趍ust 在語料庫中出現(xiàn)的語境信息以及語法學(xué)家、語用學(xué)家[2-3,6]對(duì)于must應(yīng)用語境的描述,提取了must的語境特征,如圖2所示。

      圖2 提取的語境特征

      Fig.2 Extracted contextual features

      在圖2的語境特征中,語義特征采用目標(biāo)詞must的點(diǎn)互信息,其計(jì)算公式為[24]

      (1)

      式中,w1為目標(biāo)詞,w2為w1的相鄰詞,P(w1,w2)為w1和w2共現(xiàn)概率。按照式(1)計(jì)算得出的must的點(diǎn)互信息值見表4。表4中,must1表示must(obligation,責(zé)任、義務(wù)、命令);must2表示must(necessity,必要性),must3表示must(inference,推測(cè));MIi表示第i個(gè)互信息(i=1,2,…,6);oj表示第j個(gè)對(duì)象(j=1,2,…,150);-1表示兩個(gè)詞未出現(xiàn)共現(xiàn)的情況。s表示主語,v表示謂語動(dòng)詞。

      表4 情態(tài)動(dòng)詞must的點(diǎn)互信息

      Tab.4 Point mutual information of must

      ojMI1MI2MI3MI4MI5MI6o12.412.96-1-1-1-1o22.851.36-11.53-12.03o32.461.91-1-1-1-1o40.543.350.63-11.14-1o51.372.640.58-10.94-1o60.540.730.991.040.69-1o71.581.961.24-1-1-1o81.220.73-11.04-1-1o90.912.44-1-1-1-1o101.372.060.58-10.94-1???????o1410.34-11.47-10.492.33o142-1-1-1-11.393.48o1430.81-10.55-11.252.49o144-1-1-1-13.782.93o145-0.551.430.99-10.692.89o1460.75-10.71-11.323.18o147-11.43-1-13.782.89o148-1-1-1-12.013.78o149-1-1-1-11.583.23o1500.53-10.59-10.311.67MI1—MI(s+must1);MI2—MI(must1+v);MI3—MI(s+must2);MI4—MI(must2+v);MI5—MI(s+must3);MI6—MI(must3+v)

      2.3 數(shù)據(jù)處理

      本文所采用的數(shù)據(jù)包括連續(xù)值數(shù)據(jù)和非連續(xù)值數(shù)據(jù),因此,需要對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理。數(shù)據(jù)處理流程見圖3。建立形式背景須采用二值邏輯值,而表4中的數(shù)據(jù)為連續(xù)值數(shù)據(jù),因此,需要對(duì)其進(jìn)行二值離散化處理。本文采用了散點(diǎn)圖的方法。MI1(s+must1)的散點(diǎn)圖如圖4所示。

      圖3 數(shù)據(jù)處理流程圖

      Fig.3 Flow chart of data processing

      圖4MI1(s+must1)的散點(diǎn)圖

      Fig.4 Scatter diagram ofMI1(s+must1)

      從圖4中可以看出,如果選擇MI=0作為區(qū)間分割點(diǎn),可以把must(obligation,責(zé)任/義務(wù)/命令)與must(necessity,必要性)和must(inference,推測(cè))的對(duì)象很好地區(qū)分開。另外,考慮到MIi≤0表明兩個(gè)詞語義不相關(guān),MIi>0表示兩個(gè)詞語義相關(guān)[24],而且兩個(gè)詞語義是否相關(guān)在語義分析中有著重要意義,因此,點(diǎn)互信息值劃分為MI≤0和MI>0兩個(gè)區(qū)間,每一個(gè)區(qū)間為一個(gè)屬性特征。如果一個(gè)MI值落在某個(gè)區(qū)間,就賦予其邏輯值1,否則為0。其他點(diǎn)互信息值均采用此方法進(jìn)行離散化處理。

      句法特征、語用特征和話題特征均為非連續(xù)值,以邏輯值表示。如果一個(gè)樣本例句具有圖2所列的某個(gè)特征,則該特征的邏輯值取1,否則取0。至此,數(shù)據(jù)處理完畢。

      3 形式背景構(gòu)建

      用于構(gòu)建形式背景的屬性特征符號(hào)系統(tǒng)見表5?;诒?,建立表達(dá)must的不同詞義對(duì)象和其屬性特征關(guān)系的形式背景,見表6。表6中,oj表示第j個(gè)對(duì)象,ai表示第i個(gè)屬性特征。

      表5 屬性特征符號(hào)

      Tab.5 Symbols for the features(attributes)

      符號(hào)語義特征符號(hào)句法、語用、話題特征a1MI1(s+must1)≤0a17主語有生命a2MI1(s+must1) >0a18主語無生命a3MI2(must1+v)≤0a19完成體a4MI2(must1+v) >0a20進(jìn)行體a5MI3(s+must2) ≤0a21謂語為施事動(dòng)詞a6MI3(s+must2) >0a22謂語為靜態(tài)動(dòng)詞a7MI4(must2+v) ≤0a23否定句a8MI4(must2+v) >0a24被動(dòng)語態(tài)a9MI5(s+must3) ≤0a25陳述a10MI5(s+must3) >0a26命令a11MI6(must3+v) ≤0a27說話者有權(quán)威a12MI6(must3+v) >0a28說話者參與話語a13主語為第一人稱a29法律/法規(guī)相關(guān)話題a14主語為第二人稱a30自然規(guī)律相關(guān)話題a15主語為第三人稱a31社會(huì)生活相關(guān)話題a16存在式主語a32日常生活相關(guān)話題

      4 基于獨(dú)有屬性特征的情態(tài)與語境互動(dòng)關(guān)系數(shù)據(jù)挖掘

      4.1 基于獨(dú)有屬性的must詞義分類規(guī)則提取

      在提取must的語義分類規(guī)則之前,需要對(duì)表6中的數(shù)據(jù)進(jìn)行五折交叉驗(yàn)證,以驗(yàn)證數(shù)據(jù)集的有效合理性。驗(yàn)證結(jié)果見表7。

      表6 Must的形式背景

      Tab.6 Formal context of must

      a1a2a3a4a5a6a7a8a9a10a11a12a13a14a15a16a17a18a19a20a21a22a23a24a25a26a27a28a29a30a31a32o101011010101000101000100110001000o201011001100100101000010010001000o301011010101000101000100010001000o401010110011000101000100110101000o501010110011001001000000101100001o601010101011010001000000010110010o701010110101000101000000010001000o801011001101000101000100010111000o901011010101000101000100010011000o1001011001101000100100100010001000?????????????????????????????????o14101100110010110001010010010010001o14210101010010100101011010010000001o14301100110010100100110000010000001o14410101010010100100110000110000001o14510010110010110000110010110010001o14601100110010100101010100110000001o14710011010010100101010010010000001o14810101010010100100110010010000001o14910101010010100101010000010000001o15001100110010100101000010010000001

      表7 數(shù)據(jù)集的五折交叉驗(yàn)證結(jié)果

      Tab.7Resultoffive-foldcrossvalidation

      實(shí)驗(yàn)組12345錯(cuò)誤數(shù)44320正確率/%86.6786.679093.33100

      表7中結(jié)果的平均正確率為91.33%,標(biāo)準(zhǔn)偏差為5.58%,因此,五折交叉驗(yàn)證結(jié)果為91.33%±5.58%,證明了這套數(shù)據(jù)的有效性和合理性。

      基于表6的形式背景和1.2中關(guān)于獨(dú)有屬性特征的計(jì)算方法,計(jì)算出must三個(gè)詞義的簡(jiǎn)單獨(dú)有屬性、類獨(dú)有屬性和類獨(dú)有復(fù)合屬性,作為must的詞義分類規(guī)則,見表8。每條規(guī)則后邊括號(hào)中的數(shù)值為該條規(guī)則所能識(shí)別的對(duì)象數(shù)。

      表8Must的詞義分類規(guī)則

      Tab.8Rulesforwordsenseclassificationofmust

      第一類must(責(zé)任/義務(wù)/命令)第二類must(必要性)第三類must(推測(cè))a26(10)a30(14)a16(1)a27(22)a3,a8(33)a19(31)a29(31)a1,a9(22)a20(7)a7,a11(30)a1,a11(27)a7,a12(41)a14,a31(6)a3,a11(33)a22,a32(29)a2,a4,a15,a31(1)a11,a25,a32(2)a1,a5(20)a12,a13,a21(1)a8,a12,a13(2)

      4.2 情態(tài)與語境互動(dòng)關(guān)系數(shù)據(jù)挖掘

      由于表8中是采用獨(dú)有屬性特征提取方法提取的獨(dú)有屬性特征作為詞義分類規(guī)則,因此,這些規(guī)則均為最簡(jiǎn)規(guī)則。表8中的詞義分類規(guī)則分別由簡(jiǎn)單獨(dú)有屬性特征、類獨(dú)有屬性特征和類獨(dú)有復(fù)合屬性特征構(gòu)成。通過比較分析這些規(guī)則中屬性特征的分布情況,可以發(fā)現(xiàn)情態(tài)動(dòng)詞must的不同詞義與不同語境特征的互動(dòng)關(guān)系。從表8中可以看出,在區(qū)分must的三類詞義的過程中,四類語境特征:語義特征、句法特征、語用特征和話題特征均發(fā)揮著重要的作用。通過比較分析三類詞義的分類規(guī)則發(fā)現(xiàn):

      1)在must的三類詞義分類規(guī)則中,出現(xiàn)了較多的獨(dú)有屬性特征。其中,句法語境特征a16為簡(jiǎn)單獨(dú)有屬性特征,即該特征只為第三類中一個(gè)對(duì)象所擁有;a26、a27、a29、a30、a19、a20均為類獨(dú)有屬性特征。語境特征中的語用特征a26(命令)、a27(說話者有權(quán)威)和話題特征a29(法律/法規(guī)相關(guān)話題)均為第一類詞義must(責(zé)任/義務(wù)/命令)的類獨(dú)有屬性特征,即這些特征對(duì)must(責(zé)任/義務(wù)/命令)有直接的限制作用,只要樣本例句中出現(xiàn)這些特征之一,該樣本中的must一定是must(責(zé)任/義務(wù)/命令)之義。同樣,話題特征a30(自然規(guī)律相關(guān)話題)為第二類詞義must(必要性)的類獨(dú)有屬性特征;句法特征a19(完成時(shí))和a20(進(jìn)行時(shí))為第三類詞義must(推測(cè))的類獨(dú)有屬性特征。這些類獨(dú)有屬性特征均為must的強(qiáng)分類特征,因?yàn)樗鼈兿拗苖ust的詞義,反過來,也反映出這些語境特征對(duì)must的不同詞義有很強(qiáng)的敏感性,它們只屬于并支持must的某一個(gè)詞義。

      2)在must的三個(gè)詞義中,第一類must(責(zé)任/義務(wù)/必要性)的語義最強(qiáng),其次是第二類must(必要性),第三類must(推測(cè))的語義最弱。從表8詞義分類規(guī)則中的語境特征分布可以看出,詞義強(qiáng)的第一類的分類規(guī)則中聚集著語力強(qiáng)的類獨(dú)有屬性特征,例如,a26(命令)、a27(說話者有權(quán)威)和話題特征(法律/法規(guī)相關(guān)話題),語義最弱的第三類分類規(guī)則中聚集著語力最弱的語境屬性特征,例如,a16(存在式主語),a19(完成體)和a20(進(jìn)行體)。這說明了語境特征語力的強(qiáng)弱與詞語義強(qiáng)弱的一致性。

      3)在類獨(dú)有復(fù)合屬性特征中,語義特征出現(xiàn)的最多,而且低值(奇數(shù))點(diǎn)互信息(MIi≤0)特征占多數(shù),由于在點(diǎn)互信息中,MIi≤0意味著兩個(gè)詞(must和相鄰詞)語義互不相關(guān)[26],說明在must的詞義分類中,must和相鄰詞語義互不相關(guān)特征發(fā)揮著更大的分類作用,點(diǎn)互信息MIi>0(兩詞語義相關(guān))特征主要起泛化作用。

      4)句法特征a16(存在式主語),a19(完成體)和a20(進(jìn)行體)均為第三類語義must(推測(cè))的獨(dú)有屬性特征,說明句法特征對(duì)第三類詞義分類的重要作用。

      5)在分類規(guī)則中,語義特征a6(MI3(s+must2)>0)和a10(MI5(s+must3)>0)、句法特征a14(第二人稱主語),a17(有生命主語)和a18(無生命主語)和語用特征a28(說話者參與)沒有出現(xiàn),說明這些特征為冗余特征。

      6)語義特征、句法特征、語用特征和話題特征這四種語境特征共同作用構(gòu)成情態(tài)動(dòng)詞must的詞義及其分類規(guī)則。語義特征主要出現(xiàn)在類獨(dú)有復(fù)合屬性構(gòu)成的規(guī)則中,而且發(fā)揮著重要的作用。而獨(dú)有屬性特征由句法特征、語用特征和話題特征構(gòu)成。就獨(dú)有屬性特征而言,每個(gè)獨(dú)有屬性特征所確定的對(duì)象數(shù)見表9。

      表9 不同獨(dú)有屬性分類對(duì)象數(shù)量

      Tab.9Numbersofobjectsclassifiedbydifferentexclusiveattributes

      特征符號(hào)特征含義分類類別分類對(duì)象數(shù)a16存在式主語三1a19完成體三31a20進(jìn)行體三7a26命令一10a27說話者有權(quán)威一22a29法律/法規(guī)相關(guān)話題一31a30自然規(guī)律相關(guān)話題二14

      表9中,a16,a19和a20為語內(nèi)特征中的句法特征,a26和a27為語外特征中的語用特征,a29和a30為語外特征中的話題特征。從表9可以看出,在所列的獨(dú)有屬性特征中,話題特征(a29(和a30)分類數(shù)量最對(duì)(共劃分出45個(gè)對(duì)象),其中,a29(法律/法規(guī)相關(guān)話題)分類對(duì)象數(shù)量最多(劃分出31個(gè)對(duì)象),即對(duì)分類貢獻(xiàn)最大。其次是句法特征(a16,a19和a20,共劃分出39個(gè)對(duì)象),其中,a19(完成體)分類對(duì)象數(shù)最多(31個(gè))。然后是語用特征(識(shí)別出32個(gè)對(duì)象),其中a27(說話者有權(quán)威)分類對(duì)象數(shù)最多(22個(gè))。

      在簡(jiǎn)單獨(dú)有屬性特征、類獨(dú)有屬性特征和類獨(dú)有復(fù)合屬性中,簡(jiǎn)單獨(dú)有屬性特征和類獨(dú)有屬性特征為強(qiáng)分類特征,因?yàn)樗鼈儗?duì)情態(tài)動(dòng)詞的詞義有直接的限制作用。從語內(nèi)特征(語義和句法特征)和語外特征(語用和話題特征)的比較上看,語外特征比語內(nèi)特征對(duì)情態(tài)動(dòng)詞must的詞義分類貢獻(xiàn)更大。

      5 結(jié)論

      本文基于形式概念分析理論和獨(dú)有屬性特征提取方法研究了英語情態(tài)動(dòng)詞must與語境特征的互動(dòng)關(guān)系。通過本文研究得出以下結(jié)論:

      1)本文提取的四類語境特征——語義特征、句法特征、語用特征和話題特征共同作用構(gòu)成情態(tài)動(dòng)詞must的詞義及其分類規(guī)則,它們均對(duì)情態(tài)動(dòng)詞must詞義劃分都發(fā)揮重要作用。

      2)語境特征中,語用特征和話題特征對(duì)must(責(zé)任/義務(wù)/命令)詞義有直接的限制作用;話題特征(自然規(guī)律相關(guān)話題)對(duì)must(必要性)詞義有直接的限制作用;句法特征:存在式主語、完成體和進(jìn)行體對(duì)must推測(cè)詞義有直接的限制作用。

      3)在語境特征中,語用和話題特征語義和句法特征具有更強(qiáng)的分類作用,對(duì)情態(tài)動(dòng)詞must詞義影響更直接。

      4)語義特征中,MI3(s+must2)≤0,MI3(s+must2)>0,MI5(s+must3)>0;句法特征中,“主語有生命,主語無生命,否定句,被動(dòng)語態(tài)”和語用特征中“說話者參與話語活動(dòng)”均為冗余特征。

      5)在語義特征中,低值互信息特征比高值互信息特征有更大的分類作用。

      6)四類語境特征對(duì)情態(tài)動(dòng)詞詞義分類貢獻(xiàn)依次為:話題特征>句法特征>語用特征>語義特征。

      以上研究結(jié)果充分揭示了情態(tài)動(dòng)詞must與語境特征的互動(dòng)限制關(guān)系,為情態(tài)語義學(xué)、自然語言處理和智能語義識(shí)別特征選擇研究提供了有價(jià)值的依據(jù)。

      猜你喜歡
      情態(tài)句法詞義
      句法與句意(外一篇)
      中華詩詞(2021年3期)2021-12-31 08:07:22
      述謂結(jié)構(gòu)與英語句法配置
      情態(tài)副詞“說不定”的情態(tài)化研究
      西夏語“頭項(xiàng)”詞義考
      西夏研究(2020年1期)2020-04-01 11:54:26
      表示“推測(cè)”的情態(tài)動(dòng)詞
      句法二題
      中華詩詞(2018年3期)2018-08-01 06:40:40
      詞義辨別小妙招——看圖辨詞
      詩詞聯(lián)句句法梳理
      中華詩詞(2018年11期)2018-03-26 06:41:32
      字意與詞義
      語言與翻譯(2014年3期)2014-07-12 10:31:59
      《詩經(jīng)》詞義考辨二則
      铜川市| 普宁市| 奇台县| 左权县| 彭阳县| 科技| 收藏| 泰兴市| 乌海市| 株洲市| 泗洪县| 南江县| 同德县| 平原县| 龙胜| 宁夏| 黑河市| 永福县| 荔浦县| 平遥县| 甘泉县| 北海市| 曲阜市| 得荣县| 秀山| 伊金霍洛旗| 平潭县| 瑞昌市| 开原市| 青阳县| 锦州市| 波密县| 会同县| 黑龙江省| 互助| 克什克腾旗| 潮州市| 金沙县| 柳江县| 信阳市| 嘉祥县|