• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合語義類信息的句法分析統(tǒng)計模型*

    2017-02-25 02:40:11袁里馳
    數(shù)據(jù)采集與處理 2017年1期
    關(guān)鍵詞:分析方法語料短語

    袁里馳

    (江西財經(jīng)大學(xué)信息管理學(xué)院,南昌,330013)

    融合語義類信息的句法分析統(tǒng)計模型*

    袁里馳

    (江西財經(jīng)大學(xué)信息管理學(xué)院,南昌,330013)

    稀疏數(shù)據(jù)嚴(yán)重影響句子結(jié)構(gòu)分析模型的結(jié)果, 而句法結(jié)構(gòu)是語義內(nèi)容和句法分析形式的結(jié)合。本文在語義結(jié)構(gòu)信息標(biāo)注的基礎(chǔ)上提出了一種基于語義搭配關(guān)系的詞聚類模型和算法,建立基于語義類的頭驅(qū)動句子結(jié)構(gòu)分析統(tǒng)計模型。該語言模型不但比較成功地解決了數(shù)據(jù)稀疏問題, 而且句子結(jié)構(gòu)分析系統(tǒng)性能也有了明顯的提高。句子結(jié)構(gòu)分析實驗結(jié)果表明,基于語義類的頭驅(qū)動的句子結(jié)構(gòu)分析統(tǒng)計模型,其召回率和精確率的值相應(yīng)為88.26%和88.73%,綜合指標(biāo)改進(jìn)了8.39%。

    句子結(jié)構(gòu)分析統(tǒng)計模型;語義角色標(biāo)注;詞的自動聚類;頭驅(qū)動

    引 言

    句子結(jié)構(gòu)分析是自然語言處理的一個最基本的問題,同時也是自然語言處理的關(guān)鍵技術(shù)之一。句子結(jié)構(gòu)分析的主要目標(biāo)是依據(jù)一定的句法規(guī)則分析出句子的短語組成關(guān)系,即句子包括的短語以及短語組成之間的語義、語法聯(lián)系。主要的句子結(jié)構(gòu)分析方法分為兩種途徑:基于統(tǒng)計的句子結(jié)構(gòu)分析方法[1-11]和基于規(guī)則的句子結(jié)構(gòu)分析方法。當(dāng)前,句子結(jié)構(gòu)分析方法主要有依存分析方法和短語組成分析方法。句子短語組成分析方法主要基于上下文無關(guān)概率文法(Probabilistic context free grammar,PCFG)。早期的句子結(jié)構(gòu)分析上下文無關(guān)模型從標(biāo)注句法樹庫中直接抽取語法規(guī)則,并且將相對出現(xiàn)次數(shù)計算為語法規(guī)則的概率[12]。這種句法分析模型實現(xiàn)容易,然而以前的句法分析研究證明這類句法分析模型的效果并不令人滿意,其重要原因是:上下文無關(guān)概率語法里的一些獨立假定在實際中可能并不正確。依存關(guān)系文法[13-15]容易標(biāo)注、結(jié)構(gòu)簡單, 漸漸得到重用。雖然目前漢語依存關(guān)系語法分析研究取得了一定的進(jìn)展,但是其準(zhǔn)確率和效率仍然不能滿足實際應(yīng)用的需要。Collins[11]等學(xué)者將詞匯的依存關(guān)系引入到語法中,提出了一種詞匯化的上下文無關(guān)概率句子結(jié)構(gòu)分析方法, 推動了句子結(jié)構(gòu)分析技術(shù)和方法的飛速發(fā)展。該方法的基本思想就是將短語中心詞和詞匯等語義信息融入上下文無關(guān)語法規(guī)則,此兩類語義信息的融入,大大提高了句子結(jié)構(gòu)分析方法的消歧效果,但該方法產(chǎn)生了比較嚴(yán)重的稀疏數(shù)據(jù)難題。句子結(jié)構(gòu)分析是語義分析和短語結(jié)構(gòu)分析的有機(jī)結(jié)合。句法分析不僅需做短語結(jié)構(gòu)分析,比如句子主要短語組成分析、句子型式分析及短語成分聯(lián)系分析等等,并且還必須做相關(guān)的語義聯(lián)系分析。對語義聯(lián)系分析越深刻和全面,將更能夠?qū)Χ陶Z結(jié)構(gòu)上的種種語言問題給予合理和科學(xué)的解答。詞匯句子結(jié)構(gòu)分析的當(dāng)前模型如依存關(guān)系語法、頭驅(qū)動的句子結(jié)構(gòu)分析方法[11]只引入詞語的語義依存信息, 但沒有考慮語義方面其他有關(guān)信息,比如詞語語義搭配、詞語的語義類等語義有關(guān)知識,然而一些語義有關(guān)的知識對語義關(guān)系、句子結(jié)構(gòu)的計算和分析非常有用。語義關(guān)系分析是自然語言理解的一個關(guān)鍵技術(shù)問題。作為當(dāng)前的自然語言研究熱點課題之一,語義角色的標(biāo)注[16-19](Semantic role labeling, SRL)是淺層語義關(guān)系分析的一種。語義角色標(biāo)注是在句子成分級別進(jìn)行淺層的語義關(guān)系分析,即對于給定的一個句子,對該句中的每個謂詞成分標(biāo)注出對應(yīng)的語義關(guān)系成分,并且確定其對應(yīng)的語義關(guān)系標(biāo)記,如施事成分、受事成分、工具成分或附加語成分等。 當(dāng)前的句子結(jié)構(gòu)分析方法還不能夠成功地描述出中文語言的基本特點[20-23],使得當(dāng)前中文語義關(guān)系、句子結(jié)構(gòu)的計算和分析的結(jié)果相比英語差距很明顯。針對傳統(tǒng)句法結(jié)構(gòu)分析統(tǒng)計方法存在的一些問題,本文建立了一種新穎的融合詞語語義類信息的句法結(jié)構(gòu)分析模型,提出了一種基于詞語語義搭配關(guān)系的詞聚類模型和相應(yīng)算法, 解決句法結(jié)構(gòu)分析統(tǒng)計模型在引入詞匯信息時帶來的稀疏數(shù)據(jù)問題。

    1 基于語義相似度的詞聚類模型和算法

    詞匯化句子結(jié)構(gòu)分析模型如頭驅(qū)動句子結(jié)構(gòu)分析方法, 為了利用語義知識,句子語法生成式中的任何一個非終結(jié)符號均引入詞性/核心詞等語義知識。然而語義知識的引進(jìn)產(chǎn)生了稀疏數(shù)據(jù)難題。建立基于語義類的詞類語言模型[24-28]替換基于詞的語言模型是緩解句子結(jié)構(gòu)分析方法稀疏數(shù)據(jù)難題的主要途徑之一。依據(jù)詞語的語法特點和詞語語義搭配之間的聯(lián)系對詞聚類極為重要。雖然語言學(xué)家可根據(jù)所掌握的語言信息對詞分類,然而結(jié)合語言信息,應(yīng)用統(tǒng)計方法自動分類詞的辦法應(yīng)該更為可行。

    1.1 詞的聚類模型

    假定w1,w2是含有語義搭配聯(lián)系Rel的二元詞組,本文用三元數(shù)組(w1,rel,w2)代表二元詞組及兩個詞之間的語義聯(lián)系。二元詞組 (w1,w2) 在語義聯(lián)系rel下的點互信息可定義為

    (1)

    其中

    這里的概率計算使用極大似然估計方法計算如下,即

    (2-a)

    (2-b)

    (2-c)

    (2-d)

    其中* 表示可能的詞或語義聯(lián)系,因而有

    (3)

    定義1 二元詞組w1,w2在語義聯(lián)系rel下的近似度由式(4,5)定義

    (4)

    (5)

    其中參數(shù)1≥αrel≥0,1≥βrel≥0使用最大似然估計計算,分別由式(6,7)確定

    (6)

    (7)

    定義2 二元詞組w1,w2之間的近似度定義為

    (8)

    基于詞近似度,詞類C1,C2之間的近似度定義為

    (9)

    其中Count(wi),Count(wj) 分別表示詞wi與wj在語料中出現(xiàn)的數(shù)量。

    1.2 詞的聚類算法

    詞的聚類算法如下:(1)計算出任意兩個詞的語義近似度;(2)開始設(shè)置:詞匯表里的任意一個詞均假定為一個詞類,總計N個詞類(N是詞的總數(shù)目);(3)把語義近似度最大的兩個詞類合成為一個詞類;(4)計算出其他詞類和新合成的詞類之間的語義近似度;(5)查驗算法是否滿足完結(jié)要求:詞類的最大語義近似度小于事先確定的某個數(shù)值,或者詞類合并個數(shù)滿足算法的結(jié)束條件,如是,算法完結(jié);否則,轉(zhuǎn)(3)。

    2 基于語義類的頭驅(qū)動句法分析方法

    頭驅(qū)動的句子結(jié)構(gòu)分析統(tǒng)計方法是典型的利用語義信息的句子結(jié)構(gòu)分析方法。為了利用語義知識,句子語法生成式中的任何一個非終結(jié)符均引入詞性/核心詞等語義知識。然而語義知識的引進(jìn)產(chǎn)生了稀疏數(shù)據(jù)難題。為了解決稀疏數(shù)據(jù)難題,該方法將語法規(guī)則的右邊分解為三個主要組成:一個頭成分、在右側(cè)的幾個短語組成和頭左側(cè)的幾個短語組成,其中后面兩個組成起修飾作用。即每個語法規(guī)則為

    P(ht,hw)-Lm(ltm,lwm)…L1(lt1,lw1)H(ht,hw)

    R1(rt1,rw1)…Rn(rtn,rwn)

    (10)

    式中:P為非終結(jié)符號;H為中心短語成分;L1為左邊短語修飾成分;R1為右邊短語修飾成分;hw,lw,rw都為短語成分的核心詞;ht,lt,rt相應(yīng)表示核心詞的詞性。假定由非終結(jié)符號P生成中心短語H,再分別以短語H為核心獨立地生成所有左右兩側(cè)的短語(起修飾作用)。因而語法規(guī)則(10)的概率計算為

    (11)

    式中:Lm+1和Rn+1分別表示左右兩側(cè)的相應(yīng)中止符,Δl(i-1)表示一種距離函數(shù),用于對組成等信息的不足進(jìn)行補(bǔ)償。這里的距離函數(shù)主要補(bǔ)償3類情形:(a)這個短語組成前面是否出現(xiàn)動詞短語;(b)這個短語組成前面是否有短語組成;(c) 這個短語組成前面是否有標(biāo)點符號。

    使用詞類語言模型(基于語義類)替換詞的語言模型, 可以緩解稀疏數(shù)據(jù)難題。令C(w)代表w基于語義搭配關(guān)系的詞聚類,則文法規(guī)則(10)就轉(zhuǎn)換成如下形式,即有

    P(ht,C(hw))-Lm(ltm,C(lwm))…L1(lt1,C(lw1))

    (12)

    而式(11)中的概率可近似為

    (13)

    3 實驗驗證

    3 .1 詞聚類實驗

    詞聚類實驗中采用的Baseline系統(tǒng)是一種較好的常規(guī)貪婪聚類方法[28]。本文采用《人民日報》中文標(biāo)注語料庫1月份語料和中文PropBank2.0、中文NomBank1.0等中文語料庫作為詞聚類實驗語料?!度嗣袢請蟆分形臉?biāo)注語料庫由富士通研究開發(fā)中心和北京大學(xué)計算語言學(xué)研究所共同加工《人民日報》1998年中文語料制作。語言數(shù)據(jù)聯(lián)盟公布了CTB中文樹庫,該樹庫是一個很好的中文句子結(jié)構(gòu)分析測試和訓(xùn)練語料庫。PropBank2.0語料庫是賓夕法尼亞大學(xué)在TreeBank5.1中文句法結(jié)構(gòu)分析語料庫的基礎(chǔ)上再標(biāo)注了動詞性謂詞及其語義角色的中文語料庫。而開發(fā)NomBank1.0中文語料庫是為了彌補(bǔ)PropBank中文語料庫只標(biāo)注了動詞性謂詞的局限,它標(biāo)注了TreeBank5.1中文樹庫中的名詞性謂詞和其語義角色?!度嗣袢請蟆分形?月份標(biāo)注語料庫共120萬個詞,現(xiàn)從其中選取約90萬個詞作為詞的貪婪聚類算法訓(xùn)練用語料,其余約30萬詞作為貪婪聚類算法和基于語義相似度的聚類算法的開放測試語料,而中文PropBank2.0、中文NomBank1.0等語料作為基于語義相似度聚類算法的訓(xùn)練語料。測試結(jié)果采用語言模型的困惑度作為評價指標(biāo),其定義為

    (14)

    式中:困惑度PPw為測試集概率分布幾何平均的倒數(shù);Nw為測試語料中總詞數(shù);C(wi-1)代表詞wi-1所在的詞類。一般來說,困惑度較小,語言模型更佳。

    表1 兩種詞聚類算法的聚類效果

    Tab.1 Clustering effects of two word clustering algorithms

    聚類算法困惑度貪婪聚類算法283.0基于語義相似度的聚類算法209.3

    表1列出了兩種聚類算法的聚類效果。從表1可以看出,基于語義相似度的詞聚類算法的聚類效果明顯好于常規(guī)貪婪聚類方法。

    3.2 句法分析實驗

    句法分析試驗數(shù)據(jù)取自中文PropBank2.0和中文 NomBank1.0。為了在訓(xùn)練語料、開發(fā)語料和測試語料中平衡各種語料來源,參考Xue[19]的試驗設(shè)置, 分別利用漢語PropBank2.0和NomBank1.0中的各40個數(shù)據(jù)文件共80個數(shù)據(jù)文件當(dāng)作句子結(jié)構(gòu)分析試驗的開發(fā)語料, 各648個數(shù)據(jù)文件共1296個數(shù)據(jù)文件當(dāng)作句子結(jié)構(gòu)分析試驗的訓(xùn)練語料。另利用144個數(shù)據(jù)文件當(dāng)作句子結(jié)構(gòu)分析試驗的測試語料。在句子結(jié)構(gòu)分析試驗中,統(tǒng)計方法的主要參數(shù)均為利用極大似然法和平滑方法,從訓(xùn)練語料中計算出來。

    采用句法分析召回率R、句法分析準(zhǔn)確率P、句法分析的交叉括號CB和綜合指標(biāo)F值等4個典型的指標(biāo)來評測句子結(jié)構(gòu)分析試驗的結(jié)果。評測指標(biāo)的計算如下:精確率(P)表示句子結(jié)構(gòu)分析結(jié)果中正確的短語結(jié)構(gòu)在全部分析的短語結(jié)構(gòu)中所占的比值;召回率(R)表示句子結(jié)構(gòu)分析結(jié)果中正確短語結(jié)構(gòu)在實際短語結(jié)構(gòu)中所占的比值;綜合指標(biāo):F=(P×R×2)/(P+R);交叉括號CB表示一個句子結(jié)構(gòu)分析樹與另外的句法樹短語結(jié)構(gòu)之間發(fā)生交界的平均短語結(jié)構(gòu)數(shù)。

    句子結(jié)構(gòu)分析試驗中取基于頭驅(qū)動句子結(jié)構(gòu)分析方法執(zhí)行的DBParser作為基本方法。Petrov[29]將自動發(fā)現(xiàn)隱藏的短語子塊計算方法應(yīng)用于漢語句子結(jié)構(gòu)分析樹庫,基于正確的漢語分詞,在CTB5.0漢語句子結(jié)構(gòu)分析樹庫上獲得了當(dāng)時已知的基于正確漢語分詞的漢語句子結(jié)構(gòu)分析單語言模型的最高性能。表2列出了基本方法、Petrov句子結(jié)構(gòu)分析方法和基于語義類的頭驅(qū)動句子結(jié)構(gòu)分析統(tǒng)計方法的測試數(shù)據(jù)。

    表2 句子結(jié)構(gòu)分析測試數(shù)據(jù)

    圖1 組合模型的綜合指標(biāo)F值 Fig.1 Comprehensive index F of combination model

    稀疏數(shù)據(jù)難題嚴(yán)重影響句法結(jié)構(gòu)分析模型的性能, 本文采用基于語義聚類的平滑方法,比較成功地解決了稀疏數(shù)據(jù)問題, 改進(jìn)語言模型的各項性能比Petrov句法分析模型、著名的頭驅(qū)動句法結(jié)構(gòu)分析模型有較明顯的提高。哈爾濱工業(yè)大學(xué)的曹海龍[1]等提出了一個兩級的中文句法分析方法,實驗語料采用哈爾濱工業(yè)大學(xué)樹庫,實驗結(jié)果為:召回率88.0%,準(zhǔn)確率87.5%。這是已知中文句法分析的比較好的分析結(jié)果。與曹海龍等的句法分析方法相比較, 模型2的性能也得到很大的提高。

    本文還將改良的句子結(jié)構(gòu)分析方法與頭驅(qū)動的句子結(jié)構(gòu)分析方法進(jìn)行了組合,令分析樹按照改良的句子結(jié)構(gòu)分析方法、頭驅(qū)動的句子結(jié)構(gòu)分析方法分別計算的概率為P1,P2,組合模型的概率P為

    (15)

    其中λ取值為0≤λ≤1,通過改變λ的值,可以調(diào)整方法1和頭驅(qū)動句法分析方法各自的貢獻(xiàn)度。本文在開發(fā)集上進(jìn)行實驗,其綜合指標(biāo)F值如圖1所示。當(dāng)λ約為0.6時, 組合句法結(jié)構(gòu)分析方法的綜合指標(biāo)F的值最好。

    4 結(jié)束語

    句子結(jié)構(gòu)分析是語義分析和短語結(jié)構(gòu)分析的有機(jī)結(jié)合。句法分析不僅需做短語結(jié)構(gòu)分析,比如句子主要短語組成分析、句子型式分析及短語成分聯(lián)系分析等,并且還必需做相關(guān)的語義聯(lián)系分析。對語義聯(lián)系分析越深刻和全面,將更能夠?qū)Χ陶Z結(jié)構(gòu)上的種種語言問題給予合理和科學(xué)的解答。在短語結(jié)構(gòu)分析模型中融入諸如語義知識,詞的語義搭配、詞的語義依存和詞的語義類等語義知識,將對語義和短語結(jié)構(gòu)的分析和計算非常有用。為了緩解句子結(jié)構(gòu)分析方法融入語義知識而引起的稀疏數(shù)據(jù)難題,本文在語義知識標(biāo)注基礎(chǔ)上提出了基于語義搭配關(guān)系的詞聚類模型和算法,不但比較成功地緩解了稀疏數(shù)據(jù)難題,而且明顯地提高了系統(tǒng)性能。

    [1] 曹海龍.基于詞匯化統(tǒng)計模型的漢語句法分析研究[D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2006: 64-83.

    Cao Hailong. Research on Chinese syntactic parsing based on lexicalized statistica model[D]. Harbin: Harbin University of Technology, 2006: 64-83.

    [2] Vilares J, Alonso M A, Vilares M. Extraction of complex index terms in non-English IR: A shallow parsing based approach[J]. Information Processing and Management, 2008, 44(4):1517-1537.

    [3] 劉水, 李生, 趙鐵軍,等. 頭驅(qū)動句法分析中的直接插值平滑算法[J]. 軟件學(xué)報, 2009, 20(11): 2915-2924.

    Liu Shui, Li Sheng, Zhao Tiejun, et al. Directly smooth interpolation algorithm in head-driven parsing[J]. Journal of Software, 2009, 20(11):2915-2924.

    [4] 代印唐,吳承榮,馬勝祥,等.層級分類概率句法分析[J].軟件學(xué)報, 2011,22(2): 245-257.

    Dai Yintang,Wu Chengrong, Ma Shengxiang, et al. Hierarchically classified probabilistic grammar parsing[J]. Journal of Software, 2011,22(2): 245-257.

    [5] Aviran S, Siegel P H, Wolf J K. Optimal parsing trees for run-length coding of biased data[J]. IEEE Transaction on Information Theory, 2008, 54(2):841-849.

    [6] Zhou Deyu, He Yulan. Discriminative training of the hidden vectors state model for semantic parsing[J]. IEEE Transaction on Knowledge and Data Engineering, 2009, 21(1): 66-77.

    [7] 吳偉成,周俊生,曲維光.基于統(tǒng)計學(xué)習(xí)模型的句法分析方法綜述[J]. 中文信息學(xué)報, 2013, 27(3):9-19.

    Wu Weicheng, Zhou Junsheng, Qu Weiguang. A survey of syntactic parsing based on statistical learning[J]. Journal of Chinese Information Processing, 2013, 27(3):9-19.

    [8] 孫昂,江銘虎,賀一帆,等. 基于句法分析和答案分類的中文問答系統(tǒng)[J]. 電子學(xué)報, 2008,36(5): 833-839.

    Sun Ang, Jiang Minghu, He Yifan, et al. Chinese question answering based on syntax analysis and answer classification[J]. Acta Electronica Sinica, 2008, 36(5): 833-839.

    [9] 陳毅恒, 秦兵, 宋凡, 等. 基于ontology抽取優(yōu)化初始選擇的檢索結(jié)果聚類[J]. 電子學(xué)報, 2008,36(12A):166-171.

    Chen Yiheng, Qin Bing, Song Fan, et al. Search result clustering based on centroid optimization by ontology extraction[J]. Acta Electronica Sinica, 2008,36(12A):166-171.

    [10]袁里馳. 融合語言知識的統(tǒng)計句法分析[J]. 中南大學(xué)學(xué)報: 自然科學(xué)版, 2012, 43(3): 986-991.

    Yuan Lichi. Statistical parsing with linguistic features[J]. Journal of Central South University: Natural Science, 2012, 43(3): 986-991.

    [11]Collins M. Head-driven statistical models for natural language parsing[J]. Computational Linguistics, 2003, 29(4): 589-637.

    [12]Jurafsky D,Martin J H. Speech and language processing[M]. New Jersey: Prentice Hall,2009:210-265.

    [13]Zhou M. A block-based dependency parser for unrestricted Chinese text[C] //Proceedings of the 2nd Chinese Language Processing Workshop. Hong Kong: Association for Computing Machinery, 2000: 78-84.

    [14]Gao J F, Suzuki H. Unsupervised learning of dependency structure for language modeling[C]//Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics. Sapporo, Japan: Association for Computing Machinery, 2003: 521-528.

    [15]Lai T B Y, Huang C N, Zhou M, et al. Span-based statistical dependency parsing of Chinese[C] //Proceedings of the 6th Natural Language Processing Pacific Rim Symposium (NLPRS2001). Tokyo, Japan: IEEE Computer Society, 2001: 677-684.

    [16]李軍輝. 中文句法語義分析及其聯(lián)合學(xué)習(xí)機(jī)制研究[D]. 蘇州:蘇州大學(xué), 2010: 64-103.

    Li Junhui. Research on joint syntactic and semantic parsing for Chinese[D]. Suzhou:Soochow University, 2010: 64-103.

    [17]李軍輝, 周國棟, 朱巧明, 等. 中文名詞性謂詞語義角色標(biāo)注[J]. 軟件學(xué)報, 2011, 22(8): 1725-1737.

    Li Junhui, Zhou Guodong, Zhu Qiaoming,et al.Semantic role labeling in Chinese language for nominal predicates[J]. Journal of Software, 2011, 22(8): 1725-1737.

    [18]吳方磊,李軍輝,朱巧明,等. 基于樹核函數(shù)的中文語義角色分類研究[J]. 中文信息學(xué)報, 2011, 25(3): 51-58.

    Wu Fanglei, Li Junhui, Zhu Qiaoming, et al. Tree kernel-based semantic role classification in Chinese language[J]. Journal of Chinese Information Processing,2011, 25(3): 51-58.

    [19]Xue Nianwen. Labeling Chinese predicates with semantic roles[J]. Computational Linguistics, 2008, 34(2): 225-255.

    [20]Bassiou N, Kotropoulos C. Long distance bigram models applied to word clustering[J]. Pattern Recognition, 2011, 44(1): 145-158.

    [21]宗慧, 劉金嶺. 基于短文本信息流的熱點話題檢測[J]. 數(shù)據(jù)采集與處理, 2015, 30(2): 464-468.

    Zong Hui, Liu Jinling. Hot topic detection based on short text information flow[J]. Journal of Data Acquisition and Processing, 2015, 30(2): 464-468.

    [22]宋文杰, 周俊生, 曲維光. 基于詞典信息和網(wǎng)絡(luò)百科的下位詞獲取[J]. 數(shù)據(jù)采集與處理, 2014, 29(5): 821-827.

    Song Wenjie, Zhou Junsheng, Qu Weiguang. Chinese hyponymy extraction based on dictionary and encyclopedia resources[J]. Journal of Data Acquisition and Processing, 2014, 29(5): 821-827.

    [23]Ido Dagan, Shaul Marcusb, Shaul Markovitchc. Context word similarity and estimation from sparse data[J]. Computer Speech and Language, 1995, 9(2): 123-152.

    [24]袁里馳. 基于相似度的詞聚類算法和可變長語言模型[J]. 小型微型計算機(jī)系統(tǒng), 2009, 30(5): 912-915.

    Yuan Lichi. Word clustering based on similarity and vari-gram language model[J]. Journal of Chinese Computer Systems, 2009, 30(5): 912-915.

    [25]Enhong Chen, Liu Shi, Dawei Hu. Probabilistic model for syntactic and semantic dependency parsing[C]// Proceedings of the 12th Conference on Computational Natural Language Learning. Manchester: Association for Computing Machinery, 2008:263-267.

    [26]Surdeanu M, Johansson R,Meyers A, et al. The CoNLL-2008 shared task on joint parsing of syntactic and semantic dependencies[C]// Proceedings of the 12th Conference on Computational Natural Language Learning. Manchester: Association for Computing Machinery,2008:159-177.

    [27]Duan Xiangyu, Zhao Jun,Xu Bo. Probabilistic models for action-based Chinese dependency parsing [C]// Proceedings of the 18th European Conference on Machine Learning. Warsaw, Poland: Springer, 2007: 559-566.

    [28]Brown P F, Pietra V J D ,deSouza P V, et al. Class-based n-gram models of natural language[J]. Computational Linguistics,1992(18):467-479.

    [29]Slav P,Klein D. Improved inference for unlexicalized parsing[C]// Proceedings of the Conference of the North American Chapter of the Association for Computational Linguistics. New York: Association for Computing Machinery, 2007:404-411.

    Statistical Syntactic Parsing Model Fusing Semantic Category Information

    Yuan Lichi

    (School of Information Technology, Jiangxi University of Finance and Economics, Nanchang,330013,China)

    Data sparseness severely affects the system performances of syntactic parsing, and syntactic structures are unities of syntactic forms and semantic contents. Based on the labeling of semantic information, a word clustering model and algorithm is proposed.And a head-driven statistical syntactic parsing model based on semantic category is established. The problem of data sparseness is successfully solved, and the system performances of syntactic parsing are obviously enhanced. Experiments are conducted for the head-driven statistical syntactic parsing model based on semantic category. It achieves 88.73% precision and 88.26% recall. F measure is improved 8.39% compared with the distinctive head-driven parsing model.

    statistical syntactic parsing model; semantic role labeling; word clustering; head-drive

    國家自然科學(xué)基金(61262035,61562034)資助項目; 江西省自然科學(xué)基金(20142BAB207028)資助項目; 江西省科技支撐計劃(20151BBE50082)資助項目。

    2015-05-16;

    2015-06-02

    TP391

    A

    袁里馳(1973-),男,博士,副教授,研究方向:自然語言處理,E-mail: yuanlichi@sohu.com。

    猜你喜歡
    分析方法語料短語
    基于EMD的MEMS陀螺儀隨機(jī)漂移分析方法
    一種角接觸球軸承靜特性分析方法
    中國設(shè)立PSSA的可行性及其分析方法
    中國航海(2019年2期)2019-07-24 08:26:40
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    華語電影作為真實語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實證研究比較:語料類型與收集方法
    核安全設(shè)備疲勞分析方法與步驟
    国产精品 欧美亚洲| 欧美人与性动交α欧美精品济南到| www国产在线视频色| 国产精品久久视频播放| 一级作爱视频免费观看| 欧美一级毛片孕妇| 欧美黑人欧美精品刺激| 老汉色av国产亚洲站长工具| videosex国产| 琪琪午夜伦伦电影理论片6080| 极品教师在线免费播放| 又大又爽又粗| 别揉我奶头~嗯~啊~动态视频| 国产成人精品在线电影| 亚洲av日韩精品久久久久久密| 免费少妇av软件| 一级片免费观看大全| 国产精品国产av在线观看| 他把我摸到了高潮在线观看| 国产主播在线观看一区二区| 日韩中文字幕欧美一区二区| 97人妻天天添夜夜摸| 97人妻天天添夜夜摸| 中文亚洲av片在线观看爽| 久久久久久大精品| 一级黄色大片毛片| 欧美精品啪啪一区二区三区| 国内久久婷婷六月综合欲色啪| 日韩视频一区二区在线观看| 韩国精品一区二区三区| netflix在线观看网站| 欧美中文综合在线视频| 无遮挡黄片免费观看| 欧美乱码精品一区二区三区| 曰老女人黄片| 波多野结衣高清无吗| 在线观看免费视频网站a站| 女性生殖器流出的白浆| 亚洲av熟女| 久久精品成人免费网站| 国产真人三级小视频在线观看| 精品日产1卡2卡| 久久久国产成人免费| 狠狠狠狠99中文字幕| 天堂动漫精品| 曰老女人黄片| 老司机午夜福利在线观看视频| 交换朋友夫妻互换小说| 99re在线观看精品视频| 99久久久亚洲精品蜜臀av| 欧美+亚洲+日韩+国产| 在线观看66精品国产| 亚洲五月色婷婷综合| 欧美亚洲日本最大视频资源| 亚洲全国av大片| 国产精品一区二区精品视频观看| 成人亚洲精品一区在线观看| 成人三级黄色视频| 国产男靠女视频免费网站| 国产野战对白在线观看| 欧美日韩亚洲高清精品| 免费久久久久久久精品成人欧美视频| 久久性视频一级片| 国产免费现黄频在线看| 男女之事视频高清在线观看| 久9热在线精品视频| 亚洲aⅴ乱码一区二区在线播放 | 国产又爽黄色视频| 最好的美女福利视频网| 欧美黑人精品巨大| 亚洲精品一二三| 1024香蕉在线观看| 中文字幕人妻丝袜制服| 麻豆av在线久日| 人成视频在线观看免费观看| av超薄肉色丝袜交足视频| 日韩人妻精品一区2区三区| 国产区一区二久久| svipshipincom国产片| 国产精品电影一区二区三区| 在线观看舔阴道视频| 亚洲一区中文字幕在线| 国产成人一区二区三区免费视频网站| 亚洲国产精品999在线| 涩涩av久久男人的天堂| 好男人电影高清在线观看| 久久精品aⅴ一区二区三区四区| 中文字幕人妻丝袜一区二区| 天堂√8在线中文| 久久久久久久久久久久大奶| 亚洲五月婷婷丁香| 日韩一卡2卡3卡4卡2021年| 国产97色在线日韩免费| 精品欧美一区二区三区在线| 国产成人av激情在线播放| 久久青草综合色| www国产在线视频色| 黄色毛片三级朝国网站| 免费在线观看影片大全网站| 国产免费av片在线观看野外av| 亚洲九九香蕉| 视频区图区小说| 一级毛片女人18水好多| 亚洲欧美日韩另类电影网站| 成人三级黄色视频| 99精国产麻豆久久婷婷| 香蕉国产在线看| 校园春色视频在线观看| 脱女人内裤的视频| 国产乱人伦免费视频| 新久久久久国产一级毛片| 天天影视国产精品| 黄片小视频在线播放| 国产亚洲欧美在线一区二区| 亚洲一区二区三区欧美精品| 精品日产1卡2卡| 99久久99久久久精品蜜桃| 久久香蕉精品热| 国产乱人伦免费视频| 亚洲成人精品中文字幕电影 | 99精国产麻豆久久婷婷| 又大又爽又粗| 99热国产这里只有精品6| 欧美成人免费av一区二区三区| 啦啦啦在线免费观看视频4| 老司机深夜福利视频在线观看| 亚洲精品一卡2卡三卡4卡5卡| 女人被躁到高潮嗷嗷叫费观| 国产xxxxx性猛交| 色综合站精品国产| 99riav亚洲国产免费| 三级毛片av免费| 正在播放国产对白刺激| 日韩免费高清中文字幕av| 女同久久另类99精品国产91| 新久久久久国产一级毛片| 色综合站精品国产| a级毛片在线看网站| 午夜老司机福利片| 国产aⅴ精品一区二区三区波| 国产精品野战在线观看 | 精品免费久久久久久久清纯| 亚洲一卡2卡3卡4卡5卡精品中文| 日本撒尿小便嘘嘘汇集6| 精品国产一区二区久久| 色综合欧美亚洲国产小说| 黄色怎么调成土黄色| 精品卡一卡二卡四卡免费| 在线国产一区二区在线| 在线国产一区二区在线| 曰老女人黄片| 丰满饥渴人妻一区二区三| 久久国产精品影院| 亚洲va日本ⅴa欧美va伊人久久| 怎么达到女性高潮| 午夜免费鲁丝| 精品久久久久久久久久免费视频 | 91麻豆av在线| 两人在一起打扑克的视频| 欧美中文日本在线观看视频| 淫妇啪啪啪对白视频| 亚洲午夜理论影院| 高清欧美精品videossex| 亚洲av五月六月丁香网| 亚洲欧美激情在线| 国产欧美日韩一区二区三区在线| 亚洲片人在线观看| 国产免费av片在线观看野外av| 深夜精品福利| 国产精品二区激情视频| 俄罗斯特黄特色一大片| 国产精品久久视频播放| 精品国产乱码久久久久久男人| 99riav亚洲国产免费| 首页视频小说图片口味搜索| 国产伦一二天堂av在线观看| 久久人人97超碰香蕉20202| 亚洲熟妇中文字幕五十中出 | 欧美 亚洲 国产 日韩一| 一二三四在线观看免费中文在| 一区福利在线观看| 交换朋友夫妻互换小说| 大码成人一级视频| netflix在线观看网站| 午夜精品国产一区二区电影| a级片在线免费高清观看视频| 女性生殖器流出的白浆| 国产精品成人在线| 99久久国产精品久久久| 亚洲精品久久午夜乱码| 国产成+人综合+亚洲专区| 国产男靠女视频免费网站| 亚洲精品国产精品久久久不卡| 亚洲人成电影免费在线| 黄色毛片三级朝国网站| 国产高清视频在线播放一区| 亚洲av美国av| 18禁美女被吸乳视频| 免费看十八禁软件| 国产成人av教育| x7x7x7水蜜桃| 高潮久久久久久久久久久不卡| 欧美成人午夜精品| 久久久久久人人人人人| 久久精品aⅴ一区二区三区四区| 精品福利永久在线观看| 欧美日韩亚洲国产一区二区在线观看| 精品无人区乱码1区二区| 久久精品国产99精品国产亚洲性色 | 国产一区在线观看成人免费| ponron亚洲| 日日爽夜夜爽网站| 日韩一卡2卡3卡4卡2021年| 男女高潮啪啪啪动态图| 超碰成人久久| 自线自在国产av| 99国产精品免费福利视频| 高清黄色对白视频在线免费看| 久久久久九九精品影院| 国产97色在线日韩免费| av网站在线播放免费| 男男h啪啪无遮挡| 亚洲三区欧美一区| 久久狼人影院| av在线天堂中文字幕 | 成人精品一区二区免费| 亚洲自偷自拍图片 自拍| 午夜激情av网站| 国产精品影院久久| 视频区欧美日本亚洲| 久久九九热精品免费| 少妇的丰满在线观看| 精品国内亚洲2022精品成人| 老司机亚洲免费影院| 免费少妇av软件| 亚洲一区二区三区欧美精品| 欧美另类亚洲清纯唯美| 日韩精品中文字幕看吧| 亚洲片人在线观看| 麻豆av在线久日| 精品欧美一区二区三区在线| 热99国产精品久久久久久7| 韩国精品一区二区三区| 国产亚洲精品久久久久5区| √禁漫天堂资源中文www| 一二三四在线观看免费中文在| 欧美黑人欧美精品刺激| 后天国语完整版免费观看| 在线观看免费高清a一片| 亚洲自拍偷在线| 免费女性裸体啪啪无遮挡网站| 桃色一区二区三区在线观看| 亚洲色图综合在线观看| 国产精品一区二区精品视频观看| 在线视频色国产色| 亚洲av电影在线进入| 久久久国产成人免费| 高潮久久久久久久久久久不卡| 亚洲精品在线观看二区| 亚洲精品中文字幕一二三四区| 久久草成人影院| 欧美最黄视频在线播放免费 | 亚洲第一av免费看| 亚洲精品国产精品久久久不卡| 后天国语完整版免费观看| 亚洲人成伊人成综合网2020| 国产一区二区三区综合在线观看| 亚洲av熟女| 久久久久国产一级毛片高清牌| 老司机深夜福利视频在线观看| 亚洲国产毛片av蜜桃av| 欧美日韩乱码在线| 午夜精品久久久久久毛片777| 91老司机精品| 老司机在亚洲福利影院| 久久久国产欧美日韩av| 叶爱在线成人免费视频播放| 99精品久久久久人妻精品| 成人18禁在线播放| 欧美日韩一级在线毛片| 亚洲情色 制服丝袜| 天天躁夜夜躁狠狠躁躁| 国产成年人精品一区二区 | 国产成+人综合+亚洲专区| 久久久国产欧美日韩av| 国产黄色免费在线视频| 窝窝影院91人妻| 人人妻,人人澡人人爽秒播| 亚洲aⅴ乱码一区二区在线播放 | 中文字幕人妻丝袜一区二区| 免费观看人在逋| 性欧美人与动物交配| 国产精品国产高清国产av| 久久精品国产清高在天天线| 狠狠狠狠99中文字幕| 亚洲欧美精品综合久久99| 热99国产精品久久久久久7| 男女下面进入的视频免费午夜 | 丰满人妻熟妇乱又伦精品不卡| 精品国产超薄肉色丝袜足j| 日本黄色日本黄色录像| 女警被强在线播放| 亚洲va日本ⅴa欧美va伊人久久| 亚洲激情在线av| 亚洲色图 男人天堂 中文字幕| 亚洲中文日韩欧美视频| 国产男靠女视频免费网站| 亚洲七黄色美女视频| bbb黄色大片| 午夜免费鲁丝| 一二三四在线观看免费中文在| 一区福利在线观看| 91成年电影在线观看| 一边摸一边抽搐一进一小说| 精品一区二区三区av网在线观看| 9色porny在线观看| 国产精品国产高清国产av| 在线十欧美十亚洲十日本专区| 日本黄色视频三级网站网址| 深夜精品福利| 亚洲人成电影免费在线| 丝袜美足系列| 亚洲国产精品999在线| 亚洲精华国产精华精| 欧美成人免费av一区二区三区| 一本大道久久a久久精品| 亚洲成人精品中文字幕电影 | 高清毛片免费观看视频网站 | 热re99久久精品国产66热6| 国产欧美日韩一区二区三| 制服诱惑二区| 91精品国产国语对白视频| 97碰自拍视频| 国产精品爽爽va在线观看网站 | 亚洲全国av大片| www.999成人在线观看| 国产极品粉嫩免费观看在线| 激情在线观看视频在线高清| 日本精品一区二区三区蜜桃| 亚洲人成电影免费在线| 国产亚洲精品一区二区www| 999久久久精品免费观看国产| 他把我摸到了高潮在线观看| 男女之事视频高清在线观看| 国产97色在线日韩免费| 黑人操中国人逼视频| 亚洲自拍偷在线| 久久久久久久久久久久大奶| av天堂久久9| 久久久国产一区二区| 亚洲免费av在线视频| 91在线观看av| 日韩成人在线观看一区二区三区| 亚洲人成77777在线视频| 欧美成人免费av一区二区三区| 国产亚洲av高清不卡| 99精品欧美一区二区三区四区| 国产极品粉嫩免费观看在线| 国产亚洲精品综合一区在线观看 | 麻豆一二三区av精品| 日本三级黄在线观看| 久久天躁狠狠躁夜夜2o2o| 亚洲av电影在线进入| 亚洲成a人片在线一区二区| 咕卡用的链子| 亚洲激情在线av| 女警被强在线播放| 亚洲色图综合在线观看| 久久久久亚洲av毛片大全| 91av网站免费观看| 日本vs欧美在线观看视频| 色综合站精品国产| 中文字幕人妻熟女乱码| av电影中文网址| av欧美777| 国产精品久久久久久人妻精品电影| 中出人妻视频一区二区| 精品少妇一区二区三区视频日本电影| 女生性感内裤真人,穿戴方法视频| 中文字幕人妻熟女乱码| 午夜91福利影院| 大型黄色视频在线免费观看| 国产av精品麻豆| 搡老乐熟女国产| 亚洲成人精品中文字幕电影 | 精品久久久久久电影网| 在线观看66精品国产| 亚洲国产欧美日韩在线播放| 亚洲精品一二三| 99精品久久久久人妻精品| 水蜜桃什么品种好| 男女做爰动态图高潮gif福利片 | 女人被狂操c到高潮| 亚洲精品成人av观看孕妇| 淫秽高清视频在线观看| 国产成人欧美在线观看| 欧美日韩精品网址| 亚洲七黄色美女视频| 在线观看舔阴道视频| 亚洲精品粉嫩美女一区| 男女高潮啪啪啪动态图| 天天影视国产精品| 一进一出抽搐动态| 色哟哟哟哟哟哟| 日韩大码丰满熟妇| 曰老女人黄片| 露出奶头的视频| 国产aⅴ精品一区二区三区波| 老熟妇仑乱视频hdxx| 一级,二级,三级黄色视频| 两性午夜刺激爽爽歪歪视频在线观看 | 日韩中文字幕欧美一区二区| 国产亚洲欧美在线一区二区| 久久精品国产99精品国产亚洲性色 | 最新美女视频免费是黄的| 亚洲伊人色综图| 中文欧美无线码| 美女国产高潮福利片在线看| 午夜福利免费观看在线| av天堂久久9| 国产精品久久久av美女十八| 国产欧美日韩一区二区精品| 亚洲一区中文字幕在线| 亚洲国产欧美一区二区综合| 日本黄色视频三级网站网址| 操出白浆在线播放| 亚洲美女黄片视频| 欧美成人免费av一区二区三区| 欧美黑人精品巨大| 黑人欧美特级aaaaaa片| 亚洲精品粉嫩美女一区| av电影中文网址| 满18在线观看网站| 变态另类成人亚洲欧美熟女 | 亚洲第一欧美日韩一区二区三区| 99国产极品粉嫩在线观看| 免费不卡黄色视频| 在线观看一区二区三区| 久久国产精品人妻蜜桃| 色综合站精品国产| 欧美性长视频在线观看| 又大又爽又粗| 欧美一区二区精品小视频在线| 极品人妻少妇av视频| 天天躁狠狠躁夜夜躁狠狠躁| svipshipincom国产片| 99热只有精品国产| 精品高清国产在线一区| 免费女性裸体啪啪无遮挡网站| 一边摸一边抽搐一进一出视频| av超薄肉色丝袜交足视频| 丰满饥渴人妻一区二区三| 亚洲人成电影免费在线| 日韩成人在线观看一区二区三区| 黑人猛操日本美女一级片| 欧美在线黄色| 久久精品国产99精品国产亚洲性色 | 一级片'在线观看视频| av电影中文网址| 99久久99久久久精品蜜桃| 一a级毛片在线观看| 精品欧美一区二区三区在线| ponron亚洲| 中文欧美无线码| av免费在线观看网站| 国产有黄有色有爽视频| 一区二区三区国产精品乱码| 久久久久久大精品| 亚洲欧美一区二区三区久久| 亚洲人成77777在线视频| 亚洲国产欧美网| 久久精品人人爽人人爽视色| 国产1区2区3区精品| 黄色视频不卡| 黄色毛片三级朝国网站| 欧美日本中文国产一区发布| 久久影院123| 亚洲国产看品久久| 亚洲avbb在线观看| 日韩精品免费视频一区二区三区| 亚洲精品国产一区二区精华液| 亚洲片人在线观看| 99久久综合精品五月天人人| 国产av在哪里看| 亚洲人成电影免费在线| 国产一区二区三区视频了| 国产黄色免费在线视频| 不卡av一区二区三区| 19禁男女啪啪无遮挡网站| 人妻久久中文字幕网| 久久人人97超碰香蕉20202| 久久亚洲真实| 亚洲国产欧美网| 亚洲男人天堂网一区| 高清av免费在线| 丁香欧美五月| 亚洲成国产人片在线观看| 丝袜在线中文字幕| 久久精品成人免费网站| 一边摸一边抽搐一进一出视频| 一夜夜www| 91九色精品人成在线观看| 最好的美女福利视频网| 日韩免费av在线播放| 久久久久久久精品吃奶| 国产精品久久久久成人av| 大陆偷拍与自拍| 9191精品国产免费久久| 99在线人妻在线中文字幕| 9色porny在线观看| 欧美激情 高清一区二区三区| 天堂影院成人在线观看| 久热这里只有精品99| 国内久久婷婷六月综合欲色啪| 日韩精品免费视频一区二区三区| 两人在一起打扑克的视频| 精品人妻1区二区| 国产成人av教育| 韩国精品一区二区三区| 美女 人体艺术 gogo| 午夜精品国产一区二区电影| 国产欧美日韩一区二区精品| 激情视频va一区二区三区| 嫁个100分男人电影在线观看| 又紧又爽又黄一区二区| 久久天躁狠狠躁夜夜2o2o| 亚洲欧美精品综合一区二区三区| 精品福利永久在线观看| 欧美日韩av久久| 亚洲国产欧美一区二区综合| 日韩中文字幕欧美一区二区| 操美女的视频在线观看| 他把我摸到了高潮在线观看| 精品国产国语对白av| 久久精品91无色码中文字幕| 97碰自拍视频| 国产片内射在线| 亚洲av电影在线进入| 变态另类成人亚洲欧美熟女 | 欧美中文日本在线观看视频| 宅男免费午夜| 国产成+人综合+亚洲专区| 91国产中文字幕| 精品久久久久久,| 9色porny在线观看| 免费观看人在逋| 精品国产超薄肉色丝袜足j| 在线av久久热| 88av欧美| 色婷婷久久久亚洲欧美| 中文字幕人妻熟女乱码| 亚洲片人在线观看| 中文字幕高清在线视频| 中国美女看黄片| 97碰自拍视频| 国产人伦9x9x在线观看| 叶爱在线成人免费视频播放| 激情视频va一区二区三区| 国产单亲对白刺激| 久久精品影院6| 激情在线观看视频在线高清| bbb黄色大片| 在线永久观看黄色视频| 在线观看舔阴道视频| 黄片大片在线免费观看| 亚洲国产精品sss在线观看 | 国产精品久久久人人做人人爽| 男男h啪啪无遮挡| 国产黄色免费在线视频| 村上凉子中文字幕在线| 人妻丰满熟妇av一区二区三区| 在线看a的网站| 麻豆久久精品国产亚洲av | 中文字幕人妻丝袜一区二区| 欧美精品啪啪一区二区三区| 国产精品美女特级片免费视频播放器 | 99re在线观看精品视频| 黄色毛片三级朝国网站| 中国美女看黄片| 国产三级在线视频| 久久热在线av| 欧美成人性av电影在线观看| 亚洲专区中文字幕在线| 国产高清videossex| 久久久精品欧美日韩精品| 天堂俺去俺来也www色官网| 97超级碰碰碰精品色视频在线观看| 日韩欧美三级三区| 免费日韩欧美在线观看| 18禁黄网站禁片午夜丰满| 午夜免费观看网址| 欧美 亚洲 国产 日韩一| 在线观看日韩欧美| 婷婷六月久久综合丁香| 女人爽到高潮嗷嗷叫在线视频| 亚洲色图 男人天堂 中文字幕| 在线观看一区二区三区| 日韩大码丰满熟妇| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲色图综合在线观看| 18美女黄网站色大片免费观看| 村上凉子中文字幕在线| 亚洲色图综合在线观看| 久久精品成人免费网站| 国产成人系列免费观看| 日日爽夜夜爽网站| 日韩高清综合在线| 亚洲第一av免费看| 男男h啪啪无遮挡| 国产精华一区二区三区| 男人舔女人下体高潮全视频| 国产亚洲精品综合一区在线观看 | 99久久人妻综合| 国产在线精品亚洲第一网站| 人成视频在线观看免费观看|