• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    結(jié)合BiLSTM+CRF和TextRank的句法邊界分析

    2022-07-06 14:30:02楊陳菊邵玉斌皮乾東
    小型微型計算機系統(tǒng) 2022年7期
    關鍵詞:詞塊句法短語

    楊陳菊,邵玉斌,2,孫 俊,2,龍 華,2,皮乾東

    1(昆明理工大學 信息工程與自動化學院,昆明 650500) 2(昆明理工大學 云南省計算機國家重點實驗室,昆明 650500)

    1 引 言

    句法分析是自然語言處理的基本任務,這個任務是使機器能夠自動的識別出句子的句法單位和這些單位的塊標記信息,而本文研究的重點內(nèi)容是識別出句子的句法單位而不包括塊的類型標記.漢語對于詞性要求不像英文那么嚴謹,在漢語中,動詞可以作名詞,名詞可以作動詞、形容詞等現(xiàn)象隨處可見,因此,獲取句法邊界才是關鍵.由此對于句法邊界的識別研究也有著重要的意義,同時句法分析也變得簡單高效.

    句法分析發(fā)展分為3個階段,分別是基于規(guī)則、統(tǒng)計、機器學習.早期常見的句法分析算法有:自頂向下和自底向上分析算法、線圖分析法、CYK(Cocke-Younger-Kasami)算法等.對傳統(tǒng)方法進行改進的研究,如皮乾東等[1]采用逆向掃描的方式改進LR算法,該方法存在規(guī)則不完整,魯棒性低的問題.近年來大多研究者使用機器學習方法并取得了可觀成果,HMM(Hidden Markov Model)[2]、CRF[3]、神經(jīng)網(wǎng)絡[4]被用于句法分析,這些方法是對句子的所有可能的句法樹都計算一個得分,然后選擇得分最大的對應的句法樹為最終的分析結(jié)果.對于外語而言,目前比較好的是Shen Y等[5,6]提出的一種無監(jiān)督句法結(jié)構歸納的神經(jīng)語言模型(Parsing-Reading-Predict Networks,PRPN),可同時從未加注釋的英文句子中歸納出句法結(jié)構,并能夠利用推理結(jié)構來學習更好的語言模型.Eliyahu等[7]把LSTM應用到依存分析中,很好地獲取了無限長度地上下文信息,得到了比FNN(Factorisation-machine supported Neural Networks)更好的效果.王衡軍等[8]則用LSTM和CNN(Convolutional Neural Network)分別提取詞向量特征和全局向量特征,取得了不錯的效果.諶志群等[9]創(chuàng)新性地結(jié)合樹形概率和BiLSTM對中文句法進行分析.谷波等[10]基于循環(huán)神經(jīng)網(wǎng)絡自底向上地使用中文二分結(jié)構的特點進行句法分析,在句子級別上正確率達43%.

    詞塊識別作為層次句法分析中的關鍵一步,在研究歷程中分為基于規(guī)則、統(tǒng)計、規(guī)則和統(tǒng)計結(jié)合、機器學習4個階段.其中基于規(guī)則的方法通常是根據(jù)語言的詞法、語法等語言學特點人工提取簡要規(guī)則,例如總結(jié)詞性的組合規(guī)則,或者通過統(tǒng)計手段獲得短語的構建規(guī)則和大量短語識別模板,再利用這些規(guī)則和模板進行詞塊識別.基于統(tǒng)計的方法通過對文本進行統(tǒng)計獲得各種統(tǒng)計量,例如詞頻、幾個詞語的詞語共現(xiàn)次數(shù)、互信息、信息量、C-value等,然后利用這些統(tǒng)計量進行短語的識別.基于規(guī)則和統(tǒng)計結(jié)合的方法往往能夠獲得比前面二者更高的準確率,但仍然需要人工總結(jié).隨著機器學習的發(fā)展,HMM[11]、CRF[12]、神經(jīng)網(wǎng)絡[13]等方法被用于詞塊識別中.Huang等[14]在LSTM模型的基礎上加入CRF模型提出了一種序列標記模型,能有效的利用將來和過去的輸入數(shù)據(jù)特性.袁源[15]等先用CNN獲取字向量,然后BiLSTM獲取隱含特征,最后利用CRF輸出預測序列標簽.Zhang等[16]運用多層堆疊神經(jīng)網(wǎng)絡(stacked neural network)與CRF結(jié)合,F(xiàn)1值相較于傳統(tǒng)CRF提高了3.75%的.以上結(jié)果表明了CRF對預測序列前后連貫性的修護作用.機器學習的方法避免了繁雜的特征工程,效果有顯著提高.

    核心詞提取是層次句法分析的重要步驟,目前國內(nèi)外對短語的核心詞提取研究較少,而文檔關鍵詞的提取相對較多.關鍵詞的提取分為有監(jiān)督和無監(jiān)督兩類.有監(jiān)督方法一般是把關鍵詞提取的問題轉(zhuǎn)化為二分類的問題.其中分類器利用決策樹[17],神經(jīng)網(wǎng)絡[18],BiLSTM-CRF[19]等得到了較好的效果.無監(jiān)督方法通過文本自身的詞匯信息進行提取.比較經(jīng)典的方法有TF-IDF(Term Frequency-Inverse Document Frequency)、TextRank、LDA(Latent Dirichlet Allocation).

    上述的句法分析文獻都沒有考慮漢語句法結(jié)構的層次性,雖然取得了很高的塊F1值,但從整句來看,正確率依然很低.短語結(jié)構句法樹是自底向上按層遞歸結(jié)合構成的.本文結(jié)合句法結(jié)構的層次性提出了一種把核心詞作為詞塊的形式替換的句法樹結(jié)構.在漢語層次句法邊界分析中,將詞塊識別和核心詞提取分開進行,通過結(jié)合BiLSTM網(wǎng)絡及CRF進行層次詞塊識別,通過改進TextRank方法來提取詞塊的核心詞,構建了簡單且易擴展的句法分析器.

    短語結(jié)構句法樹如圖1(a)所示,句中的詞語自底向上按層構成詞塊,體現(xiàn)了句法分析的層次性.其中NP、VP、IP代表詞塊的類型,詞塊類型根據(jù)詞語詞性等特征在不斷的發(fā)生變化.為了更好的句法分析,本文提出一種把核心詞作為詞塊的形式替換的句法樹結(jié)構,如圖1(b)所示.在層次分析中,“金融 工作”合成詞塊后用其核心詞“工作”來形式上表示這個詞塊,同樣“顯著 成績”用其核心詞“成績”來替換,在第2層分析中重復以上步驟,直到最后只剩一個詞語.

    圖1 短語結(jié)構句法樹和引入核心詞的結(jié)構句法樹Fig.1 Phrase structure syntax tree and structure syntax tree of introduces the core word

    在層次句法邊界分析中,只需要識別出句子的句法單位而不包括塊的類型標記.每一層分析采用詞塊識別的方式識別出該層的語塊,然后把該層識別出來的詞塊送入核心詞提取模型中進行核心詞的提取,再把提取結(jié)果輸入下一層,進行下一層的詞塊識別,識別后又進行核心詞識別,再把提取結(jié)果輸入下一層,在下一層中循環(huán)以上步驟,直到最后剩下為一個詞.分析流程如圖2所示.開始時先判斷句長(詞語個數(shù)),句長為1,分析結(jié)束;句長為2,不用進行詞塊的識別,默認兩個詞語為一個整體,即默認為一個詞語塊,直接融入核心詞提取模型中;句長大于2,首先進行詞塊識別,識別結(jié)果再送入核心詞識別模型中.識別結(jié)果又進行句長判斷,直到句長為1結(jié)束.

    圖2 層次句法分析流程圖Fig.2 Flow chart of hierarchical syntactic analysis

    本文與傳統(tǒng)句法分析不同的地方在于將詞塊識別和核心詞提取分開進行,識別出句子的句法單位.在詞塊識別模塊,使用BiLSTM+CRF網(wǎng)絡提取上下文特征,識別出詞塊;在核心詞提取模塊,通過加入詞語的相似度信息、位置信息、詞性信息改進TextRank方法,提高核心詞識別準確率.關鍵詞提取是指在文檔中提取出關鍵詞,本文的核心詞識別是在詞塊搜索范圍內(nèi)提取一個核心詞,以便把一個詞塊規(guī)約為一個詞.因此重新定義了詞語的重要性指標.

    2 BiLSTM+CRF詞塊識別

    本文將層次詞塊識別問題轉(zhuǎn)換為一個序列標記的問題,采用BiLSTM+CRF模型進行詞塊序列標記的識別.如圖3所示(方框表示向量,圓圈表示LSTM網(wǎng)絡),將一個句長為n的句子S={w1,w2,w3,…,wi,…,wn},i=1,2,…,n作為細粒度詞塊識別的輸入,其中w為句子中的詞語,i表示詞語在句子中的位置,n為句子中詞語的個數(shù).分布式詞向量內(nèi)部包含詞與詞之間的相似度信息,對相鄰詞塊的識別有較好的作用,因此通過詞嵌入層把詞語映射為詞向量.然后將詞向量輸入到BiLSTM模型中,獲取該句子的上下文詞特征.接下來把BiLSTM的輸出輸入到CRF模型中,經(jīng)過一個線性層,最后輸出最高分數(shù)對應的標記序列作為預測結(jié)果.其中詞塊標記方法采用BIO標記法,“B”表示詞塊的開始,“I”表示詞塊的中間及結(jié)尾,“O”表示單獨一個詞構成一個詞塊.

    2.1 詞嵌入層

    圖3中xi=[xi1,xi2,…,xin],(n=dw+dp),包含了詞向量xwi∈Rdw和詞性向量xpi∈Rdp信息,xi由兩個向量拼接后經(jīng)過線性和非線性變換后獲得,如公式(1)所示,dw表示分布式詞向量的維度,dp表示分布式詞性向量的維度,wx表示權重矩陣,bx表示偏移向量,激活函數(shù)g為sigmoid函數(shù).最后可以得到大小為(dw+dp)×n的輸入矩陣x.xwi和xpi分別從訓練好的詞向量矩陣和詞性向量矩陣中索引獲取.

    xi=g(wx[xwi;xpi]+bx)

    (1)

    圖3 BiLSTM+CRF詞塊識別模型Fig.3 Chunk recognition model of BiLSTM+CRF

    2.2 BiLSTM層

    BiLSTM層如圖4所示,BiLSTM同時從前向和后向獲取蘊含上下文信息的詞向量和詞性向量特征.LSTM網(wǎng)絡在每一時刻引入輸入門it、遺忘門ft、輸出門ot和記憶單元機制ct,當前時刻的輸出不僅僅取決于當前的輸入xt,還取決于前一時刻的記憶向量ct和隱層向量ht,前向LSTM各個機制的獲取如公式(2):

    圖4 雙向LSTM網(wǎng)絡模型Fig.4 BiLSTM neural network model

    (2)

    (3)

    BiLSTM通過前向和后向傳遞歷史信息,從而可以全面學習有效的在不同語境中的詞向量和詞性向量特征.BiLSTM層的輸出經(jīng)過線性層和log-softmax層獲得概率矩陣,softmax函數(shù)如公式(4),其中zi表示線性層的輸出.

    (4)

    (5)

    log-softmax目的是縮小值的范圍,可以避免上下溢出,如公式(5)所示,其中M=max(zi),i=1,2,…,n,這樣處理加快了運算速度,并保持數(shù)值的穩(wěn)定.

    2.3 CRF層

    BiLSTM層以及經(jīng)過線性層和log-softmax層的輸出結(jié)果是給單獨的標簽解碼,并沒有考慮到預測標簽信息的前后連貫性,假設能夠利用相鄰的輸出預測標簽信息,對預測結(jié)果會有很大的提升.CRF能夠?qū)W習輸出結(jié)果序列的轉(zhuǎn)移特征,能很好的解決這個問題,起到聯(lián)合解碼的作用.

    2.4 訓練目標

    句子的詞塊識別可以看成是句子的詞塊劃分標記的優(yōu)化問題,如公式(6)所示.其中y表示句子S的任意一種詞塊劃分方式,Y表示句子S的所有可能的詞塊劃分方式(所有可能的標記序列),θ包括模型中的所有參數(shù),y*為句子S的預測結(jié)果,預測結(jié)果為使得該句子詞塊的標簽序列得分Score(S,y;θ)最高的詞塊標記方式.

    (6)

    某個詞塊標記序列y的得分Score(S,y;θ)的得分計算式如公式(7)所示:

    (7)

    其中P表示狀態(tài)輸出矩陣,即log-softmax層輸出的向量序列,維度為n×l,n為句長,l為標記的種類個數(shù),本文中使用的是BIO標記法,即l=3;Pi,j表示第i個單元輸出的得分向量.A表示標記序列的轉(zhuǎn)移矩陣,Ayi-1,yi則表示標記yi-1轉(zhuǎn)移到標記yi的得分.該標記序列的最后得分如公式(8)所示:

    (8)

    訓練目標函數(shù)如公式(9)所示:

    (9)

    3 基于TextRank的詞塊核心詞識別

    在句法分析中,詞塊的核心詞作為該詞塊的形式代表,本節(jié)研究的問題是如何提取詞塊的核心詞.通過改進TextRank算法進行詞塊核心詞的提取.TextRank是一種用于文本的基于圖的排序算法,其思想是一個詞塊中,若有一個詞語的權值很高,那么與他關聯(lián)的詞語的重要度也會根據(jù)這個詞的重要性提升,越重要的詞對應節(jié)點的權值越高,所以我們把詞塊核心詞識別的問題轉(zhuǎn)換成詞塊中的詞匯的重要程度的排序問題,然后提取節(jié)點權值最大所對應的詞語.

    首先構造一個有向圖G=(W,E),其中W表示詞語節(jié)點,E表示邊,節(jié)點wi的權重計算式如公式(10):

    (10)

    (11)

    其中simji為詞語wj與wi的余弦相似度,x為Word2vce詞向量.

    節(jié)點wi的權重的初始值設如公式(12)所示,然后進行迭代計算直到收斂:

    (12)

    Word2vce本身含有語義相似度信息[20],現(xiàn)有方法中詞語的重要度權值只考慮了詞語的語義相似度.但詞塊中詞語的重要度不止這一個因素.漢語短語的基本類型分為五類:偏正、動賓、補充、主謂和并列.其中偏正結(jié)構前偏后正,核心詞在后,主要因素為詞語的位置;動賓和主謂是支配關系,核心詞主要為動詞,補充的核心詞為前面的動詞或形容詞,主要因素為詞語的詞性.綜上所述詞塊中詞語的重要程度還取決于詞語的位置和詞性信息.因此本文在此基礎上添加了詞匯的位置信息和詞性信息.對于位置信息遵循“前修飾后”的原則[21],越后出現(xiàn)的詞其權值越高,反之越小,如公式(13)所示:

    (13)

    其中M為詞wi在詞塊中出現(xiàn)的次數(shù),N為詞塊的長度,Lk(wi)為wi在詞塊中的位置.在位置信息矩陣中,wi和wj的詞性信息值為0.5×(IL(wi)+IL(wj)).

    詞性對詞語的重要度影響因素的構造函數(shù)如公式(14)所示:

    (14)

    其中pos為詞性分類集合,本文把詞性分為以下4類:動詞、名詞、形容詞和其他,則|pos|=4,Pk(wi)表示詞性標記,動詞類標記為4,名詞類標記為3,形容詞類標記為2,其他標記為1,遵循“動詞>名詞>形容詞>其他”的原則,詞性的具體分類見表1.在詞性信息矩陣中,wi和wj的詞性信息值為0.5×(IP(wi)+IP(wj)).另設wi的語義相似度信息如公式(15)所示:

    (15)

    IS表示若一個詞的重要度很高,與他越相似的詞也會根據(jù)它的重要度做相應的提升.

    在迭代計算前先獲取概率轉(zhuǎn)移矩陣如公式(16)所示:

    (16)

    其中Tji表示節(jié)點詞匯wj的影響因素轉(zhuǎn)移到節(jié)點詞匯wi的概率,即有向圖G=(W,E)中節(jié)點連接的邊權,計算式如公式(17)所示:

    (17)

    其中α、β、γ分別為語義相似度信息、節(jié)點位置信息、節(jié)點詞性信息的權值,且α+β+γ=1.

    最后按公式(18)優(yōu)化權重迭代計算過程,迭代計算直至收斂為止.迭代計算方法是逐步逼近最優(yōu)近似解的過程,當滿足終止迭代的條件時,能獲得一個足夠精度的近似極小值,我們認為此時達到了收斂條件,這一條件就是迭代計算的終止準則.迭代計算的終止準則一般有3種方法:點距準則、函數(shù)下降量準則、梯度準則.本研究采用函數(shù)下降量準則:當相鄰迭代時刻的目標函數(shù)值的下降量達到一個充分小值時,迭代終止,閾值設為0.0001.

    (18)

    其中,概率轉(zhuǎn)移矩陣T維度大小為N×N;R=[w1,w2,…,wN]維度大小為N×1,其元素分別對應詞塊中第一個詞至最后一個詞的重要度;e表示維度大小為N的單位向量.

    表1 詞性分類表Table 1 Part of speech classification table

    4 實 驗

    4.1 數(shù)據(jù)集預處理

    實驗數(shù)據(jù)集來自賓州中文樹庫(CTB8.0),首先對數(shù)據(jù)進行了以下處理:

    1)去除短語標記,只保留邊界信息.

    2)去除空節(jié)點和一元短語邊界.

    3)去除含未知符號的句子,例如英文單詞、“-------”、“.....”、“#”號等無明確意義的符號;去除重復的句子;去除無意義的句子,例如人物姓名列表等.

    4)替換類型詞:用“number”替換數(shù)字,“time”替換日期,“name”替換人名,“percent”替換百分數(shù),“ordinal”替換序數(shù).

    5)詞塊采用BIO標記方法.

    最后選出包含10000個句子,將其中9000個句子作為訓練集,驗證集和測試集各1000句.

    4.2 實驗設計

    為驗證模型性能,設置了12組模型實驗.其中,詞塊識別模塊設置了3組實驗,分別采用了CRF、BiLSTM、BiLSTM+CRF模型進行對比,其中的CRF詞塊識別特征模板和BiL-STM網(wǎng)絡詞塊識別的超參數(shù)設置見表2和表3;核心詞識別模塊設置了4組實驗,分別單獨驗證相似度信息、位置信息、詞性信息的核心詞識別方法對句法邊界分析的影響,以及驗證將3種信息聯(lián)合作用對句法邊界分析的影響.實驗還給出不同句長下的分析結(jié)果,按句長分為4類:130,其中N為句長.核心詞識別模塊的參數(shù)設置見表4.

    表2 CRF詞塊識別特征模板Table 2 CRF word block recognition feature template

    表3 BiLSTM詞塊識別超參數(shù)設置Table 3 LSTM block recognition hyperparameter setting

    表4 核心詞識別參數(shù)設置Table 4 Key word identification parameter setting

    4.3 評價指標

    句法邊界的識別模型評價指標有P、R和F1值,其中P表示正確率,其值為分析結(jié)果中正確的短語個數(shù)占分析結(jié)果中的短語個數(shù)的百分比;R表示召回率,其值為分析結(jié)果中正確的短語個數(shù)占測試集中總的短語個數(shù)的百分比;F1表示短語級別的綜合指標:F1=2×P×R/(P+R).本文統(tǒng)計了整句的正確率(Overall Accuracy,OA)作為指標,整句正確率指的是句法分析中從第1層至最后1層的句法邊界識別正確的句子個數(shù)與所測試句子個數(shù)的百分比.

    5 實驗結(jié)果分析

    實驗結(jié)果如表5所示.本實驗結(jié)果可以看出核心詞提取部分同等條件下,詞塊識別階段使用BiLSTM相對于CRF在句法邊界分析結(jié)果上稍有優(yōu)勢,但BiLSTM+CRF較前兩者有一定的提高:F1值分別提高了2.1和1.4個百分點,OA值分別提高了1.7和1.1個百分點.原因是長短期記憶模型能充分學習到上下文信息,并能一定程度上解決長依賴問題;CRF層在其后充分利用相鄰的輸出預測標簽信息,學習輸出結(jié)果序列的轉(zhuǎn)移特征,起到聯(lián)合解碼的作用.

    表5 實驗結(jié)果Table 5 Experimental result

    詞塊識別模塊同等條件下,核心詞識別階段的3種信息中,相似度信息與詞性信息的重要程度比較接近,且比位置信息稍重要;但把3個信息按重要程度賦予權值合并起來進行識別對句法邊界分析的效果最好.其中詞塊識別為BiLSTM+CRF模型時,合并3個信息的TextRank算法的句法邊界識別的F1值相較于單獨的相似度信息、位置信息、詞性信息分別提高了4.1、6.3、4.0個百分點,OA值分別提高了3.0、4.6、2.5個百分點.原因有:1)相似度信息對核心詞識別的準確度取決于相似度矩陣,間接取決于詞向量訓練的規(guī)模;因此擴大詞向量訓練規(guī)??捎兄诰浞ㄟ吔绲恼w識別正確率;2)位置信息對核心詞識別的準確度取決于位置信息矩陣的參數(shù)的大小,間接取決于的詞塊長度.長度越短,位置信息矩陣的參數(shù)越大,最終的轉(zhuǎn)移概率矩陣中的位置信息占比就越大,從而使得另外兩個信息占比越小,甚至起到很小的作用.由此,位置信息的權重相對較小才能起到較好的作用;3)同理詞性信息對核心詞識別的準確度取決于詞性信息矩陣參數(shù)的大小,間接取決于詞性的分類數(shù)目以及詞性劃分方式,擴大詞性劃分數(shù)目以及規(guī)范劃分細則可有助于句法邊界的整體識別正確率.

    再者,由表5可以看出,整句的正確率效果并不理想,主要原因是漢語使用的多樣化,例如同一個詞有多種用法等.輸出分析錯誤的句子后發(fā)現(xiàn),它們的大部分中含有并列結(jié)構,并列結(jié)構的核心詞不穩(wěn)定導致句法邊界的識別錯誤;另外數(shù)據(jù)集中標點符號的多樣化也是一重要原因.

    在不同句長條件下,分別測試了下12種模型的F1值及OA值分布情況.通過圖5的曲線可以看出隨著句長的增長,F(xiàn)1值及OA呈下降的趨勢.

    圖5(a)和圖5(b)曲線顯示,句長為(20,30]的IS+IL+IP的OA值相對單獨使用各信息的情況稍小,而圖5(c)的BiLSTM+CRF模型的OA值明顯提升了.說明BiLSTM+CRF詞塊識別模型對TextRank_(IS+IL+IP)的相互促進作用,聯(lián)合提升了句法邊界識別的準確率.整體來看,IS+IL+IP的方法相比于單獨使用IS、IL、IP各句長范圍下都具有明顯的優(yōu)勢.圖5(d)曲線顯示,BiLSTM+CRF+TextRank_(IS+IL+IP)模型在各句長下的F1值和OA值最高.說明該模型性能的優(yōu)越性及穩(wěn)定性.

    圖5 不同句長下各模型組合的F1值及OA值分布情況Fig.5 F1 and sentence accuracy of each model under different sentence lengths

    為了驗證本文方法相較于傳統(tǒng)方法性能上的提升,對所有標簽數(shù)據(jù)進行了文獻[1]方法的實驗;以及目前的先進方法進行了實驗,表6列出了部分F1值和OA值較高的方法與本文方法進行對比,其中文獻[22]為統(tǒng)計方法,文獻[5]、文獻[6]、文獻[8]、文獻[10]利用了神經(jīng)網(wǎng)絡方法.

    從表6可以看出,本文提出的方法較傳統(tǒng)規(guī)則方法和統(tǒng)計方法F1值和OA值都有明顯的提升:與傳統(tǒng)LR算法相比F1值提升了6.58個百分點,OA值提升了3.68個百分點,與統(tǒng)計方法相比,F(xiàn)1值提升了5.82個百分點,OA值提升了3.31個百分點.與使用BiLSTM+CNN的文獻[8]以及使用RNN-INT的文獻[10]相比,本文方法也是明顯提升的.與使用PRPN的文獻[5]相比,本文方法略有優(yōu)勢,F(xiàn)1值和OA值比較接近使用PRPN-LM的文獻[6],但仍存在差距,并且從所有方法的OA值上看,有待進一步提高.

    表6 句法邊界測試結(jié)果及對比Table 6 Syntactic boundary test results and comparison

    6 結(jié) 語

    本文通過分析短語結(jié)構類型層次句法分析的層次性和漢語結(jié)構特點,提出一種把核心詞作為詞塊的形式替換的句法樹,通過BiLSTM+CRF與改進的TextRank結(jié)合使用進行句法邊界的識別.首先利用BiLSTM獲取上下文特征,加上CRF層分析預測標簽序列的前后連貫信息,從而進行詞塊分析;利用相似度信息、位置信息和詞性信息對TextRank算法的改進,解決了從文本關鍵詞提取到詞塊核心詞提取算法移用的難題,擺脫了傳統(tǒng)的基于大量規(guī)則的繁瑣步驟,也不用頻繁地計算詞語移進和規(guī)約動作的概率,同時提升了句法邊界分析的效果.但存在的不足是層次分析的累積錯誤問題:若低層次分析錯誤,導致高層次也出現(xiàn)錯誤,從而導致整句的正確率下降.詞塊分析和核心詞提取過程是相輔相成、相互影響的.因此另外一個問題是詞塊分析的失誤可能導致核心詞提取結(jié)果不正確,同樣核心詞的識別不理想也會影響到詞塊識別效果,核心詞識別對句法分析中的非第一層詞塊識別的效果起決定性作用.

    猜你喜歡
    詞塊句法短語
    句法與句意(外一篇)
    中華詩詞(2021年3期)2021-12-31 08:07:22
    述謂結(jié)構與英語句法配置
    句法二題
    中華詩詞(2018年3期)2018-08-01 06:40:40
    詩詞聯(lián)句句法梳理
    中華詩詞(2018年11期)2018-03-26 06:41:32
    高中英語詞塊教學現(xiàn)狀調(diào)查研究及應用策略分析
    大學英語教學中的詞塊教學
    詞塊在初中英語寫作教學中的應用研究
    美國總統(tǒng)就職演說詞中的詞塊研究
    欧美又色又爽又黄视频| 国产成人影院久久av| 久久久久性生活片| 午夜精品一区二区三区免费看| 国产探花极品一区二区| 一区二区三区高清视频在线| 久久中文看片网| 两个人视频免费观看高清| 免费在线观看成人毛片| 99精品在免费线老司机午夜| 亚洲电影在线观看av| 搡老岳熟女国产| 天天添夜夜摸| 老司机午夜十八禁免费视频| 看片在线看免费视频| 欧美日韩黄片免| 婷婷六月久久综合丁香| 69av精品久久久久久| 亚洲欧美激情综合另类| 人人妻人人看人人澡| 亚洲中文字幕日韩| 国产欧美日韩一区二区三| 欧美成人a在线观看| 蜜桃亚洲精品一区二区三区| 欧美高清成人免费视频www| ponron亚洲| 色吧在线观看| 午夜老司机福利剧场| 欧洲精品卡2卡3卡4卡5卡区| 激情在线观看视频在线高清| 搡老岳熟女国产| 亚洲av一区综合| 亚洲人成伊人成综合网2020| 国产精品野战在线观看| 又粗又爽又猛毛片免费看| 久久亚洲精品不卡| av国产免费在线观看| aaaaa片日本免费| 免费在线观看亚洲国产| 欧美xxxx黑人xx丫x性爽| 欧美xxxx黑人xx丫x性爽| 久久久色成人| 老司机福利观看| 一级毛片女人18水好多| 亚洲一区二区三区不卡视频| 特级一级黄色大片| 在线播放无遮挡| 搞女人的毛片| 中文亚洲av片在线观看爽| 99久久久亚洲精品蜜臀av| 亚洲成人精品中文字幕电影| 99久久精品热视频| 免费电影在线观看免费观看| 琪琪午夜伦伦电影理论片6080| 深爱激情五月婷婷| 欧美成人一区二区免费高清观看| 男插女下体视频免费在线播放| tocl精华| 日本黄色片子视频| 国产在视频线在精品| 日日摸夜夜添夜夜添小说| 成人特级黄色片久久久久久久| 18禁国产床啪视频网站| 亚洲五月婷婷丁香| xxx96com| 在线天堂最新版资源| 国产欧美日韩一区二区三| 成人无遮挡网站| 在线播放国产精品三级| 女同久久另类99精品国产91| 久久精品国产清高在天天线| 俺也久久电影网| 久久久久久久亚洲中文字幕 | 亚洲专区中文字幕在线| 女生性感内裤真人,穿戴方法视频| 亚洲成人久久爱视频| 精品久久久久久久人妻蜜臀av| 嫩草影视91久久| 中文字幕熟女人妻在线| 久久精品国产99精品国产亚洲性色| 国产免费男女视频| 午夜福利欧美成人| 老鸭窝网址在线观看| 国产精品永久免费网站| 在线天堂最新版资源| 国产成年人精品一区二区| 久久九九热精品免费| 中文字幕久久专区| 在线观看av片永久免费下载| 露出奶头的视频| 日本撒尿小便嘘嘘汇集6| 在线播放无遮挡| 少妇人妻一区二区三区视频| 日韩av在线大香蕉| 亚洲第一电影网av| 国产熟女xx| 人人妻人人澡欧美一区二区| 观看美女的网站| 亚洲av不卡在线观看| 欧美激情久久久久久爽电影| 国产免费av片在线观看野外av| 久久久久国内视频| 国产成人a区在线观看| 身体一侧抽搐| 欧美性猛交黑人性爽| 老司机午夜十八禁免费视频| 日韩国内少妇激情av| 国产成人系列免费观看| 日韩欧美精品免费久久 | av天堂中文字幕网| 国产av不卡久久| 成年人黄色毛片网站| 国产色婷婷99| 日韩欧美国产一区二区入口| 欧美日韩乱码在线| 日本三级黄在线观看| 国产视频一区二区在线看| 久久久久久久久久黄片| 精品熟女少妇八av免费久了| 国产亚洲精品综合一区在线观看| 一级a爱片免费观看的视频| 夜夜爽天天搞| 亚洲人成网站高清观看| 91字幕亚洲| av在线天堂中文字幕| 免费看日本二区| 国产精品99久久99久久久不卡| 国产精品免费一区二区三区在线| 亚洲国产色片| 亚洲无线观看免费| 国产主播在线观看一区二区| 亚洲最大成人手机在线| 波多野结衣巨乳人妻| 国产三级在线视频| 久久精品91无色码中文字幕| 夜夜躁狠狠躁天天躁| 波多野结衣高清无吗| 观看美女的网站| 久久久久精品国产欧美久久久| 午夜福利在线观看免费完整高清在 | 国产免费av片在线观看野外av| 青草久久国产| 99久久精品一区二区三区| 国产真实伦视频高清在线观看 | 欧美一区二区亚洲| 亚洲第一电影网av| 日韩人妻高清精品专区| а√天堂www在线а√下载| 99热这里只有精品一区| 一区二区三区激情视频| 噜噜噜噜噜久久久久久91| 蜜桃亚洲精品一区二区三区| 亚洲成人免费电影在线观看| 亚洲精品色激情综合| 午夜激情欧美在线| 国产黄片美女视频| 国产国拍精品亚洲av在线观看 | 99久久久亚洲精品蜜臀av| 乱人视频在线观看| 久久伊人香网站| 不卡一级毛片| 欧美日韩乱码在线| 国产成人a区在线观看| 久久欧美精品欧美久久欧美| av视频在线观看入口| 国产aⅴ精品一区二区三区波| av在线蜜桃| 亚洲性夜色夜夜综合| 国产成人欧美在线观看| 全区人妻精品视频| 久久久国产精品麻豆| 国产精品久久久久久久久免 | 亚洲av五月六月丁香网| 天堂动漫精品| 国产精品亚洲av一区麻豆| 黄色日韩在线| 床上黄色一级片| 成人鲁丝片一二三区免费| av天堂中文字幕网| 亚洲狠狠婷婷综合久久图片| 亚洲久久久久久中文字幕| 我的老师免费观看完整版| av在线天堂中文字幕| 黄色丝袜av网址大全| 在线观看av片永久免费下载| 亚洲黑人精品在线| 可以在线观看毛片的网站| 久久国产精品影院| a级毛片a级免费在线| 人妻久久中文字幕网| 国产一区二区三区视频了| 国产精品自产拍在线观看55亚洲| 久久伊人香网站| 中文字幕av成人在线电影| 免费人成视频x8x8入口观看| 日日夜夜操网爽| 中文字幕人成人乱码亚洲影| 给我免费播放毛片高清在线观看| 国产伦一二天堂av在线观看| 欧美午夜高清在线| 亚洲欧美激情综合另类| 夜夜看夜夜爽夜夜摸| 听说在线观看完整版免费高清| 在线播放国产精品三级| 2021天堂中文幕一二区在线观| 中亚洲国语对白在线视频| 国产av麻豆久久久久久久| 少妇丰满av| 99在线视频只有这里精品首页| 国产精品乱码一区二三区的特点| 男女午夜视频在线观看| 久久精品国产清高在天天线| 国产精品久久久久久亚洲av鲁大| 天天添夜夜摸| 日本撒尿小便嘘嘘汇集6| 国产熟女xx| 校园春色视频在线观看| 一级作爱视频免费观看| 在线播放国产精品三级| 网址你懂的国产日韩在线| 国产午夜精品久久久久久一区二区三区 | 精品福利观看| 亚洲av美国av| 在线观看免费午夜福利视频| 欧美日本视频| eeuss影院久久| 亚洲精华国产精华精| 观看免费一级毛片| 18禁黄网站禁片免费观看直播| or卡值多少钱| 好男人在线观看高清免费视频| 精品一区二区三区av网在线观看| 每晚都被弄得嗷嗷叫到高潮| 色吧在线观看| 亚洲成av人片免费观看| 亚洲av不卡在线观看| 老司机深夜福利视频在线观看| 亚洲成人中文字幕在线播放| 亚洲精品影视一区二区三区av| 久久久久精品国产欧美久久久| 日本免费一区二区三区高清不卡| 制服丝袜大香蕉在线| 久久伊人香网站| 国产精品98久久久久久宅男小说| 日韩精品青青久久久久久| 日本免费a在线| 观看免费一级毛片| 亚洲精品亚洲一区二区| 免费人成视频x8x8入口观看| 天堂网av新在线| 最好的美女福利视频网| 最近最新中文字幕大全免费视频| 亚洲人成网站在线播| 婷婷亚洲欧美| 亚洲片人在线观看| 啪啪无遮挡十八禁网站| 99久久综合精品五月天人人| 亚洲精品国产精品久久久不卡| 可以在线观看的亚洲视频| 美女被艹到高潮喷水动态| 波多野结衣高清无吗| 欧美一区二区亚洲| 欧美国产日韩亚洲一区| 国产精品亚洲一级av第二区| 88av欧美| 国产麻豆成人av免费视频| 一级毛片高清免费大全| 国产野战对白在线观看| 免费搜索国产男女视频| 制服人妻中文乱码| 免费在线观看影片大全网站| 丰满乱子伦码专区| 国产亚洲欧美98| 欧美激情久久久久久爽电影| 精品乱码久久久久久99久播| 99在线视频只有这里精品首页| 亚洲av五月六月丁香网| 天美传媒精品一区二区| 色综合婷婷激情| 天堂动漫精品| 久久伊人香网站| 少妇人妻一区二区三区视频| 少妇人妻精品综合一区二区 | 两个人的视频大全免费| 18美女黄网站色大片免费观看| 香蕉久久夜色| 一个人免费在线观看的高清视频| 国产成人av激情在线播放| 久久精品夜夜夜夜夜久久蜜豆| 中文字幕精品亚洲无线码一区| 在线a可以看的网站| 一个人免费在线观看电影| av专区在线播放| 国产精品久久久久久精品电影| 国产成人欧美在线观看| 2021天堂中文幕一二区在线观| 精品熟女少妇八av免费久了| 国产极品精品免费视频能看的| 一个人观看的视频www高清免费观看| 欧美日韩国产亚洲二区| 亚洲av电影在线进入| 国产成人av激情在线播放| www.色视频.com| 欧美一级毛片孕妇| 人人妻人人澡欧美一区二区| 18禁黄网站禁片午夜丰满| 在线天堂最新版资源| 老鸭窝网址在线观看| 国产探花极品一区二区| 我要搜黄色片| 亚洲中文日韩欧美视频| 色噜噜av男人的天堂激情| 男插女下体视频免费在线播放| 级片在线观看| 精品一区二区三区人妻视频| 九九热线精品视视频播放| 日韩欧美在线二视频| 悠悠久久av| 黄色视频,在线免费观看| 九色成人免费人妻av| 久久久久性生活片| 国产亚洲精品综合一区在线观看| 亚洲av免费在线观看| 成人鲁丝片一二三区免费| 欧美最新免费一区二区三区 | 麻豆久久精品国产亚洲av| 亚洲av电影在线进入| 内地一区二区视频在线| 91字幕亚洲| 国产成人影院久久av| 欧美绝顶高潮抽搐喷水| 久久久成人免费电影| 亚洲成a人片在线一区二区| av福利片在线观看| 天天添夜夜摸| 久久国产精品人妻蜜桃| 亚洲 国产 在线| 亚洲五月天丁香| 色综合婷婷激情| 最新中文字幕久久久久| 禁无遮挡网站| 国产精品亚洲美女久久久| 九九久久精品国产亚洲av麻豆| 一级作爱视频免费观看| 老司机深夜福利视频在线观看| 亚洲熟妇中文字幕五十中出| 欧美成人免费av一区二区三区| 精品国产超薄肉色丝袜足j| 国产精品自产拍在线观看55亚洲| 免费搜索国产男女视频| 观看免费一级毛片| 97人妻精品一区二区三区麻豆| 给我免费播放毛片高清在线观看| 国产成人av激情在线播放| 欧美+亚洲+日韩+国产| 亚洲精品久久国产高清桃花| 午夜福利成人在线免费观看| 日韩免费av在线播放| 国产淫片久久久久久久久 | 久久久久亚洲av毛片大全| 操出白浆在线播放| 国产精品影院久久| 成年免费大片在线观看| 亚洲欧美日韩无卡精品| 首页视频小说图片口味搜索| 国产午夜精品久久久久久一区二区三区 | 小蜜桃在线观看免费完整版高清| 丰满乱子伦码专区| 中文资源天堂在线| 淫秽高清视频在线观看| 国产男靠女视频免费网站| 别揉我奶头~嗯~啊~动态视频| 两个人的视频大全免费| 无人区码免费观看不卡| 久久人人精品亚洲av| 亚洲欧美激情综合另类| 亚洲国产精品999在线| 国产单亲对白刺激| 一区福利在线观看| 国产成人啪精品午夜网站| 亚洲片人在线观看| 中文在线观看免费www的网站| 黄色女人牲交| 国产高清三级在线| 亚洲熟妇熟女久久| 人人妻人人看人人澡| 国产精品自产拍在线观看55亚洲| 又黄又粗又硬又大视频| 国产高清有码在线观看视频| 亚洲国产精品合色在线| 久久久久国内视频| 悠悠久久av| 一进一出抽搐动态| 亚洲精品一区av在线观看| 首页视频小说图片口味搜索| www日本黄色视频网| 熟女少妇亚洲综合色aaa.| 热99在线观看视频| 一本精品99久久精品77| 天堂动漫精品| 看黄色毛片网站| 中文字幕熟女人妻在线| 亚洲欧美日韩东京热| 99久久无色码亚洲精品果冻| 黄色成人免费大全| 男人和女人高潮做爰伦理| 国产精品综合久久久久久久免费| 国产日本99.免费观看| 亚洲自拍偷在线| 色综合欧美亚洲国产小说| avwww免费| 高清在线国产一区| 老汉色av国产亚洲站长工具| 精品久久久久久久人妻蜜臀av| 国产精品自产拍在线观看55亚洲| 欧美精品啪啪一区二区三区| 亚洲五月天丁香| 亚洲中文字幕日韩| 一进一出抽搐动态| 美女大奶头视频| 一卡2卡三卡四卡精品乱码亚洲| 国产高清激情床上av| 国产av一区在线观看免费| 久久中文看片网| 免费在线观看日本一区| a级毛片a级免费在线| 国产精品99久久久久久久久| 日韩av在线大香蕉| 成年女人看的毛片在线观看| 日韩有码中文字幕| 亚洲国产精品sss在线观看| 欧美日韩亚洲国产一区二区在线观看| 免费电影在线观看免费观看| 99久久精品一区二区三区| 国产精品精品国产色婷婷| 又黄又粗又硬又大视频| 18美女黄网站色大片免费观看| 国产99白浆流出| 国产麻豆成人av免费视频| 亚洲自拍偷在线| 内地一区二区视频在线| 国产高清视频在线观看网站| 91在线观看av| 老鸭窝网址在线观看| 日本黄色视频三级网站网址| 亚洲人与动物交配视频| 亚洲成人精品中文字幕电影| 国内久久婷婷六月综合欲色啪| 18禁国产床啪视频网站| 真人做人爱边吃奶动态| 亚洲欧美一区二区三区黑人| 麻豆成人av在线观看| 精品一区二区三区视频在线 | 国产成人啪精品午夜网站| 国产精品免费一区二区三区在线| 精品久久久久久久人妻蜜臀av| 在线观看美女被高潮喷水网站 | 国内少妇人妻偷人精品xxx网站| 18禁黄网站禁片免费观看直播| 最新在线观看一区二区三区| 99久久精品热视频| 99热精品在线国产| 日本免费a在线| 国语自产精品视频在线第100页| 国产亚洲av嫩草精品影院| 好男人电影高清在线观看| 成人鲁丝片一二三区免费| 国产精品av视频在线免费观看| 日本一本二区三区精品| 天天添夜夜摸| 欧美日韩精品网址| 精品欧美国产一区二区三| 欧美又色又爽又黄视频| 日韩欧美在线二视频| 十八禁网站免费在线| 中文资源天堂在线| 一区二区三区免费毛片| 91字幕亚洲| 婷婷丁香在线五月| 国产精品免费一区二区三区在线| 18+在线观看网站| 丝袜美腿在线中文| 免费在线观看影片大全网站| www国产在线视频色| 国产私拍福利视频在线观看| 午夜视频国产福利| 免费搜索国产男女视频| 一进一出抽搐gif免费好疼| 国产成人欧美在线观看| 在线免费观看的www视频| 啦啦啦韩国在线观看视频| 偷拍熟女少妇极品色| 亚洲av二区三区四区| 麻豆国产av国片精品| 亚洲成人精品中文字幕电影| 观看免费一级毛片| 在线播放国产精品三级| 久久久久久国产a免费观看| 少妇熟女aⅴ在线视频| 国产亚洲精品久久久com| av中文乱码字幕在线| 国产精品永久免费网站| 国产一区二区在线av高清观看| 久久精品国产亚洲av涩爱 | 婷婷丁香在线五月| 亚洲av免费在线观看| 欧美乱码精品一区二区三区| www.www免费av| 久久精品91蜜桃| 免费在线观看成人毛片| 他把我摸到了高潮在线观看| 国产激情偷乱视频一区二区| 一个人观看的视频www高清免费观看| 国产免费一级a男人的天堂| e午夜精品久久久久久久| 日韩欧美一区二区三区在线观看| 真人做人爱边吃奶动态| 老鸭窝网址在线观看| 久久久久久九九精品二区国产| 色视频www国产| 精华霜和精华液先用哪个| 久久久精品大字幕| 51午夜福利影视在线观看| 亚洲中文字幕一区二区三区有码在线看| 国产97色在线日韩免费| 91麻豆精品激情在线观看国产| 免费av观看视频| 久久天躁狠狠躁夜夜2o2o| 日韩精品青青久久久久久| svipshipincom国产片| 亚洲av日韩精品久久久久久密| 成年版毛片免费区| 国产真实乱freesex| av国产免费在线观看| 国内精品久久久久精免费| 我要搜黄色片| 国内精品美女久久久久久| 免费看日本二区| 亚洲精品美女久久久久99蜜臀| 日本熟妇午夜| 国产欧美日韩一区二区精品| 91av网一区二区| 国产成人av激情在线播放| 精品免费久久久久久久清纯| 国产午夜福利久久久久久| www国产在线视频色| 十八禁网站免费在线| 757午夜福利合集在线观看| 久久午夜亚洲精品久久| 中文字幕人成人乱码亚洲影| 国产精品野战在线观看| 国产精品久久视频播放| 女人高潮潮喷娇喘18禁视频| 一本精品99久久精品77| 我要搜黄色片| 亚洲成人久久性| 亚洲男人的天堂狠狠| 亚洲无线在线观看| 在线a可以看的网站| 亚洲成a人片在线一区二区| 日韩欧美三级三区| 无限看片的www在线观看| 日韩高清综合在线| 色哟哟哟哟哟哟| 18禁黄网站禁片午夜丰满| av天堂在线播放| 欧美中文日本在线观看视频| 五月伊人婷婷丁香| 亚洲第一电影网av| 国产黄a三级三级三级人| 国产亚洲精品av在线| 日韩欧美免费精品| 757午夜福利合集在线观看| 精品久久久久久久末码| 三级男女做爰猛烈吃奶摸视频| 国产亚洲精品久久久com| 小说图片视频综合网站| 麻豆国产av国片精品| 日本五十路高清| 蜜桃亚洲精品一区二区三区| 99久久久亚洲精品蜜臀av| 日韩欧美国产一区二区入口| 欧美丝袜亚洲另类 | 俺也久久电影网| 999久久久精品免费观看国产| 毛片女人毛片| 欧美区成人在线视频| 欧美成人一区二区免费高清观看| 久久精品亚洲精品国产色婷小说| av视频在线观看入口| 精品国产亚洲在线| 可以在线观看的亚洲视频| 日本与韩国留学比较| 热99re8久久精品国产| 国产精品亚洲一级av第二区| 俄罗斯特黄特色一大片| 国产精品99久久99久久久不卡| 国产精品久久久久久人妻精品电影| 中文字幕高清在线视频| 天美传媒精品一区二区| 又紧又爽又黄一区二区| 亚洲人成电影免费在线| 日韩成人在线观看一区二区三区| 尤物成人国产欧美一区二区三区| 国产精品三级大全| 国产精品99久久久久久久久| 免费搜索国产男女视频| 亚洲中文字幕一区二区三区有码在线看| 在线观看免费午夜福利视频| 欧美日本亚洲视频在线播放| 欧美另类亚洲清纯唯美| 国产精品免费一区二区三区在线| 小蜜桃在线观看免费完整版高清| 亚洲七黄色美女视频| 九九在线视频观看精品|