• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于結(jié)構(gòu)化學(xué)習(xí)的語句壓縮研究

    2013-10-15 01:38:12張永磊王紅玲周國棟
    中文信息學(xué)報(bào) 2013年2期
    關(guān)鍵詞:文法評(píng)測語料

    張永磊,王紅玲,周國棟

    (蘇州大學(xué) 自然語言處理實(shí)驗(yàn)室,江蘇 蘇州215006;蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州215006)

    1 引言

    隨著網(wǎng)絡(luò)的普及,我們每天接觸的信息越來越多;如何能夠在有限的時(shí)間內(nèi)掌握更多有用的信息越來越引起人們的關(guān)注。文檔的自動(dòng)摘要作為目前的熱門研究課題,是解決這一問題的有效途徑之一。而作為自動(dòng)摘要的重要組成部分,語句壓縮除了應(yīng)用于自動(dòng)文摘外,在其他方面也有較廣泛的應(yīng)用。例如,Corston-Oliver[1]將文本壓縮后顯示在 PDA、手機(jī)等設(shè)備的小屏幕上。Vandeghinste&Pan[2]則在刪除冗余的和非重要信息的同時(shí)保留話題主要論點(diǎn),從而生成對話標(biāo)題。語句壓縮的另一個(gè)較早的應(yīng)用是使用在盲人語音閱讀設(shè)備上[3],文本經(jīng)過壓縮后再使用語音機(jī)器加快閱讀速度,使得盲人的閱讀方式類似于正常人的快速閱讀方式。

    語句壓縮廣義上可以定義為:給定一個(gè)句子,生成對應(yīng)的一個(gè)句子,生成的句子滿足以下三個(gè)條件:比源語句短;保留源語句的重要信息;符合語法規(guī)范。在先前的工作中,人們主要采用刪除單詞、插入單詞、改變詞序、替換單詞等方法進(jìn)行語句壓縮。其中刪除單詞法是目前大多數(shù)系統(tǒng)采用的方法,如Knight&Marcu[4],Riezler等[5],Mc Donal d[6]等,即只考慮從源語句中刪除單詞與短語,這也是本文所采用的方法。在這個(gè)方法中,語句壓縮可被定義為生成源語句x=l1,l2,……,ln的一個(gè)子串y*=c1,c2,……,cm的過程,其中,ci∈{l1,l2,……,ln};假設(shè)F(ci)表示ci在源語句中對應(yīng)單詞的序號(hào),則F(ci)<F(ci+1),即在語句壓縮的過程中不改變詞的順序。

    目前針對語句壓縮的研究才剛剛開展,存在著壓縮結(jié)果不盡如人意、缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)等問題。本文將語句壓縮看成一個(gè)結(jié)構(gòu)化學(xué)習(xí)的過程,即在源語句的句法樹上學(xué)習(xí)一棵子樹作為其壓縮后的語句(見圖1)。同時(shí),本文還提出了兩種自動(dòng)評(píng)測指標(biāo)來評(píng)價(jià)壓縮結(jié)果。

    圖1 語句壓縮實(shí)例

    本文的主要內(nèi)容如下:第2節(jié)是相關(guān)工作的介紹,介紹了在基于單詞刪除框架下的語句壓縮的方法及其不足;第3節(jié)是結(jié)構(gòu)化學(xué)習(xí)方法的相關(guān)介紹;第4節(jié)是我們的主要工作,在這一部分我們主要介紹解碼方式、丟失函數(shù)、特征的選擇以及我們采用的評(píng)測方法;第5節(jié)實(shí)驗(yàn)與評(píng)測結(jié)果;第6節(jié)結(jié)論與未來工作。

    2 相關(guān)工作

    在語句壓縮研究中,Knight&Marcu[4]的貢獻(xiàn)是具有開創(chuàng)性的,他們首次將噪音信道模型和決策樹模型用于語句壓縮中,并提出了后來被廣泛使用的評(píng)測指標(biāo):I mportance(重要性)、Gra mmaticality(語法符合度)和Co mpression Ratio(壓縮率)。在其使用的噪音信道模型中,通過最大化目標(biāo)語句的條件概率查找最優(yōu)的目標(biāo)語句。該方法的效果很好,但仍存在一些缺點(diǎn):第一,該模型中用于表示目標(biāo)語句生成概率的原模型,是使用未壓縮的語句訓(xùn)練得到,因此造成了數(shù)據(jù)的不準(zhǔn)確;第二,訓(xùn)練信道模型需要將源語句句法樹與目標(biāo)語句句法樹對齊,由于句法分析器的可靠性等問題會(huì)導(dǎo)致源語句與目標(biāo)語句句法樹中有大量的錯(cuò)誤,這使得句法樹的對齊非常困難,最終導(dǎo)致信道模型概率的可靠性降低。

    Knight和Marcu[4]提出的另一種決策樹模型是通過學(xué)習(xí)源語句的句法樹轉(zhuǎn)換成目標(biāo)語句的句法樹的決策過程。在該過程中定義了四種操作:SHIFT(將當(dāng)前輸入隊(duì)列的隊(duì)首單詞移到棧中)、REDUCE(移除棧首的k個(gè)句法樹,并聯(lián)合生成一個(gè)新的句法樹,并將其重新放入棧中;在這里是用于生成目標(biāo)語句的句法樹)、DROP(從輸入列表中對應(yīng)句法成分的詞的子序列中刪除)、ASSIGNTYPE(修改棧頂句法樹的標(biāo)簽,如詞在源語句中的詞性與在目標(biāo)語句中的詞性不同)。壓縮以一個(gè)空棧和一個(gè)由源語句的句法樹組成的輸入隊(duì)列開始,基于棧中保留的成分與單詞和已經(jīng)生成的部分的目標(biāo)語句的特征,進(jìn)行學(xué)習(xí)什么時(shí)候該使用哪個(gè)操作。該方法避免了噪音信道模型中句法樹對齊帶來的不可靠性,但是,該方法僅使用保留節(jié)點(diǎn)與刪除節(jié)點(diǎn)的句法特征,沒有使用詞與詞性層的二元或三元文法等特征,所以,該模型會(huì)生成短而不符合語法的目標(biāo)語句。

    Mc Donal d[6]抽取了詞、詞性、句法結(jié)構(gòu)信息等特征,使用最大邊緣學(xué)習(xí)算法學(xué)習(xí)每個(gè)特征的權(quán)重,最后查找目標(biāo)語句集中最優(yōu)目標(biāo)語句。Mc Donald的工作取得了非常好的評(píng)測效果。我們對其研究做進(jìn)一步的分析后發(fā)現(xiàn),采用二元文法丟失函數(shù)的效果比采用一元文法的好。

    3 結(jié)構(gòu)化學(xué)習(xí)方法

    對于結(jié)構(gòu)化學(xué)習(xí)的問題,通常可以使用在線學(xué)習(xí)算法解決,如感知器、MIRA(mar gin-inf used relaxed algorith m)、Str uctured SV M 等。本文使用Str uct ured SV M,即支持結(jié)構(gòu)化輸出的支持向量機(jī)學(xué)習(xí)算法[7]。Str uctured SV M支持自定義丟失函數(shù),這也是它對語句壓縮和其他文本生成問題最大的吸引力。

    傳統(tǒng)的SV M是通過學(xué)習(xí)一個(gè)最大超平面將二元或多元分類問題分割開;同樣,對于Str uctured SV M也是通過學(xué)習(xí)一個(gè)最大超平面將正確的結(jié)構(gòu)與其他結(jié)構(gòu)分割開。該學(xué)習(xí)算法的目標(biāo)函數(shù)如式(1):

    其中,ξi是訓(xùn)練語料中的實(shí)例對(xi,y)對應(yīng)的松弛變量,C為常量,y*是實(shí)例xi的標(biāo)準(zhǔn)目標(biāo)語句,l(yi,y*)是預(yù)測目標(biāo)yi與標(biāo)準(zhǔn)結(jié)果y*相比的丟失值。

    訓(xùn)練過程中,主要就是查找目標(biāo)集合中具有較高得分和較大的丟失值的目標(biāo)語句,即查詢以下兩個(gè)函數(shù)任意一個(gè)的最大值:

    其中,下標(biāo)sl ack表明訓(xùn)練過程中重定位松弛變量ξ,mar gin表示訓(xùn)練過程中重定位最大邊緣。對于任意實(shí)例,當(dāng)w特定時(shí),wTf(y*,xi)為定值,所以式(2)可化簡為式(3)形式:

    Tsochantaridis[7]分別使用了這兩種函數(shù)進(jìn)行實(shí)驗(yàn),得到的結(jié)果性能相差并不大。因此在本文實(shí)驗(yàn)中,采用函數(shù)。另外,通過式(3)我們發(fā)現(xiàn)對于查找目標(biāo)函數(shù)的最優(yōu)值,可以通過擴(kuò)展解碼函數(shù)來實(shí)現(xiàn),即在解碼過程中增加丟失函數(shù)值。

    對于目標(biāo)函數(shù)(1)的優(yōu)化問題,Tsochantaridis提出的算法大大降低了時(shí)間復(fù)雜度。該算法在每一輪迭代的過程中僅增加當(dāng)前最大違反規(guī)則的限制條件,即當(dāng)前實(shí)例的解碼空間中與標(biāo)準(zhǔn)目標(biāo)語句相比具有最高的得分與丟失值之和。

    4 基于結(jié)構(gòu)化學(xué)習(xí)的語句壓縮

    本文所采用方法的系統(tǒng)框架如圖2所示。在此,我們將語句壓縮看作是基于特征權(quán)重的最大邊緣訓(xùn)練過程,即結(jié)構(gòu)化學(xué)習(xí)過程。在實(shí)驗(yàn)中我們主要抽取了源語句x轉(zhuǎn)換為目標(biāo)語句y的相關(guān)特征,因此使用f(y,x)表示特征函數(shù)。這樣解碼就是一個(gè)求解線性最優(yōu)問題,如式(4)所示。

    其中,Y是x的解碼空間集,y為解碼空間集中的最優(yōu)目標(biāo)語句,w為特征權(quán)重。

    圖2 基于結(jié)構(gòu)化學(xué)習(xí)的語句壓縮方法框架

    4.1 解碼

    根據(jù)上面的介紹解碼問題是一個(gè)線性規(guī)劃問題。但是對于語句壓縮問題的解碼空間非常大,假設(shè)源語句x有n個(gè)單詞,則它的目標(biāo)語句集有2n個(gè)元素,隨著單詞數(shù)的增加,解碼空間成指數(shù)級(jí)增長;算法1:解碼算法在這樣大的解碼空間中,查找最優(yōu)的目標(biāo),時(shí)間復(fù)雜度非常大,所以本文采用Mc Donald使用的簡化的解碼方法,具體算法如算法1,該算法的時(shí)間復(fù)雜度為O(n3)。在此算法中我們可以通過限定查找過程中變量len(即目標(biāo)語句長度)的上限來限定壓縮率的上限,則算法的時(shí)間復(fù)雜度為O(n2×len)。

    4.2 丟失函數(shù)

    0-1丟失函數(shù)是最簡單的丟失函數(shù),即當(dāng)預(yù)測語句與標(biāo)準(zhǔn)目標(biāo)語句不同時(shí)為1,相同時(shí)為0,但是這種簡單的丟失函數(shù)無法明確表示預(yù)測語句與標(biāo)準(zhǔn)目標(biāo)語句的差異性大小。在實(shí)驗(yàn)中我們分別測試了基于單詞丟失比例以及二元文法丟失比例的丟失函數(shù),結(jié)果表明二元文法丟失具有較好的性能,二元文法丟失函數(shù)在實(shí)驗(yàn)中定義如式(6):

    其中,|B(y)|為語句y的二元文法,Max為求兩個(gè)數(shù)中的最大數(shù)。

    實(shí)驗(yàn)過程中,我們也測試了 Mc Donal d[6]所采用的丟失函數(shù),即以預(yù)測出的語句與標(biāo)準(zhǔn)目標(biāo)語句之間錯(cuò)誤刪除的單詞數(shù)與錯(cuò)誤保留的單詞數(shù)的和為丟失函數(shù)。結(jié)果表明,采用該丟失函數(shù)的效果比采用的二元文法丟失的效果差,因此,在以后的實(shí)驗(yàn)中我們均默認(rèn)使用二元文法丟失函數(shù)。

    4.3 特征集

    由于目前針對語句壓縮還沒有大規(guī)模的人工標(biāo)注語料,所以選擇合適的特征空間非常困難。經(jīng)過反復(fù)的測試與對比,我們最終抽取了詞和句法兩方面的特征(表1)。在以后的工作中我們還將進(jìn)一步對特征空間的選擇進(jìn)行研究。

    4.3.1 詞特征

    實(shí)驗(yàn)中我們主要使用的詞特征有:保留的單詞的詞性二元文法(DT&NN、NN&VBD等)、保留單詞是否為停用詞(Is Stop(t he)=1)、刪除單詞為動(dòng)詞、刪除單詞是否為源語句的中心詞等。

    實(shí)驗(yàn)中我們發(fā)現(xiàn)詞匯級(jí)特征很容易導(dǎo)致數(shù)據(jù)稀疏和過度擬合問題,所以在實(shí)驗(yàn)中很少使用詞匯特征,主要使用詞性級(jí)特征。

    4.3.2 句法特征

    詞特征不包含詞在語句中的特征,如刪除從句中的動(dòng)詞與主謂語動(dòng)詞是不一樣的,因此這些信息起到了重要作用,所以我們提取了詞在句子結(jié)構(gòu)中的相關(guān)特征。

    句法結(jié)構(gòu)是自然語言處理中非常重要的信息,對于語句壓縮句法結(jié)構(gòu)信息有很大的指導(dǎo)性,這也是我們將語句壓縮看做句法樹的剪枝操作的原因。首先加入的是刪除邊的信息(如:NP——PP)指示當(dāng)前節(jié)點(diǎn)被刪除及其父節(jié)點(diǎn)的標(biāo)簽。在通過分析語料后,我們發(fā)現(xiàn)大量的從句以及介詞短語會(huì)被刪除,所以又加入了被刪除的SBAR節(jié)點(diǎn)與其中心詞詞性的聯(lián)合信息(如:SBAR&WP)、被刪除的PP節(jié)點(diǎn)與其中心詞詞性的聯(lián)合信息(如:PP&IN)兩類特征。最后加入了被刪除的節(jié)點(diǎn)與其父節(jié)點(diǎn)的結(jié)構(gòu)框架(如圖1中的實(shí)例:對于PP節(jié)點(diǎn)NP(NP,PP-D))等特征。

    表1 特征表(以圖1為例說明)

    4.4 評(píng)測指標(biāo)

    到目前為止,對于語句壓縮性能的評(píng)價(jià),大都采用人工評(píng)測指標(biāo),還沒有較好的自動(dòng)評(píng)測指標(biāo)。盡管人工評(píng)測具有較準(zhǔn)確、可靠的優(yōu)勢,但也存在以下缺陷:首先,測試語料較大時(shí),人工評(píng)測的工作量很大,測試語料較小時(shí),人工評(píng)測的可信度較小;其次,人工評(píng)測的主觀性較大,不同評(píng)測人員的評(píng)測結(jié)果沒有比較意義。因此,本文提出了兩種自動(dòng)評(píng)測方案,以彌補(bǔ)人工評(píng)測的不足。而本文的實(shí)驗(yàn)結(jié)果最終采用了人工評(píng)測與自動(dòng)評(píng)測結(jié)合的方式進(jìn)行評(píng)測。

    4.4.1 人工評(píng)測指標(biāo)

    在之前的工作中,語句壓縮主要采用以下人工評(píng)測指標(biāo)進(jìn)行評(píng)測:

    ·Importance:壓縮語句保留源語句重要信息度。

    ·Grammaticality:壓縮語句的語法結(jié)構(gòu)。

    通常使用5分制給壓縮后的目標(biāo)語句的Importance和Grammaticality評(píng)分,最后統(tǒng)計(jì)分析。

    4.4.2 自動(dòng)評(píng)測指標(biāo)

    根據(jù)以上語句壓縮的定義可知,語句壓縮的性能主要是需要評(píng)測目標(biāo)語句是否符合語法、保留源語句中重要信息度和壓縮率等。所以,在我們的實(shí)驗(yàn)中又采用了以下的自動(dòng)評(píng)測指標(biāo):

    ·壓縮率:即源語句中單詞在目標(biāo)語句中保留的比例。壓縮率是語句壓縮目前唯一公認(rèn)的自動(dòng)評(píng)測標(biāo)準(zhǔn),具有可對比性。但是,我們不能一味的追求高效的壓縮率,通常壓縮率越低,目標(biāo)語句所包含的信息量會(huì)越少。目前,大多數(shù)的壓縮系統(tǒng)的壓縮率都是在60%左右。在我們的工作中,對壓縮率的要求是達(dá)到人工壓縮的同等水平,然后再追求其他評(píng)測標(biāo)準(zhǔn)較好的效果。

    ·N-Gram文法:即目標(biāo)語句的N-Gram文法值。語言模型是自然語言處理的重要模型,應(yīng)用非常廣泛。在之前的工作中,有的將N-Gram文法值作為語句壓縮的特征,在這里,我們使用N-Gram文法作為評(píng)測語句壓縮的一個(gè)評(píng)測指標(biāo)。由于NGram模型的構(gòu)造需要大量的數(shù)據(jù),所以,我們沒有自己構(gòu)造N-Gram模型,而是使用微軟公司提供的N-Gra m網(wǎng)絡(luò)服務(wù)接口①http://research.microsoft.com/en-us/collaboration/f ocus/cs/web-ngram.aspx。實(shí)驗(yàn)中我們統(tǒng)計(jì)了四元文法值,該項(xiàng)評(píng)測指標(biāo)值越低表明目標(biāo)語句的文法越好。

    ·BLEU(相似度):即目標(biāo)語句與標(biāo)準(zhǔn)目標(biāo)語句的相似程度。BLEU是機(jī)器翻譯中最基本的評(píng)測指標(biāo)。由于我們的語句壓縮僅作單詞刪除操作,所以,可以使用BLEU進(jìn)行評(píng)測。在實(shí)驗(yàn)中,我們使用BLEU進(jìn)行相似度比較,計(jì)算到四元文法,該項(xiàng)指標(biāo)值越大表明目標(biāo)語句與標(biāo)準(zhǔn)目標(biāo)語句越接近,即值越大性能越好。

    在Cohn[8]的工作中還采用了丟失函數(shù)值作為自動(dòng)評(píng)測指標(biāo),本文使用的丟失函數(shù)是基于詞的二元文法丟失,在我們使用BLEU評(píng)測指標(biāo)中已經(jīng)使用了二元文法,所以,在自動(dòng)評(píng)測中不再使用丟失函數(shù)作為評(píng)測指標(biāo)。

    5 實(shí)驗(yàn)

    5.1 實(shí)驗(yàn)設(shè)置

    實(shí)驗(yàn)中,我們使用的是愛丁堡大學(xué)的written平行語料,該語料來自于82個(gè)文件包含了1622組平行語句,且該語料僅進(jìn)行單詞刪除,其中1250組語句用作訓(xùn)練語料,70組語句用作開發(fā)語料,302組語句用作測試語料。根據(jù)前文的介紹,我們首先需要對語料中的源語句集進(jìn)行句法分析,使用的句法分析器是來自于斯坦福大學(xué)的開源工具Stanf or d-Parser②htt p://nlp.stanfor d.edu/soft ware/lex-parser.sht ml。在對平行語料做單詞對齊時(shí),實(shí)驗(yàn)中我們使用的是自己編寫的詞對齊代碼,當(dāng)然也可以使用Giza++、Ber keley Aligner等工具(我們的初步實(shí)驗(yàn)發(fā)現(xiàn),Giza++、Ber keley Aligner工具在做相同語言的單詞對齊時(shí)效果并不是很好)。

    經(jīng)過以上處理后,我們使用SV Mstruct③htt p://download.joachi ms.or g/sv m_str uct/current/sv m_str uct.tar.gz工具學(xué)習(xí)特征權(quán)重,本文在訓(xùn)練過程中,將收斂性ε設(shè)置為10-4。

    5.2 基準(zhǔn)系統(tǒng)

    在實(shí)驗(yàn)中,我們建立了一個(gè)簡單的基于規(guī)則的語句壓縮系統(tǒng)作為基準(zhǔn)系統(tǒng)(Baseline),用于和基于結(jié)構(gòu)化學(xué)習(xí)方法的語句壓縮進(jìn)行效果對比。在這里,我們也是采用在成分句法樹上做剪枝操作,主要用到以下簡單的規(guī)則:(1)對于引用語從句只保留引用語;(2)刪除表示時(shí)間地點(diǎn)等的狀語從句;(3)刪除部分介詞短語;(4)刪除名詞的修飾語(包括定語從句、介詞短語等);(5)刪除插入語等(如表2中實(shí)例,這些實(shí)例都是從測試語料中抽取的)。這些規(guī)則都是我們通過觀察大量語句的實(shí)例得來的,需要說明的是,這些實(shí)例不是來自于本文采用的實(shí)驗(yàn)語料written平行語料,而是來自于TAC2008中的語句,這是為了能夠分析基于規(guī)則系統(tǒng)的規(guī)則是否具有普遍適用性。

    表2 測試語料實(shí)例

    基于規(guī)則的語句壓縮對于特定的領(lǐng)域具有較強(qiáng)的適應(yīng)性,但是它存在很多缺點(diǎn):(1)規(guī)則歸納不方便;(2)規(guī)則的普遍適用性較差;(3)自然語言非常靈活且時(shí)刻在發(fā)展,規(guī)則通常無法適應(yīng)新的語言特征;(4)可歸納的規(guī)則非常多;(5)不同領(lǐng)域?qū)φZ句壓縮要求不同等。

    5.3 實(shí)驗(yàn)結(jié)果分析

    表3和表4分別是我們實(shí)驗(yàn)的人工評(píng)測和自動(dòng)評(píng)測結(jié)果。表中,Baseline表示基準(zhǔn)系統(tǒng)的結(jié)果;Str uct ured SV M表示的是基于結(jié)構(gòu)化學(xué)習(xí)系統(tǒng)的結(jié)果;Golden項(xiàng)表示人工標(biāo)注結(jié)果,即標(biāo)準(zhǔn)結(jié)果。CR表示壓縮率,N-Gram表示4-gra m得分,BLEU表示四元文法相似度。

    表3 人工評(píng)測結(jié)果

    表4 自動(dòng)評(píng)測結(jié)果

    仔細(xì)分析表3和表4的評(píng)測結(jié)果,我們可以發(fā)現(xiàn):

    (1)從表3可知,基于規(guī)則方法的結(jié)果在語法結(jié)構(gòu)方面能夠有較好的效果,原因是規(guī)則由人工制定,大多來自對語句句法結(jié)構(gòu)的人工分析,因此使用規(guī)則基本不會(huì)破壞句子本身的語法結(jié)構(gòu)。

    (2)從表3可知,基于結(jié)構(gòu)化方法的結(jié)果在句法結(jié)構(gòu)上效果較差,但在信息度的保留上具有較好的結(jié)果,優(yōu)于使用規(guī)則的方法。

    (3)從表4的N-Gram項(xiàng)可以看出基于規(guī)則的方法在文法值上有很好的效果,優(yōu)于其他兩個(gè)結(jié)果,甚至比標(biāo)準(zhǔn)結(jié)果還好。這與人工評(píng)測中(表3的Grammaticality項(xiàng))的結(jié)論是一致的。

    (4)從表4的BLEU項(xiàng)可以看到基于結(jié)構(gòu)化方法的相似度值較高,本文認(rèn)為標(biāo)準(zhǔn)目標(biāo)語句保留了源語句的主要信息,則基于結(jié)構(gòu)化方法的相似度評(píng)測較高時(shí),其信息度也較高,這與表3中I mportance指標(biāo)完全一致,所以,BLEU在我們的實(shí)驗(yàn)框架中可以評(píng)測信息的保留度。

    (5)從表3、表4的各項(xiàng)評(píng)測結(jié)果可以發(fā)現(xiàn),基于結(jié)構(gòu)化方法在保持較好壓縮率的情況下能夠保留源語句的主要信息。

    由以上分析可知,在我們的實(shí)驗(yàn)框架下,基于結(jié)構(gòu)化方法相對于規(guī)則方法而言有較優(yōu)的性能。其次,實(shí)驗(yàn)結(jié)果也證明了使用N元文法和BLEU相似度等自動(dòng)評(píng)測指標(biāo),可以有效地對語句壓縮結(jié)果進(jìn)行評(píng)測。

    6 結(jié)論與展望

    本文將語句壓縮看作是基于特征權(quán)重的最大邊緣訓(xùn)練過程,使用基于結(jié)構(gòu)化學(xué)習(xí)的方法來實(shí)現(xiàn)語句壓縮,該方法是在一種最普遍易行的基于單詞刪除的語句壓縮框架下。在該框架下,本文還提出了兩個(gè)自動(dòng)評(píng)測指標(biāo)(BLEU、N-Gram)對結(jié)果進(jìn)行評(píng)測。實(shí)驗(yàn)結(jié)果表明,采用結(jié)構(gòu)化學(xué)習(xí)的方法進(jìn)行語句壓縮,能在保持較好的壓縮率的情況下保留源語句的主要信息,且提出的兩個(gè)評(píng)價(jià)指標(biāo)能夠有效反映語句壓縮性能。

    在我們的工作中,由于使用的特征集合比較小而且也是最簡單的,這限制了語句壓縮性能的提高。在下一步工作中,我們將進(jìn)一步探討語句壓縮的特征工程,同時(shí)也將進(jìn)一步思考更好的自動(dòng)評(píng)測指標(biāo)等。

    [1]Corston-Oliver,Si mon.Text Co mpaction f or Display on Very Small Screens [C]//Pr oceedings of the NAACL Wor kshop on Auto matic Su mmarization.Pittsburgh,PA,2001:89-98.

    [2]Vandeghinste V,Pan Y.Sentence co mpression for auto mated subtitling:a hybrid approach[C]//Marie-Francine Moens,S.S.(Ed.).Text Su mmarization Branches Out:Proceedings of the ACL-04 Wor kshop,Barcelona,Spain,2004:89-95.

    [3]Grefenstette G.Producing Intelligent Telegraphic Text Reduction to Provide an Audio Scanning Service for the Blind[C]//Hovy,E.,&Radev,D.R.(Eds.),Proceedings of the AAAI Sy mposium on Intelligent Text Su mmarization,Stanf ord,CA,USA,1998:111-117.

    [4]Knight K,Marcu D.Summarization beyond sentence extraction:a probabilistic approach to sentence compression[J].Artificial Intelligence,2002,139(1):91-107.

    [5]Riezler S,King T H,Cr ouch R,et al.Statistical sentence condensation using ambiguity packing and stochastic disambiguation methods f or lexical-f unctional grammar[C]//Hu man Language Technology Conference and the 3r d Meeting of the Nort h American Chapter of t he Association f or Co mputational Linguistics,Ed monton,Canada,2003:118-125.

    [6]Mc Donald R. Discri minative sentence compression with soft syntactic constraints[C]//Proceedings of the 11th Conference of the European Chapter of the Association f or Computational Linguistics,Trento,Italy,2006:297-309.

    [7]Tsochantaridis I,Joachi ms T,Hof mann T,et al.Lar ge margin met hods for str uctured and inter dependent output variables[J].Journal of Machine Learning Research,2005,6:1453-1484.

    [8]T Cohn,M Lapata.Sentence Compression as Tree Transduction[J].Jour nal of Artificial Intelligence Research,2009,34:637-674.

    [9]江敏,肖詩斌,王弘蔚,等.一種改進(jìn)的基于《知網(wǎng)》的詞語語義相似度計(jì)算[J].中文信息學(xué)報(bào),2008,22(5):84-89.

    猜你喜歡
    文法評(píng)測語料
    次時(shí)代主機(jī)微軟XSX全方位評(píng)測(下)
    次時(shí)代主機(jī)微軟XSX全方位評(píng)測(上)
    關(guān)于1940 年尼瑪抄寫的《托忒文文法》手抄本
    攻坡新利器,TOKEN VENTOUS評(píng)測
    Similarity measurement method of high-dimensional data based on normalized net lattice subspace①
    Canyon Ultimate CF SLX 8.0 DI2評(píng)測
    中國自行車(2017年1期)2017-04-16 02:54:06
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    A nearest neighbor search algorithm of high-dimensional data based on sequential NPsim matrix①
    文法有道,為作文注入音樂美
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    一级a爱视频在线免费观看| 久久av网站| 狠狠婷婷综合久久久久久88av| 十八禁人妻一区二区| 日韩大片免费观看网站| 人妻人人澡人人爽人人| av在线app专区| 亚洲精品美女久久av网站| 国产精品 国内视频| xxx大片免费视频| 久久精品国产综合久久久| 久久久久久人人人人人| 啦啦啦 在线观看视频| 亚洲国产精品一区二区三区在线| 国产一区亚洲一区在线观看| 超碰成人久久| 国产色婷婷99| a级毛片在线看网站| 亚洲av福利一区| 亚洲av男天堂| 中文字幕av电影在线播放| 性色av一级| 亚洲精华国产精华液的使用体验| 街头女战士在线观看网站| 欧美少妇被猛烈插入视频| 亚洲国产精品成人久久小说| 国产日韩欧美在线精品| 欧美在线一区亚洲| 欧美另类一区| 啦啦啦啦在线视频资源| 岛国毛片在线播放| 国产成人91sexporn| 国产1区2区3区精品| 亚洲精品在线美女| 国产在线免费精品| 国产国语露脸激情在线看| 日本爱情动作片www.在线观看| 久久精品久久久久久久性| 亚洲欧美成人精品一区二区| 波多野结衣一区麻豆| 两个人看的免费小视频| 久久久久久久大尺度免费视频| 男女床上黄色一级片免费看| 免费在线观看黄色视频的| 久久97久久精品| 国产一级毛片在线| 成人亚洲精品一区在线观看| 国产精品亚洲av一区麻豆 | 叶爱在线成人免费视频播放| 自拍欧美九色日韩亚洲蝌蚪91| 日韩欧美精品免费久久| 欧美97在线视频| 久久99一区二区三区| 狂野欧美激情性xxxx| 美国免费a级毛片| 亚洲少妇的诱惑av| 免费高清在线观看日韩| 少妇人妻 视频| 久久 成人 亚洲| 久久久久久久大尺度免费视频| 国产欧美亚洲国产| 99热网站在线观看| 国产在视频线精品| h视频一区二区三区| 国产成人精品久久二区二区91 | 婷婷色av中文字幕| 国产精品一区二区在线观看99| 亚洲欧洲国产日韩| 亚洲国产最新在线播放| 国产精品香港三级国产av潘金莲 | 熟女少妇亚洲综合色aaa.| 美女国产高潮福利片在线看| 宅男免费午夜| 亚洲熟女精品中文字幕| 9191精品国产免费久久| 久久精品熟女亚洲av麻豆精品| 亚洲av日韩在线播放| 成人三级做爰电影| 999精品在线视频| 岛国毛片在线播放| 久久久久国产一级毛片高清牌| av不卡在线播放| 精品国产一区二区三区四区第35| 在线观看免费日韩欧美大片| 在线观看免费高清a一片| 蜜桃国产av成人99| www.av在线官网国产| 超色免费av| 成人国产麻豆网| 国产成人免费观看mmmm| 国产人伦9x9x在线观看| 老司机影院成人| 性色av一级| 日本欧美视频一区| 在线天堂中文资源库| 超色免费av| 日韩精品有码人妻一区| 亚洲欧洲日产国产| www日本在线高清视频| 亚洲国产成人一精品久久久| 国产精品国产av在线观看| 亚洲欧美精品自产自拍| 成人黄色视频免费在线看| 中文精品一卡2卡3卡4更新| 色视频在线一区二区三区| 亚洲欧美一区二区三区国产| 国产深夜福利视频在线观看| av在线老鸭窝| 欧美人与善性xxx| 成年美女黄网站色视频大全免费| 波多野结衣一区麻豆| 欧美另类一区| 婷婷色综合www| 如何舔出高潮| 午夜福利乱码中文字幕| 亚洲成人av在线免费| 青草久久国产| 中文精品一卡2卡3卡4更新| 一二三四中文在线观看免费高清| 国产精品免费视频内射| 高清在线视频一区二区三区| 亚洲,欧美精品.| 大话2 男鬼变身卡| 免费人妻精品一区二区三区视频| 国产精品免费大片| 一级a爱视频在线免费观看| 在线精品无人区一区二区三| 人人妻人人澡人人看| 欧美乱码精品一区二区三区| 1024香蕉在线观看| 亚洲美女视频黄频| 九色亚洲精品在线播放| 国产精品二区激情视频| 亚洲国产欧美在线一区| 999精品在线视频| 波野结衣二区三区在线| 国产精品欧美亚洲77777| 激情视频va一区二区三区| 黄色视频不卡| 大片电影免费在线观看免费| 丝袜在线中文字幕| av.在线天堂| 男女国产视频网站| 亚洲国产欧美日韩在线播放| 国产男女超爽视频在线观看| www.精华液| 妹子高潮喷水视频| 制服丝袜香蕉在线| 国产一区二区 视频在线| 免费黄网站久久成人精品| 男女之事视频高清在线观看 | 成年女人毛片免费观看观看9 | 国产精品蜜桃在线观看| 亚洲国产精品一区二区三区在线| 啦啦啦中文免费视频观看日本| 久久精品国产a三级三级三级| 男女之事视频高清在线观看 | 国产一区二区 视频在线| 国产精品蜜桃在线观看| 午夜福利网站1000一区二区三区| 精品少妇久久久久久888优播| 日韩制服丝袜自拍偷拍| 母亲3免费完整高清在线观看| 国产高清国产精品国产三级| 日日啪夜夜爽| 91aial.com中文字幕在线观看| 嫩草影院入口| 欧美老熟妇乱子伦牲交| 中国三级夫妇交换| 国产无遮挡羞羞视频在线观看| 夫妻性生交免费视频一级片| 一级毛片电影观看| 高清在线视频一区二区三区| 成人手机av| 好男人视频免费观看在线| 国产淫语在线视频| 日韩不卡一区二区三区视频在线| 亚洲五月色婷婷综合| 啦啦啦 在线观看视频| 久久久久视频综合| 午夜精品国产一区二区电影| 男女下面插进去视频免费观看| 综合色丁香网| 精品视频人人做人人爽| 亚洲欧洲国产日韩| 国产亚洲一区二区精品| 永久免费av网站大全| 国产精品女同一区二区软件| 女人高潮潮喷娇喘18禁视频| 麻豆av在线久日| 美女福利国产在线| 宅男免费午夜| 成人三级做爰电影| 人人妻,人人澡人人爽秒播 | 成人国语在线视频| 女的被弄到高潮叫床怎么办| 这个男人来自地球电影免费观看 | 电影成人av| 亚洲,一卡二卡三卡| 亚洲国产毛片av蜜桃av| 欧美日韩福利视频一区二区| 久久人人爽人人片av| 亚洲av日韩精品久久久久久密 | 国产av国产精品国产| 欧美在线黄色| 日本一区二区免费在线视频| 亚洲精品第二区| 免费高清在线观看日韩| 精品少妇久久久久久888优播| 免费少妇av软件| 国产一区二区三区av在线| 日韩免费高清中文字幕av| 深夜精品福利| 男女国产视频网站| 美女午夜性视频免费| 亚洲一卡2卡3卡4卡5卡精品中文| 久久久久网色| 看十八女毛片水多多多| 搡老乐熟女国产| 伊人久久大香线蕉亚洲五| 久久久亚洲精品成人影院| 91精品国产国语对白视频| 80岁老熟妇乱子伦牲交| 各种免费的搞黄视频| 精品国产超薄肉色丝袜足j| 一级毛片黄色毛片免费观看视频| 国产99久久九九免费精品| 精品国产一区二区三区四区第35| 极品人妻少妇av视频| 麻豆乱淫一区二区| 交换朋友夫妻互换小说| 欧美日韩国产mv在线观看视频| 亚洲精品一二三| 最新在线观看一区二区三区 | 天天躁狠狠躁夜夜躁狠狠躁| 亚洲欧美成人综合另类久久久| 欧美中文综合在线视频| 丝袜在线中文字幕| 成人毛片60女人毛片免费| 国产精品 欧美亚洲| 美女国产高潮福利片在线看| 免费黄网站久久成人精品| 国产av精品麻豆| 亚洲国产av影院在线观看| 我要看黄色一级片免费的| 巨乳人妻的诱惑在线观看| 色网站视频免费| 性少妇av在线| 亚洲 欧美一区二区三区| 亚洲美女搞黄在线观看| 精品酒店卫生间| 亚洲av成人精品一二三区| 精品第一国产精品| 在线免费观看不下载黄p国产| 久久久精品免费免费高清| 色精品久久人妻99蜜桃| 国产精品免费大片| 下体分泌物呈黄色| 男人添女人高潮全过程视频| 午夜日本视频在线| 观看美女的网站| 三上悠亚av全集在线观看| 亚洲精品美女久久av网站| av网站在线播放免费| 999久久久国产精品视频| 汤姆久久久久久久影院中文字幕| 欧美日韩精品网址| 高清黄色对白视频在线免费看| 精品少妇内射三级| 一本一本久久a久久精品综合妖精| 可以免费在线观看a视频的电影网站 | 在线亚洲精品国产二区图片欧美| 国产精品成人在线| 免费黄色在线免费观看| 永久免费av网站大全| 亚洲欧美一区二区三区久久| 亚洲av日韩精品久久久久久密 | 欧美日韩国产mv在线观看视频| 国产午夜精品一二区理论片| 日本猛色少妇xxxxx猛交久久| 亚洲av成人不卡在线观看播放网 | 亚洲av中文av极速乱| 国产精品嫩草影院av在线观看| 国产成人精品在线电影| 日日爽夜夜爽网站| 久久鲁丝午夜福利片| 久久午夜综合久久蜜桃| 国产av一区二区精品久久| 成人国语在线视频| 精品亚洲成国产av| 99热网站在线观看| 亚洲少妇的诱惑av| 99久久精品国产亚洲精品| 久久久久久人人人人人| 99香蕉大伊视频| 国产精品一二三区在线看| 欧美精品一区二区大全| 国产精品久久久久久精品电影小说| 天天添夜夜摸| 美女福利国产在线| 日韩熟女老妇一区二区性免费视频| 91老司机精品| 久久av网站| √禁漫天堂资源中文www| tube8黄色片| 亚洲国产av新网站| 熟妇人妻不卡中文字幕| 看非洲黑人一级黄片| 热re99久久精品国产66热6| 亚洲一区二区三区欧美精品| 亚洲精品第二区| 纵有疾风起免费观看全集完整版| 热99国产精品久久久久久7| 90打野战视频偷拍视频| 王馨瑶露胸无遮挡在线观看| 亚洲国产日韩一区二区| 啦啦啦中文免费视频观看日本| 欧美激情 高清一区二区三区| √禁漫天堂资源中文www| 日本欧美视频一区| 中文精品一卡2卡3卡4更新| 国产野战对白在线观看| 久久精品久久久久久噜噜老黄| 亚洲精品国产区一区二| 男人操女人黄网站| 国产一级毛片在线| av福利片在线| 中文字幕亚洲精品专区| 婷婷色综合大香蕉| a 毛片基地| 99国产精品免费福利视频| 亚洲欧洲日产国产| 亚洲精品国产av蜜桃| 免费观看av网站的网址| 午夜日韩欧美国产| 欧美老熟妇乱子伦牲交| 99精品久久久久人妻精品| av卡一久久| 18禁观看日本| av.在线天堂| 国产激情久久老熟女| 国产精品免费视频内射| 日本黄色日本黄色录像| 精品一区二区免费观看| 久久久久精品性色| 精品酒店卫生间| 在线观看三级黄色| 婷婷成人精品国产| 欧美激情极品国产一区二区三区| 十分钟在线观看高清视频www| 久久久久国产精品人妻一区二区| 欧美激情极品国产一区二区三区| 可以免费在线观看a视频的电影网站 | 日韩 欧美 亚洲 中文字幕| 国产精品无大码| 女人爽到高潮嗷嗷叫在线视频| 蜜桃在线观看..| 操出白浆在线播放| 亚洲欧美精品综合一区二区三区| 视频在线观看一区二区三区| 亚洲熟女毛片儿| 亚洲一区二区三区欧美精品| 黄网站色视频无遮挡免费观看| 亚洲精品自拍成人| 国产亚洲一区二区精品| 欧美人与性动交α欧美精品济南到| 婷婷色av中文字幕| 日韩伦理黄色片| 久久久久久久大尺度免费视频| 日本午夜av视频| 飞空精品影院首页| 日韩制服骚丝袜av| 91成人精品电影| 18禁裸乳无遮挡动漫免费视频| 丁香六月天网| 国产一区亚洲一区在线观看| 国产精品香港三级国产av潘金莲 | 亚洲五月色婷婷综合| 婷婷色麻豆天堂久久| 久久人人爽人人片av| 亚洲人成电影观看| 欧美成人精品欧美一级黄| 少妇被粗大猛烈的视频| 女人高潮潮喷娇喘18禁视频| 亚洲国产欧美在线一区| av视频免费观看在线观看| 久久久久精品国产欧美久久久 | 亚洲av综合色区一区| 国产一区二区三区av在线| 国产成人欧美| 国产国语露脸激情在线看| 日韩制服丝袜自拍偷拍| 国产成人欧美在线观看 | 中文天堂在线官网| 97人妻天天添夜夜摸| 一级,二级,三级黄色视频| 久久久久国产精品人妻一区二区| 丰满乱子伦码专区| 人妻 亚洲 视频| 在线观看三级黄色| 热99久久久久精品小说推荐| 两个人看的免费小视频| 大香蕉久久网| 亚洲欧美清纯卡通| 亚洲精品aⅴ在线观看| 亚洲欧美精品综合一区二区三区| 成人手机av| 国产精品久久久久久久久免| 一区二区av电影网| 亚洲第一av免费看| 男女国产视频网站| 人人妻人人爽人人添夜夜欢视频| 91精品国产国语对白视频| 国产高清不卡午夜福利| 欧美 亚洲 国产 日韩一| 中文天堂在线官网| 在线观看www视频免费| 欧美人与性动交α欧美精品济南到| 亚洲专区中文字幕在线 | 亚洲人成网站在线观看播放| 精品一区二区三区av网在线观看 | 成人18禁高潮啪啪吃奶动态图| 欧美老熟妇乱子伦牲交| 成人漫画全彩无遮挡| 在线精品无人区一区二区三| 亚洲婷婷狠狠爱综合网| 国产av码专区亚洲av| 中文乱码字字幕精品一区二区三区| 伊人亚洲综合成人网| 少妇 在线观看| 国产一区二区三区av在线| 久久久久久久国产电影| 久久久久视频综合| 亚洲视频免费观看视频| av在线播放精品| 人人妻人人澡人人爽人人夜夜| 一级毛片我不卡| 大话2 男鬼变身卡| 日韩中文字幕欧美一区二区 | 国产av国产精品国产| 老司机影院毛片| 中文字幕精品免费在线观看视频| 亚洲激情五月婷婷啪啪| 国产精品久久久久久久久免| 桃花免费在线播放| 少妇被粗大的猛进出69影院| 免费观看性生交大片5| 大陆偷拍与自拍| 久久久久网色| 欧美精品一区二区免费开放| www.自偷自拍.com| 中文精品一卡2卡3卡4更新| 国产又色又爽无遮挡免| 免费观看性生交大片5| 大陆偷拍与自拍| 成年人午夜在线观看视频| 日韩大码丰满熟妇| 亚洲专区中文字幕在线 | 亚洲男人天堂网一区| 国产免费视频播放在线视频| 亚洲国产精品一区二区三区在线| 建设人人有责人人尽责人人享有的| 午夜福利网站1000一区二区三区| 一区二区三区四区激情视频| 99精国产麻豆久久婷婷| 亚洲欧美中文字幕日韩二区| 日本av免费视频播放| 乱人伦中国视频| 午夜激情久久久久久久| 国产伦理片在线播放av一区| 99久久99久久久精品蜜桃| 美女脱内裤让男人舔精品视频| 亚洲欧美中文字幕日韩二区| 男人操女人黄网站| 在线观看人妻少妇| 久久久久人妻精品一区果冻| 午夜福利免费观看在线| 老司机深夜福利视频在线观看 | 免费观看av网站的网址| 亚洲欧美激情在线| 精品久久久久久电影网| avwww免费| 搡老乐熟女国产| 亚洲av日韩精品久久久久久密 | a级毛片黄视频| 街头女战士在线观看网站| 99久久人妻综合| 国产成人91sexporn| 欧美黑人精品巨大| 久久 成人 亚洲| 亚洲国产精品一区二区三区在线| 啦啦啦啦在线视频资源| 桃花免费在线播放| 宅男免费午夜| 丝袜美足系列| 男的添女的下面高潮视频| 亚洲精品在线美女| 99久久精品国产亚洲精品| 人妻 亚洲 视频| 校园人妻丝袜中文字幕| 在线天堂最新版资源| 欧美精品亚洲一区二区| 制服诱惑二区| 在线观看一区二区三区激情| 天堂8中文在线网| 国产高清不卡午夜福利| a级毛片黄视频| 18在线观看网站| 久久精品国产a三级三级三级| 亚洲av福利一区| 在线精品无人区一区二区三| 超碰成人久久| 男人操女人黄网站| 国产日韩欧美亚洲二区| 欧美国产精品一级二级三级| 国产成人精品福利久久| 一边摸一边抽搐一进一出视频| 日本午夜av视频| 国产xxxxx性猛交| 丰满迷人的少妇在线观看| 国产精品一区二区在线观看99| 日本欧美国产在线视频| 两性夫妻黄色片| 亚洲图色成人| 精品一区在线观看国产| 岛国毛片在线播放| 国产 精品1| 欧美日韩福利视频一区二区| 久久婷婷青草| 最近中文字幕高清免费大全6| 国产在线免费精品| 国精品久久久久久国模美| 国产不卡av网站在线观看| 亚洲综合色网址| 欧美成人精品欧美一级黄| 久久久久久久久久久久大奶| 欧美日韩av久久| 黄频高清免费视频| 老司机影院成人| 亚洲一码二码三码区别大吗| 亚洲自偷自拍图片 自拍| 肉色欧美久久久久久久蜜桃| 女性被躁到高潮视频| 永久免费av网站大全| 国产黄色视频一区二区在线观看| 丝袜人妻中文字幕| 一边摸一边做爽爽视频免费| 这个男人来自地球电影免费观看 | 久久久亚洲精品成人影院| 麻豆乱淫一区二区| 成人黄色视频免费在线看| 免费黄网站久久成人精品| 十分钟在线观看高清视频www| 国产色婷婷99| av一本久久久久| 免费在线观看完整版高清| 啦啦啦中文免费视频观看日本| 亚洲av日韩精品久久久久久密 | 久久午夜综合久久蜜桃| 人妻一区二区av| 我的亚洲天堂| 精品少妇黑人巨大在线播放| 久久 成人 亚洲| 亚洲第一区二区三区不卡| 悠悠久久av| 午夜久久久在线观看| 精品酒店卫生间| 欧美日韩av久久| 日韩制服骚丝袜av| 午夜福利,免费看| 无限看片的www在线观看| 成人黄色视频免费在线看| 日韩精品免费视频一区二区三区| 嫩草影院入口| av在线观看视频网站免费| 无遮挡黄片免费观看| 国产精品女同一区二区软件| 亚洲一码二码三码区别大吗| 免费黄网站久久成人精品| 中文字幕最新亚洲高清| 亚洲第一区二区三区不卡| 中文字幕制服av| 国产精品欧美亚洲77777| 老司机影院毛片| 久久久久久免费高清国产稀缺| 99久久精品国产亚洲精品| 一级爰片在线观看| 人人妻人人添人人爽欧美一区卜| 国产精品久久久久久人妻精品电影 | 欧美最新免费一区二区三区| 久久久精品区二区三区| 高清av免费在线| 亚洲人成77777在线视频| 亚洲精品在线美女| 国产精品免费大片| 一本久久精品| 男人操女人黄网站| 少妇被粗大的猛进出69影院| 一本大道久久a久久精品| 欧美日韩一级在线毛片| 国产不卡av网站在线观看| 不卡av一区二区三区| 日韩伦理黄色片| a级片在线免费高清观看视频| 超碰成人久久| 亚洲av成人精品一二三区| 人妻一区二区av| 亚洲国产精品成人久久小说| 性少妇av在线| 高清视频免费观看一区二区| 成年人午夜在线观看视频| 日韩一卡2卡3卡4卡2021年| 十八禁网站网址无遮挡| 97精品久久久久久久久久精品| 中国三级夫妇交换|