• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向句法塊向量的句子相似度計(jì)算方法

    2020-12-01 03:15:00高順峰張?jiān)佘S
    軟件導(dǎo)刊 2020年10期

    高順峰 張?jiān)佘S

    摘 要:傳統(tǒng)句子相似度算法沒有全面考慮句子結(jié)構(gòu)與語義特征,影響相似度計(jì)算準(zhǔn)確性,對此提出一種基于句法塊向量的句子相似度計(jì)算方法。該方法綜合考慮句子的語義信息與結(jié)構(gòu)信息,首先構(gòu)建兩句子的語義依存關(guān)系樹,然后進(jìn)行一些被動轉(zhuǎn)換等操作,最后根據(jù)詞向量構(gòu)建各個句法塊向量并通過余弦值計(jì)算句子相似度。在常規(guī)句子對中進(jìn)行測試實(shí)驗(yàn),結(jié)果表明,綜合句子結(jié)構(gòu)與語義信息可提高相似度計(jì)算準(zhǔn)確性。一般句子相似度計(jì)算正確率達(dá)到92%,比傳統(tǒng)方法提高8%~10%。

    關(guān)鍵詞:句子相似度;語義依存樹;詞向量;自然語言處理;句法結(jié)構(gòu)

    DOI:10. 11907/rjdk. 201048

    中圖分類號:TP301文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2020)010-0106-05

    Abstract:Traditional sentence similarity algorithms do not fully consider the structure and semantic characteristics of sentences, which affects the accuracy of similarity calculation. In this regard, a new calculation method for sentence similarity based on syntactic block vectors is proposed. The feature of this method is to comprehensively consider the semantic and structural information of the sentence. It first constructs the semantic dependency tree of the two sentences, then performs some important operations, such as passive conversion, etc., and finally constructs each syntactic block vector and sentence vector based on the word vector sentence similarity is calculated from the cosine value. Tested in regular sentence pairs, the experimental results show that the comprehensiveness of sentence structure and semantic information can improve the accuracy of similarity calculations. For general sentence similarity calculations, the accuracy rate reaches 92%, which is 8% to 10% higher than the traditional method.

    Key Words: sentence similarity; dependency syntax tree; word embedding; natural language processing; syntactic structure

    0 引言

    度量句子之間的相似性是自然語言處理一項(xiàng)基本且重要的任務(wù),廣泛應(yīng)用于信息檢索、文本聚類、問答系統(tǒng)、文本分類、機(jī)器翻譯等。句子相似度計(jì)算是這些任務(wù)中基礎(chǔ)且重要的步驟。近年出現(xiàn)許多句子相似度計(jì)算方法,如基于Word2Vec、GloVe、FastText或其改進(jìn)版本、基于同義詞詞林的句子相似度計(jì)算方法等。Word2Vec、GloVe利用詞向量計(jì)算句子相似度,充分利用句中的相似詞,但沒有考慮句子順序結(jié)構(gòu),這點(diǎn)往往會對一些否定句以及被動句的相似度計(jì)算造成較大影響[1]?;谕x詞詞林的方法利用同義詞詞林編碼以及結(jié)構(gòu)特點(diǎn),同時(shí)考慮詞語的相似性及相關(guān)性,但未包含詞語的語義信息,對相似度計(jì)算有一定影響[2]。

    以上方法各有優(yōu)勢與不足,但均沒有考慮到中文句法成分的特殊性與差異性,沒有充分利用句子的語義信息與結(jié)構(gòu)信息。鑒于此,提出一種基于句法塊向量的句子相似度算法(Sentence Similarity Method Based on Syntax Block Vector,SSSB),更大程度考慮句子的語義特征與結(jié)構(gòu)特征,利用句子語義依存關(guān)系獲取句子的句法塊,通過詞向量構(gòu)造句法塊向量與句子向量,增加被動句轉(zhuǎn)換和否定句判斷,以此提高句子相似度精確性。

    一般中文句子句法成分包括主語、謂語、賓語、定語、補(bǔ)語、狀語等。其中主、謂、賓是句子主干,定、補(bǔ)、狀是句子枝葉。不同的自然語言處理任務(wù)需要的句法成分也不同,比如新聞標(biāo)題更強(qiáng)調(diào)主語、謂語和賓語。一個句子可以沒有主語或主語承前、蒙后省略,一個句子也可以沒有賓語,但一個句子絕不能沒有謂語,沒有謂語的句子就不存在。因此,本文以謂語為中心對句子進(jìn)行分析。利用句子的句法結(jié)構(gòu)和句子向量對句子進(jìn)行相似度計(jì)算。與傳統(tǒng)的Jaccard算法、TF-IDF算法和基于詞向量的句子相似度算法相比具有更高的準(zhǔn)確性。

    1 相關(guān)工作

    1.1 詞向量

    詞是最小和最有意義的語言單位,廣泛應(yīng)用于基于神經(jīng)網(wǎng)絡(luò)的分布式表示,也稱為單詞向量。該方法使用神經(jīng)網(wǎng)絡(luò)模擬目標(biāo)詞與上下文之間的關(guān)系,使其可以代表復(fù)雜的背景。李小濤等[3]提出基于詞向量的詞語間離和句子相似度模型,該方法結(jié)合詞向量與傳統(tǒng)語義解析兩者優(yōu)點(diǎn),在相似度計(jì)算上取得很好效果,但是該方法只注重詞的語義信息而忽略了句子的結(jié)構(gòu)信息。本文在此基礎(chǔ)上引入句子的結(jié)構(gòu)信息和句向量,以提高相似度計(jì)算的準(zhǔn)確性。

    谷歌公司發(fā)布的開源詞向量訓(xùn)練工具 word2vec主要實(shí)現(xiàn)CBOW和skip-gram兩種模型,其中一詞多義問題采用k-means算法解決。skip-gram模型是包含輸入層、隱藏層和輸出層的三層神經(jīng)網(wǎng)絡(luò)模型,由于此模型簡單且訓(xùn)練參數(shù)少,所以其訓(xùn)練效率很高。Word2vec以任意大小的文本集合作為輸入,通過無監(jiān)督訓(xùn)練得到包含所有詞向量的二進(jìn)制文件。之后再利用高維向量作為輸入,把深度學(xué)習(xí)應(yīng)用到NLP的諸多領(lǐng)域中,詞向量本身蘊(yùn)含的語義信息可直接作為詞相似度計(jì)算的依據(jù)。如Mikolov[4]發(fā)現(xiàn)[vec(berlin)-vec(germany)+vec(france)][≈vec(paris)],其中vec表示單詞向量,這表明詞向量之間的相似度也可以表示成詞在語義層面的相似度,本文就是采用word2vec的skip-gram模型構(gòu)造詞向量。

    1.2 語義依存樹

    語句由詞組成,通常包括主語(詞)、謂語(詞)和賓語(詞)3個主要成分,當(dāng)然還可能有其它成分,如定語、補(bǔ)語、狀語和語氣助詞等。作為句子,謂語成分是不可忽略的,因而句子的謂語詞稱為該句子的“核心成分”。詞與詞之間存在一定的關(guān)系,如主、謂之間的“施事關(guān)系(nsubj)”、謂語和賓語之間的“受事關(guān)系(dobj)”等,這些關(guān)系稱為詞與詞之間的依存關(guān)系。隨著統(tǒng)計(jì)自然語言處理的演化,針對語句的語義依存樹廣泛應(yīng)用。語義依存關(guān)系樹最先由法國語言學(xué)家L.Tesniere[5]在1959年提出,主要方法是將句子按照一定規(guī)則分解,分析詞與詞之間的語義依存關(guān)系,并通過樹的形式將詞語之間的依存關(guān)系直觀展現(xiàn)出來。

    如果[S=w1w2wn]是含有[n]個詞的句子,那么[S]的語義依存樹可表示為二元組[TS=(NS, ES)],其中,[NS={w0,w1,wn}]為結(jié)點(diǎn)集,由語句[S]的各個分詞加上引入的根結(jié)點(diǎn)[w0(root)]組成;[ES={e1,e2,,em}]為邊集,每條邊[et=(depk,wi,wj)]為一個三元組,表示語句[S]中的詞[wi,wj]具有依存關(guān)系[depk]。如果[wk]是語句[S]中的核心成分,那么[e1=(Root,w0,wk)]表示[wk]是樹的根節(jié)點(diǎn)。

    語義依存關(guān)系分析是信息論研究領(lǐng)域的重要內(nèi)容之一,其最核心的思想是闡明一個完整句子中各組成部分之間的相互關(guān)系。其中,主成分一般為句子核心詞,通常起著支配其它成分的作用,而修飾成分則被用來描述語境,起修飾作用并受主成分支配。通過語義依存樹,可以得到句子中詞與詞之間的依賴關(guān)系,從而分析出句子的主謂賓結(jié)構(gòu)。目前,構(gòu)建語法依存樹的常用方法是哈工大提出的較為完善的封裝式語義依存樹構(gòu)建方法[6]。

    以語句“一個老人修好了自行車”為例,構(gòu)建其語義依存關(guān)系樹。首先經(jīng)分詞得到結(jié)點(diǎn)集[NS={Root,一,個,老人,] [修好,了,自行車}],其中,“修好”是核心成分,因而有[e1=(Root,root,修好)],“人”和“修好”是施事關(guān)系“nsubj”, 即主語和謂語,所以可定義[e2=(nsubj,人,修好)];“自行車”和“修好”是受事關(guān)系“dobj”,即賓語和謂語,所以可定義[e3=(dobj,修好,自行車)],等等。最終得到語句“一個老人修好了自行車”的語義關(guān)系依存樹如圖1所示。

    利用語句的語義關(guān)系依存樹,很容易得到句子主語、謂語和賓語以及其它成分之間的關(guān)系,為計(jì)算句子相似度帶來極大便利。

    1.3 句子相似度模型

    句子相似度計(jì)算模型較多,如基于距離的相似度算法、基于語義的相似度算法、基于空間向量模型的TF-IDF方法、基于詞向量的Jacard相似度算法和基于字向量的相似度算法等[7]。

    (1)基于距離的相似度算法2001年由張煥炯等[8]提出,該方法建立文本集與碼字集之間的一一對應(yīng)關(guān)系,然后借用編碼理論中漢明距離概念,由漢明距離計(jì)算公式計(jì)算句子相似度。與傳統(tǒng)方法相比,它具有簡便、快速等優(yōu)點(diǎn),但是準(zhǔn)確率相對較差。

    (2)TF-IDF方法[9]是一種句子相似度計(jì)算統(tǒng)計(jì)方法,用來評估一個字詞對一個文件集中的其中一份文件的重要程度,其重要性隨其在文件中出現(xiàn)的次數(shù)增加而增加,但同時(shí)隨著其在語料庫中出現(xiàn)的頻率增加而降低。該方法是以大規(guī)模語料庫為基礎(chǔ)的方法,在信息檢索領(lǐng)域非常流行。其中單詞向量以語料庫中的關(guān)鍵詞確定,關(guān)鍵詞確定是TF-IDF的重要工作,計(jì)算公式如下:

    TF為歸一化后的詞頻,描述詞在文檔中的頻率。其中,[ni,j]是該詞在文件中出現(xiàn)的次數(shù),[knk,j]為文件所有詞數(shù)。IDF為逆文檔頻率,起降低通用詞作用。某一特定詞語的IDF,可由總文件數(shù)和包含該詞語之文件的數(shù)取以10為底的對數(shù)計(jì)算得到。其中[|D|]是語料庫中的文件總數(shù)。[|{j:ti∈dj}|]是包含詞語[ti]的文件數(shù),[dj]為包含詞語[ti]的文件。若該詞語不在語料庫中則會導(dǎo)致分母為零,因此一般情況下使用[|{j:ti∈dj}|+1]。TF-IDF值由TF與IDF的乘積得到。某一特定文件內(nèi)的高頻率詞語,以及該詞語在整個文件集合中的低頻率文件,可以產(chǎn)生高權(quán)重的TF-IDF。因此,TF-IDF更適合過濾掉常見的詞語,保留重要的詞語。TF-IDF在句子相似度的應(yīng)用主要是找出兩個句子的關(guān)鍵詞組,再計(jì)算各關(guān)鍵詞的詞頻并將其向量化,最后通過余弦公式計(jì)算句子的相似度。相似度計(jì)算公式如下:

    其中,[ω(i1≤i≤n)]為關(guān)鍵詞組在[Sx]中出現(xiàn)的次數(shù),[β(i1≤i≤n)]為關(guān)鍵詞組在[Sy]中出現(xiàn)的次數(shù)。該方法只考慮句子的結(jié)構(gòu)信息,沒有考慮句子的語義信息,本文在此基礎(chǔ)上增加句子的語義信息以及句子的被動轉(zhuǎn)換操作,以提高相似度計(jì)算的準(zhǔn)確性。

    (3)句子的語義依存關(guān)系是衡量句子相似度的方法之一, Li等[8]提出一種基于語義的句子相似度計(jì)算方法,該方法通過計(jì)算兩句句子的有效搭配計(jì)算句子相似度,公式如下:

    其中,[W1]表示[Sx]與[Sy]之間詞的有效匹配權(quán)值,[W2]表示[Sx]與[Sy]之間單詞的有效匹配權(quán)值。[PairCount1]是[Sx]到[Sy]的有效詞匹配數(shù),[PairCount2]是[Sy]到[Sx]的有效詞匹配數(shù)。用[W1]與[W2]的和除以[PairCount1]與[PairCount2]的最大值。該方法僅利用詞的句法匹配初步判別兩個句子的相似程度,但不能從整體上考慮句子的句法信息,因此計(jì)算的相似度不全面。SBSS不僅考慮句子的結(jié)構(gòu)信息,還引入句法塊以及詞向量方法,增加句子的句法信息,使相似度計(jì)算更加準(zhǔn)確。

    (4)Jaccard相似度改進(jìn)算法2018年由田星等[10]提出,該方法首先通過訓(xùn)練將每個詞語映射為語義層面的高維向量,然后計(jì)算各個詞向量之間的相似度,高于閾值α的作為共現(xiàn)部分。雖然考慮了句子的語義信息,但缺乏句子的結(jié)構(gòu)信息,也缺乏對句子正否定的判斷,因而影響相似度計(jì)算的準(zhǔn)確性。

    2 句子相似度算法

    傳統(tǒng)的相似度算法[4]缺乏對句子多元信息的綜合考量,如前述的TF-IDF方法只考慮句子的詞頻信息,并未關(guān)注詞義與句子的結(jié)構(gòu)信息,易導(dǎo)致較低的句子相似度準(zhǔn)確度。如Word2vec方法[6]僅僅考慮詞義而忽視句子的結(jié)構(gòu)信息,從而引起句子相似度的偏差計(jì)算。鑒于此,筆者設(shè)計(jì)一種Sentence Similarity Method Based On Syntax Block Vector(SSSB)模型。該模型對詞義與句子的結(jié)構(gòu)信息加以綜合考慮,創(chuàng)新性地引入否定句判斷與被動句轉(zhuǎn)換,增加相似度計(jì)算的精確性。設(shè)計(jì)的SSSB模型不同于傳統(tǒng)的相似度算法,其結(jié)合了詞向量和句子的句法依賴關(guān)系,首先通過句子的句法依賴關(guān)系抽取句子的句法塊,其次利用詞向量構(gòu)造句子的句法塊向量和句向量,進(jìn)而利用所得到的句向量余弦值表示句子的相似度,以提升相似度的準(zhǔn)確性。

    2.1 句法塊概念與模型基本框架

    句法塊是根據(jù)句子的主謂賓區(qū)分的,分為主語塊、謂語塊和賓語塊。設(shè)[S=w1w2wn]是含有[n]個詞的句子,[S]的語義依存樹可表示為二元組[TS=(NS, ES)],其中,[NS={w0,w1,,wn}]為結(jié)點(diǎn)集,由語句[S]的各個分詞加上引入的根結(jié)點(diǎn)[w0](root)組成;[ES={e1,e2,,em}]為邊集,其中每條邊[et=(depk,wi,wj)]為一個三元組,表示語句[S]中的詞[wi,wj]具有依存關(guān)系[depk];[ek]中[depk]值為“nsubj”或 “nsubjpass”時(shí),[ek]中的[wi]為主語;[ek]中[depk]值為“dobj”或“iobj”時(shí),[ek]中的[wi]為謂語;[ek]中[depk]值為“iobj”時(shí),[ek]中的[wj]為賓語。將主謂賓分別表示為[ws]、[wp]、[wo],其中主語[ws∈Su],謂語[wp∈Pr],賓語[wo∈Oc]都表示句子中的一個詞。將主謂賓的修飾詞分別表示為[s_modifier]、[p_modifier]和[o_modifier],主語修飾詞[s_modifier]是[Es]中所有與主語[ws]有依賴關(guān)系的詞;謂語修飾詞[p_modifier]是[Es]中所有與謂語[wp]有依賴關(guān)系的詞;賓語修飾詞[o_modifier]是[Es]中所有與賓語[wo]有依賴關(guān)系的詞;主要的依賴關(guān)系值[depk]如表1所示,主謂賓及主謂賓修飾詞如下:

    主語塊由主語與主語的修飾詞組成,謂語塊由謂語與謂語的修飾詞組成,賓語塊由賓語與賓語的修飾詞組成,那么主語塊、謂語塊和賓語塊可分別表示為[Su={ws}?] [s_modifier],[Pr={wp}?p_modifier],[Ob={wo}?o_modifier],最終得到句子S的句法塊[Sblock=(Su,Pr,Oc)]。

    SSSB模型基本框架分為:①解析部分:解析句子語義依存關(guān)系;②構(gòu)造部分:完成句法塊向量的構(gòu)造;③計(jì)算部分:進(jìn)行句子相似度計(jì)算,其模型結(jié)構(gòu)如圖2所示。

    2.2 SSSB模型計(jì)算過程

    SSSB模型計(jì)算步驟如下:

    (3)被動轉(zhuǎn)換。一般被動句對于主動句而言結(jié)構(gòu)是倒置的,導(dǎo)致某些相似句子被誤判為不相似句,為此增加被動轉(zhuǎn)換步驟,將一般被動句轉(zhuǎn)為主動句形式。中文被動句主要分為標(biāo)志型被動句和無標(biāo)志型被動句[11],本文主要針對標(biāo)志型被動句進(jìn)行被動轉(zhuǎn)換。標(biāo)志型被動句由“被”、“叫”、“教”、“讓”、“給”等5個介詞作為被動標(biāo)志,不妨稱之為“被動詞”。被動語句的一般形式可表示為:

    其中[N1]為主語,[N2]為賓語,其主動句式一般可表示為

    為增加句子相似度計(jì)算的準(zhǔn)確性,對被動形式的句子進(jìn)行被動轉(zhuǎn)換,得到句子的主動形式,本文只檢測一般被動句,對于復(fù)雜被動句暫不考慮。

    首先檢測句子是否存在作為被動標(biāo)志的5個介詞“被”“叫”“教”“讓”“給”,若存在,則對句子進(jìn)行被動轉(zhuǎn)換,互換主語塊與賓語塊。對于一般被動句[S],交換[S]的主語塊與賓語塊,原本[S]的主語塊和賓語塊為[Su={ws}?]? [s_modifier]和[Ob={wo}?o_modifier],被動轉(zhuǎn)換后使[Su={wo}?o_modifier],[Ob={ws}?s_modifier],之后再根據(jù)句法塊和詞向量構(gòu)建句法塊向量。

    (4)構(gòu)建句法塊向量??紤]到句子的語義信息,將句法塊中的詞轉(zhuǎn)為詞向量。句法塊向量由塊中單詞向量的加權(quán)和表示,每個句法塊都有一個核心詞。句法塊向量和詞向量在不同的向量空間中雖然維數(shù)一樣,但不能作比較。句子[S]的句法塊向量計(jì)算公式如下:

    其中,[BVi]表示句子第[i]個句法塊的塊向量,i=1表示主語塊,i=2表示謂語塊,i=3表示賓語塊。[Nxi]表示句子[Sx]中第[i]個句法塊的所有單詞,[wj]表示塊中的第j個單詞,[λj]表示第j個單詞的權(quán)重(離關(guān)鍵詞越近權(quán)重越高,由人工調(diào)試)。[e(wj)]表示第j個單詞的向量。句法塊向量最后將拼接到句子中形成兩個句子的句向量。

    (5)拼接塊向量并計(jì)算句子相似度。拼接塊向量前先判斷塊中是否含有否定詞,如“不” “沒”等。用[αi]表示句法塊中否定詞個數(shù)。句子向量構(gòu)造如下:

    其中,[BV1]、[BV2]、[BV3]分別表示主語塊向量、謂語塊向量、賓語塊向量,[λ1]、[λ2]、[λ3]為負(fù)調(diào)節(jié)因子,根據(jù)句法塊中否定詞數(shù)量取值。

    3 實(shí)驗(yàn)結(jié)果與分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)

    本文相似度實(shí)驗(yàn)數(shù)據(jù)集均來自Tang等[12]提供的chineseSTS數(shù)據(jù)集,數(shù)據(jù)集共有12 747個句子對,由于訓(xùn)練時(shí)間過長,選取5 000對和人工編寫的400對作為實(shí)驗(yàn)數(shù)據(jù),其中相似和不相似句子各占50%。本文詞向量訓(xùn)練數(shù)據(jù)集采用百度百科、維基百科語料。深度學(xué)習(xí)框架使用Word2vec的Skip-grams模型,維度設(shè)置為200維。

    3.2 實(shí)驗(yàn)指標(biāo)評價(jià)

    用準(zhǔn)確性衡量各方法優(yōu)劣,計(jì)算公式如下:

    T:真實(shí)為0,預(yù)測也為0或者真實(shí)為1,預(yù)測為1;

    F:真實(shí)為0,預(yù)測為1或者真實(shí)為1,預(yù)測為0;

    其中,Accuracy為準(zhǔn)確率,最大值為1,最小值為0。

    3.3 對比實(shí)驗(yàn)分析

    將本文模型與傳統(tǒng)的Jaccard算法、基于TF-IDF的算法和基于詞向量的兩種傳統(tǒng)句子相似度算法作對比實(shí)驗(yàn),結(jié)果表明,本文提出的基于詞向量和語義依存的句子相似度方法結(jié)合了句子語義信息與結(jié)構(gòu)信息,計(jì)算效果較好。本文方法與同類方法的準(zhǔn)確率對比結(jié)果如表2所示。

    表2為不同句子相似度算法在數(shù)據(jù)集上的準(zhǔn)確率,表3為不同相似度算法計(jì)算特定例句的得分情況。對比表2與表3,說明本文提出的句子相似度模型具有較高準(zhǔn)確率,特別適用于被動語句的相似度計(jì)算,符合人們對漢語語言的認(rèn)知。

    4 結(jié)語

    本文提出一種基于詞向量和語義依存樹的句子相似度模型,研究了句法塊在句子級語義相似度中的作用及中文被動句的轉(zhuǎn)換等。為在一定程度上保證句子中單詞順序,將構(gòu)造好的句法塊嵌入到句子中,通過計(jì)算句子對向量的夾角余弦值求得相似度值。由于中文句子句法復(fù)雜,不同應(yīng)用所側(cè)重的句法塊不一樣,本文模型未考慮所有的句法成分,也未考慮所有的被動句轉(zhuǎn)換。后續(xù)研究要進(jìn)一步考慮句法結(jié)構(gòu)中的句法要素,增加對無標(biāo)志型被動句的轉(zhuǎn)換,在不同自然語言處理任務(wù)中構(gòu)建句子對的相似度計(jì)算模型。

    參考文獻(xiàn):

    [1] PENNINGTON J,SOCHER R,MANNING C D. Global vectors for word representation[M].? In Emnlp, 2014.

    [2] 李婉婉,張英俊,潘理虎. 基于語義相似度的本體概念更新方法研究[J]. 計(jì)算機(jī)應(yīng)用與軟件,2018,35(4):15 - 20.

    [3] 李小濤,游樹娟,陳維. 一種基于詞義向量模型的詞語語義相似度算法[J]. 自動化學(xué)報(bào),2019,25(6):1-16.

    [4] MIKOLOV T. Statistical language models based on neural networks[R].? Technical report, Google Mountain View ,2012.

    [5] 特斯尼埃. 結(jié)構(gòu)句法基礎(chǔ)[J]. 當(dāng)代語言學(xué)報(bào),1985,33(2):19-21.

    [6] LIU T, CHE W, LI Z. Language technology platform. journal of chinese information processing[J]. Journal of Chinese Information Processing, 2011, 25(6): 53-62.

    [7] 何穎剛,王宇. 一種基于字向量和LSTM的句子相似度計(jì)算方法[J]. 長江大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,16(1):88-94.

    [8] 張煥炯,王國勝,鐘義信. 基于漢明距離的文本相似度計(jì)算[J].? 計(jì)算機(jī)工程與應(yīng)用,2001,28(19):56-61.

    [9] 趙勝輝,李吉月,徐碧,等. 基于TFIDF的社區(qū)問答系統(tǒng)問句相似度改進(jìn)算法[J]. 北京理工大學(xué)學(xué)報(bào),2017,37(9):982-985.

    [10] 田星,鄭瑾,張祖平. 基于詞向量的Jaccard相似度算法[J]. 計(jì)算機(jī)科學(xué),2018,45(7):186-189.

    [11] 張興旺. 現(xiàn)代漢語被動句的界定及其分類[J]. 陰山學(xué)刊,2008,17(1):15-19.

    [12] TANG S C, BAI Y Y, MA F Y. Chinese semantic text similarity trainning dataset[D]. Xian:Xian University of Science and Technology,2016.

    (責(zé)任編輯:杜能鋼)

    成人特级黄色片久久久久久久| 国产精品久久电影中文字幕 | 色精品久久人妻99蜜桃| 亚洲五月婷婷丁香| 日韩有码中文字幕| 女人精品久久久久毛片| 欧美大码av| 中文字幕最新亚洲高清| 好看av亚洲va欧美ⅴa在| 亚洲欧美精品综合一区二区三区| 国产精品综合久久久久久久免费 | 亚洲精品久久成人aⅴ小说| 欧美亚洲日本最大视频资源| 精品一区二区三卡| 老汉色av国产亚洲站长工具| а√天堂www在线а√下载 | 亚洲人成电影免费在线| 在线av久久热| 久久影院123| 超碰成人久久| videos熟女内射| 80岁老熟妇乱子伦牲交| 黄色视频不卡| 精品福利永久在线观看| 电影成人av| 亚洲一区二区三区欧美精品| 久久午夜亚洲精品久久| aaaaa片日本免费| 一本大道久久a久久精品| 一区二区三区精品91| 69精品国产乱码久久久| 久久香蕉激情| 久久精品亚洲av国产电影网| 久久久久视频综合| 精品第一国产精品| 久久国产亚洲av麻豆专区| 久久精品亚洲精品国产色婷小说| 午夜两性在线视频| 国产精品影院久久| 亚洲专区中文字幕在线| 日韩欧美一区视频在线观看| 久久精品人人爽人人爽视色| 一边摸一边抽搐一进一小说 | 久热爱精品视频在线9| ponron亚洲| 国产野战对白在线观看| 欧美日韩视频精品一区| 久久久久久亚洲精品国产蜜桃av| 最近最新中文字幕大全电影3 | 不卡av一区二区三区| 亚洲五月色婷婷综合| 一进一出抽搐gif免费好疼 | 妹子高潮喷水视频| 精品亚洲成国产av| 国产高清激情床上av| 国产精品免费一区二区三区在线 | 高清毛片免费观看视频网站 | 精品久久久久久久毛片微露脸| 国产一区二区三区在线臀色熟女 | 少妇裸体淫交视频免费看高清 | 一区福利在线观看| 90打野战视频偷拍视频| 免费不卡黄色视频| 国产av又大| 国产激情久久老熟女| 欧美 亚洲 国产 日韩一| 黄网站色视频无遮挡免费观看| 涩涩av久久男人的天堂| 黄色视频不卡| 嫁个100分男人电影在线观看| 中文字幕人妻熟女乱码| 18禁黄网站禁片午夜丰满| 十八禁人妻一区二区| 久久这里只有精品19| 国产人伦9x9x在线观看| 亚洲一区中文字幕在线| videos熟女内射| 十八禁网站免费在线| 美女高潮到喷水免费观看| 99国产精品一区二区蜜桃av | 50天的宝宝边吃奶边哭怎么回事| 王馨瑶露胸无遮挡在线观看| 免费观看精品视频网站| 热99re8久久精品国产| 色婷婷av一区二区三区视频| 两个人看的免费小视频| 成人永久免费在线观看视频| 麻豆成人av在线观看| 婷婷成人精品国产| 亚洲 国产 在线| 村上凉子中文字幕在线| 日韩欧美一区视频在线观看| 国产一区二区三区在线臀色熟女 | 老熟女久久久| 精品人妻熟女毛片av久久网站| 亚洲七黄色美女视频| 一边摸一边抽搐一进一小说 | 狂野欧美激情性xxxx| 成人18禁在线播放| 制服人妻中文乱码| 国产视频一区二区在线看| 亚洲欧美精品综合一区二区三区| 国产真人三级小视频在线观看| 人人妻人人爽人人添夜夜欢视频| 久久99一区二区三区| 91国产中文字幕| 欧美黄色淫秽网站| 国产精品欧美亚洲77777| 在线国产一区二区在线| 身体一侧抽搐| 在线观看免费视频网站a站| 亚洲精品美女久久av网站| 国产成人影院久久av| 久久影院123| 亚洲精品中文字幕在线视频| av有码第一页| 中出人妻视频一区二区| 老熟妇乱子伦视频在线观看| 国产主播在线观看一区二区| 亚洲五月婷婷丁香| 国精品久久久久久国模美| 12—13女人毛片做爰片一| 在线天堂中文资源库| 午夜精品久久久久久毛片777| 国产成人免费无遮挡视频| 久久人人97超碰香蕉20202| 亚洲男人天堂网一区| 欧美日韩一级在线毛片| 欧美性长视频在线观看| 国产欧美日韩一区二区三| 中文欧美无线码| 91精品国产国语对白视频| 十八禁高潮呻吟视频| 51午夜福利影视在线观看| 免费久久久久久久精品成人欧美视频| 黑人巨大精品欧美一区二区mp4| 亚洲av美国av| e午夜精品久久久久久久| 欧美 亚洲 国产 日韩一| 80岁老熟妇乱子伦牲交| 日本wwww免费看| 久久精品亚洲精品国产色婷小说| 欧美黄色片欧美黄色片| 性少妇av在线| 水蜜桃什么品种好| 美女高潮到喷水免费观看| 亚洲成国产人片在线观看| 亚洲一区中文字幕在线| 久久香蕉国产精品| 香蕉国产在线看| svipshipincom国产片| 亚洲精品中文字幕在线视频| 狠狠狠狠99中文字幕| 国内久久婷婷六月综合欲色啪| 动漫黄色视频在线观看| 丝袜美腿诱惑在线| 丰满迷人的少妇在线观看| ponron亚洲| 欧美日韩乱码在线| 成人18禁在线播放| 新久久久久国产一级毛片| 啪啪无遮挡十八禁网站| 日日摸夜夜添夜夜添小说| 午夜影院日韩av| 亚洲精华国产精华精| 淫妇啪啪啪对白视频| 丝瓜视频免费看黄片| 日本a在线网址| 黄色丝袜av网址大全| 三上悠亚av全集在线观看| 国产精品av久久久久免费| √禁漫天堂资源中文www| 亚洲欧美精品综合一区二区三区| 99在线人妻在线中文字幕 | 十八禁高潮呻吟视频| 国产成人精品久久二区二区91| 制服人妻中文乱码| 亚洲欧美色中文字幕在线| 黑丝袜美女国产一区| 黄色毛片三级朝国网站| 自线自在国产av| 国产成人精品无人区| 丰满迷人的少妇在线观看| 日韩欧美国产一区二区入口| 色精品久久人妻99蜜桃| 久久精品亚洲精品国产色婷小说| 欧美黑人欧美精品刺激| 国产亚洲欧美98| 一边摸一边抽搐一进一出视频| 日韩欧美三级三区| 精品久久蜜臀av无| 国产视频一区二区在线看| 露出奶头的视频| 国产成人av教育| 窝窝影院91人妻| 成人国产一区最新在线观看| 国产精品自产拍在线观看55亚洲 | 亚洲精品在线观看二区| 久久中文字幕一级| 欧美黄色淫秽网站| 精品电影一区二区在线| 亚洲av日韩在线播放| 91麻豆av在线| 国产高清视频在线播放一区| 十八禁网站免费在线| 亚洲成国产人片在线观看| 黄网站色视频无遮挡免费观看| 精品国产一区二区三区久久久樱花| 欧美精品av麻豆av| 老熟妇仑乱视频hdxx| 18禁美女被吸乳视频| 大片电影免费在线观看免费| 老司机靠b影院| 亚洲中文av在线| 久久性视频一级片| 国产欧美日韩综合在线一区二区| 日韩免费高清中文字幕av| 欧美黄色片欧美黄色片| 亚洲人成伊人成综合网2020| 精品国产超薄肉色丝袜足j| 欧美黑人欧美精品刺激| 午夜精品久久久久久毛片777| 欧美激情久久久久久爽电影 | 国产成人精品久久二区二区免费| 好男人电影高清在线观看| a级毛片在线看网站| av天堂久久9| 亚洲成人免费av在线播放| 性色av乱码一区二区三区2| 一级片'在线观看视频| 老司机靠b影院| 一区福利在线观看| 亚洲精品国产精品久久久不卡| 视频区图区小说| 一二三四在线观看免费中文在| 亚洲成人国产一区在线观看| 别揉我奶头~嗯~啊~动态视频| 一级毛片精品| 99国产极品粉嫩在线观看| 亚洲性夜色夜夜综合| 狂野欧美激情性xxxx| 每晚都被弄得嗷嗷叫到高潮| 露出奶头的视频| av一本久久久久| 亚洲三区欧美一区| 免费女性裸体啪啪无遮挡网站| 欧美日韩亚洲国产一区二区在线观看 | 日韩有码中文字幕| 757午夜福利合集在线观看| 欧美黑人欧美精品刺激| aaaaa片日本免费| 亚洲自偷自拍图片 自拍| 成年动漫av网址| 亚洲av欧美aⅴ国产| 亚洲av片天天在线观看| 午夜福利视频在线观看免费| 18禁美女被吸乳视频| 色尼玛亚洲综合影院| 亚洲中文字幕日韩| 欧美老熟妇乱子伦牲交| 美女 人体艺术 gogo| 搡老熟女国产l中国老女人| av中文乱码字幕在线| 大陆偷拍与自拍| 视频区图区小说| 亚洲一区二区三区不卡视频| 国产av一区二区精品久久| 亚洲五月婷婷丁香| 丝袜美足系列| 黄片小视频在线播放| 制服诱惑二区| 欧美 亚洲 国产 日韩一| 精品视频人人做人人爽| a在线观看视频网站| 99国产精品一区二区三区| 国产高清激情床上av| 香蕉国产在线看| 精品福利观看| 男女床上黄色一级片免费看| aaaaa片日本免费| 亚洲午夜精品一区,二区,三区| 久久香蕉国产精品| 熟女少妇亚洲综合色aaa.| 亚洲欧美精品综合一区二区三区| videosex国产| 欧美精品av麻豆av| 亚洲专区中文字幕在线| 大型av网站在线播放| 国产精品永久免费网站| 中文字幕制服av| 国产黄色免费在线视频| 成年人午夜在线观看视频| 女性生殖器流出的白浆| 国产成人啪精品午夜网站| 亚洲成人免费av在线播放| 母亲3免费完整高清在线观看| 搡老乐熟女国产| 在线观看免费高清a一片| 巨乳人妻的诱惑在线观看| 久久久久久久久久久久大奶| 中文字幕高清在线视频| 91字幕亚洲| 狠狠狠狠99中文字幕| 久久久久精品国产欧美久久久| 国产精品综合久久久久久久免费 | 搡老熟女国产l中国老女人| 免费少妇av软件| 中亚洲国语对白在线视频| 首页视频小说图片口味搜索| 好男人电影高清在线观看| 51午夜福利影视在线观看| 国产精品一区二区在线不卡| av天堂在线播放| 日韩有码中文字幕| 一边摸一边抽搐一进一出视频| 免费在线观看完整版高清| 国产色视频综合| 在线国产一区二区在线| 久久亚洲精品不卡| 在线观看免费午夜福利视频| 女性被躁到高潮视频| 新久久久久国产一级毛片| 日韩有码中文字幕| 9热在线视频观看99| 日韩欧美三级三区| 十分钟在线观看高清视频www| 嫩草影视91久久| 男女免费视频国产| 亚洲精品av麻豆狂野| 国产真人三级小视频在线观看| 久久久久久亚洲精品国产蜜桃av| 超碰97精品在线观看| 叶爱在线成人免费视频播放| 国产区一区二久久| 好男人电影高清在线观看| 国产成人精品久久二区二区91| 黑人欧美特级aaaaaa片| 无遮挡黄片免费观看| 精品一区二区三区四区五区乱码| 国产精品99久久99久久久不卡| 人妻一区二区av| 免费不卡黄色视频| 无限看片的www在线观看| 99精国产麻豆久久婷婷| 最新美女视频免费是黄的| av中文乱码字幕在线| 精品国产一区二区久久| 女性被躁到高潮视频| 精品人妻熟女毛片av久久网站| 精品久久蜜臀av无| 一a级毛片在线观看| 男人操女人黄网站| 国产精品国产高清国产av | svipshipincom国产片| 纯流量卡能插随身wifi吗| 51午夜福利影视在线观看| 91大片在线观看| 欧美午夜高清在线| 99热网站在线观看| 999精品在线视频| 国产av又大| 女性被躁到高潮视频| 亚洲精品美女久久av网站| 老司机午夜福利在线观看视频| 无遮挡黄片免费观看| 久久午夜亚洲精品久久| 国产精品一区二区精品视频观看| 丝袜人妻中文字幕| av不卡在线播放| 男女床上黄色一级片免费看| 亚洲色图综合在线观看| 精品视频人人做人人爽| 很黄的视频免费| 欧美日韩av久久| 久久久久久久久久久久大奶| 国产免费男女视频| videosex国产| 色播在线永久视频| 亚洲成av片中文字幕在线观看| 成人三级做爰电影| 免费黄频网站在线观看国产| 免费观看a级毛片全部| 久久久久国产精品人妻aⅴ院 | 精品少妇久久久久久888优播| 91成人精品电影| 高清毛片免费观看视频网站 | 窝窝影院91人妻| 天天影视国产精品| 亚洲一区二区三区欧美精品| 天堂俺去俺来也www色官网| 极品教师在线免费播放| 免费观看精品视频网站| 19禁男女啪啪无遮挡网站| 欧洲精品卡2卡3卡4卡5卡区| 国产在线一区二区三区精| 久久精品成人免费网站| 日韩中文字幕欧美一区二区| 丝袜人妻中文字幕| 老司机靠b影院| 一进一出抽搐动态| 亚洲伊人色综图| 久久精品成人免费网站| 欧美性长视频在线观看| 国产精品自产拍在线观看55亚洲 | 久久久久精品国产欧美久久久| 久久天堂一区二区三区四区| 久久人妻av系列| 欧美黄色片欧美黄色片| 日日爽夜夜爽网站| 99国产综合亚洲精品| 老司机深夜福利视频在线观看| 免费女性裸体啪啪无遮挡网站| 欧美最黄视频在线播放免费 | 亚洲精品美女久久av网站| 啦啦啦视频在线资源免费观看| 国产三级黄色录像| 日日摸夜夜添夜夜添小说| 欧美午夜高清在线| 亚洲 欧美一区二区三区| 亚洲精品国产精品久久久不卡| 亚洲欧洲精品一区二区精品久久久| 免费在线观看完整版高清| 成年女人毛片免费观看观看9 | 天天操日日干夜夜撸| 50天的宝宝边吃奶边哭怎么回事| 久久久久精品人妻al黑| 亚洲精品乱久久久久久| 亚洲伊人色综图| 嫁个100分男人电影在线观看| 手机成人av网站| 久久久水蜜桃国产精品网| 欧美另类亚洲清纯唯美| 欧美黄色片欧美黄色片| 精品第一国产精品| 久久亚洲精品不卡| 欧美大码av| 在线视频色国产色| 欧美日韩一级在线毛片| 国产男靠女视频免费网站| 黄片大片在线免费观看| 亚洲熟女毛片儿| 国产欧美日韩一区二区精品| 国产亚洲一区二区精品| 男女免费视频国产| 黄网站色视频无遮挡免费观看| 啪啪无遮挡十八禁网站| 国产麻豆69| 91字幕亚洲| 首页视频小说图片口味搜索| 成人国产一区最新在线观看| 女人被狂操c到高潮| 91字幕亚洲| 一级片免费观看大全| 国产97色在线日韩免费| 国产精品免费视频内射| 青草久久国产| 一二三四在线观看免费中文在| 51午夜福利影视在线观看| 看免费av毛片| 91av网站免费观看| 人妻丰满熟妇av一区二区三区 | 天堂中文最新版在线下载| 中文字幕最新亚洲高清| av视频免费观看在线观看| 黑人欧美特级aaaaaa片| 亚洲成人国产一区在线观看| 一区二区三区国产精品乱码| 老司机影院毛片| 真人做人爱边吃奶动态| 中文字幕人妻丝袜制服| 久久精品国产综合久久久| 久久久久久久精品吃奶| 高清欧美精品videossex| av网站免费在线观看视频| 热re99久久国产66热| 最近最新中文字幕大全免费视频| 日日夜夜操网爽| 亚洲精品美女久久av网站| 国产亚洲精品一区二区www | 成年人午夜在线观看视频| 成在线人永久免费视频| 国产精品免费视频内射| 久久香蕉国产精品| 色婷婷久久久亚洲欧美| 桃红色精品国产亚洲av| 999久久久精品免费观看国产| 精品久久久久久电影网| 成人国产一区最新在线观看| 国产激情久久老熟女| 亚洲男人天堂网一区| 丰满迷人的少妇在线观看| 国产精品一区二区在线观看99| 国产99久久九九免费精品| av中文乱码字幕在线| 美女 人体艺术 gogo| 999精品在线视频| 国产亚洲欧美98| 丰满的人妻完整版| 亚洲欧洲精品一区二区精品久久久| av有码第一页| 高潮久久久久久久久久久不卡| 亚洲人成77777在线视频| 亚洲一区中文字幕在线| 国产精品 国内视频| 国产成人欧美| av福利片在线| 精品一区二区三卡| 婷婷丁香在线五月| 捣出白浆h1v1| 老司机亚洲免费影院| 91av网站免费观看| 动漫黄色视频在线观看| 大香蕉久久成人网| 美女视频免费永久观看网站| 久久精品国产99精品国产亚洲性色 | 亚洲精品中文字幕在线视频| 国产精华一区二区三区| 免费黄频网站在线观看国产| 国产单亲对白刺激| 亚洲精品成人av观看孕妇| 亚洲一卡2卡3卡4卡5卡精品中文| 999精品在线视频| 久久久久视频综合| 在线视频色国产色| 国产单亲对白刺激| 亚洲熟妇中文字幕五十中出 | 亚洲avbb在线观看| 飞空精品影院首页| 99热网站在线观看| 男女午夜视频在线观看| 国产aⅴ精品一区二区三区波| 午夜福利乱码中文字幕| 国产精品秋霞免费鲁丝片| 两个人免费观看高清视频| av一本久久久久| 一级a爱片免费观看的视频| 欧美成人免费av一区二区三区 | 村上凉子中文字幕在线| 国产aⅴ精品一区二区三区波| 热99久久久久精品小说推荐| 亚洲欧美一区二区三区久久| 大陆偷拍与自拍| 人人妻人人添人人爽欧美一区卜| 男女之事视频高清在线观看| 老司机深夜福利视频在线观看| 欧美激情高清一区二区三区| 在线观看舔阴道视频| 国产精品香港三级国产av潘金莲| 亚洲在线自拍视频| 一本一本久久a久久精品综合妖精| 日日夜夜操网爽| 国产精品二区激情视频| 免费av中文字幕在线| 欧美在线黄色| 老司机福利观看| 国产一区二区三区综合在线观看| 欧洲精品卡2卡3卡4卡5卡区| 搡老岳熟女国产| 国产成人av激情在线播放| 99在线人妻在线中文字幕 | 精品久久久久久久毛片微露脸| 99精品在免费线老司机午夜| 夜夜爽天天搞| 下体分泌物呈黄色| 亚洲七黄色美女视频| 亚洲色图av天堂| 亚洲国产看品久久| 精品国内亚洲2022精品成人 | 精品人妻在线不人妻| av网站在线播放免费| www.999成人在线观看| 热99国产精品久久久久久7| 最近最新中文字幕大全免费视频| 精品电影一区二区在线| 成人影院久久| 人妻一区二区av| 成年人午夜在线观看视频| 国产成人av教育| 久久久国产欧美日韩av| 免费在线观看日本一区| 欧美精品人与动牲交sv欧美| 亚洲欧美激情在线| 18禁裸乳无遮挡动漫免费视频| 亚洲精品美女久久av网站| 丁香六月欧美| 一边摸一边抽搐一进一小说 | 日韩大码丰满熟妇| 村上凉子中文字幕在线| 成人国语在线视频| 午夜免费观看网址| 亚洲va日本ⅴa欧美va伊人久久| 国产精品 国内视频| 涩涩av久久男人的天堂| av网站在线播放免费| 99在线人妻在线中文字幕 | 俄罗斯特黄特色一大片| 又紧又爽又黄一区二区| 性少妇av在线| 18禁国产床啪视频网站| 久久热在线av| 高清黄色对白视频在线免费看| 亚洲va日本ⅴa欧美va伊人久久| 51午夜福利影视在线观看| 国产精品综合久久久久久久免费 | 中文字幕精品免费在线观看视频| 久热这里只有精品99| 欧美日韩亚洲国产一区二区在线观看 | 下体分泌物呈黄色| 亚洲人成伊人成综合网2020| 亚洲成av片中文字幕在线观看| 美女国产高潮福利片在线看| 日韩人妻精品一区2区三区| 日韩制服丝袜自拍偷拍| 免费av中文字幕在线| 亚洲男人天堂网一区|