• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    主題聯(lián)合詞向量模型

    2018-03-02 09:22:58吳旭康楊旭光陳園園王營(yíng)冠張閱川
    計(jì)算機(jī)工程 2018年2期
    關(guān)鍵詞:文檔語(yǔ)境向量

    吳旭康,楊旭光,陳園園,王營(yíng)冠,張閱川

    (1.中國(guó)科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海 200050;2.上海科技大學(xué) 信息科學(xué)與技術(shù)學(xué)院,上海 201210; 3.上海物聯(lián)網(wǎng)有限公司,上海 200018)

    0 概述

    詞向量[1-2]是用數(shù)學(xué)形式的向量來(lái)表達(dá)單詞,可用于自然語(yǔ)言處理任務(wù)中的很多方面,比如命名實(shí)體識(shí)別、句子成分分析[3]、單詞相似度計(jì)算等。因此,詞向量的研究得到了越來(lái)越多的關(guān)注。

    當(dāng)前,大部分的詞向量模型通常使用一個(gè)向量來(lái)表示一個(gè)單詞,忽視了單詞的多義性,從而削弱了詞向量對(duì)單詞語(yǔ)義表達(dá)的唯一性。為了解決這樣的問(wèn)題,多向量模型被提出[4-5],該模型通過(guò)對(duì)同一個(gè)單詞的不同上下文語(yǔ)境(context)進(jìn)行聚類,針對(duì)每一個(gè)類簇生成一個(gè)詞向量,然而,由于該方法過(guò)于笨拙和繁瑣,于是,另一些基于神經(jīng)語(yǔ)言模型[6-8]的詞向量模型被提出,這類模型通過(guò)構(gòu)造不同的神經(jīng)網(wǎng)絡(luò),使用隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)或者EM(Expectation Maximum)算法得到最終的模型參數(shù),進(jìn)而得到詞向量。

    然而,即使采用多向量模型,在生成多個(gè)詞向量的過(guò)程中也存在一個(gè)較大缺陷——這些多向量模型認(rèn)為同一個(gè)單詞的不同上下文語(yǔ)境是獨(dú)立的,不具有相關(guān)性。事實(shí)上,即使是不同的上下文語(yǔ)境,仍然可以有語(yǔ)義(Semantic)上的相似或者重疊。例如,在英語(yǔ)中,單詞“l(fā)ike”在句子“I like that girl”和句子“She is my like”中,兩者表達(dá)了幾乎一致的信息,卻完全是2種上下文語(yǔ)境。因此,把不同的語(yǔ)境完全的隔離開(kāi)并不是完美可行的方案。于是,TWE模型被提出,結(jié)合單詞的主題信息,得到更具表達(dá)性的詞向量[9],但該模型簡(jiǎn)單地將單詞和主題向量連接作為最終的詞向量,在向量表達(dá)性上不夠突出。緊接著,基于主題單詞嵌入(Topical Word Embedding,TWE)模型改進(jìn)的單詞主題混合(Word-Topic Mixture,WTM)模型[10]利用潛特征狄利克雷特分布(Latent-Feature Latent Dirichlet Allocation,LFLDA)方法,計(jì)算出TWE生成的單詞-主題向量的概率分布,并通過(guò)假設(shè)該概率分布與狄利克雷特分布(Latent Dirichlet Allocation,LDA)得到的單詞-主題概率分布一致,從而得到性能更好的詞向量。然而,WTM模型需要最小化上述2個(gè)概率分布的KL散度,計(jì)算較為繁瑣。

    本文提出一種更加有效和靈活的多向量模型——主體聯(lián)合詞向量模型(Topic Combined Word Vector Model,TCV Model)。該模型的主要思想與WTM模型類似,利用單詞所屬的主題信息來(lái)表達(dá)單詞的上下文語(yǔ)境。不同于WTM模型,該模型利用哈夫曼編碼為每一個(gè)單詞構(gòu)建一個(gè)初始向量作為神經(jīng)網(wǎng)絡(luò)的輸入,神經(jīng)網(wǎng)絡(luò)訓(xùn)練后得到每一個(gè)單詞及其主題對(duì)應(yīng)的向量。TCV模型對(duì)生成的單詞向量和主題向量進(jìn)行歸一化和線性組合,將其作為該主題下單詞的詞向量,并考慮將具有最大概率的一個(gè)或2個(gè)主題作為該單詞的有效上下文,避免WTM模型中最小化KL散度的復(fù)雜計(jì)算。

    1 模型描述

    1.1 LDA 模型

    作為非監(jiān)督型主題模型,LDA模型可以從一系列文檔中,找到指定數(shù)目的主題[11]。該模型是一個(gè)詞袋子(Bag of Word,BOW)模型[12-13],文本中每個(gè)詞的出現(xiàn)都是獨(dú)立的,不依賴于其他詞是否出現(xiàn)。在LDA模型中,假設(shè):1)文檔蘊(yùn)含多個(gè)主題,主題數(shù)量適當(dāng);2)這是一個(gè)有生成過(guò)程的概率模型,并假設(shè)每一個(gè)文檔都是被生成的。

    文檔的生成過(guò)程為:1)隨機(jī)選擇一個(gè)主題分布;2)對(duì)文檔里的每一個(gè)單詞,首先隨機(jī)從主題分布中選擇一個(gè)主題,然后從相應(yīng)的主題中隨機(jī)選擇一個(gè)單詞;3)一個(gè)主題是在一個(gè)固定詞庫(kù)上的分布,并且,所有的主題被假定為先于文檔生成。4)搜尋的主題個(gè)數(shù)需要預(yù)先指定LDA模型的框圖如圖1所示,假設(shè)語(yǔ)料庫(kù)中有M個(gè)文檔和K個(gè)主題。其中,α和β是Dirichlet分布的超參數(shù),zm,n是文檔m中的第n個(gè)單詞的主題,wm,n是第m個(gè)文檔中第n個(gè)單詞,M是文檔的總數(shù)目,Nm是第m個(gè)文檔中單詞總數(shù)目,θm和Φk均為向量,θm表示第m個(gè)文檔中主題z的概率分布Pr(z|m),向量的每一列表示每個(gè)主題在文檔中出現(xiàn)的概率,Φk表示在主題k下單詞的概率分布Pr(w|zk),向量的每一列表示在主題zk下生成每個(gè)單詞的概率。

    圖1 LDA模型框圖

    參數(shù)為α的Dirichlet分布如下:

    (1)

    (2)

    其中,Γ()是Gamma分布,xi表示詞庫(kù)中被觀察到的單詞i的概率。Dirichlet分布是多項(xiàng)分布的共軛先驗(yàn)分布。

    LDA模型的具體實(shí)施過(guò)程如下:通過(guò)對(duì)參數(shù)為α的Dirichlet分布取樣生成文檔m的主題分布θm,接著從主題的多項(xiàng)分布θm取樣生成文檔m的第n個(gè)單詞的主題zm,n,并從參數(shù)為β的Dirichlet分布取樣生成主題zm,n的單詞分布Φz(mì)m,n,最后從單詞的多項(xiàng)分布Φz(mì)m,n中取樣最終生成的單詞wm,n。如此循環(huán)直到所有的文檔都被生成。

    通過(guò)LDA模型計(jì)算,每一個(gè)單詞將會(huì)被賦予具有一定概率的主題標(biāo)簽,同時(shí)每一個(gè)主題都能通過(guò)概率排序找到最接近該主題含義的單詞。如表1所示,在4個(gè)主題下各自最接近的5個(gè)單詞(主題的名字是在觀測(cè)完對(duì)應(yīng)的單詞分布后人為添加的)。

    表1 LDA模型不同主題下的單詞

    1.2 Skip-Gram模型

    在谷歌正式推出詞向量工具Word2Vec之后,Skip-Gram模型成為一個(gè)用于生成詞向量的熱門簡(jiǎn)化版神經(jīng)語(yǔ)言模型[11]。Skip-Gram模型的目標(biāo)在于預(yù)測(cè)給定單詞的上下文單詞。其神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

    圖2 Skip-Gram模型

    神經(jīng)網(wǎng)絡(luò)的輸入是一個(gè)通過(guò)哈夫曼樹(shù)構(gòu)造的初始詞向量。哈夫曼樹(shù)的節(jié)點(diǎn)權(quán)值由詞頻(Word frequency)決定。給定一個(gè)單詞序列W={w1,w2,…,wN},該模型的目標(biāo)函數(shù)是最大化平均對(duì)數(shù)概率,如下:

    (3)

    其中,c表示范圍為k的單詞的上下文,N表示訓(xùn)練單詞的個(gè)數(shù)。為了計(jì)算Pr(wi+c|wi),引入了Softmax函數(shù):

    (4)

    層次Softmax模型主要的優(yōu)勢(shì)在于將計(jì)算的節(jié)點(diǎn)數(shù)從原來(lái)的W個(gè)下降至lbW個(gè)。該模型使用二叉樹(shù)的方式呈現(xiàn)輸出層,即將W個(gè)單詞作為W顆樹(shù)的葉子節(jié)點(diǎn),每棵樹(shù)的任一節(jié)點(diǎn)的分支代表一次二分類過(guò)程。這個(gè)處理過(guò)程,實(shí)際上是通過(guò)隨機(jī)行走的方式為每一個(gè)單詞賦予一個(gè)概率。

    詳細(xì)來(lái)說(shuō),每一個(gè)單詞wd都可以找到一條從根節(jié)點(diǎn)出發(fā)的路徑。令nd(wd,j)表示從根節(jié)點(diǎn)到單詞wd的路徑上的第j個(gè)節(jié)點(diǎn),令L(wd)代表該路徑的長(zhǎng)度,即nd(wd,L(wd))=wd。更進(jìn)一步,令child(nd)代表節(jié)點(diǎn)nd的任一固定子節(jié)點(diǎn),運(yùn)算符[]的含義是,如果x為真,那么[x]為1,x為否,則[x]為-1。那么,層次Softmax函數(shù)可以表達(dá)為:

    (5)

    chk(wd,j)=[nd(wd,j+1)=child(nd(wd,j))]

    (6)

    1.3 主題聯(lián)合詞向量模型

    主題聯(lián)合詞向量模型依賴于每個(gè)單詞的主題信息。因此,首先通過(guò)LDA模型獲取主題并對(duì)單詞wi標(biāo)記一定數(shù)量的主題zi∈Ts。在主題標(biāo)記完成后,每個(gè)單詞將會(huì)有2個(gè)id,分別是單詞id和主題id。接著,對(duì)語(yǔ)料庫(kù)中的每一個(gè)單詞構(gòu)建哈夫曼樹(shù),并進(jìn)行編碼,作為Skip-Gram模型的初始單詞輸入,同時(shí),為其對(duì)應(yīng)的主題id隨機(jī)生成主題編碼,作為Skip-Gram模型的初始主題輸入。主題聯(lián)合詞向量模型如圖3所示。對(duì)一個(gè)單詞wi及其對(duì)應(yīng)的主題z={z1,z2,…,zj,…,zN},該模型的目標(biāo)函數(shù)是最大化平均對(duì)數(shù)概率:

    (7)

    圖3 TCV模型

    當(dāng)該模型訓(xùn)練完成后就得到單詞向量wi和主題向量zi。為計(jì)算的簡(jiǎn)便,本模型要求單詞向量和主題向量擁有同樣的維度,比如,wi=W1×200,zi=Z1×200。

    為了將主題信息應(yīng)用于單詞,從而構(gòu)建更具表達(dá)性的詞向量,該模型首先對(duì)主題向量進(jìn)行歸一化:

    (8)

    然后,對(duì)兩者施加一個(gè)線性變換,得到最后的詞向量Wz:

    Wz=Norm(zi)(Normal(wi)⊕Normal(zi))

    (9)

    其中,Norm(zi)是主題向量zi的二范數(shù),⊕表示將2個(gè)長(zhǎng)度分別為x,y的向量合并成長(zhǎng)度為x+y的向量。這里對(duì)主題向量進(jìn)行歸一化的原因是相比于單詞向量,主題向量各個(gè)元素的值過(guò)小(主題向量在0.01~0.2的范圍,單詞向量在0.1~0.9的范圍)。同時(shí),對(duì)詞向量做歸一化,并將兩者連接成一個(gè)向量,然后用各個(gè)元素乘以主題向量的模,這個(gè)操作可以在一定程度上讓主題向量和單詞向量趨向統(tǒng)一,更好地結(jié)合兩者的信息。

    根據(jù)最終得到的詞向量Wz,主題聯(lián)合詞向量模型即可用于單詞相似度測(cè)試,不同于傳統(tǒng)的單詞相似度檢測(cè),該測(cè)試需要基于單詞上下文。給定一個(gè)單詞wi及其上下文ci,LDA模型可以根據(jù)[8,14]進(jìn)行主題概率分布的推斷,即Pr(z|wi,ci)=Pr(z|ci)Pr(wi|z)。因此,每一個(gè)單詞將會(huì)被標(biāo)記多個(gè)主題。一個(gè)很直接的上下文詞向量如下:

    (10)

    其含義是在模型得到的所有可能的主題中,將每個(gè)主題的概率作為權(quán)重,進(jìn)行加權(quán)求和,得到最終的上下文詞向量。然而,對(duì)于一個(gè)給定上下文語(yǔ)境的單詞,其語(yǔ)義信息大致是明確的,不會(huì)包含太多主題。因此,主題聯(lián)合詞向量模型接受t個(gè)具有最大概率的主題作為單詞的主題候選,其余主題作為噪聲處理。那么,新的上下文詞向量表達(dá)為:

    (11)

    其中,σWz被定義為噪聲項(xiàng),σ為噪聲系數(shù),為了計(jì)算的簡(jiǎn)便,噪聲系數(shù)在這里被設(shè)定為0??紤]一個(gè)具有10個(gè)主題的單詞,它唯一可能出現(xiàn)的場(chǎng)景就是字典。在一個(gè)現(xiàn)實(shí)的語(yǔ)境中,人們總會(huì)將該單詞限定在某幾種語(yǔ)義之下。10種主題的情況是不可能出現(xiàn)的。因此,本文設(shè)定t的最大值為2。

    那么,給定一對(duì)單詞及其對(duì)應(yīng)的上下文(wi,ci)、(wj,cj),本模型采用余弦相似度[15]計(jì)算其詞向量相似度,如下:

    (12)

    結(jié)合式(11)和式(12),根據(jù)AVGSimC公式[4]計(jì)算上下文詞向量的相似度S,如下:

    (13)

    2 實(shí)驗(yàn)結(jié)果

    在本節(jié)中,分別從上下文單詞相似度、文本分類2個(gè)自然語(yǔ)言處理任務(wù)進(jìn)行實(shí)驗(yàn),對(duì)比評(píng)估多種相關(guān)模型的性能。

    2.1 數(shù)據(jù)集

    2.1.1 單詞相似度實(shí)驗(yàn)

    傳統(tǒng)的單詞相似度實(shí)驗(yàn),通常選用WordSim353、MC、RG等數(shù)據(jù)集作為實(shí)驗(yàn)對(duì)象,但是,這些數(shù)據(jù)集都忽略了單詞的上下文,不適合本文的單詞相似度實(shí)驗(yàn)。因此,在本文中采用上下文單詞相似度檢測(cè)數(shù)據(jù)集SCWS,該數(shù)據(jù)集中包含2003對(duì)單詞,每一對(duì)單詞都有各自的上下文,同時(shí),每一對(duì)單詞都有10個(gè)人為標(biāo)記的對(duì)兩個(gè)單詞相似度的打分,打分原則是依靠人對(duì)每一個(gè)單詞在該上下文下的語(yǔ)義的理解打出一個(gè)0~10之間的分?jǐn)?shù)。本文對(duì)這10個(gè)打分取截尾平均數(shù)作為最終的參考打分。由于余弦相似度可以為負(fù)值,這與人為的打分(均為正值)不一致,因此本文將使用以下公式,將模型得到的打分結(jié)果xi轉(zhuǎn)化為正值。

    (14)

    其中,min和max是模型輸出的所有相似度結(jié)果的最大值和最小值。并且,考慮到模型計(jì)算得到的相似度數(shù)值與人為打分?jǐn)?shù)值差異較大,本文采用斯皮爾曼相關(guān)系數(shù)作為最終模型打分與人為打分的接近程度。

    本文使用維基百科在2010年4月的數(shù)據(jù)作為訓(xùn)練庫(kù)。由于訓(xùn)練庫(kù)數(shù)據(jù)巨大(訓(xùn)練數(shù)據(jù)有465萬(wàn)個(gè)文檔),需要進(jìn)行一些必要的預(yù)處理過(guò)程,例如格式化,停用詞(stop word),詞干提取(stemming)。該實(shí)驗(yàn)中將LDA模型的主題數(shù)目設(shè)置為200,迭代次數(shù)設(shè)置為100。當(dāng)開(kāi)始訓(xùn)練主題聯(lián)合詞向量模型時(shí),默認(rèn)窗口大小設(shè)置為5,單詞向量與主題向量維度均設(shè)置為200。整個(gè)實(shí)驗(yàn)過(guò)程在一臺(tái)Inteli7處理器、64 GB內(nèi)存的工作站上進(jìn)行,操作系統(tǒng)為Ubuntu 14.04,訓(xùn)練時(shí)間為15 d。

    本文將TCV模型與C&W模型、TFIDF/Pruned TFIDF(S/M)模型[4]、經(jīng)典多向量模型(例如Huang模型等)[6,8]、LDA模型、Skip-Gram模型進(jìn)行比較。其中,C&W模型和詞頻逆文檔頻(Term Frequency Inverse Document Frequency,TFIDF)模型都是單向量模型,前者不考慮任何的上下文信息,后者將單詞前后的10個(gè)單詞作為上下文并以TFIDF作為權(quán)重因子。Pruned TFIDF模型也是一個(gè)單向量模型,它通過(guò)精簡(jiǎn)TFIDF的單詞數(shù)量,將上下文中具有較低TDIDF值的單詞去除從而提高了性能。經(jīng)典多向量模型通過(guò)對(duì)不同上下文的聚類或者結(jié)合一個(gè)神經(jīng)語(yǔ)言模型來(lái)得到最終的向量。

    2.1.2 文本分類實(shí)驗(yàn)

    本文進(jìn)行文本分類實(shí)驗(yàn)采用的數(shù)據(jù)集是20NewsGroups。該數(shù)據(jù)集中有數(shù)千個(gè)標(biāo)記了主題的文檔。本文使用其中60%的數(shù)據(jù)作為訓(xùn)練集,剩余數(shù)據(jù)作為測(cè)試集。為了能夠提取文檔的特征,本文引入文檔向量:

    (15)

    其中,d是一個(gè)擁有一定數(shù)量主題的文檔,w是文檔中的單詞。為簡(jiǎn)化單詞w出現(xiàn)在文檔d中的概率Pr(w|d),使用簡(jiǎn)單高效的單詞的TFIDF權(quán)重作為Pr(w|d)。文檔特征即為所有詞向量的加權(quán)求和。當(dāng)文檔特征提取之后,使用線性支持向量分類器(Support Vector Classifier,SVC)得到最終的分類結(jié)果。在這個(gè)實(shí)驗(yàn)中,將TCV模型與BOW模型、LDA模型、Skip-Gram模型和WTM模型進(jìn)行比較。在BOW模型中,依然使用TFIDF作為權(quán)重。LDA模型則使用推斷的主題分布來(lái)表示文檔。在Skip-Gram模型中,為每個(gè)單詞生成向量之后,將所有的單詞向量按元素求平均,以此作為該文檔的文檔向量。WTM模型的所有參數(shù)參照文獻(xiàn)[10]說(shuō)明進(jìn)行設(shè)置。

    2.2 結(jié)果分析

    單詞相似度實(shí)驗(yàn)結(jié)果如表2、表3所示,其中,斯皮爾曼相關(guān)系數(shù)ρ越大,代表模型對(duì)相似度計(jì)算的結(jié)果越好。相似度比較結(jié)果被分成了2組——單向量組和多向量組。從實(shí)驗(yàn)結(jié)果中可以看到,在相似度檢測(cè)實(shí)驗(yàn)中,主題聯(lián)合的詞向量模型的結(jié)果優(yōu)于所有的單向量模型和多向量模型,特別是當(dāng)t=1的時(shí)候,達(dá)到了66.9%。

    表2SCWS數(shù)據(jù)集上單模型向量斯皮爾曼相關(guān)系數(shù)%

    表3SCWS數(shù)據(jù)集上多模型向量斯皮爾曼相關(guān)系數(shù)%

    文本分類實(shí)驗(yàn)結(jié)果如表4所示,結(jié)果顯示TCV模型在精度、召回率、F1綜合指標(biāo)中都優(yōu)越于傳統(tǒng)模型和WTM模型。

    表4 文本分類實(shí)驗(yàn)結(jié)果 %

    本文所提出的主題聯(lián)合詞向量模型,在單詞向量的基礎(chǔ)上融入具有最大概率的主題信息,可以更好地表達(dá)單詞。相比于其他模型,本文模型有3個(gè)顯著的優(yōu)點(diǎn):1)傳統(tǒng)的多向量模型,對(duì)一個(gè)單詞,只能生成有限數(shù)量的詞向量,然而本模型卻可以提取數(shù)百個(gè)主題,針對(duì)不同的主題,生成數(shù)百個(gè)詞向量,在單詞的呈現(xiàn)上更加靈活。2)傳統(tǒng)的多向量模型通過(guò)對(duì)上下文聚類來(lái)生成不同的向量,卻忽視不同上下文之間的語(yǔ)義交疊,而本文所提出的模型,通過(guò)依賴主題信息來(lái)生成向量,各個(gè)主題信息之間,本身就有一定程度的語(yǔ)義交疊,因此,本模型可以彌補(bǔ)將不同的上下文完全隔離的缺陷。3)WTM模型需要最小化KL散度,計(jì)算較為繁瑣,而本模型通過(guò)選取概率最大的一個(gè)或2個(gè)主題作為單詞的主題,簡(jiǎn)化了計(jì)算。

    3 結(jié)束語(yǔ)

    本文提出一種新的詞向量生成模型——主題聯(lián)合詞向量模型,能夠?yàn)樘囟ㄉ舷挛恼Z(yǔ)境下的單詞表達(dá)以主題為特征的語(yǔ)義。相比傳統(tǒng)的對(duì)單詞上下文進(jìn)行聚類的多向量模型,主題聯(lián)合詞向量模型可以結(jié)合大量的主題信息來(lái)構(gòu)建基于上下文的詞向量,使得生成的詞向量蘊(yùn)含特定主題。實(shí)驗(yàn)結(jié)果表明,該模型在多語(yǔ)境場(chǎng)景中具有較好的魯棒性。由于綜合了多個(gè)其他模型,后期需要對(duì)該模型進(jìn)行精簡(jiǎn),以提升整體運(yùn)行速度。

    [1] TURIAN J,RATINOV L,BENGIO Y.Word Representa-tions:A Simple and General Method for Semi-supervised Learning[C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics.Uppsala,Sweden:[s.n.],2010:384-394.

    [2] 馮 沖,石 戈,郭宇航,等.基于詞向量語(yǔ)義分類的微博實(shí)體鏈接方法[J].自動(dòng)化學(xué)報(bào),2016,42(6):915-922.

    [3] WANG Yiou,JUN’ICHI K Y T,TSURUOKA Y,et al.Improving Chinese Word Segmentation and POS Tagging with Semi-supervised Methods Using Large Auto-analyzed Data[C]//Proceedings of IJCNLP’11.New York,USA:[s.n.],2011:309-317.

    [4] 李 華,屈 丹,張文林,等.結(jié)合全局詞向量特征的循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型[J].信號(hào)處理,2016,32(6):715-723.

    [5] REISINGER J,MOONEY R J.Multi-prototype Vector-space Models of Word Meaning[C]//Proceedings of Human Language Technologies:The 2010 Annual Conference of the North American Chapter of the Association for Computational Linguistics.New York,USA:ACM Press,2010:109-117.

    [6] HUANG E H,SOCHER R,MANNING C D,et al.Improving Word Representations via Global Context and Multiple Word Prototypes[C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics:Long Papers-Volume 1.New York,USA:ACM Press,2012:873-882.

    [7] BENGIO Y,DUCHARME R,VINCENT P,et al.A Neural Probabilistic Language Model[J].Journal of Machine Learning Research,2003,3:1137-1155.

    [8] TIAN Fei,DAI Hanjun,BIAN Jiang,et al.A Probabilistic Model for Learning Multi-prototype Word Embeddings[C]//Proceedings of COLING’14.New York,USA:[s.n.],2014:151-160.

    [9] LIU Yang,LIU Zhiyuan,CHUA T S,et al.Topical Word Embeddings[C]//Proceedings of the 29th AAAI Conference on Artificial Intelligence.Austin,USA:[s.n.],2015:2418-2424.

    [10] FU Xianghua,WANG Ting,LI Jing,et al.Improving Distributed Word Representation and Topic Model by Word-topic Mixture Model[C]//Proceedings of the 8th Asian Conference on Machine Learning.Hamilton,New Zealand:[s.n.],2016:190-205.

    [11] MIKOLOV T,SUTSKEVER I,CHEN Kai,et al.Distributed Representations of Words and Phrases and Their Compositionality[C]//Proceedings of Advances in Neural Information Processing Systems.New York,USA:[s.n.],2013:3111-3119.

    [12] GUTHRIE D,ALLISON B,LIU Wei,et al.A Closer Look at Skip-Gram Modelling[C]//Proceedings of the 5th International Conference on Language Resources and Evaluation.Genoa,Italy:[s.n.],2006:1222-1225.

    [13] WALLACH H M.Topic Modeling:Beyond Bag-of-words[C]//Proceedings of the 23rd International Conference on Machine Learning,New York,USA:ACM Press,2006:977-984.

    [14] BLEI D M,NG A Y,JORDAN M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3:993-1022.

    [15] TATA S,PATEL J M.Estimating the Selectivity of TF-IDF Based Cosine Similarity Predicates[J].ACM Sigmod Record,2007,36(2):7-12.

    猜你喜歡
    文檔語(yǔ)境向量
    向量的分解
    有人一聲不吭向你扔了個(gè)文檔
    聚焦“向量與三角”創(chuàng)新題
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    向量垂直在解析幾何中的應(yīng)用
    語(yǔ)言學(xué)習(xí)中語(yǔ)境化的輸入與輸出
    向量五種“變身” 玩轉(zhuǎn)圓錐曲線
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    跟蹤導(dǎo)練(三)2
    論幽默語(yǔ)境中的預(yù)設(shè)觸發(fā)語(yǔ)
    国产一区在线观看成人免费| 午夜亚洲福利在线播放| 国产主播在线观看一区二区| 日韩人妻高清精品专区| 国产精品1区2区在线观看.| 亚洲欧美日韩东京热| 99精品在免费线老司机午夜| 亚洲精品456在线播放app | 99视频精品全部免费 在线| 亚洲专区国产一区二区| 亚洲国产高清在线一区二区三| 久久精品国产综合久久久| 99久久精品一区二区三区| 国产激情欧美一区二区| 日韩欧美在线二视频| 欧美一级毛片孕妇| 99久久精品国产亚洲精品| 亚洲国产色片| 久久久久九九精品影院| 欧美黑人巨大hd| 最近最新中文字幕大全免费视频| 在线观看美女被高潮喷水网站 | 好男人电影高清在线观看| 国产精品综合久久久久久久免费| 一级黄色大片毛片| 99久久九九国产精品国产免费| 757午夜福利合集在线观看| 伊人久久精品亚洲午夜| 欧美乱色亚洲激情| 亚洲一区二区三区不卡视频| 久久久久免费精品人妻一区二区| 午夜视频国产福利| 波多野结衣巨乳人妻| 精品一区二区三区av网在线观看| 国产成人av激情在线播放| 亚洲av成人精品一区久久| 真实男女啪啪啪动态图| 国产在线精品亚洲第一网站| 黑人欧美特级aaaaaa片| 国产精品永久免费网站| 丝袜美腿在线中文| 中国美女看黄片| 久久久久久大精品| 极品教师在线免费播放| 国产亚洲精品av在线| 精品熟女少妇八av免费久了| 一本久久中文字幕| 99riav亚洲国产免费| 一边摸一边抽搐一进一小说| 精品久久久久久久末码| 日韩av在线大香蕉| 日日干狠狠操夜夜爽| 午夜福利在线观看吧| 女人十人毛片免费观看3o分钟| 搡老妇女老女人老熟妇| 黄色视频,在线免费观看| 亚洲国产欧美人成| 五月玫瑰六月丁香| 亚洲精品色激情综合| 九九热线精品视视频播放| 少妇裸体淫交视频免费看高清| 51午夜福利影视在线观看| 嫩草影院入口| 日韩欧美精品免费久久 | 欧美zozozo另类| 两个人视频免费观看高清| 69av精品久久久久久| 欧美性感艳星| 制服丝袜大香蕉在线| 制服丝袜大香蕉在线| 91在线精品国自产拍蜜月 | 亚洲欧美日韩东京热| 欧美激情久久久久久爽电影| 国产精品国产高清国产av| 老司机深夜福利视频在线观看| 99国产精品一区二区三区| 99久久九九国产精品国产免费| av福利片在线观看| 国产午夜福利久久久久久| 1000部很黄的大片| 男女午夜视频在线观看| 日韩 欧美 亚洲 中文字幕| 亚洲激情在线av| 亚洲精品色激情综合| 91麻豆精品激情在线观看国产| 久久精品影院6| 成人午夜高清在线视频| 国产伦人伦偷精品视频| 51午夜福利影视在线观看| 一区二区三区免费毛片| 99riav亚洲国产免费| 精品熟女少妇八av免费久了| 成年免费大片在线观看| 99久久精品国产亚洲精品| 亚洲精品乱码久久久v下载方式 | 一a级毛片在线观看| 国产精品,欧美在线| 五月玫瑰六月丁香| 久久久久久大精品| 免费人成视频x8x8入口观看| 亚洲精品久久国产高清桃花| 午夜精品在线福利| 国产成人欧美在线观看| 女警被强在线播放| 国内精品久久久久久久电影| 欧美黄色淫秽网站| 欧洲精品卡2卡3卡4卡5卡区| 看免费av毛片| 中文资源天堂在线| 欧美激情久久久久久爽电影| 中文亚洲av片在线观看爽| 午夜福利高清视频| 亚洲乱码一区二区免费版| 男女下面进入的视频免费午夜| 宅男免费午夜| 天堂√8在线中文| 国产精品精品国产色婷婷| 亚洲精品久久国产高清桃花| 十八禁人妻一区二区| bbb黄色大片| 国产亚洲欧美98| 色av中文字幕| 亚洲在线观看片| 中文字幕高清在线视频| 欧美高清成人免费视频www| 国产精品1区2区在线观看.| 一区二区三区激情视频| 久久欧美精品欧美久久欧美| 亚洲成人中文字幕在线播放| 热99在线观看视频| www.999成人在线观看| 90打野战视频偷拍视频| 老鸭窝网址在线观看| 欧美色视频一区免费| 精品熟女少妇八av免费久了| 欧美丝袜亚洲另类 | av国产免费在线观看| 免费电影在线观看免费观看| 99在线人妻在线中文字幕| 中文字幕熟女人妻在线| 91久久精品国产一区二区成人 | 精品久久久久久久久久免费视频| 色综合婷婷激情| 日韩国内少妇激情av| 国产午夜福利久久久久久| avwww免费| 女生性感内裤真人,穿戴方法视频| av在线天堂中文字幕| 老鸭窝网址在线观看| 久久久国产成人免费| 一卡2卡三卡四卡精品乱码亚洲| 男女那种视频在线观看| 少妇的逼水好多| 三级男女做爰猛烈吃奶摸视频| 在线观看av片永久免费下载| 3wmmmm亚洲av在线观看| 国产av不卡久久| 日日干狠狠操夜夜爽| 久久久国产成人免费| 亚洲第一电影网av| 国产欧美日韩精品一区二区| 岛国在线观看网站| 悠悠久久av| 亚洲av免费在线观看| 日本a在线网址| 真人一进一出gif抽搐免费| 在线看三级毛片| 亚洲在线观看片| 亚洲无线观看免费| 成人特级黄色片久久久久久久| 午夜免费成人在线视频| 岛国视频午夜一区免费看| 欧美性感艳星| 国产欧美日韩一区二区精品| 桃色一区二区三区在线观看| 国产色爽女视频免费观看| 亚洲成av人片在线播放无| av天堂中文字幕网| 国产精品影院久久| 99精品欧美一区二区三区四区| 18禁美女被吸乳视频| 亚洲欧美日韩高清专用| 日本三级黄在线观看| 看黄色毛片网站| 亚洲中文字幕日韩| 日韩 欧美 亚洲 中文字幕| a级毛片a级免费在线| 欧美zozozo另类| 在线免费观看不下载黄p国产 | 麻豆国产97在线/欧美| 久久久国产成人免费| 成人欧美大片| 亚洲精品亚洲一区二区| 有码 亚洲区| 夜夜夜夜夜久久久久| 亚洲va日本ⅴa欧美va伊人久久| 美女免费视频网站| 男女之事视频高清在线观看| 亚洲成人久久爱视频| 亚洲精品乱码久久久v下载方式 | 美女高潮喷水抽搐中文字幕| 露出奶头的视频| 最后的刺客免费高清国语| 久久草成人影院| 中文字幕高清在线视频| 夜夜看夜夜爽夜夜摸| 亚洲片人在线观看| 国产精品爽爽va在线观看网站| 亚洲精品影视一区二区三区av| 久久草成人影院| 美女被艹到高潮喷水动态| 一二三四社区在线视频社区8| 免费无遮挡裸体视频| 99国产极品粉嫩在线观看| 一二三四社区在线视频社区8| 午夜福利视频1000在线观看| 亚洲精品乱码久久久v下载方式 | 免费看美女性在线毛片视频| 久9热在线精品视频| 欧美中文综合在线视频| 伊人久久精品亚洲午夜| 亚洲精品一区av在线观看| 亚洲国产欧洲综合997久久,| 在线观看午夜福利视频| 国产精品久久久久久久久免 | 国产亚洲欧美98| 一级毛片高清免费大全| 成人特级黄色片久久久久久久| www日本黄色视频网| 亚洲狠狠婷婷综合久久图片| 男插女下体视频免费在线播放| 亚洲欧美精品综合久久99| 丁香六月欧美| 国产一区二区三区视频了| 国产伦精品一区二区三区视频9 | 欧美3d第一页| 国产av麻豆久久久久久久| 国产免费一级a男人的天堂| 在线免费观看的www视频| 最近最新中文字幕大全免费视频| 欧美丝袜亚洲另类 | 俄罗斯特黄特色一大片| aaaaa片日本免费| 丁香六月欧美| 91久久精品电影网| 99在线人妻在线中文字幕| 禁无遮挡网站| 黑人欧美特级aaaaaa片| 日韩精品中文字幕看吧| 淫妇啪啪啪对白视频| 国产私拍福利视频在线观看| 亚洲精华国产精华精| 亚洲avbb在线观看| 欧美日韩瑟瑟在线播放| 无遮挡黄片免费观看| 噜噜噜噜噜久久久久久91| 桃红色精品国产亚洲av| 天堂影院成人在线观看| 国产精品98久久久久久宅男小说| 色噜噜av男人的天堂激情| 午夜亚洲福利在线播放| 一本久久中文字幕| 国产又黄又爽又无遮挡在线| 成人国产综合亚洲| 一区福利在线观看| 午夜老司机福利剧场| 欧美中文日本在线观看视频| 午夜免费男女啪啪视频观看 | av天堂在线播放| 国产一区二区三区在线臀色熟女| 国产日本99.免费观看| 久久久久久久久中文| 日本黄色视频三级网站网址| 88av欧美| 久久久久国内视频| 亚洲人成网站高清观看| 国产免费一级a男人的天堂| 少妇的逼好多水| 欧美色视频一区免费| 午夜视频国产福利| 12—13女人毛片做爰片一| 十八禁网站免费在线| 成年人黄色毛片网站| 亚洲av中文字字幕乱码综合| 又粗又爽又猛毛片免费看| 一个人免费在线观看的高清视频| 男人和女人高潮做爰伦理| 一级毛片女人18水好多| 国产精品综合久久久久久久免费| 亚洲av成人av| 欧美色视频一区免费| 色综合婷婷激情| 亚洲精品在线观看二区| 香蕉丝袜av| www国产在线视频色| 熟女电影av网| 国产不卡一卡二| 中亚洲国语对白在线视频| 一本精品99久久精品77| 国内精品美女久久久久久| 有码 亚洲区| 97超级碰碰碰精品色视频在线观看| 一本综合久久免费| 18禁黄网站禁片免费观看直播| 国产精品久久久久久人妻精品电影| 国产精品久久电影中文字幕| h日本视频在线播放| 男女床上黄色一级片免费看| 成人性生交大片免费视频hd| netflix在线观看网站| 国产午夜精品久久久久久一区二区三区 | 亚洲一区高清亚洲精品| 成人永久免费在线观看视频| 亚洲国产高清在线一区二区三| 岛国视频午夜一区免费看| 国产精品嫩草影院av在线观看 | 成人三级黄色视频| 免费人成视频x8x8入口观看| 亚洲av成人精品一区久久| 悠悠久久av| 超碰av人人做人人爽久久 | 欧美三级亚洲精品| 长腿黑丝高跟| 亚洲人成伊人成综合网2020| 亚洲国产日韩欧美精品在线观看 | 欧美黄色淫秽网站| 国产乱人伦免费视频| 久久中文看片网| 亚洲成人久久爱视频| 在线观看舔阴道视频| 美女大奶头视频| 岛国在线免费视频观看| 色尼玛亚洲综合影院| 欧美日韩黄片免| 亚洲中文字幕一区二区三区有码在线看| 丰满人妻一区二区三区视频av | 国产色爽女视频免费观看| 天天一区二区日本电影三级| 久久久久久九九精品二区国产| 美女高潮喷水抽搐中文字幕| 亚洲在线观看片| 99久久久亚洲精品蜜臀av| 极品教师在线免费播放| 欧美成人免费av一区二区三区| 国产精品亚洲一级av第二区| 久久久久久国产a免费观看| 老司机午夜福利在线观看视频| 日本成人三级电影网站| 黄片小视频在线播放| 51国产日韩欧美| 欧美日本视频| 啦啦啦免费观看视频1| 欧美成人a在线观看| 久久国产精品人妻蜜桃| 国内少妇人妻偷人精品xxx网站| 久久久国产精品麻豆| 色综合欧美亚洲国产小说| 三级男女做爰猛烈吃奶摸视频| 波多野结衣高清作品| 亚洲人成伊人成综合网2020| 无限看片的www在线观看| 国产伦精品一区二区三区视频9 | 精品久久久久久成人av| 国产极品精品免费视频能看的| 国产精品精品国产色婷婷| 国产精品久久电影中文字幕| 成年女人看的毛片在线观看| 亚洲精品国产精品久久久不卡| 成年免费大片在线观看| 精品不卡国产一区二区三区| 琪琪午夜伦伦电影理论片6080| 国产单亲对白刺激| 小说图片视频综合网站| 亚洲内射少妇av| 亚洲一区高清亚洲精品| 亚洲 欧美 日韩 在线 免费| 午夜福利免费观看在线| 校园春色视频在线观看| 国产老妇女一区| 淫秽高清视频在线观看| svipshipincom国产片| 老汉色∧v一级毛片| 精品免费久久久久久久清纯| 天堂影院成人在线观看| 一进一出抽搐gif免费好疼| 精品久久久久久久毛片微露脸| 蜜桃久久精品国产亚洲av| 好男人电影高清在线观看| 久久久久久久精品吃奶| 久久久久久久亚洲中文字幕 | 亚洲精品一区av在线观看| 69av精品久久久久久| 免费观看精品视频网站| 美女大奶头视频| 国产成人影院久久av| 真人做人爱边吃奶动态| 人人妻人人澡欧美一区二区| 一区二区三区免费毛片| 成人精品一区二区免费| 国产精品香港三级国产av潘金莲| 一级作爱视频免费观看| 欧美日韩精品网址| 色综合站精品国产| 精品久久久久久成人av| 国产极品精品免费视频能看的| 国产精品女同一区二区软件 | 免费高清视频大片| www国产在线视频色| 精品一区二区三区人妻视频| 俄罗斯特黄特色一大片| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 亚洲欧美精品综合久久99| 国产视频一区二区在线看| 久久香蕉国产精品| 国产精品久久电影中文字幕| 一进一出抽搐gif免费好疼| 18禁在线播放成人免费| 制服人妻中文乱码| www日本黄色视频网| 亚洲欧美日韩高清专用| 天天一区二区日本电影三级| 日本精品一区二区三区蜜桃| 女人被狂操c到高潮| 精品一区二区三区视频在线观看免费| 国产精品女同一区二区软件 | 亚洲美女视频黄频| 久9热在线精品视频| 搞女人的毛片| 男女床上黄色一级片免费看| 美女高潮的动态| 久9热在线精品视频| 欧洲精品卡2卡3卡4卡5卡区| 999久久久精品免费观看国产| 国产高清有码在线观看视频| 亚洲国产精品久久男人天堂| 亚洲av成人不卡在线观看播放网| 亚洲精品影视一区二区三区av| 99久久精品一区二区三区| 国产不卡一卡二| 国产中年淑女户外野战色| 欧美区成人在线视频| 我要搜黄色片| 国产探花在线观看一区二区| 国内揄拍国产精品人妻在线| 国产中年淑女户外野战色| 动漫黄色视频在线观看| 精品免费久久久久久久清纯| 国产精品电影一区二区三区| 国产一区二区在线观看日韩 | av专区在线播放| 久久久成人免费电影| 国产97色在线日韩免费| 国产极品精品免费视频能看的| 两个人视频免费观看高清| 看黄色毛片网站| 美女黄网站色视频| 欧美中文日本在线观看视频| 欧美+亚洲+日韩+国产| 黄片大片在线免费观看| 欧美日韩精品网址| а√天堂www在线а√下载| 人人妻人人看人人澡| 国产私拍福利视频在线观看| 中出人妻视频一区二区| 亚洲专区国产一区二区| 一个人免费在线观看电影| 美女被艹到高潮喷水动态| 在线免费观看的www视频| 欧美日韩亚洲国产一区二区在线观看| 亚洲专区中文字幕在线| 久久性视频一级片| 久久精品国产清高在天天线| 国产单亲对白刺激| 亚洲精品一区av在线观看| 午夜激情欧美在线| 在线天堂最新版资源| 亚洲黑人精品在线| 人人妻人人看人人澡| 午夜福利免费观看在线| 尤物成人国产欧美一区二区三区| 欧美在线黄色| 国产97色在线日韩免费| 亚洲精品亚洲一区二区| av女优亚洲男人天堂| 在线a可以看的网站| 叶爱在线成人免费视频播放| 99精品在免费线老司机午夜| 岛国视频午夜一区免费看| 中文在线观看免费www的网站| 久久精品国产自在天天线| 国产亚洲欧美98| 精品电影一区二区在线| www.www免费av| 老司机在亚洲福利影院| 日本a在线网址| 成人永久免费在线观看视频| 亚洲狠狠婷婷综合久久图片| 欧美最黄视频在线播放免费| 久久久成人免费电影| 亚洲人成网站在线播| 久久精品国产自在天天线| 首页视频小说图片口味搜索| 人妻夜夜爽99麻豆av| 禁无遮挡网站| 中文亚洲av片在线观看爽| 欧美成人a在线观看| 熟妇人妻久久中文字幕3abv| 久久久久久大精品| 高潮久久久久久久久久久不卡| 色吧在线观看| 校园春色视频在线观看| 91av网一区二区| 欧美中文日本在线观看视频| 村上凉子中文字幕在线| 少妇人妻精品综合一区二区 | 精品一区二区三区视频在线 | 美女cb高潮喷水在线观看| 精品福利观看| 欧美zozozo另类| 好看av亚洲va欧美ⅴa在| 天天添夜夜摸| 欧美乱码精品一区二区三区| 中文字幕熟女人妻在线| 国产av麻豆久久久久久久| 少妇的逼好多水| 免费在线观看日本一区| 国产高清视频在线观看网站| 两个人看的免费小视频| 精品国产美女av久久久久小说| 亚洲av电影不卡..在线观看| 精华霜和精华液先用哪个| 欧美丝袜亚洲另类 | 国产亚洲精品久久久com| 日日摸夜夜添夜夜添小说| 亚洲精品成人久久久久久| 久久精品91无色码中文字幕| 在线播放国产精品三级| 国产毛片a区久久久久| 2021天堂中文幕一二区在线观| 国产精品日韩av在线免费观看| 欧美成狂野欧美在线观看| 在线观看舔阴道视频| 亚洲熟妇熟女久久| 国内精品久久久久精免费| www.999成人在线观看| 国产探花在线观看一区二区| 天堂√8在线中文| 成人一区二区视频在线观看| 变态另类丝袜制服| 天堂av国产一区二区熟女人妻| 十八禁网站免费在线| 淫妇啪啪啪对白视频| 五月玫瑰六月丁香| 国产在线精品亚洲第一网站| 免费电影在线观看免费观看| 日韩欧美国产在线观看| 免费高清视频大片| 99久久精品一区二区三区| 国产精品爽爽va在线观看网站| 免费av观看视频| 天美传媒精品一区二区| 99国产精品一区二区三区| 丝袜美腿在线中文| 黄色成人免费大全| www.www免费av| 欧美日韩黄片免| 在线观看日韩欧美| 亚洲精品亚洲一区二区| 夜夜夜夜夜久久久久| 丁香欧美五月| 99久久精品国产亚洲精品| 亚洲欧美日韩无卡精品| 99久久综合精品五月天人人| 午夜福利欧美成人| www.熟女人妻精品国产| 亚洲av美国av| 免费人成在线观看视频色| 一个人免费在线观看的高清视频| 久久久久免费精品人妻一区二区| 午夜亚洲福利在线播放| 老司机在亚洲福利影院| 日韩高清综合在线| 欧美三级亚洲精品| 国产精品美女特级片免费视频播放器| 亚洲真实伦在线观看| 免费看日本二区| 久久亚洲精品不卡| 国产在线精品亚洲第一网站| 成年女人永久免费观看视频| 午夜日韩欧美国产| 18禁美女被吸乳视频| 国产精品99久久99久久久不卡| 久久性视频一级片| 午夜福利高清视频| 在线看三级毛片| 少妇丰满av| av黄色大香蕉| 国产国拍精品亚洲av在线观看 | 欧美日本亚洲视频在线播放| 成熟少妇高潮喷水视频| 国产精品久久久人人做人人爽| 国产 一区 欧美 日韩| 亚洲熟妇熟女久久| 香蕉久久夜色| 色播亚洲综合网| 三级国产精品欧美在线观看| 亚洲人与动物交配视频| 少妇人妻一区二区三区视频| 亚洲国产精品久久男人天堂| 97超视频在线观看视频| 麻豆一二三区av精品| 国产黄色小视频在线观看| 99视频精品全部免费 在线| 成人性生交大片免费视频hd| 村上凉子中文字幕在线|