• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種改進(jìn)的GloVe詞向量表示學(xué)習(xí)方法

    2021-05-27 05:30:40石雋鋒李濟(jì)洪王瑞波
    中文信息學(xué)報(bào) 2021年4期
    關(guān)鍵詞:余弦句法語(yǔ)料

    石雋鋒,李濟(jì)洪,王瑞波

    (山西大學(xué) 現(xiàn)代教育技術(shù)學(xué)院,山西 太原 030006)

    0 引言

    近些年來(lái),在自然語(yǔ)言處理領(lǐng)域,預(yù)訓(xùn)練詞語(yǔ)分布式表示在很多任務(wù)中有很好的性能,這些任務(wù)包括文本分類[1]、問答系統(tǒng)[2]、命名實(shí)體識(shí)別[3]、語(yǔ)義角色標(biāo)注[4]等。為此,研究人員提出了很多預(yù)訓(xùn)練的語(yǔ)言模型[5-9],較為典型的方法有SENNA模型[5]、Word2Vec模型[6]、GloVe模型[7]、ELMo模型[8]、BERT模型[9]。其中,GloVe模型基于任意兩個(gè)詞之間的全局共現(xiàn)信息,再采用Log-Bilinear模型學(xué)習(xí)得到詞向量表示,在多項(xiàng)評(píng)測(cè)任務(wù)中表現(xiàn)良好。通常情況下,得到的詞向量的維數(shù)越高模型性能越好,但維數(shù)越大則訓(xùn)練耗時(shí)越長(zhǎng)。一個(gè)自然的想法是,利用并行計(jì)算分別學(xué)習(xí)較低維數(shù)的詞向量再拼接,能否得到性能更高的詞向量?事實(shí)上,在GloVe模型中,共現(xiàn)矩陣的統(tǒng)計(jì)方法采用了兩種,一種是對(duì)稱窗口的方法,即取目標(biāo)詞兩側(cè)固定窗口內(nèi)的詞語(yǔ)作為其上下文;另一種是非對(duì)稱窗口的方法,即取目標(biāo)詞左側(cè)的固定窗口內(nèi)的詞語(yǔ)作為其上下文,不同的共現(xiàn)矩陣會(huì)反映不同的句法和語(yǔ)義信息。為此,在GloVe模型中,本文以對(duì)稱和非對(duì)稱窗口統(tǒng)計(jì)得到兩個(gè)共現(xiàn)矩陣,分別學(xué)習(xí)得到詞向量表示,然后再采用拼接的方式,得到較高維度的詞向量表示。在驗(yàn)證實(shí)驗(yàn)中,我們分別學(xué)習(xí)得到的300維向量,再拼接得到600維向量表示,在中文和英文的詞語(yǔ)推斷任務(wù)的評(píng)測(cè)集上,預(yù)測(cè)的準(zhǔn)確率得到顯著提升。

    1 相關(guān)工作

    在自然語(yǔ)言處理領(lǐng)域,詞語(yǔ)的分布式表示(distributional representation)是將詞的上下文信息表示為詞向量的形式,這種詞向量構(gòu)建的基礎(chǔ)是1957年Firth提出的分布式假說(shuō)(distributional hypothesis)[10],即一個(gè)詞語(yǔ)的語(yǔ)義信息是由其周圍的詞語(yǔ)來(lái)刻畫的(a word is characterized by the company it keeps)。科研人員提出了多種詞向量的構(gòu)造方法。Burgess 等[11]構(gòu)造的詞向量的每一維上表示目標(biāo)詞和其上下文詞語(yǔ)共現(xiàn)的頻次,而有些研究人員[12-13]用目標(biāo)詞和它的上下文的逐點(diǎn)互信息(pointwise mutual information,PMI)或正逐點(diǎn)互信息(positive pointwise mutual information,PPMI)代替了頻次。詞語(yǔ)的共現(xiàn)范圍通常用滑動(dòng)窗口的方法來(lái)實(shí)現(xiàn)[11],給定窗口的大小為w,通過(guò)在語(yǔ)料上逐詞地滑動(dòng)窗口。在每個(gè)窗口里,共現(xiàn)的詞對(duì)的頻次的和形成共現(xiàn)矩陣,詞對(duì)是有序的,即只統(tǒng)計(jì)目標(biāo)詞左側(cè)上下文的頻次,而把目標(biāo)詞和上下文交換角色后,就可以得到目標(biāo)詞右側(cè)上下文的頻次。文獻(xiàn)[14]系統(tǒng)地比較了不同的距離測(cè)度對(duì)不同的共現(xiàn)矩陣(PMI共現(xiàn)矩陣、PPMI共現(xiàn)矩陣)得到的詞向量在各種任務(wù)上的性能。在PPMI共現(xiàn)矩陣中,分出了四種共現(xiàn)矩陣,即基于左側(cè)共現(xiàn)、右側(cè)共現(xiàn)、及左右側(cè)共現(xiàn)相加、左右側(cè)共現(xiàn)拼接的共現(xiàn)矩陣,依次表示為:L,R,L+R,L&R,在語(yǔ)義聚類任務(wù)和句法聚類任務(wù)上比較了基于四種共現(xiàn)矩陣的性能,發(fā)現(xiàn)在語(yǔ)義聚類任務(wù)上,基于L&R的詞向量性能略高于基于L+R的詞向量;在句法聚類任務(wù)上,基于L&R的詞向量在維數(shù)較高的情況下,性能顯著高于基于L+R的詞向量。詞語(yǔ)的分布式表示是高維的、稀疏的向量,不利于進(jìn)行語(yǔ)義計(jì)算。為此,科研人員提出了一些降低維度的方法,文獻(xiàn)[15]對(duì)詞對(duì)的頻次排序,設(shè)定閾值,刪掉詞對(duì)頻次低于閾值的維數(shù),使得詞向量的維數(shù)大大降低。文獻(xiàn)[16]提出了奇異值分解方法,將文檔矩陣進(jìn)行分解,降低了詞向量的維數(shù),文獻(xiàn)[17]是對(duì)共現(xiàn)的PPMI矩陣進(jìn)行因式分解。近些年來(lái),科研人員通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練詞語(yǔ)的低維表示。Word2Vec模型[6]包括CBOW模型和Skip-gram模型,目標(biāo)函數(shù)為目標(biāo)詞和上下文的關(guān)系,CBOW模型的目標(biāo)函數(shù)為通過(guò)上下文預(yù)測(cè)目標(biāo)詞,而Skip-gram模型的目標(biāo)函數(shù)為通過(guò)目標(biāo)詞預(yù)測(cè)上下文。文獻(xiàn)[18-21]都是在CBOW和Skip-gram模型基礎(chǔ)上進(jìn)一步考慮了詞語(yǔ)在句子中的位置以及和目標(biāo)詞的關(guān)聯(lián)程度提出的改進(jìn)模型,這些模型在句法任務(wù)上性能均有所提升。文獻(xiàn)[18]采用了基于句法關(guān)系的上下文訓(xùn)練的詞向量作為依存句法解析的特征,來(lái)提高模型性能。文獻(xiàn)[19]在CBOW模型和Skip-gram模型的基礎(chǔ)上添加更多的參數(shù),保留上下文和目標(biāo)詞之間的位置信息。但模型的復(fù)雜度會(huì)隨著窗口的增大線性增加。文獻(xiàn)[20]在CBOW模型的基礎(chǔ)上,根據(jù)上下文的不同類型以及和目標(biāo)詞的相對(duì)位置的不同,為上下文分配不同的權(quán)重。文獻(xiàn)[21]引入一個(gè)方向向量來(lái)表示上下文是在目標(biāo)詞的左邊還是右邊,從而提高Skip-gram模型的性能。文獻(xiàn)[22]提出了采用基于句法關(guān)系的上下文訓(xùn)練詞向量的方法,在Skip-gram模型上,比較了基于句法關(guān)系的上下文和基于滑動(dòng)窗口的上下文訓(xùn)練得到的詞向量,發(fā)現(xiàn)通過(guò)基于句法關(guān)系的詞向量找到的相似詞語(yǔ)中功能型相似(functional similarity)的詞語(yǔ)比較多,基于滑動(dòng)窗口的詞向量找到的相似詞語(yǔ)中主題相似(topical similarity)的詞語(yǔ)比較多,例如,“佛羅里達(dá)州”在第一種上下文的詞向量下得到的相似的詞語(yǔ)為其所屬的國(guó)家或者它包含的城市,在第二種上下文的詞向量下得到的相似詞語(yǔ)是美國(guó)的一些其他的州。因此基于滑動(dòng)窗口上下文的詞向量表示和基于句法上下文的詞向量表示各有優(yōu)劣。應(yīng)當(dāng)把這兩種詞向量表示結(jié)合起來(lái)使用?;贕loVe模型有兩種統(tǒng)計(jì)共現(xiàn)矩陣的方式,一種是對(duì)稱窗口方式,沒有考慮詞語(yǔ)順序;另一種是非對(duì)稱窗口方式,考慮了上下文在目標(biāo)詞的前后順序。因此,我們有必要將兩種共現(xiàn)矩陣得到的詞向量結(jié)合起來(lái),得到精度更高的詞向量表示,來(lái)更好地完成語(yǔ)義和句法任務(wù)。

    2 GloVe模型

    GloVe模型可以分別訓(xùn)練出基于對(duì)稱共現(xiàn)矩陣的低維詞向量和基于非對(duì)稱共現(xiàn)矩陣的低維詞向量。

    GloVe模型訓(xùn)練基于對(duì)稱共現(xiàn)矩陣的低維詞向量的步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (3) 用vS表示基于對(duì)稱共現(xiàn)矩陣訓(xùn)練得到的低維詞向量。訓(xùn)練vS的目標(biāo)函數(shù)如式(1)所示。

    (1)

    GloVe模型訓(xùn)練基于非對(duì)稱共現(xiàn)矩陣的低維詞向量的步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (3) 用vA表示基于左側(cè)共現(xiàn)矩陣訓(xùn)練得到的低維詞向量。訓(xùn)練vA的目標(biāo)函數(shù)如式(2)所示。

    (2)

    3 GloVe詞向量拼接模型

    本文提出了GloVe詞向量拼接模型,該模型并行訓(xùn)練出只有一半維數(shù)的vA和vS,再將它們拼接起來(lái),完成詞語(yǔ)推斷任務(wù)。具體步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (2) 設(shè)定固定窗口大小為w,依次遍歷語(yǔ)料庫(kù)中的詞語(yǔ),并行統(tǒng)計(jì)出左側(cè)共現(xiàn)矩陣和對(duì)稱共現(xiàn)矩陣XL和XS。兩個(gè)矩陣的大小都為n×n。XL和XS都是按詞頻排序的。

    (3) 并行打亂XL和XS的順序。

    (4) 在兩個(gè)處理器上,設(shè)置維數(shù)為GloVe模型的一半,分別用式(1)訓(xùn)練出vS,用式(2)訓(xùn)練出vA。

    (5) 將vA和vS拼接起來(lái)作為詞語(yǔ)的低維詞表示。

    4 實(shí)驗(yàn)

    實(shí)驗(yàn)環(huán)境為山西大學(xué)高性能計(jì)算平臺(tái)。

    4.1 在英文詞語(yǔ)推斷任務(wù)上比較

    從English Wikipedia語(yǔ)料分割出三個(gè)不同大小的語(yǔ)料,分別包含2億、5億、10億個(gè)單詞,文件大小分別為1.09 GB、2.71 GB、5.42 GB?;瑒?dòng)窗口大小(window-size)設(shè)置為10,詞典中的最大詞數(shù)(max-vocab)設(shè)為100 000,用GloVe模型訓(xùn)練出600維的vS和vA,用GloVe詞向量拼接模型訓(xùn)練出600維的vS和vA的拼接向量(vS和vA的維數(shù)都是300維),在詞語(yǔ)推斷任務(wù)[3]上比較它們的準(zhǔn)確率,實(shí)驗(yàn)結(jié)果如下,詞語(yǔ)推斷任務(wù)的測(cè)試集包括語(yǔ)義任務(wù)(capital:country,city:state,family)和句法任務(wù)(adjective:adverb,opposite,comparative等),結(jié)果如表1~表3所示。

    從表1可以看出,GloVe詞向量拼接模型得到的詞向量在語(yǔ)義任務(wù)、句法任務(wù)和總?cè)蝿?wù)上的準(zhǔn)確率均有不同程度的提升,句法任務(wù)和總?cè)蝿?wù)上提升較大。從表2和表3可以看出,GloVe詞向量拼接模型得到的詞向量在句法任務(wù)上有較大提升,在總?cè)蝿?wù)上準(zhǔn)確率也有所提升。綜合表1到表3,GloVe詞向量拼接模型在句法任務(wù)上性 能較好,在較小的語(yǔ)料庫(kù)上性能提升得較大。隨著語(yǔ)料規(guī)模的擴(kuò)大,在“vA拼接vS”詞向量下,語(yǔ)義任務(wù)上的準(zhǔn)確率先升后降(82.01%→84.62%→84.40%),這是因?yàn)閙ax-vocab參數(shù)的設(shè)置,該參數(shù)限制了詞典的最大詞數(shù),在不同大小的語(yǔ)料上,詞典里的詞按照頻次從高到低排序,詞數(shù)相同,使得保留下來(lái)的詞并不相同,較大的語(yǔ)料保留了詞頻較高的詞,但可能刪去了一些有意義的上下文詞語(yǔ)。因此,語(yǔ)料大也可能使準(zhǔn)確率下降。由于實(shí)驗(yàn)?zāi)康氖潜容^在相同語(yǔ)料規(guī)模下,GloVe模型訓(xùn)練出詞向量和GloVe詞向量拼接模型訓(xùn)練出的詞向量的性能,因此,沒有考慮三個(gè)語(yǔ)料下要統(tǒng)一詞表。

    表1 1.09 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    表2 2.71 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    表3 5.42 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    4.2 在中文詞語(yǔ)推斷任務(wù)上比較

    本文在中文的詞語(yǔ)推斷任務(wù)上也做了相同的實(shí)驗(yàn),中文語(yǔ)料采用1998年和2000年人民日?qǐng)?bào)語(yǔ)料合并后的語(yǔ)料,大小為186 MB,中文的詞語(yǔ)推斷任務(wù)的測(cè)試集是文獻(xiàn)[23]提供的,只包含語(yǔ)義任務(wù)(首都:國(guó)家,省會(huì):省,家庭關(guān)系),用GloVe模型訓(xùn)練出600維的vS和vA,用GloVe詞向量拼接模型訓(xùn)練出600維的vS和vA的拼接向量(vS和vA的維數(shù)都是300維),在中文的詞語(yǔ)推斷任務(wù)上進(jìn)行比較,實(shí)驗(yàn)結(jié)果如表4所示。

    表4 人民日?qǐng)?bào)語(yǔ)料下的比較結(jié)果 (單位:%)

    從表中的數(shù)據(jù)可以看出,GloVe詞向量拼接模型得到的詞向量準(zhǔn)確率有大幅提高。

    4.3 顯著性檢驗(yàn)

    本文對(duì)表1中的數(shù)據(jù)用χ2檢驗(yàn)方法進(jìn)行了顯著性檢驗(yàn),如式(3)所示。

    (3)

    在本實(shí)驗(yàn)中,n01表示使用GloVe詞向量拼接模型預(yù)測(cè)錯(cuò)誤而GloVe模型預(yù)測(cè)正確的詞語(yǔ)個(gè)數(shù),n10表示使用GloVe詞向量拼接模型預(yù)測(cè)正確而GloVe模型預(yù)測(cè)錯(cuò)誤的詞語(yǔ)個(gè)數(shù),通過(guò)計(jì)算得到的χ2值如表5所示。

    表5 “vS”和“vA 拼接vS”在各個(gè)任務(wù)上的χ2值

    4.4 詞語(yǔ)聚類的示例

    詞語(yǔ)聚類的效果可以檢驗(yàn)詞向量性能。通常可以通過(guò)計(jì)算詞語(yǔ)向量的相鄰詞,觀察這些學(xué)習(xí)到的詞向量表示的好壞。本文采用詞向量的余弦相似度來(lái)度量詞語(yǔ)的相鄰程度。采用4.2節(jié)訓(xùn)練的詞向量。表6和表7分別列出了在“vS”“vA”和“vA拼接vS”的詞向量下,英國(guó)、德國(guó)最相鄰的10個(gè)詞。

    表6 “英國(guó)”在“vS”、“vA”和“vA拼接vS”詞向量下的10近鄰詞及余弦相似度

    表7 “德國(guó)”在“vS”、“vA”和“vA拼接vS”下的10個(gè)近鄰詞及余弦相似度

    可以看出,與“vS”與“vA”詞向量相比,在“vA拼接vS”詞向量下,詞語(yǔ)的余弦相似度較大,說(shuō)明聚在一起的相似的詞語(yǔ)比較多。

    通過(guò)列出的10個(gè)近鄰詞語(yǔ)可以看出,在“vS”詞向量下,列出了更多語(yǔ)義上比較接近的詞,在“vA”詞向量下,列出了更多句法上接近的詞語(yǔ),在“vA拼接vS”詞向量下,列出了更多句法和語(yǔ)義上接近的詞語(yǔ)。

    比如,在“英國(guó)”的10個(gè)近鄰詞中,在“vS”詞向量下,“英國(guó)”的相鄰詞中包括“牛津”,而在“vA”詞向量下沒有這個(gè)詞;在“vA”詞向量下,“英國(guó)”的相鄰詞中包括“美國(guó)”“日本”“澳大利亞”,而在“vS”詞向量下沒有這些詞。在“vA拼接vS”詞向量下,“英國(guó)”的10個(gè)近鄰詞中包括“美國(guó)”“日本”,不包括“牛津”“澳大利亞”。但“英國(guó)”的第14近鄰詞為“澳大利亞”,和“英國(guó)”詞向量的余弦相似度為0.502 7,“英國(guó)”的第15近鄰詞為“牛津”,和“英國(guó)”詞向量的余弦相似度為0.495 3。雖然這兩個(gè)詞不在“英國(guó)”的前10個(gè)近鄰祠內(nèi),但是,在“vA拼接vS”下,這兩個(gè)詞和“英國(guó)”的余弦相似度分別比在“vA”和“vS”詞向量下的大。例如,在“vA拼接vS”下,“澳大利亞”和“英國(guó)”的詞向量的余弦相似度為0.502 7,0.502 7>0.424 7(“vA”下“英國(guó)”和“澳大利亞”的余弦相似度),同樣,在“vA拼接vS”下,“牛津”和“英國(guó)”的詞向量的余弦相似度為0.495 3,0.495 3>0.459 5(vS下“英國(guó)”和“牛津”的余弦相似度)。同樣,在“vA拼接vS”下,“美國(guó)”“日本”和“英國(guó)”的余弦相似度比“vA”詞向量下的余弦相似度大。

    比如,在“德國(guó)”的10個(gè)近鄰詞中,在“vS”詞向量下,“德國(guó)”的相鄰詞中包括“施羅德”(德國(guó)前總理)、“納粹”,而在“vA”詞向量下沒有這兩個(gè)詞。在“vA”詞向量下,“德國(guó)”的相鄰詞中包括“荷蘭”“日本”,而在“vS”詞向量下沒有這些詞。在“vA拼接vS”詞向量下,“德國(guó)”的10個(gè)近鄰詞中包括“施羅德”“荷蘭”“日本”,不包括“納粹”。但“德國(guó)”的第22近鄰詞為“納粹”,余弦相似度比“vS”詞向量下的大,為0.482 9,0.482 9>0.439 5(“vS”下“德國(guó)”和“納粹”的余弦相似度)。在“vA拼接vS”詞向量下,“德國(guó)”的第7近鄰詞為“日本”,余弦相似度為0.578 7,0.578 7>0.439 7(“vA”下“德國(guó)”和“日本”的余弦相似度)。在“vA拼接vS”詞向量下,“施羅德”“荷蘭”的余弦相似度分別比在“vS”和“vA”詞向量下的大,由于篇幅所限,在此不一一列舉。

    總的來(lái)說(shuō),在“vA拼接vS”下,詞語(yǔ)的近鄰詞中包括了更多語(yǔ)義和句法上相近的詞語(yǔ)。“vA拼接vS”得到的詞向量在詞語(yǔ)聚類上的表現(xiàn)優(yōu)于“vS”和“vA”詞向量。

    4.5 運(yùn)行時(shí)間

    本文統(tǒng)計(jì)了4.1節(jié)在1.09 GB的English Wikipedia語(yǔ)料下完成詞語(yǔ)推斷任務(wù)時(shí),GloVe模型和GloVe詞向量拼接模型運(yùn)行的時(shí)間,如表8所示。

    表8 1.09 GB English Wikipedia語(yǔ)料下的運(yùn)行時(shí)間

    因此,對(duì)GloVe模型,采用并行的訓(xùn)練學(xué)習(xí)方法,既可以提高詞向量的性能,又能節(jié)省訓(xùn)練時(shí)間。

    4.6 實(shí)驗(yàn)結(jié)果分析

    從大部分的詞語(yǔ)推斷任務(wù)和聚類任務(wù)的實(shí)驗(yàn)結(jié)果可以看出,“vA拼接vS”詞向量在語(yǔ)義任務(wù)和句法任務(wù)上都超過(guò)了“vS”詞向量和“vA”詞向量。原因是“vS”詞向量和“vA”詞向量共現(xiàn)矩陣構(gòu)造過(guò)程不同,反映的句法和語(yǔ)義信息也不同?!皏A拼接vS”詞向量能夠體現(xiàn)更完整的句法和語(yǔ)義信息。

    “vS”詞向量的共現(xiàn)矩陣構(gòu)造方法為:在語(yǔ)料庫(kù)上,從開始位置滑動(dòng)固定大小的窗口,統(tǒng)計(jì)目標(biāo)詞兩側(cè)固定窗口內(nèi)的詞語(yǔ)的頻次,生成對(duì)稱共現(xiàn)矩陣。

    “vA”詞向量的共現(xiàn)矩陣構(gòu)造方法為:在語(yǔ)料庫(kù)上,從開始位置滑動(dòng)固定大小的窗口,統(tǒng)計(jì)目標(biāo)詞左側(cè)固定窗口內(nèi)的詞語(yǔ)的頻次,生成左側(cè)共現(xiàn)矩陣。左側(cè)共現(xiàn)矩陣的轉(zhuǎn)置即為右側(cè)共現(xiàn)矩陣,因此右側(cè)共現(xiàn)矩陣不需要單獨(dú)統(tǒng)計(jì)。

    “vA”詞向量的共現(xiàn)矩陣保存了詞語(yǔ)在目標(biāo)詞左右的位置信息,而“vS” 詞向量的共現(xiàn)矩陣將目標(biāo)詞左側(cè)和右側(cè)的相同詞語(yǔ)的頻次求和,使得共現(xiàn)矩陣中混合了目標(biāo)詞之前和之后的上下文詞語(yǔ)?!皏A”詞向量聚類能將句法相近的詞語(yǔ)更好地聚在一起,而“vS”詞向量聚類能將語(yǔ)義相近的詞更好地聚在一起。因此,“vA”詞向量更多地體現(xiàn)句法信息,而“vS”詞向量更多地體現(xiàn)語(yǔ)義信息。

    “vA拼接vS”詞向量是將“vA”詞向量和“vS”詞向量拼接起來(lái),融入了“vA”詞向量和“vS”詞向量的信息,因此該詞向量能體現(xiàn)更多的句法和語(yǔ)義信息。

    5 結(jié)論與展望

    事實(shí)上,表示學(xué)習(xí)的理論依據(jù)是詞的意義是由與其共現(xiàn)的詞來(lái)體現(xiàn)的,意義的不同體現(xiàn)了其共現(xiàn)詞語(yǔ)的差異。GloVe模型中共現(xiàn)是以滑動(dòng)窗口的方式來(lái)統(tǒng)計(jì)的,顯然,對(duì)許多詞,使用詞的左側(cè)、右側(cè)窗口或?qū)ΨQ窗口來(lái)計(jì)算共現(xiàn)能夠體現(xiàn)詞組合的不同分布特性。因此,采用多種方式而不是僅僅用對(duì)稱窗口方式得到共現(xiàn)矩陣,應(yīng)該可以學(xué)習(xí)到更為準(zhǔn)確的詞表示向量。

    本文提出了GloVe詞向量拼接模型,使用不同的共現(xiàn)矩陣,并采用并行處理分別學(xué)習(xí)較低維度的詞向量,再采用拼接方式得到較高維度的詞向量表示,減少了詞向量的訓(xùn)練時(shí)間。實(shí)驗(yàn)結(jié)果表明,由GloVe拼接模型得到的詞向量在詞語(yǔ)推斷任務(wù)上和詞語(yǔ)聚類任務(wù)上性能有顯著提升。下一步我們將研究如何得到反映多種層面信息的共現(xiàn)矩陣,有效集成多種詞表示向量,提高表示學(xué)習(xí)的性能。

    猜你喜歡
    余弦句法語(yǔ)料
    句法與句意(外一篇)
    述謂結(jié)構(gòu)與英語(yǔ)句法配置
    句法二題
    詩(shī)詞聯(lián)句句法梳理
    兩個(gè)含余弦函數(shù)的三角母不等式及其推論
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    分?jǐn)?shù)階余弦變換的卷積定理
    圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    亚洲激情在线av| 亚洲熟女毛片儿| 一进一出抽搐动态| 人人妻人人爽人人添夜夜欢视频| 一边摸一边抽搐一进一出视频| 黄片大片在线免费观看| 91成年电影在线观看| 亚洲成人免费av在线播放| 高清黄色对白视频在线免费看| 日本欧美视频一区| 国产欧美日韩一区二区三区在线| 久久国产精品影院| 热re99久久国产66热| 久久香蕉激情| 叶爱在线成人免费视频播放| 亚洲国产精品999在线| 免费日韩欧美在线观看| 亚洲欧美激情综合另类| 亚洲七黄色美女视频| 国产精品香港三级国产av潘金莲| 国产主播在线观看一区二区| 国产成人av激情在线播放| 女警被强在线播放| 亚洲国产精品一区二区三区在线| 亚洲av成人av| 欧美黑人精品巨大| 一级黄色大片毛片| 色播在线永久视频| 狠狠狠狠99中文字幕| 男女午夜视频在线观看| 侵犯人妻中文字幕一二三四区| 99国产精品99久久久久| 黄色a级毛片大全视频| 欧美老熟妇乱子伦牲交| 国产高清videossex| 中亚洲国语对白在线视频| 午夜福利欧美成人| 精品国产亚洲在线| 一级a爱视频在线免费观看| 老司机深夜福利视频在线观看| 国产精品一区二区在线不卡| 精品欧美一区二区三区在线| 日本wwww免费看| 日韩有码中文字幕| 久久精品aⅴ一区二区三区四区| 两性午夜刺激爽爽歪歪视频在线观看 | 一进一出抽搐动态| 国产在线观看jvid| 日本黄色视频三级网站网址| 亚洲精品成人av观看孕妇| 啦啦啦在线免费观看视频4| 中文字幕色久视频| 又大又爽又粗| 露出奶头的视频| 久久狼人影院| 亚洲成人久久性| 丰满人妻熟妇乱又伦精品不卡| 女警被强在线播放| 国产成人影院久久av| 久久久精品欧美日韩精品| 国产黄a三级三级三级人| 黄色女人牲交| 黄色成人免费大全| 欧美日韩瑟瑟在线播放| 亚洲精品av麻豆狂野| 国产黄色免费在线视频| 淫秽高清视频在线观看| 国产精品久久久av美女十八| 国产男靠女视频免费网站| 亚洲精品一卡2卡三卡4卡5卡| 窝窝影院91人妻| 国产区一区二久久| 成人黄色视频免费在线看| 一区在线观看完整版| 日韩欧美免费精品| 久久久水蜜桃国产精品网| 88av欧美| 人人妻人人爽人人添夜夜欢视频| 国产欧美日韩一区二区三| 老司机福利观看| 久久九九热精品免费| 欧美日本中文国产一区发布| 老司机靠b影院| 看片在线看免费视频| 久久这里只有精品19| 超色免费av| 69av精品久久久久久| 亚洲中文av在线| 色综合站精品国产| 亚洲中文av在线| 国产精品自产拍在线观看55亚洲| 久久久精品欧美日韩精品| 国产精品自产拍在线观看55亚洲| 国产三级黄色录像| 欧美黑人精品巨大| 亚洲中文字幕日韩| 国产精品一区二区精品视频观看| 成人精品一区二区免费| 日韩欧美在线二视频| 免费在线观看亚洲国产| 美女大奶头视频| 久久欧美精品欧美久久欧美| 亚洲一区二区三区色噜噜 | 亚洲欧美日韩另类电影网站| 国产精品久久久久成人av| netflix在线观看网站| 久久国产精品人妻蜜桃| 两人在一起打扑克的视频| 欧美精品一区二区免费开放| 1024视频免费在线观看| 成人免费观看视频高清| 丰满的人妻完整版| 天天影视国产精品| 国产xxxxx性猛交| 国产高清激情床上av| 丰满的人妻完整版| 国产一区二区三区综合在线观看| 黄色女人牲交| 在线观看免费视频日本深夜| 美国免费a级毛片| 99精品在免费线老司机午夜| 啦啦啦在线免费观看视频4| 夜夜躁狠狠躁天天躁| 91老司机精品| 久久久久久久久中文| 久久精品国产综合久久久| 国产免费男女视频| 精品福利观看| 少妇 在线观看| 精品少妇一区二区三区视频日本电影| 亚洲色图av天堂| 又紧又爽又黄一区二区| 悠悠久久av| 国产av在哪里看| 男女做爰动态图高潮gif福利片 | 成人手机av| 久久久久国内视频| 精品久久久久久久毛片微露脸| 天天影视国产精品| 欧美日本亚洲视频在线播放| 亚洲精品国产区一区二| 国产高清视频在线播放一区| 午夜成年电影在线免费观看| 自拍欧美九色日韩亚洲蝌蚪91| 高清av免费在线| 午夜成年电影在线免费观看| 人人澡人人妻人| 国产成+人综合+亚洲专区| 男男h啪啪无遮挡| 国产99久久九九免费精品| 成人三级做爰电影| 亚洲欧美精品综合久久99| 热99re8久久精品国产| a在线观看视频网站| 久久天躁狠狠躁夜夜2o2o| 电影成人av| 午夜免费激情av| 后天国语完整版免费观看| 久99久视频精品免费| 真人一进一出gif抽搐免费| 亚洲五月婷婷丁香| 视频区欧美日本亚洲| 精品乱码久久久久久99久播| av欧美777| 亚洲,欧美精品.| 亚洲精品国产精品久久久不卡| 久久人妻福利社区极品人妻图片| 精品福利永久在线观看| 操出白浆在线播放| 一边摸一边抽搐一进一小说| 亚洲七黄色美女视频| 欧美日韩亚洲综合一区二区三区_| 亚洲av日韩精品久久久久久密| 狠狠狠狠99中文字幕| 精品福利永久在线观看| 亚洲国产精品一区二区三区在线| 51午夜福利影视在线观看| 国产精品久久久久久人妻精品电影| 久久久久九九精品影院| 国产av又大| 精品久久蜜臀av无| 人人澡人人妻人| 两性午夜刺激爽爽歪歪视频在线观看 | 老司机靠b影院| 曰老女人黄片| 日韩精品中文字幕看吧| 亚洲av成人不卡在线观看播放网| 欧美激情极品国产一区二区三区| 在线免费观看的www视频| 日本欧美视频一区| 久久久国产欧美日韩av| 99久久人妻综合| 无遮挡黄片免费观看| 日韩欧美一区二区三区在线观看| 亚洲精品粉嫩美女一区| 电影成人av| 十分钟在线观看高清视频www| 国产高清国产精品国产三级| 国产成人精品久久二区二区免费| 欧美日韩瑟瑟在线播放| 女同久久另类99精品国产91| 老司机靠b影院| 欧美日本亚洲视频在线播放| 在线观看免费视频网站a站| 欧美午夜高清在线| 男女床上黄色一级片免费看| av视频免费观看在线观看| 午夜免费观看网址| 美女高潮喷水抽搐中文字幕| 国产三级黄色录像| 久久中文字幕一级| 亚洲精品中文字幕一二三四区| 1024视频免费在线观看| 99在线视频只有这里精品首页| aaaaa片日本免费| 多毛熟女@视频| 日日夜夜操网爽| 9热在线视频观看99| 免费在线观看影片大全网站| 欧美av亚洲av综合av国产av| 在线观看一区二区三区| 欧美+亚洲+日韩+国产| 亚洲欧美日韩无卡精品| 俄罗斯特黄特色一大片| 久久久久久亚洲精品国产蜜桃av| 9色porny在线观看| 亚洲一区二区三区不卡视频| 在线观看免费视频日本深夜| 国产xxxxx性猛交| 久久久国产精品麻豆| 久久久久九九精品影院| 大码成人一级视频| 国产成人免费无遮挡视频| 国产亚洲精品久久久久久毛片| 久久久久久人人人人人| 国产精品国产av在线观看| 老熟妇仑乱视频hdxx| 国产精品久久久av美女十八| 国产一区二区激情短视频| 久久人妻熟女aⅴ| 欧美人与性动交α欧美精品济南到| 精品午夜福利视频在线观看一区| 午夜日韩欧美国产| 悠悠久久av| 国产精品免费一区二区三区在线| 18禁美女被吸乳视频| x7x7x7水蜜桃| 91老司机精品| 女同久久另类99精品国产91| 嫩草影视91久久| 亚洲国产精品999在线| 搡老岳熟女国产| 欧美黑人精品巨大| 日本精品一区二区三区蜜桃| 日韩欧美三级三区| 国产欧美日韩精品亚洲av| 亚洲av成人av| 国产三级黄色录像| 一夜夜www| 三级毛片av免费| 女人精品久久久久毛片| 亚洲avbb在线观看| 老司机深夜福利视频在线观看| 日本免费一区二区三区高清不卡 | 亚洲中文字幕日韩| 国产又爽黄色视频| 久久人妻福利社区极品人妻图片| 成人手机av| 性少妇av在线| 欧美中文日本在线观看视频| 亚洲色图综合在线观看| 亚洲欧美精品综合一区二区三区| 欧美日韩黄片免| 纯流量卡能插随身wifi吗| avwww免费| 淫秽高清视频在线观看| 久久天躁狠狠躁夜夜2o2o| 精品无人区乱码1区二区| 窝窝影院91人妻| 久久午夜亚洲精品久久| 熟女少妇亚洲综合色aaa.| 中文字幕精品免费在线观看视频| 99国产极品粉嫩在线观看| 91成年电影在线观看| 久9热在线精品视频| 人妻久久中文字幕网| 男女高潮啪啪啪动态图| 男男h啪啪无遮挡| 不卡一级毛片| 亚洲激情在线av| 精品福利永久在线观看| 一边摸一边抽搐一进一小说| 亚洲男人的天堂狠狠| 欧美日韩瑟瑟在线播放| 日韩成人在线观看一区二区三区| 久久香蕉国产精品| 如日韩欧美国产精品一区二区三区| 国产亚洲欧美精品永久| 黑人操中国人逼视频| 丝袜在线中文字幕| 99热只有精品国产| 欧美成狂野欧美在线观看| 国产精华一区二区三区| 久久久国产一区二区| 高清在线国产一区| 国产精品 欧美亚洲| 黄色怎么调成土黄色| 国产精品1区2区在线观看.| 老汉色∧v一级毛片| 天天躁狠狠躁夜夜躁狠狠躁| 久久中文字幕一级| 18禁裸乳无遮挡免费网站照片 | 级片在线观看| 女同久久另类99精品国产91| 日韩欧美一区二区三区在线观看| 国产精品 国内视频| 亚洲avbb在线观看| 欧美日韩av久久| 亚洲国产毛片av蜜桃av| 国产精品二区激情视频| 色精品久久人妻99蜜桃| cao死你这个sao货| 免费在线观看亚洲国产| 高清在线国产一区| 亚洲av五月六月丁香网| 欧美日本亚洲视频在线播放| 19禁男女啪啪无遮挡网站| 久久久久九九精品影院| 国产精品久久电影中文字幕| 国产熟女xx| ponron亚洲| 88av欧美| 午夜免费激情av| 国产精品永久免费网站| a级毛片黄视频| 丁香欧美五月| 亚洲九九香蕉| 欧美中文日本在线观看视频| av电影中文网址| 人人妻,人人澡人人爽秒播| 琪琪午夜伦伦电影理论片6080| 欧美色视频一区免费| 制服人妻中文乱码| 亚洲三区欧美一区| 欧美黄色片欧美黄色片| 国产精品 国内视频| 婷婷丁香在线五月| a级毛片黄视频| 午夜影院日韩av| 一夜夜www| 午夜久久久在线观看| 亚洲精品成人av观看孕妇| 欧美老熟妇乱子伦牲交| 国产熟女午夜一区二区三区| 国产精品野战在线观看 | 精品人妻1区二区| 免费高清视频大片| 一进一出抽搐动态| 女人爽到高潮嗷嗷叫在线视频| 午夜免费成人在线视频| av在线天堂中文字幕 | 热re99久久国产66热| 最好的美女福利视频网| 亚洲国产精品一区二区三区在线| 亚洲avbb在线观看| 日韩中文字幕欧美一区二区| 亚洲熟妇中文字幕五十中出 | 国产亚洲精品久久久久久毛片| 在线免费观看的www视频| 久久午夜亚洲精品久久| 亚洲av片天天在线观看| 手机成人av网站| 国产不卡一卡二| av在线天堂中文字幕 | 午夜久久久在线观看| 亚洲va日本ⅴa欧美va伊人久久| 午夜视频精品福利| 亚洲成人国产一区在线观看| 亚洲欧洲精品一区二区精品久久久| 久久精品亚洲精品国产色婷小说| 国产真人三级小视频在线观看| 啪啪无遮挡十八禁网站| 久久影院123| 欧美日韩亚洲高清精品| 久久中文字幕一级| 免费不卡黄色视频| 欧美人与性动交α欧美软件| 日韩精品免费视频一区二区三区| 麻豆av在线久日| 午夜免费鲁丝| 欧美亚洲日本最大视频资源| 国产三级黄色录像| 人人妻人人澡人人看| 色播在线永久视频| 久久久国产欧美日韩av| 交换朋友夫妻互换小说| 高清av免费在线| 午夜激情av网站| 宅男免费午夜| 国产欧美日韩一区二区精品| 亚洲 欧美一区二区三区| 伊人久久大香线蕉亚洲五| 嫩草影院精品99| 久久草成人影院| 在线观看www视频免费| 啪啪无遮挡十八禁网站| 精品高清国产在线一区| 村上凉子中文字幕在线| 国产av又大| 热re99久久国产66热| 久久人人精品亚洲av| 国产成人精品无人区| 伦理电影免费视频| 麻豆久久精品国产亚洲av | 两人在一起打扑克的视频| 国产精品国产高清国产av| 亚洲激情在线av| 一级作爱视频免费观看| 免费日韩欧美在线观看| 精品乱码久久久久久99久播| 久久这里只有精品19| 一级a爱视频在线免费观看| 免费高清视频大片| bbb黄色大片| 亚洲一区中文字幕在线| 亚洲精品美女久久久久99蜜臀| 性少妇av在线| 女同久久另类99精品国产91| 亚洲av日韩精品久久久久久密| 人妻久久中文字幕网| 久久久久久免费高清国产稀缺| 久久精品人人爽人人爽视色| 正在播放国产对白刺激| 亚洲成人精品中文字幕电影 | 久久这里只有精品19| 老司机深夜福利视频在线观看| 精品人妻在线不人妻| 热99re8久久精品国产| 777久久人妻少妇嫩草av网站| 欧美日本中文国产一区发布| 亚洲第一欧美日韩一区二区三区| 久热爱精品视频在线9| 成人免费观看视频高清| 国产精品永久免费网站| 欧美日韩黄片免| 日日干狠狠操夜夜爽| 国产99久久九九免费精品| 国产不卡一卡二| 十分钟在线观看高清视频www| 12—13女人毛片做爰片一| 国产黄色免费在线视频| 中文字幕精品免费在线观看视频| a级片在线免费高清观看视频| 国产麻豆69| 亚洲精品成人av观看孕妇| 亚洲精品国产精品久久久不卡| 99久久精品国产亚洲精品| 水蜜桃什么品种好| 亚洲精品美女久久久久99蜜臀| 欧美中文日本在线观看视频| 每晚都被弄得嗷嗷叫到高潮| 欧美日本中文国产一区发布| 男人操女人黄网站| 国产精品av久久久久免费| 久久香蕉激情| 在线十欧美十亚洲十日本专区| 在线免费观看的www视频| 女警被强在线播放| 国产亚洲精品一区二区www| 久久天堂一区二区三区四区| 精品无人区乱码1区二区| av免费在线观看网站| 国产一区二区激情短视频| 熟女少妇亚洲综合色aaa.| 欧美日韩亚洲高清精品| 69av精品久久久久久| 国产99久久九九免费精品| 精品国产一区二区三区四区第35| 99久久国产精品久久久| 变态另类成人亚洲欧美熟女 | 精品人妻在线不人妻| x7x7x7水蜜桃| 热re99久久精品国产66热6| 99国产精品一区二区蜜桃av| 窝窝影院91人妻| 久久精品国产亚洲av香蕉五月| bbb黄色大片| 午夜激情av网站| 国产精品日韩av在线免费观看 | 十分钟在线观看高清视频www| 精品少妇一区二区三区视频日本电影| 日韩视频一区二区在线观看| 丰满迷人的少妇在线观看| 丝袜在线中文字幕| 免费人成视频x8x8入口观看| 久久久久久久久中文| 天堂动漫精品| 丰满人妻熟妇乱又伦精品不卡| 神马国产精品三级电影在线观看 | 国产精品av久久久久免费| 中文字幕最新亚洲高清| 久久人人精品亚洲av| 如日韩欧美国产精品一区二区三区| 一本综合久久免费| 亚洲第一青青草原| 美女扒开内裤让男人捅视频| 91字幕亚洲| www.www免费av| 国产免费男女视频| 成人免费观看视频高清| 国产片内射在线| 日韩成人在线观看一区二区三区| 久99久视频精品免费| 国产视频一区二区在线看| 18禁美女被吸乳视频| 久久精品国产综合久久久| 国产午夜精品久久久久久| 正在播放国产对白刺激| 在线观看免费视频网站a站| 免费在线观看黄色视频的| 欧美日韩瑟瑟在线播放| 国产午夜精品久久久久久| 狂野欧美激情性xxxx| 久久婷婷成人综合色麻豆| 精品免费久久久久久久清纯| 亚洲欧美日韩高清在线视频| 国产一区在线观看成人免费| 成人黄色视频免费在线看| 亚洲国产精品合色在线| 嫩草影院精品99| 国产高清videossex| 涩涩av久久男人的天堂| 中文欧美无线码| 日韩精品中文字幕看吧| 久久久国产精品麻豆| 免费在线观看日本一区| 99热只有精品国产| www.熟女人妻精品国产| 精品久久久久久,| 国产极品粉嫩免费观看在线| 欧美日韩黄片免| 久久精品成人免费网站| 久久久久国产精品人妻aⅴ院| 亚洲九九香蕉| 在线国产一区二区在线| 亚洲激情在线av| 亚洲男人的天堂狠狠| 亚洲国产精品sss在线观看 | 国产精品久久电影中文字幕| 亚洲精品国产区一区二| 亚洲精华国产精华精| 国产熟女xx| 成人亚洲精品一区在线观看| 午夜免费鲁丝| av视频免费观看在线观看| 亚洲男人的天堂狠狠| 搡老岳熟女国产| 欧美黄色淫秽网站| 波多野结衣高清无吗| 欧美日韩一级在线毛片| 色哟哟哟哟哟哟| 高清毛片免费观看视频网站 | 国产精品久久久av美女十八| 国产国语露脸激情在线看| 亚洲成人久久性| 大香蕉久久成人网| 午夜两性在线视频| 18美女黄网站色大片免费观看| 久久精品亚洲熟妇少妇任你| 欧美日韩乱码在线| 欧美人与性动交α欧美软件| 国内毛片毛片毛片毛片毛片| 一本大道久久a久久精品| 日韩av在线大香蕉| 又黄又爽又免费观看的视频| 狠狠狠狠99中文字幕| 欧美性长视频在线观看| 国产亚洲精品久久久久5区| 91九色精品人成在线观看| 啦啦啦 在线观看视频| 人妻丰满熟妇av一区二区三区| 男女床上黄色一级片免费看| 50天的宝宝边吃奶边哭怎么回事| 亚洲成av片中文字幕在线观看| 国产精品一区二区免费欧美| 深夜精品福利| 人人妻人人添人人爽欧美一区卜| 亚洲男人天堂网一区| 黄片播放在线免费| 国产精品二区激情视频| 我的亚洲天堂| 亚洲精品美女久久久久99蜜臀| 久久 成人 亚洲| 亚洲性夜色夜夜综合| netflix在线观看网站| 国内毛片毛片毛片毛片毛片| 精品卡一卡二卡四卡免费| 欧美午夜高清在线| 成年女人毛片免费观看观看9| 日韩成人在线观看一区二区三区| 国产色视频综合| 国产精品久久久久成人av| 免费女性裸体啪啪无遮挡网站| 高清欧美精品videossex| 欧美成人性av电影在线观看| 美女国产高潮福利片在线看| 久久亚洲真实| 在线观看66精品国产| 久久久久国内视频| 天堂俺去俺来也www色官网| 青草久久国产| 每晚都被弄得嗷嗷叫到高潮| 国产精品美女特级片免费视频播放器 | 午夜免费成人在线视频| 最新在线观看一区二区三区|