• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種改進(jìn)的GloVe詞向量表示學(xué)習(xí)方法

    2021-05-27 05:30:40石雋鋒李濟(jì)洪王瑞波
    中文信息學(xué)報(bào) 2021年4期
    關(guān)鍵詞:余弦句法語(yǔ)料

    石雋鋒,李濟(jì)洪,王瑞波

    (山西大學(xué) 現(xiàn)代教育技術(shù)學(xué)院,山西 太原 030006)

    0 引言

    近些年來(lái),在自然語(yǔ)言處理領(lǐng)域,預(yù)訓(xùn)練詞語(yǔ)分布式表示在很多任務(wù)中有很好的性能,這些任務(wù)包括文本分類[1]、問答系統(tǒng)[2]、命名實(shí)體識(shí)別[3]、語(yǔ)義角色標(biāo)注[4]等。為此,研究人員提出了很多預(yù)訓(xùn)練的語(yǔ)言模型[5-9],較為典型的方法有SENNA模型[5]、Word2Vec模型[6]、GloVe模型[7]、ELMo模型[8]、BERT模型[9]。其中,GloVe模型基于任意兩個(gè)詞之間的全局共現(xiàn)信息,再采用Log-Bilinear模型學(xué)習(xí)得到詞向量表示,在多項(xiàng)評(píng)測(cè)任務(wù)中表現(xiàn)良好。通常情況下,得到的詞向量的維數(shù)越高模型性能越好,但維數(shù)越大則訓(xùn)練耗時(shí)越長(zhǎng)。一個(gè)自然的想法是,利用并行計(jì)算分別學(xué)習(xí)較低維數(shù)的詞向量再拼接,能否得到性能更高的詞向量?事實(shí)上,在GloVe模型中,共現(xiàn)矩陣的統(tǒng)計(jì)方法采用了兩種,一種是對(duì)稱窗口的方法,即取目標(biāo)詞兩側(cè)固定窗口內(nèi)的詞語(yǔ)作為其上下文;另一種是非對(duì)稱窗口的方法,即取目標(biāo)詞左側(cè)的固定窗口內(nèi)的詞語(yǔ)作為其上下文,不同的共現(xiàn)矩陣會(huì)反映不同的句法和語(yǔ)義信息。為此,在GloVe模型中,本文以對(duì)稱和非對(duì)稱窗口統(tǒng)計(jì)得到兩個(gè)共現(xiàn)矩陣,分別學(xué)習(xí)得到詞向量表示,然后再采用拼接的方式,得到較高維度的詞向量表示。在驗(yàn)證實(shí)驗(yàn)中,我們分別學(xué)習(xí)得到的300維向量,再拼接得到600維向量表示,在中文和英文的詞語(yǔ)推斷任務(wù)的評(píng)測(cè)集上,預(yù)測(cè)的準(zhǔn)確率得到顯著提升。

    1 相關(guān)工作

    在自然語(yǔ)言處理領(lǐng)域,詞語(yǔ)的分布式表示(distributional representation)是將詞的上下文信息表示為詞向量的形式,這種詞向量構(gòu)建的基礎(chǔ)是1957年Firth提出的分布式假說(shuō)(distributional hypothesis)[10],即一個(gè)詞語(yǔ)的語(yǔ)義信息是由其周圍的詞語(yǔ)來(lái)刻畫的(a word is characterized by the company it keeps)。科研人員提出了多種詞向量的構(gòu)造方法。Burgess 等[11]構(gòu)造的詞向量的每一維上表示目標(biāo)詞和其上下文詞語(yǔ)共現(xiàn)的頻次,而有些研究人員[12-13]用目標(biāo)詞和它的上下文的逐點(diǎn)互信息(pointwise mutual information,PMI)或正逐點(diǎn)互信息(positive pointwise mutual information,PPMI)代替了頻次。詞語(yǔ)的共現(xiàn)范圍通常用滑動(dòng)窗口的方法來(lái)實(shí)現(xiàn)[11],給定窗口的大小為w,通過(guò)在語(yǔ)料上逐詞地滑動(dòng)窗口。在每個(gè)窗口里,共現(xiàn)的詞對(duì)的頻次的和形成共現(xiàn)矩陣,詞對(duì)是有序的,即只統(tǒng)計(jì)目標(biāo)詞左側(cè)上下文的頻次,而把目標(biāo)詞和上下文交換角色后,就可以得到目標(biāo)詞右側(cè)上下文的頻次。文獻(xiàn)[14]系統(tǒng)地比較了不同的距離測(cè)度對(duì)不同的共現(xiàn)矩陣(PMI共現(xiàn)矩陣、PPMI共現(xiàn)矩陣)得到的詞向量在各種任務(wù)上的性能。在PPMI共現(xiàn)矩陣中,分出了四種共現(xiàn)矩陣,即基于左側(cè)共現(xiàn)、右側(cè)共現(xiàn)、及左右側(cè)共現(xiàn)相加、左右側(cè)共現(xiàn)拼接的共現(xiàn)矩陣,依次表示為:L,R,L+R,L&R,在語(yǔ)義聚類任務(wù)和句法聚類任務(wù)上比較了基于四種共現(xiàn)矩陣的性能,發(fā)現(xiàn)在語(yǔ)義聚類任務(wù)上,基于L&R的詞向量性能略高于基于L+R的詞向量;在句法聚類任務(wù)上,基于L&R的詞向量在維數(shù)較高的情況下,性能顯著高于基于L+R的詞向量。詞語(yǔ)的分布式表示是高維的、稀疏的向量,不利于進(jìn)行語(yǔ)義計(jì)算。為此,科研人員提出了一些降低維度的方法,文獻(xiàn)[15]對(duì)詞對(duì)的頻次排序,設(shè)定閾值,刪掉詞對(duì)頻次低于閾值的維數(shù),使得詞向量的維數(shù)大大降低。文獻(xiàn)[16]提出了奇異值分解方法,將文檔矩陣進(jìn)行分解,降低了詞向量的維數(shù),文獻(xiàn)[17]是對(duì)共現(xiàn)的PPMI矩陣進(jìn)行因式分解。近些年來(lái),科研人員通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練詞語(yǔ)的低維表示。Word2Vec模型[6]包括CBOW模型和Skip-gram模型,目標(biāo)函數(shù)為目標(biāo)詞和上下文的關(guān)系,CBOW模型的目標(biāo)函數(shù)為通過(guò)上下文預(yù)測(cè)目標(biāo)詞,而Skip-gram模型的目標(biāo)函數(shù)為通過(guò)目標(biāo)詞預(yù)測(cè)上下文。文獻(xiàn)[18-21]都是在CBOW和Skip-gram模型基礎(chǔ)上進(jìn)一步考慮了詞語(yǔ)在句子中的位置以及和目標(biāo)詞的關(guān)聯(lián)程度提出的改進(jìn)模型,這些模型在句法任務(wù)上性能均有所提升。文獻(xiàn)[18]采用了基于句法關(guān)系的上下文訓(xùn)練的詞向量作為依存句法解析的特征,來(lái)提高模型性能。文獻(xiàn)[19]在CBOW模型和Skip-gram模型的基礎(chǔ)上添加更多的參數(shù),保留上下文和目標(biāo)詞之間的位置信息。但模型的復(fù)雜度會(huì)隨著窗口的增大線性增加。文獻(xiàn)[20]在CBOW模型的基礎(chǔ)上,根據(jù)上下文的不同類型以及和目標(biāo)詞的相對(duì)位置的不同,為上下文分配不同的權(quán)重。文獻(xiàn)[21]引入一個(gè)方向向量來(lái)表示上下文是在目標(biāo)詞的左邊還是右邊,從而提高Skip-gram模型的性能。文獻(xiàn)[22]提出了采用基于句法關(guān)系的上下文訓(xùn)練詞向量的方法,在Skip-gram模型上,比較了基于句法關(guān)系的上下文和基于滑動(dòng)窗口的上下文訓(xùn)練得到的詞向量,發(fā)現(xiàn)通過(guò)基于句法關(guān)系的詞向量找到的相似詞語(yǔ)中功能型相似(functional similarity)的詞語(yǔ)比較多,基于滑動(dòng)窗口的詞向量找到的相似詞語(yǔ)中主題相似(topical similarity)的詞語(yǔ)比較多,例如,“佛羅里達(dá)州”在第一種上下文的詞向量下得到的相似的詞語(yǔ)為其所屬的國(guó)家或者它包含的城市,在第二種上下文的詞向量下得到的相似詞語(yǔ)是美國(guó)的一些其他的州。因此基于滑動(dòng)窗口上下文的詞向量表示和基于句法上下文的詞向量表示各有優(yōu)劣。應(yīng)當(dāng)把這兩種詞向量表示結(jié)合起來(lái)使用?;贕loVe模型有兩種統(tǒng)計(jì)共現(xiàn)矩陣的方式,一種是對(duì)稱窗口方式,沒有考慮詞語(yǔ)順序;另一種是非對(duì)稱窗口方式,考慮了上下文在目標(biāo)詞的前后順序。因此,我們有必要將兩種共現(xiàn)矩陣得到的詞向量結(jié)合起來(lái),得到精度更高的詞向量表示,來(lái)更好地完成語(yǔ)義和句法任務(wù)。

    2 GloVe模型

    GloVe模型可以分別訓(xùn)練出基于對(duì)稱共現(xiàn)矩陣的低維詞向量和基于非對(duì)稱共現(xiàn)矩陣的低維詞向量。

    GloVe模型訓(xùn)練基于對(duì)稱共現(xiàn)矩陣的低維詞向量的步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (3) 用vS表示基于對(duì)稱共現(xiàn)矩陣訓(xùn)練得到的低維詞向量。訓(xùn)練vS的目標(biāo)函數(shù)如式(1)所示。

    (1)

    GloVe模型訓(xùn)練基于非對(duì)稱共現(xiàn)矩陣的低維詞向量的步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (3) 用vA表示基于左側(cè)共現(xiàn)矩陣訓(xùn)練得到的低維詞向量。訓(xùn)練vA的目標(biāo)函數(shù)如式(2)所示。

    (2)

    3 GloVe詞向量拼接模型

    本文提出了GloVe詞向量拼接模型,該模型并行訓(xùn)練出只有一半維數(shù)的vA和vS,再將它們拼接起來(lái),完成詞語(yǔ)推斷任務(wù)。具體步驟如下:

    (1) 從語(yǔ)料庫(kù)統(tǒng)計(jì)出詞表。從給定語(yǔ)料庫(kù)統(tǒng)計(jì)每個(gè)不同的詞語(yǔ)出現(xiàn)的次數(shù),按照頻次從高到低排序,ci表示第i個(gè)詞,fi表示第i個(gè)詞的頻次,1≤i≤n,其中n為語(yǔ)料庫(kù)中不同的詞語(yǔ)個(gè)數(shù)。

    (2) 設(shè)定固定窗口大小為w,依次遍歷語(yǔ)料庫(kù)中的詞語(yǔ),并行統(tǒng)計(jì)出左側(cè)共現(xiàn)矩陣和對(duì)稱共現(xiàn)矩陣XL和XS。兩個(gè)矩陣的大小都為n×n。XL和XS都是按詞頻排序的。

    (3) 并行打亂XL和XS的順序。

    (4) 在兩個(gè)處理器上,設(shè)置維數(shù)為GloVe模型的一半,分別用式(1)訓(xùn)練出vS,用式(2)訓(xùn)練出vA。

    (5) 將vA和vS拼接起來(lái)作為詞語(yǔ)的低維詞表示。

    4 實(shí)驗(yàn)

    實(shí)驗(yàn)環(huán)境為山西大學(xué)高性能計(jì)算平臺(tái)。

    4.1 在英文詞語(yǔ)推斷任務(wù)上比較

    從English Wikipedia語(yǔ)料分割出三個(gè)不同大小的語(yǔ)料,分別包含2億、5億、10億個(gè)單詞,文件大小分別為1.09 GB、2.71 GB、5.42 GB?;瑒?dòng)窗口大小(window-size)設(shè)置為10,詞典中的最大詞數(shù)(max-vocab)設(shè)為100 000,用GloVe模型訓(xùn)練出600維的vS和vA,用GloVe詞向量拼接模型訓(xùn)練出600維的vS和vA的拼接向量(vS和vA的維數(shù)都是300維),在詞語(yǔ)推斷任務(wù)[3]上比較它們的準(zhǔn)確率,實(shí)驗(yàn)結(jié)果如下,詞語(yǔ)推斷任務(wù)的測(cè)試集包括語(yǔ)義任務(wù)(capital:country,city:state,family)和句法任務(wù)(adjective:adverb,opposite,comparative等),結(jié)果如表1~表3所示。

    從表1可以看出,GloVe詞向量拼接模型得到的詞向量在語(yǔ)義任務(wù)、句法任務(wù)和總?cè)蝿?wù)上的準(zhǔn)確率均有不同程度的提升,句法任務(wù)和總?cè)蝿?wù)上提升較大。從表2和表3可以看出,GloVe詞向量拼接模型得到的詞向量在句法任務(wù)上有較大提升,在總?cè)蝿?wù)上準(zhǔn)確率也有所提升。綜合表1到表3,GloVe詞向量拼接模型在句法任務(wù)上性 能較好,在較小的語(yǔ)料庫(kù)上性能提升得較大。隨著語(yǔ)料規(guī)模的擴(kuò)大,在“vA拼接vS”詞向量下,語(yǔ)義任務(wù)上的準(zhǔn)確率先升后降(82.01%→84.62%→84.40%),這是因?yàn)閙ax-vocab參數(shù)的設(shè)置,該參數(shù)限制了詞典的最大詞數(shù),在不同大小的語(yǔ)料上,詞典里的詞按照頻次從高到低排序,詞數(shù)相同,使得保留下來(lái)的詞并不相同,較大的語(yǔ)料保留了詞頻較高的詞,但可能刪去了一些有意義的上下文詞語(yǔ)。因此,語(yǔ)料大也可能使準(zhǔn)確率下降。由于實(shí)驗(yàn)?zāi)康氖潜容^在相同語(yǔ)料規(guī)模下,GloVe模型訓(xùn)練出詞向量和GloVe詞向量拼接模型訓(xùn)練出的詞向量的性能,因此,沒有考慮三個(gè)語(yǔ)料下要統(tǒng)一詞表。

    表1 1.09 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    表2 2.71 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    表3 5.42 GB English Wikipedia語(yǔ)料下的比較結(jié)果 (單位:%)

    4.2 在中文詞語(yǔ)推斷任務(wù)上比較

    本文在中文的詞語(yǔ)推斷任務(wù)上也做了相同的實(shí)驗(yàn),中文語(yǔ)料采用1998年和2000年人民日?qǐng)?bào)語(yǔ)料合并后的語(yǔ)料,大小為186 MB,中文的詞語(yǔ)推斷任務(wù)的測(cè)試集是文獻(xiàn)[23]提供的,只包含語(yǔ)義任務(wù)(首都:國(guó)家,省會(huì):省,家庭關(guān)系),用GloVe模型訓(xùn)練出600維的vS和vA,用GloVe詞向量拼接模型訓(xùn)練出600維的vS和vA的拼接向量(vS和vA的維數(shù)都是300維),在中文的詞語(yǔ)推斷任務(wù)上進(jìn)行比較,實(shí)驗(yàn)結(jié)果如表4所示。

    表4 人民日?qǐng)?bào)語(yǔ)料下的比較結(jié)果 (單位:%)

    從表中的數(shù)據(jù)可以看出,GloVe詞向量拼接模型得到的詞向量準(zhǔn)確率有大幅提高。

    4.3 顯著性檢驗(yàn)

    本文對(duì)表1中的數(shù)據(jù)用χ2檢驗(yàn)方法進(jìn)行了顯著性檢驗(yàn),如式(3)所示。

    (3)

    在本實(shí)驗(yàn)中,n01表示使用GloVe詞向量拼接模型預(yù)測(cè)錯(cuò)誤而GloVe模型預(yù)測(cè)正確的詞語(yǔ)個(gè)數(shù),n10表示使用GloVe詞向量拼接模型預(yù)測(cè)正確而GloVe模型預(yù)測(cè)錯(cuò)誤的詞語(yǔ)個(gè)數(shù),通過(guò)計(jì)算得到的χ2值如表5所示。

    表5 “vS”和“vA 拼接vS”在各個(gè)任務(wù)上的χ2值

    4.4 詞語(yǔ)聚類的示例

    詞語(yǔ)聚類的效果可以檢驗(yàn)詞向量性能。通常可以通過(guò)計(jì)算詞語(yǔ)向量的相鄰詞,觀察這些學(xué)習(xí)到的詞向量表示的好壞。本文采用詞向量的余弦相似度來(lái)度量詞語(yǔ)的相鄰程度。采用4.2節(jié)訓(xùn)練的詞向量。表6和表7分別列出了在“vS”“vA”和“vA拼接vS”的詞向量下,英國(guó)、德國(guó)最相鄰的10個(gè)詞。

    表6 “英國(guó)”在“vS”、“vA”和“vA拼接vS”詞向量下的10近鄰詞及余弦相似度

    表7 “德國(guó)”在“vS”、“vA”和“vA拼接vS”下的10個(gè)近鄰詞及余弦相似度

    可以看出,與“vS”與“vA”詞向量相比,在“vA拼接vS”詞向量下,詞語(yǔ)的余弦相似度較大,說(shuō)明聚在一起的相似的詞語(yǔ)比較多。

    通過(guò)列出的10個(gè)近鄰詞語(yǔ)可以看出,在“vS”詞向量下,列出了更多語(yǔ)義上比較接近的詞,在“vA”詞向量下,列出了更多句法上接近的詞語(yǔ),在“vA拼接vS”詞向量下,列出了更多句法和語(yǔ)義上接近的詞語(yǔ)。

    比如,在“英國(guó)”的10個(gè)近鄰詞中,在“vS”詞向量下,“英國(guó)”的相鄰詞中包括“牛津”,而在“vA”詞向量下沒有這個(gè)詞;在“vA”詞向量下,“英國(guó)”的相鄰詞中包括“美國(guó)”“日本”“澳大利亞”,而在“vS”詞向量下沒有這些詞。在“vA拼接vS”詞向量下,“英國(guó)”的10個(gè)近鄰詞中包括“美國(guó)”“日本”,不包括“牛津”“澳大利亞”。但“英國(guó)”的第14近鄰詞為“澳大利亞”,和“英國(guó)”詞向量的余弦相似度為0.502 7,“英國(guó)”的第15近鄰詞為“牛津”,和“英國(guó)”詞向量的余弦相似度為0.495 3。雖然這兩個(gè)詞不在“英國(guó)”的前10個(gè)近鄰祠內(nèi),但是,在“vA拼接vS”下,這兩個(gè)詞和“英國(guó)”的余弦相似度分別比在“vA”和“vS”詞向量下的大。例如,在“vA拼接vS”下,“澳大利亞”和“英國(guó)”的詞向量的余弦相似度為0.502 7,0.502 7>0.424 7(“vA”下“英國(guó)”和“澳大利亞”的余弦相似度),同樣,在“vA拼接vS”下,“牛津”和“英國(guó)”的詞向量的余弦相似度為0.495 3,0.495 3>0.459 5(vS下“英國(guó)”和“牛津”的余弦相似度)。同樣,在“vA拼接vS”下,“美國(guó)”“日本”和“英國(guó)”的余弦相似度比“vA”詞向量下的余弦相似度大。

    比如,在“德國(guó)”的10個(gè)近鄰詞中,在“vS”詞向量下,“德國(guó)”的相鄰詞中包括“施羅德”(德國(guó)前總理)、“納粹”,而在“vA”詞向量下沒有這兩個(gè)詞。在“vA”詞向量下,“德國(guó)”的相鄰詞中包括“荷蘭”“日本”,而在“vS”詞向量下沒有這些詞。在“vA拼接vS”詞向量下,“德國(guó)”的10個(gè)近鄰詞中包括“施羅德”“荷蘭”“日本”,不包括“納粹”。但“德國(guó)”的第22近鄰詞為“納粹”,余弦相似度比“vS”詞向量下的大,為0.482 9,0.482 9>0.439 5(“vS”下“德國(guó)”和“納粹”的余弦相似度)。在“vA拼接vS”詞向量下,“德國(guó)”的第7近鄰詞為“日本”,余弦相似度為0.578 7,0.578 7>0.439 7(“vA”下“德國(guó)”和“日本”的余弦相似度)。在“vA拼接vS”詞向量下,“施羅德”“荷蘭”的余弦相似度分別比在“vS”和“vA”詞向量下的大,由于篇幅所限,在此不一一列舉。

    總的來(lái)說(shuō),在“vA拼接vS”下,詞語(yǔ)的近鄰詞中包括了更多語(yǔ)義和句法上相近的詞語(yǔ)。“vA拼接vS”得到的詞向量在詞語(yǔ)聚類上的表現(xiàn)優(yōu)于“vS”和“vA”詞向量。

    4.5 運(yùn)行時(shí)間

    本文統(tǒng)計(jì)了4.1節(jié)在1.09 GB的English Wikipedia語(yǔ)料下完成詞語(yǔ)推斷任務(wù)時(shí),GloVe模型和GloVe詞向量拼接模型運(yùn)行的時(shí)間,如表8所示。

    表8 1.09 GB English Wikipedia語(yǔ)料下的運(yùn)行時(shí)間

    因此,對(duì)GloVe模型,采用并行的訓(xùn)練學(xué)習(xí)方法,既可以提高詞向量的性能,又能節(jié)省訓(xùn)練時(shí)間。

    4.6 實(shí)驗(yàn)結(jié)果分析

    從大部分的詞語(yǔ)推斷任務(wù)和聚類任務(wù)的實(shí)驗(yàn)結(jié)果可以看出,“vA拼接vS”詞向量在語(yǔ)義任務(wù)和句法任務(wù)上都超過(guò)了“vS”詞向量和“vA”詞向量。原因是“vS”詞向量和“vA”詞向量共現(xiàn)矩陣構(gòu)造過(guò)程不同,反映的句法和語(yǔ)義信息也不同?!皏A拼接vS”詞向量能夠體現(xiàn)更完整的句法和語(yǔ)義信息。

    “vS”詞向量的共現(xiàn)矩陣構(gòu)造方法為:在語(yǔ)料庫(kù)上,從開始位置滑動(dòng)固定大小的窗口,統(tǒng)計(jì)目標(biāo)詞兩側(cè)固定窗口內(nèi)的詞語(yǔ)的頻次,生成對(duì)稱共現(xiàn)矩陣。

    “vA”詞向量的共現(xiàn)矩陣構(gòu)造方法為:在語(yǔ)料庫(kù)上,從開始位置滑動(dòng)固定大小的窗口,統(tǒng)計(jì)目標(biāo)詞左側(cè)固定窗口內(nèi)的詞語(yǔ)的頻次,生成左側(cè)共現(xiàn)矩陣。左側(cè)共現(xiàn)矩陣的轉(zhuǎn)置即為右側(cè)共現(xiàn)矩陣,因此右側(cè)共現(xiàn)矩陣不需要單獨(dú)統(tǒng)計(jì)。

    “vA”詞向量的共現(xiàn)矩陣保存了詞語(yǔ)在目標(biāo)詞左右的位置信息,而“vS” 詞向量的共現(xiàn)矩陣將目標(biāo)詞左側(cè)和右側(cè)的相同詞語(yǔ)的頻次求和,使得共現(xiàn)矩陣中混合了目標(biāo)詞之前和之后的上下文詞語(yǔ)?!皏A”詞向量聚類能將句法相近的詞語(yǔ)更好地聚在一起,而“vS”詞向量聚類能將語(yǔ)義相近的詞更好地聚在一起。因此,“vA”詞向量更多地體現(xiàn)句法信息,而“vS”詞向量更多地體現(xiàn)語(yǔ)義信息。

    “vA拼接vS”詞向量是將“vA”詞向量和“vS”詞向量拼接起來(lái),融入了“vA”詞向量和“vS”詞向量的信息,因此該詞向量能體現(xiàn)更多的句法和語(yǔ)義信息。

    5 結(jié)論與展望

    事實(shí)上,表示學(xué)習(xí)的理論依據(jù)是詞的意義是由與其共現(xiàn)的詞來(lái)體現(xiàn)的,意義的不同體現(xiàn)了其共現(xiàn)詞語(yǔ)的差異。GloVe模型中共現(xiàn)是以滑動(dòng)窗口的方式來(lái)統(tǒng)計(jì)的,顯然,對(duì)許多詞,使用詞的左側(cè)、右側(cè)窗口或?qū)ΨQ窗口來(lái)計(jì)算共現(xiàn)能夠體現(xiàn)詞組合的不同分布特性。因此,采用多種方式而不是僅僅用對(duì)稱窗口方式得到共現(xiàn)矩陣,應(yīng)該可以學(xué)習(xí)到更為準(zhǔn)確的詞表示向量。

    本文提出了GloVe詞向量拼接模型,使用不同的共現(xiàn)矩陣,并采用并行處理分別學(xué)習(xí)較低維度的詞向量,再采用拼接方式得到較高維度的詞向量表示,減少了詞向量的訓(xùn)練時(shí)間。實(shí)驗(yàn)結(jié)果表明,由GloVe拼接模型得到的詞向量在詞語(yǔ)推斷任務(wù)上和詞語(yǔ)聚類任務(wù)上性能有顯著提升。下一步我們將研究如何得到反映多種層面信息的共現(xiàn)矩陣,有效集成多種詞表示向量,提高表示學(xué)習(xí)的性能。

    猜你喜歡
    余弦句法語(yǔ)料
    句法與句意(外一篇)
    述謂結(jié)構(gòu)與英語(yǔ)句法配置
    句法二題
    詩(shī)詞聯(lián)句句法梳理
    兩個(gè)含余弦函數(shù)的三角母不等式及其推論
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    分?jǐn)?shù)階余弦變換的卷積定理
    圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    欧美少妇被猛烈插入视频| 九色亚洲精品在线播放| 国产黄色视频一区二区在线观看| 久久久a久久爽久久v久久| 久久精品国产亚洲av涩爱| 边亲边吃奶的免费视频| 久久人人爽人人爽人人片va| 午夜福利影视在线免费观看| 国产亚洲av片在线观看秒播厂| 日本黄色日本黄色录像| 欧美日韩视频精品一区| 色哟哟·www| 精品少妇内射三级| 嘟嘟电影网在线观看| 欧美变态另类bdsm刘玥| 久久免费观看电影| 自拍欧美九色日韩亚洲蝌蚪91| 国产免费一区二区三区四区乱码| 久久精品国产a三级三级三级| 欧美日本中文国产一区发布| 一区二区三区精品91| 国产欧美另类精品又又久久亚洲欧美| 国产精品 国内视频| 日本猛色少妇xxxxx猛交久久| 欧美激情极品国产一区二区三区 | 曰老女人黄片| 丰满少妇做爰视频| 亚洲精品第二区| 欧美成人午夜免费资源| 日本91视频免费播放| 热99久久久久精品小说推荐| 女人久久www免费人成看片| 在线天堂最新版资源| 天堂中文最新版在线下载| 国产精品 国内视频| 女人精品久久久久毛片| 久久午夜综合久久蜜桃| 插阴视频在线观看视频| 少妇熟女欧美另类| 亚洲不卡免费看| 亚洲人成网站在线观看播放| .国产精品久久| 日本黄大片高清| 人成视频在线观看免费观看| 久久热精品热| 一区二区三区精品91| 久久精品久久久久久噜噜老黄| 亚洲色图 男人天堂 中文字幕 | 亚洲第一av免费看| 人体艺术视频欧美日本| 亚洲精品久久久久久婷婷小说| 看非洲黑人一级黄片| 欧美三级亚洲精品| 色94色欧美一区二区| 国产成人精品福利久久| 天天操日日干夜夜撸| 这个男人来自地球电影免费观看 | 少妇人妻久久综合中文| 免费不卡的大黄色大毛片视频在线观看| 欧美国产精品一级二级三级| 狂野欧美激情性xxxx在线观看| 青青草视频在线视频观看| 亚洲欧美日韩卡通动漫| 精品少妇久久久久久888优播| 简卡轻食公司| 在线播放无遮挡| 久久热精品热| 黄色怎么调成土黄色| 麻豆精品久久久久久蜜桃| 午夜免费男女啪啪视频观看| 久久99蜜桃精品久久| 久久ye,这里只有精品| a级毛色黄片| 日韩在线高清观看一区二区三区| 欧美精品一区二区免费开放| 日日摸夜夜添夜夜爱| 中文字幕制服av| 91精品三级在线观看| 亚洲精品久久久久久婷婷小说| 3wmmmm亚洲av在线观看| 国产精品无大码| 精品人妻偷拍中文字幕| 成人毛片a级毛片在线播放| 久久精品久久久久久噜噜老黄| 国产精品免费大片| 日韩av免费高清视频| av在线播放精品| 亚洲欧美一区二区三区国产| 久久久久久久久久久丰满| 久久久国产欧美日韩av| 久久这里有精品视频免费| 色5月婷婷丁香| 熟女av电影| 国产成人精品福利久久| 日韩人妻高清精品专区| 两个人的视频大全免费| 国产精品久久久久久久电影| 观看av在线不卡| 国产黄片视频在线免费观看| 如何舔出高潮| 全区人妻精品视频| a级毛片免费高清观看在线播放| 亚洲欧美中文字幕日韩二区| 伦精品一区二区三区| 大香蕉久久成人网| 人人澡人人妻人| 久久精品久久久久久久性| 国产一区二区三区综合在线观看 | 天美传媒精品一区二区| 十八禁高潮呻吟视频| videosex国产| 亚洲激情五月婷婷啪啪| 18在线观看网站| 2022亚洲国产成人精品| 午夜福利网站1000一区二区三区| 亚洲精品久久久久久婷婷小说| av又黄又爽大尺度在线免费看| 国产男女内射视频| 最后的刺客免费高清国语| 韩国av在线不卡| 中文字幕人妻熟人妻熟丝袜美| 久久久精品免费免费高清| 午夜福利,免费看| 日本免费在线观看一区| 高清黄色对白视频在线免费看| 国产 一区精品| 日本猛色少妇xxxxx猛交久久| 精品卡一卡二卡四卡免费| 一边摸一边做爽爽视频免费| 高清视频免费观看一区二区| 精品久久久久久电影网| 男人爽女人下面视频在线观看| av在线老鸭窝| 新久久久久国产一级毛片| 超色免费av| 全区人妻精品视频| 2022亚洲国产成人精品| 国产一区二区在线观看av| 一区在线观看完整版| 亚洲一级一片aⅴ在线观看| 亚洲精品视频女| 精品午夜福利在线看| 插阴视频在线观看视频| 亚洲精品一区蜜桃| 亚洲性久久影院| 亚洲少妇的诱惑av| 99国产精品免费福利视频| 老司机影院毛片| 亚洲av中文av极速乱| 亚州av有码| 99九九在线精品视频| 亚洲美女搞黄在线观看| 亚洲精品一区蜜桃| www.av在线官网国产| 插逼视频在线观看| 哪个播放器可以免费观看大片| 午夜久久久在线观看| 毛片一级片免费看久久久久| 国产精品国产三级国产专区5o| 久久精品熟女亚洲av麻豆精品| 夜夜看夜夜爽夜夜摸| 欧美日韩精品成人综合77777| 成人漫画全彩无遮挡| 狂野欧美激情性bbbbbb| 亚洲三级黄色毛片| 黄色一级大片看看| 只有这里有精品99| 日本vs欧美在线观看视频| 久久久久人妻精品一区果冻| 丝袜美足系列| 如何舔出高潮| 男女无遮挡免费网站观看| .国产精品久久| 亚洲av成人精品一二三区| 亚洲色图综合在线观看| 国产精品熟女久久久久浪| 午夜av观看不卡| 国产一区二区在线观看av| 99九九线精品视频在线观看视频| 成年人午夜在线观看视频| 91精品国产九色| 欧美97在线视频| 国产成人精品在线电影| 亚洲精品久久久久久婷婷小说| 久久久精品94久久精品| 亚洲av免费高清在线观看| av在线老鸭窝| 日本黄大片高清| 国产成人精品婷婷| 欧美日韩国产mv在线观看视频| 亚洲国产欧美日韩在线播放| 欧美激情国产日韩精品一区| 母亲3免费完整高清在线观看 | 久久精品夜色国产| 免费少妇av软件| 波野结衣二区三区在线| 在线观看免费日韩欧美大片 | 国产一区有黄有色的免费视频| 国产不卡av网站在线观看| 亚洲激情五月婷婷啪啪| 一区在线观看完整版| 欧美日本中文国产一区发布| 成年美女黄网站色视频大全免费 | 热re99久久精品国产66热6| 国产一区二区在线观看日韩| www.色视频.com| 精品一区在线观看国产| 亚洲综合色网址| 亚洲av.av天堂| 国产精品久久久久久精品电影小说| 免费黄频网站在线观看国产| 久久精品国产亚洲av涩爱| 成人毛片60女人毛片免费| 国产 一区精品| 欧美精品一区二区大全| 欧美亚洲日本最大视频资源| 国产欧美日韩一区二区三区在线 | 欧美成人精品欧美一级黄| 久久婷婷青草| 一级毛片黄色毛片免费观看视频| 如日韩欧美国产精品一区二区三区 | 久久99精品国语久久久| av免费观看日本| 一级毛片 在线播放| 国产成人免费观看mmmm| 男女边吃奶边做爰视频| av电影中文网址| 亚洲精品中文字幕在线视频| 午夜视频国产福利| 伊人久久精品亚洲午夜| 亚洲经典国产精华液单| 制服诱惑二区| 亚洲av免费高清在线观看| 国产成人一区二区在线| 高清av免费在线| 国产无遮挡羞羞视频在线观看| 精品国产一区二区三区久久久樱花| a级毛片免费高清观看在线播放| 亚洲美女搞黄在线观看| 最新的欧美精品一区二区| 美女内射精品一级片tv| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 亚洲性久久影院| 各种免费的搞黄视频| 婷婷色av中文字幕| 伊人亚洲综合成人网| 国产免费视频播放在线视频| 国产毛片在线视频| 午夜久久久在线观看| 自线自在国产av| a级毛片在线看网站| 亚洲成人手机| 亚洲,欧美,日韩| 各种免费的搞黄视频| 亚洲国产欧美日韩在线播放| 天天躁夜夜躁狠狠久久av| 久久韩国三级中文字幕| 欧美激情国产日韩精品一区| 九色成人免费人妻av| 久久精品国产a三级三级三级| a级毛片在线看网站| 精品国产国语对白av| 亚洲无线观看免费| 国产精品三级大全| 欧美一级a爱片免费观看看| av福利片在线| 一级黄片播放器| 欧美日韩综合久久久久久| 搡老乐熟女国产| 老女人水多毛片| 久久99蜜桃精品久久| 亚洲av免费高清在线观看| 少妇高潮的动态图| 人人澡人人妻人| 中文字幕久久专区| 国产一区二区在线观看av| 天堂俺去俺来也www色官网| av.在线天堂| 国精品久久久久久国模美| 午夜免费观看性视频| 国产成人免费观看mmmm| 女的被弄到高潮叫床怎么办| 国产精品国产三级专区第一集| 最近手机中文字幕大全| 欧美老熟妇乱子伦牲交| 久久久久精品久久久久真实原创| 另类精品久久| 亚洲精品久久久久久婷婷小说| 插阴视频在线观看视频| 亚洲人成77777在线视频| 中国国产av一级| 久久久久久久亚洲中文字幕| 国产成人91sexporn| 999精品在线视频| 欧美精品人与动牲交sv欧美| 国产在视频线精品| 人人妻人人澡人人爽人人夜夜| 国产视频首页在线观看| 黄色欧美视频在线观看| 97超视频在线观看视频| 亚洲国产精品国产精品| 日本av免费视频播放| 欧美xxxx性猛交bbbb| 肉色欧美久久久久久久蜜桃| 国产成人a∨麻豆精品| 久久毛片免费看一区二区三区| 亚洲av男天堂| 丝袜在线中文字幕| 亚洲精品,欧美精品| 亚洲精品国产av成人精品| 人人妻人人爽人人添夜夜欢视频| 青春草亚洲视频在线观看| 精品视频人人做人人爽| 国产一区亚洲一区在线观看| 黑人巨大精品欧美一区二区蜜桃 | 久久综合国产亚洲精品| 国产淫语在线视频| 久久久久视频综合| videos熟女内射| 少妇丰满av| 亚洲欧美日韩另类电影网站| 亚洲av国产av综合av卡| 亚洲精品第二区| 在线看a的网站| videossex国产| 久久鲁丝午夜福利片| 搡老乐熟女国产| 日韩欧美一区视频在线观看| 久久人人爽人人爽人人片va| 男女无遮挡免费网站观看| 97超视频在线观看视频| 午夜影院在线不卡| 免费不卡的大黄色大毛片视频在线观看| 国产爽快片一区二区三区| 制服诱惑二区| 欧美成人精品欧美一级黄| 成人手机av| 久久久久国产精品人妻一区二区| 美女大奶头黄色视频| 在现免费观看毛片| 久久99一区二区三区| 一级毛片我不卡| www.av在线官网国产| 免费av中文字幕在线| 亚洲av成人精品一区久久| 国产午夜精品久久久久久一区二区三区| 99九九线精品视频在线观看视频| 免费日韩欧美在线观看| 国产精品久久久久久久久免| 尾随美女入室| 成人毛片a级毛片在线播放| av播播在线观看一区| 中国三级夫妇交换| 999精品在线视频| 在线观看免费日韩欧美大片 | 欧美日韩精品成人综合77777| 欧美丝袜亚洲另类| 成人手机av| 国产亚洲一区二区精品| 午夜av观看不卡| 天堂俺去俺来也www色官网| 汤姆久久久久久久影院中文字幕| 国产乱来视频区| 91午夜精品亚洲一区二区三区| 水蜜桃什么品种好| 亚洲精品视频女| 国产成人aa在线观看| 高清黄色对白视频在线免费看| 亚洲欧美清纯卡通| 肉色欧美久久久久久久蜜桃| 在线 av 中文字幕| 亚洲av欧美aⅴ国产| 在现免费观看毛片| 母亲3免费完整高清在线观看 | 国产亚洲最大av| 少妇的逼水好多| 97在线视频观看| 精品人妻在线不人妻| 国产亚洲欧美精品永久| h视频一区二区三区| 九色成人免费人妻av| 成年女人在线观看亚洲视频| 一级a做视频免费观看| 一区二区日韩欧美中文字幕 | 色视频在线一区二区三区| 中国美白少妇内射xxxbb| 中国国产av一级| 亚洲性久久影院| 天美传媒精品一区二区| 成人免费观看视频高清| 一区二区三区免费毛片| 熟女电影av网| 国产精品熟女久久久久浪| 三级国产精品欧美在线观看| 久久久久国产精品人妻一区二区| 国产精品成人在线| 久热久热在线精品观看| 日韩精品有码人妻一区| 日日啪夜夜爽| 爱豆传媒免费全集在线观看| 一区二区日韩欧美中文字幕 | 大片免费播放器 马上看| 国产精品一区二区在线观看99| 99久久综合免费| 99精国产麻豆久久婷婷| av不卡在线播放| 成人毛片a级毛片在线播放| 少妇 在线观看| 久久久午夜欧美精品| 国产乱来视频区| 国产 一区精品| 狠狠精品人妻久久久久久综合| 视频区图区小说| 丝瓜视频免费看黄片| 日韩制服骚丝袜av| 少妇精品久久久久久久| 亚洲av福利一区| 国产av一区二区精品久久| 国产片内射在线| 国产成人一区二区在线| 91精品伊人久久大香线蕉| 国产高清不卡午夜福利| 美女cb高潮喷水在线观看| 边亲边吃奶的免费视频| 国产亚洲一区二区精品| 亚洲美女视频黄频| 亚洲第一av免费看| 精品一区在线观看国产| 人妻制服诱惑在线中文字幕| 性色avwww在线观看| 三级国产精品欧美在线观看| 国产日韩欧美视频二区| 3wmmmm亚洲av在线观看| 涩涩av久久男人的天堂| √禁漫天堂资源中文www| 国产精品不卡视频一区二区| 91在线精品国自产拍蜜月| 国产免费现黄频在线看| 中文字幕精品免费在线观看视频 | 日本猛色少妇xxxxx猛交久久| 赤兔流量卡办理| 国产成人av激情在线播放 | 久久综合国产亚洲精品| 国产精品一区二区在线观看99| 国产精品久久久久成人av| 人妻夜夜爽99麻豆av| 99热全是精品| 少妇丰满av| 一个人免费看片子| 伦理电影免费视频| 一个人看视频在线观看www免费| 欧美激情国产日韩精品一区| 久久久亚洲精品成人影院| 精品国产国语对白av| 国产成人freesex在线| 国产精品欧美亚洲77777| 丁香六月天网| 九九久久精品国产亚洲av麻豆| 香蕉精品网在线| 欧美日韩成人在线一区二区| 精品人妻熟女av久视频| 亚洲欧美一区二区三区黑人 | 蜜臀久久99精品久久宅男| 国产成人aa在线观看| 在线看a的网站| 国产在视频线精品| 黑丝袜美女国产一区| 日本爱情动作片www.在线观看| 色5月婷婷丁香| 综合色丁香网| 久久亚洲国产成人精品v| √禁漫天堂资源中文www| 午夜精品国产一区二区电影| 成人亚洲欧美一区二区av| 一级a做视频免费观看| 黑人巨大精品欧美一区二区蜜桃 | 久久人妻熟女aⅴ| 国产成人a∨麻豆精品| 伊人久久精品亚洲午夜| 成人18禁高潮啪啪吃奶动态图 | 蜜臀久久99精品久久宅男| 国产黄色视频一区二区在线观看| 边亲边吃奶的免费视频| 在现免费观看毛片| 高清午夜精品一区二区三区| 热re99久久国产66热| 黄色配什么色好看| 国产成人av激情在线播放 | 看非洲黑人一级黄片| 欧美亚洲日本最大视频资源| 国产一区二区三区av在线| 国产乱来视频区| 蜜臀久久99精品久久宅男| 99热6这里只有精品| 视频在线观看一区二区三区| 国产精品久久久久久久久免| 黑人高潮一二区| 亚洲精品一二三| 嫩草影院入口| 久久免费观看电影| 成年av动漫网址| 久久人人爽人人爽人人片va| 国产成人freesex在线| 99久久精品国产国产毛片| 欧美亚洲 丝袜 人妻 在线| 欧美成人午夜免费资源| 午夜久久久在线观看| 看免费成人av毛片| 欧美 亚洲 国产 日韩一| 婷婷色麻豆天堂久久| 三上悠亚av全集在线观看| 国产男人的电影天堂91| 欧美激情 高清一区二区三区| 91久久精品国产一区二区成人| 高清黄色对白视频在线免费看| 妹子高潮喷水视频| 七月丁香在线播放| 午夜免费男女啪啪视频观看| 精品卡一卡二卡四卡免费| 母亲3免费完整高清在线观看 | 国产成人a∨麻豆精品| 成人毛片a级毛片在线播放| 特大巨黑吊av在线直播| 国产亚洲欧美精品永久| 看免费成人av毛片| 曰老女人黄片| 久久精品国产自在天天线| 久久国产精品男人的天堂亚洲 | 国产欧美日韩一区二区三区在线 | 成年人免费黄色播放视频| 欧美 亚洲 国产 日韩一| 亚洲美女黄色视频免费看| 又黄又爽又刺激的免费视频.| 成人漫画全彩无遮挡| 国产有黄有色有爽视频| 三级国产精品片| 精品久久久久久电影网| 亚洲人成网站在线观看播放| 99久久综合免费| 午夜日本视频在线| 伊人久久国产一区二区| 青春草亚洲视频在线观看| 熟女电影av网| 婷婷色av中文字幕| 中文精品一卡2卡3卡4更新| 亚洲,欧美,日韩| 国产精品熟女久久久久浪| 国产熟女午夜一区二区三区 | 天美传媒精品一区二区| 久久99一区二区三区| 中文字幕亚洲精品专区| 一边亲一边摸免费视频| 看十八女毛片水多多多| 欧美精品亚洲一区二区| 亚洲伊人久久精品综合| 18+在线观看网站| 美女内射精品一级片tv| 超色免费av| 欧美精品高潮呻吟av久久| 成人影院久久| 99国产综合亚洲精品| 在线观看www视频免费| 五月玫瑰六月丁香| 黄色一级大片看看| 欧美精品亚洲一区二区| 日本vs欧美在线观看视频| 国产伦理片在线播放av一区| 高清欧美精品videossex| 国产精品一国产av| 一级毛片aaaaaa免费看小| 一二三四中文在线观看免费高清| 日韩av在线免费看完整版不卡| 久久精品国产亚洲av天美| a级毛片免费高清观看在线播放| 国产男女超爽视频在线观看| 国产69精品久久久久777片| 亚州av有码| 黄色一级大片看看| 亚洲五月色婷婷综合| 亚洲综合色惰| 欧美人与善性xxx| 久久久久网色| 少妇人妻 视频| 熟女av电影| 亚洲av免费高清在线观看| 99热国产这里只有精品6| 国产又色又爽无遮挡免| 亚洲欧美清纯卡通| 美女主播在线视频| 少妇被粗大的猛进出69影院 | 国产精品一二三区在线看| 亚洲国产av影院在线观看| 人人妻人人爽人人添夜夜欢视频| 男人爽女人下面视频在线观看| 日韩精品有码人妻一区| a级片在线免费高清观看视频| 一本大道久久a久久精品| 日本午夜av视频| 人妻 亚洲 视频| 王馨瑶露胸无遮挡在线观看| 国产午夜精品久久久久久一区二区三区| 日韩电影二区| 能在线免费看毛片的网站| 免费观看a级毛片全部| 欧美变态另类bdsm刘玥| 99久久精品国产国产毛片| 最新中文字幕久久久久| 亚洲精品一二三| 久久久久网色| 少妇人妻久久综合中文| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 久久久久视频综合| 国产精品.久久久| 久久精品久久久久久久性| 有码 亚洲区|