• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于文本加權(quán)詞共現(xiàn)的跨語(yǔ)言文本相似度分析

    2020-05-25 02:30張曉宇王永濱吳林
    軟件導(dǎo)刊 2020年2期
    關(guān)鍵詞:語(yǔ)料庫(kù)文檔排序

    張曉宇 王永濱 吳林

    摘 要:跨語(yǔ)言文本相似度計(jì)算在跨語(yǔ)言信息檢索、數(shù)據(jù)挖掘、抄襲檢測(cè)等領(lǐng)域有著重要應(yīng)用,但是跨語(yǔ)言文本相似度計(jì)算因?yàn)椴煌Z(yǔ)言文法、結(jié)構(gòu)等問題,在空間映射、特征選擇上與單語(yǔ)言文本相似度計(jì)算有很大差異。為解決上述問題,采用一種基于文本加權(quán)詞共現(xiàn)關(guān)系的跨語(yǔ)言文本相似度計(jì)算方法,通過平行語(yǔ)料庫(kù)構(gòu)建跨語(yǔ)言詞共現(xiàn)關(guān)系模型,使用該模型進(jìn)行跨語(yǔ)言文本映射,對(duì)不同語(yǔ)言的文本進(jìn)行相似度計(jì)算。該模型實(shí)際反映了某種語(yǔ)言中某些關(guān)鍵詞共同出現(xiàn)時(shí)映射成另一種語(yǔ)言時(shí)的關(guān)鍵詞概率分布。實(shí)驗(yàn)表明,該方法對(duì)跨語(yǔ)言文本排序的計(jì)算更接近人工評(píng)判標(biāo)準(zhǔn)。

    關(guān)鍵詞:詞共現(xiàn);文本相似度;跨語(yǔ)言;統(tǒng)計(jì)翻譯模型

    DOI:10. 11907/rjdk. 191233 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

    中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)002-0092-04

    英標(biāo):Cross-linguistic Text Similarity Analysis Based on Co-occurrence of Text Weighted Words

    英作:ZHANG Xiao-yu,WANG Yong-bin,WU Lin

    英單:(Key Laboratory of Convergent Media and Intelligent Technology, Communication University of China, Beijing 100024, China)

    Abstract:Cross-language text similarity computation has important applications in cross-language information retrieval, data mining, plagiarism detection and other fields. However, cross-linguistic text similarity calculation differs greatly from single-language text similarity calculation in spatial mapping and feature selection due to the different grammar and structure of the languages. In order to solve the above problem, a cross-linguistic text similarity calculation method based on the co-occurrence relationship of text weighted words is adopted. This method constructs a cross-linguistic word co-occurrence relationship model by parallel corpus, and uses this model to map cross-linguistic texts, and calculates the similarity of texts in different languages. The model actually reflects the probability distribution of keywords in one language when some keywords appear together and map to another language. Experimental results show that the calculation of the cross language text sorting method is closer to the artificial evaluation standard.

    Key Words:word co-occurrence; text similarity; cross-linguistic; statistical translation model

    0 引言

    隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,信息存儲(chǔ)快速增長(zhǎng),如何從海量的互聯(lián)網(wǎng)信息中獲取需要的信息越來越困難,給信息處理技術(shù)帶來新的挑戰(zhàn)。文本相似度計(jì)算在各種信息處理應(yīng)用中有著重要作用,例如搜索引擎、文本分類、文本聚類、信息檢索等[1-3]?;谕环N語(yǔ)言的文本相似度算法主要分為基于字符串的方法[4-5]、基于語(yǔ)料庫(kù)的方法[6-7]、基于世界知識(shí)的方法[8-9]和其它方法[10-11]?;谕Z(yǔ)言的文本相似度研究趨于成熟,代表算法有向量空間模型[12]、基于文檔結(jié)構(gòu)方法[13]、基于本體知識(shí)[14]等。但是,相對(duì)于同語(yǔ)言的文本相似度研究,跨語(yǔ)言的文本相似度研究很少。跨語(yǔ)言文檔相似度排序難點(diǎn)在于:首先,在跨語(yǔ)言信息檢索過程中,不同語(yǔ)言的文檔不屬于同一特征空間,不能直接對(duì)不同空間的文檔進(jìn)行表示及進(jìn)一步排序;其次,影響排序質(zhì)量的因素十分復(fù)雜,即使同一算法對(duì)不同語(yǔ)言的文檔也不能復(fù)制使用,尤其是針對(duì)現(xiàn)今帶有眾多復(fù)雜特征的互聯(lián)網(wǎng)文檔,不能很好地直接以符合用戶需要的方式對(duì)文檔進(jìn)行排序。

    目前,跨語(yǔ)言文本相似度主要有以下幾種方法:

    (1)基于全文機(jī)器翻譯方法[15-16]。該方法使用機(jī)器翻譯工具,將待檢索的源語(yǔ)言翻譯成目標(biāo)語(yǔ)言,再使用單語(yǔ)言的文本相似度算法進(jìn)行相似度計(jì)算。或者將源語(yǔ)言和目標(biāo)語(yǔ)言都翻譯成同一種中間語(yǔ)言,再進(jìn)行文本相似度計(jì)算。無論是否借助中間語(yǔ)言計(jì)算,基于機(jī)器翻譯的方法都極其依賴機(jī)器翻譯的質(zhì)量,并且很難應(yīng)用到多種語(yǔ)言。

    (2)基于統(tǒng)計(jì)翻譯模型方法[17-18]。該方法需要在兩種語(yǔ)言之間生成翻譯概念詞典,建立翻譯概念詞典需要大規(guī)模對(duì)齊語(yǔ)料。本文使用的方法是基于統(tǒng)計(jì)翻譯模型的文本加權(quán)詞共現(xiàn)的跨語(yǔ)言文本相似度算法。

    (3)CL-ESA算法(Cross-Language Explicit Semantic Analysis)。是基于平行語(yǔ)料庫(kù)的跨語(yǔ)言相似度算法,是ESA算法的擴(kuò)展[19-20]。該類算法以兩種語(yǔ)言的平行語(yǔ)料庫(kù)為基礎(chǔ)計(jì)算相似度,其算法準(zhǔn)確度主要依賴語(yǔ)料庫(kù)的規(guī)模和質(zhì)量。要獲得較高的準(zhǔn)確度需要大規(guī)模高質(zhì)量的平行語(yǔ)料,而大規(guī)模的索引語(yǔ)料會(huì)增加算法的計(jì)算量。因此, CL-ESA算法的準(zhǔn)確性和效率很難兼顧。

    本文提出的方法屬于基于統(tǒng)計(jì)翻譯模型方法,不同的是,本文對(duì)翻譯概念詞典的建立基于語(yǔ)義思想,即認(rèn)為同一關(guān)鍵字在不同的語(yǔ)義中有不同含義,結(jié)合上下文語(yǔ)義才能得到該關(guān)鍵詞的最佳翻譯結(jié)果。

    1 文本相似度計(jì)算過程

    1.1 算法總體流程

    本文根據(jù)平行語(yǔ)料庫(kù)計(jì)算好關(guān)鍵詞的共現(xiàn)映射模型,并對(duì)待檢測(cè)文章和新加入的文章提取關(guān)鍵詞關(guān)聯(lián)關(guān)系存入數(shù)據(jù)庫(kù),這樣可提高計(jì)算效率。算法應(yīng)用過程分為映射階段和匹配階段,對(duì)目標(biāo)文本進(jìn)行關(guān)鍵詞映射,再通過跨語(yǔ)言的映射模型映射其它語(yǔ)言的關(guān)系矩陣,基于該矩陣對(duì)待匹配文本進(jìn)行計(jì)算匹配,流程如圖1所示。

    1.2 跨語(yǔ)言映射關(guān)系模型構(gòu)建

    本文基于語(yǔ)義思想構(gòu)建跨語(yǔ)言映射關(guān)系,并且認(rèn)為語(yǔ)義的確定基于語(yǔ)境。語(yǔ)境這一概念是英國(guó)民俗學(xué)家馬林諾斯基首先提出的,他認(rèn)為語(yǔ)境對(duì)于理解語(yǔ)言必不可少。同一個(gè)詞在不同語(yǔ)境中可能代表不同的意思,例如英語(yǔ)中的hang就有“吊死、懸掛”的意思。因此,本文使用句子作為確定語(yǔ)境的最小單位,并使用一個(gè)句子中實(shí)詞的加權(quán)共現(xiàn)關(guān)系作為跨語(yǔ)言關(guān)鍵詞映射關(guān)系模型構(gòu)建的依據(jù)。因此,對(duì)于語(yǔ)料庫(kù)選擇,必須選擇句子對(duì)齊的平行語(yǔ)料,具體方法如下:

    (1)統(tǒng)計(jì)[L1]中詞[w1]出現(xiàn)過的所有句子,組成集合[S1]。[S1=s1,s2,s3,?,sn,其中si]是含有[w1]的一個(gè)句子。

    (2)統(tǒng)計(jì)[S1]中每個(gè)詞出現(xiàn)的頻率[fi],過濾掉頻率太低的詞,對(duì)篩選得到的詞進(jìn)行排序,得到新的集合:[F1=w1,f1,w2,f2,w3,f3,?,wn,fn]。其中:

    (3)找到[L2]中所有與[S1]對(duì)應(yīng)的句子,組成集合[S1'],[S1'=s1',s2',s3',?,sn']。

    (4)對(duì)[S1']作與第(2)步相同的處理,得到[F1'。F1'=][w1',f1',w2',f2',w3',f3',?,wn',fn']。

    (5)將第(2)步和第(4)步結(jié)果生成的[F1,F(xiàn)1']映射關(guān)系保存。

    (6)對(duì)[L1]中的所有詞進(jìn)行第(1)~第(5)步操作,生成[L1]對(duì)[L2]的映射模型。

    其中[L1]、[L2]代表不同的兩種語(yǔ)言,[S1]、[S1']分別代表[L1]、[L2]中不同語(yǔ)言對(duì)齊的句子。如上述過程對(duì)平行語(yǔ)料庫(kù)處理完成后,得到[L1]對(duì)[L2]的跨語(yǔ)言映射關(guān)系模型。如需要[L2]對(duì)[L1]的映射關(guān)系模型,則對(duì)[L2]進(jìn)行相同處理。該模型實(shí)際反映了某種語(yǔ)言中某些關(guān)鍵詞共同出現(xiàn)時(shí)映射成另一種語(yǔ)言的關(guān)鍵詞概率分布,能有效解決雙關(guān)鍵詞共現(xiàn)算法中某一句子同時(shí)出現(xiàn)“A B C”時(shí),選用“AB”、“AC”還是“BC”作為共現(xiàn)詞對(duì)進(jìn)行映射的問題??缯Z(yǔ)言文本相似度計(jì)算基于本文所提出的跨語(yǔ)言映射關(guān)系模型實(shí)現(xiàn)。

    1.3 文本相似度計(jì)算

    本文使用的相似度計(jì)算基于前述構(gòu)建的跨語(yǔ)言映射關(guān)系模型。不同于傳統(tǒng)的文本相似度計(jì)算方法,使用本文算法進(jìn)行計(jì)算之前,要對(duì)待檢索的文檔數(shù)據(jù)庫(kù)進(jìn)行預(yù)處理,將每篇文檔用關(guān)鍵詞分布頻率表示出來,形成檢索匹配向量,具體方法如下:

    (1)對(duì)待檢索的[L1]語(yǔ)言[T1]進(jìn)行句子拆分,把[T1]拆分成句子集合表示的形式,即[T1=s1,s2,s3,?,sn]。

    (2)去停用詞后對(duì)[T]中的每個(gè)詞按句子統(tǒng)計(jì)共現(xiàn)詞內(nèi)容和頻率。

    得[F=w1,w2,fw1,w2,?,wm,wn,fwm,wn]。

    (3)設(shè)定頻率閾值[θ],過濾掉[fwx,wy]<[θ]的共現(xiàn)詞對(duì),計(jì)作向量[N],其中[N]的長(zhǎng)度為n。

    (4)對(duì)第(3)步中的每個(gè)共現(xiàn)詞對(duì),根據(jù)跨語(yǔ)言關(guān)系映射模型映射成對(duì)應(yīng)語(yǔ)言[L2]的向量,并截取排名前n的結(jié)果,將所有向量組合成矩陣[M]。

    (5)計(jì)算矩陣乘積結(jié)果[N?MT],其中[MT]是[M]的轉(zhuǎn)置矩陣。

    (6)將乘積結(jié)果相同的關(guān)鍵詞頻率合并,統(tǒng)計(jì)所有[關(guān)鍵詞,頻率],計(jì)作[r,f]并按照頻率從大到小排序,得到[T]的對(duì)應(yīng)[L2]語(yǔ)言共現(xiàn)詞分布概率向量[R]。

    (7)計(jì)算數(shù)據(jù)庫(kù)中每篇文章的共現(xiàn)詞分布概率[R'],計(jì)算[R]與每篇文章[R']的歐式距離[d],對(duì)結(jié)果從大到小排序即為相似度計(jì)算結(jié)果。其中:

    上述計(jì)算過程的中心思想是根據(jù)關(guān)鍵詞共現(xiàn)映射模型,將[L1]語(yǔ)言的文本[T]映射成[L2]語(yǔ)言的共現(xiàn)詞分布概率,再通過計(jì)算[L2]的每篇文本共現(xiàn)詞分布概率的相似程度,完成文檔間相似度計(jì)算。其中[L2]語(yǔ)言的待檢索文本庫(kù)可以進(jìn)行共現(xiàn)詞分布計(jì)算,將所有文檔用共現(xiàn)詞分布概率表示并存入另一個(gè)共現(xiàn)詞數(shù)據(jù)庫(kù)。當(dāng)進(jìn)行檢索時(shí),可以直接從該數(shù)據(jù)庫(kù)中獲得數(shù)據(jù),從而提升計(jì)算效率。對(duì)于新入庫(kù)的文本,也可直接對(duì)齊進(jìn)行共現(xiàn)詞概率表示,同時(shí)存入兩個(gè)數(shù)據(jù)庫(kù)。

    2 實(shí)驗(yàn)

    2.1 平行語(yǔ)料庫(kù)構(gòu)建

    平行語(yǔ)料庫(kù)是構(gòu)建跨語(yǔ)言關(guān)鍵詞映射模型的基礎(chǔ)。根據(jù)本文的模型構(gòu)建方法,要求平行語(yǔ)料庫(kù)是以句子為對(duì)齊單位的雙語(yǔ)語(yǔ)料庫(kù)。本文實(shí)驗(yàn)采用中文和英文兩種語(yǔ)言,對(duì)齊語(yǔ)料來源于大量的電影字幕文件。由于電影字幕文件有精確的時(shí)間軸和準(zhǔn)確的雙語(yǔ)語(yǔ)義信息,所以用其構(gòu)建句子級(jí)對(duì)齊的平行語(yǔ)料庫(kù)事半功倍。

    實(shí)驗(yàn)使用爬蟲工具從字幕網(wǎng)站下載字幕文件,篩選文件格式為.srt的文件下載到本地,在本地對(duì).srt文件進(jìn)行解析,根據(jù)其時(shí)間戳進(jìn)行雙語(yǔ)對(duì)齊,.srt文件格式如圖2所示。

    將得到的中英文句子存入數(shù)據(jù)庫(kù)用作對(duì)齊語(yǔ)料庫(kù),最終得到語(yǔ)料庫(kù)規(guī)模為120 994條對(duì)齊語(yǔ)料。

    根據(jù)跨語(yǔ)言關(guān)鍵詞共現(xiàn)關(guān)系模型構(gòu)建方法,對(duì)平行語(yǔ)料庫(kù)中的數(shù)據(jù)進(jìn)行處理,構(gòu)建出詞共現(xiàn)關(guān)系模型,存入另一個(gè)數(shù)據(jù)表中。該表保存了詞之間的共現(xiàn)關(guān)系及映射關(guān)系,用來對(duì)檢索文章進(jìn)行映射。

    2.2 跨語(yǔ)言文本相似度計(jì)算

    本文所使用的文本相似度計(jì)算測(cè)試數(shù)據(jù)與實(shí)驗(yàn)設(shè)備由智能融媒體教育部重點(diǎn)實(shí)驗(yàn)室(中國(guó)傳媒大學(xué))提供。其中,中文新聞文檔1 000篇,英文新聞文檔1 000篇。測(cè)評(píng)方法采用先進(jìn)行機(jī)器計(jì)算,再對(duì)結(jié)果打亂進(jìn)行人工打分。

    (1)對(duì)每篇中文文章使用本文提出的方法進(jìn)行跨語(yǔ)言文本相似度計(jì)算排序,即計(jì)算出和該篇中文文本相似的所有英文文章的相似程度并排序,截取其結(jié)果的前30篇作為人工打分備選。

    (2)打亂這30篇文章順序,交給人工進(jìn)行標(biāo)注,人工標(biāo)注為:人工認(rèn)為和待檢索文章(即中文文章)相似或相關(guān)的英文文章打1分,認(rèn)為不相似或不相關(guān)的打0分。

    (3)定義相似準(zhǔn)確率為[P1=tT],其中[t]表示算法計(jì)算排序?yàn)榍癧T]的文章中,人工標(biāo)注結(jié)果為1的文章數(shù),[T]表示選擇標(biāo)準(zhǔn),本文選用排序的前10位作為標(biāo)準(zhǔn)。同理,不相似準(zhǔn)確率為[P2=fF],其中[f]為排序倒數(shù)[F]的文章中,人工標(biāo)注為0的文章數(shù)。本文依然選擇10作為[F]的具體參數(shù),即認(rèn)為相似度排序的計(jì)算結(jié)果中,排序21-30為不相似文章。

    (4)對(duì)[P1]和[P2]進(jìn)行加權(quán)調(diào)和平均處理,得出綜合指標(biāo)[F=2P1P2(P1+P2)]。

    該評(píng)估方法參考了機(jī)器學(xué)習(xí)中常用的準(zhǔn)確率/召回率評(píng)估方法,不同的是本文并不同于文本分類問題,無法計(jì)算常規(guī)的準(zhǔn)確率或召回率,轉(zhuǎn)而采用上述方法對(duì)排序結(jié)果進(jìn)行評(píng)估,并且采用先使用算法計(jì)算再進(jìn)行人工打分的方法,減少了人工標(biāo)注時(shí)間。

    為了對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比分析,本文使用基于全文翻譯的文本相似度算法作為對(duì)照實(shí)驗(yàn),并采用上述方法對(duì)結(jié)果進(jìn)行評(píng)估。對(duì)300篇中英文文檔分別進(jìn)行相似度排序計(jì)算,取平均值作為最終實(shí)驗(yàn)結(jié)果。

    實(shí)驗(yàn)結(jié)果如表1所示。

    從表1可以看出,本文提出的基于文本加權(quán)詞共現(xiàn)的跨語(yǔ)言文本相似度算法優(yōu)于基于全文翻譯的文本相似度算法,其對(duì)跨語(yǔ)言文本相似度的排序結(jié)果更接近人工排序結(jié)果。

    3 結(jié)語(yǔ)

    本文提出了一種新的跨語(yǔ)言文本相似度計(jì)算方法,該方法依據(jù)語(yǔ)義思想,基于文本加權(quán)詞共現(xiàn)關(guān)系進(jìn)行跨語(yǔ)言文本相似度計(jì)算。通過使用平行語(yǔ)料庫(kù)實(shí)現(xiàn)跨語(yǔ)言的加權(quán)詞共現(xiàn)關(guān)系模型,通過模型間不同語(yǔ)言共現(xiàn)詞的映射關(guān)系進(jìn)行跨語(yǔ)言文本相似度計(jì)算。本文詳細(xì)闡述了根據(jù)平行語(yǔ)料庫(kù)構(gòu)建詞共現(xiàn)映射模型的過程,以及根據(jù)詞共現(xiàn)映射模型進(jìn)行文本相似度計(jì)算的過程和實(shí)驗(yàn)流程。實(shí)驗(yàn)結(jié)果表明,本文提出的方法相對(duì)于基于機(jī)器翻譯的跨語(yǔ)言文本相似度計(jì)算,更接近于人工判斷標(biāo)準(zhǔn)。但是本文所提出的算法仍然存在改進(jìn)空間:首先,語(yǔ)料庫(kù)的來源沒有針對(duì)性,本文所使用的句子級(jí)對(duì)齊語(yǔ)料庫(kù)來源于電影字幕文件,但是字幕文件往往偏口語(yǔ)化,專業(yè)性較差,沒有話題針對(duì)性;其次,詞共現(xiàn)關(guān)系研究還有待深入,需要挖掘詞之間更緊密的聯(lián)系與關(guān)聯(lián)。

    參考文獻(xiàn):

    [1] LI H,XU J. Semantic matching in search[J]. Foundations & Trends in Information Retrieval,2014,7(5):343-469.

    [2] HALL P,DOWLING G. Approximates string matching[J]. Computing Survey,1980,12(4):381-402.

    [3] 吳多堅(jiān). 基于 Word2Vec 的中文文本相似度研究與實(shí)現(xiàn)[D]. 西安:西安電子科技大學(xué),2016.

    [4] 秦春秀,趙捧未,劉懷亮. 詞語(yǔ)相似度計(jì)算研究[J]. 情報(bào) 理 論 與 實(shí) 踐,2007,30(1):105-108.

    [5] 劉萍,陳燁. 詞匯相似度研究進(jìn)展綜述[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2012(7-8):82-89.

    [6] LANDAUER T K,DUMAIS S T. A solution to Plato's problem: the latent semantic analysis theory of acquisition, induction, and representation of knowledge[J]. Psychological Review,1997,104(2): 211-240.

    [7] BLEI D M,NG A Y,JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.

    [8] 劉群,李素建. 基于《知網(wǎng)》的詞匯語(yǔ)義相似度計(jì)算[J]. 中文計(jì)算語(yǔ)言學(xué),2002,7(2):59-76.

    [9] 孫琛琛,申德榮,單菁,等. WSR:一種基于維基百科結(jié)構(gòu)信息的語(yǔ)義關(guān)聯(lián)度計(jì)算算法[J]. 計(jì)算機(jī)學(xué)報(bào),2012,35(11):2361-2370.

    [10] 李彬,劉挺,秦兵,等. 基于語(yǔ)義依存的漢語(yǔ)句子相似度計(jì)算 [J]. 計(jì)算機(jī)應(yīng)用研究,2003,20(12): 5-17.

    [11] JIANG J J,CONRATH D W. Semantic similarity based on corpus statistics and lexical taxonomy[C]. Taiwan:Proceedings of the International Conference on Research in Computational Linguistics,1997.

    [12] 胡吉明,肖璐. 向量空間模型文本建模的語(yǔ)義增量化改進(jìn)研究[J]. 現(xiàn)代圖書情報(bào)技術(shù),2014(10):49-55.

    [13] ZHANG X L,YANG T,F(xiàn)AN B Q,et al. Novel method for measuring structure and semantic similarity of xml documents based on extended adjacency matrix[J]. Physics Procedia,2012(24):1452-1461.

    [14] WACHE H,VOGELE T,VISSER U,et al. Ontology based integration of information a survey of existing approaches[C]. Seattle Proceedings of the IJCAI01 Workshop on Ontologies and Information Sharing,2001:108-117.

    [15] OARD D W,HACKETT P. Document translation for cross-language text retrival at the university of Maryland[J]. Journal of Computer Science & Technology,1998,30(2):259-272.

    [16] MAIKE ERDMANN,ANDREW FINCH. Calculating Wikipedia article similarity using machine translation evaluation metrics[C]. Procedings of the 2011 IEEE Workshops of International Conference on Advanced Information Networking and Applications,2011:620-625.

    [17] WESSEL KRAAIJ,NIE J Y,MICHEL SIMARD. Embedding web- based statistical translation model in cross-language information retrieval[J]. Computational Linguistics,Sep,2003,29(3):381-491.

    [18] ALBERTO BARRON-CEDENO, PAOLO ROSSO, DAVID PINTO,et al. On cross-lingual plagiarism analysis using a statistical model[C]. ECAI 2008 Workshop on Uncovering Plagiarism, Authorship, and Social Software Misuse,2008:9-13.

    [19] MARTIN POTTHAST,BENNO STEIN,MAIK ANDERKA. A Wikipedia-based multilingual retrieval model[C]. Proceedings of 30th European Conference on IR Research,ECIR 2008, Glasgow, LNCS, Berlin Heidelberg, New York, 2008: 522-530.

    [20] YANG Y M,JAIME G,CARBONELL, et al. Translingual information retrieval: learning from bilingual corpora[J]. Artificial Intelligence,1998,103(1-2):323-345.

    (責(zé)任編輯:杜能鋼)

    猜你喜歡
    語(yǔ)料庫(kù)文檔排序
    淺談Matlab與Word文檔的應(yīng)用接口
    排序不等式
    有人一聲不吭向你扔了個(gè)文檔
    恐怖排序
    《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開發(fā)與實(shí)現(xiàn)
    語(yǔ)料庫(kù)語(yǔ)言學(xué)未來發(fā)展趨勢(shì)
    国产高清三级在线| 在现免费观看毛片| av视频在线观看入口| 中文精品一卡2卡3卡4更新| 日韩欧美精品v在线| 中文字幕av成人在线电影| 亚洲va在线va天堂va国产| 99热只有精品国产| 少妇人妻一区二区三区视频| 欧美精品一区二区大全| 国产精品一区二区在线观看99 | 亚洲经典国产精华液单| 欧美高清成人免费视频www| 级片在线观看| 国内久久婷婷六月综合欲色啪| 少妇熟女欧美另类| 99久国产av精品国产电影| 欧美xxxx黑人xx丫x性爽| 黄色视频,在线免费观看| 变态另类丝袜制服| 免费av毛片视频| 最新中文字幕久久久久| 国产av在哪里看| 中文字幕av成人在线电影| 男的添女的下面高潮视频| 国产成人精品久久久久久| 免费av不卡在线播放| 色综合色国产| 麻豆成人av视频| 啦啦啦韩国在线观看视频| 日本三级黄在线观看| 中文字幕免费在线视频6| 日韩一区二区三区影片| 狂野欧美白嫩少妇大欣赏| 午夜精品在线福利| 国产精华一区二区三区| 中文字幕熟女人妻在线| 久久久久久国产a免费观看| 长腿黑丝高跟| 中文精品一卡2卡3卡4更新| 亚洲国产欧美在线一区| 国产亚洲91精品色在线| 国产精品久久久久久精品电影| 久久精品夜夜夜夜夜久久蜜豆| 26uuu在线亚洲综合色| 日本与韩国留学比较| 男人舔奶头视频| 亚洲精品乱码久久久久久按摩| 精品人妻偷拍中文字幕| 色哟哟哟哟哟哟| 国产精品久久久久久久电影| 在线a可以看的网站| h日本视频在线播放| 亚洲欧美日韩东京热| 18+在线观看网站| 国产激情偷乱视频一区二区| 成人美女网站在线观看视频| 高清毛片免费看| 精品久久久久久成人av| 免费搜索国产男女视频| 听说在线观看完整版免费高清| 国产午夜精品久久久久久一区二区三区| 日韩精品青青久久久久久| 大型黄色视频在线免费观看| 三级国产精品欧美在线观看| 日本黄大片高清| 亚洲国产高清在线一区二区三| 在线a可以看的网站| 高清午夜精品一区二区三区 | 欧美性感艳星| 少妇裸体淫交视频免费看高清| 青春草亚洲视频在线观看| 欧美性感艳星| 91在线精品国自产拍蜜月| 一夜夜www| 欧美日韩乱码在线| av在线天堂中文字幕| 欧美一区二区亚洲| 91在线精品国自产拍蜜月| 国产精品女同一区二区软件| 日本免费a在线| av在线播放精品| 国产精品女同一区二区软件| 一夜夜www| 欧美成人一区二区免费高清观看| 美女内射精品一级片tv| 能在线免费看毛片的网站| 久久久久九九精品影院| 亚洲精品久久国产高清桃花| 18禁裸乳无遮挡免费网站照片| 插阴视频在线观看视频| 国产精华一区二区三区| 亚洲国产色片| 美女 人体艺术 gogo| 麻豆乱淫一区二区| 蜜桃亚洲精品一区二区三区| 欧洲精品卡2卡3卡4卡5卡区| av在线老鸭窝| 中文字幕久久专区| 少妇的逼水好多| 日韩在线高清观看一区二区三区| 尾随美女入室| eeuss影院久久| 久久中文看片网| 国产男人的电影天堂91| 一级毛片电影观看 | 99视频精品全部免费 在线| 日本黄大片高清| 亚洲精品自拍成人| 91aial.com中文字幕在线观看| 少妇被粗大猛烈的视频| 草草在线视频免费看| 高清日韩中文字幕在线| 99在线人妻在线中文字幕| 色综合站精品国产| 深爱激情五月婷婷| 免费人成视频x8x8入口观看| 午夜免费激情av| 能在线免费观看的黄片| 久久精品国产亚洲网站| 一级av片app| 亚洲国产精品国产精品| 国产日韩欧美在线精品| 成人午夜精彩视频在线观看| 欧美日韩国产亚洲二区| 不卡视频在线观看欧美| 亚洲国产精品合色在线| 波野结衣二区三区在线| 免费观看在线日韩| 亚洲激情五月婷婷啪啪| 日本与韩国留学比较| 色噜噜av男人的天堂激情| 菩萨蛮人人尽说江南好唐韦庄 | 免费av不卡在线播放| 欧美三级亚洲精品| 2022亚洲国产成人精品| 最好的美女福利视频网| 久久精品夜夜夜夜夜久久蜜豆| 亚洲精品色激情综合| 99热只有精品国产| 国产男人的电影天堂91| 青春草亚洲视频在线观看| 夜夜爽天天搞| 精品一区二区三区视频在线| 成人二区视频| 国产在线精品亚洲第一网站| 午夜免费男女啪啪视频观看| 亚洲色图av天堂| 国产成人精品久久久久久| 久久欧美精品欧美久久欧美| 国产一区二区在线观看日韩| av又黄又爽大尺度在线免费看 | 白带黄色成豆腐渣| 国产高潮美女av| 亚洲欧美精品专区久久| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 成人永久免费在线观看视频| 伦理电影大哥的女人| av.在线天堂| av天堂在线播放| 草草在线视频免费看| 精品久久久久久久久av| 日本免费a在线| 99久国产av精品国产电影| 国产视频内射| 国产在视频线在精品| 在线国产一区二区在线| 国产毛片a区久久久久| 免费观看在线日韩| 久久99精品国语久久久| 日韩欧美一区二区三区在线观看| 国产成人福利小说| 免费搜索国产男女视频| 亚洲人与动物交配视频| 欧美极品一区二区三区四区| 成人欧美大片| 白带黄色成豆腐渣| 国产精品一区二区性色av| 午夜福利在线在线| 草草在线视频免费看| 亚洲国产欧美人成| 亚洲精品影视一区二区三区av| 亚洲欧美中文字幕日韩二区| 国产精品伦人一区二区| 乱码一卡2卡4卡精品| 欧美变态另类bdsm刘玥| 三级男女做爰猛烈吃奶摸视频| 久久欧美精品欧美久久欧美| 午夜a级毛片| 一级毛片电影观看 | 黄片无遮挡物在线观看| 国产一区亚洲一区在线观看| 精品免费久久久久久久清纯| 99久国产av精品国产电影| 成年免费大片在线观看| 真实男女啪啪啪动态图| 亚洲,欧美,日韩| 亚洲一区二区三区色噜噜| avwww免费| 国产一区二区亚洲精品在线观看| 日日干狠狠操夜夜爽| 国产精品一区www在线观看| 成熟少妇高潮喷水视频| 可以在线观看毛片的网站| 啦啦啦观看免费观看视频高清| 国产精品一区二区在线观看99 | 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 欧美区成人在线视频| 亚洲激情五月婷婷啪啪| 日韩欧美三级三区| 最近中文字幕高清免费大全6| 老司机影院成人| 国产精品久久久久久久久免| 黄色欧美视频在线观看| 三级男女做爰猛烈吃奶摸视频| 亚洲精品久久久久久婷婷小说 | 老熟妇乱子伦视频在线观看| 日韩av不卡免费在线播放| 一区福利在线观看| 淫秽高清视频在线观看| 97热精品久久久久久| 久久久国产成人精品二区| 亚洲人成网站高清观看| 伊人久久精品亚洲午夜| 亚洲激情五月婷婷啪啪| 国产精品免费一区二区三区在线| 日日干狠狠操夜夜爽| 人妻少妇偷人精品九色| 国产大屁股一区二区在线视频| 久久久久久久久久成人| 国内少妇人妻偷人精品xxx网站| 亚洲综合色惰| 超碰av人人做人人爽久久| 国产片特级美女逼逼视频| av黄色大香蕉| av福利片在线观看| 深夜a级毛片| 我要看日韩黄色一级片| 99在线视频只有这里精品首页| 成熟少妇高潮喷水视频| 亚洲欧美成人精品一区二区| 午夜福利在线观看免费完整高清在 | 欧美又色又爽又黄视频| 久久精品影院6| 女人十人毛片免费观看3o分钟| 日本撒尿小便嘘嘘汇集6| 国产日韩欧美在线精品| 国产精品1区2区在线观看.| 3wmmmm亚洲av在线观看| 黄色视频,在线免费观看| 国产人妻一区二区三区在| 国产日韩欧美在线精品| 亚洲成人av在线免费| 亚洲美女视频黄频| 欧美zozozo另类| 亚洲精品456在线播放app| 国产伦理片在线播放av一区 | 日韩制服骚丝袜av| 免费大片18禁| 久久精品夜色国产| 久久久久久久亚洲中文字幕| 亚洲色图av天堂| 亚洲欧美日韩无卡精品| 日韩强制内射视频| 精品人妻熟女av久视频| 老司机福利观看| 国内久久婷婷六月综合欲色啪| 麻豆一二三区av精品| 国产午夜精品一二区理论片| 欧美日韩综合久久久久久| 久久精品国产亚洲av香蕉五月| 欧美性感艳星| 久久久久性生活片| 成人一区二区视频在线观看| 在线a可以看的网站| 精品国产三级普通话版| av视频在线观看入口| 啦啦啦啦在线视频资源| 日韩欧美在线乱码| 精品一区二区三区人妻视频| 精品一区二区免费观看| 一个人观看的视频www高清免费观看| 欧美成人精品欧美一级黄| av在线亚洲专区| 自拍偷自拍亚洲精品老妇| 精品久久久久久久久av| 成人性生交大片免费视频hd| 国产大屁股一区二区在线视频| 一个人看的www免费观看视频| 亚洲精品日韩av片在线观看| 狂野欧美激情性xxxx在线观看| 久久久久久九九精品二区国产| 在线观看av片永久免费下载| 深夜精品福利| 六月丁香七月| 欧美高清性xxxxhd video| 国产国拍精品亚洲av在线观看| 久久久久九九精品影院| 亚洲第一电影网av| 黄色一级大片看看| 欧美bdsm另类| 在线观看美女被高潮喷水网站| 午夜激情欧美在线| 国产精品野战在线观看| 12—13女人毛片做爰片一| 国产成人精品婷婷| 国产老妇伦熟女老妇高清| 亚洲av成人精品一区久久| 国产熟女欧美一区二区| 国产蜜桃级精品一区二区三区| av卡一久久| 久久精品国产鲁丝片午夜精品| 日本一二三区视频观看| 亚洲国产精品久久男人天堂| 一个人看的www免费观看视频| 免费观看a级毛片全部| 91在线精品国自产拍蜜月| 午夜福利成人在线免费观看| 色综合色国产| 国产蜜桃级精品一区二区三区| 中国美女看黄片| 级片在线观看| 日本黄色视频三级网站网址| 久久中文看片网| 一本久久中文字幕| 老师上课跳d突然被开到最大视频| 国产老妇女一区| 久久精品国产清高在天天线| 亚洲va在线va天堂va国产| 中文在线观看免费www的网站| 激情 狠狠 欧美| 久久午夜亚洲精品久久| 国产成人精品一,二区 | 日本爱情动作片www.在线观看| 国产一级毛片在线| 少妇高潮的动态图| 99久久精品热视频| 能在线免费看毛片的网站| 亚洲在线自拍视频| 国产高潮美女av| 成人特级av手机在线观看| 美女 人体艺术 gogo| 国产亚洲精品av在线| 人人妻人人澡欧美一区二区| 日本免费a在线| 中文字幕免费在线视频6| 三级男女做爰猛烈吃奶摸视频| 久久中文看片网| 男人和女人高潮做爰伦理| 十八禁国产超污无遮挡网站| 身体一侧抽搐| 变态另类丝袜制服| 欧美xxxx性猛交bbbb| 日日摸夜夜添夜夜添av毛片| 黄片无遮挡物在线观看| 欧美zozozo另类| 在线播放国产精品三级| 国产极品精品免费视频能看的| 久久精品影院6| 精品无人区乱码1区二区| 尾随美女入室| www日本黄色视频网| 69av精品久久久久久| 色尼玛亚洲综合影院| 久久精品91蜜桃| 国产精品三级大全| 99热全是精品| 国产精品国产高清国产av| 丰满的人妻完整版| 精品欧美国产一区二区三| 久久亚洲国产成人精品v| www日本黄色视频网| 六月丁香七月| 国产精品麻豆人妻色哟哟久久 | 久久久久网色| 久久这里有精品视频免费| 人人妻人人澡欧美一区二区| 亚洲国产精品成人综合色| 国产精品永久免费网站| 人妻夜夜爽99麻豆av| 一边亲一边摸免费视频| 亚洲欧美日韩高清专用| 老师上课跳d突然被开到最大视频| 欧美区成人在线视频| 九九久久精品国产亚洲av麻豆| 欧美在线一区亚洲| 国产精品永久免费网站| 女同久久另类99精品国产91| 日韩制服骚丝袜av| 亚洲精品影视一区二区三区av| 亚洲不卡免费看| 在线观看66精品国产| 久久中文看片网| 高清毛片免费观看视频网站| 级片在线观看| 夜夜看夜夜爽夜夜摸| 深夜精品福利| 亚洲欧美日韩高清专用| 午夜精品一区二区三区免费看| 成人毛片60女人毛片免费| 哪里可以看免费的av片| 久99久视频精品免费| 天堂av国产一区二区熟女人妻| 日本免费一区二区三区高清不卡| 亚洲一级一片aⅴ在线观看| 男插女下体视频免费在线播放| 成人综合一区亚洲| 12—13女人毛片做爰片一| 国产成人福利小说| 亚洲成人久久爱视频| 啦啦啦韩国在线观看视频| 91久久精品电影网| 亚洲精品国产成人久久av| 青春草国产在线视频 | 欧美激情久久久久久爽电影| 免费观看a级毛片全部| 亚洲aⅴ乱码一区二区在线播放| 国产久久久一区二区三区| 国产熟女欧美一区二区| 长腿黑丝高跟| 久久人人爽人人片av| 国产亚洲精品av在线| 婷婷色综合大香蕉| 少妇猛男粗大的猛烈进出视频 | 美女 人体艺术 gogo| 亚洲色图av天堂| 精品久久久久久久久av| 国产单亲对白刺激| 国产成人精品久久久久久| 在线观看美女被高潮喷水网站| 国产大屁股一区二区在线视频| 中文字幕av成人在线电影| 亚洲av熟女| 欧美最黄视频在线播放免费| 国产 一区精品| 成人无遮挡网站| 18+在线观看网站| 久久精品国产清高在天天线| 亚洲人与动物交配视频| 免费av不卡在线播放| a级毛片a级免费在线| 99热这里只有精品一区| 久久久久久九九精品二区国产| 亚洲av熟女| 97超碰精品成人国产| 可以在线观看毛片的网站| avwww免费| 在线免费十八禁| 亚洲欧美精品自产自拍| 亚洲av.av天堂| 欧美色欧美亚洲另类二区| 亚洲经典国产精华液单| 综合色av麻豆| 国产大屁股一区二区在线视频| 波多野结衣高清无吗| 亚洲精品国产av成人精品| 久久亚洲国产成人精品v| 国产精品国产三级国产av玫瑰| 成人二区视频| 日本-黄色视频高清免费观看| 噜噜噜噜噜久久久久久91| 直男gayav资源| 蜜臀久久99精品久久宅男| 国产 一区精品| 国产一区亚洲一区在线观看| 亚洲国产精品成人久久小说 | 国产爱豆传媒在线观看| 嫩草影院入口| kizo精华| 爱豆传媒免费全集在线观看| 99久国产av精品| 国产一级毛片七仙女欲春2| 一级二级三级毛片免费看| 国产成人a区在线观看| 国产精品无大码| 在线免费十八禁| 欧美不卡视频在线免费观看| 九九热线精品视视频播放| 久久久a久久爽久久v久久| 欧美日韩精品成人综合77777| 一进一出抽搐动态| 日本-黄色视频高清免费观看| 卡戴珊不雅视频在线播放| 亚洲成av人片在线播放无| 丰满人妻一区二区三区视频av| 国产v大片淫在线免费观看| 午夜福利高清视频| 性色avwww在线观看| 亚洲,欧美,日韩| 久久久久久大精品| 老女人水多毛片| 日本色播在线视频| 狂野欧美白嫩少妇大欣赏| 久久精品91蜜桃| 亚洲国产精品成人综合色| 亚洲欧美成人精品一区二区| 久久精品影院6| 日韩欧美国产在线观看| 日本色播在线视频| 99热全是精品| 男的添女的下面高潮视频| 亚洲精品久久国产高清桃花| 日韩国内少妇激情av| 国国产精品蜜臀av免费| 老女人水多毛片| 午夜a级毛片| 国产精品一二三区在线看| 悠悠久久av| 国产精品久久视频播放| 久久久久国产网址| 综合色av麻豆| 亚洲三级黄色毛片| 丰满的人妻完整版| 嘟嘟电影网在线观看| 99国产极品粉嫩在线观看| 国产老妇伦熟女老妇高清| 99视频精品全部免费 在线| av视频在线观看入口| 日韩在线高清观看一区二区三区| 久久精品影院6| 99久久成人亚洲精品观看| 男女下面进入的视频免费午夜| 美女 人体艺术 gogo| 边亲边吃奶的免费视频| 性色avwww在线观看| 一个人看的www免费观看视频| 观看美女的网站| 国产亚洲精品av在线| 变态另类丝袜制服| 国产成人精品一,二区 | 欧美高清性xxxxhd video| 国产午夜精品久久久久久一区二区三区| 在线免费十八禁| 麻豆久久精品国产亚洲av| 一级毛片我不卡| 看免费成人av毛片| 青春草亚洲视频在线观看| 中文字幕av在线有码专区| 国产精品人妻久久久影院| 男女那种视频在线观看| 免费av毛片视频| 中文字幕免费在线视频6| av国产免费在线观看| 成人二区视频| 黄片无遮挡物在线观看| 国产真实乱freesex| 中文资源天堂在线| 丰满人妻一区二区三区视频av| 内地一区二区视频在线| 亚洲一区二区三区色噜噜| 国产高清有码在线观看视频| 国产精品不卡视频一区二区| 91久久精品国产一区二区三区| 国产激情偷乱视频一区二区| 亚洲av成人av| 成人综合一区亚洲| 在线免费观看的www视频| 亚洲第一电影网av| 国产蜜桃级精品一区二区三区| 中文字幕制服av| 久久精品久久久久久噜噜老黄 | 最近的中文字幕免费完整| 日韩人妻高清精品专区| 乱系列少妇在线播放| 国产精品久久久久久久电影| 午夜福利在线观看吧| 三级男女做爰猛烈吃奶摸视频| 99久久无色码亚洲精品果冻| 白带黄色成豆腐渣| 久久6这里有精品| 免费看光身美女| 69人妻影院| 九草在线视频观看| 99国产精品一区二区蜜桃av| 一个人看视频在线观看www免费| 免费观看人在逋| 亚洲国产日韩欧美精品在线观看| 噜噜噜噜噜久久久久久91| 国产亚洲精品av在线| 99九九线精品视频在线观看视频| 亚洲欧美成人精品一区二区| 欧美一区二区国产精品久久精品| 天堂av国产一区二区熟女人妻| 丰满乱子伦码专区| 日韩一区二区视频免费看| 精品久久久久久久久av| 99热精品在线国产| 久久人人爽人人爽人人片va| 成人一区二区视频在线观看| 国产精品三级大全| 中文字幕av在线有码专区| or卡值多少钱| 日日摸夜夜添夜夜添av毛片| 18禁在线播放成人免费| 色5月婷婷丁香| 青春草亚洲视频在线观看| 国产成人一区二区在线| 搡老妇女老女人老熟妇| www.av在线官网国产| 日本爱情动作片www.在线观看| 人妻制服诱惑在线中文字幕| 亚洲七黄色美女视频| 亚洲在久久综合| 亚洲七黄色美女视频| 日本熟妇午夜| 丝袜美腿在线中文| 日韩国内少妇激情av| 精品人妻熟女av久视频| 黄片wwwwww| 成人美女网站在线观看视频| 男女边吃奶边做爰视频| 日韩在线高清观看一区二区三区| 免费大片18禁| 岛国毛片在线播放| 一区二区三区免费毛片|