• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    哈薩克文網(wǎng)絡(luò)熱點關(guān)鍵詞提取方法研究

    2017-03-01 04:26:10胡冰瑤古麗拉阿東別克
    計算機(jī)應(yīng)用與軟件 2017年1期
    關(guān)鍵詞:文本方法

    胡冰瑤 古麗拉·阿東別克

    (新疆大學(xué)信息科學(xué)與工程學(xué)院 新疆 烏魯木齊 830046)

    哈薩克文網(wǎng)絡(luò)熱點關(guān)鍵詞提取方法研究

    胡冰瑤 古麗拉·阿東別克

    (新疆大學(xué)信息科學(xué)與工程學(xué)院 新疆 烏魯木齊 830046)

    (新疆多語種信息技術(shù)實驗室 新疆 烏魯木齊 830046)

    針對目前少數(shù)民族語言方面熱點關(guān)鍵詞提取算法研究較少,而且精度和效率不高這一問題,提出一種哈薩克文網(wǎng)絡(luò)熱點關(guān)鍵詞提取方法。將預(yù)處理后得到的文本利用多重因子加權(quán)改進(jìn)的TF-IDF算法進(jìn)行關(guān)鍵詞提取,后續(xù)根據(jù)其位置和頻率信息進(jìn)行關(guān)鍵詞組配,得到候選熱點關(guān)鍵詞集合;結(jié)合TF-PDF算法和媒體關(guān)注度思想,構(gòu)造關(guān)鍵詞熱度評分標(biāo)準(zhǔn)公式KHD(Keywords Hot Degree),實現(xiàn)對熱點關(guān)鍵詞的提取。實驗結(jié)果證明此方法可行有效,并且在提取精度和效率上都有顯著提高。

    哈薩克文 詞頻 文檔頻率 媒體關(guān)注度 熱點關(guān)鍵詞

    0 引 言

    近年來,隨著互聯(lián)網(wǎng)的普及,我們進(jìn)入了一個信息爆炸的大數(shù)據(jù)時代。新疆是一個多民族聚居的省份,在這里多種語言被廣泛使用。哈薩克語作為新疆幾大主流語言之一,其使用人數(shù)也在逐年上升,哈薩克文網(wǎng)頁數(shù)量的增長速度也越來越快。如何在海量的哈薩克文網(wǎng)絡(luò)文本中快速準(zhǔn)確地找到人們感興趣的熱點信息成為了關(guān)注的焦點。本文探討如何對互聯(lián)網(wǎng)上的海量哈薩克文網(wǎng)頁信息進(jìn)行分析、處理,從而獲取近期流行熱點關(guān)鍵詞的相關(guān)技術(shù)問題。

    1 相關(guān)工作

    1.1 關(guān)鍵詞提取

    就目前來看,國內(nèi)外相繼提出了多種關(guān)鍵詞自動提取方法,主要有3類:基于語義;基于機(jī)器學(xué)習(xí);基于統(tǒng)計。如王立霞等人在關(guān)鍵詞提取過程中將詞語語義特征融入,利用居間度密度來度量語義關(guān)鍵程度[1]。王錦波等人采用樸素貝葉斯模型對標(biāo)記好關(guān)鍵詞的文本進(jìn)行訓(xùn)練,獲得各個特征項出現(xiàn)的概率,用來提取文本的關(guān)鍵詞[2]。統(tǒng)計方法上,林滿山等人使用多線程多重因子加權(quán)的文本關(guān)鍵詞提取算法,提高了關(guān)鍵詞的提取精度[3]。

    1.2 熱度計算

    關(guān)于熱度計算,李渝勤等人將候選短語分為命名實體和非命名實體串,通過基礎(chǔ)權(quán)值和波動權(quán)值來綜合評估候選短語的熱度[4]。翟東海等人采用互信息作為熱點詞突發(fā)性的度量手段,使用類間離散度作為調(diào)節(jié)因子構(gòu)建突發(fā)性度量公式來提取熱點詞[5]。程肖對傳統(tǒng)的TF-PDF算法進(jìn)行了改進(jìn),取得了一定的效果,但會出現(xiàn)非熱點的高頻詞權(quán)值過高的問題[6]。

    1.3 本文方法

    哈薩克語屬于黏著語類型,跟漢語有很大不同,但與英語有一定的相似之處,每個詞之間都以空格或者標(biāo)點符號隔開,而且都是由詞干和詞綴組成,所以哈薩克文在文本預(yù)處理時必須進(jìn)行詞干提取。由于哈薩克文的基礎(chǔ)研究還不是特別成熟,還沒有開發(fā)出類似中文分詞器的工具,因此本文是利用空格和標(biāo)點符號對詞進(jìn)行切分。這種切分方法可能會出現(xiàn)詞語分離的現(xiàn)象,故本文在關(guān)鍵詞提取后又進(jìn)行了組配工作,盡可能減少了詞語分離。

    經(jīng)過預(yù)處理后的語料中仍然會存在大量的對文章主題意義不大的詞,而使用TF-PDF算法進(jìn)行詞語熱度計算時對詞頻的依賴程度又比較高,大量高頻出現(xiàn)且本身意義不大的詞會大大降低該算法的正確率,效果不理想。所以本文在結(jié)合哈薩克文的特點及其研究現(xiàn)狀的基礎(chǔ)上,先選擇對預(yù)處理過的網(wǎng)絡(luò)文本語料進(jìn)行關(guān)鍵詞的提取和組配,得到候選熱點關(guān)鍵詞集。這樣在過濾大量非關(guān)鍵的高頻詞的同時,又減少了后續(xù)工作的計算量;后續(xù)在傳統(tǒng)TF-PDF算法的基礎(chǔ)上結(jié)合媒體關(guān)注度的思想對詞集中的候選熱點關(guān)鍵詞進(jìn)行熱度計算,實現(xiàn)熱點關(guān)鍵詞的提取。實驗結(jié)果證明該算法可行有效,在提取準(zhǔn)確率和時間效率上都有顯著提高。

    2 熱點關(guān)鍵詞提取

    2.1 數(shù)據(jù)獲取及預(yù)處理

    本文通過網(wǎng)絡(luò)爬蟲對多個哈薩克文新聞網(wǎng)站進(jìn)行抓取來獲得真實新聞?wù)Z料。由于網(wǎng)頁中存在大量噪音信息,必須對網(wǎng)頁進(jìn)行正文抽取,后續(xù)對抽取的正文文本進(jìn)行位置標(biāo)注、分詞、詞干提取、詞性標(biāo)注、停用詞過濾等預(yù)處理,得到候選關(guān)鍵詞集合。

    2.2 關(guān)鍵詞提取

    傳統(tǒng)的TF-IDF算法是由Salton和McGill針對向量空間信息檢索樣例提出的一種用來表示文本特征的方法[7]。前人運(yùn)用傳統(tǒng)TF-IDF權(quán)重計算公式提取關(guān)鍵詞有一定的效果,但是此方法還存在一些問題,如:

    (1) 同一個候選關(guān)鍵詞wi在長文檔中可能會比短文檔有更高的詞頻,從而偏向長文檔。

    (2) 詞條出現(xiàn)在文檔的不同位置時,其重要程度也是不一樣的。

    (3) 傳統(tǒng)方法沒有對候選詞詞性進(jìn)行考慮,通過查閱文獻(xiàn)可知,在總數(shù)量上,名詞和包含名詞性成分的關(guān)鍵詞占了絕大部分[8],因此需要對不同詞性的候選詞賦予不同的權(quán)重。

    針對上述問題,本文在傳統(tǒng)的TF-IDF算法的基礎(chǔ)上,對其進(jìn)行多重因子綜合加權(quán)后得到了一個新的權(quán)重公式Score(wi),利用此公式來計算候選關(guān)鍵詞的權(quán)值。

    2.2.1 歸一化處理

    不管重要與否,同一個候選關(guān)鍵詞wi在長文檔中可能會比短文檔有更高的詞頻,為防止它偏向長的文檔,須進(jìn)行歸一化處理。下面是比較常用的一種歸一化處理的TF-IDF公式,如式(1)所示:

    (1)

    其中,w(ti,d)為詞ti在文本d中的權(quán)重,而tf(ti,d)為詞ti在文本d中的詞頻,N為文本集中文本的個數(shù),nti是詞ti在文本集中出現(xiàn)詞ti的文本個數(shù),分母為歸一化因子。

    2.2.2 位置加權(quán)

    除了TF-IDF值,候選關(guān)鍵詞的重要程度還受其出現(xiàn)位置的影響。由于不同位置的詞對文本的作用是不一樣的。因此,對于不同位置的詞應(yīng)該進(jìn)行加權(quán)處理。位置權(quán)重設(shè)為αti,其值如式(2)所示:

    (2)

    其中,各分段的系數(shù)需多次實驗進(jìn)行調(diào)節(jié),以達(dá)到較好的效果。

    設(shè)Sti為該詞在相應(yīng)位置出現(xiàn)的次數(shù),加入了位置權(quán)重后的詞權(quán)重計算如式(3)所示:

    (3)

    2.2.3 詞性加權(quán)

    由于不同詞性的詞語在表達(dá)文本信息能力方面重要性不同,本文引入了P(wi)來表示詞語的詞性權(quán)重系數(shù),通過多次實驗,規(guī)定名詞的權(quán)重系數(shù)P(wi)=2.5,動詞和形容詞的權(quán)重系數(shù)P(wi)=1,其他詞性的權(quán)重系數(shù)為0。

    2.2.4 綜合加權(quán)

    結(jié)合式(1)-式(3)及詞性系數(shù)P(wi),將新聞文檔中任意候選關(guān)鍵詞wi,進(jìn)行綜合加權(quán),權(quán)值函數(shù)如式(4)所示:

    Score(wi)=w(ti,d)×Loc(wi)×P(wi)

    (4)

    利用式(4)計算得到每一個候選關(guān)鍵詞的權(quán)重,該權(quán)重即候選關(guān)鍵詞重要性和代表文檔能力。

    2.2.5 關(guān)鍵詞組配

    在新聞網(wǎng)頁中一些關(guān)鍵詞通常連在一起,但在分詞過程中被切分,導(dǎo)致其不能完整表示其原來的意義,所以本文根據(jù)候選關(guān)鍵詞在文中出現(xiàn)的位置和頻率情況對其進(jìn)行了組配。

    組配過程如下:

    1) 根據(jù)綜合加權(quán)公式計算所有候選關(guān)鍵詞的評分,選出每篇文檔評分最高的10個詞語作為組配關(guān)鍵詞的初始集合。

    2) 由于在分詞過程中已經(jīng)對每個詞進(jìn)行了位置標(biāo)注并以其第一次出現(xiàn)時的順序編號,此步驟我們對初始集合里的候選關(guān)鍵詞進(jìn)行編號匹配,規(guī)則為:編號相鄰的進(jìn)行組合,小號在前,大號在后。如兩個號相鄰組成二元詞,三個編號相鄰則組成三元詞,依次類推。

    3) 對新組成的詞組,在本篇文檔中進(jìn)行掃描,統(tǒng)計其頻次,大于閾值S時,我們認(rèn)為這一詞組組配成功的概率較大,將其取出。此處閾值S的取值為多次實驗后確定。

    4) 利用式(4)計算組配成功的候選關(guān)鍵詞的權(quán)值,將一元候選關(guān)鍵詞與新組配的多元候選關(guān)鍵詞按權(quán)值高低排序,取每篇文檔權(quán)值最高的前10個詞作為此文檔正式抽取的關(guān)鍵詞。

    關(guān)鍵詞提取模塊,本文改進(jìn)了傳統(tǒng)的TF-IDF方法,先進(jìn)行歸一化處理,再引入位置因子和詞性因子進(jìn)行綜合加權(quán)計算,后續(xù)根據(jù)其位置和頻率信息進(jìn)行了關(guān)鍵詞組配,得到正式的關(guān)鍵詞。經(jīng)過關(guān)鍵詞提取后的文本組成了候選熱點關(guān)鍵詞集,過濾掉了大量非關(guān)鍵的高頻詞,為后續(xù)熱點關(guān)鍵詞提取準(zhǔn)確率和整體運(yùn)算效率的提高打下了基礎(chǔ)。

    2.3 熱度計算

    2.3.1 傳統(tǒng)TF-PDF算法

    TF-PDF算法是Bun和Ishizuka提出的,其中心思想是一個熱點新聞話題必然會被多篇新聞報道,并且關(guān)于這個話題的新聞報道頻度和數(shù)量都相對較高[9]。

    傳統(tǒng)的TF-PDF算法中,某個渠道詞匯的權(quán)重與它在該渠道出現(xiàn)的頻率呈線性比,與該渠道包含該詞匯的文檔比率呈指數(shù)比,詞匯的總權(quán)重為其在每個渠道的權(quán)重之和,如下所示:

    (5)

    (6)其中:Wj表示詞匯j的權(quán)重;Nc表示渠道C中文檔的總數(shù)量;njc表示詞匯j所在渠道包含的文檔數(shù)量;Fjc表示詞匯j在渠道C出現(xiàn)的頻率;D表示渠道的數(shù)量;K表示一個渠道詞匯的總數(shù)量。

    2.3.2 本文熱度計算方法

    文獻(xiàn)[10]提出了基于話題媒體關(guān)注度的計算方法。簡要地說,如果一個新聞話題在單個網(wǎng)站中相關(guān)新聞越多,說明此話題受到這個網(wǎng)站的關(guān)注程度就越高;如果一個新聞話題被越多網(wǎng)站報道,那這個話題被網(wǎng)絡(luò)媒體關(guān)注的程度越高。

    結(jié)合TF-PDF算法和話題媒體關(guān)注度的思想,本文構(gòu)造了關(guān)鍵詞熱度公式KHD(Keywords Hot Degree),來定量地描述關(guān)鍵詞受關(guān)注的程度。影響關(guān)鍵詞熱度的因素主要有兩點:關(guān)鍵詞相關(guān)文檔數(shù)目和詞頻。關(guān)鍵詞的熱度與其出現(xiàn)的頻度及其相關(guān)的文檔數(shù)成正比。關(guān)鍵詞熱越高,說明用戶對該關(guān)鍵詞的興趣越大,越容易形成熱點關(guān)鍵詞。

    改進(jìn)后的計算公式如式下所示:

    (7)

    (8)其中,KHDi為關(guān)鍵詞i的熱度;TF為候選關(guān)鍵詞的詞頻;N是文檔總數(shù);Di是關(guān)鍵詞i的相關(guān)文檔數(shù)目;|Di|表示關(guān)鍵詞i的標(biāo)準(zhǔn)頻度,C為該文檔中的關(guān)鍵詞總數(shù)。

    熱度計算模塊,使用式(7)、式(8)對候選熱點關(guān)鍵詞進(jìn)行計算,選取權(quán)值排名前X的候選詞條作為熱點關(guān)鍵詞。

    3 實驗結(jié)果與分析

    3.1 實現(xiàn)流程

    本文的實現(xiàn)流程如圖1所示。

    圖1 實現(xiàn)流程圖

    3.2 實驗數(shù)據(jù)

    本文選取了一個包含2526篇文檔的測試集來檢測本文方法的有效性。測試集中的文檔是利用網(wǎng)絡(luò)爬蟲對多個哈語版新聞網(wǎng)站進(jìn)行爬取獲得的,時間段為2015年5月1日-15日。

    3.3 實驗結(jié)果與分析

    3.3.1 關(guān)鍵詞提取結(jié)果分析

    此部分我們采用了準(zhǔn)確率、召回率、F-measure三項指標(biāo)來對實驗結(jié)果進(jìn)行度量。將提取結(jié)果與文章中擬定好的關(guān)鍵詞進(jìn)行比較,此過程有精確匹配和近似匹配兩種方式。其中近似匹配,就是相似的或存在包含關(guān)系的詞語之間我們認(rèn)為其可以匹配。

    本文選用單獨基于詞頻TF和傳統(tǒng)TF-IDF這兩種方法作為基準(zhǔn)方法進(jìn)行哈薩克文關(guān)鍵詞提取對照性實驗。選取5個關(guān)鍵詞時,實驗結(jié)果見表1所示。

    表1 基準(zhǔn)方法和本文方法實驗結(jié)果

    經(jīng)過多次實驗比對發(fā)現(xiàn),對關(guān)鍵詞提取結(jié)果進(jìn)行近似匹配的評價更有實際意義。三種方法在近似匹配比較下的結(jié)果分析柱狀圖,如圖2所示。

    圖2 近似匹配結(jié)果分析

    從表1和圖2的統(tǒng)計結(jié)果可以看出,經(jīng)過改進(jìn)后的TF-IDF算法不管是精確匹配還是近似匹配,在查準(zhǔn)率、召回率、F-measure上都高于基準(zhǔn)算法。另外每篇文檔關(guān)鍵詞提取個數(shù)對應(yīng)的準(zhǔn)確率也做了統(tǒng)計,當(dāng)關(guān)鍵詞提取個數(shù)為10個時,準(zhǔn)確率達(dá)到了95.8%,證明采用每篇文章權(quán)值排名靠前的10個詞來代替原文章,作為后續(xù)熱度計算的測試集合這一方法是可行的,如表2所示。

    表2 不同關(guān)鍵詞提取個數(shù)對應(yīng)的查準(zhǔn)率

    3.3.2 熱點關(guān)鍵詞提取結(jié)果分析

    此部分選用單獨使用改進(jìn)的TF-PDF算法來進(jìn)行熱點關(guān)鍵詞提取這一方法作為對照實驗。本文采用的是將兩種算法進(jìn)行結(jié)合的方法,先進(jìn)行關(guān)鍵詞提取再進(jìn)行熱度計算,在關(guān)鍵詞提取階段采用了基于多重因子加權(quán)的TF-IDF算法,進(jìn)行過關(guān)鍵詞提取后,由每篇文章權(quán)值排名靠前的10個詞來代替原文章,作為后續(xù)熱度計算的測試集合;熱度計算階段結(jié)合了TF-PDF算法和媒體關(guān)注度的思想構(gòu)造了關(guān)鍵詞熱度評分公式KHD,實現(xiàn)對熱點關(guān)鍵詞的提取,此處計算TF時直接調(diào)用關(guān)鍵詞提取階段保存好的詞頻數(shù)據(jù)。傳統(tǒng)TF-PDF算法和本文方法提取出的排名前15位的熱點關(guān)鍵詞,如表3、表4所示。

    表3 單獨使用TF-PDF算法提取的熱點關(guān)鍵詞

    表4 本文方法提取的熱點關(guān)鍵詞

    因為缺乏統(tǒng)一的評價標(biāo)準(zhǔn),對得到的網(wǎng)絡(luò)熱點關(guān)鍵詞進(jìn)行評價是比較困難的,而且目前沒有對少數(shù)民族語言的網(wǎng)絡(luò)熱點新聞主題進(jìn)行收集分析的平臺。為驗證本文方法的有效性,選擇了新浪網(wǎng)的中文熱點新聞來進(jìn)行比照,本文將表3、表4中提取出的哈薩克文熱點關(guān)鍵詞翻譯成中文,根據(jù)其實際意思來確定其是否在熱點新聞中出現(xiàn)。5月1日-15日之間各類別排名靠前的新浪網(wǎng)熱點新聞主題,如表5所示。

    表5 新浪網(wǎng)熱點新聞

    從表3、表4和表5可以看出,按照本文兩種算法結(jié)合的方法排名前15的熱點關(guān)鍵詞翻譯成中文后出現(xiàn)在了新浪網(wǎng)上的9個熱門新聞主題中,而單獨使用改進(jìn)的TF-PDF算法排序的15個熱點關(guān)鍵詞只出現(xiàn)在了新浪網(wǎng)上的5個熱門新聞主題中,這說明本文方法在提取準(zhǔn)確度上要優(yōu)于基準(zhǔn)方法,同時有助于熱點話題的發(fā)現(xiàn)。

    另外,隨著文檔數(shù)目的不斷增加,本文方法在時間效率方面的優(yōu)勢也得到了體現(xiàn),這在大數(shù)據(jù)時代是非常重要的,如圖3所示。

    圖3 基準(zhǔn)方法和本文方法時間效率折線圖

    4 結(jié) 語

    本文在結(jié)合哈薩克文特點的基礎(chǔ)上,創(chuàng)新性地將TF-IDF和TF-PDF這兩種統(tǒng)計算法進(jìn)行了有機(jī)結(jié)合,先用多重因子加權(quán)改進(jìn)的TF-IDF算法進(jìn)行文檔關(guān)鍵詞提取并組配,得到候選熱點關(guān)鍵詞集,為后續(xù)關(guān)鍵詞熱度計算打下了良好的基礎(chǔ);熱度計算階段,結(jié)合TF-PDF算法和媒體關(guān)注度的思想,在傳統(tǒng)TF-PDF公式的基礎(chǔ)上構(gòu)造了關(guān)鍵詞熱度評分公式KHD,使用此公式對候選熱點關(guān)鍵詞進(jìn)行計算,選取排名前X的詞作為熱點關(guān)鍵詞。結(jié)果表明,本文方法在準(zhǔn)確率和時間效率上都優(yōu)于基準(zhǔn)方法,并且有助于網(wǎng)絡(luò)輿情熱點話題的發(fā)現(xiàn)。文本數(shù)據(jù)的預(yù)處理過程對熱點關(guān)鍵詞提取的準(zhǔn)確度有很大的影響,后續(xù)工作中,將結(jié)合更多哈薩克文的語言特點對文本預(yù)處理及熱點話題發(fā)現(xiàn)方面做進(jìn)一步研究。

    [1] 王立霞,淮曉永. 基于語義的中文文本關(guān)鍵詞提取算法[J]. 計算機(jī)工程, 2012, 38(1):1-4.

    [2] 王錦波,王蓮芝,高萬林,等. 一種改進(jìn)的樸素貝葉斯關(guān)鍵詞提取算法研究[J]. 計算機(jī)應(yīng)用與軟件, 2014, 31(2):174-176,181.

    [3] 林滿山,韓雪嬌,宋威. 基于多線程多重因子加權(quán)的關(guān)鍵詞提取算法[J]. 計算機(jī)工程與設(shè)計, 2013, 34 (7) : 2398-2402,2407.

    [4] 李渝勤,孫麗華. 面向互聯(lián)網(wǎng)輿情的熱詞分析技術(shù)[J]. 中文信息學(xué)報, 2011, 25(1) : 48-53,59.

    [5] 翟東海,王佳君,聶洪玉,等. 基于互信息的熱點詞發(fā)現(xiàn)和突發(fā)性話題檢測研究[J]. 西藏大學(xué)學(xué)報(自然科學(xué)版), 2013 ,28 (1) :82-87.

    [6] 程肖. 網(wǎng)絡(luò)輿情熱點主題詞提取研究[D]. 杭州:杭州電子科技大學(xué), 2010.

    [7] 施聰鶯,徐朝軍,楊曉江.TFIDF算法研究綜述[J]. 計算機(jī)應(yīng)用, 2009, 29:167-170,180.

    [8] 錢愛兵,江嵐. 基于改進(jìn)TF-IDF的中文網(wǎng)頁關(guān)鍵詞抽取_以新聞網(wǎng)頁為例[J]. 情報理論與實踐, 2008, 31(6): 945-950.

    [9]BunKK,IshizukaM.TopicExtractionfromNewsArchiveUsingTF-PDFAlgorithm[C]//Proceedingsofthe3rdInternationalConferenceonWebInformationSystemsEngineering, 2002: 73-82.

    [10] 王永恒.海量短語信息挖掘技術(shù)的研究與實現(xiàn)[D]. 長沙:國防科學(xué)技術(shù)大學(xué), 2006.

    RESEARCH ON THE KAZAKH NETWORK HOT KEYWORDS EXTRACTION METHOD

    Hu Bingyao Gulia·Altenbek

    (CollegeofInformationScienceandEngineering,XinjiangUniversity,Urumqi830046,Xinjiang,China) (Multi-lingualInformationTechnologyLaboratoryofXinjiang,Urumqi830046,Xinjiang,China)

    In order to improve the accuracy and efficiency of the hot key words extraction algorithm for minority language,a new hot keywords extracting method is proposed.Firstly,this method extracts the keywords of the preprocessed text by the improved TF-IDF weighting algorithm and tries to link them together in the light of their location and frequency information,then the candidate hot keywords are obtained.Then,it constructs the KHD (Keywords Hot Degree) formula based on the combination of TF-PDF algorithm and the thought of media attention to achieve the extraction of hotkeywords.Experimental results show that this method is feasible and effective and the extraction accuracy and efficiency has been significantly improved.

    Kazakh Term frequency Document frequency Media attention Hot keywords

    2015-10-09。國家自然科學(xué)基金項目(61063025,61363062)。胡冰瑤,碩士生,主研領(lǐng)域:自然語言信息處理。古麗拉·阿東別克,教授。

    TP3

    A

    10.3969/j.issn.1000-386x.2017.01.008

    猜你喜歡
    文本方法
    初中群文閱讀的文本選擇及組織
    甘肅教育(2020年8期)2020-06-11 06:10:02
    在808DA上文本顯示的改善
    學(xué)習(xí)方法
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    可能是方法不對
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
    人間(2015年20期)2016-01-04 12:47:10
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    賺錢方法
    老熟女久久久| 国产精品免费大片| 亚洲黑人精品在线| 18禁国产床啪视频网站| 99久久人妻综合| 国产精品久久久久久精品古装| 高清不卡的av网站| 啦啦啦在线观看免费高清www| 精品国产乱码久久久久久小说| 美女大奶头黄色视频| 在线精品无人区一区二区三| 午夜福利乱码中文字幕| 人人妻,人人澡人人爽秒播 | 精品少妇内射三级| 久久精品久久久久久噜噜老黄| 男女下面插进去视频免费观看| 国产精品九九99| 国产精品香港三级国产av潘金莲 | 中文欧美无线码| 中文字幕人妻丝袜制服| 久久毛片免费看一区二区三区| 久久亚洲精品不卡| 成年av动漫网址| 国产视频一区二区在线看| a 毛片基地| 2021少妇久久久久久久久久久| 午夜日韩欧美国产| 国产极品粉嫩免费观看在线| 18禁黄网站禁片午夜丰满| 老司机影院毛片| 国产xxxxx性猛交| 成年人黄色毛片网站| 99久久人妻综合| a级毛片黄视频| 国产一区亚洲一区在线观看| 免费不卡黄色视频| bbb黄色大片| 在线观看免费午夜福利视频| 亚洲人成电影观看| 麻豆av在线久日| 国产成人精品久久久久久| 最近中文字幕2019免费版| 人人妻人人澡人人爽人人夜夜| 啦啦啦 在线观看视频| 久久av网站| 国产欧美日韩一区二区三 | 亚洲精品国产av成人精品| 精品国产国语对白av| 精品一区二区三区av网在线观看 | 国产片特级美女逼逼视频| 中文字幕精品免费在线观看视频| 久久国产亚洲av麻豆专区| xxxhd国产人妻xxx| 国产片内射在线| 国产精品欧美亚洲77777| 中文精品一卡2卡3卡4更新| 18禁裸乳无遮挡动漫免费视频| 国产欧美日韩综合在线一区二区| 亚洲av国产av综合av卡| 1024视频免费在线观看| 电影成人av| 国产成人精品无人区| 亚洲七黄色美女视频| 国产一区二区激情短视频 | 精品一品国产午夜福利视频| av在线app专区| 亚洲精品一区蜜桃| 亚洲av在线观看美女高潮| 欧美亚洲日本最大视频资源| a 毛片基地| 人妻人人澡人人爽人人| 好男人视频免费观看在线| 中国国产av一级| av一本久久久久| 亚洲国产av新网站| 大话2 男鬼变身卡| 精品久久久久久久毛片微露脸 | 久久女婷五月综合色啪小说| 亚洲国产看品久久| 亚洲国产精品国产精品| 乱人伦中国视频| 最新在线观看一区二区三区 | 男人操女人黄网站| 性色av乱码一区二区三区2| 色94色欧美一区二区| 欧美人与善性xxx| 亚洲,欧美,日韩| 亚洲男人天堂网一区| 亚洲视频免费观看视频| 亚洲国产毛片av蜜桃av| 午夜免费成人在线视频| 久久久久久久大尺度免费视频| 黄色 视频免费看| 久久久精品区二区三区| 女性被躁到高潮视频| 最近手机中文字幕大全| 一区二区三区乱码不卡18| netflix在线观看网站| av国产久精品久网站免费入址| 少妇猛男粗大的猛烈进出视频| 欧美精品av麻豆av| av一本久久久久| 国产人伦9x9x在线观看| 国产高清videossex| 爱豆传媒免费全集在线观看| 少妇的丰满在线观看| 成年女人毛片免费观看观看9 | 热99久久久久精品小说推荐| 国产真人三级小视频在线观看| 国产又爽黄色视频| 精品一品国产午夜福利视频| h视频一区二区三区| 少妇被粗大的猛进出69影院| 精品视频人人做人人爽| 蜜桃在线观看..| 99国产精品免费福利视频| 久久鲁丝午夜福利片| 欧美日本中文国产一区发布| 精品人妻熟女毛片av久久网站| 女人久久www免费人成看片| 90打野战视频偷拍视频| 啦啦啦 在线观看视频| 国产免费现黄频在线看| 久久久国产精品麻豆| 色94色欧美一区二区| 欧美日韩综合久久久久久| 波野结衣二区三区在线| 成在线人永久免费视频| 免费高清在线观看日韩| 精品国产乱码久久久久久男人| 亚洲av日韩在线播放| 国产成人精品久久二区二区91| 亚洲激情五月婷婷啪啪| 男女边摸边吃奶| 久久九九热精品免费| 两性夫妻黄色片| 午夜av观看不卡| 黄色片一级片一级黄色片| 少妇的丰满在线观看| 精品久久蜜臀av无| 亚洲欧美日韩高清在线视频 | 熟女av电影| 国产精品国产av在线观看| 午夜福利一区二区在线看| 宅男免费午夜| 久久鲁丝午夜福利片| 欧美日本中文国产一区发布| 五月开心婷婷网| 免费女性裸体啪啪无遮挡网站| 叶爱在线成人免费视频播放| 免费观看人在逋| 男女免费视频国产| 电影成人av| 亚洲精品日韩在线中文字幕| 日韩人妻精品一区2区三区| 国产精品国产三级专区第一集| 观看av在线不卡| 欧美亚洲 丝袜 人妻 在线| 久久精品国产亚洲av高清一级| 性色av乱码一区二区三区2| 大型av网站在线播放| 国产女主播在线喷水免费视频网站| 男的添女的下面高潮视频| a级毛片在线看网站| 国产黄频视频在线观看| 国产熟女午夜一区二区三区| 国产一区二区三区av在线| 一级片'在线观看视频| 一级毛片电影观看| 国产精品一区二区在线不卡| 久久综合国产亚洲精品| 啦啦啦在线免费观看视频4| 啦啦啦视频在线资源免费观看| 热re99久久国产66热| 2021少妇久久久久久久久久久| 美女国产高潮福利片在线看| 国产精品熟女久久久久浪| 亚洲欧美精品自产自拍| 午夜免费男女啪啪视频观看| 国产真人三级小视频在线观看| 亚洲,欧美,日韩| 久久久久精品人妻al黑| 精品国产一区二区三区久久久樱花| 美女脱内裤让男人舔精品视频| 亚洲国产精品一区二区三区在线| 亚洲国产精品一区二区三区在线| 免费高清在线观看视频在线观看| 国产精品偷伦视频观看了| 女警被强在线播放| 七月丁香在线播放| 免费av中文字幕在线| 国产精品欧美亚洲77777| 捣出白浆h1v1| 啦啦啦 在线观看视频| 色网站视频免费| 男女免费视频国产| 欧美日韩视频精品一区| 日本vs欧美在线观看视频| 精品卡一卡二卡四卡免费| 国产一级毛片在线| 黄色一级大片看看| 精品国产乱码久久久久久小说| 国产一区二区 视频在线| 99国产精品99久久久久| av电影中文网址| 九色亚洲精品在线播放| 国产精品一区二区精品视频观看| 亚洲精品国产区一区二| 亚洲国产精品国产精品| kizo精华| 五月开心婷婷网| 大话2 男鬼变身卡| 国产极品粉嫩免费观看在线| 国产一区亚洲一区在线观看| 国产精品一区二区在线不卡| 丝袜美足系列| 又紧又爽又黄一区二区| 国产爽快片一区二区三区| 一区福利在线观看| 热99久久久久精品小说推荐| 国产精品一区二区在线观看99| 91国产中文字幕| 亚洲精品乱久久久久久| 啦啦啦中文免费视频观看日本| 国产精品99久久99久久久不卡| 久久久久久久国产电影| 久热这里只有精品99| 亚洲图色成人| 人妻一区二区av| 视频在线观看一区二区三区| 极品人妻少妇av视频| 亚洲情色 制服丝袜| 成年人午夜在线观看视频| 欧美+亚洲+日韩+国产| 久久久欧美国产精品| 久久人妻福利社区极品人妻图片 | 超碰成人久久| 国产亚洲av片在线观看秒播厂| 精品少妇黑人巨大在线播放| 永久免费av网站大全| 欧美黄色淫秽网站| 国产1区2区3区精品| 日韩中文字幕欧美一区二区 | 亚洲国产av新网站| 美女扒开内裤让男人捅视频| 真人做人爱边吃奶动态| 国产精品久久久久久精品电影小说| 18禁观看日本| 国产一区二区三区综合在线观看| 电影成人av| 久久精品久久久久久噜噜老黄| 成人影院久久| 欧美精品亚洲一区二区| 亚洲 国产 在线| 深夜精品福利| 久久精品成人免费网站| 中文精品一卡2卡3卡4更新| av国产久精品久网站免费入址| 亚洲专区中文字幕在线| 亚洲,欧美精品.| av网站免费在线观看视频| 欧美黄色淫秽网站| 美女福利国产在线| 性色av一级| 一区二区日韩欧美中文字幕| 久久国产精品大桥未久av| 欧美日韩福利视频一区二区| 国产高清国产精品国产三级| 五月天丁香电影| 新久久久久国产一级毛片| 精品人妻熟女毛片av久久网站| 国产精品国产三级专区第一集| 免费久久久久久久精品成人欧美视频| 国语对白做爰xxxⅹ性视频网站| 亚洲av成人不卡在线观看播放网 | 日韩精品免费视频一区二区三区| 久久av网站| 最新的欧美精品一区二区| av一本久久久久| 美国免费a级毛片| 亚洲国产欧美日韩在线播放| 蜜桃在线观看..| 一级片免费观看大全| 成年女人毛片免费观看观看9 | 搡老岳熟女国产| 亚洲av成人不卡在线观看播放网 | 中文乱码字字幕精品一区二区三区| 欧美 日韩 精品 国产| 久久久欧美国产精品| 男女边摸边吃奶| 成人三级做爰电影| 少妇猛男粗大的猛烈进出视频| 日韩一区二区三区影片| 欧美黑人精品巨大| 交换朋友夫妻互换小说| 男女国产视频网站| 男人爽女人下面视频在线观看| 另类亚洲欧美激情| 又大又黄又爽视频免费| 亚洲欧美清纯卡通| 18禁观看日本| 十八禁网站网址无遮挡| 日韩av在线免费看完整版不卡| 首页视频小说图片口味搜索 | kizo精华| cao死你这个sao货| 中文字幕色久视频| 国产1区2区3区精品| 每晚都被弄得嗷嗷叫到高潮| 亚洲精品美女久久久久99蜜臀 | 国语对白做爰xxxⅹ性视频网站| 亚洲 国产 在线| 亚洲精品美女久久av网站| 香蕉国产在线看| 免费久久久久久久精品成人欧美视频| 欧美 亚洲 国产 日韩一| 国产又爽黄色视频| 欧美日韩亚洲综合一区二区三区_| 菩萨蛮人人尽说江南好唐韦庄| 久久精品久久精品一区二区三区| 建设人人有责人人尽责人人享有的| 一区二区日韩欧美中文字幕| 午夜福利在线免费观看网站| 亚洲av男天堂| 咕卡用的链子| 老熟女久久久| 视频区欧美日本亚洲| 亚洲天堂av无毛| 看免费av毛片| 晚上一个人看的免费电影| 人人妻人人爽人人添夜夜欢视频| 亚洲国产欧美一区二区综合| 国产成人欧美在线观看 | 免费日韩欧美在线观看| 男女午夜视频在线观看| 亚洲精品日韩在线中文字幕| 久久精品国产综合久久久| 丁香六月天网| 亚洲人成77777在线视频| 亚洲av成人精品一二三区| 国产成人精品久久二区二区免费| 自线自在国产av| 女性生殖器流出的白浆| 午夜老司机福利片| 热re99久久国产66热| 国产亚洲精品第一综合不卡| 亚洲av日韩在线播放| 桃花免费在线播放| 日韩免费高清中文字幕av| 欧美av亚洲av综合av国产av| 男女之事视频高清在线观看 | 丝袜美足系列| 亚洲av在线观看美女高潮| 国产av精品麻豆| 桃花免费在线播放| 美国免费a级毛片| 午夜影院在线不卡| 狠狠婷婷综合久久久久久88av| 女人精品久久久久毛片| 王馨瑶露胸无遮挡在线观看| 新久久久久国产一级毛片| 国产精品av久久久久免费| 国产一区亚洲一区在线观看| 久久人人爽av亚洲精品天堂| 国产欧美日韩综合在线一区二区| 99国产精品免费福利视频| 欧美另类一区| 美女脱内裤让男人舔精品视频| 超碰97精品在线观看| 久久午夜综合久久蜜桃| 久久99热这里只频精品6学生| 久久 成人 亚洲| 美女视频免费永久观看网站| 午夜免费男女啪啪视频观看| 欧美在线一区亚洲| 男女边吃奶边做爰视频| 国产精品免费视频内射| 尾随美女入室| 久久性视频一级片| 亚洲av电影在线观看一区二区三区| 曰老女人黄片| 精品国产一区二区三区四区第35| 国产成人精品久久二区二区91| 大片电影免费在线观看免费| 亚洲一区中文字幕在线| 欧美在线黄色| 伊人亚洲综合成人网| 亚洲欧洲精品一区二区精品久久久| 国产精品久久久久久精品古装| 日韩熟女老妇一区二区性免费视频| 国产成人免费观看mmmm| 久久精品亚洲熟妇少妇任你| 久久毛片免费看一区二区三区| 成人手机av| 一本久久精品| 国产日韩欧美在线精品| 亚洲国产精品一区二区三区在线| 多毛熟女@视频| 一边摸一边做爽爽视频免费| 男女床上黄色一级片免费看| 精品国产乱码久久久久久小说| 免费在线观看视频国产中文字幕亚洲 | 久久久国产精品麻豆| 99热网站在线观看| 亚洲精品日本国产第一区| 精品久久久精品久久久| 极品少妇高潮喷水抽搐| 高清黄色对白视频在线免费看| 欧美精品av麻豆av| 丰满饥渴人妻一区二区三| 国产免费现黄频在线看| 国产亚洲欧美精品永久| 欧美精品亚洲一区二区| av有码第一页| 国产男人的电影天堂91| 97精品久久久久久久久久精品| 亚洲av美国av| 亚洲人成电影免费在线| 亚洲自偷自拍图片 自拍| 少妇被粗大的猛进出69影院| 十八禁人妻一区二区| 国产成人av激情在线播放| 中文字幕亚洲精品专区| 亚洲欧美一区二区三区黑人| 国产亚洲午夜精品一区二区久久| 韩国高清视频一区二区三区| 你懂的网址亚洲精品在线观看| 成人影院久久| 欧美成人精品欧美一级黄| 99精国产麻豆久久婷婷| 2018国产大陆天天弄谢| 蜜桃国产av成人99| 51午夜福利影视在线观看| 丰满人妻熟妇乱又伦精品不卡| 国产高清视频在线播放一区 | 亚洲国产日韩一区二区| 18禁裸乳无遮挡动漫免费视频| 久热爱精品视频在线9| 久久精品国产亚洲av涩爱| 精品久久蜜臀av无| 欧美成人午夜精品| 国产成人免费观看mmmm| 亚洲熟女精品中文字幕| 日韩免费高清中文字幕av| 热99久久久久精品小说推荐| 日本午夜av视频| 一边摸一边抽搐一进一出视频| 欧美人与善性xxx| 91麻豆av在线| 黄色 视频免费看| 满18在线观看网站| 日日夜夜操网爽| 国产xxxxx性猛交| 成人手机av| 中文乱码字字幕精品一区二区三区| a级片在线免费高清观看视频| 婷婷色麻豆天堂久久| 国产1区2区3区精品| 午夜免费男女啪啪视频观看| 老司机午夜十八禁免费视频| 欧美成人午夜精品| 人体艺术视频欧美日本| 久久综合国产亚洲精品| av在线老鸭窝| 亚洲色图 男人天堂 中文字幕| 一边摸一边抽搐一进一出视频| videosex国产| av一本久久久久| 91成人精品电影| 国产熟女午夜一区二区三区| 亚洲欧美精品综合一区二区三区| 香蕉丝袜av| 日日夜夜操网爽| 男女无遮挡免费网站观看| 午夜老司机福利片| 老汉色∧v一级毛片| 欧美精品人与动牲交sv欧美| 一级毛片我不卡| 成年人免费黄色播放视频| 国产精品 欧美亚洲| 91成人精品电影| 别揉我奶头~嗯~啊~动态视频 | 女性被躁到高潮视频| videosex国产| 久久综合国产亚洲精品| 亚洲国产看品久久| 狂野欧美激情性xxxx| 91字幕亚洲| 两性夫妻黄色片| 国产片特级美女逼逼视频| 久久女婷五月综合色啪小说| 国产人伦9x9x在线观看| 午夜影院在线不卡| 亚洲av成人精品一二三区| 啦啦啦啦在线视频资源| 亚洲激情五月婷婷啪啪| 欧美精品啪啪一区二区三区 | 日本91视频免费播放| 两性夫妻黄色片| 亚洲专区国产一区二区| 肉色欧美久久久久久久蜜桃| 国产免费视频播放在线视频| 18禁国产床啪视频网站| 国产激情久久老熟女| 国产精品久久久av美女十八| 国产一区二区在线观看av| 国产一级毛片在线| 嫁个100分男人电影在线观看 | 国产成人精品在线电影| 精品少妇久久久久久888优播| 80岁老熟妇乱子伦牲交| 各种免费的搞黄视频| 老熟女久久久| 亚洲人成电影免费在线| 激情视频va一区二区三区| 永久免费av网站大全| 无限看片的www在线观看| 国产男女超爽视频在线观看| 亚洲,一卡二卡三卡| 午夜福利,免费看| 成人影院久久| 青春草视频在线免费观看| 最新在线观看一区二区三区 | 少妇被粗大的猛进出69影院| 可以免费在线观看a视频的电影网站| 久久久国产欧美日韩av| 日本vs欧美在线观看视频| 国产日韩欧美视频二区| 国产成人精品久久久久久| 美女福利国产在线| 人妻一区二区av| 中文字幕最新亚洲高清| 午夜福利乱码中文字幕| 日韩中文字幕视频在线看片| av在线老鸭窝| 日韩大片免费观看网站| 性色av一级| 色94色欧美一区二区| 青青草视频在线视频观看| h视频一区二区三区| 少妇的丰满在线观看| 亚洲国产精品国产精品| 天天躁夜夜躁狠狠久久av| 国产午夜精品一二区理论片| 熟女少妇亚洲综合色aaa.| 欧美精品高潮呻吟av久久| 性少妇av在线| 亚洲av在线观看美女高潮| 99精品久久久久人妻精品| 亚洲国产欧美日韩在线播放| 日韩大码丰满熟妇| 亚洲欧美一区二区三区国产| 久久人妻福利社区极品人妻图片 | 赤兔流量卡办理| 日韩av免费高清视频| 欧美97在线视频| 高清av免费在线| 少妇精品久久久久久久| 色婷婷av一区二区三区视频| 亚洲伊人色综图| 少妇人妻久久综合中文| 黑人巨大精品欧美一区二区蜜桃| 久9热在线精品视频| 黄色 视频免费看| 99香蕉大伊视频| 三上悠亚av全集在线观看| 久9热在线精品视频| 女人被躁到高潮嗷嗷叫费观| 久久九九热精品免费| 老司机靠b影院| 国产欧美日韩综合在线一区二区| 免费在线观看影片大全网站 | 欧美精品av麻豆av| 国产精品国产av在线观看| 国产亚洲欧美精品永久| 精品一区二区三卡| 精品久久蜜臀av无| 国产xxxxx性猛交| 国产精品免费大片| 男女无遮挡免费网站观看| 国产亚洲午夜精品一区二区久久| 美女中出高潮动态图| 国产精品免费大片| 精品视频人人做人人爽| 国产男女内射视频| av视频免费观看在线观看| 久久国产精品人妻蜜桃| 精品少妇黑人巨大在线播放| 久久99热这里只频精品6学生| 看免费成人av毛片| 国精品久久久久久国模美| 黄色一级大片看看| 亚洲成人手机| 人体艺术视频欧美日本| 亚洲欧美清纯卡通| 精品国产乱码久久久久久男人| 国产精品久久久久成人av| 纵有疾风起免费观看全集完整版| 老司机在亚洲福利影院| 国产成人影院久久av| 国产成人欧美| 日韩制服骚丝袜av| 国产在线观看jvid| 免费久久久久久久精品成人欧美视频| 久久毛片免费看一区二区三区| 久久久精品94久久精品| 久久久欧美国产精品| 人人澡人人妻人| 视频区欧美日本亚洲| 国语对白做爰xxxⅹ性视频网站| 免费女性裸体啪啪无遮挡网站| 曰老女人黄片| 只有这里有精品99| 亚洲精品国产av蜜桃| 色婷婷av一区二区三区视频|