• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于TF-IDF和余弦相似度的文本分類(lèi)方法

    2017-11-27 08:58:50武永亮趙書(shū)良李長(zhǎng)鏡魏娜娣王子晏
    中文信息學(xué)報(bào) 2017年5期
    關(guān)鍵詞:余弦類(lèi)別語(yǔ)料庫(kù)

    武永亮,趙書(shū)良 ,李長(zhǎng)鏡 , 魏娜娣,王子晏

    (1. 河北師范大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,河北 石家莊 050024;2. 河北省計(jì)算數(shù)學(xué)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室, 河北 石家莊 050024;3. 河北師范大學(xué)匯華學(xué)院,河北 石家莊 050091;4. 中國(guó)科學(xué)技術(shù)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 合肥 230022)

    基于TF-IDF和余弦相似度的文本分類(lèi)方法

    武永亮1,2,趙書(shū)良1,2,李長(zhǎng)鏡1,2, 魏娜娣3,王子晏4

    (1. 河北師范大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,河北 石家莊 050024;2. 河北省計(jì)算數(shù)學(xué)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室, 河北 石家莊 050024;3. 河北師范大學(xué)匯華學(xué)院,河北 石家莊 050091;4. 中國(guó)科學(xué)技術(shù)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽 合肥 230022)

    文本分類(lèi)是文本處理的基本任務(wù)。大數(shù)據(jù)處理時(shí)代的到來(lái)致使文本分類(lèi)問(wèn)題面臨著新的挑戰(zhàn)。研究者已經(jīng)針對(duì)不同情況提出多種文本分類(lèi)算法,如KNN、樸素貝葉斯、支持向量機(jī)及一系列改進(jìn)算法。這些算法的性能取決于固定數(shù)據(jù)集,不具有自學(xué)習(xí)功能。該文提出一種新的文本分類(lèi)方法,包括三個(gè)步驟: 基于TF-IDF方法提取類(lèi)別關(guān)鍵詞;通過(guò)類(lèi)別關(guān)鍵詞和待分類(lèi)文本關(guān)鍵詞的相似性進(jìn)行文本分類(lèi);在分類(lèi)過(guò)程中更新類(lèi)別關(guān)鍵詞改進(jìn)分類(lèi)器性能。仿真實(shí)驗(yàn)結(jié)果表明,本文提出方法的準(zhǔn)確度較目前常用方法有較大提高,在實(shí)驗(yàn)數(shù)據(jù)集上分類(lèi)準(zhǔn)確度達(dá)到90%,當(dāng)文本數(shù)據(jù)量較大時(shí),分類(lèi)準(zhǔn)確度可達(dá)到95%。算法初次使用時(shí),需要一定的訓(xùn)練樣本和訓(xùn)練時(shí)間,但分類(lèi)時(shí)間可下降到其他算法的十分之一。該方法具有自學(xué)習(xí)模塊,在分類(lèi)過(guò)程中,可以根據(jù)分類(lèi)經(jīng)驗(yàn)自動(dòng)更新類(lèi)別關(guān)鍵詞,保證分類(lèi)器準(zhǔn)確率,具有很強(qiáng)的現(xiàn)實(shí)應(yīng)用性。

    文本分類(lèi);大數(shù)據(jù);TF-IDF;余弦相似度;類(lèi)別關(guān)鍵詞

    1 引言

    20世紀(jì)90年代以來(lái),互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,信息數(shù)據(jù)成指數(shù)級(jí)別增長(zhǎng)。如何有效地對(duì)這些文本信息進(jìn)行組織和管理,已經(jīng)成為人們迫切需要解決的問(wèn)題。文本分類(lèi)是文本處理過(guò)程中最重要的步驟之一[1]。截至目前,很多文本分類(lèi)方法已被應(yīng)用在各個(gè)領(lǐng)域,例如分類(lèi)實(shí)時(shí)新聞、搜索引擎分類(lèi)搜索、互聯(lián)網(wǎng)信息統(tǒng)計(jì)分析等。

    目前,最常用的文本分類(lèi)算法有KNN、SVM和樸素貝葉斯。KNN算法由T.M. Cover在1967年提出[2],根據(jù)近鄰文本的類(lèi)別統(tǒng)計(jì)完成文本分類(lèi)。KNN算法易于理解和實(shí)現(xiàn),但對(duì)異常值不敏感。Gongde Guo等研究者把KNN算法應(yīng)用在自動(dòng)文本分類(lèi)領(lǐng)域[3]。Jiang S等研究者對(duì)KNN算法進(jìn)行深入研究[4-5]。但KNN算法計(jì)算復(fù)雜度較高,不適合大規(guī)模的文本分類(lèi)問(wèn)題。支持向量機(jī)算法是由Vapnik等人在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上對(duì)線(xiàn)性分類(lèi)器提出的另一種設(shè)計(jì)準(zhǔn)則[6],隨后又發(fā)展為支持向量網(wǎng)絡(luò)[7]。Joachims在1999年進(jìn)行了SVM分類(lèi)器的推導(dǎo)證明[8]。研究人員還在支持向量機(jī)方法的基礎(chǔ)上進(jìn)行其他研究[9-10]。支持向量機(jī)方法在小樣本空間的分類(lèi)問(wèn)題上性能突出。樸素貝葉斯算法的思想早在20世紀(jì)50年代已經(jīng)被提出。在20世紀(jì)60年代成為搜索領(lǐng)域最流行的分類(lèi)方法。Kim等把樸素貝葉斯方法應(yīng)用到文本分類(lèi)領(lǐng)域[11]。Frank把樸素貝葉斯方法應(yīng)用到不均衡文本分類(lèi)中[12],研究人員還基于樸素貝葉斯方法提出許多改進(jìn)方法[13-14]。樸素貝葉斯方法是基于統(tǒng)計(jì)學(xué)理論的分類(lèi)方法,但是無(wú)法處理特征組合分類(lèi)問(wèn)題,所以樸素貝葉斯算法無(wú)法在處理大量文本分類(lèi)問(wèn)題上有較高分類(lèi)效率。

    本文共分為六部分。第一部分描述文本分類(lèi)領(lǐng)域的研究現(xiàn)狀,指出常見(jiàn)文本分類(lèi)算法的適用領(lǐng)域。第二部分描述TF-IDF技術(shù)的原理。第三部分描述余弦相似度的原理。第四部分提出基于TF-IDF的文本分類(lèi)方法。第五部分通過(guò)實(shí)驗(yàn)對(duì)比常見(jiàn)文本分類(lèi)方法在基準(zhǔn)語(yǔ)料庫(kù)上的性能。最后一部分總結(jié)本文的研究成果,并提出下一階段的研究計(jì)劃。

    2 TF-IDF

    本文基于TF-IDF詞頻權(quán)重技術(shù)[15-16]提出一種文本分類(lèi)方法。TF-IDF技術(shù)用于評(píng)估詞語(yǔ)對(duì)于文檔集或語(yǔ)料庫(kù)中文本的重要程度。詞頻(TF)表示特定單詞在文檔中出現(xiàn)的頻率。逆文檔頻率(IDF)用來(lái)評(píng)價(jià)詞語(yǔ)對(duì)于語(yǔ)料庫(kù)的普遍性。TF-IDF值由TF值乘以IDF值得到。TF-IDF技術(shù)經(jīng)常被用于關(guān)鍵詞提取和文章摘要提取[17]。

    TF-IDF技術(shù)用來(lái)提取文本關(guān)鍵詞及類(lèi)別關(guān)鍵詞(KWC)。在本文第四節(jié)中,作者使用類(lèi)別關(guān)鍵詞和文本關(guān)鍵詞的相似度來(lái)進(jìn)行文本分類(lèi)。

    3 余弦相似度

    余弦相似度是通過(guò)兩個(gè)向量之間的夾角來(lái)衡量向量相似性。余弦相似度計(jì)算如式(1)所示。

    在本文第四節(jié)中詳細(xì)描述類(lèi)別關(guān)鍵詞的獲取,及通過(guò)文本關(guān)鍵詞和類(lèi)別關(guān)鍵詞的相似性進(jìn)行文本分類(lèi)的過(guò)程。

    4 基于TF-IDF和余弦相似度的文本分類(lèi)方法

    4.1 方法架構(gòu)

    本文提出的文本分類(lèi)方法整體架構(gòu)如圖1所示。

    本文提出類(lèi)別關(guān)鍵詞提取算法來(lái)獲取類(lèi)別關(guān)鍵詞。首先讀取類(lèi)別的所有文本,然后去除特殊符號(hào)及停用詞,剩余詞語(yǔ)為類(lèi)別關(guān)鍵詞。類(lèi)別關(guān)鍵詞數(shù)量過(guò)多會(huì)導(dǎo)致計(jì)算量增大,所以本文根據(jù)TF-IDF值進(jìn)行關(guān)鍵詞排序,篩選后得到類(lèi)別關(guān)鍵詞。具體篩選方法參見(jiàn)4.1節(jié)中類(lèi)別關(guān)鍵字尋優(yōu)過(guò)程。

    算法1類(lèi)別關(guān)鍵詞提取算法

    輸入:

    corpus:訓(xùn)練語(yǔ)料庫(kù)

    catelist:存儲(chǔ)所有類(lèi)別信息

    dlist:訓(xùn)練集的根目錄,把所有的訓(xùn)練樣本放入一個(gè)文件夾。一級(jí)目錄為類(lèi)別名。每個(gè)一級(jí)目錄中包含本類(lèi)別的所有訓(xùn)練樣本。

    stopWordList:存儲(chǔ)停用詞表

    輸出:

    catelist:包含類(lèi)別關(guān)鍵詞的類(lèi)別信息

    具體算法:

    1: foreach d∈dlist do

    2: t.realcategory = d.getDirectoryName()//得到類(lèi)別目錄

    3: singleTypeContent = ‘’

    4: foreach f∈getFileList(d) do

    5: content= readFile(f)

    6: singleTypeContent += textClean (content)

    7: end for

    8: corpus.append(singleTypeContent)

    9: catelist.append(t)

    10: end for

    11: TF-IDF = fit_transform(corpus)

    12: word = get_feature_names()

    13: weight = getTF-IDF()

    14: foreach c∈catelist do

    15: order( c. keywordList )//根據(jù)TF-IDF值,排序類(lèi)別關(guān)鍵詞

    16: end for

    圖1 基于TF-IDF和余弦相似度的文本分類(lèi)方法的架構(gòu)

    在算法1中,第1~3步,讀取訓(xùn)練集的根目錄,其中每一個(gè)子目錄代表一個(gè)類(lèi)別。在第4~10步中依次讀取各類(lèi)別所有的文本,進(jìn)行文本預(yù)處理、分詞等操作。在第11~13步中計(jì)算出所有單詞的TF-IDF值,在第14~16步中按照TF-IDF值進(jìn)行排序。最終得到每個(gè)類(lèi)別的所有關(guān)鍵詞。

    算法2的目的是得到文本關(guān)鍵詞。

    算法2文本關(guān)鍵詞提取算法

    輸入:

    corpus:訓(xùn)練語(yǔ)料庫(kù)

    testFilelist:保存所有的待分類(lèi)文本

    dtlist:測(cè)試集的根目錄,把所有的測(cè)試樣本放入一個(gè)文件夾。一級(jí)目錄為類(lèi)別名。每個(gè)一級(jí)目錄中包含本類(lèi)別的所有測(cè)試樣本。

    stopWordList:存儲(chǔ)停用詞表

    輸出:

    testFilelist:得到所有的待分類(lèi)文本的關(guān)鍵詞

    具體算法:

    1: foreach d∈dtlist do

    2: foreach f∈getFileList(d) do

    3: text.realCategory= readRealCategorys(f)

    4: content= readFile(f)

    5: text.content = textClean (content)

    6: corpus.append(text.content)

    7: testFilelist.append(text)

    8: end for

    9: end for

    10: TF-IDF = fit_transform(corpus)

    11: word = get_feature_names()

    12: weight = getTF-IDF()

    13: foreach f∈testFilelist do

    14: order( f. keywordList )//根據(jù)TF -IDF值排序文本關(guān)鍵詞

    15: end for

    在算法2中,第1~9步進(jìn)行待分類(lèi)文本根目錄的讀取。第3步中記錄測(cè)試集的真實(shí)類(lèi)別。在第2~7步中預(yù)處理所有文件內(nèi)容。在第10~11步中計(jì)算每個(gè)單詞的TF-IDF值,然后在第13~15步中按照TF-IDF值進(jìn)行關(guān)鍵詞的排序。

    文本分類(lèi)算法根據(jù)文本關(guān)鍵詞和類(lèi)別關(guān)鍵詞的相似度進(jìn)行文本分類(lèi)。

    算法3文本分類(lèi)算法

    輸入:

    KWCs:每個(gè)類(lèi)別的類(lèi)別關(guān)鍵詞

    Key-words:測(cè)試文本的文本關(guān)鍵詞

    輸出:

    predictCategory:存儲(chǔ)測(cè)試文本的預(yù)測(cè)類(lèi)別

    具體算法:

    1: foreach fkw∈dtlist do

    2: foreach kwc∈catelistdo

    3: if max lt; getCosineSimilarity(fkw , kwc)

    4: max = getCosineSimilarity(fkw , kwc)

    5: end if

    6: end for

    7: predictCategory = argmax( kwc )//相似度最大的類(lèi)別為預(yù)測(cè)的文本類(lèi)別

    8: end for

    在算法3中,第1~6步中計(jì)算文本與所有類(lèi)別的相似度。第7步中找到最大相似度的類(lèi)別。

    分類(lèi)器自學(xué)習(xí)算法可以提升分類(lèi)器性能。通過(guò)設(shè)置閾值條件把文本加入訓(xùn)練集,重新訓(xùn)練分類(lèi)器。分類(lèi)算法就在分類(lèi)過(guò)程中自學(xué)習(xí),提升分類(lèi)器的性能,具體算法在第4.4節(jié)類(lèi)別關(guān)鍵詞自更新機(jī)制中介紹。

    4.2 類(lèi)別關(guān)鍵詞尋優(yōu)

    本文提出類(lèi)別關(guān)鍵詞提取算法來(lái)獲取類(lèi)別關(guān)鍵詞。以BBC語(yǔ)料庫(kù)(BBC語(yǔ)料庫(kù)的介紹請(qǐng)參考第5.1節(jié))為例,在表1中列出每個(gè)類(lèi)別排名前10位的關(guān)鍵詞。

    表1 BBC數(shù)據(jù)集中各類(lèi)別前10個(gè)關(guān)鍵詞

    數(shù)據(jù)表明,類(lèi)別關(guān)鍵詞可表明類(lèi)別特征。關(guān)鍵詞的TF-IDF值決定關(guān)鍵詞在此類(lèi)別中的重要程度。但類(lèi)別關(guān)鍵詞過(guò)多會(huì)導(dǎo)致分類(lèi)效率降低。實(shí)驗(yàn)表明,選取的類(lèi)別關(guān)鍵詞達(dá)到一定比例時(shí),分類(lèi)精度保持穩(wěn)定。以BBC語(yǔ)料庫(kù)為例,實(shí)驗(yàn)結(jié)果如圖2所示。

    圖2 類(lèi)別關(guān)鍵詞百分比和分類(lèi)器精度的關(guān)系

    4.3 文本關(guān)鍵詞尋優(yōu)

    本文提出文本分類(lèi)算法來(lái)獲取文本關(guān)鍵詞。表2中列舉五個(gè)待分類(lèi)文本中排名前十位的關(guān)鍵詞。

    根據(jù)以上關(guān)鍵字進(jìn)行仿真實(shí)驗(yàn),當(dāng)類(lèi)別關(guān)鍵詞比例固定,文本關(guān)鍵詞比例增加時(shí),分類(lèi)精度會(huì)大幅提升,達(dá)到臨界點(diǎn)后,分類(lèi)效率穩(wěn)定。故選文本關(guān)鍵詞取臨界點(diǎn)比例,效率最優(yōu)。以BBC語(yǔ)料庫(kù)為例,實(shí)驗(yàn)結(jié)果如圖3所示。

    表2 BBC語(yǔ)料庫(kù)中測(cè)試文本的前10個(gè)關(guān)鍵詞

    圖3 文本關(guān)鍵詞比例和分類(lèi)器精度的關(guān)系

    4.4 類(lèi)別關(guān)鍵詞自更新機(jī)制

    通過(guò)4.2節(jié),4.3節(jié)的描述,對(duì)本文提出的分類(lèi)算法進(jìn)行參數(shù)優(yōu)化。本算法(算法4)加入類(lèi)別關(guān)鍵詞自更新機(jī)制來(lái)解決冷啟動(dòng)現(xiàn)象。

    算法4自學(xué)習(xí)文本分類(lèi)算法

    輸入:

    KWCs:每個(gè)類(lèi)別的類(lèi)別關(guān)鍵詞

    Key-words:待分類(lèi)文本的關(guān)鍵詞

    輸出:

    predictCategory:待分類(lèi)文本的預(yù)測(cè)類(lèi)別

    具體算法:

    1: foreach fkw∈dtlist do

    2: foreach kwc∈catelist do

    3: if max lt; getCosineSimilarity(fkw , kwc)

    4: max = getCosineSimilarity(fkw , kwc)

    5: end if

    6: end for

    7: predictCategory = argmax( kwc )

    8: if thresholdfun (max)//如果相似度達(dá)到閾值條件

    9: updatKWC();//加入待訓(xùn)練文本集合,重新訓(xùn)練分類(lèi)模型,更新類(lèi)別關(guān)鍵詞

    10: end for

    算法4與算法3相比加入第8~9步來(lái)更新類(lèi)別關(guān)鍵詞。當(dāng)文本關(guān)鍵詞和類(lèi)別關(guān)鍵詞達(dá)到相似度閾值時(shí),則把此文本加入待訓(xùn)練文本集合中。當(dāng)待訓(xùn)練文本集合的文本數(shù)量達(dá)到固定數(shù)量閾值時(shí),重新訓(xùn)練分類(lèi)器,更新類(lèi)別關(guān)鍵詞。本算法通過(guò)控制相似度閾值降低噪聲文本加入待訓(xùn)練集的概率,提升分類(lèi)效率。

    5 實(shí)驗(yàn)

    5.1 數(shù)據(jù)集

    BBC(英國(guó)廣播公司新聞數(shù)據(jù)): 此數(shù)據(jù)集經(jīng)常被用于文本分類(lèi)、文本聚類(lèi)等任務(wù)。原始的BBC語(yǔ)料庫(kù)包括2 225個(gè)新聞文本,5個(gè)不同的類(lèi)別。數(shù)據(jù)集中五個(gè)類(lèi)別分別是商業(yè)、娛樂(lè)、政治、體育和科技。(來(lái)自于http://mlg.ucd.ie/datasets/bbc.html)

    20 Newsgroups: 此數(shù)據(jù)集由Ken Lang收集,包括20 017個(gè)文本,20個(gè)類(lèi)別,經(jīng)常被用于文本分類(lèi)任務(wù)。 (來(lái)自于http://www.qwone.com/~jason/20Newsgroups/)

    Reuters-21578:包含21 578個(gè)1987年的路透社新聞文檔[18]。此數(shù)據(jù)集使用自動(dòng)語(yǔ)音識(shí)別系統(tǒng)創(chuàng)建。研究人員經(jīng)常使用本數(shù)據(jù)集代替原始數(shù)據(jù)集進(jìn)行分類(lèi)實(shí)驗(yàn)。 (來(lái)自于http://archive.ics.uci.edu/ml/datasets/Reuters + Transcribed + Subset)

    5.2 評(píng)價(jià)指標(biāo)

    本文采用準(zhǔn)確率、召回率和F1值進(jìn)行分類(lèi)評(píng)價(jià),并定義分類(lèi)指標(biāo)TP(真正)、FN(假負(fù))、FP(假正)、TN(真負(fù))。

    準(zhǔn)確率被用來(lái)作為分類(lèi)器正確識(shí)別文本的一個(gè)統(tǒng)計(jì)測(cè)量。準(zhǔn)確率P由TP和FP計(jì)算如式(2)所示。

    召回率指檢索出的相關(guān)文檔數(shù)和文檔庫(kù)中所有相關(guān)文檔數(shù)的比率,測(cè)量檢索系統(tǒng)的查全率的召回率R由TP和FN計(jì)算如式(3)所示。

    F1值是衡量分類(lèi)器分類(lèi)準(zhǔn)確性的標(biāo)準(zhǔn)。F1值的計(jì)算方法是準(zhǔn)確率P和召回率R的加權(quán)平均。F1值最大值為1,最小值為0。計(jì)算公式如式(4)所示。

    5.3 實(shí)驗(yàn)結(jié)果

    本文對(duì)于每個(gè)數(shù)據(jù)集,隨機(jī)選擇80%作為訓(xùn)練集和20%作為測(cè)試集進(jìn)行實(shí)驗(yàn)。本文采用交叉驗(yàn)證方法,選擇F1值作為綜合性能指標(biāo),在Reuters-21578數(shù)據(jù)集中各分類(lèi)方法的實(shí)驗(yàn)結(jié)果如圖4所示。

    圖4 在Reuters-21578數(shù)據(jù)集上的結(jié)果對(duì)比

    在20 Newsgroups數(shù)據(jù)集、傳統(tǒng)BBC新聞網(wǎng)數(shù)據(jù)集、2016年爬取的BBC最新數(shù)據(jù)集(測(cè)試文本下載地址http://pan.baidu.com/s/1qXNrlTy)上也呈現(xiàn)出較好的分類(lèi)結(jié)果。

    6 結(jié)束語(yǔ)

    本文提出一種基于TF-IDF和余弦相似度的有效文本分類(lèi)方法。實(shí)驗(yàn)結(jié)果表明,該方法在BBC數(shù)據(jù)集、Reuters-21578數(shù)據(jù)集和20 Newsgroups數(shù)據(jù)集上表現(xiàn)良好。在實(shí)驗(yàn)數(shù)據(jù)集上分類(lèi)準(zhǔn)確度較高,可解決當(dāng)前互聯(lián)網(wǎng)信息系統(tǒng)處理大量文本分類(lèi)任務(wù)的問(wèn)題。本文提出的分類(lèi)方法通過(guò)自學(xué)習(xí)功能維持分類(lèi)效率。

    后續(xù)擬開(kāi)展的研究包括: 對(duì)類(lèi)別關(guān)鍵詞的閾值更新進(jìn)行深入研究;本文提出的文本分類(lèi)方法主要針對(duì)英文文本數(shù)據(jù)集,后續(xù)可以應(yīng)用到中文文本數(shù)據(jù)集上進(jìn)行文本分類(lèi);本文提出的文本分類(lèi)算法只考慮了文本統(tǒng)計(jì)信息,后續(xù)將對(duì)提取的文本關(guān)鍵詞進(jìn)行組合,并提出“文本關(guān)鍵詞組”的概念,提高分類(lèi)準(zhǔn)確度,優(yōu)化文本關(guān)鍵詞提取。

    [1] Joachims T. A Probabilistic Analysis of the Rocchio Algorithm with TF-IDF for Text Categorization[R]. Carnegie-mellon univpittsburgh pa dept of computer science, 1996.

    [2] Cover T, Hart P. Nearest neighbor pattern classification[J]. IEEE Transactions on Information Theory, 1967, 13(1):21-27.

    [3] Guo G, Wang H, Bell D, et al. Using kNN model for automatic text categorization[J]. Soft Computing, 2006, 10(5): 423-430.

    [4] Jiang S, Pang G, Wu M, et al. An improved K-nearest-neighbor algorithm for text categorization[J]. Expert Systems with Applications, 2012, 39(1): 1503-1509.

    [5] Soucy P, Mineau G W. A simple KNN algorithm for text categorization[C]//Proceedings IEEE International Conference on. IEEE, 2001: 647-648.

    [6] Boser B E, Guyon I M, Vapnik V N. A training algorithm for optimal margin classifiers[C]//Proceedings of the fifth Annual Workshop on Computational Learning Theory. ACM, 1992: 144-152.

    [7] Cortes C, Vapnik V. Support-vector networks[J]. Machine Learning, 1995, 20(3): 273-297.

    [8] Joachims T. Transductive inference for text classification using support vector machines[C]//Proceedings of the International Conference on Machine Learning. 1999(99): 200-209.

    [9] Tong S, Koller D. Support vector machine active learning with applications to text classification[J]. The Journal of Machine Learning Research, 2002(2): 45-66.

    [10] Kim H, Howland P, Park H. Dimension reduction in text classification with support vector machines[J]. Journal of Machine Learning Research, 2005: 37-53.

    [11] Kim S B, Han K S, Rim H C, et al. Some effective techniques for naive bayes text classification[J]. Knowledge and Data Engineering, IEEE Transactions, 2006, 18(11): 1457-1466.

    [12] Frank E, Bouckaert R R. Naive bayes for text classification with unbalanced classes[M].Knowledge Discovery in Databases PKDD 2006. SpringerBerlin Heidelberg, 2006: 503-510.

    [13] Wang S, Jiang L, Li C. Adapting naive bayes tree for text classification[J]. Knowledge and Information Systems, 2015, 44(1): 77-89.

    [14] Rennie J D, Shih L, Teevan J, et al. Tackling the poor assumptions of naive bayes text classifiers[C]//Proceedings of the ICML, 2003, 3616-3623.

    [15] Yu C T, Salton G. Precision weighting: an effective automatic indexing method[J]. Journal of the ACM (JACM), 1976, 23(1): 76-88.

    [16] Amati G, Van Rijsbergen C J. Probabilistic models of information retrieval based on measuring the divergence from randomness[J]. ACM Transactions on Information Systems (TOIS), 2002, 20(4): 357-389.

    [17] Lin J. Using distributional similarity to identify individual verb choice[C]//Proceedings of the Fourth International Natural Language Generation Conference. Association for Computational Linguistics, 2006: 33-40.

    [18] Liere R, Tadepalli P. Active learning with committees for text categorization[C]//Proceedings of the AAAI/IAAI. 1997: 591-596.

    武永亮(1986—),博士研究生,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘、智能信息處理。

    E-mail: squallwu_2006@qq.com

    趙書(shū)良(1967—),教授,博士生導(dǎo)師,主要研究領(lǐng)域?yàn)閿?shù)據(jù)挖掘、智能信息處理。

    E-mail: zhaoshuliang@sina.com

    李長(zhǎng)鏡(1990—),碩士研究生,主要研究領(lǐng)域?yàn)槲谋就诰颉?/p>

    E-mail: lee_0809hbsd@outlook.com

    TextClassificationMethodBasedonTF-IDFandCosineSimilarity

    WU Yongliang1,2, ZHAO Shuliang1,2, LI Changjing1,2, WEI Nadi3, WANG Ziyan4

    (1. College of Mathematics and Information Science, HeBei Normal University, Shijiazhuang, Hebei 050024, China;2. Hebei Key Laboratory of Computational Mathematics and Applications, Shijiazhuang, Hebei 050024, China;3. Huihua College of Hebei Normal University, Shijiazhuang, Hebei 050091, China;4. College of Computer Science and Technology, University of Scienceamp;Technology China, Hefei, Anhui 230022, China)

    Text classification is the fundamental task for text mining. Many text classification algorithms have been presented in previous literatures, such as KNN, Na?ve Bayes, Support Vector Machine, and some improved algorithms. The performance of these algorithms depends on the data set and does not have self-learning function. This paper proposes an effective approach for text classification. The three key points of the approach are: 1)extracting the keywords of category (KWC) of labeled texts based on the TF-IDF approach, 2) classifying unlabeled text by the relevancy of category and unlabeled text, and 3) improving the performance of the approach via updating the KWC in the process of classification. Simulation experiment results show that the new approach can improve the accuracy of text classification to 90%, and even up to 95% when the data volume is large enough. The method can automatically update the keywords of category to improve the classification accuracy of the classifier.

    text classification; big data; TF-IDF; cosine similarity; category keywords

    1003-0077(2017)05-0138-08

    TP391

    A

    2016-09-07定稿日期2017-04-11

    國(guó)家自然科學(xué)基金(71271067);國(guó)家社科基金重大項(xiàng)目(13amp;ZD091);河北省高等學(xué)校科學(xué)技術(shù)研究項(xiàng)目(QN2014196);河北省科技計(jì)劃項(xiàng)目(15210403D)

    猜你喜歡
    余弦類(lèi)別語(yǔ)料庫(kù)
    《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
    把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
    兩個(gè)含余弦函數(shù)的三角母不等式及其推論
    分?jǐn)?shù)階余弦變換的卷積定理
    服務(wù)類(lèi)別
    圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
    基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
    論類(lèi)別股東會(huì)
    商事法論集(2014年1期)2014-06-27 01:20:42
    離散余弦小波包變換及語(yǔ)音信號(hào)壓縮感知
    中醫(yī)類(lèi)別全科醫(yī)師培養(yǎng)模式的探討
    亚洲av日韩在线播放| 亚洲国产精品成人久久小说| 在线观看人妻少妇| 王馨瑶露胸无遮挡在线观看| 日本色播在线视频| 高清在线视频一区二区三区| 69精品国产乱码久久久| 亚洲欧美精品自产自拍| 女性生殖器流出的白浆| 午夜免费观看性视频| 亚洲成人免费av在线播放| 考比视频在线观看| 日韩熟女老妇一区二区性免费视频| 亚洲国产欧美一区二区综合| 中文字幕人妻丝袜一区二区 | 免费观看性生交大片5| 精品免费久久久久久久清纯 | 大码成人一级视频| 伊人亚洲综合成人网| av在线app专区| 黄片无遮挡物在线观看| 国产成人午夜福利电影在线观看| 亚洲精品乱久久久久久| 精品免费久久久久久久清纯 | 综合色丁香网| 亚洲av成人精品一二三区| 国产女主播在线喷水免费视频网站| 久久久国产欧美日韩av| 九九爱精品视频在线观看| 国产乱来视频区| 男女边吃奶边做爰视频| 午夜福利一区二区在线看| 97人妻天天添夜夜摸| 日韩av不卡免费在线播放| 国产一区二区激情短视频 | 国产日韩欧美亚洲二区| 国产精品三级大全| 欧美人与性动交α欧美精品济南到| av在线老鸭窝| 99久国产av精品国产电影| 操美女的视频在线观看| 亚洲天堂av无毛| 国产成人精品无人区| 在线 av 中文字幕| 日本色播在线视频| 免费女性裸体啪啪无遮挡网站| 欧美中文综合在线视频| 狠狠精品人妻久久久久久综合| 久久久久久久精品精品| 久久午夜综合久久蜜桃| 欧美 日韩 精品 国产| 看非洲黑人一级黄片| 一边摸一边抽搐一进一出视频| 如日韩欧美国产精品一区二区三区| 日韩电影二区| 久久久精品区二区三区| 色综合欧美亚洲国产小说| 日韩一区二区视频免费看| 亚洲国产欧美日韩在线播放| 高清av免费在线| 另类亚洲欧美激情| 黑人巨大精品欧美一区二区蜜桃| 女人精品久久久久毛片| 国产一区二区 视频在线| 天天躁日日躁夜夜躁夜夜| 麻豆乱淫一区二区| 国产99久久九九免费精品| 久久久久久久久久久久大奶| 啦啦啦视频在线资源免费观看| 亚洲精品日韩在线中文字幕| 夫妻性生交免费视频一级片| 亚洲第一av免费看| 侵犯人妻中文字幕一二三四区| 欧美人与性动交α欧美精品济南到| 成人亚洲欧美一区二区av| h视频一区二区三区| 亚洲精品一区蜜桃| 丁香六月欧美| 欧美97在线视频| 欧美少妇被猛烈插入视频| 亚洲色图 男人天堂 中文字幕| 国产 精品1| 在线观看免费日韩欧美大片| 中文字幕人妻丝袜一区二区 | 国产成人精品久久久久久| 叶爱在线成人免费视频播放| 久久精品人人爽人人爽视色| 久久天堂一区二区三区四区| 97在线人人人人妻| 黄色视频在线播放观看不卡| 亚洲精品日本国产第一区| 久久久久国产精品人妻一区二区| 久久午夜综合久久蜜桃| 亚洲成国产人片在线观看| 亚洲精品aⅴ在线观看| 色94色欧美一区二区| 国产精品.久久久| 久热这里只有精品99| 黄色视频不卡| 老汉色av国产亚洲站长工具| videos熟女内射| 18禁观看日本| 国产日韩欧美亚洲二区| 在线观看一区二区三区激情| 久久国产精品男人的天堂亚洲| 啦啦啦啦在线视频资源| 精品国产超薄肉色丝袜足j| 在线观看免费高清a一片| 国产日韩一区二区三区精品不卡| 99香蕉大伊视频| 在线观看免费日韩欧美大片| 亚洲一卡2卡3卡4卡5卡精品中文| 国产午夜精品一二区理论片| 青春草国产在线视频| 久久人人爽人人片av| 性色av一级| 毛片一级片免费看久久久久| 人人澡人人妻人| 色婷婷av一区二区三区视频| 哪个播放器可以免费观看大片| 欧美人与善性xxx| 国产野战对白在线观看| 亚洲自偷自拍图片 自拍| 欧美日韩亚洲国产一区二区在线观看 | 一边摸一边做爽爽视频免费| 狂野欧美激情性bbbbbb| 99久久99久久久精品蜜桃| 久久 成人 亚洲| 国产成人一区二区在线| 91成人精品电影| 欧美av亚洲av综合av国产av | 你懂的网址亚洲精品在线观看| 亚洲图色成人| 黄色 视频免费看| 成年人午夜在线观看视频| 9191精品国产免费久久| 亚洲国产日韩一区二区| 国产成人啪精品午夜网站| 搡老岳熟女国产| 亚洲美女搞黄在线观看| 如日韩欧美国产精品一区二区三区| 亚洲欧美色中文字幕在线| 午夜福利影视在线免费观看| 精品国产国语对白av| 国产一区二区 视频在线| 亚洲成国产人片在线观看| av在线观看视频网站免费| 亚洲av日韩在线播放| 夫妻性生交免费视频一级片| 国产一区二区激情短视频 | 精品国产一区二区三区久久久樱花| 久久久精品免费免费高清| 老熟女久久久| 新久久久久国产一级毛片| 建设人人有责人人尽责人人享有的| 一级黄片播放器| 亚洲精品aⅴ在线观看| 精品福利永久在线观看| 欧美精品高潮呻吟av久久| 精品一区二区三卡| 午夜激情av网站| 在线 av 中文字幕| av国产精品久久久久影院| 老司机深夜福利视频在线观看 | 国产成人免费无遮挡视频| 国产日韩一区二区三区精品不卡| 国产av一区二区精品久久| 亚洲男人天堂网一区| 欧美老熟妇乱子伦牲交| h视频一区二区三区| 国产一区二区激情短视频 | 国产免费视频播放在线视频| 夫妻午夜视频| 亚洲精品日本国产第一区| 亚洲成人一二三区av| 日本91视频免费播放| 日韩 欧美 亚洲 中文字幕| 久久婷婷青草| 99国产精品免费福利视频| 91精品三级在线观看| 国产一区二区三区av在线| 亚洲精品乱久久久久久| 91精品国产国语对白视频| 亚洲美女搞黄在线观看| 欧美日韩亚洲综合一区二区三区_| 人成视频在线观看免费观看| 午夜久久久在线观看| 少妇人妻精品综合一区二区| 亚洲,欧美,日韩| 欧美人与性动交α欧美精品济南到| 国产高清国产精品国产三级| 日韩一区二区三区影片| 国产xxxxx性猛交| 亚洲第一区二区三区不卡| 色婷婷av一区二区三区视频| 曰老女人黄片| 久久久精品区二区三区| 最新在线观看一区二区三区 | 卡戴珊不雅视频在线播放| 日韩中文字幕欧美一区二区 | 欧美亚洲日本最大视频资源| 狂野欧美激情性xxxx| 99九九在线精品视频| 极品少妇高潮喷水抽搐| 亚洲av在线观看美女高潮| 久久久久久久久久久免费av| 亚洲av成人精品一二三区| 9色porny在线观看| 在线亚洲精品国产二区图片欧美| 人妻 亚洲 视频| 大陆偷拍与自拍| 爱豆传媒免费全集在线观看| 天堂8中文在线网| 久久99热这里只频精品6学生| 69精品国产乱码久久久| 久久热在线av| 国产精品久久久久成人av| 精品国产一区二区三区四区第35| 人妻一区二区av| 亚洲av中文av极速乱| 91国产中文字幕| 青春草亚洲视频在线观看| 大片免费播放器 马上看| 亚洲熟女毛片儿| 亚洲男人天堂网一区| 亚洲熟女精品中文字幕| 青春草亚洲视频在线观看| 国产片特级美女逼逼视频| 一个人免费看片子| av网站免费在线观看视频| 国产男人的电影天堂91| 免费黄色在线免费观看| 伦理电影大哥的女人| 日韩伦理黄色片| 亚洲婷婷狠狠爱综合网| 亚洲欧美色中文字幕在线| 母亲3免费完整高清在线观看| 午夜老司机福利片| 丝袜美足系列| h视频一区二区三区| 欧美日韩成人在线一区二区| 黄色怎么调成土黄色| 欧美精品亚洲一区二区| 国产在线视频一区二区| av免费观看日本| 国产成人啪精品午夜网站| 少妇人妻精品综合一区二区| 涩涩av久久男人的天堂| av有码第一页| 亚洲成国产人片在线观看| av不卡在线播放| 亚洲美女搞黄在线观看| 永久免费av网站大全| 多毛熟女@视频| 国产乱来视频区| 99国产精品免费福利视频| 日本wwww免费看| 99久久综合免费| 97在线人人人人妻| 国产精品久久久久久人妻精品电影 | 乱人伦中国视频| 99久久人妻综合| 欧美人与善性xxx| 国产一区二区在线观看av| 超碰成人久久| 国产精品二区激情视频| 美女主播在线视频| 超碰成人久久| 一级爰片在线观看| 国产97色在线日韩免费| 日韩一区二区三区影片| 波野结衣二区三区在线| 国产成人啪精品午夜网站| 国产免费一区二区三区四区乱码| 国产麻豆69| 操美女的视频在线观看| 亚洲综合色网址| 日韩一本色道免费dvd| 日本av免费视频播放| 久久久国产一区二区| 免费观看性生交大片5| 一二三四在线观看免费中文在| 九色亚洲精品在线播放| 秋霞伦理黄片| 亚洲熟女精品中文字幕| 99九九在线精品视频| 日韩 欧美 亚洲 中文字幕| 久久精品亚洲av国产电影网| 99久久综合免费| 亚洲精品日本国产第一区| 日本猛色少妇xxxxx猛交久久| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲国产av新网站| 国产片内射在线| 免费看av在线观看网站| 1024香蕉在线观看| 亚洲一区二区三区欧美精品| 一级毛片电影观看| 亚洲欧美清纯卡通| 欧美 日韩 精品 国产| 国产激情久久老熟女| 在线观看免费午夜福利视频| 欧美另类一区| 国产av国产精品国产| 亚洲欧美一区二区三区国产| 亚洲av在线观看美女高潮| 亚洲中文av在线| 久久99精品国语久久久| 2018国产大陆天天弄谢| 丰满饥渴人妻一区二区三| 涩涩av久久男人的天堂| 99re6热这里在线精品视频| 一级毛片 在线播放| 九色亚洲精品在线播放| 欧美在线黄色| 色婷婷av一区二区三区视频| 侵犯人妻中文字幕一二三四区| 在线亚洲精品国产二区图片欧美| 欧美亚洲日本最大视频资源| 亚洲av日韩在线播放| 国产人伦9x9x在线观看| 丝瓜视频免费看黄片| 亚洲精品日韩在线中文字幕| 91aial.com中文字幕在线观看| 丰满乱子伦码专区| www.自偷自拍.com| 男女免费视频国产| 高清av免费在线| 另类精品久久| 国产伦人伦偷精品视频| 久久性视频一级片| 老司机深夜福利视频在线观看 | 午夜免费观看性视频| 香蕉丝袜av| 99香蕉大伊视频| 国产精品99久久99久久久不卡 | 一级,二级,三级黄色视频| 久久性视频一级片| 亚洲四区av| 尾随美女入室| 少妇的丰满在线观看| 少妇 在线观看| 尾随美女入室| 成年女人毛片免费观看观看9 | 国产一区二区激情短视频 | 少妇的丰满在线观看| 丰满迷人的少妇在线观看| 老司机靠b影院| 另类亚洲欧美激情| 亚洲免费av在线视频| 精品卡一卡二卡四卡免费| 黄色视频在线播放观看不卡| videosex国产| 亚洲av电影在线观看一区二区三区| 高清欧美精品videossex| 国产成人一区二区在线| 亚洲美女视频黄频| 亚洲精品一区蜜桃| 只有这里有精品99| 午夜激情av网站| 国产福利在线免费观看视频| 国精品久久久久久国模美| avwww免费| 亚洲欧美成人综合另类久久久| 校园人妻丝袜中文字幕| 国产日韩欧美在线精品| 大香蕉久久成人网| 亚洲国产中文字幕在线视频| 亚洲伊人色综图| 亚洲人成77777在线视频| 欧美少妇被猛烈插入视频| 新久久久久国产一级毛片| 香蕉国产在线看| 中文精品一卡2卡3卡4更新| 韩国高清视频一区二区三区| 99国产综合亚洲精品| 成人18禁高潮啪啪吃奶动态图| 青春草国产在线视频| 波野结衣二区三区在线| 久久热在线av| 国产xxxxx性猛交| 午夜福利免费观看在线| 激情五月婷婷亚洲| 亚洲欧美色中文字幕在线| 免费人妻精品一区二区三区视频| 两个人看的免费小视频| 韩国精品一区二区三区| 国产在线免费精品| 久久久精品国产亚洲av高清涩受| 欧美 亚洲 国产 日韩一| 看免费成人av毛片| 亚洲国产欧美在线一区| av在线app专区| av女优亚洲男人天堂| 亚洲,欧美,日韩| www.熟女人妻精品国产| 成年av动漫网址| 操出白浆在线播放| 国产一级毛片在线| 岛国毛片在线播放| 大片电影免费在线观看免费| 精品一区二区三卡| 日本vs欧美在线观看视频| 蜜桃国产av成人99| 汤姆久久久久久久影院中文字幕| av天堂久久9| 午夜福利乱码中文字幕| 国产激情久久老熟女| 人人妻,人人澡人人爽秒播 | 久久韩国三级中文字幕| 妹子高潮喷水视频| 亚洲七黄色美女视频| 热re99久久国产66热| 亚洲第一青青草原| 国产精品一区二区在线观看99| 成人国产麻豆网| 下体分泌物呈黄色| 国产一卡二卡三卡精品 | 不卡视频在线观看欧美| www.熟女人妻精品国产| kizo精华| 国产片内射在线| 精品人妻一区二区三区麻豆| 久久精品久久久久久噜噜老黄| 欧美日韩国产mv在线观看视频| 亚洲成人免费av在线播放| 91国产中文字幕| 久久国产亚洲av麻豆专区| 亚洲,欧美,日韩| 精品久久蜜臀av无| 亚洲精品一区蜜桃| 日本色播在线视频| 国产激情久久老熟女| 韩国精品一区二区三区| 亚洲美女黄色视频免费看| 最近2019中文字幕mv第一页| 欧美人与善性xxx| 高清不卡的av网站| 老汉色av国产亚洲站长工具| 中国国产av一级| 亚洲第一av免费看| 色吧在线观看| 18禁动态无遮挡网站| 欧美黑人欧美精品刺激| 久久精品亚洲av国产电影网| svipshipincom国产片| 9热在线视频观看99| 欧美av亚洲av综合av国产av | 汤姆久久久久久久影院中文字幕| 九色亚洲精品在线播放| 国产日韩欧美视频二区| 日韩av不卡免费在线播放| 校园人妻丝袜中文字幕| 另类亚洲欧美激情| 视频区图区小说| 欧美成人午夜精品| 日韩一本色道免费dvd| av电影中文网址| 国产在线免费精品| 黄色怎么调成土黄色| 可以免费在线观看a视频的电影网站 | 亚洲一卡2卡3卡4卡5卡精品中文| 99精国产麻豆久久婷婷| 久久影院123| 欧美变态另类bdsm刘玥| 亚洲精品乱久久久久久| 国产野战对白在线观看| 国产97色在线日韩免费| 黄色怎么调成土黄色| 国产成人午夜福利电影在线观看| 男女免费视频国产| 女性被躁到高潮视频| 亚洲第一青青草原| 国产精品成人在线| 一本久久精品| 国产精品一区二区在线观看99| 一级片'在线观看视频| 国产乱人偷精品视频| 又大又黄又爽视频免费| 亚洲精品国产av蜜桃| 18在线观看网站| 三上悠亚av全集在线观看| 哪个播放器可以免费观看大片| 日韩欧美精品免费久久| 女性生殖器流出的白浆| 亚洲欧洲日产国产| 欧美黑人精品巨大| 国产男女内射视频| 日韩视频在线欧美| 中国三级夫妇交换| 国产亚洲精品第一综合不卡| 69精品国产乱码久久久| 国产成人欧美| 超色免费av| 亚洲精品第二区| 午夜日本视频在线| 国产成人免费无遮挡视频| 久久av网站| 国产成人av激情在线播放| 精品少妇黑人巨大在线播放| 欧美日韩视频高清一区二区三区二| 久久精品亚洲熟妇少妇任你| 成人亚洲欧美一区二区av| 免费观看性生交大片5| 捣出白浆h1v1| 黑人欧美特级aaaaaa片| 最近中文字幕2019免费版| xxx大片免费视频| 各种免费的搞黄视频| 看免费av毛片| 亚洲第一青青草原| 国产日韩一区二区三区精品不卡| 日韩一区二区三区影片| 老鸭窝网址在线观看| 欧美精品亚洲一区二区| 亚洲国产欧美日韩在线播放| 亚洲欧美精品自产自拍| 99香蕉大伊视频| 亚洲av在线观看美女高潮| 爱豆传媒免费全集在线观看| 国产成人系列免费观看| 欧美精品av麻豆av| 国产野战对白在线观看| 亚洲综合色网址| 国产精品香港三级国产av潘金莲 | 欧美xxⅹ黑人| 亚洲精品日本国产第一区| 亚洲av欧美aⅴ国产| 男人爽女人下面视频在线观看| av有码第一页| 一本大道久久a久久精品| 制服丝袜香蕉在线| 老司机在亚洲福利影院| 午夜福利网站1000一区二区三区| 美国免费a级毛片| 欧美日本中文国产一区发布| 91精品国产国语对白视频| 欧美日韩综合久久久久久| 我要看黄色一级片免费的| 午夜福利网站1000一区二区三区| 国产精品久久久久成人av| 国产熟女欧美一区二区| 夜夜骑夜夜射夜夜干| 国产伦人伦偷精品视频| 国产精品熟女久久久久浪| 国产熟女欧美一区二区| 久久青草综合色| 中文字幕人妻丝袜一区二区 | 丝袜脚勾引网站| 狠狠婷婷综合久久久久久88av| 夫妻午夜视频| 蜜桃在线观看..| 成人18禁高潮啪啪吃奶动态图| 午夜免费观看性视频| www.精华液| 午夜免费男女啪啪视频观看| 国产精品一区二区在线不卡| 另类亚洲欧美激情| 精品一区二区三区av网在线观看 | 一区二区三区激情视频| 精品国产一区二区三区久久久樱花| 日本av手机在线免费观看| 亚洲第一青青草原| 看免费av毛片| 性高湖久久久久久久久免费观看| 精品少妇久久久久久888优播| 1024香蕉在线观看| 天堂8中文在线网| 美女高潮到喷水免费观看| 亚洲,一卡二卡三卡| 久热这里只有精品99| 在线观看国产h片| 欧美黄色片欧美黄色片| 如日韩欧美国产精品一区二区三区| 少妇人妻精品综合一区二区| 亚洲一区二区三区欧美精品| 9热在线视频观看99| 日韩av在线免费看完整版不卡| 又粗又硬又长又爽又黄的视频| av一本久久久久| 丝袜喷水一区| 中文字幕色久视频| 18禁动态无遮挡网站| 又大又爽又粗| 久久韩国三级中文字幕| 亚洲av日韩精品久久久久久密 | xxx大片免费视频| 激情视频va一区二区三区| 国产熟女欧美一区二区| www.精华液| 久久久久久人人人人人| 男女边摸边吃奶| 亚洲精品国产av成人精品| 老汉色av国产亚洲站长工具| 免费av中文字幕在线| 亚洲欧美色中文字幕在线| 免费观看a级毛片全部| 老司机亚洲免费影院| 精品国产露脸久久av麻豆| 久久久久久久久免费视频了| 国产又爽黄色视频| 亚洲欧美成人综合另类久久久| 国产成人啪精品午夜网站| videos熟女内射| 18禁裸乳无遮挡动漫免费视频| 国产1区2区3区精品| 久久久欧美国产精品| 少妇的丰满在线观看| 久久久久久人妻| 汤姆久久久久久久影院中文字幕| 超色免费av| 中文乱码字字幕精品一区二区三区| 国产深夜福利视频在线观看| 男人操女人黄网站| 秋霞在线观看毛片|