• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于支持向量的最近鄰文本分類方法

    2018-09-18 09:48:58古麗娜孜艾力木江乎西旦居馬洪孫鐵利梁義
    智能系統(tǒng)學(xué)報(bào) 2018年5期
    關(guān)鍵詞:詞干哈薩克語類別

    古麗娜孜·艾力木江,乎西旦·居馬洪,孫鐵利,梁義

    文本分類(text classification,TC)是對一個(gè)文檔自動(dòng)分配一組預(yù)定義的類別或應(yīng)用主題的過程[1]。隨著數(shù)字圖書館的快速增長,TC已成為文本數(shù)據(jù)組織與處理的關(guān)鍵技術(shù)。數(shù)字化數(shù)據(jù)有不同的形式,它可以是文字、圖像、空間形式等,其中最常見和應(yīng)用最多的是文本數(shù)據(jù),閱讀的新聞、社交媒體上的帖子和信息主要以文本形式出現(xiàn)。文本自動(dòng)分類在網(wǎng)站分類[2-3]、自動(dòng)索引[4-5]、電子郵件過濾[6]、垃圾郵件過濾[7-9]、本體匹配[10]、超文本分類[11-12]和情感分析[13-14]等許多信息檢索應(yīng)用中起到了重要的作用。數(shù)字化時(shí)代,在線文本文檔及其類別的數(shù)量越來越巨大,而TC是從數(shù)據(jù)海洋當(dāng)中挖掘出具有參考價(jià)值數(shù)據(jù)的應(yīng)用程序[15-16]。文本挖掘工作是政府工作、科學(xué)研究、辦公業(yè)務(wù)等許多應(yīng)用領(lǐng)域里書面文本的分析過程。樸素貝葉斯、k近鄰、支持向量機(jī)、決策樹、最大熵和神經(jīng)網(wǎng)絡(luò)等基于統(tǒng)計(jì)與監(jiān)督的模式分類算法在文本分類研究中已被廣泛應(yīng)用。提高文本分類效率的算法研究對web數(shù)據(jù)的開發(fā)應(yīng)用具有重要意義。

    合理的詞干有助于提高文本分類的性能和效率[17-18],特別是對于哈薩克語這樣的構(gòu)詞和詞性變化較復(fù)雜語言的文本分類而言,詞干的準(zhǔn)確提取極其重要。從同一個(gè)詞干可以派生出許多單詞,因此通過詞干提取還可以對語料庫規(guī)模進(jìn)行降維。文本文檔數(shù)量的巨大化和包含特征的多樣化,給文本挖掘工作帶來一定的困難。目前,眾多文本分類研究都是基于英文或中文,基于少數(shù)民族語言的文本分類研究相對較少[19];但是國外對于阿拉伯語的文本分類工作比中國少數(shù)民族語言文本分類工作成熟[20–21],投入研究的人員也較多。

    哈薩克語言屬于阿爾泰語系突厥語族的克普恰克語支,中國境內(nèi)通用的哈薩克文借用了阿拉伯語和部分波斯文字母,而哈薩克斯坦等國家用的哈薩克文是斯拉夫文字。哈薩克文本跟中文不同的一點(diǎn)是哈薩克文文本單詞以空格分開的,這點(diǎn)類似于英文,都需要文本詞干提取過程。由于哈薩克語與英語語法體系不一樣,英文詞干提取規(guī)則還不能直接用到哈薩克語文本分類問題上,要研究適合哈薩克語語法體系的詞干提取規(guī)則之后才能實(shí)現(xiàn)哈薩克語文本的分類工作。哈薩克語具有豐富的形態(tài)和復(fù)雜的拼字法,因此哈薩克語文本分類系統(tǒng)的實(shí)現(xiàn)是有難度的。為了實(shí)現(xiàn)文本分類任務(wù)需要一定規(guī)模的語料庫,語料庫里語料的質(zhì)量直接影響文本分類的精度。到目前為止在哈薩克語中還沒有一個(gè)公認(rèn)的哈薩克文語料庫,當(dāng)然,也有不少人認(rèn)為新疆人民日報(bào)(哈文版)上的文本可以當(dāng)作文本分類語料庫。本文為了保證文本分類語料庫的規(guī)范化和文本分類工作的標(biāo)準(zhǔn)化,經(jīng)過認(rèn)真挑選中文標(biāo)準(zhǔn)語料庫里的部分語料文檔并對其進(jìn)行翻譯和新疆人民日報(bào)上的部分文檔來自行搭建了本研究的語料庫。本文在對前期研究里詞干提取程序詞干解析規(guī)則[22-24]進(jìn)行優(yōu)化改善的基礎(chǔ)上實(shí)現(xiàn)本研究的文本預(yù)處理,提出新的樣本測度指標(biāo)與距離公式,并結(jié)合SVM與KNN分類算法實(shí)現(xiàn)了哈薩克語文本分類。

    1 文本特征提取

    1.1 文本預(yù)處理

    文本預(yù)處理在整個(gè)文本分類工作中扮演著最重要的角色,其處理程度直接影響到文本分類精度。因?yàn)樗菑奈臋n中抽取關(guān)鍵詞集合的過程,而關(guān)鍵詞的單獨(dú)抽取因語言語法規(guī)則的不同而不同,所以這層工作屬于技術(shù)含量較高的基礎(chǔ)性工作,需要設(shè)計(jì)人員熟練掌握語言語法規(guī)則和計(jì)算機(jī)編程能力。目前存在一個(gè)現(xiàn)實(shí)問題,即包括作者在內(nèi)的很多編程人員因研究工作的需要一般從事于中英文文字資料上的研究,所以對母語(哈薩克語)語法規(guī)則的細(xì)節(jié)不精通,對從小開始在漢語授課學(xué)校上學(xué)的編程人員情況則更嚴(yán)重,所以要實(shí)現(xiàn)詞干解析需要向語言學(xué)專家或相關(guān)人員全面請教,這也是影響哈薩克語文本分類工作進(jìn)展的一個(gè)客觀問題。

    哈薩克語文字由24個(gè)輔音字母和9個(gè)元音字母的共有33個(gè)字母組成。因?yàn)楣_克語語法形式是在單詞原形前后附加一定附加成分來完成的,所以哈薩克語言屬于黏著語,即跟英文類似一個(gè)哈薩克語單詞對應(yīng)多種鏈接形式,因此對其一定要進(jìn)行詞干提取。

    本文前期系列研究工作基本完成了哈薩克語文本詞干提取以及詞性標(biāo)注工作,已完成哈薩克語文本詞干表的構(gòu)建。該詞干表收錄了如圖1所示的由新疆人民出版社出版的《哈薩克語詳解詞典》中的60 000多個(gè)哈薩克語文本詞干和如圖2所示的438個(gè)哈薩克語文本詞干附加成分。

    圖1 哈薩克語詞干Fig. 1 Kazakh text stem

    圖2 哈薩克語附加成分Fig. 2 Additional components in Kazakh text

    本文在前期準(zhǔn)備研究工作的基礎(chǔ)上,給出3種詞性的有限狀態(tài)自動(dòng)機(jī),并采用詞法分析和雙向全切分相結(jié)合的改進(jìn)方法實(shí)現(xiàn)哈薩克語文本詞干的提取與單詞構(gòu)形附加成分的細(xì)切分。以改進(jìn)的逐字母二分詞典查詢機(jī)制對詞干表進(jìn)行搜索,提高詞干提取的效率。以概率統(tǒng)計(jì)的方法對歧義詞和未記載詞進(jìn)行切分。在此研究基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)了哈薩克語文本的詞法自動(dòng)分析程序,完成哈薩克語文本的讀取預(yù)處理。處理結(jié)果如圖3所示,上半窗體上顯示的是待切分的文檔原文,下半窗體上顯示是詞干切分后的結(jié)果。

    圖3 哈薩克語文本詞干切分結(jié)果示例Fig. 3 Example segmentation results of the Kazakh text stem

    1.2 特征處理

    特征是文本分類時(shí)判別類別的尺度。模式識別的不同分類問題有不同的特征選擇方法,而在文本分類問題中常用到的方法有互信息(MI)、X2統(tǒng)計(jì)量(CHI)、信息增益(IG)、文檔頻率(DF)、卡方統(tǒng)計(jì)等[25]。這些方法各具優(yōu)點(diǎn)和不足之處。MI、IG和CHI傾向于低頻詞的處理,而DF則傾向于高頻詞的處理。目前,也有許多優(yōu)化改進(jìn)方法[26-28],其中文本頻率比值法(document frequency ratio,DFR)以簡單、快捷等優(yōu)點(diǎn)克服了以上幾種方法存在的問題,綜合考慮了類內(nèi)外文本頻率,其計(jì)算公式為

    式中,對于詞t,N是訓(xùn)練文本數(shù),ni是Ci類別中的文本數(shù),DFi是Ci類別中包含詞t的文本數(shù),而顯然是除了Ci類以外的別的類別中包含詞t的文本數(shù)。

    通過詞頻統(tǒng)計(jì)、詞權(quán)重計(jì)算和文檔向量化表示等一系列的預(yù)處理工作之后才能運(yùn)用分類算法,所以對文本分類工作而言這些都是非常重要的階段性基礎(chǔ)工作。圖4所示的是每類文檔里(如體育類文檔中)每一個(gè)單詞(如“排球”)的總出現(xiàn)次數(shù)。圖5所示的是詞的權(quán)重計(jì)算結(jié)果,即統(tǒng)計(jì)某詞在判別文檔類別所屬關(guān)系中的隸屬度,當(dāng)然隸屬度越高說明該詞在文檔分類時(shí)的貢獻(xiàn)越大。最后把文檔由如圖6所示的形式向量化表示,生成分類問題的文檔向量,即“X號特征詞:該特征詞的特征向量”形式向量化表示。

    圖4 詞頻統(tǒng)計(jì)結(jié)果Fig. 4 Term frequency statistical result

    圖5 詞權(quán)重計(jì)算結(jié)果Fig. 5 Term weight computed result

    圖6 文本向量文件Fig. 6 Text vector files

    2 SVM與KNN方法

    2.1 SVM方法

    支持向量機(jī)(support vector machine,SVM)是在1995年由Cortes和Vapnik首次提出來的一種模式識別分類技術(shù)[29]。SVM是在統(tǒng)計(jì)學(xué)習(xí)理論(statistical learning theory,SLT)原理的基礎(chǔ)上發(fā)展起來的機(jī)器學(xué)習(xí)算法。SVM方法的重點(diǎn)在于在高維特征空間中能構(gòu)造函數(shù)集VC維盡可能小的最優(yōu)分類面,使得不同類別樣本在這分類面上分類上界最小化,從而保證分類算法的最優(yōu)推廣能力。圖7所示的是SVM方法的分類原理示意圖。SVM在有限訓(xùn)練樣本情況下,在學(xué)習(xí)機(jī)復(fù)雜度和學(xué)習(xí)機(jī)泛化能力之間找到一個(gè)平衡點(diǎn),從而保證學(xué)習(xí)機(jī)的推廣能力[30]。

    圖7 SVM 分類原理示意圖Fig. 7 SVM classification schematic diagram

    根據(jù)樣本分布情況與樣本集維數(shù),SVM算法的判別函數(shù)原理大致可分為線性可分與非線性可分兩種形式。

    1)線性可分

    帶有以式(2)所示訓(xùn)練樣本集的SVM線性可分分類問題的數(shù)學(xué)模型可通過式(3)來表示:

    式中對應(yīng)ai≠0時(shí)的樣本點(diǎn)就是支持向量。因?yàn)樽顑?yōu)化問題解ai的每一個(gè)分量都與一個(gè)訓(xùn)練點(diǎn)相對應(yīng),顯然所求得的劃分超平面僅僅與對應(yīng)ai≠0 時(shí)的那些訓(xùn)練點(diǎn) (xi·x)相關(guān),而跟 ai=0 時(shí)的那些訓(xùn)練點(diǎn)沒有任何關(guān)系。相應(yīng)于ai≠0時(shí)的訓(xùn)練點(diǎn)(xi·x)里的輸入點(diǎn)xi就是支持向量,通常它們是全體樣本中的很少一部分。得出結(jié)論,最終分類分界面的法向量ω只受支持向量的影響,不受非支持向量訓(xùn)練點(diǎn)的影響。

    2)非線性可分

    為此,需要在式(3)中增加一個(gè)松弛變量ξi和懲罰因子C,從而式(3)變?yōu)?/p>

    式中:ξi≥ 0;i = 1, 2, ···, n;C 為控制樣本對錯(cuò)分的調(diào)整因子,通常稱為懲罰因子。C越大,懲罰越重。

    雖然原理看起來簡單,然而在分類問題的訓(xùn)練樣本不充足或不能保證訓(xùn)練樣本質(zhì)量的情形下確定非線性映射是很困難的,那么如何確定非線性映射呢?SVM通過運(yùn)用核函數(shù)概念解決這個(gè)問題,核函數(shù)是SVM的其他分類算法無法替代的獨(dú)特功能。

    SVM通過引入一個(gè)核函數(shù)K(xi·x),將原低維的分類問題空間映射到高維的新問題空間中,使核函數(shù)代替內(nèi)積運(yùn)算,這個(gè)高維空間就稱為Hilbert空間。引入核函數(shù)以后的最優(yōu)分類函數(shù)為

    2.2 KNN方法

    KNN(K nearest neighbor)分類法是基于實(shí)例的學(xué)習(xí)算法,它需要所有的訓(xùn)練樣本都參與分類[31]。在分類階段,利用歐氏距離公式,將每個(gè)測試樣本與和它鄰近的k個(gè)訓(xùn)練樣本進(jìn)行比較,然后將測試樣本歸屬到票數(shù)最多的那一類里[32]。KNN算法是根據(jù)測試樣本最近的k個(gè)樣本點(diǎn)的類別信息來對該測試樣本類型進(jìn)行判別,所以k值的選取非常重要。k值若太小,測試樣本特征不能充分體現(xiàn);k值若太大,與測試樣本并不相似的個(gè)別樣本也可能被包含進(jìn)來,這樣反而對分類不利。KNN算法在分類決策上只憑k個(gè)最鄰近樣本類別確定待分樣本的所屬類。目前,對于k值的選取還沒有一個(gè)全局最優(yōu)的篩選方法,這也是KNN方法的弊端,具體操作時(shí),根據(jù)先驗(yàn)知識先給出一個(gè)初始值,然后需要根據(jù)仿真分類實(shí)驗(yàn)結(jié)果重新調(diào)整,調(diào)整k值的操作有時(shí)一直到分類結(jié)果滿足用戶需求為止。該方法原理可由式(7)表示:

    式(7)表明將測試樣本di劃入到k個(gè)鄰近類別中成員最多的那個(gè)類別里。

    在使用KNN算法時(shí),還可由其他策略生成測試樣本的歸屬類,如式(8)也是被廣泛使用的公式:

    當(dāng)x(j∈ci時(shí),;當(dāng)xjci時(shí),;是測試樣本di和它最近鄰xj之間的余弦相似度。余弦相似度測量是由一個(gè)向量空間中兩個(gè)向量之間角余弦值來定義的。式(8)說明測試樣本di被歸到k個(gè)最近鄰類里相似性最大那個(gè)類別里。

    一般情況下,不同類別訓(xùn)練樣本的分布是不均勻的,同樣不同類別的樣本數(shù)量也可能不一樣。所以,在分類任務(wù)中,KNN中k參數(shù)的一個(gè)固定值可能會(huì)導(dǎo)致不同類別之間的偏差。例如,對于式(7),一個(gè)較大的k值使得方法運(yùn)行結(jié)果過擬合,反過來一個(gè)較小的k值使得方法模型性能不穩(wěn)定。實(shí)際上,k的值通常由交叉驗(yàn)證技術(shù)來獲取。然而,像在線分類等情況,就不能用交叉驗(yàn)證技術(shù),只能給出經(jīng)驗(yàn)值,因此k值的選定很重要。

    KNN雖是簡單有效的分類方法,但不能忽略以下兩方面的問題:1)由于KNN需要保留分類過程中的所有相似性計(jì)算實(shí)例,從而隨著訓(xùn)練集規(guī)模的增多,其計(jì)算量也會(huì)增加,在處理較大規(guī)模數(shù)據(jù)集分類時(shí)方法的時(shí)間復(fù)雜度會(huì)達(dá)到不可接受的程度[33],這是KNN方法的主要缺點(diǎn);2) KNN方法分類的準(zhǔn)確性可能受到訓(xùn)練數(shù)據(jù)集中特性的無關(guān)性和噪聲數(shù)據(jù)的影響,若考慮這些因素其分類效果也許更好。

    3 基于SV-NN的哈薩克語文本分類算法

    本文提出一種組合分類方法,把SVM算法當(dāng)作KNN算法的訓(xùn)練階段,這樣可以避免k參數(shù)的選擇。組合分類方法結(jié)合了SVM算法的訓(xùn)練和KNN算法的學(xué)習(xí)階段。首先運(yùn)用SVM算法對所有訓(xùn)練樣本進(jìn)行一次訓(xùn)練獲得每一類別的少量的支持向量(support vectors,SVs),在測試階段使用最近鄰分類器進(jìn)行測試并分類測試樣本,即計(jì)算出新測試樣本與每個(gè)類別SVs平均距離值后對其進(jìn)行對比分析,該測試樣本與哪一類別SVs平均距離值點(diǎn)離得最近就把它歸為該類別中。分類決策依據(jù)是各類別SVs平均距離值后對其與測試點(diǎn)之間距離的數(shù)值分析,所以簡稱該算法為支持向量與最近鄰方法(the support vector of nearest neighbor,SV-NN)。

    3.1 SV-NN算法描述及流程圖

    假設(shè)共有n個(gè)類別,每個(gè)類別含有m個(gè)支持向量。

    SVM: T1→svij;//通過使用 SVM 定義每個(gè)類別的支持向量。

    while(k<l)

    { 輸入 xk;

    利用式(9)計(jì)算xk與svij之間的距離(Dk);

    利用式(10)計(jì)算xk與svij之間的平均距離(averDk);

    SV-NN 分類算法:

    Start:

    { integer i, j,k,l;

    利用式(11)計(jì)算xk與svij之間最小平均距離

    將xk劃入到基于的最近類別;

    k=k+1;

    }

    }

    End

    SV-NN分類方法的工作流程如圖8所示。

    3.2 SV-NN 算法實(shí)現(xiàn)

    1)將所有訓(xùn)練點(diǎn)映射到向量空間,并通過傳統(tǒng)SVM確定每一個(gè)類別的支持向量。

    式中:支持向量svij是從輸入文檔中提取的(共有n個(gè)類,每個(gè)類別含有m個(gè)支持向量)。確定每一類的支持向量之后,其余的訓(xùn)練點(diǎn)可以消除。

    2)使用歐氏距離公式(9)計(jì)算測試樣本xk與由1)生成的每一類支持向量svij之間的距離。

    圖8 SV-NN分類方法工作原理Fig. 8 SV-NN classification approach working principle diagram

    3)使用式(10)計(jì)算測試樣本xk與每一類支持向量svij之間的平均距離:

    4)計(jì)算最短平均距離minD,并將測試樣本xk劃入到最短平均距離對應(yīng)的那一類中。

    即輸入點(diǎn)被確認(rèn)為與svij之間最短平均距離值對應(yīng)的正確類。

    重復(fù)步驟2)~4),直到所有的測試樣本分類完為止。

    4 實(shí)驗(yàn)結(jié)果與評價(jià)

    通常,語料庫里語料的質(zhì)量與數(shù)量直接影響文本分類算法的分類性能。中、英文等其他語言文本分類研究都有標(biāo)準(zhǔn)的語料庫,而哈薩克語文本分類工作卻還沒有一個(gè)公認(rèn)的標(biāo)準(zhǔn)語料庫。本文考慮到文本分類工作的規(guī)范性和語料的標(biāo)準(zhǔn)性,由中文標(biāo)準(zhǔn)語料部分文檔的翻譯和挑選新疆日報(bào)(哈文版)上的部分文檔來搭建了本研究的語料庫。在前期研究里,同樣是通過翻譯收集語料集的,只是其規(guī)模小了點(diǎn),本文的語料工作算是對前期研究語料集的補(bǔ)充和優(yōu)化完善。前期研究語料集語料文檔只有5類文檔,本文擴(kuò)充到8類文檔。通過跟語言學(xué)專家們的多次溝通,選擇具有代表性的文檔,同時(shí)對詞干提取程序解析規(guī)則也作了適當(dāng)?shù)恼{(diào)整。雖然本文所構(gòu)建的語料庫還不能稱得上“標(biāo)準(zhǔn)”詞語,但對現(xiàn)階段哈薩克語文本分類任務(wù)的完成具有實(shí)際應(yīng)用價(jià)值。

    本文把語料集規(guī)模擴(kuò)大到由計(jì)算機(jī)、經(jīng)濟(jì)、教育、法律、醫(yī)學(xué)、政治、交通、體育等8類共1 400個(gè)哈薩克語文檔組成的小型語料集,如表1所示。數(shù)據(jù)集被分為兩個(gè)部分。880個(gè)文檔(63%)用于訓(xùn)練,520個(gè)文檔用于測試(37%)。

    表1 數(shù)據(jù)集Table 1 Data set

    本文文本分類實(shí)驗(yàn)評價(jià)指標(biāo)采用了召回率、精度和F1這3種評價(jià)方法。精度評價(jià)是指比較實(shí)際文本數(shù)據(jù)與分類結(jié)果,以確定文本分類過程的準(zhǔn)確程度,是文本分類結(jié)果是否可信的一種度量。高精度意味著一個(gè)算法返回更相關(guān)的結(jié)果,高召回率代表著一個(gè)算法返回最相關(guān)的結(jié)果,所以文本分類工作期望獲得較高的精度和召回率。

    本文在前期研究中搭建的哈薩克文語料集的補(bǔ)充完善以及對其詞干提取程序提取規(guī)則細(xì)節(jié)的優(yōu)化改善基礎(chǔ)上實(shí)現(xiàn)了本研究哈薩克語文本的預(yù)處理。分類任務(wù)的實(shí)現(xiàn)運(yùn)用了SVM、KNN與本文提出的SV-NN算法,并對3種算法分類精度進(jìn)行了較全面的對比分析。通過對表2和圖9上的仿真實(shí)驗(yàn)數(shù)字的對比分析,發(fā)現(xiàn)SVM算法優(yōu)于KNN算法,而SV-NN算法優(yōu)于SVM 算法。SV-NN方法F1指標(biāo)除了教育類和法律類以外在其他類上的F1指標(biāo)都高于都SVM、KNN對應(yīng)指標(biāo)。SVM、KNN和SV-NN平均分類精度分別為0.754、0.731和0.778,這說明本文提出算法對所有類別文檔詞的召回率和區(qū)分度較穩(wěn)定。本研究提出的算法模型繼承了SVM算法在有限樣本情況下也能獲得較好分類精度的優(yōu)點(diǎn),另外,本算法沒有去定義KNN算法的k參數(shù),也沒有跟所有類所有訓(xùn)練樣本進(jìn)行距離運(yùn)算。所以,本研究提出的算法無論從算法復(fù)雜度的分析還是算法收斂速度的分析都是有效的。當(dāng)然,總體精度還是沒有像中、英文等其他語言文本分類精度那么理想,因?yàn)樯婕昂芏喾矫娴囊蛩?,如研究語料庫語料文檔數(shù)量、每一類文檔本身的質(zhì)量、詞干表里已錄用的詞干數(shù)量和質(zhì)量、詞干提取程序解析規(guī)則的細(xì)節(jié)等,但目前所獲得的分類精度比前期系列研究成果理想,本算法的文本分類性能有了很大的提升也較好地提高了召回率。

    表2 SVM、KNN、SV-NN的分類精度對比Table 2 SVM KNN and SV–NN comparison of classification accuracy

    圖9 分類精度的對比分析(每一類別均含175篇文檔)Fig. 9 Comparative analysis of classification accuracy (each category contains 175 documents)

    5 結(jié)束語

    本文在前期系列研究中所搭建的哈薩克文語料集和詞干提取程序的優(yōu)化完善基礎(chǔ)上實(shí)現(xiàn)了哈薩克語文本的預(yù)處理。分類任務(wù)的實(shí)現(xiàn)上運(yùn)用了模式識別的3種分類算法,并對3種分類算法分類精度進(jìn)行了較全面的對比分析。通過仿真實(shí)驗(yàn)客觀數(shù)字的對比分析,說明本文提出算法的優(yōu)越性。本文算法對所有類別文檔詞的召回率和區(qū)分度較穩(wěn)定。本文算法在繼承SVM算法的分類優(yōu)越性基礎(chǔ)上,還有效避免了KNN算法設(shè)置k參數(shù)的麻煩和跟所有訓(xùn)練樣本進(jìn)行距離計(jì)算而帶來的巨大時(shí)間復(fù)雜度,進(jìn)而保證了分類算法的收斂速度。

    本研究仍有許多待優(yōu)化完善的問題,本文接下來的研究工作中將系統(tǒng)地研究并解決影響文本分類精度的階段性問題,獲得滿意的分類精度。

    猜你喜歡
    詞干哈薩克語類別
    論柯爾克孜語詞干提取方法
    維吾爾語詞綴變體搭配規(guī)則研究及算法實(shí)現(xiàn)
    服務(wù)類別
    新校長(2016年8期)2016-01-10 06:43:59
    哈薩克語附加成分-A
    融合多策略的維吾爾語詞干提取方法
    基于維吾爾語詞干詞綴粒度的漢維機(jī)器翻譯
    哈薩克語比喻及其文化特征
    語言與翻譯(2014年2期)2014-07-12 15:49:28
    “v+n+n”結(jié)構(gòu)的哈薩克語短語歧義分析與消解
    語言與翻譯(2014年2期)2014-07-12 15:49:13
    論類別股東會(huì)
    商事法論集(2014年1期)2014-06-27 01:20:42
    中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
    成年人午夜在线观看视频| 女性被躁到高潮视频| 99热这里只有是精品在线观看| 成人综合一区亚洲| 久久久久久久久久人人人人人人| 日本色播在线视频| 久久99热这里只频精品6学生| 在现免费观看毛片| 国产亚洲精品第一综合不卡 | av在线播放精品| 久久久久国产精品人妻一区二区| 考比视频在线观看| 满18在线观看网站| 久久久久精品久久久久真实原创| 国产日韩一区二区三区精品不卡| 国产精品国产三级国产专区5o| 免费人成在线观看视频色| 全区人妻精品视频| 少妇的丰满在线观看| 99久久综合免费| 久热久热在线精品观看| 亚洲精品一二三| 国产免费一级a男人的天堂| 亚洲伊人久久精品综合| 性色avwww在线观看| 熟妇人妻不卡中文字幕| 久久国产精品大桥未久av| 精品国产乱码久久久久久小说| 人人澡人人妻人| 一边摸一边做爽爽视频免费| kizo精华| 亚洲一区二区三区欧美精品| 亚洲国产精品一区三区| 亚洲精品456在线播放app| 日韩在线高清观看一区二区三区| 国产精品成人在线| av国产精品久久久久影院| 激情视频va一区二区三区| 两个人免费观看高清视频| 满18在线观看网站| 国产高清国产精品国产三级| 超碰97精品在线观看| 亚洲欧美成人精品一区二区| 久久99蜜桃精品久久| 亚洲欧洲精品一区二区精品久久久 | 人妻少妇偷人精品九色| 午夜影院在线不卡| 男女边摸边吃奶| 国产亚洲午夜精品一区二区久久| 一边摸一边做爽爽视频免费| 在线天堂中文资源库| 国产精品成人在线| 亚洲精品av麻豆狂野| 另类精品久久| 91精品三级在线观看| 黄片无遮挡物在线观看| 久久 成人 亚洲| 啦啦啦啦在线视频资源| 国产成人一区二区在线| 最黄视频免费看| 91在线精品国自产拍蜜月| 欧美亚洲日本最大视频资源| 国产白丝娇喘喷水9色精品| 日韩中字成人| 搡老乐熟女国产| 国产在视频线精品| 老司机亚洲免费影院| 天天躁夜夜躁狠狠躁躁| 午夜视频国产福利| 国产伦理片在线播放av一区| 色网站视频免费| av在线观看视频网站免费| 美女主播在线视频| 亚洲欧美成人综合另类久久久| 日韩精品有码人妻一区| 日本vs欧美在线观看视频| 欧美精品一区二区免费开放| 伊人亚洲综合成人网| 桃花免费在线播放| 少妇猛男粗大的猛烈进出视频| 人妻少妇偷人精品九色| 男女无遮挡免费网站观看| 精品熟女少妇av免费看| 国产一区二区在线观看日韩| 又粗又硬又长又爽又黄的视频| 亚洲色图综合在线观看| 9热在线视频观看99| 18禁观看日本| 免费黄频网站在线观看国产| 成人免费观看视频高清| 九九在线视频观看精品| 亚洲美女黄色视频免费看| 国产亚洲欧美精品永久| 午夜老司机福利剧场| 一边摸一边做爽爽视频免费| 老女人水多毛片| 成人免费观看视频高清| 亚洲精品久久久久久婷婷小说| 免费不卡的大黄色大毛片视频在线观看| 制服人妻中文乱码| 久久久久精品性色| 免费黄网站久久成人精品| 日韩成人伦理影院| 亚洲经典国产精华液单| 国产成人精品无人区| 精品国产一区二区久久| 久久人人爽人人爽人人片va| 一级黄片播放器| 国产精品久久久av美女十八| 人体艺术视频欧美日本| 日韩一本色道免费dvd| 一区在线观看完整版| 男女国产视频网站| 9191精品国产免费久久| 国产精品久久久久久久久免| tube8黄色片| 性高湖久久久久久久久免费观看| av网站免费在线观看视频| 欧美bdsm另类| 日本猛色少妇xxxxx猛交久久| 久久97久久精品| 国产无遮挡羞羞视频在线观看| 午夜免费观看性视频| 欧美xxⅹ黑人| 亚洲精品,欧美精品| 2018国产大陆天天弄谢| 最近手机中文字幕大全| 午夜激情av网站| 久久久久久人人人人人| 少妇被粗大的猛进出69影院 | 国产 一区精品| 视频区图区小说| 国产精品一区二区在线不卡| 侵犯人妻中文字幕一二三四区| av线在线观看网站| 999精品在线视频| 国产亚洲精品第一综合不卡 | 成人漫画全彩无遮挡| 大香蕉97超碰在线| 久久精品久久久久久久性| 久久久a久久爽久久v久久| 人妻 亚洲 视频| 国产熟女欧美一区二区| 波多野结衣一区麻豆| 国产精品一区二区在线不卡| 热99国产精品久久久久久7| 在线亚洲精品国产二区图片欧美| 18+在线观看网站| 亚洲欧美精品自产自拍| 国产麻豆69| 午夜免费鲁丝| 最近2019中文字幕mv第一页| 免费黄频网站在线观看国产| 久久精品人人爽人人爽视色| 国产 一区精品| 多毛熟女@视频| 99热全是精品| 亚洲经典国产精华液单| √禁漫天堂资源中文www| 国产日韩欧美视频二区| 插逼视频在线观看| 丰满迷人的少妇在线观看| 纯流量卡能插随身wifi吗| 国产熟女欧美一区二区| 日本av手机在线免费观看| 99久久人妻综合| 最近最新中文字幕大全免费视频 | 亚洲成色77777| 桃花免费在线播放| 在线观看www视频免费| 五月开心婷婷网| 国产精品国产三级国产av玫瑰| 国产 精品1| 欧美人与善性xxx| 亚洲国产av影院在线观看| www日本在线高清视频| 人妻一区二区av| 亚洲伊人久久精品综合| 国产精品99久久99久久久不卡 | 少妇被粗大的猛进出69影院 | 另类精品久久| 亚洲欧美一区二区三区黑人 | 三级国产精品片| 女性生殖器流出的白浆| 久久久久人妻精品一区果冻| 精品亚洲成国产av| 日本av免费视频播放| 午夜福利影视在线免费观看| 99re6热这里在线精品视频| 日本vs欧美在线观看视频| 亚洲人与动物交配视频| 插逼视频在线观看| av国产精品久久久久影院| 婷婷色av中文字幕| 久久av网站| 18在线观看网站| 亚洲精品乱久久久久久| 亚洲国产色片| 国产爽快片一区二区三区| 久久久久精品人妻al黑| 精品国产一区二区久久| av不卡在线播放| 夜夜爽夜夜爽视频| 制服丝袜香蕉在线| 免费久久久久久久精品成人欧美视频 | 国产男女内射视频| 夜夜骑夜夜射夜夜干| 国产一区有黄有色的免费视频| av.在线天堂| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲色图综合在线观看| videos熟女内射| 精品国产露脸久久av麻豆| 成人手机av| 各种免费的搞黄视频| 大香蕉97超碰在线| 久久婷婷青草| 日韩av不卡免费在线播放| 亚洲情色 制服丝袜| 免费看av在线观看网站| 尾随美女入室| 欧美bdsm另类| 精品少妇久久久久久888优播| 97精品久久久久久久久久精品| 捣出白浆h1v1| 国产熟女午夜一区二区三区| 久久韩国三级中文字幕| 在线观看人妻少妇| 天天操日日干夜夜撸| 有码 亚洲区| 久久久精品区二区三区| 欧美日本中文国产一区发布| 久久精品国产自在天天线| 久久影院123| 免费黄色在线免费观看| kizo精华| 中文欧美无线码| 91在线精品国自产拍蜜月| 纯流量卡能插随身wifi吗| 国产成人精品在线电影| 日本午夜av视频| 久久青草综合色| 三上悠亚av全集在线观看| 亚洲av电影在线进入| 一级毛片 在线播放| 国内精品宾馆在线| 在线观看免费视频网站a站| 日本与韩国留学比较| 欧美性感艳星| 麻豆精品久久久久久蜜桃| 在线天堂中文资源库| 色吧在线观看| 女的被弄到高潮叫床怎么办| 黄片无遮挡物在线观看| 亚洲精品成人av观看孕妇| 国产av精品麻豆| 视频中文字幕在线观看| 热99久久久久精品小说推荐| 高清av免费在线| 亚洲av在线观看美女高潮| 在线观看免费日韩欧美大片| 熟女电影av网| 国产免费视频播放在线视频| 亚洲精品一二三| 在线观看三级黄色| 国产亚洲av片在线观看秒播厂| 成人手机av| 9热在线视频观看99| 亚洲av电影在线进入| 9色porny在线观看| 99久久人妻综合| 日本av免费视频播放| 水蜜桃什么品种好| 国产精品久久久久久久电影| 99九九在线精品视频| 不卡视频在线观看欧美| av天堂久久9| 国产色婷婷99| 婷婷色麻豆天堂久久| av天堂久久9| 国产精品久久久久久久久免| 久久久久久久久久人人人人人人| 欧美精品国产亚洲| 亚洲精品第二区| 亚洲久久久国产精品| 五月伊人婷婷丁香| 又黄又粗又硬又大视频| av视频免费观看在线观看| 最黄视频免费看| 欧美 亚洲 国产 日韩一| 80岁老熟妇乱子伦牲交| 久久久久久久久久久久大奶| 丰满迷人的少妇在线观看| 欧美亚洲日本最大视频资源| 人人妻人人澡人人爽人人夜夜| 十分钟在线观看高清视频www| 人妻少妇偷人精品九色| 欧美老熟妇乱子伦牲交| 成人手机av| 午夜91福利影院| 成人综合一区亚洲| 日韩一本色道免费dvd| 久久精品久久精品一区二区三区| 国产日韩欧美亚洲二区| 纵有疾风起免费观看全集完整版| 激情五月婷婷亚洲| 18禁动态无遮挡网站| 插逼视频在线观看| 国产亚洲最大av| 亚洲美女搞黄在线观看| 波多野结衣一区麻豆| 国产精品国产三级国产专区5o| 伊人亚洲综合成人网| 日本欧美国产在线视频| 寂寞人妻少妇视频99o| 日本爱情动作片www.在线观看| 久久久国产欧美日韩av| 两性夫妻黄色片 | 成年av动漫网址| 亚洲一码二码三码区别大吗| av国产精品久久久久影院| 秋霞伦理黄片| 国产国语露脸激情在线看| 九色亚洲精品在线播放| 国产在线免费精品| √禁漫天堂资源中文www| 日日啪夜夜爽| 一级,二级,三级黄色视频| 18禁在线无遮挡免费观看视频| 日韩一区二区视频免费看| 哪个播放器可以免费观看大片| 一二三四中文在线观看免费高清| 亚洲成人一二三区av| 国产精品久久久久久久电影| 久久久久人妻精品一区果冻| 日本91视频免费播放| 一级,二级,三级黄色视频| 久久国产亚洲av麻豆专区| 国产亚洲av片在线观看秒播厂| 免费高清在线观看视频在线观看| 亚洲高清免费不卡视频| 精品一品国产午夜福利视频| 国产精品成人在线| 男男h啪啪无遮挡| 80岁老熟妇乱子伦牲交| 哪个播放器可以免费观看大片| av电影中文网址| 久久精品国产亚洲av天美| 亚洲第一区二区三区不卡| 天美传媒精品一区二区| 免费少妇av软件| 日韩不卡一区二区三区视频在线| 婷婷色av中文字幕| 波野结衣二区三区在线| 国产亚洲午夜精品一区二区久久| 亚洲国产毛片av蜜桃av| 这个男人来自地球电影免费观看 | 国产1区2区3区精品| 精品国产一区二区三区四区第35| 欧美亚洲 丝袜 人妻 在线| 校园人妻丝袜中文字幕| 国产精品国产三级国产专区5o| 插逼视频在线观看| 亚洲美女视频黄频| 亚洲欧洲精品一区二区精品久久久 | 青春草视频在线免费观看| 日韩av在线免费看完整版不卡| 亚洲丝袜综合中文字幕| 亚洲精品乱码久久久久久按摩| 亚洲精品国产色婷婷电影| 国产成人欧美| 国产福利在线免费观看视频| 美女福利国产在线| 国产又爽黄色视频| 汤姆久久久久久久影院中文字幕| 日本av手机在线免费观看| 丰满饥渴人妻一区二区三| 亚洲人成77777在线视频| 少妇的逼好多水| 另类精品久久| 精品国产一区二区三区久久久樱花| 国产亚洲最大av| 中文字幕制服av| 日韩av不卡免费在线播放| 精品国产国语对白av| 午夜福利视频在线观看免费| 这个男人来自地球电影免费观看 | 国产成人精品在线电影| av天堂久久9| 久久久国产欧美日韩av| 哪个播放器可以免费观看大片| 女性被躁到高潮视频| 欧美+日韩+精品| 一级a做视频免费观看| 韩国精品一区二区三区 | 婷婷成人精品国产| 男女下面插进去视频免费观看 | videosex国产| 国产亚洲最大av| 亚洲国产看品久久| 搡女人真爽免费视频火全软件| 天堂俺去俺来也www色官网| 日本-黄色视频高清免费观看| av卡一久久| 97超碰精品成人国产| 99香蕉大伊视频| 黄网站色视频无遮挡免费观看| 免费高清在线观看日韩| 亚洲情色 制服丝袜| 熟妇人妻不卡中文字幕| 91国产中文字幕| av卡一久久| 国产一区二区三区综合在线观看 | 久久精品久久久久久久性| 成人亚洲精品一区在线观看| 夫妻午夜视频| 国产亚洲av片在线观看秒播厂| 人人妻人人澡人人看| 国产成人欧美| 国产精品偷伦视频观看了| 国产精品熟女久久久久浪| 欧美日韩综合久久久久久| 久久国产亚洲av麻豆专区| 99国产精品免费福利视频| 一边亲一边摸免费视频| 极品少妇高潮喷水抽搐| 观看av在线不卡| 97精品久久久久久久久久精品| 亚洲国产精品一区二区三区在线| 日日摸夜夜添夜夜爱| 夜夜爽夜夜爽视频| 成人毛片60女人毛片免费| 亚洲欧美日韩卡通动漫| 亚洲成av片中文字幕在线观看 | 精品熟女少妇av免费看| 亚洲婷婷狠狠爱综合网| 亚洲精品美女久久久久99蜜臀 | 99视频精品全部免费 在线| 免费高清在线观看视频在线观看| 性色avwww在线观看| 尾随美女入室| 日韩大片免费观看网站| 欧美成人精品欧美一级黄| 美女大奶头黄色视频| 国语对白做爰xxxⅹ性视频网站| 免费大片黄手机在线观看| 青春草亚洲视频在线观看| 午夜免费男女啪啪视频观看| 成人国语在线视频| 久久久久久久大尺度免费视频| 免费高清在线观看视频在线观看| 97人妻天天添夜夜摸| 狠狠婷婷综合久久久久久88av| 亚洲婷婷狠狠爱综合网| 亚洲精品美女久久久久99蜜臀 | 熟女人妻精品中文字幕| 国产有黄有色有爽视频| 综合色丁香网| av视频免费观看在线观看| 国产男女内射视频| 国产精品人妻久久久久久| 只有这里有精品99| 最近的中文字幕免费完整| 亚洲人成77777在线视频| 亚洲欧美日韩卡通动漫| 色5月婷婷丁香| 大片电影免费在线观看免费| 欧美成人午夜免费资源| 制服诱惑二区| 99热全是精品| 在线看a的网站| 99久国产av精品国产电影| 少妇高潮的动态图| 校园人妻丝袜中文字幕| 18+在线观看网站| 激情五月婷婷亚洲| 日韩精品免费视频一区二区三区 | 春色校园在线视频观看| 国产一区二区三区综合在线观看 | 极品少妇高潮喷水抽搐| 久久99精品国语久久久| 一级黄片播放器| 国产福利在线免费观看视频| 国语对白做爰xxxⅹ性视频网站| 九草在线视频观看| 亚洲精品久久午夜乱码| 午夜免费男女啪啪视频观看| 一级毛片 在线播放| 国产深夜福利视频在线观看| 日韩一本色道免费dvd| 在现免费观看毛片| 色94色欧美一区二区| 日韩成人av中文字幕在线观看| 两个人免费观看高清视频| av又黄又爽大尺度在线免费看| 国产亚洲精品第一综合不卡 | 国产欧美日韩一区二区三区在线| 国产成人精品无人区| 亚洲av免费高清在线观看| 女性生殖器流出的白浆| 日韩中文字幕视频在线看片| 久久精品国产亚洲av天美| 美女主播在线视频| 在线免费观看不下载黄p国产| 91午夜精品亚洲一区二区三区| 最近手机中文字幕大全| 老司机影院毛片| 亚洲,一卡二卡三卡| 亚洲国产日韩一区二区| 国产综合精华液| 免费人成在线观看视频色| 亚洲av.av天堂| 纯流量卡能插随身wifi吗| 日本午夜av视频| 在线观看www视频免费| 熟女电影av网| 国产综合精华液| 国产毛片在线视频| 精品久久国产蜜桃| 日韩视频在线欧美| 自拍欧美九色日韩亚洲蝌蚪91| tube8黄色片| 26uuu在线亚洲综合色| 亚洲国产成人一精品久久久| 欧美亚洲 丝袜 人妻 在线| 少妇熟女欧美另类| av网站免费在线观看视频| 老司机影院成人| 寂寞人妻少妇视频99o| 9191精品国产免费久久| 看十八女毛片水多多多| 久久 成人 亚洲| 岛国毛片在线播放| 黄色毛片三级朝国网站| 久久久久久久久久久免费av| 大片免费播放器 马上看| 久久鲁丝午夜福利片| av国产精品久久久久影院| 久久精品国产亚洲av涩爱| 中国国产av一级| 久久久欧美国产精品| 狂野欧美激情性xxxx在线观看| 热99久久久久精品小说推荐| 成人漫画全彩无遮挡| 亚洲性久久影院| 亚洲精品久久午夜乱码| 亚洲中文av在线| 中文字幕av电影在线播放| www.av在线官网国产| 亚洲一码二码三码区别大吗| 大片免费播放器 马上看| 99精国产麻豆久久婷婷| 成人无遮挡网站| 成人亚洲欧美一区二区av| 成年人午夜在线观看视频| a级毛片在线看网站| 国产亚洲一区二区精品| 69精品国产乱码久久久| 成年av动漫网址| 波多野结衣一区麻豆| 久久人人97超碰香蕉20202| 久久久久久伊人网av| 亚洲伊人色综图| 熟女电影av网| 99久国产av精品国产电影| 永久免费av网站大全| 在现免费观看毛片| 交换朋友夫妻互换小说| 免费黄色在线免费观看| 2022亚洲国产成人精品| 三级国产精品片| 欧美日韩精品成人综合77777| 香蕉精品网在线| 久久精品久久久久久噜噜老黄| 自线自在国产av| 女人精品久久久久毛片| 乱码一卡2卡4卡精品| 大码成人一级视频| 成年女人在线观看亚洲视频| 91久久精品国产一区二区三区| 亚洲精华国产精华液的使用体验| 亚洲av电影在线观看一区二区三区| 亚洲成av片中文字幕在线观看 | 边亲边吃奶的免费视频| 亚洲欧美日韩另类电影网站| 街头女战士在线观看网站| 久久久久久人人人人人| 亚洲伊人久久精品综合| 欧美丝袜亚洲另类| 日韩伦理黄色片| 精品亚洲成国产av| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲精品久久成人aⅴ小说| 成人影院久久| 免费大片黄手机在线观看| 亚洲欧美清纯卡通| 高清黄色对白视频在线免费看| 国产成人aa在线观看| 街头女战士在线观看网站| 国产爽快片一区二区三区| 免费不卡的大黄色大毛片视频在线观看| 韩国精品一区二区三区 | 天天影视国产精品| 久久久国产一区二区| 亚洲欧美成人精品一区二区| 亚洲欧美日韩卡通动漫| 肉色欧美久久久久久久蜜桃| 51国产日韩欧美| 一区在线观看完整版| 婷婷色av中文字幕| 日本vs欧美在线观看视频| 亚洲丝袜综合中文字幕| 国产欧美另类精品又又久久亚洲欧美| 亚洲国产毛片av蜜桃av| 久久久精品94久久精品|