• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁特征提取

    2014-09-13 13:12:42沈高峰谷淑敏
    智能系統(tǒng)學(xué)報 2014年4期
    關(guān)鍵詞:特征詞特征提取文檔

    沈高峰 ,谷淑敏

    (1.鄭州輕工業(yè)學(xué)院 計(jì)算機(jī)與通信工程學(xué)院,河南 鄭州 450002; 2.中原工學(xué)院信息商務(wù)學(xué)院 基礎(chǔ)學(xué)科部,河南 鄭州 450007)

    特征提取在自然語言處理領(lǐng)域有著非常廣泛的應(yīng)用,是信息檢索、文本分類、文本聚類以及自動文摘生成等技術(shù)的關(guān)鍵。由于互聯(lián)網(wǎng)資源時刻都在不斷更新,中文文本呈現(xiàn)出“爆炸式”增長。然而,采用傳統(tǒng)人工方式進(jìn)行特征提取的方法耗時較長,且具有一定的主觀性,因此快速準(zhǔn)確地實(shí)現(xiàn)中文特征提取成為中文文本處理的關(guān)鍵。

    目前,國內(nèi)外學(xué)者已提出3類特征提取方法:基于概率統(tǒng)計(jì)的特征提取方法、基于傳統(tǒng)機(jī)器學(xué)習(xí)理論的特征提取方法以及基于自然語言理解的特征提取方法?;诟怕式y(tǒng)計(jì)的特征提取方法利用文本特征的統(tǒng)計(jì)信息進(jìn)行關(guān)鍵詞提取,如TFIDF[1]、詞共現(xiàn)[2]等,該類方法具有簡單、通用的特點(diǎn),不需要復(fù)雜的訓(xùn)練過程,但準(zhǔn)確率不高。基于傳統(tǒng)機(jī)器學(xué)習(xí)理論的特征提取方法通過對大規(guī)模語料庫進(jìn)行學(xué)習(xí),采用決策樹[3]、貝葉斯算法[4]、最大熵模型[5]等方法對訓(xùn)練集進(jìn)行訓(xùn)練,從而得到相關(guān)模型,然后再利用該模型對關(guān)鍵詞進(jìn)行提取,但該類方法較為復(fù)雜。基于自然語言理解的特征提取方法通常需要對中文文本從詞、句、語義、篇章等層級進(jìn)行分析,從而獲得相關(guān)關(guān)鍵詞,這類方法更加符合關(guān)鍵詞提取的標(biāo)注過程,但如何對文章進(jìn)行準(zhǔn)確的語言學(xué)分析還沒有得到有效解決,該方法的抽取性能非常有限。

    針對上述傳統(tǒng)特征提取方法的特點(diǎn)和不足,提出了一種基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁特征提取方法。該方法首先對文本文檔的分詞結(jié)果進(jìn)行詞性標(biāo)注,然后計(jì)算文檔詞語的詞性、位置、TFIDF以及聚集特征等綜合啟發(fā)式,并用遺傳算法優(yōu)化各啟發(fā)式的權(quán)重參數(shù),最終提取獲得中文網(wǎng)頁特征詞。

    1 基礎(chǔ)知識簡介

    1.1 頻率

    TFIDF是一種常用的信息檢索方法[6]。設(shè)N表示給定文檔集合Ω中的總文檔數(shù)目。對于給定文檔d,采用TFIDF算法得到該文檔中詞條t的權(quán)重wt為

    (1)

    式中:TF表示t在文檔d中出現(xiàn)的頻率。IDF表示文檔d在文檔集中出現(xiàn)的文檔數(shù)目,n表示文檔集中出現(xiàn)特征t的文檔數(shù)目。

    從式(1)可知,如果特征t在文檔d出現(xiàn)的次數(shù)較多而在其他文檔中出現(xiàn)次數(shù)較少的話,那么特征t的權(quán)值就較大,表明該特征對文檔d的區(qū)分能力就較強(qiáng),就可以作為文檔特征的候選之一。

    1.2 關(guān)聯(lián)度

    詞語的關(guān)聯(lián)表現(xiàn)為詞與詞之間構(gòu)成的復(fù)雜網(wǎng)絡(luò)[7]。復(fù)雜網(wǎng)絡(luò)方面的研究表明,漢語語言的詞語之間的關(guān)聯(lián)度具有高度的局部聚集性和全局連接性,能夠用于表征文本特征[8]。

    設(shè)V={v1,v2,…,vn}表示文檔特征的集合,(vi,vj)表示特征vi和特征vj之間的一條邊。G(V,E)表示的是一個圖,其中V為圖的頂點(diǎn)集合,E?{(vi,vj):vi,vj∈V}為圖的邊集。對于頂點(diǎn)vi,其度定義如下:

    Di=|{(vi,vj):(vi,vj)∈E,vi,vj∈V}|

    (2)

    頂點(diǎn)vi的聚集度Ki為

    Ki=

    | {(vj,vk) :(vi,vj)∈E(vi,vk)∈E,vi,vj,vk∈V} |

    (3)

    頂點(diǎn)vi的聚集度系數(shù)Ci為

    (4)

    由式(3)和式(4)可得特征關(guān)聯(lián)度為

    (5)

    根據(jù)式(3)~(6),詞語網(wǎng)絡(luò)中節(jié)點(diǎn)的度和聚集度系數(shù)可以描述特征在文本中的連接特性,處于重要位置的特征往往具有較高的關(guān)聯(lián)度。

    1.3 詞性

    詞性是一種淺層語言學(xué)知識的表示,該因素的獲取不需要對文本進(jìn)行復(fù)雜的語言學(xué)標(biāo)注和分析,從而能有效避免傳統(tǒng)采用語言學(xué)方法的缺陷。一般而言,中文文本特征的詞性往往集中在名詞、動詞、形容詞等實(shí)詞中。根據(jù)人工標(biāo)注結(jié)果,對特征的詞性分布進(jìn)行了統(tǒng)計(jì)分析,其結(jié)果如表1所示。

    表1 特征詞性分布

    從特征詞性統(tǒng)計(jì)分布可以看到,詞性能夠有效表征文檔的中文特征。排名前4位的名詞、動詞、形容詞和副詞達(dá)到關(guān)鍵詞總數(shù)的95.5%。因此,論文引入詞性作為特征提取的重要因素之一。該因素能夠有效區(qū)分停用詞等,克服了傳統(tǒng)基于統(tǒng)計(jì)方法無法解決高頻但無實(shí)際意義的中文詞語,從而提高特征提取的性能。

    1.4 位置

    位置是文本特征提取的一個重要因素。根據(jù)特征所在的位置,主要包括標(biāo)題、摘要和正文3種。根據(jù)詞語所在的具體位置,還可細(xì)分為小標(biāo)題、起始段、中間段、末尾段、起始句、中間句、末尾句等[9]。由于網(wǎng)絡(luò)文本一般不存在摘要,本文主要考慮特征位于標(biāo)題、起始段以及其他3種情況。通常特征位于標(biāo)題和起始段的概率較高,因此根據(jù)文本中特征所在的位置,按照標(biāo)題、起始段、其他的順序分別賦給不同的權(quán)重。

    2 論文所提方法

    2.1 綜合啟發(fā)式

    僅僅根據(jù)單詞頻率進(jìn)行特征提取的TFIDF方法雖然簡單,但是也存在一定的缺陷,如數(shù)據(jù)集偏斜[10],類間、類內(nèi)分布偏差[11]等。而單純依靠復(fù)雜網(wǎng)絡(luò)中詞語之間關(guān)聯(lián)度的特征提取方法,則忽略了特征本身的頻率,容易造成特征提取聚集到某些無意義的高頻詞,如“的”等,從而導(dǎo)致特征提取出現(xiàn)偏差。研究顯示,融合頻率和關(guān)聯(lián)特征[12]能夠有效避免單一方法的缺陷,從而提高特征提取的效率。

    此外,僅僅依靠統(tǒng)計(jì)知識容易造成特征提取偏差,特別是一些高頻詞如“是”、“和”等容易成為特征的候選。盡管這些詞可以通過建立“停詞表”對其進(jìn)行過濾,但是構(gòu)建合適的詞表非常困難,因此引入特征的詞性以及位置對特征進(jìn)行進(jìn)一步選取。

    綜合以上因素,論文采用特征的頻率、關(guān)聯(lián)度、詞性以及位置4個因素來衡量待選特征。對于文本中的每個特征w,其權(quán)重計(jì)算公式為

    score(w) =α×WFreq+β×WLoc+

    γ×WCF+δ×WPOS

    (6)

    式中:WFreq表示特征的TFIDF啟發(fā)式,WPOS表示特征的詞性啟發(fā)式,WCF表示特征的關(guān)聯(lián)度啟發(fā)式,WLoc表示特征的位置啟發(fā)式。每個啟發(fā)式的具體描述如表2所示。

    表2 特征各啟發(fā)式描述

    2.2 特征提取流程

    特征提取的基本流程如圖1所示,其中虛線部分為訓(xùn)練模塊。對于給定的輸入本文,特征提取具體過程如下。

    圖1 本文方法特征提取基本流程Fig.1 Flow of feature extraction in this paper

    1)預(yù)處理。將網(wǎng)絡(luò)文本去除HTML格式,保留文本詞語的位置信息,并對文本進(jìn)行分詞和詞性標(biāo)注。

    2)各啟發(fā)式計(jì)算。計(jì)算文本中每個詞語的TFIDF、關(guān)聯(lián)度、位置和詞性等啟發(fā)式。

    3)啟發(fā)式融合。根據(jù)多啟發(fā)式融合模型,對詞語的4個啟發(fā)式進(jìn)行融合,并計(jì)算得到綜合得分。

    4)輸出結(jié)果。最后根據(jù)各特征得分的大小進(jìn)行排序,選擇最優(yōu)的特征并輸出。

    2.3 遺傳算法優(yōu)化權(quán)重參數(shù)

    本文方法中各啟發(fā)式的參數(shù)權(quán)重選擇是一個典型的組合優(yōu)化問題。由于遺傳算法簡單、易理解、易實(shí)現(xiàn),且在解決組合優(yōu)化問題有強(qiáng)大的優(yōu)勢[13],因此,論文采用遺傳算法對式(6)中的參數(shù)權(quán)重進(jìn)行優(yōu)化,從而得到一定范圍的最佳組合參數(shù)權(quán)重。這里限定4個參數(shù)權(quán)重的取值范圍為(0,1),并且滿足α+β+γ+δ=1。然后根據(jù)經(jīng)驗(yàn)選取適當(dāng)?shù)某跏贾?,并?jīng)過迭代計(jì)算,得到每個啟發(fā)式的參數(shù)權(quán)重。利用遺傳算法獲取各特征參數(shù)權(quán)重具體過程描述如下:

    1)依據(jù)經(jīng)驗(yàn),初始化各特征參數(shù)權(quán)重α=0.2,β=0.2,γ=0.4,δ=0.2;

    2)采用十進(jìn)制編碼對染色體進(jìn)行編碼。首先把各參數(shù)都乘以10或100使它們變成整數(shù),然后再對它們進(jìn)行編碼,具體格式如下:L=αβγδ。 其中各參數(shù)均用3位十進(jìn)制數(shù)來表示,例如:α=0.2,β=0.2,γ=0.4,δ=0.2,則先把它們轉(zhuǎn)化為α=020,β=020,γ=040,δ=020,則相應(yīng)染色體編碼為:L=020020040020。

    3)利用各參數(shù)權(quán)重計(jì)算相應(yīng)召回率,以召回率作為染色體的適應(yīng)度函數(shù),召回率計(jì)算公式為

    recall =n/N

    式中:n代表同所標(biāo)注的特征相符的特征的數(shù)目,N代表文檔集中所標(biāo)注的特征總數(shù)目。

    4)交叉和變異操作:遺傳算法的收斂速度以及解的質(zhì)量在很大程度上取決于交叉概率和變異概率。為了防止算法陷于局部最優(yōu)以及加快算法搜索效率,僅讓種群中較優(yōu)個體參與交叉和變異,而當(dāng)前種群最優(yōu)個體則不參與。具體交叉概率和變異概率計(jì)算公式如下:

    (8)

    (9)

    式中:a1、a2、a3、a4為0~1的隨機(jī)數(shù),fmax是當(dāng)前群體中最優(yōu)個體的適應(yīng)度值,favg是當(dāng)前群體的平均適應(yīng)度值,fc是參加交叉操作的個體中較大的適應(yīng)度值,fm是變異個體的適應(yīng)度值。

    5)終止條件:當(dāng)代種群最佳染色體適應(yīng)度值和前代種群最佳染色體適應(yīng)度值之差絕對值不超過10-5。

    采用遺傳算法優(yōu)化選擇各啟發(fā)式的參數(shù)權(quán)重,能夠有效避免通過主觀經(jīng)驗(yàn)來確定參數(shù)的主觀性,從而實(shí)現(xiàn)參數(shù)能夠依據(jù)訓(xùn)練數(shù)據(jù)自適應(yīng)地調(diào)優(yōu)。下面的實(shí)驗(yàn)驗(yàn)證結(jié)果表明,采用該遺傳算法獲得參數(shù)權(quán)重能夠使本文特征提取方法獲得良好的提取效果。

    3 實(shí)驗(yàn)驗(yàn)證

    3.1 實(shí)驗(yàn)總體設(shè)置

    以Intel Core2 Duo CPU T6500、2.4 GHz、 2 GB內(nèi)存和Windows XP 2SP2操作系統(tǒng)的PC機(jī)作為實(shí)驗(yàn)平臺,以MATLAB7.0為仿真工具,進(jìn)行2組實(shí)驗(yàn):

    第1組實(shí)驗(yàn)數(shù)據(jù)來自互聯(lián)網(wǎng)抓取的1 500個中文文檔,論文根據(jù)該數(shù)據(jù)集的來源將這些文檔分為5個類別,分別包括新聞、財經(jīng)、科技、體育和娛樂,各類文檔數(shù)目分布均勻,都包含300篇文檔。實(shí)驗(yàn)中選擇每個類別的200篇文檔作為訓(xùn)練集,剩下的100篇作為測試集。

    第2組實(shí)驗(yàn)數(shù)據(jù)采用復(fù)旦大學(xué)計(jì)算機(jī)信息與技術(shù)系國際數(shù)據(jù)庫中心自然語言處理小組構(gòu)建的中文文本分類語料庫作為實(shí)驗(yàn)數(shù)據(jù),其下載網(wǎng)址為:http://www.nlp.org.cn/categories/default.php?cat_id=16。該語料庫由20個類別的14 378篇文檔組成,其中6 164篇為測試文本,8 214篇為訓(xùn)練文本;各類別的測試文本集和訓(xùn)練文本集之間互不重疊,也即一篇文檔僅屬一個文本集并且每篇文本僅屬于一個類別。該語料庫各類別訓(xùn)練文檔數(shù)分布極其不均勻,其中訓(xùn)練文檔數(shù)較小的類別占大多數(shù),約為11個類別,它們的訓(xùn)練文檔數(shù)均少于100篇,如通信類文檔數(shù)僅有25篇。

    由于所選語料庫是中文性質(zhì)的,所以這2組實(shí)驗(yàn)都采用中科院計(jì)算技術(shù)研究所的“漢語詞法分析系統(tǒng)ICTCLAS”對它進(jìn)行分詞處理;分類工具軟件都采用紐西蘭的Waikato大學(xué)開發(fā)的Weka工具;因KNN分類器簡單、易實(shí)現(xiàn)而被廣泛應(yīng)用,這2組實(shí)驗(yàn)選它作為實(shí)驗(yàn)分類器 (其中距離采用向量夾角余弦來度量,K=20)。

    為了對論文所提方法性能進(jìn)行全面考查,論文對這2組實(shí)驗(yàn)分別做了不同方面的實(shí)驗(yàn)內(nèi)容:第1組實(shí)驗(yàn)主要做特征詞選擇和召回率方面的實(shí)驗(yàn);第2組主要做耗時和分類性能方面的實(shí)驗(yàn)。

    3.2 第1組實(shí)驗(yàn)(各類別數(shù)據(jù)分布均勻)

    在該組實(shí)驗(yàn)中,論文對比了基于頻率的特征提取方法、基于關(guān)聯(lián)度的特征提取方法以及本文方法性能。

    3.2.1 特征詞選擇實(shí)驗(yàn)結(jié)果

    分別采用上面3種方法計(jì)算全部詞語的4個啟發(fā)式值,并根據(jù)不同啟發(fā)式權(quán)重進(jìn)行排序,最后提取得分最高的前10個詞語作為最后的關(guān)鍵詞。表4為實(shí)驗(yàn)對比結(jié)果。其中,基于頻率的方法用TFIDF來表示,基于關(guān)聯(lián)度的方法用CF來表示,本文方法用Multi來表示。

    表3 3種方法下召回率對比結(jié)果

    從表4可以看出,對于“都”、“隨后”這類詞,本文方法能夠有效地濾除。由于這類單詞在文本中通常具有較高的頻率,很難通過統(tǒng)計(jì)的方法有效去除。而且本文方法召回率能夠達(dá)到70%,表現(xiàn)出較好的提取性能。此外,比較特征詞自動提取和人工選擇,3種提取方法都得到了 “進(jìn)口”這個特征詞,但人工標(biāo)注卻忽略了這個詞語。通過查看原文,“進(jìn)口”確實(shí)應(yīng)該標(biāo)注為特征詞,反映出人工選擇帶有較強(qiáng)的主觀性,這種主觀性很容易產(chǎn)生實(shí)驗(yàn)誤差。同樣也反映出特征詞自動提取能夠在一定程度上克服這種主觀性的缺點(diǎn)。

    3.2.2 召回率實(shí)驗(yàn)結(jié)果

    針對測試集的不同類別,論文分別對比不同特征詞提取方法的性能。由于不同類別的多啟發(fā)式融合參數(shù)不同,論文利用每個類別的訓(xùn)練語料分別訓(xùn)練得到各個類別的多啟發(fā)式融合參數(shù)。各特征詞提取方法性能采用該類別測試集上的平均召回率表示,實(shí)驗(yàn)結(jié)果如圖2所示。

    圖2 各特征提取方法在各類別下的召回率對比結(jié)果Fig.2 Comparison results of recall rate on feature extraction methods

    從圖2可以看出,采用本文方法在各個測試集上的平均召回率均高于基于關(guān)聯(lián)度的方法和基于頻率的方法的性能,這說明該方法提取特征詞的性能穩(wěn)定,在各個類別的提取效果均得到明顯提高。

    3.3 第2組實(shí)驗(yàn)(各類別數(shù)據(jù)分布極其不均勻)

    在這組實(shí)驗(yàn)中,采用宏平均F1值和微平均F1值作為分類性能評價標(biāo)準(zhǔn),使用3種經(jīng)典的特征提取方法:信息增益(IG)、x2統(tǒng)計(jì)量(CHI)、互信息(MI)與本文所提特征提取方法作比較。

    3.3.1 耗時實(shí)驗(yàn)結(jié)果

    在實(shí)驗(yàn)中,記錄了各特征提取方法從開始執(zhí)行到執(zhí)行結(jié)束整個過程所消耗的時間,其結(jié)果如圖3。

    圖3 各方法消耗的時間Fig.3 Comparison results of consuming time

    由于本文方法采用了多個指標(biāo)以及組合方法,耗時有所增加。從圖3可以看出,在該組實(shí)驗(yàn)中,本文方法在消耗時間方面劣于互信息方法和信息增益方法,但優(yōu)于最耗時的x2統(tǒng)計(jì)量方法,但它們耗時相差不大,這也使得本文方法有一定的實(shí)用價值。

    3.3.2 宏平均和微平均實(shí)驗(yàn)結(jié)果

    從各個特征提取方法所獲得的特征集(其中的特征已按權(quán)重逆序進(jìn)行了排序)中,分別選取相應(yīng)數(shù)目的特征對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行宏平均F1和微平均F1計(jì)算,具體結(jié)果如圖4和圖5所示。

    圖4 宏平均F1實(shí)驗(yàn)結(jié)果Fig.4 Comparison results of macro-averageF1

    圖5 微平均F1實(shí)驗(yàn)結(jié)果Fig.5 Comparison results of micro-averageF1

    利用特征數(shù)目的變化來考查分類器的性能,可以比較準(zhǔn)確地反映出該分類器數(shù)對據(jù)樣本變化是否敏感。圖4表明:隨著特征數(shù)目的遞增,宏平均F1值不斷增加,但是由于實(shí)驗(yàn)數(shù)據(jù)中各類別樣本分布極其不均勻而有所波動;圖4表明:隨著特征個數(shù)的不斷增加,微平均F1值也遞增并趨于一個相對較穩(wěn)定的值。

    從圖4和圖5可以看出:在本文方法所選的前1 500個特征上KNN分類器性能最佳,宏平均F1值約為84%,微平均F1值約為92%;在CHI方法所選的前1 500個特征上KNN分類器性能最佳,宏平均F1值約為74%,微平均F1值約為86%;在MI方法所選的前1 500個特征上KNN分類器性能最佳,宏平均F1值約為70%,微平均F1值約為84%;在IG方法所選的前2 000個特征上KNN分類器性能最佳,宏平均F1值約為61%,微平均F1值約為67%。這表明在該組實(shí)驗(yàn)中,這4個特征提取方法的優(yōu)劣依次為本文方法、CHI、MI、IG。原因在于:本文方法在選擇特征時,不但考查了特征的詞性和詞頻還考查了特征的位置和關(guān)聯(lián)度,從而有效地對待選特征進(jìn)行全面考查,這使得本文方法受類別分布影 響較小,因此所選特征集較具代表性。CHI方法在選擇特征時不但考查了特征在文檔中存在的情況而且還考查了特征不在文檔中的情況,MI方法僅考查了特征在文檔中存在的情況,但它們都沒能有效地消除冗余特征。因此,這2個方法要劣于本文方法,但是CHI方法要優(yōu)于MI方法;由于實(shí)驗(yàn)中所用語料庫中各類別樣本分布相差較大,而IG方法對類別樣本分布極其敏感,因此,在此情況下IG方法所選擇的特征集代表性最差。

    4 結(jié)束語

    基于統(tǒng)計(jì)方法和基于語言學(xué)的特征提取方法已經(jīng)被廣泛應(yīng)用于特征詞提取。本文結(jié)合2種方法的優(yōu)點(diǎn),提出了一種基于遺傳算法優(yōu)化綜合啟發(fā)式的中文網(wǎng)頁特征提取方法。該方法能夠有效利用詞語的內(nèi)在屬性和詞語之間的鏈接關(guān)系,通過多種啟發(fā)式表征中文文本的特征,對特征詞進(jìn)行較全面的考查。實(shí)驗(yàn)結(jié)果表明該方法能夠有效融合不同因素的優(yōu)點(diǎn),與傳統(tǒng)方法相比,該方法具有一定的優(yōu)勢,從而使得該方法在文本挖掘方面有一定的實(shí)用價值。

    由于不同類別的文檔的因素分布不盡相同,論文接下來的工作將繼續(xù)研究不同領(lǐng)域內(nèi)采用該方法的特征詞提取的性能。另外通過實(shí)驗(yàn)發(fā)現(xiàn),對于人工標(biāo)注的結(jié)果,主觀性因素的影響依然存在。論文還將進(jìn)一步研究合理的標(biāo)注方式,對現(xiàn)有網(wǎng)頁數(shù)據(jù)進(jìn)行處理,減少主觀因素帶來的實(shí)驗(yàn)誤差。

    另外,本文方法雖然采用了十進(jìn)制編碼以及自適應(yīng)交叉變異操作等措施來確保遺傳算法的性能,進(jìn)而保證本文特征抽取方法的性能,但是目前有些智能優(yōu)化算法比遺傳算法優(yōu)秀,例如粒子群優(yōu)化算法、蜂群優(yōu)化算法等,如果把它們用于本文方法的參數(shù)權(quán)重優(yōu)化,效果可能會優(yōu)于遺傳算法。為此,作者下一步研究工作就是嘗試把其他智能優(yōu)化算法用于本文方法的參數(shù)權(quán)重優(yōu)化,以進(jìn)一步提高本文方法的性能。

    參考文獻(xiàn):

    [1]GHEYAS I A, SMITH L S. Feature subset selection in large dimensionality domains[J]. Pattern Recognition, 2010, 43(1): 5-13.

    [2]NGUYEN M H, TORRE F D. Optimal feature selection for support vector machines[J]. Pattern Recognition, 2010, 43(3): 584-591.

    [3]ZHAO Zheng, WANG Lei, LIU Huan. On similarity preserving feature selection[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(3): 619-632.

    [4]JAVED K, BABRI H A, SAEED M. Feature selection based on class-dependent densities for high-dimensional binary data[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(3): 465-477.

    [5]WU Xindong, YU Kui ,DING Wei. Online feature selection with streaming features[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(5): 1178-1192.

    [6]LEE S, PARK C, KOO J Y. Feature selection in the Laplacian support vector machine[J]. Computational Statistics and Data Analysis, 2011, 55(1): 567-577.

    [7]SONG Qinbao, NI Jingjie, WANG Guangtao. A fast clustering-based feature subset selection algorithm for high-dimensional data[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(1): 1-14.

    [8]CHUANG L Y, YANG C H, LI J C. Chaotic maps based on binary particle swarm optimization for feature selection[J]. Journal of Applied Soft Computing, 2011, 11 (1): 239-248.

    [9]李綱,戴強(qiáng)斌. 基于詞匯鏈的關(guān)鍵詞自動標(biāo)引方法[J]. 圖書情報知識, 2011,12(3): 67-71.

    LI Gang, DAI Qiangbin. Keywords automatic indexing based on lexical chains[J]. Document, Information and Knowledge, 2011, 12(3): 67-71

    [10]朱顥東, 李紅嬋. 基于互信息和粗糙集理論的特征選擇[J].計(jì)算機(jī)工程, 2011, 37 (15): 181-183.

    ZHU Haodong, LI Hongchan. Feature selection based on mutual information and rough set theory[J]. Computer Engineering, 2011, 37 (15): 181-183.

    [11]JEONG Y S, KANG I H, JEONG M K. A new feature selection method for one-class classification problems[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 2012, 42(6): 1500-1509.

    [12]LIU Z, LIU Q. Balanced feature selection method for Internet traffic classification[J]. Networks, 2012, 1 (2): 74-83.

    [13]MAHROOGHY M,YOUNAN N H, ANANTHARAJ V G. On the use of the genetic algorithm filter-based feature selection technique for satellite precipitation estimation[J]. Geoscience and Remote Sensing Letters, 2012, 9(5): 963-967.

    猜你喜歡
    特征詞特征提取文檔
    有人一聲不吭向你扔了個文檔
    基于Daubechies(dbN)的飛行器音頻特征提取
    電子制作(2018年19期)2018-11-14 02:37:08
    基于改進(jìn)TFIDF算法的郵件分類技術(shù)
    產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
    Bagging RCSP腦電特征提取算法
    基于RI碼計(jì)算的Word復(fù)制文檔鑒別
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    面向文本分類的特征詞選取方法研究與改進(jìn)
    基于MED和循環(huán)域解調(diào)的多故障特征提取
    不讓他人隨意下載Google文檔
    電腦迷(2012年4期)2012-04-29 06:12:13
    一区二区三区精品91| 日本91视频免费播放| 99热国产这里只有精品6| 精品国产一区二区久久| 毛片一级片免费看久久久久| 秋霞在线观看毛片| 国产精品一二三区在线看| 又黄又爽又刺激的免费视频.| 黄色一级大片看看| 草草在线视频免费看| 午夜免费鲁丝| 国产无遮挡羞羞视频在线观看| 久久国产精品男人的天堂亚洲 | 欧美精品亚洲一区二区| 国产伦精品一区二区三区四那| 久久女婷五月综合色啪小说| 七月丁香在线播放| 大香蕉97超碰在线| 亚洲三级黄色毛片| 日韩欧美 国产精品| 26uuu在线亚洲综合色| 天堂8中文在线网| 水蜜桃什么品种好| 日日摸夜夜添夜夜添av毛片| 哪个播放器可以免费观看大片| 一级二级三级毛片免费看| 少妇 在线观看| 久久婷婷青草| 这个男人来自地球电影免费观看 | 麻豆成人午夜福利视频| av专区在线播放| 久久99一区二区三区| 一本色道久久久久久精品综合| videossex国产| 狠狠精品人妻久久久久久综合| 国产精品99久久久久久久久| 久久精品久久久久久噜噜老黄| 久久久久久久精品精品| 高清毛片免费看| 黄色配什么色好看| 少妇人妻久久综合中文| 国内精品宾馆在线| 80岁老熟妇乱子伦牲交| 街头女战士在线观看网站| 成人影院久久| 91久久精品国产一区二区成人| 热re99久久国产66热| 午夜福利视频精品| 人妻少妇偷人精品九色| 99久久精品国产国产毛片| 国产一级毛片在线| 亚洲国产精品国产精品| 99热这里只有是精品50| 97超碰精品成人国产| 亚洲,欧美,日韩| 熟女电影av网| 国产极品天堂在线| 欧美日韩在线观看h| 国内揄拍国产精品人妻在线| 丰满人妻一区二区三区视频av| 免费久久久久久久精品成人欧美视频 | 亚洲一区二区三区欧美精品| 新久久久久国产一级毛片| 亚洲欧美日韩另类电影网站| 一区二区三区免费毛片| 国产成人免费无遮挡视频| 日韩强制内射视频| 91精品伊人久久大香线蕉| 校园人妻丝袜中文字幕| 搡老乐熟女国产| 精品久久国产蜜桃| 日韩三级伦理在线观看| 亚洲伊人久久精品综合| 国产一区二区在线观看日韩| av播播在线观看一区| 久久久久久久久久久久大奶| 日本黄大片高清| 夫妻性生交免费视频一级片| 看免费成人av毛片| 国产免费福利视频在线观看| 成年美女黄网站色视频大全免费 | 亚洲无线观看免费| av视频免费观看在线观看| 久久婷婷青草| 黄色欧美视频在线观看| 乱码一卡2卡4卡精品| 又爽又黄a免费视频| 成人美女网站在线观看视频| 黄色一级大片看看| 亚洲天堂av无毛| 搡老乐熟女国产| 国产片特级美女逼逼视频| 久久精品久久久久久久性| 91成人精品电影| 蜜桃在线观看..| 国产欧美亚洲国产| 成人毛片a级毛片在线播放| 国产黄色免费在线视频| 菩萨蛮人人尽说江南好唐韦庄| 日韩强制内射视频| 人妻少妇偷人精品九色| 人人妻人人爽人人添夜夜欢视频 | 简卡轻食公司| 一个人看视频在线观看www免费| 精品国产乱码久久久久久小说| 午夜福利视频精品| 男人添女人高潮全过程视频| 午夜av观看不卡| 中文字幕av电影在线播放| 亚洲不卡免费看| 色网站视频免费| 国产男人的电影天堂91| 韩国高清视频一区二区三区| 欧美最新免费一区二区三区| 有码 亚洲区| 亚洲欧美日韩另类电影网站| .国产精品久久| 一级毛片 在线播放| 久久国内精品自在自线图片| 91精品一卡2卡3卡4卡| 日本av免费视频播放| 91久久精品国产一区二区成人| 精品亚洲成a人片在线观看| 永久网站在线| 青春草亚洲视频在线观看| 嘟嘟电影网在线观看| 久久女婷五月综合色啪小说| 国产成人精品婷婷| 亚洲欧美清纯卡通| 久久久久久久国产电影| 欧美精品高潮呻吟av久久| 亚洲成人av在线免费| 搡女人真爽免费视频火全软件| 99九九线精品视频在线观看视频| 国产精品嫩草影院av在线观看| 在线观看人妻少妇| 在线看a的网站| 丰满人妻一区二区三区视频av| 亚洲精品国产av成人精品| 国产色爽女视频免费观看| 精品熟女少妇av免费看| 国产精品国产三级专区第一集| 黑人高潮一二区| 午夜91福利影院| 丰满饥渴人妻一区二区三| 久久人人爽人人爽人人片va| 午夜老司机福利剧场| av黄色大香蕉| 亚洲成人av在线免费| av免费在线看不卡| 最近手机中文字幕大全| 午夜影院在线不卡| 久久女婷五月综合色啪小说| 看非洲黑人一级黄片| 成人18禁高潮啪啪吃奶动态图 | 美女国产视频在线观看| 观看美女的网站| 亚洲av综合色区一区| 亚洲欧美日韩东京热| 日本午夜av视频| 啦啦啦中文免费视频观看日本| 男人狂女人下面高潮的视频| 国产探花极品一区二区| 国产精品偷伦视频观看了| 国产亚洲最大av| 久久人人爽人人片av| 国产av一区二区精品久久| 老司机影院毛片| 深夜a级毛片| 黑人高潮一二区| 国产成人a∨麻豆精品| 在线免费观看不下载黄p国产| 欧美变态另类bdsm刘玥| 亚洲第一区二区三区不卡| 日韩制服骚丝袜av| 最近手机中文字幕大全| 乱码一卡2卡4卡精品| 欧美区成人在线视频| 国产欧美日韩综合在线一区二区 | 伊人久久精品亚洲午夜| 亚洲精品自拍成人| 精品久久国产蜜桃| 热re99久久精品国产66热6| 水蜜桃什么品种好| 狠狠精品人妻久久久久久综合| 亚洲精品一二三| 成人亚洲欧美一区二区av| 国产欧美另类精品又又久久亚洲欧美| 精品一区二区三区视频在线| 国产又色又爽无遮挡免| 国产黄频视频在线观看| 免费观看性生交大片5| 欧美 日韩 精品 国产| 久久精品国产亚洲av涩爱| 中文天堂在线官网| 久久久精品94久久精品| 久久人人爽人人片av| 国产在线男女| 2022亚洲国产成人精品| 18禁在线播放成人免费| 少妇 在线观看| 精品视频人人做人人爽| av有码第一页| 久久亚洲国产成人精品v| 亚洲一区二区三区欧美精品| 亚洲精品色激情综合| 成人无遮挡网站| 国产乱人偷精品视频| 五月开心婷婷网| 久久热精品热| 亚洲伊人久久精品综合| 国产视频首页在线观看| 少妇 在线观看| 久久久久久久亚洲中文字幕| 不卡视频在线观看欧美| 免费观看a级毛片全部| 国产男女内射视频| 嫩草影院新地址| 免费看av在线观看网站| 国产av一区二区精品久久| kizo精华| av福利片在线观看| 久久99精品国语久久久| 国产精品秋霞免费鲁丝片| 男女边吃奶边做爰视频| 亚洲成人手机| 国产片特级美女逼逼视频| 中文字幕制服av| 日韩成人伦理影院| 人体艺术视频欧美日本| 国产成人精品无人区| 亚洲精品日韩av片在线观看| 国产精品免费大片| 噜噜噜噜噜久久久久久91| 国产 精品1| 精品99又大又爽又粗少妇毛片| 亚洲国产毛片av蜜桃av| 黄色一级大片看看| 国产精品一区二区在线观看99| 精品国产一区二区三区久久久樱花| 免费高清在线观看视频在线观看| 少妇人妻久久综合中文| 色视频在线一区二区三区| 精品人妻熟女av久视频| 亚洲不卡免费看| 国产毛片在线视频| 久久免费观看电影| 国产一区二区在线观看日韩| 亚洲精品乱久久久久久| √禁漫天堂资源中文www| 国产男人的电影天堂91| 国产一区二区三区av在线| 午夜av观看不卡| 亚洲精品久久久久久婷婷小说| 国产亚洲91精品色在线| 久久ye,这里只有精品| 国精品久久久久久国模美| 97精品久久久久久久久久精品| 在线观看人妻少妇| 不卡视频在线观看欧美| 欧美+日韩+精品| 色94色欧美一区二区| 亚洲精品日韩在线中文字幕| www.色视频.com| 多毛熟女@视频| 我要看黄色一级片免费的| 三级国产精品片| 中文字幕亚洲精品专区| 91精品一卡2卡3卡4卡| 国产伦在线观看视频一区| av福利片在线| 黑人巨大精品欧美一区二区蜜桃 | 国产在线视频一区二区| 国产白丝娇喘喷水9色精品| 日本免费在线观看一区| 亚洲国产精品一区二区三区在线| 日韩一本色道免费dvd| 18禁裸乳无遮挡动漫免费视频| 美女cb高潮喷水在线观看| 自线自在国产av| 一个人看视频在线观看www免费| 亚洲精品久久久久久婷婷小说| 男女国产视频网站| 99久久综合免费| 日韩一区二区三区影片| 亚洲国产精品999| 成人国产麻豆网| 在线观看美女被高潮喷水网站| 丝瓜视频免费看黄片| 欧美xxⅹ黑人| 噜噜噜噜噜久久久久久91| 人妻系列 视频| 亚洲av成人精品一区久久| 中文字幕人妻丝袜制服| 女人精品久久久久毛片| 青春草亚洲视频在线观看| 18禁动态无遮挡网站| 日韩熟女老妇一区二区性免费视频| 男人和女人高潮做爰伦理| 极品少妇高潮喷水抽搐| 国产精品一区二区三区四区免费观看| 日本午夜av视频| 观看美女的网站| videos熟女内射| 免费观看在线日韩| 免费高清在线观看视频在线观看| 精品少妇久久久久久888优播| 久久人人爽人人片av| 欧美激情国产日韩精品一区| 三级国产精品欧美在线观看| xxx大片免费视频| 日韩欧美精品免费久久| av在线app专区| 欧美日韩综合久久久久久| 男女边吃奶边做爰视频| 韩国av在线不卡| a级片在线免费高清观看视频| 国内少妇人妻偷人精品xxx网站| 国产综合精华液| 如何舔出高潮| 午夜免费观看性视频| 男的添女的下面高潮视频| 亚州av有码| 国产精品久久久久久精品古装| 五月开心婷婷网| 日韩中字成人| 老司机影院成人| 大又大粗又爽又黄少妇毛片口| 亚洲精品视频女| av国产久精品久网站免费入址| 久久这里有精品视频免费| 免费观看在线日韩| 一本色道久久久久久精品综合| 丰满少妇做爰视频| 免费看日本二区| 女性生殖器流出的白浆| 91久久精品电影网| 欧美日韩在线观看h| 我的女老师完整版在线观看| 在线观看免费高清a一片| 国产毛片在线视频| 99热这里只有是精品50| 人人妻人人看人人澡| 99视频精品全部免费 在线| 精华霜和精华液先用哪个| 精品久久久久久久久av| 国产成人a∨麻豆精品| 最近的中文字幕免费完整| 大香蕉久久网| 亚洲欧洲精品一区二区精品久久久 | 国产欧美日韩一区二区三区在线 | 午夜福利网站1000一区二区三区| 青青草视频在线视频观看| 极品少妇高潮喷水抽搐| 国产精品.久久久| 日韩中文字幕视频在线看片| 五月天丁香电影| av视频免费观看在线观看| 少妇丰满av| 国产高清国产精品国产三级| 亚洲欧美日韩卡通动漫| 国产美女午夜福利| 日本欧美视频一区| 国产熟女欧美一区二区| 美女主播在线视频| 97超视频在线观看视频| 久久97久久精品| 国产片特级美女逼逼视频| 欧美变态另类bdsm刘玥| 婷婷色麻豆天堂久久| 在线观看免费高清a一片| 亚洲丝袜综合中文字幕| 亚洲av中文av极速乱| 亚洲va在线va天堂va国产| a级毛色黄片| 国产色爽女视频免费观看| av有码第一页| 国产精品成人在线| 亚洲婷婷狠狠爱综合网| 99热这里只有精品一区| 男的添女的下面高潮视频| 一级二级三级毛片免费看| 一级黄片播放器| 99热这里只有是精品50| 女人久久www免费人成看片| 中文欧美无线码| 99九九在线精品视频 | 日韩av不卡免费在线播放| 久久久久视频综合| 一级av片app| 国产女主播在线喷水免费视频网站| 久久久精品94久久精品| 成人美女网站在线观看视频| 国产精品无大码| 精品久久久精品久久久| 青春草视频在线免费观看| 视频区图区小说| 一区二区三区免费毛片| 激情五月婷婷亚洲| 国产爽快片一区二区三区| 亚洲欧美一区二区三区黑人 | 王馨瑶露胸无遮挡在线观看| 嘟嘟电影网在线观看| kizo精华| 亚洲精品日韩在线中文字幕| 国产高清国产精品国产三级| 下体分泌物呈黄色| 在线播放无遮挡| 日本色播在线视频| 一级毛片久久久久久久久女| 三级国产精品片| 男女边吃奶边做爰视频| 日日爽夜夜爽网站| 久久久久久久国产电影| 国产成人精品久久久久久| 国产男人的电影天堂91| 老司机亚洲免费影院| 国产在线男女| 亚洲美女黄色视频免费看| 免费观看无遮挡的男女| 国产又色又爽无遮挡免| 在线观看av片永久免费下载| 久久久国产一区二区| 久久精品国产a三级三级三级| 亚洲真实伦在线观看| 亚洲欧美清纯卡通| 久久久久久久久久人人人人人人| 天美传媒精品一区二区| 欧美变态另类bdsm刘玥| 亚洲内射少妇av| 日本91视频免费播放| 日韩精品有码人妻一区| 国产69精品久久久久777片| 久久久亚洲精品成人影院| 插阴视频在线观看视频| 国产精品人妻久久久久久| 亚洲熟女精品中文字幕| 91精品伊人久久大香线蕉| 久久亚洲国产成人精品v| 只有这里有精品99| 嫩草影院入口| 亚洲国产毛片av蜜桃av| 91aial.com中文字幕在线观看| 老司机亚洲免费影院| 在线观看免费视频网站a站| 免费观看av网站的网址| 女人精品久久久久毛片| 国产精品久久久久成人av| 久久这里有精品视频免费| 街头女战士在线观看网站| videossex国产| 色5月婷婷丁香| 精品久久久久久久久亚洲| 午夜免费鲁丝| 亚洲国产成人一精品久久久| 欧美亚洲 丝袜 人妻 在线| 18禁在线播放成人免费| 中文字幕亚洲精品专区| 黑丝袜美女国产一区| av在线播放精品| 中文字幕人妻熟人妻熟丝袜美| 亚洲第一区二区三区不卡| 国产男女内射视频| 99热6这里只有精品| 大香蕉久久网| 97超视频在线观看视频| 国产精品99久久99久久久不卡 | 亚洲精品国产色婷婷电影| 黄色欧美视频在线观看| 人妻一区二区av| 一边亲一边摸免费视频| 老司机亚洲免费影院| 性高湖久久久久久久久免费观看| 国产精品国产三级国产av玫瑰| 国产精品国产三级国产专区5o| 欧美xxⅹ黑人| 国产亚洲最大av| 亚洲人成网站在线播| 婷婷色麻豆天堂久久| 狂野欧美激情性bbbbbb| 男的添女的下面高潮视频| 亚洲欧美中文字幕日韩二区| 亚洲av日韩在线播放| av不卡在线播放| 你懂的网址亚洲精品在线观看| 亚洲婷婷狠狠爱综合网| 免费av不卡在线播放| 男男h啪啪无遮挡| 欧美激情极品国产一区二区三区 | 天天操日日干夜夜撸| 亚洲欧美日韩卡通动漫| 美女中出高潮动态图| 深夜a级毛片| 麻豆成人午夜福利视频| 国产女主播在线喷水免费视频网站| 男人和女人高潮做爰伦理| 欧美xxⅹ黑人| 在线 av 中文字幕| 国产女主播在线喷水免费视频网站| 亚洲综合精品二区| 免费观看在线日韩| 插阴视频在线观看视频| av.在线天堂| 亚洲av免费高清在线观看| 寂寞人妻少妇视频99o| 精品一区二区三区视频在线| 亚洲av日韩在线播放| 成年人午夜在线观看视频| 成人毛片60女人毛片免费| 亚洲va在线va天堂va国产| 肉色欧美久久久久久久蜜桃| 久久国内精品自在自线图片| 国产欧美亚洲国产| 色视频在线一区二区三区| 国产伦在线观看视频一区| 日韩强制内射视频| 成人午夜精彩视频在线观看| 国产精品三级大全| 免费人成在线观看视频色| 国产男女内射视频| 国产淫语在线视频| 精品久久久久久久久av| 又爽又黄a免费视频| 亚洲天堂av无毛| 在线亚洲精品国产二区图片欧美 | 国产熟女欧美一区二区| 国产综合精华液| 男女无遮挡免费网站观看| 精华霜和精华液先用哪个| 精品人妻熟女av久视频| 日本黄色片子视频| 亚洲电影在线观看av| 人人妻人人添人人爽欧美一区卜| 国产日韩欧美亚洲二区| 日日啪夜夜撸| 国产片特级美女逼逼视频| 夫妻性生交免费视频一级片| 午夜久久久在线观看| 内地一区二区视频在线| 亚洲美女黄色视频免费看| 久久精品夜色国产| 男女免费视频国产| 能在线免费看毛片的网站| 大香蕉久久网| 亚洲情色 制服丝袜| 日本91视频免费播放| 搡女人真爽免费视频火全软件| 亚洲成人一二三区av| 国产精品偷伦视频观看了| 99久国产av精品国产电影| 日韩,欧美,国产一区二区三区| 亚洲内射少妇av| 老女人水多毛片| 九九久久精品国产亚洲av麻豆| 国产精品国产三级国产专区5o| 亚洲精品aⅴ在线观看| 校园人妻丝袜中文字幕| 80岁老熟妇乱子伦牲交| 五月玫瑰六月丁香| 观看免费一级毛片| 国产精品福利在线免费观看| a 毛片基地| 国产精品久久久久久久电影| 91精品国产国语对白视频| 99国产精品免费福利视频| 黄色怎么调成土黄色| 人人妻人人看人人澡| 高清av免费在线| 在线观看免费视频网站a站| av一本久久久久| 精品人妻熟女毛片av久久网站| 卡戴珊不雅视频在线播放| 在线天堂最新版资源| 国产中年淑女户外野战色| 22中文网久久字幕| 免费在线观看成人毛片| 日韩中字成人| 超碰97精品在线观看| 亚洲精品日韩av片在线观看| 国产精品伦人一区二区| 欧美日韩精品成人综合77777| 麻豆精品久久久久久蜜桃| 22中文网久久字幕| 精品人妻熟女av久视频| 亚洲一区二区三区欧美精品| 下体分泌物呈黄色| 欧美精品一区二区大全| 春色校园在线视频观看| 日韩熟女老妇一区二区性免费视频| 在线观看免费高清a一片| 女性生殖器流出的白浆| 精品国产国语对白av| 日本-黄色视频高清免费观看| 亚洲av免费高清在线观看| 国产女主播在线喷水免费视频网站| 国产淫片久久久久久久久| 亚洲av欧美aⅴ国产| 少妇 在线观看| 自拍偷自拍亚洲精品老妇| 欧美3d第一页| 草草在线视频免费看| 亚洲精品一区蜜桃| 日日撸夜夜添| 日韩精品免费视频一区二区三区 | 午夜福利,免费看| 精品少妇内射三级| 三级国产精品欧美在线观看| 三级国产精品片| 日本vs欧美在线观看视频 | av一本久久久久| 国产成人精品福利久久| 女性被躁到高潮视频| 国产午夜精品久久久久久一区二区三区| 亚洲av在线观看美女高潮| 五月玫瑰六月丁香|