• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于二進制蜉蝣優(yōu)化的特征選擇及文本聚類算法

    2023-05-21 04:02:44高新成周中雨王莉利邵國銘
    吉林大學學報(理學版) 2023年3期
    關(guān)鍵詞:蜉蝣二進制特征選擇

    高新成,周中雨,王莉利,邵國銘,張 強

    (1.東北石油大學 現(xiàn)代教育技術(shù)中心,黑龍江 大慶 163318; 2.東北石油大學 計算機與信息技術(shù)學院,黑龍江 大慶 163318)

    0 引 言

    文本聚類是將給定對象的集合劃分為不同子集的過程,目標是使每個子集內(nèi)部的元素盡量相似,不同子集間的元素盡量迥異,其在文本挖掘中應用廣泛.空間矢量模型VSM(vector space model)是文本數(shù)據(jù)挖掘的常用模型,其通過把詞條變成一維空間向量便于進行空間向量計算.因此,聚類效果主要受特征維度[1]大小和冗余特征的影響,文本特征中存在冗余特征,無監(jiān)督特征選擇是選取非冗余特征,使聚類效果得到明顯提升.

    傳統(tǒng)的特征選擇方式有文檔頻率DF、互信息MI、卡方檢驗CHI和信息增益,這些方式均存在局限性且特征選擇后的精度較低問題.目前特征選擇的目標有兩個: 一是基于特征選擇后聚類效果得到提升; 二是如何獲得最多有用的文本特征[2-3].因此,本文設(shè)計一種基于二進制蜉蝣算法優(yōu)化的特征選擇及文本聚類算法,首先對文本特征進行選擇,選擇出最優(yōu)子集并把特征選擇的最優(yōu)解作為K-means++算法的輸入,得到最優(yōu)的聚類效果.

    目前已有的特征選擇方法主要有3種: 過濾法、嵌入法和封裝法.過濾法是一種基于數(shù)學的統(tǒng)計方法,其特征選擇方法與后面的模型訓練分開,聚類效果較差; 嵌入法是將學習器訓練過程與特征選擇過程融為一體,二者在同一優(yōu)化過程中完成,在學習器訓練過程中自動進行特征選擇[4],但參數(shù)設(shè)置需要較深的背景知識,不利于實際推廣; 封裝法利用搜索策略尋找優(yōu)質(zhì)特征子集,并基于學習算法得到優(yōu)質(zhì)特征子集,是直接面向算法優(yōu)化,不需要太多的知識,也是最常用的特征選擇方法.

    元啟發(fā)式算法已廣泛應用于最優(yōu)化問題求解中,且已被應用到文本挖掘領(lǐng)域中特征選擇的求解問題[5-6],主要包括一些智能優(yōu)化算法,如蟻群算法、遺傳算法、粒子群優(yōu)化算法、野草算法等.這類問題通過迭代的方式不斷去搜索最優(yōu)解.劉占峰等[7]提出了一種基于粒子群優(yōu)化的模糊粗糙集和實例聯(lián)合選擇算法,算法用于特征和實例聯(lián)合選擇任務中識別高質(zhì)量的模糊粗糙雙約簡集,通過ε-雙約簡的適應度函數(shù)評估約簡集的質(zhì)量,并把粒子群算法用于搜索過程中,實現(xiàn)特征的約減與精準分類; Chen等[8]用混沌蟻獅算法與特征選擇模型結(jié)合并對文本特征進行篩選,在11個基準函數(shù)上利用3個文本數(shù)據(jù)集和其他4種分類算法比較,該方法能減少文本特征,具有較好的分類效果; 張陽等[9]提出了一種基于Word2Vec詞嵌入和高維生物基因選擇遺傳算法的文本特征選擇方法,對高維詞向量模擬基因表達方式進行迭代進化,用Word2vec把文本轉(zhuǎn)換成基因的詞向量,最后基于遺傳算法搜索策略,在特征縮減率和文本聚類精度方面性能良好; Mahdieh等[10]提出了一種多目標相對判別準則(MORDC),平衡了最小冗余特征及與目標最大相關(guān)的特征,并采用多目標進化框架,通過解空間進行搜索文本特征,該方法具有較好的分類性能; 王琛等[11]把灰狼尋找食物的過程模擬成特征選擇的過程,對特征子集合并然后交叉,選出最優(yōu)的子集,最后得到特征子集與多目標的K-means算法進行融合,經(jīng)多方面評估性能良好.因此,元啟發(fā)式算法在縮減特征數(shù)量與優(yōu)質(zhì)特征選擇上效果較好,但以上早期的智能群體算法尋優(yōu)能力不強,且收斂速度較慢,與過濾的方法相結(jié)合效果也不明顯.而蜉蝣算法(mayfly algorithm,MA)是一種結(jié)合粒子群優(yōu)化算法(particle swarm optimization,PSO)[12]、遺傳算法(genetic algorithm,GA)[13]、螢火蟲算法(firefly algorithm,FA)[14]等優(yōu)點的群體智能優(yōu)化算法,具有極強的尋優(yōu)能力,但受限于解決連續(xù)型問題.因此,本文將傳統(tǒng)蜉蝣算法改進為解決離散型問題的蜉蝣優(yōu)化算法,即二進制蜉蝣優(yōu)化算法(MOMA).該算法對傳統(tǒng)二進制位置更新公式進行改進,克服了局部尋優(yōu)能力弱的缺點,并提出新的交配與變異操作,提高了全局尋優(yōu)能力.

    1 算法設(shè)計

    為更好實現(xiàn)聚類效果,本文首先利用二進制蜉蝣優(yōu)化算法對文本特征進行選擇,獲得去除冗余特征的最優(yōu)子集,然后在最優(yōu)特征子集上進行聚類分析.算法過程分3個階段: 第一階段構(gòu)建向量空間模型,其中涉及必要的文本預處理步驟; 第二階段用二進制蜉蝣優(yōu)化算法對特征進行選擇,得到初始的信息化特征子集; 第三階段在最優(yōu)特征子集的基礎(chǔ)上[15],利用文本聚類算法K-means++進行聚類,得到文檔最終聚類效果.

    1.1 構(gòu)建空間向量模型

    構(gòu)建空間向量模型主要分4步: 1) 分詞,根據(jù)空格和標點符號把文本和文檔分割成詞語和詞條,并移除空格; 2) 去除停用詞,去除小權(quán)重、高頻率詞語,如果這些詞語存在于文檔中將會影響聚類的結(jié)果; 3) 提取詞干,去除詞匯的前綴和后綴,轉(zhuǎn)換為相同詞根,并將相同詞定義為一個特征,該步驟可進行提詞器操作; 4) 計算文本詞條權(quán)重,當詞條在不同文檔中的頻率較高時,可利用該詞區(qū)分文檔內(nèi)容,且詞條應被賦予更高的權(quán)重值.目前,應用的主要詞條權(quán)重計算方法為統(tǒng)計分析算法中的逆文檔頻率指數(shù)TF-IDF方法,計算公式為

    (1)

    其中wi,j為文檔i中詞條j的權(quán)重,TF(i,j)為文檔i中詞條j的頻率,IDF(i,j)為倒數(shù)文檔頻率,n為文檔數(shù)量,DF(j)為包括特征j的文檔數(shù)量.構(gòu)造空間向量模型VSM如下:

    (2)

    1.2 基于二進制蜉蝣優(yōu)化算法的特征選擇策略

    1.2.1 特征選擇模型

    特征選擇的目標是選出具有明顯區(qū)分性的樣本特征,而文本特征選擇就是選出代表文檔主要含義的特征詞.假設(shè)給定文本特征集合為F,表示為Fi={fi,1,fi,2,…,fi,j,…,fi,t},其中t表示預處理后唯一文本特征數(shù)量,i為文檔數(shù)量.FS經(jīng)過特征選擇算法選擇后選出新的特征子集FSi={fsi,1,fsi,2,fsi,j,…,fsi,m},其中m為選擇后的特征長度,fsi,j∈{1,0},j=1,2,…,m.若fsi,j=1,則表明文檔中所選特征j為優(yōu)質(zhì)特征; 若fsi,j=0,則表明文檔中所選特征j為無用特征.

    1.2.2 解表示

    在用二進制蜉蝣算法對文本特征進行選擇過程中,每個雄雌蜉蝣的位置代表一個特征文檔的子集,如表1所示.蜉蝣種群包括蜉蝣的位置集合,其中位置集合由二進制0或1表示,每個蜉蝣的位置表示文檔是否選擇其特征.蜉蝣第j個位置表示文檔第j個特征的位置.

    表1 特征選擇的解表示

    該算法從隨機解開始搜索,不斷地選擇高質(zhì)量的特征并改進蜉蝣種群總體以獲得全局最優(yōu)解,最優(yōu)蜉蝣的位置表示最優(yōu)解和新文檔的子集.在給定的數(shù)據(jù)集中,每個特征都被視為一個搜索空間.表1中假設(shè)蜉蝣位置值為1,則表示該位置的特征為信息特征; 蜉蝣位置值是0,則表示特征j會被選擇為非信息特征.

    1.2.3 適應度函數(shù)

    適應度函數(shù)用于評價算法的候選解,每一代都要計算候選解的適應度值.若解的適應度值較大,則該解用于替換當前較小適應度值的解.平方誤差(MAD)是特征選擇領(lǐng)域常用的度量方式,本文使用MAD作為特征選擇的適應度函數(shù),并作為評判蜉蝣位置的目標函數(shù).MAD可由均值與Xi,j的中值之差表示:

    (3)

    (4)

    1.3 二進制蜉蝣優(yōu)化算法

    受蜉蝣生物活動啟發(fā),Zervoudakis等[16]提出了蜉蝣算法,每只蜉蝣在搜索空間中的位置表示問題的解.算法工作原理: 隨機產(chǎn)生兩組蜉蝣種群,其中分別表示雄性和雌性蜉蝣種群.每只蜉蝣被隨機放置在問題空間中,作為由d維向量表示的候選解x=(x1,x2,…,xd),并結(jié)合目標函數(shù)f(x)對其性能進行評估.蜉蝣的速度v=(v1,v2,…,vd)定義為其位置的變化,每只蜉蝣的飛行方向是個體和社會飛行經(jīng)驗的動態(tài)交互作用.每只蜉蝣都會調(diào)整自己的軌跡,使其向個人最佳位置(pbest)以及整個過程中蜉蝣所獲得的最佳位置(gbest)飛行.算法偽代碼如下:

    算法1蜉蝣優(yōu)化算法特征選擇算法MA.

    Initializing the male mayfly populationxi(i=1,2,…,N) and speedvmi//初始化雄蜉蝣種群位置及速度

    Initializing the female mayfly populationyi(i=1,2,…,M) and speedvFi//初始化雌蜉蝣種群位置及速度

    Evaluate the fitness values of each mayfly//評估每只蜉蝣的適應度

    Find the global optimal solutiongbest//發(fā)現(xiàn)全局最好的蜉蝣位置

    Do While the termination criteria are not met//為滿足終止規(guī)則

    Update male and female mayfly speed reconciliation//更新雄性和雌性蜉蝣的速度和位置

    Evaluation of solution//評估解

    Mayflies sorting//蜉蝣排序

    Mayflies mate//蜉蝣交配

    Evaluation of offspring//評估子代

    Randomly divide the offspring into male and female//隨機將子代分為雄性與雌性

    Updatepbestandgbest//更新全局最優(yōu)解與蜉蝣歷史位置最優(yōu)解

    End while.

    每只蜉蝣位置表示的候選解通過式(3)定義的適應度函數(shù)進行評估.在MA算法中,解包含單個實體(特征),且算法不斷對蜉蝣位置進行評估.蜉蝣當前的位置按適應度函數(shù)進行評估,全局最好的蜉蝣由自身速度更新位置,其余雄蜉蝣按全局最好位置和歷史最佳位置更新位置,而雌蜉蝣由雄蜉蝣位置更新速度與方向.直到取得表示問題最優(yōu)解的蜉蝣位置.

    二進制蜉蝣個體更新策略如下: 雄蜉蝣位置更新公式為

    (5)

    雄蜉蝣移動速率更新公式為

    (6)

    實際上,為繁衍雌蜉蝣會一直向雄蜉蝣運動,吸引過程取決于解的質(zhì)量,雌蜉蝣的位置更新公式為

    (7)

    速度更新公式為

    (8)

    針對傳統(tǒng)蜉蝣算法僅解決連續(xù)性問題,不適用于特征選擇的離散性問題,本文借鑒劉建華等[18]提出的基于改進二進制粒子群算法的優(yōu)化思路,在保持速度公式不變的前提下,對雄雌蜉蝣的速度概率映射函數(shù)進行重新定義,表示為

    (9)

    圖1 映射概率函數(shù)值Fig.1 Mapping probability function values

    (10)

    (11)

    由于最初雄蜉蝣位置的舞蹈系數(shù)d很大,導致映射的概率很大,因此位置改變概率也會變大,這種情況下,最優(yōu)雄蜉蝣位置容易變化,可增強算法全局的搜索能力.隨著迭代次數(shù)的增加,最優(yōu)的雄蜉蝣速度逐漸變小,位置變化概率也會變小,此時全局搜索能力變?nèi)?局部探測能力變強.對于非最優(yōu)雄蜉蝣,速度的更新是由最優(yōu)位置和歷史最優(yōu)位置決定的.當速度為0時,最優(yōu)蜉蝣和歷史最優(yōu)位置相等,位置一般不需要改變.當速度為負時,利用式(10)進行位置更新,此時最優(yōu)雄蜉蝣位置和歷史最優(yōu)位置很可能為0,雄蜉蝣的位置很可能為1,因此位置需大概率變?yōu)?.當速度為正時,利用式(11)對位置進行更新,此時最優(yōu)雄蜉蝣位置可能為1,而雄蜉蝣的位置很可能是0,所以位置需要最大概率變?yōu)?.對于雌蜉蝣,其位置由雄蜉蝣的位置確定.當優(yōu)于對應的雄蜉蝣位置時,雌蜉蝣根據(jù)自身的速度進行變化,隨著迭代次數(shù)的增加,雌蜉蝣速度趨于0,位置改變概率也逐漸變小,這種情況下雌蜉蝣位置小概率會改變.當劣于對應的雄蜉蝣位置時,雌蜉蝣的位置由雄蜉蝣的位置更新,當雌蜉蝣速度為負時,對應的雄蜉蝣位置很大可能為0,而雌蜉蝣位置很大可能是1,此時雌蜉蝣的位置可能為0.當雌蜉蝣速度為正時,對應的雄蜉蝣位置很可能為1,而雌蜉蝣位置很可能為0,所以雌蜉蝣的位置可能變?yōu)?.

    1.4 進化策略

    1.4.1 交配操作

    蜉蝣交配根據(jù)解的質(zhì)量將同等級的雄雌蜉蝣進行交配,產(chǎn)生兩個后代.為解決原始蜉蝣算法只能求解連續(xù)值的問題,現(xiàn)對蜉蝣的交叉策略進行改變.本文采用多點交叉的方式,隨機生成初始交叉點和交叉結(jié)束點,如圖2所示,[1,0,0,1,1]為雄蜉蝣位置,[0,0,1,0,0]為雌蜉蝣位置,[0]和[1]為雄、雌蜉蝣隨機生成的初始交叉點,[1]和[0]為雄、雌蜉蝣隨機生成的交叉結(jié)束點,雄、雌蜉蝣通過交換選中區(qū)間完成交叉,最終生成兩個子代.

    圖2 交配操作示意圖Fig.2 Schematic diagram of mating operation

    1.4.2 變異操作

    原始的蜉蝣算法變異是高斯近似變異,應用于連續(xù)值問題的求解,并不適用于二進制變異策略.本文采用基本位變異方法,該方法隨機生成一個(0,1)的隨機數(shù),當隨機數(shù)小于變異概率時進行變異,為增加種群的多樣性,采用多點變異的方式,如圖3所示.由圖3可見,蜉蝣位置第一個隨機選[0]為變異初始點,第二個[0]為變異結(jié)束點,變異操作即對變異區(qū)間的數(shù)取反.原始蜉蝣位置由[1,0,1,1,0,1]變?yōu)閇1,1,0,0,1,1].

    圖3 變異操作示意圖Fig.3 Schematic diagram of mutation operation

    1.5 基于K-means++算法聚類分析

    K-means算法[19]是目前常用的聚類算法之一,已在許多領(lǐng)域中得到成功應用,實用性良好,但傳統(tǒng)的K-means算法存在聚類中心參數(shù)難以確定且聚類結(jié)果不穩(wěn)定的問題.本文利用提出的二進制蜉蝣優(yōu)化算法對K-means++算法進行聚類優(yōu)化.K-means++算法采用一定策略選擇質(zhì)心,其中輪盤賭算法是最簡單有效的策略.在輪盤賭算法中,第m個質(zhì)心的選取取決于選取數(shù)據(jù)點距離第(m-1)個質(zhì)心的距離,度量距離越大則越有可能被選取.假設(shè)K-means++算法的輸入樣本集為D={x1,x2,…,xm},聚類的簇數(shù)為k,則經(jīng)過N次迭代后算法停止.K-means++算法的運行步驟如下.

    1) 找出k個聚類中心點: 從文本數(shù)據(jù)集D中隨機選出一個樣本作為初始的質(zhì)心向量c1,計算每只樣本與最近的質(zhì)心向量距離和Sum(D(x)),取一個能位于Sum(D(x))中的隨機值Random,并令Random-=D(x),直到其值≤0,此時的點便可作為下一個質(zhì)心點.重復上述步驟,直到k個聚類中心被選出來,k個聚類中心可記作{c1,c2,…,ck}.

    2) 利用這k個初始聚類中心運行K-means算法,對于n=1,2,…,N進行如下操作:

    ① 將簇劃分Ci,初始化為Ci={ci}(i=1,2,…,k);

    ② 對i=1,2,…,m分別計算樣本xi和各質(zhì)心向量cj(j=1,2,…,k)的距離ci,j,其中ci,j=‖xi-cj‖,將最小的xi標記為di,j所對應的類別j,然后更新C=Cj∪{xi};

    ④ 如果k個質(zhì)心的位置都未發(fā)生變化,則終止算法,轉(zhuǎn)步驟3).

    3) 輸出結(jié)果簇劃分C={C1,C2,…,Ck}.

    2 實驗對比及分析

    本文用Python編寫二進制蜉蝣優(yōu)化算法,用該算法進行文本特征選擇[20],尋求擁有更多有用特征的最優(yōu)子集,利用K-means++算法對選擇的特征進行文本聚類,并通過實驗驗證基于二進制蜉蝣算法特征選擇后的聚類效果.

    2.1 測試文本數(shù)據(jù)集

    為驗證算法的穩(wěn)定性和適應性,本文采用智能實驗室LABIC(http://sites.labic.icme.usp.br/text_collections/)提供的5種基準數(shù)據(jù)集進行測試,測試文檔數(shù)據(jù)集信息列于表2.

    表2 測試文檔數(shù)據(jù)集信息

    2.2 算法評估指標

    準確率(Accuracy)、查準率(Precision)、查全率(Recall)和F度量(F-measure)是文本聚類常用的指標,為驗證二進制蜉蝣優(yōu)化算法的效果,引入特征選擇的數(shù)量和適應度值與迭代次數(shù)的關(guān)系.

    1) 準確率.準確率用于計算真實樣本被分為正確類別的比例,計算公式為

    (13)

    其中K表示總聚類數(shù)量,p(i,j)表示聚類j中分類i的精確值.

    2) 查準率.查準率P表示相關(guān)文檔占所有聚類中i文檔總量的比例,計算公式為

    (14)

    3) 查全率.查全率R表示相關(guān)文檔實際數(shù)量占所有文檔的比例,計算公式為

    (15)

    其中R(i,j)表示聚類j中分類i的召回值,ni表示分類i中的實際樣本數(shù)量.

    4)F度量.F度量根據(jù)查準率P和查全率R計算,其中F是0~1的小數(shù),其值越接近1效果越好,聚類j中分類i的F度量計算公式為

    (16)

    所有聚類的F-measure可表示為

    (17)

    5) 特征數(shù)量.該指標表示基于元啟發(fā)式算法對特征選擇后得到的特征個數(shù),特征數(shù)量的選擇影響文本聚類效率與準確性.

    6) 收斂性能.該指標用于衡量算法的尋優(yōu)能力,本文通過計算進行特征選擇的適應度函數(shù)值評估算法的性能,算法收斂值即通過若干次迭代后的最優(yōu)適應度值.

    7) 收斂時間.收斂時間是指進行特征選擇和文本聚類所用的總時間(s),該指標用于衡量算法的收斂速度.

    2.3 實驗結(jié)果分析

    2.3.1 文本特征縮減率對比

    在5個測試文本數(shù)據(jù)集上,用傳統(tǒng)元啟發(fā)式算法和本文提出的二進制蜉蝣優(yōu)化算法得到的特征選擇情況對比結(jié)果如圖4所示.由圖4可見: 在特征縮減方面,遺傳算法特征縮減率約為50%,表現(xiàn)較差; 二進制粒子群優(yōu)化算法特征縮減率為50%~70%,表現(xiàn)一般; 二進制蜉蝣算法的特征縮減率達到75%~80%,相比于前兩種算法,二進制蜉蝣算法對特征縮減率的效果更好,表明二進制蜉蝣算法和特征選擇模型的結(jié)合,可降低冗余性特征,并降低維度空間.此外,二進制蜉蝣算法在5種數(shù)據(jù)集中保持穩(wěn)定且領(lǐng)先的特征縮減率,也說明其具有良好的普適性和廣泛性.

    2.3.2 算法收斂性對比

    MOMA,GA和PSO三種算法的復雜度對比列于表3.由表3可見,當種群個數(shù)和迭代次數(shù)為N時,3種啟發(fā)式算法的時間復雜度理論上均為O(n2),但在實際運行過程中,PSO和MOMA算法尋優(yōu)具有方向性,因此這兩種算法運行中所用的時間比GA算法低.而MOMA算法與PSO算法相比,前者的尋優(yōu)能力較強,其迭代次數(shù)通常比N小,因此MOMA算法在實際運行過程中時間小于GA算法與PSO算法.在空間復雜度上,由于GA算法是無記憶性算法,只需要得到種群中最大的適應度值,因此其空間復雜度是O(1),而PSO和MOMA算法要記錄個體的當前位置與種群的最佳位置,且所占空間和種群大小有關(guān),因此其空間復雜度為O(n).由于種群個數(shù)通常較小,所以3種算法分配的內(nèi)存空間差距較小.

    表3 不同算法的復雜度對比

    5個數(shù)據(jù)集基于3種元啟發(fā)式算法在特征選擇方面的算法收斂性實驗結(jié)果如圖5所示.通過計算適應度函數(shù)值評價算法的收斂性能,算法收斂即通過若干次迭代得到最優(yōu)適應度的值.由圖5可見,二進制蜉蝣算法約在300代收斂,而其他兩種算法約在500代收斂,因此二進制蜉蝣算法收斂性能較好.在文本特征選擇中,二進制蜉蝣算法得到的特征結(jié)果也具有較高的適應度,表明其尋優(yōu)能力較好,再次證明了二進制蜉蝣算法的有效性.

    圖5 不同算法在5個數(shù)據(jù)集上的收斂性對比Fig.5 Comparison of convergence of different algorithms on 5 datasets

    2.3.3 算法精度對比

    3種算法在5個公共數(shù)據(jù)集上得到的類準確率、查準率、查全率和F度量值的指標對比結(jié)果列于表4.由表4可見:K-means++的聚類評估指標較其他算法差,因為K-means++算法未經(jīng)過特征選擇機制,文本中存在大量的非信息化特征; 經(jīng)過元啟發(fā)式算法進行選擇后,聚類精度得到一定提升; 二進制蜉蝣算法在5個指標上明顯優(yōu)于其他兩種傳統(tǒng)算法.因為二進制蜉蝣算法是在螢火蟲、遺傳和粒子群優(yōu)化算法基礎(chǔ)上改進而來的,其尋優(yōu)能力強,能選取表示文檔意義的適應度值,所以精度顯著提高.

    2.3.4 算法收斂時間對比

    不同算法在進行文本特征選擇時的收斂時間對比結(jié)果如圖6所示.時間越短說明算法運行的速度越快,3種算法在5個數(shù)據(jù)集上進行測試的結(jié)果表明,在進行特征選擇過程中,相比其他傳統(tǒng)的遺傳和粒子群優(yōu)化算法,二進制蜉蝣算法運行時間短,運行速度較快.此外,在特征選擇時,算法的運行時間長短與文本的特征數(shù)目和文檔數(shù)量有關(guān),文檔數(shù)目越多,特征越多,進行特征選擇的時間越長.

    表4 不同算法精度的對比

    圖6 不同算法收斂時間的對比Fig.6 Comparison of convergence time of different algorithms

    綜上所述,針對文本冗余特征導致聚類精度較低的問題,本文提出了一種基于二進制蜉蝣優(yōu)化的特征選擇算法(MOMA).首先對文本進行分詞、去停用詞以及計算文本權(quán)重構(gòu)造向量空間模型; 然后改進蜉蝣位置更新和交叉變異策略,并結(jié)合特征模型選出優(yōu)質(zhì)特征,將其輸入到K-means++算法中; 最后利用5個公開數(shù)據(jù)集進行實驗.實驗結(jié)果表明,本文提出的二進制蜉蝣優(yōu)化的特征選擇算法能有效選取信息化特征,大幅度縮減特征維度,聚類效率較好.

    猜你喜歡
    蜉蝣二進制特征選擇
    《蜉蝣》
    用二進制解一道高中數(shù)學聯(lián)賽數(shù)論題
    有趣的進度
    二進制在競賽題中的應用
    黃昏的蜉蝣
    Kmeans 應用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    聯(lián)合互信息水下目標特征選擇算法
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    基于二元搭配詞的微博情感特征選擇
    計算機工程(2014年6期)2014-02-28 01:26:36
    一個生成組合的新算法
    伦理电影免费视频| 国产亚洲精品久久久久5区| 日本av免费视频播放| 亚洲综合色网址| 国产免费视频播放在线视频| 婷婷成人精品国产| 久久久欧美国产精品| 国产精品av久久久久免费| 桃红色精品国产亚洲av| 免费av中文字幕在线| 看免费av毛片| 日本黄色视频三级网站网址 | 国产福利在线免费观看视频| 久久久久久亚洲精品国产蜜桃av| 国产成人免费无遮挡视频| 日本黄色视频三级网站网址 | 这个男人来自地球电影免费观看| 正在播放国产对白刺激| av免费在线观看网站| 免费黄频网站在线观看国产| 久久人妻福利社区极品人妻图片| 国产单亲对白刺激| 欧美性长视频在线观看| 亚洲国产看品久久| 99国产精品一区二区蜜桃av | 午夜福利影视在线免费观看| 免费黄频网站在线观看国产| 国产伦人伦偷精品视频| av片东京热男人的天堂| 美国免费a级毛片| 亚洲国产成人一精品久久久| 一二三四社区在线视频社区8| 亚洲精华国产精华精| 成年女人毛片免费观看观看9 | 一边摸一边抽搐一进一出视频| 99久久人妻综合| 精品乱码久久久久久99久播| 久久九九热精品免费| 国产片内射在线| 激情在线观看视频在线高清 | 51午夜福利影视在线观看| 操出白浆在线播放| 亚洲av成人一区二区三| 亚洲美女黄片视频| 狠狠婷婷综合久久久久久88av| 视频区图区小说| 国产精品电影一区二区三区 | 一二三四社区在线视频社区8| 最新的欧美精品一区二区| 色综合欧美亚洲国产小说| 天天躁日日躁夜夜躁夜夜| 韩国精品一区二区三区| 色94色欧美一区二区| 国产熟女午夜一区二区三区| 99国产精品99久久久久| 国产男靠女视频免费网站| www.999成人在线观看| 欧美日韩亚洲综合一区二区三区_| 亚洲精品中文字幕一二三四区 | 亚洲全国av大片| 国产精品国产av在线观看| 69av精品久久久久久 | 人妻 亚洲 视频| 久久99一区二区三区| 欧美黄色淫秽网站| 欧美日韩国产mv在线观看视频| 成人av一区二区三区在线看| 十八禁网站网址无遮挡| 99精品久久久久人妻精品| 亚洲 欧美一区二区三区| 麻豆成人av在线观看| 天天影视国产精品| 男女之事视频高清在线观看| 十分钟在线观看高清视频www| 国产av又大| 91大片在线观看| 少妇 在线观看| 午夜福利乱码中文字幕| 亚洲七黄色美女视频| 中文字幕色久视频| 下体分泌物呈黄色| 1024香蕉在线观看| av福利片在线| 在线观看免费高清a一片| 久久久久久久国产电影| 国产精品av久久久久免费| 日韩大片免费观看网站| 女性被躁到高潮视频| 搡老岳熟女国产| 黄频高清免费视频| 午夜激情久久久久久久| 欧美精品亚洲一区二区| 欧美老熟妇乱子伦牲交| 成人黄色视频免费在线看| 人人妻人人添人人爽欧美一区卜| 三上悠亚av全集在线观看| 亚洲精品美女久久av网站| 久久午夜亚洲精品久久| 色视频在线一区二区三区| 不卡一级毛片| 成人亚洲精品一区在线观看| 老司机午夜福利在线观看视频 | 国产精品.久久久| 免费在线观看黄色视频的| 高潮久久久久久久久久久不卡| 精品国产超薄肉色丝袜足j| 日韩欧美三级三区| 国产一区二区在线观看av| 精品国产国语对白av| 男女午夜视频在线观看| 老鸭窝网址在线观看| 多毛熟女@视频| 变态另类成人亚洲欧美熟女 | 色播在线永久视频| 国产不卡一卡二| 日韩人妻精品一区2区三区| 亚洲精品国产色婷婷电影| 黄网站色视频无遮挡免费观看| 人人妻人人爽人人添夜夜欢视频| 午夜老司机福利片| 国产精品久久久久久精品电影小说| 精品视频人人做人人爽| 中国美女看黄片| 精品一区二区三区av网在线观看 | 亚洲精华国产精华精| 国产精品一区二区在线不卡| 亚洲全国av大片| 99国产综合亚洲精品| 99热网站在线观看| 一边摸一边抽搐一进一出视频| 他把我摸到了高潮在线观看 | 久久精品国产a三级三级三级| 成在线人永久免费视频| 精品午夜福利视频在线观看一区 | 一夜夜www| 精品午夜福利视频在线观看一区 | 51午夜福利影视在线观看| 国产精品久久电影中文字幕 | 自线自在国产av| 99精国产麻豆久久婷婷| 黑人猛操日本美女一级片| 女同久久另类99精品国产91| 女人久久www免费人成看片| 成人国产av品久久久| 久久人妻福利社区极品人妻图片| 久久久久精品国产欧美久久久| 亚洲三区欧美一区| 女人久久www免费人成看片| 桃花免费在线播放| 女同久久另类99精品国产91| 岛国毛片在线播放| 欧美成人免费av一区二区三区 | 久久久久久久国产电影| 国产精品久久久久久人妻精品电影 | 欧美日韩黄片免| 国产精品.久久久| 亚洲免费av在线视频| 久久久久网色| 欧美黄色片欧美黄色片| 少妇的丰满在线观看| 午夜激情av网站| 一本一本久久a久久精品综合妖精| 99热国产这里只有精品6| 精品久久久精品久久久| 日韩视频在线欧美| 精品熟女少妇八av免费久了| 一本综合久久免费| 免费在线观看完整版高清| 日本一区二区免费在线视频| 手机成人av网站| 精品乱码久久久久久99久播| 亚洲免费av在线视频| 九色亚洲精品在线播放| 国产三级黄色录像| 国产精品久久电影中文字幕 | 波多野结衣av一区二区av| 天天操日日干夜夜撸| 成人影院久久| 国产亚洲精品第一综合不卡| 亚洲精品自拍成人| 亚洲av成人一区二区三| 91麻豆精品激情在线观看国产 | 汤姆久久久久久久影院中文字幕| 女人爽到高潮嗷嗷叫在线视频| 无遮挡黄片免费观看| 久久天躁狠狠躁夜夜2o2o| 免费在线观看日本一区| h视频一区二区三区| 如日韩欧美国产精品一区二区三区| 精品少妇内射三级| av视频免费观看在线观看| 69精品国产乱码久久久| 亚洲午夜精品一区,二区,三区| a级片在线免费高清观看视频| 最黄视频免费看| 国产成+人综合+亚洲专区| 久久天堂一区二区三区四区| 狂野欧美激情性xxxx| 亚洲精品一卡2卡三卡4卡5卡| 十八禁网站网址无遮挡| 在线av久久热| 欧美成人午夜精品| 免费观看av网站的网址| 怎么达到女性高潮| 精品视频人人做人人爽| 三级毛片av免费| 手机成人av网站| 日本黄色日本黄色录像| 老鸭窝网址在线观看| 国产av国产精品国产| tube8黄色片| a在线观看视频网站| 9191精品国产免费久久| 欧美黄色片欧美黄色片| 亚洲第一欧美日韩一区二区三区 | 天天操日日干夜夜撸| 久久影院123| 韩国精品一区二区三区| 一级,二级,三级黄色视频| 亚洲精品久久午夜乱码| 日韩欧美一区视频在线观看| 国产一区二区在线观看av| 欧美日韩av久久| www.999成人在线观看| 桃花免费在线播放| 午夜激情av网站| 国产欧美日韩精品亚洲av| 一本—道久久a久久精品蜜桃钙片| 亚洲五月色婷婷综合| 女性生殖器流出的白浆| 黑人欧美特级aaaaaa片| 亚洲第一av免费看| 日韩有码中文字幕| 亚洲专区国产一区二区| 精品久久久久久久毛片微露脸| 久久精品国产99精品国产亚洲性色 | 久热这里只有精品99| 一进一出抽搐动态| 一级a爱视频在线免费观看| 人人妻人人澡人人爽人人夜夜| 欧美精品av麻豆av| 国产不卡一卡二| 三级毛片av免费| 变态另类成人亚洲欧美熟女 | 欧美日韩精品网址| 99国产综合亚洲精品| 两个人看的免费小视频| 在线观看免费视频网站a站| 成人黄色视频免费在线看| 亚洲一区中文字幕在线| 国产一区二区三区在线臀色熟女 | 国产精品久久电影中文字幕 | 久久精品国产亚洲av香蕉五月 | 大片免费播放器 马上看| 另类亚洲欧美激情| 亚洲国产av新网站| 久久国产精品影院| 国产福利在线免费观看视频| 91精品国产国语对白视频| 一区福利在线观看| 老司机午夜福利在线观看视频 | 桃红色精品国产亚洲av| 亚洲色图av天堂| 成人免费观看视频高清| 9色porny在线观看| 日韩欧美一区视频在线观看| av网站在线播放免费| 成人av一区二区三区在线看| 91国产中文字幕| 欧美性长视频在线观看| 久久久国产精品麻豆| 国产aⅴ精品一区二区三区波| 韩国精品一区二区三区| 超色免费av| 夜夜骑夜夜射夜夜干| 99re6热这里在线精品视频| 可以免费在线观看a视频的电影网站| 不卡一级毛片| 又大又爽又粗| 老司机亚洲免费影院| 女人久久www免费人成看片| 亚洲精品国产色婷婷电影| 欧美精品高潮呻吟av久久| 欧美日韩福利视频一区二区| 另类精品久久| 一边摸一边抽搐一进一小说 | 午夜福利欧美成人| 女人精品久久久久毛片| 老司机靠b影院| 久久亚洲真实| 免费日韩欧美在线观看| 老司机影院毛片| 久久人人爽av亚洲精品天堂| 另类亚洲欧美激情| 夫妻午夜视频| 丁香欧美五月| 久久精品国产99精品国产亚洲性色 | 国产欧美亚洲国产| 黑人欧美特级aaaaaa片| 日韩欧美一区二区三区在线观看 | 国产精品久久电影中文字幕 | 欧美激情 高清一区二区三区| 久久久久视频综合| 91成人精品电影| 欧美日韩视频精品一区| 国产亚洲av高清不卡| 男女免费视频国产| 久久精品亚洲精品国产色婷小说| 午夜福利免费观看在线| 免费一级毛片在线播放高清视频 | 国产亚洲精品一区二区www | e午夜精品久久久久久久| 国产成人欧美| 嫁个100分男人电影在线观看| 两性午夜刺激爽爽歪歪视频在线观看 | 日韩制服丝袜自拍偷拍| 女警被强在线播放| 亚洲精品中文字幕在线视频| 成年人黄色毛片网站| 侵犯人妻中文字幕一二三四区| 欧美激情高清一区二区三区| 亚洲欧美一区二区三区久久| 亚洲av电影在线进入| 人人妻人人添人人爽欧美一区卜| 高清视频免费观看一区二区| 国产aⅴ精品一区二区三区波| 一区福利在线观看| 国产男女内射视频| 欧美精品高潮呻吟av久久| aaaaa片日本免费| 久久婷婷成人综合色麻豆| 最新的欧美精品一区二区| 国产精品熟女久久久久浪| 国产av精品麻豆| 国产av国产精品国产| 亚洲久久久国产精品| svipshipincom国产片| 久久久国产欧美日韩av| 亚洲人成伊人成综合网2020| 91字幕亚洲| 别揉我奶头~嗯~啊~动态视频| 激情视频va一区二区三区| 亚洲国产欧美一区二区综合| 中文字幕精品免费在线观看视频| 91成年电影在线观看| 看免费av毛片| 国产欧美亚洲国产| 丁香六月欧美| 欧美激情极品国产一区二区三区| 我的亚洲天堂| 日本精品一区二区三区蜜桃| 怎么达到女性高潮| 国产在线视频一区二区| 91老司机精品| 丝袜喷水一区| 久久人妻福利社区极品人妻图片| 国产成人精品在线电影| 亚洲 欧美一区二区三区| 天堂动漫精品| 免费在线观看日本一区| 国产欧美亚洲国产| 少妇猛男粗大的猛烈进出视频| 欧美日本中文国产一区发布| 看免费av毛片| www.999成人在线观看| 久久人妻av系列| 欧美变态另类bdsm刘玥| svipshipincom国产片| 精品一品国产午夜福利视频| 国产精品 欧美亚洲| 国产又爽黄色视频| 国产亚洲欧美精品永久| 午夜福利欧美成人| 欧美另类亚洲清纯唯美| av在线播放免费不卡| 日韩中文字幕视频在线看片| 人人妻,人人澡人人爽秒播| 热99re8久久精品国产| 欧美日韩亚洲高清精品| 国产色视频综合| 精品少妇一区二区三区视频日本电影| a级毛片在线看网站| 一级黄色大片毛片| 欧美亚洲 丝袜 人妻 在线| 国产精品亚洲一级av第二区| 国产精品偷伦视频观看了| 成人特级黄色片久久久久久久 | 亚洲午夜精品一区,二区,三区| 纵有疾风起免费观看全集完整版| 水蜜桃什么品种好| 久久精品成人免费网站| 在线观看www视频免费| 在线观看免费日韩欧美大片| 女人被躁到高潮嗷嗷叫费观| 无人区码免费观看不卡 | 欧美中文综合在线视频| 国产不卡av网站在线观看| 中文字幕最新亚洲高清| 国产欧美日韩精品亚洲av| 国精品久久久久久国模美| 国产精品.久久久| 亚洲国产欧美网| 国产精品自产拍在线观看55亚洲 | 精品亚洲成国产av| 欧美一级毛片孕妇| 考比视频在线观看| 怎么达到女性高潮| 午夜福利在线免费观看网站| 我要看黄色一级片免费的| 满18在线观看网站| 国产精品免费视频内射| 亚洲五月婷婷丁香| 日韩免费av在线播放| 亚洲国产av新网站| 欧美在线黄色| 欧美大码av| 亚洲成av片中文字幕在线观看| 精品国产乱子伦一区二区三区| 亚洲精品美女久久久久99蜜臀| 国产成人av激情在线播放| 老汉色av国产亚洲站长工具| 黑人操中国人逼视频| 丝袜美腿诱惑在线| a级毛片黄视频| 一级,二级,三级黄色视频| 天堂俺去俺来也www色官网| 两性夫妻黄色片| 狠狠精品人妻久久久久久综合| 一区二区av电影网| 啦啦啦免费观看视频1| 欧美另类亚洲清纯唯美| 午夜福利,免费看| 中文字幕av电影在线播放| 精品久久久久久久毛片微露脸| 欧美 亚洲 国产 日韩一| 夜夜爽天天搞| 天堂俺去俺来也www色官网| 午夜精品久久久久久毛片777| 99久久人妻综合| 成年女人毛片免费观看观看9 | 国产三级黄色录像| 亚洲自偷自拍图片 自拍| 男女下面插进去视频免费观看| 一级黄色大片毛片| 精品熟女少妇八av免费久了| 精品免费久久久久久久清纯 | 精品国产一区二区三区四区第35| 搡老乐熟女国产| 捣出白浆h1v1| 丰满少妇做爰视频| 人成视频在线观看免费观看| 精品一区二区三区视频在线观看免费 | 日本五十路高清| 成人三级做爰电影| 亚洲成人国产一区在线观看| 在线观看免费高清a一片| 日韩欧美免费精品| 一级a爱视频在线免费观看| 制服诱惑二区| 丁香六月天网| 男女高潮啪啪啪动态图| 99在线人妻在线中文字幕 | 新久久久久国产一级毛片| 欧美一级毛片孕妇| 日韩欧美三级三区| 黑人操中国人逼视频| 99国产精品一区二区蜜桃av | 亚洲久久久国产精品| 丝袜美足系列| 天天操日日干夜夜撸| 精品国产超薄肉色丝袜足j| 国产精品秋霞免费鲁丝片| 国产真人三级小视频在线观看| 久久午夜综合久久蜜桃| 91成年电影在线观看| 女性被躁到高潮视频| 一区二区三区精品91| 欧美+亚洲+日韩+国产| 中文字幕色久视频| 亚洲,欧美精品.| 在线观看免费高清a一片| 精品免费久久久久久久清纯 | 日本精品一区二区三区蜜桃| 在线观看舔阴道视频| 69av精品久久久久久 | 成人国产av品久久久| 国产人伦9x9x在线观看| 成人亚洲精品一区在线观看| 下体分泌物呈黄色| 久久香蕉激情| 欧美在线黄色| 日本av手机在线免费观看| 久久中文字幕一级| 一级黄色大片毛片| 国产精品秋霞免费鲁丝片| 精品视频人人做人人爽| 啦啦啦中文免费视频观看日本| 肉色欧美久久久久久久蜜桃| 日韩中文字幕欧美一区二区| 亚洲人成伊人成综合网2020| 少妇被粗大的猛进出69影院| 一级毛片精品| 欧美精品一区二区大全| 老熟妇仑乱视频hdxx| 成人国产av品久久久| 国产日韩一区二区三区精品不卡| 国产男女超爽视频在线观看| 久久国产精品影院| 菩萨蛮人人尽说江南好唐韦庄| 久久精品aⅴ一区二区三区四区| 亚洲 欧美一区二区三区| 男女之事视频高清在线观看| 久久久久久免费高清国产稀缺| 夜夜夜夜夜久久久久| 亚洲视频免费观看视频| 色播在线永久视频| 久久久久国内视频| 久久婷婷成人综合色麻豆| 69精品国产乱码久久久| 久久久久久久大尺度免费视频| 桃花免费在线播放| 久久天堂一区二区三区四区| 久久久久久久久免费视频了| 成年人免费黄色播放视频| 丝袜美足系列| 视频在线观看一区二区三区| 韩国精品一区二区三区| 男女高潮啪啪啪动态图| 精品久久久久久久毛片微露脸| 国产精品免费视频内射| 亚洲国产av影院在线观看| 成年动漫av网址| 一级毛片精品| 老鸭窝网址在线观看| 狠狠精品人妻久久久久久综合| 高清av免费在线| 黄色视频不卡| 97人妻天天添夜夜摸| 欧美日韩一级在线毛片| 国产主播在线观看一区二区| 精品高清国产在线一区| 国产精品 国内视频| 欧美亚洲日本最大视频资源| 人妻久久中文字幕网| 啦啦啦 在线观看视频| 国产精品久久久久久精品电影小说| 99精品久久久久人妻精品| 国产淫语在线视频| 美女福利国产在线| 一级片免费观看大全| 丝瓜视频免费看黄片| 多毛熟女@视频| 91成年电影在线观看| 黑人巨大精品欧美一区二区mp4| 王馨瑶露胸无遮挡在线观看| 国产黄色免费在线视频| 91成人精品电影| 淫妇啪啪啪对白视频| 男女之事视频高清在线观看| 欧美日韩亚洲高清精品| 欧美国产精品一级二级三级| 国产精品自产拍在线观看55亚洲 | 国产av一区二区精品久久| 王馨瑶露胸无遮挡在线观看| 免费人妻精品一区二区三区视频| 久久久国产欧美日韩av| 久久99热这里只频精品6学生| 男女下面插进去视频免费观看| 狠狠精品人妻久久久久久综合| 黑人猛操日本美女一级片| 国产精品自产拍在线观看55亚洲 | 老汉色av国产亚洲站长工具| 曰老女人黄片| 一进一出抽搐动态| 亚洲视频免费观看视频| 欧美人与性动交α欧美软件| 国产熟女午夜一区二区三区| 久热这里只有精品99| 亚洲欧美一区二区三区久久| 欧美乱妇无乱码| 日韩成人在线观看一区二区三区| 亚洲 欧美一区二区三区| 老鸭窝网址在线观看| 十八禁高潮呻吟视频| 人人澡人人妻人| 满18在线观看网站| www.自偷自拍.com| 国产人伦9x9x在线观看| 黄频高清免费视频| 三上悠亚av全集在线观看| av一本久久久久| 99国产综合亚洲精品| 丝袜在线中文字幕| 欧美中文综合在线视频| 精品国产一区二区三区久久久樱花| 亚洲精品国产区一区二| 国产男女内射视频| 亚洲性夜色夜夜综合| 一区二区三区激情视频| 国产亚洲欧美精品永久| 老司机影院毛片| 欧美亚洲日本最大视频资源| √禁漫天堂资源中文www| 人人妻人人澡人人爽人人夜夜| 天堂俺去俺来也www色官网| 一级片'在线观看视频| 性高湖久久久久久久久免费观看| 亚洲欧美日韩另类电影网站| 最新在线观看一区二区三区| 精品少妇黑人巨大在线播放| 老熟妇乱子伦视频在线观看| 国产成人免费观看mmmm| 在线天堂中文资源库| 在线观看66精品国产| 精品久久蜜臀av无|