• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于云模型的文本特征自動提取算法

    2011-06-01 08:00:08何中市
    中南大學學報(自然科學版) 2011年3期
    關(guān)鍵詞:特征選擇復雜度類別

    代 勁 ,何中市,胡 峰,

    (1. 重慶大學 計算機科學與技術(shù)學院,重慶,400030;2. 重慶郵電大學 計算機科學與技術(shù)研究所,重慶,400065;3. 西南交通大學 信息科學與技術(shù)學院,四川 成都,610031)

    文本自動分類是信息檢索與數(shù)據(jù)挖掘領(lǐng)域的研究熱點與核心技術(shù),近年來得到了廣泛關(guān)注和快速發(fā)展,在信息檢索[1]、新聞推薦[2]、詞義消歧[3]、文本主題識別[4]、網(wǎng)頁分類[5]等領(lǐng)域有著廣泛應用。文本自動分類的主要難題之一是特征空間維數(shù)過高[6],如何降低特征空間維數(shù)成為文本自動分類中需要首先解決的問題。特征選擇是文本特征降維的一種有效方法[6],很多學者對此進行了深入的研究,并提出了很多有效的方法,比較經(jīng)典的有文檔頻率DF[7]、信息增益IG[7]、χ2統(tǒng)計量 CHI[7]、互信息 MI[8]和多種方法組合[9]等。這些方法按其特征選擇函數(shù)計算函數(shù)值,然后以降序選擇靠前的特征集。在選擇過程中,選擇尺度是一個重要指標,直接影響著文本分類的性能。實驗證明:多數(shù)分類器呈現(xiàn)出隨特征數(shù)量增加,效果快速提高并能迅速接近平穩(wěn)的特點;但若特征數(shù)過大,性能反而可能降低[10-13]。這表明合理的特征選擇尺度不僅能大量降低處理開銷,而且在很多情況下可以改善分類器的效果。在確定特征選擇尺度時,現(xiàn)有特征選擇方法通常采用經(jīng)驗估算方法:如給定特征數(shù)的經(jīng)驗值(PFC)或比例(THR)、考慮統(tǒng)計量閾值(MVS)或向量空間稀疏性(SPA)、特征數(shù)與文本數(shù)成比例(PCS)等一些選擇方法[14]。這些方法在某些特定語料庫上取得比較好的效果,但通常為觀察所得或經(jīng)驗推斷,理論基礎(chǔ)不充分,不便于文本自動分類的進一步推廣研究;因此,研究能適應文本特性的特征自動提取方法是非常必要的。云模型是一種定性定量轉(zhuǎn)換模型[15-18],由于其具有良好的數(shù)學性質(zhì),可以表示自然科學、社會科學中大量的不確定現(xiàn)象[18]。云模型不需要先驗知識,它可以從大量的原始數(shù)據(jù)中分析其統(tǒng)計規(guī)律,實現(xiàn)從定量向定性的轉(zhuǎn)化。本文作者結(jié)合特征在整體與局部上的χ2分布情況,利用云模型在定性知識表示以及定性、定量知識轉(zhuǎn)換時的橋梁作用,引入云隸屬度概念對特征分布加以修正,并且構(gòu)建了一種逐級動態(tài)聚類算法來獲取特征集,在此基礎(chǔ)上提出一種高性能文本特征自動提取算法。該算法不需要指定聚類數(shù)目,能根據(jù)特征分布特點自動獲取隸屬度高的特征集。分析和開放性實驗結(jié)果表明:該特征集具有特征個數(shù)少、分類精度高的特點,性能明顯比當前主要的特征選擇方法的優(yōu)。

    1 文本特征選擇方法

    特征選擇是通過構(gòu)造一個特征評分函數(shù),把測量空間的數(shù)據(jù)投影到特征空間,得到在特征空間的值,然后,根據(jù)特征空間中的值對每個特征進行評估。特征選擇并沒有改變原始特征空間的性質(zhì),只是從原始特征空間中選擇了一部分重要的特征,組成一個新的低維空間。

    特征選擇是文本特征降維的一種有效方法。目前已有的特征選擇方法主要分為 2類:(1) 傾向于詞頻的特征選擇方法,如 DF,IG,χ2統(tǒng)計量 CHI和 MI等;(2) 傾向于類別的特征選擇方法,如CTD特征選擇方法[19]和帶有強類別信息詞SCIW特征選擇方法[20]等。第1類方法強調(diào)詞頻在所有類別上的整體分布;第2類方法強調(diào)類別信息,而對詞頻在所有類別上的整體分布考慮不充分。如果能有效地結(jié)合詞頻在所有類別的整體分布和在單個類別上的分布情況,將會明顯改善特征選擇性能。

    此外,還有期望交叉熵(ECE)、文本證據(jù)權(quán)(WET)、優(yōu)勢率(OR)等一些特征選擇方法,文獻[21]對DF,IG,MI,CHI,ECE,WET和OR這些特征選擇方法進行了比較,結(jié)果表明:OR方法的效果最好,IG,CHI和ECE的效果次之,WET和DF的效果再次之,MI的效果最差。而Yang等[7,22]認為IG是最好的測度之一。Forman等[10]分別從有效性、區(qū)分能力及獲得最好效果的機會等方面對不同特征選擇方法進行了廣泛比較,結(jié)果表明:CHI和IG等統(tǒng)計量及組合方法具有一定的優(yōu)勢。

    從上述分析看,這些方法對提高文本分類的效果都沒有絕對優(yōu)勢。這是因為文本分類本身涉及訓練數(shù)據(jù)集合本身的特點,同時,不同分類器的分類效果也不盡相同[10-11]。

    2 基于χ2統(tǒng)計量的文本特征分布矩陣

    χ2統(tǒng)計量[7]的概念來自列聯(lián)表檢驗,用來衡量特征ti和類別Cj之間的統(tǒng)計相關(guān)性。實驗證明是一種比較好的特征選擇方法[10,21],它基于ti和Cj之間符合具有一階自由度的χ2分布假設(shè)。ti關(guān)于Cj的χ2可由下式計算:

    式中:N為訓練語料中文檔總數(shù);A為屬于類Cj的文檔頻數(shù);B為不屬于Cj類但包含ti的文檔頻數(shù);C為屬于 Cj類但不包含 ti的文檔頻數(shù);D是既不屬于 Cj也不包含ti的文檔頻數(shù)??芍斕卣鱰i與類別Cj相互獨立時, χ2( ti, Cj) = 0 ,此時特征 ti不包含任何與類別Cj有關(guān)的信息。特征ti與類別Cj的統(tǒng)計相關(guān)性越強,χ2( ti, Cj)越大,此時,特征ti包含的與類別Cj有關(guān)的信息就越多。

    由χ2計算公式可以看出:χ2統(tǒng)計方法作為特征選擇方法時,只考慮了特征在所有文檔出現(xiàn)的文檔頻數(shù)。若某一特征只在一類文檔的少量文檔中頻繁出現(xiàn),則通過χ2計算公式計算的χ2統(tǒng)計值很低,在特征選擇時,這種特征詞就會被排除,但這種在少量文檔中頻繁出現(xiàn)的特征詞很有可能對分類的貢獻很大,如專指概念。這是 χ2統(tǒng)計的不足之處,它對低文檔頻的特征項不可靠。

    基于以上分析,考慮特征在各個類別之間的分布情況,建立特征關(guān)于類別的χ2分布矩陣。定義如下:

    從F的構(gòu)造可以看出:F中的每一行反映了特征在不同類別中的分布情況,每一列反映了在同一類別中不同特征的分布情況。將二者結(jié)合起來,能夠完整反映整個特征集的分布,而且客觀上彌補了χ2統(tǒng)計量作為特征選擇方法上的缺點。

    3 基于云隸屬度的文本特征自動提取算法

    通過分析每一類別上不同特征的 χ2分布情況可見:一些χ2較大的特征在類別中出現(xiàn)頻率極低,而另一些在類別中出現(xiàn)比較頻繁的特征χ2反而很小。這種異常的出現(xiàn)正是由于這些特征打破了χ2統(tǒng)計量基于ti和Cj之間符合具有一階自由度的χ2分布,受整體分布影響較大,需要加以修正。由此,本文為每個特征引入一個模糊概念,用云模型對其在類別上的分布進行定量描述,將特征對于類別的χ2用相應的隸屬度加以修正。

    3.1 云模型簡介

    云模型用語言值表示某個定性概念與其定量表示之間的不確定性[15-18],已經(jīng)在智能控制、模糊評測等多個領(lǐng)域得到應用。

    定義1[15]設(shè)U是一個用數(shù)值表示的定量論域,C是U上定性概念。若定量值 Ux∈ 是定性概念C的一次隨機實現(xiàn),x對C的確定度]1,0[)(∈xμ是有穩(wěn)定傾向的隨機數(shù),μ: U→[0, 1], Ux∈?, x→μ(x),則x在論域U上的分布稱為云,記為云C(X)。每一個x稱為一個云滴。如果概念對應的論域是n維空間,那么可以拓廣至n維云。

    隸屬度在基礎(chǔ)變量上的分布稱為云。在對模糊集的處理過程中,論域中某一點到它的隸屬度之間的映射是一對多的轉(zhuǎn)換,不是一條明晰的隸屬曲線,從而產(chǎn)生了云的概念。

    云用期望Ex(Expected value)、熵En(Entropy)、超熵He(Hyper entropy)這3個數(shù)字特征來整體表征一個概念。期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點;熵En代表定性概念的可度量粒度,熵越大,通常概念越宏觀,也是定性概念不確定性的度量,由概念的隨機性和模糊性共同決定。超熵He是熵的不確定性度量,即熵的熵,由熵的隨機性和模糊性共同決定。用3個數(shù)字特征表示的定性概念的整體特征記作C(Ex,En,He),稱為云的特征向量。

    正向云算法[15]和逆向云算法[15]是云模型中2個最基本、最關(guān)鍵的算法。前者把定性概念的整體特征變換為定量數(shù)值表示,實現(xiàn)概念空間到數(shù)值空間的轉(zhuǎn)換;后者實現(xiàn)從定量值到定性概念的轉(zhuǎn)換,將一組定量數(shù)據(jù)轉(zhuǎn)換為以數(shù)字特征{Ex,En,He}來表示的定性概念。

    3.2 基于云隸屬度的文本特征自動提取算法

    通過特征χ2分布矩陣,特征的取值不僅反映了特征對整個分類作用大小,也反映了該特征對于每一類別的貢獻程度。通過云模型隸屬度函數(shù)的引入,更修正了特征在類別中的分布情況。通過提取每一類別隸屬度最高的特征集,合并而成最終的分類特征集合,不僅可以保留對整個分類貢獻最大的特征集,同時兼顧某些特征集較少(或者在某一類中出現(xiàn)頻率大,但總體出現(xiàn)概率低的特征)的類別。

    在對特征取值進行隸屬度表示后,特征在類別上的取值表示成了[0,1]區(qū)間上的連續(xù)值。特征對類別的相關(guān)性越大,其隸屬度越高。但每一類別仍包含大量特征,其中很大一部分特征對于類別的隸屬度極低,需要對特征集進行初步篩選,減少特征提取計算量。

    定義 3[17]一維論域中 U中,任一小區(qū)間上的云滴群Δx對定性概念A的貢獻ΔC為:

    由定義3,可以計算得到U上所有元素對概念A的總貢獻C為:

    基于以上分析,通過計算可以得到位于區(qū)間[Ex-0.67En, Ex+0.67En]的特征,占特征總量的22.33%,但它們對類別的貢獻占50%,能夠滿足特征提取需要,故將在此區(qū)間的特征篩選為初選特征集。

    在特征的提取上,可以采用動態(tài)聚類方法進行處理。但是,在聚類過程中,類別個數(shù)應該是與數(shù)據(jù)本身特性有關(guān),而不是一個經(jīng)驗值。因此,采用逐步試探聚類類別個數(shù)直至最終滿足聚類要求的思路,提出了逐級動態(tài)聚類算法。

    算法1:逐級動態(tài)聚類算法。

    輸入:類別向量Ci//即第2節(jié)中χ2分布矩陣F中的列向量。

    輸出:特征集合Ti。

    算法步驟:

    (1) 提取Ci中所有不重復的特征隸屬度以升序構(gòu)成新類別向量, Clusterid},其中Clusterid為聚類類別編號。

    (3) 初始類別K=1,v=e+1 //v為循環(huán)控制變量。

    (4) WHILE (v>e) DO //當v≤e時,各類的聚合程度已經(jīng)比較好,聚類結(jié)束。

    1) 構(gòu)建中心類別表TC:將iC′平均分成K+1份,取區(qū)間右端點加入TC,作為C′在K情況下的初始類別,同時將iC′各元素Clusterid置為0;

    2) 設(shè)定臨時循環(huán)控制變量e1=0;

    3) 當 e1≠v時,執(zhí)行以下循環(huán): //聚類穩(wěn)定后,各類的標準差將收斂為穩(wěn)定值。

    ① e1=v;

    ② 計算iC′中每個值與 TC中各類別距離,將其歸并到距離最小的類別中;

    ③ 根據(jù)加權(quán)平均修正 TC中各類別的中心距離;

    ④ 計算 TC中各類別的標準差 Si,令

    4) K=K+1 //聚類類別數(shù)加1,進行下一輪的聚類處理。

    LOOP

    (5) 聚類結(jié)束,K′=K-1即為聚類類別數(shù)。編號為K′的特征為類別 Ci隸屬度最大的特征集,Ti= { tj|tj∈Ci∧Clusterid=K′}。

    (6) RETURN Ti。

    算法1的復雜度分析:設(shè)類別Ci上特征的平均個數(shù)為n,算法時間復雜度主要由步驟(4)決定。步驟(4)是一個典型的 k均值聚類[24],其時間復雜度為O ( k × n ),因此,步驟(4)的時間復雜度為 O ( k2× n )(其中,k為平均聚類個數(shù))。故算法 1的時間復雜度為O ( k2× n ),空間復雜度為O(n)。

    在算法1的基礎(chǔ)上,提出了一種云隸屬度下的文本特征自動提取算法。該算法不需要指定聚類數(shù)目,能根據(jù)特征分布特點自動獲取隸屬度高的特征集,具體見算法2。

    算法 2:基于云隸屬度的文本特征自動提取算法(FAS)。

    輸入:特征χ2分布矩陣F,訓練集TR。

    輸出:經(jīng)過特征選擇后的訓練集 RT′。

    算法步驟:

    初始化特征集φ=T;

    依次選擇F中每一列Ci,進行以下步驟處理:

    1) 運用逆向云算法計算 Ci的數(shù)字特征 C(Ex, En,He);

    2) 運用正向云算法將 Ci特征值轉(zhuǎn)化成對應隸屬度;

    3) 將Ci中區(qū)間[Ex-0.67En, Ex+0.67En]外的特征刪除,得到初次約簡類別向量iC′;

    4) 在iC′基礎(chǔ)上調(diào)用逐級動態(tài)聚類算法(算法1)得到選擇后特征集Ti;

    5)iTTT∪=

    6) 刪除TR中不屬于T的所有特征項,得到選擇處理后訓練集 RT′。

    算法2的復雜度分析:設(shè)訓練集類別平均特征數(shù)為 n,類別數(shù)為 m,則算法 2的時間復雜度為O(k2×n×m) (k為平均聚類個數(shù)),空間復雜度為O(n)。

    4 實驗及其結(jié)果分析

    為了測試本文算法的有效性,對FAS算法進行橫向?qū)Ρ葴y試。實驗中,采用性能較好的kNN分類器算法[25](k=30)進行文本分類測試。測試結(jié)果用準確率(即分類正確數(shù)/實際分類數(shù))、查全率(即分類正確數(shù)/應有數(shù))和宏平均P為準確率;R為召回率)進行評測。

    4.1 語料庫

    實驗選用中文語料庫 TanCorpV1.0[26]與英文語料庫Reuters-21578[27]。 TanCorpV1.0包含文本14 150篇,共分為12類。經(jīng)過停用詞移除、詞干還原等處理后,得到詞條72 584個。

    對于Reuters-21578,使用只有1個類別且每個類別至少包含5 個以上的文檔。這樣,得到訓練集5 273篇、測試集1 767篇。經(jīng)過停用詞移除、詞干還原等處理后,得到13 961個詞條。

    4.2 實驗過程及結(jié)果分析

    現(xiàn)有特征選擇方法通常采用經(jīng)驗方式來確定特征數(shù)目,為了得到各特征選擇方法在達到最佳分類性能時的特征數(shù),采用了逐步增加特征數(shù)的方法來確定。測試結(jié)果如表1和2所示。

    從表1和2可以看出:IG和CHI方法隨著特征數(shù)的增加,分類性能提升較快,而 MI方法需要的特征數(shù)則較多,性能提升緩慢。同時,當特征數(shù)達到某個閾值時,各特征選擇方法性能均會達到最佳狀態(tài)。但此閾值的獲取因特征選擇方法的不同、語料庫的差異而各有不同,需要大量實驗才能得到。

    表1 TanCorpV1.0上各特征選擇方法在不同特征數(shù)下性能比較Table1 Performance of feature selection methods with different number of features on TanCorpV1.0

    表2 Reuters-21578上各特征選擇方法在不同特征數(shù)下性能比較Table2 Performance of feature selection methods with different number of features on Reuters-21578

    表3 TanCorpV1.0上各特征選擇方法分類性能比較Table3 Classification performance comparison on TanCorpV1.0

    表4 Reuters-21578上各特征選擇方法分類性能比較Table4 Classification performance comparison on Reuters-21578

    而使用FAS算法在TanCorpV1.0上自動提取的特征數(shù)平均為1 380個,在Reuters-21578上自動提取的特征數(shù)平均為239個,不僅不需要任何經(jīng)驗知識,而且特征數(shù)明顯少于已有特征選擇方法的特征數(shù)。將FAS算法選擇的特征集進行分類測試,性能比較結(jié)果見表3和4。

    從表3和4可以看出:與IG,CHI和MI這3種算法相比,F(xiàn)AS算法提取的特征集具有個數(shù)少、分類精度高的特點。kNN方法在TanCorpV1.0上的最好宏平均(F1=84.78%)[26]與 Reuters-21578上的最好宏平均(F1=86.1%)[22]相比,基于FAS算法提取特征集上,kNN方法宏平均提高了5%~6%,說明該算法提取的特征集具有比較高的類別描述能力。

    從分類的時間開銷來看,雖然FAS算法在特征提取階段耗費了一定的時間,但從整體上看,遠低于其他方法所需的時間。這是因為整個分類的時間主要由特征選擇及分類耗時組成。FAS算法的時間復雜度為O(k2×n×m)(k為平均聚類個數(shù),n為特征數(shù),m為類別數(shù)),而通常分類算法的時間復雜度至少為O ( m × n2)以上,特征數(shù)的多少對整個分類時間耗費起著至關(guān)重要的作用。IG,CHI和MI雖然在選擇階段不需要耗費時間,但一方面如何找到最優(yōu)的特征數(shù)需要多次測試,另一方面由于所選特征遠較 FAS算法多,直接導致整個分類時間耗費大幅度增加。

    從性能比較分析發(fā)現(xiàn),F(xiàn)AS算法提取出來的特征雖然不到IG和CHI算法的結(jié)果的一半,但分類性能明顯高于后者。性能提升是特征集的選取變化所致。為此,以TanCorpV1.0為例,考察特征集分布情況,如圖1所示。

    圖1 TanCorpV1.0上各特征選擇方法特征集分布情況Fig.1 Distribution of feature sets selected by different selection method on TanCorpV1.0

    從圖1可以看出,F(xiàn)AS算法提取了每個類別較重要的特征集,保證了不同類別之間關(guān)鍵特征大致均勻分布,同時引入的云隸屬度概念對特征值的χ2分布進行比較好的修正,因而有效提高了文本的分類性能,這在特征數(shù)少的類別中尤為明顯。

    5 結(jié)論

    (1) 本文提出的FAS算法提取出來的特征不僅具有特征個數(shù)少、分類精度高的特點,而且整體大幅度降低了分類時間。

    (2) FAS算法的性能明顯比當前主要特征選擇方法的性能優(yōu)。

    [1] Charles-Antoine J, John E, France B. Controlled user evaluations of information visualization interfaces for text retrieval:literature review and meta-analysis[J]. Journal of the American Society for Information Science and Technology, 2008, 59(6):1012-1024.

    [2] Haruechaivasak, Choochart J, Wittawat S. Implementing news article category browsing based on text categorization technique[C]// Proc of Web Intelligence and Intelligent Agent Technology (WI-IAT 2008). Piscataway: IEEE, 2008: 143-146.

    [3] Myunggwon H, Chang C, Byungsu Y, et al. Word sense disambiguation based on relation structure[C]// Proc of Advanced Language Processing and Web Information Technology (ALPIT 2008). Piscataway: IEEE, 2008: 15-20.

    [4] Xuerui W, Mccallum A, Xing W. Topical n-grams: phrase and topic discovery, with and application to information retrieval[C]// 7th IEEE International Conference on Data Mining(ICDM 2007). Piscataway: IEEE, 2007: 697-702.

    [5] Selvakuberan K, Indradevi M, Rajaram R. Combined feature selection and classification: A novel approach for the categorization of web pages[J]. Journal of Information and Computing Science, 2008, 3(2): 83-89.

    [6] 蘇金樹, 張博鋒, 徐昕. 基于機器學習的文本分類技術(shù)研究進展[J]. 軟件學報, 2006, 17(9): 1848-1859.

    SU Jin-shu, ZHANG Bo-feng, XU Xin. Advances in machine learning based text categorization[J]. Journal of Software, 2006,17(9): 1848-1859.

    [7] Yang Y M, Pedersen J O. A comparative study on feature selection in text categorization[C]// Proc of the 14th International Conference on Machine Learning (ICML 1997). San Francisco:MIT Press, 1997: 412-420.

    [8] Jana N, Petr S, Michal H. Conditional mutual information based feature selection for classification task[C]// Proc of the 12th Iberoamericann Congress on Pattern Recognition (CIAPR 2007).Berlin: Springer-Verlag, 2007: 417-426.

    [9] Santana L E A, de Oliveira D F, Canuto A M P, et al. A comparative analysis of feature selection methods for ensembles with different combination methods[C]// Proc of Internation Joint Conference on Neural Networks (IJCNN 2007). Piscataway:IEEE, 2007: 643-648.

    [10] Forman G. An extensive empirical study of feature selection metrics for text classification[J]. Journal of Machine Learning Research, 2003, 3(1): 1533-7928.

    [11] Kim H, Howland P, Park H. Dimension reduction in text classification with support vector machines[J]. Journal of Machine Learning Research, 2005, 6(1): 37-53.

    [12] Rogati M, Yang Y. High-performing feature selection for text classification[C]// Proc of the 11th ACM Int’l Conf on Information and Knowledge Management (CIKM 2002).McLean: ACM Press, 2002: 659-661.

    [13] Makrehchi M, Kame M S. Text classification using small number of features[C]// Proc of the 4th International Conference on Machine Learning and Data Mining in Pattern Recognition(MLDM 2005). Berlin: Springer-Verlag, 2005: 580-589.

    [14] Soucy P, Mineau G W. Feature selection strategies for text categorization[C]// Proc of the 16th Conf of the Canadian Society for Computational Studies of Intelligence (CSCSI 2003).Halifax: Springer-Verlag, 2003: 505-509.

    [15] 李德毅. 不確定性人工智能[M]. 北京: 國防工業(yè)出版社,2005: 171-177.

    LI De-yi. Artificial intelligence with uncertainty[M]. Beijing:National Defense Industry Press, 2005: 171-177.

    [16] 李德毅, 劉常昱. 論正態(tài)云模型的普適性[J]. 中國工程科學,2004, 6(8): 28-34.

    LI De-yi, LIU Chang-yu. Study on the universality of the normal cloud model[J]. Engineering Science, 2004, 6(8): 28-34.

    [17] 李德毅, 劉常昱, 杜鹢, 等. 不確定性人工智能[J]. 軟件學報,2004, 15(11): 1583-1594.

    LI De-yi, LIU Chang-yu, DU Yi, et al. Artificial intelligence with uncertainty[J]. Journal of Software, 2004, 15(11):1583-1594.

    [18] 張光衛(wèi), 康建初, 李鶴松, 等. 基于云模型的全局最優(yōu)化算法[J]. 北京航空航天大學學報, 2007, 33(4): 486-491.

    ZHANG Guang-wei, KANG Jian-chu, LI He-song, et al. Cloud model based algorithm for global optimization of functions[J].Journal of Beijing University of Aeronautics and Astronautics,2007, 33(4): 486-491.

    [19] Bong C H, Narayanan K. An empirical study of feature selection for text categorization based on term weightage[C]// Proc of the IEEE/WLC/ACM Int’l Conf on Web Intelligence (WI 2004).Beijing: IEEE Computer Society Press, 2004: 599-602.

    [20] Li S, Zong C Q. A new approach to feature selection for text categorization[C]// Proc of the IEEE Int’1 Conf on Natural Language Processing and Knowledge Engineering (NLP-KE 2005). Wuhan: IEEE Press, 2005: 626-630.

    [21] 胡佳妮, 徐蔚然, 郭軍, 等. 中文文本分類中的特征選擇算法研究[J]. 光通信研究, 2005, 3(129): 44-46.

    HU Jia-ni, XU Wei-ran, GUO Jun, et al. Study on feature selection methods in Chinese text categorization[J]. Study on Optical Communications, 2005, 3(129): 44-46.

    [22] 徐燕, 李錦濤, 王斌, 等. 文本分類中特征選擇的約束研究[J].計算機研究與發(fā)展, 2008, 45(4): 596-602.

    XU Yan, LI Jing-tao, WANG Bin, et al. A study on constraints for feature selection in text categorization[J]. Journal of Computer Research and Development, 2008, 45(4): 596-602.

    [23] 張光衛(wèi), 李德毅, 李鵬, 等. 基于云模型的協(xié)同過濾推薦算法[J]. 軟件學報, 2007, 18(10): 2403-2411.

    ZHANG Guang-wei, LI De-yi, LI Peng, et al. A collaborative filtering recommendation algorithm based on cloud model[J].Journal of Software, 2007, 18(10): 2403-2411.

    [24] Dai W H, Jiao C Z, He T. Research of k-means clustering method based on parallel genetic algorithm[C]// Proc of the 3rd Int’l Conf on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP 2007). 2007: 158-161.

    [25] Yang Y, Liu X. A re-examination of text categorization methods[C]// Proc of the 22nd Annual Int’l ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR 1999). Berkeley, 1999: 42-49.

    [26] Tan S, Cheng X, Ghanem M, et al. A novel refinement approach for text categorization[C]// Proc of the 14th ACM Conf on Information and Knowledge Management (CIKM 2005).Bremen: ACM Press, 2005: 469-476.

    [27] David L. Reuters-21578 test collection[EB/OL]. [2007-02-04].http://www.daviddlewis.corn/resources/testcollections/reuters 21578/.

    猜你喜歡
    特征選擇復雜度類別
    一種低復雜度的慣性/GNSS矢量深組合方法
    求圖上廣探樹的時間復雜度
    Kmeans 應用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    某雷達導51 頭中心控制軟件圈復雜度分析與改進
    聯(lián)合互信息水下目標特征選擇算法
    服務類別
    新校長(2016年8期)2016-01-10 06:43:59
    出口技術(shù)復雜度研究回顧與評述
    論類別股東會
    商事法論集(2014年1期)2014-06-27 01:20:42
    中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    亚洲av熟女| 高清黄色对白视频在线免费看| 成年人午夜在线观看视频| 一进一出抽搐动态| 高清视频免费观看一区二区| 国产免费av片在线观看野外av| 纯流量卡能插随身wifi吗| 国产视频一区二区在线看| 色老头精品视频在线观看| 色播在线永久视频| 亚洲欧美日韩高清在线视频| e午夜精品久久久久久久| 国产精品成人在线| 久久精品aⅴ一区二区三区四区| 国产一区二区三区视频了| 欧美乱码精品一区二区三区| 夫妻午夜视频| 久久久国产一区二区| 国产高清videossex| 黄色怎么调成土黄色| av一本久久久久| √禁漫天堂资源中文www| 自拍欧美九色日韩亚洲蝌蚪91| 国产97色在线日韩免费| 亚洲欧洲精品一区二区精品久久久| 亚洲国产中文字幕在线视频| 精品久久蜜臀av无| 91麻豆av在线| 美女扒开内裤让男人捅视频| 91在线观看av| 午夜影院日韩av| 亚洲av美国av| 国产三级黄色录像| 免费在线观看完整版高清| 亚洲av日韩在线播放| 免费不卡黄色视频| 咕卡用的链子| 在线视频色国产色| 精品国产乱码久久久久久男人| 精品熟女少妇八av免费久了| av福利片在线| 日韩大码丰满熟妇| 久久午夜亚洲精品久久| 操出白浆在线播放| 可以免费在线观看a视频的电影网站| 亚洲五月天丁香| 亚洲av日韩在线播放| av有码第一页| 欧美黑人精品巨大| 国产免费av片在线观看野外av| 国产午夜精品久久久久久| 欧美日韩亚洲综合一区二区三区_| av网站免费在线观看视频| 亚洲人成电影观看| 最新在线观看一区二区三区| 成人18禁高潮啪啪吃奶动态图| av国产精品久久久久影院| 两性午夜刺激爽爽歪歪视频在线观看 | 丰满饥渴人妻一区二区三| 丁香欧美五月| 精品人妻在线不人妻| 热99久久久久精品小说推荐| 成人亚洲精品一区在线观看| 精品人妻熟女毛片av久久网站| 免费观看人在逋| 久久久国产成人免费| 亚洲一卡2卡3卡4卡5卡精品中文| 99久久国产精品久久久| 亚洲第一欧美日韩一区二区三区| av一本久久久久| 在线观看免费高清a一片| 欧美大码av| 亚洲精品久久午夜乱码| 一边摸一边抽搐一进一出视频| 欧美日韩精品网址| 欧美日韩黄片免| 色在线成人网| 国产欧美日韩精品亚洲av| 叶爱在线成人免费视频播放| 亚洲五月婷婷丁香| 亚洲精品自拍成人| 久久天躁狠狠躁夜夜2o2o| av福利片在线| www.精华液| 男女高潮啪啪啪动态图| 我的亚洲天堂| 男男h啪啪无遮挡| 亚洲色图av天堂| 欧美 日韩 精品 国产| 国产99白浆流出| 国产一区二区三区视频了| 精品人妻1区二区| 捣出白浆h1v1| 黄色女人牲交| 男女床上黄色一级片免费看| 国产免费现黄频在线看| 老鸭窝网址在线观看| 亚洲成a人片在线一区二区| 国产成人欧美在线观看 | 亚洲精品在线美女| 99re在线观看精品视频| 欧美激情 高清一区二区三区| 欧美黑人精品巨大| 国产精品九九99| 精品福利永久在线观看| 视频区图区小说| 久久久久久亚洲精品国产蜜桃av| 黄色片一级片一级黄色片| av一本久久久久| 亚洲精品成人av观看孕妇| 午夜福利乱码中文字幕| 久久久国产精品麻豆| 电影成人av| 午夜老司机福利片| 亚洲欧洲精品一区二区精品久久久| 欧美激情久久久久久爽电影 | 国产深夜福利视频在线观看| 欧美 日韩 精品 国产| av线在线观看网站| 亚洲精品美女久久av网站| 18禁裸乳无遮挡免费网站照片 | 最新的欧美精品一区二区| 人妻久久中文字幕网| 久久精品亚洲精品国产色婷小说| 动漫黄色视频在线观看| 不卡一级毛片| 免费看a级黄色片| 亚洲av日韩精品久久久久久密| 桃红色精品国产亚洲av| 99久久精品国产亚洲精品| 亚洲情色 制服丝袜| 一级a爱视频在线免费观看| 丝瓜视频免费看黄片| 天堂√8在线中文| 如日韩欧美国产精品一区二区三区| 国产单亲对白刺激| av一本久久久久| 啦啦啦视频在线资源免费观看| 午夜视频精品福利| 久久精品国产清高在天天线| 久久人妻福利社区极品人妻图片| 久久性视频一级片| 欧美中文综合在线视频| 欧美日韩国产mv在线观看视频| 亚洲全国av大片| 精品人妻1区二区| 99热只有精品国产| 国产成人精品无人区| 女警被强在线播放| 成人18禁在线播放| 热99国产精品久久久久久7| 免费在线观看影片大全网站| 女人高潮潮喷娇喘18禁视频| 99国产精品免费福利视频| 久久中文字幕一级| 18禁裸乳无遮挡动漫免费视频| 色尼玛亚洲综合影院| 欧美大码av| 欧美精品啪啪一区二区三区| 黑人巨大精品欧美一区二区mp4| 一级毛片精品| 午夜91福利影院| 欧美另类亚洲清纯唯美| 成人国语在线视频| 91麻豆av在线| 韩国av一区二区三区四区| 婷婷成人精品国产| 黄色女人牲交| 亚洲精华国产精华精| 中文字幕人妻熟女乱码| 日日摸夜夜添夜夜添小说| 精品少妇一区二区三区视频日本电影| 国产xxxxx性猛交| 免费在线观看完整版高清| 午夜亚洲福利在线播放| 精品熟女少妇八av免费久了| 久久精品国产99精品国产亚洲性色 | 国产黄色免费在线视频| 美女扒开内裤让男人捅视频| 精品卡一卡二卡四卡免费| 动漫黄色视频在线观看| 国产野战对白在线观看| 国产蜜桃级精品一区二区三区 | 男人操女人黄网站| 欧洲精品卡2卡3卡4卡5卡区| 淫妇啪啪啪对白视频| av电影中文网址| 每晚都被弄得嗷嗷叫到高潮| 12—13女人毛片做爰片一| av在线播放免费不卡| 久久99一区二区三区| 丝袜人妻中文字幕| 精品熟女少妇八av免费久了| 亚洲国产中文字幕在线视频| 99国产精品一区二区三区| 一本综合久久免费| 侵犯人妻中文字幕一二三四区| 大型黄色视频在线免费观看| 天堂动漫精品| 国产一区二区三区在线臀色熟女 | 18禁国产床啪视频网站| 成年人免费黄色播放视频| 欧美日韩亚洲综合一区二区三区_| 母亲3免费完整高清在线观看| 在线观看免费午夜福利视频| 免费不卡黄色视频| 两人在一起打扑克的视频| 久久午夜综合久久蜜桃| 国产激情欧美一区二区| 日韩免费高清中文字幕av| 免费看a级黄色片| 亚洲第一av免费看| 99在线人妻在线中文字幕 | av一本久久久久| 女人被狂操c到高潮| 啦啦啦在线免费观看视频4| 日韩中文字幕欧美一区二区| 国产欧美日韩一区二区三区在线| 巨乳人妻的诱惑在线观看| 深夜精品福利| 黄片大片在线免费观看| 黄色毛片三级朝国网站| 国产精品98久久久久久宅男小说| 丝瓜视频免费看黄片| 黑丝袜美女国产一区| 99riav亚洲国产免费| 欧美日韩福利视频一区二区| 99久久国产精品久久久| 久久影院123| 热99国产精品久久久久久7| 在线视频色国产色| 人人妻人人爽人人添夜夜欢视频| 亚洲国产精品一区二区三区在线| 可以免费在线观看a视频的电影网站| 热re99久久国产66热| 亚洲专区国产一区二区| 在线永久观看黄色视频| 国产欧美日韩一区二区三| 亚洲精品美女久久久久99蜜臀| 满18在线观看网站| 亚洲一卡2卡3卡4卡5卡精品中文| 精品久久久久久久久久免费视频 | 国产成人精品无人区| 三级毛片av免费| 日韩免费高清中文字幕av| 18禁观看日本| 日韩视频一区二区在线观看| 欧美精品人与动牲交sv欧美| 欧美日韩视频精品一区| 日日夜夜操网爽| 女同久久另类99精品国产91| 精品国产一区二区三区四区第35| 亚洲精品美女久久久久99蜜臀| 精品国产乱码久久久久久男人| 亚洲精品乱久久久久久| 亚洲精品av麻豆狂野| 岛国在线观看网站| 日韩免费av在线播放| 午夜免费观看网址| 精品国产乱码久久久久久男人| bbb黄色大片| 午夜久久久在线观看| 国产成人免费无遮挡视频| 国产精品98久久久久久宅男小说| 91字幕亚洲| 亚洲,欧美精品.| 欧美色视频一区免费| 正在播放国产对白刺激| 免费在线观看日本一区| 国产欧美日韩一区二区三区在线| 91成人精品电影| 久久中文字幕一级| 性少妇av在线| 天天躁日日躁夜夜躁夜夜| 巨乳人妻的诱惑在线观看| 香蕉丝袜av| 国产精品秋霞免费鲁丝片| svipshipincom国产片| 高清欧美精品videossex| 欧美黑人精品巨大| 国产精品自产拍在线观看55亚洲 | 18禁裸乳无遮挡免费网站照片 | 亚洲精品一卡2卡三卡4卡5卡| 91麻豆精品激情在线观看国产 | 久久人人97超碰香蕉20202| 精品国产一区二区三区久久久樱花| 波多野结衣一区麻豆| xxx96com| 精品少妇一区二区三区视频日本电影| 国产野战对白在线观看| 亚洲熟妇熟女久久| 国产成人一区二区三区免费视频网站| 国产精品一区二区免费欧美| 无限看片的www在线观看| 午夜福利视频在线观看免费| 免费观看人在逋| 可以免费在线观看a视频的电影网站| www.精华液| 欧美日韩瑟瑟在线播放| 18禁国产床啪视频网站| 香蕉丝袜av| √禁漫天堂资源中文www| 欧美 亚洲 国产 日韩一| 悠悠久久av| 亚洲精品粉嫩美女一区| 久久精品成人免费网站| 婷婷丁香在线五月| 在线十欧美十亚洲十日本专区| 欧美精品高潮呻吟av久久| 黄片大片在线免费观看| 亚洲avbb在线观看| av一本久久久久| 一区二区三区激情视频| 亚洲国产毛片av蜜桃av| 亚洲av成人av| 丝袜人妻中文字幕| 国产精品欧美亚洲77777| 亚洲自偷自拍图片 自拍| 免费在线观看影片大全网站| 大香蕉久久网| 久久久久久久久免费视频了| 精品久久久久久,| 国产国语露脸激情在线看| 国产精品久久久久成人av| 老司机影院毛片| 国产精品 欧美亚洲| 久久精品国产a三级三级三级| 国产成人精品久久二区二区91| 精品久久久精品久久久| 99re6热这里在线精品视频| 日韩欧美在线二视频 | 欧美精品一区二区免费开放| 一本大道久久a久久精品| 亚洲人成77777在线视频| 国产精品久久电影中文字幕 | 精品久久久久久久毛片微露脸| 一级毛片女人18水好多| 久久国产乱子伦精品免费另类| 99久久国产精品久久久| 精品一区二区三区av网在线观看| 国产欧美日韩一区二区三| 高清毛片免费观看视频网站 | 在线观看免费日韩欧美大片| 手机成人av网站| 国产一区二区三区综合在线观看| 黑人欧美特级aaaaaa片| 村上凉子中文字幕在线| 久久久久视频综合| 每晚都被弄得嗷嗷叫到高潮| 国产精品美女特级片免费视频播放器 | 午夜激情av网站| 人人妻人人澡人人爽人人夜夜| 三级毛片av免费| 又紧又爽又黄一区二区| 日韩欧美三级三区| 久久国产精品人妻蜜桃| 国产免费av片在线观看野外av| aaaaa片日本免费| 又紧又爽又黄一区二区| 黄色视频不卡| 亚洲国产欧美网| 午夜福利欧美成人| 久久久久视频综合| 三上悠亚av全集在线观看| 18在线观看网站| 一级a爱视频在线免费观看| 免费高清在线观看日韩| 香蕉久久夜色| 日韩三级视频一区二区三区| 国产激情欧美一区二区| 国产一卡二卡三卡精品| 成人影院久久| 女同久久另类99精品国产91| 国产黄色免费在线视频| 国产亚洲一区二区精品| 最近最新中文字幕大全免费视频| 美女国产高潮福利片在线看| 国产欧美亚洲国产| 精品午夜福利视频在线观看一区| 男女午夜视频在线观看| 精品午夜福利视频在线观看一区| 91字幕亚洲| 国产精品秋霞免费鲁丝片| 激情在线观看视频在线高清 | 亚洲av成人一区二区三| 亚洲成av片中文字幕在线观看| 50天的宝宝边吃奶边哭怎么回事| tube8黄色片| 精品欧美一区二区三区在线| 国产在线观看jvid| 操美女的视频在线观看| 精品亚洲成a人片在线观看| 成人手机av| 精品国产亚洲在线| 亚洲av第一区精品v没综合| 757午夜福利合集在线观看| 午夜亚洲福利在线播放| 看黄色毛片网站| 亚洲av电影在线进入| 亚洲精品久久午夜乱码| 欧美老熟妇乱子伦牲交| 欧洲精品卡2卡3卡4卡5卡区| 午夜福利,免费看| 老司机午夜福利在线观看视频| 成人国产一区最新在线观看| 丝袜人妻中文字幕| 亚洲欧美日韩另类电影网站| videosex国产| 一本综合久久免费| 亚洲av欧美aⅴ国产| 久久影院123| 亚洲av成人av| 久久 成人 亚洲| 一本一本久久a久久精品综合妖精| 久久人妻av系列| 天天躁夜夜躁狠狠躁躁| 日本wwww免费看| 欧美不卡视频在线免费观看 | 国产欧美日韩一区二区三区在线| 在线观看午夜福利视频| 成人特级黄色片久久久久久久| 国产成人精品无人区| 一二三四在线观看免费中文在| 久久久国产精品麻豆| 亚洲午夜理论影院| 久久国产精品大桥未久av| 日日爽夜夜爽网站| 极品教师在线免费播放| 丁香六月欧美| 亚洲九九香蕉| 亚洲自偷自拍图片 自拍| 成在线人永久免费视频| 9热在线视频观看99| 国产亚洲欧美在线一区二区| 咕卡用的链子| 国产精品 国内视频| 9191精品国产免费久久| 亚洲性夜色夜夜综合| 正在播放国产对白刺激| 国产主播在线观看一区二区| 夜夜躁狠狠躁天天躁| 久久精品aⅴ一区二区三区四区| 91麻豆av在线| 激情视频va一区二区三区| 国产精品美女特级片免费视频播放器 | 免费黄频网站在线观看国产| 色精品久久人妻99蜜桃| 免费在线观看影片大全网站| 欧美日韩中文字幕国产精品一区二区三区 | 日韩一卡2卡3卡4卡2021年| 亚洲自偷自拍图片 自拍| 国产一区二区激情短视频| 黑人操中国人逼视频| 满18在线观看网站| 黑人操中国人逼视频| 高清黄色对白视频在线免费看| 国产精品98久久久久久宅男小说| 啪啪无遮挡十八禁网站| 一区二区三区激情视频| 国产精品久久视频播放| 下体分泌物呈黄色| 久久亚洲真实| 欧美不卡视频在线免费观看 | 欧美黑人欧美精品刺激| 亚洲精品国产一区二区精华液| 久久天堂一区二区三区四区| 亚洲国产中文字幕在线视频| 久久久久精品人妻al黑| xxxhd国产人妻xxx| 国产欧美日韩精品亚洲av| 韩国av一区二区三区四区| 成年人免费黄色播放视频| 美国免费a级毛片| 黄频高清免费视频| 国产精品乱码一区二三区的特点 | 国产一区在线观看成人免费| 久久久久久亚洲精品国产蜜桃av| 两个人免费观看高清视频| 丰满人妻熟妇乱又伦精品不卡| 国产又色又爽无遮挡免费看| 9色porny在线观看| 免费在线观看完整版高清| 看黄色毛片网站| 精品国产美女av久久久久小说| 亚洲国产中文字幕在线视频| 在线天堂中文资源库| 乱人伦中国视频| 欧美另类亚洲清纯唯美| 日本精品一区二区三区蜜桃| 亚洲一区二区三区不卡视频| 久久久水蜜桃国产精品网| 天天躁日日躁夜夜躁夜夜| 日韩人妻精品一区2区三区| 欧美人与性动交α欧美软件| 久久久久国内视频| 不卡av一区二区三区| 99精国产麻豆久久婷婷| 亚洲精品成人av观看孕妇| 日本黄色日本黄色录像| 国产精品乱码一区二三区的特点 | 亚洲精品一二三| 大片电影免费在线观看免费| 国产不卡av网站在线观看| 精品久久久久久电影网| 国产蜜桃级精品一区二区三区 | 两个人免费观看高清视频| 我的亚洲天堂| 午夜福利乱码中文字幕| 亚洲avbb在线观看| 欧美激情极品国产一区二区三区| 欧美大码av| 日韩视频一区二区在线观看| 又紧又爽又黄一区二区| 人成视频在线观看免费观看| 久久婷婷成人综合色麻豆| 亚洲精品乱久久久久久| 亚洲欧美色中文字幕在线| 久久午夜综合久久蜜桃| 90打野战视频偷拍视频| 午夜91福利影院| 国产黄色免费在线视频| 精品福利观看| 啪啪无遮挡十八禁网站| 亚洲全国av大片| 母亲3免费完整高清在线观看| 中文字幕制服av| 精品欧美一区二区三区在线| 色在线成人网| 亚洲在线自拍视频| 久久国产精品大桥未久av| 搡老熟女国产l中国老女人| 国产男女超爽视频在线观看| 国产成人精品久久二区二区免费| 欧美日韩中文字幕国产精品一区二区三区 | 又紧又爽又黄一区二区| 无人区码免费观看不卡| 午夜福利乱码中文字幕| 两人在一起打扑克的视频| 亚洲成人国产一区在线观看| 成人三级做爰电影| 在线永久观看黄色视频| 欧美日韩国产mv在线观看视频| 日韩视频一区二区在线观看| 黄网站色视频无遮挡免费观看| 国产亚洲欧美98| 国产在线观看jvid| av国产精品久久久久影院| 久久精品国产亚洲av高清一级| 曰老女人黄片| 久9热在线精品视频| 极品少妇高潮喷水抽搐| 欧美日韩一级在线毛片| 亚洲少妇的诱惑av| 最新美女视频免费是黄的| 日本黄色日本黄色录像| 欧美日韩瑟瑟在线播放| 制服诱惑二区| 国产精品影院久久| 最新的欧美精品一区二区| 国产免费男女视频| 国产精品 国内视频| 欧美国产精品va在线观看不卡| 少妇裸体淫交视频免费看高清 | 夜夜躁狠狠躁天天躁| 99国产精品免费福利视频| 女性被躁到高潮视频| 国产精品美女特级片免费视频播放器 | 中文字幕人妻丝袜一区二区| 免费在线观看视频国产中文字幕亚洲| 亚洲av美国av| 精品国产国语对白av| 日韩大码丰满熟妇| 老熟妇乱子伦视频在线观看| 国产精华一区二区三区| 欧美在线黄色| 成人三级做爰电影| 国产精品九九99| 亚洲专区国产一区二区| 桃红色精品国产亚洲av| 在线视频色国产色| 国产激情欧美一区二区| 亚洲国产看品久久| 正在播放国产对白刺激| 午夜亚洲福利在线播放| 国产成人欧美| x7x7x7水蜜桃| 欧美老熟妇乱子伦牲交| 国产精品久久久久成人av| 啪啪无遮挡十八禁网站| av天堂在线播放| 国产成人av激情在线播放| 99在线人妻在线中文字幕 | 18禁美女被吸乳视频| 国产激情久久老熟女| 久久久国产精品麻豆| 黑人巨大精品欧美一区二区mp4| 色94色欧美一区二区| 黄片播放在线免费| 精品久久久久久久毛片微露脸| 两个人看的免费小视频| 身体一侧抽搐| 两人在一起打扑克的视频| 高清视频免费观看一区二区| 成年版毛片免费区| 91av网站免费观看| 18禁观看日本| 丰满迷人的少妇在线观看| 狠狠狠狠99中文字幕| 妹子高潮喷水视频| √禁漫天堂资源中文www| 久久久国产精品麻豆| 99精品在免费线老司机午夜| 亚洲五月天丁香| 亚洲伊人色综图| 欧美乱妇无乱码|