• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于云模型的文本特征自動提取算法

    2011-06-01 08:00:08何中市
    中南大學學報(自然科學版) 2011年3期
    關(guān)鍵詞:特征選擇復雜度類別

    代 勁 ,何中市,胡 峰,

    (1. 重慶大學 計算機科學與技術(shù)學院,重慶,400030;2. 重慶郵電大學 計算機科學與技術(shù)研究所,重慶,400065;3. 西南交通大學 信息科學與技術(shù)學院,四川 成都,610031)

    文本自動分類是信息檢索與數(shù)據(jù)挖掘領(lǐng)域的研究熱點與核心技術(shù),近年來得到了廣泛關(guān)注和快速發(fā)展,在信息檢索[1]、新聞推薦[2]、詞義消歧[3]、文本主題識別[4]、網(wǎng)頁分類[5]等領(lǐng)域有著廣泛應用。文本自動分類的主要難題之一是特征空間維數(shù)過高[6],如何降低特征空間維數(shù)成為文本自動分類中需要首先解決的問題。特征選擇是文本特征降維的一種有效方法[6],很多學者對此進行了深入的研究,并提出了很多有效的方法,比較經(jīng)典的有文檔頻率DF[7]、信息增益IG[7]、χ2統(tǒng)計量 CHI[7]、互信息 MI[8]和多種方法組合[9]等。這些方法按其特征選擇函數(shù)計算函數(shù)值,然后以降序選擇靠前的特征集。在選擇過程中,選擇尺度是一個重要指標,直接影響著文本分類的性能。實驗證明:多數(shù)分類器呈現(xiàn)出隨特征數(shù)量增加,效果快速提高并能迅速接近平穩(wěn)的特點;但若特征數(shù)過大,性能反而可能降低[10-13]。這表明合理的特征選擇尺度不僅能大量降低處理開銷,而且在很多情況下可以改善分類器的效果。在確定特征選擇尺度時,現(xiàn)有特征選擇方法通常采用經(jīng)驗估算方法:如給定特征數(shù)的經(jīng)驗值(PFC)或比例(THR)、考慮統(tǒng)計量閾值(MVS)或向量空間稀疏性(SPA)、特征數(shù)與文本數(shù)成比例(PCS)等一些選擇方法[14]。這些方法在某些特定語料庫上取得比較好的效果,但通常為觀察所得或經(jīng)驗推斷,理論基礎(chǔ)不充分,不便于文本自動分類的進一步推廣研究;因此,研究能適應文本特性的特征自動提取方法是非常必要的。云模型是一種定性定量轉(zhuǎn)換模型[15-18],由于其具有良好的數(shù)學性質(zhì),可以表示自然科學、社會科學中大量的不確定現(xiàn)象[18]。云模型不需要先驗知識,它可以從大量的原始數(shù)據(jù)中分析其統(tǒng)計規(guī)律,實現(xiàn)從定量向定性的轉(zhuǎn)化。本文作者結(jié)合特征在整體與局部上的χ2分布情況,利用云模型在定性知識表示以及定性、定量知識轉(zhuǎn)換時的橋梁作用,引入云隸屬度概念對特征分布加以修正,并且構(gòu)建了一種逐級動態(tài)聚類算法來獲取特征集,在此基礎(chǔ)上提出一種高性能文本特征自動提取算法。該算法不需要指定聚類數(shù)目,能根據(jù)特征分布特點自動獲取隸屬度高的特征集。分析和開放性實驗結(jié)果表明:該特征集具有特征個數(shù)少、分類精度高的特點,性能明顯比當前主要的特征選擇方法的優(yōu)。

    1 文本特征選擇方法

    特征選擇是通過構(gòu)造一個特征評分函數(shù),把測量空間的數(shù)據(jù)投影到特征空間,得到在特征空間的值,然后,根據(jù)特征空間中的值對每個特征進行評估。特征選擇并沒有改變原始特征空間的性質(zhì),只是從原始特征空間中選擇了一部分重要的特征,組成一個新的低維空間。

    特征選擇是文本特征降維的一種有效方法。目前已有的特征選擇方法主要分為 2類:(1) 傾向于詞頻的特征選擇方法,如 DF,IG,χ2統(tǒng)計量 CHI和 MI等;(2) 傾向于類別的特征選擇方法,如CTD特征選擇方法[19]和帶有強類別信息詞SCIW特征選擇方法[20]等。第1類方法強調(diào)詞頻在所有類別上的整體分布;第2類方法強調(diào)類別信息,而對詞頻在所有類別上的整體分布考慮不充分。如果能有效地結(jié)合詞頻在所有類別的整體分布和在單個類別上的分布情況,將會明顯改善特征選擇性能。

    此外,還有期望交叉熵(ECE)、文本證據(jù)權(quán)(WET)、優(yōu)勢率(OR)等一些特征選擇方法,文獻[21]對DF,IG,MI,CHI,ECE,WET和OR這些特征選擇方法進行了比較,結(jié)果表明:OR方法的效果最好,IG,CHI和ECE的效果次之,WET和DF的效果再次之,MI的效果最差。而Yang等[7,22]認為IG是最好的測度之一。Forman等[10]分別從有效性、區(qū)分能力及獲得最好效果的機會等方面對不同特征選擇方法進行了廣泛比較,結(jié)果表明:CHI和IG等統(tǒng)計量及組合方法具有一定的優(yōu)勢。

    從上述分析看,這些方法對提高文本分類的效果都沒有絕對優(yōu)勢。這是因為文本分類本身涉及訓練數(shù)據(jù)集合本身的特點,同時,不同分類器的分類效果也不盡相同[10-11]。

    2 基于χ2統(tǒng)計量的文本特征分布矩陣

    χ2統(tǒng)計量[7]的概念來自列聯(lián)表檢驗,用來衡量特征ti和類別Cj之間的統(tǒng)計相關(guān)性。實驗證明是一種比較好的特征選擇方法[10,21],它基于ti和Cj之間符合具有一階自由度的χ2分布假設(shè)。ti關(guān)于Cj的χ2可由下式計算:

    式中:N為訓練語料中文檔總數(shù);A為屬于類Cj的文檔頻數(shù);B為不屬于Cj類但包含ti的文檔頻數(shù);C為屬于 Cj類但不包含 ti的文檔頻數(shù);D是既不屬于 Cj也不包含ti的文檔頻數(shù)??芍斕卣鱰i與類別Cj相互獨立時, χ2( ti, Cj) = 0 ,此時特征 ti不包含任何與類別Cj有關(guān)的信息。特征ti與類別Cj的統(tǒng)計相關(guān)性越強,χ2( ti, Cj)越大,此時,特征ti包含的與類別Cj有關(guān)的信息就越多。

    由χ2計算公式可以看出:χ2統(tǒng)計方法作為特征選擇方法時,只考慮了特征在所有文檔出現(xiàn)的文檔頻數(shù)。若某一特征只在一類文檔的少量文檔中頻繁出現(xiàn),則通過χ2計算公式計算的χ2統(tǒng)計值很低,在特征選擇時,這種特征詞就會被排除,但這種在少量文檔中頻繁出現(xiàn)的特征詞很有可能對分類的貢獻很大,如專指概念。這是 χ2統(tǒng)計的不足之處,它對低文檔頻的特征項不可靠。

    基于以上分析,考慮特征在各個類別之間的分布情況,建立特征關(guān)于類別的χ2分布矩陣。定義如下:

    從F的構(gòu)造可以看出:F中的每一行反映了特征在不同類別中的分布情況,每一列反映了在同一類別中不同特征的分布情況。將二者結(jié)合起來,能夠完整反映整個特征集的分布,而且客觀上彌補了χ2統(tǒng)計量作為特征選擇方法上的缺點。

    3 基于云隸屬度的文本特征自動提取算法

    通過分析每一類別上不同特征的 χ2分布情況可見:一些χ2較大的特征在類別中出現(xiàn)頻率極低,而另一些在類別中出現(xiàn)比較頻繁的特征χ2反而很小。這種異常的出現(xiàn)正是由于這些特征打破了χ2統(tǒng)計量基于ti和Cj之間符合具有一階自由度的χ2分布,受整體分布影響較大,需要加以修正。由此,本文為每個特征引入一個模糊概念,用云模型對其在類別上的分布進行定量描述,將特征對于類別的χ2用相應的隸屬度加以修正。

    3.1 云模型簡介

    云模型用語言值表示某個定性概念與其定量表示之間的不確定性[15-18],已經(jīng)在智能控制、模糊評測等多個領(lǐng)域得到應用。

    定義1[15]設(shè)U是一個用數(shù)值表示的定量論域,C是U上定性概念。若定量值 Ux∈ 是定性概念C的一次隨機實現(xiàn),x對C的確定度]1,0[)(∈xμ是有穩(wěn)定傾向的隨機數(shù),μ: U→[0, 1], Ux∈?, x→μ(x),則x在論域U上的分布稱為云,記為云C(X)。每一個x稱為一個云滴。如果概念對應的論域是n維空間,那么可以拓廣至n維云。

    隸屬度在基礎(chǔ)變量上的分布稱為云。在對模糊集的處理過程中,論域中某一點到它的隸屬度之間的映射是一對多的轉(zhuǎn)換,不是一條明晰的隸屬曲線,從而產(chǎn)生了云的概念。

    云用期望Ex(Expected value)、熵En(Entropy)、超熵He(Hyper entropy)這3個數(shù)字特征來整體表征一個概念。期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點;熵En代表定性概念的可度量粒度,熵越大,通常概念越宏觀,也是定性概念不確定性的度量,由概念的隨機性和模糊性共同決定。超熵He是熵的不確定性度量,即熵的熵,由熵的隨機性和模糊性共同決定。用3個數(shù)字特征表示的定性概念的整體特征記作C(Ex,En,He),稱為云的特征向量。

    正向云算法[15]和逆向云算法[15]是云模型中2個最基本、最關(guān)鍵的算法。前者把定性概念的整體特征變換為定量數(shù)值表示,實現(xiàn)概念空間到數(shù)值空間的轉(zhuǎn)換;后者實現(xiàn)從定量值到定性概念的轉(zhuǎn)換,將一組定量數(shù)據(jù)轉(zhuǎn)換為以數(shù)字特征{Ex,En,He}來表示的定性概念。

    3.2 基于云隸屬度的文本特征自動提取算法

    通過特征χ2分布矩陣,特征的取值不僅反映了特征對整個分類作用大小,也反映了該特征對于每一類別的貢獻程度。通過云模型隸屬度函數(shù)的引入,更修正了特征在類別中的分布情況。通過提取每一類別隸屬度最高的特征集,合并而成最終的分類特征集合,不僅可以保留對整個分類貢獻最大的特征集,同時兼顧某些特征集較少(或者在某一類中出現(xiàn)頻率大,但總體出現(xiàn)概率低的特征)的類別。

    在對特征取值進行隸屬度表示后,特征在類別上的取值表示成了[0,1]區(qū)間上的連續(xù)值。特征對類別的相關(guān)性越大,其隸屬度越高。但每一類別仍包含大量特征,其中很大一部分特征對于類別的隸屬度極低,需要對特征集進行初步篩選,減少特征提取計算量。

    定義 3[17]一維論域中 U中,任一小區(qū)間上的云滴群Δx對定性概念A的貢獻ΔC為:

    由定義3,可以計算得到U上所有元素對概念A的總貢獻C為:

    基于以上分析,通過計算可以得到位于區(qū)間[Ex-0.67En, Ex+0.67En]的特征,占特征總量的22.33%,但它們對類別的貢獻占50%,能夠滿足特征提取需要,故將在此區(qū)間的特征篩選為初選特征集。

    在特征的提取上,可以采用動態(tài)聚類方法進行處理。但是,在聚類過程中,類別個數(shù)應該是與數(shù)據(jù)本身特性有關(guān),而不是一個經(jīng)驗值。因此,采用逐步試探聚類類別個數(shù)直至最終滿足聚類要求的思路,提出了逐級動態(tài)聚類算法。

    算法1:逐級動態(tài)聚類算法。

    輸入:類別向量Ci//即第2節(jié)中χ2分布矩陣F中的列向量。

    輸出:特征集合Ti。

    算法步驟:

    (1) 提取Ci中所有不重復的特征隸屬度以升序構(gòu)成新類別向量, Clusterid},其中Clusterid為聚類類別編號。

    (3) 初始類別K=1,v=e+1 //v為循環(huán)控制變量。

    (4) WHILE (v>e) DO //當v≤e時,各類的聚合程度已經(jīng)比較好,聚類結(jié)束。

    1) 構(gòu)建中心類別表TC:將iC′平均分成K+1份,取區(qū)間右端點加入TC,作為C′在K情況下的初始類別,同時將iC′各元素Clusterid置為0;

    2) 設(shè)定臨時循環(huán)控制變量e1=0;

    3) 當 e1≠v時,執(zhí)行以下循環(huán): //聚類穩(wěn)定后,各類的標準差將收斂為穩(wěn)定值。

    ① e1=v;

    ② 計算iC′中每個值與 TC中各類別距離,將其歸并到距離最小的類別中;

    ③ 根據(jù)加權(quán)平均修正 TC中各類別的中心距離;

    ④ 計算 TC中各類別的標準差 Si,令

    4) K=K+1 //聚類類別數(shù)加1,進行下一輪的聚類處理。

    LOOP

    (5) 聚類結(jié)束,K′=K-1即為聚類類別數(shù)。編號為K′的特征為類別 Ci隸屬度最大的特征集,Ti= { tj|tj∈Ci∧Clusterid=K′}。

    (6) RETURN Ti。

    算法1的復雜度分析:設(shè)類別Ci上特征的平均個數(shù)為n,算法時間復雜度主要由步驟(4)決定。步驟(4)是一個典型的 k均值聚類[24],其時間復雜度為O ( k × n ),因此,步驟(4)的時間復雜度為 O ( k2× n )(其中,k為平均聚類個數(shù))。故算法 1的時間復雜度為O ( k2× n ),空間復雜度為O(n)。

    在算法1的基礎(chǔ)上,提出了一種云隸屬度下的文本特征自動提取算法。該算法不需要指定聚類數(shù)目,能根據(jù)特征分布特點自動獲取隸屬度高的特征集,具體見算法2。

    算法 2:基于云隸屬度的文本特征自動提取算法(FAS)。

    輸入:特征χ2分布矩陣F,訓練集TR。

    輸出:經(jīng)過特征選擇后的訓練集 RT′。

    算法步驟:

    初始化特征集φ=T;

    依次選擇F中每一列Ci,進行以下步驟處理:

    1) 運用逆向云算法計算 Ci的數(shù)字特征 C(Ex, En,He);

    2) 運用正向云算法將 Ci特征值轉(zhuǎn)化成對應隸屬度;

    3) 將Ci中區(qū)間[Ex-0.67En, Ex+0.67En]外的特征刪除,得到初次約簡類別向量iC′;

    4) 在iC′基礎(chǔ)上調(diào)用逐級動態(tài)聚類算法(算法1)得到選擇后特征集Ti;

    5)iTTT∪=

    6) 刪除TR中不屬于T的所有特征項,得到選擇處理后訓練集 RT′。

    算法2的復雜度分析:設(shè)訓練集類別平均特征數(shù)為 n,類別數(shù)為 m,則算法 2的時間復雜度為O(k2×n×m) (k為平均聚類個數(shù)),空間復雜度為O(n)。

    4 實驗及其結(jié)果分析

    為了測試本文算法的有效性,對FAS算法進行橫向?qū)Ρ葴y試。實驗中,采用性能較好的kNN分類器算法[25](k=30)進行文本分類測試。測試結(jié)果用準確率(即分類正確數(shù)/實際分類數(shù))、查全率(即分類正確數(shù)/應有數(shù))和宏平均P為準確率;R為召回率)進行評測。

    4.1 語料庫

    實驗選用中文語料庫 TanCorpV1.0[26]與英文語料庫Reuters-21578[27]。 TanCorpV1.0包含文本14 150篇,共分為12類。經(jīng)過停用詞移除、詞干還原等處理后,得到詞條72 584個。

    對于Reuters-21578,使用只有1個類別且每個類別至少包含5 個以上的文檔。這樣,得到訓練集5 273篇、測試集1 767篇。經(jīng)過停用詞移除、詞干還原等處理后,得到13 961個詞條。

    4.2 實驗過程及結(jié)果分析

    現(xiàn)有特征選擇方法通常采用經(jīng)驗方式來確定特征數(shù)目,為了得到各特征選擇方法在達到最佳分類性能時的特征數(shù),采用了逐步增加特征數(shù)的方法來確定。測試結(jié)果如表1和2所示。

    從表1和2可以看出:IG和CHI方法隨著特征數(shù)的增加,分類性能提升較快,而 MI方法需要的特征數(shù)則較多,性能提升緩慢。同時,當特征數(shù)達到某個閾值時,各特征選擇方法性能均會達到最佳狀態(tài)。但此閾值的獲取因特征選擇方法的不同、語料庫的差異而各有不同,需要大量實驗才能得到。

    表1 TanCorpV1.0上各特征選擇方法在不同特征數(shù)下性能比較Table1 Performance of feature selection methods with different number of features on TanCorpV1.0

    表2 Reuters-21578上各特征選擇方法在不同特征數(shù)下性能比較Table2 Performance of feature selection methods with different number of features on Reuters-21578

    表3 TanCorpV1.0上各特征選擇方法分類性能比較Table3 Classification performance comparison on TanCorpV1.0

    表4 Reuters-21578上各特征選擇方法分類性能比較Table4 Classification performance comparison on Reuters-21578

    而使用FAS算法在TanCorpV1.0上自動提取的特征數(shù)平均為1 380個,在Reuters-21578上自動提取的特征數(shù)平均為239個,不僅不需要任何經(jīng)驗知識,而且特征數(shù)明顯少于已有特征選擇方法的特征數(shù)。將FAS算法選擇的特征集進行分類測試,性能比較結(jié)果見表3和4。

    從表3和4可以看出:與IG,CHI和MI這3種算法相比,F(xiàn)AS算法提取的特征集具有個數(shù)少、分類精度高的特點。kNN方法在TanCorpV1.0上的最好宏平均(F1=84.78%)[26]與 Reuters-21578上的最好宏平均(F1=86.1%)[22]相比,基于FAS算法提取特征集上,kNN方法宏平均提高了5%~6%,說明該算法提取的特征集具有比較高的類別描述能力。

    從分類的時間開銷來看,雖然FAS算法在特征提取階段耗費了一定的時間,但從整體上看,遠低于其他方法所需的時間。這是因為整個分類的時間主要由特征選擇及分類耗時組成。FAS算法的時間復雜度為O(k2×n×m)(k為平均聚類個數(shù),n為特征數(shù),m為類別數(shù)),而通常分類算法的時間復雜度至少為O ( m × n2)以上,特征數(shù)的多少對整個分類時間耗費起著至關(guān)重要的作用。IG,CHI和MI雖然在選擇階段不需要耗費時間,但一方面如何找到最優(yōu)的特征數(shù)需要多次測試,另一方面由于所選特征遠較 FAS算法多,直接導致整個分類時間耗費大幅度增加。

    從性能比較分析發(fā)現(xiàn),F(xiàn)AS算法提取出來的特征雖然不到IG和CHI算法的結(jié)果的一半,但分類性能明顯高于后者。性能提升是特征集的選取變化所致。為此,以TanCorpV1.0為例,考察特征集分布情況,如圖1所示。

    圖1 TanCorpV1.0上各特征選擇方法特征集分布情況Fig.1 Distribution of feature sets selected by different selection method on TanCorpV1.0

    從圖1可以看出,F(xiàn)AS算法提取了每個類別較重要的特征集,保證了不同類別之間關(guān)鍵特征大致均勻分布,同時引入的云隸屬度概念對特征值的χ2分布進行比較好的修正,因而有效提高了文本的分類性能,這在特征數(shù)少的類別中尤為明顯。

    5 結(jié)論

    (1) 本文提出的FAS算法提取出來的特征不僅具有特征個數(shù)少、分類精度高的特點,而且整體大幅度降低了分類時間。

    (2) FAS算法的性能明顯比當前主要特征選擇方法的性能優(yōu)。

    [1] Charles-Antoine J, John E, France B. Controlled user evaluations of information visualization interfaces for text retrieval:literature review and meta-analysis[J]. Journal of the American Society for Information Science and Technology, 2008, 59(6):1012-1024.

    [2] Haruechaivasak, Choochart J, Wittawat S. Implementing news article category browsing based on text categorization technique[C]// Proc of Web Intelligence and Intelligent Agent Technology (WI-IAT 2008). Piscataway: IEEE, 2008: 143-146.

    [3] Myunggwon H, Chang C, Byungsu Y, et al. Word sense disambiguation based on relation structure[C]// Proc of Advanced Language Processing and Web Information Technology (ALPIT 2008). Piscataway: IEEE, 2008: 15-20.

    [4] Xuerui W, Mccallum A, Xing W. Topical n-grams: phrase and topic discovery, with and application to information retrieval[C]// 7th IEEE International Conference on Data Mining(ICDM 2007). Piscataway: IEEE, 2007: 697-702.

    [5] Selvakuberan K, Indradevi M, Rajaram R. Combined feature selection and classification: A novel approach for the categorization of web pages[J]. Journal of Information and Computing Science, 2008, 3(2): 83-89.

    [6] 蘇金樹, 張博鋒, 徐昕. 基于機器學習的文本分類技術(shù)研究進展[J]. 軟件學報, 2006, 17(9): 1848-1859.

    SU Jin-shu, ZHANG Bo-feng, XU Xin. Advances in machine learning based text categorization[J]. Journal of Software, 2006,17(9): 1848-1859.

    [7] Yang Y M, Pedersen J O. A comparative study on feature selection in text categorization[C]// Proc of the 14th International Conference on Machine Learning (ICML 1997). San Francisco:MIT Press, 1997: 412-420.

    [8] Jana N, Petr S, Michal H. Conditional mutual information based feature selection for classification task[C]// Proc of the 12th Iberoamericann Congress on Pattern Recognition (CIAPR 2007).Berlin: Springer-Verlag, 2007: 417-426.

    [9] Santana L E A, de Oliveira D F, Canuto A M P, et al. A comparative analysis of feature selection methods for ensembles with different combination methods[C]// Proc of Internation Joint Conference on Neural Networks (IJCNN 2007). Piscataway:IEEE, 2007: 643-648.

    [10] Forman G. An extensive empirical study of feature selection metrics for text classification[J]. Journal of Machine Learning Research, 2003, 3(1): 1533-7928.

    [11] Kim H, Howland P, Park H. Dimension reduction in text classification with support vector machines[J]. Journal of Machine Learning Research, 2005, 6(1): 37-53.

    [12] Rogati M, Yang Y. High-performing feature selection for text classification[C]// Proc of the 11th ACM Int’l Conf on Information and Knowledge Management (CIKM 2002).McLean: ACM Press, 2002: 659-661.

    [13] Makrehchi M, Kame M S. Text classification using small number of features[C]// Proc of the 4th International Conference on Machine Learning and Data Mining in Pattern Recognition(MLDM 2005). Berlin: Springer-Verlag, 2005: 580-589.

    [14] Soucy P, Mineau G W. Feature selection strategies for text categorization[C]// Proc of the 16th Conf of the Canadian Society for Computational Studies of Intelligence (CSCSI 2003).Halifax: Springer-Verlag, 2003: 505-509.

    [15] 李德毅. 不確定性人工智能[M]. 北京: 國防工業(yè)出版社,2005: 171-177.

    LI De-yi. Artificial intelligence with uncertainty[M]. Beijing:National Defense Industry Press, 2005: 171-177.

    [16] 李德毅, 劉常昱. 論正態(tài)云模型的普適性[J]. 中國工程科學,2004, 6(8): 28-34.

    LI De-yi, LIU Chang-yu. Study on the universality of the normal cloud model[J]. Engineering Science, 2004, 6(8): 28-34.

    [17] 李德毅, 劉常昱, 杜鹢, 等. 不確定性人工智能[J]. 軟件學報,2004, 15(11): 1583-1594.

    LI De-yi, LIU Chang-yu, DU Yi, et al. Artificial intelligence with uncertainty[J]. Journal of Software, 2004, 15(11):1583-1594.

    [18] 張光衛(wèi), 康建初, 李鶴松, 等. 基于云模型的全局最優(yōu)化算法[J]. 北京航空航天大學學報, 2007, 33(4): 486-491.

    ZHANG Guang-wei, KANG Jian-chu, LI He-song, et al. Cloud model based algorithm for global optimization of functions[J].Journal of Beijing University of Aeronautics and Astronautics,2007, 33(4): 486-491.

    [19] Bong C H, Narayanan K. An empirical study of feature selection for text categorization based on term weightage[C]// Proc of the IEEE/WLC/ACM Int’l Conf on Web Intelligence (WI 2004).Beijing: IEEE Computer Society Press, 2004: 599-602.

    [20] Li S, Zong C Q. A new approach to feature selection for text categorization[C]// Proc of the IEEE Int’1 Conf on Natural Language Processing and Knowledge Engineering (NLP-KE 2005). Wuhan: IEEE Press, 2005: 626-630.

    [21] 胡佳妮, 徐蔚然, 郭軍, 等. 中文文本分類中的特征選擇算法研究[J]. 光通信研究, 2005, 3(129): 44-46.

    HU Jia-ni, XU Wei-ran, GUO Jun, et al. Study on feature selection methods in Chinese text categorization[J]. Study on Optical Communications, 2005, 3(129): 44-46.

    [22] 徐燕, 李錦濤, 王斌, 等. 文本分類中特征選擇的約束研究[J].計算機研究與發(fā)展, 2008, 45(4): 596-602.

    XU Yan, LI Jing-tao, WANG Bin, et al. A study on constraints for feature selection in text categorization[J]. Journal of Computer Research and Development, 2008, 45(4): 596-602.

    [23] 張光衛(wèi), 李德毅, 李鵬, 等. 基于云模型的協(xié)同過濾推薦算法[J]. 軟件學報, 2007, 18(10): 2403-2411.

    ZHANG Guang-wei, LI De-yi, LI Peng, et al. A collaborative filtering recommendation algorithm based on cloud model[J].Journal of Software, 2007, 18(10): 2403-2411.

    [24] Dai W H, Jiao C Z, He T. Research of k-means clustering method based on parallel genetic algorithm[C]// Proc of the 3rd Int’l Conf on Intelligent Information Hiding and Multimedia Signal Processing (IIHMSP 2007). 2007: 158-161.

    [25] Yang Y, Liu X. A re-examination of text categorization methods[C]// Proc of the 22nd Annual Int’l ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR 1999). Berkeley, 1999: 42-49.

    [26] Tan S, Cheng X, Ghanem M, et al. A novel refinement approach for text categorization[C]// Proc of the 14th ACM Conf on Information and Knowledge Management (CIKM 2005).Bremen: ACM Press, 2005: 469-476.

    [27] David L. Reuters-21578 test collection[EB/OL]. [2007-02-04].http://www.daviddlewis.corn/resources/testcollections/reuters 21578/.

    猜你喜歡
    特征選擇復雜度類別
    一種低復雜度的慣性/GNSS矢量深組合方法
    求圖上廣探樹的時間復雜度
    Kmeans 應用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    某雷達導51 頭中心控制軟件圈復雜度分析與改進
    聯(lián)合互信息水下目標特征選擇算法
    服務類別
    新校長(2016年8期)2016-01-10 06:43:59
    出口技術(shù)復雜度研究回顧與評述
    論類別股東會
    商事法論集(2014年1期)2014-06-27 01:20:42
    中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
    基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
    国产免费福利视频在线观看| 欧美精品一区二区大全| 国产精品一国产av| 中文精品一卡2卡3卡4更新| 丝袜美足系列| 亚洲精品国产区一区二| 赤兔流量卡办理| 亚洲人成77777在线视频| av在线观看视频网站免费| 亚洲成国产人片在线观看| 91精品伊人久久大香线蕉| 国产精品国产三级国产专区5o| avwww免费| 伦理电影大哥的女人| 国产极品天堂在线| 亚洲色图 男人天堂 中文字幕| 十分钟在线观看高清视频www| xxx大片免费视频| 亚洲情色 制服丝袜| 最近2019中文字幕mv第一页| tube8黄色片| 亚洲成色77777| 看非洲黑人一级黄片| 欧美精品av麻豆av| 久久久久网色| 乱人伦中国视频| 免费在线观看完整版高清| 婷婷色麻豆天堂久久| 国产成人啪精品午夜网站| 2021少妇久久久久久久久久久| 亚洲图色成人| 美女高潮到喷水免费观看| 欧美日韩视频精品一区| 成人18禁高潮啪啪吃奶动态图| 无限看片的www在线观看| 亚洲国产精品国产精品| 伦理电影大哥的女人| 日韩伦理黄色片| 人人妻人人添人人爽欧美一区卜| 一级a爱视频在线免费观看| 性色av一级| 日韩欧美精品免费久久| 亚洲国产欧美一区二区综合| 高清视频免费观看一区二区| 99re6热这里在线精品视频| 国产精品久久久人人做人人爽| 亚洲成人国产一区在线观看 | 亚洲av在线观看美女高潮| 国产精品麻豆人妻色哟哟久久| 日韩 欧美 亚洲 中文字幕| 宅男免费午夜| 午夜福利免费观看在线| 精品国产乱码久久久久久男人| 电影成人av| 又大又黄又爽视频免费| www.熟女人妻精品国产| 久久久久网色| 男人添女人高潮全过程视频| 伊人亚洲综合成人网| 久久久国产一区二区| 亚洲四区av| 亚洲国产毛片av蜜桃av| 男女之事视频高清在线观看 | 国产人伦9x9x在线观看| 曰老女人黄片| 两个人免费观看高清视频| 久久免费观看电影| 欧美另类一区| 亚洲五月色婷婷综合| 国产不卡av网站在线观看| 这个男人来自地球电影免费观看 | 国产精品一区二区在线观看99| 又大又黄又爽视频免费| 十分钟在线观看高清视频www| 91老司机精品| 丝袜在线中文字幕| 国产欧美亚洲国产| 亚洲美女视频黄频| 午夜91福利影院| 亚洲av成人不卡在线观看播放网 | 成人18禁高潮啪啪吃奶动态图| 国产又色又爽无遮挡免| 亚洲精品久久成人aⅴ小说| 97在线人人人人妻| 波多野结衣av一区二区av| 国产成人午夜福利电影在线观看| 亚洲人成77777在线视频| 中文天堂在线官网| 日本av免费视频播放| av片东京热男人的天堂| 男女高潮啪啪啪动态图| 丁香六月欧美| 人妻人人澡人人爽人人| 老司机在亚洲福利影院| 热re99久久精品国产66热6| 久久精品国产a三级三级三级| 国产av一区二区精品久久| 不卡视频在线观看欧美| 国产福利在线免费观看视频| 日本午夜av视频| 色综合欧美亚洲国产小说| 一区二区三区四区激情视频| av女优亚洲男人天堂| 丝瓜视频免费看黄片| 午夜福利,免费看| 亚洲av中文av极速乱| 亚洲情色 制服丝袜| 女的被弄到高潮叫床怎么办| 久久国产精品大桥未久av| 国产97色在线日韩免费| 男人爽女人下面视频在线观看| 精品一品国产午夜福利视频| 91国产中文字幕| 久久久久久久精品精品| 免费黄网站久久成人精品| 老司机影院毛片| 一本色道久久久久久精品综合| 曰老女人黄片| 久久av网站| 国产熟女午夜一区二区三区| 毛片一级片免费看久久久久| 搡老岳熟女国产| 国产成人精品久久久久久| 欧美少妇被猛烈插入视频| 一边摸一边做爽爽视频免费| 午夜福利,免费看| 视频区图区小说| 久久精品国产综合久久久| 免费少妇av软件| 亚洲精品日韩在线中文字幕| 久久综合国产亚洲精品| 999久久久国产精品视频| 一级毛片黄色毛片免费观看视频| 可以免费在线观看a视频的电影网站 | 成人18禁高潮啪啪吃奶动态图| 国产精品久久久久久久久免| 国产有黄有色有爽视频| 熟女少妇亚洲综合色aaa.| 九色亚洲精品在线播放| 久久毛片免费看一区二区三区| 国产精品国产三级专区第一集| 久久精品久久精品一区二区三区| 亚洲专区中文字幕在线 | 五月天丁香电影| 少妇被粗大的猛进出69影院| 亚洲精品视频女| 91老司机精品| 涩涩av久久男人的天堂| 老鸭窝网址在线观看| 欧美国产精品一级二级三级| 如何舔出高潮| 精品国产乱码久久久久久男人| 免费久久久久久久精品成人欧美视频| 超碰97精品在线观看| 大香蕉久久网| 亚洲av成人精品一二三区| 精品久久久精品久久久| 久久久国产欧美日韩av| 99国产精品免费福利视频| 国产精品久久久久久精品电影小说| 久久久久久久久免费视频了| 国产免费一区二区三区四区乱码| a级毛片黄视频| 99久久人妻综合| 久久精品国产亚洲av涩爱| 亚洲av国产av综合av卡| 一级毛片 在线播放| 日日摸夜夜添夜夜爱| 国产无遮挡羞羞视频在线观看| 国产精品香港三级国产av潘金莲 | 欧美激情极品国产一区二区三区| 只有这里有精品99| 9色porny在线观看| www.自偷自拍.com| 天天操日日干夜夜撸| 精品第一国产精品| 九九爱精品视频在线观看| 久久精品国产亚洲av高清一级| 9色porny在线观看| 精品亚洲成a人片在线观看| 人成视频在线观看免费观看| 我的亚洲天堂| 午夜福利视频在线观看免费| 亚洲精品,欧美精品| 精品少妇内射三级| 久久久精品免费免费高清| 婷婷色综合大香蕉| 国产精品嫩草影院av在线观看| 亚洲精品一二三| 极品人妻少妇av视频| 97精品久久久久久久久久精品| 伦理电影大哥的女人| 熟女少妇亚洲综合色aaa.| 老司机靠b影院| 欧美激情高清一区二区三区 | 欧美日本中文国产一区发布| av片东京热男人的天堂| 韩国高清视频一区二区三区| 精品国产露脸久久av麻豆| 亚洲欧洲日产国产| 国产成人精品无人区| 人人澡人人妻人| 丁香六月天网| 国产精品久久久久久人妻精品电影 | av在线老鸭窝| av在线观看视频网站免费| 天天躁日日躁夜夜躁夜夜| 男女无遮挡免费网站观看| av福利片在线| 国产精品熟女久久久久浪| 国产又色又爽无遮挡免| 女人精品久久久久毛片| 久久人人爽人人片av| 成人亚洲精品一区在线观看| 国产成人啪精品午夜网站| 男人舔女人的私密视频| 久久天躁狠狠躁夜夜2o2o | 亚洲图色成人| 亚洲精品视频女| 日韩欧美精品免费久久| 亚洲,欧美精品.| 亚洲一卡2卡3卡4卡5卡精品中文| 中文字幕精品免费在线观看视频| 欧美老熟妇乱子伦牲交| 国产一区亚洲一区在线观看| 婷婷色av中文字幕| 在线看a的网站| 久久99热这里只频精品6学生| 涩涩av久久男人的天堂| 久久99精品国语久久久| 中文字幕精品免费在线观看视频| 中文字幕人妻丝袜一区二区 | a级片在线免费高清观看视频| 99久久精品国产亚洲精品| 侵犯人妻中文字幕一二三四区| 久久久久久久久久久免费av| 国产成人啪精品午夜网站| www.自偷自拍.com| 超色免费av| 无限看片的www在线观看| 精品少妇黑人巨大在线播放| 又粗又硬又长又爽又黄的视频| 天天躁夜夜躁狠狠躁躁| 老鸭窝网址在线观看| av卡一久久| 久久狼人影院| 精品一区二区三区四区五区乱码 | 亚洲国产精品国产精品| 免费人妻精品一区二区三区视频| 午夜福利影视在线免费观看| 欧美日本中文国产一区发布| 夫妻午夜视频| tube8黄色片| 在线观看免费日韩欧美大片| 在现免费观看毛片| 性高湖久久久久久久久免费观看| 国产视频首页在线观看| 在线观看人妻少妇| 一区在线观看完整版| 男人爽女人下面视频在线观看| 午夜福利免费观看在线| 两个人看的免费小视频| 秋霞伦理黄片| 性少妇av在线| 国产一级毛片在线| 母亲3免费完整高清在线观看| 91精品伊人久久大香线蕉| 另类亚洲欧美激情| 色吧在线观看| 女的被弄到高潮叫床怎么办| 亚洲精品自拍成人| 欧美国产精品va在线观看不卡| 在线精品无人区一区二区三| 夫妻午夜视频| 天天躁狠狠躁夜夜躁狠狠躁| 午夜av观看不卡| 亚洲精品日本国产第一区| 国产在线免费精品| 黄片播放在线免费| 另类精品久久| 亚洲中文av在线| 国产精品.久久久| 国产一区二区三区综合在线观看| 日本午夜av视频| 国精品久久久久久国模美| 91成人精品电影| a级毛片在线看网站| 啦啦啦视频在线资源免费观看| 精品亚洲成国产av| 免费观看av网站的网址| av国产久精品久网站免费入址| 亚洲成人手机| 男女午夜视频在线观看| 国产乱人偷精品视频| 黄频高清免费视频| 成人漫画全彩无遮挡| 天堂俺去俺来也www色官网| 欧美日本中文国产一区发布| av网站在线播放免费| 青春草国产在线视频| 国产精品二区激情视频| 又大又爽又粗| 最近中文字幕高清免费大全6| 婷婷色av中文字幕| 伦理电影大哥的女人| xxx大片免费视频| 一级黄片播放器| 久久久国产精品麻豆| 色视频在线一区二区三区| 日韩一区二区视频免费看| 桃花免费在线播放| 男人舔女人的私密视频| 一区在线观看完整版| 在线免费观看不下载黄p国产| 午夜福利在线免费观看网站| 国产成人av激情在线播放| 亚洲国产看品久久| av片东京热男人的天堂| 亚洲图色成人| 看非洲黑人一级黄片| 久久久久久免费高清国产稀缺| 久久99一区二区三区| 欧美日韩国产mv在线观看视频| 不卡视频在线观看欧美| 丰满迷人的少妇在线观看| 精品国产一区二区三区四区第35| 色婷婷av一区二区三区视频| 韩国精品一区二区三区| 99精品久久久久人妻精品| 久久精品久久久久久久性| 母亲3免费完整高清在线观看| 热99国产精品久久久久久7| videosex国产| 午夜福利视频精品| 亚洲在久久综合| 国产高清国产精品国产三级| 日韩欧美一区视频在线观看| 各种免费的搞黄视频| 高清在线视频一区二区三区| 我要看黄色一级片免费的| 性高湖久久久久久久久免费观看| 啦啦啦视频在线资源免费观看| 一本一本久久a久久精品综合妖精| 丰满乱子伦码专区| 涩涩av久久男人的天堂| 男的添女的下面高潮视频| 亚洲av中文av极速乱| 亚洲av日韩在线播放| 亚洲综合色网址| www日本在线高清视频| 99国产精品免费福利视频| 国产精品一区二区在线不卡| 久久久欧美国产精品| 亚洲国产中文字幕在线视频| 午夜影院在线不卡| 精品久久蜜臀av无| 波多野结衣av一区二区av| 成人国语在线视频| 天天躁狠狠躁夜夜躁狠狠躁| 日韩大片免费观看网站| 亚洲少妇的诱惑av| 精品久久久久久电影网| 久久人人97超碰香蕉20202| 成人黄色视频免费在线看| 国产精品久久久久久精品古装| 最新的欧美精品一区二区| 一二三四在线观看免费中文在| 午夜福利网站1000一区二区三区| 中文乱码字字幕精品一区二区三区| 欧美激情高清一区二区三区 | 青春草视频在线免费观看| 精品久久蜜臀av无| 国产精品麻豆人妻色哟哟久久| 中国三级夫妇交换| 涩涩av久久男人的天堂| 亚洲免费av在线视频| 国产亚洲精品第一综合不卡| 亚洲一级一片aⅴ在线观看| 国产乱人偷精品视频| 色婷婷av一区二区三区视频| 精品亚洲成a人片在线观看| 十分钟在线观看高清视频www| 女人高潮潮喷娇喘18禁视频| 女人精品久久久久毛片| videos熟女内射| 亚洲av男天堂| 亚洲av成人不卡在线观看播放网 | 黄片无遮挡物在线观看| 日韩中文字幕欧美一区二区 | 黑人欧美特级aaaaaa片| 国产伦理片在线播放av一区| 青青草视频在线视频观看| 久久精品国产亚洲av涩爱| 久久精品国产亚洲av高清一级| 我要看黄色一级片免费的| 免费观看人在逋| 纵有疾风起免费观看全集完整版| 欧美国产精品va在线观看不卡| 亚洲第一区二区三区不卡| 欧美人与性动交α欧美软件| 欧美激情极品国产一区二区三区| 久久影院123| 女人被躁到高潮嗷嗷叫费观| 亚洲欧美日韩另类电影网站| a级片在线免费高清观看视频| 中文欧美无线码| 欧美精品亚洲一区二区| 亚洲av日韩精品久久久久久密 | 国产伦理片在线播放av一区| 免费在线观看黄色视频的| 亚洲一区中文字幕在线| 国产在线视频一区二区| 一本—道久久a久久精品蜜桃钙片| 97精品久久久久久久久久精品| 久久久国产精品麻豆| 成人漫画全彩无遮挡| 99re6热这里在线精品视频| 最近中文字幕高清免费大全6| 伦理电影大哥的女人| 精品少妇内射三级| 天堂中文最新版在线下载| 老司机亚洲免费影院| 欧美在线一区亚洲| 亚洲精品成人av观看孕妇| 亚洲美女黄色视频免费看| 黄色 视频免费看| 欧美人与性动交α欧美精品济南到| 18禁观看日本| 日韩一卡2卡3卡4卡2021年| 男女午夜视频在线观看| 2018国产大陆天天弄谢| 午夜福利,免费看| 久久精品久久精品一区二区三区| 99热网站在线观看| 丁香六月天网| 高清av免费在线| 免费看不卡的av| 一本色道久久久久久精品综合| 亚洲专区中文字幕在线 | 大片免费播放器 马上看| 男女床上黄色一级片免费看| 亚洲精品国产一区二区精华液| 自线自在国产av| 制服丝袜香蕉在线| 黑人欧美特级aaaaaa片| 十八禁高潮呻吟视频| 亚洲欧美精品自产自拍| 天美传媒精品一区二区| 欧美在线黄色| 少妇被粗大猛烈的视频| 久久久久国产精品人妻一区二区| 欧美日韩亚洲综合一区二区三区_| 搡老乐熟女国产| 亚洲图色成人| 如日韩欧美国产精品一区二区三区| 国产精品熟女久久久久浪| 成人亚洲精品一区在线观看| 两个人看的免费小视频| 精品一品国产午夜福利视频| 可以免费在线观看a视频的电影网站 | 日本欧美视频一区| 在线观看免费午夜福利视频| 韩国av在线不卡| 天天躁夜夜躁狠狠久久av| 亚洲综合精品二区| 国产成人精品福利久久| 国产精品女同一区二区软件| 美女中出高潮动态图| 99热国产这里只有精品6| 久久精品久久久久久久性| 母亲3免费完整高清在线观看| 9热在线视频观看99| 国产精品二区激情视频| 国产精品三级大全| 男人添女人高潮全过程视频| 国产熟女午夜一区二区三区| 国产亚洲一区二区精品| 国产伦人伦偷精品视频| 亚洲国产最新在线播放| 五月开心婷婷网| 两个人看的免费小视频| 国产av一区二区精品久久| 国产亚洲最大av| 欧美精品高潮呻吟av久久| 国产 一区精品| 国产乱来视频区| 国产黄色免费在线视频| 国产在视频线精品| 蜜桃在线观看..| 亚洲精品乱久久久久久| 女人高潮潮喷娇喘18禁视频| 如日韩欧美国产精品一区二区三区| 国产老妇伦熟女老妇高清| 五月开心婷婷网| 色综合欧美亚洲国产小说| 老汉色∧v一级毛片| 又大又爽又粗| 国产精品99久久99久久久不卡 | 久久热在线av| 成年av动漫网址| 一级片免费观看大全| 欧美乱码精品一区二区三区| 午夜福利一区二区在线看| av免费观看日本| 亚洲精品第二区| 一级片免费观看大全| 日韩 亚洲 欧美在线| 电影成人av| 91精品伊人久久大香线蕉| av视频免费观看在线观看| 日本wwww免费看| 亚洲国产欧美日韩在线播放| 两性夫妻黄色片| 老汉色∧v一级毛片| 成人黄色视频免费在线看| 美女视频免费永久观看网站| 91aial.com中文字幕在线观看| 国产精品一区二区精品视频观看| 狠狠婷婷综合久久久久久88av| 欧美乱码精品一区二区三区| 99国产精品免费福利视频| 久久精品久久精品一区二区三区| 精品人妻熟女毛片av久久网站| 一边亲一边摸免费视频| 悠悠久久av| 人成视频在线观看免费观看| 嫩草影院入口| 亚洲在久久综合| 国产精品 欧美亚洲| 国产精品香港三级国产av潘金莲 | 免费不卡黄色视频| 久久久久久人人人人人| 婷婷色综合大香蕉| 一级a爱视频在线免费观看| 久久久亚洲精品成人影院| 免费黄色在线免费观看| 欧美日韩视频精品一区| 久久久久久久大尺度免费视频| 亚洲伊人久久精品综合| 亚洲伊人色综图| 久久久久国产一级毛片高清牌| 人妻 亚洲 视频| 日本av手机在线免费观看| 久久久久精品人妻al黑| 久久精品久久精品一区二区三区| 久久鲁丝午夜福利片| 日本爱情动作片www.在线观看| 啦啦啦 在线观看视频| 操出白浆在线播放| 建设人人有责人人尽责人人享有的| 亚洲精品久久久久久婷婷小说| 国产亚洲一区二区精品| 免费在线观看黄色视频的| 久久久久久久大尺度免费视频| 精品国产一区二区久久| 天天躁狠狠躁夜夜躁狠狠躁| 大码成人一级视频| 蜜桃在线观看..| 国产99久久九九免费精品| 日本黄色日本黄色录像| 咕卡用的链子| 国产成人精品无人区| 热re99久久精品国产66热6| 日本一区二区免费在线视频| 精品人妻一区二区三区麻豆| 亚洲伊人久久精品综合| 天天影视国产精品| 伦理电影免费视频| 国产探花极品一区二区| av国产久精品久网站免费入址| 国产成人精品久久二区二区91 | 日韩精品有码人妻一区| 女人高潮潮喷娇喘18禁视频| 99热国产这里只有精品6| 亚洲av综合色区一区| 男女边摸边吃奶| 国产亚洲一区二区精品| 交换朋友夫妻互换小说| 免费看av在线观看网站| 看非洲黑人一级黄片| 国产一区有黄有色的免费视频| 精品一区二区免费观看| 欧美在线黄色| 一级片'在线观看视频| 欧美黑人精品巨大| 国产一区二区在线观看av| 欧美97在线视频| 两个人看的免费小视频| 老汉色av国产亚洲站长工具| 亚洲欧美一区二区三区久久| 永久免费av网站大全| 一本久久精品| 亚洲精品自拍成人| 在线观看www视频免费| 天天躁夜夜躁狠狠久久av| 水蜜桃什么品种好| 亚洲精品日韩在线中文字幕| 亚洲国产成人一精品久久久| 日韩大片免费观看网站| 久久久精品免费免费高清| 人人澡人人妻人| 看免费成人av毛片| 人妻人人澡人人爽人人| 美女大奶头黄色视频| 午夜激情av网站| 午夜日本视频在线| 免费看av在线观看网站| av片东京热男人的天堂| 亚洲欧美色中文字幕在线| av一本久久久久| 欧美黑人精品巨大| 9色porny在线观看| 国产在线视频一区二区| 在线观看免费高清a一片| 国产av码专区亚洲av|