• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于穩(wěn)定性語義聚類的相關模型估計

    2016-05-14 10:01:54孫芯宇吳江蒲強
    計算機應用 2016年5期
    關鍵詞:信息檢索

    孫芯宇 吳江 蒲強

    摘要:針對由不穩(wěn)定聚類估計的相關模型影響檢索性能的問題,提出了基于穩(wěn)定性語義聚類的相關模型(SSRM)。首先利用初始查詢前N個結果文檔構成反饋數(shù)據(jù)集;然后探測數(shù)據(jù)集中穩(wěn)定的語義類別數(shù)量;接著從穩(wěn)定性語義聚類中選擇與用戶查詢最相似的語義類別估計SSRM;最后通過實驗對模型的檢索性能進行了驗證。對TREC數(shù)據(jù)集5個子集的實驗結果顯示,SSRM相比相關模型(RM)、語義相關模型(SRM),平均準確率(MAP)性能最少提高了32.11%和0.41%;相比基于聚類的文檔模型(CBDM)、基于LDA的文檔模型(LBDM)和Resampling等基于聚類的檢索方法,MAP性能最少提高了23.64%,19.59%和8.03%。實驗結果表明,SSRM有利于改善檢索性能。

    關鍵詞:信息檢索;語義聚類;穩(wěn)定性驗證;獨立分量分析;相關模型估計

    中圖分類號:TP391.3 文獻標志碼:A

    Abstract:To solve the problem of relevance model based on unstable clustering estination and its effect on retrieval performance, a new Stable Semantic Relevance Model (SSRM) was proposed. The feedback data set was first formed by using the top N documents from user initial query, after the stable number of semantic clusters had been detected, SSRM was estimated by those stable semantic clusters selected according to higher userquery similarity. Finally, the SSRM retrieval performance was verified by experiments. Compared with Relevance Model (RM), Semantic Relevance Model (SRM) and the clusteringbased retrieval methods including ClusterBased Document Model (CBDM), LDABased Document Model (LBDM) and Resampling, SSRM has improvement of MAP by at least 32.11%, 0.41%, 23.64%,19.59%, 8.03% respectively. The experimental results show that retrieval performance can benefit from SSRM.

    Key words:information retrieval; semantic clustering; stability validation; Independent Component Analysis (ICA); relevance model estimation

    0 引言

    信息檢索研究中常用偽相關反饋方法估計相關模型,改善用戶查詢,更準確獲取用戶信息需求。相關模型的估計需要用到偽相關反饋技術,通常假設用戶初始查詢的前N個結果文檔是查詢相關的,但大多數(shù)情況下這個假設并不成立。全部N個文檔參與反饋必將帶入不相關噪聲,使得相關模型估計偏離用戶查詢[1-2]。

    聚類技術可將N個查詢結果文檔形成的數(shù)據(jù)集劃分成若干類別,只選擇與用戶查詢最相似的聚類中的文檔估計語言模型,可以減少模型估計中不相關文檔帶來的噪聲。已有研究[3-4]表明,語義聚類技術相比傳統(tǒng)聚類技術在聚類效果上有顯著改善。語義聚類指在未知數(shù)據(jù)類別的潛在語義空間上的聚類操作,語義空間以多個數(shù)據(jù)主題為基張成。語義聚類通常借助本體[4]或利用統(tǒng)計[5-6]的方法進行。本體WordNet可以判斷文檔間的關聯(lián),決定文檔是否劃分到相同的語義聚類。雖然借助本體的語義聚類效果有所改善,但是規(guī)則式的語義聚類方法不能靈活適應各種數(shù)據(jù)。潛在語義索引(Latent Semantic Indexing,LSI)[5]、獨立分量分析(Independent Component Analysis,ICA)[6]采用統(tǒng)計方法分離語義主題,為典型的語義聚類技術。LSI技術將最大方差投影方向定義為語義類別,但最大方差投影方向并不總是表示數(shù)據(jù)的真實語義類別[6]。ICA技術具有在任意方向上分離出數(shù)據(jù)中獨立分量的能力,分量間不要求一定滿足正交關系。相比LSI定義的最大方差投影方向,ICA的任意方向上分離的獨立分量更能表示數(shù)據(jù)中真實存在的語義類別,因此本文采用ICA進行語義聚類。ICA算法分離出的每一個獨立分量代表數(shù)據(jù)中的一個語義類別,以每個獨立分量為基可張成ICA語義空間。

    由于數(shù)據(jù)中未知的語義類別數(shù)量和ICA算法的隨機性,多次運行ICA算法分離的獨立分量是不同的[7],因此得到的數(shù)據(jù)語義聚類也不一樣,也就是語義聚類是不穩(wěn)定的。數(shù)據(jù)本來具有隱含的固定數(shù)量的語義主題,在不穩(wěn)定的語義聚類上估計相關模型必定存在主題偏差。文獻[8-9]利用語義聚類估計了相關模型,并提升了檢索性能,但沒有考慮語義聚類的穩(wěn)定性。

    如果能夠預先探測數(shù)據(jù)中隱含語義類別的個數(shù),那么ICA算法根據(jù)此類別數(shù)量才能分離出接近真實可靠的語義聚類穩(wěn)定性語義聚類。探測數(shù)據(jù)集中的聚類個數(shù)通常使用多個k值重復運行包含隨機性的聚類算法,并利用聚類穩(wěn)定性指標計算不同k值下的聚類穩(wěn)定性,選擇聚類穩(wěn)定性最高的k值作為最合適的聚類個數(shù)[10]。

    針對基于穩(wěn)定聚類的語言模型估計對檢索性能的影響等研究工作較少,本文提出一種基于穩(wěn)定性語義聚類估計的相關模型(Stable Semantic Relevance Model, SSRM),通過探測前N個查詢結果文檔構成的數(shù)據(jù)集中存在的穩(wěn)定語義類別數(shù)量來驗證語義聚類的穩(wěn)定性。本文認為在穩(wěn)定性驗證后的語義聚類中,選擇與用戶查詢最相似的語義類別估計的相關模型,能夠獲取比現(xiàn)有方法更好的檢索性能。

    由于ICA算法的隨機性,在微小差別條件下多次運行ICA算法可以解決單次運行分離獨立分量的不可靠問題。假設數(shù)據(jù)集中存在從1到n的語義類別數(shù)量,通過如下方法保證穩(wěn)定性語義聚類:探測1到n的類別數(shù)量,在同一數(shù)據(jù)集上使用Bootstrapping方法微小改變運行條件,多次運行ICA算法,并聚類得到的一組獨立分量。將聚類質量得分最高對應的探測類別數(shù)量作為數(shù)據(jù)集中穩(wěn)定的語義聚類數(shù)量。

    本文研究工作將解決如下問題:如何驗證語義聚類穩(wěn)定性;如何選擇參與相關模型估計的穩(wěn)定性語義聚類;如何估計基于穩(wěn)定性語義聚類的相關模型;如何利用穩(wěn)定性語義聚類估計的相關模型進行檢索實驗,并將檢索結果在縱向和橫向上同已有典型算法詳細比較,以證明基于穩(wěn)定性語義聚類估計的相關模型能夠帶來檢索性能上的提升。

    1 相關模型和潛在語義聚類的關系

    信息檢索中,通過相關文檔的反饋可以改善用戶查詢,研究表明檢索性能改善效果明顯[11]。用戶查詢已知,相關文檔未知的情況下使得相關模型估計變得困難。文獻[11]提出一種在相關文檔未知情況下,利用用戶查詢和初始查詢結果前面若干文檔估計相關模型的理論方法。方法假設用戶查詢和文檔之間存在一個隱含的相關模型,因此可觀察的用戶查詢和文檔是由隱含的相關模型隨機采樣詞條生成的。這樣,用戶查詢和文檔通過相關模型聯(lián)系起來。

    利用查詢和初始查詢結果的前面若干文檔作為相關反饋文檔,可以近似估計相關模型。有兩種經典的相關模型估計方法[11]:一種假設由反饋文檔估計的文檔模型獨立生成查詢詞條和文檔詞條,查詢詞條和文檔詞條間無關聯(lián)關系;另一種假設查詢詞條由文檔模型獨立生成,但各查詢詞條保持和文檔詞條關聯(lián),關聯(lián)度高的詞條在相關模型估計中擁有較高的權重。

    相關模型的估計通常采用基于聚類的方法[1-2,8-9,12],好處在于可以先對初始查詢結果文檔聚類,然后只選擇用戶查詢最相似的某個類別中的文檔參與估計相關模型?;诰垲惖姆椒ü烙嬒嚓P模型的基本思想是:借助聚類選擇,過濾掉與用戶查詢相似度不高的文檔帶來的噪聲。

    ICA算法已被證明是一種有效的語義聚類方法[8-9],和文獻[8-9]不同的是,本文重點考慮了ICA算法的隨機性造成在同一數(shù)據(jù)集上多次運行ICA算法分離的獨立分量結果不唯一性,也就是語義聚類數(shù)量的不唯一問題,因此有必要驗證ICA算法在不同數(shù)據(jù)類別數(shù)量上分離獨立分量的穩(wěn)定性。本文認為在穩(wěn)定的語義聚類中選擇和用戶查詢最相似的語義類別估計的相關模型能夠改善檢索性能。驗證的基本思想是,假設數(shù)據(jù)集中存在L個語義類別,利用重采樣方法[7,13],在同一數(shù)據(jù)集上分別按1至L個類別,多次運行ICA算法,并將每次得到的一組獨立分量進行聚類。如果在某個數(shù)量m上的語義類別穩(wěn)定,那么獨立分量應接近聚類中心而遠離其他聚類,這時可將分離的獨立分量數(shù)量m作為數(shù)據(jù)集中的語義類別數(shù)量。

    2 ICA語義聚類及穩(wěn)定性驗證

    2.1 ICA語義聚類

    如果將語義空間看成一組相互獨立的隱含主題為基構成的空間,那么混合了隱含主題的一組文檔在語義空間上張成用戶可觀察的文檔集合[14]。已知混合主題的文檔集合,利用ICA技術可分離其中的隱含主題,即將文檔集表示為獨立分量的線性組合[6]。本文將獨立分量表示的相互獨立的隱含主題定義為文檔集中的語義類別。ICA模型如式(1):

    2.2 語義聚類的穩(wěn)定性驗證

    多次利用隨機性和無監(jiān)督的ICA算法分離的語義類別是不同的。如果能事先驗證數(shù)據(jù)中存在的穩(wěn)定類別數(shù)量,那么通過ICA算法得到的語義類別才可靠并接近數(shù)據(jù)類別的真實情況。在盡可能接近真實可靠的語義聚類上估計的相關模型應該能夠提升檢索性能,本文實驗部分將驗證這一猜測。

    語義聚類的穩(wěn)定性驗證的基本過程是:假設數(shù)據(jù)集中存在不同的獨立分量數(shù)量,即語義類別數(shù)量。遍歷每個類別數(shù)量,多次運行ICA算法,將得到的獨立分量進行聚類;然后考察聚類質量,將聚類質量最高情況下對應的獨立分量個數(shù)作為數(shù)據(jù)集中穩(wěn)定的語義聚類數(shù)量。

    3 基于穩(wěn)定性語義聚類的相關模型估計

    已知用戶查詢的情況下,利用前N個初始查詢結果文檔作為偽相關反饋可以估計相關模型。例如,已知用戶查詢Q和前N個結果文檔構成的文檔集D,相關模型R的估計為p(D|Q,R)=∏Ni=1p(di|Q,R)。p(di|Q,R)為假設已知相關模型R和用戶查詢Q的條件下,生成文檔di的條件概率。

    由于前N個查詢結果文檔并非都與用戶查詢相關,將N個結果文檔全部參與反饋估計相關模型必定帶入不相關的噪聲,導致估計的相關模型偏離用戶查詢主題。這里提出利用基于穩(wěn)定性語義聚類估計相關模型(SSRM)的方法,期望估計的相關模型比已有方法更好地改善檢索性能。SSRM估計過程包括兩個階段:1)選擇參與相關模型估計的穩(wěn)定性語義聚類;2)基于穩(wěn)定性語義聚類估計相關模型。

    3.1 篩選穩(wěn)定性語義聚類

    語義聚類穩(wěn)定性驗證后得到的一組獨立分量將作為數(shù)據(jù)集中穩(wěn)定的語義聚類,對應多個語義類別。穩(wěn)定性語義聚類選擇的目的是,選取穩(wěn)定性語義聚類中適合度高于閾值的一組語義類別參與相關模型的估計。語義聚類的適合度采用KL散度計算,基本思想是將語義聚類和用戶查詢的相似度距離作為語義聚類的適合度,離用戶查詢相似度距離最小的語義聚類適合度最高。語義聚類的適合度按照語義聚類模型和查詢模型間的相似度計算,并篩選出適合度高于閾值的語義聚類。計算如式(7):

    如果語義聚類模型和用戶查詢模型生成詞條w的概率越接近,那么這兩種模型的詞條分布越相似。適合度高于閾值的語義聚類下的文檔將用來估計相關模型,期待緩解使用全部前N個查詢結果文檔估計相關模型帶入的不相關噪聲,造成相關模型估計出現(xiàn)主題偏移的問題。

    3.2 估計相關模型

    假設用戶查詢詞條q1,q2,…,qk間相互獨立,與文檔詞條w保持某種程度的關聯(lián)。通過式(7)選擇的穩(wěn)定性語義聚類將在相關模型估計過程中發(fā)揮橋梁作用,它將用戶查詢和語義聚類中文檔詞條關聯(lián)起來。使用穩(wěn)定性語義聚類后,在已知用戶查詢Q的情況下,相關模型p(w | Q, R)的估計轉化為計算文檔詞條w和用戶查詢q在穩(wěn)定性語義聚類中的同現(xiàn)概率,如式(8):

    4 實驗結果與分析

    4.1 實驗設計

    實驗目的是為了驗證基于穩(wěn)定性語義聚類估計的相關模型(SSRM)更接近用戶的查詢需求,比已有的相關模型和基于聚類的檢索方法在檢索性能上有所改善。

    實驗將在TREC數(shù)據(jù)集上測試SSRM的檢索性能。實驗中,TREC標題用來模擬用戶查詢,并刪除了無相關結果文檔的查詢。數(shù)據(jù)集使用Porter進行詞干處理,同時刪除了停止詞。實驗使用Indri5.0建立數(shù)據(jù)集索引。查詢編號51~150的美聯(lián)社(Associated Press Newswire,AP)數(shù)據(jù)集作為訓練集,查詢編號151~200的AP數(shù)據(jù)集、華爾街日報(Wall Street Journal,WSJ)、圣何塞水星報(San Jose Mercury News,SJMN)、查詢編號301~400的金融時報(Financial Times,F(xiàn)T)和洛杉磯時報(Los Angeles Times,LA)等數(shù)據(jù)集作為測試集。

    估計SSRM實驗步驟包括:1)使用基本的查詢似然模型得到初始查詢結果文檔;2)使用DTU工具箱[14]255中的ICA算法對前50個用戶查詢結果文檔進行語義聚類;3)穩(wěn)定性語義聚類驗證。首先假設前50個文檔形成的數(shù)據(jù)集中存在20個語義類別,然后使用Bootstapping方法運行FastICA算法[6]154930次,探測數(shù)據(jù)集中存在的穩(wěn)定語義類別;4)通過式(7)選擇適合度高于閾值的穩(wěn)定性語義聚類。適合度閾值設定為0.3,即選擇KL散度值由高到低排列的前面30%的穩(wěn)定性聚類參與相關模型的估計;5)利用選擇的穩(wěn)定性語義聚類進行相關模型估計。估計中,選擇穩(wěn)定性語義聚類生成詞條的概率值大于閾值0.3的詞條作為語義聚類的關鍵詞。

    為了驗證SSRM的檢索性能高于其他相關模型和基于聚類的方法,實驗在查詢平均準確率均值(Mean Average Precision, MAP)上縱向和橫向比較了SSRM和其他模型的檢索性能??v向比較的模型包括:1)基線相關模型(Relevance Model, RM):Indri實現(xiàn)Lavarenko的相關模型[11]122-123作為檢索性能比較基線;2)在無穩(wěn)定性驗證的ICA語義聚類上估計的語義相關模型(Semantic Relevance Model, SRM)。橫向比較的方法包括:基于聚類的方法(ClusterBased Document Model, CBDM)[1]、基于LDA的文檔模型(LDABased Document Model, LBDM)[15]和重采樣(Resampling)方法[2]。

    4.2 三種相關模型性能縱向比較

    表1給出了SSRM在測試集上的MAP性能相比RM、SRM的MAP性能的提升情況?!?chg”表示SSRM相對RM和SRM在MAP性能上提高的百分比。表中值的上標α、β、γ分別表示RM、SRM和SSRM三種模型在置信度為95%的情況下,MAP值在Wilcoxon檢驗下顯著性提高?!癠pper”列中的值為MAP性能上界。性能上界值計算方法:首先手動選取前50個查詢結果文檔中真正查詢相關的文檔,然后將這些真實相關的文檔作為反饋估計語義相關模型(SRM)并檢索得到MAP值。之所以利用SRM計算檢索性能上界,主要考慮SRM沒有消耗額外的時間驗證語義聚類的穩(wěn)定性。

    表1縱向比較的結果顯示,SSRM在所有測試集上得到的MAP值均高于RM和SRM,MAP性能最少提高了32.11%和0.41%。例如在AP測試集,使用SSRM得到的MAP值為0.3431,相對RM的MAP值0.25,在性能上提升了37.24%;相對SRM的MAP值0.3345,在性能上提升了2.57%。

    表1中SSRMMAP值的提高驗證了經過穩(wěn)定性驗證的語義聚類更好過濾了用戶查詢無關的噪聲,因而估計的相關模型更接近用戶查詢的實際需求,從而提高了MAP性能。同時也觀察到,并非所有MAP值都是顯著性提高的。例如對于AP測試集,SSRMMAP值提高只對RM是顯著性提高,而對SRM的提高是非顯著的;但是對于SJMN和FT測試集,SSRM相對RM和SRM在MAP值上的提升都是顯著性的。這說明SJMN和FT測試集中主題噪聲影響了相關模型的估計,但SSRM能夠有效過濾這兩種測試集中的噪聲,因而帶來的MAP提升是顯著性的。

    測試集FT和LA每個主題對應的真實相關文檔在TREC五個數(shù)據(jù)集中最少[8],但SSRM在這兩個測試集上相對其他三個測試集的MAP性能提升最大。這進一步驗證了SSRM能夠較好過濾數(shù)據(jù)集中用戶查詢不相關噪聲,使穩(wěn)定性語義聚類中的文檔查詢相關,并遠離查詢不相關主題。在AP和WSJ兩個測試集上,SSRM對MAP性能的提升有限,其原因可能是兩個數(shù)據(jù)集中的文檔包含多個語義主題,使用ICA算法很難將多語義主題文檔劃分到合適的語義類別中。這說明利用ICA算法進行穩(wěn)定性語義聚類,對于多個語義主題的文檔效果有限。由表1還可以觀察到,SSRM的MAP值離性能上界還存在不小差距,說明基于穩(wěn)定性語義聚類估計出的相關模型在MAP性能上還有改進空間。

    4.3 四種聚類方法性能橫向比較

    橫向比較的三種基于聚類的方法為:基于聚類方法(CBDM)、基于LDA的方法(LBDM)和重采樣(Resampling)方法。比較的原因是:這三種方法是信息檢索中比較典型的方法,同時三種方法沒有作穩(wěn)定性聚類驗證工作,可以對比驗證SSRM的性能。表2中三種基于聚類的方法的MAP值均來源于文獻[1-2,15]的數(shù)據(jù)。

    表2顯示,SSRM在測試集上相比三種基于聚類方法的MAP性能改善明顯。相比三種基于聚類的檢索方法,MAP性能至少提高了23.64%,19.59%和8.03%。由于SSRM采用ICA算法進行語義聚類,并對語義聚類進行了穩(wěn)定性驗證,這說明ICA算法相比其他三種聚類方法在語義聚類上的效果更好,特別是經過語義聚類穩(wěn)定性驗證后估計的相關模型,在語義上更接近用戶查詢,是提升MAP性能的主要原因。

    圖1顯示了SSRM、RM、SRM三種相關模型和檢索上界UP在AP訓練集和5個測試集上檢索的準確率召回率曲線的比較情況。可以看出,無論在訓練階段還是在測試階段,SSRM總是獲得比RM明顯好的檢索性能。通常情況下,SSRM也能得到相對SRM好的檢索性能。檢索性能的改善證明了語義聚類經過穩(wěn)定性驗證后,更好地將查詢相關的文檔聚在一起,因此SSRM方法較SRM方法使用更多的真實相關文檔參與相關模型估計,而RM方法直接使用前N個查詢結果文檔估計相關模型,帶入了較多的不相關噪聲。

    圖1顯示,在WSJ和FT測試集上,在高召回率一端,SSRM比RM的檢索性能稍差;同時,SSRM在AP和WSJ測試集上相比SRM提升的檢索性能有限,甚至在低召回率一端,SSRM的檢索性能比SRM還差。顯示表明,SSRM在召回率的中前段對檢索性能的提升最明顯。

    圖1中SSRM的檢索性能同性能上界有很大差距。由于性能上界由真實的相關文檔估計的相關模型得到,這個差距說明通過數(shù)據(jù)聚類的方法不能完全獲取相關模型估計需要的真實相關的反饋文檔,同時也說明SSRM方法有較大的提升空間。一個解決思路是如何更好地選擇主題相關文檔,將聚類粒度放到段落或句子層次而不是整個文檔上。

    5 結語

    本文研究了ICA語義聚類穩(wěn)定性驗證對相關模型估計的影響及其對檢索性能的改善效果。研究發(fā)現(xiàn),語義聚類經過穩(wěn)定性驗證后,能夠更好地將查詢相關的文檔聚在一起。

    利用語義聚類的適合度篩選出和用戶查詢最相似的語義聚類,并以篩選出的語義聚類為文檔和查詢間的橋梁,估計出的穩(wěn)定性語義聚類模型(SSRM)能夠改善檢索性能。由于不相關噪聲會使相關模型估計中出現(xiàn)偏離用戶查詢主題的問題,SSRM有效利用了穩(wěn)定性語義聚類的噪聲過濾功能,因而SSRM更接近用戶的查詢需求。另外,SSRM相比基于聚類方法的檢索性能提升,也說明ICA算法是一種適合的語義聚類算法。

    研究發(fā)現(xiàn)對于多主題文檔,文檔級別上的語義聚類很難將其劃分到合適的類別中。將來的工作考慮段落或者句子粒度上的聚類,并做聚類的穩(wěn)定性驗證工作。另外,如何根據(jù)不同數(shù)據(jù)集學習適合數(shù)據(jù)集的訓練參數(shù),也是一個值得研究的問題。

    參考文獻:

    [1]LIU X, CROFT W B. Clusterbased retrieval using language models[C]// Proceedings of the 27th International Conference on Research and Development in Information Retrieval. New York: ACM, 2004:186-193.

    [2]LEE K S, CROFT W B, ALLAN J. A clusterbased resampling method for pseudorelevance feedback[C]// Proceedings of the 31st International Conference on Research and Development in Information Retrieval. New York: ACM, 2008:235-242.

    [3]NASIR J A, VARLAMIS I, KARIM A, et al. Semantic smoothing for text clustering[J]. KnowledgeBased Systems, 2013, 54(4): 216-229.

    [4]ALSULAMI B S, ABULKHAIR M F, ESSA F A. Semantic clustering approach based multiAgent system for information retrieval on Web[J]. International Journal of Computer Science & Network Security, 2012, 12(1):41-44.

    [5]HOFMANN T. Probabilistic latent semantic indexing[C]// Proceedings of the 22nd International Conference on Research and Development in Information Retrieval. New York: ACM, 1999:56-73.

    [6]HYVARINEN A. Survey on independent component analysis[J]. Neural Computing Surveys, 1999, 2(7):1527-1558.

    [7]HIMBERG J, HYVARINEN A, ESPOSITO F. Validating the independent components of neuroimaging timeseries via clustering and visualization[J]. Neuroimage, 2004, 22(3): 1214-1222.

    [8]PU Q, HE D. Pseudo relevance feedback using semantic clustering in relevance language model[C]// Proceedings of the 18th ACM International Conference on Information and Knowledge Management. New York: ACM, 2009:1931-1934.

    [9]蒲強,何大慶,楊國緯.一種基于統(tǒng)計語義聚類的查詢語言模型估計[J].計算機研究與發(fā)展,2011,48(2):224-231.(PU Q, HE D Q, YANG G W. An estimation of query language model based on statistical semantic clustering [J]. Journal of Computer Research and Development, 2011, 48(2): 224-231.)

    [10]劉家辰, 苗啟廣, 宋建鋒. 使用聚類穩(wěn)定性分析方法增強單類學習算法[J]. 西安電子科技大學學報(自然科學版), 2015, 2(2):58-64. (LIU J C, MIAO Q G, SONG J F. Enhanced oneclass learning based on clustering stability analysis[J]. Journal of Xidian University (Natural Science), 2015, 42(2): 58-64.)

    [11]LAVRENKO V, CROFT W B. Relevancebased language models[C]// Proceedings of the 24th International Conference on Research and Development in Information Retrieval. New York: ACM, 2001:120-127.

    [12]劉銘,劉秉權,劉遠超.面向信息檢索的快速聚類算法[J].計算機研究與發(fā)展,2013,50(7): 1452-1463.(LIU M, LIU B Q, LIU Y C. A fast clustering algorithm for information retrieval [J]. Journal of Computer Research and Development, 2013, 50(7):1452-1463.)

    [13]張永,浮盼盼,張玉婷.基于分層聚類及重采樣的大規(guī)模數(shù)據(jù)分類[J].計算機應用, 2013, 33(10): 2801-2803.(ZHANG Y, FU P P, ZHANG Y T. Largescale data classification based on hierarchical clustering and resampling[J]. Journal of Computer Applications, 2013, 33(10): 2801-2803.)

    [14]KOLENDA T, HANSEN L K, SIGURDSSON S. Independent components in text[J]. Perspectives in Neural Computing, 2000, 32: 235-256.

    [15]WEI X, CROFT W B. LDAbased document models for Ad Hoc retrieval[C]// Proceedings of the 29th International Conference on Research and Development in Information Retrieval. New York: ACM, 2006:178-185.

    猜你喜歡
    信息檢索
    基于同態(tài)加密支持模糊查詢的高效隱私信息檢索協(xié)議
    基于信息檢索課的大學生信息檢索行為調查研究
    高職院校圖書館開設信息檢索課的必要性探討
    基于MOOC理念的“翻轉課堂”教學改革探索——以海南大學《文獻信息檢索與利用》課程為例
    網(wǎng)絡環(huán)境下數(shù)字圖書館信息檢索發(fā)展
    山西青年(2018年5期)2018-01-25 16:53:40
    醫(yī)學期刊編輯中文獻信息檢索的應用
    新聞傳播(2016年18期)2016-07-19 10:12:06
    在網(wǎng)絡環(huán)境下高職院校開設信息檢索課的必要性研究
    新聞傳播(2016年11期)2016-07-10 12:04:01
    基于神經網(wǎng)絡的個性化信息檢索模型研究
    地理信息檢索中空間相似性度量的一種模糊方法
    教學型大學《信息檢索》公選課的設計與實施
    河南科技(2014年11期)2014-02-27 14:10:19
    少妇猛男粗大的猛烈进出视频| 亚洲av二区三区四区| a级毛色黄片| 日韩免费高清中文字幕av| 国产黄片视频在线免费观看| 国产精品欧美亚洲77777| 精品久久久久久电影网| 最黄视频免费看| 国产永久视频网站| 人妻制服诱惑在线中文字幕| 99久久精品一区二区三区| 在线亚洲精品国产二区图片欧美 | 国产一区二区在线观看av| 黄片无遮挡物在线观看| 大香蕉久久网| 日韩欧美一区视频在线观看 | 欧美亚洲 丝袜 人妻 在线| 女人久久www免费人成看片| tube8黄色片| 另类精品久久| 午夜激情福利司机影院| 国内精品宾馆在线| 美女福利国产在线| 国产视频首页在线观看| 免费人妻精品一区二区三区视频| 国产精品久久久久久久电影| 伦精品一区二区三区| 80岁老熟妇乱子伦牲交| 国产日韩欧美亚洲二区| 99热全是精品| 热99国产精品久久久久久7| 视频中文字幕在线观看| 我要看日韩黄色一级片| 日韩中文字幕视频在线看片| 观看av在线不卡| 日产精品乱码卡一卡2卡三| 全区人妻精品视频| 日日摸夜夜添夜夜添av毛片| av在线app专区| 丰满饥渴人妻一区二区三| 欧美精品一区二区免费开放| 欧美日韩国产mv在线观看视频| 男人和女人高潮做爰伦理| 日本黄色片子视频| 欧美日韩在线观看h| 日韩,欧美,国产一区二区三区| 久久精品国产鲁丝片午夜精品| 国产视频内射| 日韩欧美精品免费久久| 啦啦啦视频在线资源免费观看| 又粗又硬又长又爽又黄的视频| 日本午夜av视频| 国产永久视频网站| 亚洲国产精品999| 另类亚洲欧美激情| 亚洲av成人精品一区久久| 欧美日韩亚洲高清精品| 一区二区三区乱码不卡18| 男女边吃奶边做爰视频| 亚州av有码| 免费播放大片免费观看视频在线观看| 一级,二级,三级黄色视频| 天堂中文最新版在线下载| 看免费成人av毛片| 欧美一级a爱片免费观看看| 精品亚洲成国产av| 在线观看www视频免费| 少妇人妻 视频| 赤兔流量卡办理| 国产无遮挡羞羞视频在线观看| 国语对白做爰xxxⅹ性视频网站| 精品少妇久久久久久888优播| 国产亚洲最大av| 国产视频首页在线观看| 成人18禁高潮啪啪吃奶动态图 | 成人美女网站在线观看视频| 欧美丝袜亚洲另类| 国产成人aa在线观看| 欧美精品亚洲一区二区| 51国产日韩欧美| 色婷婷久久久亚洲欧美| 久久午夜福利片| 国产免费视频播放在线视频| 青青草视频在线视频观看| av国产精品久久久久影院| 18禁在线播放成人免费| 91久久精品国产一区二区三区| 亚洲av电影在线观看一区二区三区| 久久人人爽av亚洲精品天堂| 观看美女的网站| 色视频在线一区二区三区| 少妇裸体淫交视频免费看高清| 欧美日韩视频高清一区二区三区二| 亚洲精品国产色婷婷电影| 97在线视频观看| 欧美国产精品一级二级三级 | 妹子高潮喷水视频| 青春草国产在线视频| 亚洲人与动物交配视频| 亚洲va在线va天堂va国产| 午夜福利影视在线免费观看| 一区二区三区乱码不卡18| 99九九在线精品视频 | 久久狼人影院| 久久这里有精品视频免费| 午夜免费男女啪啪视频观看| 亚洲,欧美,日韩| 国产精品99久久久久久久久| 在线精品无人区一区二区三| 国产精品99久久久久久久久| 亚洲在久久综合| 国产精品99久久久久久久久| 国产白丝娇喘喷水9色精品| 三级经典国产精品| 老司机影院毛片| 夫妻性生交免费视频一级片| 成年美女黄网站色视频大全免费 | 三级经典国产精品| 插逼视频在线观看| 亚洲中文av在线| 老司机影院毛片| 精品熟女少妇av免费看| 只有这里有精品99| 日本午夜av视频| 国产一区二区在线观看av| 色婷婷av一区二区三区视频| 亚洲国产欧美在线一区| 一级二级三级毛片免费看| 日本av手机在线免费观看| 一区二区三区四区激情视频| 亚洲,一卡二卡三卡| 亚洲高清免费不卡视频| 日本欧美国产在线视频| 国产美女午夜福利| 人妻系列 视频| 热re99久久精品国产66热6| 精品亚洲成国产av| 亚洲三级黄色毛片| 国产毛片在线视频| 免费大片黄手机在线观看| 九九在线视频观看精品| 亚洲av欧美aⅴ国产| 国产黄色免费在线视频| 如日韩欧美国产精品一区二区三区 | 丰满乱子伦码专区| 亚洲国产精品一区三区| 国产免费视频播放在线视频| 99久久精品国产国产毛片| 国产精品99久久99久久久不卡 | 精品酒店卫生间| 黄色一级大片看看| 国产高清不卡午夜福利| 久久久国产精品麻豆| 夫妻性生交免费视频一级片| 波野结衣二区三区在线| 国产精品久久久久久久电影| 一级毛片黄色毛片免费观看视频| 国产精品久久久久久久电影| 看十八女毛片水多多多| 欧美最新免费一区二区三区| 久久精品久久久久久噜噜老黄| 日韩人妻高清精品专区| 两个人的视频大全免费| 国内少妇人妻偷人精品xxx网站| 少妇人妻一区二区三区视频| 免费av不卡在线播放| 成人亚洲精品一区在线观看| 国产有黄有色有爽视频| 国产白丝娇喘喷水9色精品| 国产高清不卡午夜福利| 国产有黄有色有爽视频| 亚洲第一区二区三区不卡| 亚洲av二区三区四区| 久久久久久久久久人人人人人人| 寂寞人妻少妇视频99o| 国产亚洲5aaaaa淫片| 国产精品福利在线免费观看| 哪个播放器可以免费观看大片| 国产精品秋霞免费鲁丝片| 亚洲自偷自拍三级| 国产亚洲最大av| 国产黄片视频在线免费观看| 嫩草影院入口| 午夜福利影视在线免费观看| 曰老女人黄片| 国产精品久久久久久精品古装| 久久久久久久久久久丰满| 免费人成在线观看视频色| 国产在线视频一区二区| 久久女婷五月综合色啪小说| 亚洲av欧美aⅴ国产| 人人妻人人澡人人看| 国产成人精品婷婷| 我要看日韩黄色一级片| 一二三四中文在线观看免费高清| 午夜老司机福利剧场| 久久精品夜色国产| 国产精品伦人一区二区| 久久久久久人妻| 青春草视频在线免费观看| 精品少妇黑人巨大在线播放| 欧美激情极品国产一区二区三区 | 成人18禁高潮啪啪吃奶动态图 | 22中文网久久字幕| 免费高清在线观看视频在线观看| 国产黄频视频在线观看| 精品国产乱码久久久久久小说| 亚洲国产av新网站| 丰满乱子伦码专区| 久久久久久久精品精品| 午夜91福利影院| 午夜福利影视在线免费观看| 久久精品夜色国产| 久久久久久人妻| 久久精品熟女亚洲av麻豆精品| 亚洲,欧美,日韩| 亚洲成人av在线免费| 日韩人妻高清精品专区| 午夜av观看不卡| av免费观看日本| 99久久精品热视频| 一本—道久久a久久精品蜜桃钙片| 欧美另类一区| 99久久综合免费| 97精品久久久久久久久久精品| 亚洲国产精品国产精品| 秋霞伦理黄片| 看免费成人av毛片| 91午夜精品亚洲一区二区三区| 视频区图区小说| 国产一区亚洲一区在线观看| 久久午夜综合久久蜜桃| 一区二区三区免费毛片| 在线免费观看不下载黄p国产| 久久精品国产a三级三级三级| 亚洲第一av免费看| 麻豆成人av视频| 久久99一区二区三区| 少妇丰满av| 男女边吃奶边做爰视频| 亚洲高清免费不卡视频| 国产成人aa在线观看| av在线老鸭窝| 十八禁网站网址无遮挡 | 久久97久久精品| 久久人人爽人人片av| 亚洲国产毛片av蜜桃av| 亚洲成色77777| 少妇丰满av| 又粗又硬又长又爽又黄的视频| 91久久精品国产一区二区成人| 久久国内精品自在自线图片| 亚洲精品456在线播放app| 人妻制服诱惑在线中文字幕| 精品一区二区三卡| 国产女主播在线喷水免费视频网站| 欧美激情国产日韩精品一区| 欧美人与善性xxx| 欧美xxxx性猛交bbbb| 免费看日本二区| 国产91av在线免费观看| 中文字幕人妻熟人妻熟丝袜美| 青春草国产在线视频| 精品99又大又爽又粗少妇毛片| 在线免费观看不下载黄p国产| 色婷婷久久久亚洲欧美| 国产乱来视频区| 色视频www国产| 黄色视频在线播放观看不卡| 黄色视频在线播放观看不卡| 午夜精品国产一区二区电影| 在线播放无遮挡| 久久久午夜欧美精品| 99九九线精品视频在线观看视频| 一本一本综合久久| 观看免费一级毛片| 国产成人精品福利久久| 精品国产一区二区三区久久久樱花| 大陆偷拍与自拍| 国产精品偷伦视频观看了| 国产亚洲91精品色在线| 亚洲av二区三区四区| 日韩中字成人| 嫩草影院新地址| 香蕉精品网在线| 伊人久久精品亚洲午夜| 如日韩欧美国产精品一区二区三区 | 26uuu在线亚洲综合色| 久久精品久久精品一区二区三区| 亚洲精品国产av成人精品| 亚洲成人一二三区av| 精品亚洲乱码少妇综合久久| 日韩熟女老妇一区二区性免费视频| 欧美日韩综合久久久久久| 哪个播放器可以免费观看大片| 国产一区二区在线观看日韩| 99久久人妻综合| 亚洲无线观看免费| 免费高清在线观看视频在线观看| 日韩强制内射视频| 国产精品熟女久久久久浪| 青春草视频在线免费观看| 男的添女的下面高潮视频| 97在线视频观看| 麻豆精品久久久久久蜜桃| 国产成人午夜福利电影在线观看| 日日啪夜夜撸| 少妇裸体淫交视频免费看高清| 国产无遮挡羞羞视频在线观看| 日韩成人伦理影院| 欧美精品一区二区免费开放| 国产成人免费无遮挡视频| 国产深夜福利视频在线观看| 亚洲成色77777| 亚洲av成人精品一二三区| 少妇熟女欧美另类| 久久久亚洲精品成人影院| 成人无遮挡网站| 成年人免费黄色播放视频 | 国产91av在线免费观看| 日韩伦理黄色片| 天堂俺去俺来也www色官网| 男的添女的下面高潮视频| 久久国内精品自在自线图片| av.在线天堂| 男男h啪啪无遮挡| 亚洲,欧美,日韩| 欧美国产精品一级二级三级 | 青春草亚洲视频在线观看| 日韩一区二区视频免费看| 草草在线视频免费看| 女的被弄到高潮叫床怎么办| 欧美日韩视频精品一区| 丝袜在线中文字幕| 国产真实伦视频高清在线观看| 国产黄色视频一区二区在线观看| 天天操日日干夜夜撸| 久久精品久久精品一区二区三区| 日本黄色日本黄色录像| 日本爱情动作片www.在线观看| 欧美高清成人免费视频www| 久久人人爽人人爽人人片va| 大又大粗又爽又黄少妇毛片口| av免费在线看不卡| 精品亚洲成a人片在线观看| 少妇人妻 视频| 丝袜在线中文字幕| 国产一区二区在线观看日韩| 中文字幕免费在线视频6| 国产精品成人在线| 久久人人爽人人片av| 十八禁网站网址无遮挡 | 精品少妇内射三级| 国产国拍精品亚洲av在线观看| 久久 成人 亚洲| 亚洲综合精品二区| 欧美成人精品欧美一级黄| 欧美老熟妇乱子伦牲交| 男女边摸边吃奶| 在线观看国产h片| 青春草国产在线视频| 亚洲性久久影院| 免费播放大片免费观看视频在线观看| 好男人视频免费观看在线| 午夜影院在线不卡| 22中文网久久字幕| 成人18禁高潮啪啪吃奶动态图 | 国产日韩一区二区三区精品不卡 | 91精品国产国语对白视频| 精品久久久噜噜| 国产黄频视频在线观看| 国产在视频线精品| 亚洲国产精品999| 亚洲综合色惰| 久久精品国产亚洲网站| 成年人免费黄色播放视频 | 久久精品夜色国产| 久久精品国产亚洲av涩爱| 久久久久久久久大av| 色婷婷久久久亚洲欧美| 精品一品国产午夜福利视频| 2018国产大陆天天弄谢| 国产淫语在线视频| 免费av中文字幕在线| 秋霞伦理黄片| 激情五月婷婷亚洲| 日韩成人伦理影院| 啦啦啦中文免费视频观看日本| 免费看光身美女| 嫩草影院新地址| 欧美激情极品国产一区二区三区 | 国产视频首页在线观看| 欧美老熟妇乱子伦牲交| 国产黄片视频在线免费观看| 久久久久久久久久久免费av| 亚洲精品国产av成人精品| 亚洲电影在线观看av| 欧美 亚洲 国产 日韩一| 肉色欧美久久久久久久蜜桃| 亚洲精品日本国产第一区| 国产精品一区二区性色av| 久久久久网色| 天天躁夜夜躁狠狠久久av| 最近2019中文字幕mv第一页| 最新的欧美精品一区二区| 丰满饥渴人妻一区二区三| 如日韩欧美国产精品一区二区三区 | 在线 av 中文字幕| 制服丝袜香蕉在线| 欧美xxxx性猛交bbbb| 最新的欧美精品一区二区| 天堂俺去俺来也www色官网| 少妇人妻一区二区三区视频| 国产欧美日韩一区二区三区在线 | 王馨瑶露胸无遮挡在线观看| 肉色欧美久久久久久久蜜桃| 欧美精品亚洲一区二区| 在线观看免费日韩欧美大片 | 成年人免费黄色播放视频 | 国产成人一区二区在线| 高清不卡的av网站| 成人免费观看视频高清| 狂野欧美激情性xxxx在线观看| 99热这里只有是精品在线观看| 18禁动态无遮挡网站| 亚洲人成网站在线播| 99国产精品免费福利视频| 日本与韩国留学比较| 久久久久国产精品人妻一区二区| 日本av免费视频播放| 国产精品蜜桃在线观看| 女人精品久久久久毛片| 中文字幕久久专区| 亚洲国产精品一区三区| 免费大片黄手机在线观看| 毛片一级片免费看久久久久| 色网站视频免费| 18禁在线无遮挡免费观看视频| 肉色欧美久久久久久久蜜桃| 51国产日韩欧美| 只有这里有精品99| 九九爱精品视频在线观看| 少妇熟女欧美另类| 国产精品国产三级专区第一集| 另类精品久久| 亚洲欧美成人综合另类久久久| 丝瓜视频免费看黄片| 美女国产视频在线观看| 久久狼人影院| 国产亚洲最大av| 伦精品一区二区三区| 国产av国产精品国产| 性高湖久久久久久久久免费观看| 我要看黄色一级片免费的| 亚洲国产精品一区二区三区在线| 51国产日韩欧美| 91aial.com中文字幕在线观看| 三上悠亚av全集在线观看 | 欧美精品亚洲一区二区| 日本色播在线视频| av在线app专区| 中文精品一卡2卡3卡4更新| 两个人免费观看高清视频 | 肉色欧美久久久久久久蜜桃| 免费黄色在线免费观看| 亚洲熟女精品中文字幕| 中文字幕人妻熟人妻熟丝袜美| 大码成人一级视频| 蜜桃在线观看..| 一二三四中文在线观看免费高清| 夜夜看夜夜爽夜夜摸| 97精品久久久久久久久久精品| 国产熟女午夜一区二区三区 | 在线天堂最新版资源| 久久久久精品性色| 少妇人妻一区二区三区视频| 在线观看人妻少妇| 一级毛片电影观看| 欧美激情极品国产一区二区三区 | 亚洲成人手机| 人妻夜夜爽99麻豆av| 国产日韩欧美视频二区| 国内揄拍国产精品人妻在线| 亚洲第一av免费看| 美女xxoo啪啪120秒动态图| 亚洲成色77777| 少妇人妻 视频| 在线观看一区二区三区激情| 久久影院123| av有码第一页| 精品一区二区三区视频在线| 一区在线观看完整版| 日本91视频免费播放| 国产亚洲最大av| 女人久久www免费人成看片| 老司机影院成人| 国产精品偷伦视频观看了| 久久精品国产鲁丝片午夜精品| 一级片'在线观看视频| 国产伦在线观看视频一区| 王馨瑶露胸无遮挡在线观看| 亚洲精品乱码久久久久久按摩| 如何舔出高潮| 中文精品一卡2卡3卡4更新| 美女中出高潮动态图| 又粗又硬又长又爽又黄的视频| 97精品久久久久久久久久精品| 国产日韩欧美亚洲二区| 日产精品乱码卡一卡2卡三| 青春草国产在线视频| 亚洲精品日韩在线中文字幕| 久久久久精品性色| 日韩欧美 国产精品| 老司机亚洲免费影院| 熟女电影av网| 日韩欧美精品免费久久| 国产精品一区二区在线观看99| 黄色毛片三级朝国网站 | 免费不卡的大黄色大毛片视频在线观看| 免费黄频网站在线观看国产| 丰满人妻一区二区三区视频av| av在线老鸭窝| 777米奇影视久久| 免费黄频网站在线观看国产| 五月玫瑰六月丁香| 免费人成在线观看视频色| 精品久久国产蜜桃| 97超碰精品成人国产| 成人18禁高潮啪啪吃奶动态图 | 99热这里只有是精品50| 国产男人的电影天堂91| 久久这里有精品视频免费| 狂野欧美激情性xxxx在线观看| 久久av网站| 最近中文字幕高清免费大全6| 夫妻性生交免费视频一级片| 欧美另类一区| 99re6热这里在线精品视频| 国产亚洲精品久久久com| 深夜a级毛片| tube8黄色片| 国产日韩一区二区三区精品不卡 | 最新的欧美精品一区二区| 精品人妻一区二区三区麻豆| 久久ye,这里只有精品| 成人亚洲精品一区在线观看| 国产黄色视频一区二区在线观看| 极品人妻少妇av视频| 亚洲人成网站在线观看播放| av在线播放精品| 男的添女的下面高潮视频| 自线自在国产av| 91久久精品国产一区二区三区| 黑丝袜美女国产一区| 天堂俺去俺来也www色官网| 各种免费的搞黄视频| 不卡视频在线观看欧美| 国产片特级美女逼逼视频| 看非洲黑人一级黄片| 精品一品国产午夜福利视频| 99久久综合免费| 婷婷色麻豆天堂久久| 丁香六月天网| 18禁在线播放成人免费| 大话2 男鬼变身卡| 精品99又大又爽又粗少妇毛片| a级毛片免费高清观看在线播放| 久久女婷五月综合色啪小说| 青春草国产在线视频| 国产一区亚洲一区在线观看| 国产探花极品一区二区| 简卡轻食公司| 亚洲怡红院男人天堂| 人人妻人人看人人澡| 一区二区三区乱码不卡18| 街头女战士在线观看网站| 大又大粗又爽又黄少妇毛片口| 在线观看免费高清a一片| 亚洲精品视频女| 中文在线观看免费www的网站| 天堂8中文在线网| 永久免费av网站大全| 亚洲精品国产av蜜桃| 亚洲精品国产成人久久av| 国产熟女欧美一区二区| 国产无遮挡羞羞视频在线观看| 2018国产大陆天天弄谢| 老司机影院毛片| 亚洲成人一二三区av| 日本猛色少妇xxxxx猛交久久| 亚洲经典国产精华液单| a级毛色黄片| 国产亚洲91精品色在线| 亚洲国产精品999| 少妇猛男粗大的猛烈进出视频| 中国美白少妇内射xxxbb| 深夜a级毛片| 男人狂女人下面高潮的视频| 国产欧美日韩综合在线一区二区 | 国产精品一区二区在线观看99| 夜夜骑夜夜射夜夜干| 亚洲精品乱码久久久久久按摩| 18禁动态无遮挡网站| 在线观看三级黄色| 不卡视频在线观看欧美| 一本大道久久a久久精品| 国内少妇人妻偷人精品xxx网站| 亚洲av不卡在线观看| 五月玫瑰六月丁香| 日日摸夜夜添夜夜添av毛片| 久久午夜福利片| 久久热精品热| 香蕉精品网在线| 国产精品国产三级国产av玫瑰| 大又大粗又爽又黄少妇毛片口|