• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    熱點(diǎn)詞匯的最長時(shí)間區(qū)間查詢算法

    2019-08-14 11:41:16何震瀛荊一楠王曉陽
    關(guān)鍵詞:詞頻熱詞復(fù)雜度

    路 暢 何震瀛 荊一楠 王曉陽

    1(復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 上海 201203)2(上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室(復(fù)旦大學(xué)) 上海 200433)3(上海智能電子與系統(tǒng)研究院 上海 201203)

    0 引 言

    高效、快速地獲取熱點(diǎn)詞匯在新聞話題追蹤[1]、金融市場(chǎng)分析[2]、商業(yè)智能[3]以及社會(huì)輿情監(jiān)測(cè)[4]等領(lǐng)域發(fā)揮著重要作用。作為話題檢測(cè)與追蹤的核心任務(wù)之一,熱點(diǎn)詞匯(以下簡稱為熱詞)提取是當(dāng)前的一個(gè)研究熱點(diǎn)。

    對(duì)語料庫中的關(guān)鍵詞及包含關(guān)鍵詞的短語、句子進(jìn)行聚類,是提取熱點(diǎn)話題的一個(gè)重要手段。但在實(shí)際應(yīng)用中,為了了解不同約束條件下的熱詞情況,用戶經(jīng)常查看不同過濾條件下的熱詞,以了解不同時(shí)間區(qū)域內(nèi)的熱詞。因此,對(duì)關(guān)鍵詞提取方法的效率進(jìn)行優(yōu)化,能有效提高熱詞檢測(cè)的效率。

    針對(duì)熱詞提取,業(yè)界已開展了大量研究工作。Krulwich等[5]利用啟發(fā)式規(guī)則抽取文檔中重要的詞和短語。Salton[6]提出了TF-IDF算法,刻畫了詞匯對(duì)于語料庫或其中一份文檔的重要性。Bun等[7]改進(jìn)了TF-IDF算法可能將更高的權(quán)重賦予語料庫中出現(xiàn)較少的詞匯的不足,提出了TF*PDF算法,將更高的權(quán)重賦予出現(xiàn)在多個(gè)文檔中的詞匯,以提取整個(gè)語料庫的關(guān)鍵詞和熱點(diǎn)話題。遲呈英等[8]引入了話題權(quán)重,并將其與TF*PDF結(jié)合,以更全面地反映話題的熱度分布情況。趙志洲等[9]提出了EHWE算法,對(duì)數(shù)據(jù)進(jìn)行劃分,在一定程度上優(yōu)化了TF*PDF的計(jì)算過程。但是這些算法的一些共同不足是:

    ① 僅考慮整個(gè)語料庫在某個(gè)時(shí)間區(qū)間關(guān)鍵詞,未考慮不同偏好的用戶對(duì)不同類別新聞等的查詢需求。

    ② 面向挖掘任務(wù),時(shí)間復(fù)雜度較高,當(dāng)用戶不斷地更改查詢條件(類別和時(shí)間區(qū)間)時(shí),算法需要對(duì)詞頻和包含關(guān)鍵詞的文檔數(shù)進(jìn)行重復(fù)計(jì)算,無法滿足用戶對(duì)于關(guān)鍵詞提取的在線查詢的需求。

    在實(shí)際應(yīng)用中,為了進(jìn)行新聞追蹤,用戶需要對(duì)一組特定的詞匯進(jìn)行查詢,以尋找這組詞匯能夠成為熱點(diǎn)詞匯所處的最長時(shí)間范圍。這要求算法不斷地更新查詢條件,使用TF*PDF算法查詢關(guān)鍵詞,以判斷該組特定詞匯是否滿足成為關(guān)鍵詞的條件。而由于上述的不足,傳統(tǒng)的TF*PDF算法無法快速、高效地對(duì)關(guān)鍵詞進(jìn)行查詢,以滿足用戶在線查詢的需求。

    為此,本文對(duì)如何有效地使用TF*PDF算法對(duì)關(guān)鍵詞進(jìn)行快速提取進(jìn)行研究。關(guān)鍵詞在線提取的兩個(gè)核心研究問題是:① 區(qū)分不同類別的新聞,以面向不同偏好的用戶;② 在用戶不斷調(diào)整查詢新聞的類別、時(shí)間區(qū)間的條件下,快速、高效地對(duì)關(guān)鍵詞進(jìn)行提取。因此,設(shè)計(jì)在類別、時(shí)間兩個(gè)維度上對(duì)關(guān)鍵詞進(jìn)行在線查詢的方法依然是一個(gè)具有挑戰(zhàn)性的問題。針對(duì)上述傳統(tǒng)方法的缺點(diǎn),本文將TF*PDF算法與Prefix Cube結(jié)合,優(yōu)化TF*PDF算法的詞頻統(tǒng)計(jì)、包含關(guān)鍵詞的文檔數(shù)統(tǒng)計(jì)的過程,提出一種高效地對(duì)二維新聞數(shù)據(jù)進(jìn)行關(guān)鍵詞提取并查詢最大時(shí)間范圍的方法(PCTF),以根據(jù)用戶提供的詞匯,快速尋找這些詞匯能夠成為熱點(diǎn)詞匯的最大區(qū)域。

    1 相關(guān)研究

    本文所使用的主要符號(hào)如表1所示。

    表1 符號(hào)說明

    1.1 話題檢測(cè)與追蹤

    話題檢測(cè)與追蹤(TDT)的研究始于1996年[10],旨在從大量的新聞數(shù)據(jù)流中發(fā)現(xiàn)并追蹤新興事件和話題。一個(gè)話題由一個(gè)種子事件或活動(dòng)以及與其直接相關(guān)的事件或活動(dòng)組成[11]。熱門話題是指在一段時(shí)間內(nèi),在某個(gè)領(lǐng)域受到人們廣泛關(guān)注和討論的話題,同時(shí)該話題被多個(gè)媒體廣泛報(bào)道。熱點(diǎn)話題檢測(cè)與追蹤是指發(fā)現(xiàn)在一定時(shí)期內(nèi)的熱門話題,并在此基礎(chǔ)上判斷后續(xù)新聞報(bào)道與該話題的相關(guān)性,從而實(shí)現(xiàn)追蹤功能。

    國內(nèi)外學(xué)者在TDT的基礎(chǔ)上提出了許多熱門話題檢測(cè)和追蹤的方法,其中一種流行的方法是基于詞匯權(quán)重,檢測(cè)文章內(nèi)容中關(guān)鍵或具有代表性的詞匯。常用的方法有Salton等提出的TF-IDF算法[6],另一個(gè)是Bun等提出的TF*PDF算法[7]。與TF-IDF方法相比,TF*PDF算法將更多的權(quán)重賦予在整個(gè)語料庫中出現(xiàn)頻率較高的詞匯,因此,TF*PDF算法提取的關(guān)鍵詞能夠更好地反映話題的熱度,更適用于整個(gè)語料庫上的熱點(diǎn)詞匯提取。

    1.2 TF*PDF算法

    在傳統(tǒng)的TF*PDF算法中,某個(gè)詞匯在單個(gè)新聞渠道的權(quán)重與其在該渠道的詞頻成線性正相關(guān),且與該渠道中包含該詞匯的文檔數(shù)成指數(shù)正相關(guān)。單詞在所有渠道中的權(quán)重為其在單個(gè)渠道中權(quán)重之和,其計(jì)算過程如下所示:

    (1)

    (3)

    TF*PDF通過計(jì)算詞匯的詞頻以及包含該詞匯的文檔數(shù),來尋找大多數(shù)渠道中能夠代表熱點(diǎn)話題的關(guān)鍵詞。當(dāng)用戶改變查詢的時(shí)間或類別區(qū)間時(shí),TF*PDF算法需要遍歷區(qū)間內(nèi)的文檔,來計(jì)算詞匯在該區(qū)間內(nèi)的詞頻和包含該詞匯的文檔數(shù),導(dǎo)致了大量的重復(fù)計(jì)算,使得傳統(tǒng)的TF*PDF算法無法滿足用戶頻繁改變查詢條件的需要。

    2 問題定義

    本文研究的主要問題為如何根據(jù)用戶給定的一組詞匯,快速尋找這組詞匯能夠成為熱點(diǎn)詞匯所處的最長時(shí)間區(qū)間。

    定義1(時(shí)間區(qū)間T(a,b)) 語料庫的一個(gè)時(shí)間區(qū)間T(a,b)={ta,ta+1,…,tb},其中ti表示語料庫的第i個(gè)時(shí)間間隔,也即語料庫中最小的時(shí)間單位。特殊地,T(1,Nt)表示語料庫中的整個(gè)時(shí)間區(qū)間,其中Nt表示語料庫中包含的全部時(shí)間間隔。

    定義2(類別樹G) 語料庫中的新聞具有類別屬性,所有的類別構(gòu)成了一個(gè)樹狀結(jié)構(gòu)G。G中的一個(gè)子類別gci={gcx,gcx+1,…,gcy},其中g(shù)cj表示類別gci的第j個(gè)子類別。

    定義3(類別區(qū)間G(x,y)) 類別樹G的所有葉子節(jié)點(diǎn)被定義為{g1,g2,…,gNg},則一個(gè)類別區(qū)間G(x,y)={gx,gx+1,…,gy}。特殊地,G中的每一個(gè)子類別gc都構(gòu)成一個(gè)類別區(qū)間。

    定義4(詞匯列表L) 語料庫中的一個(gè)詞匯列表Lmn={Lwmn}={(w,Fwmn,dwmn)|w同時(shí)出現(xiàn)在gm和tn},其中w是一個(gè)詞匯,F(xiàn)wmn是w在gm和tn中所有文檔的詞頻,dwmn是在gm和tn中包含w的文檔數(shù)。

    定義5(基本數(shù)據(jù)結(jié)構(gòu)s) 用于存儲(chǔ)一個(gè)語料庫的一個(gè)基本數(shù)據(jù)結(jié)構(gòu)s={Lmn|1≤m≤Ng,1≤n≤Nt}。

    定義6(Top-k熱詞Y) 所有語料庫在某個(gè)時(shí)間區(qū)間T(a,b)和一個(gè)子類別gc的Top-k熱詞為一個(gè)詞匯集合Y={w1,w2,…,wk},且對(duì)于該區(qū)間的詞匯w∈Y,w′?Y,有Weightw≥Weightw′。

    基于以上的定義,本文研究的主要問題的形式化定義如下:

    定義7(熱詞最長時(shí)間區(qū)間查詢)

    給定一組詞匯W={w1,w2,…,wl},G中的一個(gè)子類別gc,查詢初始時(shí)間間隔ta,正整數(shù)k,尋找一個(gè)最長的時(shí)間區(qū)間T(a,b),對(duì)?w∈W,?i∈(a,b),在T(a,i)中,有w∈Y。

    3 基于改進(jìn)TF*PDF的熱詞最長區(qū)間查詢方法

    3.1 PC:Prefix Cube

    文獻(xiàn)[12]使用Prefix Sum技術(shù)提出了一個(gè)名為Prefix Cube(PC)的存儲(chǔ)結(jié)構(gòu)。給定存儲(chǔ)一個(gè)語料庫的基本數(shù)據(jù)結(jié)構(gòu)s,首先計(jì)算其中一個(gè)詞匯w詞頻Fw的Prefix Cube表示為:

    (4)

    對(duì)于一個(gè)時(shí)間區(qū)間T(a,b)和一個(gè)子類別gc=G(x,y),w在這個(gè)區(qū)間內(nèi)的詞頻Fw可以通過FPC快速計(jì)算:

    FPCw(y,b)-FPCw(y,a-1)-

    FPCw(x-1,b)+FPCw(x-1,b-1)

    (5)

    式(5)表明,F(xiàn)w在區(qū)間T(a,b)和子類別gc=G(x,y)構(gòu)成的二維區(qū)間內(nèi)的詞頻可以通過該二維區(qū)間頂點(diǎn)的FPCw來快速計(jì)算,從而避免了對(duì)該二維區(qū)間內(nèi)的全部文檔進(jìn)行迭代計(jì)算。

    DPCw和FPCw同樣具有式(5)所示的性質(zhì),在區(qū)間T(a,b)和子類別gc=G(x,y)構(gòu)成的二維區(qū)間,有:

    DPCw(x-1,b)+DPCw(x-1,b-1)

    (7)

    當(dāng)x=y=m,a=b=n時(shí),式(5)和式(7)可變化為:

    Fw=FPCw(m,n)-FPCw(m,n-1)-

    FPCw(m-1,n)+FPCw(m-1,n-1)=Fwmn

    (8)

    dw=DPCw(m,n)-DPCw(m,n-1)-

    DPCw(m-1,n)+DPCw(m-1,n-1)=dwmn

    (9)

    因此,可以通過迭代的方式來計(jì)算FPCw和DPCw:

    FPCw(m,n)=FPCw(m,n-1)+FPCw(m-1,n)-

    FPCw(m-1,n-1)+Fwmn

    (10)

    DPCw(m,n)=DPCw(m,n-1)+DPCw(m-1,n)-

    DPCw(m-1,n-1)+dwmn

    (11)

    式中:FPCw(1,1)=Fw11,DPCw(1,1)=dw11。因此FPCw和DPCw可以通過迭代的方式進(jìn)行構(gòu)建,而不需使用式(4)和式(6)對(duì)已經(jīng)計(jì)算出的所有元素進(jìn)行循環(huán)計(jì)算。接下來,將FPCw和DPCw合并,以構(gòu)建出w的Prefix Cube:PCw。最后對(duì)所有的單詞進(jìn)行迭代計(jì)算,以構(gòu)建出整個(gè)語料庫存儲(chǔ)s的Prefix Cube:PC。

    對(duì)PC的構(gòu)建算法的詳細(xì)描述如算法1所示。

    算法1構(gòu)建PC

    ConstructPC(s,Nt,Ng,Q)

    輸入:語料庫的基本存儲(chǔ)結(jié)構(gòu)s,時(shí)間間隔個(gè)數(shù)Nt,類別樹的所有葉子節(jié)點(diǎn)個(gè)數(shù)Ng,全部詞匯Q

    輸出:所有單詞的Prefix Cube:PC

    1:Forw∈QBegin

    2: FetchFw11,dw11froms;

    3: FPCw(1,1)=Fw11,DPCw(1,1)=dw11;

    4:Form∈(1,Ng)Begin

    5:Forn∈(1,Nt)Begin

    6:FetchFwmn,dwmnfroms;

    7:FPCw(m,n)=FPCw(m,n-1)+FPCw(m-1,n)-

    FPCw(m-1,n-1)+Fwmn;

    8:DPCw(m,n)=DPCw(m,n-1)+DPCw(m-1,n)-

    DPCw(m-1,n-1)+dwmn;

    9:PCw(m,n)=(w,FPCw(m,n-1),DPCw(m,n-1));

    10:End

    11:End

    12:End

    13:PC={PCw};

    14:ReturnPC;

    在算法1中,構(gòu)建PC需要對(duì)語料庫中的全部詞匯、時(shí)間間隔和類別樹的葉子節(jié)點(diǎn)做循環(huán),因此,算法的時(shí)間復(fù)雜度為O(NwNgNt)。對(duì)于構(gòu)建出的PC,由于每個(gè)PCw的每個(gè)元素需要存儲(chǔ)w、FPCw(m,n)和DPCw(m,n),每個(gè)PCw的空間復(fù)雜度為O(3NtNg)。因此,整個(gè)PC的空間復(fù)雜度為O(3NwNtNg),和原始的s的空間復(fù)雜度相同。因此使用PC作為語料庫輔助存儲(chǔ)并不增加存儲(chǔ)的空間復(fù)雜度。

    3.2 最長時(shí)間區(qū)間查詢

    根據(jù)第2節(jié)的問題定義,本文所涉及的查詢?yōu)橛脩艚o定一組單詞、初始時(shí)間間隔、類別和k,查詢?cè)摻M單詞在該類別上滿足成為熱詞的最長時(shí)間區(qū)間。這就要求算法不斷地更新時(shí)間區(qū)間,計(jì)算出詞匯的權(quán)重,以判斷詞匯是否是Top-k的熱詞。

    當(dāng)使用傳統(tǒng)的TF*PDF算法時(shí),時(shí)間區(qū)間需要不斷地被更新來計(jì)算詞匯權(quán)重以查找Top-k的熱詞,TF*PDF算法中的詞頻和包含詞匯的文檔數(shù)需要進(jìn)行大量的重復(fù)計(jì)算。而當(dāng)使用PC作為存儲(chǔ)結(jié)構(gòu)時(shí),由于詞頻和文章數(shù)可以通過式(5)和式(7)直接得出,這些計(jì)算可以被避免。

    當(dāng)用戶給定一組詞匯W={w1,w2,…,wl}、初始時(shí)間間隔ta、類別gc和k,查詢?cè)摻M單詞在該類別上滿足成為熱詞的最長時(shí)間區(qū)間時(shí),我們以ta為初始點(diǎn),對(duì)ta后的時(shí)間間隔進(jìn)行遍歷以查詢熱詞,并判斷W是否在Top-k熱詞Y中,如算法2所示。

    算法2PCTF:查詢最長時(shí)間區(qū)間

    PCTF(W,ta,gc,k,PC,Q)

    輸入:詞匯W={w1,w2,…,wl},初始時(shí)間間隔ta,類別gc,整數(shù)k,所有語料庫的Prefix CubePC={PC1,PC2,…,PCNc},全部詞匯Q

    輸出:時(shí)間區(qū)間T(a,b)

    1:b=a;

    2:{gx,gx+1,…,gy}=gc;

    3:Do

    4:Weight=?;

    5:D=?;

    6:b=b+1;

    7:Forc∈(1,Nc)Begin

    9:lc=0;

    Forw∈QBegin

    12:End

    13:End

    14:Forw∈QBegin

    15:Weightw=0;

    16:Forc∈(1,Nc)Begin

    22:End

    23:Weight=Weight∪Weightw;

    24:End

    25:Y=Top-k(Weight);

    26:WhileW?Y;

    27:ReturnT(a,b-1);

    算法2首先獲取給定類別gc的類別區(qū)間(x,y),在7~13行,該算法計(jì)算在每個(gè)Channel中的詞頻的平方和,時(shí)間復(fù)雜度為O(NcNw)。隨后算法2依次迭代更新時(shí)間區(qū)間的終止時(shí)間間隔tb,并使用Prefix Cube查詢T(a,b)上所有單詞的權(quán)重,時(shí)間復(fù)雜度同樣為O(NcNw)。最后算法計(jì)算Top-k的熱詞,直到用戶給定的詞匯W不滿足熱詞的條件,算法返回時(shí)間區(qū)間T(a,b-1)。在計(jì)算Top-k熱詞時(shí),使用最小堆技術(shù),時(shí)間復(fù)雜度為O(Nwklogk),而判斷W?Y需要O(k)的時(shí)復(fù)雜度,因此,算法的總復(fù)雜度為(b-a)O(Nwklogk+2NcNw)。

    4 實(shí) 驗(yàn)

    本節(jié)設(shè)計(jì)了一系列實(shí)驗(yàn)來比較PCTF算法和傳統(tǒng)的TF*PDF算法在提取熱詞并查詢熱詞所在的最長時(shí)間區(qū)間的運(yùn)行效率。

    4.1 語料庫

    為測(cè)試PCTF算法的效率,本文從一些著名的新聞網(wǎng)站——路透社(https://uk.reuters.com),紐約時(shí)報(bào)(https://www.nytimes.com)和BBC(https://www.bbc.com)上收集了自2016年1月1日至2017年1月1日的新聞文章。表2列出了三個(gè)語料庫的詳細(xì)信息。

    表2 語料庫詳細(xì)信息

    實(shí)驗(yàn)中,渠道總數(shù)Nc=3,語料庫的最小時(shí)間單位為天。本文使用了Stanford CoreNLP對(duì)語料庫進(jìn)行了預(yù)處理,包括去除停止詞、分詞和詞形還原等。

    4.2 實(shí)驗(yàn)環(huán)境

    采用的實(shí)驗(yàn)環(huán)境為:Intel?Xeon(R) CPU E5-2650v3 @ 2.30 GHz×40,128 GB內(nèi)存和256 GB SSD磁盤,操作系統(tǒng)為Ubuntu Kylin 16.04,程序語言為Java (Version 1.8.0_92)。

    4.3 尋找最長時(shí)間區(qū)間

    (1) 改變k通過改變k,研究不同的k對(duì)PCTF算法查詢熱詞所滿足的最長時(shí)間區(qū)間的時(shí)間開銷的影響。在本次實(shí)驗(yàn)中,設(shè)置初試時(shí)間間隔為2016年6月15日(ta=288),類別為politics(gc=politics,類別區(qū)間長度為23),用戶給定的一組詞匯W={Trump,Clinton,Obama,President}。實(shí)驗(yàn)結(jié)果如圖1所示。

    圖1 改變k時(shí)查詢時(shí)間的變化曲線

    從圖 1可以看出,隨著k的增加,PCTF算法和傳統(tǒng)的TF*PDF算法查詢最大時(shí)間區(qū)間所消耗的時(shí)間均有所增加,這是因?yàn)樵谟?jì)算出所有詞匯的權(quán)重之后,算法需要計(jì)算Top-k的熱詞。此外,隨著k的增加,用戶給定詞匯滿足Top-k的最長時(shí)間區(qū)間的范圍也可能增加。因此,兩個(gè)算法的整體時(shí)間消耗均有所增加。然而,隨著k的增加,PCTF算法的時(shí)間開銷均遠(yuǎn)小于TF*PDF算法。

    (2) 改變類別和用戶指定的詞匯 通過改變類別和用戶指定的關(guān)鍵詞,研究PCTF算法對(duì)于不同用戶偏好的適用性。實(shí)驗(yàn)設(shè)置初始時(shí)間間隔為2016年8月1日(ta=213),k=50,類別和詞匯分別為:

    ①gc=basketball,類別區(qū)間長度為5,W={NBA,Rockets,Harden};

    ②gc=football,類別區(qū)間長度為8,W={Spain,Argentina,Ronaldo,Messi};

    ③gc=tennis,類別區(qū)間長度為3,W={Nadal,Federer,Final}。

    實(shí)驗(yàn)結(jié)果如圖2所示。

    圖2 改變類別和關(guān)鍵詞時(shí)查詢時(shí)間變化的柱狀圖

    由圖 2可以看出,對(duì)于不同的類別和用戶指定的詞匯,兩種算法在較大的類別區(qū)間上有較高的查詢時(shí)間。而與TF*PDF算法相比,PCTF算法均能以較低的查詢時(shí)間得到最大的時(shí)間區(qū)間。

    (3) 改變初始時(shí)間間隔 由于一組詞匯可以在不同的時(shí)間區(qū)間內(nèi)都成為熱詞,也即該組詞匯描述的事件發(fā)生了多次,可以通過改變初始時(shí)間間隔來更加全面地尋找詞匯能夠成為熱詞的最長時(shí)間區(qū)間。

    實(shí)驗(yàn)設(shè)置類別為Sports(gc=Sports,類別區(qū)間長度為14),W={NBA,Rockets,Lakers},k=50,初始時(shí)間間隔分別為2016年1月18日(ta=17),2016年4月11日(ta=101),2016年10月27日(ta=300),2016年12月8日(ta=342)。實(shí)驗(yàn)結(jié)果如圖3所示。

    圖3 改變初始時(shí)間間隔時(shí)查詢時(shí)間變化的柱狀圖

    由圖3可以看出,當(dāng)改變查詢的初始時(shí)間間隔時(shí),PCTF算法均能保持較低的查詢時(shí)間復(fù)雜度,且查詢時(shí)間較為穩(wěn)定。

    通過以上的實(shí)驗(yàn)我們可以看出,PCTF算法能夠較好地應(yīng)對(duì)不同的查詢場(chǎng)景。當(dāng)用戶不斷改變k、查詢類別和詞匯以及查詢的初始時(shí)間間隔時(shí),傳統(tǒng)的TF*PDF算法耗時(shí)較長,而PCTF算法均能以小于1 s的時(shí)間消耗查詢出用戶給定詞匯的最長時(shí)間區(qū)間。因此PCTF算法能夠面向不同的用戶,快速高效地對(duì)關(guān)鍵詞進(jìn)行提取,并查詢?cè)~匯所在的最長時(shí)間區(qū)間。

    5 結(jié) 語

    本文對(duì)二維區(qū)間內(nèi)關(guān)鍵詞提取的在線算法進(jìn)行研究?;赑refix Cube,對(duì)傳統(tǒng)的TF*PDF算法進(jìn)行改進(jìn),提出了FPC、DPC的存儲(chǔ)結(jié)構(gòu),快速、高效地對(duì)關(guān)鍵詞進(jìn)行提取,并能快速查詢用戶指定的詞匯成為關(guān)鍵詞的最長時(shí)間區(qū)間。PCTF算法在空間復(fù)雜度不變的情況下,降低了關(guān)鍵詞提取的時(shí)間復(fù)雜度,具有能夠面向不同偏好的用戶和較好地應(yīng)對(duì)用戶不斷更新查詢條件的優(yōu)點(diǎn)。試驗(yàn)結(jié)果表明,PCTF算法在不同查詢條件下,查詢所用時(shí)間優(yōu)于傳統(tǒng)的TF*PDF算法。在自然語言處理方面,由于本文的算法采用Stanford CoreNLP對(duì)新聞文章進(jìn)行分詞,算法對(duì)中文文檔的支持性不足。在未來的研究中,將考慮數(shù)據(jù)的更新及更加復(fù)雜的查詢,此外,將考慮使用更多中文分詞庫以增加算法對(duì)中文文檔的支持能力。

    猜你喜歡
    詞頻熱詞復(fù)雜度
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    熱詞
    熱詞
    熱詞
    一種低復(fù)雜度的慣性/GNSS矢量深組合方法
    十九大熱詞 我踐行
    求圖上廣探樹的時(shí)間復(fù)雜度
    某雷達(dá)導(dǎo)51 頭中心控制軟件圈復(fù)雜度分析與改進(jìn)
    詞頻,一部隱秘的歷史
    出口技術(shù)復(fù)雜度研究回顧與評(píng)述
    一边亲一边摸免费视频| 国产高清不卡午夜福利| tube8黄色片| 日本91视频免费播放| 亚洲国产看品久久| 极品少妇高潮喷水抽搐| 欧美在线黄色| 亚洲国产毛片av蜜桃av| avwww免费| 亚洲,欧美精品.| 亚洲,欧美精品.| 国产探花极品一区二区| 国产欧美亚洲国产| 久久av网站| 黄片小视频在线播放| 精品酒店卫生间| 中文字幕人妻丝袜一区二区 | 久久99一区二区三区| 成年美女黄网站色视频大全免费| 亚洲精品视频女| av免费观看日本| 国产在线免费精品| 色网站视频免费| 天天操日日干夜夜撸| 最黄视频免费看| 亚洲av成人精品一二三区| 成年女人毛片免费观看观看9 | videosex国产| 国产福利在线免费观看视频| 永久免费av网站大全| 欧美日韩成人在线一区二区| 久久综合国产亚洲精品| 老司机靠b影院| 国产成人一区二区在线| 69精品国产乱码久久久| 一二三四中文在线观看免费高清| 18禁动态无遮挡网站| 蜜桃在线观看..| 母亲3免费完整高清在线观看| 国产精品无大码| svipshipincom国产片| 日本欧美国产在线视频| 青春草视频在线免费观看| 精品免费久久久久久久清纯 | 无遮挡黄片免费观看| 日韩视频在线欧美| 天天躁夜夜躁狠狠躁躁| 午夜福利视频在线观看免费| 18禁国产床啪视频网站| 色94色欧美一区二区| 欧美精品人与动牲交sv欧美| 日本一区二区免费在线视频| 欧美日韩亚洲国产一区二区在线观看 | 热re99久久国产66热| av女优亚洲男人天堂| 蜜桃国产av成人99| 国产亚洲精品第一综合不卡| a级片在线免费高清观看视频| 1024视频免费在线观看| 欧美久久黑人一区二区| 女人被躁到高潮嗷嗷叫费观| 国产一区二区激情短视频 | 免费高清在线观看视频在线观看| 中文字幕最新亚洲高清| 欧美日韩av久久| 美女午夜性视频免费| 亚洲成人av在线免费| 亚洲国产av影院在线观看| 午夜日韩欧美国产| 国产日韩欧美亚洲二区| 男女免费视频国产| 成人18禁高潮啪啪吃奶动态图| 麻豆乱淫一区二区| 黄色一级大片看看| 爱豆传媒免费全集在线观看| 一级a爱视频在线免费观看| 免费少妇av软件| 午夜福利网站1000一区二区三区| √禁漫天堂资源中文www| 777久久人妻少妇嫩草av网站| 日韩一区二区视频免费看| 欧美xxⅹ黑人| 成人影院久久| 女人被躁到高潮嗷嗷叫费观| 国产有黄有色有爽视频| 多毛熟女@视频| 亚洲精品成人av观看孕妇| 久久久欧美国产精品| 亚洲精品日韩在线中文字幕| 一区二区三区四区激情视频| 黑人巨大精品欧美一区二区蜜桃| 男女免费视频国产| 9色porny在线观看| 老熟女久久久| 天天躁夜夜躁狠狠久久av| 欧美少妇被猛烈插入视频| 日韩一区二区三区影片| 久久久久久久久久久免费av| av网站在线播放免费| 欧美日韩av久久| 亚洲欧美成人精品一区二区| 欧美精品一区二区免费开放| netflix在线观看网站| 亚洲精品一区蜜桃| 国产精品 国内视频| 国产视频首页在线观看| 18禁观看日本| 最近中文字幕2019免费版| 国产一区亚洲一区在线观看| 欧美精品亚洲一区二区| 九草在线视频观看| 日韩制服骚丝袜av| 在现免费观看毛片| 久久久精品免费免费高清| 又大又爽又粗| 在线观看免费高清a一片| 乱人伦中国视频| 精品免费久久久久久久清纯 | 国产乱来视频区| 欧美人与善性xxx| 婷婷色综合大香蕉| 欧美国产精品va在线观看不卡| 国产免费又黄又爽又色| 国产精品无大码| 色播在线永久视频| tube8黄色片| 电影成人av| av天堂久久9| 国产一级毛片在线| 最近最新中文字幕大全免费视频 | 日韩中文字幕欧美一区二区 | 日本一区二区免费在线视频| a 毛片基地| 亚洲,欧美,日韩| 99热国产这里只有精品6| 久久99热这里只频精品6学生| 婷婷色综合www| 亚洲精品日本国产第一区| 午夜福利视频在线观看免费| av有码第一页| 国产精品国产三级专区第一集| 亚洲精品国产一区二区精华液| 精品久久久精品久久久| 熟妇人妻不卡中文字幕| 久久精品国产亚洲av涩爱| 一级片免费观看大全| 久久免费观看电影| 亚洲国产av新网站| xxxhd国产人妻xxx| 在线免费观看不下载黄p国产| 无遮挡黄片免费观看| 女性生殖器流出的白浆| av福利片在线| 午夜免费鲁丝| 一区二区三区乱码不卡18| 色精品久久人妻99蜜桃| 99热网站在线观看| 青青草视频在线视频观看| 天天躁狠狠躁夜夜躁狠狠躁| www.av在线官网国产| 成人手机av| 高清不卡的av网站| 日日啪夜夜爽| 国产av码专区亚洲av| 极品人妻少妇av视频| 9191精品国产免费久久| 亚洲av在线观看美女高潮| 国产精品一区二区在线观看99| 日本一区二区免费在线视频| 国产成人a∨麻豆精品| 妹子高潮喷水视频| 晚上一个人看的免费电影| 欧美老熟妇乱子伦牲交| 热99久久久久精品小说推荐| 欧美xxⅹ黑人| 国产男女内射视频| 在现免费观看毛片| 日韩欧美一区视频在线观看| 欧美日韩综合久久久久久| 亚洲国产av影院在线观看| 丰满少妇做爰视频| 秋霞伦理黄片| 大香蕉久久成人网| 亚洲情色 制服丝袜| 国产一级毛片在线| 中文字幕人妻丝袜一区二区 | 日日摸夜夜添夜夜爱| 侵犯人妻中文字幕一二三四区| 在线观看人妻少妇| 欧美日韩一区二区视频在线观看视频在线| 一本—道久久a久久精品蜜桃钙片| 亚洲综合精品二区| 一个人免费看片子| 亚洲人成77777在线视频| 亚洲美女黄色视频免费看| 精品一区在线观看国产| 亚洲欧美一区二区三区国产| 久热这里只有精品99| 母亲3免费完整高清在线观看| 大片电影免费在线观看免费| 国产精品免费视频内射| 人人妻,人人澡人人爽秒播 | 免费黄网站久久成人精品| 男女床上黄色一级片免费看| 亚洲精品久久久久久婷婷小说| 国产成人av激情在线播放| 蜜桃国产av成人99| 欧美人与善性xxx| 最近最新中文字幕大全免费视频 | 久久久精品94久久精品| 国产黄色视频一区二区在线观看| 成年动漫av网址| 国产成人精品无人区| av又黄又爽大尺度在线免费看| 亚洲国产最新在线播放| 中文字幕制服av| 90打野战视频偷拍视频| 亚洲国产av新网站| 欧美精品亚洲一区二区| 亚洲,欧美,日韩| 久久这里只有精品19| 亚洲四区av| 亚洲国产看品久久| 国产成人精品久久久久久| 女人精品久久久久毛片| 91精品伊人久久大香线蕉| 久久久久久人人人人人| 在线天堂中文资源库| 婷婷色综合大香蕉| 精品一区在线观看国产| 97人妻天天添夜夜摸| 国产不卡av网站在线观看| 国产成人精品久久二区二区91 | 亚洲欧美清纯卡通| 亚洲图色成人| 亚洲在久久综合| 亚洲精品自拍成人| 欧美日韩视频高清一区二区三区二| 免费黄色在线免费观看| 成人午夜精彩视频在线观看| 欧美激情高清一区二区三区 | 一个人免费看片子| 欧美日韩亚洲综合一区二区三区_| 中文精品一卡2卡3卡4更新| 亚洲精品日本国产第一区| avwww免费| 国产黄频视频在线观看| 欧美日韩视频高清一区二区三区二| 在线观看www视频免费| 日本黄色日本黄色录像| 久久久精品国产亚洲av高清涩受| 在现免费观看毛片| 欧美老熟妇乱子伦牲交| 国产欧美日韩综合在线一区二区| 午夜日韩欧美国产| 亚洲欧美色中文字幕在线| 久久精品国产亚洲av高清一级| 狂野欧美激情性xxxx| 亚洲综合色网址| 十分钟在线观看高清视频www| 中文字幕精品免费在线观看视频| 午夜福利乱码中文字幕| 99精品久久久久人妻精品| 卡戴珊不雅视频在线播放| 日日啪夜夜爽| 丝袜美腿诱惑在线| 七月丁香在线播放| 日韩欧美精品免费久久| 在线观看一区二区三区激情| 交换朋友夫妻互换小说| 熟女少妇亚洲综合色aaa.| 亚洲欧美清纯卡通| 乱人伦中国视频| 男女之事视频高清在线观看 | 高清黄色对白视频在线免费看| 亚洲欧洲精品一区二区精品久久久 | 老司机深夜福利视频在线观看 | 亚洲图色成人| 欧美人与善性xxx| 欧美日韩福利视频一区二区| 啦啦啦视频在线资源免费观看| 中文字幕亚洲精品专区| 久久国产精品大桥未久av| 亚洲国产欧美在线一区| 侵犯人妻中文字幕一二三四区| 亚洲视频免费观看视频| 这个男人来自地球电影免费观看 | 国产伦理片在线播放av一区| 国产精品国产三级专区第一集| 天堂8中文在线网| 亚洲少妇的诱惑av| 男女免费视频国产| 中文字幕av电影在线播放| avwww免费| 最黄视频免费看| 水蜜桃什么品种好| 亚洲成色77777| av一本久久久久| 三上悠亚av全集在线观看| 你懂的网址亚洲精品在线观看| 熟女少妇亚洲综合色aaa.| 飞空精品影院首页| 精品人妻熟女毛片av久久网站| 日本一区二区免费在线视频| 亚洲欧美一区二区三区久久| 亚洲国产毛片av蜜桃av| 国产精品久久久久久人妻精品电影 | 日本一区二区免费在线视频| 精品国产国语对白av| 国产亚洲av片在线观看秒播厂| 日韩av不卡免费在线播放| 成人三级做爰电影| 无限看片的www在线观看| 国产在线一区二区三区精| av有码第一页| 婷婷色综合大香蕉| 亚洲婷婷狠狠爱综合网| 80岁老熟妇乱子伦牲交| 操美女的视频在线观看| 我要看黄色一级片免费的| 亚洲成人国产一区在线观看 | av片东京热男人的天堂| 午夜福利影视在线免费观看| 日韩 欧美 亚洲 中文字幕| 国产精品久久久久久人妻精品电影 | 久久精品久久久久久噜噜老黄| 亚洲色图综合在线观看| 国产精品麻豆人妻色哟哟久久| 久久鲁丝午夜福利片| 久久久久精品久久久久真实原创| 亚洲一区中文字幕在线| 日韩 欧美 亚洲 中文字幕| 伊人亚洲综合成人网| 一级片'在线观看视频| 在现免费观看毛片| av线在线观看网站| 99国产精品免费福利视频| 久久人妻熟女aⅴ| 日本vs欧美在线观看视频| 99久久综合免费| 三上悠亚av全集在线观看| 九草在线视频观看| 精品国产乱码久久久久久小说| 亚洲av电影在线观看一区二区三区| 男人爽女人下面视频在线观看| 国产免费又黄又爽又色| 老鸭窝网址在线观看| 夫妻午夜视频| 男人舔女人的私密视频| 在线看a的网站| 成人漫画全彩无遮挡| 另类精品久久| 成年动漫av网址| 亚洲av日韩在线播放| √禁漫天堂资源中文www| 老汉色∧v一级毛片| 欧美黑人欧美精品刺激| 亚洲欧美成人综合另类久久久| 欧美日韩国产mv在线观看视频| 99久久人妻综合| 国产精品 国内视频| 久久精品久久精品一区二区三区| 波多野结衣av一区二区av| 一区在线观看完整版| 午夜福利,免费看| 天天添夜夜摸| 欧美日韩亚洲国产一区二区在线观看 | 亚洲精品第二区| 在线精品无人区一区二区三| av免费观看日本| 老司机深夜福利视频在线观看 | 少妇猛男粗大的猛烈进出视频| 成年动漫av网址| 精品福利永久在线观看| 欧美日韩视频高清一区二区三区二| 纯流量卡能插随身wifi吗| 亚洲七黄色美女视频| 亚洲国产中文字幕在线视频| 新久久久久国产一级毛片| 99精国产麻豆久久婷婷| 啦啦啦在线观看免费高清www| 亚洲欧美精品综合一区二区三区| 女性生殖器流出的白浆| 亚洲成国产人片在线观看| 男人爽女人下面视频在线观看| 捣出白浆h1v1| 久久久精品国产亚洲av高清涩受| 美国免费a级毛片| 亚洲视频免费观看视频| 大码成人一级视频| www日本在线高清视频| 成年人免费黄色播放视频| 美女扒开内裤让男人捅视频| 蜜桃国产av成人99| 欧美 亚洲 国产 日韩一| 亚洲男人天堂网一区| 18禁裸乳无遮挡动漫免费视频| 国产精品久久久久久精品古装| 久久天躁狠狠躁夜夜2o2o | 亚洲色图综合在线观看| 一个人免费看片子| 日韩人妻精品一区2区三区| 亚洲欧洲精品一区二区精品久久久 | 丰满迷人的少妇在线观看| 亚洲精品在线美女| 成人免费观看视频高清| av网站在线播放免费| 欧美日韩亚洲高清精品| 天天躁夜夜躁狠狠久久av| 卡戴珊不雅视频在线播放| 午夜免费观看性视频| 精品免费久久久久久久清纯 | 在线精品无人区一区二区三| 成人国产麻豆网| 国产精品久久久久成人av| 宅男免费午夜| 亚洲美女视频黄频| 亚洲精品国产av成人精品| 日韩视频在线欧美| 亚洲激情五月婷婷啪啪| 国产日韩一区二区三区精品不卡| 国产一级毛片在线| 成人免费观看视频高清| 精品久久蜜臀av无| 黄色视频在线播放观看不卡| 亚洲国产精品999| 久久久久精品久久久久真实原创| av女优亚洲男人天堂| 五月开心婷婷网| 男女边吃奶边做爰视频| 国产乱人偷精品视频| av在线观看视频网站免费| 美国免费a级毛片| 国产精品二区激情视频| 国产男女内射视频| 国产又爽黄色视频| 99精品久久久久人妻精品| 亚洲精品日本国产第一区| 国产在线视频一区二区| 国产成人啪精品午夜网站| 亚洲少妇的诱惑av| 制服诱惑二区| 日韩 亚洲 欧美在线| 久久99一区二区三区| 嫩草影院入口| 欧美黄色片欧美黄色片| 国产男女内射视频| 亚洲国产毛片av蜜桃av| 99精品久久久久人妻精品| 欧美成人精品欧美一级黄| 日韩大码丰满熟妇| 男人爽女人下面视频在线观看| 欧美xxⅹ黑人| 中国国产av一级| 欧美老熟妇乱子伦牲交| 精品第一国产精品| 另类亚洲欧美激情| 免费久久久久久久精品成人欧美视频| 999久久久国产精品视频| 69精品国产乱码久久久| 深夜精品福利| 欧美日韩亚洲国产一区二区在线观看 | 成年av动漫网址| 一级,二级,三级黄色视频| 午夜福利视频精品| 99国产精品免费福利视频| 在线观看国产h片| 国产xxxxx性猛交| 18禁裸乳无遮挡动漫免费视频| 亚洲精品一区蜜桃| 亚洲国产av影院在线观看| 自线自在国产av| 精品国产乱码久久久久久小说| 国产一级毛片在线| 大话2 男鬼变身卡| 美女大奶头黄色视频| 亚洲欧洲精品一区二区精品久久久 | 少妇 在线观看| 欧美日韩综合久久久久久| 最近最新中文字幕免费大全7| 国产在线一区二区三区精| 国产精品成人在线| 亚洲欧美一区二区三区国产| 纵有疾风起免费观看全集完整版| 最近手机中文字幕大全| 亚洲成色77777| 精品少妇内射三级| 看十八女毛片水多多多| 美女福利国产在线| 国产精品.久久久| 久久 成人 亚洲| 91精品三级在线观看| 青春草亚洲视频在线观看| 午夜免费观看性视频| 日本猛色少妇xxxxx猛交久久| 美女中出高潮动态图| 高清av免费在线| h视频一区二区三区| 免费不卡黄色视频| 新久久久久国产一级毛片| av片东京热男人的天堂| 国产乱人偷精品视频| 少妇人妻久久综合中文| 新久久久久国产一级毛片| av片东京热男人的天堂| 精品亚洲成国产av| 亚洲成国产人片在线观看| 国产亚洲av片在线观看秒播厂| 国产精品人妻久久久影院| 精品国产一区二区三区四区第35| 亚洲av福利一区| 国产免费又黄又爽又色| xxxhd国产人妻xxx| 高清黄色对白视频在线免费看| 国产无遮挡羞羞视频在线观看| 最近最新中文字幕免费大全7| kizo精华| 美国免费a级毛片| 汤姆久久久久久久影院中文字幕| 97在线人人人人妻| 青春草亚洲视频在线观看| 国产av精品麻豆| 亚洲精品成人av观看孕妇| 精品久久久久久电影网| 少妇被粗大的猛进出69影院| 久久韩国三级中文字幕| 日韩av不卡免费在线播放| 亚洲美女搞黄在线观看| 黑人猛操日本美女一级片| 国产免费现黄频在线看| 狂野欧美激情性bbbbbb| 视频区图区小说| 国产淫语在线视频| 卡戴珊不雅视频在线播放| 美女大奶头黄色视频| 久久久久久人妻| 18禁国产床啪视频网站| 国产成人免费无遮挡视频| 欧美精品人与动牲交sv欧美| 嫩草影视91久久| 夫妻午夜视频| 国产高清不卡午夜福利| 一级黄片播放器| 日本vs欧美在线观看视频| 18禁国产床啪视频网站| 又黄又粗又硬又大视频| 成人手机av| 亚洲第一av免费看| 一区二区三区四区激情视频| 欧美精品人与动牲交sv欧美| 亚洲图色成人| 成人18禁高潮啪啪吃奶动态图| 香蕉丝袜av| 一区二区三区激情视频| av又黄又爽大尺度在线免费看| 久久精品国产亚洲av涩爱| 女性被躁到高潮视频| 免费在线观看黄色视频的| 国产av一区二区精品久久| netflix在线观看网站| 亚洲av国产av综合av卡| 国产精品久久久久久久久免| 精品国产一区二区久久| 亚洲av在线观看美女高潮| 国产精品久久久久成人av| 国产毛片在线视频| 啦啦啦在线观看免费高清www| 亚洲精品国产区一区二| 婷婷色麻豆天堂久久| 日韩中文字幕欧美一区二区 | 交换朋友夫妻互换小说| a级毛片黄视频| 最近最新中文字幕大全免费视频 | 精品少妇一区二区三区视频日本电影 | 女人久久www免费人成看片| 伦理电影免费视频| 国产精品久久久人人做人人爽| 国产精品三级大全| 热99久久久久精品小说推荐| 国产人伦9x9x在线观看| 午夜福利,免费看| 黑人欧美特级aaaaaa片| 精品少妇黑人巨大在线播放| 欧美中文综合在线视频| 午夜免费观看性视频| 亚洲av电影在线观看一区二区三区| 蜜桃在线观看..| 日韩成人av中文字幕在线观看| 老汉色av国产亚洲站长工具| 国产1区2区3区精品| 老司机影院毛片| 免费日韩欧美在线观看| 一级毛片黄色毛片免费观看视频| av电影中文网址| 亚洲av中文av极速乱| 老汉色∧v一级毛片| 亚洲天堂av无毛| 国产在线一区二区三区精| av网站在线播放免费| 亚洲国产看品久久| 亚洲国产中文字幕在线视频| 国产伦理片在线播放av一区| 国产av国产精品国产| 大陆偷拍与自拍| 亚洲欧美一区二区三区国产| 国产精品无大码| 成年av动漫网址| 亚洲av福利一区| 久热这里只有精品99| 青青草视频在线视频观看| 亚洲成人av在线免费| 美女国产高潮福利片在线看| 欧美在线一区亚洲| 狂野欧美激情性bbbbbb| 亚洲国产欧美一区二区综合|