• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于邊權(quán)重的主題核心術(shù)語抽取

    2015-05-30 22:06:44薛涵秦兵劉挺
    智能計算機(jī)與應(yīng)用 2015年4期

    薛涵 秦兵 劉挺

    摘 要:術(shù)語抽取是層次體系構(gòu)建的首要子任務(wù)。目前的術(shù)語抽取研究主要集中在文本語料并且混合多個主題,存在知識獲取的瓶頸和術(shù)語表述的模糊與歧義的問題。為了解決這些問題,本文提出一種基于邊權(quán)重的主題核心術(shù)語抽取方法,從社會化標(biāo)簽中抽取主題核心術(shù)語。考慮到社會化標(biāo)簽豐富的語義關(guān)聯(lián)特征,本文提出結(jié)合具體主題的局部共現(xiàn)和資源集合中所有主題的全局語義相似度的邊權(quán)重。新穎的邊權(quán)重將傳統(tǒng)的隨機(jī)游走方法分解成多個主題相關(guān)的隨機(jī)游走,并針對每個具體主題排序相關(guān)的候選術(shù)語。排序靠前的術(shù)語被抽取作為主題核心術(shù)語。實驗結(jié)果表明本文提出的方法顯著優(yōu)于前人的相關(guān)工作。

    關(guān)鍵詞:術(shù)語抽??;社會化標(biāo)簽;主題核心術(shù)語抽??;主題相關(guān)的隨機(jī)游走

    中圖分類號:TP391 文獻(xiàn)標(biāo)識號:A

    Topic Key Term Extraction based on Edge Weight

    XUE Han1,2, QIN Bing1, LIU Ting1

    (1 School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China;2 Library, Harbin Engineering University, Harbin 150001, China)

    Abstract: Term extraction is a primary subtask of hierarchy construction. Existing studies for term extraction mainly focus on text corpora and indiscriminately mix numerous topics, which may lead to a knowledge acquisition bottleneck and misconception. To deal with these problems, this paper proposes a method of topic key term extraction based on edge weight to extract topic key term from folksonomy. In view of semantic association characteristics of folksonomy, the edge weight which combines the local co-occurrence in a specific topic with the global semantic similarity over all the topic dimensions in the whole collection considered is proposed. The new edge weight can decompose a traditional random walk into multiple random walks specific to various topics, and each of these walks outputs a list of terms ordered on the basis of importance score. Then, the top-ranking terms are extracted as the topic key terms for each topic. Experiments show that the proposed method outperforms other state-of-the-art methods.

    Keywords: Term Extraction; Folksonomy; Topic Key Term Extraction; Topic-Sensitive Random Walk

    0 引言

    作為層次體系構(gòu)建的第一步,術(shù)語抽取是一項重要的子任務(wù)[1]。核心術(shù)語通常定義為可以概括語料所蘊含語義主題內(nèi)容的一系列術(shù)語。語料往往包含多個主題,其中每個術(shù)語對于不同的主題會表達(dá)不同的含義。多個主題的共有術(shù)語在不同主題的重要性往往不同?;旌现黝}衡量術(shù)語的重要性可能會導(dǎo)致某些不太常見或者新涌現(xiàn)出的主題核心術(shù)語無法被識別出來。例如,“牛仔”在“西部”主題中是核心術(shù)語,而在其他主題中則是非核心術(shù)語?;旌隙鄠€主題構(gòu)建的單一層次體系容易導(dǎo)致不同主題共有術(shù)語的模糊和歧義問題,在同一個層次體系中用完全不同的含義定義同一個術(shù)語是不準(zhǔn)確的,然而忽略其中任何一個含義會導(dǎo)致無法完整詮釋術(shù)語的含義。為此,本研究提出抽取主題核心術(shù)語,即根據(jù)從語料中學(xué)習(xí)得到的具體主題,抽取能夠較好地概括和描述該主題的內(nèi)容并與此主題下其他非核心術(shù)語密切相關(guān)的術(shù)語。例如,電影領(lǐng)域的主題核心術(shù)語通常有“喜劇”、“科幻”、“傳記”等。主題核心術(shù)語抽取是許多自然語言處理任務(wù)的基礎(chǔ),例如,信息檢索和導(dǎo)航、問答、推薦系統(tǒng)等。

    目前核心術(shù)語抽取研究主要基于領(lǐng)域文本語料,但是發(fā)現(xiàn)能夠準(zhǔn)確描述專業(yè)性較強(qiáng)或者主題變化較快的文本語料并非易事[2]。即便可以,人工遍歷所有的文本語料并且隨時跟蹤所有新出現(xiàn)的主題也幾乎是不可能完成的任務(wù)。例如,對于常見的電影主題“喜劇”來說,找到形式化定義和描述“喜劇”主題的文本語料相對容易,但是對于不太常見的主題“Cult”,發(fā)現(xiàn)類似的文本語料則相對困難。但是,標(biāo)簽卻可以用“Cult”、“非主流”、“小成本”等自然語言詞匯更加輕松、自由地定義這樣的主題。正因為如此,一些研究者開始探索和嘗試使用社會化標(biāo)簽這種新興的語料。社會化標(biāo)簽[3]允許擁有不同專業(yè)知識的大量互聯(lián)網(wǎng)“草根”用戶使用任意詞匯(標(biāo)簽)自由標(biāo)注感興趣的資源并與他人分享,由于技術(shù)門檻低、用戶易于使用,因此蘊含著豐富并且及時的互聯(lián)網(wǎng)大眾語義知識?;ヂ?lián)網(wǎng)用戶通過標(biāo)注、分享標(biāo)簽,瀏覽他人標(biāo)簽的過程,形成異步反饋并逐漸達(dá)成共識。在這個過程中產(chǎn)生了豐富的顯式和隱式關(guān)聯(lián)。顯式關(guān)聯(lián)存在于通過標(biāo)簽關(guān)聯(lián)的資源和用戶之間,隱式關(guān)聯(lián)存在于擁有相同興趣或社區(qū)的用戶之間,以及共享相同標(biāo)簽或者用戶的資源之間。在資源、標(biāo)簽、用戶三者之間的顯式和隱式關(guān)聯(lián)提供了潛在有價值的語義信息。標(biāo)簽作為候選術(shù)語,已經(jīng)被廣大用戶人工抽取出來,從而避免了一系列自然語言處理任務(wù)如分詞、詞性標(biāo)注、句法分析等。可見,社會化標(biāo)簽相對于由少量領(lǐng)域?qū)<揖幾透碌奈谋菊Z料來說能夠克服知識獲取的瓶頸。但是,從社會化標(biāo)簽中抽取主題核心術(shù)語至少面臨兩方面的挑戰(zhàn)。第一,社會化標(biāo)簽僅僅按照出現(xiàn)頻率簡單排序并未區(qū)分主題。第二,標(biāo)簽由于大眾標(biāo)注的隨意性和模糊性,質(zhì)量差異很大。為了克服這些挑戰(zhàn),研究需要識別出主題,并按照主題排序和抽取出主題核心術(shù)語。

    鑒于此,本文提出基于邊權(quán)重的主題核心術(shù)語抽取方法??紤]到中文語法的復(fù)雜性和可用研究資源不足的問題,嘗試從中文社會化標(biāo)簽數(shù)據(jù)出發(fā)開展研究,一來可以豐富中文研究資源和成果,二來可以體現(xiàn)社會化標(biāo)簽緩解知識獲取瓶頸的優(yōu)勢。需要說明的是,提出的研究方法雖然基于中文數(shù)據(jù)源,但是無監(jiān)督而且語言無關(guān)的,可以應(yīng)用于更廣泛的語料和其他任何語言。具體地,研究首先通過LDA模型,從社會化標(biāo)簽數(shù)據(jù)中發(fā)現(xiàn)隱含的主題,并學(xué)習(xí)得到候選術(shù)語的主題分布。然后,分析社會化標(biāo)簽的語義關(guān)聯(lián)特征,提出由具體主題的局部共現(xiàn)信息和所有主題的全局語義相似度共同構(gòu)成的邊權(quán)重。進(jìn)而,通過邊權(quán)重改進(jìn)PageRank[4]方法,將傳統(tǒng)的隨機(jī)游走方法分解成多個主題相關(guān)的隨機(jī)游走,并針對每個具體主題排序相關(guān)的候選術(shù)語。最后,抽取排在最前面的候選術(shù)語作為主題核心術(shù)語。據(jù)現(xiàn)有成果所知,本研究工作在中文層次體系構(gòu)建領(lǐng)域尚屬首例。本文研究對方法進(jìn)行較詳細(xì)的分析,希望對此方向的未來研究有所助益。

    1 基于邊權(quán)重的主題核心術(shù)語抽取

    基于邊權(quán)重的主題核心術(shù)語抽取方法的核心思想是通過邊權(quán)重的設(shè)計,將主題信息融入候選術(shù)語的重要性值傳播。首先,可從社會化標(biāo)簽抽取資源集合S和標(biāo)簽集合(候選術(shù)語)V。由于標(biāo)簽反映了大眾對資源的認(rèn)識,在此僅僅將用戶集合U的標(biāo)簽按照資源 組織成文檔。然后,給出假設(shè)資源集合S存在主題集合Z,每個候選術(shù)語 屬于多個語義主題,并且在不同主題下重要性不同。進(jìn)而,研究從資源集合中識別出主題。對于每個主題,根據(jù)候選術(shù)語的主題分布,計算結(jié)合局部和全局語義相似度的邊權(quán)重,并建立主題相關(guān)的候選術(shù)語組成的圖(見第1.1節(jié))。隨后,再將一個傳統(tǒng)的隨機(jī)游走方法分解成多個主題相關(guān)的隨機(jī)游走,并針對每個主題根據(jù)重要性值對候選術(shù)語排序(見第1.2節(jié))。最后,排序靠前的術(shù)語被抽取出來作為每個主題的核心術(shù)語。

    1.1 主題識別

    本文選擇使用無監(jiān)督的機(jī)器學(xué)習(xí)技術(shù)從資源集合中識別出主題并獲得每個候選術(shù)語的主題分布,而不是已標(biāo)注的語義知識庫(如,WordNet),因為其中的詞匯并不能很好地覆蓋社會化標(biāo)簽。機(jī)器學(xué)習(xí)中的隱含主題模型能夠根據(jù)語料中詞的共現(xiàn)信息推斷隱含的主題。LDA[5]是隱含主題模型的代表,其中文檔d中的每個詞w的產(chǎn)生,是通過首先從d的主題分布θ中取出主題z,然后,從詞的分布Ф中取出能代表主題z的詞。θ和Ф分別來自共軛狄利克雷先驗α和β。在此使用資源集合S作為LDA模型的輸入,其中每個資源是由用戶集合U對其打出的標(biāo)簽組成的文檔。通過LDA,對于給定主題 ,則通過公式(1)獲得每個候選術(shù)語 的主題分布 。

    (1)

    進(jìn)而,又通過公式(2)和(3)分別計算出候選術(shù)語之間的局部和全局語義相似度。

    (2)

    (3)

    代表候選術(shù)語wi和wj之間的局部語義相似度(見公式(2)),反映了候選術(shù)語對于具體主題的局部共現(xiàn)信息。其中, 計算為候選術(shù)語wi和wj在同一個資源 中共現(xiàn)并且屬于同一個主題z的次數(shù)。 計算為候選術(shù)語wi和wj在同一個資源 中共現(xiàn)的次數(shù)。 代表候選術(shù)語wi和wj之間的全局語義相似度,通過將公式(1)代入公式(3)計算得到,定義為兩個候選術(shù)語wi和wj在整個資源集合S中所有主題維度上的余弦相似度,反映了候選術(shù)語對于整個主題集合的全局語義相似度。

    1.2 術(shù)語排序

    PageRank[4]是計算網(wǎng)頁重要性的著名圖排序算法,也可以用于計算術(shù)語的重要性。如果有邊存在于節(jié)點wi和wj之間,研究就用節(jié)點集合 和邊集合 組成圖 。其中,每個節(jié)點代表一個術(shù)語,每條邊說明連接的兩個術(shù)語的相關(guān)關(guān)系,wi和wj之間邊的權(quán)重定義為 ,節(jié)點wi的出度定義為 。在PageRank中,詞wi的重要性值通過迭代地運行公式(4)直到收斂獲得。其中,衰減因子λ的取值范圍為0到1,|V|是節(jié)點數(shù)。衰減因子說明每個節(jié)點有(1-λ)的概率隨機(jī)跳轉(zhuǎn)到圖中的其他節(jié)點,同時有λ的概率隨出度邊跳轉(zhuǎn)到相鄰節(jié)點。

    (4)

    然而,傳統(tǒng)的PageRank算法僅為每個術(shù)語保留唯一的重要性值。為了能夠按照主題排序,傳統(tǒng)PageRank的隨機(jī)游走被分解成多個主題相關(guān)的隨機(jī)游走,目的就是將術(shù)語的重要性值分解成與主題相關(guān)的重要性向量,準(zhǔn)確記錄術(shù)語對于不同主題的重要性。相關(guān)工作主要有Liu等人提出的方法[6]MTPR,主要思想是對于每個主題分別運行有偏好的PageRank算法,將公式(4)中第二項統(tǒng)一的隨機(jī)跳轉(zhuǎn)改為主題相關(guān)的隨機(jī)跳轉(zhuǎn)概率即偏好值 ,且 ,從三種備選中最終確定為 。對于主題z,MTPR計算候選術(shù)語的主題重要性值如公式(5)所示。其中,邊權(quán)重 定義為兩個候選術(shù)語在固定窗口大小中的共現(xiàn)次數(shù)。

    (5)

    Zhao等人的方法[7]McTPR認(rèn)為與主題背景知識無關(guān)的傳播會導(dǎo)致重要性值偏離主題,因而,基于MTPR的工作,進(jìn)一步在邊權(quán)重的設(shè)置上用與主題相關(guān)的背景知識建模重要性值傳播,如公式(6)所示。其中,邊權(quán)重 定義為兩個候選術(shù)語在同屬于主題z的微博中共現(xiàn)的次數(shù)。

    (6)

    受到前人相關(guān)工作的啟發(fā),研究認(rèn)為在PageRank算法的邊權(quán)重中融入主題信息能夠?qū)鹘y(tǒng)的隨機(jī)游走分解成多個主題相關(guān)的隨機(jī)游走,考慮到社會化標(biāo)簽豐富的顯式和隱式關(guān)聯(lián)特性,文中提出MeTPR方法,通過新穎的邊權(quán)重如公式(7)所示,進(jìn)一步改進(jìn)主題相關(guān)的隨機(jī)游走方法。

    (7)

    其中,權(quán)重因子ρ控制公式(2)表示的局部語義相似度和公式(3)表示的全局語義相似度兩者的比重。通過新的邊權(quán)重,主題術(shù)語的重要性傳播不僅反映出兩個術(shù)語在具體主題下資源組織結(jié)構(gòu)上的局部共現(xiàn)信息,還反映出兩個術(shù)語在所有主題下整個資源集合上的全局語義相似度。相應(yīng)地,將公式(7)代入公式(6),迭代運行MeTPR直到收斂,得到為每個術(shù)語計算的主題相關(guān)的重要性值。最終,排序靠前的術(shù)語被抽取出來作為主題核心術(shù)語。

    2 實驗及分析

    2.1 實驗設(shè)置

    研究從豆瓣電影網(wǎng)站收集實驗所需的數(shù)據(jù),豆瓣電影是一個流行的中文社交網(wǎng)站,允許注冊用戶提交與電影相關(guān)的信息,并與他人分享。實驗獲取截止到2012年6月,豆瓣電影網(wǎng)站用戶對豆瓣Top250的電影打出的標(biāo)簽信息,共計1760個標(biāo)簽。經(jīng)過去除停用詞和噪聲等預(yù)處理,最終獲得1 737個標(biāo)簽作為候選術(shù)語。根據(jù)數(shù)據(jù)集的規(guī)模和人工經(jīng)驗的判斷,實驗中嘗試10到100之間不同主題數(shù)目的設(shè)置學(xué)習(xí)LDA模型,并最終選擇將初始主題數(shù)目設(shè)定為40。然后,隨即運行LDA算法,并每隔1 000次迭代進(jìn)行Gibbs取樣一次。接著,在同樣的數(shù)據(jù)集上將我們的方法與前人相關(guān)工作做比較。

    (1)MTPR 代表Liu等人的方法[6],邊權(quán)重計算為兩個候選術(shù)語在同一個資源中共現(xiàn)的數(shù)目 ,偏好值通過公式(1)得到,候選術(shù)語對于不同主題的重要性通過迭代地運行公式(5)直到收斂后得到。

    (2)McTPR 代表Zhao等人的方法[7],邊權(quán)重計算為兩個候選術(shù)語在同一個資源中共現(xiàn)并且屬于同一個主題的數(shù)目 ,偏好值通過公式(1)計算得到,候選術(shù)語對于不同主題的重要性通過迭代地運行公式(6)直到收斂后得到。

    (3)MeTPR 代表本文提出的方法,邊權(quán)重和偏好值分別通過公式(7)和(1)計算得到,候選術(shù)語對于不同主題的重要性通過迭代地運行公式(6)直到收斂后得到。

    研究中,終止運行上述方法的條件是僅當(dāng)?shù)螖?shù)達(dá)到100或者候選術(shù)語在相鄰兩次迭代中的重要性值差異小于0.000 001。有三個參數(shù)影響主題核心術(shù)語抽取方法,包括(1)衰減因子λ,用于對比方法中調(diào)節(jié)重要性傳播通過出度邊跳轉(zhuǎn)到相鄰候選術(shù)語(公式(5),(6)中的第一項)和隨機(jī)跳轉(zhuǎn)到任意候選術(shù)語(公式(5),(6)中的第二項)之間的比重。(2)權(quán)重因子ρ,在MeTPR中應(yīng)用于邊權(quán)重(公式(7)),用于控制兩個候選術(shù)語之間的關(guān)于具體主題的局部共現(xiàn)和所有主題的全局語義相似度之間的比重。(3)閾值Q。當(dāng)把Q應(yīng)用于MTPR,McTPR,MeTPR三種方法時,如果兩個候選術(shù)語之間的全局語義相似度小于Q,有針對地將移除這對術(shù)語之間的邊。并且分別設(shè)定參數(shù)λ,ρ,Q的取值范圍為從0.1到0.9,步長為0.1,這樣每個參數(shù)就有9種候選取值。經(jīng)過三個參數(shù)的排列組合,相應(yīng)地就分別得到以上對比方法的729組實驗結(jié)果。

    2.2 評價標(biāo)準(zhǔn)

    評價標(biāo)準(zhǔn)通過Pooling方法[8]構(gòu)建完成。首先,社會化標(biāo)簽中不存在主題核心術(shù)語抽取的黃金標(biāo)準(zhǔn);第二,人工識別出所有主題,并判斷主題核心術(shù)語是不可能完成的任務(wù)。為此隨機(jī)混合對比方法MTPR,McTPR,MeTPR的所有實驗結(jié)果,并要求兩個標(biāo)注者獨立標(biāo)注。如果抽取結(jié)果中給出的是與具體主題相關(guān)的、較為抽象的、具有代表性的候選術(shù)語,就標(biāo)注為1;否則,如果抽取結(jié)果中給出的是與具體主題不相關(guān)的,或者缺乏代表性、太過于具體的候選術(shù)語,就標(biāo)注為0。僅當(dāng)兩個標(biāo)注者都標(biāo)注為1的候選術(shù)語才被認(rèn)為是正確的主題核心術(shù)語,其他情況的候選術(shù)語均被認(rèn)為是錯誤的結(jié)果。以“致我們終將逝去的青春”為例,對于這部電影和同類型的其他相關(guān)電影所屬的主題來說,正確的主題核心術(shù)語可能是“青春”、“校園”、“愛情”等,而“2013”(上映時間)和有關(guān)電影具體屬性的其他候選術(shù)語,如導(dǎo)演、演員等,在本文任務(wù)的評價中均應(yīng)被標(biāo)注為0。最終,將兩個標(biāo)注者共同認(rèn)可的主題核心術(shù)語集合作為基于邊權(quán)重的主題核心術(shù)語抽取任務(wù)評價的黃金標(biāo)準(zhǔn)(Kappa值為0.95)。

    研究對主題核心術(shù)語抽取任務(wù)的評價策略包括經(jīng)典的精確率(Precision)、召回率(Recall)、F1值(F1)(見公式(8)),以及兩個考慮順序的評價策略包括平均準(zhǔn)確率(MAP:Mean Average Precision)(見公式(9))和平均排序倒數(shù)(MRR:Mean Reciprocal Rank)(見公式(10))。

    (8)

    其中, 代表通過某種方法抽取的正確主題核心術(shù)語的數(shù)目, 代表通過某種方法自動抽取的主題核心術(shù)語的總數(shù), 代表根據(jù)黃金標(biāo)準(zhǔn)得到的主題核心術(shù)語的總數(shù)。這些評價策略均對所有主題求平均值。

    進(jìn)一步地,研究使用平均準(zhǔn)確率(MAP)[7]來評價主題核心術(shù)語抽取的整體性能,如公式(9)所示。

    (9)

    其中,Z是主題集合。I(S)是一個示函數(shù),當(dāng)S為真時返回1,否則返回0。Mz,j代表對于主題z,通過方法M產(chǎn)生的第j個候選術(shù)語,score(.)是兩個人工標(biāo)注結(jié)果的平均值。Mz代表對于主題z,通過方法M產(chǎn)生的所有候選術(shù)語。NM,z,j代表對于主題z,通過方法M返回前j個候選術(shù)語中正確的主題核心術(shù)語的數(shù)目,Nz代表對于主題z,根據(jù)黃金標(biāo)準(zhǔn)得到正確的主題核心術(shù)語的總數(shù)。

    平均排序倒數(shù)(MRR)[9],如公式(10)所示,用于評價對于每個主題來說第一個正確的主題核心術(shù)語所在的排序。對于主題z,rankz代表第一個正確的主題核心術(shù)語返回的位置。

    (10)

    2.3 與前人工作的對比

    研究通過對影響方法性能的三個參數(shù)的窮舉獲取最優(yōu)參數(shù)組合,得出提出的方法MeTPR與對比方法MTPR,McTPR在五項評價指標(biāo)上的最優(yōu)性能對比。如表1所示,本文提出的方法MeTPR在準(zhǔn)確率上獲得較大提升,比MTPR、McTPR兩種對比方法分別提升8.3%、7.5%。在召回率、F1值、MRR、MAP四項評價指標(biāo)上,MeTPR相對于其他兩種對比方法的提升均超過3.3%。由于邊權(quán)重的設(shè)置結(jié)合具體主題的局部共現(xiàn)信息和所有主題的全局語義相似度,MeTPR整體性能最好。McTPR由于在邊權(quán)重的傳播中考慮主題背景知識,性能好于在邊權(quán)重中僅考慮候選術(shù)語共現(xiàn)次數(shù)的MTPR。但是,LDA算法對于初始主題數(shù)的設(shè)置,可能會給后續(xù)多個彼此獨立的主題相關(guān)的隨機(jī)游走帶來不可避免的錯誤,因此未來需要考慮新的途徑來改善這類核心術(shù)語抽取方法。

    表1 與前人工作的性能對比(t-test,p-value < 0.0001)

    Tab.1 Performance comparison with state-of-the-art methods (t-test,p-value < 0.0001)

    對比方法 Precision Recall F1 MRR MAP

    MTPR 0.617 0.404 0.488 0.670 0.405

    McTPR 0.625 0.406 0.492 0.675 0.407

    MeTPR 0.700 0.440 0.540 0.713 0.440

    3 結(jié)束語

    本文針對從社會化標(biāo)簽中抽取主題核心術(shù)語的任務(wù),提出基于邊權(quán)重的主題核心術(shù)語抽取方法。從社會化標(biāo)簽豐富的關(guān)聯(lián)特性出發(fā),提出結(jié)合具體主題的局部共現(xiàn)信息和所有主題的全局語義相似度共同構(gòu)成的邊權(quán)重。進(jìn)而,通過新穎的邊權(quán)重將傳統(tǒng)PageRank的隨機(jī)游走分解成多個主題相關(guān)的隨機(jī)游走,經(jīng)過候選術(shù)語的重要性傳播,排序抽取出主題核心術(shù)語。在豆瓣電影數(shù)據(jù)集上的實驗結(jié)果驗證了所提出方法的有效性和健壯性。未來工作,將會通過探索更多社會化標(biāo)簽的數(shù)據(jù)源,同時結(jié)合對基于邊權(quán)重的主題核心術(shù)語抽取方法的改進(jìn),進(jìn)一步提高主題核心術(shù)語抽取的性能。

    參考文獻(xiàn):

    [1] CUI G, LU Q, LI W, et al. Automatic acquisition of attributes for ontology construction[C]//the 22nd International Conference,Hong Kong:ICCPOL,2009:248-259.

    [2] LIU X, SONG Y, LIUiu S, et al. Automatic taxonomy construction from keywords[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,New York,NY,USA:ACM,2012:1433-1441.

    [3] TRANT J. Studying social tagging and folksonomy: A review and framework [J]. Journal of Digital Information,2009,10(1):1-42.

    [4] Page L, Brin S, Motwani R, et al. The Pagerank Citation Ranking: Bringing Order to the Web[R]. Stanford:Stanford Digital Library Technologies Project,1999:1-17.

    [5] BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.

    [6] LIU Z Y, HUANG W Y, ZHENG Y B, et al. Automatic keyphrase extraction via topic decomposition[C]// Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing,Association for Computational Linguistics,Stroudsburg,PA,USA:ACL,2010:366-376.

    [7] ZHAO X, JIANG J, HE J, et al. Topical keyphrase extraction from twitter[C]. Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies,Portland,OR,United states:ACL,2011:379-388.

    [8] Voorhees E, Harman D, Standards N I, et al. TREC: Experiment and Evaluation in Information Retrieval[M]. Cambridge: MIT press,Boston,2005:1-567.

    [9] VOORHEES E M. The TREC-8 question answering track report[C]//Proceedings of TREC, Gaithersburg,Maryland:NIST,1999:77-82.

    亚洲天堂av无毛| 精品一区在线观看国产| 国产淫片久久久久久久久| 干丝袜人妻中文字幕| 日韩视频在线欧美| 两个人的视频大全免费| 看非洲黑人一级黄片| 日韩强制内射视频| 老司机影院成人| 涩涩av久久男人的天堂| 在线a可以看的网站| 亚洲成人精品中文字幕电影| 男女边吃奶边做爰视频| 五月天丁香电影| 精品亚洲乱码少妇综合久久| 美女脱内裤让男人舔精品视频| 国产一区二区在线观看日韩| 一个人观看的视频www高清免费观看| 久久99热6这里只有精品| 成人午夜精彩视频在线观看| 日本黄大片高清| 亚洲av.av天堂| 91精品伊人久久大香线蕉| 国语对白做爰xxxⅹ性视频网站| 国产美女午夜福利| 美女视频免费永久观看网站| 亚洲av不卡在线观看| 99热6这里只有精品| 黄色视频在线播放观看不卡| 欧美日韩亚洲高清精品| 又爽又黄a免费视频| 成人午夜精彩视频在线观看| www.av在线官网国产| 夜夜看夜夜爽夜夜摸| 国产精品国产三级专区第一集| 成人国产麻豆网| 久久久久久久午夜电影| 久久6这里有精品| 王馨瑶露胸无遮挡在线观看| 亚洲精品国产av成人精品| 亚洲精品日本国产第一区| 在线免费观看不下载黄p国产| 美女高潮的动态| 99热这里只有是精品50| 日本熟妇午夜| 久久久亚洲精品成人影院| 久久精品国产自在天天线| 国产欧美另类精品又又久久亚洲欧美| 久久久久久久午夜电影| 婷婷色综合www| 亚洲欧美日韩另类电影网站 | 亚洲怡红院男人天堂| 精品久久久久久电影网| 日韩大片免费观看网站| 一级毛片 在线播放| 大片电影免费在线观看免费| 搡老乐熟女国产| 一区二区三区乱码不卡18| 成年免费大片在线观看| 在线亚洲精品国产二区图片欧美 | 成人亚洲精品一区在线观看 | .国产精品久久| av网站免费在线观看视频| 国产精品秋霞免费鲁丝片| 精品一区在线观看国产| 国产精品熟女久久久久浪| 亚洲精品456在线播放app| 中文字幕久久专区| 岛国毛片在线播放| 制服丝袜香蕉在线| 日本午夜av视频| www.色视频.com| 大片电影免费在线观看免费| 成人特级av手机在线观看| 偷拍熟女少妇极品色| 国精品久久久久久国模美| 久久久色成人| 美女视频免费永久观看网站| 80岁老熟妇乱子伦牲交| 十八禁网站网址无遮挡 | 69av精品久久久久久| 国模一区二区三区四区视频| 国产精品嫩草影院av在线观看| 免费黄色在线免费观看| 蜜桃亚洲精品一区二区三区| 真实男女啪啪啪动态图| 午夜免费男女啪啪视频观看| 中国美白少妇内射xxxbb| 亚洲欧美成人精品一区二区| 在线a可以看的网站| 中文字幕av成人在线电影| 日韩精品有码人妻一区| 色哟哟·www| 性插视频无遮挡在线免费观看| 秋霞在线观看毛片| 最近最新中文字幕大全电影3| 日韩国内少妇激情av| 中文字幕av成人在线电影| 亚洲美女视频黄频| 欧美性猛交╳xxx乱大交人| 99久国产av精品国产电影| 中文字幕制服av| 人妻一区二区av| 欧美日韩视频精品一区| 王馨瑶露胸无遮挡在线观看| 成人午夜精彩视频在线观看| 国产一区二区在线观看日韩| 亚洲av免费高清在线观看| 可以在线观看毛片的网站| 91午夜精品亚洲一区二区三区| 国产视频首页在线观看| 免费黄网站久久成人精品| 老司机影院毛片| 爱豆传媒免费全集在线观看| 国产精品一二三区在线看| 国产精品99久久久久久久久| 99久久精品热视频| 色婷婷久久久亚洲欧美| 日韩国内少妇激情av| 日韩不卡一区二区三区视频在线| 国产精品嫩草影院av在线观看| 久久久精品免费免费高清| 免费看a级黄色片| 一区二区三区四区激情视频| av黄色大香蕉| 我的老师免费观看完整版| 丰满乱子伦码专区| 国产精品蜜桃在线观看| 国产午夜福利久久久久久| 有码 亚洲区| 性色av一级| 成人高潮视频无遮挡免费网站| 又大又黄又爽视频免费| 亚洲欧美中文字幕日韩二区| 人人妻人人爽人人添夜夜欢视频 | 伊人久久精品亚洲午夜| 美女国产视频在线观看| av黄色大香蕉| 亚洲精品日韩在线中文字幕| 嫩草影院入口| 赤兔流量卡办理| 哪个播放器可以免费观看大片| 亚洲aⅴ乱码一区二区在线播放| 97精品久久久久久久久久精品| 国产大屁股一区二区在线视频| 国产欧美日韩一区二区三区在线 | 天堂网av新在线| 国产视频内射| 国产av国产精品国产| 91精品伊人久久大香线蕉| 国产精品伦人一区二区| 夜夜爽夜夜爽视频| 欧美+日韩+精品| 日韩一本色道免费dvd| www.色视频.com| 日日摸夜夜添夜夜爱| 韩国av在线不卡| 真实男女啪啪啪动态图| 欧美成人精品欧美一级黄| 黄色怎么调成土黄色| 国产在视频线精品| 男人爽女人下面视频在线观看| 18禁动态无遮挡网站| 欧美日本视频| 边亲边吃奶的免费视频| 中国三级夫妇交换| 少妇猛男粗大的猛烈进出视频 | 插逼视频在线观看| 久久99热这里只有精品18| 欧美激情在线99| 超碰97精品在线观看| 少妇的逼水好多| 久久久久久九九精品二区国产| 我的女老师完整版在线观看| 午夜免费鲁丝| 人妻少妇偷人精品九色| 久久久久久久久久久丰满| 少妇高潮的动态图| 深夜a级毛片| 嫩草影院精品99| av女优亚洲男人天堂| 伊人久久国产一区二区| 成人一区二区视频在线观看| 欧美最新免费一区二区三区| 亚洲精品日韩在线中文字幕| 免费电影在线观看免费观看| 久久精品国产自在天天线| 午夜免费鲁丝| 美女高潮的动态| 在线播放无遮挡| 亚洲一区二区三区欧美精品 | 亚洲av在线观看美女高潮| 亚洲国产日韩一区二区| 色综合色国产| 亚洲精品乱码久久久久久按摩| 国产午夜精品久久久久久一区二区三区| 欧美日韩精品成人综合77777| 国产黄片视频在线免费观看| 久久久久久久大尺度免费视频| 精品国产一区二区三区久久久樱花 | 91精品一卡2卡3卡4卡| 日韩中字成人| 久久人人爽人人片av| 人人妻人人澡人人爽人人夜夜| 亚洲欧洲日产国产| 欧美成人午夜免费资源| 久久99蜜桃精品久久| 国语对白做爰xxxⅹ性视频网站| 少妇的逼水好多| 搡女人真爽免费视频火全软件| 下体分泌物呈黄色| 欧美日韩综合久久久久久| 舔av片在线| 亚洲国产精品国产精品| 国产一区二区三区av在线| 国产亚洲精品久久久com| 日韩成人伦理影院| 亚洲一级一片aⅴ在线观看| 性色av一级| 精品熟女少妇av免费看| 亚洲aⅴ乱码一区二区在线播放| 一级毛片aaaaaa免费看小| 美女主播在线视频| 亚洲欧美日韩另类电影网站 | 22中文网久久字幕| 午夜老司机福利剧场| 日韩在线高清观看一区二区三区| 七月丁香在线播放| 晚上一个人看的免费电影| 成人毛片60女人毛片免费| 国精品久久久久久国模美| 国产探花在线观看一区二区| 26uuu在线亚洲综合色| 下体分泌物呈黄色| 肉色欧美久久久久久久蜜桃 | 熟女电影av网| 亚洲,一卡二卡三卡| 97在线人人人人妻| 寂寞人妻少妇视频99o| 亚洲自偷自拍三级| 99久久精品国产国产毛片| 高清在线视频一区二区三区| 人妻一区二区av| 2022亚洲国产成人精品| 中国国产av一级| 久久精品国产亚洲网站| 91精品一卡2卡3卡4卡| 日本与韩国留学比较| 亚洲最大成人av| a级毛色黄片| 十八禁网站网址无遮挡 | 男女那种视频在线观看| 亚洲av日韩在线播放| 免费不卡的大黄色大毛片视频在线观看| 春色校园在线视频观看| 精品一区二区三卡| 国内揄拍国产精品人妻在线| 婷婷色av中文字幕| 欧美亚洲 丝袜 人妻 在线| 美女cb高潮喷水在线观看| 午夜免费观看性视频| 少妇的逼水好多| 波野结衣二区三区在线| 国产精品国产三级专区第一集| 精品一区在线观看国产| 国产精品女同一区二区软件| 男人狂女人下面高潮的视频| 免费大片黄手机在线观看| 国产伦精品一区二区三区视频9| 精品久久久久久久末码| 国产成人精品一,二区| 久久热精品热| 狂野欧美激情性xxxx在线观看| 欧美3d第一页| 成年版毛片免费区| 亚洲一级一片aⅴ在线观看| 亚洲欧美中文字幕日韩二区| 欧美日本视频| 99热国产这里只有精品6| 禁无遮挡网站| 日韩视频在线欧美| 一本色道久久久久久精品综合| 亚洲精品456在线播放app| 日韩人妻高清精品专区| 亚洲国产精品成人久久小说| 精品国产一区二区三区久久久樱花 | 日日啪夜夜撸| 狂野欧美激情性bbbbbb| 成人毛片a级毛片在线播放| 一级毛片我不卡| 亚洲国产日韩一区二区| 国产精品爽爽va在线观看网站| 国产精品麻豆人妻色哟哟久久| 国内揄拍国产精品人妻在线| 成人亚洲精品av一区二区| 欧美亚洲 丝袜 人妻 在线| 成年人午夜在线观看视频| 精品国产一区二区三区久久久樱花 | 国产黄a三级三级三级人| 国产乱人偷精品视频| 国产 一区精品| 51国产日韩欧美| 国产午夜福利久久久久久| 亚洲高清免费不卡视频| 国产一区二区三区综合在线观看 | 天天躁日日操中文字幕| 国产一区二区三区综合在线观看 | 久久精品国产亚洲网站| 神马国产精品三级电影在线观看| 亚洲欧美一区二区三区国产| 亚洲欧美一区二区三区黑人 | 国产男女内射视频| 中文字幕久久专区| 在线观看三级黄色| 国产色婷婷99| av又黄又爽大尺度在线免费看| 高清毛片免费看| 久久国产乱子免费精品| 天堂俺去俺来也www色官网| 欧美最新免费一区二区三区| 王馨瑶露胸无遮挡在线观看| 老司机影院毛片| 免费观看无遮挡的男女| 免费大片黄手机在线观看| 深爱激情五月婷婷| 日韩成人伦理影院| 欧美少妇被猛烈插入视频| 黄色欧美视频在线观看| 又粗又硬又长又爽又黄的视频| 乱码一卡2卡4卡精品| 免费播放大片免费观看视频在线观看| 亚洲精品国产av蜜桃| 国产午夜精品久久久久久一区二区三区| 狂野欧美白嫩少妇大欣赏| 午夜福利网站1000一区二区三区| 色婷婷久久久亚洲欧美| 边亲边吃奶的免费视频| 水蜜桃什么品种好| 亚洲精品视频女| 国产 精品1| 永久免费av网站大全| 高清欧美精品videossex| 99视频精品全部免费 在线| 国产免费视频播放在线视频| 色综合色国产| 精品久久久久久久末码| 精品国产一区二区三区久久久樱花 | 国产亚洲最大av| 亚洲丝袜综合中文字幕| 欧美少妇被猛烈插入视频| 青春草视频在线免费观看| 中国三级夫妇交换| 国产免费又黄又爽又色| 日本猛色少妇xxxxx猛交久久| 老女人水多毛片| 九九久久精品国产亚洲av麻豆| 国产欧美日韩一区二区三区在线 | 久久久a久久爽久久v久久| 美女国产视频在线观看| tube8黄色片| 99热网站在线观看| 国产精品麻豆人妻色哟哟久久| 免费电影在线观看免费观看| 老师上课跳d突然被开到最大视频| 日韩制服骚丝袜av| 国产大屁股一区二区在线视频| 亚洲欧洲国产日韩| 新久久久久国产一级毛片| 精品久久久久久电影网| 老师上课跳d突然被开到最大视频| 久久久久久久久大av| 国产乱人偷精品视频| 少妇人妻久久综合中文| 中文在线观看免费www的网站| 久久久久久久久大av| 极品少妇高潮喷水抽搐| 爱豆传媒免费全集在线观看| 欧美97在线视频| xxx大片免费视频| 国产免费又黄又爽又色| 久久久久久久午夜电影| 国产伦理片在线播放av一区| 久久99热这里只频精品6学生| 久久精品国产亚洲av涩爱| 91久久精品国产一区二区三区| 久久久欧美国产精品| 综合色av麻豆| 国产精品99久久久久久久久| 国产成人免费无遮挡视频| 欧美激情久久久久久爽电影| 性插视频无遮挡在线免费观看| 亚洲av二区三区四区| 国产免费一区二区三区四区乱码| 国产熟女欧美一区二区| 日本欧美国产在线视频| av网站免费在线观看视频| 黄色视频在线播放观看不卡| 欧美亚洲 丝袜 人妻 在线| 天堂俺去俺来也www色官网| 中文欧美无线码| 91精品国产九色| 黄片wwwwww| 日本三级黄在线观看| 少妇人妻 视频| 97在线人人人人妻| 国产成人精品婷婷| 国产精品人妻久久久久久| 嫩草影院精品99| 欧美激情国产日韩精品一区| 一个人观看的视频www高清免费观看| 久久女婷五月综合色啪小说 | 黄色一级大片看看| 精品久久久精品久久久| 三级国产精品欧美在线观看| 午夜激情福利司机影院| 久久国产乱子免费精品| 亚洲精品一区蜜桃| 七月丁香在线播放| 欧美潮喷喷水| 免费大片18禁| 久久久久久久久久久免费av| 高清欧美精品videossex| 1000部很黄的大片| 人妻系列 视频| 国产真实伦视频高清在线观看| 美女视频免费永久观看网站| 草草在线视频免费看| 亚洲av在线观看美女高潮| 亚洲一级一片aⅴ在线观看| 在线观看一区二区三区激情| 黄片无遮挡物在线观看| 中文字幕免费在线视频6| 久久精品国产自在天天线| 久久精品国产鲁丝片午夜精品| 18禁裸乳无遮挡动漫免费视频 | 男女国产视频网站| 国产伦在线观看视频一区| 偷拍熟女少妇极品色| 极品教师在线视频| 欧美日韩综合久久久久久| 亚洲婷婷狠狠爱综合网| 身体一侧抽搐| 日韩一区二区三区影片| 最新中文字幕久久久久| 日日啪夜夜爽| 国产av不卡久久| 国产在线男女| 亚洲色图综合在线观看| 一级毛片黄色毛片免费观看视频| 亚洲欧美一区二区三区国产| 亚洲成人中文字幕在线播放| 尤物成人国产欧美一区二区三区| 精品久久久久久久久av| 久久精品国产亚洲av涩爱| 嫩草影院入口| 纵有疾风起免费观看全集完整版| 热re99久久精品国产66热6| 亚洲成人中文字幕在线播放| videos熟女内射| 有码 亚洲区| 伦精品一区二区三区| 午夜福利视频精品| 我的老师免费观看完整版| 麻豆乱淫一区二区| 国产精品av视频在线免费观看| 国产精品麻豆人妻色哟哟久久| 欧美国产精品一级二级三级 | 亚洲精品乱码久久久v下载方式| 亚州av有码| 国产精品国产av在线观看| 久久99热这里只频精品6学生| 欧美最新免费一区二区三区| 国产精品一区www在线观看| 国产午夜精品久久久久久一区二区三区| 精品99又大又爽又粗少妇毛片| 最近最新中文字幕免费大全7| 成人欧美大片| 亚洲精品久久午夜乱码| 欧美日韩一区二区视频在线观看视频在线 | 久久久久久久亚洲中文字幕| 舔av片在线| 国产白丝娇喘喷水9色精品| 大香蕉97超碰在线| 亚洲av国产av综合av卡| 精品99又大又爽又粗少妇毛片| 亚洲精品色激情综合| 免费av观看视频| 在线观看免费高清a一片| 永久网站在线| 久久精品久久久久久久性| 日韩制服骚丝袜av| 国产在线男女| 男男h啪啪无遮挡| 永久免费av网站大全| 国产人妻一区二区三区在| 三级国产精品欧美在线观看| 亚洲欧美一区二区三区国产| 在线观看一区二区三区| 尤物成人国产欧美一区二区三区| 亚洲av男天堂| 国产综合懂色| 麻豆国产97在线/欧美| 精品少妇黑人巨大在线播放| 国语对白做爰xxxⅹ性视频网站| 亚洲精品乱码久久久久久按摩| 成人亚洲精品av一区二区| 精品午夜福利在线看| 久久亚洲国产成人精品v| 精品久久久久久久末码| 亚洲一区二区三区欧美精品 | 九色成人免费人妻av| 国产精品99久久久久久久久| 禁无遮挡网站| 黄片无遮挡物在线观看| av在线老鸭窝| 国产综合精华液| 99精国产麻豆久久婷婷| 国产中年淑女户外野战色| 26uuu在线亚洲综合色| 欧美97在线视频| 嫩草影院新地址| 国产成人精品久久久久久| 女人被狂操c到高潮| 亚洲一级一片aⅴ在线观看| 欧美日本视频| 国产在视频线精品| 国产精品福利在线免费观看| 乱码一卡2卡4卡精品| 听说在线观看完整版免费高清| 老司机影院毛片| 亚洲精品第二区| 免费播放大片免费观看视频在线观看| av专区在线播放| 色播亚洲综合网| 欧美精品人与动牲交sv欧美| 熟妇人妻不卡中文字幕| 久久久久久久午夜电影| 18+在线观看网站| 美女xxoo啪啪120秒动态图| a级毛色黄片| 高清毛片免费看| 亚洲av成人精品一二三区| 久久精品国产鲁丝片午夜精品| 国产精品久久久久久精品电影| 亚洲不卡免费看| 国产精品久久久久久精品电影| 在线亚洲精品国产二区图片欧美 | 精品人妻视频免费看| 日韩一区二区三区影片| 亚洲av国产av综合av卡| 久久久久国产精品人妻一区二区| 男女边摸边吃奶| 乱系列少妇在线播放| 婷婷色麻豆天堂久久| a级毛色黄片| 成人黄色视频免费在线看| 国产欧美日韩一区二区三区在线 | 狂野欧美激情性xxxx在线观看| 成人欧美大片| 欧美精品国产亚洲| 国产成人a区在线观看| 嫩草影院精品99| 看十八女毛片水多多多| 2021少妇久久久久久久久久久| 我的老师免费观看完整版| 97精品久久久久久久久久精品| 日韩一本色道免费dvd| a级毛色黄片| 美女主播在线视频| 久久精品国产a三级三级三级| 自拍欧美九色日韩亚洲蝌蚪91 | 2021少妇久久久久久久久久久| 交换朋友夫妻互换小说| 男人和女人高潮做爰伦理| 两个人的视频大全免费| 久久久久国产精品人妻一区二区| 久久精品人妻少妇| 国产69精品久久久久777片| 日本午夜av视频| 亚洲不卡免费看| 国产精品人妻久久久影院| 亚洲精品一二三| 亚洲精品国产成人久久av| 欧美老熟妇乱子伦牲交| 国产高清有码在线观看视频| 久久久久久久久久久免费av| 久久久久九九精品影院| 国产高潮美女av| 国产中年淑女户外野战色| 亚洲熟女精品中文字幕| 亚洲不卡免费看| 大码成人一级视频| 小蜜桃在线观看免费完整版高清| 偷拍熟女少妇极品色| 看十八女毛片水多多多| 久久国内精品自在自线图片| 男女啪啪激烈高潮av片| 啦啦啦啦在线视频资源| 日韩制服骚丝袜av| 国产日韩欧美在线精品| 日韩强制内射视频| www.av在线官网国产| 日本一二三区视频观看| 亚洲精品日韩av片在线观看| 99久久精品一区二区三区| 一级毛片我不卡| av国产免费在线观看| 久久这里有精品视频免费| 18禁裸乳无遮挡免费网站照片| 免费观看a级毛片全部| 午夜视频国产福利| 欧美成人a在线观看| 国产免费福利视频在线观看| 久久久久性生活片| 深夜a级毛片|