• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于上下文關(guān)系和TextRank算法的關(guān)鍵詞提取方法

    2018-01-16 02:40:00杜海舟陳政波鐘孔露
    關(guān)鍵詞:查全率查準(zhǔn)率權(quán)重

    杜海舟, 陳政波, 鐘孔露

    (1.上海電力學(xué)院, 上海 200090;2.浙江華云電力工程設(shè)計(jì)咨詢有限公司, 浙江 杭州 310000)

    隨著社會(huì)信息化的快速推進(jìn),網(wǎng)絡(luò)上的信息以爆炸式的趨勢(shì)飛速增長(zhǎng).若沒(méi)有強(qiáng)有力的工具支持,個(gè)人在面對(duì)海量甚至大數(shù)據(jù)級(jí)別的文本數(shù)據(jù)時(shí),很難進(jìn)行高效閱讀并提取知識(shí).同樣對(duì)于決策者而言,沒(méi)有準(zhǔn)確的信息支持很難在短時(shí)間內(nèi)做出正確的決策.因此,迫切需要一個(gè)能自動(dòng)提取文本關(guān)鍵信息的方法且以用戶可讀的方式呈現(xiàn)出來(lái).自然語(yǔ)言處理技術(shù)是目前解決海量文本數(shù)據(jù)問(wèn)題的有效技術(shù)之一.而特征關(guān)鍵詞提取方法正是其中最基礎(chǔ)和最關(guān)鍵的技術(shù),其提取效果對(duì)后續(xù)的自動(dòng)摘要、標(biāo)題提取、網(wǎng)頁(yè)去重,以及文本情感趨勢(shì)分析等起決定性作用.

    本文提出一種基于上下文關(guān)系和加權(quán)TextRank算法的關(guān)鍵詞提取方法.通過(guò)分析中文文本中的詞語(yǔ)組合來(lái)反映核心主題的客觀事實(shí),基于關(guān)鍵詞的上下文關(guān)系并利用TextRank算法來(lái)提取最能表達(dá)文本主題思想的關(guān)鍵詞.實(shí)驗(yàn)結(jié)果表明,相對(duì)其他同類技術(shù),該方法能得到更理想的效果.

    1 文本關(guān)鍵詞提取方法概述

    關(guān)于文本關(guān)鍵詞提取問(wèn)題,國(guó)內(nèi)外很多學(xué)者已經(jīng)進(jìn)行了研究,并取得了一定的成果.研究中使用的主流方法集中于以下3類:一是以TF-IDF(Term-Frequency Inverse Document Frequency)算法為代表的基于統(tǒng)計(jì)特征的關(guān)鍵詞提取方法;二是以LDA為代表的基于主題模型的關(guān)鍵詞提取方法;三是基于詞圖模型的關(guān)鍵詞提取方法.

    在基于統(tǒng)計(jì)特征方面以改進(jìn)TF-IDF算法最為流行,該算法是一種用于信息檢索和數(shù)據(jù)挖掘的常用加權(quán)技術(shù).HOW B C等人[1]提出了類別描述符,以此來(lái)減弱類別數(shù)據(jù)集偏斜帶來(lái)的影響;李運(yùn)田等人[2]則利用N-gram方法來(lái)提取特征值,可以提高關(guān)鍵詞提取的準(zhǔn)確率,但是在時(shí)間上無(wú)法滿足用戶快速檢索的要求;李鎮(zhèn)君等人[3]利用IPM收集用戶閱讀中行為的相關(guān)信息,將Document Triage引入到TF-IDF算法中,在一定程度上提高了文本關(guān)鍵詞提取的準(zhǔn)確率.上述研究者提出的改進(jìn)算法在一定程度上提高了文本特征提取的效果,但其也有一定的不足,如基于統(tǒng)計(jì)特征往往會(huì)出現(xiàn)低頻詞獲得高權(quán)重及不同關(guān)鍵詞間權(quán)重值區(qū)分度不夠等問(wèn)題,表明僅僅依靠詞語(yǔ)的統(tǒng)計(jì)特征而不考慮詞語(yǔ)的聯(lián)系進(jìn)行關(guān)鍵詞提取是不全面的.

    在基于主題模型的關(guān)鍵詞提取方面,LDA模型最具有代表性.PASQUIER C[4]將體現(xiàn)文本主題且聯(lián)系緊密的句子聚類后提取主題關(guān)鍵詞,以達(dá)到文本特征提取的目的.劉俊等人[5]利用詞和主題在主題模型中的分布情況,以及通過(guò)構(gòu)建關(guān)鍵詞抽取模型來(lái)進(jìn)行文本特征的選取.但上述模型最大的缺點(diǎn)就是過(guò)分依賴于訓(xùn)練數(shù)據(jù)集,訓(xùn)練集的數(shù)量和質(zhì)量都直接影響最后關(guān)鍵詞提取的準(zhǔn)確率,致使其在應(yīng)用方面受到較大限制.

    針對(duì)上述問(wèn)題,目前更多學(xué)者傾向基于詞圖模型的TextRank關(guān)鍵詞提取算法.李鵬等人[6]通過(guò)引入社會(huì)化標(biāo)簽(tag)這種新穎的信息源并提出一種具體的實(shí)現(xiàn)方法——Tag-TextRank算法.基于詞圖模型的算法在各個(gè)評(píng)價(jià)指標(biāo)上都優(yōu)于傳統(tǒng)的基于統(tǒng)計(jì)特征的關(guān)鍵詞提取.方康等人[7]提出基于隱馬爾科夫模型的加權(quán)TextRank關(guān)鍵詞抽取算法.實(shí)驗(yàn)結(jié)果表明,該算法在提取單文檔中較少的關(guān)鍵詞時(shí)準(zhǔn)確率比較理想.但該模型以“詞袋”來(lái)單獨(dú)考慮文本中的某一個(gè)詞語(yǔ),直接忽略上下文詞語(yǔ)對(duì)于關(guān)鍵詞的輔助作用以及其自身所帶的重要主題信息,導(dǎo)致其效果不甚理想.

    2 基于上下文關(guān)系和TextRank的文本關(guān)鍵詞提取方法

    針對(duì)上述方法存在的諸多問(wèn)題,在目前應(yīng)用最為廣泛的詞圖模型基礎(chǔ)上,本文提出了一種基于上下文關(guān)系和TextRank 算法的中文文本關(guān)鍵詞提取方法.該方法以詞語(yǔ)上下文依賴關(guān)系為基礎(chǔ),通過(guò)TextRank算法的不斷迭代計(jì)算,以提高獲取文本關(guān)鍵詞的準(zhǔn)確率.

    2.1 上下文詞語(yǔ)信息量關(guān)系

    關(guān)鍵詞的上下文是依據(jù)一個(gè)固定長(zhǎng)度的“窗口”來(lái)選定的,選定窗口是表示該關(guān)鍵詞左右一定范圍內(nèi)的詞語(yǔ)集合.當(dāng)然窗口長(zhǎng)度并不是越長(zhǎng)越好,魯松等人[8]對(duì)關(guān)鍵詞窗口長(zhǎng)度對(duì)應(yīng)的信息量進(jìn)行了研究和實(shí)驗(yàn),得出的結(jié)果如圖1所示.

    圖1 中文文本上下文位置與其信息量關(guān)系

    在利用最小代價(jià)的前提下,如何獲得文本關(guān)鍵詞上下文中最大信息量是基于上下文關(guān)系的關(guān)鍵詞提取算法中急需解決的問(wèn)題.結(jié)合相關(guān)文獻(xiàn)的結(jié)論以及信息熵知識(shí)可知,關(guān)鍵詞旁不同位置上的詞語(yǔ)信息量可用定量來(lái)表示:某位置上的信息量由系統(tǒng)熵與在該位置上時(shí)的條件系統(tǒng)熵的減少量決定.通過(guò)信息熵,文本中詞語(yǔ)的信息量就可以用定量表示出來(lái).以關(guān)鍵詞w為信息源頭的信息熵為:

    (1)

    式中:p(w)——關(guān)鍵詞w的詞頻.

    H(W|VP)是上下文位置P時(shí)的條件熵,其計(jì)算公式為:

    (2)

    式中:p(wc)——上下文詞語(yǔ)wc的詞頻.

    上下文位置P的信息量IP的計(jì)算式為:

    IP=H(W)-H(W|VP)

    (3)

    H(W|wc)是在上下文詞語(yǔ)wc已知情況下的條件熵,即:

    log2p(w|wc)

    (4)

    由此可知,不同位置上詞語(yǔ)的信息量可被定量表示,即不同位置上的詞語(yǔ)對(duì)關(guān)鍵詞的貢獻(xiàn)量可以用信息量表示.

    2.2 TextRank算法

    MIHALCEA R等人[9]通過(guò)改進(jìn)著名的網(wǎng)頁(yè)排序算法PageRank,提出了用于文本關(guān)鍵詞選擇的TextRank算法.TextRank算法的核心思想是一個(gè)節(jié)點(diǎn)的重要程度取決于相鄰指向節(jié)點(diǎn)的數(shù)量,即從文本中選取出若干關(guān)鍵詞并建立詞圖模型,利用投票機(jī)制迭代計(jì)算出每個(gè)關(guān)鍵詞的重要程度,從而進(jìn)行排序選出最能表達(dá)文本主題的關(guān)鍵詞.從TextRank的原理可知,該算法支持帶權(quán)重的迭代計(jì)算,同時(shí)根據(jù)中文語(yǔ)言特性以及文本特征選擇的規(guī)則分析可知,TextRank算法在迭代計(jì)算時(shí),重要的關(guān)鍵詞將獲得更高的投票分值,不重要的詞語(yǔ)則擁有較低的投票分值.

    2.3 基于上下文關(guān)系的TextRank模型

    基于上下文關(guān)系的TextRank算法最重要的兩個(gè)部分是帶有上下文信息的文本特征選取和帶有權(quán)重迭代計(jì)算的TextRank.其主要步驟為:

    (1) 將給定的文本進(jìn)行切割得到句子集合,并對(duì)句子集合中的每個(gè)句子做預(yù)處理,包括分詞、篩選停用詞等;

    (2) 利用傳統(tǒng)的基于統(tǒng)計(jì)特征選擇方法篩選出文本句子集合中每一個(gè)句子的初始關(guān)鍵詞集合;

    (3) 依次對(duì)初始集合中的關(guān)鍵詞進(jìn)行上下文依賴關(guān)系的定量分析并帶入計(jì)算,選擇與關(guān)鍵詞依賴程度最大的詞語(yǔ)加入集合中,形成修正關(guān)鍵詞集合;

    (4) 將修正關(guān)鍵詞集合中所有帶有權(quán)重值的關(guān)鍵詞組建關(guān)鍵詞圖模型,不斷迭代計(jì)算并得到最終的文本關(guān)鍵詞.

    具體流程如圖2所示.

    圖2 考慮上下文依賴關(guān)系以及TextRank的文本特征選取整體流程

    2.3.1 基于上下文依賴關(guān)系的關(guān)鍵詞選取

    本文利用互信息來(lái)衡量上下文中不同詞對(duì)于關(guān)鍵詞的依賴程度.依據(jù)式(1)至式(4)的核心思想,總結(jié)出互信息的計(jì)算公式為:

    (5)

    式中:wi——屬于關(guān)鍵詞k左右[a,b]之間的上下文詞語(yǔ);

    P(wi|k)——在關(guān)鍵詞k窗口范圍內(nèi)wi出現(xiàn)的概率;

    P(k)——關(guān)鍵詞k在文本中出現(xiàn)的概率.

    通過(guò)計(jì)算,將互信息與閾值α進(jìn)行比較,大于閾值的上下文被認(rèn)為是對(duì)關(guān)鍵詞貢獻(xiàn)大的詞語(yǔ).

    基于上下文依賴關(guān)系提取關(guān)鍵詞的局部流程如圖3所示.首先利用常見(jiàn)的特征選擇方法選取權(quán)重較大的關(guān)鍵詞作為初始關(guān)鍵詞集合;其次對(duì)初始關(guān)鍵詞集合當(dāng)中的每一個(gè)詞利用式(5)進(jìn)行上下文依賴關(guān)系的定量分析,從而篩選出對(duì)關(guān)鍵詞依賴度較大的上下文詞,并將其加入到修正關(guān)鍵詞集合中待進(jìn)一步處理.

    圖3 基于上下文依賴關(guān)系提取關(guān)鍵詞局部流程

    2.3.2 加權(quán)TextRank詞圖模型

    TextRank模型基于詞圖模型的文本特征選擇,將特征選擇轉(zhuǎn)變?yōu)樘卣麝P(guān)鍵詞重要性排序.將文檔中的關(guān)鍵詞及其關(guān)系組織成一張?jiān)~圖,并利用詞圖模型的迭代運(yùn)算得出權(quán)重值最大的文本特征.根據(jù)上述分析可知,在構(gòu)建詞圖模型時(shí),基于上下文關(guān)系的加權(quán)TextRank算法應(yīng)先從修正關(guān)鍵詞集合中取出關(guān)鍵詞以及各自對(duì)應(yīng)的權(quán)重開(kāi)始.

    首先,構(gòu)建初始圖G=(V,E),由詞語(yǔ)結(jié)點(diǎn)V以及其結(jié)點(diǎn)之間的邊E組成,修正關(guān)鍵詞集合中的關(guān)鍵詞為詞圖的結(jié)點(diǎn),每個(gè)詞的權(quán)重系數(shù)為對(duì)應(yīng)結(jié)點(diǎn)的權(quán)重.文獻(xiàn)[10]提出利用滑動(dòng)窗口來(lái)獲得詞與詞之間的關(guān)系,文本參考該方法來(lái)實(shí)現(xiàn)關(guān)鍵詞間的關(guān)系.本文使用較小的滑動(dòng)窗口來(lái)進(jìn)行詞與詞關(guān)系的提取.至此一個(gè)初步的加權(quán)TextRank初始模型就已建立.另外,基于TextRank的基本思想,利用投票機(jī)制來(lái)計(jì)算出每個(gè)關(guān)鍵詞的重要程度進(jìn)行排序,從而選出最能表達(dá)文本主題的詞語(yǔ).權(quán)重迭代計(jì)算式為:

    S(Vi)=(1-d)+d×

    (6)

    式中:ln(Vi)——詞圖模型中表示指向詞語(yǔ)結(jié)點(diǎn)Vi的結(jié)點(diǎn)集合;

    (Vj)out——詞語(yǔ)結(jié)點(diǎn)Vi指向其他結(jié)點(diǎn)的集合;

    Wji——初始值為修正關(guān)鍵詞集合中的權(quán)重;

    d——阻尼系數(shù),一般情況下取0.85.

    文獻(xiàn)[11]在PageRank算法中將阻尼系數(shù)定義為用戶在到達(dá)某網(wǎng)頁(yè)后繼續(xù)往后瀏覽的概率值,同時(shí)該系數(shù)的存在也可避免在迭代運(yùn)算過(guò)程遇到極端數(shù)據(jù)時(shí)而使迭代強(qiáng)行停止的情況.根據(jù)式(6)進(jìn)行多次迭代運(yùn)算直至達(dá)到所有的Wji都收斂為止,獲得權(quán)重系數(shù)最大的Top-N詞語(yǔ)即可作為文本的文本特征.

    3 實(shí)驗(yàn)評(píng)估及結(jié)果分析

    為能夠驗(yàn)證基于上下文關(guān)系和TextRank算法的中文文本關(guān)鍵詞提取方法的有效性,同時(shí)又不失樣本的普遍性,本文選取電力領(lǐng)域新聞文本作為實(shí)驗(yàn)樣本.電力領(lǐng)域具有完整的系統(tǒng)性、強(qiáng)烈的政策敏感性以及強(qiáng)大的社會(huì)發(fā)展導(dǎo)向性,所以以該領(lǐng)域的新聞文本作為實(shí)驗(yàn)語(yǔ)料庫(kù)對(duì)于算法驗(yàn)證以及該技術(shù)的發(fā)展有著重要的意義.

    本次實(shí)驗(yàn)的電力新聞文本語(yǔ)料庫(kù)全部來(lái)自互聯(lián)網(wǎng),采用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)從北極星電力網(wǎng)采集6大類別的電力新聞,共10 500篇最新的電力新聞.其中,火力發(fā)電、風(fēng)力發(fā)電、水力發(fā)電、核電以及智能電網(wǎng)5個(gè)類別的電力新聞文本各2 000篇,微電網(wǎng)這一類別由于數(shù)據(jù)有限,收集了500篇最新的新聞文本.與此同時(shí),收錄每篇電力新聞網(wǎng)頁(yè)當(dāng)中的關(guān)鍵詞和網(wǎng)頁(yè)的標(biāo)題作為關(guān)鍵詞標(biāo)準(zhǔn)來(lái)檢驗(yàn)不同的算法.

    本次實(shí)驗(yàn)的開(kāi)發(fā)語(yǔ)言是JAVA,編譯環(huán)境采用Eclipse Kepler Service Release 2,并利用中國(guó)科學(xué)院的中文分詞軟件來(lái)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;所用硬件環(huán)境為L(zhǎng)enovo ThinkCentre M8400t-N000,其處理器為Intel(R) Core(TM) i7-3770,4 GB內(nèi)存.

    3.1 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

    在語(yǔ)料庫(kù)中,實(shí)驗(yàn)的驗(yàn)證標(biāo)準(zhǔn)為每篇文章中的關(guān)鍵詞,該關(guān)鍵詞由網(wǎng)站上傳新聞時(shí)一并提供,可以準(zhǔn)確地提供該新聞的核心意思.關(guān)于評(píng)價(jià)標(biāo)準(zhǔn),本文使用查準(zhǔn)率、查全率以及F1值等方面來(lái)評(píng)價(jià)算法.衡量文本特征關(guān)鍵詞的提取效果應(yīng)從提取正確率和提取正確量?jī)蓚€(gè)方面加以考慮.查準(zhǔn)率用于描述提取的正確關(guān)鍵詞占提取總量的比重,查全率表明被提取出來(lái)的關(guān)鍵詞占文本所有關(guān)鍵詞的比例;F1值是查全率和查準(zhǔn)率兩個(gè)評(píng)價(jià)指標(biāo)綜合效果的體現(xiàn).從電力領(lǐng)域的語(yǔ)料庫(kù)中檢索到的關(guān)鍵詞可以大致分為A,B,C,D 4類,如表1所示.

    查準(zhǔn)率(Precision)和查全率(Recall)的計(jì)算公式分別為:

    (7)

    (8)

    除了對(duì)文本特征進(jìn)行兩個(gè)指標(biāo)的評(píng)價(jià)外,還將F1-measure值作為另一個(gè)評(píng)價(jià)標(biāo)準(zhǔn),即結(jié)合查準(zhǔn)率和查全率兩者使用情況而進(jìn)行的綜合評(píng)價(jià):

    (9)

    表1 語(yǔ)料庫(kù)文本特征分類

    3.2 實(shí)驗(yàn)與分析

    本文經(jīng)過(guò)網(wǎng)絡(luò)爬蟲(chóng)、預(yù)處理、權(quán)重計(jì)算、特征選擇以及精度計(jì)算等步驟,將基于上下文關(guān)系和TextRank算法選取的文本權(quán)重TOP-10的文本關(guān)鍵詞與文章標(biāo)準(zhǔn)的關(guān)鍵詞進(jìn)行對(duì)比.同時(shí),與傳統(tǒng)的TF-IDF算法的結(jié)果進(jìn)行比較,進(jìn)一步驗(yàn)證本文算法的高效與精確性.

    首先,利用傳統(tǒng)的TF-IDF算法得到文本的初始關(guān)鍵詞集合,然后根據(jù)上文描述的上下文關(guān)系對(duì)其進(jìn)行修正,得到修正關(guān)鍵詞集合,其中閾值α取0.01.依據(jù)文獻(xiàn)[8]的結(jié)論可知,對(duì)于85%的信息量可以通過(guò)關(guān)鍵詞左邊8個(gè)位置以及右邊9個(gè)位置的窗口來(lái)獲取,故窗口取值為[-8,9].最后,利用加權(quán)的TextRank的詞圖模型對(duì)修正關(guān)鍵詞集合進(jìn)行多次迭代運(yùn)算,最后選取權(quán)重TOP-10的文本特征詞作為最終的文本特征.將選取結(jié)果與標(biāo)準(zhǔn)的關(guān)鍵詞進(jìn)行多指標(biāo)的對(duì)比,其結(jié)果如表2所示.

    表2 基于不同算法的電力領(lǐng)域新聞文本特征關(guān)鍵詞選取實(shí)驗(yàn)結(jié)果 %

    由表2可知,相較于傳統(tǒng)的TF-IDF,基于上下文關(guān)系及TextRank算法在查準(zhǔn)率、查全率和F1-measure值3個(gè)指標(biāo)中都獲得了較理想的結(jié)果.

    為了進(jìn)一步驗(yàn)證本文算法在電力行業(yè)各個(gè)子領(lǐng)域中的準(zhǔn)確性,本文選取語(yǔ)料庫(kù)中的6大類別新聞文本數(shù)據(jù),分別用上述兩種算法進(jìn)行文本關(guān)鍵詞提取.依據(jù)上文所述的評(píng)價(jià)標(biāo)準(zhǔn),對(duì)相應(yīng)權(quán)重結(jié)果進(jìn)行查準(zhǔn)率、查全率以及F1-measure的計(jì)算,結(jié)果如表3所示.

    由表3可以看出,在電力行業(yè)各個(gè)不同子領(lǐng)域內(nèi),本文算法比傳統(tǒng)算法都有明顯提升.其中,本文算法比傳統(tǒng)算法在查準(zhǔn)率上平均高出近8%~9%,同時(shí)在各個(gè)子領(lǐng)域上也都有不同程度的提高.在查全率方面同樣高于傳統(tǒng)算法,其中火力發(fā)電和水利發(fā)電兩個(gè)類別體現(xiàn)得尤為明顯.由此也進(jìn)一步證實(shí)了本文算法同樣適合于各個(gè)子領(lǐng)域的文本關(guān)鍵詞的提取,并且結(jié)果較傳統(tǒng)算法更理想.

    為了更直觀地體現(xiàn)TF-IDF算法與基于上下文關(guān)系和TextRank的算法獲得正確關(guān)鍵詞的情況,又進(jìn)行了兩種算法在取不同數(shù)量的關(guān)鍵詞下平均正確關(guān)鍵詞數(shù)量的實(shí)驗(yàn).實(shí)驗(yàn)對(duì)象為整個(gè)電力行業(yè)內(nèi)的10 500篇電力新聞文本,其結(jié)果如圖4所示.

    表3 TF-IDF和本文算法在電力行業(yè)不同子領(lǐng)域文本語(yǔ)料關(guān)鍵詞提取實(shí)驗(yàn)結(jié)果 %

    圖4 TF-IDF算法與基于上下文關(guān)系和TextRank

    綜上所述,與傳統(tǒng)的TF-IDF算法相比,基于上下文關(guān)系和TextRank算法在查準(zhǔn)率、查全率和F1-measure,以及獲取平均正確關(guān)鍵詞數(shù)量方面都有大幅度的提升.

    4 結(jié) 語(yǔ)

    通過(guò)實(shí)驗(yàn)分析可知,相較于傳統(tǒng)的TF-IDF算法,采用基于上下文關(guān)系以及TextRank算法在查準(zhǔn)率、查全率和F1-measure方面有4%~7%的提升;在電力子領(lǐng)域的實(shí)驗(yàn)中,在查準(zhǔn)率上提高了6%~8%,在查全率以及F1-measure方面提升了5%~7%.因此,本文提出的方法能有效提高文本關(guān)鍵詞提取的準(zhǔn)確率,可以為文本關(guān)鍵詞提取技術(shù)提供一種新的思路.

    [1] HOW B C,NARAYANAN K.An empirical study of feature selection for text categorization based on termweightage[C]//Proceeding of the 2004 IEEE /WIC/ACM International Conference on Web Intelligence.Washington DC:IEEE Computer Society,2004:599-602.

    [2] 李運(yùn)田,吳瓊,鄭獻(xiàn)衛(wèi).改進(jìn)的TF-IDF模型在特征抽取中的應(yīng)用[J].工業(yè)控制計(jì)算機(jī),2014(2):51-52.

    [3] 李鎮(zhèn)君,周竹榮.基于Document Triage的TF-IDF算法的改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2015(12):3 506-3 510.

    [4] PASQUIER C.Task 5:single document keyphrase extraction using sentence clustering and latent dirichlet allocation[C]//Proceedings of the 5th International Workshop on Semantic Evaluation.Stroudsburg,PA,USA:Association for Computational Linguistics,2010:154-157.

    [5] 劉俊,鄒東升,邢欣來(lái),等.基于主題特征的關(guān)鍵詞抽取[J].計(jì)算機(jī)應(yīng)用研究,2012,29(11):4 224-4 227.

    [6] 李鵬,王斌,石志偉,等.Tag-TextRank:一種基于Tag的網(wǎng)頁(yè)關(guān)鍵詞抽取方法[J].計(jì)算機(jī)研究與發(fā)展,2012(11):2 344-2 351.

    [7] 方康,韓立新.基于HMM的加權(quán)Textrank單文檔的關(guān)鍵詞抽取算法[J].信息技術(shù),2015(4):114-116.

    [8] 魯松,白碩.自然語(yǔ)言處理中詞語(yǔ)上下文有效范圍的定量描述[J].計(jì)算機(jī)學(xué)報(bào),2001(7):742-747.

    [9] MIHALCEA R,TARAU P.TextRank:bringing order into texts[C]//Proceedings of Conference on Empirical Methods in Natural Language Processing,Barcelona,Spain,2004:404-411.

    [10] CORMODE G,GAROFALAKIS M.Sketching probabilistic data streams[C].Acm Sigmod International Conference on Management of Data,2007:281-292.

    [11] PAGE L.The PageRank citation ranking:bringing order to the web[J].Stanford Digital Libraries Working Paper,1998,9(1):1-14.

    猜你喜歡
    查全率查準(zhǔn)率權(quán)重
    權(quán)重常思“浮名輕”
    海量圖書(shū)館檔案信息的快速檢索方法
    基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)信息過(guò)濾系統(tǒng)設(shè)計(jì)
    為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
    基于詞嵌入語(yǔ)義的精準(zhǔn)檢索式構(gòu)建方法
    大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
    基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
    基于深度特征分析的雙線性圖像相似度匹配算法
    層次分析法權(quán)重的計(jì)算:基于Lingo的數(shù)學(xué)模型
    河南科技(2014年15期)2014-02-27 14:12:51
    中文分詞技術(shù)對(duì)中文搜索引擎的查準(zhǔn)率及查全率的影響
    精品乱码久久久久久99久播| 欧美一级毛片孕妇| 亚洲国产欧美网| 国产一区二区三区视频了| 草草在线视频免费看| 国产精品av久久久久免费| 亚洲欧美日韩高清专用| 男女那种视频在线观看| 国产极品精品免费视频能看的| 欧美在线黄色| 亚洲精品中文字幕一二三四区| bbb黄色大片| 两个人看的免费小视频| 999久久久精品免费观看国产| 久久精品国产亚洲av香蕉五月| 观看美女的网站| 久久久久性生活片| 久久久久免费精品人妻一区二区| 最好的美女福利视频网| 91av网站免费观看| 亚洲精品456在线播放app | 国产一区二区三区在线臀色熟女| 国内精品久久久久久久电影| 成人一区二区视频在线观看| 嫩草影视91久久| 变态另类丝袜制服| 无人区码免费观看不卡| 国产精品野战在线观看| 国产三级中文精品| 极品教师在线免费播放| 99久国产av精品| 国产熟女xx| 此物有八面人人有两片| 久久中文字幕人妻熟女| 欧美成人免费av一区二区三区| 又粗又爽又猛毛片免费看| 久久久成人免费电影| 搞女人的毛片| 久久久久国产一级毛片高清牌| 精品久久久久久久人妻蜜臀av| 一区二区三区激情视频| 亚洲欧美日韩无卡精品| 琪琪午夜伦伦电影理论片6080| 久久久久久久精品吃奶| a级毛片在线看网站| 免费在线观看成人毛片| 啦啦啦观看免费观看视频高清| 国产精品1区2区在线观看.| 在线视频色国产色| 长腿黑丝高跟| 国产精品av久久久久免费| 日本一二三区视频观看| 国产亚洲欧美98| 国产伦精品一区二区三区四那| 欧美日韩综合久久久久久 | 日韩中文字幕欧美一区二区| 每晚都被弄得嗷嗷叫到高潮| 天天躁狠狠躁夜夜躁狠狠躁| 99精品欧美一区二区三区四区| 国产精品av久久久久免费| 成人无遮挡网站| 日韩高清综合在线| 俄罗斯特黄特色一大片| 九色成人免费人妻av| 观看美女的网站| 两个人视频免费观看高清| 黄片大片在线免费观看| 国产真实乱freesex| 国产成人av教育| 亚洲第一欧美日韩一区二区三区| 九色国产91popny在线| 真人做人爱边吃奶动态| 麻豆成人av在线观看| 色哟哟哟哟哟哟| 久久亚洲精品不卡| 国产成人系列免费观看| 日韩欧美国产在线观看| 日韩国内少妇激情av| 久久久久久人人人人人| 巨乳人妻的诱惑在线观看| 深夜精品福利| 久久中文字幕人妻熟女| 国产精品久久视频播放| 国内精品久久久久久久电影| 成熟少妇高潮喷水视频| 观看免费一级毛片| 一级毛片精品| 亚洲av成人一区二区三| 熟妇人妻久久中文字幕3abv| 欧美日韩黄片免| 2021天堂中文幕一二区在线观| 亚洲乱码一区二区免费版| 中文字幕人妻丝袜一区二区| 这个男人来自地球电影免费观看| 麻豆成人午夜福利视频| 亚洲人成电影免费在线| 久久久国产成人精品二区| 级片在线观看| 脱女人内裤的视频| 99国产精品一区二区三区| 一区二区三区激情视频| 亚洲美女黄片视频| 精品乱码久久久久久99久播| 亚洲中文av在线| 国产成人精品久久二区二区91| 欧美成狂野欧美在线观看| 狂野欧美激情性xxxx| 精品国内亚洲2022精品成人| 又黄又爽又免费观看的视频| 国产精品久久久久久精品电影| www.www免费av| 九色国产91popny在线| 99久久久亚洲精品蜜臀av| 女生性感内裤真人,穿戴方法视频| 中文字幕精品亚洲无线码一区| 亚洲专区字幕在线| 亚洲激情在线av| 嫁个100分男人电影在线观看| 淫妇啪啪啪对白视频| 日韩免费av在线播放| 噜噜噜噜噜久久久久久91| 成年免费大片在线观看| 99视频精品全部免费 在线 | 真实男女啪啪啪动态图| 午夜福利高清视频| 免费人成视频x8x8入口观看| 高潮久久久久久久久久久不卡| 日韩欧美 国产精品| 露出奶头的视频| 狂野欧美激情性xxxx| 国产精品99久久99久久久不卡| 亚洲av美国av| 熟女人妻精品中文字幕| 国产毛片a区久久久久| 午夜免费观看网址| x7x7x7水蜜桃| 女同久久另类99精品国产91| 国产午夜精品久久久久久| 国产视频内射| 欧美精品啪啪一区二区三区| 亚洲精品美女久久久久99蜜臀| 国产成人av教育| 不卡av一区二区三区| 丰满的人妻完整版| 亚洲成人久久爱视频| 9191精品国产免费久久| 在线观看一区二区三区| 久久久国产成人免费| 国产熟女xx| 久久亚洲精品不卡| 99热6这里只有精品| 久久久久国产精品人妻aⅴ院| 色综合亚洲欧美另类图片| 欧美色视频一区免费| 中文字幕高清在线视频| 男女午夜视频在线观看| 免费观看人在逋| 色视频www国产| 天堂网av新在线| 亚洲欧美日韩东京热| 国产高清视频在线播放一区| 在线免费观看的www视频| 精品国产乱码久久久久久男人| 丝袜人妻中文字幕| 熟女少妇亚洲综合色aaa.| 一级毛片高清免费大全| 一区二区三区激情视频| 一a级毛片在线观看| 国产精品自产拍在线观看55亚洲| 99riav亚洲国产免费| 免费看日本二区| 日日摸夜夜添夜夜添小说| 黑人巨大精品欧美一区二区mp4| 美女午夜性视频免费| or卡值多少钱| 久99久视频精品免费| 成人一区二区视频在线观看| 91av网一区二区| 嫁个100分男人电影在线观看| 小蜜桃在线观看免费完整版高清| www日本黄色视频网| 青草久久国产| 免费无遮挡裸体视频| 国产精品一区二区三区四区久久| 精品午夜福利视频在线观看一区| 精品一区二区三区四区五区乱码| 国语自产精品视频在线第100页| 国产欧美日韩精品亚洲av| 女人被狂操c到高潮| 亚洲成人免费电影在线观看| 国产黄色小视频在线观看| 在线播放国产精品三级| 91字幕亚洲| 欧美成人性av电影在线观看| 少妇的逼水好多| 男女下面进入的视频免费午夜| 欧美色视频一区免费| 免费看光身美女| 精品乱码久久久久久99久播| 夜夜夜夜夜久久久久| 国产亚洲av高清不卡| or卡值多少钱| 一级毛片女人18水好多| 亚洲美女视频黄频| 桃色一区二区三区在线观看| 国内精品美女久久久久久| av在线天堂中文字幕| 日韩欧美国产在线观看| 99re在线观看精品视频| 国产麻豆成人av免费视频| 色老头精品视频在线观看| АⅤ资源中文在线天堂| 中文字幕最新亚洲高清| 色噜噜av男人的天堂激情| 成人av在线播放网站| 少妇熟女aⅴ在线视频| 国产高清激情床上av| 久久亚洲真实| 国产v大片淫在线免费观看| 国产伦在线观看视频一区| 美女免费视频网站| 久久久精品欧美日韩精品| 午夜福利视频1000在线观看| 精品久久久久久成人av| 日韩国内少妇激情av| 2021天堂中文幕一二区在线观| 日韩三级视频一区二区三区| 久久久久国内视频| 色av中文字幕| 国内精品一区二区在线观看| 久久国产乱子伦精品免费另类| 久久中文字幕人妻熟女| 亚洲成a人片在线一区二区| 日韩欧美在线乱码| 免费在线观看影片大全网站| 亚洲精品粉嫩美女一区| 一级作爱视频免费观看| 99国产精品99久久久久| 少妇丰满av| 可以在线观看的亚洲视频| 国产乱人伦免费视频| 露出奶头的视频| 国产 一区 欧美 日韩| 国产男靠女视频免费网站| 久久久久九九精品影院| 亚洲精品一卡2卡三卡4卡5卡| 精品久久久久久久毛片微露脸| 国产综合懂色| 国内揄拍国产精品人妻在线| 久久久久国产一级毛片高清牌| 久久久久久人人人人人| 久久午夜亚洲精品久久| 国产精品99久久99久久久不卡| 噜噜噜噜噜久久久久久91| 两个人看的免费小视频| 久久久成人免费电影| 日本黄色片子视频| 大型黄色视频在线免费观看| 免费观看的影片在线观看| 亚洲国产精品合色在线| 亚洲九九香蕉| 中文字幕高清在线视频| 亚洲精品色激情综合| 老司机福利观看| 18禁观看日本| 亚洲色图 男人天堂 中文字幕| 老司机在亚洲福利影院| 欧美激情在线99| 9191精品国产免费久久| 久久精品综合一区二区三区| 人妻丰满熟妇av一区二区三区| 午夜a级毛片| 亚洲欧美激情综合另类| 成年女人看的毛片在线观看| a级毛片在线看网站| 成人永久免费在线观看视频| 国产一区二区在线av高清观看| 丰满人妻熟妇乱又伦精品不卡| 国产三级在线视频| aaaaa片日本免费| 国产一区二区三区视频了| 天天躁日日操中文字幕| 日本熟妇午夜| 久久久久久大精品| 国产精品电影一区二区三区| 波多野结衣高清作品| 国产精品久久电影中文字幕| 男人舔女人下体高潮全视频| 人妻久久中文字幕网| 久久久久亚洲av毛片大全| 欧美乱妇无乱码| 亚洲欧美精品综合一区二区三区| 岛国在线免费视频观看| 不卡av一区二区三区| 国产一区二区三区在线臀色熟女| 波多野结衣巨乳人妻| 男女床上黄色一级片免费看| 国产在线精品亚洲第一网站| 国产私拍福利视频在线观看| svipshipincom国产片| 日韩成人在线观看一区二区三区| 国产97色在线日韩免费| av天堂在线播放| 午夜精品久久久久久毛片777| 黄色成人免费大全| 亚洲黑人精品在线| 少妇熟女aⅴ在线视频| 国产精品av久久久久免费| 免费一级毛片在线播放高清视频| 亚洲精品美女久久久久99蜜臀| 精品久久久久久久久久久久久| 国产真人三级小视频在线观看| 国产亚洲欧美98| 嫩草影视91久久| 久9热在线精品视频| 成人特级黄色片久久久久久久| 日本 欧美在线| 欧美绝顶高潮抽搐喷水| 精品国产乱码久久久久久男人| 久久久久久久久中文| 床上黄色一级片| 久久久精品大字幕| 天堂动漫精品| 免费在线观看日本一区| 亚洲av成人av| 啦啦啦观看免费观看视频高清| 色吧在线观看| 久久午夜综合久久蜜桃| 香蕉av资源在线| 欧美另类亚洲清纯唯美| 久久亚洲精品不卡| 成人18禁在线播放| 他把我摸到了高潮在线观看| 国产av一区在线观看免费| av欧美777| 亚洲第一欧美日韩一区二区三区| 啦啦啦免费观看视频1| 国产单亲对白刺激| 搡老岳熟女国产| 最新在线观看一区二区三区| av中文乱码字幕在线| 无人区码免费观看不卡| 大型黄色视频在线免费观看| 精品一区二区三区四区五区乱码| 免费看a级黄色片| 99久久国产精品久久久| 此物有八面人人有两片| 国产视频内射| 亚洲国产精品999在线| 欧美丝袜亚洲另类 | 免费在线观看成人毛片| 99国产极品粉嫩在线观看| 久久久国产成人免费| 精品欧美国产一区二区三| 亚洲专区国产一区二区| 久久久久九九精品影院| 亚洲一区二区三区色噜噜| 免费观看的影片在线观看| av福利片在线观看| 俺也久久电影网| 久久香蕉精品热| 亚洲精品久久国产高清桃花| 国产精品久久久久久久电影 | 国产av一区在线观看免费| 婷婷六月久久综合丁香| 久久午夜综合久久蜜桃| 亚洲熟妇中文字幕五十中出| 免费一级毛片在线播放高清视频| 国产一区二区三区在线臀色熟女| 欧美日韩国产亚洲二区| 中文字幕熟女人妻在线| 国产伦在线观看视频一区| 香蕉丝袜av| 熟妇人妻久久中文字幕3abv| 69av精品久久久久久| 激情在线观看视频在线高清| 欧美黑人巨大hd| 成年版毛片免费区| 在线观看午夜福利视频| 精品一区二区三区视频在线观看免费| 最近在线观看免费完整版| 1000部很黄的大片| 午夜精品久久久久久毛片777| 国产高清视频在线播放一区| 非洲黑人性xxxx精品又粗又长| 精品电影一区二区在线| 99久久精品国产亚洲精品| 亚洲乱码一区二区免费版| 首页视频小说图片口味搜索| 国产一区二区在线观看日韩 | 怎么达到女性高潮| 欧美性猛交黑人性爽| 中文字幕av在线有码专区| 精品久久久久久久毛片微露脸| 黑人操中国人逼视频| 亚洲狠狠婷婷综合久久图片| 超碰成人久久| 夜夜爽天天搞| 夜夜看夜夜爽夜夜摸| tocl精华| 亚洲 国产 在线| 99久久精品国产亚洲精品| 亚洲自拍偷在线| 精品日产1卡2卡| 国产精品香港三级国产av潘金莲| 一本精品99久久精品77| 日韩三级视频一区二区三区| 99久久99久久久精品蜜桃| 黄色视频,在线免费观看| 亚洲自偷自拍图片 自拍| 日本a在线网址| 欧美激情久久久久久爽电影| 亚洲精品久久国产高清桃花| 两个人的视频大全免费| 在线看三级毛片| 97人妻精品一区二区三区麻豆| 校园春色视频在线观看| 免费av毛片视频| 亚洲国产精品久久男人天堂| 色吧在线观看| 国产欧美日韩精品一区二区| 亚洲国产欧美人成| 熟妇人妻久久中文字幕3abv| 国产精品久久视频播放| av在线蜜桃| 国产成人aa在线观看| av天堂在线播放| 91麻豆av在线| 日韩欧美一区二区三区在线观看| 日韩大尺度精品在线看网址| 噜噜噜噜噜久久久久久91| 欧美绝顶高潮抽搐喷水| 免费看十八禁软件| 1000部很黄的大片| e午夜精品久久久久久久| www日本黄色视频网| 在线播放国产精品三级| 日韩三级视频一区二区三区| 国产精品亚洲美女久久久| 免费人成视频x8x8入口观看| 精品一区二区三区视频在线观看免费| 非洲黑人性xxxx精品又粗又长| 成人三级黄色视频| 国产精品永久免费网站| 久久久水蜜桃国产精品网| 久久精品国产综合久久久| 岛国在线免费视频观看| 国产精品久久久久久久电影 | 久久久久久久久免费视频了| 露出奶头的视频| 两性午夜刺激爽爽歪歪视频在线观看| 国产精品 国内视频| 国产极品精品免费视频能看的| bbb黄色大片| 少妇人妻一区二区三区视频| 成人18禁在线播放| 日韩三级视频一区二区三区| 国产精品99久久久久久久久| 成人无遮挡网站| 99久久久亚洲精品蜜臀av| av片东京热男人的天堂| 久久99热这里只有精品18| 久久久精品大字幕| 极品教师在线免费播放| 国产精品1区2区在线观看.| 亚洲色图 男人天堂 中文字幕| 国产精品影院久久| 蜜桃久久精品国产亚洲av| 久久久久久久久久黄片| netflix在线观看网站| 亚洲精品中文字幕一二三四区| 女同久久另类99精品国产91| 黄色片一级片一级黄色片| 18禁黄网站禁片免费观看直播| 级片在线观看| 久久久久久大精品| 老司机在亚洲福利影院| 午夜精品久久久久久毛片777| 欧美日本亚洲视频在线播放| 精品久久久久久久久久久久久| 国产成人福利小说| 老司机深夜福利视频在线观看| 在线观看午夜福利视频| 国产三级中文精品| 国产成人啪精品午夜网站| 天堂动漫精品| 亚洲自偷自拍图片 自拍| 久久久久国内视频| 神马国产精品三级电影在线观看| 国产激情久久老熟女| 深夜精品福利| 欧美乱色亚洲激情| 又大又爽又粗| 亚洲av成人不卡在线观看播放网| 国产v大片淫在线免费观看| 国产精品,欧美在线| 99久久精品一区二区三区| 午夜亚洲福利在线播放| 九九在线视频观看精品| 18禁黄网站禁片午夜丰满| 国产一区二区在线观看日韩 | 久久精品亚洲精品国产色婷小说| a在线观看视频网站| 波多野结衣高清无吗| 法律面前人人平等表现在哪些方面| 波多野结衣高清作品| 又黄又粗又硬又大视频| 亚洲五月婷婷丁香| 久久人人精品亚洲av| 中文字幕最新亚洲高清| 国产精品自产拍在线观看55亚洲| 日本成人三级电影网站| 三级毛片av免费| 国产不卡一卡二| 99精品在免费线老司机午夜| 成人午夜高清在线视频| 国产一区二区三区视频了| 欧美中文日本在线观看视频| 亚洲精品色激情综合| 国产精品亚洲美女久久久| 久久久久九九精品影院| 日本与韩国留学比较| 久久久久精品国产欧美久久久| 亚洲国产欧美人成| 国语自产精品视频在线第100页| 欧美日韩福利视频一区二区| 99re在线观看精品视频| 日日夜夜操网爽| 欧美在线一区亚洲| 亚洲专区中文字幕在线| 亚洲国产中文字幕在线视频| 国产精品日韩av在线免费观看| 色老头精品视频在线观看| 久9热在线精品视频| 国产一区二区在线观看日韩 | 欧美日韩瑟瑟在线播放| 99在线视频只有这里精品首页| 国产成人系列免费观看| 一级毛片女人18水好多| 欧美zozozo另类| 日韩免费av在线播放| 国产成人啪精品午夜网站| 欧美日韩中文字幕国产精品一区二区三区| 国产精品99久久99久久久不卡| 无人区码免费观看不卡| 国产欧美日韩一区二区三| 人人妻人人看人人澡| 亚洲精品久久国产高清桃花| 最好的美女福利视频网| 精品久久久久久久久久免费视频| 欧美日韩乱码在线| 悠悠久久av| 亚洲男人的天堂狠狠| 欧美性猛交黑人性爽| 又紧又爽又黄一区二区| 桃色一区二区三区在线观看| 欧美黑人欧美精品刺激| 日韩国内少妇激情av| 亚洲国产色片| 色噜噜av男人的天堂激情| 国产激情偷乱视频一区二区| 母亲3免费完整高清在线观看| 999久久久国产精品视频| 亚洲第一电影网av| 嫩草影院精品99| 动漫黄色视频在线观看| 成熟少妇高潮喷水视频| 欧美日韩中文字幕国产精品一区二区三区| 久久国产精品影院| 免费在线观看成人毛片| 岛国视频午夜一区免费看| 久久伊人香网站| 成人特级av手机在线观看| 精品不卡国产一区二区三区| 最新在线观看一区二区三区| 亚洲av成人av| h日本视频在线播放| 亚洲欧美激情综合另类| 国产成年人精品一区二区| 国内精品一区二区在线观看| 黄色片一级片一级黄色片| 午夜福利欧美成人| 丁香六月欧美| 又大又爽又粗| 国产成人系列免费观看| 丁香六月欧美| www.www免费av| 91av网一区二区| 天堂av国产一区二区熟女人妻| 国模一区二区三区四区视频 | 黄色丝袜av网址大全| 国产精品av久久久久免费| av在线蜜桃| svipshipincom国产片| 国内毛片毛片毛片毛片毛片| 国产一级毛片七仙女欲春2| 亚洲男人的天堂狠狠| 国产精品精品国产色婷婷| av在线蜜桃| 国内久久婷婷六月综合欲色啪| 天天添夜夜摸| 老汉色∧v一级毛片| 成人18禁在线播放| 免费观看人在逋| 亚洲专区中文字幕在线| 最新美女视频免费是黄的| 51午夜福利影视在线观看| 又粗又爽又猛毛片免费看| 久久热在线av| 91久久精品国产一区二区成人 | 一进一出好大好爽视频| 国产成+人综合+亚洲专区| 久99久视频精品免费| 久久中文看片网| 久久久久国产精品人妻aⅴ院|