• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    分詞技術(shù)的研究與應(yīng)用

    2015-05-30 17:19:54吳宏洲
    軟件工程 2015年12期
    關(guān)鍵詞:詞庫(kù)頻度詞條

    吳宏洲

    摘 要:一種無(wú)需語(yǔ)料庫(kù)和復(fù)雜數(shù)學(xué)模型支持的抽取新詞最簡(jiǎn)方法。通過(guò)掃描文獻(xiàn)文字流,消除停用字詞,切分單元子句,對(duì)子句枚舉可能的候選詞條,統(tǒng)計(jì)候選詞條頻度,計(jì)算長(zhǎng)短包含關(guān)系候選詞之間的置信度值,只須依據(jù)大于90%的值來(lái)消除短詞,得到候選關(guān)鍵詞,再經(jīng)過(guò)已有詞庫(kù)過(guò)濾,留下新詞。該方法可作為信息加工的輔助工具。

    關(guān)鍵詞:停用詞;候選分詞;置信度;抽取新詞

    中圖分類(lèi)號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A

    A Quick Word Segmentation Technology Research and Application

    ——the Method of Extracting New Word

    WU Hongzhou

    (The China Patent Information Center,Beijing 100088,China)

    Abstract:A complicated mathematical model without corpus and support the minimalist approach the extraction of words.By scanning the literature text flow,eliminate stop using words,segmentation unit clause,for other enumeration possible candidates for entry,the statistical frequency of candidate items,calculate length of confidence value contains the relationship between the candidate words,simply on the basis of more than 90% of the value to eliminate the short term,to get the candidate keywords,repass existing thesaurus filtering,new words.This method can be used as an auxiliary tool to information processing.

    Keywords:stop words;the candidate segmentation;confidence;extraction of new words

    1 引言(Introduction)

    在專(zhuān)利信息技術(shù)中,專(zhuān)利文獻(xiàn)信息檢索、機(jī)器翻譯、專(zhuān)利輔助自動(dòng)文摘和CPC/IPC自動(dòng)分類(lèi),都會(huì)用到一個(gè)基本的技術(shù)——分詞技術(shù)。所謂分詞,就是利用已有詞庫(kù)的詞,來(lái)切分文章中的詞的過(guò)程[1,4]。隨著大量文獻(xiàn)的不斷引入,已有詞庫(kù)永遠(yuǎn)不能滿(mǎn)足實(shí)際所需。更新分詞庫(kù),是一項(xiàng)必要工作。如果完全由人工來(lái)處理新詞,經(jīng)過(guò)一系列抽取、標(biāo)引、審校和入庫(kù)流程,當(dāng)實(shí)際需要處理的量遠(yuǎn)遠(yuǎn)超過(guò)人的能力時(shí),那么準(zhǔn)確性和效率就會(huì)成為一個(gè)問(wèn)題。那么這就涉及另外一項(xiàng)自動(dòng)化技術(shù),抽取新詞的技術(shù)。抽詞技術(shù)目前已經(jīng)非常成熟,方法也比較多。比較成熟的產(chǎn)品技術(shù),通過(guò)語(yǔ)料庫(kù)、訓(xùn)練集和復(fù)雜的數(shù)學(xué)模型及其昂貴的資源代價(jià),來(lái)獲得高質(zhì)量的效果。其效果與語(yǔ)料庫(kù)或知識(shí)庫(kù)收集的量有很大的關(guān)系。量越大越容易精確。在專(zhuān)利信息領(lǐng)域中,完全依賴(lài)知識(shí)庫(kù)的方法,對(duì)于那些改進(jìn)性的發(fā)明,還能起作用。但是對(duì)于那些強(qiáng)調(diào)首創(chuàng)性的發(fā)明,彼此之間相似性就很少,算法再高明,也可能收效甚微。本文因受N-gram啟發(fā)[2],借鑒置信度消除歧義詞[3],一個(gè)幾乎被淡忘的陳舊方法,經(jīng)過(guò)簡(jiǎn)單優(yōu)化,以最小代價(jià)來(lái)解決文獻(xiàn)領(lǐng)域面向新詞的抽取繁重工作帶來(lái)的問(wèn)題,效果非常顯著。

    2 抽詞技術(shù)的現(xiàn)狀(The extracting words

    technology)

    目前抽詞技術(shù)主要有四類(lèi),基于詞庫(kù)的、規(guī)則的、統(tǒng)計(jì)的和格式化文檔的抽詞法。

    2.1 基于詞庫(kù)的關(guān)鍵詞抽取法

    這種方法主要利用已有詞庫(kù)來(lái)抽取關(guān)鍵詞,和詞典分詞法大致類(lèi)同。和最大分詞不同,需要枚舉所有長(zhǎng)短可能的詞,這些詞都是詞庫(kù)已有的詞。不能識(shí)別未登錄詞。通常檢索短語(yǔ)用的就是這類(lèi)方法。

    2.2 基于規(guī)則的關(guān)鍵詞抽取法

    利用句法或語(yǔ)義分析,借助句法知識(shí)庫(kù)、語(yǔ)義知識(shí)庫(kù)等資源,抽取出文件中的名詞詞素,以名詞素為中心,向前向后擴(kuò)展新詞。利用句法或語(yǔ)義分析,借助句法知識(shí)庫(kù)、語(yǔ)義知識(shí)庫(kù)等資源,抽取出文件中的名詞詞素,運(yùn)用一些方法與準(zhǔn)則,過(guò)濾掉不符合規(guī)則的詞素。經(jīng)過(guò)這樣的處理之后,得到的結(jié)果幾乎都是有意義的名詞或名詞短語(yǔ)。對(duì)于面向英文的處理,這種做法已經(jīng)取得了非常好的效果。通常機(jī)器翻譯用的就是這類(lèi)方法。

    2.3 基于統(tǒng)計(jì)的關(guān)鍵詞抽取法

    通過(guò)對(duì)文獻(xiàn)中詞頻統(tǒng)計(jì)和對(duì)派生出來(lái)的新詞的互信息來(lái)獲取新詞。統(tǒng)計(jì)方法細(xì)分還有幾種方法:N-gram方法、詞頻、TFIDF、詞的同現(xiàn)信息、PAT-Tree,或是上述某些統(tǒng)計(jì)方法的結(jié)合等。通常自動(dòng)文摘、自動(dòng)分類(lèi)、自動(dòng)標(biāo)引等會(huì)用到這類(lèi)中的一些方法。自動(dòng)文摘、自動(dòng)分類(lèi)常用TFIDF方法來(lái)計(jì)算。抽取新詞常用N-gram與詞的同現(xiàn)信息計(jì)算。PAT-Tree和N-gram是抽詞常用的兩種方法。TFIDF、PAT-Tree需要語(yǔ)料信息和資源支持,計(jì)算概率和詞頻權(quán)重。N-gram不需要語(yǔ)料信息和資源,但計(jì)算量會(huì)較大。

    2.4 基于格式化文檔的關(guān)鍵詞抽取法

    利用一些排版規(guī)則、文檔結(jié)構(gòu)化和格式化規(guī)律,將重要的字符串抽取出來(lái)。例如:專(zhuān)利文獻(xiàn)中的標(biāo)題、文摘、權(quán)利要求書(shū)及其著錄項(xiàng)目、關(guān)鍵詞、同義詞等結(jié)構(gòu)文檔;權(quán)利要求書(shū)中的語(yǔ)義樹(shù)形態(tài)的陳述形式??梢园凑瘴墨I(xiàn)結(jié)構(gòu)格式化的規(guī)律,找到相應(yīng)關(guān)鍵詞,按照出現(xiàn)的位置重要性賦予不同的權(quán)重,以期達(dá)到抽取關(guān)鍵詞的目的。即便是低頻詞,由于出現(xiàn)在非常重要位置上,因而也能將其從文獻(xiàn)中輕易地得到。例如:出現(xiàn)在發(fā)明專(zhuān)利標(biāo)題中的每一個(gè)詞都非常重要,即便文摘中并未反復(fù)多次出現(xiàn),但是其不同位置詞頻度與權(quán)重積之總和卻很高,那么也能構(gòu)成關(guān)鍵詞要素。通常自動(dòng)文摘、自動(dòng)分類(lèi)、自動(dòng)標(biāo)引等也會(huì)用到這類(lèi)方法。

    3 本文抽詞技術(shù)的實(shí)現(xiàn)(The realization of the

    technology of the paper)

    抽詞技術(shù)方法很多,考慮到經(jīng)濟(jì)和實(shí)用因素,復(fù)雜的數(shù)學(xué)計(jì)算方法、需要大量歷史信息、語(yǔ)料庫(kù)、訓(xùn)練集的支持,與主旨相悖,避開(kāi)此類(lèi)方法,尋求更簡(jiǎn)單有效的方法。采用基于統(tǒng)計(jì)的方法,且僅限于對(duì)于一篇文獻(xiàn)進(jìn)行處理。以常見(jiàn)的N-gram方法來(lái)枚舉候選詞。通過(guò)尋找候選詞間的包含關(guān)系,計(jì)算置信度的取值,來(lái)濾除掉不需要的候選詞。從而留下頻度較高的、可能性大的候選詞。關(guān)鍵詞就出自其中。借助已有分詞庫(kù),再濾掉那些已有詞,最終得到的候選詞就是候選新詞。抽詞算法流程圖,如圖1所示。

    3.1 停用詞處理

    停用詞對(duì)于抽詞結(jié)果的影響比較大。選擇不同的停用詞集合,產(chǎn)生的候選詞也會(huì)不同。例如:“有”字被停用后,“有機(jī)...”等詞也被抑制。“和”字被停用后,“飽和...”等詞也被抑制。

    通常建議提供停用詞庫(kù)客戶(hù)端個(gè)性化可調(diào)整方案,根據(jù)情況適度變換停用詞策略,會(huì)產(chǎn)生不同的新詞條和關(guān)鍵詞。變換停用詞應(yīng)以能夠適應(yīng)用戶(hù)需求和方便操作為前提,優(yōu)先考慮解決方案。

    停用詞庫(kù)的使用順序,也會(huì)對(duì)抽詞產(chǎn)生很大影響。例如:“有”對(duì)“具有”或“所有”的影響,如果最先使用短詞“有”,那么就會(huì)留下“具”或“所”與其他字詞組成“…具”或“…所”的候選新詞條,形成歧義詞條。

    通常建議構(gòu)造停用字詞庫(kù),應(yīng)按照{(diào)詞長(zhǎng)[逆序],詞條[正序]}有序存放。亦即停用詞過(guò)濾按照長(zhǎng)詞優(yōu)先原則。避免停用詞因使用順序不當(dāng)而帶來(lái)新的問(wèn)題。

    3.2 候選詞條枚舉

    該方法借鑒N-gram算法[2],并受其啟發(fā)。首先要確定一個(gè)分詞可能的最大長(zhǎng)度,即N取多少個(gè)漢字合適??紤]到化學(xué)、藥物、微生物等領(lǐng)域的技術(shù)術(shù)語(yǔ)可能會(huì)有大量長(zhǎng)詞出現(xiàn)。因此,適當(dāng)降低訪問(wèn)效率,滿(mǎn)足分詞長(zhǎng)度要求,也是可容忍的。通常認(rèn)為一個(gè)長(zhǎng)詞最長(zhǎng)不超過(guò)15個(gè)漢字,就可以符合專(zhuān)利信息領(lǐng)域?qū)﹃P(guān)鍵詞的需求。N取15,這是分詞庫(kù)的一項(xiàng)重要參數(shù)定義。分詞至少由2個(gè)漢字組成,分詞庫(kù)不接收單字詞。為了闡述方便,以分詞最大長(zhǎng)度取5為例。枚舉候選分詞,詳見(jiàn)表1。

    算法:

    //參數(shù)S句子;SL句子長(zhǎng)度漢字?jǐn)?shù)

    CS=“ ”;

    For(wl=2;wl<=min(SL,15);wl++){//最大分詞長(zhǎng)度15,計(jì)算詞長(zhǎng)從2到15或SL遞增

    For(pos=0;pos

    CS←CS+substr(S,pos,wl)+“”;//抽取候選分詞

    }

    }

    Output (CS);//結(jié)果

    3.3 候選詞條統(tǒng)計(jì)

    處理一篇文獻(xiàn)須對(duì)已生成候選詞條進(jìn)行排序和頻度統(tǒng)計(jì),形成候選詞條有序集。

    3.4 歧義詞消除

    定義:在候選詞條集ψ中,如果漢字結(jié)合模式ω1添加前綴pref或后綴suff后,構(gòu)成漢字結(jié)合模式ω2,即ω2=ω1+suff或ω2=pref+ω1或ω2=pref+ω1+suff,那么模式ω2在文檔中的出現(xiàn)頻度Γ(ω2,s)與模式ω1在文檔中出現(xiàn)頻度Γ(ω1,s)之比稱(chēng)為模式ω2相對(duì)于模式ω1的置信度Confidence(ω2|ω1)。Confidence(ω2|ω1)≈Γ(ω2,s)/Γ(ω1,s)。置信度反映模式ω1與前綴和或后綴結(jié)合的穩(wěn)定性。即模式ω2構(gòu)成詞條的可能性。如果置信度低于下限,則說(shuō)明模式ω2構(gòu)成詞條的可能性小,可以除去。如果置信度位于上限和下限之間,那么,模式ω1、ω2可以共存于候選分詞集中。在后綴情況下,如果置信度高于上限,則說(shuō)明模式ω1基本被包含于模式ω2之中。按照最大匹配原則,ω1可以除去。實(shí)際使用中,某些專(zhuān)家將置信度區(qū)間定義為[0.30,0.90]作為上下區(qū)間,稱(chēng)為置信度空間[3]。

    抽取關(guān)鍵詞和或新詞條,消除其中歧義詞條的算法主要來(lái)源于三條規(guī)則:

    規(guī)則1:Confidence(ω2|ω1)≤30%,ω2為詞條的可能性很小,ω2可以除去。

    規(guī)則2:Confidence(ω2|ω1)∈(30%,90%),ω1和ω2都有可能。

    規(guī)則3:Confidence(ω2|ω1)≥90%,ω1被ω2所包含,ω1則可以除去。

    通常算法只考慮規(guī)則1和規(guī)則3的情況,作消歧處理。

    規(guī)則1算法:

    For(i=0;i

    w1←S[i];

    Sel←true;//默認(rèn)選中w1

    If(w1.wf==0) continue;//由于第一條規(guī)則本身可能使w2.wf←0的情況發(fā)生,跳過(guò)

    For(j=0;j

    If(j==i)continue;//是自己,跳過(guò)

    w2←S[j];

    If(w2.wf==0)continue;//由于第一條規(guī)則本身可能使w2.wf←0的情況發(fā)生,跳過(guò)

    If(substr_at(w1.kw,w2.kw)>=0){//如果w2=前綴+w1+后綴;前后綴不同時(shí)為空

    Confidence←w2.wf/w1.wf;//置信度≈f(w2)/f(w1),頻度比

    If(Confidence)<0.10){//置信度低于下限,也可以取下限0.30

    w2.wf←0;//w2視為不存在

    S[j]←w2;

    continue;//看下一個(gè)w2

    }

    }

    }

    }

    For(i=0;i

    If(w1.wf>1) {

    Output(S[i]);//輸出留下的詞條。

    }

    }

    規(guī)則3算法:

    For(i=0;i

    w1←S[i];

    Sel←true;//默認(rèn)選中w1

    If(w1.wf==0) continue;//由于第一條規(guī)則可能使w1.wf←0的情況發(fā)生,跳過(guò)

    For(j=0;j

    If(j==i) continue;//是自己,跳過(guò)

    W2←S[j];

    If(substr_at(w1.kw,w2.kw)>=0){//如果w2=前綴+w1+后綴;前后綴不同時(shí)為空

    Confidence←w2.wf/w1.wf;//置信度≈f(w2)/f(w1),頻度比

    If(Confidence)>=0.90){//只要有一個(gè)W2,使得置信度超過(guò)上限,

    Select←false;//w1就被包含在w2中,w1可以視為不存在

    Break;

    }

    }

    }

    If(select) {

    If(w1.wf > 1) {

    Output(w1);//輸出留下的詞條。

    }

    }

    }

    3.5 普通詞濾除

    對(duì)于候選詞條集,借助已有分詞庫(kù),依次查看庫(kù)中該詞是否已存在?從候選詞條集中除去存在的詞條。留下來(lái)的可作為候選新詞條。

    4 實(shí)驗(yàn)效果(The experiment effect)

    筆者經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),僅規(guī)則3情況,當(dāng)取Confidence

    (ω2|ω1)≥90%,濾掉ω1,就已經(jīng)可以獲得非常不錯(cuò)的效果。相反,按照規(guī)則1+3,當(dāng)取Confidence(ω2|ω1)≤30%,消除ω2,再取Confidence(ω2|ω1)≥90%,濾掉ω1,效果反而更糟。甚至調(diào)整下限為10%,改變也不大。試驗(yàn)樣本六個(gè)發(fā)明公開(kāi)專(zhuān)利的“標(biāo)題+文摘”, 詳見(jiàn)表2;不同規(guī)則下抽取的候選新詞條,詳見(jiàn)表3。

    表2 試驗(yàn)樣本6個(gè)發(fā)明公開(kāi)專(zhuān)利的“標(biāo)題+文摘”

    Tab.2 "Title+digest"of the 6 inventions of the test sample

    專(zhuān)利 標(biāo)題+文摘

    1 具有輥輪的多環(huán)節(jié)傳送帶本發(fā)明涉及一種用于輸送物體諸如容器、瓶子、捆束等等的多環(huán)節(jié)傳送帶,該傳送帶由許多相互鉸接的環(huán)節(jié)(14)構(gòu)成。所述傳送帶在其上側(cè)上具有至少一行(22)可旋轉(zhuǎn)地受支承的承放輥(24),其旋轉(zhuǎn)軸線平行于鉸鏈栓并且平行于這些環(huán)節(jié)(14)的支架(16)的縱側(cè)。利用分別相鄰的環(huán)節(jié)(14)的承放輥(24)構(gòu)成用于需要輸送的物體的承放面。在這些環(huán)節(jié)(14)的至少一個(gè)縱側(cè)的區(qū)域內(nèi)設(shè)有多個(gè)偏轉(zhuǎn)元件(26),這些偏轉(zhuǎn)元件在承放輥(24)以及支架(16)的上側(cè)(17)的高度水平之間并且在承放輥(24)的至少一側(cè)上延伸。

    2 用于計(jì)時(shí)器的擒縱裝置一種計(jì)時(shí)器機(jī)芯的擒縱裝置,包括:擒縱輪(1);第一運(yùn)動(dòng)件(2),其具有與所述擒縱輪(1)鎖止的工具(23)和與所述擒縱輪(1)的機(jī)械傳遞工具(22);第二運(yùn)動(dòng)件(3);以及平衡滾子(4)。所述第二運(yùn)動(dòng)件(3)具有與所述擒縱輪(1)鎖止的工具(33)和與所述擒縱輪(1)和所述第一運(yùn)動(dòng)件(2)的機(jī)械傳遞工具(32)。運(yùn)動(dòng)件通過(guò)擒縱輪被切向地驅(qū)動(dòng)。

    3 硼回收設(shè)備、硼回收方法和硼回收系統(tǒng)本發(fā)明涉及硼回收設(shè)備、硼回收方法和硼回收系統(tǒng),包括通道和至少一個(gè)被置于通道中的曝氣設(shè)備。根據(jù)本發(fā)明的硼回收設(shè)備包括曝氣通道型反應(yīng)器,其中含硼溶液通過(guò)所述通道而曝氣從而使硼以硼砂的形式被提??;和沉淀槽,其中含硼溶液穿過(guò)曝氣通道型反應(yīng)器而提取的硼砂被沉淀,并且其余的溶液借助于溢流而分離。

    4 控制風(fēng)輪機(jī)上的葉片的型線的方法本發(fā)明涉及一種控制風(fēng)輪機(jī)上的葉片的型線的設(shè)備或者方法,所述風(fēng)輪機(jī)具有至少第一葉片和第二葉片,該第一葉片包括適合確定第一葉片狀態(tài)的至少一個(gè)第一傳感器系統(tǒng),以及該第二葉片包括適合確定第二葉片狀態(tài)的至少一個(gè)第二傳感器系統(tǒng),其中基于確定的第一葉片狀態(tài)和確定的第二葉片狀態(tài),控制第二葉片的型線。

    5 環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法本發(fā)明提供一種環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法,在環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法中,高精度地測(cè)定大氣中的腐蝕性氣體。環(huán)境測(cè)定裝置(10)具備運(yùn)算部(13),其計(jì)算出第1QCM傳感器(11a)的第1共振頻率(f1m)的第1變化量(Δf1m)、以及第2QCM傳感器(11b)的第2共振頻率(f2m)的第2變化量(Δf2m),運(yùn)算部(14)基于第1期間(T1)內(nèi)的第1變化量(Δf1m)和該第1期間(T1)內(nèi)的第2變化量(Δf2m),來(lái)修正該第2變化量(Δf2m)。

    6 用于支持對(duì)管制和非管制物品經(jīng)銷(xiāo)的監(jiān)管要求的系統(tǒng)和方法本發(fā)明提供了用于支持如美國(guó)和加拿大等國(guó)家對(duì)管制和非管制物品配給的監(jiān)管要求的系統(tǒng)和方法,所述管制和非管制物品例如是非管制處方(Rx)、醫(yī)療設(shè)備和管制物質(zhì)。該系統(tǒng)和方法加入了許可核實(shí)模塊,其被配置以對(duì)特定的管制和/或非管制物品的訂單進(jìn)行許可驗(yàn)證。在某些實(shí)施方式中,該許可驗(yàn)證模塊將訂單數(shù)據(jù)與歷史存儲(chǔ)數(shù)據(jù)比較,如果存在一個(gè)或多個(gè)差異,驗(yàn)證即不成功。在驗(yàn)證失敗時(shí),許可核實(shí)模塊可進(jìn)一步查詢(xún)第三方數(shù)據(jù)以獲取更新的許可信息。該系統(tǒng)和方法進(jìn)一步加入了可疑訂單監(jiān)控模塊,其被配置以對(duì)訂單實(shí)施多項(xiàng)檢查,以將訂單識(shí)別出可能被進(jìn)一步調(diào)查或被視為可疑的“感興趣訂單”。

    限于篇幅,本文沒(méi)有列出候選關(guān)鍵詞和被去除的普通詞。通過(guò)比對(duì)兩種算法結(jié)果,采用規(guī)則1+3的抽取新詞結(jié)果,并不比僅采用規(guī)則3的效果好。從六組數(shù)據(jù)不難看出。采用規(guī)則3的算法來(lái)消除歧義詞,是一個(gè)最簡(jiǎn)方法。與N-gram方法相結(jié)合,可以完成最簡(jiǎn)單的抽詞工作。

    5 結(jié)論(Conclusion)

    抽詞技術(shù)作為計(jì)算機(jī)輔助工具來(lái)使用,為人們提供一種具有參考價(jià)值的信息,供人們選擇使用。本文所述抽詞方法是一種不依賴(lài)于歷史信息、語(yǔ)料庫(kù),不需要訓(xùn)練數(shù)據(jù)的方法。其優(yōu)點(diǎn)是:能識(shí)別高頻度未登錄詞;無(wú)需人工標(biāo)引詞典,不需要花費(fèi)大量資源收集語(yǔ)料庫(kù)。其缺點(diǎn)是計(jì)算量大;會(huì)抽取出意義不完整的字串,導(dǎo)致準(zhǔn)確性差;不能識(shí)別低頻度關(guān)鍵詞。計(jì)算量受兩方面因素影響:(1)隨著N-gram的長(zhǎng)度N增大,計(jì)算效率會(huì)下降。(2)連續(xù)漢字串長(zhǎng)句式增多,計(jì)算效率也會(huì)下降。如果句子經(jīng)過(guò)停用詞處理已經(jīng)足夠細(xì)碎,或者N-gram的長(zhǎng)度N不很大,計(jì)算效率還是可控的。

    本文通過(guò)抽詞實(shí)驗(yàn),實(shí)現(xiàn)并驗(yàn)證了一種對(duì)文獻(xiàn)進(jìn)行快速抽取關(guān)鍵詞和新詞的最簡(jiǎn)單有效的方法。

    參考文獻(xiàn)(References)

    [1] 莊新妍.計(jì)算機(jī)中文分詞技術(shù)的應(yīng)用[J].呼倫貝爾學(xué)院學(xué)報(bào),2010(03):70-74.

    [2] 金翔宇,孫正興,張福炎.一種中文文檔的非受限無(wú)詞典抽詞方法[J].中文信息學(xué)報(bào),2001(06):33-39.

    [3] 黃云峰.計(jì)算機(jī)中文分詞技術(shù)及其在數(shù)字化偵查中的應(yīng)用研究[J].福建警察學(xué)院學(xué)報(bào),2008(04):28-31.

    [4] 李淑英.中文分詞技術(shù)[J].科技信息(科學(xué)教研),2007(36):95.

    猜你喜歡
    詞庫(kù)頻度詞條
    眨眼頻度可判斷煙癮大小
    婦女之友(2017年3期)2017-04-20 09:20:00
    詞庫(kù)音系學(xué)的幾個(gè)理論問(wèn)題芻議
    2016年4月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    2016年3月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    2016年9月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    銅綠假單胞菌MIC分布敏感百分?jǐn)?shù)與抗菌藥物使用頻度相關(guān)性研究
    大數(shù)據(jù)相關(guān)詞條
    環(huán)境變了,詞庫(kù)別變
    電腦迷(2014年14期)2014-04-29 00:44:03
    QQ手機(jī)輸入法如何導(dǎo)入分類(lèi)詞庫(kù)
    電腦迷(2012年15期)2012-04-29 17:09:47
    將用戶(hù)詞庫(kù)快速導(dǎo)入搜狗五筆詞庫(kù)
    久久久久久人人人人人| 午夜福利18| 搡老熟女国产l中国老女人| 久久午夜亚洲精品久久| 成人亚洲精品一区在线观看| 久久欧美精品欧美久久欧美| av电影中文网址| 日韩欧美在线二视频| 色精品久久人妻99蜜桃| 88av欧美| 国产野战对白在线观看| 国产精品国产高清国产av| 亚洲精品国产色婷婷电影| 99久久国产精品久久久| 黄片大片在线免费观看| 久久天躁狠狠躁夜夜2o2o| 成人亚洲精品一区在线观看| 黄片小视频在线播放| 日韩欧美国产一区二区入口| 亚洲欧美日韩另类电影网站| 精品国产国语对白av| 欧美中文综合在线视频| 又大又爽又粗| 欧美激情极品国产一区二区三区| 亚洲精品粉嫩美女一区| 午夜免费观看网址| 亚洲国产看品久久| 亚洲专区中文字幕在线| 变态另类成人亚洲欧美熟女 | 999久久久精品免费观看国产| 亚洲情色 制服丝袜| 久久久久国产一级毛片高清牌| 国产欧美日韩综合在线一区二区| 最近最新免费中文字幕在线| 麻豆av在线久日| 精品国产乱码久久久久久男人| 精品人妻在线不人妻| 夜夜看夜夜爽夜夜摸| 咕卡用的链子| 日韩av在线大香蕉| 1024香蕉在线观看| 久久精品aⅴ一区二区三区四区| 天天躁夜夜躁狠狠躁躁| 欧美日韩精品网址| 脱女人内裤的视频| 久久精品国产99精品国产亚洲性色 | 久久国产亚洲av麻豆专区| 首页视频小说图片口味搜索| 1024视频免费在线观看| 国产精品久久久久久人妻精品电影| 99国产精品免费福利视频| 成人三级黄色视频| 男人舔女人的私密视频| 手机成人av网站| 人妻丰满熟妇av一区二区三区| e午夜精品久久久久久久| 日本撒尿小便嘘嘘汇集6| x7x7x7水蜜桃| 女警被强在线播放| 久9热在线精品视频| 久久久久久久久久久久大奶| 国产一区二区三区在线臀色熟女| 国产一区二区三区综合在线观看| 精品久久久久久,| 亚洲国产精品999在线| 老司机在亚洲福利影院| 亚洲 欧美一区二区三区| √禁漫天堂资源中文www| 淫妇啪啪啪对白视频| 黄色丝袜av网址大全| 看黄色毛片网站| 好看av亚洲va欧美ⅴa在| 韩国av一区二区三区四区| 国产免费男女视频| 国产伦一二天堂av在线观看| 一级毛片高清免费大全| 午夜福利影视在线免费观看| 无限看片的www在线观看| 欧美乱码精品一区二区三区| 亚洲午夜精品一区,二区,三区| 丝袜在线中文字幕| 神马国产精品三级电影在线观看 | 久久精品成人免费网站| 18禁裸乳无遮挡免费网站照片 | 亚洲一区二区三区色噜噜| 变态另类成人亚洲欧美熟女 | 久久久久久久午夜电影| 久久香蕉国产精品| 三级毛片av免费| 一级a爱片免费观看的视频| 成人精品一区二区免费| 免费不卡黄色视频| 亚洲一区高清亚洲精品| 亚洲精品国产色婷婷电影| 夜夜躁狠狠躁天天躁| 亚洲va日本ⅴa欧美va伊人久久| 一边摸一边做爽爽视频免费| 亚洲三区欧美一区| 亚洲午夜理论影院| 午夜日韩欧美国产| 在线国产一区二区在线| 真人做人爱边吃奶动态| 午夜免费鲁丝| 99国产精品一区二区三区| 搡老熟女国产l中国老女人| 真人做人爱边吃奶动态| 男男h啪啪无遮挡| 黄色毛片三级朝国网站| 中文字幕久久专区| 日日夜夜操网爽| 欧美最黄视频在线播放免费| 国产99久久九九免费精品| 脱女人内裤的视频| 狂野欧美激情性xxxx| 视频在线观看一区二区三区| 国产精品爽爽va在线观看网站 | 久久青草综合色| 国内精品久久久久精免费| 午夜免费鲁丝| 黄色毛片三级朝国网站| 丝袜美足系列| netflix在线观看网站| 成人18禁在线播放| 欧美成人免费av一区二区三区| 久久草成人影院| 法律面前人人平等表现在哪些方面| 女人被狂操c到高潮| 国产成人欧美在线观看| 亚洲男人的天堂狠狠| www.熟女人妻精品国产| 久久国产精品人妻蜜桃| 看免费av毛片| 亚洲中文日韩欧美视频| 色综合婷婷激情| 伦理电影免费视频| 午夜福利成人在线免费观看| 日本撒尿小便嘘嘘汇集6| 亚洲人成伊人成综合网2020| 极品人妻少妇av视频| 欧美黄色淫秽网站| 脱女人内裤的视频| 丝袜美足系列| 中文字幕精品免费在线观看视频| 亚洲va日本ⅴa欧美va伊人久久| 亚洲精品在线美女| 亚洲 国产 在线| 国产精品久久久久久亚洲av鲁大| 999精品在线视频| 在线观看66精品国产| 在线十欧美十亚洲十日本专区| 国产99久久九九免费精品| 免费在线观看日本一区| 精品高清国产在线一区| 精品卡一卡二卡四卡免费| 亚洲va日本ⅴa欧美va伊人久久| 亚洲精品一卡2卡三卡4卡5卡| 日本五十路高清| av在线播放免费不卡| 在线永久观看黄色视频| 国产精品综合久久久久久久免费 | 亚洲国产高清在线一区二区三 | 99久久精品国产亚洲精品| 无人区码免费观看不卡| 成人国语在线视频| 老司机福利观看| 国产精品一区二区在线不卡| 免费在线观看日本一区| 99国产精品99久久久久| 啦啦啦观看免费观看视频高清 | 亚洲成人免费电影在线观看| 97人妻天天添夜夜摸| 亚洲一区二区三区色噜噜| 欧美+亚洲+日韩+国产| 最好的美女福利视频网| 男女下面进入的视频免费午夜 | 女人爽到高潮嗷嗷叫在线视频| 91大片在线观看| 欧美中文综合在线视频| 丰满人妻熟妇乱又伦精品不卡| 黑人欧美特级aaaaaa片| 日日摸夜夜添夜夜添小说| 天天一区二区日本电影三级 | 亚洲狠狠婷婷综合久久图片| 电影成人av| 真人一进一出gif抽搐免费| 免费在线观看亚洲国产| 午夜老司机福利片| 多毛熟女@视频| www日本在线高清视频| 国产精品久久久久久亚洲av鲁大| 中文字幕人妻丝袜一区二区| 88av欧美| 亚洲精品国产精品久久久不卡| 在线观看免费午夜福利视频| 禁无遮挡网站| 国产成人欧美在线观看| 九色国产91popny在线| 91九色精品人成在线观看| 九色亚洲精品在线播放| 少妇粗大呻吟视频| 丁香欧美五月| 亚洲成人国产一区在线观看| 日韩精品免费视频一区二区三区| 国产av一区二区精品久久| 国产又色又爽无遮挡免费看| 国产高清激情床上av| 国产精品久久久久久精品电影 | www.自偷自拍.com| avwww免费| 国产精品九九99| 色精品久久人妻99蜜桃| a级毛片在线看网站| 久久久久久久久久久久大奶| 国产成人精品无人区| 夜夜爽天天搞| 久9热在线精品视频| 久久草成人影院| 脱女人内裤的视频| 少妇熟女aⅴ在线视频| 久久婷婷成人综合色麻豆| 日本欧美视频一区| avwww免费| 亚洲视频免费观看视频| 国产欧美日韩精品亚洲av| АⅤ资源中文在线天堂| 久久久久久大精品| 男人的好看免费观看在线视频 | 午夜视频精品福利| 亚洲成人精品中文字幕电影| 日韩欧美三级三区| 久久精品国产亚洲av高清一级| tocl精华| 中出人妻视频一区二区| 精品日产1卡2卡| 欧美国产日韩亚洲一区| 国产在线精品亚洲第一网站| 国语自产精品视频在线第100页| 亚洲成人精品中文字幕电影| 精品国产美女av久久久久小说| 成在线人永久免费视频| 亚洲国产欧美一区二区综合| 校园春色视频在线观看| 老司机深夜福利视频在线观看| 自线自在国产av| 免费在线观看完整版高清| 亚洲九九香蕉| 91国产中文字幕| av片东京热男人的天堂| 久久久久国产一级毛片高清牌| 久久久久国产一级毛片高清牌| 很黄的视频免费| 亚洲avbb在线观看| 一级毛片女人18水好多| 国产精品国产高清国产av| 日韩欧美国产一区二区入口| 国产高清激情床上av| 大陆偷拍与自拍| 男人操女人黄网站| 亚洲avbb在线观看| 久久精品国产综合久久久| 国产精品亚洲美女久久久| 黑人操中国人逼视频| 欧美日本视频| 亚洲欧美激情在线| 免费看a级黄色片| 欧美激情 高清一区二区三区| 国产高清有码在线观看视频 | 国内久久婷婷六月综合欲色啪| 一级a爱视频在线免费观看| 午夜免费成人在线视频| 在线观看一区二区三区| 19禁男女啪啪无遮挡网站| 人成视频在线观看免费观看| 18禁裸乳无遮挡免费网站照片 | 99国产精品免费福利视频| 免费人成视频x8x8入口观看| 首页视频小说图片口味搜索| 午夜免费鲁丝| 麻豆成人av在线观看| 波多野结衣av一区二区av| 在线天堂中文资源库| 欧美日韩乱码在线| 久久精品成人免费网站| 国产亚洲欧美98| 欧美大码av| 99国产精品一区二区三区| 最好的美女福利视频网| 国产一区二区激情短视频| 亚洲成av人片免费观看| 国产精品永久免费网站| 在线观看舔阴道视频| 日韩免费av在线播放| 亚洲成人国产一区在线观看| 久久亚洲真实| 成人18禁在线播放| 激情视频va一区二区三区| 波多野结衣av一区二区av| 亚洲精品粉嫩美女一区| 18禁美女被吸乳视频| 亚洲成a人片在线一区二区| 黑人操中国人逼视频| 在线观看免费午夜福利视频| 在线播放国产精品三级| 99国产精品一区二区三区| 身体一侧抽搐| 在线永久观看黄色视频| 国产亚洲精品久久久久5区| 国产麻豆成人av免费视频| 一级毛片女人18水好多| 亚洲五月色婷婷综合| 美女午夜性视频免费| 免费观看人在逋| 亚洲欧美激情综合另类| 一级毛片精品| 久久香蕉精品热| 搡老岳熟女国产| 成人免费观看视频高清| 日本免费a在线| 热99re8久久精品国产| 可以在线观看毛片的网站| 在线观看www视频免费| 亚洲精品久久成人aⅴ小说| 国产成人精品久久二区二区91| 亚洲成a人片在线一区二区| 欧美精品亚洲一区二区| 免费高清视频大片| 久久这里只有精品19| 成人国产综合亚洲| 啦啦啦 在线观看视频| 少妇的丰满在线观看| 妹子高潮喷水视频| 亚洲av日韩精品久久久久久密| 中文字幕色久视频| 亚洲专区国产一区二区| 精品人妻在线不人妻| 电影成人av| 国产亚洲欧美98| 男男h啪啪无遮挡| 不卡一级毛片| 日韩欧美一区视频在线观看| 亚洲色图综合在线观看| 久久久久久免费高清国产稀缺| 国产精品,欧美在线| 亚洲人成电影观看| 欧美久久黑人一区二区| av免费在线观看网站| 两个人免费观看高清视频| 一级,二级,三级黄色视频| 法律面前人人平等表现在哪些方面| 搞女人的毛片| 波多野结衣高清无吗| 一二三四社区在线视频社区8| 国产成人影院久久av| 欧美日韩亚洲国产一区二区在线观看| 精品国产国语对白av| 免费看a级黄色片| 亚洲性夜色夜夜综合| 操美女的视频在线观看| 欧美乱色亚洲激情| 国产xxxxx性猛交| 亚洲黑人精品在线| 国产成人免费无遮挡视频| 日韩 欧美 亚洲 中文字幕| 亚洲黑人精品在线| 高清在线国产一区| 国产精品乱码一区二三区的特点 | 一区二区三区精品91| 日本在线视频免费播放| 国产熟女xx| 日本五十路高清| 黄色视频,在线免费观看| 国产亚洲欧美98| 久久精品亚洲精品国产色婷小说| 日本免费一区二区三区高清不卡 | 国内久久婷婷六月综合欲色啪| 不卡av一区二区三区| 97人妻精品一区二区三区麻豆 | 欧美性长视频在线观看| 在线观看免费视频网站a站| 视频在线观看一区二区三区| 成人亚洲精品av一区二区| 手机成人av网站| 他把我摸到了高潮在线观看| 欧美成狂野欧美在线观看| 亚洲色图综合在线观看| 日韩欧美国产一区二区入口| 国产伦人伦偷精品视频| 亚洲国产中文字幕在线视频| 久久香蕉精品热| 国产一区二区激情短视频| 后天国语完整版免费观看| 国产在线精品亚洲第一网站| 亚洲三区欧美一区| 在线永久观看黄色视频| 亚洲人成电影观看| 精品第一国产精品| 欧美日韩黄片免| 亚洲精品粉嫩美女一区| 国内精品久久久久久久电影| 波多野结衣巨乳人妻| 男女午夜视频在线观看| 男女之事视频高清在线观看| 级片在线观看| 免费在线观看影片大全网站| 午夜福利,免费看| 欧美乱妇无乱码| 丁香六月欧美| 18禁观看日本| 黄频高清免费视频| 国内久久婷婷六月综合欲色啪| 欧美国产精品va在线观看不卡| 一a级毛片在线观看| 一本久久中文字幕| 亚洲国产精品合色在线| 国产一区二区激情短视频| 婷婷丁香在线五月| 动漫黄色视频在线观看| videosex国产| 成人亚洲精品av一区二区| 亚洲 欧美 日韩 在线 免费| 日韩欧美免费精品| 50天的宝宝边吃奶边哭怎么回事| 亚洲伊人色综图| 国产高清有码在线观看视频 | 国语自产精品视频在线第100页| 国产精品日韩av在线免费观看 | 国产野战对白在线观看| 在线观看免费午夜福利视频| 50天的宝宝边吃奶边哭怎么回事| 国产精品久久久av美女十八| 国产国语露脸激情在线看| 亚洲国产高清在线一区二区三 | 亚洲欧美日韩无卡精品| 日韩av在线大香蕉| xxx96com| 黄色女人牲交| 国产精品久久电影中文字幕| 精品久久久久久,| 99久久国产精品久久久| 女人被躁到高潮嗷嗷叫费观| 日日干狠狠操夜夜爽| 成人欧美大片| 精品国产美女av久久久久小说| 两性夫妻黄色片| 亚洲专区国产一区二区| 亚洲精品中文字幕一二三四区| 淫妇啪啪啪对白视频| 国产不卡一卡二| 18禁黄网站禁片午夜丰满| 身体一侧抽搐| 桃红色精品国产亚洲av| 女同久久另类99精品国产91| 一二三四社区在线视频社区8| 韩国av一区二区三区四区| 国产主播在线观看一区二区| 欧美日韩一级在线毛片| 亚洲va日本ⅴa欧美va伊人久久| 久久精品国产清高在天天线| 国产麻豆成人av免费视频| 韩国av一区二区三区四区| 亚洲成人国产一区在线观看| 夜夜夜夜夜久久久久| 久久婷婷成人综合色麻豆| av在线天堂中文字幕| 法律面前人人平等表现在哪些方面| 成人国产一区最新在线观看| 99国产精品一区二区蜜桃av| 91精品国产国语对白视频| 久热这里只有精品99| 国产精品秋霞免费鲁丝片| 在线观看www视频免费| 亚洲九九香蕉| 亚洲情色 制服丝袜| 涩涩av久久男人的天堂| 一区二区三区精品91| 无限看片的www在线观看| 人人妻人人爽人人添夜夜欢视频| 精品欧美一区二区三区在线| 国产高清视频在线播放一区| 青草久久国产| 在线观看免费视频日本深夜| 一级,二级,三级黄色视频| 手机成人av网站| 午夜亚洲福利在线播放| 波多野结衣巨乳人妻| 欧美黄色片欧美黄色片| 91麻豆av在线| 国产精品久久久久久亚洲av鲁大| 国产成人影院久久av| 又黄又爽又免费观看的视频| 国内毛片毛片毛片毛片毛片| 啦啦啦观看免费观看视频高清 | 亚洲人成电影观看| 欧美国产精品va在线观看不卡| 女生性感内裤真人,穿戴方法视频| 午夜久久久在线观看| 最好的美女福利视频网| 别揉我奶头~嗯~啊~动态视频| av免费在线观看网站| 男女之事视频高清在线观看| 窝窝影院91人妻| 亚洲视频免费观看视频| 亚洲第一欧美日韩一区二区三区| 12—13女人毛片做爰片一| 电影成人av| 亚洲va日本ⅴa欧美va伊人久久| av有码第一页| 日韩欧美国产在线观看| 国产成人系列免费观看| 99香蕉大伊视频| 久热爱精品视频在线9| 国产精品精品国产色婷婷| 怎么达到女性高潮| 午夜福利一区二区在线看| 欧美丝袜亚洲另类 | 色精品久久人妻99蜜桃| 欧美乱码精品一区二区三区| 人人妻人人爽人人添夜夜欢视频| 精品久久久久久成人av| 男女午夜视频在线观看| 别揉我奶头~嗯~啊~动态视频| 亚洲欧美日韩另类电影网站| 午夜亚洲福利在线播放| 精品久久久久久久人妻蜜臀av | www.www免费av| 亚洲国产精品合色在线| 久久人妻福利社区极品人妻图片| 日日夜夜操网爽| 午夜福利,免费看| 国产精品永久免费网站| 国产成人系列免费观看| 非洲黑人性xxxx精品又粗又长| 妹子高潮喷水视频| 18美女黄网站色大片免费观看| 欧美绝顶高潮抽搐喷水| 美女高潮到喷水免费观看| 久久人妻av系列| 婷婷六月久久综合丁香| 亚洲第一欧美日韩一区二区三区| 亚洲专区中文字幕在线| 给我免费播放毛片高清在线观看| 一级a爱视频在线免费观看| 一夜夜www| 99久久99久久久精品蜜桃| 久久香蕉国产精品| 欧美一级a爱片免费观看看 | 亚洲男人的天堂狠狠| 色在线成人网| 三级毛片av免费| 久久久久久人人人人人| 制服诱惑二区| 亚洲 欧美 日韩 在线 免费| 电影成人av| 成人国产综合亚洲| 老鸭窝网址在线观看| 黄色成人免费大全| 亚洲七黄色美女视频| 一本大道久久a久久精品| 国产精品自产拍在线观看55亚洲| 国产99久久九九免费精品| 午夜福利,免费看| 久久久久精品国产欧美久久久| 午夜a级毛片| 亚洲av电影不卡..在线观看| av超薄肉色丝袜交足视频| 国产精品亚洲美女久久久| 黄色视频,在线免费观看| 午夜日韩欧美国产| 国产精品日韩av在线免费观看 | 国产高清激情床上av| 校园春色视频在线观看| 久久国产精品男人的天堂亚洲| 亚洲免费av在线视频| 女人高潮潮喷娇喘18禁视频| 国产成人一区二区三区免费视频网站| 麻豆久久精品国产亚洲av| 午夜福利视频1000在线观看 | 满18在线观看网站| 老司机深夜福利视频在线观看| 精品国产乱码久久久久久男人| av电影中文网址| 性色av乱码一区二区三区2| 免费在线观看视频国产中文字幕亚洲| 制服丝袜大香蕉在线| 老司机深夜福利视频在线观看| 久久人妻福利社区极品人妻图片| 欧美日本视频| 免费观看人在逋| www日本在线高清视频| 日本免费a在线| 不卡av一区二区三区| 国产成人精品久久二区二区91| 日韩精品中文字幕看吧| 久久亚洲真实| 侵犯人妻中文字幕一二三四区| 亚洲精华国产精华精| 在线观看免费视频日本深夜| 国产成人影院久久av| 妹子高潮喷水视频| 一区在线观看完整版| 日韩免费av在线播放| 亚洲人成伊人成综合网2020| 女人高潮潮喷娇喘18禁视频| 欧美丝袜亚洲另类 | 黄色a级毛片大全视频| АⅤ资源中文在线天堂| 成人精品一区二区免费| 日韩视频一区二区在线观看| 午夜福利影视在线免费观看| 国产伦人伦偷精品视频| 一边摸一边抽搐一进一出视频| 国产精品 国内视频| 午夜两性在线视频| 男人操女人黄网站| 99国产极品粉嫩在线观看|