• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    分詞技術(shù)的研究與應(yīng)用

    2015-05-30 17:19:54吳宏洲
    軟件工程 2015年12期
    關(guān)鍵詞:詞庫(kù)頻度詞條

    吳宏洲

    摘 要:一種無(wú)需語(yǔ)料庫(kù)和復(fù)雜數(shù)學(xué)模型支持的抽取新詞最簡(jiǎn)方法。通過(guò)掃描文獻(xiàn)文字流,消除停用字詞,切分單元子句,對(duì)子句枚舉可能的候選詞條,統(tǒng)計(jì)候選詞條頻度,計(jì)算長(zhǎng)短包含關(guān)系候選詞之間的置信度值,只須依據(jù)大于90%的值來(lái)消除短詞,得到候選關(guān)鍵詞,再經(jīng)過(guò)已有詞庫(kù)過(guò)濾,留下新詞。該方法可作為信息加工的輔助工具。

    關(guān)鍵詞:停用詞;候選分詞;置信度;抽取新詞

    中圖分類(lèi)號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A

    A Quick Word Segmentation Technology Research and Application

    ——the Method of Extracting New Word

    WU Hongzhou

    (The China Patent Information Center,Beijing 100088,China)

    Abstract:A complicated mathematical model without corpus and support the minimalist approach the extraction of words.By scanning the literature text flow,eliminate stop using words,segmentation unit clause,for other enumeration possible candidates for entry,the statistical frequency of candidate items,calculate length of confidence value contains the relationship between the candidate words,simply on the basis of more than 90% of the value to eliminate the short term,to get the candidate keywords,repass existing thesaurus filtering,new words.This method can be used as an auxiliary tool to information processing.

    Keywords:stop words;the candidate segmentation;confidence;extraction of new words

    1 引言(Introduction)

    在專(zhuān)利信息技術(shù)中,專(zhuān)利文獻(xiàn)信息檢索、機(jī)器翻譯、專(zhuān)利輔助自動(dòng)文摘和CPC/IPC自動(dòng)分類(lèi),都會(huì)用到一個(gè)基本的技術(shù)——分詞技術(shù)。所謂分詞,就是利用已有詞庫(kù)的詞,來(lái)切分文章中的詞的過(guò)程[1,4]。隨著大量文獻(xiàn)的不斷引入,已有詞庫(kù)永遠(yuǎn)不能滿(mǎn)足實(shí)際所需。更新分詞庫(kù),是一項(xiàng)必要工作。如果完全由人工來(lái)處理新詞,經(jīng)過(guò)一系列抽取、標(biāo)引、審校和入庫(kù)流程,當(dāng)實(shí)際需要處理的量遠(yuǎn)遠(yuǎn)超過(guò)人的能力時(shí),那么準(zhǔn)確性和效率就會(huì)成為一個(gè)問(wèn)題。那么這就涉及另外一項(xiàng)自動(dòng)化技術(shù),抽取新詞的技術(shù)。抽詞技術(shù)目前已經(jīng)非常成熟,方法也比較多。比較成熟的產(chǎn)品技術(shù),通過(guò)語(yǔ)料庫(kù)、訓(xùn)練集和復(fù)雜的數(shù)學(xué)模型及其昂貴的資源代價(jià),來(lái)獲得高質(zhì)量的效果。其效果與語(yǔ)料庫(kù)或知識(shí)庫(kù)收集的量有很大的關(guān)系。量越大越容易精確。在專(zhuān)利信息領(lǐng)域中,完全依賴(lài)知識(shí)庫(kù)的方法,對(duì)于那些改進(jìn)性的發(fā)明,還能起作用。但是對(duì)于那些強(qiáng)調(diào)首創(chuàng)性的發(fā)明,彼此之間相似性就很少,算法再高明,也可能收效甚微。本文因受N-gram啟發(fā)[2],借鑒置信度消除歧義詞[3],一個(gè)幾乎被淡忘的陳舊方法,經(jīng)過(guò)簡(jiǎn)單優(yōu)化,以最小代價(jià)來(lái)解決文獻(xiàn)領(lǐng)域面向新詞的抽取繁重工作帶來(lái)的問(wèn)題,效果非常顯著。

    2 抽詞技術(shù)的現(xiàn)狀(The extracting words

    technology)

    目前抽詞技術(shù)主要有四類(lèi),基于詞庫(kù)的、規(guī)則的、統(tǒng)計(jì)的和格式化文檔的抽詞法。

    2.1 基于詞庫(kù)的關(guān)鍵詞抽取法

    這種方法主要利用已有詞庫(kù)來(lái)抽取關(guān)鍵詞,和詞典分詞法大致類(lèi)同。和最大分詞不同,需要枚舉所有長(zhǎng)短可能的詞,這些詞都是詞庫(kù)已有的詞。不能識(shí)別未登錄詞。通常檢索短語(yǔ)用的就是這類(lèi)方法。

    2.2 基于規(guī)則的關(guān)鍵詞抽取法

    利用句法或語(yǔ)義分析,借助句法知識(shí)庫(kù)、語(yǔ)義知識(shí)庫(kù)等資源,抽取出文件中的名詞詞素,以名詞素為中心,向前向后擴(kuò)展新詞。利用句法或語(yǔ)義分析,借助句法知識(shí)庫(kù)、語(yǔ)義知識(shí)庫(kù)等資源,抽取出文件中的名詞詞素,運(yùn)用一些方法與準(zhǔn)則,過(guò)濾掉不符合規(guī)則的詞素。經(jīng)過(guò)這樣的處理之后,得到的結(jié)果幾乎都是有意義的名詞或名詞短語(yǔ)。對(duì)于面向英文的處理,這種做法已經(jīng)取得了非常好的效果。通常機(jī)器翻譯用的就是這類(lèi)方法。

    2.3 基于統(tǒng)計(jì)的關(guān)鍵詞抽取法

    通過(guò)對(duì)文獻(xiàn)中詞頻統(tǒng)計(jì)和對(duì)派生出來(lái)的新詞的互信息來(lái)獲取新詞。統(tǒng)計(jì)方法細(xì)分還有幾種方法:N-gram方法、詞頻、TFIDF、詞的同現(xiàn)信息、PAT-Tree,或是上述某些統(tǒng)計(jì)方法的結(jié)合等。通常自動(dòng)文摘、自動(dòng)分類(lèi)、自動(dòng)標(biāo)引等會(huì)用到這類(lèi)中的一些方法。自動(dòng)文摘、自動(dòng)分類(lèi)常用TFIDF方法來(lái)計(jì)算。抽取新詞常用N-gram與詞的同現(xiàn)信息計(jì)算。PAT-Tree和N-gram是抽詞常用的兩種方法。TFIDF、PAT-Tree需要語(yǔ)料信息和資源支持,計(jì)算概率和詞頻權(quán)重。N-gram不需要語(yǔ)料信息和資源,但計(jì)算量會(huì)較大。

    2.4 基于格式化文檔的關(guān)鍵詞抽取法

    利用一些排版規(guī)則、文檔結(jié)構(gòu)化和格式化規(guī)律,將重要的字符串抽取出來(lái)。例如:專(zhuān)利文獻(xiàn)中的標(biāo)題、文摘、權(quán)利要求書(shū)及其著錄項(xiàng)目、關(guān)鍵詞、同義詞等結(jié)構(gòu)文檔;權(quán)利要求書(shū)中的語(yǔ)義樹(shù)形態(tài)的陳述形式??梢园凑瘴墨I(xiàn)結(jié)構(gòu)格式化的規(guī)律,找到相應(yīng)關(guān)鍵詞,按照出現(xiàn)的位置重要性賦予不同的權(quán)重,以期達(dá)到抽取關(guān)鍵詞的目的。即便是低頻詞,由于出現(xiàn)在非常重要位置上,因而也能將其從文獻(xiàn)中輕易地得到。例如:出現(xiàn)在發(fā)明專(zhuān)利標(biāo)題中的每一個(gè)詞都非常重要,即便文摘中并未反復(fù)多次出現(xiàn),但是其不同位置詞頻度與權(quán)重積之總和卻很高,那么也能構(gòu)成關(guān)鍵詞要素。通常自動(dòng)文摘、自動(dòng)分類(lèi)、自動(dòng)標(biāo)引等也會(huì)用到這類(lèi)方法。

    3 本文抽詞技術(shù)的實(shí)現(xiàn)(The realization of the

    technology of the paper)

    抽詞技術(shù)方法很多,考慮到經(jīng)濟(jì)和實(shí)用因素,復(fù)雜的數(shù)學(xué)計(jì)算方法、需要大量歷史信息、語(yǔ)料庫(kù)、訓(xùn)練集的支持,與主旨相悖,避開(kāi)此類(lèi)方法,尋求更簡(jiǎn)單有效的方法。采用基于統(tǒng)計(jì)的方法,且僅限于對(duì)于一篇文獻(xiàn)進(jìn)行處理。以常見(jiàn)的N-gram方法來(lái)枚舉候選詞。通過(guò)尋找候選詞間的包含關(guān)系,計(jì)算置信度的取值,來(lái)濾除掉不需要的候選詞。從而留下頻度較高的、可能性大的候選詞。關(guān)鍵詞就出自其中。借助已有分詞庫(kù),再濾掉那些已有詞,最終得到的候選詞就是候選新詞。抽詞算法流程圖,如圖1所示。

    3.1 停用詞處理

    停用詞對(duì)于抽詞結(jié)果的影響比較大。選擇不同的停用詞集合,產(chǎn)生的候選詞也會(huì)不同。例如:“有”字被停用后,“有機(jī)...”等詞也被抑制。“和”字被停用后,“飽和...”等詞也被抑制。

    通常建議提供停用詞庫(kù)客戶(hù)端個(gè)性化可調(diào)整方案,根據(jù)情況適度變換停用詞策略,會(huì)產(chǎn)生不同的新詞條和關(guān)鍵詞。變換停用詞應(yīng)以能夠適應(yīng)用戶(hù)需求和方便操作為前提,優(yōu)先考慮解決方案。

    停用詞庫(kù)的使用順序,也會(huì)對(duì)抽詞產(chǎn)生很大影響。例如:“有”對(duì)“具有”或“所有”的影響,如果最先使用短詞“有”,那么就會(huì)留下“具”或“所”與其他字詞組成“…具”或“…所”的候選新詞條,形成歧義詞條。

    通常建議構(gòu)造停用字詞庫(kù),應(yīng)按照{(diào)詞長(zhǎng)[逆序],詞條[正序]}有序存放。亦即停用詞過(guò)濾按照長(zhǎng)詞優(yōu)先原則。避免停用詞因使用順序不當(dāng)而帶來(lái)新的問(wèn)題。

    3.2 候選詞條枚舉

    該方法借鑒N-gram算法[2],并受其啟發(fā)。首先要確定一個(gè)分詞可能的最大長(zhǎng)度,即N取多少個(gè)漢字合適??紤]到化學(xué)、藥物、微生物等領(lǐng)域的技術(shù)術(shù)語(yǔ)可能會(huì)有大量長(zhǎng)詞出現(xiàn)。因此,適當(dāng)降低訪問(wèn)效率,滿(mǎn)足分詞長(zhǎng)度要求,也是可容忍的。通常認(rèn)為一個(gè)長(zhǎng)詞最長(zhǎng)不超過(guò)15個(gè)漢字,就可以符合專(zhuān)利信息領(lǐng)域?qū)﹃P(guān)鍵詞的需求。N取15,這是分詞庫(kù)的一項(xiàng)重要參數(shù)定義。分詞至少由2個(gè)漢字組成,分詞庫(kù)不接收單字詞。為了闡述方便,以分詞最大長(zhǎng)度取5為例。枚舉候選分詞,詳見(jiàn)表1。

    算法:

    //參數(shù)S句子;SL句子長(zhǎng)度漢字?jǐn)?shù)

    CS=“ ”;

    For(wl=2;wl<=min(SL,15);wl++){//最大分詞長(zhǎng)度15,計(jì)算詞長(zhǎng)從2到15或SL遞增

    For(pos=0;pos

    CS←CS+substr(S,pos,wl)+“”;//抽取候選分詞

    }

    }

    Output (CS);//結(jié)果

    3.3 候選詞條統(tǒng)計(jì)

    處理一篇文獻(xiàn)須對(duì)已生成候選詞條進(jìn)行排序和頻度統(tǒng)計(jì),形成候選詞條有序集。

    3.4 歧義詞消除

    定義:在候選詞條集ψ中,如果漢字結(jié)合模式ω1添加前綴pref或后綴suff后,構(gòu)成漢字結(jié)合模式ω2,即ω2=ω1+suff或ω2=pref+ω1或ω2=pref+ω1+suff,那么模式ω2在文檔中的出現(xiàn)頻度Γ(ω2,s)與模式ω1在文檔中出現(xiàn)頻度Γ(ω1,s)之比稱(chēng)為模式ω2相對(duì)于模式ω1的置信度Confidence(ω2|ω1)。Confidence(ω2|ω1)≈Γ(ω2,s)/Γ(ω1,s)。置信度反映模式ω1與前綴和或后綴結(jié)合的穩(wěn)定性。即模式ω2構(gòu)成詞條的可能性。如果置信度低于下限,則說(shuō)明模式ω2構(gòu)成詞條的可能性小,可以除去。如果置信度位于上限和下限之間,那么,模式ω1、ω2可以共存于候選分詞集中。在后綴情況下,如果置信度高于上限,則說(shuō)明模式ω1基本被包含于模式ω2之中。按照最大匹配原則,ω1可以除去。實(shí)際使用中,某些專(zhuān)家將置信度區(qū)間定義為[0.30,0.90]作為上下區(qū)間,稱(chēng)為置信度空間[3]。

    抽取關(guān)鍵詞和或新詞條,消除其中歧義詞條的算法主要來(lái)源于三條規(guī)則:

    規(guī)則1:Confidence(ω2|ω1)≤30%,ω2為詞條的可能性很小,ω2可以除去。

    規(guī)則2:Confidence(ω2|ω1)∈(30%,90%),ω1和ω2都有可能。

    規(guī)則3:Confidence(ω2|ω1)≥90%,ω1被ω2所包含,ω1則可以除去。

    通常算法只考慮規(guī)則1和規(guī)則3的情況,作消歧處理。

    規(guī)則1算法:

    For(i=0;i

    w1←S[i];

    Sel←true;//默認(rèn)選中w1

    If(w1.wf==0) continue;//由于第一條規(guī)則本身可能使w2.wf←0的情況發(fā)生,跳過(guò)

    For(j=0;j

    If(j==i)continue;//是自己,跳過(guò)

    w2←S[j];

    If(w2.wf==0)continue;//由于第一條規(guī)則本身可能使w2.wf←0的情況發(fā)生,跳過(guò)

    If(substr_at(w1.kw,w2.kw)>=0){//如果w2=前綴+w1+后綴;前后綴不同時(shí)為空

    Confidence←w2.wf/w1.wf;//置信度≈f(w2)/f(w1),頻度比

    If(Confidence)<0.10){//置信度低于下限,也可以取下限0.30

    w2.wf←0;//w2視為不存在

    S[j]←w2;

    continue;//看下一個(gè)w2

    }

    }

    }

    }

    For(i=0;i

    If(w1.wf>1) {

    Output(S[i]);//輸出留下的詞條。

    }

    }

    規(guī)則3算法:

    For(i=0;i

    w1←S[i];

    Sel←true;//默認(rèn)選中w1

    If(w1.wf==0) continue;//由于第一條規(guī)則可能使w1.wf←0的情況發(fā)生,跳過(guò)

    For(j=0;j

    If(j==i) continue;//是自己,跳過(guò)

    W2←S[j];

    If(substr_at(w1.kw,w2.kw)>=0){//如果w2=前綴+w1+后綴;前后綴不同時(shí)為空

    Confidence←w2.wf/w1.wf;//置信度≈f(w2)/f(w1),頻度比

    If(Confidence)>=0.90){//只要有一個(gè)W2,使得置信度超過(guò)上限,

    Select←false;//w1就被包含在w2中,w1可以視為不存在

    Break;

    }

    }

    }

    If(select) {

    If(w1.wf > 1) {

    Output(w1);//輸出留下的詞條。

    }

    }

    }

    3.5 普通詞濾除

    對(duì)于候選詞條集,借助已有分詞庫(kù),依次查看庫(kù)中該詞是否已存在?從候選詞條集中除去存在的詞條。留下來(lái)的可作為候選新詞條。

    4 實(shí)驗(yàn)效果(The experiment effect)

    筆者經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),僅規(guī)則3情況,當(dāng)取Confidence

    (ω2|ω1)≥90%,濾掉ω1,就已經(jīng)可以獲得非常不錯(cuò)的效果。相反,按照規(guī)則1+3,當(dāng)取Confidence(ω2|ω1)≤30%,消除ω2,再取Confidence(ω2|ω1)≥90%,濾掉ω1,效果反而更糟。甚至調(diào)整下限為10%,改變也不大。試驗(yàn)樣本六個(gè)發(fā)明公開(kāi)專(zhuān)利的“標(biāo)題+文摘”, 詳見(jiàn)表2;不同規(guī)則下抽取的候選新詞條,詳見(jiàn)表3。

    表2 試驗(yàn)樣本6個(gè)發(fā)明公開(kāi)專(zhuān)利的“標(biāo)題+文摘”

    Tab.2 "Title+digest"of the 6 inventions of the test sample

    專(zhuān)利 標(biāo)題+文摘

    1 具有輥輪的多環(huán)節(jié)傳送帶本發(fā)明涉及一種用于輸送物體諸如容器、瓶子、捆束等等的多環(huán)節(jié)傳送帶,該傳送帶由許多相互鉸接的環(huán)節(jié)(14)構(gòu)成。所述傳送帶在其上側(cè)上具有至少一行(22)可旋轉(zhuǎn)地受支承的承放輥(24),其旋轉(zhuǎn)軸線平行于鉸鏈栓并且平行于這些環(huán)節(jié)(14)的支架(16)的縱側(cè)。利用分別相鄰的環(huán)節(jié)(14)的承放輥(24)構(gòu)成用于需要輸送的物體的承放面。在這些環(huán)節(jié)(14)的至少一個(gè)縱側(cè)的區(qū)域內(nèi)設(shè)有多個(gè)偏轉(zhuǎn)元件(26),這些偏轉(zhuǎn)元件在承放輥(24)以及支架(16)的上側(cè)(17)的高度水平之間并且在承放輥(24)的至少一側(cè)上延伸。

    2 用于計(jì)時(shí)器的擒縱裝置一種計(jì)時(shí)器機(jī)芯的擒縱裝置,包括:擒縱輪(1);第一運(yùn)動(dòng)件(2),其具有與所述擒縱輪(1)鎖止的工具(23)和與所述擒縱輪(1)的機(jī)械傳遞工具(22);第二運(yùn)動(dòng)件(3);以及平衡滾子(4)。所述第二運(yùn)動(dòng)件(3)具有與所述擒縱輪(1)鎖止的工具(33)和與所述擒縱輪(1)和所述第一運(yùn)動(dòng)件(2)的機(jī)械傳遞工具(32)。運(yùn)動(dòng)件通過(guò)擒縱輪被切向地驅(qū)動(dòng)。

    3 硼回收設(shè)備、硼回收方法和硼回收系統(tǒng)本發(fā)明涉及硼回收設(shè)備、硼回收方法和硼回收系統(tǒng),包括通道和至少一個(gè)被置于通道中的曝氣設(shè)備。根據(jù)本發(fā)明的硼回收設(shè)備包括曝氣通道型反應(yīng)器,其中含硼溶液通過(guò)所述通道而曝氣從而使硼以硼砂的形式被提??;和沉淀槽,其中含硼溶液穿過(guò)曝氣通道型反應(yīng)器而提取的硼砂被沉淀,并且其余的溶液借助于溢流而分離。

    4 控制風(fēng)輪機(jī)上的葉片的型線的方法本發(fā)明涉及一種控制風(fēng)輪機(jī)上的葉片的型線的設(shè)備或者方法,所述風(fēng)輪機(jī)具有至少第一葉片和第二葉片,該第一葉片包括適合確定第一葉片狀態(tài)的至少一個(gè)第一傳感器系統(tǒng),以及該第二葉片包括適合確定第二葉片狀態(tài)的至少一個(gè)第二傳感器系統(tǒng),其中基于確定的第一葉片狀態(tài)和確定的第二葉片狀態(tài),控制第二葉片的型線。

    5 環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法本發(fā)明提供一種環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法,在環(huán)境測(cè)定裝置以及環(huán)境測(cè)定方法中,高精度地測(cè)定大氣中的腐蝕性氣體。環(huán)境測(cè)定裝置(10)具備運(yùn)算部(13),其計(jì)算出第1QCM傳感器(11a)的第1共振頻率(f1m)的第1變化量(Δf1m)、以及第2QCM傳感器(11b)的第2共振頻率(f2m)的第2變化量(Δf2m),運(yùn)算部(14)基于第1期間(T1)內(nèi)的第1變化量(Δf1m)和該第1期間(T1)內(nèi)的第2變化量(Δf2m),來(lái)修正該第2變化量(Δf2m)。

    6 用于支持對(duì)管制和非管制物品經(jīng)銷(xiāo)的監(jiān)管要求的系統(tǒng)和方法本發(fā)明提供了用于支持如美國(guó)和加拿大等國(guó)家對(duì)管制和非管制物品配給的監(jiān)管要求的系統(tǒng)和方法,所述管制和非管制物品例如是非管制處方(Rx)、醫(yī)療設(shè)備和管制物質(zhì)。該系統(tǒng)和方法加入了許可核實(shí)模塊,其被配置以對(duì)特定的管制和/或非管制物品的訂單進(jìn)行許可驗(yàn)證。在某些實(shí)施方式中,該許可驗(yàn)證模塊將訂單數(shù)據(jù)與歷史存儲(chǔ)數(shù)據(jù)比較,如果存在一個(gè)或多個(gè)差異,驗(yàn)證即不成功。在驗(yàn)證失敗時(shí),許可核實(shí)模塊可進(jìn)一步查詢(xún)第三方數(shù)據(jù)以獲取更新的許可信息。該系統(tǒng)和方法進(jìn)一步加入了可疑訂單監(jiān)控模塊,其被配置以對(duì)訂單實(shí)施多項(xiàng)檢查,以將訂單識(shí)別出可能被進(jìn)一步調(diào)查或被視為可疑的“感興趣訂單”。

    限于篇幅,本文沒(méi)有列出候選關(guān)鍵詞和被去除的普通詞。通過(guò)比對(duì)兩種算法結(jié)果,采用規(guī)則1+3的抽取新詞結(jié)果,并不比僅采用規(guī)則3的效果好。從六組數(shù)據(jù)不難看出。采用規(guī)則3的算法來(lái)消除歧義詞,是一個(gè)最簡(jiǎn)方法。與N-gram方法相結(jié)合,可以完成最簡(jiǎn)單的抽詞工作。

    5 結(jié)論(Conclusion)

    抽詞技術(shù)作為計(jì)算機(jī)輔助工具來(lái)使用,為人們提供一種具有參考價(jià)值的信息,供人們選擇使用。本文所述抽詞方法是一種不依賴(lài)于歷史信息、語(yǔ)料庫(kù),不需要訓(xùn)練數(shù)據(jù)的方法。其優(yōu)點(diǎn)是:能識(shí)別高頻度未登錄詞;無(wú)需人工標(biāo)引詞典,不需要花費(fèi)大量資源收集語(yǔ)料庫(kù)。其缺點(diǎn)是計(jì)算量大;會(huì)抽取出意義不完整的字串,導(dǎo)致準(zhǔn)確性差;不能識(shí)別低頻度關(guān)鍵詞。計(jì)算量受兩方面因素影響:(1)隨著N-gram的長(zhǎng)度N增大,計(jì)算效率會(huì)下降。(2)連續(xù)漢字串長(zhǎng)句式增多,計(jì)算效率也會(huì)下降。如果句子經(jīng)過(guò)停用詞處理已經(jīng)足夠細(xì)碎,或者N-gram的長(zhǎng)度N不很大,計(jì)算效率還是可控的。

    本文通過(guò)抽詞實(shí)驗(yàn),實(shí)現(xiàn)并驗(yàn)證了一種對(duì)文獻(xiàn)進(jìn)行快速抽取關(guān)鍵詞和新詞的最簡(jiǎn)單有效的方法。

    參考文獻(xiàn)(References)

    [1] 莊新妍.計(jì)算機(jī)中文分詞技術(shù)的應(yīng)用[J].呼倫貝爾學(xué)院學(xué)報(bào),2010(03):70-74.

    [2] 金翔宇,孫正興,張福炎.一種中文文檔的非受限無(wú)詞典抽詞方法[J].中文信息學(xué)報(bào),2001(06):33-39.

    [3] 黃云峰.計(jì)算機(jī)中文分詞技術(shù)及其在數(shù)字化偵查中的應(yīng)用研究[J].福建警察學(xué)院學(xué)報(bào),2008(04):28-31.

    [4] 李淑英.中文分詞技術(shù)[J].科技信息(科學(xué)教研),2007(36):95.

    猜你喜歡
    詞庫(kù)頻度詞條
    眨眼頻度可判斷煙癮大小
    婦女之友(2017年3期)2017-04-20 09:20:00
    詞庫(kù)音系學(xué)的幾個(gè)理論問(wèn)題芻議
    2016年4月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    2016年3月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    2016年9月中國(guó)直銷(xiāo)網(wǎng)絡(luò)熱門(mén)詞條榜
    銅綠假單胞菌MIC分布敏感百分?jǐn)?shù)與抗菌藥物使用頻度相關(guān)性研究
    大數(shù)據(jù)相關(guān)詞條
    環(huán)境變了,詞庫(kù)別變
    電腦迷(2014年14期)2014-04-29 00:44:03
    QQ手機(jī)輸入法如何導(dǎo)入分類(lèi)詞庫(kù)
    電腦迷(2012年15期)2012-04-29 17:09:47
    將用戶(hù)詞庫(kù)快速導(dǎo)入搜狗五筆詞庫(kù)
    最后的刺客免费高清国语| 国产精品国产三级专区第一集| 久久久久久久亚洲中文字幕| a 毛片基地| 国产精品一区二区在线不卡| 少妇人妻 视频| 在线观看免费日韩欧美大片 | 精品少妇内射三级| 久久久精品94久久精品| 午夜久久久在线观看| 久久久午夜欧美精品| 两个人的视频大全免费| 性高湖久久久久久久久免费观看| 国产色婷婷99| 高清毛片免费看| 久久人人爽人人片av| 国产成人免费无遮挡视频| 又大又黄又爽视频免费| 亚洲av中文av极速乱| 国产精品一区二区在线观看99| 熟女av电影| 精品亚洲乱码少妇综合久久| 欧美 亚洲 国产 日韩一| 视频中文字幕在线观看| 亚洲自偷自拍三级| 极品人妻少妇av视频| 久久99精品国语久久久| 欧美xxⅹ黑人| av天堂中文字幕网| 人人妻人人看人人澡| 久久久久久久亚洲中文字幕| 在线观看www视频免费| 日韩亚洲欧美综合| 中文字幕精品免费在线观看视频 | 免费看日本二区| 免费观看的影片在线观看| 亚洲色图综合在线观看| 国产男人的电影天堂91| 观看av在线不卡| 少妇人妻一区二区三区视频| 边亲边吃奶的免费视频| 欧美最新免费一区二区三区| 久久鲁丝午夜福利片| 人妻一区二区av| 亚洲国产精品999| a级一级毛片免费在线观看| 男人狂女人下面高潮的视频| 国产精品国产三级国产专区5o| 国产成人aa在线观看| 婷婷色av中文字幕| 亚洲精品乱码久久久v下载方式| 久热久热在线精品观看| 狠狠精品人妻久久久久久综合| 97精品久久久久久久久久精品| 亚洲国产精品成人久久小说| 午夜老司机福利剧场| 国产成人免费无遮挡视频| 国产黄片视频在线免费观看| 好男人视频免费观看在线| 91精品国产国语对白视频| 搡老乐熟女国产| 狂野欧美激情性xxxx在线观看| 日韩三级伦理在线观看| 2018国产大陆天天弄谢| 亚洲精品国产色婷婷电影| 久久久久人妻精品一区果冻| 97在线视频观看| 日韩av免费高清视频| 自拍欧美九色日韩亚洲蝌蚪91 | 成人二区视频| 久久久久久久大尺度免费视频| 午夜激情福利司机影院| 人妻系列 视频| 欧美xxxx性猛交bbbb| 一区二区三区免费毛片| 日日摸夜夜添夜夜爱| 黄色怎么调成土黄色| 国精品久久久久久国模美| 欧美日韩视频高清一区二区三区二| 成人影院久久| 国产日韩一区二区三区精品不卡 | 免费看光身美女| 欧美老熟妇乱子伦牲交| 少妇的逼水好多| 成人综合一区亚洲| 成人午夜精彩视频在线观看| 在线观看一区二区三区激情| h视频一区二区三区| 欧美激情极品国产一区二区三区 | a级毛片免费高清观看在线播放| 99热网站在线观看| 十分钟在线观看高清视频www | 91精品伊人久久大香线蕉| videossex国产| 一本久久精品| 亚洲va在线va天堂va国产| 99久久精品国产国产毛片| 免费在线观看成人毛片| 美女cb高潮喷水在线观看| 在线 av 中文字幕| 午夜福利影视在线免费观看| 青青草视频在线视频观看| av播播在线观看一区| 在线观看av片永久免费下载| 男的添女的下面高潮视频| 国产高清三级在线| 男人狂女人下面高潮的视频| 欧美日韩国产mv在线观看视频| 亚洲婷婷狠狠爱综合网| 亚洲婷婷狠狠爱综合网| 午夜老司机福利剧场| 人妻人人澡人人爽人人| 在现免费观看毛片| 美女cb高潮喷水在线观看| 国语对白做爰xxxⅹ性视频网站| 亚洲欧美清纯卡通| 国产精品久久久久久精品电影小说| 亚洲国产最新在线播放| 王馨瑶露胸无遮挡在线观看| 亚洲精品日本国产第一区| 人妻少妇偷人精品九色| 亚洲精品第二区| 建设人人有责人人尽责人人享有的| 亚洲欧美中文字幕日韩二区| 久久久久网色| 国产精品一二三区在线看| 99热这里只有精品一区| 国产精品蜜桃在线观看| 国产成人精品一,二区| 男女无遮挡免费网站观看| 熟女av电影| 欧美日韩综合久久久久久| 永久网站在线| 国产精品偷伦视频观看了| 午夜av观看不卡| 99久久精品热视频| 大片电影免费在线观看免费| 一级毛片电影观看| 少妇的逼好多水| 国产亚洲最大av| 欧美性感艳星| 中文精品一卡2卡3卡4更新| 一级毛片电影观看| 卡戴珊不雅视频在线播放| 亚洲国产最新在线播放| 国产精品久久久久久精品电影小说| 国产无遮挡羞羞视频在线观看| 嘟嘟电影网在线观看| 黑人巨大精品欧美一区二区蜜桃 | 国产有黄有色有爽视频| 免费观看在线日韩| 亚洲激情五月婷婷啪啪| 亚洲精品日韩av片在线观看| 日韩制服骚丝袜av| 免费不卡的大黄色大毛片视频在线观看| 精品久久国产蜜桃| 亚洲av电影在线观看一区二区三区| 免费大片18禁| 一级毛片久久久久久久久女| 偷拍熟女少妇极品色| 日日爽夜夜爽网站| 国内精品宾馆在线| 99热6这里只有精品| 国产深夜福利视频在线观看| tube8黄色片| 欧美人与善性xxx| 伦理电影大哥的女人| 成年美女黄网站色视频大全免费 | 99精国产麻豆久久婷婷| 男人舔奶头视频| 26uuu在线亚洲综合色| 日韩中文字幕视频在线看片| 久久影院123| 毛片一级片免费看久久久久| 人妻少妇偷人精品九色| 如何舔出高潮| 欧美成人午夜免费资源| 中文字幕久久专区| 亚洲在久久综合| 交换朋友夫妻互换小说| 美女主播在线视频| 美女国产视频在线观看| 2018国产大陆天天弄谢| 最近中文字幕高清免费大全6| 欧美 亚洲 国产 日韩一| 丝袜在线中文字幕| 日本欧美视频一区| kizo精华| 日本-黄色视频高清免费观看| 中文欧美无线码| 精品久久国产蜜桃| 国内精品宾馆在线| 亚洲国产成人一精品久久久| 精品久久久噜噜| 在线精品无人区一区二区三| 一级毛片黄色毛片免费观看视频| 国产精品无大码| 99热网站在线观看| 男女边吃奶边做爰视频| 国产在视频线精品| 日日啪夜夜爽| 国产欧美亚洲国产| 婷婷色麻豆天堂久久| 精品国产一区二区久久| 亚洲综合色惰| 观看美女的网站| 精品久久国产蜜桃| 综合色丁香网| 精品一区在线观看国产| 亚洲情色 制服丝袜| 我要看黄色一级片免费的| 97精品久久久久久久久久精品| 久久精品国产a三级三级三级| 美女中出高潮动态图| 女人久久www免费人成看片| 在线观看av片永久免费下载| 搡女人真爽免费视频火全软件| 有码 亚洲区| 热re99久久国产66热| 国产视频内射| 日本91视频免费播放| 不卡视频在线观看欧美| 永久网站在线| 日本av免费视频播放| av又黄又爽大尺度在线免费看| 久久青草综合色| 精品人妻熟女av久视频| 久久精品国产a三级三级三级| 18+在线观看网站| 欧美区成人在线视频| 欧美日韩在线观看h| 一级片'在线观看视频| 国产成人免费无遮挡视频| 97精品久久久久久久久久精品| 伊人久久国产一区二区| 国产欧美日韩精品一区二区| 色94色欧美一区二区| 久久99精品国语久久久| 色婷婷av一区二区三区视频| 亚洲av电影在线观看一区二区三区| 能在线免费看毛片的网站| 男人狂女人下面高潮的视频| 国产欧美日韩精品一区二区| 夫妻性生交免费视频一级片| 欧美亚洲 丝袜 人妻 在线| 日韩大片免费观看网站| 一级毛片久久久久久久久女| 国产精品久久久久久精品电影小说| 亚洲美女搞黄在线观看| 三上悠亚av全集在线观看 | 欧美日韩视频精品一区| 丰满迷人的少妇在线观看| 亚洲欧美中文字幕日韩二区| 大又大粗又爽又黄少妇毛片口| 国产成人精品无人区| 大片电影免费在线观看免费| 老司机亚洲免费影院| av专区在线播放| 一级毛片黄色毛片免费观看视频| 五月玫瑰六月丁香| 男人和女人高潮做爰伦理| 丝袜喷水一区| 亚洲欧美精品自产自拍| 各种免费的搞黄视频| 亚洲高清免费不卡视频| 少妇精品久久久久久久| 99视频精品全部免费 在线| av福利片在线| 黄色怎么调成土黄色| 亚洲av在线观看美女高潮| 在线播放无遮挡| 欧美精品一区二区大全| 大片电影免费在线观看免费| av不卡在线播放| 午夜影院在线不卡| 亚洲激情五月婷婷啪啪| av卡一久久| 国产色婷婷99| 国产精品成人在线| 亚洲国产最新在线播放| av视频免费观看在线观看| 亚洲精品,欧美精品| av在线播放精品| 纯流量卡能插随身wifi吗| 亚洲精品一二三| 日韩人妻高清精品专区| 一本色道久久久久久精品综合| 午夜福利视频精品| 欧美成人精品欧美一级黄| 免费少妇av软件| av福利片在线观看| 深夜a级毛片| 久久ye,这里只有精品| 日韩亚洲欧美综合| 国产深夜福利视频在线观看| 国产伦在线观看视频一区| 国产成人精品久久久久久| 国产欧美日韩综合在线一区二区 | 成人18禁高潮啪啪吃奶动态图 | 国产高清国产精品国产三级| 国产中年淑女户外野战色| 亚洲人成网站在线观看播放| 在线观看av片永久免费下载| 一级毛片电影观看| 国产中年淑女户外野战色| 欧美老熟妇乱子伦牲交| 这个男人来自地球电影免费观看 | 亚洲精品一二三| 这个男人来自地球电影免费观看 | 色94色欧美一区二区| 国产亚洲午夜精品一区二区久久| 亚洲精品中文字幕在线视频 | 亚洲av中文av极速乱| 欧美另类一区| 男人狂女人下面高潮的视频| 性高湖久久久久久久久免费观看| 菩萨蛮人人尽说江南好唐韦庄| 性色avwww在线观看| 中文字幕亚洲精品专区| 中国美白少妇内射xxxbb| 伊人亚洲综合成人网| 亚洲自偷自拍三级| 国产免费一区二区三区四区乱码| 色视频www国产| 亚洲精品一区蜜桃| 国产av一区二区精品久久| 亚洲精品aⅴ在线观看| 国产亚洲午夜精品一区二区久久| 亚洲欧美日韩另类电影网站| 久久毛片免费看一区二区三区| 精华霜和精华液先用哪个| 国模一区二区三区四区视频| 一级爰片在线观看| 成人毛片a级毛片在线播放| 国产男女内射视频| 99热6这里只有精品| 久久鲁丝午夜福利片| 七月丁香在线播放| av不卡在线播放| 少妇被粗大的猛进出69影院 | 99久久精品热视频| 免费观看无遮挡的男女| 亚洲精品中文字幕在线视频 | 一级,二级,三级黄色视频| 在线观看三级黄色| 大香蕉97超碰在线| 久久久a久久爽久久v久久| 久久国产精品大桥未久av | 一级黄片播放器| 赤兔流量卡办理| a级毛片在线看网站| 一级二级三级毛片免费看| 免费黄色在线免费观看| 久久这里有精品视频免费| 边亲边吃奶的免费视频| 精品午夜福利在线看| 欧美 亚洲 国产 日韩一| 在线观看人妻少妇| 国内少妇人妻偷人精品xxx网站| 欧美精品国产亚洲| 国产精品熟女久久久久浪| 99热这里只有是精品50| 免费观看在线日韩| 一本色道久久久久久精品综合| 日韩欧美精品免费久久| 中文字幕人妻熟人妻熟丝袜美| 99视频精品全部免费 在线| 精品久久久噜噜| 九九在线视频观看精品| 久久久久久伊人网av| 春色校园在线视频观看| 久久国产精品男人的天堂亚洲 | 卡戴珊不雅视频在线播放| 亚洲图色成人| 美女脱内裤让男人舔精品视频| 我的女老师完整版在线观看| 亚洲综合精品二区| 国产一区有黄有色的免费视频| 男女边摸边吃奶| 久久ye,这里只有精品| 麻豆精品久久久久久蜜桃| 尾随美女入室| 日本av免费视频播放| 高清不卡的av网站| 精品亚洲乱码少妇综合久久| 高清午夜精品一区二区三区| 久久久国产一区二区| 国产精品99久久99久久久不卡 | 一本大道久久a久久精品| 亚洲精品日韩在线中文字幕| 狂野欧美激情性xxxx在线观看| 性色av一级| 国产在线免费精品| 哪个播放器可以免费观看大片| 国产日韩一区二区三区精品不卡 | 女人精品久久久久毛片| 国模一区二区三区四区视频| 国产成人一区二区在线| 国产国拍精品亚洲av在线观看| 欧美3d第一页| 夫妻性生交免费视频一级片| 一本色道久久久久久精品综合| 免费看av在线观看网站| 夫妻性生交免费视频一级片| 在线观看三级黄色| 国产中年淑女户外野战色| 久久精品国产a三级三级三级| av天堂中文字幕网| 欧美日韩视频精品一区| 久久久精品94久久精品| 性色av一级| 九九在线视频观看精品| 国产国拍精品亚洲av在线观看| 在线免费观看不下载黄p国产| 人人妻人人看人人澡| 五月伊人婷婷丁香| 国语对白做爰xxxⅹ性视频网站| 欧美97在线视频| 日韩av在线免费看完整版不卡| 亚洲国产最新在线播放| 精品一区二区三卡| 久久99精品国语久久久| 亚洲,一卡二卡三卡| 精品亚洲成国产av| 日韩一本色道免费dvd| 久久人人爽av亚洲精品天堂| 成年av动漫网址| 午夜福利在线观看免费完整高清在| av天堂久久9| 国产91av在线免费观看| 午夜福利在线观看免费完整高清在| 夫妻午夜视频| 亚洲精品中文字幕在线视频 | 欧美日韩在线观看h| 一区二区三区免费毛片| 欧美变态另类bdsm刘玥| 精品久久久久久久久亚洲| 我要看黄色一级片免费的| 亚洲精品一二三| 草草在线视频免费看| 麻豆成人午夜福利视频| 国产精品99久久久久久久久| 亚洲精品一二三| 久久鲁丝午夜福利片| 爱豆传媒免费全集在线观看| 99久久人妻综合| 中文欧美无线码| 日韩亚洲欧美综合| 国产高清不卡午夜福利| 国产av国产精品国产| 在线播放无遮挡| 夫妻午夜视频| 秋霞伦理黄片| 亚洲内射少妇av| 成人美女网站在线观看视频| 少妇的逼好多水| 中国美白少妇内射xxxbb| 日日爽夜夜爽网站| 亚洲欧美精品自产自拍| 一级黄片播放器| 少妇被粗大猛烈的视频| 在线观看一区二区三区激情| 在线观看国产h片| 国产成人精品福利久久| 亚洲精品国产av成人精品| 边亲边吃奶的免费视频| 亚洲av综合色区一区| 亚洲美女视频黄频| 美女中出高潮动态图| 一级二级三级毛片免费看| 性高湖久久久久久久久免费观看| 老司机影院成人| 亚洲真实伦在线观看| 国产爽快片一区二区三区| 亚洲自偷自拍三级| 国产毛片在线视频| 能在线免费看毛片的网站| 美女大奶头黄色视频| 美女视频免费永久观看网站| 一本色道久久久久久精品综合| 少妇被粗大的猛进出69影院 | 欧美日韩视频精品一区| 老女人水多毛片| 日韩av免费高清视频| 久久久久久久久久成人| 夜夜骑夜夜射夜夜干| 男人舔奶头视频| 亚洲人成网站在线播| 在线观看三级黄色| 在线精品无人区一区二区三| 婷婷色综合www| 日日啪夜夜撸| 久久精品国产亚洲av天美| 2018国产大陆天天弄谢| 精品少妇黑人巨大在线播放| 高清欧美精品videossex| 汤姆久久久久久久影院中文字幕| 丝瓜视频免费看黄片| 少妇的逼好多水| 精品人妻熟女毛片av久久网站| 一本久久精品| 一区二区三区精品91| 国产乱人偷精品视频| 免费av中文字幕在线| av有码第一页| 久久久久精品性色| 少妇丰满av| 国产淫语在线视频| 久久6这里有精品| 精品国产露脸久久av麻豆| 少妇人妻精品综合一区二区| 一区二区av电影网| 少妇的逼水好多| 毛片一级片免费看久久久久| 精品人妻偷拍中文字幕| 国产爽快片一区二区三区| 九色成人免费人妻av| 99国产精品免费福利视频| 最近手机中文字幕大全| 免费高清在线观看视频在线观看| 久久精品国产a三级三级三级| 欧美国产精品一级二级三级 | 成年人午夜在线观看视频| 一区二区三区精品91| videos熟女内射| 在线观看国产h片| 亚洲成人av在线免费| 99热6这里只有精品| 九九久久精品国产亚洲av麻豆| 人妻 亚洲 视频| 男男h啪啪无遮挡| 久久久亚洲精品成人影院| 内地一区二区视频在线| 国产精品免费大片| 三级经典国产精品| 亚洲精品第二区| 日本vs欧美在线观看视频 | 亚洲成人手机| 亚洲精品日韩在线中文字幕| 极品少妇高潮喷水抽搐| 一级二级三级毛片免费看| 插逼视频在线观看| 韩国高清视频一区二区三区| 亚洲av.av天堂| 欧美高清成人免费视频www| 欧美日韩国产mv在线观看视频| 最新的欧美精品一区二区| 精品亚洲成a人片在线观看| 我要看日韩黄色一级片| 色网站视频免费| 韩国高清视频一区二区三区| 国产欧美另类精品又又久久亚洲欧美| 一个人看视频在线观看www免费| 老司机亚洲免费影院| 日本午夜av视频| 久久国产精品男人的天堂亚洲 | 日韩强制内射视频| 九九在线视频观看精品| 婷婷色av中文字幕| 高清av免费在线| 国产精品.久久久| 亚洲欧美日韩另类电影网站| 一级毛片 在线播放| 欧美+日韩+精品| 亚洲精品日本国产第一区| 日韩伦理黄色片| 久久久精品免费免费高清| 99九九在线精品视频 | 老熟女久久久| 成人18禁高潮啪啪吃奶动态图 | a级毛片在线看网站| 丰满饥渴人妻一区二区三| 黑人高潮一二区| 国产欧美亚洲国产| 51国产日韩欧美| 99久久中文字幕三级久久日本| 亚洲性久久影院| 久久久久网色| 国产伦精品一区二区三区视频9| 91精品一卡2卡3卡4卡| 大香蕉97超碰在线| 国产欧美日韩综合在线一区二区 | 五月玫瑰六月丁香| 精品酒店卫生间| 久久久久国产精品人妻一区二区| 一区在线观看完整版| 中文字幕人妻熟人妻熟丝袜美| 亚洲欧洲日产国产| 岛国毛片在线播放| 一级黄片播放器| 日韩中文字幕视频在线看片| 国产在线免费精品| 99热全是精品| xxx大片免费视频| 熟女av电影| av卡一久久| 永久免费av网站大全| 99久久人妻综合| 青青草视频在线视频观看| 亚洲成人av在线免费| 黄色视频在线播放观看不卡| 亚洲熟女精品中文字幕| 秋霞伦理黄片| 一本久久精品| 国产一区二区在线观看日韩| 国产成人午夜福利电影在线观看| 中文字幕精品免费在线观看视频 | 国产黄色免费在线视频| 又黄又爽又刺激的免费视频.| 久久6这里有精品| 免费高清在线观看视频在线观看| 日韩视频在线欧美| 久久午夜福利片| 国产午夜精品久久久久久一区二区三区| 日韩精品免费视频一区二区三区 |