• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于文本相似度的智能查號(hào)引擎研究

    2018-05-14 12:19喬世權(quán)戴繼勇
    關(guān)鍵詞:分詞

    喬世權(quán) 戴繼勇

    摘 要:為了幫助電話人工客服座席提供不間斷地、質(zhì)量穩(wěn)定的服務(wù),有必要研發(fā)智能查號(hào)引擎。基于最長公共子序列算法和最長公共子元素序列算法的研究,提出了短文本相似度計(jì)算算法,以提高查號(hào)的準(zhǔn)確性,并以此為基礎(chǔ),設(shè)計(jì)出智能查號(hào)搜索引擎系統(tǒng)及其實(shí)現(xiàn)方法??紤]到實(shí)際需求,通過自然語言處理中的分詞、簡稱替換、同義詞替換、構(gòu)建停用詞表等,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;通過基于HowNet和同義詞詞林的相似計(jì)算,完成進(jìn)一步的數(shù)據(jù)處理;對(duì)外提供遵循REST規(guī)范的API接口。實(shí)驗(yàn)表明,智能查號(hào)引擎的設(shè)計(jì)可行,具有較好的業(yè)務(wù)處理能力,可滿足用戶需求;同時(shí),也存在一些問題,有待于進(jìn)一步的改進(jìn)。智能查號(hào)引擎可以提供24 h不間斷服務(wù),相對(duì)于人工服務(wù),具有更高的查號(hào)效率和更穩(wěn)定的高質(zhì)服務(wù),可為智能電話客服的發(fā)展提供借鑒。

    關(guān)鍵詞:計(jì)算機(jī)信息管理系統(tǒng);文本相似度;分詞;停用詞;同義詞;查號(hào)引擎

    中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A

    文章編號(hào):1008-1542(2018)03-0282-07

    當(dāng)今是一個(gè)高度信息化的時(shí)代,目前搜索引擎可以為大家提供方便的信息查詢功能,但是在查詢電話號(hào)碼方面還有其不足之處,例如:網(wǎng)絡(luò)查詢時(shí)會(huì)得到大量的相關(guān)信息,需要人工挑揀需要的電話信息,并且在查詢信息中,還可能存在詐騙電話。因此撥打查詢電話是獲取準(zhǔn)確單位電話的最有保障的方式。由于人工電話查詢存在著單任務(wù)、速度慢并且不能提供不間斷、穩(wěn)定質(zhì)量服務(wù)的特點(diǎn),研發(fā)基于自然語言的對(duì)話引擎是很有必要的。對(duì)話引擎針對(duì)用戶提出的問題返回的不是一些相關(guān)的信息列表,而是一個(gè)精準(zhǔn)的答案,從而能夠省去用戶從信息列表當(dāng)中篩選信息所耗費(fèi)的時(shí)間和精力。

    目前針對(duì)智能客服方面的研究主要集中在人機(jī)對(duì)話[1]、智能服務(wù)機(jī)器人[2]等領(lǐng)域,研究內(nèi)容大部分是對(duì)自然語言的理解和處理上,而針對(duì)電話查詢業(yè)務(wù)的智能客服研究甚少。本文利用文本相似度算法,通過數(shù)據(jù)預(yù)處理、停用詞表和同義詞庫構(gòu)建完成實(shí)現(xiàn)智能查號(hào)的搜索引擎設(shè)計(jì)。

    1 數(shù)據(jù)預(yù)處理

    當(dāng)用戶表達(dá)一種需求的時(shí)候可能存在多種描述形式,每種描述形式呈現(xiàn)在文本中就會(huì)存在差異,例如“河北科技大學(xué)的地址”和“河北科技大學(xué)在哪兒”,雖然表述方式不同,但是表達(dá)的都是同一種意思,將同一語義的不同表述方式歸化為同一種表述方式即為語義歸一化,本文采用了簡稱替換和同義詞替換兩種語義歸一化操作,同時(shí)借助設(shè)定的規(guī)則模板,完成對(duì)核心查詢?cè)~的抽取工作。

    1.1 分詞與簡稱替換

    本文采用開源的分詞工具:先進(jìn)行原子切分,然后在此基礎(chǔ)上進(jìn)行N-最短路徑粗切分,找出前N個(gè)最符合的切分結(jié)果,生成二元分詞表,然后生成分詞結(jié)果,接著進(jìn)行詞性標(biāo)注并完成主要分詞步驟[3]。例如,給定一個(gè)問題“幫我查詢一下河北科技大學(xué)教務(wù)處的電話”,將“科技大學(xué)”和“教務(wù)處”人工標(biāo)注為自定義詞典,對(duì)其進(jìn)行分詞的結(jié)果為{幫/v}{我/n}{查詢/v}{一/num}{下/quant}{河北/ns}{科技大學(xué)/user-defined}{教務(wù)處/user-defined}{的/uj}{電話/n}。其中“/*”代表詞性,“/user-defined”為自定義詞性。

    簡稱,是指抽出原詞語中的共同部分,或概括原來幾個(gè)詞語表示的事物的共性[4]組成的短語。簡稱更多的時(shí)候會(huì)被用在口語化的表達(dá)中。在問答系統(tǒng)中,用戶輸入的簡稱表達(dá)不僅會(huì)省略想要表達(dá)的部分語義,甚至?xí)驗(yàn)榧?xì)小的差別而導(dǎo)致語義理解的錯(cuò)誤。所以在對(duì)用戶輸入文本做相似度計(jì)算的時(shí)候,將簡稱替換為全稱是很有必要的。

    表1為通過對(duì)日志和原始數(shù)據(jù)的分析整理得出部分簡稱替換數(shù)據(jù),其中簡稱欄為用戶常用的簡稱表達(dá)方式,全稱為對(duì)應(yīng)的全稱表達(dá)方式。

    簡稱替換機(jī)制是用在對(duì)話引擎的文本輸入部分,用在停用詞處理之前,通過將用戶的輸入與簡稱替換表中的簡稱進(jìn)行匹配,匹配成功則替換為對(duì)應(yīng)的簡稱。

    1.2 基礎(chǔ)詞法分析

    基礎(chǔ)詞法是對(duì)用戶輸入的中文文本的處理程序,主要是依據(jù)已有的基礎(chǔ)詞庫和自定義詞庫對(duì)用戶輸入進(jìn)行處理。該部分對(duì)中文的處理都是基于語音識(shí)別結(jié)果較好的中文詞語進(jìn)行,例如“大學(xué)”“公安局”“酒店”“賓館”等詞語都是用戶能夠表達(dá)清楚并且語音識(shí)別效果較好的詞匯,依據(jù)這些能夠識(shí)別準(zhǔn)確的詞匯,實(shí)現(xiàn)了觸發(fā)詞的機(jī)制,該機(jī)制的思想是:當(dāng)用戶輸入了能夠代表其語義目的的詞匯時(shí),就會(huì)自動(dòng)觸發(fā)該機(jī)制,并在給用戶的回復(fù)當(dāng)中優(yōu)先回復(fù)該觸發(fā)詞對(duì)應(yīng)的單位信息。

    觸發(fā)詞機(jī)制的數(shù)據(jù)是以文件的形式存儲(chǔ)在TXT文檔中,有3列數(shù)據(jù)并以空格隔開,存儲(chǔ)結(jié)構(gòu)如表2所示。

    其中觸發(fā)詞的定義規(guī)則為每一列之間用空格隔開,當(dāng)有多個(gè)觸發(fā)詞時(shí)使用“|”隔開,當(dāng)需要多個(gè)觸發(fā)詞同時(shí)生效才觸發(fā)時(shí),使用“*”號(hào)隔開,其中“*”號(hào)匹配任何長度的任何字符串。例如當(dāng)用戶輸入“幫我查下科大教務(wù)處的電話”或者“幫我查下科技大學(xué)”時(shí),就會(huì)觸發(fā)“科*大”這個(gè)觸發(fā)詞,并在系統(tǒng)回復(fù)當(dāng)中優(yōu)先回復(fù)這條電話號(hào)碼。

    1.3 短文本相似度計(jì)算算法

    文本相似度是兩個(gè)文本之間相似匹配程度的重要參考指標(biāo)[5],目前大多數(shù)的文本相似度算法[6]主要是基于統(tǒng)計(jì)和語義的方法,其相似度對(duì)象主要是中文文字或者詞語,而由于本文研究課題的特殊性,提出基于拼音最長公共子序列的文本相似度計(jì)算算法。

    1.3.1 最長公共子序列算法

    由式(1)可計(jì)算得出兩個(gè)字符串的最長公共子序列長度。

    1.3.2 最長公共子元素序列算法

    1.3.3 短文本相似度計(jì)算

    對(duì)話引擎的輸入文本是電話語音識(shí)別成文本的結(jié)果,而電話語音識(shí)別成文本的效果往往并不是很好,一方面原因是電話語音采集的質(zhì)量本身就比大多數(shù)電子設(shè)備的語音采集質(zhì)量差,另一方面的原因是不同地區(qū)用戶,乃至同一地區(qū)不同用戶的口音也會(huì)存在差別,口語的語音轉(zhuǎn)文本會(huì)受用戶普通話標(biāo)準(zhǔn)程度的影響。通過測(cè)試發(fā)現(xiàn),雖然語音轉(zhuǎn)寫的大多數(shù)漢字都不準(zhǔn)確,但是大致的音還是能識(shí)別對(duì)的,即同音不同字。為了解決這個(gè)問題,本文采取的是將漢字文本轉(zhuǎn)寫為拼音后的文本相似度計(jì)算,其中參與相似度計(jì)算的文本的基本單位是一個(gè)漢字或者數(shù)字或者英文字母的拼音表示,以下所有提到參與相似度計(jì)算的文本的基本單位都是一個(gè)拼音字符串。

    在數(shù)據(jù)庫中,用于信息檢索的字段為3~15個(gè)字符的單位名稱,而通過對(duì)用戶輸入文本的預(yù)處理,最終形成大概5~20個(gè)字符的文本,通過計(jì)算用戶輸入的內(nèi)容與數(shù)據(jù)庫中單位名稱字段文本的相似度,給出相似度的排序列表并最終選出一個(gè)最優(yōu)解?;谶@樣的需求和對(duì)前兩節(jié)內(nèi)容的研究,本文提出了一種文本相似度計(jì)算方法:文本的相似度與兩個(gè)文本的長度成反比關(guān)系,與兩個(gè)文本的最長公共子序列的長度成正比關(guān)系。由此可得出公式

    1.4 停用詞表及同義詞庫構(gòu)建

    1.4.1 停用詞表構(gòu)建

    正確理解用戶輸入問題的語義是影響對(duì)話引擎效果好壞的關(guān)鍵,而由于用戶輸入內(nèi)容的不可控性,除了能正確表達(dá)用戶意圖的文本,還會(huì)有許多的干擾因素,稱之為噪音詞[16]。文本預(yù)處理就是在通過技術(shù)手段消除噪音詞、提取核心語義文本的過程。

    停用詞(Stop Word)[17-18]是指在進(jìn)行語義理解或者相似度計(jì)算當(dāng)中,在輸入的文本當(dāng)中出現(xiàn)頻率很高但是在信息檢索的時(shí)候幾乎不起任何作用甚至?xí)鸬礁蓴_作用的詞語,如“的”、“啦”、“呀”等詞語。但是在對(duì)話引擎或者問答系統(tǒng)當(dāng)中,停用詞并不是唯一的,停用詞會(huì)因?yàn)槠鋺?yīng)用場(chǎng)景或者問題的不同而動(dòng)態(tài)的改變[19]。

    本文構(gòu)建的停用詞表分為絕對(duì)停用詞和相對(duì)停用詞。

    1) 絕對(duì)停用詞是不考慮停用詞所在文本中的上下文語義必須過濾的停用詞;

    2) 相對(duì)停用詞是需要考慮停用詞在上下文語境中的成分、位置的停用詞,只在特定語境下才會(huì)觸發(fā)該停用詞。

    在構(gòu)建停用詞的時(shí)候本文引入了熵計(jì)算[20]的概念,熵計(jì)算是一個(gè)基于詞語出現(xiàn)的平均信息量,對(duì)詞的有效性進(jìn)行計(jì)算

    在同一個(gè)文本當(dāng)中,P(Wi|W)為貝葉斯公式原理,表示詞語W出現(xiàn)的情況下,Wi出現(xiàn)的概率。通過對(duì)多個(gè)文本進(jìn)行分詞統(tǒng)計(jì)詞頻的計(jì)算,可得出某一停用詞出現(xiàn)的情況下,其他詞語出現(xiàn)的概率,從而可以得出在同一個(gè)文本當(dāng)中兩個(gè)詞之間的語義關(guān)聯(lián)。

    其中原始數(shù)據(jù)進(jìn)行分詞處理是對(duì)原始名稱、地址處理,這兩個(gè)字段的內(nèi)容代表著該單位名稱語義的核心內(nèi)容,此外,由于原始數(shù)據(jù)和日志數(shù)據(jù)的不規(guī)范性,最終確定停用詞表的規(guī)模在100個(gè)詞語以后,對(duì)于最終停用詞表的確定需要一定工作量的人工標(biāo)注以確保準(zhǔn)確性。

    1.4.2 同義詞庫的構(gòu)建

    同義詞是指詞匯意義相同或者相近的詞語。一般情況下同義詞都會(huì)是兩個(gè)詞語中間有一個(gè)或者幾個(gè)字重復(fù)或者重音的,例如“地址”和“地點(diǎn)”,“發(fā)現(xiàn)”和“發(fā)覺”。同義詞所表達(dá)的基本意義相同,會(huì)因不同的表達(dá)習(xí)慣和場(chǎng)合而有所不同。

    詞語相似度計(jì)算在許多領(lǐng)域如信息檢索、信息抽取、問答系統(tǒng)、詞義消歧、多文檔文摘系統(tǒng)等都有著非常廣泛的應(yīng)用。它可以表示為兩個(gè)詞語在同一個(gè)文本當(dāng)中可以相互替換而不改變文本原來含義的程度。由于網(wǎng)絡(luò)資源的不規(guī)范性,需要對(duì)一些差別比較大的同義詞進(jìn)行過濾。本文采取的是以數(shù)據(jù)分詞結(jié)果作為主詞通過網(wǎng)絡(luò)爬蟲的方式構(gòu)建同義詞庫,并通過計(jì)算詞語相似度的方式對(duì)同義詞的近義程度進(jìn)行數(shù)據(jù)化表示。

    同義詞替換[21]機(jī)制是用在停用詞替換之后,同義詞替換過程流程圖如圖2所示。將用戶輸入進(jìn)行分詞和詞性標(biāo)注之后,通過這兩個(gè)屬性分別與同義詞庫當(dāng)中的同義詞節(jié)點(diǎn)進(jìn)行比對(duì),首先與主詞進(jìn)行比對(duì),匹配成功則不進(jìn)行任何操作循環(huán)進(jìn)行下一個(gè)詞語的匹配;與主詞匹配不成功則與副詞進(jìn)行匹配,匹配成功則替換成對(duì)應(yīng)的主詞,匹配不成功則進(jìn)行下一個(gè)詞語的匹配,直到同義詞替換完成返回替換后的結(jié)果。

    2 智能查號(hào)引擎設(shè)計(jì)

    2.1 單位信息查詢

    單位信息查詢是基于文本相似度的計(jì)算和排序機(jī)制實(shí)現(xiàn)的,其中相似度的計(jì)算包括漢字和拼音相似度計(jì)算。文本相似度的計(jì)算會(huì)將用戶的問句通過文本研究的相似度計(jì)算算法與語義分析得出的場(chǎng)景知識(shí)庫中的數(shù)據(jù)一一進(jìn)行計(jì)算,其中計(jì)算的兩個(gè)文本相似度的因素主要有3個(gè),如表3所示。

    在漢字的語義相似度計(jì)算當(dāng)中,如果經(jīng)過分詞之后觸發(fā)了觸發(fā)詞機(jī)制,則會(huì)把觸發(fā)詞對(duì)應(yīng)的單位名稱的

    名稱相似度、地址相似度和部門相似度全部設(shè)為最

    高值,在系統(tǒng)回復(fù)的過程中優(yōu)先回復(fù)本條信息。

    對(duì)于單位名稱的相似度計(jì)算是使用基于主文本長度的相似度計(jì)算算法,對(duì)于地址和部門信息的相似度計(jì)算是使用基于關(guān)鍵字匹配的相似度計(jì)算算法。

    計(jì)算完相似度之后,會(huì)根據(jù)每條數(shù)據(jù)的單位名稱相似度、地址信息相似度和部門信息相似度對(duì)已有的場(chǎng)景知識(shí)庫數(shù)據(jù)進(jìn)行排序,并得出最優(yōu)解。對(duì)最優(yōu)解答案的排序規(guī)則如下:

    1)通過對(duì)名稱相似度的計(jì)算,按照單位名稱的相似度評(píng)分進(jìn)行排序,取前若干條中單位名稱相同但部門和地址不同的數(shù)據(jù)得到一個(gè)通過單位名稱評(píng)分排序的列表;

    2)在經(jīng)過第1次排序之后加入地址評(píng)分的考慮因素進(jìn)行二次排序,即相同單位名稱的情況中,地址評(píng)分較高者,將排序的位置調(diào)整到所在單位中最靠前的位置;

    3)再加入部門評(píng)分的考慮因素進(jìn)行第3次排序,在第2次排序結(jié)果的基礎(chǔ)上,單位名稱和地址信息都相同的情況下,部門評(píng)分較高者排序到最靠前的位置。

    如果部門評(píng)分都相同,即沒有匹配到部門信息的情況下,則按照設(shè)定好的優(yōu)先部門排序規(guī)則進(jìn)行排序。例如如果設(shè)定部門優(yōu)先排序規(guī)則為“辦公室、財(cái)務(wù)科、人事科”,則會(huì)優(yōu)先排序該單位中部門為“辦公室”的數(shù)據(jù),如果數(shù)據(jù)當(dāng)中沒有部門為“辦公室”的,則優(yōu)先排序部門為“財(cái)務(wù)科”的,以此類推。

    語義相似度排序流程圖如圖3所示。

    2.2 智能查號(hào)引擎的實(shí)現(xiàn)與性能分析

    在查號(hào)引擎測(cè)試中,測(cè)試并分析了1 000條數(shù)據(jù)分別請(qǐng)求對(duì)話。查號(hào)引擎的響應(yīng)時(shí)間分布圖如圖4所示,最快響應(yīng)時(shí)間為1 ms,最慢響應(yīng)時(shí)間為3 815 ms,平均響應(yīng)時(shí)間為282.353 ms,這個(gè)平均響應(yīng)時(shí)間完全可以滿足用戶的需求。

    3 結(jié) 語

    本文首先通過分詞、簡稱替換和單位名稱基礎(chǔ)分詞分析完成數(shù)據(jù)的預(yù)處理。構(gòu)建了停用詞表和同義詞庫,實(shí)現(xiàn)了對(duì)原始數(shù)據(jù)名稱、地址語義和部門語義的抽取。通過最長公共子序列、最長公共子元素序列、短文本相似度計(jì)算等算法實(shí)現(xiàn)了單位信息的查詢處理。利用文本相似度計(jì)算結(jié)合前期對(duì)數(shù)據(jù)的預(yù)處理,通過提供遵循REST規(guī)范的API接口來實(shí)現(xiàn)智能查號(hào),最終完成了智能查號(hào)引擎的設(shè)計(jì)。最后,對(duì)查號(hào)引擎響應(yīng)時(shí)間進(jìn)行了測(cè)試,分析了其業(yè)務(wù)處理能力。結(jié)果表明,智能查號(hào)引擎能夠滿足用戶的基本需求,

    可以提供24 h不間斷服務(wù),相對(duì)于人工服務(wù),具有更高的查號(hào)效率和更穩(wěn)定的高質(zhì)服務(wù),可為智能電話客服的發(fā)展提供借鑒。盡管如此,本研究在文本預(yù)處理階段需要做大量人工標(biāo)注工作,今后的研究方向是進(jìn)一步減少人工干預(yù),實(shí)現(xiàn)數(shù)據(jù)處理的自動(dòng)化。

    參考文獻(xiàn)/References:

    [1] 馬龍. 人機(jī)對(duì)話理解中聯(lián)合學(xué)習(xí)技術(shù)的研究與應(yīng)用[D].北京:北京郵電大學(xué),2017.

    MA Long. Research and Application on Joint Learning Technology in Spoken Language Understanding[D]. Beijing: Beijing University of Posts and Telecommunications,2017.

    [2] 谷鑫.微信公眾平臺(tái)客服機(jī)器人設(shè)計(jì)與實(shí)現(xiàn)[J].信息技術(shù),2017(5):166-169.

    GU Xin. Design and implementation of customer service robot on WeChat public platform[J].Information Technology,2017(5):166-169.

    [3] 王飛. 基于蟻群優(yōu)化的模糊文本聚類算法研究[D].鄭州:河南工業(yè)大學(xué),2010.

    WANG Fei. The Research on Fuzzy C-Means Documents Clustering Based on Ant Colony Optimization[D]. Zhengzhou: Henan University of Technology, 2010.

    [4] 劉麗彬.語言學(xué)視角下中西新聞報(bào)道的文體特征差異[J].新聞知識(shí),2013(5):28-29.

    LIU Libin. Differences in stylistic features between chinese and western news reports from the perspective of linguistics[J]. News Research, 2013(5):28-29.

    [5] 趙謙. 基于HowNet的短文本語義相似度計(jì)算方法研究[D].太原:太原理工大學(xué),2017.

    ZHAO Qian. Research on the Method of Semantic Similarity Calculation of Short Texts Based on HowNet[D]. Taiyuan: Taiyuan University of Technology, 2017.

    [6] ZHU Ganggao, CARLOS A I. Exploiting semantic similarity for named entity disambiguation in knowledge graphs[J]. Expert Systems with Applications,2018,101: 8-24.

    [7] 于海英. 程序代碼相似度識(shí)別的研究[D].呼和浩特:內(nèi)蒙古師范大學(xué),2006.

    YU Haiying. Research of Identifying Progam Code Similarity[D]. Hohhot: Inner Mongolia Normal University, 2006.

    [8] 孫燾,朱曉明.基于格代數(shù)的最長公共子序列近似求解[J].計(jì)算機(jī)科學(xué),2017,44(2):270-274.

    SUN Tao, ZHU Xiaoming. Computing longest common subsequences approximately based on lattice[J]. Computer Science,2017,44(2):270-274.

    [9] 林翠萍,吳揚(yáng)揚(yáng).采用改進(jìn)最長公共子序列的人名消歧[J].華僑大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,37(2):201-206.

    LIN Cuiping, WU Yangyang. Person name disambiguation based on revised longest common subsequence[J]. Journal of Huaqiao University(Natural Science),2016,37(2):201-206.

    [10]李城,沙俊淞,武文.基于最長公共子序列的微博謠言溯源研究[J].計(jì)算機(jī)與現(xiàn)代化,2018(1):107-112.

    LI Cheng, SHA Junsong, WU Wen. Research on origin of micro-blog rumors based on longest common subsequence[J]. Computer and Modernization, 2018(1):107-112.

    [11]TSENG Kuotsung, CHAN Desheng, YANG Changbiau,et al. Efficient merged longest common subsequence algorithms for similar sequences[J]. Theoretical Computer Science,2018,708:75-90.

    [12]劉鼎甲. 基于關(guān)系模型的語料庫查詢處理問題研究[D].秦皇島:燕山大學(xué),2015.

    LIU Dingjia. Issues on the Query Processing of Corpora Based on Relational Model[D]. Qinhuangdao:Yanshan University, 2015.

    [13]王鑒全. 基于概念圖挖掘的中文文本傾向性研究[D].大連:大連理工大學(xué),2012.

    WANG Jianquan. Chinese Sentiment Analysis Based on Comception Map Mining[D]. Dalian: Dalian University of Technology, 2012.

    [14]王先勝. XSemantic:基于語義擴(kuò)展的XML關(guān)鍵字檢索技術(shù)研究[D].上海:復(fù)旦大學(xué),2010.

    WANG Xiansheng. XSemantic: The Research of Keuword Search on XML Documents based on Keyword Expansion[D]. Shanghai: Fudan University, 2010.

    [15]王鑒全, 季紹波. 基于關(guān)聯(lián)規(guī)則的自動(dòng)構(gòu)詞算法研究[J]. 計(jì)算機(jī)科學(xué), 2014, 41(11):256-259.

    WANG Jianquan, JI Shaobo. Research and application on auto-word buiding[J].Computer Science, 2014, 41(11):256-259.

    [16]陳俊鵬. 詞義消歧中若干關(guān)鍵技術(shù)研究[D].武漢:武漢大學(xué),2012.

    CHEN Junpeng. The Reaearch of Several Key Technologies of Word Semse Disambiquation[D]. Wuhan: Wuhan University, 2012.

    [17]化柏林.知識(shí)抽取中的停用詞處理技術(shù)[J].現(xiàn)代圖書情報(bào)技術(shù),2007(8):48-51.

    HUA Bolin. Stop-word processing technique in knowledge extraction[J]. New Technology of Library and Information Service, 2007(8):48-51.

    [18]馬治濤. 文本分類停用詞處理和特征選擇技術(shù)研究[D].西安:西安電子科技大學(xué),2014.

    MA Zhitao. Research on Stop Words and Feature Selection for Text Classification[D].Xian: Xidian University,2014.

    [19]熊文新,宋柔.信息檢索用戶查詢語句的停用詞過濾[J].計(jì)算機(jī)工程,2007,33(6):195 -197.

    XIONG Wenxin, SONG Rou. Removal of stop word in users request for information retrieval[J]. Computer Engineering, 2007,33(6):195-197.

    [20]靳銳,張宏莉,張玥,等.中文公眾事件信息熵計(jì)算方法[J].軟件學(xué)報(bào),2016,27(11):2855-2869.

    JIN Rui, ZHANG Hongli, ZHANG Yue,et al. Calculation method of chinese public event information entropy[J].Journal of Software,2016,27(11):2855-2869.

    [21]胡毅君. 基于低失真替換的文本隱寫算法研究[D].長沙:長沙理工大學(xué),2015.

    HU Yijun.Research on Text Steganography based on Low Distortion Substitution[D].Changsha: Changsha University of Science & Technology,2015.

    猜你喜歡
    分詞
    分詞在英語教學(xué)中的妙用
    耶魯大學(xué)的52歲新生
    結(jié)巴分詞在詞云中的應(yīng)用
    結(jié)巴分詞在詞云中的應(yīng)用
    分詞做狀語的概念解析
    最大概率分詞方法研究
    高中階段出現(xiàn)的英語懸垂分詞
    分詞邏輯主語的理解與應(yīng)用
    現(xiàn)在分詞與過去分詞的主要區(qū)別在哪里?
    聚焦現(xiàn)在完成進(jìn)行時(shí)
    国产精品一国产av| 纯流量卡能插随身wifi吗| 少妇的逼水好多| 男女免费视频国产| 国产精品一国产av| 91精品国产国语对白视频| 狂野欧美激情性bbbbbb| 青春草视频在线免费观看| 国产成人精品福利久久| 日韩一本色道免费dvd| 日本午夜av视频| 国产日韩一区二区三区精品不卡| 亚洲欧美一区二区三区国产| 国产精品人妻久久久久久| 亚洲av欧美aⅴ国产| 黑人高潮一二区| 午夜91福利影院| 老司机影院成人| 国产亚洲一区二区精品| 国产无遮挡羞羞视频在线观看| 国产成人欧美| 亚洲精品一区蜜桃| 少妇的逼水好多| 久久av网站| 大陆偷拍与自拍| 国产福利在线免费观看视频| 精品福利永久在线观看| 一级毛片黄色毛片免费观看视频| 精品酒店卫生间| 久久av网站| 99re6热这里在线精品视频| 亚洲久久久国产精品| 久久久久久久久久久免费av| 久久久久久久久久人人人人人人| 亚洲国产日韩一区二区| 久久久久国产网址| 看十八女毛片水多多多| 少妇高潮的动态图| 韩国精品一区二区三区 | 久久这里有精品视频免费| 国产av一区二区精品久久| 日韩,欧美,国产一区二区三区| 免费高清在线观看日韩| 亚洲一码二码三码区别大吗| 97在线视频观看| 亚洲av免费高清在线观看| av在线老鸭窝| 一级毛片黄色毛片免费观看视频| 少妇的丰满在线观看| 一本久久精品| 免费人成在线观看视频色| 国产免费一级a男人的天堂| 日韩中文字幕视频在线看片| 亚洲精品国产av成人精品| av在线app专区| 亚洲成人av在线免费| 国产精品秋霞免费鲁丝片| 在线观看免费高清a一片| 久久人人97超碰香蕉20202| 国产成人精品福利久久| 日韩大片免费观看网站| 国产精品久久久久久精品电影小说| 日韩电影二区| 亚洲av国产av综合av卡| 黄片播放在线免费| 韩国高清视频一区二区三区| 国产在线视频一区二区| 国产一区二区在线观看av| 精品卡一卡二卡四卡免费| 亚洲美女搞黄在线观看| 黑丝袜美女国产一区| 极品人妻少妇av视频| 亚洲婷婷狠狠爱综合网| 国产又爽黄色视频| 国产免费一级a男人的天堂| 亚洲内射少妇av| 色婷婷久久久亚洲欧美| 亚洲人成网站在线观看播放| 美女主播在线视频| videossex国产| 丁香六月天网| 男女下面插进去视频免费观看 | 亚洲,欧美精品.| 国产黄色免费在线视频| 精品少妇久久久久久888优播| 亚洲精品456在线播放app| 国产欧美亚洲国产| 一本色道久久久久久精品综合| 2021少妇久久久久久久久久久| 欧美精品高潮呻吟av久久| 国产免费一级a男人的天堂| 国产亚洲午夜精品一区二区久久| 婷婷色av中文字幕| 国产成人精品在线电影| 少妇的逼好多水| 九色亚洲精品在线播放| 精品少妇黑人巨大在线播放| 99热国产这里只有精品6| 亚洲高清免费不卡视频| 久久精品熟女亚洲av麻豆精品| 日韩人妻精品一区2区三区| av一本久久久久| 妹子高潮喷水视频| 99国产综合亚洲精品| 爱豆传媒免费全集在线观看| 欧美成人午夜精品| 看十八女毛片水多多多| 国产精品免费大片| 久热久热在线精品观看| 久久女婷五月综合色啪小说| 久久久国产一区二区| 精品一区二区三区视频在线| 亚洲久久久国产精品| 成人国产麻豆网| 欧美日韩国产mv在线观看视频| 国产精品麻豆人妻色哟哟久久| 最近最新中文字幕大全免费视频 | 99国产精品免费福利视频| av福利片在线| 国产精品久久久久成人av| 青春草视频在线免费观看| 亚洲一区二区三区欧美精品| 美女福利国产在线| 国产色婷婷99| 午夜av观看不卡| 免费观看无遮挡的男女| 久久国产精品男人的天堂亚洲 | 中文字幕亚洲精品专区| 日本-黄色视频高清免费观看| 一级a做视频免费观看| 国产乱来视频区| 国产一区二区三区综合在线观看 | 亚洲精品久久成人aⅴ小说| 亚洲精品视频女| 男女边摸边吃奶| 黑人欧美特级aaaaaa片| 亚洲av在线观看美女高潮| 亚洲欧美精品自产自拍| 9色porny在线观看| 欧美精品高潮呻吟av久久| 日韩av在线免费看完整版不卡| 在线观看国产h片| 如何舔出高潮| 人体艺术视频欧美日本| 多毛熟女@视频| 亚洲成人一二三区av| 免费高清在线观看日韩| 成人18禁高潮啪啪吃奶动态图| 国产欧美日韩一区二区三区在线| 交换朋友夫妻互换小说| 亚洲,一卡二卡三卡| 乱码一卡2卡4卡精品| 久久久亚洲精品成人影院| 久久热在线av| 侵犯人妻中文字幕一二三四区| 日韩视频在线欧美| 尾随美女入室| 美女大奶头黄色视频| 婷婷色综合大香蕉| 欧美国产精品一级二级三级| 天美传媒精品一区二区| 卡戴珊不雅视频在线播放| 国产精品国产三级国产专区5o| 国产色婷婷99| 精品少妇黑人巨大在线播放| 在线天堂最新版资源| 26uuu在线亚洲综合色| 国产亚洲欧美精品永久| 中文字幕av电影在线播放| 欧美xxxx性猛交bbbb| 亚洲精品国产av蜜桃| 成年女人在线观看亚洲视频| 肉色欧美久久久久久久蜜桃| 一级毛片 在线播放| 青青草视频在线视频观看| 国产日韩欧美视频二区| 考比视频在线观看| 成年美女黄网站色视频大全免费| 99久久中文字幕三级久久日本| 又黄又粗又硬又大视频| 国产日韩欧美亚洲二区| 亚洲人成77777在线视频| 母亲3免费完整高清在线观看 | 最近中文字幕2019免费版| 丝袜人妻中文字幕| 大码成人一级视频| 卡戴珊不雅视频在线播放| 婷婷色av中文字幕| 色5月婷婷丁香| 欧美精品一区二区大全| www.色视频.com| 亚洲,一卡二卡三卡| 久久久久久人人人人人| 亚洲在久久综合| 日本与韩国留学比较| 亚洲婷婷狠狠爱综合网| 国产又色又爽无遮挡免| 久久久久视频综合| 另类精品久久| 欧美精品人与动牲交sv欧美| 丰满少妇做爰视频| 国产在线视频一区二区| 欧美精品av麻豆av| 亚洲欧美色中文字幕在线| 两性夫妻黄色片 | 成年人免费黄色播放视频| 最近最新中文字幕免费大全7| 欧美成人午夜精品| 在线看a的网站| 精品少妇久久久久久888优播| 在线观看一区二区三区激情| 人人妻人人澡人人看| 9热在线视频观看99| 少妇高潮的动态图| 免费大片18禁| 国产xxxxx性猛交| 国产熟女午夜一区二区三区| 下体分泌物呈黄色| 欧美日韩一区二区视频在线观看视频在线| 精品第一国产精品| 久热这里只有精品99| 国产极品粉嫩免费观看在线| 久久99热6这里只有精品| 99视频精品全部免费 在线| 两个人看的免费小视频| 久久久精品免费免费高清| 又大又黄又爽视频免费| 成人二区视频| 婷婷色麻豆天堂久久| 日韩欧美精品免费久久| 国产伦理片在线播放av一区| 有码 亚洲区| 韩国精品一区二区三区 | 韩国精品一区二区三区 | 内地一区二区视频在线| 男女边摸边吃奶| 在线观看美女被高潮喷水网站| 婷婷色av中文字幕| 久久久久久久久久人人人人人人| www.熟女人妻精品国产 | 精品一区在线观看国产| 久久国产精品男人的天堂亚洲 | 国产免费又黄又爽又色| 亚洲综合色惰| 中文字幕免费在线视频6| 国产永久视频网站| 99久久精品国产国产毛片| 精品少妇黑人巨大在线播放| 中文字幕最新亚洲高清| 国产一区有黄有色的免费视频| 亚洲熟女精品中文字幕| 黄网站色视频无遮挡免费观看| 中文字幕另类日韩欧美亚洲嫩草| 久久韩国三级中文字幕| 十八禁网站网址无遮挡| 9色porny在线观看| 国产不卡av网站在线观看| 成人国产av品久久久| 亚洲欧美日韩卡通动漫| 欧美+日韩+精品| 自拍欧美九色日韩亚洲蝌蚪91| 国产欧美日韩一区二区三区在线| 国产精品无大码| 国产片特级美女逼逼视频| 久久久久国产网址| 视频中文字幕在线观看| 欧美变态另类bdsm刘玥| 亚洲av福利一区| 在线亚洲精品国产二区图片欧美| 午夜av观看不卡| 97人妻天天添夜夜摸| 美女脱内裤让男人舔精品视频| 精品少妇久久久久久888优播| 久久精品aⅴ一区二区三区四区 | 精品第一国产精品| 亚洲人成网站在线观看播放| 国产视频首页在线观看| 80岁老熟妇乱子伦牲交| 亚洲内射少妇av| 极品少妇高潮喷水抽搐| 日韩不卡一区二区三区视频在线| 丝袜在线中文字幕| 如日韩欧美国产精品一区二区三区| 午夜激情av网站| 在线天堂最新版资源| 黄色毛片三级朝国网站| 欧美激情极品国产一区二区三区 | 女性生殖器流出的白浆| 亚洲,一卡二卡三卡| kizo精华| 亚洲精品国产色婷婷电影| 国产精品久久久av美女十八| 亚洲欧美成人综合另类久久久| 青春草国产在线视频| 亚洲精品aⅴ在线观看| 精品国产国语对白av| 国产一区二区三区综合在线观看 | 国产成人精品福利久久| 成人国语在线视频| 最近2019中文字幕mv第一页| 亚洲三级黄色毛片| 国产永久视频网站| 免费久久久久久久精品成人欧美视频 | 亚洲精品国产色婷婷电影| 水蜜桃什么品种好| 宅男免费午夜| 街头女战士在线观看网站| 久久影院123| 久久久精品区二区三区| 五月开心婷婷网| 亚洲国产av新网站| av国产久精品久网站免费入址| 国产淫语在线视频| freevideosex欧美| 国产综合精华液| 国产乱人偷精品视频| 纵有疾风起免费观看全集完整版| 久久影院123| 久久国产精品男人的天堂亚洲 | 午夜免费男女啪啪视频观看| 国产精品欧美亚洲77777| 夜夜爽夜夜爽视频| 日韩av免费高清视频| 精品亚洲成国产av| 爱豆传媒免费全集在线观看| 在线观看一区二区三区激情| 亚洲综合色网址| 国产乱人偷精品视频| 成人国产麻豆网| 女的被弄到高潮叫床怎么办| 99热国产这里只有精品6| 婷婷成人精品国产| 免费观看a级毛片全部| 天堂俺去俺来也www色官网| 久久久亚洲精品成人影院| 国产精品久久久久久精品电影小说| 亚洲欧美精品自产自拍| 精品一区二区三区视频在线| 免费观看在线日韩| 女性被躁到高潮视频| 欧美xxⅹ黑人| 曰老女人黄片| 一级,二级,三级黄色视频| 人妻少妇偷人精品九色| 1024视频免费在线观看| a级毛色黄片| 视频在线观看一区二区三区| 韩国av在线不卡| 亚洲av中文av极速乱| 熟女人妻精品中文字幕| 一级,二级,三级黄色视频| 欧美精品亚洲一区二区| 视频在线观看一区二区三区| 久久99热6这里只有精品| 国产极品天堂在线| 啦啦啦啦在线视频资源| 日本色播在线视频| 女人被躁到高潮嗷嗷叫费观| 成人国产麻豆网| 久久久久久人妻| 最新中文字幕久久久久| 亚洲av在线观看美女高潮| 人人妻人人澡人人看| 内地一区二区视频在线| 日日撸夜夜添| 久久久久久久亚洲中文字幕| 亚洲内射少妇av| 成年动漫av网址| 午夜久久久在线观看| 亚洲精品久久成人aⅴ小说| 精品久久国产蜜桃| 国产精品不卡视频一区二区| 国产综合精华液| 久久精品国产亚洲av涩爱| 国产精品女同一区二区软件| 黄色配什么色好看| 亚洲成人手机| 久久女婷五月综合色啪小说| 我要看黄色一级片免费的| 永久网站在线| 亚洲欧美一区二区三区国产| 免费人妻精品一区二区三区视频| 久久精品久久久久久久性| 制服诱惑二区| 18禁动态无遮挡网站| 国产极品粉嫩免费观看在线| av黄色大香蕉| 国产成人精品婷婷| 亚洲精华国产精华液的使用体验| 日本av手机在线免费观看| 久久鲁丝午夜福利片| 亚洲 欧美一区二区三区| 黄色配什么色好看| 最后的刺客免费高清国语| 日本免费在线观看一区| 男人爽女人下面视频在线观看| 欧美精品一区二区大全| 99热这里只有是精品在线观看| 两性夫妻黄色片 | 午夜日本视频在线| 国产精品久久久久久精品古装| 日本色播在线视频| 久久精品国产鲁丝片午夜精品| 一级毛片 在线播放| 久久久久久久亚洲中文字幕| 国国产精品蜜臀av免费| 午夜福利,免费看| 日本爱情动作片www.在线观看| 精品酒店卫生间| 精品卡一卡二卡四卡免费| 在线天堂最新版资源| 欧美国产精品va在线观看不卡| 精品福利永久在线观看| 国产亚洲一区二区精品| 又大又黄又爽视频免费| tube8黄色片| 九色成人免费人妻av| av视频免费观看在线观看| 制服人妻中文乱码| 亚洲精品美女久久av网站| 精品少妇内射三级| 肉色欧美久久久久久久蜜桃| 亚洲人与动物交配视频| 91aial.com中文字幕在线观看| 黄色 视频免费看| 精品国产一区二区久久| 少妇精品久久久久久久| 激情五月婷婷亚洲| 捣出白浆h1v1| 最后的刺客免费高清国语| 日本黄大片高清| 男人爽女人下面视频在线观看| 亚洲成人av在线免费| 高清不卡的av网站| 免费观看av网站的网址| 老司机亚洲免费影院| 90打野战视频偷拍视频| 少妇猛男粗大的猛烈进出视频| 九九在线视频观看精品| 国产黄色视频一区二区在线观看| 波多野结衣一区麻豆| 久久精品国产亚洲av天美| 日韩中文字幕视频在线看片| kizo精华| 91精品伊人久久大香线蕉| 你懂的网址亚洲精品在线观看| 国产精品久久久久久精品电影小说| 超色免费av| 18禁动态无遮挡网站| 亚洲av男天堂| 午夜免费观看性视频| 久久午夜综合久久蜜桃| 岛国毛片在线播放| 热99国产精品久久久久久7| a级毛片在线看网站| 国产精品久久久久久精品古装| 搡女人真爽免费视频火全软件| 精品亚洲成国产av| 国产亚洲最大av| 亚洲精品美女久久久久99蜜臀 | 中文天堂在线官网| 亚洲精品456在线播放app| 精品人妻一区二区三区麻豆| 亚洲成国产人片在线观看| 午夜福利乱码中文字幕| 最近中文字幕高清免费大全6| 夫妻性生交免费视频一级片| 久久久久网色| 国产精品成人在线| 极品少妇高潮喷水抽搐| 激情五月婷婷亚洲| 国产精品.久久久| 国产精品熟女久久久久浪| 国产极品天堂在线| 国产深夜福利视频在线观看| 日本猛色少妇xxxxx猛交久久| 久热这里只有精品99| 有码 亚洲区| 精品视频人人做人人爽| 2018国产大陆天天弄谢| 午夜福利视频在线观看免费| 少妇被粗大猛烈的视频| 亚洲av综合色区一区| 欧美亚洲 丝袜 人妻 在线| 狂野欧美激情性bbbbbb| 母亲3免费完整高清在线观看 | 久久综合国产亚洲精品| 亚洲欧美成人精品一区二区| 男女高潮啪啪啪动态图| 国产av一区二区精品久久| 九色成人免费人妻av| 欧美97在线视频| 大码成人一级视频| 亚洲国产毛片av蜜桃av| 亚洲av.av天堂| 久久精品国产a三级三级三级| 精品国产一区二区久久| 天天躁夜夜躁狠狠躁躁| 少妇被粗大猛烈的视频| 精品99又大又爽又粗少妇毛片| 久久精品国产自在天天线| 黄色 视频免费看| 男人操女人黄网站| 成人二区视频| 视频在线观看一区二区三区| 亚洲欧美中文字幕日韩二区| 国产av精品麻豆| 午夜福利视频精品| 大香蕉久久网| 色视频在线一区二区三区| 亚洲,欧美,日韩| 国产精品女同一区二区软件| 免费在线观看完整版高清| 两个人看的免费小视频| 深夜精品福利| 9色porny在线观看| 欧美激情国产日韩精品一区| 两个人看的免费小视频| 深夜精品福利| 看免费av毛片| 国产欧美亚洲国产| 国产免费视频播放在线视频| 90打野战视频偷拍视频| 99九九在线精品视频| 国产熟女欧美一区二区| 日本欧美国产在线视频| 纵有疾风起免费观看全集完整版| a 毛片基地| 亚洲一区二区三区欧美精品| 久久人人爽人人片av| av福利片在线| 亚洲精品久久成人aⅴ小说| 亚洲精品av麻豆狂野| 边亲边吃奶的免费视频| 女的被弄到高潮叫床怎么办| 有码 亚洲区| 日韩熟女老妇一区二区性免费视频| 欧美日韩av久久| 久久久久精品久久久久真实原创| 两个人免费观看高清视频| av卡一久久| 亚洲精品视频女| 日日啪夜夜爽| 中国国产av一级| 大陆偷拍与自拍| a级毛色黄片| 国产精品国产三级国产av玫瑰| 色5月婷婷丁香| 2021少妇久久久久久久久久久| 国产一区二区三区av在线| 日本欧美视频一区| 啦啦啦中文免费视频观看日本| 午夜福利网站1000一区二区三区| 狠狠精品人妻久久久久久综合| 国产亚洲欧美精品永久| 日韩熟女老妇一区二区性免费视频| 亚洲欧美一区二区三区国产| 亚洲国产精品专区欧美| 亚洲欧美成人精品一区二区| 一本大道久久a久久精品| 国产 一区精品| 久久狼人影院| 午夜福利视频精品| 汤姆久久久久久久影院中文字幕| 丁香六月天网| 青青草视频在线视频观看| 国产免费福利视频在线观看| 中文字幕制服av| 久久久精品94久久精品| 大陆偷拍与自拍| 欧美丝袜亚洲另类| 国产亚洲欧美精品永久| 90打野战视频偷拍视频| 99热这里只有是精品在线观看| 日韩三级伦理在线观看| 亚洲国产日韩一区二区| 亚洲欧美一区二区三区国产| 久久久久久伊人网av| 亚洲久久久国产精品| 久久久久精品性色| 亚洲国产av新网站| 人人妻人人爽人人添夜夜欢视频| 中文乱码字字幕精品一区二区三区| 日韩精品有码人妻一区| 亚洲人成网站在线观看播放| 国语对白做爰xxxⅹ性视频网站| 亚洲色图 男人天堂 中文字幕 | 一级毛片 在线播放| 不卡视频在线观看欧美| 国产黄色视频一区二区在线观看| 亚洲av.av天堂| 不卡视频在线观看欧美| 欧美xxxx性猛交bbbb| 99久久中文字幕三级久久日本| 久久久久精品人妻al黑| 国产 精品1| av免费在线看不卡| 看免费成人av毛片| 亚洲欧美日韩另类电影网站| 最近最新中文字幕免费大全7| 久久鲁丝午夜福利片| 在线免费观看不下载黄p国产| 99热网站在线观看| 久久久久精品人妻al黑| 最近的中文字幕免费完整| 免费不卡的大黄色大毛片视频在线观看| 免费大片黄手机在线观看| 99热全是精品| 国产男人的电影天堂91| 波野结衣二区三区在线| 999精品在线视频| 一级毛片电影观看| 午夜福利在线观看免费完整高清在| 国产爽快片一区二区三区| 9色porny在线观看|