• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種面向財務(wù)文本分類的TF-IDF改進算法

    2020-02-22 03:09:35孫德華孫晨
    現(xiàn)代信息科技 2020年18期
    關(guān)鍵詞:特征詞詞頻準(zhǔn)確率

    孫德華 孫晨

    摘? 要:結(jié)合財務(wù)文本特征,對TF-IDF方法在應(yīng)用到財務(wù)文本分類時的不足進行了分析,提出了一種新的特征詞權(quán)重計算方法(SNGTI-LFDF)。該算法以TF-IDF方法為基礎(chǔ),引入停用詞失效的N-Gram方法和特征詞位置詞頻因子,保留特征詞位置信息并改善了特征詞的權(quán)重分配。采用樸素貝葉斯方法對分類性能進行了驗證,實驗結(jié)果表明,相對于TF-IDF和同類改進算法TF-IDF-DL,SNGTI-LFDF方法取得了更高的準(zhǔn)確率、召回率和F1值。因此該算法在能較好地提高財務(wù)文本分類性能。

    關(guān)鍵詞:TF-IDF;N-Gram;位置因子;SNGTI-LFDF;財務(wù)文本分類

    中圖分類號:TP301.6? ? ? 文獻標(biāo)識碼:A 文章編號:2096-4706(2020)18-0107-05

    Abstract:Combining with the characteristics of financial texts,the TF-IDF algorithm was investigated for its shortcomings when applied to financial text classification,and a new algorithm for calculating the weight of feature words (SNGTI-LFDF) was proposed. This algorithm is based on TF-IDF method,and introduces the N-Gram method of invalid stop words and term frequency location factor,which retains the location information of the feature word and improves the weight distribution of the feature word. The Naive Bayes method is used to verify the classification performance. The experimental results show that compared with TF-IDF and the similar algorithm TF-IDF-DL,the SNGTI-LFDF method achieves higher accuracy,recall and F1 value. Therefore,the algorithm is better improving the performance of financial text classification.

    Keywords:TF-IDF;N-Gram;location factor;SNGTI-LFDF;financial text classification

    0? 引? 言

    隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)文本充斥著人們生活的方方面面,財務(wù)文本是網(wǎng)絡(luò)文本中的一大分支,在財務(wù)危機預(yù)測[1]、資本市場調(diào)研、企業(yè)管理等方面都有重要的指示作用。就財務(wù)文本的性質(zhì)和作用可以將其劃分為政策類財務(wù)文本、規(guī)章制度類財務(wù)文本、統(tǒng)計數(shù)據(jù)類財務(wù)文本。其中政策類財務(wù)文本是國家各行政部門、企業(yè)財務(wù)部門等針對財務(wù)狀況出臺的一系列財務(wù)管理的方針、政策,這類文本為個人和企業(yè)提供政策指引,做出更好的財務(wù)決策;規(guī)章制度類財務(wù)文本是各企業(yè)制定的符合企業(yè)發(fā)展的章程,對企業(yè)和財務(wù)工作者制定符合其發(fā)展的規(guī)章制度有很高的參考價值;統(tǒng)計數(shù)據(jù)類財務(wù)文本是符合客觀財務(wù)信息并能反映一段時間內(nèi)企業(yè)財務(wù)狀況的文本,統(tǒng)計類財務(wù)文本可以幫助規(guī)避投資風(fēng)險、預(yù)防財務(wù)詐騙等。然而在這個大數(shù)據(jù)時代下,各類財務(wù)錯綜復(fù)雜,使得我們很難快速準(zhǔn)確地找到所需類別的財務(wù)文本,由于缺乏信息資料進而造成損失。作者結(jié)合實習(xí)項目“財務(wù)機器人”的開發(fā),對智能財務(wù)機器人的實現(xiàn)進行了深入調(diào)研,智能財務(wù)機器人的實現(xiàn)要依據(jù)大量的已知類別的財務(wù)文本,通過學(xué)習(xí)每種類別的文本的特征,總結(jié)經(jīng)驗,實現(xiàn)智能化。因此如何快速準(zhǔn)確地對財務(wù)文本進行分類就成了一個待解決的課題,傳統(tǒng)的基于人工進行財務(wù)文本分類同時存在效率低下和人為失誤不可避免等問題。機器學(xué)習(xí)和人工智能技術(shù)的發(fā)展使得自動高效地進行財務(wù)文本分類[2]變成了可能,有效地改善了人工分類時所帶來的問題,它通過學(xué)習(xí)已標(biāo)記類別的文本集,建立文本特征詞與文本類別之間的關(guān)系模型,進而通過該模型對新的文本進行類別判定。

    對文本進行分類要遵循文本所具有的特征。本文擬根據(jù)財務(wù)文本特征定向的改進文本分類中常用的方法——TF-IDF算法[3],以較好地提升財務(wù)文本分類的性能。因此本文收集調(diào)研了大量的財務(wù)文本并對財務(wù)文本的特征總結(jié)為:

    (1)財務(wù)特征詞的不可分割性:財務(wù)特征詞又可叫作財務(wù)術(shù)語,不可分割性是指一旦分割就會偏離原詞所表達的含義。如“固定資產(chǎn)”雖然可以被拆分為“固定”和“資產(chǎn)”兩個有實際意義的詞,但是其已經(jīng)偏離了原特征詞所表示的含義;

    (2)財務(wù)文本結(jié)構(gòu)的嚴(yán)謹(jǐn)性:結(jié)構(gòu)的嚴(yán)謹(jǐn)性是指大多數(shù)財務(wù)文本都符合類似“總分總”這樣的文本特征,在文本始末都會出現(xiàn)對文本進行總結(jié)的內(nèi)容。

    TF-IDF算法是一種基于詞頻統(tǒng)計的特征權(quán)重計算方法,通過計算詞頻和逆文檔頻率來計算特征詞的權(quán)重,在應(yīng)用到文本分類時取得了良好的效果,但是傳統(tǒng)的TF-IDF方法還存在有明顯的缺陷,第一,依賴于特征詞提取的效果,在特征詞提取準(zhǔn)確率不高的情況下,分類性能較低;第二,未考慮特征詞出現(xiàn)的位置信息,默認(rèn)賦予所有特征詞同樣的權(quán)重。基于此,結(jié)合財務(wù)文本的特性,本文的主要工作為:

    (1)引入了基于去停用詞的N-Gram方法,在豐富特征詞的同時清除了無效特征詞帶來的影響;

    (2)引入特征詞位置因子,加重符合文本主題的特征詞的權(quán)重;

    (3)提出了基于N-Gram特征詞失效和位置因子和詞頻統(tǒng)計的TF-IDF方法(SNGTI-LFDF)并在財務(wù)數(shù)據(jù)集上取得了良好的效果。

    1? 相關(guān)工作

    為了考慮一個詞語對其上若干個詞語的依賴關(guān)系,Jestes[4]等人在2013年便提出了N-Gram的概念,N-Gram在保留詞匯的特征信息的同時也保留了特征詞的位置信息;文獻[5]將N-Gram方法用到計算機病毒特征碼的提取中,取得了較好的結(jié)果;文獻[6]在SQL注入檢測中結(jié)合N-Gram中提取SQL語句固定維數(shù)的特征向量,提高了檢測率降低了誤報率;文獻[7]將N-Gram模型結(jié)合卷積神經(jīng)網(wǎng)絡(luò),從而提升了短文本分類的分類性能。文獻[5-7]的結(jié)果表明,N-Gram方法與特定領(lǐng)域結(jié)合使用時,可以在一定程度上取得較好的效果。

    對于TF-IDF算法來說,其核心就是特征詞的權(quán)重計算,計算方式為:

    其中,wi,k為文本i中的第k個特征詞的權(quán)重。針對傳統(tǒng)的TF-IDF算法存在的不足,眾多學(xué)者都其進行了研究改進。文獻[8]通過改進特征詞權(quán)重計算,提出詞頻-逆重力矩計算方法,提升分類效果;文獻[9]引入去中心化詞頻因子和特征詞位置因子,加強特征權(quán)重的準(zhǔn)確性;文獻[10]將新詞納入TF-IDF的權(quán)重計算中,達到了特征降維的目的,提升了文本分類的效果;文獻[11-12]均引入權(quán)重影響因子,對TF-IDF算法的權(quán)重進行優(yōu)化,這些改進算法雖然提升了文本分類的準(zhǔn)確率,但其在應(yīng)用到財務(wù)文本分類時,由于未結(jié)合財務(wù)文本特征,還存在著一定的局限性。

    2? 改進的TF-IDF權(quán)重計算方法

    2.1? 基于停用詞失效的N-Gram方法

    N-Gram方法是從一個句子中提取連續(xù)的N個字的字符串集合,可以獲取到字的前后信息的同時還可以提高特征詞提取的豐富程度。例如“資產(chǎn)轉(zhuǎn)移手段”,如果按照傳統(tǒng)的TF-IDF涉及的關(guān)鍵詞計算過程,其關(guān)鍵詞信息只有“資產(chǎn)、轉(zhuǎn)移、手段”,但結(jié)合N-Gram方法進行詞匯特征的選取,以2-Gram為例,程序和執(zhí)行結(jié)果如下所示:

    In[1]: content = “資產(chǎn)轉(zhuǎn)移的手段”

    ...: ls_word = list(content)

    ...: bigram = []

    ...: for i in range(len(ls_word)-1):

    ...:? ? word = “”

    ...:? ? ?for j in range(i,i+2):

    ...:? ? ? ? ?word+=ls_word[j]

    ...:? ? ?bigram.append(word)

    ...: print(bigram)

    [“資產(chǎn)”,“產(chǎn)轉(zhuǎn)”,“轉(zhuǎn)移”,“移的”,“的手”,“手段”]

    由以上結(jié)果可以看出,原來僅有的3個特征詞,經(jīng)過2-Gram的處理變長到了6個,特征詞的豐富程度得到了極大的提升,但這種方式也帶來了無效特征詞的干擾,如上述結(jié)果中的“產(chǎn)轉(zhuǎn)、移的、的手”,這類特征詞不僅不具備特定的意義而且還會對文本處理的結(jié)果產(chǎn)生干擾,影響文本分類的性能。其中部分的無效特征詞可以通過一定的手段將其識別并從特征詞分詞表中刪除,如“移的、的手”兩詞都包含有字符“的”,而“的”通常是描述定語和形容詞之間的修飾關(guān)系,與其組成的詞在語義上無任何意義,相同的一類詞在文本中經(jīng)常出現(xiàn)的還有“是、為、也、了、個”等,與這些詞組成的特征詞在語義上無任何意義,因而又被稱為停用詞。停用詞失效是指一個特征詞如果包含有停用詞,那么這個特征詞是無意義的,對文本分類結(jié)果產(chǎn)生負(fù)面影響。

    基于停用詞失效的N-Gram方法就是在使用N-Gram方法進行特征詞劃分選取時,對特征詞是否包含停用詞進行判別,判別公式如式(2)所示:

    其中,termi,k指文本i中的第k個特征詞,validi,k第k個特征詞的有效性,stw指停用詞。

    其具體步驟為:

    (1)使用N-Gram方法對文本處理得到一個特征詞集合TC;

    (2)使用式(2)對TC中的第k個特征詞進行有效性判定,結(jié)果為True則轉(zhuǎn)到步驟(3);若結(jié)果為False,轉(zhuǎn)到(4);

    (3)從TC移除當(dāng)前的第k個特征詞,TC長度減1;

    (4)k加1,轉(zhuǎn)到(2),直到k值等于TC的長度,結(jié)束處理過程。

    2.2? 特征詞位置詞頻影響因子

    在財務(wù)文檔中,大多數(shù)文檔都符合中文文本“總分總”的結(jié)構(gòu),即在文本的開始和末尾都會包含符合文本主題的特征詞信息,這類特征詞對文本較為重要,應(yīng)該賦予更高的權(quán)重,所以本文將特征詞的位置信息作為特征詞權(quán)重調(diào)節(jié)的重要影響因子。以1為度量單位,將所有的特征詞以第一次出現(xiàn)的位置排列成一個序列,取文本序列最中間的位置為原點,建立二維直角坐標(biāo)系,x軸存儲特征詞的相對位置信息,y軸存儲特征詞的詞頻(Term Frequency,TF)信息,以原點為基礎(chǔ),計算其他特征詞與原點的距離(x軸絕對距離),距離越大,說明其越是位于文本的開始或者末尾,應(yīng)該賦予更高的權(quán)重。在一份文檔中,文本的開始和末尾包含有若干特征詞,特征詞的TF值可以客觀地反映特征詞對文本的重要程度,將特征詞位置因子和詞頻因子結(jié)合,距離越遠、頻次越高的特征詞對文本更重要,應(yīng)賦予更高的權(quán)重。但在實際處理過程中,會出現(xiàn)某個特征詞在長文本中出現(xiàn)的頻次比短文本中出現(xiàn)頻次高,產(chǎn)生偏袒長文本的現(xiàn)象,因此需要對TF值進行規(guī)范化處理,通過取特征詞的詞頻和文本中特征詞的總數(shù)的比值定義規(guī)范化公式如式(3)所示:

    其中,RTFi,x為規(guī)范化處理后的詞頻值,結(jié)果取兩位小數(shù)點,Mi為文本i包含的特征詞的總數(shù),TFi,x為文檔i中位置x的特征詞的詞頻。

    將位置因子和詞頻因子結(jié)合,定義位置詞頻(Location Factor Term Frequency,LFDF)影響因子,要增加的文本i中x位置的權(quán)重LFDF值計算如式(4)所示:

    其中,ε為權(quán)重值倍數(shù),范圍在(1,+)之間,η的范圍在(0,D/2)之間,D為序列總長度。

    2.3? SNGTI-LFDF算法

    將基于停用詞失效的N-Gram方法與特征詞位置詞頻影響因子相結(jié)合,定義基于停用詞失效和改進TF-IDF算法的特征詞權(quán)重計算算法(SNGTI-LFDF),算法步驟為:

    (1)引入N-Gram模型,使用2.1章節(jié)的方法對特征詞集處理,得到一個有效特征詞集合;

    (2)引入特征詞位置詞頻影響因子,使用式(4)計算特征詞的LFDF值;

    (3)將特征詞的位置詞頻影響因子納入TF-IDF權(quán)重計算公式中,最終得到SNGTI-LFDF公式,由式(1)和式(4)得:

    其中,weighti,k為由SNGTI-LFDF算法計算的文本i中第k個特征詞的權(quán)重值。

    3? 實驗與結(jié)果分析

    3.1? 實驗數(shù)據(jù)

    目前公開的數(shù)據(jù)集中少有中文財務(wù)文本檔,本文從國內(nèi)一些財經(jīng)網(wǎng)站和相關(guān)金融媒體微博、公眾號等搜集整理了一個包含3 720條數(shù)據(jù)的財務(wù)文本集,其數(shù)據(jù)遵循的格式為:

    差旅費用報銷管理制度

    為了保證出差人員工作和生活的需要,合理使用差旅費用,提高出差效率,特制定差旅費用報銷管理制度。

    交通工具按標(biāo)準(zhǔn)乘坐,采用實報實銷制……

    ……

    差旅費用報銷制度即日起施行

    同時,對獲取的文檔進行分類處理,將其劃分為政策類、統(tǒng)計類、制度類三種類型的文本,各類文本的測試集和訓(xùn)練集數(shù)量的劃分如表1所示。

    3.2? 實驗步驟

    本文采用傳統(tǒng)的TF-IDF算法、文獻[8]中的TF-IDF-DL算法和SNGTI-LFDF算法進行特征詞權(quán)重計算。并使用樸素貝葉斯方法實現(xiàn)對文本的分類,結(jié)合實驗結(jié)果進行分析,具體實驗步驟為:

    (1)提取特征詞并將生成的特征詞轉(zhuǎn)化詞頻向量;

    (2)分別采用傳統(tǒng)TF-IDF、TF-IDF-DL和SNGTI-LFDF算法對特征詞的權(quán)重進行計算,選取權(quán)重最高的M個特征詞;

    (3)將訓(xùn)練集文本的特征詞送入到樸素貝葉斯分類器,訓(xùn)練分類器模型;

    (4)對測試文本按照樸素貝葉斯理論[13]進行相似度的計算,對最后相似度的大小排序,選擇相似度最大的作為待分類文本的類別;

    (5)對比分析實驗結(jié)果。使用準(zhǔn)確率、召回率、和F1值作為分類器性能的評估指標(biāo)。其中準(zhǔn)確率指分類結(jié)果中正確分類為A類別的樣本數(shù)占所有分類為A類別的樣本數(shù)的比例;召回率指分類結(jié)果中正確分類為A類別的樣本數(shù)占實際為A類別的樣本數(shù)的比例;F1值為準(zhǔn)確率和召回率的調(diào)和平均值。

    3.3? 實驗對比

    采用SNGTI-LFDF算法進行特征詞權(quán)重計算時,首先需要計算出需要選取的N-Gram方法中的N值來完成特征詞的劃分。由于N-Gram方法也適用于所有的權(quán)重計算方法,本文采用TF-IDF方法對不同的N值設(shè)定的情況下,財務(wù)文本集分類的準(zhǔn)確率結(jié)果進行了計算驗證,結(jié)果如表2所示。由表2可知,分類的準(zhǔn)確率、召回率和F1值隨著N值的增加均有上升的趨勢,在N=4時,分類的準(zhǔn)確率、召回率和F1值均達到最高,而后隨著N值的增加分類的性能不斷降低,因此可以斷定4為分類的一個峰值,應(yīng)采用4-Gram作為本文的特征詞劃分方法。

    3.3.1? 參數(shù)選擇

    在文本分類中,特征詞的選取直接關(guān)系到文本分類的結(jié)果。少量的特征詞不能準(zhǔn)確的表達文本的主題,造成文本分類效果較差,但特征詞數(shù)量過大,也會對實驗產(chǎn)生一定的消極影響。因此在分類前,首先要計算出需要送入樸素貝葉斯分類器中的權(quán)重值最高的M個特征詞數(shù)量M。由于特征詞數(shù)量的選取適用于所有的權(quán)重值計算方法,因此本文采用傳統(tǒng)的TF-IDF方法在財務(wù)數(shù)據(jù)集上的文本分類的準(zhǔn)確率和時間兩個方面綜合考慮M值的選取,圖1為特征詞數(shù)量對分類的準(zhǔn)確率的影響。

    假設(shè)文本i中的特征詞的總數(shù)量為D,由圖1可知,當(dāng)選取的特征詞數(shù)量M占總量D的40%左右時分類的準(zhǔn)確率增長速度開始變慢,由圖2可知,當(dāng)M占總量D的50%時,分類需要的時間開始急劇增加。因此,為了兼顧文本分類的準(zhǔn)確率和時間性能,本實驗選取中間值45%作為每個文本作為分類的特征詞數(shù)量比例,即M=0.45×D。

    此外還需要計算出特征詞位置信息的影響因子ε和η的值。η值反應(yīng)特征詞的位置信息,ε為加權(quán)因子。本文等比例地從三個種類的財務(wù)文本集中抽取200個文本,其中政策類財務(wù)文本70個、統(tǒng)計類財務(wù)文本82個,制度類財務(wù)文本48個,對每個文本經(jīng)過4-Gram方法進行分詞后,分別計算每個財務(wù)文本的始末特征詞數(shù)量與文本特征詞總數(shù)量的商,得到一個文本比例數(shù)據(jù)集,經(jīng)過對數(shù)據(jù)集進行分析,發(fā)現(xiàn)其符合均值μ為0.12,方差σ為0.03的正態(tài)分布,其分布如圖2所示,因此可以假設(shè)所有的財務(wù)文本的始末特征詞數(shù)量與特征詞總數(shù)量的商也都符合這一分布,即需要根據(jù)位置信息對特征詞進行加權(quán)操作的特征詞數(shù)量占總特征詞數(shù)量的12%,此外,對這200個文本進行平均特征詞權(quán)重數(shù)量的計算,得到每個文本平均特征詞數(shù)量為545,由于這200個文本是隨機選取的,可以認(rèn)為整財務(wù)文本數(shù)據(jù)集中的平均特征詞數(shù)量為545,因此η的最優(yōu)值計算為545×(1-0.12)/2,即η=240。

    在η值確定后,把ε作為變量,對財務(wù)文本分類的準(zhǔn)確率進行了驗證,結(jié)果如圖3所示。

    由圖3可知,隨著加權(quán)因子ε的增加,文本分類的準(zhǔn)確率也會有一定的提升,但在ε值達到1.4時,分類的準(zhǔn)確率達到峰值,此后ε值再增加,分類的準(zhǔn)確率反而會降低,因此本文選取ε=1.4作為特征詞權(quán)重的調(diào)節(jié)值。

    3.3.2? 結(jié)果分析

    完成了對各個實驗參數(shù)的求解,分別使用TF-IDF、TF-IDF-DL和SNGTI-LFDF算法對財務(wù)數(shù)據(jù)文本進行特征詞權(quán)重的計算,并將訓(xùn)練集文本的特征詞經(jīng)由貝葉斯方法訓(xùn)練得到樸素貝葉斯分類器,對測試集文本進行驗證,記錄每個方法計算得到的準(zhǔn)確率、召回率和F1值,結(jié)果如圖4所示。

    通過實驗對比,由圖4可知,SNGTI-LFDF算法在財務(wù)文本分類的準(zhǔn)確率、召回率以及F1值的性能表現(xiàn)方面都較TF-IDF和TF-IDF-DL算法有了較明顯的提升。其中SNGTI-LFDF的準(zhǔn)確率、召回率以及F1值較TF-IDF方法分別提升了20.3%、23.0%和21.7%,較TF-IDF-DL算法分別提升了5.3%、5.0%和5.2%。說明SNGTI-LFDF在財務(wù)文本分類中,能適應(yīng)財務(wù)文本的特征,分類效果更好,是一種良好的特征詞權(quán)重計算方法。

    4? 結(jié)? 論

    通過調(diào)研財務(wù)文本的特征,總結(jié)TF-IDF方法在應(yīng)用到財務(wù)文本分類中存在的不足,引入N-Gram方法進行財務(wù)文本特征詞提取的同時引入特征詞位置因子對TF-IDF方法進行改進,提出SNGTI-LFDF算法并結(jié)合樸素貝葉斯方法對算法的性能進行驗證。實驗采用自整理的財務(wù)文本數(shù)據(jù)集,結(jié)果表明該算法在財務(wù)文本分類中取得了較高的準(zhǔn)確率、召回率和F1值,較好地提升了財務(wù)文本分類的效果。

    參考文獻:

    [1] 劉佳明.引入財務(wù)狀態(tài)分析的上市公司財務(wù)危機預(yù)測方法研究 [D].哈爾濱:哈爾濱工業(yè)大學(xué),2018.

    [2] 蘇金樹,張博鋒,徐昕.基于機器學(xué)習(xí)的文本分類技術(shù)研究進展 [J].軟件學(xué)報,2006(9):1848-1859.

    [3] QU Z,SONG X,ZHENG S,et al. Improved Bayes Method Based on TF-IDF Feature and Grade Factor Feature for Chinese Information Classification [C]// 2018 IEEE International Conference on Big Data and Smart Computing (BigComp),2018:677-680.

    [4] KIM Y,PARK H,SHIM K,et al. Efficient processing of substring match queries with inverted variable-length gram indexes [J]. Information Sciences,2013,244:119-141.

    [5] YANG Y,JIANG G P.Improved Method of Computer Virus Signature Automatic Extraction Basedon N-Gram [J]. Computer Science,2017,44(S2):338-341(in Chinese).

    [6] 萬卓昊,徐冬冬,梁生,等.基于N-Gram的SQL注入檢測研究 [J].計算機科學(xué),2019,46(7):108-113.

    [7] WANG H T,HE J,ZHANG X H,et al. A Short Text Classification Method Based on N-Gram and CNN [J]. Chinese Journal of Electronics,2020,29(2):248-254.

    [8] CHEN K W,ZHANG Z P,LONG J,et al. Turning from TF-IDF to TF-IGM for term weighting in text classification [J]. Expert Systems With Applications,2016,66:245-260.

    [9] 許甜華,吳明禮.一種基于TF-IDF的樸素貝葉斯算法改進 [J].計算機技術(shù)與發(fā)展,2020,30(2):75-79.

    [10] 葉雪梅,毛雪岷,夏錦春,等.文本分類TF-IDF算法的改進研究 [J].計算機工程與應(yīng)用,2019,55(2):104-109+161.

    [11] 董蕊芳,柳長安,楊國田.一種基于改進TF-IDF的SLAM回環(huán)檢測算法 [J].東南大學(xué)學(xué)報(自然科學(xué)版),2019,49(2):251-258.

    [12] 但唐朋,許天成,張姝涵.基于改進TF-IDF特征的中文文本分類系統(tǒng) [J].計算機與數(shù)字工程,2020,48(3):556-560.

    [13] LIU P,ZHAO H H,TENG J Y,et al. Parallel naive Bayes algorithm for large-scale Chinese text classification based on spark [J].Journal of Central South University,2019,26(1):1-12.

    作者簡介:孫德華(1994—),男,漢族,河南周口人,碩士研究生在讀,研究方向:自然語言處理。

    猜你喜歡
    特征詞詞頻準(zhǔn)確率
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
    健康之家(2021年19期)2021-05-23 11:17:39
    不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
    2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
    高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
    基于改進TFIDF算法的郵件分類技術(shù)
    產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
    詞頻,一部隱秘的歷史
    面向文本分類的特征詞選取方法研究與改進
    云存儲中支持詞頻和用戶喜好的密文模糊檢索
    国产精品国产高清国产av| 久久这里有精品视频免费| 亚洲国产欧美在线一区| h日本视频在线播放| 欧美xxxx性猛交bbbb| 日本五十路高清| 亚洲久久久久久中文字幕| 亚洲精品粉嫩美女一区| 欧美日韩综合久久久久久| 国产亚洲欧美98| 亚洲自偷自拍三级| 人体艺术视频欧美日本| 中文字幕免费在线视频6| 国产精品日韩av在线免费观看| 欧美日韩综合久久久久久| 桃色一区二区三区在线观看| 深夜精品福利| 国产成人精品久久久久久| 国产色婷婷99| 美女cb高潮喷水在线观看| 黑人高潮一二区| 国产精品一区二区三区四区免费观看| 如何舔出高潮| 日韩成人av中文字幕在线观看| 黄片无遮挡物在线观看| 欧美丝袜亚洲另类| 亚洲综合色惰| 婷婷精品国产亚洲av| 直男gayav资源| 亚洲aⅴ乱码一区二区在线播放| 久久精品91蜜桃| 日韩欧美国产在线观看| 69av精品久久久久久| 欧美一区二区精品小视频在线| 九九爱精品视频在线观看| 99riav亚洲国产免费| www.色视频.com| 熟女电影av网| 内地一区二区视频在线| 亚洲内射少妇av| 成年女人看的毛片在线观看| 蜜桃久久精品国产亚洲av| 国产视频首页在线观看| 国产极品精品免费视频能看的| 亚洲国产精品成人综合色| 天堂av国产一区二区熟女人妻| 精品人妻一区二区三区麻豆| 国产亚洲91精品色在线| 亚洲欧美精品自产自拍| 在线播放国产精品三级| а√天堂www在线а√下载| 成年版毛片免费区| 午夜精品在线福利| 国产乱人视频| 国产高清三级在线| 欧美日韩乱码在线| 国产高潮美女av| 午夜免费男女啪啪视频观看| 成人av在线播放网站| 黄片wwwwww| 插逼视频在线观看| 亚洲精品乱码久久久v下载方式| 18禁在线无遮挡免费观看视频| 91午夜精品亚洲一区二区三区| 97超碰精品成人国产| 国产人妻一区二区三区在| 少妇被粗大猛烈的视频| 日韩一区二区视频免费看| 午夜福利视频1000在线观看| 久久精品久久久久久噜噜老黄 | 国产一区二区三区av在线 | 精品免费久久久久久久清纯| av在线老鸭窝| 深爱激情五月婷婷| 日本熟妇午夜| 久久久久网色| 成人高潮视频无遮挡免费网站| 搡女人真爽免费视频火全软件| 日日干狠狠操夜夜爽| 亚洲人成网站在线播| 国产精品国产高清国产av| 国产精品蜜桃在线观看 | 男插女下体视频免费在线播放| 国产美女午夜福利| 长腿黑丝高跟| 看黄色毛片网站| 少妇猛男粗大的猛烈进出视频 | 插阴视频在线观看视频| 国产精品不卡视频一区二区| 51国产日韩欧美| 蜜臀久久99精品久久宅男| 亚洲精品乱码久久久v下载方式| 嫩草影院新地址| 岛国毛片在线播放| 国产久久久一区二区三区| 国产亚洲av嫩草精品影院| 久久久久久伊人网av| 成人欧美大片| 久久久久网色| 国产精品一区二区三区四区久久| 国产伦一二天堂av在线观看| 国产一级毛片在线| 在线观看美女被高潮喷水网站| 国产精品一区二区在线观看99 | 久久这里只有精品中国| 亚洲性久久影院| 麻豆乱淫一区二区| 精品久久久久久久久av| 久久午夜亚洲精品久久| 91av网一区二区| 欧美日韩国产亚洲二区| 国产精品伦人一区二区| 亚洲一级一片aⅴ在线观看| 日韩欧美 国产精品| 亚洲精品456在线播放app| 色综合站精品国产| 国产精品久久久久久精品电影| 三级经典国产精品| 午夜免费男女啪啪视频观看| 亚洲精品456在线播放app| 91久久精品国产一区二区成人| 深夜精品福利| 日韩精品青青久久久久久| 色5月婷婷丁香| 中文字幕久久专区| 综合色丁香网| 深夜a级毛片| 寂寞人妻少妇视频99o| 在线国产一区二区在线| 非洲黑人性xxxx精品又粗又长| 97在线视频观看| 少妇人妻一区二区三区视频| 日韩,欧美,国产一区二区三区 | 激情 狠狠 欧美| 三级国产精品欧美在线观看| 欧洲精品卡2卡3卡4卡5卡区| 一区二区三区免费毛片| 亚洲av成人av| 只有这里有精品99| 国产精品不卡视频一区二区| 99热全是精品| 最后的刺客免费高清国语| 久久久久久大精品| 国产精品免费一区二区三区在线| 色哟哟哟哟哟哟| 在线a可以看的网站| av在线亚洲专区| 可以在线观看毛片的网站| 精品久久久久久久久久免费视频| 国产精品久久电影中文字幕| 99久久精品国产国产毛片| 综合色丁香网| 亚洲无线在线观看| 国产精品,欧美在线| 成人三级黄色视频| av.在线天堂| 一级黄色大片毛片| 久久久久久久久中文| 国产色婷婷99| 久久午夜福利片| 亚洲七黄色美女视频| 久久久久久久亚洲中文字幕| 级片在线观看| 欧洲精品卡2卡3卡4卡5卡区| 老司机福利观看| 免费看日本二区| 国产日本99.免费观看| 麻豆国产av国片精品| 一级毛片久久久久久久久女| 91久久精品国产一区二区三区| 波多野结衣高清作品| 国产真实伦视频高清在线观看| 1000部很黄的大片| 国语自产精品视频在线第100页| 小蜜桃在线观看免费完整版高清| 99久国产av精品| 熟女人妻精品中文字幕| 国产成人影院久久av| 亚洲av熟女| 91久久精品国产一区二区成人| 天堂√8在线中文| 草草在线视频免费看| 男女啪啪激烈高潮av片| 欧美精品一区二区大全| 国内精品美女久久久久久| 日本黄大片高清| 在线观看66精品国产| 97超碰精品成人国产| av在线老鸭窝| 极品教师在线视频| 亚洲成a人片在线一区二区| 给我免费播放毛片高清在线观看| 18禁在线无遮挡免费观看视频| 亚洲国产欧美人成| 国产男人的电影天堂91| 国产黄片视频在线免费观看| 亚洲av免费高清在线观看| 91精品国产九色| 99精品在免费线老司机午夜| 久久鲁丝午夜福利片| 亚洲中文字幕一区二区三区有码在线看| 国产精品福利在线免费观看| 免费av毛片视频| av在线天堂中文字幕| 性色avwww在线观看| 青春草国产在线视频 | 九九在线视频观看精品| 久久久久久久久中文| 国产亚洲精品av在线| 中文资源天堂在线| 日韩国内少妇激情av| 精品少妇黑人巨大在线播放 | 国产麻豆成人av免费视频| 成人特级av手机在线观看| 可以在线观看毛片的网站| 精品一区二区三区视频在线| 18+在线观看网站| 日本一二三区视频观看| 一边亲一边摸免费视频| av免费观看日本| 国产av在哪里看| 国产精品久久久久久亚洲av鲁大| 久久久成人免费电影| 一区二区三区高清视频在线| 日本-黄色视频高清免费观看| 日韩成人伦理影院| 在线国产一区二区在线| 亚洲欧美日韩东京热| 日韩国内少妇激情av| 久久久久国产网址| 大香蕉久久网| 成人高潮视频无遮挡免费网站| 大香蕉久久网| 国产亚洲精品久久久久久毛片| 欧美+日韩+精品| 国产精品乱码一区二三区的特点| 亚洲av成人精品一区久久| 黄色欧美视频在线观看| 国产在线男女| 国产午夜精品一二区理论片| 国产亚洲精品av在线| 小蜜桃在线观看免费完整版高清| 欧美变态另类bdsm刘玥| 久久久久免费精品人妻一区二区| 黄色欧美视频在线观看| 可以在线观看毛片的网站| 一级毛片aaaaaa免费看小| 成人综合一区亚洲| 亚洲av不卡在线观看| 成年av动漫网址| 国产视频内射| 韩国av在线不卡| 欧美成人一区二区免费高清观看| 嫩草影院入口| 男女视频在线观看网站免费| 亚洲精品久久国产高清桃花| 亚洲欧美清纯卡通| 久久久精品94久久精品| 我要看日韩黄色一级片| 日本av手机在线免费观看| av在线播放精品| 能在线免费看毛片的网站| 一本久久精品| 51国产日韩欧美| 国产美女午夜福利| 69人妻影院| 波多野结衣高清作品| 亚洲国产欧洲综合997久久,| 麻豆国产97在线/欧美| 少妇裸体淫交视频免费看高清| 免费观看人在逋| 亚洲av第一区精品v没综合| 黄色视频,在线免费观看| 欧美性猛交╳xxx乱大交人| 国产成人精品婷婷| 国产一区二区激情短视频| 国内揄拍国产精品人妻在线| 久久婷婷人人爽人人干人人爱| 久久综合国产亚洲精品| 乱人视频在线观看| 观看美女的网站| 欧美3d第一页| 尾随美女入室| 成人毛片60女人毛片免费| 美女国产视频在线观看| 国产黄色小视频在线观看| 国产亚洲欧美98| 亚洲精品久久国产高清桃花| 国产av一区在线观看免费| h日本视频在线播放| 午夜a级毛片| 在线观看美女被高潮喷水网站| 啦啦啦啦在线视频资源| 赤兔流量卡办理| 国产亚洲5aaaaa淫片| 激情 狠狠 欧美| 亚洲成人久久爱视频| 久久这里有精品视频免费| 国产成人精品久久久久久| 色综合亚洲欧美另类图片| 一级毛片我不卡| 亚洲av不卡在线观看| 欧美不卡视频在线免费观看| 亚洲精品成人久久久久久| a级毛片免费高清观看在线播放| 人妻少妇偷人精品九色| 可以在线观看毛片的网站| 久久精品91蜜桃| 亚洲国产欧美在线一区| 好男人在线观看高清免费视频| 国产色婷婷99| 亚洲中文字幕日韩| 国内揄拍国产精品人妻在线| 国产精品久久久久久av不卡| 欧洲精品卡2卡3卡4卡5卡区| 又黄又爽又刺激的免费视频.| 欧美日韩综合久久久久久| 18禁黄网站禁片免费观看直播| 日本爱情动作片www.在线观看| 国产日本99.免费观看| 国产探花在线观看一区二区| 成年女人看的毛片在线观看| 亚洲国产欧洲综合997久久,| 老司机影院成人| 中文字幕久久专区| 12—13女人毛片做爰片一| 日韩强制内射视频| 国产亚洲欧美98| 麻豆成人av视频| 国产精品无大码| 深爱激情五月婷婷| 男女边吃奶边做爰视频| 亚洲婷婷狠狠爱综合网| 中文字幕人妻熟人妻熟丝袜美| 亚洲欧美日韩高清在线视频| 两个人的视频大全免费| 国产精品免费一区二区三区在线| 最近手机中文字幕大全| 成人综合一区亚洲| ponron亚洲| 欧美性猛交黑人性爽| 国产单亲对白刺激| 成人永久免费在线观看视频| 久久久午夜欧美精品| 我要搜黄色片| 简卡轻食公司| 久久这里有精品视频免费| 在线观看66精品国产| 欧美bdsm另类| 欧美成人一区二区免费高清观看| 国产乱人偷精品视频| 午夜福利在线观看免费完整高清在 | a级毛色黄片| 人人妻人人看人人澡| 久久99蜜桃精品久久| av又黄又爽大尺度在线免费看 | 久久久午夜欧美精品| 亚洲精品色激情综合| 高清毛片免费观看视频网站| 国产综合懂色| 成人毛片60女人毛片免费| 少妇的逼好多水| 热99re8久久精品国产| 亚洲,欧美,日韩| 欧美bdsm另类| 亚洲aⅴ乱码一区二区在线播放| 如何舔出高潮| 免费av观看视频| 久久99蜜桃精品久久| 国产精品女同一区二区软件| 能在线免费观看的黄片| 99久久精品一区二区三区| 波多野结衣高清无吗| 免费大片18禁| 国产精品久久电影中文字幕| 成人亚洲欧美一区二区av| 亚洲真实伦在线观看| 青春草亚洲视频在线观看| 中文字幕精品亚洲无线码一区| 熟妇人妻久久中文字幕3abv| 国产不卡一卡二| 一边摸一边抽搐一进一小说| 久久久a久久爽久久v久久| 在线观看免费视频日本深夜| 亚洲综合色惰| 在现免费观看毛片| 亚洲三级黄色毛片| 2022亚洲国产成人精品| 69人妻影院| av在线老鸭窝| 欧美+亚洲+日韩+国产| 青青草视频在线视频观看| 国内久久婷婷六月综合欲色啪| av在线蜜桃| 波多野结衣高清作品| 日本黄色片子视频| .国产精品久久| 国产成人福利小说| 久久精品国产亚洲网站| 久久久久久久久中文| 深夜a级毛片| 午夜老司机福利剧场| 黄色欧美视频在线观看| 91午夜精品亚洲一区二区三区| 观看美女的网站| 日本一本二区三区精品| 一区二区三区高清视频在线| 中国国产av一级| 又爽又黄无遮挡网站| 亚洲人成网站在线播放欧美日韩| 色综合站精品国产| 久久草成人影院| 日韩国内少妇激情av| 深夜精品福利| 欧美色欧美亚洲另类二区| 波多野结衣高清作品| 亚洲国产色片| 大香蕉久久网| 深夜精品福利| 狂野欧美白嫩少妇大欣赏| 国产探花极品一区二区| 男女做爰动态图高潮gif福利片| 久久午夜亚洲精品久久| 赤兔流量卡办理| 精品久久久久久久久亚洲| videossex国产| 亚洲精华国产精华液的使用体验 | 久久九九热精品免费| 日日摸夜夜添夜夜添av毛片| 男女做爰动态图高潮gif福利片| 成人无遮挡网站| 99热精品在线国产| 国产午夜精品久久久久久一区二区三区| 一本久久中文字幕| 国产成人一区二区在线| 我的女老师完整版在线观看| 精品人妻熟女av久视频| 成人亚洲欧美一区二区av| 97在线视频观看| 欧美另类亚洲清纯唯美| 国产午夜福利久久久久久| 校园人妻丝袜中文字幕| 亚洲av成人精品一区久久| 亚洲精品亚洲一区二区| а√天堂www在线а√下载| 亚洲av成人精品一区久久| 色噜噜av男人的天堂激情| 日本欧美国产在线视频| a级一级毛片免费在线观看| 久久精品久久久久久噜噜老黄 | 亚洲欧美日韩卡通动漫| 丝袜喷水一区| 国产真实伦视频高清在线观看| 亚洲婷婷狠狠爱综合网| 美女被艹到高潮喷水动态| 亚洲欧洲国产日韩| 久久精品夜色国产| 精品不卡国产一区二区三区| 国产视频首页在线观看| 国内久久婷婷六月综合欲色啪| 男女啪啪激烈高潮av片| 搡老妇女老女人老熟妇| 亚洲欧美日韩高清在线视频| 国产不卡一卡二| 美女cb高潮喷水在线观看| 久久这里有精品视频免费| 在线观看一区二区三区| 热99re8久久精品国产| 午夜福利在线观看免费完整高清在 | 亚洲欧美日韩卡通动漫| 精品久久久久久久人妻蜜臀av| 欧美精品一区二区大全| 亚洲精品乱码久久久久久按摩| 丝袜美腿在线中文| 日韩成人伦理影院| 国产男人的电影天堂91| 蜜桃久久精品国产亚洲av| 日产精品乱码卡一卡2卡三| 老司机影院成人| 久久久久国产网址| or卡值多少钱| 真实男女啪啪啪动态图| 欧美bdsm另类| 国产精品一二三区在线看| 成年女人看的毛片在线观看| 日韩成人av中文字幕在线观看| 99精品在免费线老司机午夜| 午夜a级毛片| 99久国产av精品| 久久久午夜欧美精品| 久久九九热精品免费| 欧美最新免费一区二区三区| 一个人免费在线观看电影| 99热精品在线国产| 国产精品免费一区二区三区在线| 免费看av在线观看网站| 神马国产精品三级电影在线观看| 久久国内精品自在自线图片| 一个人看的www免费观看视频| 偷拍熟女少妇极品色| 成人欧美大片| 亚洲国产欧洲综合997久久,| 日本三级黄在线观看| 蜜臀久久99精品久久宅男| 国产人妻一区二区三区在| 美女脱内裤让男人舔精品视频 | 国产精品久久久久久久久免| 国产成人精品久久久久久| 日韩成人av中文字幕在线观看| 亚洲人成网站高清观看| 国内揄拍国产精品人妻在线| 国产69精品久久久久777片| 99久久久亚洲精品蜜臀av| 六月丁香七月| 岛国毛片在线播放| 欧美性猛交╳xxx乱大交人| 亚洲人成网站在线观看播放| 欧美精品国产亚洲| 国产色爽女视频免费观看| 亚洲美女视频黄频| 亚洲av不卡在线观看| 久久国产乱子免费精品| 啦啦啦啦在线视频资源| 亚洲精品乱码久久久久久按摩| av女优亚洲男人天堂| 亚洲中文字幕日韩| 一边摸一边抽搐一进一小说| 国产精品.久久久| 免费观看人在逋| kizo精华| 麻豆国产97在线/欧美| 亚洲欧美日韩高清在线视频| 国产精品一及| 内地一区二区视频在线| 看非洲黑人一级黄片| 成人二区视频| 村上凉子中文字幕在线| 人妻系列 视频| 久久精品人妻少妇| 久久久国产成人免费| 插逼视频在线观看| 少妇猛男粗大的猛烈进出视频 | 国产精品1区2区在线观看.| 青青草视频在线视频观看| 国产午夜精品论理片| 成人漫画全彩无遮挡| 亚洲成av人片在线播放无| 麻豆国产97在线/欧美| 欧美最黄视频在线播放免费| 国产精品免费一区二区三区在线| 又爽又黄a免费视频| 久久精品国产亚洲av香蕉五月| 亚洲aⅴ乱码一区二区在线播放| 久久精品国产亚洲av涩爱 | 午夜视频国产福利| 男女边吃奶边做爰视频| 国产激情偷乱视频一区二区| 有码 亚洲区| 99热这里只有是精品50| 亚洲自偷自拍三级| 国产色婷婷99| 波多野结衣高清作品| 国产高清三级在线| 日日撸夜夜添| 国产在视频线在精品| 久久婷婷人人爽人人干人人爱| 日韩 亚洲 欧美在线| 天天躁夜夜躁狠狠久久av| 少妇人妻精品综合一区二区 | 亚州av有码| 成人综合一区亚洲| 亚洲内射少妇av| 成人午夜精彩视频在线观看| or卡值多少钱| 尾随美女入室| 日韩成人av中文字幕在线观看| 亚洲最大成人中文| 免费看美女性在线毛片视频| 国产探花极品一区二区| 亚洲自偷自拍三级| 亚洲三级黄色毛片| 九九热线精品视视频播放| 成人一区二区视频在线观看| 97在线视频观看| 国产精品不卡视频一区二区| 综合色av麻豆| 午夜精品一区二区三区免费看| 变态另类丝袜制服| 国产激情偷乱视频一区二区| 色综合站精品国产| 亚洲久久久久久中文字幕| 国产高清激情床上av| 乱码一卡2卡4卡精品| 久久人人爽人人爽人人片va| 波多野结衣巨乳人妻| 一级毛片久久久久久久久女| 伦精品一区二区三区| 亚洲国产精品成人综合色| 欧美不卡视频在线免费观看| 性色avwww在线观看| 欧美三级亚洲精品| 日韩 亚洲 欧美在线| 自拍偷自拍亚洲精品老妇| 中出人妻视频一区二区| 婷婷六月久久综合丁香| 十八禁国产超污无遮挡网站| 精品午夜福利在线看| 亚洲av中文字字幕乱码综合| 在线观看美女被高潮喷水网站| 久久鲁丝午夜福利片| 精品久久久久久久末码| 欧美三级亚洲精品| 51国产日韩欧美| 亚洲国产精品sss在线观看| 九九爱精品视频在线观看|