• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Python語言的中文分詞技術(shù)的研究*

    2019-09-04 05:41:14祝永志
    通信技術(shù) 2019年7期
    關(guān)鍵詞:文本

    祝永志,荊 靜

    (曲阜師范大學(xué) 信息科學(xué)與工程學(xué)院,山東 日照 276826)

    0 引 言

    Python是當(dāng)今最熱門的編程語言之一,僅次于Java語言、C語言。國內(nèi)的知名互聯(lián)網(wǎng)企業(yè)也有很多使用python語言搭建的,比如網(wǎng)易、豆瓣等。由于很多公司使用Python進(jìn)行開發(fā)和其他工作,導(dǎo)致Python招聘相關(guān)工作崗位的范圍很廣,涉及到從后臺維護(hù)到前端開發(fā)。Python適用于數(shù)據(jù)科學(xué)方面,比如數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)可視化等,社會發(fā)展的需求也是Python熱門的原因之一。

    用高級語言編程可以大大提高生產(chǎn)力的想法并不新鮮,當(dāng)今社會各個(gè)領(lǐng)域都離不開數(shù)據(jù)的支持,獲取和充分利用數(shù)據(jù)是一個(gè)巨大的問題,而Python就是一門可以解決這種問題的高級編程語言。Python爬蟲是眾多數(shù)據(jù)來源渠道中重要的一條,運(yùn)用它可以提供優(yōu)質(zhì)和價(jià)值豐富的數(shù)據(jù)集[1]。除了獲取數(shù)據(jù),Python在后續(xù)的數(shù)據(jù)處理等過程中也展現(xiàn)出了巨大的優(yōu)勢,它的應(yīng)用范圍十分廣泛,幾乎覆蓋了整個(gè)程序設(shè)計(jì)的領(lǐng)域[2]。在本文中首先運(yùn)用Python爬蟲爬取新聞網(wǎng)頁數(shù)據(jù),為后續(xù)實(shí)驗(yàn)提供文本數(shù)據(jù),然后對文本進(jìn)行切分,對切分結(jié)果進(jìn)行去除停用詞處理后對分詞進(jìn)行了加權(quán)處理篩選出關(guān)鍵詞,在加權(quán)時(shí)采用了TF-IDF算法和TextRank算法對分詞的重要性進(jìn)行計(jì)算,根據(jù)加權(quán)結(jié)果提取出關(guān)鍵詞,最后運(yùn)用WordCloud庫采用詞云的方式對關(guān)鍵詞進(jìn)行展現(xiàn)。數(shù)據(jù)的獲取和分析處理過程都程序化,不僅可以節(jié)省時(shí)間,使得閱讀過程更加方便快捷,而且可以迅速地從中文文本中提取到高價(jià)值的信息。

    1 Python簡介

    1.1 Python

    Python作為當(dāng)今最熱門的編程語言之一,它的應(yīng)用場景很多,比如科學(xué)計(jì)算,軟件的開發(fā)與維護(hù)等等,Python已經(jīng)是當(dāng)前熱門領(lǐng)域中不可或缺的編程語言,比如云計(jì)算、網(wǎng)絡(luò)爬蟲、人工智能等等。在當(dāng)今熱門的語言中,Python的優(yōu)勢主要體現(xiàn)在以下兩點(diǎn):

    (1)易于學(xué)習(xí),開源,高級語言,可移植性,可解釋性,面向?qū)ο螅蓴U(kuò)展性,豐富的庫和規(guī)范的代碼。

    (2)具有一個(gè)強(qiáng)大的標(biāo)準(zhǔn)庫和許多功能豐富的第三方庫,這些使得開發(fā)過程更簡單,這些庫可以應(yīng)用于學(xué)計(jì)算、數(shù)據(jù)分析等多個(gè)領(lǐng)域[3],對這些庫的熟練使用會使開發(fā)過程變得更簡便和高效。標(biāo)準(zhǔn)庫包含的功能有很多,比如文本處理和操作系統(tǒng)功能調(diào)用等。

    1.2 jieba

    結(jié)巴分詞(Jieba)作為一個(gè)強(qiáng)大的分詞庫,它的開發(fā)者通過大量的訓(xùn)練后,向其錄入了有兩萬多條詞組成了基本的庫,不僅如此,jieba的實(shí)現(xiàn)原理也比較完善,設(shè)計(jì)的算法有基于前綴詞典的有向無環(huán)圖、動態(tài)規(guī)劃、HMM模型等[4]。jieba分詞支持三種分詞模式:

    (1)精確模式,此模式試圖以最高精度來對句子進(jìn)行劃分,適用于文本分析;

    (2)全模式,此模式可以掃描出句中全部可成詞的詞語,并且速度很快,但它并不可以解決歧義問題;

    (3)搜索引擎模式,此模式基于精確模式對長詞在進(jìn)行切分,可以將此模式用于搜索引擎分詞[5]。

    Jieba分詞的jieba.cut()方法有三個(gè)參數(shù):字符串,cut_all,HMM(Hidden Markov Model,隱馬爾可夫模型)參數(shù)。其中字符串是待分詞的實(shí)驗(yàn)文本,第二個(gè)參數(shù)cut_all=True時(shí)使用全模式,當(dāng)指定cut_all=False時(shí)為精確模式。圖1展示了不同模式的使用方法和分詞結(jié)果。

    圖1 jieba分詞模式

    2 Python爬蟲

    Python爬蟲就是用Python編程實(shí)現(xiàn)的網(wǎng)絡(luò)爬蟲,Python擁有很多可用于爬蟲的第三方包和框架,可以輕松地實(shí)現(xiàn)爬蟲功能[6]。用Python來寫爬蟲程序不僅爬取速度快,處理各種爬蟲問題也很方便。Python爬蟲的用處有很多,比如各種數(shù)據(jù)聚合的網(wǎng)站像搜索引擎和信息對比的網(wǎng)站等都運(yùn)用了爬蟲技術(shù)。

    2.1 Python爬蟲庫

    Python有兩個(gè)十分強(qiáng)大的第三方庫常用于寫爬蟲程序,一個(gè)是requests,另一個(gè)是BeautifulSoup。Requests是一個(gè)簡單易用的HTTP庫,包含了大多數(shù)HTTP功能。BeautifulSoup是一個(gè)網(wǎng)頁解析庫,最主要的功能就是在網(wǎng)頁上抓取數(shù)據(jù),它能夠很容易的提取出HTML或者XML標(biāo)簽中的內(nèi)容。Python爬蟲的架構(gòu)主要是由URL管理器,網(wǎng)頁下載器和網(wǎng)頁解析器這三個(gè)部分組成。其中URL管理器負(fù)責(zé)管理將要抓取和已經(jīng)抓取網(wǎng)頁的url集合。網(wǎng)頁下載器用于爬取相應(yīng)的網(wǎng)頁,并將抓得的數(shù)據(jù)以字符串的形式存儲,然后傳輸給網(wǎng)頁解析器。網(wǎng)頁解析器用于解析出有用的數(shù)據(jù)存儲下來,并且給URL管理器補(bǔ)充url。除此之外還有調(diào)度器主要負(fù)責(zé)調(diào)度各部分間協(xié)調(diào)工作。

    2.2 Python爬蟲流程

    Python爬蟲的流程主要分為四個(gè)步驟:發(fā)起請求,獲取響應(yīng)內(nèi)容,解析內(nèi)容和保存數(shù)據(jù)。

    (1)發(fā)起請求

    對目標(biāo)發(fā)送一個(gè)Request,Request中主要包含有請求方式、請求URL和請求頭三個(gè)部分,這個(gè)Request可以還包括headers等,然后等待響應(yīng)。

    (2)獲取響應(yīng)內(nèi)容

    若正常,會得到一個(gè)Response,Response中包含響應(yīng)狀態(tài)、響應(yīng)頭和響應(yīng)體。其中最重要的就是響應(yīng)體,它包含所請求資源的內(nèi)容,這個(gè)內(nèi)容可能是HTML,二進(jìn)制等

    (3)解析內(nèi)容

    對響應(yīng)的內(nèi)容進(jìn)行解析,根據(jù)獲取內(nèi)容類型的不同采用不同的解析方式,解析方式有正則表達(dá)式、網(wǎng)頁解析庫、BeautifulSoup解析處理、轉(zhuǎn)為Json對象等。

    (4)保存數(shù)據(jù)

    對解析過后的內(nèi)容進(jìn)行保存,保存形式有多種,可以根據(jù)需要保存為不同的格式。

    3 中文文本分詞

    分詞是指將完整的一句話根據(jù)其語義分揀成一個(gè)詞語項(xiàng)集[7],該詞語項(xiàng)集作為參與關(guān)聯(lián)規(guī)則挖掘的基本單元[8]。中文分詞是指以詞作為基本單元,運(yùn)用計(jì)算機(jī)自動地對中文文本進(jìn)行詞語的切分,即變成英文文本中用空格將句中的詞分開的形式,這樣方便計(jì)算機(jī)識別出各語句中的重點(diǎn)內(nèi)容。

    3.1 創(chuàng)建自定義詞典

    許多情況下,我們需要對特定的場景來進(jìn)行分詞,這時(shí)會有一些特定領(lǐng)域內(nèi)的專用詞匯,這些詞匯往往是詞庫里沒有的,解決這個(gè)問題的方法是創(chuàng)建自定義詞典,自定義詞典的有兩個(gè)重要方法:載入詞典,往詞庫里添加單詞。

    Jieba中載入詞典:jieba.load_userdict(file_name),其中file_name是文件類對象或自定義詞典的路徑,載入詞典的格式需與 dict.txt 相同,每詞占一行;每行需要分成三個(gè)部分為:詞語、詞頻、詞性,詞頻和詞性可省略不寫,它們之間要使用空格來分開,并且其順序不可改變。其中file_name 若采用路徑或二進(jìn)制來打開文件,則文件必須采用UTF-8編碼。當(dāng)詞頻被省略的時(shí)候,Jieba會采用自動計(jì)算的方式來確保詞頻被分出。

    自定義詞典的方式可以被用來添加jieba詞庫中不存在的詞。雖然jieba具有對新的詞匯進(jìn)行辨別的能力,但單獨(dú)添加這些詞可以確保更高的正確率,還能夠解決未登錄詞的問題,然而人們對分詞技術(shù)和漢語結(jié)構(gòu)的理解程度也會影響著自定義詞典的準(zhǔn)確度[9]。示例中在自定義詞典中添加了‘探測器造訪’和‘火星探測衛(wèi)星’兩個(gè)新詞,從實(shí)驗(yàn)結(jié)果可以看出,兩個(gè)詞語在分詞結(jié)果中被準(zhǔn)確的切分出來,使得分詞結(jié)果更加精確。添加新詞示例:

    test_sent='2020年我們將發(fā)射一個(gè)火星探測衛(wèi)星'jieba.add_word('火星探測衛(wèi)星')

    在自定義詞典中添加了“火星探測衛(wèi)星”這個(gè)詞,圖2展示了是否添加分詞后的不同運(yùn)行結(jié)果。

    圖2 是否添詞不同結(jié)果對比

    從結(jié)果可以看出添加分詞使得火星探測器被準(zhǔn)確的切分出來,分詞結(jié)果更加準(zhǔn)確。

    3.2 關(guān)鍵詞提取

    對中文文本關(guān)鍵詞提取的方法是采用不同方法對文本分割后的分詞進(jìn)行計(jì)算權(quán)重,進(jìn)行加權(quán)的方法有TF-IDF算法和TextRank算法。

    3.2.1 TF-ID算法

    TF-IDF(Term Frequency-inverse Document Frequency)是一種統(tǒng)計(jì)方法,其中TF(Term Frequency)的意思是詞頻,IDF(Inverse Document Frequency)的意思是逆文本頻率指數(shù),TF-IDF算法所求實(shí)際上就是這兩者相乘所得的乘積。該算法的主要思想為:若某詞在一類指定的文本中出現(xiàn)的頻率很高,而這個(gè)詞在其他類文本中出現(xiàn)的頻率很低,那么認(rèn)為該詞具有此類文本某些代表性的特征,可用詞對此類文本進(jìn)行分類[10]。因此使用TF-IDF算法計(jì)算分詞重要性可對某一文本提取關(guān)鍵詞。

    詞頻指的是一個(gè)詞在指定的文件中出現(xiàn)的次數(shù)。在特定文件dj中詞語ti的TF公式如下:

    其中,ni,j表示詞ti在文件dj中出現(xiàn)的次數(shù),分母表示dj中包含的所有詞出現(xiàn)的次數(shù)的總和。

    逆向文件頻率是用來衡量詞普遍性的一個(gè)定義,對于某詞t的IDF的計(jì)算公式如下:

    其中,|D|是語料庫中的文件總數(shù),分母表示dj中包含有ti的文件的數(shù)目。TF-IDF的計(jì)算公式如下:

    在指定的文本中出現(xiàn)次數(shù)多而在文件集合中其他文件中出現(xiàn)頻率低的詞計(jì)算出來的TF-IDF值更高,所以使用TF-IDF算法可以過濾掉一些常用詞。

    3.2.2 TextRank算法

    TextRank算法是一種基于圖的算法,它是一種排序算法,用于處理文本,可用于提取關(guān)鍵詞[11]。

    TextRank可由一個(gè)有向有權(quán)圖G=(V,E)表示,圖中任兩點(diǎn)vi,vj之間的邊的權(quán)重為Wji,對于給頂點(diǎn)vi,點(diǎn)vi的TextRank計(jì)算公式如下:

    其中,In(vi)為指向該點(diǎn)的點(diǎn)集合,Out(vi)為該點(diǎn)所指向的集合,d為阻尼系數(shù),取值在0到1之間,表示某點(diǎn)指向其他任意點(diǎn)的概率。

    TextRank算法基于PageRank算法[12],步驟為:

    (1)分割文本,過濾。

    (2)采用分割單位建立圖模型。

    (3)根據(jù)式(4)在節(jié)點(diǎn)進(jìn)行權(quán)重迭代,收斂時(shí)結(jié)束。

    (4)根據(jù)權(quán)重的大小對節(jié)點(diǎn)進(jìn)行排序,排序時(shí)采用的是倒序的方式,排序后根據(jù)重要性假設(shè)得到了T個(gè)候選關(guān)鍵詞。

    (5)在原始文本中對候選詞檢測它們之間是否相鄰,相鄰的時(shí)候?qū)⑺麄兘M合成多詞關(guān)鍵詞。

    3.3 詞云制作

    詞云是一種使用語言分析技術(shù)對文本進(jìn)行分析統(tǒng)計(jì)后生成可視圖像的技術(shù)[13]。詞云圖[14],也稱為文字云,是用圖像的方式對文本中頻繁出現(xiàn)的詞語進(jìn)行展現(xiàn),形成“關(guān)鍵詞渲染”或者“關(guān)鍵詞云層”的效果。詞云圖可以過濾掉大量的低頻和低質(zhì)量的文本,讓瀏覽者只需匆匆一瞥就能夠通過關(guān)鍵詞來領(lǐng)會文本的核心內(nèi)容。WordCloud庫用于生成詞云,是python的第三方庫,這個(gè)庫的功能十分強(qiáng)大,在統(tǒng)計(jì)分析方面有著很好地應(yīng)用。

    4 實(shí)驗(yàn)

    4.1 軟件環(huán)境

    本文編程語言為Python,編程環(huán)境是pycharm,第三方包有wordcloud、jieba等,直接使用pip安裝即可,安裝命令為:pip install wordcloud,pip install jieba。

    4.2 獲取數(shù)據(jù)

    本文采用介紹嫦娥四號相關(guān)資訊的新聞網(wǎng)頁作為爬蟲目標(biāo)網(wǎng)頁。這一事件標(biāo)志著人類首次將探測器成功發(fā)射到月球背面,對月球背面進(jìn)行了近距離的拍攝,并傳回了世界第一張?jiān)虑虮趁鎴D像,這是一次偉大的創(chuàng)舉。原網(wǎng)頁如圖3所示。

    圖3 新聞網(wǎng)頁

    編寫程序?qū)W(wǎng)頁數(shù)據(jù)進(jìn)行抓取,并將抓取到的數(shù)據(jù)保存到指定的文本文件中。第一步要導(dǎo)入的相關(guān)庫:

    然后要獲得網(wǎng)頁的Html,這時(shí)要用到Requests庫中的requests.get()方法,使用方式如下:

    其中r.raise_for_status()在不成功的時(shí)候時(shí)拋出異常。然后要用BeautifulSoup庫進(jìn)行解析,首先分析一下網(wǎng)頁的HTML結(jié)構(gòu),在Chrome中打開目標(biāo)網(wǎng)頁,右鍵查看源碼可以看到如圖4所示。

    圖4 網(wǎng)頁源碼

    對網(wǎng)頁源碼進(jìn)行分析,結(jié)合html相關(guān)知識,可以看出title為

    因?yàn)閟elect()方法返回的是一個(gè)列表,對于paras要采用循環(huán)的方式實(shí)現(xiàn)。最后將數(shù)據(jù)寫入文件并且保存,這里將爬取到的文章以字典的格式來保存:

    爬取的數(shù)據(jù)被保存到指定路徑和文件名的文本文檔中,圖5是對爬取內(nèi)容進(jìn)行展示。

    圖5 爬取的數(shù)據(jù)

    4.3 文本分詞

    因?yàn)閷?shí)驗(yàn)要用到panda里面的value_count()等方法,所以要導(dǎo)入panda和jieba等相關(guān)包,然后讀取文本獲取文本數(shù)據(jù):

    對文本進(jìn)行分詞,因?yàn)榉衷~結(jié)果較長這里只打印一部分進(jìn)行展示。而cut()方法返回的是可迭代的generator,若要打印指定某幾行時(shí)需要寫循環(huán),這里運(yùn)用列表的形式打印出前五個(gè)分詞結(jié)果,簡化了代碼過程,關(guān)鍵代碼為:

    分詞結(jié)果如圖6所示。

    圖6 分詞前五個(gè)結(jié)果

    從分詞結(jié)果中可以看出分詞不僅分出了詞語,還將標(biāo)點(diǎn)也當(dāng)做一個(gè)詞切分出來,像標(biāo)點(diǎn)這樣的數(shù)據(jù)不僅無用,而且會占據(jù)存儲空間,影響分詞結(jié)果的準(zhǔn)確度。所以要先對文本進(jìn)行數(shù)據(jù)預(yù)處理,然后再進(jìn)行后續(xù)實(shí)驗(yàn)。

    在處理文本的前后,Jieba會自動地篩除掉有些字或詞,篩除掉的字或詞被稱為Stop Words(停用詞)。停用詞大致被分類兩類:一種是被普遍包含的功能詞,比如“是”、“在”等等,這種詞一般沒有什么實(shí)際含義,基本上不會單獨(dú)表達(dá)文本的重要內(nèi)容,若要記錄這些詞會占據(jù)很大的磁盤空間;另一種包含詞匯詞,這種詞的特征是被普遍應(yīng)用,但是卻不能保證準(zhǔn)確的搜索結(jié)果,也不能夠降低搜索范圍,并且會影響搜索效率。從運(yùn)行結(jié)果可以看到,在去除停用詞后,一些無用的符號和詞語被去除,使得分詞結(jié)果更清晰準(zhǔn)確。首先創(chuàng)建停用詞詞典:

    打印前十個(gè)結(jié)果如圖7所示。

    圖7 去除停用詞前后對比

    在去除停用詞后對剩下的分詞文本進(jìn)行處理,首先運(yùn)用統(tǒng)計(jì)詞頻的方法,觀察一下運(yùn)行結(jié)果,統(tǒng)計(jì)詞頻時(shí)采用的是value_count()方法,這個(gè)函數(shù)能夠?qū)eries里面的每個(gè)值進(jìn)行計(jì)數(shù)并排序。函數(shù)為:word_fre = pd.Series(word).value_counts()排序后的實(shí)驗(yàn)結(jié)果前二十行如圖8所示。

    圖8 統(tǒng)計(jì)詞頻結(jié)果

    在統(tǒng)計(jì)詞頻后發(fā)現(xiàn)最后結(jié)果依然有噪聲數(shù)據(jù)存在,比如“成于”這種詞還沒有被劃分出去,因此基于詞頻的中文分詞算法是不可靠的。

    4.4 提取關(guān)鍵詞

    分別使用TF-IDF算法和TextRank算法對分詞結(jié)果進(jìn)行權(quán)重計(jì)算,其中TF-IDF算法得到的結(jié)果前二十個(gè)如圖9所示。

    圖9 TF-IDF算法運(yùn)行結(jié)果

    對分詞結(jié)果執(zhí)行TextRank算法,計(jì)算分詞的權(quán)重并進(jìn)行排序,計(jì)算結(jié)果前二十個(gè)如圖10所示。

    圖10 TextRank算法結(jié)果

    對比三種算法的運(yùn)行結(jié)果,TF-IDF算法和TextRank算法的運(yùn)行結(jié)果中基本上沒有常用詞這種帶有噪聲的分詞,這兩種算法的運(yùn)行結(jié)果的差異性也不大,與基于詞頻的算法相比較分詞效果明顯的增強(qiáng)。

    最后采用TF-IDF算法對篩選的結(jié)果進(jìn)行詞云的繪制,根據(jù)計(jì)算的權(quán)重大小選取了前一百個(gè)結(jié)果進(jìn)行繪圖,實(shí)現(xiàn)可視化。

    4.5 詞云

    詞云不僅用于展示標(biāo)簽,也多用于呈現(xiàn)文本的關(guān)鍵詞語,以便幫助人們簡明扼要地了解文本的大體內(nèi)容。最后根據(jù)詞的重要性來繪制詞云,詞云可以從不同維度展現(xiàn)數(shù)據(jù):詞匯本 身、頻率(詞匯大小)、以及詞匯的顏色,使得分詞結(jié)果簡單清晰。

    每個(gè)詞云在wordcloud中被當(dāng)作一個(gè)對象,生成一個(gè)美觀的詞云需要三步:配置對象參數(shù),加載詞云文本,輸出詞云文件。在Wordcloud中,w.generate(txt)用于向w中加載文本,w.tofile(filename)輸出為圖像格式保存。常用的參數(shù)列表如表1所示。

    表1 wordcloud對象參數(shù)

    最后采用云效果圖進(jìn)行展示,詞云效果圖的文字的不同大小以及顏色的不同展示了文本內(nèi)容的關(guān)鍵程度。月球在詞云圖中占據(jù)了顯眼的位置,其次就是嫦娥、夢想等,通過對詞云圖的簡單瀏覽就可以大致了解文本的主要內(nèi)容,詞云圖如圖11所示。

    圖11 詞云效果圖

    5 結(jié) 語

    本文首先運(yùn)用python的第三方庫對新聞網(wǎng)頁進(jìn)行了爬蟲操作,將爬取的數(shù)據(jù)保存為文本文檔作為后續(xù)分詞實(shí)驗(yàn)的數(shù)據(jù),然后對文本進(jìn)行分詞處理,在分詞的過程中先進(jìn)行了數(shù)據(jù)預(yù)處理,采用自定義詞典的方式對新詞進(jìn)行識別劃分,然后又進(jìn)行了去除停用詞操作來提高分詞結(jié)果的準(zhǔn)確度,然后根據(jù)TF-IDF算法和TextRank算法計(jì)算分詞的權(quán)重來提取關(guān)鍵詞的結(jié)果較理想,成功篩選掉了噪聲數(shù)據(jù),最后根據(jù)TF-IDF的結(jié)果對關(guān)鍵詞采用了詞云的方式實(shí)現(xiàn)了數(shù)據(jù)的可視化。

    本文通過實(shí)驗(yàn)對文本數(shù)據(jù)提取出了有價(jià)值的信息,并且用一種清晰的方式對重要內(nèi)容進(jìn)行了展示。但是本文爬蟲只是抓取了單個(gè)網(wǎng)頁,數(shù)據(jù)量比較小,后續(xù)可以將抓取數(shù)據(jù)量加大,實(shí)驗(yàn)結(jié)果可能會更加明顯。

    猜你喜歡
    文本
    文本聯(lián)讀學(xué)概括 細(xì)致觀察促寫作
    重點(diǎn):論述類文本閱讀
    重點(diǎn):實(shí)用類文本閱讀
    初中群文閱讀的文本選擇及組織
    甘肅教育(2020年8期)2020-06-11 06:10:02
    作為“文本鏈”的元電影
    在808DA上文本顯示的改善
    “文化傳承與理解”離不開對具體文本的解讀與把握
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    從背景出發(fā)還是從文本出發(fā)
    語文知識(2015年11期)2015-02-28 22:01:59
    少妇丰满av| 国产探花极品一区二区| 1000部很黄的大片| 日日撸夜夜添| 六月丁香七月| 中文字幕亚洲精品专区| 人人妻人人爽人人添夜夜欢视频 | 亚洲经典国产精华液单| 美女主播在线视频| 久久人人爽av亚洲精品天堂 | 一区在线观看完整版| 伦理电影免费视频| 日韩 亚洲 欧美在线| 成人美女网站在线观看视频| 免费观看av网站的网址| 成人国产av品久久久| 精品久久久久久久久亚洲| 精品久久久久久久久av| 亚洲欧美中文字幕日韩二区| 日本欧美视频一区| 亚洲欧美一区二区三区黑人 | videossex国产| 纯流量卡能插随身wifi吗| 欧美人与善性xxx| 这个男人来自地球电影免费观看 | 国产精品av视频在线免费观看| 久久人人爽av亚洲精品天堂 | 亚洲怡红院男人天堂| 久久99热这里只频精品6学生| 日韩一区二区三区影片| 国产淫语在线视频| 永久免费av网站大全| 久久久久久久久大av| 嫩草影院入口| 国产乱人偷精品视频| 少妇高潮的动态图| 少妇人妻 视频| 欧美性感艳星| 国产无遮挡羞羞视频在线观看| 欧美少妇被猛烈插入视频| 色婷婷久久久亚洲欧美| 日韩视频在线欧美| 成人毛片60女人毛片免费| 一本色道久久久久久精品综合| 好男人视频免费观看在线| 熟妇人妻不卡中文字幕| 国产精品一区二区在线观看99| 3wmmmm亚洲av在线观看| 国产成人免费无遮挡视频| 极品教师在线视频| 女人久久www免费人成看片| 亚洲成人中文字幕在线播放| 久久精品久久精品一区二区三区| 嘟嘟电影网在线观看| 国产伦在线观看视频一区| 亚洲av国产av综合av卡| 噜噜噜噜噜久久久久久91| 少妇 在线观看| 国产av一区二区精品久久 | 王馨瑶露胸无遮挡在线观看| 精品人妻一区二区三区麻豆| 国产熟女欧美一区二区| 高清日韩中文字幕在线| 我要看黄色一级片免费的| 观看免费一级毛片| 日本黄大片高清| 大码成人一级视频| 人妻少妇偷人精品九色| 精品一品国产午夜福利视频| 亚洲激情五月婷婷啪啪| 丰满迷人的少妇在线观看| a级毛色黄片| 中国美白少妇内射xxxbb| 亚洲精品久久久久久婷婷小说| 激情 狠狠 欧美| 麻豆精品久久久久久蜜桃| 亚洲欧美成人精品一区二区| 深夜a级毛片| 青青草视频在线视频观看| 亚洲av综合色区一区| 一个人看视频在线观看www免费| 国产精品无大码| 天美传媒精品一区二区| 成年av动漫网址| 久久女婷五月综合色啪小说| av免费在线看不卡| 中文字幕精品免费在线观看视频 | 国产亚洲最大av| 少妇 在线观看| 熟女av电影| av播播在线观看一区| 一级毛片久久久久久久久女| 国产91av在线免费观看| 成人亚洲欧美一区二区av| 国产精品一及| 在线免费十八禁| a级一级毛片免费在线观看| 国产乱人视频| 视频中文字幕在线观看| 九九爱精品视频在线观看| 亚洲成人av在线免费| av免费在线看不卡| 人妻少妇偷人精品九色| 亚洲国产精品999| 国产 一区精品| av国产精品久久久久影院| 国产91av在线免费观看| 亚洲欧美一区二区三区黑人 | 亚洲欧美中文字幕日韩二区| 91狼人影院| 亚洲熟女精品中文字幕| av卡一久久| av在线app专区| 天堂中文最新版在线下载| 一级片'在线观看视频| 国产美女午夜福利| 伦精品一区二区三区| 一区在线观看完整版| 国产成人a∨麻豆精品| 精品亚洲成a人片在线观看 | 久久久久久久大尺度免费视频| 少妇高潮的动态图| 日韩中文字幕视频在线看片 | 日韩中字成人| videossex国产| 黄色欧美视频在线观看| 日本与韩国留学比较| 亚洲色图综合在线观看| 国产大屁股一区二区在线视频| 亚洲第一区二区三区不卡| 国产精品三级大全| 如何舔出高潮| 欧美日韩一区二区视频在线观看视频在线| 国产亚洲午夜精品一区二区久久| 男人狂女人下面高潮的视频| 大陆偷拍与自拍| av又黄又爽大尺度在线免费看| 丝袜脚勾引网站| 亚洲精华国产精华液的使用体验| 看非洲黑人一级黄片| 一区二区三区乱码不卡18| 欧美一级a爱片免费观看看| 中文字幕av成人在线电影| 成人漫画全彩无遮挡| 亚洲av不卡在线观看| 成人亚洲欧美一区二区av| 又粗又硬又长又爽又黄的视频| 亚洲欧美日韩另类电影网站 | 欧美国产精品一级二级三级 | 国产在线视频一区二区| 一本色道久久久久久精品综合| 日韩 亚洲 欧美在线| 亚洲在久久综合| 国产精品秋霞免费鲁丝片| 高清欧美精品videossex| 成人午夜精彩视频在线观看| 欧美日韩精品成人综合77777| 欧美xxxx黑人xx丫x性爽| 亚洲三级黄色毛片| 欧美日韩在线观看h| 99久久综合免费| 成人综合一区亚洲| 精品人妻视频免费看| 精品久久久久久久末码| 一级毛片aaaaaa免费看小| 在线观看免费日韩欧美大片 | 成人漫画全彩无遮挡| 蜜桃久久精品国产亚洲av| 成年美女黄网站色视频大全免费 | 各种免费的搞黄视频| 国产在线视频一区二区| 啦啦啦在线观看免费高清www| 免费黄色在线免费观看| 亚洲色图av天堂| 又粗又硬又长又爽又黄的视频| 成年免费大片在线观看| 插逼视频在线观看| 狂野欧美激情性xxxx在线观看| 欧美日韩亚洲高清精品| 全区人妻精品视频| 免费大片18禁| 中文字幕制服av| 精品一区二区三卡| 亚洲熟女精品中文字幕| 综合色丁香网| 在线亚洲精品国产二区图片欧美 | 亚洲色图av天堂| 日韩av免费高清视频| 美女视频免费永久观看网站| 男女免费视频国产| 久久精品久久精品一区二区三区| 久久久久久久亚洲中文字幕| 亚洲精品日韩av片在线观看| 2021少妇久久久久久久久久久| 亚洲无线观看免费| 色吧在线观看| 国产69精品久久久久777片| 美女脱内裤让男人舔精品视频| 成人特级av手机在线观看| 中文字幕亚洲精品专区| 日韩一本色道免费dvd| 一二三四中文在线观看免费高清| 久久久精品免费免费高清| 日本午夜av视频| 五月天丁香电影| 伦精品一区二区三区| 亚洲一级一片aⅴ在线观看| 久久99热6这里只有精品| 色网站视频免费| 搡老乐熟女国产| 又爽又黄a免费视频| 日韩一本色道免费dvd| 国产精品久久久久久av不卡| 人人妻人人看人人澡| 日韩制服骚丝袜av| 干丝袜人妻中文字幕| 国产av码专区亚洲av| 国产亚洲最大av| 亚洲av在线观看美女高潮| 91午夜精品亚洲一区二区三区| av卡一久久| 另类亚洲欧美激情| 丰满人妻一区二区三区视频av| 免费在线观看成人毛片| 肉色欧美久久久久久久蜜桃| 午夜免费鲁丝| 精品一区二区三卡| 99久久精品热视频| 99热全是精品| 日本黄大片高清| 亚洲色图综合在线观看| 秋霞伦理黄片| 国产精品一及| 国产欧美日韩一区二区三区在线 | 插逼视频在线观看| 国产av国产精品国产| 国产色婷婷99| 亚洲综合色惰| 中文字幕亚洲精品专区| 国产极品天堂在线| 日本欧美国产在线视频| 一个人看的www免费观看视频| 97在线视频观看| 亚洲图色成人| 一区二区三区精品91| 亚洲精品国产av成人精品| 人人妻人人爽人人添夜夜欢视频 | 18禁在线播放成人免费| 成人综合一区亚洲| 日本wwww免费看| 麻豆精品久久久久久蜜桃| 精品熟女少妇av免费看| 毛片一级片免费看久久久久| 人妻一区二区av| 免费不卡的大黄色大毛片视频在线观看| 亚洲av综合色区一区| 日韩欧美 国产精品| 美女福利国产在线 | 在线观看三级黄色| 精品亚洲乱码少妇综合久久| 黄片无遮挡物在线观看| 亚洲欧美日韩另类电影网站 | 少妇猛男粗大的猛烈进出视频| 亚洲av中文字字幕乱码综合| 97超视频在线观看视频| 久久精品夜色国产| 久久久久久久久久人人人人人人| 深爱激情五月婷婷| 亚洲第一av免费看| 亚洲av男天堂| 99热这里只有精品一区| 日产精品乱码卡一卡2卡三| 日本欧美国产在线视频| 女人久久www免费人成看片| 久久ye,这里只有精品| 观看免费一级毛片| 日本vs欧美在线观看视频 | 麻豆成人av视频| 欧美精品国产亚洲| 亚洲精品乱码久久久v下载方式| 亚洲精品久久久久久婷婷小说| 免费观看的影片在线观看| 九草在线视频观看| 综合色丁香网| 中国美白少妇内射xxxbb| 国产亚洲欧美精品永久| 久久久a久久爽久久v久久| 精品国产乱码久久久久久小说| 一级黄片播放器| 午夜福利在线观看免费完整高清在| 久久97久久精品| 国产在线男女| 国产精品三级大全| 日韩电影二区| 一级毛片 在线播放| 晚上一个人看的免费电影| 亚洲av中文av极速乱| 国内精品宾馆在线| 高清午夜精品一区二区三区| 丰满少妇做爰视频| 成人亚洲精品一区在线观看 | h视频一区二区三区| 日本vs欧美在线观看视频 | 一级毛片电影观看| 久久这里有精品视频免费| 亚洲一级一片aⅴ在线观看| 熟妇人妻不卡中文字幕| 男女下面进入的视频免费午夜| 日韩一区二区三区影片| freevideosex欧美| 欧美xxxx性猛交bbbb| 精品熟女少妇av免费看| 亚洲精品国产av成人精品| 国产白丝娇喘喷水9色精品| 在线观看美女被高潮喷水网站| 日韩一区二区视频免费看| 一本色道久久久久久精品综合| 丝瓜视频免费看黄片| 一区在线观看完整版| av女优亚洲男人天堂| 欧美日本视频| 亚洲av男天堂| av在线app专区| 午夜福利在线在线| 啦啦啦视频在线资源免费观看| kizo精华| 一级二级三级毛片免费看| 久久这里有精品视频免费| 777米奇影视久久| 中文字幕人妻熟人妻熟丝袜美| 26uuu在线亚洲综合色| 久久久久性生活片| 天天躁夜夜躁狠狠久久av| 国产精品嫩草影院av在线观看| 成人免费观看视频高清| 99九九线精品视频在线观看视频| 在线播放无遮挡| 精品久久国产蜜桃| a级一级毛片免费在线观看| 久久久国产一区二区| 亚洲人成网站高清观看| 国产男人的电影天堂91| 免费少妇av软件| 日韩大片免费观看网站| 免费黄频网站在线观看国产| 十分钟在线观看高清视频www | 精品人妻一区二区三区麻豆| 一级毛片 在线播放| 成人二区视频| 欧美日韩一区二区视频在线观看视频在线| 99九九线精品视频在线观看视频| 国产中年淑女户外野战色| 久久99热这里只频精品6学生| 尤物成人国产欧美一区二区三区| 午夜福利高清视频| 国模一区二区三区四区视频| 国产成人午夜福利电影在线观看| 九九久久精品国产亚洲av麻豆| 少妇熟女欧美另类| 国产有黄有色有爽视频| 久久久久久久精品精品| 亚洲人成网站在线观看播放| 精品午夜福利在线看| 99久久人妻综合| 国产真实伦视频高清在线观看| 一本一本综合久久| 黄色一级大片看看| 一级毛片久久久久久久久女| 国产欧美日韩精品一区二区| 搡女人真爽免费视频火全软件| 建设人人有责人人尽责人人享有的 | 中文欧美无线码| 能在线免费看毛片的网站| 久久久欧美国产精品| 少妇人妻久久综合中文| 日韩一区二区三区影片| 肉色欧美久久久久久久蜜桃| 青青草视频在线视频观看| 国产一区有黄有色的免费视频| 精品人妻视频免费看| 在线 av 中文字幕| 少妇高潮的动态图| 国产亚洲午夜精品一区二区久久| 高清毛片免费看| 蜜臀久久99精品久久宅男| 亚洲婷婷狠狠爱综合网| 国产成人午夜福利电影在线观看| 十分钟在线观看高清视频www | 丰满少妇做爰视频| 色5月婷婷丁香| 激情 狠狠 欧美| 久久av网站| 视频中文字幕在线观看| 亚洲色图av天堂| videossex国产| 九九在线视频观看精品| 婷婷色综合www| 肉色欧美久久久久久久蜜桃| 久久久久精品性色| 午夜福利在线在线| 欧美成人精品欧美一级黄| 最黄视频免费看| 国产欧美日韩一区二区三区在线 | 国产一区二区三区av在线| 美女视频免费永久观看网站| 日韩不卡一区二区三区视频在线| 免费黄频网站在线观看国产| 一级a做视频免费观看| 国产午夜精品一二区理论片| 色视频在线一区二区三区| 欧美激情极品国产一区二区三区 | 亚洲av欧美aⅴ国产| 欧美xxxx性猛交bbbb| 免费高清在线观看视频在线观看| 亚洲成人一二三区av| 看非洲黑人一级黄片| 国产深夜福利视频在线观看| 各种免费的搞黄视频| 联通29元200g的流量卡| 国产精品一区二区在线不卡| 国产欧美亚洲国产| 国产在视频线精品| 国产乱人视频| 亚洲精品456在线播放app| 最黄视频免费看| 高清在线视频一区二区三区| 一边亲一边摸免费视频| 亚洲欧美成人精品一区二区| 亚洲欧美日韩卡通动漫| 国产高清不卡午夜福利| 在线 av 中文字幕| 国产黄频视频在线观看| 蜜桃久久精品国产亚洲av| 一级毛片 在线播放| 精品一区二区三卡| 一级二级三级毛片免费看| 日韩,欧美,国产一区二区三区| 亚洲高清免费不卡视频| 国产免费一级a男人的天堂| 熟女人妻精品中文字幕| 国产 一区精品| 久久精品国产亚洲av天美| 一本—道久久a久久精品蜜桃钙片| 日韩视频在线欧美| 丰满迷人的少妇在线观看| 黄色配什么色好看| 国产亚洲精品久久久com| 中文天堂在线官网| 一级av片app| 国内揄拍国产精品人妻在线| 少妇精品久久久久久久| 日韩强制内射视频| 免费大片黄手机在线观看| 午夜老司机福利剧场| 寂寞人妻少妇视频99o| 一级黄片播放器| 免费观看a级毛片全部| 99久久人妻综合| 国产男人的电影天堂91| 色5月婷婷丁香| 国产精品久久久久久av不卡| 午夜福利网站1000一区二区三区| 麻豆精品久久久久久蜜桃| 日韩伦理黄色片| 国产高清三级在线| 青春草亚洲视频在线观看| 国产高清三级在线| 国产一区亚洲一区在线观看| 国产精品不卡视频一区二区| 嫩草影院入口| 欧美精品人与动牲交sv欧美| 国产精品久久久久久久久免| av免费在线看不卡| 国产精品国产av在线观看| 久久97久久精品| 高清午夜精品一区二区三区| 99热全是精品| 99久久精品热视频| 久热这里只有精品99| 日本爱情动作片www.在线观看| 大陆偷拍与自拍| 欧美精品亚洲一区二区| 国产一区二区在线观看日韩| tube8黄色片| 一级毛片电影观看| 看十八女毛片水多多多| 亚洲欧美中文字幕日韩二区| 日本午夜av视频| 国产色爽女视频免费观看| 亚洲精品国产成人久久av| 九草在线视频观看| 中文乱码字字幕精品一区二区三区| 国产黄频视频在线观看| 中文在线观看免费www的网站| 欧美国产精品一级二级三级 | 日本午夜av视频| 久久久a久久爽久久v久久| 狂野欧美激情性xxxx在线观看| 亚洲中文av在线| 中文乱码字字幕精品一区二区三区| 男女边摸边吃奶| 精品99又大又爽又粗少妇毛片| 精品午夜福利在线看| 久久av网站| 最后的刺客免费高清国语| 久久久亚洲精品成人影院| 亚洲国产成人一精品久久久| 大片电影免费在线观看免费| 成人高潮视频无遮挡免费网站| 大香蕉97超碰在线| 亚洲欧美日韩无卡精品| 国产精品麻豆人妻色哟哟久久| 国产视频首页在线观看| 网址你懂的国产日韩在线| 黄色视频在线播放观看不卡| 男女下面进入的视频免费午夜| 联通29元200g的流量卡| 久久97久久精品| 在线看a的网站| 一级av片app| 亚州av有码| 高清视频免费观看一区二区| 我要看黄色一级片免费的| 国产精品成人在线| 少妇精品久久久久久久| 综合色丁香网| 身体一侧抽搐| 国产亚洲一区二区精品| 成人国产av品久久久| 18禁在线无遮挡免费观看视频| 国产爱豆传媒在线观看| 欧美高清性xxxxhd video| 国产亚洲午夜精品一区二区久久| 国产白丝娇喘喷水9色精品| 精品人妻熟女av久视频| 视频区图区小说| 人妻 亚洲 视频| 欧美成人a在线观看| 国内少妇人妻偷人精品xxx网站| 午夜精品国产一区二区电影| 少妇的逼好多水| 成人高潮视频无遮挡免费网站| 老司机影院成人| 免费观看a级毛片全部| 日本欧美视频一区| 高清不卡的av网站| 亚洲av欧美aⅴ国产| 少妇被粗大猛烈的视频| 亚洲丝袜综合中文字幕| 欧美成人a在线观看| 午夜日本视频在线| 又爽又黄a免费视频| 久久影院123| 最近中文字幕2019免费版| 建设人人有责人人尽责人人享有的 | 日韩av不卡免费在线播放| 国产视频内射| 在线观看一区二区三区| 成人美女网站在线观看视频| 免费久久久久久久精品成人欧美视频 | 热re99久久精品国产66热6| 免费播放大片免费观看视频在线观看| 精品亚洲成国产av| 久久久国产一区二区| 小蜜桃在线观看免费完整版高清| 欧美性感艳星| .国产精品久久| 亚洲av免费高清在线观看| 中文字幕av成人在线电影| 国产精品久久久久久精品古装| 草草在线视频免费看| 亚洲av成人精品一区久久| 男女国产视频网站| 人妻制服诱惑在线中文字幕| 免费观看的影片在线观看| 男女啪啪激烈高潮av片| 干丝袜人妻中文字幕| 久久精品久久久久久噜噜老黄| 日日啪夜夜爽| 亚洲av福利一区| 久久毛片免费看一区二区三区| 我要看日韩黄色一级片| 国产在线视频一区二区| 18禁在线无遮挡免费观看视频| 在线天堂最新版资源| 亚洲av免费高清在线观看| 国内少妇人妻偷人精品xxx网站| 人妻系列 视频| 哪个播放器可以免费观看大片| 国产久久久一区二区三区| 日韩三级伦理在线观看| av视频免费观看在线观看| 人人妻人人添人人爽欧美一区卜 | 亚洲国产av新网站| 日本欧美视频一区| 噜噜噜噜噜久久久久久91| 久久鲁丝午夜福利片| 午夜福利影视在线免费观看| 国产爱豆传媒在线观看| 欧美丝袜亚洲另类| 日韩精品有码人妻一区| 国产大屁股一区二区在线视频| 精品久久国产蜜桃| 99国产精品免费福利视频| videossex国产| 午夜福利高清视频| 国产精品久久久久久久久免| 亚洲av.av天堂| 欧美变态另类bdsm刘玥| 亚洲色图综合在线观看| 全区人妻精品视频| 97精品久久久久久久久久精品| 亚洲天堂av无毛| 欧美一级a爱片免费观看看| 六月丁香七月|