• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    網(wǎng)絡(luò)爬蟲在信息檢索中的研究與應(yīng)用

    2017-09-07 07:17:38劉鑫
    關(guān)鍵詞:網(wǎng)絡(luò)爬蟲信息檢索

    劉鑫

    摘要:本文從網(wǎng)絡(luò)爬蟲的基本概念、網(wǎng)絡(luò)爬蟲的主要作用、網(wǎng)絡(luò)爬蟲的各種類型和網(wǎng)絡(luò)爬蟲的發(fā)展方向著手進(jìn)行研究。各種爬蟲的研究對(duì)于我們現(xiàn)如今的意義也相當(dāng)重大,通過網(wǎng)絡(luò)爬蟲爬取的特定信息通過專業(yè)分析,可以影響著我們的生活,如經(jīng)濟(jì)、健康、工作效率等方面,本文主要運(yùn)用Python編寫網(wǎng)絡(luò)爬蟲,實(shí)現(xiàn)網(wǎng)絡(luò)爬蟲的功能。了解網(wǎng)絡(luò)爬蟲如何爬取信息,如何存儲(chǔ)所爬取的信息,從而認(rèn)識(shí)其在信息檢索中的關(guān)鍵作用。

    關(guān)鍵詞:網(wǎng)絡(luò)爬蟲;信息檢索;Python

    中圖分類號(hào):TP391.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)05-0095-03

    1 緒論

    當(dāng)今社會(huì),數(shù)據(jù)顯得越來(lái)越重要,以往人們也意識(shí)到數(shù)據(jù)的重要性,但是以前的情況面對(duì)浩如煙海的數(shù)據(jù),人們往往望洋興嘆。因?yàn)橐砸郧暗臄?shù)據(jù)處理能力,很難對(duì)大量的數(shù)據(jù)信息進(jìn)行處理分析。隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)的處理能力得到了極大的提高,尤其是近幾年開啟的云時(shí)代,讓人們迎來(lái)了大數(shù)據(jù)時(shí)代,人們?cè)谔幚頂?shù)據(jù)的能力得到提高的時(shí)候,生產(chǎn)數(shù)據(jù)的能力也得到了極大的提升,因此獲得數(shù)據(jù),處理數(shù)據(jù)是人們提高對(duì)數(shù)據(jù)的利用的關(guān)鍵。

    網(wǎng)絡(luò)爬蟲可以很容易的獲取互聯(lián)網(wǎng)上的信息,是我們獲取大量網(wǎng)絡(luò)上信息的高效工具,現(xiàn)如今有各種各樣的網(wǎng)絡(luò)爬蟲在以不同的方式獲取網(wǎng)絡(luò)上的數(shù)據(jù),抓取網(wǎng)絡(luò)上有用的數(shù)據(jù),方便人們對(duì)數(shù)據(jù)進(jìn)行分析和利用。本課題對(duì)于網(wǎng)絡(luò)爬蟲進(jìn)行研究,了解其在信息檢索中的應(yīng)用,并設(shè)計(jì)簡(jiǎn)單的網(wǎng)絡(luò)爬蟲,實(shí)現(xiàn)其功能。

    2 網(wǎng)絡(luò)爬蟲的基本概念

    網(wǎng)絡(luò)爬蟲(Web Crawler),又稱為網(wǎng)絡(luò)蜘蛛(Web Spider)或Web信息采集器,是一個(gè)自動(dòng)下載網(wǎng)頁(yè)的計(jì)算機(jī)程序或自動(dòng)化腳本,是搜索引擎的重要組成部分。網(wǎng)絡(luò)爬蟲通常從一個(gè)稱為種子集的URL集合開始運(yùn)行,它首先將這些URL全部放入到一個(gè)有序的待爬行隊(duì)列里,按照一定的順序從中取出URL并下載所指向的頁(yè)面,分析頁(yè)面內(nèi)容,提取新的URL并存入待爬行URL隊(duì)列中,如此重復(fù)上面的過程,直到URL隊(duì)列為空或滿足某個(gè)爬行終止條件,從而遍歷Web。該過程稱為網(wǎng)絡(luò)爬行(Web Crawling)[1]。

    對(duì)于網(wǎng)絡(luò)爬蟲,基本的工作流程首先要有一個(gè)初始的URL,這個(gè)URL可以是一開始自己確定好,也可以是由用戶輸入獲得,然后通過URL獲取到網(wǎng)頁(yè)的信息,接著抓取網(wǎng)頁(yè)內(nèi)的相關(guān)URL,對(duì)于滿足條件的信息進(jìn)行抓取,直到所有的條件滿足才結(jié)束爬取的過程。當(dāng)然,這只是對(duì)于網(wǎng)絡(luò)爬蟲大概的一個(gè)爬取過程,對(duì)于不同的網(wǎng)絡(luò)爬蟲來(lái)說,爬取的過程是不同的,但是他們都需要有一個(gè)URL,然后還有過濾的條件,以及存儲(chǔ)所抓取到的信息的過程。

    3 網(wǎng)絡(luò)爬蟲的類型

    網(wǎng)絡(luò)爬蟲根據(jù)不同的應(yīng)用,爬蟲系統(tǒng)在許多方面也存在著不同的差異,按照系統(tǒng)結(jié)構(gòu)和實(shí)現(xiàn)技術(shù),我們可以將網(wǎng)絡(luò)爬蟲分為以下幾類:通用型網(wǎng)絡(luò)爬蟲(General Purpose Web Crawler)、聚焦網(wǎng)絡(luò)爬蟲(Focused Web Crawler)、增量式網(wǎng)絡(luò)爬蟲(Incremental Web Crawler)、深層網(wǎng)絡(luò)爬蟲(Deep Web Crawler)。當(dāng)然,實(shí)際上的網(wǎng)絡(luò)爬蟲不會(huì)是單一的技術(shù)實(shí)現(xiàn),通常是由多種網(wǎng)絡(luò)爬蟲技術(shù)結(jié)合而成[2]。

    3.1 通用網(wǎng)絡(luò)爬蟲

    通用網(wǎng)絡(luò)爬蟲通常用于搜索引擎,它能從一些種子URL爬取大量網(wǎng)站,甚至是整個(gè)Web,僅僅受限于時(shí)間或者其他方面的限制,它的邏輯相比于其他提取規(guī)則的復(fù)雜的網(wǎng)絡(luò)爬蟲較為簡(jiǎn)單,但是其作用不可小覷。它主要用于門戶站點(diǎn)搜索引擎和為大型的Web服務(wù)提供商采集數(shù)據(jù)。由于商業(yè)原因,這方面性能優(yōu)秀爬蟲的技術(shù)細(xì)節(jié)很少披露,但是此類的網(wǎng)絡(luò)爬蟲爬行的范圍和數(shù)量巨大,并且其爬行的速度快,存儲(chǔ)空間比較大。它們通常采用并行的方式,對(duì)爬行頁(yè)面的順序要求比較低,但是由于要刷新的頁(yè)面很多,很長(zhǎng)時(shí)間頁(yè)面才能刷新一次。雖然其有一定缺陷,但是通用爬蟲適用于搜索引擎,有比較強(qiáng)的應(yīng)用價(jià)值,其結(jié)構(gòu)如圖1所示。

    通用網(wǎng)絡(luò)爬蟲通常會(huì)采取一些爬行策略來(lái)提高爬行效率,如:深度優(yōu)先策略、廣度優(yōu)先策略、最佳優(yōu)先策略等。

    (1)深度優(yōu)先策略。深度優(yōu)先策略所采取主要方法是按照由低到高的順序,它首先從起始網(wǎng)頁(yè)中的URL選擇一個(gè)進(jìn)入,然后對(duì)這個(gè)網(wǎng)頁(yè)中的URL進(jìn)行分析,接著再選擇其中的一個(gè)URL進(jìn)入,就像這樣不斷的層層深入,一個(gè)接著一個(gè)鏈接抓取,直到?jīng)]有鏈接,不能深入為止。當(dāng)一個(gè)分支爬取完后爬蟲會(huì)返回上個(gè)分支繼續(xù)爬取未爬取的鏈接,直到所有的鏈接遍歷完成后,這時(shí)的爬行任務(wù)才算結(jié)束。其實(shí),深度優(yōu)先策略設(shè)計(jì)較為簡(jiǎn)單,但是若其爬取較深的站點(diǎn)時(shí)會(huì)造成資源的大量浪費(fèi),而且隨著鏈接的深入,鏈接自身的價(jià)值往往較低,所有相較于其它兩種策略,通常這種策略很少被用到。(2)廣度優(yōu)先策略。廣度優(yōu)先策略是指在爬蟲爬取的過程中先完成當(dāng)前頁(yè)的所有爬取工作再進(jìn)入下一層進(jìn)行爬取,等下一層的爬取工作結(jié)束后再逐步深入進(jìn)行爬取。此策略能控制爬行深度,避免了遇到一個(gè)無(wú)窮深的分支無(wú)法結(jié)束爬取浪費(fèi)資源的情況。廣度優(yōu)先策略通常和網(wǎng)頁(yè)過濾技術(shù)結(jié)合使用,先通過廣度優(yōu)先策略抓取網(wǎng)頁(yè),然后過濾掉無(wú)關(guān)的網(wǎng)頁(yè)。但是此策略也有缺點(diǎn),當(dāng)抓取的網(wǎng)頁(yè)過多時(shí)有許多無(wú)關(guān)的網(wǎng)頁(yè)也會(huì)被下載并且過濾,影響效率,并且此策略要爬取目錄較深的網(wǎng)頁(yè)時(shí),需要耗費(fèi)大量時(shí)間。(3)最佳優(yōu)先策略。最佳優(yōu)先策略是先按照一定的網(wǎng)頁(yè)分析算法進(jìn)行分析,預(yù)選出幾個(gè)和需求相似度高或者主題相近的URL進(jìn)行爬取,它只爬取經(jīng)過網(wǎng)頁(yè)分析算法認(rèn)為“有用”的URL,這種算法可以節(jié)約大量資源,改善了前兩種策略的不足,但是此策略也有所不足,由于網(wǎng)頁(yè)分析算法不夠精確,所以有可能忽略大量相關(guān)的網(wǎng)頁(yè),所以需要結(jié)合具體的應(yīng)用改善此策略。

    3.2 聚焦網(wǎng)絡(luò)爬蟲

    傳統(tǒng)的網(wǎng)絡(luò)爬蟲通常被設(shè)計(jì)成盡可能多的覆蓋網(wǎng)絡(luò),對(duì)于需要爬取頁(yè)面的順序和爬取網(wǎng)頁(yè)主題是否相關(guān)關(guān)注度不是很大。聚焦網(wǎng)絡(luò)爬蟲解決了這一問題,它定向爬取與主題相關(guān)的頁(yè)面,有選擇的訪問互聯(lián)網(wǎng)上的網(wǎng)頁(yè)和相關(guān)鏈接,極大的節(jié)約了資源和時(shí)間,適用于特定人員對(duì)特定特定領(lǐng)域信息獲取的需求。endprint

    聚焦網(wǎng)絡(luò)爬蟲需要解決幾個(gè)問題,如:如何對(duì)目標(biāo)網(wǎng)頁(yè)進(jìn)行描述,如何對(duì)網(wǎng)頁(yè)和數(shù)據(jù)進(jìn)行分析和過濾,還有就是對(duì)URL的搜索和排序策略,為了解決以上問題,聚焦網(wǎng)絡(luò)爬蟲有以下幾種實(shí)現(xiàn)策略:

    (1)基于內(nèi)容評(píng)價(jià)的爬行策略。它將用戶輸入的查詢?cè)~作為主題,將文本相似度的計(jì)算方法引入到網(wǎng)絡(luò)爬蟲中,它爬取包含用戶輸入查詢?cè)~的頁(yè)面,但是不能判斷所抓取的頁(yè)面與主題關(guān)系的相關(guān)程度的高低后來(lái)有人利用空間向量模型計(jì)算和頁(yè)面主題的相關(guān)程度,改善了這一缺點(diǎn);(2)基于鏈接結(jié)構(gòu)評(píng)價(jià)的爬行策略。此爬行策略訪問網(wǎng)頁(yè)中的鏈接,它通過HITS方法對(duì)網(wǎng)頁(yè)中的鏈接進(jìn)行評(píng)估,并按照一定的方法決定鏈接的訪問順序,還有的一種評(píng)估方法是通過PageRank算法,比較PageRank的值對(duì)網(wǎng)頁(yè)中的鏈接進(jìn)行排序訪問;(3)基于增強(qiáng)學(xué)習(xí)的爬行策略。此策略是將增強(qiáng)學(xué)習(xí)引入聚焦爬蟲,利用貝葉斯分類器講網(wǎng)頁(yè)中的超鏈接按文本和超鏈接文本進(jìn)行分類,計(jì)算出鏈接的重要性,根據(jù)這個(gè)決定鏈接的訪問順序;(4)基于語(yǔ)境圖的爬行策略。M.Diligenti.[3]等人提出了通過建立語(yǔ)境圖(Context Graphs)學(xué)習(xí)網(wǎng)頁(yè)之間的相關(guān)度,從而訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),通過這個(gè)機(jī)器學(xué)習(xí)系統(tǒng)可以計(jì)算當(dāng)前頁(yè)面到相關(guān)的網(wǎng)頁(yè)距離,距離越近的的網(wǎng)頁(yè)鏈接優(yōu)先。

    3.3 增量式網(wǎng)絡(luò)爬蟲

    增量式網(wǎng)絡(luò)爬蟲(Incremental Web Crawler)是指對(duì)已下載網(wǎng)頁(yè)采取增量式更新,為保證爬取的網(wǎng)頁(yè)都是盡可能新的網(wǎng)頁(yè),所以此爬蟲只爬取新產(chǎn)生或者已經(jīng)發(fā)生變化的網(wǎng)頁(yè)。與周期性爬行和刷新頁(yè)面的網(wǎng)絡(luò)爬蟲對(duì)比,增量式爬蟲只在網(wǎng)頁(yè)新產(chǎn)生或者發(fā)生變化的頁(yè)面才進(jìn)行爬取,因而減少了數(shù)據(jù)的下載,節(jié)約了時(shí)間和空間等各種資源,但是其爬行的算法相較而言更復(fù)雜而且實(shí)現(xiàn)難度大大增加[4]。

    增量式爬蟲主要是為了保證本地爬取到的網(wǎng)頁(yè)為最新網(wǎng)頁(yè),并提高本地頁(yè)面的質(zhì)量,為了達(dá)到這兩點(diǎn)要求,我們要做到以下幾種方法:

    (1)統(tǒng)一更新:爬蟲需以相同的頻率訪問所有網(wǎng)頁(yè),且不考慮網(wǎng)頁(yè)的改變頻率;(2)個(gè)體更新:爬蟲需根據(jù)個(gè)體網(wǎng)頁(yè)的改變頻率來(lái)重新訪問各頁(yè)面;(3)基于分類的更新:爬蟲根據(jù)網(wǎng)頁(yè)改變頻率將網(wǎng)頁(yè)分為更新較快和較慢的網(wǎng)頁(yè)子集,然后以不同的訪問頻率對(duì)這兩類網(wǎng)頁(yè)進(jìn)行訪問。

    4 系統(tǒng)分析

    本課題所做的是一個(gè)爬取百度貼吧內(nèi)容的網(wǎng)絡(luò)爬蟲,主要用urllib2模塊編寫爬蟲,還有其他爬蟲用requests模塊編寫,進(jìn)行對(duì)比,現(xiàn)在主要談爬取百度貼吧的網(wǎng)絡(luò)爬蟲,通過獲得一個(gè)初始URL,頁(yè)面爬行模塊在互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè),經(jīng)過分析模塊將抓取的頁(yè)面放入頁(yè)面庫(kù)中,并且過濾頁(yè)面中的超鏈接放入U(xiǎn)RL隊(duì)列,從而進(jìn)行下一輪的頁(yè)面抓取。對(duì)于所需要編寫的網(wǎng)絡(luò)爬蟲先要得到一個(gè)URL,然后通過URL抓取頁(yè)面,接著對(duì)頁(yè)面內(nèi)容進(jìn)行分析,滿足過濾條件的(即正則表達(dá)式)的存入頁(yè)面庫(kù),不滿足的接著爬取,直到相關(guān)的URL爬取完畢,如流程圖2所示。

    對(duì)于網(wǎng)絡(luò)爬蟲爬取貼吧的內(nèi)容需要有爬蟲自動(dòng)抓取,但是初始的URL要由人為定義,并且對(duì)于抓取到的內(nèi)容要進(jìn)行過濾,獲得自己需要的內(nèi)容,剔除那些不需要的內(nèi)容,將過濾后所得的需要的內(nèi)容存儲(chǔ)起來(lái)。這些只是最基本的功能,如果能夠進(jìn)一步完善人機(jī)交互的話,會(huì)使得本課題更加完善,如做出一個(gè)界面友好的前端等。

    由于貼吧的信息容量大小不確定,所以此網(wǎng)絡(luò)爬蟲的工作量也挺難確定,而且還要對(duì)爬取的內(nèi)容進(jìn)行過濾,取得想要爬取的信息,而且只是在個(gè)人的筆記本電腦上運(yùn)行網(wǎng)絡(luò)爬蟲的程序,這樣有可能降低爬行的效率。但是對(duì)于本課題來(lái)說,我們編寫的網(wǎng)絡(luò)爬蟲比較小,在普通的個(gè)人筆記本電腦足以運(yùn)行,完全不影響運(yùn)行的效率。此外,我們還可以通過改變網(wǎng)絡(luò)爬蟲的爬行策略來(lái)提高網(wǎng)絡(luò)爬蟲的運(yùn)行效率。對(duì)于貼吧的網(wǎng)絡(luò)爬蟲來(lái)說,通常貼吧的基礎(chǔ)架構(gòu)變動(dòng)不是很大,所以不用擔(dān)心因?yàn)榫W(wǎng)站的改變,網(wǎng)絡(luò)爬蟲不能使用。此外這個(gè)爬蟲經(jīng)過很多人試驗(yàn)過,功能是能夠?qū)崿F(xiàn)的,還有,這個(gè)網(wǎng)絡(luò)爬蟲是由Python語(yǔ)言編寫的,Python語(yǔ)言具有強(qiáng)大而且豐富的庫(kù),對(duì)代碼的可用性和可靠性提供了強(qiáng)有力的保障,所以此網(wǎng)絡(luò)爬蟲在可靠性和可用性的需求也是滿足的[5]。

    對(duì)于本課題,主要研究了貼吧爬蟲的爬取過程,對(duì)于以后可能還要研究爬取其他信息的網(wǎng)絡(luò)爬蟲,此外對(duì)于網(wǎng)絡(luò)爬蟲也要求有良好的用戶體驗(yàn),最好能增加一點(diǎn)用戶界面的友好性,還有對(duì)于不同爬行策略的網(wǎng)絡(luò)爬蟲的性能進(jìn)行對(duì)比,從而編寫出目的性更強(qiáng),性能更強(qiáng)的高效的網(wǎng)絡(luò)爬蟲,此外我們還應(yīng)當(dāng)考慮對(duì)于網(wǎng)絡(luò)爬蟲爬取到的信息處理問題等。

    5 系統(tǒng)設(shè)計(jì)

    5.1 抓取貼吧信息爬蟲

    網(wǎng)絡(luò)爬蟲主要是爬取互聯(lián)網(wǎng)上的網(wǎng)頁(yè)信息,獲得需求的目標(biāo)信息。對(duì)于這個(gè)貼吧的網(wǎng)絡(luò)爬蟲要包括的模塊有頁(yè)面爬行模塊、頁(yè)面分析模塊、頁(yè)面過濾模塊、還有頁(yè)面數(shù)據(jù)的保存模塊。

    5.2 抓取貼吧圖片爬蟲

    對(duì)于貼吧的圖片爬取,我設(shè)計(jì)的比較簡(jiǎn)單,功能模塊因?yàn)榕廊≠N吧信息的網(wǎng)絡(luò)爬蟲都有,也包括頁(yè)面爬行模塊、頁(yè)面分析模塊、頁(yè)面過濾模塊、還有頁(yè)面數(shù)據(jù)的保存模塊

    5.3 詳細(xì)設(shè)計(jì)

    對(duì)于貼吧的網(wǎng)絡(luò)爬蟲來(lái)說,首先要有一個(gè)URL,此次做的網(wǎng)絡(luò)爬蟲初始的URL前半部分是http://tieba.baidu.com/p/,這部分內(nèi)容針對(duì)的是百度貼吧,由于百度貼吧的內(nèi)容比較多,分類也煩雜,此時(shí)我們要求用戶輸入貼吧的頁(yè)碼,如3138733512,接著網(wǎng)絡(luò)爬蟲開始運(yùn)行。對(duì)于百度貼吧,如果我們只爬取樓主發(fā)表的信息所以我們需要把樓主的信息放入類的初始化上,即init方法,除此之外我們還要將貼吧中比較重要的帖子頁(yè)碼這一參數(shù)放入此方法中。通過對(duì)網(wǎng)頁(yè)源代碼的分析,我們發(fā)現(xiàn)百度貼吧的每一層的主要內(nèi)容都在標(biāo)簽

    里面,因此我們采用的正則表達(dá)式來(lái)實(shí)現(xiàn)。 查看運(yùn)行結(jié)果我們發(fā)現(xiàn)除了我們需要爬取的樓層內(nèi)容之外,還包含了大量的換行符和圖片符,因此我們需要對(duì)所抓取的內(nèi)容進(jìn)行處理,將這些沒用的標(biāo)簽去除掉,從而得到我們真正想要的純正的信息[6]。endprint

    針對(duì)此類情況,我們編寫一個(gè)Tool類,在它的里面定義一個(gè)替換各種標(biāo)簽的方法replace,其中也定義了幾個(gè)正則表達(dá)式,re.sub方法對(duì)抓取的信息進(jìn)行匹配替換處理,在代碼運(yùn)行后,我們需要寫入需要爬行貼吧的具體URL,然后會(huì)讓我們選擇是否只爬取樓主的發(fā)表信息,接著會(huì)選擇是否寫入樓層信息,當(dāng)選擇完畢后,爬蟲開始爬取所需要的信息并寫入文件,運(yùn)行完成后會(huì)生成一個(gè)TXT文件,上面有所需要抓取的信息。

    6 結(jié)語(yǔ)

    對(duì)于網(wǎng)絡(luò)爬蟲的發(fā)展主要要看信息檢索的發(fā)展方向,這些可以從國(guó)內(nèi)外的搜索引擎哪里看出一些端倪,伴隨著大數(shù)據(jù),云計(jì)算的浪潮,網(wǎng)絡(luò)爬蟲肯定會(huì)得到進(jìn)一步的發(fā)展,對(duì)于信息爬取的效率也越來(lái)越高,不僅僅是信息爬取的速提高,而且信息爬取的準(zhǔn)確性也會(huì)提高,而人們通過對(duì)于這些爬取下來(lái)的信息進(jìn)行分析,會(huì)讓這些信息充分發(fā)揮其作用。網(wǎng)絡(luò)爬蟲的設(shè)計(jì)將來(lái)會(huì)越來(lái)越智能化,不僅僅能高效的爬取需要爬取的信息,還能智能化的預(yù)測(cè)爬取相關(guān)需要的信息,如果這一功能將來(lái)得到實(shí)現(xiàn),運(yùn)用到智能機(jī)器人的身上,將會(huì)使機(jī)器人更趨于人類的思考方式。

    參考文獻(xiàn)

    [1]張海藩,袁勤勇,李曄.軟件工程導(dǎo)論[M].北京:清華大學(xué)出版社,2010.

    [2][美]Justin Seitz 著.孫松柏,李聰,潤(rùn)秋譯.Python黑帽子-黑客與滲透測(cè)試編程之道[M].北京:電子工業(yè)出版社,2015.

    [3]M.Diligenti.,F(xiàn).Coetzee, S.Lawtence, et al.F0cused crawling using context graphs[C].In Proceedings of 26th International Confer-ence on Very Large Database,Cairo,Egypt.2000.

    [4][美]Justin Seitz 著.丁赟卿,譯.Python灰帽子-黑客與逆向工程師的Python編程之道[M].北京:電子工業(yè)出版社,2011.

    [5]Mark Lutz著.鄒曉,瞿喬.任發(fā)科譯.Python編程(上下兩冊(cè))[M].北京:中國(guó)電力出版社,2015.

    [6]羅剛,王振東,著.自己動(dòng)手寫網(wǎng)絡(luò)爬蟲[M].北京:清華大學(xué)出版社,2010.endprint

    猜你喜歡
    網(wǎng)絡(luò)爬蟲信息檢索
    煉鐵廠鐵量網(wǎng)頁(yè)數(shù)據(jù)獲取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    基于社會(huì)網(wǎng)絡(luò)分析的權(quán)威網(wǎng)頁(yè)挖掘研究
    主題搜索引擎中網(wǎng)絡(luò)爬蟲的實(shí)現(xiàn)研究
    醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
    新聞傳播(2016年18期)2016-07-19 10:12:06
    淺析如何應(yīng)對(duì)網(wǎng)絡(luò)爬蟲流量
    基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
    教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計(jì)與實(shí)施
    河南科技(2014年11期)2014-02-27 14:10:19
    公共圖書館信息檢索服務(wù)的實(shí)踐探索——以上海浦東圖書館為例
    圖書館界(2013年5期)2013-03-11 18:50:29
    97碰自拍视频| 日韩欧美一区二区三区在线观看| 亚洲成人精品中文字幕电影| 亚洲成人精品中文字幕电影| 亚洲av第一区精品v没综合| 成人av在线播放网站| 嫁个100分男人电影在线观看| 在线观看免费午夜福利视频| 91久久精品国产一区二区成人 | 久久婷婷人人爽人人干人人爱| 国产高潮美女av| 黄色成人免费大全| 欧美三级亚洲精品| 亚洲专区中文字幕在线| 欧美一区二区国产精品久久精品| 久久久久久久久久黄片| 一边摸一边抽搐一进一小说| 观看免费一级毛片| 国产一区二区三区视频了| 国产精品一及| 美女cb高潮喷水在线观看| 亚洲人成网站在线播| 特级一级黄色大片| 美女免费视频网站| 免费人成视频x8x8入口观看| av黄色大香蕉| 小说图片视频综合网站| 中文字幕人妻丝袜一区二区| 国产真实乱freesex| 亚洲av成人精品一区久久| 变态另类成人亚洲欧美熟女| 免费电影在线观看免费观看| 国产高清有码在线观看视频| 日韩亚洲欧美综合| 午夜精品一区二区三区免费看| 怎么达到女性高潮| 日韩人妻高清精品专区| 乱人视频在线观看| 亚洲精品456在线播放app | 国产色爽女视频免费观看| 国产精品1区2区在线观看.| 国产真人三级小视频在线观看| 偷拍熟女少妇极品色| 真人一进一出gif抽搐免费| 亚洲国产色片| 中文字幕精品亚洲无线码一区| 日本撒尿小便嘘嘘汇集6| 美女cb高潮喷水在线观看| 成人av在线播放网站| 麻豆国产av国片精品| 99精品久久久久人妻精品| 母亲3免费完整高清在线观看| 免费观看的影片在线观看| 夜夜爽天天搞| 午夜福利视频1000在线观看| x7x7x7水蜜桃| 精品久久久久久成人av| 九九在线视频观看精品| 国产成人福利小说| 国产日本99.免费观看| 在线播放无遮挡| 久久欧美精品欧美久久欧美| а√天堂www在线а√下载| www国产在线视频色| 国产伦在线观看视频一区| av中文乱码字幕在线| 叶爱在线成人免费视频播放| 一卡2卡三卡四卡精品乱码亚洲| 激情在线观看视频在线高清| 午夜a级毛片| 90打野战视频偷拍视频| 国产成人福利小说| 黄色丝袜av网址大全| 亚洲人成伊人成综合网2020| 久99久视频精品免费| 亚洲国产中文字幕在线视频| 国产伦精品一区二区三区四那| 伊人久久精品亚洲午夜| 精品一区二区三区人妻视频| 久久久成人免费电影| 亚洲精品影视一区二区三区av| 亚洲不卡免费看| 亚洲av二区三区四区| 国产精品av视频在线免费观看| 亚洲五月天丁香| 国内久久婷婷六月综合欲色啪| 久久国产精品影院| 天堂动漫精品| aaaaa片日本免费| 国产熟女xx| 村上凉子中文字幕在线| 亚洲五月天丁香| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 欧美乱码精品一区二区三区| 最新中文字幕久久久久| 午夜福利视频1000在线观看| 在线播放无遮挡| 亚洲国产精品sss在线观看| 国产高清有码在线观看视频| xxx96com| av在线蜜桃| 亚洲精品粉嫩美女一区| tocl精华| 老司机午夜福利在线观看视频| 老司机午夜福利在线观看视频| 欧美国产日韩亚洲一区| 国产在视频线在精品| 一区二区三区国产精品乱码| 色综合婷婷激情| 日韩精品中文字幕看吧| 精品国产超薄肉色丝袜足j| 亚洲美女黄片视频| www.色视频.com| 国产精品女同一区二区软件 | 国产真实伦视频高清在线观看 | 亚洲 国产 在线| 亚洲狠狠婷婷综合久久图片| 日本三级黄在线观看| 欧美区成人在线视频| 国产主播在线观看一区二区| 欧美乱妇无乱码| 天堂av国产一区二区熟女人妻| 日韩中文字幕欧美一区二区| 亚洲美女黄片视频| 国产欧美日韩一区二区三| 中文字幕人成人乱码亚洲影| 九九久久精品国产亚洲av麻豆| 噜噜噜噜噜久久久久久91| 久久久久久久精品吃奶| 国产麻豆成人av免费视频| 一本精品99久久精品77| 精品久久久久久成人av| 手机成人av网站| 午夜免费观看网址| 欧美色欧美亚洲另类二区| 一个人看视频在线观看www免费 | 亚洲精品456在线播放app | 叶爱在线成人免费视频播放| 亚洲精品美女久久久久99蜜臀| 亚洲av第一区精品v没综合| 久久久色成人| 欧美中文综合在线视频| 一本综合久久免费| 色老头精品视频在线观看| 国产精品1区2区在线观看.| ponron亚洲| 九九久久精品国产亚洲av麻豆| tocl精华| 欧美激情久久久久久爽电影| 国产精品三级大全| 亚洲人成网站在线播| 久久香蕉精品热| 国产亚洲欧美在线一区二区| 亚洲男人的天堂狠狠| 日本黄色视频三级网站网址| 亚洲av一区综合| 日韩欧美在线二视频| 亚洲精品在线美女| 搡老妇女老女人老熟妇| 人妻丰满熟妇av一区二区三区| 亚洲精品在线观看二区| 久久久久九九精品影院| 在线观看舔阴道视频| 男女下面进入的视频免费午夜| www.www免费av| 成人欧美大片| ponron亚洲| 亚洲av免费在线观看| 嫩草影院精品99| 日本 欧美在线| 校园春色视频在线观看| 全区人妻精品视频| 午夜福利欧美成人| 亚洲av日韩精品久久久久久密| bbb黄色大片| 日本三级黄在线观看| 久久精品国产综合久久久| 手机成人av网站| 精华霜和精华液先用哪个| 乱人视频在线观看| 黄色片一级片一级黄色片| 亚洲欧美日韩高清在线视频| 欧美激情久久久久久爽电影| 中文字幕av成人在线电影| 97人妻精品一区二区三区麻豆| 久久久久久大精品| 国产精品嫩草影院av在线观看 | 亚洲在线自拍视频| 757午夜福利合集在线观看| 日韩免费av在线播放| 亚洲av美国av| 中国美女看黄片| 亚洲不卡免费看| 欧美日韩精品网址| 男人舔女人下体高潮全视频| 欧美激情在线99| 精品人妻一区二区三区麻豆 | 亚洲成av人片免费观看| 国产探花极品一区二区| 国产一区二区激情短视频| 老司机午夜福利在线观看视频| 国产精品98久久久久久宅男小说| 久久精品国产清高在天天线| 午夜亚洲福利在线播放| 最近最新免费中文字幕在线| 母亲3免费完整高清在线观看| 午夜激情福利司机影院| 亚洲中文日韩欧美视频| 亚洲国产高清在线一区二区三| 搡老岳熟女国产| 欧美性猛交╳xxx乱大交人| 老司机午夜十八禁免费视频| 亚洲av中文字字幕乱码综合| 一a级毛片在线观看| 18禁在线播放成人免费| 超碰av人人做人人爽久久 | 禁无遮挡网站| 欧美丝袜亚洲另类 | 最新中文字幕久久久久| 精品免费久久久久久久清纯| 首页视频小说图片口味搜索| 香蕉久久夜色| 国产黄a三级三级三级人| 久久草成人影院| 欧美三级亚洲精品| 制服丝袜大香蕉在线| 国产综合懂色| 91av网一区二区| 亚洲av免费高清在线观看| 又黄又粗又硬又大视频| 亚洲精品粉嫩美女一区| 成人18禁在线播放| 亚洲成人中文字幕在线播放| 熟女人妻精品中文字幕| 老司机在亚洲福利影院| 综合色av麻豆| 亚洲人成网站高清观看| 婷婷六月久久综合丁香| 精品日产1卡2卡| av在线蜜桃| 狠狠狠狠99中文字幕| 99热这里只有是精品50| 国产精品久久久久久精品电影| e午夜精品久久久久久久| 动漫黄色视频在线观看| 在线观看午夜福利视频| 日本熟妇午夜| 中文字幕熟女人妻在线| 亚洲在线自拍视频| 18禁国产床啪视频网站| 少妇的丰满在线观看| 免费在线观看影片大全网站| 一区二区三区免费毛片| 搞女人的毛片| 亚洲精品美女久久久久99蜜臀| 老司机福利观看| 成人特级av手机在线观看| 真人一进一出gif抽搐免费| 亚洲av五月六月丁香网| 中文字幕熟女人妻在线| 一级毛片高清免费大全| 男女床上黄色一级片免费看| 国产综合懂色| 国产高清激情床上av| 免费在线观看亚洲国产| 一进一出抽搐gif免费好疼| 午夜福利在线观看吧| 真实男女啪啪啪动态图| 我的老师免费观看完整版| 他把我摸到了高潮在线观看| www.www免费av| 日本三级黄在线观看| 国产精品久久久久久久电影 | 国产精品美女特级片免费视频播放器| 精品人妻一区二区三区麻豆 | 国产色婷婷99| 精品电影一区二区在线| 乱人视频在线观看| 成人亚洲精品av一区二区| 欧美日韩综合久久久久久 | ponron亚洲| 十八禁人妻一区二区| 岛国在线观看网站| 欧美日韩乱码在线| 一本综合久久免费| 99国产综合亚洲精品| 窝窝影院91人妻| 国产欧美日韩一区二区三| 欧美成人免费av一区二区三区| 国产三级中文精品| 亚洲人成电影免费在线| 91久久精品电影网| 久9热在线精品视频| 国产精品亚洲一级av第二区| 欧美成人一区二区免费高清观看| 老司机在亚洲福利影院| 丝袜美腿在线中文| 婷婷亚洲欧美| 亚洲国产精品成人综合色| 国产熟女xx| 国产精品日韩av在线免费观看| 国产色爽女视频免费观看| 亚洲片人在线观看| 欧美中文综合在线视频| 亚洲精品日韩av片在线观看 | 日韩欧美 国产精品| 免费看十八禁软件| 精品不卡国产一区二区三区| 亚洲精品久久国产高清桃花| 三级男女做爰猛烈吃奶摸视频| av视频在线观看入口| 国产午夜精品论理片| 丰满乱子伦码专区| 窝窝影院91人妻| 99精品欧美一区二区三区四区| 国产高清videossex| 国产真人三级小视频在线观看| 两人在一起打扑克的视频| 精品电影一区二区在线| 18禁黄网站禁片午夜丰满| 1000部很黄的大片| 禁无遮挡网站| 国产一级毛片七仙女欲春2| 99riav亚洲国产免费| 国语自产精品视频在线第100页| 日本a在线网址| 国产午夜精品论理片| a级毛片a级免费在线| 亚洲欧美日韩高清在线视频| 老汉色av国产亚洲站长工具| 高潮久久久久久久久久久不卡| 黄片小视频在线播放| 日本在线视频免费播放| 免费av毛片视频| 亚洲人成网站在线播| 日韩成人在线观看一区二区三区| 国产单亲对白刺激| 国产一区在线观看成人免费| 亚洲avbb在线观看| 日本 av在线| 中出人妻视频一区二区| 一级a爱片免费观看的视频| 两人在一起打扑克的视频| 国产精品久久久久久亚洲av鲁大| 国产日本99.免费观看| 此物有八面人人有两片| 国产视频内射| 一区二区三区高清视频在线| 免费看美女性在线毛片视频| 成人亚洲精品av一区二区| 欧美日韩综合久久久久久 | 真人一进一出gif抽搐免费| 国产高清三级在线| 久久久久久九九精品二区国产| 岛国在线免费视频观看| 99热这里只有精品一区| 成人av一区二区三区在线看| 国产黄色小视频在线观看| 夜夜躁狠狠躁天天躁| 亚洲国产精品sss在线观看| 国产精品嫩草影院av在线观看 | 国产视频内射| 亚洲 国产 在线| 成人无遮挡网站| 亚洲中文日韩欧美视频| 国产高清激情床上av| 国产精品 国内视频| 精品久久久久久成人av| 欧美日韩黄片免| 日本免费a在线| 亚洲avbb在线观看| 国产免费一级a男人的天堂| 最近最新中文字幕大全免费视频| 国产探花在线观看一区二区| 3wmmmm亚洲av在线观看| 在线观看日韩欧美| 一个人看的www免费观看视频| 成人午夜高清在线视频| 亚洲国产精品合色在线| 中亚洲国语对白在线视频| av天堂中文字幕网| 嫁个100分男人电影在线观看| 全区人妻精品视频| 午夜精品久久久久久毛片777| 久久久久久九九精品二区国产| 可以在线观看的亚洲视频| 中文字幕av成人在线电影| 少妇人妻精品综合一区二区 | 男人舔女人下体高潮全视频| 高清在线国产一区| 天堂动漫精品| 国产又黄又爽又无遮挡在线| 国产国拍精品亚洲av在线观看 | 国产精品免费一区二区三区在线| 淫妇啪啪啪对白视频| 亚洲熟妇中文字幕五十中出| 免费一级毛片在线播放高清视频| 一个人免费在线观看的高清视频| 91在线观看av| av视频在线观看入口| 欧美日韩精品网址| 国产精华一区二区三区| 悠悠久久av| 51国产日韩欧美| 日本五十路高清| 欧美中文日本在线观看视频| 亚洲片人在线观看| 黑人欧美特级aaaaaa片| 国产一区二区在线av高清观看| 亚洲中文日韩欧美视频| 一夜夜www| 国产精品一区二区三区四区免费观看 | 国产又黄又爽又无遮挡在线| 99在线人妻在线中文字幕| 成人精品一区二区免费| 成人鲁丝片一二三区免费| 丁香欧美五月| 精品久久久久久久久久久久久| 黄片小视频在线播放| 免费在线观看日本一区| 亚洲狠狠婷婷综合久久图片| 久久久久国产精品人妻aⅴ院| 国产精品 国内视频| 国产亚洲精品久久久久久毛片| 国产精品嫩草影院av在线观看 | 午夜日韩欧美国产| 18禁美女被吸乳视频| 激情在线观看视频在线高清| 美女cb高潮喷水在线观看| 每晚都被弄得嗷嗷叫到高潮| 一级黄片播放器| 亚洲国产精品999在线| 亚洲av电影不卡..在线观看| 久久久久久久久大av| 欧美一级a爱片免费观看看| 国产黄a三级三级三级人| 免费av观看视频| 精品免费久久久久久久清纯| 女同久久另类99精品国产91| 麻豆国产av国片精品| 日韩欧美国产一区二区入口| 色av中文字幕| 国产91精品成人一区二区三区| 亚洲人成网站高清观看| 午夜激情欧美在线| 国产精品99久久久久久久久| 女生性感内裤真人,穿戴方法视频| 久久伊人香网站| 亚洲精品日韩av片在线观看 | 国产激情偷乱视频一区二区| 久久精品国产自在天天线| 男人和女人高潮做爰伦理| 熟女电影av网| 熟女人妻精品中文字幕| 日韩成人在线观看一区二区三区| 亚洲第一电影网av| 有码 亚洲区| 国产熟女xx| 色播亚洲综合网| 精品国产亚洲在线| 午夜激情欧美在线| 男人舔女人下体高潮全视频| 淫妇啪啪啪对白视频| 淫秽高清视频在线观看| 色老头精品视频在线观看| 午夜免费激情av| 一进一出抽搐gif免费好疼| 美女高潮的动态| 久久婷婷人人爽人人干人人爱| 欧美一级a爱片免费观看看| 国产一区二区三区在线臀色熟女| 久久久久国产精品人妻aⅴ院| 一本久久中文字幕| 久久久久亚洲av毛片大全| 欧美极品一区二区三区四区| 久久久久久久久久黄片| 国产亚洲精品av在线| 夜夜爽天天搞| 12—13女人毛片做爰片一| 国产日本99.免费观看| 一区福利在线观看| 99热精品在线国产| 午夜亚洲福利在线播放| 国产精品久久久久久久电影 | 精品国产三级普通话版| 天堂网av新在线| 国产精品精品国产色婷婷| 婷婷精品国产亚洲av| 一级作爱视频免费观看| 精华霜和精华液先用哪个| 久久人妻av系列| 琪琪午夜伦伦电影理论片6080| 亚洲欧美日韩东京热| 在线观看午夜福利视频| 日韩精品青青久久久久久| 亚洲欧美精品综合久久99| 日韩欧美三级三区| 韩国av一区二区三区四区| 欧美黑人巨大hd| 日韩欧美 国产精品| 亚洲精品456在线播放app | 男女下面进入的视频免费午夜| 亚洲在线观看片| 国产精品女同一区二区软件 | 少妇熟女aⅴ在线视频| 男插女下体视频免费在线播放| 好男人电影高清在线观看| 欧美成人免费av一区二区三区| 深夜精品福利| 国产亚洲精品一区二区www| 一边摸一边抽搐一进一小说| 波多野结衣高清无吗| 亚洲国产精品久久男人天堂| 国产亚洲欧美在线一区二区| 免费无遮挡裸体视频| 欧美色视频一区免费| 少妇人妻一区二区三区视频| 淫妇啪啪啪对白视频| 在线观看美女被高潮喷水网站 | 国产精品影院久久| 亚洲第一电影网av| 亚洲狠狠婷婷综合久久图片| 在线a可以看的网站| 狂野欧美白嫩少妇大欣赏| 中文字幕人成人乱码亚洲影| 99精品在免费线老司机午夜| 日本a在线网址| 身体一侧抽搐| 欧美成人免费av一区二区三区| 亚洲熟妇中文字幕五十中出| www日本在线高清视频| 给我免费播放毛片高清在线观看| 少妇人妻一区二区三区视频| 国产成人av激情在线播放| 观看美女的网站| 午夜福利在线观看免费完整高清在 | 九色成人免费人妻av| 亚洲在线自拍视频| 长腿黑丝高跟| 一级毛片女人18水好多| 老汉色av国产亚洲站长工具| 国产高清三级在线| 亚洲激情在线av| 国产v大片淫在线免费观看| 日本与韩国留学比较| 国产视频内射| 美女大奶头视频| 亚洲男人的天堂狠狠| 久久99热这里只有精品18| 午夜久久久久精精品| 黄片小视频在线播放| 怎么达到女性高潮| 欧美日韩中文字幕国产精品一区二区三区| 欧美高清成人免费视频www| 国产伦人伦偷精品视频| 99久久九九国产精品国产免费| 久久精品91无色码中文字幕| 午夜两性在线视频| 欧美成狂野欧美在线观看| 日韩人妻高清精品专区| 一级黄片播放器| 少妇人妻一区二区三区视频| 日韩欧美在线二视频| 在线免费观看的www视频| 免费观看精品视频网站| 久久久久久大精品| 熟妇人妻久久中文字幕3abv| 欧美黑人巨大hd| 亚洲 欧美 日韩 在线 免费| 99精品久久久久人妻精品| 大型黄色视频在线免费观看| 桃色一区二区三区在线观看| 91av网一区二区| 亚洲国产中文字幕在线视频| 高清日韩中文字幕在线| 欧洲精品卡2卡3卡4卡5卡区| 欧美午夜高清在线| 午夜精品一区二区三区免费看| 成人特级av手机在线观看| 91九色精品人成在线观看| 18禁美女被吸乳视频| h日本视频在线播放| 青草久久国产| 午夜福利高清视频| 桃色一区二区三区在线观看| 久久精品国产自在天天线| 国产综合懂色| 久久精品综合一区二区三区| 亚洲无线观看免费| 久久久久久久精品吃奶| 国产亚洲精品久久久久久毛片| 麻豆成人午夜福利视频| 国产三级在线视频| 国产久久久一区二区三区| 十八禁网站免费在线| 欧美高清成人免费视频www| 欧美激情在线99| 成人特级黄色片久久久久久久| 熟女人妻精品中文字幕| 欧美av亚洲av综合av国产av| 日本三级黄在线观看| 波多野结衣高清作品| 内射极品少妇av片p| 国产精品嫩草影院av在线观看 | 国产精品98久久久久久宅男小说| e午夜精品久久久久久久| 国产av不卡久久| 欧美日韩综合久久久久久 | 中文资源天堂在线| 午夜精品在线福利| 一a级毛片在线观看| 国产亚洲精品av在线| 国产淫片久久久久久久久 | 久久精品综合一区二区三区| 亚洲成人免费电影在线观看|