• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Python的反反爬蟲(chóng)技術(shù)分析與應(yīng)用

    2018-09-29 02:38余豪士匡芳君
    關(guān)鍵詞:網(wǎng)絡(luò)爬蟲(chóng)數(shù)據(jù)分析大數(shù)據(jù)

    余豪士 匡芳君

    摘 要:爬蟲(chóng)軟件是現(xiàn)今互聯(lián)網(wǎng)環(huán)境下,高效準(zhǔn)確地獲取數(shù)據(jù)的重要方式之一。針對(duì)傳統(tǒng)的初級(jí)爬蟲(chóng)技術(shù)易于被目標(biāo)網(wǎng)站攔截訪問(wèn)的問(wèn)題,簡(jiǎn)述爬蟲(chóng)的工作原理和方式,討論爬蟲(chóng)、反爬蟲(chóng)與反反爬蟲(chóng)之間的相互關(guān)系。分析應(yīng)對(duì)目標(biāo)網(wǎng)站的反反爬蟲(chóng)機(jī)制,包括偽裝用戶(hù)代理,設(shè)置IP地址代理、使用自動(dòng)化測(cè)試工具調(diào)用瀏覽器等技術(shù)要點(diǎn),并分析了基于Python語(yǔ)言中Requests庫(kù),構(gòu)建了對(duì)網(wǎng)頁(yè)的多種請(qǐng)求方式和數(shù)據(jù)獲取方法的解決方案。結(jié)合反反爬蟲(chóng)機(jī)制與數(shù)據(jù)分析技術(shù),以嗶哩嗶哩視頻網(wǎng)為案例,分析其網(wǎng)頁(yè)基本結(jié)構(gòu)與調(diào)用的應(yīng)用程序接口,使用Python與Requests庫(kù)抓取網(wǎng)站所有視頻的相關(guān)數(shù)據(jù)。數(shù)據(jù)清洗后分析播放量最高視頻的相關(guān)信息,并將結(jié)論以數(shù)據(jù)可視化的方式呈現(xiàn),實(shí)現(xiàn)對(duì)數(shù)據(jù)的獲取、挖掘與分析。

    關(guān)鍵詞:網(wǎng)絡(luò)爬蟲(chóng); 反爬蟲(chóng); 反反爬蟲(chóng); 大數(shù)據(jù); 數(shù)據(jù)分析

    Abstract: Crawler software is one of the most important ways to obtain data effectively and accurately in the current Internet environment. In view of the traditional crawler technology which is prone to be intercepted by target website, the paper explains how the crawler appears to work, discusses about the relationship between crawler, anti-crawler and anti-anti-crawler, and analyzes the mechanism of anti-anti-crawler for the target website, including fake user agents, setting IP proxy address, calling browser using automated testing tools. Furthermore, multiple requests and data acquisition methods for web pages are built based on Requests Library in Python language and its solution is analyzed. Combined with the mechanism of anti-anti crawler and data analysis technology, the paper takes the Bilibili website as a case, analyzing its basic structure, as well as its API called. On the one side, all relevant data of video on the Bilibili website is captured using Python and Requests Library and the related information of the video, in which the highest click rate is analyzed after data cleaning. On the other side, the conclusion is presented in the way of data visualization, and the data acquisition, mining and analysis are also realized.

    Key words: Web crawler; anti-crawler; anti-anti-crawler technology; big data; data analysis

    引言

    大數(shù)據(jù)時(shí)代下的數(shù)據(jù)來(lái)源和獲取尤為重要[1],爬蟲(chóng)技術(shù)作為一項(xiàng)獲取數(shù)據(jù)的工具而被廣泛應(yīng)用。已超過(guò)60%的互聯(lián)網(wǎng)流量來(lái)自爬蟲(chóng)(Spider),各大搜索引擎門(mén)戶(hù)網(wǎng)站以及新聞網(wǎng)站的文章都與爬蟲(chóng)息息相關(guān)。爬蟲(chóng)技術(shù)已成為當(dāng)今的研究熱點(diǎn),目標(biāo)網(wǎng)站對(duì)爬蟲(chóng)軟件所做的各方面防范,給出了不同的攔截方式[2]。開(kāi)發(fā)者與開(kāi)發(fā)者之間通過(guò)爬蟲(chóng)、反爬蟲(chóng)、反反爬蟲(chóng)技術(shù)進(jìn)行較量,一方面開(kāi)發(fā)者想通過(guò)爬蟲(chóng)腳本獲取數(shù)據(jù),另一方面開(kāi)發(fā)者又想攔截爬蟲(chóng),防止爬蟲(chóng)腳本妨礙本網(wǎng)站的正常運(yùn)營(yíng),對(duì)正常用戶(hù)的訪問(wèn)造成了負(fù)面影響。

    1 反反爬蟲(chóng)概述

    1.1 反反爬蟲(chóng)技術(shù)

    爬蟲(chóng)軟件是一種模擬瀏覽器的行為,是從指定網(wǎng)站抓取和保存網(wǎng)絡(luò)數(shù)據(jù)的應(yīng)用軟件。爬蟲(chóng)軟件提取出存在于網(wǎng)頁(yè)上的數(shù)據(jù),并以結(jié)構(gòu)化的方式存儲(chǔ)。主要活動(dòng)于計(jì)算機(jī)網(wǎng)絡(luò)通信模型中的傳輸層與應(yīng)用層。傳輸層使用TCP/IP協(xié)議與目標(biāo)Web服務(wù)器進(jìn)行數(shù)據(jù)傳輸;應(yīng)用層使用HTTP或HTTPS協(xié)議與目標(biāo)Web服務(wù)器通信[3]。

    由于傳統(tǒng)的初級(jí)爬蟲(chóng)不使用任何隱藏偽裝手段,在對(duì)站點(diǎn)發(fā)送大量請(qǐng)求時(shí),會(huì)加重目標(biāo)Web服務(wù)器的負(fù)擔(dān),且容易被服務(wù)器偵測(cè)。在大中型網(wǎng)站中,開(kāi)發(fā)者會(huì)針對(duì)傳統(tǒng)的初級(jí)爬蟲(chóng)制定一系列的反爬機(jī)制,如針對(duì)爬蟲(chóng)軟件所處終端進(jìn)行IP限制;針對(duì)請(qǐng)求報(bào)文中Header屬性攔截爬蟲(chóng)軟件;通過(guò)分析網(wǎng)站流量和日志統(tǒng)計(jì)分析過(guò)濾爬蟲(chóng)。爬蟲(chóng)開(kāi)發(fā)者針對(duì)反爬蟲(chóng)機(jī)制,開(kāi)發(fā)了一套反反爬蟲(chóng)機(jī)制,在爬取數(shù)據(jù)的過(guò)程中防止被目標(biāo)站點(diǎn)攔截,開(kāi)發(fā)者需最大限度地將爬蟲(chóng)模擬成真人行為,獲取真實(shí)可靠的數(shù)據(jù)。初級(jí)爬蟲(chóng)、反爬蟲(chóng)、反反爬蟲(chóng)的關(guān)系如圖1所示。

    1.2 反反爬蟲(chóng)策略

    1.2.1 降低訪問(wèn)頻率

    對(duì)目標(biāo)站點(diǎn)連續(xù)訪問(wèn)不同網(wǎng)頁(yè),如果不限制爬蟲(chóng)的請(qǐng)求頻率,爬蟲(chóng)的效率只會(huì)受到所處終端的處理能力和帶寬的限制,因此爬蟲(chóng)的訪問(wèn)頻率會(huì)非常高。通過(guò)增加線程的休眠時(shí)間,降低訪問(wèn)頻率,實(shí)現(xiàn)模仿人為瀏覽的行為。具體代碼如下:

    import time

    time.sleep(0.5)

    1.2.2 偽裝用戶(hù)代理

    用戶(hù)代理(User-Agent)是一種代表用戶(hù)行為的屬性,用于發(fā)送HTTP請(qǐng)求描述用戶(hù)系統(tǒng)和瀏覽器信息。站點(diǎn)服務(wù)器通過(guò)獲取報(bào)文中的User-Agent屬性,給不同操作系統(tǒng)與瀏覽器發(fā)送不同頁(yè)面。通常爬蟲(chóng)軟件在請(qǐng)求數(shù)據(jù)時(shí)不會(huì)攜帶此屬性字段,目標(biāo)站點(diǎn)也因此可偵測(cè)與進(jìn)行攔截。所以,爬蟲(chóng)腳本在請(qǐng)求時(shí)需在頭部加入類(lèi)似瀏覽器的User-Agent屬性[4]。例如:

    headers = {'User-Agent':'Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.115 Safari/537.36'}

    data = requests.get(url, headers=headers). text

    1.2.3 IP代理

    爬蟲(chóng)腳本在訪問(wèn)請(qǐng)求的過(guò)程中,TCP報(bào)文會(huì)攜帶客戶(hù)端的IP地址,站點(diǎn)服務(wù)器也因此可獲取到客戶(hù)端的IP地址。爬蟲(chóng)軟件訪問(wèn)頻率過(guò)高,站點(diǎn)服務(wù)器可對(duì)此IP地址進(jìn)行暫時(shí)性的封禁。開(kāi)發(fā)者在編寫(xiě)腳本時(shí)需要設(shè)置IP代理池。在多進(jìn)程下,多個(gè)進(jìn)程間使用不同的IP代理訪問(wèn)目標(biāo)網(wǎng)站,繞過(guò)站點(diǎn)服務(wù)器IP地址字段的檢測(cè),加快爬取數(shù)據(jù)的效率。例如:

    proxies = {'http':'XX.XX.XX.XX:XXXX',

    'https':'XX.XX.XX.XX:XXXX'}

    data = requests.get(url, proxies=proxies). text

    1.2.4 使用自動(dòng)化測(cè)試工具Selenium

    Selenium是一個(gè)用于WEB開(kāi)發(fā)自動(dòng)化測(cè)試的軟件,其本身用于從用戶(hù)角度使用終端測(cè)試Web應(yīng)用,加載瀏覽器驅(qū)動(dòng)對(duì)網(wǎng)頁(yè)進(jìn)行操作。爬蟲(chóng)開(kāi)發(fā)者使用Selenium,并設(shè)置適應(yīng)的瀏覽器,例如Chome Driver或無(wú)頭瀏覽器PhantomJS,最大限度模擬真人行為。應(yīng)用代碼如下:

    from selenium import webdriver

    driver = webdriver.Chrome()

    1.2.5 訪問(wèn)移動(dòng)端站點(diǎn)

    網(wǎng)站根據(jù)終端瀏覽器的用戶(hù)代理相應(yīng)不同的頁(yè)面,其中終端分為移動(dòng)端和PC端。移動(dòng)端站點(diǎn)地址通常以WAP開(kāi)頭,且對(duì)爬蟲(chóng)軟件的限制不如PC端強(qiáng)。如果目標(biāo)站點(diǎn)有移動(dòng)端頁(yè)面且數(shù)據(jù)可抓性高,可以對(duì)移動(dòng)端頁(yè)面進(jìn)行抓取[5-6]。

    2 基于Requests庫(kù)編寫(xiě)爬蟲(chóng)

    Python中的第三方HTTP庫(kù)、Requests庫(kù)被爬蟲(chóng)開(kāi)發(fā)者廣泛應(yīng)用。Requests集成了定制請(qǐng)求頭、發(fā)送請(qǐng)求、傳遞URL參數(shù)、獲取相應(yīng)內(nèi)容等多種函數(shù)[7]。

    2.1 發(fā)送請(qǐng)求

    在發(fā)送請(qǐng)求上,Requests 集成了多種請(qǐng)求方式,例如最普遍的get和post請(qǐng)求,還有其他HTTP協(xié)議中的請(qǐng)求類(lèi)型。具體實(shí)現(xiàn)過(guò)程如下:

    response = requests.get('https://httpbin.org/get')

    response = requests.delete("http://httpbin.org/delete")

    response = requests.options("http://httpbin.org/get")

    2.2 傳遞 URL 參數(shù)

    在瀏覽器地址輸入欄,輸入目標(biāo)網(wǎng)址的地址后,可輸入以鍵值對(duì)形成的參數(shù),最終形成一個(gè)完整的URL地址跳轉(zhuǎn)至目標(biāo)網(wǎng)頁(yè)。同理在Requests庫(kù)也有此功能,以字典的形式構(gòu)建。實(shí)現(xiàn)過(guò)程如下:

    params = {'key1':'value1','key2': 'value2'}

    response = requests.get('http://yhslib.com', params= params)

    若要查看構(gòu)建后的完整地址,也可輸出查看。

    2.3 定制請(qǐng)求頭

    HTTP請(qǐng)求頭,Requests庫(kù)也給出了定制方式,以字典的形式構(gòu)建。實(shí)現(xiàn)過(guò)程如下:

    headers = {'content-type': 'application/json'}

    response = requests.get('http://yhslib.com', headers=headers)

    2.4 獲取相應(yīng)內(nèi)容

    通常所需的數(shù)據(jù)會(huì)顯示在網(wǎng)頁(yè)上,這也說(shuō)明數(shù)據(jù)包含在HTML或者JavaScript等文本類(lèi)型的文件中,通過(guò)獲取其文本信息經(jīng)過(guò)篩選即可獲得數(shù)據(jù)。Requests庫(kù)中可以通過(guò)獲取text獲得其文本:

    r = requests.get('http://httpbin.org/get')

    print(r.text)

    有些情況下,所需數(shù)據(jù)以二進(jìn)制的文件存在,例如圖片、音頻、視頻等。在Requests中可通過(guò)獲得二進(jìn)制數(shù)據(jù),通過(guò)解碼和編碼得到最終數(shù)據(jù)文件。

    JSON數(shù)據(jù)在數(shù)據(jù)交換和API接口領(lǐng)域中廣泛應(yīng)用。Requests中,對(duì)JSON類(lèi)型數(shù)據(jù)有獨(dú)立的獲取方式:

    r = requests.get('https://XXX.XXX')

    print(r.json())

    3 案例分析

    嗶哩嗶哩視頻網(wǎng)是中國(guó)的彈幕視頻分享網(wǎng)站,此網(wǎng)站的特色是懸浮在視頻上方實(shí)時(shí)地評(píng)論社交功能[8]。嗶哩嗶哩網(wǎng)主打動(dòng)漫視頻,吸引了大量年輕用戶(hù),具有音樂(lè)、舞蹈、科技、生活等板塊。據(jù)統(tǒng)計(jì),此網(wǎng)站注冊(cè)用戶(hù)已超過(guò)1.5億,其中24歲以下用戶(hù)占總用戶(hù)數(shù)的75%,每日視頻播放量已超過(guò)1億。分析網(wǎng)站中各個(gè)視頻的播放次數(shù)等關(guān)鍵數(shù)據(jù),得出用戶(hù)對(duì)此網(wǎng)站視頻的喜好。

    3.1 分析網(wǎng)頁(yè)

    打開(kāi)嗶哩嗶哩彈幕網(wǎng)中任意視頻詳情頁(yè),分析HTML代碼[9],可以發(fā)現(xiàn)每一個(gè)視頻頁(yè)中都有其相應(yīng)的播放量,用戶(hù)發(fā)送的彈幕數(shù)、捐贈(zèng)投幣數(shù)和收藏?cái)?shù)等關(guān)鍵數(shù)據(jù),如圖2所示。檢查其元素屬性和網(wǎng)頁(yè)元數(shù)據(jù)可以發(fā)現(xiàn),各個(gè)數(shù)值并非存在于網(wǎng)頁(yè)源碼中,而是通過(guò)AJAX[10]方式進(jìn)行異步交互[11]最終顯示在頁(yè)面中,因此需要從加載資源尋找。

    3.2 獲取數(shù)據(jù)與分析接口

    進(jìn)入調(diào)試模式,點(diǎn)擊Network選項(xiàng),可以搜索到相關(guān)API接口[12]。API接口分析如圖3所示,得到請(qǐng)求頭部信息,信息包括目標(biāo)地址(GET)、主機(jī)域名(Host)、用戶(hù)代理(User-Agent)、上一級(jí)網(wǎng)頁(yè)(Referer)、Cookie信息(Cookie)等信息。通過(guò)Get方式傳遞參數(shù),其中包含視頻編號(hào)(aid)。在編寫(xiě)爬蟲(chóng)腳本時(shí),需要偽造請(qǐng)求頭部信息,防止被站點(diǎn)攔截。

    得到的數(shù)據(jù)包以JSON類(lèi)型返回,如圖4所示。數(shù)據(jù)包包括HTTP狀態(tài)碼(code)、數(shù)據(jù)屬性(data)、信息屬性(message)與TTL屬性。數(shù)據(jù)屬性中不僅包括上述中提到的播放量(view)、彈幕數(shù)(danmaku)、捐贈(zèng)投幣數(shù)(coin)和收藏?cái)?shù)(favorite),還包括視頻編號(hào)(aid)、評(píng)論數(shù)(reply)、分享次數(shù)(share)。

    3.3 編寫(xiě)爬蟲(chóng)腳本與保存數(shù)據(jù)

    由于視頻編號(hào)是一個(gè)隨機(jī)數(shù),所以需要從1開(kāi)始循環(huán)到視頻編號(hào)的最大值,且單次設(shè)置的最大值不宜過(guò)大,否則會(huì)導(dǎo)致內(nèi)存溢出[13]。

    urls = ["https:// api.bilibili.com/x/web-interface/archive/stataid={} ".format(i) for i in range(100000)]

    頭部請(qǐng)求只需包含用戶(hù)代理,連接狀態(tài)、主機(jī)地址等,其它信息可不攜帶[14]。

    headers = {'User-Agent':'Windows NT 10.0; Win64; x64) AppleWebKit/537.36(KHTML,likeGecko)\\Chrome/59.0.3071.115 Safari/537.36', 'Host': 'api.bilibili.com'}

    因此,請(qǐng)求數(shù)據(jù)和函數(shù)構(gòu)成如下:

    data = requests.get(url, headers=headers, timeout=5).json()

    最終的爬蟲(chóng)腳本偽代碼如下:

    for url in urls:

    data=get(url,herders=herders).json()

    try:

    download(data)

    open bilibili.csv

    write data

    close bilibili.csv

    獲取的數(shù)據(jù)以csv類(lèi)型文件保存。在爬取過(guò)程結(jié)束后,將數(shù)據(jù)保存至MySQL數(shù)據(jù)庫(kù)中,截至日前共有7 600 000余條記錄。以視頻播放量為排序條件選取播放量最多的100個(gè)視頻編號(hào)。通過(guò)視頻編號(hào)瀏覽其具體視頻頁(yè),抓取所在第一級(jí)分類(lèi)和第二級(jí)分類(lèi)具體信息。目標(biāo)網(wǎng)站所屬分類(lèi)如圖5所示。

    3.4 統(tǒng)計(jì)數(shù)據(jù)信息

    經(jīng)過(guò)數(shù)據(jù)分析,根據(jù)第一級(jí)分類(lèi)匯總,在視頻播放量最多的100個(gè)視頻中,國(guó)內(nèi)外番劇共有64個(gè),鬼畜有16個(gè),音樂(lè)和舞蹈各有6個(gè)和3個(gè),動(dòng)畫(huà)有3個(gè),其它分類(lèi)共8個(gè),如圖6所示。

    統(tǒng)計(jì)百分比中,國(guó)內(nèi)外番劇占比最大,共占比64%,鬼畜分類(lèi)視頻占比16%,音樂(lè)占6%,舞蹈、生活、動(dòng)畫(huà)各占3%,其它分類(lèi)共占5%。

    從數(shù)據(jù)中可以發(fā)現(xiàn),嗶哩嗶哩彈幕網(wǎng)的用戶(hù)最喜歡看國(guó)內(nèi)外動(dòng)漫番劇,在番劇占比64%中,其中日本動(dòng)漫占比58%,國(guó)創(chuàng)動(dòng)漫占比6%。由于日本動(dòng)漫數(shù)量遠(yuǎn)大于國(guó)創(chuàng)動(dòng)漫,因此日本動(dòng)漫播放量占比最大。鬼畜視頻多數(shù)由用戶(hù)自行上傳,主要提供用戶(hù)歡樂(lè)和笑聲,最受喜愛(ài)的視頻中占據(jù)第二位。嗶哩嗶哩彈幕網(wǎng)的用戶(hù)也喜歡音樂(lè)和舞蹈,對(duì)生活和動(dòng)畫(huà)制作這一塊也有一定的興趣。由此統(tǒng)計(jì)得到的結(jié)論,可以對(duì)網(wǎng)站首頁(yè)的輪播板塊設(shè)計(jì)提供參考。首推動(dòng)漫視頻與鬼畜視頻,對(duì)音樂(lè)和舞蹈制定一定的推送量,對(duì)其它分類(lèi)的視頻分類(lèi)減少推薦。

    4 結(jié)束語(yǔ)

    本文針對(duì)初級(jí)爬蟲(chóng)獲取網(wǎng)頁(yè)數(shù)據(jù)存在易于發(fā)現(xiàn)和速度慢等問(wèn)題,利用Python的Requests庫(kù)實(shí)現(xiàn)反反爬蟲(chóng)算法,并對(duì)其進(jìn)行了技術(shù)原理分析,最后通過(guò)相關(guān)案例描述了反反爬蟲(chóng)技術(shù)的簡(jiǎn)單應(yīng)用。文中實(shí)現(xiàn)的反反爬蟲(chóng)算法是基于Requests庫(kù)開(kāi)發(fā),具有速度快的優(yōu)點(diǎn)。但由于獲取的數(shù)據(jù)信息量不夠大,因此,下一步將對(duì)反反爬蟲(chóng)算法進(jìn)行改進(jìn)完善,并結(jié)合數(shù)據(jù)分析和人工智能開(kāi)展實(shí)際案例分析和應(yīng)用。

    參考文獻(xiàn)

    [1] 劉智慧,張泉靈. 大數(shù)據(jù)技術(shù)研究綜述[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版),2014,48(6):957-972.

    [2] 安子建. 基于Scrapy框架的網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)與數(shù)據(jù)抓取分析[D]. 長(zhǎng)春:吉林大學(xué),2017.

    [3] 鄒科文,李達(dá),鄧婷敏,等. 網(wǎng)絡(luò)爬蟲(chóng)針對(duì)“反爬”網(wǎng)站的爬取策略研究[J]. 電腦知識(shí)與技術(shù),2016,12(7):61-63.

    [4] 楊定中,趙剛,王泰. 網(wǎng)絡(luò)爬蟲(chóng)在Web信息搜索與數(shù)據(jù)挖掘中應(yīng)用[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2009,30(24):5658-5662.

    [5] 趙本本,殷旭東,王偉. 基于Scrapy的GitHub數(shù)據(jù)爬蟲(chóng)[J]. 電子技術(shù)與軟件工程, 2016(6):199-202.

    [6] 焦文華. 基于Android的移動(dòng)互聯(lián)網(wǎng)應(yīng)用的研究和實(shí)現(xiàn)[D]. 北京:北京郵電大學(xué),2013.

    [7] 謝克武. 大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)[J]. 電子制作,2017(9):44-45.

    [8] KANG Shulong, ZHANG Chuang,LIN Zhiqing, et al. Complexity research of massively microblogging based on human behaviors[C] //2010 2nd International Workshop on Database Technology and Applications, DBT A2010 —Proceedings. Wuhan, China:IEEE Computer Society, 2010:1-4.

    [9] BTTGER H, MLLER A, SCHWARTZBACH M I. Contracts for cooperation between Web service programmers and HTML designers[J].Journal of Web Engineering,2006,5(1):65-89.

    [10]呂林濤,萬(wàn)經(jīng)華,周紅芳. 基于AJAX的Web無(wú)刷新頁(yè)面快速更新數(shù)據(jù)方法[J]. 計(jì)算機(jī)應(yīng)用研究,2006(11):199-200,223.

    [11]熊文,熊淑華,孫旭,等. Ajax技術(shù)在Web2.0網(wǎng)站設(shè)計(jì)中的應(yīng)用研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展,2012,22(3):145-148.

    [12]廉捷,周欣,曹偉,等. 新浪微博數(shù)據(jù)挖掘方案[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2011,51(10):1300-1305.

    [13]RAMALHO L. Fluent Python[M]. United States: O'Reilly Media Inc, 2015.

    [14]JONES B, BEAZLEY D. Python Cookbook[M]. 3rd ed. United States: O'Reilly Media Inc, 2016.

    猜你喜歡
    網(wǎng)絡(luò)爬蟲(chóng)數(shù)據(jù)分析大數(shù)據(jù)
    煉鐵廠鐵量網(wǎng)頁(yè)數(shù)據(jù)獲取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
    淺析大數(shù)據(jù)時(shí)代對(duì)企業(yè)營(yíng)銷(xiāo)模式的影響
    基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
    基于社會(huì)網(wǎng)絡(luò)分析的權(quán)威網(wǎng)頁(yè)挖掘研究
    主題搜索引擎中網(wǎng)絡(luò)爬蟲(chóng)的實(shí)現(xiàn)研究
    淺析如何應(yīng)對(duì)網(wǎng)絡(luò)爬蟲(chóng)流量
    国产一级毛片在线| 国产乱人偷精品视频| 秋霞伦理黄片| 欧美最新免费一区二区三区| 国产成人91sexporn| 国产日韩一区二区三区精品不卡| 51国产日韩欧美| 国产免费又黄又爽又色| 在线天堂最新版资源| 日韩伦理黄色片| 成人18禁高潮啪啪吃奶动态图| 国语对白做爰xxxⅹ性视频网站| 国产欧美日韩一区二区三区在线| av有码第一页| 如日韩欧美国产精品一区二区三区| 亚洲内射少妇av| 一本久久精品| 天天影视国产精品| 国产免费福利视频在线观看| 成人国语在线视频| 亚洲色图综合在线观看| 香蕉丝袜av| 免费在线观看完整版高清| 国产毛片在线视频| 久久精品国产亚洲av涩爱| 日韩熟女老妇一区二区性免费视频| 国产av码专区亚洲av| 成人毛片60女人毛片免费| 2022亚洲国产成人精品| av福利片在线| www.色视频.com| 国产精品免费大片| 国产精品欧美亚洲77777| 日本av手机在线免费观看| 99久国产av精品国产电影| 天堂俺去俺来也www色官网| 考比视频在线观看| 只有这里有精品99| 国产视频首页在线观看| 国产无遮挡羞羞视频在线观看| 宅男免费午夜| 亚洲熟女精品中文字幕| 国产成人av激情在线播放| 麻豆精品久久久久久蜜桃| 午夜免费观看性视频| 午夜福利网站1000一区二区三区| 丰满乱子伦码专区| 另类精品久久| 性高湖久久久久久久久免费观看| 国产成人免费观看mmmm| 在现免费观看毛片| 亚洲国产看品久久| 丝袜人妻中文字幕| 久久久久人妻精品一区果冻| 丝袜在线中文字幕| 亚洲经典国产精华液单| 免费不卡的大黄色大毛片视频在线观看| 精品久久久精品久久久| 男女无遮挡免费网站观看| 国产福利在线免费观看视频| 大片电影免费在线观看免费| 97人妻天天添夜夜摸| 久久这里有精品视频免费| 精品福利永久在线观看| 国产高清国产精品国产三级| 亚洲五月色婷婷综合| 久久精品aⅴ一区二区三区四区 | 青春草视频在线免费观看| 久久人妻熟女aⅴ| 我的女老师完整版在线观看| 美女国产高潮福利片在线看| 久久毛片免费看一区二区三区| a级毛片在线看网站| 日本猛色少妇xxxxx猛交久久| 国产老妇伦熟女老妇高清| 成人综合一区亚洲| 2022亚洲国产成人精品| 久久午夜综合久久蜜桃| 欧美3d第一页| 欧美激情国产日韩精品一区| 国产欧美日韩综合在线一区二区| 男男h啪啪无遮挡| 高清毛片免费看| 色94色欧美一区二区| 草草在线视频免费看| 大片免费播放器 马上看| 99久久人妻综合| 大陆偷拍与自拍| 各种免费的搞黄视频| 亚洲精品国产av成人精品| 国产精品麻豆人妻色哟哟久久| 插逼视频在线观看| xxx大片免费视频| 亚洲欧美中文字幕日韩二区| 精品少妇黑人巨大在线播放| 日韩精品有码人妻一区| 2021少妇久久久久久久久久久| 国产又爽黄色视频| 国产精品成人在线| 国产1区2区3区精品| 亚洲美女搞黄在线观看| 成人毛片60女人毛片免费| 久久久精品94久久精品| 免费看av在线观看网站| 亚洲中文av在线| 国产精品秋霞免费鲁丝片| 99九九在线精品视频| 国产亚洲精品第一综合不卡 | 欧美xxxx性猛交bbbb| 18禁国产床啪视频网站| av免费观看日本| 99久久综合免费| av在线app专区| 日本黄大片高清| 色哟哟·www| 亚洲精品成人av观看孕妇| 人妻一区二区av| 欧美日韩精品成人综合77777| 卡戴珊不雅视频在线播放| 亚洲av在线观看美女高潮| 你懂的网址亚洲精品在线观看| 自拍欧美九色日韩亚洲蝌蚪91| 丝袜脚勾引网站| 亚洲,欧美精品.| 国产熟女午夜一区二区三区| 欧美 亚洲 国产 日韩一| 国产淫语在线视频| 国产熟女午夜一区二区三区| 色婷婷久久久亚洲欧美| 亚洲,欧美,日韩| 视频区图区小说| 亚洲精品国产av成人精品| 精品视频人人做人人爽| 五月伊人婷婷丁香| 日本欧美国产在线视频| 日韩在线高清观看一区二区三区| 国产欧美日韩综合在线一区二区| 成年人午夜在线观看视频| 亚洲欧美成人精品一区二区| 久久这里只有精品19| 国产精品嫩草影院av在线观看| 久久精品aⅴ一区二区三区四区 | 欧美精品国产亚洲| 婷婷色av中文字幕| 99精国产麻豆久久婷婷| 久久热在线av| 国产亚洲精品第一综合不卡 | 久热久热在线精品观看| 亚洲欧美精品自产自拍| 欧美日韩视频高清一区二区三区二| 亚洲精品美女久久av网站| 久久精品熟女亚洲av麻豆精品| 亚洲久久久国产精品| 亚洲一码二码三码区别大吗| 日韩伦理黄色片| 国产精品一区二区在线不卡| 精品国产国语对白av| 99热这里只有是精品在线观看| 男人添女人高潮全过程视频| 色94色欧美一区二区| 亚洲天堂av无毛| 一级毛片电影观看| 欧美 亚洲 国产 日韩一| 内地一区二区视频在线| 99re6热这里在线精品视频| 亚洲精品日韩在线中文字幕| 高清av免费在线| 色婷婷久久久亚洲欧美| 久久精品国产鲁丝片午夜精品| 久久精品人人爽人人爽视色| 国产男女内射视频| 纯流量卡能插随身wifi吗| 全区人妻精品视频| 国产成人av激情在线播放| av黄色大香蕉| 一级,二级,三级黄色视频| av国产精品久久久久影院| av在线app专区| 1024视频免费在线观看| 亚洲婷婷狠狠爱综合网| 欧美变态另类bdsm刘玥| 美女国产视频在线观看| 久久久精品区二区三区| 国产高清不卡午夜福利| 国产视频首页在线观看| 亚洲国产毛片av蜜桃av| 国产精品成人在线| 美国免费a级毛片| 两个人免费观看高清视频| av福利片在线| 亚洲精品第二区| 亚洲av电影在线进入| 国产精品免费大片| 高清在线视频一区二区三区| 久久免费观看电影| 精品少妇内射三级| 赤兔流量卡办理| 亚洲欧洲国产日韩| 国产精品国产三级国产专区5o| 亚洲av电影在线进入| 国产精品欧美亚洲77777| 中文字幕制服av| 男女免费视频国产| 国产1区2区3区精品| 在线观看免费视频网站a站| 最黄视频免费看| 一区二区三区乱码不卡18| 蜜桃在线观看..| 久久这里只有精品19| 国产精品99久久99久久久不卡 | 午夜免费观看性视频| 日韩伦理黄色片| 国产精品久久久久久精品电影小说| 深夜精品福利| 亚洲欧洲日产国产| 亚洲伊人色综图| 岛国毛片在线播放| 自拍欧美九色日韩亚洲蝌蚪91| 少妇人妻精品综合一区二区| 色5月婷婷丁香| 日本wwww免费看| 亚洲欧美一区二区三区国产| 插逼视频在线观看| 青青草视频在线视频观看| 国产成人精品一,二区| 午夜av观看不卡| 我要看黄色一级片免费的| 伦精品一区二区三区| 亚洲精品色激情综合| 亚洲成人一二三区av| 欧美xxⅹ黑人| 好男人视频免费观看在线| 亚洲欧美成人精品一区二区| 日本猛色少妇xxxxx猛交久久| 自线自在国产av| 午夜日本视频在线| 在现免费观看毛片| 99精国产麻豆久久婷婷| 啦啦啦中文免费视频观看日本| 夜夜爽夜夜爽视频| 亚洲伊人久久精品综合| a级毛色黄片| 欧美xxⅹ黑人| 日韩欧美精品免费久久| 亚洲中文av在线| www.熟女人妻精品国产 | 一边亲一边摸免费视频| 极品少妇高潮喷水抽搐| 波多野结衣一区麻豆| 老司机影院成人| 国产在线免费精品| 国产精品一区二区在线不卡| 国产高清三级在线| 国产一区二区在线观看日韩| 在线观看www视频免费| 欧美xxⅹ黑人| 一本久久精品| 免费av不卡在线播放| 久久热在线av| 免费看不卡的av| 99久久中文字幕三级久久日本| 妹子高潮喷水视频| 欧美亚洲 丝袜 人妻 在线| 中文字幕精品免费在线观看视频 | 国产亚洲精品久久久com| 国产在线视频一区二区| 成人影院久久| 久热这里只有精品99| 少妇人妻久久综合中文| 中文字幕免费在线视频6| 日韩av不卡免费在线播放| 欧美日韩国产mv在线观看视频| 秋霞伦理黄片| 大片电影免费在线观看免费| 天天影视国产精品| 亚洲精品乱久久久久久| 丁香六月天网| 日韩精品有码人妻一区| 婷婷成人精品国产| 欧美日韩成人在线一区二区| 51国产日韩欧美| 免费女性裸体啪啪无遮挡网站| 啦啦啦中文免费视频观看日本| 另类亚洲欧美激情| 欧美国产精品一级二级三级| 亚洲三级黄色毛片| 亚洲一级一片aⅴ在线观看| 三上悠亚av全集在线观看| 婷婷色麻豆天堂久久| 国产精品嫩草影院av在线观看| 久久女婷五月综合色啪小说| 美女福利国产在线| 欧美激情极品国产一区二区三区 | 亚洲国产日韩一区二区| 天美传媒精品一区二区| 免费在线观看完整版高清| 一级a做视频免费观看| 国产亚洲av片在线观看秒播厂| 99香蕉大伊视频| 亚洲精品第二区| 满18在线观看网站| 国产亚洲精品久久久com| 波野结衣二区三区在线| 日本爱情动作片www.在线观看| 国产精品人妻久久久久久| 欧美精品国产亚洲| 欧美人与性动交α欧美精品济南到 | 亚洲综合色网址| 下体分泌物呈黄色| 人妻一区二区av| 色婷婷av一区二区三区视频| 老司机影院成人| 尾随美女入室| 免费播放大片免费观看视频在线观看| 午夜老司机福利剧场| 亚洲丝袜综合中文字幕| 日韩av在线免费看完整版不卡| 看免费av毛片| 精品亚洲成国产av| 男女啪啪激烈高潮av片| av卡一久久| 亚洲精品久久成人aⅴ小说| 日本午夜av视频| 久久久久精品性色| 亚洲av日韩在线播放| 午夜福利影视在线免费观看| 美女脱内裤让男人舔精品视频| 久久 成人 亚洲| 伦精品一区二区三区| 搡老乐熟女国产| 秋霞伦理黄片| 久久久精品94久久精品| 18+在线观看网站| 一边亲一边摸免费视频| 一区二区日韩欧美中文字幕 | 国产深夜福利视频在线观看| 精品国产一区二区久久| 亚洲国产欧美日韩在线播放| 观看av在线不卡| 建设人人有责人人尽责人人享有的| av网站免费在线观看视频| 久久国内精品自在自线图片| 在线看a的网站| 亚洲欧美清纯卡通| 欧美xxⅹ黑人| 亚洲国产精品成人久久小说| 寂寞人妻少妇视频99o| 午夜福利影视在线免费观看| 日本-黄色视频高清免费观看| 性色avwww在线观看| 色94色欧美一区二区| 国产1区2区3区精品| 日韩,欧美,国产一区二区三区| 两个人看的免费小视频| 色5月婷婷丁香| 亚洲av电影在线观看一区二区三区| 成人综合一区亚洲| 夫妻午夜视频| 18+在线观看网站| 国产视频首页在线观看| 国产毛片在线视频| 免费观看性生交大片5| 久久久久精品人妻al黑| 亚洲欧美日韩卡通动漫| 90打野战视频偷拍视频| videossex国产| 黑丝袜美女国产一区| av卡一久久| 90打野战视频偷拍视频| 日韩免费高清中文字幕av| 精品国产露脸久久av麻豆| 18禁在线无遮挡免费观看视频| 亚洲av电影在线进入| 18禁在线无遮挡免费观看视频| 国产成人精品在线电影| 午夜91福利影院| 免费av不卡在线播放| 久久精品国产综合久久久 | 亚洲欧美一区二区三区国产| 国产精品国产三级专区第一集| 99热全是精品| 制服诱惑二区| 男人舔女人的私密视频| 菩萨蛮人人尽说江南好唐韦庄| 久久精品国产a三级三级三级| 日本wwww免费看| 十八禁高潮呻吟视频| 菩萨蛮人人尽说江南好唐韦庄| av黄色大香蕉| 亚洲综合色网址| 成年女人在线观看亚洲视频| 欧美少妇被猛烈插入视频| 国产精品国产av在线观看| www.熟女人妻精品国产 | 亚洲成人手机| 九九在线视频观看精品| 男人爽女人下面视频在线观看| 午夜福利网站1000一区二区三区| 侵犯人妻中文字幕一二三四区| 最新的欧美精品一区二区| 天堂俺去俺来也www色官网| 91aial.com中文字幕在线观看| 成人二区视频| 久久精品国产自在天天线| 中文字幕免费在线视频6| 久久这里只有精品19| 97在线人人人人妻| 国产一区亚洲一区在线观看| 日韩一区二区视频免费看| www.熟女人妻精品国产 | 午夜91福利影院| 日本免费在线观看一区| 久久久久精品性色| 亚洲精品,欧美精品| 热re99久久精品国产66热6| 亚洲天堂av无毛| 男人舔女人的私密视频| 一本色道久久久久久精品综合| 国产精品久久久av美女十八| 国产激情久久老熟女| 成人午夜精彩视频在线观看| 人人妻人人添人人爽欧美一区卜| 少妇高潮的动态图| 一区二区三区乱码不卡18| 男女免费视频国产| 麻豆乱淫一区二区| 看非洲黑人一级黄片| 精品亚洲乱码少妇综合久久| 777米奇影视久久| 久久精品aⅴ一区二区三区四区 | 18禁在线无遮挡免费观看视频| 国产熟女欧美一区二区| av女优亚洲男人天堂| 丝袜人妻中文字幕| 纯流量卡能插随身wifi吗| 久久久久久伊人网av| 国产又爽黄色视频| 青春草亚洲视频在线观看| 亚洲精品美女久久av网站| 99久久综合免费| 亚洲第一区二区三区不卡| 美女国产高潮福利片在线看| 91国产中文字幕| 18禁动态无遮挡网站| 精品一区二区免费观看| 久久精品熟女亚洲av麻豆精品| 国产精品一区二区在线不卡| 国产成人精品福利久久| 大香蕉97超碰在线| 2022亚洲国产成人精品| 成年av动漫网址| 亚洲成国产人片在线观看| 精品一品国产午夜福利视频| 人人澡人人妻人| 亚洲经典国产精华液单| 男人爽女人下面视频在线观看| 国产极品天堂在线| 内地一区二区视频在线| 亚洲av福利一区| 国产精品国产av在线观看| 久久久久久久精品精品| 99视频精品全部免费 在线| 欧美日韩av久久| 两性夫妻黄色片 | 免费人妻精品一区二区三区视频| 97超碰精品成人国产| 永久免费av网站大全| 午夜91福利影院| 亚洲在久久综合| 又粗又硬又长又爽又黄的视频| 亚洲精品一区蜜桃| 国产 一区精品| 欧美日韩av久久| 寂寞人妻少妇视频99o| 国语对白做爰xxxⅹ性视频网站| 日韩熟女老妇一区二区性免费视频| 综合色丁香网| 色5月婷婷丁香| 中国国产av一级| 国产成人午夜福利电影在线观看| 久久人人爽人人爽人人片va| 男人舔女人的私密视频| 久久99蜜桃精品久久| 久久久久精品性色| 香蕉丝袜av| 久久国产亚洲av麻豆专区| 午夜福利,免费看| 激情五月婷婷亚洲| 成年动漫av网址| 免费不卡的大黄色大毛片视频在线观看| 韩国精品一区二区三区 | 黄色视频在线播放观看不卡| 亚洲第一区二区三区不卡| 亚洲国产最新在线播放| 国产免费现黄频在线看| 91在线精品国自产拍蜜月| 色5月婷婷丁香| 亚洲av电影在线观看一区二区三区| h视频一区二区三区| 精品一区二区三区四区五区乱码 | 美女视频免费永久观看网站| 国产一区二区在线观看日韩| 国产色婷婷99| 日本av手机在线免费观看| 中文字幕另类日韩欧美亚洲嫩草| 国产乱来视频区| 国产一区二区在线观看av| 精品一品国产午夜福利视频| 亚洲,一卡二卡三卡| 大话2 男鬼变身卡| 国产一级毛片在线| 五月玫瑰六月丁香| 久久久久久久久久成人| 国产在视频线精品| 2022亚洲国产成人精品| 精品人妻一区二区三区麻豆| 一边亲一边摸免费视频| 欧美激情极品国产一区二区三区 | 久久99蜜桃精品久久| 极品少妇高潮喷水抽搐| 国产精品一区二区在线不卡| 99精国产麻豆久久婷婷| 人妻系列 视频| 搡女人真爽免费视频火全软件| 男女无遮挡免费网站观看| 啦啦啦中文免费视频观看日本| 制服丝袜香蕉在线| 亚洲国产欧美日韩在线播放| 中文精品一卡2卡3卡4更新| 亚洲国产精品999| 美国免费a级毛片| 欧美亚洲 丝袜 人妻 在线| av黄色大香蕉| 成人漫画全彩无遮挡| 99国产综合亚洲精品| 亚洲精品成人av观看孕妇| 菩萨蛮人人尽说江南好唐韦庄| 另类亚洲欧美激情| 久久精品国产综合久久久 | 日韩制服丝袜自拍偷拍| 精品久久国产蜜桃| 国产白丝娇喘喷水9色精品| 九色亚洲精品在线播放| 免费播放大片免费观看视频在线观看| 久热这里只有精品99| 嫩草影院入口| 男女啪啪激烈高潮av片| 亚洲国产精品国产精品| 成人18禁高潮啪啪吃奶动态图| 九九在线视频观看精品| 激情视频va一区二区三区| 桃花免费在线播放| 午夜福利,免费看| 久久国内精品自在自线图片| 日本色播在线视频| 成年女人在线观看亚洲视频| 男男h啪啪无遮挡| 视频在线观看一区二区三区| 亚洲av在线观看美女高潮| 久久午夜综合久久蜜桃| 熟女电影av网| 亚洲精品中文字幕在线视频| 大片电影免费在线观看免费| 性高湖久久久久久久久免费观看| 久久久久国产精品人妻一区二区| www.色视频.com| 免费在线观看完整版高清| 国产精品久久久久成人av| 亚洲天堂av无毛| h视频一区二区三区| 亚洲高清免费不卡视频| 婷婷色麻豆天堂久久| 在线观看人妻少妇| 精品少妇久久久久久888优播| 久久99一区二区三区| 三上悠亚av全集在线观看| 欧美少妇被猛烈插入视频| 国产av精品麻豆| 国产69精品久久久久777片| 中文精品一卡2卡3卡4更新| 精品酒店卫生间| 最近2019中文字幕mv第一页| 亚洲美女视频黄频| 尾随美女入室| 中文乱码字字幕精品一区二区三区| 最新中文字幕久久久久| 热99久久久久精品小说推荐| 亚洲欧美清纯卡通| 99香蕉大伊视频| 少妇的逼水好多| 婷婷色综合www| 日韩中字成人| 久久久欧美国产精品| 又黄又粗又硬又大视频| 欧美人与性动交α欧美精品济南到 | 亚洲精品中文字幕在线视频| 日韩av免费高清视频| 国产免费现黄频在线看| 国产精品一二三区在线看| 精品久久蜜臀av无| 女性生殖器流出的白浆| 99热全是精品| xxx大片免费视频| 看十八女毛片水多多多| 建设人人有责人人尽责人人享有的| xxx大片免费视频| 90打野战视频偷拍视频| 国产69精品久久久久777片| 少妇的逼好多水| 国产av精品麻豆| 香蕉精品网在线| 伦理电影免费视频| 亚洲欧美一区二区三区黑人 | 不卡视频在线观看欧美| 最近的中文字幕免费完整|