• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于網(wǎng)頁信息抽取的OA期刊資源采集方法研究

    2017-06-13 03:37:03黃政張學(xué)福
    數(shù)字圖書館論壇 2017年5期
    關(guān)鍵詞:適用性網(wǎng)頁工具

    黃政,張學(xué)福

    (中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)

    一種基于網(wǎng)頁信息抽取的OA期刊資源采集方法研究

    黃政,張學(xué)福

    (中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)

    本文結(jié)合開放獲取期刊(Open Access Journal,OA期刊)資源特點,針對無法通過OAI-PMH協(xié)議進(jìn)行資源采集的OA期刊,提出一種基于網(wǎng)頁信息抽取的資源采集策略。本文從網(wǎng)頁資源描述的角度總結(jié)OA期刊資源特點并對其分類。基于網(wǎng)頁信息抽取方法在OA期刊資源采集適用性,提出一種基于OA期刊網(wǎng)頁元數(shù)據(jù)抽取的采集方法,并在此方法的基礎(chǔ)上設(shè)計了采集系統(tǒng)。通過對國內(nèi)外不遵循OAI-PMH協(xié)議的10本OA期刊的網(wǎng)站實證采集,得到45 785篇論文的元數(shù)據(jù),證明該采集方法能有效地應(yīng)用于此類資源采集。研究豐富了OA期刊資源采集方式,對不遵循OAI-PMH協(xié)議的OA期刊資源采集提供方法借鑒。

    OA期刊;OA期刊資源采集;網(wǎng)頁信息采集;OA期刊資源采集系統(tǒng)

    開放獲取期刊(Open Access Journal,OA期刊)是經(jīng)過同行評審,且在網(wǎng)絡(luò)上可免費獲取的期刊。OA期刊資源主要包括期刊元數(shù)據(jù)、論文元數(shù)據(jù)以及論文全文等。該類資源分布廣泛,且經(jīng)過同行評審,具有重要的學(xué)術(shù)價值。目前,OA期刊資源采集方法主要有兩種:一種是針對遵循OAI-PMH協(xié)議的OA期刊,采用OAIPMH協(xié)議的方法對資源進(jìn)行采集,該方法在此類資源采集應(yīng)用中較成熟;另一種是對于部分不遵循OAIPMH協(xié)議的OA期刊,通常采用網(wǎng)頁信息抽取方法。然而,由于OA期刊資源在網(wǎng)頁中存在組織形式不一、揭示粒度多變,且網(wǎng)頁結(jié)構(gòu)變化多樣等特點,這為此類期刊資源采集帶來了一定挑戰(zhàn)。本文將從OA期刊資源特點出發(fā),對網(wǎng)頁信息采集方法和采集工具在OA期刊資源采集中的適用性進(jìn)行對比分析,針對無法通過OAIPMH協(xié)議進(jìn)行資源采集的OA期刊,提出一種基于網(wǎng)頁信息抽取的資源采集策略。以期既能豐富OA期刊資源采集方式,也能對不遵循OAI-PMH協(xié)議的OA期刊資源采集提供指導(dǎo),提高資源采集效率。

    1 文獻(xiàn)回顧

    OA期刊資源采集的研究現(xiàn)狀可以從網(wǎng)頁信息采集、開放獲取資源采集和OA期刊資源采集三個角度進(jìn)行分析。

    在網(wǎng)頁信息采集方面,根據(jù)采集包裝器形成方式將采集方法分為:(1)基于自然語言處理的網(wǎng)頁信息抽取,即將網(wǎng)頁信息作為文本,使用自然語言處理技術(shù)來抽取網(wǎng)頁信息;(2)基于本體的網(wǎng)頁信息抽取,即將網(wǎng)頁正文信息與構(gòu)建的本體集進(jìn)行比較并計算相關(guān)度,從中抽取相關(guān)度高的信息;(3)基于包裝器歸納方式的網(wǎng)頁信息抽取,即對有標(biāo)注的樣本網(wǎng)頁采用機(jī)器學(xué)習(xí)算法來歸納抽取規(guī)則,并利用該規(guī)則抽取其他網(wǎng)頁信息;(4)基于HTML頁面結(jié)構(gòu)分析的網(wǎng)頁信息抽取,即將網(wǎng)頁解析為結(jié)構(gòu)樹,對比多個網(wǎng)頁,進(jìn)而構(gòu)建抽取信息的正則表達(dá)式采集網(wǎng)頁中的信息;(5)基于Web查詢的網(wǎng)頁信息抽取,即先將網(wǎng)頁進(jìn)行解析,再使用類似數(shù)據(jù)庫查詢語句對網(wǎng)頁信息進(jìn)行采集[1-4]。

    在開放獲取資源采集方面,有學(xué)者對不同類型的開放獲取資源采集進(jìn)行了研究。朱江等研究開放會議資源采集,利用用戶推薦和人工收集方式對Web環(huán)境下的開放會議資源進(jìn)行采集,采用文本識別的方式抽取非結(jié)構(gòu)化文本格式的會議文獻(xiàn)開放資源[5];王思麗等根據(jù)開放知識資源的不同數(shù)據(jù)來源提出不同的自動采集策略,包括基于OAI-PMH協(xié)議的元數(shù)據(jù)采集策略、基于抽取動態(tài)網(wǎng)頁的元數(shù)據(jù)采集策略和基于解析RSS源接口的元數(shù)據(jù)采集策略[6]。對開放獲取資源采集方法的研究也越來越全面和深入,對所采集資源從一概而論變?yōu)榉诸愔贫ú杉呗?開放資源采集方法研究逐步從人工采集過渡到自動采集。除方法層面的研究外,有學(xué)者也從系統(tǒng)層面展開研究。宋辰對科技情報采集系統(tǒng)進(jìn)行研究,指出當(dāng)前科技情報采集工具難以滿足情報資源采集需求的原因之一在于收費系統(tǒng)需要花費大量財力和人力,并且系統(tǒng)使用和維護(hù)困難[7]。

    在OA期刊資源采集方面,基于OAI-PMH協(xié)議的元數(shù)據(jù)采集方法對于主要局限于遵循OAI-PMH協(xié)議的OA期刊,資源采集的應(yīng)用已十分成熟[8-12]。針對OA期刊網(wǎng)頁中展示的資源主要是先通過人工分析網(wǎng)頁結(jié)構(gòu),再使用網(wǎng)頁解析工具來對資源進(jìn)行采集[13],該方法主要以人工考察分析網(wǎng)頁結(jié)構(gòu)為主,需要采集者具有一定的計算機(jī)專業(yè)背景,而且工作量大,不適合對大量期刊資源采集。OA期刊資源屬于網(wǎng)絡(luò)資源的一種,對不遵循OAI-PMH協(xié)議的OA期刊,可以借鑒網(wǎng)頁信息采集方法。文本將從網(wǎng)頁信息采集的角度出發(fā),結(jié)合OA期刊資源特點,對不遵循OAI-PMH協(xié)議的OA期刊資源采集策略進(jìn)行研究,以滿足此類OA期刊資源采集需求。

    2 不遵循OAI-PMH協(xié)議的OA期刊資源采集方法研究

    2.1 OA期刊資源的特點與分類

    OA期刊分為遵循OAI-PMH協(xié)議和不遵循OAIPMH協(xié)議兩種,但所有的OA期刊都是通過網(wǎng)頁對資源進(jìn)行描述和展示,且描述和展示的方式差異較小,故本文分析的OA期刊資源特點適用于所有類型。

    2.1.1 OA期刊資源的特點

    (1)描述粒度細(xì)。OA期刊資源的元數(shù)據(jù)包含眾多字段,如文章標(biāo)題、中英文關(guān)鍵詞、中英文摘要、作者、機(jī)構(gòu)、期刊名、年、卷、期等。相比于其他網(wǎng)絡(luò)資源,OA期刊資源元數(shù)據(jù)描述粒度更細(xì)。

    (2)展現(xiàn)形式多樣。OA期刊資源的元數(shù)據(jù)字段眾多,而這些字段通常是以不同的組織形式展現(xiàn)在網(wǎng)頁中。部分元數(shù)據(jù)字段在網(wǎng)頁中是按照單個字段進(jìn)行展示,如文章標(biāo)題、摘要等;而部分元數(shù)據(jù)是多個字段組合成一條文本信息進(jìn)行展示,如文章的年、卷、期。

    (3)描述載體結(jié)構(gòu)多變。在對國內(nèi)OA期刊資源調(diào)研過程中發(fā)現(xiàn),部分OA期刊網(wǎng)站的資源展示頁面,在不同時期采用不同的網(wǎng)頁模板。在結(jié)構(gòu)發(fā)生變化的開放獲取資源網(wǎng)站中,一般會存在1—3套不等的網(wǎng)頁模板;而其他網(wǎng)絡(luò)資源,如電商平臺、論壇等通常采用統(tǒng)一的網(wǎng)頁模板。

    2.1.2 OA期刊資源分類

    OA期刊資源以不同的組織形式在不同網(wǎng)頁中進(jìn)行展示,本文根據(jù)OA期刊資源在網(wǎng)頁中的組織形式,將其分為單一型資源和組合型資源。

    單一型資源指網(wǎng)頁中一個HTML標(biāo)簽僅展示一個元數(shù)據(jù)字段信息的資源,如期刊名稱、文章標(biāo)題、摘要、關(guān)鍵詞、全文獲取鏈接等。此類資源信息揭示簡單明了、層次清晰。

    組合型資源指網(wǎng)頁中一個HTML標(biāo)簽封裝多個期刊元數(shù)據(jù)字段信息的資源,多個字段通常是組合成一個文本信息進(jìn)行展示,如期刊的年、卷、期字段等。組合型資源的文本信息由固定字段按照一定的形式組合而成,具有一定的結(jié)構(gòu)性,為半結(jié)構(gòu)化文本。

    2.2 現(xiàn)有網(wǎng)頁信息采集方法的特點及適用性分析

    2.2.1 現(xiàn)有網(wǎng)頁信息采集方法特點分析

    現(xiàn)有網(wǎng)頁信息采集方法主要分為基于自然語言處理的網(wǎng)頁信息抽取、基于本體的網(wǎng)頁信息抽取、基于包裝器歸納方式的網(wǎng)頁信息抽取、基于HTML頁面結(jié)構(gòu)分析的網(wǎng)頁信息抽取以及基于Web查詢的網(wǎng)頁信息抽取。5種采集方法特點對比分析結(jié)果如表1所示。

    由表1可見,5種網(wǎng)頁信息采集方法采用不同方式來保證資源采集的準(zhǔn)確性。如基于包裝器歸納方式的網(wǎng)頁信息抽取方法需要對樣本進(jìn)行標(biāo)注,通過機(jī)器學(xué)習(xí)歸納抽取規(guī)則來提高采集準(zhǔn)確率;基于Web查詢的網(wǎng)頁信息抽取方法通過對網(wǎng)頁分析,編寫合適查詢語句來準(zhǔn)確定位頁面中資源。不同的Web信息采集方法由于采集方式不同,適用于不同類型的網(wǎng)頁資源采集。如基于自然語言處理的網(wǎng)頁信息抽取方法適用于大量文本信息抽取,基于本體的網(wǎng)頁信息抽取方法適用于特定領(lǐng)域的信息抽取。

    表1 5種網(wǎng)頁信息采集方法特點對比分析

    2.2.2 網(wǎng)頁信息采集方法對OA期刊資源采集的適用性分析

    與傳統(tǒng)網(wǎng)頁信息采集不同的是,OA期刊資源采集更注重網(wǎng)頁內(nèi)部元數(shù)據(jù)的過濾和抽取,網(wǎng)頁元素采集準(zhǔn)確率是衡量采集方法適用性的基本指標(biāo)。每本OA期刊的網(wǎng)頁結(jié)構(gòu)各不相同,因此采集方法需要具有很好的靈活性,以應(yīng)對不同網(wǎng)頁結(jié)構(gòu)的OA期刊資源采集。單一型資源采集類似于普通網(wǎng)頁元數(shù)據(jù)采集,僅抽取網(wǎng)頁標(biāo)簽對封裝的信息;而組合型資源除抽取網(wǎng)頁標(biāo)簽對封裝的文本信息外,還需要對文本信息進(jìn)一步采集,抽取文本信息中的單個資源信息。因此,文本信息抽取是采集OA期刊資源組合型元數(shù)據(jù)資源的主要方式。綜合而言,采集準(zhǔn)確率和方法靈活性是衡量方法適用性的基礎(chǔ),而文本信息處理是全面采集OA期刊資源的衡量指標(biāo)。通過對5種網(wǎng)頁信息采集方法特點以及優(yōu)缺點分析,結(jié)合5種方法在OA期刊資源采集上的應(yīng)用,對5種方法適用性對比分析如表2所示。

    表2 5種網(wǎng)頁信息采集方法適用性對比分析

    通過對5種網(wǎng)頁信息采集方法的適用性分析,得出兩個結(jié)論。(1)現(xiàn)有主要的網(wǎng)頁信息采集方法無法單獨完成OA期刊資源采集工作。基于Web查詢的網(wǎng)頁信息抽取方法具備采集準(zhǔn)確率和方法靈活性特征,但無法對文本信息進(jìn)行處理。而其他4種方法無法兼?zhèn)洳杉瘻?zhǔn)確率和方法靈活性。在文本信息處理方面,雖然基于本體的網(wǎng)頁信息抽取方法和基于包裝器歸納方式的網(wǎng)頁信息采集方法通過構(gòu)造本體集或構(gòu)造包裝器能夠?qū)ξ谋局械男畔⒊槿?但基于自然語言處理的信息抽取方法能更靈活、準(zhǔn)確地抽取文本信息。(2)OA期刊資源采集方法需要綜合網(wǎng)頁信息采集方法的功能。雖然現(xiàn)有網(wǎng)頁信息采集方法無法完成OA期刊資源的完整性采集,但基于Web查詢的網(wǎng)頁信息抽取方法和基于自然語言處理的網(wǎng)頁信息抽取方法分別具備OA期刊資源采集的基礎(chǔ)性指標(biāo)和全面性指標(biāo),OA期刊資源采集方法需要綜合這兩種Web信息采集方法的功能,實現(xiàn)OA期刊資源靈活、準(zhǔn)確和全面地采集。

    2.3 基于網(wǎng)頁信息抽取的OA期刊資源采集方法

    通過分析5種網(wǎng)頁信息采集方法的特征,以及各方法在OA期刊資源采集的適用性,認(rèn)為OA期刊資源采集方法需要集成Web查詢和自然語言處理兩種網(wǎng)頁信息資源采集方法的功能?;诰W(wǎng)頁信息抽取的OA期刊資源采集方法如圖1所示。

    圖1 基于網(wǎng)頁信息抽取的OA期刊資源采集方法

    網(wǎng)頁元素采集指對OA期刊網(wǎng)頁中的單一型資源和組合型資源的文本信息進(jìn)行采集。這些文本信息封裝在HTML標(biāo)簽對中,屬于網(wǎng)頁元素。OA期刊資源采集需要靈活、準(zhǔn)確地采集OA期刊網(wǎng)頁中的元素。借鑒Web信息采集方法思想,將網(wǎng)頁元素采集具體分為三個步驟:首先,將網(wǎng)頁解析成DOM樹結(jié)構(gòu);其次,解析出待采集網(wǎng)頁元素在DOM樹中的路徑,并以該路徑作為查詢條件;最后,使用Web-SQL語句對該網(wǎng)頁元素進(jìn)行查詢和采集。該方法對網(wǎng)頁依賴度較低,而且不需要大量樣本學(xué)習(xí),可以靈活應(yīng)對不同OA期刊網(wǎng)頁元素采集。同時,通過待采集元素在DOM樹中的路徑可以準(zhǔn)確定位網(wǎng)頁元素位置,保證采集的準(zhǔn)確性。

    半結(jié)構(gòu)化文本信息抽取指對組合型資源的OA期刊元數(shù)據(jù)字段進(jìn)行抽取。組合型資源的文本信息是由多個期刊元數(shù)據(jù)字段組合而成的半結(jié)構(gòu)化文本。為保證資源采集的全面性,需對組合型資源文本信息中的期刊元數(shù)據(jù)進(jìn)行抽取。使用類似基于自然語言處理的信息抽取方法,可以對組合型資源的半結(jié)構(gòu)化文本信息進(jìn)行抽取。具體步驟為:先對半結(jié)構(gòu)化文本信息進(jìn)行結(jié)構(gòu)分析,通過人工標(biāo)注,構(gòu)建正則表達(dá)式對文本進(jìn)行分解,抽取期刊元數(shù)據(jù),進(jìn)而保證期刊資源的全面采集。

    2.4 現(xiàn)有網(wǎng)頁信息采集工具特點及適用性分析

    為解決OA期刊資源采集的實際問題,同時驗證本文提出的基于OA期刊資源網(wǎng)頁元數(shù)據(jù)采集方法的有效性,先對現(xiàn)有3款典型網(wǎng)頁信息采集工具進(jìn)行對比,并對各采集工具在OA期刊網(wǎng)頁元數(shù)據(jù)采集中的適用性進(jìn)行分析。

    2.4.1 現(xiàn)有網(wǎng)頁信息采集工具特點分析

    國內(nèi)外3款典型網(wǎng)頁信息采集工具對比分析如表3所示。通過對采集工具對比分析發(fā)現(xiàn),3款采集工具都采用類似基于Web查詢的網(wǎng)頁信息抽取方法,來對網(wǎng)頁元素進(jìn)行采集。不同的是,在實現(xiàn)基于Web查詢的網(wǎng)頁信息抽取方法時,一部分工具是自動形成定位規(guī)則,另一部分工具則需要人工制定定位規(guī)則。而對于網(wǎng)頁元素中的文本信息,部分采集工具提供正則表達(dá)式匹配抽取功能。

    2.4.2 網(wǎng)頁信息采集工具對OA期刊資源采集的適用性分析

    通過上述分析,發(fā)現(xiàn)3款采集工具都能準(zhǔn)確地采集網(wǎng)頁元素,因此,本文主要從采集資源的完整性角度分析各采集工具在OA期刊資源采集上的適用性。本文將OA期刊資源分為單一型資源和組合型資源,本文提出的判斷采集工具是否適用于OA期刊資源采集,主要由采集工具是否能對單一型資源和組合型資源進(jìn)行采集決定。此外,本文在對OA期刊資源采集調(diào)研中發(fā)現(xiàn),有超過10%的OA期刊網(wǎng)站存在多套網(wǎng)頁模板,即存在網(wǎng)頁結(jié)構(gòu)變化的情況。因此,能否對網(wǎng)頁結(jié)構(gòu)變化后的資源進(jìn)行采集也是判斷采集工具是否適用于OA期刊資源采集的指標(biāo)之一。綜上所述,單一型資源采集、組合型資源采集以及網(wǎng)頁結(jié)構(gòu)變化后資源采集是判斷采集工具是否適用于OA期刊資源采集的主要指標(biāo)。通過對3款工具特點和優(yōu)缺點分析,結(jié)合各工具在OA期刊資源采集上的應(yīng)用,對3款采集工具的適用性分析如表4所示。

    表3 3款國內(nèi)外典型網(wǎng)頁信息采集工具特點對比分析

    表4 3款網(wǎng)頁信息采集工具適用性對比分析

    通過適用性分析,可以得出兩個結(jié)論。(1)現(xiàn)有采集工具基本實現(xiàn)了本文提出的采集方法的功能,即對網(wǎng)頁元素準(zhǔn)確、靈活地采集,對文本信息進(jìn)行進(jìn)一步抽取。(2)現(xiàn)有采集工具無法對網(wǎng)頁結(jié)構(gòu)變化后的OA期刊資源進(jìn)行完整采集。由于OA期刊網(wǎng)站存在網(wǎng)頁結(jié)構(gòu)發(fā)生變化的情況,采集工具不具備網(wǎng)頁結(jié)構(gòu)檢查功能,形成的采集規(guī)則無法對結(jié)構(gòu)變化的網(wǎng)頁進(jìn)行采集。

    通過以上分析,雖然現(xiàn)有采集工具基本實現(xiàn)本文提出的基于OA期刊網(wǎng)頁信息抽取方法的功能,但并不能對網(wǎng)頁結(jié)構(gòu)變化后的OA期刊資源進(jìn)行有效采集。因此,本文在現(xiàn)有方法基礎(chǔ)上,設(shè)計一種適用于OA期刊資源采集的系統(tǒng)并進(jìn)行實證分析,以更好地實現(xiàn)OA期刊資源的全面采集。

    3 基于網(wǎng)頁信息抽取的OA期刊資源采集系統(tǒng)設(shè)計

    現(xiàn)有采集工具無法對網(wǎng)頁結(jié)構(gòu)發(fā)生變化的OA期刊資源進(jìn)行采集,為全面采集OA期刊資源,進(jìn)一步驗證本文提出的基于網(wǎng)頁信息抽取的OA期刊資源采集方法的有效性,在該方法的基礎(chǔ)上,還需要提供頁面結(jié)構(gòu)檢查功能?;诰W(wǎng)頁信息抽取的OA期刊資源采集框架如圖2所示。

    基于OA期刊網(wǎng)頁元數(shù)據(jù)抽取的采集框架主要分為數(shù)據(jù)源、數(shù)據(jù)采集、數(shù)據(jù)存儲和數(shù)據(jù)服務(wù)四個層次。

    數(shù)據(jù)源層是采集系統(tǒng)面向的數(shù)據(jù)源。本文主要研究不遵循OAI-PMH協(xié)議的OA期刊資源采集方法。根據(jù)網(wǎng)頁中OA期刊資源的組織形式,為保證OA期刊資源采集的全面和完整,數(shù)據(jù)源需覆蓋結(jié)構(gòu)統(tǒng)一和結(jié)構(gòu)變化兩種網(wǎng)頁結(jié)構(gòu)的OA期刊資源。

    數(shù)據(jù)采集層是對OA期刊資源實施采集。對于不遵循OAI-PMH協(xié)議的資源,主要是在基于OA期刊網(wǎng)頁元數(shù)據(jù)抽取的采集方法基礎(chǔ)上,輔以網(wǎng)頁結(jié)構(gòu)檢查功能,來滿足單一型資源、組合型資源以及網(wǎng)頁結(jié)構(gòu)發(fā)生變化后的期刊資源進(jìn)行采集。主要解決當(dāng)前網(wǎng)頁信息采集方法無法單獨完成OA期刊資源采集,以及當(dāng)前采集工具無法對網(wǎng)頁結(jié)構(gòu)變化后的OA期刊資源采集的問題。

    數(shù)據(jù)存儲層主要表現(xiàn)OA期刊資源采集過程中數(shù)據(jù)的存儲過程,包括初始URL、待采集URL和采集規(guī)則等的臨時存儲,以及本地OA期刊元數(shù)據(jù)數(shù)據(jù)庫等。

    數(shù)據(jù)服務(wù)層主要是為采集到的OA期刊資源提供服務(wù),如對采集到的數(shù)據(jù)進(jìn)行展示和提供下載服務(wù)。

    4 實證分析

    為進(jìn)一步驗證本文提出的方法,對基于網(wǎng)頁信息抽取的OA期刊資源采集系統(tǒng)的主要功能進(jìn)行具體的實現(xiàn)。

    圖2 基于網(wǎng)頁信息抽取的OA期刊資源采集框架

    (1)網(wǎng)頁元素采集。使用JavaFX可視化組件Web View,實現(xiàn)資源選擇和查詢語句自動生成,通過網(wǎng)頁解析器Jsoup根據(jù)查詢語句采集網(wǎng)頁信息。具體而言,當(dāng)Web View組件加載HTML內(nèi)容時,為每個節(jié)點添加事件監(jiān)聽,當(dāng)鼠標(biāo)點擊某節(jié)點時,系統(tǒng)會將該節(jié)點賦值給“org.w3c.dom.Node”類型的變量。Node類提供“getParentNode()”的方法來獲取當(dāng)前節(jié)點的父類節(jié)點,據(jù)此可遞歸尋找到當(dāng)前節(jié)點到網(wǎng)頁根節(jié)點的路徑。通過將路徑中各節(jié)點標(biāo)簽名和屬性值拼接成Jsoup能夠識別的查詢語句,再使用Jsoup中select方法對待采集節(jié)點的信息進(jìn)行采集,即可完成網(wǎng)頁元素采集工作。

    (2)半結(jié)構(gòu)化文本信息抽取。具體實現(xiàn)方式為通過用戶標(biāo)注的分隔符,再根據(jù)分隔符位置,提取元數(shù)據(jù)字段信息。OA期刊網(wǎng)站通常會將“年、卷、期”組合成一條文本信息,如“2017,vol39,no.1”。在抽取具體信息時,先將該條文本信息作為網(wǎng)頁元素進(jìn)行采集,再通過用戶在文本中插入分隔符進(jìn)行標(biāo)注,將所需采集信息與固定展示信息進(jìn)行分隔,即“{2017},vol{39}, no.{1}”“2017”“39”“1”是需要采集的信息,“,vol”“,no.”是固定展示信息。固定展示信息內(nèi)容通常不會改變,因此,可以根據(jù)固定展示信息位置來抽取文本中相應(yīng)信息。

    (3)網(wǎng)頁結(jié)構(gòu)檢查。根據(jù)規(guī)定所需采集的必須字段,來作為判斷網(wǎng)頁結(jié)構(gòu)是否發(fā)生變化的標(biāo)準(zhǔn),如果采集到的必須字段為空則認(rèn)為當(dāng)前網(wǎng)頁結(jié)構(gòu)已發(fā)生變化,需重新選擇和采集。如文章標(biāo)題作為必須字段,在網(wǎng)頁元素采集時會判斷采集到的該字段是否為空。如果為空則可能有兩種情況:一是當(dāng)前頁面確實沒有該字段,此頁面為臟頁面;二是當(dāng)前頁面存在該字段,但該元數(shù)據(jù)采集規(guī)則不適用于當(dāng)前頁面,則可以判斷此頁面為結(jié)構(gòu)變化后的頁面。系統(tǒng)無法識別必須字段為空時屬于何種情況,因此,系統(tǒng)會將當(dāng)前頁面加入結(jié)構(gòu)變化頁面鏈接數(shù)組中。該輪采集結(jié)束后,提取結(jié)構(gòu)變化網(wǎng)頁鏈接數(shù)組的第一個鏈接,在內(nèi)嵌瀏覽器中進(jìn)行展示,由用戶對字段為空的情況作出判斷。系統(tǒng)對兩種情況均提出解決方案,對于第一種臟頁情況,直接跳過,并將該頁面鏈接從結(jié)構(gòu)變化的網(wǎng)頁鏈接數(shù)組中刪除;對于第二種網(wǎng)頁結(jié)構(gòu)變化的情況,用戶會在結(jié)構(gòu)變化后的頁面上重新進(jìn)行元數(shù)據(jù)選擇,將形成的新采集規(guī)則加入原采集規(guī)則集合中,系統(tǒng)會使用新的采集規(guī)則繼續(xù)進(jìn)行采集。這樣往復(fù)2—3次便可以遍歷網(wǎng)站所有模板,進(jìn)而采集到全數(shù)據(jù),解決OA期刊資源網(wǎng)頁結(jié)構(gòu)多變而無法全面采集的問題。

    為驗證基于網(wǎng)頁信息抽取的OA期刊資源采集方法的有效性,本文選擇國內(nèi)外不遵循OAI-PMH協(xié)議的10本OA期刊的網(wǎng)站作為采集對象,通過爬蟲腳本采集10本OA期刊的論文鏈接數(shù)量,作為采集數(shù)量全面性的標(biāo)準(zhǔn)。測試結(jié)果如表5所示。

    表5 10本OA期刊資源采集結(jié)果對比分析

    由表5可知,10本期刊共采集到論文45 785篇,采集時間共用31 039秒,其中有4本期刊的網(wǎng)頁結(jié)構(gòu)發(fā)生變化。通過系統(tǒng)測試結(jié)果可以看出,基于網(wǎng)頁信息抽取的OA期刊資源采集方法可以靈活應(yīng)對不同OA期刊資源的采集。在準(zhǔn)確率方面,該方法能準(zhǔn)確采集單一型資源和文本結(jié)構(gòu)固定的組合型資源,說明其能夠適用于OA期刊資源采集工作?;诰W(wǎng)頁信息抽取的OA期刊資源采集系統(tǒng)的網(wǎng)頁結(jié)構(gòu)檢查能準(zhǔn)確識別網(wǎng)頁結(jié)構(gòu)變化,并對結(jié)構(gòu)變化后的資源進(jìn)行采集。除部分OA期刊網(wǎng)站存在無法訪問或無詳細(xì)信息外,采集到的論文數(shù)量與通過爬蟲腳本統(tǒng)計到的論文鏈接數(shù)一致。從采集時間上看,平均1 000篇文章的采集時間為678秒??傮w而言,基于網(wǎng)頁信息抽取的OA期刊資源采集方法,能較好地滿足不遵循OAI-PMH協(xié)議的OA期刊資源采集需求。

    5 總結(jié)

    本文以O(shè)A期刊資源為研究對象,從網(wǎng)頁信息采集的角度,對不遵循OAI-PMH協(xié)議的OA期刊資源采集進(jìn)行研究。首先,本文對OA期刊資源特點進(jìn)行總結(jié),并按照資源在網(wǎng)頁中的組織方式將其分為單一型資源和組合型資源;其次,分析對網(wǎng)頁采集方法在OA期刊資源采集上的適用性,發(fā)現(xiàn)網(wǎng)頁采集方法無法單獨完成OA期刊資源采集工作。因此,本文提出基于網(wǎng)頁信息抽取的OA期刊資源采集方法,該方法綜合了網(wǎng)頁信息采集方法的功能,不僅能準(zhǔn)確、靈活采集OA期刊網(wǎng)頁元素,也能對本文信息進(jìn)行抽取。通過3款典型網(wǎng)頁信息采集工具在OA期刊資源采集上的適用性分析,發(fā)現(xiàn)各工具均無法對網(wǎng)頁結(jié)構(gòu)發(fā)生變化的OA期刊資源進(jìn)行采集。因此,本文對基于網(wǎng)頁信息抽取的OA期刊資源采集系統(tǒng)進(jìn)行設(shè)計,增加對網(wǎng)頁結(jié)構(gòu)的檢查。通過對國內(nèi)外不遵循OAI-PMH協(xié)議的10本期刊網(wǎng)站實證采集,發(fā)現(xiàn)4本期刊網(wǎng)站存在網(wǎng)頁結(jié)構(gòu)發(fā)生變化的情況,并對網(wǎng)頁結(jié)構(gòu)變化后的資源進(jìn)行采集,得到45 785篇論文的元數(shù)據(jù)信息,證明采集框架能很好地指導(dǎo)不遵循OAI-PMH協(xié)議的OA期刊資源采集工作。本文雖然基本滿足不遵循OAI-PMH協(xié)議的OA期刊資源采集需求,但仍存在如資源采集時間過長等問題,還有待進(jìn)一步優(yōu)化。

    [1]LAENDER A H F,RIBEIRO-NETO B A,SILVA A S D,et al.Abrief surveyof web data extraction tools[J].Acm Sigmod Record,2002,31(2):84-93.

    [2]蒲筱哥.基于Web的信息抽取技術(shù)研究綜述[J].現(xiàn)代情報,2007,27(10): 215-219.

    [3]董娟.基于頁面結(jié)構(gòu)分析的網(wǎng)頁信息抽取方法研究[D].青島:中國石油大學(xué)(華東),2010.

    [4]于靜.基于頁面主體提取的WEB信息抽取技術(shù)研究[D].南京:南京郵電大學(xué),2013.

    [5]朱江,尚瑋姣,姜恩波,等.會議文獻(xiàn)開放資源采集與服務(wù)系統(tǒng)的建設(shè)[J].情報理論與實踐,2010(7):117-119.

    [6]王思麗,馬建玲,王楠,等.開放知識資源的元數(shù)據(jù)自動采集策略研究[J].圖書館學(xué)研究,2013(12):47-51.

    [7]宋辰.科技情報采集系統(tǒng)的設(shè)計及其快速文本聚類方法研究[D].北京:北京工業(yè)大學(xué),2014.

    [8]董慧,丁波濤.用OAI-MHP協(xié)議解決數(shù)字圖書館互操作問題[J].情報科學(xué),2004(6):699-702.

    [9]李勇文.OAI元數(shù)據(jù)搜索引擎的設(shè)計與實現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2005(2): 37-39,32.

    [10]王芳,王小麗.基于OAI協(xié)議的數(shù)字檔案館元數(shù)據(jù)互操作問題研究[J].現(xiàn)代圖書情報技術(shù),2007(3):18-24.

    [11]徐方,張靜.國內(nèi)OAI-PMH協(xié)議研究綜述[J].現(xiàn)代情報,2009(1):89-94.

    [12]郭少友.OAI-PMH元數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化方法研究[J].圖書情報工作, 2011(2):107-111.

    [13]楊東清.開放獲取期刊資源庫共建共享平臺的研究與開發(fā)[D].南京:南京農(nóng)業(yè)大學(xué),2010.

    A Research on Open Access Journal Resource Acquisition Method Based on Web Information Extraction

    HUANG Zheng, ZHANG XueFu
    (Agricultural Information Institute of Chinese Academy of Agricultural Sciences, Beijing 100081, China)

    Open access journal resources have important academic value, however, some open access journals do not follow the OAI-PMH protocol, and can not collect resources through OAI-PMH protocol.In this paper, based on the characteristics of open Access journal resources, we propose a non OAI-PMH protocol based open access resource acquisition strategy.In this paper, from the point of view of web resources description, this paper summarizes the characteristics of open access journal resources and classi fi es them from the point of view of web resources description.Based on the applicability of the web information collection method in collecting open access journal resources, this paper proposes a open access journal resource acquisition strategy non based on OAI-PMH protocol, which is based on the method of acquisition open access journal web metadata extraction and design the acquisition system.Through the empirical study of 10 open access journals which do not provide the OAI-PMH protocol at home and abroad, a total of 45 785 papers were collected.It is proved that this method can be effectively applied to the acquisition of such resources.The research enriches the acquisition methods of open access journals, and provides a method to guide the acquisition of open access journals that do not follow the OAI-PMH protocol.

    Open Access Journal; Open Access Journal Resource Acquisition; Web Information Acquisition; Open Access Journal Resource Acquisition System

    G250

    10.3772/j.issn.1673-2286.2017.05.004

    黃政,男,1992年生,碩士研究生,研究方向:信息資源管理,E-mail:17888802420@163.com。

    張學(xué)福,男,1966年生,博士,研究員,研究方向:農(nóng)業(yè)知識組織與可視化分析,通訊作者,E-mail:zhangxuefu@caas.cn。

    2017-04-14)

    猜你喜歡
    適用性網(wǎng)頁工具
    強(qiáng)調(diào)簡潔和適用性 MICHI by Rotel X5/X3合并功放
    波比的工具
    波比的工具
    環(huán)保技術(shù)在土木工程領(lǐng)域的適用性探討
    小議階級分析理論的適用性
    基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
    電子制作(2018年10期)2018-08-04 03:24:38
    “巧用”工具
    讀者(2017年18期)2017-08-29 21:22:03
    基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
    電子制作(2017年2期)2017-05-17 03:54:56
    新一代車上轉(zhuǎn)換裝置在廠礦企業(yè)鐵路運輸中的適用性研究
    網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
    電子測試(2015年18期)2016-01-14 01:22:58
    精品国产露脸久久av麻豆| 观看美女的网站| 毛片女人毛片| 国产在线一区二区三区精| 久久av网站| 亚洲精品乱码久久久久久按摩| 黑人高潮一二区| 午夜福利视频精品| 内地一区二区视频在线| 国产黄片美女视频| 亚洲av男天堂| 中文字幕精品免费在线观看视频 | 亚洲欧美一区二区三区黑人 | 亚洲国产最新在线播放| 九九爱精品视频在线观看| 亚洲,欧美,日韩| 中文字幕av成人在线电影| 成人国产av品久久久| 久久久久久久久大av| 一二三四中文在线观看免费高清| av线在线观看网站| 99视频精品全部免费 在线| 久久精品久久久久久噜噜老黄| 我要看日韩黄色一级片| 亚洲精品第二区| 成人一区二区视频在线观看| 亚洲av国产av综合av卡| 丰满乱子伦码专区| 国产69精品久久久久777片| 观看免费一级毛片| 午夜免费观看性视频| 久久精品国产鲁丝片午夜精品| 又黄又爽又刺激的免费视频.| 日韩一区二区视频免费看| 精品久久久噜噜| 欧美变态另类bdsm刘玥| 日韩欧美精品免费久久| 99久国产av精品国产电影| 国产中年淑女户外野战色| 久久久久久久国产电影| 日韩电影二区| 黄色配什么色好看| 一级毛片黄色毛片免费观看视频| 亚洲中文av在线| 成人免费观看视频高清| 高清视频免费观看一区二区| 亚洲经典国产精华液单| 高清黄色对白视频在线免费看 | 亚洲电影在线观看av| 全区人妻精品视频| 这个男人来自地球电影免费观看 | 免费黄色在线免费观看| 国产欧美日韩一区二区三区在线 | 午夜老司机福利剧场| 少妇熟女欧美另类| 亚洲av在线观看美女高潮| 午夜免费观看性视频| 色网站视频免费| 这个男人来自地球电影免费观看 | 久久精品国产鲁丝片午夜精品| 国产精品国产av在线观看| .国产精品久久| 这个男人来自地球电影免费观看 | av福利片在线观看| 中文欧美无线码| 伦理电影免费视频| 亚洲欧美中文字幕日韩二区| 在线观看人妻少妇| 色5月婷婷丁香| 人人妻人人澡人人爽人人夜夜| 国产高潮美女av| 亚洲精品乱久久久久久| 亚洲aⅴ乱码一区二区在线播放| 免费黄色在线免费观看| av线在线观看网站| 久久女婷五月综合色啪小说| 国产亚洲91精品色在线| 国产69精品久久久久777片| 99re6热这里在线精品视频| 亚洲美女黄色视频免费看| 偷拍熟女少妇极品色| 嘟嘟电影网在线观看| 少妇高潮的动态图| 亚洲欧美成人综合另类久久久| 亚洲aⅴ乱码一区二区在线播放| 高清毛片免费看| av天堂中文字幕网| 一级片'在线观看视频| 国产精品嫩草影院av在线观看| 国产色婷婷99| 交换朋友夫妻互换小说| 亚洲精品国产成人久久av| 天堂俺去俺来也www色官网| 国产伦在线观看视频一区| 成人黄色视频免费在线看| 国精品久久久久久国模美| 内地一区二区视频在线| 国产高潮美女av| av一本久久久久| 建设人人有责人人尽责人人享有的 | 欧美三级亚洲精品| 日韩强制内射视频| 亚洲精品乱码久久久v下载方式| av福利片在线观看| 精品一区在线观看国产| 一级av片app| 免费大片黄手机在线观看| 哪个播放器可以免费观看大片| av在线播放精品| 国产在线一区二区三区精| 欧美三级亚洲精品| 丰满乱子伦码专区| 丝瓜视频免费看黄片| 99视频精品全部免费 在线| 自拍欧美九色日韩亚洲蝌蚪91 | 成人午夜精彩视频在线观看| 一区二区三区精品91| 久久99热这里只频精品6学生| 国产91av在线免费观看| 亚洲av日韩在线播放| 伦理电影免费视频| av线在线观看网站| 在线观看av片永久免费下载| av在线播放精品| 高清在线视频一区二区三区| 亚洲精品亚洲一区二区| 嫩草影院新地址| 久久久久久久久久久丰满| 亚洲电影在线观看av| 一级a做视频免费观看| 性色av一级| 岛国毛片在线播放| 一级a做视频免费观看| 欧美丝袜亚洲另类| 国产熟女欧美一区二区| 亚洲国产精品一区三区| 亚洲国产精品国产精品| 边亲边吃奶的免费视频| 亚洲aⅴ乱码一区二区在线播放| 乱码一卡2卡4卡精品| 日本免费在线观看一区| 久久久久人妻精品一区果冻| 新久久久久国产一级毛片| 亚洲精品aⅴ在线观看| 久久久久人妻精品一区果冻| 如何舔出高潮| 91精品一卡2卡3卡4卡| 制服丝袜香蕉在线| 视频区图区小说| 在线观看国产h片| 国产熟女欧美一区二区| 国产男女内射视频| 亚洲婷婷狠狠爱综合网| 国产一级毛片在线| 91狼人影院| 老熟女久久久| 国产精品一区二区在线观看99| 国产亚洲5aaaaa淫片| 亚洲国产欧美人成| 在现免费观看毛片| 极品少妇高潮喷水抽搐| 一个人看的www免费观看视频| av免费观看日本| 丰满迷人的少妇在线观看| 亚洲人与动物交配视频| 免费人成在线观看视频色| 亚洲第一区二区三区不卡| 99久久中文字幕三级久久日本| 男男h啪啪无遮挡| 亚洲图色成人| 网址你懂的国产日韩在线| 黄片wwwwww| 嫩草影院新地址| 欧美3d第一页| 国产伦在线观看视频一区| 国产精品国产三级专区第一集| 国产精品三级大全| 日本欧美国产在线视频| 亚洲无线观看免费| 国产精品人妻久久久影院| 青春草国产在线视频| 国产精品.久久久| 大码成人一级视频| 精品99又大又爽又粗少妇毛片| 午夜福利在线观看免费完整高清在| 成人18禁高潮啪啪吃奶动态图 | 在线观看美女被高潮喷水网站| 久久久久久久久久久丰满| 欧美精品人与动牲交sv欧美| 毛片一级片免费看久久久久| 18+在线观看网站| 日本wwww免费看| 精品一区二区三区视频在线| 国产高清不卡午夜福利| 久久影院123| 直男gayav资源| 成人毛片60女人毛片免费| 久久久久久久精品精品| 一级毛片aaaaaa免费看小| 精华霜和精华液先用哪个| 欧美成人一区二区免费高清观看| 亚洲在久久综合| 97超视频在线观看视频| 中文字幕制服av| 亚洲av日韩在线播放| 国产黄片视频在线免费观看| 小蜜桃在线观看免费完整版高清| 亚洲精品乱久久久久久| 内地一区二区视频在线| 亚洲欧美精品专区久久| 中文乱码字字幕精品一区二区三区| 亚洲最大成人中文| av免费在线看不卡| 极品教师在线视频| 91午夜精品亚洲一区二区三区| 免费观看无遮挡的男女| 尾随美女入室| 成人国产av品久久久| 一区二区三区乱码不卡18| 亚洲精华国产精华液的使用体验| 国产欧美另类精品又又久久亚洲欧美| 如何舔出高潮| 亚洲av欧美aⅴ国产| 国产av国产精品国产| 精品视频人人做人人爽| 亚洲av男天堂| 免费黄网站久久成人精品| 午夜福利高清视频| 插阴视频在线观看视频| 五月开心婷婷网| 国产亚洲午夜精品一区二区久久| 尤物成人国产欧美一区二区三区| 精华霜和精华液先用哪个| 久久久久精品性色| 欧美日韩综合久久久久久| 舔av片在线| 亚洲国产毛片av蜜桃av| 日韩不卡一区二区三区视频在线| 水蜜桃什么品种好| 日本黄大片高清| 久久 成人 亚洲| 赤兔流量卡办理| 久久精品久久久久久噜噜老黄| 好男人视频免费观看在线| 亚洲美女搞黄在线观看| 99热这里只有是精品在线观看| 午夜免费男女啪啪视频观看| av网站免费在线观看视频| 天美传媒精品一区二区| 狂野欧美激情性bbbbbb| 18+在线观看网站| av免费观看日本| 夜夜骑夜夜射夜夜干| 国产高清三级在线| 国产永久视频网站| 在线观看国产h片| 久久久久久人妻| av在线蜜桃| 多毛熟女@视频| 亚洲人成网站在线播| 欧美日韩一区二区视频在线观看视频在线| 国产欧美另类精品又又久久亚洲欧美| av女优亚洲男人天堂| 高清视频免费观看一区二区| 久久国产乱子免费精品| 亚洲,一卡二卡三卡| 国产精品久久久久久久久免| 伦理电影大哥的女人| 七月丁香在线播放| 麻豆成人午夜福利视频| a级一级毛片免费在线观看| 汤姆久久久久久久影院中文字幕| 久久人人爽av亚洲精品天堂 | 纵有疾风起免费观看全集完整版| a级毛片免费高清观看在线播放| 久久99热6这里只有精品| www.av在线官网国产| 久久久久久伊人网av| 国产淫片久久久久久久久| 精品视频人人做人人爽| 国产精品无大码| 久久午夜福利片| 人妻 亚洲 视频| 婷婷色综合大香蕉| 一本久久精品| 亚洲国产精品国产精品| 国产美女午夜福利| 尾随美女入室| 成人黄色视频免费在线看| 久久久a久久爽久久v久久| 黄色配什么色好看| 美女国产视频在线观看| 国产淫片久久久久久久久| 亚洲精品一二三| 黄片wwwwww| 大香蕉97超碰在线| 中国美白少妇内射xxxbb| 看非洲黑人一级黄片| 插阴视频在线观看视频| 九九爱精品视频在线观看| 人妻一区二区av| 日本午夜av视频| 国产国拍精品亚洲av在线观看| 女性被躁到高潮视频| 人妻一区二区av| 国产成人91sexporn| 欧美精品亚洲一区二区| 岛国毛片在线播放| 国产黄片视频在线免费观看| 日日摸夜夜添夜夜添av毛片| 丰满迷人的少妇在线观看| 午夜免费观看性视频| 日韩中文字幕视频在线看片 | 视频区图区小说| 亚洲av综合色区一区| 男人舔奶头视频| av不卡在线播放| 久久女婷五月综合色啪小说| 国产免费一区二区三区四区乱码| 黑丝袜美女国产一区| 在线观看免费高清a一片| 欧美+日韩+精品| 精品一区在线观看国产| 亚洲精品一二三| 丰满乱子伦码专区| kizo精华| 狂野欧美激情性xxxx在线观看| 精品视频人人做人人爽| 麻豆国产97在线/欧美| 免费黄频网站在线观看国产| 黑人高潮一二区| 国产亚洲av片在线观看秒播厂| 亚洲欧洲国产日韩| 久久精品国产亚洲av天美| 免费观看a级毛片全部| 久久精品久久久久久久性| 蜜臀久久99精品久久宅男| 97精品久久久久久久久久精品| 亚洲av欧美aⅴ国产| 一本一本综合久久| av在线蜜桃| 在现免费观看毛片| 男的添女的下面高潮视频| av不卡在线播放| 欧美日韩一区二区视频在线观看视频在线| 久久国内精品自在自线图片| 久久人妻熟女aⅴ| 成人无遮挡网站| 一个人看的www免费观看视频| 啦啦啦视频在线资源免费观看| 国产探花极品一区二区| 久久久久久久精品精品| 九草在线视频观看| 毛片一级片免费看久久久久| 亚洲成人av在线免费| 国产免费一区二区三区四区乱码| 国产av码专区亚洲av| 一本久久精品| 在线看a的网站| 99久国产av精品国产电影| 精品熟女少妇av免费看| 精品一区二区三区视频在线| 中文字幕av成人在线电影| 国产精品99久久99久久久不卡 | 日本-黄色视频高清免费观看| 最后的刺客免费高清国语| 国产精品99久久久久久久久| 国产精品福利在线免费观看| 国产黄频视频在线观看| 卡戴珊不雅视频在线播放| 在线观看免费视频网站a站| 久久久成人免费电影| 干丝袜人妻中文字幕| 亚洲激情五月婷婷啪啪| 能在线免费看毛片的网站| 国产探花极品一区二区| 激情 狠狠 欧美| 夜夜爽夜夜爽视频| 日日撸夜夜添| 极品教师在线视频| 亚洲精品日韩在线中文字幕| 王馨瑶露胸无遮挡在线观看| 高清视频免费观看一区二区| 亚洲欧洲日产国产| 亚洲第一av免费看| 欧美bdsm另类| 99热全是精品| av网站免费在线观看视频| 日韩欧美精品免费久久| 三级经典国产精品| 偷拍熟女少妇极品色| 亚洲av中文字字幕乱码综合| 久久久久久久久大av| 国产黄色视频一区二区在线观看| 女人久久www免费人成看片| 在线观看国产h片| 乱码一卡2卡4卡精品| 亚洲熟女精品中文字幕| 毛片女人毛片| 亚洲欧美成人精品一区二区| 国产精品av视频在线免费观看| 国语对白做爰xxxⅹ性视频网站| 高清视频免费观看一区二区| 欧美精品国产亚洲| 亚洲av不卡在线观看| 男女边摸边吃奶| 最后的刺客免费高清国语| 精品少妇黑人巨大在线播放| 国产男女内射视频| 日日啪夜夜爽| av国产免费在线观看| 99热6这里只有精品| 日本黄大片高清| 国产精品久久久久久av不卡| 国产精品不卡视频一区二区| 亚洲精品色激情综合| 亚洲精品国产av蜜桃| freevideosex欧美| 亚洲精品日本国产第一区| 国产男女超爽视频在线观看| 高清不卡的av网站| 国产精品99久久久久久久久| 成人特级av手机在线观看| 国产一区有黄有色的免费视频| 日本午夜av视频| 九九爱精品视频在线观看| 十分钟在线观看高清视频www | 麻豆精品久久久久久蜜桃| 深夜a级毛片| 内地一区二区视频在线| 亚洲精品色激情综合| h视频一区二区三区| 国产精品爽爽va在线观看网站| 伦精品一区二区三区| 91精品国产国语对白视频| 在线天堂最新版资源| 国产老妇伦熟女老妇高清| 久久久亚洲精品成人影院| 天堂俺去俺来也www色官网| 日韩中字成人| 老师上课跳d突然被开到最大视频| 国产亚洲91精品色在线| 国产伦理片在线播放av一区| 91久久精品国产一区二区成人| 国产高清不卡午夜福利| 简卡轻食公司| 亚洲熟女精品中文字幕| 乱码一卡2卡4卡精品| 麻豆国产97在线/欧美| 亚洲无线观看免费| 一区二区三区免费毛片| av网站免费在线观看视频| 久久99热6这里只有精品| 99热国产这里只有精品6| 国产日韩欧美亚洲二区| 国产精品三级大全| 日韩,欧美,国产一区二区三区| av国产久精品久网站免费入址| 男女无遮挡免费网站观看| 又粗又硬又长又爽又黄的视频| 欧美高清成人免费视频www| 久久精品久久精品一区二区三区| 高清午夜精品一区二区三区| 少妇人妻精品综合一区二区| 最黄视频免费看| 免费黄频网站在线观看国产| 噜噜噜噜噜久久久久久91| 亚洲久久久国产精品| 欧美成人一区二区免费高清观看| 国产永久视频网站| 久久人人爽人人片av| 一区在线观看完整版| 涩涩av久久男人的天堂| 一边亲一边摸免费视频| 国产伦在线观看视频一区| 嫩草影院入口| 国产永久视频网站| 纯流量卡能插随身wifi吗| 色吧在线观看| 亚洲欧美成人精品一区二区| 在线观看免费高清a一片| 寂寞人妻少妇视频99o| 99热全是精品| www.色视频.com| 日韩电影二区| 国产高清有码在线观看视频| 亚洲欧美一区二区三区黑人 | 亚洲,欧美,日韩| av国产久精品久网站免费入址| 欧美精品一区二区大全| 如何舔出高潮| 国产男人的电影天堂91| 一个人看视频在线观看www免费| 最后的刺客免费高清国语| 久久精品人妻少妇| 亚洲美女搞黄在线观看| 亚洲欧洲日产国产| 色综合色国产| 亚洲欧美中文字幕日韩二区| 日韩中字成人| 国产淫语在线视频| av国产精品久久久久影院| 亚洲第一区二区三区不卡| 99热这里只有是精品在线观看| 国产伦精品一区二区三区视频9| 成年女人在线观看亚洲视频| 亚洲,一卡二卡三卡| 国产免费福利视频在线观看| 男人狂女人下面高潮的视频| av又黄又爽大尺度在线免费看| 日日摸夜夜添夜夜添av毛片| 精品久久久精品久久久| 汤姆久久久久久久影院中文字幕| 久久精品国产鲁丝片午夜精品| 男女边吃奶边做爰视频| 黄色配什么色好看| 国产精品久久久久久精品电影小说 | 日本一二三区视频观看| 自拍偷自拍亚洲精品老妇| 丝瓜视频免费看黄片| 亚洲国产欧美人成| 亚洲经典国产精华液单| 少妇 在线观看| 亚洲国产av新网站| 欧美高清成人免费视频www| 一区二区三区免费毛片| 亚洲精品久久久久久婷婷小说| av线在线观看网站| 国产视频首页在线观看| 大陆偷拍与自拍| 免费在线观看成人毛片| 一级毛片 在线播放| 中文资源天堂在线| 99久久精品国产国产毛片| 中文欧美无线码| 又黄又爽又刺激的免费视频.| 久久综合国产亚洲精品| 制服丝袜香蕉在线| 特大巨黑吊av在线直播| 一级a做视频免费观看| 女人久久www免费人成看片| 精品人妻熟女av久视频| 日本wwww免费看| 18+在线观看网站| 精品久久久精品久久久| 久久99蜜桃精品久久| 99热这里只有是精品50| av国产精品久久久久影院| 交换朋友夫妻互换小说| 高清毛片免费看| 国产精品爽爽va在线观看网站| 国产av精品麻豆| 国产69精品久久久久777片| 国产一区亚洲一区在线观看| 久久久久国产网址| 国产黄色视频一区二区在线观看| 亚洲国产精品专区欧美| 亚洲欧美成人精品一区二区| 日本一二三区视频观看| 哪个播放器可以免费观看大片| 日韩电影二区| 大片免费播放器 马上看| 日产精品乱码卡一卡2卡三| 在线观看人妻少妇| 嫩草影院新地址| 交换朋友夫妻互换小说| 99久久人妻综合| 欧美性感艳星| 精品熟女少妇av免费看| 中文字幕制服av| 欧美另类一区| 国产有黄有色有爽视频| 嘟嘟电影网在线观看| 亚洲欧洲日产国产| 99精国产麻豆久久婷婷| 亚洲精品中文字幕在线视频 | 一区二区三区四区激情视频| 久久热精品热| 亚洲精品一区蜜桃| 成人漫画全彩无遮挡| 肉色欧美久久久久久久蜜桃| 国产一级毛片在线| 夫妻午夜视频| 在线天堂最新版资源| 香蕉精品网在线| 亚洲欧洲日产国产| 精品国产露脸久久av麻豆| 亚洲精品456在线播放app| 国产精品免费大片| 99精国产麻豆久久婷婷| 嘟嘟电影网在线观看| 国产精品欧美亚洲77777| 九九在线视频观看精品| 国产视频内射| 777米奇影视久久| 99re6热这里在线精品视频| 乱系列少妇在线播放| 高清日韩中文字幕在线| 亚洲欧美日韩东京热| 少妇人妻精品综合一区二区| 免费不卡的大黄色大毛片视频在线观看| 人妻制服诱惑在线中文字幕| 欧美xxxx性猛交bbbb| 久久久久视频综合| 看十八女毛片水多多多| 色视频www国产| 日韩中文字幕视频在线看片 | 下体分泌物呈黄色| 亚洲伊人久久精品综合| 日韩国内少妇激情av| 免费黄色在线免费观看| 五月玫瑰六月丁香| 人人妻人人澡人人爽人人夜夜| 国产无遮挡羞羞视频在线观看| 国产亚洲午夜精品一区二区久久|