• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    新聞?wù)男畔⒃诰€提取方法研究

    2017-06-20 23:48:34王年豐費瀟瀟
    軟件導(dǎo)刊 2017年4期
    關(guān)鍵詞:信息系統(tǒng)設(shè)計

    王年豐+費瀟瀟

    摘要:新聞?wù)男畔⑻崛π畔z索、存儲和輿情監(jiān)測等具有極其重要的意義。為實現(xiàn)新聞信息的正確提取,考慮到DOM等幾種技術(shù)的優(yōu)勢,結(jié)合DOM技術(shù)、動態(tài)型網(wǎng)頁信息抽取技術(shù)和行塊分布算法等技術(shù)優(yōu)點,重點研究了新聞信息的提取方法,尤其針對動態(tài)網(wǎng)頁的信息提取,設(shè)計了一套有效的新聞?wù)男畔⑻崛》椒?。實驗結(jié)果表明,該方法能有效實現(xiàn)新聞的正文信息抽取,準(zhǔn)確率高,具有一定推廣價值。

    關(guān)鍵詞:信息抽?。籇OM技術(shù);動態(tài)型網(wǎng)頁;行塊分布算法(DOIBP)WT9.5HZDOI:WTHT9.5SS10.11907/rjdk.162557中圖分類號:TP301

    文獻(xiàn)標(biāo)識碼:A(文章編號BP)文章編號:16727800(2017)004000905

    0引言 當(dāng)前,互聯(lián)網(wǎng)資源豐富,如何從海量信息中獲取所需信息已經(jīng)成為Web智能信息處理研究領(lǐng)域面臨的重大問題之一。由于實際的新聞網(wǎng)頁往往包含很多與主題無關(guān)的導(dǎo)航區(qū)、超鏈接、廣告信息、版權(quán)信息等噪聲信息,設(shè)計搜索引擎按主題搜索相關(guān)信息的工具時,應(yīng)采用新聞信息抽取技術(shù)剔除網(wǎng)頁中的噪聲信息,從而獲取整個新聞的正文信息。新聞信息抽取技術(shù)是將Web作為信息源的一類信息抽取,即從新聞頁面所包含的無結(jié)構(gòu)或半結(jié)構(gòu)化的信息中識別用戶所需的數(shù)據(jù)。為了提高Web新聞信息抽取的準(zhǔn)確度和效率,許多學(xué)者提出了各自的方法而且不斷加以完善,主要可以分為4類:基于統(tǒng)計理論的技術(shù)、基于文檔對象模型的技術(shù)、基于模板的技術(shù)和基于視覺特征的技術(shù)。

    (1)基于統(tǒng)計理論的方法利用統(tǒng)計方法和規(guī)律,將網(wǎng)頁HTML文檔作為一個整體或去除網(wǎng)頁標(biāo)簽,獲取網(wǎng)頁正文信息。該方法克服了數(shù)據(jù)源的限制,具有通用性。Arias等

    [1]從網(wǎng)頁標(biāo)簽序列中找出對應(yīng)的文本序列,由于網(wǎng)頁正文與非正文長度和標(biāo)簽數(shù)量存在差異,可以此為基礎(chǔ)構(gòu)建網(wǎng)頁文本密度圖,以統(tǒng)計的方法識別出網(wǎng)頁正文部分;而參考文獻(xiàn)[2]提出了一種基于行塊分布的方法,該方法擺脫了網(wǎng)頁結(jié)構(gòu)的限制,可高效準(zhǔn)確地抽取網(wǎng)頁正文,但需要人工干預(yù),且對網(wǎng)頁上其它信息的提取不夠。

    (2)基于文檔對象模型的方法,通過將HTML文檔解析成一棵DOM樹,利用節(jié)點特征來制定相應(yīng)的抽取規(guī)則。目前已有許多成型的系統(tǒng)和經(jīng)典算法,如 RoadRunner系統(tǒng)、DSE算法、MDR算法等

    [3]。很多學(xué)者在此基礎(chǔ)上進(jìn)行了深入研究。如王琦等

    [4]基于DOM規(guī)范,將HTML文檔轉(zhuǎn)換為含有語義信息的STU-DOM樹,進(jìn)行基于結(jié)構(gòu)的過濾和基于語義的剪枝,提取網(wǎng)頁主題;Gupta等

    [5]使用啟發(fā)式規(guī)則來構(gòu)造過濾器,以對DOM樹中的無用節(jié)點進(jìn)行過濾刪除,對于廣告的過濾使用的是黑名單策略。該方法依靠文檔本身的結(jié)構(gòu)優(yōu)勢,不需要復(fù)雜技術(shù)和人工干預(yù),但通用性不好。

    (3)基于網(wǎng)頁模板的提取算法。這類算法可以大致分為兩類,一類是從同種結(jié)構(gòu)的網(wǎng)頁集中提取出模板作為參考,這種模板一般從同一網(wǎng)站的不同網(wǎng)頁中提取;另一類是從各種不同的網(wǎng)頁中歸類,并分別提取抽象層次更高、歸納性更強的通用模板。Reis等

    [6]使用一種樹的類正則表達(dá)式pe-pattern,以RTDM算法對樣本網(wǎng)頁進(jìn)行聚類,并從聚類結(jié)果的DOM樹中提取出ne-pattern作為該聚類的模板;Vieira等

    [7]對RTDM算法進(jìn)行拓展,使用樹的最小編輯距離,實現(xiàn)對DOM樹模板的檢測和刪除。這些方法從模板角度提供了比較新穎的思路,但是計算量非常大,在處理海量數(shù)據(jù)時效率較低。

    (4)基于視覺分塊的提取算法。這類算法從用戶對網(wǎng)頁的視覺感受出發(fā),依照網(wǎng)頁中節(jié)點的樣式特點對頁面分塊,再從分塊結(jié)果中找出正文所在的塊來達(dá)到提取正文的目的。黃文蓓等

    [8]以TVPS算法為參考,構(gòu)建DOM樹,以

    等容器標(biāo)簽為基準(zhǔn),尋找最低層容器節(jié)點的各個文本節(jié)點進(jìn)行合并,計算信息量并比較最低層容器節(jié)點與其兄弟節(jié)點、父節(jié)點的信息量,從而選擇出能夠構(gòu)成文本塊的節(jié)點。該方法考慮到了DOM中包含文本節(jié)點的結(jié)構(gòu)性,相比于原有算法,準(zhǔn)確率得到了一定提升,但算法的運算量依然較大。 這些方法抽取正文信息的前提是所有正文信息都在網(wǎng)頁內(nèi),但新聞圖片網(wǎng)頁的正文信息一般不是全部在網(wǎng)頁內(nèi),例如:騰訊、搜狐、新浪、鳳凰等新聞圖片頻道,大多需要用戶點擊翻頁獲取更多信息,因而傳統(tǒng)方法很難準(zhǔn)確地獲取這種新聞網(wǎng)頁信息。因此本文在研究現(xiàn)有抽取技術(shù)的基礎(chǔ)上,利用動態(tài)網(wǎng)頁信息抽取方法、行塊分析算法和DOM技術(shù),實現(xiàn)了針對大型新聞門戶的新聞網(wǎng)頁正文信息抽取系統(tǒng)。該系統(tǒng)不僅解決了正文信息在網(wǎng)頁上的正文抽取問題,而且解決了正文信息不全在網(wǎng)頁上的正文抽取問題。

    1系統(tǒng)概述

    本系統(tǒng)總體分為3部分:預(yù)處理模塊(Pretreatment)、動態(tài)型網(wǎng)頁信息抽取模塊(Dywebextract)、新聞普通網(wǎng)頁信息抽取模塊(Stwebextract)。系統(tǒng)總體框架如圖1所示。 預(yù)處理模塊(Pretreatment):Pretreatment模塊是正文信息提取預(yù)處理模塊,可提前獲取新聞標(biāo)題、發(fā)布時間等信息;對不同的新聞網(wǎng)頁進(jìn)行分類,對于動態(tài)型網(wǎng)頁則采用動態(tài)型網(wǎng)頁抽取模塊,對于新聞普通網(wǎng)頁則采用靜態(tài)型網(wǎng)頁信息抽取模塊。 動態(tài)型網(wǎng)頁信息抽取模塊(Dywebextract):該模塊的主要功能是對新聞圖片網(wǎng)頁進(jìn)行解析、識別翻頁符和獲取正文信息。 新聞普通網(wǎng)頁信息抽取模塊(Stwebextract):該模塊是對普通新聞網(wǎng)頁進(jìn)行解析,其基于行分塊分布算法來提取正文信息,通過中文語法規(guī)范來減少噪聲。

    2各模塊算法設(shè)計與實現(xiàn)

    2.1預(yù)處理模塊 在新聞?wù)男畔⒊槿∠到y(tǒng)中,為保證新聞?wù)男畔⒌某槿≠|(zhì)量和抽取效率,在抽取相關(guān)信息時應(yīng)按照網(wǎng)頁類型采用不同的抽取方法(即大部分新聞圖片網(wǎng)頁采用動態(tài)抽取方法,新聞普通網(wǎng)頁采用行塊分布方法)。由此可以看出,在抽取信息之前應(yīng)對網(wǎng)頁進(jìn)行分類,根據(jù)抽取目的,采用預(yù)處理模塊完成新聞網(wǎng)頁分類工作。又由于行塊分布算法不依賴于網(wǎng)頁結(jié)構(gòu)本身,對于新聞標(biāo)題等信息提取明顯不足,因此需要在預(yù)處理模塊中利用DOM技術(shù)提取新聞標(biāo)題、發(fā)布時間等信息,并將新聞標(biāo)題、新聞網(wǎng)頁HTML文檔、新聞URL等信息打包分別傳給下級模塊。因此,預(yù)處理模塊的功能是網(wǎng)頁分類和利用文檔對象模型提取新聞標(biāo)題等信息。

    2.1.1Web新聞分類 新聞網(wǎng)頁一般分為兩種類型:導(dǎo)航型網(wǎng)頁、主題型網(wǎng)頁。主題型網(wǎng)頁通常通過成段的文字、圖片等信息描述新聞主題,為了便于處理又可將其分為兩小類:①新聞普通網(wǎng)頁。這類網(wǎng)頁類似靜態(tài)網(wǎng)頁,當(dāng)網(wǎng)頁加載完之后,要采集的信息都在網(wǎng)頁上,大部分新聞網(wǎng)頁屬于這一類;②動態(tài)型網(wǎng)頁。即圖片新聞(指有相同事件主題的圖片及簡短文字描述的數(shù)據(jù)集合),當(dāng)網(wǎng)頁加載完之后,要采集的信息不都在網(wǎng)頁中,需要翻頁才能更新網(wǎng)頁內(nèi)容,大量新聞圖片網(wǎng)頁屬于這一類,如圖2所示。 通常,網(wǎng)絡(luò)上的每一種資源,例如網(wǎng)頁、圖片、視頻等,都有一個唯一的URL,其信息包含了文件位置和瀏覽器對其如何處理。URL的一般格式為:協(xié)議類型://服務(wù)器地址(一般情況下,默認(rèn)不寫端口號)/路徑名/[?查詢][#信息片段],其中方括號[]為可選項,例如:http://news.qq.com/a/20160714/048155.htm#p=1 通過觀察驗證,屬于同一新聞網(wǎng)站動態(tài)網(wǎng)頁的內(nèi)容布局與樣式外觀比較相似。與此同時,同一網(wǎng)站的動態(tài)網(wǎng)頁的URL相似度也高,這一點從網(wǎng)頁開發(fā)和網(wǎng)站管理的高效性和便捷而言也是十分合理的,因此利用URL相似度進(jìn)行新聞網(wǎng)頁分類。Qi等

    [9]在計算URL相似度上使用了Dice系數(shù)并結(jié)合使用了統(tǒng)計方法完成URL的相似度量。這種方法從字符串處理的角度出發(fā),又由于URL的格式特點,在協(xié)議、服務(wù)器名、域名相同的情況下,本文利用新聞URL特征來判斷動態(tài)型網(wǎng)頁,詳細(xì)介紹如下:①若新聞url字符串中,其路徑中包含有“pic”、“photo”等關(guān)于圖片的英文字符串,則表示該新聞URL為動態(tài)型網(wǎng)頁。例如:人民網(wǎng)、新華網(wǎng)等網(wǎng)站中的URL包含這些關(guān)于圖片的字符串;②若新聞url其后綴符合數(shù)字遞增或字母遞增,則該新聞網(wǎng)頁是動態(tài)型網(wǎng)頁,例如:騰訊、新浪、搜狐、網(wǎng)易、鳳凰等網(wǎng)站中的URL后綴有極強的規(guī)律,為數(shù)字遞增。2.1.2〓文檔對象模型 文檔對象模型(DOM)是一種處理HTML和 XML文檔的標(biāo)準(zhǔn)應(yīng)用程序接口(API),它將文檔表示為一個樹形結(jié)構(gòu),HTML標(biāo)簽、屬性或文本都被作為樹的一個節(jié)點?;贒OM的信息抽取技術(shù)利用網(wǎng)頁的結(jié)構(gòu)特點,能夠簡單、高效地從網(wǎng)頁中提取所需內(nèi)容,其克服了行分塊算法對新聞標(biāo)題、發(fā)布時間等信息提取不足的缺點。因此本文在正文信息抽取之前,使用HtmlUnit

    [10]渲染新聞網(wǎng)頁獲取HTML源碼,然后使用Jsoup中的DOM對象抽取新聞標(biāo)題、發(fā)布時間等信息。例如:新聞標(biāo)題抽取時,首先提取標(biāo)簽中的標(biāo)簽內(nèi)容,然后截取‘—、‘_、‘/等標(biāo)記(<TITLE>內(nèi)容常常用來分割標(biāo)題與新聞來源)之前的內(nèi)容為新聞標(biāo)題。2.2動態(tài)型網(wǎng)頁信息抽取模塊 Dywebextract模塊接受了Pretreatment模塊的數(shù)據(jù),其主要功能是動態(tài)型網(wǎng)頁翻頁識別和正文信息抽取。對于動態(tài)型網(wǎng)頁翻頁識別,采用兩種策略:①若該新聞網(wǎng)頁有本地url pattern模板(系統(tǒng)在初始化時根據(jù)各大新聞網(wǎng)站動態(tài)型網(wǎng)頁url的特點,添加url pattern)或者XPath模板(有效元素路徑),則按照url pattern模板自行翻頁(url后綴數(shù)字遞增或者字母遞減)或觸發(fā)點擊XPath。在新聞網(wǎng)頁標(biāo)題相同的情況下,循環(huán)翻頁直到抓取不到有效頁面(出現(xiàn)重復(fù)頁面或者死鏈接);②若本地沒有相應(yīng)的url pattern模板或者XPath,則獲取HTML中的備選有效元素,然后將其觸發(fā),最后通過觸發(fā)有效性來篩選出有效元素。 對于正文信息提取,本文利用同一個新聞門戶里的動態(tài)型網(wǎng)頁結(jié)構(gòu)高度相似的特點,采用兩個策略:①若本地有XPath pattern模板庫,則按照XPath pattern模板提取正文信息;②若沒有,則利用布局相似性的網(wǎng)頁正文內(nèi)容提取方法<br>[11]提取正文信息。對于XPath pattern模板庫的管理采用計時的管理方式,若XPath pattern模板庫中的一個XPath連續(xù)一個星期沒用到,則認(rèn)為該模板為失效XPath,將其刪去。本模塊算法流程如圖3所示,下面重點介紹其中的幾個主要環(huán)節(jié)。<br>2.2.1備選有效元素集合 動態(tài)型網(wǎng)頁中含有有效元素,有效元素觸發(fā)之后會異步生成動態(tài)信息,而靜態(tài)型網(wǎng)頁不需要觸發(fā)有效元素來獲取信息。但動態(tài)型網(wǎng)頁中含有很多觸發(fā)元素(比如按鈕、文本框、鏈接等),有效元素觸發(fā)生成的動態(tài)信息為有價值的動態(tài)信息,而無效元素觸發(fā)生成的動態(tài)信息為無效信息,比如觸發(fā)元素僅改變了網(wǎng)頁的字體顏色或其它噪聲部分。在動態(tài)型網(wǎng)頁中,<a>、<div>、<span>等標(biāo)簽代表的元素可能導(dǎo)致頁面發(fā)生變化<br>[12],從而產(chǎn)生有價值的動態(tài)信息,因此本系統(tǒng)將有效元素篩選僅限于<A>、<DIV>、<SPAN>標(biāo)簽。 為進(jìn)一步縮小有效元素的搜索范圍,提高頁面信息的獲取效率,需要在搜索有效元素之前確定有效元素的標(biāo)簽集合。對于本系統(tǒng)而言,有效元素是可以點擊下一頁獲取下一頁正文信息的元素。因此,本文統(tǒng)計了騰訊等8個大型新聞門戶網(wǎng)站,從這些新聞門戶中隨機抽取各100個新聞網(wǎng)頁,發(fā)現(xiàn)絕大部分有效元素的屬性值里都包含有“next”、“right”、“下一張(頁)”等字眼。有效元素一般綁定了有效事件,通過用戶點擊元素執(zhí)行腳本程序或者網(wǎng)頁跳轉(zhuǎn),以獲取更多網(wǎng)頁信息,因此其屬性值里包含有JavaScript或者一個URL。對于<A>標(biāo)簽,若其子標(biāo)簽里沒有<IMG>,則認(rèn)為其是有效標(biāo)簽。 綜上所述,本系統(tǒng)將屬性里包含有“next”、“下一張”等字眼的<A>、<DIV>、<SPAN>標(biāo)簽定義為備選有效標(biāo)簽。<br>2.2.2觸發(fā)元素 動態(tài)型網(wǎng)頁采用異步加載技術(shù),當(dāng)用戶點擊觸發(fā)有效元素時,會激發(fā)有效元素綁定的特定事件,瀏覽器會執(zhí)行該事件相應(yīng)的JavaScript動態(tài)腳本程序。因此,需要一個工具來模擬用戶點擊操作,HtmlUnit恰恰能解決此模擬問題。HtmlUnit是一款開源的Java頁面分析工具,采用了Rhinojs引擎,可以模擬瀏覽器運行,且運行速度很快。本系統(tǒng)采用全探測掃描算法 <!--endprint--> </div> </div> <div class="newartpage"> [<a href="article.aspx?titleid=rjdk20170403">1</a>] <label class="fBold"> 2 </label> [<a href="article.aspx?titleid=rjdk20170403-2">3</a>] [<a href="article.aspx?titleid=rjdk20170403-3">4</a>] <a href="javascript:OpenFavoriteTitle('rjdk20170403','新聞?wù)男畔⒃诰€提取方法研究','王年豐 費瀟瀟');"> 存入我的閱覽室</a> </div> </div> </div> <div class="eiboxright"> <div class="eiboxrighttop"> </div> <div class="eiboxrightbody0"> <div class="eitextbox"> <ul> <li><a target="_blank" href="Mag.aspx?issn=82589D23-32F8-4175-B6A9-49CEFBC68AF0&year=2017&issue=5"> <img src="http://img1.qikan.com/qkimages/rjdk/rjdk201705-m.jpg" alt="《故事會》" style="filter: alpha(opacity=100);" onmousemove="javascript:f_move(this)" onmouseout="javascript:f_out(this)" width="120px" height="158px" /> </a> <p> <b><a target="_blank" href="Mag.aspx?issn=82589D23-32F8-4175-B6A9-49CEFBC68AF0&year=2017&issue=5" title="軟件導(dǎo)刊">《軟件導(dǎo)刊》</a></b><br /> 2017年05期 </p> </li> </ul> </div> <div class="eiboxrightbody0dlcase"> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 軟件理論與方法</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170401" title="基于不確定性分析的移動對象軌跡估計技術(shù)"> 基于不確定性分析的移動對象軌跡估計技術(shù)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170402" title="領(lǐng)域文本信息抽取中的短語相似度計算方法"> 領(lǐng)域文本信息抽取中的短語相似度計算方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170403" title="新聞?wù)男畔⒃诰€提取方法研究"> 新聞?wù)男畔⒃诰€提取方法研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170404" title="研討系統(tǒng)中的發(fā)言文本聚類及其可視化"> 研討系統(tǒng)中的發(fā)言文本聚類及其可視化</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170405" title="一種基于單周期控制的改進(jìn)型功率因數(shù)校正方法"> 一種基于單周期控制的改進(jìn)型功率因數(shù)校正方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170406" title="一種基于ARM的異構(gòu)CPU—GPU集群調(diào)度模型"> 一種基于ARM的異構(gòu)CPU—GPU集群調(diào)度模型</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170407" title="基于Bootstrap的響應(yīng)式網(wǎng)頁設(shè)計中斷點研究"> 基于Bootstrap的響應(yīng)式網(wǎng)頁設(shè)計中斷點研究</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 算法與語言</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170408" title="基于灰狼優(yōu)化的模糊C—均值聚類算法"> 基于灰狼優(yōu)化的模糊C—均值聚類算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170409" title="基于協(xié)方差矩陣的壓縮感知跟蹤算法"> 基于協(xié)方差矩陣的壓縮感知跟蹤算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170410" title="基于Android端的慣性導(dǎo)航算法研究"> 基于Android端的慣性導(dǎo)航算法研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170411" title="基于NAND閃存的安全U盤FTL算法研究"> 基于NAND閃存的安全U盤FTL算法研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170412" title="無線傳感器網(wǎng)絡(luò)加權(quán)質(zhì)心定位算法改進(jìn)研究"> 無線傳感器網(wǎng)絡(luò)加權(quán)質(zhì)心定位算法改進(jìn)研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170413" title="基于最低能耗的改進(jìn)LEACH分簇算法"> 基于最低能耗的改進(jìn)LEACH分簇算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170414" title="基于AdaBoost算法的在線連續(xù)極限學(xué)習(xí)機集成算法"> 基于AdaBoost算法的在線連續(xù)極限學(xué)習(xí)機集成算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170415" title="協(xié)同進(jìn)化多生境遺傳算法"> 協(xié)同進(jìn)化多生境遺傳算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170416" title="K—means和人工魚群結(jié)合的聚類算法研究"> K—means和人工魚群結(jié)合的聚類算法研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170417" title="基于Voronoi盲區(qū)的差分進(jìn)化WSN部署算法"> 基于Voronoi盲區(qū)的差分進(jìn)化WSN部署算法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170418" title="算法參數(shù)對人工蜂群算法性能的影響"> 算法參數(shù)對人工蜂群算法性能的影響</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170419" title="基于卡爾曼預(yù)測的軌跡片段關(guān)聯(lián)目標(biāo)跟蹤算法"> 基于卡爾曼預(yù)測的軌跡片段關(guān)聯(lián)目標(biāo)跟蹤算法</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 軟件設(shè)計與開發(fā)</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170420" title="基于Express的違章查詢REST Web Service設(shè)計與實現(xiàn)"> 基于Express的違章查詢REST Web Service設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170421" title="基于協(xié)同過濾算法的IT書籍推薦系統(tǒng)設(shè)計與實現(xiàn)"> 基于協(xié)同過濾算法的IT書籍推薦系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170422" title="OpenStack云主機監(jiān)控系統(tǒng)研究與實現(xiàn)"> OpenStack云主機監(jiān)控系統(tǒng)研究與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170423" title="面向部門崗位的工作流引擎研究與實現(xiàn)"> 面向部門崗位的工作流引擎研究與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170424" title="基于HALCON的票據(jù)字符提取系統(tǒng)設(shè)計與實現(xiàn)"> 基于HALCON的票據(jù)字符提取系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170425" title="基于ANSYS的豎直型風(fēng)力發(fā)電機葉片建模與仿真"> 基于ANSYS的豎直型風(fēng)力發(fā)電機葉片建模與仿真</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170426" title="基于虛擬現(xiàn)實技術(shù)的湖湘文化旅游系統(tǒng)設(shè)計與實現(xiàn)"> 基于虛擬現(xiàn)實技術(shù)的湖湘文化旅游系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170427" title="一種基于OSG的雙旋翼直升機仿真系統(tǒng)與程序?qū)崿F(xiàn)"> 一種基于OSG的雙旋翼直升機仿真系統(tǒng)與程序?qū)崿F(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170428" title="基于ESSH框架的高??蒲袌F(tuán)隊信息管理系統(tǒng)設(shè)計與實現(xiàn)"> 基于ESSH框架的高??蒲袌F(tuán)隊信息管理系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170429" title="基于SolidWorks二次開發(fā)的剪式升降平臺快速設(shè)計系統(tǒng)"> 基于SolidWorks二次開發(fā)的剪式升降平臺快速設(shè)計系統(tǒng)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170430" title="基于.NET N層架構(gòu)和團(tuán)隊開發(fā)模式的部隊信息化平臺構(gòu)建"> 基于.NET N層架構(gòu)和團(tuán)隊開發(fā)模式的部隊信息化平臺構(gòu)建</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170431" title="基于VR技術(shù)的虛擬仿真生活體驗館設(shè)計與實現(xiàn)"> 基于VR技術(shù)的虛擬仿真生活體驗館設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170432" title="基于面部瞳孔識別及數(shù)據(jù)采集器的電子巡檢系統(tǒng)設(shè)計"> 基于面部瞳孔識別及數(shù)據(jù)采集器的電子巡檢系統(tǒng)設(shè)計</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170433" title="基于微信公眾平臺與Moodle的移動學(xué)習(xí)環(huán)境構(gòu)建"> 基于微信公眾平臺與Moodle的移動學(xué)習(xí)環(huán)境構(gòu)建</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170434" title="學(xué)習(xí)資源爬蟲系統(tǒng)設(shè)計與實現(xiàn)"> 學(xué)習(xí)資源爬蟲系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170435" title="基于參數(shù)化的擠壓模具敏捷設(shè)計系統(tǒng)研究"> 基于參數(shù)化的擠壓模具敏捷設(shè)計系統(tǒng)研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170436" title="一種基于Hadoop平臺的分布式數(shù)據(jù)檢索系統(tǒng)"> 一種基于Hadoop平臺的分布式數(shù)據(jù)檢索系統(tǒng)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170437" title="DBaaS自助門戶服務(wù)平臺構(gòu)建研究"> DBaaS自助門戶服務(wù)平臺構(gòu)建研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170438" title="基于μCOS嵌入式系統(tǒng)控制的激光打標(biāo)機設(shè)計"> 基于μCOS嵌入式系統(tǒng)控制的激光打標(biāo)機設(shè)計</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170439" title="基于協(xié)同過濾算法的移動英語學(xué)習(xí)平臺研究與設(shè)計"> 基于協(xié)同過濾算法的移動英語學(xué)習(xí)平臺研究與設(shè)計</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170440" title="基于MVC模式的畢業(yè)論文(設(shè)計)管理系統(tǒng)設(shè)計與實現(xiàn)"> 基于MVC模式的畢業(yè)論文(設(shè)計)管理系統(tǒng)設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170441" title="基于VB.NET的圓柱齒輪減速器智能設(shè)計系統(tǒng)"> 基于VB.NET的圓柱齒輪減速器智能設(shè)計系統(tǒng)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170442" title="基于AM3359 和WinCE7.0平臺的RTC時鐘設(shè)計與實現(xiàn)"> 基于AM3359 和WinCE7.0平臺的RTC時鐘設(shè)計與實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170443" title="基于Pro/E二次開發(fā)的剪板機快速設(shè)計系統(tǒng)"> 基于Pro/E二次開發(fā)的剪板機快速設(shè)計系統(tǒng)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170444" title="基于單片機的水位監(jiān)控系統(tǒng)設(shè)計"> 基于單片機的水位監(jiān)控系統(tǒng)設(shè)計</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 應(yīng)用技術(shù)與研究</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170445" title="BP神經(jīng)網(wǎng)絡(luò)在石油項目經(jīng)濟效益綜合評價中的應(yīng)用"> BP神經(jīng)網(wǎng)絡(luò)在石油項目經(jīng)濟效益綜合評價中的應(yīng)用</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170446" title="基于密度的空間聚類算法在照明運維中的應(yīng)用"> 基于密度的空間聚類算法在照明運維中的應(yīng)用</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170447" title="基于VBA的異構(gòu)數(shù)據(jù)源自適應(yīng)讀寫技術(shù)研究與實踐"> 基于VBA的異構(gòu)數(shù)據(jù)源自適應(yīng)讀寫技術(shù)研究與實踐</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170448" title="基于泊松過程可分解性的小區(qū)開放對道路通行能力的影響"> 基于泊松過程可分解性的小區(qū)開放對道路通行能力的影響</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170449" title="基于模塊分解的IFPUG功能點分析方法應(yīng)用研究"> 基于模塊分解的IFPUG功能點分析方法應(yīng)用研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170450" title="基于圖像處理的工件加工精度檢測系統(tǒng)研究"> 基于圖像處理的工件加工精度檢測系統(tǒng)研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170451" title="一種基于EA的需求管理實施方案"> 一種基于EA的需求管理實施方案</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170452" title="基于Halcon的食品生產(chǎn)日期針孔光學(xué)字符檢測"> 基于Halcon的食品生產(chǎn)日期針孔光學(xué)字符檢測</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170453" title="面向照明終端芯片程序的無線遠(yuǎn)程升級研究與應(yīng)用"> 面向照明終端芯片程序的無線遠(yuǎn)程升級研究與應(yīng)用</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170454" title="基于ElasticSearch的Angularjs聯(lián)想框功能實現(xiàn)"> 基于ElasticSearch的Angularjs聯(lián)想框功能實現(xiàn)</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170455" title="“互聯(lián)網(wǎng)+”校園一卡通融合路徑研究"> “互聯(lián)網(wǎng)+”校園一卡通融合路徑研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170456" title="一種使用經(jīng)驗系數(shù)灰度化的中藥葉片分割方法"> 一種使用經(jīng)驗系數(shù)灰度化的中藥葉片分割方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170457" title="基于相似度代價計算的內(nèi)存數(shù)據(jù)庫集群數(shù)據(jù)劃分"> 基于相似度代價計算的內(nèi)存數(shù)據(jù)庫集群數(shù)據(jù)劃分</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170458" title="基于K—均值算法的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用"> 基于K—均值算法的數(shù)據(jù)挖掘技術(shù)研究及應(yīng)用</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 信息安全</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170459" title="一種基于壓縮感知與混沌系統(tǒng)的比特級圖像加密方法"> 一種基于壓縮感知與混沌系統(tǒng)的比特級圖像加密方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170460" title="鐵路車站計算機聯(lián)鎖系統(tǒng)安全性分析"> 鐵路車站計算機聯(lián)鎖系統(tǒng)安全性分析</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170461" title="PDF中隱私數(shù)據(jù)的保護(hù)方法"> PDF中隱私數(shù)據(jù)的保護(hù)方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170462" title="基于貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)風(fēng)險評估研究"> 基于貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)風(fēng)險評估研究</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 圖像學(xué)與輔助設(shè)計</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170463" title="桌面遙感圖像處理系統(tǒng)并行處理架構(gòu)選擇與實驗分析"> 桌面遙感圖像處理系統(tǒng)并行處理架構(gòu)選擇與實驗分析</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170464" title="SharpGL三維建模技術(shù)實現(xiàn)"> SharpGL三維建模技術(shù)實現(xiàn)</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 綜述</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170465" title="Web服務(wù)測試綜述"> Web服務(wù)測試綜述</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170466" title="大數(shù)據(jù)處理平臺比較研究"> 大數(shù)據(jù)處理平臺比較研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170467" title="Java Web應(yīng)用開發(fā)中的常見亂碼形式及解決方法"> Java Web應(yīng)用開發(fā)中的常見亂碼形式及解決方法</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170468" title="APP應(yīng)用現(xiàn)狀、挑戰(zhàn)與展望"> APP應(yīng)用現(xiàn)狀、挑戰(zhàn)與展望</a> </dd> </dl> <dl onmouseover="this.className='cc0'" onmouseout="this.className='cc1'"> <dt> 計算機與網(wǎng)絡(luò)教學(xué)</dt> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170469" title="面向工程的計算機專業(yè)實踐教學(xué)體系研究"> 面向工程的計算機專業(yè)實踐教學(xué)體系研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170470" title="《C語言程序設(shè)計》課程“三位一體式”教學(xué)模式研究"> 《C語言程序設(shè)計》課程“三位一體式”教學(xué)模式研究</a> </dd> <dd > <a target="_blank" href="Article.aspx?titleid=rjdk20170471" title="ASP.NET課程教學(xué)改革研究與實踐"> ASP.NET課程教學(xué)改革研究與實踐</a> </dd> </dl> </div> </div> </div> </div> </div> <div id="menuFooterDiv" class="headnav0"></div> <script type="text/javascript"> jQuery("#menuHeaderDiv").html(html); jQuery(function () { jQuery("#morelayer").hover(function () { jQuery("#divmorelayer").fadeIn(300); }) jQuery("#divmorelayer").hover(function () { jQuery("#divmorelayer").fadeIn(300); }, function () { jQuery("#divmorelayer").fadeOut(300); }) }) jQuery("#menuFooterDiv").html(htmlFooter); jQuery(function () { jQuery("#morelayerFooter").hover(function () { jQuery("#divmorelayerFooter").fadeIn(300); }) jQuery("#divmorelayerFooter").hover(function () { jQuery("#divmorelayerFooter").fadeIn(300); }, function () { jQuery("#divmorelayerFooter").fadeOut(300); }) }) if (jQuery('.morelayer_body > a').length == 0) { //頁眉/頁腳導(dǎo)航“更多”下沒有內(nèi)容,將“更多”隱藏 jQuery('.threeunit').hide(); } </script> <div class="rearinfo"> 公司地址: 北京市西城區(qū)德外大街83號德勝國際中心B-11<br>客服熱線:400-656-5456??客服專線:010-56265043??電子郵箱:<a href="mailto:longyuankf@126.com">longyuankf@126.com</a><br>電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證:<a target="_blank">京icp證060024號</a><br>Dragonsource.com Inc. All Rights Reserved </div><div class="icp"> <a target="_blank"> <img src="/Content/Images/icp.jpg" alt="icp" /></a></div> </div> </div> </form> <script type="text/javascript" src="/Content/Script/jquery.cookie.js"></script> <script type="text/javascript"> jQuery(document.body).ready(function () { if (jQuery.cookie('enablecookie') == null) { jQuery.cookie('enablecookie', '1'); var ec = jQuery.cookie('enablecookie'); if (ec == null) { location.href = "http://" + domain + "/content/error.aspx?error=nocookie"; } } }); </script> <script type="text/javascript"> var showad = true; var Toppx = jQuery(".headbox").height() + jQuery(".banner").height() + 10; //60; var AdDivW = 100; var AdDivH = 252; var PageWidth = 800; var MinScreenW = 1024; function scall1() { if (!showad) { return; } if (window.screen.width < MinScreenW) { showad = false; // document.getElementById("ctl00_LeftDiv").style.display = "none"; // document.getElementById("ctl00_RightDiv").style.display = "none"; jQuery("#ctl00_LeftDiv").hide(); jQuery("#ctl00_RightDiv").hide(); return; } var Borderpx = 30; //((window.screen.width - PageWidth) / 2 - AdDivW) / 2; // document.getElementById('ctl00_LeftDiv').style.display = ""; // document.getElementById('ctl00_LeftDiv').style.top = document.documentElement.scrollTop + Toppx; // document.getElementById('ctl00_LeftDiv').style.left = document.documentElement.scrollLeft + Borderpx; // document.getElementById('ctl00_RightDiv').style.display = ""; // document.getElementById('ctl00_RightDiv').style.top = document.documentElement.scrollTop + Toppx; // document.getElementById('ctl00_RightDiv').style.left = document.documentElement.scrollLeft + document.body.clientWidth - document.getElementById('ctl00_RightDiv').offsetWidth - Borderpx; jQuery("#ctl00_LeftDiv").show(); var Scrolltoppx = document.documentElement.scrollTop; var Scrollleftpx = document.documentElement.scrollLeft; jQuery("#ctl00_LeftDiv").css("top", Scrolltoppx + Toppx); jQuery("#ctl00_LeftDiv").css("left", Scrollleftpx + Borderpx); jQuery("#ctl00_RightDiv").show(); jQuery("#ctl00_RightDiv").css("top", Scrolltoppx + Toppx); jQuery("#ctl00_RightDiv").css("left", Scrollleftpx + document.body.clientWidth - document.getElementById('ctl00_RightDiv').offsetWidth - Borderpx); } function hidead1() { showad = false; document.getElementById('ctl00_LeftDiv').style.display = "none"; document.getElementById('ctl00_RightDiv').style.display = "none"; } function addLoadEvent1(func) { var oldonload = window.onload; if (typeof window.onload != 'function') { window.onload = func; } else { window.onload = function () { oldonload(); func(); } } } window.onscroll = scall1; window.onresize = scall1; addLoadEvent1(scall1); </script> <script type="text/javascript"> var piao=false; var xPos = 300; var yPos = 200; var step = 1; var delay = 30; var height = 0; var Hoffset = 0; var Woffset = 0; var yon = 0; var xon = 0; var pause = true; var interval; var img1 = document.getElementById("ctl00_PiaoDiv"); img1.style.display = 'block'; img1.style.top = yPos; function changePos() { var Scrolltoppx = document.documentElement.scrollTop; var Scrollleftpx = document.documentElement.scrollLeft; width = document.body.clientWidth - 200; height = document.documentElement.clientHeight; Hoffset = img1.offsetHeight; Woffset = img1.offsetWidth; jQuery(img1).css("left", xPos + document.body.scrollLeft); jQuery(img1).css("top", Scrolltoppx + yPos + document.body.scrollTop); if (yon) { yPos = yPos + step; } else { yPos = yPos - step; } if (yPos < 0) { yon = 1; yPos = 0; } if (yPos >= (height - Hoffset)) { yon = 0; yPos = (height - Hoffset); } if (xon) { xPos = xPos + step; } else { xPos = xPos - step; } if (xPos < 0) { xon = 1; xPos = 0; } if (xPos >= (width - Woffset)) { xon = 0; xPos = (width - Woffset); } } function start() { img1.visibility = "visible"; interval = setInterval('changePos()', delay); } function pause_resume() { if (pause) { clearInterval(interval); pause = false; } else { interval = setInterval('changePos()', delay); pause = true; } } if(piao) { start(); } </script> <fjtignoreurl> <script type="text/javascript"> //為了處理https協(xié)議在繁簡轉(zhuǎn)換的時候會默認(rèn)吧鏈接轉(zhuǎn)換成帶有端口號444的鏈接的問題。 jQuery(function () { $("a[href*=':444']").each(function () { var link = $(this).attr('href'); link = link.replace(/^https://big5.qikan.com:444/i, "http://big5.qikan.com") $(this).attr('href', link); }); });</script></fjtignoreurl> <script type="text/javascript"> jQuery(function () { var link = "https://big5.qikan.com"; }); </script><fjtignoreurl><script type="text/javascript">var _userid = 'locklg006@nlc.com';var _siteid =19;var _istoken = 1;var _model = 'Model03';</script><script src="http://tj.qikan.com/urchin.js" type="text/javascript"> </script><script type="text/javascript">WebPageSpeed =469; UrchinTrack();</script></fjtignoreurl></body></html>

    [13],將有效元素集合中的所有元素進(jìn)行點擊操作。2.2.3觸發(fā)有效性判斷 動態(tài)型網(wǎng)頁在觸發(fā)有效元素時,會改變DOM樹的結(jié)構(gòu),觸發(fā)有效性判斷也可以表示為DOM樹結(jié)構(gòu)的變化,因此可以通過比較DOM樹結(jié)構(gòu)相似性作為觸發(fā)有效性的標(biāo)識。由于每次獲取下一頁,網(wǎng)頁里只有圖片和正文信息變動,其它噪聲、鏈接等部分基本不變,因此在判斷DOM樹相似性之前,通過正則表達(dá)式過濾獲取中文文字信息。 何昕等

    [14]利用簡單樹匹配算法來判斷DOM樹相似性,它是一個受限的匹配算法,采用動態(tài)規(guī)劃來計算兩棵樹的最大匹配結(jié)點個數(shù),得到兩棵樹結(jié)構(gòu)的相似度;Roest等

    [15]提出了比較頁面的方法,該方法比較每個模塊首先定位到該模塊所針對的DOM樹結(jié)構(gòu)的特點部位,若判定其內(nèi)容相同,則過濾掉該部分信息,將剩余內(nèi)容傳遞給下一比較模塊,否則便可以直接判定兩個DOM樹不相似。以上兩種方法更多的是從DOM樹結(jié)構(gòu)出發(fā),考慮到新聞網(wǎng)頁有效信息都在中文文字里,在網(wǎng)頁標(biāo)題的情況下,本系統(tǒng)對比新得到的網(wǎng)頁中文信息與觸發(fā)之前的網(wǎng)頁中文信息,若只有極少數(shù)發(fā)生變化,則認(rèn)為新得到的網(wǎng)頁無效,該觸發(fā)無效;否則,認(rèn)為得到的網(wǎng)頁有效,將有效元素XPath存入XPath模板庫中。2.3新聞普通網(wǎng)頁信息抽取模塊 新聞普通網(wǎng)頁信息抽取模塊的目標(biāo)是抽取新聞普通網(wǎng)頁的正文信息。新聞普通網(wǎng)頁的正文結(jié)構(gòu)通常比較緊湊,網(wǎng)頁內(nèi)圖片較少,正文代碼的一行大都是文字,超鏈接長度所占比率不大。又由于行塊分布算法對主題網(wǎng)頁有很好的通用性和較高的準(zhǔn)確率,因此使用行塊分布算法。行塊分析算法的思想是哈爾濱工業(yè)大學(xué)信息檢索中心的陳鑫等研究提出的,其網(wǎng)頁正文塊起始行塊號Xstart和結(jié)束行塊號Xend的確定,必須同時滿足以下幾個條件,這里定義 Y(X)為以行號 X 為軸的行塊長度值。 (1)Ystart> Y(Xt),其中Y(Xt)是行塊長度的第一個驟升點,驟升點的行塊長度必須大于預(yù)先定義的閾值。

    (2)Y(Xn)不等于0(其中n屬于[start+1,start+n]),緊跟在驟升點的行塊長度不能為0,以消除噪聲。

    (3)Y(Xm)=0(其中m屬于[end,end+1]),驟降點以及緊跟在驟降點后面行的行塊長度為 0,以保證正文提取結(jié)束。 本文根據(jù)行塊分布算法的思想,利用Java中的JFreeChart繪圖工具,可得如圖4所示的行塊分布函數(shù)折線圖。從圖4可看出,有很多內(nèi)容塊[start=743,end=745]、[start=749,end=773]、[start=1160,end=1165]、[start=1198,end=1205],而且內(nèi)容塊中可能還有噪聲部分沒有清除。因此,根據(jù)新聞網(wǎng)頁噪聲的特點,添加了第4個約束條件。

    (4)Ystart

    3實驗測試

    3.1實驗準(zhǔn)備

    測試系統(tǒng)的機器環(huán)境為:1臺臺式機(CPU為Intel四核2.93GHz,4G內(nèi)存,硬盤為7 200r/min,操作系統(tǒng)為Win7,10兆網(wǎng)速)。本系統(tǒng)采用純Java實現(xiàn),有效元素路徑存儲選用MySQL5.5數(shù)據(jù)庫存儲。為了使結(jié)果更具說服力,本文設(shè)計了一個輕量級的主題爬蟲,從知名的新聞網(wǎng)站(如騰訊新聞、網(wǎng)易新聞、搜狐新聞、新浪新聞等)中爬取網(wǎng)頁,以此作為實驗網(wǎng)頁集。實驗主要測試新聞?wù)男畔⑻崛〉恼_率和提取速度,而新聞標(biāo)題則是由網(wǎng)頁采集器提?。ㄒ话銓?dǎo)航網(wǎng)頁里,新聞標(biāo)題和新聞URL在一起),這里不作處理。對于動態(tài)新聞,提取出的正文完全覆蓋真正的含義,而且沒有過濾干凈的噪聲占正文的比例不大于5%時才算合格。對于靜態(tài)網(wǎng)頁,本文采用準(zhǔn)確率來表示提出正文信息的準(zhǔn)確性:準(zhǔn)確率=正確過濾的網(wǎng)頁數(shù)/總網(wǎng)頁個數(shù)×100%

    3.2實驗結(jié)果 表1給出了系統(tǒng)網(wǎng)頁正文抽取準(zhǔn)確率以及在線抽取正文信息速率,其中每個網(wǎng)站動態(tài)網(wǎng)頁和靜態(tài)網(wǎng)頁各100個,總共1 600個網(wǎng)頁。表1的試驗結(jié)果表明:本系統(tǒng)抽取靜態(tài)型網(wǎng)頁的準(zhǔn)確率高于93%,對原新聞網(wǎng)頁正文內(nèi)容提取比較完整,但動態(tài)型網(wǎng)頁的準(zhǔn)確率都在80%以上。出現(xiàn)誤差的原因是不同專題的設(shè)計風(fēng)格不盡相同,以及人們對于網(wǎng)頁中正文的界定差異等因素存在,本文算法的結(jié)果或多或少會受到一定影響。對于正文內(nèi)容為純文本的網(wǎng)頁,本文算法的準(zhǔn)確率很高。對于影響本系統(tǒng)正確率的幾個主要因素總結(jié)如下:①動態(tài)型網(wǎng)頁和普通新聞網(wǎng)頁的區(qū)分是根據(jù)URL相似度和URL是否含有標(biāo)識符來判斷的;②對于普通新聞網(wǎng)頁中正文內(nèi)容和噪聲部分的比例,如果網(wǎng)頁內(nèi)以圖片或視頻為主要內(nèi)容,過短的正文內(nèi)容會被作為噪聲,從而降低提取結(jié)果的正確率;③普通新聞網(wǎng)頁中若嵌入圖片,將使正文各部分之間距離相差較大。

    4實驗結(jié)論 本文提出的新聞網(wǎng)頁正文抽取系統(tǒng)除了利用行分塊算法抽取網(wǎng)頁信息以及DOM技術(shù)之外,還利用動態(tài)型網(wǎng)頁結(jié)構(gòu)上的相似性特點,實現(xiàn)了大型新聞網(wǎng)站新聞?wù)男畔⒌奶崛?。本系統(tǒng)不依靠大量的訓(xùn)練集,能夠較準(zhǔn)確地抽取新聞?wù)男畔?,實驗結(jié)果驗證了其有效性。然而,對英文網(wǎng)頁以及結(jié)構(gòu)復(fù)雜的網(wǎng)頁抽取效果不是很理想,尤其是嵌入圖文信息的普通新聞網(wǎng)頁。此方法只能抽取文字信息,不能獲得網(wǎng)頁圖片,下一步可以對英文網(wǎng)頁優(yōu)化、復(fù)雜網(wǎng)頁抽取算法和網(wǎng)頁圖片獲取方法等進(jìn)行深入研究。

    參考文獻(xiàn):

    [1]ARIAS J,DESCHACHT K,MOENS M F.Language independent content extraction from web pages[J].University of Twente,2009.

    [2]〓開源中國社區(qū).通用網(wǎng)頁正文抽取[EB/OL].[20150425].http://code.google.com/p/cxextractor/.

    [3]陳釗,張冬梅.Web信息抽取技術(shù)綜述[J].計算機應(yīng)用研究,2010,27(12):44014405.

    [4]王琦,唐世渭,楊冬青,等.基于DOM的網(wǎng)頁主題信息自動提取[C].中國數(shù)據(jù)庫學(xué)術(shù)會議,2004:17861792.

    [5]GUPTA S,KAISER G E,GRIMM P,et al.Automating content extraction of HTML documents[J].World Wide Webinternet & Web Information Systems,2005,8(2):179224.

    [6]REIS D C.Automatic web news extraction using tree edit distance[C].International Conference on World Wide Web.ACM,2004:502511.

    [7]VIEIRA K,SILVA A S D,PINTO N,et al.A fast and robust method for web page template detection and removal[C].ACM International Conference on Information and Knowledge Management.ACM,2006:258267.

    [8]黃文蓓,楊靜,顧君忠.基于分塊的網(wǎng)頁正文信息提取算法研究[J].計算機應(yīng)用,2007,27(s1):2426.

    [9]QI X,NIE L,DAVISON B D.Measuring similarity to detect qualified links[C].Airweb 2007,Third International Workshop on Adversarial Information Retrieval on the Web,CoLocated with the WWW Conference,Banff,Canada,2007:4956.

    [10]張佳榮.Java開源項目HtmlUnit在瀏覽器模擬方面的應(yīng)用[J].電子制作,2015(8):79.

    [11]楊柳青,李曉東,耿光剛.基于布局相似性的網(wǎng)頁正文內(nèi)容提取研究[J].計算機應(yīng)用研究,2015(9):25812586.

    [12]張瑤.面向AJAX腳本網(wǎng)絡(luò)的網(wǎng)頁爬行及解析技術(shù)的研究與實現(xiàn)[D].沈陽:東北大學(xué),2012.

    [13]MESBAH A,BOZDAG E,DEURSEN A V.Crawling AJAX by inferring user interface state changes[C].Eighth International Conference on Web Engineering,Yorktown Heights,New York,Usa.2008:122134.

    [14]何昕,謝志鵬.基于簡單樹匹配算法的Web頁面結(jié)構(gòu)相似性度量[J].計算機研究與發(fā)展,2007,44(z3):16.

    [15]ROEST D,MESBAH A,DEURSEN A V.Regression testing ajax applications: coping with dynamism[C].International Conference on Software Testing,Verification and Validation,ICST 2010,Paris,F(xiàn)rance,2010:127136.(責(zé)任編輯:杜能鋼)

    猜你喜歡
    信息系統(tǒng)設(shè)計
    Smartflower POP 一體式光伏系統(tǒng)
    WJ-700無人機系統(tǒng)
    ZC系列無人機遙感系統(tǒng)
    北京測繪(2020年12期)2020-12-29 01:33:58
    瞞天過海——仿生設(shè)計萌到家
    連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
    設(shè)計秀
    海峽姐妹(2017年7期)2017-07-31 19:08:17
    訂閱信息
    中華手工(2017年2期)2017-06-06 23:00:31
    有種設(shè)計叫而專
    Coco薇(2017年5期)2017-06-05 08:53:16
    展會信息
    中外會展(2014年4期)2014-11-27 07:46:46
    設(shè)計之味
    舒適廣告(2008年9期)2008-09-22 10:02:48
    天堂中文最新版在线下载| 欧美97在线视频| 日本黄色日本黄色录像| 国产女主播在线喷水免费视频网站| 美女大奶头黄色视频| 91精品三级在线观看| 美女脱内裤让男人舔精品视频| 黄片小视频在线播放| 久久毛片免费看一区二区三区| 免费看不卡的av| 人妻一区二区av| 黑丝袜美女国产一区| 国产女主播在线喷水免费视频网站| 久久99精品国语久久久| 欧美日韩一级在线毛片| 桃花免费在线播放| www.精华液| 91在线精品国自产拍蜜月| 久久午夜福利片| 最近的中文字幕免费完整| 18禁动态无遮挡网站| 久久国产精品男人的天堂亚洲| 欧美日韩综合久久久久久| 99热国产这里只有精品6| 看免费av毛片| 蜜桃国产av成人99| 老汉色av国产亚洲站长工具| 国产 一区精品| 国产综合精华液| 天堂俺去俺来也www色官网| 久久久精品免费免费高清| 中文天堂在线官网| 国产精品免费大片| 成年人午夜在线观看视频| 极品少妇高潮喷水抽搐| www.av在线官网国产| 亚洲精品,欧美精品| 看免费av毛片| 亚洲一区中文字幕在线| 亚洲国产毛片av蜜桃av| 国产高清不卡午夜福利| 日韩一卡2卡3卡4卡2021年| 亚洲 欧美一区二区三区| 日韩一区二区三区影片| 另类亚洲欧美激情| 久久免费观看电影| 国产男女内射视频| 国产老妇伦熟女老妇高清| 伊人久久国产一区二区| 国产白丝娇喘喷水9色精品| 1024视频免费在线观看| 国产精品 欧美亚洲| 色婷婷久久久亚洲欧美| 午夜影院在线不卡| 日本免费在线观看一区| 18禁裸乳无遮挡动漫免费视频| 国产1区2区3区精品| 久久久精品区二区三区| 亚洲精品一二三| 亚洲精品日韩在线中文字幕| 国产日韩一区二区三区精品不卡| 免费看av在线观看网站| 九草在线视频观看| 一区二区av电影网| 国产免费一区二区三区四区乱码| 国产野战对白在线观看| 久久99一区二区三区| 久久女婷五月综合色啪小说| 成人黄色视频免费在线看| 日本爱情动作片www.在线观看| 黄色 视频免费看| 国产一区二区三区综合在线观看| 永久网站在线| 国产精品三级大全| 青春草国产在线视频| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 国产男女内射视频| 国产成人aa在线观看| 少妇被粗大的猛进出69影院| 国产黄频视频在线观看| av国产精品久久久久影院| 国产欧美日韩一区二区三区在线| 成人亚洲精品一区在线观看| 亚洲成国产人片在线观看| 一本大道久久a久久精品| 久久国产精品男人的天堂亚洲| 最近最新中文字幕大全免费视频 | 日本vs欧美在线观看视频| 精品久久久精品久久久| 精品国产一区二区三区四区第35| 久久免费观看电影| 精品第一国产精品| 纯流量卡能插随身wifi吗| 国产白丝娇喘喷水9色精品| 日韩制服骚丝袜av| 夜夜骑夜夜射夜夜干| 久久国产精品男人的天堂亚洲| 欧美精品一区二区大全| 国产日韩一区二区三区精品不卡| 欧美 日韩 精品 国产| 看十八女毛片水多多多| 成人国语在线视频| 热99国产精品久久久久久7| 男女无遮挡免费网站观看| 亚洲激情五月婷婷啪啪| 亚洲精品久久午夜乱码| 成年av动漫网址| 最近中文字幕2019免费版| 日韩中文字幕视频在线看片| 亚洲欧美中文字幕日韩二区| 蜜桃在线观看..| 欧美日韩视频精品一区| 9191精品国产免费久久| 国产日韩欧美在线精品| 亚洲精品久久久久久婷婷小说| 青青草视频在线视频观看| 纯流量卡能插随身wifi吗| 美女高潮到喷水免费观看| 欧美bdsm另类| 夜夜骑夜夜射夜夜干| 精品一品国产午夜福利视频| 麻豆av在线久日| 自拍欧美九色日韩亚洲蝌蚪91| 卡戴珊不雅视频在线播放| 一区二区三区四区激情视频| 国产 精品1| 美女午夜性视频免费| 日韩熟女老妇一区二区性免费视频| 男的添女的下面高潮视频| 在线观看免费日韩欧美大片| 中文字幕人妻熟女乱码| 2018国产大陆天天弄谢| 王馨瑶露胸无遮挡在线观看| 国产一级毛片在线| 亚洲人成网站在线观看播放| 日本-黄色视频高清免费观看| 欧美日韩精品成人综合77777| 激情五月婷婷亚洲| 又黄又粗又硬又大视频| 亚洲精品国产av蜜桃| 另类亚洲欧美激情| 久久精品国产亚洲av高清一级| av免费在线看不卡| 久久午夜福利片| www.自偷自拍.com| 国产精品一区二区在线观看99| 各种免费的搞黄视频| 亚洲欧美精品综合一区二区三区 | 欧美日韩亚洲国产一区二区在线观看 | 日产精品乱码卡一卡2卡三| av国产精品久久久久影院| 男女午夜视频在线观看| 视频在线观看一区二区三区| 91精品国产国语对白视频| 欧美精品高潮呻吟av久久| 母亲3免费完整高清在线观看 | 亚洲内射少妇av| 国产精品一二三区在线看| 黄色配什么色好看| 在线观看三级黄色| 青春草国产在线视频| 久久久久久久久久久免费av| 亚洲内射少妇av| 成人二区视频| 永久网站在线| 天美传媒精品一区二区| 在线观看人妻少妇| 老鸭窝网址在线观看| 天堂8中文在线网| 伊人久久国产一区二区| 伊人亚洲综合成人网| 色视频在线一区二区三区| 涩涩av久久男人的天堂| 欧美亚洲 丝袜 人妻 在线| 中文字幕av电影在线播放| 亚洲第一av免费看| 免费观看a级毛片全部| 春色校园在线视频观看| 蜜桃在线观看..| 人人妻人人澡人人看| 在线 av 中文字幕| 91精品三级在线观看| av免费在线看不卡| 一区二区三区激情视频| 日本免费在线观看一区| 天堂8中文在线网| 在线观看人妻少妇| 欧美精品一区二区免费开放| 久久午夜福利片| 午夜免费观看性视频| 国产熟女午夜一区二区三区| 美女国产高潮福利片在线看| 大香蕉久久网| 国产激情久久老熟女| 如何舔出高潮| 男的添女的下面高潮视频| av在线播放精品| 欧美97在线视频| 亚洲天堂av无毛| 日本欧美国产在线视频| 看免费成人av毛片| 亚洲欧洲日产国产| 亚洲av在线观看美女高潮| 日韩av不卡免费在线播放| 亚洲精品av麻豆狂野| 男女无遮挡免费网站观看| 婷婷色综合大香蕉| 女性被躁到高潮视频| 十八禁网站网址无遮挡| 高清av免费在线| 在线亚洲精品国产二区图片欧美| 一级片免费观看大全| 久久韩国三级中文字幕| 18+在线观看网站| 国产成人91sexporn| 国产 精品1| 国产在线免费精品| 亚洲精品国产色婷婷电影| 久久久久久人妻| 我的亚洲天堂| 精品亚洲成a人片在线观看| 免费高清在线观看视频在线观看| 99久久精品国产国产毛片| 久久久久精品人妻al黑| 多毛熟女@视频| 99久久人妻综合| 日韩人妻精品一区2区三区| 嫩草影院入口| 高清视频免费观看一区二区| 自拍欧美九色日韩亚洲蝌蚪91| 欧美日韩亚洲高清精品| 日本-黄色视频高清免费观看| 考比视频在线观看| videosex国产| 免费在线观看黄色视频的| 亚洲精品av麻豆狂野| 女的被弄到高潮叫床怎么办| 久久av网站| 亚洲第一区二区三区不卡| 亚洲一级一片aⅴ在线观看| 我要看黄色一级片免费的| 黄色 视频免费看| 国产伦理片在线播放av一区| 女人久久www免费人成看片| 日韩人妻精品一区2区三区| 精品国产国语对白av| 黄色 视频免费看| 久久久精品区二区三区| 韩国高清视频一区二区三区| 777久久人妻少妇嫩草av网站| 春色校园在线视频观看| 免费观看无遮挡的男女| 99久国产av精品国产电影| 国产在线一区二区三区精| 国产精品.久久久| 中文字幕人妻熟女乱码| 一区二区三区四区激情视频| 欧美成人精品欧美一级黄| 国产探花极品一区二区| 亚洲色图 男人天堂 中文字幕| 成人漫画全彩无遮挡| 青春草国产在线视频| 熟女av电影| 街头女战士在线观看网站| 精品一区在线观看国产| 欧美中文综合在线视频| 国产亚洲最大av| 啦啦啦中文免费视频观看日本| 亚洲欧美精品综合一区二区三区 | 一个人免费看片子| 亚洲经典国产精华液单| 日韩伦理黄色片| 天美传媒精品一区二区| 麻豆精品久久久久久蜜桃| 久久毛片免费看一区二区三区| 人成视频在线观看免费观看| 又粗又硬又长又爽又黄的视频| 久久国内精品自在自线图片| 国产精品麻豆人妻色哟哟久久| 色网站视频免费| 国产成人av激情在线播放| 久久婷婷青草| 国产成人免费观看mmmm| 纯流量卡能插随身wifi吗| 亚洲av国产av综合av卡| 老司机亚洲免费影院| 国产成人精品在线电影| 久久精品久久精品一区二区三区| 精品99又大又爽又粗少妇毛片| 80岁老熟妇乱子伦牲交| 国产精品二区激情视频| 亚洲少妇的诱惑av| 中文字幕制服av| 亚洲精品日本国产第一区| 国产精品熟女久久久久浪| 免费日韩欧美在线观看| 少妇人妻精品综合一区二区| 久久99热这里只频精品6学生| 国产男女内射视频| 日韩伦理黄色片| 日韩av在线免费看完整版不卡| 亚洲第一区二区三区不卡| 制服诱惑二区| 亚洲情色 制服丝袜| 老司机亚洲免费影院| 人妻 亚洲 视频| 男女免费视频国产| 精品一区在线观看国产| 久久久久久人人人人人| 国产探花极品一区二区| 99精国产麻豆久久婷婷| 国产精品秋霞免费鲁丝片| 国产人伦9x9x在线观看 | 欧美老熟妇乱子伦牲交| 一级毛片黄色毛片免费观看视频| 视频在线观看一区二区三区| 亚洲熟女精品中文字幕| 精品第一国产精品| 免费av中文字幕在线| 免费久久久久久久精品成人欧美视频| 高清av免费在线| 精品第一国产精品| 久久人人爽av亚洲精品天堂| 亚洲精品第二区| 久久鲁丝午夜福利片| 久久这里只有精品19| 美国免费a级毛片| 超碰97精品在线观看| 一区二区三区激情视频| 下体分泌物呈黄色| 欧美成人午夜精品| 亚洲欧美精品综合一区二区三区 | 亚洲av综合色区一区| 亚洲五月色婷婷综合| 日韩一区二区三区影片| 国产无遮挡羞羞视频在线观看| 飞空精品影院首页| 久久精品国产亚洲av涩爱| 看非洲黑人一级黄片| 国精品久久久久久国模美| 如何舔出高潮| 久久这里有精品视频免费| 母亲3免费完整高清在线观看 | 久久午夜综合久久蜜桃| 国精品久久久久久国模美| 精品国产国语对白av| 久久久久久久国产电影| 高清在线视频一区二区三区| 在线观看一区二区三区激情| 亚洲精品久久成人aⅴ小说| 亚洲精品一二三| 久久久久国产网址| 日本免费在线观看一区| 男女国产视频网站| 18禁观看日本| 在线看a的网站| 我的亚洲天堂| 999久久久国产精品视频| 超碰97精品在线观看| 成年av动漫网址| 午夜免费观看性视频| 国产精品二区激情视频| 久久精品人人爽人人爽视色| 国产成人精品久久二区二区91 | 天天躁狠狠躁夜夜躁狠狠躁| 欧美精品高潮呻吟av久久| 青春草视频在线免费观看| 久久久欧美国产精品| 90打野战视频偷拍视频| 视频区图区小说| 天天躁日日躁夜夜躁夜夜| 亚洲三级黄色毛片| 寂寞人妻少妇视频99o| 久久久久视频综合| 亚洲一区中文字幕在线| 高清在线视频一区二区三区| 成人亚洲精品一区在线观看| 街头女战士在线观看网站| 可以免费在线观看a视频的电影网站 | 女人高潮潮喷娇喘18禁视频| 国产毛片在线视频| 波野结衣二区三区在线| 这个男人来自地球电影免费观看 | 亚洲av电影在线观看一区二区三区| 精品99又大又爽又粗少妇毛片| 男女下面插进去视频免费观看| 日韩不卡一区二区三区视频在线| 一本—道久久a久久精品蜜桃钙片| 久久久久久久精品精品| 大片免费播放器 马上看| 亚洲欧美精品综合一区二区三区 | 国产淫语在线视频| 18+在线观看网站| 久久久久精品人妻al黑| 成年人免费黄色播放视频| 性高湖久久久久久久久免费观看| 91午夜精品亚洲一区二区三区| 日日爽夜夜爽网站| 日韩一区二区视频免费看| 日本色播在线视频| 亚洲欧美清纯卡通| 精品人妻在线不人妻| 搡女人真爽免费视频火全软件| 水蜜桃什么品种好| 国产成人一区二区在线| 最黄视频免费看| 精品久久久精品久久久| 日本91视频免费播放| 亚洲av国产av综合av卡| 久久久久视频综合| av电影中文网址| 少妇精品久久久久久久| 最近中文字幕2019免费版| 日韩制服骚丝袜av| 欧美国产精品va在线观看不卡| 亚洲精品一二三| 一边亲一边摸免费视频| 日本91视频免费播放| 少妇人妻 视频| 天天躁日日躁夜夜躁夜夜| 亚洲伊人色综图| 精品酒店卫生间| 又大又黄又爽视频免费| 久久99热这里只频精品6学生| 亚洲欧美一区二区三区国产| 免费黄频网站在线观看国产| 亚洲人成网站在线观看播放| 国产成人精品无人区| 少妇人妻久久综合中文| 国产1区2区3区精品| 久久精品久久久久久久性| 在线观看免费视频网站a站| 七月丁香在线播放| www.自偷自拍.com| 免费高清在线观看视频在线观看| 中文字幕精品免费在线观看视频| 在线精品无人区一区二区三| 多毛熟女@视频| 少妇精品久久久久久久| 香蕉国产在线看| 曰老女人黄片| 色网站视频免费| 精品第一国产精品| 丝瓜视频免费看黄片| 最近最新中文字幕免费大全7| 久久97久久精品| videos熟女内射| 电影成人av| 我的亚洲天堂| av线在线观看网站| 一区二区三区精品91| 国产1区2区3区精品| 少妇精品久久久久久久| 欧美精品人与动牲交sv欧美| 成人影院久久| 亚洲国产成人一精品久久久| 成人亚洲精品一区在线观看| 少妇的丰满在线观看| 国产亚洲精品第一综合不卡| 国产一区二区在线观看av| 亚洲精品中文字幕在线视频| 91国产中文字幕| 丝袜脚勾引网站| 老司机影院毛片| 啦啦啦中文免费视频观看日本| 亚洲精品久久成人aⅴ小说| 国产成人91sexporn| 在线免费观看不下载黄p国产| 久久久亚洲精品成人影院| 女性被躁到高潮视频| 久久精品人人爽人人爽视色| 黄片播放在线免费| 国产乱人偷精品视频| 婷婷色麻豆天堂久久| 校园人妻丝袜中文字幕| 精品亚洲成国产av| 成人手机av| 亚洲欧美一区二区三区久久| 十八禁高潮呻吟视频| 午夜日本视频在线| 丝袜美足系列| 考比视频在线观看| 日韩制服骚丝袜av| 亚洲精品中文字幕在线视频| 免费女性裸体啪啪无遮挡网站| 丰满迷人的少妇在线观看| tube8黄色片| 久久久久视频综合| 国产日韩欧美在线精品| 亚洲国产欧美在线一区| 国产色婷婷99| 亚洲内射少妇av| 十八禁高潮呻吟视频| 欧美亚洲 丝袜 人妻 在线| 日韩免费高清中文字幕av| 大香蕉久久网| 久久久精品94久久精品| 久久精品国产鲁丝片午夜精品| 国产黄色免费在线视频| 9191精品国产免费久久| 国产精品国产av在线观看| 最新中文字幕久久久久| 人妻少妇偷人精品九色| 狠狠婷婷综合久久久久久88av| 天堂8中文在线网| kizo精华| 国产成人av激情在线播放| 午夜福利,免费看| 人人妻人人添人人爽欧美一区卜| 热99久久久久精品小说推荐| √禁漫天堂资源中文www| 亚洲第一av免费看| 欧美人与性动交α欧美精品济南到 | 欧美精品av麻豆av| 日日啪夜夜爽| 成人手机av| 9热在线视频观看99| 大陆偷拍与自拍| xxxhd国产人妻xxx| 热99久久久久精品小说推荐| 亚洲成国产人片在线观看| 在线亚洲精品国产二区图片欧美| 天天躁夜夜躁狠狠久久av| 99久国产av精品国产电影| 国产精品.久久久| 9色porny在线观看| 亚洲精品久久成人aⅴ小说| 99久久中文字幕三级久久日本| 飞空精品影院首页| 汤姆久久久久久久影院中文字幕| 亚洲av免费高清在线观看| 五月开心婷婷网| 我的亚洲天堂| 18+在线观看网站| 久久久国产一区二区| 少妇精品久久久久久久| 搡女人真爽免费视频火全软件| 超碰97精品在线观看| 亚洲天堂av无毛| 亚洲三区欧美一区| 一区二区三区精品91| 亚洲国产欧美日韩在线播放| 人人妻人人澡人人看| 一个人免费看片子| 啦啦啦在线观看免费高清www| 国产av一区二区精品久久| 久久久久久久久免费视频了| 国产探花极品一区二区| 人人妻人人添人人爽欧美一区卜| 亚洲久久久国产精品| 午夜免费鲁丝| 中文字幕人妻丝袜一区二区 | 久久久久国产一级毛片高清牌| 18禁观看日本| 五月伊人婷婷丁香| 国产亚洲一区二区精品| 午夜日本视频在线| 欧美日韩精品网址| 国产成人精品无人区| 中文乱码字字幕精品一区二区三区| 亚洲欧美一区二区三区黑人 | 欧美激情高清一区二区三区 | 在线观看www视频免费| 久久精品国产自在天天线| 高清在线视频一区二区三区| 一级片'在线观看视频| 国产精品不卡视频一区二区| 亚洲 欧美一区二区三区| 成年人免费黄色播放视频| 色播在线永久视频| 看十八女毛片水多多多| 黄色毛片三级朝国网站| 女人久久www免费人成看片| 黄色毛片三级朝国网站| 国产精品.久久久| 午夜福利视频精品| videosex国产| 国产免费一区二区三区四区乱码| 成人亚洲精品一区在线观看| 91精品伊人久久大香线蕉| 亚洲经典国产精华液单| 99久久综合免费| 成人亚洲欧美一区二区av| 国语对白做爰xxxⅹ性视频网站| 国产有黄有色有爽视频| 亚洲四区av| 交换朋友夫妻互换小说| 777久久人妻少妇嫩草av网站| 老鸭窝网址在线观看| 亚洲精品成人av观看孕妇| 美女主播在线视频| 老熟女久久久| 国产一区亚洲一区在线观看| 免费黄频网站在线观看国产| 一级毛片 在线播放| 免费黄频网站在线观看国产| 精品久久蜜臀av无| 国产成人精品一,二区| av又黄又爽大尺度在线免费看| 在线观看一区二区三区激情| 免费av中文字幕在线| 国产毛片在线视频| 亚洲精品久久午夜乱码| 日韩熟女老妇一区二区性免费视频| 国产免费一区二区三区四区乱码| 丝袜美腿诱惑在线| 亚洲国产色片| 丝袜人妻中文字幕| 国产精品久久久久久精品古装| 免费在线观看黄色视频的| 女人高潮潮喷娇喘18禁视频| 精品午夜福利在线看| 国产又色又爽无遮挡免| 精品少妇内射三级| 日韩人妻精品一区2区三区|