• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    電力系統(tǒng)中數(shù)據(jù)集成技術(shù)關(guān)鍵問題研究

    2016-12-28 06:44:18劉冬蘭劉新馬雷任俊杰楊鋒
    山東電力技術(shù) 2016年11期
    關(guān)鍵詞:高頻率頁面數(shù)據(jù)庫

    劉冬蘭,劉新,馬雷,任俊杰,楊鋒

    (1.國網(wǎng)山東省電力公司電力科學(xué)研究院,濟(jì)南250003;2.山東中實(shí)易通集團(tuán)有限公司,濟(jì)南250003)

    電力系統(tǒng)中數(shù)據(jù)集成技術(shù)關(guān)鍵問題研究

    劉冬蘭1,劉新1,馬雷1,任俊杰2,楊鋒2

    (1.國網(wǎng)山東省電力公司電力科學(xué)研究院,濟(jì)南250003;2.山東中實(shí)易通集團(tuán)有限公司,濟(jì)南250003)

    國家電網(wǎng)公司多年來建設(shè)了很多業(yè)務(wù)系統(tǒng),如辦公自動化(OA)系統(tǒng)、營銷系統(tǒng)、管理信息系統(tǒng)等。然而,電力企業(yè)信息化建設(shè)的深入以及業(yè)務(wù)系統(tǒng)中數(shù)據(jù)量的急劇增長給查找數(shù)據(jù)信息帶來極大不便和新的挑戰(zhàn)。為此,提出了一個(gè)面向電力領(lǐng)域的數(shù)據(jù)集成系統(tǒng)架構(gòu),并對其中的數(shù)據(jù)獲取、抽取、整合等關(guān)鍵技術(shù)問題進(jìn)行研究;提出了基于高頻率查詢詞采集率的數(shù)據(jù)獲取方法、自底向上方法構(gòu)建數(shù)據(jù)抽取包裝器的思想以及無監(jiān)督學(xué)習(xí)的自動化重復(fù)記錄檢測模式。針對電力系統(tǒng)各個(gè)信息孤島進(jìn)行數(shù)據(jù)集成,對各業(yè)務(wù)系統(tǒng)中非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行統(tǒng)一存儲和管理,方便用戶檢索出所需的數(shù)據(jù),為電力企業(yè)員工提供便捷服務(wù)。

    數(shù)據(jù)集成;數(shù)據(jù)抽??;包裝器;自底向上;非結(jié)構(gòu)化數(shù)據(jù)

    0 引言

    近年來,信息技術(shù)已經(jīng)滲透到各個(gè)領(lǐng)域,而且能采集、處理、存儲和顯示的信息量在不斷增長。在電力系統(tǒng)領(lǐng)域中數(shù)字化技術(shù)應(yīng)用廣泛,如數(shù)字化繼電保護(hù)系統(tǒng)和數(shù)字化控制系統(tǒng)。由于各類相互獨(dú)立的信息管理及監(jiān)控系統(tǒng)較多且規(guī)模龐大,使數(shù)據(jù)庫存儲的數(shù)據(jù)種類繁多,在電力系統(tǒng)中產(chǎn)生大量數(shù)據(jù)。面對電力系統(tǒng)中迅速膨脹的數(shù)據(jù)信息量,運(yùn)行人員和決策者不僅需要對本行業(yè)的數(shù)據(jù)庫了如指掌,還需要熟練地對大量數(shù)據(jù)進(jìn)行分析處理。由于各類信息系統(tǒng)中的數(shù)據(jù)具有大規(guī)模、異構(gòu)性、分布式等特點(diǎn),使數(shù)據(jù)的分析挖掘變得尤為困難[1]。

    通過數(shù)據(jù)集成與應(yīng)用集成技術(shù),建立能相互共享數(shù)據(jù)、有效協(xié)同工作的企業(yè)綜合管理信息平臺,利用各專業(yè)信息系統(tǒng)多年積累的數(shù)據(jù)將其轉(zhuǎn)換成能為企業(yè)創(chuàng)造價(jià)值的信息。針對電力系統(tǒng)龐大的數(shù)據(jù)信息進(jìn)行分析、加工、提煉以獲取用戶所需的數(shù)據(jù),把各個(gè)信息孤島相互匯集成為決策輔助信息系統(tǒng),構(gòu)建面向電力領(lǐng)域的數(shù)據(jù)集成系統(tǒng),將分布式非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行集中式存儲、管理并提供統(tǒng)一的查詢接口,使企業(yè)相關(guān)人員能夠高效、便捷地檢索出所需的數(shù)據(jù)[2]。因此,對電力領(lǐng)域數(shù)據(jù)集成系統(tǒng)平臺進(jìn)行研究可以為電力企業(yè)用戶提供決策支持,更好地保證信息系統(tǒng)的經(jīng)濟(jì)、安全穩(wěn)定運(yùn)行,具有重要意義。

    1 數(shù)據(jù)集成系統(tǒng)架構(gòu)

    電力系統(tǒng)中數(shù)據(jù)集成技術(shù)關(guān)鍵問題主要分為數(shù)據(jù)獲取、數(shù)據(jù)抽取、數(shù)據(jù)整合、數(shù)據(jù)分析等幾方面。技術(shù)關(guān)鍵在于如何解決電力系統(tǒng)領(lǐng)域數(shù)據(jù)模式的異構(gòu)問題,使操作人員不必受限于數(shù)據(jù)模型的異構(gòu)性、數(shù)據(jù)獲取、抽取和整合等問題[3]。為此,對各業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行系統(tǒng)集成,通過對眾多業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行分析,提出了面向電力領(lǐng)域的數(shù)據(jù)集成系統(tǒng)架構(gòu),如圖1所示。

    圖1 數(shù)據(jù)集成系統(tǒng)架構(gòu)

    數(shù)據(jù)集成主要包括數(shù)據(jù)獲取、抽取、整合及分析,其中涉及一個(gè)核心技術(shù)問題是領(lǐng)域模型管理,領(lǐng)域模型管理組件包含領(lǐng)域模型的定制和演化。領(lǐng)域模型定制是負(fù)責(zé)實(shí)體模式和實(shí)體之間的關(guān)系,領(lǐng)域模型演化負(fù)責(zé)檢測并及時(shí)更新實(shí)體之間的關(guān)系[4-5]。數(shù)據(jù)集成系統(tǒng)操作過程如下。

    1)數(shù)據(jù)獲取。數(shù)據(jù)獲取通過構(gòu)造爬蟲程序來實(shí)現(xiàn),爬蟲根據(jù)提交的查詢表單,發(fā)現(xiàn)并選擇優(yōu)質(zhì)的Web數(shù)據(jù)庫,通過對接口進(jìn)行理解分析,從網(wǎng)站上爬取出盡可能多的Web頁面存儲在本地?cái)?shù)據(jù)庫。

    2)數(shù)據(jù)抽取。數(shù)據(jù)抽取通過構(gòu)造包裝器來實(shí)現(xiàn),包裝器抽取對用戶感興趣的數(shù)據(jù)進(jìn)行準(zhǔn)確定位,把非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)抽取出來并轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲;對頁面中的數(shù)據(jù)進(jìn)行標(biāo)注和抽取,實(shí)現(xiàn)對同領(lǐng)域內(nèi)不同站點(diǎn)中Web數(shù)據(jù)的模式統(tǒng)一。

    3)數(shù)據(jù)整合。數(shù)據(jù)整合包括重復(fù)記錄檢測和數(shù)據(jù)融合,通過一些重復(fù)檢測技術(shù)對抽取到的Web數(shù)據(jù)進(jìn)行檢測,并對同一實(shí)體相同信息進(jìn)行合并,獲得結(jié)構(gòu)化數(shù)據(jù)。

    4)數(shù)據(jù)分析。數(shù)據(jù)分析采用適當(dāng)?shù)姆椒▽?shù)據(jù)整合中得到的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,對數(shù)據(jù)信息的功能進(jìn)行最大化開發(fā),充分發(fā)揮數(shù)據(jù)的作用,獲取有用信息并對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié),進(jìn)而采用一些圖表形式展現(xiàn)給用戶。

    2 基于高頻率查詢詞采集率的數(shù)據(jù)獲取

    數(shù)據(jù)集成的基礎(chǔ)問題是數(shù)據(jù)獲取。通常只有把網(wǎng)站上眾多的網(wǎng)頁數(shù)據(jù)爬取下來存儲在本地?cái)?shù)據(jù)庫,才能進(jìn)行后續(xù)的數(shù)據(jù)抽取、整合操作,為市場情報(bào)分析等應(yīng)用提供決策支持。目前,普通的網(wǎng)絡(luò)爬蟲軟件是單一的爬蟲程序,面對眾多的業(yè)務(wù)系統(tǒng)數(shù)據(jù)需要對各業(yè)務(wù)系統(tǒng)頁面的查詢接口進(jìn)行解析,提交合適的查詢詞,在短時(shí)間內(nèi)爬取大量網(wǎng)頁,提高數(shù)據(jù)獲取效率[6]。

    為達(dá)到較高的數(shù)據(jù)獲取效率,提出了基于高頻率查詢詞采集率模型的數(shù)據(jù)獲取方法。通過統(tǒng)計(jì)網(wǎng)頁中漢字出現(xiàn)頻率,獲取高頻率列表用于估算候選詞的新數(shù)據(jù)獲取率,同時(shí)對網(wǎng)站數(shù)據(jù)庫進(jìn)行采樣,得到某一文本屬性的采樣數(shù)據(jù)庫,采用多個(gè)特征自動構(gòu)造訓(xùn)練樣本,利用多元線性回歸方法不斷訓(xùn)練樣本,進(jìn)而構(gòu)造基于高頻率查詢詞采集率模型。在每一次獲取數(shù)據(jù)過程中使用此模型不斷迭代選擇查詢詞向該文本屬性進(jìn)行提交,實(shí)現(xiàn)對網(wǎng)站數(shù)據(jù)庫的爬取,該方法有較高的數(shù)據(jù)覆蓋率。

    基于高頻率查詢詞采集率模型的數(shù)據(jù)獲取過程主要包括查詢詞采新率模型構(gòu)建和網(wǎng)站數(shù)據(jù)庫獲取,如圖2所示。

    第一階段是基于高頻率查詢詞采新率模型的構(gòu)建。通過統(tǒng)計(jì)網(wǎng)站頁面中漢字出現(xiàn)頻率,獲取高頻率列表用于估算候選詞的新數(shù)據(jù)獲取率;使用一些常用的采樣方法對網(wǎng)站數(shù)據(jù)庫中待抽取數(shù)據(jù)的文本屬性進(jìn)行采樣,得到文本屬性的采樣數(shù)據(jù)庫,利用網(wǎng)頁結(jié)構(gòu)特征構(gòu)建訓(xùn)練集,使用線性回歸方法對樣本進(jìn)行訓(xùn)練,得到基于高頻率查詢詞采集率模型。

    圖2 基于高頻率查詢詞采集率模型的數(shù)據(jù)獲取過程

    第二階段是利用第一階段構(gòu)建的模型來獲取網(wǎng)站數(shù)據(jù)庫。從提交的查詢列表中選擇一個(gè)有效的新查詢詞重新提交,查詢提交后從所有的網(wǎng)站W(wǎng)eb數(shù)據(jù)庫中查詢數(shù)據(jù),返回結(jié)果頁面后抽取所需記錄存儲在本地?cái)?shù)據(jù)庫,將采集到的相應(yīng)網(wǎng)站頁面存儲到本地?cái)?shù)據(jù)庫,其中從結(jié)果頁面提取的數(shù)據(jù)已經(jīng)是待抽取數(shù)據(jù),屬于結(jié)構(gòu)化數(shù)據(jù);通過不斷迭代選擇新查詢詞提交,實(shí)現(xiàn)對網(wǎng)站數(shù)據(jù)庫的獲取,直至獲取數(shù)據(jù)盡可能多地覆蓋到整個(gè)網(wǎng)站。為了提高數(shù)據(jù)獲取效率,可將此過程采用Map/Reduce方式來并行操作,可以有效解決數(shù)據(jù)獲取過程中URL分配調(diào)度面臨的負(fù)載均衡問題。

    3 基于自底向上方法的數(shù)據(jù)抽取包裝器的構(gòu)建

    數(shù)據(jù)抽取包括頁面提取和語義標(biāo)注,該組件可以準(zhǔn)確提取目標(biāo)網(wǎng)頁中的目標(biāo)數(shù)據(jù),并對數(shù)據(jù)元素進(jìn)行語義理解,進(jìn)而準(zhǔn)確地識別數(shù)據(jù)元素和屬性標(biāo)簽的采樣頁面,提高對目標(biāo)數(shù)據(jù)的抽取準(zhǔn)確度。領(lǐng)域模型演化組件從更新的數(shù)據(jù)中檢測新的實(shí)體模式和新的關(guān)系,進(jìn)而及時(shí)更新領(lǐng)域模型。實(shí)體模式關(guān)系的動態(tài)更新可采用支持向量機(jī)(Support Vector Machine,SVM)方法[7],利用數(shù)據(jù)系統(tǒng)中存在的數(shù)據(jù)及目標(biāo)頁面的視覺信息有效地檢測和建立不同實(shí)體之間的關(guān)系。

    3.1 數(shù)據(jù)抽取包裝器健壯性評估方法

    數(shù)據(jù)抽取通過構(gòu)造包裝器來實(shí)現(xiàn),所謂包裝器是指使用一個(gè)程序把感興趣的數(shù)據(jù)從網(wǎng)站頁面提取出來,并轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)存儲和管理[8]。

    數(shù)據(jù)抽取的關(guān)鍵問題在于網(wǎng)站頁面中如何定位數(shù)據(jù)的準(zhǔn)確位置,自動化抽取中一般將網(wǎng)站頁面轉(zhuǎn)化成對應(yīng)的DOM樹,利用網(wǎng)站DOM樹的頁面和結(jié)構(gòu)特征,構(gòu)造XPath路徑表達(dá)式來定位數(shù)據(jù),這種XPath路徑表達(dá)式就稱之為包裝器[9]。例如,某省電力公司招聘網(wǎng)站上信息安全工程師崗位招聘頁面對應(yīng)的DOM樹如圖3所示。

    圖3 網(wǎng)站頁面對應(yīng)的DOM樹結(jié)構(gòu)

    構(gòu)造XPath路徑表達(dá)式可通過遍歷HTMLDOM樹得到,即W1=//html/body/div[2]/table/td[4]/text()就是所構(gòu)造的包裝器,由此包裝器能準(zhǔn)確抽取到工作地點(diǎn)是濟(jì)南。此包裝器是采用自頂向下方式構(gòu)建的,包含了頁面DOM樹中從根節(jié)點(diǎn)到待抽取節(jié)點(diǎn)的所有謂詞。但是此網(wǎng)站頁面中如果刪除第一個(gè)div,或者在第二個(gè)div下面添加了新的謂詞td或table,那么上述包裝器就失效了。

    例如,包裝器表達(dá)式W2=//div[@class=‘btname’]/*/td[4]/text(),顯然,包裝器W2性能優(yōu)于W1,因?yàn)楫?dāng)?shù)谝粋€(gè)div謂詞被刪除后,包裝器W2還能繼續(xù)抽取到正確的工作地點(diǎn)信息;包裝器表達(dá)式W3=//table[@width=‘95%’]/td[4]/text(),顯然,包裝器W3性能更優(yōu)于W2,因?yàn)楫?dāng)在第二個(gè)謂詞div下面添加了新的謂詞td或table后,包裝器W3能正確抽取到準(zhǔn)確的工作地點(diǎn)信息。從上述可以看出,數(shù)據(jù)抽取包裝器表達(dá)式XPath越少依賴于DOM樹結(jié)構(gòu),其包裝器的健壯性越好。

    包裝器健壯性是表示當(dāng)網(wǎng)頁隨著時(shí)間變化時(shí),包裝器將繼續(xù)保持抽取數(shù)據(jù)節(jié)點(diǎn)的能力,是測量包裝器在變化后的新版本網(wǎng)頁中抽取數(shù)據(jù)的能力。衡量數(shù)據(jù)抽取包裝器的健壯性,通常根據(jù)數(shù)據(jù)抽取的查準(zhǔn)率和查全率來判斷。查準(zhǔn)率表示抽取數(shù)據(jù)的準(zhǔn)確度,查全率表示獲取正確數(shù)據(jù)的覆蓋程度。

    3.2 數(shù)據(jù)抽取包裝器構(gòu)建方法

    為提高數(shù)據(jù)抽取包裝器的健壯性,根據(jù)自底向上的邏輯歸納設(shè)計(jì)思想,提出了一種自底向上方法構(gòu)建數(shù)據(jù)抽取包裝器。先選擇一些普通的特定XPath路徑表達(dá)式,在此基礎(chǔ)上提出一個(gè)規(guī)則,匹配和特化每個(gè)節(jié)點(diǎn)直到數(shù)據(jù)抽取包裝器表達(dá)式和需要抽取的目標(biāo)數(shù)據(jù)節(jié)點(diǎn)信息完全匹配,同時(shí)盡可能地使其生成的數(shù)據(jù)抽取包裝器查全率和查準(zhǔn)率都等于1,即使抽取數(shù)據(jù)的準(zhǔn)確率盡量達(dá)到完全準(zhǔn)確,并且使抽取的數(shù)據(jù)覆蓋到網(wǎng)站上所有的結(jié)果數(shù)據(jù)。

    假設(shè)D表示一系列有標(biāo)簽的XML文檔集合,包含了相應(yīng)的網(wǎng)頁中若干個(gè)感興趣的待抽取數(shù)據(jù)節(jié)點(diǎn)信息。對于任意一個(gè)待抽取節(jié)點(diǎn)d∈D,我們想要從有標(biāo)簽的文檔D中抽取目標(biāo)節(jié)點(diǎn),記為T(d)。對于任意給定的XPath路徑表達(dá)式x,我們想要生成一個(gè)XPath表達(dá)式x使其滿足如下規(guī)則。

    對于任意的d,使x(d)=T(d),即使用包裝器XPath表達(dá)式抽取的結(jié)果正好等于待抽取的目標(biāo)節(jié)點(diǎn)。根據(jù)信息檢索中的評估方法定義評估標(biāo)準(zhǔn)

    式中:P為查準(zhǔn)率,R為查全率。構(gòu)建健壯性的包裝器應(yīng)使其包裝器的查準(zhǔn)率和查全率都等于1。

    4 重復(fù)記錄檢測

    Web數(shù)據(jù)庫之間的同一實(shí)體存在重復(fù)記錄,即同一條信息可能存在于多個(gè)數(shù)據(jù)庫中。從網(wǎng)站上抽取的數(shù)據(jù)里有重復(fù)信息會造成數(shù)據(jù)冗余,冗余數(shù)據(jù)會增大所占空間導(dǎo)致數(shù)據(jù)查詢效率降低,對數(shù)據(jù)分析造成一定影響。從抽取的結(jié)果數(shù)據(jù)中識別出重復(fù)的數(shù)據(jù)記錄稱之為重復(fù)記錄檢測,而數(shù)據(jù)整合主要包括重復(fù)記錄檢測和數(shù)據(jù)融合。數(shù)據(jù)整合的過程是利用一些重復(fù)記錄檢測技術(shù)對抽取到的數(shù)據(jù)信息進(jìn)行檢測,并對同一實(shí)體相同信息進(jìn)行合并,提高數(shù)據(jù)的質(zhì)量,進(jìn)而提高數(shù)據(jù)檢索的速度。手工檢測重復(fù)記錄得到的數(shù)據(jù)準(zhǔn)確率高,但是工作量大并且靠人工檢測速度較慢。因此,研究自動化的重復(fù)記錄檢測技術(shù)變得尤為重要。

    重復(fù)記錄檢測的關(guān)鍵問題在于識別出兩條數(shù)據(jù)記錄是否完全重復(fù)或相似,即兩條數(shù)據(jù)記錄表達(dá)的信息是否相同或相近。目前識別重復(fù)記錄的算法主要有編輯距離匹配、字段匹配、聚類等[10-11]。為此,提出一種無監(jiān)督學(xué)習(xí)的自動化重復(fù)記錄檢測方法,通過采用聚類分析方法自動選擇初始訓(xùn)練集,采用SVM的分類迭代方式,構(gòu)建數(shù)據(jù)記錄分類模型,達(dá)到重復(fù)記錄識別及檢測分類合并的目的。

    無監(jiān)督學(xué)習(xí)的自動化重復(fù)記錄檢測過程如下。

    1)分塊/索引。兩個(gè)數(shù)據(jù)庫D1和D2之間的記錄對是D1和D2大小的乘積,為提高重復(fù)記錄檢測效率,可使用分塊或者索引技術(shù)先分類,將不可能重復(fù)的記錄對進(jìn)行過濾。

    2)獲取比較向量。分析實(shí)體屬性類型,選擇相似度計(jì)算方法,對分塊索引后的記錄對計(jì)算記錄對中相同屬性值的相似度,進(jìn)一步獲取比較向量。

    3)獲取訓(xùn)練樣本。自動化的重復(fù)記錄檢測通常選擇聚類算法訓(xùn)練樣本集,為提高樣本集質(zhì)量,采用聚類集成方法結(jié)合多個(gè)聚類結(jié)果,獲取其一致結(jié)果作為訓(xùn)練樣本集。

    4)比較向量分類。采用已獲取的訓(xùn)練樣本集訓(xùn)練一個(gè)SVM分類器,用該分類器對剩余未分類的比較向量進(jìn)行分類。分類包括匹配對和不匹配對,并對分類結(jié)果按照可信度排序,選擇可信度大的比較向量更新訓(xùn)練樣本,重新訓(xùn)練SVM分類器,不斷迭代執(zhí)行,直到滿足某一條件結(jié)束。分類得到的匹配對比較向量集對應(yīng)的記錄就是重復(fù)記錄檢測的結(jié)果。

    無監(jiān)督學(xué)習(xí)的自動化重復(fù)記錄檢測采用聚類集成方法,結(jié)合多個(gè)聚類結(jié)果自動選擇初始訓(xùn)練集,提高了樣本集的準(zhǔn)確度,采用SVM迭代分類方法構(gòu)建數(shù)據(jù)記錄分類模型,提高了數(shù)據(jù)記錄的分類準(zhǔn)確度,進(jìn)一步提高數(shù)據(jù)融合性能。

    5 結(jié)語

    針對電力領(lǐng)域眾多的業(yè)務(wù)系統(tǒng)數(shù)據(jù),為便于企業(yè)用戶快捷地檢索信息,對電力領(lǐng)域中各業(yè)務(wù)系統(tǒng)架構(gòu)等進(jìn)行了初步調(diào)查研究,研究基于高頻率查詢詞采集率的數(shù)據(jù)獲取方法、采用自底向上方法構(gòu)建數(shù)據(jù)抽取包裝器思想以及無監(jiān)督學(xué)習(xí)的自動化重復(fù)記錄檢測模式,并設(shè)計(jì)了電力系統(tǒng)數(shù)據(jù)集成系統(tǒng)架構(gòu)。針對電力系統(tǒng)領(lǐng)域龐大的數(shù)據(jù)信息進(jìn)行分析加工,進(jìn)一步提煉用戶所需的數(shù)據(jù),對各個(gè)信息孤島進(jìn)行數(shù)據(jù)集成,對各業(yè)務(wù)系統(tǒng)中非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行統(tǒng)一存儲和管理,并且提供統(tǒng)一的查詢接口,方便企業(yè)用戶快速檢索出所需數(shù)據(jù)。

    [1]董永權(quán).Deep Web數(shù)據(jù)集成關(guān)鍵問題研究[D].濟(jì)南:山東大學(xué),2010.

    [2]羅學(xué)禮,徐樹振,王森,等.電力企業(yè)的非結(jié)構(gòu)化數(shù)據(jù)檢索研究[J].計(jì)算機(jī)與數(shù)字工程,2014,42(4):729-733.

    [3]馬玉梅.電力系統(tǒng)中數(shù)據(jù)集成技術(shù)的研究與應(yīng)用[D].保定:華北電力大學(xué),2006.

    [4]DONG Yongquan,LI Qingzhong.A Robust Approach of Automat ic Web Data Record Extraction[J].Journal of Computational Information Systems,2009,6(6):1 757-1 766.

    [5]XU Xiuxing,LI Qingzhong,DONG Yongquan et al.Dynamically Constructing a Global Schema for Web Entities.Web Information Systems&Applications Conference[C].Huhhot:IEEE,2010.

    [6]劉偉.Deep Web數(shù)據(jù)集成中的關(guān)鍵技術(shù)研究[D].北京:中國人民大學(xué),2008.

    [7]閆中敏,李慶忠,彭朝暉,等.DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2010,47(S1):479-483.

    [8]RAHUL Gupta,SUNITA Sarawagi.Domain Adaptation of Information Extraction Models[J].SIGMOD Record,2008,37(4):35-40.

    [9]NILESH Dalvi,RAVI Kumar,MOHAMED Soliman.Automatic Wrappers for Large Scale Web Extraction[J].In VLDB,2011,4(4):219-230.

    [10]葉煥倬,吳迪.相似重復(fù)記錄清理方法研究綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(9):56-66.

    [11]邱越峰,田增平,季文赟,等.一種高效的檢測相似重復(fù)記錄的方法[J].計(jì)算機(jī)學(xué)報(bào),2001,24(1):69-77.

    Key Problems of Data Integration Technology in Electric Power System

    LIU Donglan1,LIU Xin1,MA Lei1,REN Junjie2,YANG Feng2
    (1.State Grid Shandong Electric Power Research Institute,Jinan 250003,China;2.Shandong Zhongshi Yitong Group Co.,Ltd.,Jinan 250003,China)

    The State Grid has built amounts of business systems for many years,such as OA system,marketing system and management information system.However,with the deepening of power enterprise informatization construction and the sharp increase of data in business systems,it brings new challenges and inconvenience for data seekers.An architecture model of data integration in the power field is proposed,and key problems in this model such as data acquiring,extracting and integrating are investigated.A new date acquirement method based on high frequency words collecting rate is put forward,a concept to build data extraction wrapper through bottom-up approach and an automating repetitive record detection model for unsupervised learning are also proposed.Aiming at the information isolated island in the electric power system the data is integrated,and the unified storage and management of unstructured data in business systems are conducted,which can help users to obtain required data and to provide convenient services for staffs in the power enterprise.

    data integration;data extraction;wrapper;bottom-up;unstructured data

    TP311

    A

    1007-9904(2016)11-0023-05

    2016-05-26

    劉冬蘭(1987),女,工程師,從事電力系統(tǒng)信息安全技術(shù)督查工作。

    猜你喜歡
    高頻率頁面數(shù)據(jù)庫
    大狗熊在睡覺
    刷新生活的頁面
    計(jì)算機(jī)與信息技術(shù)發(fā)展趨勢芻探
    成才之路(2018年12期)2018-05-26 10:08:48
    仨月胸透四次,“共享體檢”卡在哪
    數(shù)據(jù)庫
    數(shù)據(jù)庫
    怎樣有效地記背英語
    數(shù)據(jù)庫
    數(shù)據(jù)庫
    高頻率使用芐嘧磺隆對固氮魚腥藻細(xì)胞生長和抗氧化系統(tǒng)的影響
    免费大片黄手机在线观看| 日本爱情动作片www.在线观看| 激情五月婷婷亚洲| 欧美 日韩 精品 国产| 久久久久久九九精品二区国产| 蜜桃亚洲精品一区二区三区| 日韩伦理黄色片| 免费看不卡的av| 青春草国产在线视频| 国产精品成人在线| 欧美变态另类bdsm刘玥| 男人爽女人下面视频在线观看| 国产亚洲5aaaaa淫片| 精品一区二区三卡| 18禁在线无遮挡免费观看视频| 亚洲成人久久爱视频| 直男gayav资源| 久久亚洲国产成人精品v| 你懂的网址亚洲精品在线观看| 亚洲天堂av无毛| 久久精品综合一区二区三区| 国产老妇伦熟女老妇高清| 亚洲久久久久久中文字幕| 欧美老熟妇乱子伦牲交| 久久久久久九九精品二区国产| 国产成人91sexporn| 国产综合精华液| 简卡轻食公司| 日韩视频在线欧美| 日本黄大片高清| 久久久久精品久久久久真实原创| 国精品久久久久久国模美| 黄色视频在线播放观看不卡| 黄色欧美视频在线观看| 三级国产精品欧美在线观看| 在线观看三级黄色| 婷婷色综合www| 亚洲国产成人一精品久久久| 看免费成人av毛片| 亚洲精品成人久久久久久| 亚洲最大成人av| 国产亚洲精品久久久com| 欧美极品一区二区三区四区| 欧美老熟妇乱子伦牲交| 自拍偷自拍亚洲精品老妇| 丰满人妻一区二区三区视频av| 国产高清有码在线观看视频| 18禁动态无遮挡网站| 少妇的逼水好多| 日本免费在线观看一区| 一本色道久久久久久精品综合| 69av精品久久久久久| 久久人人爽人人片av| 一级毛片aaaaaa免费看小| 熟女电影av网| 高清日韩中文字幕在线| 一本久久精品| av在线老鸭窝| 1000部很黄的大片| 午夜激情久久久久久久| 好男人在线观看高清免费视频| 别揉我奶头 嗯啊视频| 久久久久久久久久成人| 国产亚洲5aaaaa淫片| 国产一区二区亚洲精品在线观看| 亚洲人与动物交配视频| 精品久久久久久久人妻蜜臀av| 天堂中文最新版在线下载 | 亚洲最大成人av| 在线免费十八禁| 真实男女啪啪啪动态图| 日本免费在线观看一区| 1000部很黄的大片| 欧美成人精品欧美一级黄| 一区二区三区乱码不卡18| 自拍偷自拍亚洲精品老妇| 2021少妇久久久久久久久久久| 亚洲精品视频女| 成人综合一区亚洲| 亚洲av免费高清在线观看| 少妇猛男粗大的猛烈进出视频 | 久久精品久久久久久久性| 国产成人a∨麻豆精品| 日韩伦理黄色片| 超碰av人人做人人爽久久| 最近的中文字幕免费完整| 一级爰片在线观看| 国产高潮美女av| 国产精品人妻久久久影院| 国产免费一区二区三区四区乱码| 老女人水多毛片| 国产精品一区二区在线观看99| 在线看a的网站| 97超视频在线观看视频| 亚洲美女搞黄在线观看| 亚洲,一卡二卡三卡| 又大又黄又爽视频免费| 人人妻人人澡人人爽人人夜夜| 日日啪夜夜爽| 麻豆成人午夜福利视频| 国产视频首页在线观看| av国产免费在线观看| 少妇高潮的动态图| 男女那种视频在线观看| 女的被弄到高潮叫床怎么办| 亚洲性久久影院| 国产精品成人在线| 国产成人免费无遮挡视频| 中文字幕制服av| 亚洲国产日韩一区二区| 国产精品av视频在线免费观看| 91在线精品国自产拍蜜月| 免费看av在线观看网站| 白带黄色成豆腐渣| 一本色道久久久久久精品综合| 日韩免费高清中文字幕av| 国产在线一区二区三区精| 白带黄色成豆腐渣| 亚洲精品色激情综合| 国产精品嫩草影院av在线观看| 丝袜喷水一区| 国产永久视频网站| 国产高清国产精品国产三级 | 欧美一级a爱片免费观看看| 国产午夜福利久久久久久| 大码成人一级视频| 99热全是精品| 国产精品一区二区三区四区免费观看| 亚洲av.av天堂| 午夜老司机福利剧场| 丝瓜视频免费看黄片| 黄色日韩在线| 一级片'在线观看视频| 亚洲欧美一区二区三区国产| 女人久久www免费人成看片| 免费不卡的大黄色大毛片视频在线观看| 在现免费观看毛片| 国产伦在线观看视频一区| 国内揄拍国产精品人妻在线| 亚洲成人久久爱视频| 亚洲性久久影院| 在线观看一区二区三区| 日韩亚洲欧美综合| 不卡视频在线观看欧美| 国产精品人妻久久久影院| 狂野欧美白嫩少妇大欣赏| 亚洲无线观看免费| 亚洲av免费在线观看| 简卡轻食公司| 国产白丝娇喘喷水9色精品| 日日撸夜夜添| 三级国产精品片| 女人久久www免费人成看片| 97超视频在线观看视频| 99热全是精品| 熟女电影av网| 校园人妻丝袜中文字幕| 精品久久久噜噜| 免费高清在线观看视频在线观看| 69av精品久久久久久| 国产色爽女视频免费观看| 中文字幕av成人在线电影| 亚洲精品久久午夜乱码| 精品视频人人做人人爽| 一区二区av电影网| 99热这里只有是精品在线观看| 特级一级黄色大片| 日本与韩国留学比较| 中国美白少妇内射xxxbb| 伦理电影大哥的女人| 国产午夜福利久久久久久| 又大又黄又爽视频免费| av在线app专区| 久久亚洲国产成人精品v| 国产免费福利视频在线观看| 精品国产三级普通话版| 精品一区在线观看国产| 男插女下体视频免费在线播放| 久久久久久久国产电影| 尾随美女入室| 日本黄大片高清| 国产伦精品一区二区三区视频9| 国产精品爽爽va在线观看网站| 日日摸夜夜添夜夜爱| 欧美xxxx性猛交bbbb| av在线老鸭窝| 国产成人freesex在线| 天堂中文最新版在线下载 | 直男gayav资源| 美女被艹到高潮喷水动态| 人妻一区二区av| 永久网站在线| 久久99热这里只有精品18| 欧美一区二区亚洲| 身体一侧抽搐| 亚洲av欧美aⅴ国产| 汤姆久久久久久久影院中文字幕| 亚洲欧美日韩卡通动漫| 欧美潮喷喷水| 精品一区二区免费观看| 麻豆乱淫一区二区| 欧美三级亚洲精品| 噜噜噜噜噜久久久久久91| 亚洲国产成人一精品久久久| 亚洲精品日韩在线中文字幕| 在现免费观看毛片| 91狼人影院| 美女国产视频在线观看| 美女视频免费永久观看网站| 男女边摸边吃奶| 六月丁香七月| 亚洲在久久综合| 丰满人妻一区二区三区视频av| 国产视频内射| 国产午夜福利久久久久久| 成人漫画全彩无遮挡| 国产精品蜜桃在线观看| 亚洲av国产av综合av卡| 亚洲精品影视一区二区三区av| 国产淫语在线视频| 美女国产视频在线观看| 国产精品一二三区在线看| 全区人妻精品视频| 国精品久久久久久国模美| 日韩一区二区视频免费看| 亚洲天堂av无毛| 五月天丁香电影| 亚洲人成网站在线观看播放| 交换朋友夫妻互换小说| 精品人妻偷拍中文字幕| 欧美bdsm另类| 观看美女的网站| 欧美极品一区二区三区四区| 看免费成人av毛片| 午夜福利在线在线| 欧美另类一区| 亚洲不卡免费看| 中文字幕av成人在线电影| 亚洲精品影视一区二区三区av| 国产精品国产av在线观看| 搡女人真爽免费视频火全软件| 国产 精品1| 成年版毛片免费区| 美女xxoo啪啪120秒动态图| 观看免费一级毛片| 少妇丰满av| 亚洲欧美一区二区三区国产| 欧美xxⅹ黑人| 一个人观看的视频www高清免费观看| 99久久精品一区二区三区| 久久精品久久久久久噜噜老黄| 精品人妻熟女av久视频| 插逼视频在线观看| 久久97久久精品| 精品久久久久久久人妻蜜臀av| 亚洲怡红院男人天堂| 99热全是精品| 午夜福利在线观看免费完整高清在| 黄色怎么调成土黄色| 欧美97在线视频| 99热国产这里只有精品6| 97精品久久久久久久久久精品| 美女脱内裤让男人舔精品视频| 在线观看美女被高潮喷水网站| 国产日韩欧美在线精品| 菩萨蛮人人尽说江南好唐韦庄| 热re99久久精品国产66热6| 国产免费一级a男人的天堂| 一区二区三区四区激情视频| 亚洲性久久影院| 亚洲内射少妇av| 97在线人人人人妻| 欧美bdsm另类| 蜜桃亚洲精品一区二区三区| freevideosex欧美| 精品人妻熟女av久视频| 色网站视频免费| 在线观看国产h片| 亚洲在线观看片| 久久久久精品久久久久真实原创| 国产一级毛片在线| 亚洲av中文av极速乱| 最近手机中文字幕大全| 国产精品一区二区在线观看99| 深爱激情五月婷婷| 久热这里只有精品99| 七月丁香在线播放| 国产在线一区二区三区精| 亚洲熟女精品中文字幕| 99热全是精品| 国产永久视频网站| 好男人在线观看高清免费视频| 亚洲成人av在线免费| 听说在线观看完整版免费高清| 国产日韩欧美在线精品| 97超视频在线观看视频| 中文在线观看免费www的网站| 3wmmmm亚洲av在线观看| 国产精品伦人一区二区| 神马国产精品三级电影在线观看| 最近2019中文字幕mv第一页| 在线观看av片永久免费下载| 男人和女人高潮做爰伦理| 一个人看的www免费观看视频| 国产综合精华液| 18+在线观看网站| 午夜激情久久久久久久| 亚洲在线观看片| 99久久精品热视频| 熟妇人妻不卡中文字幕| 日本午夜av视频| 午夜激情福利司机影院| 91午夜精品亚洲一区二区三区| 免费观看的影片在线观看| 久久女婷五月综合色啪小说 | 黄色欧美视频在线观看| 亚洲自偷自拍三级| 国产一区有黄有色的免费视频| 26uuu在线亚洲综合色| 麻豆精品久久久久久蜜桃| 亚洲精品aⅴ在线观看| 日韩欧美精品免费久久| 人人妻人人澡人人爽人人夜夜| 综合色丁香网| 中文资源天堂在线| 97在线视频观看| 中文字幕久久专区| 中文精品一卡2卡3卡4更新| 国产在线一区二区三区精| 少妇人妻一区二区三区视频| 99热全是精品| 亚洲精品日韩在线中文字幕| 99热全是精品| 午夜福利网站1000一区二区三区| 国产在视频线精品| 精品国产露脸久久av麻豆| 色播亚洲综合网| 日本熟妇午夜| 听说在线观看完整版免费高清| 成年女人在线观看亚洲视频 | 91狼人影院| 激情五月婷婷亚洲| 亚洲精华国产精华液的使用体验| 亚洲av电影在线观看一区二区三区 | 搞女人的毛片| 亚洲最大成人av| 久久精品熟女亚洲av麻豆精品| 日韩三级伦理在线观看| 天堂网av新在线| 日韩大片免费观看网站| 亚洲av成人精品一区久久| 精品久久久久久电影网| 亚洲天堂国产精品一区在线| 各种免费的搞黄视频| 亚洲不卡免费看| 久久久久精品久久久久真实原创| 中文字幕免费在线视频6| 只有这里有精品99| 国产精品一二三区在线看| 亚洲av国产av综合av卡| 啦啦啦啦在线视频资源| 精品人妻视频免费看| 国产真实伦视频高清在线观看| 国产精品久久久久久精品电影小说 | 边亲边吃奶的免费视频| 色婷婷久久久亚洲欧美| 在线看a的网站| 国产精品熟女久久久久浪| 黄色日韩在线| 男插女下体视频免费在线播放| av福利片在线观看| 18禁裸乳无遮挡免费网站照片| 波野结衣二区三区在线| 亚洲国产最新在线播放| 插逼视频在线观看| 亚洲最大成人手机在线| 亚洲av日韩在线播放| 日韩亚洲欧美综合| 永久免费av网站大全| 午夜福利视频精品| 欧美最新免费一区二区三区| 一级毛片我不卡| 国产精品.久久久| 亚洲,一卡二卡三卡| 亚洲最大成人中文| 嫩草影院入口| 人体艺术视频欧美日本| 国模一区二区三区四区视频| 国产老妇女一区| 插阴视频在线观看视频| 国产高清不卡午夜福利| 国产免费一区二区三区四区乱码| h日本视频在线播放| 国产成人a∨麻豆精品| 色综合色国产| 亚洲婷婷狠狠爱综合网| 国产有黄有色有爽视频| 国产亚洲av嫩草精品影院| 夜夜看夜夜爽夜夜摸| 国产在视频线精品| 免费观看av网站的网址| 麻豆成人午夜福利视频| 国产黄色免费在线视频| 超碰97精品在线观看| 免费高清在线观看视频在线观看| 麻豆精品久久久久久蜜桃| 蜜臀久久99精品久久宅男| 麻豆精品久久久久久蜜桃| 国产极品天堂在线| 天堂俺去俺来也www色官网| 午夜福利在线在线| 日本黄色片子视频| 日韩精品有码人妻一区| 极品少妇高潮喷水抽搐| 日韩三级伦理在线观看| 赤兔流量卡办理| 国产亚洲最大av| 人妻一区二区av| 国产精品精品国产色婷婷| 国产毛片在线视频| 亚洲国产精品成人综合色| 女人久久www免费人成看片| 亚洲婷婷狠狠爱综合网| 日本黄大片高清| 亚洲国产色片| 国产黄色免费在线视频| 香蕉精品网在线| 男女下面进入的视频免费午夜| 亚洲美女搞黄在线观看| 各种免费的搞黄视频| 亚洲三级黄色毛片| 国产亚洲91精品色在线| videos熟女内射| 美女主播在线视频| 国产av国产精品国产| 最近最新中文字幕大全电影3| 大陆偷拍与自拍| 日韩强制内射视频| 久久久久国产精品人妻一区二区| 成人综合一区亚洲| 亚洲欧美日韩无卡精品| 久久久久网色| 亚洲最大成人中文| 亚洲欧洲日产国产| 亚洲av在线观看美女高潮| 久久热精品热| av卡一久久| 精品久久久久久久人妻蜜臀av| 国产成人免费观看mmmm| 亚洲成人一二三区av| 纵有疾风起免费观看全集完整版| av卡一久久| 熟女av电影| 日韩精品有码人妻一区| 少妇熟女欧美另类| 精品熟女少妇av免费看| 一个人观看的视频www高清免费观看| 亚洲欧美日韩东京热| 欧美成人a在线观看| 99视频精品全部免费 在线| 久久国内精品自在自线图片| 国产永久视频网站| 一级av片app| 国产伦精品一区二区三区视频9| 久久久久久久亚洲中文字幕| 欧美少妇被猛烈插入视频| 久久精品国产亚洲av涩爱| 少妇丰满av| 九九爱精品视频在线观看| 99久久中文字幕三级久久日本| 国产欧美日韩精品一区二区| 天美传媒精品一区二区| 99视频精品全部免费 在线| 国产精品一区www在线观看| 亚洲精品久久久久久婷婷小说| 一级av片app| 久久久成人免费电影| 涩涩av久久男人的天堂| 精品一区在线观看国产| 99久久九九国产精品国产免费| 国产免费视频播放在线视频| 亚洲在久久综合| 精品久久国产蜜桃| 久久精品国产a三级三级三级| 亚洲自拍偷在线| 午夜激情福利司机影院| 99精国产麻豆久久婷婷| 国产黄片视频在线免费观看| 亚洲丝袜综合中文字幕| 国产欧美另类精品又又久久亚洲欧美| 久久久久久久久久久丰满| 国内揄拍国产精品人妻在线| 亚洲精品456在线播放app| 2021天堂中文幕一二区在线观| 欧美xxxx性猛交bbbb| 午夜福利高清视频| av女优亚洲男人天堂| 亚洲av日韩在线播放| 免费观看的影片在线观看| 日本免费在线观看一区| 最后的刺客免费高清国语| 亚洲成人av在线免费| 久久午夜福利片| 白带黄色成豆腐渣| 欧美激情在线99| 久久精品国产亚洲av涩爱| 日韩成人av中文字幕在线观看| 熟女av电影| 中国国产av一级| 国产精品国产av在线观看| 久久久精品94久久精品| 小蜜桃在线观看免费完整版高清| 国产精品爽爽va在线观看网站| 精品酒店卫生间| 好男人在线观看高清免费视频| 亚洲欧美精品专区久久| 国产 一区 欧美 日韩| 噜噜噜噜噜久久久久久91| 国产白丝娇喘喷水9色精品| 亚洲国产色片| 国产一区二区在线观看日韩| 男女无遮挡免费网站观看| 免费大片18禁| 午夜福利在线观看免费完整高清在| 国产乱来视频区| 少妇人妻久久综合中文| 国产精品人妻久久久久久| 好男人视频免费观看在线| 日韩av不卡免费在线播放| 亚洲人成网站在线播| 日韩av免费高清视频| 伦精品一区二区三区| 婷婷色综合www| 亚洲精品,欧美精品| 91精品国产九色| 亚洲国产欧美在线一区| 色5月婷婷丁香| 日韩免费高清中文字幕av| 国产亚洲5aaaaa淫片| 国产日韩欧美亚洲二区| 一级二级三级毛片免费看| 美女脱内裤让男人舔精品视频| 久久精品国产亚洲网站| 一级毛片 在线播放| 日韩成人伦理影院| 最后的刺客免费高清国语| 2022亚洲国产成人精品| videos熟女内射| 一级毛片久久久久久久久女| 日本免费在线观看一区| 免费看av在线观看网站| 亚洲精品色激情综合| 国产成人freesex在线| 老司机影院成人| 欧美日韩精品成人综合77777| 欧美潮喷喷水| 国产精品久久久久久av不卡| 亚洲av中文av极速乱| 又爽又黄a免费视频| 国产男女内射视频| 精品酒店卫生间| 亚洲人与动物交配视频| 免费av毛片视频| av在线亚洲专区| 18禁裸乳无遮挡免费网站照片| 一区二区三区精品91| 男女那种视频在线观看| av在线播放精品| 欧美精品一区二区大全| 国产久久久一区二区三区| 综合色av麻豆| 插逼视频在线观看| 国产精品久久久久久精品古装| 国产一区亚洲一区在线观看| 日本熟妇午夜| 狂野欧美激情性bbbbbb| 草草在线视频免费看| 精品久久久久久久人妻蜜臀av| 欧美日韩国产mv在线观看视频 | 舔av片在线| 精品熟女少妇av免费看| 久久久久久久大尺度免费视频| 2018国产大陆天天弄谢| 国产成人精品福利久久| 亚洲精品成人av观看孕妇| 日韩大片免费观看网站| 日本熟妇午夜| 51国产日韩欧美| 国产伦精品一区二区三区视频9| 熟女av电影| 国产老妇伦熟女老妇高清| 少妇被粗大猛烈的视频| 欧美高清成人免费视频www| 久久午夜福利片| 亚洲欧美日韩无卡精品| 亚洲av成人精品一区久久| 色播亚洲综合网| 免费看a级黄色片| 亚洲三级黄色毛片| 亚洲婷婷狠狠爱综合网| 亚洲成人精品中文字幕电影| 国产淫语在线视频| 欧美日韩国产mv在线观看视频 | 国产av国产精品国产| 男人舔奶头视频| 亚洲在线观看片| av在线天堂中文字幕| 国产高清不卡午夜福利| 国产 精品1| 国产毛片a区久久久久| xxx大片免费视频| 国语对白做爰xxxⅹ性视频网站| av在线观看视频网站免费| 老师上课跳d突然被开到最大视频| 成人特级av手机在线观看|