吳海江,唐鶴,駱國銘
(廣東電網(wǎng)公司佛山供電局,廣東佛山 528000)
隨著近年來電力企業(yè)發(fā)展進(jìn)程的不斷加快,信息化發(fā)展態(tài)勢愈來愈快,數(shù)據(jù)成為各專業(yè)應(yīng)用的重要核心。我國電力行業(yè)歷經(jīng)長時(shí)間的持續(xù)化信息發(fā)展,目前已經(jīng)逐漸發(fā)展成為大量專業(yè)信息系統(tǒng),譬如OA、電力交易運(yùn)營、電力營銷、電力調(diào)度、配電管理、生產(chǎn)管理、項(xiàng)目管理等系統(tǒng)。分別由不同廠家負(fù)責(zé)生產(chǎn),不同系統(tǒng)之間互相獨(dú)立,所以極易產(chǎn)生“信息孤島”,導(dǎo)致無法真正高效實(shí)現(xiàn)數(shù)據(jù)共享。隨著我國電力機(jī)制改革進(jìn)程的逐步深入,電力企業(yè)的信息化建設(shè)也獲得了飛速發(fā)展,電力企業(yè)領(lǐng)導(dǎo)層逐漸提高對自身管理決策綜合水平的要求,對于各信息數(shù)據(jù)需求也要求更加充分、準(zhǔn)確且及時(shí),能夠?qū)崟r(shí)統(tǒng)一地完成信息的傳遞共享,因此建立能夠滿足傳遞共享的綜合調(diào)度管理數(shù)據(jù)平臺(tái),已經(jīng)逐漸發(fā)展成為如今電力行業(yè)信息化發(fā)展的主要方向。近年來,網(wǎng)絡(luò)搜索引擎技術(shù)也取得了極大進(jìn)展,譬如Google、百度等搜索引擎,能夠滿足短時(shí)間內(nèi)數(shù)據(jù)信息的快速獲取,更受到各大行業(yè)領(lǐng)域的普遍認(rèn)可。但往往該類搜索引擎,并不能滿足搜尋企業(yè)內(nèi)部信息需求,更無法實(shí)現(xiàn)搜尋用戶信息實(shí)現(xiàn)統(tǒng)一共享調(diào)度。因此,檢索成為如今電力行業(yè)信息資源共享的核心技術(shù)點(diǎn),文中提出的基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺(tái),能夠解決以上信息資源調(diào)度共享的問題。
搜索引擎主要包括了以下程序設(shè)備:信息收集程序,分析、索引和檢索設(shè)備,以及查詢接口。搜索引擎的結(jié)構(gòu)原理如圖1 所示。
圖1 搜索引擎結(jié)構(gòu)原理示意圖
1)在信息收集程序中。該結(jié)構(gòu)主要實(shí)現(xiàn)網(wǎng)絡(luò)所覆蓋所有公開領(lǐng)域內(nèi),信息站點(diǎn)記錄具體網(wǎng)址,并將站點(diǎn)的鏈接指針成功找出后,尋找新型信息空間,然后將創(chuàng)建形成的新信息空間文檔順利取出。
2)分析器。該結(jié)構(gòu)針對信息收集程序中所成功收集的文檔信息,通過運(yùn)用分詞、過濾、轉(zhuǎn)換等不同操作方法進(jìn)行索引。
3)索引器。索引文檔作為一種新型的檢索方式,成功存儲(chǔ)于建立的索引數(shù)據(jù)庫內(nèi),具體索引操作可以依照倒排文件這一存放格式。
4)檢索器。該結(jié)構(gòu)根據(jù)索引數(shù)據(jù)庫,成功找出密切相關(guān)用戶查詢需求的文檔,并根據(jù)設(shè)定的相關(guān)度遞減這一排列順序,將相關(guān)度較閾值明顯偏大的文檔成功排列并最終返回至用戶。
5)查詢接口。該結(jié)構(gòu)是為了能夠方便提供用戶信息查詢輸入及輸出的結(jié)果界面。
異構(gòu)數(shù)據(jù)集成實(shí)現(xiàn)了用戶信息數(shù)據(jù)調(diào)度集成,是一種能夠有效維護(hù)數(shù)據(jù)源一致性,真正提升并實(shí)現(xiàn)數(shù)據(jù)信息共享效率的技術(shù),能夠?yàn)殡娏π袠I(yè)供電信息資源多用戶提供統(tǒng)一集成的數(shù)據(jù)訪問源及接口,并且執(zhí)行相應(yīng)的用戶對數(shù)據(jù)源提出的訪問請求。圖2 為異構(gòu)用戶數(shù)據(jù)集成系統(tǒng)模型。
圖2 異構(gòu)數(shù)據(jù)集成系統(tǒng)模型示意圖
一是采用虛擬視圖法,基于該方法建立的數(shù)據(jù)集成系統(tǒng),可以在用戶經(jīng)系統(tǒng)提出查詢請求時(shí),系統(tǒng)能夠自主根據(jù)用戶的數(shù)據(jù)源執(zhí)行操作,該方法也被稱為Lazy 方法。
二是聯(lián)邦數(shù)據(jù)庫系統(tǒng),主要包括了緊耦合FDBS、松耦合FDBS 共兩類(見圖3)作為聯(lián)邦數(shù)據(jù)庫體系結(jié)構(gòu)。前者擁有一個(gè)或多個(gè)統(tǒng)一模式,能夠經(jīng)模式集成技術(shù)實(shí)現(xiàn)半自動(dòng)生成,還可以經(jīng)用戶實(shí)現(xiàn)手工構(gòu)造。只需將邏輯異構(gòu)關(guān)系妥善解決,便可以實(shí)現(xiàn)同領(lǐng)域?qū)<覜Q定數(shù)據(jù)庫模式對應(yīng)關(guān)系,但是緊耦合也存在靜態(tài)升級困難這一問題。后者并未形成統(tǒng)一模式,但是提供了部分?jǐn)?shù)據(jù)庫統(tǒng)一查詢語言,F(xiàn)DBS 數(shù)據(jù)庫內(nèi)相關(guān)數(shù)據(jù)的自洽性,能夠?qū)φZ義異構(gòu)妥善解決,但是這種耦合并不具備全局模式。
圖3 聯(lián)邦數(shù)據(jù)庫體系結(jié)構(gòu)
三是中介系統(tǒng),能夠提供全部的異構(gòu)數(shù)據(jù)源虛擬化視圖實(shí)現(xiàn)用戶數(shù)據(jù)集成。在這里所指的數(shù)據(jù)源包括了數(shù)據(jù)庫、遺產(chǎn)系統(tǒng)、Web 數(shù)據(jù)庫等各類模式。能夠建立數(shù)據(jù)源與全局模式之間的銜接橋梁,并且滿足用戶的透明化異構(gòu)操作,無需全部得知數(shù)據(jù)源所在的模式、位置和所要采用的訪問方式。Mrdiated系統(tǒng)典型結(jié)構(gòu)示意圖如圖4 所示。
圖4 Mrdiated系統(tǒng)典型結(jié)構(gòu)示意圖
電力調(diào)度專業(yè)搜索供電信息資源用戶調(diào)度管理平臺(tái)的建立,需要基于搜索引擎這項(xiàng)技術(shù)來實(shí)現(xiàn),建立知識(shí)庫也與搜索引擎存在依賴關(guān)系。除此之外,還能夠提供用戶平時(shí)高頻次訪問的相應(yīng)站點(diǎn)的異構(gòu)數(shù)據(jù)集成,建立圖5 所示的系統(tǒng)結(jié)構(gòu)框架。
圖5 平臺(tái)系統(tǒng)架構(gòu)示意圖
如圖5 所示,在該平臺(tái)信息展現(xiàn)功能方面,實(shí)現(xiàn)資訊數(shù)據(jù)集成,經(jīng)資訊集成該功能模塊,可以集中統(tǒng)一展現(xiàn)用戶關(guān)心的數(shù)據(jù)信息統(tǒng)一調(diào)度,省去原本需要不斷登錄各網(wǎng)站進(jìn)行搜索的麻煩。在信息分類模塊則能夠?qū)⒂脩羲阉餍畔⒄{(diào)度分類,以便用戶能夠在平臺(tái)應(yīng)用中及時(shí)方便查詢。用戶模塊基于Web2.0 技術(shù)能夠個(gè)性化定制數(shù)據(jù)信息,并且最終可以成功展現(xiàn)個(gè)性化信息。建立基于搜索引擎的供電信息資源多用戶調(diào)度管理平臺(tái),能夠?yàn)橛脩粼趹?yīng)用過程中,提供多樣化信息展現(xiàn)途徑,并創(chuàng)建便捷高效化的工作方式。
該系統(tǒng)平臺(tái)主要實(shí)現(xiàn)的系統(tǒng)檢索功能,基于網(wǎng)絡(luò)爬蟲、索引器、檢索器三大硬件實(shí)現(xiàn)。
1)外網(wǎng)搜索。平臺(tái)用戶可以在應(yīng)用中確保網(wǎng)絡(luò)環(huán)境安全的前提下,為用戶提供外網(wǎng)相關(guān)信息的搜索引擎功能服務(wù),能夠?qū)崿F(xiàn)電力有關(guān)信息網(wǎng)站的全面檢索。
2)內(nèi)網(wǎng)搜索。平臺(tái)可以為用戶提供電力行業(yè)內(nèi)部網(wǎng)絡(luò)信息資源搜索,以IP 地址作為搜索依據(jù),設(shè)定具體的檢索范圍。
3)本地搜索。通過為平臺(tái)用戶提供本地搜索源,譬如可以搜索成功保存于計(jì)算機(jī)終端的硬盤文件。并且可以集成文件管理系統(tǒng),并為內(nèi)部網(wǎng)站提供相應(yīng)的站內(nèi)檢索這一功能。此功能設(shè)計(jì)代碼示例如下:
文檔類型:該平臺(tái)能夠?qū)崿F(xiàn)Word、PDF、網(wǎng)頁等全文檢索功能。
檢索規(guī)模速度:該平臺(tái)的配置技術(shù)水平,直接對檢索速度和最終規(guī)模起決定影響作用,能夠滿足用戶應(yīng)用該平臺(tái)的檢索操作要求。
本地緩存:該系統(tǒng)可以為用戶在應(yīng)用過程中,提供所需的快照功能,方便對閱讀文檔做html 版本處理,這樣一來用戶可以在應(yīng)用中迅速查詢自己所需的相關(guān)信息。
更新周期:通過在該平臺(tái)增設(shè)了增量更新這一全新模式,包含具體的檢索范圍以及確定的系統(tǒng)硬件設(shè)備。通常情況下企業(yè)用戶能夠滿足在有限時(shí)間(1 周內(nèi)),作為搜索引擎信息調(diào)度的完整更新周期,并運(yùn)用廣度優(yōu)先這一方式,真正實(shí)現(xiàn)每一個(gè)分布站點(diǎn)的信息更新。
用戶在應(yīng)用該平臺(tái)過程中,隨著網(wǎng)站數(shù)量的逐漸增加,也會(huì)導(dǎo)致數(shù)據(jù)集成的整體效率不斷降低。所以為了提高用戶的調(diào)度平臺(tái)應(yīng)用效率及便捷性,通過提供資訊集成類服務(wù)在統(tǒng)一頁面中顯示用戶感興趣的主要頁面,并實(shí)現(xiàn)該頁面的及時(shí)更新,如圖6所示。
圖6 搜索引擎體系結(jié)構(gòu)框圖
1)資訊源作為用戶信息調(diào)度的興趣主站點(diǎn),譬如包括了用戶主要關(guān)心的站點(diǎn),供電公司網(wǎng)站、供電系統(tǒng)地調(diào)網(wǎng)站等站點(diǎn),通過設(shè)置這些作為實(shí)時(shí)監(jiān)測站點(diǎn),并在每一個(gè)站點(diǎn)中實(shí)現(xiàn)多URL 信息監(jiān)視。
2)該系統(tǒng)的更新周期可以以人工設(shè)定為主,設(shè)定相應(yīng)的調(diào)度平臺(tái)更新周期后,即可確定是否實(shí)時(shí)更新相關(guān)信息及資訊鏈接。
3)內(nèi)容展現(xiàn)。在統(tǒng)一模塊中集中向用戶展現(xiàn)統(tǒng)一的資訊源信息,并且依照不同的信息發(fā)布時(shí)長完成排序。
用戶在應(yīng)用該平臺(tái)中實(shí)現(xiàn)的內(nèi)網(wǎng)搜索功能主要是面向當(dāng)?shù)毓╇姽倬W(wǎng)、省級供電調(diào)度通訊主頁、市級調(diào)度中心主頁的相關(guān)信息搜索,如圖7 所示。
圖7 站點(diǎn)或基于局域網(wǎng)內(nèi)部的網(wǎng)頁資源的檢索系統(tǒng)
在電力行業(yè)的供電系統(tǒng)平臺(tái)內(nèi)部,包含大量文檔資料,譬如Word、Office、PDF、TXT 等不同文檔資料,具備了大量、復(fù)雜化特點(diǎn),存儲(chǔ)于供電內(nèi)網(wǎng)PC 終端設(shè)備中,用戶可以通過在該平臺(tái)搜索關(guān)鍵詞來查詢所需文檔資料,便于用戶滿足自己的信息資料調(diào)度所需。并且該平臺(tái)還實(shí)現(xiàn)了用戶名及網(wǎng)址的雙重認(rèn)證,嚴(yán)格保證了用戶擁有搜索的權(quán)限,與文檔保密性要求相符。
供電公司網(wǎng)站相關(guān)要聞檢索,能夠根據(jù)不同用戶的應(yīng)用所需,自主選擇需要的相關(guān)內(nèi)容添加至個(gè)性化主頁中。
該平臺(tái)可實(shí)現(xiàn)的高級搜索功能,可以滿足用戶在具體應(yīng)用中根據(jù)自主需求,自定義不同的文件格式、重命名、關(guān)鍵詞、日期以及具體的搜索范圍。
總而言之,隨著供電系統(tǒng)平臺(tái)功能的逐漸完善,在后續(xù)應(yīng)用中也會(huì)不斷增加大量電力行業(yè)相關(guān)圖文資料及專業(yè)搜索功能,最大化滿足用戶的搜索數(shù)據(jù)集成功能需求。