張梅 張新陽
摘 要:當(dāng)今社會(huì),不同生產(chǎn)、生活領(lǐng)域信息化程度的逐步加深,電子文檔與數(shù)據(jù)資料的大量積累,使得電力管理與開發(fā)數(shù)據(jù)資源成為實(shí)現(xiàn)組織單位快速發(fā)展的重要途徑。元數(shù)據(jù)可以看作是對(duì)數(shù)據(jù)的描述,當(dāng)前階段的元數(shù)據(jù)模型通常采用都柏林標(biāo)準(zhǔn),即利用一個(gè)元數(shù)據(jù)對(duì)不同種類的數(shù)據(jù)資源進(jìn)行描述,便于信息開發(fā)人員更好地管理著錄格式,提高信息檢索、描述的效率。
關(guān)鍵詞:元數(shù)據(jù)標(biāo)準(zhǔn);模型驅(qū)動(dòng);數(shù)據(jù)訪問
科技社會(huì)的數(shù)字化進(jìn)程逐步推進(jìn),使得以原數(shù)據(jù)為基礎(chǔ)的資源管理、開發(fā)模式進(jìn)入了成熟發(fā)展的階段,可以實(shí)現(xiàn)快速獲取信息、統(tǒng)一視圖的功能。然而,大數(shù)據(jù)資源管理趨勢(shì)的影響下,電力行業(yè)表格數(shù)據(jù)以及統(tǒng)計(jì)數(shù)據(jù)的規(guī)模更加龐大、類型更加多樣化。靜態(tài)、單一的元數(shù)據(jù)管理模式無法完全實(shí)現(xiàn)數(shù)據(jù)的一致、系統(tǒng)管理,無法兼顧元數(shù)據(jù)與數(shù)據(jù)的描述,如果每一類的數(shù)據(jù)都通過靜態(tài)元數(shù)據(jù)描述,將會(huì)產(chǎn)生數(shù)量極多的元數(shù)據(jù)實(shí)例,增加數(shù)據(jù)維護(hù)的投入成本。因此,本文深入研究電力行業(yè)數(shù)據(jù)開發(fā)的情況,通過元數(shù)據(jù)的動(dòng)態(tài)管理模型構(gòu)建,對(duì)元數(shù)據(jù)的應(yīng)用與管理進(jìn)行系統(tǒng)的探析。
一、元數(shù)據(jù)的標(biāo)準(zhǔn)及其質(zhì)量評(píng)估
1、元數(shù)據(jù)的標(biāo)準(zhǔn)
元數(shù)據(jù)的標(biāo)準(zhǔn)主要是指描述特定資料數(shù)據(jù)的規(guī)則集合,分為語義層次方面的著錄規(guī)則以及語法層次的規(guī)則。其中,語義層次的規(guī)則主要對(duì)數(shù)據(jù)不同領(lǐng)域的概念進(jìn)行描述,按照規(guī)則類型的不同分為類、約束以及屬性等,屬于比較具體的元數(shù)據(jù)規(guī)則。與此相對(duì)應(yīng)的,語法層次的規(guī)則是一種元語言,通過定義使用的語言、語法,對(duì)數(shù)據(jù)的格式以及結(jié)構(gòu)進(jìn)行描述。元數(shù)據(jù)產(chǎn)生及發(fā)展的過程中,其實(shí)際的標(biāo)準(zhǔn)被不斷地修訂,逐步完善元數(shù)據(jù)在不同領(lǐng)域適應(yīng)過程中的規(guī)則。從元數(shù)據(jù)研發(fā)至今,國外學(xué)者針對(duì)元數(shù)據(jù)的規(guī)則與標(biāo)準(zhǔn)進(jìn)行深入研究,將單一的元數(shù)據(jù)劃分規(guī)則演化為多種數(shù)據(jù)集的規(guī)則,在此基礎(chǔ)之上,以都柏林為核心提出了元數(shù)據(jù)的可擴(kuò)展標(biāo)準(zhǔn),進(jìn)一步細(xì)化了核心元數(shù)據(jù)的定義、說明、報(bào)名規(guī)則、擴(kuò)展規(guī)則以及特定元數(shù)據(jù)概念。國內(nèi)相關(guān)元數(shù)據(jù)的標(biāo)準(zhǔn)化建設(shè)成果包括2014年的圖書館系類著錄規(guī)則以及元數(shù)據(jù)規(guī)范叢書等著作的集中出版,體現(xiàn)了我國元數(shù)據(jù)規(guī)則研究的發(fā)展進(jìn)程。
2、元數(shù)據(jù)的質(zhì)量評(píng)估以及具體控制
對(duì)元數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估以及控制主要指以功能需求為導(dǎo)向,對(duì)元數(shù)據(jù)的質(zhì)量進(jìn)行具體控制,保證元數(shù)據(jù)質(zhì)量符合應(yīng)用的實(shí)際需求,確保元數(shù)據(jù)的利用水平達(dá)到設(shè)計(jì)的預(yù)期效果。相關(guān)學(xué)者對(duì)元數(shù)據(jù)的具體評(píng)估指標(biāo)與資源管理體系的研究重點(diǎn)在于評(píng)估指標(biāo)的選擇、數(shù)據(jù)應(yīng)用環(huán)境以及應(yīng)用目標(biāo)等。國外相關(guān)的元數(shù)據(jù)綜合評(píng)估與控制課題的研究已經(jīng)取得了系統(tǒng)性的成果。在國內(nèi),專家學(xué)者也陸續(xù)發(fā)表了如《基于元數(shù)據(jù)的數(shù)據(jù)質(zhì)量控制與評(píng)估模型研究》等學(xué)術(shù)成果,對(duì)元數(shù)據(jù)質(zhì)量的影響因素進(jìn)行了綜合分析,同時(shí)對(duì)數(shù)據(jù)流動(dòng)的質(zhì)量檢測(cè)、控制、評(píng)估等內(nèi)容開展了研究工作,提出了以元數(shù)據(jù)為基礎(chǔ)對(duì)數(shù)據(jù)資源進(jìn)行質(zhì)量控制的模型。
二、以元數(shù)據(jù)為基礎(chǔ)的資源管理系統(tǒng)
針對(duì)現(xiàn)階段靜態(tài)元數(shù)據(jù)應(yīng)用的漏洞,本文提出了以元數(shù)據(jù)為基礎(chǔ)的動(dòng)態(tài)數(shù)據(jù)模型,對(duì)數(shù)據(jù)資源進(jìn)行系統(tǒng)管理,并在電力單位進(jìn)行實(shí)踐的過程中取得了較為顯著的成效。該種數(shù)據(jù)管理模式主要是利用元數(shù)據(jù)的模型,對(duì)管理的數(shù)據(jù)對(duì)象開展標(biāo)準(zhǔn)化模型建設(shè)工作,然后利用動(dòng)態(tài)數(shù)據(jù)對(duì)資源進(jìn)行管理。這種利用元數(shù)據(jù)的動(dòng)態(tài)管理模式,可以對(duì)數(shù)據(jù)進(jìn)行實(shí)例描述,在確保模型一致性的同時(shí),保證了多種形式數(shù)據(jù)資源的統(tǒng)一管理效率。
1、數(shù)據(jù)管理的范圍
動(dòng)態(tài)資源管理與靜態(tài)數(shù)據(jù)控制都是以元數(shù)據(jù)為基礎(chǔ)建立模型的,從電力管理統(tǒng)一性以及元數(shù)據(jù)控制標(biāo)準(zhǔn)化角度來說,數(shù)據(jù)資源的主要范圍包括:
(1)基礎(chǔ)元數(shù)據(jù)(標(biāo)準(zhǔn)元數(shù)據(jù))
基礎(chǔ)范圍的元數(shù)據(jù)屬于對(duì)領(lǐng)域中一般性業(yè)務(wù)進(jìn)行抽象,得出的標(biāo)準(zhǔn)化模型,主要功能在于為數(shù)據(jù)實(shí)例提供標(biāo)準(zhǔn)的管理視圖。
(2)領(lǐng)域元數(shù)據(jù)(擴(kuò)展元數(shù)據(jù))
擴(kuò)展元數(shù)據(jù)是依照不同類型的業(yè)務(wù)特征提取出來的特殊數(shù)據(jù)模型,對(duì)數(shù)據(jù)資源的不同功能進(jìn)行描述。
(3)數(shù)據(jù)資源
數(shù)據(jù)資源包含的內(nèi)容較多,不僅涵蓋了不同格式的數(shù)據(jù)文件(office文件、視頻文件、音頻文件、數(shù)據(jù)庫及其他),還包括數(shù)據(jù)本身(統(tǒng)計(jì)數(shù)據(jù)、個(gè)人信息、憑證等)
(4)標(biāo)準(zhǔn)數(shù)據(jù)
標(biāo)準(zhǔn)數(shù)據(jù)是指符合國家標(biāo)準(zhǔn)、國軍標(biāo)與國際標(biāo)準(zhǔn)以及領(lǐng)域內(nèi)標(biāo)準(zhǔn)數(shù)據(jù)規(guī)則的數(shù)據(jù),包括固定范圍內(nèi)的分類標(biāo)準(zhǔn)以及數(shù)據(jù)字典。
(5)數(shù)據(jù)規(guī)則與數(shù)據(jù)約束
通常情況下,只有數(shù)據(jù)信息與標(biāo)準(zhǔn)數(shù)據(jù)才具備約束、關(guān)聯(lián)等局限性條件,屬于數(shù)據(jù)復(fù)雜性的深度體現(xiàn)。
2、動(dòng)態(tài)元數(shù)據(jù)體系的分層描述
數(shù)據(jù)資源的管理對(duì)象不同,使用的管理形式與模型構(gòu)建方法也存在差異,通過分層管理,可以實(shí)現(xiàn)由簡單到復(fù)雜的系統(tǒng)管理,最終通過數(shù)據(jù)映射保證動(dòng)態(tài)管理的目的。
(1)元元模型
元元模型對(duì)全部的數(shù)據(jù)類型進(jìn)行定義,包括字符、整型等。
(2)元模型
對(duì)領(lǐng)域的元數(shù)據(jù)進(jìn)行基礎(chǔ)的定義,該種模型能夠利用分類體系對(duì)不同領(lǐng)域的元模型進(jìn)行動(dòng)態(tài)管理,同時(shí)通過不同的版本對(duì)分層的元數(shù)據(jù)演化進(jìn)行區(qū)分。
(3)元數(shù)據(jù)
以元模型為基礎(chǔ)對(duì)數(shù)據(jù)進(jìn)行管理,從數(shù)據(jù)庫的角度出發(fā),可以視為一種表單,對(duì)管理領(lǐng)域的實(shí)際資料數(shù)據(jù)進(jìn)行存儲(chǔ)。
(4)實(shí)例
實(shí)例也可以稱為INFO,是一種能夠真實(shí)存儲(chǔ)的資源。其第二與第三列分別對(duì)應(yīng)模型的內(nèi)容與實(shí)現(xiàn)手段。以元元模型為例,作為一般性的通用語言,對(duì)抽象數(shù)據(jù)的全部數(shù)據(jù)格式進(jìn)行了定義,為更復(fù)雜管理層的信息描述提供基礎(chǔ)。
以電力單位需要進(jìn)行檢修的設(shè)備為例,修理數(shù)據(jù)包括:單位名稱、負(fù)責(zé)人、生產(chǎn)信息、修理日期以及設(shè)備編號(hào)等數(shù)據(jù),分層管理模型的構(gòu)建流程為:首先對(duì)元元數(shù)據(jù)進(jìn)行定義,涉及字符型、數(shù)字型、日期型等;其次,對(duì)元數(shù)據(jù)模型進(jìn)行定義,以都柏林體系或領(lǐng)域要求為基礎(chǔ),進(jìn)行模型創(chuàng)建,具體包括:創(chuàng)建者、創(chuàng)建時(shí)間、資源名稱與類型等;第三,定義元數(shù)據(jù)、模型,內(nèi)容為單位名稱、修理日期、負(fù)責(zé)人、設(shè)備編號(hào)等,其中元模型和數(shù)據(jù)模型中,每項(xiàng)都是通過元元模型進(jìn)行描述;第四,實(shí)例,是構(gòu)建完成后基于元數(shù)據(jù)的動(dòng)態(tài)數(shù)據(jù)資源模型的存儲(chǔ)表,一般為主從表的二維關(guān)系映射。
3、模型驅(qū)動(dòng)機(jī)制
為了實(shí)現(xiàn)元數(shù)據(jù)分層模型,從技術(shù)實(shí)現(xiàn)角度,采用模型驅(qū)動(dòng)的方法完成從平臺(tái)無關(guān)到平臺(tái)實(shí)現(xiàn)的遞進(jìn)實(shí)現(xiàn)。其中元元數(shù)據(jù)和元數(shù)據(jù)模型構(gòu)建是平臺(tái)無關(guān)的,針對(duì)領(lǐng)域數(shù)據(jù)資源進(jìn)行邏輯模型構(gòu)建,形成PIM。在邏輯模型校驗(yàn)和審核無誤后,可以進(jìn)行平臺(tái)相關(guān)的物理模型構(gòu)建,形成PSM。最后根據(jù)平臺(tái)約束轉(zhuǎn)換成平臺(tái)依賴的腳本庫及代碼,完成模型的最終構(gòu)建。這里和數(shù)據(jù)庫建模的過程基本一致,但是最大的不同在于,基于元數(shù)據(jù)的動(dòng)態(tài)數(shù)據(jù)資源管理模型構(gòu)建,是以模型管理和領(lǐng)域分類管理為核心,最終會(huì)形成以元數(shù)據(jù)模型為基礎(chǔ)的數(shù)據(jù)資源體系。
三、動(dòng)態(tài)元數(shù)據(jù)管理的技術(shù)架構(gòu)
根據(jù)模型驅(qū)動(dòng)原理和分層設(shè)計(jì)體系,采用SOA面向服務(wù)的技術(shù)架構(gòu),實(shí)現(xiàn)分層模型定義、模型轉(zhuǎn)換和數(shù)據(jù)訪問的一體化動(dòng)態(tài)數(shù)據(jù)資源管理平臺(tái),便于電力單位對(duì)數(shù)據(jù)資源進(jìn)行系統(tǒng)化管理。
1、可視化模型設(shè)計(jì)器
開發(fā)框架由系統(tǒng)框架層,技術(shù)框架層構(gòu)成。在系統(tǒng)框架層,包括操作系統(tǒng)層和數(shù)據(jù)庫層。在技術(shù)框架層,包含各種企業(yè)應(yīng)用開發(fā)必須的技術(shù)控件,包括數(shù)據(jù)交換引擎、業(yè)務(wù)應(yīng)用服務(wù)、IOC容器、數(shù)據(jù)持久化框架、ESA及各類引擎等。各種服務(wù)和工具都基于SOA架構(gòu),可以實(shí)現(xiàn)靈活的接口輸出。使用模型設(shè)計(jì)器創(chuàng)建分層模型并發(fā)布。平臺(tái)如下圖所示。
2、數(shù)據(jù)訪問架構(gòu)
平臺(tái)模型構(gòu)建中通過引入對(duì)象-關(guān)系映射系統(tǒng)中間件,實(shí)現(xiàn)數(shù)據(jù)庫的快速開發(fā)。平臺(tái)可通過JDBC實(shí)現(xiàn)單獨(dú)的持久化層,把數(shù)據(jù)庫訪問操作封裝起來,提供簡潔的API,供業(yè)務(wù)層統(tǒng)一調(diào)用,實(shí)現(xiàn)了獨(dú)立的ORM系統(tǒng)。最上層提供了基于元數(shù)據(jù)的持久化接口??梢詫?shí)現(xiàn)對(duì)模型數(shù)據(jù)對(duì)象持久化操作,比如基本的增、刪、查、改等操作。電力單位通過這些持久化服務(wù)可以進(jìn)行對(duì)模型數(shù)據(jù)的數(shù)據(jù)庫操作。同時(shí)業(yè)務(wù)建??蚣苓€提供了代碼生成和SQL生成的相關(guān)功能。其中代碼生成用于生成模型對(duì)象(元數(shù)據(jù)實(shí)體)的類代碼。
四、以原數(shù)據(jù)為基礎(chǔ)進(jìn)行資源管理的應(yīng)用情況
現(xiàn)階段,元數(shù)據(jù)的應(yīng)用范圍主要包括:數(shù)字圖書館、數(shù)字化的檔案館、教育以及政府電子資源組織幾個(gè)領(lǐng)域。
1、數(shù)字化檔案館
元數(shù)據(jù)屬于數(shù)據(jù)資源管理的重要基礎(chǔ),在圖書館、檔案館與博物館等領(lǐng)域應(yīng)用范圍較廣。三館作為文化遺產(chǎn)保護(hù)單位、歷史文化管理單位與書籍資料存儲(chǔ)單位,是元數(shù)據(jù)應(yīng)用的重點(diǎn)發(fā)展方向。基于三館合一基礎(chǔ),開展元數(shù)據(jù)的動(dòng)態(tài)管理,不僅可以打破數(shù)據(jù)資源的相對(duì)孤立情況,提升數(shù)據(jù)關(guān)聯(lián)的效率,還可以為用戶提供更加便捷的數(shù)據(jù)服務(wù)。具體的管理優(yōu)勢(shì)表現(xiàn)在以下幾方面:首先,元數(shù)據(jù)管理能夠更快的建立起檔案之間的內(nèi)在關(guān)聯(lián);其次,元數(shù)據(jù)可以使檔案的管理更加高效化、科學(xué)化;第三,檔案館通過元數(shù)據(jù)模型的構(gòu)建,能夠提供多元化的信息服務(wù)平臺(tái)。
2、教育領(lǐng)域
元數(shù)據(jù)在教育領(lǐng)域的應(yīng)用主要體現(xiàn)在兩方面:一方面是教育資源的深度開發(fā)上。相較于其他信息資源,教育資源具備共享程度低、多源異構(gòu)以及互操作性差等局限問題。通過元數(shù)據(jù)的深入應(yīng)用,可以為教育資源的共享、開發(fā)提供更加廣闊的服務(wù)平臺(tái)。與此同時(shí),嵌入聚類算法的管理機(jī)制能夠幫助用戶更加快速、精準(zhǔn)的定位需求資源,保障學(xué)習(xí)者的E-Learning環(huán)境和諧;另一方面,電子課本、書包等資源模式,也是現(xiàn)代教育關(guān)注的重點(diǎn)之一,以元數(shù)據(jù)為基礎(chǔ)的電子課本對(duì)電子元數(shù)據(jù)的體系進(jìn)行了層次化動(dòng)態(tài)管理,保證了內(nèi)容、類別之間的管理一致性。通過研發(fā)電子課本的數(shù)據(jù)資源約束、XML綁定等,提升了教育資源的共享性。除此之外,現(xiàn)階段遠(yuǎn)程教育與MOOC(幕課)的研究與發(fā)展,使得數(shù)據(jù)資源的管理越發(fā)的復(fù)雜,因此需要通過元數(shù)據(jù)與本體技術(shù)等手段,保證遠(yuǎn)程教育知識(shí)共享的實(shí)踐性與穩(wěn)定性。
結(jié)論:元數(shù)據(jù)理論與應(yīng)用在不同領(lǐng)域的深入發(fā)展,使得以元數(shù)據(jù)為基礎(chǔ)的動(dòng)態(tài)資源管理系統(tǒng)成為數(shù)據(jù)資源開發(fā)的重點(diǎn)。在此基礎(chǔ)之上,本文結(jié)合電力單位的數(shù)據(jù)開發(fā)情況,從管理需求、數(shù)據(jù)定義、技術(shù)實(shí)現(xiàn)等方面出發(fā),結(jié)合實(shí)際案例對(duì)數(shù)據(jù)資源動(dòng)態(tài)管理的模型進(jìn)行了具體分析。該平臺(tái)可以在高效處理大數(shù)據(jù)的基礎(chǔ)上,通過一致性、系統(tǒng)性的管理,為用戶提供更便捷的數(shù)據(jù)服務(wù)。
參考文獻(xiàn):
[1]楊博文,劉太敏.基于元數(shù)據(jù)的軍用數(shù)據(jù)資源采集匯總系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[C]//中國指揮控制大會(huì).2018;
[2]張錚.基于XML元數(shù)據(jù)的農(nóng)作物光譜信息管理系統(tǒng)的研究與設(shè)計(jì)[D].華中農(nóng)業(yè)大學(xué),2016;
[3]劉婧.基于元數(shù)據(jù)的多源異構(gòu)海洋情報(bào)數(shù)據(jù)交互共享研究[J].情報(bào)雜志,2016,35(9);
[4]高勁松,劉洪秋.基于生命周期理論的文物元數(shù)據(jù)開放機(jī)制研究[J].圖書情報(bào)工作,2017(12).