文必龍,焦圣杰,郭 嬌
(東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)
為了更好地應對數(shù)據(jù)的海量、異構、共享性和多樣性給數(shù)據(jù)管理帶來的挑戰(zhàn)[1],F(xiàn)ranklin提出了數(shù)據(jù)空間(Data Space)的概念:一個數(shù)據(jù)空間由一系列相關的異構資源對象集和資源對象間的關聯(lián)關系集組成,包含某個組織或個體相關的一切信息,這些信息可以以任意形式,在任意地方存儲;在將數(shù)據(jù)加入到數(shù)據(jù)空間之前,無需像關系數(shù)據(jù)庫事先為其定義嚴格的關系模式,直接將數(shù)據(jù)源加入數(shù)據(jù)空間,并以pay-as-you-go模式實現(xiàn)數(shù)據(jù)的管理[2]。
有不少學者對數(shù)據(jù)空間技術開展了研究,其中最具有代表性的是個人數(shù)據(jù)空間技術,如瑞士蘇黎世理工學院開發(fā)的iMeMex系統(tǒng)[3]、美國華盛頓大學開發(fā)的SEMEX系統(tǒng)[4]以及中國人民大學開發(fā)的OrientSpace[5]等個人數(shù)據(jù)空間系統(tǒng)原型。個人數(shù)據(jù)空間的許多技術同樣適合企業(yè)數(shù)據(jù)空間,如個人數(shù)據(jù)空間模型與查詢、數(shù)據(jù)關聯(lián)、數(shù)據(jù)索引等,但與個人數(shù)據(jù)空間相比,企業(yè)數(shù)據(jù)空間管理更加復雜。
企業(yè)數(shù)據(jù)空間的主體是整個企業(yè),而不是個人或某個部門。需要管理的數(shù)據(jù)來自各個部門、專業(yè)、項目或者業(yè)務,數(shù)據(jù)規(guī)模巨大、種類復雜多樣,組織管理困難。而且,企業(yè)現(xiàn)有數(shù)據(jù)庫具有專門的,甚至標準化的數(shù)據(jù)模式,與個人數(shù)據(jù)空間的數(shù)據(jù)模式的靈活性相反,這些數(shù)據(jù)庫要求的是模式穩(wěn)定,需要將傳統(tǒng)的“先模式后數(shù)據(jù)”和數(shù)據(jù)空間的“先數(shù)據(jù)后模式”的方式協(xié)調(diào)起來進行管理。
針對靈活高效地組織企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)資源的問題,該文結合企業(yè)數(shù)據(jù)管理的特點,提出了企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法:通過構建的分層組織模型實現(xiàn)對數(shù)據(jù)進行多維多角度地組織,利用屬性圖模型統(tǒng)一描述企業(yè)數(shù)據(jù)空間中的各種數(shù)據(jù)資源,實現(xiàn)了對企業(yè)數(shù)據(jù)靈活和高效的組織管理。
目前,數(shù)據(jù)空間中數(shù)據(jù)組織方面的研究主要包括數(shù)據(jù)空間體系架構、數(shù)據(jù)空間數(shù)據(jù)模型表示方法、數(shù)據(jù)索引、數(shù)據(jù)關聯(lián)關系挖掘等。Dong Xin[4]提出的個人信息集成與管理平臺SEMEX系統(tǒng)采用以數(shù)據(jù)為主的體系架構,采用數(shù)據(jù)源、域模型、關聯(lián)與實例、領域模型和關系抽取引擎來組織管理數(shù)據(jù)。J P Dittrich[6]提出了一個基于圖數(shù)據(jù)模型和資源視圖的iDM模型,用一種統(tǒng)一資源視圖的概念和形式化表示方法,實現(xiàn)各種數(shù)據(jù)類型(如文檔、目錄、關系表、XML文檔、數(shù)據(jù)流等)的統(tǒng)一表示,采用數(shù)據(jù)源層、個人數(shù)據(jù)空間管理系統(tǒng)PDSMS(Personal DataSpace Management System)、應用層的分層體系架構來組織管理數(shù)據(jù)。
中國人民大學的孟小峰教授發(fā)表了關于數(shù)據(jù)空間技術發(fā)展的綜述性文章,并提出了一個典型的數(shù)據(jù)空間集成與管理框架,該框架由數(shù)據(jù)集成引擎、數(shù)據(jù)空間引擎、數(shù)據(jù)演化引擎和數(shù)據(jù)輸出引擎組成[1]。鐘鳴等人基于RDF提出了類似的元組模型,采用逐層分解的方式構建圖,并提供了強大的查詢能力[7]。董彥磊等人提出了一個應用于數(shù)據(jù)空間的3層組織結構,該結構由物理數(shù)據(jù)層、邏輯數(shù)據(jù)層和應用層組成[8]。邏輯數(shù)據(jù)層是整個數(shù)據(jù)空間的關鍵組成部分,基于該層才能對數(shù)據(jù)空間進行統(tǒng)一的管理,同時支持數(shù)據(jù)空間管理系統(tǒng)所提供的各種服務。楊丹等人以實體作為基本的數(shù)據(jù)單位,提出分層的圖模型lgDM[9],用來建模數(shù)據(jù)空間中存在的各種異構數(shù)據(jù),即:實體關聯(lián)數(shù)據(jù)圖和實體關聯(lián)模式圖。王江海等人基于刻面的概念,利用數(shù)據(jù)源、刻面和屬性來描述數(shù)據(jù)源[10]。
李玉坤等人針對數(shù)據(jù)空間本質(zhì)特征,提出了基于圖的個人數(shù)據(jù)空間概念模型和基于四元組的數(shù)據(jù)空間邏輯模型,該模型可以刻畫數(shù)據(jù)空間的時序特征[11]。概念上將個人數(shù)據(jù)空間用一個大的有向圖表示,圖中節(jié)點表示數(shù)據(jù)對象,邊表示數(shù)據(jù)對象之間的關聯(lián)關系,數(shù)據(jù)對象和關聯(lián)可以具有若干屬性,屬性取值具有時間屬性。邏輯上用四元組<對象,屬性,取值,時間>描述個人數(shù)據(jù)對象及其動態(tài)變化,即用形如
企業(yè)數(shù)據(jù)空間的數(shù)據(jù)是復雜多樣的,現(xiàn)有的個人數(shù)據(jù)空間的數(shù)據(jù)組織方法或者傳統(tǒng)的數(shù)據(jù)組織方法都無法將“先模式后數(shù)據(jù)”和“先數(shù)據(jù)后模式”的兩種數(shù)據(jù)管理方式靈活地結合,且企業(yè)中的半結構化數(shù)據(jù)和非結構化數(shù)據(jù)越來越重要,需要統(tǒng)一的方式對企業(yè)中的異構數(shù)據(jù)進行統(tǒng)一表達和描述,且隨著企業(yè)業(yè)務中的快速變化,需要一個靈活的企業(yè)數(shù)據(jù)模式的描述方式,可以隨著企業(yè)的變化,更好地滿足企業(yè)中的數(shù)據(jù)應用需求,需要對企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法進行進一步的研究。
個人數(shù)據(jù)空間管理的主要是與個人相關的數(shù)據(jù),僅需滿足個人數(shù)據(jù)需求即可,而企業(yè)數(shù)據(jù)管理的對象是整個企業(yè)中所有相關的數(shù)據(jù),需要滿足各種應用系統(tǒng)的數(shù)據(jù)服務需求。與個人數(shù)據(jù)管理相比,企業(yè)數(shù)據(jù)管理更加復雜,結合數(shù)據(jù)空間的概念,提出企業(yè)數(shù)據(jù)空間的概念:
定義1:企業(yè)數(shù)據(jù)空間(Enterprise Data Space,EDS)是以整個企業(yè)為主體,以企業(yè)中各個部門的信息系統(tǒng)中的數(shù)據(jù)和數(shù)據(jù)間的關聯(lián)關系為管理對象的數(shù)據(jù)空間,提供按需、即時、靈活的數(shù)據(jù)服務[13]。
企業(yè)數(shù)據(jù)空間的主要特點有:
(1)可以對結構化、半結構化和非結構化的數(shù)據(jù)進行統(tǒng)一描述和管理。
(2)將原有關系數(shù)據(jù)庫的“先模式后數(shù)據(jù)”和數(shù)據(jù)空間的“先數(shù)據(jù)后模式”的方式協(xié)調(diào)起來進行管理,靈活管理兩種方式的數(shù)據(jù)。
(3)具有多維度、多層次、多角度的數(shù)據(jù)組織方式,更能滿足企業(yè)靈活管理和使用數(shù)據(jù)的需求。
為了更加靈活和高效地組織管理企業(yè)數(shù)據(jù)空間中海量的多源異構數(shù)據(jù)資源,該文提出了一個應用于企業(yè)數(shù)據(jù)空間的分層數(shù)據(jù)組織結構,按照數(shù)據(jù)資源目錄、數(shù)據(jù)模型、數(shù)據(jù)三個層次進行組織與管理,如圖1所示。
其中數(shù)據(jù)空間(DataSpace,DS)是與主體相關的所有數(shù)據(jù)和數(shù)據(jù)間關系的集合。企業(yè)中不同的部門、項目組或者個人,都可以根據(jù)需要創(chuàng)建數(shù)據(jù)空間,并對其進行維護和使用。不同數(shù)據(jù)空間中的數(shù)據(jù)也可以存在交叉,可以看作企業(yè)數(shù)據(jù)空間的個人視圖。
圖1 企業(yè)數(shù)據(jù)空間的分層組織架構
數(shù)據(jù)資源目錄(Data Resource Catalog,DRC),是從多維多角度對數(shù)據(jù)空間中的數(shù)據(jù)進行分類和組織的一種樹形目錄結構,也是企業(yè)中數(shù)據(jù)的分類標準。數(shù)據(jù)源是從數(shù)據(jù)存儲載體形式進行分類的,企業(yè)架構是從使用數(shù)據(jù)的角度對數(shù)據(jù)進行分類,采用應用視圖的方式使用數(shù)據(jù)。這兩種分類方式是數(shù)據(jù)空間提供的默認分類方式,企業(yè)根據(jù)需要可以自行定義相應的分類角度。數(shù)據(jù)資源目錄的每一個葉子節(jié)點都對應有相應的數(shù)據(jù)資源,數(shù)據(jù)資源可以是實際的數(shù)據(jù)源,如具體的數(shù)據(jù)庫系統(tǒng)、文檔文件等,也可以是虛擬的數(shù)據(jù)源,如數(shù)據(jù)視圖。在數(shù)據(jù)空間中,數(shù)據(jù)資源目錄的結構是靈活的、動態(tài)的,一個數(shù)據(jù)資源可以屬于多個目錄節(jié)點。
數(shù)據(jù)模型(DataModel,DM),代表著不同數(shù)據(jù)資源的數(shù)據(jù)結構,包括多種類型的數(shù)據(jù)源模型,既有物理數(shù)據(jù)源的存儲模型,又有虛擬數(shù)據(jù)源的邏輯模型,還包括數(shù)據(jù)空間的邏輯數(shù)據(jù)模型,即企業(yè)數(shù)據(jù)空間的所有數(shù)據(jù)資源作為企業(yè)頂層組織的一個數(shù)據(jù)視圖。數(shù)據(jù)模型有兩種情況:一種是遺留的關系數(shù)據(jù)庫的數(shù)據(jù)模型,按照“先模式后數(shù)據(jù)”的形式,將關系數(shù)據(jù)庫的數(shù)據(jù)模型直接納入企業(yè)數(shù)據(jù)空間的管理之中;另一種是,預設數(shù)據(jù)模式之外或沒有嚴格數(shù)據(jù)模式的數(shù)據(jù),隨著企業(yè)的需求改變和數(shù)據(jù)模式演化,逐漸演化出來的數(shù)據(jù)模式。數(shù)據(jù)模型由類、類之間的關系、數(shù)據(jù)操作和數(shù)據(jù)約束組成。類(Class),代表著數(shù)據(jù)模型中的類(也就是實體),例如關系數(shù)據(jù)庫的數(shù)據(jù)模型中的一張表,半結構化數(shù)據(jù)中的元素。屬性(Attribute),代表著類中的屬性,如關系表中的字段,半結構化數(shù)據(jù)中的元素。約束(Constrain),代表數(shù)據(jù)模型中類的相關約束。
數(shù)據(jù)(Data),是指符合數(shù)據(jù)模型定義的類的數(shù)據(jù)實例,即數(shù)據(jù)源。企業(yè)數(shù)據(jù)空間的數(shù)據(jù)源分四類:遺留的關系型數(shù)據(jù)庫、半結構化的數(shù)據(jù)文件、非結構數(shù)據(jù)文件和自動演化的數(shù)據(jù)庫。其中遺留的關系數(shù)據(jù)庫指的是,企業(yè)中已經(jīng)投入使用的各個信息系統(tǒng)或者應用的關系型數(shù)據(jù)庫,其中包含大量數(shù)據(jù)模式穩(wěn)定的結構化數(shù)據(jù);半結構化數(shù)據(jù)文件主要指的是XML文件;非結構化數(shù)據(jù)文件常見的有文檔、視頻、音頻和郵件等;自動演化的數(shù)據(jù)庫主要指的是,事先沒有建立完整的數(shù)據(jù)模式的數(shù)據(jù),而且也沒有相應的物理存儲模式,直接將數(shù)據(jù)存入ESD空間中,通過數(shù)據(jù)模式演化,自動創(chuàng)建相應的邏輯模式和相應的物理存儲模式,提供該數(shù)據(jù)模式下數(shù)據(jù)的存儲和管理。
數(shù)據(jù)對象(Data Object),是指沒有相應明確數(shù)據(jù)模式和結構的數(shù)據(jù),直接納入企業(yè)數(shù)據(jù)空間的管理,隨著企業(yè)數(shù)據(jù)空間的使用或者有需要的時候,逐步完善數(shù)據(jù)對象的數(shù)據(jù)模式,形成更加嚴格的數(shù)據(jù)模式,利用數(shù)據(jù)模型表示出來,進行組織和管理。
企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)結構復雜,包含不同異構數(shù)據(jù)的數(shù)據(jù)模型,所以需要一個可以描述企業(yè)數(shù)據(jù)空間中所有數(shù)據(jù)的方法。該文利用屬性圖數(shù)據(jù)模型(Property Graph Data Model,PGDM)[14]來描述數(shù)據(jù)空間中存在的各種異構數(shù)據(jù)。企業(yè)數(shù)據(jù)空間利用屬性圖模型將所有數(shù)據(jù)描述并關聯(lián)起來,形成一個與企業(yè)相關的屬性圖。其中使用的基本概念定義如下:
定義2:節(jié)點(Node)是屬性圖模型中的一個基本元素,用來表示各種類型的數(shù)據(jù),可以是數(shù)據(jù)源、數(shù)據(jù)資源目錄分類節(jié)點,數(shù)據(jù)模型中類、屬性、約束,數(shù)據(jù)層的每一個數(shù)據(jù)單元,數(shù)據(jù)對象等。節(jié)點的標簽(Label)表示數(shù)據(jù)的類型或模式信息,屬性集(Properties)描述節(jié)點的具體信息,節(jié)點可以包含多個屬性(Property)和多個標簽(Label),每個節(jié)點至少擁有一個用于區(qū)分節(jié)點和節(jié)點之間是否相等的唯一標識。
定義3:關系(Relationship)是任意兩個節(jié)點間可能存在的關聯(lián)關系,同樣是屬性圖模型中的基本元素,將節(jié)點關聯(lián)起來構成圖,也可以稱為圖論中的邊(Edge)。其始端(Start node)和末端(End node)都必須是節(jié)點,關系不能指向空也不能從空發(fā)起,而且關系是有方向的。關系和節(jié)點一樣可以包含多個屬性,但關系只能有一個類型(Type),一個節(jié)點可以被多個關系指向或作為關系的起始節(jié)點。
定義4:屬性(Property)是節(jié)點或者關系所具有的特性,節(jié)點和關系都可以有多個屬性。屬性是由鍵值對
定義5:節(jié)點標簽(Node Labels)是一種對節(jié)點進行語義分類的方法[14]。節(jié)點可以分配零個標簽、一個或多個標簽,標簽本質(zhì)上是圖形結構中面向集合的概念:它們允許輕松高效地創(chuàng)建子圖,這對于許多不同的用途非常有用,例如僅查詢數(shù)據(jù)庫內(nèi)容的一部分??梢允褂脴撕灡硎灸撤N數(shù)據(jù)類型、結構或模式,或者根據(jù)企業(yè)需要,自定義相應的標簽。雖然不是必需的,但節(jié)點應至少具有一個標簽,為了更加清晰地了解數(shù)據(jù)。
定義6:關系類型(Relationship Types)實現(xiàn)的內(nèi)容與處理節(jié)點標簽類似,是為了對關系進行分類。但是關系類型是關系必不可少的,每個關系必須有一種且只有一種類型,兩個節(jié)點可以由多個關系連接,并且在屬性圖中復雜、深層遍歷期間使用。
定義7:屬性圖模型的數(shù)據(jù)結構,可以形式化定義為一個二元組PGDM=(Nodes,Relationships),其中Nodes表示企業(yè)數(shù)據(jù)空間中所有的節(jié)點集合;Relationships?Node×Node表示節(jié)點之間的關系集合,具體情況如圖2所示。
圖2 屬性圖數(shù)據(jù)模型的數(shù)據(jù)結構
利用屬性圖數(shù)據(jù)模型對企業(yè)數(shù)據(jù)空間中的異構數(shù)據(jù)進行統(tǒng)一描述,具有以下優(yōu)點:
(1)屬性圖模型沒有固定的模式。屬性圖本身并不強制要求數(shù)據(jù)必須具有嚴格的關系模式,符合數(shù)據(jù)空間先模式后數(shù)據(jù)的特點。
(2)屬性圖的無模式和弱模式特性,更適合處理半結構化數(shù)據(jù)。當半結構化數(shù)據(jù)發(fā)生變化的時候,可以比較方便地處理數(shù)據(jù)模式的變化。
(3)節(jié)點、屬性及關系,更符合現(xiàn)實世界中事物的特點,更加容易理解。
(4)關系是明確的,不是由某種約束推斷的,也不是通過連接操作在查詢時建立的,是屬性圖中重要的基本元素,而且可以具有屬性,可以將現(xiàn)實世界中數(shù)據(jù)間復雜的關系給描述和利用起來,具有和節(jié)點相同的表達能力。
(5)獨立于各種數(shù)據(jù)源,可以描述結構化、半結構、非結構化數(shù)據(jù)結構,可以多維度多層次描述企業(yè)數(shù)據(jù)空間數(shù)據(jù),便于自動模式演化。
為了將企業(yè)中大量穩(wěn)定的關系數(shù)據(jù)庫也集成到EDS中進行管理,將“先模式后數(shù)據(jù)”的特點也體現(xiàn)出來,還有后續(xù)弱模式或無模式的數(shù)據(jù)對象隨著使用,逐漸演化出相應的數(shù)據(jù)模型,設計統(tǒng)一的數(shù)據(jù)模式描述方法,無論是結構化數(shù)據(jù)模型、半結構化數(shù)據(jù)模型或者ESD全局邏輯模型,都用同一種描述方法進行描述,在邏輯模式層上進行統(tǒng)一管理。
數(shù)據(jù)模式由類、類之間關系和類的約束組成。用來統(tǒng)一描述企業(yè)數(shù)據(jù)空間中的各種模型和企業(yè)數(shù)據(jù)空間的概念模型。描述方法的形式化表達為:
DataModel={Class,Constrain,Relationship}
其中,DataModel代表不同的數(shù)據(jù)模型,既有物理數(shù)據(jù)源的存儲模型,又有虛擬數(shù)據(jù)源的邏輯模型。在企業(yè)數(shù)據(jù)空間中,有一個全局的邏輯模型。企業(yè)數(shù)據(jù)空間的所有數(shù)據(jù)資源作為企業(yè)頂層組織的一個數(shù)據(jù)視圖,其對應的數(shù)據(jù)模型即全局邏輯模型。
Class是數(shù)據(jù)模型下包含的各個類(也可叫做實體),例如關系數(shù)據(jù)庫中的一張表或者是視圖,或者一個半結構化的文件的元素節(jié)點。其中Class下包含不同的屬性(Attribute),如關系表中的字段,半結構化數(shù)據(jù)中的屬性節(jié)點。
Constrain是類的相關約束,是對類的約束限制,如關系表的字段的取值約束。
Relationship是數(shù)據(jù)模型下各個類之間的關系,如常見的有關系表中的主外鍵關系、類與類之間的引用關系等。
通過上述的數(shù)據(jù)模型描述方法,無論是各種數(shù)據(jù)源的數(shù)據(jù)模型,還是虛擬的數(shù)據(jù)模型或者數(shù)據(jù)空間本身的全局模型,都可以用統(tǒng)一的方法描述。不同異構數(shù)據(jù)模型,用同一種數(shù)據(jù)模型描述方法,為后續(xù)數(shù)據(jù)模式匹配提供了良好的基礎,可以更好地支持后續(xù)的數(shù)據(jù)模式演化。
3.2.1 描述結構化數(shù)據(jù)模型
當結構化數(shù)據(jù)模型在EDS中被進行描述時,需要有一定的描述規(guī)則,才可以直接地對關系數(shù)據(jù)結構進行描述。其中的描述規(guī)則有:
(1)其中的表(Relation)用Class下的節(jié)點來描述,表的一些本身特征用Class下節(jié)點的屬性集來表示。
(2)其中表的各個字段(Attribute)用Attribute來表示,屬性的本身特征用Attribute下的屬性集來表示。
(3)表的一些完整性約束條件和用戶自定義的約束條件,用Constrain來描述。
(4)表與表之間的關系,用Relationship來描述。
3.2.2 描述半結構化數(shù)據(jù)模型
半結構化數(shù)據(jù)的數(shù)據(jù)結構和數(shù)據(jù)內(nèi)容是混合在一起的,介于結構化和非結構化數(shù)據(jù)之間?,F(xiàn)在企業(yè)中用的最廣泛的半結構數(shù)據(jù),就是XML文件。以XML的數(shù)據(jù)模式為例,其數(shù)據(jù)模式描述方法為:
(1)將XML文件中不含有文本節(jié)點的元素節(jié)點用Class下的節(jié)點來表達,元素節(jié)點的名字當作類的名字,屬性節(jié)點當作節(jié)點的屬性。
(2)將XML文件中含有文本節(jié)點的元素節(jié)點用Attribute下的節(jié)點來描述,元素節(jié)點的名字當作屬性的名字,屬性節(jié)點當作節(jié)點的屬性。
3.2.3 描述非結構化數(shù)據(jù)模型
非結構化數(shù)據(jù)常見的有視頻、音頻、文檔或者一些二進制文件,沒有明顯的數(shù)據(jù)結構。但是在非結構化數(shù)據(jù)文件中,其實是隱含著相應的數(shù)據(jù)結構的。如常見的音頻數(shù)據(jù)、視頻數(shù)據(jù),WORD、PDF文檔,石油企業(yè)中的地震數(shù)據(jù)、測井數(shù)據(jù)等,這些數(shù)據(jù)的格式是標準化的,格式的描述不在數(shù)據(jù)體中。賁福才提出了一種非結構化數(shù)據(jù)模式描述標記語言BULKML,該標記語言采用XML描述的非結構化數(shù)據(jù)的結構,為非結構化數(shù)據(jù)補充模式描述,使非結構化數(shù)據(jù)轉換為半結構化數(shù)據(jù)[15]。BULKML按數(shù)據(jù)文件偏移量(二進制文件)或文件標記(文本文件),對數(shù)據(jù)文件中的數(shù)據(jù)的語義進行標注。BULKML按數(shù)據(jù)文件格式規(guī)范進行定義,每一種格式規(guī)范定義一個BULKML。而且在國家標準非結構化數(shù)據(jù)表示規(guī)范中,利用XML文件格式來表示非結構化數(shù)據(jù)文件的數(shù)據(jù)結構[16]。也就是說非結構化數(shù)據(jù)的數(shù)據(jù)模式用半結構化數(shù)據(jù)文件來表示,從而利用半結構化數(shù)據(jù)的數(shù)據(jù)模式描述方法,實現(xiàn)對非結構化數(shù)據(jù)的數(shù)據(jù)模型進行描述。
該文以企業(yè)數(shù)據(jù)的現(xiàn)有數(shù)據(jù)管理特征為出發(fā)點,針對靈活高效地組織企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)資源的問題,對企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法進行研究:提出了企業(yè)數(shù)據(jù)空間分層的組織模型,實現(xiàn)對企業(yè)數(shù)據(jù)空間多角度多維度的組織;建立了基于屬性圖模型的數(shù)據(jù)描述方法,統(tǒng)一描述各種異構數(shù)據(jù)。利用此方法可以高效靈活地組織和管理企業(yè)數(shù)據(jù)空間的數(shù)據(jù),為后續(xù)的數(shù)據(jù)模式演化奠定基礎。
在以后的工作中,將致力于改進企業(yè)數(shù)據(jù)空間的數(shù)據(jù)的存取優(yōu)化,考慮將企業(yè)中的實時數(shù)據(jù)也納入企業(yè)數(shù)據(jù)空間的管理,解決數(shù)據(jù)模式演化問題等,使企業(yè)數(shù)據(jù)空間功能更加完善。