孫遠輝,劉曉娟
(1.中國人民武裝警察部隊學院訓練部,河北廊坊065000;2.廊坊東方職業(yè)技術學院城鐵系,河北廊坊065000)
一種校園公共數(shù)據(jù)平臺架構研究與實現(xiàn)
孫遠輝1,劉曉娟2
(1.中國人民武裝警察部隊學院訓練部,河北廊坊065000;2.廊坊東方職業(yè)技術學院城鐵系,河北廊坊065000)
高校信息化發(fā)展至今,數(shù)據(jù)綜合應用依然存在不足。結合建設實踐,采用面向服務的體系結構思想,提出了一種新穎的校園公共數(shù)據(jù)平臺架構,并描述了主要實現(xiàn)技術,為面向服務的校園數(shù)據(jù)綜合應用系統(tǒng)設計與實現(xiàn)提供了一個新的參考模型。
面向服務的體系結構;公共數(shù)據(jù)平臺;元數(shù)據(jù)
伴隨信息化的快速發(fā)展,高校信息資源逐漸豐富,各類人員對數(shù)據(jù)的綜合應用需求日益提升,從簡單的信息管理發(fā)展到整合的、個性化的、主動的信息服務。通過走訪和調研一些高校的信息化建設情況,有些高校已建應用系統(tǒng)缺乏統(tǒng)一規(guī)劃和統(tǒng)一數(shù)據(jù)標準,僅僅解決了局部的業(yè)務處理和信息共享,尚未在全校范圍內實現(xiàn)跨部門、跨業(yè)務、跨應用的信息共享和集成,[1]不同業(yè)務系統(tǒng)之間存在著數(shù)據(jù)不一致、共享程度不高等諸多問題,信息“孤島”[2]問題依然沒有很好解決;整體數(shù)據(jù)資源未能得到充分挖掘和利用,信息應用的深度和廣度不足,沒有形成基于學校整體信息的綜合查詢視圖和主題分析視圖,難以發(fā)揮數(shù)據(jù)的綜合效益和規(guī)模效益。
為進一步提升高校現(xiàn)有信息化建設水平,解決發(fā)展中存在的遺留問題,在汲取其他高校信息化建設經驗的基礎上,結合本校建設實踐,采用面向服務的體系結構思想,提出了一種新穎的校園公共數(shù)據(jù)平臺架構,它定位于整合學校各部門、各應用領域的數(shù)據(jù)共享需求,建立數(shù)據(jù)共享標準,以各類信息資源的集成和交換為基礎,構建滿足學校教學、科研、管理要求的開放性、協(xié)同化的綜合信息服務環(huán)境,為學校各類人員提供基于統(tǒng)一全校信息視圖的數(shù)據(jù)綜合應用服務,實現(xiàn)了系統(tǒng)互聯(lián)、資源共享,提高了應用效能,推進了學校信息化建設持續(xù)協(xié)調發(fā)展。
本文第2節(jié)提出了基于SOA的校園公共數(shù)據(jù)平臺架構;第3節(jié)描述了主要的實現(xiàn)技術;第4節(jié)結合平臺實際運行,給出了應用實例;最后進行了總結。
1.面向服務結構的特點
面向服務的體系結構(Service Oriented Architecture, SOA)是一種充分利用Internet技術、滿足企業(yè)對不斷增長的業(yè)務運營模式需求的應用架構,該模式具有安全、靈活和無縫處理異構和異質的內外資源的能力,[3-4]作為分布式的軟件架構模型,該模型中任何業(yè)務功能都被作為提供的一個服務使用,應用程序的不同功能(服務)通過這些服務之間定義的結構和合約聯(lián)系,應用系統(tǒng)可以看做是一系列服務的集成。[5]
SOA的體系結構中,服務提供者將服務注冊到服務代理目錄上,當服務請求者需要調用服務時,首先在服務代理提供的目錄查找服務信息,服務代理返回調用服務信息,服務請求者根據(jù)返回的信息調用服務提供者提供的服務,當服務請求者從服務代理得到所需服務的信息后,通訊在服務請求者和服務提供者之間進行,無需經過服務代理。
2.公共數(shù)據(jù)平臺架構
與傳統(tǒng)的集成方法相比,基于SOA的集成方法具有較多優(yōu)勢,即可重用、平臺獨立、基于標準、粗粒度、松耦合以及可適應業(yè)務需求變化等。此外,SOA架構本身具有很好的擴展性、靈活性和適應性,并容易實現(xiàn)應用之間的互操作與信息互通。[1]因此,采用SOA的思想來設計公共數(shù)據(jù)平臺是一種很好的策略。公共數(shù)據(jù)平臺的總體架構如圖1所示:
公共數(shù)據(jù)平臺總體架構是一個龐大而復雜的技術體系,為降低技術體系設計的復雜度,構造出結構清晰、適應性強的總體架構模型,依據(jù)分層分離原則,按信息化技術功能不同,抽象、歸納出基礎設施層、信息資源層、應用支撐層、應用層、展現(xiàn)層以及相應的保障環(huán)境,保障環(huán)境包括標準規(guī)范體系、安全保障體系和運行維護體系。
圖1 公共數(shù)據(jù)平臺總體架構
(1)基礎設施層
基礎設施層是公共數(shù)據(jù)平臺總體架構中最根本的軟硬件支撐環(huán)境,平臺架構中的資源、應用都建立在這些網(wǎng)絡硬件、存儲設備和系統(tǒng)軟件之上,該層包括操作系統(tǒng)、應用中間件、數(shù)據(jù)庫軟件、備份軟件、應用服務器、數(shù)據(jù)庫服務器、網(wǎng)絡平臺以及存儲備份平臺。
(2)信息資源層
信息資源層集中存儲、統(tǒng)一管理公共數(shù)據(jù)平臺所有的數(shù)據(jù)資源,提供多種類型數(shù)據(jù)的訪問,為公共數(shù)據(jù)平臺提供資源支持和信息存儲媒介。它包括全域數(shù)據(jù)庫、主題數(shù)據(jù)庫以及元數(shù)據(jù)庫。全域數(shù)據(jù)庫中的數(shù)據(jù)來源于各個業(yè)務系統(tǒng),以信息共享為核心目標,構建集中統(tǒng)一的共享數(shù)據(jù)整合、存儲和管理的平臺;主題數(shù)據(jù)庫是把來自全域數(shù)據(jù)庫的信息資源,按照不同的維度進行組織,提供各職能域分析,支持各類主題應用,挖掘信息價值。通過信息資源層的規(guī)劃與建設,全域數(shù)據(jù)庫與主題數(shù)據(jù)庫等一起構成了數(shù)據(jù)中心的整體數(shù)據(jù)架構,遵循相同的數(shù)據(jù)編碼規(guī)則,執(zhí)行統(tǒng)一的元數(shù)據(jù)管理及數(shù)據(jù)質量控制。元數(shù)據(jù)庫在第3節(jié)重點介紹。
(3)應用支撐層
應用支撐層通過建立面向服務的體系結構,構建開放的、模塊化的、可重用、可擴展的一系列共性技術平臺。在總體架構中支撐上層應用,弱化信息資源層對應用層的制約和限制;減少上層應用在共性、基礎需求上的投入,為上層應用之間的互聯(lián)、互通、互操作奠定基礎。應用支撐層依據(jù)共性技術體制、依托信息資源層的支持,提供了對應用層的技術支撐及統(tǒng)一技術標準規(guī)范。應用支撐層包括元數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)訪問服務系統(tǒng)、ETL服務管理系統(tǒng)以及報表管理系統(tǒng)。數(shù)據(jù)訪問服務系統(tǒng)以全域數(shù)據(jù)庫中的共享數(shù)據(jù)為核心,提供統(tǒng)一的信息整合,實現(xiàn)各業(yè)務系統(tǒng)間信息共享,以服務方式向各業(yè)務系統(tǒng)提供數(shù)據(jù),并負責從各業(yè)務系統(tǒng)接收信息,更新全域數(shù)據(jù)庫。ETL[6]服務管理系統(tǒng)是學校內部各類數(shù)據(jù)庫之間的抽取、轉換和加載過程的數(shù)據(jù)調度平臺,實現(xiàn)全域數(shù)據(jù)庫與各應用系統(tǒng)之間、全域數(shù)據(jù)庫與主題數(shù)據(jù)庫之間的數(shù)據(jù)抽取、轉換與加載服務。
(4)應用層
應用層是公共數(shù)據(jù)平臺業(yè)務應用與公共信息服務實現(xiàn)的核心,依據(jù)不同的業(yè)務特征、技術特性,公共數(shù)據(jù)平臺基于JavaEE平臺,采用B/S模式進行構建。應用層實現(xiàn)了基于主題數(shù)據(jù)庫的各類上層應用,包括業(yè)務應用與公共信息服務兩部分內容。其中,業(yè)務應用包括綜合查詢、主題分析和統(tǒng)計報表;在業(yè)務應用基礎上,將綜合查詢、主題分析和報表統(tǒng)計提供的各類信息服務相互關聯(lián)、匹配組合,形成面向管理者、教師、學生和校友的綜合信息視圖,構建公共數(shù)據(jù)平臺的公共信息服務。
(5)展現(xiàn)層
展現(xiàn)層是公共數(shù)據(jù)平臺與學校用戶交互的主要橋梁,是總體架構中實現(xiàn)用戶交互體驗和信息展現(xiàn)的關鍵支撐,主要完成平臺與用戶之間的各種互動,是整個公共數(shù)據(jù)平臺對外的窗口。通過提供界面交互框架以及多種類型的訪問渠道,展現(xiàn)層實現(xiàn)了公共數(shù)據(jù)平臺的對外服務、信息采集以及內部管理。展現(xiàn)層主要包括學校管理者、教師、學生、校友等五類應用桌面。
(6)保障環(huán)境
標準規(guī)范體系是支撐技術、管理等方面的標準和規(guī)范,除了貫徹國家、教育行業(yè)和學校的已有標準外,更多的是制定公共數(shù)據(jù)平臺建設的數(shù)據(jù)標準、數(shù)據(jù)交換標準、技術規(guī)范、項目管理規(guī)范;安全保障體系涉及信息化建設各個層面,為整個平臺提供鑒別、訪問控制、防入侵、防攻擊、防篡改、抗抵賴和數(shù)據(jù)機密性、完整性、可用性、可控性等安全服務,形成集防護、檢測、響應、恢復于一體的安全保障體系,實現(xiàn)網(wǎng)絡安全、系統(tǒng)安全、數(shù)據(jù)安全及應用安全,以滿足整個平臺各層次的安全需求;基于ITIL和ISO2000的運行維護理念,對平臺進行全面而集中的管理,實現(xiàn)對學校各級部門的統(tǒng)一協(xié)調管理,提供高效率、高質量、低成本的IT服務。
1.元數(shù)據(jù)庫
元數(shù)據(jù)庫實現(xiàn)對全域數(shù)據(jù)庫和主題數(shù)據(jù)庫所涉及的元數(shù)據(jù)的整體管理,使元數(shù)據(jù)管理趨于標準化、規(guī)范化和工具化,并提供通過網(wǎng)絡對元數(shù)據(jù)進行查詢檢索的方法或途徑,幫助用戶了解數(shù)據(jù),對數(shù)據(jù)是否滿足數(shù)據(jù)綜合應用需求作出正確的判斷。元數(shù)據(jù)庫建設主要包括中心元數(shù)據(jù)、主題元數(shù)據(jù)、交換元數(shù)據(jù)。中心元數(shù)據(jù)是元數(shù)據(jù)庫的主要建設內容,它是一個以業(yè)務需求為導向、在學校信息化應用實踐中持續(xù)改進和不斷完善的過程。中心元數(shù)據(jù)的建設過程如圖2所示:
圖2 中心元數(shù)據(jù)的建設過程
在中心元數(shù)據(jù)建設時,要首先確定核心的編碼規(guī)則模型,然后在編碼規(guī)則模型的指導下,建立相應的指標庫、統(tǒng)一分類編碼庫和基礎分類庫。
主題元數(shù)據(jù)包含主題數(shù)據(jù)和相關技術標準的信息,主要涵蓋主題數(shù)據(jù)的信息屬性、數(shù)據(jù)結構、流程控制等描述信息;交換元數(shù)據(jù)描述數(shù)據(jù)交換處理的一系列標準、數(shù)據(jù)交換處理過程、數(shù)據(jù)交換處理邏輯、執(zhí)行角色等信息。
2.數(shù)據(jù)共享與交換
為了實現(xiàn)學校各業(yè)務系統(tǒng)間的互通互聯(lián),解決信息孤島和信息流通問題,需要建立數(shù)據(jù)共享與交換機制。所有業(yè)務系統(tǒng)數(shù)據(jù)統(tǒng)稱為數(shù)據(jù)源,公共數(shù)據(jù)庫是所有共享數(shù)據(jù)及綜合分析應用數(shù)據(jù)的資源池,所有業(yè)務系統(tǒng)的共享數(shù)據(jù)以及綜合分析應用數(shù)據(jù)在這里匯聚、集成。公共數(shù)據(jù)庫從數(shù)據(jù)源集成數(shù)據(jù)并保持更新同步,成為各個業(yè)務系統(tǒng)之間的數(shù)據(jù)共享與交換通道。公共數(shù)據(jù)庫通過數(shù)據(jù)集成工具從數(shù)據(jù)源的各個業(yè)務系統(tǒng)數(shù)據(jù)庫中抽取數(shù)據(jù),并根據(jù)數(shù)據(jù)類型進行分類存儲。數(shù)據(jù)集成過程可以定義為兩種方式,數(shù)據(jù)訪問服務集成和數(shù)據(jù)抽取集成。
數(shù)據(jù)訪問服務集成方式主要通過數(shù)據(jù)訪問服務系統(tǒng)、元數(shù)據(jù)庫管理系統(tǒng)并結合數(shù)據(jù)訪問服務定制功能,定制發(fā)布數(shù)據(jù)訪問服務,各業(yè)務系統(tǒng)通過調用生成的數(shù)據(jù)訪問服務客戶端,實現(xiàn)數(shù)據(jù)的集成,它應用于實時性要求較高且有條件、有能力進行服務包裝改造的業(yè)務應用。
數(shù)據(jù)抽取集成方式通過在各業(yè)務系統(tǒng)中建立觸發(fā)器和中間表,根據(jù)交換數(shù)據(jù)的內容和獲取的時限要求,采用ETL服務管理系統(tǒng),制訂數(shù)據(jù)抽取調度計劃,完成共享數(shù)據(jù)的抽取,最后對抽取的數(shù)據(jù)進行清洗和轉換,完成數(shù)據(jù)的集成,它應用于實時性要求不高或無條件、無能力進行服務包裝改造的業(yè)務應用。數(shù)據(jù)訪問服務接口方式可以用于實時或定時的場合,數(shù)據(jù)抽取方式只能用于定時的場合。
數(shù)據(jù)綜合服務是基于公共數(shù)據(jù)庫之上構建的信息綜合應用,通過構建學校數(shù)據(jù)綜合分析應用環(huán)境,創(chuàng)建數(shù)據(jù)間的有機聯(lián)系,針對學校的教學、科研、管理等公共信息進行綜合分析、深度鉆取,建立多角度的分析體系,增強學校管理的針對性,為學校綜合管理提供決策支持。按照以上原則和目標,確定綜合查詢、主題分析、統(tǒng)計報表三個方向,以及在此之上建立公共信息服務。數(shù)據(jù)綜合應用系統(tǒng)的功能結構如圖3所示。
圖3 數(shù)據(jù)綜合應用系統(tǒng)的功能結構
現(xiàn)以主題分析為例,實現(xiàn)了某教學部系科研成果數(shù)量的統(tǒng)計功能,對成果類型、年度和論文等級3個維度進行了分析,維度在數(shù)據(jù)倉庫中主要對指標進行過濾和為重新組織提供指導,可以將用戶對實時的查詢結果按照維度指標進行篩選,只允許與維度指標相關的數(shù)據(jù)返回給用戶,由主題元數(shù)據(jù)實現(xiàn)維度維護的描述片段如圖4所示。
圖4 維度維護的描述片段
實現(xiàn)效果如圖5所示,在每個指標上建立了擴展連接,鉆取后可查看數(shù)據(jù)明細,對于主題分析的結果展現(xiàn)形式可以進行自定義,提供了二維、三維圖形展現(xiàn)。
圖5 科研成果數(shù)量統(tǒng)計
本文提出的基于SOA的校園公共數(shù)據(jù)平臺,整合了學校各業(yè)務系統(tǒng)的數(shù)據(jù)共享需求,以建立數(shù)據(jù)統(tǒng)一標準為基礎,實現(xiàn)了各系統(tǒng)間的信息交換和共享,構建了滿足學校教學、科研、管理要求的開放性、協(xié)同化的綜合信息服務環(huán)境,為學校各類人員提供了基于全校信息視圖的數(shù)據(jù)綜合應用服務,最終實現(xiàn)了互聯(lián)互通、資源共享。公共數(shù)據(jù)平臺已在學院成功部署并順利運行,強力推動了學院信息化建設的可持續(xù)發(fā)展。以物聯(lián)網(wǎng)理論為基礎打造“教育云”,實現(xiàn)新型智慧校園,將是我們下一步工作目標。
[1]陸鑫,周明天.數(shù)字化校園統(tǒng)一應用支撐平臺系統(tǒng)研究與設計[J].計算機應用研究,2007(12):279-281.
[2]陶祥亞,胡建華.高校信息資源建設中“孤島現(xiàn)象”的研究[J].中國教育信息化,2007(9):49-51.
[3]Patrick F Carey,Bernard W Gleason.Solving the integration issue-service-oriented architecture[EB/OL]. http://www.zdnet.co.uk/tsearch/Service-Oriented+Architecture.htm,F(xiàn)eb.2006.
[4]趙會群,孫晶.一種SOA軟件系統(tǒng)可信性評價方法研究[J].計算機學報,2010(11):2202-2210.
[5]汪清明.基于SOA的ERP系統(tǒng)體系結構的研究[J].計算機應用,2007(2):413-414.
[6]張寧,賈自艷,史忠植.數(shù)據(jù)倉庫中ETL技術的研究[J].計算機工程與應用,2002(4):213-215.
(編輯:王天鵬)
TP39
A
1673-8454(2016)01-0071-04