文/吳希忠
當(dāng)前高校的信息化已經(jīng)進(jìn)入了一個全新的建設(shè)周期。“十三五”期間,全國大部分高校主要圍繞IT基礎(chǔ)設(shè)施、各類業(yè)務(wù)應(yīng)用系統(tǒng)以及以服務(wù)為核心的校內(nèi)各服務(wù)平臺進(jìn)行建設(shè)。隨著大數(shù)據(jù)時代的來臨,各高校將圍繞相關(guān)維度的數(shù)據(jù)采集及其應(yīng)用來開展信息化建設(shè),需要運用綜合數(shù)據(jù)分析技術(shù)、輔助決策技術(shù)等構(gòu)建圍繞數(shù)據(jù)分析與服務(wù)的解決方案。
華東政法大學(xué)數(shù)字化校園、統(tǒng)一身份認(rèn)證、一站式項目已經(jīng)相當(dāng)完善,各部門的系統(tǒng)包括人事系統(tǒng)、教務(wù)系統(tǒng)、學(xué)工系統(tǒng)、研究生系統(tǒng)、科研系統(tǒng)、財務(wù)系統(tǒng)、資產(chǎn)系統(tǒng)、迎新系統(tǒng)、就業(yè)系統(tǒng)、圖書系統(tǒng)、一卡通等已經(jīng)運行多年,積累了大量的原始數(shù)據(jù),但各部門的系統(tǒng)是各自獨立的,系統(tǒng)之間沒有統(tǒng)一的標(biāo)準(zhǔn),相互沒有聯(lián)系,整個學(xué)校的數(shù)據(jù)散落在各系統(tǒng)中,形成了一個個“信息孤島”。如何打破信息孤島,使各系統(tǒng)的信息形成一個整體是迫在眉睫也是十分有價值的事情。
本項目將在數(shù)字化校園的基礎(chǔ)上,制定數(shù)據(jù)標(biāo)準(zhǔn),建立共享數(shù)據(jù)庫,實現(xiàn)各部門之間的信息互動、共享和有效協(xié)同,并在統(tǒng)一的標(biāo)準(zhǔn)和共享庫的基礎(chǔ)上,根據(jù)學(xué)校需求,進(jìn)行師生數(shù)據(jù)的主題分析和統(tǒng)計,并以更直觀的圖形化的方式進(jìn)行展現(xiàn),進(jìn)一步滿足學(xué)校對數(shù)據(jù)分析決策的需求。
項目計劃分一年半進(jìn)行建設(shè),首先制定出華東政法大學(xué)信息標(biāo)準(zhǔn),建成共享庫,其次維護(hù)并完善各部門數(shù)據(jù),提高共享庫數(shù)據(jù)的規(guī)范性、正確性和完整性,最后運用決策分析工具,以直觀圖表的方式把師生各維度的統(tǒng)計分析結(jié)果展現(xiàn)出來。
在進(jìn)行數(shù)據(jù)分析之前,為了保證數(shù)據(jù)質(zhì)量,需要制訂學(xué)校的信息標(biāo)準(zhǔn);為了數(shù)據(jù)查詢統(tǒng)計提供數(shù)據(jù)源,需要將未集成的業(yè)務(wù)系統(tǒng)集成到公共數(shù)據(jù)平臺;之后按照制定的數(shù)據(jù)標(biāo)準(zhǔn),對數(shù)據(jù)進(jìn)行清洗,并同步到共享庫中,為后續(xù)的數(shù)據(jù)分析夯實基礎(chǔ)。
信息標(biāo)準(zhǔn)以國標(biāo)、部標(biāo)、行標(biāo)、校標(biāo)為基礎(chǔ),結(jié)合校內(nèi)實際業(yè)務(wù)情況,充分考慮后期信息化改造需要,制訂完善的信息標(biāo)準(zhǔn),使之符合最新的技術(shù)規(guī)范和業(yè)務(wù)需求,形成信息標(biāo)準(zhǔn)文檔。
本項目將對人事、教務(wù)、學(xué)工、研究生、科研、財務(wù)、資產(chǎn)、迎新、就業(yè)、圖書、一卡通等的數(shù)據(jù)進(jìn)行抽取、清洗、轉(zhuǎn)換和加載,將各部分業(yè)務(wù)數(shù)據(jù)同步集成到共享庫中,完成數(shù)據(jù)的集成和共享交換。
共享庫的數(shù)據(jù)來源,均來自學(xué)校的各業(yè)務(wù)系統(tǒng),對于暫無業(yè)務(wù)系統(tǒng)支撐的信息和業(yè)務(wù)部門認(rèn)為不適合共享的信息目前暫不集成和處理;數(shù)據(jù)平臺建成后,為保證數(shù)據(jù)的唯一性和正確性,各業(yè)務(wù)部門應(yīng)明確數(shù)據(jù)來源的管理維護(hù)責(zé)任人,以及時同步和更新到共享庫平臺。
以公共數(shù)據(jù)平臺為核心,結(jié)合制訂的信息標(biāo)準(zhǔn),對業(yè)務(wù)數(shù)據(jù)進(jìn)行分析和檢查,找出數(shù)據(jù)質(zhì)量隱患和存在問題,對質(zhì)量不高的數(shù)據(jù)和無效數(shù)據(jù)進(jìn)行清洗和優(yōu)化,保證現(xiàn)有業(yè)務(wù)數(shù)據(jù)的高質(zhì)量,為后期進(jìn)行數(shù)據(jù)展現(xiàn)及分析應(yīng)用奠定基礎(chǔ)。針對學(xué)?,F(xiàn)有數(shù)據(jù)的梳理,按照以下步驟來進(jìn)行:
(1)結(jié)合學(xué)?,F(xiàn)有業(yè)務(wù)系統(tǒng),梳理分析學(xué)校有哪些數(shù)據(jù),借助元數(shù)據(jù)管理工具,實現(xiàn)學(xué)校業(yè)務(wù)系統(tǒng)數(shù)據(jù)的語義清晰可查;
(2)在業(yè)務(wù)系統(tǒng)范圍明確的情況下,梳理分析這些數(shù)據(jù)的具體流向,從哪兒來、到哪兒去,誰是數(shù)據(jù)的生產(chǎn)者、誰是數(shù)據(jù)的消費者;梳理的過程需要借助數(shù)據(jù)流向規(guī)劃工具和IPO(輸入-處理-輸出)調(diào)研工具;
(3)在數(shù)據(jù)范圍、數(shù)據(jù)流向明確的前提下,需要考慮代碼標(biāo)準(zhǔn)如何規(guī)范統(tǒng)一;借助代碼標(biāo)準(zhǔn)管理工具,滿足代碼標(biāo)準(zhǔn)的日常維護(hù)管理,并及時監(jiān)測各相關(guān)業(yè)務(wù)系統(tǒng)的代碼標(biāo)準(zhǔn)使用情況,推動標(biāo)準(zhǔn)化管理;對于國標(biāo)、部標(biāo),通常集中在代碼標(biāo)準(zhǔn)管理工具中進(jìn)行管理;對于校標(biāo),有兩種可能的管理方式。①同樣集中在代碼標(biāo)準(zhǔn)管理工具中進(jìn)行管理、各業(yè)務(wù)系統(tǒng)進(jìn)行使用;②分散在各自的業(yè)務(wù)系統(tǒng)中獨立管理、集成到學(xué)校主數(shù)據(jù)代碼庫之后再分發(fā)到各業(yè)務(wù)系統(tǒng)使用。
(4)有了統(tǒng)一的代碼標(biāo)準(zhǔn),下一步則需要開始數(shù)據(jù)抽取、清洗、轉(zhuǎn)換的工作。對于國標(biāo)、部標(biāo)的部分,將業(yè)務(wù)系統(tǒng)中存儲的代碼抽取到共享庫中,進(jìn)行語義的轉(zhuǎn)換,并與代碼標(biāo)準(zhǔn)進(jìn)行比對,對不一致的數(shù)據(jù)進(jìn)行清洗,轉(zhuǎn)換,并存儲;對于校標(biāo)的部分,分為兩類:公共部分,也就是多個業(yè)務(wù)部門都使用的數(shù)據(jù),根據(jù)數(shù)據(jù)流向規(guī)劃制定的源頭,作為代碼標(biāo)準(zhǔn),并對其他與之不一致的數(shù)據(jù)進(jìn)行清洗;對單個業(yè)務(wù)系統(tǒng)使用的數(shù)據(jù),直接抽取到共享庫中。
(5)最后一步,也是數(shù)據(jù)梳理過程中最為關(guān)鍵的一個環(huán)節(jié),進(jìn)行運維監(jiān)控,加強(qiáng)數(shù)據(jù)質(zhì)量監(jiān)督、避免只采不監(jiān)督,繼而推進(jìn)業(yè)務(wù)系統(tǒng)提高源頭數(shù)據(jù)質(zhì)量。
師生個人數(shù)據(jù)平臺包括數(shù)據(jù)整合和數(shù)據(jù)展現(xiàn):
4.1.1 數(shù)據(jù)整合
將校內(nèi)與學(xué)生、教師相關(guān)的數(shù)據(jù)進(jìn)行整合。數(shù)據(jù)平臺目前擬整合的數(shù)據(jù)包括:師生基本信息、學(xué)生類其他信息(招生信息、培訓(xùn)信息、專業(yè)信息、培養(yǎng)計劃/培養(yǎng)方案、課程信息、學(xué)籍異動信息、成績信息、等級考試信息、獎懲助貸信息、保險理賠信息、貸款還款信息、宿舍信息、就業(yè)信息、一卡通消費信息、財務(wù)信息)、教師類其他信息(國內(nèi)外學(xué)習(xí)進(jìn)修信息、獎懲信息、變遷離校信息、離退休信息、返聘信息、科研項目經(jīng)費信息、教務(wù)教學(xué)信息、財務(wù)工資信息、一卡通信息)、圖書借閱信息、資產(chǎn)信息、師生健康狀況信息、校友基本信息、校友捐贈及活動信息。
4.1.2 數(shù)據(jù)展現(xiàn)
當(dāng)用戶登錄系統(tǒng)后,系統(tǒng)自動根據(jù)用戶權(quán)限,將用戶的相關(guān)個人數(shù)據(jù)以表格的形式展現(xiàn)出來。
(1)學(xué)生個人數(shù)據(jù)平臺。學(xué)生個人數(shù)據(jù)平臺,可以查看學(xué)生個人的基本信息、學(xué)籍信息、成績信息、獎懲助貸信息、異動信息、一卡通消費信息、財務(wù)信息等。
(2)教師個人數(shù)據(jù)平臺。教師個人數(shù)據(jù)平臺,可以查看教師個人的基本信息、學(xué)習(xí)進(jìn)修信息、獎懲信息、科研信息、教務(wù)教學(xué)信息、財務(wù)信息、資產(chǎn)信息、一卡通信息等。
本功能提供給部門領(lǐng)導(dǎo)、學(xué)院領(lǐng)導(dǎo)或校領(lǐng)導(dǎo)查詢使用,可以看到權(quán)限范圍內(nèi)(本部門或本校)所有師生的個人信息。
4.2.1 學(xué)生信息查詢
查詢條件為:年級、院系、專業(yè)、學(xué)生類別(研究生、本科生)、學(xué)號、姓名、性別、民族、政治面貌、生源地、是否在校、是否在籍等。
4.2.2 教師信息查詢
查詢條件為:學(xué)院、部門、工號、性別、職稱、入職年份、民族、學(xué)歷、編制情況、政治面貌、在職狀態(tài)等。
主題統(tǒng)計分析實現(xiàn)不同業(yè)務(wù)維度和方向的主題分析展現(xiàn)和輔助決策。主題分析需要有業(yè)務(wù)系統(tǒng)和業(yè)務(wù)數(shù)據(jù)支撐,且有明確的數(shù)據(jù)來源。
確定分析主題:
本項目主要包含學(xué)生、教師、一卡通消費、財務(wù)幾大類等分析主題。所有的數(shù)據(jù)來源均來自于共享數(shù)據(jù)庫,以圖、表兩種形式展示,并可下鉆到數(shù)據(jù)明細(xì)。具體的描述如下:
學(xué)生主題主要有總體、迎新、就業(yè)、學(xué)習(xí)成績、學(xué)籍異動等情況,維度包含年度、學(xué)生類別、院系、年級、生源地、性別、政治面貌等。
教師主題主要有教師分布、科研、教學(xué)等情況,維度包含職稱、學(xué)歷、院系、年齡段、性別、政治面貌等。
一卡通主題主要有學(xué)生個人消費、上網(wǎng)時間、借書等情況,維度包含人均消費、消費類型、上網(wǎng)時間、借書總數(shù)等。
財務(wù)主題主要有薪酬分析、項目經(jīng)費分析等,維度包含、院系、工齡、崗位、項目類別等。
圖1
數(shù)據(jù)庫服務(wù)器:IBM3650服務(wù)器兩臺,交換機(jī)兩臺,部署Oracle Rac架構(gòu)應(yīng)用服務(wù)器:虛擬機(jī)兩臺,一臺部署數(shù)據(jù)分析應(yīng)用服務(wù)器,一臺部署ODI數(shù)據(jù)交換應(yīng)用平臺系統(tǒng)拓?fù)鋱D如圖1。
數(shù)據(jù)庫操作系統(tǒng)采用Oracle Linux Release6.7x64,數(shù)據(jù)庫Oracle11.2.0.4,應(yīng)用服務(wù)器操作系統(tǒng)安裝Windows server2008,中間件安裝tomcat-7.0.72、JDK1.8。
華東政法大學(xué)大數(shù)據(jù)主題分析項目的建設(shè),提高了校園各業(yè)務(wù)系統(tǒng)數(shù)據(jù)的規(guī)范性、正確性和及時性,打通了各業(yè)務(wù)系統(tǒng)之間的壁壘,為全校師生查詢相關(guān)信息提供了簡捷的方式,主題分析展現(xiàn)的統(tǒng)計分析結(jié)果為學(xué)校領(lǐng)導(dǎo)決策提供了科學(xué)的依據(jù)。