余 鵬 李 艷 呂 鵬
?
高等院校大數(shù)據(jù)挖掘與決策分析體系的應(yīng)用研究
余 鵬1李 艷2【通訊作者】呂 鵬3
(1.中南民族大學(xué)現(xiàn)代教育技術(shù)中心,湖北武漢 430074;2.中國科學(xué)院武漢文獻情報中心湖北武漢 430071;3.中南民族大學(xué)圖書館湖北武漢 430074)
文章從我國高等院?!笆濉逼陂g信息化建設(shè)的情況入手,探討了高等院校大數(shù)據(jù)研究及發(fā)展的趨勢,分析了大數(shù)據(jù)挖掘與決策分析體系建設(shè)的意義,并就該體系在高等院校信息化建設(shè)中的發(fā)展方向展開了討論。文章設(shè)計了高等院校大數(shù)據(jù)挖掘與決策分析體系架構(gòu)及流程,提出了一種新穎的“大數(shù)據(jù)+微服務(wù)”模式。結(jié)合該體系在高等院校未來信息化建設(shè)中多個典型應(yīng)用場景的分析,可為高等院校信息化發(fā)展提供個性化服務(wù)保障,同時為高等院校的決策者進行科學(xué)決策提供依據(jù)。
高等院校;大數(shù)據(jù)挖掘與決策分析體系;微服務(wù);個性化服務(wù)
當(dāng)前,大數(shù)據(jù)承載著海量、高增長率和多樣化的信息特點。面對數(shù)據(jù)的大幅膨脹和積累,高等院校如何更好地利用數(shù)據(jù)源信息,深入挖掘數(shù)據(jù)間的關(guān)聯(lián)性和交互性,大幅釋放出數(shù)據(jù)紅利,為決策者提供更為強大的決策力、洞察力以及管理的效率、手段、流程等方面的優(yōu)化能力,將是高等院校信息化人員、管理人員和業(yè)務(wù)人員需要進一步研究的課題。教育部在2012年發(fā)布的《教育信息化十年發(fā)展規(guī)劃》中提出:智慧教育發(fā)展的目標(biāo)是依托新一代信息技術(shù),尊重學(xué)習(xí)者的個性化與多元化的發(fā)展需要,創(chuàng)建智能化的教育環(huán)境,推動信息時代“教與學(xué)”的變革,以最有效的方式促進學(xué)習(xí)者的知識構(gòu)建與智慧發(fā)展。高等院校應(yīng)抓住機遇,努力挖掘校園大數(shù)據(jù)的價值,以大數(shù)據(jù)驅(qū)動自身發(fā)展、推動智慧校園建設(shè),從而挖掘人才創(chuàng)新力,輔助管理者進行決策。大數(shù)據(jù)輔以“云平臺+云計算”技術(shù),為新時期的教育信息化建設(shè)帶來了新思路。同時,云計算技術(shù)的快速發(fā)展,也成功掃清了大數(shù)據(jù)技術(shù)面臨的數(shù)據(jù)處理和存儲瓶頸等相關(guān)問題。大數(shù)據(jù)挖掘與決策分析體系(下文簡稱“體系”)的建立,將可以大幅縮小高等院校各類業(yè)務(wù)系統(tǒng)之間的信息孤島與數(shù)字鴻溝,為不同規(guī)模、不同結(jié)構(gòu)的數(shù)據(jù)構(gòu)建統(tǒng)一的分布式管理、分布式計算體系提供保障。
1 高等院校大數(shù)據(jù)研究發(fā)展的趨勢及體系建設(shè)的意義
據(jù)調(diào)查顯示,“十二五”期間,我國大部分高等院校正在建設(shè)或已經(jīng)完成一輪甚至是幾輪信息化系統(tǒng)的建設(shè)[1]。信息化建設(shè)除了實現(xiàn)各類業(yè)務(wù)系統(tǒng)的模塊、規(guī)范業(yè)務(wù)的操作流程等功能,本研究認(rèn)為最重要的一項工作應(yīng)是各類業(yè)務(wù)系統(tǒng)的數(shù)據(jù)累積、數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范管理(即數(shù)據(jù)字典的統(tǒng)一與規(guī)范)、業(yè)務(wù)數(shù)據(jù)交換平臺的構(gòu)建。各類信息化系統(tǒng)除了實現(xiàn)自身的業(yè)務(wù)流程,理應(yīng)最大地程度克服“數(shù)據(jù)孤島”,構(gòu)建一種“既分工、又合作”的關(guān)系。同時,通過構(gòu)建標(biāo)準(zhǔn)的數(shù)據(jù)接口和數(shù)據(jù)字典,依托ODI、LDAP等方式,實現(xiàn)最大化的數(shù)據(jù)交換與共享。截至2015年底,中央財經(jīng)大學(xué)數(shù)據(jù)資源以每年30~50%的速度在增長;北京師范大學(xué)教務(wù)管理信息系統(tǒng)數(shù)據(jù)達到500~600G,校園卡系統(tǒng)日記數(shù)據(jù)達到1~2TB,校園網(wǎng)日記數(shù)據(jù)大約為1TB。2015年5月,清華大學(xué)的業(yè)務(wù)系統(tǒng)記錄條數(shù)已達到3億條;其中,門禁系統(tǒng)每天以10萬條的速度增長;結(jié)構(gòu)化數(shù)據(jù)高達1.3T,非結(jié)構(gòu)化數(shù)據(jù)更是積累至14T的規(guī)模[2]。高等院校數(shù)據(jù)庫里的內(nèi)容不僅豐富,而且結(jié)構(gòu)已經(jīng)發(fā)生了很大的改變,即大量的數(shù)據(jù)由過去的結(jié)構(gòu)化數(shù)據(jù)占主導(dǎo)發(fā)展為非結(jié)構(gòu)化數(shù)據(jù)占主導(dǎo)。據(jù)統(tǒng)計,全球結(jié)構(gòu)化數(shù)據(jù)增長速度約為32%,而非結(jié)構(gòu)化數(shù)據(jù)增速高達63%——這個趨勢在高等院校亦然[1]。針對國內(nèi)高等院校日益龐大的數(shù)據(jù)積累,如何提高信息的利用率,使得數(shù)據(jù)逐步轉(zhuǎn)化為潛在的知識服務(wù),并輔助業(yè)務(wù)部門和決策者做出合理的決策,將成為“十三五”期間高等院校信息化建設(shè)和發(fā)展的重點課題。
“十三五”元年,諸如清華大學(xué)、上海交通大學(xué)、復(fù)旦大學(xué)、武漢大學(xué)、中國地質(zhì)大學(xué)(武漢)、華中農(nóng)業(yè)大學(xué)、中南民族大學(xué)、常熟理工學(xué)院等高等院校信息化建設(shè)的主要工作,已轉(zhuǎn)到“智慧校園驅(qū)動個性化服務(wù)”、“高等院校大數(shù)據(jù)挖掘、決策與分析驅(qū)動知識服務(wù)”的建設(shè)上。高等院校建設(shè)大數(shù)據(jù)挖掘及決策分析體系的目標(biāo)在于:緊密圍繞自身發(fā)展的需求,以促進智慧校園創(chuàng)新應(yīng)用、釋放數(shù)據(jù)紅利為核心;輔助提升學(xué)校治理能力,以推進學(xué)校治理體系現(xiàn)代化為契機;構(gòu)建大數(shù)據(jù)生態(tài)體系,輔助提升網(wǎng)絡(luò)和信息安全保障能力;完善大數(shù)據(jù)發(fā)展的政策環(huán)境,加快實施大數(shù)據(jù)發(fā)展戰(zhàn)略。也就是說,要強化各級管理的數(shù)據(jù)意識,不斷輔助提升精確的數(shù)據(jù)意識,讓決策者從拍腦門到“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新[2]”。
2 高等院校體系建設(shè)的基礎(chǔ)及發(fā)展方向
高等院校體系建設(shè)將是一項長期且持續(xù)化投入的工程,而信息化建設(shè)過程中數(shù)據(jù)的積累與再利用是體系運轉(zhuǎn)的軸心。當(dāng)前,高等院校在完善和優(yōu)化各級業(yè)務(wù)系統(tǒng)功能、厘清各級業(yè)務(wù)流程、不斷構(gòu)筑數(shù)據(jù)中心虛擬化云支撐平臺的同時,更應(yīng)不斷完善“整合大數(shù)據(jù)業(yè)務(wù)及微服務(wù)滲透”、“以學(xué)促建加速關(guān)鍵技術(shù)的發(fā)展”、“實現(xiàn)高等院校的科學(xué)化管理與智能化決策”的工作流,以實現(xiàn)未來高等院校信息化建設(shè)的發(fā)展目標(biāo)[3]。
(1)整合大數(shù)據(jù)業(yè)務(wù)及微服務(wù)滲透
①需要統(tǒng)籌規(guī)劃大數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)。具體包括:統(tǒng)籌校園各類業(yè)務(wù)的數(shù)據(jù)資源和社會大數(shù)據(jù)資源,加強與社會大數(shù)據(jù)的匯聚整合和關(guān)聯(lián)分析;充分利用現(xiàn)有數(shù)據(jù)資源和基礎(chǔ)設(shè)施平臺,統(tǒng)籌建立低成本、高效率的大數(shù)據(jù)基礎(chǔ)設(shè)施和行業(yè)性數(shù)據(jù)匯聚平臺。
②信息化部門應(yīng)在相關(guān)校領(lǐng)導(dǎo)的支持下,構(gòu)建以校領(lǐng)導(dǎo)為核心,以多業(yè)務(wù)部門處級領(lǐng)導(dǎo)為成員的信息化建設(shè)小組。該小組的成立,旨在以信息化技術(shù)推動校園全面發(fā)展為業(yè)績考核目標(biāo),不斷推動業(yè)務(wù)部門的數(shù)據(jù)共享:統(tǒng)籌規(guī)劃跨部門的數(shù)據(jù)共享工作,加強頂層設(shè)計,明確各部門數(shù)據(jù)共享的范圍、邊界和使用方式,厘清各部門數(shù)據(jù)管理及共享的義務(wù)和權(quán)力;建立統(tǒng)一的數(shù)據(jù)交換接口及標(biāo)準(zhǔn),加強信息系統(tǒng)的統(tǒng)籌共建,推進系統(tǒng)間信息共享。
③以“微服務(wù)”作為應(yīng)用手段,不斷滲透至各級業(yè)務(wù),依托數(shù)據(jù)交換平臺及大數(shù)據(jù)挖掘與分析平臺,輔助“微終端”(如微信、APP應(yīng)用、釘釘?shù)纫苿咏K端技術(shù))實現(xiàn)個性化業(yè)務(wù)的展示與交互。
(2)以學(xué)促建加速關(guān)鍵技術(shù)的發(fā)展
①推進核心技術(shù)攻關(guān)。即開展大數(shù)據(jù)基礎(chǔ)理論和關(guān)鍵技術(shù)研究,圍繞大數(shù)據(jù)全生命周期管理,攻關(guān)大數(shù)據(jù)分析技術(shù),突破校園大數(shù)據(jù)建模方法、非結(jié)構(gòu)化數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)安全與隱私保護等技術(shù),提升大數(shù)據(jù)管理能力、分析處理能力、知識發(fā)現(xiàn)能力和輔助決策能力。
②形成大數(shù)據(jù)產(chǎn)品體系。即圍繞數(shù)據(jù)采集、數(shù)據(jù)整理、分析挖掘、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)應(yīng)用等環(huán)節(jié),研發(fā)大數(shù)據(jù)管理軟件、大數(shù)據(jù)分析挖掘軟件、數(shù)據(jù)可視化軟件、硬件支撐平臺等產(chǎn)品,打造健全的大數(shù)據(jù)技術(shù)產(chǎn)品體系,形成與傳統(tǒng)產(chǎn)業(yè)業(yè)務(wù)流程深度融合的大數(shù)據(jù)解決方案。
③構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)生態(tài)體系。即整合企業(yè)、科研院所、產(chǎn)業(yè)聯(lián)盟等創(chuàng)新資源,組建大數(shù)據(jù)開源社區(qū)、產(chǎn)業(yè)聯(lián)盟,促進協(xié)同創(chuàng)新,加速大數(shù)據(jù)應(yīng)用普及。
(3)實現(xiàn)高等院校的科學(xué)化管理與智能化決策
體系的建立對決策者的意義在于:①輔助事前預(yù)測;②輔助事中感知;③輔助事后反饋。在大數(shù)據(jù)中“沙里淘金”,貫穿于事件的起因、經(jīng)過和結(jié)果三個重要階段,為決策者提供了客觀、準(zhǔn)確的策略來實現(xiàn)目標(biāo)的制定,讓決策者能夠更好地了解并把握政策的實施情況,從而更好地根據(jù)反饋情況,優(yōu)化、改進政策方案,增進政策的執(zhí)行力,讓政策更有活力、效力[4]。
圖1 大數(shù)據(jù)輔助高等院校實現(xiàn)科學(xué)化的管理和智能化的決策模型
結(jié)合當(dāng)前高等院校建設(shè)發(fā)展的特點,體系的建立同樣能夠為高等院校今后的發(fā)展提供更加科學(xué)化的管理和智能化的決策。鑒于此,本研究構(gòu)建了大數(shù)據(jù)輔助高等院校實現(xiàn)科學(xué)化的管理和智能化的決策模型,如圖1所示。
①實現(xiàn)科學(xué)化的管理(不僅限于以下方面)。主要包括:培養(yǎng)計劃執(zhí)行預(yù)警(學(xué)生)、失聯(lián)與行為預(yù)警(學(xué)生、輔導(dǎo)員)、畢業(yè)資格審查預(yù)警(學(xué)生、管理老師)、項目經(jīng)費執(zhí)行預(yù)警(項目負(fù)責(zé)人)、學(xué)風(fēng)預(yù)警(高等院校)、就業(yè)發(fā)展?fàn)顩r預(yù)警(高等院校)。
②輔助智能化的決策(不僅限于以下方面)。主要包括:實現(xiàn)招生計劃決策支持、財務(wù)狀況與政策決策支持、師資隊伍發(fā)展?fàn)顩r與人才政策決策支持、科研發(fā)展?fàn)顩r與學(xué)科建設(shè)決策支持、教學(xué)評估狀況與人才培養(yǎng)模式?jīng)Q策支持。
1 體系的架構(gòu)和流程
高等院校大數(shù)據(jù)挖掘與決策分析體系的構(gòu)建,離不開數(shù)據(jù)中心虛擬化云平臺的建設(shè)[5],并需要依賴于各業(yè)務(wù)系統(tǒng)的數(shù)據(jù)積累及數(shù)據(jù)交換平臺的建設(shè)。如圖2所示,體系可由“大數(shù)據(jù)存儲交換平臺”、“外部數(shù)據(jù)挖掘平臺”、“大數(shù)據(jù)分析平臺”構(gòu)成。其中,“大數(shù)據(jù)存儲交換平臺”完成高等院校內(nèi)部各業(yè)務(wù)系統(tǒng)結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)集的存儲、交換、推送,實現(xiàn)異構(gòu)數(shù)據(jù)的統(tǒng)一化處理,其貫穿于整個系統(tǒng)建模與流程構(gòu)建,在數(shù)據(jù)的預(yù)處理階段為大數(shù)據(jù)分析過濾、多維度數(shù)據(jù)抽取、數(shù)據(jù)的高性能分布式存儲提供技術(shù)保障;“外部數(shù)據(jù)挖掘平臺”實現(xiàn)互聯(lián)網(wǎng)信息的抓取(爬蟲引擎)、關(guān)鍵字過濾及實時檢索、知識及語義分析、智能挖掘,為大數(shù)據(jù)存儲交換平臺的數(shù)據(jù)源做預(yù)處理,并提供標(biāo)準(zhǔn)化的外部數(shù)據(jù)接口;”;“大數(shù)據(jù)分析平臺主要依托校園虛擬化云平臺、云計算,實現(xiàn)對問題的抽取、建模、規(guī)則庫的定義和遞歸優(yōu)化,并實現(xiàn)數(shù)據(jù)的可視化統(tǒng)計與智能化分析,為管理、決策者提供可行性的決策依據(jù)。
圖2 高等院校大數(shù)據(jù)挖掘與決策分析體系架構(gòu)
依據(jù)前期研究,本研究將體系的建模流程定義為[6]:
Step A——多維度提取數(shù)據(jù)來源:從外部互聯(lián)網(wǎng)數(shù)據(jù)(直接裝載爬蟲引擎)和學(xué)校內(nèi)部數(shù)據(jù)(評估數(shù)據(jù)采集和對接方式)提??;
Step B——評估數(shù)據(jù)規(guī)模:根據(jù)規(guī)模大小,選擇合適的分布式并行計算應(yīng)用架構(gòu);
Step C——數(shù)據(jù)樣例分析:根據(jù)采樣的數(shù)據(jù)特點進行分類、重組、歸并;
Step D——根據(jù)實際需求確定建模方式:輿情監(jiān)控和分析(關(guān)鍵詞組合)、分類(選用合適的算法)、預(yù)測及輔助決策(需調(diào)整模型做大量嘗試,優(yōu)化模型,無限接近準(zhǔn)確結(jié)果);
Step E——根據(jù)需求確定輸出方式:或直接輸出分析報告,或提供SAAS平臺,或?qū)覦MP,或設(shè)計整體解決方案;
Step F——反復(fù)地進行迭代、優(yōu)化,建立最優(yōu)庫(這是一個長期過程,需要不斷進行模型匹配、機器分類、人工聚類):確立算法模型優(yōu)化、整合盡可能多的維度數(shù)據(jù)、提供多元的可視化方案。
2 以“大數(shù)據(jù)+微服務(wù)”模式驅(qū)動未來高等院校信息化發(fā)展的意義
當(dāng)前,信息化服務(wù)的對象正逐步從原有的“面”服務(wù)向“點”服務(wù)發(fā)展,而用戶的需求逐步趨向于定制化及個性化的發(fā)展[7],因此信息化服務(wù)模式轉(zhuǎn)變是未來“知識服務(wù)化”發(fā)展的必要趨勢?;诖?,本研究構(gòu)建了一種加快信息化服務(wù)轉(zhuǎn)型和衍生的手段——“大數(shù)據(jù)+微服務(wù)”模式,來驅(qū)動未來高等院校信息化的發(fā)展。
“微服務(wù)”的核心價值在于利用先進、穩(wěn)定的信息化技術(shù)手段,將龐大且復(fù)雜的業(yè)務(wù)服務(wù)流微小化,以構(gòu)建特點突出、個性鮮明的“微小”服務(wù)來貼近用戶的服務(wù)體驗。作為業(yè)務(wù)與服務(wù)的催化劑,“微服務(wù)”將各類業(yè)務(wù)數(shù)據(jù)與業(yè)務(wù)流進行深度融合,構(gòu)建起貼近用戶、便捷管理的知識服務(wù)體系?!拔⒎?wù)”依賴于微信、跨平臺APP應(yīng)用、釘釘?shù)纫苿咏K端的微應(yīng)用技術(shù),通過調(diào)用各類標(biāo)準(zhǔn)化的數(shù)據(jù)通信接口,并利用基于大數(shù)據(jù)的挖掘、分析決策平臺,實現(xiàn)復(fù)雜的多業(yè)務(wù)系統(tǒng)平臺異構(gòu)數(shù)據(jù)統(tǒng)一的處理;同時,通過抽取、清洗、挖掘、分析、整合等步驟,構(gòu)建基于高等院校特點的大數(shù)據(jù)挖掘與決策分析平臺,建立事件或業(yè)務(wù)流程模型,向用戶提供豐富的個性化資源數(shù)據(jù)和服務(wù)。
1 場景一:輔助學(xué)工部門實現(xiàn)“學(xué)生失聯(lián)與行為預(yù)警”
問題分析:“學(xué)生無故失聯(lián)”是輔導(dǎo)員最大的訴求問題之一。學(xué)生作為高等院校中的個體,存在于高等院校這個空間中,不可避免地會產(chǎn)生各種數(shù)據(jù)痕跡。學(xué)生失聯(lián)信息如何提前預(yù)警并及時獲知,可以依賴于大數(shù)據(jù)挖掘分析機制。
學(xué)生離不開吃飯、飲水、洗澡等消費,一卡通消費數(shù)據(jù)就是分析學(xué)生日常是否在校的第一個維度;學(xué)生來學(xué)校的主要工作就是上課,依賴于上課簽到系統(tǒng)日志數(shù)據(jù),從中提取學(xué)生的上課簽到信息,可作為分析學(xué)生日常是否在校的第二個維度;學(xué)生在宿舍生活,務(wù)必離不開對校園網(wǎng)的使用,從校園網(wǎng)認(rèn)證系統(tǒng)中提取學(xué)生的上網(wǎng)日志,可作為分析學(xué)生日常是否在校的第三個維度;學(xué)生進出宿舍,務(wù)必需要刷卡進行準(zhǔn)出和準(zhǔn)入操作,從一卡通門禁系統(tǒng)中提取學(xué)生的出入信息,可作為分析學(xué)生日常是否在校的第四個維度?;诖?,通過在高等院校數(shù)據(jù)中心構(gòu)建大數(shù)據(jù)存儲交換平臺,挖掘并分析學(xué)生一卡通消費數(shù)據(jù)、上課簽到系統(tǒng)日志數(shù)據(jù)、校園網(wǎng)上網(wǎng)日志數(shù)據(jù)、宿舍進出門禁日志數(shù)據(jù),然后從學(xué)校各個業(yè)務(wù)系統(tǒng)中抽取相關(guān)數(shù)據(jù)到大數(shù)據(jù)存儲及分析平臺,設(shè)計數(shù)據(jù)分析模型和預(yù)警策略,進行數(shù)據(jù)清洗和歸并,可以構(gòu)建學(xué)生失聯(lián)與行為預(yù)警機制分析模型,如圖3所示。該模型會及時將超過閾值的異常信息,借助短信、郵件、微信等微技術(shù)介質(zhì)推送給管理學(xué)生的輔導(dǎo)員,并在學(xué)工部門備案。失聯(lián)預(yù)警信息能夠呈現(xiàn)學(xué)生失聯(lián)的可能信息(如關(guān)聯(lián)學(xué)工系統(tǒng)請假記錄、在外租房記錄、校醫(yī)院就醫(yī)記錄等),以減輕輔導(dǎo)員線下核實信息的工作量,同時能夠輔助輔導(dǎo)員及時了解學(xué)生動向,為學(xué)生失聯(lián)與異常行為提供預(yù)警服務(wù),并為高等院校管理者做出及時且科學(xué)的決策提供依據(jù)。
2 場景二:輔助教學(xué)部門實現(xiàn)“大數(shù)據(jù)輔助教學(xué)評估”
問題分析:教學(xué)評估是高等院校被考核的必選動作之一,評估結(jié)果的好壞將直接影響高等院校未來的建設(shè)與發(fā)展。結(jié)構(gòu)化的數(shù)據(jù)依賴于關(guān)系數(shù)據(jù)庫,比較容易分析。面對教學(xué)評估中的一系列非結(jié)構(gòu)化數(shù)據(jù),如何進行有效的分析處理是評估的難點之一,往往會大量耗費工作人員的時間和精力來進行甄別和篩選。針對全文本結(jié)構(gòu)的非結(jié)構(gòu)化數(shù)據(jù)(如學(xué)生對教師的評價、學(xué)生對課程設(shè)置的建議等),如何準(zhǔn)確地抓取非結(jié)構(gòu)化數(shù)據(jù)中的有效信息,可以依賴于大數(shù)據(jù)挖掘分析機制。
如圖4所示,初始化評教文本數(shù)據(jù),首先將數(shù)據(jù)進行預(yù)分類,通過構(gòu)建非結(jié)構(gòu)化數(shù)據(jù)處理平臺,依托人工聚類分析法,搭建并不斷修訂模型規(guī)則匹配庫,將使評價中的非結(jié)構(gòu)化數(shù)據(jù)處理效率和效果成倍提升。
3 學(xué)生失聯(lián)與行為預(yù)警機制分析模型
圖4 大數(shù)據(jù)輔助教學(xué)評估分析模型
3 場景三:輔助招生部門實現(xiàn)“大數(shù)據(jù)輔助就業(yè)”
問題分析:當(dāng)前,高等院校人才培養(yǎng)與社會需求間的結(jié)構(gòu)性矛盾問題突出,一方面一批批大學(xué)生感慨就業(yè)難,另一方面眾多用人單位卻苦于招不到合適的人才。對于高等院校來說,輔助畢業(yè)生就業(yè)的手段十分有限,主要依賴于畢業(yè)前的就業(yè)指導(dǎo)、組織數(shù)量有限的校園招聘會和人才推薦等方式。高等院校的專業(yè)設(shè)置與目標(biāo)求職崗位關(guān)系復(fù)雜,部分行業(yè)的數(shù)據(jù)涉及多項參數(shù),難以用傳統(tǒng)的方法進行度量與處理;互聯(lián)網(wǎng)上的招聘數(shù)據(jù)量很龐大,且每天都在不斷增加。
大數(shù)據(jù)輔助就業(yè),具體表現(xiàn)為:通過對互聯(lián)網(wǎng)上與就業(yè)相關(guān)的網(wǎng)站數(shù)據(jù)進行抓取、清洗和整理后,導(dǎo)入到大數(shù)據(jù)存儲交換平臺和數(shù)據(jù)挖掘分析平臺,可以對互聯(lián)網(wǎng)上各類與就業(yè)相關(guān)的網(wǎng)站數(shù)據(jù)進行監(jiān)控;將用人單位的需求與校園內(nèi)的數(shù)據(jù)進行交叉對比(如學(xué)校專業(yè)分類數(shù)據(jù)、學(xué)生課程設(shè)置數(shù)據(jù)等),依據(jù)高等院校用戶的需求進行統(tǒng)計分析,可以為高等院校管理者與決策者提供大數(shù)據(jù)就業(yè)指導(dǎo)模型;方便學(xué)校查找待定地區(qū)、待定行業(yè)歷年的人才需求變化分析及行業(yè)未來走勢分析,并了解不同行業(yè)、不同崗位對技術(shù)和技能的儲備要求,以指導(dǎo)學(xué)生入學(xué)后提前做好學(xué)習(xí)及研究方向的規(guī)劃;幫助學(xué)校開展有針對性的專業(yè)培訓(xùn),以提升學(xué)生的素養(yǎng),同時調(diào)整專業(yè)設(shè)置、實現(xiàn)資源優(yōu)化,布局招生計劃、完成科學(xué)的分析與預(yù)測;利用“微應(yīng)用”等媒介進行可視化的數(shù)據(jù)展示,來輔助高等院校管理者與決策者定期調(diào)整專業(yè)需求,從而為招生計劃、師生配比等提供依據(jù)。
作為大數(shù)據(jù)的生產(chǎn)者,高等院校各類業(yè)務(wù)系統(tǒng)為學(xué)校的各項信息化工作提供了基礎(chǔ)保障。數(shù)據(jù)的價值在于多維度數(shù)據(jù)的聯(lián)動與交互。通過對各類生產(chǎn)數(shù)據(jù)進行采集、抽取、清洗、關(guān)聯(lián)、分析,面向?qū)ο蠡挠脩舴?wù)由“面式”已逐步轉(zhuǎn)化為“點式”的定制化、個性化用戶服務(wù)。依托高等院校大數(shù)據(jù)挖掘與決策分析體系,借助“大數(shù)據(jù)+微服務(wù)”模式,可為高等院校全面建設(shè)智慧校園,實現(xiàn)以大數(shù)據(jù)輔助高等院校日常教學(xué)、科研、管理以及個性化服務(wù)功能,提供科學(xué)合理的保障。
[1]中國教育和科研計算機網(wǎng).大數(shù)據(jù)時代:一切都讓沉睡的數(shù)據(jù)說話[OL].
[2]袁芳.智慧校園中大數(shù)據(jù)的機遇與挑戰(zhàn)[OL].
[3]汪浩.大數(shù)據(jù)輔助智慧校園落地探索[OL].
[4]孫強,張雪峰.大數(shù)據(jù)決策學(xué)論綱:大數(shù)據(jù)時代的決策變革[J].華北電力大學(xué)學(xué)報,2014,(4):34-37.
[5]李艷,呂鵬,李瓏.虛擬云桌面為高等院校圖書館服務(wù)和管理帶來的革新——以中南民族大學(xué)圖書館為例[J].現(xiàn)代情報,2015,(6):58-63.
[6]李艷,呂鵬,李瓏.基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個性化服務(wù)研究[J].圖書情報知識,2016,(2):60-68.
[7]馬曉亭.基于可信小數(shù)據(jù)的圖書館個性化服務(wù)研究[J].圖書情報工作,2015,(4):70-75.
The Application of Information Construction in Universities with Big Data Mining and Decision Analysis System
YU Peng1LI Yan2LV Peng3
The paper, started from the information construction of the universities in the 12th Five-Year Plan, mainly discussed the research and the development trends of big data. Meanwhile, it analyzed the significance and the value of the data-mining and decision analysis system (short for “system”), as well as discussing the direction of development in the information construction of universities. The paper designed the architecture and process of the system, and proposed a novel information construction mode named “big data+micro-service”. Combined several typical application scenarios in universities with the system model, it can quickly and effectively penetrate into each business units of universities and provides personalized services. Meanwhile, the system can also be used for the researchers and managers of the universities to make scientific decisions.
big data; data-mining and decision analysis system; micro-service; personalized services
G40-057
A
1009—8097(2016)08—0102—07
10.3969/j.issn.1009-8097.2016.08.015
本文為中南民族大學(xué)教研項目“基于‘大數(shù)據(jù)挖掘與決策分析+微服務(wù)’體系的高等院校云輔助教學(xué)研究”、中央高等院?;究蒲袠I(yè)務(wù)費專項資金項目“云計算環(huán)境中數(shù)字化圖書館基于多維QoS屬性的虛擬化資源分配算法研究”(項目編號:CZQ14023)的階段性研究成果。
余鵬,實驗師,碩士,研究方向為大數(shù)據(jù)、SDN網(wǎng)絡(luò),郵箱為wildwolfyup@sina.com。
2015年12月29日
編輯:小西