丁建英+張鈺涵
摘 要 大數(shù)據(jù)是繼云計(jì)算和物聯(lián)網(wǎng)之后IT領(lǐng)域的又一次顛覆性技術(shù)創(chuàng)新,大數(shù)據(jù)時(shí)代的到來(lái)為陷入瓶頸的信息化校園數(shù)據(jù)利用提供了新的出路。探討智慧校園建設(shè)現(xiàn)狀,基于大數(shù)據(jù)技術(shù)特點(diǎn),提出基于大數(shù)據(jù)的智慧校園支撐平臺(tái),分析、挖掘隱藏在校園信息化大數(shù)據(jù)中的教學(xué)結(jié)果和教學(xué)規(guī)律,對(duì)未來(lái)進(jìn)行預(yù)測(cè),以便于教師、學(xué)生和教育決策者及時(shí)掌握個(gè)性化教學(xué)狀態(tài),改進(jìn)教育策略,最終真正實(shí)現(xiàn)智慧校園。
關(guān)鍵詞 大數(shù)據(jù);智慧校園;智慧校園支撐平臺(tái)
中圖分類(lèi)號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2017)22-0038-03
Construction of Wisdom Campus Support Platform based Big Data//DING Jianying, ZHANG Yuhan
Abstract Big data is another disruptive technological innovation in IT after cloud computing and the Internet of things. The arrival of Big Data Era provides a new way for the information campus data utilization which is in the bottleneck stage. This article discusses the status quo of the wisdom campus, proposes wisdom campus support platform based on the Big data, so as to analyze and excavate the tea-
ching results and rules which is hidded in the campus big data. Then teachers, students and educational decision makers can master the individual teaching state, improve the education strategy timely, and ultimately realize the real wisdom campus.
Key words big data; wisdom campus; wisdom campus support platform
1 前言
2012年,《紐約時(shí)報(bào)》首次提出“大數(shù)據(jù)”一詞?!按髷?shù)據(jù)”用于命名和描述信息化時(shí)代爆發(fā)的海量數(shù)據(jù)以及隨之出現(xiàn)的技術(shù)革新和發(fā)展[1],它是繼云計(jì)算和物聯(lián)網(wǎng)之后,互聯(lián)網(wǎng)領(lǐng)域又一次顛覆性的技術(shù)創(chuàng)新,給各行各業(yè)的發(fā)展帶來(lái)了極大的機(jī)遇[2]。作為新技術(shù)應(yīng)用前沿陣地之一的高校,大數(shù)據(jù)的概念已經(jīng)延伸至校園信息化建設(shè)中,來(lái)重塑校園業(yè)務(wù)流程、IT基礎(chǔ)設(shè)施以及對(duì)于教育信息、教學(xué)資源的獲取和使用方式。面對(duì)大數(shù)據(jù)時(shí)代的到來(lái),如何構(gòu)建基于大數(shù)據(jù)的高校智慧校園服務(wù)平臺(tái),從根本上促進(jìn)校園活動(dòng)的深度融合,是當(dāng)前高校信息化建設(shè)的主題。
2 智慧校園建設(shè)現(xiàn)狀
智慧校園是數(shù)字化校園的進(jìn)一步發(fā)展和延續(xù),它是應(yīng)用各種新興的IT技術(shù),如物聯(lián)網(wǎng)、智能感知、云計(jì)算、移動(dòng)互聯(lián)和大數(shù)據(jù)等,在完全感知校園環(huán)境,智能識(shí)別教師、學(xué)生的個(gè)別特征和校園教學(xué)、生活等場(chǎng)景的基礎(chǔ)上,有效整合學(xué)校的課堂教學(xué)、科學(xué)研究、運(yùn)行管理等方面的資源與應(yīng)用,為教師和學(xué)生建立智能、開(kāi)放的教育教學(xué)環(huán)境,改變其知識(shí)傳遞、資源共享和交互協(xié)作的方式,將學(xué)校物理空間和數(shù)字空間有機(jī)銜接起來(lái),實(shí)現(xiàn)以人為本的個(gè)性化創(chuàng)新服務(wù)。
智慧校園結(jié)構(gòu)如圖1所示。首先是利用物聯(lián)網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)絡(luò)連接校園網(wǎng)中的各種基礎(chǔ)傳感設(shè)備,創(chuàng)建一個(gè)一體化的智能感知環(huán)境,實(shí)時(shí)采集教學(xué)設(shè)備的運(yùn)行狀態(tài),教師與學(xué)生的教學(xué)、活動(dòng)動(dòng)態(tài),以及生活環(huán)境狀態(tài)信息等,以積累校園教育教學(xué)、科學(xué)研究、運(yùn)行管理等各個(gè)方面的海量大數(shù)據(jù)。在此基礎(chǔ)上,智慧校園還必須要建立一個(gè)基礎(chǔ)服務(wù)支撐平臺(tái),使用先進(jìn)的技術(shù)(如大數(shù)據(jù)處理技術(shù)、數(shù)據(jù)挖掘技術(shù)等)深入分析挖掘校園大數(shù)據(jù)中有價(jià)值的信息,將其轉(zhuǎn)化為上層應(yīng)用服務(wù)的優(yōu)化依據(jù),為所有上層應(yīng)用提供存儲(chǔ)、計(jì)算、共享等服務(wù),從而為教師和學(xué)生提供基于角色的個(gè)性化教學(xué)引導(dǎo)服務(wù);同時(shí)引導(dǎo)教育信息化工作者從煩瑣的業(yè)務(wù)中抽身出來(lái),推動(dòng)業(yè)務(wù)服務(wù)向基于大數(shù)據(jù)分析的個(gè)性化服務(wù)模式發(fā)展[3],從而真正實(shí)現(xiàn)智慧校園的智慧化。
當(dāng)前大部分高校已經(jīng)完成智慧校園的基礎(chǔ)設(shè)施建設(shè),也開(kāi)展了數(shù)據(jù)中心建設(shè),考慮了數(shù)據(jù)的積累和管理,但還沒(méi)有深入對(duì)這些海量教學(xué)數(shù)據(jù)進(jìn)行分析、挖掘和充分利用。以山西師范大學(xué)為例,據(jù)不完全統(tǒng)計(jì),截至2016年底,學(xué)校核心業(yè)務(wù)系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)總量累計(jì)近1300 GB;在非結(jié)構(gòu)化數(shù)據(jù)方面也積累了大量的課件、視頻材料等,然而目前這些海量的基礎(chǔ)數(shù)據(jù)并未得到深入分析和利用。因此,對(duì)智慧校園運(yùn)行過(guò)程中積累的海量大數(shù)據(jù)展開(kāi)深入分析、挖掘,獲取其中蘊(yùn)藏的知識(shí)和價(jià)值,為學(xué)校的教育決策者、教師和學(xué)生提供個(gè)性化數(shù)據(jù)服務(wù)的迫切性正逐步呈現(xiàn)出來(lái)。
3 大數(shù)據(jù)概念及特點(diǎn)
“大數(shù)據(jù)”這個(gè)概念最初是在全球知名咨詢(xún)公司麥肯錫(McKinsey & Company)于2011年5月發(fā)布的報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》中提出的。該報(bào)告指出:“數(shù)據(jù)已經(jīng)滲透到各行各業(yè)的職能領(lǐng)域,并且逐步構(gòu)成了行業(yè)發(fā)展的重要生產(chǎn)因素;因而人們對(duì)于海量數(shù)據(jù)的高效利用必會(huì)帶來(lái)新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”[4]大數(shù)據(jù)現(xiàn)在還沒(méi)有統(tǒng)一的界定,著云臺(tái)暨《中國(guó)云》團(tuán)隊(duì)將大數(shù)據(jù)定義為:企業(yè)在運(yùn)行過(guò)程中產(chǎn)生的海量結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù),而這些海量數(shù)據(jù)采用關(guān)系型數(shù)據(jù)庫(kù)分析,將消耗大量的時(shí)間以及金錢(qián)。信息專(zhuān)家涂子沛認(rèn)為:大數(shù)據(jù)并不單單是指容量大,其更深層次意義在于通過(guò)對(duì)海量異構(gòu)類(lèi)型數(shù)據(jù)的整合、統(tǒng)計(jì)以及分析,挖掘出其中蘊(yùn)藏的知識(shí)和價(jià)值。IDC將大數(shù)據(jù)定義為:為了更加快速經(jīng)濟(jì)地從海量的、異構(gòu)類(lèi)型的數(shù)據(jù)中挖掘出潛藏價(jià)值而設(shè)計(jì)的新型架構(gòu)體系以及相關(guān)技術(shù)。endprint
總結(jié)起來(lái),各種表達(dá)的共同之處就是:大數(shù)據(jù)不是傳統(tǒng)意義上的海量數(shù)據(jù),而是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多種多樣的非結(jié)構(gòu)化數(shù)據(jù),它具有信息容量龐大、信息種類(lèi)多樣化、處理速度快、價(jià)值密度低的特點(diǎn)。
1)數(shù)據(jù)量龐大,指采集、存儲(chǔ)和分析的數(shù)據(jù)量非常大,在實(shí)際應(yīng)用中,很多企業(yè)用戶(hù)把多個(gè)數(shù)據(jù)集放在一起,從TB級(jí)別躍升到PB級(jí)別、EB級(jí)別或者ZB級(jí)別。
2)數(shù)據(jù)種類(lèi)多。大數(shù)據(jù)的種類(lèi)和來(lái)源是多樣化的,既包含結(jié)構(gòu)化的數(shù)據(jù),也包含半結(jié)構(gòu)化以及非結(jié)構(gòu)化等形式的數(shù)據(jù),如文字、圖片、文檔、視音頻、網(wǎng)絡(luò)日志、位置、環(huán)境信息等。2012年由互聯(lián)網(wǎng)數(shù)據(jù)中心(DCCI)舉辦的“Adworld2012互動(dòng)營(yíng)銷(xiāo)世界”指出:2010年,全球數(shù)據(jù)量已經(jīng)達(dá)到1.2 ZB,然而在如此龐大的數(shù)據(jù)中,結(jié)構(gòu)化數(shù)據(jù)大約只占10%,其余的大部分?jǐn)?shù)據(jù)則是由視音頻、各類(lèi)文檔、位置、環(huán)境等組成的大量半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)[5]。
3)處理速度快。和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)不同,大數(shù)據(jù)需要對(duì)海量數(shù)據(jù)采取近實(shí)時(shí)的分析和挖掘。因此,大數(shù)據(jù)強(qiáng)調(diào)利用強(qiáng)大的機(jī)器算法和專(zhuān)用技術(shù)如數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)和OLAP(聯(lián)機(jī)分析處理)對(duì)海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行科學(xué)、快速分析和挖掘。如2011年,日本發(fā)生大地震之后僅僅九分鐘,美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and
Atmospheric Administration)就通過(guò)分析海洋傳感器的實(shí)時(shí)大數(shù)據(jù),挖掘出了海嘯影響模型,公布了詳細(xì)的海嘯預(yù)警[6]。
4)價(jià)值密度低。大數(shù)據(jù)的信息容量極為龐大,然而其中有利用價(jià)值的信息少之又少,如時(shí)長(zhǎng)60分鐘的視頻中,有利用價(jià)值的數(shù)據(jù)可能僅僅十幾秒。
4 基于大數(shù)據(jù)的智慧校園支撐平臺(tái)研究
智慧校園的關(guān)鍵特色在于利用校園內(nèi)的各種智能感知設(shè)備、物聯(lián)網(wǎng)以及移動(dòng)互聯(lián)網(wǎng)絡(luò)等技術(shù),獲取海量的教學(xué)互動(dòng)和狀態(tài)大數(shù)據(jù),并基于這些海量大數(shù)據(jù)的分析挖掘而掌握教與學(xué)的相關(guān)特征和規(guī)律,從而展開(kāi)智慧的個(gè)性化教學(xué)應(yīng)用[7]。這其中的關(guān)鍵就在于對(duì)海量數(shù)據(jù)的分析與挖掘,使得高校師生通過(guò)數(shù)據(jù)不僅知道發(fā)生了什么,而且掌握數(shù)據(jù)背后隱藏的個(gè)性化指導(dǎo)信息,以便于他們?cè)诮虒W(xué)與學(xué)習(xí)過(guò)程中及時(shí)做出相應(yīng)的調(diào)整決策,主動(dòng)積極地開(kāi)展個(gè)性化的教與學(xué)。
面對(duì)這些問(wèn)題,大數(shù)據(jù)時(shí)代提出利用Hadoop技術(shù)包括分布式存儲(chǔ)HDFS、分布式計(jì)算Map Reduce和數(shù)據(jù)實(shí)時(shí)反應(yīng)技術(shù)等,對(duì)海量的數(shù)據(jù)進(jìn)行科學(xué)化管理和分析。這個(gè)方法通過(guò)構(gòu)建一個(gè)基于大數(shù)據(jù)的智慧校園支撐平臺(tái),利用HDFS分布式文件系統(tǒng)為海量非結(jié)構(gòu)化數(shù)據(jù)提供并行分布存儲(chǔ),確保負(fù)載均衡的同時(shí)保證數(shù)據(jù)的可靠性和安全性,并通過(guò)Map Reduce并行計(jì)算多個(gè)任務(wù),提高大數(shù)據(jù)分析的速度和效率,快速、準(zhǔn)確地為上層應(yīng)用提供智慧服務(wù)。基于大數(shù)據(jù)的智慧校園支撐平臺(tái)如圖2所示。
智能感知層 智能感知層首先利用各種傳感技術(shù)和傳感設(shè)備來(lái)收集校園活動(dòng)的原始數(shù)據(jù),包括教學(xué)設(shè)備儀器的工作狀態(tài)、教師和學(xué)生的教學(xué)、生活和狀態(tài)數(shù)據(jù)等,為智慧校園支撐平臺(tái)提供海量、多樣化的校園基礎(chǔ)大數(shù)據(jù)。
大數(shù)據(jù)處理層 大數(shù)據(jù)處理層包括數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)挖掘三個(gè)部分。
首先,數(shù)據(jù)采集是對(duì)智能感知層的海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)過(guò)濾、數(shù)據(jù)篩選以及數(shù)據(jù)存儲(chǔ)等操作。其中,數(shù)據(jù)過(guò)濾主要是對(duì)海量的大數(shù)據(jù)展開(kāi)約束性檢查,實(shí)施去冗余化等操作,初步保證數(shù)據(jù)的真實(shí)性以及可用性;數(shù)據(jù)篩選是對(duì)海量數(shù)據(jù)進(jìn)行多次反復(fù)過(guò)濾,從而獲取到低信息粒度的連續(xù)性數(shù)據(jù);數(shù)據(jù)存儲(chǔ)則是利用Hadoop中的HDFS技術(shù)對(duì)經(jīng)過(guò)篩選的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行安全存儲(chǔ)。
其次,數(shù)據(jù)分析是利用Hbase、ZooKeeper等數(shù)據(jù)處理和管理工具動(dòng)態(tài)生成Map Reduce任務(wù),對(duì)經(jīng)過(guò)篩選的非結(jié)構(gòu)化數(shù)據(jù)(如教室信息云、教師信息云、學(xué)生信息資源云、教學(xué)信息云等)進(jìn)行計(jì)算和聚合高效處理。并利用Hadoop的ETL處理輸出基本模型分析匯總信息,以推斷出各種數(shù)據(jù)之間的細(xì)微差異與關(guān)系,從而獲得有利于優(yōu)化教與學(xué)效果的洞見(jiàn)點(diǎn)。如通過(guò)分析教學(xué)信息云中學(xué)生的課堂學(xué)習(xí)行為、與他人協(xié)作行為、解決問(wèn)題行為、提交作業(yè)行為等學(xué)習(xí)行為,獲取每一個(gè)學(xué)生的性格特征、學(xué)習(xí)能力、交互協(xié)作能力、資源利用能力以及學(xué)習(xí)方式傾向等個(gè)性化信息,以便于教師和學(xué)生根據(jù)分析結(jié)果做出適當(dāng)教學(xué)調(diào)整。
最后,對(duì)數(shù)據(jù)進(jìn)行分析之后,大數(shù)據(jù)處理層還要利用回歸算法、分類(lèi)算法、聚合算法等數(shù)據(jù)挖掘算法對(duì)數(shù)據(jù)進(jìn)行深層次挖掘,以提取隱藏在數(shù)據(jù)背后的有價(jià)值的信息,對(duì)未來(lái)的教與學(xué)提供相關(guān)優(yōu)化策略。如通過(guò)挖掘?qū)W生的各類(lèi)資源點(diǎn)擊率和觀看率,可以直接預(yù)測(cè)出學(xué)生更傾向于哪種資源。
智慧應(yīng)用層 智慧應(yīng)用層是在大數(shù)據(jù)處理的基礎(chǔ)上,獲取學(xué)生學(xué)習(xí)能力、性格特征、作息規(guī)律等個(gè)性化信息,評(píng)估目前教師的教學(xué)效果以及學(xué)生的學(xué)習(xí)效果,然后對(duì)這些個(gè)性化的處理數(shù)據(jù)加以應(yīng)用,如信息檢索、數(shù)據(jù)可視化應(yīng)用、教學(xué)評(píng)估與預(yù)測(cè)等,從而便于學(xué)校各業(yè)務(wù)部門(mén)、教師和學(xué)生及時(shí)改進(jìn)。如課程教學(xué)之后,及時(shí)對(duì)學(xué)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析和挖掘,在此基礎(chǔ)上對(duì)該課程的后期課時(shí)設(shè)置、教學(xué)環(huán)境設(shè)置等提出針對(duì)性建議。
5 結(jié)語(yǔ)
隨著高校教育信息化的迅猛發(fā)展,各種業(yè)務(wù)產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)必將會(huì)以成倍的速度快速增長(zhǎng),如何科學(xué)有效地分析、挖掘大數(shù)據(jù)中的隱藏價(jià)值,使數(shù)據(jù)真正為高校的教學(xué)、科研、管理等發(fā)揮指導(dǎo)和預(yù)測(cè)作用,逐漸成為高校信息化部門(mén)的關(guān)注焦點(diǎn)?;诖髷?shù)據(jù)的智慧校園支撐平臺(tái)能夠?qū)@些海量的數(shù)據(jù)展開(kāi)收集、過(guò)濾、深入分析和挖掘等一系列完全操作,從而為高校教育決策者、教師和學(xué)生提供教與學(xué)的相關(guān)特征和規(guī)律,以便其開(kāi)展智慧的個(gè)性化教學(xué)應(yīng)用。
參考文獻(xiàn)
[1]成果.大數(shù)據(jù)背景下智慧校園云資源利用研究[J].信息化建設(shè),2016(1):185.
[2]劉中宇,劉海良.基于大數(shù)據(jù)的云教學(xué)環(huán)境設(shè)計(jì)[J].中國(guó)教育信息化,2013(24):18-21.
[3]宓詠,趙澤宇.大數(shù)據(jù)創(chuàng)新智慧校園服務(wù)[J].中國(guó)教育信息化,2013(24):3-7.
[4]Manyika J, Chui M, Brown B. Big data: The next frontier for innovation competition and productivity[R].USA: McKinsey Global Institute,2011.
[5]Adworid2012互動(dòng)營(yíng)銷(xiāo)世界夏暨2012微鋒匯啟動(dòng)[J].電腦與電信,2012(5):14-15.
[6]佘叢國(guó),朱志軍.大數(shù)據(jù)與云計(jì)算的關(guān)系及其對(duì)通信行業(yè)的影響[M]//中國(guó)通信學(xué)會(huì)通信管理委員會(huì)學(xué)術(shù)研討會(huì)暨寬帶中國(guó)戰(zhàn)略與創(chuàng)新學(xué)術(shù)研討會(huì).2012.
[7]蔣東興,付小龍,袁芳,等.大數(shù)據(jù)背景下的高校智慧校園建設(shè)探討[J].華東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2015(S1):119-125.endprint