章喻鑫 吳開龍 王榮遠 李志強 成陽
摘要:目前,高校貧困生資助體系雖然已經(jīng)建立,但貧困生的判定存在著短板和不足。高校一卡通內(nèi)存在著大量寶貴的潛在數(shù)據(jù),通過SQL Server數(shù)據(jù)庫和Excel的結(jié)合,可以從高校一卡通里探尋有價值的數(shù)據(jù)信息,幫助評定潛在貧困生的程序更加完善。該文為學校管理人員提供一種可靠的數(shù)據(jù)分析途徑。
關(guān)鍵詞:高校一卡通;SQL Server數(shù)據(jù)庫;Excel;貧困生;數(shù)據(jù)分析
中圖分類號:TP392? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)04-0037-02
Abstract:Although the funding system for poor students in colleges and universities has been established, there are shortcomings and deficiencies in the determination of poor students. There are a lot of valuable potential data in the college card. Through the combination of SQL server database and Excel, valuable data can be explored from the college card, and the process of evaluating potential poor students can be improved. This article provides a reliable way of data analysis for school administrators.
Key words: the college card; SQL server database; Excel; poor students; data analysis
1 引言
作為高校必備的學生信息管理和消費的載體,一卡通系統(tǒng)是十分重要的。隨著信息化的不斷發(fā)展,大學校園數(shù)字化、網(wǎng)絡(luò)化是不可阻擋的潮流趨勢。高校一卡通被視為數(shù)字化校園建設(shè)的主要工程,實現(xiàn)了三大主要功能,作用于校園內(nèi)的每個角落。目前來看,高校一卡通主要提供交易、信息管理、身份識別等三大功能[1]。其中交易代表了學生在校園內(nèi)的主要消費,能夠反映學生在校生活期間的總體消費情況。因此可以借助一卡通內(nèi)的消費數(shù)據(jù),進行分析學生的經(jīng)濟狀況,從而可以起到輔助判定貧困生的目的。
高校一卡通內(nèi)的數(shù)據(jù)會因校內(nèi)活動變得異常復雜,如果高校在初建一卡通平臺時未考慮后續(xù)數(shù)字化網(wǎng)絡(luò)化的發(fā)展,沒有特定的去優(yōu)化一卡通系統(tǒng),就會導致其中數(shù)據(jù)的雜亂無章,從而增加了數(shù)據(jù)處理的難度。一般來說,消費數(shù)據(jù)項目越多,越能精確的體現(xiàn)學生的消費水平和家庭狀況,日常使用校園卡的頻率越高,也就越能說明學生的消費主要是在校園內(nèi)進行。這對于學校高層人員判定學生經(jīng)濟情況有極好的借鑒作用,為決策人員實施決策提供必要的事實依據(jù)[2],因此高校一卡通的數(shù)據(jù)的高效利用是非常有價值的。
2 搭建一卡通數(shù)據(jù)分析框架和流程
高校一卡通內(nèi)數(shù)據(jù)經(jīng)過簡單分析處理,主要分成兩大類,分別是交易數(shù)據(jù)類和行為數(shù)據(jù)類,其中交易數(shù)據(jù)類主要分為學校各食堂、校園內(nèi)超市、洗浴、復印店以及圖書館書籍超期等消費信息,行為數(shù)據(jù)類型包含校園內(nèi)的各種行動軌跡和宿舍等地點門禁信息。
在高校一卡通系統(tǒng)中,消費數(shù)據(jù)是有明顯特征的,其大部分數(shù)據(jù)儲以記錄的方式存儲于數(shù)據(jù)庫中,我們將其按照學生卡號和消費的編號、時間、金額等數(shù)據(jù)重新組織記錄,準備放入構(gòu)建的數(shù)據(jù)倉庫中。經(jīng)過對數(shù)據(jù)進行抽取、轉(zhuǎn)換、加載等相關(guān)處理,在構(gòu)建好的數(shù)據(jù)倉庫中,我們可以進一步地對消費數(shù)據(jù)進行分析。把與消費相關(guān)的(如時間、用戶、金額和消費類型等)作為不同的維度來衡量學生的狀況。在這里,我們將其分為四個表,分別為時間表,消費表,一卡通表和商戶表。時間表中包含年、季度、月、日以及時間編號;消費表分為消費類型、商戶編號、卡ID號、消費金額以及時間編號;一卡通表包括卡ID、持卡人的個人信息以及卡內(nèi)余額;商戶表分為商戶序號、商戶種別和其他詳細信息。其中主要操作是對數(shù)據(jù)類型和缺失值的處理,可以將其分為兩大獨立的部分進行,數(shù)據(jù)類型歸為一類,數(shù)據(jù)類型的不同可以轉(zhuǎn)換為統(tǒng)一類型。缺失值歸為另一類,針對缺失金額部分可采取平均值填入的方法。
本次實驗采取模擬某高校的大量流水數(shù)據(jù),通過抽樣的方法,對其在有規(guī)律的一段時間內(nèi)的數(shù)據(jù)抽取出,利用SQL Server的DTS方式把我們需要分析的數(shù)據(jù)導入到目標數(shù)據(jù)庫中,DTS的用途是可以從不同的源將數(shù)據(jù)抽取、轉(zhuǎn)換和整理到理想的目標位置[3]。用戶可以通過DTS工具很容易地創(chuàng)建適合于特定的自定義移動解決方法。我們利用這些數(shù)據(jù)建立一個以消費為事例的數(shù)據(jù)倉庫,通過該數(shù)據(jù)倉庫,可以了解到我們處理的數(shù)據(jù)信息。在這里,我們以學生的消費具體時間段、不同學段的學生消費頻率等內(nèi)容進行分層次的分析。在得到的數(shù)據(jù)基礎(chǔ)上可以利用OLAP Services建立數(shù)據(jù)立方體。步驟如下:(1)建立主量:利用Dimension Wizard選擇時間表,建立時間維度;選擇消費表,建立消費維度;選擇商戶表,建立商戶維度[4];選擇一卡通表,建立個人信息維度;(2)構(gòu)建數(shù)據(jù)體:在OLAP菜單管理器上選擇Cubes文件夾新建Cube向?qū)?。選擇消費事實數(shù)據(jù)庫中的消費表,該表里是學生的消費信息。在立方體測量時,應選消費金額;最后完成該立方體的構(gòu)建;(3)通過引導創(chuàng)建MOLAP存儲類型的集合[3]。MOLAP可以把OLAP分析的多維度的屬性值將數(shù)據(jù)從物理層面上存儲為高維數(shù)組的形式,形成立體的結(jié)構(gòu)。維的數(shù)據(jù)屬性值和多維數(shù)組的下標值或下標的范圍形成相互對應的關(guān)系,總數(shù)據(jù)屬性值變成多維數(shù)組的屬性值,可以存儲在數(shù)組中。
在此構(gòu)建完成后利用Excel進行分析,我們可以選擇菜單欄中的新建數(shù)據(jù)庫查詢選項,再次選擇OLAP多維數(shù)據(jù)集中的新數(shù)據(jù)源目標,并為訪問的數(shù)據(jù)庫選擇一個OLAP供應者中選擇OLE OB for OLAP,按提示步驟完成對消費事實數(shù)據(jù)庫的選擇。
將立方體的數(shù)據(jù)調(diào)入Excel中,數(shù)據(jù)分析工作可以在此完成。通過加載Excel里的數(shù)據(jù)分析工具庫選項,選擇合適的分析工具庫和規(guī)劃求解加載項,數(shù)據(jù)分析中還有直方圖、回歸、抽樣、描述統(tǒng)計、傅里葉分析等工具可以實現(xiàn)數(shù)據(jù)的不同角度的利用。我們還可以直接通過已經(jīng)處理好的數(shù)據(jù)建立數(shù)據(jù)透視表,利用不同形式的圖形進行簡單直接的觀察,得出我們所需要的結(jié)論。以下為我們實際操作中的部分數(shù)據(jù)直觀圖和數(shù)據(jù)表的處理。
在此,我們可以根據(jù)其學生總體消費水平的高低判斷學生的貧困程度。以單位學年類同等水平的學生消費為基準,找出低于此水平的學生人群,即可判斷為潛在貧困生。具體有如下特點:
(1)潛在貧困生每次消費的金額平均較少。
(2)潛在貧困生每日消費的金額比較少,并且刷卡消費的頻率相對來說穩(wěn)定。
(3)潛在貧困生消費的總金額在同一學年中相對較少。
(4)潛在貧困生使用高校一卡通交易的頻率比較高。
基于此,從Excel中可以得到吻合上述特征的學生,甚至還可以通過調(diào)節(jié)立方體中粒度的大小,以便于實際的貧困生判定情況更加吻合,從而選出潛在貧困生。
3 結(jié)語
本文主要簡單介紹了如何利用SQL Server和Excel配合構(gòu)建分析框架,對高校一卡通里數(shù)據(jù)結(jié)果進行分析。關(guān)鍵點在于對一卡通內(nèi)消費數(shù)據(jù)的界限的確定,在界限明顯情況下,界限之下即為潛在貧困生的消費水平,同時也能夠確定學生消費狀況,其結(jié)果不僅夠使學校為潛在貧困生提供更精準化的管理和補助金的發(fā)放,還能能夠為輔導員輔助決策[5]、優(yōu)化校園卡管理等提供了有力的數(shù)據(jù)支撐框架。在此建立和分析的過程中發(fā)現(xiàn)SQL Server和Excel能夠處理高校一卡通內(nèi)學生數(shù)據(jù),但效率方面不夠高,還需要根據(jù)事實確定合適的維度和粒度,可視化程度還欠缺,這也是將來應該改進的地方之一。
參考文獻:
[1] 李志國,張彬,范佳偉.智慧校園一卡通數(shù)據(jù)的分析及利用[J].信息與電腦(理論版),2019(4):3-4.
[2] 丁蓉,孫曉輝,李智勇.基于校園一卡通的高校貧困生消費行為分析[J].電子測試,2016(18):78-79+99.
[3] 田永青,陳衛(wèi)華,朱仲英.基于SQL Server的數(shù)據(jù)倉庫的建立和分析[J].電子技術(shù),2001(8):35-38.
[4] 丁潔,賈應煒,蘇興龍,郇林.校園一卡通數(shù)據(jù)挖掘分析設(shè)計與應用[J].自動化技術(shù)與應用,2020,39(2):132-137.
[5] 周皞,萬里亞.基于校園卡數(shù)據(jù)挖掘的高校貧困生輔助判別研究[J].職教通訊,2012(35):59-61.
【通聯(lián)編輯:王力】