李婷 李海平 尉亦兵
摘 要:?以陜西工業(yè)職業(yè)技術(shù)學(xué)院校園“一卡通”中教職工交易流水?dāng)?shù)據(jù)為研究對象,通過對提取的數(shù)據(jù)進行預(yù)處理、整理與分析、最終實現(xiàn)數(shù)據(jù)可視化,以滿足后勤餐飲部門的管理要求。提取了118 249條交易數(shù)據(jù),使用Python、SPSS 24、Excel 2010對數(shù)據(jù)進行預(yù)處理和統(tǒng)計分析。首先,討論了職工餐廳與學(xué)生餐廳中教職工消費數(shù)據(jù)的綜合關(guān)系;然后,整體研究了職工餐廳近一年來消費情況;最后,從不同方向進一步研究教職工的就餐規(guī)律,為學(xué)校優(yōu)化資源配置和科學(xué)決策提供參考依據(jù)。
關(guān)鍵詞:?校園“一卡通”; 數(shù)據(jù)可視化; 消費行為; 數(shù)據(jù)分析
中圖分類號: O 213.9? ? ? 文獻標(biāo)志碼: A
Consuming Behavior Data Analysis Based on Campus E-Card System
LI Ting1, LI Haiping1,2, WEI Yibing3
(1.School of Trade and Circulation, Shanxi Polytechnic Institute, Xianyang, Shanxi 712000, China;
2.School of Economics and Finance, Xian Jiaotong University,? Xian, Shanxi 710061, China;
3.Finance Office, Shanxi Polytechnic Institute, Xianyang, Shanxi 712000, China)
Abstract:
In this paper, we study the consuming transaction in E-Card system of Shanxi Polytechnic Institute by preprocessing, sorting and analyzing the extracted data, and realize data visualization to meet the management requirements of logistics and catering department. There are 118 249 records from transaction data are extracted from E-Card system. First of all, we discuss the relationship between the consumption data of staff restaurant and the student restaurant. Then, the consumption of the staff restaurant in the past year is studied. Finally, it is significant to provide a reference for the optimization of resource allocation and scientific decision-making of the school through further researching the dining rules of teachers.
Key words:
campus “E-Card”; data visualization; consuming behavior; data analysis
0 引言
隨著高校信息化、智能化的推動,校園“一卡通”得到了快速發(fā)展和普及,已由最初的小額消費卡,變?yōu)閷W(xué)生證、借閱證、門禁卡、考勤卡、公交卡,甚至能夠應(yīng)用于學(xué)籍注冊、自助文印、學(xué)費繳納、體育場館預(yù)定、體能測試等場景[1-3],可以說是“一卡在手,走遍校園”[4-6]。校園“一卡通”的高度智能化涉及到了全校師生的上課、科研、管理等方方面面,同時也記錄了師生在學(xué)校中的各種行為,在校園“一卡通”中可以找到相應(yīng)的足跡,因此校園“一卡通”也產(chǎn)生了海量高速增長的數(shù)據(jù)?;跀?shù)據(jù)挖掘理論,從大量繁雜、無序的原始數(shù)據(jù)中提取出有價值的信息,通過分析和建模來實現(xiàn)知識發(fā)現(xiàn),將有助于學(xué)校全面掌握師生的行為規(guī)律,對學(xué)校優(yōu)化資源配置和科學(xué)決策具有重要意義[7-10]。
本研究以陜西工業(yè)職業(yè)技術(shù)學(xué)院(以下簡稱:陜西工院)為例。全校共有明倫(共兩層)、明善(共一層)、明德(包含明德堂、西一、西二餐廳)三個學(xué)生餐廳,為全校師生提供餐飲服務(wù)。2018年11月底學(xué)校為避免用餐高峰期師生用餐擁擠、保證教師午休質(zhì)量、同時給教職工營造一個良好的餐飲環(huán)境,專門設(shè)立職工餐廳。以全校職工的“一卡通”消費數(shù)據(jù)為研究對象,通過對原始數(shù)據(jù)進行預(yù)處理、整理與分析、最終實現(xiàn)數(shù)據(jù)的可視化,以滿足后勤餐飲部門的決策與管理。首先,對陜西工院校園“一卡通”系統(tǒng)進行簡單介紹。然后,研究自職工餐廳設(shè)立之日起,職工餐廳和學(xué)生餐廳中教師的綜合消費情況。最后,針對近一年來職工餐廳的消費情況進行研究。
1 陜西工院校園一卡通系統(tǒng)簡介
陜西工院“一卡通”系統(tǒng)始建于2017年8月,是一個基于C/S架構(gòu)的多應(yīng)用集成系統(tǒng)[11-12]。圖1給出了陜西工院
校園“一卡通”系統(tǒng)平臺的結(jié)構(gòu)圖。按照功能劃分,該系統(tǒng)主要包含數(shù)據(jù)層、平臺層、網(wǎng)絡(luò)層、用戶層。其中,和我們最息息相關(guān)的一層便是用戶層,它為用戶提供各種服務(wù)與便利。
用戶層具體包含充值系統(tǒng)、消費系統(tǒng)、身份認證系統(tǒng)、及其它應(yīng)用系統(tǒng)四類。陜西工院的“一卡通”充值系統(tǒng)為師生提供微信充值、現(xiàn)金充值、手機APP充值三種方式。消費系統(tǒng)支持在食堂、浴室、超市、校醫(yī)院等場所消費,主要消費方式是刷卡或手機“完美校園”刷碼,同時還支持手機“完美校園”繳納學(xué)費、書費、網(wǎng)費、四六級、AB級、圖書逾期扣款等功能。身份認證系統(tǒng)包含所有需要身份認證的場所,包含上課簽到、會議簽到、圖書館門禁、宿舍晚歸考勤統(tǒng)計等應(yīng)用。其它應(yīng)用系統(tǒng)包含快遞提取、教務(wù)管理、注冊報到等場景。
2 餐飲數(shù)據(jù)挖掘分析及結(jié)果
2.1 數(shù)據(jù)預(yù)處理
陜西工院共有在校職工1 080人,每天產(chǎn)生的餐飲消費數(shù)據(jù)在620多條,一年累計產(chǎn)生餐飲消費數(shù)據(jù)15.36萬條。由于職工餐廳是從2018年11月底才成立,截止目前,消費數(shù)據(jù)共計65 694條,數(shù)據(jù)量相比不是很大,所以將對所有數(shù)據(jù)進行分析處理。同時為了對比,提取出3個學(xué)生餐廳中所有職工的交易流水?dāng)?shù)據(jù)。
使用Python、Mapreduce、SPSS 24和Excel 2010對數(shù)據(jù)進行處理。首先對于“一卡通”系統(tǒng)平臺導(dǎo)出的數(shù)據(jù)進行預(yù)處理,包含數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約[13]。
其次,為了研究職工的消費習(xí)慣和規(guī)律,將職工餐廳數(shù)據(jù)中的消費時間離散化處理,主要思想是將時間以半小時為計量單位,例如:18:18、18:25統(tǒng)一記為18:30。因為職工餐廳的用餐時間為:早飯(6:30-9:30),午飯(11:00-13:30),晚飯(17:00-19:30),共8個小時,由于個別老師在規(guī)定用餐時間段提前或延遲消費,所以根據(jù)實際消費時間將其離散化為21個時間點。離散化后消費時間段與其對應(yīng)時間點的關(guān)系,如表1所示。
通過前期的數(shù)據(jù)預(yù)處理,已得到待分析的數(shù)據(jù),接下來會從不同角度分析研究。
2.2 所有餐廳消費情況綜合分析
有的教師喜歡在職工餐廳消費,但有的鑒于上課教室的
地理位置以及個人偏好,會選擇在就近的學(xué)生餐廳就餐。所以文中分別研究了近一年來職工餐廳、學(xué)生餐廳中教職工消費數(shù)據(jù),并做對比分析。
圖2給出了研究時間段內(nèi)的教師在職工餐廳及學(xué)生餐廳的消費情況。從圖中可以看出,除2018年11月份外,其余月份的職工餐廳消費金額均高于學(xué)生餐廳,11月份職工餐廳總額超低是因為它是從11月28日才開始營業(yè)。加之職工餐廳的單價較低,由此可以推出,在學(xué)校消費的教師中有超過一半的人員選擇職工餐廳就餐,從而減緩了用餐高峰期的擁堵現(xiàn)象,這表明職工餐廳的設(shè)立還是有一定的成效。
表2給出了每個月在職工餐廳的消費金額占所有餐廳消費金額的比重(這里只包含教職工的消費數(shù)據(jù))。從表中可以看出,近一年來職工餐廳的消費總金額占所有餐廳的50.26%,這說明職工餐廳的飯菜還是很受歡迎的。其中12月份占比最高(63.72%),這是因為剛開業(yè),菜品種類繁多、味道可口、環(huán)境優(yōu)雅,所有老師會抱著嘗鮮的心態(tài)去消費。從2019年的1月份開始,消費總額稍有下滑,經(jīng)調(diào)查發(fā)現(xiàn),一方面,老師對于長時間的自助餐模式略感乏味;另一方面,食堂的菜式花樣減少。而9、10月份的消費占比又逐漸增加,經(jīng)調(diào)研,新的一學(xué)期,餐飲部門對職工餐廳進行調(diào)整、廚師進行培訓(xùn),從味道、營養(yǎng)搭配等方面嚴格把關(guān),保證了消費的高質(zhì)量性。由此說明,只要餐飲部門進一步改善餐廳的飲食、服務(wù)等質(zhì)量,例如針對喜歡的菜品、餐廳環(huán)境等因素對教職工進行市場調(diào)研,每周、尤其是學(xué)期末可以推出爆款菜品,吸引客流量。想必假以時日,職工餐廳會真正吸引所有的教職工,成為他們飲食消費的不二之選。
前述研究的是職工餐廳與所有餐廳的整體消費情況,接下來只針對職工餐廳中的交易流水進行統(tǒng)計分析。
2.3 職工餐廳總體消費情況分析
2.3.1 職工餐廳用餐人數(shù)
通過統(tǒng)計職工餐廳中實際用餐人數(shù),發(fā)現(xiàn)有84.32%的老師近一年來至少在職工餐廳消費過一次,說明職工餐廳還是受到了老師們的青睞,如表3所示。
2.3.2 職工餐廳月消費情況
圖3 給出了近一年來職工餐廳每個月的消費金額。
從圖中看到,18年11月、19年的2、3、7、8月份消費金額均比較少。其中11月的前面已做說明,19年1月份是臨近放寒假,該餐廳不營業(yè);2月底寒假結(jié)束、正式開學(xué);7、8月份與1、2月份類似。3-6月份,9、10月份屬于教學(xué)正常時間,消費趨于穩(wěn)定。3、4月和9、10月同時開學(xué)的前兩個月,但3、4月份的消費額略高于9、10月份,這說明職工餐廳的效益從長遠看還是有降低的趨勢,這就需要餐飲部門提高重視;同時可以根據(jù)實際情況有必要的適當(dāng)增減食材,減少不必要的浪費;同時添加不同菜系的小吃等。
2.3.3 職工餐廳各時間點消費情況
運用數(shù)據(jù)透視表以“時”為步長進行統(tǒng)計,將交易流水時間數(shù)據(jù)化為整點,通過統(tǒng)計不同時間點的消費次數(shù),方便更加清晰、準確地了解餐廳的消費曲線。如圖4所示。
圖4給出了近一年來不同時間點的消費總次數(shù)。可以看出一天的消費曲線中有三個高峰期,分別在早飯的8時(即7:00-8:00),共計刷卡5630次;午飯的12時(即11:00-12:00),共計刷卡29272次;晚飯的19時(即18:00-19:00)。且午飯的12時集中爆發(fā)高峰期,刷卡次數(shù)大約是早飯8時的近3倍,這說明教職工午飯更愿意在食堂用餐,同時用餐時間也相對較集中,可能會產(chǎn)生一些擁擠現(xiàn)象;早飯8時和晚飯19時的用餐高峰相對平緩,擁擠程度不明顯,而且此階段教師用餐較分散。針對午飯用餐,餐廳可以臨時將飯菜一式兩份分布在兩個窗口,減少擁擠;適當(dāng)增加餐桌,避免“端著盤子找不到位子”的尷尬。
2.3.4 職工餐廳各餐別消費情況
結(jié)合用餐時間,利用SPSS軟件將交易流水時間進行歸類,包含三類:早飯、午飯、晚飯3個餐別。
近一年來各餐別的消費情況,如表4所示。
可以看出,午飯的消費次數(shù)大于早、晚飯之和,而且早飯的消費次數(shù)略高于晚飯,這說明部分老師可能早上第一節(jié)有課,上課前順便吃個早飯,而下午下班后會選擇回家做飯。
2.4 職工餐廳各月消費情況分析
在上表研究各餐別的基礎(chǔ)上,加上時間因素,研究每個月的消費情況。每個月各餐別的消費情況分布,如圖5所示。
從圖中可以看出18年11月-19年2月份中,每個月早、晚飯的消費金額基本相近,但從19年3月份開始,每個月的早飯消費金額高于晚飯。結(jié)合當(dāng)時的月份,天亮的早、氣溫逐漸升高,教師可能會提前出門,順便在學(xué)校享用早餐,所以早飯用餐的老師人數(shù)多于晚飯。
與此同時,每個月各餐別的就餐率,如圖6所示。
圖中可以看出,3個餐別的就餐率整體上都很低,雖然午飯的就餐率較早、晚飯高,但最高的才24.92%。晚飯的就餐率中最高的也才是11.19%,最低的為4.43%。這說明除了一部分老師選擇學(xué)生餐廳外,還有大部分的老師可能選擇在家吃飯。所以這就需要相關(guān)負責(zé)人根據(jù)前幾個月各餐別的實際就餐人數(shù)及在校老師人數(shù)來權(quán)衡食材的采購與每日供給,避免浪費。同時,針對當(dāng)?shù)厝说娘嬍沉?xí)慣和口味,每天可適當(dāng)增加面食的樣式,添加砂鍋、涼皮、香鍋冒菜等菜品,減少炒菜。飯菜樣式多了,勢必會吸引更多的教職工。
接下來討論每個時間點的月均消費情況,前面已經(jīng)將交易流水時間按每半個小時進行離散化,通過統(tǒng)計不同時間點的消費次數(shù),直觀了解餐廳的消費曲線,如圖7所示。
圖7給出了一年中不同時間點的月均消費次數(shù)。該值為2018年11月28日-2019年10月31日共計12個月的消費平均值。同樣可以看出有三個高峰期,早飯的7:30-8:30(實際時間為7:00:01-8:30:00),平均月刷卡共計1 267次;午飯的12:00-12:30(實際時間為11:30:01-12:30:00),平均刷卡共計2 439次;晚飯的18:00-19:00(實際時間為17:30:01-19:00:00)平均刷卡共計1 037次。同前面研究發(fā)現(xiàn)結(jié)果一樣,午餐的消費高峰非常突出,會出現(xiàn)用餐擁擠現(xiàn)象,早、晚飯用餐高峰先對平緩。
最后想研究一下教職工每個月的消費能力分布情況。利用SPSS統(tǒng)計出每一位消費者每月消費金額,并給出頻數(shù)直方圖,如圖8所示。從圖8中可以看出,月消費水平在50元以下的占比非常大,50-150元/月的人數(shù)相比已減少,150元/月以上的人數(shù)明顯很稀少。因為食堂日標(biāo)準為12元(早、晚飯各3元,午飯6元),若每月按22天計算,最高月消費金額為264元,故250-300段的人數(shù)極少是正常的。
若將月消費金額按以上思想劃可分為6檔,依次是:0元、1-50元、51-100元、101-150元、151-200元、201-250元、250-300元,可得出職工的月消費能力分布情況,如圖9所示。
從圖中可以看出,月消費為0元的人數(shù)還是很突兀的,經(jīng)計算發(fā)現(xiàn)有1/3的老師一年來在職工餐廳只消費過偶爾幾次。說明這些老師經(jīng)常在家吃飯,偶爾因為上課等原因臨時去職工餐廳用餐。月消費水平在1-50元的人數(shù)是最多的,51-100元的次之。這說明經(jīng)常在職工餐廳用餐的職工其實并不多,所以餐飲部門應(yīng)該結(jié)合此統(tǒng)計結(jié)果每季度做一次全面的調(diào)查問卷,進一步了解具體的原因,及時做以調(diào)整,在為用餐者提供更優(yōu)質(zhì)服務(wù)的基礎(chǔ)上增加創(chuàng)收。
由于月消費金額范圍跨度大且較為分散,為更精準獲取教職工月消費水平,宜采用聚類分析方法[14],在這里使用K-means聚類算法。K-means聚類算法是最常用的一種聚類算法,輸入為一個樣本集(或者稱為點集),通過該算法可以將樣本進行聚類,具有相似特征的樣本聚為一類[15]。
基本的步驟為:
步驟1:選定要聚類的類別數(shù)目k(如上例的k=3類),選擇k個中心點;
步驟2:針對每個樣本點,找到距離其最近的中心點(尋找組織),距離同一中心點最近的點為一個類,這樣完成了一次聚類;
步驟3:判斷聚類前后的樣本點的類別情況是否相同,如果相同,則算法終止,否則進入步驟4;
步驟4:針對每個類別中的樣本點,計算這些樣本點的中心點,當(dāng)作該類的新的中心點,繼續(xù)步驟2。
設(shè)置最大迭代次數(shù)為100,聚類類別數(shù)目為8個,通過迭代運算,最終得到結(jié)果,如表5所示。
通過表4可以看出職工月消費水平大致分為5個檔,分別為:3元、24元、51元、81元、112元,各占比59.42%、18.34%、10.23%、5.44%、3.58%。其中月消費金額在3元檔的占一半以上,印證了前述“老師一年來在職工餐廳只消費過偶爾幾次”的結(jié)論;月消費金額在24元檔和51元檔的合起來占比不到1/3,由此看出職工餐廳的效益比當(dāng)初計劃差了很多,這樣長此以往,職工餐廳的實際價值并不能很明顯地體現(xiàn)出來。
3 總結(jié)
本文以陜西工院校園“一卡通”中教職工交易流水?dāng)?shù)據(jù)為研究對象,利用分類、K-means聚類等方法,從不同角度、不同深度研究教職工在職工餐廳的就餐規(guī)律、消費水平等內(nèi)容,為學(xué)??茖W(xué)管理、后勤餐飲部門優(yōu)化資源配置提供了科學(xué)依據(jù)。
校園“一卡通”系統(tǒng)平臺是智能化校園建設(shè)的重要組成部分,是高校核心業(yè)務(wù)系統(tǒng)之一,為打造信息化管理的智能化校園提供一種快速、便捷、有效得到管理手段[16]。通過對“一卡通”系統(tǒng)中沉淀積累的數(shù)據(jù)進行挖掘、建模、分析并得出所需結(jié)果,可以為智能化校園建設(shè)提供可行性的技術(shù)方案支持,加快學(xué)校智能化校園建設(shè)進程。
參考文獻
[1] 孟昆鵬.數(shù)字校園如何向智慧校園轉(zhuǎn)型的探討——以開封技師學(xué)院為例[J].中國培訓(xùn),2016(11):52-54.
[2] 樊鐵成,高路,管晶,等.智慧校園一卡通未來發(fā)展研究[J].鄭州大學(xué)學(xué)報(工學(xué)版),2017,38(S1):25-28.
[3] 田麗.智慧校園環(huán)境下的校園一卡通建設(shè)[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),2015(S1):530-535.
[4] 賁能軍. 基于一卡通平臺數(shù)據(jù)挖掘在學(xué)生管理中的應(yīng)用分析[J].信息與電腦,2017(23):160-161.
[5] 申兵.校園一卡通對高校財務(wù)管理的影響分析[J].財經(jīng)界(學(xué)術(shù)版),2019(6):98-99.
[6] 張寧,劉宏磊,譚薇,等.基于校園一卡通的電子商務(wù)平臺的設(shè)計和實現(xiàn)[J].華中師范大學(xué)學(xué)報(自然科學(xué)版),2017,(A1):195-199.
[7] 李珊娜.基于校園一卡通平臺的數(shù)據(jù)挖掘應(yīng)用研究[J].鐵路計算機應(yīng)用,2010,19(6):55-58.
[8] 張兵兵,王建,張建威,等.數(shù)據(jù)挖掘在校園一卡通系統(tǒng)中的應(yīng)用初探[J].數(shù)理醫(yī)藥學(xué)雜志,2009,22(5):572-575.
[9] 陳鋒.基于校園一卡通系統(tǒng)的高校用戶就餐消費行為分析與數(shù)據(jù)挖掘[J].中國教育信息化,2014(9):47-49.
[10] 薛黎明,欒維新,李志淮,等.數(shù)據(jù)挖掘在校園一卡通消費數(shù)據(jù)分析中的應(yīng)用[C]//中國高等教育學(xué)會教育信息化分會.中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集.北京: 中國高等教育學(xué)會教育信息化分會,2014:8.
[11] 張四海,李珊珊.校園一卡通消費行為數(shù)據(jù)分析與研究——以南開大學(xué)為例[J].北京聯(lián)合大學(xué)學(xué)報,2019,33(1):64-68.
[12] 李珊珊,焦寶臣,曲申,等.基于校園一卡通系統(tǒng)的數(shù)據(jù)挖掘研究[J].中國教育信息化,2018(3):77-80.
[13] 馮玖,李俊玲,張海霞,等.基于數(shù)據(jù)挖掘的校園一卡通數(shù)據(jù)應(yīng)用研究[J]. 石家莊學(xué)院學(xué)報, 2017,19(3):53-58.
[14] 韓偉,胡西民,付剛,等.基于校園一卡通系統(tǒng)的餐飲消費數(shù)據(jù)分析[J].江蘇科技信息,2018,35(24):26-29.
[15] tensory.online數(shù)據(jù)挖掘十大算法(二):K-means聚類算法原理與實現(xiàn)[EB/OL].2018-07-12.https://blog.csdn.net/ten_sory/article/details/81016748.
[16] 劉宏志,喻曉旭. 基于數(shù)據(jù)挖掘的校園一卡通消費行為分析[J].信息記錄資料,2018,19(12):89-90.
(收稿日期: 2019.08.28)