曹小平,孫 暖
(重慶科創(chuàng)職業(yè)學(xué)院 人工智能學(xué)院,重慶 永川 402160)
隨著高校信息化建設(shè)的不斷推進(jìn)和發(fā)展,需要對高校的校園消費進(jìn)行信息化建設(shè),通過分析大學(xué)生和教師的校園消費信息,進(jìn)一步促進(jìn)高校的信息化管理和建設(shè),提高高校的智能信息化管理水平,根據(jù)校園消費數(shù)據(jù)分析結(jié)果,分析大學(xué)生和教師的就餐行為和消費行為信息,可以進(jìn)一步為貧困生的幫扶以及相關(guān)管理措施的制定提供數(shù)據(jù)基礎(chǔ)[1],從而提高校園信息化智能管理水平。研究校園消費數(shù)據(jù)的可視化分析平臺,在高校的智能信息化建設(shè)和管理中發(fā)揮重要作用,相關(guān)的平臺建設(shè)設(shè)計研究受到人們的極大關(guān)注[2]。較傳統(tǒng)設(shè)計方法相比,本文設(shè)計的校園消費數(shù)據(jù)可視化分析平臺具有校園消費數(shù)據(jù)的融合調(diào)度處理特點,以及能夠計算校園消費數(shù)據(jù)的窗口最大容納量的特點,系統(tǒng)穩(wěn)定性較高,可視化分析能力較強。
設(shè)計基于校園消費數(shù)據(jù)的可視化分析平臺,首先進(jìn)行了平臺的總體設(shè)計構(gòu)架分析和功能設(shè)計分析,平臺的功能實現(xiàn)包括了服務(wù)端的實現(xiàn)和客戶端實現(xiàn),主要分析了校園的就餐行為和擁擠度預(yù)測,結(jié)合數(shù)據(jù)分析和K-均值聚類方法,實現(xiàn)校園消費數(shù)據(jù)的可視化分析,從而設(shè)計了通用化的校園消費數(shù)據(jù)可視化分析平臺,最后進(jìn)行仿真測試,得出有效性結(jié)論。
首先分析校園消費數(shù)據(jù)可視化分析平臺的總體結(jié)構(gòu)構(gòu)架,并進(jìn)行校園消費數(shù)據(jù)可視化分析的功能模塊結(jié)構(gòu)設(shè)計,校園消費數(shù)據(jù)可視化分析平臺建立在通用計算機平臺上[3],校園消費信息分析數(shù)據(jù)的采集來自于就餐的刷卡相關(guān)信息,結(jié)合視頻監(jiān)控信息、飯卡充值數(shù)據(jù)信息以及消費數(shù)據(jù)信息等,進(jìn)行大學(xué)生就餐信息采集,采用ARM作為核心控制單元,進(jìn)行校園消費數(shù)據(jù)可視化平臺的嵌入式構(gòu)造設(shè)計,結(jié)合物聯(lián)網(wǎng)技術(shù)和ZigBee技術(shù)進(jìn)行的校園消費數(shù)據(jù)可視化分析平臺的網(wǎng)絡(luò)開發(fā)設(shè)計,采用VIX總線控制技術(shù)構(gòu)建校園消費數(shù)據(jù)可視化分析平臺的總線模塊[4],采用嵌入式總線控制方法,進(jìn)行校園消費數(shù)據(jù)可視化分析和信息調(diào)度。平臺的總體設(shè)計構(gòu)架包括貧困生就餐行為分析模塊、大學(xué)生就餐行為分析模塊、教師就餐行為分析模塊以及就餐擁擠度情況預(yù)測模塊等,首先在用戶控制模塊進(jìn)行參數(shù)輸入,初始化消費統(tǒng)計參數(shù),在數(shù)據(jù)處理模塊進(jìn)行數(shù)據(jù)分析和可視化預(yù)測,在輸出模塊顯示校園消費的數(shù)據(jù)分析和統(tǒng)計結(jié)果,根據(jù)上述總體設(shè)計構(gòu)架,得到校園消費數(shù)據(jù)可視化分析平臺的總體構(gòu)架如圖1所示。
根據(jù)圖1所示的校園消費數(shù)據(jù)可視化分析平臺的總體結(jié)構(gòu)構(gòu)架,采用ADSP21160集成處理器系統(tǒng)作為校園消費數(shù)據(jù)可視化分析平臺主控模塊,結(jié)合PLC邏輯信息分析技術(shù),進(jìn)行校園消費數(shù)據(jù)可視化分析平臺轉(zhuǎn)換和數(shù)據(jù)分析[5]。
圖1 校園消費數(shù)據(jù)可視化分析平臺的總體構(gòu)架
為了實現(xiàn)對校園消費數(shù)據(jù)的可視化分析,需要結(jié)合SPSS統(tǒng)計分析技術(shù)和傳感信息融合技術(shù),進(jìn)行校園消費數(shù)據(jù)采樣,平臺的功能模塊分為貧困生就餐行為分析模塊、大學(xué)生就餐行為分析模塊、教師就餐行為分析模塊以及就餐擁擠度情況預(yù)測模塊等,平臺分為用戶子系統(tǒng)和后臺管理子系統(tǒng)[6],首先在用戶子系統(tǒng)中建立登錄注冊模塊和賬號管理模,構(gòu)建校園消費數(shù)據(jù)可視化分析平臺的網(wǎng)絡(luò)通信模塊,結(jié)合各種消費項目,進(jìn)行用戶的消費行為和就餐行為分析,根據(jù)就餐信息反饋結(jié)果,進(jìn)行校園消費數(shù)據(jù)的可視化平臺的用戶模塊構(gòu)造,采用信息分類管理的方法,進(jìn)行校園消費數(shù)據(jù)的可視化平臺的網(wǎng)絡(luò)控制和用戶管理,根據(jù)上述分析,得到校園消費數(shù)據(jù)的可視化平臺的功能模塊構(gòu)成如圖2所示。
圖2 校園消費數(shù)據(jù)可視化平臺的功能模塊構(gòu)成
基于C/S客戶端服務(wù)器建立學(xué)生校園消費數(shù)據(jù)可視化分析平臺的服務(wù)端模塊,在Qt/Embedded中進(jìn)行學(xué)生校園消費數(shù)據(jù)可視化分析平臺的應(yīng)用軟件設(shè)計,在Linux內(nèi)核中開發(fā)學(xué)生校園消費數(shù)據(jù)可視化分析平臺的移動終端APP,在嵌入式ARM總線控制協(xié)議下建立平臺的內(nèi)核結(jié)構(gòu),進(jìn)行校園消費數(shù)據(jù)可視化分析平臺的網(wǎng)絡(luò)模塊化開發(fā)和嵌入式設(shè)計,平臺的服務(wù)端分為貧困生就餐信息控制、大學(xué)生就餐信息控制和教師就餐信息控制等,在CPU寄存器中建立校園消費數(shù)據(jù)可視化分析平臺的客戶端,采用ISA/EISA構(gòu)架模式進(jìn)行校園消費數(shù)據(jù)可視化分析平臺的總線開發(fā)設(shè)計,設(shè)計校園消費數(shù)據(jù)可視化分析平臺的總線傳輸協(xié)議,綜上分析,得到平臺的服務(wù)端模塊結(jié)構(gòu)如圖3所示。
圖3 平臺的服務(wù)端模塊結(jié)構(gòu)
客戶端采用標(biāo)準(zhǔn)的JTAG(Joint Test Action Group;聯(lián)合測試工作組)接口:TMS(Test mode selection;測 試 模 式 選 擇)、TCK(Test clock input;測 試 時 鐘 輸 入)、TDI(Test data input;測試數(shù)據(jù)輸入)、TDO(Test data output;測試數(shù)據(jù)輸出)進(jìn)行校園消費數(shù)據(jù)可視化分析分析平臺的輸出接口設(shè)計,實現(xiàn)人機交互設(shè)計,在智能控制過程中實現(xiàn)校園消費數(shù)據(jù)可視化分析和人機交互。通過32位嵌入式設(shè)計方法進(jìn)行校園消費數(shù)據(jù)可視化分析平臺的輸出信息調(diào)度。選取DS18B20作為校園消費數(shù)據(jù)可視化分析平臺的外圍總線,結(jié)合交叉編譯控制技術(shù),進(jìn)行校園消費數(shù)據(jù)可視化分析平臺的編譯控制和指令加載,設(shè)計程序加載模塊,進(jìn)行平臺的人機交互設(shè)計和人工智能控制,選擇ADI公司的ADM706嵌入式處理器作為校園消費數(shù)據(jù)可視化分析平臺總線控制終端模塊,利用ADSP-BF537BBC-5A實現(xiàn)校園消費數(shù)據(jù)可視化分析和總線設(shè)計,根據(jù)上述分析,得到客戶端設(shè)計如圖4所示。
圖4 校園消費數(shù)據(jù)可視化客戶端設(shè)計
在上述總體設(shè)計和功能模塊設(shè)計的基礎(chǔ)上,進(jìn)行校園消費數(shù)據(jù)的可視化分析[7-8],采用串口最大容納量預(yù)測的方法進(jìn)行校園消費數(shù)據(jù)預(yù)測評估,結(jié)合K-均值聚類分析技術(shù)進(jìn)行校園消費數(shù)據(jù)的融合調(diào)度處理,構(gòu)建校園消費數(shù)據(jù)分布式存儲結(jié)構(gòu)模型,假設(shè)Nk(k=0,1,…,L)表示第k層校園消費數(shù)據(jù)主動融合的分布集的個數(shù);表示校園消費數(shù)據(jù)在數(shù)據(jù)采樣中第k-1層的第i個節(jié)點的模糊隸屬度函數(shù),采用多層規(guī)劃的方法,構(gòu)建校園消費數(shù)據(jù)主動融合的最大獨立平均分布集函數(shù)P(n i)={p k|pr kj=1,k=1,2,…,m},初始化校園消費數(shù)據(jù)的分類區(qū)間,在模糊聚類中心F(x i,A j(L)),i=1,…,m,j=1,…,k,采用關(guān)聯(lián)規(guī)則挖掘方法,進(jìn)行校園消費數(shù)據(jù)主動融合的特征挖掘,得到校園消費數(shù)據(jù)的模糊隸屬函數(shù)為:
其中,P fi表示校園消費數(shù)據(jù)融合過程中的模糊聚類中心,P di為校園消費數(shù)據(jù)的先驗概率密度,設(shè)計校園消費數(shù)據(jù)的區(qū)域融合特征分布集,得到模糊統(tǒng)計特征量為:
其中,s c(t)表示校園消費數(shù)據(jù)的特征屬性,ej2πf0t表示直覺模糊信息,校園消費數(shù)據(jù)的空間分布式存儲特征分布為:
假定校園消費數(shù)據(jù)的簇內(nèi)分布函數(shù):
對校園消費數(shù)據(jù)采用空間區(qū)域信息融合的方法進(jìn)行K-均值聚類處理,實現(xiàn)校園消費數(shù)據(jù)的優(yōu)化聚類,聚類輸出為:
其中
根據(jù)上述分析,構(gòu)建校園消費數(shù)據(jù)的窗口最大容納量模型,結(jié)合K-均值聚類算法,進(jìn)行校園消費數(shù)據(jù)的可視化分析和調(diào)度[9-10]。
在采用模糊K-均值聚類算法實現(xiàn)校園消費數(shù)據(jù)特征量聚類分析的基礎(chǔ)上,進(jìn)行窗口最大容納量計算[11],對關(guān)聯(lián)系數(shù)ρ(k)進(jìn)行自適應(yīng)修正,得到校園消費數(shù)據(jù)窗口最大容納量的約束函數(shù):
其中λ為校園消費數(shù)據(jù)的統(tǒng)計特征量,通過對校園消費數(shù)據(jù)的信息融合處理,建立校園消費數(shù)據(jù)模糊聚類和自適應(yīng)調(diào)度模型,輸出為:
結(jié)合校園消費的數(shù)據(jù)的模糊度檢索方法,得到校園消費的數(shù)據(jù)的預(yù)測模型為:
據(jù)上述預(yù)測結(jié)果,實現(xiàn)校園消費數(shù)據(jù)的窗口最大容納量計算,根據(jù)計算結(jié)果實現(xiàn)就餐行為和擁擠度預(yù)測分析[11]。
為了分析時間段與刷卡次數(shù)的關(guān)系,收集三食堂周一到周三從10:00到13:00時間段內(nèi)的pos機的刷卡次數(shù),每隔10分鐘統(tǒng)計一次,將采集到的數(shù)據(jù)進(jìn)行可視化作圖,得到如圖5所示,從圖中可以看出整體刷卡次數(shù)先增大后減小,在12:00左右達(dá)到峰值,因為12:00是學(xué)校下課學(xué)生開始午餐時間,所以此時刷卡人數(shù)回達(dá)到最高,符合實際情況,隨后隨著時間的增加,人數(shù)越來越少。我們分析了周一到周三的數(shù)據(jù),數(shù)據(jù)的波動程度相似,符合學(xué)生的作息規(guī)律。
圖5 時間與刷卡次數(shù)的關(guān)系圖
接下來我們對學(xué)生的近三個月的消費數(shù)據(jù)進(jìn)行統(tǒng)計分析,以便對貧困學(xué)生的消費水平和一般學(xué)生的消費水平進(jìn)行區(qū)分。采取1000個學(xué)生近三個月的消費作為樣本,取每個月的消費的平均值,并對數(shù)據(jù)采用歸一化處理,采取kmeans算法進(jìn)行聚類,得到聚類的結(jié)果如圖6所示:藍(lán)色的點表示藍(lán)色的點表示消費水平在600元以下,有理由認(rèn)為這些學(xué)生中很可能存在貧困生,綠色的點代表消費水平在600-1000元之間屬于普通家庭消費,而黃色的點表示消費水平高于1000的人數(shù)。通過對學(xué)生消費水平的進(jìn)行聚類可以很容易找到貧困學(xué)生,從而對貧困生進(jìn)行補助。
圖6 學(xué)生消費水平的k-means聚類
根據(jù)上述算法設(shè)計和系統(tǒng)模塊化設(shè)計,構(gòu)建平臺的用戶表示層、業(yè)務(wù)邏輯層、數(shù)據(jù)鏈路層,在嵌入式Linux內(nèi)核下,實現(xiàn)校園消費數(shù)據(jù)可視化分析平臺的開發(fā)設(shè)計,在此基礎(chǔ)上進(jìn)行仿真實驗分析,結(jié)合Matlab仿真工具,采用Simulink構(gòu)造校園消費數(shù)據(jù)的可視化分析平臺的接口,設(shè)定校園消費數(shù)據(jù)的模糊采樣時間間隔為0.45s,對校園消費數(shù)據(jù)的離散采樣頻率為,對校園消費數(shù)據(jù)K-均值聚類的迭代步數(shù)為200,根據(jù)上述參數(shù)設(shè)定,進(jìn)行校園消費的數(shù)據(jù)分析,得到原始的數(shù)據(jù)采集結(jié)果如圖7所示。
以圖7的數(shù)據(jù)為輸入,通過Bridge Api調(diào)用原生控件,采用Mysql構(gòu)建數(shù)據(jù)庫,實現(xiàn)校園消費的數(shù)據(jù)的可視分析,測試數(shù)據(jù)召回率,得到對比結(jié)果如圖8所示:
圖7 校園消費的數(shù)據(jù)采樣
圖8 數(shù)據(jù)召回性能測試
分析圖8可知,在進(jìn)行迭代步數(shù)的數(shù)據(jù)召回性能測試時,本文算法召回率對比PID算法和支持向量機算法的召回率較高。設(shè)計的校園消費數(shù)據(jù)可視化分析平臺的系統(tǒng)穩(wěn)定性較好,對校園消費數(shù)據(jù)的統(tǒng)計分析結(jié)果準(zhǔn)確可靠。
本文采用F度量值作為聚類結(jié)果的評價標(biāo)準(zhǔn)。該方法同時兼顧了查準(zhǔn)率(P)和查全率(R)兩個指標(biāo),P和R分別由下面的計算公式得到。
其中,T P為預(yù)測為貧困生的同學(xué)是真實的貧困生,即聚類的正確個數(shù),F(xiàn)P為非貧困生被劃分為貧困生的個數(shù),F(xiàn) N為貧困生類被劃分非貧困生類的個數(shù),T P+FP表示實際分類的同學(xué),TP+FN表示應(yīng)有的貧困生個數(shù)。為更客觀地評價聚類性能,本研究對傳統(tǒng)的算法進(jìn)行多次隨機選擇初始聚類中心完成聚類,對本文提出的初始中心選擇算法,也是選取了多個密度閾值進(jìn)行聚類,分別取各自最佳的一次結(jié)果。表1是傳統(tǒng)的k-means算法與改進(jìn)后的模糊k-means算法的F值的實驗結(jié)果。
表1 與傳統(tǒng)k-means算法的F值比較
從表1中不難發(fā)現(xiàn),改進(jìn)后的聚類算法F值相對比較穩(wěn)定比傳統(tǒng)的FCM和k-means的F值大,這說明本文采取的聚類算法效果較好與上述兩種算法,而不像傳統(tǒng)kmeans和FCM算法的F值上下波動比較大,此外,改進(jìn)后的算法總體的聚類準(zhǔn)確度有所提高。
通過分析大學(xué)生和教師的校園消費信息,進(jìn)一步促進(jìn)高校信息化管理和建設(shè),提高高校智能信息化管理水平,對接入數(shù)據(jù)源進(jìn)行參數(shù)初始化設(shè)置,實現(xiàn)校園消費的數(shù)據(jù)分析和統(tǒng)計,提出基于校園消費數(shù)據(jù)的可視化分析平臺。通過C/S模塊化設(shè)計技術(shù),建立校園消費數(shù)據(jù)可視化分析平臺的服務(wù)端和客戶端,采用串口最大容納量預(yù)測方法進(jìn)行校園消費數(shù)據(jù)預(yù)測評估,結(jié)合K-均值聚類分析技術(shù)進(jìn)行校園消費數(shù)據(jù)的融合調(diào)度處理,實現(xiàn)校園消費數(shù)據(jù)的窗口最大容納量計算,根據(jù)計算結(jié)果實現(xiàn)就餐行為和擁擠度預(yù)測分析。所設(shè)計可視化分析平臺的創(chuàng)新點是:校園消費數(shù)據(jù)的融合調(diào)度處理與計算校園消費數(shù)據(jù)的窗口最大容納量。
在嵌入式Linux內(nèi)核下,實現(xiàn)校園消費數(shù)據(jù)可視化分析平臺的開發(fā)設(shè)計。研究得知,設(shè)計的校園消費數(shù)據(jù)可視化分析平臺的系統(tǒng)穩(wěn)定性較好,對校園消費數(shù)據(jù)的統(tǒng)計分析結(jié)果準(zhǔn)確可靠,具有很好的應(yīng)用價值。