摘 要:本文針對高職院校創(chuàng)新創(chuàng)業(yè)課程傳播數(shù)據(jù)冗雜、技術(shù)發(fā)展過快等現(xiàn)狀,結(jié)合試驗法設(shè)計了高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺。采用FCM聚類算法、特征選擇算法以及mRMR算法對數(shù)據(jù)進(jìn)行處理。結(jié)果表明,高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺數(shù)據(jù)可視化、數(shù)據(jù)分析維度包括每日登錄人數(shù)分析、平均學(xué)習(xí)時長分析、學(xué)習(xí)行為次數(shù)分析、每日活躍情況分析和分時段學(xué)習(xí)人數(shù)分析。最終使用ECharts可視化工具對在線教育平臺在學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)進(jìn)行可視化大屏展現(xiàn),教育數(shù)據(jù)可視化能夠了解教學(xué)方向,為學(xué)生學(xué)習(xí)提供幫助。
關(guān)鍵詞:教育傳播;大數(shù)據(jù);可視化;ECharts
中圖分類號:G 434 " " " " 文獻(xiàn)標(biāo)志碼:A
隨著人工智能、大數(shù)據(jù)技術(shù)快速發(fā)展,人工智能+教育也成為現(xiàn)代科技研究的熱點。AI技術(shù)在教育、教學(xué)等領(lǐng)域發(fā)揮重要作用,圍繞“AI學(xué)習(xí)服務(wù)平臺”的各種創(chuàng)新創(chuàng)業(yè)課程可幫助院校學(xué)生加強創(chuàng)新創(chuàng)業(yè)的理解和實踐能力,利用人工智能對高職院校創(chuàng)新創(chuàng)業(yè)進(jìn)行數(shù)據(jù)板塊處理,能夠推動高職院校就業(yè)率的提高[1]。《中國高校創(chuàng)新創(chuàng)業(yè)教育發(fā)展藍(lán)皮書(2017)》指出,新時期的創(chuàng)新創(chuàng)業(yè)教育對于深化高校教育改革、完善人才發(fā)展機制、支撐“雙創(chuàng)”以及創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略有重要意義[2]。作為大學(xué)生創(chuàng)新創(chuàng)業(yè)的重要組成部分,大數(shù)據(jù)與AI為大學(xué)生的創(chuàng)新創(chuàng)業(yè)行為提供了強有力支撐,如何利用AI和云計算技術(shù)對大學(xué)生進(jìn)行創(chuàng)新創(chuàng)業(yè)引導(dǎo),成為目前高校創(chuàng)新創(chuàng)業(yè)教育面臨的一個重要課題。目前,大數(shù)據(jù)、AI等應(yīng)用越來越多,各高校紛紛搭建各自的大數(shù)據(jù)與AI技術(shù)平臺。因此,高職院校要跟上時代步伐,全面發(fā)展,搭建起自己的大數(shù)據(jù)和AI技術(shù)平臺,培養(yǎng)具有大數(shù)據(jù)思維能力和AI技能的新一代人才,為國家的經(jīng)濟建設(shè)培養(yǎng)出更多創(chuàng)新創(chuàng)業(yè)型優(yōu)秀人才。本文以“大數(shù)據(jù)”與“AI”為基礎(chǔ),對高職院?!按髮W(xué)生創(chuàng)新創(chuàng)業(yè)”教育進(jìn)行了探討。
1 高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺算法研究
1.1 功能分析
高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺功能分析如圖1所示。1)在線課程:平臺提供了全面的AI和云計算課程,包括理論知識和實踐操作,方便學(xué)生隨時隨地學(xué)習(xí)。2)互動學(xué)習(xí):平臺提供了在線討論、實時問答、在線測試等功能,方便學(xué)生與學(xué)生、學(xué)生與老師間的交流和互動。3)虛擬試驗:通過云計算技術(shù),平臺為學(xué)生提供了虛擬試驗環(huán)境,使學(xué)生能在沒有硬件設(shè)備的情況下進(jìn)行試驗操作。4)創(chuàng)新創(chuàng)業(yè)支持:平臺為學(xué)生提供了創(chuàng)新創(chuàng)業(yè)資源和指導(dǎo),鼓勵學(xué)生在課程中開展創(chuàng)新創(chuàng)業(yè)活動。
1.2 相關(guān)算法
1.2.1 FCM聚類算法
高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺的主要算法為FCM聚類算法[3],該算法可將同一類型數(shù)據(jù)進(jìn)行整合。FCM聚類算法的基本原理是模糊理論,這種模糊理論從客觀事實出發(fā),可處理模糊不確定的事物,又稱模糊C均值算法。確定AI云計算學(xué)習(xí)服務(wù)平臺模型的輸入、輸出后,需要對輸入的數(shù)據(jù)進(jìn)行形式化定義。FCM是將n個用戶數(shù)據(jù)作為n個向量xi,其中涉及隸屬關(guān)系,F(xiàn)CM算法的模糊隸屬度的取值范圍為[0,1],該算法的實質(zhì)是構(gòu)建模糊矩陣U,矩陣中每個要素都是各矢量的糊隸屬度,值的范圍為[0,1],歸類后的每個元素的模糊隸屬度之和均為1。
FCM聚類算法如公式(1)所示。
(1)
FCM聚類算法的目標(biāo)函數(shù)如公式(2)、公式(3)所示。
(2)
dij=||cj-xj|| " "(3)
式中:uij的取值范圍為[0,1];ci為模糊類i的聚類中心;dij為第i個聚類中心到第j向量間的歐式距離;m為加權(quán)指數(shù),其取值范圍為[1,∞]。
為使目標(biāo)函數(shù)取得最小值,做出以下改進(jìn),如公式(4)所示。
(4)
式中:λj為n個約束式的拉格朗日因子。
目標(biāo)函數(shù)取得最小值需要前提,其必要條件如公式(5)、公式(6)所示。
(5)
(6)
1.2.2 聚類有效性函數(shù)
AI云計算學(xué)習(xí)服務(wù)平臺進(jìn)行聚類分析時需要確定分類效果,聚類有效度函數(shù)是評價聚類效果的一種方法,能較好地評價聚類的分類效果,增強對各創(chuàng)新創(chuàng)業(yè)類型的表達(dá)能力。計算時,其特性值并不是固定的,因此可通過類間分離性和類內(nèi)緊性來間接判定聚類效果,通過對聚類有效性函數(shù)可以判定二者間的相關(guān)性。
用戶與類內(nèi)用戶間的相似度如公式(7)所示。
(7)
類內(nèi)平均值如公式(8)所示。
(8)
某一類數(shù)據(jù)的類內(nèi)緊密度如公式(9)所示。
(9)
1.2.2.1 聚類評價指標(biāo)
MIA指標(biāo):MIA函數(shù)如公式(10)所示。
(10)
式中:N為用戶的個數(shù);MIA為類內(nèi)距離和的平均值,MIA的值越小,聚類效果越好。
CDI指標(biāo):CDI函數(shù)如公式(11)所示。
(11)
式中:Xc為第c類用戶;CDI為類內(nèi)緊密度的平均值,CDI的值越小,聚類效果越好。
SI指標(biāo):SI函數(shù)如公式(12)所示。
(12)
式中:為每個向量與平均值間距離和;為每個聚類中心與平均值間的距離和;SI的值越小,聚類效果越好。
DBI指標(biāo):DBI函數(shù)如公式(13)所示。
(13)
式中:DBI為類內(nèi)距離與類間距離的比值,DBI的值越小,聚類效果越好。
1.2.2.2 聚類效果
該模型對AI云計算學(xué)習(xí)服務(wù)平臺700個樣本進(jìn)行驗證,結(jié)合四項指標(biāo)和聚類數(shù)目2~9,模型的指標(biāo)或者模型樣本特征提取可作為模型輸入變量,指標(biāo)分析見表1。利用FCM算法,對用戶數(shù)據(jù)(X3)、輸入數(shù)據(jù)(X1)和輸出數(shù)據(jù)(X2)進(jìn)行論述。
由表1可知,當(dāng)聚類數(shù)目為4時,各類指標(biāo)值均為最小值,聚類效果最好。聚類時,AI云計算學(xué)習(xí)服務(wù)平臺可結(jié)合需求,聚類效果最好。
1.2.3 協(xié)同過濾推薦算法
1.2.3.1 基于AI云計算學(xué)習(xí)服務(wù)平臺用戶的UCF
基于用戶的協(xié)同過濾算法(User-based Collaborativen Filtering,UCF)的主要做法是找到一群愛好相似的用戶,即基于AI云計算學(xué)習(xí)服務(wù)平臺用戶的協(xié)同過濾(Collaborative Filtering,CF)算法或基于相鄰者的協(xié)同過濾(Neighbor-based Collaborativen Filtering)算法。用戶與用戶間的相似度通常用Jaccard公式或余弦相似度來計算,可以更直觀地觀察到2個用戶的相似度。設(shè)M(u)是用戶u中意項目的集合,M(v)為用戶v中意項目的集合,則u和v的相似度如下所示。
余弦相似度如公式(14)所示。
(14)
Jaccard公式如公式(15)所示。
(15)
UCF通過對相關(guān)數(shù)據(jù)進(jìn)行搜集,掌握使用者的創(chuàng)業(yè)創(chuàng)新數(shù)據(jù),再根據(jù)用戶間的相似性找出與此用戶相近的一群人,并根據(jù)創(chuàng)業(yè)創(chuàng)新數(shù)據(jù)信息推送相關(guān)創(chuàng)業(yè)創(chuàng)新內(nèi)容。
1.2.3.2 基于項目的ICF
隨著用戶數(shù)量增加,UCF消耗的計算時間越來越多。因此出現(xiàn)了另一種CF,即基于項目的協(xié)同過濾(Item-based Collaborative Filtering,ICF)算法。ICF的基本假設(shè)如下:如果用戶中意一個項目,那么與該項目相似的其他項目也有可能引起用戶的興趣。項目間的相似性用數(shù)學(xué)方法進(jìn)行計算。項目相似度的計算過程如公式(16)所示。
(16)
式中:|M(i)|是喜歡項目i的用戶數(shù);|M(j)|是喜歡項目j的用戶數(shù)。
ICF的方法步驟如下:收集相應(yīng)信息,計算已評價的項目和預(yù)測項目的相似度,并以此為基礎(chǔ)得出預(yù)測項目的預(yù)測分?jǐn)?shù),最終產(chǎn)生推薦結(jié)果。
首先,分類準(zhǔn)確度是指判斷一個項目是否迎合了用戶的偏好且結(jié)果正確的比例,包括召回率和準(zhǔn)確率。設(shè)U為用戶集,Ru為用戶u的推薦列表,Bu為測試集中用戶給予正反饋的項目。
準(zhǔn)確率是指在推薦的結(jié)果中,用戶在現(xiàn)實中給過正反饋的項目所占的比例。單個用戶u的準(zhǔn)確率如公式(17)所示。
(17)
整個推薦系統(tǒng)的準(zhǔn)確率如公式(18)所示。
(18)
召回率是指在測試集中,用戶給過正反饋的項目占測試集的比例。單個用戶u的召回率如公式(19)所示。
(19)
整個系統(tǒng)的召回率如公式(20)所示。
(20)
其次,預(yù)測準(zhǔn)確度是指預(yù)測用戶對項目的評分的行為,包括均方根誤差(Root Mean Square Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE)。
均方根誤差RMSE如公式(21)所示。
(21)
式中:Ωtest為測試集;ruv用戶u對項目v的實際評分;yuv表示預(yù)測評分。
平均絕對誤差MAE如公式(22)所示。
(22)
2 高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺設(shè)計
2.1 設(shè)計目標(biāo)
該平臺是一個在線學(xué)習(xí)平臺,專為高職院校的創(chuàng)新創(chuàng)業(yè)課程而設(shè)計。平臺結(jié)合了人工智能和云計算技術(shù),提供了豐富的課程資源和互動工具,使學(xué)生可以在線學(xué)習(xí)AI和云計算知識,并參與各種實踐活動。
2.2 數(shù)據(jù)處理
將AI云計算學(xué)習(xí)服務(wù)應(yīng)用于高職院校的創(chuàng)新創(chuàng)業(yè)課程數(shù)據(jù)處理中,可有效提高教學(xué)質(zhì)量和學(xué)生的學(xué)習(xí)效果。隨著技術(shù)不斷進(jìn)步和應(yīng)用領(lǐng)域不斷拓展,AI云計算學(xué)習(xí)服務(wù)平臺將在高職教育中發(fā)揮更大作用,為培養(yǎng)高素質(zhì)的技術(shù)技能人才提供有力支持。1)數(shù)據(jù)采集。本次試驗使用的數(shù)據(jù)集是創(chuàng)業(yè)網(wǎng)站的公開數(shù)據(jù)集。這個數(shù)據(jù)集包括470多萬條評論和15多萬企業(yè)信息。下載SQL版數(shù)據(jù)集,將其存儲在MySQL數(shù)據(jù)庫中。通過AI云計算學(xué)習(xí)平臺收集學(xué)生在創(chuàng)新創(chuàng)業(yè)課程中的學(xué)習(xí)數(shù)據(jù),包括學(xué)習(xí)進(jìn)度、成績和反饋等信息。2)數(shù)據(jù)處理。利用AI技術(shù)對收集的數(shù)據(jù)進(jìn)行清洗、分類、分析和挖掘,提取有價值的信息,為教學(xué)提供決策支持。3)數(shù)據(jù)應(yīng)用。將處理后的數(shù)據(jù)應(yīng)用于教學(xué)實踐中,優(yōu)化教學(xué)資源配置,提高教學(xué)質(zhì)量。同時引導(dǎo)學(xué)生利用數(shù)據(jù)解決實際問題,培養(yǎng)他們的創(chuàng)新意識和創(chuàng)業(yè)能力。
2.3 試驗結(jié)果分析
將處理好的數(shù)據(jù)使用上述設(shè)計模型進(jìn)行訓(xùn)練。其中訓(xùn)練數(shù)據(jù)用于訓(xùn)練LDA模型,測試數(shù)據(jù)用于對訓(xùn)練好的模型進(jìn)行推薦結(jié)果測試。與其他推薦系統(tǒng)類似,本文將準(zhǔn)確率(Precision)作為評估標(biāo)準(zhǔn)。Precision@K是指對所有測試集評論進(jìn)行推薦的平均Top K準(zhǔn)確度。本文將分別計算Precision@1、Precison@5、Precision@10和Precision@15,用于衡量模型的性能。為了分別觀察不同主題個數(shù)對推薦結(jié)果的影響,分別選取主題個數(shù)5、10、15、20,25和30,分別訓(xùn)練出對應(yīng)的模型,然后利用訓(xùn)練出來的模型進(jìn)行推薦并計算其Precision@K。不同主題數(shù)目下的Precision@5、Precision@10和Precision@15分別如圖2、圖3所示。
不同主題數(shù)目的Precision@K對比如圖4所示。從圖4可以看出,高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺主題數(shù)目設(shè)置為20時,推薦結(jié)果較好。
2.4 系統(tǒng)實現(xiàn)
高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺提供了豐富的學(xué)習(xí)資源,包括課程資料、案例分析和實踐項目等,方便學(xué)生自主學(xué)習(xí)和團隊協(xié)作,為學(xué)生提供一個在線學(xué)習(xí)交流的平臺,方便學(xué)生間進(jìn)行互動和討論,提高學(xué)生的參與度和學(xué)習(xí)效果。支持學(xué)生在平臺上開展實踐項目,提供項目進(jìn)度管理、團隊協(xié)作等功能,幫助學(xué)生提高實踐能力。利用人工智能技術(shù),根據(jù)學(xué)生的學(xué)習(xí)情況和興趣愛好,為學(xué)生推薦相關(guān)學(xué)習(xí)資源和項目,提高學(xué)生的學(xué)習(xí)效率。對學(xué)生的學(xué)習(xí)情況和教師的教學(xué)效果進(jìn)行數(shù)據(jù)分析,為學(xué)校的管理和決策提供依據(jù)。并將分析結(jié)果反饋給教師和學(xué)生,幫助他們改進(jìn)學(xué)習(xí)和教學(xué)。
3 結(jié)論
結(jié)合上述分析,高職院校創(chuàng)新創(chuàng)業(yè)課程學(xué)習(xí)服務(wù)平臺需要進(jìn)一步完善,尤其在AI云計算發(fā)展方面。為了提高教學(xué)水平和學(xué)生參與度,本文結(jié)合現(xiàn)代化AI技術(shù),設(shè)計了高職院校創(chuàng)新創(chuàng)業(yè)課程AI云計算學(xué)習(xí)服務(wù)平臺。該系統(tǒng)在教學(xué)內(nèi)容上將AI和云計算技術(shù)與資源相結(jié)合,通過AI技術(shù)的“真實感”加強學(xué)生對創(chuàng)新創(chuàng)業(yè)課程學(xué)習(xí)的興趣。因此,將AI和云計算技術(shù)應(yīng)用于學(xué)習(xí)平臺,能夠更有效地推動創(chuàng)新創(chuàng)業(yè)活動,增加學(xué)生對創(chuàng)新創(chuàng)業(yè)的了解。
參考文獻(xiàn)
[1]田西雨,吳淑蘋.教育大數(shù)據(jù)分析模型與服務(wù)平臺建構(gòu)研究——以國家開放大學(xué)教學(xué)分析平臺為例[J].重慶開放大學(xué)學(xué)報,2023,35(3):32-41.
[2]方海光,孔新梅,洪心,等.面向教育數(shù)字化服務(wù)的教育數(shù)據(jù)模型體系研究[J].遠(yuǎn)程教育雜志,2022,40(4):45-54.
[3]李國峰.教育大數(shù)據(jù)背景下智慧學(xué)習(xí)系統(tǒng)模型的構(gòu)建研究[J].北京城市學(xué)院學(xué)報,2021(1):59-64.