張 源(安徽醫(yī)學高等專科學校,安徽 合肥 230601)
?
高校人才評估的數(shù)據(jù)結(jié)構(gòu)設計
張 源
(安徽醫(yī)學高等??茖W校,安徽 合肥 230601)
摘 要:為了建立教育文化大數(shù)據(jù),探索發(fā)揮大數(shù)據(jù)對變革教育方式、促進教育公平、提升教育質(zhì)量的支撐作用,本文通過科學的數(shù)據(jù)分析方法設計的分析框架結(jié)構(gòu),結(jié)合大數(shù)據(jù)分析理念,為高等院校的教師人才培養(yǎng)提出一些科學的建議和評價,為教師的培養(yǎng)評估提出定量和定性綜合性評價打下基礎。
關鍵詞:數(shù)據(jù)分析;交叉驗證算法;定量與定性評價
本論文建立在相關研究的基礎上,形成了比較適合高等院校的教師人才評估模型,該模型從三個維度描述教師人才的結(jié)構(gòu)。本論文提出一個三層模型:師德師風、教學質(zhì)量、科研質(zhì)量,進而對獲取數(shù)據(jù)進行分析和數(shù)據(jù)挖掘,得到一些有價值的信息。
對高校教師人才評估數(shù)據(jù)的分析研究的技術框架,如圖1所示
圖1 教師人才培養(yǎng)評估的數(shù)據(jù)分析研究框架圖
2.1樣本數(shù)據(jù)的來源和預處理
本論文針對部分教師的師德評價、教學質(zhì)量考核、科研質(zhì)量數(shù)據(jù)庫進行數(shù)據(jù)的采集和預處理。數(shù)據(jù)采集的來源:學生測評、同行評價,專家評價,教學質(zhì)量考核數(shù)據(jù)庫、科研質(zhì)量賦分數(shù)據(jù)庫,主要采用的評估內(nèi)容包含師德師風評估表,教學質(zhì)量評估表和科研質(zhì)量評估表[1]。
2.2數(shù)據(jù)分析算法和工具
(1)交叉驗證算法。Logistic回歸作為預測時,在更大樣本數(shù)據(jù)集的表現(xiàn)如何,其真實性如何,我們可以做一些驗證算法,其中交叉驗證法就是一種驗證預測的回歸方程的泛化能力。
所謂交叉驗證,也就是將一定比例的數(shù)據(jù)挑選出來作為訓練樣本,其余的樣本作為保留樣本,在訓練樣本上獲取回歸方程,然后在保留樣本上做預測,因為保留樣本數(shù)據(jù)不設計參數(shù)的選擇,所以此類樣本獲得的預測數(shù)據(jù)更為真實和準確。
假設做k重交叉驗證,樣本被分為k個子樣本,輪流將k-1個子樣本作為訓練樣本集,剩余1個作為保留樣本集,這樣我們可以得到k個回歸預測方程,記錄k個保留樣本的預測表現(xiàn)結(jié)果,然后求其平均值。
(2)R語言程序編程。在大數(shù)據(jù)時代,數(shù)據(jù)分析工具有許多,例如:SASS、SPS、R語言等等,本項目之所以選擇R語言作為數(shù)據(jù)分析編程工具,原因有以下幾點:產(chǎn)品功能齊全,接口開放、開源免費、有C語言基礎的上手容易。
3.1實驗機器配置
硬件要求內(nèi)存在 4G以上,cpu處理速度3.5GHz PentiumⅣ CPU以上,軟件安裝環(huán)境要求windows7操作系統(tǒng),安裝MS office 2010,編程環(huán)境選擇RSTUDIO,結(jié)合官方的函數(shù)包。
3.2樣本數(shù)據(jù)收集
選擇目前采用的評估數(shù)據(jù)作為指標變量,包含四個“師德師風考評表”、 “教師課堂教學質(zhì)量評估表(包含學生測評分值)”、“科研質(zhì)量評估表”作為數(shù)據(jù)收集來源,隨機抽取20名已經(jīng)獲得“教壇新秀”或“教學名師”稱號的近2年的評估數(shù)據(jù),再隨機抽取80名尚未評選成功的教師的近2年評估數(shù)據(jù),構(gòu)成100名教師近2年的樣本數(shù)據(jù)。
3.3數(shù)據(jù)的整理和預處理
剔除評估分值存在異樣的樣本數(shù)據(jù),異樣數(shù)據(jù)的情況判斷依據(jù):缺分,超低分(大面積不合格分值)等等極端分值的數(shù)據(jù),避免出現(xiàn)數(shù)據(jù)最終分析嚴重偏離實際情況的出現(xiàn)[2]。選擇一級指標4個V1、V2、V3、V4分別是師德師風、教學質(zhì)量、科研質(zhì)量、教壇新秀或者教學名師,二級指標33個。對近2年的教師所有對應的指標數(shù)據(jù)首先進行平均值計算,得出相應的分值。
3.4算法編程實現(xiàn)
在R語言中使用read.delim()函數(shù)導入帶分隔符的文本文件,或者使用RODBC包的函數(shù)導入excel文件,接著使用principal()、prcomp()、pca()函數(shù)分別對33個指標變量執(zhí)行PCA算法確定主成分以及主成分個數(shù),得到主成分的 Standard deviation標準差(特征值)、Proportion of Variance方差貢獻率、Cumulative Proportion累計方差貢獻率,通過觀察這3個值確定主成分的個數(shù),用確定的主成分代替原來的33個指標變量,寫出主成分與原變量的線性關系方程,經(jīng)過分析得出新的判定指標變量。再通過對主成分中的貢獻度參考原始指標最終確定關鍵性指標,接著使用Kmeans()函數(shù)進行聚類分析得到結(jié)果,繪制譜系圖,最終結(jié)合實際的指標變量描述得出關于教師人才培養(yǎng)的指標客觀性的定性評價。到此完成教師人才培養(yǎng)評估的定量與定性評價。
通過選取的100名教師的數(shù)據(jù)結(jié)合這些相對重要的關鍵性指標,用glm()函數(shù)配合“AER”包進行Logistic回歸算法分析,得到p值,也就是顯著性,影響最大的幾個指標變量,接著對取值進行探討和解釋,使用常規(guī)的檢驗手段進行檢驗模型擬合度,最后使用 predict()函數(shù)對于新的樣本數(shù)據(jù)進行測試,如圖2所示觀察p值,分析p值看是否具有“教學新秀或教學名師”的潛力和可能性,也可以將結(jié)果結(jié)合實際情況對教師人才培養(yǎng)的現(xiàn)狀進行預測和解釋。最后使用交叉驗證法,使用bootstrap包中的crossval()函數(shù)對結(jié)果進行k重交叉驗證,以檢驗預測結(jié)果的表現(xiàn)。
圖2 預測函數(shù)得到的p值
3.5可視化結(jié)果
將分析的結(jié)果以可視化的方式展現(xiàn),使用函數(shù)包中的 screenplot()、plot()、varplot()等圖像函數(shù)包,其中包括譜系圖、散點圖、碎石圖、方差圖、矩陣散點圖、矩陣圖等等,方便形象的對分析結(jié)果進行解釋。
3.6定量和定性評價和預測
通過對編程計算后的結(jié)果,包括產(chǎn)生的可視化圖形,結(jié)合實際的參數(shù)對分析結(jié)果進行綜合評價。例如:某位教師最終得分,屬于偏教學輕科研型,離優(yōu)秀人才評估的分值相差較大,無論是教學還是科研仍需努力。某位教師最終得分,屬于重科研輕教學型,離優(yōu)秀人才評估的分值相差較少,繼續(xù)努力,可以作為下一輪優(yōu)秀人才評估的推薦教師,除此之外,還有雙強教師,已經(jīng)具備優(yōu)秀人才的素質(zhì),還有雙弱教師,需要找出其原因?qū)ΠY下藥。
參考文獻:
[1]俞東進.基于服務的決策支持系統(tǒng)研究[D].杭州: 浙江工商大學;2010.
[2]李明星.多粒度粗糙集的理論研究及其應用[D].鎮(zhèn)江: 江蘇科技大學;2014.
(責任編輯:吳湘銀)
中圖分類號:TB482.2
文獻標識碼:A
doi:10.3969/j.issn.1672-7304.2016.01.078
文章編號:1672–7304(2016)01–0168–02
作者簡介:張源(1982-),男,安徽合肥人,講師,研究方向:數(shù)據(jù)分析。
Of college talent evaluation data structure design
ZHANG Yuan
(Anhui medical college,Hefei Anhui 230601)
Abstact:In order to establish education culture big data , exploring the way big data should be utilized to change education, promote education fairness, improve education quality support. This paper hopes to design the analysis frame structure of the scientific data analysis method, combined with the idea of big data analysis,which makes some scientific suggestions and evaluation and also puts forward the foundation of quantitative and qualitative comprehensive evaluation for the cultivation and evaluation of faculty.
Keywords:Data analysis; Cross validation algorithm; quantitative and qualitative evaluation