摘要:如何挖掘高校中特別困難學(xué)生的信息是高校學(xué)生資助工作的一項重要內(nèi)容,為了在不影響學(xué)生自尊心前提下更好地發(fā)現(xiàn)高校中的特困學(xué)生,利用學(xué)校食堂后臺刷卡記錄,采用正態(tài)分布理論,構(gòu)建了特困學(xué)生的挖掘模型。經(jīng)實驗檢驗該模型判定的正確率為82.6%,還新挖掘出了特困生總數(shù)2.79%的特困學(xué)生。為學(xué)校特困學(xué)生的認(rèn)定提供了重要的科學(xué)依據(jù)。
關(guān)鍵詞:食堂刷卡記錄;正態(tài)分布;特困學(xué)生
一、引言
隨著高等教育的發(fā)展,貧困地區(qū)和貧困家庭的孩子進入大學(xué)人數(shù)越來越多,據(jù)教育部的統(tǒng)計數(shù)據(jù),截至2013年,全國高校貧困學(xué)生已經(jīng)達到500余萬,高校中的貧困學(xué)生比例已經(jīng)高達20%,其中特困學(xué)生的比例達到總在校人數(shù)的5%以上。貧困生的資助工作也成各高校的一項重要的學(xué)生工作。
由于種種原因,各高校在貧困學(xué)生的認(rèn)定和資助工作中,還存在很多問題。
1. 高校學(xué)生的貧困認(rèn)定一般以學(xué)生在戶籍所在地村委、鄉(xiāng)鎮(zhèn)政府或民政部門出據(jù)的相關(guān)證明材料為主要的依據(jù)之一,而這些證明材料中的數(shù)據(jù)往往以相關(guān)人員的主觀為主,缺乏可信度。
2. 特困和一般貧困的界限不清楚,很多學(xué)校以劃分比例或設(shè)定名額的方式進行“推選”,從而使特困生的認(rèn)定結(jié)果在不同院系存在很大差異,最終認(rèn)定的特困生不一定特困,而真正特困的學(xué)生有可能沒有被發(fā)現(xiàn)。
3. 很多學(xué)生為了獲得資助每當(dāng)進行貧困認(rèn)定時就哭窮,卻拿著貧困資助的錢去進行請客吃喝等非貧困的消費,而學(xué)生相關(guān)部和老師每年只是按程序進行了相關(guān)貧困生的認(rèn)定和資助工作,對特困學(xué)生的日常生活方面缺乏較合理的跟蹤手段,不能及時發(fā)現(xiàn)真假特困生。
然而,學(xué)校食堂是學(xué)生在校期間的主要餐飲消費場所,信息時代學(xué)生的餐飲消費被全部記錄,而學(xué)生食堂的消費最能體現(xiàn)學(xué)生的消費情況,并反映到該學(xué)生的經(jīng)濟情況。
二、研究現(xiàn)狀
貧困生的認(rèn)定工作是高校貧困生資助中最重要的工作之一,貧困的認(rèn)定標(biāo)準(zhǔn)制定、認(rèn)定流程和認(rèn)定方法等都有不少學(xué)者進行了研究。黃永斌提出了高校自身認(rèn)定法、在校消費水平認(rèn)定法和綜合認(rèn)定法等三種方法;畢鶴霞等將校園判定與生源地判定相結(jié)合的方法,構(gòu)建了貧困生的判定體系;葛超從貧困生證明真假難辨、貧困生的認(rèn)定標(biāo)準(zhǔn)難以制定和認(rèn)定方法的不科學(xué)性等三個方面分析的貧困生認(rèn)定工作的難點,同時提出了完美相關(guān)法制、建立貧困生信息共享平臺和改進貧困生認(rèn)定手段等機制和措施;岑道權(quán)將學(xué)生的生活費支出、家庭人均收入、繳納學(xué)費等方面相結(jié)合來完美貧困生的資助體系;肖蕾等從學(xué)生家庭真實經(jīng)濟情況、學(xué)生的人際關(guān)系對貧困認(rèn)定的影響、國家無償資助造成學(xué)生騙取資助現(xiàn)象等方面提出了完美家庭經(jīng)濟情況的審核、加強誠信教育和誠信檔案建設(shè),改變無償性資助的現(xiàn)狀等有效措施。
以上這些研究主要從貧困生的認(rèn)定困難性、貧困生認(rèn)定的判定體系和貧困相關(guān)政策等方面進行了研究,而尚無從所有學(xué)生中發(fā)現(xiàn)真正的貧困學(xué)生的研究成果。
陳曉等利用高校中的學(xué)生信息、學(xué)生家庭成員信息、學(xué)生家庭經(jīng)濟狀況信息、成績信息、月消費信息、助學(xué)貸款信息和貧困生申請表等學(xué)生多方面的信息,構(gòu)建加權(quán)約束的決策樹,用于提高貧困生的認(rèn)定效率。該作者的研究綜合了高校中幾乎與學(xué)生有關(guān)的信息偷出,綜合考慮學(xué)生的所有情況,但就學(xué)生的真正貧困情況而言并不具體深入。
綜合以上情況,本文將以學(xué)生食堂消費記錄為依據(jù),采用正態(tài)分布理論,構(gòu)建基于學(xué)生食堂消費記錄的特困學(xué)生挖掘模型,從學(xué)生日常的餐飲消費記錄中挖掘出真正需要資助的特困學(xué)生,也可以從中發(fā)現(xiàn)假的特困學(xué)生。為高等學(xué)校的特困學(xué)生認(rèn)定和資助提供科學(xué)的參考依據(jù)。
三、特困生挖掘模型
由于高等學(xué)校是開放式辦學(xué),學(xué)生在校期間相對比較自由,因此學(xué)校并未要求學(xué)生必須要去學(xué)校食堂就餐,為挖掘特困學(xué)生,由于校外消費均遠(yuǎn)高于校內(nèi)學(xué)生食堂,所以,假設(shè)特困學(xué)生絕大多數(shù)時間都在學(xué)校食堂就餐。
為衡量學(xué)生在學(xué)校食堂就餐的情況,列出單個學(xué)生在校就餐消費均值、全體學(xué)生食堂就餐消費均值和方差的定義。
定義1:設(shè)全校共有M個學(xué)生在食堂就餐,學(xué)生xi在校食堂總消費次數(shù)為Ni,每次消費金額為hi,單個學(xué)生的消費均值記為μi,全體學(xué)生的消費均值記為μ,全體學(xué)生的消費方差記為μ則有
μi=hi(1)
μ=Ei(2)
σ2=(μi-μ)2(3)
為了界定特別困難學(xué)生與其它學(xué)生的區(qū)別,列出學(xué)生消費閾值的定義。
定義2:設(shè)食堂消費記錄采樣天數(shù)為N,把學(xué)生的消費次數(shù)閾值記為N0,則有
N0=λN(4)
其中λ表示均值消費次數(shù)閾值系數(shù),用于限制只有在食堂消費次數(shù)達到一定數(shù)量的學(xué)生才參與貧困生的判定。
為了使用離群點的理論來研究特困學(xué)生的挖掘方法,下面給出離群點的定義。
假設(shè)每個學(xué)生就餐的消費均值服從正態(tài)分布(如圖1所示),記為N(μ,σ2),從圖中可以看出,X軸上μ左右兩側(cè)各1σ 間的面積為68.27%,各 1.96σ間的面積為95.00%,各2.58σ間的面積為99.00%。
定義3:根據(jù)正態(tài)分布規(guī)律,將低于全體學(xué)生均值γσ的部分學(xué)生定義為特困學(xué)生。
根據(jù)(1)、(2)、(3)、(4)式和定義3,設(shè)學(xué)生xi每月在食堂消費的次數(shù)為Ni,每次的平均消費額為ui,則可構(gòu)建特困學(xué)生判定模型如下:
f(xi)=1 Ni≥N0且μi≤μ-γσ
0 其它(5)
上述式中,f(x)=1表示學(xué)生x為特困學(xué)生,f(x)=0,則表示該學(xué)生不是特困學(xué)生。
四、實驗分析
根據(jù)實驗需要,某普通高等學(xué)校食堂后臺采集到2014年2月26日至5月8日共71天的學(xué)生就餐刷卡記錄739029條,由于食堂消費普通不高,因此先將單次消費高于20元的記錄作為噪聲去掉,經(jīng)過去噪后有效記錄為737252條。
預(yù)處理后的數(shù)據(jù)進行以刷卡賬號為分組依據(jù)分別統(tǒng)計其刷卡次數(shù)和平均刷卡消費金額,得到7792人的相關(guān)信息,這也與該校的在校生人數(shù)基本相符,然后畫出其散點圖如圖2所示。
從統(tǒng)計數(shù)據(jù)可知,在圖2中有5521名學(xué)生在食堂就餐的次數(shù)低于每天2次,即λ取值為2,根據(jù)前面的假設(shè),這部分學(xué)生對于計算并無意義,將這些學(xué)的數(shù)據(jù)進刪除后只剩下2271名學(xué)生的消費情況。將這些學(xué)生的平均消費金額進行統(tǒng)計后得到如下的圖3所示。
從圖3可以看出,平均每次刷卡消費的金額主要集中在1元至4元之間,整體基本滿足正態(tài)分布。
因為全部學(xué)生人數(shù)為7792人,經(jīng)過清洗后剩余學(xué)生2271人,按全體學(xué)生的5%來挖掘特困學(xué)生,則應(yīng)找出389名學(xué)生,其占經(jīng)過去噪處理后2271名學(xué)生的17.1%。根據(jù)圖1可知, γ≈0.89,經(jīng)過統(tǒng)計可知2271名學(xué)生的單次消費均值μ為2.382元,方差σ為0.634元,因此,根據(jù)(5)式可得特困學(xué)生的判定模型為
f(xi)=1,Ni≥142且μi≤2.382-0.562
0,其它(6)
最后使用散點圖顯示(6)式的特困學(xué)生判定結(jié)果如圖4所示。
在圖4中紅色橫線以下部分,共394人即為挖掘出來的特困學(xué)生。經(jīng)過與該校學(xué)生資助管理中心提供的2014年5月全校特困學(xué)生數(shù)據(jù)對比,發(fā)現(xiàn)特困學(xué)生的判定正確率為82.6%。另有2.79%共11人新挖掘出的特困生經(jīng)過核實確認(rèn)為原未被認(rèn)定的特困學(xué)生。同時發(fā)現(xiàn)了該校某學(xué)院2011級預(yù)科有一名非常特殊的學(xué)生,其平均每天的生活費用為6.06元。后經(jīng)調(diào)查核實,該生的確因家庭情況特殊,生活費用非常有限。
五、結(jié)語
本文針對當(dāng)前特困學(xué)生的認(rèn)定中存在的問題,利用學(xué)校食堂后臺的學(xué)生刷卡消費記錄,利用正態(tài)分布理論構(gòu)建了特困學(xué)生的挖掘模型,為特困學(xué)生的認(rèn)定工作帶來科學(xué)的決策數(shù)據(jù),取得了一定的成果。但是,由于高校中男女生在飲食上消費的特點不同、體育等體能消耗較大的專業(yè)學(xué)生也有不同的較大的區(qū)別,這些都將是下一步需要研究的內(nèi)容。
參考文獻:
[1]黃永斌.新形勢下高校貧困生認(rèn)定及資助模式探析[J].合肥工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2010(02).
[2]畢鶴霞,沈紅.貧困生判定的難點與認(rèn)定方法探究[J].高校探索,2008(05).
[3]葛超.論高校貧困生認(rèn)定工作中的難點及對策[J].中國電力教育,2012(02).
[4]岑道權(quán).高校貧困生認(rèn)定的難點及對策探析[J].陜西理工學(xué)院學(xué)報(社會科學(xué)版),2007(04).
*基金項目:貴州省2014年大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(20141066801)。
(作者單位:貴州工程應(yīng)用技術(shù)學(xué)院。張仕學(xué)為本文通訊作者)