張志銀 劉丹丹
(1.鄭州升達經(jīng)貿(mào)管理學(xué)院基礎(chǔ)部 河南 鄭州 451191;
2.中原工學(xué)院理學(xué)院 河南 鄭州 451191)
Z分數(shù)分布理論在教育評價體系中的應(yīng)用
張志銀1劉丹丹2
(1.鄭州升達經(jīng)貿(mào)管理學(xué)院基礎(chǔ)部 河南 鄭州 451191;
2.中原工學(xué)院理學(xué)院 河南 鄭州 451191)
本文簡單介紹了標準分數(shù)(Z分數(shù))分布理論,并著重論述了標準分數(shù)(Z分數(shù))分布理論在教育評價體系中的應(yīng)用,以使教育評價更為客觀、公平、公正,這對于提高教育評價水平和管理水平有著重要的意義.
標準分數(shù);正態(tài)分布;教育評價;應(yīng)用
目前,我國在教育評價方面取得了很大的成績,教育評價理論逐步深化,教育評價實踐活動也廣泛開展.但同時也存在著評價模式呆板單一、評價技術(shù)手段水平不高等問題.在教育評價中有許多資料和指標是屬于定性方面的,如工人的工作業(yè)績,學(xué)生的思想品德,教師的教學(xué)水平等,往往以好、中、差或優(yōu)、良、中或合格、不合格等來劃分.假如教師的教學(xué)水平用三個指標(教學(xué)能力、教學(xué)態(tài)度、教學(xué)方法)反映,每個指標又分為三等(優(yōu)、良、中),教師張三的三個指標等級分別為優(yōu)、良、中,教師李四的三個指標等級分別為中、優(yōu)、良.試問這兩位教師誰的教學(xué)水平更高呢?要回答這個問題,我們面臨這樣一個困難:對這兩位老師評價的指標屬于定性描述或等級化,若僅僅停留在定性描述或等級化,則無法將兩個或多個具有若干定性指標基本相同的個體進行比較.有時候即使對于有些定量的資料和指標,如果不進行技術(shù)處理,也很難將兩個或多個具有相同定量指標的個體進行比較.那么,如何將定性指標加以量化或?qū)Χ恐笜诉M行處理,并盡量地做到評價的合理、公平、公正,是值得深入研究的問題.一方面可以用概率統(tǒng)計中正態(tài)分布知識將這些定性描述具體數(shù)量化;另一方面,我們努力找到找到一種處理定量數(shù)據(jù)的方法.為了方面討論問題,下面我給出正態(tài)分布的相關(guān)知識及標準分數(shù)(Z分數(shù))的相關(guān)理論。
正態(tài)分布是一種連續(xù)性隨機變量的概率分布,在其次數(shù)分配中,中間的次數(shù)多,由中間往兩邊的次數(shù)逐漸減少,兩邊的次數(shù)多少相等,呈一種“兩頭小、中間大”的分布形態(tài).其標準正態(tài)曲線如圖1:
圖1
從標準正態(tài)曲線可知,它具有以下特點:
(1)曲線在X=0(即平均數(shù))處為最高點;
(2)曲線以X=0處為中心,雙側(cè)對稱;
(3)曲線從最高點向左右緩慢下降,并無限延伸,最后接近基線,但永不與基線相交;
(4)標準正態(tài)分布上的平均數(shù)為0,標準差為1,基線上從X=-3到X=3幾乎有6個標準差的距離,并且多數(shù)數(shù)據(jù)都集中在平均數(shù)附近,具體地說有:
P(-1 P(-2 P(-3 即是說,在平均數(shù)上下一個標準差單位范圍內(nèi),包含曲線下總體面積的68.26%,在±2個標準差范圍內(nèi),包含總體的面積為95.46%,在±3個標準范圍內(nèi),包含總體的面積的99.73%.因此,在±3個標準差范圍以外,僅有0.27%的面積,在統(tǒng)計中可以忽略不計.但是,需注意的是,橫軸上的距離相等,因在曲線中所處的位置不同,所包括的面積是不相同的.越離平均數(shù)較遠的地方,在其標準差內(nèi)所包括的面積越少. 在考試中,學(xué)生所得分數(shù)稱為原始分數(shù).但有時原始分數(shù)也說明不了學(xué)生的學(xué)習(xí)好壞.比如,某學(xué)生在一次數(shù)學(xué)考試中得了90分(試題比較容易),在另一次數(shù)學(xué)考試中得了75分(試題比較難),那么試問該學(xué)生是進步了還是退步了呢?為了解決這個問題,下面引入了標準分數(shù)(Z分數(shù))的概念. S為原始分數(shù)的標準差 Z為標準分數(shù) 由概率統(tǒng)計知識可知 (1) (2) 上述(1)(2)說明標準分數(shù)Z這個統(tǒng)計量服從標準正態(tài)分布,即Z~N(0,1). 下面就介紹在幾類教育實踐中用到標準分數(shù)(Z分數(shù))分布理論的例子. 對于那些定性的品質(zhì)資料或質(zhì)量指標,我們又該怎么辦呢?首先,我們要做的工作是需要將它們量化為標準分數(shù)Z.具體做法如下: (1)算出個體的品質(zhì)資料或質(zhì)量指標所得等級在群體中所占的比例,此比例可視為各等級的概率.(給出的各等級的人數(shù)應(yīng)服從或基本服從正態(tài)分布).假設(shè) P(優(yōu))=a,P(良)=b,P(中)=c,P(合格)=d,P(不合格)=e 這里a+b+c+d+e=1. (2)作一標準正態(tài)曲線的草圖,并大致將正態(tài)曲線下圖形的面積從右向左按a,b,c,d,e的次序劃分.如圖2: 圖2 原始分數(shù)標準正態(tài)曲線圖 (3)由于同等級內(nèi)也有差異,因此我們把各等級均視為集中在中位點上,找出各等級中位點的標準分數(shù)Z來代表各等級的標準分數(shù)Z. 由圖2可知 然后根據(jù)標準正態(tài)分布表可查出Z不合格,Z合格,Z中,Z良,Z優(yōu). 在學(xué)生成績或能力符合正態(tài)分布時,可將正態(tài)分布基線上X=-3至X=+3之間六個標準差的距離分成相等的幾份,然后求出各段Z值間的面積,再乘以總?cè)藬?shù),即為各等級評定人數(shù). 例如某校初中一年級有學(xué)生500人,其數(shù)學(xué)成績符合正態(tài)分布,把學(xué)生數(shù)學(xué)成績定為優(yōu)、良、中、差四個等級,問各等級內(nèi)應(yīng)有多少學(xué)生.其確定方法為,將X=-3至X=+3分成四等份,每等份X值為1.5,即如圖4: 圖4 查正態(tài)分布表可知,X=3的面積比例P=49.87%,X=1.5的面積比例為P=43.32%,則優(yōu)等人數(shù)面積比例為P=49.87%-43.32%=6.55%.那么,優(yōu)等人數(shù)500×6.55%=32.8人,即該年級數(shù)學(xué)成績優(yōu)等生約有33人. 查正態(tài)分布表得知,X=1.5的面積比為43.32%,則成績良等者約有500×43.32%≈217人.由于屬正態(tài)分布,成績屬中等者與成績良等者相同也約有217人,成績屬差等者與成績優(yōu)等者相同,也約有33人. 利用正態(tài)分布不僅可以根據(jù)等級求人數(shù),而且可以估計分數(shù)區(qū)間的人數(shù).例如,某初中一年級380名學(xué)生,數(shù)學(xué)考試成績平均分為85分,標準差為6,問70-80分之間有多少人?這仍屬求某一段分數(shù)區(qū)間的概率問題.首先把原分數(shù)轉(zhuǎn)換為Z分數(shù). 然后求-0.83個標準差與-2.5個標準差之間所包含的面積.查表P1=0.2967,P2=0.4938則70-80分之間所含的面積比例為P=0.4938-0.2967=0.1917.故70-80分之間的學(xué)生約有380×0.1971≈75人. 品質(zhì)評定數(shù)量化主要用于不同的評價者對評價對象的等級評分,以求得評價對象的平均成績情況.其方法就是把評價者所評定的各等級人數(shù)的百分比作為正態(tài)曲線下的面積,再以平分每塊面積的Z值(即中位數(shù))作為各等級數(shù)量化的分數(shù),最后計算每個評價對象等級的數(shù)量化分數(shù). 例如,某校年度考核評優(yōu)時,學(xué)校三位領(lǐng)導(dǎo)對全校40名教師按A、B、C三個等級進行了評定,結(jié)果為如表1: 表1 現(xiàn)要從教學(xué)實績一樣的甲、乙、丙三位教師中評出兩位優(yōu)秀,三位領(lǐng)導(dǎo)的評價結(jié)果如表2: 表2 試問,應(yīng)選評哪兩位?由于不同評價者評的等級不同,要選評哪兩位,這類問題就需要把等級數(shù)量化.即把評定的等級轉(zhuǎn)換為標準分數(shù)Z. 首先,計算各等級的比率.即用各等級人數(shù)除以總?cè)藬?shù),并將此數(shù)值看作該等級在正態(tài)曲線下所占的面積值. 最后,計算等級分數(shù).即用不同評價者所評的等級所對應(yīng)的值相加并求其平均數(shù),則為各評價對象的等級分數(shù). 那么,甲、乙、丙三位教師的等級數(shù)量化分數(shù)分別為: 甲教師:[(-1.36)+0.71+(-0.45)]÷3=-0.367 乙教師:[(-0.19)+(-1.44)+0.75]÷3=-0.293 丙教師:[0.98+(-0.42)+(-1.65)]÷3=-0.545 從等級數(shù)量化分數(shù)比較,-0.293>-0.367>-0.545,所以,學(xué)校評優(yōu)應(yīng)評乙、甲兩位教師. 這樣,就把定性的評價轉(zhuǎn)化為定量化的評價,更為客觀、科學(xué)、公平、公正.總之,正態(tài)分布應(yīng)用在教育評價實踐中,可以克服許多弊端,使教育評價更加客觀、公平、公正,使教學(xué)管理工作更加科學(xué)化.數(shù)學(xué)知識在各個領(lǐng)域有著廣泛的應(yīng)用,特別是概率統(tǒng)計知識與我們的生活實際密切相關(guān),但這需要我們數(shù)學(xué)工作者不斷地努力探索。 [1] 馬忠林.數(shù)學(xué)教育評價[M].南寧:廣西教育出版社,1999. [2] 盛聚,謝式千,潘承毅等.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2001. [3] 劉書田.概率統(tǒng)計[M].北京:北京大學(xué)出版社,2004. [4] 侯風(fēng)波.經(jīng)濟數(shù)學(xué)基礎(chǔ)[M].北京:科學(xué)出版社,2005. [5] 王漢瀾.教育統(tǒng)計學(xué)[M].北京:教育科學(xué)出版社,1986. [6] 楊鳳英.淺析運用學(xué)生成績評價教師的利弊與注意事項[J].教學(xué)與管理,1997,(12). [7] 孫益領(lǐng).教職工成績評估辦法的改革嘗試[J].教學(xué)與管理,1997,(10). 張志銀(1983-),男,漢族,河南鹿邑人,講師,碩士,鄭州升達經(jīng)貿(mào)管理學(xué)院基礎(chǔ)部,研究方向:從事大學(xué)公共數(shù)學(xué)教學(xué)等方面的研究;劉丹丹(1984-),女,漢族,河南鹿邑人,講師,博士,中原工學(xué)院理學(xué)院,研究方向:從事大學(xué)物理教學(xué)及原子與分子物理等方面的研究。 G712 A 1672-5832(2017)12-0106-023 標準分數(shù)(Z分數(shù))概述
4 標準分數(shù)(Z分數(shù))分布理論在教育評價體系中的應(yīng)用
4.1 定性指標的比較
4.2 等級評定
4.3 品質(zhì)評定