韓玲
摘要:教學(xué)測(cè)評(píng)是高校教學(xué)過程中的重要環(huán)節(jié),是評(píng)估教學(xué)效果的有效手段。其中,試卷質(zhì)量的高低直接影響對(duì)該課程的教學(xué)考核。教師命題時(shí),從內(nèi)容到分值往往帶有一定的主觀性,其合理性也值得商榷。粗糙集理論認(rèn)為在決策系統(tǒng)中,不同的條件屬性對(duì)分類的作用不盡相同,利用條件熵計(jì)算出各條件屬性的重要性。將試卷的各類題型作為條件屬性,根據(jù)屬性重要性大小修正各題型的分值,提高試卷命題質(zhì)量。
關(guān)鍵詞:教學(xué)質(zhì)量評(píng)價(jià);粗糙集; 評(píng)價(jià)指標(biāo);信息熵
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)17-3961-03
Correction of Teaching Evaluation Index Based on Rough Set Theory
HAN Ling
(School of Computer Science and Technology, Huaibei Normal University, Huaibei 235000, China)
Abstract: Teaching evaluation is an important link in teaching process of colleges and universities, is the effective means for the evaluation of teaching effect. And the examination paper quality decides directly on the teaching evaluation. The teachers set up the paper with subjectivity, from the content to the scores. Its rationality is also questionable. In decision system, effect of different condition attributes on the classification is different in Rough set theory. Conditional information entropy was used to calculate the importance of attribute. All kinds of questions as a condition attributes according to the attribute importance, correct the test score to improve the quality of a examination paper.
Key words: teaching quality evaluation; rough set; evaluating index; information entropy
目前,我國各類學(xué)校已逐步進(jìn)入“數(shù)字化校園”時(shí)代,實(shí)現(xiàn)從教學(xué)環(huán)境、教學(xué)資源到教學(xué)活動(dòng)的數(shù)字化,創(chuàng)建電子校務(wù)、教育資源、及網(wǎng)絡(luò)服務(wù)的數(shù)字化虛擬大學(xué)教育環(huán)境,最終實(shí)現(xiàn)提高教學(xué)質(zhì)量、科研和管理水平與效率的目的。
現(xiàn)在,許多高校都建立了教務(wù)平臺(tái),學(xué)生、教師和管理人員共同參與教學(xué)活動(dòng)。教務(wù)平臺(tái)開通后產(chǎn)生了大量的數(shù)據(jù),而其中蘊(yùn)含著大量有價(jià)值的信息。如何從大量的、動(dòng)態(tài)的、不確定的、模糊的甚至是有噪聲的數(shù)據(jù)中快速、有效地挖掘出潛在的、有利用價(jià)值的知識(shí)?數(shù)據(jù)挖掘方法和技術(shù)是一有效的手段。粗糙集理論與方法是諸多數(shù)據(jù)挖掘技術(shù)中較為有效的一種方法。
1 粗糙集理論相關(guān)知識(shí)
粗糙集理論是處理不精確、不一致、不完整等各種不完備的信息有效的理論工具。一方面有成熟數(shù)學(xué)基礎(chǔ)、不需要先驗(yàn)知識(shí),另一方面易于掌握和使用。它直接從給定問題出發(fā),通過不可分辨關(guān)系和不可分辨類確定問題的近似域,從中發(fā)現(xiàn)隱含的知識(shí),揭示潛在的規(guī)律[1]。
粗糙集理認(rèn)為知識(shí)就是人類所固有的分類能力。分類是推理、學(xué)習(xí)與決策的關(guān)鍵問題。因此,粗糙集理論假定知識(shí)是一種對(duì)對(duì)象進(jìn)行分類的能力[2]。這里“對(duì)象”構(gòu)成了所討論的論域。
定義1 信息系統(tǒng) S=(U,A,V,f)。S為知識(shí)庫,U為論域,A為屬性有限有限集合,V為屬性的值域,[V=a∈AVa], [f=UO×A→V]為信息函數(shù),[?a∈A,x∈U,f(x,a)∈Va]。
如果屬性A=C∪D,C∩D=[?],C為條件屬性集,D為決策屬性集,信息系統(tǒng)也稱為決策系統(tǒng)[3]。決策系統(tǒng)是最為常見的信息系統(tǒng)。
分類的依據(jù)是屬性的值,在多屬性中,它們對(duì)分類的重要性是不同的,甚至有些屬性是冗余的。常用的度量屬性重要性方法之一是根據(jù)信息熵來定義。
信息論認(rèn)為,信息量的大小是由所消除的不確定性的大小來度量。文[4]中說明:如果將決策表中屬性去掉,條件信息熵將單調(diào)遞增。在決策表中,刪除某個(gè)屬性所引起條件信息熵的變化大小可以作為屬性重要性的度量。
決策系統(tǒng)S=(U,C∪D,V,f)中,U/C={X1, X2,……Xn},U/D={Y1, Y2,……Ym},定義p(Xi)=|Xi|/|U|,i=1,2, ……,n,p(Yj)=|Xj|/|U|,j=1,2, ……,m。
定義2屬性集R的熵:
[H(Xi)=-i=1np(Xi)logp(Xi) ]
描述了粗糙集所包含的知識(shí)的不確定性。
定義3決策系統(tǒng)S中,決策屬性D集相對(duì)于條件屬性C集的條件熵:
[H(D|C)=-i=1nP(Xi)j=1mp(Yj|Xi)logp(Yj|Xi), 其中,p(Yj|Xi)=|Yj?Xi| /|Xi|, i=1,2,......,n, j=1,2,......,m]endprint
條件熵值越大,條件屬性相對(duì)于決策屬性的不確定程度越高,即根據(jù)C所進(jìn)行的劃分U/C,能確切劃入U(xiǎn)/D類的對(duì)象數(shù)越少[5-6]。
定義 2.4在決策表中,從C中刪除屬性r,條件信息的增量為:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,說明在刪除條件屬性c后,所造成的不確定性越大,所以其重要性越大。
2 屬性重要性對(duì)試卷分值的修正
教學(xué)質(zhì)量測(cè)評(píng)中一個(gè)重要環(huán)節(jié)是對(duì)考試的測(cè)評(píng),高質(zhì)量的試卷直接反映出學(xué)生的學(xué)習(xí)情況和教師的教學(xué)水平,試卷上所包含的知識(shí)點(diǎn)量和分值是否合理性都是值得探討問題的。
本文以最近一次程序設(shè)計(jì)實(shí)驗(yàn)課考試結(jié)果為例進(jìn)行討論。實(shí)驗(yàn)課成績(jī)由上機(jī)考試和平時(shí)成績(jī)綜合得出。全班62人參加考試,試卷分為基本概念題、理解題和程序設(shè)計(jì)題三部分,分值各占卷面1/5、1/5、3/5。平時(shí)成績(jī)由學(xué)生平時(shí)實(shí)驗(yàn)課上的表現(xiàn)和實(shí)驗(yàn)報(bào)告算出??荚嚦煽?jī)和平時(shí)成績(jī)各占總評(píng)的40%和60%,四部分分?jǐn)?shù)分別為8分、8分、24分和60分。
表1是學(xué)生成績(jī)?cè)急?,將?中概念題、理解題、編程題的分?jǐn)?shù)按照它們的分值轉(zhuǎn)換成百分制得到表2,再按照學(xué)校相關(guān)規(guī)定將成績(jī)劃分5個(gè)等級(jí):優(yōu)(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分別用1、2、3、4和5表示。由此得成績(jī)決策表表3。
對(duì)屬性重要性作歸一化處理,再乘以100作為該題的分值。屬性重要性的計(jì)算結(jié)果表明平時(shí)成績(jī)對(duì)成績(jī)等級(jí)的劃分貢獻(xiàn)最大,平時(shí)成績(jī)真實(shí)、全面反映了學(xué)生實(shí)驗(yàn)課程的學(xué)習(xí)情況,分值應(yīng)該最大,應(yīng)分配45分左右;而編程題可考查學(xué)生的程序設(shè)計(jì)動(dòng)手能力,分值應(yīng)該適當(dāng)增加到30分左右;基本概念可在理論考試中檢查,分值不用增加;理解題是考查學(xué)生對(duì)概念的理解程度,這也有助于靈活運(yùn)用所學(xué)知識(shí)設(shè)計(jì)程序,所以分值增到20分左右是合理的。在期末考試中,可以考慮適當(dāng)修改考題分值。
3 總結(jié)
試卷質(zhì)量的高低直接影響對(duì)該課程的教學(xué)考核,通過對(duì)試卷、成績(jī)數(shù)據(jù)的挖掘,使試卷從內(nèi)容到分值更趨于合理,提高了試卷的命題質(zhì)量。高質(zhì)量的試卷能全面、真實(shí)反映學(xué)生的學(xué)習(xí)狀況,院系能更好掌控學(xué)生后續(xù)課程的教學(xué)節(jié)奏,有效開展教學(xué)工作。學(xué)生能更清楚了解自己的優(yōu)勢(shì)與不足,揚(yáng)長(zhǎng)避短,提高學(xué)習(xí)成績(jī)。教師也能發(fā)現(xiàn)教學(xué)中存在的問題,在今后的教學(xué)工作中加以改進(jìn)。
參考文獻(xiàn):
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知識(shí)發(fā)現(xiàn)[M].北京:清華大學(xué)出版社,2002.
[3] 胡壽松,何亞群[M].北京:北京航空航天大學(xué)出版社,2006.
[4] 李明,黃文濤,劉智云.關(guān)于決策表約簡(jiǎn)的CEBARKNC算法改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2006,26(4):864-866.
[5] 吳尚智,茍平章.粗糙集和信息熵的屬性約簡(jiǎn)算法及其應(yīng)用[J].計(jì)算機(jī)工程,2011,37(7):57-59,61.
[6] 陳媛,楊棟.基于信息熵的屬性約簡(jiǎn)算法及應(yīng)用[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版, 2013,27(1):42,46.endprint
條件熵值越大,條件屬性相對(duì)于決策屬性的不確定程度越高,即根據(jù)C所進(jìn)行的劃分U/C,能確切劃入U(xiǎn)/D類的對(duì)象數(shù)越少[5-6]。
定義 2.4在決策表中,從C中刪除屬性r,條件信息的增量為:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,說明在刪除條件屬性c后,所造成的不確定性越大,所以其重要性越大。
2 屬性重要性對(duì)試卷分值的修正
教學(xué)質(zhì)量測(cè)評(píng)中一個(gè)重要環(huán)節(jié)是對(duì)考試的測(cè)評(píng),高質(zhì)量的試卷直接反映出學(xué)生的學(xué)習(xí)情況和教師的教學(xué)水平,試卷上所包含的知識(shí)點(diǎn)量和分值是否合理性都是值得探討問題的。
本文以最近一次程序設(shè)計(jì)實(shí)驗(yàn)課考試結(jié)果為例進(jìn)行討論。實(shí)驗(yàn)課成績(jī)由上機(jī)考試和平時(shí)成績(jī)綜合得出。全班62人參加考試,試卷分為基本概念題、理解題和程序設(shè)計(jì)題三部分,分值各占卷面1/5、1/5、3/5。平時(shí)成績(jī)由學(xué)生平時(shí)實(shí)驗(yàn)課上的表現(xiàn)和實(shí)驗(yàn)報(bào)告算出??荚嚦煽?jī)和平時(shí)成績(jī)各占總評(píng)的40%和60%,四部分分?jǐn)?shù)分別為8分、8分、24分和60分。
表1是學(xué)生成績(jī)?cè)急?,將?中概念題、理解題、編程題的分?jǐn)?shù)按照它們的分值轉(zhuǎn)換成百分制得到表2,再按照學(xué)校相關(guān)規(guī)定將成績(jī)劃分5個(gè)等級(jí):優(yōu)(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分別用1、2、3、4和5表示。由此得成績(jī)決策表表3。
對(duì)屬性重要性作歸一化處理,再乘以100作為該題的分值。屬性重要性的計(jì)算結(jié)果表明平時(shí)成績(jī)對(duì)成績(jī)等級(jí)的劃分貢獻(xiàn)最大,平時(shí)成績(jī)真實(shí)、全面反映了學(xué)生實(shí)驗(yàn)課程的學(xué)習(xí)情況,分值應(yīng)該最大,應(yīng)分配45分左右;而編程題可考查學(xué)生的程序設(shè)計(jì)動(dòng)手能力,分值應(yīng)該適當(dāng)增加到30分左右;基本概念可在理論考試中檢查,分值不用增加;理解題是考查學(xué)生對(duì)概念的理解程度,這也有助于靈活運(yùn)用所學(xué)知識(shí)設(shè)計(jì)程序,所以分值增到20分左右是合理的。在期末考試中,可以考慮適當(dāng)修改考題分值。
3 總結(jié)
試卷質(zhì)量的高低直接影響對(duì)該課程的教學(xué)考核,通過對(duì)試卷、成績(jī)數(shù)據(jù)的挖掘,使試卷從內(nèi)容到分值更趨于合理,提高了試卷的命題質(zhì)量。高質(zhì)量的試卷能全面、真實(shí)反映學(xué)生的學(xué)習(xí)狀況,院系能更好掌控學(xué)生后續(xù)課程的教學(xué)節(jié)奏,有效開展教學(xué)工作。學(xué)生能更清楚了解自己的優(yōu)勢(shì)與不足,揚(yáng)長(zhǎng)避短,提高學(xué)習(xí)成績(jī)。教師也能發(fā)現(xiàn)教學(xué)中存在的問題,在今后的教學(xué)工作中加以改進(jìn)。
參考文獻(xiàn):
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知識(shí)發(fā)現(xiàn)[M].北京:清華大學(xué)出版社,2002.
[3] 胡壽松,何亞群[M].北京:北京航空航天大學(xué)出版社,2006.
[4] 李明,黃文濤,劉智云.關(guān)于決策表約簡(jiǎn)的CEBARKNC算法改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2006,26(4):864-866.
[5] 吳尚智,茍平章.粗糙集和信息熵的屬性約簡(jiǎn)算法及其應(yīng)用[J].計(jì)算機(jī)工程,2011,37(7):57-59,61.
[6] 陳媛,楊棟.基于信息熵的屬性約簡(jiǎn)算法及應(yīng)用[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版, 2013,27(1):42,46.endprint
條件熵值越大,條件屬性相對(duì)于決策屬性的不確定程度越高,即根據(jù)C所進(jìn)行的劃分U/C,能確切劃入U(xiǎn)/D類的對(duì)象數(shù)越少[5-6]。
定義 2.4在決策表中,從C中刪除屬性r,條件信息的增量為:
[SGF(c,C,D)=H(D|C-{r})-H(D|C) ]
SFG(c,C,D)的值越大,說明在刪除條件屬性c后,所造成的不確定性越大,所以其重要性越大。
2 屬性重要性對(duì)試卷分值的修正
教學(xué)質(zhì)量測(cè)評(píng)中一個(gè)重要環(huán)節(jié)是對(duì)考試的測(cè)評(píng),高質(zhì)量的試卷直接反映出學(xué)生的學(xué)習(xí)情況和教師的教學(xué)水平,試卷上所包含的知識(shí)點(diǎn)量和分值是否合理性都是值得探討問題的。
本文以最近一次程序設(shè)計(jì)實(shí)驗(yàn)課考試結(jié)果為例進(jìn)行討論。實(shí)驗(yàn)課成績(jī)由上機(jī)考試和平時(shí)成績(jī)綜合得出。全班62人參加考試,試卷分為基本概念題、理解題和程序設(shè)計(jì)題三部分,分值各占卷面1/5、1/5、3/5。平時(shí)成績(jī)由學(xué)生平時(shí)實(shí)驗(yàn)課上的表現(xiàn)和實(shí)驗(yàn)報(bào)告算出。考試成績(jī)和平時(shí)成績(jī)各占總評(píng)的40%和60%,四部分分?jǐn)?shù)分別為8分、8分、24分和60分。
表1是學(xué)生成績(jī)?cè)急?,將?中概念題、理解題、編程題的分?jǐn)?shù)按照它們的分值轉(zhuǎn)換成百分制得到表2,再按照學(xué)校相關(guān)規(guī)定將成績(jī)劃分5個(gè)等級(jí):優(yōu)(90-100分)、良(80-89分)、中(70-79分)、合格(60-69分)和不合格(0-59分),分別用1、2、3、4和5表示。由此得成績(jī)決策表表3。
對(duì)屬性重要性作歸一化處理,再乘以100作為該題的分值。屬性重要性的計(jì)算結(jié)果表明平時(shí)成績(jī)對(duì)成績(jī)等級(jí)的劃分貢獻(xiàn)最大,平時(shí)成績(jī)真實(shí)、全面反映了學(xué)生實(shí)驗(yàn)課程的學(xué)習(xí)情況,分值應(yīng)該最大,應(yīng)分配45分左右;而編程題可考查學(xué)生的程序設(shè)計(jì)動(dòng)手能力,分值應(yīng)該適當(dāng)增加到30分左右;基本概念可在理論考試中檢查,分值不用增加;理解題是考查學(xué)生對(duì)概念的理解程度,這也有助于靈活運(yùn)用所學(xué)知識(shí)設(shè)計(jì)程序,所以分值增到20分左右是合理的。在期末考試中,可以考慮適當(dāng)修改考題分值。
3 總結(jié)
試卷質(zhì)量的高低直接影響對(duì)該課程的教學(xué)考核,通過對(duì)試卷、成績(jī)數(shù)據(jù)的挖掘,使試卷從內(nèi)容到分值更趨于合理,提高了試卷的命題質(zhì)量。高質(zhì)量的試卷能全面、真實(shí)反映學(xué)生的學(xué)習(xí)狀況,院系能更好掌控學(xué)生后續(xù)課程的教學(xué)節(jié)奏,有效開展教學(xué)工作。學(xué)生能更清楚了解自己的優(yōu)勢(shì)與不足,揚(yáng)長(zhǎng)避短,提高學(xué)習(xí)成績(jī)。教師也能發(fā)現(xiàn)教學(xué)中存在的問題,在今后的教學(xué)工作中加以改進(jìn)。
參考文獻(xiàn):
[1] Pawlak Z.Rough Sets[J].Communications of ACM,1995,38(11):89-95.
[2] 史忠植.知識(shí)發(fā)現(xiàn)[M].北京:清華大學(xué)出版社,2002.
[3] 胡壽松,何亞群[M].北京:北京航空航天大學(xué)出版社,2006.
[4] 李明,黃文濤,劉智云.關(guān)于決策表約簡(jiǎn)的CEBARKNC算法改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2006,26(4):864-866.
[5] 吳尚智,茍平章.粗糙集和信息熵的屬性約簡(jiǎn)算法及其應(yīng)用[J].計(jì)算機(jī)工程,2011,37(7):57-59,61.
[6] 陳媛,楊棟.基于信息熵的屬性約簡(jiǎn)算法及應(yīng)用[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版, 2013,27(1):42,46.endprint