牛猛
(皖南醫(yī)學院 教務(wù)處,安徽 蕪湖 241002)
高校醫(yī)學生的培養(yǎng)方案,其課程的設(shè)置,是按照公共基礎(chǔ)課、專業(yè)基礎(chǔ)課、專業(yè)課的先后順序來安排的。從內(nèi)容上來說,公共基礎(chǔ)課是專業(yè)基礎(chǔ)課的基礎(chǔ),專業(yè)基礎(chǔ)課是專業(yè)課的基礎(chǔ);從學習效果上說,公共基礎(chǔ)課的學習效果對專業(yè)基礎(chǔ)課的學習有很大的影響,專業(yè)基礎(chǔ)課的學習效果對專業(yè)課的學習有很大的影響,前期開設(shè)的專業(yè)課的學習效果對與之有關(guān)聯(lián)的后期開設(shè)的專業(yè)課的學習也有很大的影響。
本文將從具體的課程關(guān)聯(lián)上,對醫(yī)學生成績進行分析,利用 Apriori算法對同一專業(yè)的課程成績進行關(guān)聯(lián)規(guī)則[1]挖掘:挖掘出有一定關(guān)聯(lián)的公共基礎(chǔ)課程成績對專業(yè)基礎(chǔ)課程成績的影響;有一定關(guān)聯(lián)的專業(yè)基礎(chǔ)課程成績對專業(yè)課程成績的影響;有一定關(guān)聯(lián)的專業(yè)課程成績對后續(xù)專業(yè)課程成績的影響。用挖掘出的規(guī)律反饋教學過程,在輔助教學決策、提高教師教學質(zhì)量和增加學生學習效果等方面都能給出指導性意見。
以我校2008級臨床醫(yī)學專業(yè)學生學習基礎(chǔ)化學和生物化學為例,基礎(chǔ)化學,作為公共基礎(chǔ)課,是學習生物化學這門專業(yè)課的基礎(chǔ)。從教務(wù)系統(tǒng)中導出2008級臨床醫(yī)學專業(yè)的學生基本情況表,共 821人,包含學號、姓名、性別、院系、當前所在級、學籍狀態(tài)、專業(yè)、班級、身份證號等共53個字段;導出2008級臨床醫(yī)學專業(yè)包含基礎(chǔ)化學和生物化學的學生成績表,其中基礎(chǔ)化學共 824條記錄,生物化學共824條記錄,包含學年、學期、課程名稱、考核方式、成績、學分、當前所在級、專業(yè)、班級名稱、學號、姓名、課程性質(zhì)、課程類型等共22個字段。
然后,對導出的原始數(shù)據(jù)進行修改,如增加或刪除字段,增加或刪除記錄,將不同數(shù)據(jù)表連接至同一個數(shù)據(jù)挖掘庫中[2]。將學生基本情況與成績表中的學號、專業(yè)、基礎(chǔ)化學成績和生物化學成績這 4個字段導出生成用于挖掘的學生成績挖掘表1,其記錄共有820條,如表1-1所示。
表1-1 完成數(shù)據(jù)預處理的學生成績挖掘表1
之后,根據(jù) Apriori算法的要求,對學生成績挖掘表 1中的成績進行離散化。將平均成績按大于或等于75分(優(yōu)良)、小于75分(一般)分別劃分成“1”、“0”,分別表示學習成績?yōu)閮?yōu)良和學習成績?yōu)橐话慵耙韵?,如?1-2所示。
表1-2 完成數(shù)據(jù)離散化的學生成績挖掘表2
之后,給定 min_sup[3]為 0.2,min_conf[4]為0.5,再通過Apriori算法挖掘所有的頻繁項集[5],如表1-3所示。
表1-3 從學生成績挖掘表2中挖掘出的頻繁項集
最后,計算最終頻繁項集的所有非空子集的置信度,刪除小于min_conf的記錄,確定模型,生成關(guān)聯(lián)規(guī)則[6],如表1-4所示。
表1-4 從學生成績挖掘表2中挖掘出的關(guān)聯(lián)規(guī)則
通過挖掘的關(guān)聯(lián)規(guī)則,我們可以發(fā)現(xiàn)下述關(guān)系:
學生的基礎(chǔ)化學成績,對學生的生物化學成績有很重要的影響,基礎(chǔ)化學成績是優(yōu)良的,其生物化學成績在非常大程度上都是優(yōu)良的。但基礎(chǔ)化學成績并非絕對因素,基礎(chǔ)化學成績是一般的學生,通過努力學習,有一些都能夠獲得優(yōu)良的生物化學成績。
根據(jù)上述關(guān)系,我們可以得出如下結(jié)論:
基礎(chǔ)化學屬于公共基礎(chǔ)課,生物化學屬于專業(yè)基礎(chǔ)課,并且基礎(chǔ)化學這門公共基礎(chǔ)課是學習生物化學這門專業(yè)基礎(chǔ)課的基礎(chǔ)。對于同一專業(yè),有一定關(guān)聯(lián)的公共基礎(chǔ)課成績對專業(yè)基礎(chǔ)課成績有非常大的影響。
分析同一專業(yè),有一定關(guān)聯(lián)的專業(yè)基礎(chǔ)課成績對專業(yè)課成績的影響。以2008級臨床醫(yī)學專業(yè)學生學習生理學和內(nèi)科學為例,生理學,作為專業(yè)基礎(chǔ)課,是學習內(nèi)科學這門專業(yè)課的基礎(chǔ)。
按照之前的方法,將2008級臨床醫(yī)學專業(yè)的學生基本情況表與生理學成績表和內(nèi)科學成績表連接至同一個數(shù)據(jù)挖掘庫中,并將學號、專業(yè)、生理學和內(nèi)科學成績這 4個字段導出生成用于挖掘的學生成績挖掘表 3,其記錄共有820條,如表2-1所示。
表2-1 完成數(shù)據(jù)預處理的學生成績挖掘表3
之后,按照成績是否大于或等于75分進行離散化,如表2-2所示。
表2-2 完成數(shù)據(jù)離散化的學生成績挖掘表4
之后,按照 min_sup為 0.2,min_conf為0.5挖掘所有的頻繁項集,如表2-3所示。
表2-3 從學生成績挖掘表4中挖掘出的頻繁項集
最后,計算最終頻繁項集的所有非空子集的置信度,刪除小于min_conf的記錄,確定模型,生成關(guān)聯(lián)規(guī)則,如表2-4所示。
表2-4 從學生成績挖掘表4中挖掘出的關(guān)聯(lián)規(guī)則
通過挖掘的關(guān)聯(lián)規(guī)則,我們可以發(fā)現(xiàn)下述關(guān)系:
學生的生理學成績,對學生的內(nèi)科學成績有很重要的影響,生理學成績是優(yōu)良的,其內(nèi)科學成績在非常大程度上都是優(yōu)良的。但生理學成績并非絕對因素,生理學成績是一般的學生,通過努力學習,有一些都能夠獲得優(yōu)良的內(nèi)科學成績。
根據(jù)上述關(guān)系,我們可以得出如下結(jié)論:
生理學屬于專業(yè)基礎(chǔ)課,內(nèi)科學屬于專業(yè)課,并且生理學這門專業(yè)基礎(chǔ)課是學習內(nèi)科學這門專業(yè)課的基礎(chǔ)。對于同一專業(yè),有一定關(guān)聯(lián)的專業(yè)基礎(chǔ)課成績對專業(yè)課成績有非常大的影響。
分析同一專業(yè),有一定關(guān)聯(lián)的專業(yè)課成績對專業(yè)課成績的影響。以2008級臨床醫(yī)學專業(yè)學生學習手術(shù)學和外科學為例,雖同為專業(yè)課,但手術(shù)學是學習外科學的基礎(chǔ)。
按照之前的方法,將2008級臨床醫(yī)學專業(yè)的學生基本情況表與手術(shù)學成績表和外科學成績表連接至同一個數(shù)據(jù)挖掘庫中,并將學號、專業(yè)、生理學和內(nèi)科學成績這 4個字段導出生成用于挖掘的學生成績挖掘表 5,其記錄共有820條,如表3-1所示。
表3-1 完成數(shù)據(jù)預處理的學生成績挖掘表5
之后,按照成績是否大于或等于75分進行離散化,如表3-2所示。
表3-2 完成數(shù)據(jù)離散化的學生成績挖掘表6
之后,按照 min_sup為 0.2,min_conf為0.5挖掘所有的頻繁項集,如表3-3所示。
表3-3 從學生成績挖掘表6中挖掘出的頻繁項集
最后,計算最終頻繁項集的所有非空子集的置信度,刪除小于min_conf的記錄,確定模型,生成關(guān)聯(lián)規(guī)則,如表3-4所示。
表3-4 從學生成績挖掘表6中挖掘出的關(guān)聯(lián)規(guī)則
通過挖掘的關(guān)聯(lián)規(guī)則,我們可以發(fā)現(xiàn)下述關(guān)系
學生的手術(shù)學成績,對學生的外科學成績有很重要的影響,手術(shù)學成績是優(yōu)良的,其外科學成績在非常大程度上都是優(yōu)良的。但手術(shù)學成績并非絕對因素,手術(shù)學成績是一般的學生,通過努力學習,有一些都能夠獲得優(yōu)良的外科學成績。
根據(jù)上述關(guān)系,我們可以得出如下結(jié)論:
手術(shù)學、外科學均屬于專業(yè)課,并且手術(shù)學是學習外科學的基礎(chǔ)。對于同一專業(yè),相互之間有關(guān)聯(lián)的先授課的專業(yè)課成績對后授課的專業(yè)課成績有非常大的影響。
將之前挖掘出的規(guī)律反饋給授課的教師和聽課的學生,得到他們的認同。因此,教師和學生均要注意課程之間的關(guān)聯(lián),在講授、學習課程的時候,要及時聯(lián)系、復習與之關(guān)聯(lián)的前期相關(guān)課程,這樣互相促進,對提高教師的教學質(zhì)量和增加學生的學習效果有重要的指導意義。這樣的規(guī)律,對于教學管理部門來說,在專業(yè)建設(shè)、培養(yǎng)方案制定、課程設(shè)置、輔助教學決策等方面具有重要的指導意義。
[1]杜孝平,馬秀莉,唐世渭,等.快速關(guān)聯(lián)規(guī)則挖掘算法[J].計算機工程與應用,2002(11):1-4,47.
[2]謝琦,張振興.基于 Apriori算法和 OLAP的關(guān)聯(lián)規(guī)則挖掘模型設(shè)計[J].計算機應用,2007,27(6):4-5,9.
[3]周虹,馬麗麗.一種改進的 Apriori 算法[J].佳木斯大學學報(自然科學版),2007,25(4):492-494.
[4]王杰,張靜,張繼生.等.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的研究與論證[J].鞍山科技大學學報,2005,28(2):123-126.
[5]佟強,周園春,閻保平.關(guān)聯(lián)規(guī)則挖掘算法.微電子學與計算機,2005,22(6):68-72.
[6]陸麗娜,陳亞萍,魏恒義.挖掘關(guān)聯(lián)規(guī)則中Apriori算法的研究[J].小型微型計算機系統(tǒng),2000,21(9):940-943.