方林 于燕平
關(guān)鍵詞:數(shù)據(jù)挖掘;Apriori算法;專業(yè)設(shè)置;關(guān)聯(lián)性分析
1引言
隨著“互聯(lián)網(wǎng)+”時代的到來,各行各業(yè)高速積累的數(shù)據(jù)流填滿了每個社會參與者的時空環(huán)境,挖掘海量數(shù)據(jù)中的有用信息是各行各業(yè)研究者孜孜不倦的追求目標(biāo)。本文利用Apriori算法對鐵道供電技術(shù)專業(yè)學(xué)生往年的成績數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,找出各課程之間的關(guān)聯(lián)性,為科學(xué)規(guī)劃和設(shè)置專業(yè)課程體系提供參考依據(jù)。
2研究背景
鐵道供電技術(shù)專業(yè)旨在培養(yǎng)從事電氣化鐵道供電系統(tǒng)及其設(shè)備的運行、檢修、維護與施工等的高素質(zhì)技術(shù)技能型人才。開設(shè)公共基礎(chǔ)課、專業(yè)基礎(chǔ)課、專業(yè)核心課、專業(yè)主干課、專業(yè)限選課等5類課程,其中專業(yè)核心課是鐵道供電技術(shù)專業(yè)課程體系中最核心、最重要的課程,專業(yè)基礎(chǔ)課是為專業(yè)學(xué)習(xí)奠定必要基礎(chǔ)的課程。即便近年來專業(yè)課學(xué)時一再地縮減,這兩類課程的學(xué)時也維持不變或少量增長,由此也說明專業(yè)基礎(chǔ)課和專業(yè)核心課在專業(yè)人才培養(yǎng)中的重要性。
專業(yè)課程設(shè)置遵循專業(yè)建設(shè)指導(dǎo)委員會的意見和建議,但在課程落實到具體專業(yè)后,各專業(yè)也會根據(jù)本專業(yè)師資、實驗實訓(xùn)條件等適當(dāng)調(diào)整課程學(xué)時、學(xué)分等,而調(diào)整的依據(jù)一般僅依靠本專業(yè)教師的經(jīng)驗,缺乏科學(xué)依據(jù)。本文的研究目的是通過對鐵道供電技術(shù)專業(yè)的基礎(chǔ)課程和專業(yè)核心課程成績的數(shù)據(jù)挖掘,發(fā)掘出專業(yè)核心課與專業(yè)基礎(chǔ)課潛在的關(guān)聯(lián)性,為課程建設(shè)、專業(yè)人才培養(yǎng)方案的制定等提供更科學(xué)的決策依據(jù)。
3Apriori算法
Apriori算法是挖掘產(chǎn)生布爾關(guān)聯(lián)規(guī)則所需頻繁項集的基本算法。該算法利用了一個層次順序搜索的循環(huán)方法來完成頻繁項集的挖掘工作。這一循環(huán)方法就是利用k項集來產(chǎn)生k+1-項集,即首先找出頻繁1項集,記為Li;然后利用Li來挖掘L2,即頻繁2一項集;不斷如此循環(huán),直到無法發(fā)現(xiàn)更多的頻繁項集為止。挖掘出所有的頻繁項集后,產(chǎn)生滿足最小支持度和最小信任度的強關(guān)聯(lián)規(guī)則。
Apriori算法可分為兩個步驟:(1)通過迭代,檢索出數(shù)據(jù)庫中的所有頻繁項集,即支持度不低于用戶設(shè)定的閾值的項集;(2)利用頻繁項集構(gòu)造出滿足用戶最小信任度的規(guī)則。
4基于Apriori算法的課程關(guān)聯(lián)性分析
4.1數(shù)據(jù)準(zhǔn)備
本次研究采集了柳州鐵道職業(yè)技術(shù)學(xué)院2016級、2017級鐵道供電技術(shù)專業(yè)6門課程的學(xué)生期末成績,其中包含2門專業(yè)基礎(chǔ)課,4門專業(yè)核心課。因為數(shù)據(jù)庫中的學(xué)生成績是以數(shù)值形式表示的,不便于進(jìn)行數(shù)據(jù)挖掘,所以需要對各科成績進(jìn)行離散化處理。本文采用了以下兩個步驟進(jìn)行數(shù)據(jù)預(yù)處理。
(1)以離散字符替代課程名稱。以離散字符D1,D2,D3,D4,D5,D6分別替代表示“電路分析與測試”“電子技術(shù)基礎(chǔ)”“變電所運行與維護”“電力線路運行檢修與施工”“接觸網(wǎng)運行檢修與施工”“電氣化鐵路供電系統(tǒng)運行與管理”六門課程。
(2)對連續(xù)型數(shù)據(jù)進(jìn)行離散化分類。設(shè)定90分以上為優(yōu)秀,70~89分為良好,60~69分為合格,60分以下為不合格。將以上分段分別以A-優(yōu)秀、B-良好、C——合格、D-不合格四個等級替代表示。經(jīng)過預(yù)處理后的學(xué)生成績?nèi)绫?所列,其中學(xué)生總?cè)藬?shù)為275人,分別對應(yīng)275條記錄。
4.2結(jié)果與分析
4.2.1挖掘結(jié)果
本文采用Microsoft SQL Server 2008軟件進(jìn)行數(shù)據(jù)挖掘,將預(yù)處理好的、已滿足Apriori算法要求的數(shù)據(jù)導(dǎo)人,即可直接使用Apriori模型進(jìn)行分析。關(guān)聯(lián)規(guī)則如表2所列。
通過挖掘分析,分別獲得:(I)D1-D2;(2) D1,D2-D3,D4,D5,D6;(3) D3,D4,D5-D6的關(guān)聯(lián)規(guī)則表,如表3~表5所列。
4.2.2結(jié)果分析
挖掘的關(guān)聯(lián)規(guī)則并不是所有條目都具有實際意義,接下來我們進(jìn)一步地對挖掘出的規(guī)則進(jìn)行分析,得出有意義的知識。
(1)學(xué)習(xí)“電路分析與測試”課程是學(xué)習(xí)“電子技術(shù)基礎(chǔ)”課程的基礎(chǔ),如果“電路分析與測試”課程學(xué)習(xí)基礎(chǔ)打不好,在學(xué)習(xí)“電子技術(shù)基礎(chǔ)”課程時就會受影響較大。
在表3中,D1電路分析與測試=D-D2電子技術(shù)基礎(chǔ)=D,支持度0.517,置信度0.6458。電路分析與測試和電子技術(shù)基礎(chǔ)同時是D的概率為51.7%,電路分析與測試為D中64.58%的人電子技術(shù)基礎(chǔ)也為D,說明如果“電路分析與測試”課程基礎(chǔ)未打牢,“電子技術(shù)基礎(chǔ)”課程也較難學(xué)好。
(2)學(xué)好“電路分析與測試”“電子技術(shù)基礎(chǔ)”兩門專業(yè)基礎(chǔ)課是學(xué)好專業(yè)核心課(“變電所運行與維護”“電力線路運行檢修與施工”“接觸網(wǎng)運行檢修與施工”)的基礎(chǔ)。如果專業(yè)基礎(chǔ)課基礎(chǔ)打不牢,也會影響后面專業(yè)課的學(xué)習(xí)。表4數(shù)據(jù)說明,“電路分析與測試”和“電子技術(shù)基礎(chǔ)”課程學(xué)不好,51.61%的人可能也學(xué)不好“電氣化鐵路供電系統(tǒng)運行與管理”課程。
(3)專業(yè)核心課“變電所運行與維護”“電力線路運行檢修與施工”“接觸網(wǎng)運行檢修與施工”的學(xué)習(xí)與“電氣化鐵路供電系統(tǒng)運行與管理”的學(xué)習(xí)關(guān)聯(lián)性較強。
從表5可以看出.D6電氣化鐵路供電系統(tǒng)運行與管理成績的好壞很有可能與D3變電所運行與維護、D4電力線路運行檢修與施工、D5接觸網(wǎng)運行檢修與施工三門課程成績有關(guān)。D4電力線路運行檢修與施工、D3電所運行與維護同時為A,D6電氣化鐵路供電系統(tǒng)運行與管理也為A的支持度0. 813,置信度0.99894;D5接觸網(wǎng)運行檢修與施工、D3電所運行與維護同時為A,D6電氣化鐵路供電系統(tǒng)運行與管理也為A的支持度0.769,置信度0.9462; D5接觸網(wǎng)運行檢修與施工、D4電力線路運行檢修與施工同時為A,D6電氣化鐵路供電系統(tǒng)運行與管理也為A的支持度0.75.置信度0.9723。這表明前三門課程成績優(yōu)異,很有可能電氣化鐵路供電系統(tǒng)運行與管理課程成績也優(yōu)異。但如果D3電所運行與維護、D4電力線路運行檢修與施工同時為D,D6電氣化鐵路供電系統(tǒng)運行與管理也為D的支持度0.8,置信度0.5589; D3電所運行與維護、D5接觸網(wǎng)運行檢修與施工為D,D6電氣化鐵路供電系統(tǒng)運行與管理為D的支持度0.72,置信度0.5726。即前三門D3,D4,D5課程成績不及格,也有可能導(dǎo)致D6課程成績不及格。
(4)本次挖掘結(jié)果表明:選取的2門專業(yè)基礎(chǔ)課與專業(yè)核心課之間存在較強的依賴關(guān)系。課程設(shè)置時盡可能保持專業(yè)基礎(chǔ)課的學(xué)時、學(xué)分不縮減。另外,“電氣化鐵路供電系統(tǒng)運行與管理”課程的綜合性較強,需要以其他課程作為基礎(chǔ),應(yīng)考慮將其放在其他理論課程學(xué)完后的學(xué)期進(jìn)行開設(shè)。
5結(jié)束語
利用關(guān)聯(lián)規(guī)則中的Apriori算法對鐵道供電技術(shù)專業(yè)的2門專業(yè)基礎(chǔ)課和4門核心課成績進(jìn)行關(guān)聯(lián)性挖掘,從而探究各課程之間存在的內(nèi)在聯(lián)系,并將挖掘結(jié)果應(yīng)用于該專業(yè)課程設(shè)置,可以為專業(yè)設(shè)置提供更可靠的理論依據(jù)。后續(xù)也可以將該方法應(yīng)用于專業(yè)的其他課程,為專業(yè)建設(shè),甚至是學(xué)生學(xué)習(xí)、教師的教學(xué)提供更科學(xué)的指導(dǎo)。