摘要:以北京聯(lián)合大學(xué)商務(wù)學(xué)院信息管理與信息系統(tǒng)專業(yè)課程為研究對(duì)象,通過提取課程大綱內(nèi)容關(guān)鍵詞,應(yīng)用Apriori算法對(duì)課程內(nèi)容進(jìn)行關(guān)聯(lián)分析,得出課程關(guān)聯(lián)規(guī)則,并建立專業(yè)課程知識(shí)網(wǎng)絡(luò)。通過課程關(guān)聯(lián)分析及知識(shí)網(wǎng)絡(luò)分析研究課程之間的相關(guān)關(guān)系和緊密程度,區(qū)分核心課程,劃分課程結(jié)構(gòu),并在此基礎(chǔ)上對(duì)專業(yè)課程設(shè)置及改革提出意見與建議。對(duì)于專業(yè)課程研究及探索具有較強(qiáng)的理論和實(shí)踐意義。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;Apriori算法;知識(shí)網(wǎng)絡(luò);專業(yè)課程;數(shù)據(jù)挖掘
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-0079(2014)21-0055-03
專業(yè)課程設(shè)置是決定高等教育人才培養(yǎng)質(zhì)量的重要環(huán)節(jié)。課程計(jì)劃是課程設(shè)置的整體規(guī)劃,是實(shí)現(xiàn)專業(yè)人才培養(yǎng)方案的關(guān)鍵,決定了教學(xué)實(shí)施的效果和人才培養(yǎng)的質(zhì)量。課程設(shè)置是否合理、課程之間如何關(guān)聯(lián);如何合理地設(shè)置專業(yè)課程結(jié)構(gòu)、調(diào)整專業(yè)課程內(nèi)容;如何用科學(xué)的方法對(duì)現(xiàn)有專業(yè)課程體系進(jìn)行關(guān)聯(lián)分析,成為國(guó)內(nèi)高校專業(yè)建設(shè)與課程改革中極為重要的研究課題。
本文以北京聯(lián)合大學(xué)信息管理與信息系統(tǒng)專業(yè)課程為例,通過提取課程大綱關(guān)鍵詞對(duì)專業(yè)課程進(jìn)行內(nèi)容分析,運(yùn)用Apriori算法發(fā)現(xiàn)課程關(guān)聯(lián)規(guī)則,并繪制課程知識(shí)網(wǎng)絡(luò)圖,在此基礎(chǔ)上分析課程的關(guān)聯(lián)程度,區(qū)分核心課程與非核心課程,對(duì)課程進(jìn)行緊密度劃分,以驗(yàn)證專業(yè)課程設(shè)置的合理性,為專業(yè)課程計(jì)劃的調(diào)整提供針對(duì)性的意見和建議。
一、關(guān)聯(lián)規(guī)則及Apriori算法綜述
關(guān)聯(lián)規(guī)則最早由Agrawal(1993)等人提出,側(cè)重于確定數(shù)據(jù)中滿足特定要求的不同屬性域之間的相互聯(lián)系。關(guān)聯(lián)規(guī)則挖掘過程主要分為三大步驟:①一是求數(shù)據(jù)庫(kù)中滿足相應(yīng)閥值的所有的頻繁項(xiàng)目集并逐步尋找子集;二是利用挖掘好的頻繁項(xiàng)目集生成所有達(dá)到相應(yīng)閥值的關(guān)聯(lián)規(guī)則;三是對(duì)發(fā)掘出來的規(guī)則進(jìn)行可視化處理和評(píng)估。關(guān)聯(lián)規(guī)則采用的主要算法有:Apriori算法及其衍生算法、增量挖掘算法以及并行挖掘算法等。本文分析的數(shù)據(jù)集較小且迭代次數(shù)不多,因此采用經(jīng)典Apriori算法對(duì)課程進(jìn)行關(guān)聯(lián)分析。
Apriori算法是由Agrawal(1994)等人設(shè)計(jì)并提出的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的一種有效算法。其基本思路是重復(fù)掃描數(shù)據(jù)庫(kù),其核心內(nèi)容是基于頻繁項(xiàng)集的一步步推導(dǎo),首先找出用戶設(shè)定的minsupport閥值的第一頻繁項(xiàng)集L1,使用L1來尋找第二頻繁項(xiàng)集L2,然后L2尋找L3,如此反復(fù),直到找不到頻繁項(xiàng)集為止。②實(shí)施步驟主要分為兩步:一是發(fā)現(xiàn)頻繁項(xiàng)集,如果一個(gè)項(xiàng)集是頻繁的,則其子集也是頻繁的;二是根據(jù)所獲得的頻繁項(xiàng)集尋找符合支持度的關(guān)聯(lián)規(guī)則,最后依據(jù)設(shè)定的置信度指標(biāo)確定規(guī)則。關(guān)聯(lián)規(guī)則實(shí)質(zhì)上是在數(shù)據(jù)庫(kù)中找出置信度和支持度分別大于等于設(shè)定好的相應(yīng)閥值的規(guī)則。
置信度也稱為置信水平(Degree of confidence,簡(jiǎn)稱Dconf),是估計(jì)值與總體參數(shù)在一定允許的誤差范圍以內(nèi),其相應(yīng)概率的大小。置信度表示區(qū)間估計(jì)的把握程度大小,所以要求的把握程度越大,就會(huì)得到一個(gè)相對(duì)寬的置信區(qū)間,相應(yīng)降低了估計(jì)的準(zhǔn)確程度。在挖掘關(guān)聯(lián)規(guī)則時(shí)需要自己設(shè)定一個(gè)最低準(zhǔn)確度的數(shù)值,用來選取確定關(guān)聯(lián)規(guī)則,為決策做依據(jù);對(duì)于規(guī)則X、Y的置信度的計(jì)算公式為:
(1)
支持度即被支持的程度(Degree of support,簡(jiǎn)稱Dsupp),即在一個(gè)數(shù)據(jù)集中支持被選數(shù)據(jù)出現(xiàn)的百分比。對(duì)于項(xiàng)集X的支持度公式為:
(2)
對(duì)于規(guī)則X、Y的支持度計(jì)算公式為:
(3)
以上X、Y為數(shù)據(jù)項(xiàng)集的子集,則合格規(guī)則X→Y(給定最小支持度α和最小置信度β)可以表示為:。
已有文獻(xiàn)對(duì)關(guān)聯(lián)規(guī)則及Apriori算法的改進(jìn)及優(yōu)化研究較多,應(yīng)用于課程關(guān)聯(lián)分析的文獻(xiàn)并不多見,少數(shù)文獻(xiàn)采用學(xué)生成績(jī)或追蹤畢業(yè)生就業(yè)狀況來獲取數(shù)據(jù)源,以此推斷課程設(shè)置的合理性。本文以信息管理與信息系統(tǒng)專業(yè)課程為研究對(duì)象,采用客觀數(shù)據(jù)即課程大綱提取內(nèi)容關(guān)鍵詞,避免其他主觀因素的影響,再應(yīng)用Apriori算法提取課程關(guān)聯(lián)規(guī)則,使分析結(jié)果更加客觀。
二、課程關(guān)聯(lián)分析
1.課程編碼及關(guān)鍵詞提取
本文研究對(duì)象是專業(yè)課程,不考慮基礎(chǔ)課和通識(shí)教育課,如大學(xué)英語(yǔ)、體育等。信息管理與信息系統(tǒng)專業(yè)課程主要分為四大類:學(xué)科大類必修課、學(xué)科大類限選課、專業(yè)必修課、專業(yè)限選課,本文一共選取了26門專業(yè)課程進(jìn)行關(guān)聯(lián)分析。
課程大綱是最能客觀反映課程內(nèi)容的規(guī)范性文件,從課程大綱中提取關(guān)鍵詞可以較為準(zhǔn)確地涵蓋課程主要內(nèi)容。本文采用Python語(yǔ)言對(duì)26門專業(yè)課程大綱進(jìn)行分詞分析,提取高頻詞作為本門課程的關(guān)鍵詞,從分詞結(jié)果中對(duì)每門課程出現(xiàn)頻率最高的30個(gè)詞語(yǔ)進(jìn)行分析,剔除語(yǔ)義不合理的詞匯以及動(dòng)詞、形容詞等無法反映課程內(nèi)容的詞匯。考慮到關(guān)聯(lián)規(guī)則算法對(duì)數(shù)據(jù)的要求,圍繞課程核心保留關(guān)鍵詞,經(jīng)過多次試驗(yàn)每門課程最終選取10個(gè)以內(nèi)的關(guān)鍵詞。由于提取的關(guān)鍵詞存在一定的差異性,各門課程提取的有效詞匯數(shù)目不同,少數(shù)課程提取的有效關(guān)鍵詞不足10個(gè)但不少于7個(gè),符合本文的分析目的及要求,最后整理課程有效關(guān)鍵詞如。
2.提取關(guān)聯(lián)規(guī)則
以上規(guī)則反映了課程之間的關(guān)聯(lián)關(guān)系,具體解釋如下:數(shù)據(jù)庫(kù)應(yīng)用基礎(chǔ)、管理信息系統(tǒng)分析與設(shè)計(jì)、商務(wù)智能;供應(yīng)鏈與物流管理、電子商務(wù)網(wǎng)站建設(shè)、商務(wù)智能;商務(wù)決策、統(tǒng)計(jì)學(xué)、商務(wù)定量分析;客戶關(guān)系管理、項(xiàng)目管理、管理學(xué);市場(chǎng)營(yíng)銷、客戶關(guān)系管理、供應(yīng)鏈與物流管理;供應(yīng)鏈與物流管理、項(xiàng)目管理、市場(chǎng)營(yíng)銷;企業(yè)資源計(jì)劃、商務(wù)智能、供應(yīng)鏈與物流管理;企業(yè)資源計(jì)劃、商務(wù)智能、數(shù)據(jù)庫(kù)應(yīng)用基礎(chǔ);信息管理學(xué)、商務(wù)智能、管理信息系統(tǒng)分析與設(shè)計(jì);商務(wù)定量分析、統(tǒng)計(jì)學(xué)、商務(wù)決策;電子商務(wù)概論、電子商務(wù)網(wǎng)站建設(shè)、供應(yīng)鏈與物流管理。每條規(guī)則都反映了這幾門課程之間存在較強(qiáng)的內(nèi)容聯(lián)系,或?yàn)橄刃拚n程與后續(xù)課程,或可以通過這些規(guī)則發(fā)現(xiàn)核心課程,也從一定程度上驗(yàn)證了課程設(shè)置的專業(yè)集中度及合理性。
3.課程知識(shí)網(wǎng)絡(luò)分析
通過關(guān)聯(lián)規(guī)則挖掘得到了部分課程之間的相關(guān)性,但無法直觀反映出專業(yè)課程體系的整體關(guān)聯(lián)程度,以下采用社會(huì)網(wǎng)絡(luò)分析方法(Social Network Analysis)構(gòu)建課程知識(shí)網(wǎng)絡(luò)。本文采用NetDraw工具對(duì)課程設(shè)置構(gòu)建可視化的知識(shí)網(wǎng)絡(luò),以課程及關(guān)鍵詞作為節(jié)點(diǎn),對(duì)專業(yè)課程進(jìn)行知識(shí)網(wǎng)路分析。
圖2反映了課程關(guān)聯(lián)程度的總體知識(shí)網(wǎng)絡(luò)結(jié)構(gòu),其中圓圈代表課程,方塊代表關(guān)鍵詞。越趨于中心的課程說明該課程的內(nèi)容越核心,關(guān)鍵詞越靠近外圍說明通過其連接的課程越少,例如極限、動(dòng)畫、通貨膨脹、求導(dǎo)等關(guān)鍵詞都只屬于某一門課程,并未與其他課程關(guān)聯(lián)。
為了更清晰地分辨課程的分布情況和關(guān)聯(lián)程度,構(gòu)建課程關(guān)系圖如圖3所示。其中節(jié)點(diǎn)圖形越大代表通過它連接的課程或者關(guān)鍵詞越多,在整體課程設(shè)置計(jì)劃或內(nèi)容中越重要。
三、數(shù)據(jù)結(jié)果分析
通過上述分析可以看出,該專業(yè)課程設(shè)置整體情況較為合理,所有專業(yè)課程之間都可以通過至少一個(gè)關(guān)鍵詞進(jìn)行連接,從而形成完整的知識(shí)網(wǎng)絡(luò)。通過關(guān)聯(lián)規(guī)則提取,得出了11條課程關(guān)聯(lián)規(guī)則,證明多門課程在課程內(nèi)容設(shè)置上存在較強(qiáng)的相關(guān)性,反映了專業(yè)課程之間的內(nèi)容聯(lián)系。通過對(duì)關(guān)聯(lián)規(guī)則中課程緊密程度進(jìn)行分析,并對(duì)知識(shí)網(wǎng)絡(luò)中每門課程所連接關(guān)鍵詞的頻次從高到低排序,確定該專業(yè)的核心課程如下:“管理信息系統(tǒng)分析與設(shè)計(jì)”“商務(wù)智能”“信息管理學(xué)”“電子商務(wù)概論”五門課程。課程內(nèi)容核心關(guān)鍵詞為:商務(wù)、模擬、經(jīng)濟(jì)學(xué)、軟件、電子商務(wù)、信息管理、案例、分析方法等,體現(xiàn)了該專業(yè)的方向及特色。通過以上分析可劃分專業(yè)課程結(jié)構(gòu)如下:
第一,數(shù)學(xué)分析類,包括高等數(shù)學(xué)、統(tǒng)計(jì)學(xué)、商務(wù)定量分析、商務(wù)分析方法,主要關(guān)鍵詞有微積分、定量分析、假設(shè)檢驗(yàn)、概率論等。
第二,計(jì)算機(jī)基礎(chǔ)類,包括計(jì)算機(jī)應(yīng)用基礎(chǔ)、互聯(lián)網(wǎng)應(yīng)用與開發(fā)、數(shù)據(jù)庫(kù)應(yīng)用基礎(chǔ),主要關(guān)鍵詞為數(shù)據(jù)、操作系統(tǒng)、軟件等。
第三,管理類,包括管理學(xué)、項(xiàng)目管理、客戶關(guān)系管理、供應(yīng)鏈與物流管理,主要關(guān)鍵詞為管理學(xué)、戰(zhàn)略、分析方法等。
第四,經(jīng)濟(jì)學(xué)類,包括宏觀經(jīng)濟(jì)、微觀經(jīng)濟(jì)學(xué)、會(huì)計(jì)學(xué)、信息經(jīng)濟(jì)學(xué)、市場(chǎng)營(yíng)銷,主要關(guān)鍵詞為經(jīng)濟(jì)學(xué)、成本、業(yè)務(wù)流程、營(yíng)銷、策略等。
第五,電子商務(wù)類,包括電子商務(wù)概論、電子商務(wù)網(wǎng)站建設(shè),主要關(guān)鍵詞為物流、電子商務(wù)、模擬等。
第六,信息類,包括管理信息系統(tǒng)分析與設(shè)計(jì)、信息管理學(xué)、商務(wù)智能,主要關(guān)鍵詞為信息管理、系統(tǒng)、設(shè)計(jì)、案例等。
第七,商務(wù)類,包括商務(wù)研究方法、商務(wù)決策,主要關(guān)鍵詞為商務(wù)、案例、方法論、營(yíng)銷、策略等。
四、建議與總結(jié)
本文從關(guān)聯(lián)分析的角度對(duì)北京聯(lián)合大學(xué)商務(wù)學(xué)院信息管理與信息系統(tǒng)專業(yè)課程進(jìn)行針對(duì)性分析。從課程內(nèi)容上看,目前該課程體系設(shè)置基本合理,但仍然存在部分課程關(guān)聯(lián)度不高、課程結(jié)構(gòu)設(shè)置須進(jìn)一步合理化等問題。針對(duì)以上分析提出課程調(diào)整建議如下:一是依據(jù)培養(yǎng)目標(biāo)加強(qiáng)核心課程的內(nèi)容建設(shè),形成信息管理與信息系統(tǒng)專業(yè)特色的核心課程體系;二是依據(jù)課程性質(zhì)及內(nèi)容關(guān)聯(lián)程度劃分課程群,形成合理的課程知識(shí)鏈條;三是依據(jù)課程內(nèi)容的邏輯關(guān)系確定先修課與后續(xù)課程,根據(jù)課程先后順序設(shè)置合理的教學(xué)計(jì)劃。
注釋:
①高飛.關(guān)聯(lián)規(guī)則挖掘算法研究[D].西安:西安電子科技大學(xué),2001.
②王明,宋順林.基于項(xiàng)集優(yōu)化重組的頻繁項(xiàng)集發(fā)現(xiàn)算法[J].計(jì)算機(jī)應(yīng)用,2010,(9).
參考文獻(xiàn):
[1]朱文湘,朱建軍.關(guān)聯(lián)規(guī)則分析及其在教務(wù)管理系統(tǒng)中的應(yīng)用[J].微計(jì)算機(jī)應(yīng)用,2007,7(2).
[2]王運(yùn)鋒,夏德宏,顏堯妹.社會(huì)網(wǎng)絡(luò)分析與可視化工具NetDraw的應(yīng)用案例分析[J].現(xiàn)代教育技術(shù),2008,4(18).
[3]楊靜.關(guān)聯(lián)規(guī)則Apriori算法在學(xué)生信息管理中的應(yīng)用[J].福建電腦,2010,3(1).
[4]鄧硯谷,佘穎.基于關(guān)聯(lián)規(guī)則的高校課程關(guān)聯(lián)性分析[J].現(xiàn)代教育技術(shù),2010,(5).
[5]王明,宋順林.基于項(xiàng)集優(yōu)化重組的頻繁項(xiàng)集發(fā)現(xiàn)算法[J].計(jì)算機(jī)應(yīng)用,2010,(9).
[6]李橋,陽(yáng)春華.關(guān)聯(lián)規(guī)則Apriori算法在教學(xué)評(píng)價(jià)中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2010,6(1).
[7]崔貫勛,李梁.關(guān)聯(lián)規(guī)則挖掘中Apriori算法的研究與改進(jìn)[J].計(jì)算機(jī)應(yīng)用,2010,11(1).
[8]高飛.關(guān)聯(lián)規(guī)則挖掘算法研究[D].西安:西安電子科技大學(xué),2001.
[9]文蓉.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法及應(yīng)用研究[D].長(zhǎng)沙:湖南大學(xué),2007.
[10]焦亞冰.關(guān)聯(lián)規(guī)則挖掘算法的研究與應(yīng)用[D].濟(jì)南:山東師范大學(xué),2008.
[11]王玉榮.關(guān)聯(lián)規(guī)則算法在大數(shù)據(jù)集上的應(yīng)用研究[D].無錫:江南大學(xué),2011.
[12]陳國(guó)青.商務(wù)智能原理與方法[M].北京:電子工業(yè)出版社,2009.
(責(zé)任編輯:孫晴)