詳細(xì)介紹了基于數(shù)據(jù)挖掘技術(shù)的課程相關(guān)性分析方法(相關(guān)分析法、典型相關(guān)分析法和關(guān)聯(lián)規(guī)則分析法)的運(yùn)算原理、適用范圍和優(yōu)缺點(diǎn)。分析認(rèn)為,三種分析方法各具優(yōu)缺點(diǎn),互不可替代,具有顯著的實(shí)用意義和社會(huì)價(jià)值,可作為教育教學(xué)改進(jìn)決策的支持信息來(lái)源,也理應(yīng)是教育工作者在教學(xué)提升方面的重要研究方向。
課程相關(guān)性分析數(shù)據(jù)挖掘相關(guān)分析典型相關(guān)分析關(guān)聯(lián)規(guī)則一、引言
課程是實(shí)現(xiàn)教學(xué)內(nèi)容傳遞的集中體現(xiàn),是學(xué)校教育的目的性、計(jì)劃性和組織性的集中體現(xiàn)。課程設(shè)置規(guī)定著課程類(lèi)型、課程性質(zhì)、課程排序和學(xué)時(shí)分配,還規(guī)定各類(lèi)各科課程的學(xué)習(xí)目標(biāo)、學(xué)習(xí)內(nèi)容和學(xué)習(xí)要求等,其合理與否將直接影響到所培養(yǎng)人才的質(zhì)量,關(guān)系到學(xué)生知識(shí)面的寬度、深度、動(dòng)手實(shí)踐和研究能力的高低,同時(shí)也已經(jīng)成為了影響大學(xué)生就業(yè)的主要因素之一。因此,課程結(jié)構(gòu)和課程內(nèi)容的合理設(shè)置尤為重要。
課程相關(guān)性分析可定量描述課程之間的相關(guān)性,可根據(jù)相關(guān)系數(shù)值的大小確定課程間關(guān)系的緊密程度,然后從順序性、整體性、關(guān)聯(lián)性和連續(xù)性四個(gè)方面為優(yōu)化課程設(shè)置提供參考信息,優(yōu)化課程結(jié)構(gòu)和課程內(nèi)容。近年來(lái),國(guó)內(nèi)外教育工作研究人員開(kāi)展了大量的課程相關(guān)性方面的研究,國(guó)內(nèi)外多所著名高校已將課程相關(guān)性研究成果作為課程設(shè)置的基本依據(jù)。
目前課程相關(guān)性分析研究所采用的方法均基于數(shù)據(jù)分析,其方法主要包括傳統(tǒng)數(shù)據(jù)分析法和數(shù)據(jù)挖掘分析法兩種,而兩者又有著本質(zhì)的區(qū)別。在探索數(shù)據(jù)關(guān)系時(shí),傳統(tǒng)的分析方法一般是基于驗(yàn)證的方法,即用戶首先對(duì)數(shù)據(jù)之間的關(guān)系做出一定的假設(shè),然后通過(guò)數(shù)據(jù)分析來(lái)驗(yàn)證假設(shè)是否正確來(lái)得出相應(yīng)結(jié)論,其分析過(guò)程是基于假設(shè)驅(qū)動(dòng)的演繹型分析;數(shù)據(jù)挖掘不是用于驗(yàn)證某個(gè)假定的模式(模型)的正確性,而是在數(shù)據(jù)庫(kù)中自己尋找模型,數(shù)據(jù)挖掘在本質(zhì)上是一個(gè)完全基于發(fā)現(xiàn)驅(qū)動(dòng)的歸納型分析過(guò)程。
本文對(duì)課程相關(guān)性分析中的數(shù)據(jù)挖掘過(guò)程及基于數(shù)據(jù)挖掘技術(shù)的課程相關(guān)分析方法進(jìn)行介紹,以期為我國(guó)高校課程的優(yōu)化設(shè)置研究提供理論指導(dǎo)和方法借鑒。
二、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining,DM)又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,通過(guò)使用成熟的數(shù)據(jù)挖掘模型,提取出隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí),得到數(shù)據(jù)中反映出來(lái)的數(shù)據(jù)內(nèi)在的關(guān)系,從而進(jìn)一步應(yīng)用到具體的數(shù)據(jù)分析研究中去。數(shù)據(jù)挖掘得到的信息具有先前未知、有效和實(shí)用三個(gè)特征。
目前,數(shù)據(jù)挖掘技術(shù)的已被應(yīng)用于關(guān)聯(lián)分析(Association Analysis)、概念/類(lèi)別描述(Concept/Class Description)、分類(lèi)與估值(Classification and Estimation)、聚類(lèi)分析(Clustering Analysis)、時(shí)間序列分析(Time-Series Analysis)、偏差分析(Deviation Analysis)、孤立點(diǎn)分析(Outlier Analysis)等方面,隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,可能還會(huì)繼續(xù)出現(xiàn)新的數(shù)據(jù)挖掘功能。課程相關(guān)性分析為其關(guān)聯(lián)分析功能中的一部分,所采用的分析方法主要有相關(guān)分析法、典型相關(guān)分析法和關(guān)聯(lián)規(guī)則分析法等。
數(shù)據(jù)挖掘分析過(guò)程各步驟之間互相影響、反復(fù)調(diào)整,形成一種螺旋式上升過(guò)程,具體分析流程見(jiàn)圖1所示。目前已建立的數(shù)據(jù)挖掘模型有CRISP-DM模型(Cross Industry Standard Process for Data Mining)、ODDM模型(OLE DB for Data Mining)、Oracle9i數(shù)據(jù)挖掘模型等多種,對(duì)于課程相關(guān)性分析來(lái)說(shuō),具有直觀、簡(jiǎn)單和可靠等特點(diǎn)的CRISP-DM模型最為適用,其模型見(jiàn)圖2所示。
三、基于數(shù)據(jù)挖掘的課程相關(guān)性分析方法
基于數(shù)據(jù)挖掘的課程相關(guān)性分析方法主要有相關(guān)分析法、典型相關(guān)分析法和關(guān)聯(lián)規(guī)則分析法,三種方法各具優(yōu)缺點(diǎn),互不可取代。
1.相關(guān)分析法
相關(guān)分析法又稱單因子相關(guān)分析法,主要用于研究?jī)蓚€(gè)變量因子間的相關(guān)關(guān)系。作為教育信息多元統(tǒng)計(jì)分析方法的一種,相關(guān)分析法主要用于測(cè)定現(xiàn)象之間相關(guān)關(guān)系的規(guī)律性,據(jù)此進(jìn)行預(yù)測(cè)和控制。將其用于課程相關(guān)性的探討研究,可直接量化兩門(mén)課程間的相關(guān)性,分析過(guò)程簡(jiǎn)單、快捷,顯示方式直觀,數(shù)據(jù)可信度高。
相關(guān)分析法在課程相關(guān)性分析研究中應(yīng)用,主要有以下幾個(gè)步驟:
(1)確定兩門(mén)課程之間有無(wú)相關(guān)關(guān)系以及相關(guān)關(guān)系的類(lèi)型。在不熟悉課程情況時(shí),則需收集兩門(mén)課程的對(duì)應(yīng)資料,用繪制相關(guān)圖的方法進(jìn)行初步判斷。
(2)判定現(xiàn)象之間相關(guān)關(guān)系的密切程度,通常是計(jì)算相關(guān)系數(shù)R(又稱皮氏積矩相關(guān)系數(shù)),其絕對(duì)值在0.8以上表明高度相關(guān),必要時(shí)應(yīng)對(duì)R進(jìn)行顯著性檢驗(yàn)。