• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大規(guī)模在線協(xié)作學(xué)習(xí)分組方法及應(yīng)用研究

    2021-01-11 09:12:16陳甜甜何秀青葛文雙何聚厚
    關(guān)鍵詞:組內(nèi)協(xié)作分組

    陳甜甜,何秀青,葛文雙,何聚厚

    1.陜西師范大學(xué) 現(xiàn)代教學(xué)技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,西安710062

    2.陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,西安710062

    MOOC 課程的興起給高等教育的全球化提供了契機(jī),使得不同地區(qū)、不同年齡的學(xué)習(xí)者可以在任何時(shí)間、任何地點(diǎn)進(jìn)行學(xué)習(xí)[1]。但是與大規(guī)模學(xué)習(xí)參與者形成鮮明對(duì)比的是,目前MOOC 課程普遍存在完成率低的現(xiàn)象[2]。造成課程完成率低的原因有很多,比如學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)者的能力及特質(zhì)、學(xué)習(xí)者的知識(shí)背景等,除此之外還有一個(gè)不可忽視的原因就是學(xué)習(xí)孤獨(dú)感[3]。文獻(xiàn)[3]中指出雖然在線學(xué)習(xí)平臺(tái)上同時(shí)學(xué)習(xí)同一門MOOC課程的在線學(xué)習(xí)者有成千上萬(wàn)名,但是實(shí)際上絕大多數(shù)在線學(xué)習(xí)者都是在獨(dú)自學(xué)習(xí)。與傳統(tǒng)課堂教學(xué)不同,在線學(xué)習(xí)者主要通過(guò)觀看教學(xué)視頻進(jìn)行課程學(xué)習(xí),在線課程學(xué)習(xí)沒(méi)有時(shí)間和空間的限制、沒(méi)有教師管束、沒(méi)有同學(xué)之間的互相監(jiān)督與提醒,學(xué)習(xí)活動(dòng)完全以個(gè)體學(xué)習(xí)為主,在學(xué)習(xí)過(guò)程中有疑問(wèn)時(shí)沒(méi)有老師及時(shí)解答,遇到困難時(shí)也沒(méi)有適合的學(xué)習(xí)伙伴進(jìn)行交流、討論,這種學(xué)習(xí)過(guò)程中的孤獨(dú)感使其逐漸失去學(xué)習(xí)的興趣和動(dòng)力,最終放棄對(duì)課程的學(xué)習(xí),成為流失學(xué)習(xí)者,進(jìn)而造成MOOC課程完成率低的現(xiàn)象。

    隨著在線學(xué)習(xí)和協(xié)作學(xué)習(xí)的發(fā)展,在線協(xié)作學(xué)習(xí)成為一種有效的學(xué)習(xí)模式[4],構(gòu)建在線協(xié)作學(xué)習(xí)小組可以改善學(xué)習(xí)者的在線學(xué)習(xí)體驗(yàn),提高學(xué)習(xí)積極性。越來(lái)越多的教育研究者開(kāi)始意識(shí)到協(xié)作學(xué)習(xí)在在線學(xué)習(xí)過(guò)程中發(fā)揮的重要作用。在線教育開(kāi)拓者琳達(dá)·哈拉西姆博士[5]首次提出必須修改協(xié)作學(xué)習(xí)教學(xué)法以適應(yīng)在線學(xué)習(xí)環(huán)境;MOOC供應(yīng)商也認(rèn)為在線協(xié)作學(xué)習(xí)是在線教育質(zhì)量的重要保證之一,其中Coursera平臺(tái)的創(chuàng)始人吳恩達(dá)認(rèn)為,協(xié)作學(xué)習(xí)環(huán)境是MOOC 存在的諸多重大缺失之一,Coursera平臺(tái)將更加重視在線協(xié)作學(xué)習(xí)[6];Udacity平臺(tái)的首席執(zhí)行官特倫也認(rèn)為,在線學(xué)習(xí)平臺(tái)要更具有包容性和協(xié)作性[7]。但是在線學(xué)習(xí)者人數(shù)眾多,如何設(shè)計(jì)和開(kāi)展大規(guī)模在線協(xié)作學(xué)習(xí)分組是當(dāng)前面臨的一個(gè)挑戰(zhàn)。國(guó)內(nèi),馬艷云等人[8]綜合考慮網(wǎng)絡(luò)協(xié)作學(xué)習(xí)者的個(gè)性化特征和協(xié)作特征,提出基于聚類和梯度選擇的網(wǎng)絡(luò)協(xié)作學(xué)習(xí)分組算法,為智能化分組奠定了基礎(chǔ);羅凌等人[9]構(gòu)建了在線協(xié)作學(xué)習(xí)者的多維特征模型,并提出了基于模糊C 均值的在線協(xié)作學(xué)習(xí)混合分組算法。但是上述方法僅在理論上為大規(guī)模在線協(xié)作學(xué)習(xí)分組提供了一定的借鑒和參考,沒(méi)有真正實(shí)現(xiàn)大規(guī)模的在線協(xié)作學(xué)習(xí)分組。

    為了改善在線學(xué)習(xí)者的學(xué)習(xí)體驗(yàn),降低學(xué)習(xí)孤獨(dú)感,本文在對(duì)當(dāng)前研究進(jìn)行總結(jié)梳理的基礎(chǔ)上,考慮到在線學(xué)習(xí)平臺(tái)具有數(shù)據(jù)規(guī)模大、特征維度高的特點(diǎn),于是引入深度學(xué)習(xí)中的自編碼神經(jīng)網(wǎng)絡(luò)與模糊C 均值算法相結(jié)合,設(shè)計(jì)了基于MOOC 課程的大規(guī)模在線協(xié)作學(xué)習(xí)分組方法。該方法的基本思想是:首先構(gòu)建在線學(xué)習(xí)者的特征模型,利用自編碼神經(jīng)網(wǎng)絡(luò)提取學(xué)習(xí)者的關(guān)鍵特征,對(duì)原始數(shù)據(jù)進(jìn)行降維;然后根據(jù)在線學(xué)習(xí)者的關(guān)鍵特征,利用模糊C均值算法以迭代分組的方式構(gòu)建與學(xué)習(xí)者學(xué)習(xí)特征相適應(yīng)的在線協(xié)作學(xué)習(xí)小組,使在線學(xué)習(xí)者的學(xué)習(xí)形式由獨(dú)自學(xué)習(xí)轉(zhuǎn)變?yōu)樾〗M協(xié)作學(xué)習(xí),從而改善學(xué)習(xí)者的在線學(xué)習(xí)體驗(yàn),提高學(xué)習(xí)積極性和課程參與度,解決在線學(xué)習(xí)過(guò)程中產(chǎn)生的孤獨(dú)學(xué)習(xí)者問(wèn)題,最大限度地保留課程參與者,提高M(jìn)OOC課程完成率。

    圖1 edX開(kāi)放數(shù)據(jù)集字段描述

    1 基于MOOC 課程的大規(guī)模在線協(xié)作學(xué)習(xí)分組方法

    1.1 大規(guī)模在線協(xié)作學(xué)習(xí)分組依據(jù)

    大規(guī)模在線協(xié)作學(xué)習(xí)分組不同于傳統(tǒng)課堂教學(xué)的協(xié)作學(xué)習(xí)分組,主要體現(xiàn)在兩個(gè)方面:“大規(guī)?!焙汀霸诰€”?!按笠?guī)?!笔侵概c傳統(tǒng)課堂教學(xué)中的學(xué)習(xí)者數(shù)量相比,選擇同一門MOOC 課程的在線學(xué)習(xí)者可能有成千上萬(wàn)名;“在線”則是指在線學(xué)習(xí)者不是在同一間教室里進(jìn)行面對(duì)面的學(xué)習(xí)和協(xié)作交流,而是通過(guò)在線學(xué)習(xí)平臺(tái)進(jìn)行學(xué)習(xí)和協(xié)作交流。這兩個(gè)方面的區(qū)別導(dǎo)致在線學(xué)習(xí)者在地理位置、教育背景、性別、年齡等各個(gè)方面存在較大差異。為了使在線學(xué)習(xí)小組中小組成員之間能更充分地進(jìn)行協(xié)作交流,避免個(gè)別學(xué)習(xí)者因?yàn)槟挲g、教育背景和興趣愛(ài)好等差異太大而不能很好地融入小組進(jìn)行協(xié)作學(xué)習(xí)[9]。因此,本文將根據(jù)同質(zhì)分組策略[10]進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組。同質(zhì)分組是指將學(xué)習(xí)水平、學(xué)習(xí)目標(biāo)、興趣愛(ài)好等特征相似的學(xué)習(xí)者劃分到同一小組中,確保同一小組內(nèi)的在線學(xué)習(xí)者具有較高的同質(zhì)性[11],使小組成員之間能夠更好地進(jìn)行協(xié)作學(xué)習(xí)和討論交流,從而改善其在線學(xué)習(xí)體驗(yàn),降低學(xué)習(xí)孤獨(dú)感。

    1.2 在線學(xué)習(xí)者特征模型

    本文采用edX開(kāi)放數(shù)據(jù)集[12]作為研究基礎(chǔ),進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組研究。edX 開(kāi)放數(shù)據(jù)集是哈佛大學(xué)和麻省理工學(xué)院于2014 年5 月聯(lián)合發(fā)布的2012—2013 學(xué)年edX 平臺(tái)上16 門課程的開(kāi)放數(shù)據(jù)[13]。該數(shù)據(jù)集共有641 139 條在線學(xué)習(xí)者的信息,每條信息包含課程ID、學(xué)習(xí)者ID、國(guó)家、出生年月、性別等19 個(gè)特征字段,如圖1所示。

    學(xué)習(xí)者的學(xué)習(xí)特征能夠反映學(xué)習(xí)者的個(gè)體差異[14],根據(jù)在線學(xué)習(xí)者特征進(jìn)行聚類是實(shí)現(xiàn)大規(guī)模在線協(xié)作學(xué)習(xí)分組的基礎(chǔ)。本文將從edX 開(kāi)放數(shù)據(jù)集的課程信息、學(xué)習(xí)者基本情況信息、學(xué)習(xí)者類型信息和學(xué)習(xí)者行為信息4 個(gè)方面,對(duì)原始的19 個(gè)特征字段進(jìn)行分析,從中篩選出與大規(guī)模在線協(xié)作學(xué)習(xí)分組最相關(guān)的特征,構(gòu)建在線學(xué)習(xí)者特征模型。

    (1)課程信息

    在線協(xié)作學(xué)習(xí)分組是針對(duì)選擇同一門MOOC課程的在線學(xué)習(xí)者進(jìn)行分組,因此edX開(kāi)放數(shù)據(jù)集中課程ID字段與在線協(xié)作學(xué)習(xí)分組不具有相關(guān)性,故排除課程ID字段。

    (2)學(xué)習(xí)者基本情況信息

    edX 開(kāi)放數(shù)據(jù)集中學(xué)習(xí)者的基本情況信息反映了學(xué)習(xí)者的文化背景、教育水平、性別和年齡等。與傳統(tǒng)課堂學(xué)習(xí)者不同,在線學(xué)習(xí)者分布在世界各地,學(xué)習(xí)者成分也更加多樣化,比如選擇同一門MOOC 課程的在線學(xué)習(xí)者可能是學(xué)生,可能是公司職員,也可能是退休老人。這意味著在線學(xué)習(xí)者擁有不同的文化背景、知識(shí)水平、年齡和興趣愛(ài)好等。如果同一小組內(nèi)在線學(xué)習(xí)者之間差異太大,必然會(huì)影響小組成員之間的協(xié)作交流,無(wú)法有效實(shí)施在線協(xié)作學(xué)習(xí)。相反,如果同一小組內(nèi)在線學(xué)習(xí)者之間有許多共同點(diǎn),那么小組成員之間就會(huì)有更多共同話題,有利于促進(jìn)小組成員之間的相互了解。因此,edX 開(kāi)放數(shù)據(jù)集中在線學(xué)習(xí)者的基本信息,對(duì)大規(guī)模在線協(xié)作學(xué)習(xí)分組而言非常重要。

    (3)學(xué)習(xí)者類型信息

    學(xué)習(xí)者類型信息可以反映在線學(xué)習(xí)者的課程參與程度,在進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組時(shí),應(yīng)充分考慮在線學(xué)習(xí)者的課程參與程度,以便分組完成后,課程開(kāi)發(fā)者有針對(duì)性的對(duì)在線學(xué)習(xí)小組進(jìn)行個(gè)性化的教學(xué)干預(yù)。edX 平臺(tái)上的在線學(xué)習(xí)者被劃分為4 種類型,分別是注冊(cè)者、一般學(xué)習(xí)者、積極學(xué)習(xí)者和獲取證書者[15],相應(yīng)的描述和課程參與程度如表1所示。從表1中可以看到,注冊(cè)者類型的在線學(xué)習(xí)者僅注冊(cè)課程,并沒(méi)有在平臺(tái)上產(chǎn)生任何學(xué)習(xí)行為數(shù)據(jù),因此,在進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組時(shí)不必考慮該字段。

    表1 edX在線學(xué)習(xí)者類型

    (4)學(xué)習(xí)者行為信息

    在線學(xué)習(xí)者從注冊(cè)、登錄平臺(tái)開(kāi)始,到點(diǎn)擊課程鏈接、觀看教學(xué)視頻、參與論壇互動(dòng)等一系列學(xué)習(xí)過(guò)程中,會(huì)產(chǎn)生海量的學(xué)習(xí)行為數(shù)據(jù)[16],包括課程交互次數(shù)、課程訪問(wèn)次數(shù)、視頻播放次數(shù)、學(xué)習(xí)章節(jié)數(shù)以及論壇發(fā)帖數(shù)等。其中,課程交互次數(shù)和課程訪問(wèn)次數(shù)在一定程度上反映了學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī)。具有不同學(xué)習(xí)動(dòng)機(jī)的在線學(xué)習(xí)者會(huì)有不同的學(xué)習(xí)需求,根據(jù)不同的學(xué)習(xí)需求對(duì)在線學(xué)習(xí)者進(jìn)行分組,可以幫助課程開(kāi)發(fā)者和運(yùn)營(yíng)者為在線學(xué)習(xí)者的個(gè)性化學(xué)習(xí)實(shí)施各類分層[17]。學(xué)習(xí)章節(jié)數(shù)和視頻播放次數(shù)反映了在線學(xué)習(xí)者的課程參與程度。論壇發(fā)帖數(shù)量在一定程度上反映了學(xué)習(xí)者的活躍程度?;钴S度越高,說(shuō)明其在學(xué)習(xí)中主動(dòng)思考和參與課程討論的積極性越高,越能帶動(dòng)小組內(nèi)其他在線學(xué)習(xí)者的學(xué)習(xí)積極性。

    綜上所述,本文從學(xué)習(xí)者基本情況信息、學(xué)習(xí)者類型信息和學(xué)習(xí)者行為信息三方面,共篩選出13 個(gè)在線學(xué)習(xí)者的特征字段構(gòu)成在線學(xué)習(xí)者特征模型,如圖2所示。

    圖2 在線學(xué)習(xí)者特征模型

    圖3 自編碼神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

    1.3 在線學(xué)習(xí)者特征提取

    大規(guī)模在線協(xié)作學(xué)習(xí)分組具有數(shù)據(jù)規(guī)模大、學(xué)習(xí)者特征維度高的特點(diǎn),直接對(duì)在線學(xué)習(xí)者進(jìn)行分組,分組效率很低。深度學(xué)習(xí)中自編碼神經(jīng)網(wǎng)絡(luò)(AutoEncoder,AE)具有非常好的數(shù)據(jù)降維和特征提取的能力[18]。在分組之前利用AE 提取在線學(xué)習(xí)者特征,不僅可以降低在線學(xué)習(xí)者特征維度,而且能夠?qū)W習(xí)在線學(xué)習(xí)者數(shù)據(jù)中豐富的內(nèi)在信息,更有助于進(jìn)行大規(guī)模的在線協(xié)作學(xué)習(xí)分組。

    AE由兩部分組成:用于提取特征的編碼器(encoder)和用于生成重構(gòu)的解碼器(decoder),兩者通過(guò)瓶頸層(bottleneck)連接[19],其基本結(jié)構(gòu)如圖3所示。從輸入層到隱藏層為編碼過(guò)程,用于提取原始輸入的關(guān)鍵特征得到編碼數(shù)據(jù),編碼數(shù)據(jù)能夠很好的保留原始數(shù)據(jù)信息。從隱藏層到輸出層為解碼過(guò)程,利用編碼數(shù)據(jù)對(duì)原始輸入進(jìn)行重構(gòu),恢復(fù)原始輸入數(shù)據(jù)。

    利用AE提取在線學(xué)習(xí)者關(guān)鍵特征的具體過(guò)程如下:

    (1)編碼過(guò)程。將原始在線學(xué)習(xí)者數(shù)據(jù)進(jìn)行歸一化操作后作為AE 的輸入,經(jīng)過(guò)權(quán)重和偏置的線性計(jì)算傳入隱藏層,隱藏層的非線性激活函數(shù)為sigmoid函數(shù),通過(guò)sigmoid函數(shù)再進(jìn)行非線性變換,如公式(1)所示。各隱藏層之間同樣先通過(guò)權(quán)重和偏置的線性計(jì)算,再經(jīng)過(guò)sigmoid 函數(shù)進(jìn)行非線性變化,然后從上一層傳入下一層。AE利用瓶頸層對(duì)輸入的原始在線學(xué)習(xí)者數(shù)據(jù)進(jìn)行壓縮編碼,將高維的原始數(shù)據(jù)用低維的向量表示,使壓縮后的低維向量能夠保留在線學(xué)習(xí)者數(shù)據(jù)中的關(guān)鍵特征,從而有利于大規(guī)模在線協(xié)作學(xué)習(xí)分組。

    式中,x表示原始輸入數(shù)據(jù),W1表示連接輸入層和隱藏層的權(quán)重,b是偏置,σ表示sigmoid 激活函數(shù),其公式如(2)所示。

    (2)解碼過(guò)程。將提取到的在線學(xué)習(xí)者特征h作為解碼器中第一個(gè)隱藏層的輸入,經(jīng)過(guò)權(quán)重和偏置的線性計(jì)算傳入下一個(gè)隱藏層,隱藏層的非線性激活函數(shù)同樣是sigmoid 函數(shù),通過(guò)sigmoid 函數(shù)進(jìn)行非線性變換,如公式(3)所示,直到得到在線學(xué)習(xí)者的重構(gòu)數(shù)據(jù)。

    式中,h是提取到的新的在線學(xué)習(xí)者特征,W2是連接隱藏層和輸出層的權(quán)重,y是重構(gòu)的在線學(xué)習(xí)者數(shù)據(jù)。

    (3)計(jì)算損失函數(shù)loss。將輸出層的重構(gòu)數(shù)據(jù)與輸入數(shù)據(jù)進(jìn)行比較,計(jì)算損失函數(shù)loss,用來(lái)評(píng)估模型的重構(gòu)數(shù)據(jù)與原始輸入數(shù)據(jù)的誤差程度。該模型使用均方誤差(Mean Square Error,MSE)作為loss,計(jì)算公式如(4)所示。使用Adam 優(yōu)化算法進(jìn)行梯度下降,降低loss直至收斂。

    其中,N是訓(xùn)練樣本的個(gè)數(shù)。

    (4)保存訓(xùn)練好的AE 模型。在后續(xù)實(shí)驗(yàn)過(guò)程中可調(diào)用已訓(xùn)練好的AE 模型用于提取在線學(xué)習(xí)者的關(guān)鍵特征。

    (5)AE模型瓶頸層輸出的編碼數(shù)據(jù),即在線學(xué)習(xí)者的關(guān)鍵特征,將作為后續(xù)大規(guī)模在線協(xié)作學(xué)習(xí)分組的輸入數(shù)據(jù)。

    1.4 大規(guī)模在線學(xué)習(xí)者分組

    為了對(duì)大規(guī)模在線學(xué)習(xí)者進(jìn)行分組,本文采用模糊C 均值(Fuzzy C-Means,F(xiàn)CM)算法以迭代分組的形式進(jìn)行在線協(xié)作學(xué)習(xí)分組。

    FCM 算法是最常用的模糊聚類算法之一,在運(yùn)行時(shí)間和準(zhǔn)確度方面相對(duì)優(yōu)于其他聚類算法[20],在數(shù)據(jù)挖掘和人工智能等領(lǐng)域中被廣泛應(yīng)用[21]。利用FCM算法進(jìn)行協(xié)作學(xué)習(xí)分組的主要思想是:n位學(xué)習(xí)者構(gòu)成學(xué)習(xí)者數(shù)據(jù)集X={x1,x2,…,xn} ,利用FCM算法將學(xué)習(xí)者分成c組,通過(guò)不斷迭代更新聚類中心Vi和隸屬度矩陣uij來(lái)優(yōu)化目標(biāo)函數(shù),目標(biāo)函數(shù)如公式(5)所示,使其達(dá)到極小值,此時(shí)學(xué)習(xí)者將被劃分給隸屬度最大的那個(gè)分組,從而實(shí)現(xiàn)學(xué)習(xí)者的最優(yōu)劃分。其中,聚類中心vi和隸屬度矩陣uij可以通過(guò)拉格朗日條件極值求解,公式如(6)和(7)所示。

    式中,U 為隸屬度矩陣,V 為聚類中心。i為小組個(gè)數(shù);j為學(xué)習(xí)者個(gè)數(shù);m為模糊加權(quán)指數(shù),通常情況下m=2;xj表示第j個(gè)學(xué)習(xí)者;vi表示第i組的類中心;uij表示第j個(gè)學(xué)習(xí)者屬于第i組的隸屬度,它需要滿足公式(8)。

    由于FCM算法的最佳分組結(jié)果通常取決于分組個(gè)數(shù)c[22],對(duì)于大規(guī)模在線協(xié)作學(xué)習(xí)分組而言,如果得到的最佳分組個(gè)數(shù)c特別小,那么分組后每個(gè)小組中在線學(xué)習(xí)人數(shù)依然很多,而小組內(nèi)在線學(xué)習(xí)者人數(shù)過(guò)多會(huì)直接影響小組成員之間的交流討論,從而不能達(dá)到改善在線學(xué)習(xí)體驗(yàn),降低學(xué)習(xí)孤獨(dú)感的目的,也就失去了大規(guī)模在線協(xié)作學(xué)習(xí)分組的意義。因此,為了控制在線協(xié)作學(xué)習(xí)小組中學(xué)習(xí)者人數(shù),達(dá)到降低學(xué)習(xí)孤獨(dú)感的目的,本文采用迭代分組的方法進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組,將小組成員控制在2~9 人之間,從而確保在線學(xué)習(xí)者在學(xué)習(xí)過(guò)程中能夠進(jìn)行有效的協(xié)作學(xué)習(xí)和交流討論,最終順利完成對(duì)課程的學(xué)習(xí)。大規(guī)模在線協(xié)作學(xué)習(xí)迭代分組方法的具體步驟如下。

    (1)確定分組個(gè)數(shù)c的范圍。

    通常分組個(gè)數(shù)c的取值范圍為[ ]2, n[23],n為在線學(xué)習(xí)者總?cè)藬?shù)。但是對(duì)于大規(guī)模在線協(xié)作學(xué)習(xí)分組而言,由于在線學(xué)習(xí)者的數(shù)量眾多,若采用該方法確定最優(yōu)分組個(gè)數(shù),將花費(fèi)大量時(shí)間。羅凌等人[9]認(rèn)為lnn隨n的增長(zhǎng)速度比n的增長(zhǎng)速度慢,所以當(dāng)數(shù)據(jù)集規(guī)模特別大時(shí),可將c的取值范圍定為[2,2 lnn] 。

    (2)利用FCM算法進(jìn)行分組,計(jì)算聚類有效性函數(shù)值,進(jìn)一步確定最佳分組個(gè)數(shù)c。

    為了進(jìn)一步確定最佳分組個(gè)數(shù)c的值,往往需要聚類有效性函數(shù)進(jìn)行判斷。本文通過(guò)Xie-Beni 聚類有效性指標(biāo)(XB)[24]確定大規(guī)模在線協(xié)作學(xué)習(xí)分組的最優(yōu)分組個(gè)數(shù),公式如(9)所示。依次計(jì)算c為2 至2 lnn時(shí)XB值,當(dāng)XB取得最小值時(shí)對(duì)應(yīng)的c,即為最佳分組個(gè)數(shù)。

    (3)確定最佳分組個(gè)數(shù)c后,利用FCM算法進(jìn)行在線協(xié)作學(xué)習(xí)分組。

    (4)分組完成后,判斷每個(gè)小組中在線學(xué)習(xí)者人數(shù)。

    (5)如果小組中的學(xué)習(xí)者人數(shù)在2~9 之間,那么分組成功,計(jì)算該組的組內(nèi)相似度。

    組內(nèi)相似度是指同一小組內(nèi)在線學(xué)習(xí)者兩兩之間的特征相似程度,反映了同一小組內(nèi)在線學(xué)習(xí)者的同質(zhì)性。本文采用余弦相似度公式計(jì)算在線學(xué)習(xí)者之間的特征相似度,公式如(10)所示,并將同一小組內(nèi)在線學(xué)習(xí)者兩兩之間的余弦相似度的平均值作為該組的組內(nèi)相似度。根據(jù)余弦相似度原理可知,兩個(gè)向量夾角的余弦值可以作為衡量?jī)蓚€(gè)個(gè)體間差異大小的度量,其中余弦值越接近1,說(shuō)明夾角角度越接近0°,兩個(gè)向量越相似。也就是說(shuō),組內(nèi)相似度的值越接近1,說(shuō)明在線學(xué)習(xí)者之間的特征越相似,同一小組內(nèi)在線學(xué)習(xí)者的同質(zhì)性越高,越有利于小組成員之間的相互了解和交流討論,說(shuō)明分組效果越好。因此,組內(nèi)相似度將作為衡量本文大規(guī)模在線協(xié)作學(xué)習(xí)分組方法的評(píng)價(jià)指標(biāo)。

    其中,表示c組第l個(gè)在線學(xué)習(xí)者x 的特征向量中第t個(gè)特征值。

    (6)如果小組中的學(xué)習(xí)者人數(shù)多于9 人,那么對(duì)該小組重新進(jìn)行分組,即重復(fù)步驟(1)~(5)。

    如此循環(huán),直到所有的在線學(xué)習(xí)者分組結(jié)束。迭代分組流程圖如圖4所示。其中表示第i個(gè)小組C中有pi個(gè)在線學(xué)習(xí)者。

    圖4 FCM迭代分組流程圖

    2 實(shí)驗(yàn)及結(jié)果分析

    2.1 模型訓(xùn)練

    本文以edX數(shù)據(jù)集中15門課程的621 293條記錄作為原始實(shí)驗(yàn)數(shù)據(jù),過(guò)濾掉其中存在前后矛盾的數(shù)據(jù)和異常數(shù)據(jù),填充缺失值并進(jìn)行歸一化操作后得到540 977條學(xué)習(xí)記錄。將其按照3∶1∶1 的比例劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集,其中訓(xùn)練集用于AE 模型的訓(xùn)練,樣本數(shù)量為324 585;驗(yàn)證集和測(cè)試集的樣本數(shù)量均為108 196。經(jīng)過(guò)3 000次迭代后,訓(xùn)練集和驗(yàn)證集loss同步收斂,其中訓(xùn)練集loss 為0.032 1,驗(yàn)證集loss 為0.038 7。模型訓(xùn)練結(jié)束,保存訓(xùn)練好的AE模型,用于提取在線學(xué)習(xí)者的關(guān)鍵特征。

    2.2 大規(guī)模在線協(xié)作學(xué)習(xí)分組方法有效性

    為了驗(yàn)證本文提出的結(jié)合AE 和FCM 算法的大規(guī)模在線協(xié)作學(xué)習(xí)分組方法分組效率更高,更適合進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組。本文與傳統(tǒng)的基于FCM的協(xié)作學(xué)習(xí)分組方法進(jìn)行對(duì)比。

    為保證數(shù)據(jù)樣本的平衡性,本文從測(cè)試集數(shù)據(jù)中選出48 078位在線學(xué)習(xí)者作為對(duì)比實(shí)驗(yàn)的實(shí)驗(yàn)數(shù)據(jù),以學(xué)習(xí)成績(jī)?yōu)闃?biāo)簽,分別利用上述兩種方法將在線學(xué)習(xí)者分成3組:成績(jī)?yōu)?的在線學(xué)習(xí)者為第一組;成績(jī)?cè)冢?,50]之間的在線學(xué)習(xí)者為第二組,成績(jī)?cè)冢?0,100]之間的在線學(xué)習(xí)者為第三組。以準(zhǔn)確率和運(yùn)行時(shí)間作為評(píng)價(jià)指標(biāo),準(zhǔn)確率計(jì)算公式如(11)所示,m是分類正確數(shù),n是樣本總個(gè)數(shù)。實(shí)驗(yàn)重復(fù)運(yùn)行5次后取平均值,結(jié)果如表2所示。

    表2 兩種分組方法的實(shí)驗(yàn)結(jié)果

    從表2中可以看到,相對(duì)于傳統(tǒng)的基于FCM的協(xié)作學(xué)習(xí)分組方法,本文利用AE提取學(xué)習(xí)者的關(guān)鍵特征后,利用FCM 算法對(duì)在線協(xié)作學(xué)習(xí)者進(jìn)行分組的方法,不僅降低了運(yùn)行時(shí)間,而且明顯提高了分組準(zhǔn)確率。這是因?yàn)樵诰€學(xué)習(xí)者的規(guī)模大,特征維度高,直接利用FCM算法進(jìn)行協(xié)作學(xué)習(xí)分組,計(jì)算復(fù)雜度高,時(shí)間開(kāi)銷大。而AE 能夠提取學(xué)習(xí)者的關(guān)鍵特征,降低在線學(xué)習(xí)者的特征維度,從而能夠降低計(jì)算復(fù)雜度,提高分組效率;同時(shí)提取到的關(guān)鍵特征對(duì)在線學(xué)習(xí)者有更本質(zhì)的刻畫,可以提高分組準(zhǔn)確率。因此,與傳統(tǒng)的僅利用FCM 算法進(jìn)行協(xié)作學(xué)習(xí)分組的方法相比,本文提出的方法更適合進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組。

    2.3 大規(guī)模在線協(xié)作學(xué)習(xí)分組應(yīng)用

    本文以edX 開(kāi)放數(shù)據(jù)集中選擇計(jì)算機(jī)科學(xué)與編程入門課程的19 846位在線學(xué)習(xí)者為實(shí)驗(yàn)對(duì)象,進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組。

    首先將經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的19 846 位在線學(xué)習(xí)者輸入已訓(xùn)練好的AE 模型,利用AE 模型提取在線學(xué)習(xí)者的關(guān)鍵特征,作為后續(xù)FCM算法的輸入數(shù)據(jù);根據(jù)在線學(xué)習(xí)者人數(shù)19 846,可以確定最佳分組個(gè)數(shù)c的范圍是[2,20];根據(jù)公式(9)依次計(jì)算c=2 至c=20 時(shí)的XB值,結(jié)果如圖5所示。從圖5中可以看到,當(dāng)c=3 時(shí),XB值最小,因此將在線學(xué)習(xí)者分成3 組,其中第一組有6 453人,第二組有3 840人,第三組有9 553人;很明顯3個(gè)小組的組內(nèi)學(xué)習(xí)者人數(shù)均大于9人,不滿足分組約束條件(2~9 人)。因此,分別對(duì)這3 個(gè)在線學(xué)習(xí)小組再次進(jìn)行分組。不斷重復(fù)上述步驟,直到組內(nèi)學(xué)習(xí)者人數(shù)滿足分組約束條件為止。對(duì)于滿足分組約束條件的在線協(xié)作學(xué)習(xí)小組,計(jì)算其組內(nèi)相似度。

    經(jīng)過(guò)不斷迭代分組,最終本文將19 846 名在線學(xué)習(xí)者分為2 835組,每組2到9人。如圖6所示是截取了部分在線學(xué)習(xí)小組的組內(nèi)相似度。本文把所有小組的組內(nèi)相似度相加取均值,計(jì)算平均組內(nèi)相似度,結(jié)果為0.846 3,該結(jié)果說(shuō)明本文提出的大規(guī)模在線協(xié)作學(xué)習(xí)分組方法的分組效果較好,即基于該分組方法得到的每一個(gè)小組內(nèi)的在線學(xué)習(xí)者都具有較高的同質(zhì)性,同一小組內(nèi)在線學(xué)習(xí)者的學(xué)習(xí)水平、興趣愛(ài)好等特征相似度較高。因此,小組成員之間能夠更充分地進(jìn)行討論、交流,達(dá)到改善在線學(xué)習(xí)體驗(yàn),降低學(xué)習(xí)孤獨(dú)感的目的。

    圖5 的XB值

    3 結(jié)束語(yǔ)

    本文主要完成了以下工作:(1)以edX 開(kāi)放數(shù)據(jù)集為研究基礎(chǔ),構(gòu)建在線學(xué)習(xí)者特征模型,利用AE提取在線學(xué)習(xí)者的關(guān)鍵特征;然后根據(jù)同質(zhì)分組原則,利用FCM算法以迭代分組的形式進(jìn)行大規(guī)模在線協(xié)作學(xué)習(xí)分組。(2)在edX在線學(xué)習(xí)平臺(tái)上,以計(jì)算機(jī)科學(xué)與編程入門課程為例,實(shí)現(xiàn)了大規(guī)模在線協(xié)作學(xué)習(xí)分組。實(shí)驗(yàn)結(jié)果表明,基于本文提出的大規(guī)模在線協(xié)作學(xué)習(xí)分組方法進(jìn)行分組后,每個(gè)在線協(xié)作學(xué)習(xí)小組都有較高的同質(zhì)性,可以有效改善學(xué)習(xí)者的在線學(xué)習(xí)體驗(yàn),降低學(xué)習(xí)過(guò)程中的孤獨(dú)感,達(dá)到保留在線學(xué)習(xí)者,提高M(jìn)OOC課程完成率的目的。

    圖6 部分在線協(xié)作學(xué)習(xí)小組的組內(nèi)相似度

    猜你喜歡
    組內(nèi)協(xié)作分組
    用心說(shuō)題 提高效率 培養(yǎng)能力
    團(tuán)結(jié)協(xié)作成功易
    分組搭配
    怎么分組
    協(xié)作
    讀者(2017年14期)2017-06-27 12:27:06
    分組
    協(xié)作
    讀寫算(下)(2016年9期)2016-02-27 08:46:31
    合作學(xué)習(xí)組內(nèi)交流討論時(shí)間的遵循原則
    合作學(xué)習(xí)“組內(nèi)交流討論時(shí)間”注意問(wèn)題
    可與您并肩協(xié)作的UR3
    古蔺县| 墨竹工卡县| 旬邑县| 虞城县| 宁阳县| 凤翔县| 托克逊县| 类乌齐县| 娱乐| 西充县| 高陵县| 信宜市| 阳东县| 县级市| 枣强县| 乌海市| 庐江县| 泽普县| 延安市| 清河县| 晋州市| 西和县| 泾阳县| 图们市| 博野县| 普兰县| 渑池县| 海城市| 陈巴尔虎旗| 台东市| 广宗县| 永丰县| 白河县| 武穴市| 土默特左旗| 南投县| 武陟县| 吴江市| 夏河县| 集安市| 清丰县|