• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于決策樹的慕課退課預(yù)測研究

      2021-07-15 02:28:56林佳慧周寶建廈門大學(xué)嘉庚學(xué)院管理學(xué)院
      現(xiàn)代經(jīng)濟信息 2021年17期
      關(guān)鍵詞:決策樹正確率神經(jīng)網(wǎng)絡(luò)

      林佳慧 周寶建 廈門大學(xué)嘉庚學(xué)院管理學(xué)院

      引言

      慕課即大型開放式網(wǎng)絡(luò)課程,是目前最熱門的線上學(xué)習(xí)方式之一。目前全球范圍內(nèi)的MOOC用戶已經(jīng)超過1億,全球有超過900所大學(xué)提供約有11 400個慕課課程。2020年是特許的一年,一場新冠疫情的來臨,讓所有人的生活都發(fā)生了巨大的變化,為了在這一特殊時期也可以順利完成教學(xué)任務(wù),開啟了線上代替線下的教學(xué)模式,不少同學(xué)都開啟了“宅”在家中、網(wǎng)絡(luò)上課的模式,一時間在線教育用戶得到了快速增長。

      伴隨國內(nèi)疫情的逐漸好轉(zhuǎn),國外的疫情狀況得到了強有力的控制,多地已有序組織開學(xué)復(fù)課。疫情之后,紅極一時的網(wǎng)上在線教育平臺,應(yīng)該怎樣定位自己呢?

      中國互聯(lián)網(wǎng)絡(luò)信息中心于2020年4月發(fā)布了《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》(第45次),報告統(tǒng)計,截至2020年3月,我國已注冊在線教育用戶數(shù)量已達4.23億,與2019年相比,用戶量增長了2.22億,在全部網(wǎng)民總量中占比46.8%。

      MOOC (Massive Open Online Courses),本文將稱之為慕課,是教學(xué)模式借助互聯(lián)網(wǎng)發(fā)展的一種新型教學(xué)模式,具有課程免費、內(nèi)容豐富、學(xué)習(xí)自由等特點。在過去的六年里,MOOC平臺不斷涌現(xiàn),國內(nèi)外著名高校紛紛在慕課在線學(xué)習(xí)平臺開設(shè)精品課程,越來越多的學(xué)生群體通過慕課在線平臺學(xué)習(xí)。[1]

      在文獻調(diào)查前期,通過對慕課研究相關(guān)文獻調(diào)查分析發(fā)現(xiàn),現(xiàn)今對于慕課在線學(xué)習(xí)平臺的相關(guān)國內(nèi)外研究概括起來大概為三個方面:首先,在分析用戶學(xué)習(xí)行為發(fā)現(xiàn)規(guī)律的基礎(chǔ)上,優(yōu)化慕課在線學(xué)習(xí)平臺的教學(xué)活動;[2]其次,采用數(shù)理統(tǒng)計方法分析學(xué)習(xí)行為繼而對慕課在線學(xué)習(xí)平臺現(xiàn)有措施提出意見建議;[3]三是通過建立模型尋找學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系并對學(xué)習(xí)效果進行預(yù)測。但目前針對學(xué)習(xí)行為的退課預(yù)測研究較少,慕課較高的退課率嚴(yán)重影響了其作為在線學(xué)習(xí)平臺的持續(xù)發(fā)展,本文利用神經(jīng)網(wǎng)絡(luò)、C5.0決策樹、二元Logistic回歸模型對學(xué)員的退課進行預(yù)測,助力慕課在線平臺的可持續(xù)發(fā)展。

      一、數(shù)據(jù)來源與處理

      本文的數(shù)據(jù)來源主要是“學(xué)堂在線”的MOOC平臺的2017年5月1日到2018年7月1日的大部分學(xué)習(xí)用戶的選課記錄和學(xué)習(xí)行為記錄。其中包括完成課后作業(yè)、觀看課程視頻、參與課程論壇討論、訪問課程內(nèi)容和訪問課程其它部分內(nèi)容。

      針對數(shù)據(jù)集當(dāng)中出現(xiàn)的若干問題,進行噪音處理。查找不規(guī)則的數(shù)值,例如空白、極端異常數(shù)值。對空白的數(shù)據(jù)進行插補處理,對極端異常數(shù)值,采取刪除處理。

      二、數(shù)據(jù)描述

      為了更加直觀地了解已經(jīng)獲取的數(shù)據(jù),首先將數(shù)據(jù)區(qū)分為退課者和未退課者兩種類型,并分別觀察他們的各種學(xué)習(xí)行為的平均次數(shù),這五種學(xué)習(xí)行為分別是:完成課后作業(yè)(problem)、觀看課程視頻(video)、訪問課程內(nèi)容(wiki)、參與課程論壇討論(discussion)和訪問課程其他部分(navigation)完成課后作業(yè)。由表1可知,這五種學(xué)習(xí)行為都是未退課者比退課者的次數(shù)更多,說明學(xué)習(xí)行為與用戶是否選擇退課之間具有關(guān)聯(lián)性,利用這五個因素來進行MOOC的退課預(yù)測是可行的。

      表1 2017—2018年MOOC用戶學(xué)習(xí)行為退課與未退課者平均次數(shù)比較

      三、因子分析

      對用戶使用慕課學(xué)習(xí)行為的五個維度數(shù)據(jù)進行置信效度分析和因子分析,并對相關(guān)數(shù)據(jù)進行精簡和降維。

      計算得到KMO值為0.946,Bartlett值為2445.352,自由度為45,P值為0.000,說明問卷總體效度居于較高且可接受范圍內(nèi),也就是說數(shù)據(jù)適合做因子分析。同時,根據(jù)總方差解釋圖,當(dāng)取到三個因子的時候,累計方差已經(jīng)達到85.727%>85%,可以認為該解釋程度已經(jīng)達到所需的標(biāo)準(zhǔn),參見表2。

      表2 KMO和巴特利特檢驗

      綜上所述,將五項測量指標(biāo)轉(zhuǎn)化為得分均值,以因子載荷為權(quán)重,選擇“最大方差法”,縮減成三個因子影響程度指數(shù),得到以下成分矩陣:

      表3 旋轉(zhuǎn)后的因子成分矩陣

      四、慕課退課行為預(yù)測研究

      為了探究利用慕課學(xué)習(xí)因素的重要程度,在了解用戶日后是否繼續(xù)上課的基礎(chǔ)上,對其進行分析??紤]到用戶是否愿意繼續(xù)上課是一個定性二分變量,如果直接套用回歸方程模型,則可能出現(xiàn)許多不嚴(yán)謹(jǐn)?shù)慕Y(jié)論。通過線性回歸分析,可以使得對P值的回歸預(yù)測具有實際意義。為確保模型的準(zhǔn)確率,使用神經(jīng)網(wǎng)絡(luò)、C5.0決策樹、二元Logistic回歸三個模型對預(yù)測正確率進行比較,從而挑選出預(yù)測率最高的模型,對其因素的重要程度進行分析。利用SPSSModeler軟件進行分析,分析方法如下圖所示。

      圖1 模型比較方法

      (一)神經(jīng)網(wǎng)絡(luò)法

      BP神經(jīng)網(wǎng)絡(luò)模型主要由三層組成,分別是輸入層、隱藏層及輸出層。隨著網(wǎng)絡(luò)層次的增加,會降低誤差,加強網(wǎng)絡(luò)的表現(xiàn)力,但網(wǎng)絡(luò)結(jié)構(gòu)的龐大也會增加訓(xùn)練的時長。一般情況下,三個層級的神經(jīng)網(wǎng)絡(luò)模型能夠獲得較好的結(jié)果。

      對于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及測試同樣將進行因子分析篩選以后得到的因子作為分析的樣本。其中選取80%的數(shù)據(jù)部分作為訓(xùn)練基,用來訓(xùn)練模型。另外的20%則作為檢測基用來對該模型的樣本進行檢測。

      最后得出各因子的重要程度如表4所示,可以看到,在神經(jīng)網(wǎng)絡(luò)模型中,信息因子相較于其他兩個因子的重要程度較高,達到了0.3667。

      表4 神經(jīng)網(wǎng)絡(luò)模型各變量重要度

      (二)C5.0決策樹

      C5.0決策樹是一種經(jīng)典的預(yù)測模型,是決策樹模型中的經(jīng)典算法。它是一種映射關(guān)系主要針對于對象屬性和對象值,決策樹的分支代表著對象并且是符合節(jié)點條件的,而葉子節(jié)點則代表則代表對象所屬的一些預(yù)測結(jié)果,模型的建立需要特征選擇、決策樹的生成和修剪三個步驟。[5]

      C5.0算法對C4.5算法的進一步完善,在大數(shù)據(jù)相關(guān)問題處理中C5.0更為合適,而且它能增加強大的Boosting算法提升分類精度。[6]

      圖2 決策樹模型結(jié)果

      在C5.0決策樹模型中,信息因子仍然是重要性最高的變量,達到了0.39。

      (三)二元線性回歸分析

      對于Logistic回歸分析,要關(guān)注回歸系數(shù)。一般來說,50%—80%的決定系數(shù)為相當(dāng)高的回歸決定系數(shù)。[4]模型中的回歸系數(shù)達到了47.2%與64.6%,因而可認為該模型的預(yù)測效果較好。

      表5 回歸系數(shù)

      表6為各個變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤差、Wald卡方、自由度和P值與OR值。一般來說,P值小于0.05可以認為對因變量有影響。可以看到,三個因子的顯著性均為0.000,遠小于0.05,說明三個因子對因變量均有顯著影響。同時根據(jù)B與Exp(B)的數(shù)值來看,信息因子相較于其他兩個因子來看更為重要一些。其回歸方程為:

      表6 二元Logistic模型各變量重要度

      Logit(P)=0.538+2.125x1+2.086x2+2.041x3

      (四)三個模型對比

      如表7所示,神經(jīng)網(wǎng)絡(luò)模型(即$N)的預(yù)測正確率為83.37%,C5.0決策樹模型(即$C)的預(yù)測正確率為86.63%,二元Logistic回歸(即$L)的模型正確率為86.14%。由此可以看到,C5.0決策樹模型的預(yù)測效果相對來說最好。

      表7 各模型預(yù)測正確率比較

      由于三個模型間的差異性較小,因此依舊分別對三個變量進行分析。

      總的來說,通過三個模型的分析與對比可以發(fā)現(xiàn),信息因子相比于其他兩個因子,對是否繼續(xù)選課影響更大。

      五、建議

      通過研究用戶使用慕課學(xué)習(xí)時的五種學(xué)習(xí)行為,利用因子分析將其降維成信息因子,功能因子和社交因子。根據(jù)這個結(jié)果,采用預(yù)測模型進行預(yù)測,結(jié)果顯示信息因子對慕課用戶是否退課影響最大。

      經(jīng)過模型數(shù)據(jù)分析發(fā)現(xiàn),三個因子重,信息因子對于慕課在線學(xué)習(xí)平臺用戶的退課行為影響是最大的,從降低慕課在線學(xué)習(xí)平臺用戶退課行為的角度來看,應(yīng)該重點關(guān)注觀看課程視頻和完成課后作業(yè)這兩種行為。可以發(fā)現(xiàn),若想完整的完成一門課程的學(xué)習(xí),不僅要觀看課程視頻,還需要完成課后作業(yè),及相關(guān)參考科目的學(xué)習(xí)。為了有效降低課程的退課率,有效完成課程學(xué)習(xí),慕課在線學(xué)習(xí)平臺可以針對這對這兩種學(xué)習(xí)行為重點展開措施,例如針對一些學(xué)員要開展教學(xué)干預(yù),如學(xué)生觀看課程視頻次數(shù)少,完成作業(yè)次數(shù)不達標(biāo)等都可以成為干預(yù)對象。[7]

      當(dāng)教師設(shè)置MOOC課程時,應(yīng)著重考慮視頻的設(shè)置、組織,以及作業(yè)集布置、評分等環(huán)節(jié)。

      針對于高校與慕課在線平臺合作課程的狀況,則可以適當(dāng)建設(shè)相關(guān)制度規(guī)范進行干預(yù),例如建立相關(guān)學(xué)生管理誠信檔案,對于有過于頻繁以及惡意退課的同學(xué)進行警告處理。

      修改慕課在線學(xué)習(xí)平臺的評價體系,提高觀看課程時評以及完成課后作業(yè)行為次數(shù)對于最終評價的影響程度,激勵更多同學(xué)提高積極學(xué)習(xí)行為,降低退課頻率。

      六、結(jié)語

      對慕課用戶的五種學(xué)習(xí)行為進行因子分析,降維得到信息因子、功能因子和社交因子三個公共因子。在此基礎(chǔ)上,通過利用神經(jīng)網(wǎng)絡(luò)算法、C5.0決策樹、二元線性回歸模型進行模型的建立以及預(yù)測研究,得到信息因子對慕課退課行為影響最大。因此,如何提高學(xué)生觀看課程視頻和完成課后作業(yè)的次數(shù),成為慕課改進措施的重要切入點?!?/p>

      猜你喜歡
      決策樹正確率神經(jīng)網(wǎng)絡(luò)
      門診分診服務(wù)態(tài)度與正確率對護患關(guān)系的影響
      神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      生意
      品管圈活動在提高介入手術(shù)安全核查正確率中的應(yīng)用
      天津護理(2016年3期)2016-12-01 05:40:01
      生意
      故事會(2016年15期)2016-08-23 13:48:41
      基于決策樹的出租車乘客出行目的識別
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
      重型機械(2016年1期)2016-03-01 03:42:04
      復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
      茌平县| 收藏| 望奎县| 石棉县| 平武县| 康平县| 佛冈县| 龙海市| 库尔勒市| 离岛区| 沙洋县| 南涧| 临安市| 井研县| 顺义区| 寻乌县| 会理县| 灵丘县| 雷州市| 清镇市| 岐山县| 滦南县| 和林格尔县| 东明县| 凌云县| 永昌县| 澜沧| 天镇县| 丹寨县| 乌什县| 都兰县| 新宾| 思茅市| 都江堰市| 报价| 和田县| 会宁县| 渭源县| 永善县| 宜丰县| 额尔古纳市|