郝秦霞
(西安科技大學(xué)通信與信息工程學(xué)院,西安 710054)
(*通信作者電子郵箱haoqinxia@126.com)
“六卓越一拔尖”計(jì)劃2.0 的正式啟動標(biāo)志著中國高等教育改革發(fā)展逐步走向成熟[1],中國高校積極探索“互聯(lián)網(wǎng)+教育”“智能+教育+新形態(tài)”[2],構(gòu)建多目標(biāo)靈活的高等教育體系和評價(jià)體系[3],實(shí)現(xiàn)人才培養(yǎng)從同質(zhì)化向多樣化。
在智能教育新形態(tài)[4]的背景下通過分析歷史行為數(shù)據(jù),預(yù)測、推薦式的網(wǎng)絡(luò)教學(xué)平臺成為“互聯(lián)網(wǎng)+教育”模式[5]主流,而教學(xué)推薦系統(tǒng)算法主要是基于內(nèi)容的推薦和基于協(xié)同過濾的推薦,如姚敦紅等[6]介紹了三維有偏權(quán)值張量分解在授課推薦上的應(yīng)用,何杰光等[7]介紹了一種矩形鄰域結(jié)構(gòu)的教學(xué)優(yōu)化教研模式,Hou等[8]介紹了基于動態(tài)自適應(yīng)教與學(xué)優(yōu)化算法的WebGIS 課程教學(xué)評價(jià),管皓等[9]介紹了動態(tài)數(shù)學(xué)數(shù)字資源開放平臺的設(shè)計(jì)與實(shí)現(xiàn)。各種推薦式的創(chuàng)新教學(xué)模式在不同程度上存在以下問題:
1)網(wǎng)絡(luò)教學(xué)平臺提供的網(wǎng)絡(luò)課程教學(xué)覆蓋的范圍龐大,缺乏學(xué)科統(tǒng)籌設(shè)計(jì),多形態(tài)的教研方式中學(xué)生對課程的選擇沒有合理的推薦方式,課程難以構(gòu)成體系。
2)微課、慕課、混合教學(xué)等遠(yuǎn)程協(xié)同教學(xué)是以單數(shù)據(jù)為驅(qū)動的教研方式,是對教研活動中組織形式與技術(shù)手段的融合研究,未針對學(xué)生個(gè)體的特征、意愿建立適合面向?qū)W生的知識學(xué)習(xí)渠道。
3)未以“學(xué)生-老師-課程-評價(jià)”多元關(guān)系建立多目標(biāo)效果評估,多目標(biāo)數(shù)據(jù)未能體現(xiàn)出全局最優(yōu)解,學(xué)生難以根據(jù)自身實(shí)際情況精準(zhǔn)引導(dǎo)式地進(jìn)行課程選擇。
4)目標(biāo)優(yōu)化的方法在有限計(jì)算資源條件下,雖解集能獲得較好的收斂性和分布性,但在實(shí)際工程領(lǐng)域中難以滿足多目標(biāo)優(yōu)化問題求解需求,求解精準(zhǔn)度需進(jìn)一步提高,最終實(shí)現(xiàn)精準(zhǔn)課程推薦。
為了解決以上問題,本文以學(xué)科分類為背景,提出基于R2 指標(biāo)的高維多目標(biāo)差分進(jìn)化算法R2-MODE(R2 based Multi-Objective Differential Evolution),提高算法在高維復(fù)雜空間中的搜索能力;對各類多目標(biāo)數(shù)據(jù)給出明確定義,并提出對課程教師推薦、專業(yè)相關(guān)度、課程難度系數(shù)、課程綜合評價(jià)這4 項(xiàng)控制指標(biāo)進(jìn)行優(yōu)化,建立高維多目標(biāo)優(yōu)化模型。最后利用課程屬性數(shù)據(jù)集進(jìn)行課程引導(dǎo)推薦實(shí)驗(yàn),與主流推薦算法進(jìn)行對比來驗(yàn)證本文方法在課程引導(dǎo)推薦上的準(zhǔn)確性。
本文的主要工作:
1)在“互聯(lián)網(wǎng)+”的大背景下,針對網(wǎng)絡(luò)教學(xué)平臺研究了引導(dǎo)式課程推薦在多目標(biāo)數(shù)據(jù)時(shí)選課決策問題,實(shí)現(xiàn)精準(zhǔn)的課程搜索方案。
2)給出多目標(biāo)數(shù)據(jù)中各種指標(biāo)數(shù)據(jù)的明確定義,進(jìn)行了函數(shù)優(yōu)化,分析建立了目標(biāo)關(guān)系之間的相關(guān)性。
3)設(shè)計(jì)基于R2-MODE多目標(biāo)數(shù)據(jù)模型,將切比雪夫函數(shù)作為R2指標(biāo)排序的效用函數(shù),提高了選課決策結(jié)果的收斂性和多樣性。
多目標(biāo)推薦式選課系統(tǒng)程需要充分實(shí)現(xiàn)對于系統(tǒng)內(nèi)學(xué)習(xí)資源的有效分配以及學(xué)生學(xué)習(xí)積極性的調(diào)度,合理地按照學(xué)生的學(xué)習(xí)計(jì)劃實(shí)現(xiàn)課程推薦是研究的關(guān)鍵。一個(gè)合理的科學(xué)的課程推薦機(jī)制應(yīng)該考慮到學(xué)生自身的學(xué)習(xí)喜好、學(xué)科類型、課程授課教師信息、課程信息、課程評價(jià)、課程相關(guān)度等多目標(biāo)數(shù)據(jù),這些多目標(biāo)數(shù)據(jù)包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。最終要篩選出匹配學(xué)生能力以及計(jì)劃的課程,以滿足不同階段學(xué)生的個(gè)性化學(xué)習(xí)需求。
對比國際QM(Quality Matters)標(biāo)準(zhǔn)和國內(nèi)FD-QM 標(biāo)準(zhǔn)(FD-QM 高等教育在線課程質(zhì)量標(biāo)準(zhǔn)),結(jié)合中國高等教育實(shí)際情況,以最大限度減少數(shù)據(jù)存儲量為目標(biāo),本文定義了課程推薦中的4 種類型目標(biāo)數(shù)據(jù)。針對多目標(biāo)數(shù)據(jù)在多維數(shù)據(jù)視圖下構(gòu)建數(shù)據(jù)倉庫,最終實(shí)現(xiàn)高維多目標(biāo)差分優(yōu)化模型。
本系統(tǒng)采用多維數(shù)據(jù)視圖的數(shù)據(jù)倉庫,構(gòu)建用于課程推薦的多維數(shù)據(jù)模型,存儲教師信息、課程信息、學(xué)生評價(jià)、課程維度、課程相關(guān)度系數(shù)等的多維空間數(shù)量值。為了把較小的維表聯(lián)合在一起來改善查詢性能,系統(tǒng)采用雪花模型的選課教學(xué)信息倉庫,結(jié)構(gòu)如圖1 所示。圖1 中Course ID 表示課程編號,課程集合course={c1,c2,…,cn};Student ID 表示學(xué)生編號,學(xué)生集合student={s1,s2,…,sn};Teacher ID 表示教師編號,教師集合teacher={t1,t2,…,tn}。在多目標(biāo)教學(xué)系統(tǒng)中,所選定的參數(shù)指標(biāo)為“學(xué)生正在選修的課程”“學(xué)生已經(jīng)完成的課程”“系統(tǒng)內(nèi)已發(fā)布的課程”,對于Course ID 設(shè)置標(biāo)志位,“學(xué)生正在選修的課程”設(shè)為flag1,“學(xué)生已經(jīng)完成的課程”設(shè)為flag2。由此將學(xué)生的這兩項(xiàng)描述參數(shù)構(gòu)成一個(gè)學(xué)生需求向量,用此需求向量對課程集合進(jìn)行遍歷操作,操作去除學(xué)生已經(jīng)完成課程的記錄,即學(xué)生正在選修以及選修完成的課程越多,課程推薦也就越詳細(xì),對學(xué)生推薦的課程更符合其之前的學(xué)習(xí)計(jì)劃,很好地解決學(xué)生在完成或正在學(xué)習(xí)一門課程時(shí),下一步學(xué)習(xí)課程推薦計(jì)劃問題,是一種較為高效并且可行的推薦機(jī)制。
圖1 雪花事實(shí)數(shù)據(jù)倉庫模型Fig.1 Fact data warehouse of snowflake model
對于課程、學(xué)生、教師、課程難度、課程推薦指數(shù)等數(shù)據(jù)倉庫中的相關(guān)屬性進(jìn)行形式化定義以及規(guī)約處理:
定義1教學(xué)名師因子(Teacher factor,Tf)。用來規(guī)約課程授課教師的職稱,院士及以上Tf=0.5,教授Tf=0.4,副教授Tf=0.3,講師Tf=0.2,助教及其他Tf=0.1。
定義2學(xué)位因子(Degree factor,Df)。用來規(guī)約課程授課教師的學(xué)位,博士Df=0.5,碩士Df=0.4,學(xué)士Df=0.3,其他Df=0.2。
定義3課程教師專業(yè)度(Teacher relationship,Tr)。用來規(guī)約課程主講教師的專業(yè)性,值越大表示主講教師的專業(yè)認(rèn)可性越大。
其中:n表示授課教師取得的學(xué)位數(shù);Rti表示授課教師的第i個(gè)專業(yè)與所授課程的相關(guān)性。Rti取值范圍定義如下:
其中:r(0 <r<1)表示相關(guān)性系數(shù)。
定義4專業(yè)相關(guān)度(Professional relationship,Pr),0.1≤Pr≤1。用來規(guī)約課程的專業(yè)相關(guān)度。定義給定課程為C,子學(xué)科合集為H,一級學(xué)科合集為U。存 在,C∈Hi∈Uq|C∈Hj∈Uq|C∈Up因而Rdi(i=1,2,…,l)表示課程與一級學(xué)科的相關(guān)度,Rsi(i=1,2,…,k)表示課程與子學(xué)科的相關(guān)度。Pr值越大表示課程相關(guān)度越大。
其中:n表示課程的總數(shù);Hi、Hj為任意一級學(xué)科包含的任意子學(xué)科;Uq、Up為任意一級學(xué)科。wi為課程專業(yè)權(quán)重值,定義如下:
定義5課程難度系數(shù)(Course difficulty coefficient,Cd),0.1≤Cd≤1。用于規(guī)約課程難度的指標(biāo),指標(biāo)越大表示課程的學(xué)習(xí)難度越高。課程的難度系數(shù)取值來自于系統(tǒng)專家教師、完成課程學(xué)習(xí)的學(xué)生網(wǎng)絡(luò)投票問卷。問卷內(nèi)容包含對其他先導(dǎo)課程的評定,最終給出個(gè)人難度評定。給定每門課程的難度系數(shù)區(qū)間[Cmin,Cmax],參與學(xué)習(xí)的學(xué)生越多,結(jié)合的個(gè)人實(shí)際情況對課程的投票結(jié)果越公正。Cd取值區(qū)間[0.1,1],難度系數(shù)Cd為:
其中:Q表示課程的難度值,系統(tǒng)專家教師和學(xué)生對課程給出難度值的權(quán)重比例為w∶(1-w);p為系統(tǒng)專家教師的問卷量;q為完成課程學(xué)習(xí)的學(xué)生問卷量;Adi為問卷給出的難度值。
定義6課程綜合評價(jià)(Course evaluation,Ce)(0.1≤Ce≤1):表示課程的綜合評分,分值越高表明課程越實(shí)用,越被學(xué)生接受。Ce取值區(qū)間[0.1,1],C′max為課程綜合評價(jià)最大值,C′min為最小值。課程綜合評價(jià)Ce的計(jì)算公式為:
課程隨著時(shí)代發(fā)展而不斷地修正,因而設(shè)Pe為課程參與評價(jià)的年均分。Tyn表示在第n(1≤n≤N)年參與評價(jià)的專家教師數(shù),Ten(0≤Ten≤100)表示此課程在第n年給出的評價(jià)值。Syn表示在第n年參與評價(jià)的專家教師數(shù),Sen(0≤Sen≤100)表示此課程在第n年給出的評價(jià)值,系統(tǒng)專家教師和學(xué)生對課程綜合評價(jià)的權(quán)重比例為v∶(1-v)。在第N年課程Pe表示為:
多目標(biāo)推薦選課系統(tǒng)包含的課程教師推薦、專業(yè)相關(guān)度、課程難度系數(shù)、課程綜合評價(jià)4 項(xiàng)推薦評價(jià)指標(biāo),從不同角度反映了課程的質(zhì)量。而最佳課程質(zhì)量的推薦應(yīng)體現(xiàn)出4 項(xiàng)指標(biāo)在一個(gè)學(xué)生發(fā)出學(xué)習(xí)訴求時(shí)達(dá)到全局最優(yōu)策略,完成高維目標(biāo)優(yōu)化。通過平行空間內(nèi)搜索最佳的推薦組合方案,實(shí)現(xiàn)4項(xiàng)指標(biāo)的最優(yōu)化。
在m維多目標(biāo)優(yōu)化模型中,考慮多目標(biāo)優(yōu)化需要統(tǒng)一目標(biāo)最優(yōu)化取值的極值性,其中Cd′(0 ≤Cd′)為選課者設(shè)定的課程難度系數(shù),4個(gè)目標(biāo)上的適應(yīng)度函數(shù)值為:
應(yīng)用R2-MODE 求解選課推薦系統(tǒng)的4 目標(biāo)優(yōu)化決策問題的整體流程如圖2所示。
為實(shí)現(xiàn)多目標(biāo)推薦選課系統(tǒng)的4 項(xiàng)指標(biāo)的最優(yōu)化,應(yīng)滿足高維多目標(biāo)優(yōu)化問題,本文在目前主流的多目標(biāo)優(yōu)化算法(Multi-Objective Evolutionary Algorithms,MOEA)的基礎(chǔ)上,提出R2-MODE 算法,增加目標(biāo)選擇的收斂性和多樣性,并利用加權(quán)切比雪夫函數(shù)[10]作為R2指標(biāo)[11]排序函數(shù),作為選擇標(biāo)準(zhǔn)來進(jìn)行個(gè)體選擇。
圖2 四目標(biāo)優(yōu)化決策流程Fig.2 Process of 4-objective optimization decision making
算法1 中R2-MODE 選用非支配解[12]指導(dǎo)種群進(jìn)化,首先在目標(biāo)解中生成N個(gè)均勻分布參考權(quán)重向量W,接著利用拉丁方抽樣(Latin Hypercube Sampling,LHS)[13]隨機(jī)均勻地分層抽樣特性,保證初始種群的均勻分布采樣。在主循環(huán)中,根據(jù)進(jìn)化算法MODE[14]對父代種群Pt進(jìn)行變異、交叉操作產(chǎn)生子代種群Qt,再根據(jù)R2 指標(biāo)從合并種群中進(jìn)行環(huán)境選擇,利用個(gè)體a∈A的R2 的貢獻(xiàn)值進(jìn)行R2 排序,根據(jù)排序結(jié)果從合并種群中選擇N個(gè)個(gè)體Xi進(jìn)入下一代,多次迭代后產(chǎn)生的非支配解集作為種群最優(yōu)個(gè)體集合的最終信號控制方案。
算法1 R2-MODE算法框架。
算法2 中首先采用MODE 算法對父代種群進(jìn)行變異、交叉產(chǎn)生Vt→Ut→Pt,獲得非支配解集合At,并對種群中的個(gè)體Xj在第m個(gè)目標(biāo)上進(jìn)行目標(biāo)值標(biāo)準(zhǔn)化,m∈[1,M]。fm(Xi)為目標(biāo)個(gè)體在第m維目標(biāo)上的歸一化函數(shù)值。gm,max、gm,minx分別為當(dāng)前種群Pt中所有個(gè)體在第m維目標(biāo)函數(shù)上的最大值和最小值。
在算法2 的步驟4 中采用R2 指標(biāo)定性評價(jià)兩個(gè)近似PF的優(yōu)劣,加權(quán)切比雪夫函數(shù)作為獲得R2 指標(biāo)排序的效用函數(shù),將多目標(biāo)函數(shù)整合成單一目標(biāo)函數(shù),以便優(yōu)化不同類型的Pareto 前沿[15]。利用目標(biāo)值作為該效用函數(shù)的一組候選解集A,αj為MODE 算法為在目標(biāo)個(gè)體在第m維目標(biāo)上的歸一化函數(shù)值;一組權(quán)值向量Λ(λ=(λ1,λ2,…,λk)∈Λ)和理想點(diǎn)r*。
R2指標(biāo):
個(gè)體α∈A的R2的貢獻(xiàn)值:
算法2 種群的分解。
本文算法的計(jì)算成本來自于推薦式選課系統(tǒng)自定義模型和高階差分算法中的個(gè)體選擇。時(shí)間復(fù)雜度計(jì)算包括非支配排序和R2 指標(biāo)貢獻(xiàn)值計(jì)算,M為目標(biāo)維數(shù)數(shù),N為種群規(guī)模。非支配排序時(shí)間復(fù)雜度為O(N(1ogN)M-2),R2 指標(biāo)貢獻(xiàn)值計(jì)算時(shí)間雜度為O(MN2),且O(MN2)>O(N(1ogN)M-2),因而R2-MODE 時(shí)間復(fù)雜度為O(MN2)。與基于參考點(diǎn)的NSGA-III(Third version of Non-dominated Sorting Genetic Algorithm)[16]、基于支配關(guān)系的?-MOEA(?-dominance based MOEA)[17]以及基于排列的AR+DMO(Average Ranking method+Diversity Management Operator)[18]算法時(shí)間復(fù)雜度進(jìn)行比較,NSGA-III時(shí)間復(fù)雜度計(jì)算包括個(gè)體進(jìn)行非支配排序O(N2(1ogN)M-2)和基于參照點(diǎn)環(huán)境選擇O(MN2),最壞時(shí)間復(fù)雜度為max{O(MN2),O(N2logN)M-2)},NSGA-III 時(shí)間復(fù)雜度為O(MN2)。?-MOEA時(shí)間復(fù)雜度計(jì)算包括種群的規(guī)模與歸檔集維修,歸檔集規(guī)模設(shè)為k,時(shí)間復(fù)雜度為O(MN(N+K))。AR+DMO 時(shí)間復(fù)雜度計(jì)算包括AR 排序、DMO 對種群收斂性評價(jià)和分布性保持機(jī)制,且都為O(MN2),因而AR+DMO 時(shí)間復(fù)雜度為O(MN2)。
R2-MODE 算法沒有增加算法復(fù)雜度,與NSGA-III、AR+DMO基本相同,優(yōu)于?-MOEA。
為了評估R2-MODE 算法在多目標(biāo)問題綜合求解時(shí)的性能,與NSGA-III、?-MOEA 以及AR+DMO 的結(jié)果進(jìn)行實(shí)驗(yàn)對比。實(shí)驗(yàn)采用DTLZ 系列測試集,性能度量選取目前國內(nèi)外主流的標(biāo)準(zhǔn):世代距離(Generational Distance,GD)、分級度量(Diversity Metric,DM)和反轉(zhuǎn)世代距離(Inverted Generational Distance,IGD),從收斂性、分布性和綜合性作為評價(jià)標(biāo)準(zhǔn)。
3.1.1 測試函數(shù)
由于DTLZ[1~7]是用于評價(jià)高維MOEA 性能最廣泛的測試集之一,目標(biāo)個(gè)數(shù)可以任意設(shè)置,并且具有線性、凸凹面、多峰性、退化性,以及連續(xù)非連續(xù)性等特征[19],因而實(shí)驗(yàn)采用DTLZ[1~7]進(jìn)行算法對比和性能分析。在測試集中,一個(gè)給定的M目標(biāo)測試中,每一個(gè)目標(biāo)函數(shù)的決策變量為n=m+r-1。測試問題劃分為4、5、8、10 目標(biāo)時(shí),即:m∈{4,5,8,10},對于DTLZ1 設(shè)r=5,DTLZ[2~6]設(shè)r=10,DTLZ7 設(shè)r=20。DTLZ[1~7]的屬性如表1所示。
表1 DTLZ[1~7]測試集屬性Tab.1 Attributes of DTLZ[1~7]test sets
3.1.2 評價(jià)指標(biāo)
算法的性能指標(biāo)由GD、IGD 和DM 來評估。GD 檢驗(yàn)算法在優(yōu)化過程中種群收斂的能力,值越小說明收斂性越好。DM衡量解集的分布性,取值在區(qū)間(0,1],DM值越大解集的均勻性越好。實(shí)驗(yàn)中需根據(jù)DM 針對的目標(biāo)維數(shù)設(shè)置網(wǎng)格劃分?jǐn)?shù),目標(biāo)數(shù)4、5、8、10,相對的網(wǎng)格劃分?jǐn)?shù)為6、4、3、3。IGD 表示每個(gè)參考點(diǎn)到最近解的距離的平均值,值越小說明算法綜合性能越好,整體效果更好。
3.1.3 參數(shù)設(shè)置
為保證算法的公正性,參考文獻(xiàn)[20]對實(shí)驗(yàn)參數(shù)進(jìn)行設(shè)置。
編碼方式:實(shí)數(shù)編碼。
交叉算子:模擬二進(jìn)制交叉,分布指標(biāo)ηc=20,交叉率等于1。
變異算子:多項(xiàng)式變異,分布指標(biāo)ηm=20,變異率為1/n。每個(gè)算法獨(dú)立重復(fù)實(shí)30次。種群規(guī)模N為100。
實(shí)驗(yàn)?zāi)繕?biāo)空間維數(shù):4、5、8、10。
終止條件:需為不同測試函數(shù)設(shè)置相應(yīng)的運(yùn)行代數(shù),DTLZ 1、DTLZ3、DTLZ6 迭代1 000 代;DTLZ2、DTLZ4、DTLZ5、DTLZ7迭代300代。
3.1.4 對比參數(shù)設(shè)置
對于?-MOEA,需對不同測試函數(shù)的不同目標(biāo)維數(shù)的?參數(shù)[21]進(jìn)行設(shè)置,參數(shù)設(shè)置如表2所示。
表2 ?-MOEA中?參數(shù)設(shè)置Tab.2 Settings of ? parameter in ?-MOEA
3.1.5 結(jié)果對比分析
表3~5 分別給出了4 個(gè)算法在DTLZ 系列測試集上的均值和方差實(shí)驗(yàn)結(jié)果。
表3 給出了在4、5、8、10 維上的DTLZ[1~7]中的GD 值,其中R2-MODE 算法被加粗和加下劃線數(shù)量明顯多于其他算法,整體表現(xiàn)優(yōu)秀,特別是在DTLZ2、DTLZ4、DTLZ5 問題上。?-MOEA 次之,在DTLZ1、DTLZ3、DTLZ6、DTLZ7 表現(xiàn)較好。NSGA-III在更高維上完全不收斂。AR+DMO表現(xiàn)不理想。
表4 給出了在4、5、8、10 維上的DTLZ[1~7]中的DM 值,反映算法的分布性。R2-MODE 算法被加粗和加下劃線數(shù)量顯示其表現(xiàn)一般。分析原因認(rèn)為,R2-MODE 算法含有一組均勻分布的權(quán)值向量和效用函數(shù)的R2貢獻(xiàn)值,快速計(jì)算收斂性和多樣性都較好的候選解;但算法仍然存在不足之處,比如在收斂困難的DTLZ3上表現(xiàn)得性能較弱,分析認(rèn)為R2-MODE算法存在一定的不穩(wěn)定性,由于算法前期主要考慮收斂性而造成種群在部分問題上收斂到局部PF 上,使得多樣性管理不佳。?-MOEA 總體表現(xiàn)較優(yōu),尤其在DTLZ5、DTLZ7 的高維處。NSGA-III 的收斂性較差,但其在DTLZ1、DTLZ2、DTLZ4上表現(xiàn)出了較好的分布性,體現(xiàn)了其自身算法的全局搜索能力。
GD 指標(biāo)、DM 指標(biāo)分別從算法的收斂性和分布性進(jìn)行了驗(yàn)證,IGD指標(biāo)進(jìn)一步從算法的綜合性進(jìn)行評價(jià)。表5給出了在4、5、8、10維上的DTLZ[1~7]中的IGD值,R2-MODE算法被加粗和加下劃線數(shù)量顯示其綜合性強(qiáng),在DTLZ3、DTLZ4 和DTLZ6 上具有明顯的優(yōu)勢,尤其在維數(shù)特別高時(shí)性能更加優(yōu)越,在DTLZ 測試問題上取得了最為滿意的結(jié)果。?-MOEA 表現(xiàn)也較好,但?需要根據(jù)不同維數(shù)、不同測試問題進(jìn)行參數(shù)調(diào)整,實(shí)時(shí)性差。NSGA-III、AR+DMO 的綜合能力不強(qiáng)。4 種算法綜合性排序:R2-MODE、?-MOEA、NSGA-III、AR+DMO。
為測試R2-MODE 高維多目標(biāo)算法的推薦選課系統(tǒng)的推薦教學(xué)效果,系統(tǒng)選用數(shù)據(jù)來源于全國一類本科高校,5 個(gè)學(xué)年、280 門課程、690 名學(xué)生、192 名教師、690 份學(xué)生評價(jià)、150份教師評價(jià)的記錄數(shù)據(jù)。課程參數(shù)標(biāo)準(zhǔn)表、難度參數(shù)評價(jià)表、評價(jià)等級表,借鑒2019 年《普通高等學(xué)校本科專業(yè)目錄》,以電子信息類基礎(chǔ)專業(yè)為例,如表6~8所示。
表3 GD指標(biāo)的均值和方差Tab.3 Mean and variance of GD indicator
表4 DM指標(biāo)的均值和方差Tab.4 Mean and variance of DM indicator
表5 IGD指標(biāo)的均值和方差Tab.5 Mean and variance of IGD indicator
續(xù)表
表6 課程參數(shù)標(biāo)準(zhǔn)表(部分)Tab.6 Course parameter standard table(part)
表7 難度參數(shù)評價(jià)表(部分)Tab.7 Evaluation of difficulty parameters table(part)
課程參數(shù)標(biāo)準(zhǔn)表6 中,Course ID 表示在一級學(xué)科下的子學(xué)科課程編碼,共12 位,第1 位用表示課程專業(yè)屬性,即主干課(A)、主干選修課(B)、選修課(E)、其他(S)。2~3 位表示學(xué)科門類,4~5 位表示專業(yè)代碼,6~7 位表示是專業(yè)名稱,8~9 位表示子學(xué)科名稱,10~12 表示所在子學(xué)科內(nèi)的課程。例如A08070101001表示如圖3所示。
表8 課程評價(jià)等級表(部分)Tab.8 Grade of course evaluation table(part)
因?yàn)榍掖嬖贑∈Hi∈Uq|C∈Hj∈Uq|C∈Up,如A08070101001 是電子科學(xué)與技術(shù)專業(yè),Rdi、Rsi分別表示課程與一級學(xué)科、子學(xué)科的相關(guān)度,wi為課程專業(yè)權(quán)重值。由于篇幅有限,表6中只列出具有代表性課程信息。
難度參數(shù)評價(jià)表7中:Ce表示課程的綜合評分;Pe為課程參與評價(jià)的年均分,取值大小由Tyn、Ten、Syn、Sen決定,專家教師和學(xué)生對課程綜合評價(jià)的權(quán)重和為1。
課程評價(jià)等級表8中:Adi為問卷給出的難度值;Q表示課程的難度值,表示課程難度系數(shù)的指標(biāo)Cd的結(jié)果給定課程的難度系數(shù)區(qū)間和網(wǎng)絡(luò)投票問卷而來。網(wǎng)絡(luò)投票問卷包含系統(tǒng)專家教師的問卷與完成課程學(xué)習(xí)的學(xué)生問卷,問卷量越能更反映真實(shí)的情況。專家教師和學(xué)生對課程給出難度值的權(quán)重和為1。
課程教師信息表9中:Rti的值由ri界定,ri表示在課程主講教師的第i個(gè)專業(yè)與所授課程的相關(guān)性,Rti取值由系統(tǒng)專家在考核課程主講教師時(shí)在系統(tǒng)內(nèi)設(shè)定初始值。
圖3 課程參數(shù)示例Fig.3 Example of course parameter
表9 課程教師信息表(部分)Tab.9 Course teacher information table(part)
在1.2 節(jié)建立的多目標(biāo)推薦式課程系統(tǒng)模型中,系統(tǒng)初始選定方向、子方向以及已學(xué)課程,利用R2-MODE 高維多目標(biāo)算法對模型進(jìn)行求解,確定4 目標(biāo)最優(yōu)的選課方案,優(yōu)化加權(quán)切比雪夫權(quán)值向量λ=(λ1,λ2,…,λk)∈Λ,實(shí)現(xiàn)課程教師專業(yè)度Tr、專業(yè)相關(guān)度Pr、課程難度系數(shù)Cd、課程綜合評價(jià)Ce共4 項(xiàng)推薦評價(jià)指標(biāo)的同時(shí)最優(yōu)化。R2-MODE 算法中種群規(guī)模NP 取值為30,最大迭代次數(shù)Gen取值200,MODE 算法中,變異因子F取值0.5,交叉因子CR取值0.4。表10所示為在選擇工科→信息工程→物聯(lián)網(wǎng)專業(yè)后,R2-MODE 算法對多目標(biāo)課程引導(dǎo)教學(xué)模型的求解選課結(jié)果。多目標(biāo)優(yōu)化問題最終需要得到全局最優(yōu)解集,而非單個(gè)最優(yōu)解,因而在結(jié)果集中選取10 項(xiàng)互為非支配的最優(yōu)解,代表多目標(biāo)課程引導(dǎo)教學(xué)系統(tǒng)中最優(yōu)的10 項(xiàng)設(shè)置選課參數(shù)的方案。均勻分布的權(quán)值λ1、λ2、λ3、λ4作為選課者4目標(biāo)的偏好信息。
從現(xiàn)有網(wǎng)絡(luò)平臺缺乏精準(zhǔn)引導(dǎo)式課程選擇的問題出發(fā),提出了一種多目標(biāo)課程引導(dǎo)教學(xué)模型。通過引導(dǎo)式?jīng)Q策選課實(shí)現(xiàn)對課程教師專業(yè)度、課程的專業(yè)相關(guān)度、課程難度系數(shù)、課程綜合評價(jià)等多項(xiàng)性能的同時(shí)最優(yōu)化。為得到以人為本的、精準(zhǔn)的高維多目標(biāo),設(shè)計(jì)了基于R2 指標(biāo)的優(yōu)化MODE 算法,提高了收斂精度和解集的分布性。成功針對學(xué)生個(gè)體的特征、意愿,建立實(shí)現(xiàn)課程的精準(zhǔn)推薦,為智能選課提供了一種新的方法。系統(tǒng)實(shí)驗(yàn)結(jié)果表明,設(shè)計(jì)方法在數(shù)據(jù)集的收斂性和分布性上都能得到較優(yōu)的結(jié)果,為網(wǎng)絡(luò)平臺精準(zhǔn)引導(dǎo)式課程選擇提供了必要的理論支持。
表10 課程選擇結(jié)果Tab.10 Results of course selection