肖立志
(河南廣播電視大學(xué),河南 鄭州450008)
當(dāng)前,教育管理部門對中小學(xué)教師的繼續(xù)教育工作在全國鋪展開來,隨之各地都建立了專門的中小學(xué)教師繼續(xù)教育管理系統(tǒng).主要解決傳統(tǒng)操作模式在時(shí)間消耗和人力消耗上都存在較大的支出問題,使操作流程更加簡便合理,提高工作效率,節(jié)省人力資源成本,實(shí)現(xiàn)培訓(xùn)項(xiàng)目的高效管理、業(yè)務(wù)操作流程的簡便化和信息傳遞的及時(shí)快捷.這些系統(tǒng)基本上都實(shí)現(xiàn)了教育信息管理的數(shù)字化和信息化,然而,都片面強(qiáng)調(diào)了管理,而沒有從服務(wù)對象的角度去進(jìn)一步深入研究,為使用者提供個(gè)性化的智能服務(wù).
傳統(tǒng)的中小學(xué)教師繼續(xù)教育管理系統(tǒng)積累了大量數(shù)據(jù),這些數(shù)據(jù)中隱含著許多知識,都不曾被發(fā)現(xiàn)和利用,造成數(shù)據(jù)資源的浪費(fèi),也就是數(shù)據(jù)沉睡.大數(shù)據(jù)時(shí)代來臨,利用智能分析技術(shù)從海量的數(shù)據(jù)資源中獲得有價(jià)值的知識與信息資源,為用戶提供智能化、個(gè)性化的服務(wù)[1].目的是通過智能化的手段實(shí)現(xiàn)學(xué)習(xí)的個(gè)性化和教學(xué)的針對性.如何生成能夠自動(dòng)優(yōu)化的、合適的個(gè)性化學(xué)習(xí)序列,成為實(shí)現(xiàn)具有適應(yīng)性和智能性的中小學(xué)教師繼續(xù)教育管理系統(tǒng)的關(guān)鍵.
目前國內(nèi)外對學(xué)習(xí)分析進(jìn)行了深入研究,并取得了不少新的成果,國外學(xué)者利用虛擬手段通過試探和反饋信息來生成學(xué)習(xí)序列[2-5].例如,Iglesia等通過虛擬教學(xué)場景和模擬數(shù)據(jù)的方法,提出采用強(qiáng)化學(xué)習(xí)對不同的學(xué)習(xí)序列進(jìn)行嘗試,進(jìn)而訓(xùn)練系統(tǒng)以獲得最優(yōu)的學(xué)習(xí)序列,從而將成果運(yùn)用到匹配的學(xué)習(xí)者.其缺點(diǎn)在于沒有考慮知識點(diǎn)和學(xué)習(xí)者之間的關(guān)系(如學(xué)習(xí)者的關(guān)注點(diǎn),愛好等).其他的研究也提出一些優(yōu)化技術(shù)以獲得最佳的學(xué)習(xí)序列進(jìn)行系統(tǒng)應(yīng)用.
當(dāng)前研究存在的主要問題:(1)注重優(yōu)化技術(shù),忽略了學(xué)習(xí)規(guī)律中的綜合因素,如學(xué)員關(guān)注點(diǎn)和偏好與知識點(diǎn)之間的關(guān)系,及學(xué)員的個(gè)性差異(學(xué)習(xí)能力等);(2)對于學(xué)員的個(gè)性化需求與特征、生成合適的學(xué)習(xí)序列的研究還不夠深入;(3)不具備自適應(yīng)的學(xué)習(xí)能力;(4)目前研究的對象都是學(xué)生,而缺乏針對中小學(xué)教師的專項(xiàng)研究.為此,本文提出研究一個(gè)針對中小學(xué)教師的繼續(xù)教育系統(tǒng).采用知識點(diǎn)和關(guān)注點(diǎn)間關(guān)系作為出發(fā)點(diǎn),并與學(xué)員個(gè)性化特征及考核反饋信息等結(jié)合的個(gè)性化學(xué)習(xí)序列生成方法.
定義1(知識點(diǎn)) 系統(tǒng)中每個(gè)知識有若干個(gè)知識點(diǎn),一個(gè)知識點(diǎn)由若干固定的成員構(gòu)成,可以用一個(gè)多元組表示:K=(KID,name, RL,KWS,des,imp,dif),其中KID為知識點(diǎn)的標(biāo)識,用于區(qū)別于其他知識點(diǎn);name為知識點(diǎn)的名稱;RL為知識點(diǎn)的相應(yīng)資源列表;KWS為知識的關(guān)鍵詞集,是對該知識點(diǎn)的高度概括;des為知識點(diǎn)的詳細(xì)描述,包括該知識點(diǎn)的定義、范疇、詳述及來源的領(lǐng)域等;imp∈[0,1]為知識點(diǎn)的重要系數(shù);dif∈[0,1]為知識點(diǎn)的難度系數(shù).
文本挖掘是項(xiàng)目的重點(diǎn)所在,從學(xué)員提供的基本信息、相關(guān)文檔以及學(xué)員訪問頻次較高的網(wǎng)頁中提取學(xué)員的關(guān)注點(diǎn).
項(xiàng)目采用LDA(Latent Dirichlet Allocation 簡稱LDA)建立信息進(jìn)行文檔主題分析模型.LDA是一個(gè)生成式三層貝葉斯網(wǎng)絡(luò)的概率主題模型,由David Blei,Andrew Ng和Michael Jordan于2003年提出,主要用于文檔處理和知識發(fā)現(xiàn)方面.
文檔的主題抽取是文本挖掘的一項(xiàng)重要的基礎(chǔ)性工作.使用LDA模型對語料集建模,然后確定詞項(xiàng)集合,以此形成文檔的主題.實(shí)驗(yàn)表明該方法在表達(dá)文檔的主題方面能更加準(zhǔn)確地表達(dá)其主題,獲得了良好的效果.非監(jiān)督機(jī)器學(xué)習(xí)算法LDA,依據(jù)詞項(xiàng)頻度來表達(dá)文檔主題,而不考慮詞項(xiàng)之間的關(guān)系[6].
標(biāo)準(zhǔn)的LDA很難進(jìn)行精確的求解,并且忽略了詞項(xiàng)之間的聯(lián)系和詞項(xiàng)頻度與主題之間的關(guān)系,在實(shí)際的應(yīng)用當(dāng)中需要借助其他的方法進(jìn)行不精確的求解,并且可以利用詞項(xiàng)頻度設(shè)置權(quán)重的方法來彌補(bǔ)這些缺點(diǎn).項(xiàng)目中采取了吉布斯抽樣方法(Gibbs Sampling).
采用主題概率模型對文本進(jìn)行主題建模,得到文本的主題~詞項(xiàng)分布.然后綜合文本的詞項(xiàng)序列、主題~詞項(xiàng)分布和相關(guān)主題挖掘出易于理解的文檔主題.文本挖掘過程如圖1所示.
圖1 文本挖掘過程Fig.1 The process of text mining
根據(jù)LDA模型生成的文檔~主題分布,采用libsvm實(shí)現(xiàn)SVM算法,訓(xùn)練二元分類器進(jìn)行分類.經(jīng)過樣本訓(xùn)練的測試實(shí)驗(yàn),分類的準(zhǔn)確率達(dá)到92.42%.
隨著移動(dòng)互聯(lián)網(wǎng)發(fā)展,移動(dòng)智能終端廣泛使用,隨時(shí)隨地的移動(dòng)學(xué)習(xí)和辦公成為習(xí)慣,進(jìn)一步拓展了個(gè)性化學(xué)習(xí)的應(yīng)用環(huán)境,智能答疑及自適應(yīng)服務(wù)等開始用于支持移動(dòng)學(xué)習(xí),以用戶為中心的服務(wù)質(zhì)量和能力的提升成為決定產(chǎn)品成敗的關(guān)鍵,如何為學(xué)習(xí)者提供更“貼切”的服務(wù)成為研究的切入點(diǎn),智慧學(xué)習(xí)環(huán)境的提出為個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)提供了新的途徑,大數(shù)據(jù)分析也為個(gè)性化學(xué)習(xí)提供了技術(shù)基礎(chǔ).智慧學(xué)習(xí)的基本方法是依據(jù)學(xué)習(xí)者個(gè)體差異的特點(diǎn),提供個(gè)性化的學(xué)習(xí)方案、學(xué)習(xí)計(jì)劃、學(xué)習(xí)診斷和學(xué)習(xí)服務(wù)等,并利用移動(dòng)互聯(lián)網(wǎng)實(shí)時(shí)記錄學(xué)習(xí)者的學(xué)習(xí)行為和軌跡以用于數(shù)據(jù)挖掘和深入分析,結(jié)果用于還原學(xué)習(xí)軌跡,評估過往學(xué)習(xí)過程和學(xué)習(xí)成果,以及預(yù)測未來表現(xiàn)和及時(shí)發(fā)現(xiàn)潛在問題,為學(xué)習(xí)者提供最佳的學(xué)習(xí)方案及策略,從而提高學(xué)習(xí)效果[7].
目前學(xué)習(xí)分析還沒有統(tǒng)一的定義,但基本上都反映了學(xué)習(xí)分析的本質(zhì):首先發(fā)掘?qū)W習(xí)者的需求,利用技術(shù)手段獲取、分析數(shù)據(jù)和解析預(yù)測,為學(xué)員、教師、管理人員等提供所需的數(shù)據(jù)結(jié)果,參與者依據(jù)數(shù)據(jù)結(jié)果采取及時(shí)、有效的干預(yù)措施,從而達(dá)到提高學(xué)習(xí)和教學(xué)效果的目的.可見,學(xué)習(xí)分析科學(xué)地提升教學(xué)效能的指向非常明確[8].
學(xué)習(xí)分析的要素.布朗(Brown,2011)提出學(xué)習(xí)分析包括五個(gè)要素.
1)數(shù)據(jù)獲取:利用技術(shù)手段獲取系統(tǒng)中的學(xué)習(xí)數(shù)據(jù)和學(xué)員學(xué)習(xí)日志等.
2)數(shù)據(jù)分析:按照學(xué)習(xí)能力、用戶需求等方向?qū)?shù)據(jù)進(jìn)行分析.
3)學(xué)員學(xué)習(xí):學(xué)員在系統(tǒng)上的學(xué)習(xí)序列、學(xué)習(xí)行為、時(shí)間分配等.
4)信息反饋:將結(jié)果以各種方式反饋給教師、學(xué)員本人以及教育管理者.
5)干預(yù):根據(jù)結(jié)果,為學(xué)員提供個(gè)性化的學(xué)習(xí)方案,服務(wù)學(xué)員.
學(xué)習(xí)分析的過程模型如圖2所示.
圖2 學(xué)習(xí)分析過程模型Fig.2 The learning analytics model
從模型可以看出數(shù)據(jù)的來源主要有學(xué)員的學(xué)習(xí)日志和網(wǎng)絡(luò)行為及系統(tǒng)相關(guān)數(shù)據(jù),最終的分析結(jié)果用戶個(gè)性化學(xué)習(xí)服務(wù).
中小學(xué)教師繼續(xù)教育培訓(xùn)通常是在一個(gè)固定的時(shí)間單元內(nèi)(如假期等)組織實(shí)施的,一次培訓(xùn)通常為一個(gè)月或者一周時(shí)間不等,每次培訓(xùn)又會細(xì)化成幾個(gè)階段或者是幾個(gè)環(huán)節(jié)來進(jìn)行.每個(gè)階段或者環(huán)節(jié)、一個(gè)學(xué)時(shí)都可以看作一個(gè)學(xué)習(xí)活動(dòng),每次培訓(xùn)可以有若干個(gè)學(xué)習(xí)活動(dòng)組成(如72個(gè)學(xué)時(shí)).按照預(yù)設(shè)的培訓(xùn)方案,假定每個(gè)學(xué)員的學(xué)習(xí)能力、學(xué)習(xí)效率等特點(diǎn)都是一樣的,都能夠在規(guī)定的時(shí)間內(nèi)完成培訓(xùn)任務(wù).這種傳統(tǒng)的培訓(xùn)方式忽略了學(xué)員的個(gè)性化差異,實(shí)際上每個(gè)學(xué)員的各方面指標(biāo)都是有差別的.在固定的時(shí)間單位內(nèi),依據(jù)學(xué)員學(xué)習(xí)能力等方面的差異,由知識點(diǎn)組成更大容量的學(xué)習(xí)序列,便于學(xué)員個(gè)性化學(xué)習(xí)的需要.學(xué)習(xí)工作量是學(xué)員完成學(xué)習(xí)序列任務(wù)所需付出的精力成本.在固定的時(shí)間單位內(nèi),它與知識點(diǎn)的數(shù)量、難度系數(shù)和重點(diǎn)系數(shù)成正比.
定義2(學(xué)習(xí)能力) 學(xué)員的學(xué)習(xí)能力是指在單位時(shí)間內(nèi)完成學(xué)習(xí)工作量的多少.可以用公式lC=Wl/t來表示.lC為學(xué)員的學(xué)習(xí)能力,Wl為學(xué)習(xí)工作量,t為單位學(xué)習(xí)時(shí)間.在培訓(xùn)計(jì)劃確定后,隨之的學(xué)習(xí)工作量也是固定的,依據(jù)學(xué)員學(xué)習(xí)能力的不同,能夠計(jì)算出每個(gè)學(xué)員完成培訓(xùn)任務(wù)所需的時(shí)間,進(jìn)而生成學(xué)習(xí)序列,為學(xué)員提供個(gè)性化學(xué)習(xí)服務(wù).
圖3為一個(gè)學(xué)習(xí)序列,該序列由若干個(gè)學(xué)習(xí)單元構(gòu)成.lui為學(xué)員正在學(xué)習(xí)的學(xué)習(xí)單元,它之前的為學(xué)員已經(jīng)完成學(xué)習(xí)的學(xué)習(xí)單元,后面的為將要學(xué)習(xí)的學(xué)習(xí)單元.每個(gè)學(xué)習(xí)單元的單位時(shí)間t相等,也就意味著每個(gè)學(xué)習(xí)單元內(nèi)的知識點(diǎn)的數(shù)量不盡相同;在固定的學(xué)習(xí)工作量要求下,知識點(diǎn)的重要系數(shù)和難度系數(shù)越大,也就意味著能完成學(xué)習(xí)的知識點(diǎn)的數(shù)量越少,反之則相反.綜上,這些公式和數(shù)值對于學(xué)習(xí)任務(wù)的精準(zhǔn)生成提供了依據(jù)和幫助.
圖3 個(gè)性化學(xué)習(xí)序列Fig.3 The learning sequences
關(guān)于個(gè)性,著名心理專家郝濱先生認(rèn)為:個(gè)性可界定為個(gè)體思想、情緒、價(jià)值觀、信念、感知、行為與態(tài)度之總稱,它確定了我們?nèi)绾螌徱曌约阂约爸車沫h(huán)境.它是不斷進(jìn)化和改變的,是人從降生開始,生活中所經(jīng)歷的一切總和.個(gè)性就是指某個(gè)個(gè)體區(qū)別于自己所屬群體中其他個(gè)體的一些獨(dú)有的特征.本文重點(diǎn)探討個(gè)性在中小學(xué)教師繼續(xù)教育管理系統(tǒng)中的應(yīng)用,以及對方法和模式的影響,特別是學(xué)員的學(xué)習(xí)軌跡和選擇傾向.系統(tǒng)個(gè)性化和適應(yīng)性的第一要?jiǎng)?wù)就是精準(zhǔn)刻畫學(xué)員畫像.例如,在學(xué)員使用系統(tǒng)過程中,往往有些并行的選項(xiàng),學(xué)員根據(jù)個(gè)人喜好進(jìn)行選擇,系統(tǒng)記錄學(xué)員的選擇、理解并分析出學(xué)員的個(gè)性.用戶畫像盡量精準(zhǔn)地反映用戶的真實(shí)個(gè)性,是實(shí)現(xiàn)中小學(xué)教師繼續(xù)教育管理系統(tǒng)個(gè)性化的關(guān)鍵所在.項(xiàng)目實(shí)際過程中真實(shí)地理解用戶就要獲得相當(dāng)量的用戶信息,如果要求用戶大量顯式輸入顯得臃腫,也影響用戶體驗(yàn).
互聯(lián)網(wǎng)的迅速發(fā)展和移動(dòng)智能終端的普及為用戶偏好的記錄提供了堅(jiān)實(shí)的基礎(chǔ).用戶通過智能終端的網(wǎng)絡(luò)行為和操作行為為用戶的個(gè)性化分析提供了完整可靠的數(shù)據(jù)基礎(chǔ),用戶通過社交軟件的行為能反映學(xué)員的偏好、需求、動(dòng)機(jī)等一系列的個(gè)性特質(zhì).
以學(xué)員為中心的學(xué)習(xí)服務(wù)系統(tǒng),為學(xué)習(xí)提供貼切的服務(wù)是唯一要旨.貼切的個(gè)性化服務(wù)就要求系統(tǒng)能根據(jù)學(xué)員的變化,自動(dòng)做出實(shí)時(shí)的調(diào)整和優(yōu)化,具備自適應(yīng)的學(xué)習(xí)能力.自適應(yīng)機(jī)制是提供系統(tǒng)生命力的關(guān)鍵手段.
通常,學(xué)員近期對某個(gè)知識點(diǎn)訪問的頻繁度能夠反映學(xué)員最近的偏好和關(guān)注點(diǎn),設(shè)置衰減系數(shù)(attenuation coefficient),以適應(yīng)學(xué)員偏好的變化,用于修正學(xué)員的學(xué)習(xí)偏好:
Cα= e-D/K×F,
其中:F∈[0,1]為訪問頻度系數(shù),單位時(shí)間內(nèi)訪問的次數(shù)越多,F(xiàn)的值越?。环粗?,F(xiàn)越大.D為當(dāng)前時(shí)間與訪問時(shí)間的差,訪問知識點(diǎn)的時(shí)間越早,D的值就越大,Cα就越小;反之,Cα就越大.K為選擇性常量,用于標(biāo)識衰減速度,K的值大于1,衰減的速度越快,K值就越大.據(jù)此,自動(dòng)定期對學(xué)員的關(guān)注點(diǎn)和偏好就行相應(yīng)的修正.
Pik=Cα×Pik.
系統(tǒng)的適應(yīng)性體現(xiàn)在系統(tǒng)是否能夠根據(jù)學(xué)員的實(shí)際操作和變化,不斷地進(jìn)行學(xué)習(xí),進(jìn)而滿足用戶不斷變化的個(gè)性化需求,以及對學(xué)員的變化提前做出預(yù)測和判斷,引導(dǎo)學(xué)員進(jìn)行學(xué)習(xí).將學(xué)員失去不再關(guān)注的知識點(diǎn)的衰減系數(shù)趨近于0,將預(yù)測的用戶關(guān)注的知識點(diǎn)添加到為學(xué)員推薦的知識點(diǎn)列表中;學(xué)員持續(xù)關(guān)注的知識點(diǎn)在推薦列表中進(jìn)行加強(qiáng).針對系統(tǒng)通過預(yù)測推薦的知識點(diǎn)和學(xué)員真正期望的知識內(nèi)容存在的情形,分別采取4種不同的策略.如表1所示.
表1 自適應(yīng)策略表Tab.1 The table of the adaptive strategy
知識點(diǎn)推薦.根據(jù)學(xué)員記錄和學(xué)習(xí)行為日志產(chǎn)生預(yù)測,為學(xué)員推薦與之關(guān)注點(diǎn)相匹配的知識點(diǎn)結(jié)合,主要通過文本匹配和相似性分析進(jìn)行.
系統(tǒng)內(nèi)知識點(diǎn)的集合,其中對于學(xué)員未曾學(xué)習(xí)過的每個(gè)知識點(diǎn),都要與預(yù)測的學(xué)員關(guān)注點(diǎn)之間進(jìn)行相似性匹配:
式中:Pi(Kl)表示學(xué)員i在關(guān)注點(diǎn)Kl上的需求;Nj(Kl)表示知識點(diǎn)j中關(guān)鍵字Kl的構(gòu)成相應(yīng)比例;t為設(shè)置的閥值,t值越大,說明匹配度越高,推薦t值高的知識點(diǎn)推薦給學(xué)員,并按照t值進(jìn)行排序.
公式完全滿足相似度匹配的要求.系統(tǒng)能夠隨著學(xué)員需求和偏好的變化而自適應(yīng)學(xué)習(xí)調(diào)整,進(jìn)而完善了個(gè)性化服務(wù).
系統(tǒng)的開發(fā)工具為VS2013和SQL2008,采用ASP.NET MVC進(jìn)行開發(fā),也分別開發(fā)了基于Android和IOS的移動(dòng)智能終端軟件,利用Python開發(fā)了網(wǎng)絡(luò)爬蟲系統(tǒng).系統(tǒng)投入使用1年多來,不斷完善,已經(jīng)替代了老的培訓(xùn)系統(tǒng),正在為河南省100多萬中小學(xué)教師服務(wù).2000人的問卷調(diào)查結(jié)果表明,學(xué)員對新的個(gè)性化培訓(xùn)系統(tǒng)滿意率為97.32%,對老的培訓(xùn)系統(tǒng)滿意率為81.12%.系統(tǒng)分析數(shù)據(jù)表明,使用新的培訓(xùn)系統(tǒng)后,學(xué)員的學(xué)習(xí)成績提高了7.6%,培訓(xùn)效率提高了8.5%.
本文整體上對系統(tǒng)的研究和設(shè)計(jì)過程中的重點(diǎn)進(jìn)行了較為清晰的表述,滿足了學(xué)員個(gè)性化的學(xué)習(xí)需求,并具有較好的自適應(yīng)學(xué)習(xí)能力.目前該系統(tǒng)的個(gè)性化服務(wù)得到學(xué)員的好評,但也存在一定的不足,例如對知識點(diǎn)之間的內(nèi)在關(guān)系沒有詳細(xì)的分析和考慮,對學(xué)員的個(gè)性刻畫還不夠詳盡,下一步在這兩點(diǎn)上完善研究與設(shè)計(jì),并進(jìn)一步提供系統(tǒng)的自適應(yīng)性.