王夢菊 邵晶波
哈爾濱金融學院 黑龍江 哈爾濱 150080
虛擬學習社區(qū)是借助信息技術創(chuàng)建的網絡學習環(huán)境,是在聯(lián)結主義的啟發(fā)下出現的一種學習組織,也是將在線學習與社交網絡相結合的產物。在虛擬學習社區(qū)中,不同的群體對構建知識的貢獻和所起的作用不盡相同。因此,認識和理解虛擬學習社區(qū)中的各類角色,可以更好地分析和理解虛擬學習社區(qū)、預測用戶行為、研究用戶之間的關系和交互過程、對不同的角色采取不同的支撐策略。
社會網絡理論出現于20世紀50、60年代,德國社會學家Georg Simmelcon從社會學角度將其定義為:一個由一組代表社會成員的節(jié)點和表示節(jié)點間關系的邊或連線構成的社會結構。 1969年,Milgram做了Small-World實驗,1991年Guare提出“六度分離”概念。1992年,美國社會學家Ronald Burt提出了結構洞理論。美國斯坦福大學人文與科學學院社會學家Mark Granovetter對找工作的過程進行研究,得出結論:“弱連接”有著極快的以及可能具有低成本和高效能的傳播效率。此外, “二對一理論”和結構角色理論也是目前主要的社會網絡理論。但傳統(tǒng)的社會網絡研究具有準確性低、個人主觀性強以及樣本規(guī)模小等問題。
社會角色的概念最早是由人類學家Ralphlinton提出,指人們對于某種位置上人的行為的期望或要求。目前,社會網絡角色識別的主要方法為以下4種以及之間的組合:社會網絡分析方法、數學分析方法、內容分析方法、機器學習方法。另外,根據結構相似性、規(guī)則結構等價性、結構特征的分類、聚類、概率圖模型等具體識別的方法,可歸屬到上述4種方法中。這些研究方法目前面臨的挑戰(zhàn)有:社會網絡復雜性分析問題、海量數據問題和評價問題等。
國內最早出現虛擬學習社區(qū)的概念是由陳超等在2001年提出。國外對于虛擬學習社區(qū)的研究早于國內,研究者們使用社交網絡中的密度、出度/入度、社群圖、中心性等基本屬性來分析學習者的交互結構,一般將虛擬學習社區(qū)中的群體劃分成核心、積極和非積極三類。已有學者為了研究學習者在構建知識中的角色和在虛擬社區(qū)中的地位,使用了結構洞、凝聚子群王、塊模型中的結構等價等方法[1]。
在這些方法中,專門劃分社交網絡中行為人地位的是塊模型和概率模型識別方法。傳統(tǒng)的塊模型主要是通過網絡的關系結構來構建,忽視了用戶間交互的信息內容。而概率模型,在不考慮網絡關系結構的情況下,將文本內容與圖中的邊關聯(lián)起來,雖然用到了節(jié)點間文本的關鍵信息,卻缺乏像塊模型從全局的角度來識別。因此,如何將這兩種模式有效結合,是當前虛擬學習社區(qū)角色分類方法中的一個重要思路。
研究對象為大型在線開放課程的課后討論區(qū)。選取中國大學慕課中《操作系統(tǒng)原理》的課后討論區(qū)作為模型設計階段的數據來源,具備豐富的數據樣本空間,適合作為訓練樣本。本文作者近兩年使用中國大學慕課平臺上的《操作系統(tǒng)原理》課程進行SPOC教學,熟悉該課程的教學過程,有利于對課后討論區(qū)中數據進行特征分析。在模型評價階段,擬選取我校智慧樹平臺上的在線開放課程《數據結構》的課后討論區(qū)學習者昵稱和發(fā)言文本作為評價數據源,本文作者為該課程負責人,方便調取后臺數據,同時,熟悉課程學生情況,便于在實際教學和互動中掌握學生角色類別,為人工評價提供了可行性。
本文研究數據來源于MOOC中國慕課網和智慧樹平臺。
MOOC即大規(guī)模開放在線課程,于2008年次提出。2012年,美國的頂尖大學陸續(xù)設立網絡學習平臺,Coursera、Udacity、edX三大課程提供商興起,給更多學生提供了系統(tǒng)學習的可能。平臺上的課程向學習者免費提供,與真正的大學相似,有一套自己的學習和管理系統(tǒng)。MOOC平臺課程具有資源工具多元化、課程學習方便、課程受眾面廣等特點。
智慧樹于2009 年成立,是中國最大的MOOC式在線互動學堂,支持跨校授課和學分互認,適合實現跨校選課修讀。該平臺可實現在線課程和見面課相結合,同時設置技術向導,為教師和學生引領學習過程的開展。在課程教學的整個流程中都提供平臺服務,同時,通過統(tǒng)計圖和進程條等方式反饋個體和群體學習情況,使教師能夠及時掌握學情。
社會網絡數據的海量化和動態(tài)化,使角色識別算法的數據處理面臨如下挑戰(zhàn):處理的時間即效率和算法的準確率。因此,本課題中數據源的選取考慮三個方面:數據規(guī)模、數據的時間變化和數據的種類多樣化。如上所述,中國大學慕課平臺是大規(guī)模在線開放課程平臺,選課人數眾多、數據規(guī)模較大,適合訓練樣本的選擇;同時,課程的多次開課使得同一課程在不同時間階段擁有不同學習者群體的學習數據,更適合作為動態(tài)訓練樣本,方便進行對比、評價。智慧樹平臺作為在線互動學堂,設有課程論壇和見面課,能夠進行互動交流,使得教師在異步和同步互動中更加熟悉學生情況,方便進行學生角色的主觀識別,從而對模型的識別結果進行主觀評價。分別從上述兩大平臺中選取2門共3次課程數據,從而確保數據種類的多樣化。具體選取策略如下:
2.3.1 選取大規(guī)模在線開放課程中國大學慕課中《操作系統(tǒng)原理》(第六次開課)的課后討論區(qū)作為模型設計階段的數據來源。本文作者近兩年使用中國大學慕課平臺上的《操作系統(tǒng)原理》課程進行SPOC教學,熟悉該課程的教學過程,有利于對課后討論區(qū)中數據進行特征分析。使得訓練樣本空間有足夠數量的歷史數據作為靜態(tài)訓練樣本,數據收集截止日期至2020年6月30日。
2.3.2 選取上述《操作系統(tǒng)原理》課程的第七次開課數據作為動態(tài)訓練樣本,進行識別模型測試。
2.3.3 采用智慧樹平臺上的在線開放課程《數據結構》的課后討論區(qū)學習者昵稱和發(fā)言文本作為評價數據源。該課程的負責人為本文作者,方便后臺數據調取。同時,由于該課程的教學團隊熟悉課程學生情況,便于在實際教學和互動中掌握學生角色類別,因此由一線教師進行人工評價(目前,人工評價仍是評估社會網絡角色識別模型的主要方法)。
結構等價的定義比正則等價嚴苛,在小規(guī)模的、自發(fā)形成的社交網絡中,很難找到能夠結構等價的兩個節(jié)點。 像虛擬學習區(qū)中常見的場次多但參與人數不多的討論,用正則等價比較容易實現區(qū)分角色的目標。將正則等價結構與塊模型的構建結合,實現正則等價下的角色劃分[2]。
選取主題,即在課后評論區(qū)選取一個數量較小詞匯的分布對大量的文本進行總結,這些分布被稱為 “主題”。把主題定義為一個給定詞匯的多項式分布。具體過程如下:
對評論區(qū)的每一個帖子,從狄利克雷分布中抽取出該帖子的主題分布。根據主題分布,對帖子中的每一個詞匯選擇一個單一的主題。從具有特定采樣主題的詞匯多項式分布中,對每個詞匯進行采樣。由該生成過程對應的分層貝葉斯模型,得到關于參與主體的主題信息和每個帖子中這些主題的權重信息。
設計優(yōu)化組合策略,計劃使用迭代方法,將前期構建的正則等價塊模型和主題概率模型相融合,構建混合識別模型。在動態(tài)訓練樣本空間上運行、修改優(yōu)化。目前,社會網絡角色識別的大多數方法,或是依據社會網絡中的結構,或是依據社會網絡中的內容。前者側重從宏觀角度識別角色,對主題或環(huán)境的因素幾乎沒有考慮;后者從微觀角度識別社會網絡中的角色,更多關注文本中的關鍵信息,缺乏對全局的認識。
本文采用“混合方案”,在角色識別中使用塊模型關注社會網絡的結構,同時使用主題概率模型關注社會網絡的內容。通過對二者的優(yōu)化組合,并考慮時間因素,使角色識別結果更符合虛擬學習社區(qū)的實際情況。
目前,還沒有一種評估方法,可以對所有角色識別方法進行有效評估,甚至很多時候需要通過人工來完成。本文采取客觀評價與主觀評價相結合的策略。對于識別結果效率等定量問題,采用在相同樣本空間上與其他識別方法對比的評價方法。而角色識別方法的評價問題中,最難解決的是如何判斷識別結果是否符合實際情況,即識別出的角色在實際活動中是否符合角色特征。這是一個具有主觀性的問題。針對這一問題,將采用智慧樹平臺上的在線開放課程《數據結構》平臺上的數據作為評價樣本空間,由課程團隊中教師進行人工評價。采用以下四種方法,從角色識別的精度和效率兩個方面進行綜合評估:與常見的聚類算法進行對比。與單一塊模型算法進行對比。與單一主題概率模型算法進行對比。由智慧樹平臺上的在線開放課程《數據結構》教學團隊進行人工評價。
通過上述混合識別模型,發(fā)現虛擬學習社區(qū)的學習者在知識構建的過程中形成的不同的角色。得到他們在交流討論、知識傳遞的過程中表現的不同特征[3]。根據角色分類的結果,預計在以下方面有所啟發(fā):對虛擬學習社區(qū)的不同角色進行知識推薦,采取不同的策略,促進個性化學習。同時,角色識別的結果也為自適應課程中知識模塊的劃分和總體策略的制定提供了參考。挖掘導學者,向慕課的教師推薦“學生助教”。發(fā)現初學者,對其給予更多關注。在SPOC課程中,在線學習社區(qū)的角色識別可以幫助教師及時了解學情,調整與學生互動的方案,提高教學效果。學習者角色的識別結果,也可用于“自適應”課程針對不同的學習角色進行不同的知識模塊組合。對于大型在線開放課程平臺,學習者角色識別可以幫助教學者了解當前課程學習者的多樣需求,對于課程建設,甚至專業(yè)課程設置、人才培養(yǎng)方案制定都起著積極的作用。