魏孔鵬 谷洪彬 李嘯龍
摘 ?要: 提升職業(yè)院校學生綜合素質評價的科學性與準確性,是建設現(xiàn)代職業(yè)教育體系的必然要求。文章按照學生綜合素質評價體系的要素,采集學生在校期間產生的海量數據,并對海量數據清洗、交換和集成。通過標簽定義和模型特征構建,實現(xiàn)基于學生思想品德、身心素質、學業(yè)水平、實踐能力、職業(yè)能力和指標評價的用戶畫像模型。該模型的構建為學生綜合素質評價的方法、過程、反饋提供了新思路和新方法。
關鍵詞: 用戶畫像; 大數據; 綜合素質; 評價
中圖分類號:TP311 ? ? ? ? ?文獻標識碼:A ? ? 文章編號:1006-8228(2020)03-96-03
Research on the construction of user portrait for the evaluation
of students' comprehensive quality
Wei Kongpeng, Gu Hongbin, Li Xiaolong
(Panjin Vocational and Techical College, Panjin, Liaoning 124000, China)
Abstract: It is an inevitable requirement of constructing the modern vocational education system to improve the scientific nature and accuracy of the comprehensive quality evaluation of students in vocational colleges. According to the elements of students' comprehensive quality evaluation system, the massive data generated by students in school is collected, cleaned, exchanged and integrated. Through tag definitions and model features building, the user portrait model is constructed according to students' ideological and moral, physical and mental quality, academic level, practice ability, professional ability and index evaluation. The construction of the model provides new ideas and methods for students' comprehensive quality evaluation methods, process and feedback.
Key words: user portrait; big data; comprehensive quality; evaluation
0 引言
《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》提出充分發(fā)揮教育評價對科學育人的導向作用,構建科學的職業(yè)教育評價制度和改進高校人才培養(yǎng)質量評價。隨著人工智能、大數據、區(qū)塊鏈等新技術的迅猛發(fā)展,信息技術對教育的革命性影響日趨明顯,在面對新生代學習者和以大數據技術為核心的信息社會背景下,學生的學習方式、生活習慣都發(fā)生了深刻變革。如何依托大數據技術深入整合校園各類數據,通過數據挖掘和預測性分析,不斷提升職業(yè)院校學生綜合素質評價的科學性與準確性,是教育工作者正在面臨的問題,對其研究即有理論意義也是現(xiàn)實需求。
關于大數據時代背景下大學生綜合素質評價的研究正處于起步階段。楊鴻等[1]在《大數據時代學生綜合素質評價:方法論、價值與實踐導向》中論述了從大數據的視角探尋學生綜合素質評價的改革方略,提出大數據對學生綜合素質的全面診斷、精準預測可以促進學生的生命成長,實現(xiàn)教育價值的回歸的理論;王祖霖[2]在《大數據時代學生評價變革研究》中闡述教育大數據的特征與學生評價原則的關系,揭示大數據時代學生評價變革面臨的挑戰(zhàn),預示大數據時代學生評價變革的趨勢,提出應對大數據時代學生評價變革的策略;余戡[3]在《大數據時代背景下大學生綜合素質評價體系研究—以安慶師范大學為例》用調查問卷的方式研究出一套符合當下條件和時代特性的全面客觀科學合理的大學生綜合素質評價指標體系內容。
高職學生的綜合素質評價應當貫穿高職學生教育的全過程,對學生的綜合素質進行全面、科學、系統(tǒng)的評價是保障學生培養(yǎng)質量的必然要求,是建設現(xiàn)代職業(yè)教育體系的需要。
用戶畫像技術是大數據技術的一部分。用戶畫像技術應用于學生綜合素質評價,為學生評價的方法、過程、反饋提供了強大的技術支撐和管理模式,確保綜合素質評價因素的真實性和系統(tǒng)性,評價過程的準確性和全面性,評價反饋的有效性和可操作性。
1 用戶畫像
Alan Cooper提出用戶畫像,是真實用戶的虛擬代表,是建立在真實數據之上的目標用戶模型。用戶畫像的實質是用數據(結構化數據和非結構化數據)描述用戶組或用戶的過程,用短語或標簽反映用戶的特征,用數據集合反映用戶的特征狀態(tài),通過分類、過濾、反饋、加權等算法,構建個體用戶畫像或群體用戶畫像[4]。
學生綜合素質的用戶畫像,就是對學生在校期間的學習、科研、實習實訓、生活等活動中產生和積累的海量數據,利用大數據技術進行存儲、加工、治理和交換,通過特征分析、聚類、分類、異常分析和TopN分析,以圖與表的形式發(fā)現(xiàn)并挖掘學生行為特征的規(guī)律性,提升學生綜合素質評價的可行性、持續(xù)性和可信度。
2 學生綜合素質的用戶畫像
數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態(tài)以及相互關系等進行記載的物理符號,具有描述現(xiàn)象、發(fā)現(xiàn)關系、評價效果及預測趨勢的功能。用戶畫像是對現(xiàn)實世界中用戶的數學建模,構建學生綜合素質的用戶畫像,是為了塑造一個虛擬化的真實學生模型,為學生綜合素質評價的提質增效提供事實性參考和科學性預測依據。構建用戶畫像需要準確的標簽體系、真實的數據來源和可靠的邏輯架構。
學生綜合素質進行用戶畫像的核心是數據,數據的范圍是學生綜合素質評價體系的各級指標,數據的內容可以是數字、文字、圖像和聲音。為了從多維角度對學生進行精準畫像,需要對海量數據進行分類[5]。本研究采用數據-用戶標簽映射方法構建用戶畫像,用數據驅動畫像的生產,具體方法如圖1所示,首先,圍繞學生綜合素質評價體系采集用戶的靜態(tài)數據(學號、身份證號碼、年齡、專業(yè)、籍貫等)和動態(tài)數據(思想道德表現(xiàn)特征、學習特征等);然后對采集到的數據進行數據清洗、數據交換和數據集成,確保數據的準確性、完整性和可交換性;最后將采集到的數據進行標簽定義和模型特征構建,通過數據的關聯(lián)和規(guī)則的定義構建學生綜合素質的整體畫像模型。
2.1 數據采集
本研究根據學生綜合素質評價體系[6]提出畫像所需的五種數據分類,根據數據分類確定數據來源,具體見表1。采集用戶的靜態(tài)信息(學號、身份證號碼、年齡、專業(yè)、籍貫等)和動態(tài)信息(思想道德表現(xiàn)特征、學習特征等),將學生信息轉化為標簽信息。
2.2 數據預處理
由于高校各業(yè)務系統(tǒng)數據存在數據標準不統(tǒng)一、數據源頭不清晰、數據重復不一致、等問題,需要對采集的數據進行預處理。參考DGI數據治理框架,數據預處理主要包括數據清洗、數據交換和數據集成三個階段。數據清洗階段主要是檢測各業(yè)務系統(tǒng)中數據存在的錯誤和不一致,排除和更正臟數據,提高數據的質量。數據交換階段是采用基于XML的數據交換框架,在不更改原有業(yè)務系統(tǒng)數據存儲和數據標準的情況下,使異構系統(tǒng)之間實現(xiàn)最大限度的協(xié)同與交換。數據集成階段是指將教務、科研、人事、財務、資產等多個重要業(yè)務系統(tǒng)的結構化數據采用模式集成方法、數據復制方法,交換到數據倉庫,將網絡系統(tǒng)日志、視頻圖像、文本等非結構化數據交換到數據倉庫。
2.3 畫像模型構建
本研究以科學性、實用性、精確性和可操作性為原則,采用基于融合的用戶畫像模型構建方法,畫像模型的構建圍繞用戶的基本屬性、行為特征、興趣維度等進行多維形式化描述。根據高職學生綜合素質的評價體系將采集到的數據分別進行標簽定義和模型特征構建,邏輯框架結構如圖2所示。標簽是特征模型的子集,多個數據集構成標簽,多個標簽組合成特征模型。按照學生綜合素質評價體系的構成,畫像模型分為思想道德特征模型、身心素質特征模型、學業(yè)水平特征模型、實踐能力特征模型、職業(yè)能力特征模型和指標評價特征模型。根據每個標簽的特點使用數據挖掘的算法(決策樹、聚類、支持向量機、分類與回歸樹等)對數據進行處理,計算標簽的維度值。以身心素質特征模型為例,心理測試標簽的維度值由學校的心理測評結構的狀態(tài)值構成;生活習慣標簽的維度值由網絡行為、打開水行為、消費行為等多個數據集構成,需進行數據的關聯(lián)和規(guī)則的定義。
3 結束語
學生綜合素質評價是職業(yè)院校教育教學的重要環(huán)節(jié),是對學生在校期間全面發(fā)展情況的全觀察、全紀錄和全分析。通過應用用戶畫像技術,使學生綜合素質評價的方式從人工統(tǒng)計和人為主觀評價變革為機器自動采集和定性向定量轉變;評價的結果從單一的分數和片面結論變革為綜合的、多維的、全過程的數據模型,能夠有效推進“以人為本”的現(xiàn)代職業(yè)教育體系的建設。
參考文獻(References):
[1] 楊鴻,朱德全,宋乃慶,周永平.大數據時代學生綜合素質評價方法論、價值與實踐導向[J].中國電化教育,2018.1:27-34.
[2] 王祖霖.大數據時代學生評價變革研究[D].湖南大學,2016.
[3] 余戡.大數據時代背景下大學生綜合素質評價體系研究--以安慶師范大學為例[D].安慶師范大學,2017.
[4] 劉海鷗,孫晶晶,蘇妍嫄,張亞明.國內外用戶畫像研究綜述[J].情報理論與實踐,2018.11:155-160
[5] 高廣尚.用戶畫像構建方法研究綜述[J].數據分析與知識發(fā)現(xiàn),2019.3:25-35
[6] 于運會.高職學生綜合素質評價研究與實踐[J].經濟師,2019.6:178-179