摘要:作為《中華人民共和國數(shù)據(jù)安全法》規(guī)定的數(shù)據(jù)安全保護(hù)基本制度之一,數(shù)據(jù)分類分級保護(hù)制度的實(shí)施是數(shù)據(jù)安全治理和有效利用的基礎(chǔ)環(huán)節(jié)??紤]到教育行業(yè)掌握了大量的教育教學(xué)業(yè)務(wù)數(shù)據(jù)和師生個人信息,故開展教育數(shù)據(jù)分類分級工作勢在必行。為此,文章遵循“現(xiàn)狀分析-問題挖掘-方法構(gòu)建-案例驗證”的研究思路,首先梳理了數(shù)字化轉(zhuǎn)型背景下教育數(shù)據(jù)的發(fā)展現(xiàn)狀和國內(nèi)外教育數(shù)據(jù)分類分級的研究現(xiàn)狀;接著,文章從制度、管理、技術(shù)三個層面深入剖析了教育數(shù)據(jù)分類分級面臨的困境;然后,文章從教育數(shù)據(jù)分類分級規(guī)則和工作流程兩個方面,構(gòu)建了一套教育數(shù)據(jù)分類分級方法;最后,文章選取3個教育行政部門和6所高校作為試點(diǎn)單位,驗證了教育數(shù)據(jù)分類分級方法的可行性和有效性。教育數(shù)據(jù)分類分級方法的提出,旨在解決教育行業(yè)數(shù)據(jù)分類分級中缺乏統(tǒng)一標(biāo)準(zhǔn)的問題,可為教育系統(tǒng)各單位開展數(shù)據(jù)分類分級提供理論指導(dǎo)。
關(guān)鍵詞:數(shù)字化轉(zhuǎn)型;教育數(shù)據(jù);分類分級;試點(diǎn)驗證
【中圖分類號】G40-057 【文獻(xiàn)標(biāo)識碼】A 【論文編號】1009—8097(2025)01—0089—09 【DOI】10.3969/j.issn.1009-8097.2025.01.010
隨著信息技術(shù)的快速發(fā)展,數(shù)據(jù)作為國家基礎(chǔ)性戰(zhàn)略資源和新的社會生產(chǎn)要素,其安全性、可控性對于國家長治久安與綜合國力競爭極為重要,數(shù)據(jù)安全已經(jīng)成為國家安全的重要組成部分。2021年4月,教育部等七部門聯(lián)合印發(fā)《關(guān)于加強(qiáng)教育系統(tǒng)數(shù)據(jù)安全工作的通知》,明確提出“建立教育系統(tǒng)數(shù)據(jù)安全責(zé)任體系和數(shù)據(jù)分類分級制度,形成教育系統(tǒng)數(shù)據(jù)資源目錄”的工作目標(biāo)[1]。同年9月,《中華人民共和國數(shù)據(jù)安全法》(下文簡稱《數(shù)據(jù)安全法》)正式施行,將數(shù)據(jù)分類分級保護(hù)制度確定為數(shù)據(jù)安全保護(hù)基本制度之一,并明確要求“各地區(qū)、各部門應(yīng)當(dāng)按照數(shù)據(jù)分類分級保護(hù)制度,確定本地區(qū)、本部門以及相關(guān)行業(yè)、領(lǐng)域的重要數(shù)據(jù)具體目錄,對列入目錄的數(shù)據(jù)進(jìn)行重點(diǎn)保護(hù)”[2]。作為《數(shù)據(jù)安全法》提出的八個重要數(shù)據(jù)領(lǐng)域之一,教育數(shù)據(jù)包含大量敏感的個人信息,如身份證號、家庭住址、手機(jī)號碼、成績、健康狀況等,一旦泄露或被濫用,不僅會對師生和家長的個人隱私造成極大侵犯,還可能會影響教育公平和教育機(jī)構(gòu)的公信力[3],因此開展教育數(shù)據(jù)分類分級工作,對于提升教育管理、教育教學(xué)、教育科研等具有重要意義[4]。在此背景下,教育行業(yè)亟待加強(qiáng)數(shù)據(jù)分類分級,將其納入數(shù)據(jù)安全管理體系的核心環(huán)節(jié),這既是數(shù)據(jù)合規(guī)、安全使用和精細(xì)化管控的基礎(chǔ),也是數(shù)據(jù)安全的堅實(shí)保障[5]?;诖耍狙芯恳詳?shù)字化轉(zhuǎn)型背景下的教育數(shù)據(jù)分類分級為切入點(diǎn),結(jié)合教育行政部門和學(xué)校的調(diào)研數(shù)據(jù),深入分析我國教育數(shù)據(jù)分類分級的現(xiàn)狀和存在的問題,并提出一套教育數(shù)據(jù)分類分級方法,以期為教育數(shù)據(jù)分類分級工作提供參考。
一 現(xiàn)實(shí)困境:教育數(shù)據(jù)分類分級的發(fā)展桎梏
1 數(shù)字化轉(zhuǎn)型背景下教育數(shù)據(jù)的發(fā)展現(xiàn)狀
①數(shù)據(jù)量急劇增長。隨著教育數(shù)字化轉(zhuǎn)型的推進(jìn),教育數(shù)據(jù)體量增幅巨大,主要來自于三個方面:一是數(shù)字教育資源的積累,如以國家智慧教育公共服務(wù)平臺為代表的服務(wù)平臺,匯聚了大量在線課程、音視頻資源、電子圖書等數(shù)字資源;二是教育教學(xué)過程的在線化,如各種在線學(xué)習(xí)平臺、教育應(yīng)用軟件、智能設(shè)備,收集了大量的學(xué)生學(xué)習(xí)行為數(shù)據(jù)、教師授課記錄等信息;三是教育管理過程的服務(wù)化,如教育管理信息系統(tǒng)和政務(wù)校務(wù)服務(wù)平臺,收集了大量的學(xué)生注冊、教師評價、科研數(shù)據(jù)等信息。教育數(shù)據(jù)體量劇增,不僅加大了數(shù)據(jù)存儲和管理的難度,也降低了數(shù)據(jù)的質(zhì)量和價值密度[6],使數(shù)據(jù)分類分級更加復(fù)雜、繁瑣。
②數(shù)據(jù)類型呈現(xiàn)多樣化。數(shù)字化轉(zhuǎn)型背景下的教育數(shù)據(jù)類型繁多,既有結(jié)構(gòu)化的數(shù)據(jù)(如學(xué)生信息、考試成績、財務(wù)數(shù)據(jù)等),也有非結(jié)構(gòu)化的數(shù)據(jù)(如教學(xué)資料、學(xué)生作業(yè)、視頻課程等)。每一類數(shù)據(jù)都有其獨(dú)特的處理和分析方法,需要在合理、準(zhǔn)確地識別分類后,進(jìn)一步開展教育數(shù)據(jù)分類分級保護(hù)。
③個人信息數(shù)據(jù)規(guī)模巨大。教育數(shù)據(jù)包含數(shù)以億計的師生信息,對于個人隱私保護(hù)的要求非常高。《2023年全國教育事業(yè)發(fā)展統(tǒng)計公報》的相關(guān)數(shù)據(jù)顯示,2023年我國各級各類學(xué)歷教育在校生2.91億人、專任教師1891.78萬人[7],教育管理信息系統(tǒng)和政務(wù)校務(wù)服務(wù)平臺收集了姓名、身份證號等大量敏感的個人信息。隨著大數(shù)據(jù)、云計算、人工智能等技術(shù)的廣泛應(yīng)用,這些數(shù)據(jù)的收集、存儲、處理和傳輸面臨前所未有的挑戰(zhàn),數(shù)據(jù)一旦泄露,不僅會侵害學(xué)生的個人權(quán)益,還會影響教育機(jī)構(gòu)的聲譽(yù)和社會地位[8]。
2 國內(nèi)外教育數(shù)據(jù)分類分級的研究現(xiàn)狀
作為較早開展教育數(shù)據(jù)分類分級研究與探索的國家之一,美國于2005年正式啟動了“州縱向追蹤數(shù)據(jù)系統(tǒng)”(Statewide Longitudinal Data System,SLDS)項目,旨在建立一套全面、連貫的學(xué)生數(shù)據(jù)系統(tǒng),以改善教育政策的制定、實(shí)施和評估,其強(qiáng)調(diào)利用數(shù)據(jù)驅(qū)動決策,引發(fā)了對教育數(shù)據(jù)進(jìn)行分類分級研究的迫切需求。英國也在教育個人信息保護(hù)方面有較為領(lǐng)先的法律規(guī)定,如2018年修訂了《數(shù)據(jù)保護(hù)法》(Data Protection Act),以適應(yīng)歐盟的《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation),要求教育機(jī)構(gòu)在處理敏感的個人信息時,不僅要對數(shù)據(jù)進(jìn)行分類,還要進(jìn)行更細(xì)致的分級。
近年來,國內(nèi)學(xué)者對教育數(shù)據(jù)分類分級給予了持續(xù)關(guān)注,相關(guān)主題的研究呈爆發(fā)式增長[9],且已經(jīng)取得了一定的進(jìn)展,主要集中在以下方面:①探索如何制定科學(xué)合理的分類分級標(biāo)準(zhǔn),以適應(yīng)不同教育行政部門、高校和學(xué)科領(lǐng)域的需求[10]。②研究如何利用大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)提高數(shù)據(jù)分類分級的效率和準(zhǔn)確性,如有研究者指出,利用機(jī)器學(xué)習(xí)算法可以自動識別數(shù)據(jù)特征,輔助完成數(shù)據(jù)分類[11];利用數(shù)據(jù)脫敏技術(shù)可以保護(hù)敏感數(shù)據(jù),降低數(shù)據(jù)泄露風(fēng)險[12];在人工智能技術(shù)的輔助下處理數(shù)量龐大的復(fù)雜數(shù)據(jù),可使分類誤差得到有效控制[13]。③除了理論研究,相關(guān)研究者還在積極探索教育數(shù)據(jù)分類分級的實(shí)踐應(yīng)用,如通過構(gòu)建數(shù)據(jù)分類分級模型、開發(fā)數(shù)據(jù)管理平臺等,將研究成果應(yīng)用于實(shí)際的高校數(shù)據(jù)管理場景中[14]。
3 數(shù)字化轉(zhuǎn)型背景下教育數(shù)據(jù)分類分級面臨的困境
①制度困境:缺乏統(tǒng)一標(biāo)準(zhǔn)。目前,國家已發(fā)布《數(shù)據(jù)安全技術(shù)"數(shù)據(jù)分類分級規(guī)則》(下文簡稱《數(shù)據(jù)分類分級規(guī)則》)、《信息技術(shù) 大數(shù)據(jù) 數(shù)據(jù)分類指南》等國家標(biāo)準(zhǔn),能在一定程度上指導(dǎo)某些教育數(shù)據(jù)的分類分級保護(hù),但所涉范圍有限。與此同時,一些教育行政部門、高校也探索制定了本地區(qū)或本單位的數(shù)據(jù)分類分級規(guī)則,但這些規(guī)則并不具有普適性,教育行業(yè)仍然缺乏專門、統(tǒng)一的數(shù)據(jù)分類分級標(biāo)準(zhǔn)。
②管理困境:管理體系不健全。當(dāng)前,我國教育信息化普遍存在“重建設(shè)、輕安全”的現(xiàn)象[15]。部分高校雖然成立了網(wǎng)絡(luò)安全和信息化工作領(lǐng)導(dǎo)小組,但在實(shí)際運(yùn)作過程中尚未建立完善的數(shù)據(jù)安全保護(hù)體系,也未對教育數(shù)據(jù)分類分級工作給予足夠的重視,導(dǎo)致數(shù)據(jù)安全管理責(zé)任不明確、數(shù)據(jù)分類分級工作流程不清晰,即使強(qiáng)行開展分類分級工作也容易流于形式,無法有效落地。
③技術(shù)困境:技術(shù)支撐不足。隨著教育數(shù)據(jù)的不斷增長和復(fù)雜化,傳統(tǒng)的數(shù)據(jù)管理工具與技術(shù)已經(jīng)難以滿足分類分級的需求。當(dāng)前,大多數(shù)教育行政部門和高校缺乏自動化或半自動化的數(shù)據(jù)分類分級工具,同時缺乏與之配套的數(shù)據(jù)標(biāo)記、存儲、訪問控制等技術(shù)手段,難以高效地對海量、異構(gòu)的教育數(shù)據(jù)進(jìn)行精準(zhǔn)分類和合理分級,導(dǎo)致教育數(shù)據(jù)的分類分級工作往往依賴于人工判斷與手動操作,這不僅增加了操作難度和工作量,而且失誤率高,難以實(shí)現(xiàn)規(guī)?;?、高效化的數(shù)據(jù)管理。
二 方法構(gòu)建:教育數(shù)據(jù)分類分級規(guī)則和工作流程
1 教育數(shù)據(jù)分類規(guī)則
教育數(shù)據(jù)分類是指根據(jù)教育數(shù)據(jù)的屬性或特征,將其按一定的規(guī)則進(jìn)行區(qū)分和歸類,并建立起一定的分類體系與排列順序的過程。參考《數(shù)據(jù)分類分級規(guī)則》,各行業(yè)、各領(lǐng)域主管(監(jiān)管)部門根據(jù)本行業(yè)、本領(lǐng)域的業(yè)務(wù)屬性,對各自行業(yè)、領(lǐng)域的數(shù)據(jù)進(jìn)行細(xì)化分類,常見的業(yè)務(wù)屬性包括業(yè)務(wù)領(lǐng)域、責(zé)任部門、描述對象、流程環(huán)節(jié)、數(shù)據(jù)主體、內(nèi)容主題、數(shù)據(jù)用途、數(shù)據(jù)處理、數(shù)據(jù)來源等[16]。例如,《證券期貨業(yè)數(shù)據(jù)分類分級指引》行業(yè)標(biāo)準(zhǔn)的分類思路是從業(yè)務(wù)條線出發(fā),先進(jìn)行業(yè)務(wù)細(xì)分,之后進(jìn)行數(shù)據(jù)細(xì)分,形成由總到分的樹形邏輯體系結(jié)構(gòu)[17];而關(guān)于交通運(yùn)輸行業(yè)數(shù)據(jù)分類的研究,也是按照自上而下、面線分類相結(jié)合的方式,在業(yè)務(wù)范圍內(nèi)從管理對象、業(yè)務(wù)行為主題、數(shù)據(jù)信息類別三個不同維度進(jìn)行分類[18]。
教育行業(yè)中的核心業(yè)務(wù)場景是教學(xué)與科研,與之相匹配的兩個分類維度為數(shù)據(jù)主體和業(yè)務(wù)領(lǐng)域。據(jù)此,本研究從數(shù)據(jù)主體、業(yè)務(wù)領(lǐng)域兩個維度嘗試對教育數(shù)據(jù)進(jìn)行分類,同時為提高分類規(guī)則的有效性和準(zhǔn)確性,將分類維度進(jìn)一步延伸至二級,細(xì)化各類數(shù)據(jù)的分類歸屬。此外,通過教育系統(tǒng)的實(shí)際調(diào)研,本研究發(fā)現(xiàn)教育行政部門和學(xué)校兩類單位數(shù)據(jù)的側(cè)重點(diǎn)存在不同:教育行政部門需要掌握大量的管理類數(shù)據(jù),學(xué)校則更應(yīng)關(guān)注師生個人信息和教學(xué)科研數(shù)據(jù)。基于此,本研究將教育數(shù)據(jù)分為教育行政部門數(shù)據(jù)(下文簡稱“部門數(shù)據(jù)”)和學(xué)校數(shù)據(jù),分別提出分類規(guī)則。
(1)部門數(shù)據(jù)分類規(guī)則
部門數(shù)據(jù)分為四類:①教育基礎(chǔ)數(shù)據(jù),是指部門數(shù)據(jù)中高頻、通用、核心的數(shù)據(jù)集合,包括人員基礎(chǔ)數(shù)據(jù)和學(xué)校(機(jī)構(gòu))基礎(chǔ)數(shù)據(jù)兩個子類;②教育業(yè)務(wù)管理數(shù)據(jù),是指教育行政部門在開展教育管理業(yè)務(wù)過程中收集和產(chǎn)生的數(shù)據(jù)集合,包括學(xué)生管理數(shù)據(jù)、教職工管理數(shù)據(jù)、辦學(xué)條件管理數(shù)據(jù)、教育教學(xué)管理數(shù)據(jù)、考試招生管理數(shù)據(jù)、科研管理數(shù)據(jù)、教育統(tǒng)計數(shù)據(jù)七個子類;③教育行政管理數(shù)據(jù),是指教育行政部門日常運(yùn)行過程中收集和產(chǎn)生的數(shù)據(jù)集合,包括綜合辦公數(shù)據(jù)、財務(wù)資產(chǎn)數(shù)據(jù)、干部人事數(shù)據(jù)、后勤與安全管理數(shù)據(jù)、信息系統(tǒng)運(yùn)行數(shù)據(jù)五個子類;④其他數(shù)據(jù),是指不屬于以上分類的數(shù)據(jù)。
(2)學(xué)校數(shù)據(jù)分類規(guī)則
學(xué)校數(shù)據(jù)分為六類:①學(xué)生數(shù)據(jù),是指學(xué)校在開展學(xué)生管理與服務(wù)活動過程中收集和產(chǎn)生的數(shù)據(jù)集合,包括學(xué)生基礎(chǔ)數(shù)據(jù)和學(xué)生管理數(shù)據(jù)兩個子類;②教職工數(shù)據(jù),是指學(xué)校在開展教職工管理和服務(wù)活動中收集和產(chǎn)生的數(shù)據(jù)集合,包括教職工基礎(chǔ)數(shù)據(jù)和教職工管理數(shù)據(jù)兩個子類;③教學(xué)管理數(shù)據(jù),是指學(xué)校在開展教育教學(xué)活動過程中收集和產(chǎn)生的數(shù)據(jù)集合,包括教務(wù)數(shù)據(jù)、教學(xué)資源數(shù)據(jù)、教學(xué)質(zhì)量與評價數(shù)據(jù)三個子類;④科研管理數(shù)據(jù),是指學(xué)校在開展科研管理活動過程中收集和產(chǎn)生的數(shù)據(jù)集合;⑤校務(wù)管理數(shù)據(jù),是指學(xué)校在日常運(yùn)行過程中收集和產(chǎn)生的數(shù)據(jù)集合,包括學(xué)校概況數(shù)據(jù)、綜合辦公數(shù)據(jù)、財務(wù)資產(chǎn)數(shù)據(jù)、干部人事數(shù)據(jù)、黨建德育數(shù)據(jù)、外事管理數(shù)據(jù)、校友服務(wù)數(shù)據(jù)、后勤與安全管理數(shù)據(jù)、信息系統(tǒng)運(yùn)行數(shù)據(jù)九個子類;⑥其他數(shù)據(jù)是指不屬于以上分類的數(shù)據(jù)。
2 教育數(shù)據(jù)分級規(guī)則
教育數(shù)據(jù)分級是指根據(jù)教育數(shù)據(jù)對于經(jīng)濟(jì)社會發(fā)展的重要程度和遭到泄露、篡改、破壞或非法獲取、非法使用、非法共享所產(chǎn)生的危害,將其按一定的規(guī)則進(jìn)行級別劃分的過程。數(shù)據(jù)分級取決于影響對象和危害程度兩個核心要素,《數(shù)據(jù)分類分級規(guī)則》給出了詳細(xì)界定:影響對象通常包括國家安全、經(jīng)濟(jì)運(yùn)行、社會秩序、公共利益、組織權(quán)益、個人權(quán)益;而危害程度從高到低可以分為特別嚴(yán)重危害、嚴(yán)重危害、一般危害。結(jié)合數(shù)據(jù)的重要性、敏感性、規(guī)模等因素,本研究采用定量與定性相結(jié)合的方式,將教育數(shù)據(jù)分為核心數(shù)據(jù)(L5)、重要數(shù)據(jù)(L4)和一般數(shù)據(jù)(L3、L2、L1)五個級別(國家層面的數(shù)據(jù)級別可分為核心數(shù)據(jù)、重要數(shù)據(jù)和一般數(shù)據(jù))。考慮到教育數(shù)據(jù)體量大,因此本研究對一般數(shù)據(jù)做進(jìn)一步細(xì)分,得到教育數(shù)據(jù)級別確定參考表,如表1所示。
①從定性的角度來看,部門數(shù)據(jù)中覆蓋全國范圍的教育基礎(chǔ)數(shù)據(jù)若出現(xiàn)泄露或非法獲取等情況,可能對國家安全造成嚴(yán)重危害,直接影響政治安全,符合核心數(shù)據(jù)L5的定義。部門數(shù)據(jù)中覆蓋全國范圍的教育業(yè)務(wù)管理數(shù)據(jù)、省級范圍的教育基礎(chǔ)數(shù)據(jù)等,若出現(xiàn)泄露或非法獲取等情況,可能對經(jīng)濟(jì)運(yùn)行、社會秩序、公共利益造成嚴(yán)重危害,符合重要數(shù)據(jù)L4的定義。部門數(shù)據(jù)中覆蓋全國范圍的教育行政管理數(shù)據(jù)、省級范圍的教育業(yè)務(wù)管理數(shù)據(jù)、地市區(qū)縣級范圍的教育基礎(chǔ)數(shù)據(jù),以及學(xué)校數(shù)據(jù)中覆蓋高校范圍的學(xué)生數(shù)據(jù)、教職工數(shù)據(jù)、教學(xué)管理數(shù)據(jù)、科研管理數(shù)據(jù)等,若出現(xiàn)泄露或非法獲取等情況,可能對組織權(quán)益、個人權(quán)益造成特別嚴(yán)重危害,可以設(shè)定為一般數(shù)據(jù)L3。部門數(shù)據(jù)中覆蓋省級范圍的教育行政管理數(shù)據(jù)、地市區(qū)縣級范圍的教育業(yè)務(wù)管理數(shù)據(jù),以及學(xué)校數(shù)據(jù)中覆蓋高校范圍的校務(wù)管理數(shù)據(jù)和其他學(xué)校范圍(包括中職、中小學(xué)、幼兒園等)的學(xué)生數(shù)據(jù)、教職工數(shù)據(jù)、教學(xué)管理數(shù)據(jù)、科研管理數(shù)據(jù)等,若出現(xiàn)泄露或非法獲取等情況,可能對組織權(quán)益、個人權(quán)益造成嚴(yán)重危害,可以設(shè)定為一般數(shù)據(jù)L2。部門數(shù)據(jù)中覆蓋地市區(qū)縣級范圍的教育行政管理數(shù)據(jù),學(xué)校數(shù)據(jù)中覆蓋中職、中小學(xué)、幼兒園等學(xué)校范圍的校務(wù)管理數(shù)據(jù)等,若出現(xiàn)泄露或非法獲取等情況,可能對組織權(quán)益、個人權(quán)益造成一般危害,可以設(shè)定為一般數(shù)據(jù)L1。
②從定量的角度來看,《數(shù)據(jù)分類分級規(guī)則》并未給出核心數(shù)據(jù)或重要數(shù)據(jù)識別時具體定量的要求,但從通過其他數(shù)據(jù)安全和個人信息保護(hù)相關(guān)的規(guī)章制度可以估算出一個大概的數(shù)據(jù)量——100萬。例如,2021年,國家互聯(lián)網(wǎng)信息辦公室在發(fā)布的《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例(征求意見稿)》中明確要求“數(shù)據(jù)處理者處理一百萬人以上個人信息的,還應(yīng)當(dāng)遵守本條例第四章對重要數(shù)據(jù)的處理者作出的規(guī)定”[19];2023年,國家互聯(lián)網(wǎng)信息辦公室在發(fā)布的《個人信息保護(hù)合規(guī)審計管理辦法(征求意見稿)》中明確規(guī)定“處理超過100萬人個人信息的個人信息處理者,應(yīng)當(dāng)每年至少開展一次個人信息保護(hù)合規(guī)審計”[20]。據(jù)此,本研究考慮將100萬人及以上敏感個人信息作為納入重要數(shù)據(jù)L4的定量標(biāo)準(zhǔn)。依此量化指標(biāo)逐級遞增或遞減,本研究進(jìn)一步確定了核心數(shù)據(jù)L5和一般數(shù)據(jù)L3、L2的定量標(biāo)準(zhǔn)。
3 教育數(shù)據(jù)分類分級工作流程
綜合上述定性和定量兩個角度,本研究確定了教育數(shù)據(jù)分級規(guī)則,如表2所示。教育行政部門和學(xué)校可依據(jù)此規(guī)則實(shí)施本地區(qū)、本單位的數(shù)據(jù)分類分級工作,主要步驟如下:①梳理數(shù)據(jù)目錄,這是數(shù)據(jù)分類分級工作的基礎(chǔ)。教育行政部門和學(xué)校需對本單位主管的數(shù)據(jù)進(jìn)行系統(tǒng)梳理,形成數(shù)據(jù)資源目錄。②實(shí)施數(shù)據(jù)分類,這是數(shù)據(jù)分級的前置步驟。教育行政部門和學(xué)校需按照教育數(shù)據(jù)分類規(guī)則,對本單位數(shù)據(jù)資源目錄內(nèi)的數(shù)據(jù)逐一進(jìn)行識別、歸類。③實(shí)施數(shù)據(jù)分級,這是在數(shù)據(jù)分類的基礎(chǔ)上進(jìn)行定性、定量分級判斷。教育行政部門和學(xué)校需按照教育數(shù)據(jù)分級規(guī)則,完成分級。④形成數(shù)據(jù)分類分級目錄,這是完成分類分級工作后的成果整理,是對數(shù)據(jù)目錄的進(jìn)一步細(xì)化、完善。數(shù)據(jù)分類分級目錄并非一成不變,當(dāng)應(yīng)用場景發(fā)生變化或數(shù)據(jù)處理(如脫敏、去標(biāo)識、聚合分析等)過程發(fā)生變化時[21],教育行政部門和學(xué)校需即時調(diào)整數(shù)據(jù)分類分級目錄,保持動態(tài)更新。⑤開展數(shù)據(jù)分類分級保護(hù),這是整個工作流程的最終目的。教育行政部門和學(xué)校需根據(jù)相應(yīng)級別的數(shù)據(jù)安全保護(hù)要求,持續(xù)開展數(shù)據(jù)安全保護(hù)。
三 案例驗證:教育數(shù)據(jù)分類分級方法的試點(diǎn)驗證
本研究按照“同步研究、同步驗證”的原則,從教育行政部門和學(xué)校選取試點(diǎn)單位,來驗證前文構(gòu)建的教育數(shù)據(jù)分類分級方法的可行性和有效性。考慮到試點(diǎn)驗證單位地域分布、信息化現(xiàn)狀和數(shù)據(jù)安全工作基礎(chǔ)的相關(guān)情況,本研究選取3個省級教育行政部門、6所高校作為試點(diǎn)驗證單位并與其充分溝通以獲得支持,由試點(diǎn)驗證單位組織相關(guān)人員按照上述分類分級規(guī)則和工作流程對本單位的教育數(shù)據(jù)進(jìn)行分類分級,然后進(jìn)行二次驗證,得到最終的數(shù)據(jù)分類分級結(jié)果。
1 教育行政部門試點(diǎn)驗證
①數(shù)據(jù)分類結(jié)果。按照上述教育數(shù)據(jù)分類規(guī)則,3個省級教育行政部門對本單位的教育數(shù)據(jù)進(jìn)行分類驗證,共包含230個數(shù)據(jù)集。數(shù)據(jù)集按照本研究提出的分類規(guī)則全部完成分類后,共包含3個一級分類和10個二級分類,數(shù)據(jù)分類覆蓋率達(dá)100%,且并無數(shù)據(jù)需要被識別到“其他數(shù)據(jù)”中,具體的分類情況統(tǒng)計結(jié)果如表3所示。由此證明,本研究針對教育行政部門提出的教育數(shù)據(jù)分類方法較為全面、合理,具有較高的可行性,能夠滿足教育行政部門的工作特點(diǎn)和需求。
②數(shù)據(jù)分級結(jié)果。按照上述教育數(shù)據(jù)分級規(guī)則,3個省級教育行政部門對本單位的教育數(shù)據(jù)進(jìn)行分級驗證,共包含230個數(shù)據(jù)集。數(shù)據(jù)集按照本研究提出的分級規(guī)則全部完成分級后,3個省級教育行政部門的數(shù)據(jù)分級集中在L2、L3、L4級;其中,省份2、省份3的學(xué)生數(shù)量超過1000萬量級,故將相關(guān)數(shù)據(jù)集定為L5級,具體的分級情況統(tǒng)計結(jié)果如表4所示。由此證明,本研究針對教育行政部門提出的教育數(shù)據(jù)分級方法均滿足定性、定量兩方面的標(biāo)準(zhǔn),適應(yīng)教育行業(yè)的實(shí)際情況,具有較高的可行性和實(shí)踐價值。
2 學(xué)校試點(diǎn)驗證
①數(shù)據(jù)分類結(jié)果。按照上述教育數(shù)據(jù)分類規(guī)則,6所高校對本校的教育數(shù)據(jù)進(jìn)行分類驗證,共包含1386條數(shù)據(jù)。數(shù)據(jù)集按照本研究提出的分類規(guī)則全部完成分類后,共包含5個一級分類和15個二級分類,覆蓋率達(dá)100%,且并無數(shù)據(jù)需要被識別到“其他數(shù)據(jù)”中,具體的分類情況統(tǒng)計結(jié)果如表5所示。由此證明,本研究針對學(xué)校提出的教育數(shù)據(jù)分類方法具有實(shí)用性和可操作性,學(xué)??梢愿鶕?jù)分類了解自身的數(shù)據(jù)資源分布狀況,從而更好地支持教學(xué)、科研、管理等工作。
②數(shù)據(jù)分級結(jié)果。按照上述教育數(shù)據(jù)分級規(guī)則,6所高校對本校的教育數(shù)據(jù)進(jìn)行分級驗證,共包含1386條數(shù)據(jù)。數(shù)據(jù)集按照本研究提出的分級規(guī)則全部完成分級后,6所高校的數(shù)據(jù)分級主要集中在L2、L3級;其中,高校4的某個科研數(shù)據(jù)集包含100萬人以上的敏感個人信息,故定為L4級,具體的分級情況統(tǒng)計結(jié)果如表6所示。由此證明,本研究針對學(xué)校提出的教育數(shù)據(jù)分級方法具有靈活性和可行性,能貼合學(xué)校數(shù)據(jù)現(xiàn)狀,便于學(xué)校開展后續(xù)的數(shù)據(jù)保護(hù)工作。
總結(jié)上述試點(diǎn)驗證單位的數(shù)據(jù)分類分級結(jié)果,可知:①數(shù)據(jù)分類方面,除了“其他數(shù)據(jù)”這個二級分類,教育行政部門的14個二級分類、學(xué)校的17個二級分類均能涵蓋所有試點(diǎn)的填報數(shù)據(jù),且并無數(shù)據(jù)需要被識別到“其他數(shù)據(jù)”中。其中,省級教育行政部門數(shù)據(jù)分類中位列前三的分別為人員基礎(chǔ)數(shù)據(jù)、學(xué)生管理數(shù)據(jù)、教職工管理數(shù)據(jù),符合教育行政部門掌握本地區(qū)教職工和學(xué)生全量數(shù)據(jù)的管理職能;高校數(shù)據(jù)分類中位列前三的分別為科研管理數(shù)據(jù)、財務(wù)資產(chǎn)數(shù)據(jù)、教務(wù)數(shù)據(jù),符合高??蒲泻徒虒W(xué)的兩條主線核心業(yè)務(wù)。②數(shù)據(jù)分級方面,省級教育行政部門數(shù)據(jù)集中在L2、L3、L4級,識別認(rèn)定的核心數(shù)據(jù)L5級均為規(guī)模超1000萬的學(xué)生數(shù)據(jù);高校數(shù)據(jù)集中在L2、L3級,部分科研數(shù)據(jù)因為包含大量敏感個人信息被識別認(rèn)定為重要數(shù)據(jù)L4級,無L5級別數(shù)據(jù),符合教育系統(tǒng)的實(shí)際特點(diǎn)。案例驗證結(jié)果表明,本研究提出的教育數(shù)據(jù)分類分級方法具有較高的可行性和有效性。
四 結(jié)語
隨著數(shù)字技術(shù)全面融入教學(xué)、科研、管理、服務(wù)等各方面,教育行業(yè)積累了大量業(yè)務(wù)數(shù)據(jù)和個人信息,面臨的數(shù)據(jù)安全威脅持續(xù)加大,數(shù)據(jù)分類分級作為數(shù)據(jù)安全治理的第一步,是當(dāng)前數(shù)據(jù)安全治理的痛點(diǎn)和難點(diǎn)。而當(dāng)前教育系統(tǒng)分類分級工作存在缺乏統(tǒng)一標(biāo)準(zhǔn)的問題,在實(shí)際推進(jìn)過程中面臨很大的困境。為此,本研究參考《數(shù)據(jù)分類分級規(guī)則》,結(jié)合教育行業(yè)實(shí)際情況,提出了一套教育數(shù)據(jù)分類分級方法,并通過部分教育行政部門和學(xué)校的試點(diǎn)應(yīng)用,驗證了教育數(shù)據(jù)分類分級方法具有較高的可行性和有效性,可為教育系統(tǒng)各單位開展教育數(shù)據(jù)分類分級提供理論支持和實(shí)踐指導(dǎo)。然而,教育數(shù)據(jù)分類分級保護(hù)是一項繁雜的工作,且并非一成不變,故對教育數(shù)據(jù)分類分級進(jìn)行全程跟蹤和動態(tài)更新很有必要。此外,教育數(shù)據(jù)分類分級是實(shí)施教育數(shù)據(jù)安全治理的基礎(chǔ),但沒有觸及教育數(shù)據(jù)安全保護(hù)能力建設(shè)與風(fēng)險評估?;诖耍罄m(xù)研究將從以下兩個方面持續(xù)發(fā)力進(jìn)行深入探索:一是擴(kuò)大試點(diǎn)驗證范圍,持續(xù)優(yōu)化教育數(shù)據(jù)分類分級規(guī)則和工作流程,并嘗試構(gòu)建基于人工智能技術(shù)的教育數(shù)據(jù)分類分級方法,以確保數(shù)據(jù)分類分級方法的準(zhǔn)確性、合理性、有效性;二是制定教育數(shù)據(jù)安全保護(hù)要求,提出適應(yīng)于不同類型、不同級別的教育數(shù)據(jù)安全保護(hù)基線要求與風(fēng)險評估方法,為教育數(shù)據(jù)安全保護(hù)提供理論規(guī)范和實(shí)踐指導(dǎo)。
參考文獻(xiàn)
[1]教育部.教育部等七部門關(guān)于加強(qiáng)教育系統(tǒng)數(shù)據(jù)安全工作的通知[OL].
lt;https://xxzx.hebcm.edu.cn/col/1559021415599/2023/05/16/1684228560091.htmlgt;
[2]全國人民代表大會.中華人民共和國數(shù)據(jù)安全法[OL].
lt;http://www.npc.gov.cn/npc/c2/c30834/202106/t20210610_311888.htmlgt;
[3]馮鑫,王海燕,牛凡潔.對教育大數(shù)據(jù)中隱私泄露的探究[J].中國醫(yī)學(xué)教育技術(shù),2020,(5):566-571.
[4]馬建立.基于《數(shù)據(jù)安全法》的教育數(shù)據(jù)分類分級研究[J].天津電大學(xué)報,2023,(1):55-60.
[5]趙潔,張凱,田鵬.高校數(shù)據(jù)安全治理實(shí)踐[J].網(wǎng)絡(luò)空間安全,2019,(3):81-84.
[6]吳信東,董丙冰,堵新政,等.數(shù)據(jù)治理技術(shù)[J].軟件學(xué)報,2019,(9):2830-2856.
[7]教育部.2023年全國教育事業(yè)發(fā)展統(tǒng)計公報[OL].
lt;http://www.moe.gov.cn/jyb_sjzl/sjzl_fztjgb/202410/t20241024_1159002.htmlgt;
[8]徐有芳.教育數(shù)字化轉(zhuǎn)型中的數(shù)據(jù)安全挑戰(zhàn)與應(yīng)對策略[J].河西學(xué)院學(xué)報,2024,(2):85-90.
[9]嚴(yán)煒煒,謝順欣,潘靜,等.數(shù)據(jù)分類分級:研究趨勢、政策標(biāo)準(zhǔn)與實(shí)踐進(jìn)展[J].數(shù)字圖書館論壇,2022,(9):2-12.
[10]李松濤,謝宗曉.數(shù)據(jù)分類/分級及其相關(guān)標(biāo)準(zhǔn)解析[J].中國質(zhì)量與標(biāo)準(zhǔn)導(dǎo)報,2019,(4):14-16.
[11]祁瑞華.基于機(jī)器學(xué)習(xí)算法的分類知識發(fā)現(xiàn)及其在文本分析中的應(yīng)用[M].北京:清華大學(xué)出版社,2015:16-24.
[12]熊能,王玉林.基于數(shù)據(jù)脫敏技術(shù)的電子病歷隱私保護(hù)應(yīng)用與研究[J].中國高新科技,2023,(6):122-124、130.
[13]陸駿.基于人工智能的網(wǎng)絡(luò)復(fù)雜數(shù)據(jù)分類方法研究[J].信息記錄材料,2022,(8):195-197.
[14]范新民,林暉,陳圣楠,等.基于教育云平臺數(shù)據(jù)分類分級體系的訪問控制模型架構(gòu)[J].信息安全研究,2022,(4):400-407.
[15]洪偉,任劍洪,徐麗娜,等.數(shù)據(jù)安全法實(shí)施背景下的教育數(shù)據(jù)分類分級研究[J].中國教育信息化,2022,(3):41-50.
[16]國家標(biāo)準(zhǔn)管理委員會.GB/T 43697-2024數(shù)據(jù)安全技術(shù)"數(shù)據(jù)分類分級規(guī)則[S].北京:中國標(biāo)準(zhǔn)出版社,2024:2-3.
[17]中國證券監(jiān)督管理委員會.JR/T 0158-2018證券期貨業(yè)數(shù)據(jù)分類分級指引[S].北京:中國金融出版社,2018:4.
[18]白紫秀,王濤,郭明多,等.交通運(yùn)輸政務(wù)數(shù)據(jù)分類分級方法研究[J].信息安全研究,2023,(8):808-813.
[19]國家互聯(lián)網(wǎng)信息辦公室.國家互聯(lián)網(wǎng)信息辦公室關(guān)于《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例(征求意見稿)》公開征求意見的通知[OL]. lt;https://www.cac.gov.cn/2021-11/14/c_1638501991577898.htmgt;
[20]國家互聯(lián)網(wǎng)信息辦公室.國家互聯(lián)網(wǎng)信息辦公室關(guān)于《個人信息保護(hù)合規(guī)審計管理辦法(征求意見稿)》公開征求意見的通知[OL]. lt;https://www.cac.gov.cn/2023-08/03/c_1692628348448092.htmgt;
[21]高磊,趙章界,林野麗,等.基于《數(shù)據(jù)安全法》的數(shù)據(jù)分類分級方法研究[J].信息安全研究,2021,(10):933-940.
Research on the Classification and Grading of Educational Data under the Background of Digital Transformation
YANG"Wei-Ping""""ZENG"De-Hua """DUAN"Ting-Ting """ZHAO"Yu
(Cyber Security Department, Center for Information of Education Management, Ministry of Education, Beijing, China 100034)
Abstract:"As one of the basic systems for data security protection stipulated in the Data Security Law of the People’s Republic of China, the implementation of the data classification and grading protection system is the fundamental part for data security governance and effective utilization. Considering that the education industry has mastered a large amount of education and teaching business data, as well as personal information of teachers and students, it is imperative to carry out the classification and grading of educational data. Therefore, following the research idea of “status analysis-problem mining-method construction-case verification”, this paper firstly combed the development status of educational data under the background of digital transformation, and the research status of classification and grading of educational data at home and abroad. Secondly, this paper deeply analyzed the difficulties in classifying and grading educational data from three aspects of system, management and technology. Then, a set of methods for classification and grading of educational data were constructed from two aspects of rules and workflow for classification and grading of educational data. Finally, three education"administrative departments and six universities were selected as pilot units to verify the feasibility and effectiveness of the methods for classification and grading of educational data. The proposed methods for classification and grading of education data were aimed to solve the problem of lack of unified standards to classify and grade educational industry data, and provide theoretical guidance for all units of the education system to carry out data classification and grading.
Keywords:"digital transformation;"educational data;"classification and grading;"pilot verification
*基金項目:本文為全國教育科學(xué)規(guī)劃課題“支撐教育高質(zhì)量發(fā)展的國家教育管理信息化體系研究”(項目編號:CCA210253)的階段性研究成果。
作者簡介:楊偉平,工程師,碩士,研究方向為網(wǎng)絡(luò)安全、人工智能安全等,郵箱為yangweiping@moe.edu.cn。
收稿日期:2024年8月2日
編輯:小時