張務(wù)農(nóng)
基于大數(shù)據(jù)的教育科學(xué)研究以“大數(shù)據(jù)”作為研究活動(dòng)的基本質(zhì)料,以大數(shù)據(jù)記錄和實(shí)時(shí)分析作為研究活動(dòng)的基本形式,延續(xù)了經(jīng)典科學(xué)研究范式的“數(shù)據(jù)依賴”。但大數(shù)據(jù)研究方法的數(shù)據(jù)論基礎(chǔ)又不同于“小數(shù)據(jù)”,它蘊(yùn)含著人們對(duì)數(shù)據(jù)應(yīng)用認(rèn)識(shí)的“肯定—批判—再肯定”的辯證發(fā)展過(guò)程,由此構(gòu)成審視大數(shù)據(jù)方法的三個(gè)理論視點(diǎn)。
對(duì)數(shù)字化方法的質(zhì)疑是科學(xué)研究范式的危機(jī),也孕育著科學(xué)研究方法突破的契機(jī),大數(shù)據(jù)科學(xué)研究方法正是在這一危機(jī)、契機(jī)中間應(yīng)運(yùn)而生的。? 大數(shù)據(jù)方法構(gòu)建了有別于“小數(shù)據(jù)”方法的教育科學(xué)研究范式,但在超越中也存在著新的數(shù)據(jù)方法危機(jī),需要加以甄別并恰當(dāng)應(yīng)對(duì)。
大數(shù)據(jù)方法 需其他研究方法補(bǔ)充
大數(shù)據(jù)方法的物質(zhì)基礎(chǔ)在于“一個(gè)布滿傳感器”的世界,可隨時(shí)隨地記錄人類個(gè)體極其復(fù)雜和細(xì)微的行為,從而對(duì)任何觸網(wǎng)的物體和個(gè)體實(shí)現(xiàn)數(shù)字化描述。技術(shù)的如此進(jìn)步造就了新的數(shù)據(jù)功能論,即大數(shù)據(jù)的龐雜性、混沌性、跨界性使得大數(shù)據(jù)具有描述和揭示復(fù)雜社會(huì)現(xiàn)象的可能與潛力。但現(xiàn)代技術(shù)條件下的數(shù)據(jù)化過(guò)程仍存在一些問(wèn)題。
首先,盡管在數(shù)字化時(shí)代,世界可以看成是由連續(xù)數(shù)字構(gòu)成的,但技術(shù)工具記錄的數(shù)據(jù)仍然是“有限數(shù)據(jù)”,仍難以實(shí)現(xiàn)付諸對(duì)象的無(wú)縫數(shù)據(jù)化。
其次,現(xiàn)代智能機(jī)器對(duì)人類個(gè)體的數(shù)字化描述主要基于“行為數(shù)據(jù)”而不是“思維數(shù)據(jù)”。人的思維涉及情緒、情感,涉及生活史、生命史,也涉及理性和非理性,變化莫測(cè)、難以捉摸,因此思維的徹底數(shù)據(jù)化仍存在極大困難。完全的數(shù)據(jù)化方法仍是以大數(shù)據(jù)為表現(xiàn)形式的“行為主義”科學(xué)方法。在教育研究中,學(xué)生的內(nèi)部思維過(guò)程才是研究重點(diǎn)。對(duì)內(nèi)部思維的研究也不是分析被現(xiàn)代人工智能借用的“形式化、數(shù)字化認(rèn)知程序”,而是理解充滿生命氣息、人文氣息的文化心理認(rèn)知過(guò)程。在這方面,標(biāo)榜超越人類智能的人工智能仍相形見(jiàn)絀,大數(shù)據(jù)尚不能記錄并呈現(xiàn)人類個(gè)體昨夜的美夢(mèng),這說(shuō)明教育研究作為人文的研究,不能僅靠數(shù)據(jù)化方法,教育研究仍需人文研究方法作為補(bǔ)充,并把它置于數(shù)據(jù)分析的基座之上,且使它成為整個(gè)數(shù)據(jù)分析過(guò)程的靈魂。
最后,大數(shù)據(jù)方法與“小數(shù)據(jù)”方法應(yīng)互相補(bǔ)充。數(shù)據(jù)的增加,意味著數(shù)據(jù)結(jié)構(gòu)更復(fù)雜以及數(shù)據(jù)資源量的增加,但價(jià)值密度降低,這需要“小數(shù)據(jù)”方法來(lái)彌補(bǔ)。由此也可看出從“小數(shù)據(jù)”方法到大數(shù)據(jù)方法并非徹底的范式轉(zhuǎn)換,還涉及范式融合。
大數(shù)據(jù)方法 應(yīng)融入教育價(jià)值原則
與經(jīng)典科學(xué)研究方法不同,大數(shù)據(jù)方法取得的結(jié)果并非必然的邏輯因果說(shuō)明,而是關(guān)聯(lián)性說(shuō)明。
因果性是事物之間明確的、確定的邏輯關(guān)聯(lián),代表著必然性;相關(guān)性則是事物之間非明確的聯(lián)系,代表著蓋然性。必然性,是教育活動(dòng)中必須遵從的價(jià)值原則,因?yàn)椤斑`背規(guī)律必然得到規(guī)律的懲罰”。
蓋然性說(shuō)明的是概率性事件,包括大概率事件和小概率事件。大概率事件和小概率事件對(duì)教育活動(dòng)來(lái)說(shuō)具有同等重要的意義。大概率事件使得我們?cè)诮逃顒?dòng)中要面向大多數(shù)、面向一般問(wèn)題、共性問(wèn)題,小概率事件則使我們重視教育活動(dòng)中的個(gè)別事件、偶發(fā)事件。
而教育活動(dòng)領(lǐng)域正是個(gè)別事件和偶發(fā)事件集中的場(chǎng)所。甚至在很多情況下,個(gè)別事件和偶發(fā)事件正是教育追求的東西,因?yàn)樗鼈兺碇鴮W(xué)生發(fā)展的可能性。而大數(shù)據(jù)方法,從根本上看主要聚焦大概率事件,它反映的是數(shù)據(jù)的聚類、分類和趨勢(shì)?!靶?shù)據(jù)”方法尋找的則是異常數(shù)據(jù)和小概率事件,如傳統(tǒng)數(shù)理統(tǒng)計(jì)學(xué)中的P值正是追蹤小概率事件的重要指標(biāo)。因此,不妨說(shuō)大數(shù)據(jù)方法能更好反映大數(shù)據(jù)的優(yōu)勢(shì),因?yàn)樵跀?shù)據(jù)海洋里“小數(shù)據(jù)”往往被湮沒(méi)。這也是由大數(shù)據(jù)的本質(zhì)特點(diǎn)決定的,大數(shù)據(jù)由于其價(jià)值密度低,不可能篩查數(shù)據(jù)中的所有異?,F(xiàn)象。因此,大數(shù)據(jù)方法對(duì)教育活動(dòng)中的小概率事件及其價(jià)值并不夠敏感。這說(shuō)明,大數(shù)據(jù)方法在教育研究中的應(yīng)用要重視兩點(diǎn):一是在研究設(shè)計(jì)中應(yīng)當(dāng)注重對(duì)“小數(shù)據(jù)”、異常數(shù)據(jù)的檢測(cè),另外是給予反映小概率事件的數(shù)據(jù)以足夠重視。
大數(shù)據(jù)方法 需權(quán)衡具體適用情景
大數(shù)據(jù)并不是萬(wàn)能數(shù)據(jù),大數(shù)據(jù)的數(shù)據(jù)來(lái)源、數(shù)據(jù)特征、數(shù)據(jù)功能決定了大數(shù)據(jù)有相對(duì)優(yōu)勢(shì)的使用領(lǐng)域。大數(shù)據(jù)的解釋力和預(yù)測(cè)力還需要具體領(lǐng)域進(jìn)行具體分析。
一般認(rèn)為,社會(huì)科學(xué)(包括教育科學(xué))是具有低解釋力和低可預(yù)測(cè)性的科學(xué)領(lǐng)域,從大數(shù)據(jù)本身的功能看,則具有低解釋力和相對(duì)高的預(yù)測(cè)力。雖然“社會(huì)學(xué)很少做預(yù)測(cè),即便預(yù)測(cè)了也很少成功”,但大數(shù)據(jù)還是可能幫助其提高預(yù)測(cè)力的。而大數(shù)據(jù)的低解釋力則會(huì)加劇社會(huì)科學(xué)的低解釋力。由于教育學(xué)相對(duì)其他社會(huì)科學(xué)具有更濃厚的人文性、更弱的規(guī)律性,因此大數(shù)據(jù)對(duì)教育現(xiàn)象的解釋力進(jìn)一步降低。
不過(guò),大數(shù)據(jù)方法在教育科學(xué)領(lǐng)域內(nèi)部的適用性可以進(jìn)一步細(xì)分。其一,從宏觀教育現(xiàn)象與微觀教育現(xiàn)象的對(duì)比看,大數(shù)據(jù)顯然對(duì)宏觀問(wèn)題具有更好的解釋力和預(yù)測(cè)力,這是由大數(shù)據(jù)之大形成的“宏觀視野”決定的。比如,國(guó)家根據(jù)地方的經(jīng)濟(jì)數(shù)據(jù)對(duì)各地進(jìn)行動(dòng)態(tài)教育財(cái)政撥款。但運(yùn)用國(guó)家宏觀數(shù)據(jù)指導(dǎo)具體教學(xué)則不合理。其二,圍繞微觀個(gè)體的大數(shù)據(jù)仍遠(yuǎn)遠(yuǎn)沒(méi)有形成,說(shuō)明大數(shù)據(jù)在微觀教學(xué)領(lǐng)域有比較低的解釋力和預(yù)測(cè)力。其三,大數(shù)據(jù)在教育理論、教育實(shí)踐、教育評(píng)價(jià)等領(lǐng)域的解釋力和功用也有差異。大數(shù)據(jù)在教育評(píng)價(jià)領(lǐng)域的解釋力好于教學(xué)實(shí)踐領(lǐng)域,因?yàn)樵u(píng)價(jià)本身就是數(shù)據(jù)化過(guò)程,而在實(shí)踐領(lǐng)域的應(yīng)用效果則好于理論研究領(lǐng)域,因?yàn)榻逃龑?shí)踐領(lǐng)域是關(guān)系復(fù)雜的混沌領(lǐng)域,契合大數(shù)據(jù)的特點(diǎn),而大數(shù)據(jù)分析沒(méi)有確定的理論模型,也不指向理論因果,說(shuō)明其理論性較弱。
大數(shù)據(jù)對(duì)外生性因素的解釋力好于內(nèi)生性因素。由于大數(shù)據(jù)善于對(duì)學(xué)生行為進(jìn)行記錄,因此,大數(shù)據(jù)分析學(xué)生學(xué)習(xí)外生性因素的效果要好于內(nèi)生性因素。
大數(shù)據(jù)方法 應(yīng)考量相關(guān)數(shù)據(jù)積累
大數(shù)據(jù)方法應(yīng)用不能只從理想視角分析,而應(yīng)對(duì)理想大數(shù)據(jù)和現(xiàn)實(shí)大數(shù)據(jù)進(jìn)行區(qū)分,以免造成認(rèn)識(shí)上和實(shí)踐上的混亂。其一,從理想大數(shù)據(jù)看,大數(shù)據(jù)基于對(duì)世界萬(wàn)物的感知和記錄。在技術(shù)基礎(chǔ)上,可穿戴設(shè)備等傳感器無(wú)處不在,世界的每個(gè)角落、物的樣態(tài)和人的一舉一動(dòng)都在智慧網(wǎng)絡(luò)的觀測(cè)記錄之內(nèi),數(shù)據(jù)在信息公路上自由流通。然而,大數(shù)據(jù)的現(xiàn)實(shí)是:傳感器沒(méi)有無(wú)所不在,智慧網(wǎng)絡(luò)遠(yuǎn)未無(wú)孔不入,大數(shù)據(jù)仍是一張稀疏的數(shù)據(jù)網(wǎng)絡(luò)。大數(shù)據(jù)只是相對(duì)的大數(shù)據(jù)、局部的大數(shù)據(jù)。另外,大數(shù)據(jù)方法產(chǎn)生于商業(yè)領(lǐng)域,在商業(yè)領(lǐng)域應(yīng)用廣泛,在教育領(lǐng)域發(fā)展滯后。其二,從大數(shù)據(jù)的挖掘和分析看,大數(shù)據(jù)的算法有限,諸如貝葉斯算法和決策樹(shù)等有限種類。很難想象大數(shù)據(jù)無(wú)限的可能會(huì)被有限的算法捕捉到。因此,舍恩伯格和克里斯·安德森所宣稱的“相關(guān)關(guān)系代替因果關(guān)系”的豪言壯語(yǔ)仍然缺乏物質(zhì)技術(shù)基礎(chǔ)。其三,數(shù)據(jù)倫理問(wèn)題,包括數(shù)據(jù)隱私、數(shù)據(jù)開(kāi)放、數(shù)據(jù)共享等。由于種種人為的、技術(shù)的和倫理的障礙,數(shù)據(jù)沒(méi)有匯聚成大數(shù)據(jù)的海洋,而是被分割成了無(wú)數(shù)的數(shù)據(jù)湖泊,許多關(guān)于大數(shù)據(jù)方法的理想功用仍無(wú)法實(shí)現(xiàn)。
因此,著眼于教育科學(xué)研究的發(fā)展,應(yīng)重視教育領(lǐng)域內(nèi)的大數(shù)據(jù)庫(kù)建設(shè),開(kāi)發(fā)針對(duì)教育科學(xué)研究和教育活動(dòng)監(jiān)測(cè)的數(shù)據(jù)搜集處理軟件。
同時(shí),盡量消除教育領(lǐng)域內(nèi)各部門(mén)之間的數(shù)據(jù)壁壘,并通過(guò)合適的方式與學(xué)校外部數(shù)據(jù)實(shí)現(xiàn)對(duì)接。在方法論上,把領(lǐng)域內(nèi)大數(shù)據(jù)的成熟度作為大數(shù)據(jù)方法應(yīng)用及對(duì)其結(jié)果進(jìn)行解釋的重要依據(jù)。