吳 忭 David Shaffer
(1.華東師范大學(xué) 教育信息技術(shù)學(xué)系,上海 200062;2.威斯康辛大學(xué)麥迪遜分校 教育心理系,美國(guó))
我們置身于數(shù)據(jù)大爆炸的時(shí)代。新興技術(shù)加速并徹底改變知識(shí)的生產(chǎn)周期及獲取方式,這也使在諸如教育、政府管理、經(jīng)濟(jì)、公共安全、政治等領(lǐng)域,數(shù)據(jù)逐步取代經(jīng)驗(yàn),成為幫助人類(lèi)作出重大決定的依據(jù)。然而,對(duì)大多數(shù)人而言,理解和分析數(shù)據(jù),實(shí)現(xiàn)從數(shù)據(jù)到信息、信息到知識(shí)、知識(shí)到智慧的升華更像是一門(mén)黑暗藝術(shù)。
在探討數(shù)據(jù)的作用之前,我們需要對(duì)“什么是數(shù)據(jù)”有深刻的理解。這常常像是一個(gè)容易被人們忽略的技術(shù)性細(xì)節(jié)?!癲ata”一詞源自希臘文字“datum”的復(fù)數(shù)形式,人們通常談?wù)摶驎?shū)寫(xiě)所謂的“數(shù)據(jù)”時(shí),指的是一般意義上的信息。韋氏詞典對(duì)“數(shù)據(jù)”的定義是:作為推斷、討論或者計(jì)算基礎(chǔ)的事實(shí)類(lèi)信息。牛津高階詞典將其界定為“事實(shí)或信息,尤其是把它們用來(lái)核查、探尋事物的本質(zhì)或進(jìn)行決策時(shí)?!边€原到日常生活對(duì)數(shù)據(jù)的理解,我們認(rèn)為數(shù)據(jù)是一個(gè)連續(xù)體的一部分,它從原始信息發(fā)展到可操作的知識(shí),從而幫助決策。它包括定量或定性的事實(shí)、數(shù)字、材料或結(jié)果等。
在信息時(shí)代,人類(lèi)無(wú)時(shí)無(wú)刻不在生產(chǎn)數(shù)據(jù),這為社會(huì)學(xué)家提供了前所未有的研究人類(lèi)行為的機(jī)會(huì)。雖然計(jì)算機(jī)可以從海量數(shù)據(jù)中找到統(tǒng)計(jì)顯著的關(guān)聯(lián)模式,但再精妙復(fù)雜的算法也無(wú)法從海量數(shù)據(jù)的隨機(jī)關(guān)聯(lián)中區(qū)分出有意義的模式。“垃圾輸入、垃圾輸出(garbage in, garbage out)”的忠告暗示我們,如果不思考數(shù)據(jù)背后的意義,而將所能夠收集的海量數(shù)據(jù)都扔進(jìn)統(tǒng)計(jì)模型,得到的關(guān)聯(lián)模式甚至?xí)T導(dǎo)我們作出錯(cuò)誤的、帶偏見(jiàn)的解讀。
教育數(shù)據(jù)常指圍繞著教育活動(dòng)所產(chǎn)生的數(shù)據(jù)集合。它產(chǎn)生于各種教育實(shí)踐場(chǎng)景中,諸如課堂教學(xué)、學(xué)校管理、教師教研活動(dòng)、校園活動(dòng)等。在傳統(tǒng)教學(xué)場(chǎng)景中,教育數(shù)據(jù)常常是課程活動(dòng)、學(xué)習(xí)測(cè)評(píng)結(jié)果、學(xué)習(xí)觀(guān)察、學(xué)習(xí)檔案袋等以紙質(zhì)或視頻媒介記錄的證據(jù)。隨著創(chuàng)新學(xué)習(xí)環(huán)境的增多,學(xué)習(xí)的技術(shù)創(chuàng)新、模式創(chuàng)新、非正式學(xué)習(xí)場(chǎng)景下的多元化學(xué)習(xí)目標(biāo)創(chuàng)新使教育數(shù)據(jù)也變得海量而復(fù)雜,教育大數(shù)據(jù)應(yīng)運(yùn)而生。教育大數(shù)據(jù)涵蓋了教育系統(tǒng)收集的學(xué)校層面的大規(guī)模標(biāo)準(zhǔn)化考試數(shù)據(jù),或者是利用在線(xiàn)學(xué)習(xí)系統(tǒng)、物聯(lián)網(wǎng)傳感器技術(shù)等數(shù)據(jù)采集技術(shù)收集的線(xiàn)上或者線(xiàn)下的學(xué)習(xí)行為數(shù)據(jù)。
面對(duì)海量的教育大數(shù)據(jù),如何從混亂中找出有意義的信息,能夠回答教育利益相關(guān)者所關(guān)心問(wèn)題的數(shù)據(jù)有哪些,或者說(shuō)分析數(shù)據(jù)的目的是什么,是了解學(xué)生的迷思概念、學(xué)科思維、元認(rèn)知技能、社交能力、批判性思維、問(wèn)題解決能力、創(chuàng)新能力?……在從知識(shí)導(dǎo)向向能力素養(yǎng)導(dǎo)向轉(zhuǎn)變的教育大背景下,這些訴求并非以往直觀(guān)經(jīng)驗(yàn)所能滿(mǎn)足,變得愈加復(fù)雜而難以決斷,有賴(lài)于證據(jù)的支持。
基于證據(jù)的評(píng)估和決策絕非新生事物,在商業(yè)智能、循證醫(yī)學(xué)、用戶(hù)中心的產(chǎn)品設(shè)計(jì)、數(shù)據(jù)驅(qū)動(dòng)的運(yùn)動(dòng)員訓(xùn)練等眾多行業(yè)的應(yīng)用由來(lái)已久。而教育領(lǐng)域?yàn)楹芜@一問(wèn)題今天會(huì)變得尤為突出,主要原因還是學(xué)習(xí)形態(tài)的日益多樣化。這從學(xué)習(xí)科學(xué)的研究主題可以略窺一二:多媒體學(xué)習(xí)、慕課、移動(dòng)學(xué)習(xí)、游戲化學(xué)習(xí)、創(chuàng)客教育、翻轉(zhuǎn)課堂、基于項(xiàng)目的學(xué)習(xí)、問(wèn)題解決學(xué)習(xí)、虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)的學(xué)習(xí)、基于場(chǎng)所的學(xué)習(xí)等。但是,人類(lèi)如何學(xué)習(xí)至少在目前還是無(wú)法計(jì)算的問(wèn)題。這就像搜索引擎對(duì)于搜索結(jié)果的意義一無(wú)所知一樣,它僅僅是依據(jù)詞與詞之間的相關(guān)性進(jìn)行計(jì)算而得到的結(jié)果。因此,教育數(shù)據(jù)本身不能保證我們對(duì)于學(xué)習(xí)有深入的理解,也不會(huì)自動(dòng)呈現(xiàn)學(xué)習(xí)的證據(jù),而需要人對(duì)數(shù)據(jù)背后的含義進(jìn)行詮釋。
教育研究和實(shí)踐對(duì)數(shù)據(jù)的理解離不開(kāi)與之相關(guān)的特定情境,這樣的教育數(shù)據(jù)被稱(chēng)為胖?jǐn)?shù)據(jù)(fat data),即對(duì)教學(xué)實(shí)踐活動(dòng)的現(xiàn)象和意義的深描,包括敘述和詮釋。這里的情境包括生產(chǎn)和收集數(shù)據(jù)的全過(guò)程——誰(shuí)、什么時(shí)候、在哪里、通過(guò)何種方式產(chǎn)生或收集這些數(shù)據(jù)?以及為什么會(huì)產(chǎn)生或者要收集這些數(shù)據(jù)?認(rèn)識(shí)教育數(shù)據(jù)的情境性,或許是教育大數(shù)據(jù)分析能夠被教師采納并應(yīng)用于教學(xué)實(shí)踐的前提。
教育實(shí)證研究方法一直有定量與定性之分,但兩種研究方法在教育研究中各具優(yōu)劣。定量研究的目的是利用基于大樣本的瘦數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,獲得關(guān)于總體一般教學(xué)規(guī)律的證據(jù),比如某種教學(xué)方法對(duì)提高學(xué)生成績(jī)是否有效。然而,真實(shí)復(fù)雜的學(xué)習(xí)情境,比如課堂難以像封閉可控的心理學(xué)實(shí)驗(yàn)研究環(huán)境一樣保證量化研究的生態(tài)效度和內(nèi)在效度。定性研究則往往通過(guò)對(duì)小樣本的胖?jǐn)?shù)據(jù)的細(xì)致觀(guān)察和深描,對(duì)特定教學(xué)現(xiàn)象形成深度的理解和認(rèn)識(shí),回答如何在課堂采用某種教學(xué)方法以及通過(guò)采用這種方法,學(xué)生如何學(xué)習(xí),產(chǎn)生了怎樣的效果等。但是,這種通過(guò)“典型”案例舉證,常常因?yàn)榉治鲞^(guò)程缺乏透明性而帶有主觀(guān)偏見(jiàn),并因?yàn)檠芯拷Y(jié)論不具有泛化效果而常受到質(zhì)疑。
近年來(lái),教育實(shí)證研究的趨勢(shì)是包含這兩種方法的混合分析策略,即將定量和定性研究并列或按順序進(jìn)行,分別構(gòu)建獨(dú)立的定量和定性分析模型,希望通過(guò)兩個(gè)模型結(jié)果的相互佐證,支持彼此的結(jié)論。但是,定性和定量研究一直存在彼此獨(dú)立的鴻溝,如何整合兩種研究方式,有效利用大數(shù)據(jù)時(shí)代所能提供的基于大樣本的胖?jǐn)?shù)據(jù),需要新的研究思路。
首先,我們需要在定性和定量研究之間構(gòu)建一套可以相互理解的話(huà)語(yǔ)體系。例如,定量研究的分類(lèi)或者指標(biāo),與定性研究的編碼,都對(duì)應(yīng)于研究者所感興趣的理論構(gòu)念。而從大數(shù)據(jù)中識(shí)別特定理論構(gòu)念,在定量研究和定性研究中分別被稱(chēng)為分類(lèi)和編碼的過(guò)程。定量和定性研究又通過(guò)統(tǒng)計(jì)顯著和理論飽和確保數(shù)據(jù)發(fā)現(xiàn)的指標(biāo)體系或者叫作編碼方案在樣本所在總體中是反復(fù)出現(xiàn)的。但不管定性還是定量模型,都不只滿(mǎn)足于從數(shù)據(jù)中識(shí)別出單一的理論構(gòu)念,而是揭示多個(gè)理論構(gòu)念之間的關(guān)聯(lián)模式,這在定量研究中被稱(chēng)為研究假設(shè),在定性研究中是對(duì)編碼之間關(guān)系的深描,又被稱(chēng)為敘事。這種數(shù)據(jù)(實(shí)證層面)和意義(理論層面)的雙向互動(dòng)就是研究的概念化和操作化過(guò)程。
有了上述方法論層面的相似性比較,再來(lái)看待理解學(xué)習(xí)的研究目標(biāo)。當(dāng)前,學(xué)習(xí)科學(xué)和教育測(cè)量領(lǐng)域分別倡導(dǎo)的學(xué)習(xí)設(shè)計(jì)和證據(jù)支持的測(cè)評(píng)設(shè)計(jì),不約而同地指向能力模型、證據(jù)模型和任務(wù)模型三者的相互映射。培養(yǎng)學(xué)生像科學(xué)家、工程師或者其他特定社會(huì)文化的成員一樣思維和實(shí)踐,意味著在對(duì)特定文化群體調(diào)查的基礎(chǔ)上,建立關(guān)于該文化群體的知識(shí)、技能、認(rèn)識(shí)論、價(jià)值觀(guān)和專(zhuān)業(yè)身份的認(rèn)知模型。因此,學(xué)習(xí)也可以視作是一種教化(encultration)的過(guò)程,目的是使學(xué)生建立符合某種文化的規(guī)范和認(rèn)識(shí)。這種進(jìn)入真實(shí)學(xué)習(xí)情境,理解教化過(guò)程的研究工作,類(lèi)似于社會(huì)學(xué)的民族志研究,是一種情境化的能力、證據(jù)和任務(wù)建模。而質(zhì)性分析的扎根理論正是獲得理論創(chuàng)新、建立可解釋和可檢驗(yàn)?zāi)P偷挠行緩?,進(jìn)一步通過(guò)定量分析大樣本數(shù)據(jù),提供該模型關(guān)于理論構(gòu)念,以及理論構(gòu)念之間關(guān)聯(lián)關(guān)系的統(tǒng)計(jì)學(xué)證據(jù)。數(shù)據(jù)、理論構(gòu)念以及構(gòu)念間關(guān)聯(lián)三者的雙向迭代循環(huán),確保了定量和定性的相互佐證,確保我們對(duì)于學(xué)習(xí)的深度理解是可靠的。
過(guò)去20年的技術(shù)進(jìn)步徹底改變了人類(lèi)消費(fèi)和生產(chǎn)數(shù)據(jù)的方式。這些變化促使研究人員尋找新的方法,對(duì)現(xiàn)有的大量數(shù)據(jù)進(jìn)行有意義的分析。教育和社會(huì)科學(xué)領(lǐng)域的類(lèi)似變革正在到來(lái)。在數(shù)字時(shí)代,質(zhì)性研究和定量研究、科學(xué)和人文、數(shù)字和理解這種舊的區(qū)分方式,在某些情況下限制了研究者的思維,而在另一些時(shí)候又迫使我們接受一些浮于表面的答案。這也正是當(dāng)前對(duì)于學(xué)習(xí)的理解存在的誤區(qū)。在教育大數(shù)據(jù)盛行時(shí)期,許多教育研究者和管理者主張教育元素能夠通過(guò)數(shù)據(jù)處理完全捕捉和表達(dá),甚至是簡(jiǎn)化為一些孤立的“指標(biāo)”。這些關(guān)注遠(yuǎn)遠(yuǎn)超出了數(shù)據(jù)有效性的傳統(tǒng)概念,挑戰(zhàn)了使用數(shù)據(jù)充分地建模教育過(guò)程和實(shí)踐的適當(dāng)性。就模擬人類(lèi)學(xué)習(xí)者和教師的行為而言,這些對(duì)胖?jǐn)?shù)據(jù)的忽視其實(shí)值得警惕。學(xué)習(xí)分析要避免被用于夸大教育的普遍一般規(guī)律,而低估不同教室、學(xué)校和學(xué)生生活的獨(dú)特性和復(fù)雜性。因此,真正的理解學(xué)習(xí),需要我們?cè)凇皩W(xué)習(xí)和教學(xué)可以被客觀(guān)地定義、測(cè)量和建模”與“所有形式的數(shù)據(jù)都是社會(huì)構(gòu)建的,任何數(shù)據(jù)處理或分析的實(shí)例本質(zhì)上都是由先驗(yàn)理論、思想、解釋結(jié)構(gòu)和假設(shè)形成的”之間建立關(guān)聯(lián)與平衡。這也是質(zhì)性和量化分析融合的關(guān)鍵,更是量化民族志(quantitative ethnography)研究方法的精髓所在。