陰祖寶 容中逵
[摘 ? 要] 在教育數(shù)字化轉(zhuǎn)型背景下,基于算法的教育研究已呈現(xiàn)出蓬勃發(fā)展之勢(shì),正推動(dòng)著教育研究由以個(gè)體數(shù)據(jù)為主的實(shí)證分析向以海量關(guān)系數(shù)據(jù)為主的智能預(yù)測(cè)轉(zhuǎn)型。基于算法的教育研究具有獨(dú)特的運(yùn)行邏輯,表現(xiàn)為指向計(jì)算主義的研究本體論規(guī)定,指向算法表征的研究認(rèn)識(shí)論預(yù)設(shè),指向數(shù)據(jù)驅(qū)動(dòng)的研究方法論實(shí)踐,指向模型預(yù)測(cè)的研究?jī)r(jià)值論訴求。但基于算法的教育研究也面臨量化一切的算法崇拜、人之主體性的僭越、唯數(shù)據(jù)論的方法圭臬以及教育研究的非正義性等潛在風(fēng)險(xiǎn)。為防范和化解算法風(fēng)險(xiǎn)需要建立相應(yīng)的規(guī)制機(jī)制,具體包括嵌入基于人文主義的研究立場(chǎng),構(gòu)建主體間性的“人—算”協(xié)同關(guān)系,推進(jìn)基于數(shù)據(jù)效能的算法公開,重塑基于教育邏輯的算法正義等。
[關(guān)鍵詞] 人工智能; 教育研究; 算法; 算法風(fēng)險(xiǎn)
[中圖分類號(hào)] G434 ? ? ? ? ? ?[文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 陰祖寶(1988—),男,山東泰安人。博士研究生,主要從事教育基本理論研究。E-mail:yinzubao@yeah.net。
一、引 ? 言
教育研究的“算法轉(zhuǎn)向”是人工智能賦能教育研究再造升級(jí)的集中體現(xiàn),對(duì)創(chuàng)新教育研究范式,促進(jìn)教育研究數(shù)字化轉(zhuǎn)型具有重要意義。然而,算法并非完美無(wú)缺的,其自身存在的算法理性、算法鴻溝、算法歧視等問(wèn)題,也給教育研究帶來(lái)了潛在風(fēng)險(xiǎn)和挑戰(zhàn)。而這正是基于算法的教育研究亟待克服和解決的重要問(wèn)題。有鑒于此,本文在闡明算法作用于教育研究的內(nèi)在邏輯基礎(chǔ)上,辯證審視和追問(wèn)算法研究可能存在的風(fēng)險(xiǎn)及產(chǎn)生原因,并提出規(guī)制算法風(fēng)險(xiǎn)的策略,以期對(duì)教育研究范式創(chuàng)新有所助益。
二、算法邏輯:教育研究的當(dāng)下之“維”
基于算法的教育研究以數(shù)據(jù)關(guān)聯(lián)思維構(gòu)建教育數(shù)據(jù)關(guān)系模型,并以可計(jì)算的方式將具體問(wèn)題置于算法模型中,從而依托智能算法技術(shù)對(duì)教育社會(huì)結(jié)構(gòu)和運(yùn)行規(guī)則加以解構(gòu)和分析。由此可見(jiàn),算法為教育研究提供了一種全新視角,是對(duì)傳統(tǒng)教育研究范式從思維、認(rèn)識(shí)再到方法、實(shí)踐的全面突破,這種突破反映了算法研究所具有的獨(dú)特運(yùn)行邏輯。具體而言,可以從研究本體論、認(rèn)識(shí)論、方法論、價(jià)值論四個(gè)維度予以詮釋。
(一)指向計(jì)算主義的研究本體論規(guī)定
若要探究人工智能時(shí)代教育研究的算法邏輯,首先必須明晰其背后隱含的本體論立場(chǎng)。哲學(xué)領(lǐng)域的本體論是指一切“實(shí)在”的本原或基質(zhì),其要回答的是世界是什么,以及如何解釋、理解世界的問(wèn)題。本體論代表著一個(gè)具有最高、最普遍的邏輯規(guī)定性的先驗(yàn)原理系統(tǒng),旨在為人們認(rèn)識(shí)世界提供哲學(xué)立場(chǎng)[1]。就教育研究而言,本體論所要解決的是研究方法或范式的指導(dǎo)思想問(wèn)題,即何種本體論立場(chǎng)決定何種研究方法或范式。事實(shí)證明,不同教育研究范式有著不同的本體論立場(chǎng)。如實(shí)證主義范式秉持主客二分觀,相信原子論、還原論;解釋主義范式堅(jiān)持人與世界一體觀,反對(duì)主客體截然分開;批判理論范式則主張教育是意識(shí)形態(tài)過(guò)程,存在于對(duì)現(xiàn)實(shí)的否定和批判之中[2]。當(dāng)前,計(jì)算主義作為認(rèn)識(shí)世界、理解世界的新的認(rèn)知范疇,逐漸成為人工智能發(fā)展的哲學(xué)思想基礎(chǔ),為各學(xué)科結(jié)合領(lǐng)域需求開展算法實(shí)踐提供了本體論框架和指導(dǎo)。計(jì)算主義認(rèn)為,整個(gè)世界由算法控制,物理世界、生命過(guò)程、認(rèn)知意識(shí)皆可計(jì)算,所謂的存在實(shí)質(zhì)上不過(guò)是以不同的方式所顯現(xiàn)的信息形式,整個(gè)宇宙猶如一臺(tái)巨型計(jì)算機(jī),世界從根本上是按照一定算法或程序計(jì)算的過(guò)程;生命、心靈和智能也是計(jì)算演化的結(jié)果,而人類大腦及意識(shí)則被視為宇宙計(jì)算機(jī)中的虛擬機(jī),其既是宇宙計(jì)算的產(chǎn)物,也可以模擬和推演整個(gè)宇宙的本質(zhì)[3]。從本質(zhì)上講,計(jì)算主義是通過(guò)數(shù)學(xué)的方式將人類的認(rèn)知行為和模式轉(zhuǎn)化為某種特定的算法,然后映射到“比特世界”中,實(shí)現(xiàn)世界算法化、算法世界化。就教育領(lǐng)域而言,基于算法的教育研究需要依托智能科技賦能,以數(shù)智世界中的教育問(wèn)題為主要研究對(duì)象,利用海量教育數(shù)據(jù)從算法設(shè)計(jì)、數(shù)據(jù)構(gòu)造等方面對(duì)教育研究問(wèn)題進(jìn)行可計(jì)算、可控制的建模分析,并以量化方式呈現(xiàn)各要素及要素間的互動(dòng)關(guān)系,進(jìn)而建立多維度、多層序的問(wèn)題分析與預(yù)測(cè)模型,據(jù)此研究和解釋復(fù)雜教育問(wèn)題及其內(nèi)在作用規(guī)律。
(二)指向算法表征的研究認(rèn)識(shí)論預(yù)設(shè)
在人工智能時(shí)代,算法成為解釋和認(rèn)識(shí)人、教育、社會(huì)關(guān)系的基本思維方式。以算法表征世界、重構(gòu)世界的認(rèn)識(shí)論與以往的研究認(rèn)識(shí)論具有顯著不同,其根本差異在于算法思維絕不只是一種空洞的思辨,也不是單純基于實(shí)驗(yàn)操作的關(guān)于事物本體意義的溯源,而是“基于功能模擬、結(jié)構(gòu)模擬和行為模擬,以算法語(yǔ)言的方式描述領(lǐng)域世界的實(shí)體、對(duì)象、關(guān)系以及過(guò)程等,實(shí)現(xiàn)理性推導(dǎo)、深度學(xué)習(xí)、智能模擬的動(dòng)態(tài)互釋,即走向一種可以整合理性主義、經(jīng)驗(yàn)主義和具身認(rèn)知的新的認(rèn)識(shí)論”[4]。指向算法表征的教育研究認(rèn)識(shí)論內(nèi)含表征主體和表征關(guān)系兩個(gè)操作規(guī)定。表征主體規(guī)定的是“誰(shuí)來(lái)表征”的問(wèn)題,即“機(jī)器”在一定程度上具備了類人化的認(rèn)識(shí)能力,被賦予了虛擬的表征主體身份。傳統(tǒng)研究的數(shù)據(jù)分析是以人腦為媒介的命題澄清過(guò)程,而算法思維則側(cè)重以電腦、云平臺(tái)等機(jī)器為媒介,通過(guò)數(shù)據(jù)化、模型化的方式將教育問(wèn)題的產(chǎn)生機(jī)理、作用關(guān)系等表達(dá)出來(lái),此時(shí)呈現(xiàn)的研究結(jié)果已不再是單純的人的主觀意志,而是互滲機(jī)器算法意志的表達(dá)。研究者與算法之間演化為一種“賽博格”式的認(rèn)識(shí)結(jié)構(gòu)關(guān)系,即人與技、人與機(jī)之間的關(guān)系由傳統(tǒng)的主客“器用”關(guān)系轉(zhuǎn)變?yōu)樾滦螒B(tài)的主體間性關(guān)系。算法表征實(shí)質(zhì)是人機(jī)協(xié)同的結(jié)果,并由此使教育研究的知識(shí)表征呈現(xiàn)出“人類編碼知識(shí)+智能代理編碼知識(shí)”的雙重性[5]。表征關(guān)系規(guī)定的是“表征什么”的問(wèn)題,即算法表征教育現(xiàn)象之間的相關(guān)關(guān)系。在傳統(tǒng)教育研究中,對(duì)因果關(guān)系的探索一直被視為研究的基本使命,嚴(yán)密的因果推理和關(guān)系驗(yàn)證是揭示教育現(xiàn)象與問(wèn)題本質(zhì)的最基本的思維模式。此間,因果關(guān)系得以表征的前提是數(shù)據(jù)、變量的“人為操縱性”,即研究者在精確控制足以影響研究實(shí)驗(yàn)結(jié)果的無(wú)關(guān)干擾變量之下,方能了解自變量與因變量之間是否存在因果關(guān)系。而在算法時(shí)代,研究者獲得的則是大量的非人為操縱的原始真實(shí)數(shù)據(jù),同時(shí),數(shù)據(jù)繁雜、變量多元且難控。在此情況下,普遍意義上的因果關(guān)系已難以“捕捉”,而更適合的是相關(guān)關(guān)系的“抓取”。由此,教育研究從關(guān)注因果關(guān)系轉(zhuǎn)向關(guān)注相關(guān)關(guān)系。
(三)指向數(shù)據(jù)驅(qū)動(dòng)的研究方法論實(shí)踐
數(shù)據(jù)驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)是基于算法的教育研究所遵循的方法論原則。與傳統(tǒng)研究范式相比,基于算法的教育研究對(duì)數(shù)據(jù)性質(zhì)定位、研究進(jìn)路選擇有著不同理解和把握。人工智能技術(shù)和計(jì)算社會(huì)科學(xué)的發(fā)展使數(shù)據(jù)采集突破了時(shí)間、空間及體量限制的瓶頸,而以機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)模型、圖像智能識(shí)別為代表的算法技術(shù)則使大數(shù)據(jù)分析突破了多源異構(gòu)、多維多類教育數(shù)據(jù)耦合應(yīng)用的障礙。此時(shí),數(shù)據(jù)成為一種新型的生產(chǎn)要素。正如佩德羅·多明戈斯(Pedro Domingos)所言,“所有知識(shí),無(wú)論過(guò)去的、現(xiàn)在的還是未來(lái)的,都有可能利用某個(gè)單一的、通用的學(xué)習(xí)算法而從數(shù)據(jù)中獲得?!盵6]如此數(shù)據(jù)被賦予了“知識(shí)發(fā)現(xiàn)”的功能,數(shù)據(jù)本身具有了表征教育事實(shí)的意義,而研究者所要做的就是從數(shù)據(jù)中提取這些意義。在大數(shù)據(jù)教育研究中,研究者直接作用的對(duì)象是大規(guī)模、全樣本、多模態(tài)、全流程的教育元數(shù)據(jù)“本身”,并通過(guò)對(duì)數(shù)據(jù)的算法分析獲得那些之前未曾知道或知道但未覺(jué)其價(jià)值的復(fù)雜現(xiàn)象和規(guī)律。研究者不需要基于現(xiàn)象考察事先確定某種理論假設(shè)后再展開研究,而是直接基于數(shù)據(jù)達(dá)成知識(shí)發(fā)現(xiàn)的目的。這實(shí)則代表了兩種不同的研究理路,前者是“始于假設(shè)”的理論驅(qū)動(dòng)型進(jìn)路,而后者則是“基于數(shù)據(jù)”的數(shù)據(jù)驅(qū)動(dòng)型進(jìn)路[7]?!盎跀?shù)據(jù)”的教育研究遵循“數(shù)據(jù)挖掘—數(shù)據(jù)清洗—數(shù)據(jù)分析—預(yù)測(cè)服務(wù)”的自下而上的歸納推理路徑,其目的不在于理論驗(yàn)證,而是旨在數(shù)據(jù)解釋和理論建構(gòu)。這在一定程度上顛覆了以前置性理論預(yù)設(shè)為前提的“觀察現(xiàn)象—提出假設(shè)—驗(yàn)證假設(shè)—形成結(jié)論”的研究傳統(tǒng),規(guī)避了研究者非中立的意識(shí)判定可能存在的偏見(jiàn)和干擾,同時(shí)以高維、高頻大數(shù)據(jù)算法,彌補(bǔ)了傳統(tǒng)研究用“小樣本”證明“大邏輯”(用簡(jiǎn)單的數(shù)量關(guān)系外推復(fù)雜的教育因果關(guān)系),用“小數(shù)據(jù)”演繹“大定律”的缺陷(用有限的數(shù)據(jù)模擬闡釋教育宏觀系統(tǒng)問(wèn)題),從而提升研究結(jié)果的可靠性、解釋力,以及可適用性。
(四)指向模型預(yù)測(cè)的研究?jī)r(jià)值論訴求
教育研究?jī)r(jià)值論是對(duì)教育科學(xué)研究存在意義的闡釋,是對(duì)研究自身價(jià)值構(gòu)造和功能承載的抽象概括。算法之所以具有強(qiáng)大的變革潛力和認(rèn)知世界的智慧,關(guān)鍵在于其創(chuàng)建的數(shù)字化模型能夠刻畫物質(zhì)世界乃至人類思想的內(nèi)隱秩序。就教育研究而言,創(chuàng)建算法模型的目的在于參照教育系統(tǒng)的特征以及各種教育現(xiàn)象、教育對(duì)象的依存關(guān)系,以智能模擬或擬態(tài)仿真的方式,賦予數(shù)據(jù)表征價(jià)值,并利用數(shù)學(xué)公式、圖形圖表等呈現(xiàn)特定教育研究問(wèn)題或?qū)ο笾g的關(guān)系和規(guī)律,借以解釋和預(yù)測(cè)未來(lái)的發(fā)展趨勢(shì)。沿循以上邏輯,基于算法的教育研究?jī)r(jià)值論在現(xiàn)實(shí)層面表現(xiàn)為解釋規(guī)律性和預(yù)測(cè)可能性兩個(gè)功能承載。在解釋功能上,基于算法的教育研究依托人工智能技術(shù),以超強(qiáng)算力和智能算法為保障,以教育學(xué)科為基礎(chǔ),綜合運(yùn)用統(tǒng)計(jì)學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、計(jì)算科學(xué)等學(xué)科資源,構(gòu)建具有復(fù)雜自適應(yīng)性的廣域、開放的教育問(wèn)題算法模型。這種建??梢浴皩?shí)現(xiàn)對(duì)教育實(shí)踐中復(fù)雜變量關(guān)系的準(zhǔn)確把握和對(duì)教育系統(tǒng)的整體認(rèn)識(shí),使研究人員能夠真正關(guān)注復(fù)雜教育系統(tǒng)具有的非線性特征,為教育研究構(gòu)造新的時(shí)空關(guān)系,”[8]進(jìn)而揭示和解釋以往常規(guī)方法難以洞見(jiàn)或無(wú)法觸及的教育深層問(wèn)題、規(guī)律或事實(shí),并為探討復(fù)雜智慧網(wǎng)絡(luò)和數(shù)字化空間中的一系列新興教育議題提供研究理路。在預(yù)測(cè)功能上,建立在相關(guān)分析基礎(chǔ)上的“預(yù)測(cè)”是基于算法的教育研究的核心功能。預(yù)測(cè)原本就是教育研究的應(yīng)有功能?,F(xiàn)如今,在大數(shù)據(jù)、算法技術(shù)助力下,研究者可以通過(guò)模型配置對(duì)諸多教育現(xiàn)象之間的相關(guān)關(guān)系加以量化分析和定性闡釋,創(chuàng)設(shè)虛擬仿真情境,對(duì)有關(guān)教育問(wèn)題進(jìn)行趨勢(shì)性、概率性預(yù)測(cè)。尤其是在教育規(guī)劃和政策制定中,基于算法的教育預(yù)測(cè)能夠破解教育決策中選擇性偏差和時(shí)效性制約,將教育決策需要考慮的多方面因素進(jìn)行量化和可視化,使教育決策者能夠?qū)撛诘慕逃芾韱?wèn)題和未來(lái)發(fā)展方向加以預(yù)測(cè),促進(jìn)教育規(guī)劃編制科學(xué)化和決策精準(zhǔn)化[9]。
三、可能風(fēng)險(xiǎn):教育研究的算法之“?!?/p>
相較于傳統(tǒng)教育研究范式,基于算法的教育研究在邏輯構(gòu)造的關(guān)系呈現(xiàn)、研究數(shù)據(jù)的規(guī)模保障、邏輯推演的智能水平、研究結(jié)果的預(yù)測(cè)水平等方面實(shí)現(xiàn)了難以匹及的技術(shù)飛躍。然而,算法是一把雙刃劍,其在賦能教育研究的同時(shí),也將自身技術(shù)缺陷和意識(shí)偏見(jiàn)滲透到了教育研究活動(dòng)中,從而引發(fā)一系列潛在風(fēng)險(xiǎn)。
(一)量化一切:教育研究的“烏托邦”
計(jì)算主義“一切皆可計(jì)算”的核心理念清楚地展現(xiàn)了人工智能時(shí)代以數(shù)據(jù)和算法為基礎(chǔ)認(rèn)識(shí)事物本質(zhì)及其特征的思維邏輯。而智能技術(shù)的本質(zhì)就是人類精神和心靈的技術(shù)化或者說(shuō)計(jì)算化(算法化)[10]。在計(jì)算語(yǔ)境下,教育自然被置于某種算法的運(yùn)行模式中,關(guān)乎教育本質(zhì)的一切,包括教育主體的認(rèn)知和意識(shí)都是計(jì)算的結(jié)果,任何教育行為都可以通過(guò)某種算法程序加以呈現(xiàn)和解釋。在此意義上,教育成為可算度的教育,教育研究的過(guò)程就是利用算法技術(shù)對(duì)教育問(wèn)題進(jìn)行代碼化與算法化的處理,從而獲得可量化的確定性規(guī)律或結(jié)果。不難看出,基于算法的教育研究力圖將教育問(wèn)題置于一個(gè)可計(jì)算的空間中加以研究,并借此展現(xiàn)教育研究“科學(xué)化”的曙光。然而,對(duì)于教育而言,算法的應(yīng)用范圍有其局限性,教育并非一個(gè)絕對(duì)可算的世界,不是所有情境中的教育問(wèn)題都適合用算法加以模擬和解析。一旦忽視這一點(diǎn),基于算法邏輯的教育研究將面臨算法崇拜、研究簡(jiǎn)約化等風(fēng)險(xiǎn)。具體表現(xiàn)為:
一是教育研究極易陷入“把一切交由算法,一切靠數(shù)據(jù)說(shuō)話”的算法控制論誤區(qū)。算法世界是確定性的、物化的,其處理的是一些本身能夠被計(jì)算或精確定義的現(xiàn)象或問(wèn)題。當(dāng)然這也是算法得以發(fā)揮作用的重要前提。但教育世界卻具有復(fù)雜性和模糊性,其充滿了諸多不確定且難以算度的因素。對(duì)算法的盲目崇拜,讓人們誤以為算法技術(shù)能夠克服教育不確定性的羈絆,讓教育變得客觀、可測(cè),甚至將“量化一切”視為衡量教育研究科學(xué)性的唯一標(biāo)準(zhǔn)。由此演變?yōu)閷?duì)思辨研究的排斥,及其方法科學(xué)性的否定。
二是教育研究可能淪為一種簡(jiǎn)約化、單向度、線性化的思維模式?!傲炕磺小北澈箅[藏著算法本體論的魔咒,即為實(shí)現(xiàn)可量化、可計(jì)算的目標(biāo)而借用某種算法機(jī)制將教育生活中模糊性的動(dòng)態(tài)數(shù)據(jù),簡(jiǎn)約化為確定性的靜態(tài)數(shù)據(jù),并將整個(gè)教育社會(huì)生活當(dāng)成一個(gè)沒(méi)有生命力的靜態(tài)數(shù)據(jù)集。這種簡(jiǎn)約化實(shí)則是對(duì)教育數(shù)據(jù)本身所具有的復(fù)雜性和客觀性的排斥,其使數(shù)據(jù)失去了豐富的內(nèi)涵和諸多有價(jià)值的成分,并導(dǎo)致數(shù)據(jù)的單一化和殘缺化,進(jìn)而影響對(duì)問(wèn)題本質(zhì)的呈現(xiàn)。
(二)算法理性:人之主體性的僭越
由于算法對(duì)人類生活的全方位介入,以及算法較之人類所具有的先天技術(shù)勢(shì)差,以算法表征為認(rèn)識(shí)論基礎(chǔ)的算法理性在教育研究中日益凸顯,并不斷沖擊著人的認(rèn)識(shí)主體地位。尤其是在更加自動(dòng)化、自主化、意識(shí)化的強(qiáng)智能算法面前,研究者更加倚重算法實(shí)現(xiàn)教育數(shù)據(jù)的自動(dòng)演算和分析,并期望獲得令人驚喜的研究發(fā)現(xiàn),而其自身在研究中的主導(dǎo)和支配作用卻漸趨虛置。對(duì)于算法技術(shù)的過(guò)度迷戀,使研究者在無(wú)意識(shí)中將主體性讓渡于算法,最終淪為算法的附庸,由此引發(fā)人的主體性危機(jī)。具體表現(xiàn)為:
一是面臨算法反向馴化的風(fēng)險(xiǎn)。作為研究工具的算法在被研究者設(shè)計(jì)、編制的同時(shí),也在以自身的技術(shù)負(fù)載影響著研究者的認(rèn)知和思維,從而產(chǎn)生反向馴化作用。與此同時(shí),算法所固有的“自我生產(chǎn)能力”,使其能夠按照自身運(yùn)作邏輯,改造既有的教育研究認(rèn)識(shí)范式,建構(gòu)不依賴于教育主體意志的規(guī)則機(jī)制。在此機(jī)制下,“沒(méi)有人能夠理解這些算法的內(nèi)在邏輯或者解釋我們接收到這些信息的原因”,“算法逐漸成為隱藏在人類社會(huì)幕后的控制者,并以它們的方式對(duì)待我們,而我們卻對(duì)此毫不知情”[11]。這種反向馴化使研究者從對(duì)算法的技術(shù)性依賴轉(zhuǎn)變?yōu)閮r(jià)值性服從,以致越來(lái)越難逃算法的操縱與規(guī)制。人反而成了表達(dá)算法意義的工具,而所獲得的研究結(jié)果或許只是算法想要我們看到的結(jié)果,并不一定是教育問(wèn)題的真實(shí)反映。
二是面臨理論闡釋弱化的風(fēng)險(xiǎn)?;谒惴ǖ慕逃芯吭噲D以相關(guān)關(guān)系取代因果關(guān)系。然而,相關(guān)關(guān)系作為一種表象的、非本質(zhì)的思維路徑,其回答的僅是事物“是什么”的問(wèn)題,而不是“為什么”的問(wèn)題,對(duì)于教育規(guī)律的揭示仍需借助于教育現(xiàn)象背后因果關(guān)系的解釋。因果關(guān)系判斷和推理是作為主體的人所具有的獨(dú)特能力,更是理論闡釋得以實(shí)現(xiàn)的基礎(chǔ)。盡管運(yùn)用算法可以對(duì)海量教育數(shù)據(jù)加以分析,并從中發(fā)現(xiàn)各類復(fù)雜教育行為和現(xiàn)象之間的相關(guān)性,但是數(shù)據(jù)相關(guān)性只是描述性的表象發(fā)現(xiàn),卻不能告訴我們這些現(xiàn)象的內(nèi)在機(jī)制和運(yùn)作規(guī)律,有時(shí)反而會(huì)掩蓋事物的本質(zhì),從而給我們的認(rèn)識(shí)過(guò)程帶來(lái)誤導(dǎo),這也是相關(guān)性分析固有的缺陷。
(三)算法濫用:唯數(shù)據(jù)論的方法圭臬
基于數(shù)據(jù)驅(qū)動(dòng)的教育研究方法論并非絕對(duì)完美,事實(shí)上隱含著唯數(shù)據(jù)論的傾向。如過(guò)分夸大數(shù)據(jù)在研究中的價(jià)值,一味強(qiáng)調(diào)“數(shù)據(jù)會(huì)自己說(shuō)話”,罔顧并非一切現(xiàn)象都能以數(shù)據(jù)形式表征的客觀事實(shí)和應(yīng)用限制;又如盲目擴(kuò)大算法適用范圍,簡(jiǎn)單將“量大”等同于“質(zhì)優(yōu)”,以數(shù)據(jù)規(guī)模代表數(shù)據(jù)的有效性和正確性。唯數(shù)據(jù)論的傾向致使人們無(wú)法客觀識(shí)別算法濫用對(duì)教育研究結(jié)果和過(guò)程造成的潛在風(fēng)險(xiǎn)。具體表現(xiàn)為:
一是數(shù)據(jù)噪聲導(dǎo)致研究結(jié)果偏差。數(shù)據(jù)噪聲是指在獲得的總體數(shù)據(jù)中存在著偏離期望值的異常乃至錯(cuò)誤的數(shù)據(jù),這些數(shù)據(jù)會(huì)影響算法模型的性能,從而大大降低模型在研究結(jié)果分析上的準(zhǔn)確性。數(shù)據(jù)噪聲是不可避免的,大數(shù)據(jù)技術(shù)在捕捉所謂有研究?jī)r(jià)值數(shù)據(jù)的同時(shí),也將個(gè)體日常生活中無(wú)意義的情節(jié)、社會(huì)活動(dòng)中非目的性活動(dòng)、人際交往中偶然性事件等數(shù)據(jù)信息一并囊括其中。同時(shí),當(dāng)教育卷入一種虛擬與現(xiàn)實(shí)并行的智能生活模式時(shí),個(gè)體在虛擬空間中會(huì)刻意表現(xiàn)出他人期待、認(rèn)可或被智能技術(shù)人為設(shè)計(jì)的行為,這就造成虛擬空間與現(xiàn)實(shí)空間中個(gè)體心理意向、行為表現(xiàn)的偏差?;诖怂@取的數(shù)據(jù)勢(shì)必會(huì)存在偏誤,而在此基礎(chǔ)上經(jīng)由算法所得到的研究結(jié)果的可靠性必然大打折扣。
二是算法黑箱導(dǎo)致研究過(guò)程失真。算法黑箱是指算法的計(jì)算過(guò)程猶如一個(gè)密閉而不透明的“黑箱”,人們所能看到的只是算法的輸入和輸出環(huán)節(jié),卻無(wú)法獲知和理解算法內(nèi)部的運(yùn)算程序、決策機(jī)制以及目標(biāo)意圖。對(duì)于算法使用者而言,算法運(yùn)行是看不見(jiàn)、摸不著的,是脫離于人的控制而獨(dú)立進(jìn)行的。由于算法黑箱的存在,研究者始終無(wú)法知道算法處理分析教育問(wèn)題以及得出研究結(jié)論的邏輯思路和研究過(guò)程。盡管從計(jì)算主義擁護(hù)者的立場(chǎng)出發(fā),科學(xué)的研究結(jié)論足以為“輕視過(guò)程”提供辯護(hù),并默認(rèn)研究過(guò)程是科學(xué)合理的[12]。但科學(xué)清晰的研究過(guò)程是保障研究可重復(fù)性和結(jié)論可再現(xiàn)性的基礎(chǔ),這也是研究信度的重要體現(xiàn)。而算法黑箱所造成的研究過(guò)程的不透明性、不可理解性,卻加劇了教育研究的信度危機(jī)。
(四)算法歧視:看不見(jiàn)的教育非正義
盡管基于算法的教育研究總是試圖借用技術(shù)優(yōu)勢(shì)將自身標(biāo)榜為客觀、公正的化身。但是,作為人類思維外化的產(chǎn)物,算法卻存在固有的偏見(jiàn)屬性。同時(shí),隨著算法決策深度介入教育研究和教育管理的各個(gè)領(lǐng)域,算法歧視得以潛藏于算法模型和數(shù)據(jù)代碼之中,以更加隱蔽、不易察覺(jué)的方式影響教育生活,并持續(xù)生產(chǎn)偏見(jiàn),導(dǎo)致對(duì)教育主體或教育問(wèn)題的差別對(duì)待,侵害教育利益相關(guān)者的權(quán)益和尊嚴(yán),進(jìn)而造成教育偏見(jiàn)和決策誤判,引發(fā)教育非正義的倫理風(fēng)險(xiǎn)。具體表現(xiàn)為:
一是引發(fā)教育偏見(jiàn)。算法模型的建立依賴于教育大數(shù)據(jù),但并不是所有的數(shù)據(jù)都會(huì)被納入模型的演算之中,能夠作為模型基礎(chǔ)數(shù)據(jù)的都是那些“訓(xùn)練數(shù)據(jù)”。訓(xùn)練數(shù)據(jù)往往是在數(shù)據(jù)挖掘階段出現(xiàn)頻率高的數(shù)據(jù),這些數(shù)據(jù)與數(shù)據(jù)模型性能直接相關(guān),是算法預(yù)測(cè)分析過(guò)程中使用的關(guān)鍵元素,也是構(gòu)成算法推薦的基礎(chǔ)。一旦訓(xùn)練數(shù)據(jù)中涵蓋錯(cuò)誤的、片面的或帶有歧視的成分,或捕捉范圍是具有偏見(jiàn)意識(shí)人群的樣本,則建立的模型也會(huì)帶有先天的歧視和偏見(jiàn),由此所輸出的結(jié)果也會(huì)體現(xiàn)出價(jià)值偏見(jiàn),從而導(dǎo)致研究結(jié)論的片面、失實(shí)。
二是引發(fā)決策誤判。算法決策的本質(zhì)是在過(guò)去數(shù)據(jù)基礎(chǔ)上對(duì)未來(lái)作出預(yù)測(cè)。然而,過(guò)去數(shù)據(jù)是基于過(guò)去教育情境形成的,當(dāng)我們用這些數(shù)據(jù)所建立的模型去分析處于新的教育情境中的問(wèn)題和現(xiàn)象時(shí),可能會(huì)水土不服,從而無(wú)法對(duì)當(dāng)下問(wèn)題作出準(zhǔn)確的判斷和預(yù)測(cè),甚至?xí)?dǎo)致決策失誤。同時(shí),對(duì)算法模型的過(guò)度依賴可能會(huì)弱化研究者的批判意識(shí),全盤接受由算法生產(chǎn)的各種研究結(jié)論和趨勢(shì)預(yù)測(cè)而全無(wú)價(jià)值判定和取舍,隱藏著極大的誤判風(fēng)險(xiǎn)。此外,算法本身具有價(jià)值負(fù)載性,算法設(shè)計(jì)者的價(jià)值立場(chǎng)或社會(huì)偏見(jiàn)也會(huì)不自覺(jué)地嵌入模型之中,從而影響結(jié)果公正。
四、規(guī)制策略:教育研究的算法之“位”
為有效推動(dòng)教育研究的數(shù)字化轉(zhuǎn)型,必須對(duì)基于算法的教育研究所存在的潛在風(fēng)險(xiǎn)加以規(guī)制,讓算法在合理軌道上運(yùn)行,而不越“位”,從而使其真正發(fā)揮驅(qū)動(dòng)教育變革和塑造研究新范式的作用。
(一)嵌入基于人文主義的研究立場(chǎng)
教育研究本質(zhì)上是科學(xué)性與人文性相統(tǒng)一的活動(dòng),并由此形成了科學(xué)主義和人文主義兩種傳統(tǒng)研究立場(chǎng)。兩種立場(chǎng)雖各有側(cè)重,但不可割裂,且以人文主義為基礎(chǔ)。正如有學(xué)者所言,“教育研究離不開思想性與人文性,甚至它的實(shí)證與科學(xué)化也要以人文性為前提。過(guò)于倚重實(shí)證、量化、技術(shù)及其效率,教育研究過(guò)程就有可能淪陷于機(jī)械化的工具與程序,勢(shì)必偏離了以人的存在為目的的教育本身”[13]。盡管算法正深刻改造著教育研究范式與思維方式,但這種改造不能違背人存在的意義。為此,基于算法的教育研究必須嵌入人文主義價(jià)值立場(chǎng),以此破除對(duì)“量化一切”的過(guò)度膜拜。首先,“必須承認(rèn)算法不是全能的,并停止科技烏托邦的幻想,即無(wú)根據(jù)地寄希望于用算法解決一切問(wèn)題”[11]。算法研究是有限度的,其發(fā)揮作用有其特定時(shí)空限制,研究者不能無(wú)限夸大算法能力。算法研究也只是多種教育研究范式中的一類而已,憑其一己之力無(wú)法完全解釋整個(gè)教育世界。其次,基于算法的教育研究要指向人的發(fā)展,在對(duì)教育問(wèn)題進(jìn)行技術(shù)化審視和診斷的同時(shí),更要關(guān)注人的意義的探討,要從文化和人文層面探討影響教育問(wèn)題演進(jìn)的各種情感、個(gè)性等非理性因素,將教育研究引入更為廣闊的人文性視野思考框架之中。此外,為避免人文主義傾向的研究陷入碎片化、個(gè)體化的境地,基于算法的教育研究必須符合所處時(shí)代社會(huì)文化語(yǔ)境的要求,對(duì)人文化場(chǎng)景中的人、物、事進(jìn)行整體性研究,并借助算法技術(shù)手段,實(shí)現(xiàn)由個(gè)體經(jīng)驗(yàn)、感受、判斷上升到對(duì)社會(huì)意義、群體意義的建構(gòu)上,從而建立科學(xué)性與人文性的關(guān)聯(lián)渠道,實(shí)現(xiàn)人文性與科學(xué)性的統(tǒng)一。
(二)實(shí)現(xiàn)基于主體間性的“人—算”協(xié)同
在基于算法的教育研究中,之所以會(huì)存在人之主體性被算法理性僭越的風(fēng)險(xiǎn),其根本原因在于人與算法關(guān)系的異化和錯(cuò)位。為此,要規(guī)制算法理性風(fēng)險(xiǎn),必須科學(xué)理解和定義人與算法的關(guān)系,并在此基礎(chǔ)上,實(shí)現(xiàn)人之主體性的回歸。具體而言:一方面,在認(rèn)知層面重塑人與算法的主體間性關(guān)系。人與算法的關(guān)系不是簡(jiǎn)單的主體與客體、改造與被改造的關(guān)系,而是一種主體間性關(guān)系,其所要達(dá)成的是人與算法的協(xié)同共生。人之主體性的真正回歸并不是將算法置于人的強(qiáng)力控制之下,而是在承認(rèn)算法的智能化、類人化特性基礎(chǔ)上,賦予算法智能主體身份,實(shí)現(xiàn)人與算法的有機(jī)結(jié)合,從而形成一種“新形態(tài)的認(rèn)識(shí)主體”[14]?!叭恕惴ā弊鳛橐环N新形態(tài)的認(rèn)識(shí)主體,其目的不是要?jiǎng)?chuàng)造一個(gè)所謂的“人工認(rèn)識(shí)主體”,而是要利用算法彌補(bǔ)人之局限,進(jìn)而拓展教育研究的深度和廣度,同時(shí)又利用人的意識(shí)洞察和糾正算法表征結(jié)果中的偏見(jiàn)和誤識(shí)。另一方面,在實(shí)踐層面實(shí)現(xiàn)相關(guān)表征與因果推理的協(xié)同互促。教育研究中主體性的回歸還體現(xiàn)在對(duì)算法表征結(jié)果的闡釋上,即研究者要在相關(guān)關(guān)系分析基礎(chǔ)上,論證其因果推理和判斷。就教育研究而言,相關(guān)關(guān)系是應(yīng)對(duì)復(fù)雜系統(tǒng)的一種橫向思維方式,而因果關(guān)系則是應(yīng)對(duì)現(xiàn)實(shí)情境的一種縱向思維方式。這兩種思維針對(duì)不同教育問(wèn)題,且分屬不同思維向度,不存在替代可能。因此,基于算法的教育研究不僅要關(guān)注相關(guān),而且要探明相關(guān)背后的深刻原因。這既是去偽存真、剔除假相關(guān)的過(guò)程,也是揭示教育規(guī)律和生成教育理論的必然歷程。
(三)推進(jìn)基于數(shù)據(jù)效能的算法公開
防范算法濫用風(fēng)險(xiǎn)是實(shí)現(xiàn)教育數(shù)據(jù)價(jià)值最大化,推進(jìn)算法在教育研究領(lǐng)域科學(xué)高效運(yùn)用的關(guān)鍵。而保障數(shù)據(jù)導(dǎo)向正確、安全可控,算法公開透明、監(jiān)管有序是規(guī)避算法濫用帶來(lái)的風(fēng)險(xiǎn)隱患的有效舉措。具體而言:一是規(guī)范數(shù)據(jù)質(zhì)量監(jiān)控機(jī)制。建立涵蓋教育數(shù)據(jù)獲取、收集、存儲(chǔ)、使用、分析等整個(gè)數(shù)據(jù)生命周期的全鏈條、全流程質(zhì)量管理體系。研究者要避免“貪大求全”“量大則質(zhì)優(yōu)”的算法研究誤識(shí),并以教育研究問(wèn)題域?yàn)榛鶞?zhǔn)確定數(shù)據(jù)獲取的范圍、規(guī)模、對(duì)象、標(biāo)準(zhǔn)等;要構(gòu)建數(shù)據(jù)質(zhì)量校驗(yàn)的模型方法,并據(jù)此甄別和清理無(wú)效數(shù)據(jù)、冗余數(shù)據(jù)、僵尸數(shù)據(jù)、冷數(shù)據(jù)等,從而確保數(shù)據(jù)質(zhì)量和安全使用。二是健全數(shù)據(jù)隱私保護(hù)機(jī)制。教育數(shù)據(jù)的獲取與處理必須遵守倫理規(guī)約,要保障原始數(shù)據(jù)權(quán)利人(如教師、學(xué)生、學(xué)校等)的知情權(quán),只有在獲得其授權(quán)情況下才能對(duì)教育數(shù)據(jù)加以采集、使用或共享。同時(shí),針對(duì)師生個(gè)人身份信息、興趣行為偏好、成績(jī)考評(píng)、學(xué)籍學(xué)歷等敏感數(shù)據(jù),要構(gòu)建教育系統(tǒng)敏感數(shù)據(jù)安全儲(chǔ)存和傳輸機(jī)制,保障隱私信息、敏感信息不被篡改、竊取、盜用、泄露等。三是建立算法程序公開機(jī)制。盡管算法黑箱本質(zhì)上并非人為刻意制造,而是由算法自身的隱蔽性技術(shù)特征導(dǎo)致的。但這并不意味著算法黑箱是無(wú)解命題,人們通過(guò)開源技術(shù)手段能夠在一定程度上實(shí)現(xiàn)算法程序的透明與公開?;谒惴ǖ慕逃芯恳皶r(shí)、合理、有效地公開研究過(guò)程中的算法原理、維度變量、模型參數(shù)、決策標(biāo)準(zhǔn)等信息,并建立算法研究程序解釋機(jī)制,對(duì)數(shù)據(jù)處理、決策過(guò)程及應(yīng)用情況加以解釋說(shuō)明,從而提升研究公信力。同時(shí)加強(qiáng)算法程序公開的監(jiān)督審查,有學(xué)者提出,“由學(xué)校、教師、家長(zhǎng)、政府等教育利益攸關(guān)方組成一個(gè)監(jiān)督委員會(huì),對(duì)算法教育程序合理公開加以審查”[15],這不失為一個(gè)可行舉措。
(四)重塑基于教育邏輯的算法正義
算法秩序的構(gòu)建并不只是一個(gè)技術(shù)問(wèn)題,而是一個(gè)實(shí)實(shí)在在的社會(huì)正義問(wèn)題[16]。而算法歧視卻是對(duì)社會(huì)正義評(píng)價(jià)的扭曲。為此,基于算法的教育研究必須重塑教育世界的算法正義空間和秩序,最大限度地減少算法偏見(jiàn)和歧視,保障教育主體的平等權(quán)利,維護(hù)教育公平正義。具體而言:一是要以正義原則引領(lǐng)算法運(yùn)行。算法應(yīng)用于教育研究要以實(shí)現(xiàn)算法效率和保障個(gè)人權(quán)利與自由為基本準(zhǔn)則。為此,要將算法正義貫穿于教育研究算法設(shè)計(jì)、數(shù)據(jù)挖掘、結(jié)果輸出等全過(guò)程,以正義價(jià)值防范算法權(quán)力的無(wú)限擴(kuò)張,規(guī)避算法霸權(quán)對(duì)教育價(jià)值的侵蝕以及對(duì)弱勢(shì)群體的歧視,保障教育決策和行動(dòng)的正義性與公平性。二是要以教育邏輯規(guī)制算法設(shè)計(jì)。任何形式的教育研究都必須以教育的本質(zhì)屬性為邏輯基礎(chǔ),這是確保教育研究獨(dú)立性,避免成為其他學(xué)科附庸的前提?;谒惴ǖ慕逃芯恳獔?jiān)持教育邏輯,而不是算法技術(shù)邏輯,即要由教育的需求決定選用何種適合的算法,而不是由算法決定何種教育才是適合的教育。也就是說(shuō),教育算法必須是基于教育實(shí)際問(wèn)題和應(yīng)用場(chǎng)景的“原創(chuàng)者”,而不是做其他領(lǐng)域應(yīng)用場(chǎng)景的“跟隨者”[17]。這是解決算法歧視的根本所在,只有如此才能保障以教育思維去思考教育問(wèn)題,而避免算法邏輯的宰制與操控。三是要以監(jiān)測(cè)機(jī)制服務(wù)算法決策。實(shí)現(xiàn)以算法為核心的教育自動(dòng)化決策是算法參與教育治理的重要方式,也是基于算法的教育研究的內(nèi)在追求。但算法決策卻潛藏誤判風(fēng)險(xiǎn)。為此,有必要加強(qiáng)對(duì)算法決策過(guò)程及實(shí)踐應(yīng)用的動(dòng)態(tài)監(jiān)測(cè),及時(shí)發(fā)現(xiàn)和預(yù)警偏離教育現(xiàn)實(shí)或引發(fā)教育行動(dòng)偏差的情況;同時(shí)建立算法決策糾偏機(jī)制,及時(shí)調(diào)整教育政策或措施,并對(duì)教育預(yù)測(cè)模型加以修正。
[參考文獻(xiàn)]
[1] 俞宣孟.本體論研究[M].上海:上海人民出版社,2012:19.
[2] 張羽,劉惠琴,石中英.指向教育實(shí)踐改進(jìn)的系統(tǒng)范式——主流教育研究范式的危機(jī)與重構(gòu)[J].清華大學(xué)教育研究,2021,42(4):78-90.
[3] 李建會(huì),符征,張江.計(jì)算主義:一種新的世界觀[M].北京:中國(guó)社會(huì)科學(xué)出版社,2012:2-5.
[4] 肖峰.人工智能與認(rèn)識(shí)論的哲學(xué)互釋:從認(rèn)知分型到演進(jìn)邏輯[J].中國(guó)社會(huì)科學(xué),2020(6):49-71.
[5] 鄧國(guó)民.智能時(shí)代教育研究的認(rèn)識(shí)論變革與方法論轉(zhuǎn)變[J].現(xiàn)代教育技術(shù),2020,30(5):26-32.
[6] 佩德羅·多明戈斯.終極算法:機(jī)器學(xué)習(xí)和人工智能如何重塑世界[M].黃芳萍,譯,北京:中信出版社,2017:33.
[7] 鄒太龍,易連云.從“始于假設(shè)”到“基于數(shù)據(jù)”——大數(shù)據(jù)時(shí)代教育研究范式的轉(zhuǎn)型[J].教育研究與實(shí)驗(yàn),2017(4):74-79.
[8] 劉三女牙,周子荷,李卿.再論“計(jì)算教育學(xué)”:人工智能何以改變教育研究[J].教育研究,2022,43(4):18-27.
[9] 萬(wàn)力勇.算法時(shí)代的教育預(yù)測(cè)及其研究范式轉(zhuǎn)變[J].遠(yuǎn)程教育雜志,2022,40(3):35-44.
[10] 孫周興.人類世的哲學(xué)[M].北京:商務(wù)印書館,2018:85.
[11] 凱西·奧尼爾.算法霸權(quán):數(shù)學(xué)殺傷性武器的威脅[M].馬青玲,譯.北京:中信出版社,2018:201,243.
[12] 靖東閣.人工智能時(shí)代教育研究的計(jì)算主義及超越[J].電化教育研究,2021,42(2):18-24.
[13] 閻光才.如何理解中國(guó)當(dāng)下教育實(shí)證研究取向[J].大學(xué)教育科學(xué),2020(5):4-11.
[14] 王治東.人工智能研究路徑的四重哲學(xué)維度[J].南京社會(huì)科學(xué),2019(9):39-47.
[15] 肖鳳翔,張雙志.算法教育治理:技術(shù)邏輯、風(fēng)險(xiǎn)挑戰(zhàn)與公共政策[J].中國(guó)電化教育,2020(1):76-84.
[16] 董青嶺,朱玥.人工智能時(shí)代的算法正義與秩序構(gòu)建[J].探索與爭(zhēng)鳴,2021(3):82-86.
[17] 譚維智.人工智能教育應(yīng)用的算法風(fēng)險(xiǎn)[J].開放教育研究,2019,25(6):20-30.
Algorithmic Logic, Possible Risks and Regulatory Strategies of
Educational Research in the Era of Artificial Intelligence
YIN Zubao, ?RONG Zhongkui
(Research Institute for Rural Education, Hunan Normal University, Changsha Hunan 410081)
[Abstract] In the context of digital transformation of education, algorithm-based educational research has shown a booming trend and is driving the transformation of educational research from empirical analysis based on individual data to intelligent prediction based on massive relational data. Algorithm-based educational research has a unique operating logic, which is manifested as the research ontological prescriptions of computationalism, the research epistemological presuppositions of algorithmic representations, the data-driven research methodological practices, and the research axiological appeal of model prediction. However, algorithm-based educational research also faces potential risks such as the cult of the algorithm that quantifies everything, the arrogation of individual subjectivity, the principle of data-only method and the injustice of educational research. In order to prevent and resolve algorithmic risks, it is necessary to establish corresponding regulatory mechanisms, including adhering to a humanistic research standpoint, constructing an intersubjective "human-algorithm" cooperative relationship, promoting an algorithm openness based on data efficiency, and reshaping the algorithmic justice based on the logic of education.
[Keywords] ?Artificial Intelligence; ?Educational Research; ?Algorithm; ?Algorithmic Risk