劉 驥 張 晉
近年來全球教育治理體系快速發(fā)展,基于大規(guī)模學(xué)生測評(píng)的國際學(xué)業(yè)評(píng)價(jià)已成為衡量各國教育發(fā)展水平、判斷各項(xiàng)政策有效性、推進(jìn)各層各類教育改革的重要治理工具。[1]由經(jīng)濟(jì)合作與發(fā)展組織(Organisation for Economic Cooperation and Development,簡稱OECD)所主導(dǎo)的國際學(xué)生評(píng)估項(xiàng)目(Programme for International Student Assessment,簡稱PISA)是具有廣泛全球參與基礎(chǔ)和政策影響力的跨國教育質(zhì)量評(píng)價(jià)工具,并逐漸成為全球教育治理領(lǐng)域難以忽視的重要力量,為各國提供了可資參照的國際教育水平比照標(biāo)準(zhǔn)。通過全球勝任力框架(Global Competency Framework),PISA將各國測試成績與教育質(zhì)量水平、經(jīng)濟(jì)發(fā)展?jié)摿﹃P(guān)聯(lián)起來,將學(xué)生成績高低與教育政策績效銜接掛鉤,據(jù)此溯源教育政策優(yōu)劣,提出教育改革方案。
在OECD豐富的測量統(tǒng)計(jì)與政策評(píng)議資源的推動(dòng)下,PISA作為衡量教育發(fā)展水平的國際性指標(biāo)在全球教育治理中得到廣泛推崇。越來越多的教育政策制定者、媒體與公眾開始將目光集聚于每三年一次的“PISA放榜日”(PISA Day),將其結(jié)果認(rèn)定為考核本國教育質(zhì)量的事實(shí)依據(jù),圍繞各國的PISA表現(xiàn)來論證并實(shí)施教育改革,并寄希望于新的改革能夠顯性化為PISA排名的提升。以歐洲為例,德國、挪威等國相繼以PISA測試框架為藍(lán)本建立了國家教育監(jiān)測體系,力圖通過加強(qiáng)國內(nèi)與國際教學(xué)評(píng)價(jià)指標(biāo)的關(guān)聯(lián)度,提高本國的PISA表現(xiàn)。[2]在國內(nèi)改革與國際指標(biāo)不斷趨同下,有不少學(xué)者對(duì)此現(xiàn)象表示擔(dān)憂,認(rèn)為基于PISA邏輯無異于追求一套“唯分?jǐn)?shù)”的單維教育評(píng)價(jià)系統(tǒng),其教育評(píng)價(jià)形式與追求人性解放的教育理想背道而馳。[3]而PISA邏輯所依托的復(fù)雜測量模型則借殼于數(shù)字化、科學(xué)化、標(biāo)準(zhǔn)化等工具主義治理理念,加劇了全球教育發(fā)展去情景化、去地域化的趨勢(shì)[4],通過扮演“標(biāo)準(zhǔn)裁定者”的角色將那些選擇不參與國際學(xué)業(yè)評(píng)價(jià)的國家塑造為國際教育秩序的“破壞者”并施以懲罰[5]。
鑒于此,本研究圍繞以PISA為代表的跨國教育質(zhì)量評(píng)價(jià)工具,針對(duì)其教育質(zhì)量評(píng)價(jià)功能的可靠性展開實(shí)證研究,嘗試在考察各國相對(duì)獨(dú)特的教育與文化背景情況下,檢驗(yàn)PISA邏輯的可靠性,打開“黑匣子”,揭露國際大規(guī)模學(xué)業(yè)評(píng)價(jià)復(fù)雜模型背后究竟在測量什么。
在形成機(jī)制溯源上,PISA邏輯的生成與OECD教育治理權(quán)威的構(gòu)建緊密相關(guān),是數(shù)據(jù)治理(data governance)與技術(shù)官僚(technocracy)交互疊加的產(chǎn)物。數(shù)據(jù)治理指通過對(duì)數(shù)據(jù)的收集、分析與歸納形成“最佳實(shí)踐”(best practice)的指導(dǎo)方案,其目的在于通過數(shù)據(jù)挖掘降低決策風(fēng)險(xiǎn)。[6]但在推動(dòng)政策效率的同時(shí),數(shù)據(jù)治理往往在具體實(shí)踐中演變?yōu)閿?shù)據(jù)教條主義,即決策者忽視統(tǒng)計(jì)數(shù)據(jù)背后的多維現(xiàn)實(shí)含義,而其決策邏輯淪為以優(yōu)化簡單的顯性數(shù)據(jù)為主導(dǎo)的形式主義決策模式。[7]技術(shù)官僚源于西方20世紀(jì)初開始盛行的技術(shù)官僚型治理模式,特指遵循數(shù)據(jù)證據(jù)的分析結(jié)論制定相應(yīng)政策的決策思路。[8]雖然其初衷是在政策決策中強(qiáng)調(diào)理性分析的重要性,在實(shí)踐中卻往往因過度依賴復(fù)雜模型計(jì)算而演變?yōu)楣ぞ呓虠l主義,從而忽略了社會(huì)事務(wù)中豐富的多元文化等因素。[9]
從政策學(xué)角度探析,數(shù)據(jù)治理和技術(shù)官僚的運(yùn)用為PISA邏輯提供了三個(gè)關(guān)鍵特征,即去情境化(de-contextualization)、通約性(commensurability)和政策問題的產(chǎn)生(construction of policy problems)。[10]去情境化是指PISA通過使用復(fù)雜測量模型與特定統(tǒng)計(jì)算法力圖盡可能消除國際大規(guī)模學(xué)業(yè)評(píng)價(jià)比較分析中所常見的歷史文化和空間差異。在技術(shù)層面上,這意味著不同群體被重新校準(zhǔn),被塑造為標(biāo)準(zhǔn)化的數(shù)據(jù)觀測點(diǎn),賦予標(biāo)準(zhǔn)和算法的制定者以主觀評(píng)議的權(quán)利與權(quán)威。通約性則是指在去情景化的基礎(chǔ)上構(gòu)建比較各國教育質(zhì)量的等價(jià)空間(space of equivalence)。[11]在此空間內(nèi),PISA成績與教育質(zhì)量等價(jià),成為考量各國教育質(zhì)量與發(fā)展水平的核心且唯一標(biāo)準(zhǔn)。因此,政策問題的產(chǎn)生是數(shù)字治理與技術(shù)官僚主義結(jié)合的必然產(chǎn)物,即通過問題的識(shí)別與證實(shí)、解決方案的提出與論證體現(xiàn)其自身的價(jià)值與不可或缺性。
在政策治理實(shí)踐中,OECD通過國別簡報(bào)(country brief)等形式進(jìn)一步加強(qiáng)PISA測試成績與教育政策績效的關(guān)聯(lián)程度,以最具傳播效度的政策渠道向成員國與伙伴國提出政策指導(dǎo),并督促政策改革的實(shí)施與評(píng)估。[12]例如,“PISA之父”安德烈爾·施萊謝爾(Andrea Schleicher)曾高調(diào)宣稱“將數(shù)據(jù)轉(zhuǎn)化為政策實(shí)踐”是OECD影響力生成的源動(dòng)力。[13]就OECD而言,在其主導(dǎo)下的PISA邏輯依托于每期超過50萬學(xué)生的超大數(shù)據(jù)樣本、項(xiàng)目反應(yīng)理論(Item Response Theory)的復(fù)雜測量模型等數(shù)據(jù)與技術(shù)雙重權(quán)威要素,將原本相對(duì)主觀、由OECD獨(dú)立構(gòu)建的全球勝任力框架塑造成了具有科學(xué)統(tǒng)計(jì)方法支撐的全球性教育評(píng)價(jià)方案。由此,PISA一方面重新圈定了國際教育評(píng)價(jià)中可比較因素的范圍,營造出一種科學(xué)量表下國國平等的片面印象;另一方面實(shí)則枉顧各國教育發(fā)展所特有的歷史文化地理等因素,淡化了各國當(dāng)前及未來人才培養(yǎng)需求和教育體系結(jié)構(gòu)異質(zhì)性,嘗試用一根由西方發(fā)達(dá)國家設(shè)計(jì)的分?jǐn)?shù)標(biāo)尺度量世界各地極為豐富多樣的教育形態(tài)。
然而,更值得注意的是,教育后發(fā)國家在數(shù)據(jù)與技術(shù)權(quán)威的雙重作用下變得容易失去教育價(jià)值判斷的客觀基準(zhǔn),更容易被“大數(shù)據(jù)樣本”“復(fù)雜測量模型”等關(guān)鍵詞吸引,在未充分了解時(shí)便已經(jīng)全盤接受PISA的權(quán)威性,殊不知被納入了基于數(shù)據(jù)與技術(shù)雙重權(quán)威的“核心—邊緣”體系。相應(yīng)的,假若一國需要提升PISA成績、改善其國際教育排名位次,那么就需要根據(jù)OECD提供的最佳實(shí)踐清單開展相應(yīng)的標(biāo)準(zhǔn)化改革。[14]
近二十年來,學(xué)界對(duì)PISA邏輯所隱含的狹隘功利主義教育觀的擔(dān)憂從未中斷。[15]在價(jià)值取向上,OECD倡導(dǎo)將提升經(jīng)濟(jì)與國際競爭力作為各國發(fā)展教育的主要目標(biāo),強(qiáng)調(diào)量化學(xué)校產(chǎn)出而非教育投入,在新自由主義思潮的影響下將各國教育系統(tǒng)等同于人力資本培育機(jī)器,倡導(dǎo)教育效率優(yōu)先、輕視育人過程的評(píng)價(jià)理念。[16]在具體指標(biāo)測量中,PISA在相當(dāng)長的一段時(shí)間里僅關(guān)注閱讀、數(shù)學(xué)與科學(xué)等可標(biāo)準(zhǔn)化的科目,簡單地將教育質(zhì)量等同于三項(xiàng)科目成績的表現(xiàn),導(dǎo)致許多國家為了在PISA中獲得更高分?jǐn)?shù)和排名,依據(jù)PISA測試科目框架重新制定課程標(biāo)準(zhǔn)和教學(xué)時(shí)間分配。[17]在政策導(dǎo)向上,PISA邏輯主張存在一套世界通用且具有普遍價(jià)值的核心素養(yǎng)評(píng)估與提升方案,即通過閱讀、數(shù)學(xué)與科學(xué)素養(yǎng)測試推廣其全球勝任力框架及其配套的教育改革方案。[18]但哈佛大學(xué)霍華德·加德納教授(Howard Gardner)的多元智能理論(Multiple Intelligences)指出,人的全面發(fā)展需要依托于多元智力培育的多樣性,離不開人所生存的文化環(huán)境,從人的發(fā)展教育角度論證了多元文化環(huán)境的重要性。[19]由此可見,PISA邏輯下各國趨同與標(biāo)準(zhǔn)化的教育政策脫離了本土實(shí)際與需求,并不利于學(xué)生自由全面的發(fā)展。
教育具有長期性、綜合性、滯后性的特點(diǎn),因此長期穩(wěn)定且連貫一致的教育政策是教育良好發(fā)展的必要環(huán)境條件。據(jù)此,許多學(xué)者對(duì)PISA每三年開展一次的超短評(píng)價(jià)周期與實(shí)際育人規(guī)律相悖而感到擔(dān)憂,特別是因?yàn)槠涿咳暌淮蔚亩讨芷谂c許多國家的選舉周期相近,導(dǎo)致不少政客為了快速提升排名、突顯政績選擇鋌而走險(xiǎn),采取“見效快”的教育改革措施。[20]這些短視的改革往往以加重教師與學(xué)生負(fù)擔(dān)為代價(jià),在犧牲了教育可持續(xù)發(fā)展動(dòng)力的同時(shí),還加劇了各國教育領(lǐng)域唯分?jǐn)?shù)、唯排名的不良競爭趨勢(shì)。[21]
在愈發(fā)倡導(dǎo)勝任力、競爭力的國際教育話語環(huán)境中,PISA成為了政客、媒體與公眾內(nèi)心焦慮的顯性化載體,以成績和排名上下浮動(dòng)的方式將國家發(fā)展?jié)摿?、教育質(zhì)量水平置于最顯要的位置。[22]以世界銀行為例,PISA測試成績不僅是其對(duì)各國人力資本質(zhì)量的定期監(jiān)測,也是提高人力資本的政策能見度、敦促各國教育質(zhì)量提升的策略工具。[23]而在國家內(nèi)部,PISA測試成績的優(yōu)劣被認(rèn)為不僅僅代表了教育質(zhì)量,更與國家前途命運(yùn)息息相關(guān),有關(guān)PISA的各類報(bào)道和討論也變得愈加富有煽動(dòng)性、政治性。[24]例如在歐洲,PISA測試成績搖身一變成為政治輿情不確定性的催化劑,時(shí)不時(shí)成為在野黨攻擊執(zhí)政黨的政治輿論素材。[25]相應(yīng)的,PISA測試成績已逐漸成為各國重要的教育政績指標(biāo),教育在PISA邏輯的影響下儼然成為政客們爭相追逐的政治資源,加深了政治化風(fēng)險(xiǎn)。
學(xué)界認(rèn)為,PISA邏輯最重要的風(fēng)險(xiǎn)之一是將測試成績過于簡單地歸因于教育政策的影響,而選擇性地對(duì)國別間的非政策因素熟視無睹。[26]PISA邏輯的擁護(hù)者曾毫不避諱地倡導(dǎo)在全球化背景下忽視文化環(huán)境差異的觀點(diǎn),認(rèn)為OECD關(guān)注政策是想為各國教育發(fā)展提供更清晰的路徑,而以文化地理因素差異拒絕其改革指導(dǎo)則是“一種傲慢行為”。[27]然而從復(fù)雜系統(tǒng)理論來看,教育系統(tǒng)是一個(gè)非線性系統(tǒng),不斷地與社會(huì)因素關(guān)聯(lián)交流,具有混沌的特征,對(duì)教育質(zhì)量的分析不僅要關(guān)注政策因素,還需要充分考慮家庭、文化等諸多非政策因素。[28]一方面,學(xué)生家庭背景差異在教育過程中的作用不可忽視,是影響教育的最主要非政策因素之一。大量研究表明,教育資源投入、父母受教育水平和經(jīng)濟(jì)水平等家庭背景因素與學(xué)生學(xué)業(yè)成績高度相關(guān),特別是那些受教育水平較高的家庭能夠更有效地通過增加家庭教育資源等方式提升學(xué)生學(xué)習(xí)效果。[29]另一方面,社會(huì)文化環(huán)境因素也對(duì)學(xué)生的教育理念、教育動(dòng)機(jī)和學(xué)習(xí)方式有著重要影響。在教育理念層面,有研究通過探究影響移民學(xué)生和本土學(xué)生成績差異的因素發(fā)現(xiàn),重視教育的文化理念對(duì)培養(yǎng)學(xué)生積極的學(xué)習(xí)態(tài)度和信念具有促進(jìn)作用,并最終有助于提高學(xué)生的學(xué)習(xí)成績。[30]在教育動(dòng)機(jī)層面,也有學(xué)者通過中美學(xué)生對(duì)照實(shí)驗(yàn)證明文化因素對(duì)學(xué)生學(xué)習(xí)內(nèi)驅(qū)力、考試努力程度有著重要影響。[31]在學(xué)習(xí)方式層面,對(duì)歐洲各國學(xué)生學(xué)習(xí)方式的研究發(fā)現(xiàn),不同文化背景的學(xué)生在任務(wù)選擇、時(shí)間規(guī)劃和思維習(xí)慣等學(xué)習(xí)方式上的偏好不同。[32]雖然社會(huì)歷史文化因素對(duì)學(xué)生教育具有多方面的影響,但其最終都滲透并集中反映在家庭文化和教育理念之中,對(duì)學(xué)生發(fā)展產(chǎn)生了深刻影響。[33]簡言之,影響教育實(shí)踐活動(dòng)的因素非常復(fù)雜,不同家庭、民族與國家都可能在教育過程中體現(xiàn)出獨(dú)有的價(jià)值觀、思維方式與精神特質(zhì),因此將復(fù)雜的教育教學(xué)效果歸因于單一政策要素極具風(fēng)險(xiǎn)。[34]
針對(duì)PISA邏輯的核心要素與其最主要風(fēng)險(xiǎn),本研究期望通過檢驗(yàn)PISA測試成績歸因于政策因素的假設(shè),進(jìn)一步探索PISA測試成績究竟能否反映國與國之間教育政策優(yōu)劣的問題。在理論上,檢驗(yàn)這一假設(shè)的方法是構(gòu)建一組隨機(jī)對(duì)照試驗(yàn),即將特征相似的學(xué)生隨機(jī)分配到不同國家教育政策環(huán)境中,經(jīng)過一段時(shí)間學(xué)習(xí)后通過PISA來考察他們的學(xué)習(xí)結(jié)果是否存在差異。[35]如若PISA邏輯的核心假設(shè)成立,那么這些特征相似的學(xué)生將在不同教育政策環(huán)境中產(chǎn)生完全不同的學(xué)習(xí)結(jié)果。
然而,這樣的大規(guī)??鐕S機(jī)對(duì)照試驗(yàn)顯然是難以操作實(shí)現(xiàn)的,因此本研究利用在國與國之間自然存在的跨國移民現(xiàn)象,構(gòu)建出便于考察特征相似的學(xué)生在不同教育政策環(huán)境中PISA測試成績的準(zhǔn)實(shí)驗(yàn)(quasi-experimental)研究設(shè)計(jì),通過PISA樣本所提供的學(xué)生背景信息構(gòu)建移民學(xué)生、母國學(xué)生、目的地國學(xué)生三者間的反事實(shí)(counterfactual)比較分析框架。
在研究操作層面,本研究通過追蹤海外華裔學(xué)生,分別開展三組研究假設(shè)的檢驗(yàn)(詳見表1)。
研究假設(shè)1:具有“相同文化背景但不同教育政策環(huán)境”的學(xué)生是否在學(xué)習(xí)結(jié)果上存在顯著差異?
研究假設(shè)2:具有“不同文化背景但相同教育政策環(huán)境”的學(xué)生是否在學(xué)習(xí)結(jié)果上存在顯著差異?
研究假設(shè)3:文化背景與教育政策環(huán)境均不同的學(xué)生是否在學(xué)習(xí)結(jié)果上存在顯著差異?
表1 反事實(shí)比較分析框架示意
其中,研究假設(shè)1聚焦于探究PISA是否具備識(shí)別特征相似的學(xué)生在不同教育政策環(huán)境中的學(xué)習(xí)結(jié)果差異,而研究假設(shè)2則更進(jìn)一步分析教育文化背景作為關(guān)鍵的非政策因素對(duì)特征相似的學(xué)生在相同教育政策環(huán)境下所產(chǎn)生的學(xué)習(xí)結(jié)果影響。按照PISA邏輯以政策因素為主要推斷的預(yù)期判斷,特征相似的學(xué)生無論文化背景,只要是同處相同教育政策環(huán)境,其學(xué)習(xí)結(jié)果就不應(yīng)存在顯著差異;反之,只要所處教育政策環(huán)境不同,其學(xué)習(xí)結(jié)果理應(yīng)存在顯著差異。
我國在PISA 2009與PISA 2012中僅有上海市參加,自2015年起擴(kuò)大參與規(guī)模至四省市,因此本研究選取地理與人口覆蓋面更廣的PISA 2015(北京、江蘇、上海、廣東)和PISA 2018(北京、江蘇、上海、浙江)兩期數(shù)據(jù)對(duì)研究假設(shè)分別進(jìn)行驗(yàn)證。該數(shù)據(jù)涵蓋了15周歲學(xué)生在閱讀、數(shù)學(xué)與科學(xué)的測試成績及其家庭和學(xué)校特征信息。由于不少國家選擇隱去學(xué)生出生地等特征信息,因此本研究聚焦于那些提供了充足的學(xué)生特征信息且華裔學(xué)生樣本大于等于50人的國家,即澳大利亞(110人)、新西蘭(50人)、加拿大(110人),其中加拿大并未提供PISA 2015的學(xué)生出生地信息,僅含PISA 2018的樣本。具體而言,樣本中海外華裔學(xué)生須滿足如下條件:本人出生于中國,父母至少一方出生于中國,且本人在5歲前抵達(dá)目的地國并完整地接受了目的地國的基礎(chǔ)教育。
參照當(dāng)前跨國學(xué)業(yè)評(píng)價(jià)的相關(guān)文獻(xiàn),本研究選用PISA測試成績指標(biāo)中波動(dòng)較小、跨國可比性較強(qiáng)的學(xué)生數(shù)學(xué)成績作為因變量。[36]具體模型估計(jì)中,為了降低數(shù)學(xué)成績的測量誤差,本研究采用由OECD依據(jù)項(xiàng)目反應(yīng)理論計(jì)算得出的10項(xiàng)數(shù)學(xué)成績的似真值(Plausible Value)。核心自變量為三個(gè)虛擬變量,即海外華裔學(xué)生、目的地國本土學(xué)生、中國學(xué)生。其中,中國學(xué)生成績由我國參與PISA的四省市學(xué)生成績代表,在文中所有模型里均作為參照組。在控制變量方面,本研究選定父母職業(yè)指數(shù)(HISEI)、父母學(xué)歷指數(shù)(HISCED)、家庭教育資源指數(shù)(HEDRES)作為影響學(xué)生成績的家庭特征。[37]學(xué)生家庭特征變量由PISA的學(xué)生調(diào)查問卷(Student Questionnaire)測量所得,對(duì)這三種指數(shù)的測量由“你父親的主要工作是什么”“你母親的最高學(xué)歷是什么”“你家里有多少本書”等43個(gè)題目組成。[38]在此基礎(chǔ)上,本研究進(jìn)一步選取學(xué)生性別和年級(jí)作為控制變量,盡可能降低個(gè)人特征對(duì)結(jié)論的偏誤影響。
表2展示了樣本主要變量的基本統(tǒng)計(jì)情況。在數(shù)學(xué)成績方面,中國學(xué)生與樣本中其他國家學(xué)生的平均成績相差較大,這一現(xiàn)象對(duì)研究假設(shè)3進(jìn)行了驗(yàn)證,證明文化背景與教育政策環(huán)境均不同時(shí)學(xué)生成績存在差異,但這一結(jié)果并不能分辨究竟是何種因素導(dǎo)致了跨國間的學(xué)生成績差異,還需在下文中對(duì)此進(jìn)行進(jìn)一步探討。樣本中學(xué)生的性別比例均衡,學(xué)生年級(jí)指數(shù)的平均數(shù)集中分布在全球均值附近且標(biāo)準(zhǔn)差較小,即多數(shù)學(xué)生為9年級(jí)。其中,中國樣本的家庭教育資源指數(shù)在兩期數(shù)據(jù)中呈現(xiàn)差異,這是由我國2015年和2018年參與省份不同、PISA 2015—2018全球樣本基數(shù)變化所致。但由于本研究不進(jìn)行跨年份比較,因此該差異并不對(duì)研究結(jié)果造成影響。總體來看,本研究所選樣本與PISA數(shù)據(jù)中全球?qū)W生樣本的背景特征相近似。[39]
表2 樣本中主要變量基本統(tǒng)計(jì)情況
模型運(yùn)算中,本研究根據(jù)因變量特點(diǎn)選擇使用似真值回歸分析模型(Plausible Value Regression)。相較于傳統(tǒng)回歸分析,似真值回歸分析可有效針對(duì)多個(gè)似真值組及其權(quán)重進(jìn)行綜合分析,進(jìn)而減少二次分析中的測量誤差并得出更準(zhǔn)確結(jié)果。由于同一國家、同一學(xué)校內(nèi)部學(xué)生的同質(zhì)性較高,因此本模型進(jìn)一步對(duì)回歸系數(shù)的標(biāo)準(zhǔn)誤進(jìn)行了國家—學(xué)校層面的聚類調(diào)整。具體計(jì)量模型如下:
研究假設(shè)檢驗(yàn)上,若系數(shù)β1和β2均顯著,則認(rèn)為學(xué)生成績差異主要受教育政策影響,符合PISA邏輯的政策因素推斷。若系數(shù)β1不顯著且β2顯著,則可認(rèn)為學(xué)生成績差異受文化背景等非政策因素影響,不符合PISA邏輯推斷。任意情景下,若系數(shù)β2顯著,則表示文化背景與教育政策均不同時(shí)學(xué)生成績也相應(yīng)存在差異。
為確定以歷史文化背景為關(guān)鍵的非政策因素和教育政策因素對(duì)學(xué)生成績的影響,本研究依靠上述模型進(jìn)行似真值回歸分析。由于教育政策環(huán)境不同,因此若依據(jù)PISA邏輯則中國四省市學(xué)生與華裔學(xué)生、本土學(xué)生成績皆應(yīng)存在顯著差異。但表3中的結(jié)果并不支持PISA邏輯的推斷。
首先,以PISA 2018樣本為例,澳大利亞(P=0.63)、新西蘭(P=0.61)、加拿大(P=0.59)的華裔學(xué)生與中國四省市學(xué)生成績均不存在顯著差異,也就是說相同文化背景但不同教育政策環(huán)境下的學(xué)生學(xué)習(xí)結(jié)果之間不存在顯著差異。簡言之,雖然華裔學(xué)生在目的地國接受了完整的義務(wù)教育,即與中國四省市學(xué)生教育政策環(huán)境完全不同,在學(xué)習(xí)結(jié)果上卻是近似的。
其次,按照PISA邏輯的推理,教育政策環(huán)境應(yīng)當(dāng)是學(xué)生成績差異的主要解釋因素,然而澳大利亞、新西蘭、加拿大的本土學(xué)生與本國華裔學(xué)生均存在顯著差異(P<0.05),也就是說只要是文化背景不同,即使教育政策相同的情況下,學(xué)習(xí)結(jié)果仍存在顯著差異。
表3 回歸分析模型結(jié)果
上述結(jié)論基礎(chǔ)上,PISA 2015樣本的估計(jì)結(jié)果也顯示出相似規(guī)律,即具有相同教育政策環(huán)境的澳大利亞與新西蘭的本土學(xué)生與本國華裔學(xué)生存在顯著差異(P<0.05),但具有相同文化背景的華裔學(xué)生、中國四省市學(xué)生卻在學(xué)習(xí)成績上近似(P>0.05)。據(jù)此可知,OECD所倡導(dǎo)將PISA測試成績歸因于政策因素的PISA邏輯及其假設(shè)在本文所構(gòu)建的反事實(shí)比較分析框架下并未得到PISA數(shù)據(jù)自身的支撐。
為探究教育政策究竟能在多大程度上解釋不同國家學(xué)生成績差異,厘清政策因素與非政策因素對(duì)PISA成績的相對(duì)影響,本研究運(yùn)用OB分解法(Oaxaca-Blinder Decomposition)將樣本中華裔學(xué)生與本土學(xué)生成績差異分解為特征變量可解釋差異與特征變量未解釋差異兩部分。具體的OB分解運(yùn)算除了納入表2中的特征變量外,還通過添加學(xué)校固定效應(yīng)納入每名學(xué)生的相關(guān)學(xué)校信息。在結(jié)果闡釋上,通過分析特征變量可解釋與未解釋的相對(duì)大小,大致判斷教育政策與非教育政策因素對(duì)華裔學(xué)生與本土學(xué)生成績差異的影響程度,即可解釋部分指向政策因素相關(guān)影響,而未解釋部分指向非教育政策因素的影響。
圖1形象地展示了各國OB分解的結(jié)果,顯示華裔學(xué)生與本土學(xué)生成績差異并不能主要由特征變量解釋,即學(xué)生成績受到可觀的非教育政策因素影響。以PISA 2018樣本OB分解結(jié)果為例,澳大利亞華裔學(xué)生與本土學(xué)生成績的差異分解中,可由特征變量解釋的部分僅占總分差的9.6%(10.2分),而未由特征變量解釋的部分占總分差的90.4%(96.4分);在PISA 2015樣本中,可由特征變量解釋的學(xué)生成績差異占總分差的23.5%(19.9分),而未由特征變量解釋的部分占總分差的76.5%(64.6分)。此外,PISA 2018樣本中新西蘭的OB分解結(jié)果顯示,其可解釋差異為-3.7分,說明在考慮特征變量時(shí),華裔學(xué)生較本土學(xué)生分?jǐn)?shù)更低,但由于未解釋差異的較大影響,最終使華裔學(xué)生高出本土學(xué)生81.8分。
圖1 Oaxaca-Blinder分解結(jié)果
過去二十余年間,以O(shè)ECD的PISA為代表的國際大規(guī)模學(xué)業(yè)評(píng)價(jià)迅速興起,對(duì)世界教育產(chǎn)生了深刻影響。雖然PISA為各國教育研究提供了新的教育評(píng)價(jià)框架與跨國教育數(shù)據(jù)庫,但不少學(xué)者認(rèn)為其PISA邏輯注定會(huì)將全球教育發(fā)展引上狹隘化、功利化的道路。從核心內(nèi)涵上,PISA邏輯過度地將學(xué)生成績與教育政策優(yōu)劣掛鉤,并據(jù)此提出其全球“最佳實(shí)踐”。由此,為了檢驗(yàn)PISA邏輯的可靠性、探究國際學(xué)業(yè)評(píng)價(jià)是否具有識(shí)別教育政策優(yōu)劣的功能,本研究運(yùn)用PISA的原始數(shù)據(jù),構(gòu)建依托反事實(shí)比較分析框架設(shè)計(jì)的準(zhǔn)實(shí)驗(yàn)研究,并以似真值回歸分析和OB分解進(jìn)行PISA邏輯的檢驗(yàn)分析。一方面,似真值回歸結(jié)果顯示,文化背景相似的學(xué)生即使在不同教育政策下也不一定會(huì)產(chǎn)生顯著的成績差異;另一方面,OB分解結(jié)果顯示,即使在同一教育政策環(huán)境下,特征因素對(duì)學(xué)生成績差異的解釋力也極為有限。值得追加闡明的是,考慮到華裔學(xué)生長期生活在目的地國可能存在的文化趨同現(xiàn)象,上述研究發(fā)現(xiàn)應(yīng)被看作一種保守估計(jì)。
據(jù)此,本研究運(yùn)用PISA數(shù)據(jù)質(zhì)疑OECD所宣揚(yáng)的PISA邏輯,發(fā)現(xiàn)過度地將學(xué)生成績歸因于教育政策因素是OECD倡導(dǎo)PISA邏輯的嚴(yán)重誤區(qū),并提出以下啟示。
第一,歷史文化因素和教育政策環(huán)境都對(duì)學(xué)生成績有著重要影響,過度強(qiáng)調(diào)任意一方或者以PISA成績推銷“最佳實(shí)踐”等政策改革方案,是OECD參與全球教育治理的重大局限。雖然從政策績效方面推動(dòng)的“最佳實(shí)踐”具有其獨(dú)特的政治吸引力,但全球教育治理不應(yīng)是趨同式的治理規(guī)訓(xùn),而需在“共商、共建、共享”的理念上關(guān)切各國教育需求,妥善解決成因不同的教育發(fā)展問題。因此,OECD在政策提議中應(yīng)更加重視各國截然不同的教育情境對(duì)教育教學(xué)過程、學(xué)生學(xué)業(yè)結(jié)果的異質(zhì)影響,協(xié)調(diào)好全球教育治理與發(fā)展中國家教育情境化與在地化發(fā)展的關(guān)系。
第二,任何教育體系都不能脫離歷史傳統(tǒng)和社會(huì)環(huán)境而獨(dú)立存在,各國亟需清醒認(rèn)識(shí)PISA邏輯盛行下OECD有關(guān)“最佳實(shí)踐”等政策倡議中經(jīng)常忽視的歷史文化與教育發(fā)展間重要互動(dòng),積極結(jié)合自身教育發(fā)展需要加強(qiáng)全球教育治理的再情境化(re-contextualization)。有學(xué)者歸納認(rèn)為,在PISA邏輯下,OECD將歷史文化因素視為阻礙全球教育政策流動(dòng)的消極因素。[40]但一個(gè)國家和民族立于世界的根本所在是其獨(dú)特的歷史文化底色,全球教育治理不應(yīng)抹去各國教育特色和文化差異。真正擁抱全球化的全球教育治理一定是彰顯各民族特色、凝聚各國人民智慧的多向互動(dòng)。
第三,站在發(fā)展中國家與教育后發(fā)國家的視角,只有牢牢把握教育評(píng)價(jià)標(biāo)準(zhǔn)的制定權(quán),國別教育治理主權(quán)才能完整,教育才能真正服務(wù)于本國社會(huì)發(fā)展需要。相應(yīng)的,全球教育治理中教育評(píng)價(jià)標(biāo)準(zhǔn)的制定與其治理方向的決定權(quán)高度重合。以發(fā)達(dá)國家利益訴求為主體的現(xiàn)行全球教育治理體系下,教育發(fā)展的世界圖景變得異常模板化,各國教育發(fā)展遵循固定且線性的規(guī)律。特別是通過PISA復(fù)雜測量模型的科學(xué)外殼,許多教育后發(fā)國家正在OECD所營造的數(shù)據(jù)與技術(shù)雙重權(quán)威形象下背離本國人才培養(yǎng)的社會(huì)實(shí)際和現(xiàn)實(shí)需求,盲目追逐那些“看似時(shí)髦”(seemingly cosmopolitan)卻脫離本土教育情境的育人框架、勝任力模型與“最佳實(shí)踐”改革方案。鑒于此,加強(qiáng)全球教育治理中教育評(píng)價(jià)標(biāo)準(zhǔn)多元化發(fā)展是有效避免PISA邏輯誤區(qū)的應(yīng)然之策。
第四,重視子女教育是中華民族文化基因的重要組成部分,本研究發(fā)現(xiàn),華裔學(xué)生無論身處何處、在什么樣的教育政策環(huán)境下,學(xué)習(xí)結(jié)果都較本土學(xué)生具有相對(duì)優(yōu)勢(shì),這反映出華裔家庭教育文化中超越教育政策環(huán)境影響的獨(dú)特內(nèi)涵。這種對(duì)子女教育的重視和我國傳統(tǒng)文化高度呼應(yīng),對(duì)當(dāng)今教育發(fā)展有著重要啟發(fā)。鑒于此,應(yīng)更廣泛地發(fā)掘我國家庭教育文化理念在教育現(xiàn)代化進(jìn)程中的積極作用,注重總結(jié)家庭教育經(jīng)驗(yàn)、生成教育文化智慧,利用好國際交流平臺(tái)分享中國家庭教育經(jīng)驗(yàn),為解決國際教育問題貢獻(xiàn)中國思想。