周文輝 趙金敏
研究生教育是國家人才戰(zhàn)略的重要構(gòu)成。為增強本國高端人力資源的競爭力,各國政府均在不同程度上介入研究生教育評估活動,希望借助外部評估來考察研究生培養(yǎng)單位的質(zhì)量。研究生教育外部評估是指“由校外全國性或區(qū)域性的研究生教育質(zhì)量保障機構(gòu)對培養(yǎng)單位所進行的質(zhì)量審核、質(zhì)量評估和社會評價活動”[1]。1981年實施《中華人民共和國學(xué)位條例》后,國務(wù)院成立了學(xué)位委員會和學(xué)科評議組,實行國家集中統(tǒng)一的學(xué)位評審制度。我國研究生教育外部評估隨之誕生,由此建立了研究生教育準入機制,并著手設(shè)立學(xué)位授權(quán)點的質(zhì)量檢查制度和評估機構(gòu)。進入21世紀之后,研究生教育事業(yè)面臨著新的考驗,提升教育質(zhì)量成為我國研究生教育的重要目標。在保障教育質(zhì)量的基礎(chǔ)上,研究生教育外部評估體系日益重視評估的質(zhì)量提升作用,開展了學(xué)位論文抽檢、優(yōu)秀論文評選、一級學(xué)科整體水平評估、學(xué)位授權(quán)點定期評估等項目,形成了常態(tài)化、周期性的評估機制。近十年來,隨著專業(yè)學(xué)位研究生教育蓬勃發(fā)展,專業(yè)學(xué)位評估工作愈發(fā)彰顯出現(xiàn)實價值,面向?qū)I(yè)學(xué)位的評估項目應(yīng)運而生。研究生教育外部評估的評估對象由學(xué)術(shù)學(xué)位延伸至專業(yè)學(xué)位,評估主體由教育行政部門拓展到第三方評估機構(gòu),圍繞著學(xué)位點、學(xué)科、專業(yè)、學(xué)位論文等要素,分別在研究生教育的起點、過程和終點設(shè)置了相應(yīng)的評估項目,形成了對研究生教育全階段的完整評估體系。
歷經(jīng)40余年建設(shè)與發(fā)展,具有中國特色的研究生教育外部評估體系初步成型。從我國研究生教育評估的現(xiàn)狀來看,外部評估是評估體系中的核心內(nèi)容。與其他國家相比,我國研究生教育外部評估主要由國家行政部門主導(dǎo),且外部評估對內(nèi)部評估具有強大的引導(dǎo)和約束作用是中國研究生教育評估的本土特征[2]。然而從實踐效果來看,外部評估在回應(yīng)質(zhì)量問題的同時也產(chǎn)生了諸多非預(yù)期后果。如何保證研究生教育外部評估的科學(xué)性和有效性,尤其是如何達成“以評促改”的初心,是當前教育管理部門以及高校面臨的艱巨挑戰(zhàn)。鑒于此,本研究基于具有代表性和影響力的評估項目方案,呈現(xiàn)外部評估體系整體上的政策現(xiàn)狀;采用半結(jié)構(gòu)化訪談的方式對國家教育行政部門的評估行動者、高校管理部門負責(zé)人、院系行政人員以及高校教師進行深度訪談,以了解評估政策的實踐面貌和制約評估效果的現(xiàn)實問題;在此基礎(chǔ)上,思考與挖掘問題背后的成因,探討完善評估體系的可行路徑。
目前,我國研究生教育已基本形成了常態(tài)監(jiān)測、動態(tài)調(diào)整、多元綜合的外部評估體系。其中,學(xué)位授權(quán)審核、學(xué)位授權(quán)點合格評估、學(xué)科評估、專業(yè)學(xué)位水平評估、學(xué)位論文抽檢、“雙一流”建設(shè)及其成效評價等評估項目,對研究生培養(yǎng)單位具有較強引導(dǎo)和約束作用,在展現(xiàn)研究生教育外部評估體系的現(xiàn)狀與特征時有著一定的代表性。鑒于此,本研究通過對以上項目的評估要素進行梳理,并展開細致描述和分類歸納,希望呈現(xiàn)研究生教育外部評估體系的政策現(xiàn)狀。
目前我國研究生教育外部評估形成了相對穩(wěn)定的政策方案,為評估項目提供了制度保障和實踐指導(dǎo)。就評估主體而言,外部評估體系形成了國家教育行政部門組織實施、專業(yè)協(xié)會評議、高校積極參與的多元協(xié)同模式,具體負責(zé)落實評估活動的官方機構(gòu)或半官方機構(gòu)主要包括國務(wù)院學(xué)位委員會、教育部學(xué)位與研究生教育發(fā)展中心、省級學(xué)位委員會,直接參與教育評估的人員一般來自國務(wù)院學(xué)位委員會、省級學(xué)位委員會、國務(wù)院學(xué)科評議組、全國專業(yè)學(xué)位研究生教育指導(dǎo)委員會、高校領(lǐng)導(dǎo)者、學(xué)科專家和其他行業(yè)專家。就評估客體而言,學(xué)位授權(quán)審核和學(xué)位授權(quán)點合格評估面向?qū)W位授權(quán)單位、研究生學(xué)位點,學(xué)科評估、專業(yè)學(xué)位水平評估分別用來評估一級學(xué)科和專業(yè)學(xué)位,學(xué)位論文抽檢針對研究生學(xué)位論文,“雙一流”建設(shè)遴選評價面向國內(nèi)高水平大學(xué)與學(xué)科,“雙一流”建設(shè)成效評價則針對已入選“雙一流”建設(shè)的高校與學(xué)科。為實現(xiàn)質(zhì)量保障與質(zhì)量提升的雙重目標,現(xiàn)有的外部評估項目涵蓋了合格評估、水平評估和選優(yōu)評估多種類型。學(xué)位授權(quán)審核、學(xué)位授權(quán)點合格評估和學(xué)位論文抽檢類屬合格評估,旨在保證研究生教育的質(zhì)量底線;學(xué)科評估、專業(yè)學(xué)位水平評估和“雙一流”建設(shè)及其成效評價致力于提升研究生教育的整體實力和國際競爭力。在評估周期方面,當前實施的外部評估主要是周期性的常態(tài)化評估。伴隨著評估活動的更新迭代,評估方案也呈現(xiàn)出歷時性和創(chuàng)新性,推動了外部評估體系的完善與發(fā)展(見表1)。
表1 研究生教育外部評估項目的評估主客體、類型與周期
評估標準及其實施程序關(guān)乎評價結(jié)果的科學(xué)性和可靠性。我國研究生教育外部評估的標準體現(xiàn)在評估指標體系中,針對特定的評估內(nèi)容,各評估項目設(shè)置了一級指標(見表2)??紤]到參評對象的異質(zhì)性,評估項目的指標體系呈現(xiàn)出分類設(shè)計的趨勢。例如,學(xué)科評估按一級學(xué)科設(shè)置了99套指標體系,根據(jù)各學(xué)科特色分別設(shè)置17~21個三級指標;專業(yè)學(xué)位水平評估針對專業(yè)學(xué)位類別建立了36套指標體系,按專業(yè)學(xué)位特點分別設(shè)置15~16個三級指標;學(xué)位授權(quán)點合格評估的指標體系由參評對象結(jié)合院校與專業(yè)特色自主制定。在評估的實施過程中,外部評估不斷創(chuàng)新評估工具,以指標體系為紐帶,借助調(diào)查問卷和數(shù)據(jù)平臺,將教育評估專家、各方利益相關(guān)者和評估數(shù)據(jù)結(jié)合起來。盡管不同評估項目在實施程序的細節(jié)上有所差異,但均詳細規(guī)定了各級各類參與者在評估過程中的職責(zé),建立了權(quán)責(zé)清晰、分工明確、執(zhí)行有力的評估管理體系。該體系總體上包括確定評估范圍、制定評估方案、收集信息、組織評議和發(fā)布評估結(jié)果幾個環(huán)節(jié)(見表2)。
表2 研究生教育外部評估項目的評價標準與實施程序
評估結(jié)果的發(fā)布影響著大學(xué)的社會聲譽甚至大學(xué)排名,評估結(jié)果的應(yīng)用則關(guān)系著外部評估項目的影響力,因此評估結(jié)果的發(fā)布和應(yīng)用容易引起廣泛關(guān)注。在結(jié)果發(fā)布方面,評估項目依據(jù)評估目標的差異,采取了不同的結(jié)果發(fā)布形式。一般而言,合格類型的評估項目,其結(jié)果公開程度較高。例如,學(xué)位授權(quán)審核需面向社會公開高校的申請材料,當中包括申請單位在師資隊伍、培養(yǎng)條件等方面的詳細信息;高校在學(xué)位授權(quán)點合格評估中需要公開發(fā)布《研究生教育發(fā)展質(zhì)量年度報告》和《學(xué)位授權(quán)點建設(shè)年度報告》。類屬水平評估、選優(yōu)評估的項目通常以劃分等級或區(qū)間的形式來呈現(xiàn)評估結(jié)果,不發(fā)布參評對象的詳細信息。如學(xué)科評估與專業(yè)學(xué)位水平評估通過等級分檔的形式發(fā)布結(jié)果,“雙一流”建設(shè)成效評價以區(qū)間和梯度分布呈現(xiàn)綜合評價結(jié)果(見表3)。在結(jié)果應(yīng)用方面,外部評估已經(jīng)成為我國配置研究生學(xué)位點、招生計劃、撥款數(shù)額等教育資源的重要手段之一。例如,教育行政部門將學(xué)位授權(quán)點合格評估結(jié)果作為監(jiān)測“雙一流”建設(shè)、地方高水平大學(xué)及學(xué)科建設(shè)項目的重要內(nèi)容;“雙一流”建設(shè)遴選及其成效評價與高校的資金、政策支持密切相關(guān);學(xué)位論文抽檢結(jié)果是確定學(xué)位授予資格、導(dǎo)師招生資格的重要依據(jù)。由此,研究生教育外部評估使高校產(chǎn)生質(zhì)量保障的壓力,促使其加強內(nèi)部監(jiān)管和建設(shè)。
表3 研究生教育外部評估項目的評估結(jié)果發(fā)布與應(yīng)用
現(xiàn)階段我國研究生教育外部評估體系在制度建設(shè)方面取得了一定成效,對于研究生教育的實踐改進也發(fā)揮了積極作用。但相比總結(jié)成就,更重要的是發(fā)現(xiàn)其中的不足?;趯φ攥F(xiàn)狀和訪談資料的歸納分析發(fā)現(xiàn),我國研究生外部評估體系在評價指標、評估數(shù)據(jù)采集和評估結(jié)果方面尚存在一些不足,有待改進。
在不同國家的外部評估中,評估指標體系的詳細程度存在較大差異,一些國家僅為評估提供一級指標,由參評對象自主選取二級指標和三級指標。除“雙一流”建設(shè)評價之外,我國多數(shù)研究生教育評估活動設(shè)計了明確的指標體系,每個指標下包含多個子指標,并賦以具體的分值和權(quán)重。在詳盡的評價系統(tǒng)中,指標體系的科學(xué)性對于評估結(jié)果的信服力至關(guān)重要。然而,當前評估活動的指標體系設(shè)計還存在缺陷,致使指標體系的認可度未能達到預(yù)期、評估結(jié)果遭受批評。
一是過多使用教育投入代替教育產(chǎn)出。研究生教育評估最終指向教育質(zhì)量,體現(xiàn)為人才培養(yǎng)、科學(xué)研究和社會服務(wù)等大學(xué)職能的履行狀況。因此,評估需要圍繞著人才培養(yǎng)質(zhì)量、科學(xué)研究水平和社會服務(wù)能力等教育產(chǎn)出來建立指標體系。但我國研究生教育評估通常使用師資隊伍、學(xué)術(shù)平臺等教育投入指標,以及科研成果等部分可視化的教育產(chǎn)出指標來代表整體的教育質(zhì)量,社會服務(wù)和人才培養(yǎng)在指標體系中的地位需要進一步凸顯。
二是評估指標共線性較高。各個評價指標之間應(yīng)相對獨立,但我國多個研究生教育評估指標體系存在共線性明顯的問題。例如,學(xué)位授權(quán)審核中“學(xué)位建設(shè)期”與“碩博學(xué)位授權(quán)時長”、“科學(xué)研究基礎(chǔ)”與“學(xué)科基礎(chǔ)”之間具有明顯的共線性;學(xué)科評估中,師資隊伍的人才計劃數(shù)據(jù)與科研論文、項目和獎勵等指標之間重復(fù)度較高。這會導(dǎo)致部分指標被重復(fù)計算,有損評估結(jié)果的真實性和全面性。
三是“重量輕質(zhì)”的評價思維難以克服。伴隨著數(shù)字測量在評估指標體系中的大面積、高頻度使用,以數(shù)字為規(guī)訓(xùn)工具的量化思維主導(dǎo)了研究生教育質(zhì)量評價,評估工作淪為“計件”、教師的專業(yè)工作淪為“掙工分”[3]。盡管近年來研究生教育評估有意識地完善評估方法,評估體系也表現(xiàn)出客觀評價為主、主觀評價為輔,量化評價為主、聲譽評價為輔的特點,但在本質(zhì)上仍難以克服結(jié)果導(dǎo)向的量化思維。這種數(shù)字依附容易導(dǎo)致評估體系僵化、人的主體地位淡化,最終使評估成為“數(shù)字游戲”[4]。
在外部評估中,高校不僅是被評議者,同時又充當參與者的角色,需要配合評估主體為其提供所需的評估信息。目前我國實施了多項周期性的常態(tài)化外部評估項目,可以說研究生培養(yǎng)單位常年處于評估活動的監(jiān)測之下。如學(xué)位論文抽檢的評估周期為1年、學(xué)位授權(quán)點合格評估需要培養(yǎng)單位每年編制《研究生教育發(fā)展質(zhì)量年度報告》和《學(xué)位授權(quán)點建設(shè)年度報告》,高校在每輪“雙一流”建設(shè)中期和終期均需開展自我評價。與此同時,我國研究生教育的培養(yǎng)規(guī)模迅速擴大、學(xué)位類型日益豐富,加之評估程序日益復(fù)雜、評估指標更加精細(如學(xué)科評估設(shè)置了99套指標體系,按學(xué)科特色分別設(shè)置了17~21個三級指標)。這些變化使高校的評估工作量極大增加,參評單位需要收集與整理海量的評估信息,花費在評估活動上的時間成倍增長。
雖然有的評估組織者將自身定位為第三方非行政性評估人員,但他們?nèi)噪`屬于政府部門或事業(yè)單位,具有半官方性質(zhì),這導(dǎo)致評估人員兼具“督學(xué)”和“督政”的雙重角色,使教育評估長期伴有行政主導(dǎo)色彩[5]。在行政問責(zé)性的模式下,評估會成為高校在一段時期內(nèi)的工作重點,參評對象始終處于自上而下的問責(zé)壓力中,并全力迎合評估的要求。日益增加的評估任務(wù)層層貫徹落實到高校行政部門、院系、學(xué)科、個人,導(dǎo)致高校在一定程度上犧牲辦學(xué)資源、教育教學(xué)秩序、教師的時間和精力。有學(xué)者指出:“每次評估都要求填寫大量的表格,要求參評學(xué)校準備大量的佐證材料,這些繁瑣的工作浪費了基層管理工作者和教師很大一部分時間?!盵6]評估“進?!辈粌H增加高校人員的工作負擔(dān)、影響其日?;顒樱L此以往還容易導(dǎo)致參評對象失去質(zhì)量建設(shè)的積極性和主動性[7](P16)。
我國研究生教育外部評估以政府為主導(dǎo),評估活動天然地具備制度合法性。參評對象為了確立自身的合法性,需要接受和采納評估項目提出的要求[8]。由于我國研究生教育外部評估的權(quán)威性強、建設(shè)周期長,因此參評對象一般按照評估指標的內(nèi)容來替代原先的發(fā)展規(guī)劃,致使不同類型、不同層次的院校的建設(shè)方向呈現(xiàn)相似性。由此,評估主導(dǎo)部門通過評估制度影響乃至形塑了研究生教育的發(fā)展方向,利用標準化的指標體系實現(xiàn)對研究生教育質(zhì)量的簡化和統(tǒng)一,助推了參評對象的同質(zhì)性[9]。
外部評估不僅自身具有同質(zhì)性生產(chǎn)的功能,而且它還通過評估指標的相似性來強化參評對象之間的同質(zhì)化。評估指標的相似性首先體現(xiàn)為不同評估項目的指標體系在內(nèi)容上高度重合,如學(xué)位授權(quán)審核、學(xué)位授權(quán)點合格評估、學(xué)科評估以及“雙一流”建設(shè)成效評價的一級指標基本上都是圍繞師資隊伍、人才培養(yǎng)、教學(xué)條件、科學(xué)研究等維度,評估項目之間的指標差異性和針對性有待突出。其次,學(xué)科間的評估指標差異性不足。比較明顯的表征是學(xué)位論文抽檢中,某些省份的藝術(shù)學(xué)科不合格率(43.33%)遠遠超過平均不合格率(4.04%)[10],而理工科等自然學(xué)科的合格率則長期處于前列[11]。自然科學(xué)和邏輯實證主義始終居于學(xué)科聲譽的塔尖,其他學(xué)科的合法性只能通過模仿其方法和范式才能取得[12]。這意味著不僅相同類型的參評對象呈同質(zhì)化的發(fā)展趨勢,甚至不同性質(zhì)的參評對象也朝著同質(zhì)化方向發(fā)展??梢姡u估文化及其附帶的同質(zhì)化基因在研究生教育中留下了深刻印記。
美國學(xué)者斯塔弗爾比姆(D.L.Stufflebeam)就教育評價的目的有過經(jīng)典論述,他認為評價最重要的意圖不是為了證明,而是為了改進。然而,我國研究生培養(yǎng)單位存在的缺陷難以在外部評估中得到體現(xiàn)和反饋。當前,研究生教育資源與評估之間建立了穩(wěn)固的關(guān)系,如學(xué)科評估、“雙一流”建設(shè)成效評價的結(jié)果成為我國政府財政撥款、學(xué)校發(fā)展規(guī)劃的重要依據(jù)。這種“論功行賞”式的結(jié)果應(yīng)用使外部評估成為一種利害性評估[13]。此外,外部評估需要向社會公開評估結(jié)果,即使是合格類的評估結(jié)果也會成為培養(yǎng)單位的質(zhì)量符號和標簽,從而影響院校的社會聲譽和招生質(zhì)量。例如,一些高校將《研究生教育發(fā)展質(zhì)量年度報告》視為招生宣傳。由此,外部評估在聯(lián)系貨幣資本之外還具有了象征性資本,無形中給參評對象造成壓力。
為了在競爭中取得優(yōu)勢,高校傾向于凸顯優(yōu)勢而非探究問題,這也導(dǎo)致外部評估難以發(fā)揮診斷與改進功能。在部分高校評估行動者的理解中,外部評估遵循競賽思維,評估工作等同于“寫本子”,需要通過文字功夫、數(shù)據(jù)拆分重組等“策略”來包裝自己,以此獲取與評估結(jié)果相對應(yīng)的教育資源。例如,合格評估存在學(xué)位授權(quán)單位的自我評估深度不足、同行評審專家大多給予正面積極的評價等問題[14];學(xué)科評估中存在資源整合亂象,甚至是數(shù)據(jù)造假、學(xué)術(shù)不端等行為[15]。從客觀上來說,適當參考評估結(jié)果能夠為教育管理部門降低決策失誤的風(fēng)險,但當評估結(jié)果成為教育決策的主要工具時,評估則容易催生大學(xué)急功近利的不良風(fēng)氣。此外,評估組織者未能形成健全的反饋機制,在結(jié)果反饋上存在重告知輕改進的傾向[15](P111)。評估組織部門一般僅通過公告、通知等形式將結(jié)果反饋給參評對象,同時學(xué)科評估與專業(yè)學(xué)位水平評估雖然會給參評對象提供詳細的反饋報告,但也只是告知其在各項指標上的排名情況,因此專家咨詢的功能未能充分體現(xiàn)。
由上可見,研究生教育外部評估中還存在一些問題,然而這些問題更多的是研究生教育外部評估體系中存在的表象問題,只有對上述問題表征的深層原因進行充分挖掘,才能更有針對性地構(gòu)建外部評估體系的改革路徑和調(diào)適措施。研究發(fā)現(xiàn),以下幾方面認識誤區(qū)和實踐偏差是影響評估有效性的重要原因。
研究生教育外部評估的最終指向不是評估本身,而是研究生教育質(zhì)量,因此評估活動的評價標準取決于對教育質(zhì)量的界定和理解。阿斯?。ˋstin)將質(zhì)量觀分為神秘的(mystical)、聲譽的(reputational)、資源的(resources)、結(jié)果的(outcomes)和增值的(value-added)五種類型,其中后四種質(zhì)量觀已經(jīng)有了相應(yīng)的測量方法[16]。從質(zhì)量觀的多樣化可以發(fā)現(xiàn),教育質(zhì)量不僅在定義上缺乏共識,而且在構(gòu)成要素上也無法統(tǒng)一,要制定獲得各方認可的評價標準存在非常大的難度?,F(xiàn)實情況是,不同群體的利益相關(guān)者選擇有利于自身利益合法化的概念來評定研究生教育質(zhì)量[17]。雖然政府評估行動者在我國評估活動中占據(jù)主導(dǎo)地位,但在評估標準的制定方面,他們通常聽從學(xué)術(shù)帶頭人的意見,可以說高校人員把控著研究生教育評估的標準。在阿斯汀的五種質(zhì)量觀中,教育者傾向于采用資源質(zhì)量觀來定義質(zhì)量,將師生比、生均經(jīng)費、實驗室規(guī)模等教育資源等同于教育質(zhì)量,因為教育質(zhì)量與資源建立起聯(lián)系后,大學(xué)可以借助外部評估獲取政府的財政支持,同時可以減輕自身在保障教育質(zhì)量中的責(zé)任[18]。
隨著質(zhì)量觀不斷發(fā)展和演變,公眾和政府對結(jié)果質(zhì)量觀的呼聲日益增長。由于教育產(chǎn)出具有不可視化、滯后性等特點,評估標準制定者開始使用科研績效來代表教育成果,將教育產(chǎn)出轉(zhuǎn)化為論文、項目、獎項等顯性指標,然而國內(nèi)外實證研究均顯示科研產(chǎn)出與教學(xué)效果之間不具有正相關(guān)關(guān)系[19][20]。此外,聲譽質(zhì)量觀在評估體系中也有所體現(xiàn),如學(xué)科評估和專業(yè)學(xué)位水平評估增加了聲譽評價。從現(xiàn)實情況來看,我國研究生培養(yǎng)單位的科研產(chǎn)出、社會聲譽與教育投入之間息息相關(guān),由此看來評價標準依然囿于資源質(zhì)量觀的框架中。資源質(zhì)量觀雖然極大地調(diào)動了高校領(lǐng)導(dǎo)者參與評估的積極性,但實際上難以真實反映研究生教育的成效,而且容易造成院校和學(xué)科之間的“馬太效應(yīng)”。更嚴重的是,評價體系過度依賴這類規(guī)模性指標后,教育評估開始邁入“五唯”陷阱,整個研究生教育系統(tǒng)也處于盲目追求“投入最大化”的境地。
研究生教育外部評估體系是由多項評估項目共同組成的整體,需要處理好系統(tǒng)整體和項目元素之間的關(guān)系。目前我國研究生教育外部評估項目類型眾多,既有來自同一層級不同部門牽頭組織的評估項目(如學(xué)科評估與專業(yè)學(xué)位水平評估由學(xué)位中心下的不同部門實施),也有來自國家、?。ㄗ灾螀^(qū)、直轄市)等不同層級的項目(如博士、碩士學(xué)位點授權(quán)由國務(wù)院學(xué)位委員會和省級學(xué)位委員會分別負責(zé))。從評估項目的組織單位來看,領(lǐng)導(dǎo)研究生教育評估的國家部門有國務(wù)院學(xué)位委員會及其辦公室、國務(wù)院教育督導(dǎo)委員會及其辦公室等,負責(zé)組織與落實的行政部門和專業(yè)組織包括教育部學(xué)位中心、教育評估院、國務(wù)院學(xué)位委員會學(xué)科評議組和全國專業(yè)學(xué)位研究生教育指導(dǎo)委員會等。然而,由于統(tǒng)籌規(guī)劃不足,從事研究生教育外部評估工作的部門缺少歸口管理,評估主體各自為政,評估項目之間的數(shù)據(jù)不能共享,造成了研究生教育評估多頭管理、評估內(nèi)容重復(fù)交叉、評估數(shù)據(jù)多次提交的現(xiàn)象,評估任務(wù)往往呈現(xiàn)多、散、急的特點。這不僅人為增大了各方評估行動者的工作量,而且不同評估部門在數(shù)據(jù)采集時存在口徑不一致的問題,相似的評估內(nèi)容還可能出現(xiàn)結(jié)果相差較大的情況,由此導(dǎo)致部分參評對象質(zhì)疑評估結(jié)果的真實性,并引發(fā)其對外部評估的反感情緒。
我國多數(shù)研究生教育外部評估部門代表著政府的意志,評估行動者將外部評估視為監(jiān)測研究生教育質(zhì)量的技術(shù)手段。在技術(shù)理性的視角下,評估人員必須將質(zhì)量這一虛幻概念轉(zhuǎn)化為可審計的標準化概念,其方法是通過規(guī)定清晰可識別的參與者、設(shè)計可預(yù)測結(jié)果的步驟、采用顯性可量化的指標來簡化教育質(zhì)量的內(nèi)涵[21]。利用技術(shù)視角來指導(dǎo)評估實踐是有益且必要的,但倘若將評估僅僅視為一種技術(shù)過程,則具有明顯的局限性。
第一,受技術(shù)理性指導(dǎo)的評估活動為了實現(xiàn)質(zhì)量概念的標準化,傾向采用整齊劃一的評價標準,強調(diào)參評對象的共同點、排斥其特異性[22]。這反映在外部評估中的表征,就是采用高度相似的指標體系評價各具特點的參評對象,導(dǎo)致質(zhì)量只是等同于符合常規(guī)的標準,無法識別“出類”和“拔萃”的培養(yǎng)單位,最終抑制評價對象的多樣性和特色化,造成“千校一面”的趨同現(xiàn)象。第二,以技術(shù)理性為設(shè)計理念的評估預(yù)設(shè)了不同利益相關(guān)者擁有一致的行動目標,并認為技術(shù)改進能夠克服評估中面臨的問題[23]。然而,評估系統(tǒng)和高校組織的復(fù)雜性意味著只有少數(shù)人具有共同目標,評估的技術(shù)理性觀點往往掩蓋了評估活動的行政屬性。多數(shù)外部評估當中隱含著管理心態(tài)和控制形式,但評估的技術(shù)流程將其包裝成平等的治理過程,這就忽視了參評對象的意愿,也容易掩蓋高校內(nèi)部的權(quán)力分配和資源競爭[24]。例如,學(xué)科評估中“不敢不參評”“資源整合”等現(xiàn)象便是行政問題的集中體現(xiàn)。近年來,我國研究生教育評估雖然在指標體系、實施過程等方面都較以往有了許多改進,并試圖從方法和技術(shù)層面處理好科學(xué)性、精準性、操作性、國際化、本土化這些關(guān)系[7](P70),但評估體系中的深層矛盾仍難以破除??梢?,技術(shù)理性也在一定程度上限制了評估行動者解決問題的思路。
教師參與評估是保證評估效果和教學(xué)質(zhì)量的“黃金準則”[25]。教師在評估制度下的工作環(huán)境及其對制度的回應(yīng),與評估成效休戚相關(guān)。盡管我國高校教師參與了研究生教育評估活動,但外部評估的設(shè)計和執(zhí)行往往是直接施加于高校教師的,普通教師幾乎沒有機會對評估目標、評價標準和評價流程提出意見,他們的作用僅限于向評估人員提供繁復(fù)數(shù)據(jù),而評估的要求卻最終傳導(dǎo)至教師身上,并顯著增加其工作壓力[26]。這表明高校教師不僅在研究生教育評估的制度設(shè)計上沒有話語權(quán),而且在評估實施過程中也沒有適應(yīng)的余地,相反卻需要接受評估對自身工作和職業(yè)生涯產(chǎn)生的重大影響。
有學(xué)者指出,“教師在評估中處于邊緣化的位置”,當大學(xué)教師認為自己在評估體系中是“局外人”時,他們會產(chǎn)生被管理者和外部評估機構(gòu)不重視或不信任的感覺[27]。已有研究發(fā)現(xiàn),多數(shù)高校教師對評估活動持負面看法,教師們認為評估侵犯了自己的專業(yè)自主權(quán),并且多數(shù)時候是一種管理活動而非質(zhì)量提升活動[15](P109)[28]。外部評估一方面要求教師準備大量文件資料和填寫表格,犧牲教師從事直接提高質(zhì)量的活動時間;另一方面,區(qū)別對待教師的科研工作和教學(xué)工作,將教師的工作重心引向?qū)W術(shù)研究、偏離教書育人。這些做法會導(dǎo)致教師反感、批評甚至抵制外部評估。需要指明的是,評估本身并不產(chǎn)生質(zhì)量,質(zhì)量提升以一線教師主動投注精力為前提[29]。倘若外部評估活動無法與基層教師的質(zhì)量改進工作建立聯(lián)系,那么“以評促改”的效果不顯著便成為必然結(jié)果。
為了破除研究生教育外部評估體系中的問題,糾正其中的認識誤區(qū)和實踐偏差,未來可通過培育第三方評估機構(gòu)、搭建研究生教育監(jiān)測數(shù)據(jù)平臺、強化研究生教育督導(dǎo)、開展研究生教育元評估來建成更加成熟有效的評估體系。
評估機構(gòu)對研究生教育外部評估的設(shè)計與實施至關(guān)重要,其職責(zé)包括設(shè)計評估方案、遴選專家、構(gòu)建評估指標體系、采集與整理數(shù)據(jù)、分析數(shù)據(jù)、協(xié)調(diào)與匯總專家意見、給出評估結(jié)果和撰寫評估報告等。在“管辦評分離”的高等教育管理體制下,獨立的第三方評估機構(gòu)理應(yīng)成為研究生教育外部評估的主體。第三方評估機構(gòu)一般圍繞著特定的評估目標組建而成,具備專業(yè)的評估隊伍和充足的評估時間,能夠確保評估活動的專業(yè)性[30]。此外,獨立的第三方評估機構(gòu)具有高度自治性,與政府教育部門不存在隸屬關(guān)系,能夠避免出現(xiàn)政府部門兼任“運動員”與“裁判員”的情況,與高校也不存在利益相關(guān)關(guān)系,因而其評估結(jié)果的客觀性和可信度更強。在研究生教育外部評估的改革實踐中,我國亟需培育獨立的第三方評估機構(gòu)。一方面,政府作為研究生教育的宏觀調(diào)控者,需有意識地培育多個第三方評估機構(gòu),可通過項目委托、責(zé)任授權(quán)、簽訂委托代理合約等形式,將外部評估項目讓渡給社會上的第三方評估機構(gòu),使其獲得代理人的獨立身份,形成機構(gòu)之間的多元特色和良性競爭,促使第三方評估機構(gòu)不斷完善服務(wù)功能。另一方面,第三方評估機構(gòu)不能僅呈現(xiàn)最終的評估結(jié)果,也需要規(guī)范地說明評估標準和評估流程、加強信息公開,允許社會各界對其進行監(jiān)督,從而提升自身的專業(yè)性與公信力。
了解研究生培養(yǎng)單位的基本狀態(tài)、收集數(shù)據(jù)信息是開展研究生教育評估的前提。研究生教育監(jiān)測評估能夠借助現(xiàn)代信息技術(shù)常態(tài)化地收集教育系統(tǒng)中關(guān)于研究生教育各要素的信息,包括學(xué)科建設(shè)、師資隊伍、人才培養(yǎng)、科研情況等。評估部門可以根據(jù)需求進行數(shù)據(jù)挖掘與分析,從而判斷教育系統(tǒng)中各單位研究生教育發(fā)展狀況,方便指導(dǎo)其持續(xù)發(fā)展[31]。監(jiān)測評估的核心在于加強教育評估的信息化,建立研究生教育評估的大數(shù)據(jù)平臺。對于評估組織者來說,監(jiān)測數(shù)據(jù)平臺能夠?qū)崿F(xiàn)數(shù)據(jù)資源的開放共享和分級使用,在統(tǒng)一數(shù)據(jù)口徑的情況下滿足不同評估部門的訴求,提高不同評估項目的精確性,為統(tǒng)籌管理多個評估項目創(chuàng)造可能性。對于參評對象而言,監(jiān)測評估有助于提高數(shù)據(jù)使用率,減輕提交數(shù)據(jù)、重復(fù)收集的工作負擔(dān),同時避免評估“進?!庇绊懡逃虒W(xué)日常工作。教育主管部門未來需依托高校、省域和國家三個層面,搭建研究生教育質(zhì)量監(jiān)測數(shù)據(jù)平臺,利用區(qū)塊鏈等信息技術(shù)優(yōu)勢,實現(xiàn)對研究生教育全過程的數(shù)據(jù)采集、存儲和共享,推動研究生教育監(jiān)測評估的深度開展。
我國研究生教育外部評估存在診斷與改進功能難以發(fā)揮的問題,而研究生教育督導(dǎo)恰好能彌補這一缺點,既能夠監(jiān)督研究生教育活動的效果、反饋教育實際情況,又可以指導(dǎo)教育工作實踐、調(diào)整教育生態(tài)體系[32]。具體而言,研究生教育督導(dǎo)可通過外部督導(dǎo)、內(nèi)部督導(dǎo)兩種形式來發(fā)揮診斷與指導(dǎo)功能。外部督導(dǎo)依托材料考察、實地調(diào)研、遠程聽課等方式,檢查高校的研究生教育是否符合人才培養(yǎng)規(guī)律、是否執(zhí)行相應(yīng)的教育政策,指出培養(yǎng)單位存在何種問題,推動高校明確責(zé)任主體、加強原因分析和后續(xù)整改。與外部督導(dǎo)相比,內(nèi)部督導(dǎo)機構(gòu)能夠洞察內(nèi)部獨特的教育生態(tài),并進行深入的自我反省和自我修正。研究生培養(yǎng)單位內(nèi)部的督導(dǎo)機構(gòu)需要重視外部評估結(jié)果的分析與應(yīng)用,對評估結(jié)果進行多類型、深層次的數(shù)據(jù)挖掘,履行內(nèi)部自查、再評估、指導(dǎo)、咨詢等職能,建立起內(nèi)部質(zhì)量保障和外部評估之間的聯(lián)系,使研究生教育評估體系成為一個自律與他律并存的有機整體。
元評估是按照一定的標準或原則對評估工作本身進行評估的活動,其目的是判斷評估工作的質(zhì)量[33]。研究生教育元評估是加強研究生評估制度建設(shè)、完善評估工作的重要手段。我國研究生教育評估尚未進入成熟階段,在評估項目的諸多要素上有待改進,積極開展元評估是適應(yīng)新時代教育評價改革的現(xiàn)實要求。研究生教育元評估需描述教育評價的全過程,考察評估項目本身的科學(xué)性和有效性,對評估理念、評估技術(shù)和評估主客體的行為表現(xiàn)進行價值判斷,幫助評估活動審視和反思自身,并為研究生教育評估體系提供激勵、監(jiān)督和指導(dǎo)。目前我國研究生教育元評估活動尚未發(fā)育成熟,未來首先需要建設(shè)符合中國研究生教育評估實際情況的元評估理論,明確元評估的目的、意義、作用和工作重點;其次,要將元評估納入研究生教育外部評估體系中,在研究生評估項目的設(shè)計方案中設(shè)置元評估程序,使其制度化;最后,應(yīng)積極培育元評估組織,為研究生教育外部評估項目提供診斷報告,反饋教育評估活動中的真實問題及深層原因,從而形成外部評估體系的改進機制。
正如蓋格指出:“評估不可能做到精確無誤,評估結(jié)果也難以完全令人信服,要獲得各方一致公認的評估結(jié)果則更難?!盵34]由于教育系統(tǒng)和評估體系自身的復(fù)雜性,研究生教育外部評估不可避免地存在局限、面臨爭議。研究生教育外部評估是十分復(fù)雜的研究課題,如何發(fā)現(xiàn)評估問題、提升評估實效,仍然需要大量的思辨和實證研究。未來的研究生教育評估改革一方面可以依據(jù)已有研究成果,革除外部評估體系中的偏誤,另一方面也應(yīng)意識到外部評估僅是質(zhì)量保障手段中的一種,不可過分放大和神化外部評估的作用,而應(yīng)積極尋求外部評估與其他教育質(zhì)量保障手段的協(xié)同和互補。