常桐善
(1.加州大學 校長辦公室,美國加州 奧克蘭 94598; 2.華中科技大學 教育科學研究院,湖北 武漢 430074)
評估是高等教育運行的核心部分之一,也是保障教育質量、踐行社會問責的關鍵。但如何確保評估的有效性,尤其是完成以評促改之初心,仍然是當前教育管理部門以及高校面臨的艱巨挑戰(zhàn)。美國高等教育評估已有一個多世紀的歷史,為美國高等教育發(fā)展,尤其是高質量大學群體的形成發(fā)揮了巨大作用,但評估效果仍然有與時俱進的提升空間。中國從21世紀初開始對高校本科辦學質量和學科進行評估,經過二十多年的發(fā)展建設,已初步形成了反映中國高等教育辦學特色的模式,但成就、成效與困境并存。就中美高等教育評估而言,建設具有凝聚力的評估文化是改進評估效果、擺脫困境的關鍵所在。如理查德·賀士(Richard Hersh)和理查德·克靈(Richard Keeling)所強調的,營造校園評估文化是提升評估效果的關鍵……大學必須通過重構評估文化凸顯大學教育和學習的優(yōu)先地位[1]。翟亞軍和王戰(zhàn)軍也指出:“重塑評估制度、重構評估倫理和重塑評估文化,營造優(yōu)質高等教育評估軟環(huán)境,已成為提升高等教育評估質量的迫切需要?!盵2]
首先,美國常用的與評估活動相關的術語包括“evaluation”“assessment”“accreditation”“review”“appraisal”等。這些術語翻譯成中文時常用“評價”“評估”“認證”“審核”等。除了“appraisal”通常是指教職員工的績效評價外,其他幾個術語雖然有各自特定的意思,如“assessment”常指學生學習成果評估,“accreditation”則特指認證,“review”是專業(yè)/學科評價,但這些活動包含的內容都與中國目前開展的本科教育質量和學科評價相似。本文通用“評估”主要是與中國教育部高等教育教學評估中心名稱中使用的“評估”和學科評估中的“評估”保持一致,以便讀者理解相關內容。所以,除了特別強調外,本文所闡述的評估文化建設均適應于所有相關的評估活動。
其次,文化是一個非常復雜的概念,是人類社會發(fā)展過程中所創(chuàng)造的物質財富和精神財富,也常常反映了特定群體在特定時期形成的對某一事物的習慣和信仰。高等教育評估文化就是在高等教育質量領域形成的共識和大家共同遵循的習慣。艾莫斯·萊考斯(Amos Lakos)和雪萊·菲普斯(Shelley Phipps) 將其界定為:“評估文化(a culture of assessment)是組織基于事實、研究和分析制定政策的組織環(huán)境,并以此規(guī)劃學校提供的各項服務,優(yōu)化教育成果,影響服務對象?!盵3]溫迪·威娜(Wendy Weiner)從高校的教育目標、評估概念、教師參與、評估技能培訓、評估計劃、學習成果評估、學科評估、大學效能、信息共享、改進行動等15個領域闡述了評估文化的塑造[4]。中國學者在評估文化方面的研究還不多。用“評估文化”和“評價文化”這兩個關鍵詞在中國知網查看相關研究論文,共查到42篇文章,而且只有一部分文章與本文闡述的高等教育評估文化有關。其中,張繼平從評估生態(tài)性角度對評估文化的界定比較完整。他強調,評估文化是“促成評估主客體的思想、行為、動機、價值觀等和諧統(tǒng)一的氛圍與環(huán)境,在這樣的氛圍與環(huán)境中,參評高校能以平常的心態(tài)看待評估,以原始的狀態(tài)對待評估,以真實的‘面貌’示人,以形成客觀的評估結果”[5]。 顯然,評估文化涵蓋的維度非常廣泛。本文從評估組織管理、質量標準、證據、參與、改進等五個方面簡單介紹美國評估文化的建設路徑。
組織管理是評估文化建設的基礎,包括管理機構、職責職能、人力資源等諸多方面的建設。美國高等教育評估的組織管理可以粗略分為三個層面:一是政府層面,包括聯邦政府與州政府,主要發(fā)揮政策導向作用,同時通過審批第三方評估機構、經費支持、貧困學生資助、問責、審計、績效評價等手段管理評估活動,并營造政府負責的評估法治文化氛圍;二是社會層面,包括第三方評估機構、咨詢機構和勞動力市場的默契配合,共同構建有利于高等教育評估的社會文化環(huán)境;三是大學內部的評估機構,這是三個層面中最重要的組織機構,形成了包括評估專家、教師、行政管理人員、學生在內的評估委員會、學校層面的評估管理辦公室、學科/學院評估協調人員、提供數據分析的院校研究辦公室等網絡狀組織管理結構,是實施評估工作的主體,并在營造校園評估文化中擔負重要職責。當然,這三個層面之間也通過各種評估實施工作、培訓、數據交換、咨詢、問責、結果公開等形式開展密切合作,構建彼此信任、信息透明的評估組織管理文化氛圍。
除了政府層面的管理機構外,社會層面和學校層面的評估機構都有強大的專業(yè)評估團隊。美國很多高校的高等教育學研究生專業(yè)設置評估、測量等方向,為美國高等教育評估培養(yǎng)了大批集高等教育管理、教學及評估理論和實踐技能相結合的評估學術研究和實踐人員。另外,美國高校的評估委員會通常是學術委員會的一個分委員會,或者是由教務長與學術委員會共同領導的由各學科教師和各領域行政管理人員組成的常設機構,為學校層面的評估工作提供專業(yè)指導。所以,學校層面的評估人力資源構成不僅包括從事學術工作的專業(yè)人員,也包括從事評估的職業(yè)管理人員,形成了濃厚的職業(yè)與專業(yè)緊密結合、理論與實踐相輔相成的評估組織管理文化氛圍。
質量標準是高等教育辦學的準則,是評估賴以有效實施的前提。美國高等教育評估起源于20世紀初美國大學學會(Association of American Universities, 簡稱AAU)制定的以提升博士教育質量為目的的博士專業(yè)質量標準,后來延伸為美國博士專業(yè)的學科評估標準。幾乎在同一時間,AAU也開發(fā)了本科教育認證標準。后來區(qū)域認證機構相繼成立后,AAU終止認證工作。但AAU通過規(guī)范大學辦學標準提升大學辦學質量的行動開創(chuàng)了美國高等教育規(guī)范質量標準的先河,對美國評估質量標準共識文化的建設奠定了基礎。一百多年的認證實踐也證明,質量標準在評估中所展示的堅韌剛強作用是有效踐行評估工作的前提。
當然,隨著高等教育體系的完善和穩(wěn)定,美國以問題為導向的評估日漸盛行。其中學校內部開展的學科評估更加聚焦于解決學科發(fā)展的問題。例如,加州大學伯克利分校開展的學科評估就是圍繞一百多個問題診斷和分析學科發(fā)展面臨的困境,并有針對性地提供學科愿景發(fā)展策略。但學科評估仍然不能完全脫離與對標高校的比較,也就是與行業(yè)質量標準的比較,亦稱之為標桿比較(benchmarking)。另外,過去二十多年來,美國高校實施的學生就讀經歷(learning experience)、學習成果(learning outcomes)和增值(value-added)等評估為認證、學科評估注入了新鮮的評估血液,使美國高等教育質量從“輸入-輸出”(input-output)評估邁入了聚焦教育成果的“輸入-成果”(input-outcomes)的評估發(fā)展歷程。而后者,也更加關注質量標準,形成了“知己知彼”,共同提升的質量評估文化。全國性學習投入調研(National Survey of Student Engagement, NSSE)[6]和研究型大學就讀經歷調研(Student Experience in the Research University, SERU)[7]堪稱本科教育質量標準共識文化建設的典范項目。
簡單地說,評估就是回答諸如教師教了什么、學生學到了什么、學生畢業(yè)后能做什么、如何改進辦學績效等問題的過程。顯然,證據是回答這些問題唯一令人信服的理由;沒有證據便無法衡量教學是否達到了質量標準,評估的有效性也便會受到質疑。為此,大學必須構建評估的循證文化,養(yǎng)成基于事實、研究和分析開展評估的組織環(huán)境和校園文化氛圍。事實上,評估的循證文化也是科學決策和質量文化的重要組成部分??茖W決策模式的奠基人赫伯特·西蒙(Hebert Simon)提出的“信息收集-方案設計-方案選擇”的科學決策三步驟[8],以及羅素·艾可夫(Russell Alcoff)提出的“數據-信息-知識-智慧”(data-information-knowledge-wisdom)的金字塔決策模式[9]都非常清晰地闡述了循證決策文化的重要性和實踐路徑。這些模式也可用于詮釋和設計評估的循證文化建設路徑。
在循證文化建設的具體操作中,美國高校的經驗是加強院校研究工作。美國高校的院校研究是20世紀50年代興起的,其初心是大學自查,后來拓展為通過數據收集、分析、報告,支持大學決策過程的組織機構。事實上,院校研究興起的時期也幾乎與科學決策模式和計算機決策支持工具誕生處于同一時期,其發(fā)展與“商業(yè)智能”(business intelligence)所涵蓋的大數據建設、信息挖掘、網絡報告等領域的發(fā)展幾乎是同步的。在這樣的發(fā)展環(huán)境中,受信息時代信息文化的影響,院校研究也形成了別具特色、服務大學決策的高等教育院校研究文化。這種文化不僅在高校內部根深蒂固,也得到了社會各界的廣泛認可。更重要的是,大學賦予院校研究數據治理的重要職責,自然就承擔評估數據的收集與分析。所以,院校研究文化為評估循證文化建設奠定了物質基礎,提供了文化養(yǎng)料。
帕特·哈欽斯(Pat Hutchings)曾強調,教師參與評估是保證評估效果和教學質量的“黃金準則”,因為教師參與評估是評估結果能在課堂上產生影響的關鍵因素[10]。但目前的高等教育領域有一種非常奇怪的現象,那就是我們都在呼吁學生要積極參與學習等各類活動,但教職員工卻沒有積極參與能夠提升教學質量的所有活動,評估活動就是其中之一。雖然部分教職工也參與了大學認證、學科評估等活動,但并沒有把評估這項活動有效地與自己的教學、服務工作緊密結合起來。也就是說,目前的很多教學和服務活動是忽視質量標準的。教師沒有把有利于提升教學質量的有效設計嵌入到課程教學中,行政服務人員也沒有把改進教學質量的有效理念融入到自己的行政管理決策之中。最為典型的例子就是“碎片化”教學、“碎片化”評估學生的學習成果。本文闡述的評估參與文化所強調的是將“評估”融入到日常教學活動中,形成按照質量標準“吾日三省吾教”的習慣。但是要形成這樣的參與文化認知,仍然是“路漫漫其修遠兮”。
為此,美國高校的教務長于2009年就呼吁,更多的教師參與評估已成為提升評估效果的首要任務[11]。帕特·哈欽斯也提出了為教師參與評估敞開大門的六項建議:一是圍繞日常教學工作建立評估體系,將評估理念融入到課程設置和課堂教學設計中,包括教學計劃、課堂活動和課后學習任務的開發(fā)和考核體系;二是將評估培訓嵌入到教師職業(yè)發(fā)展之中,提升教師的評估技能;三是將評估納入博士研究生的培養(yǎng)中,為他們未來從事教學工作和參與評估打好基礎,美國密歇根大學、威斯康星大學已經開始這樣的嘗試;四是同等對待教師的評估工作與學術研究,為教師積極參與評估活動、實踐評估理論創(chuàng)造激勵環(huán)境;五是構建教師之間的評估對話機制和校園評估文化,為不同高校相同學科教師之間的評估交流提供機會和支持;六是為學生提供自我評估機會和工具(如學習進展電子檔案袋等),鼓勵學生參與評估是促使更多教師參與評估的有效途徑。
克斯頓·福勒切(Keston Fulcher)等把基于證據改進質量的模式稱之為“評估、干預、再評估”,而且將其形象地比喻為“稱豬、喂豬、再稱豬”的過程[12]。他們所說的“干預”或“稱豬”實際上就是基于評估結果的質量改進過程。他們強調“評估”本身不能改進質量,如同“稱豬”本身不會給豬增膘;只有通過合理的教學“干預”才能改進教學質量。而這種合理的“干預”必須是基于“評估”結果而制定的;而要了解“干預”效果,就必須“再評估”。這個過程循環(huán)往復,常態(tài)化后,便形成了評估的質量改進文化。
美國高校評估質量改進文化的建設至少包括五個方面:一是政府通過法律手段強制大學進行質量改進,對公立大學來說更是如此。例如,從1979年起,先后有25個州采納基于績效的撥款模式(performance-based funding model),將學生的畢業(yè)率、就業(yè)率、完成的學分等指標納入州政府給高校的預算制定方案中[13]。州政府出臺的其他督促高校改進的法案更是枚不勝舉。二是在制定評估計劃時提前作好質量閉環(huán)分析(closed-loop analysis)和改進監(jiān)測(progress monitoring)設計,也就是“干預”計劃。目前由第三方評估機構承擔的認證評估有非常詳細的回訪計劃,也就是要求高校在評估周期內提交質量改進進展報告。學校內部開展的問題導向的學科評估更是如此,尤其是針對評估中發(fā)現的問題所開展的再評估對質量改進起到了非常重要的督促作用。三是提升評估數據的透明度。雖然美國評估機構和高校并沒有特別公布評估結果及其相關數據,但政府、各類高等教育學會及高校利用現代網絡技術已經最大化地公布了高校辦學績效方面的數據[14]。這樣的行動不僅有利于大學有效利用評估數據制定改進計劃,也為社會監(jiān)督大學提供了證據。四是高校成立特別委員會(task force)深入研究評估中發(fā)現的問題,啟動針對質量問題的改進項目(initiatives)。五是在“后評估”“再評估”中重點審核對上一輪評估發(fā)現問題的改進情況。
評估文化的建設是一個長期的過程,需要一點一滴的積累和塑造。美國高等教育評估經過一百多年的發(fā)展,雖然有待繼續(xù)改進,但其范式也彰顯了很多優(yōu)秀的評估文化特征,也為世界高等教育評估方法和實踐貢獻了豐富的經驗和教訓。中國的高等教育評估歷史還較短,雖然取得了很好的成績,但從評估文化建設的角度來說,目前還沒有合理的組織架構,尤其是高校內部的評估組織還比較薄弱;還沒有形成穩(wěn)定的、普遍認可的評價制度和質量標準;高校的評估內動力和教職工參與評估的主動性有待提升;高校的院校研究還非常薄弱,相關人員缺乏信息素養(yǎng),支撐評估的數據系統(tǒng)也需要加強。當然,美國積累的評估文化經驗不一定完全適合中國的國情,更何況美國的評估文化也有很多需要深化建設的地方,所以,如何構建中國高等教育評估文化,需要中國學者和評估實踐人員結合中國的國情及中國高等教育當前所處的普及化發(fā)展階段的特征進行深入思考,總結過去評估的經驗教訓,建立穩(wěn)定的評估模式。只有這樣才有可能形成評估文化氛圍,為中國高等教育質量改進把脈獻策,也為世界高等教育評估的發(fā)展貢獻知識和經驗。