朱南香,郭麗君,易佳
(湖南農業(yè)大學,湖南 長沙 410128)
2018年教育部發(fā)布《教育信息化2.0行動計劃》,要求進一步推進人工智能教育的發(fā)展。《中國教育現代化2035》提出加快信息化時代教育變革,實現智能化教學,推進教育現代化。2020年10月,中共中央、國務院印發(fā)了《深化新時代教育評價改革總體方案》,其中明確提出“利用人工智能、大數據等現代信息技術創(chuàng)新評價工具”“提升教育評價的科學性、專業(yè)性、客觀性”。大力發(fā)展人工智能技術,積極探索人工智能與教學評價領域的融合發(fā)展,是我國推動智慧教育的必然舉措[1],在目前智能時代的趨勢之下,算法、算力、人工智能不斷滲透到教育的各個層面,助推教育進步和發(fā)展,引領教育朝現代化方向不斷進步。
近年來,高等教育一直以內涵式發(fā)展和提高人才培養(yǎng)質量為核心,提高大學人才培養(yǎng)質量是大學立足于自身實際的必由之路,亦是大學發(fā)展的重中之重。課堂教學是人才培養(yǎng)的必經之路,提升課堂教學的質量必須依靠教學評價,教學評價在教育中起著導向、診斷、分析、反饋等多重作用。在信息化飛速發(fā)展的智能時代,傳統教學評價已經不能滿足現階段的需求,隨著算法時代的到來,滋生出的人工智能、大數據等多種形式正逐漸和教學評價進行融合,為大學課堂教學質量評價提供一條新的路徑,從而推動大學課堂教學質量評價的發(fā)展,越來越多的新工具、新方法、新標準不斷進入到大學課堂教學評價的體系之中,人工智能成為教育教學評價的輔助者、評價過程的監(jiān)督者、評價內容的采集者、評價結果的反饋者,人工智能融入大學課堂教學給教學質量評價帶來了新的發(fā)展機遇,但也導致大學課堂教學評價出現了良莠不齊、頭重腳輕等一系列問題,這些問題都開始讓教育研究者反思如何在人工智能時代促進大學課堂教學質量評價的變革和進步。
人工智能是第四次信息技術革命的產物,最早于20世紀50年代在達特茅斯會議上首次提出,是指由人類所創(chuàng)造的智能,也被稱為“機器智能”[2]。以ChatGPT為代表的人工智能技術,具備超強的信息檢索能力、超強的文本能力讀寫以及自然語言處理能力等,這些都是人類智能難以企及的。
大學課堂教學質量評價是立足于教師的教和學生的學,著眼于改進教師教育教學能力,提高教學質量,而對教學設計、過程和結果展開的評價[3]。傳統大學課堂教學質量評價主要依托現場觀察、學生評教、同行評價的形式對教師教學進行評價,隨著人工智能賦能大學課堂教學質量評價,大學課堂教學質量評價開始展現出評價主體多元化、評價方式還原真實、評價結果更關注師生的特征,綜合來說,人工智能賦能大學課堂教學質量評價具有以下現實表征。
人工智能可以利用AI技術來采集學生的學業(yè)數據、體育數據、心育數據等多維度數據,可以實現對學生多方面數據的掌握,從多組數據中得到最真實的反饋。胡欽太曾以廣東工業(yè)大學教學云平臺蘊瑜課堂與智慧教室為基礎,利用人工智能算法建立融合智能感知、智能算法、數據決策等模塊的教育診斷評價與干預功能系統,利用人工智能來獲取面部數據、聲音數據、交互數據以及人體形態(tài)等數據[4],綜上所述,人工智能所獲取的數據可以擺脫人類智能的主觀性和關注范圍較窄的問題,使數據更加客觀真實,為教學評價提供有效參照。
人工智能整合自然語言理解、知識推理等多項技術,可以參與課堂測驗、課后作業(yè)等,并針對學生的學習情況進行對比分析,進而做出精準的診斷,可以減輕教師機械的課業(yè)工作,給教師更多創(chuàng)造性教學的空間。許吉宏在課堂教學情境中,結合人工智能技術,以學生行為的智能識別為基礎搭建了課堂智能學情分析系統,通過對學生課堂行為進行智能識別以實現對學生課堂參與狀態(tài)的系統性定量評估,達到對課堂教學進行有效學情分析的目的[5]。值得注意的是,人工智能技術可以承擔很多輔助工作,但并不具備情感交流的功能,因此教師在運用人工智能技術進行工作的過程中要注意情感價值的引導作用。
人工智能的知識圖譜構建技術可以針對學生個體提供個性化學習路徑規(guī)劃,可以基于過程性的學情診斷,提供精準化和個性化學習方案。吳立寶曾提及記錄學生的舉手發(fā)言次數、抬頭聽課時間、參與討論情況以及專注力等課堂過程性數據,并及時反饋給學生,便于學生直觀認識自身學習狀態(tài),從而及時調整與改進,開展形成性評價,同時依托大容量的存儲空間、高速度的運算能力,生成階段性的課堂表現數據,以此追蹤教師專業(yè)發(fā)展與學生全面發(fā)展的成長軌跡[1]。比如說:人工智能技術可以根據學生的學習情況進行自動分層,構建個性化學習體系,做到因材施教。除此之外,人工智能也可以為學生提供個性化的心理輔導規(guī)劃,幫助教師做好教學評價反饋的工作,進一步完善學生的學習鏈。
美國哈佛大學文理學院前院長哈瑞·劉易斯曾嚴厲批判大學已經失去了靈魂——教育學生的任務,他將追求學術優(yōu)秀而忽視教學優(yōu)秀的大學稱為“失去靈魂的卓越”[6],這就肯定了大學課堂教學質量評價是大學的靈魂,是推動大學進步的源動力。
大學課堂教學質量評價是高校教學質量保障體系的重要組成部分,主要包括了學生評教、教師自評、同行互評、督導評價等具體形式[7]。目前人工智能參與大學課堂教學質量評價并不普遍,絕大多數高校依舊保留著傳統的教學評價模式,主要是依靠教務系統讓學生對教師的教學效果進行評價。學生的評教過程較為主觀,而且由于學校會將教師的獎懲和學生評教進行直接掛鉤,十分不利于教師的發(fā)展,因此人工智能融入大學課堂教學質量評價既是時代趨勢,亦是現實需求。
教學評價主體亦是教學評價的實施者和組織者,主要有教育決策者、教育活動的主體(教師和學生)、教學評價信息的使用者等[8]。自中世紀大學形成以來,人才培養(yǎng)就已經成為大學的職能,就目前來說,人才培養(yǎng)、科學研究和社會服務是現代大學的三種職能,后兩種職能是隨著社會進步和經濟發(fā)展而逐漸衍生出來的。“教育是一棵樹搖動另一棵樹,一朵云追逐另一朵云,一個靈魂喚醒另一個靈魂”[9],這便向我們詮釋了大學教育的旨趣是立德樹人,培養(yǎng)學生是大學教育的根本目標,大學人才培養(yǎng)的功能是擺在首位的。
人工智能融入大學課堂教學質量評價最初的目標是提升學校人才培養(yǎng)的質量,全方面監(jiān)測教學效果,從而讓學校教育可以達到更高的標準,但是隨著人工智能技術的廣泛應用,我們明顯發(fā)現,在利用人工智能進行教學評價的過程中,人工智能只能關注到量化數據的采集,并針對大量的量化數據進行元分析,從而得出評價結果(如學生成績和學習時間、教師科研量化考核、學校質量評估和排名等),該結果是一個完全客觀的可量化的操作數據。
首先,忽視了學生的主體性?!爸黧w性是主體潛在地具有并且能夠發(fā)揮出來的屬性”[10],人的主體性涵蓋了內在主體性和外在主體性兩個方面,內在主體性主要表現在自我認同上,外在主體性主要是表現在能動性和自我性上,教育的過程就是教師和學生主體性的最佳體現,這種主體性是通過教師和學生雙向互動所產生的。人工智能具備數據流、信息流的特點,可以根據程序設定監(jiān)測教學的過程,可以通過既定計劃來診斷學生對于知識的掌握程度,但是學生是一個具備主觀能動性的人,在知識傳授的過程中,同時伴隨了高階思維能力、批判能力、情感交流、創(chuàng)造力以及意志品質等多方面的提升,因而人工智能尚不能判斷出學生綜合能力的提升,只能從數據來判斷學生量化知識水平提高與否,由此可見,學生的主體性被人工智能技術所忽視。
其次,異化了教師的主體性。大學教學的準備、授課、評價、反思環(huán)節(jié)都是教師主體性的體現,教學的環(huán)節(jié)環(huán)環(huán)相扣,每一個環(huán)節(jié)都需要教師全身心地參與才能取得更好的教學效果。用人工智能幫助教師進行教學評價后,確實能讓教師從機械的工作中抽身出來,但隨之而來的問題是教師的主體性被遮蔽,即教師不再是課堂教學評價的核心力量,單純地從機器獲取的數據來反思課堂的教學,從而導致教學效果良莠不齊。除此之外,在大學課堂教學質量評價中,行政管理者或者教育督導人員也會利用人工智能技術對教師的教學進行多方面衡量,并且評價結果的利用局限于教師年終考核、職稱晉升、績效工資、榮譽獎勵、項目申報等,并未深入挖掘、分析評價結果中蘊藏的有關課堂教學的信息,忽視了評價結果的診斷與改進功能[11]。
最后,缺乏情感交流互動。大學教學的最初目的是為了培養(yǎng)德智體美勞全面發(fā)展的人,人工智能的發(fā)展雖然愈漸成熟,甚至通過了“圖靈測試”,可以“騙過”30%的成年人,但是和機器對話不能進行情感交流,以至教學評價過程中缺乏學生的情感數據,難以促進學生情感方面的發(fā)展和進步。如果學生成為一個只會接受知識的人,這樣的教育就脫離了教育的目標,是一場失敗的教育。
教學評價的客體主要是針對評價標準的固定性、評價指標的唯一性而言的,運用人工智能參與教學評價,將固化教學評價的標準和指標體系,僵化學生思維模式,讓機器成為教學評價過程中的主力軍、監(jiān)督者。
首先,固化了教學評價的標準和指標體系。利用人工智能技術進行大學課堂教學質量評價,由于算法的限制,只能衡量量化的數據,不能衡量質性的標準,所以教學評價的過程和結果呈現出標準化的數據模型,使得學生和教師的創(chuàng)造力和獨特性無法被體現出來,比如運用學習時長來監(jiān)測學生的學習效果,會忽視學生的個體差異性,由于學生個體的獨特性,每個人學習知識所需要的時間并不一致,但是運用人工智能進行監(jiān)測,只能通過學習投入的時間來衡量學生的學習是否達標,因此以統一的標準來判斷所有學生的學習效果是不符合教育發(fā)展性原則的。
其次,學習者的思維模式被標準化。學生在教學的過程中既是評價的客體,又是評價的主體,教育的最初目的是促進學習者的學習,人工智能技術進入教育場域后,盡管可以收集數據,進行學情分析,為學習者提供優(yōu)化路徑,但是在機器監(jiān)測和路徑指導的過程中,將會不斷抹殺學生的創(chuàng)造性,在一次又一次的評價中學生逐漸喪失主體性和創(chuàng)造性,就如同“工廠里流水線上的產品一樣”,缺乏獨立思考問題、創(chuàng)造性地解決問題的能力。
工具理性主張技術至上,是通過精確計算功利的方法,最有效達至目的的理性,是一種以工具崇拜和技術主義為生存目標的價值觀[12],價值理性主張價值至上,在追求目標的過程中對自身活動有意識地選擇和反饋,用以回答“做什么”的問題[13],強調人是任何活動的主體和核心。
首先,人工智能時代是一個技術崇尚以及工具理性高度籠罩的時代,在教學評價中主要體現在人類對智能工具的依賴性,可以直接依靠人工智能的算力和算法得出結果,讓教師以及管理者直接利用數據,來計算教學效果,從而被數據所控制,得出程序化的結果,忽視了教育的本質是促進學生的發(fā)展,會導致教育目標本末倒置的情況。除此之外,教師會在人工智能時代為了減輕教學負擔和教學任務,更多地依靠人工智能技術來輔助教學,教師亦會機械性地將評價數據收集、評價指標體系建構的權力都讓渡給人工智能技術,從而讓輔助工具占據核心地位,混淆了教學評價的主次關系。
其次,算法是人工智能的核心,它是通過人為設計的一系列計算機程序指令、計算規(guī)則和流程,模擬人類智能活動實現替代和拓展的功能[14]。人工智能的算法都是由人工智能程序設計師來進行設定的,雖然產品正式投入市場之前,進行了相關檢測,可以保障數據的相對公平,但是在算法設計之初,由于程序設定人員是具有主觀能動性的人,他們在程序設定時很難保證絕對的客觀性,存在主觀偏見、算法程序設定漏洞、算法機制不嚴密等問題,比如在成績分數決定論的評價系統中,只會對成績較好的“好學生”給予更多的關注度,對成績較差的學生則會有所忽視。
最后,人工智能是機器,會存在失誤的可能性,因此人工智能的判斷并非絕對正確。我們始終要運用發(fā)展的眼光看待每一個學生和教師,讓他們可以有進步的空間和機會,這才是教育的最終價值和意蘊。當一個社會過度強調工具理性時,我們失去的可能是一個更富有情感和靈魂的人。因此,我們要從一個相對的層面來看待人工智能的效用和價值,既要承認它所帶來的益處,也要看到它的弊端,從而揚長避短,更好地發(fā)揮教育的作用,讓價值理性得到更真實的詮釋,呼吁價值的回歸與突破。
人工智能是信息化時代發(fā)展的產物,由于人工智能的發(fā)展十分迅猛,迅速和各類學科、行業(yè)進行融合,不斷地衍生和分化,使得人工智能快速進入實際應用場域,讓人工智能和教育、醫(yī)療、制造、金融等進行了高度的融合。但是隨著人工智能技術的入場,我們發(fā)現,現階段的人工智能都是弱人工智能,還遠遠不能達到強人工智能的階段,在人工智能領域的人才儲備量是極其有限的,遠遠不足以支撐教育體系的人才需求。
首先,從專業(yè)設置上來說,教育統計、測量與評價的相關專業(yè)很少,目前,國外對于教育測量與統計專業(yè)的設置比較火熱,比如華盛頓大學、波士頓學院、佛羅里達州立大學等設置了測量與統計學學位,但是反觀國內,盡管有些學校設置了統計學學院或者專業(yè),但是這些專業(yè)更側重從經濟統計,而非教育統計與測量。因此,我國教學評價專業(yè)人才十分稀缺,而且由于相關專業(yè)的人才培養(yǎng)方案和培養(yǎng)體制不夠健全,導致人工智能技術很難融入相關的專業(yè)設置中,擁有人工智能技術的測量與統計人才更少。
其次,教學評價主體的信息化素養(yǎng)欠缺。信息化教學素養(yǎng)既包括運用現代化教學手段組織教學的能力,又包括在人工智能時代靈活、系統地運用人工智能技術參與教育教學的全過程的能力,前一種能力已經在大學教學中得到了較好的體現和發(fā)展,但是后一種能力卻一直止步不前,人工智能技術融AI能力、AI知識和AI倫理于一體,以AI能力為核心,判斷教學評價主體能否勝任智能時代教學評價實踐的關鍵能力,涵蓋數據能力、分析能力、計算思維能力、算法能力等[15]。比如,教師需要具備正確分析處理人工智能教學評價結果的能力,從而做出正確的教學評價決策,促進教學的進步和發(fā)展,但是現實情況卻是相悖的,評價主體由于缺乏AI能力,無法從機器提供的實證量化數據中去分析問題,無法從數據和算法中做出價值判斷和決策,從而無法提升教學評價的效果,使得智能化教學評價成為“空中樓閣”,無法落地扎根。
隨著人工智能技術融入大學教育過程,大學教育展現出了更加強大的生命力和創(chuàng)造力,不僅是讓課堂教學質量評價散發(fā)出新的活力,讓學習的過程變得更加趣味靈動,同時也對新時代的教師提出了更大的挑戰(zhàn),這些都是人工智能給大學教學帶來的變化。盡管在人工智能時代大學課堂教學質量評價存在諸多困境,但也針對這些困境提出了具體的優(yōu)化路徑,推動人工智能時代大學課堂教學質量評價取得高質量發(fā)展,從而推動學生和教師的雙向進步。
個性化評價是針對學生的獨特性、針對學生的差異性所制定的一種教學評價模式,在這個模式中主要以學生個體為評價的中心,可以針對單個學生進行專屬評價,因材施教,提供有針對性的評價結果和評價措施。在大學課堂教學質量評價中,不能直接將教學評價的權力讓渡給人工智能技術,人工智能技術只能是教學評價的輔助者,教師才是教學評價的主體和核心力量,教師除了要探索和發(fā)現學生在教學過程中的獨特性和創(chuàng)造性,也需要針對學生不可測量的能力去進行人為評價,從而進行人為干預,為學生提供個性化的評價,將大幅度推動大學教育的進步和學生能力的提升。
在人工智能技術參與教學評價的過程中,倡導教師不要喪失主體性,教師和教學評價者可以通過自然觀察、訪談調查、描述分析等質性評價方法去探索教學評價的效果,在機器提供數據的同時,利用質性的方法去參與教學評價,建構質性評價與量化評價交融互通的教學評價體系,推動教師和人工智能技術協同評價,以人為主,以機為輔,讓教學評價落到每一個學生的身上,避免形成教學評價“空中樓閣”的現象。
多元評價既包括教學評價主體的多元,也包括教學評價工具的多元和教學評價標準的多元。
首先,教學評價主體多元化。在人工智能時代教學評價的過程中,不能單純地讓機器和教師成為教學評價的主體,也不能忘記傳統教學評價的應用,讓家長、教學監(jiān)督者、管理者以及同行都參與到教學評價中,在多主體的共同施力下,多角度、全方面地評價教學活動,使教學評價的效果會更加凸顯。
其次,教學評價工具的多元化。不要單純以成績作為教學評價的定性指標,可以機器數據提供的數據樣本作為教學評價的參考依據,也可以采取學生評教、線上/線下檔案袋評價等方法,通過對學生的前后對比分析,更加直觀地看到教學的效果,以多維視角參與教學評價,綜合評價教學效果,做好評價反饋工作,從而讓教學質量更上一層樓。
最后,教學評價標準的多元化。人工智能技術很容易將教師帶入以成績作為評價標準的誤區(qū),在教學過程中,更多地關注學生能力培養(yǎng)、思維創(chuàng)新等多方面的評價標準,可以采用基于智能技術的試題測試、實踐操作、面試答辯等不同方法去進行教學評價。美國知名私立高中聯盟MTC采用全新的學生評價指標體系,評價內容涵蓋創(chuàng)造性思維、數理能力等八大類,實現個性化的學生綜合評價[16]。
首先,我們需要擺脫數據為王的技術基調,不要讓機器評價出來的數據結果成為教學評價的核心,我們需要利用數據來作為參考,而不是絕對相信數據所給出的結果,應將數據作為教學評價的一個指標,并且也需要帶著懷疑的態(tài)度去看待每一組數據,進而將機器數據和人為數據相結合,做出中肯的價值判斷,謹防被數據蒙蔽了教學評價的宗旨。
其次,培養(yǎng)教師的技術理性和技術倫理意識,擺脫工具依賴心理,扭轉技術為王、效率為主的工具理性,在運用工具進行教學評價的過程中,應該樹立工具和技術并非萬能的思想,讓大學教學元評價走進大學課堂教學質量評價中。有合理的大學教學元評價才有合格的教學評價,教學元評價即對教學評價本身的評價,其主要目的是檢驗教學評價中可能呈現的種種誤差,進而進行修正與完善,使其積極作用得以充分發(fā)揮[17]。
最后,堅持立德樹人為根本,堅持以學生為己任,樹立以發(fā)展為核心的總基調,呼吁價值理性的復歸,明白“機器文明的一切機制都必須服從于人的目的、人的需求”[18],讓多元主體參與教學評價的過程中,讓量化數據評價和質性評價進行融合,從而讓教學評價結果更加真實、可靠,做好教學評價的監(jiān)督工作,讓教學評價促進學生的發(fā)展和教師專業(yè)能力的提升。
首先,樹立終身學習的教學理念,作為教師和教學評價監(jiān)督者,應該保持與時俱進的學習態(tài)度,在新的背景之下去學習新的知識、新的教學方式、新的評價方法,比如說在人工智能背景下,教師應該學習以ChatGPT、深度學習、基于大數據的自適應學習為代表的新技術,感受人工智能技術給教育帶來的變化,從而使教育事業(yè)始終保持年輕化的發(fā)展趨勢,適應新的環(huán)境,孕育新的生命力。
其次,大學應該開啟相應的師資培訓,面對大學教師的AI智能素養(yǎng)缺乏的問題,可以在寒暑假開展人工智能技術工具的課程培訓,開展職前職后AI能力培訓,在整個過程中可以讓教師掌握基礎的人工智能技術,從而更好地將智能技術運用到教學評價體系中。
最后,國家應該鼓勵教育評價與測量專業(yè)的開設,從而擴大評價類專業(yè)人才的培養(yǎng),讓專業(yè)的人才做專業(yè)的事情,從根源上保障大學課堂教學質量評價的發(fā)展。在做好專業(yè)設置、專業(yè)人才培養(yǎng)計劃的同時,也需要讓教學評價與測量專業(yè)和其他學科領域進行橫向融通,例如與人工智能、大數據技術、數學、管理學等學科進行交叉融合,從而讓專業(yè)人才適應時代的發(fā)展和改變。
大學課堂教學質量評價一直是高等教育發(fā)展的核心和內生動力。隨著時代的發(fā)展和現代科學技術的進步,大學課堂教學質量評價在人工智能技術的助力下更加真實、立體,但也衍生出一系列的問題。本文論述了人工智能技術賦能大學課堂教學質量評價、人工智能時代大學課堂教學質量評價的困境和路徑選擇。不可否認,人工智能技術的支撐和相應智能產品的設計與開發(fā)將大幅度推動大學課堂教學質量評價的發(fā)展,本研究希望能為人工智能時代大學課堂教學質量評價提供一些借鑒或參考。