本刊特邀記者 劉 凱 王 韶 隆 舟 屈 靜
記者:格雷澤教授,您好。很高興您能接受我們的學(xué)術(shù)專訪。您在教育技術(shù)學(xué)領(lǐng)域,尤其在智能導(dǎo)學(xué)系統(tǒng)(ITS)研究領(lǐng)域,可謂名聞遐邇。今天訪談的主題主要圍繞三方面展開:一是基于個人視角概述您的研究工作;二是請您回應(yīng)幾個熱點(diǎn)問題,因為您的經(jīng)驗和見解也許能對中國同仁有幫助和啟發(fā);三是請您簡評自己的學(xué)術(shù)生涯。
格雷澤教授:在全球范圍內(nèi),學(xué)校都在應(yīng)對數(shù)字技術(shù)進(jìn)課堂的挑戰(zhàn),但教師通常沒有作好準(zhǔn)備,這個挑戰(zhàn)異常嚴(yán)峻。雖然好于傳統(tǒng)教學(xué)的解決方案不少,但只要教師沒有理解、接受或使用,那么一切都將枉然。所以,教師培訓(xùn)是重中之重。此外,情緒管理、小組探究或互動指導(dǎo)等有益于教學(xué)的非技術(shù)方法也很多,但教師仍缺乏足夠的訓(xùn)練。教師很少接受如何引導(dǎo)和利用學(xué)生情緒或協(xié)作解決問題的培訓(xùn)。他們不了解信息技術(shù)不足為奇,但我們面對的挑戰(zhàn)是巨大的。
中國也許可以解決這些問題,通過師資培訓(xùn)或職業(yè)發(fā)展靈活、有針對性地提升教師能力。但是,美國的發(fā)展步子非常緩慢,原因可能是:一,教師工資普遍偏低,教育職業(yè)缺乏吸引力。相對而言,中國教師的平均收入更可觀;二,很多教師雖然接受過培訓(xùn),但培訓(xùn)內(nèi)容未涉及信息技術(shù)。為了學(xué)習(xí)新知或提升新技能,他們需要通過進(jìn)修不斷充電;三,學(xué)生是社交媒體、電視、電影院、計算機(jī)和數(shù)字游戲的“原住民”,師生代際差異也是難點(diǎn)之一。
再談?wù)勄榫w,這是極為重要的問題。人非草木孰能無情,但直到最近十年,人們才真正了解如何應(yīng)對學(xué)習(xí)者情緒。過去,教師沒有受過指導(dǎo)如何處理自己的情緒,也沒有正確地關(guān)注情緒。他們了解氣憤、欺凌以及興奮和煩惱,但不明白困惑、挫敗和無聊。比如,我和同事悉尼(Sydney)及德梅羅(Demerol)對比研究學(xué)習(xí)者主觀情緒感受與教師和專家觀測之間的差異,經(jīng)常發(fā)現(xiàn)一個問題:詢問學(xué)生感受時,他們會說“我覺得很無聊”,但教師卻認(rèn)為學(xué)生此時正積極參與。實際上,半數(shù)情況下,學(xué)習(xí)者感到無聊時,教師都以為他們正在積極思考。其原因部分在于,人們不會將無聊寫在臉上。我們發(fā)現(xiàn),無聊、集中思想或不無聊也不集中思想時,人們的表情沒有顯著差別。所以,教師觀察學(xué)生的面部表情,并不總能起作用。困惑具有顯著表情標(biāo)記——好似一頭霧水。事實上,困惑和驚奇情緒一看便知,但挫敗感不易察覺。由于教師沒有受過如何閱讀情緒的訓(xùn)練,他們通常只能覺察生氣、憤怒和悲傷等生存性情緒,卻不知如何辨識與學(xué)習(xí)密切相關(guān)的情緒。
而且,教師不僅閱讀情緒有困難,回應(yīng)情緒也存在不足。事實上,我曾在這個問題上申請過專利。以困惑為例,我們都希望學(xué)生能夠自主思考,也希望學(xué)生感到困惑,因為困惑能促進(jìn)深度思考,但教師的想法是“既然他們感到困惑,我最好把問題變得簡單一點(diǎn),或者直接公布答案吧”。教師希望擺脫困惑局面,但這絕非處理困惑情緒的最佳方法,反倒應(yīng)希望學(xué)生盤桓在一種理想的困惑中。不過,應(yīng)對持續(xù)的困惑并不容易。如果學(xué)生正在汲取知識,我們希望他們保持困惑,因為他們可能由此作出有益的推理及解決問題的嘗試。當(dāng)他們攻克難題,會非常欣喜。如果能力不足,就可能放棄。盡管我們對此已有所知,但世界上幾乎沒有教師受過相應(yīng)的培訓(xùn),索性可以編制電腦程序完成這項任務(wù),或通過AutoTutor系統(tǒng)訓(xùn)練人類教師。
記者:AutoTutor系統(tǒng)能幫助教師開展教學(xué)?
格雷澤教授:是的。我們可以通過數(shù)字技術(shù)訓(xùn)練教師。例如,系統(tǒng)展示不同情緒的學(xué)生,然后讓教師預(yù)測相應(yīng)情緒,以此練習(xí)情緒識別。同樣,數(shù)字技術(shù)也可以訓(xùn)練教師回應(yīng)情緒。運(yùn)用數(shù)字技術(shù)助力職業(yè)發(fā)展是個全新的領(lǐng)域,盡管它還處于起步階段,但很有發(fā)展?jié)摿Α?/p>
在團(tuán)隊中,個人提議不會總被他人采納,所以困惑和失望情緒很常見。這也是小組學(xué)習(xí)常有負(fù)面效果的原因。例如,皮埃爾·迪倫巴克(Pierre Dillenburg)曾記錄團(tuán)隊情緒變化軌跡。在團(tuán)隊成立初期,成員間交流常帶來積極影響,大家因此相互了解,一切都很和諧。然而,當(dāng)團(tuán)隊目標(biāo)確定后,成員間可能對同一問題提出不同的解決方案,而方案的復(fù)雜性和視角的多樣性往往很難用某種簡單的辦法解決。當(dāng)觀點(diǎn)沖突嚴(yán)重時,團(tuán)隊就會放棄嘗試甚至解散。不過,如果成員間最終達(dá)成共識,此時又會帶來積極影響。
因此,情緒和團(tuán)隊活動非常重要。我們應(yīng)該如何制定社交互動的規(guī)范和策略?比如,團(tuán)隊活動中,我們不直接舍棄個人提議,而是吸收其中的恰當(dāng)內(nèi)容,這樣建議者就會覺得自己作了貢獻(xiàn)。試想,如果某人分享一個為之驕傲的好主意,那么在得到反饋“這主意真是太糟糕了!我們才不會這么做”與“我喜歡你提議中的第三步,應(yīng)該把它考慮進(jìn)去”之間,當(dāng)事人的感受會有天壤之別。即使該倡議不是最終方案,只要可能是其中的一部分,上述規(guī)范和策略就能促進(jìn)團(tuán)隊協(xié)作。該領(lǐng)域前景廣闊,畢竟全世界都想知道如何才能實現(xiàn)有效的團(tuán)隊合作,但相關(guān)研究少得可憐。常見的例子是,團(tuán)隊的兩個成員意見產(chǎn)生分歧時,應(yīng)該如何應(yīng)對和處理?遺憾的是,人們沒有受過指導(dǎo)該如何解決協(xié)作問題,世界上也沒有專門教授協(xié)作的課程。事實上,學(xué)校應(yīng)當(dāng)提供相關(guān)培訓(xùn),方法之一便是運(yùn)用虛擬會話代理,將受訓(xùn)者編入虛擬小組中,嘗試解決爭端。我們可以預(yù)設(shè)多種角色,制造多種沖突,觀察受訓(xùn)者如何處理,還可以設(shè)置旁觀者。而這些都能通過虛擬代理加以引導(dǎo)和訓(xùn)練,教師和學(xué)生均可使用。這一方向仍是有待探索的處女地。
記者:這需要使用對話分析,您曾提出一對一虛擬對話教學(xué)五步驟,在多人情況下是否也有章可循?
格雷澤教授:是的,可以用虛擬代理訓(xùn)練學(xué)生或教師如何使用語言開展小組互動。我總結(jié)了不同情境的八條產(chǎn)生式規(guī)則,這里列舉幾項。假設(shè)團(tuán)隊中有個學(xué)生不愛說話,缺乏行動的勇氣或主動性,我們就可在團(tuán)隊中增設(shè)一位虛擬導(dǎo)師。
其中的規(guī)則之一是,如果某人不說話,導(dǎo)師會主動問他“你怎么看?”“你的任務(wù)完成了嗎?”或“你還有任務(wù)沒完成嗎?”,目的是將其置于任務(wù)焦點(diǎn)下。而對那些滔滔不絕的學(xué)生,導(dǎo)師可以說“你說得對。不過,我很好奇其他人怎么看?”,從而擴(kuò)散會話,了解其他成員的想法。假如大家沒有專心解決問題,只是在閑聊,這時可以讓虛擬代理說“好的,現(xiàn)在請大家回到手頭的工作上來”。今天,借助人工智能技術(shù),我們能實時監(jiān)測某人的發(fā)言是否與主題相關(guān)。如果持續(xù)閑聊,虛擬導(dǎo)師會打斷并指出“我不知道這與主題有什么關(guān)系”。另一個問題是,一旦有人說臟話或者言辭過激,即發(fā)言不當(dāng)或不專業(yè),系統(tǒng)會提醒“請別說這種話,我們還有正事要做呢”。
當(dāng)小組成員的意見發(fā)生分歧時,解決辦法之一是找到分歧的共同點(diǎn)。假設(shè)在某方面兩人都同意,但其他方面有異議,那么接下來需要明晰的是,贊同與不贊同的內(nèi)容。其實,只要組員共同厘清這些異同,他們自然而然會形成某種共識。其中有多種對話技巧,都是人工智能和自然語言理解可利用的。我們可以使用虛擬代理靈活驅(qū)動,經(jīng)濟(jì)又高效。
記者:也就是說,虛擬代理能促進(jìn)人們之間更好地溝通交流。那么,相對于一對一輔導(dǎo),團(tuán)隊導(dǎo)學(xué)系統(tǒng)是否有所不同?
格雷澤教授:是的,這是個很好的問題,因為兩者側(cè)重點(diǎn)不同。我的博士生曾作過研究,對比傳統(tǒng)課堂、一對一輔導(dǎo)和小組互動中學(xué)生提問的數(shù)量。結(jié)果發(fā)現(xiàn),小組提問數(shù)量最多,超過一對一輔導(dǎo),遠(yuǎn)多于課堂——因為課堂幾乎為零。頗具諷刺的是,它發(fā)生在美國。美國統(tǒng)計數(shù)據(jù)發(fā)現(xiàn),學(xué)生在課堂中每小時提問數(shù)量平均僅0.11個!換言之,每名學(xué)生大概九到十小時才會問一個問題。然而,小組互動中每小時卻高達(dá)20個。所以,主動性或提問可以當(dāng)作衡量標(biāo)準(zhǔn)開展研究。這位博士后來做博士后,目前就職于ACT①,年薪15萬美元。很顯然,知識就是金錢,前提是能夠找到并真正解決問題。
記者:對研究新手而言,這既受啟發(fā)又相當(dāng)勵志。那么,以AutoTutor為例,在一對一輔導(dǎo)中,智能導(dǎo)學(xué)系統(tǒng)在教學(xué)中只需建立暢通的教學(xué)對話即可,但在團(tuán)隊教學(xué)中,是不是系統(tǒng)本身也需要參與其中,有角色參與并起到協(xié)調(diào)作用?
格雷澤教授:對,這就是為什么把它叫做Tutor而不是Mentor或Monitor的原因。在理想狀態(tài)下,虛擬導(dǎo)師的風(fēng)格應(yīng)該不同:有的是微觀管理者,催促人們做事;有的負(fù)責(zé)觀察學(xué)生、觀察互動,在互動沒有進(jìn)展時發(fā)言推進(jìn)討論。假設(shè)某個小組正在協(xié)作解決問題或設(shè)計某種產(chǎn)品,但突然因某種原因停滯不前了,這時虛擬導(dǎo)師會出面提供信息,幫助小組攻克難關(guān)。有人認(rèn)為這種導(dǎo)師比微觀管理者更好,因為學(xué)生會得到激勵并保持主動。布倫特·摩根(Brent Morgan)等人的文章②,討論了不同導(dǎo)師的策略,可供參考。
關(guān)于團(tuán)隊教學(xué),我想強(qiáng)調(diào)一個重要問題,那就是,現(xiàn)在的問題比過去復(fù)雜,需要更深層的理解和學(xué)習(xí),一人往往獨(dú)木難支。因此,采用團(tuán)隊協(xié)作促進(jìn)學(xué)習(xí)者的深層學(xué)習(xí)仍是所有人的共同愿景。這有三種實現(xiàn)方式:
一、在個體層面上,通過一對一輔導(dǎo)改善學(xué)生的心智模式。這可借助AutoTutor或其他智能導(dǎo)學(xué)系統(tǒng)完成。
二、在團(tuán)隊層面上,通過協(xié)作解決問題或制作物品。比如,極具挑戰(zhàn)的“創(chuàng)客運(yùn)動”,無人能獨(dú)自完成,甚至連答案都無從知曉。這通常應(yīng)由不同技能的人組成團(tuán)隊共同探討,也只有在團(tuán)隊中才能獲得深入的解決方案。
三、選擇“真正的問題”。所謂“真正的問題”是指能激發(fā)人們內(nèi)在動力開展研究和解決的問題。舉例說,假設(shè)某學(xué)校幫派和暴力問題嚴(yán)重,不論作為整體還是其中的小團(tuán)體,學(xué)生都會主動尋求辦法避免陷入幫派糾紛,這就是個“真正的問題”。于是,學(xué)生對某件事越有動力,會鉆研得越深,越可能探查到更深層的知識。有趣的是,今天的美國人正奮力研究如何擺脫特朗普(Trump),且已經(jīng)學(xué)習(xí)到很多關(guān)于政府的知識。
記者:這真是個值得深入探索的領(lǐng)域。在智能導(dǎo)學(xué)系統(tǒng)中團(tuán)隊往往以小組出現(xiàn),那么小組輔導(dǎo)的理論挑戰(zhàn)是什么?
格雷澤教授:一是小組如何運(yùn)作,二是如何提升小組協(xié)作質(zhì)量。我是協(xié)作問題解決能力評價專家團(tuán)主席。我與他人合作撰寫了涵蓋各種團(tuán)隊理論的論文,作為2015年國際學(xué)生評價項目(PISA)的成果。就目前來說,理論還在發(fā)展完善中,不過首要問題是如何在協(xié)作問題解決上訓(xùn)練學(xué)生。
帕特里克·格里芬(Patrick Griffin)是澳大利亞研究者,2007—2015年間,他的研究團(tuán)隊嘗試訓(xùn)練學(xué)生的協(xié)作技能,但由于缺乏經(jīng)費(fèi)未能繼續(xù)。幸運(yùn)的是,他出版了這方面的著作。
還有斯蒂芬·菲奧里(Stephen Fiore),我們合作在《Nature》子刊發(fā)表了討論訓(xùn)練團(tuán)隊協(xié)作解決問題的論文③。文章討論的是,有時分組解決問題反而不會得到反饋。比如,學(xué)生分組完成項目時,教師拍拍頭表揚(yáng)一句“不錯”,但這不是詳細(xì)的反饋,因為教師不清楚該如何推進(jìn)合作。
鑒于反饋的重要性,許多人將目光投向智能導(dǎo)學(xué)系統(tǒng),希望它能教導(dǎo)如何成為優(yōu)秀的合作者。事實上,美國海軍已經(jīng)嘗試設(shè)計了此類智能導(dǎo)學(xué)系統(tǒng)基本框架,形成了通用智能導(dǎo)學(xué)框架(Generalized Intelligent Framework for Tutoring,簡稱GIFT)開源項目④。關(guān)于協(xié)作解決問題的基本理論,你們可以參考那篇論文。它囊括了大部分相關(guān)文獻(xiàn)。但是,對于如何訓(xùn)練協(xié)作解決問題的研究仍很少。而這正是我想要做的,我想研究人們還沒有研究過的東西,因為那里會有更多的發(fā)現(xiàn)。
記者:您已經(jīng)為智能導(dǎo)學(xué)系統(tǒng)研究作出了卓越貢獻(xiàn)。我們想知道,當(dāng)您從學(xué)校畢業(yè)時,為何選擇從事教育技術(shù)研究?怎么萌發(fā)創(chuàng)建AutoTutor系統(tǒng)的?
格雷澤教授:非常好的問題。其實,一切都源于興趣。在整個職業(yè)生涯中,我一直對交流和對話感興趣。我發(fā)現(xiàn)在輔導(dǎo)過程中,師生的知識結(jié)構(gòu)之間實際上鴻溝很大。我十分好奇人們是如何解決這個問題的,事實上人們對此知之甚少。因此,我的研究領(lǐng)域之一便是指向(direction giving)。比方說,大家都有過向陌生人問路的經(jīng)歷,路人盡管十分友善并詳細(xì)地告知答案,但你仍可能在一大堆熱情回復(fù)中迷茫不已。很顯然,這樣的交流并不順暢。有時他們還會追問“你明白了嗎?”,而你鼓起勇氣回答“是的,非常感謝”,然后目送他走遠(yuǎn)后趕忙找下個人打聽。這是現(xiàn)實生活中存在巨大溝通鴻溝的典型案例。教學(xué)是另一個案例。也有人研究醫(yī)生與病人之間的互動。病人去看醫(yī)生時,醫(yī)生總是使用成串晦澀難懂的專業(yè)術(shù)語,讓病人不知所云。
于是,我特別想探索這一過程,了解人際鴻溝前人們是如何溝通的。所以,我對輔導(dǎo)過程特別感興趣,分析了許多眾所周知的教學(xué)過程、面部表情和動作等。然后,我發(fā)現(xiàn)教師們所做的也沒什么特別之處,加之我是學(xué)習(xí)認(rèn)知科學(xué)出身,有計算機(jī)科學(xué)背景,所以我打賭計算機(jī)也能做到。
實際上,我讀大學(xué)時是神奇的六十年代,反叛精神特別強(qiáng),我們抗議越戰(zhàn),我當(dāng)時還留了長發(fā),是個嬉皮士。我主修過八個專業(yè),但沒有全部獲得學(xué)位。一開始我學(xué)習(xí)數(shù)學(xué)和計算機(jī)科學(xué),但這與社會學(xué)相關(guān)不大。我便去學(xué)哲學(xué),又學(xué)經(jīng)濟(jì)學(xué),接著又學(xué)英語、人類學(xué)和語言學(xué)。經(jīng)過廣泛涉獵后,最后我進(jìn)入心理學(xué)。因此,我主修心理學(xué),但輔修數(shù)學(xué)、計算機(jī)科學(xué)、哲學(xué)和語言學(xué)等。后來這些正是認(rèn)知科學(xué)的基礎(chǔ),也是認(rèn)知科學(xué)的主要研究領(lǐng)域?;剡^頭看,只要跟著這些問題走,最終都會殊途同歸。
有了這些基礎(chǔ)后,再加上我喜歡創(chuàng)造,所以每次分析各類行為時,我總會思考這些人的行為能否通過計算機(jī)實現(xiàn),并對此充滿信心。恰好在這一時期,出現(xiàn)了語義分析技術(shù),并引發(fā)了計算語言學(xué)的變革。早期分析人類教師時,胡祥恩⑤教授曾跟我一起工作,我們合作論文之一就叫量化會話心理學(xué)⑥。我們提交了申請書,這成為后續(xù)研究的起點(diǎn)。就這樣,我進(jìn)入教育領(lǐng)域,開啟了研究生涯。
虛擬代理出現(xiàn)很早,第一個代理名叫“巴迪(Baldi)”。那時,各種想法不斷涌現(xiàn),我開始對創(chuàng)造新東西感興趣,但創(chuàng)造需要淵博的知識。比如,汽車半路拋錨,得去哪兒修呢?是去汽車制造廠,還是汽車經(jīng)銷商?有些人能滔滔不絕地講個不停“這車五秒內(nèi)能達(dá)到45公里時速”,這只是對汽車進(jìn)行測量,并沒有制造和維修能力。重點(diǎn)是,現(xiàn)在的心理學(xué)家對各種事物開展實驗——通常也只是測量而非構(gòu)建事物。比起測量者,創(chuàng)造者對事物的內(nèi)部機(jī)制理解更深。
記者:AutoTutor已形成了家族,您設(shè)計AutoTutor的愿景是什么?
格雷澤教授:在美國,非常多的成年人閱讀水平低到無法找到合適的工作,所以我想讓有需要的人能免費(fèi)使用。我們跟“專業(yè)讀寫”(Pro-literacy)機(jī)構(gòu)合作,花了很長時間建立訓(xùn)練理解能力的導(dǎo)學(xué)系統(tǒng),其中包含35個小課程模塊,每個時長約半小時,目的是幫助閱讀障礙的成年人。這是其中的愿景之一,若能幫助成千上萬人更好地閱讀,我將十分欣慰。
還是用數(shù)據(jù)說話。在美國大學(xué)生中,閱讀能力未達(dá)到八年級的占38%,數(shù)學(xué)能力嚴(yán)重不足的占40%,形勢相當(dāng)嚴(yán)峻——他們就這樣進(jìn)入大學(xué),學(xué)不好便面臨退學(xué)。實際上,我們可以對理解和閱讀水平低的大學(xué)生進(jìn)行實驗,無須費(fèi)力招募校外被試。如果將范圍拓寬,有這類問題的成年人有多少?答案是五千萬。那么其中又有多少人去讀寫中心求助呢?答案是3%。也就是說,五千萬美國人中僅一百五十萬人試圖尋求幫助,更多人甚至不知道這個機(jī)構(gòu)。因此,我希望AutoTutor能夠讓更多人受益,這就是我的初衷。
記者:與人類教師相比,他們喜歡用這種方式提高自己的能力嗎?
格雷澤教授:是的,大多數(shù)人喜歡使用AutoTutor。首先,人們在它面前不會感到尷尬,可以輕松地展示和審視自己的不足;其次,系統(tǒng)備有教師和學(xué)生兩種代理角色,有時我們會安置學(xué)生代理與真人比賽環(huán)節(jié),但設(shè)定人不會輸給機(jī)器。有趣的是,如果人的表現(xiàn)不好,學(xué)生代理會被“降級”到低一級學(xué)段。這類系統(tǒng)能夠幫助學(xué)生培養(yǎng)自信等品質(zhì),這是我正在做的事。
我還想創(chuàng)建另一個系統(tǒng),希望和優(yōu)秀游戲團(tuán)隊合作,開發(fā)一組對情緒高度敏感的代理系統(tǒng)。之所以選擇游戲方向,是因為思考常會受挫,人們生性不喜歡多思考。但是,虛擬代理和比賽或許能把任務(wù)變成娛樂而引人入勝。人們花時間努力通關(guān),甚至有時會感到沮喪,直到成功完成任務(wù)。我希望用虛擬代理達(dá)到這種效果,也想和公司合作開發(fā)出色的學(xué)習(xí)游戲,但這樣的公司不好找。我們曾嘗試與培生教育集團(tuán)(Pearson Education Group)合作,開發(fā)一款寄予厚望的商業(yè)游戲。該游戲面向高中生和大學(xué)生,用于訓(xùn)練批判性思維,講述火星人降臨地球,以擴(kuò)散偽科學(xué)的伎倆妄圖侵占地球。學(xué)習(xí)者需要努力成為聯(lián)邦科學(xué)局的探員,找到并將火星人緝捕。但他們只有掌握科學(xué)方法,才能在宣傳材料中鑒別出偽科學(xué)。然而,五年前培生教育集團(tuán)遭遇經(jīng)濟(jì)問題,只得中途放棄所有高端科技項目。
記者:真是太可惜了,這屬于“黑天鵝”因素,完全不可控制。不過,游戲中有很多可控因素,最可能影響學(xué)習(xí)效果的因素是哪些呢?
格雷澤教授:成功的游戲的確有利于生成淺層知識,但不適用于深層知識學(xué)習(xí)。人們很難直接在游戲中深度探究。據(jù)我所知,所有成功的商業(yè)游戲,都無法提供深層知識,主要原因是思維上的阻隔和非連續(xù)性。
不過,如果能嘗試找到正確的游戲設(shè)計方法,或許可以克服。比如,有些人——盡管只是少數(shù)——喜歡有深度的、嚴(yán)肅的游戲,他們甚至可能花上幾十個小時沉浸于此。如果能讓更多的人參與其中,那么人們便可能進(jìn)入并享受深度學(xué)習(xí)、系統(tǒng)性思維和因果推斷的樂趣,之后還會對淺層內(nèi)容感到無聊。截至目前,我只見過游戲偶然或短暫地達(dá)到深層學(xué)習(xí)的效果。至于其中的要素,可參考我、胡祥恩和鮑勃(Robert A. Sottilare)合作撰寫的論文⑦。在游戲環(huán)境下,使用通用智能導(dǎo)學(xué)框架和深度學(xué)習(xí)的可能性,奧秘在于反饋和選擇。
再聊一個哥特式的想法。假定任務(wù)為引導(dǎo)孩子進(jìn)入深度學(xué)習(xí),可他們大多很頑皮并愛搞破壞。所以,如果游戲主題是“如何炸毀一幢建筑”,他們一定會長時間非常用心地研究這個問題。又比如,“如何給一個村莊下毒,在指定時間內(nèi)使死亡率最高?”,有些人還喜歡玩欺騙和密謀類的游戲。既然男孩和女孩都會經(jīng)歷這個階段,為何不借機(jī)使之與深度學(xué)習(xí)相關(guān)聯(lián)?
還有個值得思考的問題:為什么在游戲中人們對積極的事情沒那么感興趣呢?為什么孩子們的學(xué)習(xí)會偏好哥特式元素?這種現(xiàn)象在心智中如何發(fā)展起來的?我敢打賭中國也會有這種情況,肯定有孩子一拿到玩具就想拆解,即使拆開后無法裝回原樣。請注意,他們正自發(fā)努力弄清事情背后的運(yùn)作方式,這就是深層知識的萌芽!但有多少家長和教師不是在斥責(zé)聲中扼殺了孩子們這種深度思考和大膽探索之途呢?
為推翻敘利亞巴沙爾政權(quán),美國除了動用阿盟政治力量、反對派武裝之外,還暗中助長“伊斯蘭國”壯大?!耙了固m國”發(fā)動圣戰(zhàn),并在較短時期迅速占領(lǐng)敘利亞、伊拉克的一些重要城市和地區(qū),以及包括中國石油企業(yè)在內(nèi)的國際公司在敘利亞運(yùn)營的油氣田?!耙了固m國”推行原教旨主義,采取極端統(tǒng)治手段,對世界和西方的威脅越來越大。美國不得不與國際力量聯(lián)合開展清剿,并在軍事上基本終結(jié)了存在三年多的極端組織“伊斯蘭國”。
記者:不止孩子,成年人仍有這種沖動。感謝您的啟發(fā),這是個非常深刻的問題。您如何看待深層知識和深度學(xué)習(xí)之間的關(guān)系?
格雷澤教授:深層知識不僅需要系統(tǒng)性思考,還需要因果互動。通常,某個事物被視為包含眾多要素的整體系統(tǒng),那么附帶效應(yīng)和意外事件會使實際方案變復(fù)雜。
例如,人行橫道剛被使用時,事故率陡增三倍。原因在于,行人認(rèn)為自己被允許過馬路,可司機(jī)不十分清楚這一點(diǎn),不少司機(jī)直接忽視人行橫道而引發(fā)交通事故,這屬于意料外的后果。直至十年后情況才發(fā)生逆轉(zhuǎn),人行橫道切實降低了事故頻率。這需要以“有多少司機(jī)會注意人行橫道?”“有多少行人會十分小心?”等反思思維去思考。當(dāng)習(xí)慣于系統(tǒng)性思考后,就會意識到一個簡單的解決辦法很可能存在紕漏,因為背后的整體機(jī)制不簡單。
現(xiàn)實問題根本不像建立數(shù)學(xué)模型求得最優(yōu)解一樣容易,折中權(quán)衡極具挑戰(zhàn)。比如,美國新奧爾良市曾多次遭遇颶風(fēng)襲擊,城市受損嚴(yán)重。起初,人們計劃建造超大堤壩擋住洪水,事實證明此事絕非那么簡單,因為只要水位漫過堤壩,就是一場滅頂之災(zāi)。如果換種思考方式,種植一些植物群落,隨機(jī)排列在海岸線上而非把墻建得越來越高,就能使阻擋洪水的屏障功用發(fā)揮到最大化,這才是真正穩(wěn)妥的解決方案。同理,在政治領(lǐng)域中,特朗普想建造“美式長城”,結(jié)果這個愚蠢提議讓更多的人越過了邊境。
記者:因此在您看來,為了提升學(xué)生深度學(xué)習(xí)的能力,對話是必需的?
格雷澤教授:對,很有必要。我贊同喬治·米勒(George Miller)的觀點(diǎn),這位神人不僅對認(rèn)知心理學(xué)、心理語言學(xué)和認(rèn)知神經(jīng)科學(xué)的建立貢獻(xiàn)巨大,還將喬姆斯基(Chomsky)的生成語法理論引入心理學(xué),甚至參與了WordNet項目,不過最知名的一定是神奇數(shù)字“7±2”。他認(rèn)為語言是最不模糊的交流方式,人們通常從語言中獲取的信息和判斷比其他交流形式都高級。很多人說有研究表明人們的主要交流方式是面部表情和肢體語言,這太偏激了,這些結(jié)論通常來自實驗室中簡單互動的圖片或視頻,因此生態(tài)效度很低。假如你想向我傳達(dá)復(fù)雜信息,比如你打算明年春夏之交的某個時間來孟菲斯拜訪我,如何用肢體語言表達(dá)呢?同樣,若想解釋事物的問題出在哪里,不用言語表達(dá),溝通將變得非常困難。
回到 “指路”的例子。如果向別人問路,98%的人會用手指著目標(biāo)方向,甚至自己都沒有意識到就指了,此時范圍已明顯縮小。反之,如果他們只用語言回答“向南或向東南方向走”,就不易理解。這時,手勢往往能迅速傳達(dá)準(zhǔn)確信息。因此,手勢和面部表情有時比語言交流效果好。
然而,現(xiàn)實生活中人們需要整合很多信息,特別是在假設(shè)的情況下,必須使用語言。動物不討論假設(shè)世界,有人也許會說它們也有這種跡象,其實沒有,只有人類才會討論假設(shè)的世界。與他人交流時,提及的多為別的時間和地點(diǎn),針對此時此地的信息不多。我敢說你們的談話內(nèi)容有很大部分不是關(guān)于假設(shè)的就是關(guān)于其他時間和地點(diǎn)的。在談?wù)摷僭O(shè)事件時,離開語言通常很難做到。因此,我堅信理解深層知識通常需要涉及清晰的辨別和解釋,這也正是語言的看家本領(lǐng)。不然,用非言語的方式交流深層知識,那就太痛苦,會不得不中斷的。
記者:為了更好地學(xué)習(xí)深層知識,學(xué)生需要更多的深度解釋,創(chuàng)設(shè)對話環(huán)境是一種理想方式。不過,對話與學(xué)生的認(rèn)知緊密聯(lián)系。對嚴(yán)肅游戲的研究,有認(rèn)知和情緒兩種視角。近年來,為何越來越多的研究者開始對情緒感興趣?
格雷澤教授:實際上,概念學(xué)習(xí)是認(rèn)知的,但情緒更能激發(fā)人們的動機(jī)和注意力,二者都為學(xué)習(xí)所必需。進(jìn)一步來說,使人保持學(xué)習(xí)的動力是什么呢?就是情緒。我剛完成一篇論文⑧,對“情緒在學(xué)習(xí)環(huán)境中扮演的角色”進(jìn)行梳理,指出情緒對學(xué)習(xí)而言好似黏合體驗的膠水。在日常生活中,情緒同樣非常重要。假如早上一起床心情就不好,這會影響我們大半天或一整天。多年來,情緒在心理學(xué)研究中一直居次席,現(xiàn)在轉(zhuǎn)向情緒研究正是為了掌控動機(jī)——讓學(xué)生保持動力來源、獲得足夠關(guān)注和毅力堅持學(xué)習(xí)。如果動機(jī)缺乏,成功便遙不可及。
記者:我們非常希望深入了解和使用AutoTutor,也很好奇它有什么缺點(diǎn)?
格雷澤教授:正所謂“甘瓜苦蒂,物無全美”。對這個問題的詳細(xì)闡述,可參考2016年的文章⑨。此外,一篇剛發(fā)表的論文⑩,也指出了其中的不足。我把AutoTutor的缺點(diǎn)大致歸納如下:
第一個實際上是人類自身的弱點(diǎn),與AutoTutor無關(guān)。比如,當(dāng)學(xué)生回答問題時,他只需說出一兩個關(guān)鍵詞就能獲得人類教師的認(rèn)可。但AutoTutor卻期望學(xué)生說出詳細(xì)的信息,這會讓學(xué)生抵觸。很自然,學(xué)生在自動化輔導(dǎo)環(huán)境下也會有這種期望,于是AutoTutor可能會惹到他們。這是非?,F(xiàn)實的矛盾,但并非不能解決。
第二個缺點(diǎn)是AutoTutor無法妥善處理學(xué)生的問題,畢竟設(shè)計者不可能考慮到所有潛在問題,考慮到的問題也不可能提供所有答案。因此,無法直接回答學(xué)生的提問時,AutoTutor會使用語言技巧來回避。比如,它會說“哦,這是個好問題,請稍后再問我”或者“這是個好問題,你怎么看?”
第三個缺點(diǎn)是AutoTutor不會復(fù)述。復(fù)述是很重要的教學(xué)技巧,即教師根據(jù)學(xué)生發(fā)言重新組織語言加以表述。假如你說“哦,AutoTutor,有問題”。如果我需要重述你的話,我會說“你是想知道AutoTutor應(yīng)用是否存在問題嗎?”雖然這只是重復(fù),卻是用更完善的語言加以組織和表達(dá)。優(yōu)秀教師在課堂上也許會這么做,尤其在不明確學(xué)生的表述時,可以說“喬治正在思考語言和交流之間的關(guān)系,你們對此有什么看法?”這種做法一箭雙雕——既能帶動學(xué)生,又能串聯(lián)起其他同學(xué)的問題。我們希望AutoTutor也能做到,但目前還達(dá)不到。事實上,很多人類教師也不擅長復(fù)述,需要接受培訓(xùn)。匹茲堡大學(xué)專門開設(shè)會話課程,指導(dǎo)教師如何在課堂上與學(xué)生更好地交談,復(fù)述便是其中的常見方法。
此外,還有個問題,AutoTutor情緒反饋系統(tǒng)目前仍不理想,不過我們正在改善。例如,假設(shè)學(xué)生回答非常精彩,我們希望系統(tǒng)能夠給出與之對應(yīng)的情緒反饋——用熱切而非平時那種平淡的語氣稱贊學(xué)生。人們一直希望設(shè)計出情緒反饋得當(dāng)?shù)奶摂M導(dǎo)師,用細(xì)致的情感、熱情的或者懷疑的語氣進(jìn)行反饋。很多人類教師可以做到,但AutoTutor還做不到。
記者:由于AutoTutor已被整合到GIFT中,請簡單介紹一下兩者之間的關(guān)系。
格雷澤教授:GIFT既是理論框架,也是工程框架,有一套開源的軟件系統(tǒng),任何人都可以借助GIFT免費(fèi)快速搭建導(dǎo)學(xué)系統(tǒng)?,F(xiàn)在,世界上活躍的智能導(dǎo)學(xué)系統(tǒng)有數(shù)十個。比如,MathTutor是個輔導(dǎo)數(shù)學(xué)的智能導(dǎo)學(xué)系統(tǒng),美國軍方也有用于訓(xùn)練射擊術(shù)的智能導(dǎo)學(xué)系統(tǒng)。GIFT對所有這些智能導(dǎo)學(xué)系統(tǒng)進(jìn)行詮釋,AutoTutor只是其中涉及自然語言交互的一例。
記者:AutoTutor基于對話思想而設(shè)計,GIFT和AutoTutor之間是否存在架構(gòu)沖突呢?
格雷澤教授:不,沒有實質(zhì)性的沖突。AutoTutor和史蒂夫·里特(Steve Ritter)的Cognitive Tutors for Mathematics,后者面向數(shù)學(xué),前者面向自然語言。但當(dāng)學(xué)生陷入僵局時,系統(tǒng)都會給出提示。假如學(xué)生仍不明白,才會告知答案。此外,其他導(dǎo)學(xué)系統(tǒng)通常也遵從“線索-提示-結(jié)論”循環(huán),不會直接被訓(xùn)練成“填鴨機(jī)”。這是GIFT基本原則決定的——不只是講課或直接給出答案,而是提出問題并給出提示,鼓勵學(xué)生主動解決問題。
記者:MOOC在中國非常受歡迎,您如何看待MOOC和AutoTutor之間的關(guān)系,二者能否融合?
格雷澤教授:今天,“融合”指的是不同技術(shù)的協(xié)同工作。八年前,我們討論過MOOC與AutoTutor的結(jié)合,曾設(shè)計了基于MOOC的AutoTutor模型。其實,我們既然有MOOC,又有會話代理,沒理由不能融合。當(dāng)時本想深入探究,卻因忙于其他事務(wù)而擱淺,但我仍覺得二者融合十分必要。
在MOOC模式下,要么觀看視頻,要么閱讀文本或完成練習(xí),學(xué)生不知道自己是否真正理解。因為人的閱讀理解能力并不完美,學(xué)生對材料的實際理解程度和自認(rèn)為理解程度之間的相關(guān)性僅0.27。這其實是缺乏反饋所致。這看似復(fù)雜,其實很簡單,不需要懂得很多技術(shù)知識就能做到。比如,學(xué)生正在學(xué)習(xí)MOOC視頻課程,中途暫停并彈出對話框“如果按1-5評分,請您就本材料的理解程度打分”。學(xué)生給出評分,系統(tǒng)繼續(xù)提問“現(xiàn)在,請你概括觀看的內(nèi)容并輸入”。不少學(xué)生開始都自認(rèn)為理解到位,卻往往在概括環(huán)節(jié)啞口無言。這是個非常簡單的操作,只需暫停并概括總結(jié)即可,其間僅需采集概括的內(nèi)容,甚至無須給出任何反饋。這種方法有兩方面優(yōu)勢:一,可以提高內(nèi)在認(rèn)知標(biāo)準(zhǔn)和理解標(biāo)準(zhǔn),學(xué)生將意識到“我可能沒有完全理解學(xué)習(xí)材料,因為我什么也說不出來”;二,助力學(xué)生深入內(nèi)化信息。最終,理解和概括能力都將獲得提升。
記者:AutoTutor有良好的過程控制,其效果可以細(xì)化至個體,但MOOC不同。
格雷澤教授:是的,就AutoTutor控制MOOC教學(xué)進(jìn)度而言,技術(shù)上沒有任何問題。Moodle就是理想的平臺,胡祥恩教授已經(jīng)將很多課程以Moodle的方式進(jìn)行部署,創(chuàng)作插件提供多種控制方式,可對視頻或多頁材料的目標(biāo)位置設(shè)置斷點(diǎn),實現(xiàn)學(xué)生評分及收集總結(jié)等操作,全程無需編程、易掌握。其實,MOOC本身也有聊天互動的功能,但使用者寥寥無幾。人們可以開發(fā)一個插件運(yùn)行虛擬代理,讓它站出來說“等一會,你理解了嗎?你學(xué)習(xí)得怎么樣?能替我總結(jié)一下剛剛學(xué)習(xí)的內(nèi)容嗎?”使之更富社交性。還可設(shè)置積分,讓你認(rèn)為另一個學(xué)生正與你一起學(xué)習(xí),如果你能提供幫助,就可以加分。
記者:請暢想一下,如果您有足夠的財富,您會選擇哪種人工智能技術(shù)開發(fā)更好的AutoTutor呢?
格雷澤教授:首先跳入腦海的念頭是,一定要做與眾不同的事。以物聯(lián)網(wǎng)為例,世界上有各式各樣的設(shè)備,人們并不熟悉它們的功能,也不知道該如何使用?,F(xiàn)在,也請你們暢想一下,假如設(shè)備能夠像AutoTutor一樣與人類互動,可以向使用者介紹自己該有多好。在你拿到一個新設(shè)備卻窘于不知如何使用時,它便開口道“嗨,你想了解我嗎?”,而不是像現(xiàn)在,你拿著一個不會說話的新輪胎,心中痛苦地嘀咕著“我該怎么辦?”然而,未來的孩子們或許會驚訝道“我的自行車竟然是個啞巴!”
記者:太酷了,也許下一個谷歌和臉書就在這里。謝謝您,最后還有三個小問題,請您用一句話回答。第一個小問題是,在整個職業(yè)生涯中,您最高興的事情是什么?
格雷澤教授:最開心的時刻是被授予Harold W. McGraw學(xué)習(xí)科學(xué)獎,這要感謝胡祥恩教授的幫助。
記者:第二個小問題,在所有成就中,什么是最成功的?
格雷澤教授:最成功的事情就是我和同事一起合作創(chuàng)建了AutoTutor。
記者:最后一個小問題,您最遺憾的事情是什么?
格雷澤教授:最大的遺憾是沒有足夠的能力將AutoTutor造福于千千萬萬的人。
所以,我們現(xiàn)在需要與企業(yè)合作。其實,到了我這個年齡,并不在乎能否借AutoTutor致富,只關(guān)心它能否被大眾使用。擔(dān)心侵犯知識產(chǎn)權(quán)在我這兒是多余的。我真心希望我的知識產(chǎn)權(quán)被大家“侵犯”,也誠摯歡迎大家前來“侵犯”!
[注釋]
① ACT是一家提供美國大學(xué)入學(xué)考試(American College Test,簡稱ACT)服務(wù)的非營利性教育培訓(xùn)公司。
② D’Mello S., Jackson T., Craig S., et al.(2008). AutoTutor detects and responds to learners affective and cognitive states[C]//Workshop on emotional and cognitive issues at the international conference on intelligent tutoring systems: 306-308.
③ Fiore, S. M., Arthur, G., & Samuel, G.(2018). Collaborative problem-solving education for the twenty-first-century workforce[J]. Nature Human Behaviour,2(6):367-369.
④ https://gifttutoring.org.
⑤ 胡祥恩教授是美國孟菲斯大學(xué)心理學(xué)系、電子計算機(jī)工程系、計算機(jī)科學(xué)系教授,智能系統(tǒng)研究院高級研究員,華中師范大學(xué)心理學(xué)院院長、中國青少年網(wǎng)絡(luò)心理與行為教育部重點(diǎn)實驗室高級研究員,主要研究領(lǐng)域包括數(shù)學(xué)心理學(xué)、實驗設(shè)計與統(tǒng)計、心理學(xué)、人工智能和智能導(dǎo)學(xué)系統(tǒng)。
⑥ Graesser, A. C., Swamer, S. S., & Hu, X.(1997). Quantitative discourse psychology[J]. Discourse Processes,23(3):229-263.
⑦ Graesser, A. C., Hu, X., Nye, B. D., & Sottilare, R. A.(2016). Intelligent tutoring systems, serious games, and the Generalized Intelligent Framework for Tutoring (GIFT)[M]. Using Games and Simulations for Teaching and Assessment. Routledge: 82-104.
⑧ Graesser, A. C.(2019). Emotions are the experiential glue of learning environments in the 21st century[J]. Learning and Instruction, 2019:https://doi.org/10.1016/j.learninstruc.05.009.
⑨ Graesser, A. C.(2016). Conversations with AutoTutor help students learn[J]. International Journal of Artificial Intelligence in Education,26(1):124-132.
⑩ Dowell, N. M. M., Nixon, T. M., & Graesser, A. C.(2019). Group communication analysis:A computational linguistics approach for detecting sociocognitive roles in multiparty interactions[J]. Behavior research methods,51(3):1007-1041.