范永全 李顯勇 杜亞軍
關(guān)鍵詞:自然語言處理;多元考核;OBE;項目驅(qū)動;教學(xué)改革
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)03-0133-03
0引言
隨著互聯(lián)網(wǎng)和社會媒體的快速發(fā)展,網(wǎng)絡(luò)文本呈爆炸性增長,為自然語言處理提出了巨大的應(yīng)用需求。同時,自然語言處理研究也為人們更深刻地理解語言的機(jī)理和社會的機(jī)制提供了一條重要的途徑,社會對具備自然語言處理能力的人才的需求日益迫切。作為人工智能的支撐技術(shù),自然語言處理(NaturalLanguage Processing,NLP) 在機(jī)器翻譯、智能客服、信息檢索等領(lǐng)域具有廣泛應(yīng)用,需要大量具備NLP技術(shù)的人才來推動相關(guān)領(lǐng)域的發(fā)展[1]。目前,很多高校和科研院所都開設(shè)了自然語言處理課程,對“自然語言處理”的教學(xué)模式進(jìn)行探討[2-6],已成為當(dāng)前高校計算機(jī)和人工智能及相關(guān)專業(yè)教學(xué)體系和人才培養(yǎng)工作中的改革重點。
成果導(dǎo)向教育(Outcomes-based Education) 是指基于學(xué)習(xí)產(chǎn)出的教育模式[7]。OBE理念強(qiáng)調(diào)學(xué)生取得的成果,提高學(xué)生學(xué)習(xí)的積極性和主動性,把所學(xué)知識轉(zhuǎn)化為實踐能力。本文旨在探索基于OBE理論的自然語言處理課程教學(xué)改革的途徑與實踐。通過在現(xiàn)有基礎(chǔ)上,引入基于深度學(xué)習(xí)技術(shù)的項目實踐,制定以團(tuán)隊授課、多階段、多元化考核的目標(biāo)驅(qū)動的教學(xué)模式,使得學(xué)生在掌握理論知識的同時,提升學(xué)生的實踐能力和創(chuàng)新能力。
1 教學(xué)現(xiàn)狀分析
西華大學(xué)是四川省屬重點綜合性大學(xué),學(xué)院建有“計算機(jī)軟件與理論”四川省重點學(xué)科和“智能技術(shù)與系統(tǒng)”四川省高??蒲袆?chuàng)新團(tuán)隊,長期以來開設(shè)研究生“自然語言處理”和“社會網(wǎng)絡(luò)與計算”課程,培養(yǎng)了不少人工智能方向的高層次人才。隨著社會對智能信息處理人才的需求不斷增長,對自然語言處理課程的教學(xué)改革勢在必行。傳統(tǒng)的自然語言處理課程教學(xué)存在一些問題,如教學(xué)內(nèi)容滯后、教學(xué)方法單一等,需要進(jìn)行改革與創(chuàng)新。
自然語言處理是計算機(jī)科學(xué)與技術(shù)專業(yè)大數(shù)據(jù)與人工智能方向碩士研究生的學(xué)科專業(yè)課,主要從計算機(jī)科學(xué)的角度出發(fā),研究用計算機(jī)來理解和生成自然語言的各種理論和方法,屬于人工智能領(lǐng)域的一個重要甚至核心分支。該課程傳統(tǒng)以課程講授為主,這種教學(xué)模式存在理論與實踐脫節(jié)、教學(xué)內(nèi)容陳舊、教學(xué)方法單一等問題。學(xué)生往往難以將理論知識應(yīng)用到實際問題中,導(dǎo)致應(yīng)用能力不足。具體來說,傳統(tǒng)教學(xué)模式存在的主要問題分析如下:
1) 課時分配少,研究內(nèi)容多、授課難度大。自然語言處理課程涵蓋了緒論,概率統(tǒng)計與信息論基礎(chǔ)、語料庫語言學(xué),形式語言與自動機(jī)、語言模型、詞法分析、句法分析、語義分析,以及包括文本分類、信息抽取、情感分析、問答系統(tǒng)、對話系統(tǒng)、閱讀理解等在內(nèi)的NLP應(yīng)用,但教學(xué)計劃只有32課時,難以深入覆蓋所有研究內(nèi)容。
2) 學(xué)生基礎(chǔ)參差不齊,學(xué)習(xí)效率低。由于大數(shù)據(jù)和人工智能的關(guān)注熱度,有不少學(xué)生是跨專業(yè)報考計算機(jī)與軟件工程專業(yè),專業(yè)基礎(chǔ)和編程能力薄弱,難以在短時間內(nèi)掌握相關(guān)知識。
3) 課程教學(xué)與研究實踐脫節(jié)。由于導(dǎo)師不參與課程教學(xué)和考核,授課教師難以顧及每個學(xué)生的具體研究方向,課程大作業(yè)與導(dǎo)師方向沒有關(guān)聯(lián),導(dǎo)致大作業(yè)沒有針對性而同質(zhì)化。
針對以上問題,筆者為自然語言處理課程引入OBE教學(xué)模式,緊緊圍繞“ 以學(xué)生為中心、產(chǎn)出導(dǎo)向、持續(xù)改進(jìn)”進(jìn)行教學(xué)設(shè)計,建立一套有效的教學(xué)方案與考核評價體系。
2 基于OBE 理念的課程教學(xué)改革
OBE 教學(xué)模式通過培養(yǎng)學(xué)生的學(xué)習(xí)能力、創(chuàng)新能力、團(tuán)隊協(xié)作能力以及分析問題、解決問題的能力來提高教學(xué)質(zhì)量,以培養(yǎng)對社會有用的創(chuàng)新型技能人才。具體來說,通過以下幾個方面進(jìn)行自然語言處理教學(xué)改革。
2.1 傾聽學(xué)生需求,關(guān)注學(xué)生發(fā)展
通過調(diào)查研究和討論,了解學(xué)生對自然語言處理課程的期望和需求。通常,學(xué)生對專業(yè)方向和未來的就業(yè)比較感興趣,在課堂上可以聯(lián)系人工智能專業(yè)廣闊的發(fā)展前景,相對較高的薪資水平,NLP算法工程師平均薪資,以及人工智能專業(yè)需要具備的素質(zhì)和專業(yè)技能這些話題進(jìn)行舉例和討論,激發(fā)學(xué)生的學(xué)習(xí)興趣和主動性。
營造積極互動的學(xué)習(xí)環(huán)境和學(xué)習(xí)氛圍,鼓勵學(xué)生之間的合作與交流。通過小組討論、項目實踐等方式,激發(fā)學(xué)生的創(chuàng)新思維和團(tuán)隊合作能力。針對學(xué)生的興趣和特長,設(shè)計靈活多樣的教學(xué)內(nèi)容,采用項目驅(qū)動[2,6]進(jìn)行實踐教學(xué)。在課程開始之前,按照當(dāng)前NLP領(lǐng)域的研究熱點,把選課的學(xué)生分成7個小組,每組2-3名同學(xué),協(xié)作完成一個自然語言處理的綜合實踐項目。部分項目如下:
1) 序列標(biāo)注方法研究
2) 實體關(guān)系抽取方法研究
3) 推薦系統(tǒng)算法實現(xiàn)
4) 事件抽取方法研究
5) 知識庫問答系統(tǒng)研究6) 知識圖譜構(gòu)建研究7) 文本情感分析方法研究
2.2 激發(fā)學(xué)生的學(xué)習(xí)興趣和主動性,培養(yǎng)學(xué)生的實踐能力和創(chuàng)新意識
通過結(jié)合具體案例和學(xué)生所選的實戰(zhàn)項目,引導(dǎo)學(xué)生主動探索獨立思考、查閱資料,提出解決方案,進(jìn)行課內(nèi)討論、并由學(xué)生獨立實現(xiàn),其中,優(yōu)秀方案和成果可以整理成論文發(fā)表。通過引入有趣的應(yīng)用場景和挑戰(zhàn)性的項目,定期檢查項目進(jìn)度,解決遇到的難點,在學(xué)生中形成奮發(fā)向上的氛圍,激發(fā)學(xué)生的學(xué)習(xí)興趣和動力,培養(yǎng)解決問題的能力。
在教學(xué)過程中,采用案例引導(dǎo)進(jìn)行啟發(fā)式教學(xué)。比如,在介紹自然語言處理的應(yīng)用領(lǐng)域時,可以列舉日常生活中的案例,讓學(xué)生來回答是什么應(yīng)用。比如,微信的語音轉(zhuǎn)換成文字(語音識別、語言模型),公交自動報站(文語轉(zhuǎn)換)、垃圾郵件篩選(文本過濾)、小學(xué)生作業(yè)拍照批改(文本識別)、命題作文(文本生成)、產(chǎn)品說明書文字提?。ㄐ畔⒊槿。?、汽車輔助駕駛(語音識別、對話系統(tǒng))……。通過這些案例的引入,讓學(xué)生思考自然語言處理在日常生活中的實際應(yīng)用,激發(fā)學(xué)生的學(xué)習(xí)興趣。
通過實踐項目和案例分析,培養(yǎng)學(xué)生的實際應(yīng)用能力。鼓勵學(xué)生自主設(shè)計和實現(xiàn)自然語言處理系統(tǒng),提升他們的創(chuàng)新意識和問題解決能力。
2.3 引入最新的研究成果和技術(shù),及時更新教學(xué)內(nèi)容
在教材方面,選擇中國科學(xué)院自動化所宗成慶研究員編寫的《統(tǒng)計自然語言處理》[1],這本書是國內(nèi)NLP領(lǐng)域的經(jīng)典教材,介紹了自然語言處理的基本原理和常見應(yīng)用,如情感分析、文本生成等。除了學(xué)習(xí)教材中的經(jīng)典內(nèi)容,還應(yīng)引導(dǎo)學(xué)生理解深度學(xué)習(xí)技術(shù)在自然語言處理中的作用和優(yōu)勢。特別是隨著人工智能模型的發(fā)展,預(yù)訓(xùn)練模型、強(qiáng)化學(xué)習(xí)、對抗訓(xùn)練網(wǎng)絡(luò)、圖神經(jīng)網(wǎng)絡(luò)等前沿算法驅(qū)動了一系列新興的NLP 技術(shù)。通過引入最新的研究成果和技術(shù)進(jìn)展,介紹先進(jìn)的模型架構(gòu)、算法和工具,讓學(xué)生了解最新的自然語言處理技術(shù),并引導(dǎo)他們參與相關(guān)研究。
隨著以ChatGPT為標(biāo)志的大模型的問世,開辟了人工智能的發(fā)展的新紀(jì)元。大型語言模型(LLM) 的出現(xiàn)為NLP的研究帶來新的機(jī)遇和挑戰(zhàn),也產(chǎn)生了值得研究的新方向:
1) 隨著大模型積累的數(shù)據(jù)不斷增加,呈現(xiàn)出與以往統(tǒng)計學(xué)習(xí)模型、深度學(xué)習(xí)模型、預(yù)訓(xùn)練模型不同的特性,從而需要對大模型的基礎(chǔ)理論進(jìn)行深入研究。
2) 大模型往往包含數(shù)以億計的參數(shù),對計算和存儲的成本消耗巨大,如何建設(shè)更加高效的分布式計算體系是一個值得研究的問題。
3) 目前預(yù)訓(xùn)練模型已經(jīng)得到了廣泛應(yīng)用,但真正使用大模型的研究占比并不高。其原因在于,盡管已經(jīng)有很多的大模型開源框架,但是對于計算能力薄弱的研究機(jī)構(gòu)來說,如何將大模型高效適配到具體應(yīng)用場景是亟待解決的問題。
2.4 利用多媒體技術(shù)和在線資源,豐富教學(xué)方法與手段
結(jié)合OBE理念進(jìn)行教學(xué)設(shè)計[7],其教學(xué)模式的組織如圖1所示。課前發(fā)布教學(xué)資源供學(xué)生預(yù)習(xí),課堂采用師生互動的參與式教學(xué),引導(dǎo)學(xué)生參與課堂活動,課后發(fā)布在線測驗或課后作業(yè)引導(dǎo)學(xué)生進(jìn)行知識鞏固和拓展,并通過微信、QQ群進(jìn)行線上答疑。在教學(xué)資源方面,除了使用教材配套的PPT之外,還向?qū)W生引入學(xué)堂在線,中國大學(xué)慕課等平臺中優(yōu)秀的網(wǎng)課資源,如西湖大學(xué)的“自然語言處理”,北京理工大學(xué)的“機(jī)器學(xué)習(xí)”、浙江大學(xué)的“知識圖譜”等在線教程。
為了深入地學(xué)習(xí)某一具體任務(wù),如“知識圖譜問答系統(tǒng)”,可引導(dǎo)學(xué)生參照B站相關(guān)視頻,通過展示視頻,提供直觀的學(xué)習(xí)材料和實踐環(huán)境,幫助學(xué)生更好地理解和應(yīng)用知識。提供實踐項目和團(tuán)隊合作任務(wù),讓學(xué)生通過實際操作和合作解決自然語言處理問題。培養(yǎng)學(xué)生的團(tuán)隊合作精神和實踐能力,提升他們的綜合素質(zhì)。
2.5 設(shè)計多樣化的評估方式,完善考核體系
針對傳統(tǒng)課程考核方式存在的問題,制定了團(tuán)隊授課和導(dǎo)師參與的多元化的評估方式,包括文獻(xiàn)綜述、單元測驗、算法實驗報告、項目展示、小組討論等。通過綜合評估學(xué)生的理論掌握、實踐能力和團(tuán)隊合作能力,全面了解他們的學(xué)習(xí)成果。在西華大學(xué)碩士研究生培養(yǎng)方案中,本課程為2學(xué)分,32學(xué)時。每個章節(jié)的學(xué)習(xí)結(jié)束后,按照教學(xué)計劃進(jìn)行單元測驗、算法實驗或大作業(yè),按照每個單元評分比例核算最終成績。課程總成績由三部分構(gòu)成:即平時成績(20%) 、實踐環(huán)節(jié)(30%) 和期末考試成績(50%) 。其中,平時成績由課堂表現(xiàn)(50%) 、單元測驗(50%) 構(gòu)成。課堂表現(xiàn)包括出勤、課堂提問、課堂練習(xí)等。實踐環(huán)節(jié)可以根據(jù)章節(jié)內(nèi)容,選擇文獻(xiàn)綜述/算法實驗報告/項目報告的方式,由負(fù)責(zé)該模塊的教師靈活把握。
如表1所示為課程的教學(xué)日歷安排及考核方式設(shè)置,課程教學(xué)團(tuán)隊由三位老師承擔(dān),每人負(fù)責(zé)若干相關(guān)的單元,通過多階段、多元化考核和多人參與授課的方式,彌補(bǔ)了期末考試/大作業(yè)考核方式中存在的單一考核模式。通過團(tuán)隊教學(xué)+導(dǎo)師參與的方式,引導(dǎo)學(xué)生進(jìn)入自己感興趣的研究領(lǐng)域。利用單元測驗+項目報告的方式,使得學(xué)生同時掌握理論原理和算法實現(xiàn)能力。對于編程能力,由于每個學(xué)生的入學(xué)基礎(chǔ)不同,要求其通過自學(xué)的方式鞏固Python編程和機(jī)器學(xué)習(xí),在完成算法實驗/項目實訓(xùn)的過程中提高編程能力。
3 教學(xué)改革的成效與反饋
通過兩屆研究生自然語言處理課程的教學(xué)改革探索實踐,基于OBE理念的教學(xué)思路明顯提高了教學(xué)質(zhì)量,課程改革得到了學(xué)生普遍的認(rèn)可。主要體現(xiàn)在:
1) 學(xué)生能夠在研一下學(xué)期根據(jù)項目實訓(xùn)的大作業(yè)為背景,撰寫學(xué)術(shù)論文。以2022級為例,在11位選修該課程的同學(xué)中,有6位有論文投稿,其中1位同學(xué)的論文“基于信息集成的意圖識別和槽位填充聯(lián)合模型研究”已被《計算機(jī)應(yīng)用研究》錄用。
2) 鼓勵學(xué)生團(tuán)隊在合作完成項目實訓(xùn)任務(wù)的基礎(chǔ)上,積極申請軟件著作權(quán)。其中有學(xué)生在完成了項目實訓(xùn)任務(wù)后,成功申請了名為《知識圖譜問答信息檢索系統(tǒng)》的軟件著作權(quán)。
3) 通過對學(xué)生進(jìn)行問卷調(diào)查與座談,有90%的學(xué)生認(rèn)為課程安排及考核體系合理,有助于調(diào)動其積極性,有80%的同學(xué)認(rèn)為課程改革有助于申請到頭部企業(yè)的實習(xí)機(jī)會,有40%的同學(xué)有意繼續(xù)在課程某個方向進(jìn)行深入研究和論文選題。
4 結(jié)論
基于 OBE 教育教學(xué)理念自然語言處理課程教學(xué)和學(xué)習(xí)方法,更加符合人們的認(rèn)識復(fù)雜事物的規(guī)律。通過改變以往的教學(xué)方式,更新教學(xué)方法,以學(xué)生為中心,設(shè)定教學(xué)內(nèi)容和學(xué)習(xí)目標(biāo),結(jié)合學(xué)習(xí)成果多樣化評估模式,激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動性。通過以上教學(xué)方案和考核措施,基于OBE理念的自然語言處理課程教學(xué)改革可以更好地培養(yǎng)具備實踐能力和創(chuàng)新意識的人才,滿足社會對智能信息處理人才的需求。教師在教學(xué)過程中要注重學(xué)生的主體地位,建立積極互動的學(xué)習(xí)環(huán)境,多樣化評估學(xué)生的能力和素質(zhì)。同時,不斷總結(jié)經(jīng)驗、修正不足,實現(xiàn)教學(xué)改革的可持續(xù)發(fā)展。
【通聯(lián)編輯:王力】