中圖分類號(hào):G434文獻(xiàn)標(biāo)識(shí)碼:A論文編號(hào):1674-2117(2025)09-0048-06
背景和現(xiàn)狀
“人工智能初步”作為高中信息技術(shù)課程的選擇性必修內(nèi)容,旨在讓學(xué)生學(xué)習(xí)描述典型人工智能算法的實(shí)現(xiàn)過程,并通過搭建簡單的人工智能應(yīng)用模塊,了解設(shè)計(jì)與實(shí)現(xiàn)簡單智能系統(tǒng)的基本過程與方法,從而增強(qiáng)學(xué)生利用智能技術(shù)為人類發(fā)展服務(wù)的責(zé)任感。但是,目前中小學(xué)人工智能教育還存在AI課程資源匱乏、教學(xué)設(shè)備及平臺(tái)陳舊、AI教學(xué)師資不足以及GPU算力資源不足等問題,導(dǎo)致一線教師在引導(dǎo)學(xué)生運(yùn)用數(shù)據(jù)、算法和算力解決實(shí)際問題的能力培養(yǎng)上,還面臨一些挑戰(zhàn)。
教育部教育技術(shù)與資源發(fā)展中心(中央電化教育館)發(fā)布的《中小學(xué)實(shí)驗(yàn)教學(xué)基本目錄(2023年版)》(以下簡稱《基本目錄》)不僅為《普通高中信息技術(shù)課程標(biāo)準(zhǔn)(2017年版2020年修訂)》在實(shí)踐教學(xué)中的實(shí)施提供了具體指導(dǎo),而且鼓勵(lì)教師在實(shí)驗(yàn)技術(shù)和方法上進(jìn)行創(chuàng)新,旨在提升學(xué)生解決復(fù)雜問題的能力?!痘灸夸洝访鞔_了通過人工智能實(shí)驗(yàn)教學(xué)提升學(xué)生的實(shí)踐技能和創(chuàng)新思維的路徑。通過實(shí)驗(yàn)教學(xué),重點(diǎn)培養(yǎng)學(xué)生在以數(shù)據(jù)、算法和算力為核心的項(xiàng)目創(chuàng)作中解決實(shí)際問題的能力。
概念與模型
在這樣的背景下,項(xiàng)目式學(xué)習(xí)在人工智能教育中就顯得尤為重要,它不僅能夠激發(fā)學(xué)生的學(xué)習(xí)興趣,還能夠提供一個(gè)實(shí)踐平臺(tái),讓學(xué)生在解決實(shí)際問題的過程中,深入理解和掌握人工智能的核心概念。在人工智能項(xiàng)目式學(xué)習(xí)中,數(shù)據(jù)、算法和算力是實(shí)現(xiàn)項(xiàng)目成功的三個(gè)關(guān)鍵要素,它們在人工智能實(shí)驗(yàn)教學(xué)中扮演著至關(guān)重要的角色。因此,筆者提出了在人工智能項(xiàng)目式學(xué)習(xí)中構(gòu)建以數(shù)據(jù)、算法和算力為核心的實(shí)驗(yàn)教學(xué)模型(如下頁圖1),旨在通過實(shí)驗(yàn)深化學(xué)生對數(shù)據(jù)、算法和算力三要素的理解。
人工智能項(xiàng)目式學(xué)習(xí)涵蓋了從項(xiàng)目需求分析到項(xiàng)目方案設(shè)計(jì),再到項(xiàng)目探究與實(shí)施,以及最終的項(xiàng)目展示與評價(jià)等關(guān)鍵環(huán)節(jié)。在項(xiàng)目探究與實(shí)施階段,采用以數(shù)據(jù)、算法和算力為核心的人工智能實(shí)驗(yàn)教學(xué)。該實(shí)驗(yàn)是學(xué)生掌握知識(shí)點(diǎn)和技能點(diǎn)、落實(shí)核心素養(yǎng)和達(dá)成學(xué)業(yè)要求的重要環(huán)節(jié),可將其細(xì)分為以下幾個(gè)核心步驟。
1.數(shù)據(jù)采集
① 數(shù)據(jù)來源選擇:指導(dǎo)學(xué)生根據(jù)項(xiàng)目需求挑選合適的數(shù)據(jù)源。② 數(shù)據(jù)收集方法:講解網(wǎng)絡(luò)爬蟲、API、調(diào)查問卷、拍攝等數(shù)據(jù)獲取手段。
2.數(shù)據(jù)預(yù)處理
① 數(shù)據(jù)清洗:教授學(xué)生識(shí)別和處理缺失值、異常值和重復(fù)數(shù)據(jù)。② 特征提?。褐笇?dǎo)學(xué)生從原始數(shù)據(jù)中提取有助于模型學(xué)習(xí)的特征。
3.算法選擇與理解
① 算法介紹:闡述貝葉斯分類、線性回歸、決策樹、SVM、神經(jīng)網(wǎng)絡(luò)等。 ② 算法匹配:依據(jù)項(xiàng)目和數(shù)據(jù)特點(diǎn),引導(dǎo)學(xué)生挑選適宜算法。
4.模型訓(xùn)練
① 選擇平臺(tái)和工具:選擇適合中小學(xué)AI教育的工具或?qū)W習(xí)平臺(tái),構(gòu)建訓(xùn)練環(huán)境。 ② 算法實(shí)現(xiàn):應(yīng)用選定算法,執(zhí)行模型訓(xùn)練任務(wù)。
5.模型測試與評估
① 性能評估:運(yùn)用準(zhǔn)確率、召回率、F1分?jǐn)?shù)評估模型。 ② 參數(shù)優(yōu)化:調(diào)整參數(shù)以提升模型效能。
6.算力資源應(yīng)用
① 算力硬件基礎(chǔ):講解算力基 礎(chǔ),對比CPU與GPU。 ② 云服務(wù)算
力:感受云服務(wù)對AI項(xiàng)目帶來的便利。 ③ 算力資源意識(shí):教授優(yōu)化算力資源使用效率。
7.模型部署與應(yīng)用
① 模型部署:將訓(xùn)練好的模型部署到不同的平臺(tái)和環(huán)境中。② 模型應(yīng)用:將模型應(yīng)用到實(shí)際生活中解決實(shí)際問題,并監(jiān)測效果和優(yōu)化。
通過這種以真實(shí)情境為基礎(chǔ)的項(xiàng)目探究和實(shí)施,學(xué)生能夠深化對數(shù)據(jù)、算法和算力的理解和應(yīng)用,實(shí)現(xiàn)從理論到實(shí)踐的轉(zhuǎn)化。這種學(xué)習(xí)方式不僅有助于學(xué)生深入理解人工智能技術(shù),而且能夠提升他們解決復(fù)雜問題的能力,培養(yǎng)人工智能素養(yǎng)。
應(yīng)用與實(shí)踐
下面,筆者以粵教版高中信息技術(shù)《選擇性必修4人工智能初步》第三章“3.2貝葉斯分類器”中的項(xiàng)目范例“剖析垃圾郵件智能分類系統(tǒng)”為例,闡述在項(xiàng)目式學(xué)習(xí)中如何開展以數(shù)據(jù)、算法和算力為核心的人工智能實(shí)驗(yàn)教學(xué)。
1.“垃圾郵件分類”項(xiàng)目實(shí)驗(yàn)中的數(shù)據(jù)、算法和算力
在“垃圾郵件分類”項(xiàng)目實(shí)驗(yàn)教學(xué)中,將數(shù)據(jù)、算法和算力三個(gè)核心要素與教學(xué)活動(dòng)緊密結(jié)合,以確保學(xué)生在項(xiàng)目實(shí)踐中能夠全面理解和掌握人工智能的核心概念和技術(shù),具體如下頁表所示。
2.選擇實(shí)驗(yàn)平臺(tái)和工具
① 選擇浦育-OpenInnoLab平臺(tái),借助平臺(tái)上的中小學(xué)AI學(xué)習(xí)工具XEdu,幫助學(xué)生體驗(yàn)文本數(shù)據(jù)處理,實(shí)現(xiàn)郵件文本向量化,體驗(yàn)使用貝葉斯算法進(jìn)行模型訓(xùn)練和推理的過程。
② 本地安裝中小學(xué)AI學(xué)習(xí)工具XEdu,在本地完成數(shù)據(jù)處理、模型訓(xùn)練和推理,幫助學(xué)生體驗(yàn)比較本地CPU算力和云服務(wù)CPU、GPU算力的不同。
3.實(shí)驗(yàn)步驟設(shè)計(jì)
(1)數(shù)據(jù)采集
① 數(shù)據(jù)來源選擇:引導(dǎo)學(xué)生識(shí)別和選擇與垃圾郵件分類相關(guān)的數(shù)據(jù)集,如公開的郵件數(shù)據(jù)集或通過模擬環(huán)境生成的數(shù)據(jù)。 ② 數(shù)據(jù)收集方法:學(xué)習(xí)如何通過網(wǎng)絡(luò)爬蟲收集電子郵件數(shù)據(jù),或使用API從電子郵件服務(wù)提供商處獲取數(shù)據(jù)。
(2)數(shù)據(jù)預(yù)處理
在人工智能項(xiàng)目中,數(shù)據(jù)預(yù)處理是至關(guān)重要的一步,它直接影響到模型訓(xùn)練的效果和預(yù)測的準(zhǔn)確性。數(shù)據(jù)預(yù)處理具體包括數(shù)據(jù)清洗和特征提取。 ① 數(shù)據(jù)清洗:學(xué)習(xí)識(shí)別和處理垃圾郵件數(shù)據(jù)中的缺失值、異常值和重復(fù)郵件。 ② 特征提?。簩⑽谋緮?shù)據(jù)轉(zhuǎn)換為數(shù)值向量的過程,這對于計(jì)算機(jī)理解和處理文本內(nèi)容至關(guān)重要。
本項(xiàng)目引導(dǎo)學(xué)生深入學(xué)習(xí)和體驗(yàn)兩種主要的文本特征提取方法:TF-IDF算法和CLIP模型的文本嵌入。
方法一:運(yùn)用TF-IDF算法進(jìn)行文本特征提取。
理論學(xué)習(xí):學(xué)習(xí)TF-IDF算法的原理,包括文本分詞、構(gòu)建詞典、計(jì)算詞頻、去除停用詞,以及計(jì)算TF-IDF值。
實(shí)踐操作:引導(dǎo)學(xué)生使用Python實(shí)現(xiàn)以TF-IDF算法進(jìn)行文本特征提取,通過如圖2所示的步驟完成文本向量化。
方法二:運(yùn)用CLIP模型進(jìn)行文本向量特征提取。
為了幫助計(jì)算機(jī)理解文本,一般是通過“特征提取”的方式將它們轉(zhuǎn)換為數(shù)字向量,這個(gè)過程可以叫做向量化。
理論學(xué)習(xí):CLIP是一種基于深度學(xué)習(xí)的多模態(tài)預(yù)訓(xùn)練模型,它通過對比學(xué)習(xí)的方式在大量文本數(shù)據(jù)上進(jìn)行訓(xùn)練,從而能夠捕捉文本的豐富語義和上下文關(guān)系。本項(xiàng)目選用中小學(xué)AI學(xué)習(xí)工具XEdu集成的XEduHub,其內(nèi)置了CLIP模型,提供了embedding_text文本特征提取任務(wù),實(shí)現(xiàn)文本向量化。
理論驗(yàn)證:為幫助學(xué)生理解詞向量能夠捕捉單詞的語義信息,使得相似意義的單詞在向量空間中位置接近,并且可以做簡單的計(jì)算。例如,“貓”和“狗”比較接近,而“貓”和“飛機(jī)”相對遠(yuǎn)一些。那么從意義上看,“國王”(King)和“女王”(queen)的最大區(qū)別是不是性別不同?設(shè)計(jì)驗(yàn)證實(shí)驗(yàn),驗(yàn)證“國王”的詞向量減去“男”的詞向量,再加上“女”的詞向量,是否與“女王”的詞向量接近(如圖3),
驗(yàn)證實(shí)驗(yàn)結(jié)論:兩個(gè)向量相似度很高,達(dá)到了“0.9216038”。可見公式“v(\"國王\")-v(\"男\(zhòng)")+v(\"女\")\~v(\"女王\")”的預(yù)測是成立的。從而證明了CLIP模型在處理中文文本特征提取時(shí)的有效性,以及詞向量能夠捕捉單詞的語義信息,使得相似意義的單詞在向量空間中位置接近。
實(shí)踐操作:使用XEduHub進(jìn)行詞向量獲取與文本特征計(jì)算,通過如圖4所示的步驟完成郵件文本向量化。
兩種方法的比較:TF-IDF算法在處理文本數(shù)據(jù)時(shí),更注重詞語的統(tǒng)計(jì)信息,而CLIP模型則能夠捕捉更深層次的語義信息。相比之下,TF-IDF算法可能無法直接體現(xiàn)這種語義層面的接近性。
兩者各有優(yōu)勢,對于資源有限或數(shù)據(jù)集不是特別大的項(xiàng)目,TF一IDF可能是一個(gè)快速且有效的選擇。對于需要深層次語義理解的項(xiàng)目,CLIP模型能夠提供更豐富的語義特征,有助于提高分類器的性能。
(3)算法選擇與理解
算法介紹:介紹適合中文文本分類的算法,如樸素貝葉斯算法、支持向量機(jī)算法、神經(jīng)網(wǎng)絡(luò)等。
算法匹配:根據(jù)垃圾郵件分類的特點(diǎn),本項(xiàng)目選擇樸素貝葉斯算法。
理論學(xué)習(xí):學(xué)習(xí)樸素貝葉斯分
課程教學(xué)
類器進(jìn)行文本分類的原理。為了深入理解這一分類器,組織學(xué)生學(xué)習(xí)與其相關(guān)的數(shù)學(xué)原理。引導(dǎo)學(xué)生利用他們在數(shù)學(xué)課程中已經(jīng)掌握的概率論知識(shí),學(xué)習(xí)貝葉斯公式,理解樸素貝葉斯分類器的“樸素”是基于特征條件獨(dú)立假設(shè),并根據(jù)最大后驗(yàn)概率進(jìn)行分類。了解樸素貝葉斯分類器的類型,即高斯模型、多項(xiàng)式模型和伯努利模型。
理論驗(yàn)證:在浦育平臺(tái)或本地環(huán)境用Python編程實(shí)踐,用樸素貝葉斯公式進(jìn)行廣告郵件的分類(如上頁圖5)。學(xué)生從理論到實(shí)踐,學(xué)會(huì)如何用樸素貝葉斯算法進(jìn)行文本分類。
(4)模型訓(xùn)練
在浦育平臺(tái)或者本地環(huán)境,學(xué)習(xí)用XEdu的BaseML庫中的樸素貝葉斯算法,進(jìn)行垃圾郵件分類的模型訓(xùn)練,如圖6所示。
(5)模型測試與評估
① 性能評估:使用混淆矩陣來評估垃圾郵件分類模型的性能?;煜仃囂峁┝四P皖A(yù)測的詳細(xì)視圖,包括真正例(True Positives,TP)、假正例(False Positives,F(xiàn)P)、真反例(True Negatives,TN)和假反例(False Negatives,F(xiàn)N),從而可以計(jì)算出準(zhǔn)確率、召回率和F1分?jǐn)?shù)等指標(biāo)來評估垃圾郵件分類模型的性能(如圖7)。模型測試效果可視化圖如圖8所示。
② 參數(shù)優(yōu)化:根據(jù)混淆矩陣的結(jié)果,可以識(shí)別模型在哪些類別上存在誤差,并據(jù)此調(diào)整模型參數(shù)以提高對垃圾郵件的識(shí)別準(zhǔn)確率。
從結(jié)果可見,TP和TN的比例很大,說明效果不錯(cuò),運(yùn)行結(jié)果準(zhǔn)確率為0.90,召回率為0.60,F(xiàn)1分?jǐn)?shù)為
作為本項(xiàng)目的拓展任務(wù),鼓勵(lì)學(xué)生體驗(yàn)XEdu的BaseML庫中的SVM、KNN等算法,以及XEdu的BaseNN,均可快速便捷地完成郵件文本分類模型的訓(xùn)練、測試和評估。同時(shí)讓學(xué)生比較不同算法下,郵模型部署到云服務(wù)器、樹莓派或其他單板計(jì)算機(jī)上,以便實(shí)現(xiàn)垃圾郵件分類系統(tǒng)的遠(yuǎn)程訪問和操作。這樣的實(shí)踐不僅加深了學(xué)生對機(jī)器學(xué)習(xí)算法的理解,而且提升了他們應(yīng)用AI技術(shù)解決實(shí)際問題的能力。
4.實(shí)驗(yàn)報(bào)告撰寫
指導(dǎo)學(xué)生如何撰寫實(shí)驗(yàn)報(bào)告,記錄實(shí)驗(yàn)過程、結(jié)果和分析。引導(dǎo)學(xué)生深人思考項(xiàng)目在數(shù)據(jù)隱私保護(hù)、算法公平性、社會(huì)影響以及責(zé)任透明度方面的倫理考量,確保他們的工作不僅技術(shù)先進(jìn),而且在道德和社會(huì)責(zé)任上也是負(fù)責(zé)任的。
引導(dǎo)學(xué)生借助AI大模型輔助開發(fā)垃圾郵件識(shí)別系統(tǒng)。學(xué)生運(yùn)用件分類效果的不同。
結(jié)論
(6)算力資源應(yīng)用
Python的Tkinter庫構(gòu)建圖形用戶界面,創(chuàng)建出能讓用戶輸入郵件文本的系統(tǒng)(如圖9)。該系統(tǒng)會(huì)應(yīng)用先前訓(xùn)練好的樸素貝葉斯分類模型進(jìn)行分類,直觀顯示郵件是垃圾郵件還是正常郵件。此外,鼓勵(lì)學(xué)生在AI大模型助力下,嘗試用Gradio等方式實(shí)現(xiàn)系統(tǒng)部署。
在文本數(shù)據(jù)處理任務(wù)中,CPU與GPU的性能差異不如在深度學(xué)習(xí)或大規(guī)模并行計(jì)算任務(wù)中那么顯著。通過在浦育平臺(tái)上完成實(shí)驗(yàn),學(xué)生將直觀感受到云服務(wù)算力的便捷性;通過在本地環(huán)境完成實(shí)驗(yàn),學(xué)生可比較本地CPU算力和云服務(wù)CPU、GPU算力的不同。
本研究通過在高中階段實(shí)施以數(shù)據(jù)、算法和算力為核心的人工智能實(shí)驗(yàn)教學(xué)模型,成功地引導(dǎo)學(xué)生進(jìn)行“垃圾郵件智能分類”項(xiàng)目的深人探究和實(shí)踐。通過學(xué)習(xí),學(xué)生不僅掌握了文本數(shù)據(jù)的處理和分析方法,而且能夠應(yīng)用相關(guān)算法來解決實(shí)際的文本分類問題。實(shí)驗(yàn)成果顯示,學(xué)生在分類任務(wù)中達(dá)到了 9 0 % 的準(zhǔn)確率,這說明該實(shí)驗(yàn)不僅顯著提升了學(xué)生的實(shí)踐技能,而且促進(jìn)了其創(chuàng)新思維的發(fā)展。
(7)模型部署與應(yīng)用
通過整合DeepSeek、Kimi等人工智能生成內(nèi)容(AIGC)模型,學(xué)生將有機(jī)會(huì)深人研究并實(shí)踐如何將機(jī)器學(xué)習(xí)模型部署到服務(wù)器或硬件平臺(tái)上。這包括但不限于將
參考文獻(xiàn):
教育部教育技術(shù)與資源發(fā)展中心.中小學(xué)實(shí)驗(yàn)教學(xué)基本目錄(2023年版)[EB/OL].htps://www.ncet.edu.cn/u/cms/www/202311/241430136xjv.pdf.e
作者簡介:劉宜萍,中學(xué)高級(jí)職稱。
本文系安徽省教育信息技術(shù)研究課題“基于A全鏈路項(xiàng)目的高中生人工智能素養(yǎng)培養(yǎng)策略研究”(課題立項(xiàng)號(hào):AH2023039)的研究成果。