中圖分類號:G434文獻標識碼:A論文編號:1674-2117(2025)09-0016-04
教育部辦公廳2024年發(fā)布的《關(guān)于加強中小學人工智能教育的通知》明確提出,要通過人工智能課程培養(yǎng)學生的創(chuàng)新精神與問題解決能力。然而,在中小學推進人工智能實踐教學的過程中,算力匱乏始終是制約課程開展的關(guān)鍵瓶頸。商業(yè)云服務(wù)高昂的成本、外網(wǎng)連接的不確定性以及學生終端性能的局限性,使得許多學校在人工智能實驗教學中只能停留在淺層體驗階段。
為突破這一瓶頸,筆者設(shè)計了一套基于算力支持的單元課程,幫助學生理解人工智能技術(shù)的核心原理和應(yīng)用邏輯。下面,筆者以單元的最后一課《Embedding和文本分類》為例,辨析本地算力服務(wù)器在中小學人工智能課堂中的價值與意義。
核心內(nèi)容設(shè)計:讓計算機讀懂文字
人類通過字詞的排列組合理解語義,而計算機同樣需要用各種算法提取出文字特征來理解文本。早期人們通過統(tǒng)計詞頻來分析文本的特征,現(xiàn)在常用詞嵌入技術(shù),其流程是先將字詞轉(zhuǎn)換為多個數(shù)值的列表(數(shù)學上的向量)(如下頁圖1),在經(jīng)過深度學習模型訓練后,語義相近的詞數(shù)值也更加相近。
以常見的詞嵌入模型為例,訓練一個包含10萬詞匯的Word2Vec模型需要進行數(shù)百萬次矩陣運算;而基于Transformer架構(gòu)的現(xiàn)代語言模型(如GPT-3等),其參數(shù)規(guī)模已達1750億(175B)甚至更大,也需要將字詞從文本轉(zhuǎn)為數(shù)字向量,再判斷可能的輸出詞,其單次推理就需要調(diào)用數(shù)以億計的參數(shù)。這些計算任務(wù)遠超普通教學終端的處理能力,因此,強大的算力支持變得至關(guān)重要,只有具備足夠的計算能力,才能讓計算機快速處理海量文本數(shù)據(jù),真正實現(xiàn)從“能讀”到“會懂'的跨越。
本課是“人工智能跨學科項目入門”單元的總結(jié)課,本單元涵蓋機器學習基礎(chǔ)、感知機、神經(jīng)網(wǎng)絡(luò)等核心概念(如圖2),并通過實踐項目幫助學生設(shè)計解決實際問題的智能應(yīng)用。
學生已具備一定的機器學習知識,熟悉詞嵌入和向量比較原理,但尚未將文本向量化與分類模型訓練結(jié)合。學生熟悉OpenHydra平臺和Jupyter編輯器,可完成復雜模型訓練任務(wù)并分析報錯原因。
基于以上考慮,確認本課教學目標如下。
信息意識:培養(yǎng)對人工智能技術(shù)的敏感性和認知能力,理解詞嵌入和文本分類的技術(shù)原理及其在實際問題中的應(yīng)用價值。
計算思維:通過調(diào)用預(yù)訓練模型和優(yōu)化本地數(shù)據(jù)集,培養(yǎng)分析問題、設(shè)計算法、優(yōu)化模型的能力,提升邏輯推理和問題解決能力。
數(shù)字化學習與創(chuàng)新:借助本地算力平臺和編程環(huán)境,能夠高效完成文本分類任務(wù),自主探索機器學習算法,培養(yǎng)技術(shù)實踐能力和創(chuàng)新能力。
信息社會責任:通過解決校園管理中的實際問題,理解人工智能技術(shù)的社會意義,培養(yǎng)技術(shù)倫理意識和社會責任感。
硬件配置與本地算力教學平臺
針對上述問題,筆者所在學??苿?chuàng)團隊采購了算力服務(wù)器,在其基礎(chǔ)上部署了校本算力管理平臺,不僅解決了算力匱乏的問題,還極大地提升了教學效率。
1.硬件
算力服務(wù)器專為處理復雜的計算任務(wù)而設(shè)計,它通常配備高性能的GPU(圖形處理單元),如筆者所在學校配置的算力服務(wù)器配有兩張TeslaT4顯卡,擁有32GB顯存,這些GPU能夠加速深度學習和機器學習算法的訓練過程,使學生能夠在短時間內(nèi)完成復雜的計算任務(wù)。服務(wù)器操作系統(tǒng)一般選擇Linux系統(tǒng),也有配備Windows系統(tǒng)的工作站可供選擇,適合初學者和對特定軟件有需求的用戶。
在預(yù)算范圍方面,根據(jù)市場調(diào)研和實際需求,中小學校部署一套能滿足課堂深度學習教學的本地算力服務(wù)器的預(yù)算通常在2萬元至5萬元之間。
2.OpenHydra平臺的優(yōu)勢
在擁有硬件后,還需安裝特定軟件以實現(xiàn)算力分割功能,才能支持多個小組同時開展人工智能實驗。算力分割允許多個用戶或任務(wù)共享同一物理計算資源,而不會相互干擾,每個虛擬計算單元可以獨立運行不同計算任務(wù),實現(xiàn)資源高效利用和任務(wù)并行處理。平臺中教師管理頁面如圖3所示。
除算力分割功能外,平臺還支持常規(guī)教學模塊與課程資源模塊。學生可以在瀏覽器中訪問平臺,點擊創(chuàng)建容器開始實驗(如圖4)。每個賬號擁有獨立的編程環(huán)境與文件目錄,也可為多人小組分配同一個賬號進行協(xié)作實驗。
在傳統(tǒng)教學模式下,教師需在不同設(shè)備上配置實驗環(huán)境,耗時費力且容易出現(xiàn)兼容問題,而容器化技術(shù)實現(xiàn)了“一次配置,多次使用”,顯著提升了教學效率。
教學過程與活動設(shè)計
1.課題導入與情境創(chuàng)設(shè)
課堂伊始,教師通過校園管理中的真實場景導人:校長信箱每月收到數(shù)百條學生反饋,涵蓋食堂、課程、宿舍等多個領(lǐng)域。接著,提出問題“如何讓計算機自動理解這些文本并精準分類”,通過課前收集的待分類數(shù)據(jù)集,讓學生直觀感受文本分類技術(shù)的應(yīng)用價值。
2.預(yù)訓練模型調(diào)用
(1)詞嵌入原理講解
教師先通過動畫演示詞嵌入原理,結(jié)合物理中向量運算類比解釋語義運算(如\"國王-男人+女人≈ 女王\"),讓學生體驗向量運算的邏輯,再使用可視化工具展示字詞之間的相關(guān)性,幫助學生理解語義相近的詞在向量空間中的位置關(guān)系。
在隨后的實踐活動中,學生通過調(diào)用互聯(lián)網(wǎng)上的預(yù)訓練模型,對校長信箱文本數(shù)據(jù)進行向量化與文本分類,學生能夠在文件目錄中看到簡單分類后的結(jié)果(如下頁圖5)。
在這一過程中,本地算力服務(wù)器發(fā)揮了關(guān)鍵作用:上百條文本的向量化過程原本需要數(shù)十分鐘,如今在學生的瀏覽器上僅需數(shù)秒即可完成,讓學生能夠?qū)崟r觀察到運算
多層感知機(MLP)和 1sec.ago 鑫尾花數(shù)集因其樣本。在中、斷、分類問題eML單,一了多入門級機器學習數(shù)圓基于果物的K近鄰分類.ipy.. 1 sec. ago 尾花的三個品種進行識別,驗證多層感知機(MLP)的分類性能。圓樸素貝葉斯和天氣預(yù)報.p.. 1 sec. ago圓支持向量機(SVM)和手. 1 sec. ago 1)實驗資源·data/iris.csv2)實驗?zāi)康摹ねㄟ^自主探究,可以理解多層感知機的基本原理,知道多層感知機可以運用鳶尾花分類任務(wù):·通過使用BaseML搭建多層感知機分類器,掌握搭建多層感知機分類器的基礎(chǔ)代碼:·通過對模型參數(shù)的調(diào)整,能夠解釋重點參數(shù)的含義以及對于模型效果的作用。3)實驗內(nèi)容0實驗一:使用多層感知機搭建并訓練鳶尾花分類模型 寸SimpleO 01 Python 3 (ipykernel) ↓ ldle Mode: Command Ln1,Col1多層感知機(MLP)和尾花分類.ipynb1
(2)實踐操作
結(jié)果結(jié)果。
3.模型的二次優(yōu)化
雖然通過調(diào)用現(xiàn)成模型能夠獲取分類結(jié)果,但仍存在分類錯誤的問題。如“一鳴”便利店實際開設(shè)位置在食堂附近,但對于互聯(lián)網(wǎng)上的模型,詞庫中并不存在該建筑的地理位置信息,有關(guān)“一鳴”的建議就被隨機分到了“食堂”“寢室”等任意分類方向,此時就需要手動標注數(shù)據(jù),生成一個本地化的數(shù)據(jù)集。
經(jīng)過了“自動生成類別”的操作,再對上圖中的標簽進行微調(diào),之后就可以將數(shù)據(jù)投入機器學習模型,讓其再次分類(如圖6),得到一個更加準確的機器學習模型。
為了讓學生快速回憶起機器學習的相關(guān)訓練流程,教師在公共課程文件夾中提供了“常見機器學習分類方法及其程序?qū)崿F(xiàn)”的資源,每個程序文件中都包含了完整的算法講解與實際情境。資源目錄如下: ① 多層感知機(MLP)和鳶尾花分類; ② 基于果物的K近鄰分類;③ 樸素貝葉斯和天氣預(yù)報; ④ 支持向量機(SVM)和手勢分類(關(guān)鍵點檢測)。
學生兩人一小組,每組自行選擇一種機器學習方法進行學習,在學習完簡單案例后,替換代碼與數(shù)據(jù)集,用機器學習的算法完成文本數(shù)據(jù)的分類。
4.展示分享
在課堂最后,在教師提供的資源支架下,大部分小組能訓練出一個機器學習模型,在程序中看到新模型的分類效果。教師邀請部分小組展示分類模型應(yīng)用情況,分享模型優(yōu)化策略。
課后反思:中 小學人工智能教學的 算力困境與突破
算力是人工智能教育的底層支撐,但中小學校長期面臨算力匱乏的困境。筆者曾嘗試使用云端平臺進行模型訓練,但由于并發(fā)限制和網(wǎng)絡(luò)波動,學生經(jīng)常無法完成實驗。這種“時斷時續(xù)”的教學體驗嚴重限制了課程開展的深度與廣度。
本地算力支持下的課堂教學能高效訓練模型,在結(jié)合適當?shù)乃懔芾砥脚_后,還能擁有如下優(yōu)勢:教師統(tǒng)一分發(fā)賬號,免去注冊與登錄流程,保障學生學習文件歸屬與連續(xù)性;虛擬助教提供個性化指導;豐富的公共課程與數(shù)據(jù)集助力學生自主學習跨學科內(nèi)容。
許多中小學教師對算力部署存在顧慮,認為其部署流程復雜且成本高昂。然而,實踐證明,本地算力服務(wù)器的部署并不復雜(購置設(shè)備后安裝操作系統(tǒng)),成本也在可承受范圍內(nèi)。通過算力支持,學生能夠深入?yún)⑴c模型訓練和算法優(yōu)化,真正實現(xiàn)從“體驗”到“實踐”的轉(zhuǎn)變。算力不僅是技術(shù)支撐,更是解決人工智能課堂教學“淺層化、表面化”難題的利器,助力青少年在基礎(chǔ)教育階段了解“數(shù)據(jù)收集一模型訓練一模型部署”的人工智能應(yīng)用邏輯。