摘 要:研究旨在應(yīng)對(duì)教育中的學(xué)生個(gè)體差異、教學(xué)資源限制及師生互動(dòng)缺乏等問(wèn)題,介紹了一種基于大型語(yǔ)言模型的創(chuàng)新型教育教學(xué)知識(shí)問(wèn)答系統(tǒng)。該系統(tǒng)整合了課堂知識(shí)和網(wǎng)絡(luò)資源,構(gòu)建了全面豐富的教學(xué)知識(shí)庫(kù),并通過(guò)精細(xì)的數(shù)據(jù)清洗與分類(lèi)處理提升了數(shù)據(jù)質(zhì)量。為優(yōu)化性能,研究團(tuán)隊(duì)設(shè)計(jì)實(shí)現(xiàn)了高效的多模型檢索機(jī)制,確保系統(tǒng)在不同硬件環(huán)境下均能快速響應(yīng)。系統(tǒng)不僅提高了響應(yīng)速度,降低了基礎(chǔ)設(shè)施成本,而且適用于學(xué)校教育和黨課培訓(xùn)等多個(gè)領(lǐng)域,對(duì)教育數(shù)字化轉(zhuǎn)型及創(chuàng)新產(chǎn)生深遠(yuǎn)影響。
關(guān)鍵詞:大語(yǔ)言模型;人工智能教育;高效檢索模型
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2025)02-0189-06
Design of Education and Teaching Knowledge Question and Answering System Based on Large Language Model
YI Yunheng, PAN Ji
(School of Rail Transportation, Southwest Jiaotong University Hope College, Chengdu 610400, China)
Abstract: This research aims to deal with the problems such as individual differences among students, limited teaching resources, and inadequate teacher-student interaction in education, and introduces an innovative education and teaching knowledge question and answering system based on Large Language Model. The system integrates classroom knowledge and network resources, builds a comprehensive and rich teaching knowledge base, and improves data quality through meticulous data cleaning and classification processing. To optimize performance, the research team designs and implements an efficient multi-model retrieval mechanism, which ensures the system could respond quickly in different hardware environments. This system not only improves response speed but also reduces infrastructure costs. It is suitable for multiple fields such as school education and party class training, and has a profound impact on the digital transformation and innovation of education.
Keywords: Large Language Model; Artificial Intelligence education; efficient retrieval model
DOI:10.19850/j.cnki.2096-4706.2025.02.036
0 引 言
傳統(tǒng)教育模式通常以教師為中心,采用信息單向傳授的教學(xué)方式,包括課堂提問(wèn)和課后提問(wèn)兩部分;而課后問(wèn)答環(huán)節(jié)則通過(guò)手機(jī)應(yīng)用、郵件、課程網(wǎng)站等渠道向教師尋求問(wèn)題的解決[1]。課堂教學(xué)質(zhì)量的高低與教師的教育教學(xué)能力、課程內(nèi)容豐富度直接相關(guān)。學(xué)生被動(dòng)接受知識(shí),難以培養(yǎng)自主學(xué)習(xí)能力。更為關(guān)鍵的是這種單向傳授的教學(xué)方式使得教師難以掌握學(xué)生的學(xué)習(xí)進(jìn)度、知識(shí)掌握情況,而部分學(xué)習(xí)能力較弱的學(xué)生由于跟不上教學(xué)進(jìn)度對(duì)教學(xué)產(chǎn)生焦慮和抗拒情緒,喪失興趣和主動(dòng)學(xué)習(xí)和動(dòng)力。此外,傳統(tǒng)教育教學(xué)側(cè)重考查學(xué)生的記憶力與理解力,忽視對(duì)于創(chuàng)新能力的培養(yǎng)[2]。
大語(yǔ)言模型技術(shù)在教育領(lǐng)域的應(yīng)用具有廣闊的發(fā)展前景和重要的意義[3]。該技術(shù)能夠?yàn)閷W(xué)生和教師提供更為個(gè)性化、高效的學(xué)習(xí)與教學(xué)體驗(yàn),有助于緩解教師的工作壓力,豐富教學(xué)資源,并提升學(xué)校的學(xué)生管理效率。將大語(yǔ)言模型應(yīng)用于教育領(lǐng)域能住與優(yōu)化教育流程,增強(qiáng)學(xué)習(xí)效果與教學(xué)質(zhì)量,為師生雙方帶來(lái)便捷。
因此,基于深度學(xué)習(xí)模型的教育教學(xué)知識(shí)問(wèn)答系統(tǒng),以學(xué)習(xí)者為中心提供線上知識(shí)問(wèn)答,有助力推動(dòng)教學(xué)教育的改革[4]。
1 數(shù)據(jù)獲取與處理
基于大語(yǔ)言模型的教育教學(xué)知識(shí)問(wèn)答系統(tǒng)的系統(tǒng)架構(gòu)包括教學(xué)知識(shí)庫(kù)構(gòu)建、數(shù)據(jù)清洗與分類(lèi)、多模型檢索系統(tǒng)以及選擇并加載大語(yǔ)言模型等關(guān)鍵環(huán)節(jié)。
1.1 數(shù)據(jù)獲取
教學(xué)知識(shí)庫(kù)構(gòu)建過(guò)程包括知識(shí)數(shù)據(jù)提取流程和課堂知識(shí)構(gòu)建過(guò)程,教學(xué)知識(shí)庫(kù)構(gòu)建流程如圖1所示。其中,知識(shí)數(shù)據(jù)提取為教學(xué)知識(shí)庫(kù)提供了豐富的數(shù)據(jù)來(lái)源,而課堂知識(shí)構(gòu)建過(guò)程提取授課的語(yǔ)音,進(jìn)一步擴(kuò)充知識(shí)庫(kù)的內(nèi)容。所有的知識(shí)將會(huì)經(jīng)過(guò)整理和清洗寫(xiě)入數(shù)據(jù)庫(kù)。
1.1.1 知識(shí)數(shù)據(jù)提取流程
數(shù)據(jù)采集采用Python中的Selenium框架[5]。Selenium框架支持對(duì)動(dòng)態(tài)網(wǎng)站的爬取和數(shù)據(jù)提取,能夠在更廣泛的網(wǎng)站范圍內(nèi)實(shí)時(shí)收集數(shù)據(jù)。數(shù)據(jù)主要來(lái)源于各大社區(qū)問(wèn)答平臺(tái),同時(shí)輔以百度百科、知乎等第三方教育網(wǎng)站的問(wèn)答庫(kù)。為了高效地從這些不同網(wǎng)站中抓取數(shù)據(jù),針對(duì)性地編寫(xiě)了多個(gè)Python腳本。在數(shù)據(jù)抓取環(huán)節(jié),采用了Selenium框架,它能夠模擬真實(shí)用戶(hù)的行為,依次從預(yù)設(shè)的URL列表中提取網(wǎng)頁(yè)鏈接并發(fā)起請(qǐng)求,從而精準(zhǔn)地獲取網(wǎng)站中的知識(shí)數(shù)據(jù)。在數(shù)據(jù)采集后,進(jìn)一步利用正則表達(dá)式對(duì)數(shù)據(jù)進(jìn)行細(xì)致的清洗和過(guò)濾,以剔除特殊字符和數(shù)據(jù)噪聲,確保最終錄入知識(shí)庫(kù)的數(shù)據(jù)具備高度純凈性和準(zhǔn)確性。
1.1.2 課堂知識(shí)構(gòu)建過(guò)程
教師的課堂講解內(nèi)容更全面、更完整,而且這些內(nèi)容往往并未被教材或文檔所記錄。因此,將教師的課堂講解內(nèi)容整合起來(lái),可以極大地豐富教學(xué)知識(shí)庫(kù),為學(xué)生提供更多元、更深入的學(xué)習(xí)資源。
STT(Speech-to-Text)技術(shù)[6]是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù),可以將語(yǔ)音轉(zhuǎn)換為文本格式,將口頭描述實(shí)時(shí)轉(zhuǎn)化為書(shū)面形式,并提煉關(guān)鍵知識(shí)點(diǎn),更好地分析和總結(jié)教師的授課內(nèi)容,建立豐富且易于搜索的知識(shí)庫(kù)。
1.2 數(shù)據(jù)處理
針對(duì)教育領(lǐng)域的數(shù)據(jù)處理,由于教學(xué)知識(shí)數(shù)據(jù)具有復(fù)雜且多樣的特性,通?;祀s著大量無(wú)效的信息和噪音,因此有必要對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行一次清洗。整體的清洗過(guò)程如圖2所示。
在對(duì)爬取的數(shù)據(jù)進(jìn)行預(yù)處理操作時(shí),需要采用一定的數(shù)據(jù)清洗規(guī)則和分類(lèi)標(biāo)準(zhǔn)[7]。這一過(guò)程包括識(shí)別并剔除噪音、錯(cuò)誤和不規(guī)則數(shù)據(jù),去除HTML標(biāo)簽、特殊字符以及數(shù)據(jù)中的重復(fù)項(xiàng)等。
1.2.1 關(guān)鍵詞提取
在構(gòu)建教學(xué)知識(shí)庫(kù)的過(guò)程中,為了提高數(shù)據(jù)的檢索效率和精準(zhǔn)度,采用了TF-IDF算法[8]對(duì)獲取的文章進(jìn)行關(guān)鍵詞提取。TF-IDF(Term Frequency-Inverse Document Frequency)算法是一種統(tǒng)計(jì)方法,用于評(píng)估一個(gè)詞語(yǔ)對(duì)于一個(gè)文檔集或一個(gè)語(yǔ)料庫(kù)中的其中一份文檔的重要程度。通過(guò)TF-IDF算法,可以從文章中識(shí)別出那些能夠代表文章主題和內(nèi)容的核心詞匯,這些詞匯就是關(guān)鍵詞。
具體來(lái)說(shuō),TF-IDF算法會(huì)計(jì)算每個(gè)詞語(yǔ)的“詞頻”(TF),即詞語(yǔ)在文檔中出現(xiàn)的次數(shù),以及“逆文檔頻率”(IDF),即詞語(yǔ)在整個(gè)文檔集中的稀疏程度。一個(gè)詞語(yǔ)在文檔中的出現(xiàn)次數(shù)越多,且在文檔集中的出現(xiàn)頻率越低,其IDF值就越高,表明這個(gè)詞語(yǔ)在區(qū)分文檔內(nèi)容方面的重要性越大。
提取關(guān)鍵詞后,將這些關(guān)鍵詞與相應(yīng)的文章一同存入數(shù)據(jù)庫(kù)。這樣,當(dāng)用戶(hù)在搜索特定知識(shí)點(diǎn)時(shí),系統(tǒng)可以快速定位到包含相關(guān)關(guān)鍵詞的文章,從而提高用戶(hù)獲取信息的效率。通過(guò)TF-IDF算法的有效應(yīng)用,不僅優(yōu)化了知識(shí)庫(kù)的結(jié)構(gòu),還顯著提升了系統(tǒng)的用戶(hù)體驗(yàn)。
1.2.2 數(shù)據(jù)庫(kù)設(shè)計(jì)
從課堂或網(wǎng)絡(luò)中獲取的數(shù)據(jù),為了便于程序高效地查找和管理,應(yīng)當(dāng)被存儲(chǔ)在數(shù)據(jù)庫(kù)中。在本系統(tǒng)中,選擇了MySQL數(shù)據(jù)庫(kù)作為數(shù)據(jù)存儲(chǔ)的解決方案。MySQL因其穩(wěn)定性、可擴(kuò)展性和易用性而被廣泛應(yīng)用于各種規(guī)模的系統(tǒng)中[9]。
為了組織和管理數(shù)據(jù),將所有的表結(jié)構(gòu)設(shè)計(jì)為包含三個(gè)基本字段:ID、Keyword、Text。每個(gè)字段的作用如下:
1)ID是一個(gè)唯一標(biāo)識(shí)符,用于區(qū)分?jǐn)?shù)據(jù)庫(kù)中的每一條記錄。它通常是一個(gè)自動(dòng)遞增的整數(shù),確保了每條記錄的唯一性,便于快速檢索和引用。
2)Keyword這個(gè)字段用于存儲(chǔ)從文章中提取的關(guān)鍵詞,這些關(guān)鍵詞是通過(guò)之前提到的TF-IDF算法計(jì)算得出的。關(guān)鍵詞的存儲(chǔ)為后續(xù)的搜索和檢索提供了直接的索引,使得系統(tǒng)能夠快速定位到與用戶(hù)查詢(xún)相關(guān)的數(shù)據(jù)。
3)Text這個(gè)字段用于存儲(chǔ)實(shí)際的文本內(nèi)容,無(wú)論是從課堂錄音轉(zhuǎn)換的文本,還是從網(wǎng)絡(luò)爬取的文章,都會(huì)保存在這個(gè)字段中。文本內(nèi)容是用戶(hù)查詢(xún)的最終目標(biāo),也是知識(shí)庫(kù)中最有價(jià)值的部分。
通過(guò)這種簡(jiǎn)潔而高效的表結(jié)構(gòu)設(shè)計(jì),確保了數(shù)據(jù)庫(kù)的靈活性,同時(shí)也為程序的快速查詢(xún)和數(shù)據(jù)管理提供了便利。用戶(hù)可以通過(guò)關(guān)鍵詞搜索快速找到相關(guān)的教學(xué)資料,而程序也可以通過(guò)ID字段高效地進(jìn)行數(shù)據(jù)維護(hù)和更新。這樣的數(shù)據(jù)庫(kù)設(shè)計(jì)不僅優(yōu)化了數(shù)據(jù)存儲(chǔ),還提升了系統(tǒng)的整體性能和用戶(hù)體驗(yàn)。
2 知識(shí)問(wèn)答系統(tǒng)
2.1 基礎(chǔ)結(jié)構(gòu)
知識(shí)問(wèn)答系統(tǒng)基于大語(yǔ)言模型,其包含兩類(lèi)主要模型,一個(gè)是大語(yǔ)言模型,一個(gè)是檢索式模型,檢索式模型通常以text2vec_base_chinese作為基座模型[10],并以LangChain框架[11]實(shí)現(xiàn)對(duì)文本的檢索。多模型檢索系統(tǒng)的示意圖如圖3所示。
用戶(hù)向系統(tǒng)提出問(wèn)題后,系統(tǒng)會(huì)提示用戶(hù)選擇所需模型。用戶(hù)僅需選擇一次,之后系統(tǒng)將自動(dòng)沿用該選擇,無(wú)須用戶(hù)再次操作。若用戶(hù)選擇普通模型,系統(tǒng)將調(diào)用本地的大型語(yǔ)言模型;若選擇高級(jí)模型,則會(huì)接入如文心一言、通義千問(wèn)等先進(jìn)的大型語(yǔ)言模型。
選定模型后,該模型會(huì)分析用戶(hù)的問(wèn)題,判斷是否需要借助檢索式模型。若無(wú)須檢索式模型,則直接給出答案;若需要,便將問(wèn)題傳遞給檢索式模型以獲取相關(guān)提示詞。后經(jīng)過(guò)分析得到問(wèn)題是否需要使用檢索式模型的相關(guān)意見(jiàn)。
在實(shí)際實(shí)現(xiàn)中,僅需要對(duì)模型的意見(jiàn)進(jìn)行TD-IDF關(guān)鍵字提取,隨后將關(guān)鍵字與預(yù)設(shè)的關(guān)鍵字進(jìn)行余弦相似度比對(duì),即可精準(zhǔn)地分類(lèi)出是否需要調(diào)用檢索式模型。關(guān)鍵字進(jìn)行余弦相似度進(jìn)行余弦相似度比較前可以使用Scikit-learn中的TfidfVectorizer或CountVectorizer來(lái)將文本轉(zhuǎn)換為向量表示。
最后,大型語(yǔ)言模型會(huì)依據(jù)這些提示詞來(lái)構(gòu)建并給出回答。知識(shí)問(wèn)答系統(tǒng)判斷流程圖如圖4所示。
2.2 檢索式模型
檢索式模型是知識(shí)問(wèn)答系統(tǒng)的核心組件,其性能的好壞直接關(guān)系到系統(tǒng)能否精確抓取到相關(guān)知識(shí)。這類(lèi)模型通常以text2vec_base_chinese為基座,通過(guò)先進(jìn)的算法將用戶(hù)輸入的查詢(xún)語(yǔ)句轉(zhuǎn)換成文本向量[12]。隨后,這些向量會(huì)與知識(shí)庫(kù)中的文本向量進(jìn)行余弦相似度計(jì)算[13],從而找出與用戶(hù)查詢(xún)最相關(guān)的文本信息。這種機(jī)制確保了系統(tǒng)能夠迅速、準(zhǔn)確地提供用戶(hù)所需的知識(shí)。為了優(yōu)化這一模型,提出以下改進(jìn)方案:首先,檢索式模型接收用戶(hù)的輸入語(yǔ)句,并利用TF-IDF算法從中提取關(guān)鍵詞。接著,將這些關(guān)鍵詞與數(shù)據(jù)庫(kù)中每條數(shù)據(jù)的關(guān)鍵詞進(jìn)行余弦相似度比較,選擇相似度最高的十條數(shù)據(jù),并將其對(duì)應(yīng)的文本內(nèi)容合并,形成一份綜合知識(shí)文本。
隨后,再次利用text2vec_base_chinese模型,將用戶(hù)問(wèn)題和這份綜合知識(shí)文本分別轉(zhuǎn)換為文本向量。通過(guò)計(jì)算這兩組向量之間的余弦相似度,選取最相關(guān)的十個(gè)段落。最后,將這些段落轉(zhuǎn)換為文字,整合后作為提示信息(prompt)反饋給大型模型,從而提供更精準(zhǔn)、更全面的知識(shí)答案。這樣的優(yōu)化流程旨在提高檢索式模型的精確度和效率,為用戶(hù)提供更加優(yōu)質(zhì)的知識(shí)檢索體驗(yàn),示意圖如圖5所示。
2.3 基于Gradio的可視化界面
Gradio是一個(gè)功能強(qiáng)大的Python可視化庫(kù)[14],其獨(dú)特之處在于,它賦予使用者無(wú)須編寫(xiě)煩瑣的HTML、CSS和js代碼的能力,便可輕松構(gòu)建出美觀且實(shí)用的用戶(hù)界面。通過(guò)Gradio,開(kāi)發(fā)者可以迅速搭建起一個(gè)簡(jiǎn)約而不失現(xiàn)代感的交互界面,直觀且易于操作,其中包括了用于顯示聊天記錄的清晰區(qū)域,便于用戶(hù)追蹤對(duì)話內(nèi)容;用戶(hù)輸入?yún)^(qū)域設(shè)計(jì)得簡(jiǎn)潔明了,方便用戶(hù)隨時(shí)輸入信息;此外,還提供了模型選擇功能,用戶(hù)可以根據(jù)自己的需求靈活選擇不同的模型進(jìn)行交互。整個(gè)界面布局合理,既符合現(xiàn)代審美,又充分考慮了用戶(hù)操作的便捷性,使得用戶(hù)能夠便捷地進(jìn)行交互操作,同時(shí)也大大提升了用戶(hù)體驗(yàn)。
3 實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果
3.1 開(kāi)發(fā)環(huán)境
系統(tǒng)的軟件環(huán)境與硬件環(huán)境如表1和表2所示。
3.2 數(shù)據(jù)集展示
在具體實(shí)驗(yàn)中,采用了Gradio作為前端界面,后臺(tái)則依托了強(qiáng)大的基礎(chǔ)大語(yǔ)言模型ChatGLM 4和ChatGPT 3.5。本模型提供了兩種模式:知識(shí)助手模式和原生模式。在原生模式下,模型會(huì)直接響應(yīng)用戶(hù)輸入,不會(huì)進(jìn)行任何額外的數(shù)據(jù)處理。
為了實(shí)現(xiàn)這一系統(tǒng),以黨課為具體案例,構(gòu)建了一個(gè)專(zhuān)為黨建教育設(shè)計(jì)的知識(shí)助手,稱(chēng)之為“黨建助手”。為了確保數(shù)據(jù)的權(quán)威性和準(zhǔn)確性,所有的數(shù)據(jù)集都來(lái)源于人民網(wǎng)黨建數(shù)據(jù)庫(kù)(http://jhsjk.people.cn/)。在遵守相關(guān)法律法規(guī)的前提下,從該數(shù)據(jù)庫(kù)中合法爬取了少量數(shù)據(jù),用于研究和分析。數(shù)據(jù)集部分展示如表3所示。
3.3 對(duì)比實(shí)驗(yàn)
本研究旨在評(píng)估基于大語(yǔ)言模型的教育教學(xué)知識(shí)問(wèn)答系統(tǒng)的有效性。為實(shí)現(xiàn)這一目標(biāo),對(duì)比了黨建模式和原生模式下大語(yǔ)言模型的表現(xiàn)。專(zhuān)注于黨建知識(shí)數(shù)據(jù)庫(kù)中的內(nèi)容,并以此為基礎(chǔ)設(shè)計(jì)提問(wèn),以全面觀察和分析不同大語(yǔ)言模型在應(yīng)對(duì)這些問(wèn)題時(shí)的性能。
為確保實(shí)驗(yàn)的公正性和結(jié)果的可靠性,特別選擇了不依賴(lài)聯(lián)網(wǎng)搜索的ChatGLM-Pro作為基礎(chǔ)模型。這一選擇有助于更直觀地比較不同模式下的模型表現(xiàn),排除了網(wǎng)絡(luò)搜索對(duì)實(shí)驗(yàn)結(jié)果可能產(chǎn)生的干擾。
通過(guò)實(shí)驗(yàn),收集并整理了豐富的數(shù)據(jù),詳細(xì)記錄了兩種模式下大語(yǔ)言模型的回答質(zhì)量和準(zhǔn)確性。這些數(shù)據(jù)不僅揭示了模型在不同模式下的性能差異,也提供了關(guān)于如何優(yōu)化教育教學(xué)知識(shí)問(wèn)答系統(tǒng)的寶貴見(jiàn)解。
實(shí)驗(yàn)原始結(jié)果如圖6所示,通過(guò)對(duì)比分析,可以更深入地了解大語(yǔ)言模型在教育教學(xué)領(lǐng)域的應(yīng)用潛力,以及黨建模式對(duì)模型性能的具體影響。這將有助于進(jìn)一步探索和開(kāi)發(fā)更高效、更智能的教育技術(shù)解決方案。
圖6通過(guò)科學(xué)對(duì)比的方式,深入探討了黨建助手與原生模式在回答黨建、政治及經(jīng)濟(jì)領(lǐng)域相關(guān)問(wèn)題時(shí)的表現(xiàn)差異。研究結(jié)果顯示,相較于原生模式,黨建助手在針對(duì)各類(lèi)問(wèn)題的回答中,展現(xiàn)出了更高的具體性、專(zhuān)業(yè)性和針對(duì)性。舉例而言,在回答有關(guān)黨建新聞的問(wèn)題時(shí),黨建助手能夠精準(zhǔn)地提供相關(guān)的具體內(nèi)容和方向,反觀原生模式,其回答則僅限于給出一般性的新聞獲取建議。同樣值得注意的是,在解讀政治類(lèi)文章以及提出經(jīng)濟(jì)領(lǐng)域?qū)W習(xí)要點(diǎn)的問(wèn)題上,黨建助手的回答均表現(xiàn)出了更深的洞察力和全面性,其不僅能夠準(zhǔn)確概括文章的核心主旨,還能為學(xué)習(xí)者提供切實(shí)可行的指導(dǎo)和建議。綜上所述,本研究表明,黨建助手在提供精確、專(zhuān)業(yè)的黨建及相關(guān)領(lǐng)域信息方面具有顯著優(yōu)勢(shì),這一發(fā)現(xiàn)對(duì)于相關(guān)領(lǐng)域的研究和實(shí)踐具有重要的指導(dǎo)意義。
4 結(jié) 論
本研究成功設(shè)計(jì)并開(kāi)發(fā)了一款基于大語(yǔ)言模型技術(shù)的教育教學(xué)知識(shí)問(wèn)答系統(tǒng)。通過(guò)巧妙運(yùn)用Selenium技術(shù),實(shí)現(xiàn)了廣域數(shù)據(jù)的全面收集,進(jìn)一步與STT技術(shù)相結(jié)合,構(gòu)建了一個(gè)內(nèi)容更為豐富、結(jié)構(gòu)更為完善的教學(xué)知識(shí)庫(kù)。此外,還采用了高級(jí)關(guān)鍵詞搜索和語(yǔ)義匹配方法,對(duì)文本進(jìn)行了細(xì)致的分類(lèi)和異常值處理,從而顯著提升了數(shù)據(jù)的可用性和可信度。
為了優(yōu)化用戶(hù)體驗(yàn),特別是在硬件性能受限的環(huán)境下,特別設(shè)計(jì)了一個(gè)多模型檢索系統(tǒng)。這一創(chuàng)新舉措不僅大幅提高了檢索速度,還確保了檢索結(jié)果的準(zhǔn)確性,為用戶(hù)帶來(lái)了更加流暢、高效的知識(shí)檢索體驗(yàn)。
展望未來(lái),計(jì)劃進(jìn)一步完善和優(yōu)化該知識(shí)檢索系統(tǒng)。首先,將繼續(xù)擴(kuò)充教學(xué)知識(shí)庫(kù),覆蓋更多學(xué)科領(lǐng)域,以滿(mǎn)足不同用戶(hù)的需求。其次,將致力于提升系統(tǒng)的智能化水平,通過(guò)引入更先進(jìn)的算法和技術(shù),實(shí)現(xiàn)更加精準(zhǔn)的語(yǔ)義理解和匹配,從而提高檢索的精確度和效率。最后,將持續(xù)關(guān)注用戶(hù)反饋,不斷優(yōu)化系統(tǒng)功能和用戶(hù)界面,力求為廣大教育者和學(xué)生提供更加全面、便捷、高效的知識(shí)檢索服務(wù),助力教育教學(xué)事業(yè)的發(fā)展。
參考文獻(xiàn):
[1] 朱衛(wèi)平,林海,謝榕,等.智能問(wèn)答系統(tǒng)在高校課程教學(xué)中的應(yīng)用 [J].計(jì)算機(jī)教育,2019(10):23-26.
[2] 胡萍,蒲小瓊.基于“互聯(lián)網(wǎng)+”的互動(dòng)式自主學(xué)習(xí)教學(xué)模式研究及應(yīng)用 [J].高教學(xué)刊,2022,8(17):80-83.
[3] 張春紅,杜龍飛,朱新寧,等.基于大語(yǔ)言模型的教育問(wèn)答系統(tǒng)研究 [J].北京郵電大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2023,25(6):79-88.
[4] 賀超波,林曉凡,程俊偉,等.學(xué)習(xí)型社區(qū)賦能教育強(qiáng)國(guó)建設(shè)——基于在線學(xué)習(xí)者關(guān)系網(wǎng)絡(luò)分析視角 [J].中國(guó)電化教育,2024(6):38-45.
[5] 馮興利,洪丹丹,羅軍鋒,等.基于Selenium+Python的高校統(tǒng)一身份認(rèn)證自動(dòng)化驗(yàn)收測(cè)試技術(shù)研究 [J].現(xiàn)代電子技術(shù),2019,42(22):89-91+97.
[6] 付強(qiáng),徐振平,盛文星,等.結(jié)合字節(jié)級(jí)別字節(jié)對(duì)編碼的端到端中文語(yǔ)音識(shí)別方法 [J/OL].計(jì)算機(jī)應(yīng)用,1-8(2024-05-17).http://kns.cnki.net/kcms/detail/51.1307.TP.20240515.0955.004.html.
[7] 白星振,隋舒婷,葛磊蛟,等.基于滑動(dòng)四分位和可行搜索圓算法的風(fēng)速-功率異常數(shù)據(jù)清洗方法 [J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版,2023,42(6):106-116.
[8] 蔣昊達(dá),趙春蕾,陳瀚,等.基于改進(jìn)TF-IDF與BERT的領(lǐng)域情感詞典構(gòu)建方法 [J].計(jì)算機(jī)科學(xué),2024,51(S1):162-170.
[9] 趙子晨,楊鋒,郭玉輝,等.基于Hadoop技術(shù)的加速器大數(shù)據(jù)安全存儲(chǔ)與高效分析系統(tǒng)設(shè)計(jì) [J].現(xiàn)代電子技術(shù),2024,47(8):9-17.
[10] 楊濱瑕,羅旭東,孫凱麗.基于預(yù)訓(xùn)練語(yǔ)言模型的機(jī)器翻譯最新進(jìn)展 [J].計(jì)算機(jī)科學(xué),2024,51(S1):50-57.
[11] MORALES-CHAN M,AMADO-SALVATIERRA H R,MEDINA J A,et al. Personalized Feedback in Massive Open Online Courses: Harnessing the Power of LangChain and OpenAI API [J].Electronics,2024,13(10):1960.
[12] 郭順.詞和文本的表示與文本分類(lèi)的研究 [D].大連:大連理工大學(xué),2020.
[13] 武永亮,趙書(shū)良,李長(zhǎng)鏡,等.基于TF-IDF和余弦相似度的文本分類(lèi)方法 [J].中文信息學(xué)報(bào),2017,31(5):138-145.
[14] FERREIRA R,CANESCHE M,JAMIESON P,et al. Examples and Tutorials on Using Google Colab and Gradio to Create Online Interactive Student-learning Modules [J].Computer Applications in Engineering Education,2024,32(4):e22729.
作者簡(jiǎn)介:易云恒(1998—),男,漢族,四川達(dá)州人,專(zhuān)職教師,碩士,研究方向:自然語(yǔ)言處理;通信作者:潘濟(jì)(1998—),女,漢族,遼寧葫蘆島人,專(zhuān)職教師,碩士,研究方向:計(jì)算機(jī)本科教學(xué)。
收稿日期:2024-06-15
基金項(xiàng)目:四川省教育信息技術(shù)研究課題(kt202309286459124);西南交通大學(xué)希望學(xué)院2023年黨建研究項(xiàng)目(19)