引言
隨著高等教育規(guī)模的擴(kuò)張,教師作業(yè)批改壓力日漸增加,既耗費(fèi)教師的時(shí)間與精力,也影響教師對(duì)學(xué)生個(gè)性化輔導(dǎo)的投入。同時(shí),教育信息化的發(fā)展使數(shù)字化教育開始普及,對(duì)作業(yè)批改智能化提出了迫切需求,傳統(tǒng)人工批改已難以適應(yīng)時(shí)代發(fā)展步伐1]。在此背景下,一些學(xué)者積極開展研究,利用圖像識(shí)別、大數(shù)據(jù)提取等技術(shù)嘗試創(chuàng)建智能作業(yè)批改系統(tǒng)。例如,鄭克松提出了智能化eNSP實(shí)訓(xùn)自動(dòng)批改技術(shù),利用VRP配置文件解析算法與多尺度圖像模板匹配算法實(shí)現(xiàn)了實(shí)時(shí)評(píng)估與批改[2;劉代雄等開發(fā)了一套通用性系統(tǒng),實(shí)現(xiàn)了自動(dòng)規(guī)整作業(yè)格式、以圖形化交互方式的批閱過程,提高了完成單次作業(yè)批改全流程的效率[3。這些研究雖提供了一些有效方法,但在面對(duì)字跡模糊、不規(guī)則圖形等作業(yè)圖像時(shí)的適應(yīng)性略有不足。有的研究雖引入機(jī)器學(xué)習(xí)方法,但在識(shí)別精度上難以滿足現(xiàn)實(shí)所需。鑒于此,本文設(shè)計(jì)一種基于深度學(xué)習(xí)的智能作業(yè)批改系統(tǒng),以期進(jìn)一步提升作業(yè)批改效率與質(zhì)量。
1.基于深度學(xué)習(xí)的智能作業(yè)批改系統(tǒng)算法介紹
本系統(tǒng)主要采用圖像識(shí)別、圖像處理等技術(shù)路徑。在圖像識(shí)別上,通過邊緣輪廓檢測(cè)、圖文掃描、文字識(shí)別三階段處理,結(jié)合Laplacian算子、SCAN算法與卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,CNN)將作業(yè)圖像轉(zhuǎn)化為可識(shí)別的文本信息;在圖像處理上,綜合運(yùn)用二值化處理、濾波處理和旋轉(zhuǎn)變換處理等技術(shù)對(duì)原始作業(yè)圖像進(jìn)行降噪、增強(qiáng)和校正。這些算法的結(jié)合既保障了圖像高效提取,又提升了系統(tǒng)對(duì)復(fù)雜作業(yè)場(chǎng)景的適應(yīng)性。
1.1作業(yè)圖像識(shí)別
利用TensorFlow圖像掃描識(shí)別字符時(shí),流程一般為邊緣輪廓檢測(cè)、圖文掃描、文字識(shí)別等。
1.1.1邊緣輪廓檢測(cè)
在作業(yè)紙圖像中,文字、圖形等元素的邊緣信息蘊(yùn)含著豐富特征,通過Laplacian算子進(jìn)行邊緣檢測(cè)計(jì)算可提取圖像邊緣輪廓[4]。該算法基于圖像灰度值的梯度變化,首先計(jì)算圖像的梯度幅值和方向;其次對(duì)梯度幅值進(jìn)行非極大值抑制,去除非邊緣的偽邊緣點(diǎn);再次通過雙閾值檢測(cè)確定真正邊緣點(diǎn)與可能邊緣點(diǎn);最后對(duì)可能邊緣點(diǎn)進(jìn)行邊緣連接,從而得到清晰邊緣輪廓,可將其表示為
式中, G(x,y) 表示梯度幅值, 表示圖像在x方向上的梯度,
表示圖像在y方向上的梯度。邊緣輪廓檢測(cè)為后續(xù)圖文掃描提供了基礎(chǔ),使掃描過程能更有針對(duì)性地聚焦有效信息區(qū)域。
1.1.2圖文掃描
完成邊緣輪廓檢測(cè)后進(jìn)入圖文掃描階段,此時(shí)利用SCAN算法沿著邊緣輪廓界定區(qū)域進(jìn)行逐行或逐列掃描。在本系統(tǒng)中,從圖像頂部開始,按照固定行距依次向下掃描,記錄每行像素變化。對(duì)于文字區(qū)域,因文字像素與背景像素存在顯著差異,所以通過設(shè)定閾值區(qū)分出文字像素點(diǎn)。在灰度圖像中,如果像素值高于閾值128則判定為文字像素,低于該閾值則為背景像素。通過這種掃描,能夠?qū)D像中的圖文信息轉(zhuǎn)化為可進(jìn)一步處理的像素序列。
1.1.3文字識(shí)別
經(jīng)過邊緣輪廓檢測(cè)與圖文掃描后,得到的像素序列需要被識(shí)別為具體文字。使用基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)構(gòu)建卷積層、池化層和全連層,自動(dòng)學(xué)習(xí)文字圖像的特征。卷積層利用卷積核在圖像上滑動(dòng)進(jìn)行卷積,提取筆畫方向等圖像局部特征;池化層則對(duì)卷積層輸出的特征圖進(jìn)行下采樣,減少數(shù)據(jù)量的同時(shí)保留主要特征;全連層將經(jīng)過多次卷積和池化后的特征進(jìn)行整合,通過softmax函數(shù)輸出文字類別概率,由此確定輸入圖像對(duì)應(yīng)內(nèi)容,可將其表示為
式中, x 表示圖像數(shù)據(jù), 表示各層權(quán)重,
表示各層偏置,ReLU表示激活函數(shù),y表示最終文字類別概率分布。通過大量標(biāo)注數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,使其能夠準(zhǔn)確識(shí)別不同書寫風(fēng)格。
1.2作業(yè)圖像處理
1.2.1二值化處理
二值化處理是將彩色圖像或灰度圖像轉(zhuǎn)化為僅有黑白二色的圖像,以便進(jìn)行后續(xù)處理。本系統(tǒng)在處理作業(yè)圖像時(shí)采用閾值分割,設(shè)圖像 I(x,y) 為輸入灰度圖像,灰度值范圍限制在[0,255],選擇合適閾值T ,則二值化后的圖像 B(x,y) 為
采用自適應(yīng)閾值法選取閾值,通過計(jì)算圖像灰度直方圖,將圖像分為前景與背景,以類間方差最大確定閾值。在操作過程中,設(shè)圖像灰度級(jí)為L,灰度值為i的像素個(gè)數(shù)為i,總像素?cái)?shù) ,則灰度值為i的像素出現(xiàn)概率
。設(shè)閾值為k,前景像素的平均灰度為
,背景像素的平均灰度為
,類間方差
可表示為
式中,
。通過查詢所有可能閾值
,找尋使
最大的k值作為最佳閾值 T 經(jīng)二值化處理后,作業(yè)圖像中的文字和背景更為分明。
1.2.2濾波處理
作業(yè)圖像采集因設(shè)備、環(huán)境等因素影響會(huì)引入部分椒鹽噪聲和高斯噪聲,其干擾會(huì)顯著影響后續(xù)圖像識(shí)別,所以需進(jìn)行濾波處理。去除椒鹽噪聲應(yīng)采用中值濾波,以該圖像中的像素點(diǎn)為中心構(gòu)建n × n 窗口,并將窗口內(nèi)的像素值按灰度值大小排序,取中間值作為灰度值。設(shè)窗口內(nèi)的像素值集合為 排序后為
,則將中值濾波后的像素值表示為
去除高斯噪聲時(shí)則采用高斯濾波,一般通過高斯核與圖像卷積運(yùn)算實(shí)現(xiàn),將高斯核表示為
式中, σ 表示高斯分布標(biāo)準(zhǔn)差,其決定了高斯核寬度。在本系統(tǒng)工作時(shí),將高斯核離散化后與圖像進(jìn)行卷積,可將卷積過程表示為
式中, I(x,y) 表示原始圖像, 表示濾波后圖像,M、N則決定了高斯核大小。通過濾波處理可有效降低圖像噪聲,提升圖像質(zhì)量。
1.2.3旋轉(zhuǎn)變換處理
旋轉(zhuǎn)變換處理旨在將旋轉(zhuǎn)圖像校正為水平或垂直方向,設(shè)圖像點(diǎn) (x,y) 繞原點(diǎn)旋轉(zhuǎn) θ 角度后得到新點(diǎn) ,可將旋轉(zhuǎn)變換表示為
以圖像中心為旋轉(zhuǎn)中心,將圖像坐標(biāo)原點(diǎn)平移到圖像中心 進(jìn)行旋轉(zhuǎn)變換后,再將坐標(biāo)原點(diǎn)平移回原處。設(shè)圖像中心坐標(biāo)為
,則旋轉(zhuǎn)變換過程可表示為
通過計(jì)算圖像特征確定旋轉(zhuǎn)角度 θ ,隨后利用式(9)對(duì)圖像進(jìn)行旋轉(zhuǎn)變換,使圖像能以正確方向處理。
2.基于深度學(xué)習(xí)的智能作業(yè)批改系統(tǒng)設(shè)計(jì)
2.1層級(jí)結(jié)構(gòu)
深度學(xué)習(xí)算法是典型的從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)和提取特征的人工智能算法,在作業(yè)紙圖像完成處理、特征提取后,獲取切割后的題目、題號(hào)及二維碼,隨后根據(jù)設(shè)定的二維碼自動(dòng)識(shí)別題型與題號(hào),以此調(diào)用不同題目做出輸入數(shù)據(jù)、輸出圖像的關(guān)系映射。深度學(xué)習(xí)算法的作業(yè)紙感知、大數(shù)據(jù)分析執(zhí)行流程一般分為輸入層、隱藏層、輸出層等3個(gè)層級(jí)(如圖1所示)。其中,輸入層負(fù)責(zé)接收經(jīng)預(yù)處理后的作業(yè)圖像數(shù)據(jù),將其轉(zhuǎn)化為適合神經(jīng)網(wǎng)絡(luò)處理的格式;隱藏層由多個(gè)神經(jīng)元組成,通過復(fù)雜非線性變換對(duì)輸入數(shù)據(jù)進(jìn)行特征提?。惠敵鰧觿t根據(jù)隱藏層的輸出結(jié)果生成最終的識(shí)別與批改結(jié)果。
2.2題型處理
選擇、填空等客觀題常使用光標(biāo)機(jī)答題卡,即填涂區(qū)域位置固定的作業(yè)卡紙進(jìn)行答題[0]。對(duì)于此類型作業(yè),本系統(tǒng)通過識(shí)別答題卡上的填涂區(qū)域來判斷答案。首先,根據(jù)預(yù)設(shè)填涂區(qū)域模板在圖像中定位填涂區(qū)域位置;然后,分析填涂區(qū)域像素值,判斷是否被填涂。如果填涂區(qū)域內(nèi)的黑色像素占比超過 50% ,那么就判定該區(qū)域被填涂。通過與標(biāo)準(zhǔn)答案比較,即可得出客觀題的批改結(jié)果。這種處理模式利用了填涂區(qū)域位置固定、答案標(biāo)準(zhǔn)化的特點(diǎn),可快速準(zhǔn)確完成客觀題批改。
主觀題答案較為開放,需利用深度學(xué)習(xí)算法對(duì)輸人樣本的初始坐標(biāo)、像素閾值進(jìn)行迭代計(jì)算。以手寫文字識(shí)別為例,采用長短期記憶(longshort-termmemory,LSTM)網(wǎng)絡(luò)處理時(shí)間序列數(shù)據(jù),捕捉筆畫間的依賴關(guān)系。在訓(xùn)練時(shí),將主觀題答案的圖像數(shù)據(jù)按筆畫順序輸入LSTM網(wǎng)絡(luò)中,通過調(diào)整網(wǎng)絡(luò)的權(quán)重和閾值,使網(wǎng)絡(luò)能學(xué)習(xí)到手寫文字的特征。在識(shí)別時(shí),根據(jù)輸入圖像數(shù)據(jù),網(wǎng)絡(luò)輸出不同字符的概率分布,選擇概率最大字符作為識(shí)別結(jié)果,可將其迭代計(jì)算過程表示為
式中,W表示權(quán)重; b 表示偏置; σ 表示Sigmold函數(shù);tanh表示雙曲正切函數(shù); t 表示代表時(shí)間步;表示輸入門,輸出i決定了當(dāng)前時(shí)間步有多少輸入信息能夠流入記憶單元c; 表示輸入調(diào)制門,其輸出g,用于對(duì)輸入數(shù)據(jù)進(jìn)行變換;
表示輸出門,輸出
控制著記憶單元c中的信息有多少會(huì)被輸出到隱藏狀態(tài)
;h表示隱藏狀態(tài);f表示遺忘門,
輸出決定了上一個(gè)時(shí)間步記憶單元
中的信息有多少會(huì)被保留到當(dāng)前時(shí)間步的記憶單元
通過這種迭代計(jì)算,對(duì)主觀題答案識(shí)別進(jìn)行持續(xù)優(yōu)化。
2.3調(diào)整誤差
利用糾錯(cuò)學(xué)習(xí)調(diào)整隱藏層與輸出層之間的連接權(quán)值、輸出層閾值,使輸出圖像數(shù)據(jù)的誤差函數(shù)值達(dá)到最小,可將誤差函數(shù)表示為
式中, 表示真實(shí)值,表示預(yù)測(cè)值,N 表示樣本數(shù)量。使用反向傳播算法將誤差從輸出層反向傳播到隱藏層,根據(jù)誤差對(duì)連接權(quán)值和閾值進(jìn)行調(diào)整。例如,可將連接權(quán)值
調(diào)整表示為
式中, η 表示學(xué)習(xí)率,負(fù)責(zé)控制調(diào)整步長,通過不斷調(diào)整連接權(quán)值和閾值,使誤差函數(shù)值逐漸減小,以此提高系統(tǒng)識(shí)別精度。隨后,沿著相對(duì)誤差平方和的降低方向,連續(xù)調(diào)整連接權(quán)值、作業(yè)紙圖像閥值,可將殘差平方和(RSS)表示為
在訓(xùn)練過程中監(jiān)測(cè)RSS,當(dāng)其不再持續(xù)降低時(shí)表明本系統(tǒng)已達(dá)到一個(gè)較好收斂狀態(tài)。為了進(jìn)一步優(yōu)化系統(tǒng)性能,還應(yīng)通過調(diào)整學(xué)習(xí)率、增加訓(xùn)練量、改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)等方式,沿著RSS降低的方向不斷優(yōu)化,從而不斷提升本系統(tǒng)對(duì)各類型作業(yè)的批改能力。
3.基于深度學(xué)習(xí)的智能作業(yè)批改系統(tǒng)的實(shí)際應(yīng)用
在落地階段,積極引人該系統(tǒng)進(jìn)行教學(xué)實(shí)踐,針對(duì)高職一年級(jí)護(hù)理專業(yè)、藥學(xué)專業(yè)、康復(fù)治療技術(shù)專業(yè),展開為期一學(xué)期的試點(diǎn)應(yīng)用。護(hù)理專業(yè)涉及大量病例分析作業(yè),系統(tǒng)能快速識(shí)別醫(yī)學(xué)術(shù)語,分析護(hù)理措施的合理性,給出精準(zhǔn)評(píng)分建議,識(shí)別準(zhǔn)確率達(dá) 86% 。例如,一份包含10個(gè)病例分析的作業(yè)人工批改需2小時(shí),系統(tǒng)僅需10分鐘。藥學(xué)專業(yè)作業(yè)多圍繞藥物成分、藥理作用等,系統(tǒng)對(duì)客觀題識(shí)別準(zhǔn)確率高達(dá) 93% ,藥物處方分析等主觀題能依據(jù)專業(yè)知識(shí)判斷對(duì)錯(cuò),并給出改進(jìn)方向,準(zhǔn)確率約為 181% 。在康復(fù)治療技術(shù)專業(yè)中,系統(tǒng)對(duì)于康復(fù)方案設(shè)計(jì)等主觀題會(huì)從康復(fù)流程、手法運(yùn)用等維度評(píng)估,為教師提供參考。經(jīng)統(tǒng)計(jì),教師批改作業(yè)時(shí)間平均縮短 65% 。學(xué)期末,三個(gè)專業(yè)學(xué)生對(duì)作業(yè)反饋及時(shí)性滿意度顯著提升,教師也能將更多精力用于實(shí)踐指導(dǎo),初步體現(xiàn)了系統(tǒng)對(duì)教學(xué)的推動(dòng)性。
結(jié)語
本系統(tǒng)利用深度學(xué)習(xí)算法實(shí)現(xiàn)了對(duì)作業(yè)圖像的準(zhǔn)確處理與自動(dòng)批改,有效解決了傳統(tǒng)人工批改效率低下的問題,減輕了教師工作負(fù)擔(dān)。同時(shí),為了促使系統(tǒng)有效落地,已逐步擬定完善的推進(jìn)方案。展望未來,應(yīng)進(jìn)一步探索更先進(jìn)的深度學(xué)習(xí)模型,如引入循環(huán)神經(jīng)網(wǎng)絡(luò)強(qiáng)化模型,加強(qiáng)對(duì)復(fù)雜作業(yè)的處理能力,以此助力教育智能化邁向更高水平。
參考文獻(xiàn):
[1]杜孟航.人工智能在智能批改中的應(yīng)用分析[J].科技傳播,2019,11(4):133-134.
[2]鄭克松.智能化eNSP實(shí)訓(xùn)自動(dòng)批改技術(shù)[J].長江工程職業(yè)技術(shù)學(xué)院學(xué)報(bào),2024,41(3):26-29.
[3]劉代雄,萬彪.基于Python的作業(yè)批閱系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].長江信息通信,2023,36(4):166-168.
[4]師連鑫,張永恒,劉紅霞,等.基于JavaWeb的在線作業(yè)批改系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[]現(xiàn)代計(jì)算機(jī),2024,30(23):182-186.
[5]楊勤民,江志松.大學(xué)數(shù)學(xué)作業(yè)自動(dòng)批改系統(tǒng)的設(shè)計(jì)與實(shí)踐[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2022(2):76-83.
[6]何佳穎,熊峰,潘永平.基于程序題的自動(dòng)批改系統(tǒng)設(shè)計(jì)[J].信息技術(shù)與信息化,2022(4):54-57.
[7]陳磊,李澤世,王銘晗,等.基于學(xué)習(xí)者視角的AWE系統(tǒng)與ChatGPT作文批改反饋及改進(jìn)效果比較[J].科技傳播,2023,15(17):1-5.
[8]陳冬英,嚴(yán)瓊.應(yīng)用數(shù)據(jù)分析的在線作業(yè)管理教學(xué)改革[J].福建電腦,2021,37(12):137-140.
[9]劉淇,李瑞陽,李雨盈,等.基于文字識(shí)別技術(shù)的作業(yè)自動(dòng)批改系統(tǒng)[J].電子技術(shù)與軟件工程,2020(19):31-33.
[10]童映紅,張玲.Access作業(yè)自動(dòng)批改系統(tǒng)開發(fā)研究[J].無線互聯(lián)科技,2018,15(9):54-56.
作者簡(jiǎn)介:辛翠平,本科,講師,xincuiping99@163.com,研究方向:計(jì)算機(jī)技術(shù)。