滕勝杰, 朱琳, 李運(yùn)澤, 王新年, 晉強(qiáng)*
(1.新疆農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院, 烏魯木齊 830052; 2.新疆兵團(tuán)城建集團(tuán)有限公司, 烏魯木齊 830052)
隨著建筑業(yè)的持續(xù)發(fā)展,對(duì)天然砂的需求越來越大,導(dǎo)致砂石資源緊缺,價(jià)格飛漲,因此需要尋找天然砂的替代品[1-2]。鋼渣砂價(jià)格低廉,是一種表面粗糙多孔、質(zhì)地堅(jiān)硬、耐磨性較好的顆粒。因此眾多工程將鋼渣砂作為細(xì)骨料使用,但鋼渣中含有游離氧化鈣、氧化鎂等有害成分,導(dǎo)致鋼渣砂漿和鋼渣混凝土體積安定性不良,致使混凝土膨脹破壞,影響工程安全[3-5]。
為鋼渣在工程中大規(guī)模利用,許多學(xué)者對(duì)鋼渣的長(zhǎng)期安定性做了大量研究。楊杰等[6]對(duì)鋼渣開展了浸水膨脹率實(shí)驗(yàn),隨著水浴時(shí)間的增加,累積膨脹量近似呈線性增長(zhǎng)。張紅日等[7]采用化學(xué)成分、粉化率、基本物理指標(biāo)等實(shí)驗(yàn)研究露天陳化的鋼渣集料,鋼渣集料至少要露天陳化12個(gè)月才能滿足路用穩(wěn)定性要求。李曉剛等[8]通過游離氧化鈣含量檢測(cè)、浸水膨脹率和壓蒸實(shí)驗(yàn)檢測(cè)鋼渣的體積安定性,鋼渣集料壓蒸試驗(yàn)條可作為安定性快速檢測(cè)方法,鋼渣集料的壓蒸脹裂粉化率不大于5%。通過粉化率評(píng)價(jià)鋼渣砂安定性,鋼渣砂中膨脹性礦物不均勻性,影響粉化率指標(biāo)。倫云霞等[9]對(duì)比鋼渣砂漿強(qiáng)度和砂漿棒自由線性膨脹率,發(fā)現(xiàn)鋼渣砂砂漿強(qiáng)度的發(fā)展趨勢(shì)與砂漿棒自由線性膨脹率有較好的相關(guān)性,砂漿棒法可作為最終評(píng)價(jià)鋼渣砂安定性的方法。砂漿棒線性膨脹率雖然是一種可靠的鋼渣砂安定性評(píng)價(jià)方法,但檢測(cè)周期太長(zhǎng)。韓檬等[10]分析鋼渣體積的評(píng)價(jià)方法,測(cè)定游離氧化鈣含量可快速評(píng)價(jià)鋼渣的安定性,但對(duì)樣品的均勻性和代表性要求較高,只能作為輔助手段。學(xué)者通過研究鋼渣砂在長(zhǎng)期陳化處理中的變化規(guī)律,可通過檢測(cè)游離氧化鈣含量、砂漿棒線性膨脹率、粉化率評(píng)價(jià)鋼渣的安定性。但方法尚有缺陷,缺少針對(duì)鋼渣體積安定性快速準(zhǔn)確的評(píng)價(jià)方法?,F(xiàn)通過卷積神經(jīng)網(wǎng)絡(luò)模型區(qū)分不同陳化時(shí)間下的鋼渣砂表觀圖像,探究陳化過程中鋼渣砂圖像的變化規(guī)律。并對(duì)比鋼渣砂蒸汽粉化率和鋼渣砂表觀變化的相關(guān)性,為后續(xù)基于鋼渣砂圖像評(píng)價(jià)安定性的方法提供支撐。
為了觀察鋼渣砂圖像及圖像表觀變化規(guī)律,現(xiàn)選用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別鋼渣砂圖像。卷積神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力、泛化能力,AlexNet[11]于2012年獲得ImageNet視覺識(shí)別挑戰(zhàn)賽冠軍后,卷積神經(jīng)網(wǎng)絡(luò)的模型快速發(fā)展。目前,有代表性的模型有VGGNet[12]、ResNet[13]、MobileNet[14]、GoogleNet[15]和Efficient[16]等。卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)?fù)雜的圖像進(jìn)行分類,且結(jié)構(gòu)簡(jiǎn)單應(yīng)用性強(qiáng),廣泛解決圖像識(shí)別等問題。
通過觀察陳化前后的鋼渣砂圖像,陳化后的鋼渣圖像顏色明顯變淺,顏色是鋼渣砂的主要變化特征?,F(xiàn)以ConvNeXt[17]網(wǎng)絡(luò)為主體結(jié)構(gòu),在網(wǎng)絡(luò)中添加通道注意力機(jī)制SE-Net[18](squeeze and excitation network),使網(wǎng)絡(luò)更好地獲取鋼渣砂圖像的顏色特征。通過改進(jìn)的ConvNeXt網(wǎng)絡(luò),區(qū)分陳化前后的鋼渣砂圖像,分析鋼渣砂表觀變化的規(guī)律。
原始粒徑越大的鋼渣砂,安定性越差,危害越高,因此主要研究粒徑為2.36~4.75 mm和1.18~2.36 mm鋼渣圖像。鑒于鋼渣砂自然陳化速度較慢,選用蒸汽處理的方式陳化鋼渣砂。為衡量鋼渣砂的陳化效果,計(jì)算陳化前后鋼渣砂粉化率。針對(duì)訓(xùn)練所需的圖像,利用專業(yè)相機(jī)獲取圖像,劃分鋼渣砂圖像數(shù)據(jù)集。
分別取粒徑2.36~4.75 mm和1.18~2.36 mm的鋼渣砂,每種粒徑取3組鋼渣砂,每組1.5 kg,分別蒸汽處理2.5、5、7.5 h。蒸汽處理過程中,將鋼渣砂放入容器中,置于沸煮箱中在100 ℃下蒸汽處理。蒸煮時(shí)能保證在(30±5) min內(nèi)升至沸騰,且不需中途添補(bǔ)試驗(yàn)用水。同時(shí)保證水蒸氣能順利進(jìn)入容器內(nèi)。將蒸汽處理后的鋼渣砂用烘箱烘干至恒重,待獲取圖像。
《鋼渣穩(wěn)定性試驗(yàn)方法》(GB/T 24175—2009)中粒徑為2.36~4.75 mm的鋼渣過1.18 mm篩[19],粒徑為1.18~2.36 mm的鋼渣過0.6 mm篩。稱取鋼渣砂300 g,用烘箱烘干后,稱取鋼渣砂200 g。置于100 ℃沸煮箱中蒸汽處理5 h后取出烘干。將烘干后的鋼渣砂過篩,并按照式(1)計(jì)算單粒級(jí)粉化率(粉化率取2次平行試驗(yàn)的平均值)。
(1)
式(1)中:G為處理前試樣干重;G1為處理后篩上試樣干重。
將專業(yè)相機(jī)放置于鋼渣砂正上方10 cm處,相機(jī)具體參數(shù)如表1所示。
表1 相機(jī)參數(shù)Table 1 Camera parameters
每種處理方式下的鋼渣砂各拍攝250張圖像,共獲得2 000張圖像。取典型圖像,如圖1所示。
圖1 蒸汽處理的鋼渣砂圖像Fig.1 Images of steam-treated steel slag sand
將獲取的圖像壓縮為224×224像素,按鋼渣砂粒徑制作兩個(gè)圖像數(shù)據(jù)集,并按照訓(xùn)練集60%、驗(yàn)證集20%、測(cè)試集20%的占比,劃分每個(gè)圖像數(shù)據(jù)集。
架構(gòu)SE-ConvNeXt網(wǎng)絡(luò),以ConvNeXt網(wǎng)絡(luò)為主體結(jié)構(gòu),效仿Swin Transformer[20]中注意力機(jī)制模塊位于多層感知器層之前的思路,在網(wǎng)絡(luò)中添加通道注意力機(jī)制SE-Net。
ConvNeXt網(wǎng)絡(luò)是以ResNet結(jié)構(gòu)為基礎(chǔ),借鑒Swin Transformer架構(gòu)策略的一種純卷積神經(jīng)網(wǎng)絡(luò)模型。ConvNeXt與Swin Transformer相比,ConvNeXt不需要分塊合并、滑動(dòng)窗口等復(fù)雜計(jì)算,具有更好的性能和更簡(jiǎn)單的模型結(jié)構(gòu)。
ConvNeXt主要由下采樣層、ConvNeXt模塊(block)和全連接層3部分組成。ConvNeXt的下采樣層包括最初的下采樣層(patchify)、ConvNeXt模塊之間的下采樣層和ConvNeXt模塊與全連接層之間的下采樣層。ConvNeXt的patchify借鑒了Swin Tansformer的patchify,由一個(gè)尺寸為4×4步距為4的卷積層構(gòu)成,如圖2(b)所示,而不再使用ResNet中傳統(tǒng)結(jié)構(gòu)的下采樣下層。每個(gè)模塊之間的下采樣層(downsample)使用一個(gè)尺寸2×2步距為2的卷積層構(gòu)成,如圖2(d)所示。在ConvNeXt模塊與全連接層之間的下采樣層,使用一個(gè)全球平均池化層構(gòu)成。
Patchify表示最初下采樣層;Block表示模塊;Downsample表示兩個(gè)模塊之間的下采樣層;GELU(Gaussian error linear units)表示高斯誤差線性單元激活函數(shù);ReLU(rectified linear units)修正線性單元激活函數(shù);LN(layer normalization)表示層歸一化;FC(full connection)表示全連接;d7×7,96,s1表示尺寸為7×7的深度卷積層,通道為96,步距為1;4×4, 96, s4表示尺寸為4×4的卷積層,通道為96,步距為4;GLP表示全球平均池化層;Layer Scale為數(shù)據(jù)通道的縮放操作;Drop Path層為模型分支結(jié)構(gòu)隨機(jī)失活操作;H為數(shù)據(jù)的高度;W為數(shù)據(jù)的寬度;C為數(shù)據(jù)的通道數(shù)
ConvNeXt模塊的堆疊次數(shù)模仿Swin Tansformer的堆疊比例,從(3,4,6,3)調(diào)整為(3,3,9,3),圖2(a)所示的SE-ConvNeXt結(jié)構(gòu)模型中block的堆疊次數(shù)。ConvNeXt模塊結(jié)構(gòu)采用Swin Transformer塊中的倒置瓶頸,如圖2(c)所示。首先通過一個(gè)7×7的深度卷積層,兩個(gè)1×1的卷積層,提取輸入圖像的特征。其次進(jìn)行Layer Scale[21]操作,對(duì)每個(gè)通道的數(shù)據(jù)進(jìn)行縮放。最后,為了防止出現(xiàn)過擬合現(xiàn)象,提高模型的泛化能力,添加了一個(gè)Drop Path[22]層,將模型的主分支結(jié)構(gòu)隨機(jī)失活。
全連接層位于整個(gè)網(wǎng)絡(luò)的最后,輸入圖像經(jīng)過卷積和池化操作提取特征后,全連接層將提取的特征壓縮,并且根據(jù)壓縮的特征完成模型的分類功能。
ConvNeXt不僅在整體架構(gòu)結(jié)合了Swin Tansformer模型架構(gòu)的策略,還關(guān)注了ResNet模型與Swin Tansformer模型層之間的差異。Transformer模型中常用GELU[23](Gaussian error linear units)激活函數(shù),而ResNet模型中常用ReLU[24](rectified linear units)激活函數(shù)。Transformer使用了更少的激活函數(shù),而不是在每個(gè)卷積層或者全連接層都接上一個(gè)激活函數(shù)。同樣,Transformer使用的數(shù)據(jù)歸一化操作更少,使用的LN(layer normalization),而不是ResNet模型常用的BN(batch normalization)。ConvNeXt借鑒Swin Tansformer模型架構(gòu)的策略,在模塊中第一個(gè)1×1卷積層后跟GELU激活函數(shù),7×7深度卷積后使用LN,如圖2(b)所示。
根據(jù)鋼渣砂圖像可知,未陳化處理的鋼渣砂圖像顏色較深,通過陳化處理后,鋼渣砂圖像的顏色逐漸變淺。針對(duì)鋼渣砂圖像的變化特點(diǎn),將SE模塊應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)中,在增加少量計(jì)算的情況下,能獲得明顯的性能提升。
SE-Net:SE-Net[18]是胡杰團(tuán)隊(duì)提出的網(wǎng)絡(luò)結(jié)構(gòu),該團(tuán)隊(duì)利用SE-Net,獲得了ImageNet2017競(jìng)賽圖像分類任務(wù)的冠軍。一個(gè)SE模塊的過程分為Squeeze(壓縮)和Excitation(激發(fā))兩個(gè)步驟:Squeeze(壓縮)通過在特征圖層上執(zhí)行全球平均池化,得到當(dāng)前特征圖層的全局壓縮特征量;Excitation(激發(fā))通過兩層全連接的bottleneck(瓶頸層)得到特征圖層中每個(gè)通道的權(quán)值,并將加權(quán)后的特征圖層作為下一層網(wǎng)絡(luò)的輸入,SE模塊結(jié)構(gòu)如圖3所示。
r為縮放通道(C)的比率
SE注意力機(jī)制可獲取每個(gè)通道的重要程度,使ConvNeXt更好地獲取鋼渣砂圖像的顏色特征,降低對(duì)其他特征的關(guān)注度,提高模型在鋼渣砂分類任務(wù)中的效率和準(zhǔn)確性。在Transformer中,注意力機(jī)制模塊位于多層感知器層之前,添加SE模塊效仿這種架構(gòu)方式。在ConvNeXt模塊之前添加SE,組成SE-ConvNeXt模塊。因此構(gòu)建的SE-ConvNeXt網(wǎng)絡(luò)架構(gòu)的主體結(jié)構(gòu)與ConvNeXt網(wǎng)絡(luò)結(jié)構(gòu)相同,網(wǎng)絡(luò)結(jié)構(gòu)詳細(xì)信息如表3所示。
試驗(yàn)裝置:SE-ConvNeXt使用python語(yǔ)言中tensorflow深度學(xué)習(xí)框架超參數(shù)設(shè)置:全部圖像訓(xùn)練120次,模型每次迭代16張圖像。
分析過程:首先,使用鋼渣砂的驗(yàn)證集和測(cè)試集訓(xùn)練SE-ConvNeXt網(wǎng)絡(luò),并通過訓(xùn)練過程和測(cè)試集對(duì)分類結(jié)果評(píng)價(jià)。其次,結(jié)合模型的分類結(jié)果和粉化率指標(biāo),分析鋼渣砂圖像的變化規(guī)律。最后,將SE-ConvNeXt網(wǎng)絡(luò)與其他卷積神經(jīng)網(wǎng)絡(luò)做比較,評(píng)價(jià)SE-ConvNeXt網(wǎng)絡(luò)改進(jìn)后的優(yōu)缺點(diǎn)。
為了觀察不同粒徑的鋼渣砂圖像,分別使用粒徑2.36~4.75 mm和1.18~2.36 mm的鋼渣砂數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)。使用2.36~4.75 mm的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練SE-ConvNeXt模型,并利用測(cè)試集檢驗(yàn)?zāi)P托阅懿⒗L制混淆矩陣,對(duì)角線為正確的預(yù)測(cè)結(jié)果,立方體顏色越深,代表預(yù)測(cè)正確的圖像越多,如圖4所示。模型準(zhǔn)確率達(dá)到92.5%,預(yù)測(cè)蒸汽0、2.5、5、7.5 h的鋼渣砂圖像時(shí),準(zhǔn)確率分別達(dá)到了96%、98%、100%、76%。使用1.18~2.36 mm的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練SE-ConvNeXt模型,并利用測(cè)試集檢驗(yàn)?zāi)P托阅懿⒗L制混淆矩陣,如圖5所示。模型準(zhǔn)確率達(dá)到94%,預(yù)測(cè)蒸汽0、2.5、5、7.5 h的鋼渣砂圖像時(shí),準(zhǔn)確率分別達(dá)到了100%、94%、96%、86%。通過對(duì)比兩個(gè)混淆矩陣,模型預(yù)測(cè)兩種粒徑的鋼渣砂結(jié)果相似。在蒸汽處理?xiàng)l件下,兩種粒徑的鋼渣砂圖像變化規(guī)律相似。
圖4 預(yù)測(cè)粒徑為2.36~4.75 mm鋼渣砂圖像的混淆矩陣Fig.4 Confusion matrix for steel slag sand images with a predicted particle size of 2.36~4.75 mm
圖5 預(yù)測(cè)粒徑為1.18~2.36 mm鋼渣砂圖像的混淆矩陣Fig.5 Confusion matrix for steel slag sand images with a predicted particle size of 1.18~2.36 mm
為觀察鋼渣砂圖像的變化程度,使用相鄰類別的鋼渣砂圖像訓(xùn)練網(wǎng)絡(luò)。訓(xùn)練過程中,準(zhǔn)確率和損失值變化曲線收斂速度越快,圖像差異越大。粒徑為4.75~2.36 mm的鋼渣砂,相鄰類別的圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)如圖6所示,粒徑為2.36~1.18 mm的鋼渣砂,相鄰類別的圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)如圖7所示。
acc_表示準(zhǔn)確率變化趨勢(shì),loss_表示損失值變化趨勢(shì);蒸汽0 h與蒸汽2.5 h表示使用蒸汽0 h與蒸汽2.5 h的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)模型
圖7 1.18~2.36 mm相鄰類別鋼渣砂圖像訓(xùn)練模型的準(zhǔn)確率和損失值變化趨勢(shì)Fig.7 Trends in accuracy and loss values of the training models for the 1.18~2.36 mm adjacent category steel slag sand images
根據(jù)準(zhǔn)確率和損失值曲線收斂過程可知,兩種粒徑的鋼渣砂圖像變化的程度相似。使用蒸汽2.5 h與蒸汽0 h的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)時(shí),準(zhǔn)確率和損失值曲線的收斂速度較快,蒸汽2.5 h與蒸汽0 h的鋼渣砂圖像有明顯差異。使用蒸汽2.5 h與蒸汽5 h的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)時(shí),準(zhǔn)確率和損失值曲線的收斂速度減慢,蒸汽2.5 h與蒸汽5 h的鋼渣砂圖像的差異較小。使用蒸汽5 h與蒸汽7.5 h的鋼渣砂圖像數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)時(shí),準(zhǔn)確率和損失值收斂速度趨于平穩(wěn),蒸汽2.5、5、7.5 h的鋼渣砂圖像之間差異程度相同。鋼渣砂蒸汽處理的初期,鋼渣砂圖像變化程度最大,隨著蒸汽時(shí)間的增加,鋼渣砂圖像變化程度減小,隨后圖像變化程度趨于穩(wěn)定。
結(jié)合蒸汽粉化率,分析鋼渣砂蒸汽粉化率和鋼渣砂表觀的關(guān)系,蒸汽處理的鋼渣砂粉化率如表4所示,兩種粒徑的鋼渣砂粉化率變化規(guī)律相似。在蒸汽處理前期,粉化率下降速度快,隨著蒸汽時(shí)間的增加,粉化率下降速度減慢,逐漸趨于平穩(wěn)。粉化率的變化規(guī)律與鋼渣砂圖像的變化規(guī)律具有相關(guān)性,可使用SE-ConvNeXt評(píng)價(jià)蒸汽處理的鋼渣砂體積安定性。鋼渣砂蒸汽處理后,粉化率較為接近,鋼渣砂的安定性相差較小,圖像易混淆。導(dǎo)致預(yù)測(cè)蒸汽7.5 h的鋼渣砂圖像時(shí),準(zhǔn)確率較低。且蒸汽2.5 h與蒸汽5 h的鋼渣砂圖像訓(xùn)練網(wǎng)絡(luò)模型時(shí),最終準(zhǔn)確率未收斂至1,損失值未收斂至0。
表4 蒸汽處理的鋼渣砂粉化率Table 4 Chalking rate of steam-treated steel slag sand
為了驗(yàn)證SE注意力機(jī)制模塊對(duì)ConvNeXt的影響,通過粒徑為2.36~4.75 mm的鋼渣砂圖像數(shù)據(jù)集對(duì)比ConvNeXt和SE-ConvNeXt。圖8是SEConvNeXt和ConvNeXt兩個(gè)模型準(zhǔn)確率和損失值變化趨勢(shì)。對(duì)兩個(gè)模型的損失值和準(zhǔn)確率的變化趨勢(shì)比較,在訓(xùn)練初期損失值和準(zhǔn)確率收斂速度較快,且SE-ConvNeXt模型的損失值曲線的下降梯度和準(zhǔn)確率曲線的上升梯度與ConvNeXt網(wǎng)絡(luò)相似。模型逐漸訓(xùn)練,SE-ConvNeXt模型的收斂速度比ConvNeXt快很多,曲線的波動(dòng)范圍較小。SE-ConvNeXt模型在訓(xùn)練50次后,準(zhǔn)確率和損失值變化曲線趨于收斂,曲線波動(dòng)范圍較小。訓(xùn)練90次后,曲線趨于穩(wěn)定,最終準(zhǔn)確率收斂至0.981,損失值收斂至0.103。ConvNeXt模型訓(xùn)練50次后,準(zhǔn)確率和損失值變化曲線收斂速度降低,且曲線波動(dòng)范圍較大。訓(xùn)練90次后,準(zhǔn)確率曲線波動(dòng)范圍講笑,但損失值變化曲線出現(xiàn)反常波動(dòng),損失值上升0.358。在訓(xùn)練105次時(shí),準(zhǔn)確率和損失值變化曲線才趨于平穩(wěn),最終準(zhǔn)確率收斂至0.969,損失值收斂至0.357。對(duì)比準(zhǔn)確率和損失值表明,增加SE后的ConvNeXt模型訓(xùn)練過程更加穩(wěn)定,收倆速度更快,收斂效果更好。
在鋼渣砂分類任務(wù)中,顏色特征是分類任務(wù)的重要特征,隨著鋼渣砂陳化處理時(shí)間的增加,鋼渣砂的顏色逐漸變淺。所以選擇的SE注意力機(jī)制能夠獲取每個(gè)通道的重要程度,其次用這個(gè)重要程度去給每個(gè)特征賦予一個(gè)權(quán)重值,從而讓神經(jīng)網(wǎng)絡(luò)重點(diǎn)關(guān)注顏色特征。通過實(shí)驗(yàn)表明,SE注意力機(jī)制適合識(shí)別鋼渣砂的分類任務(wù),使ConvNeXt網(wǎng)絡(luò)有較大的提升。
為了衡量SE-ConvNeXt在鋼渣砂分類任務(wù)上的表現(xiàn),通過粒徑為2.36~4.75 mm的鋼渣砂圖像數(shù)據(jù)集對(duì)比了5種卷積神經(jīng)網(wǎng)絡(luò),如圖9、圖10所示。
圖9 卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中準(zhǔn)確率變化趨勢(shì)Fig.9 Accuracy trend of convolutional neural network in the training process
圖10 卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中損失值變化趨勢(shì)Fig.10 Trend of loss value during the training process of convolutional neural network
圖9顯示了EfficientNet V2[25]、MobileNet V3[26]、GoogleNet[15]、VGG-16[12]、Resnet-50[13]這5種先進(jìn)卷積神經(jīng)網(wǎng)絡(luò)和SE-ConvNeXt在驗(yàn)證集上的準(zhǔn)確率變化趨勢(shì)。圖10顯示了上述6個(gè)卷積神經(jīng)網(wǎng)絡(luò)在驗(yàn)證集上的損失值變化趨勢(shì)。根據(jù)圖9、圖10所示的準(zhǔn)確率和損失值變化趨勢(shì),可知MobileNet V3、Resnet-50和VGG-16 3種網(wǎng)絡(luò)模型未能達(dá)到較好的收斂效果。GoogleNet、EfficientNet V2、SE-ConvNeXt 3種網(wǎng)絡(luò)訓(xùn)練初期,曲線收斂速度較快。GoogleNet與SE-ConvNeXt曲線收斂速度相似,且比EfficientNet V2網(wǎng)絡(luò)快很多。模型逐漸訓(xùn)練,GoogleNet網(wǎng)絡(luò)在訓(xùn)練60次時(shí),曲線趨于收斂,但在訓(xùn)練60次到100次時(shí),曲線波動(dòng)較大。EfficientNet V2網(wǎng)絡(luò)80次趨于收斂,且曲線有較大的范圍波動(dòng)。SE-ConvNeXt網(wǎng)絡(luò)在60次趨于收斂,曲線波動(dòng)較小,最終趨于穩(wěn)定。
綜上所述,SE-ConvNeXt與其他模型相比,在鋼渣砂的分類任務(wù)中,具有最快的收斂速度、最高準(zhǔn)確率和穩(wěn)定的訓(xùn)練過程。在上述的6個(gè)卷積神經(jīng)網(wǎng)絡(luò)中,SE-ConvNeXt是最適合識(shí)別鋼渣砂分類任務(wù)的網(wǎng)絡(luò)模型。
使用卷積神經(jīng)網(wǎng)絡(luò)區(qū)分陳化前后的鋼渣砂圖像,分析鋼渣砂表觀變化的規(guī)律。以ConvNeXt網(wǎng)絡(luò)為主體框架,針對(duì)鋼渣砂的顏色特征,在ConvNeXt的模塊中添加SE注意力機(jī)制模塊,架構(gòu)了SE-ConvNeXt網(wǎng)絡(luò)模型。
(1)分別使用粒徑2.36~4.75 mm和1.18~2.36 mm的鋼渣砂數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò),并對(duì)比兩個(gè)混淆矩陣。模型預(yù)測(cè)2.36~4.75 mm的鋼渣砂圖像準(zhǔn)確率為92.5%,預(yù)測(cè)1.18~2.36 mm的鋼渣砂圖像準(zhǔn)確率為94%,且兩種粒徑的鋼渣砂圖像在蒸汽處理?xiàng)l件下變化規(guī)律相似。
(2)使用相鄰類別的鋼渣砂圖像訓(xùn)練網(wǎng)絡(luò)觀察鋼渣砂圖像的變化程度,鋼渣砂蒸汽處理的初期,鋼渣砂圖像變化程度最大,隨著蒸汽處理時(shí)間的增加,鋼渣砂圖像變化程度減小,隨后圖像變化程度趨于穩(wěn)定。
(3)結(jié)合蒸汽粉化率,分析鋼渣砂蒸汽粉化率和鋼渣砂表觀的關(guān)系。在蒸汽處理前期,粉化率下降速度快,隨著蒸汽時(shí)間的增加,粉化率下降速度減慢,逐漸趨于平穩(wěn)。粉化率的變化規(guī)律與鋼渣砂圖像的變化規(guī)律具有相關(guān)性。
(4)通過混淆矩陣分析,對(duì)比SE-ConvNeXt和ConvNeXt的性能。增加SE后的ConvNeXt模型訓(xùn)練過程更加穩(wěn)定,收斂效果更好。SE注意力機(jī)制幫助ConvNeXt更好地獲取鋼渣圖像的顏色特征。
(5)將5種卷積神經(jīng)網(wǎng)絡(luò)模型與SE-ConvNeXt使用同一鋼渣砂數(shù)據(jù)集訓(xùn)練,對(duì)比網(wǎng)絡(luò)的訓(xùn)練過程。SE-ConvNeXt在鋼渣圖像識(shí)別中具有最快的收斂速度、最高準(zhǔn)確率和穩(wěn)定的訓(xùn)練過程。