摘" 要: 針對(duì)結(jié)晶過程中晶體原位圖像存在的目標(biāo)像素低、晶體重疊以及背景干擾等導(dǎo)致的分割檢測(cè)困難等現(xiàn)象,提出一種改進(jìn)YOLOv8的晶體原位圖像分割方法。為了提高模型的分割檢測(cè)性能,首先引入高效多尺度注意力機(jī)制(EMA),增強(qiáng)模型的感知能力;其次使用空間到深度非跨步卷積(SPD?Conv)對(duì)原卷積塊進(jìn)行改進(jìn),在提升對(duì)低像素、小目標(biāo)晶體分割精度的同時(shí)降低了模型的計(jì)算量;最后采用高效交互比(EIoU)損失函數(shù)優(yōu)化對(duì)遮擋和重疊目標(biāo)的檢測(cè)效果。實(shí)驗(yàn)結(jié)果表明,文中提出的算法晶體檢測(cè)精度(mAP)達(dá)到71.3%,精度提高了5.3%,浮點(diǎn)運(yùn)算量降低了1.9 GFLOPs。此外,該方法對(duì)改善結(jié)晶圖像質(zhì)量較差以及存在晶體重疊的工況也具有明顯的優(yōu)勢(shì)。
關(guān)鍵詞: 原位圖像; 晶體; 圖像分割; YOLOv8; 注意力機(jī)制; 損失函數(shù)
中圖分類號(hào): TN911.73?34; TP391.4" " " " " " " " "文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " 文章編號(hào): 1004?373X(2024)23?0055?07
Deep learning based in?situ image segmentation method for crystallization process
CHU Tengfei1, SUN Ke2, ZHANG Fangkun1, SHAN Baoming1 , XU Qilei1
(1. College of Automation and Electronic Engineering, Qingdao University of Science and Technology, Qingdao 266061, China;
2. Shandong Xinhua Pharmaceutical Co., Ltd., Zibo 255000, China)
Abstract: A crystal in?situ image segmentation method based on improved YOLOv8 is proposed to address the crystal segmentation difficulties caused by low pixels, overlapped crystals and background interference of the in?situ images in the process of crystallization. To improve the segmentation detection performance of the model, the efficient multi?scale attention (EMA) mechanism is introduced to enhance the perception ability of the model. Subsequently, the original convolutional block is improved by the space?to?depth non?strided convolution (SPD?Conv) method, so as to enhance the segmentation accuracy of crystals (the objects) with low pixel and small size while reducing the computational effort of the model. Finally, the efficient intersection over union (EIoU) loss function is used to optimize the detection results of the occluded and overlapped crystals (the objects). The experimental results show that the crystal detection accuracy (mAP) of the proposed algorithm reaches 71.3%, its accuracy is improved by 5.3%, and its floating?point calculation burden is reduced by 1.9 GFLOPs. In addition, the proposed method has advantages in improving the quality of crystal image and eliminating the crystal overlap.
Keywords: in?situ image; crystal; image segmentation; YOLOv8; attention mechanism; loss function
0" 引" 言
結(jié)晶已廣泛應(yīng)用于醫(yī)藥、電子元件以及材料等行業(yè)[1?2]。晶體的關(guān)鍵質(zhì)量屬性如形狀、尺寸分布等不僅影響產(chǎn)品質(zhì)量和品質(zhì),還影響下游工藝工序,如過濾、干燥、包裝等處理步驟[3]。然而,由于工業(yè)結(jié)晶過程體系復(fù)雜且晶體具有動(dòng)態(tài)、微觀性、多形態(tài)、多維度等特征,晶體信息的在線監(jiān)測(cè)極具挑戰(zhàn)。近年來,隨著光電傳感技術(shù)的發(fā)展,極具有潛力的圖像測(cè)量技術(shù)在工業(yè)結(jié)晶領(lǐng)域受到了廣泛關(guān)注和研究[4]。
將晶體從溶液背景中識(shí)別并分離出來是原位分析的前提,算法分割效果將直接影響后續(xù)的晶體特性分析與研究[5]。為了獲取晶體信息,國內(nèi)外學(xué)者基于閾值[6]、邊緣檢測(cè)[7]、形態(tài)學(xué)[8]等原理開展了自動(dòng)分割算法的研究。這些基于傳統(tǒng)的分割方法在一些相對(duì)簡(jiǎn)單的情況下表現(xiàn)良好,但其準(zhǔn)確性通常會(huì)受到許多因素的影響,例如圖像質(zhì)量、固體濃度以及顆粒重疊等[9]。
隨著機(jī)器視覺技術(shù)的快速發(fā)展,基于深度學(xué)習(xí)的分割算法因其適應(yīng)性、抗干擾能力強(qiáng)以及更優(yōu)秀的分割精度,逐漸成為了晶體圖像處理的主流方法。目前,根據(jù)候選框的生成可以將目標(biāo)檢測(cè)算法分為兩大類:?jiǎn)坞A段檢測(cè)算法與雙階段檢測(cè)算法[10]。其中,單階段檢測(cè)器的檢測(cè)精度略遜于雙階段檢測(cè)器,但有著更高的檢測(cè)速度[11]。
近年來,由于更高的分割精度以及魯棒性,基于深度學(xué)習(xí)的分割方法被廣泛應(yīng)用于晶體的原位監(jiān)測(cè)。文獻(xiàn)[12]使用YOLOv4實(shí)現(xiàn)了晶體團(tuán)聚與偽團(tuán)聚的分析與分類,但YOLOv4本身不包含分割功能,因此不利于對(duì)晶體形態(tài)的后續(xù)研究。文獻(xiàn)[13]使用Mask?RCNN算法分割并分類β型L谷氨酸晶體,但雙階段的網(wǎng)絡(luò)構(gòu)造實(shí)時(shí)性較差。文獻(xiàn)[14]提出了一種改進(jìn)的Unet算法,改善了溶液攪拌和顆粒運(yùn)動(dòng)的負(fù)面影響,但跨越連接的構(gòu)造會(huì)造成信息的丟失,不利于低像素、小目標(biāo)晶體的檢測(cè)。
本文針對(duì)晶體原位圖像存在的目標(biāo)像素較低、顆粒重疊以及背景干擾問題,綜合考慮了檢測(cè)精度與速度,提出了一種改進(jìn)的YOLOv8晶體分割算法。首先,將EMA(Efficient Multi?Scale Attention)模塊與C2f結(jié)合,提出了EMA_C2f模塊,提高對(duì)圖形特征的提取能力;其次,考慮到晶體圖像存在目標(biāo)模糊、微觀性等特征,引入SPD?Conv對(duì)網(wǎng)絡(luò)進(jìn)行改進(jìn),減少淺層信息的丟失并減少模型的參數(shù)計(jì)算量;最后,采用高效交并比(Efficient Intersection over Union, EIoU)損失函數(shù),改善遮擋和重疊晶體的漏檢問題。經(jīng)過實(shí)驗(yàn)對(duì)比證明,改進(jìn)后的算法在實(shí)現(xiàn)模型輕量化的同時(shí)提高了分割檢測(cè)精度。
1" YOLOv8算法原理
YOLO系列是單階段檢測(cè)器的代表算法,該框架因兼顧速度和精度而受到廣泛關(guān)注,其能夠快速可靠地識(shí)別圖像中的目標(biāo)。YOLOv8于2023年由Ultralytics團(tuán)隊(duì)開發(fā),因其優(yōu)秀的檢測(cè)性能而被廣泛應(yīng)用[15]。YOLOv8網(wǎng)絡(luò)支持對(duì)象檢測(cè)和跟蹤以及附加任務(wù),例如實(shí)例分割、圖像分類和關(guān)鍵點(diǎn)檢測(cè)。YOLOv8網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
YOLOv8?seg是YOLOv8的實(shí)例分割模型,與目標(biāo)檢測(cè)模型相比,實(shí)例分割模型在頭部結(jié)構(gòu)中具有掩模分支和掩模系數(shù),通過分割頭學(xué)習(xí)來預(yù)測(cè)輸入圖像的語義分割掩碼。
YOLOv8?seg網(wǎng)絡(luò)可以分為Backbone、Neck以及Head三部分。Backbone主干網(wǎng)絡(luò)用于提取輸入圖片的特征信息,該部分由CBS、C2f和SPPF三種模塊組成。其中,CBS包括Conv2d、BN以及SiLU激活函數(shù),主要用于提取圖像的特征信息。C2f模塊的設(shè)計(jì)參考了C3模塊以及ELAN思想,在保證輕量化的同時(shí)提供了更多的特征信息;SPPF為空間金字塔池化結(jié)構(gòu),用于處理不同尺度的特征。Neck頸部網(wǎng)絡(luò)采用了FPN+PAN結(jié)構(gòu),可以對(duì)主干網(wǎng)絡(luò)提取的特征進(jìn)行聚合與細(xì)化,起到特征融合的作用,并能夠增強(qiáng)多個(gè)尺度上的語義表達(dá)和定位能力。Head檢測(cè)頭作為輸出端,采用無錨框(Anchor?Free)解耦頭降低模型復(fù)雜度的同時(shí)提高了定位精度與泛化能力。損失函數(shù)方面,YOLOv8采用CIoU和DFL作為邊界框損失函數(shù),二元交叉熵作為分類損失,從而提高目標(biāo)檢測(cè)的性能。
YOLOv8?seg分為五個(gè)模型:YOLOv8n?seg、YOLOv8s?seg、YOLOv8m?seg、YOLOv8l?seg、YOLOv8x?seg。其中,YOLOv8s?seg兼顧了精度與速度,因此選擇YOLOv8s?seg作為基準(zhǔn)模型。
2" 改進(jìn)YOLOv8算法原理
結(jié)晶過程中晶體具有動(dòng)態(tài)、微觀性等特征,導(dǎo)致拍攝到的原位圖像往往存在像素較低以及晶體重疊等干擾,給晶體的分割帶來了極大的挑戰(zhàn)。根據(jù)圖2的分割結(jié)果,原始的YOLOv8對(duì)于像素較低以及重疊的晶體檢測(cè)效果較差,容易出現(xiàn)漏檢等問題,不利于結(jié)晶過程的原位分析。因此為了獲得更好的檢測(cè)效果,對(duì)YOLOv8進(jìn)行了一系列的改進(jìn)。
2.1" 改進(jìn)后的YOLOv8算法
為了提高算法對(duì)晶體目標(biāo)的分割性能,首先,在主干網(wǎng)絡(luò)引入EMA注意力機(jī)制對(duì)C2f進(jìn)行改進(jìn),以提高目標(biāo)檢測(cè)的準(zhǔn)確性與魯棒性;其次,使用SPD?Conv改進(jìn)卷積模塊,避免了淺層特征信息丟失的問題;同時(shí),SPD?Conv由于去除了池化與步長(zhǎng)的部分,可以有效降低模型的參數(shù)計(jì)算量;最后,采用EIoU損失函數(shù)代替CIoU,優(yōu)化對(duì)遮擋和重疊目標(biāo)的檢測(cè)效果。相比于基準(zhǔn)模型YOLOv8s?seg,改進(jìn)后的算法對(duì)晶體原位圖像有著更好的分割檢測(cè)效果。改進(jìn)后的YOLOv8網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
2.2" EMA注意力機(jī)制
注意力機(jī)制能夠捕獲局部重要信息,從而提高模型在各種任務(wù)中的性能和準(zhǔn)確性。對(duì)于結(jié)晶過程所拍攝的原位圖像,往往存在較多的背景干擾,因此在基準(zhǔn)算法YOLOv8的基礎(chǔ)上加入了注意力機(jī)制,幫助算法聚焦于晶體目標(biāo),提高算法的識(shí)別性能。
EMA是一種高效多尺度注意力機(jī)制[16],它采用并行子結(jié)構(gòu)減少網(wǎng)絡(luò)深度,并通過跨維度的交互作用保留每個(gè)通道上的信息。EMA機(jī)制結(jié)構(gòu)如圖4所示。
EMA聚合了多尺度空間結(jié)構(gòu)信息,將1×1卷積內(nèi)核與3×3卷積內(nèi)核并行放置從而保證檢測(cè)速度。對(duì)于輸入特征[X∈Rc×h×w],EMA按通道數(shù)將其劃分為[g]個(gè)子特征,以學(xué)習(xí)不同的語義。其中[g?c],保證符合一般性的條件。
通過在C2f結(jié)構(gòu)中引入EMA模塊,使得模型能夠更加專注于目標(biāo)區(qū)域的位置信息,從而提高對(duì)目標(biāo)區(qū)域的檢測(cè)精度。EMA_C2f模塊的網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
2.3" SPD?Conv
在卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的早期層中,圖像分辨率適合研究大目標(biāo),并且可以在步長(zhǎng)體積內(nèi)很好地過濾大量冗余信息,使得模型學(xué)習(xí)的特征效果更好。然而,當(dāng)圖像像素?cái)?shù)量較少或檢測(cè)目標(biāo)較小時(shí),冗余數(shù)據(jù)量較少。在這種情況下,跨步卷積和池化會(huì)導(dǎo)致細(xì)節(jié)信息的丟失,卷積神經(jīng)網(wǎng)絡(luò)在圖像分辨率較低或目標(biāo)較小的情況下,其網(wǎng)絡(luò)性能會(huì)迅速下降。
為了提升算法對(duì)低像素、小目標(biāo)晶體的檢測(cè)效果,在YOLOv8中引入SPD?Conv[17]模塊以減少特征提取過程中信息的丟失,改善模型對(duì)模糊、小目標(biāo)晶體的分割檢測(cè)性能。在SPD?Conv中,使用空間到深度卷積SPD提取更深層次的特征信息,并通過降維來加快運(yùn)算速度。隨后,無步長(zhǎng)卷積Conv(步長(zhǎng)為1)對(duì)經(jīng)過SPD處理的特征信息進(jìn)行卷積操作,逐層提取特征。由于去除了步長(zhǎng)和池化,不會(huì)造成淺層信息的丟失并且降低了計(jì)算量。SPD?Conv網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。
對(duì)于輸入大小為[S×S×C1]的原始特征圖[X],SPD?Conv按比例因子[q]對(duì)子特征圖進(jìn)行下采樣,將[X]切分成一系列的子特征圖。通常比例因子[q]設(shè)定為2,經(jīng)過下采樣的[X]空間維度縮小一半,通道維度擴(kuò)大為4倍,從而得到4個(gè)大小均為[(S2,S2,C1)]的子特征圖。再沿著通道維度將這些子特征圖連接起來,將4個(gè)子特征圖按通道維度拼接,得到一個(gè)中間特征圖[X]。隨后,添加一個(gè)帶有[C2]過濾器的Conv,再進(jìn)一步進(jìn)行轉(zhuǎn)換,將[X(Sq,Sq,q2C1)]轉(zhuǎn)換為[X(Sq,Sq,C2)],其中,[C2lt;q2C1]。
通過在網(wǎng)絡(luò)中融合SPD?Conv,幫助模型有效地融合不同層次的特征,減少信息丟失,從而提高模型對(duì)低分辨率、小目標(biāo)晶體的檢測(cè)性能。
2.4" EIoU損失函數(shù)
YOLOv8采用了CIoU損失函數(shù),能夠?qū)χ行狞c(diǎn)距離、重疊面積和縱橫比三個(gè)方面進(jìn)行調(diào)整,實(shí)現(xiàn)邊界框回歸過程的優(yōu)化。但CIoU由于無法反映錨框?qū)捀叩膶?shí)際差距,當(dāng)錨框?qū)捀弑戎迪嗤瑫r(shí)損失為0,因此不利于預(yù)測(cè)框的回歸優(yōu)化[18]。所以在CIoU的基礎(chǔ)上,將縱橫比部分拆分,提出了可以描述寬高的EIoU[19]損失函數(shù),其計(jì)算公式如下:
[LEIoU=LIoU+LDis+LAsp=1-IoU+ρ2(b,bgt)(wc)2+(hc)2+ρ2(w,wgt)(wc)2+ρ2(h,hgt)(hc)2]
式中:[LIoU]表示I[o]U損失;[LDis]表示距離損失;[LAsp]表示縱橫比損失;[b]、[w]、[h]分別表示預(yù)測(cè)框的中心坐標(biāo)、寬度和高度;[bgt]、[wgt]、[hgt]分別表示真實(shí)框的中心坐標(biāo)、寬度和高度;[wc]、[hc]分別表示預(yù)測(cè)框和真實(shí)框最小外接矩形的寬度和高度;[ρ2(b,bgt)]表示[b]和[bgt]之間的歐氏距離;[ρ2(w,wgt)]表示[w]和[wgt]之間的寬度差值;[ρ2(h,hgt)]表示[h]和[hgt]之間的高度差值。
EIoU損失可以反映錨框?qū)捀叩膶?shí)際差距,幫助算法選擇最合適的邊界框來準(zhǔn)確定位目標(biāo),有助于改善晶體重疊導(dǎo)致的檢測(cè)框失真現(xiàn)象,從而有效降低重疊晶體漏檢問題。
3" 實(shí)驗(yàn)與分析
3.1" 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)使用的服務(wù)器環(huán)境配置如表1所示。
3.2" 實(shí)驗(yàn)數(shù)據(jù)集采集
數(shù)據(jù)集來自β型L谷氨酸的冷卻結(jié)晶過程實(shí)驗(yàn),使用非侵入式在線成像系統(tǒng)對(duì)晶體圖像進(jìn)行原位采集,實(shí)驗(yàn)裝置如圖7所示。
晶體的原位圖像通過外部CCD相機(jī)獲取,拍攝的晶體原位圖像樣圖如圖8所示。其中每張圖片中都含有多個(gè)晶體目標(biāo),并在標(biāo)注過程中針對(duì)晶體類型(單個(gè)晶體(single)與重疊晶體(overlapped))進(jìn)行了分類。
3.3" 消融實(shí)驗(yàn)
為了證明各項(xiàng)改進(jìn)措施對(duì)晶體原位圖像中目標(biāo)分割精度的提升作用,基于結(jié)晶過程中采集的晶體原位圖像數(shù)據(jù)集,依次對(duì)YOLOv8網(wǎng)絡(luò)模型添加相應(yīng)的改進(jìn)措施,進(jìn)行了一系列的消融實(shí)驗(yàn)。針對(duì)模型的查準(zhǔn)率([P])、召回率([R])、[F1]、平均精度均值(mAP)、浮點(diǎn)運(yùn)算量(GFLOPs)以及模型參數(shù)量(Params)進(jìn)行了統(tǒng)計(jì)分析,結(jié)果如表2所示。
通過實(shí)驗(yàn)結(jié)果分析可知:A表示在主干網(wǎng)絡(luò)替換EMA_C2f模塊,提高了模型對(duì)特征的提取能力,綜合指標(biāo)mAP與[F1]分?jǐn)?shù)均有提升;B表示將SPD?Conv模塊替換為YOLOv8主干與頸部網(wǎng)絡(luò)中的Conv模塊,提高了低像素、小目標(biāo)晶體的檢測(cè)能力,整體mAP與[F1]均有提升;C表示將CIoU替換為EIoU損失函數(shù),在不增加網(wǎng)絡(luò)復(fù)雜程度的前提下,提高了精度;D表示將EMA_C2f與SPD?Conv兩種改進(jìn)同時(shí)應(yīng)用于基準(zhǔn)算法;E分別將EMA_C2f與EIoU損失函數(shù)兩種改進(jìn)同時(shí)應(yīng)用于基準(zhǔn)算法;Ours代表加入所有改進(jìn)措施后的改進(jìn)算法,其中[F1]為68.2%,提高了5.1%,mAP值為71.3%,提高了5.3%,說明改進(jìn)后的YOLOv8算法更能準(zhǔn)確地識(shí)別晶體。
對(duì)于改進(jìn)的YOLOv8s?seg算法,注意力機(jī)制的引入提高了模型性能,但會(huì)增加一定的計(jì)算量。SPD?Conv的引入,可以有效應(yīng)對(duì)晶體圖像目標(biāo)模糊的缺陷,同時(shí)SPD?Conv相比于普通的Conv模塊,去掉了步長(zhǎng)與池化操作,起到了減少模型計(jì)算量的作用。通過實(shí)驗(yàn)對(duì)比,經(jīng)過改進(jìn)后的模型浮點(diǎn)運(yùn)算量降低了1.9 GFLOPs,模型參數(shù)量降低了1.14 MB,實(shí)現(xiàn)了輕量化。
3.4" 算法對(duì)比實(shí)驗(yàn)
為了進(jìn)一步驗(yàn)證,將改進(jìn)后的算法與YOLO系列分割算法以及結(jié)晶領(lǐng)域主流的深度學(xué)習(xí)分割算法進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如表3所示。
由對(duì)比實(shí)驗(yàn)結(jié)果可知,本文改進(jìn)的方法與其他主流的分割模型相比,有著更高的準(zhǔn)確度。
3.5" 分割結(jié)果可視化
為了更直觀地展示本文改進(jìn)算法在檢測(cè)晶體原位圖像上的提升效果,進(jìn)行了分割對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖9所示。
通過圖9中的對(duì)比可知,基準(zhǔn)算法YOLOv8s與改進(jìn)算法都能識(shí)別出兩類目標(biāo),但基準(zhǔn)算法在面對(duì)出現(xiàn)的小目標(biāo)晶體、陰影下的晶體以及重疊晶體時(shí)無法做到全面的識(shí)別,而本文提出的方法對(duì)于這類晶體有著更高的識(shí)別能力,通過分割對(duì)比實(shí)驗(yàn)證明,本文提出的改進(jìn)算法有著更好的綜合性能。
4" 結(jié)" 語
本文針對(duì)結(jié)晶過程原位圖像存在的目標(biāo)像素較低、顆粒重疊以及背景干擾等問題,提出一種改進(jìn)YOLOv8的晶體原位圖像分割方法。首先,將EMA注意力機(jī)制與C2f模塊結(jié)合,使模型聚焦于目標(biāo)的關(guān)鍵相關(guān)特征,從而提高模型的性能與準(zhǔn)確性;其次,使用SPD?Conv改進(jìn)卷積模塊,加強(qiáng)網(wǎng)絡(luò)對(duì)低像素、小目標(biāo)晶體的檢測(cè)能力,同時(shí)降低模型的參數(shù)計(jì)算量;最后,采用EIoU損失優(yōu)化對(duì)相互遮擋目標(biāo)的檢測(cè)效果。通過多種實(shí)驗(yàn)分析,改進(jìn)后的算法mAP為71.3%,精度提高了5.3%,浮點(diǎn)運(yùn)算量為40.5 GFLOPs,降低了1.9 GFLOPs。此外,對(duì)結(jié)晶圖像質(zhì)量較差以及存在晶體重疊的工況下該方法也具有明顯的優(yōu)勢(shì),能夠更好地識(shí)別成像較差以及重疊的晶體。
注:本文通訊作者為徐啟蕾。
參考文獻(xiàn)
[1] WU W L, MILLS M M, SCHACHT U, et al. Sensor fusion and calibration?based adaptive image analysis procedure for in situ crystal size measurement [J]. Crystal growth amp; design, 2023, 23(10): 7076?7089.
[2] 趙紹磊,王耀國,張騰,等.制藥結(jié)晶中的先進(jìn)過程控制[J].化工學(xué)報(bào),2020,71(2):459?474.
[3] NEOPTOLEMOU P, GOYAL N, CRUZ?CABEZA A J, et al. A novel image analysis technique for 2D characterization of overlapping needle?like crystals [J]. Powder technology, 2022, 399: 116827.
[4] ZHANG F K, LI W, SHAN B M, et al. Crystal measurement technologies for crystallization processes: Advances, applications, and challenges [J]. Measurement, 2024, 231: 114672.
[5] 陳宗元,張磊磊,趙寧寧,等.混合顆粒系重疊圖像分割與分類方法研究[J].計(jì)量學(xué)報(bào),2022,43(6):746?753.
[6] 郭觀凱,劉偉,余玲玲,等.基于改進(jìn)FAST與分水嶺算法的顆粒圖像分割[J].中國粉體技術(shù),2019,25(2):61?67.
[7] VANCLEEF A, MAES D, VAN GERVEN T, et al. Flow?through microscopy and image analysis for crystallization processes [J]. Chemical engineering science, 2022, 248: 117067.
[8] 趙于前,柳建新,劉劍.基于形態(tài)學(xué)重構(gòu)運(yùn)算的醫(yī)學(xué)圖像分割[J].計(jì)算機(jī)工程與應(yīng)用,2007(10):238?240.
[9] ZONG S, ZHOU G, LI M, et al. Deep learning?based on?line image analysis for continuous industrial crystallization processes [J]. Particuology, 2023, 74: 173?183.
[10] 趙永強(qiáng),饒?jiān)?,董世鵬,等.深度學(xué)習(xí)目標(biāo)檢測(cè)方法綜述[J].中國圖象圖形學(xué)報(bào),2020,25(4):629?654.
[11] 何俊,蔣昌輝,李倡洪,等.基于EF?YOLO的輸電線路鳥害檢測(cè)技術(shù)研究[J].現(xiàn)代電子技術(shù),2022,45(10):94?98.
[12] JIANG Z Y, LIU T, HUO Y, et al. Image analysis of crystal size distribution and agglomeration for β form L?Glutamic acid crystallization based on YOLOv4 deep learning [C]// 2021 China Automation Congress (CAC). New York: IEEE, 2021: 3017?3022.
[13] GAO Z G, WU Y Y, BAO Y, et al. Image analysis for in?line measurement of multidimensional size, shape, and polymorphic transformation of I?Glutamic acid using deep learning?based image segmentation and classification [J]. Crystal growth amp; design, 2018, 18(8): 4275?4281.
[14] HUO Y, LI X, TU B. Image measurement of crystal size growth during cooling crystallization using high?speed imaging and a U?net network [J]. Crystals, 2022, 12(12): 1690.
[15] TERVEN J, CóRDOVA?ESPARZA D M, ROMERO?GONZáLEZ J A. A comprehensive review of YOLO architectures in computer vision: From YOLOv1 to YOLOv8 and YOLO?NAS [J]. Machine learning and knowledge extraction, 2023, 5(4): 1680?1716.
[16] OUYANG D L, HE S, ZHANG G Z, et al. Efficient multi?scale attention module with cross?spatial learning [C]// 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). New York: IEEE, 2023: 1?5.
[17] SUNKARA R, LUO T. No more strided convolutions or pooling: A new CNN building block for low?resolution images and small objects [C]// Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Heidelburg: Springer, 2022: 443?459.
[18] 劉毅,蔣三新.基于改進(jìn)YOLOX的鋼材表面缺陷檢測(cè)研究 [J].現(xiàn)代電子技術(shù),2024,47(9):131?138.
[19] ZHANG Y F, REN W Q, ZHANG Z, et al. Focal and efficient IOU loss for accurate bounding box regression [J]. Neurocomputing, 2022, 506: 146?157.
作者簡(jiǎn)介:褚騰飛(1997—),男,山東濰坊人,碩士研究生,研究方向?yàn)閳D像分割、智能感知與信息處理。
孫" 科(1980—),男,山東淄博人,工程師,研究方向?yàn)闄C(jī)器學(xué)習(xí)、化工智能控制。
張方坤(1986—),男,山東聊城人,博士研究生,副教授,研究方向?yàn)橹悄芸刂?、在線監(jiān)測(cè)。
單寶明(1974—),男,山東東營(yíng)人,博士研究生,教授,研究方向?yàn)槿斯ぶ悄堋⒅悄軆x表與嵌入式系統(tǒng)。
徐啟蕾(1980—),女,山東青島人,博士研究生,副教授,研究方向?yàn)闄C(jī)器視覺及機(jī)器人自主導(dǎo)航。