江 凱,楊 凱,顏迪新,李子印,倪 軍,陳 燦
(1.中國計(jì)量大學(xué) 光學(xué)與電子科技學(xué)院,浙江 杭州 310018;2.浙江省計(jì)量科學(xué)研究院 醫(yī)學(xué)與電離輻射計(jì)量研究所,浙江 杭州 310018)
隨著電子技術(shù)的不斷發(fā)展,家用電子血壓計(jì)自動(dòng)檢定系統(tǒng)已經(jīng)成為應(yīng)用于居民社區(qū)等公眾場所便捷的檢定設(shè)備。為了更好地保證電子血壓計(jì)檢定過程智能化,使用機(jī)器視覺代替人眼獲取被檢測的電子血壓計(jì)關(guān)鍵信息,通過自動(dòng)化填充到檢測報(bào)告對應(yīng)信息欄中,其中準(zhǔn)確識別電子血壓計(jì)的品牌型號成了非常重要的問題。傳統(tǒng)的機(jī)器學(xué)習(xí)算法在電子血壓計(jì)品牌型號識別任務(wù)上具有局限性。這些算法如支持向量機(jī)(support vector machine, SVM)和隨機(jī)森林(random forest, RF)等,需要人工提取特征和選擇模型,這可能會導(dǎo)致模型過擬合或欠擬合[1]。另外,它們可能無法處理數(shù)據(jù)中的復(fù)雜變化和噪聲。而深度學(xué)習(xí)模型,特別是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)和生成對抗網(wǎng)絡(luò)(generative adversarial network, GAN)模型的出現(xiàn),為電子血壓計(jì)品牌型號識別提供了新的思路和方法[2]。
CNN是一種基于卷積和池化操作的深度學(xué)習(xí)模型,它以不同的層次對輸入數(shù)據(jù)進(jìn)行逐層特征提取,并通過全連接層進(jìn)行分類。Krizhevsky等[3]在2012年提出的AlexNet成功應(yīng)用CNN進(jìn)行圖像分類,它在ImageNet大規(guī)模視覺識別競賽中取得了巨大成功。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,CNN已經(jīng)成為圖像處理領(lǐng)域的主要研究方向。然而,對于具有多種復(fù)雜特征的圖像,傳統(tǒng)CNN可能無法充分提取全局特征。在電子設(shè)備識別任務(wù)中,已有相關(guān)研究使用CNN進(jìn)行識別,如Wang等[4]中提出的基于深度CNN的電子設(shè)備識別方法,表明CNN比傳統(tǒng)機(jī)器學(xué)習(xí)算法的性能更好。GAN是由Goodfellow等[5]提出的一種生成式模型,它由兩個(gè)神經(jīng)網(wǎng)絡(luò)組成:生成器和判別器。生成器試圖生成與真實(shí)數(shù)據(jù)相似的數(shù)據(jù),判別器則試圖區(qū)分真實(shí)數(shù)據(jù)和生成數(shù)據(jù)。兩個(gè)網(wǎng)絡(luò)在對抗的過程中不斷迭代優(yōu)化,最終生成器可以生成與真實(shí)數(shù)據(jù)相似的數(shù)據(jù)。GAN已經(jīng)被廣泛應(yīng)用于生成逼真的圖像,近年來也被用于圖像恢復(fù)和增強(qiáng)任務(wù)。GAN可以學(xué)習(xí)圖像的潛在分布,并生成與訓(xùn)練數(shù)據(jù)感知上相似的新圖像。通過訓(xùn)練生成器網(wǎng)絡(luò)以生成與真實(shí)圖像相似的圖像,GAN可以有效地恢復(fù)和增強(qiáng)降質(zhì)圖像。但是,尚未有研究使用生成對抗網(wǎng)絡(luò)-卷積神經(jīng)網(wǎng)絡(luò)(GAN-CNN)聯(lián)合模型進(jìn)行電子血壓計(jì)品牌型號的識別。GAN-CNN模型能夠同時(shí)學(xué)習(xí)全局和局部特征,提高了對復(fù)雜圖像變化的處理能力。它采用對抗性訓(xùn)練的方式,可以增強(qiáng)模型的魯棒性,且對抗攻擊和噪聲的干擾具有一定的容忍度[6]。GAN模型的引入可以幫助提高數(shù)據(jù)的質(zhì)量和多樣性,從而增強(qiáng)CNN模型的學(xué)習(xí)能力和魯棒性。
為了解決傳統(tǒng)算法的局限性,本文提出一種基于GAN-CNN聯(lián)合模型的電子血壓計(jì)品牌型號識別方法。采用GAN來進(jìn)行數(shù)據(jù)增強(qiáng),在擴(kuò)充數(shù)據(jù)集的同時(shí),還能提高模型的泛化性能。利用CNN作為識別模型,提取電子血壓計(jì)圖片中的特征信息,并進(jìn)行分類識別。
本文所采用數(shù)據(jù)集來自浙江省計(jì)量科學(xué)研究院2022年1-12月家用電子血壓計(jì)公益檢定的拍攝圖片,選用常用的A、B、C、D、E五種品牌6種不同型號的電子血壓計(jì)進(jìn)行樣本圖片拍攝,分別從正面、側(cè)面等9個(gè)角度對每種品牌每種型號采集100張圖片作為樣本集。圖像分辨率為256×256像素,圖像大小為256×256×3,每個(gè)圖像都標(biāo)注了所屬品牌和型號。訓(xùn)練模型時(shí),采用了交叉驗(yàn)證的方法,將數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測試集,其中訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于調(diào)整模型的超參數(shù),測試集用于評估模型的性能。其中A品牌a型號數(shù)據(jù)集采集樣圖如圖1。
圖1 A品牌a型號數(shù)據(jù)集采集樣圖Figure 1 A brand a model dataset collection sample
為了使數(shù)據(jù)的量綱保持一致使得模型易于訓(xùn)練,需要對數(shù)據(jù)進(jìn)行處理,具體流程如圖2。
圖2 數(shù)據(jù)處理流程Figure 2 Data processing flow
其中數(shù)據(jù)增強(qiáng)的操作如表1。
表1 數(shù)據(jù)增強(qiáng)操作
其中歸一化的處理公式為
(1)
式(1)中,X為電子血壓計(jì)圖片真實(shí)尺寸大小,Xn為歸一化尺寸大小,XM為尺寸最大值,Xm為尺寸最小值。
本文采用準(zhǔn)確率和相對誤差作為評判標(biāo)準(zhǔn)對模型識別結(jié)果準(zhǔn)確率進(jìn)行評估,當(dāng)準(zhǔn)確度約接近100%或者相對誤差接近0,模型識別越精確。具體公式如下:
(2)
式(2)中,yt為識別次數(shù),pt為實(shí)際識別出次數(shù)。
GAN是由一個(gè)生成器和一個(gè)判別器組成的對抗網(wǎng)絡(luò)。生成器用于生成與真實(shí)數(shù)據(jù)相似的虛假數(shù)據(jù),而判別器用于將真實(shí)數(shù)據(jù)和虛假數(shù)據(jù)區(qū)分開來[7]。GAN的核心內(nèi)容是最小化生成器和判別器之間的損失函數(shù),以實(shí)現(xiàn)生成器生成更加真實(shí)的數(shù)據(jù)。
GAN是一種生成式模型,生成器網(wǎng)絡(luò)接收一個(gè)隨機(jī)噪聲向量,生成一個(gè)虛假的數(shù)據(jù)樣本,判別器網(wǎng)絡(luò)接收這個(gè)虛假數(shù)據(jù)樣本和真實(shí)數(shù)據(jù)樣本,判斷哪一個(gè)是真實(shí)的。生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)交替訓(xùn)練,通過對抗學(xué)習(xí)的方式,逐漸提升生成器網(wǎng)絡(luò)的生成能力和判別器網(wǎng)絡(luò)的判別能力。其框架圖如圖3。
圖3 GAN框架圖Figure 3 GAN frame diagram
GAN的損失函數(shù)包括兩個(gè)部分,即生成器的損失函數(shù)和判別器的損失函數(shù)[8]。生成器的損失函數(shù)是由生成器生成的虛假數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的差異計(jì)算而來,判別器的損失函數(shù)是由判別器將虛假數(shù)據(jù)和真實(shí)數(shù)據(jù)分開的能力計(jì)算而來。GAN的核心目標(biāo)是通過最小化這兩個(gè)損失函數(shù)來實(shí)現(xiàn)生成器生成更加真實(shí)的數(shù)據(jù)。GAN的損失函數(shù)如下:
LGAN(G,D)=EX~Pdata(x)[logD(X)]+
EZ~Pz(z)[log(1-D(g(z)))]。
(3)
式(3)中,D表示判別器網(wǎng)絡(luò),G表示生成器網(wǎng)絡(luò),D(x)表示判別器D對一個(gè)原始樣本的評分,D(g(z))表示判別器D一個(gè)生成樣本的概率;Pdata表示生成樣本的概率分布,Pdata表示原始數(shù)據(jù)的概率分布。在訓(xùn)練過程中,將判別器網(wǎng)絡(luò)損失函數(shù)值進(jìn)行最大化,將生成器網(wǎng)絡(luò)損失函數(shù)值進(jìn)行最小化。
CNN是一種前饋神經(jīng)網(wǎng)絡(luò),廣泛用于圖像識別任務(wù)中。CNN的核心內(nèi)容是卷積層和池化層,這兩個(gè)層次可以有效地提取圖像的特征[9]。卷積層可以將原始圖像轉(zhuǎn)換為一組特征圖,每個(gè)特征圖都可以捕獲圖像的不同特征。池化層可以對特征圖進(jìn)行降采樣操作,從而減少特征的數(shù)量,同時(shí)保留最重要的特征。其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖4。
圖4 CNN網(wǎng)絡(luò)結(jié)構(gòu)圖Figure 4 CNN network structure diagram
CNN通過卷積層、池化層和全連接層等模塊提取輸入數(shù)據(jù)的特征,再通過softmax分類器實(shí)現(xiàn)分類[10]。CNN的核心模塊是卷積層,卷積層通過滑動(dòng)卷積核對輸入數(shù)據(jù)進(jìn)行卷積操作,提取數(shù)據(jù)的空間特征。池化層通過對輸入數(shù)據(jù)進(jìn)行降采樣操作,減小數(shù)據(jù)維度和參數(shù)數(shù)量,防止過度擬合。全連接層將特征映射到類別概率分布上,實(shí)現(xiàn)分類。CNN的核心目標(biāo)是通過學(xué)習(xí)卷積核和權(quán)重來最大化分類準(zhǔn)確率。CNN的訓(xùn)練過程是通過反向傳播算法來優(yōu)化損失函數(shù),以調(diào)整卷積核和權(quán)重的值。CNN的損失函數(shù)通常采用交叉熵?fù)p失函數(shù),如下:
(4)
式(4)中,θ表示CNN的參數(shù),N表示數(shù)據(jù)樣本數(shù)量,M表示類別數(shù)量,yij表示第i個(gè)樣本的真實(shí)標(biāo)簽,pij表示CNN預(yù)測為第j類的概率。
本文提出了一種優(yōu)化的GAN-CNN模型,將GAN和CNN的優(yōu)勢結(jié)合起來,實(shí)現(xiàn)對電子血壓計(jì)品牌型號的精準(zhǔn)識別。該模型由GAN和CNN兩部分組成,其中GAN用于提取電子血壓計(jì)圖片的結(jié)構(gòu)信息和全局特征,CNN用于提取圖片的局部特征。具體來說,首先使用GAN學(xué)習(xí)每個(gè)血壓計(jì)圖像的特征表示,然后將這些特征表示作為CNN的輸入,以進(jìn)一步提取特征。最后,使用多層感知器(multilayer perceptron,MLP)進(jìn)行分類。GAN-CNN模型的核心內(nèi)容是將GAN模型作為CNN模型的輔助模塊,以增強(qiáng)CNN模型的特征提取能力[11]。GAN模型的生成器可以生成更多的樣本,使得CNN模型訓(xùn)練更加穩(wěn)健,以提高識別準(zhǔn)確率。具體地,GAN模型的生成器G生成與真實(shí)樣本分布相似的假樣本,判別器D用于判斷樣本是真實(shí)樣本還是假樣本。GAN模型的訓(xùn)練目標(biāo)是最小化生成器和判別器的損失函數(shù),使得生成器生成的假樣本能夠騙過判別器,同時(shí)判別器能夠準(zhǔn)確判斷真假樣本。
GAN-CNN模型結(jié)構(gòu)如圖5。其中,第一層是GAN,用于學(xué)習(xí)每個(gè)血壓計(jì)圖像的特征表示。第二層是CNN,用于進(jìn)一步提取特征。第三層是MLP,用于分類。
圖5 GAN-CNN模型結(jié)構(gòu)圖Figure5 GAN-CNN model structure diagram
GAN-CNN模型訓(xùn)練的主要流程如下:對數(shù)據(jù)進(jìn)行預(yù)處理,包括讀取數(shù)據(jù)、劃分?jǐn)?shù)據(jù)集和圖像預(yù)處理等操作。GAN模型的訓(xùn)練旨在最小化生成器生成的偽造圖像與真實(shí)圖像之間的差異[12]。在生成器和判別器訓(xùn)練完成后,將生成器的權(quán)重固定,將判別器的輸出作為特征提取器,用于提取真實(shí)圖像和偽造圖像的特征。CNN模型的輸入是經(jīng)過預(yù)處理后的圖像,輸出是圖像所屬的電子血壓計(jì)品牌和型號。CNN模型的訓(xùn)練旨在最小化預(yù)測結(jié)果與真實(shí)結(jié)果之間的差異。GAN-CNN模型實(shí)現(xiàn)參數(shù)如表2。
表2 GAN-CNN模型參數(shù)
在聯(lián)合訓(xùn)練GAN-CNN模型步驟中,使用經(jīng)過預(yù)處理的圖像作為GAN模型的輸入,使用CNN模型的輸出作為GAN模型的損失函數(shù)。這樣,GAN模型就可以生成更加適合CNN模型的偽造圖像,以提高CNN模型的性能。同時(shí),CNN模型也可以提供更加準(zhǔn)確的損失函數(shù),以優(yōu)化GAN模型。參考公式如下:
生成器損失函數(shù):
(5)
判別器損失函數(shù):
(6)
交叉熵?fù)p失函數(shù):
(7)
本文通過GAN處理生成的增強(qiáng)數(shù)據(jù)集,將訓(xùn)練集數(shù)據(jù)輸入CNN中進(jìn)行訓(xùn)練,卷積層通過計(jì)算輸入變量的乘積和來提取特征,ReLU用于引入卷積網(wǎng)絡(luò)的非線性,引入最大池化層來減小卷積數(shù)據(jù)的空間大小。然后,引入一個(gè)全連通層來學(xué)習(xí)高級特征的非線性組合,通過輸出層采用了交叉熵?fù)p失函數(shù)識別電子血壓計(jì)品牌型號。其中卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置如表3。
表3 CNN參數(shù)設(shè)置
在預(yù)處理完成后,將數(shù)據(jù)集分成三部分:70%用于訓(xùn)練,10%用于驗(yàn)證,20%用于測試。在訓(xùn)練過程中,采用交叉熵作為損失函數(shù),使用Adam優(yōu)化器來更新模型參數(shù)[13]。使用PyTorch框架實(shí)現(xiàn)了GAN-CNN模型并在NVIDIA TITAN Xp GPU上訓(xùn)練模型。為了標(biāo)識不同電子血壓計(jì)的品牌和型號,在模型中使用了一個(gè)one-hot編碼的向量[14]。假設(shè)有n個(gè)品牌和m個(gè)型號,則電子血壓計(jì)的品牌和型號將分別用n維和m維的向量表示。模型的輸出為兩個(gè)向量,一個(gè)用于品牌的預(yù)測,另一個(gè)用于型號的預(yù)測。在訓(xùn)練、驗(yàn)證和測試時(shí),將模型的預(yù)測結(jié)果轉(zhuǎn)換為品牌和型號的標(biāo)簽,并計(jì)算準(zhǔn)確率和相對誤差來評估模型的性能。
本文使用工業(yè)相機(jī)、計(jì)算機(jī)、環(huán)形光源、數(shù)據(jù)存儲系統(tǒng)和模式識別算法搭建一個(gè)電子血壓計(jì)品牌型號識別系統(tǒng)去驗(yàn)證GAN-CNN模型的識別效果,如圖6。
圖6 GAN-CNN模型實(shí)驗(yàn)平臺Figure 6 GAN-CNN model experiment platform
實(shí)驗(yàn)采用了Python編程語言和TensorFlow深度學(xué)習(xí)框架,運(yùn)行環(huán)境為Windows 10操作系統(tǒng),CPU為Intel Core i7-9700K,GPU為NVIDIA GeForce RTX 2080 Ti。模型訓(xùn)練配置信息如表4。
表4 模型訓(xùn)練配置信息
在模型訓(xùn)練過程中使用了驗(yàn)證集來調(diào)整模型的超參數(shù),例如學(xué)習(xí)率、判別器和生成器的層數(shù)等。
在每個(gè)訓(xùn)練周期結(jié)束后,使用驗(yàn)證集來評估模型的性能,然后根據(jù)性能指標(biāo)來調(diào)整超參數(shù),以提高模型的準(zhǔn)確率和魯棒性。使用的是Adam優(yōu)化器來訓(xùn)練GAN-CNN模型,并設(shè)置初始學(xué)習(xí)率為0.000 2。在訓(xùn)練過程中,使用批量大小為32的隨機(jī)梯度下降算法進(jìn)行參數(shù)更新。每個(gè)訓(xùn)練周期的總迭代次數(shù)為10 000次,訓(xùn)練過程中使用了數(shù)據(jù)增強(qiáng)技術(shù),如隨機(jī)裁剪、翻轉(zhuǎn)和旋轉(zhuǎn)等。
在驗(yàn)證集上的最佳結(jié)果是在第15個(gè)訓(xùn)練周期時(shí)獲得的,此時(shí)模型的準(zhǔn)確率為95.3%。經(jīng)過實(shí)驗(yàn)測試,使用驗(yàn)證集調(diào)整超參數(shù)可以更好地優(yōu)化模型,提高模型的準(zhǔn)確率和魯棒性。同時(shí),采用驗(yàn)證集還可以避免過擬合的情況發(fā)生,提高模型的泛化能力。表5列出了模型訓(xùn)練過程中的超參數(shù)設(shè)置和實(shí)驗(yàn)結(jié)果。
表5 超參數(shù)設(shè)置情況
在訓(xùn)練GAN-CNN模型的過程中,采用了10%的數(shù)據(jù)作為驗(yàn)證集,并使用驗(yàn)證集來調(diào)整模型的超參數(shù)[15]。這樣可以幫助更好地優(yōu)化模型,提高模型的準(zhǔn)確率和魯棒性,同時(shí)避免過擬合的發(fā)生。
本文將GAN-CNN模型應(yīng)用于電子血壓計(jì)品牌型號識別,首先,將電子血壓計(jì)正面不同角度圖片輸入GAN進(jìn)行預(yù)處理,得到一個(gè)拓展數(shù)據(jù)集,對于數(shù)據(jù)集按照7∶1∶2比例劃分訓(xùn)練集、驗(yàn)證集和測試集。之后將劃分好的數(shù)據(jù)集數(shù)據(jù)輸入CNN模型進(jìn)行訓(xùn)練識別。為了更好地展現(xiàn)該方法的識別效果,使用同樣的數(shù)據(jù)集,將該方法與SVM、RF、MLP、ResNet、VGG16、MobileNe、CNN等多種方法進(jìn)行對比實(shí)驗(yàn)。同時(shí),也進(jìn)行了消融實(shí)驗(yàn),驗(yàn)證GAN和CNN的相互補(bǔ)充作用。另外,對也探究了不同超參數(shù)對GAN-CNN模型的影響。通過與市面上傳統(tǒng)的機(jī)器視覺識別算法和現(xiàn)在比較常用的深度學(xué)習(xí)模型分別進(jìn)行對比實(shí)驗(yàn),同時(shí)對GAN與CNN模型組合效果的探究和對組合模型不同超參數(shù)影響大小的實(shí)驗(yàn),得出GAN-CNN算法模型高準(zhǔn)確性和穩(wěn)健性的結(jié)論。與傳統(tǒng)機(jī)器視覺算法模型識別表現(xiàn)對比結(jié)果如表6。
表6 與傳統(tǒng)機(jī)器視覺算法模型識別表現(xiàn)對比
表6顯示了使用SVM、RF、MLP、GAN-CNN算法進(jìn)行品牌識別的準(zhǔn)確率和誤差率。其中MLP、GAN-CNN算法識別準(zhǔn)確度都達(dá)到90%以上。并且GAN-CNN算法實(shí)現(xiàn)了94.7%的品牌型號識別準(zhǔn)確度,明顯優(yōu)于傳統(tǒng)機(jī)器視覺算法模型,這表明GAN-CNN模型可以更好地提取特征,并且能夠有效地識別電子血壓計(jì)品牌型號。
接下來,對比了GAN-CNN模型和其他常見的深度學(xué)習(xí)算法在電子血壓計(jì)品牌型號識別任務(wù)上的表現(xiàn),包括ResNet、VGG16、MobileNet和CNN。具體的結(jié)果如表7。
表7 與常見深度學(xué)習(xí)模型識別表現(xiàn)對比
結(jié)果顯示,GAN-CNN模型的準(zhǔn)確率達(dá)到了95.1%,而傳統(tǒng)的CNN模型的準(zhǔn)確率為91.5%。這表明GAN-CNN模型可以更好地提取特征,并且能夠有效地識別電子血壓計(jì)品牌型號。其次,比較了GAN-CNN模型和ResNet、VGG16和MobileNet模型在品牌型號識別任務(wù)上的表現(xiàn)。結(jié)果顯示,GAN-CNN模型在參數(shù)數(shù)量較少的前提下品牌型號識別任務(wù)上都高于這些模型。這表明GAN-CNN模型在電子血壓計(jì)識別任務(wù)上具有更好的性能和魯棒性。
為了驗(yàn)證GAN-CNN模型的有效性和穩(wěn)健性,進(jìn)行了消融實(shí)驗(yàn),分別考察了GAN成分和CNN成分對模型性能的影響。分別移除GAN組件和CNN組件,重新訓(xùn)練模型,并在測試集上進(jìn)行了準(zhǔn)確率的測試。實(shí)驗(yàn)結(jié)果如表8。
表8 GAN-CNN模型的消融實(shí)驗(yàn)
通過上表的數(shù)據(jù)可以看出,僅使用CNN的準(zhǔn)確率為92.4%,僅使用GAN的準(zhǔn)確率為88.5%,而使用GAN-CNN的準(zhǔn)確率提高到了95.7%。因此可以得出結(jié)論:GAN對于CNN模型的訓(xùn)練是具有重要作用的,同時(shí)GAN和CNN的結(jié)合可以顯著提高模型的準(zhǔn)確率。
在探究不同超參數(shù)對GAN-CNN模型性能的影響的實(shí)驗(yàn)中,我們通過改變判別器和生成器層的數(shù)量以及學(xué)習(xí)率,測試了不同的超參數(shù)組合對模型的影響。實(shí)驗(yàn)結(jié)果數(shù)據(jù)如表9。
表9 不同超參數(shù)對GAN-CNN模型性能的影響
從上表可以看出,最優(yōu)的超參數(shù)組合為4個(gè)判別器層、4個(gè)生成器層和學(xué)習(xí)率為0.000 2。在這個(gè)超參數(shù)組合下,模型在訓(xùn)練集、驗(yàn)證集和測試集上都獲得了最高的準(zhǔn)確率,分別為95.2%、94.8%和94.5%。如果再增加超參數(shù)的層數(shù)、學(xué)習(xí)率會使模型計(jì)算量增大,識別效果達(dá)不到最佳。通過實(shí)驗(yàn)結(jié)果分析,可以得出結(jié)論:選擇合適的超參數(shù)可以進(jìn)一步提高模型的準(zhǔn)確率。
綜上所述,實(shí)驗(yàn)結(jié)果表明,所提出的GAN-CNN算法在電子血壓計(jì)的品牌型號識別精度方面優(yōu)于其他算法。GAN與CNN結(jié)合使用可以提高電子血壓計(jì)的識別精度。
本文基于GAN-CNN的電子血壓計(jì)品牌型號識別技術(shù)研究,采用了GAN和CNN模型相結(jié)合的方法,并通過參數(shù)優(yōu)化,得到了最佳的GAN-CNN模型。實(shí)驗(yàn)結(jié)果表明,GAN-CNN模型的識別準(zhǔn)確率高達(dá)94.7%以上,明顯高于其他單一模型,且在不同品牌型號的電子血壓計(jì)識別中都取得了較好的效果。這證明了GAN-CNN模型在電子血壓計(jì)品牌型號識別方面有如下的優(yōu)勢。
1)增強(qiáng)數(shù)據(jù)的多樣性和真實(shí)性:GAN模型可以生成逼真的電子血壓計(jì)圖像數(shù)據(jù),可以有效地?cái)U(kuò)展數(shù)據(jù)集,提高數(shù)據(jù)的多樣性和真實(shí)性,從而提高模型的泛化能力。
2)學(xué)習(xí)特征的有效性:GAN-CNN模型可以通過對真實(shí)數(shù)據(jù)和生成數(shù)據(jù)的訓(xùn)練來學(xué)習(xí)有效的特征表示,從而提高識別性能。
3)局部和全局信息綜合性:GAN-CNN模型使用CNN模型提取局部特征和GAN模型提取全局特征,通過融合兩種特征來提高識別準(zhǔn)確率。
未來,可以進(jìn)一步探索GAN-CNN模型在其他圖像識別任務(wù)中的應(yīng)用,如醫(yī)學(xué)圖像分析、自然圖像處理等領(lǐng)域。同時(shí),也可以考慮引入更多的深度學(xué)習(xí)技術(shù),如Attention機(jī)制、Capsule網(wǎng)絡(luò)等,進(jìn)一步提升模型性能。