祝小惟,萬 鵬,張道強,程 樂,王 毅
(1.南京航空航天大學(xué)計算機科學(xué)與技術(shù)學(xué)院,南京 211106;2.南京鼓樓醫(yī)院醫(yī)學(xué)影像科,南京 210008;3.南京鼓樓醫(yī)院神經(jīng)外科,南京 210008)
腦出血是一種發(fā)生在顱內(nèi)的原發(fā)性腦實質(zhì)內(nèi)出血,發(fā)生后1 個月內(nèi)死亡率可達40%[1],所以盡早有效治療至關(guān)重要。門急診中主要基于非造影劑增強的頭部CT 掃描成像進行腦出血的診斷工作,且依賴放射科醫(yī)生的閱片過程,這一重復(fù)且重要的步驟要求醫(yī)生具有相當(dāng)程度的專業(yè)知識、豐富的經(jīng)驗以及一定的速度和效率。因此隨著計算機技術(shù)和人工智能方法的不斷發(fā)展,希望能將機器學(xué)習(xí)和深度學(xué)習(xí)方法應(yīng)用于醫(yī)學(xué)影像上,對醫(yī)生的診療工作進行輔助,對病癥快速準確地識別以便盡快開始治療。
值得注意的是,人工智能在臨床醫(yī)學(xué)中的應(yīng)用存在許多問題。首先患者腦CT 影像中亮度不同程度衰減的現(xiàn)象[2]和腦出血多種類型的存在,為腦出血的自動化識別帶來了挑戰(zhàn)[3]。另外,智能診斷的方法不同于醫(yī)生的診斷,作為黑箱模型存在可信度的局限,因此考慮到實際應(yīng)用,需要提高模型的可解釋性,為診斷結(jié)果提供依據(jù),同時方便醫(yī)生對結(jié)果的正確性進行檢查。更重要的是,臨床上漏檢的腦出血將可能帶來加重病情貽誤治療時機等嚴重的后果,也就是說,對于計算機輔助得到的結(jié)果,假陰性將產(chǎn)生比假陽性的結(jié)果更大的危害,這種代價的不平衡也是醫(yī)學(xué)問題中一大特點。因此實際應(yīng)用時除了一般地要求模型方法具有一定程度的準確性,尤其更要盡可能減少漏檢的發(fā)生,也即更加注重提升模型的敏感性。目前,許多前沿方法已被越來越多地應(yīng)用在腦出血疾病中,基于CT 圖像的腦出血智能篩檢的方式和途徑主要包括直接給出有無出血或出血類型診斷結(jié)果,以及對出血區(qū)域提取和分割等。
在進行直接診斷的方法中,Dawud 等[4]基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)、AlexNet、AlexNet-SVM 三種深度學(xué)習(xí)模型將含有多種類型腦出血的CT 圖像分為正常和出血兩類,并證明了在遷移學(xué)習(xí)中從自然圖像到醫(yī)學(xué)圖像分類的知識轉(zhuǎn)移是可行的;Togacar 等[5]通過自動編碼器從原始數(shù)據(jù)集生成新的數(shù)據(jù)集,熱力圖處理并擴充后利用AlexNet 和SVM 分類器區(qū)分出包含出血的圖像;Grewal 等[6]分析了三維的掃描級腦CT 圖像數(shù)據(jù),在斷層圖像中關(guān)注有出血潛力的區(qū)域后,利用長短時記憶整合相鄰圖像中的上下文信息得到診斷結(jié)果;而Arbabshirani 等[7]基于大型的頭部CT 研究臨床數(shù)據(jù)庫開發(fā)了一個三維CNN 模型,分析掃描級的CT 影像數(shù)據(jù)來識別腦出血,在臨床中對放射學(xué)工作列表進行排序,顯著減少了門診腦出血的平均診斷時間,優(yōu)化了放射科的工作流程;Menon 等[8]基于Inception V3 和DenseNet 模型診斷腦出血的發(fā)生,并設(shè)計特殊的窗口技術(shù)對相對較小的出血進行關(guān)注,取得了良好的效果。在識別多出血類型方面,Hu 等[9]提出一種植入灰度共生矩陣(Gray level co-occurrence matrix,GLCM)的CNN 模型,從感興趣區(qū)域生成固定大小的GLCM 圖像,與原始圖像共同通過CNN 模型提取特征,增加網(wǎng)絡(luò)對重要病變區(qū)域的關(guān)注;而Le 等[10]則先對原始的DICOM 數(shù)據(jù)設(shè)置特定的窗口,對生成的圖像進行邊界框標記,并分別訓(xùn)練Faster R-CNN 和R-FCN 兩種模型來檢測4種類型的腦出血;Mushtaq 等[11]在研究中利用CNN 對腦出血分類任務(wù)進行研究,并構(gòu)建了CNN+LSTM 和CNN+GRU 混合模型,關(guān)注小的不平衡數(shù)據(jù)集,使模型在現(xiàn)實應(yīng)用場景中能夠更好地識別多種腦出血的發(fā)生。
在對出血的具體區(qū)域進行識別分割的工作中,Singh 等[12]利用傳統(tǒng)方法進行顱內(nèi)出血區(qū)域的分割工作,改進距離正則化水平集進化算法,采用FCM 聚類初始化水平集函數(shù),獲得了較好的效果。Chang等[13]提出了一種二維與三維混合的DCNN 模型,基于Mask R-CNN 關(guān)注每個出血區(qū)域的分割和分類,并利用圖像周圍上下文信息,對不同類型的腦出血進行了檢測和量化。Hidayatullah 等[14]提出了一種快速自動分割CT 圖像的方法,通過圖像預(yù)處理消除圖像中的噪聲,使用傳統(tǒng)的分割方法將顱骨和腦組織分離,進一步分割出血區(qū)域,計算腦出血體積。Zhao 等[15]則利用了在生物醫(yī)學(xué)成像分割任務(wù)中表現(xiàn)良好的nnU-Net 建立分割網(wǎng)絡(luò)架構(gòu),通過分割出血邊界從而幫助進行腦出血及其亞型的識別和診斷。
目前已有工作考慮多種計算機輔助情形下的腦出血診斷問題,然而也存在著一些局限性。首先,對具體出血區(qū)域進行分割的方法往往意味著更大的數(shù)據(jù)標注工作量,為了得到更優(yōu)良的模型以及驗證模型分割是否精準,逐像素的邊界標注是十分消耗時間和精力的。對于相比之下更加便捷的直接分類方法來說,則不需要大量的復(fù)雜標記,但同時多數(shù)方法的診斷結(jié)果不如分割那么直觀,并且由于模型方法的黑箱特點,模型得到結(jié)果的過程和依據(jù)并不可視。而實際臨床應(yīng)用中模型對結(jié)果的解釋能力往往有很大的意義,增加結(jié)果的可信性,能夠為醫(yī)生基于診斷結(jié)果的進一步復(fù)核和細檢有所幫助。除此之外,目前關(guān)于腦出血疾病的工作普遍忽略了模型方法在疾病方面應(yīng)用中的代價敏感問題,這使得模型并不能夠很好地符合醫(yī)學(xué)場景。
考慮到綜上臨床應(yīng)用的特定需求,本文主要基于頭部CT 掃描得到的影像數(shù)據(jù)進行個體的腦部狀況判斷,利用目標檢測的方法對影像中的腦出血區(qū)域進行識別和提取,識別包含出血的斷層圖像。這樣可以直觀地在圖像中定位到有觀察價值的特定區(qū)域,幫助醫(yī)生快速鎖定CT 掃描中的關(guān)鍵圖像,并且提高醫(yī)生的效率,同時便于直接地進一步觀察到出血的范圍、形態(tài)和紋理等,方便醫(yī)生發(fā)現(xiàn)更細致的問題。同時模型方法得到有無腦出血發(fā)生的診斷結(jié)果下,顯示具體出血能為診斷結(jié)果提供解釋,使得結(jié)果更有依據(jù)和可信度。最終提出的代價敏感Faster R-CNN 方法,通過引入錨的前景背景比例自動化調(diào)節(jié)機制和帶有超參數(shù)的代價敏感損失函數(shù),使模型用于腦出血診斷時能夠更加警惕漏診情況的發(fā)生。為了提升模型的效果,在實驗中對原始數(shù)據(jù)集進行了處理,并針對檢測模型中錨的設(shè)計,采用一種聚類的方式來得到適當(dāng)?shù)某跏汲叽绱笮?。在基于多個網(wǎng)絡(luò)結(jié)構(gòu)和超參數(shù)進行實驗的基礎(chǔ)上,得到最終的應(yīng)用模型。在檢測和診斷多方面的指標考察下,該方法能夠從代價敏感的角度提升腦出血檢測效果,給出直觀可視的診斷依據(jù)和較為準確的診斷結(jié)果。
Faster R-CNN 模型[16]在基于自然圖像的檢測問題中被提出,用于解決自然場景下的實物目標檢測和識別問題,主要通過CNN、候選區(qū)域建議網(wǎng)絡(luò)(Region proposal network,RPN)、感興趣區(qū)域(Region of interest,ROI)池化層、以及框分類和回歸幾個部分共同實現(xiàn)。
CNN 對輸入圖像卷積以提取特征,生成的特征圖提供給RPN 部分,特征圖與原圖像存在映射關(guān)系。在輸入圖像每個位置生成9 個大小、形狀不同的錨,計算每個錨對應(yīng)包含目標的概率,再利用框回歸修正得到建議框。通過非極大值抑制算法(Non-maximum suppression,NMS)根據(jù)分類的得分對這些建議框進行排序,得分較高的建議框作為ROI 輸出。將每個ROI 分塊最大池化以統(tǒng)一區(qū)域特征的大小,通過全連接層后由Softmax 層計算每個目標建議框識別為目標的概率;同時利用邊界框回歸對目標建議框進行精確微調(diào),輸出檢測結(jié)果。
一方面,F(xiàn)aster R-CNN 模型作為基于CNN 的目標檢測方法,在提出區(qū)域建議的思想下利用RPN的設(shè)計大大提高了模型的效率,尤其在醫(yī)學(xué)領(lǐng)域的應(yīng)用中有著實用意義。另一方面,自然場景下的模型方法也常應(yīng)用于醫(yī)學(xué)圖像以診斷各類疾病,說明醫(yī)學(xué)圖像中的特征能夠通過模型進行較為充分的提取。綜上,本文采取Faster R-CNN 檢測模型作為診斷方法的基礎(chǔ)。
本節(jié)設(shè)計代價敏感的Faster R-CNN 方法,說明其中改進方法細節(jié)處理,以及如何基于此方法實現(xiàn)對腦出血的智能診斷,圖1 展示了模型的結(jié)構(gòu)。
圖1 用于腦出血檢測的代價敏感Faster R-CNN 模型結(jié)構(gòu)Fig.1 Architecture of cost-sensitive Faster R-CNN for the detection of ICH
在模型的RPN 層中錨的設(shè)計是檢測的基礎(chǔ)。以一個點為中心,基于3 種不同的長寬比和3 種不同的尺度,共有9 種組合方式對應(yīng)生成9 個尺寸的錨,而長寬比和縮放尺度的適當(dāng)選取,將對檢測效果和框定區(qū)域準確度的提高有所幫助。
考慮到實際CT 圖像中的腦出血區(qū)域形態(tài)各異,長寬比上有很大的不同,尺度上也有較大差異,因此在訓(xùn)練集上提取所有標注框的長寬比和面積值,分別對這兩個方面進行聚類,通過K-means 方法在每個方面分別得到3 個聚類中心,即最終通過3 種長寬比和3 個面積值形成針對腦出血區(qū)域尺寸特點的9 種錨。
訓(xùn)練RPN 網(wǎng)絡(luò)時,通過錨生成機制得到的多個錨將與真實圖像中的標記框做交并比(Intersection-over-union,IoU)計算,如果IoU>0.7 則認為當(dāng)前錨為前景樣本,即RPN 網(wǎng)絡(luò)訓(xùn)練中的陽性樣本,如果IoU<0.3 則認為當(dāng)前錨為背景樣本,即陰性樣本,對初篩出的樣本進行NMS 算法篩選,得到實際訓(xùn)練需要的N個樣本。初始兩類樣本比例設(shè)為1∶1,即在一張圖像中隨機抽取的陽性樣本和陰性樣本數(shù)量相同。
考慮到問題的代價敏感性,更多的陽性樣本有利于訓(xùn)練模型識別目標出血區(qū)域并減少漏檢的能力。因此在訓(xùn)練集中考慮適當(dāng)提高陽性樣本的比例,并且希望根據(jù)模型當(dāng)前檢測能力自動在一定區(qū)間范圍內(nèi)調(diào)整比例。設(shè)當(dāng)前圖像陽性樣本數(shù)Nif和陰性樣本數(shù)Nib表達式分別為
式中:i為當(dāng)前圖像索引;ki為此圖像中陽性樣本與陰性樣本的比值,且1 ≤ki≤R,R≥1;N為一張圖像中總樣本數(shù)。其中ki的更新策略為
式中:j為當(dāng)前圖像中所有錨樣本的索引;pij表示錨預(yù)測為目標的概率;表示實際標簽,當(dāng)樣本為陽性樣本時取1,否則為0。通過自動化更新錨樣本比例的策略,使得模型在訓(xùn)練時能夠根據(jù)在陽性樣本上的訓(xùn)練情況選擇接下來是否提高陽性樣本的占比。
代價敏感問題希望盡可能減少圖形中的漏檢情況,因此考慮在模型的損失函數(shù)中設(shè)計代價敏感損失,以增加對于模型未識別出陽性樣本情況的懲罰。
Faster R-CNN 模型整體包括兩大類損失,分別是RPN 部分產(chǎn)生的RPN 損失和分類回歸部分產(chǎn)生的損失稱為RCNN 損失,這兩個損失中又分別包括分類損失和回歸損失。分類損失由交叉熵來實現(xiàn),表達式為
式中:tij表示錨預(yù)測的框偏移量;表示錨實際的偏移量。
RPN 層的分類損失是針對樣本是否是目標產(chǎn)生的,而RCNN 損失中的分類損失是考慮檢測到的目標屬于哪一類,因此考慮對前者損失函數(shù)進行改進。通過引入超參數(shù)α,提高模型對陽性樣本的關(guān)注,增加陽性樣本漏檢帶來的損失,改進后的RPN 層分類損失函數(shù)為,表達式為
選取不同的超參數(shù)α的值,通過最小化相應(yīng)的具有代價敏感設(shè)計的損失函數(shù),訓(xùn)練針對醫(yī)學(xué)圖像檢測模型,考察模型在預(yù)留出來的驗證集上的結(jié)果,進行網(wǎng)格搜索選取合適的α值,得到最終的代價敏感Faster R-CNN 模型,后續(xù)在此α值上進行進一步的出血診斷。
利用有真實框標記的腦出血數(shù)據(jù)集訓(xùn)練代價敏感的Faster R-CNN 檢測模型,降低模型的損失使其收斂以提高模型性能。輸入顱腦CT 圖像,識別其中是否存在出血區(qū)域,檢測框可以定位到可能的出血,并給出其概率。選擇一個接受閾值θ,若檢測框的概率高于閾值,則決定認為框識別到了出血,在一張圖像中最終確定了一個或多個標記框,即模型識別到了一處或多處出血,則此CT 圖像分為陽性的一類,否則為正常即陰性的一類,因此該CT 圖像診斷結(jié)果Ytest表達式為
式中:yl代表圖像檢測結(jié)果中第l個檢測框概率;θ為接受閾值水平。
在模型給出診斷結(jié)果時,可以了解出血的具體位置和形態(tài),同時對于在不平衡代價下更關(guān)注漏檢情況的模型,給出模型的感興趣區(qū)域能夠快速識別其中的假陽性。
本節(jié)使用代價敏感的Faster R-CNN 模型,在實際采集的含有腦出血的CT 影像數(shù)據(jù)集上進行實驗,相關(guān)的實驗環(huán)境為Ubuntu16.04LTS 操作系統(tǒng),GPU 型號為NVIDIA GeForce GTX Titan X,使用深度學(xué)習(xí)框架Tensorflow1.10.0。
本文CT 圖像數(shù)據(jù)來自南京鼓樓醫(yī)院醫(yī)學(xué)影像科,使用的CT 掃描儀廠商是飛利浦,掃描得到的圖像大小為512 像素×512 像素,層厚6 mm,層距6 mm。收集了100 個腦出血病人的顱腦非增強CT 斷層圖像進行研究,每個病例由高年資專科醫(yī)師篩選出較有意義的16 張圖像。對于每張圖像首先使用MicroDicom 軟件[17]讀取DICOM 格式,根據(jù)相關(guān)研究[18]以及專家經(jīng)驗和建議選取窗位WL為50,窗寬WW為100,在這個水平下將DICOM 轉(zhuǎn)換為日常通用的PNG 圖像格式以便后續(xù)處理。然后由專家對此1 600 張圖像做數(shù)據(jù)標注,通過LabelImg 軟件[19]對圖像中的腦出血區(qū)域添加標記框,根據(jù)PASCAL VOC數(shù)據(jù)集格式寫成XML 文件。關(guān)于數(shù)據(jù)集的制作,將全部1 600 張圖像隨機抽取50%作為訓(xùn)練集,20%作為驗證集以及30%作為測試集,具體如表1 所示。由于樣本量相對較小,因此對訓(xùn)練集的部分進行數(shù)據(jù)擴充,通過平移和放縮的方式將樣本擴充至原來的4 倍。
表1 數(shù)據(jù)集劃分Table 1 Partition of dataset
對于本文使用的模型來說,數(shù)據(jù)集的規(guī)模較小,因此考慮應(yīng)用預(yù)訓(xùn)練模型,加快收斂速度并有效提高性能。對于自然場景下的Faster R-CNN 模型來說,大型數(shù)據(jù)集ImageNet 已經(jīng)被用于模型的預(yù)訓(xùn)練,同時Dawud 等[4]通過研究和對比試驗說明了自然圖像到醫(yī)學(xué)圖像的知識轉(zhuǎn)移是可能且有用的,故預(yù)訓(xùn)練后的模型也可以應(yīng)用于本文問題的研究。實驗中分別選取VGG16、ResNet50、Inception V3 三種特征提取網(wǎng)絡(luò),以選取在本問題中更為合適的網(wǎng)絡(luò)。在RPN 中,每張圖像選取中選取共256 個錨樣本用于訓(xùn)練,初始選取相同數(shù)量的前景和背景樣本分別作為檢測過程中的陽性樣本和陰性樣本。學(xué)習(xí)率預(yù)先設(shè)置為0.000 5,迭代次數(shù)為30 000,其中15 000 次迭代后,學(xué)習(xí)率降為0.000 1,使用隨機梯度下降的動量方法進行訓(xùn)練,動量值為0.9。
本文基于VGG16、ResNet50、Inception V3 三種特征提取網(wǎng)絡(luò)進行實驗,并對比了有無數(shù)據(jù)擴充和基于聚類的錨生成機制對檢測結(jié)果的影響,多次實驗的mAP 平均水平統(tǒng)計情況如圖2 所示。通過對比可以發(fā)現(xiàn),針對本檢測問題表現(xiàn)效果更好的是ResNet50 網(wǎng)絡(luò),后續(xù)實驗基于此網(wǎng)絡(luò)結(jié)構(gòu)進行。同時結(jié)果表明,進行了數(shù)據(jù)擴充處理和基于聚類方法生成錨后,在3 種網(wǎng)絡(luò)結(jié)構(gòu)上均表現(xiàn)出了mAP 水平提升,說明兩種方法處理的有效性。
圖2 不同網(wǎng)絡(luò)下的Faster R-CNN 不同方法處理的mAP 檢測指標結(jié)果Fig.2 Results of mAP with different methods of Faster R-CNN under different networks
通過實驗固定了特征提取的網(wǎng)絡(luò)結(jié)構(gòu)后,考察代價敏感Faster R-CNN 方法的檢測效果,其中為特定損失中的超參數(shù)α取不同的值,其對應(yīng)的mAP 指標變化以及與非代價敏感設(shè)計方法的結(jié)果對比如圖3 所示。從圖中可以發(fā)現(xiàn),隨著α取值的不同,代價敏感方法的檢測效果也不同,并且整體水平要高于原模型。其中在α=100 時驗證集上表現(xiàn)最好。整體表現(xiàn)說明代價敏感設(shè)計使得整體模型能夠在識別腦出血區(qū)域時更關(guān)注漏檢,通過對出血區(qū)域更敏感的角度提高檢測能力。
圖3 不同超參數(shù)α 下代價敏感模型與原模型在mAP 指標上的結(jié)果對比Fig.3 Performance comparison between cost-sensitive method and baseline on mAP based on different α
選擇超參α為100 在測試集上進行出血區(qū)域的識別,進而依據(jù)檢測的結(jié)果給出基于圖像級別的出血診斷,與原始Faster R-CNN 以及其他依賴于深度學(xué)習(xí)的診斷方法結(jié)果進行比較。Phong 等[20]在研究中對比了LeNet、GoogLeNet 和Inception ResNet 三種深度學(xué)習(xí)架構(gòu)在腦出血診斷的效果,證明了LeNet 在精度和時間上都要優(yōu)于后兩者。同時Dawud 等[4]和Togacar等[5]在關(guān)于腦出血診斷的研究中均使用了AlexNet,并取得了很好的結(jié)果。Menon 等[8]針對腦出血檢測任務(wù)中利用DenseNet 模型進行研究,并對相對較小的出血進行關(guān)注,取得良好的效果。而Mushtaq 等[11]在研究中利用CNN 構(gòu)建了BHCNet 模型,基于CT 掃描對腦出血進行分類,通過關(guān)注小的不平衡數(shù)據(jù)集,使模型具有良好的識別能力。因此本文選用LeNet、AlexNet、DenseNet 和BHCNet 與基于原Faster R-CNN的診斷方法進行對比實驗,在準確率、召回率和精度這3 種分類指標下的結(jié)果如圖4 所示。
圖4 不同檢測框概率閾值下不同模型與代價敏感方法的腦出血診斷結(jié)果對比Fig.4 Comparison of ICH diagnosis results between different models and cost sensitive method with different probability thresholds of bounding box
對于依據(jù)檢測框的診斷來說,當(dāng)閾值選擇越大,被判定為出血區(qū)域越嚴格,而當(dāng)閾值選擇越小,概率相對來說較低的區(qū)域容易被判定為出血,因此閾值的選擇會對最終的結(jié)果有影響。從圖4 中可以發(fā)現(xiàn),整體上代價敏感的方法效果優(yōu)于以普通Faster R-CNN 實現(xiàn)的診斷模型、AlexNet 模型、LeNet 模型以及DenseNet 模型。在分類精度方面,可以發(fā)現(xiàn)BHCNet 模型與本文提出方法均有很好的表現(xiàn)。而從閾值對改進前后的模型在結(jié)果上的影響來看,通過更多關(guān)注漏檢的情況,本文提出方法可以在更小的犧牲準確率的同時達到更高的召回率。可見在選取合適的閾值水平下,代價敏感的Faster R-CNN 方法具有召回率方面的優(yōu)勢。實驗中,本文提出的模型在閾值選取為0.85 時表現(xiàn)最好,陽性病例分類的準確率為0.90,召回率為0.91,分類精度為0.92。
圖5 顯示了實驗中具體實例的出血區(qū)域檢測結(jié)果,以及基于0.85 的檢測框概率閾值的腦出血情況診斷。其中陽性樣本為1、2、7、8,陰性樣本為3、4、5、6,從圖中可以看出,在0.85 的閾值下,1 和2 分別以1.000 和0.995 的檢測框概率得到真陽性(TP)的診斷結(jié)果,3 和4 分別以0.224 和0.000 的檢測框概率得到假陽性(FP)的診斷結(jié)果,5 和6 分別以1.000 和0.856 的檢測框概率得到真陰性(TN)的診斷結(jié)果,7 和8 分別以0.778 和0.820 的檢測框概率得到假陰性(FN)的診斷結(jié)果。
圖5 閾值0.85 水平下檢測和診斷結(jié)果示例Fig.5 Examples of detection and diagnosis results at the threshold level of 0.85
為了使醫(yī)學(xué)圖像的智能診斷在臨床上實現(xiàn)更好的應(yīng)用,需要考慮疾病漏檢情況的嚴重性并盡量減少漏檢情況的發(fā)生,同時關(guān)心基于深度學(xué)習(xí)的模型方法所得結(jié)果的可信度和可視化問題。為此本文提出了基于腦CT 影像識別和診斷腦出血疾病的代價敏感Faster R-CNN 模型,該方法能夠在腦出血診斷中快速定位到圖像中的出血區(qū)域,能夠更好地使診斷的依據(jù)一目了然,更方便醫(yī)生進行基于此結(jié)果的細節(jié)檢查,提高醫(yī)生的工作效率。實驗結(jié)果表明,相較于原本的檢測模型和CNN 直接用于分類的方法,代價敏感的Faster R-CNN 可以取得更好的效果,降低漏檢的可能,具有一定的研究價值和現(xiàn)實意義。