丁維龍,丁 瀟,池凱凱,陳 琦,毛科技,2
(1.浙江工業(yè)大學(xué) 計算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023; 2.浙江康體匯科技有限公司,浙江 杭州 311215)
骨齡的評估在諸多領(lǐng)域中都有應(yīng)用,它可以直觀地反映人體的骨骼發(fā)育情況,是生物年齡的重要指標(biāo)。骨齡與個體的生長發(fā)育水平呈現(xiàn)出完全一致的關(guān)系[1],是評價生長發(fā)育情況的最可靠指標(biāo)[2-4]。骨齡也可以用于司法領(lǐng)域(鑒定犯罪嫌疑人、受害者的年齡),為審判過程提供參考[5]。在了解青少年兒童實(shí)時生長發(fā)育情況和預(yù)測成年身高方面,骨齡的準(zhǔn)確評估都有著重要意義。目前,國際上評估骨齡的方法主要有通過對比手腕骨X光圖像與標(biāo)準(zhǔn)片的GP圖譜法[6],以及從手腕骨選出部分有代表性的骨塊,對每一塊骨骼評定分值后計算總分,再通過已制定的標(biāo)準(zhǔn)換算成對應(yīng)骨齡的TW3計分法[7]。其中GP圖譜法的精準(zhǔn)度較低且讀片時醫(yī)生的主觀性較強(qiáng),不同的人所得到的骨齡有所不同;TW3法有效降低了讀片時的主觀性,但在制定標(biāo)準(zhǔn)時均取樣自歐洲,對中國人的骨齡評估適用性還有待證明。在結(jié)合圖譜法和計分法基礎(chǔ)上,針對中國青少年兒童的生長發(fā)育情況,張紹巖等[8]制定了《中國人手腕骨發(fā)育標(biāo)準(zhǔn)CHN法》。在使用CHN法判定骨齡的過程中,需要判斷第三遠(yuǎn)節(jié)指骨、橈骨、鉤骨等14 塊骨塊的成熟等級,之后依照CHN法所制定的得分表,查表得到最終的骨齡[9]。傳統(tǒng)方法中,這一過程需要專業(yè)的醫(yī)生進(jìn)行人工讀片,醫(yī)生通過手腕骨X光片來確定14 塊骨塊的成熟等級,進(jìn)而經(jīng)計算得到骨齡。但是這一方法耗時較長,再加上讀片量大、專業(yè)醫(yī)生少的問題,使得人工讀片的工作量大且效率低下。目前較為成功的骨齡自動評估軟件是BoneXpert[10],它使用活動形狀模型(Active appearance model, AAM)來分割圖像,提取手腕骨邊緣,結(jié)合13 塊骨的形態(tài)、骨密度和紋理特征確定骨齡,但此方法對圖片質(zhì)量要求高且有年齡范圍限制。為提高骨齡評估效率,國內(nèi)外已經(jīng)出現(xiàn)了基于深度學(xué)習(xí)評估骨齡的方法[11-13]。針對不同種族、年齡,采用深度學(xué)習(xí)方法自動評估骨齡和專家評估年齡差異平均約為0.8 歲[14]。Iglovikov等[15]使用U-Net對圖像進(jìn)行分割,建立了關(guān)鍵點(diǎn)模型評價特定區(qū)域。王景樟[16]設(shè)計了一種基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)模型,免去了特征區(qū)域提取,但這一方法對整體的識別率提高作用有限,不利于個性化分析。Zhou等[17]利用深度卷積神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行分類,根據(jù)已有知識定義興趣區(qū)域,進(jìn)而通過VGG實(shí)現(xiàn)每個區(qū)域局部骨齡的分類模型。王永燦等[18]在研究中采用Faster R-CNN目標(biāo)檢測的方式來提取特征區(qū)域,進(jìn)而進(jìn)行骨齡階段識別。這些實(shí)驗均表明,卷積神經(jīng)網(wǎng)絡(luò)在骨齡評估上有一定的優(yōu)越性。通過多特征區(qū)域識別得到骨齡的分類是目前研究的主要分類方法。值得強(qiáng)調(diào)的是,目前區(qū)域的提取方式均是固定尺寸區(qū)域的,而手腕部的特征骨塊周圍有較多其他骨塊,采用固定區(qū)域提取的方式很容易帶來其他骨塊的干擾,進(jìn)而影響卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程。
針對手腕部骨塊復(fù)雜的情況,筆者提出了一種區(qū)域自適應(yīng)的提取方法,以減少周邊骨塊、肌肉組織帶來的干擾像素,從而更準(zhǔn)確地評估特征骨塊的成熟等級。為了使評估結(jié)果更能適用于中國青少年兒童,筆者采用CHN法作為判斷依據(jù)。鑒于鉤骨是CHN法中占有最大權(quán)重(男性:14.13%;女性:10.75%)的特征骨塊,橈骨也占有較大權(quán)重(男性:9.52%;女性:8.39%),同時它們的周邊其他骨塊也較多,識別難度較大,故在實(shí)驗過程中選取鉤骨和橈骨作為實(shí)驗對象,采用區(qū)域自適應(yīng)的方式提取出兩者的特征區(qū)域,進(jìn)而通過卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí),分別得到了87.83%和85.51%的骨成熟等級識別準(zhǔn)確率,從而驗證了該方法的可行性。
本實(shí)驗所使用的原始數(shù)據(jù)是X光機(jī)拍攝的全手部位的DICOM格式圖像。將DICOM格式圖像轉(zhuǎn)換為1 626×2 032的JPG格式圖像。同時記錄該圖像所屬兒童的身份、年齡和身高信息。另外,骨齡專家按照中國人手腕骨發(fā)育標(biāo)準(zhǔn)CHN法給出手腕骨中鉤骨和橈骨的成熟等級,并將所有信息保存在CSV格式的文件中。將圖片文件序號和標(biāo)簽序號進(jìn)行匹配,最終得到有效的標(biāo)簽圖片共8 876 張。
共制作兩份數(shù)據(jù)樣本集,一份996 張用于BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)鉤骨和橈骨自適應(yīng)提取區(qū)域的尺寸大小,一份7 880 張用于卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,以驗證自適應(yīng)提取區(qū)方法對特征手腕骨等級識別準(zhǔn)確率的影響。從上述所有數(shù)據(jù)樣本中取出一個小學(xué)的數(shù)據(jù)共996 張,涵蓋1~6 年級以確保身高以及年齡分布的均衡性。對996 張數(shù)據(jù)樣本進(jìn)行標(biāo)注,確定手腕骨中鉤骨、橈骨的幾何中心位置以及提取區(qū)域尺寸大小,對其按照等比例原則進(jìn)行劃分,共劃分出836 張用來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),余下160 張用來測試以評估所設(shè)計的尺寸大小自適應(yīng)提取方法的效果。
經(jīng)專家確認(rèn),剩余7 880 張有效圖片中共有7 230 張數(shù)據(jù)樣本可用作卷積神經(jīng)網(wǎng)絡(luò)對鉤骨成熟等級的判別訓(xùn)練和測試;7 880 張可用作卷積神經(jīng)網(wǎng)絡(luò)對橈骨成熟等級的判別訓(xùn)練和測試。在CHN法中,按照不同的指征,鉤骨的成熟等級共分為1~8共8 個等級,橈骨的成熟等級共分為1~10共10 個等級。鑒于本次使用樣本均來自于學(xué)校學(xué)生,年齡介于6~14 歲,故實(shí)驗樣本并不能完全覆蓋所有成熟等級,用于實(shí)驗樣本的鉤骨成熟等級分布為等級3到等級8,橈骨成熟等級分布為等級4到等級8,且樣本等級分布并不均勻,呈現(xiàn)出邊緣等級樣本數(shù)量少的特點(diǎn)。將各個等級的樣本按照8∶2的比例劃分出訓(xùn)練集和測試集,供卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練和測試,具體分布如表1,2所示。
表1 鉤骨各等級數(shù)據(jù)分布情況Table 1 Grade distribution of uncinate bone
表2 橈骨各等級數(shù)據(jù)分布情況Table 2 Grade distribution of radius
1.2.1 BP神經(jīng)網(wǎng)絡(luò)
1986年,以Rumelhart和Mc-Celland為首的科學(xué)家小組提出了BP(Back propagation)神經(jīng)網(wǎng)絡(luò),這是一種有誤差反向傳播機(jī)制的多層前饋網(wǎng)絡(luò)結(jié)構(gòu)。BP神經(jīng)網(wǎng)絡(luò)主要包含三層網(wǎng)絡(luò)結(jié)構(gòu),即輸入層、隱藏層和輸出層,在每一層網(wǎng)絡(luò)結(jié)構(gòu)里,處于同一層的神經(jīng)元之間沒有連接,與下一層的神經(jīng)元之間則采用全連接的方式相互連接。筆者采用三層網(wǎng)絡(luò)結(jié)構(gòu),其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Three-layer BP neural network structure
BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程主要是不斷更新各個神經(jīng)元間連接的權(quán)值,包括前向傳播過程和反向誤差傳播過程。文獻(xiàn)[19]給出了神經(jīng)網(wǎng)絡(luò)前向傳播過程的計算方法如下:
假設(shè)輸入層的神經(jīng)元i,隱藏層的第j個神經(jīng)元的輸入值Sj為
(1)
隱藏層的第j個神經(jīng)元的輸出值Bj為
(2)
輸出層的第k個神經(jīng)元的輸入值Sk為
(3)
輸出層的第k個神經(jīng)元的輸出值yk為
(4)
在誤差反向傳播過程中,如果輸出端得到的輸出值與期望的輸出值之間的差值大于已設(shè)定的誤差值,則誤差就反向傳播,更新調(diào)整神經(jīng)元間連接的權(quán)值、閾值。假設(shè)輸入輸出的樣本數(shù)為P,其中P∈{1,2,3,4,5,…},輸入樣本是xp,輸出樣本是yp,期望的輸出值是dp,則誤差信號Ep的計算式為
(5)
再對神經(jīng)元間連接的權(quán)值進(jìn)行迭代更新,即
(6)
式中η為學(xué)習(xí)率。這樣逐層修改每個神經(jīng)元間的連接權(quán)值,直至所有的權(quán)值都修改更新完畢,使誤差達(dá)到預(yù)先設(shè)定值,完成一次學(xué)習(xí)過程。BP神經(jīng)網(wǎng)絡(luò)就是通過不斷更新權(quán)值以及閾值的學(xué)習(xí)方式使系統(tǒng)精度不斷提高。
1.2.2 基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)骨骼圖片提取
根據(jù)CHN法判斷骨齡,鉤骨和橈骨在手腕骨所占權(quán)重較大,而鉤骨和橈骨所在位置周圍又有掌骨、頭狀骨、三角骨等手腕部骨骼。在訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)過程中,周圍骨塊會帶入過多干擾像素。為提高識別過程中鉤骨和橈骨的識別準(zhǔn)確率,筆者提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的自適應(yīng)骨塊特征區(qū)域提取方法??梢愿鶕?jù)手腕骨X光片所屬者的身高和年齡信息,得到與鉤骨、橈骨大小自適應(yīng)的提取區(qū)域(以長和寬兩個數(shù)值來刻畫),進(jìn)而提取出干擾像素少的特征骨塊圖片以供卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí),以提高圖像識別的準(zhǔn)確率。
基于BP神經(jīng)網(wǎng)絡(luò)的骨塊特征區(qū)域自適應(yīng)提取主要步驟為
1) 首先取第2節(jié)中所述的樣本圖片996 張,記錄其所屬者身高、年齡信息,以及能涵蓋全部鉤骨、橈骨骨塊的特征區(qū)域尺寸大小,將這些信息一一對應(yīng)。
2) 搭建BP神經(jīng)網(wǎng)絡(luò),輸入層的神經(jīng)元個數(shù)為2,隱藏層的神經(jīng)元個數(shù)為50,輸出層神經(jīng)元個數(shù)為2。
3) 將確定的836 個訓(xùn)練樣本集輸入BP神經(jīng)網(wǎng)絡(luò),確定期望的輸出目標(biāo)樣本,訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。使用剩余160 個樣本作為測試集,測試神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果,根據(jù)網(wǎng)絡(luò)輸出值與測試集的差別,調(diào)整參數(shù)。
4) 保存訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型參數(shù)。
5) 在全手的手腕骨X光圖片提取特征區(qū)域時,向模型傳入學(xué)生身高和年齡信息,得到鉤骨、橈骨的尺寸大小自適應(yīng)的提取區(qū)域,完成圖片的特征區(qū)域提取。
根據(jù)上述基于BP神經(jīng)網(wǎng)絡(luò)的鉤骨以及橈骨特征區(qū)域自適應(yīng)提取的方法,可以批量提取出數(shù)據(jù)樣本圖片的所有鉤骨、橈骨區(qū)域。提取后的每張圖片的大小由身高和年齡決定,尺寸各不相同,特征區(qū)域自適應(yīng)的提取效果如圖2所示。由圖2可知:提取出的鉤骨、橈骨特征區(qū)域圖片尺寸大小符合特征骨骨塊本身的大小,在保留全部識別特征的基礎(chǔ)上,盡可能地減少了周邊骨塊和肌肉組織帶來的干擾像素。
圖2 特征區(qū)域自適應(yīng)的提取效果Fig.2 Adaptive extraction of feature regions
1.2.3 搭建卷積神經(jīng)網(wǎng)絡(luò)用于鉤骨和橈骨等級識別
卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于圖像識別等領(lǐng)域的機(jī)器學(xué)習(xí)問題中[20-22],是一種具有多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),其典型結(jié)構(gòu)中擁有卷積層、池化層、全連接層。通過這樣的組合,可以使得數(shù)據(jù)量極大的圖像識別問題不斷降低維度,使計算機(jī)可以對其進(jìn)行訓(xùn)練學(xué)習(xí)。在卷積神經(jīng)網(wǎng)絡(luò)中,由卷積核進(jìn)行卷積,逐層提取圖像特征,并通過全連接層來完成圖像的分類工作。
筆者采用AlexNet網(wǎng)絡(luò)模型結(jié)構(gòu)進(jìn)行學(xué)習(xí)訓(xùn)練。AlexNet是由2012年的ImageNet競賽冠軍Alex Krizhevsky設(shè)計提出的[23]。AlexNet擁有8 層網(wǎng)絡(luò)深度,其中卷積層5 層,全連接層3 層(不包括LRN層和池化層),采用ReLU作為激活函數(shù),并使用Dropout技術(shù)避免過擬合。在每層的參數(shù)設(shè)置里,輸入尺寸是227×227,第一層卷積層的卷積核是11×11,步長是4,再接一層LRN,然后接核為3×3,步長為2的最大池化層。第二層卷積層的卷積核是5×5,步長是1;第三、四、五層卷積層的卷積核是3×3,步長是1,且每層卷積層后都接LRN層和核為3×3,步長為2的最大池化層,參數(shù)同上,最終輸出各個等級概率,并取概率最大的作為等級輸出,其結(jié)構(gòu)如表3所示。
表3 CNN模型結(jié)構(gòu)Table 3 Architecture of CNN model
為了驗證骨骼特征區(qū)域自適應(yīng)提取方法在實(shí)際骨齡自動評估應(yīng)用中的效果,采用Pytorch深度學(xué)習(xí)框架,使用卷積神經(jīng)網(wǎng)絡(luò)對鉤骨和橈骨的成熟等級進(jìn)行訓(xùn)練和學(xué)習(xí),并用得到的鉤骨以及橈骨的成熟等級識別模型對測試集中的數(shù)據(jù)進(jìn)行識別準(zhǔn)確率測試。比較了固定尺寸大小方式提取圖片、Faster R-CNN[24-25]目標(biāo)檢測方式提取圖片、YOLO-V3[26]提取圖片和筆者提出的基于BP神經(jīng)網(wǎng)絡(luò)的特征區(qū)域自適應(yīng)提取圖片的準(zhǔn)確率差異。
依照1.2.2節(jié)中的方法,使用訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)模型,批量傳入7 880 張數(shù)據(jù)樣本圖片,以及個體的身高和年齡信息,完成鉤骨、橈骨區(qū)域的自適應(yīng)提取。所得的鉤骨區(qū)域圖像中,最小的特征區(qū)域尺寸為90×120像素,最大的為150×192像素;橈骨區(qū)域圖像中,最小的特征區(qū)域尺寸為154×134像素,最大的為242×220像素,特征區(qū)域大小由每一個個體的數(shù)據(jù)決定,批量效果如圖3(a)所示。因不同身高、年齡的青少年兒童的手腕骨骨塊大小存在差異性,若采用統(tǒng)一固定大小的區(qū)域提取,為滿足保留全部骨塊所需的識別特征信息,則應(yīng)以尺寸較大的提取區(qū)域尺寸為統(tǒng)一尺寸,以保證全部特征信息的完整保留。在不考慮個體差異時,本實(shí)驗采用的鉤骨固定提取區(qū)域尺寸為180×180像素,橈骨固定提取區(qū)域尺寸為250×250像素,批量提取后的效果如圖3(b)所示。為進(jìn)一步驗證這一提取方式的可行性,筆者還采用了Faster R-CNN和YOLO-V3的方式自動檢測目標(biāo)骨塊的位置區(qū)域并作提取,批量提取的效果如圖3(c,d)所示。
圖3 特征區(qū)域批量提取效果Fig.3 Extraction of feature region
卷積神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,而本文的數(shù)據(jù)量有限,尤其是邊緣等級的缺少。在實(shí)際拍片過程中,會存在手腕部擺放不規(guī)范的問題,造成了手腕部X線片中的骨塊存在一定的斜率角度變化,產(chǎn)生重影等問題。針對實(shí)際X線片中可能存在的問題,采用數(shù)據(jù)增強(qiáng)技術(shù)可以保證模型針對這些情況也能有較高的識別準(zhǔn)確率,提高模型的魯棒性。同時數(shù)據(jù)增強(qiáng)技術(shù)也可以有效減少訓(xùn)練過程中出現(xiàn)的過擬合現(xiàn)象,降低模型對特征骨塊的部分特征的依賴性,進(jìn)而提高模型泛化能力。筆者對訓(xùn)練集數(shù)據(jù)使用了隨機(jī)旋轉(zhuǎn)、隨機(jī)平移和隨機(jī)中心裁剪的數(shù)據(jù)增強(qiáng)技術(shù)。輸入鉤骨圖片時,以圖片中心為原點(diǎn),首先進(jìn)行隨機(jī)角度旋轉(zhuǎn),旋轉(zhuǎn)角度α∈[-30°,30°];然后在水平或垂直的任意一個方向上進(jìn)行一次隨機(jī)平移,平移距離L為0~20像素;之后以原圖的中心點(diǎn)坐標(biāo)為中心進(jìn)行中心裁切,將圖片邊緣隨機(jī)裁去0~10像素;最后對圖片進(jìn)行填充并以圖像為中心進(jìn)行裁切使得大小為符合卷積神經(jīng)網(wǎng)絡(luò)輸入的227×227像素。由于橈骨圖像本身較大,為保留圖像信息,在圖像處理中的最后一步是使用中心裁切至280×280像素后再縮放為符合卷積神經(jīng)網(wǎng)絡(luò)輸入的227×227像素。在實(shí)驗中處理后的圖片如圖4所示,使用經(jīng)過數(shù)據(jù)增強(qiáng)處理后再讓卷積神經(jīng)網(wǎng)絡(luò)對其進(jìn)行訓(xùn)練學(xué)習(xí)。
使用1.1節(jié)中所述的數(shù)據(jù)樣本進(jìn)行訓(xùn)練學(xué)習(xí),鉤骨的訓(xùn)練集共5 882 張,測試集共1 348 張;橈骨的訓(xùn)練集共6 306 張,測試集共1 574 張。分別使用固定尺寸提取、Faster R-CNN目標(biāo)檢測提取、YOLO-V3提取和筆者所提出的特征區(qū)域自適應(yīng)方法提取的鉤骨、橈骨骨塊區(qū)域的圖像,使用1.2.3小節(jié)中搭建的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,并測試結(jié)果。本研究的整體測試框架結(jié)構(gòu)如圖5所示。
圖5 本研究的測試框架Fig.5 The experimental framework of this paper
訓(xùn)練學(xué)習(xí)模型后對測試集數(shù)據(jù)進(jìn)行測試,表4~7分別記錄了使用區(qū)域自適應(yīng)提取方法、固定尺寸提取方法、Faster R-CNN方法提取和YOLO-V3方法提取所得到的鉤骨成熟等級準(zhǔn)確率。表8~11記錄了橈骨在不同特征區(qū)域提取方法下的成熟等級準(zhǔn)確率測試結(jié)果。
表4 區(qū)域自適應(yīng)提取鉤骨的成熟等級測試準(zhǔn)確率
表5 固定尺寸提取鉤骨的成熟等級準(zhǔn)確率
表6 Faster R-CNN提取鉤骨的成熟等級準(zhǔn)確率
表7 YOLO-V3提取鉤骨的成熟等級準(zhǔn)確率
表8 區(qū)域自適應(yīng)提取橈骨的成熟等級測試準(zhǔn)確率
表9 固定尺寸提取橈骨的成熟等級準(zhǔn)確率
表10 Faster R-CNN提取橈骨的成熟等級準(zhǔn)確率
表11 YOLO-V3提取橈骨的成熟等級準(zhǔn)確率
由表4~7可知:采用區(qū)域自適應(yīng)提取方式所得到的鉤骨區(qū)域圖片的成熟等級判定綜合準(zhǔn)確率為87.83%,而采用固定尺寸提取方式,F(xiàn)aster R-CNN和YOLO-V3方法提取的鉤骨區(qū)域圖片的成熟等級判定綜合準(zhǔn)確率分別是86.57%,85.01%和83.31%。在橈骨的成熟等級測試中,由表8~11可知:采用區(qū)域自適應(yīng)提取方式所得到的橈骨區(qū)域圖片的成熟等級判定綜合準(zhǔn)確率為85.51%,而采用固定尺寸提取方式,F(xiàn)aster R-CNN和YOLO-V3方法提取的橈骨區(qū)域圖片的成熟等級判定綜合準(zhǔn)確率分別是84.05%,84.18%和83.67%。通過鉤骨和橈骨的成熟等級測試實(shí)驗,均表明特征區(qū)域自適應(yīng)的提取方法具有一定的優(yōu)勢。這說明該方法能夠根據(jù)個體的不同信息,提取出符合骨骼本身大小的特征區(qū)域,從而減少了周邊干擾像素,提高了圖片質(zhì)量,進(jìn)而提高了卷積神經(jīng)網(wǎng)絡(luò)對特征骨塊成熟等級判定的準(zhǔn)確率。
筆者提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的手腕骨特征區(qū)域的提取方法,并以鉤骨、橈骨為例,使用這一方法進(jìn)行了特征區(qū)域的自適應(yīng)提取。提取的結(jié)果表明:特征區(qū)域圖片的尺寸大小和鉤骨、橈骨骨塊本身的大小是能夠相匹配的,成熟等級高的鉤骨和橈骨,特征區(qū)域尺寸也大,反之亦然。骨齡識別過程中,對于14 塊特征骨塊的成熟等級判定,主要依靠特征骨塊的形狀、紋理等信息。采用筆者方法提取的鉤骨和橈骨特征區(qū)域可以保留完整的鉤骨、橈骨特征,特征信息不僅沒有缺失,還減少了周邊骨塊和肌肉組織帶來的干擾。在對比實(shí)驗中,采用了固定尺寸的特征區(qū)域,因為在個體成長過程中,骨骼也是在不斷成長的,這一方式不能體現(xiàn)出骨骼的各異性,為保證全部特征信息的不缺失,需要較大的特征區(qū)域來將骨骼覆蓋,而在特征骨塊的成熟等級較低時,這一切區(qū)域必然會偏大,導(dǎo)致周邊不必要的骨塊進(jìn)入特征區(qū)域,從而形成干擾;采用Faster R-CNN提取的特征區(qū)域可以表現(xiàn)出一定各異性,但是在實(shí)驗過程中,采用這一方式批量提取骨骼時,會存在因部分信息不完整和個別骨頭無法檢測到從而沒有提取出所需特征區(qū)域的問題;YOLO-V3在該場景使用中,存在特征區(qū)域大小不匹配的問題,從而導(dǎo)致圖片信息缺失進(jìn)而影響識別準(zhǔn)確率。在完成區(qū)域提取后,筆者又用卷積神經(jīng)網(wǎng)絡(luò)對鉤骨、橈骨的特征進(jìn)行訓(xùn)練學(xué)習(xí)。測試結(jié)果表明:采取特征區(qū)域自適應(yīng)的提取方式,在數(shù)據(jù)集標(biāo)簽相同情況下,有著更高的成熟等級的判定綜合準(zhǔn)確率,從而證明了這一方法的可行性和有效性。
目前已有的骨齡研究中,也有研究人員采用其他的提取方式。相比于目前的提取方式,筆者提出的特征區(qū)域自適應(yīng)提取方式,可以根據(jù)個體的專屬信息(身高和體重)進(jìn)行特征區(qū)域的自適應(yīng)提取,每個個體都擁有專屬的特征區(qū)域尺寸,而且不存在批量提取時檢測不到目標(biāo)區(qū)域、圖片丟失的問題,在分區(qū)域識別骨齡的過程中也能夠提高單個特征骨塊成熟等級的判定準(zhǔn)確率。
本研究尚存在一些不足之處:沒有提取訓(xùn)練剩余12 塊CHN法所需的特征骨塊的單個模型,只是以鉤骨、橈骨為例;用于學(xué)習(xí)訓(xùn)練的樣本較少;自動檢測提取的精確度還有提高的空間;由于樣本的不均衡性,邊緣等級的識別準(zhǔn)確率較低。這些都有待于進(jìn)一步探索。
筆者所提特征區(qū)域自適應(yīng)提取方法能夠較為準(zhǔn)確地提取出目標(biāo)骨塊的特征區(qū)域,保留完整信息并有效減少周邊骨塊、肌肉組織帶來的干擾像素。并通過卷積神經(jīng)網(wǎng)絡(luò)測試了該方法提取的特征區(qū)域圖片對成熟等級判定準(zhǔn)確率的影響。筆者所提的方法在骨齡自動評估、生物醫(yī)學(xué)圖像分析中,值得進(jìn)一步探索。如何在樣本不均衡的情況下進(jìn)一步提高樣本量少的邊緣等級識別準(zhǔn)確率是接下來的研究方向。