• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于混淆矩陣的多分類任務(wù)準確率評估新方法*

    2021-11-22 08:55:30張開放蘇華友
    計算機工程與科學(xué) 2021年11期
    關(guān)鍵詞:分類效果方法

    張開放,蘇華友,竇 勇

    (國防科技大學(xué)計算機學(xué)院, 湖南 長沙 410073)

    1 引言

    在機器學(xué)習(xí)領(lǐng)域,多分類任務(wù)[1 - 3]是指將樣本實例分為3個及以上類別之一的問題(將樣本實例分類為2個類別之一稱為二分類)。由于分類算法和模型的局限性,對分類器的分類結(jié)果進行準確性評估是一個必須面對的問題[4,5]。另一方面,由于分類器過擬合現(xiàn)象的存在,恰當(dāng)?shù)剡x擇準確率評價指標(biāo)顯得十分重要。現(xiàn)有的一些評價指標(biāo),諸如準確率[3]、Kappa系數(shù)[6]和F1值[3]等,都是基于混淆矩陣對總體分類效果進行的評估。它們很難給出單個類別的分類效果,這在某些實際應(yīng)用中是不足以滿足用戶需求的(例如在MNIST(Mixed National Institute of Standards and Technology database)手寫字符體識別任務(wù)中,數(shù)字0出現(xiàn)的概率和重要性往往會比其他數(shù)字大和高)。

    本文將該方法引入多分類任務(wù)模型評估場景。該方法最初運用于地震預(yù)測領(lǐng)域[7],后被引入遙感圖像目標(biāo)識別效果評估領(lǐng)域[8,9],用于評估識別的效率。本文針對機器學(xué)習(xí)領(lǐng)域的多分類任務(wù),對該方法進行拓展和遷移應(yīng)用,并給出了理論推導(dǎo)過程。基于MNIST手寫字符體識別和CIFAR-10(Canadian Institute For Advanced Research, 10 classes)數(shù)據(jù)集的多分類任務(wù)實驗結(jié)果表明,與已有模型準確率評估方法相比,上述方法可以較好地評估模型分類準確率。值得一提的是,同樣是基于混淆矩陣進行推理,該方法計算簡單,并且可以同時給出分類器整體以及每一個類別的分類效果,對于評估和改進訓(xùn)練過程具有一定的指導(dǎo)意義,同時在特定的任務(wù)背景下應(yīng)用前景廣闊。

    本文的主要工作如下所示:

    (1)提出了一種新的多類別分類效果評價指標(biāo),該指標(biāo)考慮真實標(biāo)簽和預(yù)測標(biāo)簽之間的數(shù)值差異,可以更好地反映分類模型的分類效果。

    (2)從數(shù)學(xué)上給出了所提指標(biāo)的理論推導(dǎo)及其性質(zhì)證明。

    (3)通過該指標(biāo)可同時獲得總體和單個類別分類效果,以改進分類模型訓(xùn)練過程。

    (4)在不同的應(yīng)用中評估了各指標(biāo)在MNIST和CIFAR-10數(shù)據(jù)集上的分類效果,以驗證其有效性和魯棒性。

    2 現(xiàn)有評估方法及其缺陷

    本節(jié)主要介紹幾種常見的模型準確率評價指標(biāo)及其不足。不失一般性,考慮表1所示的三分類問題的混淆矩陣。表1中,l、m、n分別代表類別1、類別2、類別3的真實樣本數(shù),r、s、t分別代表結(jié)果中預(yù)測為3個類別的樣本數(shù);w是所有樣本的總數(shù);a、b、c代表被正確分類的樣本數(shù),d、f、g、e、i*、h代表被錯誤分類的樣本數(shù)。

    Table 1 Confusion matrix of the three-category task表1 三分類問題混淆矩陣

    2.1 準確率

    準確率作為分類問題最原始的評價指標(biāo),定義為正確預(yù)測的樣本占總樣本的百分比。對于表1所示的混淆矩陣,有:

    (1)

    顯然,這一指標(biāo)沒有考慮非對角線因素,也就是忽略了諸多的邊界樣本信息,尤其是在各個類別樣本數(shù)量不均衡的情況下,它不能很好地評估分類效果的好壞。

    2.2 PR曲線

    PR曲線是描述精準率、召回率變化關(guān)系的曲線。其中P代表精準率(Precision),又叫查準率,是針對分類結(jié)果而言的,定義為所有被預(yù)測為正的樣本中真實標(biāo)簽為正的樣本的概率;R代表召回率(Recall),又叫查全率,是針對真實標(biāo)簽而言的,定義為所有實際為正的樣本中被分類為正的樣本的概率。曲線最初是針對二分類任務(wù)場景提出的,混淆矩陣如表2所示。其中,m、n分別代表類別1和類別2的真實樣本數(shù),s、t分別代表分類結(jié)果中預(yù)測為2個類別的樣本數(shù);w是所有樣本的總數(shù);a、b代表被正確分類的樣本數(shù),c、d代表被錯誤分類的樣本數(shù)。表1和表2的a、b、c和d僅有局部意義,分別適用于三分類場景和二分類場景。

    Table 2 Confusion matrix of the two-category task表2 二分類問題混淆矩陣

    其PR值的計算如式(2)所示:

    (2)

    對于多分類問題,實際上會獲得多組混淆矩陣,也就會得到多組PR值,此時有2種處理方法:宏平均(macro-average)和微平均(micro-average)。宏平均是先計算每個混淆矩陣的PR值,然后再分別取平均;微平均則是計算出全局混淆矩陣的平均正負樣本數(shù),然后再計算整體的值。

    這樣,對于上述三分類問題,采用宏平均方式計算如式(3)所示:

    (3)

    其中,Pi和Ri分別代表類別i的精準率和召回率,具體計算方法為:P1=a/r,P2=b/s,P3=c/t;R1=a/l,R2=b/m,R3=c/n。

    采用微平均方式(對于沒有漏檢的多分類任務(wù)而言,實際就是2.1節(jié)中的準確率)計算如式(4)所示:

    (4)

    可以看出,宏平均雖然加入了更多的非對角線元素,但是仍然只能給出所有類別整體的分類效果,而微平均則和2.1節(jié)的準確率等價。同時,PR值是一對此消彼長的統(tǒng)計量,在實際應(yīng)用中要做好兩者的兼顧和取舍。

    2.3 F1值

    為了解決PR值的上述問題,調(diào)和PR值,研究人員提出了F-measure(或F-score)方法,即:

    (5)

    特別地,當(dāng)β=1時,認為PR值同等重要,稱F1值;有些情況下,如果認為P值更重要,就調(diào)整β值小于1;反之,若認為R值比較重要,則調(diào)整β值大于1。

    雖然F-score給了更大的調(diào)節(jié)空間,一方面很難根據(jù)實際場景量化β值,另一方面仍然無法給出單個類別的分類評估結(jié)果。

    2.4 Kappa系數(shù)

    Kappa系數(shù)是統(tǒng)計學(xué)中的概念,一般用于一致性檢驗,也可以用來作為衡量分類精度的指標(biāo)。其計算方法如式(6)所示:

    (6)

    其中,Po代表總體分類精度(即2.1節(jié)中的準確率),Pe計算方法如式(7)所示:

    (7)

    其中,rowi和coli分別代表第i個類別的真實樣本個數(shù)和分類預(yù)測的樣本個數(shù),具體為:row1=l,row2=m,row3=n;col1=r,col2=s,col3=t。一般情況下,根據(jù)Kappa系數(shù)大小進行如表3所示的一致性等級劃分。

    Table 3 Consistency level of Kappa coefficient表3 Kappa 系數(shù)一致性等級劃分

    同樣,無法避免的是上述Kappa系數(shù)仍然不能給出單個類別分類結(jié)果的準確率評估。同時,這種等級劃分的適用范圍有限,等級劃分缺乏一定的合理性,不能適應(yīng)應(yīng)用場景的變化遷移和滿足用戶特定的具體需求。

    據(jù)作者所知,這方面的工作很少。然而,在一些特定的應(yīng)用場景中,文獻[10-13]進行了一些相關(guān)的工作。文獻[14,15]研究了評估檢索系統(tǒng)的問題,并定義了一些類似于AP(Average Precision)的指標(biāo)。文獻[16-18]通過數(shù)學(xué)分析和一些特定實驗比較了AP和其他一些指標(biāo)。文獻[19,20]提出了一些改進措施,以克服平均精度(mAP)的缺陷。文獻[21-23]探究了在其他一些領(lǐng)域改變評價指標(biāo)的可能性。但是,上述所有工作都只是試圖調(diào)整或采用AP指數(shù)以在某些特定的應(yīng)用場景中獲得更好的性能[24 - 28]。他們很少關(guān)注怎樣去克服AP及類似指標(biāo)的固有缺點,且應(yīng)用場景受限[29 - 32]。

    3 R′方法介紹

    R方法是由許紹燮院士在1973年提出的,最初運用于地震預(yù)測的準確率評估,后來(1989年)給出了更嚴格的理論推導(dǎo)和證明,并由王曉青研究員等人(1999年,2002年)進行了進一步的改進和推廣[7]。Dou等人[9](2004年)將其引入遙感圖像分類效果評估,給出了理論推導(dǎo),并進行了適當(dāng)改進,稱之為R′方法?;谏鲜鲈?,這里給出應(yīng)用于多分類任務(wù)場景的評估方法,并仍稱之為R′方法。

    3.1 方法定義

    不失一般性,仍以表2中的二分類問題為例,先給出R′方法的一般原理,然后進行多分類任務(wù)的拓展和推廣。

    以類別1為例,該類別的分類效率R(1)定義如下:對該類別進行正確分類的概率與樣本被預(yù)測為這個類別的概率之差,如式(8)所示:

    R(m|s)=P(s|m)-P(s)

    (8)

    其中,P(s|m)代表該類別被正確分類的概率,計算方法如下:正確分類的樣本數(shù)與該類別樣本總數(shù)之比,如式(9)所示:

    (9)

    P(s)代表樣本被預(yù)測為該類別的概率,如式(10)所示:

    (10)

    同樣,P(m)代表這一類別在總樣本中的出現(xiàn)概率,如式(11)所示:

    (11)

    綜上,可得:

    (12)

    進而有:

    R(m|s)+P(m)=P(s|m)-P(s)+P(m)=

    (13)

    根據(jù)實際的分類結(jié)果,考慮以下3種可能出現(xiàn)的情況:

    (1)該類別預(yù)測樣本數(shù)小于該類別實際的樣本數(shù),即a≤s

    (14)

    (2)該類別預(yù)測樣本數(shù)大于該類別實際的樣本數(shù),即a≤m

    (15)

    (3)分類結(jié)果完全正確,即a=m=s時:

    R(m|s)+P(m)=1

    (16)

    根據(jù)R(1)值的定義,可得R(m|s)+P(s)=P(s|m)≥0,即R(m|s)≥-P(s)。所以有:

    -P(s)≤R(m|s)≤1-P(m)

    (17)

    也就是說,R(1)∈[-P(s),1-P(m)]。它越接近于1-P(m),表明分類效果越好。為方便評估,本文進行以下改進,并定義為R′(1):

    R′(m|s)=R(m|s)+P(m)=

    P(s|m)-P(s)+P(m)=

    P(s|m)-[P(s)-P(m)]

    (18)

    這樣,R′(1)∈[P(m)-P(s),1]。R′(1)值越接近于1,分類效果越好。

    3.2 R′方法在多分類任務(wù)下的推廣

    對于多分類(假設(shè)類別數(shù)為n)問題,顯然不止一個類別需要預(yù)測。為此,對上述推理進行以下推廣。

    設(shè)x表示總樣本中所有類別真實樣本的總數(shù),y代表最終的分類預(yù)測結(jié)果,xi代表第i個類別的真實樣本數(shù)量,yi代表第i個類別的預(yù)測樣本數(shù)量,對于機器學(xué)習(xí)領(lǐng)域的多分類任務(wù)而言,每一個樣本都會有一個預(yù)測標(biāo)簽,所以有:

    (19)

    基于此,第i個類別分類正確的概率計算如式(20)所示:

    P(yi)=P(yi|y)P(y)

    (20)

    其中,P(yi|y)代表樣本被分為第i個類別的條件概率,P(y)代表樣本參與分類的概率(對于本文中的多分類任務(wù)場景,該概率實際為1)。

    進而,對所有類別而言,分類結(jié)果和真實標(biāo)簽一致的概率如式(21)所示:

    (21)

    其中,P(yi|xi)代表第i個類別被正確分類的條件概率。

    根據(jù)3.1節(jié)的結(jié)論,對于第i個類別有:

    R′(xi|yi)=P(yi|xi)-[P(yi)-P(xi)]

    (22)

    進而對所有類別而言,有:

    R′(x|y)=P(y|x)-[P(y)-P(x)]=

    (23)

    其中,ai代表第i個類別的樣本中被正確預(yù)測的樣本數(shù)量。該值越接近1,表明總體的分類效果越好。

    這樣,就可以通過這種方法同時獲得分類器整體的分類效果評估值R′(x|y)和單個樣本分類效果的評估值R′(xi|yi)。在某些應(yīng)用場景下,用戶如果特別關(guān)注某一類別的分類效果,可以在保證總體分類效果的前提下,通過調(diào)節(jié)R′(xi|yi)來滿足特殊分類需要。

    上文給出了在多分類任務(wù)場景下的R′方法。值得注意的是,該方法與Dou等人[9]的R′方法有2點不同:(1)應(yīng)用場景不同。如式(8)描述的那樣,多分類任務(wù)場景下,該指標(biāo)評估每個類別被正確分類的概率,并以樣本數(shù)作為統(tǒng)計標(biāo)準。與之不同的是,Dou等人的方法以遙感圖像像元的多少表征目標(biāo)識別概率的高低。(2)適用條件不同。遙感圖像識別往往包含像元的錯漏現(xiàn)象,也就是某些像元不屬于任何一個目標(biāo)。而在一般的多分類任務(wù)場景下,正如式(20)中描述的那樣,樣本參與分類的概率P(y)=1,也就是不存在樣本不被歸類的情況。

    4 實驗及結(jié)果分析

    本文的實驗基于MNIST手寫字符體識別任務(wù)。這是一個n=10的多分類問題。采用一種典型人工神經(jīng)網(wǎng)絡(luò)(LeNet-5)進行訓(xùn)練和測試,得到在測試樣本精度最高的參數(shù)設(shè)置下的測試樣本混淆矩陣,并計算出第2節(jié)描述的各評價指標(biāo),將在4.1節(jié)給出,以觀察R′方法的評價效果;同時,基于不同超參數(shù)設(shè)置,給出不同模型下R′值對分類器的評估結(jié)果,將在4.2節(jié)給出,以評估R′方法的魯棒性;4.3節(jié)通過改變某些樣本的容量或者標(biāo)簽,對比在不改變上述容量或者標(biāo)簽的情況下,這些類別的值的變化,以此來進一步驗證此方法對于單個類別的評估效果;4.4節(jié)則將上述實驗遷移到CIFAR-10數(shù)據(jù)集(對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型采用VGG)并試圖從另一個角度說明R′方法的有效性。

    4.1 不同評價指標(biāo)的對比

    實驗中,測試樣本最終在模型(最終測試準確率為98.06%)下得出如表4所示的混淆矩陣(表中行表示實際標(biāo)簽,列表示預(yù)測標(biāo)簽;表中同時給出了每個類別的R′值)。基于混淆矩陣,計算得出表5所示的各個評價指標(biāo)取值(PR值項分別給出P值和R值,用P/R表示)。

    Table 4 Confusion matrix of the test samples表4 測試樣本分類結(jié)果混淆矩陣

    Table 5 Evaluation indices of test samples classification result表5 測試樣本分類結(jié)果評價指標(biāo)

    可以看出,在給定的參數(shù)設(shè)置下,R′值給出了與現(xiàn)有的評價指標(biāo)相近的分類器評估取值。值得一提的是,表4說明了R′值可以同時給出整體預(yù)測結(jié)果的評估指標(biāo)以及單個類別的評估指標(biāo),這是其他指標(biāo)無法做到的。為進一步說明R′值的上述特性,圖1給出了10個類別在不同指標(biāo)體系下評估結(jié)果的雷達圖(對于R′值以外的評估指標(biāo),由于它們只給出了整體的分類效果評估值,這里對所有類別賦予同樣的該評估值)。

    Figure 1 Appraised values for different categories of classification results under each indicator圖1 各個指標(biāo)下不同類別分類結(jié)果的評估值

    同樣可以看出,除了R′值以外,其他的評估指標(biāo)雷達圖均為正十邊形(每個類別具有相同的全局評估值)。而對R′值而言,可以清楚地看出,實驗結(jié)果對數(shù)字0,1,2,7識別率較高,對數(shù)字4識別率最差(數(shù)字3,5,6,8,9則介于兩者之間)。這給某些場景下的特殊應(yīng)用需求提供了直觀、便利的評估結(jié)果和模型選擇方法。

    4.2 不同分類結(jié)果下R′值的對比

    為進一步驗證R′值的魯棒性(在不同參數(shù)設(shè)置下,R′值對不同模型的評價結(jié)果有無差異),本節(jié)進行了不同超參數(shù)設(shè)置(實際是不同學(xué)習(xí)率)下的10組實驗,并對比其分類結(jié)果的評估值,如表6(作為參考,同時給出了其他指標(biāo)的評估R′值;或者更直觀地將值繪制為圖2的形式)所示。

    可以看出,對于不同超參數(shù)設(shè)置下的分類結(jié)果,R′值給出了不同的評估結(jié)果。R′值根據(jù)不同模型的好壞,給出了其實際效果的評估結(jié)果,這說明了R′方法的魯棒性。

    4.3 R′值對單個類別的評估效果

    本節(jié)的實驗采取改變訓(xùn)練樣本標(biāo)簽的方法,以此來控制樣本容量變化。具體而言,又分為以下2個步驟:首先分別去除類別0和類別6的某些樣本,減少類別0和類別6樣本的容量,并通過R′方法來評估分類效果,稱之為改變前;然后恢復(fù)這些訓(xùn)練樣本的原始標(biāo)簽,同樣通過R′方法來評估分類效果,稱之為改變后。

    Figure 2 Classifier values under different hyper-parameter settings圖2 不同超參數(shù)設(shè)置下分類器值

    改變前后保持模型的其他參數(shù)不變。

    表7給出了樣本標(biāo)簽改變前后各個類別以及整體的R′值。

    Table 6 Evaluation values of the classifier under different hyper-parameter settings表6 不同超參數(shù)設(shè)置下分類器評估值

    Table 7 R′ value of each category before and after changing the sample label表7 改變樣本標(biāo)簽前后各個類別的R′值

    可以看出,在恢復(fù)類別0和類別6的樣本容量之前(也就是改變前),他們的R′值很小(分別為0.117 6和0.388 1,如表7中加粗部分所示),對應(yīng)的類別4和類別8的R′值也得到一定的影響(分別為0.873 9和0.886 6,如表7中加粗部分所示)?;謴?fù)樣本原始容量之后(也就是改變后),類別0和類別6對應(yīng)的R′值得到顯著提升(分別為0.989 2和0.972 3,如表7中加粗部分所示),對應(yīng)的類別4和類別8的R′值也得到一定的提升(分別為0.974 4和0.978 7,如表中加粗部分所示)。值得說明的是,這對于優(yōu)化和改進訓(xùn)練過程具有顯著的指導(dǎo)意義,即可以通過觀察單一類別或者某一些類別R′值的變化,采取必要的手段(如樣本均衡)來改進訓(xùn)練過程。

    回到3.2節(jié)的關(guān)于R′值方法推廣。3.2節(jié)中給出了某一單個類別的R′值計算方法,如式(22)所示。

    考察式(22),R′值方法在評估分類效果的時候,除了考慮在真實標(biāo)簽中樣本被正確預(yù)測的概率P(si|mi)之外,還進一步結(jié)合了樣本被正確預(yù)測和錯誤預(yù)測的差異,即P(si)-P(mi)。對于實驗中因改變樣本標(biāo)簽而導(dǎo)致樣本不均衡的情形,這一差異被R′方法很好地提取了出來。

    具體而言,考察表8和表9所示的訓(xùn)練樣本容量改變前后的測試樣本的混淆矩陣。表格中的行表示測試樣本真實標(biāo)簽在2次實驗中未發(fā)生變化,而表示預(yù)測標(biāo)簽的每一列則發(fā)生了一定的變化(尤其對類別0、類別4、類別6和類別8而言,如表7中加粗部分所示)。這解釋了上述實驗中這些類別值變化的原因。進一步說,R′方法可以很好地發(fā)現(xiàn)和指導(dǎo)解決訓(xùn)練過程中因樣本不均衡等原因?qū)е碌姆诸愋Чu估的差異問題,進而指導(dǎo)和改進訓(xùn)練過程。

    4.4 CIFAR-10數(shù)據(jù)集實驗結(jié)果

    為進一步說明R′方法的有效性和適用性,本節(jié)實驗采用另一個多分類任務(wù)場景的經(jīng)典數(shù)據(jù)集CIFAR-10進行驗證。

    CIFAR-10數(shù)據(jù)集是一個更接近普適物體的彩色圖像數(shù)據(jù)集,一共包含10個類別的RGB彩色圖像:飛機(airplane)、汽車(automobile)、鳥類(bird)、貓(cat)、鹿(deer)、狗(dog)、蛙類(frog)、馬(horse)、船(ship)和卡車(truck)。數(shù)據(jù)集中每幅圖像的尺寸為32 × 32,每個類別有6 000幅圖像,數(shù)據(jù)集中一共有50 000幅訓(xùn)練圖像和10 000幅測試圖像。與MNIST的灰度圖像不同,CIFAR-10數(shù)據(jù)集由3通道RGB彩色圖像組成,圖像尺寸也比MNIST的28 × 28更大。此外,數(shù)據(jù)集是現(xiàn)實世界的真實物體,圖像噪聲更大,物體的比例、特征也都不盡相同,識別難度更大。但是,值得注意的是,CIFAR-10數(shù)據(jù)集樣本更加均衡,每個類別的樣本數(shù)量都是6 000,這對于進一步驗證4.3節(jié)實驗的設(shè)計思路更加方便和有效。

    Table 8 Confusion matrix 1 before sample label changes表8 改變樣本標(biāo)簽前的混淆矩陣1

    Table 9 Confusion matrix 1 after sample label changes表9 改變樣本標(biāo)簽后的混淆矩陣1

    同樣采用4.3節(jié)的實驗設(shè)計方法,通過改變測試樣本的標(biāo)簽來模擬樣本不均衡的現(xiàn)象(這里將cat類別部分樣本去除,將deer類別部分樣本去除)。表10和表11分別給出了對應(yīng)的混淆矩陣(表中同時給出了各個類別和整體上分類效果的評估R′值,表中最后一列的all代表整體分類效果的R′值)。

    從表10和表11中可以看出,在恢復(fù)類別cat和類別deer的樣本容量之前(也就是改變前),它們的R′值很低(分別為0.1和0.1,如表10中加粗部分所示),對應(yīng)的類別dog和類別horse的值也受到一定的影響(分別為0.808 3和0.811 7,如表11中加粗部分所示)?;謴?fù)原始標(biāo)簽之后(也就是改變后),類別cat和類別deer對應(yīng)的R′值得到顯著提升(分別為0.761 4和0.884 1,如表11中加粗部分所示),對應(yīng)的類別dog和類別horse的R′值也得到一定的提升(分別為0.821 3和0.896 9,如表11中加粗部分所示),整體的分類效果評估指標(biāo)也從0.718 9提高到0.873 0。

    Table 10 Confusion matrix 2 before sample label changes表10 改變樣本標(biāo)簽前的混淆矩陣2

    Table 11 Confusion matrix 2 after sample label changes表11 改變樣本標(biāo)簽后的混淆矩陣2

    上述實驗說明了R′方法對于CIFAR-10數(shù)據(jù)集的適用性和有效性,進一步說明了R′方法的可拓展性及其應(yīng)用場景。

    此外,結(jié)合4.3節(jié)和4.4節(jié)的實驗結(jié)果,也就是樣本容量發(fā)生變化前后評估指標(biāo)的對比,可以看出該方法對不平衡數(shù)據(jù)集同樣適用。也就是說,它不會因為樣本數(shù)量的不均衡而影響對分類結(jié)果的評價,因為正如3.2節(jié)所強調(diào)的那樣,該方法可以單獨對每一個類別進行評估而不僅僅是對整體分類效果進行評估。在不平衡數(shù)據(jù)集上,即使整體的分類效果較好,對于樣本數(shù)較少的類別而言,無論它的分類效果如何,它的評價指標(biāo)都會被單獨地呈現(xiàn)出來。這一點正是該方法的一個突出特點。

    5 結(jié)束語

    多分類任務(wù)模型準確率評估一直是一個值得討論的問題,這不僅要涉及到模型選擇問題,也對模型訓(xùn)練過程具有很好的指導(dǎo)意義。本文針對多分類任務(wù)場景下,尤其是用戶關(guān)心特定類別分類效果的實際情況,現(xiàn)有的多分類任務(wù)準確率評價指標(biāo)的不足,介紹和引入了用于評估模型分類準確率的R′方法。該方法具有嚴格的數(shù)學(xué)理論推導(dǎo)過程,不僅可以評估分類器整體的分類效果,而且還可以給出每一個類別的分類效果,不僅可以用于模型選擇,而且對于更好地指導(dǎo)訓(xùn)練過程具有一定的意義。通過與已有評價方法的對比,基于MNIST的手寫字符體識別任務(wù)和CIFAR-10數(shù)據(jù)集的多分類任務(wù)的實驗驗證,表明該方法具有很好的魯棒性和有效性,可以用于多分類任務(wù)的分類準確率評估場景。同時值得一提的是,不僅對文中實驗驗證采用的MNIST手寫字符體識別和CIFAR-10數(shù)據(jù)集分類這2個多分類任務(wù),該方法還可以擴展到任意場景下的多分類任務(wù)問題,具有廣泛的應(yīng)用前景。

    猜你喜歡
    分類效果方法
    按摩效果確有理論依據(jù)
    分類算一算
    分類討論求坐標(biāo)
    迅速制造慢門虛化效果
    數(shù)據(jù)分析中的分類討論
    抓住“瞬間性”效果
    中華詩詞(2018年11期)2018-03-26 06:41:34
    教你一招:數(shù)的分類
    可能是方法不對
    模擬百種唇妝效果
    Coco薇(2016年8期)2016-10-09 02:11:50
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    欧美+日韩+精品| 成年免费大片在线观看| 亚洲在线自拍视频| 少妇熟女aⅴ在线视频| 在线观看av片永久免费下载| 国产精品三级大全| 久久精品夜色国产| 国产精品电影一区二区三区| 日本黄色视频三级网站网址| 国产成年人精品一区二区| 91久久精品国产一区二区成人| 熟女人妻精品中文字幕| 亚洲av成人精品一区久久| av天堂中文字幕网| 一级黄色大片毛片| 国产精品亚洲美女久久久| 国产精品亚洲美女久久久| 日日摸夜夜添夜夜添av毛片| 又爽又黄a免费视频| 国产大屁股一区二区在线视频| av在线老鸭窝| 亚洲第一电影网av| 老司机午夜福利在线观看视频| 麻豆精品久久久久久蜜桃| 别揉我奶头~嗯~啊~动态视频| 午夜福利视频1000在线观看| 日本欧美国产在线视频| 毛片女人毛片| 国产中年淑女户外野战色| a级毛色黄片| 国产视频内射| 欧美日本视频| 婷婷精品国产亚洲av在线| 亚洲精品粉嫩美女一区| 欧美xxxx性猛交bbbb| 久久久精品大字幕| 日本免费一区二区三区高清不卡| 狂野欧美激情性xxxx在线观看| 麻豆成人午夜福利视频| 大又大粗又爽又黄少妇毛片口| 国产精品久久久久久久电影| 亚洲自偷自拍三级| 麻豆国产av国片精品| 男女那种视频在线观看| 亚洲成人久久性| 日韩三级伦理在线观看| 麻豆成人午夜福利视频| 午夜免费男女啪啪视频观看 | 男女边吃奶边做爰视频| 在线免费观看不下载黄p国产| 可以在线观看毛片的网站| 精品一区二区三区人妻视频| 久久久精品94久久精品| 一进一出抽搐动态| 亚洲av中文字字幕乱码综合| av中文乱码字幕在线| 露出奶头的视频| 国产黄色视频一区二区在线观看 | 级片在线观看| 在线观看免费视频日本深夜| 国产精品免费一区二区三区在线| 1024手机看黄色片| av专区在线播放| 12—13女人毛片做爰片一| 亚洲18禁久久av| 久久国内精品自在自线图片| 大又大粗又爽又黄少妇毛片口| 日韩欧美 国产精品| 免费高清视频大片| 秋霞在线观看毛片| 亚洲最大成人中文| 欧美日韩精品成人综合77777| 国产高清有码在线观看视频| 久久久久久久久久久丰满| 亚洲av五月六月丁香网| 99热只有精品国产| 国产黄色视频一区二区在线观看 | 成人美女网站在线观看视频| 亚洲精品日韩在线中文字幕 | 97超级碰碰碰精品色视频在线观看| 人人妻人人看人人澡| 国产精品久久久久久亚洲av鲁大| 日本爱情动作片www.在线观看 | 国产精品国产三级国产av玫瑰| 毛片女人毛片| 午夜视频国产福利| 97人妻精品一区二区三区麻豆| 亚洲av第一区精品v没综合| 蜜桃亚洲精品一区二区三区| 国产老妇女一区| 色吧在线观看| 可以在线观看的亚洲视频| 青春草视频在线免费观看| 国产高潮美女av| 有码 亚洲区| 精品人妻熟女av久视频| 久久久久久久久久成人| 久久久成人免费电影| 亚洲va在线va天堂va国产| 久久久a久久爽久久v久久| 日本-黄色视频高清免费观看| 日韩三级伦理在线观看| 国产69精品久久久久777片| 搞女人的毛片| 99久久精品热视频| 最近2019中文字幕mv第一页| 亚洲国产精品合色在线| 久久中文看片网| 一本一本综合久久| 少妇的逼水好多| 婷婷精品国产亚洲av| 日韩中字成人| 亚洲va在线va天堂va国产| 成人综合一区亚洲| 亚洲成人精品中文字幕电影| 18禁在线无遮挡免费观看视频 | 成年女人永久免费观看视频| 成人鲁丝片一二三区免费| 伊人久久精品亚洲午夜| 最新中文字幕久久久久| 久久久色成人| 国产伦在线观看视频一区| 五月伊人婷婷丁香| 男女视频在线观看网站免费| 成人综合一区亚洲| 欧美日韩精品成人综合77777| 精品久久久久久久末码| 99久久精品一区二区三区| 神马国产精品三级电影在线观看| 日韩av在线大香蕉| 国产大屁股一区二区在线视频| 免费在线观看影片大全网站| 色哟哟·www| 日本爱情动作片www.在线观看 | 精品久久国产蜜桃| 国产精品一二三区在线看| 不卡视频在线观看欧美| 丰满人妻一区二区三区视频av| 在现免费观看毛片| 赤兔流量卡办理| 日本与韩国留学比较| 国产高清有码在线观看视频| 最近最新中文字幕大全电影3| 精品熟女少妇av免费看| 哪里可以看免费的av片| 一级黄片播放器| 两性午夜刺激爽爽歪歪视频在线观看| 免费电影在线观看免费观看| 久99久视频精品免费| 乱码一卡2卡4卡精品| 国产高清三级在线| 国产熟女欧美一区二区| 亚洲内射少妇av| 国产日本99.免费观看| 不卡视频在线观看欧美| 97超视频在线观看视频| 99热这里只有是精品在线观看| 国产精品亚洲美女久久久| 久久亚洲精品不卡| 国产亚洲av嫩草精品影院| 久久久久久久亚洲中文字幕| 日韩人妻高清精品专区| 午夜福利在线观看吧| 欧美一级a爱片免费观看看| 中文字幕av成人在线电影| 免费大片18禁| 欧美高清性xxxxhd video| 国产熟女欧美一区二区| 最近视频中文字幕2019在线8| 如何舔出高潮| 亚洲一区二区三区色噜噜| 91久久精品国产一区二区三区| 久久草成人影院| 亚洲人成网站在线播放欧美日韩| 少妇裸体淫交视频免费看高清| 国产91av在线免费观看| 国产乱人视频| 麻豆国产97在线/欧美| 一区二区三区免费毛片| 国产亚洲精品综合一区在线观看| 丰满的人妻完整版| 国产美女午夜福利| 国产视频一区二区在线看| 精品久久国产蜜桃| 亚洲av电影不卡..在线观看| 国产爱豆传媒在线观看| 免费搜索国产男女视频| 高清毛片免费看| 国产精品乱码一区二三区的特点| 亚洲一级一片aⅴ在线观看| 99热6这里只有精品| 三级经典国产精品| 最近视频中文字幕2019在线8| 九九爱精品视频在线观看| 日韩欧美 国产精品| 一夜夜www| 国产aⅴ精品一区二区三区波| 国产乱人视频| 色播亚洲综合网| 大又大粗又爽又黄少妇毛片口| 亚洲国产精品sss在线观看| 在线观看午夜福利视频| 国产精品人妻久久久久久| 国产高清激情床上av| 国产片特级美女逼逼视频| 伊人久久精品亚洲午夜| 97在线视频观看| 精品99又大又爽又粗少妇毛片| 亚洲一区二区三区色噜噜| a级毛片a级免费在线| 国产久久久一区二区三区| 国产高潮美女av| av在线播放精品| 国产aⅴ精品一区二区三区波| 日产精品乱码卡一卡2卡三| 日韩欧美精品免费久久| 国产午夜精品论理片| 91麻豆精品激情在线观看国产| 狂野欧美白嫩少妇大欣赏| 波野结衣二区三区在线| 成人特级av手机在线观看| 亚洲国产精品久久男人天堂| 亚洲精品一区av在线观看| 亚洲婷婷狠狠爱综合网| 两性午夜刺激爽爽歪歪视频在线观看| 亚洲熟妇熟女久久| 国产v大片淫在线免费观看| av在线蜜桃| 久久6这里有精品| 亚洲三级黄色毛片| 久久久久久伊人网av| 日韩 亚洲 欧美在线| 伦理电影大哥的女人| 变态另类丝袜制服| 亚洲人成网站在线播| 大型黄色视频在线免费观看| 插阴视频在线观看视频| 一个人看视频在线观看www免费| 长腿黑丝高跟| 色视频www国产| 欧美日本视频| 99视频精品全部免费 在线| 国产淫片久久久久久久久| 欧美成人精品欧美一级黄| 欧美人与善性xxx| 午夜a级毛片| 在线观看美女被高潮喷水网站| 欧美色视频一区免费| av专区在线播放| 国产高潮美女av| 我要搜黄色片| 日本三级黄在线观看| 精品不卡国产一区二区三区| 精品久久久久久久久亚洲| 国产高清视频在线观看网站| 欧美激情在线99| 别揉我奶头 嗯啊视频| 欧美一区二区国产精品久久精品| 午夜亚洲福利在线播放| 成人鲁丝片一二三区免费| 欧美日本视频| 国产av在哪里看| 亚洲精品国产成人久久av| 亚洲成人久久爱视频| 国产亚洲精品综合一区在线观看| 日本免费一区二区三区高清不卡| 99在线人妻在线中文字幕| 国产成人aa在线观看| 成人欧美大片| 亚洲精品日韩在线中文字幕 | 不卡一级毛片| 精品久久久久久久久av| 欧美3d第一页| av中文乱码字幕在线| 精品欧美国产一区二区三| 国内精品一区二区在线观看| 久久久久久大精品| 99精品在免费线老司机午夜| 亚洲一级一片aⅴ在线观看| 女的被弄到高潮叫床怎么办| 国产乱人视频| 精品欧美国产一区二区三| 色综合色国产| av视频在线观看入口| 日韩欧美在线乱码| 亚洲精品粉嫩美女一区| 人妻丰满熟妇av一区二区三区| 国产精品av视频在线免费观看| 99热这里只有是精品在线观看| 12—13女人毛片做爰片一| 性插视频无遮挡在线免费观看| 亚洲av电影不卡..在线观看| 级片在线观看| 久久精品夜色国产| 免费人成在线观看视频色| 在线观看免费视频日本深夜| 日韩制服骚丝袜av| 最近中文字幕高清免费大全6| 蜜桃久久精品国产亚洲av| 日本黄色视频三级网站网址| 97在线视频观看| 国产精品伦人一区二区| 变态另类成人亚洲欧美熟女| 日日撸夜夜添| 国产麻豆成人av免费视频| 一个人看视频在线观看www免费| 国产伦精品一区二区三区视频9| 久久久色成人| 色5月婷婷丁香| 精品国产三级普通话版| 亚洲av免费高清在线观看| 麻豆一二三区av精品| 欧美bdsm另类| 日韩亚洲欧美综合| 寂寞人妻少妇视频99o| 美女内射精品一级片tv| 成年版毛片免费区| 性插视频无遮挡在线免费观看| 精品少妇黑人巨大在线播放 | 国产真实伦视频高清在线观看| 久久精品夜色国产| 亚洲av中文av极速乱| 99久国产av精品国产电影| 婷婷精品国产亚洲av| 床上黄色一级片| 亚洲va在线va天堂va国产| 91久久精品国产一区二区三区| 非洲黑人性xxxx精品又粗又长| 精品久久久久久久久久免费视频| 你懂的网址亚洲精品在线观看 | 亚洲精品456在线播放app| 全区人妻精品视频| 综合色av麻豆| 日本在线视频免费播放| 免费无遮挡裸体视频| 国产精品人妻久久久影院| 国产精品一二三区在线看| 国产黄片美女视频| 亚洲精品粉嫩美女一区| 国产精品久久久久久久久免| 变态另类成人亚洲欧美熟女| 国产精品三级大全| 人妻久久中文字幕网| 国产成人精品久久久久久| 免费大片18禁| 国内久久婷婷六月综合欲色啪| 欧美一区二区精品小视频在线| а√天堂www在线а√下载| 国产综合懂色| 欧美又色又爽又黄视频| 一区二区三区免费毛片| 精品少妇黑人巨大在线播放 | 国产欧美日韩精品亚洲av| av在线老鸭窝| 99在线人妻在线中文字幕| 亚洲欧美日韩高清在线视频| 深夜精品福利| 99热精品在线国产| 久久人人爽人人爽人人片va| 欧美一级a爱片免费观看看| 亚州av有码| 亚洲av成人精品一区久久| 精品乱码久久久久久99久播| 最近最新中文字幕大全电影3| av免费在线看不卡| 精品一区二区三区av网在线观看| 国产男人的电影天堂91| 人妻丰满熟妇av一区二区三区| 国产高清视频在线观看网站| 精品久久久噜噜| 国产精品国产三级国产av玫瑰| 国产又黄又爽又无遮挡在线| 亚洲熟妇中文字幕五十中出| 国产精品野战在线观看| 久久久久久久午夜电影| 亚洲国产日韩欧美精品在线观看| 欧美日韩乱码在线| 国产精品国产高清国产av| 日韩av在线大香蕉| 欧美日韩综合久久久久久| 一区二区三区免费毛片| 在线天堂最新版资源| 男人的好看免费观看在线视频| 欧美日韩一区二区视频在线观看视频在线 | 亚洲国产高清在线一区二区三| 免费搜索国产男女视频| 女同久久另类99精品国产91| 给我免费播放毛片高清在线观看| 成人毛片a级毛片在线播放| 能在线免费观看的黄片| 婷婷精品国产亚洲av在线| 亚洲成a人片在线一区二区| 2021天堂中文幕一二区在线观| a级毛色黄片| 亚洲美女黄片视频| 欧美另类亚洲清纯唯美| 国产蜜桃级精品一区二区三区| 精品人妻一区二区三区麻豆 | 夜夜夜夜夜久久久久| 色在线成人网| 亚洲美女搞黄在线观看 | 国产激情偷乱视频一区二区| 狂野欧美激情性xxxx在线观看| 亚洲成av人片在线播放无| 亚洲av一区综合| 亚洲最大成人中文| 在线观看午夜福利视频| 三级国产精品欧美在线观看| 在线免费十八禁| 男人舔奶头视频| 99热这里只有是精品在线观看| 少妇人妻一区二区三区视频| 欧美xxxx性猛交bbbb| 国产三级在线视频| 久久99热6这里只有精品| 国产高清视频在线播放一区| 国产成年人精品一区二区| 亚洲精品456在线播放app| 在线观看免费视频日本深夜| 波多野结衣高清作品| 国产又黄又爽又无遮挡在线| 哪里可以看免费的av片| 黄色欧美视频在线观看| a级毛片a级免费在线| 特级一级黄色大片| 亚洲精品影视一区二区三区av| 成人av在线播放网站| videossex国产| 人人妻人人看人人澡| 国产高清视频在线观看网站| 干丝袜人妻中文字幕| 亚洲中文字幕日韩| 欧美一区二区亚洲| 亚洲av成人精品一区久久| 一级a爱片免费观看的视频| 麻豆成人午夜福利视频| 白带黄色成豆腐渣| 综合色av麻豆| 久久精品国产鲁丝片午夜精品| 婷婷精品国产亚洲av在线| 性插视频无遮挡在线免费观看| 人妻丰满熟妇av一区二区三区| 一a级毛片在线观看| 久久久久性生活片| 国产成人精品久久久久久| 色播亚洲综合网| av在线亚洲专区| 国产精品一区二区三区四区久久| 成人二区视频| 国产高潮美女av| 午夜爱爱视频在线播放| 最好的美女福利视频网| 精品午夜福利视频在线观看一区| 香蕉av资源在线| 中文字幕久久专区| 中国国产av一级| 看免费成人av毛片| 高清毛片免费观看视频网站| 大型黄色视频在线免费观看| 欧美3d第一页| 99热网站在线观看| 精品久久久久久久人妻蜜臀av| 欧美日韩乱码在线| 国产精品亚洲一级av第二区| 久久久国产成人免费| 最好的美女福利视频网| 九九爱精品视频在线观看| 丰满人妻一区二区三区视频av| 国产伦精品一区二区三区四那| 深爱激情五月婷婷| 一级黄色大片毛片| 日韩 亚洲 欧美在线| 成人三级黄色视频| 国产又黄又爽又无遮挡在线| 国国产精品蜜臀av免费| 少妇熟女aⅴ在线视频| 18禁裸乳无遮挡免费网站照片| 91久久精品电影网| 亚洲欧美精品综合久久99| 久久久久久久久大av| 天堂av国产一区二区熟女人妻| 国产精品精品国产色婷婷| 国产黄片美女视频| 国产人妻一区二区三区在| 午夜影院日韩av| 别揉我奶头 嗯啊视频| 国产国拍精品亚洲av在线观看| 国产亚洲精品综合一区在线观看| 亚洲aⅴ乱码一区二区在线播放| 女同久久另类99精品国产91| 国产黄色视频一区二区在线观看 | 黄色一级大片看看| 欧美zozozo另类| 欧美+日韩+精品| 大香蕉久久网| 日韩欧美三级三区| 国产精品久久电影中文字幕| 2021天堂中文幕一二区在线观| 欧美在线一区亚洲| 特级一级黄色大片| 国产精品女同一区二区软件| 亚洲国产日韩欧美精品在线观看| 淫秽高清视频在线观看| 成人一区二区视频在线观看| 久久精品国产清高在天天线| 国产美女午夜福利| av.在线天堂| 国模一区二区三区四区视频| 伦理电影大哥的女人| 精品免费久久久久久久清纯| 亚洲,欧美,日韩| 亚洲国产欧美人成| 99久久精品一区二区三区| 国产欧美日韩精品亚洲av| 久久久a久久爽久久v久久| 国产精品免费一区二区三区在线| 国产在视频线在精品| 国产精品一及| 十八禁国产超污无遮挡网站| 日韩三级伦理在线观看| 国产在线精品亚洲第一网站| 国产一区亚洲一区在线观看| 精品一区二区三区av网在线观看| 日韩欧美三级三区| 天堂影院成人在线观看| 日韩中字成人| 男人狂女人下面高潮的视频| 国产伦精品一区二区三区视频9| 久久久a久久爽久久v久久| 男女边吃奶边做爰视频| 国产伦一二天堂av在线观看| 久久久久久大精品| 日本熟妇午夜| 国产黄色小视频在线观看| 亚洲中文日韩欧美视频| 综合色av麻豆| 成人欧美大片| 91久久精品国产一区二区三区| 国产精品人妻久久久久久| 黄色视频,在线免费观看| 国产精品不卡视频一区二区| 日韩欧美免费精品| 搞女人的毛片| 亚洲aⅴ乱码一区二区在线播放| 欧美不卡视频在线免费观看| 欧美成人a在线观看| 欧美日韩综合久久久久久| 春色校园在线视频观看| 国产免费一级a男人的天堂| 能在线免费观看的黄片| 日韩一本色道免费dvd| 国产中年淑女户外野战色| 午夜福利18| 成熟少妇高潮喷水视频| 国产伦精品一区二区三区视频9| 日本在线视频免费播放| 天堂动漫精品| 成人高潮视频无遮挡免费网站| 亚洲国产精品成人久久小说 | 麻豆国产97在线/欧美| 国产精品乱码一区二三区的特点| 别揉我奶头~嗯~啊~动态视频| 久久精品久久久久久噜噜老黄 | 给我免费播放毛片高清在线观看| 亚洲自拍偷在线| 啦啦啦观看免费观看视频高清| 精品久久久久久久末码| h日本视频在线播放| 丝袜美腿在线中文| 人人妻人人澡人人爽人人夜夜 | 69av精品久久久久久| 白带黄色成豆腐渣| 国产亚洲av嫩草精品影院| 色哟哟哟哟哟哟| 亚洲国产色片| 国产免费一级a男人的天堂| 国产亚洲精品久久久com| 国产免费一级a男人的天堂| 国产精品一区www在线观看| 亚洲精品在线观看二区| 国产精品久久久久久久久免| 久久久成人免费电影| 午夜精品一区二区三区免费看| 国国产精品蜜臀av免费| 特级一级黄色大片| 亚洲婷婷狠狠爱综合网| 国产一级毛片七仙女欲春2| 久99久视频精品免费| av天堂在线播放| 国产91av在线免费观看| 色吧在线观看| a级一级毛片免费在线观看| 免费看美女性在线毛片视频| 国产精品乱码一区二三区的特点| 97热精品久久久久久| 午夜福利在线观看免费完整高清在 | 99热只有精品国产| 少妇的逼水好多| 国产高清有码在线观看视频| 中文亚洲av片在线观看爽| 别揉我奶头~嗯~啊~动态视频| 国产爱豆传媒在线观看| 午夜爱爱视频在线播放| 亚洲成人精品中文字幕电影| 老师上课跳d突然被开到最大视频| 美女黄网站色视频| 国产欧美日韩精品一区二区| 日本爱情动作片www.在线观看 | 91在线精品国自产拍蜜月| 国语自产精品视频在线第100页| 亚洲婷婷狠狠爱综合网| 麻豆久久精品国产亚洲av| 亚洲成a人片在线一区二区| 国产 一区精品| 国产又黄又爽又无遮挡在线|