李尚汝,宋佳美,張城瑞,孫雨坤,張永根
(東北農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院,哈爾濱 150030)
目前,牧場中奶牛疾病的檢測主要依賴獸醫(yī)巡視和診斷[1]。然而僅靠牛場的工作人員無法完成高質(zhì)量的群體化和個性化管理工作,這使機(jī)器學(xué)習(xí)(machine learning,ML)在奶牛精準(zhǔn)育種、飼養(yǎng)管理和疾病監(jiān)測等領(lǐng)域有著廣泛的研究和應(yīng)用前景[2]。大型牧場利用傳感器收集各種類型的數(shù)據(jù),并配有一體化的信息管理系統(tǒng),其中一些系統(tǒng)能夠處理部分傳感器的數(shù)據(jù)并提供決策支持[3]。如配有智能化設(shè)備(如智能項圈、計步器等)的牧場會根據(jù)反芻量和活動量的異常預(yù)警來輔助診斷,在一定程度上避免了誤判、漏判[4]。然而,如果牧場的信息管理系統(tǒng)能夠整合ML算法以支持生產(chǎn)決策過程或使其自動化時,來自各種傳感器的數(shù)據(jù)才能得到充分利用[1]。ML算法利用統(tǒng)計技術(shù)對大型數(shù)據(jù)集進(jìn)行處理并預(yù)測奶牛的生產(chǎn)性能和疾病[5-6]。
近年來,有許多學(xué)者利用ML算法判斷奶牛的異常。Wagner等[7]利用瘤胃內(nèi)pH傳感器監(jiān)測奶牛瘤胃pH,同時利用具有定位功能的項圈監(jiān)測奶牛的活動,評估K-近鄰回歸(K-Nearest Neighbours for Regression,KNNR)、決策樹回歸(Decision Tree for Regression,DTR)、多層感知器(MultiLayer Perceptron,MLP)和長短期記憶(Long Short-Term Memory,LSTM)預(yù)測奶牛瘤胃酸中毒情況,結(jié)果表明KNNR表現(xiàn)最佳,真陽性為83%。Mtga等[8]比較了線性回歸(Linear Regression,LRN)、隨機(jī)森林(Random Forests,RF)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)預(yù)測熱應(yīng)激時奶牛的呼吸頻率、皮膚溫度和陰道溫度的效果,發(fā)現(xiàn)RF和ANN的預(yù)測效果較好,均方根誤差最低分別為9.695次/min、0.334 ℃和0.434 ℃。Xu等[9]利用8種ML算法對奶牛血漿中β-羥丁酸、游離脂肪酸、葡萄糖、胰島素和胰島素樣生長因子-1的濃度進(jìn)行聚類,以評價泌乳早期代謝狀態(tài),發(fā)現(xiàn)RF和支持向量機(jī)(Support Vector Machine,SVM)表現(xiàn)最佳,最低錯誤率為12.4%~22.6%。然而,這些方法存在一定的侵入性,可能會使奶牛產(chǎn)生應(yīng)激,在牧場中適用性有限。用奶牛生產(chǎn)中的常規(guī)數(shù)據(jù)來預(yù)測奶牛的異常表現(xiàn),如反芻量、胎次、產(chǎn)奶性能等,可以有效避免因人為操作引起的奶牛應(yīng)激。
奶?;疾『螅顒有袨?、采食行為和社交行為通常會減少[10],這些指標(biāo)的變化,可輔助員工、技術(shù)人員和獸醫(yī)進(jìn)行疾病預(yù)警、診斷和決策[11]。研究表明,反芻時間可作為疾病早期檢測的工具[12-14],反芻和活動可有效監(jiān)測奶牛乳房炎、消化和代謝狀態(tài)[15-16]。除了奶牛的行為指標(biāo),產(chǎn)奶量也是反映疾病的一個重要因素[17]。目前,奶牛疾病的預(yù)測模型多以反芻量、活動量和產(chǎn)奶量作為預(yù)測變量[7,18-19],而產(chǎn)奶量在很大程度上受胎次和泌乳天數(shù)的影響[20],此外,泌乳天數(shù)和胎次也可以反映奶牛的身體代謝和健康狀態(tài)[9],這表明各個指標(biāo)并不能孤立地預(yù)測奶牛的健康狀況。除了反芻量、活動量、產(chǎn)奶量之外,有必要將胎次和泌乳天數(shù)納入疾病預(yù)測的變量中。鑒于此,本試驗采用6種ML算法,利用奶牛生產(chǎn)中的日活動量、反芻量、產(chǎn)奶量、泌乳天數(shù)和胎次5種變量,建立奶牛健康狀態(tài)的預(yù)測模型,探究開發(fā)奶牛管理決策支持工具的可能性,評估6種ML算法在奶牛疾病預(yù)測中的性能;此外,建立以日活動量、反芻量和產(chǎn)奶量為變量的預(yù)測模型,評估胎次和泌乳天數(shù)對模型性能的影響。
試驗數(shù)據(jù)來源于黑龍江省黑河市金澳牧場所有處于泌乳期的奶牛。泌乳奶牛飼喂全混合飼糧(TMR),分區(qū)飼養(yǎng)(新產(chǎn)區(qū)、低產(chǎn)區(qū)、高產(chǎn)區(qū)和病區(qū)),不同產(chǎn)區(qū)飼喂的TMR不同,其中新產(chǎn)區(qū)和病區(qū)飼喂同一種TMR。TMR中粗飼料主要由玉米青貯、燕麥、紫花苜蓿、全棉籽和啤酒糟組成,精飼料由預(yù)混料、麩皮、噴漿玉米皮、菜籽粕和玉米蛋白等組成。TMR營養(yǎng)水平見表1。
表1 泌乳牛TMR營養(yǎng)水平
收集2020年12月至2021年11月所有泌乳奶牛的數(shù)據(jù),總計944頭牛,共105 168條數(shù)據(jù),其中疾病記錄3 268條。將數(shù)據(jù)分為訓(xùn)練集和外部驗證集,比例為2∶1。每條數(shù)據(jù)包含胎次、泌乳天數(shù)、日反芻量、日活動量、產(chǎn)奶量和6類疾病情況。其中,胎次、泌乳天數(shù)由信息管理人員登記在信息管理系統(tǒng)中;日反芻量、日活動量由智能項圈和計步器(安樂福(中國)科技智能有限公司)實時監(jiān)測并上傳至信息管理系統(tǒng);產(chǎn)奶量由奶廳管理人員將奶廳的數(shù)據(jù)上傳至信息管理系統(tǒng)中。所有的疾病均由2名有經(jīng)驗的獸醫(yī)診治,每天進(jìn)行巡視和診斷,6類疾病分別為乳房疾病(乳房炎、隱性乳房炎),蹄病(蹄葉炎、關(guān)節(jié)囊腫、潰瘍等),生殖系統(tǒng)疾病(子宮炎、胎衣不下、陰道炎等),消化系統(tǒng)疾病(前胃遲緩、瘤胃積食、瓣胃秘結(jié)等),營養(yǎng)與代謝疾病(酮病、產(chǎn)后癱瘓等),過敏與應(yīng)激(高燒、冷熱應(yīng)激等)。以上數(shù)據(jù)每日上傳1次,連續(xù)收集365 d。
1.2.1 模型算法 ANN包含輸入層、隱藏層和輸出層(圖1),隱藏層包含若干神經(jīng)元,各神經(jīng)元之間用帶可變權(quán)重的有向弧連接,網(wǎng)絡(luò)通過對已知信息的反復(fù)學(xué)習(xí)訓(xùn)練,通過逐步調(diào)整、改變神經(jīng)元連接權(quán)重,達(dá)到處理信息、模擬輸入輸出之間關(guān)系的目的。
x,輸入變量;h,隱藏層神經(jīng)元;o,輸出變量;W,權(quán)重
DT用樹的結(jié)構(gòu)來構(gòu)建分類模型(圖2),每個節(jié)點代表1個屬性,根據(jù)這個屬性的劃分,進(jìn)入這個節(jié)點的子節(jié)點,直至葉子節(jié)點,每個葉子節(jié)點都代表著一定的類別,從而達(dá)到分類的目的。C5.0和CHAID算法是DT里主要用于分類的算法。對于連續(xù)性自變量來說,C5.0每個節(jié)點分為兩支,CHAID可分為多支。
A是B和C的父節(jié)點
RF是包含多個DT的分類器,其輸出的類別是由個別樹輸出的類別的眾數(shù)而定的。由于利用了集成的方法,相較于DT更能避免過擬合現(xiàn)象。
LR是一種廣義線性模型,主要用于解決分類問題,多用于二分類,也可用于多分類。線性回歸y=f(x)=wTx的取值并不在區(qū)間(0,1)內(nèi),LR使用一個函數(shù)來歸一化y值,使y的取值在區(qū)間(0,1)內(nèi),目的是利用樣本數(shù)據(jù)訓(xùn)練得到參數(shù)ω的值。該函數(shù)表達(dá)式如下:
BN也被稱為信念網(wǎng)絡(luò)(Belif Networks)或者因果網(wǎng)絡(luò)(Causal Networks),是描述數(shù)據(jù)變量之間依賴關(guān)系的一種推理模型。BN的網(wǎng)絡(luò)結(jié)構(gòu)是一個有向無環(huán)圖,其中每個結(jié)點代表一個屬性或者數(shù)據(jù)變量,結(jié)點間的弧代表屬性間的概率依賴關(guān)系(圖3)。一條弧由屬性A指向?qū)傩訠,說明屬性A的取值可以對屬性B的取值產(chǎn)生影響,由于是有向無環(huán)圖,A、B間不會出現(xiàn)有向回路。
圖3 BN網(wǎng)絡(luò)結(jié)構(gòu)[23]
1.2.2 數(shù)據(jù)平衡 由于疾病記錄遠(yuǎn)少于健康記錄,而ML的分類器算法習(xí)慣于偏向多數(shù)類,會導(dǎo)致模型不準(zhǔn)確,因此首先對訓(xùn)練集的數(shù)據(jù)樣本進(jìn)行平衡。疾病記錄進(jìn)行過采樣,平衡因子=5;健康記錄進(jìn)行欠采樣,平衡因子=0.5。
1.2.3 模型訓(xùn)練與驗證 將平衡后的訓(xùn)練集數(shù)據(jù)用于模型訓(xùn)練。訓(xùn)練數(shù)據(jù)集被隨機(jī)分為訓(xùn)練集(90%)和測試集(10%),采用10-折交叉法進(jìn)行內(nèi)部驗證,以調(diào)節(jié)參數(shù)優(yōu)化模型性能。每組模型重復(fù)訓(xùn)練2次:①將日產(chǎn)奶量、反芻量、活動量作為連續(xù)輸入變量,胎次和泌乳天數(shù)作為分類輸入變量,疾病情況作為分類目標(biāo)變量,用于模型性能和預(yù)測變量重要性的研究;②將日產(chǎn)奶量、反芻量、活動量作為連續(xù)輸入變量,疾病情況作為分類目標(biāo)變量,用于胎次和泌乳天數(shù)對模型精度影響的研究。輸出混淆矩陣和預(yù)測變量的權(quán)重。將訓(xùn)練后的模型采用外部驗證集數(shù)據(jù)進(jìn)行驗證,輸出混淆矩陣。所有ML模型訓(xùn)練和驗證采用IBM SPSS Modeler 18.0進(jìn)行,模型訓(xùn)練參數(shù)見表2、3。
表2 ANN、DT CHAID、RF參數(shù)集
表3 DT C5.0、LR、BN參數(shù)集
1.2.4 結(jié)果分析 對混淆矩陣分別進(jìn)行敏感性和特異性計算,評估模型性能,對輸入變量的權(quán)重進(jìn)行排序并評估其重要性。其中:
敏感性(%)=真陽性數(shù)/(真陽性數(shù)+假陰性數(shù))×100%
特異性(%)=真陰性數(shù)/(真陰性數(shù)+假陽性數(shù))×100%
由表4可知,DT C5.0的敏感性均>85%,總體敏感度最佳,為95.5%。RF對于各項疾病識別的正確率均>50%,除乳房疾病外,其余疾病的識別正確率較一致,總體敏感度為56.8%。對于ANN,乳房疾病、蹄病、生殖系統(tǒng)和消化系統(tǒng)疾病以及健康牛的敏感性均在50%以上,而營養(yǎng)與代謝疾病和過敏與應(yīng)激識別錯誤率為100%,這與DT CHAID算法得到的結(jié)果趨勢一致,但DT CHAID對于蹄病和消化系統(tǒng)疾病的敏感性僅為20%左右。對于BN,除健康牛和乳房疾病外,其余疾病的敏感性不足45%;而對于LR,所有疾病的敏感性均不足40%,總體敏感度不足30%。
表4 6種模型的敏感性
由表5可知,DT C5.0算法對于識別健康牛和患病牛的特異性均>90%,RF特異性均>80%。ANN、DT CHAID和BN的總特異性雖然超過90%,但對于健康牛的特異性均在70%左右。LR對健康牛的特異性僅為52%,未被識別為健康牛的特異性較高,均在80%以上。
表5 6種模型的特異性
由外部驗證得到的敏感性(表6)可知,除RF外,其余5種模型對健康牛預(yù)測的敏感性均超過70%。ANN、DT C5.0和CHAID對于生殖系統(tǒng)疾病的敏感性均超過60%,除LR外,其余5種模型對于乳房疾病的敏感性均超過50%,DT C5.0對營養(yǎng)與代謝疾病的敏感性超過50%。同時,DT C5.0的總體敏感度表現(xiàn)最佳,為56.8%,其余模型均在30%左右。而對于營養(yǎng)與代謝疾病和過敏與應(yīng)激,模型的整體預(yù)測精度較差。
表6 6種模型外部驗證的敏感性
由外部驗證得到的特異性(表7)可知,RF和ANN的特異性均在80%以上,且RF的總體特異度最佳,為95.1%。DT C5.0、CHAID和BN對于識別健康牛的特異性均為70%左右,LR為60%。對于6種疾病,6種模型的特異性均超過80%。
表7 6種模型外部驗證的特異性
由圖4可知,對于不同算法,不同變量的重要性不一致。產(chǎn)奶量和泌乳天數(shù)為最重要的預(yù)測變量,其中,產(chǎn)奶量為RF、ANN和LR的第一重要變量,在其他3個模型中為第二或第三重要變量,而泌乳天數(shù)為DT C5.0、CHAID和BN的第一重要變量,在其他3個模型中為第二重要變量。在DT C5.0、CHAID和BN 3種模型中,胎次的重要性僅次于泌乳天數(shù)和產(chǎn)奶量,日反芻量和活動量重要性稍弱。將胎次和泌乳天數(shù)添加至預(yù)測變量前后得到的模型敏感性變化結(jié)果見圖5。由圖5可知,ANN、BN和LR對于健康牛的敏感性下降,對于6類疾病,僅有RF對于消化系統(tǒng)疾病的敏感性有所下降,其余模型對疾病敏感性均上升或不變。
圖4 6種模型預(yù)測變量的重要性
1,未患??;2,乳房疾??;3,蹄??;4,生殖系統(tǒng)疾??;5,消化系統(tǒng)疾??;6,營養(yǎng)與代謝疾?。?,過敏與應(yīng)激
在本研究中,產(chǎn)奶量和泌乳天數(shù)被證明為最重要的預(yù)測變量,泌乳天數(shù)和胎次可有效提高模型的性能和預(yù)測精度。本試驗?zāi)P陀?xùn)練后的最佳性能表現(xiàn)為總體敏感性>80%,特異性>90%。與本研究類似,Wagner等[7]采集奶牛的行為信息,利用ML預(yù)測奶牛瘤胃酸中毒情況,表現(xiàn)最優(yōu)的模型敏感性為83%。Kamphuis等[24]用體重、行為數(shù)據(jù)和產(chǎn)奶性能建立ML模型預(yù)測奶牛跛行,將模型特異性固定在80%時,組合模型的總體敏感性為50%。在實際生產(chǎn)中,許多疾病的癥狀通常受到多種因素的影響,ML因其強(qiáng)大的泛化能力和集成各種數(shù)據(jù)的靈活性具有很大的優(yōu)勢[18],進(jìn)一步探索和完善可能會實現(xiàn)在個體水平上的精準(zhǔn)監(jiān)測。
對6種模型性能的總體表現(xiàn)進(jìn)行分析發(fā)現(xiàn),對于健康牛和患有乳房疾病的牛的敏感性相對較高,特異性相對較低,這可能是因為牧場中健康牛的數(shù)量遠(yuǎn)多于患病牛,且患有乳房疾病的奶牛數(shù)量多于患其他疾病的數(shù)量。數(shù)據(jù)量大的類別使得模型學(xué)習(xí)該特征的能力更強(qiáng)[7],因此敏感性較高,同時由于該類別被識別為錯誤的數(shù)量也多于其他類別,因此特異性相對較低,然而這更能反映模型的真實水平。對于數(shù)據(jù)量少的類別(比如營養(yǎng)與代謝疾病、過敏與應(yīng)激),即使被分類錯誤,其數(shù)量上相對占少數(shù),因此特異性會“虛高”,導(dǎo)致模型不穩(wěn)定。此外,在本試驗和實際生產(chǎn)中,健康牛的數(shù)據(jù)量遠(yuǎn)多于患病牛,會導(dǎo)致數(shù)據(jù)不平衡的問題。盡管有些類型的數(shù)據(jù)樣本稀缺,但在某些情況下,這些數(shù)據(jù)更重要,如罕見疾病的診斷、災(zāi)難預(yù)測等[25-27]。因此,本試驗對不平衡的數(shù)據(jù)進(jìn)行了適當(dāng)?shù)奶幚?,即欠采樣和過采樣,以提高M(jìn)L預(yù)測數(shù)據(jù)量較少的樣本的準(zhǔn)確率,同時又不影響它們預(yù)測數(shù)據(jù)量多的樣本的精度。在實際應(yīng)用中,對數(shù)據(jù)量少的樣本進(jìn)行正確分類往往比對數(shù)據(jù)量多的樣本正確分類更重要。
本試驗中,DT C5.0算法在訓(xùn)練和驗證時表現(xiàn)出了很高的敏感性和特異性,CHAID算法則表現(xiàn)稍差。C5.0采用的是信息增益的方法對樹進(jìn)行劃分,強(qiáng)調(diào)小樣本上的重復(fù)測試比較,CHAID采用的是卡方的方法,1次對1個變量切分出多個統(tǒng)計顯著的分支,這樣會更快地生長出預(yù)測能力高的樹枝,但隨著樹不斷分支,子節(jié)點的支持度迅速降低,使其更快地逼近一棵臃腫而不穩(wěn)定的樹[28]。在查看樹的分支情況時會發(fā)現(xiàn),C5.0的樹深度為27,而CHAID樹深度僅為4。Kurt等[28]利用DT算法預(yù)測乳腺癌,發(fā)現(xiàn)C5.0系列的算法敏感性和特異性均優(yōu)于CHAID,與本研究的結(jié)果一致?;贒T算法的模型常用于疾病監(jiān)測中,如Kamphuis等[29]收集9個不同牧場的擠奶機(jī)器人的數(shù)據(jù),建立并驗證臨床乳房炎預(yù)測模型,將特異性保持在與牧場當(dāng)前使用的模型相當(dāng)?shù)乃綍r,DT模型能夠?qū)⒓訇栃跃瘓蟮臄?shù)量減少50%以上。DT往往在類別不均衡數(shù)據(jù)上表現(xiàn)良好,它使用基于類變量的劃分規(guī)則去創(chuàng)建分類樹,因此可以強(qiáng)制地將不同類別的樣本分開。
ANN在分類、聚類、模式識別和預(yù)測等領(lǐng)域已成為一種常用且有效的模型[30]。在本試驗中,ANN對于不同疾病的分類效果表現(xiàn)不一,這可能與疾病信息的數(shù)量有關(guān),營養(yǎng)與代謝疾病、過敏與應(yīng)激疾病數(shù)據(jù)較少,導(dǎo)致模型擬合性弱,但其對于其他疾病的敏感性均>50%,對所有疾病的特異性均>90%?,F(xiàn)有研究表明,ANN在奶牛疾病預(yù)測方面表現(xiàn)出較好的預(yù)測性能,如Ehret等[18]利用基因組、代謝信息和牛奶成分,通過ANN預(yù)測亞臨床酮病(β-羥丁酸含量),結(jié)果表明,β-羥丁酸含量的觀測值和預(yù)測目標(biāo)值之間的平均相關(guān)性最高可達(dá)0.643。此外,Li等[31]以飼料的營養(yǎng)成分、干物質(zhì)采食量和體重為輸入變量,利用ANN預(yù)測瘤胃pH、瘤胃氨氮和揮發(fā)性脂肪酸的濃度,與傳統(tǒng)方法相比,ANN提高了瘤胃代謝相關(guān)預(yù)測的精度。Slob等[1]指出,對于畜牧領(lǐng)域的研究,學(xué)者更傾向于DT和ANN算法。但基于DT的算法比基于ANN的算法更受歡迎,可能是因為ANN是一種黑盒方法,內(nèi)部決策規(guī)則不清楚,而DT算法的“if-else”決策規(guī)則可以幫助使用者理解決策過程。
除最常用的DT和ANN算法外,本試驗還選取了LR、BN和RF,因為它們各自代表了一批相似的方法[32]。在本試驗中,LR對于6類疾病的敏感性均不足40%,對健康牛的特異性僅為52%,這說明約有一半的患病牛被識別為健康牛,性能表現(xiàn)較差。這與很多研究相反,回歸在其他研究中的表現(xiàn)優(yōu)于BN、SVM和RF,這些研究多為預(yù)測與個體遺傳有關(guān)的產(chǎn)犢或受孕性狀,且沒有在個體水平上得到很好的預(yù)測結(jié)果,無法在實踐中使用[6,33]。這可能是因為LR在本質(zhì)上是一種線性分類模型,處理非線性數(shù)據(jù)時往往表現(xiàn)較差,而在個體水平預(yù)測時,個體信息之間可能很難滿足線性關(guān)系。在其他研究中,RF和BN在預(yù)測奶牛熱應(yīng)激和存活率方面均優(yōu)于LR[32,34],這與本試驗的結(jié)論一致。RF是一種基于DT算法的模型,通過集成學(xué)習(xí)的思想將多棵樹集成,基本單元為DT[35],相較于DT的單個樹算法,RF能有效防止過擬合,因此在本試驗中,雖然RF模型性能表現(xiàn)不及DT,但該模型相對更穩(wěn)定。與本試驗類似,Shahinfar等[36]利用ML預(yù)估具有高受孕率的奶牛發(fā)現(xiàn),RF優(yōu)于貝葉斯方法,其準(zhǔn)確度可達(dá)0.80,這可能是因為BN的前提假設(shè)是分布獨立,然而現(xiàn)實中的預(yù)測變量受其他變量和環(huán)境的影響,很難完全獨立,如研究表明胎次和泌乳階段對產(chǎn)奶量有顯著影響[37-39],每公斤干物質(zhì)的反芻時間與產(chǎn)奶量呈負(fù)相關(guān)關(guān)系[40]。影響模型性能的因素很多,不同的ML模型受自身算法和外部因素的限制,在不同場景下表現(xiàn)出的性能不一。
奶牛生產(chǎn)過程中產(chǎn)生的數(shù)據(jù)已被用于許多基于ML算法的疾病預(yù)警的研究中,如用血漿胰島素樣生長因子-1、葡萄糖、胰島素、游離脂肪酸、β-羥丁酸的濃度來評估奶牛泌乳早期的代謝狀態(tài)[9],用牛奶代謝物濃度和牛奶成分預(yù)測酮病發(fā)生情況[32],用瘤胃pH和活動情況來預(yù)測瘤胃酸中毒[7]等。然而,這些方法在目前的生產(chǎn)中并沒有得到充分的應(yīng)用,除部分?jǐn)?shù)據(jù)的獲取存在局限性外,其中一個原因可能是缺乏多參數(shù)數(shù)據(jù)集[41]。Kamphuis等[24]收集奶牛不同傳感器中的常規(guī)信息,如體重、活動量、產(chǎn)奶性能等,利用LR預(yù)測奶牛跛行,結(jié)果表明多變量(來自多個傳感器的數(shù)據(jù))模型始終優(yōu)于單變量(來自單個傳感器的數(shù)據(jù))模型。Stangaferro等[15-16,42]利用反芻和活動的信息建立基于健康指數(shù)評分(HIS)的自動健康監(jiān)測系統(tǒng),以預(yù)測奶牛疾病情況,該系統(tǒng)對于皺胃移位、酮病、消化疾病、乳房炎和子宮炎的預(yù)警總敏感性為59.0%,總特異性為97.6%。這與本試驗中RF得到的結(jié)果相似,與DT C5.0算法得到的特異性相似,但敏感性相差較大。這可能是因為本試驗在此基礎(chǔ)上還增加了其他的預(yù)測變量。
通過對預(yù)測變量重要性的分析發(fā)現(xiàn),產(chǎn)奶量在本試驗的RF、ANN和LR 3個模型中為最重要的預(yù)測變量,在其他3個模型中也表現(xiàn)出了較高的重要性。疾病對產(chǎn)奶量有很大的影響,Carvalho等[43]研究表明,產(chǎn)后至少患1種疾病(子宮炎、乳房炎、蹄病、消化系統(tǒng)疾病和呼吸系統(tǒng)疾病)的奶牛,產(chǎn)奶量降低約4%,即使是具有相似的產(chǎn)奶基因潛力,患病牛的產(chǎn)奶量也遠(yuǎn)低于健康牛。此外,Khansefid等[44]建立了奶牛蹄病預(yù)測的多變量模型,指出產(chǎn)奶量可以提高模型的精度。對于反芻量和活動量,在本試驗?zāi)P椭械闹匾陨匀?,但仍為提高預(yù)測的精度做了一定貢獻(xiàn)。反芻和活動可有效監(jiān)測奶牛乳房炎、消化和代謝狀態(tài)[15-16],Liboreiro等[45]研究發(fā)現(xiàn),患子宮炎的奶牛反芻量每天減少30 min,活動量每天減少37 min;患亞臨床酮病的奶?;顒恿棵刻鞙p少35 min。同樣,Soriani等[46]也報道稱,產(chǎn)后沒有健康問題或只有輕微健康問題的奶牛在泌乳頭10 d的平均反芻時間(≥520 min/d)更長。
本試驗在模型常用的產(chǎn)奶量、反芻量和活動量的基礎(chǔ)上,添加了胎次和泌乳天數(shù)的信息,以預(yù)測奶牛的健康狀況。其中泌乳天數(shù)為DT C5.0、CHAID和BN 3個模型最重要的預(yù)測變量,為其余3個模型第二重要的預(yù)測變量,胎次在性能表現(xiàn)最佳的DT C5.0模型中,重要性僅次于泌乳天數(shù)和產(chǎn)奶量。疾病被證明與胎次和泌乳天數(shù)有關(guān),Ribeiro等[47]總結(jié)了多項研究發(fā)現(xiàn),約1/3的奶牛在泌乳前3周內(nèi)至少患1種臨床疾病(子宮炎、乳房炎、消化系統(tǒng)疾病、呼吸系統(tǒng)疾病或蹄病),Leblanc[48]發(fā)現(xiàn)約有75%的奶牛疾病發(fā)生在產(chǎn)后1個月內(nèi),Sogstad等[49]發(fā)現(xiàn)胎次≥3時,罹患蹄病的風(fēng)險顯著提高,且多胎奶牛更容易發(fā)生酮病和低血鈣癥[50-51]。本試驗中,將胎次和泌乳天數(shù)添加至預(yù)測變量后,模型的敏感性顯著提高,除了ANN、BN和LR 3種模型對健康牛的預(yù)測精度稍有下降外,只有RF對1類疾病的預(yù)測精度顯示為下降,這說明將胎次和泌乳天數(shù)納入預(yù)測變量中,可以提高模型的預(yù)測精度。與本試驗類似,Xu等[9]在利用ML算法預(yù)測奶牛泌乳早期代謝狀態(tài)時,將胎次作為其中1種預(yù)測變量,輸出模型的最低錯誤率僅為12.4%~22.6%。在目前的奶牛生產(chǎn)中,各類傳感器可以持續(xù)收集奶牛信息和行為數(shù)據(jù),未來可以將多個傳感器和系統(tǒng)中的數(shù)據(jù)充分利用,以提高模型對異常指標(biāo)的敏感性。
ML算法對奶牛的健康狀態(tài)可以進(jìn)行有效分類,在預(yù)測疾病方面表現(xiàn)出了潛力。模型受各自算法的限制,在不同場景和條件下表現(xiàn)不一,本試驗中DT C5.0算法預(yù)測性能最佳,與同類研究相比,總體敏感性和特異性均表現(xiàn)出了優(yōu)勢。在常用的預(yù)測變量(日產(chǎn)奶量、反芻量和活動量)基礎(chǔ)上,納入胎次和泌乳天數(shù)可提高模型預(yù)測精度,其中泌乳天數(shù)和產(chǎn)奶量為相對重要的預(yù)測變量。