趙玉華 楊文旺 武 濤
(1.北礦機電科技有限責任公司,北京 100160;2.礦冶科技集團有限公司,北京 100160;)
據相關統(tǒng)計,國內 90%以上的有色金屬礦物會采取浮選工藝。由于浮選工藝流程內部耦合度高、時間周期長、浮選結果的影響因素多,在走向自動化、信息化、智能化的道路上仍有巨大的阻力[1]。國內外無數學者嘗試搭建出一個完善的數學模型來描述浮選生產流程中復雜的物理化學過程,但是由于各種原因研究進展緩慢。第一,浮選生產過程是一個高度的非線性過程,而對非線性問題的建模理論研究應用于浮選過程效果不好;第二,盡管浮選過程中部分可以進行結構化建模,但是浮選過程整體上還是一個非結構化問題,如果將浮選各環(huán)節(jié)結構化建模后整合成整體模型,建模效果與實際的浮選生產相差較大并且違反了浮選系統(tǒng)的原理。所以通過“黑箱”建模方法,建立輸入與輸出之間的數學模型,對浮選生產的信息化和智能化具有重大研究價值。
近年來很多學者致力于在線礦漿品位分析,這對于指導生產、節(jié)約藥劑、控制產品質量和提高回收率等方面都起著非常關鍵的作用。M·瓜里尼等[2]提取顏色特征B均值、G均值、R均值和H均值、S均值、V均值、形態(tài)特征泡沫尺寸、平均形狀系數等,并且將以上特征參數與精礦品位作相關性分析,可以采用浮選泡沫的圖像特征參數來作為訓練模型的輸入數據,從而獲得精礦品位預測模型。魏利君提出了多數據相關性分析算法,進行了單一浮選槽的浮選泡沫圖像特征與精礦品位的相關性分析,以及多個浮選槽的浮選泡沫圖像特征之間的相關性分析,然后使用基于改進粒子群的支持向量機算法來建立精礦品位預測模型[3]。李啟福等選取顏色特征、紋理特征、形態(tài)特征和速度特征作為訓練模型的輸入數據,應用滑窗樣條偏最小二乘算法建立精礦品位的回歸預測模型[4]。
從以上案例不難發(fā)現,目前一般的基于機器視覺的精礦品位預測,均是通過研究特定的泡沫圖像處理方法提取泡沫表面的一個或者多個視覺特征,進而通過大量的樣本統(tǒng)計分析這些視覺特征與精礦品位的相互關系,建立相應的關系模型,建模算法從最初的最小二乘法、相關似然法等經典算法發(fā)展到了支持向量機、神經網絡等機器學習算法。雖然模型借助機器學習技術實現“黑箱”操作,然而依然需要提取一些主觀認為密切相關的視覺特征,比如顏色、紋理、形態(tài)、速度等,這些特征是否合理,是否充分,目前沒有相關的理論支撐。近年來深度學習技術在各行各業(yè)廣泛使用,其不需要人為提取特征的優(yōu)勢,給浮選生產的信息化和智能化輸入新的血液,本文研究出了一種基于深度學習的浮選精礦品位在線預測模型,模型的輸入為浮選泡沫圖像序列、原礦品位值和尾礦品位值,輸出為精礦品位值,屬于回歸問題。對比了主干網絡分別為VGG-16、ResNet-50和MobileNet-V2時預測結果的差異,實驗結果顯示VGG-16的預測精度和魯棒性最好,平均預測精度達到12.48%。
傳統(tǒng)機器學習常通過“特征工程”針對不同任務設計特定特征以實現對數據的特征提取,比如在傳統(tǒng)計算機視覺領域,常用全局特征描述子和局部特征描述子對圖像進行表示,但是實際工程中的學習任務復雜多變,針對具體任務設計生成特定特征復雜費力且缺乏泛化性和魯棒性,難以擴展運用于其他任務。深度學習是機器學習的一個分支領域,是從原始數據中自動學習特征表示的一種新方法,強調從連續(xù)的層(Layer)中進行學習,這些層的輸出對應著越來越有意義、越來越抽象的表示。
深度學習模型每一層對其輸入數據所進行的操作保存在該層的權重(Weight)中,其本質是一個向量或多維矩陣。深度學習模型訓練過程即為模型每一層找到合適的權重值,使得模型輸出與其目標相適應。模型的訓練過程由損失函數(Loss function)和優(yōu)化器(Optimizer)進行控制。損失函數,又稱目標函數(Objective function),其輸入是模型預測值與真實目標值,然后計算一個距離值(損失值)用于衡量該模型在樣本數據上的效果好壞。優(yōu)化器基于損失函數計算的損失作為反饋信號對權重進行調整更新,以降低模型預測值與真實目標值的距離。模型訓練初始對每一層的權重進行隨機賦值,其預測值與真實目標值自然相差甚遠,體現在損失值很高。隨著訓練樣本的輸入,每一層權重值也逐步的向正確的方向進行調整,同時損失也逐漸降低,即模型的訓練過程(見圖1)。
圖1 深度學習模型訓練過程
精礦品位預測要得到的模型是:
f(圖像序列,原礦品位,尾礦品位)=精礦品位
可將其視為單目標回歸任務,很多機器學習模型都能解決單目標回歸任務,但是由于輸入中有圖像序列,為了防止參數過大,實驗中用到的網絡模型是從CNN發(fā)展出來的VGG-16[5]網絡、ResNet-50[6]網絡和MobileNet-V2[7]網絡。
德興銅礦作為我國規(guī)模最大的銅礦,多年來在資源綜合回收利用方面做了大量有成效的工作,但是受裝備技術水平的制約,每年損失在尾礦中的銅金屬仍然有10%左右。江西銅業(yè)股份有限公司與礦冶科技集團有限公司聯合開展尾礦再選提升回收率工業(yè)試驗項目,依托礦冶科技集團有限公司單槽容積為680 m3的世界第一大浮選機成套裝備技術,在德興銅礦泗洲選礦廠一期18 000 t/天磨浮系列生產線建立起工業(yè)試驗系統(tǒng)。本文的研究工作是在這臺680 m3浮選機上進行的。
浮選泡沫圖像儀(見圖2)主要由工業(yè)CCD數碼相機、高亮點光源以及幾字型支架和保護外罩組成。將泡沫圖像儀安裝于浮選機溢流堰正上方,通過采集裝置內的高清工業(yè)照相機將連續(xù)的泡沫序列Images傳輸至圖像處理工作站,圖像的每一個像素的色彩空間為RGB空間。
圖2 浮選泡沫圖像采集儀
實驗中發(fā)現采用拍攝的圖像序列直接訓練模型的收斂速度很慢,預測精度也不高,需要對圖片進行了數據預處理與增強,處理過程包括對圖像數據進行縮放、對所有數據進行歸一化、遮蓋無貢獻部分圖像。
1)圖像縮放
為了直接利用預訓練模型對任務進行處理,對圖像進行縮放以適配預訓練網絡模型的輸入大小,將圖像由原來1 278×958大小縮放為224×224,具體的縮放是通過雙線性插值來實現的。在數學上,雙線性插值是有兩個變量的插值函數的線性插值擴展,其核心思想是在兩個方向分別進行一次線性插值。
假設已知函數f在Q11=(x1,y1),Q12=(x1,y2),Q21=(x2,y1),Q22=(x2,y2)四個點的值,則點p的值可以計算為:
(1)
2)數據歸一化
使用Z-score標準化的方法對所有數據進行歸一化處理,使得經過處理的數據符合標準正態(tài)分布,即均值為0,標準差為1,轉化函數見式(2)。
(2)
式中,μ為樣本數據的均值;σ為樣本數據的標準差。
3)圖像遮蓋
輸入圖像如圖3所示。圖像中紅線以上圖像對結果預測沒有幫助,因此,通過掩碼設計,對紅線以上部分圖像進行遮蓋。具體來說,直接將上半部分圖像像素設置為整幅圖像像素值的平均數(式3)。
圖3 圖像遮蓋
(3)
其中,H和W為圖像的高和寬的大小;vij為圖像中第i行第j列的像素值。
根據現場熒光取樣裝置的設置,精礦熒光閥門開啟后存儲3 s 75幀的圖像,精礦熒光閥門關閉后讀取原礦品位、精礦品位、尾礦品位。
從75張圖片中隨機抽取25張作為輸入,經過縮放后按照通道維度拼接為1張25×3通道維度的圖像,直接送入預訓練模型,預訓練模型輸出圖片序列對應的特征表示向量,最后,拼接原礦、尾礦品位值,送入3層全連接網絡進行精礦品位回歸預測(圖4)。
圖4 深度學習模型和數值信息處理
使用Python3.8編程語言、PyTorch1.9.0深度學習框架,結合Intel(R)Xeon(R)Gold 5218 CPU @ 2.30GHz處理器,在Ubuntu18.04操作系統(tǒng)下進行實驗。使用Tesla V100顯卡、CUDA11.4和cuDNN8.2.2調用GPU進行加速。迭代次數N取150,使用Adam梯度下降,學習率取0.000 1,batch大小為96。
實驗中共標注了802個訓練樣本,每個訓練樣本有75張圖片和2個輸入標量,隨機采樣25張圖片作為訓練數據。為進行模型訓練與驗證,將其按照訓練、驗證集8∶2分配,即:訓練集641個樣本,驗證集161個樣本。
圖5、6和圖7分別展示了VGG-16、ResNet-50和MobileNet-V2在訓練過程中,訓練、驗證損失變化和預測結果與標注值的差值圖。從結果上看,三個模型的訓練集損失曲線和交叉驗證集損失曲線都隨著迭代次數增加逐步下降并趨于平緩,但VGG-16的2個曲線重合度更好,模型的擬合能力更高一些。為了得到更多信息,進一步對數據進行統(tǒng)計分析,得到表1。表1中R2為決定系數,又稱擬合優(yōu)度,其值越大表明自變量對因變量的解釋程度越高,模型的魯棒性也越高。平均絕對誤差、均方誤差、最大差值都從不同側面反映出了預測精度,其值越小越好。表1再一次證明VGG-16在預測精度和魯棒性上表現都是最好的。
圖5 VGG-16訓練中損失變化和差值圖
圖6 ResNet-50訓練中損失變化和差值圖
圖7 MobileNet-V2訓練中損失變化和差值圖
表1 精礦品位預測結果的數據分析
1)一般的基于機器視覺的精礦品位預測,均是通過研究特定的泡沫圖像處理方法提取泡沫表面的一個或者多個視覺特征,進而通過大量的樣本統(tǒng)計分析這些視覺特征與精礦品位的相互關系,建立相應的關系模型,實際上泡沫圖像序列暗含了浮選泡沫的顏色、紋理、速度等信息,加上原礦品位和尾礦品位對信息的補充,借助深度學習技術預測精礦品位是一種行之有效的解決方案。
2)在德興銅礦尾礦再選的680 m3浮選機上,網絡模型VGG-16在解決浮選泡沫圖像序列精礦品位預測問題上,其預測精度和魯棒性表現更好。
3)在深度學習的訓練過程中,訓練數據是很重要的,提高訓練樣本集的數量,會使預測精度和魯棒性得到進一步提升。