杜錦程 ,吳福森,陳丙三
(1.福建工程學(xué)院 機(jī)械與汽車工程學(xué)院,福建 福州 350118;2.福建省特種設(shè)備檢驗研究院 泉州分院,福建 泉州 362011)
概率篩是篩分作業(yè)中使用最廣的設(shè)備之一[1-2]。在實際應(yīng)用中,概率篩的結(jié)構(gòu)及運行參數(shù)的選擇主要依據(jù)振動機(jī)械設(shè)計理論中參數(shù)的設(shè)定范圍,結(jié)合不同行業(yè)的實際使用狀態(tài)加以改進(jìn)。為了提高概率篩的篩分效率,獲得概率篩的最優(yōu)運行參數(shù)或結(jié)構(gòu)參數(shù),國內(nèi)外學(xué)者開展了許多相關(guān)研究。Davoodi等[3]研究了孔徑在不同材料中的變化,以及孔徑形狀和篩選介質(zhì)材料的不同對篩選性能的影響,利用離散元法(DEM)建模模擬篩分過程明顯提高了篩分的分辨率。Ferenc等[4]通過對單球顆粒在振動篩非慣性參照系中的運動分析,確定了振動篩的最佳振動參數(shù)。鄭桂霞等[5]應(yīng)用支持向量機(jī)算法,建立預(yù)測模型來預(yù)測不同的概率篩結(jié)構(gòu)參量和運行參量條件下的篩分效率,得出支持向量機(jī)在小樣本、非線性及高維模式下識別問題中表現(xiàn)的許多優(yōu)勢[6-7]。黃宜堅[8]利用基于自回歸 (AR) 模型估計的雙譜及其對角切片, 找出譜特征與篩分效率之間的相關(guān)性。
上述研究針對篩分效率的建模分析與預(yù)測精度均與核函數(shù)的選擇及參數(shù)設(shè)置有關(guān),但目前針對篩分效率的預(yù)測精度仍然有局限性。核函數(shù)的選擇對概率篩預(yù)測精度有較大影響,本研究將最小二乘支持向量機(jī)分類算法(least squares support vector machine,LS-SVM)引入自同步概率篩篩分效率預(yù)測建模,同時探討核函數(shù)對LS-SVM 預(yù)測精度的影響通過網(wǎng)格搜索法和交叉驗證法來選擇合適的核函數(shù)進(jìn)行預(yù)測精度研究,并應(yīng)用于概率篩振動參數(shù)與篩分效率之間的關(guān)系研究,為概率篩結(jié)構(gòu)的進(jìn)一步改進(jìn)提供依據(jù)。
Vapnik等人早在20世紀(jì)70年代就已經(jīng)建立了統(tǒng)計學(xué)習(xí)理論的基本體系,系統(tǒng)研究了機(jī)器學(xué)習(xí)的問題,尤其是有限樣本情況下的統(tǒng)計學(xué)習(xí)問題[9]。LS-SVM方法是Suykens[10]于1999年在支持向量機(jī)基礎(chǔ)上提出的改進(jìn)算法,主要針對大規(guī)模數(shù)據(jù)集的處理、處理數(shù)據(jù)的魯棒性、參數(shù)調(diào)節(jié)和選擇問題、訓(xùn)練以及仿真。
模型描述:將不等式約束條件轉(zhuǎn)變成等式約束,使求解過程變?yōu)榫€性的運算,保證分類精度的同時簡化了計算量,其訓(xùn)練通過式(1)完成[10-11]:
(1)
s.t.yi=wT·g(xi)+b+ξii=1,2,…,n
式中,x為輸入數(shù)據(jù);y為輸出數(shù)據(jù);w為權(quán)重向量;g(xi)是將x從輸入空間映射到特征空間的函數(shù);ξ是xi的松弛系數(shù),C是邊界系數(shù)。式(1)的Lagrange目標(biāo)函數(shù)為:
(2)
令式(2)對w,b,ξ的偏導(dǎo)為零,可得:
(3)
(4)
(5)
將式(1)~(4)結(jié)合式(5)的條件消去w,ξ可以得到一個線性系統(tǒng):
(6)
為了避免直接處理變量的空間映射,可以利用核函數(shù)K(xi,xj)=g(xi)g(xj)來減少計算維度以此來降低計算的復(fù)雜度。
求解矩陣式(6)可解得α和b,代入(3)求解出w后得到回歸函數(shù):
(7)
概率篩以概率篩分理論為基礎(chǔ),產(chǎn)品物料粒度篩分級別與篩網(wǎng)網(wǎng)孔直徑不完全吻合,篩分出的各種粒度級別產(chǎn)品會混有其他粒度級別的顆粒。為了適應(yīng)概率篩篩分效率計算公式,美國學(xué)者R·T·漢考克于1918年提出總效率公式(漢考克效率)來解決這一問題,其式如下:
篩分總效率(η)=
目的物的回收率(η1)- 非目的物的混雜率(η2)
(8)
目的物的回收率:
(9)
非目的物的混雜率:
(10)
篩分機(jī)入料口的物料總量M和篩上的物料總量U及篩下物料總量D滿足關(guān)系式:
M=U+D
(11)
M·a=U·b+D·c
(12)
由式(11) 和(12)可以推得:
(13)
再將式(13)代入式(8)中得:
(14)
式中,a為原始物料中小于規(guī)定粒度的物料質(zhì)量所占總質(zhì)量的比值;b為篩上物料中小于規(guī)定粒度的細(xì)粒物料占總質(zhì)量的比值;c為篩下物料中小于規(guī)定粒度的細(xì)粒物料占總質(zhì)量的比值,其中規(guī)定粒度是根據(jù)用戶對產(chǎn)品的粒度要求而確定的。篩分總效率公式是反映篩分過程的綜合指標(biāo)。
實驗主要研究設(shè)備包括料倉、給料器、螺旋輸送器、 Gls10概率篩以及GLs10概率篩樣機(jī),對干沙的處理量達(dá)到每小時5.0 t,使用的篩網(wǎng)尺寸為800 mm×600 mm,篩網(wǎng)規(guī)格為0.7 mm×0.7 mm。
根據(jù)自同步概率篩工作原理,確定實驗過程中對概率篩篩分效率有較大影響的4個工藝參數(shù),并針對這4個工藝參數(shù)進(jìn)行不同參數(shù)的自同步概率篩篩分實驗。為了對篩分效率進(jìn)行對比驗證,給料速度設(shè)為2.0 t/h和3.0 t/h,由經(jīng)驗可知振動圓頻率一般為700~1200 r/min,實驗分別對振動圓頻率為700、750、800、850、950、1 100、1 200 r/min的情況進(jìn)行實驗。篩網(wǎng)傾角選擇18°、19°、20°、21°、22°、26°,振幅選擇范圍為3~7 mm,此時篩分效率變化明顯。本次試驗篩分產(chǎn)品規(guī)定粒度為0.6 mm,實驗結(jié)果如表1所示。
表1 自同步概率篩實驗安排Tab.1 Experiment arrangement of the self-synchronous probabilistic sieve
實驗結(jié)合不同的振動參數(shù)進(jìn)行多次篩分實驗,記錄不同出料口的物料質(zhì)量,確立不同出料口物料的顆粒大小的含量情況,研究不同振動參數(shù)的篩分性能。以自同步概率篩實際篩分?jǐn)?shù)據(jù)作為LS-SVM模型預(yù)測的實驗及學(xué)習(xí)對照樣本,部分參數(shù)配比在實際中無法測出,將其當(dāng)作預(yù)測樣本。
對自同步概率篩不同振動參數(shù)情況進(jìn)行篩分實驗,計算不同篩分作業(yè)情況的篩分效率。由于實驗過程中人為因素的影響,導(dǎo)致部分粗大誤差數(shù)據(jù)點,因此需要對篩分記錄數(shù)據(jù)進(jìn)行預(yù)處理,通過分析篩分效率的變化趨勢,根據(jù)實際情況對于篩分效率與整體變化趨勢相悖較大的實驗數(shù)據(jù),認(rèn)為該次實驗數(shù)據(jù)有誤,應(yīng)當(dāng)剔除,以此提供準(zhǔn)確的數(shù)據(jù)進(jìn)行篩分概率的研究分析。圖1和圖2分別表示給料速度為2.0、3.0 t/h,振幅固定時的概率篩篩分效率出現(xiàn)粗大誤差數(shù)據(jù)隨振動頻率的數(shù)據(jù)變化情況,圖中三角形標(biāo)記的數(shù)據(jù)點是誤差點,剔除這部分?jǐn)?shù)據(jù)后建立自同步概率篩篩分效率預(yù)測建模的支持向量機(jī)樣本庫。
圖1 不同振動參數(shù)的篩分效率分布情況(給料速度2.0 t/h)Fig.1 Distribution of screening efficiency of different vibration parameters (feeding speed 2.0t/h)
圖2 不同振動參數(shù)的篩分效率分布情況(給料速度3.0t/h)Fig.2 Distribution of screening efficiency of different vibration parameters (feeding speed 3.0t/h)
模式識別是一種對輸入數(shù)據(jù)進(jìn)行診斷并根據(jù)診斷出的類別采取相應(yīng)行為的學(xué)習(xí)方法。其基本實現(xiàn)過程是預(yù)處理、特征提取和分類。利用LS-SVM算法建立一個概率篩篩分效率的分類器對輸入數(shù)據(jù)賦予一個類別標(biāo)記,研究該分類器的可靠性以及推廣能力,該LS-SVM篩分效率預(yù)測模型是利用MATLAB 2018編寫最小二次支持向量機(jī)程序來實現(xiàn)的,實驗數(shù)據(jù)為自同步概率篩篩分實驗記錄的不同參數(shù)下的篩分效率情況。程序流程如圖3所示。
圖3 LS-SVM模型建立流程Fig3 LS-SVM model building process
(1)數(shù)據(jù)預(yù)處理。實驗中對各種參數(shù)情況下自同步概率篩篩分產(chǎn)品進(jìn)行收集,記錄各篩面出口產(chǎn)品重量,利用上述總效率公式計算各種工況下概率篩篩分效率。
(2)確立LS-SVM模型數(shù)據(jù)樣本。將影響概率篩篩分性能的因素,即給料速度、振動圓頻率、篩面傾角和篩面振幅4個參數(shù)指標(biāo),記為xi;分類閾值標(biāo)準(zhǔn)yi,我們規(guī)定篩分效率大于80%的樣本記為y=1,篩分效率小于80%的樣本記為y=-1。
(3)輸入學(xué)習(xí)樣本(xi,yi)。將實驗獲得的130組數(shù)據(jù)分成兩部分,其中100組作為訓(xùn)練樣本,30組作為預(yù)測樣本。
(4)對學(xué)習(xí)樣本進(jìn)行參數(shù)尋優(yōu),通過網(wǎng)格和交叉算法,對核參數(shù)的選擇進(jìn)行優(yōu)化,并以此進(jìn)行LS-SVM模型的訓(xùn)練。
(5)把預(yù)測樣本輸入已建立的LS-SVM模型進(jìn)行計算,將計算結(jié)果與實驗真實值比較,誤差采用錯分率e來評價LS-SVM模型的推廣能力,如式(15):
(15)
合適的核函數(shù)參數(shù)和誤差懲罰因子,能夠增強LS-SVM模型的推廣性能。為了研究將LS-SVM算法引入概率篩篩分效率預(yù)測建模的可行性,同時選用不同核函數(shù)進(jìn)行LS-SVM的建模,比較3種常用核函數(shù)的建模預(yù)測情況。
采用多項式建模情況下,誤差懲罰因子C的改變對模型預(yù)測精度影響較小,而多項式核函數(shù)階數(shù)d的改變對模型預(yù)測精度影響較大。采用多項式核函數(shù)建模,預(yù)測結(jié)果如表2所示。比較各個參數(shù)情況的建模結(jié)果,只在多項式階數(shù)d=2時建模預(yù)測精度最好,最高識別率達(dá)到96.7%,達(dá)到建模預(yù)測效果,所建模型有較好的泛化能力,但是學(xué)習(xí)能力不足,并且多項式核函數(shù)的階數(shù)比較高時核矩陣的元素值將趨于無窮大或者無窮小,計算復(fù)雜度會大到無法計算。
表2 多項式核函數(shù)建模分類情況Tab.2 LS-SVM classification by using polynomial kernel function
續(xù)表2
觀察表3可得,誤差懲罰因子C在一定范圍內(nèi)增大能夠提高模型的識別率,而RBF核參數(shù)σ2的增大致使模型的識別率下降,所以建模時綜合考慮二者影響情況,合理選擇C和σ2使模型的識別率達(dá)到最高。采用RBF核函數(shù)建模預(yù)測獲得理想結(jié)果,當(dāng)參數(shù)C=2和σ2=15;C=20,σ2=60;C=50,σ2=60時模型預(yù)測識別率都達(dá)到100%,達(dá)到理想建模預(yù)測效果,表明采用RBF核函數(shù)建模預(yù)測是可行的,所建模型具有較高的泛化性能。
表3 RBF核函數(shù)建模分類情況Tab.3 LS-SVM classification by using RBF kernel function
由表4可得,采用Sigmoid核函數(shù)建模預(yù)測不夠理想,無論對學(xué)習(xí)樣本還是對預(yù)測樣本的識別率都低于80%,建模分類效果最差,因此Sigmoid核函數(shù)不適合應(yīng)用于自同步概率篩篩分效率預(yù)測建模。
表4 Sigmoid核函數(shù)建模分類情況Tab.4 LS-SVM classification by using Sigmoid kernel function
選擇采用將交叉驗證法(CV)和網(wǎng)格搜索法結(jié)合的方法運用MATLAB程序自動對核參數(shù)進(jìn)行尋優(yōu),獲得優(yōu)化核參數(shù)為C=9.5和σ2=56.6,計算預(yù)測樣本的估計輸出與實驗值的相對均方誤差為e=1.44%,預(yù)測結(jié)果如圖4所示。
圖4 LS-SVM建模的實驗值與預(yù)測數(shù)據(jù)比較Fig.4 Comparison of LS-SVM modeling experimental values and predicted data
觀察圖4中LS-SVM模型預(yù)測出的篩分效率值與對應(yīng)的實驗中各中工藝參數(shù)下概率篩所獲得的篩分效率值大小非常接近,單次最大誤差百分比為3.14%。LS-SVM比S-SVM大大簡化了運算算法,但由此卻給建立的LS-SVM模型帶來了魯棒性的不足,因此采用加權(quán)的方法來提高LS-SVM模型的魯棒性。對已經(jīng)建立的LS-SVM模型,再進(jìn)行Weighted LS-SVM建模,增強模型的魯棒性,進(jìn)行了魯棒性訓(xùn)練后的預(yù)測結(jié)果,相對均方誤差e=1.22%,模型預(yù)測精度有一定的提高,單次預(yù)測最大誤差百分比下降為2.27%,表明此模型具有更強的推廣能力,進(jìn)一步表明基于LS-SVM的概率篩篩分效率預(yù)測建模的優(yōu)越性。
分析3種核函數(shù)實驗建模預(yù)測結(jié)果,可以得到這樣的結(jié)論:1)采用多項式(Poly)核函數(shù)和RBF核函數(shù)建模預(yù)測都取得理想效果,Sigmoid核函數(shù)建模預(yù)測不夠理想,分類效果最差。2)Poly核函數(shù)是一個全局性函數(shù),具有較強的泛化能力,但是學(xué)習(xí)能力較弱是導(dǎo)致實驗?zāi)P皖A(yù)測識別率不高的主要原因。3)RBF核函數(shù)是一個典型的局部性核函數(shù),泛化能力不如Poly核函數(shù),僅僅在測試點附近小領(lǐng)域類對數(shù)據(jù)點有影響,因此當(dāng)預(yù)測樣本數(shù)據(jù)在學(xué)習(xí)樣本數(shù)據(jù)點附近時,建模核函數(shù)選用RBF核函數(shù)為最佳。4)實驗建模預(yù)測結(jié)果也表明預(yù)測樣本輸入?yún)?shù)在學(xué)習(xí)樣本參數(shù)附近時,模型識別率都很理想,最高達(dá)到100%。