李昊,張晞
1.中國煤炭科工集團(tuán) 北京天地瑪珂電液控制系統(tǒng)有限公司,北京 100013 2.中國礦業(yè)大學(xué)(北京) 機(jī)電與信息工程學(xué)院,北京 100083;
在綜采工作面自動(dòng)化生產(chǎn)工藝中,液壓支架是長壁開采支護(hù)設(shè)施的主要設(shè)備[1],液壓支架自動(dòng)跟機(jī)移架已在現(xiàn)場生產(chǎn)中得到大量的應(yīng)用。但與之協(xié)同工作的乳化液泵站在大部分自動(dòng)化工作面尚未實(shí)現(xiàn)自動(dòng)供液。作為工作面生產(chǎn)的動(dòng)力來源,泵站供液能力對(duì)液壓支架的動(dòng)作速率有著很大的影響,從而會(huì)影響采煤機(jī)牽引速度乃至整個(gè)工作面的自動(dòng)化效率[2]。液壓支架單架移架和多架移架時(shí),流量和壓力的大小對(duì)液壓支架的動(dòng)作速度有很大影響。單泵供液時(shí),移架動(dòng)作數(shù)量(包括降柱、抬底、升柱、推移等)越多,支架各個(gè)動(dòng)作速度就會(huì)越慢,移架速度也越慢。當(dāng)采煤機(jī)牽引速度達(dá)到一定值時(shí),需要至少2臺(tái)液壓支架同時(shí)移架支護(hù)才能達(dá)到支架追機(jī)作業(yè)的要求,如果泵站供液不足,就會(huì)出現(xiàn)液壓支架動(dòng)作速度緩慢,跟不上采煤機(jī)的牽引速度,出現(xiàn)空頂、丟架子等問題[3]。因此,研究能夠按需供液的供液系統(tǒng)自動(dòng)控制方法有著重要的意義。
泵站通常以四泵三箱(或三泵兩箱等)多乳化液泵的形式組成,其控制的目標(biāo)是通過啟停不同數(shù)量的泵或調(diào)解變頻泵功率,調(diào)解整體的輸出流量。因此,泵站的自動(dòng)化控制的核心是泵站要具備自主決策啟泵數(shù)量的能力。文獻(xiàn)[4-6]提出了以供液系統(tǒng)出口壓力為控制目標(biāo)的恒壓控制方法,利用啟停不同數(shù)量的乳化液泵使出口壓力趨近目標(biāo)壓力值。文獻(xiàn)[7]采用ENN(Elman Neural Network)預(yù)測出口壓力值進(jìn)行泵啟??刂频姆椒?。文獻(xiàn)[8]提出一種基于支架動(dòng)作識(shí)別的流量匹配的供液方案。文獻(xiàn)[9]計(jì)算了供液過程中管道壓力的損失,并結(jié)合理論計(jì)算得出液壓支架的動(dòng)作流量需求,設(shè)計(jì)了一種基于粒子群混合算法的流量匹配控制算法。以上的研究多數(shù)集中在供液系統(tǒng)本身,盡管有與液壓支架動(dòng)作進(jìn)行關(guān)聯(lián)的分析研究,也均是圍繞供液單元與用液機(jī)單元之間的機(jī)理研究,以推導(dǎo)計(jì)算流量和壓力所需的算法為目標(biāo)。由于整個(gè)工作面用液單元多,液壓支架、采煤機(jī)等系統(tǒng)的控制邏輯復(fù)雜多變,且供液管路形式不一、長距離供液管道損失大等環(huán)境因素的影響,導(dǎo)致針對(duì)供液機(jī)理的研究算法難以推導(dǎo)和計(jì)算,因此現(xiàn)有的研究成果未能在實(shí)際應(yīng)用中取得較好的效果。基于此,筆者提出了一種新的基于人工智能思想的乳化液泵站啟??刂频淖灾鳑Q策模型,將研究思路從傳統(tǒng)的研究流量和出口壓力的變化機(jī)理,轉(zhuǎn)變?yōu)橥ㄟ^實(shí)際人工啟停泵操作進(jìn)行數(shù)據(jù)建模,將整個(gè)工作面的供液單元、用液機(jī)單元和相關(guān)設(shè)備視為一個(gè)整體系統(tǒng),利用系統(tǒng)的“I/O”數(shù)據(jù)建立乳化液泵啟停決策模型。通過分析大量的實(shí)際生產(chǎn)過程數(shù)據(jù)可知,數(shù)據(jù)中的“果”為啟泵數(shù)量(出口流量),可以通過簡單計(jì)算得出,屬于已知量,因此研究的重點(diǎn)在于“因”,即分析影響決策的相關(guān)因素(如液壓支架跟機(jī)移架動(dòng)作、采煤機(jī)牽引速度)以及各影響因素對(duì)供液的影響占比等。本文在分析確定影響因素后,利用決策樹、隨機(jī)森林算法分別對(duì)歷史數(shù)據(jù)進(jìn)行模型訓(xùn)練,建立泵站啟停決策模型,提出了針對(duì)樣本數(shù)據(jù)的不平衡問題的優(yōu)化算法,對(duì)隨機(jī)森林算法優(yōu)化權(quán)重配比,并通過現(xiàn)場工作面的實(shí)驗(yàn),驗(yàn)證了模型的效果,提高了模型的準(zhǔn)確率和工作面的供液效率。
液壓支架是“用液耗能”單元,液壓支架的動(dòng)作模式直接影響乳化液泵的輸出控制。為適應(yīng)不同的跟機(jī)速度,常見的跟機(jī)策略有串行移架和并行移架,如圖1所示。文獻(xiàn)[10-12]分析了具體跟機(jī)的邏輯,整個(gè)過程為:以采煤機(jī)位置為基準(zhǔn),采煤機(jī)前進(jìn)方向某一液壓支架依次進(jìn)行收互幫動(dòng)作,采煤機(jī)后滾筒另一液壓支架進(jìn)行移架動(dòng)作(降柱、移架、升柱),遠(yuǎn)處的支架進(jìn)行推移動(dòng)作;在降柱、移架、升柱整個(gè)過程中,移架動(dòng)作對(duì)供液流量的要求最高。
圖1 串行移架和并行移架過程示意Fig.1 Serial shifting and parallel shifting
液壓支架整個(gè)自動(dòng)跟機(jī)過程與采煤機(jī)的牽引速度、位置以及行進(jìn)方向緊密關(guān)聯(lián),特別是采煤機(jī)牽引速度較低時(shí),可以采用串行移架策略,即支架依次順序移架;隨著采煤機(jī)牽引速度的增大,移架速度增大,供液系統(tǒng)需要及時(shí)調(diào)整流量和壓力,滿足采煤機(jī)和支架的運(yùn)行速度,當(dāng)采煤機(jī)牽引速度達(dá)到一定值、超過液壓支架動(dòng)作速度設(shè)計(jì)時(shí)限時(shí),則需要改用并行移架策略,使液壓支架跟機(jī)速度能匹配采煤機(jī)牽引速度。因此,需要對(duì)液壓支架動(dòng)作過程的供液特征、采煤機(jī)牽引速度與供液系統(tǒng)流量的匹配關(guān)系進(jìn)行研究。
本文的仿真計(jì)算以某礦綜采工作面實(shí)際情況為研究對(duì)象,控制參數(shù)按照實(shí)際控制器參數(shù)設(shè)定,以保證計(jì)算的真實(shí)性和可靠性。液壓支架型號(hào)為ZY6800/11.5/24D,主要參數(shù)見表1;供液系統(tǒng)為四泵三箱組成,單泵為400 L流量乳化液泵,工作面采用環(huán)形供液方式,如圖2所示。
表1 液壓支架參數(shù)值
圖2 環(huán)形供液原理Fig.2 Principle diagram of annular liquid supply
單臺(tái)液壓支架在跟機(jī)自動(dòng)化過程中主要完成降柱-移架-升柱(簡稱降-移-升)和推移,在時(shí)間上這2個(gè)動(dòng)作是分離的,為了仿真計(jì)算的簡化,把推移動(dòng)作放在前面動(dòng)作完成后進(jìn)行。按計(jì)算要求,主要時(shí)間參數(shù)設(shè)置:① 支架降柱時(shí)間為4 s;② 降柱4 s后進(jìn)行移架動(dòng)作;③ 移架行程到達(dá)900 mm時(shí),延時(shí)0.5 s; ④ 移架延時(shí)0.5 s后,進(jìn)行支架升柱;⑤ 立柱下腔達(dá)到壓力規(guī)定值時(shí)停止。
仿真過程分別以1臺(tái)泵、2臺(tái)泵開啟時(shí)計(jì)算支架靜態(tài)動(dòng)作時(shí)間,并計(jì)算跟機(jī)時(shí)與采煤機(jī)匹配的牽引速度。為方便計(jì)算、分析和匹配采煤機(jī)的牽引速度,以單臺(tái)液壓支架動(dòng)作為例,采煤機(jī)每經(jīng)過1臺(tái)支架的寬度時(shí)間內(nèi),支架應(yīng)完成整個(gè)動(dòng)作流程。因此,單臺(tái)液壓支架動(dòng)作時(shí)間和采煤機(jī)牽引速度有如下關(guān)系:
(1)
式中,t1為液壓支架配合采煤機(jī)牽引速度的動(dòng)作時(shí)間,s;L為液壓支架寬度,m;vm為采煤機(jī)牽引速度,m/min。
以采煤機(jī)牽引速度為7.5 m/min,支架寬度為1.5 m計(jì)算,則每個(gè)支架的理想動(dòng)作時(shí)間為12 s時(shí)才能保障支架動(dòng)作能協(xié)調(diào)采煤機(jī)牽引速度;在采煤過程中單臺(tái)液壓支架整個(gè)動(dòng)作流程包括降柱-移柱-升柱-推移(簡稱降-移-升-推)4個(gè)動(dòng)作,其中推移動(dòng)作和降-移-升動(dòng)作分別執(zhí)行,為不連續(xù)動(dòng)作,以降-移-升動(dòng)作總時(shí)間為主,故需要保證這4個(gè)動(dòng)作的時(shí)間要小于12 s;通過計(jì)算得出不同采煤機(jī)牽引速度所需要單臺(tái)液壓支架靜動(dòng)作時(shí)間見表2。
表2 采煤機(jī)牽引速度所需單臺(tái)液壓支架靜動(dòng)作時(shí)間
1.2.1 單泵供液時(shí)單臺(tái)液壓支架移架動(dòng)作(降-移-升)的仿真模擬
單臺(tái)400 L泵供液時(shí),單臺(tái)液壓支架控制模型的原理如圖3所示。其中主閥公稱流量500 L/min,壓力為40 MPa,流阻為7 MPa;液控單向閥流量為400 L/min,公稱壓力為50 MPa,流阻為7 MPa,控制開啟壓力為4 MPa;立柱初始位移為1.2 m,在該點(diǎn)開始接頂,其立柱的位移變化曲線如圖4(a)所示,推移缸的流量變化曲線如圖4(b)所示。
圖3 單泵供單缸成組降移升動(dòng)作原理Fig.3 Single cylinder Action
圖4 單泵供液時(shí)單臺(tái)液壓支架的位移和流量變化曲線Fig.4 Displacement and flow curves with 1 pump
仿真結(jié)果見表3,單泵供液單臺(tái)液壓支架動(dòng)作時(shí),其降柱時(shí)間為4 s,升柱時(shí)間為5.75 s;移架時(shí)全流量供液時(shí)間為3.72 s。其中,降柱過程中屬于壓力控制,所需凈流量最大為111 L/min,故動(dòng)作過程的剩余流量可以用于供應(yīng)推移或其他動(dòng)作。在降-移-升過程中剩余流量為(289×4)/60=19.3 L/s,推移用流量為(367×1.5)/60=9.18 L/s,故單臺(tái)泵供液1個(gè)周期中剩余容量為10.12 L/s,相當(dāng)于1.5 s總流量(400 L/min)狀態(tài),可供其他動(dòng)作所用。同時(shí),推移動(dòng)作中由于其直徑比變化小,其為壓力控制模式,裕度低;當(dāng)流量降低后即可變?yōu)榱髁靠刂颇J?,該?dòng)作獨(dú)立于“降-移-升”成組控制;當(dāng)動(dòng)作時(shí)間較短且為壓力控制模式時(shí),可將其同降柱控制在同一時(shí)間段,因此推移的1.5 s可不計(jì)入跟機(jī)動(dòng)作時(shí)長。由此得出,液壓支架跟機(jī)總動(dòng)作理論時(shí)長約為13.5 s。據(jù)此可知,其能匹配的采煤機(jī)牽引速度為6 m/min,即當(dāng)采煤機(jī)牽引速度等于或低于6 m/min時(shí),單泵供液可以滿足單臺(tái)液壓支架串行跟機(jī)速度。
表3 單泵供液單臺(tái)液壓支架動(dòng)作時(shí)流量分配
1.2.2 單泵供液2臺(tái)液壓支架移架動(dòng)作時(shí)的仿真模擬
液壓支架主閥公稱流量500 L/min,壓力為40 MPa,流阻為7 MPa;液控單向閥流量為400 L/min,公稱壓力為50 MPa,流阻為7 MPa,控制開啟壓力為4 MPa;立柱初始位移為1.2 m,在該點(diǎn)開始接頂。單臺(tái)400 L泵為2臺(tái)液壓支架同時(shí)動(dòng)作進(jìn)行供液時(shí),支架立柱的位移變化曲線如圖5(a)所示,推移缸的流量變化曲線如圖5(b)所示。
仿真結(jié)果見表4,單泵供液2臺(tái)液壓支架同時(shí)動(dòng)作時(shí),降柱時(shí)間為4 s,移架時(shí)間為6 s,升柱時(shí)間為11.5 s,故理論液壓支架跟機(jī)總動(dòng)作時(shí)長約為21.5 s。據(jù)此可知,其能匹配的采煤機(jī)牽引速度為3~4.5 m/min,即當(dāng)采煤機(jī)牽引速度低于 6 m/min時(shí),單泵供液2臺(tái)液壓支架并行跟機(jī)時(shí),須將采煤機(jī)的牽引速度控制在4.5 m/min以下。
圖5 單泵供液2臺(tái)液壓支架同時(shí)動(dòng)作時(shí)的位移與流量曲線Fig.5 Displacement and flow curves of two brackets acting simultaneously with 1 pump
表4 2臺(tái)液壓支架同時(shí)動(dòng)作時(shí)流量分配
1.2.3 雙泵供液單臺(tái)液壓支架移架動(dòng)作時(shí)的仿真模擬
液壓支架主閥公稱流量為500 L/min,壓力為40 MPa,流阻為7 MPa;液控單向閥流量為 400 L/min,公稱壓力為50 MPa,流阻為7 MPa,控制開啟壓力為4 MPa;立柱初始位移為1.2 m,在該點(diǎn)開始接頂,2臺(tái)400 L泵為單臺(tái)支架供液時(shí),支架立柱的位移變化曲線如圖6(a)所示,推移缸的流量變化曲線如圖6(b)所示。
圖6 雙泵供液單臺(tái)液壓支架動(dòng)作時(shí)的位移與流量曲線Fig.6 Displacement and flow curves for single bracket operation with 2 pumps
表5 雙泵供液單臺(tái)液壓支架移動(dòng)時(shí)各動(dòng)作所需流量分配Tab.5 Flow distribution table for single cylinder operation in two-pump-feed mode
仿真結(jié)果見表5,雙泵供液單臺(tái)液壓支架動(dòng)作時(shí),降柱時(shí)間為4 s,升柱時(shí)間為3 s,移架時(shí)間為1.4 s。在降-移-升過程中剩余流量為 (689×4)/60=46 L/s,推移用流量為 (367×1.5)/60=9.17 L/s,故雙泵供液1個(gè)周期中剩余流量為36 L/s,等效到其他動(dòng)作過程中,相當(dāng)于2.7 s總流量狀態(tài),單獨(dú)降-移-升動(dòng)作過程中需要時(shí)間約為8.7 s,故如果能利用降柱過程中的溢流流量,理論上總動(dòng)作時(shí)間可降低到6 s左右。即能夠匹配最大的采煤機(jī)牽引速度為 13.5~15 m/min。
綜上仿真結(jié)果分析可知,當(dāng)采煤機(jī)牽引速度在6 m/min以下時(shí),單泵供液可以滿足液壓支架跟機(jī)速度;當(dāng)采煤機(jī)牽引速度增大或者采用并行跟機(jī)時(shí),需要2臺(tái)泵供液??紤]實(shí)際生產(chǎn)過程遠(yuǎn)比靜態(tài)仿真環(huán)境復(fù)雜,液壓支架的動(dòng)作受到來自頂?shù)装迥Σ亮Φ榷喾矫嬉蛩氐挠绊?。因此,乳化液泵站和液壓支架組合運(yùn)行時(shí)還要充分考慮實(shí)際情況。
現(xiàn)有供液系統(tǒng)的自動(dòng)化控制邏輯是以出口壓力為判斷條件,預(yù)先設(shè)定壓力閾值,超過閾值時(shí)則啟動(dòng)第2臺(tái)泵,增大流量供給。壓力閾值按照經(jīng)驗(yàn)設(shè)定,壓力大于31.5 MPa時(shí),關(guān)閉1臺(tái)泵;壓力小于28 MPa時(shí),增開1臺(tái)泵。
通常安裝2個(gè)出口壓力傳感器,其出口壓力p需要進(jìn)行均值處理,其方法有2種情況:
(1) 求出口壓力平均值,即
(2)
式中,p為出口壓力平均值,MPa;pi為傳感器采集到的出口壓力值,i=1,2,MPa;N為傳感器的數(shù)量。
(2) 如果其中一個(gè)傳感器故障,則直接以另外一個(gè)數(shù)值為準(zhǔn),即出口壓力p=pi。傳感器采集的出口壓力值pi的取值規(guī)則為
(3)
如圖7所示,現(xiàn)有決策方式的問題在于泵站出口壓力在表象上抖動(dòng)頻繁,在短時(shí)間內(nèi)多次超過閾值,以此進(jìn)行泵的啟停決策會(huì)造成泵的頻繁啟停,影響使用壽命。因此,僅考慮泵站自身的出口壓力變化是不足以建立泵自主啟停決策模型的,還需要對(duì)造成出口壓力變化的影響因素進(jìn)行分析研究。
圖7 出口壓力時(shí)序Fig.7 Sequence Diagram of outlet pressure
在實(shí)際生產(chǎn)過程中,影響供液系統(tǒng)的因素很多,并非只有液壓支架的動(dòng)作。圖8所示為“一刀”過程中的煤機(jī)軌跡、液壓支架動(dòng)作數(shù)量與供液系統(tǒng)出口壓力的變化情況。其中,液壓支架動(dòng)作數(shù)量大時(shí),供液系統(tǒng)的出口壓力值多數(shù)會(huì)減小,但沒有呈現(xiàn)完全的線性關(guān)系。首先,液壓支架是串行供液的,由于管道損失,端頭到端尾存在管道壓降,不同位置液壓支架的同一動(dòng)作對(duì)供液系統(tǒng)的影響也不一樣,計(jì)算時(shí)需要相應(yīng)增加權(quán)重;其次,采煤機(jī)的牽引速度、位置、行進(jìn)方向與液壓支架動(dòng)作邏輯有耦合性[13],泵的流量與液壓支架動(dòng)作也具有耦合性,頂?shù)装迥Σ恋拳h(huán)境因素也影響支架動(dòng)作速度,影響因素較多且各因素具有耦合性。因此,乳化液泵自主啟停決策模型是一個(gè)非常復(fù)雜的多維非線性數(shù)學(xué)模型,難于推導(dǎo)與計(jì)算。
圖8 液壓支架動(dòng)作與煤機(jī)位置、泵站出口壓力影響Fig.8 Effect of hydraulic support actions and shearer position on pumping station pressure
針對(duì)此類問題,筆者采用基于學(xué)習(xí)算法的行為決策方法進(jìn)行建模,即通過對(duì)系統(tǒng)的I/O樣本數(shù)據(jù)進(jìn)行自主學(xué)習(xí)。該方法以決策樹等各類機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)的相關(guān)方法[14-15]為核心算法,行為規(guī)則庫由數(shù)據(jù)驅(qū)動(dòng)建立,利用不同的學(xué)習(xí)方法與網(wǎng)絡(luò)結(jié)構(gòu),將各系統(tǒng)特征量進(jìn)行直接的行為匹配,從而完成行為決策。
根據(jù)受控系統(tǒng)的I/O數(shù)據(jù)設(shè)計(jì)決策模型,首先將已有的數(shù)據(jù)集分成I/O兩部分,即(X,Y),其中,X={x1,x2,…,xs}是一組特征變量,即X={采煤機(jī)牽引速度,采煤機(jī)位置,采煤機(jī)方向,泵站出口壓力,1號(hào)支架動(dòng)作,…,m號(hào)支架動(dòng)作};Y={y1,y2,…,yp}為響應(yīng)變量,即當(dāng)前啟動(dòng)泵的數(shù)量。于是有
yi=fi(x1,x2,…,xs)
即每輸入一組特征變量,就可以得到一個(gè)對(duì)應(yīng)的系統(tǒng)響應(yīng)。設(shè)x(t)=[x1(t),x2(t),…,xs(t)]為t時(shí)刻系統(tǒng)狀態(tài)矢量,y(t)=[y1(t),y2(t),…,yp(t)]為t時(shí)刻系統(tǒng)的響應(yīng)矢量,則有
f(t)=f(x1(t),x2(t),…,xs(t))
(4)
根據(jù)記錄人工啟停泵的操作日志可知,在任意時(shí)刻啟泵數(shù)量是已知的,即y(t)={0,1,2,3};而采煤機(jī)牽引速度等特征變量在任意對(duì)應(yīng)時(shí)刻的數(shù)值可以通過設(shè)備傳感器采集或計(jì)算出來。因此,式(4)中的函數(shù)模型是一個(gè)分類模型。
針對(duì)分類模型設(shè)計(jì),利用模糊控制理論,有
IFx1isA1
ANDx2isA2
…
ANDxmisAm
THENy=f(x1,x2,…,xm)
則規(guī)則可表示為
IFx1isA1
ANDx2isB2
THENy=f1
IFx2isA2
ANDx1isB1
THENy=f2
其中,x1和x2為輸入變量;A1和A2是論域x1上的模糊集;B1和B2是論域x2上的模糊集。
設(shè)n為訓(xùn)練樣本總數(shù),G為類別數(shù),fi(Xj)為像元Xj對(duì)第i類的隸屬度,則訓(xùn)練樣本的模糊分割矩陣可構(gòu)造為
模糊均值和模糊協(xié)方差矩陣為
分類的關(guān)鍵是確定隸屬度,通常采用最大似然估計(jì)等概率論法。本文面臨的樣本數(shù)據(jù)屬于高維特征,應(yīng)用概率論算法不但運(yùn)算效率低,且容易出現(xiàn)“維度災(zāi)難”[16]。因此,采用CART(Classification And Regression Trees)算法進(jìn)行建模。
CART是一種二分遞歸分割的技術(shù),分割方法采用基于最小距離的Gini(基尼系數(shù))估計(jì)函數(shù)[17],跟機(jī)樣本數(shù)據(jù)中各特征量的Gini系數(shù)下降的程度視為其對(duì)分類結(jié)果的貢獻(xiàn)度,從而劃分模糊特征空間。將當(dāng)前的樣本集分為2個(gè)子樣本集,使得生成的每個(gè)非葉子節(jié)點(diǎn)都有2個(gè)分支。分類過程中,假設(shè)有K個(gè)類,樣本點(diǎn)屬于第k個(gè)類的概率為Pk,則概率分布的基尼系數(shù)定義為
(5)
根據(jù)基尼系數(shù)定義,可以得到樣本集合D的基尼系數(shù),即
(6)
式中,Ck為數(shù)據(jù)集D中屬于第k類的樣本子集;D為數(shù)據(jù)集。
如果數(shù)據(jù)集D根據(jù)特征A在某一取值a上進(jìn)行分割,得到D1和D2兩部分,那么在特征A下集合D的基尼系數(shù)為
(7)
其中,基尼系數(shù)Gini(D)為集合D的不確定性;基尼系數(shù)Gini(D,A)為A=a分割后集合D的不確定性。基尼系數(shù)越大,樣本集合的不確定性越大。對(duì)于屬性A,分別計(jì)算任意屬性值將數(shù)據(jù)集分為兩部分的Gini系數(shù),選取其中的最小值作為屬性A得到的最優(yōu)二分方案;然后對(duì)訓(xùn)練集S再計(jì)算所有屬性的最優(yōu)二分方案,選取其中的最小值作為樣本集S的最優(yōu)二分方案,有
(8)
(9)
首先,由于各特征量來源于不同的設(shè)備和傳感器,采樣頻率也不同,故需要以時(shí)間戳為基準(zhǔn)進(jìn)行數(shù)據(jù)整合;其次,由于液壓支架13個(gè)動(dòng)作中僅有4個(gè)動(dòng)作對(duì)供液流量影響較大,故需要進(jìn)行數(shù)據(jù)篩選;第三,同一時(shí)刻的液壓支架動(dòng)作數(shù)量不能直接從傳感器采集,需要計(jì)算得出??梢姡枰偻瓿纱罅康臄?shù)據(jù)預(yù)處理工作后,才可以進(jìn)一步構(gòu)建模型。整體的建模流程如圖9所示。
圖9 模型訓(xùn)練流程Fig.9 Flow chart of model training
以某礦綜采工作面實(shí)際生產(chǎn)數(shù)據(jù)為依據(jù),數(shù)據(jù)所涉及的變量有采煤機(jī)牽引速度、采煤機(jī)方向、采煤機(jī)位置、液壓支架控制數(shù)據(jù)(動(dòng)作數(shù)據(jù))、乳化液泵出口壓力、1—4號(hào)泵控制數(shù)據(jù)(啟停操作數(shù)據(jù))。各數(shù)據(jù)的采樣頻率不一,原則是發(fā)生變化即采集。
處理后的數(shù)據(jù)樣本數(shù)為26 953條,其中隨機(jī)抽取70%的數(shù)據(jù)作為訓(xùn)練樣本(共18 867條),剩余30%為檢測樣本(共8 086條)。將啟泵數(shù)量作為輸出量,其他作為輸入量,處理的樣本數(shù)據(jù)見表6。
表6 處理的樣本數(shù)據(jù)Tab.6 Processed sample data
3.2.1 數(shù)據(jù)篩選
原始的支架動(dòng)作數(shù)據(jù)包含降柱、移架、升柱、推移、伸收互幫、抬底、噴霧等多個(gè)動(dòng)作,部分動(dòng)作對(duì)流量影響較小[18],因此需要篩選出降柱、移架、升柱、推移4個(gè)關(guān)鍵動(dòng)作的數(shù)據(jù)。
首先,原始數(shù)據(jù)中僅有單支架動(dòng)作起止時(shí)間,需要計(jì)算得出動(dòng)作時(shí)長;其次,需要對(duì)動(dòng)作數(shù)據(jù)進(jìn)行編碼處理,以便于數(shù)據(jù)篩選及計(jì)算,液壓支架動(dòng)作編碼見表7,整理后的數(shù)據(jù)(以支架36為例)見表8。
表7 液壓支架動(dòng)作編碼
表8 支架樣本數(shù)據(jù)
3.2.2 數(shù)據(jù)整合
由于各個(gè)特征量采樣頻率不一,需要進(jìn)行時(shí)間對(duì)齊操作,找到在任意時(shí)刻各采樣點(diǎn)的數(shù)據(jù)狀態(tài),對(duì)部分?jǐn)?shù)據(jù)進(jìn)行重采樣操作。其中,啟停泵數(shù)據(jù)屬于操作數(shù)據(jù),由于實(shí)際開采過程中從泵啟到泵停的時(shí)間持續(xù)可能會(huì)達(dá)數(shù)小時(shí),樣本數(shù)據(jù)相對(duì)傳感器數(shù)據(jù)頻率較低,因此對(duì)其采用“升采樣”操作,即如果啟泵到停泵間隔1 h,原樣本數(shù)據(jù)只有2條,升采樣后,1 h內(nèi)的每秒鐘都有1條泵啟狀態(tài)數(shù)據(jù)。
常用的分類預(yù)測CART模型有決策樹和隨機(jī)森林2種算法,本文采用這2種算法構(gòu)建供液系統(tǒng)啟??刂颇P停⑼ㄟ^效果比較選擇最優(yōu)的分類模型。建模過程使用Tensorflow1.2,利用處理好的訓(xùn)練樣本構(gòu)建模型,采用測試樣本進(jìn)行模型驗(yàn)證,并通過混淆矩陣(Confusion Matrix,CM)進(jìn)行模型效果評(píng)估。
3.3.1 CART決策樹建模
訓(xùn)練所得的決策樹模型片段如圖10所示,由于整個(gè)樹模型非常大,此處僅截取一部分作為示意。圖11為決策樹模型驗(yàn)證混淆矩陣(CM)圖。其中,橫軸為預(yù)測應(yīng)啟泵數(shù)量,縱軸為實(shí)際啟泵的數(shù)量。其中,4 226次預(yù)測2個(gè)泵啟動(dòng)與實(shí)際相符,2 198次預(yù)測1個(gè)泵啟動(dòng)與實(shí)際相符,分類模型整體準(zhǔn)確率為88%。
預(yù)測2個(gè)泵啟動(dòng)而實(shí)際啟動(dòng)非2個(gè)泵的誤判率為
R=(17+350+14)/(17+350+14+4 226)
=8.2%
預(yù)測1個(gè)泵啟動(dòng)的誤判率為
R=(44+450)/(44+450+2 198)=18.3%
由此可見,決策樹建模的誤差較大。
圖10 CART決策樹模型片段示意圖Fig.10 Decision tree model fragment
圖11 決策樹模型驗(yàn)證CM圖Fig.11 Decision tree model verification CM diagram
3.3.2 CART隨機(jī)森林建模
訓(xùn)練所得的隨機(jī)森林模型節(jié)點(diǎn)較多,圖12為CART隨機(jī)森林模型一部分示意圖。圖13為隨機(jī)森林模型驗(yàn)證CM圖,整體的預(yù)測準(zhǔn)確率達(dá)到90%。
預(yù)測2個(gè)泵啟動(dòng)的誤判率為
R=(19+367+14)/(19+367+14+4253)
=8.2%
預(yù)測1個(gè)泵啟動(dòng)的誤差率為
R=(36+250)/(36+250+2186)=11.5%
相比于決策樹模型,CART隨機(jī)森林模型的預(yù)測成功率約提高了7%。
圖12 CART隨機(jī)森林模型片段示意圖Fig.12 Random forest model fragment
圖13 CART隨機(jī)森林模型驗(yàn)證CM圖Fig.13 Random forest model verification CM diagram
雖然單泵啟動(dòng)預(yù)測準(zhǔn)確率降低到11%,但相比于2泵啟動(dòng)預(yù)測準(zhǔn)確率的8.2%仍然較高,其主要原因在于樣本數(shù)據(jù)的不平衡性。圖14為樣本數(shù)據(jù)的分布情況,由于2泵啟動(dòng)的樣本遠(yuǎn)多于單泵啟動(dòng)的樣本數(shù)量,這樣的數(shù)據(jù)集訓(xùn)練出來的算法“偏向”于識(shí)別新樣本為2泵啟動(dòng),這是一個(gè)數(shù)據(jù)不平衡問題。
圖14 樣本數(shù)據(jù)中0—3個(gè)泵同時(shí)運(yùn)行時(shí)長數(shù)據(jù)分布Fig.14 Sample data distribution
代價(jià)敏感學(xué)習(xí)是使隨機(jī)森林算法更適合從非常不平衡的數(shù)據(jù)中學(xué)習(xí)的方法之一[19-20]。隨機(jī)森林算法有偏向大多數(shù)類別的缺點(diǎn)[21]。因此,對(duì)少數(shù)群體錯(cuò)誤分類施加昂貴的懲罰可能是有作用的。由于這種技術(shù)可以改善模型性能,故需要為少數(shù)群體分配較高的權(quán)重(更高的錯(cuò)誤分類成本);然后將類別權(quán)重合并到隨機(jī)森林算法中。
按照常規(guī)的做法,需要將樣本數(shù)據(jù)中的全部輸出量根據(jù)樣本數(shù)量之間的比率確定各類別的權(quán)重。根據(jù)業(yè)務(wù)經(jīng)驗(yàn),本文重點(diǎn)關(guān)注單泵和雙泵的控制規(guī)律,因此對(duì)于0泵啟動(dòng)和3泵啟動(dòng)的樣本數(shù)據(jù)不做權(quán)重配比。權(quán)重的計(jì)算公式為
(10)
其中,j={0,1,2,3}為類別,即啟泵數(shù)量;wj為j類別的權(quán)重值;n為樣本數(shù)量;nj為j類別的樣本數(shù)量;k為類別總數(shù),k=4。
調(diào)整權(quán)重后的數(shù)據(jù)重新訓(xùn)練模型后,其模型驗(yàn)證CM如圖15所示。其中,預(yù)測1個(gè)泵啟動(dòng)的誤判率R=(34+188)÷(34+188+2241)=9%,相比優(yōu)化前降低了約2%。
圖15 優(yōu)化后的CART隨機(jī)森林模型驗(yàn)證CM圖Fig.15 Optimized RF model verification CM diagram
本方法在某煤礦自動(dòng)化工作面進(jìn)行了3個(gè)月的實(shí)驗(yàn)驗(yàn)證,其中前2個(gè)月用于數(shù)據(jù)采集以及模型訓(xùn)練,后1個(gè)月為模型驗(yàn)證時(shí)間。除以上混淆矩陣模型驗(yàn)證方法之外,還可以從供液系統(tǒng)平均出口壓力值來體現(xiàn)。
平均出口壓力值的計(jì)算過程,是利用窗口函數(shù)(Window Function)在時(shí)間尺度上對(duì)數(shù)據(jù)進(jìn)行擬合,擬合方式可以是平均值或中位數(shù)等統(tǒng)計(jì)算法,筆者使用的是平均值。隨著時(shí)間的增大,擬合值趨于穩(wěn)定,即可認(rèn)為是平均出口壓力值(圖16)。出口壓力與時(shí)間擬合2種方式的對(duì)比如圖17所示,整體出口壓力約提高了1.5 MPa,這說明流量供給提高,進(jìn)而使液壓支架動(dòng)力更足。
圖16 出口壓力時(shí)間擬合示意Fig.16 Window function of the pressure
圖17 出口壓力與時(shí)間擬合2種方式的對(duì)比Fig.17 Window function results of tow methods
(1) 通過仿真分析了供液系統(tǒng)流量對(duì)液壓支架動(dòng)作速率的影響關(guān)系,以及不同數(shù)量泵供液情況下靜態(tài)液壓支架動(dòng)作速度與采煤機(jī)牽引速度的匹配關(guān)系。
(2) 針對(duì)實(shí)際生產(chǎn)過程中影響跟機(jī)移架速度的因素較多,且各因素間具有耦合性,難以理論推導(dǎo)供液系統(tǒng)控制器的數(shù)學(xué)模型問題,設(shè)計(jì)了利用人工操作I/O數(shù)據(jù)建立基于學(xué)習(xí)算法的乳化液泵自主啟停決策模型。該模型將同一時(shí)刻的采煤機(jī)位置、采煤機(jī)行進(jìn)方向、采煤機(jī)牽引速度以及液壓支架主要?jiǎng)幼?降柱-移架-升柱-推移)作為觀測特征量,與人工啟停泵操作行為進(jìn)行匹配,從而決策出應(yīng)啟動(dòng)的乳化液泵數(shù)量。
(3) 不同于其他研究中計(jì)算不同支架動(dòng)作對(duì)流量影響的方式,以及追求恒定出口壓力的控制方式,將歷史數(shù)據(jù)中的不同位置的不同支架動(dòng)作(降柱-移架-升柱-推移)均作為特征量代入決策模型計(jì)算,以替代流量值,從而避免了推導(dǎo)計(jì)算流量變化機(jī)理。
(4) 針對(duì)實(shí)際生產(chǎn)樣本數(shù)據(jù)中的不平衡性問題,提出了一種調(diào)整權(quán)重的CART分類樹優(yōu)化算法,對(duì)隨機(jī)森林算法優(yōu)化權(quán)重配比,提高了模型的準(zhǔn)確率。