龔 勛,王淑營,崔曉宇
(西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,成都 611756)
隨著智能時(shí)代的到來,生產(chǎn)數(shù)據(jù)價(jià)值的重要性越來越明顯.如何根據(jù)生產(chǎn)工藝,通過數(shù)據(jù)采集、處理、聚類、存儲(chǔ)、分析和可視化等技術(shù)手段發(fā)揮數(shù)據(jù)蘊(yùn)含的價(jià)值信息,成為了熱門的研究課題.而流程型制造車間的生產(chǎn)環(huán)境特殊,加上傳輸網(wǎng)絡(luò)、人為因素的影響,導(dǎo)致采集到的生產(chǎn)數(shù)據(jù)不可避免的存在一定程度的異常情況,如數(shù)據(jù)缺失、離群和異常波動(dòng)等[1,2],若不經(jīng)過處理,無法正常應(yīng)用.數(shù)據(jù)處理就是為了清洗掉生產(chǎn)現(xiàn)場各種因素干擾造成的異常情況,同時(shí)也為了面向生產(chǎn)管控需求進(jìn)行特定的數(shù)據(jù)加工[3,4].
目前,數(shù)據(jù)處理技術(shù)非常廣泛[5,6],如文獻(xiàn)[7]針對復(fù)雜裝備的監(jiān)測數(shù)據(jù)在采集過程中出現(xiàn)時(shí)序混亂,影響對設(shè)備狀態(tài)的分析問題進(jìn)行了建模研究,根據(jù)不同實(shí)時(shí)任務(wù)對數(shù)據(jù)的時(shí)序容錯(cuò)性和實(shí)時(shí)性要求不同,采用不同大小的緩沖窗口和處理策略,并結(jié)合數(shù)據(jù)傳輸延時(shí)的概率密度,分析計(jì)算模型的參數(shù),最后以仿真實(shí)驗(yàn)的方式驗(yàn)證了所提出模型的有效性;文獻(xiàn)[8]針對流程型制造業(yè)個(gè)性化的環(huán)境中生產(chǎn)工藝參數(shù)難以快速?zèng)Q策影響實(shí)時(shí)管控任務(wù)的問題,通過結(jié)合實(shí)際生產(chǎn)工藝進(jìn)行分析,提出了基于數(shù)據(jù)驅(qū)動(dòng)的生產(chǎn)工藝參數(shù)匹配方法,建立了產(chǎn)品工藝相似度函數(shù),從大量生產(chǎn)數(shù)據(jù)中選取與實(shí)際生產(chǎn)任務(wù)有關(guān)的鄰近數(shù)據(jù),通過對比歷史數(shù)據(jù)與目標(biāo)產(chǎn)品的生產(chǎn)要求實(shí)現(xiàn)了生產(chǎn)工藝參數(shù)的匹配;文獻(xiàn)[9]通過分析已有時(shí)間序列數(shù)據(jù)處理的研究,進(jìn)行了大量的實(shí)驗(yàn)研究,結(jié)果表明,在特殊情況下某些觀點(diǎn)可能太樂觀,最后重新實(shí)現(xiàn)了一些時(shí)間序列表示形式和相似性度量;文獻(xiàn)[10]和文獻(xiàn)[11]針對缺失數(shù)據(jù)的異常情況,基于EM 插補(bǔ)算法和高斯混合模型進(jìn)行改進(jìn)優(yōu)化,提出一種新的數(shù)據(jù)流缺失處理算法,有效的解決了數(shù)據(jù)缺失異常,最后通過實(shí)驗(yàn)驗(yàn)證,相比于傳統(tǒng)的EM 插補(bǔ)算法,改進(jìn)后的算法實(shí)時(shí)性和適應(yīng)性更好,但是該算法僅局限于對缺失數(shù)據(jù)進(jìn)行修復(fù),其他異常情況無法處理;文獻(xiàn)[12]根據(jù)傳感器數(shù)據(jù)的時(shí)序性特點(diǎn),提出了一種基于嵌套滑動(dòng)窗口的數(shù)據(jù)缺失填充算法,通過皮爾遜分析數(shù)據(jù)項(xiàng)的空間相關(guān)性,然后使用固定大小的嵌套滑動(dòng)窗口進(jìn)行數(shù)據(jù)采樣處理,通過MKNN 算法進(jìn)行缺失數(shù)據(jù)的精準(zhǔn)填補(bǔ),該算法的復(fù)雜度更低,數(shù)據(jù)修復(fù)效果精準(zhǔn),但是也只局限于缺失數(shù)據(jù)異常問題.
通過對現(xiàn)有數(shù)據(jù)處理技術(shù)的分析,并不適合應(yīng)用于流程型制造車間生產(chǎn)數(shù)據(jù)的處理,因?yàn)槠鋽?shù)據(jù)種類多,格式不一,不同數(shù)據(jù)項(xiàng)采集頻率不一,數(shù)據(jù)質(zhì)量也是參差不齊,加上不同任務(wù)對數(shù)據(jù)的實(shí)時(shí)性和準(zhǔn)確性要求不同,所以不能一概而論.本文根據(jù)生產(chǎn)數(shù)據(jù)特點(diǎn)不同,將其分為3 類:狀態(tài)數(shù)據(jù)、開關(guān)數(shù)據(jù)和邏輯數(shù)據(jù).其中狀態(tài)數(shù)據(jù)是生產(chǎn)過程中表示環(huán)境、設(shè)備運(yùn)行狀態(tài)的數(shù)據(jù)信號,如物料重量、傳送帶速度、焙燒溫度時(shí)間、環(huán)境溫度濕度等;開關(guān)數(shù)據(jù)是設(shè)備啟動(dòng)、停止,以及閥門開關(guān)時(shí)產(chǎn)生的開關(guān)信號;邏輯數(shù)據(jù)是設(shè)備運(yùn)行中表示是否運(yùn)行的邏輯信號,如電流、頻率,其值在某一范圍內(nèi)有效.為了滿足流程型車間生產(chǎn)任務(wù)的實(shí)際需求,針對不同數(shù)據(jù)類型,不同異常類型采用了不同的處理策略.
待處理數(shù)據(jù)是典型的時(shí)間序列[9]數(shù)據(jù),即一系列按時(shí)間先后順序、等間隔采集的數(shù)據(jù)點(diǎn)所組成的數(shù)據(jù)序列.因此,數(shù)據(jù)模型可表示為由采集點(diǎn)唯一標(biāo)識(shí)、采集時(shí)間以及數(shù)據(jù)值組成,記為:
其中,di=(pi,ti,vi)表示在pi采集點(diǎn)、ti時(shí)刻采集的數(shù)據(jù)值為vi,并且時(shí)間是一維線性遞增的,n為時(shí)間序列的長度.制造車間所有采集點(diǎn)在環(huán)境的影響下采集到的生產(chǎn)數(shù)據(jù),如圖1所示
圖1 生產(chǎn)數(shù)據(jù)示意圖
流程型制造車間生產(chǎn)過程中時(shí)間序列數(shù)據(jù)的特點(diǎn)就是數(shù)據(jù)維度高,即數(shù)據(jù)值v表示的類型眾多,如溫度值、速度值、重量值等;加上時(shí)間流特點(diǎn),這決定了不能使用傳統(tǒng)單一的數(shù)據(jù)處理方式進(jìn)行處理.因此,降低數(shù)據(jù)維度、提高數(shù)據(jù)處理算法效率成為關(guān)鍵.本文首先根據(jù)數(shù)據(jù)特征,進(jìn)行數(shù)據(jù)分類處理,再針對每類數(shù)據(jù)采用適合的算法進(jìn)行處理,在保證數(shù)據(jù)處理質(zhì)量的前提下,最大化提高處理效率[13].
滑動(dòng)窗口[12]是一個(gè)固定長度的隊(duì)列,窗口中的數(shù)據(jù)是過去一段時(shí)間內(nèi)采集數(shù)據(jù)點(diǎn)組成的數(shù)據(jù)流.數(shù)據(jù)點(diǎn)從窗口首部流入,尾部流出.
根據(jù)窗口中存放數(shù)據(jù)方式的定義,滑動(dòng)窗口分為基于時(shí)間的滑動(dòng)窗口和基于數(shù)據(jù)個(gè)數(shù)的滑動(dòng)窗口;其中基于時(shí)間的滑動(dòng)窗口保存最近一段時(shí)間長度內(nèi)采集到的數(shù)據(jù);基于數(shù)據(jù)個(gè)數(shù)的滑動(dòng)窗口保存最近采集到的K個(gè)數(shù)據(jù).
結(jié)合采集數(shù)據(jù)的特點(diǎn)分析,數(shù)據(jù)可能存在丟失情況,如果采用基于時(shí)間的定義方式,則在一定時(shí)間段內(nèi)進(jìn)入滑動(dòng)窗口的數(shù)據(jù)項(xiàng)個(gè)數(shù)可能很少,在數(shù)據(jù)修復(fù)時(shí)準(zhǔn)確度會(huì)下降.所以本文選擇基于數(shù)據(jù)個(gè)數(shù)的滑動(dòng)窗口.在數(shù)據(jù)處理過程中,結(jié)合生產(chǎn)工藝的具體情況分析,根據(jù)每類數(shù)據(jù)的特點(diǎn)不同,為每類數(shù)據(jù)建立不同寬度的滑動(dòng)窗口緩存數(shù)據(jù),盡可能實(shí)時(shí)高效的處理數(shù)據(jù).
圖2 ti 時(shí)刻滑動(dòng)窗口
例如滑動(dòng)窗口大小N,在ti時(shí)刻,進(jìn)入滑動(dòng)窗口的數(shù)據(jù)流(d1,d2,···,dn),如圖2所示[12].在tj時(shí)刻,滑動(dòng)窗口中前i-j個(gè)數(shù)據(jù)移出窗口,dn+1至dn+i-j作為最新數(shù)據(jù)進(jìn)入滑動(dòng)窗口,存放在最右位置,如圖3所示.
圖3 tj 時(shí)刻滑動(dòng)窗口
隨著時(shí)間推移,數(shù)據(jù)流不斷流入滑動(dòng)窗口,窗口中的數(shù)據(jù)不斷更新,并且每次只需要處理更新后的數(shù)據(jù),即dn+1至dn+i-j.
本文針對流程型制造車間采集數(shù)據(jù)來源廣、采集頻率不同、格式不同等特點(diǎn)分析,提出基于滑動(dòng)窗口的多源數(shù)據(jù)分類處理模型.如圖4所示[14].
圖4 基于滑動(dòng)窗口的多源數(shù)據(jù)分類處理模型
首先根據(jù)生產(chǎn)管控任務(wù)從數(shù)據(jù)源中選擇需要的數(shù)據(jù)項(xiàng),在進(jìn)行處理前根據(jù)數(shù)據(jù)特點(diǎn)進(jìn)行分類,可劃分為3 類數(shù)據(jù),分別是狀態(tài)數(shù)據(jù)、開關(guān)數(shù)據(jù)、邏輯數(shù)據(jù);基于各類數(shù)據(jù)對完整性、準(zhǔn)確性的需求不同,采用不同的處理算法進(jìn)行修復(fù);最后根據(jù)生產(chǎn)管控任務(wù)中數(shù)據(jù)項(xiàng)的關(guān)聯(lián)關(guān)系將處理后的數(shù)據(jù)進(jìn)行多源融合,方便應(yīng)用.
根據(jù)數(shù)據(jù)的采集頻率將數(shù)據(jù)分為3 類:邏輯數(shù)據(jù)、狀態(tài)數(shù)據(jù)、開關(guān)數(shù)據(jù).其中邏輯數(shù)據(jù)變化最頻繁,采樣頻率最高,狀態(tài)數(shù)據(jù)次之,開關(guān)數(shù)據(jù)最后;狀態(tài)數(shù)據(jù)包含數(shù)據(jù)項(xiàng)、異常情況最多,分析處理也最為復(fù)雜.以下是對不同種類數(shù)據(jù)進(jìn)行異常分析處理的過程.
狀態(tài)數(shù)據(jù)的異常情況可以分為3 類:數(shù)據(jù)重復(fù)、數(shù)據(jù)離群和數(shù)據(jù)丟失;其中丟失數(shù)據(jù)的修復(fù)較為復(fù)雜.根據(jù)狀態(tài)數(shù)據(jù)的特點(diǎn),主要采用EM 算法進(jìn)行改進(jìn),結(jié)合滑動(dòng)窗口技術(shù)進(jìn)行處理,提高數(shù)據(jù)處理的精度和性能.
(1)重復(fù)
根據(jù)之前對數(shù)據(jù)模型的分析,每個(gè)數(shù)據(jù)點(diǎn)都是由采集點(diǎn)唯一標(biāo)識(shí)、采集時(shí)間和采集值構(gòu)成,記d1=(p1,t1,v1).所以重復(fù)數(shù)據(jù)可以根據(jù)采集時(shí)間的唯一性過濾.
(2)離群
離群數(shù)據(jù)包括局部異常高值、低值,超出數(shù)據(jù)閾值.其中超出數(shù)據(jù)閾值異??梢酝ㄟ^為每個(gè)數(shù)據(jù)項(xiàng)配置數(shù)據(jù)閾值方式過濾;局部異常高值低值可以通過中值法修復(fù),如下式:
(3)缺失
數(shù)據(jù)缺失的異常處理較為復(fù)雜,分為連續(xù)型缺失和不連續(xù)型缺失.針對不連續(xù)缺失情況,由于缺失數(shù)據(jù)前后時(shí)間間隔較短,可以采用中值法進(jìn)行修補(bǔ);對于連續(xù)型缺失,由于缺失數(shù)據(jù)過多若使用中值法修復(fù),則可能導(dǎo)致誤差較大,所以本文采用改進(jìn)的EM (Expectation-Maximization algorithm,最大期望算法)插值法,處理連續(xù)性缺失[10,11].EM 算法是一種從不完整數(shù)據(jù)集中對參數(shù)進(jìn)行估值,然后通過不斷迭代求參數(shù)最大似然值的經(jīng)典數(shù)據(jù)修復(fù)算法之一.
文獻(xiàn)[10]介紹了針對EM 算法進(jìn)行改進(jìn)處理缺失數(shù)據(jù)的情況.改進(jìn)的EM 缺失插補(bǔ)算法有3 個(gè)特點(diǎn):(1)設(shè)定連續(xù)缺失數(shù)據(jù)點(diǎn)個(gè)數(shù)的閾值為M,當(dāng)連續(xù)缺失數(shù)據(jù)個(gè)數(shù)小于M時(shí),表明數(shù)據(jù)缺失不嚴(yán)重,使用中值法進(jìn)行修復(fù),大于M時(shí)才使用EM 插補(bǔ)算法;(2)設(shè)定EM算法的最高迭代次數(shù)為K,當(dāng)算法迭代次數(shù)大于K時(shí),停止迭代,使用最后一次迭代結(jié)果作為缺失數(shù)據(jù)的插補(bǔ)值;(3)設(shè)定算法迭代精度ε,當(dāng)?shù)趉次與k-1 次迭代結(jié)果差小于ε時(shí),表明結(jié)果滿足要求,停止迭代,這樣可以在保證數(shù)據(jù)處理質(zhì)量的前提下,提高數(shù)據(jù)處理效率.
數(shù)據(jù)修復(fù)的整個(gè)過程是基于固定大小的滑動(dòng)窗口模型,窗口寬度為N,數(shù)據(jù)缺失閾值為M,最高迭代次數(shù)為K,迭代精度為ε,數(shù)據(jù)的采樣頻率為T,即時(shí)間序列數(shù)據(jù)正常到達(dá)滑動(dòng)窗口的時(shí)間間隔.計(jì)算滑動(dòng)窗口相鄰兩條數(shù)據(jù)di=(pi,ti,vi) 和di+1=(pi,ti+1,vi+1)的時(shí)間間隔△t=ti+1-ti,比較△t與M×T的關(guān)系,共有3 種情況,如下:
(1)當(dāng)△t<2×T,則采集數(shù)據(jù)無缺失情況,無須處理;
(2)當(dāng)2×T≤△t≤M×T,則數(shù)據(jù)點(diǎn)d1和d2之間存在缺失點(diǎn),但沒有超過設(shè)定的缺失閾值M,使用中值法進(jìn)行修復(fù);
(3)當(dāng)△t≥M×T,則缺失數(shù)據(jù)個(gè)數(shù)超出閾值M,采用EM 算法進(jìn)行修復(fù).具體如下[12]:首先記滑動(dòng)窗口中N個(gè)數(shù)據(jù)點(diǎn)構(gòu)成的數(shù)據(jù)集為S,假設(shè)其中有m個(gè)連續(xù)缺失的數(shù)據(jù)點(diǎn),記為di(i=1,2,···,m).掃描數(shù)據(jù)集,分別以m個(gè)連續(xù)缺失數(shù)據(jù)為中心進(jìn)行高斯模型劃分,得到m個(gè)高斯模型分別記為S1,S2,···,Sm,構(gòu)成高斯混合模型[11],表示為:
其中,N(si|μi,Σi)是混合模型的第i個(gè),πi是每個(gè)模型的權(quán)重,滿足0≤πi≤1;在這里引入一個(gè)m維隱變量z,zi(1≤i≤m)只能取0 或1 兩個(gè)值,zi=1 表示選中第i個(gè)分組中,即p(zi=1)=πi,zi∈{0,1}.在高斯混合模型中,隱變量是缺失點(diǎn)屬于某個(gè)模型的概率.因?yàn)镾1,S2,···,Sm分別都是符合高斯分布的,則用條件概率表示為:
在貝葉斯思想下,p(z)是先驗(yàn)概率,p(s|z)是似然概率,得到后驗(yàn)概率p(z|s)如下:
為了方便計(jì)算模型的參數(shù),在式(4)中用γ(zk)表示第k個(gè)分組的后驗(yàn)概率.這里有3 個(gè)參數(shù)π,μ,Σ每次計(jì)算需要更新,需要分別求出這3 個(gè)參數(shù)的最大似然函數(shù),求似然函數(shù)的方法有多種,這里直接給出最大似然函數(shù):
其中,C表示每個(gè)分組中包含數(shù)據(jù)點(diǎn)的個(gè)數(shù),xn表示當(dāng)前分組中的第n個(gè)點(diǎn),γ(zni)表示第n點(diǎn)屬于分組Si的后驗(yàn)概率.
然后設(shè)定最大迭代次數(shù)K,初始迭代次數(shù)K0=1,迭代精度ε,數(shù)據(jù)缺失閾值M,以及每個(gè)分組πi、μi、Σi的初始值進(jìn)行結(jié)算.
求期望:根據(jù)當(dāng)前πi、μi、Σi計(jì)算后驗(yàn)概率γ(zn i),由上述γ(zn i)表達(dá)式如下:
求極大:根據(jù)求期望步驟可得的γ(zn i),再代入式(5)~式(7)計(jì)算πi、μi、Σi的值,在每次迭代之前都需要判斷迭代次數(shù)K0>K和迭代精度是否小于ε,若不成立則迭代執(zhí)行求期望步驟;若成立則停止迭代,輸出最終參數(shù)μi作為缺失點(diǎn)的插補(bǔ)值.
開關(guān)數(shù)據(jù)主要有兩種狀態(tài)開和關(guān),有兩種表現(xiàn)形,第一種分別用True 和False 表示開和關(guān),另一種用1 和0 表示用開和關(guān),兩種表示形式的數(shù)據(jù)處理都不復(fù)雜.首先需要將非數(shù)字量轉(zhuǎn)換為數(shù)字量的0 或1;然后結(jié)合生產(chǎn)工藝,聯(lián)合相關(guān)數(shù)據(jù)項(xiàng)進(jìn)行處理,這里不做詳細(xì)介紹.對于同一采集點(diǎn)的開關(guān)數(shù)據(jù)處理結(jié)果一定是{0,1,0,1,···}.
邏輯數(shù)據(jù)是另一種形式表示設(shè)備開關(guān)狀態(tài)的數(shù)據(jù),其采樣頻率高,但是只有在一定范圍內(nèi)才有效,如機(jī)器運(yùn)轉(zhuǎn)的頻率、電流、電壓等,只有頻率達(dá)到某個(gè)范圍才表示機(jī)器在運(yùn)轉(zhuǎn)中,而在這個(gè)范圍內(nèi),數(shù)據(jù)波動(dòng)頻繁,有時(shí)出現(xiàn)異常情況可能跳出范圍內(nèi).所以對該類數(shù)據(jù)的容錯(cuò)性較高,即使出現(xiàn)部分?jǐn)?shù)據(jù)缺失、離群對整體數(shù)據(jù)的影響不大,處理的重點(diǎn)在于找到數(shù)據(jù)趨于穩(wěn)定的點(diǎn),將穩(wěn)定在某范圍內(nèi)的數(shù)據(jù)按邏輯1 處理,其余按邏輯0 處理.這樣便于對邏輯數(shù)據(jù)的分析時(shí)找到從0 跳變到1 或者從1 跳變到0 的時(shí)間點(diǎn).
本文采用二次穩(wěn)定度算法判斷邏輯數(shù)據(jù)的穩(wěn)定性,具體如算法1[15].
算法1.二次穩(wěn)定度算法1) 結(jié)合生產(chǎn)工藝和數(shù)據(jù)特點(diǎn),選擇合適的波動(dòng)率(R1,R2),其中R1、R2 分別是第一次和第二次穩(wěn)定性判斷的波動(dòng)率,以及穩(wěn)定指標(biāo)(S1,S2);一般情況下波動(dòng)率R1 大于R2,穩(wěn)定指標(biāo)S1 小于S2;2) 從計(jì)算滑動(dòng)窗口中所有數(shù)據(jù)的總值Vsum 和平均值Vavg;當(dāng)每次滑動(dòng)窗口向后移動(dòng)時(shí)只需要用Vsum 減去移出數(shù)據(jù)值,再加上移入數(shù)據(jù)值即可得到新的總值;3) 根據(jù)波動(dòng)率R1 確定均值上下的一次穩(wěn)定區(qū)間[Vavg-Vavg×R1,Vavg+Vavg×R1],然后計(jì)算滑動(dòng)窗口中數(shù)據(jù)在一次穩(wěn)定區(qū)間中的概率,即數(shù)值在穩(wěn)定區(qū)間的個(gè)數(shù)占總數(shù)的比值P1;如果P1 小于S1,則判定數(shù)據(jù)不穩(wěn)定,將滑動(dòng)窗口首位置為0,否則執(zhí)行4);4) 根據(jù)波動(dòng)率R2 計(jì)算均值上下的二次穩(wěn)定區(qū)間[Vavg-Vavg×R2,Vavg+Vavg×R2],然后計(jì)算滑動(dòng)窗口中數(shù)據(jù)在二次穩(wěn)定區(qū)間中的概率P2;如果P2 大于等于S2,則判定數(shù)據(jù)穩(wěn)定,將滑動(dòng)窗口首位置為1,否則置為0.
本文采用的實(shí)驗(yàn)環(huán)境是Windows 7,CPU 3.6 GHz,內(nèi)存16 GB 的計(jì)算機(jī);實(shí)驗(yàn)數(shù)據(jù)是某鋰電池材料生產(chǎn)車間產(chǎn)生的數(shù)據(jù),該生產(chǎn)車間是典型的流程型生產(chǎn)車間,數(shù)據(jù)種類多,質(zhì)量參差不齊,采樣間隔1 s,如表1所示.
表1 部分生產(chǎn)數(shù)據(jù)
本文分別選取滑動(dòng)窗口的寬度N為150,160,170,180,190,200;EM 算法循環(huán)迭代精度ε=0.1;數(shù)據(jù)缺失閾值W=4,5,6,7,8;分別進(jìn)行實(shí)驗(yàn)驗(yàn)證,最后選定滑動(dòng)窗口寬度N=180,數(shù)據(jù)缺失閾值W=7 時(shí)數(shù)據(jù)插補(bǔ)效果最好.
同時(shí)對于邏輯數(shù)據(jù)由于生產(chǎn)環(huán)境因素影響造成其值在一定范圍內(nèi)波動(dòng)的情況,如圖5所示,為原料高混機(jī)運(yùn)行時(shí)產(chǎn)生的電流數(shù)據(jù).
圖5 高混機(jī)電流數(shù)據(jù)
為了便于找到數(shù)據(jù)穩(wěn)定趨勢,分析從邏輯0 跳變到邏輯1,或者相反跳變的時(shí)間點(diǎn),采用二次穩(wěn)定度算法,結(jié)合生產(chǎn)工藝設(shè)置波動(dòng)率R1、R2分別是10%、5%,穩(wěn)定指標(biāo)S1、S2分別是90%、80%,將穩(wěn)定在某范圍內(nèi)的數(shù)據(jù)值按邏輯1 處理,其余按照邏輯0 處理,結(jié)果如圖6所示.
圖6 處理后的電流數(shù)據(jù)
最后為了驗(yàn)證數(shù)據(jù)處理效果,將經(jīng)過處理后的數(shù)據(jù)應(yīng)用于流程型制造車間鋰電池材料產(chǎn)品生產(chǎn)批次判斷,與實(shí)際人工統(tǒng)計(jì)結(jié)果比較,誤差率不足1%.
本文針對流程型車間生產(chǎn)數(shù)據(jù)的多樣性、數(shù)據(jù)質(zhì)量參差不齊等問題,采用數(shù)據(jù)分類處理技術(shù),相比與傳統(tǒng)的單一數(shù)據(jù)處理技術(shù),提高了數(shù)據(jù)處理效率,為數(shù)據(jù)應(yīng)用于過程控制提供了保障.最后以某鋰電池材料生產(chǎn)車間生產(chǎn)數(shù)據(jù)為例,驗(yàn)證了所設(shè)計(jì)的數(shù)據(jù)分類處理模型.結(jié)果表明:該方法在保證數(shù)據(jù)處理質(zhì)量的前提下,較傳統(tǒng)數(shù)據(jù)處理方法更加簡潔、高效,具有實(shí)際應(yīng)用價(jià)值.