孫祥洪
(江西中煙工業(yè)有限責(zé)任公司信息中心,江西 南昌 330096)
隨著工業(yè)4.0時(shí)代的到來(lái),大數(shù)據(jù)分析技術(shù)已然成為世界上不同行業(yè)信息傳遞與資源共享的潛力資源,各領(lǐng)域通過(guò)互聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)數(shù)據(jù)的傳遞[1]。例如在智能制造領(lǐng)域,隨著現(xiàn)代傳感自動(dòng)化等先進(jìn)技術(shù)的發(fā)展,通過(guò)智能化的感知、人機(jī)交互、決策和執(zhí)行技術(shù),實(shí)現(xiàn)了設(shè)計(jì)過(guò)程、制造過(guò)程和裝備制造的智能化。然而,現(xiàn)有的卷煙信息分析技術(shù)發(fā)展滯后,難以對(duì)卷煙的信息進(jìn)行恰當(dāng)處理[2]。
針對(duì)以上問(wèn)題,國(guó)內(nèi)外學(xué)者對(duì)于卷煙信息分析方法進(jìn)行了廣泛探討與研究。文獻(xiàn)[3]采用模擬與數(shù)字監(jiān)控技術(shù)實(shí)現(xiàn)了卷煙生產(chǎn)活動(dòng)的動(dòng)態(tài)監(jiān)控,在煙草信息分析系統(tǒng)的基礎(chǔ)上建立預(yù)警機(jī)制。文獻(xiàn)[4]設(shè)計(jì)了卡方自動(dòng)交叉預(yù)警流程,進(jìn)一步加強(qiáng)了卷煙信息生產(chǎn)運(yùn)作的控制力度,使異常數(shù)據(jù)的處理更加具有條理性。然而,以上2種方法的內(nèi)核計(jì)算框架過(guò)于簡(jiǎn)單、運(yùn)行數(shù)據(jù)監(jiān)測(cè)困難,存在局限性。文獻(xiàn)[5]采用1種局部異常因子算法分析異常卷煙數(shù)據(jù),通過(guò)將數(shù)據(jù)點(diǎn)的局部密度與其k距離鄰域內(nèi)的對(duì)象進(jìn)行比較來(lái)推導(dǎo)出卷煙生產(chǎn)的異常程度。但當(dāng)異常多維數(shù)據(jù)的維度之間存在相關(guān)性時(shí),該算法檢測(cè)過(guò)程會(huì)經(jīng)常失敗,且監(jiān)測(cè)準(zhǔn)確性較低。
本文針對(duì)現(xiàn)有技術(shù)的不足,在智能制造背景下,基于物聯(lián)網(wǎng)技術(shù)提出了1種卷煙信息采集與數(shù)據(jù)分析系統(tǒng)。該系統(tǒng)利用計(jì)算機(jī)算法模型實(shí)現(xiàn)卷煙數(shù)據(jù)信息的異常檢測(cè),并在算法中加入主成分分析法,大幅提高了監(jiān)測(cè)的準(zhǔn)確性。
本文通過(guò)物聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)煙草數(shù)據(jù)信息的分析,提高了數(shù)據(jù)物聯(lián)控制和交互能力,并在智能制造背景下設(shè)計(jì)了卷煙信息采集與數(shù)據(jù)分析系統(tǒng)。卷煙信息采集與數(shù)據(jù)分析系統(tǒng)架構(gòu)如圖1所示。
圖1 卷煙信息采集與數(shù)據(jù)分析系統(tǒng)架構(gòu)圖
由圖1可知,系統(tǒng)首先對(duì)卷煙數(shù)據(jù)信息進(jìn)行采集。采集內(nèi)容包括卷煙生產(chǎn)日期、生產(chǎn)量、異常數(shù)據(jù)信息、正常數(shù)據(jù)信息等。在數(shù)據(jù)交互時(shí),采用通用分組無(wú)線(xiàn)服務(wù)(general packet radio service,GPRS)轉(zhuǎn)換模塊實(shí)現(xiàn)數(shù)據(jù)信息的傳遞。采集服務(wù)器終端將這些數(shù)據(jù)信息傳送到協(xié)議中。卷煙異常數(shù)據(jù)通過(guò)模數(shù)轉(zhuǎn)換,經(jīng)過(guò)路由器和防火墻或者通過(guò)GPRS網(wǎng)絡(luò)類(lèi)型的通信機(jī)到達(dá)管理內(nèi)網(wǎng),進(jìn)而傳送到數(shù)據(jù)存儲(chǔ)中心[6]。在數(shù)據(jù)存儲(chǔ)層,所有信息輸入至數(shù)據(jù)處理系統(tǒng)中。數(shù)據(jù)提取后經(jīng)過(guò)結(jié)構(gòu)化的方式進(jìn)行儲(chǔ)存。與此同時(shí),系統(tǒng)通過(guò)映射的方式處理卷煙信息數(shù)據(jù)庫(kù)中的異常生產(chǎn)類(lèi)型的復(fù)雜非線(xiàn)性關(guān)系,并通過(guò)改進(jìn)的局部矩陣重構(gòu)檢測(cè)算法進(jìn)行數(shù)據(jù)信息分析診斷和生產(chǎn)流水線(xiàn)異常位置的研判,使管理人員能夠?qū)崟r(shí)地得出異常問(wèn)題的解決方案[7-8]。分析后的數(shù)據(jù)信息通過(guò)遠(yuǎn)程數(shù)據(jù)傳輸端口傳遞到數(shù)據(jù)監(jiān)控系統(tǒng)進(jìn)行監(jiān)控,進(jìn)而實(shí)現(xiàn)底層數(shù)據(jù)的物聯(lián)網(wǎng)傳遞。工作人員無(wú)需手工在各制造廠區(qū)進(jìn)行人工檢測(cè),即可實(shí)現(xiàn)底層卷煙數(shù)據(jù)的遠(yuǎn)程監(jiān)控。
在對(duì)現(xiàn)場(chǎng)卷煙數(shù)據(jù)信息進(jìn)行分析和計(jì)算時(shí),通常以AT91RM9200單片機(jī)為核心進(jìn)行現(xiàn)場(chǎng)監(jiān)控、數(shù)據(jù)監(jiān)測(cè)、特征參量采集等,從而實(shí)現(xiàn)異常數(shù)據(jù)信息監(jiān)控。卷煙數(shù)據(jù)信息故障檢測(cè)硬件架構(gòu)如圖2所示。
圖2 卷煙數(shù)據(jù)信息故障檢測(cè)硬件架構(gòu)示意圖
監(jiān)控功能主要由AT91RM9200芯片核心處理器執(zhí)行。該處理器設(shè)置有16 KB指令和16 KB數(shù)據(jù)Cache存儲(chǔ)模塊,以及Flash存儲(chǔ)器、液晶顯示器(liquid crystal display,LCD)控制器、接口控制器和串行控制器等。數(shù)據(jù)采集與計(jì)算是通過(guò)16路12位模擬數(shù)字轉(zhuǎn)換器(analog-to-digital converter,ADC)接口模塊實(shí)現(xiàn)的。該模塊嵌入式地采集數(shù)據(jù)信息,經(jīng)DM9161芯片計(jì)算,通過(guò)微處理器將以太網(wǎng)媒體訪問(wèn)控制器(Ethernet media access controller,EMAC) 接口以擴(kuò)展的方式連接外部以太網(wǎng)接口RJ45,進(jìn)而與工業(yè)以太網(wǎng)連接[9-10]以進(jìn)行數(shù)據(jù)信息的通信,從而實(shí)現(xiàn)與外部設(shè)備DeviceNet的連接。采用的工業(yè)以太網(wǎng)為EtherNet/IP通信體系。AT91RM9200芯片計(jì)算單元在串行外設(shè)接口(serial peripheral interface,SPI)的作用下,通過(guò)改進(jìn)局部矩陣重構(gòu)檢測(cè)算法在上位機(jī)上對(duì)采集到的煙草圖像數(shù)據(jù)進(jìn)行監(jiān)測(cè)。攝像機(jī)監(jiān)測(cè)采用比例積分微分(proportional integral differential,PID)控制器進(jìn)行速度控制。該算法在對(duì)物體或零件進(jìn)行驗(yàn)證之前使用PID控制穩(wěn)定時(shí)間。一旦處于穩(wěn)定狀態(tài),控制系統(tǒng)就啟動(dòng)光電傳感器。其功能是在每次檢測(cè)到物體時(shí)提供拍攝信號(hào)和圖像捕獲功能。
本文使用的光電傳感器對(duì)應(yīng)于用于非接觸檢測(cè)物體和材料的漫反射傳感器。該傳感器的功能是檢測(cè)物體或零件何時(shí)處于檢查區(qū)域,以便向通信卡發(fā)送確認(rèn)信號(hào)。控制卡向相機(jī)發(fā)送1個(gè)觸發(fā)脈沖(觸發(fā)器)。相機(jī)保持幾微秒。有了這個(gè)信號(hào),相機(jī)就可以拍攝到生產(chǎn)流水線(xiàn)上的卷煙生產(chǎn)過(guò)程,并開(kāi)始進(jìn)行圖像處理,以確定生產(chǎn)過(guò)程中卷煙數(shù)據(jù)信息是否存在異常。光電傳感器中信號(hào)通信采用混沌振蕩器?;煦绮ㄐ蔚膸捥岣吡诵盘?hào)對(duì)影響?yīng)M窄頻率范圍的干擾的魯棒性?;煦缯袷幤麟娐啡鐖D3所示。
圖3 混沌振蕩器電路示意圖
混沌振蕩器由電感電容(linductance capacitance,LC)諧振電路、公共基極放大器和反饋網(wǎng)絡(luò)組成。x(t)由諧振電路產(chǎn)生[11]。s(t)由反饋網(wǎng)絡(luò)產(chǎn)生。元件工作時(shí),公共基極放大器作為電路的負(fù)電阻有效工作。通過(guò)反饋網(wǎng)絡(luò)對(duì)諧振電路的輸出進(jìn)行采樣以產(chǎn)生s(t),將s(t)反饋到諧振電路中。振蕩器的基頻f由圖3中的C和L的值設(shè)置。對(duì)于18.4 kHz振蕩器,C=1 μF,L=150 μH。光電傳感器的通信信號(hào)需均衡控制。AT91RM9200芯片接收主要通過(guò)變頻器進(jìn)一步的信號(hào)調(diào)理來(lái)實(shí)現(xiàn)。
變頻器結(jié)構(gòu)如圖4所示。
圖4 變頻器結(jié)構(gòu)圖
由圖4可知,整個(gè)變頻器由主控制電路和控制電路這2種電路組成。
主控制電路通過(guò)不斷地開(kāi)關(guān)電子器件來(lái)實(shí)現(xiàn)卷煙圖像信息信號(hào)的變頻調(diào)節(jié),從而對(duì)所有設(shè)備進(jìn)行控制。控制電路主要有控制電源、鍵盤(pán)與顯示器、采樣電路、驅(qū)動(dòng)電路等。電源穩(wěn)定性要好。鍵盤(pán)與顯示器主要對(duì)信號(hào)指令進(jìn)行操作。電流和電壓能夠在特殊情況下保護(hù)電路。驅(qū)動(dòng)電路主要是為了控制逆變管,通過(guò)變頻器元件實(shí)現(xiàn)光電傳感器的高效、節(jié)能。
本文通過(guò)改進(jìn)局部矩陣重構(gòu)檢測(cè)算法模型,提高了卷煙數(shù)據(jù)信息的異常檢測(cè)能力。本文在該算法中融入主成分分析方法。主成分分析方法能夠?qū)⒏呔S度數(shù)據(jù)信息轉(zhuǎn)換為低維度數(shù)據(jù)信息,比如卷煙數(shù)據(jù)信息集合為A=[x1,x2,…,xi,…,xn]。卷煙數(shù)據(jù)信息集合有n×p異常卷煙樣本矩陣,即n為卷煙數(shù)據(jù)樣本數(shù)、p為卷煙數(shù)據(jù)維度,則矩陣A的協(xié)方差矩陣可以表示為:
CO(A)=V(A)×D(A)×V(A)T
(1)
式中:CO(A)為卷煙數(shù)據(jù)信息協(xié)方差矩陣;V(A)為卷煙數(shù)據(jù)信息p×p正交矩陣;D(A)為p×p對(duì)角矩陣。
卷煙數(shù)據(jù)信息包括卷煙數(shù)據(jù)特征值λi(i=1,2,…,p)。其中,數(shù)據(jù)前h(h≤p)個(gè)最大特征值的累積貢獻(xiàn)率γh的表達(dá)式為:
(2)
采用主成分分析技術(shù)將卷煙數(shù)據(jù)信息降維后,其表達(dá)式為:
(3)
式中:Yh(A)為降維過(guò)程中異常卷煙數(shù)據(jù)的異常信息矩陣;Rh(A)為在卷煙數(shù)據(jù)信息降維過(guò)程中的異常卷煙數(shù)據(jù)信息;Vh(A)為p×h矩陣。
降維誤差通過(guò)式(4)進(jìn)行計(jì)算。
(4)
式中:re(xi)為卷煙數(shù)據(jù)信息降維誤差;ri為卷煙數(shù)據(jù)信息中Rh(A)內(nèi)的第i行數(shù)據(jù)信息。
本文將異常數(shù)據(jù)信息和正常數(shù)據(jù)信息通過(guò)離散分布的方式表示。
為了將正常卷煙數(shù)據(jù)信息劃分到1個(gè)數(shù)據(jù)系列內(nèi),這些正常點(diǎn)可以與主成分方向一致。在數(shù)據(jù)與主成分方向不一致時(shí),這些數(shù)據(jù)則被認(rèn)為是異常數(shù)據(jù)信息。
正常卷煙數(shù)據(jù)信息與異常卷煙數(shù)據(jù)信息區(qū)分如圖5所示。
圖5 正常卷煙數(shù)據(jù)信息與異常卷煙數(shù)據(jù)信息區(qū)分示意圖
判別過(guò)程如下。
①形成局部分布矩陣。假設(shè)CO為包含所有異常卷煙數(shù)據(jù)的集合,則被檢測(cè)的卷煙數(shù)據(jù)點(diǎn)P與故障數(shù)據(jù)信息點(diǎn)k之間的距離Nk(p)的表達(dá)式如下。
Nk(p)={o1(p),o2(p),…,oK(p)}
(5)
式中:K為故障信息點(diǎn)p與故障數(shù)據(jù)信息點(diǎn)k之間的所有距離,K=|Nk(p)|且K≥k;o為正常卷煙數(shù)據(jù)信息構(gòu)成的信息矩陣[12]。
當(dāng)被檢測(cè)的卷煙數(shù)據(jù)點(diǎn)p為異常數(shù)據(jù)時(shí),則其局部分布矩陣M(p)為:
(6)
通過(guò)這種方法,可以找出與點(diǎn)p比較相似的k個(gè)領(lǐng)域點(diǎn)。
②對(duì)故障異常數(shù)據(jù)信息的特征值進(jìn)行分解。M(p)的協(xié)方差矩陣假設(shè)為CO[M(p)]。其卷煙數(shù)據(jù)特征為:
CO[M(P)]=V[M(P)]×D[M(P)]×V[M(P)]T
(7)
式中:V為卷煙數(shù)據(jù)信息5×5正交矩陣,該正交矩陣構(gòu)成矩陣中行列數(shù)據(jù)信息CO的特征向量;D為卷煙數(shù)據(jù)信息中的5×5對(duì)角矩陣,該對(duì)角矩陣中對(duì)角元素表示CO卷煙數(shù)據(jù)內(nèi)的數(shù)據(jù)信息特征值(λp,1,λp,2,…,λp,5)。
(8)
式中:Vh為V的前h列數(shù)據(jù),其特征值假設(shè)為5;Rh為降維后的卷煙數(shù)據(jù)信息局部分布矩陣。
卷煙數(shù)據(jù)信息降維對(duì)象p的局部降維誤差err的計(jì)算式為:
(9)
式中:rK+1為Rh內(nèi)第(K+1)行數(shù)據(jù)信息;λp,i為所有卷煙數(shù)據(jù)信息中矩陣CO內(nèi)第i大特征值;γh(p)為前h個(gè)主成分在所有主成分中的比例信息。
在對(duì)局部異常值進(jìn)行計(jì)算時(shí),L(p)為降維對(duì)象p和異常數(shù)據(jù)信息之間的差值。其表達(dá)式為:
(10)
式中:dist為點(diǎn)p與設(shè)置的標(biāo)準(zhǔn)故障數(shù)據(jù)信息節(jié)點(diǎn)k之間的距離。
假設(shè)不同的故障異常數(shù)據(jù)信息應(yīng)用過(guò)程中,其內(nèi)閾值設(shè)置為σ,則當(dāng)L(p) >σ時(shí),p被認(rèn)為是異常卷煙數(shù)據(jù)。σ介于0~1之間。
為了驗(yàn)證卷煙異常數(shù)據(jù)信息故障情況,試驗(yàn)需要搭建計(jì)算平臺(tái)。該計(jì)算平臺(tái)通過(guò)5臺(tái)服務(wù)器(ThinkServer RD460×4、Dell R210II×1)組成計(jì)算機(jī)數(shù)據(jù)信息集群。服務(wù)器之間可以采用千兆交換機(jī)相連。本文假設(shè)在服務(wù)器上安裝Xenserver,并擬合出9個(gè)節(jié)點(diǎn)。2個(gè)虛擬機(jī)中央處理器(certral processing unit,CPU)核心安置到1個(gè)節(jié)點(diǎn)上。CPU型號(hào)為CPU i3-2120 3.30 GHz、內(nèi)存3 GB、存儲(chǔ)250 GB;CPU E5-2609v2 2.50 GHz、內(nèi)存7 GB、存儲(chǔ)300 GB。
試驗(yàn)架構(gòu)如圖6所示。
圖6 試驗(yàn)架構(gòu)圖
試驗(yàn)采用比較的形式,實(shí)現(xiàn)數(shù)據(jù)信息的計(jì)算。本文選擇文獻(xiàn)[5]所采用的局部異常因子檢測(cè)算法作為試驗(yàn)參照對(duì)象。試驗(yàn)從試驗(yàn)數(shù)據(jù)集中提取0~3 GB卷煙相關(guān)檢測(cè)數(shù)據(jù),利用MATLAB軟件進(jìn)行模擬仿真。
試驗(yàn)檢測(cè)時(shí)間為40 s、采樣頻率為22.05 kHz。試驗(yàn)結(jié)果匯總到數(shù)據(jù)表中。2種系統(tǒng)檢測(cè)性能對(duì)比如表1所示。
表1 2種系統(tǒng)檢測(cè)性能對(duì)比
本文將試驗(yàn)結(jié)果導(dǎo)入Plant Simulation仿真軟件中,生成的誤差方法對(duì)比如圖7所示。
圖7 誤差方法對(duì)比示意圖
由圖7可知,當(dāng)數(shù)據(jù)識(shí)別量在0~0.5 GB時(shí),2種系統(tǒng)誤差相差不大。然而,隨著數(shù)據(jù)量不斷增大,文獻(xiàn)[5]系統(tǒng)的預(yù)測(cè)誤差越來(lái)越大,在3 GB卷煙數(shù)據(jù)時(shí)達(dá)到最大。此時(shí),本文系統(tǒng)的檢測(cè)誤差為0.68%,文獻(xiàn)[5]系統(tǒng)的檢測(cè)誤差為0.86%。試驗(yàn)結(jié)果表明,本文系統(tǒng)對(duì)卷煙異常生產(chǎn)信息的監(jiān)測(cè)誤差最小,體現(xiàn)出本文系統(tǒng)的適用性。
本文從卷煙信息檢測(cè)與分析時(shí)間上開(kāi)始評(píng)估,以文獻(xiàn)[3]與文獻(xiàn)[4]系統(tǒng)作為參照對(duì)象。本文采集相同的數(shù)據(jù)量以計(jì)算消耗時(shí)間。耗時(shí)對(duì)比如圖8所示。
圖8 耗時(shí)對(duì)比示意圖
由圖8可知,在同樣分析2 GB數(shù)據(jù)量信息時(shí),本文系統(tǒng)耗時(shí)較小。隨著時(shí)間逐漸增多,本文系統(tǒng)表現(xiàn)出了明顯的技術(shù)優(yōu)勢(shì),耗費(fèi)時(shí)間均比較少。因此,本文系統(tǒng)具有突出的技術(shù)優(yōu)勢(shì)。
卷煙生產(chǎn)過(guò)程中,很容易出現(xiàn)多種數(shù)據(jù)信息。這些數(shù)據(jù)信息維度高、甄別困難。為了提高卷煙信息分析效率,本文以智能制造為背景、智能化制造為前提,實(shí)現(xiàn)了煙草數(shù)據(jù)信息的采集、傳遞和分析。本文在設(shè)計(jì)嵌入式數(shù)據(jù)采集系統(tǒng)時(shí),將所有信息輸入至數(shù)據(jù)處理系統(tǒng)中,并將提取后數(shù)據(jù)以結(jié)構(gòu)化的方式進(jìn)行儲(chǔ)存。通過(guò)改進(jìn)的局部矩陣重構(gòu)檢測(cè)算法進(jìn)行數(shù)據(jù)信息分析診斷和生產(chǎn)流水線(xiàn)異常位置的研判,有效地實(shí)現(xiàn)了高維度數(shù)據(jù)信息轉(zhuǎn)換為低維度數(shù)據(jù)信息,以便數(shù)據(jù)處理與計(jì)算。這大幅提升了數(shù)據(jù)分析能力。分析后的數(shù)據(jù)信息通過(guò)遠(yuǎn)程數(shù)據(jù)傳輸端口傳遞到數(shù)據(jù)監(jiān)控系統(tǒng)進(jìn)行監(jiān)控。通過(guò)試驗(yàn)證實(shí)了本文系統(tǒng)的可行性,但在監(jiān)測(cè)過(guò)程中發(fā)現(xiàn)信息采集裝置電源管理模塊存在供電不足的問(wèn)題。未來(lái)會(huì)針對(duì)該問(wèn)題作進(jìn)一步優(yōu)化與改進(jìn)。