孫麗君
(山東省科技服務(wù)發(fā)展推進(jìn)中心,山東 濟(jì)南 250101)
由于信息技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展,電爐企業(yè)面對(duì)的數(shù)據(jù)規(guī)模和多樣性不斷增長,涉及的數(shù)據(jù)類型也更加豐富[1]。因此,電爐企業(yè)亟需提高自身的競爭力和市場適應(yīng)性,這就要求企業(yè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行準(zhǔn)確的分析和挖掘,以獲取有用的信息和洞察。因此,電爐企業(yè)需要開發(fā)出更加高效、準(zhǔn)確、可靠的數(shù)據(jù)挖掘系統(tǒng),從而提高生產(chǎn)效率、資源利用率和企業(yè)利潤。然而,電爐企業(yè)數(shù)據(jù)本身存在不同結(jié)構(gòu)和異構(gòu)性的問題,加之?dāng)?shù)據(jù)規(guī)模不斷增大,這些都為挖掘和分析帶來了諸多困難和挑戰(zhàn)[2]。對(duì)于電爐企業(yè)異構(gòu)網(wǎng)絡(luò)而言,在其運(yùn)行過程中,如何實(shí)現(xiàn)共享數(shù)據(jù)的跨級(jí)傳輸,并根據(jù)事務(wù)長度標(biāo)準(zhǔn)對(duì)其進(jìn)行挖掘處理成為一項(xiàng)亟待解決的問題。
文獻(xiàn)[3]提出基于改進(jìn)粒子群優(yōu)化算法的挖掘系統(tǒng)。根據(jù)粒子節(jié)點(diǎn)選擇思想,在高效用項(xiàng)集中確定數(shù)據(jù)樣本初始優(yōu)化系數(shù)的取值,再通過效用值比較的方式,確定數(shù)據(jù)挖掘指令的執(zhí)行強(qiáng)度。文獻(xiàn)[4]采用N-list結(jié)構(gòu)的混合并行挖掘系統(tǒng)通過設(shè)計(jì)負(fù)載量估計(jì)函數(shù)的方式,確定共享數(shù)據(jù)的跨級(jí)傳輸能力,再聯(lián)合N-list結(jié)構(gòu),生成最終的高效項(xiàng)集挖掘結(jié)果。
然而上述兩類系統(tǒng)并不能有效控制事務(wù)長度,故而很難大幅提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級(jí)傳輸能力。針對(duì)上述情況,設(shè)計(jì)新型電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級(jí)高效項(xiàng)集挖掘系統(tǒng)。
電爐企業(yè)的網(wǎng)絡(luò)通常由多個(gè)不同類型的設(shè)備(如PLC、CNC、DCS等)組成,并可能采用不同的通訊協(xié)議,導(dǎo)致網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,難以維護(hù)。因此在設(shè)計(jì)電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系中,利用關(guān)系圖譜清晰地顯示企業(yè)內(nèi)部設(shè)備結(jié)構(gòu),以文字信息或者數(shù)字信息表示,使其明確且清楚地展示企業(yè)內(nèi)部關(guān)系。
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系負(fù)責(zé)整理Update主機(jī)輸出的電爐企業(yè)文字信息與電爐企業(yè)數(shù)字信息,并可以在Bi-GRU節(jié)點(diǎn)、RGCN節(jié)點(diǎn)的作用下,生成電爐企業(yè)關(guān)系圖譜與電爐企業(yè)內(nèi)部職能關(guān)系圖譜[5]。Bi-GRU節(jié)點(diǎn)負(fù)責(zé)梳理電爐企業(yè)文字信息與電爐企業(yè)數(shù)字信息,并可以將其中與共享數(shù)據(jù)相關(guān)的信息樣本提取處理,以用于構(gòu)造符合跨級(jí)傳輸需求的高效項(xiàng)集指標(biāo)。RGCN節(jié)點(diǎn)可以同時(shí)調(diào)度n個(gè)Node下級(jí)附屬結(jié)構(gòu),當(dāng)文字信息與數(shù)字信息累積量達(dá)到一定數(shù)值標(biāo)準(zhǔn)后,Node結(jié)構(gòu)進(jìn)入輸出狀態(tài),而這些信息樣本則可以根據(jù)電爐企業(yè)關(guān)系圖譜的表現(xiàn)形式,展示電爐企業(yè)內(nèi)部的職能關(guān)系[6]。具體的電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系結(jié)構(gòu)如圖1所示。
圖1 電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系結(jié)構(gòu)圖
為避免共享數(shù)據(jù)在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系中出現(xiàn)混亂傳輸?shù)那闆r,Bi-GRU節(jié)點(diǎn)、RGCN節(jié)點(diǎn)都具備存儲(chǔ)數(shù)據(jù)樣本的能力。
電爐企業(yè)的各項(xiàng)系統(tǒng)需要緊密協(xié)作,實(shí)現(xiàn)數(shù)據(jù)共享和集中管理,這就要求不同系統(tǒng)之間具備良好的互通性。因此設(shè)計(jì)數(shù)據(jù)跨級(jí)共享模塊可以有效實(shí)現(xiàn)電爐企業(yè)不同系統(tǒng)的緊密協(xié)作功能。數(shù)據(jù)跨級(jí)共享模塊兼容代理服務(wù)組件、異構(gòu)網(wǎng)絡(luò)管理組件、跨級(jí)傳輸組件等多個(gè)應(yīng)用結(jié)構(gòu),可以在控制共享數(shù)據(jù)傳輸方向的同時(shí),分析電爐企業(yè)異構(gòu)網(wǎng)絡(luò)信息的組成情況。代理服務(wù)組件作為數(shù)據(jù)跨級(jí)共享模塊的頂層應(yīng)用結(jié)構(gòu),同時(shí)控制Web主機(jī)與Sip主機(jī),決定了共享數(shù)據(jù)的跨級(jí)傳輸方向[7-8]。異構(gòu)網(wǎng)絡(luò)管理組件同時(shí)處理共享數(shù)據(jù)存檔文本與歷史數(shù)據(jù)存檔文本,可以聯(lián)合跨級(jí)傳輸組件,利用已獲取到的共享數(shù)據(jù)樣本,定義高效項(xiàng)集組織。挖掘處理組件作為數(shù)據(jù)跨級(jí)共享模塊底層應(yīng)用結(jié)構(gòu),可以根據(jù)電爐企業(yè)異構(gòu)子網(wǎng)絡(luò)的布局形式,分析共享信息樣本的跨級(jí)傳輸需求。圖2反映了數(shù)據(jù)跨級(jí)共享模塊的基本布局形式。
圖2 數(shù)據(jù)跨級(jí)共享模塊簡圖
出于維持電爐企業(yè)異構(gòu)網(wǎng)絡(luò)運(yùn)行穩(wěn)定性的考慮,共享數(shù)據(jù)的跨級(jí)傳輸方向只能由代理服務(wù)組件端指向挖掘處理組件端。
電爐企業(yè)的生產(chǎn)過程通常受到嚴(yán)格的安全標(biāo)準(zhǔn)和法規(guī)的監(jiān)管,同時(shí),電爐企業(yè)的生產(chǎn)過程通常需要實(shí)時(shí)采集和處理大量數(shù)據(jù),需要保證數(shù)據(jù)實(shí)時(shí)性,所以網(wǎng)絡(luò)的時(shí)延和帶寬要求比較高,對(duì)數(shù)據(jù)進(jìn)行分類可以有效提高數(shù)據(jù)的后續(xù)分析與處理效率,因此設(shè)計(jì)電爐數(shù)據(jù)邏輯分析模塊,負(fù)責(zé)確定電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)的傳輸目的,對(duì)電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行邏輯分析,實(shí)現(xiàn)對(duì)數(shù)據(jù)的自動(dòng)分類和處理,能夠根據(jù)高效項(xiàng)集定義標(biāo)準(zhǔn),制定系統(tǒng)主機(jī)所需執(zhí)行的挖掘指令,實(shí)現(xiàn)電爐數(shù)據(jù)的實(shí)時(shí)查詢和深度挖掘[9-10]。同時(shí),該模塊的主要分析部分同時(shí)執(zhí)行共享信息查詢、數(shù)據(jù)跨級(jí)高效項(xiàng)集定義、深度挖掘的指令文本,能夠準(zhǔn)確提取電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的所有共享數(shù)據(jù)信息樣本,并按照電爐數(shù)據(jù)邏輯分析原則,能夠準(zhǔn)確提取電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中的各類數(shù)據(jù)信息,并進(jìn)行按需處理,滿足電爐企業(yè)對(duì)數(shù)據(jù)挖掘的需求。電爐數(shù)據(jù)邏輯分析模塊執(zhí)行原則如圖3所示。
圖3 電爐數(shù)據(jù)邏輯分析模塊執(zhí)行原則
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級(jí)高效項(xiàng)集挖掘系統(tǒng)運(yùn)行過程中,如果數(shù)據(jù)信息默認(rèn)傳輸方向與共享文檔傳輸方向不一致,首先要對(duì)信息傳輸方向進(jìn)行統(tǒng)一,然后再根據(jù)挖掘系統(tǒng)執(zhí)行需求,定義高效項(xiàng)集結(jié)構(gòu)。
對(duì)于電爐企業(yè)的異構(gòu)網(wǎng)絡(luò),MP節(jié)點(diǎn)可以被看作是一個(gè)數(shù)據(jù)發(fā)射器和接收器,它可以從不同的設(shè)備和系統(tǒng)節(jié)點(diǎn)獲取數(shù)據(jù),并將這些數(shù)據(jù)匯聚到一個(gè)數(shù)據(jù)池中,供上層的系統(tǒng)主機(jī)進(jìn)行數(shù)據(jù)挖掘處理。由于MP節(jié)點(diǎn)具有強(qiáng)大的跨級(jí)傳輸作用能力,它可以根據(jù)挖掘?qū)ο笏幬恢?實(shí)現(xiàn)快速、準(zhǔn)確的電爐運(yùn)行過程中環(huán)境監(jiān)測或設(shè)備運(yùn)行數(shù)據(jù)傳輸和共享,從而使得系統(tǒng)主機(jī)能夠在短時(shí)間內(nèi)對(duì)大量的數(shù)據(jù)信息樣本進(jìn)行挖掘處理。在實(shí)際應(yīng)用中,MP節(jié)點(diǎn)可以通過與其他網(wǎng)絡(luò)設(shè)備和系統(tǒng)節(jié)點(diǎn)進(jìn)行協(xié)作,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)傳輸和動(dòng)態(tài)共享,為企業(yè)的生產(chǎn)和管理提供必要的數(shù)據(jù)支持和決策參考。此外,MP節(jié)點(diǎn)還具有良好的擴(kuò)展性和可靠性,可以根據(jù)電爐企業(yè)的實(shí)際需求進(jìn)行個(gè)性化的定制和優(yōu)化,以適應(yīng)不同應(yīng)用場景下的特殊需求[11-12]。由于電爐企業(yè)異構(gòu)網(wǎng)絡(luò)允許數(shù)據(jù)并列傳輸行為的出現(xiàn),所以MP節(jié)點(diǎn)在單位時(shí)間內(nèi)所承擔(dān)的數(shù)據(jù)樣本總量相對(duì)較大。設(shè)c、x、z表示三個(gè)隨機(jī)選取的數(shù)據(jù)樣本共享系數(shù),其取值滿足式(1)所示的計(jì)算結(jié)果。
c≠x≠z
(1)
(2)
如果共享數(shù)據(jù)的跨級(jí)傳輸目的地不同,那么在傳輸過程中,這些信息樣本所占用的MP共享節(jié)點(diǎn)也就不同。
在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中,可能存在多個(gè)應(yīng)用程序同時(shí)進(jìn)行數(shù)據(jù)傳輸?shù)那闆r,涉及大量的數(shù)據(jù)傳輸和處理操作。此時(shí),如果采用普通的數(shù)據(jù)傳輸方式,可能會(huì)遇到數(shù)據(jù)過大而無法一次性傳輸?shù)膯栴},導(dǎo)致數(shù)據(jù)傳輸失敗,影響電爐企業(yè)的生產(chǎn)和管理流程。而采用AP數(shù)據(jù)分片技術(shù),可以將大的數(shù)據(jù)包分為若干個(gè)小的數(shù)據(jù)分片,逐一將這些數(shù)據(jù)分片傳輸過去,最終實(shí)現(xiàn)整個(gè)數(shù)據(jù)的完整傳輸。一般來說,分片標(biāo)準(zhǔn)的定義標(biāo)準(zhǔn)越細(xì)致,電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)的單位累積量就越小,當(dāng)前情況下,系統(tǒng)主機(jī)所需處理的高效項(xiàng)集結(jié)構(gòu)總量也就相對(duì)較少[13-14]。規(guī)定s1、s2、…、sn表示電爐企業(yè)異構(gòu)網(wǎng)絡(luò)中n個(gè)待共享的數(shù)據(jù)信息樣本,且取值標(biāo)準(zhǔn)滿足式(3)。
s1,s2,…,sn∈[1,+∞)
(3)
聯(lián)立式(2)、式(3),推導(dǎo)高效項(xiàng)集挖掘系統(tǒng)所遵循的AP數(shù)據(jù)分片標(biāo)準(zhǔn)表達(dá)式為
(4)
式中:α為分類項(xiàng)系數(shù);ε為共享數(shù)據(jù)賦值系數(shù);β為電爐企業(yè)異構(gòu)網(wǎng)絡(luò)對(duì)于共享數(shù)據(jù)的分配權(quán)限。在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)空間中,共享數(shù)據(jù)樣本的累積量不可能為零,所以β系數(shù)的取值恒大于自然數(shù)“1”。
RCAUL調(diào)用是挖掘系統(tǒng)針對(duì)高效項(xiàng)集結(jié)構(gòu)所制定的執(zhí)行指令,在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)環(huán)境中,共享數(shù)據(jù)的目標(biāo)傳輸位置直接影響RCAUL調(diào)用指令的執(zhí)行結(jié)果[15-16]。高效項(xiàng)集RCAUL調(diào)用指令的制定包含三個(gè)處理流程,具體定義式如下。
第一流程:
(5)
第二流程:
l2=K2·l1
(6)
第三流程:
(7)
聯(lián)立式(5)~式(7),可將高效項(xiàng)集的RCAUL調(diào)用表達(dá)式定義為
(8)
在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)環(huán)境中,事務(wù)長度影響主機(jī)元件對(duì)數(shù)據(jù)項(xiàng)參量的挖掘處理能力,在網(wǎng)絡(luò)運(yùn)行能力保持穩(wěn)定的前提下,事務(wù)長度越大,主機(jī)元件在處理數(shù)據(jù)項(xiàng)參量時(shí)所能到達(dá)的挖掘深度也就越淺,而這種情況則會(huì)明顯抑制電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級(jí)傳輸能力。因此,促進(jìn)電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)的跨級(jí)傳輸能力就是實(shí)現(xiàn)對(duì)事務(wù)長度的有效壓縮。
首先,選擇電爐企業(yè)異構(gòu)網(wǎng)絡(luò)共享數(shù)據(jù)跨級(jí)高效項(xiàng)集挖掘系統(tǒng)作為實(shí)驗(yàn)組檢測方法,將該系統(tǒng)執(zhí)行程序輸入Windows主機(jī)中,分析該方法對(duì)數(shù)據(jù)集參量事務(wù)長度的挖掘處理能力;其次,選擇基于改進(jìn)粒子群優(yōu)化算法的挖掘系統(tǒng)作為第一對(duì)照組檢測方法,選擇采用N-list結(jié)構(gòu)的混合并行挖掘系統(tǒng)作為第二對(duì)照組檢測方法,分析該方法對(duì)數(shù)據(jù)集參量事務(wù)長度的挖掘處理能力;最后,統(tǒng)計(jì)所有實(shí)驗(yàn)結(jié)果,總結(jié)實(shí)驗(yàn)規(guī)律。
表1記錄了電爐企業(yè)不同數(shù)據(jù)集參量的初始事務(wù)長度。
表1 電爐企業(yè)數(shù)據(jù)集參量的初始事務(wù)長度
電爐企業(yè)異構(gòu)網(wǎng)絡(luò)對(duì)于事務(wù)長度挖掘處理的表達(dá)式如下:
(9)
圖4反映了不同挖掘系統(tǒng)作用下,數(shù)據(jù)集參量事務(wù)長度的具體數(shù)值水平。
圖4 事務(wù)長度實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時(shí),經(jīng)實(shí)驗(yàn)組挖掘系統(tǒng)作用后,這些數(shù)據(jù)集參量的事務(wù)長度水平被控制在500 kB以下,小于標(biāo)準(zhǔn)值512 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時(shí),經(jīng)實(shí)驗(yàn)組挖掘系統(tǒng)作用后,質(zhì)量、人員數(shù)據(jù)集參量的事務(wù)長度等于0,加熱數(shù)據(jù)集參量的事務(wù)長度也只能達(dá)到50 kB,遠(yuǎn)小于標(biāo)準(zhǔn)值512 kB。綜上實(shí)驗(yàn)組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度始終處于0~512 kB的數(shù)值范圍之內(nèi)。
第一對(duì)照組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時(shí),這些數(shù)據(jù)集參量的事務(wù)長度最小值為500 kB、最大值為525 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時(shí),這些數(shù)據(jù)集參量的事務(wù)長度最小值為375 kB、最大值為425 kB。綜上第一對(duì)照組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度處于375~525 kB的數(shù)值范圍之內(nèi),高于實(shí)驗(yàn)組實(shí)驗(yàn)結(jié)果
第二對(duì)照組:當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于1 024 kB時(shí),這些數(shù)據(jù)集參量的事務(wù)長度最小值為700 kB、最大值為800 kB。當(dāng)數(shù)據(jù)集參量初始事務(wù)長度等于512 kB時(shí),這些數(shù)據(jù)集參量的事務(wù)長度最小值為325 kB、最大值為450 kB。綜上第二對(duì)照組挖掘系統(tǒng)作用下,數(shù)據(jù)集參量長度處于325 ~800 kB的數(shù)值范圍之內(nèi),遠(yuǎn)高于實(shí)驗(yàn)組實(shí)驗(yàn)結(jié)果。
上述實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)系統(tǒng)可以有效解決因事務(wù)長度過大導(dǎo)致的數(shù)據(jù)項(xiàng)挖掘深度不達(dá)標(biāo)的問題,能夠有效提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)跨級(jí)傳輸能力。
所設(shè)計(jì)挖掘系統(tǒng)在電爐企業(yè)異構(gòu)網(wǎng)絡(luò)體系的基礎(chǔ)上,聯(lián)合數(shù)據(jù)邏輯分析模塊與數(shù)據(jù)跨級(jí)共享模塊,求解MP節(jié)點(diǎn)與AP數(shù)據(jù)分片標(biāo)準(zhǔn)表達(dá)式,從而實(shí)現(xiàn)對(duì)高效項(xiàng)集RCAUL調(diào)用指令的精準(zhǔn)定義。實(shí)驗(yàn)結(jié)果表明,在這種新型挖掘系統(tǒng)的作用下,因事務(wù)長度過大導(dǎo)致的數(shù)據(jù)項(xiàng)挖掘深度不達(dá)標(biāo)的問題得到較好解決,符合提升電爐企業(yè)網(wǎng)絡(luò)共享數(shù)據(jù)跨級(jí)傳輸能力的實(shí)際應(yīng)用需求。