李昊巍
(中國(guó)工業(yè)互聯(lián)網(wǎng)研究院,北京 100102)
柔性車間是能夠靈活調(diào)整工序加工路徑的一種車間模式,在運(yùn)行中會(huì)有很多擾動(dòng)情況出現(xiàn),此外還會(huì)有高緯度,多樣化以及規(guī)模化的數(shù)據(jù)[1]。根據(jù)其特點(diǎn),本文設(shè)計(jì)的挖掘架構(gòu)見圖1。該架構(gòu)的組成部分有基于改進(jìn)隨機(jī)森林算法挖掘模型、擾動(dòng)屬性聚類策略以及結(jié)合大數(shù)據(jù)預(yù)處理模型。
圖1 挖掘架構(gòu)
通過改進(jìn)隨機(jī)森林算法模型能夠從歷史數(shù)據(jù)中發(fā)現(xiàn)調(diào)度規(guī)律,并通過調(diào)度規(guī)則來進(jìn)行表現(xiàn)。這種模型作為挖掘算法,根據(jù)決策樹來對(duì)隨機(jī)森林規(guī)則進(jìn)行構(gòu)建,在通過加權(quán)之后得到結(jié)果,從而能夠?qū)?yōu)先性高的工件或者是合適的機(jī)器進(jìn)行區(qū)分。
現(xiàn)階段在制造業(yè)中物聯(lián)網(wǎng)技術(shù)、自動(dòng)化技術(shù)以及信息技術(shù)的快速發(fā)展,尤其是車間底層廣泛的應(yīng)用數(shù)據(jù)采集裝置,無線傳感器以及其他智能感知設(shè)備,企業(yè)大幅度的提高獲取調(diào)度歷史數(shù)據(jù)的能力。本文提出了和大數(shù)據(jù)技術(shù)相結(jié)合的一種數(shù)據(jù)預(yù)處理模型,該模型包含的有數(shù)據(jù)的篩選、采集、整合以及清洗,見圖2。
圖2
1.1.1 數(shù)據(jù)采集
要想挖掘,前提需要采集數(shù)據(jù),而數(shù)據(jù)采集是對(duì)柔性車間數(shù)據(jù)從多個(gè)數(shù)據(jù)源中進(jìn)行采集。本文采取Flume 和Sqoop 數(shù)據(jù)采集工具,從數(shù)據(jù)庫(kù)中獲得工件、人員和機(jī)器等信息[2]。對(duì)柔性車間在擾動(dòng)下的調(diào)度問題進(jìn)行考慮,需要解決工件機(jī)器選擇和空間工件選擇的問題,所以采集的調(diào)度歷史數(shù)據(jù)集合D 能夠表示為Dh={d1,d2,d3}。其中d1表示制定方案時(shí)和擾動(dòng)相關(guān)的系統(tǒng)信息,比如返工工件的數(shù)量,機(jī)器故障的數(shù)量等。d2表示某個(gè)工件的某到工序選擇的機(jī)器,能夠?qū)@道工序進(jìn)行加工的每臺(tái)機(jī)器信息,比如對(duì)這道工序該機(jī)器的加工時(shí)間,機(jī)器前在制品數(shù)量等。d3表示空閑機(jī)器在等待中對(duì)工件進(jìn)行選擇加工時(shí),當(dāng)前等待中的每個(gè)工件的信息,比如工件是不是返工工件,在該機(jī)器上工件的加工時(shí)間等。
1.1.2 數(shù)據(jù)清洗
在智能化趨勢(shì)下的車間,肯定會(huì)多次重復(fù)的記錄調(diào)度相關(guān)歷史數(shù)據(jù),從而會(huì)使得采集的調(diào)度數(shù)據(jù)集合Dh中有數(shù)據(jù)重復(fù)以及數(shù)據(jù)沖突的情況,要想對(duì)之后的調(diào)度挖掘奠定基礎(chǔ)必須要對(duì)這些調(diào)度數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗才行[3]。本文通過建立數(shù)據(jù)清洗以及過濾規(guī)則,定義每種生產(chǎn)屬性需要的過濾規(guī)則以及內(nèi)部數(shù)據(jù)處理邏輯,來對(duì)采集的數(shù)據(jù)進(jìn)行清洗。根據(jù)清洗和過濾規(guī)則,采集的每條數(shù)據(jù)都會(huì)根據(jù)自身數(shù)據(jù)集合中的哪種數(shù)據(jù),來對(duì)數(shù)據(jù)清洗方法進(jìn)行查詢,選擇相應(yīng)規(guī)則進(jìn)行組合,對(duì)于最終的數(shù)據(jù)清洗根據(jù)Spark 來進(jìn)行完成。在Hadoop 分布式文件系統(tǒng)(HDFS)中把清洗好的調(diào)度數(shù)據(jù)集合Dh進(jìn)行存儲(chǔ)。
本文挖掘算法選擇的是隨機(jī)森林法,最終得到該算法的隨機(jī)森林,實(shí)際就是多棵C4.5 決策樹。所以,調(diào)度性能和決策樹的分類性能有著很大的關(guān)系,而決策樹的分支數(shù)量影響著調(diào)度規(guī)則的復(fù)雜程度以及計(jì)算效率。而決策樹的分支越少,分類性能越好,得到的調(diào)度規(guī)則的計(jì)算效率越高,復(fù)雜程度越低。而根據(jù)擾動(dòng)的聚類策略主要就是為了對(duì)決策樹的分類性能進(jìn)行提高,對(duì)分支數(shù)量進(jìn)行減少[6]?;诖它c(diǎn),通過挖掘算法,能夠得到不同擾動(dòng)下的調(diào)度規(guī)則。在發(fā)生擾動(dòng)變化時(shí),對(duì)調(diào)度規(guī)則進(jìn)行切換,能夠提升擾動(dòng)的實(shí)時(shí)響應(yīng)能力。
在動(dòng)態(tài)調(diào)度中,擾動(dòng)發(fā)生改變,那么生產(chǎn)屬性就會(huì)影響調(diào)度的決策,比如,在沒有擾動(dòng)情況下,在對(duì)工件加工進(jìn)行判斷時(shí),空閑機(jī)器不會(huì)對(duì)這個(gè)工件是否為緊急訂單而考慮其優(yōu)先性,但如果車間有緊急插單時(shí),那么對(duì)于工件進(jìn)行加工時(shí)的優(yōu)先性會(huì)考慮該工件是不是緊急訂單。而生產(chǎn)屬性影響調(diào)度決策主要在決策樹中生產(chǎn)屬性信息增益率的變化進(jìn)行體現(xiàn),其公式如下所示。
其中,|Dik|表示Dik的訓(xùn)練實(shí)例個(gè)數(shù),Dik表示Di中屬于Ck的集合,|Di|表示Di訓(xùn)練實(shí)例個(gè)數(shù),D 通過A可以劃分為n 個(gè)子集D1,D2,......,Dn,|Ck|表示Ck中的訓(xùn)練實(shí)例個(gè)數(shù),|D|表示D 的訓(xùn)練實(shí)例個(gè)數(shù),H(A)表示A 的分裂信息,G(D,A)表示A 的信息增益,GR(D,A)表示A 的信息增益率。
改進(jìn)隨機(jī)森林算法流程見圖3 所示,在圖3 中的規(guī)則1 是通過d2 數(shù)據(jù)訓(xùn)練得到的,主要是對(duì)選擇工件機(jī)器問題進(jìn)行解決。規(guī)則2 是通過d3 數(shù)據(jù)訓(xùn)練得到的,主要是對(duì)空閑機(jī)器工件選擇問題進(jìn)行解決。對(duì)于某個(gè)擾動(dòng)情況下,使用該算法挖掘規(guī)則如下:
圖3 改進(jìn)隨機(jī)森林算法
步驟1:對(duì)隨機(jī)森林進(jìn)行構(gòu)建,首先訓(xùn)練數(shù)據(jù)是擾動(dòng)下對(duì)應(yīng)簇中的較優(yōu)數(shù)據(jù)。然后從d2 和d3 部分?jǐn)?shù)據(jù)中進(jìn)行抽取訓(xùn)練實(shí)例,形成k 個(gè)新集合。最后,從d2和d3 中,隨機(jī)的進(jìn)行m 個(gè)屬性的選擇,并對(duì)最好的分類進(jìn)行計(jì)算,以此能夠得到k 棵決策樹。
步驟2:對(duì)決策樹的分類表現(xiàn)進(jìn)行測(cè)試,測(cè)試數(shù)據(jù)是由d2 和d3 中部分?jǐn)?shù)據(jù)沒有被選中的實(shí)例數(shù)據(jù),對(duì)每顆決策樹分類表現(xiàn)進(jìn)行測(cè)試并記錄。
步驟3:對(duì)決策樹相似的策略進(jìn)行避免。對(duì)決策樹之間的相似度進(jìn)行計(jì)算,如果兩者之間的相似度在60%以上,那么該決策樹就可以認(rèn)為是相似的,需要對(duì)表現(xiàn)比較差的決策樹進(jìn)行淘汰。
步驟4:對(duì)每棵決策樹的權(quán)值進(jìn)行計(jì)算。根據(jù)測(cè)試的表現(xiàn),對(duì)保留下來的決策樹權(quán)值進(jìn)行計(jì)算,公式如下所示。
對(duì)于柔性車間動(dòng)態(tài)調(diào)度問題,本文提出了工業(yè)大數(shù)據(jù)特點(diǎn)的調(diào)度挖掘方法。這種算法在調(diào)度歷史存在噪聲,高緯度以及大規(guī)模的數(shù)據(jù)中較為合適,這種挖掘方法在實(shí)時(shí)響應(yīng)能力,計(jì)算效率以及實(shí)際可操作性等方面表現(xiàn)是非常不錯(cuò)的。因挖掘得到的調(diào)度性能會(huì)受到歷史調(diào)度優(yōu)劣的影響,所以,之后可對(duì)調(diào)度規(guī)則相關(guān)數(shù)據(jù)進(jìn)行研究,以此來不斷的完善隨機(jī)森林調(diào)度規(guī)則。