黃國(guó)樑 張蓀毅 樊盛炯 譚衍冬 葉 盛
(上海煙草集團(tuán)有限責(zé)任公司,上海 200082)
風(fēng)選后煙絲的填充值水平一直是影響后續(xù)卷接包質(zhì)量的重要關(guān)聯(lián)指標(biāo),與煙絲的填充、煙支空頭、吸阻等物測(cè)指標(biāo)存在顯著的相關(guān)性。對(duì)此筆者針對(duì)上海卷煙廠中華專線81#的風(fēng)選后煙絲填充值進(jìn)行了專題研究。
該文主要介紹了煙絲填充值穩(wěn)定性控制模式中的特征降維、層級(jí)關(guān)聯(lián)性數(shù)據(jù)的分析手法。數(shù)據(jù)降維是將原來較多的特征重新計(jì)算組合,從而形成少量新特征的過程。將特征降維和聚類挖掘技術(shù)應(yīng)用于“煙絲填充值穩(wěn)定性控制模式”的關(guān)鍵指標(biāo)特征甄選上,其目的是以盡可能用可視化的呈現(xiàn)方式,快速發(fā)現(xiàn)特征參數(shù)間的內(nèi)部關(guān)聯(lián)性與因果關(guān)系,方便用戶后期對(duì)各層級(jí)指標(biāo)組織樹的快速鉆取;關(guān)聯(lián)性分析是在大規(guī)模數(shù)據(jù)中集中尋找數(shù)據(jù)間的關(guān)聯(lián)性。數(shù)據(jù)間的這些聯(lián)系可以看作為兩種抽象主體之間的遞進(jìn)關(guān)系,其中前者是后者的抽象基礎(chǔ),代表了共現(xiàn)關(guān)系的頻繁項(xiàng)集。頻繁項(xiàng)集是經(jīng)常出現(xiàn)在一處的物品的集合,它暗示了某些事物之間總是結(jié)伴或成對(duì)出現(xiàn)的現(xiàn)象。
該文選取上海卷煙廠中華專線81#內(nèi)從制葉預(yù)處理段至煙絲風(fēng)選段內(nèi)2021年3月—10月為期半年的制絲批次參數(shù)數(shù)據(jù)。收集81#廠內(nèi)工序段對(duì)應(yīng)的該時(shí)間段內(nèi)的環(huán)境溫濕度檢測(cè)點(diǎn)原始數(shù)據(jù)。獲取81#風(fēng)選出口煙絲批次檢測(cè)填充值質(zhì)檢數(shù)據(jù)。
該文根據(jù)每個(gè)批次的相應(yīng)工序的生產(chǎn)時(shí)間,統(tǒng)計(jì)對(duì)應(yīng)時(shí)間段內(nèi)的多位點(diǎn)的環(huán)境溫、濕度原始數(shù)據(jù),利用加權(quán)平均的方法進(jìn)行統(tǒng)計(jì)整理,得出對(duì)應(yīng)批次的松散段溫度、松散段濕度、加料段溫度、加料段濕度、烘絲前溫度、烘絲前濕度的數(shù)據(jù);針對(duì)數(shù)據(jù)樣本中存在的缺失值,應(yīng)用參數(shù)數(shù)據(jù)均值填補(bǔ)的方法進(jìn)行數(shù)據(jù)填補(bǔ);選取研究對(duì)象填充值進(jìn)行偏度分析,結(jié)果顯示呈現(xiàn)偏右分布;于是采用BOX-COX變換轉(zhuǎn)化為正態(tài)分布。采用Z-score標(biāo)準(zhǔn)化方法對(duì)整體數(shù)據(jù)樣本進(jìn)行參數(shù)標(biāo)準(zhǔn)化,并剔除相對(duì)異常范圍以外的數(shù)據(jù)點(diǎn)。
該文將81#預(yù)處理段至風(fēng)選段的所有質(zhì)量參數(shù)進(jìn)行工序歸位和性質(zhì)分類,分類規(guī)則為各類別內(nèi)參數(shù)可以交叉出現(xiàn),共分為蒸汽、溫度、水分、風(fēng)度、氣壓、流量六個(gè)特征大類(即六大簇),以便為后續(xù)因子分析和降維分析做準(zhǔn)備。
通過分析計(jì)算蒸汽簇、溫度簇等六大簇內(nèi)所有參數(shù)之間的相關(guān)系數(shù),并對(duì)相關(guān)系數(shù)進(jìn)行排序、篩選后發(fā)現(xiàn),其中21個(gè)蒸汽系列參數(shù)之間的相關(guān)性較強(qiáng),于是便將此21個(gè)參數(shù)作為后續(xù)因子特征降維的參數(shù)研究范圍。然后對(duì)參數(shù)簇進(jìn)行KMO檢驗(yàn)和巴特利球形檢驗(yàn)(Bartlett's test),以驗(yàn)證數(shù)據(jù)用于因子分析的有效性。該文以溫度簇作為示例,見表1。
表1 KMO檢驗(yàn)和巴特利球形檢驗(yàn)數(shù)值表
其中KMO檢驗(yàn)和巴特利球形檢驗(yàn)值達(dá)到79.4%線性相關(guān),即大于50%,說明了變量間的相關(guān)程度無太大差異,驗(yàn)證了數(shù)據(jù)用于因子分析是有效的。
對(duì)于2.1節(jié)經(jīng)類別參數(shù)相關(guān)性分析后篩選出的相關(guān)性較強(qiáng)的21個(gè)具體參數(shù)名目,該文僅認(rèn)為這21個(gè)參數(shù)具有較高的代表性質(zhì),但是它們之間的交互作用、具體工段位置和參數(shù)效應(yīng)是混亂且不一致的。為了便于后續(xù)分析,參數(shù)需要進(jìn)一步精簡(jiǎn)。
因此筆者采用數(shù)據(jù)壓縮方法,利用因子分析計(jì)算出了21個(gè)參數(shù)的公因子貢獻(xiàn)率以及相應(yīng)公因子數(shù)對(duì)應(yīng)的累計(jì)貢獻(xiàn)率等數(shù)值。該21個(gè)參數(shù)的因子貢獻(xiàn)率與累計(jì)貢獻(xiàn)率分別為31.63%、31.63%;13.75%、45.37%;10.73%、56.10%;7.16%、63.27%;6.85%、70.12%;5.28%、75.40%;5.00%、80.39%;3.86%、84.25%;3.58%、87.83%;2.72%、90.55%;2.55%、93.10%;2.48%、95.58%;1.46%、97.04%;0.81%、97.85%;0.61%、98.46%;0.47%、98.93%;0.40%、99.33%;0.28%、99.62%;0.16%、99.78%;0.14%、99.91%;0.09%、100.00%。
根據(jù)該計(jì)算數(shù)據(jù),可提取前6個(gè)公因子代表該21個(gè)參數(shù)75%的信息。但是由于因子間相關(guān)性較低,在數(shù)據(jù)壓縮時(shí)對(duì)其提取度有可能達(dá)不到60%,因此該文需要進(jìn)一步計(jì)算因子載荷矩陣數(shù)值,為接下來的參數(shù)降維提供依據(jù)。
通過對(duì)因子載荷矩陣數(shù)據(jù)進(jìn)行偏維度分類,并按照計(jì)算出來的因子載荷矩陣數(shù)值的絕對(duì)值大小,該文最終將蒸汽簇內(nèi)21個(gè)參數(shù)壓縮至四個(gè)維度的四小參數(shù)簇,依次命名為葉絲增溫增濕(HT)蒸汽(HT蒸汽壓力A、B,HT蒸汽閥門開度A、B,蒸汽溫度A、B和蒸汽流量A、B)、加料HT蒸汽(二次加料機(jī)HT蒸汽壓力、蒸汽溫度和蒸汽流量)、加料筒蒸汽(二次加料機(jī)筒壁蒸汽溫度、加蒸汽流量體積和進(jìn)滾筒散熱器薄膜閥閥門開度)和加料助噴蒸汽(二次加料機(jī)加料助噴蒸汽壓力)。其他五大參數(shù)簇均按照類似該數(shù)據(jù)壓縮方式進(jìn)行壓縮,最終形成煙絲填充性能-六大參數(shù)簇(一級(jí)性能指標(biāo))-二級(jí)壓縮指標(biāo)簇-三級(jí)底層參數(shù)指標(biāo)。壓縮成果如下所示:
一級(jí)性能指標(biāo)為六大類:水分、風(fēng)度、氣壓、流量、蒸汽、溫度;二級(jí)壓縮指標(biāo)為根據(jù)六大類進(jìn)行的詳細(xì)劃分,詳情見表2。
表2 二級(jí)壓縮指標(biāo)
三級(jí)底層參數(shù)指標(biāo)分別對(duì)應(yīng)二級(jí)壓縮指標(biāo),一個(gè)二級(jí)指標(biāo)下對(duì)應(yīng)多個(gè)三級(jí)參數(shù)指標(biāo),詳細(xì)對(duì)應(yīng)關(guān)系與因子相關(guān)系數(shù)見表3。
在利用特征降維和因子分析方法將81#整體參數(shù)數(shù)據(jù)進(jìn)行維度降維,將蒸汽、溫度、風(fēng)度、氣壓、流量和水分作為第一維度。其次,利用因子分析方法,將各個(gè)一級(jí)維度進(jìn)一步劃分為二級(jí)維度自定義參數(shù)。最后,利用相關(guān)性分析建立起實(shí)際制絲工序中具體參數(shù)與二級(jí)自定義參數(shù)對(duì)應(yīng)的邏輯關(guān)系,進(jìn)而形成了可用于決策樹模型預(yù)測(cè)的數(shù)據(jù)樣本。
該文運(yùn)用決策樹的基尼指數(shù) CART算法對(duì)81#整體參數(shù)與填充值進(jìn)行決策樹決策劃分。其中CART決策樹使用“基尼指數(shù)”來選擇劃分屬性。數(shù)據(jù)集D的純度可用基尼值來度量,如公式(1)所示。
式中:D代表為數(shù)據(jù)分析樣本;k代表為序號(hào);y為數(shù)據(jù)樣
表3 三級(jí)底層參數(shù)指標(biāo)與二級(jí)壓縮指標(biāo)的對(duì)應(yīng)關(guān)系與因子相關(guān)系數(shù)
然后利用CART算法來進(jìn)行81#的填充值決策,切分質(zhì)量的評(píng)價(jià)準(zhǔn)則使用均方誤差(MSE),切分原則splitter使用最優(yōu)切分原則(best),最大樹深度選擇3層。進(jìn)行決策后,模型預(yù)測(cè)性能在85%以上。
在81#填充值的影響模式下,因子水平優(yōu)化順序見表4。
表4 81#填充值影響模式下的因子水平優(yōu)化順序
在輸出填充值影響控制模式下的決策樹決策后,依據(jù)模型推薦算法得出因子重要性排序,從低到高依次為:F61工序水分、F53功能風(fēng)、F水汽壓力、F21工序溫度、F63加水量、F振動(dòng)溫度。詳細(xì)排序如下所示: F61工序水分占11.31%、F53功能風(fēng)占10.5%、F41水汽壓力占10.4%、F21工序溫度占9.06%、F63加水量占7.82%、F22振動(dòng)溫度占6.17%、F52風(fēng)速占4.43%、F32總路流量規(guī)模占4.1%、F33加水量占3.95%、F25風(fēng)溫占3.83%、F31分路流量規(guī)模占3.58%、F24排潮溫度占3.37%、F12綜合蒸汽占3.34%、F42拔風(fēng)罩壓力占3.2%、F43筒氣壓占3.06%、F34加蒸汽量占2.85%、F62烘后水分占2.77%、F23主動(dòng)溫度占2.73%、F51風(fēng)壓占2.42%、F11分后蒸汽占1.1%。
在進(jìn)行填充值決策以及因子重要性排序之后,結(jié)合表3,進(jìn)行底部溯源分析,從填充值的最佳水平設(shè)置數(shù)值區(qū)間出發(fā),根據(jù)決策樹推薦決策,將一級(jí)參數(shù)、二級(jí)自定義參數(shù)全部化歸到第三級(jí)工序指標(biāo),利用置信區(qū)間算法,得出在95%置信度下,因子參數(shù)對(duì)應(yīng)不同填充值上、下界數(shù)值的各自應(yīng)該控制的上、下界范圍如表5所示。
表5 中羅列了制絲流程中可控或者間接可控參數(shù)的最佳控制區(qū)間范圍,而“-”代表在對(duì)應(yīng)填充性能下不做參數(shù)范圍的明確要求。
后續(xù)可結(jié)合車間對(duì)風(fēng)選后葉絲填充值控制標(biāo)準(zhǔn),利用平行坐標(biāo)原理將相關(guān)參數(shù)進(jìn)行區(qū)間監(jiān)控,做到及時(shí)預(yù)判與調(diào)整葉絲質(zhì)量的趨勢(shì)性偏移。
該文通過制絲流程全參數(shù)的決策模型運(yùn)算,得出按照層級(jí)關(guān)系與填充性能相對(duì)應(yīng)的參數(shù)控制范圍。為了后續(xù)運(yùn)用模型的有效性、準(zhǔn)確性,該文采用分割測(cè)試(AB test)驗(yàn)證方法,選取相鄰兩天完全一樣的生產(chǎn)工況與計(jì)劃作為一組AB test試驗(yàn),驗(yàn)證在中、高填充性能下,并根據(jù)模型預(yù)測(cè)的參數(shù)設(shè)置水平范圍進(jìn)行設(shè)置,分析最終葉絲填充性能是否有顯著性差異。
由于筒壁溫度是被動(dòng)控制的設(shè)備參數(shù),無法直接調(diào)節(jié),最終的驗(yàn)證參數(shù)為松散回潮加水比例、松散回潮工藝氣體溫度、松散回潮拔風(fēng)壓力、松散回潮加蒸汽比例。驗(yàn)證試驗(yàn)方案見表6。
根據(jù)表6的試驗(yàn)方案進(jìn)行AB test驗(yàn)證試驗(yàn)時(shí),第一天正常生產(chǎn),第二天調(diào)整試驗(yàn)參數(shù)水平設(shè)置,并保持其他參數(shù)不變,該2組試驗(yàn)的試驗(yàn)結(jié)果見表7。
對(duì)表7的2組試驗(yàn)結(jié)果分別進(jìn)行成對(duì)雙樣本t檢驗(yàn),P≤0.05、泊松相關(guān)系數(shù)≥0.8,結(jié)果顯示:1組根據(jù)模型預(yù)測(cè)的高填充性能對(duì)應(yīng)的參數(shù)調(diào)整后,得到的試驗(yàn)填充值結(jié)果相比正常生產(chǎn)的對(duì)照組填充值均值有顯著性地提升;2組根據(jù)中水平填充性能對(duì)應(yīng)的參數(shù)調(diào)整后,得到的填充值結(jié)果相對(duì)正常生產(chǎn)對(duì)照組并無明顯差異。
該文通過AB test驗(yàn)證試驗(yàn),驗(yàn)證了利用決策預(yù)測(cè)模型得到的填充值關(guān)鍵參數(shù)的控制體系,可以有效、及時(shí)地調(diào)整與控制風(fēng)選后煙絲填充性能的變化。
表5 因子參數(shù)對(duì)應(yīng)填充值水平的填充性能
表6 驗(yàn)證試驗(yàn)方案
表7 AB test 驗(yàn)證結(jié)果
該文利用特征降維和決策樹預(yù)測(cè)等分析方法,找尋出了影響風(fēng)選后填充值穩(wěn)定性的全工序參數(shù)控制體系,并且通過因子置信區(qū)間分析得出了各參數(shù)對(duì)應(yīng)的控制范圍,通過ABtest驗(yàn)證試驗(yàn),驗(yàn)證了參數(shù)控制體系可以有效地調(diào)整、控制填充值的變化趨勢(shì),并且證明了相關(guān)的重點(diǎn)參數(shù)對(duì)風(fēng)選后制絲質(zhì)量的影響,便于生產(chǎn)管理人員重點(diǎn)監(jiān)控,為保持制絲質(zhì)量穩(wěn)定性提供了明確的方向。