張 杰,張子蓬
(湖北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,湖北 武漢 430068)
中國(guó)白酒文化源遠(yuǎn)流長(zhǎng),采用純糧谷類作物固態(tài)發(fā)酵釀造工藝[1]的中國(guó)白酒也是世界六大蒸餾酒之一,釀造好品質(zhì)白酒的核心工藝是蒸餾,而上甑工藝[2]的好壞直接決定了蒸餾出白酒的質(zhì)量。目前白酒蒸汽狀態(tài)還處于依靠檢測(cè)的方法,無(wú)法避免酒損。因此,準(zhǔn)確地預(yù)測(cè)白酒蒸汽狀態(tài)具有顯著應(yīng)用價(jià)值。然而白酒蒸汽狀態(tài)的變化受多種因素的影響,給白酒蒸汽狀態(tài)預(yù)測(cè)帶來(lái)很大的困難,同時(shí)也使其成為具有重要意義的工業(yè)問(wèn)題。
近年來(lái),部分釀酒企業(yè)開(kāi)始采用上甑機(jī)器人進(jìn)行上甑操作,其中武漢奮進(jìn)智能機(jī)器有限公司首創(chuàng)了定制化上甑機(jī)器人[3]。機(jī)器人在探汽上甑過(guò)程中,需要時(shí)刻通過(guò)紅外熱成像儀獲取白酒蒸汽紅外輻射來(lái)監(jiān)測(cè)白酒蒸汽的運(yùn)行狀態(tài),通過(guò)鋪料上甑來(lái)阻止白酒蒸汽跑出。目前機(jī)器學(xué)習(xí)技術(shù)已經(jīng)常被用于許多個(gè)領(lǐng)域,其中基于機(jī)器學(xué)習(xí)的模型在蒸汽類預(yù)測(cè)中也獲得了一些不錯(cuò)的效果,比如有:支持向量機(jī)回歸(SVM regression)[4]、決策樹(shù)回歸(Decision Tree regression)[5]、隨機(jī)森林回歸(Random Forest regression)[6]、人工神經(jīng)網(wǎng)絡(luò)回歸(ANN regression)[7]。其中,人工神經(jīng)網(wǎng)絡(luò)可以模擬人腦神經(jīng)元進(jìn)行工作,常被使用在各種復(fù)雜工作場(chǎng)景下進(jìn)行預(yù)測(cè)。在蒸汽預(yù)測(cè)中,陳小強(qiáng)等[8]提出了一種基于GMDH神經(jīng)網(wǎng)絡(luò)的超臨界機(jī)組的過(guò)熱蒸汽溫度預(yù)測(cè)模型,與線性神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)相比,預(yù)測(cè)精度有顯著提升。朱清智等[9]使用混沌搜索策略鯨魚(yú)優(yōu)化算法(CAWOA)和并行極限學(xué)習(xí)機(jī)(PELM)對(duì)主蒸汽流量進(jìn)行預(yù)測(cè),獲得了較好的預(yù)測(cè)效果。謝七月等[10]介紹了基于改進(jìn)自適應(yīng)GPC的鍋爐主蒸汽溫度預(yù)測(cè)控制方法,相較于常規(guī)PID方法和GPC方法,對(duì)蒸汽溫度的預(yù)測(cè)取得了很好的效果。Valsalam等[11]使用卡爾曼濾波方法優(yōu)化了鍋爐電廠的主蒸汽溫度預(yù)測(cè)模型。劉祥杰等[12]提出了基于NFGPC模糊神經(jīng)網(wǎng)絡(luò)的非線性廣泛預(yù)測(cè)模型對(duì)過(guò)熱蒸汽溫度進(jìn)行預(yù)測(cè)。Golob等[13]使用神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)了鍋爐蒸汽的分布。Nguyen等[14]提出了基于LSTM神經(jīng)網(wǎng)絡(luò)模型和自動(dòng)優(yōu)化參數(shù)方法對(duì)蒸汽相關(guān)的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè)。Alizamair等[15]使用多種機(jī)器學(xué)習(xí)模型和多種神經(jīng)網(wǎng)絡(luò)模型對(duì)不同深度土壤溫度進(jìn)行預(yù)測(cè)。Delcroix等[16]使用具有外源變量的自動(dòng)回歸神經(jīng)網(wǎng)絡(luò)模型對(duì)建筑物室內(nèi)溫度進(jìn)行預(yù)測(cè)。Asmaa等[17]使用LSTM對(duì)溫室作物的內(nèi)部氣候變化進(jìn)行預(yù)測(cè)。。
在以上研究中,大多使用人工神經(jīng)網(wǎng)絡(luò)等模型實(shí)現(xiàn)蒸汽預(yù)測(cè)。而且對(duì)于白酒蒸汽狀態(tài)預(yù)測(cè)的方法缺少其他機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型的研究,比如門控循環(huán)單元模型(Gate Recurrent Unit)[18]。門控循環(huán)單元模型具有記憶神經(jīng)元,能同時(shí)記憶短期行為和長(zhǎng)期行為。這種模式使得門控循環(huán)單元很適合模擬自然過(guò)程的行為。同時(shí),梯度提升樹(shù)(Gradient Boosting Decision Tree)是基于梯度下降算法[19],使用多個(gè)弱學(xué)習(xí)器加權(quán)求和組合成一個(gè)強(qiáng)學(xué)習(xí)器,這種集成學(xué)習(xí)的模式使得梯度提升樹(shù)在各個(gè)領(lǐng)域的預(yù)測(cè)研究得到普遍的使用。同時(shí),白酒蒸汽狀態(tài)的特征因子很多,如:空氣濕度、酒醅濕度等,目前基于機(jī)器學(xué)習(xí)模型的特征因子重要性研究評(píng)估還沒(méi)有展開(kāi),另外在預(yù)測(cè)模型中各種蒸汽狀態(tài)特征因子的不同組合會(huì)高度影響預(yù)測(cè)模型的預(yù)測(cè)能力。
本文使用茅臺(tái)酒廠上甑機(jī)器人工作數(shù)據(jù)進(jìn)行實(shí)驗(yàn),首先基于梯度提升樹(shù)計(jì)算白酒蒸汽狀態(tài)預(yù)測(cè)中每個(gè)特征因子的重要性大小,然后依此對(duì)特征因子進(jìn)行多種組合,最后將各種特征因子輸入預(yù)測(cè)模型,本文使用梯度提升樹(shù)改進(jìn)的門控循環(huán)單元作為蒸汽狀態(tài)預(yù)測(cè)模型,通過(guò)不同因素組合的最終預(yù)測(cè)性能來(lái)確定最終的重要特征因子集合。
本文在茅臺(tái)酒廠進(jìn)行了測(cè)試。在上甑機(jī)器人(圖1)上下載了兩秒一采樣的半年數(shù)據(jù)(2020年1月1日至2020年6月30日),其特征因子分別為酒醅表面溫度(Surface Temperature),酒醅相對(duì)濕度(Relative Humidity),酒廠環(huán)境溫度(Ambient Temperature),甑桶內(nèi)酒蒸汽氣壓(Steam Pressure),機(jī)器人輔料速度(Loading Speed),甑桶出酒量(Wine Yield),甑桶出酒速度(Production Speed),其中酒醅表面溫度是通過(guò)紅外熱成像儀在距甑桶頂70 cm處得到。茅臺(tái)鎮(zhèn)是我國(guó)重要的醬酒圣地,鎮(zhèn)內(nèi)資源奇特,微生物體系奇異,具有得天獨(dú)厚的釀造環(huán)境,以盛產(chǎn)美酒而聞名海內(nèi)外,被譽(yù)為中國(guó)第一酒鎮(zhèn)[20]。茅臺(tái)鎮(zhèn)屬于亞熱帶季風(fēng)氣候,全年冬暖夏熱,高溫少雨,平均氣溫為18℃,夏季最高溫度為40℃,這種特殊氣候十分有利于釀造醬酒微生物的棲息和繁殖,核心產(chǎn)區(qū)內(nèi)多達(dá)百余種微生物參與了醬酒的釀造過(guò)程。并且酒廠環(huán)境溫度、酒醅相對(duì)濕度對(duì)這些微生物在參與上甑蒸餾的釀造過(guò)程的蒸汽生成有很大影響,而目前白酒蒸汽狀態(tài)還依靠檢測(cè),無(wú)法避免酒損,故白酒蒸汽預(yù)測(cè)對(duì)于白酒的釀造具有重要意義。
圖1 上甑機(jī)器人結(jié)構(gòu)圖
本文主要研究?jī)蓚€(gè)問(wèn)題:
1)對(duì)于白酒蒸汽狀態(tài)預(yù)測(cè)時(shí),每個(gè)特征因子的功能是不一樣的,白酒蒸汽狀態(tài)與每個(gè)特征因子和其組合之間的關(guān)系是怎樣的?
2)白酒蒸汽狀態(tài)預(yù)測(cè)是一種多維時(shí)間序列預(yù)測(cè),什么樣的算法適合白酒蒸汽變化的規(guī)律?
面對(duì)以上疑問(wèn),本文提出了改進(jìn)的門控循環(huán)單元融合模型(圖2)。對(duì)于多個(gè)上甑過(guò)程中的特征因子,不同的特征因子與白酒蒸汽狀態(tài)之間的相關(guān)性不一樣。先使用GBDT對(duì)每個(gè)特征因子進(jìn)行重要性排序,對(duì)于排序后的特征因子,根據(jù)重要性來(lái)完成不同的組合,然后輸入門控循環(huán)單元模型,找到預(yù)測(cè)效果最優(yōu)的特征因子輸入組合,最后基于門控循環(huán)單元模型分析白酒蒸汽狀態(tài)與其特征因子之間的關(guān)聯(lián),得到預(yù)測(cè)結(jié)果。
圖2 改進(jìn)的GRU模型的白酒蒸汽狀態(tài)預(yù)測(cè)流程圖
門控循環(huán)單元模型(GRU)是一種結(jié)構(gòu)簡(jiǎn)單,性能優(yōu)良的循環(huán)神經(jīng)網(wǎng)絡(luò)。具有記憶神經(jīng)元的GRU可以同時(shí)記憶白酒蒸汽狀態(tài)與特征因子間的短期行為信息和長(zhǎng)行為期信息。循環(huán)神經(jīng)網(wǎng)絡(luò)可以讓輸入信息在神經(jīng)元里被保存下來(lái),但這種保存是無(wú)目的性的,且會(huì)產(chǎn)生梯度消失和梯度爆炸問(wèn)題,因此后來(lái)出現(xiàn)了LSTM[21],有針對(duì)性的將重要信息記憶下來(lái),不相關(guān)信息遺忘,這個(gè)過(guò)程通過(guò)LSTM的3個(gè)門函數(shù):輸入門,遺忘門和輸出門來(lái)確定輸入值,遺忘值和輸出值,這樣就一定程度解決了循環(huán)神經(jīng)網(wǎng)絡(luò)的序列訓(xùn)練過(guò)程中的梯度爆炸和梯度消失問(wèn)題,多用來(lái)進(jìn)行時(shí)間序列的預(yù)測(cè)。
GRU的發(fā)展借鑒了LSTM神經(jīng)網(wǎng)絡(luò)的門結(jié)構(gòu),與LSTM相比,GRU神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)更簡(jiǎn)單,效果也不錯(cuò),GRU模型通過(guò)兩個(gè)門函數(shù):更新門和重置門完成和LSTM相似的過(guò)程,其中更新門值和重置門值的大小與上一時(shí)刻狀態(tài)信息權(quán)重正相關(guān),門控制信號(hào)的范圍是0~1,更新門值越接近1,則上一時(shí)刻記憶下來(lái)的信息越多,反之則遺忘的信息更多,重置門值越接近0,則上一時(shí)刻信息遺忘的越多,從模型復(fù)雜度上來(lái)看,長(zhǎng)序列訓(xùn)練過(guò)程中需要適當(dāng)遺忘一些信息,否則模型復(fù)雜度會(huì)增加,模型計(jì)算時(shí)間也會(huì)變長(zhǎng)。GRU模型結(jié)構(gòu)如圖3所示,其中,Xt是t時(shí)刻的輸入,ht是t時(shí)刻的輸出,zt是t時(shí)刻的更新門,rt是t時(shí)刻的重置門,σ是sigmoid函數(shù),tanh是雙曲正切函數(shù),?表示兩個(gè)矩陣的張量積,⊙表示兩矩陣對(duì)應(yīng)位置元素相乘。
圖3 門控循環(huán)單元模型結(jié)構(gòu)圖
更新門zt:用于確定上一時(shí)刻的狀態(tài)信息在當(dāng)前狀態(tài)ht中的權(quán)重大小,通過(guò)sigmoid函數(shù)將數(shù)據(jù)變成0~1之間的數(shù)值,表示更新門控信號(hào),越接近1說(shuō)明上一時(shí)刻信息帶入的越多,即:
zt=σ(WzXt+Uzht-1+bz)
重置門rt:用于確定前一時(shí)刻的狀態(tài)信息在當(dāng)前狀態(tài)下遺忘的的權(quán)重大小,通過(guò)sigmoid函數(shù)將數(shù)據(jù)變成0~1之間的數(shù)值,表示重置門控信號(hào),越接近0說(shuō)明上一時(shí)刻信息遺忘的越多,即:
rt=σ(WrXt+Urht-1+br)
得到門控信號(hào)后,使用重置門確定上一時(shí)刻狀態(tài)信息ht-1要遺忘的狀態(tài)信息權(quán)重,然后將重置之后的數(shù)據(jù)與當(dāng)前的狀態(tài)信息輸入xt拼接,再一起輸入tanh激活函數(shù)將數(shù)據(jù)變成-1~1之間的數(shù)值,即:
最后在GRU中進(jìn)行狀態(tài)信息的更新操作,使用求得的更新門控信號(hào)zt,對(duì)歷史狀態(tài)信息和當(dāng)前狀態(tài)信息同時(shí)進(jìn)行重置和更新兩個(gè)步驟,其中(1-zt)*ht-1表示對(duì)歷史狀態(tài)信息選擇性遺忘,zt*ht-1表示對(duì)當(dāng)前狀態(tài)信息選擇性記憶,通過(guò)一個(gè)更新門控zt使遺忘和記憶始終處于一種穩(wěn)態(tài),即:
梯度提升樹(shù)模型(GBDT)是一種基于Boosting思想的集成學(xué)習(xí)模型,迭代地使用多個(gè)弱學(xué)習(xí)器加權(quán)求和組合成一個(gè)強(qiáng)學(xué)習(xí)器,將每一步的殘差訓(xùn)練成下一輪的弱學(xué)習(xí)器,串行訓(xùn)練以獲得較高的精度,誤差小于給定閾值時(shí)停止訓(xùn)練,以優(yōu)化預(yù)測(cè)效果。本文使用梯度提升樹(shù)算法計(jì)算特征因子在本模型的貢獻(xiàn)率,從而評(píng)估該特征因子對(duì)于模型的重要性。流程為:首先求出特征因子a對(duì)于一個(gè)弱學(xué)習(xí)器的重要性,原因是當(dāng)特征因子a作為每一輪弱學(xué)習(xí)器生成條件,若模型損失函數(shù)值變化越大,說(shuō)明該特征因子越重要,N-1是非葉子節(jié)點(diǎn),qi是與節(jié)點(diǎn)i關(guān)聯(lián)的特征因子,計(jì)算得到特征因子a的損失值,將每個(gè)平方損失值累加起來(lái),得到每一個(gè)弱學(xué)習(xí)器中特征因子a的重要性。然后計(jì)算特征因子a對(duì)于整個(gè)強(qiáng)學(xué)習(xí)器的影響程度,對(duì)每個(gè)含有特征因子a的弱學(xué)習(xí)器的重要程度求和,然后求均值。對(duì)每個(gè)特征因子進(jìn)行上述操作,得到所有特征因子的重要性排序,對(duì)于排序后的特征因子,根據(jù)重要性來(lái)完成不同的組合:
2.2.1數(shù)據(jù)采集本文選取酒廠上甑機(jī)器人上甑過(guò)程相關(guān)數(shù)據(jù),采集茅臺(tái)酒廠某車間1號(hào)上甑機(jī)器人半年的上甑數(shù)據(jù),約八萬(wàn)個(gè)樣本。本文數(shù)據(jù)集按照時(shí)間順序?qū)颖緞澐譃橛?xùn)練集、驗(yàn)證集和測(cè)試集,劃分比例為7∶2∶1,54 600條數(shù)據(jù)作為訓(xùn)練集,15 600條數(shù)據(jù)作為驗(yàn)證集,7800條數(shù)據(jù)作為測(cè)試集。
均方根誤差:
平均絕對(duì)誤差:
可決系數(shù):
按照時(shí)間順序?qū)颖緞澐譃橛?xùn)練集X_train、驗(yàn)證集X_val和測(cè)試集X_test,劃分比例為7∶2∶1。
2.2.2搭建門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)模型本文改進(jìn)的門控循環(huán)單元網(wǎng)絡(luò)中的超參數(shù)有每一批訓(xùn)練個(gè)數(shù)、訓(xùn)練輪數(shù),每一層隱藏層神經(jīng)元個(gè)數(shù)、舍棄率、學(xué)習(xí)率、特征因子的選取,這些超參數(shù)都和預(yù)測(cè)性能高度相關(guān)。在確定門控循環(huán)單元個(gè)數(shù)時(shí),初始化每一批訓(xùn)練個(gè)數(shù)100,訓(xùn)練輪數(shù)150,學(xué)習(xí)率0.001,舍棄率0.5,選取特征因子有酒醅表面溫度,酒醅相對(duì)濕度,甑桶內(nèi)酒蒸汽氣壓。選取[16,32,64,128]來(lái)分別測(cè)試門控循環(huán)單元神經(jīng)元個(gè)數(shù),進(jìn)一步確定最優(yōu)的門控循環(huán)單元的神經(jīng)元個(gè)數(shù),然后用相同的思想來(lái)通過(guò)選取[50,150,200,250,300,350,400]進(jìn)而來(lái)確定最優(yōu)的每一批訓(xùn)練個(gè)數(shù),然后再?gòu)腫50,250,350,450,550,650,800]選取最優(yōu)的訓(xùn)練輪數(shù),從[0.0001,0.00001,0.000001]中選取最優(yōu)的學(xué)習(xí)率,從[0.4,0.3,0.2,0.1]中選取最優(yōu)的舍棄率。將以上超參數(shù)確定之后,也確定了門控循環(huán)單元預(yù)測(cè)模型的最優(yōu)結(jié)構(gòu)。下一步對(duì)特征因子進(jìn)行選取測(cè)試,根據(jù)梯度提升樹(shù)算法模型計(jì)算每個(gè)特征因子(酒醅表面溫度,酒醅相對(duì)濕度,酒廠環(huán)境溫度,甑桶內(nèi)酒蒸汽氣壓,機(jī)器人輔料速度,甑桶出酒量,甑桶出酒速度)的重要性值大小,然后依此對(duì)特征因子進(jìn)行各種組合,然后輸入門控循環(huán)單元預(yù)測(cè)模型中,根據(jù)預(yù)測(cè)結(jié)果判斷哪些特征因子組合對(duì)白酒蒸汽狀態(tài)預(yù)測(cè)的影響更大。其中,門控循環(huán)單元預(yù)測(cè)模型輸入特征的維度(input_dim)是特征因子的個(gè)數(shù)。本文選取茅臺(tái)酒廠上甑機(jī)器人上甑過(guò)程相關(guān)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),門控循環(huán)單元神經(jīng)元個(gè)數(shù)(node_size),訓(xùn)練輪數(shù)(train_epoch),每一批訓(xùn)練個(gè)數(shù)(batch_size),學(xué)習(xí)率(learning_rate),舍棄率(dropout)的預(yù)測(cè)結(jié)果見(jiàn)表1-表5。
表1 神經(jīng)元個(gè)數(shù)對(duì)于白酒蒸汽狀態(tài)預(yù)測(cè)結(jié)果
表2 訓(xùn)練輪數(shù)對(duì)白酒蒸汽狀態(tài)預(yù)測(cè)結(jié)果
表3 每一批訓(xùn)練個(gè)數(shù)對(duì)白酒蒸汽狀態(tài)預(yù)測(cè)結(jié)果
表4 學(xué)習(xí)率對(duì)白酒蒸汽狀態(tài)預(yù)測(cè)結(jié)果
表5 舍棄率對(duì)白酒蒸汽狀態(tài)預(yù)測(cè)結(jié)果
根據(jù)表1觀察得到,不同的超參數(shù)構(gòu)建的模型的預(yù)測(cè)能力也是不同的,當(dāng)神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)過(guò)多時(shí)容易使模型產(chǎn)生過(guò)擬合,即偏差小、方差大,模型弱化了對(duì)新數(shù)據(jù)的預(yù)測(cè)能力,而當(dāng)神經(jīng)元節(jié)點(diǎn)過(guò)少時(shí)就容易使模型失去一定的擬合能力,進(jìn)而不能準(zhǔn)確表現(xiàn)出白酒蒸汽狀態(tài)與其他特征因子之間的相關(guān)性,當(dāng)神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)為32時(shí),模型預(yù)測(cè)最優(yōu);根據(jù)表2觀察得到,訓(xùn)練輪數(shù)過(guò)小會(huì)讓模型不能收斂,訓(xùn)練輪數(shù)過(guò)大會(huì)使模型產(chǎn)生過(guò)擬合,同時(shí)預(yù)測(cè)能力不再變高,當(dāng)訓(xùn)練輪數(shù)為650輪時(shí),此時(shí)模型預(yù)測(cè)最優(yōu);類似的,根據(jù)表3觀察得到,每一批訓(xùn)練個(gè)數(shù)決定了一次處理多少的訓(xùn)練樣本信息,批次處理量過(guò)小會(huì)使模型無(wú)法收斂,當(dāng)批次處理個(gè)數(shù)為350時(shí),模型最優(yōu);根據(jù)表4觀察得到,當(dāng)學(xué)習(xí)率過(guò)小時(shí)收斂過(guò)程十分緩慢,且容易陷入局部最優(yōu),當(dāng)學(xué)習(xí)率過(guò)大時(shí)容易在最優(yōu)值附近來(lái)回震蕩,當(dāng)學(xué)習(xí)率為0.00001時(shí),模型最優(yōu),由此得到最優(yōu)模型主要超參數(shù),進(jìn)而也得到了門控循環(huán)單元預(yù)測(cè)模型結(jié)構(gòu)。
2.2.3模型選取特征因子在確定門控循環(huán)單元預(yù)測(cè)模型結(jié)構(gòu)后,進(jìn)一步分析不同特征因子的組合對(duì)模型的預(yù)測(cè)效果,改進(jìn)的門控循環(huán)單元模型的整體數(shù)據(jù)處理流程見(jiàn)圖2,首先計(jì)算得到所有特征因子的重要性(圖4)。在使用梯度提升樹(shù)計(jì)算特征因子時(shí),對(duì)梯度提升樹(shù)模型的三個(gè)重要超參數(shù)(學(xué)習(xí)率(learning_rate),回歸樹(shù)的個(gè)數(shù)(sub_tree),每棵獨(dú)立樹(shù)最大深度(max_depth))進(jìn)行相應(yīng)的損失減少值測(cè)試,方便確定最優(yōu)參數(shù),經(jīng)過(guò)計(jì)算如表6所示,確定超參數(shù)取值(加粗為最優(yōu)超參數(shù))。
表6 各種超參數(shù)的梯度提升樹(shù)對(duì)比
圖4 特征因子重要性
根據(jù)實(shí)驗(yàn)分析得到,特征因子按照其重要性降序排序?yàn)椋壕契砻鏈囟取⒕茝S環(huán)境溫度、甑桶內(nèi)酒蒸汽氣壓、機(jī)器人輔料速度、甑桶內(nèi)酒蒸汽氣壓、甑桶出酒速度、甑桶出酒量。按照特征因子的重要性依次組合出預(yù)測(cè)模型的輸入:酒醅表面溫度(input_1),酒醅表面溫度+酒廠環(huán)境溫度(input_2),酒醅表面溫度+酒廠環(huán)境溫度+甑桶內(nèi)酒蒸汽氣壓(input_3),酒醅表面溫度+酒廠環(huán)境溫度+甑桶內(nèi)酒蒸汽氣壓+機(jī)器人輔料速度(input_4),酒醅表面溫度+酒廠環(huán)境溫度+甑桶內(nèi)酒蒸汽氣壓+機(jī)器人輔料速度+甑桶內(nèi)酒蒸汽氣壓(input_5),酒醅表面溫度+酒廠環(huán)境溫度+甑桶內(nèi)酒蒸汽氣壓+機(jī)器人輔料速度+甑桶內(nèi)酒蒸汽氣壓+甑桶出酒速度(input_6),酒醅表面溫度+酒廠環(huán)境溫度+甑桶內(nèi)酒蒸汽氣壓+機(jī)器人輔料速度+甑桶內(nèi)酒蒸汽氣壓+甑桶出酒速度+甑桶出酒量(input_7)。使用改進(jìn)的門控循環(huán)單元預(yù)測(cè)模型對(duì)以上的各種組合進(jìn)行測(cè)試,來(lái)確定最優(yōu)的特征因子組合,如表7所示。由測(cè)試得到,使用酒醅表面溫度、酒廠環(huán)境溫度和甑桶內(nèi)酒蒸汽氣壓的組合輸入,能夠讓模型的預(yù)測(cè)效果最優(yōu)。
表7 特征因子組合的預(yù)測(cè)結(jié)果
2.2.4不同模型效果比較本文模型與幾種常見(jiàn)模型進(jìn)行了比較,如表8所示。本文模型與其他模型相比,RMSE,MAE均更小,可決系數(shù)更大。因此,本文的方法在白酒蒸汽狀態(tài)的預(yù)測(cè)中是優(yōu)于其他模型的。
表8 本模型與常見(jiàn)模型結(jié)果比較
本文提出了使用梯度提升樹(shù)改進(jìn)的門控循環(huán)單元預(yù)測(cè)模型,來(lái)實(shí)現(xiàn)白酒蒸汽狀態(tài)的預(yù)測(cè),目前白酒蒸汽狀態(tài)還處于依靠檢測(cè)的方法,無(wú)法避免酒損,因此,白酒蒸汽預(yù)測(cè)對(duì)于白酒的釀造意義重大。本文模型基于茅臺(tái)酒廠上甑機(jī)器人上甑數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,首先使用梯度提升樹(shù)計(jì)算白酒蒸汽狀態(tài)預(yù)測(cè)中每個(gè)特征因子的重要性大小,然后依此對(duì)特征因子進(jìn)行多種組合,最后將各種特征因子輸入預(yù)測(cè)模型,本文中使用門控循環(huán)單元作為預(yù)測(cè)模型,根據(jù)各種特征因子組合的預(yù)測(cè)效果來(lái)確定最重要的特征因子。實(shí)驗(yàn)結(jié)果表明:本文提出的改進(jìn)的門控循環(huán)單元模型與常見(jiàn)預(yù)測(cè)模型相比,預(yù)測(cè)效果更優(yōu)。由于數(shù)據(jù)采集限制,本文主要是對(duì)2020年1月1日至2020年6月30日的半年數(shù)據(jù)進(jìn)行分析,全年不同月份氣候?qū)︻A(yù)測(cè)模型性能的影響還需要進(jìn)一步探索。