陳 琪,徐芳芳 ,張 欣 ,徐 冰,吳 云 ,王振中 ,肖 偉,
1.南京中醫(yī)藥大學(xué),江蘇 南京 210023
2.江蘇康緣藥業(yè)股份有限公司,江蘇 連云港 222001
3.中藥制藥過程新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 連云港 222001
4.北京中醫(yī)藥大學(xué),北京 100029
桂枝茯苓膠囊(Guizhi Fuling Capsules,GFC)是由桂枝、茯苓、牡丹皮、桃仁和白芍5 味藥材組成,具有活血、化瘀、消癥等功效,用于治療痛經(jīng)、子宮肌瘤等疾病。GFC 內(nèi)容物屬于中藥半浸膏粉,具有吸濕性強(qiáng)、易結(jié)塊等特點(diǎn)[1-2],會(huì)影響膠囊的裝量差異和穩(wěn)定性等關(guān)鍵質(zhì)量屬性。王晴等[1]采用偏最小二乘算法(partial least squares,PLS)建立GFC內(nèi)容物吸濕性預(yù)測(cè)模型,該建模方法在生產(chǎn)應(yīng)用中需手動(dòng)篩選關(guān)鍵變量,數(shù)據(jù)預(yù)處理工作量大,所建模型的交叉驗(yàn)證決定系數(shù)(determination coefficient of cross-validation ,Q2)、校正集決定系數(shù)(determination coefficient of calibration,R2c)和預(yù)測(cè)集決定系數(shù)(determination coefficient of prediction,R2p)較高且需進(jìn)一步提升。本實(shí)驗(yàn)嘗試從算法角度提高模型性能,研究不同算法對(duì)模型性能的影響。
決策樹算法(classification and regression tree,CART)、多元自適應(yīng)回歸樣條算法(multivariate adaptive regression splines,MARS)都可自動(dòng)篩選變量,處理速度快,能夠提升建模效率和模型性能,還可利用預(yù)測(cè)建模技術(shù)自動(dòng)化、智能化對(duì)缺失值進(jìn)行處理。吳曉倩等[3]引入決策樹算法,利用與成績(jī)相關(guān)的數(shù)據(jù)實(shí)現(xiàn)對(duì)學(xué)生未來成績(jī)的預(yù)測(cè),預(yù)測(cè)準(zhǔn)確率達(dá)到94%。仉文崗等[4]基于大量可靠的巖土監(jiān)測(cè)數(shù)據(jù),運(yùn)用MARS 算法對(duì)輸入、輸出參數(shù)進(jìn)行相關(guān)性擬合,得到各輸入?yún)?shù)的相對(duì)重要性。2 個(gè)評(píng)估實(shí)例中測(cè)試集的R2c分別為0.921、0.986。上述研究表明CART 算法和MARS 算法可以彌補(bǔ)PLS 算法的缺陷和不足。廣義路徑追蹤算法(generalized pathseeker,GPS)算法的應(yīng)用未見報(bào)道,但它也具備自動(dòng)篩選變量的優(yōu)點(diǎn),模型性能情況有待進(jìn)一步研究。上述3 種可自動(dòng)篩選變量的算法都屬于目前機(jī)器學(xué)習(xí)算法,在膠囊內(nèi)容物吸濕性方面的應(yīng)用未見報(bào)道,本實(shí)驗(yàn)基于現(xiàn)有數(shù)據(jù)運(yùn)用不同算法建模,優(yōu)選出最佳算法后嵌入在線控制系統(tǒng)中進(jìn)行后續(xù)生產(chǎn)驗(yàn)證,以此來提升GFC 生產(chǎn)過程中質(zhì)量控制智能化水平。
BT-1001 智能粉體特性測(cè)試儀,丹東百特儀器有限公司;Bettersize 2600 激光粒度分布儀,丹東百特儀器有限公司;LHS-250HC-II 恒溫恒濕箱,上海一恒科學(xué)儀器有限公司。
本研究所使用的數(shù)據(jù)來自于前期研究獲得的80 批GFC 生產(chǎn)過程中的5 種中間體(原料細(xì)粉、濕顆粒、干燥顆粒、整粒顆粒、總混顆粒)和GFC成品的物性參數(shù),收集的樣品為2018年6月份至2018年11月份生產(chǎn)的中間體樣品,樣品的批次為180610~181121 共480 個(gè)樣品,均由江蘇康緣藥業(yè)股份有限公司提供[1]。
本研究按照實(shí)際生產(chǎn)時(shí)間順序?qū)颖疽?∶1比例劃分校正集和驗(yàn)證集,前60 批次為校正集,后20 批次為驗(yàn)證集,校正集的范圍覆蓋了預(yù)測(cè)集的 整個(gè)范圍,且校正集分布較廣,適宜建立定量校正模型。
2.2.1 粒徑 使用激光粒度分布儀測(cè)定顆粒粒度分布,計(jì)算D10(累計(jì)粒度分布數(shù)達(dá)到10%時(shí)所對(duì)應(yīng)的粒徑)、中值粒徑(D50,累計(jì)粒度分布數(shù)達(dá)到50%時(shí)所對(duì)應(yīng)的粒徑)和D90(累計(jì)粒度分布數(shù)達(dá)到90%時(shí)所對(duì)應(yīng)的粒徑),以及粒徑分布寬度(span)。
2.2.2 粒徑<50 μm 百分比(%Pf)和相對(duì)均齊度指數(shù)(Iθ) 以空氣為分散媒介,使用激光粒度分布儀測(cè)定顆粒粒度分布,計(jì)算每個(gè)粒徑范圍內(nèi)顆粒所占的比例,平行3 次試驗(yàn)。所選取的粒徑分別為355、212、100、50 μm。
Fm為顆粒粒徑在多數(shù)范圍(100~212 μm)的質(zhì)量百分比,F(xiàn)m-1為多數(shù)粒徑范圍下一層篩子(50~100 μm)截留顆粒的質(zhì)量百分比,F(xiàn)m+1為多數(shù)粒徑范圍上一層篩子(212~355 μm)截留顆粒的質(zhì)量百分比,dm為多數(shù)粒徑范圍的顆粒平均粒徑,dm-1為多數(shù)粒徑范圍下一層篩子截留顆粒平均粒徑,dm+1為多數(shù)粒徑范圍上一層篩子截留顆粒平均粒徑,n為所確定的粒徑范圍個(gè)數(shù)
2.2.3 休止角(α) 采用固定底面積法,使用粉末流動(dòng)性測(cè)定儀對(duì)樣品進(jìn)行測(cè)試,底面圓盤直徑100 mm,噴嘴直徑為10 mm。取待測(cè)中間體顆粒約50.0 g,將儀器校零后,從特殊噴嘴漏斗的上方緩慢加入,使其逐漸堆積在圓盤上,形成錐體,測(cè)定錐體高(h)和底面圓盤半徑(d),平行3 次試驗(yàn)。
2.2.4 松裝密度(Da) 將約50.0 g(質(zhì)量記為m)待測(cè)顆粒緩慢地加入到100 mL 量筒中,輕輕抹平表面,讀取待測(cè)顆粒的體積(Va),平行3 次試驗(yàn)。
2.2.5 振實(shí)密度(Dc) 將上述盛有待測(cè)顆粒的量筒固定在振實(shí)密度儀上,設(shè)定頻率70 Hz,振動(dòng)1250次后讀取待測(cè)顆粒的體積(Vc),平行3 次試驗(yàn)。
2.2.6 豪斯納比(Hausner ratio,HR) 由松裝密度和振實(shí)密度計(jì)算而得。
2.2.7 卡爾指數(shù)(Carr index,CI) 由松裝密度和振實(shí)密度計(jì)算而得。
2.2.8 顆粒間孔隙率(Ie) 由松裝密度和振實(shí)密度計(jì)算而得。
2.2.9 吸濕性(H) 取干燥的具塞稱量瓶置于恒溫恒濕箱(設(shè)置溫度為25 ℃,相對(duì)濕度為75%)中,12 h 后精密稱定質(zhì)量(m1)。取待測(cè)顆粒適量,置上述稱量瓶中并平鋪于稱量瓶?jī)?nèi),厚度約為1 mm,精密稱定質(zhì)量(m2)。將稱量瓶敞口,并與瓶蓋同置于上述恒溫恒濕條件下。24 h 后蓋好稱量瓶蓋,精密稱定質(zhì)量(m3),平行3 次試驗(yàn)。
本實(shí)驗(yàn)建模所用的輸入?yún)?shù)X為軟材細(xì)粉(RC)、干顆粒(GZ)、整粒顆粒(ZL)、總混顆粒(ZH)的D10、D50、D90、Da、Dc、span、%Pf、Iθ、HR、α、Ie、CI 以及濕顆粒(SKL)的Da、Dc、HR、α、Ie、CI 共54 個(gè)參數(shù),輸出參數(shù)Y為膠囊內(nèi)容物H值。
采用SIMCA-P 軟件(version 12.0,瑞典MKS Umetrics 公司)建立PLS 模型,采用SPASS25.0 進(jìn)行自變量共線性評(píng)價(jià),采用SPM8.3 軟件(美國(guó)Salford Systems 公司)中不同機(jī)器學(xué)習(xí)算法建立吸濕性預(yù)測(cè)模型。
2.4.1 PLS 算法 PLS 是經(jīng)多次迭代映射分解,組合成1 個(gè)Y與X的線性回歸(Y=bX+f),將每次迭代過程中的映射變換參數(shù)進(jìn)行線性運(yùn)算可以得到最終模型的參數(shù)b和f。PLS 采用成分分解的思路來進(jìn)行特征降維;PLS 關(guān)注各個(gè)變量對(duì)目標(biāo)變量的解釋,會(huì)保留共線性的變量;PLS 先擬合大致輪廓,再逐步擬合細(xì)節(jié),考慮當(dāng)前的最優(yōu)擬合決策進(jìn)行局部最優(yōu)化。
2.4.2 CART CART 具有高速、精確和容易使用 的特點(diǎn),并自動(dòng)對(duì)數(shù)據(jù)提供深入的探索研究,產(chǎn)生高度可理解的預(yù)測(cè)模型;僅使用排序信息因而不需要進(jìn)行變量變形,不會(huì)受到孤立點(diǎn)的影響,同時(shí)使用替代分裂變量智能的處理缺失值。CART 是非參數(shù)的,沒有預(yù)設(shè)的函數(shù)形式,它通過局域性的總結(jié)來逼近數(shù)據(jù)模式,動(dòng)態(tài)地決定使用哪個(gè)變量,動(dòng)態(tài)地決定關(guān)注哪個(gè)區(qū)域,所有的一切都由數(shù)據(jù)自動(dòng)決定[5-10]。
2.4.3 MARS MARS 是一種非線性和多維關(guān)系建模的算法,可以高度自動(dòng)化的回歸分析,可以看成是逐步線性回歸的推廣,也可以看成是為了提高CART 在回歸中的效果而進(jìn)行的改進(jìn)。
MARS 算法分為前向選擇、后向剪枝、模型選擇3 個(gè)步驟,通過自適應(yīng)的選取節(jié)點(diǎn)對(duì)數(shù)據(jù)進(jìn)行分割,每選取1 個(gè)節(jié)點(diǎn)就生成2 個(gè)新的基函數(shù),前向過程結(jié)束后生成1 個(gè)過擬合的模型,后向剪枝過程是刪除導(dǎo)致模型過度擬合的基函數(shù),便于選擇最佳模型,這一過程遵循廣義交叉驗(yàn)證(generalized cross-validation,GCV)原則,GCV 值最小的模型為最終的MARS 模型[11-13]。GCV 是根據(jù)誤差模型和正則化解構(gòu)造1 個(gè)廣義交叉G 函數(shù),GCV 的計(jì)算方法如下式所示。
N為樣本數(shù)據(jù)總數(shù),H為基函數(shù)的個(gè)數(shù),d為懲罰系數(shù)
MARS 的主要優(yōu)點(diǎn)是可以進(jìn)行變量選擇,將相關(guān)變量與不相關(guān)的預(yù)測(cè)變量分開;能夠估計(jì)基函數(shù)的貢獻(xiàn),允許預(yù)測(cè)變量的加性和交互影響來確定相應(yīng)變量;使用新的嵌套變量技術(shù)處理缺失值;進(jìn)行廣泛的自我測(cè)試,以防止過度擬合[14-17]。
2.4.4 GPS GPS 提供了完整的正則化策略,利用更為廣譜的彈性系數(shù)建立更多候選模型,開始時(shí)模型里沒有任何預(yù)測(cè)變量,在每一步中添加1 個(gè)新的變量或者更新現(xiàn)有變量的1 個(gè)系數(shù),通過建立若干步數(shù)不同的路徑模型,并自動(dòng)選擇出其中最優(yōu)的線性模型。GPS 從速度和覆蓋率2 個(gè)方面對(duì)正則化回歸進(jìn)行了顯著提升。模型效果會(huì)比傳統(tǒng)回歸更好、更穩(wěn)定,同時(shí)提供了強(qiáng)大的變量篩選能力,更好應(yīng)對(duì)大數(shù)據(jù)高緯度降維的挑戰(zhàn)。
以上機(jī)器學(xué)習(xí)算法都可以對(duì)變量重要性列表進(jìn)行建模精煉,篩選重要變量。
2.5.1 PLS 模型評(píng)價(jià) 使用R2c、R2p、Q2評(píng)價(jià)擬合效果,這些指標(biāo)越接近1,表示PLS 模型擬合數(shù)據(jù)效果越好,校正或預(yù)測(cè)能力越好;用決定系數(shù)(R2)、交叉驗(yàn)證均方根誤差(root mean square errors of cross validation,RMSECV)、預(yù)測(cè)均方根誤差(root mean square errors of prediction,RMSEP)評(píng)價(jià)模型的性能,R2越大,RMSECV 和RMSEP 越小,模型的性能越好。
2.5.2 機(jī)器學(xué)習(xí)算法模型評(píng)價(jià) 以R2、均方根誤差(root mean square error,RMSE)、平均絕對(duì)百分比誤差(mean absolute percent arror,MAPE)等指標(biāo)來評(píng)價(jià)模型的性能,R2越接近1,MAPE 越接近0,表明模型的性能越好;RMSE 越接近0,表明模型的預(yù)測(cè)性能越強(qiáng)[18-19]。n為校正集或驗(yàn)證集的樣本數(shù),t∈[1,n],y為參考值,yi為預(yù)測(cè)值,y為所有樣品參考值的平均值
2.5.3 模型精度評(píng)價(jià) PLS 和機(jī)器學(xué)習(xí)算法都是根據(jù)驗(yàn)證集中的相對(duì)預(yù)測(cè)誤差來評(píng)價(jià)模型預(yù)測(cè)精度的影響。
3.1.1 PLS 建模結(jié)果 以膠囊內(nèi)容物吸濕性(Y)為因變量,54 個(gè)物性參數(shù)為自變量(X),建立的PLS 預(yù)測(cè)模型的Q2為0.399,R2c和R2p分別為0.216、0.656。變量個(gè)數(shù)為8 時(shí),Q2達(dá)到最大值0.549,R2X和R2Y為0.616、0.602。篩選出的物性參數(shù)包括RC-D10、RC-D50、RC-span、RC-α、RC-%Pf、ZH-Dc、SKL-Da、SKL-Dc。繪制的變量投影重要性(variable importance in the projection,VIP)圖如圖1 所示,自變量回歸系數(shù)如圖2 所示。使用方差膨脹因子(variance inflation factor,VIF)評(píng)價(jià)以上8 個(gè)物性參數(shù)的共線性程度,RC-%Pf、RC-α、RC-D10、RC-D50、RC-span、ZH-Dc、SKL-Da、SKL-Dc物性參數(shù)共線性檢驗(yàn)結(jié)果的VIF 值分別為25.839、1.303、7.181、21.223、2.461、1.259、7.054、7.109。由圖1、2 和VIF 值考察結(jié)果可知,VIP>1、回歸系數(shù)>0.2、VIF<10 的變量有RC-α、RC-D10、Rc-span、SKL-Dc、ZH-Dc,可作為潛在關(guān)鍵物料屬性。以5 個(gè)變量建立的模型性能指標(biāo)Q2為0.531,R2c和R2p分別為0.616、0.615。
圖1 模型的VIP 分布Fig.1 VIP indexes for independent variables of PLS model
圖2 模型自變量回歸系數(shù)Fig.2 Regression coefficients of PLS model
用20 批樣品測(cè)試所建模型的穩(wěn)健性,驗(yàn)證集真實(shí)值與預(yù)測(cè)值相關(guān)性如圖3 所示,校正集R2c為0.602 5,交叉驗(yàn)證均方根誤差RMSECV 為0.630 9,預(yù)測(cè)集R2p為0.348 7,預(yù)測(cè)均方根誤差RMSEP 為0.408,驗(yàn)證集的相對(duì)預(yù)測(cè)誤差為3.69%。
圖3 PLS 模型擬合效果Fig.3 Comparison between target and predicted hygroscopicity
3.1.2 CART 算法建模結(jié)果 節(jié)點(diǎn)和樹的深度對(duì)算法的影響較大,開始建模前通過AUTOMATE 自動(dòng)建模選項(xiàng)篩選最優(yōu)max nodes 參數(shù)為8,樹的深度為30 時(shí),性能最佳。根據(jù)變量重要性表來逐步篩選關(guān)鍵變量并結(jié)合驗(yàn)證集預(yù)測(cè)誤差來確定最優(yōu)模型。由54 個(gè)物性參數(shù)建模,隨機(jī)選擇20%的樣本作為驗(yàn)證集,所得變量重要性如圖4 所示,不同變量個(gè)數(shù)建立的CART 模型性能和預(yù)測(cè)性能比較如表2 所示,用20 批樣品對(duì)模型進(jìn)行外部驗(yàn)證的結(jié)果如表1所示。由表1 可知當(dāng)變量數(shù)為14 時(shí),CART 模型的 性能不是最好但預(yù)測(cè)效果較好,變量數(shù)目減少,預(yù)測(cè)相對(duì)誤差增大,可能損失了一些重要的信息。
圖4 變量重要性Fig.4 Importance of input variables
表1 不同變量個(gè)數(shù)建立的CART 模型的性能和預(yù)測(cè)性能比較Table 1 Comparison of CART model performance and prediction performance established with different numbers of variables
3.1.3 MARS 算法建模結(jié)果 基函數(shù)的個(gè)數(shù)影響著預(yù)測(cè)模型的選擇,可由GCV 性能曲線得到最優(yōu)基函數(shù),因此得到最佳模型尺寸[20-21]。由圖5可知GCV值隨基函數(shù)的變化規(guī)律,GCV 值最小時(shí)對(duì)應(yīng)的基函數(shù)個(gè)數(shù)為7,由表2 可知基函數(shù)個(gè)數(shù)對(duì)GCV 函數(shù)值和校正集驗(yàn)證集決定系數(shù)R2和均方誤差(mean square errors,MSE)的影響,擬合效果不隨基函數(shù)增長(zhǎng)而優(yōu)化,應(yīng)不斷調(diào)試預(yù)設(shè)基函數(shù)的數(shù)目,以此選擇最優(yōu)基函數(shù),建立最佳模型[11]。
圖5 不同GCV 值對(duì)應(yīng)基函數(shù)個(gè)數(shù)Table 5 Different GCV values correspond to number of basis functions
MARS 算法中隨機(jī)選擇20%的樣本做為驗(yàn)證集,由54 個(gè)物性參數(shù)建立的MARS 模型得到8 個(gè)重要變量:SKL-Dc、ZH-Da、RC-α、GZ-Da、GZ-D90、SKL-Da、GZ-D10、GZ-α,校正集的R2c為0.843,RMSE 為0.391,MAPE 為0.025,預(yù)測(cè)集的R2p為0.808,RMSE 為0.031,MAPE 為0.031。
另取20 批樣品對(duì)MARS 模型進(jìn)行外部驗(yàn)證,參考值與預(yù)測(cè)值如表3 所示,吸濕性平均相對(duì)預(yù)測(cè)誤差為2.69%,預(yù)測(cè)結(jié)果相對(duì)準(zhǔn)確。
3.1.4 GPS 算法建模結(jié)果 MSE 表示測(cè)試集模型的性能,由來自于復(fù)雜的內(nèi)部搜索結(jié)果的彈性系數(shù)決定。圖6 顯示了最佳模型是一種最小化測(cè)試樣品的MSE 的模型,藍(lán)色線是校正集,紅色線是驗(yàn)證集,對(duì)應(yīng)的模型系數(shù)為26。不同變量個(gè)數(shù)建立的GPS 模型性能和預(yù)測(cè)性能比較如表4 所示,用20批樣品對(duì)模型進(jìn)行外部驗(yàn)證的結(jié)果如表4 所示。
由表4可知用54個(gè)物性參數(shù)建立的模型過擬合程度較大,當(dāng)逐步剔除變量重要性小的變量重新建模時(shí),所選變量數(shù)為3 時(shí),模型的穩(wěn)定性和預(yù)測(cè)精度最好,這3 個(gè)變量為SKL-Dc、RC-α、ZH-Dc。
表2 GCV 函數(shù)值和評(píng)價(jià)指標(biāo)隨基函數(shù)數(shù)目變化情況Table 2 GCV function value and variations of measuring indexes with basis function number
表3 外部驗(yàn)證樣本參考值和預(yù)測(cè)值結(jié)果Table 3 Experimental values and predicted values for external validation samples
圖6 MSE 隨彈性系數(shù)變化規(guī)律Table 6 MSE changes with elasticity coefficient
綜合對(duì)比分析以上不同算法建立的最優(yōu)模型結(jié)果如表5 所示,可以發(fā)現(xiàn)MARS 算法建立的預(yù)測(cè)模型在校正集和驗(yàn)證集上獲得了較大的決定系數(shù)和較小的各項(xiàng)誤差,模型的穩(wěn)定性和預(yù)測(cè)精度更好。校正集和預(yù)測(cè)集的決定系數(shù)分別為0.843、0.808,RMSE 分別為0.391、0.472,MAPE 分別為0.025、0.031,驗(yàn)證樣本的平均預(yù)測(cè)誤差為2.69%。
表4 不同變量個(gè)數(shù)建立的GPS 模型性能和預(yù)測(cè)性能比較Table 4 Comparison of GPS model performance and prediction performance established with different numbers of variables
表5 不同算法模型性能和預(yù)測(cè)精度比較Table 5 Comparison of performance and prediction accuracy of different algorithm models
本研究運(yùn)用不同算法對(duì)GFC 內(nèi)容物吸濕性進(jìn)行建模,結(jié)果表明MARS 算法建立的模型最好,模型平均相對(duì)預(yù)測(cè)誤差為2.69%。綜合分析可知,MARS算法優(yōu)化了PLS算法需手動(dòng)篩選關(guān)鍵變量的缺點(diǎn),提高了模型運(yùn)用的效率;標(biāo)識(shí)了PLS 算法和CART 算法未顯示的變量累加貢獻(xiàn)值或變量之間的相互作用結(jié)果[14,22-23];彌補(bǔ)了GPS 算法不可處理非線性問題的缺陷。
本研究選用的4 種算法都以特殊的方式來計(jì)算變量重要性,PLS 算法根據(jù)殘差平方和的最小化選擇變量[24],CART 算法根據(jù)信息增益選擇特征變量,GPS 算法利用正則化策略和彈性系數(shù)來選擇變量,MARS 算法利用廣義交叉原則和基函數(shù)來篩選變量。4 種算法篩選出的相同變量有SKL-Dc、RC-α,表明GFC 內(nèi)容物吸濕性與軟材細(xì)粉的休止角和濕顆粒的振實(shí)密度有關(guān),與前期研究結(jié)果相同。休止角的大小是粉體粒子大小和粒徑分布、粉體表面性質(zhì)以及粒子間相互作用力的綜合體現(xiàn),休止角越大,吸濕性越強(qiáng)[1]。軟材細(xì)粉的休止角與制軟材時(shí)浸膏的干燥粉碎方式、干燥工藝參數(shù)和浸膏的混合比例等有關(guān),需收集更多的樣本來進(jìn)行實(shí)驗(yàn)研究確定影響吸濕性的顯著因素。濕顆粒振實(shí)密度與顆粒的粒徑分布、骨架密度和孔隙結(jié)構(gòu)有關(guān),因而影響顆粒吸濕性。前期研究結(jié)果顯示濕法制粒過程中物料與黏合劑作用導(dǎo)致粉體表面黏性變化,濕顆粒振實(shí)密度與黏合劑加入量和濃度有關(guān),提示生產(chǎn)過程中需及時(shí)調(diào)整黏合劑用量和濃度來保證顆粒的吸濕性處于一定的均勻范圍內(nèi)。濕顆粒振實(shí)密度還有可能與制粒過程中所加輔料的性質(zhì)有關(guān),尚需通過實(shí)驗(yàn)進(jìn)一步驗(yàn)證[25-27]。
本研究所選數(shù)據(jù)量遠(yuǎn)少于生產(chǎn)過程產(chǎn)生的大批量數(shù)據(jù),在后續(xù)研究中還需要繼續(xù)收集更多的數(shù)據(jù)來進(jìn)一步驗(yàn)證、更新、維護(hù)和優(yōu)化模型,提高模型預(yù)測(cè)精確度,以此提升GFC 生產(chǎn)過程質(zhì)量控制智能化水平。
利益沖突所有作者均聲明不存在利益沖突