摘要:隨著環(huán)境問(wèn)題的日益嚴(yán)峻,為了提高實(shí)驗(yàn)效率、節(jié)約成本,推動(dòng)可持續(xù)發(fā)展戰(zhàn)略在染料與紡織品領(lǐng)域的應(yīng)用,文章首先對(duì)天然染料染色的數(shù)據(jù)進(jìn)行了收集與預(yù)處理,然后采用Xgboost集成學(xué)習(xí)算法構(gòu)建AI模型并進(jìn)行了模型訓(xùn)練與驗(yàn)證,評(píng)估了模型的有效性和預(yù)測(cè)精度。該模型實(shí)現(xiàn)了天然染料在絲綢上染色工藝與效果的高效模擬與預(yù)測(cè),從而顯著縮短了實(shí)驗(yàn)時(shí)間并降低了資源損耗。這一方法提高了研究效率和經(jīng)濟(jì)效益。研究表明,該模型在預(yù)測(cè)反應(yīng)最佳酸堿度(pH值)、水洗色牢度(CFW)和摩擦色牢度(CFR)方面具有較高的準(zhǔn)確率,在驗(yàn)證集中三者的預(yù)測(cè)準(zhǔn)確率高達(dá)94.12%、93.75%、100%,在真實(shí)的測(cè)試集上分別擁有87.50%、94.12%、82.35%的準(zhǔn)確率,同時(shí)具備有效性與可遷移性。集成學(xué)習(xí)的方法通過(guò)極小的部署成本和極短的耗時(shí)為天然染料染色性能的探索給出了極具價(jià)值的指導(dǎo),也為AI機(jī)器學(xué)習(xí)與紡織染色的學(xué)科的交叉應(yīng)用拓展了可能性。
關(guān)鍵詞:AI預(yù)測(cè);Xgboost;天然染料;絲綢;色牢度
中圖分類(lèi)號(hào):TS141.8
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):10017003(2025)01004009
DOI:10.3969 j.issn.1001-7003.2025.01.005
基金項(xiàng)目:廣西教育科學(xué)“十四五”規(guī)劃專(zhuān)項(xiàng)項(xiàng)目(2023ZJY1805)
作者簡(jiǎn)介:劉瑩(1990),女,副教授,博士,主要從事可持續(xù)時(shí)尚設(shè)計(jì)、視覺(jué)傳達(dá)設(shè)計(jì)的研究。
絲綢作為一種擁有數(shù)千年歷史的紡織品,已成為國(guó)際公認(rèn)的中國(guó)特有的文化符號(hào)之一[1]。絲綢以其良好的吸濕性、柔軟的手感、華麗的外觀及優(yōu)雅的光澤等性能,深受消費(fèi)者青睞[2],在服裝、家居裝飾等領(lǐng)域具有廣泛的應(yīng)用。隨著環(huán)保和健康理念的不斷深入人心,越來(lái)越多的消費(fèi)者傾向于以“環(huán)境友好”的方式進(jìn)行綠色消費(fèi)[3]。天然植物染料因其無(wú)毒、無(wú)害、與環(huán)境友好、生物降解性良好等特性[4],開(kāi)始受到行業(yè)內(nèi)外的廣泛關(guān)注。然而,天然植物染料的染色性能和功能化效果受多種因素影響,導(dǎo)致其在應(yīng)用中面臨諸多挑戰(zhàn)。
近年來(lái)隨著深度學(xué)習(xí)等技術(shù)的突破,人工智能(AI)在數(shù)學(xué)、物理學(xué)、化學(xué)、生物學(xué)、材料學(xué)、制藥等自然科學(xué)和高技術(shù)領(lǐng)域的研究中得到了廣泛應(yīng)用[5]。而紡織品染色領(lǐng)域還未涉及,由于機(jī)器學(xué)習(xí)在復(fù)雜問(wèn)題建模和高維數(shù)據(jù)挖掘方面具有顯著優(yōu)勢(shì)[6],因此,本研究利用Xgboost算法構(gòu)建AI模型,模擬天然染料對(duì)絲綢紡織品的功能化過(guò)程,旨在優(yōu)化染色工藝、縮短新品開(kāi)發(fā)周期,以填補(bǔ)研究空白,并推動(dòng)行業(yè)的綠色、可持續(xù)發(fā)展。通過(guò)引入AI技術(shù),可以模擬預(yù)測(cè)出精準(zhǔn)的數(shù)值、促進(jìn)高效的生產(chǎn),降低資源浪費(fèi)和環(huán)境污染,為染料與紡織品行業(yè)的可持續(xù)發(fā)展注入新的活力。同時(shí),這也將為消費(fèi)者帶來(lái)更多高品質(zhì)、環(huán)保健康的絲綢產(chǎn)品,滿足人們對(duì)美好生活的追求。通過(guò)本研究,以期為絲綢等紡織品行業(yè)帶來(lái)一個(gè)更加綠色、環(huán)保、可持續(xù)的未來(lái)。
1 研究方法
1.1 數(shù)據(jù)來(lái)源與預(yù)處理
本研究使用的天然染料最佳反應(yīng)條件(在無(wú)媒染劑條件下K S值最高)和染色性能(水洗色牢度與摩擦色牢度)數(shù)據(jù)均來(lái)源于已發(fā)表的文獻(xiàn)和實(shí)驗(yàn)報(bào)告。同時(shí),采用手工提取與自動(dòng)化腳本相結(jié)合的方式,對(duì)數(shù)據(jù)進(jìn)行了高效的提取,并對(duì)提取后的數(shù)據(jù)集進(jìn)行了2次以上的校對(duì)。在收集的超過(guò)350篇文獻(xiàn)中,具有具體和完整數(shù)據(jù)的文獻(xiàn)達(dá)到146篇,包括最新的天然染料實(shí)驗(yàn)數(shù)據(jù)及中文期刊中最具有影響力的研究。其中最完整的應(yīng)當(dāng)是59篇對(duì)絲綢織物染色的實(shí)驗(yàn)數(shù)據(jù),詳細(xì)記錄了不同反應(yīng)溫度、環(huán)境酸堿度、M∶L比值與反應(yīng)時(shí)長(zhǎng)下各天然染料的染色結(jié)果,這部分?jǐn)?shù)據(jù)也成為本研究構(gòu)建集成學(xué)習(xí)模型所使用的數(shù)據(jù)。
由于不可能每篇文獻(xiàn)都對(duì)某一天然染料的化學(xué)組分、反應(yīng)環(huán)境酸堿度、反應(yīng)溫度、反應(yīng)時(shí)間及色素浸提比進(jìn)行研究,同時(shí)也有部分文獻(xiàn)缺少最終色牢度與抗紫外能力的具體數(shù)據(jù),因此在數(shù)據(jù)分析之前,首先需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要包括:
1)數(shù)據(jù)清洗:刪除重復(fù)、錯(cuò)誤或不完整的數(shù)據(jù)條目,確保數(shù)據(jù)的準(zhǔn)確性和一致性。
2)數(shù)據(jù)標(biāo)準(zhǔn)化:對(duì)數(shù)值型數(shù)據(jù)(尤其是pH值和色素浸提比)進(jìn)行標(biāo)準(zhǔn)化處理,消除不同文獻(xiàn)的數(shù)據(jù)之間的量綱和格式差異,以求達(dá)到標(biāo)準(zhǔn)統(tǒng)一。
3)數(shù)據(jù)預(yù)處理通常根據(jù)數(shù)據(jù)的分布和特征,對(duì)缺失數(shù)據(jù)采用插值、回歸等方法進(jìn)行合理填充。本研究沒(méi)有這么做,是因?yàn)樘烊蝗玖螷 S值最高時(shí)的反應(yīng)條件和染色結(jié)果數(shù)據(jù)具有顯著的不規(guī)律性和不確定性,無(wú)法通過(guò)算法進(jìn)行插值。同時(shí),在實(shí)驗(yàn)過(guò)程中發(fā)現(xiàn)每一個(gè)數(shù)值都對(duì)算法的擬合結(jié)果具有顯著的影響。因此,本研究擇直接剔除實(shí)驗(yàn)結(jié)果有缺失或者不精確的樣本,只輸入最原始最準(zhǔn)確的數(shù)據(jù)。
1.2 數(shù)據(jù)分析與算法構(gòu)建
1.2.1 數(shù)據(jù)分析
根據(jù)大量的文獻(xiàn)數(shù)據(jù),在相似的反應(yīng)條件下不同的物質(zhì)也可能表現(xiàn)出差異較大的染色結(jié)果,最終起到?jīng)Q定性作用的仍是染料種類(lèi)與組分本身。因此,本研究認(rèn)為應(yīng)該根據(jù)不同的天然染料類(lèi)型與組分進(jìn)行數(shù)據(jù)劃分,讓集成學(xué)習(xí)算法能夠針對(duì)不同的染料組分推測(cè)出合理的結(jié)果。
本研究保留了“天然染料種類(lèi)”作為最重要的輸入自變量。但通過(guò)數(shù)學(xué)邏輯可知,一個(gè)不具備先驗(yàn)知識(shí)的算法模型,僅憑輸入染料的名稱(chēng),是無(wú)法全面理解染料與絲綢之間復(fù)雜相互作用的。雖然算法并不知道茶葉與樹(shù)葉染色的差異,但是可以將染料名稱(chēng)映射成化學(xué)組分,這樣茶葉和樹(shù)葉的差異就被映射成了多酚與葉綠素的差異,自變量與因變量之間的關(guān)系就具有了底層的數(shù)學(xué)邏輯性。
根據(jù)前述邏輯,本研究創(chuàng)新性地進(jìn)行了“文本數(shù)據(jù)”的組分映射,將類(lèi)似“紅茶色素”“茶多酚”“茶水”等文本映射為由組分百分比構(gòu)成的一維數(shù)組,如[0,0,0,5,0,95]代表該化學(xué)物質(zhì)大概由0%的葉綠素、0%的葉黃素等類(lèi)胡蘿卜素、0%的花青素或花色苷、5%的黃酮類(lèi)物質(zhì)、0%的單寧及95%的原花青素等其他多酚類(lèi)物質(zhì)構(gòu)成。這個(gè)成分劃分標(biāo)注是在參考了Shen等[7]發(fā)表的綜述文章與Bhandari的酚類(lèi)化合物特別是類(lèi)黃酮和單寧的主要職責(zé)是賦予織物顏色的觀點(diǎn)[8]的基礎(chǔ)上,由本研究首次提出的。
本研究根據(jù)對(duì)收集的59條實(shí)驗(yàn)數(shù)據(jù)(完整的對(duì)絲綢染色的數(shù)據(jù))進(jìn)行歸類(lèi)與分析后(圖1),再參考上述文獻(xiàn),將常見(jiàn)天然染料著色成分劃分為葉綠素、葉黃素及其他類(lèi)胡蘿卜素、花青素、單寧、其他黃酮類(lèi),以及其他多酚類(lèi)六類(lèi),能基本囊括國(guó)內(nèi)外文獻(xiàn)中常見(jiàn)天然染料著色的有效成分。
部分化學(xué)成分?jǐn)?shù)據(jù)如表1所示。
1.2.2 數(shù)據(jù)集構(gòu)建
本研究篩選后的天然染料組分比例、反應(yīng)條件及色牢度等數(shù)據(jù)整合為數(shù)據(jù)集,并以ND-Dataset(Natural Dyes Dataset)的名稱(chēng)公開(kāi)發(fā)布,供各類(lèi)機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練和測(cè)試。
數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集與測(cè)試集3個(gè)部分。將從文獻(xiàn)獲取到的146條實(shí)驗(yàn)數(shù)據(jù)中59條有效的(統(tǒng)一在絲綢上染色,且數(shù)據(jù)完整可靠)數(shù)據(jù)按照6∶2∶2的比例劃分為35條訓(xùn)練集數(shù)據(jù)、12條驗(yàn)證集數(shù)據(jù)與12條測(cè)試集數(shù)據(jù),分別用于模型訓(xùn)練學(xué)習(xí)階段的輸入、模型調(diào)整過(guò)程中的驗(yàn)證及訓(xùn)練完畢后的測(cè)試。這是由于使用模型沒(méi)有學(xué)習(xí)過(guò)的數(shù)據(jù)作為測(cè)試集,可以模擬訓(xùn)練完成的模型在真實(shí)數(shù)據(jù)中的預(yù)測(cè)效果,防止模型對(duì)訓(xùn)練集產(chǎn)生過(guò)擬合,保證了模型的泛化能力與可遷移性。
由于數(shù)據(jù)量較少的情況下,在實(shí)驗(yàn)中本研究采用了K-折交叉驗(yàn)證的技術(shù)。這種方法將數(shù)據(jù)集分成K個(gè)子集,每次留出一個(gè)子集作為驗(yàn)證集,其余(K-1)個(gè)子集組合成訓(xùn)練集。這個(gè)過(guò)程重復(fù)K次,每個(gè)子集都有機(jī)會(huì)作為驗(yàn)證集,以此更穩(wěn)定和可靠地估計(jì)模型性能。本研究實(shí)際實(shí)驗(yàn)過(guò)程中K=4,對(duì)47條數(shù)據(jù)(訓(xùn)練集和驗(yàn)證集)選用了4折交叉驗(yàn)證的方法。
1.2.3 算法選擇
在與XGBoost、CNN、KNN、貝葉斯、隨機(jī)森林等算法的比較中,本研究最終選擇了XGBoost的集成學(xué)習(xí)算法。在機(jī)器學(xué)習(xí)中的各類(lèi)有監(jiān)督學(xué)習(xí)算法中,集成學(xué)習(xí)在各個(gè)規(guī)模的數(shù)據(jù)集上都有很好的策略。這是因?yàn)榧蓪W(xué)習(xí)組合了多個(gè)弱監(jiān)督模型以期得到一個(gè)更好更全面的強(qiáng)監(jiān)督模型,潛在的思想是即便某一個(gè)弱分類(lèi)器得到了錯(cuò)誤的預(yù)測(cè),其他的弱分類(lèi)器也可以將錯(cuò)誤糾正回來(lái)。對(duì)于結(jié)構(gòu)化的、序列化的數(shù)據(jù),XGBoost則是集成學(xué)習(xí)的算法當(dāng)中擁有最出色的擬合能力和規(guī)律總結(jié)能力的算法之一,在各大算法競(jìng)賽上頻獲佳績(jī)。同時(shí),針對(duì)輕量級(jí)和快速預(yù)測(cè)的需求,XGBoost也能夠通過(guò)極小的部署成本與極快的推理速度解決。
針對(duì)一個(gè)訓(xùn)練集,XGBoost首先使用決策樹(shù)訓(xùn)練得到一個(gè)模型,這樣針對(duì)每個(gè)樣本都會(huì)產(chǎn)生一個(gè)偏差值。然后將樣本偏差值作為新的訓(xùn)練集,繼續(xù)使用決策樹(shù)訓(xùn)練得到一個(gè)新模型;以此重復(fù),直至達(dá)到某個(gè)退出條件為止。因此與隨機(jī)森林算法不同,隨機(jī)森林算法的核心特點(diǎn)是降低方差,而XGBoost算法的特點(diǎn)是降低偏差(圖2)。
由圖2可見(jiàn),最終的XGBoost模型就是將上述所有模型進(jìn)行加和。 假設(shè)一共有M棵決策樹(shù),即共需迭代M次,每個(gè)決策樹(shù)模型的輸出被定義為fi。那么XGBoost模型的最終輸出 yi為:
yi=∑Mi=1fi(xi)(1)
若當(dāng)前迭代到第m次,則當(dāng)前輸出為:
y(m)i=∑mi=1fi(xi)=y(m-1)i+fm(xm)(2)
式中:y(m-1)i為上一輪迭代的輸出結(jié)果, fm(xm)為當(dāng)前輪次生成的決策樹(shù)模型輸出。
損失函數(shù)方面,本研究為XGBoost算法訓(xùn)練選擇了對(duì)數(shù)損失(Log Loss)函數(shù),即邏輯損失或交叉熵?fù)p失(Cross-Entropy Loss)函數(shù)。
在統(tǒng)計(jì)學(xué)中,期望值是對(duì)隨機(jī)變量可能取值的加權(quán)平均,每個(gè)取值的權(quán)重是它發(fā)生的概率,代表了該隨機(jī)變量的平均預(yù)期結(jié)果。如果每種情況下的編碼長(zhǎng)度與它的概率相乘,就可以得到編碼長(zhǎng)度的數(shù)學(xué)期望。編碼長(zhǎng)度的期望值,在信息論中即信息熵(Entropy)。
在本質(zhì)上,對(duì)數(shù)損失其實(shí)求得也是一種熵,用于求編碼長(zhǎng)度的概率。對(duì)于其中N個(gè)樣本數(shù)量,yi是第i個(gè)樣本的真實(shí)標(biāo)簽(0或1),yi是第i個(gè)樣本的預(yù)測(cè)概率值。來(lái)自于模型的實(shí)際輸出yi,取值介于0~1,它對(duì)應(yīng)的編碼長(zhǎng)度記做log1yi,但評(píng)價(jià)這個(gè)編碼長(zhǎng)度的權(quán)值,卻來(lái)自于真實(shí)概率yi,故稱(chēng)為交叉熵。
yi是真實(shí)標(biāo)簽,取值為0或1,如果將這樣的標(biāo)簽當(dāng)作概率,它們可以理解為0%和100%,其編碼長(zhǎng)度期望(即每個(gè)樣本的交叉熵)如下式描述:
Cross-entropyforthei-thsample=
yilog1yi=-yilog(yi)
(1-yi)log11-yi=-(1-yi)log(1-yi)(3)
因此對(duì)于N個(gè)樣本的交叉熵進(jìn)行加權(quán),得到Log Loss的公式描述如下:
Log Loss=-1N∑Ni=1[yilog(yi)+(1-yi)log(1-yi)](4)
作為一種用于二分類(lèi)或多分類(lèi)問(wèn)題的損失函數(shù),Log Loss不僅考慮了模型的預(yù)測(cè)準(zhǔn)確度,還考慮了預(yù)測(cè)概率。這有助于了解模型的不確定性,同時(shí)可微分的特性適用于梯度下降等訓(xùn)練過(guò)程中的優(yōu)化算法。
1.2.4 模型構(gòu)建
利用Python的Xgboost庫(kù)構(gòu)建三個(gè)獨(dú)立的模型,分別用于預(yù)測(cè)最佳反應(yīng)酸堿度(pH值)、水洗色牢度(CFW)和摩擦色牢度(CFR)。
在模型訓(xùn)練的過(guò)程中,本研究仔細(xì)調(diào)整了Xgboost的各項(xiàng)參數(shù),如學(xué)習(xí)率、樹(shù)深度等,以?xún)?yōu)化模型的性能。訓(xùn)練過(guò)程中,學(xué)習(xí)率為0.03,樹(shù)最大深度為8層,多分類(lèi)數(shù)量為7類(lèi)(pH值0~6+共七類(lèi),色牢度3、3~4、4、4~5、5+共五類(lèi),取兩者最大值)。模型的其他超參數(shù)方面,本研究將”objective”參數(shù)類(lèi)型設(shè)置為”multi:softmax”,以利用Softmax算子將多分類(lèi)的預(yù)測(cè)輸出值轉(zhuǎn)換為范圍在[0, 1]和為1的概率分布。同時(shí)將”n_estimators”參數(shù)設(shè)為500,這為整個(gè)AI模型提供500次的迭代與500棵決策樹(shù)的集成,充分的迭代與決策樹(shù)數(shù)量為模型的擬合能力提供了保障,如圖3所示。
1.3 模型訓(xùn)練與驗(yàn)證
使用訓(xùn)練集對(duì)Xgboost模型進(jìn)行訓(xùn)練。在訓(xùn)練過(guò)程中,通過(guò)迭代優(yōu)化算法不斷更新模型的參數(shù),以提高模型的預(yù)測(cè)精度。同時(shí),通過(guò)交叉驗(yàn)證(如5折交叉驗(yàn)證)來(lái)評(píng)估模型的穩(wěn)定性和泛化能力。
由于文獻(xiàn)中實(shí)驗(yàn)用物料的差異,即使是同一組分的天然染料測(cè)出來(lái)的最佳染色溫度和酸堿度都有偏差,再加上溶液的浸提比和溶劑的不同,最終染色的結(jié)果會(huì)有一定的波動(dòng)。因此,這個(gè)模型理論上因變量(色牢與抗紫外)是由非常多自變量(化學(xué)組分、溫度、pH值、色素、溶劑甚至催化劑等)影響的,每個(gè)自變量又具有波動(dòng),互相之間形成噪聲干擾,在100條數(shù)據(jù)內(nèi)幾乎是毫無(wú)規(guī)律的一片混沌。于是本研究通過(guò)簡(jiǎn)化輸入,減少指定個(gè)數(shù)的自變量,探究各個(gè)自變量與因變量之間的相關(guān)性。最終發(fā)現(xiàn)影響程度最大的是天然染料的化學(xué)組分,這也非常合乎事實(shí)邏輯,所以在訓(xùn)練前對(duì)數(shù)據(jù)進(jìn)行了重新整理和清洗再輸出。最后,重復(fù)進(jìn)行模型訓(xùn)練和驗(yàn)證過(guò)程,直至滿意的模型性能為止。每次迭代會(huì)根據(jù)前一次迭代的驗(yàn)證結(jié)果對(duì)模型進(jìn)行調(diào)整和優(yōu)化,以提高模型的性能。
2 結(jié)果與分析
2.1 數(shù)據(jù)預(yù)處理結(jié)果
本研究在相關(guān)性分析的過(guò)程中選取了Correl函數(shù)對(duì)任一因變量(數(shù)組X)與自變量(數(shù)組Y)進(jìn)行相關(guān)系數(shù)的計(jì)算:
Correl(X,Y)=∑(x-x)(y-y)∑(x-x)2∑(y-y)2(5)
若結(jié)果越接近+1或-1則表示該因素和最終染色結(jié)果直接具有越強(qiáng)烈的正或負(fù)相關(guān),然而在參與分析的15組樣本(國(guó)內(nèi)最新、最全面的15組文獻(xiàn)數(shù)據(jù))中,反應(yīng)溫度與水洗色牢度的相關(guān)系數(shù)低至-0.27,反應(yīng)酸堿度(pH值)與水洗色牢度的相關(guān)系數(shù)更是低至0.006 9,與0接近,幾乎無(wú)相關(guān)性可言。其他因變量的相關(guān)性系數(shù)同樣不容樂(lè)觀,如表2所示。
唯一與色牢度正相關(guān)較強(qiáng)的反應(yīng)時(shí)間也只是順應(yīng)了長(zhǎng)時(shí)間反應(yīng)通常能提供更高色牢度的普遍規(guī)律。因此得出結(jié)論,針對(duì)不同的天然染料物質(zhì),反應(yīng)環(huán)境酸堿度、反應(yīng)溫度、反應(yīng)時(shí)間及色素浸提比并不能對(duì)最終染色的結(jié)果起到?jīng)Q定性的作用,在同一反應(yīng)條件下不同的物質(zhì)往往表現(xiàn)出差異較大的染色結(jié)果。因此,最終本研究認(rèn)為應(yīng)該根據(jù)不同的天然染料類(lèi)
型與組分進(jìn)行數(shù)據(jù)劃分,讓AI模型能夠針對(duì)不同的染料組分推測(cè)合理的結(jié)果。
2.2 模型訓(xùn)練結(jié)果
整個(gè)模型通過(guò)三個(gè)子模型,使用Xgboost的集成決策樹(shù)分別對(duì)天然染料化學(xué)組分與反應(yīng)最佳酸堿度pH值、水洗色牢度(CFW)值與摩擦色牢度(CFR)值之間的關(guān)系進(jìn)行了學(xué)習(xí)和擬合,如圖4所示。
整個(gè)算法的輸入是天然染料的化學(xué)組分,用戶可以通過(guò)輸入染料的名字找到數(shù)據(jù)庫(kù)里的組分,也可以根據(jù)用戶已知的組分?jǐn)?shù)據(jù)手動(dòng)自定義,如圖5所示。
最終三者在測(cè)試集上的準(zhǔn)確率分別為94.12%、93.75%、100%(圖6),模型預(yù)測(cè)混淆矩陣如圖7所示;對(duì)數(shù)損失函數(shù)(Log Loss)分別為0.818 19、0.216 12、0.164 17;可移植(C語(yǔ)言版本)模型文件總體量小至815 kB;總訓(xùn)練時(shí)長(zhǎng)總和低至3.12 s,對(duì)某一染料進(jìn)行預(yù)測(cè)推理時(shí)間低至52 ms。
這說(shuō)明本實(shí)驗(yàn)通過(guò)極小的模型體量與極其迅速的推理速度完成了對(duì)天然染料化學(xué)組分染色效果的精準(zhǔn)預(yù)測(cè),利用極少的時(shí)間和存儲(chǔ)成本為后續(xù)的大規(guī)模染色實(shí)驗(yàn)提供了可靠指導(dǎo)。
經(jīng)過(guò)對(duì)天然染料化學(xué)組分?jǐn)?shù)據(jù)的深入分析和Xgboost算法的精心訓(xùn)練,本研究分別通過(guò)組分推理預(yù)測(cè)出反應(yīng)最佳酸堿度pH值、水洗色牢度(CFW)值與摩擦色牢度(CFR)值,如表3所示。
2.3 預(yù)測(cè)結(jié)果與實(shí)際比較
經(jīng)過(guò)對(duì)天然染料化學(xué)組分?jǐn)?shù)據(jù)的細(xì)致處理和Xgboost算法的精確訓(xùn)練,本研究得到了三個(gè)預(yù)測(cè)模型的結(jié)果。令人鼓舞的是,這些預(yù)測(cè)結(jié)果與實(shí)際觀測(cè)值之間的差異并不顯著,對(duì)于本研究收集的34條文獻(xiàn)數(shù)據(jù),模型對(duì)最優(yōu)酸堿度環(huán)境的預(yù)測(cè)準(zhǔn)確率為87.50%,對(duì)水洗色牢度的預(yù)測(cè)準(zhǔn)確率高達(dá)9412%,對(duì)于摩擦色牢度的預(yù)測(cè)準(zhǔn)確率則達(dá)到82.35%。這表明了針對(duì)天然染料,本研究使用組分比例進(jìn)行映射建模并使用集成學(xué)習(xí)方法進(jìn)行訓(xùn)練取得了顯著的學(xué)習(xí)結(jié)果與擬合吻合度。
更值得一提的是,對(duì)于文獻(xiàn)中并沒(méi)有完成或沒(méi)有給出的實(shí)驗(yàn)結(jié)果(即缺失的數(shù)據(jù)),AI模型給出了合理的推測(cè)。這是訓(xùn)練學(xué)習(xí)完成后的合理預(yù)測(cè),體現(xiàn)了模型的良好的預(yù)測(cè)能力及對(duì)訓(xùn)練集中不包含的數(shù)據(jù)表現(xiàn)出的泛化能力與可遷移性,為未來(lái)面對(duì)更多樣的數(shù)據(jù)能夠給出合理可靠、魯棒穩(wěn)定的結(jié)果提供了保證。
經(jīng)過(guò)對(duì)天然染料化學(xué)組分?jǐn)?shù)據(jù)的深入分析及Xgboost預(yù)測(cè)模型的訓(xùn)練與驗(yàn)證,本研究得到了關(guān)于反應(yīng)最佳酸堿度(pH值)、水洗色牢度(CFW)和摩擦色牢度(CFR)的預(yù)測(cè)結(jié)果。在驗(yàn)證集上分別獲得了高達(dá)94.12%、93.75%、100%的準(zhǔn)確率,在真實(shí)的測(cè)試集中獲得了87.5%、94.12%、82.35%的準(zhǔn)確率,取得了預(yù)測(cè)值與實(shí)驗(yàn)值高度一致的結(jié)果。
3 結(jié) 論
本研究通過(guò)運(yùn)用Xgboost集成學(xué)習(xí)算法,成功構(gòu)建了預(yù)測(cè)天然染料在絲綢上染色效果的模型。模型針對(duì)反應(yīng)最佳酸堿度(pH值)、水洗色牢(CFW)和摩擦色牢(CFR)進(jìn)行了預(yù)測(cè),在驗(yàn)證集上獲得了高達(dá)94.12%、93.75%、100%的準(zhǔn)確率,在真實(shí)的測(cè)試集上分別擁有87.50%、94.12%、82.35%的準(zhǔn)確率,取得了預(yù)測(cè)值與實(shí)驗(yàn)值高度一致的結(jié)果。同時(shí),該模型具有泛化能力強(qiáng)、魯棒性高、輕量級(jí)與推理速度快的特點(diǎn)。最終僅占用815 kB的存儲(chǔ)空間即可在52 ms的極短時(shí)間內(nèi)給出對(duì)某一天然染料染色實(shí)驗(yàn)效果的合理預(yù)測(cè),該模型可無(wú)須任何部署成本在任意設(shè)備上運(yùn)行。這一結(jié)果大大減少了后續(xù)實(shí)驗(yàn)的重復(fù)工作量,為新品類(lèi)天然染料的可持續(xù)探究和嘗試給出了可靠的方向和快速有效的指導(dǎo)。
參考文獻(xiàn):
[1]孫菊劍. 基于顧客價(jià)值的絲綢品牌文化營(yíng)銷(xiāo)研究[D]. 蘇州: 蘇州大學(xué), 2016.
SUN J J. Research on Cultural Marketing of Silk Brand Based on Customer Value[D]. Suzhou: Soochow University, 2016.
[2]張慶華, 王琛, 王梅. 蠶絲纖維及其制品改性的最新研究進(jìn)展[J]. 絲綢, 2012, 49(5): 16-20.
ZHANG Q H, WANG C, WANG M. Progress of the latest research on modifcation of silk fiber and its products[J]. Journal of Silk, 2012, 49(5): 16-20.
[3]于偉. 消費(fèi)者綠色消費(fèi)行為形成機(jī)理分析:基于群體壓力和環(huán)境認(rèn)知的視角[J]. 消費(fèi)經(jīng)濟(jì), 2009, 25(4): 75-77.
YU W. Analysis of the formation mechanism of consumer green consumption behavior: From the perspective of group pressure and environmental cognition [J]. Consumer Economics, 2009, 25(4): 75-77.
[4]張弛, 崔永珠. 國(guó)內(nèi)外天然植物染料的應(yīng)用及發(fā)展現(xiàn)狀[J]. 針織工業(yè), 2009(1): 75-78.
ZHANG C, CUI Y Z. Application and development status of natural plant dyes at home and abroad[J]. Knitting Industries, 2009 (1): 75-78.
[5]陳云霽, 郭崎. AI for Technology: 技術(shù)智能在高技術(shù)領(lǐng)域的應(yīng)用實(shí)踐與未來(lái)展望[J]. 中國(guó)科學(xué)院院刊, 2024, 39(1): 34-40.
CHEN Y J, GUO Q. Al for Technology: Applied practices and future perspectives of technological intelligence in high tech areas[J]. Bulletin of Chinese Academy of Sciences, 2024, 39 (1): 34-40.
[6]李香伶, 陳奉獻(xiàn), 陳希娟. 基于XGBoost模型的土壤中阿特拉津降解預(yù)測(cè)[J]. 應(yīng)用生態(tài)學(xué)報(bào), 2024, 35(3): 789-796.
LI X L, CHEN F X, CHEN X J. Plediction of atrazine degradation in soil based on XGBoost model[J]. Chinese Journal of Applied Ecology, 2024, 35(3): 789-796.
[7]SHEN N, REN J N, LIU Y X, et al. Natural edible pigments: A comprehensive review of resource, chemical classification, biosynthesis pathway, separated methods and application[J]. Food Chemistry, 2023(403): 134422.
[8]BHANDARI N, SHRESTHA S, BHANDARI G, et al. Extraction of dye from castanopsis indica for its use in textile dyeing and medicinal purpose withnatural mordant[J]. Egyptian Journal of Chemistry, 2021, 64(11): 6681-6690.
[9]WANG W W, LE T, YU L T, et al. Effects of key components on the antioxidant activity of black tea[J]. Foods, 2023,12(16): 3134.
[10]WANG J L, YAO J, LIU J M, et al. Chemical constituents from barks of Quercus mongolica[J]. Chinese Traditional and Herbal Drugs, 2014, 45(21): 3062-3066.
[11]JIA Y M, LIU B, CHENG D H, et al. Dyeing characteristics and functionability of tussah silk fabric with oak bark extract[J]. Textile Research Journal, 2017, 87(15): 1806-1817.
[12]SHUKLA D, VANKAR P S. Natural dyeing with black carrot: New source for newer shades on silk[J]. Journal of Natural Fibers, 2013, 10(3): 207-218.
[13]ALI S, NISAR N, HUSSAIN T. Dyeing properties of natural dyes extracted from eucalyptus[J]. The Journal of the Textile Institute, 2007, 98(6): 559-562.
[14]杜春霖, 賈艷梅. 紅茶色素對(duì)絲綢的抗紫外線功能化染色[J]. 蠶業(yè)科學(xué), 2023, 49(3): 283-288.
DU C L, JIA Y M. Anti-ultraviolet functional dyeing of silk with black tea pigment[J]. Acta Sericologica Sinica, 2023, 49(3): 283-288.
[15]陳文麗, 蔣海華, 汪媛, 等. 茶樹(shù)果殼染料在真絲織物上的染色性能[J]. 印染, 2012, 38(17): 8-11.
CHEN W L, JIANG H H, WANG Y, et al. Dyeing behaviors of natural dyestuffs from tea nutshell on silk fabric[J]. China Dyeing amp; Finishing, 2012, 38(17): 8-11.
[16]董超萍, 董杰, 梅林, 等. 冬青葉色素的提取及其在真絲染色中的應(yīng)用[J]. 印染, 2015, 41(7): 37-40.
DONG C P, DONG J, MEI L, et al. Extraction of natural dyes from holly leaves and its application to silk dyeing[J]. China Dyeing amp; Finishing, 2015,41(7): 37-40.
[17]陳美云, 袁德宏, 張玉萍. 荷葉天然染料的提取及用于真絲綢染色[J]. 絲綢, 2012, 49(7): 19-24.
CHEN M Y, YUAN D H, ZHANG Y P. Extraction of natural dlye from lotus leaves and its application to dyeing of silk[J]. Journal of Silk, 2012, 49(7): 19-24.
[18]趙航, 任燕, 洪寶嘉. 黑枸杞色素的制備及真絲染色[J]. 印染, 2019, 45(10): 7-11.
ZHAO H, REN Y, HONG B J. Preparation of black wolfberry colourant and its dyeing performance on silk[J]. China Dyeing amp; Finishing, 2019, 45 (10): 7-11.
[19]賈艷梅, 郝旭, 趙龍. 黑米花青素對(duì)絲綢的染色及其抗紫外線性能[J]. 現(xiàn)代紡織技術(shù), 2022, 30(3): 174-178.
JIA Y M, HAO X, ZHAO L. Dyeing behavior and anti-ultraviolet property of silk fabric dyed with black rice anthocyanin[J]. Advanced Textile Technology, 2022, 30(3): 174-178.
[20]徐靜, 張梅, 張玉. 紅莧菜色素的提取及真絲染色[J]. 印染, 2017, 43(20): 1-6.
XU J, ZHANG M, ZHANG Y. Extraction of colorant from amaranthus paniculatus and dyeing performance on silk fabric[J]. China Dyeing amp; Finishing, 2017, 43 (20): 1-6.
[21]徐靜, 王鑫. 金盞花色素的提取及其對(duì)真絲染色性能的研究[J]. 上海紡織科技, 2018, 46(1): 28-31.
XU J, WANG X. Extraction of marigold pigment and its dyeing property to silk[J]. Shanghai Textile Science amp; Technology, 2018, 46(1): 28-31.
[22]彭文芳, 黃美瑜. 咖啡渣提取液對(duì)蠶絲織物的超聲染色研究[J]. 絲綢, 2020, 57(8): 19-22.
PENG W F, HUANG M Y. Study on ultrasonic dyeing of silk fabric with coffee ground extract[J]. Journal of Silk, 2020, 57(8): 19-22.
[23]朱莉娜, 張梅. 菱角殼色素的提取及其對(duì)真絲染色的工藝研究[J]. 印染助劑, 2016, 33(2): 38-40.
ZHU L N, ZHANG M. Extraction of natural dye from water chestnut and its dyeing on silk fabric[J]. Textile Auxiliaries, 2016, 33 (2): 38-40.
[24]徐靜, 陳曉娜. 玫瑰茄色素提取及對(duì)真絲染色性能研究[J]. 印染助劑, 2018, 35(9): 29-32.
XU J, CHEN X N. Extraction of rose eggplant pigment and its dyeing property to silk[J]. Textile Auxiliaries, 2018, 35(9): 29-32.
[25]陳夢(mèng)吉, 曹天天, 張俊, 等. 葡萄籽對(duì)于真絲織物的染色工藝研究[J]. 江蘇絲綢, 2022(1): 7-10.
CHEN M J, CAO T T, ZHANG J, et al. Study on the dyeing process of grape seeds on silk fabrics[J]. Jiangsu Silk, 2022(1): 7-10.
[26]張蓉, 顧偉, 張鈺, 等. 石榴皮多酚提取物對(duì)真絲的應(yīng)用及測(cè)試[J]. 山東紡織經(jīng)濟(jì), 2016(12): 43-44.
ZHANG R, GU W, ZHANG Y, et al. Application and testing of pomegranate peel polyphenol extract on real silk[J]. Shandong Textile Economy, 2016(12): 43-44.
[27]唐孝明, 黃繼紅, 張淑云, 等. 石榴色素用于真絲織物染色的研究[J]. 惠州學(xué)院學(xué)報(bào), 2012, 32(3): 58-61.
TANG X M, HUANG J H, ZHANG S Y, et al. Study on the dyeing of silk fabrics with granatum pigment[J]. Journal of Huizhou University, 2012, 32(3): 58-61.
[28]王輝, 陳學(xué)遂, 陸偉, 等. 水溶性姜黃色素對(duì)真絲染色工藝的研究[J]. 印染助劑, 2009, 26(5): 24-25.
WANG H, CHEN X S, LU W, et al. Study on silk dyeing with water soluble curcuma colourant [J]. Textile Auxiliaries, 2009, 26(5): 24-25.
[29]張俊, 陳林, 陳艷娟. 天然多酚在真絲上的改性及染色性能研究[J]. 上海紡織科技, 2015, 43(10): 20-22.
ZHANG J, CHEN L, CHEN Y J. Study on the modification and dyeing property of silk with natural polyphenols[J]. Shanghai Textile Science amp; Technology, 2015, 43(10): 20-22.
[30]任燕, 徐成書(shū), 胥小鳳. 天然紅曲色素的真絲綢染色[J]. 西安工程大學(xué)學(xué)報(bào), 2015, 29(3): 289-294.
REN Y, XU C S, XU X F. Dyeing of nature monascus pigment on silk fabric[J]. Journal of Xi’an Polytechnic University, 2015, 29(3): 289-294.
[31]陳林. 烏飯樹(shù)葉染料對(duì)桑蠶絲織物的染色[J]. 染料與染色, 2017, 54(1): 30-32.
CHEN L. Dyeing mulberry silk with vaccinium bracteatum Thunb. Leaves[J]. Dyestuffs and Coloration, 2017, 54(1): 30-32.
[32]張鵬, 范榮, 鐘雨文, 等. 銀杏落葉植物染料的提取及真絲染色[J]. 印染, 2018, 44(9): 26-30.
ZHANG P, FAN R, ZHONG Y W, et al. Extraction of deciduous plant dyes from ginkgo and its dyeing process on silk fabrics[J]. China Dyeing amp; Finishing, 2018, 44 (9): 26-30.
[33]周青青, 陳國(guó)強(qiáng), 唐孝明. 用薯莨提取液對(duì)真絲織物染色增重的最佳工藝及金屬離子后處理的改性效果[J]. 蠶業(yè)科學(xué), 2008, 34(4): 694-700.
ZHOU Q Q, CHEN G Q, TANG X M. Optimal technology of silk weighted by deying with dioscorea cirrhosa extract and effect of post-treatment with metal lons on its performance [J]. Acta Sericologica Sinica, 2008, 34(4): 694-700.
[34]賈艷梅. 柞樹(shù)葉染料對(duì)柞蠶絲綢的染色性能研究[J]. 絲綢, 2012, 49(12): 6-9.
JIA Y M. Study on dyeing performance of tussah leaves dyes for tussah silk fabric[J]. Journal of Silk, 2012, 49(12): 6-9.
[35]祖倚丹, 李龍春, 王瑾, 等. 真絲面料的欒樹(shù)葉染色[J]. 印染, 2018, 44(9): 1-5.
ZU Y D, LI L C, WANG J, et al. Dyeing properties of koelrenteria paniculata leaves on silk fabric[J]. China Dyeing amp; Finishing, 2018, 44 (9): 1-5.
[36]陳美云, 袁德宏, 張玉萍. 竹葉天然染料的提取及其真絲綢染色[J]. 印染助劑, 2012, 29(11): 15-19.
CHEN M Y, YUAN D H, ZHANG Y P. Extraction of natural dye from bamboo and its dyeing on silk fabric[J]. Textile Auxiliaries, 2012, 29(11): 15-19.
[37]李紅, 孫建榮. 紫甘薯天然色素的提取及對(duì)真絲染色性能的研究[J]. 印染助劑, 2010, 27(11): 17-20.
LI H, SUN J R. Study on extraction of natural dyestuff from purple sweet potato and its dyeing behaviour on silk fabric[J]. Textile Auxiliaries, 2010, 27(11): 17-20.
[38]PUNRATTANASIN N, NAKPATHOM M, SOMBOON B, et al. Silk fabric dyeing with natural dye from mangrove bark (Rhizophora apiculata Blume) extract[J]. Industrial Crops and Products, 2013(49): 122-129.
[39]CHE J N, TENG X H, JI J L. Extraction and application of pumpkin peel colorants for natural textile dyeing[J]. AATCC Journal of Research, 2023, 10(3): 154-162.
[40]NARAYANASWAMY V, GOWDA K N N, SUDHAKAR R. Dyeing and color fastness of natural dye from psidium guajuva on silk[J]. Journal of Natural Fibers, 2013, 10(3): 257-270.
[41]WANG L N, WANG S W, SONG K L,et al. Dyeing of silk fabric using natural dye extracted from sargentodoxa cuneata and its ultraviolet resistant property[J]. Journal of Natural Fibers,2022, 19(13): 7275-7282.
[42]SAHINBASKAN B Y, KARADAG R, TORGAN E. Dyeing of silk fabric with natural dyes extracted from cochineal (Dactylopius coccus Costa) and gall oak (Quercus infectoria Olivier)[J]. Journal of Natural Fibers, 2018, 15(4): 559-574.
[43]WANG S W, WANG L N, WU M H, et al. Dyeing of silk fabric with natural wall nut tree wood dye and its ultraviolet protection properties[J]. Journal of Natural Fibers, 2022, 19(15): 11181-11192.
[44]YIN Y J, FEI L, WANG C X. Optimization of natural dye extracted from phytolaccaceae berries and its mordant dyeing properties on natural silk fabric[J]. Journal of Natural Fibers, 2017, 15(1): 69-79.
[45]SASIVATCHUTIKOOL P, NAKPATHOM M. Application of natural dye extracted from cassia fistula ripe pods for dyeing of silk fabric[J]. Fibers and Polymers, 2019, 20(9): 1841-1849.
[46]SINGHEE D, SAMANTA P. Studies on dyeing process variables for application of Tesu (Butea monosperma) as natural dye on silk fabric[J]. Journal of Natural Fibers, 2019, 16(8): 1098-1112.
[47]YANG R, LI J Q, CHENG G, et al. Textiles dyeing with Pomegranate (Punica granatum) peel extract using natural mordant[J]. Journal of Natural Fibers, 2023, 20(2): 2282056.
A study on AI prediction of optimal dyeing process and color fastness of natural dyes on silk
LIU Ying1, CHEN Jie2
(1.College of Art and Design, Nanning Normal University, Nanning 530001, China;
2.School of Physics and Technology, Wuhan University, Wuhan 430000, China)
Abstract:Against the background of the current growing global environmental crisis, this study aims to promote the green transformation of the textile industry through AI technology, especially for the application of natural dyes in the textile dyeing process. Traditional chemical dyes not only cause serious pollution to the environment, but also threaten humans’ health. Therefore, the core objective of this study is to develop an efficient and accurate AI intelligent prediction model to simulate and optimize the dyeing process of natural dyes on silk, which can significantly reduce the experimental cost, shorten the Ramp;D cycle, and significantly enhance the market competitiveness of natural dye products, contributing to the sustainable development of the textile industry.
Firstly, a large amount of data were collected on natural dye types, dyeing conditions (e.g., temperature, time, pH, pigment extraction ratio, etc.) and dyeing effects (e.g., color fastness, UV resistance) through an extensive literature research system. Subsequently, data cleaning and pre-processing techniques were applied to ensure the data quality and lay a solid foundation for model construction. In the model construction stage, this study innovatively adopts the Xgboost integrated learning algorithm to construct the AI model and conducts model training and validation to evaluate the effectiveness and prediction accuracy of the model, which realizes the efficient simulation and prediction of the dyeing process and effect of natural dyes on silk, thus significantly shortening the experimental time and reducing the loss of resources. The innovations of this study are mainly reflected in the following aspects: first, the Xgboost integrated learning algorithm is applied for the first time to the simulation and prediction of natural dye dyeing process, which breaks the limitations of the traditional experimental methods and realizes the leap from empirical trial-and-error to intelligent prediction; second, the evaluation system covering the optimal reaction acidity and alkalinity, washing fastness and rubbing fastness and other multi-dimensional prediction indexes is constructed, which significantly improves the multi-dimensionality and prediction accuracy of the prediction; third, the efficiency and reliability of the model in real test sets are proved through validation, which provides a strong technical support and theoretical basis for the research and development and application of green dyestuffs in the textile industry. The study shows that the model has high accuracy in predicting the best reactive pH, color fastness to washing (CFW) and color fastness to friction (CFR), and the prediction accuracies of the three in the validation set are as high as 94.12%, 93.75%, and 100%, and the accuracies in the real test set are 8750%, 94.12%, and 82.35%, respectively. It also possesses good migratability and generalization ability, providing strong technical support for the green transformation of the textile industry.
With the continuous development of artificial intelligence technology and the continuous expansion of application fields, the natural dye dyeing effect prediction model constructed in this study is expected to be further optimized and improved. On the one hand, the prediction accuracy and generalization ability of the model can be improved by introducing data with more dimensions and higher accuracy; on the other hand, the model can be explored to be combined with automated and intelligent production equipment to realize the intelligent control of the whole chain of dyeing process, and to promote the textile industry to develop in a greener, more efficient, and more intelligent direction. At the same time, this study also provides useful reference for the deep integration of AI machine learning with traditional industries such as textile dyeing, and opens up a new path for cross-disciplinary applications.
Key words:AI predictions; Xgboost; natural dye; silk; color fastness