李東珂
(西安工程大學(xué) 機(jī)電工程學(xué)院,陜西西安 710048)
紡織加工是一個依賴于專家知識與經(jīng)驗的過程,智能化方法在紡織生產(chǎn)中的應(yīng)用還相對較少。近年來,國內(nèi)外學(xué)者已開始研究和應(yīng)用機(jī)器學(xué)習(xí)的方法預(yù)測紡織品質(zhì)量,劉彬基于遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測紗線質(zhì)量[1],李翔基于神經(jīng)網(wǎng)絡(luò)預(yù)測精仿毛紗性能[2],Te基于神經(jīng)網(wǎng)絡(luò)預(yù)測紡紗工藝性能[3]。目前,依據(jù)《國家紡織產(chǎn)業(yè)基本安全技術(shù)規(guī)范GB18401-2010》對紡織品安全質(zhì)量的評測,還是以人工經(jīng)驗評測為主。機(jī)器學(xué)習(xí)領(lǐng)域中,支持向量機(jī)具有小樣本、結(jié)構(gòu)風(fēng)險最小、非線性等優(yōu)點[4-7],本研究將其應(yīng)用在紡織品安全質(zhì)量評測,并相應(yīng)調(diào)整計算模型,使其更適合用于紡織品安全質(zhì)量評測。
支持向量機(jī) (Support vector machine,簡稱SVM) 是基于統(tǒng)計學(xué)習(xí)理論的一種模式識別方法,它能夠輸出一個將不同類樣本在樣本空間分隔的超平面 ?;舅枷胧前岩粋€低維的線性不可分的問題通過核函數(shù)方法轉(zhuǎn)化為一個高維的線性可分問題。
在機(jī)器學(xué)習(xí)領(lǐng)域,SVM也是一種統(tǒng)計機(jī)器學(xué)習(xí)方法[8-10],相對于傳統(tǒng)機(jī)器學(xué)習(xí)輸出經(jīng)驗風(fēng)險最小,統(tǒng)計機(jī)器學(xué)習(xí)輸出結(jié)構(gòu)風(fēng)險最小,即經(jīng)驗風(fēng)險和置信風(fēng)險的總和最小。給定一些標(biāo)記(label)好的訓(xùn)練樣本 (監(jiān)督式學(xué)習(xí)),SVM輸出一個最優(yōu)化的分隔超平面[11-12]。下面的公式定義了其超平面,表達(dá)式如下所示:
式中:W是權(quán)重向量,b0是偏差向量,x是離超平面最近的點,這些點被稱作支持向量。
最優(yōu)超平面可以有無數(shù)種表達(dá)方式,即任意地改變W和b0的值。由于需要找到最優(yōu)超平面對樣本數(shù)據(jù)進(jìn)行精確的分類,所以要找到最優(yōu)的W和b0值。
損失函數(shù)反應(yīng)了SVM對樣本分類的真實程度,損失函數(shù)最優(yōu)則最真實。假設(shè)超平面表達(dá)式f(x)為一個得分,損失函數(shù)反應(yīng)了該得分與標(biāo)記(label)的匹配程度,表達(dá)式如(2)所示。
式中:fyi為正確分類的得分,fj為不正確分類的得分,?為邊界值。該式子表示Syi要比Sj至少多出一個?值,不滿足則計算損失值,此值越小越好。為了防止預(yù)測結(jié)果過擬合,需要對模型進(jìn)行正則化。正則化后模型的完整目標(biāo)函數(shù)如下所示。
式中:N為數(shù)據(jù)量,C為懲罰因子,為正則化損失。在目標(biāo)函數(shù)中加入正則化損失可對大數(shù)值權(quán)重類進(jìn)行懲罰,提升其泛化能力,防止模型過擬合。
確定支持向量機(jī)模型,首先要確定其核函數(shù)。核函數(shù)分為線性核函數(shù),多項式核函數(shù),徑向基(RBF)核函數(shù),Sigmoid核函數(shù),這些函數(shù)中應(yīng)用最廣的是徑向基(RBF)核函數(shù),無論樣本大小,高維低維等情況,RBF核函數(shù)均適用,它相比其他的函數(shù)有以下優(yōu)點:
(1)RBF核函數(shù)可以將一個樣本映射到一個更高維的空間,而且線性核函數(shù)是RBF的一個特例,如果考慮使用RBF,那么就沒有必要考慮線性核函數(shù)了。
(2)與多項式核函數(shù)相比,RBF需要確定的參數(shù)要少,核函數(shù)參數(shù)的多少直接影響函數(shù)的復(fù)雜程度。另外,當(dāng)多項式的階數(shù)比較高時,核矩陣的元素值將趨于無窮大或無窮小,而RBF則在上,會減少數(shù)值的計算困難。
(3)對于某些參數(shù),RBF和sigmoid具有相似的性能。
結(jié)合研究應(yīng)用方向和樣本數(shù)據(jù)數(shù)量以及特征量不多的情況,綜合考慮下選擇徑向基(RBF)核函數(shù)。徑向基核函數(shù)公式如下所示。
式中:σ為徑向基核帶寬的調(diào)節(jié)參數(shù)。
支持向量機(jī)中懲罰因子C的選擇也十分重要,懲罰因子也叫松弛變量,其對應(yīng)未被正確分類的離群點的離群程度,C越大,模型越看重離群點,目標(biāo)函數(shù)損失越大。C的尋優(yōu)過程如圖1所示。
圖1 C值尋優(yōu)流程圖
本研究將紡織品安全質(zhì)量信息數(shù)據(jù)存入數(shù)據(jù)庫模塊,該數(shù)據(jù)庫中的信息數(shù)據(jù)與紡織品安全質(zhì)量信息對應(yīng),為質(zhì)量預(yù)測模塊提供訓(xùn)練數(shù)據(jù),質(zhì)量預(yù)測模塊應(yīng)用SVM,所以隨著訓(xùn)練數(shù)據(jù)的增多,預(yù)測結(jié)果也會相對的更加精準(zhǔn)。表1為懲罰因子C值測試,表2為收集的部分紡織品安全質(zhì)量性能指標(biāo)。首先確定懲罰因子C值,選擇20組數(shù)據(jù)進(jìn)行訓(xùn)練時,模型的C值測試如表1所示。根據(jù)測試,最終模型選擇懲罰因子C值為5.0。
表1 C值測試
表2 數(shù)據(jù)庫中部分紡織品性能指標(biāo)
續(xù)表 2
設(shè)置好模型參數(shù),將支持向量機(jī)用于預(yù)測紡織品安全質(zhì)量等級,預(yù)測流程如圖2所示。
圖2 算法預(yù)測流程圖
假設(shè)數(shù)據(jù)庫中有50組樣本數(shù)據(jù),在訓(xùn)練時,將40組訓(xùn)練數(shù)據(jù)定好對應(yīng)的標(biāo)記(質(zhì)量等級),通過數(shù)據(jù)庫地址接口傳入SVM模型,每一組訓(xùn)練數(shù)據(jù)都可到一個f(x)的值,即“得分”,通過訓(xùn)練次數(shù)的增多,W和b0的值也逐漸調(diào)整使得目標(biāo)函數(shù)達(dá)到最優(yōu),即“得分”與標(biāo)記有非常好的匹配。再將10組數(shù)據(jù)作為測試數(shù)據(jù)送入訓(xùn)練好的模型中,進(jìn)行測試,判斷準(zhǔn)確率是否達(dá)標(biāo)。此外,還要將訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行交叉驗證,優(yōu)化模型,提高模型的泛化能力,防止過擬合。本實驗過程應(yīng)用VS2010+OPENCV庫中SVM和MFC模塊完成,經(jīng)驗證,用20組數(shù)據(jù)進(jìn)行訓(xùn)練,5組數(shù)據(jù)進(jìn)行測試,準(zhǔn)確率為82.6%;用40組數(shù)據(jù)進(jìn)行訓(xùn)練,10組數(shù)據(jù)進(jìn)行測試,準(zhǔn)確率為89.7%。
針對紡織品安全質(zhì)量評測依賴人工經(jīng)驗的問題,通過仿真分析,建立了評測模型并驗證,提出一種基于支持向量機(jī)(SVM)評測紡織品安全質(zhì)量的方法。該質(zhì)量評測方法較以往方法更加智能,節(jié)省人力,為紡織品生產(chǎn)企業(yè)在紡織品的質(zhì)量控制方面提供了新方案。
[1]劉彬, 項前, 楊建國,等. 基于遺傳神經(jīng)網(wǎng)絡(luò)的紗線質(zhì)量預(yù)測[J]. 東華大學(xué)學(xué)報(自然科學(xué)版), 2013,39(4):504-508.
[2]李翔, 彭志勤, 金鳳英,等. 基于神經(jīng)網(wǎng)絡(luò)的精紡毛紗性能預(yù)測模型比較[J]. 紡織學(xué)報, 2011, 32(3):51-56.
[3]Su T L, Kuo C F J, Wei H J. Prediction system of openend rotor spinning process based on LM-neural network for bamboo charcoal fibers[J]. Fibers & Polymers, 2011,12(5):657-663.
[4]宋楚平, 蔡彬彬, 李少芹. 基于SVM的紗線生產(chǎn)工藝智能優(yōu)化研究[J]. 毛紡科技, 2015, 43(7):13-17.
[5]楊建國, 熊經(jīng)緯, 徐蘭,等. 基于改進(jìn)極限學(xué)習(xí)機(jī)的紗線質(zhì)量預(yù)測[J]. 東華大學(xué)學(xué)報(自然科學(xué)版), 2015,41(4):494-497.
[6]靳江偉. 基于改進(jìn)支持向量機(jī)的產(chǎn)品質(zhì)量預(yù)測研究[D]. 東北林業(yè)大學(xué), 2016.
[7]丁世飛, 齊丙娟, 譚紅艷. 支持向量機(jī)理論與算法研究綜述[J]. 電子科技大學(xué)學(xué)報, 2011, 40(1):2-10.
[8]Jiang X, Lu W X, Zhao H Q, et al. Quantitative evaluation of m ining geo-environmental quality in Northeast China: comprehensive index method and support vector machine models[J]. Environmental Earth Sciences, 2015,73(12):7945-7955.
[9]He K, Li X. A quantitative estimation technique for welding quality using local mean decomposition and support vector machine[J]. Journal of Intelligent Manufacturing,2016, 27(3):525-533.
[10]Hosseinipour S E, Ahmadzadeh M R, Zanjirchi B. Quality Management in Textile through Noble Methodology and Six Sigma[J]. Advanced Materials Research, 2011,332-334:351-355.
[11]Zhang X K, Ding S F, Xue Y, et al. An improved multiple birth support vector machine for pattern classification[J].Elsevier B.V.,2016,11(6):10-16.
[12]Lu Z J, Xiang Q, Li B Z, et al. Support Vector Machine w ith Real Code Genetic A lgorithm for Yarn Quality Prediction[J]. Advanced Science Letters, 2013, 19(8):2468-2472.