張 閣,鄭元林,廖開(kāi)陽(yáng),劉夢(mèng)瑩,王曉彤
(1.西安理工大學(xué) 印刷包裝與數(shù)字媒體學(xué)院,陜西西安710048; 2.陜西省印刷包裝工程重點(diǎn)實(shí)驗(yàn)室,陜西西安710048)
在科技飛速發(fā)展的今天,精美的包裝已逐漸成為大眾消費(fèi)的重要指標(biāo)。為了使工業(yè)技術(shù)與信息化時(shí)代的發(fā)展步調(diào)一致,印刷行業(yè)的改革也勢(shì)在必行,油墨配色作為印刷的核心已成為各企業(yè)競(jìng)爭(zhēng)的關(guān)鍵。自印刷技術(shù)發(fā)展以來(lái),主要以紐介堡方程[1]、Kubelka-Munk、蒙版方程、三刺激值、人工神經(jīng)網(wǎng)絡(luò)和光譜配色[2]理論為油墨配色[3]的研究對(duì)象,其中人工神經(jīng)網(wǎng)絡(luò)因具有處理復(fù)雜信息的能力而成為各學(xué)者研究的熱點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)是由大量的簡(jiǎn)單基本元件即神經(jīng)元相互聯(lián)接而成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng),能夠自身適應(yīng)環(huán)境,總結(jié)規(guī)律,完成某種運(yùn)算、識(shí)別或過(guò)程控制,具有較強(qiáng)的逼近非映射能力,但學(xué)習(xí)算法還需進(jìn)一步完善?;谶@些理論的缺陷,國(guó)內(nèi)外學(xué)者不斷地在提出新方法并加以改進(jìn)。Zurita等[4]提出了利用Kubelka-Munk理論的二階倒數(shù)的方法計(jì)算砂漿顏色濃度,平均誤差達(dá)到8.80%,但在顏色濃度較高時(shí)測(cè)量精度降低;Furferi等[5]提出了Kubelka-Munk理論加人工神經(jīng)網(wǎng)絡(luò)的方法對(duì)織物進(jìn)行配色,較Kubelka-Munk理論算法精度提高,平均誤差減小;基于光譜匹配的油墨配色方法[6]減小了油墨厚度與光照的影響,但是該方法受設(shè)備影響較大;基于混紡紗線的分光光度顏色匹配算法[7]匹配的平均色差達(dá)到1.17%,具有實(shí)用性。目前,這些理論已成功應(yīng)用到生產(chǎn)中。國(guó)外已經(jīng)成功開(kāi)發(fā)了基于Kubelka-Munk理論的配色軟件,例如愛(ài)麗色公司的Color iMatch紡織品配色軟件、Datacolor公司的Match-Pigment,這些軟件通用性高,已被很多廠家使用,但是精度還可以進(jìn)一步提高?;谝陨吓渖惴ǖ膬?yōu)缺點(diǎn),本文應(yīng)用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的模型來(lái)進(jìn)行油墨配色。遺傳算法是一種全局優(yōu)化算法,可以優(yōu)化配色模型中的參數(shù),因此文中主要針對(duì)BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最小這一缺點(diǎn),利用遺傳算法對(duì)其結(jié)構(gòu)進(jìn)行改進(jìn),找到最優(yōu)參數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,使輸入值可以準(zhǔn)確地映射到輸出值,從而得到更精確的光譜配色方法,結(jié)果顯示配色精度優(yōu)于BP神經(jīng)網(wǎng)絡(luò)算法。
本文使用了《新編四色配色印藝圖典》的色譜顏色樣本作為訓(xùn)練和檢驗(yàn)數(shù)據(jù),色譜由膠印油墨(CMYK)印刷,其中分為四個(gè)部分:青品黃黑單色梯尺、二次色樣本、三色樣本、四色樣本。單色梯尺由網(wǎng)點(diǎn)面積率從0到100%,間隔為10%(另外增加5%)的色塊組成;二次色樣本由黃品青黑四色兩兩組合疊印而成,每一色的網(wǎng)點(diǎn)面積率以10%為間隔從10%到100%;三色樣本由CMY三色疊印而成,各色塊網(wǎng)點(diǎn)面積率從10%到100%,間隔10%組成;四色樣本由青品黃以網(wǎng)點(diǎn)面積率為10%的間隔,K以網(wǎng)點(diǎn)面積率為20%的間隔組成(K為90%時(shí),C不包含90%、100%);這四部分色譜分別疊印在銅版紙上,形成不同的色塊,表1為色塊組合。測(cè)量過(guò)程中使用X-Rite eXact在M1、D50、2°視場(chǎng)條件下測(cè)量了色譜的光譜數(shù)據(jù)和CMYK四色網(wǎng)點(diǎn)面積率,測(cè)量波長(zhǎng)范圍為400~700 nm,間隔10 nm取其色塊的光譜值與CMYK四色網(wǎng)點(diǎn)面積率,總共測(cè)量有6 422組數(shù)據(jù)。為保證色譜測(cè)量的精確度,每個(gè)色塊測(cè)量3次,然后取平均值作為最終結(jié)果。
表1 色塊組合
該實(shí)驗(yàn)以BP神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的輸入數(shù)據(jù)通過(guò)非線性映射函數(shù)映射到高維特征空間,用于預(yù)測(cè)目標(biāo)值CMYK的網(wǎng)點(diǎn)面積率。將測(cè)量色塊的31維光譜值作為輸入值, 輸出為4維的CMYK網(wǎng)點(diǎn)面積率。實(shí)驗(yàn)測(cè)量數(shù)據(jù)隨機(jī)選取5 600組光譜數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,822組數(shù)據(jù)進(jìn)行驗(yàn)證。為檢驗(yàn)網(wǎng)絡(luò)的穩(wěn)定性,實(shí)驗(yàn)進(jìn)行50次,取平均值作為最終誤差[8]。表2為部分原始光譜數(shù)據(jù)。
為了使所有數(shù)據(jù)在同一維度,網(wǎng)絡(luò)訓(xùn)練前首先對(duì)原始光譜數(shù)據(jù)進(jìn)行歸一化,方便后續(xù)的數(shù)據(jù)處理,并且使網(wǎng)絡(luò)訓(xùn)練速度更快。
表2 部分光譜數(shù)據(jù)
2.1.1神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)又稱為誤差反向傳播神經(jīng)網(wǎng)絡(luò),它是一種多層的前向型神經(jīng)網(wǎng)絡(luò)。在BP網(wǎng)絡(luò)中,信號(hào)是前向傳播的,而誤差是反向傳播的。
1) 前饋神經(jīng)網(wǎng)絡(luò)是一種非線性函數(shù)映射設(shè)備,用于確定非線性函數(shù)向量,輸入數(shù)據(jù)向量P通過(guò)非線性映射函數(shù)f映射到高維特征空間,用于預(yù)測(cè)A。在這種架構(gòu)中,P是一組M維輸入向量,A是一組相應(yīng)的N維輸出向量。其中f為非線性映射函數(shù),輸入層節(jié)點(diǎn)的訓(xùn)練函數(shù)為trainlm,隱層節(jié)點(diǎn)的傳遞函數(shù)為tansing,輸出層節(jié)點(diǎn)的傳遞函數(shù)為purelin。
P=[p1,p2,…,pM]T
(1)
A=[a1,a2,…,aN]T
(2)
非線性映射可以表示為:
A=f(P;W)+b
(3)
式中,W為權(quán)值集合;b為閾值集合。BP神經(jīng)網(wǎng)絡(luò)流程圖如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)流程圖Fig.1 BP neural network flow chart
2) 反向傳播訓(xùn)練過(guò)程目的在于修正權(quán)值,得到最優(yōu)集合W。計(jì)算過(guò)程為:評(píng)估所有特定節(jié)點(diǎn)的輸入加權(quán)和,然后使用非線性映射函數(shù)f對(duì)隱層和輸出層進(jìn)行轉(zhuǎn)換,計(jì)算輸出節(jié)點(diǎn)的輸出值與其目標(biāo)值的均方誤差,最終更新權(quán)重集合W。
2.1.2神經(jīng)網(wǎng)絡(luò)參數(shù)確定
1) 神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)的確定
輸入層的節(jié)點(diǎn)為31,輸出層的節(jié)點(diǎn)為4,結(jié)合網(wǎng)絡(luò)訓(xùn)練速度和目標(biāo)精度并經(jīng)多次驗(yàn)證,文中選用單隱層結(jié)構(gòu),隱層節(jié)點(diǎn)為30。
2) 神經(jīng)網(wǎng)絡(luò)訓(xùn)練
訓(xùn)練參數(shù)包含迭代次數(shù)、學(xué)習(xí)速率、目標(biāo)精度和動(dòng)量因子這幾個(gè)部分。學(xué)習(xí)速率有不斷調(diào)整權(quán)值和閾值的作用,根據(jù)多次實(shí)驗(yàn)將值設(shè)為0.1,為了避免神經(jīng)網(wǎng)絡(luò)陷入局部最小,文中添加了動(dòng)量因子,設(shè)置為0.005。迭代次數(shù)為1 000,目標(biāo)精度為0.000 01,網(wǎng)絡(luò)訓(xùn)練過(guò)程[9]中達(dá)到目標(biāo)精度則停止訓(xùn)練。最終輸出結(jié)果循環(huán)50次后取平均值。
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程為:
步驟一 對(duì)樣本進(jìn)行歸一化處理,所有數(shù)據(jù)歸一化到[-1,1]之間;
步驟二 兩組實(shí)驗(yàn)分別取樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,結(jié)果達(dá)到目標(biāo)精度時(shí)停止訓(xùn)練;
步驟三 選取測(cè)試樣本進(jìn)行網(wǎng)絡(luò)測(cè)試,最后進(jìn)行誤差分析。
2.1.3BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果
根據(jù)建立好的BP神經(jīng)網(wǎng)絡(luò),使用822組測(cè)試樣本進(jìn)行仿真訓(xùn)練,圖2為測(cè)量值與預(yù)測(cè)值的誤差分布直方圖。
圖2 BP神經(jīng)網(wǎng)絡(luò)的誤差分布直方圖Fig.2 Error distribution histogram of BP neural network
從圖中可以看出,822組測(cè)試數(shù)據(jù)經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)計(jì)算,誤差集中分布在[0.04,0.08],平均誤差為8.6%。從該實(shí)驗(yàn)可以看出,僅使用BP神經(jīng)網(wǎng)絡(luò)誤差較大,說(shuō)明該結(jié)構(gòu)需要進(jìn)一步優(yōu)化。
遺傳算法抽象于生物體的進(jìn)化過(guò)程,通過(guò)全面模擬自然選擇和遺傳機(jī)制,形成一種具有“生成+檢驗(yàn)”特征的搜索算法,它在整個(gè)進(jìn)化過(guò)程中的遺傳操作是隨機(jī)性的,但它所呈現(xiàn)出的特性并不是完全隨機(jī)搜索,它能有效地利用歷史信息來(lái)推測(cè)下一代性能有所提高的尋優(yōu)點(diǎn)集。物種不斷進(jìn)化,最后收斂到一個(gè)最適應(yīng)環(huán)境的個(gè)體上,求得問(wèn)題的最優(yōu)解。
遺傳算法以編碼空間代替問(wèn)題的參數(shù)空間,以適應(yīng)度函數(shù)為評(píng)價(jià)依據(jù),以編碼群體為進(jìn)化基礎(chǔ)進(jìn)行遺傳操作建立起一個(gè)迭代過(guò)程。遺傳算法的優(yōu)越性主要表現(xiàn)在不容易陷入局部最優(yōu),即使在所定義的適應(yīng)度函數(shù)不連續(xù)、非規(guī)則或有噪聲的情況下,也能很大概率地找到整體最優(yōu)解。遺傳算法所涉及的五大要素包括:參數(shù)編碼、初始群體的設(shè)定、適應(yīng)度函數(shù)的設(shè)計(jì)、遺傳操作的設(shè)計(jì)和參數(shù)的設(shè)定。
1) 實(shí)數(shù)編碼
樣本數(shù)據(jù)輸入后,首先隨機(jī)產(chǎn)生權(quán)值和閾值并對(duì)其編碼產(chǎn)生一定數(shù)量的染色體。遺傳算法中常用二進(jìn)制編碼,因?yàn)樗耐ㄓ眯愿摺⑹褂梅奖?,所以?jīng)常被用于編碼。二進(jìn)制編碼的進(jìn)化層次是基因,實(shí)數(shù)編碼的進(jìn)化層次是個(gè)體。在參數(shù)變量范圍較大的模型中,若采用二進(jìn)制編碼,其編碼字符串長(zhǎng)度太大,使得染色體的編碼和解碼占用計(jì)算機(jī)時(shí)間較長(zhǎng),另外,二進(jìn)制編碼的雜交和變異對(duì)動(dòng)力學(xué)模型的參數(shù)估計(jì)問(wèn)題缺乏明確的物理意義。文中舉例參數(shù)A的兩種編碼方式,圖3中左圖為參數(shù)A的二進(jìn)制編碼,右圖為參數(shù)A的實(shí)數(shù)編碼形式)。相比之下,實(shí)數(shù)編碼[10]不僅無(wú)需轉(zhuǎn)換數(shù)制和數(shù)據(jù)類型便于理解,而且節(jié)省遺傳操作時(shí)間。另外,實(shí)數(shù)編碼具有精度高、便于大空間搜索的優(yōu)點(diǎn)。
圖3 編碼Fig.3 Coding
2) 初始化種群
初始化種群開(kāi)始階段,生成一定規(guī)模的種群并同時(shí)開(kāi)始進(jìn)化,每個(gè)種群都由待優(yōu)化參數(shù)(權(quán)值和閾值)編碼而成的染色體組成。遺傳算法進(jìn)行時(shí)隨機(jī)產(chǎn)生40個(gè)種群并開(kāi)始進(jìn)化,進(jìn)化代數(shù)為20,進(jìn)化開(kāi)始后每一代染色體和其位置都會(huì)被記錄,方便以后的最優(yōu)染色體雜交變異。
3) 適應(yīng)度計(jì)算
在遺傳算法中[11,12],采用適應(yīng)度函數(shù)來(lái)區(qū)分群體中個(gè)體的好壞,以及評(píng)價(jià)測(cè)試樣本的輸出值和期望值之間的誤差。計(jì)算過(guò)程為先對(duì)染色體進(jìn)行解碼,然后用設(shè)計(jì)的模型進(jìn)行網(wǎng)絡(luò)訓(xùn)練,這時(shí)的權(quán)值和閾值為優(yōu)化之后得到的值,輸入向量P(光譜值)將會(huì)對(duì)應(yīng)輸出向量A(與光譜值對(duì)應(yīng)的四色網(wǎng)點(diǎn)面積率),最終用適應(yīng)度函數(shù)[13]驗(yàn)證其性能。在計(jì)算當(dāng)中,MSE充當(dāng)適應(yīng)度值,并根據(jù)性能目標(biāo)進(jìn)行最小化。i表示輸入節(jié)點(diǎn)數(shù)(I為實(shí)驗(yàn)中用到的光譜數(shù)組總數(shù)),k表示輸出節(jié)點(diǎn)數(shù)(K為四色網(wǎng)點(diǎn)面積率輸出數(shù)組總數(shù)),ti,k和si,k分別表示第i個(gè)輸入樣本下第k個(gè)輸出樣本的預(yù)測(cè)值和期望值。
(4)
式中,P、A分別為向量P、A的數(shù)值。
4) 雜交與變異
雜交的作用在于將優(yōu)良的基因傳給下一代個(gè)體,并生成包含更復(fù)雜基因結(jié)構(gòu)的新個(gè)體。這個(gè)過(guò)程主要是在交配池中隨機(jī)選取一對(duì)染色體,并隨機(jī)選取雜交位置根據(jù)雜交概率Pc相互交換各自的部分內(nèi)容,從而形成一對(duì)新的個(gè)體。變異是通過(guò)變異概率Pm隨機(jī)反轉(zhuǎn)等位基因來(lái)實(shí)現(xiàn)的。
為提高遺傳算法求解效率,本文將尋找Pc和Pm的最優(yōu)組合,判斷的準(zhǔn)則為找到最優(yōu)參數(shù)所需要的遺傳代數(shù)最少。Pc限定在[0.7,1.0]范圍內(nèi),Pm限定在[0.003,0.05]范圍內(nèi),固定某一Pc值,改變Pm值進(jìn)行運(yùn)算,從而找到最優(yōu)組合(Pc,Pm)。最終確定Pc為0.7,Pm為0.004。
5) 最優(yōu)種群
在各種群進(jìn)化過(guò)程中會(huì)將進(jìn)化最好的個(gè)體選擇出來(lái)放在最優(yōu)種群中,最終以進(jìn)化代數(shù)作為終止的依據(jù)。圖4為混合模型訓(xùn)練流程圖。
圖4 混合模型(GABP)流程圖Fig.4 Framework of the proposed GABP method
本小節(jié)對(duì)圖5油墨配色流程圖進(jìn)行說(shuō)明。
1) 構(gòu)建模型。對(duì)四色墨進(jìn)行其光譜值與CMYK不同網(wǎng)點(diǎn)百分比的測(cè)量,并輸入油墨配色系統(tǒng)建立一個(gè)完整的配色系統(tǒng)。這些數(shù)據(jù)將作為標(biāo)準(zhǔn)值來(lái)完成不同客戶的印刷需求。
2) 配方計(jì)算。首先測(cè)量待配色樣品的光譜值,將光譜值所有的數(shù)據(jù)輸入配色系統(tǒng),系統(tǒng)開(kāi)始計(jì)算,所有數(shù)據(jù)歸一化處理,系統(tǒng)根據(jù)輸入數(shù)據(jù)隨機(jī)產(chǎn)生權(quán)值和閾值,遺傳算法生成一定數(shù)量的種群開(kāi)始進(jìn)化,反復(fù)繁殖找到最優(yōu)參數(shù)并賦予BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,網(wǎng)絡(luò)會(huì)根據(jù)輸入值進(jìn)行迭代計(jì)算,直到找到與之對(duì)應(yīng)的誤差最小的一組四色網(wǎng)點(diǎn)面積率,計(jì)算停止。
3) 模型應(yīng)用。最終按照上一步計(jì)算的CMYK四色網(wǎng)點(diǎn)面積率,直接調(diào)配四色墨進(jìn)行印刷[14]。
圖5 油墨配色流程圖Fig.5 Framework of the proposed ink color matching method
傳統(tǒng)印刷工藝主要依靠工人憑借經(jīng)驗(yàn)給出印刷配方,該方法對(duì)工人技術(shù)有太大的依賴性,容易造成油墨、承印物的浪費(fèi)。GABP模型的應(yīng)用不僅能夠穩(wěn)定預(yù)測(cè)出所需油墨的網(wǎng)點(diǎn)面積率,而且還有效防止了材料的浪費(fèi),將為企業(yè)提供一種更便利的生產(chǎn)方式。
將樣本數(shù)據(jù)輸入GABP模型進(jìn)行計(jì)算,重復(fù)50次并選取平均誤差作為最終結(jié)果。
1) 在遺傳算法計(jì)算適應(yīng)度時(shí),MSE充當(dāng)適應(yīng)度值,將目標(biāo)進(jìn)行最小化。圖6為樣本訓(xùn)練后的適應(yīng)度曲線,在進(jìn)化代數(shù)為5時(shí),適應(yīng)度達(dá)到最佳值為227,說(shuō)明此時(shí)染色體在進(jìn)化過(guò)程中達(dá)到最佳狀態(tài)。
圖6 適應(yīng)度曲線圖Fig.6 Fitness curve
2) 最優(yōu)種群得到后,網(wǎng)絡(luò)中各參數(shù)確定并同時(shí)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。網(wǎng)絡(luò)運(yùn)行結(jié)果如圖7所示,藍(lán)綠紅曲線分別為訓(xùn)練值、驗(yàn)證值和測(cè)試值,圖中綠色圓圈處代表實(shí)驗(yàn)經(jīng)過(guò)97次迭代,最終達(dá)到最佳精度并停止工作。在迭代次數(shù)為97時(shí),最佳驗(yàn)證性能為0.004 619 1。
圖7 神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)曲線圖Fig.7 Neural network learning curve
3) 總結(jié)實(shí)驗(yàn)結(jié)果可得到實(shí)驗(yàn)誤差直方圖,如圖8所示,其中橫坐標(biāo)為誤差范圍,縱坐標(biāo)為誤差頻數(shù)。圖中表明了在實(shí)驗(yàn)中每組數(shù)據(jù)的CMYK四色網(wǎng)點(diǎn)面積率測(cè)量值與預(yù)測(cè)值誤差分布的情況,其中誤差主要分布在[0,0.08]內(nèi),822組數(shù)據(jù)經(jīng)過(guò)BP神經(jīng)網(wǎng)絡(luò)測(cè)試平均誤差為4.5%。
圖8 GABP誤差分布直方圖Fig.8 Error distribution histogram of GABP
4) 網(wǎng)絡(luò)訓(xùn)練結(jié)束后仿真得到的預(yù)測(cè)值經(jīng)過(guò)反歸一化處理得到最終結(jié)果。文中截取10組隨機(jī)取值的輸出數(shù)據(jù)進(jìn)行誤差對(duì)比分析,表3為CMYK混色的實(shí)際測(cè)量值與預(yù)測(cè)值的均方誤差。
通過(guò)對(duì)表中數(shù)據(jù)進(jìn)行誤差分析可以直觀地看到,CMYK四色網(wǎng)點(diǎn)面積率測(cè)量值與預(yù)測(cè)值十分接近,誤差較小。實(shí)驗(yàn)表明,經(jīng)過(guò)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練能力較好,較BP神經(jīng)網(wǎng)絡(luò)誤差明顯減小。
表3 預(yù)測(cè)值與測(cè)量值的誤差分析
為了找到最佳配色系統(tǒng),本文通過(guò)創(chuàng)建GABP混合模型來(lái)實(shí)現(xiàn)光譜配色,利用構(gòu)建的模型使光譜反射率找到與目標(biāo)值CMYK最接近的值與之匹配。文中通過(guò)樣本數(shù)據(jù)隨機(jī)選取的方式進(jìn)行實(shí)驗(yàn),平均誤差為4.5%,在實(shí)驗(yàn)過(guò)程中網(wǎng)絡(luò)收斂速度較快,計(jì)算結(jié)果的精度也比較好,說(shuō)明經(jīng)過(guò)改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)能夠彌補(bǔ)結(jié)構(gòu)上的不足從而找到最優(yōu)參數(shù),并能進(jìn)一步訓(xùn)練得到準(zhǔn)確的目標(biāo)值。同時(shí)也說(shuō)明經(jīng)遺傳算法優(yōu)化改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射能力,泛化能力高。在配色系統(tǒng)中模型的建立是至關(guān)重要的,它決定了系統(tǒng)是否能夠準(zhǔn)確的印刷出滿足客戶需求的樣品。實(shí)驗(yàn)證明,應(yīng)用GABP油墨配色系統(tǒng)配色精度較高,能為印刷企業(yè)提供較為準(zhǔn)確的配色方法。