孫漢文,夏祥華
(河北大學(xué) 化學(xué)與環(huán)境科學(xué)學(xué)院,河北省分析科學(xué)技術(shù)重點實驗室,河北 保定 071002)
苯酚、苯二酚和硝基苯酚作為重要的化工原料被廣泛地用于制造染料、藥物、酚醛樹脂、膠粘劑等,其屬于對環(huán)境和人類危害較大的毒性有機(jī)物.目前酚類化合物的檢測主要有高效液相色譜法[1]、氣相色譜法[2]、薄層色譜法[3]、光度法[4]、化學(xué)發(fā)光法[5-6]、熒光光度法[7].但上述方法存在前處理繁雜、耗時長、成本高,而且因酚類化合物的物理和化學(xué)性質(zhì)的相似性,光譜法也難以實現(xiàn)多組分酚類化合物的同時測定.高效毛細(xì)管電泳是近20年迅速發(fā)展的一種快速的分離分析技術(shù)[8],以其高效、快速,微量操作簡單、經(jīng)濟(jì),對樣品純度要求不高及更接近體內(nèi)的結(jié)合行為等優(yōu)點,被廣泛應(yīng)用于分析測定領(lǐng)域.將毛細(xì)管電泳方法用于苯二酚同分異構(gòu)測定的文獻(xiàn)[9-12]已有報道,但就苯二酚、苯酚、對硝基苯酚5組分同時測定的文獻(xiàn)未見報道.本文將遺傳算法(genetic algorithms,GA)優(yōu)化輸入變量下的徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)方法與毛細(xì)管電泳方法相結(jié)合,用于苯二酚、苯酚、對硝基苯酚5種化合物的同時測定,以“數(shù)學(xué)分離”替代物理、化學(xué)上的分離,實現(xiàn)復(fù)雜化學(xué)體系的多組分的同時測定,該方法不但準(zhǔn)確,快捷,簡便,經(jīng)濟(jì),而且不用實現(xiàn)化合物之間的完全分離便可以進(jìn)行測定.
遺傳算法[13]是一種群體搜索技術(shù),沿多種路線進(jìn)行平行搜索,為實現(xiàn)群體進(jìn)化到接近最優(yōu)解或包含的狀態(tài),進(jìn)行選擇、交叉、變異等一系列遺傳操作,由當(dāng)前群體而產(chǎn)生出新一代的群體.一般的GA 由編碼機(jī)制、控制參數(shù)、適應(yīng)度函數(shù)(目標(biāo)函數(shù))、遺傳算子4部分組成.
1)編碼的實現(xiàn):GA 要把問題解編成一個合適的編碼.本文采用二進(jìn)制編碼.
2)初始化群體:選擇合適的初始群體規(guī)模至關(guān)重要,規(guī)模大小既不易使算法陷入局部最優(yōu)解,又要使迭代時間不能太長.本文初始種群規(guī)模選擇20,采用隨機(jī)取種法產(chǎn)生初始種群的二進(jìn)制串,每次GA 操作后輸入變量優(yōu)化組合不盡相同[14].因此,本文采用的是平行多次GA 操作,按照輸入變量選取概率的大小進(jìn)行變量優(yōu)化組合.
3)對象函數(shù):對象函數(shù)也稱適應(yīng)度函數(shù),為問題求解品質(zhì)的測量函數(shù).本文選擇通用回歸神經(jīng)網(wǎng)絡(luò)對每個樣本的適應(yīng)性進(jìn)行評估.通用回歸網(wǎng)絡(luò)對模型中所包含的非相關(guān)性變量較為敏感,且較快的訓(xùn)練速度能夠快速完成GA 操作中對大量樣本的適應(yīng)性評估.
4)遺傳算法算子的選擇、交換、變異:個體的優(yōu)劣度由算子的選擇所決定,算子的選擇成為最終為選擇它在下一代被復(fù)制還是被淘汰的依據(jù).本文選用了輪盤賭選擇法.變異和交叉操作的作用主要是防止過早熟,避免收斂過慢.本工作選用單點交叉方式進(jìn)行父串信息的交換,以便獲得質(zhì)量更優(yōu)的新解.
本文輸入變量選擇優(yōu)化的程序包括2步.
1)對同一輸入變量進(jìn)行平行GA 操作.在GA 操作中,因初始種群產(chǎn)生的隨機(jī)性和變量之間的偶然相關(guān)性,即使對同一數(shù)據(jù)進(jìn)行平行遺傳操作,輸入變量優(yōu)化組合方式具有相似性,但不完全相同.本文選擇平行10次GA 操作進(jìn)行輸入變量優(yōu)化選取,將變量在所有GA 操作中被選擇的概率進(jìn)行統(tǒng)計,按輸入變量被選擇概率大小依次增加變量數(shù)量.
2)計算不同輸入變量模型的預(yù)測誤差值,預(yù)測誤差值最小所對應(yīng)的輸入變量組合為輸入變量最佳組合.神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差均由下式計算.
其中p 代表所有樣本的數(shù)目;ippred樣本p 的預(yù)測值;iptrue代表模型樣本p 的目標(biāo)值.
徑向基函數(shù)[14]神經(jīng)網(wǎng)絡(luò)是一種單隱層前饋層狀型的神經(jīng)網(wǎng)絡(luò),能以任意精度逼近任一連續(xù)函數(shù),非常適合于非線性動態(tài)系統(tǒng)建模.RBF神經(jīng)網(wǎng)絡(luò)模型是基于相關(guān)RBF 的線性組合.最常用的RBF 為高斯型函數(shù),其表達(dá)式如公式(2)所示.
hj(x;cj;σj)表示隱含層中第j個RBF單元的輸出值;║x-cj║表示第j 個網(wǎng)絡(luò)模型的中心矢量cj和輸入變量x 的Euclidean間的距離;σj代表第j 個網(wǎng)絡(luò)模型的擴(kuò)展程度.模型的輸出公式表示為
其中,ωjk表示輸出層單元k 與隱含層單元j 間的連接權(quán)重;Yk(x)為輸入矢量x 經(jīng)網(wǎng)絡(luò)模型計算后的輸出層單元k 中的輸出值.bk表示輸出單元k 的偏置.本文以K-均值算法為RBF模型的中心,且以K-最鄰近偏差分配算法進(jìn)行模型寬度選取.模型的中心和寬度確定之后,將以偽逆訓(xùn)練算法不準(zhǔn)進(jìn)行隱含層單元與輸出層單元間的連接權(quán)重的調(diào)整,并以平方和誤差函數(shù)監(jiān)控RBF 網(wǎng)絡(luò)的訓(xùn)練過程,使最優(yōu)網(wǎng)絡(luò)模型的誤差函數(shù)E最小.E 由公式(4)給出:
主要儀器:CL1020型高效毛細(xì)管電泳儀(中國北京彩陸科學(xué)儀器有限公司);KH-50B型超聲波清洗器(昆山禾創(chuàng)超聲儀器有限公司);pHS-3C精密pH 計(上海雷磁儀器廠);毛細(xì)管為內(nèi)徑100μm 未涂層的熔硅毛細(xì)管(河北永年光導(dǎo)纖維廠),總長度為65cm,有效長度57cm.
試劑:鄰苯二酚(天津市科密歐化學(xué)試劑有限公司);間苯二酚(天津市華東試劑廠);對苯二酚(天津市科密歐化學(xué)試劑有限公司);苯酚(天津市科密歐化學(xué)試劑開發(fā)中心);對硝基苯酚(SCRC國藥集團(tuán)化學(xué)試劑有限公司);磷酸二氫鉀(KH2PO4);磷酸氫二鈉.所用試劑均為分析純,水為二次重蒸水,所有上機(jī)溶液均需經(jīng)0.45μm濾膜處理.
分別準(zhǔn)確稱量0.025g鄰苯二酚、間苯二酚、對苯二酚、苯酚和對硝基苯酚分別于100mL容量瓶中,加水稀釋、定容,作為儲備液放置于冰箱內(nèi),用時逐級稀釋.在5.4~230.0μg/mL內(nèi),配置鄰、間、對苯二酚、苯酚和硝基苯酚5組的混合溶液實驗樣本30個.
用稀鹽酸調(diào)節(jié)磷酸鹽緩沖體系的酸度pH 8.17;實驗前依次用NaOH 溶液(0.1mol/L)、H2O、緩沖溶液沖洗毛細(xì)管各10min,高效毛細(xì)管電泳儀的檢測波長為200nm,分離操作電壓為10kV,重力進(jìn)樣高度15cm,時間為10s;每2個樣品分析后沖洗3min.在本文優(yōu)化條件下,采集30個樣品的毛細(xì)管電泳譜圖.
本實驗所需程序均由MATALAB編寫和運行.數(shù)據(jù)采集和處理由ACS-2000工作站進(jìn)行分析和評估.以ASCⅡ碼文件格式表述光譜圖數(shù)據(jù).所用計算程序在PC計算機(jī)上運行.
緩沖溶液的pH 直接影響著電滲流的大小進(jìn)而影響分離的效果.由于苯二酚、苯酚和對硝基苯酚結(jié)構(gòu)相近、化學(xué)及物理性質(zhì)相似,鄰苯二酚、間苯二酚、對苯二酚、苯酚和對硝基苯的pKa值分別為9.4,9.4,10.3,10.0和7.09,在磷酸二氫鉀和磷酸氫二鈉的緩沖體系下,本文考察了溶液pH 在5.80~9.00內(nèi)對樣品測定的影響.綜合考慮選擇緩沖體系pH 為8.17進(jìn)行分離.圖1為在本實驗優(yōu)化條件下鄰苯二酚、間苯二酚、對苯二酚、苯酚和對硝基苯酚5組分混合溶液的毛細(xì)管電泳譜圖.
圖1 檢測波長200nm 5組分的毛細(xì)管電泳Fig.1 Electrophoretogram of the five compounds at 200nm
在磷酸鹽緩沖體系下pH 為8.17,溫度20 ℃,在5~20kV 電壓下對5種物質(zhì)進(jìn)行分離.研究發(fā)現(xiàn)電壓對分離影響較小,但是隨電壓和溫度升高,遷移時間縮短.綜合考慮分離效果和分析速度,選擇電壓為10kV,溫度為20 ℃,在15min內(nèi)可完成5種物質(zhì)的分離.
將優(yōu)化條件下采集的30個5組分混合樣品的毛細(xì)管電泳圖的數(shù)據(jù)點作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,從訓(xùn)練集中均勻選取7個樣本作為神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的校正集,用于監(jiān)控神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,避免“過訓(xùn)練”的發(fā)生,且使神經(jīng)網(wǎng)絡(luò)模型平行運行10次,以檢驗神經(jīng)網(wǎng)絡(luò)運行的穩(wěn)定性.如果從毛細(xì)管電泳譜圖上均勻選取81個數(shù)據(jù)點都作為神經(jīng)網(wǎng)絡(luò)模型的輸入變量,輸入變量顯然過多,不相關(guān)的、冗余的以及含有噪聲的變量可能也被包含在輸入數(shù)據(jù)集中,有意義的變量可能被隱藏[16],這就使得過大數(shù)量的輸入變量間偶然相關(guān)的概率大大增加[17],且大數(shù)量的輸入變量也使得相關(guān)神經(jīng)網(wǎng)絡(luò)模型難以進(jìn)行優(yōu)化[18].因此,有必要進(jìn)行模型輸入變量的優(yōu)化.選擇GA 對初次選取的變量進(jìn)行優(yōu)化操作,即使有校正程序存在的情況下,GA 的每次平行操作往往輸入變量具有相似性但不完全相同,因此,本文作者采用平行運行10次GA 操作(遺傳代數(shù)為100代,種群規(guī)模為20,變異率為1,交叉率為0.3,懲罰因子為0.1).在單次的GA 操作中,最后一代群體中的變量被記錄下來,對這些變量在所有GA 操作中出現(xiàn)的概率進(jìn)行統(tǒng)計,概率大小依次排列,逐一增加輸入變量,最終將所有變量均加入變量集,根據(jù)預(yù)測誤差大小,選出合適的輸入變量.預(yù)測誤差最小所對應(yīng)的變量為最佳輸入變量,本文將“去-交叉校驗法”用于檢驗網(wǎng)絡(luò)模型的預(yù)測能力.“去-交叉校驗法”是將數(shù)據(jù)集中的任意1個樣本剔除,剔除的樣本作為未知樣本對訓(xùn)練好的模型進(jìn)行測試,最后使得每一個樣本均作為一次未知樣本對訓(xùn)練好的模型進(jìn)行測試,根據(jù)預(yù)測結(jié)果對模型進(jìn)行評估,將采集的30個5組分樣本的譜圖數(shù)據(jù)(81個)平行進(jìn)行10次GA 操作后,變量選取概率如圖2所示.不同輸入變量所對應(yīng)的預(yù)測誤差如圖3所示,選取41個輸入變量時RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差最小,即選取概率從50%~100%的所有變量最合適.對樣品分析的預(yù)測誤差和標(biāo)準(zhǔn)偏差在表1中均被列出.
圖2 5組分?jǐn)?shù)據(jù)點被遺傳算法選擇的概率Fig.2 Frequency of the data points of five component being selected by genetic input selection
圖3 優(yōu)化選取輸入變量對應(yīng)的預(yù)測誤差Fig.3 Optimization of the input variable corresponding to the prediction errow
表1 徑向基函數(shù)的預(yù)測誤差和標(biāo)準(zhǔn)偏差Tab.1 Result of prediction errors and standard deviation of RBF NN
將毛細(xì)管電泳-遺傳算法優(yōu)化輸入變量下的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)方法用于同時檢測水中5組分鄰、間、對苯二酚、苯酚和對硝基苯酚,可有效解決由毛細(xì)管電泳對苯二酚、苯酚和對硝基苯酚5組分的分離不理想,給定量檢測帶來的困難.本文建立了水樣中苯二酚、苯酚、對硝基苯酚5組分的同時測定的新方法,具有較高的檢測靈敏度和精密度,可有效地同時檢測水樣中多種苯的衍生物.
[1] CUI Hua,HE Caixia,ZHAO Guiwen.Determination of polyphe-nols by high-performance liquid chromatography with inhibited chemiluminescence detection[J].Chromatogr A,1999,855:171-179.
[2] MOLDOVEANU S C,KISER M.Gas chromatography/mass spectrometry versus liquid chromatography/fluorescence detection in the analysis of phenols in mainstream cigarette smoke[J].Journal of Chromatography A,1141:90-97.
[3] 黃少鵬,徐金瑞,王瓊.薄層色譜法同時測定鄰苯二酚、間苯二酚和對苯二酚異構(gòu)體[J].分析化學(xué),1999,27(3):331-333.HUANG Shaopeng,XU Jinrui,WANG Qiong.Simultaneous determination of o-,m- ,p-dihydroxybenzene isomer by thin-layer chromatography[J].Chinese Journal of Analytical Chemistry,1999,27(3):331-333.
[4] 耿玉珍,劉葵,劉連偉.吸光度比值導(dǎo)數(shù)法同時測定苯酚、鄰苯二酚和對苯二酚[J].分析化學(xué),1997,25(9):1024-1210.GENG Yuzhen,LIU Kui,LIU Lianwei.Simultaneous determination of phenol,catechol and hydroquinone by absorbance ratio derivative method[J].Chinese Journal of Analytical,1997,25(9):1024-1210.
[5] LI Shifeng,LI Xiangzhi,XU Jing,et al.Flow-injection chemiluminescence determination of polyphenols using luminol-NaIO4-gold nanoparticles system[J].Talanta,2008,75:32-37.
[6] SUN Yugang,CUI Hua,LI Yinghui,et al.Determination of some catechol derivatives by a flow injection electrochemiluminescent inhibition method[J].Talanta,2000,53:661-666.
[7] PISTONESI M F,DINEZIO M S,CENTURION M E,et al.Determination of phenol,resorcinol and hydroquinone in air samples by synchronous fluorescence using partial least-squares(PLS)[J].Talanta,2006,69(5):1265-1268.
[8] 陳義.毛細(xì)管電泳技術(shù)及應(yīng)用[M].北京:化學(xué)工業(yè)出版社,2000.
[9] ZHANG Yaxiong,LI Hua,HOU Aixia,et al.Artificial neural networks based on genetic input selection for quantification in overlapped capillary electrophoresis peaks[J].Talanta,2005,65:118-128.
[10] 張裕平,熊輝,袁倬斌.硝基苯類化合物的高效毛細(xì)管電泳的分離測定[J].分析化學(xué),2001,29(12):1481.ZHANG Yuping,XIONG Hui,YUAN Yibin.Determination of nitrobenzene compounds by high performance capillary electrophoresis[J].Chinese Journal of Analytical,2001,29(12):1481.
[11] 劉學(xué)良,王進(jìn)防,王俊德,等.毛細(xì)管區(qū)帶電泳法快速分離硝基酚和除草劑[J],色譜,2001,19(2):173-175.LIU Xueliang,WANG Jinfang,WANG Junde,et al.Sensitive and rapid analysis of nitrophenols and herbicides by capillary zone electrophoresis(CZE)[J].Chinese Journal of Chromatography,2001,19(2):173-175.
[12] 劉學(xué)良,王進(jìn)防,王俊德,等.毛細(xì)管電泳中獲得穩(wěn)定電滲流的毛細(xì)管預(yù)處理方法[J].分析化學(xué),2000,28(9):1110-1113.LIU Xueliang,WANG Jinfang,WANG Junde,et al.A Procedure for obtaining reproducible results in capillary electrophoresis[J].Chinese Journal of Analytical,2000,28(9):1110-1113.
[13] SHAO Xueguang,CHEN Zonghai,LIN Xiangqin.Resolution of multicomponent overlapping chromatogram using an immune algorithm and genetic algorithm[J].Chemometricsand Intelligent Laboratory Systems,2000,50:91-99.
[14] ARCOS M J,ORTIZ M C,VILLAHOZ B A,et al.Genetic-algorithm-based wavelength selection in multicomponent spectrometric determinations by PLS:application on indomethacin and acemethacin mixture[J].Anal Chim Acta,1997,339:63-77.
[15] DAVID V,SANCHEZ A.Searching for a solution to the automatic RBF network design problem[J].Neurocomputing,2002,421(4):147-170.
[16] SEASHOLTZ M B,KOWALSKI B R.The parsimony principle applied to multivariate calibration[J].Anal Chim,Acta,1993,277:165-177.
[17] LIVINGSTONE D J,MANALLACK D T.Statistics using neural networks:chance effects[J].Med Chem,1993,36:1295-1297.
[18] BROADHURST D,ROWLAND J J,KELL D B.Genetic algorithms as a method for variable selection in multiple linear regression and partial least squares regression,with applications to pyrolysis mass spectrometry[J].Anal Chim Acta,1997,348:71-86.