曹瑤瑤,李 霞,白軍朋,徐 蔚,倪 盈,董 創(chuàng),仲紅麗,李 斌*
1.天津理工大學(xué)機械工程學(xué)院,天津 300384 2.北京農(nóng)業(yè)智能裝備技術(shù)研究中心,北京 100097 3.北京市可持續(xù)發(fā)展科技促進中心,北京 100101 4.國家農(nóng)業(yè)智能裝備工程技術(shù)研究中心,北京 100097 5.山東省菏澤市巨野縣林業(yè)局,山東 菏澤 274000
培氟沙星(Pefloxacin)、氟羅沙星(Fleroxacin)是兩種常用的喹諾酮類抗生素,因為殺菌性強、高效快速,被廣泛應(yīng)用于家禽家畜,預(yù)防疾病和促進動物生長[1-2]。然而,過量使用抗生素使得動物體內(nèi)抗生素含量超標(biāo),進而通過食物鏈進入到人的體內(nèi),引起耐藥性,影響人體健康。國家農(nóng)業(yè)部2015年第2292號公告規(guī)定在動物食品中禁止使用培氟沙星等抗生素[3]。因此,對這兩種抗生素殘留進行有效監(jiān)控非常重要。農(nóng)業(yè)部2349號公告規(guī)定飼料中喹諾酮類抗生素的標(biāo)準(zhǔn)檢測方法為液相色譜串聯(lián)質(zhì)譜法[4]。常用的抗生素檢測方法還有高效液相色譜法、免疫化學(xué)法、酶聯(lián)免疫法、毛細管電泳法等[5]。這些方法檢測精度較高,但需要專業(yè)人員進行操作,且需要復(fù)雜的預(yù)處理??焖佟⒏咝У臋z測方法成為一種需求。
太赫茲波是指頻率范圍為0.1~10 THz,波長為0.03~3 mm的電磁波,介于微波與紅外波之間,能夠穿透大分子物質(zhì),得到其物理和化學(xué)信息[6]。相關(guān)研究人員利用太赫茲技術(shù)對不同的抗生素進行了研究。徐賢海、朱思原、戴浩等[7-9]先后對β-內(nèi)酞胺類抗生素進行了檢測,結(jié)果顯示β-內(nèi)酞胺類抗生素在太赫茲波段存在特征吸收峰。有報道對14種頭孢類抗生素進行了研究,其中8種存在吸收峰,其余6種可以通過折射率將它們區(qū)分出來。Albert Redo-Sanchez和Qin等[10-11]對四環(huán)素和人工合成抗生素進行研究,發(fā)現(xiàn)與不同基質(zhì)混合后,仍然可以檢測到抗生素。Long等[12]利用太赫茲技術(shù)對魚粉中的諾氟沙星、恩諾沙星、氧氟沙星進行了定性定量分析,其中氧氟沙星的最優(yōu)相關(guān)系數(shù)達到0.964。有研究利用太赫茲光譜技術(shù)對高濃度和低濃度的諾氟沙星初步開展了定量分析。在利用太赫茲光譜技術(shù)對培氟沙星和氟羅沙星抗生素進行定性定量研究方面尚未見報道。
為探索上述兩種抗生素的太赫茲波段吸收特性和定性定量檢測方法,本研究選取培氟沙星和氟羅沙星該兩種抗生素為研究對象,利用太赫茲時域光譜(THz-TDS)開展測試研究。研究實驗流程如圖1所示,包括:(1)制備培氟沙星、氟羅沙星、聚乙烯(PE)、魚粉純凈物以及培氟沙星-魚粉、氟羅沙星-魚粉17種不同濃度二元混合物的壓片樣品;(2)得到所有樣品的太赫茲光譜數(shù)據(jù),并分析其太赫茲光譜特性;(3)利用連續(xù)投影算法(successive projections algorithm,SPA)選取特征頻率,基于特征頻率處的吸收系數(shù)建立支持向量機(support vector machine,SVM)和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)分類判別模型,選出分類結(jié)果最優(yōu)模型;(4)利用特征頻率處吸收系數(shù)建立偏最小二乘回歸(partial least squares regression,PLSR)、BPNN和多元線性回歸(multiple linear regression,MLR)定量回歸模型,通過比較幾種模型的預(yù)測結(jié)果,選出最佳預(yù)測模型。
圖1 實驗流程圖
使用太赫茲時域光譜儀(TERA K15,德國Menlo System公司)進行光譜測量,飛秒激光中心波長為1 550 nm,重復(fù)頻率為100 MHZ,脈寬小于90 fs;使用手動壓片機(Specac GS15011,英國)壓片;使用精密電子天平(FA2004N,上海菁海儀器有限公司)稱量。
培氟沙星(CAS: 149676-40-4,純度為99%)和氟羅沙星(CAS: 79660-72-3,純度為98%)由上海麥克林生化科技有限公司購買;魚粉由當(dāng)?shù)爻匈徺I,經(jīng)檢測無抗生素殘留;聚乙烯粉末(CAS 9002-88-4,粒度40~48 μm)由西格瑪-奧爾德里奇公司購買。
樣品制備流程為:(1)研磨:將粉末樣品置于瑪瑙研缽中充分研磨;(2)稱量:使用精密電子天平按照不同濃度依次稱量樣品,每個壓片質(zhì)量約200 mg,并將混合物攪拌均勻;(3)制片:在3.5 t外力,3 min固片條件下,運用壓片機依次制備壓片,壓片直徑為13 mm,厚度為1~2 mm。樣品制備信息如表1所示。
表1 實驗樣品制備信息
測量實驗在透射模式下進行,同時充入氮氣進行干燥,使測試環(huán)境相對濕度低于3%,排除空氣中水分影響。每個樣品在不同部位重復(fù)測量3次。運用自帶軟件TeraMat_v10.vi計算頻譜和吸收系數(shù)。
利用多項式平滑(Savitzky-Golay,SG)算法對原始數(shù)據(jù)進行預(yù)處理,選擇平滑窗口寬度為5,多項式次數(shù)為2。利用連續(xù)投影算法(successive projections algorithm,SPA)來選取特征頻率以減少冗余信息。
支持向量機(SVM)是一種適合于非線性、小樣本的分類算法,其分類原理是找到一個超平面使得其兩側(cè)樣本距離最大。反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)不僅可以實現(xiàn)分類,還可以進行回歸分析,其輸出結(jié)果前向傳播,誤差采用反向傳播。偏最小二乘回歸(PLSR)是一種常用回歸方法,可以較好地解決自變量存在的嚴(yán)重多重相關(guān)性問題[13]。多元線性回歸(MLR)算法能線性表示輸入變量與輸出變量的關(guān)系,是最常用的多變量回歸方法。
在定性判別模型中,利用準(zhǔn)確率、精確率、召回率、F1得分來對模型進行評價[14],這些指標(biāo)越接近1,模型分類結(jié)果越好;在定量回歸模型中,采用校正集相關(guān)系數(shù)(Rc)、校正集均方根誤差(RMSEC)、預(yù)測集相關(guān)系數(shù)(Rp)、預(yù)測集均方根誤差(RMSEP)對結(jié)果進行評價,其中,相關(guān)系數(shù)越接近1,模型預(yù)測性能越好,均方根誤差越接近0,模型越穩(wěn)定[15]。
本研究中數(shù)據(jù)預(yù)處理、降維、繪圖與建模均在Matlab2016a和Origin2017軟件中完成。
各一元純凈物質(zhì)的太赫茲時域譜如圖2(a)所示,可以看出,聚乙烯和參考信號的幅值基本相同,說明聚乙烯對太赫茲波無吸收,但在時間上較參考信號呈現(xiàn)延遲;魚粉、培氟沙星、氟羅沙星的太赫茲時域信號不僅在時間上較參考信號發(fā)生延遲,能量也發(fā)生了嚴(yán)重的衰減;四種物質(zhì)的幅值由大到小依次是聚乙烯、氟羅沙星、魚粉、培氟沙星,表明它們對太赫茲的吸收依次減小。各純凈物質(zhì)頻域譜如圖2(b)所示,選取0.2~1.5 THz的有效數(shù)據(jù)進行后續(xù)分析??梢钥闯?,各樣品的幅值由大到小依次是聚乙烯、氟羅沙星、魚粉、培氟沙星,說明對太赫茲的吸收依次減小,這與時域數(shù)據(jù)的分析結(jié)果一致。各純凈物質(zhì)吸收系數(shù)曲線如圖2(c)所示,可以發(fā)現(xiàn)聚乙烯的吸收系數(shù)趨向于零,與已有報道一致[6];培氟沙星在0.775和0.988 THz處有明顯吸收峰,其中0.775 THz處的吸收峰更強;氟羅沙星在0.919和1.088 THz有明顯吸收峰,其中1.088 THz處的吸收峰更強;魚粉對太赫茲沒有吸收峰,但隨著頻率增大,其吸收系數(shù)增大。
圖2 純凈物質(zhì)的太赫茲光譜信息
2.2.1 混合物的吸收系數(shù)譜分析
為進一步研究二元混合物的吸收特性,分別將培氟沙星-魚粉、氟羅沙星-魚粉混合物中每個濃度的光譜數(shù)據(jù)求平均值,并利用SG對數(shù)據(jù)進行平滑。圖3(a)和(b)分別為培氟沙星-魚粉和氟羅沙星-魚粉的吸收系數(shù)曲線,由圖可知,兩種抗生素與魚粉混合后吸收峰仍然存在,培氟沙星-魚粉的吸收系數(shù)曲線峰值在0.775和0.988 THz附近,氟羅沙星-魚粉的吸收系數(shù)曲線峰值在0.919和1.088 THz附近;當(dāng)頻率大于1.3 THz時,兩種混合物的光譜信號不穩(wěn)定,信噪比較低;當(dāng)濃度為3%和5%時,抗生素含量太少峰值被湮沒,無明顯吸收峰;整體上隨著濃度的減少,吸收峰的幅值發(fā)生規(guī)律的衰減,說明適合進一步開展定性定量研究。
圖3 二元混合物吸收系數(shù)譜
2.2.2 SPA特征頻率選擇
為進行定性定量建模研究,首先利用SPA算法對高維數(shù)據(jù)進行降維。在定性分類中,將兩種混合物的吸收系數(shù)作為輸入,類別標(biāo)簽作為輸出,選取特征頻率;定量分析中,將每一種類的吸收系數(shù)作為輸入,濃度作為輸出,選取特征頻率。定性分類中,選取的特征頻率為0.206,0.775,1.069和1.50 THz。定量分析中,培氟沙星-魚粉選出的特征頻率為0.775,1.275和1.144 THz,氟羅沙星-魚粉選出的特征頻率為1.069,0.988,1.231,1.269和1.50 THz。
2.2.3 定性判別建模結(jié)果分析
利用特征頻率處的光譜數(shù)據(jù)建立SVM和BPNN分類判別模型。每個樣本3次測量的數(shù)據(jù)都進行建模,一共306個數(shù)據(jù),按照2∶1隨機劃分為校正集和預(yù)測集,每類樣本中校正集為102個不同濃度的混合物,預(yù)測集為51個不同濃度的混合物。圖4(a)和(b)分別為SVM和BPNN模型預(yù)測集判別結(jié)果,可以看出,在SVM模型中,有3個培氟沙星-魚粉被誤分為氟羅沙星-魚粉,氟羅沙星-魚粉全部判別正確。而在BPNN模型中,每種混合物都有兩個被誤分。表2為兩種模型的評價指標(biāo),其中精確率和召回率是兩種物質(zhì)的平均值。由表2可得,SPA-SVM的準(zhǔn)確率為97.06%,精確率為97.22%,召回率為97.06%,F(xiàn)1得分為97.06%。SPA-BPNN的準(zhǔn)確率、精確率、召回率、F1得分均為96.08%。顯然,SVM模型的判別結(jié)果更好,同時也說明SVM對于小樣本的分類具有優(yōu)勢。
圖4 定性判別結(jié)果
表2 定性判別結(jié)果評價指標(biāo)
2.2.4 定量回歸建模結(jié)果分析
建立全譜-PLSR,SPA-BPNN,SPA-MLR定量回歸模型,校正集與預(yù)測集比為2∶1,每類樣本中校正集個數(shù)為34,預(yù)測集個數(shù)為17,校正集和預(yù)測集隨機進行劃分。在PLSR模型中,主因子數(shù)設(shè)置為2。BPNN模型中,學(xué)習(xí)率設(shè)置為0.1,進行200次迭代訓(xùn)練。表3為二元混合物定量檢測結(jié)果,可以看出,SPA-BPNN模型對培氟沙星-魚粉預(yù)測結(jié)果最好,Rc,RMSEC,Rp和RMSEP分別為0.994 9,0.001 6,0.984 9和0.009 5。SPA-MLR模型對氟羅沙星-魚粉預(yù)測結(jié)果最好,Rc,RMSEC,Rp和RMSEP分別為0.990 1,0.034 9,0.982 7和0.040 6。圖5(a,b)分別為最佳預(yù)測模型的實際濃度與預(yù)測濃度的散點圖,由圖可知,校正集和預(yù)測集的濃度均勻分散在直線y=x的兩側(cè),說明預(yù)測效果較好。
表3 二元混合物定量檢測結(jié)果
圖5 最佳預(yù)測模型測量與預(yù)測濃度散點圖
應(yīng)用THz-TDS技術(shù)對魚粉基質(zhì)中培氟沙星、氟羅沙星這兩類典型喹諾酮類抗生素進行定性定量分析研究。實驗采集了培氟沙星、氟羅沙星、聚乙烯、魚粉純凈物質(zhì)以及培氟沙星-魚粉、氟羅沙星-魚粉17種不同濃度混合物的太赫茲光譜數(shù)據(jù)。首先對所有壓片樣品太赫茲光譜特性進行研究分析,結(jié)果發(fā)現(xiàn),培氟沙星對太赫茲的吸收峰為0.775和0.988 THz,氟羅沙星對太赫茲的吸收峰為0.919和1.088 THz,聚乙烯對太赫茲的吸收接近于零,魚粉對太赫茲無吸收峰,兩種抗生素與魚粉混合后吸收峰仍然存在。接著對魚粉中的抗生素進行了定性定量分析,數(shù)據(jù)選取范圍為0.2~1.5 THz,建模之前利用SPA進行降維選取特征頻率。在建立的SVM和BPNN分類判別模型中,SVM模型判別結(jié)果更好,預(yù)測集判別準(zhǔn)確率、精確率、召回率、F1得分分別為97.06%,97.22%,97.06%和97.06%;在建立的全譜-PLSR,SPA-BPNN和SPA-MLR定量回歸模型中,幾種建模方法的預(yù)測結(jié)果都較好,預(yù)測集相關(guān)系數(shù)均在0.95以上,其中,培氟沙星-魚粉的最佳預(yù)測模型為SPA-BPNN,Rp為0.984 9,RMSEP為0.009 5,氟羅沙星-魚粉的最佳預(yù)測模型為SPA-MLR,Rp為0.982 7,RMSEP為0.040 6。研究表明利用THz-TDS技術(shù)結(jié)合化學(xué)計量學(xué)方法對喹諾酮類抗生素培氟沙星和氟羅沙星進行定性定量檢測是可行的,為利用太赫茲技術(shù)實際檢測飼料中的這兩種抗生素提供理論和技術(shù)參考。