邱麗媛,梁澤華,吳鑫雨,潘穎潔,方劍文
·藥劑與工藝·
基于模式識別和遺傳神經(jīng)網(wǎng)絡(luò)算法的醋香附近紅外光譜等級評價和含量預(yù)測模型研究
邱麗媛,梁澤華#*,吳鑫雨,潘穎潔,方劍文
浙江中醫(yī)藥大學(xué)藥學(xué)院,浙江 杭州 311400
基于近紅外光譜(near infrared spectrum,NIRS)技術(shù)建立一種能快速準(zhǔn)確識別醋香附飲片等級并預(yù)測其揮發(fā)油中α-香附酮、香附烯酮含量的質(zhì)量評價模型,為其他中藥材或中藥飲片的質(zhì)量評價提供參考。采集醋香附的NIRS信息,并建立39批醋香附揮發(fā)油氣相色譜-質(zhì)譜聯(lián)用(GC-MS)指紋圖譜,對揮發(fā)油中的α-香附酮、香附烯酮進(jìn)行定量,采用相似度分析、多元統(tǒng)計分析、主成分分析(principal component analysis,PCA)、聚類分析、偏最小二乘-判別分析(partial least squares-discriminant analysis,PLS-DA)、Logistic回歸分析等方法處理數(shù)據(jù),劃分等級;利用遺傳神經(jīng)網(wǎng)絡(luò)算法(GA-BPNN)將等級劃分結(jié)果、α-香附酮含量、香附烯酮含量分別與NIRS信息進(jìn)行擬合,建立等級預(yù)測模型和含量預(yù)測模型。根據(jù)主成分聚類分析法可以將醋香附劃分為3個等級,其中一等品6批,二等品8批,三等品25批,PLS-DA分析結(jié)果與主成分聚類分析結(jié)果一致。采用多元Logistic回歸分析建立了飲片等級分類經(jīng)驗公式一等=exp(1)/[1+exp(1)]、二等=exp(2)/[1+exp(2)]、三等=1-二等,等級預(yù)測結(jié)果和主成分聚類分析結(jié)果一致。利用GA-BPNN建立的醋香附飲片等級預(yù)測模型預(yù)測準(zhǔn)確率達(dá)89.74%,模型準(zhǔn)確性較好;α-香附酮、香附烯酮回歸模型預(yù)測集決定系數(shù)分別為0.992 3、 0.969 7,能很好地預(yù)測醋香附揮發(fā)油中α-香附酮、香附烯酮含量。采用GA-BPNN所建立的基于近紅外技術(shù)的醋香附飲片等級評價模型能快速準(zhǔn)確地預(yù)測醋香附飲片等級,為醋香附及其他中藥材或中藥飲片質(zhì)量標(biāo)準(zhǔn)的制定和等級評價模型的研究提供了參考。
醋香附;揮發(fā)油;等級評價;氣相色譜-質(zhì)譜聯(lián)用;近紅外光譜;模式識別;遺傳神經(jīng)網(wǎng)絡(luò)算法;α-香附酮;香附烯酮;質(zhì)量評價;相似度分析;多元統(tǒng)計分析;主成分分析;聚類分析;偏最小二乘-判別分析;Logistic回歸分析
香附為莎草科植物莎草L.的干燥根莖,又稱莎草、香附子、雷公頭,味辛、微苦、微甘,性平,歸肝、脾、三焦經(jīng),始載于《名醫(yī)別錄》[1],素有“氣病之總司,女科之主帥”之譽。香附一般醋炙后入藥,臨床上常被用于治療肝氣郁滯所引起的胸脅脹悶疼痛、疝氣腹痛,還可用于治療月經(jīng)不調(diào)、經(jīng)行腹痛以及經(jīng)前乳房脹痛等癥[2],是理氣開郁要藥。香附的化學(xué)成分復(fù)雜,藥理活性廣泛,其主要有效成分是揮發(fā)油,另外還包括黃酮類、生物堿類、糖類、三萜類與甾醇類、蒽醌類等多種化合物[3]。香附主要產(chǎn)于長江、黃河中下游地區(qū),以山東泰安為道地產(chǎn)區(qū)。由于各地的生態(tài)環(huán)境、栽培條件、采收加工方式、炮制工藝等的不同導(dǎo)致市場上醋香附飲片的質(zhì)量差異較大?!吨袊幍洹?020年版規(guī)定醋香附揮發(fā)油不得少于0.8%[2],僅根據(jù)揮發(fā)油含量單一指標(biāo)無法全面、準(zhǔn)確地反映醋香附飲片的質(zhì)量等級和優(yōu)劣,且目前尚無統(tǒng)一的等級評價標(biāo)準(zhǔn),難以劃分醋香附質(zhì)量等級。因此,開展醋香附飲片等級評價標(biāo)準(zhǔn)研究,對規(guī)范醋香附的標(biāo)準(zhǔn)化生產(chǎn)和市場流通具有重要意義。
傳統(tǒng)性狀鑒別存在模糊性、不確定性等缺點,所以香附及其炮制品的現(xiàn)代質(zhì)量評價多以總揮發(fā)油、總黃酮含量,有效成分α-香附酮、香附烯酮、圓柚酮、馬兜鈴?fù)?-羥甲基糠醛(5-hydroxymethyl- furfural,5-HMF)含量等作為質(zhì)量評價指標(biāo)[4-9]。α-香附酮和香附烯酮是香附發(fā)揮抗炎鎮(zhèn)痛作用的主要物質(zhì)基礎(chǔ),且在香附中含量較高。香附醋炙后α-香附酮含量明顯升高,這和醋炙后鎮(zhèn)痛活性增強(qiáng)存在一定聯(lián)系[10-11],且香附烯酮、α-香附酮和sugeonol三者之間具有明顯的協(xié)同作用[12],推測香附烯酮和α-香附酮達(dá)到一定配比時其抗炎鎮(zhèn)痛活性可能最佳,故本研究主要選取這2個成分進(jìn)行定量分析。揮發(fā)油作為香附的主要有效成分,具有抗抑郁、促進(jìn)胃腸動力、抗炎鎮(zhèn)痛、抑制血小板凝集等多種作用[13-15],有較大的制劑研發(fā)前景和價值,如香附油滴丸[16]、揮發(fā)油β-環(huán)糊精包合物[17]等。所以本實驗最終選擇總揮發(fā)油含量、香附烯酮含量、α-香附酮含量作為主要含量指控指標(biāo)進(jìn)行研究。
近紅外光譜(near infrared spectrum,NIRS)技術(shù)具有快速、準(zhǔn)確、便捷、樣品前處理簡單等優(yōu)點,目前已被廣泛應(yīng)用于食品、藥品、石油、煙草等領(lǐng)域的質(zhì)量檢測中[18-20]。但NIRS數(shù)據(jù)變量多、噪聲大,采用傳統(tǒng)NIRS定性定量建模方法,如馬氏距離、歐氏距離、偏最小二乘(partial least square method,PLS)、主成分回歸(principal component regression,PCR)、逐步多元線性回歸(stepwise multiple linear regression,LMR)等,有時建模結(jié)果并不理想[21-22]。
人工神經(jīng)網(wǎng)絡(luò)(artificial netural network,ANN)是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型,具有強(qiáng)大的抗干擾、抗噪聲能力。反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation netural network,BPNN)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),具有任意復(fù)雜的模式分類能力和優(yōu)良的非線性映射能力,是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)算法之一,在工藝優(yōu)化、中藥藥效預(yù)測、生物藥劑學(xué)等方面有較多應(yīng)用[23],但其算法易陷入局部極小值。
遺傳算法(genetic algorithm,GA)是模擬生物在自然環(huán)境中的遺傳和進(jìn)化過程而形成的一種自適應(yīng)全局優(yōu)化概率搜索算法,GA和BPNN神經(jīng)網(wǎng)絡(luò)的有效結(jié)合可以解決BPNN算法固有缺陷,如收斂速度慢、易陷入局部極小等。本研究主要利用GA優(yōu)化BPNN神經(jīng)網(wǎng)絡(luò)的初始權(quán)重和偏置,采用化學(xué)計量學(xué)、遺傳-神經(jīng)網(wǎng)絡(luò)算法(GA-BPNN)等數(shù)據(jù)分析方法,建立融合NIRS信息的醋香附等級快速評價模型及α-香附酮、香附烯酮含量預(yù)測模型,為醋香附飲片質(zhì)量等級評價標(biāo)準(zhǔn)的制定和等級評價模型的研究提供了新的思路。
Agilent 7890B-5977A氣相色譜-質(zhì)譜聯(lián)用儀,美國Agilent公司;XS105DU型十萬分之一電子天平,瑞士梅特勒-托利多儀器有限公司;JA1003B型千分之一電子天平,上海越平科學(xué)儀器制造有限公司;150T型多功能粉碎機(jī),永康市鉑歐五金制品有限公司;ANTARISII型傅立葉變換近紅外分析儀,美國Thermo scientific公司;Vent Filter MPK01純水系統(tǒng),美國Millipore公司。
高純氦氣(≥99.999%)、色譜級甲醇,美國天地公司;無水硫酸鈉,批號Z17A10Y95555,上海源葉生物科技有限公司;α-香附酮對照品,質(zhì)量分?jǐn)?shù)98%,批號PS010758,成都普思生物科技股份有限公司;香附烯酮對照品,批號RFS-X06911803028,質(zhì)量分?jǐn)?shù)96%,成都瑞芬思生物科技有限公司;水為純水。醋香附樣品購于不同飲片生產(chǎn)廠家,基原植物經(jīng)浙江中醫(yī)藥大學(xué)黃真教授鑒定為莎草科莎草屬植物莎草L.的干燥根莖,具體樣品信息見表1。
2.1.1 GC-MS定性條件 Agilent HPM-5柱(30 m×250 μm×0.25 μm),進(jìn)樣口溫度250 ℃,分流比為20∶1,初始溫度100 ℃,保持1 min,以 5 ℃/min速率升溫至132.5 ℃,以0.1 ℃/min速率升溫至132.8 ℃,保持2 min,以0.1 ℃/min速率升溫至133.4 ℃,保持2 min,以0.2 ℃/min速率升溫至134.3 ℃,保持5 min,以0.2 ℃/min速率升溫至134.7 ℃,保持1 min,以20 ℃/min速率升溫至260 ℃,保持10 min,載氣為高純氦氣(≥99.999%),體積流量1.0 mL/min,進(jìn)樣量1 μL。質(zhì)譜條件為EI源,轟擊電壓70 eV,正離子模式,離子源溫度230 ℃,四級桿溫度150 ℃,采用全掃描模式獲得醋香附樣品總離子流色譜圖,見圖1。色譜圖經(jīng)質(zhì)譜檢索標(biāo)準(zhǔn)庫NIST14.L匹配,結(jié)果見表2。
表1 醋香附樣品采集信息
2.1.2 GC-MS定量條件 色譜條件同“2.1.1”項下內(nèi)容,質(zhì)譜條件為EI源,轟擊電壓70 eV,正離子模式,離子源溫度230 ℃,四級桿溫度150 ℃,采用離子檢測模式(SIM)定量,選擇/:91.1、133.1、147.1、175.1、218.2;91.0、147.1、161.1、175.1、218.2分別為香附烯酮、α-香附酮的檢測離子。
2.2.1 混合對照品儲備液的制備 精密稱取香附烯酮、α-香附酮對照品100、150 mg分別置于1.5 mL棕色進(jìn)樣瓶中,加500 μL甲醇溶解得對照品母液,質(zhì)量濃度分別為200、300 mg/mL。再分別取對照品母液100、50 μL混合于10 mL量瓶,加甲醇定容,混勻,即得混合對照品溶液,香附烯酮、α-香附酮質(zhì)量濃度分別為2、1.5 mg/mL。
圖1 醋香附揮發(fā)油總離子流圖(峰號與表2對應(yīng))
表2 醋香附揮發(fā)油GC-MS分析
2.2.2 供試品溶液的制備 精密稱取醋香附樣品粗粉100.000 g,置2000 mL圓底燒瓶中,加純水1000 mL,按《中國藥典》2020年版揮發(fā)油測定法(通則2204甲法)測定。持續(xù)提取5 h至揮發(fā)油不再增加時讀取提取器刻度。得到的樣品揮發(fā)油用無水硫酸鈉干燥,靜置過夜,精密量取干燥后的揮發(fā)油10 μL于10 mL量瓶中,甲醇定容,混勻,0.22 μm微孔濾膜濾過,即得供試品溶液。
2.3.1 精密度實驗 取醋香附樣品(XDB241)1份,按“2.2.2”項下方法制備供試品溶液,按“2.1.1”項下GC-MS定性條件進(jìn)行分析,連續(xù)進(jìn)樣6次。以共有峰3(該峰響應(yīng)高,穩(wěn)定性較好)為對照峰(S),計算各共有峰的相對保留時間與相對峰面積,RSD均小于1.98%,所得圖譜導(dǎo)入《中藥色譜指紋圖譜相似度評價系統(tǒng)》(2012版)軟件,相似度均在0.998以上,表明儀器的精密度良好。
2.3.2 重復(fù)性實驗 取同一批號(XDB241)醋香附樣品6份,按“2.2.2”項下方法平行制備6份供試品溶液,并按“2.1.1”項下方法進(jìn)行分析,以共有峰3為對照峰,計算各共有峰的相對保留時間與相對峰面積,RSD均小于2.72%,所得圖譜導(dǎo)入《中藥色譜指紋圖譜相似度評價系統(tǒng)》(2012版)軟件,相似度均在0.999以上,表明方法的重復(fù)性良好。
2.3.3 穩(wěn)定性實驗 取同一批號(XDB241)醋香附樣品1份,按“2.2.2”項下方法制備供試品溶液,按“2.1.1”項下GC-MS定性條件,分別在0、2、4、8、12、24 h進(jìn)樣分析,以共有峰3為對照峰,計算各共有峰的相對保留時間與相對峰面積,RSD均小于3.12%,所得圖譜導(dǎo)入《中藥色譜指紋圖譜相似度評價系統(tǒng)》(2012版)軟件,相似度均在0.987以上,表明供試品溶液在24 h內(nèi)穩(wěn)定性良好。
2.3.4 醋香附揮發(fā)油指紋圖譜的建立 分別將各批次醋香附揮發(fā)油GC-MS指紋圖譜導(dǎo)入《中藥色譜指紋圖譜相似度評價系統(tǒng)》(2012版)軟件進(jìn)行分析,設(shè)置S1為參照圖譜,采用中位數(shù)法,時間窗寬度為0.1 s,經(jīng)多點校正和色譜峰匹配,生成了醋香附揮發(fā)油對照指紋圖譜(R)及各批次藥材疊加指紋圖譜,見圖2、3。計算各批次醋香附藥材指紋圖譜與對照指紋圖譜的相似度,結(jié)果見表3。如表2所示,經(jīng)NIST14.L標(biāo)準(zhǔn)譜庫的匹配和相關(guān)文獻(xiàn)研究,選擇80%以上匹配度的成分進(jìn)行指認(rèn)歸屬,從醋香附揮發(fā)油中共鑒定出21種成分,主要為倍半萜類及其氧化物。指紋圖譜共確定了8個共有峰,根據(jù)GC-MS定性分析結(jié)果,分別為(3a,4,7)-1,4,9, 9-tetramethyl-5,6,7,8-tetrahydro-4-3a,7-methanoazulene(1號峰);1,1,7,7a-tetramethyl-1a,2,6,7,7a,7b- hexahydro-1-cyclopropa[a]naphthalene(2號峰);3-3a,7-methanoazulene,2,4,5,6,7,8-hexahydro-1,4,9,9-tetramethyl-,(3a,4,7)-(3號峰);1,4,6-trimethyl- 1,2,3,3a,4,7,8,8a-octahydro-4,7-ethanoazulene(4號峰);isospathuleno(5號峰);isolongifolen-5-one(6號峰);longiverbenone(7號峰);(3a,4,7)-1,4, 9,9-tetramethyl-3,4,5,6,7,8-hexahydro-2-3a,7-methanoazulen-2-one(8號峰)。
圖2 39批醋香附揮發(fā)油對照指紋圖譜
2.3.5 指紋圖譜相似度分析 以39批醋香附生成的共有模式作為對照指紋圖譜進(jìn)行相似度分析,結(jié)果39批醋香附相似度在0.694~0.990,除了S12樣品的相似度為0.694外,其余批次相似度均在0.8以上,表明不同批次醋香附藥材整體化學(xué)組分類似,樣品質(zhì)量穩(wěn)定性較好。S12樣品相似度較低可能和其炮制工藝、貯藏時間及采收加工中的人為因素有關(guān)。僅根據(jù)常用的指紋圖譜相似度分析難以判別醋香附飲片質(zhì)量,需要進(jìn)一步結(jié)合模式識別的方法來判斷醋香附飲片質(zhì)量。
2.4.1 線性關(guān)系及檢測限、定量限的考察 取混合對照品儲備液1000、400、300、100、40、2 μL分別置于2 mL量瓶中,甲醇定容并混勻,即得系列混合對照品溶液。按“2.1”項下色譜條件進(jìn)樣1 μL。基于Agilent MS定量數(shù)據(jù)分析工作站,以溶液質(zhì)量濃度為橫坐標(biāo)(),響應(yīng)值為縱坐標(biāo)(),進(jìn)行線性回歸,得線性回歸方程分別為香附烯酮=407.816 694-9 015.871 699,2=0.999 15;α-香附酮=480.924 413-7 989.664 354,2=0.999 14。結(jié)果表明香附烯酮、α-香附酮的質(zhì)量濃度分別在2~1000、1.5~750 μg/mL與峰面積呈良好的線性關(guān)系。以信噪比(S/N)為3時作為檢測限,S/N為10時作為定量限,香附烯酮的檢測限為1 μg/mL,定量限為1.5 μg/mL;α-香附酮的檢測限為0.75 μg/mL,定量限為1.5 μg/mL。
圖3 39批醋香附揮發(fā)油指紋圖譜疊加圖
2.4.2 精密度考察 取混合對照品溶液,按“2.1”項下定量分析方法連續(xù)進(jìn)樣6次,計算純揮發(fā)油中香附烯酮、α-香附酮峰面積RSD分別為2.05%、0.90%,表明儀器精密度良好。
2.4.3 重復(fù)性考察 精密稱取同一批號(XDB241)樣品粗粉6份,按“2.2.2”項下方法平行制備供試品溶液6份,按“2.1.2”項下方法依次測定,計算純揮發(fā)油中香附烯酮、α-香附酮的平均質(zhì)量濃度分別為519.97、140.80 mg/mL,RSD分別為1.97%、1.74%,表明該方法重復(fù)性良好。
2.4.4 穩(wěn)定性考察 取同一批號(XDB241)供試品溶液,按“2.1.2”項下方法分別在制備后0、2、4、8、12、24 h進(jìn)樣測定,計算純揮發(fā)油中香附烯酮、α-香附酮峰面積RSD分別為1.99%、2.00%,表明供試品溶液在24 h內(nèi)穩(wěn)定。
2.4.5 加樣回收率考察 精密稱取同一批號(XDB241)樣品粗粉100.000 g,分別加入適量香附烯酮、α-香附酮對照品,加入質(zhì)量濃度為0.50、0.15 mg/mL,按“2.2.2”項下方法提取,每份取10 μL置10 mL量瓶中,樣品中香附烯酮、α-香附酮質(zhì)量濃度分別為0.50、0.14 mg/mL,甲醇定容,混勻過0.22 μm微孔濾膜,按“2.1.2”項下色譜條件進(jìn)樣分析,計算香附烯酮、α-香附酮平均加樣回收率分別為98.58%、98.99%,RSD分別為1.76%、1.42%。結(jié)果表明該方法回收率良好,符合含量測定要求。
2.4.6 樣品含量測定 取各批次醋香附揮發(fā)油,按“2.2.2”項下方法制備供試品溶液,再按“2.1.2”項下方法進(jìn)樣3次,分別計算香附烯酮、α-香附酮的含量,結(jié)果見表3。
取醋香附粉末(50~65目)約1.0 g,裝樣厚度為0.4 cm,裝入石英杯,混勻,按以下條件進(jìn)行掃描,采集光譜圖。測樣方式為積分球漫反射,分辨率設(shè)定16 cm?1,掃描數(shù)32次,掃描范圍處于 12 000~4000 cm?1,溫度25~30 ℃,相對濕度25%~35%。每個樣品重復(fù)掃描3次,計算平均光譜,39批醋香附近紅外平均光譜疊加圖譜見圖4。
表3 醋香附各指標(biāo)原始數(shù)據(jù)
圖4 39批醋香附樣品近紅外平均光譜疊加圖
2.6.1 相關(guān)性分析 《中國藥典》2020年版規(guī)定醋香附揮發(fā)油含量不得少于0.008 mL/g,故將其作為主要等級評價指標(biāo)。將揮發(fā)油提取率、指紋圖譜相似度、香附烯酮含量、α-香附酮含量及8個共有峰百分含量(峰面積歸一化值),采用SPSS 25.0軟件進(jìn)行相關(guān)性分析,結(jié)果見表4,結(jié)果發(fā)現(xiàn)各指標(biāo)之間相關(guān)性顯著,可以作為醋香附品質(zhì)評價指標(biāo)。
2.6.2 主成分分析(principal component analysis,PCA) 將測得的12個指標(biāo)經(jīng)Z標(biāo)準(zhǔn)化處理后導(dǎo)入SIMCA 14.1軟件進(jìn)行PCA,得到各主成分的VIP值和方差貢獻(xiàn)率見表5,PCA載荷因子圖見圖5。由表5可知前3個主成分特征值均大于1且累積方差貢獻(xiàn)率為74.80%,表明前3個主成分對原始信息的解釋率較高。由圖5可知在第1主成分上C1~C6、α-香附酮含量這7個指標(biāo)載荷較大,在第2主成分上C7、C8、相似度、香附烯酮含量這4個指標(biāo)載荷較大。
2.6.3 聚類分析 提取前3個主成分,采用Ward法進(jìn)行聚類分析。如圖6所示,聚類分析結(jié)果可分為3類,即編號為S3、S12、S24、S29、S38、S39的樣品聚為一類;編號為S4、S6、S11、S23、S26、S27、S30、S34的樣品聚為一類;其余樣品聚為一類。
表4 醋香附各指標(biāo)相關(guān)性分析
C1~C8分別代表前面39批醋香附指紋圖譜的8個共有峰的相對峰面積;在**<0.01級別,相關(guān)性極顯著;在*<0.05級別,相關(guān)性顯著
C1—C8 represent the relative peak areas of the eight common peaks of the fingerprint of the first 39 batches of;**indicated significant correlation at 0.01 level, and*indicated significant correlation at 0.05 level
表5 PCA特征值及方差貢獻(xiàn)率
圖5 PCA載荷圖
圖6 聚類分析圖
圖7 PLS-DA散點圖
2.6.4 偏最小二乘判別分析(partial least squares- discriminant analysis,PLS-DA) 為了進(jìn)一步驗證聚類結(jié)果的可靠性,采用有監(jiān)督模式的PLS-DA進(jìn)行驗證,如圖7所示,PLS-DA分類結(jié)果和聚類分析結(jié)果一致。由聚類分析結(jié)果可知,浙江、山東產(chǎn)的樣品聚為同一類,而其他產(chǎn)地的樣品在不同類別中都有出現(xiàn),說明浙江、山東這2個產(chǎn)地的醋香附樣品質(zhì)量相對穩(wěn)定,其余產(chǎn)地醋香附樣品質(zhì)量差異較大,且同一類中樣品的離散度較大,這可能與各地氣候環(huán)境、土壤條件等自然因素及采收加工、炮制工藝等人為因素有關(guān)。
2.6.5 多元Logistic回歸模型的建立 多元Logistic回歸模型的建立是為了根據(jù)自變量預(yù)測因變量(經(jīng)驗等級)的概率分布。根據(jù)聚類結(jié)果,對一等、二等、三等不同等級代表樣本分別賦予響應(yīng)值1、2、3。采用Logistic算法建立12個指標(biāo)與響應(yīng)值(等級)之間的函數(shù)關(guān)系,通過SPSS 25.0軟件實現(xiàn)Logistic模型參數(shù)的求解,得到模型表達(dá)式如下。
1=log[一等/三等]=398.401+1 460.4941+2 315.0812-153.6013+340.5324-89.3645+71.1436-90.6477+30.1348+10.3279-0.02810+0.02611-418.23212
2=log[二等/三等]=435.427+951.3121+3250.0202+43.7713-744.7564+634.8795+374.4566+43.7487+184.4718+25.8359-0.00810+0.07111-650.24512
3=0(對照)
一等=exp(1)/[1+exp(1)]
二等=exp(2)/[1+exp(2)]
三等=1-二等
1~12分別代表1~8號共有峰的相對百分含量、揮發(fā)油含量、香附烯酮含量、α-香附烯酮含量、指紋圖譜相似度
將各指標(biāo)實測值代入Logistic模型方程中即可計算樣品屬于各等級的概率,規(guī)定大于0.9即屬于該等級,各批次醋香附等級判斷結(jié)果見表6。Logistic回歸模型對樣品的分級結(jié)果與HCA分類果一致,說明該模型可以較好地反映醋香附飲片質(zhì)量等級。其中一等品的平均α-香附酮含量最高,表面呈深褐色或棕褐色,微有焦斑,質(zhì)地堅硬,斷面無白心,從氣味上也較其他等級樣品具有更明顯的醋香味。三等品中有較多批樣品節(jié)上有未除凈的棕色毛須和須根斷痕,表面呈焦黃色或焦黑色,從外觀性狀上來說較一等品和二等品差。以上分析結(jié)果提示建立的Logistic等級預(yù)測經(jīng)驗公式其預(yù)測結(jié)果符合客觀質(zhì)量等級。
表6 醋香附飲片等級分類結(jié)果
基于“2.6.5”項的預(yù)測結(jié)果,建立近紅外快速等級評價模型,將采集到的NIRS信息通過遺傳神經(jīng)網(wǎng)絡(luò)算法構(gòu)建等級分類模型。如圖8所示,GA-BPNN神經(jīng)網(wǎng)絡(luò)通常由3層組成,即輸入層,隱藏層和輸出層,神經(jīng)元之間的互連模式稱為網(wǎng)絡(luò)結(jié)構(gòu)。將所有向量歸一化至[0,1]以消除量綱影響。通過SPSS 25.0軟件,采用PCA法對NIRS信息進(jìn)行數(shù)據(jù)降維和特征提取,提取前4個主成分時累積方差貢獻(xiàn)率達(dá)99.904%,將這4個主成分作為輸入層數(shù)據(jù)。然后利用遺傳算法(GA)來確定最佳權(quán)重和偏置,即ω和b,激活函數(shù)為Sigmoid和purelin,訓(xùn)練函數(shù)為trainlm,最后輸出得到,即分類結(jié)果。在模型建立過程中首先采用二分類模型法對3個等級的樣品進(jìn)行分類訓(xùn)練,利用Matlab 2019b Neural Network training tool工具包優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)重,其中W1和B1代表輸入層和隱藏層之間的權(quán)重和偏置,W2和B2代表隱藏層和輸出層之間的權(quán)重和偏置,結(jié)果見表7。
圖8 BP神經(jīng)網(wǎng)絡(luò)工作流程
如表8所示,采用準(zhǔn)確度(accuracy)、精確率(precision)、特異性(specificity)、F1綜合評價值、ROC曲線下面積(AUC)這5個指標(biāo)來評估模型效果,綜合比較5個模型性能指標(biāo)最終確定最佳隱藏神經(jīng)元分別為2、3、3。最后采用3分類模型法綜合12、13、23模型對所有數(shù)據(jù)進(jìn)行預(yù)測,如圖9所示,得到3列預(yù)測值,根據(jù)少數(shù)服從多數(shù)的投票法決定最終輸出,錯誤輸出數(shù)有1+2+1=4個,模型預(yù)測準(zhǔn)確率為89.74%。結(jié)果表明利用GA-BPNN法優(yōu)化得到的醋香附飲片質(zhì)量等級快速評價模型預(yù)測準(zhǔn)確性較好。
表7 醋香附飲片GA-BPNN等級預(yù)測模型最佳隱藏神經(jīng)元權(quán)重值
NaN是not a number的縮寫,表示一些特殊數(shù)值(無窮與非數(shù)值),圖9同
NaN is the abbreviation of not a number, which means some special numerical values (infinite and non-numerical), same as Fig. 9
表8 GA-BPNN二分類模型性能指標(biāo)
圖9 三分類模型預(yù)測結(jié)果圖
GA-BPNN含量預(yù)測模型的工作流程同上,NIRS數(shù)據(jù)通過PCA可以達(dá)到降維的目的便于分析,同時采用GA遺傳算法得到最優(yōu)神經(jīng)元訓(xùn)練下的權(quán)重值,可以降低NIRS原始數(shù)據(jù)中的基線漂移、雜峰、噪聲等的影響,利用Matlab2019b Neural Network training tool工具包分別將樣品揮發(fā)油中的香附烯酮和α-香附酮含量與NIRS信息中提取的4個主成分進(jìn)行擬合,隨機(jī)選取其中3個樣品作為驗證集,其余樣品作為訓(xùn)練集。
由表9可知香附烯酮的最佳隱藏神經(jīng)元是4個,α-香附酮的最佳隱藏神經(jīng)元為5個。由表10可知,在最佳隱藏神經(jīng)元個數(shù)的訓(xùn)練下α-香附酮、香附烯酮驗證集決定系數(shù)分別為0.992 3、0.969 7,表明模型預(yù)測準(zhǔn)確率較高。
如圖10、11所示,基于GA-BPNN算法建立的醋香附揮發(fā)油中α-香附酮、香附烯酮含量近紅外預(yù)測模型擬合效果較好,可以為醋香附有效成分α-香附酮和香附烯酮的含量預(yù)測提供一定的參考和應(yīng)用價值。
表9 香附烯酮和α-香附酮GA-BPNN含量預(yù)測模型最佳隱藏神經(jīng)元權(quán)重值
表10 隱藏神經(jīng)元數(shù)量對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的最大絕對誤差、決定系數(shù)和相關(guān)系數(shù)的影響
MAEtrain、MAEtest、2train、2test、train、test分別代表訓(xùn)練集和驗證集的最大絕對誤差、決定系數(shù)和相關(guān)系數(shù)
MAEtrain, MAEtest,2train,2test,trainandtestrepresent the maximum absolute error, determination coefficient and correlation coefficient of the training data and the testing data, respectively
本研究綜合了GC-MS指紋圖譜技術(shù)和NIRS技術(shù)2種全息指紋圖譜,能全面地反映樣品內(nèi)在物質(zhì)整體性變化,體現(xiàn)了醋香附飲片質(zhì)量等級評價研究的全面性和整體性?;趽]發(fā)油GC-MS指紋圖譜相似度、共有峰百分含量、香附烯酮含量、α-香附酮含量、揮發(fā)油含量等多個指標(biāo)進(jìn)行多元統(tǒng)計分析,可將39批醋香附飲片分為3類,并建立了Logistic等級預(yù)測回歸模型,預(yù)測結(jié)果符合客觀質(zhì)量等級。為進(jìn)一步提高模型的預(yù)測效率,采用遺傳神經(jīng)網(wǎng)絡(luò)算法建立了近紅外等級預(yù)測模型和含量預(yù)測模型,可以快速評價醋香附飲片質(zhì)量,為醋香附飲片的質(zhì)量監(jiān)控及質(zhì)量標(biāo)準(zhǔn)的建立提供參考。GA- BPNN等級預(yù)測模型最大的優(yōu)勢是融合了近紅外技術(shù)和指紋圖譜技術(shù),明顯提高了等級預(yù)測的準(zhǔn)確性和可靠性,同時也加快了檢測的速度。GA-BPNN算法可以反映數(shù)據(jù)之間復(fù)雜的非線性關(guān)系,相對于常用的近紅外定性定量分析方法,如PLS、PCR、LMR等具有更強(qiáng)的學(xué)習(xí)率和自適應(yīng)率,模型的穩(wěn)定性和預(yù)測準(zhǔn)確率更好。
圖10 α-香附酮GA-BPNN含量預(yù)測模型
圖11 香附烯酮GA-BPNN含量預(yù)測模型
現(xiàn)代中藥飲片等級評價方法常用質(zhì)量常數(shù)法和相對質(zhì)量常數(shù)法,這2種方法一般適用于飲片外觀性狀較為規(guī)則的飲片,如黨參[24]、丹參[25]、梔子[26]、厚樸[27]等,有時單位質(zhì)量中藥指標(biāo)性成分含量越高不一定代表飲片質(zhì)量越好或等級越高,這就需要尋找中藥質(zhì)量標(biāo)志物(Q-Marker)[28]以反映藥材整體質(zhì)量。針對“Q-Marker-生物活性”的質(zhì)量評價方法,目前已經(jīng)建立了赤芍[29]、紅花[30]、雞血藤[31]等中藥的等級評價模型。
本研究收集的39批不同產(chǎn)地的醋香附飲片,涵蓋了市場上大部分中藥飲片生產(chǎn)廠家,發(fā)現(xiàn)醋香附飲片一般切厚片或者碾碎成顆粒狀,外觀形狀不規(guī)則,因此難以根據(jù)質(zhì)量常數(shù)的方法來進(jìn)行等級評價。醋香附揮發(fā)油成分復(fù)雜,已有研究表明α-香附酮、香附烯酮等成分是其發(fā)揮抗炎鎮(zhèn)痛活性的物質(zhì)基礎(chǔ)之一[32],且這2個成分存在明顯協(xié)同作用,即α-香附酮和香附烯酮達(dá)到一定配比時其抗炎鎮(zhèn)痛活性可能最佳,所以將這2種化合物作為指標(biāo)性成分進(jìn)行定量分析。通過對揮發(fā)油成分的研究,發(fā)現(xiàn)香附子烯在醋香附揮發(fā)油中的相對含量最高,但因為缺乏對照品,難以對其準(zhǔn)確定量,故只能以峰面積百分含量(相對含量)來代替。
為進(jìn)一步優(yōu)化和完善基于機(jī)器學(xué)習(xí)分析技術(shù)的醋香附飲片近紅外快速等級評價模型,后期可擴(kuò)大樣本量,并進(jìn)一步開展不同等級醋香附揮發(fā)油的抗炎鎮(zhèn)痛藥效試驗,建立譜效關(guān)系,以推測其抗炎鎮(zhèn)痛質(zhì)量標(biāo)志物。此外,在今后的研究中也可利用電子鼻、電子舌、電子眼等仿生技術(shù)將傳統(tǒng)性狀指標(biāo)量化,建立基于近紅外、電子眼、電子鼻、電子舌、質(zhì)量標(biāo)志物含量等多種非同源數(shù)據(jù)的融合質(zhì)量評價模型,實現(xiàn)關(guān)聯(lián)“性狀-含量-活性”的全面整體的質(zhì)量評價模型的構(gòu)建。
利益沖突 所有作者均聲明不存在利益沖突
[1] (梁) 陶弘景集尚志鈞輯校. 名醫(yī)別錄 [M]. 北京: 人民衛(wèi)生出版社, 1986: 154.
[2] 中國藥典[S]. 一部. 2020: 270.
[3] 潘少斌, 孔娜, 李靜, 等. 香附化學(xué)成分及藥理作用研究進(jìn)展 [J]. 中國現(xiàn)代中藥, 2019, 21(10): 1429-1434.
[4] 袁芮, 張超, 蘇彤, 等. 香附和醋香附HPLC特征圖譜及多元統(tǒng)計分析 [J]. 中成藥, 2019, 41(8): 1991-1994.
[5] 盧君蓉, 李文兵, 傅超美, 等.香附藥材的質(zhì)量控制方法的探討 [J]. 中國醫(yī)院藥學(xué)雜志, 2015, 35(5): 389-392.
[6] 鄧遠(yuǎn)輝, 劉瑜彬, 羅淑文, 等. α-香附酮的分離及其解熱鎮(zhèn)痛作用研究 [J]. 中藥新藥與臨床藥理, 2012, 23(6): 620-623.
[7] 位玉蝶, 李沁, 宋晨鴿,等. 基于多指標(biāo)響應(yīng)曲面法優(yōu)選醋炙香附炮制工藝及炮制終點量化研究 [J]. 中草藥, 2021, 52(4): 982-992.
[8] 李艷蘋, 孟輝, 蘇海瀟, 等. 不同炮制方法對醋香附中主要成分含量的影響 [J]. 華西藥學(xué)雜志, 2019, 34(4): 427-430.
[9] 許娜, 牟玉偵, 李文兵, 等. 基于HPLC法和多元統(tǒng)計分析的不同產(chǎn)地香附揮發(fā)油中4種成分含量的比較研究 [J]. 中國藥房, 2020, 31(23): 2833-2840.
[10] 盛菲亞, 盧君蓉, 彭偉, 等. 香附炮制前后揮發(fā)油的GC-MS指紋圖譜對比研究 [J]. 中草藥, 2013, 44(23): 3321-3327.
[11] 劉忠全. 醋炙法炮制香附增強(qiáng)療效的作用研究 [J]. 西部中醫(yī)藥, 2014, 27(9): 27-29.
[12] 胡律江, 許茜茜, 趙曉娟, 等.混料均勻設(shè)計優(yōu)化四制香附活性成分配伍 [J]. 中國實驗方劑學(xué)雜志, 2015, 21(14): 1-3.
[13] 張躍飛, 李鑫, 孟憲生,等. 香附揮發(fā)油的生物活性及其GC-MS分析 [J]. 中國實驗方劑學(xué)雜志, 2015, 21(14): 32-35.
[14] 劉歡, 張孟歷, 于猛,等. 醋制香附揮發(fā)油抗抑郁活性及化學(xué)成分分析 [J]. 藥物評價研究, 2020, 43(3): 436-442.
[15] 陳志堅, 胡璇, 劉國道. 香附的化學(xué)成分及藥理作用研究進(jìn)展 [J]. 安徽農(nóng)業(yè)科學(xué), 2017, 45(36): 113-115.
[16] 丁平, 田友清, 陳國勝, 等. 香附油滴丸抗炎鎮(zhèn)痛作用及其物質(zhì)基礎(chǔ)研究 [J]. 中國實驗方劑學(xué)雜志, 2013, 19(20): 172-176.
[17] 席駿鉆, 錢大瑋, 劉培, 等. 香附四物湯揮發(fā)油β-環(huán)糊精包合物的藥動學(xué)研究 [J]. 廣州中醫(yī)藥大學(xué)學(xué)報, 2018, 35(6): 1088-1094.
[18] 曹慶璽, 賈燦潮, 黃柳芳, 等. 近紅外光譜技術(shù)快速測定醋香附中α-香附酮的含量 [J]. 中國實驗方劑學(xué)雜志, 2018, 24(7): 27-32.
[19] Kim D S, Choi M H, Shin H J. Estimation of starch hydrolysis in sweet potato () based on storage period using nondestructive near-infrared spectrometry [J]., 2021, 11(2): 135.
[20] 褚小立, 史云穎, 陳瀑, 等. 近五年我國近紅外光譜分析技術(shù)研究與應(yīng)用進(jìn)展 [J]. 分析測試學(xué)報, 2019, 38(5): 603-611.
[21] 祝詩平. 人工神經(jīng)網(wǎng)絡(luò)NIR定量分析方法及其軟件實現(xiàn) [J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2007, 38(1): 108-111.
[22] 孔慶明. 神經(jīng)網(wǎng)絡(luò)在食用油質(zhì)量近紅外光譜分析中的應(yīng)用研究 [D]. 哈爾濱:哈爾濱商業(yè)大學(xué), 2012.
[23] 劉瑞新, 劉南岑, 史新元, 等. 基于遺傳算法和BP網(wǎng)絡(luò)的清開靈注射液增溶工藝優(yōu)化研究 [J]. 中國中藥雜志, 2009, 34(19): 2469-2472.
[24] 張芮銘, 張沙沙, 侯靜, 等. 相對質(zhì)量常數(shù)在黨參飲片等級評價中的應(yīng)用 [J]. 中國實驗方劑學(xué)雜志, 2021, 27(1): 162-171.
[25] 倪鳳燕, 呂慧芳, 畢霄鶴,等.基于相對質(zhì)量常數(shù)的丹參飲片等級評價 [J]. 中國實驗方劑學(xué)雜志, 2021, 27(5): 140-146.
[26] 石佳, 荊文光, 鄧哲, 等.基于質(zhì)量常數(shù)方法評價方法的梔子等級評價研究 [J]. 中國中藥雜志, 2019, 44(17): 3732-3737.
[27] 荊文光, 程顯隆, 劉安, 等. 基于“辨狀論質(zhì)”綜合評價指數(shù)的厚樸飲片等級劃分和優(yōu)質(zhì)優(yōu)效研究 [J]. 中草藥, 2021, 52(8): 2285-2293.
[28] 劉昌孝, 陳士林, 肖小河, 等. 中藥質(zhì)量標(biāo)志物(Q-Marker): 中藥產(chǎn)品質(zhì)量控制的新概念 [J]. 中草藥, 2016, 47(9): 1443-1457.
[29] 李曉紅, 劉妍如, 唐志書, 等.基于“生物活性-質(zhì)量標(biāo)志物”關(guān)聯(lián)的赤芍飲片等級評價方法研究 [J]. 中草藥, 2020, 51(10): 2611-2617.
[30] 閆亞峰, 宋忠興, 劉妍如, 等. 基于“生物活性-質(zhì)量標(biāo)志物”關(guān)聯(lián)的紅花等級評價研究 [J]. 中草藥, 2019, 50(19): 4683-4690.
[31] 趙夢利, 劉妍如, 宋忠興,等. 基于成分-抗氧化活性相關(guān)的雞血藤飲片等級評價研究 [J]. 中草藥, 2020, 51(4): 943-949.
[32] 郭慧玲, 董能峰, 胡律江, 等. 基于成分敲出策略辨識四制香附抗痛經(jīng)的主要效應(yīng)成分 [J]. 中國實驗方劑學(xué)雜志, 2017, 23(10): 7-11.
Study on near infrared spectrum grade evaluation and content prediction model ofvinegar-processedbased on pattern recognition and GA-BPNN
QIU Li-yuan, LIANG Ze-hua, WU Xin-yu, PAN Ying-jie, FANG Jian-wen
School of Pharmacy, Zhejiang Chinese Medical University, Hangzhou 311400, China
A quality evaluation model was established based on near infrared spectroscopy (NIRS), which could quickly and accurately identify the grade ofprocessed with vinegar and predict the content of α-cyperone and cyperenone in its volatile oil, so as to provide reference for the quality evaluation of other Chinese medicinal materials or Chinese herbal pieces.The near infrared spectrum information of vinegar-processedwas collected, and the GC-MS fingerprint of 39 batches ofvolatile oil was established. The α-cyperone and cyperenone in the volatile oil were quantified. The data were processed by similarity analysis, multivariate statistical analysis, PCA, HCA, PLS-DA, logistic regression analysis and other methods, and the grades were classified. Genetic neural network algorithm (GA-BPNN) was used to fit the grade classification results, the content of α-cyperone and cyperenone with the near infrared spectral information, respectively, to establish the grade prediction model and the content prediction model.According to the principal component cluster analysis, vinegar-processedcan be divided into three grades, and the results of PLS-DA analysis were consistent with those of principal component cluster analysis. Multivariate logistic regression analysis was used to establish the empirical formula for the classification of decoction pieces. The results of grade prediction were consistent with those of principal component cluster analysis. The prediction accuracy of GA-BPNN model was 89.74%, and the model accuracy was good; The determination coefficients of α-cyperone and cyperenone regression model were 0.992 3 and 0.969 7, respectively, which could well predict the content of α-cyperone and cyperenone in volatile oil of vinegar-processed.The grade evaluation model of vinegar-processedbased on near infrared technology established by GA-BPNN can quickly and accurately predict the grade of vinegar-processed, which provides a reference for the establishment of quality standards of vinegar-processedand other Chinese medicinal materials and the research of grade evaluation model.
vinegar-processed; volatile oil; grade evaluation; GC-MS; NIR; pattern recognition; genetic neural network algorithm; α-cyperone; cyperenone; quality evaluation; similarity analysis; multivariate statistical analysis; principal component analysis; hierarchical cluster analysis; partial least squares-discriminant analysis; Logistic regression analysis
R283.6
A
0253 - 2670(2021)13 - 3818 - 13
10.7501/j.issn.0253-2670.2021.13.006
2021-03-09
國家重點研發(fā)計劃——中藥飲片質(zhì)量識別關(guān)鍵技術(shù)研究(2018YFC1707001)
邱麗媛(1996—),碩士研究生,研究方向為中藥炮制工藝及質(zhì)量標(biāo)準(zhǔn)。Tel: 18806823685 E-mail: 2387841189@qq.com
梁澤華(1976—),副教授,從事中藥炮制工藝及質(zhì)量標(biāo)準(zhǔn)研究。Tel: 13858042221 E-mail: 1046698407@qq.com
#并列第一作者:梁澤華
[責(zé)任編輯 鄭禮勝]