閆 艷, 孟慶華, 李廣超, 張桂芝
(江蘇師范大學化學化工學院, 江蘇 徐州 221116)
色譜指紋圖譜歐式距離法的一種改進
閆 艷, 孟慶華*, 李廣超, 張桂芝
(江蘇師范大學化學化工學院, 江蘇 徐州 221116)
目的 通過對歐氏距離算法的改進構建相對歐氏距離,使其值能夠精確地反映樣品指紋圖譜與對照指紋圖譜的相似性。方法 以對照指紋圖譜為標準建立樣品及對照比值指紋圖譜,并將樣品與對照品指紋峰向量差值和的絕對值和向量差絕對值的和的比值和各共有峰、非共有峰總面積的權重系數(shù)引入歐氏距離計算公式,并計算指紋圖譜向量模長的比值,利用文獻數(shù)據(jù)評價參麥注射液質(zhì)量和中藥材大黃質(zhì)量。結果 模擬數(shù)據(jù)計算結果表明改進算法能準確反應指紋圖譜峰間比例關系的一致性及共有峰總面積的波動,定量反應非共有峰總面積對相對歐氏距離的影響.參麥注射液和大黃指紋色譜的計算結果與文獻一致。結論 本文提出的相對歐氏距離計算方法和判斷方法可用于中藥產(chǎn)品批間質(zhì)量穩(wěn)定性的控制。
指紋圖譜;歐式距離;質(zhì)量評價;參麥注射液;大黃
指紋圖譜技術是目前公認的全面控制中藥、食品等復雜成分體系質(zhì)量的最有效可靠的技術。指紋圖譜質(zhì)控技術進行質(zhì)量控制的關鍵是相似度評價理論及其軟件化。色譜指紋圖譜相似度評價的實質(zhì)是考察要比較的兩個指紋圖譜的組成峰數(shù)、峰匹配以及相應峰量化關系的一致性:即一方面從產(chǎn)品質(zhì)量的穩(wěn)定性和一致性考慮,相似度大小應能靈敏反映多元化學成分分布比例的差異和整體含量的差異;另一方面從安全性考慮,相似度大小應能考察非共有峰總面積大小對相似度的影響。有關色譜指紋圖譜相似度評價方法研究已取得了一定的進展,文獻報道的 主 要 有 峰 重 疊 率[1]及 作 者 提 出 的 改 進 方法[2]、向量夾角余弦[3]、 相關系數(shù)[4]、組合相似度[5]、基于相 似 系 統(tǒng) 理 論 的 多 種 程 度 相 似 度[6-8]、總量 統(tǒng) 計 矩 相 似 度[9]、 距 離 相 似 度 包 括 馬 氏 距離[10]、 歐氏距離[11-13]、 歐馬距離[14]、 指數(shù) 相似系數(shù)法[15]、 以及用相對熵的歧異值來衡量色譜指紋圖譜的相似度[16]等方法, 文獻 [17] 提出了比率定性相似度及投影含量相似度等多個特性指標用于中藥質(zhì)量的控制。這些相似度評價方法各有特點,但也存在各自的局限性[18], 不能完全滿足指紋圖譜對中藥質(zhì)量控制的實際應用要求,如相關系數(shù)、夾角余弦法等相似度不能靈敏地反映小峰的變化和丟失,也不能反應圖譜上色譜峰總面積的波動變化;基于相似系統(tǒng)理論的多種程度相似度,不能反映非共有峰 (不能與對照指紋圖譜相匹配的峰)峰值大小對相似度的影響,其計算的相似度大小順序有時與峰值比例的變化趨勢并不一致;組合相似度是在共有峰的夾角余弦相似度基礎上納入了非共有峰的影響,但存在樣本增加或改變時需重新計算合適的 ω范圍的問題[5]; 歐馬距離盡管克服了馬氏距離對變化微小變量的作用放大的缺點,但依然和馬氏距離一樣存在要求總體樣本數(shù)大于樣本的維數(shù),另一方面即使?jié)M足了總體樣本數(shù)大于樣本的維數(shù)的條件,但是有些情況下存在無法求出協(xié)方差矩陣的逆矩陣的可能。絕對歐式距離數(shù)值大小盡管存在受變量單位不同以及檢測器響應不同的影響[19-20], 但絕對 歐 氏 距 離 沒 有 馬 氏 距離存在 的 上述問題,同時 (與夾角余弦等相似度算法比較而言)具有能同時反映中藥多元化學成分分布比例的差異和色譜峰總面積的差異,也能考察非共有峰峰值大小對相似度影響的性能[19], 因此本研究基于分子分母只要取相同計量單位,其比值大小與分子分母計量單位無關的原理,結合以對照指紋圖譜為計算參照標準,采用比值法對數(shù)據(jù)進行預處理,以修正的待比較樣品指紋圖譜和對照指紋圖譜間的歐氏距離與對照指紋圖譜向量模長的比值來計算指紋圖譜間的相似性,本研究稱之為相對歐式距離,由于相對歐式距離是絕對歐氏距離相對對照指紋圖譜模長求得的比值,消除了絕對歐氏距離存在的上述問題,數(shù)值大小具有直觀的綜合定量評價能力,能夠反映指紋峰的相關性、峰比例關系的變化和色譜峰總面積的波動,定量地反映非共有峰總面積大小的影響; 本研究還根據(jù)箱線圖法 ( Box Plot) 原理[21]提出了確定相似性判斷閾值的經(jīng)驗方法, 便于根據(jù)相似度大小從質(zhì)量均一性、穩(wěn)定性與安全性上控制藥品、食品的質(zhì)量。
1.1 相似度算法的提出 本研究構建的相似度算法是基于事先確定的對照指紋圖譜為計算參照標準;以中藥色譜指紋圖譜峰面積值或峰高為相似度評價信息參數(shù);以圖譜矢量化空間模式向量間相似性計算為基本出發(fā)點。
圖1 樣品指紋圖譜和對照指紋圖譜向量圖Fig.1 Vectors of sam p le fingerp rint and standard fingerprint
1.2 相似度算法的優(yōu)化 當樣品指紋圖譜色譜峰比對照指紋圖譜對應峰都偏大時,樣品與對照樣品的化學成分分布比例較一致,而如果樣品指紋圖譜色譜峰比對照指紋圖譜對應峰一部分偏大另一部分偏小時,二者的化學成分分布比例相差較大,采用式 (1) 計算上述兩種情況的相似性時不能靈敏反應這種差異, 必須對公式 (1) 進行修正, 修正后的計算方法見公式 (2)。
由于中藥組成成分復雜,各成分的結構及藥效等不盡相同,故對中藥指紋圖譜相似性評價時,各成分可能存在有不同的比重系數(shù)。為此,實際應用時可考慮根據(jù)藥效、毒性研究等確定中藥不同成分相似性評價的藥效影響因子,對指紋圖譜相似性評價中的特征變量進行加權運算。加權運算公式為公式 (5):
式中 δi、δa分別是各共有峰、 非共有峰總面積的權重系數(shù), 權重的取值范圍 δi≥0 或 δa≥0, δi、δa取值原則是: ①向量的各維變量對產(chǎn)品有效性安全性影響不明確時 δi及 δa可全取 1;②某些變量對產(chǎn)品有效性安全性影響非常明顯時 δi>1 或 δa>1,具體大小通過實驗確定;③某些變量對產(chǎn)品有效性安全性影響較小時 1 >δi≥0 或 1 >δa≥0,具體大小通過實驗確定。 確定 δi、δa大小的具體試驗方法有待進一步研究。
1.3 相似度判斷閾值 d限的確定方法 公式 (4)用于判定中藥批次間產(chǎn)品質(zhì)量是否穩(wěn)定的實際應用時,需要確立一個科學合理的相似度評價閾值;閾值的確定前提是必須首先確定對照指紋圖譜,這顯然要事先選擇一些已鑒定好的合格的中藥產(chǎn)品樣本并獲得其相應的中藥色譜指紋圖譜;合格品的最終選擇只有通過有效性、安全性試驗確定,目前的指紋圖譜技術發(fā)展水平還難于實現(xiàn)。根據(jù)本實驗室對試驗數(shù)據(jù)和文獻數(shù)據(jù)計算驗證經(jīng)驗,提出一種結果較可靠、操作性較強的經(jīng)驗方法:①根據(jù)專家經(jīng)驗或其他方法選擇不少于 10個批次的正品藥材或中藥制劑產(chǎn)品;②采用計算機技術對這些正品藥材或中藥制劑產(chǎn)品的指紋圖譜數(shù)據(jù)進行預處理和色譜峰匹配;③對被保留的藥材或中藥制劑產(chǎn)品的指紋圖譜用平均矢量法或中位數(shù)矢量法,優(yōu)選穩(wěn)健性較好的中位數(shù)矢量法初步建立該產(chǎn)品的對照指紋圖譜;④用式 (4) 計算被保留的每個正品藥材或中藥制劑產(chǎn)品的指紋圖譜與初步確定的對照指紋圖譜相似度的 Syj;⑤ 根 據(jù) 箱 線 圖 法 ( Box Plot) 原 理[21],對 dyj數(shù)據(jù)按從小到大排序, 并求出該序列數(shù)據(jù)的統(tǒng)計量第一四分位數(shù) Q1、 第三四分位數(shù) Q3, 并求出這兩個四分位數(shù)差值 df=Q3-Q1, 將所有 Syj數(shù)據(jù)與 Q3+1.5df比較, 所有大于 Q3+1.5df的 dyj數(shù)據(jù)判斷為異常值而將對應藥材或中藥制劑產(chǎn)品剔除, 重復③ ~⑤步, 直至 dyj系列不再出現(xiàn)異常值;⑥被保留藥材或中藥制劑產(chǎn)品的指紋圖譜的按③步確定最終對照指紋圖譜, 按④步計算的 dyj系列,其中的最大值即為 d限。
本研究以模擬數(shù)據(jù)計算結果研究比較相似性新算法及其他相似度算法的性能,并將本研究提出的方法應用于文獻指紋圖譜數(shù)據(jù), 相關計算采用 matlab 軟件 (Mathwork Inc.)自行編寫程序。
3.1 定性比較新算法與其他相似度算法 假設有某一產(chǎn) 品 的對照指紋 圖 譜向量和 3 個 待比較樣品指紋圖譜 向 量如 圖 1b 所 示,、是 3 個樣品 指 紋 圖譜向量與的差向量,分 別表示向 量之間的歐氏距離向 量在向量的投影是在 向 量上 的 投 影,表 示 向 量的 模長,表 示 向量的模長。 從 圖 1 可以
3.2 定量比較新算法與其他相似度算法 表 1 是采用差異明確的模擬數(shù)據(jù)來考察4種相似度的計算結果。表中對照樣品假設有6個色譜峰,各峰值大小依次為 1、 5、 10、 15、 20、 25; 1 ~6 號樣品是對對照樣品稀釋或濃縮不同倍數(shù)的樣品,稀釋或濃縮的倍數(shù)分別為 0.5、 0.9、 1.1、 1.5、 2.0 和3.0;7 ~12 號樣品除含對照樣品中種類相同濃度相同的6個成分外,還多出一個對照樣品中沒有的非共有成分, 非共有成分的峰大小依次由 1 變?yōu)?25;13號樣品與3號樣品各峰值大小相對于對照樣品各峰的差異都為 10%, 但變化方向不同, 3 號樣品所有峰都比對照指紋圖譜峰偏大, 而 13 號樣品比對照指紋圖譜峰后三個峰偏大, 前三個峰偏?。?14號樣品的二號小峰與 15 號樣品的六號大峰相對對照指紋圖譜的相對差異相同, 都為 10%, 其余峰值與對照樣品對應峰大小相同; 16號樣品的二號小峰與17號樣品的六號大峰相對對照指紋圖譜的絕對差異相同,都為3, 其余峰值與對照樣品對應峰大小相同。
表1 用4種相似度算法計算的模擬數(shù)據(jù)相似度結果Tab.1 Resu lts of four sim ilarity algorithm s based on simulated data
表1中1~6號樣品的相似度數(shù)據(jù)表明當峰值大小的總差異不超過 100%時, 本研究定義的相對歐氏距離d的數(shù)值大小與樣品和參照樣品的相對平均差異大小一致, 而改良程度相似度 q、 新改良程度相似度 q'數(shù)值大小與樣品相對參照樣品的相對含量一致,從不同角度都能給出直觀的綜合定量評價結果; 即使相對差異超過 100%, 數(shù)值的大小也能反映樣品和參照樣品的差異,本研究計算的相對歐式距離越大,樣品與對照樣品的差異越大;而夾角余弦相似度 cosθ全為 1, 不能反應樣品與參照樣品的這種總量的差異。 7 ~12 號樣品與對照樣品非共有峰峰值由1 變?yōu)?5時, 本研究定義相對歐氏距離 d 由 0.005 4 變化為 0.134 3; 夾角余弦相似度cosθ由 0.999 6 變化 0.829 3; 表明相對歐氏距離d、 夾角余弦相似度 cosθ都能定量地反映非共有峰峰大小的影響,而改良相似度q及新改良程度相似度 q'由于只能反應共有峰的變化對相似度的影響,相似度全為 1。相對于對照指紋圖譜而言,13 號樣品峰比例關系的一致性比3號樣品峰比例關系的一致性要差, 按公式 (3) 計算的相對歐氏距離 d13號樣品的 0.181 6 大于 3 號樣品 0.100 0, 與實際一致且二者的相對歐氏距離 d的差值△d比夾角余弦值差值大,而改良程度相似度q及新改良程度相似度 q'不能反映這種差異。 表 1 中 14 號、 15 號樣品相似性數(shù)據(jù)表明按公式 (4) 計算的相對歐氏距離d無論大峰還是小峰,只要相對差異相同對性的影響是一樣的,而夾角余弦值對大小峰的靈敏度是不同的。 16 號、 17 號樣品相似度數(shù)據(jù)表明按公式(4) 計算的相對歐氏距離 d 能靈敏反應大小峰產(chǎn)生相同的絕對差異時對相似性不同的影響, 對16號樣品小峰的絕對差異為 3 時相對差異為 60%,而17號樣品大峰的絕對差異為 3 時相對差異為12%,因此 17 號樣品的相對歐氏距離 0.049 0 小于 16 號樣品的相對歐氏距離 0.245 0。上述結果表明:本研究建立的指紋圖譜相似度算法既能靈敏反映指紋圖譜各成分含量比例的變化,也能反映總量的變化及非共有峰的影響,且無論對大峰還是小峰都表現(xiàn)出較高的敏感性。
3.3 計量單位以及檢測器不同的響應對相對歐氏距離的影響 相同條件下同一樣品指紋圖譜色譜峰面積或峰高大小與采用的計量單位有關,但不同的計量單位間存在一定的換算系數(shù) k,假設yi由某已計量單位換算成另一計量單位,數(shù)值大小變?yōu)閗xi、代入式 (4) 整理如式 (6), 顯然 d 值與k無關。盡管不同儀器不同的檢測器響應不同,檢測器間響應值比是固定不變的,這類似于峰值計量單位的不同情況,檢測器不同響應對d值大小理論上沒有影響,甚至采用適當方法測量出不同檢測器間比值對不同儀器獲取數(shù)據(jù)校正后,不同儀器獲取數(shù)據(jù)可通用。
3.4 新算法評價中藥制劑質(zhì)量穩(wěn)定性的應用 表2 是文獻 [10] 中 23 個參麥注射液樣品指紋圖譜數(shù)據(jù)及采用式 (4)計算的相對歐氏距離結果;1 ~11 號是以工藝 A制得的參麥注射液樣品, 作為合格品, 12 ~17 號以工藝 B制得的參麥注射液樣品, 2’、 3’、 4’、 5’、 9’ 號是 2、 3、 4、 5、 9 號參麥注射液樣品的重復進樣獲得的指紋圖譜, 18號是以西洋參代替紅參所作的偽品;對照指紋圖譜是以中位矢量法用 1 ~11 號樣品指紋圖譜數(shù)據(jù)確定的。 根據(jù)本研究確定相對歐氏距離判斷閾值 d限的方法, 發(fā)現(xiàn)7號樣品和 11 號樣品為異常樣品, 剔除 7、 11 號樣品后, 將 1 ~6 號、 9 ~10 號作為合格樣本,以中位法重新確定對照指紋圖譜,依次以公式 (4)計算 1 ~6 號、9 ~10 號、 2’、 3’、4’、5’、 9’號、 7 號、 11 號及 12 ~18 號樣品相對新對照指紋圖譜的相對歐氏距離,結果按順序為0.232 9、 0.197 1、 0.202 8、 0.437 3、 0.094 8、0.303 6、 0.345 1、0.237 8、0.188 2、0.222 9、0.197 6、 0.421 7、0.102 8、0.239 5、0.975 3、0.718 8、 2.132, 2.700, 2.941, 1.939 3, 3.726,3.263, 11.89; 1 ~6 號、 9 ~10 號合格樣本的相對歐氏距離未發(fā)現(xiàn)異常值,4號樣本的相對歐氏距離0.437 3 為最大, 確定為判斷閾值 d限; 顯然 12 ~18號相對歐氏距離 d 值均大于 0.437 3, 可判定為不合格品 (工藝 B與工藝 A有顯著差別), 2’、 3’、 4’、5’、 9’ 號相似度的均小于 0.437 3, 可判定為合格品,特別是 18 號偽品其相對歐氏距離最大為 11.89,按新的閾值 d限判斷, 7、 11 號樣品依然為異常樣品,分析7、 11 號樣品指紋圖譜數(shù)據(jù)可發(fā)現(xiàn), 二者的指紋圖譜第一個色譜峰值分別為 2.72、 3.05, 明顯比其他合格樣本對應峰值大得多,說明判斷是合理的;即使在剔除 7、 11 號樣品前計算的相對歐氏距離,從表1 的數(shù)據(jù)也可以看出1 ~11 號樣本的相對歐氏距離也遠小于 12 ~18 號樣品的相似度, 表明公式(4) 算法計算的相對歐氏距離能夠反應兩種不同工藝的差別, 從另一個角度說明公式 (4) 算法計算能夠反應中藥制劑質(zhì)量的穩(wěn)定性均勻性。
表 2 18 批參麥注射液指紋圖譜數(shù)據(jù)及相對歐式距離相似度結果Tab.2 Data of chromatographic fingerprints of 18 batches of Shenmai Injection and results of their sim ilarity
3.5 新算法評價中藥材質(zhì)量優(yōu)劣的應用 表 3 是文獻 [22] 中 19 個大黃樣品的指紋圖譜數(shù)據(jù)及采用公式 (4) 計算的相對歐氏距離 d 結果。 1 ~5號、 8 ~11 號樣本在原始文獻中定為正品大黃樣品, 6、 7 號及 12 ~19 號是待鑒定大黃樣品, 表中對照指紋圖譜是按 “3.3” 節(jié)同樣的方法剔除 4 號樣本后以1 ~3 號、 5 號、 8 ~11 號為合格樣本指紋圖譜數(shù)據(jù)用中位矢量法確定的。根據(jù)本研究提出的相對歐氏距離判斷閾值 d限的確定方法, 1 ~3 號、 5號、 8~11 號相對歐氏距離無奇異值, 最終確定大黃相對歐氏距離的閾值 d限為 1.904 3; 顯然 6、7 號樣品相對歐氏距離 d 值均小于 1.904 3, 可判定為合格品; 12 ~19 樣品相對歐氏距離 d 的值均遠大于1.904 3, 可判斷它們屬非合格品, 這與文獻6、 7 號為正品, 12 ~19 為非正品的結論是一致的。盡管原文獻把4號樣品作為正品大黃,但4號樣品的指紋圖譜數(shù)據(jù)表明, 其第 10 個和第 14 個色譜峰面積(分別為 94.4、 28.1) 比其他正品大黃對應色譜峰遠遠大得多 (對照指紋圖譜相應峰面積分別為8.90、 1.40), 說明其內(nèi)在化學成分與其他正品大黃有顯著差異,剔除是合理的。上述數(shù)據(jù)表明本研究構建的相對歐氏距離算法可用于中藥材質(zhì)量控制。
表 3 19 批大黃藥材指紋圖譜數(shù)據(jù)及相對歐式距離相似度結果Tab.3 Data of chromatographic fingerprints of 19 batches of Rhei Radix et Rhizoma and results of their sim ilarities
綜上所述,模擬數(shù)據(jù)計算結果顯示本研究構建的相對歐氏距離算法不僅能夠準確靈敏地反應指紋圖譜共有峰峰分布比例關系的變化和峰面積總量的波動,也能夠定量反應非共有峰總面積大小對相似度的影響,具有較好的綜合評價能力;本研究根據(jù)箱線圖法原理提出的確定相對歐氏距離判斷閾值的經(jīng)驗方法具有較強的可操作性和實用性,利用文獻數(shù)據(jù)對參麥注射液質(zhì)量和藥材大黃質(zhì)量的評價結果表明方法可用于中藥產(chǎn)品批次間質(zhì)量的均一性、穩(wěn)定性和安全性評價;數(shù)據(jù)顯示用于中藥材的相對歐氏距離判斷閾值比中藥制劑的相對歐氏距離判斷閾值要大,主要由于中藥材內(nèi)在化學成分是次生代謝產(chǎn)物受各種因素影響變化較大,而中藥制劑經(jīng)生產(chǎn)工藝過程的控制,內(nèi)在化學成分質(zhì)量較均一穩(wěn)定,這本就是中藥指紋圖譜質(zhì)控技術的目的所在,顯然利用本研究提出的方法能夠篩選出質(zhì)量更為穩(wěn)定的原藥材,更有利于中藥質(zhì)量穩(wěn)定可控。
[ 1] 洪筱坤, 王智華.中藥數(shù)字化色譜指紋譜[M].上海: 上??茖W技術出版社, 2003: 82-83.
[2] 孟慶華,劉永鎖,王健松,等.色譜指紋圖譜相似度的新算法及其應用[J].中成藥, 2003, 25(1): 4-8.
[3] 王龍星,肖紅斌,梁鑫淼,等.一種評價中藥色譜指紋譜相似性的新方法: 向量夾角法[ J].藥學學報, 2002, 37(9): 713-717.
[4] 田潤濤, 謝培山.色譜指紋圖譜相似度評價方法的規(guī)范化研究 (一) [J].中藥新藥與臨床藥理, 2006, 17(1): 40-42, 54.
[5] 詹雪艷,史新元,段天璇,等.色譜指紋圖譜組合相似度的算法[ J] .色譜, 2010, 28(11) : 1071-1076.
[6] 劉永鎖,孟慶華,蔣淑敏,等.相似系統(tǒng)理論用于中藥色譜指紋圖譜的相似度評價[J].色譜, 2005, 23(2): 158-163.
[7] 劉永鎖,曹 敏,王義明,等.相似系統(tǒng)理論定量評價中藥材色譜指紋圖譜的相似度[J].分析化學, 2006, 34(3):333-337.
[8] 詹雪艷,史新元,展曉日,等.基于相似系統(tǒng)理論的相似度計算方法的改進[ J].分析化學, 2010, 38(2) : 253-257.
[9] 賀福元,周宏灝,鄧凱文,等.指紋圖譜的一種定性定量研究新方法_ 總量統(tǒng)計矩分析法[J].藥學學報, 2008, 43(2): 195-201.
[10] 吳 昊, 田燕華, 郭平平, 等.多元統(tǒng)計學在參麥注射液指紋圖譜中的應用[J].中成藥, 2002, 24(1): 3-6.
[11] 葉 皓, 沈 順, 張祥民.液相指紋圖譜結合歐氏距離對野菊花質(zhì)量控制的研究[J].世界科技研究與發(fā)展, 2006,28(2): 72-74.
[12] 李希強, 陸舍銘, 王 笛, 等.煙用香精 UPLC指紋圖譜的夾角余弦、 相關系數(shù)與歐氏距離評價[J].煙草科技,2008(12): 37-41.
[13] 李希強, 王 笛, 陸舍銘.夾角余弦與歐式距離相結合建立煙用香精 HPLC指紋圖譜[J].香料香精化妝品, 2007,(6): 26-30.
[14] 趙曰利, 于宏曉, 宗兆奇, 等.歐馬距離法在香料指紋圖譜模式識別中的應用[J].煙草科技, 2011(2): 52-57.
[15] 谷瑞敏, 郭治昕, 劉巍巍, 等.中藥色譜指紋圖譜相似度評價新模型及其論證[ J] .中成藥, 2009, 31(1) : 1-4.
[16] 王 康, 杜 凱, 李 華.相對熵方法用于中藥指紋圖譜相似度計算[ J].計算機與應用化學, 2007, 24 (1):49-52.
[17] 孫國祥, 侯志飛, 張春玲, 等.色譜指紋圖譜定性相似度和定量相似度的比較研究[J].藥學學報, 2007, 42(1) :75-80.
[18] 關洪月, 李 林, 劉 曉, 等.中藥指紋圖譜相似度計算方法探析[J].中國實驗方劑學雜志, 2011, 17(18) : 282-287.
[19] 吳玉田, 柴逸峰.藥物分析信息學及應用[M].北京: 人民衛(wèi)生出版社, 2009: 143.
[20] 聶 磊, 曹 進, 羅國安, 等.中藥指紋圖譜相似度評價方法的比較[J].中成藥, 2005, 27(3): 249-252.
[21] 莊作欽.BOXPLOT_ 描述統(tǒng)計的一個簡便工具[ J].統(tǒng)計與預測, 2003, 2: 56-57.
[22] 洪筱坤, 王智華, 李 旭.HPLC-相對保留值指紋圖譜鑒別大黃[J].中國中藥雜志, 1993, 18(11): 650-652.
Im provement of Euclidean distance between chromatographic fingerprints
YAN Yan, MENG Qing-hua*, LIGuang-chao, ZHANG Gui-zhi
(School of Chemistry&Chemical Engineering, Jiangsu Normal University, Xuzhou 221116, China)
AIM To improve the algorithm of the relative Euclidean distance in order to accurately reflect the similarities between chromatographic fingerprints of herbs.METHODS The ratio of sample and reference chromatographic fingerprintswere established for reference standard of chromatographic fingerprints.The absolute value of the sum of the vector difference and the sum of absolute value of the vector difference of sample and reference chromatographic fingerprints and the weight coefficients of common peaks and non common peakswere brought into the calculation of Euclidean distance,and their norm of vector.Lecture data of Shenmai Injection and Rhei Radix et Rhizoma were served as the computation.RESULTS The improved algorithm could reflect the uniformity of peak area ratios and fluctuation of total peak areas and quantified the influence of non common peaks on relative Euclide-an distance.The data from algorithm applied to the chromatographic fingerprints of Shenmai Injection and Rhei Radix et Rhizoma were consistentwith the lecture data.CONCLUSION The algorithm may be applicable for the quality evaluation of differentbatches of herbal preparations.
fingerprints; similarity;Euclidean distance;quality evaluation; Shenmai Injection;RheiRadix et Rhizoma
R284.1
: A
: 1001-1528(2014)05-1012-09
10.3969/j.issn.1001-1528.2014.05.028
2013-06-04
江蘇省徐州市科技發(fā)展基金 (XF10C015)
閆 艷 (1987—) , 女, 碩士, 從事藥品分析研究。 Tel: (0516) 83403165, E-mail: 571472309@qq.com
*通信作者: 孟慶華 (1965—) , 男, 博士, 副教授, 研究方向: 中藥質(zhì)量控制。 Tel: (0516) 83403165, E-mail: mqhxz@126.com