馮艷春, 張 琪, 胡昌勤
中國(guó)食品藥品檢定研究院, 北京 100050
藥品近紅外光譜通用性定量模型評(píng)價(jià)參數(shù)的選擇
馮艷春, 張 琪, 胡昌勤*
中國(guó)食品藥品檢定研究院, 北京 100050
為尋找藥品近紅外通用性定量模型在建立過(guò)程中用于確立最優(yōu)模型的關(guān)鍵評(píng)價(jià)參數(shù)組合, 收集整理了目前各種商品化化學(xué)計(jì)量學(xué)軟件及文獻(xiàn)中的13個(gè)常用于評(píng)價(jià)近紅外定量模型的統(tǒng)計(jì)學(xué)參數(shù), 結(jié)合人用藥品注冊(cè)技術(shù)要求國(guó)際協(xié)調(diào)會(huì)對(duì)于藥品定量分析方法驗(yàn)證基本要求, 對(duì)92個(gè)藥品近紅外通用性定量分析模型的這些參數(shù)進(jìn)行了計(jì)算和分析。 通過(guò)對(duì)各個(gè)參數(shù)之間相互關(guān)系的研究, 確定了適合于藥品近紅外通用性定量分析模型評(píng)價(jià)的參數(shù)組合, 并統(tǒng)計(jì)出了這些參數(shù)的數(shù)值范圍: 用于模型準(zhǔn)確性評(píng)價(jià)的關(guān)鍵參數(shù)為交叉驗(yàn)證均方根誤差/預(yù)測(cè)均方根誤差、 平均相對(duì)偏差和相對(duì)分析誤差; 大部分交叉驗(yàn)證均方根誤差/預(yù)測(cè)均方根誤差結(jié)果在3%以內(nèi), 其中交叉驗(yàn)證均方根誤差在數(shù)值上與平均絕對(duì)偏差相當(dāng), 大部分相對(duì)分析誤差值大于2, 而平均相對(duì)偏差的數(shù)值與所建模型的類型(劑型、 樣品的包裝形式)和待測(cè)成分含量的分布有關(guān)。 模型線性評(píng)價(jià)關(guān)鍵參數(shù)為決定系數(shù); 大部分模型的決定系數(shù)在80%~100%之間。 模型耐用性關(guān)鍵評(píng)價(jià)參數(shù)為預(yù)測(cè)均方根誤差與交叉驗(yàn)證均方根誤差的比值, 大部分模型該參數(shù)在1.5以內(nèi)。 精密度評(píng)價(jià)關(guān)鍵參數(shù)為重復(fù)測(cè)定結(jié)果的標(biāo)準(zhǔn)差; 該參數(shù)對(duì)于規(guī)范近紅外的操作, 以及考核模型能否在不同儀器間傳遞具有重要的意義, 但目前藥品近紅外通用性定量模型對(duì)于分析精密度的關(guān)注較少, 無(wú)法估計(jì)出具體數(shù)值范圍。 該研究不僅為藥品近紅外通用性模型的建立者和使用者提供了評(píng)價(jià)模型優(yōu)劣的依據(jù), 也為完善藥品近紅外光譜通用性定量分析模型的參數(shù)評(píng)價(jià)體系提供了基礎(chǔ)數(shù)據(jù)。
藥品; 近紅外光譜; 通用性定量模型; 模型優(yōu)化; 評(píng)價(jià)參數(shù); 準(zhǔn)確性; 線性; 精密度; 耐用性
為有效打擊我國(guó)市場(chǎng)上的假劣藥品, 中國(guó)食品藥品檢定研究院從2003年起著手開(kāi)展藥品近紅外(near infrared, NIR)快速分析系統(tǒng)地研究[1]; 2006年起該系統(tǒng)被裝備于藥品檢測(cè)車上, 用于流通領(lǐng)域藥品質(zhì)量的快速篩查[2], 逐步形成了國(guó)內(nèi)NIR分析技術(shù)的一個(gè)主要應(yīng)用平臺(tái)[3]。 其中藥品NIR通用性定量分析模型是該系統(tǒng)的重要組成部分, 該類模型由于涵蓋了不同廠家、 不同儀器所測(cè)樣品的光譜信息, 因此能有效排除制劑中工藝、 輔料的干擾, 針對(duì)活性成分對(duì)不同企業(yè)的具有相同INN(international nonproprietary names)名稱的同類產(chǎn)品在銷售現(xiàn)場(chǎng)進(jìn)行快速定量分析。 有關(guān)如何建立該類模型已經(jīng)進(jìn)行過(guò)詳細(xì)的報(bào)道, 同時(shí)很多藥品通用性定量模型也已投入使用[4], 但對(duì)于如何系統(tǒng)地評(píng)價(jià)該類模型還鮮有報(bào)道。
NIR光譜技術(shù)屬于二級(jí)分析方法, 定量模型需要一定數(shù)量的代表性樣品, 借助軟件將法定方法測(cè)得的含量與樣品的NIR光譜圖進(jìn)行關(guān)聯(lián), 通過(guò)多元校正的方法建立模型用于預(yù)測(cè)未知樣品。 在建模過(guò)程中, 通常要嘗試不同的光譜預(yù)處理方法, 選擇不同的譜段與待測(cè)成分的含量進(jìn)行關(guān)聯(lián), 以獲得理想的模型, 即模型優(yōu)化; 且需要借助于適宜的評(píng)價(jià)參數(shù)確定最優(yōu)模型。 雖然人用藥品注冊(cè)技術(shù)要求國(guó)際協(xié)調(diào)會(huì)(International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use, ICH) 頒布的分析方法驗(yàn)證指南ICH Q2 (R1)中已經(jīng)對(duì)藥品定量分析方法的評(píng)價(jià)提出了基本要求, 但基于多元校正方法的NIR定量模型的優(yōu)化過(guò)程運(yùn)算十分巨大, 因此一般都需要依賴于計(jì)算機(jī)僅使用來(lái)自NIR儀器隨機(jī)攜帶或商品化的化學(xué)計(jì)量學(xué)軟件中的參數(shù)用于模型優(yōu)化過(guò)程的評(píng)價(jià)。 然而這些參數(shù)并不足以完全的評(píng)價(jià)或驗(yàn)證模型的優(yōu)劣, 進(jìn)行NIR模型的評(píng)價(jià)和驗(yàn)證應(yīng)以適合于最終使用為目標(biāo), 根據(jù)應(yīng)用目的, 恰當(dāng)?shù)倪x擇評(píng)價(jià)參數(shù)和評(píng)價(jià)方法[5]。 基于ICH的基本原則和建立藥品NIR通用性定量分析方法的特殊性, 選擇模型合適的評(píng)價(jià)參數(shù)就顯得十分重要。 本文總結(jié)歸納了目前各種商品化化學(xué)計(jì)量學(xué)軟件及文獻(xiàn)中常用的評(píng)價(jià)NIR定量模型的統(tǒng)計(jì)學(xué)參數(shù), 同時(shí)結(jié)合ICH Q2 (R1)中對(duì)藥品定量分析方法驗(yàn)證的基本要求, 以92個(gè)藥品NIR通用性定量模型為例, 分別計(jì)算、 統(tǒng)計(jì)、 分析和比較目前常用的NIR定量模型評(píng)價(jià)參數(shù), 系統(tǒng)地揭示藥品NIR通用性定量分析模型的特征, 并嘗試尋找到適宜的評(píng)價(jià)藥品NIR通用性定量分析模型的最佳參數(shù)組合, 為建立藥品NIR通用性定量分析模型評(píng)價(jià)體系提供基礎(chǔ)數(shù)據(jù)。
1.1 參與數(shù)據(jù)統(tǒng)計(jì)的藥品NIR通用性定量分析模型
共收集到92個(gè)藥品NIR通用性定量模型進(jìn)行各個(gè)參數(shù)的計(jì)算、 分析和評(píng)價(jià)。 其中包含2個(gè)注射液模型(分別為硫普羅寧和左氧氟沙星小針劑); 19個(gè)注射用粉針模型(分別為阿莫西林鈉、 氨芐西林鈉、 氨芐西林鈉舒巴坦鈉、 更昔洛韋、 泮托拉唑鈉、 普魯卡因青霉素、 青霉素鈉、 頭孢呋辛鈉、 頭孢拉定、 頭孢美唑鈉、 頭孢哌酮鈉、 頭孢哌酮鈉舒巴坦鈉、 頭孢曲松鈉、 頭孢噻肟鈉、 頭孢唑林鈉、 頭孢唑肟鈉); 10個(gè)注射用粉針?biāo)帜P?分別為氨芐西林鈉舒巴坦鈉、 氨芐西林鈉、 普魯卡因青霉素、 頭孢呋辛鈉、 頭孢美唑鈉、 頭孢哌酮鈉舒巴坦鈉、 頭孢曲松鈉、 頭孢噻肟鈉、 頭孢唑林鈉、 頭孢唑肟鈉); 8個(gè)非鋁塑膠囊劑模型(分別為阿莫西林、 布洛芬、 利福平、 羅紅霉素、 諾氟沙星、 頭孢拉定、 鹽酸雷尼替丁、 鹽酸左氧氟沙星); 7個(gè)鋁塑膠囊劑模型(分別為阿莫西林、 枸櫞酸鉍鉀、 羅紅霉素、 諾氟沙星、 洛伐他汀、 鹽酸克林霉素、 鹽酸左氧氟沙星); 38個(gè)非鋁塑片劑模型(分別為阿卡波糖、 阿莫西林克拉維酸鉀、 阿奇霉素、 阿司匹林、 氨茶堿、 貝諾酯、 吡嗪酰胺、 對(duì)乙酰氨基酚、 呋喃唑酮、 格列吡嗪、 格列齊特、 谷維素、 紅霉素、 琥乙紅霉素、 甲硝唑、 卡托普利、 利巴韋林、 羅紅霉素、 尼莫地平、 尼群地平、 青霉素V、 氫氯噻嗪、 維生素B1、 維生素B2、 維生素B6、 維生素C、 西咪替丁、 硝苯地平、 辛伐他汀、 鹽酸氨溴索、 鹽酸苯海索、 鹽酸吡格列酮、 鹽酸地爾硫卓、 鹽酸二甲雙胍、 鹽酸左氧氟沙星、 氧氟沙星、 異煙肼); 8個(gè)鋁塑片劑模型(分別為阿奇霉素、 苯磺酸氨氯地平、 對(duì)乙酰氨基酚、 利巴韋林、 鹽酸氨溴索、 鹽酸地爾硫卓、 鹽酸左氧氟沙星、 氧氟沙星)。
所有NIR光譜模型的參考方法均采用中國(guó)藥典或部(局)頒藥品標(biāo)準(zhǔn)等國(guó)家法定標(biāo)準(zhǔn)中收載的該品種的含量測(cè)定方法。 NIR光譜的采集均使用布魯克公司的MATRIX-F, MPA或TENSOR37型傅里葉變換型光譜儀, 所有儀器光路相似, 且均配有1.5 m的光纖探頭用于漫反射采樣。 同時(shí), 針對(duì)不同藥品劑型, 光譜采集的關(guān)注點(diǎn)不同[6]: 對(duì)于注射用粉針劑, 直接用光纖探頭抵住玻璃瓶底較平整部位測(cè)量; 對(duì)于液體制劑, 采用附件在光纖探頭前固定形成測(cè)樣槽, 將少量待測(cè)液滴加至測(cè)樣槽中進(jìn)行測(cè)量; 對(duì)于片劑, 按包裝形式分為鋁塑包裝和非鋁塑包裝(瓶裝和鋁鋁包裝)樣品, 非鋁塑包裝樣品, 從包裝中取出后用光纖探頭抵住測(cè)量, 鋁塑包裝樣品無(wú)需拆除包裝, 用光纖探頭直接隔塑料包裝一側(cè)抵住測(cè)量, 測(cè)量位點(diǎn)盡量選擇片劑無(wú)刻痕一面; 對(duì)于膠囊劑, 包裝分類和測(cè)樣方式基本與片劑相同, 只是探頭測(cè)量位點(diǎn)盡量選擇單層膠囊殼一端。
1.2 評(píng)價(jià)參數(shù)與特性
在建立NIR光譜定量模型的過(guò)程中, 通常需要對(duì)NIR光譜預(yù)測(cè)結(jié)果和參照方法測(cè)定結(jié)果進(jìn)行統(tǒng)計(jì)分析, 以評(píng)價(jià)所建模型的質(zhì)量, 從而確定最優(yōu)模型參數(shù)并對(duì)模型的實(shí)用性作出初步的判斷。 模型建成后, 還需要按照ICH的要求對(duì)模型從方法的準(zhǔn)確性、 精密度、 專屬性、 線性、 范圍和耐用性等方面進(jìn)行驗(yàn)證, 以證明方法適合于相應(yīng)的檢測(cè)要求。 因此, 無(wú)論是模型關(guān)鍵評(píng)價(jià)參數(shù)的選擇還是最優(yōu)模型的確定都應(yīng)為進(jìn)一步的方法驗(yàn)證打下良好的基礎(chǔ)。
1.2.1 準(zhǔn)確性參數(shù)
對(duì)于NIR定量模型, 方法的準(zhǔn)確性往往倍受關(guān)注。 評(píng)價(jià)NIR模型預(yù)測(cè)準(zhǔn)確性的實(shí)質(zhì)就是評(píng)價(jià)NIR預(yù)測(cè)結(jié)果與樣品參照結(jié)果的接近程度。 模型優(yōu)化時(shí), 主要通過(guò)比較誤差參數(shù)在優(yōu)化過(guò)程中的變化, 確定最優(yōu)模型; 建模時(shí)如設(shè)有驗(yàn)證集, 則應(yīng)首選驗(yàn)證集的誤差參數(shù)進(jìn)行比較, 如無(wú)驗(yàn)證集, 也可以利用訓(xùn)練集進(jìn)行比較。 方法驗(yàn)證時(shí), 則主要比較NIR模型對(duì)與訓(xùn)練集完全獨(dú)立的驗(yàn)證集樣本的預(yù)測(cè)結(jié)果與參照結(jié)果之間是否有顯著性差異。 目前主要的誤差評(píng)價(jià)參數(shù)如下:
1.2.1.1 偏差(Bias)
偏差, 即NIR預(yù)測(cè)值(Y)與參照值(X)之差。 在模型評(píng)價(jià)中的偏差一般指平均偏差, 計(jì)算公式見(jiàn)式(1), 用于表征NIR校正模型的總體準(zhǔn)確性[7]。
(1)
式中,n為訓(xùn)練集或者驗(yàn)證集的樣本數(shù)量。 以下公式中X,Y和n的意義與此相同。
1.2.1.2 SECV和SEP
交叉驗(yàn)證標(biāo)準(zhǔn)誤差(standard error of cross-validauion, SECV)和預(yù)測(cè)標(biāo)準(zhǔn)誤差(standard error of prediction, SEP)均表征NIR結(jié)果與參照結(jié)果差異的標(biāo)準(zhǔn)差[7], 但SECV表示的是訓(xùn)練集樣本交互驗(yàn)證的標(biāo)準(zhǔn)差, 而SEP是模型對(duì)驗(yàn)證集樣本的預(yù)測(cè)標(biāo)準(zhǔn)差, 兩者計(jì)算公式見(jiàn)式(2)
(2)
1.2.1.3 RMSECV和RMSEP
交叉驗(yàn)證均方根誤差(root mean square error of cross-validation, RMSECV)和預(yù)測(cè)均方根誤差(root mean square error of prediction, RMSEP)均表征NIR結(jié)果與參照結(jié)果差異的標(biāo)準(zhǔn)誤差[7], 但RMSECV表示訓(xùn)練集樣本交互驗(yàn)證結(jié)果的標(biāo)準(zhǔn)誤差, 而RMSEP表示模型對(duì)驗(yàn)證集樣本預(yù)測(cè)結(jié)果的標(biāo)準(zhǔn)誤差, 兩者計(jì)算公式見(jiàn)式(3)。 部分文獻(xiàn)中使用n-1做分母, 當(dāng)n→∞時(shí), (n-1)/n→1, 所以當(dāng)樣本足夠大時(shí), 對(duì)結(jié)果影響不大。 RMSECV/RMSEP中包含有偏差的信息, 如果偏差為0, RMSECV/RMSEP與SECV/SEP一致, 但當(dāng)偏差存在時(shí), RMSECV/RMSEP要明顯大于SECV/SEP。 從式(3)可以看出, 雖然RMSECV/RMSEP與偏差有關(guān), 但并不能暗示偏差的大小和特征, 因此, 標(biāo)準(zhǔn)誤差和偏差都經(jīng)常用于評(píng)價(jià)模型的準(zhǔn)確性。
(3)
1.2.1.4 RPD
Williams等[8]于1993年提出用相對(duì)分析誤差[ratio of (standard error of) prediction (validation) to (standard) deviation, RPD]參數(shù)來(lái)評(píng)價(jià)NIR定量模型的準(zhǔn)確性, 現(xiàn)已成為農(nóng)業(yè)領(lǐng)域評(píng)價(jià)模型有效性使用頻率最高的參數(shù)之一。 通常要求RPD為5或者更高[9]。 其計(jì)算公式見(jiàn)式(4), SDx為驗(yàn)證集樣本參照結(jié)果的標(biāo)準(zhǔn)偏差; 如采用交叉驗(yàn)證方法評(píng)價(jià), RPD為訓(xùn)練集樣本參照值的標(biāo)準(zhǔn)偏差與SECV的比值。 RPD是一個(gè)簡(jiǎn)單的可以對(duì)SEP進(jìn)行評(píng)價(jià)的統(tǒng)計(jì)量。 SEP應(yīng)該遠(yuǎn)低于SDx, 如果SEP值與SDx相等或者大于SDx值, 就意味著方法無(wú)法準(zhǔn)確預(yù)測(cè)參照值。
RPD=SDx/SEP
(4)
1.2.1.5 RER
濃度范圍與預(yù)測(cè)(交叉驗(yàn)證)標(biāo)準(zhǔn)誤差的比值[ratio of the SEP(SECV) to the range, RER]是Starr等提出的將SEP與參照值濃度范圍相關(guān), 建立的另外一個(gè)標(biāo)準(zhǔn)化的SEP評(píng)價(jià)指標(biāo)[10], 其計(jì)算公式見(jiàn)式(5)。 RER值應(yīng)該越大越好, 但其易受參照值個(gè)別數(shù)據(jù)的影響, 一個(gè)極值參照就可能導(dǎo)致RER值升高, 因此要求參照數(shù)據(jù)的濃度范圍呈均勻分布。
(5)
1.2.1.6 相對(duì)偏差
除了以上參數(shù)之外, 在藥品通用性定量模型中, 為了更加直觀地比較預(yù)測(cè)結(jié)果與參照結(jié)果之間的差異, 引入相對(duì)偏差(relative deviation)的概念[11], 其計(jì)算公式見(jiàn)式(6)。 相對(duì)偏差表示每一個(gè)NIR預(yù)測(cè)結(jié)果與對(duì)應(yīng)的參照結(jié)果的差異占參照結(jié)果的百分比。 與常規(guī)的相對(duì)偏差[12]表示的意義不同, 式(6)中Xi不再代表對(duì)某一樣品多次測(cè)量的平均值, 而是代表第i個(gè)樣品的參照結(jié)果。 一般通用性模型訓(xùn)練集或者驗(yàn)證集中樣品間的濃度差異較大, 采用相對(duì)偏差可以減少濃度對(duì)預(yù)測(cè)偏差的影響。 為了表征NIR訓(xùn)練集或者驗(yàn)證集樣本的總體偏差, 使用平均絕對(duì)偏差[average absolute deviation, AAD, 式(7)]和平均相對(duì)偏差[average relative deviation, ARD, 式(8)], 式中ARD使用相對(duì)偏差的絕對(duì)值進(jìn)行計(jì)算。
(6)
(7)
(8)
1.2.2 線性參數(shù)
NIR模型的線性與傳統(tǒng)分析方法的線性不同。 由于NIR模型一般采用多元回歸法建立, 所以它的線性通常由待分析物的預(yù)測(cè)結(jié)果與參照結(jié)果之間的關(guān)系表征; 而線性范圍, 表征模型能達(dá)到一定精密度、 準(zhǔn)確性要求時(shí)高低限濃度或量的區(qū)間, 主要由建模訓(xùn)練集樣本的濃度范圍決定。 因此, 線性也可以間接反映NIR定量模型的準(zhǔn)確性。 但與上述準(zhǔn)確性參數(shù)所表征的意義不同: 誤差分析主要表征NIR預(yù)測(cè)結(jié)果與參照結(jié)果之間的誤差大小, 而線性主要表征NIR方法與參照方法之間的相關(guān)性。 只有當(dāng)NIR方法與參照方法之間具有明確的相關(guān)性, 且NIR預(yù)測(cè)結(jié)果與參照結(jié)果之間的誤差在可接受范圍, NIR方法才具有實(shí)用價(jià)值。
方法驗(yàn)證時(shí)主要關(guān)注驗(yàn)證集樣本預(yù)測(cè)結(jié)果與參照結(jié)果所得直線的截距、 斜率、 相關(guān)系數(shù)和決定系數(shù)。 模型優(yōu)化時(shí)也可以用訓(xùn)練集樣本的交叉驗(yàn)證結(jié)果代替。
1.2.2.1 相關(guān)系數(shù)r和決定系數(shù)R2
r(correlation coefficient)表征兩組數(shù)據(jù)(即參照結(jié)果和NIR預(yù)測(cè)結(jié)果)彼此間的相關(guān)程度[12], 其計(jì)算公式見(jiàn)式(9)。 當(dāng)r=1時(shí), 兩組數(shù)據(jù)完全相關(guān)。 由于無(wú)論是X或Y都可能產(chǎn)生誤差, 因此,X和Y可能呈正或負(fù)相關(guān)。
R2(determination coefficient)是以回歸偏差占總偏差的比率來(lái)表示回歸模型的擬合優(yōu)度[13], 計(jì)算公式見(jiàn)式(10)。 可以推導(dǎo)出當(dāng)X與Y線性相關(guān)時(shí), 決定系數(shù)為相關(guān)系數(shù)r的平方, 即決定系數(shù)R2同相關(guān)系數(shù)r具有一致性。 如果R2=90%, 則表示總偏差中的90%可以由X和Y的依存關(guān)系來(lái)解釋, 只有10%屬于隨機(jī)因素(如樣品制備, 參照方法測(cè)試等)。 當(dāng)R2=50%時(shí),r=71%, 雖然此時(shí)隨機(jī)因素的影響已經(jīng)有50%, 但X和Y的依存關(guān)系仍占主導(dǎo)地位, 這是可以接受結(jié)果的底線[14]。 另外決定系數(shù)也可以寫成式(11), 式中SDc為訓(xùn)練集濃度值的標(biāo)準(zhǔn)偏差[式(12)]。 可以看出R2的大小與濃度分布范圍有關(guān), 相同的RMSECV, 濃度分布范圍越寬(SDc越大),R2也越大[15]。 因此采用R2表征NIR定量模型的相關(guān)關(guān)系較r可以得到更多的有用信息。
(9)
(10)
(11)
(12)
1.2.2.2 回歸系數(shù)和截距
回歸系數(shù)(regression coefficient,b)也被稱為斜率, 通常b和截距(intercept,a)共同用來(lái)表征Y值能被X值準(zhǔn)確預(yù)測(cè)的程度[8], 其計(jì)算公式見(jiàn)式(13)和(14)。b和a通常和r一起用于從整體上評(píng)價(jià)NIR結(jié)果與參照結(jié)果兩組數(shù)據(jù)是否具有相關(guān)性。 由于存在誤差, NIR結(jié)果與參照結(jié)果的擬合方程通常呈Y=bX+a的形式。 當(dāng)兩種方法存在系統(tǒng)誤差(b=1,a≠0)時(shí), 如果r=1, 且系統(tǒng)誤差在可接受的范圍時(shí), NIR方法仍然可被接受; 但如果參數(shù)b≠1且與1相差較大, 則表示NIR預(yù)測(cè)結(jié)果與參照方法之間不存在相關(guān)性, 此時(shí)參數(shù)r明顯小于1, NIR預(yù)測(cè)結(jié)果的準(zhǔn)確性受到質(zhì)疑。 上述分析也提示參數(shù)r較參數(shù)b和a更加重要。
(13)
(14)
1.2.3 精密度參數(shù)
精密度主要指在規(guī)定條件下, 同一份均勻供試品, 經(jīng)多次取樣測(cè)定所得結(jié)果之間的接近程度。 對(duì)于NIR方法精密度的評(píng)價(jià), 主要包含兩方面: 一是指在同一實(shí)驗(yàn)室, 由同一操作者使用相同的儀器設(shè)備, 按照相同的測(cè)試方法在短時(shí)間內(nèi)對(duì)同一被測(cè)樣品相互獨(dú)立進(jìn)行測(cè)試(重復(fù)性); 二是指在不同實(shí)驗(yàn)室, 由不同操作者使用不同的儀器設(shè)備, 按相同的測(cè)試方法對(duì)同一被測(cè)樣品相互獨(dú)立進(jìn)行測(cè)試(重現(xiàn)性)。 一般用測(cè)定結(jié)果的標(biāo)準(zhǔn)偏差(SD)來(lái)表征精密度, 計(jì)算公式如式(12), 其中X代表重復(fù)測(cè)量的結(jié)果。
1.2.4 耐用性參數(shù)
耐用性系指當(dāng)測(cè)定條件有小的變動(dòng)時(shí), 方法所能承受的保證測(cè)定結(jié)果不受影響的程度。 NIR光譜, 特別是液體樣品的NIR光譜受環(huán)境等因素的影響較大。 NIR模型的耐用性主要指模型應(yīng)對(duì)樣品光譜變動(dòng)的適應(yīng)性質(zhì), 它表示了測(cè)量中模型允許光譜的變異范圍: 耐用性較好的模型應(yīng)對(duì)樣品光譜變動(dòng)的適應(yīng)能力較強(qiáng), 反之較差。 對(duì)于藥品NIR通用性定量分析模型, 訓(xùn)練集樣本的代表性與模型的耐用性息息相關(guān)。 對(duì)在建模中同時(shí)存在訓(xùn)練集和驗(yàn)證集的模型, 通過(guò)對(duì)訓(xùn)練集樣本參照數(shù)據(jù)的均值和標(biāo)準(zhǔn)偏差與驗(yàn)證集樣本的結(jié)果進(jìn)行比較, 可以判斷訓(xùn)練集和驗(yàn)證集的樣本是否來(lái)自相同的總體且具有相同的代表性。 另外國(guó)際谷物化學(xué)組織(International Cereal Chemists, ICC)在2001年公布的通用標(biāo)準(zhǔn)化NIR分析推薦草案《No. 202. General Recommendation for Standardization Near Infrared Analysis (Draft 2001)》, 簡(jiǎn)稱ICC標(biāo)準(zhǔn))中, 將SEP/SEC作為穩(wěn)健性評(píng)價(jià)的指標(biāo)性參數(shù), 規(guī)定在正常的容變性范圍之內(nèi), 該值應(yīng)小于1.2, 其值大于1.2則表示模型穩(wěn)健性不佳。
1.2.5 專屬性參數(shù)
NIR方法的專屬性主要指模型識(shí)別分析物是否為特定分析對(duì)象的能力。 在NIR分析方法中, 除了常規(guī)的比較PLS載荷因子與活性成分光譜之外, 也常采用馬氏距離來(lái)評(píng)判一個(gè)模型的專屬性。 目前, 國(guó)內(nèi)外尚未見(jiàn)直接用于評(píng)價(jià)模型專屬性的公認(rèn)參數(shù)。 但由于藥品NIR通用性模型通常與定性模型串聯(lián)使用, 只有定性判別為此品種的藥品才應(yīng)用相應(yīng)的定量模型。 所以專屬性本身對(duì)于這類模型來(lái)說(shuō)目前不是關(guān)鍵評(píng)價(jià)指標(biāo)。
2.1 各參數(shù)之間的關(guān)系
2.1.1 RMSECV與SECV, RMSEP與SEP相關(guān)性
通過(guò)計(jì)算92個(gè)模型交叉驗(yàn)證和外部驗(yàn)證結(jié)果, 得到RMSECV(x)與SECV(y)的相關(guān)性方程為y=1.007 6x+0.000 6(r=0.999 9), RMSEP(x)與SEP(y)的相關(guān)性方程為y=1.011 7x-0.011 2(r=0.999 7)。 由于所有模型的預(yù)測(cè)偏差均較小, 故SECV(SEP)和RMSECV(RMSEP)幾乎相等, 兩者的r值均大于0.999; 此時(shí), 只需使用其中的一個(gè)參數(shù)就可以表征模型的預(yù)測(cè)誤差。
2.1.2 RMSECV與AAD相關(guān)性
實(shí)驗(yàn)結(jié)果顯示, 各模型訓(xùn)練集樣本AAD在數(shù)值上與RMSECV相當(dāng), 略低于RMSECV(圖1), 并和RMSECV(x)呈很好的線性關(guān)系(y=0.786 2x-0.004 5,r=0.995 9)。 驗(yàn)證集的AAD與RMSEP也呈類似關(guān)系。 由于AAD在一般商業(yè)化軟件中不能直接得到, 因此在使用過(guò)程中可以用RMSECV或者RMSEP來(lái)預(yù)測(cè)AAD較為方便。
圖1 92個(gè)模型訓(xùn)練集的RMSECV與平均絕對(duì)偏差
2.1.3 RMSECV/RMSEP與ARD相關(guān)性
通用性定量模型由于所針對(duì)的預(yù)測(cè)對(duì)象是來(lái)自不同企業(yè)的相同藥品, 藥品處方和規(guī)格的差異使得不同的樣品, 單位質(zhì)量中藥品活性成分的量可能有較大的差異。 因此盡管樣品的絕對(duì)偏差可能一致, 但其相對(duì)偏差可能相差較大。 從圖2可以看出, ARD和RMSECV/RMSEP沒(méi)有顯著的相關(guān)性。 因此在評(píng)價(jià)通用性定量模型時(shí), 逐一計(jì)算驗(yàn)證樣本的相對(duì)偏差以及整體的ARD可更有效地表征模型的預(yù)測(cè)能力。
圖2 ARD與RMSECV(a)/RMSEP(b)關(guān)系圖
2.1.4 RMSECV與R2相關(guān)性
選擇劑型、 包裝相同的通用性模型如2.1.3中作圖的方法比較模型R2與RMSECV的關(guān)系。 結(jié)果39個(gè)非鋁塑包裝片劑通用性模型的R2與RMSECV沒(méi)有明顯線性關(guān)系。 即對(duì)于不同的訓(xùn)練集樣本來(lái)說(shuō), 不能單憑R2的大小來(lái)評(píng)價(jià)模型的準(zhǔn)確性。 對(duì)于同一訓(xùn)練集樣品, 由于R2越大, NIR預(yù)測(cè)結(jié)果與參照結(jié)果之間的誤差越小, NIR方法與參照方法之間的相關(guān)性越強(qiáng), 因此R2用來(lái)評(píng)價(jià)使用相同訓(xùn)練集樣本優(yōu)化模型時(shí), 是一個(gè)很好的模型評(píng)價(jià)參數(shù)。 但R2不能單獨(dú)用來(lái)評(píng)價(jià)不同訓(xùn)練集所建立的不同模型的質(zhì)量。
2.1.5 RPD與RER,R2和RMSECV相關(guān)性
RPD和RER都是無(wú)量綱的評(píng)價(jià)參數(shù), 它們不僅可以作為模型優(yōu)化時(shí)的評(píng)價(jià)參數(shù), 也可以用于不同模型的橫向比較。 由于, 驗(yàn)證集或訓(xùn)練集中樣品分布的SD或樣品濃度范圍可表征樣品參比值的范圍, 因此這兩個(gè)參數(shù)還可表征NIR模型對(duì)于含有不同待測(cè)量樣品的分辨能力[16]。 模型的分辨能力與被分析物含量跨度范圍大小有關(guān), 當(dāng)不同的訓(xùn)練集樣品參比值有相同的均值和SEP時(shí), 含量跨度越大, 模型對(duì)未知樣品預(yù)測(cè)結(jié)果的可修正范圍越大, 模型對(duì)不同預(yù)測(cè)樣品的分辨能力更強(qiáng), 預(yù)測(cè)結(jié)果更準(zhǔn)確。 和RPD相比, RER易受樣品極值濃度的影響, 因此RPD更為常用。
如果建模數(shù)據(jù)呈正態(tài)分布, RPD還可以寫成式(15), 可見(jiàn)雖然RPD會(huì)隨R2的增加而增加, 但當(dāng)R2接近100%時(shí), RPD值仍有較大的變化。 一般認(rèn)為R2大于0.75, 即RPD大于2時(shí), 模型已達(dá)到可接受程度。
(15)
另外, 通過(guò)如2.1.3中的作圖方法分析, RPD與RMSECV的相關(guān)性較小, 是兩個(gè)相對(duì)獨(dú)立的量, 故二者可能不一致。
2.2 關(guān)鍵評(píng)價(jià)參數(shù)的選擇和數(shù)值范圍統(tǒng)計(jì)
2.2.1 準(zhǔn)確性參數(shù)
2.2.1.1 偏差
圖3為92個(gè)模型交叉驗(yàn)證和外部驗(yàn)證結(jié)果偏差的正態(tài)分布圖(受樣品量的影響, 只有35個(gè)模型存在外部驗(yàn)證結(jié)果), 交叉驗(yàn)證的偏差基本分布在±0.1%之間, 而外部驗(yàn)證的偏差分布在±0.5%之間。 由于交叉驗(yàn)證時(shí)所有的樣本均來(lái)自同一個(gè)整體, 故得到的偏差結(jié)果偏低, 并不能很好的反映出模型預(yù)測(cè)偏差的真實(shí)特征。 實(shí)際應(yīng)用中藥品NIR通用性模型主要用于篩查含量遠(yuǎn)低于標(biāo)示含量的假藥, 因此無(wú)論是0.1%或0.5%的差異都是微不足道的。 故這個(gè)參數(shù)可以不作為藥品NIR通用性模型的關(guān)鍵評(píng)價(jià)參數(shù)。
圖3 偏差結(jié)果概率密度函數(shù)圖
2.2.1.2 RMSECV/RMSEP
由前面對(duì)各參數(shù)關(guān)系特性的分析可知, 當(dāng)預(yù)測(cè)偏差不能忽略時(shí), RMSECV/RMSEP要明顯大于SECV/SEP, 對(duì)模型的預(yù)測(cè)偏差更敏感, 故更推薦使用RMSECV/RMSEP表征模型的預(yù)測(cè)誤差。 統(tǒng)計(jì)所有92個(gè)模型的RMSECV和RMSEP結(jié)果發(fā)現(xiàn), 除5個(gè)結(jié)果外, 其他結(jié)果均在3%以內(nèi), 提示如果所建模型的RMSECV/RMSEP大于3%, 需要仔細(xì)研究尋找原因。
2.2.1.3 ARD
由于ARD和RMSECV/RMSEP沒(méi)有顯著的相關(guān)性, 故通常二者不能任選其一, 因此ARD也是藥品通用性定量分析模型必不可少的評(píng)價(jià)參數(shù)之一。 本文共對(duì)10個(gè)注射用粉針劑水分含量模型進(jìn)行了分析, 所有訓(xùn)練集和驗(yàn)證集共包含804個(gè)樣品, 通過(guò)留一法交叉驗(yàn)證和驗(yàn)證集外部驗(yàn)證共得到804個(gè)NIR預(yù)測(cè)結(jié)果, 以相對(duì)偏差來(lái)表示對(duì)每一個(gè)樣品預(yù)測(cè)的誤差(表1), 可見(jiàn)注射用粉針劑水分含量均在10%以下, 隨著水分含量的升高, 預(yù)測(cè)ARD逐漸減小。
表1 注射用粉針劑水分含量預(yù)測(cè)結(jié)果相對(duì)偏差分析
同理對(duì)19個(gè)注射用粉針劑活性成分定量模型所涉及到的1743個(gè)樣品的NIR預(yù)測(cè)結(jié)果與參照結(jié)果進(jìn)行了比較(表2)。 由于注射用粉針劑中的輔料相對(duì)于其他劑型要少, 因此活性成分含量相對(duì)較高, 同時(shí)可見(jiàn)當(dāng)含量高于60%時(shí), 盡管NIR的測(cè)量方式是隔著玻璃瓶測(cè)量, 但其分析ARD小于2%。 對(duì)38個(gè)非鋁塑包裝片劑定量分析模型所涉及到的3 590個(gè)樣品的NIR預(yù)測(cè)結(jié)果與參照結(jié)果進(jìn)行了分析(表2)。 樣品的參照結(jié)果均大于2%, 大多數(shù)含量在10%至80%之間。 與注射用粉針劑預(yù)測(cè)模型相比較, 在相同的濃度范圍, 不管是水分模型還是活性成分預(yù)測(cè)模型, 片劑預(yù)測(cè)結(jié)果的ARD都大于注射用粉針劑預(yù)測(cè)結(jié)果的ARD。 由于片劑成分的復(fù)雜程度遠(yuǎn)大于注射用粉針劑, 提示通用性NIR模型的預(yù)測(cè)準(zhǔn)確性不僅與模型的預(yù)測(cè)范圍有關(guān), 還和待測(cè)成分的復(fù)雜程度有關(guān)。 對(duì)8個(gè)非鋁塑包裝膠囊劑定量分析模型所涉及到的841個(gè)樣品的NIR預(yù)測(cè)結(jié)果與參照結(jié)果進(jìn)行比較(表2), 可見(jiàn), 由于受到膠囊殼的干擾, 即使是去除鋁塑包裝直接使用光纖測(cè)量膠囊劑, 在同一含量范圍內(nèi), 膠囊劑測(cè)量ARD明顯高于注射用粉針劑和片劑的活性成分。
表2 各劑型活性成分含量預(yù)測(cè)結(jié)果相對(duì)偏差分析
Table 2 The ARD analysis of the universal quantitative models in the different formulations for their corresponding APIs (active pharmaceutical ingredient)
劑型活性成分含量/%樣品量平均相對(duì)偏差/%最大相對(duì)偏差/%最小相對(duì)偏差/%注射用粉針劑<202115 1441 280 8120≤含量<402592 6227 550 0040≤含量<603122 5522 950 0160≤含量<803491 9112 160 0180≤含量<906401 389 210 00≥901621 326 540 02非鋁塑包裝片劑2≤含量<54075 05140 970 005≤含量<102475 0961 490 0010≤含量<209453 0021 180 0120≤含量<403963 2319 960 0140≤含量<605252 9814 190 0160≤含量<807761 8810 930 00≥802941 347 600 00非鋁塑包裝膠囊劑20≤含量<40358 7330 400 2140≤含量<602594 0917 560 0060≤含量<803052 4514 210 01≥802421 787 120 02
另外, 在92個(gè)模型中有7個(gè)片劑品種和4個(gè)膠囊劑品種用同樣的樣品既建立了鋁塑包裝模型又建立了非鋁塑包裝模型。 比較同一品種藥品的這兩種模型, 發(fā)現(xiàn)總體上鋁塑包裝模型的各項(xiàng)統(tǒng)計(jì)參數(shù)略差于非鋁塑包裝的結(jié)果, 證明塑料包裝可影響預(yù)測(cè)結(jié)果的準(zhǔn)確性。
2.2.1.4 RPD
92個(gè)模型的RPD有86個(gè)在2以上, 42個(gè)在5以上, 且由于通用性模型涉及不同生產(chǎn)工藝的同種產(chǎn)品, 樣品處方的差異使得其含量的跨度較大, 因此個(gè)別模型RPD值更高。
2.2.2 線性參數(shù)
評(píng)價(jià)模型線性的參數(shù)主要有R2,r,a和b。 由前面的原理介紹和關(guān)系分析可知, 更傾向于使用R2來(lái)評(píng)價(jià)NIR模型的準(zhǔn)確性, 且與其他幾個(gè)參數(shù)相比,R2可由多數(shù)NIR商業(yè)化軟件直接給出, 無(wú)需再另外計(jì)算。 經(jīng)統(tǒng)計(jì)92個(gè)模型, 大部分R2集中在80%~100%之間, 也有個(gè)別模型的R2只有20%, 但并不影響模型的預(yù)測(cè)能力。 同樣說(shuō)明R2不宜單獨(dú)用來(lái)評(píng)價(jià)不同訓(xùn)練集所建立的不同模型的質(zhì)量。
2.2.3 精密度參數(shù)
模型精密度評(píng)價(jià)對(duì)于規(guī)范NIR的操作, 以及考核模型能否在不同儀器間傳遞具有重要的意義。 ICC標(biāo)準(zhǔn)規(guī)定同一樣品在同一儀器多次測(cè)定計(jì)算的預(yù)測(cè)精密度標(biāo)準(zhǔn)差要小于等于0.5×SEP, 另一國(guó)際組織美國(guó)谷物化學(xué)家協(xié)會(huì)(American Association of Cereal Chemists, AACC)在其批準(zhǔn)的方法(《AACC Method 39-00 Near-Infrared Methods——Guidelines for model Development and Maintenance》, 簡(jiǎn)稱AACC標(biāo)準(zhǔn))中規(guī)定該值應(yīng)小于等于0.33×SEP, 即重復(fù)性標(biāo)準(zhǔn)差大約占SEP的1/2~1/3; ICC標(biāo)準(zhǔn)規(guī)定模型在同一品牌儀器的子機(jī)之間傳遞時(shí), 定標(biāo)模型傳遞的標(biāo)準(zhǔn)差要小于等于0.7×SEP(AACC標(biāo)準(zhǔn)則定為0.5×SEP)。 由于SEP不但包含了光譜測(cè)量與參比值測(cè)量產(chǎn)生的隨機(jī)誤差、 系統(tǒng)誤差, 還包含模型穩(wěn)健性不足產(chǎn)生的偏差以及信息處理過(guò)程中產(chǎn)生的誤差, 因此NIR方法的精密度(SD)和參照方法的精密度(SD)應(yīng)低于SEP; 且NIR方法本身的精密度可能好于參照方法。 以往在藥品NIR通用性模型的建模過(guò)程中, 對(duì)精密度的關(guān)注較少, 特別是同一樣品在同一實(shí)驗(yàn)室的重復(fù)測(cè)定結(jié)果, 因此目前沒(méi)有足夠的數(shù)據(jù)精確估算重復(fù)性與SEP的關(guān)系。 對(duì)于個(gè)別品種, 曾經(jīng)進(jìn)行過(guò)不同儀器間模型傳遞精密度的考察, 比如琥乙紅霉素和羅紅霉素片劑的通用性定量分析模型[11](表3), 可見(jiàn)由于RMSEP與SEP結(jié)果相近, 因此精密度與SEP的關(guān)系可以用精密度與RMSEP的關(guān)系代替。 對(duì)琥乙紅霉素片劑模型, 13個(gè)樣品分別在7臺(tái)不同儀器上測(cè)定結(jié)果的重現(xiàn)性均小于0.5RMSEP, 對(duì)羅紅霉素片劑模型, 盡管大部分結(jié)果小于0.7RMSEP, 但有一批樣品的結(jié)果大于SEP(該批樣品的含量為31%左右), 可見(jiàn)不同儀器間的再現(xiàn)性不僅與被測(cè)樣品的濃度有關(guān), 還可能與被測(cè)品種的復(fù)雜程度(處方、 工藝)有關(guān)。
2.2.4 耐用性參數(shù)
92個(gè)模型中只有35個(gè)模型存在獨(dú)立的驗(yàn)證集。 在建立NIR通用性模型時(shí), 由于樣品量的限制, 為保證訓(xùn)練集的代表性, 往往訓(xùn)練集樣本所包含的變異要多于驗(yàn)證集, 即目前的35個(gè)驗(yàn)證集不能保證包含與訓(xùn)練集完全相同的獨(dú)立樣本。 因此一般情況下, 訓(xùn)練集樣本的SDc會(huì)大于驗(yàn)證集樣本的SDx, 如果出現(xiàn)相反的情況, 則提示訓(xùn)練集樣本的代表性不全。 實(shí)驗(yàn)結(jié)果表明35個(gè)模型中, SDx大于SDc的模型有21個(gè), 剩余的14個(gè)模型中, 有7個(gè)模型的SDx與SDc相對(duì)偏差小于10%, 與理論分析結(jié)果基本一致。
表3 琥乙紅霉素、 羅紅霉素非鋁塑片劑模型傳遞統(tǒng)計(jì)結(jié)果
Table 3 The statistical results of transferability for the universal quantitative model for determination of erythromycin ethylsuccinate or roxithromycin in tablets without blister packing
樣品編號(hào)琥乙紅霉素統(tǒng)計(jì)結(jié)果羅紅霉素統(tǒng)計(jì)結(jié)果SD/%SD/RMSEP?SD/SEP?SD/%SD/RMSEP?SD/SEP?10 350 170 170 340 230 2320 390 180 190 750 510 5130 440 210 210 320 220 2240 300 140 140 770 530 5350 300 140 140 360 250 2560 370 170 170 390 270 2770 390 180 181 170 810 8180 650 310 311 891 301 3090 240 110 120 550 380 38100 190 090 091 260 870 87110 750 350 351 070 740 74120 900 420 420 540 370 37130 680 320 320 910 620 62均值0 460 220 220 790 550 55
*琥乙紅霉素模型: RMSEP=2.13%, SEP=2.12%; 羅紅霉素模型: RMSEP=1.45%, SEP=1.45%
*The model for erythromycin ethylsuccinate: RMSEP=2.13%, SEP=2.12%; The model for roxithromycin: RMSEP=1.45%, SEP=1.45%
由2.1.1可知SECV(SEP)和RMSECV(RMSEP)幾乎相等, 因此本研究計(jì)算了所有35個(gè)模型RMSEP與RMSECV的比值, 均在1.5以內(nèi)。
研究表明, 在建立藥品NIR通用性定量分析模型過(guò)程中, RMSECV/RMSEP, ARD, RPD,R2, 重復(fù)測(cè)定結(jié)果的SD和RMSEP與RMSECV的比值6個(gè)參數(shù)是模型優(yōu)化過(guò)程中的關(guān)鍵評(píng)價(jià)參數(shù), 利用這組參數(shù)可從模型的準(zhǔn)確性、 線性、 精密度和耐用性四個(gè)方面對(duì)模型進(jìn)行全面的表征。
通過(guò)對(duì)92個(gè)藥品NIR通用性定量分析模型參數(shù)值的統(tǒng)計(jì), 發(fā)現(xiàn)大部分模型的RMSECV/RMSEP在3%以內(nèi), 其中RMSECV在數(shù)值上與AAD相當(dāng); RPD值大于2; ARD的數(shù)值與模型的類型(劑型、 樣品的包裝形式)和待測(cè)成分的含量分布有關(guān);R2在80%~100%之間; RMSECV與RMSEP的比值在1.5以內(nèi)。 另外研究還提示, 目前對(duì)藥品NIR通用性定量分析模型精密度的關(guān)注較少; 由于該參數(shù)對(duì)于規(guī)范NIR操作, 考核模型能否在不同儀器間傳遞具有重要的意義, 應(yīng)在以后的建模過(guò)程中予以關(guān)注。
本研究結(jié)果不僅藥品NIR通用性模型的建立者和使用者提供了評(píng)價(jià)模型優(yōu)劣的依據(jù), 也為完善藥品NIR通用性定量分析模型的參數(shù)評(píng)價(jià)體系提供了基礎(chǔ)數(shù)據(jù)。
[1] HU Chang-qin, FENG Yan-chun(胡昌勤, 馮艷春). Chinese Pharmaceutical Affairs(中國(guó)藥事), 2004, 18(4): 250.
[2] HU Chang-qin, FENG Yan-chun, XUE Jing, et al(胡昌勤, 馮艷春, 薛 晶, 等). Chinese Journal of Pharmaceutical Analysis(藥物分析雜志), 2008, 28(4): 647.
[3] Chu X L, Lu J. NIR News, 2014, 25(6): 13.
[4] Hu C Q, Feng Y C, Yin L H. J. Near Infrared Spec., 2015, 23: 271.
[5] De Bleye C, Chavez P F, Mantanus J, et al. J. Pharmaceut. Biomed., 2012, 69: 125.
[6] HU Chang-qin, FENG Yan-chun(胡昌勤, 馮艷春). Near Infrared Spectroscopy for Rapid Drug Analysis(近紅外光譜法快速分析藥品). Beijing: Chemical Industry Press(北京: 化學(xué)工業(yè)出版社), 2011. 106.
[8] Williams P C, Sobering D C. J. Near Infrared Spec., 1993, 1: 25.
[9] Williams P C, Norris K. Near-Infrared Technology in the Agricultural and Food Industries. Saint Paul: American Association of Cereal Chemists Press, 2001. 145.
[10] Starr C, Morgan A G, Smith D B. J. Agric. Sci., 1981, 97: 107.
[11] Feng Y C, Hu C Q. J. Pharmaceut. Biomed., 2006, 41: 373.
[12] SUN Yu-qing(孫毓慶). Analytical Chemistry(分析化學(xué)). Beijing: People’s Medical Publishing House(北京: 人民衛(wèi)生出版社), 1991. 10.
[13] Gujarati D N, Porter D C. Basic Econometrics(計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)). Translated by FEI Jian-ping(費(fèi)劍平, 譯). Beijing: China Renmin University Press(北京: 中國(guó)人民大學(xué)出版社), 2011. 75.
[14] H?rdle W K, Simar L. Applied Multivariate Statistical Analysis. 2nd ed. Berlin: Springer-Verlag, 2007. 75.
[15] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications(分子光譜與化學(xué)計(jì)量學(xué)及其應(yīng)用). Beijing: Chemical Industry Press(北京: 化學(xué)工業(yè)出版社), 2011. 64.
[16] YAN Yan-lu, CHEN Bin, ZHU Da-zhou, et al(嚴(yán)衍祿, 陳 斌, 朱大洲, 等). Near Infrared Spectroscopy——Principles, Technologies and Applications(近紅外光譜分析的原理、 技術(shù)與應(yīng)用). Beijing: China Light Industry Press(北京: 中國(guó)輕工業(yè)出版社), 2013. 169.
*Corresponding author
Study on the Selection of Parameters for Evaluating Drug NIR Universal Quantitative Models
FENG Yan-chun, ZHANG Qi, HU Chang-qin*
National Institutes for Food and Drug Control, Beijing 100050, China
In order to find out the optimum combination of the evaluation parameters for the selection of the best drug near infrared (NIR) universal quantitative model during model optimization, 13 common evaluation parameters of NIR quantitative models were collected and arranged from commercial chemometrics software or references based on the requirements of validation of quantitative analytical procedures of ICH (International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use). Then all these parameters of 92 drug NIR universal quantitative models were calculated and analyzed. By studying the correlation of these parameters, the optimum combination of evaluation parameters for drug NIR universal quantitative models was determined. And the value range of these parameters in the optimum combination was also obtained. Root mean square error of cross-validation(RMSECV)/root mean square error of prediction (RMSEP), average relative deviation (ARD) and ratio of (standard error of) prediction (validation) to (standard) deviation (RPD) were used as the key parameters to evaluate the model accuracy. Most of RMSECV/RMSEP was within 3%, and the value of RMSECV was roughly equivalent to the average absolute deviation of the corresponding model. Most of RPD was more than 2. The value of ARD was related to the type of universal models (such as the drug preparation and packing) and the content range which the test sample belonged to. Determination coefficient (R2) was used as the key parameter to evaluate the model linearity and most of its values were from 80% to 100%. The ratio of RMSEP to RMSECV was selected as the key evaluation parameter of model robustness and its value was usually within 1.5. The standard deviation of repeated measurement data was chosen to evaluate model precision. And it was an important parameter for standardizing operation of NIR instruments and studying the feasibility of model transfer in different instruments. However, the parameter for NIR universal quantitative models
much less attention in previous studies and it was difficult to give a value range for this parameter at present. All the results can not only provide evidence for evaluation of drug NIR universal quantitative models for the model builders or users, but also supply basic data to establish and improve the parameter evaluation system of drug NIR universal quantitative models.
Drug; Near infrared spectroscopy; Universal quantitative models; Model optimization; Evaluation parameters; Accuracy; Linearity; Precision; Robustness
Oct. 1, 2015; accepted Feb. 5, 2016)
2015-10-01,
2016-02-05
國(guó)家公益性行業(yè)科研專項(xiàng)項(xiàng)目(2012104008)資助
馮艷春, 女, 1978年生, 中國(guó)食品藥品檢定研究院副研究員 e-mail: fyc@nifdc.org.cn *通訊聯(lián)系人 e-mail: hucq@nifdc.org.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)08-2447-08