劉方舟,李園白,王 靜,杜 昱,楊 陽
(中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所 北京 100700)
當(dāng)歸藥材來源于傘形科當(dāng)歸屬植物Angelica sinensis(Oliv.)Diels的干燥根[1],又名干歸、馬尾當(dāng)歸、秦哪、馬尾歸、云歸、岷歸等,是我國臨床最常用中藥之一。當(dāng)歸廣泛分布于甘肅、四川、湖北、陜西等地[2]。當(dāng)歸主要含有揮發(fā)油、有機(jī)酸、多糖、腦苷類、核苷類、氨基酸等多種類型的化合物[3]。
道地藥材是指來自特定產(chǎn)區(qū)、特定生態(tài)環(huán)境、栽培規(guī)范、加工精細(xì)、貯藏合理、品質(zhì)卓越、療效顯著的中藥材,是傳統(tǒng)中醫(yī)藥行業(yè)評(píng)價(jià)藥材質(zhì)量的一項(xiàng)獨(dú)特判別標(biāo)準(zhǔn),其來源具有強(qiáng)烈的地域性[4]。藥材的道地性判斷、醫(yī)學(xué)實(shí)踐經(jīng)驗(yàn)源于中醫(yī)藥學(xué),脫離中醫(yī)藥學(xué)理論基礎(chǔ),道地藥材就如同無源之水,故中藥材的本草考證研究顯得尤為重要,可根據(jù)本草考證結(jié)果推斷藥材道地產(chǎn)區(qū)[5]。性狀特征作為道地藥材的傳統(tǒng)評(píng)價(jià)指標(biāo),可在一定程度上概括道地藥材外在特征[6],但不能確切反映道地藥材的內(nèi)在品質(zhì),因此,對道地藥材特征化學(xué)成分以及有效成分的含量測定,成為當(dāng)前道地藥材質(zhì)量特征評(píng)價(jià)的主要方法[7],眾多研究結(jié)果表明,道地藥材與非道地藥材的指標(biāo)性成分含量有顯著性差異[8]。
考證古近代主流醫(yī)學(xué)典籍和本草著作,歸納研究當(dāng)歸藥材歷代道地產(chǎn)區(qū),考證涉及的古代地名,參照《古今地方大辭典》、《中華人民共和國行政區(qū)劃表》映射得出現(xiàn)代地名,再對現(xiàn)代地名(省)進(jìn)行頻次統(tǒng)計(jì),結(jié)合古籍原文中相關(guān)描述推斷當(dāng)歸藥材的道地產(chǎn)區(qū)。
當(dāng)歸本草考證共涉獵秦朝、東漢、南北朝、唐朝、宋朝、明朝、清朝相關(guān)古籍14本,包括:《神農(nóng)本草經(jīng)》、《名醫(yī)別錄》、《吳普本草》、《本草經(jīng)集注》、《千金翼方藥出州土》、《新修本草》、《本草圖經(jīng)》、《本草品匯精要》、《本草原始》、《本草綱目》、《本草備要》、《本草求真》、《本草從新》、《本草述》以及民國書籍《藥物出產(chǎn)辨》。摘錄出隴西、宕州、秦州、松州、川蜀、汶州等19個(gè)古代產(chǎn)區(qū)和7個(gè)近代產(chǎn)區(qū),對應(yīng)現(xiàn)代地名(?。?個(gè)及西南地區(qū)、河套地區(qū),具體結(jié)果(表1)?,F(xiàn)代產(chǎn)區(qū)頻次統(tǒng)計(jì)結(jié)果由高到低為甘肅省、四川省、陜西省、安徽省、江蘇省、河北省、西南地區(qū)、河南省、河套地區(qū)和山西省,具體結(jié)果(表2),結(jié)合古籍文獻(xiàn)相關(guān)文字描述推斷甘肅省、四川省為現(xiàn)今當(dāng)歸藥材的道地產(chǎn)區(qū)。
針對當(dāng)歸藥材性狀特征制定專業(yè)檢索策略,在CNKI數(shù)據(jù)庫中檢索相關(guān)文獻(xiàn),檢索式如下:
(SU=當(dāng)歸+干歸+馬尾當(dāng)歸+秦哪+馬尾歸+云歸+西當(dāng)歸+岷當(dāng)歸AND TI=性狀+外觀+真?zhèn)?偽品+生藥+形狀+大小+氣味+味道+斷面特征+摻偽+摻假+真假+混淆品+混用品)OR((SU=當(dāng)歸+干歸+馬尾當(dāng)歸+秦哪+馬尾歸+云歸+西當(dāng)歸+岷當(dāng)歸AND(SU=鑒定+鑒別OR CLC=R282.5)AND SU=生藥+形狀+大小+氣味+味道+斷面特征))OR(SU=當(dāng)歸+干歸+馬尾當(dāng)歸+秦哪+馬尾歸+云歸+西當(dāng)歸+岷當(dāng)歸AND KY=外觀+性狀+真?zhèn)?偽品+生藥+形狀+大小+味道+斷面特征+氣味+混淆品+混用品+摻偽+摻假)NOT CLC=R285.6 NOT CLC=R285.5 NOT CLC=R285 NOT CLC=R284 NOT SU=基因NOT SU=化學(xué)NOT SU=成分NOT SU=分子NOT SU=DNA NOT SU=RNA NOT SU=注射液NOT SU=滴丸NOT SU=片NOT SU=膠囊 NOT SU=丸NOT SU=高效液相NOT SU=HPLC
檢索到當(dāng)歸藥材性狀特征相關(guān)文獻(xiàn)共計(jì)75篇,從中優(yōu)選有效文獻(xiàn)59篇,針對文獻(xiàn)中藥材產(chǎn)地、全植物大小、全植物形狀、全植物色澤、全植物味道、全植物氣味、用藥部位、根部大小、根部形狀、根部色澤、根部質(zhì)地、根部表面特征、根部味道、根部氣味及根部斷面特征等字段進(jìn)行錄入,從中提取歸納當(dāng)歸道地藥材的性狀特征如下:
①原植物:多年生草本植物,根圓錐形。莖直立,高60-130 cm,上部分枝?;~有長柄,三出全裂或羽狀3小葉,中間小葉菱狀倒卵形,有短柄,側(cè)小葉寬卵形,有柄或無,邊緣有不整齊粗鋸齒。莖生葉有柄,三出至二回三出。莖上部為深裂或僅有狹長圓筒狀葉鞘。復(fù)傘形花序頂生或側(cè)生。果實(shí)長圓形或近長圓形,分果背棱有極狹翅?;ㄆ?月-9月,果期9月-10月。野生于海拔1200-2300 m間的山谷疏林下及山坡灌叢中。②藥材:用藥部位為干燥根,主根粗短略呈圓柱形或圓錐形,下部有支根3-5條或更多,表面黃棕色至棕褐色,有明顯縱皺紋及橫長皮孔。質(zhì)較柔韌,香氣濃厚特異,味甘、辛、微苦,折斷面黃白色或淡黃棕色,呈放射狀紋理,習(xí)稱“菊花心”,皮部厚,有棕色油點(diǎn),形成層呈黃棕色環(huán)狀,木質(zhì)部及韌皮部有多數(shù)細(xì)小裂隙和黃棕色分泌腔,中心有時(shí)有白色髓心。
針對當(dāng)歸化學(xué)成分研究制定專業(yè)檢索策略,在CNKI數(shù)據(jù)庫中檢索相關(guān)文獻(xiàn),檢索式如下:
(TI=當(dāng)歸+干歸+馬尾當(dāng)歸+秦哪+馬尾歸+云歸+西當(dāng)歸+岷當(dāng)歸OR KY=當(dāng)歸+干歸+馬尾當(dāng)歸+秦哪+馬尾歸+云歸+西當(dāng)歸+岷當(dāng)歸)AND(SU=化學(xué)+成分+質(zhì)量評(píng)價(jià)+質(zhì)量標(biāo)準(zhǔn)+高效液相+質(zhì)譜+指紋圖譜+波譜解析+HPLC+UPLC+GC+MS++NMR+含量+提取物+揮發(fā)油+水提物+萃取+超臨界萃取+薄層+比色+液質(zhì)聯(lián)用+質(zhì)譜聯(lián)用OR CLC=R284.3+R284.2+R284.1+R284)NOT CLC=R285.5 NOT CLC=R285 NOT CLC=R285.6 NOT SU=DNA NOT SU=RNA NOT SU=分子NOT SU=基因NOT SU=遺傳NOT SU=注射液NOT SU=口服液NOT SU=滴丸 NOT SU=丸 NOT SU=片 NOT SU=膠囊NOT SU=膏
檢索到當(dāng)歸藥材化學(xué)成分相關(guān)文獻(xiàn)共計(jì)1949篇,優(yōu)選含量測定成分全面、方法標(biāo)準(zhǔn)、數(shù)據(jù)相對規(guī)范的100篇為有效文獻(xiàn),提取并整合成分含量數(shù)據(jù),共提煉出甘肅、四川、湖北、云南、陜西、河北6個(gè)不同產(chǎn)地當(dāng)歸的10個(gè)化學(xué)成分含量結(jié)果,涉及成分包括正丁基 苯 酞(3-butylphthalide)、正 丁 烯 基 苯 酞(nbutylidenephthalide)、藁本內(nèi)酯(ligustilide)、阿魏酸(ferulic acid)、精氨酸(L-arginine)、苯丙氨酸(L-phenylalanine)、賴氨酸(L-lysine)、揮發(fā)油、總多糖、總核苷,6個(gè)不同產(chǎn)區(qū)當(dāng)歸藥材的10種成分含量平均值(表3)。對數(shù)據(jù)進(jìn)行全面清洗及規(guī)范化處理,采用SPSS22.0軟件進(jìn)行單因素方差分析、主成分分析和聚類分析,對當(dāng)歸化學(xué)成分含量數(shù)據(jù)進(jìn)行多指標(biāo)綜合評(píng)價(jià)。
規(guī)范到“省”級(jí)行政單位,SPSS軟件處理錯(cuò)誤值與極端值,用Analyze-Descriptive Statistics法標(biāo)準(zhǔn)化處理不同量綱數(shù)據(jù),得到標(biāo)準(zhǔn)化描述性分析結(jié)果(表4)。
續(xù)表
表2 當(dāng)歸本草考證得出古近代產(chǎn)地對應(yīng)現(xiàn)代產(chǎn)地頻次統(tǒng)計(jì)結(jié)果
表3 不同產(chǎn)地當(dāng)歸化學(xué)成分平均值(mg?g-1)
本研究通過分析文章中化合物中英文名稱,到Molbase查詢得到化合物CAS號(hào),依據(jù)CAS規(guī)范化合物名稱,相同CAS號(hào)代表同一物質(zhì),例如,“Z-3-丁烯基苯酞”與“正丁烯基苯酞”、“丁烯基酞內(nèi)酯”與“丁烯基苯酞”為同一物質(zhì),有一個(gè)CAS;天然氨基酸均具旋光性,以左旋(-L型)形式存在,L-型氨基酸才具有生化活性,故氨基酸類化合物均默認(rèn)左旋型異構(gòu)體對應(yīng)的CAS號(hào),據(jù)此對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化整合。
1.3.2 單因素方差分析
本研究對來源于6個(gè)不同產(chǎn)地當(dāng)歸中10種化學(xué)成分的含量數(shù)據(jù)進(jìn)行多指標(biāo)兩兩比較,采用SPSS22.0軟件對規(guī)范化清洗處理后的數(shù)據(jù)進(jìn)行單因素方差分析,分析結(jié)果(表5)。
結(jié)果顯示,甘肅產(chǎn)區(qū)樣品各項(xiàng)指標(biāo)值大都顯著高于其它產(chǎn)區(qū),指標(biāo)正值結(jié)果與其他產(chǎn)區(qū)比較,有顯著性差異(P<0.05);云南產(chǎn)區(qū)樣品中氨基酸含量顯著高于其他產(chǎn)區(qū)(P<0.05);觀察指標(biāo)數(shù)值趨勢,甘肅、四川產(chǎn)區(qū)除氨基酸外,其余指標(biāo)值均較高,與其他產(chǎn)區(qū)比較,有一定差異;云南、湖北產(chǎn)區(qū)樣品中氨基含量值較高,與其他產(chǎn)區(qū)比較,有一定差異,云南產(chǎn)區(qū)阿魏酸含量特別高;陜西產(chǎn)區(qū)揮發(fā)油成分含量較高,其余指標(biāo)值均低,河北產(chǎn)區(qū)各指標(biāo)值均低。
1.3.3 主成分分析
采用SPSS22.0軟件對當(dāng)歸藥材中正丁基苯酞、正丁烯基苯酞、藁本內(nèi)酯、阿魏酸、揮發(fā)油、總多糖、總核苷、精氨酸、苯丙氨酸、賴氨酸10個(gè)檢測指標(biāo)進(jìn)行主成分分析[9],以特征根>0.5,為提取標(biāo)準(zhǔn),得到3個(gè)主成分,累積貢獻(xiàn)率90.641%,說明以此三個(gè)主成分進(jìn)行分析的結(jié)果基本可以客觀的反應(yīng)當(dāng)歸藥材內(nèi)在質(zhì)量(表6),主成分荷載矩陣(表7),主成分荷載圖(圖5)。
根據(jù)主成分荷載值,得到3個(gè)主成分線性模型組合表達(dá)式F1、F2、F3,利用3個(gè)主成分方差貢獻(xiàn)率線性加權(quán)求和得到當(dāng)歸藥材各產(chǎn)區(qū)質(zhì)量的綜合得分評(píng)價(jià)函數(shù):F=(43.609 × F1+31.137 × F2+15.895 × F3)/90.641。根據(jù)綜合評(píng)價(jià)指數(shù)F數(shù)值的高低,確定當(dāng)歸藥材整體評(píng)分高低。甘肅產(chǎn)區(qū)當(dāng)歸整體評(píng)分最高,推測其質(zhì)量最好,西川、云南、湖北產(chǎn)區(qū)當(dāng)歸評(píng)分較好,水平尚佳,河北、陜西產(chǎn)區(qū)當(dāng)歸評(píng)分較低,水平一般。
表4 SPSS數(shù)據(jù)標(biāo)準(zhǔn)化處理描述性統(tǒng)計(jì)結(jié)果
1.3.4 聚類分析
采用SPSS22.0軟件對當(dāng)歸藥材中正丁基苯酞、正丁烯基苯酞、藁本內(nèi)酯、阿魏酸、揮發(fā)油、總多糖、總核苷、精氨酸、苯丙氨酸、賴氨酸10個(gè)檢測指標(biāo)的平均值進(jìn)行聚類分析。選擇Ward’s method作為聚類方法,樣品間距離計(jì)算采用Squareded Euclidean distance法,聚類結(jié)果(圖6)。
當(dāng)閾值為1.65時(shí),6個(gè)產(chǎn)區(qū)當(dāng)歸樣品可劃分為3類,這說明不同產(chǎn)區(qū)當(dāng)歸藥材的質(zhì)量存在差異(圖6)。第一類包括甘肅、四川2個(gè)產(chǎn)區(qū),綜合參考表3中各產(chǎn)區(qū)指標(biāo)含量平均值結(jié)果,該類各指標(biāo)值均處于較高水平;第二類包括云南、湖北2個(gè)產(chǎn)區(qū)(表3),該類3種氨基酸含量值均處較高水平,其余指標(biāo)值大都處于中等水平;第三類為陜西、河北2個(gè)產(chǎn)區(qū),該類各指標(biāo)值普遍較低。
道地藥材是傳統(tǒng)中醫(yī)藥文化的瑰寶,道地性評(píng)價(jià)是判斷中藥品質(zhì)優(yōu)劣的傳統(tǒng)方法,是中醫(yī)理論在實(shí)踐中精煉出來針對中藥質(zhì)量控制的一套客觀評(píng)價(jià)標(biāo)準(zhǔn)[10]。道地藥材存在其化學(xué)物質(zhì)基礎(chǔ)特征性[11],體現(xiàn)在活性成分含量上的差異。采用科學(xué)、系統(tǒng)的理論體系與研究方法對道地藥材進(jìn)行多維度評(píng)價(jià),揭示其科學(xué)內(nèi)涵、探索其物質(zhì)基礎(chǔ)及形成機(jī)理,即為藥材道地性研究關(guān)鍵所在[12]。
中藥化學(xué)成分組成復(fù)雜,傳統(tǒng)中藥是以復(fù)方或飲片入藥,藥效的發(fā)揮并不取決于單一化合物,而是多種化合物協(xié)作的結(jié)果[13],因此在研究中需要盡量收集大量且全面的數(shù)據(jù)信息[14]。若僅采納單一文獻(xiàn)研究得到的一種或幾種成分含量測定指標(biāo),作為針對某藥材品種質(zhì)量評(píng)價(jià)的標(biāo)準(zhǔn),這種模式是比較局限的,缺乏評(píng)價(jià)的系統(tǒng)性與全面性。在理論上,綜合分析藥材所含成分的種類越多、數(shù)據(jù)量越大,越接近藥材化學(xué)成分的真實(shí)整體組成,據(jù)此得到的評(píng)價(jià)結(jié)果應(yīng)該越全面、準(zhǔn)確。為了避免對當(dāng)歸藥材道地性質(zhì)量評(píng)價(jià)研究的片面性,本研究整合以往研究成果,將隱沒在大規(guī)模實(shí)驗(yàn)數(shù)據(jù)中重要信息提煉出來,從1949篇當(dāng)歸化學(xué)相關(guān)文獻(xiàn)中優(yōu)選出100篇成分全面、含量測定方法標(biāo)準(zhǔn)、數(shù)據(jù)較為規(guī)范的作為有效文獻(xiàn),對其中化合物含量測定數(shù)據(jù)進(jìn)行整合,并對數(shù)據(jù)進(jìn)行全面清洗及規(guī)范化處理,采用主成分分析、聚類分析結(jié)合單因素方差分析的方法對當(dāng)歸化學(xué)成分含量數(shù)據(jù)進(jìn)行多指標(biāo)綜合評(píng)價(jià)[15]?;瘜W(xué)成分綜合評(píng)價(jià)結(jié)果顯示甘肅為當(dāng)歸藥材最優(yōu)產(chǎn)區(qū),四川、云南、湖北次之,河北、陜西產(chǎn)區(qū)當(dāng)歸質(zhì)量不佳,而本草考證部分則從14本相關(guān)古籍中摘錄出隴西、宕州、川蜀等26個(gè)古近代產(chǎn)區(qū),其對應(yīng)當(dāng)歸藥材現(xiàn)代產(chǎn)區(qū)的頻次統(tǒng)計(jì)結(jié)果最高為甘肅省,四川次之,該結(jié)果與當(dāng)歸本
草考證研究所得道地產(chǎn)區(qū)有一致性,為當(dāng)歸藥材的道地性評(píng)價(jià)提供了有利的支撐。
表5 不同產(chǎn)地當(dāng)歸藥材中化學(xué)成分多指標(biāo)兩兩比較結(jié)果
圖1 各產(chǎn)區(qū)當(dāng)3歸中藁本內(nèi)酯平均值
圖2 各產(chǎn)區(qū)當(dāng)歸中阿魏酸平均值
圖3 各產(chǎn)區(qū)當(dāng)歸中苯丙氨酸平均值
圖4 各產(chǎn)區(qū)當(dāng)歸中總揮發(fā)油平均值
圖5 主成分荷載圖
圖6 各產(chǎn)區(qū)指標(biāo)平均值聚類分析圖
表6 主成分初始特征值及貢獻(xiàn)率
表7 主成分荷載矩陣
關(guān)于藥材道地性研究,前人或從本草考證角度切入,或從綜述進(jìn)行切入,本研究以數(shù)據(jù)挖掘作為切入點(diǎn),通過對丹參藥材的道地性古今文獻(xiàn)、化學(xué)成分文獻(xiàn)進(jìn)行梳理,運(yùn)用統(tǒng)計(jì)學(xué)定量分析,利用數(shù)據(jù)挖掘技術(shù)從文獻(xiàn)中挖掘文獻(xiàn)背后之規(guī)律,得出更為可靠的結(jié)論。
關(guān)于異源數(shù)據(jù)標(biāo)準(zhǔn)化處理與整合問題,筆者整理數(shù)據(jù)時(shí)發(fā)現(xiàn)文獻(xiàn)中存在同一化合物對應(yīng)多個(gè)中文名稱的現(xiàn)象,如:Z-3-丁烯基苯酞、正丁烯基苯酞、丁烯基苯酞與丁烯基酞內(nèi)酯為同一物質(zhì),CAS均為551-08-6;天然氨基酸均具旋光性,以左旋(-L型)形式存在,L-型氨基酸才具有生化活性,故氨基酸類化合物均默認(rèn)左旋型異構(gòu)體對應(yīng)的CAS號(hào)。針對此種情況,本研究通過分析文章中化合物對應(yīng)的英文名稱,并到Molbase查詢得到化合物CAS號(hào),一種成分具有唯一的CAS號(hào),據(jù)此原則整理得到當(dāng)歸中各化合物中英文名稱及CAS號(hào)對照表,根據(jù)對照表對各產(chǎn)區(qū)當(dāng)歸成分含量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化整合,確保了本研究結(jié)果的準(zhǔn)確性與科學(xué)嚴(yán)謹(jǐn)性。