張紅俠,王 宇**,朱正安,劉曉娜
(1.陜西中醫(yī)藥大學(xué) 咸陽 712000;2.遼寧工程技術(shù)大學(xué) 葫蘆島 125105)
西藥起效快,療效高,目前普遍應(yīng)用于臨床,但由于西藥大多數(shù)是合成劑,副作用也十分明顯。相比而言中藥藥效溫和,療效突出。所以在市場上需求量十分大,人們更傾向于中醫(yī)治療。在我國,具有藥用價值的中草藥就有五千多種,許多中草藥性狀十分相似,但藥理作用卻相差很遠(yuǎn)。由于中草藥植物來源廣泛,種屬相近,性狀相似等因素,極易導(dǎo)致錯誤識別,混淆使用,給病人帶來傷害,造成臨床意外。例如大血藤和雞血藤、菟絲子和蘇子等中草藥植物[1],其中大血藤主要偏于清熱解毒,雞血藤偏于活血補(bǔ)血[2],臨床上曾經(jīng)因?yàn)樾誀钕嗨茖?dǎo)致混淆使用,造成患者病情惡化,帶來十分嚴(yán)重的后果。即使在現(xiàn)如今,混淆使用中草藥的問題也有出現(xiàn),例如發(fā)生于香港的“白英”和“尋骨風(fēng)”事件,主要是因?yàn)榛煜褂弥兴?,最終導(dǎo)致病人腎衰竭和尿道癌。
傳統(tǒng)的相似中草藥植物性狀鑒定具有主觀性強(qiáng),而且人力成本高等缺點(diǎn)。因此,實(shí)現(xiàn)快速,高效的識別技術(shù)必不可少。正確鑒別相似中草藥植物對于了解其知識和發(fā)揚(yáng)我國中醫(yī)文化意義重大,不僅可以保證臨床上用藥安全,而且也能夠促進(jìn)中藥文化的發(fā)展。由于鑒定技術(shù)的不斷完善和進(jìn)步,相似中草藥植物的鑒定迎來了新的發(fā)展。
神農(nóng)嘗百草的故事彰顯了在中國古代,人們就有了辨識中草藥植物的意識。古代本草學(xué)是中草藥鑒定學(xué)發(fā)展的基礎(chǔ)[3]。由于我國對傳統(tǒng)醫(yī)學(xué)的重視,許多中草藥鑒定工作者深入研究中藥的來源鑒定和性狀鑒定,出版了《新編中藥志》、《中華人民共和國藥典》等書籍,對我國醫(yī)學(xué)的發(fā)展起到了極大的促進(jìn)作用[4]。傳統(tǒng)的相似中草藥性狀鑒別方法主要是依據(jù)經(jīng)驗(yàn)判斷,通過眼觀,鼻聞,手摸等方式來獲取中草藥外形特征的形態(tài)和理解[5]。顯微鑒別技術(shù)發(fā)展于中草藥真?zhèn)舞b定,但無法實(shí)現(xiàn)質(zhì)量的評估。色譜指紋圖譜適用于中藥質(zhì)量鑒別,但品種來源的鑒定無法實(shí)現(xiàn)。高效液相色譜法可以對中藥的有效成分進(jìn)行全面,高效的分析,但其存在著不足,即耗損溶劑多,時間長等缺點(diǎn)。在定性定量研究方面,核磁共振法具有很大優(yōu)勢,但技術(shù)復(fù)雜,相關(guān)儀器價格昂貴。國外對相似植物的鑒定也進(jìn)行了長期深入的探索,基于多路徑稀疏編碼的方法是利用SIFI特征研究出的一種新穎的植物識別方法。主要使用了五個路徑模型植物圖片的形狀和紋理特征,有效的避免了創(chuàng)建特征工程時,對植物分類依賴的缺點(diǎn)。但其存在著新樣本點(diǎn)的擴(kuò)展有難度及數(shù)據(jù)過少不能獲得滿意結(jié)果等缺陷。多器官綜合廠網(wǎng)方法,主要利用框架卷積神經(jīng)網(wǎng)絡(luò)(CNN)[6]進(jìn)行初步植物單個器官的識別分析,然后進(jìn)行線性加權(quán)決策分類和支持向量機(jī)(SVM)處理。但其數(shù)據(jù)庫需擴(kuò)大以致覆蓋更多植物而且系統(tǒng)的性能也有待提高。近年來,計(jì)算機(jī)視覺領(lǐng)域不斷取得了豐碩的成就,爆炸性的增長趨勢突出了計(jì)算機(jī)視覺技術(shù)應(yīng)用的廣泛性。早在二十世紀(jì)五十年代,西方計(jì)算機(jī)視覺技術(shù)開始逐步成長,2D圖像的分析和探索是當(dāng)時主要的研究方向。進(jìn)入二十世紀(jì)六十年代,羅伯茨在MIT利用計(jì)算機(jī)程序從數(shù)字圖片中成功提取了多維數(shù)據(jù)集,棱鏡等多面體的三維結(jié)構(gòu),而且清楚的描述了物體的形狀與空間的聯(lián)系。計(jì)算機(jī)視覺技術(shù)的主要原理是借助拍攝設(shè)備替換人眼以獲取目標(biāo)圖像,進(jìn)而通過計(jì)算機(jī)對物體進(jìn)行追蹤,檢測和分析。利用計(jì)算機(jī)視覺技術(shù)的WIFI無線智能通訊汽車[7],通過無線網(wǎng)絡(luò)借助Zigbee和藍(lán)牙,實(shí)現(xiàn)了中短距離無線傳輸和識別圖像,避免了人和危險區(qū)的接觸進(jìn)而減少危險區(qū)的人員傷亡。在表面疲勞裂紋圖像識別檢測方面[8],計(jì)算機(jī)視覺技術(shù)的突出貢獻(xiàn)具有很大的現(xiàn)實(shí)意義,其市場發(fā)展前景十分廣闊。因此計(jì)算機(jī)視覺技術(shù)在國外發(fā)展十分成熟,而且普遍應(yīng)用于各領(lǐng)域。不斷發(fā)展進(jìn)步的計(jì)算機(jī)視覺技術(shù),在植物鑒別方面更趨完善,精確度達(dá)到了更高水平。
隨著現(xiàn)代技術(shù)的蓬勃發(fā)展,中草藥植物鑒定技術(shù)也需要更加完善,不光可以增強(qiáng)我國相似中草藥植物鑒定的精確度,同時也促進(jìn)我國中醫(yī)醫(yī)學(xué)的進(jìn)步。
許多中藥植物外形,味,氣十分相似,但它們的藥理活性十分復(fù)雜。免疫學(xué)鑒定和同工酶鑒定技術(shù)已逐漸發(fā)展成熟,但植物的生長階段,緯度差異等均會影響其鑒別的準(zhǔn)確度。近年來分子生物學(xué)和分子克隆學(xué)應(yīng)用前景十分廣闊,依據(jù)中草藥植物遺傳物質(zhì)的不同,以及個體間有著基因組水平上的變異,進(jìn)行植物間多態(tài)性的考察,可以完成相似中草藥植物的鑒別,也可以利用限制性內(nèi)切酶酶切片段長度多態(tài)性(RFLP)進(jìn)行中草藥植物品屬間,屬間的DNA變異情況的研究。通過不斷探索研究中草藥植物內(nèi)在基因的分布規(guī)律,可以研究出外在性狀表現(xiàn)的分布特點(diǎn)。但是大多數(shù)中草藥植物在進(jìn)行鑒別時其新鮮度未能保持,DNA已發(fā)生部分降解,不過一種聚合酶鏈?zhǔn)椒磻?yīng)技術(shù)[9]已越來越成熟,即PCR技術(shù),可以將少量的遺傳物質(zhì)DNA進(jìn)行擴(kuò)展以便研究人員進(jìn)行操作觀察。進(jìn)行引物的設(shè)計(jì)在多重PCR中占有重要的地位,尤其是同源種屬之間變異位點(diǎn)少,保證引物的特異性和不互相干擾是鑒別的關(guān)鍵之處[10]。聚合酶鏈?zhǔn)椒磻?yīng)的自動化和高效優(yōu)質(zhì)的特點(diǎn)完成了痕跡量DNA的擴(kuò)增,其在生物科學(xué)領(lǐng)域發(fā)展前景十分廣闊。作為高科技領(lǐng)域的一項(xiàng)技術(shù),植物生物技術(shù)得到了廣泛人士的認(rèn)同。相關(guān)研究者進(jìn)行了實(shí)驗(yàn),Shaw[11]等人對真假人參進(jìn)行了DNA分子遺傳標(biāo)記,利用PCR技術(shù)擴(kuò)增了真假人參基因,證明了真假人參擁有的DNA指紋圖譜不一樣。基于DNA條形碼[12]的多重PCR不僅可以鑒別多種植物,而且擁有高效,準(zhǔn)確等特點(diǎn),同時也可以對其他多基源中藥材鑒別,也可以對市場上以次充好,摻假摻偽等現(xiàn)象進(jìn)行有力的遏制[13]。由于DNA具有遺傳信息多,而且不受外界環(huán)境的影響,沒有發(fā)育階段因素干擾,所以該植物生物識別技術(shù)具有很大優(yōu)勢。植物生物技術(shù)能夠保護(hù)好稀缺中草藥植物,辨別真假,準(zhǔn)確識別藥物的來源,性狀,但適用范圍小,成本高,程序復(fù)雜。此技術(shù)雖然發(fā)展十分成熟,但測序儀和試劑成本比較高,耗資巨大,存在一定的適用局限性。
光譜鑒別技術(shù)主要通過中草藥植物有效成分鑒別,避免了一些鑒定技術(shù)的片面性而且取樣量少。作為景天科植物的中藥,凹葉景天在全國分布廣泛,消腫,解毒和止血等作用應(yīng)用普遍。為了使中藥凹葉景天資源得到更好的利用,使用紫外可見光譜技術(shù)可以對其定性鑒定,但其主要缺點(diǎn)是檢測的樣品為非單一化合物,所以需要其它檢測技術(shù)共同鑒定。中草藥植物的使用需經(jīng)過多道程序,例如采收、加工、運(yùn)輸?shù)?,其外形多已遭到破壞,不具有完整性,給鑒定增加了難度。由于葉類植物富含葉綠素和鞣質(zhì),限制了理化鑒別,而熒光光譜技術(shù)靈敏度強(qiáng),選擇性強(qiáng),對葉類植物鑒定十分高效,但熒光的光強(qiáng)并不強(qiáng),易受某些離子的干擾,并且持續(xù)時間不長。能夠定量和定性的分析中草藥植物是近紅外光譜技術(shù)的主要特點(diǎn),由于該技術(shù)專屬性高,所以在中草藥植物鑒定中普遍應(yīng)用。其中分子震動模式和亞甲基的六種振動模式是紅外光譜所擁有的滑雪特征。其振動模式的數(shù)量是依據(jù)自由度來確定的[14],但空間中的點(diǎn)需要三個自由度。然后進(jìn)行光譜吸收帶解析,通過對植物成分在近紅外光區(qū)域的吸收帶進(jìn)行分析,從而得出準(zhǔn)確的辨別結(jié)果。其主要通過數(shù)學(xué)模型的建立,完成以下的步驟:挑選具有典型特點(diǎn)的樣本,完成模型訓(xùn)練集數(shù)據(jù)組的測量,然后進(jìn)行掃描,使用多元校正的計(jì)算手法,讓樣本光譜與組成數(shù)據(jù)相聯(lián),實(shí)現(xiàn)數(shù)學(xué)模型的建立,隨后便可進(jìn)行未知樣本的測試。LIU[15]等以近鄰法以及多類支持向量機(jī)完成了白芷和丹參的準(zhǔn)確鑒別。Woo[15]等還采用特殊計(jì)算突出譜圖的特征,借用SIMCA高效率的完成了藥材生產(chǎn)地的鑒別。該類技術(shù)能夠有效的鑒別形態(tài)相近,種屬關(guān)系相近的中草藥植物。聚類分析等模式識別技術(shù)對相似中草藥的性狀鑒別更加準(zhǔn)確,Mao[15]等通過研究系統(tǒng)聚類法,對白參,西洋參,紅參和三七均能正確的歸類。52種大黃樣品的鑒別[16]具有相當(dāng)高的難度,而近紅外光譜和人工神經(jīng)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)了96%的正確率。該方法已經(jīng)發(fā)展為一種鑒別中草藥植物快速,無損,定量分析化學(xué)組分的新方法。由于光譜測量的速度極快,所以近紅外光譜擁有分析速度快的優(yōu)勢,從而使最后計(jì)算的的結(jié)果也快。然而近紅外光分析的效率主要取決于儀器所具有的模型數(shù)量的多少,所以希望在進(jìn)行植物鑒別時快速得出計(jì)算結(jié)論,增加儀器模型數(shù)量至關(guān)重要。近紅外光譜技術(shù)發(fā)展迅速,處理簡易,反應(yīng)靈敏,適用于固體漫反射,可以很好的進(jìn)行中草藥植物的種類,產(chǎn)地,真?zhèn)?,質(zhì)量,加工炮制和親緣關(guān)系的識別,也可以作為相似中草藥植物鑒別的依據(jù)[15],但建模成本較高,模型不通用,不適用于小批量樣品。
計(jì)算機(jī)視覺技術(shù)可以實(shí)現(xiàn)復(fù)雜的視覺描述功能,完成圖像的準(zhǔn)確識別。通過許多海內(nèi)外學(xué)者對圖像匹配工作的研究,使此領(lǐng)域技術(shù)取得了顯著成果。國外深入推進(jìn)計(jì)算機(jī)視覺技術(shù)和理論的探索,嘗試人工系統(tǒng)的建立,以此實(shí)現(xiàn)從圖片中獲取更多的信息和多維數(shù)據(jù)。使計(jì)算機(jī)具有能自主適應(yīng)人類環(huán)境的功能,憑借視覺觀察的途徑進(jìn)行全面的認(rèn)識世界,并且在3D環(huán)境中,計(jì)算機(jī)可以實(shí)現(xiàn)感知幾何信息的功能,具體包括:形狀,位置,手勢和動作[17]。該技術(shù)可以避免人的主觀判斷,評價,而且可以有效的去除情緒和精神狀態(tài)的影響。目前,計(jì)算機(jī)視覺技術(shù)已在許多領(lǐng)域廣泛應(yīng)用,主要有工業(yè)檢測,工業(yè)自動化,視覺導(dǎo)航,虛擬現(xiàn)實(shí),衛(wèi)星遙感等。計(jì)算機(jī)視覺處理技術(shù)在相似中草藥植物范圍的應(yīng)用已逐漸深入,主要通過中草藥植物圖像預(yù)處理,特征提取,圖像分割,圖像匹配等步驟完成鑒別。隨著計(jì)機(jī)視覺技術(shù)日新月異的發(fā)展,圖像識別技術(shù)取得了很高的成就,例如人臉識別,指紋識別,虹膜識別,聲音識別等,生物特征識別主要在于構(gòu)造智能人機(jī)接口以及利用計(jì)算機(jī)視覺技術(shù)進(jìn)行真實(shí)身份的研究,以及應(yīng)用于溫室環(huán)境中的監(jiān)控和移動機(jī)器人的設(shè)計(jì)等。用計(jì)算機(jī)代替人的識別和理解過程,實(shí)現(xiàn)了準(zhǔn)確,快速等功能。在全國開展的中藥資源普查中[18],圖像識別技術(shù)起到了重要的作用。植物葉片的識別在計(jì)算機(jī)視覺中也有了極大的發(fā)展,基于彩色通道植物相似性圖像分割方法[19],主要是計(jì)算葉片的面積,不用對彩色圖像灰度化,直接進(jìn)行分割。此技術(shù)可以直接嵌入到手機(jī)中,利用手機(jī)的便攜性可以進(jìn)行野外植物觀察但須保證光線充足。作為計(jì)算機(jī)視覺領(lǐng)域當(dāng)前最為火熱的研究課題,不僅帶動了與其密切相關(guān)的圖像處理,模式識別,射影幾何的統(tǒng)計(jì)推斷,統(tǒng)計(jì)學(xué)習(xí)和其他學(xué)科的發(fā)展,而且也極大的造福了人類。以下是計(jì)算機(jī)視覺技術(shù)各類算法研究。
中草藥植物的輪廓和外形提取中,葉脈的處理與分析占有重要的作用。作為葉片主要特征之一的葉脈,眾多的研究者從不同的方面深入探索了其提取方法,包括有:神經(jīng)網(wǎng)絡(luò)、Hough變換等,但都存在著一定的缺點(diǎn),神經(jīng)網(wǎng)絡(luò)比較耗時,Hough變換不能實(shí)現(xiàn)自動化。而K-means算法首先進(jìn)行彩色空間轉(zhuǎn)換,從人類的視覺系統(tǒng)出發(fā),使用圖像的HIS彩色空間更有利于特征參數(shù)的提取[20]。繼而在使用其I分量,進(jìn)行植物葉片葉脈的提取。依據(jù)數(shù)據(jù),從屬于無監(jiān)督聚類中的K-means算法,可以利用從深入分析的葉片的特征信息中探索出相關(guān)的聯(lián)系,然后進(jìn)行聚類,此空間將會呈現(xiàn)特征相似的像素點(diǎn)組??旖莘奖愕脑擃愃惴ㄔ诖搜芯款I(lǐng)域中得到了普遍的認(rèn)同和應(yīng)用[21]。葉脈提取的準(zhǔn)確性直接受到葉片受光是否均勻的影響,受光均勻葉片首先進(jìn)行圖像預(yù)提取,然后葉脈和葉片邊界的提取,再將其融合;受光不均勻葉片,首先將會去除葉肉像素,再次進(jìn)行K-means聚類,獲得新的葉脈圖像,最后進(jìn)行融合[22]。K-means聚類算法提取效果如圖1所示。
圖1 K-means聚類算法提取效果[22]
由于現(xiàn)實(shí)大多數(shù)是綠葉圖景拍攝,所以應(yīng)用前景十分廣闊。但也存在著一定的季節(jié)局限性,必須所選葉片葉脈像素值比葉肉像素值大,例如秋季的落葉,不適合于本算法的范圍。
許多研究者將植物葉片的形狀,顏色,紋理進(jìn)行融合,完成相關(guān)相似植物的鑒別。顏色和紋理可以輔助進(jìn)行葉緣葉裂明顯的中草藥植物葉片識別,但精準(zhǔn)度卻不會提升。植物葉片識別主要利用了主成分分析(PCA),采用最大間差方法Otsu,完成圖像的預(yù)處理,去除噪聲,剔除雜質(zhì)。然后以形態(tài)學(xué)開運(yùn)算解決葉片的殘缺及葉柄的影響,完成葉片8項(xiàng)特征的提取。使用PCA進(jìn)行降維[23],不僅簡化了特征間的繁復(fù),更促進(jìn)了神經(jīng)網(wǎng)絡(luò)的輸入向量維數(shù)簡單。通過設(shè)計(jì)BPNN,不斷輸入圖像特征進(jìn)行訓(xùn)練,最終形成準(zhǔn)確高效的識別分類器。該類方法對于植物葉片的識別技術(shù)又是一個新的提高,對于一些難以識別的種類,以及以顏色和紋理識別效果差的植物都有一個極大的提升,尤其對于有葉緣葉裂的葉片識別效率極高。但該類識別也存在一定的局限性,對于無葉裂,葉緣完整的葉片識別率低。該算法測試在圖2植物葉片數(shù)據(jù)集的測試結(jié)果(表1)。
在將來的發(fā)展中,研究者將會更多探索葉基形狀,葉端形狀,此方面有更大的發(fā)展空間。
圖2 植物葉片數(shù)據(jù)集[23]
表1 葉片形狀特征識別結(jié)果[23]
相似植物的鑒定和歸類,對于植物間的親緣關(guān)系以及進(jìn)化規(guī)律都有重大意義。傳統(tǒng)方法以采集植物標(biāo)本,進(jìn)行測量和對比完成歸類,工作量大,耗時多,效率低,質(zhì)量難以保證。其中統(tǒng)計(jì)學(xué)和模糊數(shù)學(xué)在早期應(yīng)用于植物歸類,但其需要人工操作,不能滿足自動化。而基于葉片圖像的植物識別[24]是利用計(jì)算機(jī)進(jìn)行的一種模式識別,首先獲取葉片的圖像,進(jìn)行圖像灰度化處理,亮度較正,為使在去除隨機(jī)噪聲時不致邊緣受到影響,使用中值濾波,采用灰度門限法進(jìn)行圖像分割。然后進(jìn)行葉片圖像參數(shù)計(jì)算,RBF分類器擁有的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)相比于BP神經(jīng)網(wǎng)絡(luò)具有極大的優(yōu)勢,不僅在自學(xué)性方面,而且局部極小值的解域問題中都得到了很好的解決。在葉片圖像的植物識別程序中,圖像匹配[25]是一項(xiàng)尤為重要,關(guān)鍵的技術(shù)。早期西方圖像處理的發(fā)展可以追溯到1920年,英國借助北大西洋海底的電纜,實(shí)現(xiàn)了向美國傳輸一張簡單數(shù)字處理的照片。隨著科技的進(jìn)步,數(shù)千張?jiān)卤韴D片的采集,通過計(jì)算機(jī)視覺技術(shù)的處理,最終月球的全景鑲嵌圖問世。一項(xiàng)造福于人類的技術(shù),是計(jì)算機(jī)視覺的典型應(yīng)用,即英國工程師發(fā)明的全身CT診斷技術(shù)。眾多有益于人類和促進(jìn)發(fā)展的應(yīng)用,都需要計(jì)算機(jī)視覺技術(shù)中圖像進(jìn)行準(zhǔn)確的匹配。權(quán)值和豎向關(guān)系是計(jì)算機(jī)視覺技術(shù)圖匹配的核心。其中譜方法,雙隨機(jī)約束松弛法,稀疏約束松弛法等是近年最常應(yīng)用的算法。借助這些算法,可以實(shí)現(xiàn)在兩幅或三幅圖中找出相似之處,從而實(shí)現(xiàn)了對相似中草藥植物準(zhǔn)確,科學(xué)的進(jìn)行處理。由于噪聲,角度,變形等因素的存在,將會導(dǎo)致圖像發(fā)生一定的變化,即使在相同的環(huán)境中,不同的條件也會使圖片產(chǎn)生一定的差異,因此增加了圖像匹配的難度。只有分析和歸納圖匹配的基本要素,科學(xué)的組合才是實(shí)現(xiàn)圖像匹配的科學(xué)方法。圖匹配中人工智能可視化,三維重建,虛擬現(xiàn)實(shí),增強(qiáng)現(xiàn)實(shí),是研究的重點(diǎn),其在醫(yī)學(xué),交通,通訊,植物鑒別等方面做出了巨大貢獻(xiàn)。該研究對相似植物自動識別具有重要意義,奠定了一定的基礎(chǔ)。
在相似中草藥植物的準(zhǔn)確識別和臨床應(yīng)用過程中,相似中草藥植物的鑒定技術(shù)發(fā)展前景十分廣闊。相似中草藥植物鑒定技術(shù)的種類、特點(diǎn)和應(yīng)用在中醫(yī)的發(fā)展史中更具有重要意義。相似中草藥植物的識別離不開鑒定技術(shù),采用各種不同的鑒定技術(shù),不光可以使人們準(zhǔn)確識別中草藥植物,而且可以省時省力,不浪費(fèi)資源,避免臨床用藥意外。隨著生物識別技術(shù),光譜技術(shù)等的不斷發(fā)展,同時計(jì)算機(jī)視覺技術(shù)的更新和應(yīng)用,相似中草藥植物鑒定技術(shù)會向著更高速,準(zhǔn)確,科學(xué)的方向前進(jìn)。