胡永恒 杜鴻
摘 要:隨著圖像識別技術的發(fā)展,利用醫(yī)學成像、圖像識別和數(shù)據(jù)處理來分析尿樣試紙也是未來的一個發(fā)展方向。針對尿樣試紙被檢測顏色塊有效面積小、受光照條件影響嚴重、直方圖匹配可行性差、采樣數(shù)據(jù)有限等不足,提出了基于QDA(Quadratic discriminant analysis)和LDA(Linear discriminant analysis)相結(jié)合的判別分析算法。該算法通過對采集的圖像直接進行數(shù)據(jù)采樣,可減少顏色空間轉(zhuǎn)換帶來的的誤差;考慮sRGB顏色空間的相關性和采樣數(shù)據(jù)構成的協(xié)方差矩陣的差異做判別分析。通過實驗驗證,該算法能夠有效提升識別效率。
關鍵詞:圖像識別;協(xié)方差;二次判別分析法;直方圖匹配
現(xiàn)實生活中,高血壓、血脂稠、糖尿病等疾病患者越來越多,而這些疾病都可以通過尿液檢測判斷病情,但是市場上使用人工比對試紙或者傳感器的方法不僅成本高,而且效率極低,不同人的眼睛由于視力等因素的影響,觀察的誤差也非常大,測試有很大的局限性,并且對于老年癡呆和小孩子等這類病人尿液采樣也是一件不容易的事情。因此找到一種能夠快速、經(jīng)濟、便捷的尿液測試方法成為一個亟待解決的問題。
隨著智能手機和圖像拍攝設備的更新?lián)Q代,現(xiàn)在的智能手機像素已經(jīng)能夠滿足圖像識別所要求的性能。使用智能相機把與尿液反應后的試紙拍攝下來,通過計算機程序自動的識別反應后的顏色與標準的參考顏色對比,進而做出定量性判斷,這樣的判斷不僅節(jié)省時間,而且也會克服人眼被環(huán)境、視力等因素的影響造成的誤差。
1 建立模型
試紙物理結(jié)構。整個算法研究過程是建立在如圖1所示的專用醫(yī)療試紙上,試紙一共有兩部分,黑色三角符號的左邊是參考顏色,右邊是反應顏色塊,該顏色塊遇到尿液以后會發(fā)生顏色變化,通過采集與尿液反應后的圖片,進行下一步的圖像處理。
實際圖片為彩色圖片,參考顏色的每一個方塊代表一種不同顏色,下文中所用圖片與該圖片一樣。
2 QDA和LDA算法原理
判別分析法的基本原理是按照一定的判別準則,建立一個或者多個判別函數(shù),用研究對象的大量資料確定判別函數(shù)中待定系數(shù)并且和判別指標作對比,據(jù)此就可以判斷某一樣本屬于哪一類。貝葉斯判別原理就是根據(jù)已掌握的每個類的樣本信息,總結(jié)出事物的分類規(guī)律建立判別函數(shù),然后就可以根據(jù)這個判別函數(shù)判斷樣本屬于哪一類。
2.1 QDA原理
在測試點取51*51個像素作為樣本,每一個參考色也取同樣的像素點數(shù),計算出每一個參考點對應的均值向量、協(xié)方差矩陣和協(xié)方差矩陣的逆矩陣,將測試樣本計代入公式計該樣本點判別系數(shù),依次循環(huán)計算出所有樣本的判別系數(shù)并求平均,對比每個參考色平均判別系數(shù)并求出最大值,該值所對應顏色就是測試顏色最接近的。
2.2 LDA算法原理
3 實驗與結(jié)果分析
3.1 實驗方案和步驟
為了驗證識別率與樣本容量的關系,實驗分為A、B、C、D四組進行,分別在不同的光照條件下獲取5、10、20、40張圖片,用于測量人體比重(SG):
實驗步驟:
1)測試點和參考點都獲取51*51個像素點;
2)計算參考點的均值向量和協(xié)方差矩陣;
3)判斷協(xié)方差矩陣是否相等并求逆矩陣;
4)將參考點代入QDA或者LDA判別公式;
5)將所有參考點計算的判別系數(shù)相加,求所有測試樣本點相對于每個參考色的平均判別系數(shù);
6)獲取平均判別系數(shù)最大的參考色序號;
7)測試顏色就和6)所獲得的序號對應的顏色最相近;
3.2 Matlab仿真
驗證性實驗需要事先設置測試顏色與某種參考顏色最相近,本實驗將A組、B組、C組和D組測試顏色設置分別與第2、3,、5和6個參考色最接近,然后隨機獲取圖片,在Matlab中按照上述實驗步驟進行仿真,仿真結(jié)果如下圖:
設置測試顏色和第三個參考顏色塊顏色最相近然后隨機獲取10張圖片進行仿真測試,仿真結(jié)果如下:
對C組照片設置測試顏色和參考顏色5接近,仿真結(jié)果如下:
從圖2、圖3,可以看出,隨意設定一種測試顏色,最終的測試結(jié)果都是在該參考色處折線獲取最大值,例如:A組設置測試色為第2個參考色,曲線在第二個參考色處經(jīng)過QDA判別獲取最大值,同理圖4在三號色獲取最大值,圖5在5號色獲取最大值,在D組試驗中6號色獲取最大值,但是判別有兩條曲線出現(xiàn)誤差??偟膩碚f,QDA判別的整體分布是合乎理論要求,判別率比較高。
4 結(jié)語
通過對醫(yī)用試紙的研究,提出了基于QDA和LDA在sRGB顏色空間直接進行圖像識別的算法,該算法可以克服樣本數(shù)量小、環(huán)境因素對圖片的影響,能夠做出快速判斷。但是由于JPEG格式局限性,對于小樣本數(shù)據(jù)分析協(xié)相關性強,影響判別分析,因此,研究如何通過小樣本做正確快速的識別并將此算法能夠在一般的硬件產(chǎn)品上運行是下一步研究的重點。
參考文獻:
[1] Fisher R A.The use of multiple measurements in taxonomic problems[J].Annals of eugenics,1936,7(2):176-188.
[2] Pastrana J C,Rath T.Novel image processing approach for solving the overlapping problem in agriculture[J].Biosystems Engineering,2013,115(1):106~115.
[3] 陳紅文.植被滲流溝在洞庭湖區(qū)的推廣應用[J].湖南文理學院學報(自然科學版),2014,26(1):61-63.
[4] 曹斌芳,彭光含,彭元杰,et al.一種分層閾值優(yōu)化的語音感知小波去噪方法[J].湖南文理學院學報(自然科學版),2014,26(2):35-39.
[5] 王文山,柳平增,臧官勝,et al.基于物聯(lián)網(wǎng)的果園環(huán)境信息監(jiān)測系統(tǒng)的設計[J].山東農(nóng)業(yè)大學學報(自然科學版),2012,43(2):239-243.
[6] Weidong W.Optimizing regularized discriminant analysis in virtual training samples[J].JOURNAL OF COMPUTER AIDED DESIGN AND COMPUTER GRAPHICS,2006,18(9):1327.