楊守志, 徐嘉陽, 劉宇寧, 楊婷婷, 謝文凱, 李劍君
(生物醫(yī)學信息工程教育部重點實驗室 西安交通大學 生命科學與技術學院,陜西 西安 710049)
汞(Hg)是對人類最具危害的重金屬之一,長期生活在Hg2+含量超標的環(huán)境中會引起腦組織損害、神經衰弱綜合征以及嚴重的肝腎損傷等癥狀[1]。目前Hg2+檢測已有很多方法,常用的檢測方法主要有原子光譜法、電感耦合等離子體—質譜法、直接測汞儀等[2],但是這些方法由于儀器和檢測費用昂貴、分析周期長等問題,難以用于食品環(huán)境安全的快速監(jiān)測。近年來,納米金顆粒(gold nanoparticles)因其性質穩(wěn)定以及良好的光學性質常常應用于食品污染物的檢測中[3]。將納米金修飾到紙基上進行快速便捷的比色傳感檢測就是目前較熱門的研究方向[4],如杜鵑等人基于基因(DNA)修飾的納米金探針研制了一種可檢測水溶液中Hg2+濃度的層析試紙條[5]。納米金除了具有良好的光學特性,還具有過氧化物酶的性質,在H2O2存在的情況下,可催化3,3′,5,5′—四甲基聯苯胺(3,3′,5,5′-tetramethylbenzidine,TMB)生成藍色產物,在652 nm處產生特定吸收峰[6]。據目前文獻報道,利用紙基比色反應檢測Hg2+雖然快速,但只是“有”、“無”的定性分析,而無法利用顏色梯度變化等信息進行定量檢測。
如何很好地解決這個問題,機器學習中的支持向量機(support vector machine,SVM)可對圖片進行模式識別、分類以及回歸分析[7]。洪茜等人利用SVM分類算法對于豬肉中四環(huán)素量進行分類分級[8],Wang H Q等人利用手機對比色結果進行觀測[9]。
本文研究以上述納米金催化H2O2和TMB的比色反應為原理,在修飾后的硫酸紙反應基底上滴加Hg2+和H2O2溶液,對產生了比色反應的試紙進行圖像數據采集及預處理,利用SVM算法中的線性核函數對圖像數據進行分類,從而對比色結果實現Hg2+低、中、高濃度等級評估。對相關參數進行優(yōu)化后準確率可達93.3 %。在此基礎上,開發(fā)了手機App,對比色結果進行實時拍照分析,其總體判別率也可達到91.1 %。為實現Hg2+濃度的等級評估提供了一種新型快速檢測的方法。
檸檬酸鈉(Na3C6H5O7·2H2O,Aladin試劑有限公司);氯金酸 (HAuCl4·4H2O,國藥集團化學試劑有限公司);氯化汞(HgCl2);3,3′,5,5′—四甲基聯苯胺 (TMB);雙氧水(H2O2,ω=30 %);氫氧化鈉(NaOH,國藥集團化學試劑有限公司);MILLI-Q超純水(電阻值為18.2 MΩ·cm);硫酸紙若干張(愛卡樂,120 mg/m2)
紫外可見分光光度計UV3600(島津,日本);HH—1型數顯恒溫水浴鍋(常州朗越儀器制造有限公司);梅特勒—托利多B-S天平(梅特勒—托利多儀器上海有限公司);漩渦式混合器(海門市其林貝爾儀器制造有限公司);透射電子顯微鏡(日本電子光學公司)
1.3.1 納米金球的制備
利用改進的檸檬酸鹽還原法[10],制得吸收峰約為520 nm的納米金球溶液。
1.3.2 紙基比色
按文獻所示方式[6],取TMB粉末溶于乙醇中稀釋,得到5×10-4mol/L的TMB溶液;將4 mL的5×10-4mol/L的TMB溶液、2.5 mL納米金球溶液、2 mL配置好的Britton-Robison(BR)緩沖溶液、0.5 mL超純水充分混合得到浸泡液。將1 cm×1 cm的硫酸紙置于浸泡液中浸泡10 min后,于60 ℃烘箱中烘烤10 min得到檢測試紙。將50 μL不同濃度的Hg2+待測液和50 μL H2O2檢測液滴加到檢測試紙上,觀測顏色變化。
選取濃度范圍分別為(0~1)×10-6mol/L,1×10-6~1×10-5mol/L 和1×10-5~1×10-4mol/L的Hg2+溶液進行比色檢測,90 s后用手機進行圖像采集,采集過程如圖1所示。每個范圍各重復15次操作并采集數據。
圖1 智能手機采集圖像過程
如表 1所示,實驗共獲得45張圖片,對應高、中、低三類不同濃度范圍的Hg2+濃度檢測物的樣本各15個。將采集數據的2/3作為訓練樣本,1/3作為預測樣本進行驗證。具體選擇方式為從第三個數據開始,每間隔2個數據抽取一個數據作為預測集,余下的數據作為訓練集,其中Hg2+濃度為(0~1)×10-6mol/L是低濃度;1×10-6~1×10-5mol/L是中濃度;1×10-5~1×10-4mol/L是高濃度,每種濃度各含有15個樣本,其中訓練樣本10個,預測樣本5個。
表1 樣本中Hg2+含量統(tǒng)計結果
在采集到比色圖像之后,提取不同顏色特征組合作為分類特征并作為輸入變量,建立SVM分類模型,預測其正確率。
本文研究構建了一個SVM分類器,用于判別Hg2+的濃度類別,將采用SVM中的C_SVC模型,選擇不同的核函數類型,并選取合適的懲罰系數C和核函數參數g的值,以分類結果的準確率作為訓練目標,得出最佳核函數類型及合適的參數,用6折交叉法進行驗證[11]。
上述圖像預處理的操作利用MATLAB R2019b實現,提取特征值和建立模型的操作利用OpenCV 3.4.1實現[12]。
在最優(yōu)反應條件下,取(400~2 000)nmol/L的系列濃度汞離子標準溶液與之反應,記錄反應過程中652 nm處的紫外吸收光譜值。隨著Hg2+濃度的增加,顏色由無色變?yōu)樗{綠色,吸光度與Hg2+濃度呈正相關(如圖2所示),相關系數為0.993 1。
圖2 濃度為(400~2 000)nmol/L的Hg2+在652 nm處的吸光度
圖3 干擾性離子檢測結果
三個不同濃度等級Hg2+的紙基比色檢測的結果如圖4所示。
圖4 紙基比色檢測結果
將圖像RGB值矩陣數據作為所提取的特征信息,為實現對Hg2+的濃度等級判別,選取高、中、低濃度的Hg2+實驗數據各15組。將圖片裁剪為40像素×40像素的大小,每組數據經過預處理后RGB平均值如表 2所示。
表2 不同濃度等級Hg2+ 檢測樣本實驗數據
選用各個濃度等級中序號為3,6,9,12,15號作為測試集,其余為訓練集,即共有30組訓練數據和15組測試數據。訓練模型的過程中,采用6折交叉驗證,在選取SVM的模型為C_SVM,且給定松弛系數ε=1×10-6的前提下,分別選用線性核函數、徑向基函數(radial basis function,RBF)核函數、Sigmoid核函數和多項式核函數,懲罰系數C的取值范圍為2-10~210,核函數參數g的取值范圍為2-10~20,通過C和g的不同取值,找出準確率最高時對應的參數,確定不同核函數對應的最高準確率及相應的最優(yōu)參數,如表3所示。
表3 不同核函數對應的最高準確率及相應的最優(yōu)參數
可見,線性核函數和多項式核函數的模型的預測準確率均為93.3 %,明顯優(yōu)于其他核函數。由于取得最高準確率時,多項式核函數的階數degree為1,退化為線性核,故在本測試中,線性核和多項式核函數可以達到的準確率相同。因此,最終確定選用SVM的模型及最優(yōu)參數為:用線性核函數,且C=0.1,g=1。以最優(yōu)參數完成模型訓練,對測試集進行預測,結果如表4所示。預測結果正確率總體較高,表明此模型取得了較好的訓練結果。
表4 SVM 分類實驗統(tǒng)計結果
基于上述研究結果,利用Android Studio平臺開發(fā)手機應用(App)[13],軟件設計流程及界面如圖5和圖6所示。本應用軟件提供歷史檢測記錄功能以方便用戶評估近期的Hg2+檢測情況,間接反映用戶近期Hg2+污染現狀。
圖5 手機App具體操作流程設計
圖6 手機App操作與結果顯示界面
使用該軟件對高、中、低三種濃度各15組進行濃度判別,如圖7所示,判別準確率分別為86.7 %,93.3 %和93.3 %,總體判別準確率為91.1 %。
圖7 手機App判別Hg2+濃度的結果
本文將SVM算法應用于Hg2+比色分析檢測的研究中,并開發(fā)了相應的手機App,對水體中的Hg2+的含量進行低、中、高濃度等級評估。
本研究驗證了Hg2+濃度和TMB氧化反應的比色結果在650 nm處的紫外吸收光譜的吸收峰值呈良好的線性關系,相關系數(R2)為0.993 1。確定了SVM分類器的核函數為線性核及最優(yōu)參數C=0.1,g=1,基于上述SVM分類器,開發(fā)了新型檢測手機App,用戶通過拍照上傳比色結果圖,就可以快速分析Hg2+的濃度等級,識別準確率可達91.1 %。本文研究結合產品便攜化的發(fā)展趨勢和機器學習研究熱點,在Hg2+濃度判別研究領域實現了較高的選擇特異性和判別準確率,為實現快速簡便地檢測食品內含殘留物提供技術支持和思路,具備良好的社會意義和經濟價值。