劉翠玲, 聞世震, 孫曉榮, 張善哲, 姜傳智, 殷鶯倩
(北京工商大學(xué) 人工智能學(xué)院/食品安全大數(shù)據(jù)技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100048)
目前,近紅外光譜技術(shù)已廣泛應(yīng)用于食品、藥品、農(nóng)產(chǎn)品等領(lǐng)域的無(wú)損檢測(cè)中。微型便攜式近紅外光譜儀因體積小、價(jià)格低等優(yōu)點(diǎn),逐漸在食品安全領(lǐng)域中得到普及和應(yīng)用[1-3]。隨著便攜式光譜儀集成化程度的提高,該類產(chǎn)品實(shí)現(xiàn)了數(shù)據(jù)采集、處理和得到結(jié)果顯示一鍵式操作等系統(tǒng)功能。雖然該類產(chǎn)品對(duì)特定物質(zhì)有較高精度的采集和分析能力,但是現(xiàn)有產(chǎn)品存在設(shè)備成本高、模型可擴(kuò)展性較差和適用場(chǎng)景單一的問(wèn)題,不適用于多目標(biāo)場(chǎng)景的食品品質(zhì)實(shí)時(shí)在線檢測(cè)和分析。
近年來(lái),云計(jì)算及其服務(wù)在諸多領(lǐng)域得到了廣泛應(yīng)用[4-6],尤其是云服務(wù)器使用成本降低,提高了各領(lǐng)域基于云計(jì)算服務(wù)的開(kāi)發(fā)效率。云計(jì)算融合了分布式計(jì)算、網(wǎng)格計(jì)算、虛擬化、網(wǎng)絡(luò)存儲(chǔ)等計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的特點(diǎn)[7],在移動(dòng)計(jì)算方面有著顯著優(yōu)勢(shì)?;谠朴?jì)算的便捷、可擴(kuò)展、廉價(jià)等優(yōu)勢(shì),結(jié)合光譜分析技術(shù),通過(guò)部署食品光譜模型到云計(jì)算中心,實(shí)現(xiàn)模型資源云端共享;同時(shí)云計(jì)算中心高性能服務(wù)器高效率的計(jì)算能力,為食品品質(zhì)實(shí)時(shí)在線檢測(cè)分析提供了服務(wù)支撐。
國(guó)內(nèi)外基于近紅外光譜技術(shù)的食品品質(zhì)檢測(cè)相關(guān)研究較多[8-10],針對(duì)云計(jì)算與光譜檢測(cè)技術(shù)的結(jié)合在國(guó)內(nèi)外也有研究。李慶等[11]利用云端互聯(lián)便攜式近紅外技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)名貴藥材西紅花與其常見(jiàn)偽品和摻偽品進(jìn)行了現(xiàn)場(chǎng)快速真?zhèn)舞b別及摻偽量的定量預(yù)測(cè)。王林惠等[12]設(shè)計(jì)了一套基于深度卷積神經(jīng)網(wǎng)絡(luò)的柑橘蟲害實(shí)時(shí)檢測(cè)系統(tǒng),實(shí)現(xiàn)了柑橘蟲害的快速準(zhǔn)確識(shí)別。Muller-Maatsch等[13]提出了對(duì)每種食品或目標(biāo)化合物,使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)策略的數(shù)據(jù)融合方法,對(duì)光譜數(shù)據(jù)進(jìn)行云端分析。目前,云計(jì)算在光譜檢測(cè)技術(shù)的應(yīng)用研究主要是使用云端系統(tǒng)對(duì)單一對(duì)象檢測(cè)分析,提高了檢測(cè)分析的便捷性,但缺乏對(duì)云端光譜分析系統(tǒng)的設(shè)計(jì)結(jié)構(gòu)和實(shí)現(xiàn)過(guò)程的整體描述,對(duì)于系統(tǒng)的模型擴(kuò)展性和光譜資源共享功能關(guān)注較少。
基于云計(jì)算技術(shù)和光譜分析技術(shù)的優(yōu)勢(shì),以食品品質(zhì)多場(chǎng)景實(shí)時(shí)在線檢測(cè)為目的,本研究擬構(gòu)建以云計(jì)算服務(wù)為中心的光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)。以小麥粉面筋為例,建立定量分析模型并部署到云端,以手機(jī)終端作為數(shù)據(jù)傳輸媒介,完成光譜數(shù)據(jù)采集上傳和分析結(jié)果可視化,驗(yàn)證系統(tǒng)的可靠性。希望提供一種云端部署模型實(shí)現(xiàn)光譜實(shí)時(shí)在線分析方案,為多場(chǎng)景下食品品質(zhì)快速無(wú)損檢測(cè)提供平臺(tái)和技術(shù)支撐。
光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)是以模型復(fù)用和光譜數(shù)據(jù)共享為最終目的的開(kāi)放式服務(wù)平臺(tái)。通過(guò)系統(tǒng)中已經(jīng)建立的模型,對(duì)實(shí)時(shí)采集的光譜數(shù)據(jù)進(jìn)行快速分析,為現(xiàn)場(chǎng)無(wú)損快速檢測(cè)提供有力支持。系統(tǒng)整體架構(gòu)自下而上分別為設(shè)備層、客戶端層和云服務(wù)層。系統(tǒng)架構(gòu)如圖1。
圖1 光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)架構(gòu)Fig.1 Architecture of spectral real-time online detection system
在設(shè)備層中,便攜式光譜儀負(fù)責(zé)采集光譜數(shù)據(jù),使用通用串行總線(universal serial bus, USB)或者低功耗藍(lán)牙(bluetooth low energy, BLE)方式與客戶端通信,由客戶端進(jìn)行管理控制。在客戶端層中,移動(dòng)設(shè)備作為數(shù)據(jù)傳輸媒介,通過(guò)無(wú)線網(wǎng)絡(luò)與云服務(wù)器進(jìn)行通信,實(shí)現(xiàn)光譜數(shù)據(jù)上傳和接收光譜數(shù)據(jù)云端計(jì)算結(jié)果,而且還可完成本地光譜數(shù)據(jù)可視化和控制便攜式光譜儀設(shè)備的功能。在云服務(wù)層,硬件系統(tǒng)由云服務(wù)器廠商提供,根據(jù)系統(tǒng)所需的運(yùn)算能力和數(shù)據(jù)存儲(chǔ)空間大小,從云服務(wù)器廠商獲取云服務(wù)器作為該系統(tǒng)的基礎(chǔ)開(kāi)發(fā)環(huán)境,利用模塊化開(kāi)發(fā)思想,將光譜算法和建模算法設(shè)計(jì)為應(yīng)用編程接口(application programming interface, API),在主程序中組合調(diào)用即可完成光譜分析;同時(shí)云服務(wù)層還包含了數(shù)據(jù)存儲(chǔ)和用戶管理,云端部署的模型和參與云計(jì)算的光譜數(shù)據(jù)存放于云服務(wù)器的數(shù)據(jù)庫(kù)中,根據(jù)用戶注冊(cè)身份給予對(duì)應(yīng)的使用權(quán)限,管理員可對(duì)模型和光譜數(shù)據(jù)進(jìn)行增刪改查,普通用戶可以查詢、上傳光譜數(shù)據(jù)和使用模型,光譜模型由管理員負(fù)責(zé)進(jìn)行維護(hù)更新,保證了系統(tǒng)穩(wěn)定性。
現(xiàn)有的近紅外光譜分析軟件大多數(shù)是基于離線數(shù)據(jù)進(jìn)行分析研究,較少有在線光譜獲取和離線光譜分析的結(jié)合,進(jìn)而難以實(shí)現(xiàn)實(shí)時(shí)在線分析,在一定程度上制約了現(xiàn)場(chǎng)快速檢測(cè)的信息化發(fā)展。為了更加符合便攜式光譜儀實(shí)際檢測(cè)場(chǎng)景的需求,在現(xiàn)有便攜式近紅外光譜技術(shù)的基礎(chǔ)上,增加云服務(wù)器作為光譜數(shù)據(jù)分析系統(tǒng)載體,在云端實(shí)現(xiàn)光譜數(shù)據(jù)分析并返回分析結(jié)果。通過(guò)將分析功能封裝并部署至云端,用戶只需在手機(jī)終端控制便攜式光譜儀采集數(shù)據(jù)并上傳數(shù)據(jù)至云服務(wù)器進(jìn)行分析處理,即可得到數(shù)據(jù)可視化的分析結(jié)果。系統(tǒng)的主要功能如圖2。
圖2 光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)功能結(jié)構(gòu)Fig.2 Functional structure of spectral real-time online detection system
光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)主要功能包括用戶基本信息和權(quán)限管理;常用的光譜預(yù)處理算法管理,如多元散射校正(multiplicative scatter correction, MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variable transformation, SNV)、Savitzky-Golay卷積平滑(Savitzky-Golay smooth, S-G)等[14];常用的建模算法管理,如主成分回歸(principle component regression, PCR)、偏最小二乘回歸(partial least squares regression, PLSR)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)等[15];光譜數(shù)據(jù)和光譜模型的上傳與下載;光譜數(shù)據(jù)和模型導(dǎo)入,返回結(jié)果評(píng)價(jià);光譜數(shù)據(jù)預(yù)處理、建立模型、結(jié)果可視化。
光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)的服務(wù)端由前端和后端兩部分組成。前端系統(tǒng)主要用于用戶與服務(wù)端交互,簡(jiǎn)化數(shù)據(jù)管理和使用。后端系統(tǒng)是光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)的核心,用于處理移動(dòng)端和系統(tǒng)前端發(fā)來(lái)的請(qǐng)求。前端系統(tǒng)采用HTML、CSS和JavaScript編程語(yǔ)言編寫管理界面,使用Vue前端框架實(shí)現(xiàn)系統(tǒng)的前后端分離。后端系統(tǒng)開(kāi)發(fā)語(yǔ)言采用Java 8,使用Spring開(kāi)發(fā)框架實(shí)現(xiàn)控制反轉(zhuǎn)(inversion of control, IoC)和面向切面編程(aspect oriented programming, AOP)技術(shù),采用SpringMVC開(kāi)發(fā)模式簡(jiǎn)化開(kāi)發(fā)流程,降低系統(tǒng)的耦合性,便于對(duì)系統(tǒng)的功能擴(kuò)展;使用Java的持久層框架MyBatis簡(jiǎn)化對(duì)輸入輸出數(shù)據(jù)的處理;使用Maven項(xiàng)目構(gòu)建工具自動(dòng)管理項(xiàng)目依賴包;服務(wù)器數(shù)據(jù)存儲(chǔ)使用MySQL 5.7,Web容器采用Tomcat 8.0。光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)界面如圖3。
圖3 光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)界面Fig.3 Interface of spectral real-time online detection system
系統(tǒng)主要有原始數(shù)據(jù)管理、數(shù)據(jù)分析管理和基礎(chǔ)信息管理。原始數(shù)據(jù)管理模塊用于存儲(chǔ)實(shí)驗(yàn)樣本的光譜數(shù)據(jù),數(shù)據(jù)由管理員審核上傳,普通用戶只可查看和使用。數(shù)據(jù)分析管理模塊負(fù)責(zé)對(duì)光譜數(shù)據(jù)進(jìn)行處理,用戶可在該模塊界面選擇需要進(jìn)行分析的光譜數(shù)據(jù)、預(yù)處理方法和建模算法,在線分析光譜數(shù)據(jù)并給出可視化的分析結(jié)果?;A(chǔ)信息管理模塊包括了用戶權(quán)限、個(gè)人信息和上傳的文件,由管理員負(fù)責(zé)更新和維護(hù)。
移動(dòng)端系統(tǒng)基于第三方軟件開(kāi)發(fā)工具,在Android平臺(tái)上開(kāi)發(fā)手機(jī)終端應(yīng)用程序。在Android Studio 4.2軟件環(huán)境中開(kāi)發(fā)光譜儀通信和網(wǎng)絡(luò)數(shù)據(jù)傳輸服務(wù)代碼,主要完成控制光譜儀數(shù)據(jù)采集、設(shè)置光譜儀采集參數(shù)、光譜儀數(shù)據(jù)的本地存儲(chǔ)、光譜儀采集數(shù)據(jù)網(wǎng)絡(luò)傳輸和解析光譜儀分析系統(tǒng)返回結(jié)果。該移動(dòng)端系統(tǒng)的軟件功能流程如圖4。
圖4 移動(dòng)端軟件功能流程Fig.4 Flow chart of mobile terminal software function
移動(dòng)端使用JavaScript對(duì)象表示法(javascript object notation, JSON)格式作為數(shù)據(jù)格式,相比較傳統(tǒng)的可擴(kuò)展標(biāo)記語(yǔ)言(extensible markup language, XML)數(shù)據(jù)格式,JSON數(shù)據(jù)格式能直接與服務(wù)器端進(jìn)行交互,壓縮數(shù)據(jù)大小,降低網(wǎng)絡(luò)的占用帶寬。同時(shí)移動(dòng)端采用異步通信模式,降低應(yīng)用程序的耦合性,提升應(yīng)用程序與服務(wù)器端的通信效率。
2.3.1開(kāi)發(fā)環(huán)境
系統(tǒng)的開(kāi)發(fā)環(huán)境:Windows10 21H1,內(nèi)存16GB,處理器為AMD Ryzen 7 5800H、阿里云云服務(wù)器ECS(1核CPU,2 GB內(nèi)存,1M bps帶寬,40 GB存儲(chǔ)空間),服務(wù)器操作系統(tǒng)CentOS 7.5。
2.3.2實(shí)現(xiàn)方式
云計(jì)算服務(wù)主要在系統(tǒng)服務(wù)端實(shí)現(xiàn),包含控制模塊、服務(wù)模塊和數(shù)據(jù)通信模塊,系統(tǒng)云計(jì)算服務(wù)實(shí)現(xiàn)方式如圖5??刂颇K用于處理用戶按照超文本傳輸協(xié)議(hypertext transfer protocol,HTTP)發(fā)送的請(qǐng)求參數(shù),根據(jù)請(qǐng)求參數(shù)的內(nèi)容,將光譜數(shù)據(jù)傳遞給服務(wù)模塊中對(duì)應(yīng)的數(shù)據(jù)處理方法。服務(wù)模塊是云計(jì)算服務(wù)的核心,其包含不同種類物質(zhì)定量分析的業(yè)務(wù)邏輯代碼,根據(jù)模型的多項(xiàng)表達(dá)式運(yùn)算規(guī)則,提取光譜數(shù)據(jù)中對(duì)應(yīng)波長(zhǎng)點(diǎn)的吸光度數(shù)據(jù)進(jìn)行計(jì)算,實(shí)現(xiàn)物質(zhì)的定量分析,同時(shí)將分析結(jié)果數(shù)據(jù)傳遞給數(shù)據(jù)通信模塊。數(shù)據(jù)通信模塊用于系統(tǒng)訪問(wèn)光譜模型資源,建立與數(shù)據(jù)庫(kù)的通信和打包數(shù)據(jù)功能,通過(guò)將光譜數(shù)據(jù)的分析結(jié)果打包成JSON格式,發(fā)送至手機(jī)應(yīng)用程序進(jìn)行數(shù)據(jù)解析并可視化,實(shí)現(xiàn)系統(tǒng)的云計(jì)算服務(wù)。
圖5 系統(tǒng)云計(jì)算服務(wù)實(shí)現(xiàn)方式Fig.5 Implementation of system cloud computing services
2.3.3云服務(wù)部署
云服務(wù)部署流程如圖6,在獲取阿里云ECS服務(wù)器后,登錄阿里云服務(wù)器控制面板,使用ECS服務(wù)器賬號(hào)配置并激活服務(wù)器;搭建JDK1.8+Tomcat+MySQL5.7環(huán)境,為后續(xù)Web項(xiàng)目的運(yùn)行提供基礎(chǔ)條件;使用FinalShell軟件在本地建立與云服務(wù)器的SSH遠(yuǎn)程連接,然后使用FTP協(xié)議將本地的光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)的服務(wù)端項(xiàng)目打包上傳至云服務(wù)器;通過(guò)云服務(wù)器控制面板配置服務(wù)器安全組規(guī)則,選擇項(xiàng)目所需服務(wù)器開(kāi)放的端口號(hào);最后使用Linux命令運(yùn)行項(xiàng)目文件,完成系統(tǒng)云服務(wù)的部署。
圖6 云服務(wù)部署流程Fig.6 Flow chart of cloud service deployment
在部署過(guò)程中,項(xiàng)目未租用場(chǎng)地放置實(shí)體服務(wù)器,通過(guò)云服務(wù)廠商提供的控制面板有助于項(xiàng)目的快速部署,體現(xiàn)了云計(jì)算的存儲(chǔ)計(jì)算資源虛擬化和成本低的特點(diǎn)。另外,云服務(wù)器作為云計(jì)算服務(wù)載體,以付費(fèi)形式獲得額外計(jì)算資源,做到了按需付費(fèi),為項(xiàng)目后續(xù)擴(kuò)展提供了便利。
實(shí)驗(yàn)所用的小麥粉樣本均來(lái)自北京古船面粉廠不同批次的面粉產(chǎn)品,共計(jì)125個(gè)。對(duì)每個(gè)小麥粉樣本,按照GB/T 5506.2—2008《小麥和小麥粉 面筋含量 第2部分:儀器法測(cè)定濕面筋》,使用面筋儀測(cè)得小麥粉面團(tuán)洗滌后的濕面筋含量;按照GB/T 5506.3—2008《小麥和小麥粉 面筋含量 第3部分:烘箱干燥法測(cè)定干面筋》,使用烘箱和干燥器對(duì)濕面筋進(jìn)行干燥,得到小麥粉樣本的干面筋含量。本研究中小麥粉樣本的面筋含量以干面筋含量為標(biāo)準(zhǔn),其數(shù)值由北京古船面粉廠按照國(guó)標(biāo)方法測(cè)定提供。
NIR-M-R2型便攜式近紅外光譜儀,深圳譜研互聯(lián)有限公司。
在室內(nèi)自然狀態(tài)下使用便攜式近紅外光譜儀采集小麥粉光譜數(shù)據(jù)。光譜儀參數(shù)設(shè)置為:光譜采集波長(zhǎng)為900~1 700 nm,積分時(shí)間100 ms,掃描次數(shù)6次,平滑寬度2.34 nm,曝光時(shí)間0.635 ms。采集光譜數(shù)據(jù)前,使用白板對(duì)光譜儀進(jìn)行校正。采集時(shí),室內(nèi)溫度31 ℃,濕度29%,將采集探頭與透明袋裝小麥粉樣本的平整面接觸,每個(gè)小麥粉樣本采集一次。實(shí)驗(yàn)一共采集125組包含228個(gè)波長(zhǎng)點(diǎn)的小麥粉樣本吸光度數(shù)據(jù),原始光譜數(shù)據(jù)如圖7。由圖7可見(jiàn),在波長(zhǎng)為 1 120、1 300、1 680 nm處有較為明顯的吸收峰,其中1 120 nm吸收峰對(duì)應(yīng)C—H鍵的3倍頻吸收帶,1 300 nm的吸收峰對(duì)應(yīng)水分中的O—H吸收帶,1 680 nm的吸收峰對(duì)應(yīng)蛋白質(zhì)結(jié)構(gòu)中的N—H吸收帶。由于采集光譜數(shù)據(jù)的環(huán)境、樣本表面差異等因素影響,光譜重疊現(xiàn)象較為明顯,影響預(yù)測(cè)模型的準(zhǔn)確性。
圖7 小麥粉樣本原始近紅外光譜Fig.7 Raw NIR spectrum of a wheat flour sample
3.3.1模型評(píng)價(jià)指標(biāo)的確定
光譜分析模型的評(píng)價(jià)指標(biāo)有:均方根誤差(root mean square error, RMSE)、相關(guān)系數(shù)(correlation coefficient,R2)以及相對(duì)分析誤差(relative percent deviation, RPD)[16]。RMSE越小模型效果越好;R2越接近于1,預(yù)測(cè)結(jié)果越好;RPD大于2表明模型具有良好的預(yù)測(cè)能力。
3.3.2樣本集劃分
樣本集中會(huì)存在差異性較小的樣本,包含這些樣本建立的校正模型不利于模型的擴(kuò)展和維護(hù)。Kennard-Stone(K-S)算法[17]基于變量之間的歐氏距離,選擇距離大的樣本為校正集,剩余樣本作為預(yù)測(cè)集,保證了校正集中的樣本按照空間距離分布均勻。對(duì)采集得到的125個(gè)小麥粉樣本,按照4∶1比例劃分校正集和預(yù)測(cè)集,劃分出100個(gè)校正集樣本和25個(gè)預(yù)測(cè)集樣本。校正集和預(yù)測(cè)集的面筋含量統(tǒng)計(jì)結(jié)果如表1,校正集的最大值和最小值分別為36.2%、25.7%,預(yù)測(cè)集的最大值和最小值分別為31.8%、27.3%,校正集和預(yù)測(cè)集的平均值相差0.2%,表明樣本集經(jīng)K-S算法劃分后的數(shù)據(jù)分布合理,有助于提高模型的穩(wěn)定性。
表1 校正集和預(yù)測(cè)集面筋含量統(tǒng)計(jì)結(jié)果
3.3.3光譜預(yù)處理
為了減少近紅外光因小麥粉樣本散射水平不同帶來(lái)的光譜差異,需要對(duì)原始光譜進(jìn)行光譜預(yù)處理。采用多種預(yù)處理方法進(jìn)行PLSR建模,結(jié)果如表2。由表2可知,使用MSC預(yù)處理方法建立的模型效果較好,預(yù)測(cè)集的R2達(dá)到了0.826 4,RMSE達(dá)到了0.463 2,RPD達(dá)到了2.162 1。MSC通過(guò)把所有光譜數(shù)據(jù)的平均值作為理想光譜,修正光譜數(shù)據(jù)的基線平移和偏移現(xiàn)象,可以有效消除由于散射水平不同帶來(lái)的光譜差異,從而增強(qiáng)光譜與數(shù)據(jù)之間的相關(guān)性[18]。經(jīng)MSC預(yù)處理后的光譜如圖8,光譜重疊現(xiàn)象大幅減少,1 120、1 300、1 680 nm處的波峰更為明顯,有利于提高模型的準(zhǔn)確性。
表2 不同預(yù)處理方法下PLSR模型的預(yù)測(cè)集結(jié)果
圖8 小麥粉樣本經(jīng)MSC預(yù)處理后的光譜Fig.8 Spectra of wheat flour samples pretreated by MSC
3.3.4波長(zhǎng)篩選
在建立近紅外分析模型時(shí),光譜儀器噪聲或外界環(huán)境因素變化使某些波段下的樣本光譜信噪比較低,影響模型穩(wěn)定性。利用波長(zhǎng)篩選選擇光譜數(shù)據(jù)的最優(yōu)波長(zhǎng)進(jìn)行建模,可提高模型的預(yù)測(cè)能力和穩(wěn)定性。使用多種特征波長(zhǎng)篩選算法建立PLSR模型,結(jié)果如表3。使用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣法[19](competitive adaptive reweighted sampling, CARS)所建立PLSR模型預(yù)測(cè)集的R2、RMSE和RPD都優(yōu)于無(wú)信息變量消除算法(uninformative variables elimination,UVE)、連續(xù)投影算法(successive projections algorithm,SPA)建立的PLSR模型。CARS算法選取小麥粉面筋的特征波長(zhǎng)如圖9。由圖9可知,當(dāng)交叉驗(yàn)證均方根誤差(root mean square error of cross validation, RMSECV)逐漸減小時(shí),表明光譜無(wú)用信息被剔除;當(dāng)RMSECV逐漸增大時(shí),表明光譜中的有用信息被剔除。因此取50次采樣所建立的PLSR模型中對(duì)應(yīng)的最小RESECV作為最優(yōu)結(jié)果,在取樣運(yùn)行次數(shù)達(dá)到24次時(shí),RMSECV最小。經(jīng)過(guò)CARS算法進(jìn)行特征波長(zhǎng)提取,共選出28個(gè)最優(yōu)波長(zhǎng)。
表3 不同特征波長(zhǎng)篩選算法PLSR模型的預(yù)測(cè)集結(jié)果
圖9 基于CARS算法的小麥粉面筋特征波長(zhǎng)選取結(jié)果Fig.9 Selection results of characteristic wavelengths of gluten in wheat flour based on CARS algorithm
3.3.5模型建立
對(duì)于便攜式近紅外光譜儀所測(cè)得的小麥粉面筋光譜數(shù)據(jù),使用MSC+CARS+PLSR算法建立定量分析模型。校正集的R2為0.900 6,校正集的RMSE為0.125 9,預(yù)測(cè)集的R2為0.870 4,預(yù)測(cè)集的RMSE為0.182 4,相對(duì)分析誤差RPD為2.835 1,說(shuō)明模型對(duì)面筋含量有良好的預(yù)測(cè)能力。校正集和預(yù)測(cè)集的面筋含量真實(shí)值與預(yù)測(cè)值對(duì)比結(jié)果如圖10。
圖10 小麥粉校正集和預(yù)測(cè)集面筋含量預(yù)測(cè)結(jié)果Fig.10 Prediction results of gluten content of wheat flour gluten training set and test set
將基于MSC+CARS+PLSR算法建立的包含28個(gè)波長(zhǎng)的小麥粉面筋定量分析模型以表達(dá)式形式寫入服務(wù)端程序中,并重新打包上傳至服務(wù)器完成模型部署。為了驗(yàn)證光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)的可靠性,從北京古船面粉廠不同批次的面粉產(chǎn)品中隨機(jī)選取與樣本集無(wú)關(guān)的25個(gè)小麥粉測(cè)試樣本,測(cè)試樣本的面筋含量按照GB/T 5506.2—2008、GB/T 5506.3—2008進(jìn)行測(cè)定,數(shù)值由北京古船面粉廠測(cè)定提供。
使用便攜式光譜儀手機(jī)終端,設(shè)置光譜儀參數(shù)(采集波長(zhǎng)為900~1 700 nm,積分時(shí)間為100 ms,掃描次數(shù)為6次,平滑寬度為2.34 nm,曝光時(shí)間為0.635 ms),對(duì)測(cè)試樣本進(jìn)行光譜掃描,上傳測(cè)得的光譜數(shù)據(jù)至云端處理,返回小麥粉面筋預(yù)測(cè)值和處理用時(shí)。系統(tǒng)對(duì)單個(gè)小麥粉樣本的光譜數(shù)據(jù)分析結(jié)果如圖11。
在相同網(wǎng)絡(luò)環(huán)境下,使用光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)對(duì)25個(gè)小麥粉測(cè)試樣本進(jìn)行檢測(cè)分析,系統(tǒng)測(cè)得的25個(gè)小麥粉測(cè)試樣本結(jié)果如圖12。25個(gè)小麥粉樣本的面筋含量預(yù)測(cè)值與真實(shí)值差值范圍為0~0.7%,單個(gè)樣本檢測(cè)分析平均耗時(shí)7.09 s。結(jié)果表明,光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)預(yù)測(cè)分析小麥粉面筋含量較為準(zhǔn)確且用時(shí)較少,驗(yàn)證了系統(tǒng)通過(guò)建立分析模型并部署模型至云端,完成實(shí)時(shí)在線分析是可行的。
圖12 25個(gè)小麥粉樣本的面筋分析結(jié)果Fig.12 Gluten analysis results for 25 wheat flour samples
結(jié)合云計(jì)算技術(shù)和光譜分析技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)多場(chǎng)景食品品質(zhì)光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)。該系統(tǒng)所使用的便攜式光譜儀只需光譜數(shù)據(jù)采集模塊,與集成化程度更高的專用光譜儀相比,能做到體積更小,設(shè)備成本更低。使用手機(jī)終端將光譜數(shù)據(jù)上傳云端并進(jìn)行分析處理,不但提高了光譜檢測(cè)的便捷性,同時(shí)還可將分析結(jié)果可視化。
1)在云服務(wù)器中實(shí)現(xiàn)光譜數(shù)據(jù)分析和模型部署,通過(guò)在云端部署不同的分析模型,解決了模型擴(kuò)展性較差的問(wèn)題。
2)光譜實(shí)時(shí)在線檢測(cè)系統(tǒng)利用云計(jì)算高擴(kuò)展性、使用便捷等優(yōu)勢(shì),彌補(bǔ)了光譜分析擴(kuò)展性、便捷性上的不足,保證了云端進(jìn)行光譜分析的可靠性,同時(shí)使用云服務(wù)器搭建系統(tǒng)環(huán)境,降低了光譜模型資源的共享成本。
以小麥粉面筋定量分析驗(yàn)證系統(tǒng)的可靠性,結(jié)果表明,系統(tǒng)具有良好的準(zhǔn)確性和較快的分析速度,能夠滿足光譜的實(shí)時(shí)在線檢測(cè)分析。希望該系統(tǒng)可為模型資源共享和光譜實(shí)時(shí)在線檢測(cè)分析提供一種解決方案,同時(shí)為多場(chǎng)景食品品質(zhì)的快速無(wú)損檢測(cè)提供新的思路。系統(tǒng)分析結(jié)果與云端部署模型精度具有較高相關(guān)性,本研究所使用的模型準(zhǔn)確率還有提升空間,因此后續(xù)的模型應(yīng)持續(xù)優(yōu)化,可采用增加樣本量、使用人工神經(jīng)網(wǎng)絡(luò)建模等方法提高模型精度。