褚小立,陳 瀑,李敬巖,劉 丹,許育鵬
(石油化工科學(xué)研究院,北京 100083)
現(xiàn)代近紅外光譜(Near infrared spectroscopy,NIRS)分析技術(shù)起源于上世紀(jì)50年代末期,經(jīng)過半個(gè)多世紀(jì)的發(fā)展,目前已達(dá)到較為成熟的水平,被廣泛地用于農(nóng)業(yè)、食品、石化和制藥等領(lǐng)域,并在一些領(lǐng)域取得了規(guī)?;膽?yīng)用成效[1]。
在谷物分析方面,目前全球約90%的小麥貿(mào)易基于整粒谷物近紅外分析儀檢測蛋白質(zhì)含量進(jìn)行。據(jù)統(tǒng)計(jì),加拿大農(nóng)業(yè)采用近紅外光譜技術(shù)后(主要是對農(nóng)作物的管理),稻米的產(chǎn)量每公頃提高約0.6噸,小麥的產(chǎn)量提高約1.1噸,小麥蛋白質(zhì)含量提高約1%[2-3]。
在石化行業(yè),在線近紅外光譜已廣泛應(yīng)用于煉油企業(yè)。從原油調(diào)合、原油加工(原油蒸餾、催化裂化、催化重整和烷基化等)到成品油(汽油、柴油和潤滑油)調(diào)合的整個(gè)生產(chǎn)環(huán)節(jié),在線近紅外光譜分析技術(shù)可為實(shí)時(shí)控制和優(yōu)化系統(tǒng)提供原料、中間產(chǎn)物和最終產(chǎn)品物化性質(zhì)等方面的信息,為裝置的平穩(wěn)操作和優(yōu)化生產(chǎn)提供準(zhǔn)確的分析數(shù)據(jù),與優(yōu)化控制系統(tǒng)結(jié)合,為石化企業(yè)帶來了可觀的經(jīng)濟(jì)和社會(huì)效益。在線近紅外光譜分析也成為現(xiàn)代智能化煉廠的標(biāo)志性技術(shù)之一[4]。
在制藥領(lǐng)域,以近紅外光譜為代表的現(xiàn)代過程分析技術(shù)可對制藥過程的關(guān)鍵質(zhì)量參數(shù)進(jìn)行監(jiān)控,以改進(jìn)成品的質(zhì)量并降低藥品的制造成本,在歐美的一些大型制藥企業(yè)得到了廣泛推崇,取得了很好的應(yīng)用效果[5]。
振動(dòng)光譜基礎(chǔ)理論、光譜儀器硬件和化學(xué)計(jì)量學(xué)是現(xiàn)代近紅外光譜分析技術(shù)的3大支柱。近些年,近紅外光譜技術(shù)在這3個(gè)方面均取得了顯著進(jìn)展。本文結(jié)合應(yīng)用研究情況,就上述3個(gè)方面對近紅外光譜分析技術(shù)的最新進(jìn)展進(jìn)行綜述,并對未來發(fā)展趨勢進(jìn)行了展望。
由于化學(xué)鍵振動(dòng)的非諧性,近紅外光譜包含有豐富的化學(xué)鍵振動(dòng)信息,但這些譜峰往往吸收較弱且重疊在一起,盡管可以通過傳統(tǒng)的導(dǎo)數(shù)光譜或二維相關(guān)光譜對其歸屬進(jìn)行初步解析,但仍很難深入地對其歸屬和強(qiáng)度進(jìn)行完整的辨識和利用。近些年,隨著分子模擬技術(shù)和計(jì)算機(jī)科學(xué)的發(fā)展,量子化學(xué)計(jì)算也被越來越多地用于近紅外光譜的模擬計(jì)算。在這一基礎(chǔ)研究方向上,日本的Ozaki教授和奧地利的Huck教授做了較多的工作[6-7],我國的吳志生教授也開展了相關(guān)的研究及應(yīng)用工作[8]。例如,盡管甲醇分子中的化學(xué)鍵相對較少,但在近紅外光譜中卻擁有豐富的化學(xué)鍵振動(dòng)信息,Ozaki 等采用量子化學(xué)計(jì)算對甲醇的近紅外光譜進(jìn)行模擬,得到了20余個(gè)倍頻和組合頻的吸收峰(圖1),與實(shí)驗(yàn)得到的光譜有較好的吻合性[9]。采用量子化學(xué)計(jì)算還可以得到分子間氫鍵、分子內(nèi)氫鍵、溶劑效應(yīng)等對近紅外光譜特征吸收峰頻率和強(qiáng)度的影響。更為重要的是,通過量子化學(xué)計(jì)算可以指導(dǎo)多元定量和定性模型的建立,進(jìn)一步闡明近紅外光譜進(jìn)行定量和定性的依據(jù),為近紅外光譜分析技術(shù)提供可靠的方法學(xué)基礎(chǔ)[10]。
近紅外光譜中含有豐富的羥基和氫鍵信息,近紅外測量的對象如食品、谷物、煙草、聚合物、生物組織等都含有水,當(dāng)加入擾動(dòng)條件(如溫度、壓力、溶質(zhì)等)時(shí),水的近紅外光譜會(huì)發(fā)生明顯變化,變化的水光譜可以反映物質(zhì)結(jié)構(gòu)的改變或水與溶質(zhì)之間的相互作用,在分子層面上獲取豐富的信息。2006年,Tsenkova等在研究不同質(zhì)量奶制品近紅外光譜特征的基礎(chǔ)上提出“水光譜組學(xué)(Aquaphotomics)”,開辟了一個(gè)新的研究領(lǐng)域[11]。水光譜組學(xué)通過研究體系中水的光譜信息在溫度和溶質(zhì)(種類和含量)等擾動(dòng)下產(chǎn)生的變化,了解不同物質(zhì)及含量對水結(jié)構(gòu)產(chǎn)生的影響,再通過水的結(jié)構(gòu)推斷溶質(zhì)的結(jié)構(gòu)與功能,迄今水光譜組學(xué)取得了豐富的研究成果。我國邵學(xué)廣教授基于溫控近紅外光譜技術(shù),開展了多項(xiàng)水光譜組學(xué)的研究工作,例如采用化學(xué)計(jì)量學(xué)方法通過提取隨溫度變化的水光譜信息對溶質(zhì)進(jìn)行結(jié)構(gòu)和定量分析[12]。臧恒昌教授將水光譜組學(xué)用于生物藥物生產(chǎn)純化過程中的水醇體系,提出了一種利用水光譜信息的變化定量分析發(fā)酵過程中低含量甲醇的方法[13]。
綜上所述,采用量子化學(xué)計(jì)算、水光譜組學(xué)等手段可以從近紅外光譜中挖掘出更多、更豐富的物理和化學(xué)信息,有望在很大程度上將傳統(tǒng)的近紅外光譜“黑箱模型”變?yōu)椤盎疑P汀保踔痢鞍咨P汀薄?/p>
由于近紅外光譜區(qū)處于紫外可見光譜與中紅外光譜之間,因此光譜儀有很多的分光方式,這為近紅外光譜儀器的小型化和微型化帶來了極大的便利。近紅外光譜儀從車載臺式(Benchtop)、便攜式(Portable)、手持式(Hand-held),發(fā)展到袖珍式(Pocket-sized)和微型化(Miniature),用了不到10年的時(shí)間。表1給出了一些商品化的便攜式、手持式和微型近紅外光譜儀器及其性能指標(biāo)[16]。近些年,一些公司致力于開發(fā)微型近紅外光譜儀芯片,例如已有公司研制出外觀尺寸為18 mm×18 mm,厚度為4 mm,重量小于10 g,范圍為1 100~2 500 nm的微型光譜儀,其大小足以集成于智能手機(jī)和可穿戴設(shè)備中,而且將來的光譜儀會(huì)越來越小。楊宗銀等[14]用一種帶隙漸變的特殊納米線替代傳統(tǒng)光譜儀中的分光和探測元件,并在納米線上加工出了光探測器陣列,將傳統(tǒng)光學(xué)器件的尺寸縮小到納米尺度。
表1 商品化的便攜式、手持式和微型近紅外光譜儀器及其性能指標(biāo)Table 1 Commercial portable,hand-held and miniature NIR spectrophotometers and main specifications
(續(xù)表1)
近些年,便攜式、微型光譜儀器在人們?nèi)粘I钪械膽?yīng)用研究已初顯端倪[15-16],多款概念產(chǎn)品紛紛亮相市場,例如智能洗衣機(jī)、紅酒智能鑒別掃描儀、脫水監(jiān)測智能手環(huán)、衣料鑒別儀等。近期,三星電子申請專利并在網(wǎng)站上展示了一種具有近紅外光譜儀功能的智能手機(jī),如圖2所示。該手機(jī)的后部攝像系統(tǒng)頂部提供了一系列光源,照射物品后,手機(jī)鏡頭會(huì)接收反射信號,生成光譜數(shù)據(jù)。這種智能手機(jī)有望實(shí)現(xiàn)生鮮產(chǎn)品新鮮度和味道的測量,還可以探測其營養(yǎng)價(jià)值,例如脂肪、蛋白質(zhì)和碳水化合物含量;也可用于測量皮膚的水油平衡狀態(tài)、一杯飲料的含糖量,甚至有望直接參與醫(yī)療診斷過程。
微型近紅外光譜儀芯片與機(jī)器人和無人機(jī)的結(jié)合越來越緊密。例如,目前已有商品化的塑料分選設(shè)備將機(jī)器人手臂與光譜儀結(jié)合用于廢塑料種類的快速鑒別,以便更有效地對廢塑料進(jìn)行再利用。近紅外光譜微型儀器與機(jī)器人的結(jié)合甚至可以實(shí)現(xiàn)完全無人的智能化分析實(shí)驗(yàn)室:從取樣到數(shù)據(jù)的報(bào)出完全由機(jī)器人操作,并可以全天候工作,顯著提高分析效率。
近紅外光譜成像儀器的小型化和便攜式也得到了快速發(fā)展,如表2所示,有近20家制造商研制生產(chǎn)小型化和便攜式的近紅外光譜成像儀器,但目前還主要集中在短波區(qū)域。如表3所示,近紅外光譜成像技術(shù)在環(huán)境、地質(zhì)、食品、生物醫(yī)學(xué)、醫(yī)藥、考古與文物、公安與法學(xué)、反恐技術(shù)等領(lǐng)域有著廣泛的應(yīng)用潛力[17]。
表2 商品化的小型和手持式近紅外光譜成像儀器及其性能指標(biāo)Table 2 Some commercially available small,hand-held hyperspectral imagers and their specifications
(續(xù)表2)
表3 低成本便攜式及手持式光譜成像儀潛在的應(yīng)用領(lǐng)域Table 3 Possible applications for low-cost portable and handheld spectroscopic imaging
近些年,多譜學(xué)儀器的組合和融合是另一個(gè)顯著的研究熱點(diǎn)[18-19]。例如,拉曼光譜儀器與中紅外光譜儀器的組合,激光誘導(dǎo)擊穿光譜(LIBS)儀器與拉曼光譜儀器的組合,中紅外光譜儀器與近紅外光譜儀器的組合,還有各種譜學(xué)成像儀器的組合等,這樣一臺小型或微型的儀器便可獲取更多、更豐富的物質(zhì)成分信息。這些融合或組合式的譜學(xué)或成像儀器已有商品化的產(chǎn)品。
近紅外光譜儀器和成像儀器的微型化無論從成本、性能還是應(yīng)用場景上都將會(huì)帶來重要的變革。由于數(shù)據(jù)存儲(chǔ)和計(jì)算速度等原因,上述這些光譜儀和光譜成像儀的應(yīng)用場景將來會(huì)得益于5G通訊、深度學(xué)習(xí)和云平臺等技術(shù)的發(fā)展,成為物聯(lián)網(wǎng)構(gòu)建中的關(guān)鍵組成元素和重要節(jié)點(diǎn)。
近紅外光譜與化學(xué)計(jì)量學(xué)是一對孿生技術(shù),兩者在相互促進(jìn)中不斷發(fā)展。在近紅外光譜分析中用到的化學(xué)計(jì)量學(xué)方法主要有光譜預(yù)處理算法、多元定量校正算法、定性模式識別算法和模型傳遞算法等,其中光譜預(yù)處理算法中包含了波長變量的選擇算法,另外,在光譜成像中還會(huì)用到多維光譜數(shù)據(jù)解析。
在光譜預(yù)處理方法中,外部參數(shù)正交化算法(EPO)和廣義最小二乘加權(quán)算法(GLSW)得到了較為廣泛的重視[20-21],這兩種算法可在一定程度上消除水分或溫度對光譜的影響。光譜波長變量篩選算法一直是研究的熱點(diǎn),以競爭性自適應(yīng)重加權(quán)算法(CARS)為代表的基于模型集群分析的變量選擇方法受到最為廣泛的關(guān)注,梁逸曾教授在該方面做了大量的研究工作[22]。今后,在提高波長變量選擇的穩(wěn)定性、可靠性和可解釋性等方面還應(yīng)更深入地研究,與光譜量子化學(xué)計(jì)算等基礎(chǔ)研究相結(jié)合有可能是新的研究方向。
近些年,以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為代表的深度學(xué)習(xí)算法開始用于近紅外光譜定量和定性模型的建立[23-25]。如圖3所示,與傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,卷積神經(jīng)網(wǎng)絡(luò)可以通過多個(gè)卷積層和池化層逐步提取蘊(yùn)藏在光譜數(shù)據(jù)中的微觀特征和宏觀特征,在一定程度上降低建模前對光譜的預(yù)處理和變量選取工作,減少建模的工作量。深度學(xué)習(xí)算法在光譜分析中的應(yīng)用研究剛剛開始,還有諸如網(wǎng)絡(luò)規(guī)模、參數(shù)的優(yōu)化選擇、過擬合、模型的可解釋性等問題仍值得進(jìn)一步研究。深度學(xué)習(xí)中的遷移學(xué)習(xí)(Transfer learning)、域適配(Domain adaptation)和多任務(wù)學(xué)習(xí)(Multi-task learning)等策略有望為模型傳遞提供新思路,在一定程度上解決定量和定性模型在不同儀器上的通用性問題。
圖3 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖Fig.3 Architecture of a convolutional neural network
隨著各應(yīng)用領(lǐng)域大型近紅外光譜數(shù)據(jù)庫的建立,建模策略將會(huì)變得越來越重要。傳統(tǒng)的集成(或共識)建模策略和基于局部樣本的建模策略將得到進(jìn)一步發(fā)展,在提高模型預(yù)測穩(wěn)定性和準(zhǔn)確性方面發(fā)揮重要作用[26]。
值得一提的是,盡管不斷出現(xiàn)新的有效的化學(xué)計(jì)量學(xué)算法,但與儀器配套的計(jì)算軟件的功能往往升級不及時(shí),這一問題有望通過云計(jì)算服務(wù)平臺的推廣應(yīng)用得以解決。
目前,流程工業(yè)正處于從傳統(tǒng)生產(chǎn)模式向精確數(shù)字化、智能化現(xiàn)代生產(chǎn)模式轉(zhuǎn)變的時(shí)期。信息深度“自感知”、智慧優(yōu)化“自決策”和精準(zhǔn)控制“自執(zhí)行”是智能工廠的3個(gè)關(guān)鍵特征,其中信息深度“自感知”是智能煉廠的基礎(chǔ)。原料、中間物料和產(chǎn)品的分子組成和物性分析數(shù)據(jù)是信息感知的重要組成部分,以近紅外光譜為核心之一的現(xiàn)代過程分析技術(shù)為化學(xué)信息感知提供了非常有效的手段。
例如在石化企業(yè),以汽油管道自動(dòng)調(diào)和技術(shù)為例,目前在線近紅外光譜分析儀已成為該技術(shù)的標(biāo)配[27]。經(jīng)過十余年的積累,我國已經(jīng)建立了較為完善的汽油近紅外光譜數(shù)據(jù)庫,能夠在10 min之內(nèi)預(yù)測出近10種組分汽油和成品汽油的多個(gè)關(guān)鍵物性(研究法辛烷值、抗爆指數(shù)、烯烴、芳烴、苯、MTBE含量、蒸氣壓等),調(diào)合優(yōu)化控制系統(tǒng)則利用各種汽油組分之間的調(diào)合效應(yīng)實(shí)時(shí)優(yōu)化,計(jì)算出調(diào)合組分之間的相對比例,即調(diào)合配方,保證調(diào)合后的汽油產(chǎn)品滿足質(zhì)量規(guī)格要求,并使調(diào)合成本和質(zhì)量過剩降低到最小。這項(xiàng)技術(shù)每年可為煉油企業(yè)帶來上千萬元的經(jīng)濟(jì)效益。
再例如在飼料生產(chǎn)企業(yè),隨著市場競爭的日趨激烈,低成本的原料投入、穩(wěn)定的產(chǎn)品質(zhì)量、低的加工消耗成為市場中穩(wěn)定生存的關(guān)鍵。采用在線近紅外光譜分析技術(shù)可以實(shí)時(shí)檢測原料、過程產(chǎn)品及成品的品質(zhì)參數(shù)(例如水分、蛋白、粗纖維、含油量、灰分、顏色等),通過優(yōu)化控制系統(tǒng)根據(jù)實(shí)時(shí)產(chǎn)品質(zhì)量及目標(biāo)產(chǎn)品的質(zhì)量進(jìn)行生產(chǎn)過程的精細(xì)閉環(huán)調(diào)整,保證成品飼料質(zhì)量的穩(wěn)定性,實(shí)現(xiàn)產(chǎn)品收率和質(zhì)量最優(yōu)化,在規(guī)模生產(chǎn)方面為企業(yè)帶來更多的經(jīng)濟(jì)效益。
在線近紅外光譜技術(shù)在食品、制藥和化工等領(lǐng)域的應(yīng)用大幕在我國剛剛拉開,這是順應(yīng)精細(xì)化管理和智能化加工的大趨勢,將會(huì)給流程工業(yè)帶來變革[28-29]。在今后的很長一段時(shí)間內(nèi),在線近紅外光譜技術(shù)在流程工業(yè)領(lǐng)域應(yīng)用穩(wěn)定向好的基本面不會(huì)發(fā)生改變。此外,在廢塑料、紡織物及果品在線篩選領(lǐng)域,在線近紅外光譜技術(shù)的應(yīng)用也將越來越廣泛。
在線近紅外光譜技術(shù)的實(shí)施是一項(xiàng)多學(xué)科交叉的系統(tǒng)工程[30-31],需要多部門的協(xié)同合作,后續(xù)的運(yùn)維也需要專業(yè)的團(tuán)隊(duì)執(zhí)行。在在線近紅外光譜技術(shù)的推廣方面,本土定制化的設(shè)計(jì)、制造、實(shí)施和運(yùn)維具有較強(qiáng)的優(yōu)勢,我國相關(guān)企業(yè)應(yīng)利用自身的技術(shù)優(yōu)勢,合理組合各種資源,在不同領(lǐng)域打造出多支有實(shí)力、有特色的研究和應(yīng)用團(tuán)隊(duì)。
國內(nèi)外近紅外光譜(含光譜成像)應(yīng)用類的綜述文獻(xiàn)已有近百篇,其中有谷物、肉類、牛奶、食用油、水果、土壤、木材等大領(lǐng)域的綜述文章[1],也有一整條產(chǎn)業(yè)鏈(例如紅酒產(chǎn)業(yè)鏈,從葡萄栽培土壤、葡萄生長管理、發(fā)酵到成品品質(zhì)的檢測等)的綜述文章[32]。近些年的綜述文章已逐漸聚焦到更細(xì)分的應(yīng)用對象上,例如橄欖油、咖啡、土豆等,甚至有綜述論文引用近百篇文獻(xiàn)專門評述近紅外光譜用于監(jiān)測儲(chǔ)糧中蟲害的應(yīng)用進(jìn)展[33],這說明近紅外光譜的應(yīng)用研究已進(jìn)入了新階段,逐漸向細(xì)分應(yīng)用領(lǐng)域發(fā)展。
近紅外的應(yīng)用研究和實(shí)際應(yīng)用取得了豐碩成果,以我國標(biāo)準(zhǔn)方法為例,目前已制訂頒布了幾十項(xiàng)涉及近紅外光譜分析技術(shù)的標(biāo)準(zhǔn)方法(包括國家、行業(yè)、團(tuán)體和地方標(biāo)準(zhǔn))[34],也有多項(xiàng)標(biāo)準(zhǔn)正在制訂中,說明這項(xiàng)技術(shù)已經(jīng)得到了較為廣泛的認(rèn)可,有望在實(shí)際應(yīng)用中加快普及的步伐。
從應(yīng)用發(fā)展方向來看,農(nóng)業(yè)、食品和制藥領(lǐng)域近紅外光譜的研究依舊是熱點(diǎn),尤其是近紅外光譜成像技術(shù)的應(yīng)用研究更為突出[35-37];在林業(yè)、再生能源和化工等領(lǐng)域的應(yīng)用研究也得到了持續(xù)關(guān)注;在刑偵、生物醫(yī)學(xué)和臨床診斷方面的應(yīng)用研究亦從未停止。但近紅外技術(shù)在上述領(lǐng)域較大規(guī)模的實(shí)際應(yīng)用尚需時(shí)日。
從微電子機(jī)械系統(tǒng)(MEMS)制造工藝、大數(shù)據(jù)、深度學(xué)習(xí)算法、云計(jì)算平臺、物聯(lián)網(wǎng)等技術(shù)的發(fā)展可以看到其對近紅外光譜分析技術(shù)的推動(dòng)力量,從工農(nóng)業(yè)生產(chǎn)、服務(wù)業(yè)和人們?nèi)粘I畹确矫娴陌l(fā)展可以看到其對近紅外光譜分析技術(shù)的需求牽引力量。在這兩種力量的作用下,未來一段時(shí)期內(nèi),近紅外光譜技術(shù)將會(huì)得到加速發(fā)展,以近紅外光譜為核心的商業(yè)產(chǎn)品將在不同業(yè)務(wù)領(lǐng)域進(jìn)一步提供深化和細(xì)化的服務(wù),近紅外光譜有望成為與時(shí)代發(fā)展特征(如大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等)最相關(guān)的一項(xiàng)分析技術(shù)。
盡管近紅外光譜分析技術(shù)的應(yīng)用前景廣闊,但仍有一些技術(shù)壁壘和難題需要攻克。例如,目前光譜數(shù)據(jù)庫或模型的儀器供應(yīng)商依賴(Vendor lock-in)問題,即各廠商的儀器之間存在的臺間差異,使其普適性的應(yīng)用遷移變得困難,需要從儀器標(biāo)準(zhǔn)化、算法和軟件等多方面協(xié)同努力方能得以解決。再例如,無論是傳統(tǒng)的機(jī)器學(xué)習(xí)算法還是深度學(xué)習(xí)算法,都是在有監(jiān)督學(xué)習(xí)的框架下建立定性或定量分析模型。所謂有監(jiān)督學(xué)習(xí)就是每個(gè)訓(xùn)練集樣本是帶有標(biāo)簽的,即每個(gè)樣本的光譜對應(yīng)著一組參考值(真實(shí)的濃度值或類別)。隨著近紅外光譜技術(shù)的廣泛應(yīng)用,將產(chǎn)生大量無標(biāo)簽的光譜資源,這些光譜沒有對應(yīng)的參考值,因此,如何充分利用大量無標(biāo)簽的樣本信息進(jìn)行半監(jiān)督或無監(jiān)督分析模型的構(gòu)建,有可能是未來很值得研究的新方向。