摘 要: 為解決傳統(tǒng)的差示掃描量熱法(differential scanning calorimetry, DSC) 信號(hào)分析需要手動(dòng)選點(diǎn)來(lái)構(gòu)造基線(xiàn),存在人為因素引入誤差且操作繁瑣等問(wèn)題,將機(jī)器學(xué)習(xí)方法應(yīng)用于DSC 信號(hào)分析中,提出一種融合無(wú)監(jiān)督學(xué)習(xí)的DSC 自動(dòng)基線(xiàn)構(gòu)造及特征峰信號(hào)分析方法。首先使用改進(jìn)的聚類(lèi)算法將特征峰兩側(cè)的基線(xiàn)與特征峰信號(hào)初步分離;其次對(duì)特征峰兩側(cè)的基線(xiàn)信號(hào)結(jié)合迭代多項(xiàng)式擬合進(jìn)行基線(xiàn)重構(gòu);最后將原始信號(hào)減去重構(gòu)的基線(xiàn)信號(hào)得到凈特征峰信號(hào),進(jìn)行熱力學(xué)分析。對(duì)多組實(shí)驗(yàn)數(shù)據(jù)分析表明,基于機(jī)器學(xué)習(xí)的DSC 信號(hào)分析方法可自動(dòng)實(shí)現(xiàn)良好的基線(xiàn)構(gòu)造與峰信號(hào)分析,提高DSC 信號(hào)分析的速度和精度,有效減少人為因素引起的分析誤差。
關(guān)鍵詞: 差示掃描量熱法; 基線(xiàn)重構(gòu); 峰識(shí)別; 聚類(lèi); 迭代擬合; 信號(hào)分析
中圖分類(lèi)號(hào): TB9; TH81; TP181 文獻(xiàn)標(biāo)志碼: A 文章編號(hào): 1674–5124(2025)03–0053–06
0 引 言
差示掃描量熱法是一種檢測(cè)樣品材料的物理或化學(xué)性質(zhì)隨溫度改變而變化的熱分析技術(shù)[1]。分析DSC 信號(hào)可以得到樣品的一系列熱力學(xué)參數(shù)。DSC 憑借快速、簡(jiǎn)便、能夠提供樣品的熱力學(xué)(熱容量、焓、熵等)和動(dòng)力學(xué)數(shù)據(jù)(反應(yīng)速率和活化能)等特點(diǎn),在食品、制藥等行業(yè)有著廣泛應(yīng)用[2],然而,目前主流的DSC 信號(hào)分析方法需要在目視檢查實(shí)驗(yàn)曲線(xiàn)之后通過(guò)手動(dòng)方式形成基線(xiàn)[3],將特征峰扣減基線(xiàn)后再進(jìn)行分析。特征峰指DSC 曲線(xiàn)中偏離試樣基線(xiàn)達(dá)到最大或最小,而后又返回到試樣基線(xiàn)的部分。這種處理方法可能會(huì)受到主觀(guān)偏差的影響,導(dǎo)致計(jì)算結(jié)果出現(xiàn)差異。此外,對(duì)于數(shù)據(jù)量較大的DSC 實(shí)驗(yàn)來(lái)說(shuō),手動(dòng)處理基線(xiàn)工作非常耗時(shí)。國(guó)際上成熟的DSC 儀器生產(chǎn)商大多開(kāi)發(fā)了相應(yīng)的數(shù)據(jù)分析軟件, 如TA Universal Analysis、NETZSCHProteus、SETARAM Calisto 等,軟件中可以選擇多種不同的基線(xiàn)形式,如線(xiàn)性基線(xiàn)、S 型基線(xiàn)等來(lái)對(duì)DSC 實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,得到多種熱力學(xué)和動(dòng)力學(xué)參數(shù)。但這些軟件也存在一些不足:首先,在分析樣品的特征峰時(shí),不能自動(dòng)識(shí)別峰位置,需手動(dòng)選擇左右端點(diǎn)來(lái)確定特征峰位置,選擇不同的端點(diǎn)會(huì)導(dǎo)致相關(guān)的計(jì)算結(jié)果發(fā)生變化,從而引入人為因素造成的分散性,降低了DSC 計(jì)算結(jié)果的準(zhǔn)確性;其次,傳統(tǒng)的基線(xiàn)選取方法僅在峰區(qū)域內(nèi)選點(diǎn)構(gòu)造基線(xiàn),未充分考慮峰外基線(xiàn)趨勢(shì)。因此,對(duì)于DSC 基線(xiàn)構(gòu)造以及特征峰信號(hào)分析需要一種自動(dòng)且可重復(fù)的方法來(lái)克服當(dāng)前的瓶頸。
對(duì)基線(xiàn)以及信號(hào)峰的自動(dòng)處理方法在拉曼光譜中應(yīng)用較多[4],但與DSC 信號(hào)不同,拉曼光譜中信號(hào)峰數(shù)目較多且非負(fù)。迄今為止,對(duì)DSC 信號(hào)進(jìn)行自動(dòng)分析的研究仍然很少,Cisse 等[5] 使用三次樣條插值法來(lái)構(gòu)造DSC 信號(hào)的基線(xiàn),但是,他們未進(jìn)一步對(duì)特征峰進(jìn)行分析。Mazurenko 等[6] 建立了一個(gè)交互式應(yīng)用來(lái)處理DSC 數(shù)據(jù),對(duì)DSC 數(shù)據(jù)全局?jǐn)M合,但是,該方法無(wú)法識(shí)別DSC 特征峰信號(hào)以及構(gòu)造基線(xiàn)。隨著人工智能的發(fā)展,已有諸多研究工作將機(jī)器學(xué)習(xí)理論巧妙地應(yīng)用于熱分析領(lǐng)域,并且取得了較好的效果。Farah 等[7] 運(yùn)用隨機(jī)森林、梯度增強(qiáng)機(jī)和多層感知器等多種機(jī)器學(xué)習(xí)方法分析DSC 數(shù)據(jù),實(shí)現(xiàn)了對(duì)牛奶中摻假物的快速檢測(cè)。Wesoowski 等[8] 結(jié)合熱重曲線(xiàn)及化學(xué)參數(shù)訓(xùn)練了一種反向傳播神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)了植物油正確分類(lèi)。
聚類(lèi)是典型的無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法,基于密度的有噪聲的應(yīng)用空間聚類(lèi)( density-based spatialclustering of application with noise, DBSCAN)算法將具有足夠高密度的區(qū)域劃分為簇,并可以在具有“噪聲”的空間數(shù)據(jù)庫(kù)中發(fā)現(xiàn)任意形狀的聚類(lèi)[9]。本文將密度聚類(lèi)算法應(yīng)用到DSC 信號(hào)分析領(lǐng)域,提出一種融合無(wú)監(jiān)督學(xué)習(xí)的DSC 特征峰信號(hào)自動(dòng)分析方法:首先使用自適應(yīng)DBSCAN 算法將樣品特征峰前后兩部分的實(shí)驗(yàn)數(shù)據(jù)聚類(lèi)成兩個(gè)簇以初步將樣品特征峰信號(hào)與基線(xiàn)分離,其次對(duì)聚類(lèi)得到的特征峰前后兩個(gè)簇內(nèi)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行迭代多項(xiàng)式擬合,最后根據(jù)原始DSC 信號(hào)與多項(xiàng)式擬合曲線(xiàn)的交點(diǎn)進(jìn)行基線(xiàn)重構(gòu),以從DSC 信號(hào)中提取凈特征峰信號(hào)。多組實(shí)驗(yàn)數(shù)據(jù)的計(jì)算結(jié)果表明,與傳統(tǒng)的手動(dòng)構(gòu)造基線(xiàn)方式分析DSC 特征峰信號(hào)相比,本研究提出的方法,操作簡(jiǎn)單、速度更快、重復(fù)性更高。