張 勇,王振華,趙 蔚2
(1.鄂爾多斯市交通運(yùn)輸工程質(zhì)量監(jiān)測(cè)鑒定服務(wù)中心,內(nèi)蒙古 鄂爾多斯 017000;2.交通運(yùn)輸部科學(xué)研究院,北京 100029)
國(guó)道242項(xiàng)目起點(diǎn)位于鄂爾多斯市杭錦旗與鄂托克交界處的公其日嘎北,與國(guó)道242線臨河黃河大橋至公其日嘎段公路順接,終點(diǎn)位于烏蘭鎮(zhèn)東繞城公路與國(guó)道338交叉處。項(xiàng)目路線全長(zhǎng)93.752 km,其中完全利用路段12.187 km,實(shí)際建設(shè)里程長(zhǎng)度81.565 km,路線總體走向由北向南。本項(xiàng)目采用雙向兩車道二級(jí)公路標(biāo)準(zhǔn),設(shè)計(jì)速度80 km/h,路基寬度12 m,路面寬10.5 m,全部采用瀝青混凝土路面。
對(duì)于本項(xiàng)目的到場(chǎng)瀝青,采用傳統(tǒng)檢測(cè)方法與紅外快速檢測(cè)相結(jié)合的方式,逐車進(jìn)行入庫(kù)前檢測(cè),檢測(cè)合格后方可入庫(kù)。
瀝青的化學(xué)組成及內(nèi)部分子結(jié)構(gòu)是影響瀝青性能的關(guān)鍵[1],因此,對(duì)瀝青的化學(xué)組成及內(nèi)部分子結(jié)構(gòu)的表征可以影響瀝青的宏觀性能指標(biāo)[2-3]。
紅外光譜是瀝青等有機(jī)化合物最有效的表征手段[4-5]。采用衰減全反射紅外光譜技術(shù)對(duì)不同車輛運(yùn)輸?shù)臑r青樣品進(jìn)行光譜采集,采用S-G導(dǎo)數(shù)法預(yù)處理方法對(duì)光譜進(jìn)行預(yù)處理消除或減弱環(huán)境、儀器等噪聲的影響;再采用PCA主成分分析法進(jìn)行異常樣品剔除和數(shù)據(jù)優(yōu)化,采用留一法建庫(kù),最后采用數(shù)據(jù)挖掘方法建立光譜與性質(zhì)值之間的回歸曲線,依據(jù)最佳的預(yù)測(cè)效果選擇最佳波長(zhǎng)變量,將正確的光譜數(shù)據(jù)和性質(zhì)數(shù)據(jù)留在庫(kù)中,建立不同車次瀝青三大指標(biāo)快速預(yù)測(cè)定標(biāo)數(shù)據(jù)庫(kù),只需不超過(guò)30個(gè)樣本即可建立軟化點(diǎn)、針入度和延度的定標(biāo)模型,用于之后到場(chǎng)瀝青車中未知瀝青樣本檢測(cè),僅需5 min即可給出三大指標(biāo)檢測(cè)結(jié)果。
傅立葉變換紅外光譜儀,光譜范圍包含650 cm-1~4 000 cm-1,分辨率不小于4 cm-1,光譜測(cè)量方式為衰減全反射(ATR),內(nèi)部掃描次數(shù)為32次;裝樣次數(shù)為3次。
(1)Savitzky-Gola(S-G)一階導(dǎo)數(shù)預(yù)處理方法[6]
S-G卷積求導(dǎo)法可以在求導(dǎo)的同時(shí)降低噪音水平,是目前最常用的求導(dǎo)方法。該方法通過(guò)移動(dòng)窗口的方式,對(duì)每一個(gè)窗口中的數(shù)據(jù)點(diǎn)及其相鄰點(diǎn)進(jìn)行多項(xiàng)式最小二乘擬合,對(duì)擬合后的多項(xiàng)式進(jìn)行求導(dǎo)得到每個(gè)窗口中心點(diǎn)的導(dǎo)數(shù)。求導(dǎo)窗口應(yīng)該合理選擇,避免信息丟失和信噪比降低。本次采用S-G一階導(dǎo)數(shù),窗口寬度為5,擬合次數(shù)為2,求導(dǎo)次數(shù)為1。
(2)異常樣品篩查
使用所有瀝青樣本光譜(每條光譜是一矢量)構(gòu)成一個(gè)光譜矩陣。通過(guò)主成分分析[6](Principal Component Analysis,PCA)處理該矩陣數(shù)據(jù)。瀝青是多種成分組成的混合物,瀝青樣品的光譜是其各成分光譜的線性組合(即各成分濃度與光譜的乘積的加和)。通過(guò)PCA對(duì)光譜矩陣數(shù)據(jù)處理,得到一系列的虛擬成分光譜(稱之為主成分光譜)以及對(duì)應(yīng)的虛擬成分濃度(稱之為得分)。其中,第一主成分光譜所含信息量最大,第二主成分光譜次之,以此類推。光譜矩陣中的任意一張光譜均可以使用這些主成分光譜的線性組合表達(dá)出來(lái)(即主成分光譜與得分乘積的加和)。使用PCA對(duì)不同瀝青樣品光譜數(shù)據(jù)進(jìn)行處理,使用第一主成分PC1對(duì)第二主成分PC2的得分值作圖,如圖1(a)所示;同理,前三個(gè)主成分得分值作圖,如圖1(b)所示。這樣可將每個(gè)瀝青光譜分別投射至二維主成分光譜空間、三維主成分光譜空間等多維主成分空間里。不同的瀝青樣本在組成上有所不同,其光譜也不同,進(jìn)而,獲得的主成分光譜得分值也不同,使得它們?cè)谥鞒煞止庾V空間里的位置分布也不同。物以類聚,同類樣本在主成分光譜空間的分布具有聚類特征。遠(yuǎn)離聚類區(qū)域的樣本,稱之為異常樣品,其可能原因包括:①光譜采集誤差造成的;②光譜沒(méi)有問(wèn)題,與其他樣本相比,在組成上有明顯差別,即不是一類樣品。對(duì)于異常樣本,需重新采集光譜數(shù)據(jù),以二次判別是否與其他樣本為一類樣品,如果不是一類,則剔除該樣本。
圖1 (a) 前兩個(gè)主成分的二維光譜空間Fig.1 (a) Two-dimensional spectral space of the first two principal components
圖1 (b) 前三個(gè)主成分的三維光譜空間Fig.1(b) Three-dimensional spectral space of the first three principal components
使用偏最小二乘法[6](Partial Least Squares,PLS)將瀝青樣品的光譜數(shù)據(jù)和對(duì)應(yīng)的軟化點(diǎn)數(shù)據(jù)進(jìn)行關(guān)聯(lián),建立基于光譜預(yù)測(cè)軟化點(diǎn)的函數(shù)(也稱PLS模型)。其原理如下:
光譜定量分析的理論是Lanmbert-Beer定律,A=αlc,其中α為吸光系數(shù)(常數(shù))、l為光程(常數(shù))、c為吸光組分在樣品中的濃度,即吸光度A與被測(cè)樣品的結(jié)構(gòu)與組成有線性關(guān)系,樣品的結(jié)構(gòu)與組成又直接決定樣品的性質(zhì),因此,吸光度A與被測(cè)樣品的性質(zhì)(軟化點(diǎn))之間呈線性關(guān)系。由于瀝青樣品成分復(fù)雜,各種成分的光譜對(duì)軟化點(diǎn)貢獻(xiàn)不一樣,且在光譜上高度重疊,因此,Lanmbert-Beer定律不能直接應(yīng)用于瀝青樣品(混合物)光譜去關(guān)聯(lián)軟化點(diǎn)數(shù)據(jù),需要對(duì)瀝青光譜中各成分光譜進(jìn)行分離,在這里使用了PCA方法,將瀝青光譜分解為主成分光譜,再使用多個(gè)主成分光譜的得分值(該得分值為一個(gè)矩陣)與其軟化點(diǎn)數(shù)據(jù)進(jìn)行多元線性回歸,建立一個(gè)基于主成分得分的線性回歸方程(一般采用Matlab軟件進(jìn)行數(shù)據(jù)處理和回歸方程的建立),即模型。預(yù)測(cè)時(shí),首先通過(guò)PCA求出瀝青光譜的各主成分光譜的得分值,將這些得分值導(dǎo)入模型,即可計(jì)算出軟化點(diǎn)的值。
采用留一法建庫(kù),留一法是機(jī)器學(xué)習(xí)中對(duì)學(xué)習(xí)器進(jìn)行評(píng)估的一種方法,屬于交叉驗(yàn)證法(Cross Validation)的一個(gè)特例。假設(shè)有N個(gè)樣本,將每一個(gè)樣本作為測(cè)試樣本,其他N-1個(gè)樣本作為訓(xùn)練樣本。這樣得到N個(gè)分類器,N個(gè)測(cè)試結(jié)果。用這N個(gè)結(jié)果的平均值來(lái)衡量模型的性能。留一法使用的訓(xùn)練集與初始數(shù)據(jù)集相比只少了一個(gè)樣本,這就使得在絕大多數(shù)情況下,留一法中被實(shí)際評(píng)估的模型與期望評(píng)估的用D訓(xùn)練出的模型很相似。因此,留一法的評(píng)估結(jié)果往往被認(rèn)為比較準(zhǔn)確。
國(guó)道242項(xiàng)目面層采用6 cm AC-16C中粒式瀝青混凝土面層,全部選用90號(hào)基質(zhì)瀝青,全線瀝青用量約7 700噸。
收集242項(xiàng)目上的30個(gè)90號(hào)A級(jí)瀝青樣本,對(duì)其針入度、軟化點(diǎn)、延度等性質(zhì)進(jìn)行檢測(cè)。檢測(cè)結(jié)果如表1所示:
表1 瀝青檢測(cè)結(jié)果Tab.1 Test results of asphalt
用紅外光譜儀對(duì)收集到的樣本進(jìn)行光譜采集。每個(gè)樣本測(cè)量3張光譜(平均次數(shù):32,分辨率:4 cm-1,增益222)為樣品光譜,所有瀝青樣本的近紅外光譜圖,如圖2所示。
圖2 瀝青樣本紅外光譜圖Fig.2 Sample infrared spectrum of asphalt
采用PCA統(tǒng)計(jì)分析方法,對(duì)30個(gè)紅外樣本進(jìn)行異常樣品剔除。使用PCA對(duì)30個(gè)瀝青樣本光譜數(shù)據(jù)進(jìn)行處理,使用第二主成分PC2對(duì)第一主成分PC1的得分值作圖,如圖3(a)所示;同理,前三個(gè)主成分得分值作圖,如圖3(b)所示。
圖3 (a) 90號(hào)基質(zhì)瀝青前兩個(gè)主成分的二維光譜空間Fig.3(a) Two-dimensional spectral space of the first two principal components of No.90 base asphalt
圖3 (b) 前三個(gè)主成分的三維光譜空間Fig.3 (b) Three-dimensional spectral space of the first three principal components
在圖3中,樣本10、樣本15(方形點(diǎn))落在圈外,為異常樣本,對(duì)異常樣本重新進(jìn)行紅外光譜掃描,進(jìn)行PCA處理,重新繪制30個(gè)樣本的主成分多維光譜空間圖。重新作圖后發(fā)現(xiàn)異常樣本10、樣本15全部落在圈內(nèi),說(shuō)明30個(gè)樣本全部為一類樣品,30個(gè)樣本可以全部入庫(kù)。
針對(duì)瀝青的軟化點(diǎn)性質(zhì):采用S-G導(dǎo)數(shù)對(duì)30個(gè)樣本的紅外光譜進(jìn)行預(yù)處理,窗口寬度為5,擬合次數(shù)為2,求導(dǎo)次數(shù)為1,處理后的結(jié)果見(jiàn)圖4。
圖4 瀝青—S-G一階導(dǎo)數(shù)光譜圖Fig.4 Asphalt-S-G First Derivative Spectra
針對(duì)瀝青的25℃針入度和10℃延度:不采用預(yù)處理方法。選擇波段1 291~1 638 cm-1和2 747~3 085 cm-1用于建立模型。
本次研究,因?yàn)闃悠穪?lái)源單一,且JTG E20中對(duì)瀝青軟化點(diǎn)、針入度和延度3個(gè)性能均有再現(xiàn)性偏差要求,建模時(shí)不必按照統(tǒng)計(jì)學(xué)的要求收集不小于100個(gè)樣品,通過(guò)可靠性分析來(lái)確定預(yù)測(cè)效果,只要預(yù)測(cè)的結(jié)果與實(shí)測(cè)的檢測(cè)結(jié)果符合再現(xiàn)性偏差的要求,就可以確定模型的可靠性。
分別用10、15、20、25、30個(gè)樣本進(jìn)行建庫(kù)及性能預(yù)測(cè),根據(jù)JTG E20中再現(xiàn)性偏差要求,對(duì)模型的預(yù)測(cè)效果進(jìn)行評(píng)價(jià),并判斷合理的建庫(kù)樣本數(shù)量。
采用留一法分別進(jìn)行10、15、20、25、30個(gè)樣本的建庫(kù),采用PLS方法將PCA處理后的得分值與針入度性能進(jìn)行建模和預(yù)測(cè),模型的相關(guān)系數(shù)圖見(jiàn)圖5(a)~(e),預(yù)測(cè)結(jié)果見(jiàn)表2。
圖5 光譜與針入度的相關(guān)系數(shù)圖Fig.5 Correlation coefficient diagram between spectrum and penetration
表2 瀝青樣本針入度預(yù)測(cè)結(jié)果Tab.2 Prediction results of sample penetration of asphalt
由表2可以看出,當(dāng)選取25和15個(gè)樣本進(jìn)行建模預(yù)測(cè)時(shí),均有兩個(gè)樣本的預(yù)測(cè)值超出了JTG E20中規(guī)定的再現(xiàn)性偏差要求;當(dāng)選取30、20、10個(gè)樣本進(jìn)行建模預(yù)測(cè)時(shí),均有一個(gè)樣本的預(yù)測(cè)值超出了再現(xiàn)性偏差要求。該預(yù)測(cè)結(jié)果說(shuō)明,當(dāng)樣本數(shù)量遠(yuǎn)小于統(tǒng)計(jì)分析所需的樣本數(shù)量時(shí),隨著樣本數(shù)量的增加,模型預(yù)測(cè)的準(zhǔn)確性沒(méi)有明顯變化,因此對(duì)于單一來(lái)源的瀝青樣品,采用10個(gè)樣本數(shù)量進(jìn)行建模,即可滿足要求。
采用留一法分別進(jìn)行10、15、20、25、30個(gè)樣本的建庫(kù),采用PLS方法將PCA處理后的得分值與軟化點(diǎn)性能進(jìn)行建模和預(yù)測(cè),模型的相關(guān)系數(shù)圖見(jiàn)圖6(a)~(e),預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 瀝青樣本軟化點(diǎn)預(yù)測(cè)結(jié)果Tab.3 Prediction results of softening point of asphalt sample
圖6 光譜與軟化點(diǎn)的相關(guān)系數(shù)圖Fig.6 Correlation coefficient diagram with softening point of spectrum
由表3可以看出,當(dāng)選取30、25、20、15、10個(gè)樣本分別進(jìn)行建模預(yù)測(cè)時(shí),預(yù)測(cè)值均滿足JTG E20中規(guī)定的再現(xiàn)性偏差要求。該預(yù)測(cè)結(jié)果說(shuō)明,對(duì)于單一來(lái)源的瀝青樣品,采用10個(gè)樣本數(shù)量進(jìn)行建模,即可滿足要求。
采用留一法分別進(jìn)行10、15、20、25、30個(gè)樣本的建庫(kù),采用PLS方法將PCA處理后的得分值與延度性能進(jìn)行建模和預(yù)測(cè),模型的相關(guān)系數(shù)圖見(jiàn)圖7(a)~(e),預(yù)測(cè)結(jié)果見(jiàn)表4。
表4 瀝青樣本延度預(yù)測(cè)結(jié)果Tab.4 Prediction results of asphalt sample ductility
圖7 光譜與延度的相關(guān)系數(shù)圖Fig.7 Correlation coefficient diagram with spectral ductility
由表4可以看出,當(dāng)選取15個(gè)樣本進(jìn)行建模預(yù)測(cè)時(shí),有三個(gè)樣本的預(yù)測(cè)值超出了JTG E20中規(guī)定的再現(xiàn)性偏差要求;當(dāng)選取30和20個(gè)樣本進(jìn)行建模預(yù)測(cè)時(shí),均有兩個(gè)樣本的預(yù)測(cè)值超出了再現(xiàn)性偏差要求;當(dāng)選取25和10個(gè)樣本進(jìn)行建模預(yù)測(cè)時(shí),均有一個(gè)樣本的預(yù)測(cè)值超出了再現(xiàn)性偏差要求。該預(yù)測(cè)結(jié)果說(shuō)明,對(duì)于單一來(lái)源的瀝青樣品,采用10個(gè)樣本數(shù)量進(jìn)行建模,即可滿足要求。
(1)本文采用主成分分析(PCA)方法,將瀝青光譜分解為主成分光譜,再采用PLS將多個(gè)主成分光譜的得分值與瀝青的三大指標(biāo)測(cè)試數(shù)據(jù)進(jìn)行多元線性回歸,建立一個(gè)基于PLS-PCA方法的線性回歸模型。
(2)通過(guò)在242項(xiàng)目上的實(shí)施發(fā)現(xiàn),對(duì)于單一來(lái)源的瀝青樣品,不必按照傳統(tǒng)建模方式,收集大量樣品,采用10個(gè)樣本數(shù)量進(jìn)行模型建立,即可較好地進(jìn)行瀝青三大指標(biāo)的結(jié)果預(yù)測(cè),其中軟化點(diǎn)的預(yù)測(cè)結(jié)果最準(zhǔn)確,10個(gè)預(yù)測(cè)值全面滿足JTG E20中再現(xiàn)性偏差要求,針入度和延度均有一個(gè)預(yù)測(cè)值超出了再現(xiàn)性偏差的要求。
(3)紅外快速檢測(cè)技術(shù)在國(guó)道242線的成功應(yīng)用,為內(nèi)蒙古地區(qū)瀝青快速檢測(cè)技術(shù)的現(xiàn)場(chǎng)應(yīng)用積累了經(jīng)驗(yàn),可以在本區(qū)域內(nèi)全面推廣。