張偉亞 宋保靚 陳向陽 晏金燦 譚智毅
1.深圳海關(guān)工業(yè)品檢測技術(shù)中心 2.深圳市檢驗(yàn)檢疫科學(xué)研究院 3.中山大學(xué)惠州研究院 4.廣州海關(guān)技術(shù)中心
潤滑油是發(fā)動機(jī)、變速箱、傳動機(jī)構(gòu)等機(jī)械設(shè)備中必不可少的物質(zhì),其質(zhì)量直接關(guān)系到設(shè)備的使用壽命和性能。潤滑油的種類繁多,其中合成潤滑油和礦物油基潤滑油是最常見的兩種潤滑油基礎(chǔ)油。合成潤滑油是通過化學(xué)合成或精煉加工的方法獲得的,其工藝復(fù)雜,煉制成本高昂,但是其性能卓越,包括高溫穩(wěn)定性、低溫流動性和抗氧化性等方面均優(yōu)于礦物油基潤滑油。天然氣合成潤滑油(以下簡稱GTL潤滑油)是通過將天然氣中的烴類組分加氫裂解反應(yīng)制成,不含硫、氮和芳烴化合物等有害成分,具有良好的生物降解性能和環(huán)保性能。同時(shí),其物理性質(zhì)和化學(xué)性質(zhì)也非常穩(wěn)定,能夠在高溫、高壓和惡劣工作條件下保持良好的潤滑性能,從而延長設(shè)備壽命,降低維修成本。因此,雖然成本相對較高,但由于其出色的性能和環(huán)保性能,在市場上仍有一定的競爭力[1]。此外,合成潤滑油和礦物油基潤滑油屬于不同的稅則[2],稅率有較大的差異:礦物油基潤滑油屬于稅目27.10,進(jìn)口關(guān)稅為6%;合成潤滑油屬于稅目34.03,進(jìn)口關(guān)稅為10%。鑒于此,為保護(hù)稅收[3],GTL潤滑油的準(zhǔn)確鑒別已成為一項(xiàng)急需解決的問題。
目前,潤滑油的鑒別主要采用紅外光譜、電化學(xué)、光譜等檢測技術(shù)[4-10],通過分析不同種類潤滑油之間的差異,從而對潤滑油進(jìn)行鑒別。但是這些方法僅考慮單一參數(shù)、易受干擾、結(jié)果準(zhǔn)確率不高、適用范圍窄。隨著計(jì)算機(jī)技術(shù)的發(fā)展,基于數(shù)理統(tǒng)計(jì)的深度學(xué)習(xí)、數(shù)據(jù)挖掘方法得到廣泛應(yīng)用,這種方法具有參數(shù)多、不容易受到干擾等特點(diǎn),尤其適用于潤滑油鑒別工作。但是,目前類似的GTL潤滑油鑒別技術(shù)的研究卻仍未見報(bào)道。因此,本研究基于互信息和貝葉斯算法,探索一種新的GTL潤滑油鑒別技術(shù),以提高潤滑油鑒別的準(zhǔn)確性和可靠性,為潤滑油行業(yè)提供更可靠的鑒別方法。
DR-A1型折光儀(ATAGO公司);2400-Ⅱ型元素分析儀(ATAGO公司);ZF-1型紫外燈(上海楚柏實(shí)驗(yàn)室設(shè)備有限公司);GCMS-QP Plus型氣相色譜-質(zhì)譜聯(lián)用儀(日本Shimadzu公司);SYP1016-Ⅳ型傾點(diǎn)分析儀(上海神開石油化工裝備股份有限公司);SYP1003-ⅥA型黏度分析儀(上海神開石油化工裝備股份有限公司);KD-H1120型蒸發(fā)損失測定器;KD-H1120型(長沙卡頓??藸杻x器有限公司);SYP1001B-Ⅴ型開口閃點(diǎn)分析儀(上海神開石油化工裝備股份有限公司)。
硅膠(GF254, 200目);正己烷、石油醚、乙酸乙酯(上海國藥),均為分析純。
GTL潤滑油(編號01~12)和礦物油基潤滑油(編號13~25)樣品來源于工廠定制及實(shí)驗(yàn)室自行配制,作為已知樣品用來訓(xùn)練模型;GTL潤滑油(編號26、27)和礦物油基潤滑油(編號28、29)樣品來源于市場購買,作為未知樣品用來驗(yàn)證模型的準(zhǔn)確度。
潤滑油由基礎(chǔ)油和添加劑組成,添加劑配方的多樣化或在一定程度上干擾基礎(chǔ)油性能指標(biāo)的分析結(jié)果。為保證分析的可比性、準(zhǔn)確性與可靠性,對潤滑油樣品進(jìn)行組成分離,分離出非極性組分和極性組分,非極性組分即是潤滑油的基礎(chǔ)油。
利用柱色譜對潤滑油進(jìn)行基礎(chǔ)油和添加劑的分離。在長1.5 m、直徑10 cm的色譜柱中加入500 g硅膠,裝柱后加入10 g潤滑油樣品,再加入500 mL的正己烷或石油醚進(jìn)行洗脫,流量為1 mL/min;利用薄層色譜法跟蹤,當(dāng)254 nm紫外燈觀察到薄層上出現(xiàn)明顯吸收斑痕時(shí)停止分離。收集非極性組分,將非極性組分濃縮作為基礎(chǔ)油待測樣。
通過采集實(shí)驗(yàn)樣品基礎(chǔ)油的常見理化參數(shù)測試數(shù)據(jù),如烴類組成(GC-MS法)、折射率、濁點(diǎn)、黏度、蒸發(fā)損失、閃點(diǎn)等,用于篩選特征指標(biāo)和計(jì)算貝葉斯算法的先驗(yàn)概率,從而最終建立GTL潤滑油的分類預(yù)測模型。
1.5.1烴類組成的檢測方法
1.5.1.1 GC條件
色譜柱:Rtx-5MS,0.25 um×0.25 mm×30.0 m。載氣:高純氮?dú)?。柱流?1 mL/min。檢測器:質(zhì)譜檢測器。進(jìn)樣口溫度:350 ℃。進(jìn)樣方式:分流進(jìn)樣。進(jìn)樣分流比:10∶1。進(jìn)樣量:1.0 μL。柱溫:100 ℃(2 min)。
1.5.1.2 MS條件
質(zhì)量范圍:60~700 amu。電離方式:EI。電子能源:70 eV。接口溫度:340 ℃。離子源溫度:230 ℃。四級桿溫度:150 ℃。掃描方式:scan。
1.5.2其他項(xiàng)目的檢測方法
測試項(xiàng)目及采用的檢測方法如表 1所列。
表1 測試項(xiàng)目及采用的檢測方法測試項(xiàng)目檢測標(biāo)準(zhǔn)[10-19]備注折射率SH/T 0724-2002《液體烴的折射率和折射色散測定法》等效采用ASTM D1218-1999C、H、N、S含量NB/SH/T 0656-2017《石油產(chǎn)品及潤滑劑中碳、氫、氮的測定 元素分析儀法》等效采用ASTM D5291-10(2015)GC-MS分析NB/SH/T 0606-2019《中間餾分烴類組成的測定 質(zhì)譜法》等效采用ASTM D2425-2017傾點(diǎn)GB/T 3535-2006《石油產(chǎn)品傾點(diǎn)測定法》等效采用ISO 3016-1994濁點(diǎn)GB/T 6986-2014《石油產(chǎn)品濁點(diǎn)測定法》等效采用ASTM D2500-201140 ℃和100 ℃運(yùn)動黏度GB/T 265-1988《石油產(chǎn)品運(yùn)動粘度測定法和動力粘度計(jì)算法》黏度指數(shù)GB/T 1995-1998《石油產(chǎn)品粘度指數(shù)計(jì)算法》等效采用ASTM D2270-1993蒸發(fā)損失NB/SH/T 0059-2010《潤滑油蒸發(fā)損失的測定 諾亞克法》等效采用ASTM D5800-2008開口閃點(diǎn)GB/T 3536-2008《石油產(chǎn)品閃點(diǎn)和燃點(diǎn)的測定 克利夫蘭開口杯法》等效采用ISO 2592-2000
按照第1.5節(jié)中的測試方法對第1.3節(jié)的樣品進(jìn)行檢測,結(jié)果見表 2、表 3。
表2 已知樣品烴類組成檢測結(jié)果樣品編號基礎(chǔ)油類型MS豐度比71856768698182839697w(鏈烷烴)/%01GTL潤滑油1.000 00.679 70.085 40.046 40.353 90.110 90.071 30.236 60.072 00.244 257.9102GTL潤滑油1.000 00.709 00.060 50.035 20.219 60.112 10.056 60.212 10.084 50.252 662.3203GTL潤滑油1.000 00.644 80.062 60.032 80.298 90.060 40.049 90.198 00.058 20.217 862.6904GTL潤滑油1.000 00.770 60.072 90.035 80.207 10.146 80.075 70.221 60.093 50.191 462.8905GTL潤滑油1.000 00.647 90.095 30.043 80.386 30.140 90.081 90.299 80.086 80.326 353.0106GTL潤滑油1.000 00.774 40.054 40.033 10.300 30.055 80.050 60.211 00.065 60.250 463.4707GTL潤滑油1.000 00.725 30.065 20.035 30.315 80.074 80.051 40.228 70.075 80.251 061.1108GTL潤滑油1.000 00.687 50.052 20.031 60.290 60.054 20.043 20.187 60.054 70.210 064.6209GTL潤滑油1.000 00.895 50.097 80.045 90.365 30.193 40.091 10.287 80.097 50.354 055.2910GTL潤滑油1.000 00.875 90.070 70.032 60.191 70.127 00.043 60.236 40.078 40.254 964.4411GTL潤滑油1.000 00.683 20.084 90.046 00.348 40.112 30.071 50.236 00.072 80.242 260.4012GTL潤滑油1.000 00.727 20.056 10.031 80.269 70.069 50.043 30.197 90.059 70.219 464.5313礦物油基潤滑油1.000 00.652 70.192 80.067 70.563 40.303 80.124 70.448 50.145 80.509 941.2214礦物油基潤滑油1.000 00.632 20.137 50.054 00.502 20.202 80.126 20.399 00.123 20.440 145.1215礦物油基潤滑油1.000 00.626 80.129 20.051 90.464 00.185 30.092 30.337 40.111 80.401 047.8516礦物油基潤滑油1.000 00.649 70.128 40.052 70.445 70.194 70.091 70.331 70.114 90.398 448.4117礦物油基潤滑油1.000 00.633 70.144 10.057 50.496 30.226 90.109 90.399 70.145 10.459 744.4918礦物油基潤滑油1.000 00.628 80.186 20.065 80.580 90.313 40.133 70.471 10.164 50.590 539.3919礦物油基潤滑油1.000 00.748 80.199 40.068 20.578 80.351 50.157 10.500 50.169 20.566 340.2920礦物油基潤滑油1.000 00.661 90.009 80.194 80.066 40.313 90.130 40.455 30.161 40.534 447.1021礦物油基潤滑油1.000 00.663 90.111 40.053 60.401 80.119 80.155 00.334 70.089 10.317 951.2422礦物油基潤滑油1.000 00.663 30.092 50.044 70.371 60.126 00.074 60.273 00.086 80.306 354.7423礦物油基潤滑油1.000 00.642 10.164 20.060 60.531 70.251 40.125 50.422 90.134 10.473 743.1724礦物油基潤滑油1.000 00.641 40.136 50.055 20.471 90.211 40.101 10.366 90.130 50.430 146.4525礦物油基潤滑油1.000 00.660 50.189 70.066 40.580 40.323 50.139 90.478 90.165 70.584 139.84
表3 已知樣品其他項(xiàng)目檢測結(jié)果樣品編號基礎(chǔ)油類型折射率(20 ℃)w(C)/%w(H)/%w(N)/%w(S)/%傾點(diǎn)/℃黏度(40 ℃)/(mm2·s-1)黏度(100 ℃)/(mm2·s-1)黏度指數(shù)蒸發(fā)損失/%開口閃點(diǎn)/℃01GTL潤滑油1.47185.1214.8800-3418.24.11287.422102GTL潤滑油1.48685.1314.8700-3617.84.11326.822503GTL潤滑油1.46285.0015.0000-3318.24.11286.922804GTL潤滑油1.48485.1514.8500-3817.24.01336.522605GTL潤滑油1.46584.9915.0100-3816.23.81276.522806GTL潤滑油1.46785.0914.9100-3717.84.01247.521907GTL潤滑油1.46885.0214.9800-3518.24.11286.923208GTL潤滑油1.47485.1714.8300-3030.05.71367.122209GTL潤滑油1.46985.1214.8800-2843.07.61457.323110GTL潤滑油1.47685.1414.8600-4013.83.51376.822511GTL潤滑油1.45385.1514.8500-3513.83.41247.321912GTL潤滑油1.45585.1714.8300-3613.33.31217.522313礦物油基潤滑油1.48785.1014.9000-1448.67.41159.820914礦物油基潤滑油1.48485.0614.9400-1257.38.11109.621015礦物油基潤滑油1.47985.0314.9700-1258.68.31128.721416礦物油基潤滑油1.48585.1614.8400-1848.56.89310.220517礦物油基潤滑油1.48885.1514.8500-1926.85.11229.020918礦物油基潤滑油1.48285.0314.9700-1736.16.11169.021119礦物油基潤滑油1.48985.0514.9500-1925.84.91159.520920礦物油基潤滑油1.48785.1314.8700-1826.85.112210.821021礦物油基潤滑油1.48285.0414.9600-1355.38.11108.921422礦物油基潤滑油1.48185.0314.9700-1539.86.51169.520523礦物油基潤滑油1.48385.0514.9500-2418.33.91069.220124礦物油基潤滑油1.48685.1514.8500-2516.13.610510.220025礦物油基潤滑油1.48185.0314.9700-2215.53.61158.8208
測試結(jié)果表明,雖然各項(xiàng)理化參數(shù)之間存在潛在的相關(guān)性,但它們之間并不呈現(xiàn)直接的因果關(guān)系,也沒有明確的影響規(guī)律。例如,GTL潤滑油的鏈烷烴含量(質(zhì)量分?jǐn)?shù)為53.01%~64.62%)整體上來說比礦物油基潤滑油(質(zhì)量分?jǐn)?shù)為39.84%~54.74%)高,但兩者之間存在交叉重疊,無法通過該參數(shù)直接做出準(zhǔn)確的分類判斷。其他參數(shù)也具有類似的特性。因此,為了鑒別GTL潤滑油,需要建立一種綜合考慮多種特征指標(biāo)參數(shù)數(shù)值的分類判斷方法,以避免單一參數(shù)數(shù)值的交叉重疊影響。
2.2.1特征指標(biāo)算法的選擇
篩選特征指標(biāo)的算法可以多種多樣,具體的實(shí)現(xiàn)方式會根據(jù)數(shù)據(jù)類型、數(shù)據(jù)規(guī)模、數(shù)據(jù)分布等因素而有所不同,如方差分析、卡方檢驗(yàn)、互信息、信息增益、基尼指數(shù)[20]。
互信息是衡量兩個(gè)變量之間關(guān)聯(lián)程度的指標(biāo),它可以用來評估兩個(gè)變量之間的非線性關(guān)聯(lián)性。在貝葉斯分類中,選擇關(guān)鍵指標(biāo)就是為了找到和分類結(jié)果最相關(guān)的變量,而互信息可以捕捉到變量之間的非線性關(guān)系,從而更準(zhǔn)確地找到關(guān)鍵指標(biāo)。此外,互信息算法不需要假設(shè)變量之間的線性關(guān)系或者正態(tài)性,所以,更適合處理非線性問題。因此,本研究采用互信息方法來篩選特征指標(biāo)。
2.2.2互信息算法原理
互信息的計(jì)算是基于信息熵的概念[20]。假設(shè)X和Y是兩個(gè)隨機(jī)變量,它們的聯(lián)合概率分布為P(X,Y),邊緣概率分布分別為P(X)和P(Y)。則X和Y的互信息可以定義為:
(1)
式中:I(X;Y)為由X引入而使Y的不確定度減小的量;Σx∈X為X中的每個(gè)取值x進(jìn)行求和;Σy∈Y為Y中的每個(gè)取值y進(jìn)行求和;log表示以e為底的對數(shù)。
互信息表示了X和Y之間的信息量,即如果知道了X的取值,那么能夠?qū)的取值做出多大的貢獻(xiàn)。如果X和Y獨(dú)立,則它們的互信息為0,表示它們之間沒有信息量。
在特征選擇中,可以將互信息作為特征重要性的度量,選擇與目標(biāo)變量相關(guān)性高的特征作為關(guān)鍵特征。
2.2.3特征指標(biāo)的篩選結(jié)果
按照互信息算法建立模型,并篩選特征指標(biāo),計(jì)算結(jié)果見表 4。
表4 互信息計(jì)算結(jié)果測試項(xiàng)目互信息得分測試項(xiàng)目互信息得分開口閃點(diǎn)0.712 7 MS豐度比960.471 2 蒸發(fā)損失0.712 7 折射率(20 ℃)0.433 6傾點(diǎn)0.644 7 MS豐度比810.349 8MS豐度比680.615 7 MS豐度比850.287 1鏈烷烴含量0.570 3 40 ℃黏度0.183 0MS豐度比830.562 6 100 ℃黏度0.167 8黏度指數(shù)0.511 4 C含量0.109 4MS豐度比970.506 6 H含量0.058 9MS豐度比670.501 9 MS豐度比710.056 0MS豐度比690.484 2 N含量0.039 3MS豐度比820.482 2 S含量0.000 0
根據(jù)表4的結(jié)果,經(jīng)綜合考慮,舍棄元素C、H、N、S含量指標(biāo),將烴類組成(GC-MS法)、濁點(diǎn)、傾點(diǎn)、40 ℃和100 ℃運(yùn)動黏度、黏度指數(shù)、蒸發(fā)損失、開口閃點(diǎn)定為GTL潤滑油分類預(yù)測模型的特征指標(biāo)。
2.3.1分類預(yù)測算法的選擇
分類預(yù)測算法是指根據(jù)已有的數(shù)據(jù)和標(biāo)簽,學(xué)習(xí)出一個(gè)分類模型,然后用該模型對新的數(shù)據(jù)進(jìn)行分類的算法。常用的分類預(yù)測算法有很多,例如k-近鄰 (k-NN) 算法、邏輯回歸算法、支持向量機(jī) (SVM) 算法、決策樹算法、隨機(jī)森林算法、樸素貝葉斯算法、神經(jīng)網(wǎng)絡(luò)算法、XGBoost 算法等[20]。
由于本研究目前的樣本數(shù)量較少,希望通過后期不斷引入新數(shù)據(jù)的方式提高模型準(zhǔn)確度,且數(shù)據(jù)類型多樣,包括離散型、連續(xù)型、有序型等。因此,采用貝葉斯算法來建立分類預(yù)測模型。
2.3.2貝葉斯算法原理
貝葉斯算法基于貝葉斯定理[20],通過計(jì)算后驗(yàn)概率來進(jìn)行預(yù)測和分類。其原理可以式(2)表示:
(2)
式中:P(A|B)為在觀察到B的條件下,A發(fā)生的概率;P(B|A)為在A發(fā)生的條件下,B發(fā)生的概率;P(A)和P(B)分別表示A和B的先驗(yàn)概率。
2.3.3分類預(yù)測模型的構(gòu)建
將經(jīng)過篩選后的檢測結(jié)果(見表2、表3)特征指標(biāo)數(shù)據(jù)作為訓(xùn)練集,經(jīng)計(jì)算得到分類預(yù)測模型的先驗(yàn)概率和條件概率。在對未知樣品進(jìn)行分類預(yù)測時(shí),則把未知樣品的數(shù)據(jù)代入式(2)進(jìn)行計(jì)算,并將所有特征的條件概率相乘來計(jì)算P(數(shù)據(jù)|類別),就得到每個(gè)類別的后驗(yàn)概率,最后選擇后驗(yàn)概率最大的類別作為預(yù)測結(jié)果。
將實(shí)驗(yàn)樣品(編號26~29)作為未知樣品,測試其特征指標(biāo),結(jié)果見表 5、表 6。
將表 5、表 6的數(shù)據(jù)輸入分類預(yù)測模型,預(yù)測結(jié)果見表 7。
表5 未知樣品烴類組成檢測結(jié)果樣品編號MS豐度比71856768698182839697w(鏈烷烴)/%261.000 00.686 10.103 10.043 50.393 80.157 10.076 10.307 60.094 80.322 852.94271.000 00.677 30.066 60.035 10.318 10.101 30.058 50.258 80.069 20.254 359.08281.000 00.631 90.143 70.057 30.494 80.226 30.109 60.398 50.144 70.458 344.52290.413 51.000 00.295 80.033 40.278 60.295 00.299 80.061 70.119 00.171 847.61
表6 未知樣品其他項(xiàng)目檢測結(jié)果樣品編號折射率(20 ℃)傾點(diǎn)/℃黏度(40 ℃)/(mm2·s-1)黏度(100 ℃)/(mm2·s-1)黏度指數(shù)蒸發(fā)損失/%開口 閃點(diǎn)/℃261.489-1925.84.91159.5209271.487-1826.85.112210.8210281.482-1355.38.11108.9214291.481-1539.86.51169.5205
由表7分類預(yù)測結(jié)果表明,該模型可以很好地對GTL潤滑油進(jìn)行分類鑒別,具有很高的準(zhǔn)確性和穩(wěn)定性。
表7 未知樣品基礎(chǔ)油分類預(yù)測結(jié)果樣品編號基礎(chǔ)油預(yù)測概率分布GTL潤滑油礦物油基潤滑油基礎(chǔ)油預(yù)測分類結(jié)果與標(biāo)識是否一致261.002.16×10-27GTL潤滑油是271.008.97×10-35GTL潤滑油是281.29×10-1521.00礦物油基潤滑油是295.00×10-1911.00礦物油基潤滑油是
建立了一種基于互信息和貝葉斯算法的分類預(yù)測模型,用于對GTL潤滑油進(jìn)行分類鑒別。通過對市售樣品進(jìn)行分析預(yù)測,結(jié)果表明該模型可以很好地對GTL潤滑油進(jìn)行分類鑒別。為了進(jìn)一步提高模型的準(zhǔn)確性和穩(wěn)定性,可以通過不斷引入新數(shù)據(jù),更新模型中的先驗(yàn)概率分布,以便于模型更好地適應(yīng)真實(shí)世界中的變化,并提高模型對未知數(shù)據(jù)的預(yù)測能力。此外,還可以通過補(bǔ)充新的分類數(shù)據(jù),對該模型進(jìn)行擴(kuò)展,用于預(yù)測其他種類的潤滑油。這將為潤滑油行業(yè)和關(guān)稅鑒定提供更加全面和準(zhǔn)確的鑒別工具。