關雎,聶淑瑜
(廣州能源檢測研究院,廣州 511447)
生物質固體成型燃料熱值和碳元素預測模型的建立*
關雎,聶淑瑜
(廣州能源檢測研究院,廣州 511447)
建立生物質固體成型燃料熱值和碳元素預測模型。利用秸稈類生物質固體成型燃料的測試數(shù)據,以工業(yè)分析中的水分、灰分、揮發(fā)分和固定碳含量指標為4個自變量,分別以低位熱值、高位熱值和碳元素分析為因變量,通過多元線性回歸模型(MLR)方法建立多元線性回歸預測模型。內部檢驗和外部檢驗說明3組模型在應用域范圍內均具有理想的預測能力,擬合效果良好,其中高位熱值預測模型的R2和R2prep分別為0.900和0.730,與已有研究相比,相對殘差范圍減小為–2.59%~2.26%,可為工業(yè)用途的生物質固體成型燃料的熱值和碳元素分析快速做出反映。
生物質固體成型燃料;熱值;碳元素;多元線性回歸;預測模型
隨著世界經濟的飛速發(fā)展,石化能源消耗量急劇增加,人類的可持續(xù)發(fā)展受到嚴重影響。積極開發(fā)利用可再生清潔能源、減少石化能源消耗、降低溫室氣體排放,已經成為世界各國緩解能源危機和氣候變化問題的共識[1]。生物質能是繼煤和石油之后的世界第三大能源,生物質燃料既能緩解溫室效應,又能充分利用廢棄生物質資源,具有明顯的社會意義與經濟意義。目前,生物質能應用廣泛,其中生物質固體成型燃料是生物質固體形態(tài)的能源化利用方式,也是生物質能源化利用最簡單、最直接的途徑之一[2–3]。
由于生物質固體成型燃料的組成成分各異,導致其具有參差不齊的物化特性。生物質固體成型燃料的物化特性通過生物質的熱值、工業(yè)分析和元素分析得到反映,這3項指標作為生物質燃料質量的優(yōu)劣及其工業(yè)用途的重要參考依據。與工業(yè)分析相比,生物質燃料熱值和元素分析測試的操作過程復雜,耗時長,容易受到外界環(huán)境溫度變化的影響,對檢測人員的水平要求甚高。此外,由于生物質固體成型燃料被廣泛用作工業(yè)燃料,入廠前需對其進行分批分量的常規(guī)分析,工作量巨大,因此尋求便捷的定量分析方法尤為必要。目前國內外雖有生物質固體成型燃料工業(yè)分析和元素分析指標之間定性關系的初步研究[4–5],但利用數(shù)學方法來定量分析生物質固體成型燃料的熱值和元素分析指標的研究甚少。筆者基于秸稈類生物質固體成型燃料的測試數(shù)據(工業(yè)分析、低位熱值、高位熱值及碳元素分析指標),以工業(yè)分析中的水分、灰分、揮發(fā)分和固定碳含量指標作為自變量,分別以低位熱值、高位熱值和碳元素分析為因變量,用多元線性回歸模型(MLR)方法建立多元線性回歸方程,通過內部檢驗和外部檢驗判斷模型的預測能力,并使用Leverage方法定義模型的應用域。本研究對生物質固體成型燃料理化特性之間定量關系的探索具有參考價值,為生物質固體成型燃料的低位熱值和高位熱值、碳元素分析指標提供了一種簡單快速的計算方法,對工業(yè)用途的生物質固體成型燃料的熱值和元素分析快速做出反映具有重要意義。
1.1 建模數(shù)據獲取
按照GB/T 21923–2008 《固體生物質燃料檢驗通則》、GB/T 28731–2012 《固體生物質燃料工業(yè)分析方法》和GB/T 30727–2014 《固體生物質燃料發(fā)熱量測定方法》等國家標準,對2016年10月和11月送往廣州能源檢測研究院檢驗的生物質固體成型燃料(均為秸稈類生物質)樣品的水分、灰分、揮發(fā)分和固定碳,低位熱值和高位熱值以及元素分析中的空氣干燥基碳含量等指標進行檢測。其中35組數(shù)據用于構建多元線性回歸方程,為訓練集(training set);7組數(shù)據用于驗證方程,為測試集(test set),試驗數(shù)據見表1、表2。
表1 生物質固體成型燃料樣品的特性分析檢測數(shù)據(訓練集)
續(xù)表1
表2 生物質固體成型燃料樣品的特性分析檢測數(shù)據(測試集)
1.2 建模方法
多元線性回歸模型(MLR)具有形式簡單、表達清晰、易于解釋等特點,并且能夠在描述值和實驗值之間建立明確的方程,是定量構效關系研究及數(shù)據預測最為常用的建模方法之一[6]。筆者采用MLR方法構建秸稈類生物質固體成型燃料熱值和碳元素的預測模型。MLR方法可表示如下[7]。
設Y為可觀測的隨機變量,本實驗代表低位熱值、高位熱值或者空氣干燥基碳含量。Y受N個非隨機因素X1,X2,…,XN(本實驗為4項工業(yè)分析指標)和隨機因素的影響,則Y與X1,X2,…,XN的線性關系見式(1)。
式中:β0,β1,…,βN——N+1個未知系數(shù);
ε——不可測量的隨機誤差,通常假定ε~N(0,σ2)。
應用SPSS統(tǒng)計分析軟件,通過35組訓練集數(shù)據,以生物質固體成型燃料的4項工業(yè)分析指標為自變量,分別建立生物質固體成型燃料的低位熱值、高位熱值和空氣干燥基碳含量3個指標的多元線性回歸方程。
1.3 模型驗證
為了建立一個擬合度高、穩(wěn)定性和預測能力強的可靠預測模型,一般需要采用多種方法對模型進行評估[8],主要包括模型的內部擬合度、內部預測能力、模型的顯著性、模型內參數(shù)的顯著性和模型的外部預測能力等的評估。主要通過模型的內部擬合度顯著性(F檢驗)及外部預測能力這3項指標來分析已建立的多元線性回歸方程的預測能力。
R2是描述對模型貢獻的全變差分數(shù),R2值越接近1.0,回歸方程就越能夠更好地表示Y變量。它是最常用的內部檢驗指標,能很好地反映模型的內部擬合度,R2按式(2)計算。
模型及參數(shù)顯著性檢驗,F(xiàn)檢驗(Ftest)[9]:Fisher統(tǒng)計或方差比是檢驗自變量和因變量之間的線性回歸方程是否顯著的重要方法,適用基于多元線性回歸方法建立的模型。對于多元線性回歸模型,在對每個回歸系數(shù)進行顯著性檢驗之前,應該對回歸模型的整體做顯著性檢驗,這就是F檢驗。如果是顯著的,說明兩個變量之間存在線性關系,如果不顯著,則說明兩個變量之間不存在線性關系。
對所建模型進行內部驗證后還必須進行外部驗證,外部驗證能為模型預測能力提供一個更加嚴厲的評估。使用不參與建模的外部測試集(見表2)進行外部驗證。R2prep參數(shù)是用來評估模型的外部預測能力一個非常重要的指標參數(shù)[10]。R2prep定義為建立模型的預測性復相關系數(shù),按式(3)計算。
一般情況下,(1)當R2>0.6,R2prep>0.5時,認為模型好,大于0.9則為模型優(yōu)秀。Tropsha等建議R2和R2prep均大于0.6[11]。
通過已建立的多元線性回歸方程,用表2中7組測試集的工業(yè)分析指標數(shù)據對生物質固體成型燃料的低位熱值、高位熱值和空氣干燥基碳含量進行預測,并使用模型內部檢驗參數(shù)、F顯著性分析及外部檢驗參數(shù)R2prep對模型進行評估,反映生物質固體成型燃料熱值和碳元素含量計算模型的預測能力。
1.4 模型的應用域
經過內部驗證和外部驗證后,即使各項評價指標都證明所建模型是穩(wěn)健、可靠且具有很好的泛化能力和預測能力,還不能認定該模型能對任何未知樣本做出可靠的預測[12]。因此必須定義多元線性回歸方程的應用域[13]。如果預測樣本不在模型的適用范圍內,則模型對該樣本的預測不一定可靠[12]。定義應用域的一個簡單方法是確定外推程度[14],通過杠桿值hi反映外推的程度。
對模型應用域的定義一般使用leverage方法[14]。該方法的優(yōu)點是可以將模型的應用范圍量化,并用直觀圖形的方式表達出來,即Williams圖。標準的leverage值定義為h*=3p'/n(p'為模型中所使用描述符的個數(shù)加l,n為訓練集樣本的個數(shù))。根據式(4)計算每個樣本的leverage值hi。
式中:xi——待預測樣本i的特征矩陣(即描述符矩陣);
X——全體訓練集樣本的特征矩陣;
n——待預測樣本的個數(shù)。
Williams圖就是以leverage值為橫坐標,以標準殘差為縱坐標構建的。在Williams圖中,兩條水平線±3表示設定的標準殘差的標準,垂直的線表示h*值,只有落在這3條線圍成的區(qū)域,即h≤h*,標準殘差在±3范圍內的樣本才認為是符合模型的應用域,其預測值才是可靠的[15]。單個樣本的標準殘差按式(5)計算。
其中:σi——第i個預測樣本的標準殘差;
λi——第i個預測樣本的殘差,即第i個樣本
的預測值與實測值之差;
——所有預測樣本的殘差的平均值。
2.1 模型建立與預測能力評估
已有研究表明,熱值和空氣干燥基碳含量與生物質固體燃料的4項工業(yè)分析指標均呈現(xiàn)較高的相關性顯著水平[7],因此以表1中35組樣本為訓練集,分別以低位熱值、高位熱值和空氣干燥基碳含量為因變量,自變量均為4項工業(yè)分析指標,即水分、灰分、揮發(fā)分和固定碳含量。通過SPSS統(tǒng)計分析軟件,得到三個多元線性回歸方程,結果見表3。
表3 低位熱值、高位熱值和空氣干燥基碳含量的預測模型與統(tǒng)計參數(shù)
為了檢驗多元線性回歸方程的預測能力,通過模型的內部檢驗參數(shù)R2和F檢驗,外部檢驗參數(shù)R2
prep來分析,結果見表3。對于低位熱值的MLR模型Ylow,內部檢驗參數(shù)R2和F檢驗計算結果分別為0.866和48.384,反映了模型較好的擬合能力。對于高位熱值的MLR模型Yhigh,內部檢驗參數(shù)R2和F檢驗計算結果分別為0.900和67.478,說明模型具有很好的擬合能力。對于空氣干燥基碳含量的MLR模型YC,內部檢驗參數(shù)R2和F檢驗計算結果分別為0.733和20.641,說明訓練集中的樣本能夠很好的被預測。另外,3個MLR模型的顯著性Sig值均為0.000(小于0.05),說明模型具有較好的穩(wěn)健性,排除了偶然得到的可能性。綜合多元線性回歸預測模型的內部檢驗指標,說明預測模型具有良好的擬合能力。
除了對所建立的預測模型進行內部檢驗,還必須對模型進行外部檢驗,外部檢驗可以更顯著地反映出模型的預測能力。外部檢驗需要用不參與建模的數(shù)據集,即表2中的測試集數(shù)據進行檢驗。通過R2
prep值分析模型的外部預測能力,其計算按照式(3)。生物質固體燃料低位熱值、高位熱值和空氣干燥基碳含量對應的MLR模型的R2prep計算結果分別為0.703、0.730和0.745,均大于0.6,進一步說明了模型具有很好的預測能力。此外,R2–R2prep<0.3,排除了模型有過擬合嫌疑或數(shù)據有離群值的可能性[16]。
2.2 模型預測效果分析
利用所建立的多元線性回歸方程,對生物質固體燃料測試集的7組數(shù)據(表2)進行模型預測效果分析。分別作出低位熱值、高位熱值和空氣干燥基碳含量對應3個MLR模型預測值和實測值的曲線圖,并對分析預測值與實際測量值的絕對殘差和相對殘差進行誤差分析,結果見圖1~圖3。
圖1 生物質固體燃料低位熱值的實測值與預測值對比及相對誤差
圖2 生物質固體燃料高位熱值的實測值與預測值對比及相對誤差
圖3 生物質固體燃料空氣干燥基碳含量的實測值與預測值對比及相對誤差
根據低位熱值的MLR模型預測效果分析,由圖1可知,預測值與實測值的絕對殘差范圍為0.04~0.50,相對殘差范圍為–2.32%~3.05%,由此可見,Ylow多元線性回歸方程對低位熱值的預測效果較為理想。根據高位熱值的MLR模型預測效果分析,由圖2可知,預測值與實測值的絕對殘差范圍為0.04~0.40,相對殘差范圍為–2.59%~2.26%,誤差范圍較小,反映了Yhigh多元線性回歸方程較好的預測效果。由圖3可知,空氣干燥基碳含量的MLR模型計算得到的預測值與實驗值的絕對殘差范圍為0.51~1.05,相對殘差范圍為–1.50%~2.33%,說明YC模型的碳含量的預測結果理想。綜上分析,以生物質固體燃料工業(yè)分析的4項指標建立的多元線性回歸預測模型的預測誤差在合理的范圍內,并且與其他學者的研究結果相比,誤差范圍明顯減小,證明了MLR多元線性回歸方法應用于低位熱值、高位熱值及碳元素分析指標預測的可行性和實用性。
2.3 模型的應用域
每個模型的應用范圍是有一定限度的,即使經過了內部驗證和外部驗證確認所建模型是穩(wěn)健、可靠且具有很好的泛化能力和預測能力,但也不能認定該模型能對任何未知樣本做出可靠的預測。因此定義模型的應用域是將所建模型應用到未知樣本之前的一個重要步驟。本實驗模型應用域的定義采用Leverage方法,用Williams圖分析生物質固體燃料低位熱值、高位熱值和空氣干燥基碳含量模型的應用域,結果見圖4~圖6。
圖4 低位熱值預測模型的Williams圖
圖5 高位熱值預測模型的Williams圖
圖6 空氣干燥基碳含量預測模型的Williams圖
根據定義計算得到3個模型的leverage值h* 為0.43。對于生物質固體成型燃料低位熱值、高位熱值和空氣干燥基碳含量這3個模型,由式(4)計算得到第11組訓練集樣本的h11值為0.58,超出h*。但由于其對應的低位熱值、高位熱值和碳元素含量的標準殘差比較小,由式(5)分別計算得到–0.006,–0.009,0.394,因此可以保留該組樣本,不影響模型的穩(wěn)定性[17]。因此根據圖2的分析可知,3個模型的樣本均落在應用域范圍內,表明模型的預測是準確可靠的。
(1)利用秸稈類生物質固體成型燃料的測試數(shù)據(工業(yè)分析、低位熱值、高位熱值及碳元素分析指標),以工業(yè)分析中的水分、灰分、揮發(fā)分和固定碳含量指標為4個自變量,分別以與上述指標相關性強的低位熱值、高位熱值和碳元素分析為因變量,通過MLR方法建立了3組多元線性回歸預測模型。內部檢驗和外部檢驗說明3組模型在應用域范圍內均具有理想的預測能力,擬合效果良好,誤差范圍顯著減小。說明通過工業(yè)分析指標來預測秸稈類生物質固體成型燃料的熱值和碳元素含量是可行實用的。
(2)本研究與已有相關報道相比,構建的預測模型的擬合效果更好,誤差范圍明顯減小,并且對模型應用域的合理性進行了探究。本研究可為秸稈類生物質固體成型燃料理化特性之間的定量關系的探索提供參考,為工業(yè)用途的生物質固體成型燃料的熱值和元素分析快速做出反映建立起一套便捷簡單的計算方法,對生物質固體成型燃料的應用和發(fā)展具有重要意義。
(3)本研究的對象為秸稈類生物質固體成型燃料,為了能夠促進本研究成果更廣泛的應用,將進一步探究包含不同組分如樹皮、花生殼、木屑等生物質固體成型燃料的熱值和碳元素分析預測模型的建立方法。
[1]馬文超,陳冠益,顏蓓蓓,等.生物質燃燒技術綜述[J].生物質化學工程,2007,40(1): 43–48.
[2]魏偉,張緒坤,祝樹森,等.生物質能開發(fā)利用的概況及展望[J].農機化研究,2013(3): 7–11.
[3]田宜水,趙立欣,孟海波,等.歐盟固體生物質燃料標準技術進展[J].可再生能源,2007,25(4): 61–64.
[4]Parikh J,Channiwala S A,Ghosal G K. A correlation for calculating HHV from proximate analysis of solid fuels [J]. Fuel,2005,84(5): 487–494.
[5]陳文敏.煤質分析結果的定性與定量審查[M].北京:煤炭工業(yè)出版社,1994.
[6]Lei B L,Ma Y M,Li J Z,et al. Prediction of the adsorption capability onto activated carbon of a large data set of chemicals by local lazy regression method [J]. Atmos Environ,2010,44(25): 2 954–2 960.
[7]湯燁,付殿崢,付正輝,等.木質生物質理化性質指標預測模型建立及應用[J].電力建設,2013.34(9): 71–75.
[8]Gharagheizi F,Eslamimanesh A,Ilani-Kashkouli P,et al. QSPR molecular approach for representation/prediction of very large vapor pressure dataset [J]. Chem Eng Sci,2012,76: 99–107.
[9]Dearden J C,Cronin M T D,Kaiser K L E. How not to develop a quantitative structure–activity or structure–property relationship (QSAR/QSPR)[J]. SAR QSAR Environ Res,2009,20(3–4): 241–266.
[10]Roy K,Kabir H. QSPR with extended topochemical atom (ETA) indices: Exploring effects of hydrophobicity,branching and electronic parameters on logCMC values of anionic surfactants [J]. Chem Eng Sci,2013,87: 141–151.
[11]Wagener M,Sadowski J,Gasteiger J. Autocorrelation of molecular surface properties for modeling corticosteroid binding globulin and cytosolic Ah receptor activity by neural networks [J]. J Am Chem Soc,1995,117(29): 7 769–7 775.
[12]Mhlanga P,Hassan W A W,Hamerton I,et al. Using combined computational techniques to predict the glass transition temperatures of aromatic polybenzoxazines [J]. PloS one,2013,8(1): e53367.
[13]Saghaie L,Shahlaei M,F(xiàn)assihi A,et al. QSAR Analysis for Some Diaryl-substituted Pyrazoles as CCR2 Inhibitors by GA–Stepwise MLR [J]. Chem Biol Drug Des,2011,77(1): 75–85.
[14]Tropsha A,Gramatica P,Gombar V K. The importance of being earnest: validation is the absolute essential for successful application and interpretation of QSPR models [J]. Molecular Inform,2003,22(1): 69–77.
[15]Gharagheizi F,Eslamimanesh A,Ilani-Kashkouli P,et al. QSPR molecular approach for representation/prediction of very large vapor pressure dataset [J]. Chem Eng Sci,2012,76: 99–107.
[16]吳文勝,張燦陽,李秀喜,等.跨尺度方法研究聚合物載藥膠束的定量構性關系[J].化工學報,2015,66(6): 2 303–2 312.
[17]Wu W,Zhang R,Peng S,et al. QSPR between molecular structures of polymers and micellar properties based on block unit autocorrelation (BUA)descriptors [J]. Chemometr Intell Lab,2016,157: 7–15.
歡迎訂閱2016年《計測技術》
《計測技術》創(chuàng)刊于1958年,是中航工業(yè)北京長城計量測試技術研究所(國防科技工業(yè)第一計量測試研究中心)主辦的計量測試技術類期刊,雙月刊,逢雙月28日出版,國內外公開發(fā)行。
《計測技術》是中國核心期刊(遴選)數(shù)據庫收錄期刊,中國學術期刊綜合評價數(shù)據庫統(tǒng)計源期刊,中國期刊全文數(shù)據庫、中文科技期刊數(shù)據庫、臺灣CEPS期刊數(shù)據庫全文收錄期刊。國際刊號:ISSN 1674-5795,國內刊號:CN 11-5347/ TB。
本刊為國防科技工業(yè)系統(tǒng)、部隊、民用計量測試院所、高等院校、相關設備制造商和各大公司服務。廣泛刊載長、熱、力、電、無線電、時間頻率、光學、電離輻射、聲學等計量測試、校準稿件。設有綜合評述,理論與實踐,新技術新儀器,計量、測試與校準,計量信息化與管理,經驗與體會等主要欄目。
歡迎訂閱2016年度雜志,本刊郵發(fā)代號:80–441;全年定價:60元。讀者可到各地郵局訂閱,也可直接與編輯部聯(lián)系。
通訊地址:北京市海淀區(qū)1066信箱雜志社 郵政編碼:100095
電話:010-62457159 (編輯部),010-62457160(廣告部),傳真:010-62457159,E-mail: mmt304@126.com
《計測技術》2017年第37卷第2期目次
綜合評述
專用測試系統(tǒng)計量校準問題討論
軸系扭矩測量方法與發(fā)展趨勢
微壓測量和校準技術分析與發(fā)展趨勢
理論與實踐
超音速條件下基于CFD的壓力探針校準特性數(shù)值模擬
計量、測試與校準
測量系統(tǒng)分析技術在構件鋼筋保護層厚度檢測中的應用
基于VBA實現(xiàn)黑體輻射源發(fā)射率偏離1引起有效亮度溫度修正
出租車計價器內部時鐘穩(wěn)定性實驗及分析
薄膜熱電偶熱電特性分析與試驗
新技術新儀器
基于半導體制冷片的高精度控溫電路系統(tǒng)設計
經驗與體會
雙活塞式壓力計準確度等級的確定
交流標準電阻器技術淺析
Development of Prediction Models for Heating Value and Carbon Content of Biomass Solid Fuel
Guan Ju, Nie Shuyu
(Guangzhou Institute of Energy Testing, Guangzhou 511447, China)
The prediction models for the heating value and carbon content of biomass solid fuel were established. Based on the measured data of straw biomass solid fuel,MLR method was used to establish multiple linear regression forecast models. The industrial analysis of moisture,ash content,volatile and fixed carbon content indexes were secleted as four independent variables,while low heating value,high heating value or carbon content were the dependent variable. The internal and external inspections of the three models demonstrated that all the models had ideal prediction ability and the error range decreased remarkably. TheR2andR2prepvalues of prediction model of high heating value were 0.900 and 0.730,respectively,while the decreased relative residual error range was –2.59% to 2.26%. The research is capable of rapidly reflecting the heating value and elemental analysis of biomass solid fuel for industrial use.
bomass solid fuel; heating value; carbon element; multiple linear regression; prediction model
O651
A
1008–6145(2017)03–0031–06
*廣州市質量技術監(jiān)督局科技項目(2014KJ10)
聯(lián)系人:聶淑瑜;E-mail: 403692162@qq.com
2017–02–16
10.3969/j.issn.1008–6145.2017.03.007