胡杰,楊博聞,宋洪干
(1. 武漢理工大學 現(xiàn)代汽車零部件技術(shù)湖北省重點實驗室,武漢 430070;2. 武漢理工大學 汽車零部件技術(shù)湖北省協(xié)同創(chuàng)新中心,武漢 430070;3. 新能源與智能網(wǎng)聯(lián)車湖北工程技術(shù)研究中心,武漢 430070)
目前,提高汽車的安全性、舒適性以及優(yōu)化人車交互已成為智能網(wǎng)聯(lián)汽車的主要研究方向之一[1]。
在智能網(wǎng)聯(lián)汽車中,車載空調(diào)作為調(diào)節(jié)車內(nèi)環(huán)境舒適性的不可或缺的汽車總成,其性能的優(yōu)良和功能的多樣已成為汽車品質(zhì)重要評價指標之一[2],盡管車載空調(diào)已經(jīng)具備一定的智能化,但仍然需要人們對設備的操作做出決策,因此,使用T-Box來通過收集用戶的使用習慣和偏好大數(shù)據(jù),然后幫用戶做出決策的研究就顯得非常有意義。
車載空調(diào)智能溫度調(diào)節(jié)是改善車內(nèi)舒適度重要途徑,如何確定最佳車內(nèi)溫度是一個問題;張載龍與茹亮[3]提出了一種基于BP神經(jīng)網(wǎng)絡的冷藏車溫度預測方法,用一種自適應的學習速率解決了BP神經(jīng)網(wǎng)絡在訓練過程收斂速度慢的問題,并實現(xiàn)了車內(nèi)溫度非線性時間序列的預測;翁建華等[4]采用熱網(wǎng)絡法對車內(nèi)溫度進行預測。太陽輻射是影響車內(nèi)溫度的主要因素,此外車內(nèi)外表面對流換熱和天氣狀況也有一定影響;劉榮等[5]為實現(xiàn)模型在高緯度大樣本下的快速訓練,采用移除上邊界約束條件的快速支持向量機算法,并基于粒子群優(yōu)化算法,構(gòu)建動力電池溫度預測模型,實現(xiàn)了溫度預測模型的全局最優(yōu)和群體泛化;殷青等[6]采集某高校建筑實測環(huán)境數(shù)據(jù),考慮室內(nèi)外溫度時序性和滯后性的關(guān)系,建立了基于LSTM神經(jīng)網(wǎng)絡的室內(nèi)溫度預測模型,擬合優(yōu)度為98.7%。綜上,目前的研究主要集中在模型算法的改進和考慮更多環(huán)境因素來提高模型性能。
本文對車載空調(diào)數(shù)據(jù)進行分析和處理,提出了一種習慣溫度預測模型和時間序列溫度預測模型雙模型耦合的方法來為特定用戶建立熱舒適模型,該模型用于預測用戶預期的空調(diào)設定溫度。
本文研究的空調(diào)設定溫度預測方法是一種基于數(shù)據(jù)驅(qū)動的預測方法,首先車輛產(chǎn)生的數(shù)據(jù)通過車載終端(T-BOX)采集并上傳到車聯(lián)網(wǎng)云平臺,云平臺中的數(shù)據(jù)庫負責存儲這大量的用戶數(shù)據(jù);然后,通過平臺管理系統(tǒng)將數(shù)據(jù)導出并在電腦端對數(shù)據(jù)進行下載,運用數(shù)據(jù)挖掘與機器學習方法研究用戶使用空調(diào)的習慣,建立機器學習預測模型。而對于本文討論的則是在已知每臺車使用空調(diào)的歷史記錄的情況下,結(jié)合實時的環(huán)境狀態(tài),預測用戶所需的溫度,這屬于典型的回歸問題[7]。為保證模型的魯棒性,選用平均絕對百分比誤差(MAPE)作為評價指標,其公式為
(1)
對于本文用戶期望的空調(diào)設定溫度的預測可以看成是用戶習慣溫度預測和時間序列溫度預測的耦合。對于前者,本文采用機器學習回歸預測的方法;而對于后者,本文構(gòu)造了時間序列特征從而將時間序列預測問題轉(zhuǎn)化為機器學習中的監(jiān)督學習問題。針對實際應用場景來說就是對于駕駛員上車后開啟空調(diào)第一時刻的空調(diào)設定溫度使用習慣溫度預測模型進行預測;而對于后面連續(xù)性實時空調(diào)設定溫度則采用時間序列溫度預測模型,因此總體用戶期望的空調(diào)設定溫度預測系統(tǒng)如圖1所示。
圖1 用戶期望的空調(diào)設定溫度預測系統(tǒng)
選取隨機森林模型RF作為本文的習慣溫度預測模型。而對于時間序列溫度預測問題則選擇多元線性回歸模型Lasso作為的時間序列溫度預測模型。根據(jù)提出的空調(diào)設定溫度預測方法,將優(yōu)化后的RF模型和Lasso模型進行集成,得到RF-Lasso集成模型,從而實現(xiàn)對用戶期望的空調(diào)設定溫度預測。
本文的所有數(shù)據(jù)均來自于某企業(yè)的真實車輛數(shù)據(jù),數(shù)據(jù)格式為Json格式,共七千多萬條T-BOX原始數(shù)據(jù)。包含在2019-01-14到2019-02-28期間1336輛車的T-BOX的記錄,T-BOX的采樣頻率為1條/s。對于空調(diào)設定溫度預測可能有用的數(shù)據(jù)進行了提取,共包含13項,分為5大類具體如表1所示。
表1 數(shù)據(jù)名稱說明
1) 地理分布
我國的車輛主要分布在我國中部與東部地區(qū),所以車輛位置分布的熱力也集中在這兩個地區(qū),由于不同地區(qū)的天氣差異大,因此可以添加地理特征來提升預測精度。
2) 車外溫度分布
通過繪制車外溫度分布圖如圖2所示。圖2中可以看出,溫度的平均值為7.92℃,標準差為7.57,偏度為0.33,峰度為0.63,呈現(xiàn)近似正態(tài)分布其中嵌入的小圖為Q-Q圖, 縱坐標為特征值,即車外溫度的大小,橫坐標為正態(tài)分布分位數(shù),深藍色曲線為數(shù)據(jù)樣本,紅色直線代表估測結(jié)果;如果直線與曲線能夠很好擬合,則說明數(shù)據(jù)樣本大體滿足正態(tài)分布。
圖2 車外溫度分布圖
3) 用戶設定的目標溫度分布
從用戶設定溫度分布如圖3中可以看出,空調(diào)設定溫度范圍大約是17 ℃~33 ℃。通過對數(shù)據(jù)進行K-S檢驗,發(fā)現(xiàn)數(shù)據(jù)近似呈現(xiàn)正態(tài)分布并顯示漸進顯著性。
圖3 用戶設定溫度分布圖
4) 用戶設定溫度的變化次數(shù)分布
用戶設定溫度的變化次數(shù)分布如圖4所示。一般情況下,個人車主一天內(nèi)調(diào)整溫度的次數(shù)不會過多,而從圖中可以明顯看出數(shù)據(jù)存在異常。
圖4 空調(diào)溫度調(diào)整次數(shù)分布圖
5) 用戶車輛使用時間天數(shù)分布
用戶車輛使用時間的天數(shù)分布如圖5所示。由于原始數(shù)據(jù)的時間跨度為1月14日到2月28日,共計時間天數(shù)46 d,考慮數(shù)據(jù)量較少的車輛對模型可能會造成干擾,尤其是考慮到個性化推薦的影響,所以對數(shù)據(jù)少于7 d的車輛給予刪除。
圖5 車輛使用天數(shù)分布圖
6) 車外溫度傳感器和天氣溫度差值的分布
計算車外溫度和天氣溫度的差值如圖6所示。為了剔除溫度傳感器異常數(shù)據(jù)的樣本,通過圖6數(shù)據(jù)分布的判斷,以95%和5%的置信區(qū)間去篩選數(shù)據(jù),分別得出上下5%的溫差數(shù)值,差值大于10.5和小于-9.5的視為異常數(shù)據(jù),應給予刪除,以保證數(shù)據(jù)樣本的可信度和分布合理性。
圖6 車外溫度與天氣溫度差值分布圖
通過對數(shù)據(jù)進行分析發(fā)現(xiàn)有以下幾種數(shù)據(jù)故障:
1) 缺失值處理
對于短時間內(nèi)溫度異常的數(shù)據(jù)采用插值法替換。而對于其他特征,由于采樣頻率較高且缺失樣本數(shù)量僅占總樣本的0.010 5%,采取直接刪除整條數(shù)據(jù)的方法。
2) 異常值的處理
對于溫度類特征異常同樣采用插值法進行替換。但是對于周期性跳變式的異常數(shù)據(jù),難以保證其他特征是否可信,所以給予整行刪除。
3) 樣本重采樣處理
因為溫度變化是一個漸進的過程,短時間內(nèi)不會驟變,所以數(shù)據(jù)采樣頻率為1條/s對于溫度預測而言頻率過高。為了節(jié)省計算時間,重采樣的時間間隔取為100 s。
4) 干擾數(shù)據(jù)樣本的處理
通過對調(diào)整次數(shù)異常的數(shù)據(jù)車輛進行觀察,發(fā)現(xiàn)有絕大部分車輛還存在其他數(shù)據(jù)異常,因此對于這部分車輛的數(shù)據(jù)全部刪除。
特征工程是在原有數(shù)據(jù)的基礎上提取能體現(xiàn)數(shù)據(jù)屬性的特征,從而提高預測精度。特征工程提取的特征主要包括原始的數(shù)據(jù)屬性特征和在原始數(shù)據(jù)中提取的新特征,從而更好的對數(shù)據(jù)進行理解和分析。
本文根據(jù)對數(shù)據(jù)的理解對原有特征類別做了拓展,并構(gòu)造了相關(guān)的新特征類別,主要分為以下幾個部分:
1) 時間信息特征
在原有時間信息特征的基礎上提取是否是周末,是否是白天等類別特征。除此之外,一般正常使用空調(diào)都有一個調(diào)節(jié)過程,這樣就會有空調(diào)的累積運行時間,這對于用戶期望的設定溫度也有一定的影響。
2) 地理信息特征
本文從原始經(jīng)緯度地理特征解析出省份、市區(qū)、縣區(qū)3個地理位置特征,并根據(jù)我國四大地理分區(qū),將用戶車輛的地理位置特征劃分成四類,從而提高模型的準確性。
3) 環(huán)境信息特征
為了獲取更多的環(huán)境信息特征,本文通過網(wǎng)絡爬蟲獲取了相關(guān)天氣特征并根據(jù)天氣特征可以構(gòu)造出晝夜溫差(diff-temp-daynight)、平均日溫(aver-temp)、平均日風速(aver-wind)、天氣狀況(outside-weather)等特征。由于天氣情況種類過多,同理將天氣情況根據(jù)晴、陰、雨、雪分成4類。
4) 車輛信息特征
在本文中,車輛信息特征有VIN碼和車型,假設一名用戶僅使用一輛車。由于VIN碼和車型都是字符串類型,所以對其進行獨熱編碼,這樣對于一個模型來說,一個用戶代表一個特征。
5) 人體感受特征
本文采用體感溫度作為人體感受特征,體感溫度實際上是人通過皮膚與外界接觸時在身體上或精神上所獲得的一種感受。1984年,羅伯特·史特德(Robert G. Steadman)發(fā)表《體感溫度的通用公式》(A universal scale of apparent temperature)為:
AT=1.07T+0.2e-0.65V-2.7
(2)
(3)
式中:AT為體感溫度,℃;T為氣溫,℃;e為水汽壓,hpa;V為風速,m/s;RH為相對濕度,%。此公式則由中央氣象局預報各地體感溫度所引用,本文同樣引用該公式構(gòu)造 “體感溫度”特征。
6) 用戶喜好特征
通過數(shù)據(jù)分析可看出,人們在相同外界環(huán)境的條件下對溫度的喜好程度不同,因此本文將用戶喜好大致分為3類:偏好熱、偏好冷、中性。
ASHRAE55-92標準通過對人對周圍環(huán)境的主觀感覺的研究,確定了人體舒適環(huán)境參數(shù)的最佳范圍及允許范圍[8]。國內(nèi)外學者在熱舒適性方面做了大量現(xiàn)場及實驗室研究,從而得到了人體關(guān)于空氣溫度或有效溫度的熱感覺方程,并給出了熱舒適性的評價指標[9]。
本文采用的熱舒適評價為PMV-PPD指標,PMV指標是引入反映人體熱平衡偏離程度的人體熱負荷TL而得出的。PMV指標采用了7級分度分別為熱(+3)、暖(+2)、微暖(+1)、適中(0)、微涼(-1)、涼(-2)、冷(-3),具體PMV模型見圖7[10]。
圖7 PMV模型
Fanger認為[11-12],人在一定勞動強度條件下的冷熱感覺只與人體熱負荷有關(guān)。
具體PMV計算公式為
VPMV=(0.303e-0.036M+0.028)×L
L={(M-W)-3.15×10-3[5 733-6.99(M-W)-Pa]-
0.42[(M-W)-58.5]-
1.7×10-5M(5 857-Pa)-1.4×10-3M(34-ta)-
DPDD=100-95e-(0.033 58PMV4+0.217 9PMV2)
(4)
服裝表面平均溫度計算公式為
tcl=35.7-0.028(M-W)-
Rcl{39.6×10-9fcl[(tcl+273)4-(tr+273)4]+
fclhc(tcl-ta)}
(5)
對流換熱系數(shù)與服裝面積系數(shù)分別為:
(6)
(7)
為了求解PMV,需要對七項參數(shù)進行設定。求解過程和參數(shù)設置參考美國加州大學伯克利分校建筑環(huán)境中心CBE熱舒適計算方法[8]。4項環(huán)境參數(shù)如下:
(1) 空氣溫度
它是影響熱舒適的主要因素。本文計算中采用車內(nèi)溫度作為計算指標。
(2) 空氣相對濕度
直接影響皮膚表面蒸發(fā)散熱量,進而影響人體的舒適感。本文數(shù)據(jù)中缺少車內(nèi)濕度數(shù)據(jù),故以天氣情況的相對濕度作為計算指標。
(3) 室內(nèi)空氣流動速度
影響人體的對流換熱和蒸發(fā)換熱。由于本文數(shù)據(jù)中缺少空調(diào)設定風速,故以默認風速0.1 m/s作為計算指標。
(4) 平均輻射溫度
平均輻射溫度大約等于車內(nèi)當前的空氣溫度。因此在本文中平均輻射溫度取為車內(nèi)溫度。
兩項人體參數(shù)如下:
(1) 人體新陳代謝率
人體新陳代謝率在不同狀態(tài)下有著較大差異,這取決于人的活動水平和環(huán)境條件。在CBE熱舒適計算方法中規(guī)定了開轎車時的新陳代謝為1.5 met,等價于87.225 W/m2。
(2) 服裝熱阻
本文在計算服裝熱阻時借鑒韓滔[13]總結(jié)出的一個具體室外溫度與對應衣服熱阻的關(guān)系表,使得計算結(jié)果更準確。
7) 時間序列特征
時間序列預測方法有很多,本文通過構(gòu)造時間序列特征將時間序列問題轉(zhuǎn)換為機器學習的監(jiān)督學習問題,并最終選擇Lasso多元線性回歸模型。
考慮到需要對比多種模型和集成處理的效果,對經(jīng)過清洗的數(shù)據(jù),離散型特征進行獨熱編碼,連續(xù)型變量進行歸一化處理。
為了保持每段行程完整和時間維度分配均勻,自定義了一種以日期為標準4∶1的比例劃分方法來切分訓練集和測試集。這樣在劃分數(shù)據(jù)時就可以保證一天內(nèi)所有行程的數(shù)據(jù)保持完整。
特征篩選可以減少特征數(shù)量,使模型泛化能力更強,減少過擬合,增強對特征和特征值之間的理解,特征篩選的方法主要包括Filter方法、Wrapper方法和Embedded方法。本文通過數(shù)據(jù)清洗和特征工程,得到了20個維度的特征如表2所示。
表2 數(shù)據(jù)預處理后的數(shù)據(jù)特征說明
本文中特征篩選是基于Filter方法中的皮爾遜相關(guān)系數(shù)法和基于隨機森林的特征篩選方法來判斷特征重要性從而刪除無關(guān)冗余特征,方法流程圖如圖8所示。
圖8 特征篩選方法流程圖
其中皮爾遜相關(guān)系數(shù)計算公式為
(8)
式中:cov(X,Y)為變量X,Y的協(xié)方差;σX和σY分別為X,Y的標準差;相關(guān)性系數(shù)ρX,Y的取值區(qū)間為[-1,1],-1表示完全的負相關(guān),+1表示完全的正相關(guān)。
對表2中全部特征使用皮爾遜相關(guān)系數(shù)分析,得到相關(guān)系數(shù)熱力圖如圖9所示。
圖9 皮爾遜相關(guān)系數(shù)熱力圖
Filter方法中的皮爾森相關(guān)系數(shù)法是一種分析變量特征和目標特征之間關(guān)系的方法,該方法主要用于分析特征之間的線性相關(guān)度,但不易于發(fā)現(xiàn)特征與特征之間的非線性相關(guān)關(guān)系,對于該問題可以引入基于樹模型的方法。因為樹模型的方法對非線性關(guān)系的特征處理簡單快速,并且不需要太多的調(diào)試,但考慮到單顆決策樹模型容易過擬合,所以本文利用基于隨機森林的特征排序法來評價每個特征的重要性,刪除無關(guān)冗余特征,進而優(yōu)化模型結(jié)構(gòu)。其中時間序列特征中的duration-time和vehacdrvtargettemp-shift用于訓練時間序列溫度預測模型,不用于訓練習慣溫度預測模型,因此共有17個特征進行篩選,最終得到結(jié)果如圖10所示。
圖10 隨機森林特征篩選重要性結(jié)果
根據(jù)特征篩選結(jié)果,保留前10個最重要的特征,其中時間類特征包括6(hour)、8(dayofweek),地理位置類是10(geo-cluster),環(huán)境類包括3(vehoutsidetemp)、1(vehinsidetemp)、7(diff-temp-daynight)、5(aver-temp)和9(weather-cluster),用戶喜好類是4(favorite-type),而人體感受特征是2(temp-hm),前10個特征的重要性占比之和高達97.4%,最后加上時間序列特征duration-time、vehacdrvtargettemp-shift和目標特征vehacdrvtargettemp從而構(gòu)成最終的特征。其中人體感受特征中的體感溫度與環(huán)境溫度不同,其更能直接反映人體的熱感受情況,當相對濕度越小、風速越大時,能得出較低的體感溫度,而用戶喜好類特征中的冷熱喜好則是用戶對于空調(diào)設定溫度高低的喜好。
在本文中,采用數(shù)據(jù)切分后的訓練集來對習慣溫度預測模型和時間序列溫度預測模型進行篩選并使用交叉驗證來對比模型的準確度和運算時間,其中需要交叉驗證的模型為Ridge、ElasticNet、Lasso、AdaBoostRegressor、CART、Bagging、Random Forest Regressor、XGBRegressor、Gradient Boosting和LGBMRegressor。K折交叉驗證(K Fold Cross Validation)[14]是將所有數(shù)據(jù)集分成K份,每次不重復地取其中一份做測試集,用其他K-1份做訓練集訓練模型,每次訓練和預測都計算該模型在測試集上的MAPE,最后將K次的MAPE取平均得到最終的MAPE,即
(9)
本文對訓練樣本的切分依舊采用以日期為標準4:1的比例進行切分。數(shù)據(jù)切分好之后開始迭代訓練和驗證,將每次驗證的結(jié)果記做EMAPEi,最終模型的評價結(jié)果取5次MAPE的均值。
1) 習慣溫度預測模型
習慣溫度預測模型輸出用戶上車開啟空調(diào)后一段時間內(nèi)的空調(diào)設定溫度,訓練模型特征不包括時間記憶特征,其交叉驗證結(jié)果如圖11所示。
圖11 習慣溫度預測模型交叉驗證結(jié)果
根據(jù)交叉驗證結(jié)果,綜合考慮模型精度與計算時間,本文習慣溫度預測模型選擇RF。RF算法是Bagging算法的代表,由于其良好的性能表現(xiàn),被廣泛應用到諸如領(lǐng)域。單棵決策樹通常具有高方差,容易過擬合,而RF構(gòu)建過程的Bagging思想能夠降低方差,此外,RF在Bagging隨機采樣的思想上還增加了隨機特征選擇,使得其在訓練過程中增加更多的隨機性。
2) 時間序列溫度預測模型
時間序列溫度預測輸出的是上車開啟空調(diào)一段時間后實時的空調(diào)設定溫度,時間序列模型是在基礎特征的基礎上加上了時間序列特征,其交叉驗證結(jié)果如圖12所示。
圖12 時間序列溫度預測模型交叉驗證結(jié)果
根據(jù)交叉驗證結(jié)果,綜合考慮模型精度與計算時間,并且Lasso較為簡單,可以減少計算資源,適合連續(xù)性的實時工作,因此本文時間序列溫度預測模型選擇Lasso。
在確定模型后,我們需要確定模型的超參數(shù)來提高模型的精度,常見的超參數(shù)尋優(yōu)方法有網(wǎng)格搜索法和貝葉斯優(yōu)化方法。考慮到Lasso回歸模型簡單、超參數(shù)少,所以對Lasso模型使用網(wǎng)格搜索法。而貝葉斯優(yōu)化方法則充分利用了被測試點忽略的前一個點的信息,在該問題中貝葉斯優(yōu)化方法是一種非常有效的優(yōu)化算法[15-16],因此本文RF模型采用貝葉斯優(yōu)化算法。
在模型篩選階段,Lasso使用的Sklearn中的LassoCV,其中已加入網(wǎng)格搜索法自動尋優(yōu),最終得到懲罰系數(shù)alpha=0.007 512 482 411 700 719,優(yōu)化后MAPE評分為0.0228。而RF模型通過貝葉斯優(yōu)化后的MAPE評分從0.057 0降為了0.046 4。
最后根據(jù)本文提出的空調(diào)設定溫度預測方法,將優(yōu)化后的RF模型和Lasso模型進行集成,得到RF-Lasso集成模型,實現(xiàn)對用戶期望的空調(diào)設定溫度預測。RF-Lasso集成模型原理圖如圖13所示,X為時間序列輸入,Y為模型輸出,從集成方式上可以解釋為RF與Lasso求解過程的集成。
圖13 RF-Lasso集成模型原理圖
Xi作為RF-Lasso集成模型的輸入,隨著時間和模型的變化,其包含的特征也在變化,即
(10)
式中:Di為RF模型的輸入特征;Ti為空調(diào)開啟后的累計時間特征;Yi-1是上一時刻集成模型的輸出結(jié)果,又作為Lasso模型i時刻的輸入特征之一。
最終得到RF-Lasso集成模型為
(11)
為了驗證本次預測模型的準確性和可靠性,采用圖14方法來完成數(shù)據(jù)試驗。
圖14 RF-Lasso集成模型試驗流程圖
如圖15所示,首先根據(jù)前文中找到的超參數(shù)對訓練集S進行重新訓練,以獲得最佳模型。最后使用測試集T以驗證模型的有效性,試驗同樣采用MAPE作為評價指標。
圖15 數(shù)據(jù)試驗流程圖
首先對習慣溫度預測模型RF和時間序列溫度預測模型Lasso進行單模型測試,但是時間序列模型在固定步長下的表現(xiàn)不能代表模型實際情況下的效果,所以需要通過RF-Lasso集成模型來說明實際情況下的模型準確性。
在對集成模型進行數(shù)據(jù)試驗時,按行程分段讀入數(shù)據(jù),每段行程第一條數(shù)據(jù)處理之后分配給RF模型,剩余數(shù)據(jù)處理之后分配給Lasso模型,集成模型具體數(shù)據(jù)試驗如圖14所示。
通過數(shù)據(jù)試驗得到性能評價指標如表3所示。
表3 性能評價指標
從表3中可以看出習慣溫度預測模型RF和時間序列溫度預測模型Lasso在測試集上的MAPE得分與驗證集上表現(xiàn)相似,證明模型都沒有出現(xiàn)過擬合。而RF-Lasso集成模型的實驗結(jié)果則與習慣溫度預測模型效果相似,因此可以說明習慣溫度預測模型的效果決定著集成模型的最終結(jié)果。
本文以用戶期望的空調(diào)設定溫度預測為目標,基于車聯(lián)網(wǎng)平臺采集和存儲的用戶歷史數(shù)據(jù),利用數(shù)據(jù)挖掘和機器學習算法,構(gòu)建了RF-Lasso集成預測模型。其中,通過數(shù)據(jù)清洗、有關(guān)特征構(gòu)建和特征篩選,分析了與空調(diào)設定溫度相關(guān)的影響因素,隨后對比了10種機器學習回歸算法,綜合算法的精度和運算時間篩選出最適合本文的機器學習模型并利用網(wǎng)格尋優(yōu)和貝葉斯優(yōu)化算法優(yōu)化模型參數(shù),從而得到優(yōu)化RF和Lasso模型,最后根據(jù)本文提出的空調(diào)設定溫度預測方法,集成得到RF-Lasso模型。結(jié)果表明,本文提出的空調(diào)設定溫度預測模型對用戶空調(diào)設定溫度預測結(jié)果的平均絕對百分比誤差(MAPE)為0.049,預測結(jié)果較為理想,說明模型具有良好的準確性和魯棒性。