孫齊鳴 莊大偉 曹昊敏 丁國(guó)良△ 戚文端 邵艷坡 鄭 雄 張 浩
(1.上海交通大學(xué),上海;2.廣東美的制冷設(shè)備有限公司,順德)
隨著我國(guó)經(jīng)濟(jì)發(fā)展水平的提高,人們對(duì)建筑室內(nèi)環(huán)境的熱舒適性要求也越來(lái)越高[1]。在不同的環(huán)境條件下,空調(diào)器滿足用戶熱舒適性要求的設(shè)定參數(shù)是不一樣的。在環(huán)境條件變化時(shí),用戶為了滿足舒適性,不得不相應(yīng)地調(diào)整設(shè)定參數(shù),這會(huì)給用戶帶來(lái)不便。而根據(jù)用戶偏好自動(dòng)化調(diào)整空調(diào)設(shè)定參數(shù)的方法可以免去用戶的操作。
現(xiàn)有的空調(diào)器自動(dòng)化程度較低,需用戶手動(dòng)輸入指令或定義設(shè)定參數(shù),不具備根據(jù)用戶偏好自動(dòng)化調(diào)整空調(diào)設(shè)定參數(shù)的功能。為了自動(dòng)化設(shè)定空調(diào)參數(shù),需要對(duì)設(shè)定參數(shù)的變化規(guī)律進(jìn)行分析,這要求對(duì)空調(diào)運(yùn)行的歷史設(shè)定數(shù)據(jù)進(jìn)行學(xué)習(xí)。目前有關(guān)空調(diào)設(shè)定數(shù)據(jù)的研究涉及到大量的數(shù)據(jù)計(jì)算與分析,均需借助計(jì)算機(jī)的快速計(jì)算能力[2-4]。例如Zhou等人在高性能計(jì)算機(jī)上對(duì)收集的房間內(nèi)環(huán)境參數(shù)數(shù)據(jù)進(jìn)行學(xué)習(xí)與分析,并以此識(shí)別了空調(diào)器的運(yùn)行模式[2]。Zhao等人在計(jì)算機(jī)上運(yùn)用神經(jīng)網(wǎng)路模型對(duì)房間內(nèi)環(huán)境參數(shù)進(jìn)行了分析,實(shí)現(xiàn)了對(duì)空調(diào)能耗的準(zhǔn)確預(yù)測(cè)[4]。而目前空調(diào)器單片機(jī)的存儲(chǔ)器寬度多為16位,處理能力不足,僅依靠空調(diào)器單片機(jī)無(wú)法完成學(xué)習(xí)和預(yù)測(cè)設(shè)定參數(shù)的任務(wù)[5-7]。
快速發(fā)展的云計(jì)算技術(shù)為分析處理大量數(shù)據(jù)提供了便捷的解決方法[8-9]。例如謝宜鑫使用云計(jì)算技術(shù)對(duì)空調(diào)能耗數(shù)據(jù)進(jìn)行挖掘,從而實(shí)現(xiàn)空調(diào)能耗模式的預(yù)測(cè)[10]。如果將復(fù)雜的計(jì)算分析任務(wù)放在空調(diào)企業(yè)云端服務(wù)器上,空調(diào)器單片機(jī)則可以節(jié)省出空間執(zhí)行其常規(guī)任務(wù)。
為了能夠?qū)崿F(xiàn)空調(diào)器運(yùn)行中參數(shù)的自動(dòng)設(shè)定,本文擬基于云端學(xué)習(xí)與空調(diào)器本地計(jì)算相結(jié)合的思路,實(shí)現(xiàn)對(duì)于空調(diào)器運(yùn)行中控制參數(shù)用戶偏好的預(yù)測(cè)。
針對(duì)空調(diào)器單片機(jī)計(jì)算能力不足導(dǎo)致無(wú)法自動(dòng)化預(yù)測(cè)設(shè)定參數(shù)的問(wèn)題,本文提出云端學(xué)習(xí)與空調(diào)器本地計(jì)算相結(jié)合的技術(shù)路線,如圖1所示。具體的做法是:在高計(jì)算能力的云端服務(wù)器上建立學(xué)習(xí)算法,用于解決復(fù)雜的數(shù)據(jù)分析和模型建立的任務(wù);云端服務(wù)器將建立好的模型轉(zhuǎn)化為可供空調(diào)器單片機(jī)識(shí)別的多維矩陣格式;而在僅可執(zhí)行簡(jiǎn)單命令的本地單片機(jī)上建立預(yù)測(cè)方法,用于識(shí)別云端服務(wù)器生成的多維矩陣;單片機(jī)下載包含關(guān)系模型信息的多維矩陣后即可計(jì)算出用戶設(shè)定參數(shù)的預(yù)測(cè)值。
圖1 空調(diào)云端服務(wù)器與本地單片機(jī)的交互流程圖
在上述方案中,需要解決的是“云端服務(wù)器上學(xué)習(xí)算法的開(kāi)發(fā)”和“本地單片機(jī)上預(yù)測(cè)方法的開(kāi)發(fā)”問(wèn)題。云端學(xué)習(xí)算法的開(kāi)發(fā),包括建立環(huán)境參數(shù)與用戶設(shè)定參數(shù)之間的關(guān)系模型,以及針對(duì)用戶高頻調(diào)節(jié)時(shí)關(guān)系模型的動(dòng)態(tài)修正方法。本地預(yù)測(cè)方法的開(kāi)發(fā)包括關(guān)系模型的讀取,關(guān)系模型向多維插值矩陣的轉(zhuǎn)化,以及多維插值矩陣預(yù)測(cè)值的計(jì)算。
云端學(xué)習(xí)算法和本地預(yù)測(cè)方法在實(shí)際應(yīng)用過(guò)程中需要保證可靠性和準(zhǔn)確率。為了驗(yàn)證二者的可靠性與準(zhǔn)確率,本文基于用戶歷史操作數(shù)據(jù)分別對(duì)算法和方法進(jìn)行交叉驗(yàn)證和測(cè)試驗(yàn)證,操作數(shù)據(jù)中的一部分用于驗(yàn)證云端服務(wù)器上開(kāi)發(fā)的學(xué)習(xí)算法的可靠性,剩余的用于驗(yàn)證本地單片機(jī)上建立的預(yù)測(cè)方法的準(zhǔn)確率。
開(kāi)發(fā)云端學(xué)習(xí)算法需要對(duì)用戶的歷史操作數(shù)據(jù)進(jìn)行分析與學(xué)習(xí),而分析與學(xué)習(xí)的效果取決于數(shù)據(jù)的質(zhì)量。由于數(shù)據(jù)采集過(guò)程中的硬件失效或人為誤導(dǎo)等因素,采集到的數(shù)據(jù)可能混有噪聲數(shù)據(jù);又由于用戶偏好設(shè)定參數(shù)集中于某一區(qū)間,使用數(shù)據(jù)中存在著不平衡的問(wèn)題。這2個(gè)問(wèn)題會(huì)降低數(shù)據(jù)整體的質(zhì)量,對(duì)分析過(guò)程中的精度和性能影響極大[11-12]。而噪聲數(shù)據(jù)消除和數(shù)據(jù)重采樣的方法可以分別解決這2個(gè)問(wèn)題。
噪聲數(shù)據(jù)消除旨在對(duì)數(shù)據(jù)中的錯(cuò)誤值和離群值進(jìn)行消除。空調(diào)器的運(yùn)行數(shù)據(jù)主要包括時(shí)間、型號(hào)、環(huán)境溫濕度、設(shè)定參數(shù)、各項(xiàng)功能啟停狀態(tài)、各部件的運(yùn)行參數(shù)等。空調(diào)器每隔15 min自動(dòng)監(jiān)測(cè)、記錄1次運(yùn)行參數(shù),當(dāng)用戶通過(guò)遙控或其他方式調(diào)整設(shè)定參數(shù)或運(yùn)行模式時(shí),空調(diào)器也會(huì)自動(dòng)記錄該次調(diào)整數(shù)據(jù)。因?yàn)閿嗑W(wǎng)、機(jī)器故障或人為操作等原因,空調(diào)器會(huì)產(chǎn)生不合要求的噪聲數(shù)據(jù)。本文通過(guò)對(duì)相關(guān)參數(shù)進(jìn)行約束來(lái)刪除噪聲數(shù)據(jù),并通過(guò)對(duì)非數(shù)值格式的數(shù)據(jù)賦予數(shù)字標(biāo)簽的方式來(lái)對(duì)數(shù)據(jù)進(jìn)行格式轉(zhuǎn)化,從而能夠篩選出有效的數(shù)據(jù)集。
數(shù)據(jù)重采樣旨在解決數(shù)據(jù)集中存在的不平衡問(wèn)題。用戶設(shè)定偏好預(yù)測(cè)包括對(duì)空調(diào)器設(shè)定溫度和設(shè)定風(fēng)速的預(yù)測(cè),而用戶的偏好設(shè)定溫度和風(fēng)速多集中于某一固定區(qū)間,存在著明顯的不平衡現(xiàn)象。為了防止模型訓(xùn)練出的結(jié)果出現(xiàn)失衡問(wèn)題,本文對(duì)數(shù)據(jù)集進(jìn)行了樣本重采樣,即在用戶設(shè)定頻次較少的數(shù)據(jù)集附近插入調(diào)和后的新數(shù)據(jù)點(diǎn),使設(shè)定頻次較少的數(shù)據(jù)集的數(shù)量擴(kuò)充至高頻設(shè)定數(shù)據(jù)集的數(shù)量。以上海地區(qū)10戶用戶夏季的使用情況為例,用戶設(shè)定溫度和設(shè)定風(fēng)速的頻數(shù)分別如圖2a、b所示。用戶設(shè)定溫度偏好集中在24~28 ℃的區(qū)間內(nèi),出現(xiàn)64 344次,占據(jù)總頻次的93.2%;而用戶設(shè)定風(fēng)速偏好多為自動(dòng)風(fēng),出現(xiàn)54 723次,占據(jù)總頻次的84.1%。
圖2 上海地區(qū)10戶用戶的總體設(shè)定偏好
以上海地區(qū)10戶用戶的原始數(shù)據(jù)為例,經(jīng)過(guò)數(shù)據(jù)重采樣后,用戶低頻設(shè)定的數(shù)據(jù)量與高頻設(shè)定的數(shù)據(jù)量持平。具體數(shù)據(jù)的對(duì)比結(jié)果如表1所示。
表1 上海地區(qū)10戶用戶數(shù)據(jù)重采樣前后對(duì)比
為了實(shí)現(xiàn)對(duì)用戶設(shè)定溫度和風(fēng)速偏好的預(yù)測(cè),需要對(duì)使用數(shù)據(jù)中自變量與因變量的關(guān)系進(jìn)行分析并建立預(yù)測(cè)模型,而快速發(fā)展的機(jī)器學(xué)習(xí)算法為找出變量間相互關(guān)系提供了有效的解決手段[13]。梯度提升算法(light gradient boosting machine,LightGBM)[14]具有快速性、高精度、內(nèi)存消耗低的優(yōu)點(diǎn),且處理大批量數(shù)據(jù)的效果好,可以高效學(xué)習(xí)與分析用戶歷史操作數(shù)據(jù)。該算法學(xué)習(xí)輸入自變量和因變量之間的關(guān)系,將自變量與因變量之間的關(guān)系儲(chǔ)存在算法模型之中。
模型的輸入?yún)?shù)為月份、日期、小時(shí)數(shù)、分鐘數(shù)、室內(nèi)環(huán)境溫度、冷凝器出口溫度、蒸發(fā)器出口溫度、室外環(huán)境溫度、室內(nèi)濕度、設(shè)定溫度變化量和設(shè)定風(fēng)速變化量,這些不同輸入?yún)?shù)統(tǒng)稱(chēng)為數(shù)據(jù)特征;模型的輸出參數(shù)為用戶設(shè)定溫度和用戶設(shè)定風(fēng)速。為了降低算法的消耗并提高算法適用性,需要尋找到與用戶設(shè)定參數(shù)(設(shè)定溫度和設(shè)定風(fēng)速)關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)特征。本文使用遞歸式特征消除的方法對(duì)空調(diào)運(yùn)行數(shù)據(jù)進(jìn)行篩選,遞歸地分析特征集來(lái)選擇與目標(biāo)值關(guān)聯(lián)性最強(qiáng)的數(shù)據(jù)特征,并用特征重要度來(lái)反映與目標(biāo)值的關(guān)聯(lián)性強(qiáng)弱[15]。
對(duì)各個(gè)用戶數(shù)據(jù)集進(jìn)行遞歸式特征消除后,得到了數(shù)據(jù)特征的重要度排序,如圖3所示。本文為了降低插值矩陣的維度,使之能儲(chǔ)存于空調(diào)器單片機(jī)上,選取4條排序靠前的特征量作為算法模型的輸入,即室內(nèi)環(huán)境溫度、室外環(huán)境溫度、分鐘數(shù)和室內(nèi)濕度。用戶設(shè)定溫度和風(fēng)速作為算法模型的輸出。
圖3 遞歸式特征消除后的數(shù)據(jù)特征重要度排序
建立的算法模型學(xué)習(xí)了用戶的歷史使用習(xí)慣,但此模型不會(huì)隨著用戶的使用而更新。隨著使用時(shí)間的延長(zhǎng),模型預(yù)測(cè)的設(shè)置參數(shù)可能會(huì)偏離近期用戶的使用偏好,為此需要對(duì)模型進(jìn)行修正,使用戶在長(zhǎng)期使用過(guò)程中仍能給出高準(zhǔn)確率的預(yù)測(cè)值。本文提出將該模型修正為短期頻繁訓(xùn)練的動(dòng)態(tài)模型的方法。
此動(dòng)態(tài)模型的更新周期可以由用戶設(shè)定,確保捕捉用戶近期的使用習(xí)慣,具體的訓(xùn)練過(guò)程如圖4所示。首先基于歷史數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,經(jīng)過(guò)一個(gè)周期后,空調(diào)器所記錄的新的操作數(shù)據(jù)將被添加到訓(xùn)練數(shù)據(jù)集中,模型被重新訓(xùn)練并用于下一周期的用戶偏好預(yù)測(cè)。隨著使用時(shí)間的延長(zhǎng)和訓(xùn)練次數(shù)的增加,動(dòng)態(tài)模型給出的預(yù)測(cè)值會(huì)更加符合用戶的使用習(xí)慣。
圖4 動(dòng)態(tài)模型更新方法示意圖
云端服務(wù)器協(xié)助空調(diào)器本地進(jìn)行設(shè)定參數(shù)預(yù)測(cè)的主要過(guò)程為:云端服務(wù)器接收空調(diào)運(yùn)行參數(shù),經(jīng)過(guò)修正后的動(dòng)態(tài)模型學(xué)習(xí)與訓(xùn)練后,將輸出的用戶設(shè)定參數(shù)作為目標(biāo)值下達(dá)給空調(diào)器單片機(jī),單片機(jī)再結(jié)合控制策略調(diào)節(jié)空調(diào)器各部件。而空調(diào)器單片機(jī)存在算力不足和斷網(wǎng)時(shí)無(wú)法接收云端數(shù)據(jù)的問(wèn)題。本文提出多維矩陣插值的方法用于識(shí)別云端指令并下達(dá)指令給單片機(jī),以解決單片機(jī)存在的算力不足和斷網(wǎng)時(shí)無(wú)法接收云端數(shù)據(jù)的問(wèn)題。
本地多維矩陣用于插值預(yù)測(cè)方法的示意圖見(jiàn)圖5。首先,云端算法在對(duì)空調(diào)運(yùn)行歷史數(shù)據(jù)進(jìn)行學(xué)習(xí)后,會(huì)得到輸入輸出變量之間關(guān)系的數(shù)學(xué)模型;隨后,根據(jù)輸入自變量的特征值數(shù)目確定插值矩陣的維度,對(duì)每個(gè)特征按指定間隔進(jìn)行劃分后再組合,并在插值矩陣中儲(chǔ)存不同特征維度組合下的設(shè)定參數(shù)。每次有新數(shù)據(jù)上傳至云端時(shí),云端算法都會(huì)對(duì)模型進(jìn)行一次修正并更新插值矩陣??照{(diào)器單片機(jī)便從云端下載更新完成后的插值矩陣。
圖5 多維矩陣插值預(yù)測(cè)方法示意圖
矩陣查詢方法被編寫(xiě)入空調(diào)器本地的單片機(jī)上,以三維插值矩陣預(yù)測(cè)方法為例,如圖6所示,室內(nèi)溫度、室外溫度和時(shí)間3個(gè)特征屬性作為x、y、z坐標(biāo),實(shí)際工況點(diǎn)與其相鄰節(jié)點(diǎn)的坐標(biāo)的歐氏距離di為
圖6 插值矩陣方法示意圖
(1)
式中i為三維矩陣下實(shí)際工況點(diǎn)的相鄰節(jié)點(diǎn)的序號(hào);x0、y0、z0分別為實(shí)際工況點(diǎn)的三維特征參數(shù),即對(duì)應(yīng)室內(nèi)溫度、室外溫度和時(shí)間;xi、yi、zi分別為第i個(gè)相鄰節(jié)點(diǎn)的三維特征參數(shù)。
為了確定預(yù)測(cè)推薦值,需分析實(shí)際工況點(diǎn)與相鄰參考工況點(diǎn)的關(guān)系,在考慮計(jì)算負(fù)荷和預(yù)測(cè)準(zhǔn)確度的前提下,本文提出了8點(diǎn)加權(quán)平均法則。根據(jù)實(shí)際工況點(diǎn)與相鄰節(jié)點(diǎn)的歐氏距離的倒數(shù)對(duì)節(jié)點(diǎn)的設(shè)定參數(shù)做加權(quán),與實(shí)際工況點(diǎn)距離越近的節(jié)點(diǎn),其權(quán)重越高。加權(quán)后得到的設(shè)定參數(shù)即作為本地模型的預(yù)測(cè)值y,可由下式給出:
(2)
式中pi為儲(chǔ)存在插值矩陣上的第i個(gè)相鄰節(jié)點(diǎn)的設(shè)定參數(shù)。
空調(diào)器本地單片機(jī)讀取運(yùn)行數(shù)據(jù)后,定期上傳至云端服務(wù)器,由云端學(xué)習(xí)算法根據(jù)最新數(shù)據(jù)來(lái)訓(xùn)練模型,并定期更新插值矩陣,再由空調(diào)器本地下載該矩陣,最后根據(jù)矩陣查詢方法得到用戶設(shè)定參數(shù)的預(yù)測(cè)值。
云端服務(wù)器上建立的學(xué)習(xí)算法在應(yīng)用過(guò)程中需要有足夠的準(zhǔn)確率,為此需要對(duì)算法模型的準(zhǔn)確率進(jìn)行驗(yàn)證。算法模型的輸入?yún)?shù)為室內(nèi)溫度、室外溫度、時(shí)間和室內(nèi)濕度。模型的輸出參數(shù)為用戶設(shè)定溫度和風(fēng)速。模型的驗(yàn)證準(zhǔn)確率Av定義為
(3)
式中npre為用戶設(shè)定溫度(風(fēng)速)與預(yù)測(cè)值的絕對(duì)誤差在±0.5 ℃(±10%)內(nèi)的次數(shù);nt為測(cè)試數(shù)據(jù)集中的總條目數(shù)。
為了避免訓(xùn)練集數(shù)據(jù)自驗(yàn)證而產(chǎn)生過(guò)擬合的問(wèn)題,本文在驗(yàn)證上述模型時(shí)使用k折交叉驗(yàn)證方法,即將初始數(shù)據(jù)集均分為k個(gè)子集,其中k-1個(gè)子集作為訓(xùn)練集,剩余1個(gè)作為測(cè)試集用于測(cè)試,依次重復(fù)k次,并將測(cè)試k次得到的準(zhǔn)確率平均后作為交叉驗(yàn)證的準(zhǔn)確率??紤]到需要對(duì)數(shù)據(jù)集充分使用,以及各個(gè)子集需要有足夠的數(shù)據(jù),k取值建議在3~6之間,此處交叉驗(yàn)證的k值取為5。
為了評(píng)價(jià)算法模型在單個(gè)地區(qū)的通用性和適用性,定義地區(qū)平均準(zhǔn)確率Aa為
(4)
式中k為用戶序號(hào);m為地區(qū)用戶的數(shù)目;nt,k為第k個(gè)用戶測(cè)試集的數(shù)據(jù)容量;Ak為第k個(gè)用戶測(cè)試集的分類(lèi)準(zhǔn)確率。
本文選擇了位于重慶、廣州和上海3個(gè)大型城市共30戶用戶的歷史數(shù)據(jù),這些用戶的數(shù)據(jù)具有地域差異大、涵蓋范圍廣、使用時(shí)間長(zhǎng)的特點(diǎn),數(shù)據(jù)集的主要信息如表2所示。對(duì)于上海地區(qū)的10戶用戶,其交叉驗(yàn)證數(shù)據(jù)集包含的條目最多為14 949條,最少為1 777條,平均為6 503條;對(duì)于廣州地區(qū)的10戶用戶,其交叉驗(yàn)證數(shù)據(jù)集包含的條目最多為9 337條,最少為1 889條,平均為7 190條;對(duì)于重慶地區(qū)的10戶用戶,其交叉驗(yàn)證數(shù)據(jù)集包含的條目最多為7 513條,最少為1 911條,平均為4 296條。
表2 交叉驗(yàn)證數(shù)據(jù)集的主要信息
數(shù)據(jù)集交叉驗(yàn)證結(jié)果如圖7~9所示。
圖7 上海地區(qū)用戶夏季運(yùn)行數(shù)據(jù)交叉驗(yàn)證結(jié)果
圖8 廣州地區(qū)用戶夏季運(yùn)行數(shù)據(jù)交叉驗(yàn)證結(jié)果
圖9 重慶地區(qū)用戶夏季運(yùn)行數(shù)據(jù)交叉驗(yàn)證結(jié)果
對(duì)于設(shè)定溫度的交叉驗(yàn)證結(jié)果而言,上海、廣州、重慶地區(qū)的平均驗(yàn)證準(zhǔn)確率分別為0.92、0.89、0.89。對(duì)于設(shè)定風(fēng)速的交叉驗(yàn)證結(jié)果而言,上海、廣州、重慶地區(qū)的平均驗(yàn)證準(zhǔn)確率分別為0.93、0.91、0.95。
由此可見(jiàn),云端算法模型在多數(shù)空調(diào)用戶的運(yùn)行數(shù)據(jù)集上的表現(xiàn)良好,能有效地反映出用戶的行為特征與輸入環(huán)境特征的關(guān)系。
本地單片機(jī)上建立的預(yù)測(cè)方法在應(yīng)用中需要有較高的準(zhǔn)確率,為此需要對(duì)預(yù)測(cè)方法的準(zhǔn)確率進(jìn)行驗(yàn)證。用戶操作數(shù)據(jù)中的一部分用于訓(xùn)練算法模型,剩余的用于驗(yàn)證本地單片機(jī)上建立的預(yù)測(cè)方法的準(zhǔn)確率。時(shí)間、室內(nèi)濕度、室內(nèi)溫度和室外溫度的組合作為模型的輸入?yún)?shù),用戶設(shè)定溫度和設(shè)定風(fēng)速則是模型的輸出參數(shù)。預(yù)測(cè)方法的衡量指標(biāo)采用預(yù)測(cè)準(zhǔn)確率與地區(qū)平均準(zhǔn)確率,計(jì)算公式沿用式(3)、(4)。
本文將具有代表性的3個(gè)城市共30戶用戶的夏季空調(diào)運(yùn)行大數(shù)據(jù)分為訓(xùn)練組和測(cè)試組,其中,5—7月的空調(diào)運(yùn)行數(shù)據(jù)作為模型的訓(xùn)練組,8月的空調(diào)運(yùn)行數(shù)據(jù)作為模型的測(cè)試組,用于檢驗(yàn)連續(xù)1個(gè)月內(nèi)的預(yù)測(cè)效果。訓(xùn)練組和測(cè)試組數(shù)據(jù)的主要信息如表3所示。
表3 訓(xùn)練組和測(cè)試組數(shù)據(jù)集的主要信息
3個(gè)城市共30戶用戶的數(shù)據(jù)集預(yù)測(cè)結(jié)果如圖10~12所示。
圖10 上海地區(qū)用戶夏季運(yùn)行數(shù)據(jù)的本地預(yù)測(cè)結(jié)果
圖12 重慶地區(qū)用戶夏季運(yùn)行數(shù)據(jù)的本地預(yù)測(cè)結(jié)果
由空調(diào)用戶8月運(yùn)行數(shù)據(jù)的預(yù)測(cè)結(jié)果可知:對(duì)于設(shè)定溫度的預(yù)測(cè)結(jié)果而言,上海、廣州、重慶地區(qū)的平均預(yù)測(cè)準(zhǔn)確率分別為0.88、0.84、0.80;對(duì)于設(shè)定風(fēng)速的預(yù)測(cè)結(jié)果而言,上海、廣州、重慶地區(qū)的平均預(yù)測(cè)準(zhǔn)確率分別為0.91、0.90、0.94,這主要是由于多數(shù)用戶的設(shè)定風(fēng)速偏好均為自動(dòng)風(fēng)擋。對(duì)于設(shè)定溫度預(yù)測(cè)準(zhǔn)確率低于0.70的部分?jǐn)?shù)據(jù)集來(lái)說(shuō),用戶的設(shè)定偏好多呈現(xiàn)不規(guī)律且頻繁的波動(dòng),模型無(wú)法根據(jù)歷史習(xí)慣給出準(zhǔn)確的預(yù)測(cè)值。可能原因之一是該空調(diào)室內(nèi)存在人員的頻繁變動(dòng)。
多維矩陣插值方法能較好地復(fù)現(xiàn)云端算法模型的結(jié)果,繼承模型的內(nèi)在關(guān)聯(lián)。由此可見(jiàn),云端學(xué)習(xí)模型與本地預(yù)測(cè)模型的結(jié)合在大多數(shù)空調(diào)用戶運(yùn)行數(shù)據(jù)集上的表現(xiàn)良好,可以準(zhǔn)確地反映出用戶的設(shè)定溫度和設(shè)定風(fēng)速偏好。
1) 通過(guò)云端學(xué)習(xí)與本地計(jì)算相結(jié)合的方法,可以在空調(diào)器單片機(jī)有限計(jì)算資源下實(shí)現(xiàn)用戶偏好設(shè)定參數(shù)的預(yù)測(cè)。
2) 云端服務(wù)器上建立的學(xué)習(xí)算法能夠?qū)W習(xí)用戶操作數(shù)據(jù)并建模,建立的模型可以反映用戶設(shè)定溫度和設(shè)定風(fēng)速與環(huán)境參數(shù)的關(guān)聯(lián)。
3) 本地單片機(jī)上建立的預(yù)測(cè)方法可以繼承云端算法模型的內(nèi)在關(guān)聯(lián),能夠在低計(jì)算消耗下對(duì)用戶設(shè)定溫度和風(fēng)速進(jìn)行預(yù)測(cè)。
4) 云端學(xué)習(xí)算法的數(shù)據(jù)交叉驗(yàn)證結(jié)果顯示:交叉驗(yàn)證數(shù)據(jù)集的設(shè)定溫度與預(yù)測(cè)值的偏差在±0.5 ℃內(nèi)的比例平均為90%,最高為92%;設(shè)定風(fēng)速與預(yù)測(cè)值的偏差在±10%內(nèi)的比例平均為93%,最高為95%。說(shuō)明云端學(xué)習(xí)算法的適用性較好。
5) 本地預(yù)測(cè)方法的驗(yàn)證結(jié)果表明:用戶實(shí)際設(shè)定溫度與預(yù)測(cè)值的偏差在±0.5 ℃內(nèi)的占比平均為84%,最高為88%;用戶實(shí)際設(shè)定風(fēng)速與預(yù)測(cè)值的偏差在±10%內(nèi)的占比平均為92%,最高為94%。說(shuō)明本地預(yù)測(cè)方法效果良好,可用于空調(diào)用戶設(shè)定偏好的預(yù)測(cè)。