全泓達,蓋 磊
(中國海洋大學 物理與光電工程學院,山東 青島 266100)
熱機是將熱能轉(zhuǎn)換為機械能的儀器.法國青年工程師卡諾從理論上對理想熱機的工作原理進行研究,提出了一種理想的由2個等溫及2個絕熱過程的循環(huán),稱為卡諾循環(huán),并在1824年提出了卡諾定理,為后來熱力學第二定律的建立奠定了基礎,為提高熱機的效率指明了方向,為熱力學的發(fā)展做出了杰出的貢獻[1-3].
由于熱機的整個裝置處于動態(tài)平衡,獲取精準的靜態(tài)狀態(tài)數(shù)據(jù)需要較長的判斷時間,因此本文主要基于空氣熱機實驗中驗證卡諾定理的靜態(tài)測量法,探索了快速判斷平衡點的方法.
實驗采用世紀中科的ZKY-RJ空氣熱機實驗儀,實驗由空氣熱機電加熱器進行加熱,并由空氣熱機測試儀得到冷端溫度、熱端溫度、轉(zhuǎn)速、氣缸壓力以及氣缸體積等實驗數(shù)據(jù),并經(jīng)過實驗通信器面板傳回電腦進行數(shù)據(jù)顯示.
熱機每次循環(huán)從熱源吸收的熱量
(1)
其中,n為熱機轉(zhuǎn)速,ΔT為冷熱端溫差.因此熱機效率η可表示為
(2)
其中,A為氣體對外所做的凈功,即P-V圖中曲線所圍面積.由于式中的變量均可以在實驗中測量得到,因此通過觀測不同冷熱端溫度時的nA/ΔT與ΔT/n的關系即可驗證卡諾定理.
測量式子(2)中的參量有2種方法:靜態(tài)測量法和動態(tài)測量法.靜態(tài)測量法是在電壓檔位一定時,在系統(tǒng)穩(wěn)定后測量得到的平均值,可以表示在一定的冷熱端溫度時的關系.熱機穩(wěn)定工作是指冷熱端在一定的溫度下,保持一定的效率,即在每次循環(huán)中熱機對外做功近乎不變.在一定輸入功率下,系統(tǒng)是否達到平衡取決于冷熱端的溫差和轉(zhuǎn)速,即通過電加熱器可以使冷熱端溫差變大(視冷端溫度不變或者變化很小),而熱機每次循環(huán)都將從熱源吸收熱量,使冷熱端溫差下降.所以二者的平衡即是靜態(tài)測量法所需要的穩(wěn)定狀態(tài).
實驗中判斷熱機是否平衡需要長時間的數(shù)據(jù)記錄,當轉(zhuǎn)速、冷熱端溫差在一定范圍內(nèi)上下浮動時(例如n<1 r·s-1,ΔT<5 K),可判斷空氣熱機達到平衡狀態(tài),但判定平衡點的觀測時間通常需要10 min甚至更長,從而不利于實驗教學.
1)打開計算機、測試儀和通信器,加熱電源;
2)將電壓調(diào)至5檔,預熱儀器使飛輪順利轉(zhuǎn)動(一般ΔT>80 K);
3)將電壓調(diào)回1檔,開始計時計數(shù),每隔1 min記錄1次T1,ΔT,n和A,直至各項數(shù)值在平衡點附近變化(記錄時間約1 h);
4)將電壓調(diào)至2檔重復上述步驟3).
3.1.1 K型均值聚類
K型均值聚類(K-means clustering)是經(jīng)典的無監(jiān)督機器學習算法,用于無目標值的數(shù)據(jù)集[4].K型算法主要是通過迭代來對數(shù)據(jù)集進行分類.首先在樣本中選取任意K個樣本作為聚類中心,利用所選取的聚類中心計算各樣本與中心間的距離;然后根據(jù)獲得的最小計算距離重新劃分對象.距離一般通過歐式距離Dδ進行度量,表達式如下:
Dδ(xi,xj)=
(3)
其中,xi=(xi1,xi2,…,xip)和xj=(xj1,xj2,…,xjp)表示p維歐幾里德空間中的2點.重新計算獲得每個樣本的均值后,迭代至目標函數(shù)值不變或者小于指定閾值.目標函數(shù)為平方誤差準則函數(shù),表示為
(4)
其中,Ci為數(shù)據(jù)對象數(shù)量,ci表示第i個簇中心.
3.1.2 KNN分類
最近鄰節(jié)點分類(K-nearest neighbor,KNN)方法是有監(jiān)督的弱機器學習算法[5],其通過計算預測值與現(xiàn)有樣本的閔可夫斯基距離(Minkowski distance)來確定預測所屬類別.
閔式距離的表達式為:
(5)
當p→∞時,閔式距離轉(zhuǎn)化為切比雪夫距離(Chebyshev distance);當p=2時,閔式距離轉(zhuǎn)化為歐幾里得距離;當p=1時,閔式距離轉(zhuǎn)化為曼哈頓距離(Manhattan distance).通過閔式距離,可較好表示n維歐幾里德空間中2點相對距離.
KNN算法中最為重要的參量為判斷類別時采用的樣本個數(shù),若選取的樣本數(shù)量過小,容易受到異常點的影響;若選取的樣本數(shù)量過大,就會受到樣本均衡的影響,所以選取合適的樣本數(shù)對KNN模型具有重要作用.
本文對實驗數(shù)據(jù)進行KNN分類處理,以獲得能較好判斷熱機是否到達平衡的模型,通過該模型能準確快速地判斷空氣熱機是否達到平衡,從而減少實驗時間.
為使實驗結果具有普適性,消除儀器和檔位(加熱電壓)的偶然性,本文對2臺儀器3個檔位進行實驗,部分原始數(shù)據(jù)如表1所示.
表1 實驗原始數(shù)據(jù)(部分)
由于各項指標的數(shù)據(jù)單位以及數(shù)值大小不同,所以需要對各類數(shù)據(jù)進行標準化.假設進行分析的指標變量有m個,分別為z1,z2,…,zm,共有n個評價對象,第i個評價對象的第j個指標的取值為aij[6].將各指標值轉(zhuǎn)化為標準化值有
(6)
由式(6)可獲得各項指標標準化后隨時間的變化圖線,如圖1所示.根據(jù)卡諾定理,熱機在穩(wěn)定運行時,其在1個循環(huán)內(nèi)的效率僅跟冷熱端溫度有關,而在多次循環(huán)中,轉(zhuǎn)速與循環(huán)次數(shù)有關,那么是否平衡也與轉(zhuǎn)速有關.以下將不考慮對外做功對平衡判斷的影響.需要補充說明的是,為了獲取僅與上述因素有關的熱機平衡判定方法,而非對比儀器間差異,所以無需控制儀器A和B都在電壓檔1和2進行實驗測量.
(a)儀器A電壓檔1
利用得到的標準化數(shù)據(jù),進行K型聚類[7],將歐幾里德距離作為K型聚類的判斷標準,將數(shù)據(jù)分為平衡狀態(tài)與非平衡狀態(tài),由此可以獲得較為客觀公正的平衡點,圖2為聚類后的輪廓圖.
(a)儀器A電壓檔1
圖2中簇1為聚類后認定的平衡狀態(tài),簇2為聚類后認定的非平衡狀態(tài).通過對輪廓圖的分析,可以發(fā)現(xiàn)聚類效果較為顯著.為了讓實驗數(shù)據(jù)更具有信服力,本次實驗記錄了長時間(遠超熱機平衡所需時間)的實驗數(shù)據(jù),所以有大量的平衡狀態(tài)數(shù)據(jù)點,而該類型的點能很好地被聚集在一起,形成較為明顯的數(shù)據(jù)邊際,說明平衡與非平衡之間存在一定的衡量指標.
然后利用KNN進行分類,將所有數(shù)據(jù)進行整合,并將加熱電壓值作為模型建立的特征值.圖3和圖4為模型的訓練結果.
圖3 模型ROC曲線與AUC
圖4 模型混淆矩陣
整體利用5折交叉驗證獲得的模型準確率達到93.3%,且為了防止過擬合,預留部分數(shù)據(jù)進行驗證,最后效果較好,基本滿足預期需求.
圖3為模型的ROC曲線(Receiver operating characteristic),其中AUC[8](Area under curve)接近1,遠在超假正率(False positive rate,F(xiàn)PR)等于真正率(True Positive Rate,TPR)的直線上方,接近1個完美的分類器.
圖4為模型的混淆矩陣[9],從矩陣可以看出誤判斷數(shù)量較少,整體能比較好地對平衡與非平衡狀態(tài)進行分類.
基于以上模型,再次進行5組實驗,在不同儀器不同電壓檔位下各測量60個數(shù)據(jù),并將得到的數(shù)據(jù)放入模型預測系統(tǒng)是否處于平衡狀態(tài).為了避免儀器因轉(zhuǎn)速過高而觸發(fā)保護機制,將最高電壓檔位設定為4檔.
圖5是模型對于系統(tǒng)是否達到平衡狀態(tài)判斷,橫坐標表示儀器和電壓檔位,上下閾值為K-means聚類算法得出的平衡點的最大值和最小值,模型所判斷出的平衡點落在該范圍越多說明模型判定準確性越好.可以看出,模型判斷的平衡點基本都集中在平衡范圍內(nèi).
圖5 不同儀器、不同電壓檔位下系統(tǒng)平衡狀態(tài)的判斷結果
圖6為C儀器在電壓檔為4時的轉(zhuǎn)速隨時間的判斷結果,可看出系統(tǒng)在平衡狀態(tài)與非平衡狀態(tài)間的轉(zhuǎn)換位置處于曲線拐點,與真實進入平衡點時間不超過2 min,說明該模型判斷效果較好.
圖6 C儀器在電壓檔為4時轉(zhuǎn)速隨時間的判斷結果
本文通過對空氣熱機實驗測得的數(shù)據(jù)進行分析,獲得了基于KNN的模型分類器,通過多種指標對模型進行衡量分類都有較好的預測結果.其中,誤分類點處于平衡狀態(tài)與非平衡狀態(tài)的模糊界線處,從錯誤預測進入正確預測所需時間不大于2 min,因此誤分類相較于接近10 min的主觀判斷有了大幅度的提升,并具備一定的實用性.將每一時刻獲得的數(shù)據(jù)輸入該模型,能得到較好的預測結果.另外,通過K-means聚類算法可以對因測量精度、環(huán)境影響、儀器誤差、動態(tài)平衡等因素帶來的數(shù)據(jù)波動提供較好的參考中心值,從而使得真實值的選取更加準確.