• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于特征提取和隨機(jī)森林的風(fēng)機(jī)故障診斷

    2020-09-04 07:56:20梁川
    科學(xué)技術(shù)創(chuàng)新 2020年26期
    關(guān)鍵詞:結(jié)冰決策樹風(fēng)機(jī)

    梁川

    (江中藥業(yè)股份有限公司,江西 南昌330000)

    隨著全球變暖引起的氣候問題越來越嚴(yán)重,各國都越來越重視環(huán)境和氣候問題,首先是化石能源的使用帶來的負(fù)面影響

    [1],因此,可再生能源的發(fā)展備受關(guān)注。

    其中,風(fēng)力發(fā)電是最成熟、經(jīng)濟(jì)可行、應(yīng)用最廣泛的新能源發(fā)電技術(shù)之一[2],風(fēng)能是利用氣流做功和提供能源。在海拔1000米以下的地區(qū),每升高100 米風(fēng)速增加0.1 米/秒[3],同時(shí),低溫地區(qū)空氣密度增加,風(fēng)能利用率提高10%,因此在高寒地區(qū)安裝了大量的風(fēng)力發(fā)電機(jī)[4]。在這些高海拔地區(qū),葉片容易結(jié)冰,影響風(fēng)機(jī)的性能和安全。因此,對(duì)風(fēng)機(jī)葉片結(jié)冰預(yù)報(bào)的研究具有較高的應(yīng)用價(jià)值。

    國內(nèi)外都十分重視風(fēng)機(jī)葉片結(jié)冰故障診斷的研究。Simani等[5]提出了數(shù)據(jù)驅(qū)動(dòng)方法對(duì)風(fēng)機(jī)的早期故障進(jìn)行檢測,主要運(yùn)用了模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)來描述測量和故障之間的強(qiáng)非線性關(guān)系。葉春霖等[6]采用處理不平衡學(xué)習(xí)算法和隨機(jī)森林實(shí)現(xiàn)風(fēng)機(jī)結(jié)冰故障診斷。李大中[7]等提出利用極端梯度提升XGBoost 算法對(duì)風(fēng)機(jī)葉片結(jié)冰狀態(tài)進(jìn)行評(píng)估,在風(fēng)機(jī)葉片結(jié)冰狀態(tài)診斷中具有良好的性能。

    目前,對(duì)于風(fēng)機(jī)葉片故障診斷的研究很多,但準(zhǔn)確度還有待提高。本文提出了一種基于ReliefF 特征提取和隨機(jī)森林的風(fēng)機(jī)結(jié)冰故障診斷模型,可以提高故障診斷的準(zhǔn)確率,保證故障能夠及時(shí)發(fā)現(xiàn)并處理,確保風(fēng)機(jī)的安全運(yùn)行。

    1 ReliefF 特征選擇

    Relief 算法是Kira 于1992 年首次提出的一種經(jīng)典的特征選擇算法[8],ReliefF 算法是Relief 算法的擴(kuò)展,ReliefF 算法是一種常用的過濾式特征權(quán)重算法,根據(jù)各個(gè)特征和類別的相關(guān)性賦予特征不同的權(quán)重,權(quán)重小于某個(gè)閾值的特征將被移除,該方法設(shè)定了一個(gè)“相關(guān)統(tǒng)計(jì)量”來表達(dá)特征的重要性。ReliefF 通常用于多類別標(biāo)簽的特征選擇,是根據(jù)每個(gè)特征和類別的相關(guān)性,賦予特征不同的權(quán)重[9]。

    給出l 類的類標(biāo)簽,ReliefF 算法從訓(xùn)練集中隨機(jī)抽取一個(gè)樣本Ri,然后從同一類別中找到K 個(gè)Ri的近樣本,用Hj(j=1,2,…,K)表示,并從不同類別中找到K 個(gè)Ri的近樣本,用Mj(c)(j=1,2,…,K)[10]。ReliefF 算法在每個(gè)特征維上重復(fù)上述過程,得到每個(gè)特征的權(quán)重如下:

    其中m 是迭代次數(shù),p(c)是c 類的概率,diff(A,R1,R2)表示關(guān)于特征A 的樣本R1和R2之間的差異,其定義為

    2 隨機(jī)森林

    隨機(jī)森林(Random Forests,RF)算法最早是由美國科學(xué)家Leo 于2001 年提出的一種機(jī)器學(xué)習(xí)算法[11],該算法結(jié)合了Bagging 集成學(xué)習(xí)算法與隨機(jī)子空間思想,通過有放回的隨機(jī)采樣構(gòu)造完各個(gè)決策樹后,綜合多個(gè)決策樹的分類結(jié)果來作為最終輸出。隨機(jī)森林算法是由決策樹(Decision Forests)算法一步一步發(fā)展而來的,發(fā)展經(jīng)過如圖1 所示。

    圖1 決策樹發(fā)展經(jīng)過

    決策樹是一種常用的分類算法,屬于有監(jiān)督學(xué)習(xí)(Supervised Learning),他代表的是對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系。樹中每個(gè)節(jié)點(diǎn)表示某個(gè)對(duì)象,每個(gè)分叉路徑則代表某個(gè)可能的屬性值。對(duì)于機(jī)器學(xué)習(xí)中的分類問題,將樣本特征輸入到?jīng)Q策樹模型后,通過一層層的決策,最終得到模型對(duì)該特征的預(yù)測結(jié)果,即樣本標(biāo)簽。決策樹一般模型如圖2 所示。

    圖2 決策樹的一般模型

    隨機(jī)森林是以K 個(gè)決策樹為基本分類器,進(jìn)行集成學(xué)習(xí)后得到一個(gè)組合分類器,將樣本輸入訓(xùn)練好的隨機(jī)森林模型之后,隨機(jī)森林模型根據(jù)每個(gè)決策樹的分類結(jié)果投票決定出最終的輸出[12]。

    由于隨機(jī)森林中各個(gè)決策樹的訓(xùn)練都是相互獨(dú)立的,因此在具體使用隨機(jī)森林算法時(shí)可采用并行處理,這將極大的提高隨機(jī)森林模型的訓(xùn)練速度。隨機(jī)森林中單個(gè)決策樹的訓(xùn)練過程如圖3 所示。

    圖3 隨機(jī)森林中單個(gè)決策樹訓(xùn)練過程

    隨機(jī)森林的特點(diǎn)決定了即便是處理大樣本、多維的數(shù)據(jù)也能有較快的速度,并且還可以根據(jù)每個(gè)特征在不同的決策樹中所做的貢獻(xiàn)來進(jìn)行特征權(quán)重分析,同時(shí)隨機(jī)森林是一種非參數(shù)分類方法,只需要根據(jù)訓(xùn)練樣本中特征與標(biāo)簽的對(duì)應(yīng)關(guān)系學(xué)習(xí)分類規(guī)則,而不需要分類的先驗(yàn)知識(shí)。

    3 實(shí)例分析

    本文采用的數(shù)據(jù)來自國內(nèi)某風(fēng)機(jī)組15 號(hào)單機(jī)運(yùn)行狀態(tài)下SCADA 部分?jǐn)?shù)據(jù),有28 個(gè)連續(xù)數(shù)值型變量,除去時(shí)間列和沒有任何意義的“group”列外,共有26 個(gè)連續(xù)型數(shù)值變量,覆蓋了風(fēng)機(jī)的工況、運(yùn)行環(huán)境、狀態(tài)等多個(gè)維度的參數(shù),如功率、葉片轉(zhuǎn)速、葉片角度、風(fēng)速、風(fēng)向、溫度等,共計(jì)393886*28 組數(shù)據(jù)。

    3.1 數(shù)據(jù)預(yù)處理

    訓(xùn)練數(shù)據(jù)集中包含了正常數(shù)據(jù)、故障數(shù)據(jù)以及無效數(shù)據(jù),分別將其對(duì)應(yīng)的訓(xùn)練樣本label 標(biāo)記為0,1,2。其中,對(duì)于無效數(shù)據(jù),我們無法將其分成正常數(shù)據(jù)或是故障數(shù)據(jù),因此在實(shí)際訓(xùn)練中將其刪除。

    3.2 特征選擇

    原始數(shù)據(jù)有26 個(gè)有效特征參數(shù),作為模型的輸入維度偏高,訓(xùn)練會(huì)耗用過多的時(shí)間。因此,本文運(yùn)用ReliefF 方法可以明確各特征對(duì)分類和故障診斷貢獻(xiàn)率。其特征權(quán)重相關(guān)度如圖4所示。

    圖中各個(gè)顏色分別表示原始數(shù)據(jù)進(jìn)行了10 次迭代的效果,提升貢獻(xiàn)率的準(zhǔn)確性。

    由圖可知,wind_direction_mean、yaw_speed、acc_x 等6 個(gè)特征的特征權(quán)重基本為0,與結(jié)果之間基本無關(guān)系,可以將26 維數(shù)據(jù)減少至20 維特征,提升了模型的訓(xùn)練速度。

    圖4 ReliefF 算法特征權(quán)重相關(guān)度

    3.3 故障診斷驗(yàn)證

    原始數(shù)據(jù)經(jīng)過“去噪”以及基于ReliefF 特征選擇之后,數(shù)據(jù)集具備了一定的完整性。將15 機(jī)組風(fēng)機(jī)機(jī)組數(shù)據(jù)按7:3 劃分為訓(xùn)練集和測試集。運(yùn)用訓(xùn)練集對(duì)隨機(jī)森林模型進(jìn)行訓(xùn)練,測試集帶入模型之后獲得狀態(tài)輸出,將輸出的結(jié)果與測試集實(shí)際situation 及逆行對(duì)比,來評(píng)估模型的效果,其流程圖如圖5 所示。

    圖5 隨機(jī)森林模型訓(xùn)練的流程

    為判定算法的性能,本文采用了準(zhǔn)確率(ACC)、精確率(PRE)、召回率(REC)和F1 Score。各個(gè)指標(biāo)的定義為:

    其中,F(xiàn)N/TP/FP/TN 的含義參數(shù)如表1。準(zhǔn)確率表示診斷正確的結(jié)果占總樣本的百分比;精確率表示在所有診斷為正的樣本中實(shí)際為正樣本的概率;召回率表示在實(shí)際為正的樣本中被診斷為正樣本的概率;F1 Score 是綜合考慮精確率和召回率的一個(gè)評(píng)價(jià)指標(biāo)。

    表1 FN/TP/FP/TN 的含義

    將原始數(shù)據(jù)按照以上步驟“去噪”、特征選擇后,將數(shù)據(jù)劃分為訓(xùn)練集和測試集,運(yùn)用訓(xùn)練集對(duì)隨機(jī)森林模型進(jìn)行訓(xùn)練,測試集帶入模型中驗(yàn)證模型效果,如表2 所示。再分別采用傳統(tǒng)的決策樹,KNN 和SVM算法實(shí)現(xiàn)風(fēng)機(jī)結(jié)冰故障診斷,可以得到4 個(gè)算法的效果對(duì)比,如表3 所示。通過比較,能夠發(fā)現(xiàn)本文采取的方法的優(yōu)勢。

    表2 基于特征選擇以及隨機(jī)森林的風(fēng)機(jī)故障診斷

    表3 4 種分類器模型的效果對(duì)比

    4 結(jié)論

    本文提出了一種基于ReliefF 特征提取和隨機(jī)森林算法的風(fēng)機(jī)結(jié)冰故障診斷方法,經(jīng)過實(shí)驗(yàn)對(duì)比驗(yàn)證,得出該方法在準(zhǔn)確度上提升至97%左右,可以有效診斷出風(fēng)機(jī)結(jié)冰的故障,及時(shí)警報(bào)除冰,減少風(fēng)機(jī)因結(jié)冰而導(dǎo)致的效率降低和損壞。

    本文還采用了適用于不平衡數(shù)據(jù)的評(píng)價(jià)指標(biāo)F1 Score 參數(shù),可以減少因數(shù)據(jù)不平很而影響模型的評(píng)判。

    猜你喜歡
    結(jié)冰決策樹風(fēng)機(jī)
    通體結(jié)冰的球
    一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
    冬天,玻璃窗上為什么會(huì)結(jié)冰花?
    決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    風(fēng)機(jī)折翼“倒春寒”
    能源(2018年5期)2018-06-15 08:56:02
    風(fēng)機(jī)倒塔事故為何頻發(fā)?
    能源(2017年9期)2017-10-18 00:48:27
    魚缸結(jié)冰
    基于決策樹的出租車乘客出行目的識(shí)別
    節(jié)能技術(shù)EPU在AV71風(fēng)機(jī)上的應(yīng)用
    TS3000系統(tǒng)防喘振控制在 AV80-14風(fēng)機(jī)中的應(yīng)用
    濉溪县| 兴宁市| 海盐县| 弥渡县| 永城市| 泾川县| 亳州市| 汽车| 琼结县| 仙桃市| 延边| 文昌市| 孟津县| 缙云县| 烟台市| 三河市| 东乡族自治县| 揭西县| 诸暨市| 延津县| 务川| 牡丹江市| 韶关市| 彭山县| 大埔区| 昭觉县| 乌什县| 漠河县| 和政县| 秀山| 鄂托克旗| 永昌县| 灌云县| 张家口市| 廉江市| 民丰县| 元朗区| 长汀县| 珠海市| 大荔县| 肇东市|