北京拾易技術(shù)有限公司 馮雅皓 安熠然 林晨
機(jī)器學(xué)習(xí)(Machine Learning)是一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科,專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域,它主要使用歸納、綜合而不是演繹。
當(dāng)前,機(jī)器學(xué)習(xí)已經(jīng)在數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、檢測(cè)信用卡欺詐、證券市場(chǎng)分析、DNA序列測(cè)序、語音和手寫識(shí)別、戰(zhàn)略游戲和機(jī)器人方面得到十分廣泛的應(yīng)用。本文主要分享機(jī)器學(xué)習(xí)在風(fēng)電機(jī)組功率曲線研究和數(shù)據(jù)挖掘方面的一些成果。
首先簡單描述我們機(jī)器學(xué)習(xí)系統(tǒng)的基本結(jié)構(gòu)。通過輸入接口向系統(tǒng)的學(xué)習(xí)部分提供功率曲線研究所需相關(guān)數(shù)據(jù),學(xué)習(xí)部分利用這些數(shù)據(jù)修改知識(shí)庫,以增進(jìn)系統(tǒng)執(zhí)行部分完成任務(wù)的效能,執(zhí)行部分根據(jù)知識(shí)庫完成任務(wù)并輸出結(jié)果數(shù)據(jù),同時(shí)把獲得的數(shù)據(jù)反饋給學(xué)習(xí)部分。
在具體的應(yīng)用中,輸入接口、知識(shí)庫和執(zhí)行部分決定了具體的工作內(nèi)容,學(xué)習(xí)部分所需要解決的問題完全由上述3部分確定。機(jī)器學(xué)習(xí)的過程就是實(shí)踐、認(rèn)識(shí)、再實(shí)踐、再認(rèn)識(shí)的一個(gè)循環(huán)往復(fù)的過程。機(jī)器學(xué)習(xí)系統(tǒng)就是一個(gè)神經(jīng)網(wǎng)絡(luò),同時(shí)它也是一個(gè)神經(jīng)元。
圖1
圖2
由于機(jī)器學(xué)習(xí)系統(tǒng)獲得的數(shù)據(jù)是不完全的,所以學(xué)習(xí)系統(tǒng)所進(jìn)行的推理并不完全是可靠的,它總結(jié)出來的規(guī)則可能正確,也可能不正確。這要通過執(zhí)行效果加以檢驗(yàn),正確的規(guī)則能使系統(tǒng)的效能提高,應(yīng)予保留;不正確的規(guī)則應(yīng)予修改或從數(shù)據(jù)庫中刪除。我們投入了大量的精力在檢驗(yàn)執(zhí)行效果方面,不斷調(diào)整、增加和刪除設(shè)定的規(guī)則,最終得到了預(yù)期的效果。
圖3
圖4
圖5
圖6
圖7
此項(xiàng)研究歷時(shí)三年,機(jī)器學(xué)習(xí)系統(tǒng)利用數(shù)千臺(tái)風(fēng)電機(jī)組的海量數(shù)據(jù),經(jīng)過無數(shù)次的學(xué)習(xí),不斷調(diào)整、增加和刪除之前設(shè)定的規(guī)則,同時(shí)還有效避免了由于過度學(xué)習(xí)造成效果偏差的問題。
在此項(xiàng)研究過程中,發(fā)現(xiàn)我國風(fēng)電機(jī)組功率曲線方面普遍存在以下特征:由SCADA系統(tǒng)采集的風(fēng)速數(shù)據(jù)普遍存在修正過度問題,初步統(tǒng)計(jì)在70%以上;由SCADA系統(tǒng)采集的有功功率數(shù)據(jù)基本符合實(shí)際;制造商提供的投標(biāo)功率曲線數(shù)據(jù)在額定風(fēng)速的確定方面差異很大,普遍存在偏離理論值較多問題,初步統(tǒng)計(jì)70%左右存在較大偏差;80%左右機(jī)組在實(shí)際運(yùn)行中存在超銘牌現(xiàn)象,一般在2~4%,個(gè)別機(jī)組達(dá)到10%以上。
下面在系統(tǒng)海量數(shù)據(jù)中隨機(jī)提取部分功率曲線散點(diǎn)圖分析其主要特征。
圖一主要特征:風(fēng)速數(shù)據(jù)未過度修正;額定風(fēng)速稍有未偏離理論值;實(shí)際運(yùn)行有超銘牌出力現(xiàn)象,超出6.7%左右;存在大量限負(fù)荷運(yùn)行狀態(tài)。
圖二主要特征:風(fēng)速數(shù)據(jù)過度修正,最大值2.5米左右;額定風(fēng)速基本未偏離理論值;實(shí)際運(yùn)行未達(dá)到銘牌出力,低3%左右;存在較多限負(fù)荷運(yùn)行狀態(tài)。
圖三主要特征:風(fēng)速數(shù)據(jù)過度修正,最大值1米左右;額定風(fēng)速嚴(yán)重偏離理論值1米以上;實(shí)際運(yùn)行中超銘牌3%左右;存在大量的停機(jī)和限負(fù)荷運(yùn)行狀態(tài)。
圖四主要特征:風(fēng)速數(shù)據(jù)未過度修正;額定風(fēng)速稍有偏離理論值,不是特別嚴(yán)重;實(shí)際運(yùn)行中超銘牌5%左右;幾乎沒有停機(jī)和限負(fù)荷運(yùn)行狀態(tài)。
圖五主要特征:風(fēng)速數(shù)據(jù)過度修正,最大值1米左右;額定風(fēng)速稍有偏離理論值,不是特別嚴(yán)重;實(shí)際運(yùn)行中不存在超銘牌現(xiàn)象;有少量停機(jī)狀態(tài)。
圖六主要特征:風(fēng)速數(shù)據(jù)未過度修正;額定風(fēng)速稍有偏離理論值,不是特別嚴(yán)重;實(shí)際運(yùn)行中超銘牌4%左右;幾乎沒有停機(jī)和限負(fù)荷運(yùn)行狀態(tài)。
圖七主要特征:風(fēng)速數(shù)據(jù)過度修正,最大值1.5米以上;額定風(fēng)速稍有偏離理論值,不是特別嚴(yán)重;實(shí)際運(yùn)行中超銘牌2%左右;有少量停機(jī)狀態(tài)。
圖八主要特征:風(fēng)速數(shù)據(jù)過度修正,最大值2米左右;額定風(fēng)速稍有偏離理論值,不是特別嚴(yán)重;實(shí)際運(yùn)行中不存在超銘牌現(xiàn)象;幾乎沒有停機(jī)狀態(tài),有大量限負(fù)荷運(yùn)行狀態(tài)。
圖九主要特征:風(fēng)速數(shù)據(jù)未過度修正,最大值0.5米以內(nèi);額定風(fēng)速幾乎沒有偏離理論值;實(shí)際運(yùn)行中存在較小的超銘牌現(xiàn)象;幾乎沒有停機(jī)和限負(fù)荷運(yùn)行狀態(tài)。
圖十主要特征:風(fēng)速數(shù)據(jù)過度反向修正,最大值2米左右;額定風(fēng)速?zèng)]有嚴(yán)重偏離理論值;實(shí)際運(yùn)行中存在較小的超銘牌現(xiàn)象,2%左右;存在部分停機(jī)和限負(fù)荷狀態(tài)。
圖十一主要特征:風(fēng)速數(shù)據(jù)未過度反向修正;額定風(fēng)速?zèng)]有嚴(yán)重偏離理論值;實(shí)際運(yùn)行中存在嚴(yán)重超銘牌現(xiàn)象,最大值超過15%;存在部分停機(jī)和限負(fù)荷狀態(tài)。
圖8
圖9
根據(jù)上述功率曲線散點(diǎn)圖的主要特征,可以得出如下初步結(jié)論:制造商提供的功率曲線額定風(fēng)速偏離理論值較大的問題,造成理論與實(shí)際的巨大偏差,給功率曲線理論研究工作帶來困難,此項(xiàng)研究有效解決了這一難題;風(fēng)電機(jī)組風(fēng)速數(shù)據(jù)過度修正和超銘牌運(yùn)行現(xiàn)象嚴(yán)重,初步分析,認(rèn)為是風(fēng)電機(jī)組制造商為了滿足用戶考核要求采取的補(bǔ)救措施。同時(shí),這種現(xiàn)象的嚴(yán)重程度側(cè)面反映出我國風(fēng)電機(jī)組制造水平有待進(jìn)一步提高。
圖10
圖11
之所以說是初步結(jié)論,是由于以上結(jié)論是基于數(shù)千臺(tái)風(fēng)電機(jī)組部分時(shí)間段數(shù)據(jù)得到的,面對(duì)我國11萬臺(tái)風(fēng)電機(jī)組的規(guī)模,還需要大量的研究和驗(yàn)證工作,以便得出更可靠的結(jié)論。但是,此項(xiàng)研究的的客觀性和科學(xué)性是毋庸置疑的,機(jī)器學(xué)習(xí)算法確實(shí)在此項(xiàng)研究過程中發(fā)揮了巨大的威力,幫助我們發(fā)現(xiàn)了一些重要的規(guī)律和結(jié)論,從另一個(gè)側(cè)面看清了我國風(fēng)電行業(yè)發(fā)展的現(xiàn)狀和存在的問題,能夠在風(fēng)電機(jī)組的制造和運(yùn)維方面提供一些進(jìn)一步改進(jìn)的方法和思路。