趙興安
(大唐可再生能源試驗(yàn)研究院有限公司,北京市 西城區(qū) 100052)
隨著新一代信息技術(shù)的創(chuàng)新驅(qū)動(dòng)發(fā)展,我國工業(yè)互聯(lián)網(wǎng)發(fā)展迅速,但同時(shí)工業(yè)互聯(lián)網(wǎng)面臨著數(shù)據(jù)孤島、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)安全風(fēng)險(xiǎn)等數(shù)據(jù)治理問題[1-4],需有效提升數(shù)據(jù)治理的規(guī)范化水平。目前國內(nèi)外各大發(fā)電集團(tuán)和風(fēng)機(jī)廠商均已開展新能源大數(shù)據(jù)平臺(tái)建設(shè)[5],在平臺(tái)運(yùn)行過程中積累了大量的生產(chǎn)數(shù)據(jù)和經(jīng)驗(yàn)數(shù)據(jù),隨著數(shù)據(jù)共享以及決策的需求,以及數(shù)據(jù)使用范圍的擴(kuò)大,在使用過程中存在大量數(shù)據(jù)問題[6-8]。中國大唐集團(tuán)新能源監(jiān)控與大數(shù)據(jù)中心于2020年底投入運(yùn)行,截止目前已累計(jì)接入風(fēng)電機(jī)組13 000多臺(tái),光伏發(fā)電容量300多萬kW,實(shí)時(shí)采集測(cè)點(diǎn)600多萬條,每天處理數(shù)據(jù)量達(dá)300 多億條[9]。為確保大數(shù)據(jù)中心的數(shù)據(jù)質(zhì)量以及所需生產(chǎn)指標(biāo)的準(zhǔn)確計(jì)算,需對(duì)采集的數(shù)據(jù)持續(xù)進(jìn)行數(shù)據(jù)治理,保證數(shù)據(jù)的完整性、有效性和一致性,為各風(fēng)電場(chǎng)后續(xù)優(yōu)化提供基礎(chǔ)。
隨著大數(shù)據(jù)技術(shù)和智能化技術(shù)的發(fā)展,數(shù)據(jù)治理技術(shù)逐步滲透到電力企業(yè)。文獻(xiàn)[10]提出電力企業(yè)數(shù)據(jù)治理不能僅采用技術(shù)手段,應(yīng)根據(jù)實(shí)際情況,制定數(shù)據(jù)治理實(shí)現(xiàn)目標(biāo),成立專業(yè)組織,健全保障機(jī)制及治理體系,持續(xù)開展數(shù)據(jù)治理。文獻(xiàn)[11]提出了一種電力企業(yè)實(shí)時(shí)數(shù)據(jù)治理框架解決方案,可為企業(yè)數(shù)據(jù)治理工作提供數(shù)據(jù)連通、數(shù)據(jù)建模、數(shù)據(jù)運(yùn)行和數(shù)據(jù)服務(wù)等方面的功能。文獻(xiàn)[12]提出一種基于數(shù)據(jù)全生命周期管理的電網(wǎng)企業(yè)數(shù)據(jù)治理方案,通過部署數(shù)據(jù)技術(shù)支撐平臺(tái)、規(guī)范數(shù)據(jù)資源管理、制定數(shù)據(jù)管理規(guī)范、構(gòu)建元數(shù)據(jù)質(zhì)量管控體系等,從數(shù)據(jù)全生命周期的各環(huán)節(jié)把控?cái)?shù)據(jù)質(zhì)量,解決數(shù)據(jù)多口徑差異問題。文獻(xiàn)[13]針對(duì)電力大數(shù)據(jù)的治理問題,設(shè)計(jì)了適用于電力企業(yè)的相關(guān)數(shù)據(jù)治理體系,有效提高電力企業(yè)的精細(xì)化管理和科學(xué)決策水平。文獻(xiàn)[14]針對(duì)電力企業(yè)風(fēng)電設(shè)備可靠性指標(biāo)數(shù)據(jù)中存在的質(zhì)量問題,建立企業(yè)風(fēng)電設(shè)備可靠性評(píng)估模型,并對(duì)治理前后的相關(guān)指標(biāo)數(shù)據(jù)結(jié)果進(jìn)行對(duì)比分析,說明數(shù)據(jù)治理的必要性和有效性。
本文針對(duì)發(fā)電企業(yè)建立的企業(yè)級(jí)數(shù)據(jù)中心在風(fēng)電數(shù)據(jù)價(jià)值挖掘、數(shù)據(jù)質(zhì)量提升以及管理落實(shí)過程中存在的問題,依據(jù)中國大唐集團(tuán)新能源監(jiān)控與大數(shù)據(jù)中心中間層數(shù)據(jù)接收、存儲(chǔ)規(guī)范及現(xiàn)有應(yīng)用系統(tǒng)特性,提出一種基于數(shù)據(jù)標(biāo)準(zhǔn)化的風(fēng)電數(shù)據(jù)治理體系,通過建立集團(tuán)級(jí)新能源生產(chǎn)數(shù)據(jù)標(biāo)準(zhǔn)化體系,固化在云端平臺(tái),以統(tǒng)一和規(guī)范的數(shù)據(jù)采集規(guī)約和協(xié)議,將數(shù)據(jù)采集至邊緣計(jì)算服務(wù)器,打通系統(tǒng)各個(gè)環(huán)節(jié)和各個(gè)業(yè)務(wù)的交互,實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一的管理和數(shù)據(jù)之間的共享。
本文在借鑒通用數(shù)據(jù)治理框架[15-16]的基礎(chǔ)上,結(jié)合風(fēng)電大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)源、數(shù)據(jù)特點(diǎn)及業(yè)務(wù)場(chǎng)景等核心要素,搭建針對(duì)風(fēng)電大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)治理架構(gòu),如圖1所示,其核心內(nèi)容包括數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)全過程周期管理、數(shù)據(jù)安全等,此外還需要有規(guī)章制度和組織機(jī)構(gòu)的保障,以及數(shù)據(jù)管理的流程和IT 技術(shù)平臺(tái)的支撐。
圖1 風(fēng)電數(shù)據(jù)治理架構(gòu)Fig.1 Wind power data governance architecture
圍繞風(fēng)電數(shù)據(jù)治理架構(gòu),明確各級(jí)主體單位在數(shù)據(jù)治理中的職責(zé),對(duì)風(fēng)電數(shù)據(jù)建立標(biāo)準(zhǔn),統(tǒng)一數(shù)據(jù)治理流程,搭建數(shù)據(jù)治理平臺(tái),編制數(shù)據(jù)治理相關(guān)制度,建立數(shù)據(jù)治理組織,逐步建立完整的數(shù)據(jù)治理管理體系,為企業(yè)數(shù)據(jù)質(zhì)量的提升奠定基礎(chǔ)。
數(shù)據(jù)質(zhì)量管理不僅要保障數(shù)據(jù)的完整性、準(zhǔn)確性、及時(shí)性以及一致性,而且還包括問題追蹤和合規(guī)性監(jiān)控[17-18]。本文從評(píng)估、指標(biāo)、對(duì)象三個(gè)維度對(duì)風(fēng)電數(shù)據(jù)質(zhì)量進(jìn)行管理,如圖2所示。最終通過數(shù)據(jù)覆蓋率、數(shù)據(jù)完整率、數(shù)據(jù)有效率、通信正常率和數(shù)據(jù)一致率5個(gè)指標(biāo)實(shí)時(shí)掌握數(shù)據(jù)質(zhì)量的整體狀態(tài),定位數(shù)據(jù)質(zhì)量較差的區(qū)域、風(fēng)場(chǎng)、機(jī)組。
圖2 風(fēng)電數(shù)據(jù)質(zhì)量管理Fig.2 Wind power data quality management
2.1.1 數(shù)據(jù)覆蓋率
數(shù)據(jù)覆蓋率指實(shí)際采集的數(shù)據(jù)元素對(duì)預(yù)期采集數(shù)據(jù)元素的覆蓋程度。單臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)覆蓋率為
式中:A為單臺(tái)風(fēng)電機(jī)組數(shù)據(jù)覆蓋率;M為實(shí)際采集數(shù)據(jù)點(diǎn)數(shù)量;N1為標(biāo)準(zhǔn)化采集點(diǎn)表規(guī)范要求數(shù)據(jù)點(diǎn)數(shù)量。
2.1.2 數(shù)據(jù)完整率
數(shù)據(jù)完整率指特定采樣時(shí)間范圍內(nèi)和所有期望屬性上采集非空值數(shù)據(jù)元素?cái)?shù)情況。單臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)完整率為
式中:B為單臺(tái)風(fēng)電機(jī)組數(shù)據(jù)完整率;L為空值點(diǎn)數(shù);N2為標(biāo)準(zhǔn)點(diǎn)數(shù)(以10 min為1個(gè)數(shù)據(jù)點(diǎn)進(jìn)行計(jì)算,每天144個(gè)數(shù)據(jù)點(diǎn);T為采集數(shù)據(jù)時(shí)間;S為采集風(fēng)機(jī)數(shù)量,S=1。
2.1.3 數(shù)據(jù)有效率
數(shù)據(jù)有效率指特定采樣時(shí)間范圍內(nèi)和所有期望屬性上采集有效數(shù)據(jù)元素情況。單臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)有效率為
式中:C為單臺(tái)風(fēng)電機(jī)組數(shù)據(jù)有效率;K為無效數(shù)據(jù)點(diǎn)數(shù),主要包括空值、錯(cuò)誤、不刷新等。
2.1.4 通信正常率
通信正常率指特定采樣時(shí)間范圍內(nèi)通信狀態(tài)正常下數(shù)據(jù)元素?cái)?shù)情況。單臺(tái)風(fēng)電機(jī)組的通信正常率為
式中:D為單臺(tái)風(fēng)電機(jī)組通信正常率;P為風(fēng)機(jī)與平臺(tái)中斷通訊時(shí)長;Q為標(biāo)準(zhǔn)通訊時(shí)長(以秒為單位進(jìn)行計(jì)算)。
2.1.5 數(shù)據(jù)一致率
數(shù)據(jù)一致率指多個(gè)系統(tǒng)內(nèi)相同測(cè)點(diǎn)數(shù)據(jù)值保持一致的數(shù)據(jù)元素情況。單臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)一致率為
式中:E為單臺(tái)風(fēng)電機(jī)組數(shù)據(jù)一致率;R為多個(gè)系統(tǒng)內(nèi)相同測(cè)點(diǎn)、同一時(shí)標(biāo)、同一時(shí)刻數(shù)據(jù)值保持一致的元素個(gè)數(shù);U為預(yù)期數(shù)據(jù)元素?cái)?shù)量。
式(1)—(5)為單臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)質(zhì)量指標(biāo)計(jì)算方法,若計(jì)算平臺(tái)整體、區(qū)域集控、單一風(fēng)場(chǎng)或同一機(jī)型等情況,則為
式中:X為平臺(tái)整體、區(qū)域集控、單一風(fēng)場(chǎng)或同一機(jī)型數(shù)據(jù)質(zhì)量指標(biāo)情況;n為指定風(fēng)電機(jī)組數(shù)量;F(i)為第i臺(tái)風(fēng)電機(jī)組的數(shù)據(jù)質(zhì)量指標(biāo)(數(shù)據(jù)覆蓋率、數(shù)據(jù)完整率、數(shù)據(jù)有效率、通信正常率或數(shù)據(jù)一致率)。
目前平臺(tái)將數(shù)據(jù)質(zhì)量衡量指標(biāo)精度等級(jí)劃分為優(yōu)、良、中、差,并根據(jù)不同等級(jí)對(duì)所采集的數(shù)據(jù)進(jìn)行評(píng)價(jià),詳見表1。
表1 數(shù)據(jù)質(zhì)量精度等級(jí)劃分Tab l e1Classification of data quality accuracy
風(fēng)電數(shù)據(jù)標(biāo)準(zhǔn)化是數(shù)據(jù)治理體系的基礎(chǔ),是保障、改進(jìn)和提升數(shù)據(jù)質(zhì)量的重要措施。通過對(duì)29個(gè)風(fēng)機(jī)廠家,累計(jì)155種機(jī)型的數(shù)據(jù)進(jìn)行綜合分析,參考國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn),結(jié)合業(yè)務(wù)系統(tǒng)現(xiàn)狀,制定每種機(jī)型唯一標(biāo)準(zhǔn)的點(diǎn)表和映射邏輯,規(guī)范統(tǒng)一兩級(jí)中心風(fēng)電數(shù)據(jù)接入方式、狀態(tài)映射邏輯、設(shè)備測(cè)點(diǎn)點(diǎn)表、事件信息等,建立風(fēng)電生產(chǎn)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)化體系,如圖3所示。區(qū)域集控中心同步開展風(fēng)電數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè),保證上送數(shù)據(jù)統(tǒng)一規(guī)范。
圖3 新能源生產(chǎn)數(shù)據(jù)標(biāo)準(zhǔn)化體系Fig.3 New energy production data standardization system
受限于主控通訊協(xié)議不對(duì)外開放、集控廠家技術(shù)水平不同、區(qū)域集控功能需求不同等原因,風(fēng)電機(jī)組數(shù)據(jù)采集方式較多,本文對(duì)行業(yè)內(nèi)典型機(jī)型數(shù)據(jù)采集方式進(jìn)行總結(jié),詳見表2。
表2 風(fēng)電機(jī)組數(shù)據(jù)采集方式Table 2 Wind turbine data collection method
平臺(tái)形成一套有體系、有標(biāo)準(zhǔn)的采集方式,各區(qū)域集控統(tǒng)一采用可編程邏輯控制器(programmable logic controller,PLC)直采或數(shù)據(jù)采集與監(jiān)控系統(tǒng)(supervisory control and data acquisition,SCADA)服務(wù)器轉(zhuǎn)發(fā)的方式,按照標(biāo)準(zhǔn)化采集點(diǎn)表,實(shí)現(xiàn)風(fēng)電數(shù)據(jù)標(biāo)準(zhǔn)化采集,屏蔽不同機(jī)組底層數(shù)據(jù)差異、通訊協(xié)議差異,使采集的數(shù)據(jù)全面、準(zhǔn)確、穩(wěn)定,為機(jī)組數(shù)據(jù)分析、故障診斷等提供先決條件。
3.2.1 測(cè)點(diǎn)標(biāo)準(zhǔn)化
新能源監(jiān)控與大數(shù)據(jù)中心目前共計(jì)接入29個(gè)廠家、155種機(jī)型。由于主控、變槳、變流器等硬件和軟件版本不同,集控廠家數(shù)據(jù)接入技術(shù)差異,機(jī)組定制化升級(jí)及改造等原因,同種機(jī)型點(diǎn)表測(cè)點(diǎn)數(shù)量、點(diǎn)名等差異性較大,平臺(tái)接入配置映射版本高達(dá)348種,如圖4所示。
圖4 平臺(tái)已接入機(jī)型和配置映射版本數(shù)量Fig.4 Number of connected models and configuration mapping versions of the platform
基于以上情況,以中國大唐集團(tuán)風(fēng)電數(shù)據(jù)采集測(cè)點(diǎn)及編碼技術(shù)規(guī)范為基礎(chǔ),按照機(jī)型技術(shù)路線,制定直驅(qū)、半直驅(qū)和雙饋機(jī)型通用點(diǎn)表,明確影響指標(biāo)計(jì)算測(cè)點(diǎn)(基采點(diǎn))以及影響平臺(tái)各項(xiàng)功能應(yīng)用測(cè)點(diǎn)(必采點(diǎn))范圍,規(guī)范測(cè)點(diǎn)名稱及映射關(guān)系,見表3,各區(qū)域集控按照標(biāo)準(zhǔn)化點(diǎn)表,實(shí)現(xiàn)風(fēng)電數(shù)據(jù)的全量采集與轉(zhuǎn)發(fā)。
表3 標(biāo)準(zhǔn)化點(diǎn)表Table 3 Standardization point table
續(xù)表
3.2.2 通道標(biāo)準(zhǔn)化
為保證各區(qū)域集控上送的風(fēng)電數(shù)據(jù)頻率滿足集團(tuán)大數(shù)據(jù)監(jiān)控平臺(tái)的要求,各區(qū)域集控通過104規(guī)約進(jìn)行數(shù)據(jù)轉(zhuǎn)發(fā)。在2002版標(biāo)準(zhǔn)104規(guī)約的基礎(chǔ)上,通過將遙測(cè)數(shù)據(jù)的信息體地址范圍進(jìn)行擴(kuò)展解析,為4 001H~6 000H,即最多可接收8 192個(gè)遙測(cè)數(shù)據(jù)。單個(gè)104轉(zhuǎn)發(fā)通道的數(shù)據(jù)量按照表4進(jìn)行轉(zhuǎn)發(fā)。
表4 單個(gè)104轉(zhuǎn)發(fā)通道數(shù)據(jù)量Table 4 Data volume of a single 104 forwarding channel
單個(gè)104轉(zhuǎn)發(fā)通道的數(shù)據(jù)量轉(zhuǎn)發(fā)規(guī)則為:
(1) 單通道轉(zhuǎn)發(fā)遙測(cè)(8 192)、遙信(16 384)、遙脈(512)點(diǎn),單通道機(jī)組數(shù)量不超過33臺(tái)。如果轉(zhuǎn)發(fā)通道測(cè)點(diǎn)數(shù)超過上述要求,應(yīng)另開轉(zhuǎn)發(fā)端口通道,并將一部分機(jī)組更換到另一個(gè)轉(zhuǎn)發(fā)端口通道調(diào)整。
(2) 同一臺(tái)機(jī)組的所有測(cè)點(diǎn)必須在同一個(gè)通道里面。每臺(tái)機(jī)組的所有測(cè)點(diǎn),應(yīng)集中轉(zhuǎn)發(fā)。在制作轉(zhuǎn)發(fā)點(diǎn)表時(shí),應(yīng)對(duì)每臺(tái)機(jī)組中預(yù)留不少于40個(gè)備用測(cè)點(diǎn)。
(3) 轉(zhuǎn)發(fā)點(diǎn)表調(diào)整應(yīng)在不影響原有測(cè)點(diǎn)數(shù)據(jù)的原則下進(jìn)行調(diào)整。
3.3.1 狀態(tài)映射統(tǒng)一
平臺(tái)基于IEC61400標(biāo)準(zhǔn),規(guī)定了手動(dòng)停機(jī)、故障停機(jī)、環(huán)境待命、正常發(fā)電、降出力運(yùn)行、技術(shù)待命、電網(wǎng)故障、維護(hù)狀態(tài)和未知狀態(tài)9種標(biāo)準(zhǔn)狀態(tài)定義,本文對(duì)以上9種標(biāo)準(zhǔn)狀態(tài)的詳細(xì)工況進(jìn)行了說明,詳見表5。各區(qū)域集控按照9種標(biāo)準(zhǔn)狀態(tài)將不同機(jī)型的風(fēng)機(jī)狀態(tài)轉(zhuǎn)發(fā)大數(shù)據(jù)平臺(tái)。
表5 標(biāo)準(zhǔn)狀態(tài)工況定義表Table 5 Definition of standard conditions
為提高狀態(tài)判定的準(zhǔn)確性,在此基礎(chǔ)上通過增加槳葉角度、有功功率、遙信信號(hào)等輔助判據(jù),形成各機(jī)型標(biāo)準(zhǔn)狀態(tài)映射判斷邏輯推薦表。本文給出以下示例供參考。
(1) 一維映射。
某型號(hào)機(jī)組定義了16種不同的狀態(tài),且16種狀態(tài)均可映射至9種標(biāo)準(zhǔn)狀態(tài),此時(shí),對(duì)于標(biāo)準(zhǔn)狀態(tài)的判斷,應(yīng)直接選擇進(jìn)行一維映射。其狀態(tài)映射關(guān)系詳見圖5。
圖5 一維映射示例圖Fig.5 Example diagram of one-dimensional mapping
(2) 二維映射。
某些型號(hào)機(jī)組狀態(tài)數(shù)量小于9種標(biāo)準(zhǔn)狀態(tài),此時(shí)應(yīng)使用機(jī)組事件來輔助進(jìn)行機(jī)組狀態(tài)的映射。二維映射示例詳見圖6。
圖6 二維映射示例圖Fig.6 Example diagram of two-dimensional mapping
如圖6所示,廠家狀態(tài)為“停機(jī)”,機(jī)組事件為“電網(wǎng)電壓超高”,此時(shí)的標(biāo)準(zhǔn)狀態(tài)應(yīng)判定為“電網(wǎng)故障”;機(jī)組事件為“環(huán)境溫度高”,標(biāo)準(zhǔn)狀態(tài)應(yīng)判定為“環(huán)境待命”;機(jī)組事件為“變槳安全鏈觸發(fā)”,標(biāo)準(zhǔn)狀態(tài)應(yīng)判定為“故障停機(jī)”;機(jī)組事件為“塔底急停按鈕動(dòng)作”,標(biāo)準(zhǔn)狀態(tài)應(yīng)判定為“維護(hù)狀態(tài)”。
(3) 狀態(tài)輔助判定功能。
由于廠家提供的機(jī)組狀態(tài)以及機(jī)組事件信息的完整性不足,即使在進(jìn)行了二維映射之后,仍有部分標(biāo)準(zhǔn)狀態(tài)無法進(jìn)行映射時(shí),應(yīng)根據(jù)需要增加狀態(tài)輔助判定。例如在廠家狀態(tài)為“待機(jī)”時(shí),如果此時(shí)機(jī)組的實(shí)際風(fēng)速大于切入風(fēng)速,則此時(shí)機(jī)組的標(biāo)準(zhǔn)狀態(tài)會(huì)被判定為“技術(shù)待命”,反之,則會(huì)被判定為“環(huán)境待命”。狀態(tài)輔助判定示例詳見圖7。
圖7 狀態(tài)輔助判定示例Fig.7 Example of state auxiliary determination
3.3.2 通訊狀態(tài)統(tǒng)一
平臺(tái)規(guī)定機(jī)組標(biāo)準(zhǔn)通訊狀態(tài)為通訊正常、數(shù)據(jù)中斷、未接入和停運(yùn)機(jī)組,并進(jìn)一步規(guī)定通訊中斷的二級(jí)通訊狀態(tài),數(shù)據(jù)中斷的原因應(yīng)識(shí)別通訊鏈路故障、源數(shù)據(jù)卡死、機(jī)組斷電,從機(jī)組到平臺(tái)通訊鏈路中各段節(jié)點(diǎn)的中斷狀態(tài)。本文針對(duì)平臺(tái)的標(biāo)準(zhǔn)通訊狀態(tài)定義進(jìn)行了說明,詳見表6。
表6 通訊狀態(tài)定義表Table 6 Definition of communication status
同一機(jī)型事件等級(jí)、部件系統(tǒng)類別、中文描述應(yīng)規(guī)范統(tǒng)一。平臺(tái)將事件等級(jí)分為故障、告警、信息三類,其中故障會(huì)導(dǎo)致風(fēng)機(jī)停運(yùn),告警和提示則不會(huì)導(dǎo)致停機(jī),各區(qū)域集控按照分類標(biāo)準(zhǔn),明確事件等級(jí)。事件描述采用中文描述,規(guī)定并統(tǒng)一機(jī)組部件系統(tǒng)共17種類別,包括主控系統(tǒng)、偏航系統(tǒng)、變槳系統(tǒng)、變槳機(jī)構(gòu)、變流系統(tǒng)、葉片、發(fā)電機(jī)、齒輪箱、聯(lián)軸器、機(jī)械制動(dòng)、主軸、塔架/基礎(chǔ)、安全鏈節(jié)點(diǎn)、防雷系統(tǒng)、消防系統(tǒng)、通訊系統(tǒng)、SCADA 系統(tǒng),事件信息按照類別歸類并分析。
依據(jù)制定的標(biāo)準(zhǔn)點(diǎn)表等規(guī)范,作為標(biāo)準(zhǔn)要求嚴(yán)格執(zhí)行,通過5個(gè)數(shù)據(jù)質(zhì)量指標(biāo)掌控?cái)?shù)據(jù)質(zhì)量整體狀態(tài),定位質(zhì)量異常。自上而下成立數(shù)據(jù)治理組織機(jī)構(gòu)、明確相應(yīng)責(zé)任人,落實(shí)工作職責(zé)。建立健全業(yè)務(wù)界面分工及信息報(bào)送方式,保證工作信息及時(shí)溝通和交流,積極推動(dòng)工作的有效落實(shí)。定期開展數(shù)據(jù)質(zhì)量驗(yàn)收工作,實(shí)施循環(huán)治理、鞏固治理成效。
大數(shù)據(jù)中心統(tǒng)一導(dǎo)出大數(shù)據(jù)平臺(tái)配置的映射點(diǎn)表,主要為風(fēng)機(jī)測(cè)點(diǎn)、風(fēng)機(jī)廠家狀態(tài)、風(fēng)機(jī)事件相關(guān)信息以及與轉(zhuǎn)發(fā)測(cè)點(diǎn)映射關(guān)系表,按照風(fēng)電場(chǎng)、解析方式等進(jìn)行匯總整理,發(fā)送至區(qū)域集控,集控?cái)?shù)據(jù)治理人員核對(duì)下發(fā)文件正確性,并對(duì)不符合數(shù)據(jù)標(biāo)準(zhǔn)化體系的風(fēng)機(jī)數(shù)據(jù)按照相關(guān)要求進(jìn)行重新配置,保證風(fēng)機(jī)數(shù)據(jù)按照風(fēng)電數(shù)據(jù)標(biāo)準(zhǔn)化體系要求進(jìn)行采集與傳輸。
依據(jù)平臺(tái)標(biāo)準(zhǔn)化測(cè)點(diǎn)映射表,對(duì)集控中心上報(bào)的風(fēng)機(jī)點(diǎn)表和升壓站點(diǎn)表中的必要測(cè)點(diǎn)進(jìn)行核對(duì)檢查,集控中心轉(zhuǎn)發(fā)大數(shù)據(jù)平臺(tái)測(cè)點(diǎn)必須滿足指標(biāo)所需測(cè)點(diǎn)及必要測(cè)點(diǎn)要求??紤]到不同廠家、機(jī)型或主控系統(tǒng)等的差別,部分機(jī)組未采集到的數(shù)據(jù)點(diǎn)需進(jìn)行加裝傳感器補(bǔ)全。
數(shù)據(jù)一致性指風(fēng)場(chǎng)SCADA 系統(tǒng)、集控側(cè)監(jiān)控平臺(tái)及大數(shù)據(jù)平臺(tái)測(cè)點(diǎn)數(shù)據(jù)一致。每個(gè)風(fēng)電場(chǎng)每個(gè)機(jī)型每個(gè)主控版本抽測(cè)3臺(tái)(首、尾、中間各1臺(tái)),進(jìn)行測(cè)點(diǎn)一致性核查;升壓站選定每個(gè)升壓站,進(jìn)行測(cè)點(diǎn)一致性核查。選定設(shè)備的全部必采點(diǎn)、基采點(diǎn)(不包含風(fēng)機(jī)狀態(tài)、風(fēng)機(jī)事件測(cè)點(diǎn))。對(duì)同一時(shí)標(biāo)下的、集控平臺(tái)與大數(shù)據(jù)平臺(tái)的測(cè)點(diǎn)數(shù)據(jù)進(jìn)行核對(duì),同一時(shí)標(biāo)下風(fēng)場(chǎng)SCADA系統(tǒng)、區(qū)域集控與大數(shù)據(jù)平臺(tái)的數(shù)據(jù)值保持一致,即可認(rèn)為相應(yīng)測(cè)點(diǎn)在2個(gè)系統(tǒng)內(nèi)的數(shù)據(jù)一致性完好。此外,部分測(cè)點(diǎn)數(shù)據(jù)實(shí)時(shí)變化趨勢(shì)并不明顯,采用一定時(shí)間周期內(nèi)的統(tǒng)計(jì)結(jié)果數(shù)據(jù)進(jìn)行核對(duì),如場(chǎng)站發(fā)電量、風(fēng)機(jī)發(fā)電量等。
使用平臺(tái)采樣數(shù)據(jù)質(zhì)量監(jiān)控模塊進(jìn)行分析采樣數(shù)據(jù)的完整性和有效性,對(duì)采樣數(shù)據(jù)完整率和有效性偏低的機(jī)組進(jìn)行分析與治理。通過平臺(tái)導(dǎo)出歷史數(shù)據(jù),查找不合格數(shù)據(jù)的時(shí)間段,并查看同一時(shí)間段風(fēng)機(jī)所處的狀態(tài)和事件,綜合分析問題原因,經(jīng)實(shí)際運(yùn)行與總結(jié),可能的原因有通訊中斷、數(shù)據(jù)未正常轉(zhuǎn)發(fā),數(shù)據(jù)長時(shí)間死數(shù)、數(shù)據(jù)值不合理等因素,需要通過查看數(shù)據(jù)接收與數(shù)據(jù)轉(zhuǎn)發(fā)端的通訊狀態(tài),數(shù)據(jù)源側(cè)轉(zhuǎn)發(fā)數(shù)據(jù)的合理性的手段進(jìn)行問題排查。
核查大數(shù)據(jù)平臺(tái)配置表與收資表是否一致,如不一致查找原因并解決問題,更新收資表或重新配置;將大數(shù)據(jù)平臺(tái)整理后的收資表反饋至區(qū)域集控,核對(duì)大數(shù)據(jù)平臺(tái)與集控中心顯示記錄的風(fēng)機(jī)事件一致性;區(qū)域集控根據(jù)核對(duì)情況修改,做好收資表變更記錄,并上報(bào)收資表及記錄;將最終風(fēng)機(jī)事件代碼表在平臺(tái)中進(jìn)行配置。
核查大數(shù)據(jù)平臺(tái)配置表與收資表是否一致,如不一致查找原因并解決問題,更新收資表或重新配置;將大數(shù)據(jù)平臺(tái)整理后的收資表、風(fēng)機(jī)狀態(tài)映射說明文件反饋至區(qū)域集控,核查風(fēng)機(jī)狀態(tài)映射關(guān)系是否正確;區(qū)域集控核對(duì)大數(shù)據(jù)平臺(tái)與集控中心顯示記錄的風(fēng)機(jī)狀態(tài)一致性,保證每種機(jī)型每個(gè)主控版本的風(fēng)機(jī)9種狀態(tài)全狀態(tài)核對(duì);區(qū)域集控根據(jù)核對(duì)情況修改,做好收資表變更記錄,并上報(bào)收資表及記錄;將最終風(fēng)機(jī)狀態(tài)碼表在平臺(tái)中進(jìn)行配置。
針對(duì)以上數(shù)據(jù)治理排查出的問題,對(duì)問題進(jìn)行整理匯總,按照以下問題分類:測(cè)點(diǎn)覆蓋率、測(cè)點(diǎn)一致性、風(fēng)機(jī)事件、風(fēng)機(jī)狀態(tài)、收資信息、其他問題。在風(fēng)電場(chǎng)問題排查結(jié)束后,根據(jù)問題清單,制定明確的處理計(jì)劃和解決方案,并在問題清單中相關(guān)位置處進(jìn)行標(biāo)注,定期進(jìn)行進(jìn)度跟蹤直至相關(guān)的問題完成閉環(huán)。
平臺(tái)建設(shè)、運(yùn)行過程中大數(shù)據(jù)中心始終開展風(fēng)電數(shù)據(jù)治理工作,于2021年8月開展“大數(shù)據(jù)平臺(tái)數(shù)據(jù)治理百日攻堅(jiān)行動(dòng)”,采用基于數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)化體系的風(fēng)電數(shù)據(jù)治理體系后,數(shù)據(jù)質(zhì)量提升效果顯著,詳見圖8。
圖8 2021年6月至2022年5月份平臺(tái)整體數(shù)據(jù)質(zhì)量指標(biāo)月均情況Fig.8 Monthly average of overall platform data quality indicators from June 2021 to May 2022
由圖8可見,2021年8月前采用常規(guī)數(shù)據(jù)治理方法雖有較好改善,但數(shù)據(jù)完整率、數(shù)據(jù)有效率低于80%,通信正常率低于90%;2021年8月采用本文所述的風(fēng)電數(shù)據(jù)治理體系后,2021年12月達(dá)到較高水平,此后數(shù)據(jù)完整率為90%±2%,數(shù)據(jù)有效率約在85%±2%范圍內(nèi),通信正常率在95%±2%。
本文提出一種基于數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)化體系的風(fēng)電數(shù)據(jù)治理體系,并在大唐集團(tuán)新能源監(jiān)控與大數(shù)據(jù)中心進(jìn)行了部署實(shí)施,初步形成了完整的風(fēng)電數(shù)據(jù)治理體系,包括一個(gè)完整的數(shù)據(jù)治理平臺(tái)及輔助保障措施,制度、管理規(guī)范和技術(shù)標(biāo)準(zhǔn),有效保障數(shù)據(jù)治理。目前數(shù)據(jù)質(zhì)量問題能夠隨時(shí)掌握、及時(shí)發(fā)現(xiàn),缺陷數(shù)據(jù)能夠得到及時(shí)修正;數(shù)據(jù)治理問題及處理情況可追溯、恢復(fù)。通過建設(shè)的數(shù)據(jù)標(biāo)準(zhǔn)化體系,有效提升新能源監(jiān)控與大數(shù)據(jù)中心風(fēng)電數(shù)據(jù)質(zhì)量,為其他企業(yè)級(jí)新能源數(shù)據(jù)中心數(shù)據(jù)治理提供一套可參考的實(shí)際案例。