白星振,隋舒婷,葛磊蛟,朱愛蓮,趙 康,顧志成
(1. 山東科技大學(xué) 電氣與自動化工程學(xué)院,山東 青島 266590;2.國網(wǎng)山東省電力公司 陽谷縣供電公司,山東 聊城 252300;3. 天津大學(xué) 智能電網(wǎng)教育部重點實驗室,天津 300072;4. 青島龍發(fā)熱電有限公司,山東 青島 266317)
風(fēng)能作為一種環(huán)境友好且經(jīng)濟(jì)實用的可再生能源,是國家“碳達(dá)峰、碳中和”的主力軍[1-3]。風(fēng)電場建成投運后,根據(jù)實際運行條件下風(fēng)速和功率數(shù)據(jù)得到的風(fēng)電機(jī)組出力曲線不僅能夠表征風(fēng)電機(jī)組的實際運行情況,也能夠衡量機(jī)組的出力水平[4]。良好的風(fēng)電機(jī)組出力曲線對風(fēng)速和功率數(shù)據(jù)的質(zhì)量有很高要求,但受地理條件、運行環(huán)境、棄風(fēng)限電等多因素影響,風(fēng)電場數(shù)據(jù)采集與監(jiān)視控制(supervisory control and data acquisition,SCADA)系統(tǒng)實時采集的風(fēng)電場運行數(shù)據(jù)常存在較多的奇異數(shù)據(jù),嚴(yán)重影響了風(fēng)速和功率本應(yīng)有的整體分布規(guī)律和對應(yīng)關(guān)系,無法直接用于風(fēng)電機(jī)組的性能分析和風(fēng)電場調(diào)度管理,因此對采集的風(fēng)電場運行數(shù)據(jù)進(jìn)行識別和清洗[4-5]非常必要。
目前,針對風(fēng)速-功率異常數(shù)據(jù)識別和清洗方面,國內(nèi)外學(xué)者進(jìn)行了一些研究。已有的數(shù)據(jù)清洗算法主要存在三類問題。一是奇異數(shù)據(jù)的漏檢,如文獻(xiàn)[4]采用最優(yōu)組內(nèi)方差算法識別異常數(shù)據(jù),但僅能識別位于功率曲線下方的堆積型異常數(shù)據(jù),且需要大量的迭代計算;文獻(xiàn)[5]采用基于密度的局部離群因子算法,能有效識別分散型異常數(shù)據(jù),但不能識別成堆出現(xiàn)的異常數(shù)據(jù)。二是在識別異常數(shù)據(jù)的同時刪除了大量正常運行的數(shù)據(jù),不能保證正常運行數(shù)據(jù)的完整性,如文獻(xiàn)[6]采用四分位法和k-means算法剔除異常數(shù)據(jù),但沒有給出具體的剔除標(biāo)準(zhǔn),會導(dǎo)致正常運行數(shù)據(jù)被誤刪,而且對于不同的棄風(fēng)數(shù)據(jù)簇,聚類算法中k值的選取目前沒有統(tǒng)一的標(biāo)準(zhǔn);文獻(xiàn)[7]基于Copula理論建立了風(fēng)電機(jī)組的等效置信邊界模型,但需要多臺風(fēng)機(jī)運行數(shù)據(jù),數(shù)據(jù)需求量大,且數(shù)據(jù)刪除率高,常出現(xiàn)誤刪。三是清洗效率低下,如文獻(xiàn)[8]建立非線性模型判別異常數(shù)據(jù),但清洗效率低且對樣本數(shù)據(jù)的需求量大;文獻(xiàn)[9]采用四分位法和基于密度的聚類算法確定出越限風(fēng)功率數(shù)據(jù)的識別邊界,但算法本身存在較多控制參數(shù)且數(shù)據(jù)處理速度較慢。
綜上,現(xiàn)有的數(shù)據(jù)清洗算法主要存在數(shù)據(jù)刪除率高、異常數(shù)據(jù)漏檢、清洗效率低等問題。本研究提出一種基于滑動四分位和可行搜索圓(feasible search circle,FSC)算法的異常數(shù)據(jù)清洗方法,該方法首先刪除原始風(fēng)速-功率數(shù)據(jù)中功率小于等于零的數(shù)據(jù),然后利用滑動四分位算法清洗掉位于風(fēng)功率曲線周圍的功率散點,最后利用FSC算法完成分布密集的異常數(shù)據(jù)簇的識別和清洗。實驗結(jié)果表明,本研究所提的基于滑動四分位和FSC算法的清洗方法能夠?qū)崿F(xiàn)多類型異常數(shù)據(jù)的識別和清洗,具有運算簡單、清洗時間短、數(shù)據(jù)刪除率低的優(yōu)點。
標(biāo)準(zhǔn)風(fēng)功率曲線是在標(biāo)準(zhǔn)工況下根據(jù)風(fēng)電機(jī)組設(shè)計參數(shù)計算得出[10],較難體現(xiàn)風(fēng)電機(jī)組的實際運行狀況。實際風(fēng)電場運行環(huán)境下,風(fēng)電機(jī)組SCADA系統(tǒng)采集到的實際風(fēng)功率曲線數(shù)據(jù)主帶周圍分布著大量的異常數(shù)據(jù)點,除了由系統(tǒng)誤差和隨機(jī)誤差等原因產(chǎn)生的少量散點之外,大多數(shù)異常數(shù)據(jù)點是由機(jī)組非正常運行引起的。這些數(shù)據(jù)點一般不能用于功率曲線建立和機(jī)組性能分析,必須進(jìn)行針對性剔除。異常數(shù)據(jù)可根據(jù)其空間分布特征分為兩大類:分散型異常數(shù)據(jù)和堆積型異常數(shù)據(jù)[17]。圖1為我國北方某個風(fēng)電機(jī)組一年內(nèi)的實測風(fēng)速-功率曲線與標(biāo)準(zhǔn)功率曲線對比圖,圖1中(1)、(2)處為分散型異常數(shù)據(jù),(3)、(4)處為堆積型異常數(shù)據(jù)。剔除上述兩大類異常數(shù)據(jù)點之后,保留的數(shù)據(jù)主帶是機(jī)組的常規(guī)發(fā)電狀態(tài)數(shù)據(jù),能較好地反映風(fēng)電機(jī)組的正常工作范圍和出力特性。因此,本研究的目的是實現(xiàn)異常數(shù)據(jù)的有效清洗。
異常數(shù)據(jù)產(chǎn)生的原因及其在風(fēng)功率曲線中存在的形式多樣,目前尚無一個算法實現(xiàn)多類型異常數(shù)據(jù)的完全識別和清洗,因此本研究根據(jù)異常數(shù)據(jù)的空間分布特點,采用滑動四分位算法處理分散型異常數(shù)據(jù),采用FSC算法處理堆積型異常數(shù)據(jù)。
四分位算法[9]通常用于處理分散型異常數(shù)據(jù),該算法需要提前進(jìn)行數(shù)據(jù)分區(qū)且受異常數(shù)據(jù)量的影響較大,一般不能單獨使用。本研究采用的滑動四分位法將滑動窗口[11]與四分位法結(jié)合。設(shè)原始數(shù)據(jù)集為:
W={(v1,p1),(v2,p2),…,(vn,pn)}。
(1)
式中:vi和pi分別表示第i個數(shù)據(jù)樣本的風(fēng)速和功率值,數(shù)據(jù)按照功率升序排列,即pi 1) 計算樣本的第2分位數(shù)即中位數(shù)Q2。 (2) 2) 計算第1、3個分位數(shù)Q1和Q3。Q2將v分為兩部分(Q2不包含在兩部分?jǐn)?shù)據(jù)之內(nèi)),分別計算兩部分的中位數(shù)Q1、Q3。當(dāng)L=4k+3(k=0,1,2,…)時,有 (3) 當(dāng)L=4k+1(k=0,1,2,…)時,有 (4) 3) 計算第1分位數(shù)Q1和第3分位數(shù)Q3之間的差值IQR,稱作四分位距。 IQR=Q3-Q1。 (5) 根據(jù)四分位距確定樣本中數(shù)據(jù)的正常值范圍為[Q1-1.5IQR,Q3+1.5IQR],位于此范圍之外的數(shù)據(jù)稱為異常值。 滑動四分位算法中不同的L和m取值對應(yīng)著不同的數(shù)據(jù)處理精度,通過窗口寬度和步長的設(shè)置,可以保證一次處理的數(shù)據(jù)量,靈活改變算法的精度,可較好地實現(xiàn)風(fēng)功率曲線分散型異常數(shù)據(jù)點的剔除。 經(jīng)過滑動四分位算法初步識別之后,大部分位于風(fēng)功率曲線周圍的無規(guī)律散點被清除,但位于曲線中部的橫向堆積型異常數(shù)據(jù)仍存在,該類數(shù)據(jù)多是由棄風(fēng)限電等原因引起,對于此類異常數(shù)據(jù),本研究提出可行搜索圓數(shù)據(jù)清洗算法。 棄風(fēng)限電是指因當(dāng)?shù)仉娋W(wǎng)接納能力不足、風(fēng)電不穩(wěn)定等原因造成的部分風(fēng)機(jī)被迫降低出力或暫停出力的現(xiàn)象,棄風(fēng)限電產(chǎn)生的原因是多方面的[12-14]。當(dāng)風(fēng)電場發(fā)生棄風(fēng)限電時,風(fēng)電機(jī)組的輸出功率將不再與風(fēng)速呈對應(yīng)關(guān)系,而是被限制在一定范圍內(nèi)。此時,在同一風(fēng)速范圍內(nèi),正常運行時的功率和發(fā)生棄風(fēng)時的功率相差較大,所以通過棄風(fēng)數(shù)據(jù)點偏離正常數(shù)據(jù)點的程度進(jìn)行識別,故提出FSC算法??紤]到正常運行數(shù)據(jù)存在一定的波動范圍,發(fā)展軌跡不是單一的,故選用歐氏距離作為評判標(biāo)準(zhǔn),以搜索圓的半徑閾值作為搜索的邊界值,搜索圓的圓心和半徑確定后,可在搜索圓的范圍內(nèi)對正常數(shù)據(jù)進(jìn)行全方位搜索,極大減少了漏判和誤判率。設(shè)經(jīng)過四分位算法初步處理之后的數(shù)據(jù)樣本集合為: (6) 設(shè)置一個長度為2的可變數(shù)據(jù)窗口[(a1,b1),(a2,b2)],將數(shù)據(jù)集的第一個數(shù)據(jù)點(風(fēng)速數(shù)值最小的)看作正常數(shù)據(jù)點,并將其作為窗口的左端點,即: (7) 將數(shù)據(jù)集的下一個數(shù)據(jù)點放在該數(shù)據(jù)窗口內(nèi),以窗口的左端點為圓心,閾值δ為半徑作圓,判斷數(shù)據(jù)集的下一個數(shù)據(jù)點是否在此圓包含的范圍內(nèi)。若在,則該數(shù)據(jù)點屬于當(dāng)前的數(shù)據(jù)窗口,為正常數(shù)據(jù)點,此時將窗口的左端點取出,用該點作為窗口的新的左端點判斷下一個數(shù)據(jù)點;若不在,則該點距離正常數(shù)據(jù)點較遠(yuǎn),視作異常數(shù)據(jù)點舍棄,繼續(xù)判斷接下來的數(shù)據(jù)點。 FSC算法示意圖如圖2所示,si、sj、sl分別是相鄰的3個數(shù)據(jù)點。假設(shè)si為正常點,則si∈D,D是長度為2的數(shù)據(jù)窗口,檢驗sj時,以si為圓心,δ為半徑作圓,比較si和sj之間的歐氏距離d1和δ之間的大小關(guān)系: (8) 圖2 算法示意圖 (9) 進(jìn)而判斷sj可加入窗口。此時,將si取出,用sj作為窗口的左端點,判斷接下來的數(shù)據(jù)點sl。此時,比較數(shù)據(jù)點sj和sl之間的歐氏距離d2和δ之間的大小關(guān)系, (10) 由圖2可知,sl不可加入窗口,即sj不是棄風(fēng)數(shù)據(jù)點,此時將sl舍去,繼續(xù)用sj判斷下一個數(shù)據(jù)點。 分析風(fēng)電機(jī)組的實際運行情況發(fā)現(xiàn),原始的風(fēng)功率曲線中位于曲線中部的橫向堆積型異常數(shù)據(jù)十分常見,若直接在豎直方向(沿著風(fēng)速變化的方向)使用滑動四分位算法進(jìn)行數(shù)據(jù)清洗,四分位算法的內(nèi)限會受到堆積型異常數(shù)據(jù)的嚴(yán)重影響,不僅無法正確識別異常數(shù)據(jù),還會產(chǎn)生一系列新的異常數(shù)據(jù)點,影響總體的數(shù)據(jù)識別效果,不利于后續(xù)FSC算法半徑閾值的選取,而在水平方向(沿著功率變化的方向)使用滑動四分位算法可避免此類問題?;瑒铀姆治缓虵SC算法的具體步驟如下: 1) 數(shù)據(jù)預(yù)處理。將原始數(shù)據(jù)中風(fēng)速位于切入風(fēng)速和切出風(fēng)速之間而功率小于等于零的數(shù)據(jù)點清除,此類數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為位于曲線底部的橫向密集數(shù)據(jù)帶,如圖1中的(4)處所示; 2) 在水平方向運用滑動四分位算法消除分散型異常數(shù)據(jù)。根據(jù)曲線周圍分散型異常數(shù)據(jù)的分布情況,定義合適寬度和步長的滑動窗口(選取方法見2.4節(jié)),對每個窗口中的數(shù)據(jù)采用四分位算法進(jìn)行識別清洗,可消除功率曲線中的大部分分散型異常數(shù)據(jù),避免了數(shù)據(jù)散點對后續(xù)堆積型異常數(shù)據(jù)的清洗產(chǎn)生干擾,方便FSC算法半徑閾值的確定; 3) 對經(jīng)過滑動四分位算法處理之后的數(shù)據(jù)用FSC算法進(jìn)行二次處理,將數(shù)據(jù)按照風(fēng)速升序順序排列,將第一個數(shù)據(jù)點作為初始圓的圓心,依次沿著風(fēng)速增大的方向進(jìn)行異常點搜索,直至遍歷完所有數(shù)據(jù)點,即可得出正常數(shù)據(jù)集。 滑動四分位和FSC算法流程如圖3所示。 圖3 滑動四分位和FSC算法流程圖 2.4.1 寬度和步長的選取 滑動四分位算法的滑動窗口區(qū)間的寬度和步長的閾值的選取參照式(11): (11) 式中:Num為功率數(shù)據(jù)的總數(shù),L和m需為整數(shù),將風(fēng)功率數(shù)據(jù)進(jìn)行N等分。 2.4.2 半徑閾值的選取 良好的半徑閾值應(yīng)能較完整地識別堆積型異常數(shù)據(jù),半徑閾值的選取依賴于堆積型異常數(shù)據(jù)區(qū)間集合,堆積型異常數(shù)據(jù)區(qū)間的選取參考文獻(xiàn)[6],FSC算法半徑閾值的選取流程如下。 1) 確定閾值所在的區(qū)間[a,c]。求得堆積型異常數(shù)據(jù)區(qū)間集合為Z={U1,U2,…,Um},其中Um={(v1,p1),(v2,p2),…,(vn,pn)},且滿足vi 2) 求區(qū)間[a,c]的中點b,判斷當(dāng)閾值為b時,經(jīng)FSC算法處理之后的數(shù)據(jù)是否含有堆積型異常數(shù)據(jù)。若含有堆積型異常數(shù)據(jù),則半徑閾值的最佳取值位于區(qū)間[a,b],若處理之后的數(shù)據(jù)不含有堆積型異常數(shù)據(jù),則半徑閾值的最佳取值位于區(qū)間[b,c]。 3) 繼續(xù)在區(qū)間內(nèi)進(jìn)行二分搜索,直到找出最佳的半徑閾值,該閾值能基本實現(xiàn)堆積型異常數(shù)據(jù)的清洗。 以北方某風(fēng)電場風(fēng)電機(jī)組數(shù)據(jù)為例,對采用滑動四分位清洗過后的風(fēng)速-功率數(shù)據(jù)進(jìn)行堆積型異常數(shù)據(jù)區(qū)間的判斷,確定半徑閾值過程如圖4所示。 1) 半徑閾值的初始范圍為[200, 600],當(dāng)半徑閾值為600時,FSC算法的處理效果如圖4(a)所示,圖中(1)處仍顯示異常數(shù)據(jù)簇,顯然不滿足清洗要求。 2) 計算初始區(qū)間的中點為400,當(dāng)半徑閾值為400時,FSC算法的清洗效果如圖4(b)所示,仍有部分堆積型異常數(shù)據(jù)清洗不徹底,故可知最佳半徑閾值應(yīng)位于區(qū)間[200, 400]。 3) 計算區(qū)間[200,400]的中點為300,當(dāng)半徑閾值為300時,FSC算法的清洗效果如圖4(c)所示,仍存在少量異常數(shù)據(jù)點,故可知最佳半徑閾值位于區(qū)間[200, 300]。 4) 依次類推,重復(fù)上述步驟,最終取整數(shù)確定半徑閾值為230時,處理效果如圖4(d)所示,處理效果最為合適。 為了更好地說明本研究提出的半徑閾值確定方法的數(shù)據(jù)識別效果,對清洗過后的風(fēng)功率數(shù)據(jù)采用bin算法[15]建模,以均方根誤差(root mean square error,RMSE)和平均絕對誤差(mean absolute error,MAE)作為評價指標(biāo),對比不同半徑閾值的建模誤差大小[16]。其中,每個bin區(qū)間的風(fēng)速和功率均值分別為: (12) (13) 均方根誤差RMSE和平均絕對誤差MAE的計算式分別為: (14) (15) 表1 風(fēng)電機(jī)組等值功率曲線的評價指標(biāo)值 結(jié)合表1和圖4可知,當(dāng)半徑閾值選擇為230時,通過bin算法建模得到的風(fēng)功率曲線最接近于標(biāo)準(zhǔn)的風(fēng)功率曲線,且建模的RMSE和MAE取得最小值。同時,比較圖4(c)和圖4(d)可知,只有少量異常數(shù)據(jù)點存在時,對功率曲線的建模影響很小,故為了方便計算,選取半徑閾值時可取近似。 為了說明本研究所提算法和流程的有效性,選取我國北方某風(fēng)電機(jī)組的實際運行數(shù)據(jù)進(jìn)行實驗驗證,取該風(fēng)電機(jī)組2014年9月—2015年8月、2015年9月—2016年8月、2016年9月—2017年8月共3年的原始數(shù)據(jù),數(shù)據(jù)每10 min記錄一個點。該風(fēng)電機(jī)組的基本參數(shù)為:切入風(fēng)速為3 m/s,切出風(fēng)速為23 m/s,額定功率為1 500 kW,額定風(fēng)速為12 m/s。該風(fēng)電機(jī)組3年間每連續(xù)12個月的原始數(shù)據(jù)如圖5所示。 圖5 實測風(fēng)速-功率散點圖 由圖5可知,該風(fēng)電場的風(fēng)電機(jī)組3年來的風(fēng)功率實測數(shù)據(jù)中存在不同類型的異常數(shù)據(jù),但具體分布位置和數(shù)量有明顯差別。其中,圖5(a)中風(fēng)功率實測數(shù)據(jù)中兩類異常數(shù)據(jù)均比較典型,圖5(b)中風(fēng)功率實測數(shù)據(jù)中主要為分散型異常數(shù)據(jù),圖5(c)中風(fēng)功率實測數(shù)據(jù)中主要為堆積型異常數(shù)據(jù)。 對圖5(a)、5(b)、5(c)風(fēng)電機(jī)組的風(fēng)速-功率實測數(shù)據(jù)運用滑動四分位算法進(jìn)行預(yù)處理,窗口寬度、步長分別取為40、40,41、41,20、20,初步處理效果如圖6所示。 圖6 風(fēng)功率數(shù)據(jù)初步處理效果圖 由圖6可知,原始數(shù)據(jù)經(jīng)過滑動四分位算法首次處理之后,分散型異常數(shù)據(jù)基本被剔除,但位于曲線中部橫向分布的堆積型異常數(shù)據(jù)并未被識別,接下來用FSC算法進(jìn)行下一步處理。按照2.4節(jié)所述最佳閾值的選取規(guī)則,將半徑閾值分別設(shè)置為230、200、120,清洗結(jié)果與原始數(shù)據(jù)對比如圖7所示。由圖7可知,本研究提出FSC算法能夠進(jìn)一步完成堆積型異常數(shù)據(jù)的清洗。 圖7 FSC算法數(shù)據(jù)清洗效果圖 采用本研究所提算法與Thompson tau-四分位算法[17]、LOF算法[18]分別對該風(fēng)電機(jī)組前述數(shù)據(jù)進(jìn)行分析,比較3種算法在清洗效果、數(shù)據(jù)刪除率、清洗時間等方面的差距。對比分析時,Thompson tau-四分位算法的舍棄水平設(shè)置為0.01;為便于比較,LOF算法的鄰域點的個數(shù)為20,且LOF算法的數(shù)據(jù)刪除率設(shè)置為與本研究算法相同。表2統(tǒng)計了3種方法對該機(jī)組3年內(nèi)的數(shù)據(jù)刪除率、清洗效率情況,Thompson tau-四分位算法、LOF算法的數(shù)據(jù)清洗效果分別如圖8、圖9所示。 表2 不同方法的數(shù)據(jù)清洗效果 圖8 Thompson tau-四分位算法清洗效果 圖9 LOF算法清洗效果 由表2可知,3種算法的數(shù)據(jù)刪除率、算法效率存在較大差距,具體表現(xiàn)為: 1) 數(shù)據(jù)刪除率。用本研究算法對2014年9月—2016年8月數(shù)據(jù)進(jìn)行處理,數(shù)據(jù)刪除率分別為7.24%和9.59%,而采用Thompson tau-四分位算法處理,數(shù)據(jù)刪除量分別為21.49%和21.06%,表明Thompson tau-四分位算法在處理這兩年的數(shù)據(jù)時存在過識別現(xiàn)象,一部分正常數(shù)據(jù)被誤刪。結(jié)合圖7(c)和圖8(c)可知,Thompson tau-四分位算法無法準(zhǔn)確識別2016年9月—2017年8月的堆積型異常數(shù)據(jù)。 2) 算法效率。本研究算法對該風(fēng)電機(jī)組3年的數(shù)據(jù)清洗時間均在5 s左右,Thompson tau-四分位算法的清洗時間約為2~3 min,LOF的清洗時間約為30 s,表明本研究算法效率比Thompson tau-四分位算法和LOF算法均有很大提升。 此外,對比圖7、圖8可知,Thompson tau-四分位算法可以處理分散型異常數(shù)據(jù),但當(dāng)堆積型異常數(shù)據(jù)過多時,該算法將失去使用價值。 由表2和圖7、圖9可知,LOF算法和本研究算法在異常數(shù)據(jù)識別率相同的情況下,LOF算法對于該風(fēng)電機(jī)組2014年9月—2015年8月實測風(fēng)功率數(shù)據(jù)中存在的分散型異常數(shù)據(jù)處理效果尚可,但基本無法識別該風(fēng)電機(jī)組產(chǎn)生的堆積型異常數(shù)據(jù)。該風(fēng)電機(jī)組2015年9月—2016年8月產(chǎn)生的異常數(shù)據(jù)多為分散型異常數(shù)據(jù),故LOF算法基本能保留完整的數(shù)據(jù)主帶,但對于以堆積型異常數(shù)據(jù)為主的2015年9月—2016年8月實測風(fēng)功率數(shù)據(jù)處理效果欠佳。 本研究分析了風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)的來源及分布特征,提出基于滑動四分位和FSC算法的風(fēng)速-功率異常數(shù)據(jù)清洗方法,首先采用滑動四分位算法實現(xiàn)了數(shù)據(jù)散點的清洗,然后針對滑動四分位算法不能有效清洗的橫向堆積型異常數(shù)據(jù)提出了FSC算法。驗證結(jié)果表明,本研究提出的基于滑動四分位和FSC算法的風(fēng)速-功率異常數(shù)據(jù)清洗方法,通過設(shè)置算法半徑閾值,能夠很好地識別并清洗風(fēng)電機(jī)組產(chǎn)生的異常數(shù)據(jù),清洗效果不受堆積型異常數(shù)據(jù)的影響。同時,該方法考慮了風(fēng)功率數(shù)據(jù)的運行主帶,在實現(xiàn)異常數(shù)據(jù)清洗的同時盡可能地保留了正常運行的數(shù)據(jù)點,清洗效率較高,具有一定的實際應(yīng)用價值。2.2 可行搜索圓法
2.3 滑動四分位和FSC算法清洗流程
2.4 閾值的選取
3 實驗結(jié)果與分析
3.1 數(shù)據(jù)來源
3.2 數(shù)據(jù)清洗測試
3.3 算法對比分析
4 結(jié)論