趙志峰,文 虎,樊 恒,朱凱然
(1. 西安石油大學(xué) 電子工程學(xué)院,陜西 西安 710065;2. 西安科技大學(xué) 安全科學(xué)與工程學(xué)院,陜西 西安 710054)
權(quán)重系數(shù)是用數(shù)量形式權(quán)衡對比評價系統(tǒng)中各因素相對重要程度的量值。對于同一組指標(biāo)因素數(shù)據(jù),權(quán)重系數(shù)的不同,會導(dǎo)致截然不同,甚至完全相反的評價結(jié)論。因此、評價指標(biāo)因素的權(quán)重確定是非常重要和必要的。指標(biāo)權(quán)重的方法確定,一般有專家評分法,模擬評價法,Delphi法,主觀賦權(quán)法,沃爾評分法等[1-3]。很多方法都是主觀性評價,評價結(jié)果具有一定的局限性。為了使評價更具有針對性、適用性和實用性,且避免使用主觀性方法,在實際客觀數(shù)據(jù)的基礎(chǔ)上,根據(jù)粗糙集處理數(shù)據(jù)的特點,以及熵權(quán)計算法的原理和計算權(quán)重的客觀性,提出將粗糙集和熵權(quán)計算法結(jié)合進行指標(biāo)權(quán)重的計算。
粗糙集是處理不確定問題的數(shù)學(xué)工具。它在不需要考慮任何先驗信息的條件下,直接通過對觀測數(shù)據(jù)進行分析處理,依靠粗糙集算法從決策表中刪除重復(fù)的相同信息和冗余項,簡化條件屬性,精簡決策指標(biāo),從而進行核心指標(biāo)的選取和權(quán)重系數(shù)的計算[4-5]。
熵權(quán)計算法是種客觀的權(quán)重計算方法,其通過信息熵計算出各指標(biāo)的熵權(quán),再利用熵權(quán)對各指標(biāo)進行權(quán)重的修正,因而評價結(jié)果更具有較好的客觀性[6-7]。
在有T個評價指標(biāo)(因素)、Y個被分類對象的區(qū)域系統(tǒng)內(nèi),可以按照定性和定量相結(jié)合的原則,Y個被分類對象對應(yīng)于T個指標(biāo)的因素值構(gòu)成評價矩陣R:
(1)
對評價矩陣R作標(biāo)準(zhǔn)化處理,得到矩陣R′ :
(2)
(3)
對于定義評價指標(biāo)的熵,在有T個指標(biāo),Y個被分類對象的區(qū)域系統(tǒng)內(nèi),定義第v個指標(biāo)的熵值為:
(4)
(5)
針對土壤的腐蝕性因素較多,并且不同地區(qū)的土壤環(huán)境,其核心影響因素及權(quán)重也截然不同的特點,提出應(yīng)用粗糙集和熵權(quán)計算法進行核心指標(biāo)因素的分析與權(quán)重計算。首先根據(jù)粗糙集(RS)處理數(shù)據(jù)的特點,對土壤多指標(biāo)因素原始數(shù)據(jù)進行前期數(shù)據(jù)的分析與挖掘,針對數(shù)據(jù)的多樣性、冗余性、復(fù)雜性、異常性和屬性關(guān)系進行規(guī)范化處理和約簡,找出核心指標(biāo)因素,并保證計算權(quán)重前數(shù)據(jù)信息的一致性和準(zhǔn)確性。其次應(yīng)用粗糙集和熵權(quán)計算法對處理后的指標(biāo)因素進行權(quán)重計算,最后權(quán)重值取2種方法計算值的平均值作為權(quán)重系數(shù)。
以項目中梁平段管道所在的壤土土壤腐蝕區(qū)域為例,針對壤土腐蝕現(xiàn)場埋設(shè)的區(qū)域和位置情況,按試片取片數(shù)據(jù)以及采集批次進行6種影響因素的核心指標(biāo)因素分析與權(quán)重計算,具體見表1壤土區(qū)管段20組土壤腐蝕實際原始樣本指標(biāo)因素值所示。
表1 壤土區(qū)管段20組土壤腐蝕實際原始樣本指標(biāo)因素值
將表1壤土區(qū)管段20組土壤腐蝕實際原始樣本指標(biāo)因素值作為決策表,其中把土壤腐蝕選取點作為研究對象U={X1,X2,…,X20}。把土壤腐蝕所選取的影響因素作為條件屬性A={土壤電阻率,氧化還原電位,氯離子含量,…,pH值}。把壤土區(qū)域的土壤腐蝕等級作為決策屬性D={強,較強,一般,弱}={4,3,2,1}。
由于現(xiàn)有的離散化數(shù)據(jù)方法都有或多或少的丟值問題,并且在屬性值增加的情況下,斷點數(shù)也會增加。斷點選擇的好壞直接關(guān)系到離散化數(shù)據(jù)的準(zhǔn)確性。斷點過少會造成嚴(yán)重的失值問題,過多會造成維度和復(fù)雜度上升,精度下降。例如等寬、等頻區(qū)間離散法,統(tǒng)計學(xué)離散法,貪心及改進離散法,聚類連續(xù)屬性離散法,差分演化離散法等[8-9]。論文結(jié)合離散化的要求和目的,即保證數(shù)據(jù)結(jié)果的一致性和簡單化,以及通過離散化的有效性提高數(shù)據(jù)集合的分類能力和魯棒性,減少樣本沖突和最小的信息丟失。因此,在土壤腐蝕多因素特點的基礎(chǔ)上,針對離散化方法和原理,提出改進其應(yīng)用,并考慮決策表的具體屬性值(監(jiān)督性離散化方法),根據(jù)其相應(yīng)的土壤腐蝕等級分類[10],見表2土壤腐蝕指標(biāo)因素分類區(qū)間表所示,等級區(qū)間選取依據(jù)土壤腐蝕等級標(biāo)準(zhǔn)及規(guī)范(《NACE SP0502-2010》,《管道風(fēng)險評價手冊》),以及相關(guān)參考文獻[11-13]等標(biāo)準(zhǔn)建立,對表1進行離散化處理,從而解決了數(shù)據(jù)中的丟值問題,保證了數(shù)據(jù)離散時的穩(wěn)定性。壤土區(qū)管段土壤腐蝕因素離散化表見表3所示,將數(shù)據(jù)冗余項2(或10,17)、項4(或7,12)、項9(或15)、項11(或18)、項16(或19,20)中的括號內(nèi)數(shù)據(jù)刪除,得到的新決策表按約簡決策規(guī)則進行屬性約簡,以及權(quán)重值分析。
表2 土壤腐蝕指標(biāo)因素分類區(qū)間
表3 壤土區(qū)管段土壤腐蝕因素離散化
結(jié)合壤土區(qū)域管道土壤腐蝕數(shù)據(jù),定義整個數(shù)據(jù)集合為U,T和J分別為條件屬性集和結(jié)果屬性集,其中條件屬性集T含有:土壤電阻率為a,氧化還原電位為b,氯離子含量為c,硫酸根離子含量為d,含水量為e,pH值為f。結(jié)果屬性集J是壤土區(qū)域土壤腐蝕等級[14-15]。因此:U/J={{2,3,8,16},{1,4,5,6,9,11,13,14}};
U/T={{1,16},{2},{3,6},{4},{5},{8},{9},{11},{13},{14}};
U/T-a={{1,16},{2,5},{3,4,6},{8},{9,13},{11},{14}};
U/T-b={{1,16},{2,8,9},{3,6},{4,11},{5,13},{14}};U/T-c={{1,16},{2},{3,6},{4,14},{5},{8},{9},{11},{13}};
U/T-d={{1,16},{2},{3,6},{4},{5},{8},{9},{11},{13},{14}};
U/T-e={{1,2,3,6,16},{4,5},{8},{9},{11},{13},{14}};
U/T-f={{1,16},{2},{3,6},{4},{5},{8},{9},{11},{13},{14}}。
結(jié)果屬性對各類的正域為:
POST(J)={2,4,5,8,9,11,13,14};
POST-a(J)={8,9,11,13,14};
POST-b(J)={4,5,11,13,14};
POST-c(J)={2,4,5,8,9,11,13,14};
POST-d(J)={2,4,5,8,9,11,13,14};
POST-e(J)={4,5,8,9,11,13,14};
POST-f(J)={2,4,5,8,9,11,13,14}。
各屬性的重要度:
根據(jù)以上的計算可知,該壤土區(qū)域的腐蝕影響因素的重要性排序為:土壤電阻率=氧化還原電位>含水量>硫酸根離子含量=氯離子含量=pH值。由于硫酸根離子含量、氯離子含量和pH值=0,表明上述3個條件屬性對結(jié)果無意義,可以刪除。同時刪除數(shù)據(jù)中的非正域項(第1,3,6,16項),見表4壤土區(qū)管段RS土壤腐蝕約簡項所示。則土壤電阻率等于氧化還原電位的權(quán)重值為:
含水量的權(quán)重值為:
表4 壤土區(qū)管段RS土壤腐蝕約簡項
將表4對應(yīng)的實際數(shù)據(jù)值代入公式(1)至(5)算出權(quán)重值,從計算結(jié)果發(fā)現(xiàn)所得的土壤電阻率權(quán)重計算值為0.338 5,含水量權(quán)重計算值為0.332 8,氧化還原電位權(quán)重計算值為0.328 7。排序順序為土壤電阻率>含水量>氧化還原電位,但這與粗糙集計算的權(quán)重值的排序存在明顯的不一致。通過分析發(fā)現(xiàn)在含水量指標(biāo)因素中,其與評價等級的關(guān)系并不是單純的隨著指標(biāo)越小越優(yōu),或是隨著指標(biāo)越大越優(yōu),而是隨著指標(biāo)越大越差,但到達(dá)一定范圍值時就轉(zhuǎn)變?yōu)殡S著指標(biāo)越大越優(yōu)的形同拋物線的比例關(guān)系,因此需針對含水量指標(biāo)因素中的熵權(quán)計算法的無量綱化處理公式做同級變形,即根據(jù)實際指標(biāo)值所在的區(qū)間利用公式6統(tǒng)一處理為隨著指標(biāo)越小越優(yōu)的情況。
(6)
因此,將編號4號、11號和14號中的含水量值代入公式6進行同級變換,再進行熵權(quán)值計算,從計算結(jié)果可看出:土壤電阻率權(quán)重計算值0.361 3,含水量權(quán)重計算值0.287 9,氧化還原電位權(quán)重計算值0.350 8。排序順序為土壤電阻率≈氧化還原電位>含水量,這與粗糙集計算的權(quán)重值的排序基本一致。從對比結(jié)果可以看出,以上的應(yīng)用改進提高了熵權(quán)計算法在土壤腐蝕性權(quán)重計算分析的正確性,為土壤腐蝕評價權(quán)值計算提供了應(yīng)用方法指導(dǎo)。
從實例的應(yīng)用可以看出,此方法能夠根據(jù)客觀數(shù)據(jù)和指標(biāo)因素的特點進行權(quán)重計算,適應(yīng)性的解決了粗糙集離散化要求,以及熵權(quán)計算法由于非線性關(guān)系導(dǎo)致無量綱化處理時所造成的結(jié)果偏差,提高了客觀權(quán)重分析的準(zhǔn)確性。
該方法主要應(yīng)用于多因素評價體系里以客觀數(shù)據(jù)為前提,且指標(biāo)閾值已確定的權(quán)重計算。應(yīng)注意的是,當(dāng)評價指標(biāo)等級優(yōu)劣關(guān)系中出現(xiàn)非線性問題而進行公式同級變換時,需統(tǒng)一按一種標(biāo)準(zhǔn)要求進行轉(zhuǎn)化,即都按指標(biāo)越大越優(yōu)處理,或都按指標(biāo)越小越優(yōu)的一致性進行處理,以保證處理數(shù)據(jù)無量綱化時的統(tǒng)一性。
1)針對土壤腐蝕多因素的特點,為了改進粗糙集應(yīng)用中離散化數(shù)據(jù)時丟值的問題,提出依據(jù)土壤腐蝕等級的分類離散化方法,減少了離散數(shù)據(jù)時的失值問題,動態(tài)的進行了土壤腐蝕多因素的核心指標(biāo)因素分析和實際離散化方法的應(yīng)用,增加針對其核心指標(biāo)因素和權(quán)重分析的適用性和客觀性。
2)通過分析20個點的實際土壤腐蝕數(shù)據(jù)來看,壤土區(qū)域的核心因素為土壤電阻率、氧化還原電位和含水量,從而客觀驗證了,不同區(qū)域不同地質(zhì)環(huán)境下,土壤的腐蝕核心因素是不同的,不能片面的選取單因素或同一類核心因素來進行多因素評判,需考慮不同地域環(huán)境條件下,土壤核心因素選取的適應(yīng)性和有效性。
3)針對多指標(biāo)因素權(quán)重計算的特點,根據(jù)非線性關(guān)系導(dǎo)致熵權(quán)計算法中無量綱化處理時標(biāo)準(zhǔn)的不統(tǒng)一,提出利用同級變換公式進行轉(zhuǎn)化,其計算結(jié)果得到了粗糙集權(quán)重排序的驗證,增加了針對權(quán)重系數(shù)分析的實用性和可靠性,同時也說明了應(yīng)用時的盲目性將導(dǎo)致結(jié)果的偏差和不正確。
[1]李軍,張宏,梁海濱.基于模糊綜合評價的燃?xì)夤艿赖谌狡茐氖а芯縖J].中國安全生產(chǎn)科學(xué)技術(shù),2016,12(8):140-145.
LI Jun,ZHANG Hong,LIANG Haibin. Study on failure of gas pipeline due to third party damage based on fuzzy comprehensive evaluation[J]. Journal of Safety Science and Technology,2016,12(8):140-145.
[2]國家能源局. 油氣管道風(fēng)險評價方法第一部分半定量評價法:SY 6891.1-2012T [S].北京:石油工業(yè)出版社,2012.
[3]文虎,趙志峰,郭軍. 集對理論聚類分析法綜合預(yù)測煤與瓦斯突出[J].西安科技大學(xué)學(xué)報,2015,35(5):547-554.
WEN Hu, ZHAO Zhifeng, GUO Jun. Comprehensive forecast of coal and gas outburst on the basis of set pair theory and clustering analysis method[J].Journal of Xi'an University of Science and Technology,2015,35(5):547-554.
[4]Pawlak Z. Rough sets[J].International Journal of Information and Computer Science. 1982,11(5):341-356.
[5]張延松,趙英凱.基于PCA和粗糙集構(gòu)建決策樹的變電站故障診斷[J].電力系統(tǒng)保護與控制,2010,38(14):104-109.
ZHANG Yansong, ZHAO Yingkai. Fault diagnosis of substation by the constructed decision tree based on principal component analysis(PCA) and rough set[J]. Power System Protection and Control, 2010, 38(14):104-109.
[6]王書明.煤礦安全投入系統(tǒng)分析及其決策的研究[D].北京:中國礦業(yè)大學(xué),2008.
[7]ZHAO Zhifeng,WEN Hu, GAO Weixin. The pipeline soil corrosion comprehensive prediction method of multi-method integration[J].International Journal of Simulation: Systems, Science and Technology,2016,17(26):19-26.
[8]張鵬飛.一種基于熵的連續(xù)屬性離散方法[J].燃?xì)鉁u輪試驗與研究,2014,27(6):49-52.
ZHANG Pengfei. A Method of Continuous Attributes Discretization Based on Entropy[J].Gas Turbine Experiment and Research,2014,27(6):49-52.
[9]李慧.一種基于粗糙集理論的連續(xù)屬性離散化新算法[J].計算機應(yīng)用研究,2010,27(1):77-78.
LI Hui. Novel algorithm for discretization of continuous attributes based on rough set theory[J].Application Research of Computers,2010,27(1):77-78.
[10]趙志峰,文虎,高煒欣,等.長輸管道完整性管理中的數(shù)據(jù)挖掘和知識決策[J].西安石油大學(xué)學(xué)報(自然科學(xué)版),2016,31(4):109-114.
ZHAO Zhifeng, WEN Hu, GAO Weixin, et al. Data mining and knowledge decision in the integrity management of long-distance pipeline[J].Journal of Xi an Shiyou University(Natural Science Edition),2016,31(4):109-114.
[11]張江江,張志宏.雅克拉氣田天然氣西氣東輸管道腐蝕與檢測評價[J].腐蝕與防護,2015,36(3):234-239.
ZHANG Jiangjiang,ZHANG Zhihong. Corrosion detection and evaluation of west to east nature gas transmission pipeline in yakela gas field[J].Corrosion & Protection,2015,36(3):234-239.
[12]柳華偉,陳楊. 模糊綜合評價法在埋地管道腐蝕狀況評價中的應(yīng)用[J].石油工程建設(shè),2011,37(5): 43-45.
LIU Huawei, CHEN Yang. Application of fuzzy integrated evaluation method in evaluating corrosion state of buried pipeline[J]. Petroleum Engineering Construction,2011,37(5):43-45.
[13]張弛,王凱全.基于可拓學(xué)的燃?xì)夤艿劳寥栏g性評價[J].油氣儲運,2010, 29(11): 848-851.
ZHANG Chi, WANG Kaiquan. Soil Corrosivity assessment of gas pipeline based an extenics[J]. Oil & Gas Storage and Transportation, 2010, 29(11): 848-851.
[14]趙志峰,文虎,郭軍. 基于多方法融合的煤與瓦斯突出綜合預(yù)測[J].煤礦安全,2015,46(11):160-163.
ZHAO Zhifeng,WEN Hu,GUO Jun. Comprehensive forecast of coal and gas outburst based on multiple methods[J].Safety in Coal Mines,2015,46(11):160-163.
[15]楊林娟,沈士明.基于粗糙集理論的故障樹重要度分析[J].南京工業(yè)大學(xué)學(xué)報〔自然科學(xué)版),2007,29(1):60-64.
YANG Linjuan, SHEN Shiming. Importance analysis of the fault tree based on rough set theory[J].Journal of Nanjng University of Technology,2007,29(1):60-64.