鄔陽陽,任 艷,韓 碩,孫巖松
(新疆財經(jīng)大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,新疆 烏魯木齊,830012)
多屬性綜合評價與多屬性決策在學(xué)術(shù)上并沒有進(jìn)行嚴(yán)格區(qū)分[1]。綜合評價是相對于單指標(biāo)評價而言的,利用多個指標(biāo)從多個維度對事物進(jìn)行評價,在工程管理、經(jīng)濟(jì)管理以及決策等領(lǐng)域有著廣泛地應(yīng)用。傳統(tǒng)的綜合評價方法主要包括基于數(shù)理理論和統(tǒng)計分析的評價方法,但隨著管理問題的日益復(fù)雜,這些方法已經(jīng)不再適用于復(fù)雜系統(tǒng)的評價,而智能化方法具有較好的魯棒性和自適應(yīng)性,并且隱含并行處理數(shù)據(jù)的能力[2]。于是,一些學(xué)者將人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、云模型、粗糙集等智能學(xué)習(xí)方法引入到多屬性決策問題的研究,設(shè)計了基于智能方法的綜合評價方法。作為一種有效的評價理論,粗糙集理論也受到了學(xué)者們的關(guān)注。
粗糙集理論由波蘭學(xué)者Pawlak 于1982 年提出[3,4],是繼概率論、模糊集、證據(jù)理論等理論之后處理不確定性信息的有效工具。伴隨著數(shù)據(jù)科學(xué)的興起,粗糙集理論得到了迅速發(fā)展。一些學(xué)者也將粗糙集應(yīng)用到經(jīng)濟(jì)學(xué)、管理學(xué)、金融等諸多領(lǐng)域[5]。粗糙集理論在計算過程中完全由數(shù)據(jù)驅(qū)動,計算結(jié)果具有客觀性,并且算法易于運(yùn)行,其理論本身的屬性重要度計算方法、約簡原理可以應(yīng)用到指標(biāo)權(quán)重的計算和評價指標(biāo)的篩選兩個方面。另外,作為一種軟計算方法,粗糙集可以和其他多種軟計算方法(神經(jīng)網(wǎng)絡(luò)、模糊集、證據(jù)理論)進(jìn)行結(jié)合,優(yōu)勢互補(bǔ),建立新的評價模型,也可以結(jié)合傳統(tǒng)的評價方法(灰色系統(tǒng)評價法、模糊綜合評價法、因子分析法)提高綜合評價結(jié)果的精確度[6]。
就目前的文獻(xiàn)資料而言,有些學(xué)者對粗糙集在綜合評價中的一些基本原理和應(yīng)用實例也進(jìn)行了分析和總結(jié)[6],但粗糙集理論在多屬性評價的應(yīng)用取得了進(jìn)一步的進(jìn)展,為了促進(jìn)粗糙集在多屬性評價方法的應(yīng)用和多屬性評價理論本身的完善,需要有新的專業(yè)文獻(xiàn)對這類評價方法作出系統(tǒng)的總結(jié)和分析。基于此,本文對粗糙集在多屬性評價中的應(yīng)用的理論基礎(chǔ)進(jìn)行了介紹,并對一些經(jīng)典文獻(xiàn)進(jìn)行總結(jié)和分析,以期為跨學(xué)科研究和利用粗糙集理論提供借鑒。
在多屬性評價過程中,主要運(yùn)用了粗糙集屬性重要度定義和粗糙集屬性約簡原理。首先引入粗糙集的一些基本概念:粗糙集理論用知識(論域U的任何非空子集簇)描述客觀事物[7]。對于信息系統(tǒng)IS=(U,A,V,f),其中U為論域,A為非空條件屬性集,f表示信息系統(tǒng)的信息函數(shù),V為信息函數(shù)f的值域。對于屬性集合B,其不可分辨關(guān)系和等價類可分別表示為:和[x]IND(B)={y|y∈U,x,y∈IND(B)}。當(dāng)X?U時,粗糙集的正域可定義為
二元組K=(U,R)是U論域的一個知識庫。其中,R為U上的一簇等價關(guān)系。對于等價關(guān)系P和Q,P∈R,Q∈R,稱為Q和P間的依賴度。對于屬性B'在屬性集B中的重要度定義。粗糙集屬性約簡分為信息系統(tǒng)的屬性約簡和決策信息系統(tǒng)的約簡兩種情形。由于兩類約簡原理類似,這里僅對信息系統(tǒng)的屬性約簡定義進(jìn)行描述。在IS=(U,A,V,f)中,B?A,?p∈B,若集合B先后滿足IND(B)=IND(A)和IND(B-p)≠IND(B)兩個條件,則稱B為A的一個約簡。其約簡原理可用自然語言描述為:屬性集合B和屬性集合A具有相同的數(shù)據(jù)分辨能力,若屬性集合B去掉一個屬性之后,數(shù)據(jù)分辨能力就會發(fā)生改變,那么屬性集合B可稱為屬性集合A的一個約簡。
Pawlak 粗糙集模型是粗糙集理論的基礎(chǔ),其他拓展粗糙集模型都是為了滿足特定類型數(shù)據(jù)處理的需要而在這個模型上進(jìn)行的改進(jìn)。Pawlak 粗糙集無論是在屬性約簡算法還是在模型應(yīng)用方面的研究都相對深入。與其有關(guān)的評價方法大體可以分為兩類,一類是利用約簡原理對指標(biāo)進(jìn)行篩選后再進(jìn)行評價,另一類則是直接利用屬性重要度公式計算權(quán)重后進(jìn)行排序,或者計算權(quán)重后再結(jié)合一些評價方法進(jìn)行綜合評價。
3.1.1 篩選指標(biāo)
粗糙集的一個主要研究內(nèi)容就是屬性約簡。屬性約簡又稱特征選擇,可以在不影響決策質(zhì)量的前提下,去除冗余或不相關(guān)的屬性,從而達(dá)到提高決策效率的目的。粗糙集約簡原理在多屬性評價中的應(yīng)用實質(zhì)就是將評價指標(biāo)視為信息系統(tǒng)的屬性,然后根據(jù)粗糙集約簡原理進(jìn)行指標(biāo)處理,最后即可得到簡化后的指標(biāo)[8-12]。巴希等人[10]對風(fēng)險分擔(dān)進(jìn)行綜合評價之前,用粗糙集對指標(biāo)進(jìn)行預(yù)處理,剔除了具有相似功能的一些指標(biāo),同時又能使剩余指標(biāo)達(dá)到分類目標(biāo)。然后,結(jié)合傳統(tǒng)的評價方法——理想點法對PPP 項目風(fēng)險分擔(dān)進(jìn)行評價。王天擎等人[11]首先應(yīng)用DEA 模型進(jìn)行效率測度,然后利用粗糙集對產(chǎn)學(xué)研的投入和產(chǎn)出指標(biāo)體系進(jìn)行約簡,從而找出了影響投入產(chǎn)出效率的關(guān)鍵因素。蔡中華等人[12]運(yùn)用粗糙集屬性約簡方法,得出對養(yǎng)老服務(wù)質(zhì)量影響較大的服務(wù)項目,在一定程度上克服了噪聲數(shù)據(jù)的干擾,并利用粗糙集方法計算了各個屬性的權(quán)重,提高了評價的客觀性。
3.1.2 計算權(quán)重
粗糙集確定權(quán)重主要是依據(jù)屬性重要度公式計算每個屬性(指標(biāo))的重要度。在綜合評價過程中,權(quán)重的計算大致可分為單獨利用粗糙集計算權(quán)重以及結(jié)合其他主觀賦權(quán)方法(主成份分析法、層次分析法、德爾菲法等)進(jìn)行賦權(quán)兩種方法。
第一類基于粗糙集的單獨計算權(quán)重的方法主要是根據(jù)屬性重要度計算公式直接進(jìn)行指標(biāo)的權(quán)重計算。仇國芳等人[13]利用粗糙集理論建立了綠色施工項目評價模型,模型主要是通過粗糙集的權(quán)重計算公式求解評價指標(biāo)的權(quán)重,最后再計算綜合得分。項勇等人[14]應(yīng)用粗糙集計算影響影子收費(fèi)因素的權(quán)重,從而明確對非營利性項目評估系統(tǒng)完善性影響最大的因素,文章在利用粗糙集計算權(quán)重之前,應(yīng)用了粗糙集約簡理論對評價指標(biāo)進(jìn)行了約簡,達(dá)到了簡化計算的目的。作為一種客觀賦權(quán)方法,粗糙集權(quán)重計算方法完全依賴數(shù)據(jù)驅(qū)動,忽略了專家的一些經(jīng)驗,所以一些學(xué)者將粗糙集方法與一些主觀賦權(quán)法相結(jié)合,并采用加法合成法、乘法合成法、博弈論等方法進(jìn)行權(quán)重的融合,這便是第二類權(quán)重計算方法。張文宇等人[15]針對粗糙集計算客觀權(quán)重和層次分析法(AHP)計算主觀權(quán)重的不足,將兩種方法相互結(jié)合,通過加法賦權(quán)方式進(jìn)行組合賦權(quán),最后應(yīng)用于電子政務(wù)的評價說明,驗證了該方法的可行性。與文獻(xiàn)[15]類似,萬榮等人[16]將基于粗糙集和基于模糊層次分析法(FAHP)的求解權(quán)重的方法進(jìn)行集成,求解客戶需求權(quán)重。該文獻(xiàn)利用線性加權(quán)方法求解得到了最終權(quán)重。張健等人[17]用網(wǎng)絡(luò)層次分析法(ANP)確定了新鐵路客站綠色星級評估指標(biāo)的主觀權(quán)重,同時用經(jīng)典粗糙集計算指標(biāo)的客觀權(quán)重,最后采用相對熵原理減小了主、客觀權(quán)重融合時的誤差,得出了更為合理的組合權(quán)重。
為了彌補(bǔ)Pawlak 粗糙集在處理數(shù)據(jù)時僅限制于符號型數(shù)據(jù)的弊端,許多學(xué)者提出了拓展粗糙集模型,一些經(jīng)典的拓展模型也應(yīng)用到多屬性評價問題中。拓展粗糙集在多屬性評價中的應(yīng)用,主要也是依據(jù)屬性約簡原理、權(quán)重確定方法,其評價過程類似于Pawlak 粗糙集,此處不再贅述。本文選擇了幾類較為經(jīng)典的拓展模型(變精度粗糙集、模糊粗糙集、鄰域粗糙集、優(yōu)勢粗糙集、區(qū)間值粗糙集)的應(yīng)用實例進(jìn)行了詳細(xì)分析。在缺失數(shù)據(jù)的處理方面,傳統(tǒng)的數(shù)據(jù)分析主要通過插值法對這類數(shù)據(jù)進(jìn)行預(yù)處理。而變精度粗糙集由于引入了β閾值可以直接處理噪聲數(shù)據(jù)。張金隆等人[18]將變精度粗糙集與層次分析法相結(jié)合,對IT 項目的投標(biāo)風(fēng)險進(jìn)行評價,該方法避免了使用層次分析法過程中專家人為劃分重要度的缺點,同時又簡化了計算。謝松等人[19]為了解決變壓器油紙絕緣狀態(tài)評估中部分?jǐn)?shù)據(jù)未知的問題,采用模糊C 均值法和模糊粗糙集的辨識矩陣法對絕緣狀態(tài)進(jìn)行評估,并通過實例演繹證明了該方法的有效性。郭春花[20]利用鄰域粗糙集對信用風(fēng)險的復(fù)雜數(shù)據(jù)進(jìn)行降維,并采用馬氏距離消除數(shù)據(jù)量綱的影響,建立了一種有效的評級方法。王靜等人[21]引入優(yōu)勢粗糙集以克服Pawlak 粗糙集不能處理具有偏好信息的信息系統(tǒng)的缺點,首先利用優(yōu)勢粗糙集對評價對象的屬性進(jìn)行約簡,然后利用極大熵進(jìn)行賦權(quán),建立了高校招生的資源配置評估模型。徐飛等人[22]研究發(fā)現(xiàn)以往的研究生教育質(zhì)量的評價體系中存在冗余或不重要的指標(biāo),于是引入?yún)^(qū)間值模糊粗糙集對評價指標(biāo)進(jìn)行約簡,并根據(jù)區(qū)間模糊粗糙集的屬性重要度公式算出來各種指標(biāo)的重要度。
粗糙集在進(jìn)行依賴度計算時會出現(xiàn)指標(biāo)權(quán)重為零的情況,而所選擇的評價指標(biāo)一般都會對評價主體產(chǎn)生影響,權(quán)重為零則存在一定的不合理性。對于這類問題,有學(xué)者提出了通過專家再次打分的方法,重新計算指標(biāo)的重要度[18],但這種方法需要耗費(fèi)更多的人力成本。因此,一些學(xué)者對基于粗糙集的權(quán)重計算公式進(jìn)行了改進(jìn)[23-27]。其中,鮑新中等人[23]為了解決經(jīng)典粗糙集模型無法確定冗余屬性權(quán)重的問題,利用粗糙集信息觀下表示更全面的特點,引入條件信息熵,提出了新的基于粗糙集條件信息熵的權(quán)重確定方法,并分析了該方法的合理性。朱紅燦等人[24]指出鮑新中等人基于代數(shù)觀改進(jìn)的權(quán)重計算公式雖然可以避免權(quán)重出現(xiàn)零的情況,但有可能出現(xiàn)冗余屬性的屬性重要度大于非冗余屬性重要度之一矛盾現(xiàn)象。于是依據(jù)重要度是否為零將其劃分為高級或低級優(yōu)先級隊列,重新定義了權(quán)重的計算公式:其中,μ(c)表示條件屬性(指標(biāo))c的隊列的優(yōu)先級。對于朱紅燦改進(jìn)算法的應(yīng)用,劉姍等人[28]基于改進(jìn)的權(quán)重計算方法建立了水質(zhì)綜合評價模型,將其應(yīng)用到重慶市南川鳳嘴江水質(zhì)評價中,取得了較好的評價效果。施振佺 等人[27]指出朱紅燦等人改進(jìn)的權(quán)重計算方法會增加計算的額外開銷,于是引入了知識粒度理論,提出了基于粗糙集和知識粒度的權(quán)重求解方法。該方法可以有效避免冗余特征權(quán)重為0 以及非冗余特征當(dāng)成冗余特征等問題。
粗糙集是處理不確定性問題的智能數(shù)學(xué)工具,也是一種智能評價方法,基于粗糙集的多屬性評價方法已經(jīng)在多個領(lǐng)域得到了一定程度的應(yīng)用,但其應(yīng)用并沒有一些傳統(tǒng)理論那么廣泛以及在應(yīng)用中還存在一些問題。因此,基于粗糙集的多屬性評價方法在推廣以及深入研究方面還需要作進(jìn)一步的探索。
Pawlak 粗糙集在多屬性評價中的應(yīng)用最為廣泛,但該模型應(yīng)用前需要對原始數(shù)據(jù)進(jìn)行離散化處理,離散化操作會導(dǎo)致原有數(shù)據(jù)所包含的信息缺失。一些經(jīng)典的粗糙集拓展模型,比如模糊粗糙集、鄰域粗糙集可以處理非符號性數(shù)據(jù),但兩類模型在應(yīng)用中還存在以下問題:第一,鄰域粗糙集閾值的確定,鄰域粗糙集的閾值主要是采用胡清華在建立鄰域粗糙集過程中使用的經(jīng)典閾值,這個閾值并不一定適合所有的應(yīng)用場景。第二,兩類模型在處理數(shù)據(jù)中,計算量比較大,現(xiàn)階段并沒有相應(yīng)的軟件支持,而其他許多評價方法(層次分析法、灰色系統(tǒng)理論、理想點法、模糊評價法等)都有較為成熟的軟件,這些軟件將評價模型封裝成黑箱模式,有利于這些評價方法的推廣使用,為其他領(lǐng)域的研究人員使用此類方法提供了極大的便利。因此,開發(fā)相應(yīng)的粗糙集評價軟件,可以促進(jìn)粗糙集評在其他領(lǐng)域的應(yīng)用。
新模型的應(yīng)用。為了更好地處理現(xiàn)實中的數(shù)據(jù),粗糙集模型的拓展是一個重要的研究方向[29-30]。因此,不斷有新的模型被提出,比如:局部粗糙集[31]、三支決策粗糙集[32]、多粒度粗糙集[33]等。其中,三支決策粗糙集在多屬性評價中,運(yùn)用三支語義,同原來的二支決策相比,決策更加科學(xué),在社會科學(xué)的應(yīng)用方面已經(jīng)有一些研究成果出現(xiàn)[34-36]。將決策粗糙集應(yīng)用到更多的領(lǐng)域可以為決策者提供更為有力的工具,提高決策的質(zhì)量。多粒度粗糙集由于可以從多個視角分析問題,對于復(fù)雜的大型問題的解決具有重要意義,將多粒度粗糙集應(yīng)用到多屬性問題的評價,能夠從不同角度分析問題,有利于問題的有效解決,將多粒度粗糙集應(yīng)用到復(fù)雜問題的分析,可以為決策提供更為科學(xué)合理的信息。
多種方法的集成。隨著數(shù)據(jù)科學(xué)的不斷進(jìn)步和發(fā)展,有多種分析處理數(shù)據(jù)的智能模型被提出,將粗糙集和這些先進(jìn)的模型相結(jié)合可以避免某一類模型在處理數(shù)據(jù)中的弊端。云模型是一種處理模糊信息的較新的理論,它反映了知識的模糊性和隨機(jī)性,構(gòu)成了定量與定性的相互映射的關(guān)系[37],一些研究者將云模型與Pawlak 粗糙集結(jié)合進(jìn)行綜合評價[38-40],取得了較好的評價效果,為各個領(lǐng)域提供了新的評價方法。將這些方法應(yīng)用到其他領(lǐng)域可以為這些具體領(lǐng)域提供一些新的評價模型,提升評價質(zhì)量。另外,將粗糙集拓展模型和云模型結(jié)合也是一個研究方向。粗糙集的拓展模型某些性能要優(yōu)于經(jīng)典粗糙集,將這些拓展模型與云模型集成可以取得更好的評價效果。
基于粗糙集的綜合評價方法已經(jīng)應(yīng)用到很多領(lǐng)域,體現(xiàn)了該理論的優(yōu)良性能。文章對基于粗糙集的綜合評價方法的應(yīng)用原理、經(jīng)典文獻(xiàn)以及研究中存在的一些問題進(jìn)行了綜述與分析,為進(jìn)一步研究粗糙集在多屬性評價中的應(yīng)用提供了參考。
湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報2020年1期