吳樹霖, 伍 剛, 毛舒樂(lè), 邵 臻, 吳小華, 鄭青如
(1.國(guó)網(wǎng)福建省電力有限公司,福建 福州 350003; 2.國(guó)網(wǎng)福建省電力有限公司 信息通信分公司,福建 福州 350003; 3.安徽繼遠(yuǎn)軟件有限公司,安徽 合肥 230088; 4.合肥工業(yè)大學(xué) 管理學(xué)院,安徽 合肥 230009)
當(dāng)前,我國(guó)進(jìn)一步深化電力體制改革和完善電力市場(chǎng)化交易機(jī)制的工作正穩(wěn)步推進(jìn),隨著電力市場(chǎng)的逐步開放,電力企業(yè)想要在日益激烈的競(jìng)爭(zhēng)市場(chǎng)中取得優(yōu)勢(shì),實(shí)時(shí)有效地檢測(cè)其業(yè)務(wù)信息系統(tǒng)的運(yùn)行狀況并確保系統(tǒng)穩(wěn)定運(yùn)行變得尤為重要。電力業(yè)務(wù)信息系統(tǒng)主要包括營(yíng)銷系統(tǒng)、物資管理系統(tǒng)、人力資源系統(tǒng)、生產(chǎn)管理系統(tǒng)等[1],各業(yè)務(wù)系統(tǒng)的健康運(yùn)營(yíng)有利于電力公司更好地適應(yīng)市場(chǎng)變化。與此同時(shí),隨著電力系統(tǒng)信息化、智能化進(jìn)程的加快,信息技術(shù)已經(jīng)融入到電力系統(tǒng)發(fā)、輸、變、配、用等各個(gè)環(huán)節(jié),電力業(yè)務(wù)信息系統(tǒng)在運(yùn)行過(guò)程中會(huì)產(chǎn)生大量的日志數(shù)據(jù)。因此在電力業(yè)務(wù)信息系統(tǒng)運(yùn)維過(guò)程中,需要在海量日志環(huán)境下對(duì)電力業(yè)務(wù)信息系統(tǒng)的健康運(yùn)行情況進(jìn)行實(shí)時(shí)有效的評(píng)價(jià)。
目前,對(duì)于信息系統(tǒng)健康評(píng)價(jià)的研究已取得了一些研究成果。信息系統(tǒng)健康度需要從數(shù)據(jù)的視角客觀反映企業(yè)信息系統(tǒng)、互聯(lián)網(wǎng)技術(shù)的綜合運(yùn)營(yíng)能力和水平[2]。對(duì)系統(tǒng)健康性的研究主要從功能性、安全性和性能性等多個(gè)層面展開,采用層次分析法、模糊理論等方法,構(gòu)建系統(tǒng)健康性評(píng)價(jià)體系[2-4]。文獻(xiàn)[3]利用功能特性、性能特性和安全特性3個(gè)方面的數(shù)據(jù),采用層次分析法評(píng)估信息系統(tǒng)的運(yùn)行狀態(tài);文獻(xiàn)[5]利用模糊綜合評(píng)價(jià)模型研究服務(wù)器工作狀態(tài)、服務(wù)區(qū)域內(nèi)用戶的使用狀態(tài)以及DNS非常規(guī)使用狀態(tài)等方面對(duì)系統(tǒng)健康性的影響;文獻(xiàn)[6]提出一種新的基于粗糙集的容器云系統(tǒng)健康評(píng)價(jià)模型,實(shí)時(shí)、動(dòng)態(tài)地對(duì)整個(gè)云平臺(tái)資源的運(yùn)行狀況進(jìn)行直觀反映。
除了直接對(duì)健康性進(jìn)行研究,還有部分學(xué)者從系統(tǒng)的風(fēng)險(xiǎn)評(píng)估、安全評(píng)價(jià)體系等方面展開研究,相應(yīng)的評(píng)價(jià)方法主要有層次分析法、模糊評(píng)價(jià)法和神經(jīng)網(wǎng)絡(luò)等方法。文獻(xiàn)[1,7]運(yùn)用層次分析法,并對(duì)指標(biāo)進(jìn)行分析,確定指標(biāo)權(quán)重?cái)?shù)值,構(gòu)建信息系統(tǒng)評(píng)價(jià)體系,對(duì)系統(tǒng)的成熟度進(jìn)行綜合評(píng)價(jià);文獻(xiàn)[8]基于層次分析法和熵權(quán)法對(duì)配電網(wǎng)調(diào)度評(píng)價(jià),提高配電網(wǎng)調(diào)度管理水平。對(duì)于模糊評(píng)價(jià)法,文獻(xiàn)[9-10]將模糊評(píng)價(jià)方法應(yīng)用于信息系統(tǒng)的風(fēng)險(xiǎn)評(píng)估、等級(jí)保護(hù)和安全檢查3項(xiàng)測(cè)評(píng)工作中,對(duì)信息系統(tǒng)風(fēng)險(xiǎn)進(jìn)行評(píng)估,得出其安全級(jí)別,直觀地為信息系統(tǒng)安全等級(jí)定級(jí)提供可量化的標(biāo)準(zhǔn)。但層次分析法和模糊評(píng)價(jià)法構(gòu)建層次結(jié)構(gòu)或模糊一致矩陣時(shí),需要依靠專家打分確定相應(yīng)的權(quán)重,這就導(dǎo)致評(píng)價(jià)過(guò)程具有隨機(jī)性和主觀性。為了解決這一問(wèn)題,文獻(xiàn)[11]運(yùn)用熵權(quán)法對(duì)安全指標(biāo)體系進(jìn)行處理,確定評(píng)價(jià)指標(biāo)的權(quán)重,盡管該模型屬于一種客觀賦權(quán)方法,但由于系統(tǒng)評(píng)價(jià)指標(biāo)較多,導(dǎo)致實(shí)際分析時(shí)計(jì)算量較大,容易出現(xiàn)殘缺判斷矩陣且標(biāo)度工作量過(guò)大等問(wèn)題。為此有學(xué)者采用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評(píng)價(jià),克服了層次分析法等評(píng)價(jià)方法中的主觀因素影響,提高了綜合評(píng)價(jià)的客觀性和合理性。文獻(xiàn)[12]基于改進(jìn)的ELMAN神經(jīng)網(wǎng)絡(luò)構(gòu)建了協(xié)同創(chuàng)新伙伴評(píng)價(jià)模型;文獻(xiàn)[13]提出一種深度神經(jīng)網(wǎng)絡(luò)的風(fēng)險(xiǎn)評(píng)價(jià)方法,實(shí)驗(yàn)表明該模型具有更高的有效性;文獻(xiàn)[14]提出了基于量子門線路神經(jīng)網(wǎng)絡(luò)的信息安全風(fēng)險(xiǎn)評(píng)估方法,該方法能夠?qū)崿F(xiàn)信息系統(tǒng)的風(fēng)險(xiǎn)評(píng)估,使評(píng)價(jià)結(jié)果更準(zhǔn)確;文獻(xiàn)[15]利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建了評(píng)估模型,來(lái)提高生態(tài)風(fēng)險(xiǎn)管理;文獻(xiàn)[16]結(jié)合模糊理論和神經(jīng)網(wǎng)絡(luò)方法,提出T-S模糊神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)對(duì)系統(tǒng)的評(píng)價(jià),但基于神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)方法同樣需要考慮權(quán)重賦值問(wèn)題。
電力系統(tǒng)健康性評(píng)價(jià)研究主要側(cè)重于電網(wǎng)安全和電網(wǎng)運(yùn)行狀態(tài)等領(lǐng)域,關(guān)于電力業(yè)務(wù)信息系統(tǒng)健康性評(píng)價(jià)的研究工作較少。傳統(tǒng)的電力信息系統(tǒng)運(yùn)行狀況評(píng)價(jià)對(duì)于日志信息的利用不足,缺乏對(duì)電力信息系統(tǒng)實(shí)時(shí)監(jiān)測(cè)的多元信息的綜合判別與分析。此外,基于傳統(tǒng)的AHP、模糊綜合評(píng)價(jià)法等數(shù)據(jù)評(píng)價(jià)方法難以克服評(píng)價(jià)指標(biāo)權(quán)重賦值的主觀性等問(wèn)題,嚴(yán)重影響了系統(tǒng)健康度評(píng)價(jià)的實(shí)時(shí)性和客觀性。針對(duì)上述問(wèn)題,本文提出了基于數(shù)據(jù)包絡(luò)分析的典型業(yè)務(wù)信息系統(tǒng),即人力資源系統(tǒng)評(píng)價(jià)方法,該方法通過(guò)關(guān)聯(lián)規(guī)則技術(shù)中的Apriori算法對(duì)信息系統(tǒng)的運(yùn)行數(shù)據(jù)指標(biāo)進(jìn)行提取,將所發(fā)現(xiàn)的指標(biāo)間的聯(lián)系用頻繁項(xiàng)集的形式進(jìn)行表示,進(jìn)而選取出能表達(dá)電力業(yè)務(wù)信息系統(tǒng)健康性的重要關(guān)聯(lián)規(guī)則。結(jié)合提取到的核心關(guān)聯(lián)規(guī)則,運(yùn)用數(shù)據(jù)包絡(luò)分析(data envelopment analysis,DEA)模型進(jìn)行確定系統(tǒng)健康度的投入與產(chǎn)出指標(biāo),進(jìn)而根據(jù)得到的不同時(shí)間點(diǎn)的綜合評(píng)價(jià)效率指數(shù)來(lái)判斷電力業(yè)務(wù)信息系統(tǒng)資源配置的合理性,據(jù)此來(lái)衡量系統(tǒng)的健康性。
Apriori關(guān)聯(lián)規(guī)則算法是經(jīng)典的關(guān)聯(lián)規(guī)則算法[17]。Apriori算法主要是先對(duì)預(yù)處理過(guò)的數(shù)據(jù)進(jìn)行分析,找出比設(shè)定的最小置信度大或者相等的頻繁項(xiàng)集,再?gòu)闹姓业奖仍O(shè)定的最小置信度大的強(qiáng)關(guān)聯(lián)規(guī)則。Apriori算法的優(yōu)點(diǎn)是對(duì)數(shù)據(jù)的要求不高,算法易操作。本文將Apriori算法應(yīng)用于日志文件的數(shù)據(jù)挖掘與處理中,在沒(méi)有直接聯(lián)系的指標(biāo)之間找到聯(lián)系,形成一定的規(guī)則。
支持度和置信度是關(guān)聯(lián)規(guī)則的2個(gè)重要指標(biāo)。支持度表示項(xiàng)集(X,Y)在總項(xiàng)集中的概率,即number(I)。最小支持度記為smin,用于衡量規(guī)則需要滿足的最低重要性。頻繁項(xiàng)集就是支持度大于或等于最小支持度的集合。置信度表示在X發(fā)生的情況下,由關(guān)聯(lián)規(guī)則(X→Y)推出Y發(fā)生的概率,即confident(X→Y)=P(X|Y)=P(X,Y)/P(X)。最小置信度記為cmin,表示關(guān)聯(lián)規(guī)則需要滿足的最低可靠性,是人為設(shè)定的。若關(guān)聯(lián)規(guī)則R:X→Y滿足support(X→Y)≥smin且confident(X→Y)≥cmin,則稱此規(guī)則為強(qiáng)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的目的就是找到符合條件的強(qiáng)關(guān)聯(lián)規(guī)則。
DEA[18]是常用于運(yùn)籌學(xué)和研究經(jīng)濟(jì)生產(chǎn)邊界的一種方法。該模型只需要研究輸入輸出數(shù)據(jù),不對(duì)數(shù)據(jù)進(jìn)行其他處理,不需要了解數(shù)據(jù)之間的某些關(guān)系,并且對(duì)于權(quán)重?zé)o任何要求,只從決策單元的實(shí)際輸入輸出數(shù)據(jù)求出最優(yōu)權(quán)重。
DEA是通過(guò)線性規(guī)劃方法將多個(gè)投入和產(chǎn)出指標(biāo)進(jìn)行效益評(píng)價(jià)的方法。DEA的優(yōu)點(diǎn)主要是權(quán)重由實(shí)際數(shù)據(jù)求得,沒(méi)有主觀因素的影響,不用對(duì)輸入和輸出之間的表達(dá)式加以明確。在DEA方法中,CCR模型和BCC模型是典型的模型。在DEA方法中,每一個(gè)評(píng)價(jià)單元為一個(gè)決策單元(decision making unit,DMU)。假設(shè)有n個(gè)決策單元,簡(jiǎn)稱DDMUj(j=1,2,…,n),每個(gè)決策單元有m項(xiàng)投入xij(i=1,2,…,m)和s個(gè)產(chǎn)出yrj(r=1,…,s),相應(yīng)的投入和產(chǎn)出向量分別記作Xj=(x1j,x2j,…,xmj)和Yj=(y1j,y2j,…,ymj)。
CCR模型是基于規(guī)模報(bào)酬不變的假設(shè)提出來(lái)的經(jīng)典DEA模型[19]。為方便模型求解和產(chǎn)能分析,引入松弛變量si-、sr+。其中:si-表示該決策單元為達(dá)到DEA有效應(yīng)減少的投入量,稱為超額變數(shù);sr+表示達(dá)到DEA 有效應(yīng)增加的產(chǎn)出量,稱為差額變數(shù)。CCR模型得到的是綜合技術(shù)效率,表示決策單元在最優(yōu)規(guī)模時(shí)投入要素的生產(chǎn)效率,反映了決策單元的資源配置的合理程度。
評(píng)價(jià)決策單元效益的CCR模式線性規(guī)劃模型為:
λj≥0,
ε=10-6
(1)
ε=10-6
(2)
該模型將綜合效率分解為純技術(shù)效率和規(guī)模效率,通過(guò)BCC模型得到純技術(shù)效率(technical efficiency,TE),即因管理和技術(shù)等因素影響的生產(chǎn)效率。規(guī)模效率(scale efficiency,SE)即由企業(yè)規(guī)模影響的生產(chǎn)因素。
SE=OE/TE
(3)
對(duì)于本文電力業(yè)務(wù)信息系統(tǒng)而言,其DEA效率的意義如下:綜合效率值等于1,該系統(tǒng)為DEA有效,即在當(dāng)前投入的情況下,所獲得的產(chǎn)出達(dá)到相對(duì)最優(yōu),同時(shí)技術(shù)和規(guī)模有效。也就是說(shuō)在該狀態(tài)下電力業(yè)務(wù)信息系統(tǒng)是處于非常健康狀態(tài)的。若綜合效率值小于1,則該系統(tǒng)DEA非有效,即該決策單元相對(duì)于其他決策單元綜合效率低,可根據(jù)純技術(shù)效率和規(guī)模效率分析造成該情況的原因。若純技術(shù)效率=1,表示在目前的技術(shù)水平上,其投入資源的使用是有效率的,未能達(dá)到綜合有效的根本原因在于其規(guī)模無(wú)效。
電力業(yè)務(wù)信息系統(tǒng)健康性評(píng)價(jià)模型框架如圖1所示,步驟如下:① 選擇數(shù)據(jù)。對(duì)電力業(yè)務(wù)信息系統(tǒng)進(jìn)行健康性評(píng)價(jià)合適的系統(tǒng)運(yùn)行數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。② 確定DEA評(píng)價(jià)模型的投入產(chǎn)出。根據(jù)日志信息數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,得到關(guān)聯(lián)規(guī)則模式,進(jìn)一步將得到的關(guān)聯(lián)規(guī)則進(jìn)行篩選,篩選后的關(guān)聯(lián)規(guī)則的先導(dǎo)作為投入,后繼作為產(chǎn)出。③ 利用 DEA 模型進(jìn)行系統(tǒng)評(píng)價(jià),得出DEA分析評(píng)價(jià)結(jié)果并提出決策建議。
圖1 電力業(yè)務(wù)信息系統(tǒng)健康性評(píng)價(jià)模型框架
某省電力公司人力資源系統(tǒng)的日志信息,主要包括人力資源數(shù)據(jù)庫(kù)、人力資源數(shù)據(jù)庫(kù)宿主機(jī)、人力資源中間件和人力資源應(yīng)用服務(wù)器等日志信息??紤]數(shù)據(jù)的可獲取性、一致性和完備性,本文選取了人力資源數(shù)據(jù)庫(kù)宿主機(jī)的日志信息進(jìn)行實(shí)驗(yàn)。進(jìn)一步利用正則表達(dá)式提取日志信息得到人力資源數(shù)據(jù)庫(kù)宿主機(jī)的運(yùn)行數(shù)據(jù),數(shù)據(jù)包括ID、Guideline-ID、Monitor-Date、Monitor-Value 等4個(gè)不同類型的屬性,其中:ID表示每個(gè)數(shù)據(jù)存儲(chǔ)的ID,作為主鍵;Guideline-ID包含18個(gè)指標(biāo),表示日志信息數(shù)據(jù),見表1所列;Monitor-Date表示檢測(cè)日期;Monitor-Value表示不同時(shí)間點(diǎn)各指標(biāo)對(duì)應(yīng)的值(2019年5月31日 11:00—2019年6月1日 11:00)。
表1 人力資源數(shù)據(jù)庫(kù)宿主機(jī)數(shù)據(jù)總指標(biāo)
為進(jìn)一步分析人力資源數(shù)據(jù)庫(kù)宿主機(jī)在不同時(shí)間(Monitor-Date)范圍內(nèi)的健康運(yùn)行狀況,首先對(duì)運(yùn)行數(shù)據(jù)進(jìn)行清洗,篩選信息完整的指標(biāo)進(jìn)行系統(tǒng)評(píng)價(jià)分析,刪除Monitor-Value值均為空值的指標(biāo)。利用相關(guān)性分析,刪除與各指標(biāo)之間相關(guān)系數(shù)為空值的指標(biāo)(空值表示該指標(biāo)的Monitor-Value值均相等),最終得到Guideline-ID包含7個(gè)指標(biāo)。所選取的指標(biāo)見表2所列,分別為CPU平均使用率、內(nèi)存剩余量、內(nèi)存分配率、內(nèi)存利用率、內(nèi)存占用量、連續(xù)運(yùn)行時(shí)間和存儲(chǔ)介質(zhì)利用率。其中內(nèi)存剩余量、內(nèi)存分配率、內(nèi)存利用率和內(nèi)存占用量4個(gè)指標(biāo)衡量了人力資源數(shù)據(jù)庫(kù)宿主機(jī)子系統(tǒng)中內(nèi)存的使用情況,連續(xù)運(yùn)行時(shí)間即系統(tǒng)截止目前時(shí)間點(diǎn)的運(yùn)行時(shí)間,存儲(chǔ)介質(zhì)利用率表示存儲(chǔ)數(shù)據(jù)載體的利用率,如硬盤的利用率。
表2 人力資源數(shù)據(jù)庫(kù)宿主機(jī)評(píng)價(jià)指標(biāo)
2.2.1 評(píng)價(jià)指標(biāo)的確定
本文利用Apriori關(guān)聯(lián)規(guī)則算法所提取的頻繁項(xiàng)集,綜合考慮指標(biāo)的數(shù)據(jù)質(zhì)量問(wèn)題[21],從而確定了DEA評(píng)價(jià)模型的投入與產(chǎn)出變量。關(guān)聯(lián)規(guī)則分析設(shè)置的最小支持度為0.5,最小置信度為0.7,由此產(chǎn)生關(guān)聯(lián)規(guī)則模式。從模式中選擇適當(dāng)?shù)年P(guān)聯(lián)規(guī)則,其前項(xiàng)作為投入,后項(xiàng)作為產(chǎn)出,所確定的指標(biāo)體系見表3所列。
表3 DEA評(píng)價(jià)模型的投入、產(chǎn)出指標(biāo)
2.2.2 基于DEA評(píng)價(jià)模型的系統(tǒng)健康性評(píng)價(jià)
在得到相應(yīng)的信息系統(tǒng)健康評(píng)價(jià)指標(biāo)后,本文將得到的投入產(chǎn)出指標(biāo)代入DEA模型中,得到系統(tǒng)的綜合效率、純技術(shù)效率、規(guī)模效率等,結(jié)果如圖2所示。
圖2 人力資源數(shù)據(jù)庫(kù)宿主機(jī)健康性評(píng)價(jià)結(jié)果
圖2中,時(shí)間段為2019年5月31日 11:00—2019年6月1日 11:00。因?yàn)闃颖緮?shù)量較多,直接列出每一個(gè)樣本對(duì)應(yīng)的效率不具有十分顯著的意義,所以以小時(shí)劃分?jǐn)?shù)據(jù)對(duì)人力資源數(shù)據(jù)庫(kù)宿主機(jī)健康性評(píng)價(jià)結(jié)果進(jìn)行統(tǒng)計(jì)和分析。首先從總體的效率得分進(jìn)行分析,其次統(tǒng)計(jì)非 DEA 有效的各時(shí)間段數(shù)據(jù)投入冗余和產(chǎn)出不足的情況,進(jìn)一步分析影響系統(tǒng)綜合效率的指標(biāo)。
在不同時(shí)間段內(nèi),系統(tǒng)健康性評(píng)價(jià)得分均值的計(jì)算結(jié)果見表4所列。從表4中可以看出,人力資源數(shù)據(jù)庫(kù)宿主機(jī)的綜合技術(shù)效益(OE)得分偏低,均值為0.642。造成得分偏低主要原因是規(guī)模效益(SE)偏低,即內(nèi)存、CPU容量過(guò)小或利用不足等原因。由圖2、表4可知,人力資源數(shù)據(jù)庫(kù)宿主機(jī)的綜合技術(shù)效率在23:00—次日02:00時(shí)間段內(nèi)健康得分較高,在11:30—12:00和次日05:30—06:30健康性評(píng)價(jià)得分波動(dòng)較大。
表4 人力資源數(shù)據(jù)庫(kù)宿主機(jī)各時(shí)間段健康性評(píng)價(jià)結(jié)果
根據(jù)綜合效率高低將系統(tǒng)評(píng)價(jià)結(jié)果進(jìn)行分類,結(jié)果見表5所列。綜合效率為1.0,即DEA有效的時(shí)間點(diǎn)有4個(gè),綜合效率在0.8以上的有50個(gè),綜合效率一般的時(shí)間點(diǎn)有93個(gè),綜合效率介于0.4~0.6之間的結(jié)果數(shù)占比最高,占總數(shù)的48.44%。人力資源數(shù)據(jù)庫(kù)宿主機(jī)系統(tǒng)在24 h中約有12 h的綜合效率低于0.6,存在較大的改進(jìn)空間。
表5 綜合效率分類結(jié)果
為進(jìn)一步探究在非DEA有效情形下各投入指標(biāo)的冗余情況,找出導(dǎo)致系統(tǒng)非DEA有效和綜合健康性效率偏低的根本原因,本文進(jìn)一步分析了各時(shí)間段非 DEA 有效數(shù)據(jù)的投入冗余和產(chǎn)出不足的情況,見表6所列。由表6可知,有285個(gè)非DEA有效的時(shí)間點(diǎn),其中內(nèi)存利用率、連續(xù)運(yùn)行時(shí)間、存儲(chǔ)介質(zhì)利用率、內(nèi)存占用量、內(nèi)存分配率投入冗余的數(shù)據(jù)量分別達(dá)到了34、238、262、284、284。整體來(lái)看,非DEA有效主要由存儲(chǔ)介質(zhì)利用率、內(nèi)存占用量和內(nèi)存分配率導(dǎo)致,其中存儲(chǔ)介質(zhì)利用率的投入冗余的數(shù)據(jù)在13:00—17:00和19:00—次日11:00較多,應(yīng)該合理提高三者的利用率。
表6 各時(shí)間段非DEA有效數(shù)據(jù)的投入冗余和產(chǎn)出不足情況
本文結(jié)合某省電力公司人力資源數(shù)據(jù)庫(kù)宿主機(jī)日志信息歷史數(shù)據(jù),對(duì)CPU平均使用率、內(nèi)存剩余量、內(nèi)存分配率、內(nèi)存利用率、內(nèi)存占用量、連續(xù)運(yùn)行時(shí)間和存儲(chǔ)介質(zhì)利用率等指標(biāo)進(jìn)行了統(tǒng)計(jì)與分析,利用Apriori關(guān)聯(lián)規(guī)則提取算法提取了信息系統(tǒng)的日志數(shù)據(jù)指標(biāo)的頻繁項(xiàng)集,進(jìn)而選取出能夠表達(dá)系統(tǒng)健康性的重要規(guī)則和信息。結(jié)合提取到的核心關(guān)聯(lián)規(guī)則,運(yùn)用DEA模型進(jìn)行確定系統(tǒng)健康度的投入與產(chǎn)出指標(biāo),根據(jù)提取出來(lái)的指標(biāo)對(duì)系統(tǒng)進(jìn)行了健康性評(píng)價(jià)。
研究發(fā)現(xiàn),從整體效率來(lái)看,人力資源數(shù)據(jù)庫(kù)宿主機(jī)的綜合技術(shù)效益得分偏低,主要是由于規(guī)模效益偏低造成的。對(duì)投入冗余的分析表明,存儲(chǔ)介質(zhì)利用率、內(nèi)存占用量和內(nèi)存分配率3個(gè)指標(biāo)導(dǎo)致人力資源數(shù)據(jù)庫(kù)宿主機(jī)的健康性效率偏低。
本文針對(duì)電力業(yè)務(wù)信息系統(tǒng)的運(yùn)行健康狀況開展了客觀性評(píng)價(jià)分析,提出的基于Apriori-DEA的評(píng)價(jià)方法能夠有效提取日志關(guān)聯(lián)信息,為系統(tǒng)運(yùn)行健康狀況的核心指標(biāo)選取及評(píng)價(jià)提供了理論依據(jù)。結(jié)果表明,基于Apriori的日志信息關(guān)聯(lián)規(guī)則提取可以通過(guò)合理的投入與產(chǎn)出分析,達(dá)到客觀、科學(xué)有效地評(píng)價(jià)電力業(yè)務(wù)信息系統(tǒng)的實(shí)時(shí)運(yùn)行狀況。需要指出的是,本文所建模型主要基于同一信息系統(tǒng)的連續(xù)時(shí)段歷史運(yùn)行數(shù)據(jù),未能考慮不同子系統(tǒng)之間的相互影響及其對(duì)比分析,忽略了子系統(tǒng)之間的動(dòng)態(tài)關(guān)聯(lián)關(guān)系,因而需要在將來(lái)的研究中進(jìn)一步拓展和完善。