(浙江工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023)
高校專業(yè)評價(jià)是指多個(gè)高校在某一專業(yè)上優(yōu)劣比較結(jié)果,為全面、準(zhǔn)確地表示評價(jià)結(jié)果,在高校專業(yè)評價(jià)的過程中需要以多個(gè)指標(biāo)為準(zhǔn)則[1-3],由于高校專業(yè)評價(jià)指標(biāo)涉及面廣、數(shù)據(jù)間差異大,因此解決該問題的評價(jià)方法需要在考慮以上因素的同時(shí)兼顧傳統(tǒng)觀念因素。目前被廣泛應(yīng)用到多指標(biāo)評價(jià)分析的方法主要有主成分分析法[4-5]、模糊綜合評判法、TOPSIS評價(jià)法、灰色關(guān)聯(lián)度分析法和熵權(quán)法等。文獻(xiàn)[6-10]將層次分析法(AHP)運(yùn)用到威脅評估、質(zhì)量評價(jià)等問題上,雖然可以快速、簡便地得出評價(jià)結(jié)果,但是評價(jià)過程過于依賴專家知識(shí)體系,獲得的指標(biāo)權(quán)重和評價(jià)結(jié)果缺乏客觀依據(jù)。文獻(xiàn)[11-12]通過對熵權(quán)法進(jìn)行改進(jìn)并應(yīng)用于實(shí)際評價(jià)問題中,雖然一定程度上改善了指標(biāo)權(quán)重精確度,但是仍然會(huì)因?yàn)閿?shù)據(jù)極端多寡導(dǎo)致評價(jià)結(jié)果失真。文獻(xiàn)[13-19]將多種評價(jià)方法結(jié)合建立多指標(biāo)評價(jià)決策模型,各模型都一定程度地降低了對人為因素的依賴、增加評價(jià)結(jié)果的穩(wěn)定性,但在主、客觀權(quán)重融合及評價(jià)結(jié)果的精確度上還有待提升。
筆者提出一種多組合賦權(quán)評價(jià)模型,通過主成分分析法提取原始樣本主成分,實(shí)現(xiàn)對復(fù)雜樣本數(shù)據(jù)的降維處理,在層次分析法執(zhí)行中引入多專家打分及熵值概念,并與熵權(quán)法獲取指標(biāo)權(quán)重綜合加權(quán)求得綜合權(quán)重,既大幅度減輕了指標(biāo)權(quán)重對專家經(jīng)驗(yàn)的依賴,又避免數(shù)據(jù)極端多寡導(dǎo)致的指標(biāo)權(quán)重失調(diào),最后采用二次加權(quán)的方式獲取更準(zhǔn)確的評價(jià)結(jié)果,并將這種多指標(biāo)評價(jià)模型應(yīng)用到高校專業(yè)評價(jià)問題中。
以各高校在計(jì)算機(jī)專業(yè)中排名問題為例,為該多指標(biāo)評價(jià)問題構(gòu)建指標(biāo)體系,基于指標(biāo)選取的契合性、針對性、系統(tǒng)性和科學(xué)性原則,參照層次分析法的關(guān)系模型,根據(jù)該問題的支配關(guān)系形成指標(biāo)體系層次結(jié)構(gòu),如表1所示。表1中:新生質(zhì)量、就業(yè)競爭力、科研力量和學(xué)校實(shí)力為一級(jí)指標(biāo)體系;二級(jí)指標(biāo)體系由計(jì)算機(jī)專業(yè)在該校的錄取分?jǐn)?shù)線、錄取最低名次、該校計(jì)算機(jī)專業(yè)學(xué)生總數(shù)、該校計(jì)算機(jī)專業(yè)學(xué)生的就業(yè)率、升學(xué)率、專業(yè)就業(yè)對口度、就業(yè)后的滿意度、雇主滿意度、平均薪酬、計(jì)算機(jī)專業(yè)教師學(xué)生發(fā)表論文單篇引用數(shù)、H指數(shù)、發(fā)表論文數(shù)、計(jì)算機(jī)專業(yè)老師數(shù)、教授的比例、高校批次及高校辦學(xué)地的城市等級(jí)16 個(gè)指標(biāo)組成。在前期的研究中,發(fā)現(xiàn)科研力量及學(xué)校實(shí)力等多項(xiàng)指標(biāo)均成線性相關(guān),解釋的信息有重疊,因此基于對信息的高效性與簡潔可操作性原則,科研力量主要從論文產(chǎn)出來做解釋。
表1 高校專業(yè)排名指標(biāo)體系Table 1 University professional ranking index system
在高校專業(yè)評價(jià)原始指標(biāo)體系中二級(jí)指標(biāo)變量較多,且多指標(biāo)數(shù)據(jù)之間通常具有一定的相關(guān)性,得到的評價(jià)結(jié)果往往效果較差。用層次分析法(AHP)求多指標(biāo)權(quán)重時(shí),重要性判斷過于依賴專家的知識(shí)體系和經(jīng)驗(yàn),評價(jià)結(jié)果很大程度受到主觀因素的影響。高校專業(yè)評價(jià)問題受多個(gè)指標(biāo)的影響,精度要求較高,對于多指標(biāo)的子層指標(biāo)體系評價(jià)準(zhǔn)則往往偏差較大;熵權(quán)法(IE)求指標(biāo)權(quán)重的結(jié)果完全取決于客觀的樣本數(shù)據(jù),因此原始數(shù)據(jù)的差異性決定了權(quán)重的大小,而實(shí)際應(yīng)用中往往存在許多特殊數(shù)據(jù)導(dǎo)致獲取的權(quán)重與人們的常識(shí)相差過多。筆者通過改進(jìn)、結(jié)合3 種多指標(biāo)評價(jià)算法,來得到更加客觀、穩(wěn)定的權(quán)重。利用PCA的降維思想結(jié)合樣本數(shù)據(jù)的差異性來選擇綜合排名指標(biāo),實(shí)現(xiàn)對不同量綱單位數(shù)據(jù)的歸一化處理,從而構(gòu)造性質(zhì)較好的樣本數(shù)據(jù),更準(zhǔn)確地映射評價(jià)結(jié)果。表1中高校專業(yè)評價(jià)指標(biāo)體系一級(jí)指標(biāo)屬于對高校專業(yè)評價(jià)領(lǐng)域相對抽象的主觀認(rèn)知,二級(jí)指標(biāo)為樣本數(shù)據(jù)的客觀映射,首先通過引入多專家打分機(jī)制和熵值概念改進(jìn)層次分析法,分別獲得一級(jí)指標(biāo)和對應(yīng)的二級(jí)指標(biāo)的權(quán)重,從而消除傳統(tǒng)層次分析法中1~9標(biāo)度對多指標(biāo)間重要差異性難區(qū)分的問題,同時(shí)很大程度上避免權(quán)重計(jì)算因過于依賴人的主觀意識(shí)致使評價(jià)結(jié)果有失客觀性及準(zhǔn)確度的問題;然后采用熵權(quán)法對下層指標(biāo)體系求權(quán)重,將層次分析和熵權(quán)法得到的指標(biāo)體系權(quán)重進(jìn)行一系列的綜合加權(quán)處理獲得綜合指標(biāo)權(quán)重,最后對綜合指標(biāo)權(quán)重采用二次加權(quán)的方法求評價(jià)結(jié)果,從而兼顧所有評價(jià)指標(biāo)的影響,避免指標(biāo)權(quán)重失調(diào)引起評價(jià)結(jié)果的失真。具體步驟如下。
假設(shè)高校排名實(shí)例樣本數(shù)據(jù)中有n個(gè)樣本,指標(biāo)評價(jià)體系中有k個(gè)一級(jí)指標(biāo),m個(gè)二級(jí)指標(biāo)項(xiàng),則可構(gòu)成由樣本和指標(biāo)項(xiàng)數(shù)據(jù)組合的原始矩陣Y=(yij)n×m,其中yij表示第i個(gè)高校對象在第j個(gè)排名指標(biāo)上的值。
(1)
2) 依據(jù)標(biāo)準(zhǔn)化矩陣均值為0,方差為1的規(guī)則,計(jì)算標(biāo)準(zhǔn)化矩陣C的相關(guān)系數(shù)矩陣R為
(2)
(3)
4) 通過選取在主成分中載荷量較大的r個(gè)指標(biāo)來作為新指標(biāo)體系的二級(jí)指標(biāo),代替原有的樣本指標(biāo)項(xiàng)來表示所有的樣本信息,構(gòu)成綜合指標(biāo)體系。
對上述綜合指標(biāo)體系中的一級(jí)指標(biāo)及對應(yīng)的二級(jí)指標(biāo)求解權(quán)重,以k個(gè)一級(jí)指標(biāo)求解為例,為指標(biāo)重要性設(shè)置100 分制評分表,如表2所示。采用v個(gè)專家分別對各指標(biāo)重要性打分,再結(jié)合1~9 標(biāo)度法(表3)對指標(biāo)重要性分值進(jìn)行兩兩比較建立v個(gè)判斷矩陣,第q個(gè)判斷矩陣為
Pq=(pqij)k×k
式中pqij為第q個(gè)專家比較矩陣中第i個(gè)指標(biāo)比第j個(gè)指標(biāo)的重要度,則第q個(gè)專家判斷矩陣對應(yīng)的權(quán)重集合記為wq,且wqi表示根據(jù)第q個(gè)專家指標(biāo)評分得到的第i個(gè)指標(biāo)權(quán)重,其計(jì)算式為
(4)
式中zi為中間變量,表示第q個(gè)專家指標(biāo)評分中第i個(gè)指標(biāo)的相對權(quán)重,通過對k各指標(biāo)的相對權(quán)重進(jìn)行歸一化處理,得到第q個(gè)專家指標(biāo)評分得到的第i個(gè)指標(biāo)權(quán)重wqi。對第q個(gè)專家判斷矩陣進(jìn)行一致性檢驗(yàn),其計(jì)算式為
(5)
(6)
將一級(jí)指標(biāo)權(quán)重向量記為B={β1,β2,…,βk},同理求出一級(jí)指標(biāo)對應(yīng)的二級(jí)指標(biāo)權(quán)重向量記為Φ={φ1,φ2,…,φr}。
表2 指標(biāo)重要度評分表Table 2 Index importance score
表3 1~9標(biāo)度法規(guī)則表Table 3 Levels scale method
表4 平均隨機(jī)一致性指標(biāo)Table 4 RI index
1) 根據(jù)主成分分析法確定的n個(gè)高校樣本及r個(gè)綜合排名二級(jí)指標(biāo)項(xiàng)組成原始矩陣T為
T=(tij)n×r
對T進(jìn)行標(biāo)準(zhǔn)化處理,包括對去除排名指標(biāo)單位不同造成的影響而進(jìn)行的無量綱化處理和為減少指標(biāo)數(shù)據(jù)極端值對排名結(jié)構(gòu)的影響而進(jìn)行的歸一化處理,得到標(biāo)準(zhǔn)化矩陣為A=(aij)n×r,aij可表示為
(7)
式中:tmax,tmin分別為原始數(shù)據(jù)中最優(yōu)值與最差值。
2) 根據(jù)數(shù)學(xué)上熵值的定義可得出第j個(gè)評價(jià)指標(biāo)的熵值為
(8)
式中:sij為第j個(gè)指標(biāo)在第i個(gè)樣本下的比重;熵值Ej取值為0~1。
3) 根據(jù)得到的熵值,定義熵權(quán)法權(quán)重向量為Ψ={ψ1,ψ2,…,ψr}。熵值與熵權(quán)呈現(xiàn)反比關(guān)系,熵權(quán)越大,熵值越小,說明該指標(biāo)在評價(jià)體系中作用越重要,熵權(quán)為
(9)
1) 將改進(jìn)層次分析法得到的二級(jí)權(quán)重Φ={φ1,φ2,…,φr},結(jié)合熵權(quán)法得到指標(biāo)權(quán)重Ψ={ψ1,ψ2,…,ψr},計(jì)算二級(jí)指標(biāo)綜合權(quán)重為T={t1,t2,…,tr},其計(jì)算式為
(10)
2) 按照主成分分析得到的k個(gè)一級(jí)指標(biāo)與r個(gè)二級(jí)指標(biāo)的對應(yīng)關(guān)系,對綜合指標(biāo)權(quán)重T重新定義為T={t11,t12,…,t1n1,…,tk1,tk2,…,tknk},其中tini即第i個(gè)一級(jí)指標(biāo)對應(yīng)的第ni個(gè)二級(jí)指標(biāo)權(quán)重,ni表示第i個(gè)一級(jí)指標(biāo)對應(yīng)的二級(jí)指標(biāo)數(shù)。分別對第i個(gè)一級(jí)指標(biāo)對應(yīng)的二級(jí)指標(biāo)綜合指標(biāo)進(jìn)行歸一化處理,結(jié)果記為Ω={ω11,ω12,…,ω1n1,…,ωk1,ωk2,…,ωknk},其中ωij為
(11)
3) 將一級(jí)指標(biāo)權(quán)重向量B與綜合二級(jí)指標(biāo)權(quán)重向量Ω進(jìn)行2 次加權(quán),得出高校專業(yè)評價(jià)模型為
(12)
式中xikl為第l個(gè)高校專業(yè)在第i個(gè)一級(jí)指標(biāo)對應(yīng)的第k個(gè)二級(jí)指標(biāo)項(xiàng)對應(yīng)的樣本數(shù)據(jù),這種2 次加權(quán)模型很好地將主、客觀權(quán)重組合到一起,保證了評價(jià)模型的科學(xué)性、穩(wěn)定性及準(zhǔn)確性。
實(shí)例選取116 個(gè)高校的計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的16 個(gè)評價(jià)指標(biāo)在2016 年各項(xiàng)數(shù)據(jù)作為實(shí)驗(yàn)樣本數(shù)據(jù),即樣本n=116,指標(biāo)項(xiàng)m=16。
1) 將上述116 個(gè)樣本,16 個(gè)排名指標(biāo)項(xiàng)數(shù)據(jù)作為原始矩陣,對原始樣本矩陣進(jìn)行同一量綱下的標(biāo)準(zhǔn)化處理,計(jì)算出關(guān)系矩陣R,利用SPSS工具計(jì)算相關(guān)矩陣R的累積貢獻(xiàn)率等,如表5所示。
表5 樣本總方差分解表Table 5 Total varlance explained
由表5可知:前4 個(gè)主成分的累積貢獻(xiàn)率為82.5%,超過80%,基本代表了原始樣本的所有信息量。根據(jù)載荷矩陣規(guī)則得出:第1個(gè)主成分主要由C7(就業(yè)滿意度),C8(雇主滿意度),C9(平均薪酬),C15(高校批次)決定;第2 個(gè)主成分主要由C10(單篇引用數(shù)決定),C11(H指數(shù)),C14(教授占比)決定;第3 個(gè)主成分主要由C1(錄取分?jǐn)?shù)線),C2(錄取最低名次)決定;第4 個(gè)主成分主要由C16(辦學(xué)地城市等級(jí))決定。上述10 個(gè)排名指標(biāo)分別在4 個(gè)主成分中載荷較大,可代替原有的16 個(gè)指標(biāo),大大減少了需要分析的變量數(shù)。
2) 從上述116 個(gè)樣本中選取80 個(gè)樣本數(shù)據(jù)比較完整的高校結(jié)合主成分分析得出的10 個(gè)主成分排名指標(biāo)組成的新矩陣進(jìn)行相關(guān)性檢驗(yàn),考察指標(biāo)間的聯(lián)系和區(qū)別及指標(biāo)的交叉影響,實(shí)現(xiàn)對指標(biāo)體系的優(yōu)化。從檢驗(yàn)結(jié)果(篇幅有限,此處不贅述)得出多項(xiàng)指標(biāo)存在相關(guān)性關(guān)系,考慮同一量綱下對于樣本中缺失項(xiàng)數(shù)據(jù)的兩種處理方法為(1) 替代轉(zhuǎn)化:由樣本數(shù)據(jù)結(jié)論可知,雇主滿意度和就業(yè)滿意度存在可替代關(guān)系,利用線性回歸系數(shù)加以處理,可以較為合理地解決滿意度數(shù)據(jù),因此可將這兩項(xiàng)整合為一個(gè)綜合指標(biāo);(2) 相關(guān)性均值填充:因?yàn)閿?shù)據(jù)顯示,多項(xiàng)指標(biāo)的數(shù)值浮動(dòng)較大,故不適合用全體均值來填充缺項(xiàng),但發(fā)現(xiàn)各項(xiàng)指標(biāo)間的相關(guān)性存在顯著,如若A校缺少P指標(biāo),P指標(biāo)與Q指標(biāo)顯著線性相關(guān),高校按照Q指標(biāo)排名,取A校臨近4 個(gè)高校P指標(biāo)均值進(jìn)行填充。
依據(jù)以上規(guī)則,結(jié)合主成分分析法得到綜合指標(biāo)體系的二級(jí)指標(biāo)集合為S={錄取分?jǐn)?shù)線,錄取最低名次,就業(yè)滿意度,平均薪酬,單篇引用數(shù)決定,H指數(shù),教授占比,高校批次,辦學(xué)地城市等級(jí)},對116 個(gè)樣本中的缺失項(xiàng)數(shù)據(jù)進(jìn)行補(bǔ)全后得到矩陣T,表示為
T=(tij)n×ri=1,…,n;j=1,…r;n=116;r=9
3) 高校專業(yè)評價(jià)綜合指標(biāo)體系一級(jí)指標(biāo)集合Z={新生質(zhì)量,就業(yè)競爭力,科研力量,高校實(shí)力},利用改進(jìn)層次分析法求綜合指標(biāo)體系權(quán)重。參考3 位專家對綜合指標(biāo)體系的評分意見,可構(gòu)成一級(jí)指標(biāo)打分矩陣A為
以一級(jí)指標(biāo)求權(quán)重為例,根據(jù)每個(gè)專家的評分情況,結(jié)合1~9 標(biāo)度法構(gòu)成5 個(gè)判斷矩陣,對第i個(gè)矩陣通過式(4)求出第i個(gè)專家評分對應(yīng)的指標(biāo)權(quán)重向量Wi,并通過一致性檢驗(yàn)獲取滿足一致性要求的指標(biāo)權(quán)重向量。即W1={0.226,0.293,0.165,0.316},W2={0.257,0.231,0.103,0.409},W3={0.308,0.199,0.207,0.286},W4={0.297,0.145,0.239,0.319},W5={0.273,0.233,0.177,0.317}。將得到的3 個(gè)一級(jí)指標(biāo)權(quán)重向量組合成權(quán)重矩陣W。
對權(quán)重矩陣W利用熵值概念,通過式(6)求出指標(biāo)相對客觀權(quán)重向量B={0.293,0.203,0.113,0.391},同理利用改進(jìn)的層次分析法分別求出一級(jí)指標(biāo)對應(yīng)的二級(jí)指標(biāo)向量Φ={0.761,0.239,0.376,0.624,0.733,0.267,0.275,0.479,0.246},如表6所示。
表6 改進(jìn)層次分析法求指標(biāo)權(quán)重
Table 6 Improved analytic hierarchy process to obtain index weight
總體目標(biāo)評價(jià)準(zhǔn)則評價(jià)指標(biāo)高校專業(yè)評價(jià)A新生質(zhì)量(0.293)錄取分?jǐn)?shù)線(0.761)錄取最低名次(0.239)就業(yè)競爭力(0.203)就業(yè)滿意度(0.376)平均薪酬(0.624)科研力量(0.113)論文單篇引用數(shù)(0.733)論文產(chǎn)出H-指數(shù)(0.267)高校實(shí)力(0.391)教授占比(0.275)高校批次(0.479)辦學(xué)地城市等級(jí)(0.246)
4) 熵權(quán)法求綜合指標(biāo)體系二級(jí)指標(biāo)權(quán)重,參照式(7)對主成分分析法得到的矩陣T進(jìn)行標(biāo)準(zhǔn)化處理,得到矩陣A作為熵權(quán)法的標(biāo)準(zhǔn)化矩陣,指標(biāo)項(xiàng)集合為S,得到的權(quán)重集合為φ={0.053,0.242,0.138,0.116,0.211,0.105,0.034,0.066,0.035}。然后,參照公式(10),將熵權(quán)法獲得的二級(jí)指標(biāo)權(quán)重φ,結(jié)合改進(jìn)層次分析法得到的二級(jí)權(quán)重Φ求得綜合二級(jí)指標(biāo)權(quán)重集合T={0.089,0.127,0.114,0.159,0.34,0.062,0.02,0.07,0.019}。參照式(11)對綜合二級(jí)指標(biāo)權(quán)重進(jìn)行歸一化處理得當(dāng)標(biāo)準(zhǔn)化綜合二級(jí)指標(biāo)權(quán)重Ω={0.412,0.588,0.418,0.582,0.846,0.154,0.184,0.642,0.174}。
最后利用加權(quán)評價(jià)模型式(12)對改進(jìn)層次分析法得到的一級(jí)權(quán)重B及綜合二級(jí)指標(biāo)權(quán)重Ω進(jìn)行二次加權(quán)求解,求得高校專業(yè)評價(jià)結(jié)果。表7為筆者評價(jià)模型及層次分析法得到的部分高校在計(jì)算機(jī)專業(yè)上排名結(jié)果,根據(jù)層次分析得到的結(jié)果中武漢大學(xué)排名明顯高過北京郵電大學(xué),因?yàn)閷哟畏治龇▽<医?jīng)驗(yàn)給出的錄取分?jǐn)?shù)線權(quán)重較高,而武漢大學(xué)在錄取分?jǐn)?shù)線高于北京郵電大學(xué),而其他大部分指標(biāo)數(shù)據(jù)較為劣勢的情況下得到較高的排名,這與傳統(tǒng)觀念相差甚遠(yuǎn)。經(jīng)驗(yàn)證,筆者提出的評價(jià)模型獲得的評價(jià)結(jié)果具有較高的準(zhǔn)確度和穩(wěn)定性,該評價(jià)模型合理、可行且易操作。
表7 計(jì)算機(jī)專業(yè)高校排名Table 7 University rankings in computer science
筆者通過改良高校專業(yè)評價(jià)的指標(biāo)設(shè)計(jì)體系,提出了基于PCA-AHP-IE的多指標(biāo)評價(jià)模型,很好地避免了評價(jià)結(jié)果過于依賴主觀經(jīng)驗(yàn)或客觀數(shù)據(jù),也避免了因數(shù)據(jù)極端多寡或?qū)<抑R(shí)庫結(jié)構(gòu)不同而導(dǎo)致評價(jià)結(jié)果與人們的正常認(rèn)知或?qū)嶋H情況不符的情景,既符合樣本數(shù)據(jù)的內(nèi)在規(guī)律,又能滿足專家及大眾的普遍認(rèn)知。該評價(jià)模型可以有效、合理地應(yīng)用到高校專業(yè)評價(jià)這類多指標(biāo)評價(jià)研究中,但是算法仍存在一些不足之處,指標(biāo)體系仍受限于數(shù)據(jù)的不完善,希望在以后的研究中繼續(xù)改進(jìn)。