劉麗華,宗曉華
(南京大學 教育研究院,南京 210093)
《統(tǒng)籌推進世界一流大學和一流學科建設總體方案》指出要堅持以績效為杠桿,充分激發(fā)高校內(nèi)生動力和發(fā)展活力。研究型高校的知識創(chuàng)新和科研能力是國家科技創(chuàng)新和經(jīng)濟發(fā)展的重要源泉,“985工程”等高校重點建設工程存在身份固化、競爭缺失、重復交叉等問題。合理評價研究型大學的科研效率,對加快“雙一流”建設和推動高等教育內(nèi)涵式發(fā)展具有重要的現(xiàn)實意義。
近年來,無需預設函數(shù)和參數(shù)的數(shù)據(jù)包絡分析(DEA)因其簡單方便備受學者青睞,[1]指標體系更關注質量因素,評價單元更小、分類更細和評價模型更復雜的方向發(fā)展。然而經(jīng)典DEA模型與引用Tobit模型進行影響因素分析的二階段DEA模型,均沒有將環(huán)境變量和隨機干擾分離出來,而是片面的將其歸入投入和產(chǎn)出變量中,使得測量的結果是有偏的。[2][3]盡管部分研究嘗試剔除環(huán)境變量和隨機干擾的三階段DEA研究,但是均側重于第三階段所謂真實效率值的解釋上。研究者在分區(qū)域、類型、層級等方面評價高??蒲行实慕Y果不盡相同,在沒有充分論證環(huán)境變量選擇的基礎上的真實值的解釋是有待商榷的。
地理位置包含經(jīng)濟發(fā)展、科技水平、文化氛圍等要素信息,不同的指標得到的結果可能截然相反。正因如此,高??蒲行逝c所在地區(qū)經(jīng)濟發(fā)展之間的關系方面,學者們并未達成共識。[4][5][6][7]已有研究發(fā)現(xiàn),產(chǎn)出容易量化的理工農(nóng)醫(yī)類院校的科研效率優(yōu)于人文社科類占優(yōu)勢的高校(如財經(jīng)類、師范類),[8]辦學實力較強的“985工程”和“211工程”高??蒲行蕛?yōu)于一般本科院校。[9]
部分研究還探討了地區(qū)教育環(huán)境、校企合作環(huán)境與國際交流環(huán)境等環(huán)境因素的影響,[10]地區(qū)經(jīng)濟發(fā)展水平、教育水平與科技水平具有循環(huán)溢出效應,[11]而以交流人數(shù)為變量的國際交流環(huán)境是高??梢钥刂频膬?nèi)部因素。剔除環(huán)境變量的本意是將所有高校置于相同外部環(huán)境下,比較各高校的管理及努力程度與規(guī)模效益情況,高??梢酝ㄟ^努力調整的影響因素不在探索更為公平的研究型大學科研效率評價范圍之內(nèi)。因此本文通過選取突出科研質量和貢獻的指標體系,采用熵值法客觀賦予權重,利用2011年至2015年59所部屬高校數(shù)據(jù),構建基于產(chǎn)出導向的三階段DEA模型,對控制與不控制地區(qū)、層級和類型等環(huán)境因素以及隨機因素的影響進行對比實證分析。
本著全面性、科學性、層次性、可比性和可操作性的原則,本文的投入產(chǎn)出指標和環(huán)境變量如表1所示。有效樣本59所高校,數(shù)據(jù)由《教育部直屬高?;厩闆r統(tǒng)計資料匯編》(2010年—2015年)整理,并用熵值法客觀賦權計算,[12]其中,考慮到科研活動從投入到產(chǎn)出的轉化周期,參考對轉化周期的已有研究,[13][14][15]本文將轉化周期定為 1 年,即產(chǎn)出指標數(shù)據(jù)滯后 1 年。
表1 研究型高校科研效率分析指標
從生產(chǎn)要素理論出發(fā),可以將大學科研投入分為人力、物力和財力三方面。但是高校的物力投入(實驗室面積等)和經(jīng)費中的基本建設費用通常在短時間內(nèi)不變或者某一年份忽然增加,存在偶然性和不確定性,而人力投入中起中堅作用的主要是專任教師,因此投入方面選用專任教師數(shù)量作為人力投入的指標,人文社科的科研經(jīng)費與自然科學科研經(jīng)費之和作為財力投入的指標。
大學科研產(chǎn)出的度量方面存在質量難以測量、與教學社會服務界限不清楚、產(chǎn)出各維度賦值困難等問題。僅以發(fā)表論文數(shù)量這種量化指標顯然是偏頗的,AHP方法賦予各維度權重帶有主觀經(jīng)驗的色彩。本文產(chǎn)出指標分為科研論文、科研獲獎和社會服務三個二級指標。在三級指標選取上,人文社科與自然科學并重,僅使用層次較高或認可度較高的產(chǎn)出,并用科研論文被引用量和影響力等來強化質量導向。在數(shù)據(jù)處理上,采用熵值法賦權計算,避免了經(jīng)驗主義和人為干擾,體現(xiàn)了客觀性和科學性。
環(huán)境變量,又稱外部影響因素,其選擇遵循兩個基本原則。首先,環(huán)境變量對松弛變量(本文采用產(chǎn)出導向,即一階段得到的目標值與實際值的差值)和決策單元(樣本高校)有影響,又不受決策單元控制;其次,環(huán)境變量不受單位影響。結合外部環(huán)境影響因素經(jīng)典的PEST模型,考慮到高校背景,選取學校層次、地理位置和學校類型三個指標。是否為985工程高校既能體現(xiàn)出層次分類,又一定程度上暗含政策影響,即政府支持力度。從短期來看,政府的支持對高??蒲挟a(chǎn)出具有促進作用,“985”工程高校在選擇年度區(qū)間內(nèi)獲得政府多維度的支持,[16]集聚了大量社會資源。地理位置[17]選用是否為東部地區(qū)作為虛擬變量,我國東部沿海省份占據(jù)良好的地理優(yōu)勢,經(jīng)濟發(fā)展水平較高,產(chǎn)業(yè)聚集程度較高,為東部地區(qū)高校創(chuàng)造了良好的經(jīng)濟環(huán)境和文化環(huán)境。學校類型選用理工農(nóng)醫(yī)學科學生占比這一指標,相較于人文社科專業(yè),理工科專業(yè)往往可以獲得更多的來自國家和社會的經(jīng)費支持,科研成果產(chǎn)出周期相對較短,更容易用數(shù)量指標度量。[18]而且,學校類型會形成獨特的校園文化,在目標模糊的組織中可能存在路徑依賴。[19]
第一階段:基于產(chǎn)出導向的BCC模型分析初始效率
數(shù)據(jù)包絡分析(Data Envelopment analysis,簡稱DEA模型)用于評價相同部門間的相對有效性已經(jīng)比較成熟,本文不再贅述?;谘芯磕康暮蛿?shù)據(jù)決策單元特點,在第一階段選用基于產(chǎn)出導向的規(guī)模收益可變的BCC模型得到各決策單元的效率值和諸產(chǎn)出的松弛變量。對于任一決策單元,產(chǎn)出導向下對偶形式的BCC模型可表示為:
其中ε為非阿基米德無窮小量。根據(jù)BCC模型中uo的的取值大小判斷模型的規(guī)模收益情況:
(i)對于投入產(chǎn)出組合(xo,yo)規(guī)模收益不變當且僅當在某個最優(yōu)解情況下有=0;
(ii)對于投入產(chǎn)出組合(xo,yo)規(guī)模收益遞增當且僅當在所有最優(yōu)解情況下都有<0;
(iii)對于投入產(chǎn)出組合(xo,yo)規(guī)模收益遞減當且僅當在所有最優(yōu)解情況下都有>0。
第二階段:類SFA模型獲得調整后的產(chǎn)出指標
決策單元的績效受到管理無效率、環(huán)境因素和隨機誤差的影響,因此有必要分離這三種影響,[20]但是傳統(tǒng)DEA模型沒有考慮環(huán)境因素和隨機噪聲對決策單元效率評價的影響,而且Tobit回歸不能有效分離隨機噪聲的影響。借助SFA回歸的三階段DEA[21]可以有效解決這一問題,以各產(chǎn)出松弛變量為因變量,各環(huán)境因素為自變量建立隨機前沿分析模型(SFA)如下:
其中,Sni是第i個決策單元第n項投入的松弛值;Zi是環(huán)境變量,βn是環(huán)境變量的系數(shù);vni+μni是混合誤差項,vni表示隨機干擾,μni表示管理無效率。其中v~N(0)是隨機誤差項,表示隨機干擾因素對投入松弛變量的影響;μ是管理無效率,表示管理因素對投入松弛變量的影響,假設其服從在零點截斷的正態(tài)分布,即 μ ~N+(0)。
結合Fried對環(huán)境變量的處理辦法和 JLMS推導公式的原理,[22]對管理無效率項進行如下分離:[23][24]
第三階段:調整后的投入產(chǎn)出變量的BCC模型效率分析
運用調整后的投入產(chǎn)出變量再次測算各決策單元的效率,此時的效率已經(jīng)剔除環(huán)境因素和隨機因素的影響,理論上是相對真實準確的。
第一階段運用以產(chǎn)出為導向的BCC模型計算59所研究型樣本院校的技術效率、純技術效率和規(guī)模效率(表2)。在不考慮環(huán)境因素和隨機干擾下,北京大學、清華大學、北京師范大學、南開大學、復旦大學、華東理工大學、華東師范大學、南京大學和陜西師范大學這九所高校位于生產(chǎn)前沿面上,相對效率較高。我國研究型高校的平均技術效率為0.514、平均純技術效率為0.595、平均規(guī)模效率為0.872,純技術效率比規(guī)模效率低27.7個百分點。除了中山大學、廈門大學、西南大學、北京林業(yè)大學、北京化工大學、中國藥科大學和北京中醫(yī)藥大學這7所高校的純技術效率分別比規(guī)模效率高7.00、0.80、12.00、42.70、52.20、67.10、69.80個百分點之外,43所高校的純技術效率比規(guī)模效率低,排名最后的西南交通大學純技術效率比規(guī)模效率低94.3個百分點。
表2 我國59所研究型樣本高校第一階段科研效率情況
分析發(fā)現(xiàn)(圖1),大部分高校規(guī)模效率較高、純技術效率較低。其中純技術效率和規(guī)模效率均低于全國平均水平的是北京郵電大學、西北農(nóng)林科技大學、同濟大學、重慶大學、華中農(nóng)業(yè)大學、中國海洋大學、四川大學、中南大學、吉林大學、武漢理工大學、中國農(nóng)業(yè)大學和南京農(nóng)業(yè)大學這12所高校,其中農(nóng)林院校占了4所,非東部高校占了6所。而且,規(guī)模效率最低的4所高校均為東部地區(qū)規(guī)模并不大的高校。這種具有集聚性的結果可能是有偏差的。我們推斷這種偏誤可能是經(jīng)典DEA未考慮外部環(huán)境因素和隨層次、類型、所處地區(qū)經(jīng)濟狀況、科技水平、政府政策導向以及文化傳統(tǒng)等方面存在差異,將所有決策單元視作同一類型進行比較與事實不符。將各個決策單元致于相同的外部環(huán)境下是非常必要的。
圖1 經(jīng)典DEA純技術效率和規(guī)模效率分布的散點圖
以第一階段計算得到的松弛變量作為因變量,是否為985工程院校、是否為東部高校和理工農(nóng)醫(yī)學科本科生占比這三個環(huán)境變量作為自變量構建類SFA回歸,結果如表3所示。
產(chǎn)出變量的松弛變量是指約束條件均達標之后,仍然可以改進的部分。如果回歸系數(shù)為正,說明環(huán)境變量值的增加有利于該項科研產(chǎn)出的增加?;貧w系數(shù)為負,則說明環(huán)境變量值的增加不利于該項科研產(chǎn)出的增加。985高校的社會服務松弛變量顯著為正,說明其在社會服務指標上表現(xiàn)優(yōu)秀,存在低估;科研論文同樣為正但是不顯著;科研獲獎松弛變量顯著為負,說明985高校在這方面沒有發(fā)揮出優(yōu)勢。東部地區(qū)高校在社會服務上表現(xiàn)顯著高于非東部地區(qū),但是在科研論文和科研獲獎方面并沒有優(yōu)勢。理工科院校在科研論文、科研獲獎和社會服務方面松弛變量均顯著為正,均表現(xiàn)優(yōu)秀,存在低估。與此相對,人文社科占比較大的高校在這些方面并不突出。綜上,外部環(huán)境對科研效率的影響不容忽視,采用剔除環(huán)境變量和隨機干擾的三階段DEA不失為一種可行的方法。
表3 我國59所研究型樣本高校外部環(huán)境似SFA回歸結果
1.經(jīng)典DEA與第三階段DEA的結果存在顯著差異
從產(chǎn)出變量中剔除外部環(huán)境因素和隨機因素干擾后,再次使用基于產(chǎn)出導向的BCC模型測算大學科研效率(表4)??刂骗h(huán)境因素和隨機因素后,第三階段我國研究型高校的平均技術效率為0.623、平均純技術效率為0.688、平均規(guī)模效率為0.892,比第一階段分別高出10.9、9.3和2.4個百分點;第三階段純技術效率比規(guī)模效率低20.8個百分點(差距較第一階段減少約7個百分點)。剔除外界環(huán)境變量和隨機干擾的影響對大學科研效率的影響較大??傮w而言,純技術效率是制約我國高校技術效率的主要因素。
剔除環(huán)境因素和隨機干擾后我國研究型高校的規(guī)模狀態(tài)變化較大,相較于第一階段的規(guī)模遞增狀態(tài)的高校數(shù)量遠多于規(guī)模遞減和規(guī)模不變狀態(tài)的高校數(shù)量,第三階段處于規(guī)模遞減狀態(tài)的高校數(shù)量達40所,大約是規(guī)模不變(10所)或規(guī)模遞增(9所)狀態(tài)的高校的4倍。在59個樣本高校中規(guī)模遞減狀態(tài)高校增加了19所,其中,東部地區(qū)增加10所(11/34),非東部地區(qū)高校增加9所(9/25)。
表4 我國59所研究型樣本高校第三階段科研效率情況
與圖1相比,第三階段DEA純技術效率和規(guī)模效率分布更為分散,規(guī)模效率與純技術效率低于平均值的院校顯著增加。盡管控制環(huán)境因素和隨機因素之后,整體效率有所提升,但是分布更為分散。而且規(guī)模效率較低的四所高校均為規(guī)模較大的綜合類高校。
圖2 第三階段DEA純技術效率和規(guī)模效率分布的散點圖
圖3 技術效率分布概率密度圖
剔除外界環(huán)境變量和隨機干擾的影響前后技術效率的概率密度變化如圖3所示。調整之后我國高??蒲屑夹g效率水平顯著提高,出現(xiàn)三個小高峰,分別大約在技術效率的0.4、0.7和0.9處。
利用配對t檢驗(Paired t test)[25]檢驗經(jīng)典DEA與第三階段DEA的結果是否存在顯著差異。技術效率、純技術效率和規(guī)模效率的配對t檢驗的值分別是0.00024(<0.05)、0.00028(<0.05)和0.33;即技術效率和純技術效率的結果是有顯著差異的,規(guī)模效率的結果不顯著,不能拒絕沒有顯著差異的原假設。綜上,經(jīng)典DEA與第三階段DEA的結果在數(shù)值、顯著性及分布等方面均存在明顯差異,即環(huán)境因素和隨機干擾對大學科研效率具有重要影響。
2.經(jīng)典效率評價低估了非東部高校、非“985”高校、理工類高校的科研效率
調整前后技術效率變化高達110%以上的高校有11個,均為理工農(nóng)醫(yī)比例較大的高校(表5)。其中,非東部地區(qū)高校有7所,985高校僅有2所,而且這兩所均為雙一流高校名單被劃為B類的原985高校。“雙一流”建設高校AB類的劃分是否充分考慮高校在地理位置方面的劣勢,一流學科的評定是否能打破高校的階層固化現(xiàn)象,都值得我們深思。
表5 我國受環(huán)境因素干擾較大的研究型高校科研效率情況
通過雙重差分法,分別測量學校類型、地理位置和學校層次三個變量對評估高??蒲行实母纳瞥潭?表6、表7)。在學校類型中,以學生規(guī)模即理工農(nóng)醫(yī)學生比例為分類標準,樣本均值為0.68,理工農(nóng)醫(yī)學生比例大于0.68為大理類高校、大于0.50小于0.68為綜合類高校、小于0.5為大文類高校。東部地區(qū)985高校共有19所,平均技術效率進步率為1.4%,其中盡管大理類高校的技術效率值較低,但是調整后的結果進步高于均值進步情況。相反,控制環(huán)境變量和隨機干擾后,綜合類和大文類技術效率竟有所降低,而且,這種降低主要是規(guī)模效率的降低導致的。大理類高校比綜合類及大文類高校所處環(huán)境稍微差一些,在經(jīng)典DEA效率評價中低估了大理類高校的科研效率。部分學者認為人文社科類高校因指標不易量化而處于劣勢,[8]本文實證研究表明,采用更偏重質量的指標體系時,對投入指標特別是科研經(jīng)費上遠高于人文類專業(yè)的理工類高校采用產(chǎn)出/投入計算效率的邏輯是不公平的。
表6 調整前后不同類型、地區(qū)和層次高校的技術效率變化
大理類985高校共有18所,控制環(huán)境變量和隨機干擾后,技術效率進步14.9%,其中,非東部地區(qū)高校進步18.7%,東部地區(qū)高校進步12.1%。非東部地區(qū)高校技術效率的進步均來自于純技術效率的進步,其規(guī)模效率在調整后甚至有所退步。經(jīng)典效率評價低估了非東部地區(qū)高校技術效率特別是純技術效率。東部地區(qū)的大理類高校技術效率平均進步41.8%,其中,非“985”高校進步了76.6%,985高校僅進步12.1%,控制環(huán)境變量和隨機干擾后,非“985”高校的技術效率、純技術效率和規(guī)模效率均存在低估。將所有高校放在同一尺度下比較,這對大理類高校、中西部地區(qū)高校和非985高校是極為不公平的。
表7 調整前后不同類型、層次和地區(qū)高校的純技術效率與規(guī)模效率變化
第一,外部環(huán)境因素各個科研產(chǎn)出松弛變量的影響不同,但除了是否為985高校對科研論文松弛變量的影響不顯著之外均顯著。具體來看,985高校在社會服務上表現(xiàn)優(yōu)秀,存在低估,但是在科研獲獎上并沒有發(fā)揮出優(yōu)勢。東部地區(qū)高校在社會服務上表現(xiàn)顯著高于非東部地區(qū),表明經(jīng)典DEA方法低估了東部地區(qū)的社會服務職能。理工科院校在科研論文、科研獲獎和社會服務方面松弛變量均顯著為正,存在低估。盡管理工農(nóng)醫(yī)類院校更容易量化,但是其在以投入產(chǎn)出比為導向的效率評價中并不占優(yōu)勢,人文社科類專業(yè)因投入小,科研相對效率較高。優(yōu)厚的政策影響、優(yōu)越的地理位置和強悍的理工類學科能有效增強高校在社會服務方面的溢出效應。但是將投入高的理工科院校與投入低的人文社科放在同一尺度下計算投入產(chǎn)出比,很大程度上低估理工科院校的科研效率。
加強政府的引導作用,堅持以學科為基礎的分類評價指標體系,堅持學科專業(yè)建設與學校整體建設評價并行。在加大對中西部高校傾斜的基礎上,著力從技術、制度和文化上提高中西部高校的辦學效率,保障傳統(tǒng)優(yōu)勢學科的活力,發(fā)展特色,形成良好的競爭態(tài)勢,探索具有中國特色的現(xiàn)代高等教育評估制度。
第二,第一階段和第三階段配對t檢驗在純技術效率和技術效率上差異顯著。剔除外界環(huán)境變量和隨機干擾的影響之后,第三階段我國研究型高校的平均技術效率為0.623、平均純技術效率為0.688、平均規(guī)模效率為0.892,比第一階段分別高出10.9、9.3和2.4個百分點,但是其分布比第一階段更為分散。本文認為,在統(tǒng)籌推進世界一流大學和一流學科建設的過程中,堅持以績效為杠桿勢必引入退出機制,控制環(huán)境因素和隨機干擾后的評估結果更能體現(xiàn)高校的真實效率情況。
第三,在控制環(huán)境和隨機因素之后,經(jīng)典DEA效率評估中高估了東部高校、“985”高校、大文類高校的平均科研效率。盡管控制環(huán)境和隨機因素之后,研究型高校整體科研效率有所進步,但是非東部高校(中西部)、非“985”高校以及大理類高校進步更大,即其所處外部環(huán)境較差。因此,在未來“雙一流”績效評估中,為了更為公平、公正地評價高??蒲锌冃?,政府應合理發(fā)揮資源配置作用,在評價中充分考慮地區(qū)、層級和類型等環(huán)境因素,切實推動高等教育內(nèi)涵式發(fā)展。