范煒烽 許 燕
隨著新公共管理運動的興起,政府向社會力量購買公共服務(wù)已是當今世界各國日益通行的普遍做法。20世紀90年代初,我國政府向社會力量購買公共服務(wù)進入初始啟動和探索發(fā)展階段。2013年9月,國務(wù)院頒布《關(guān)于政府向社會力量購買公共服務(wù)的指導(dǎo)意見》(國辦發(fā)〔2013〕96號),標志著我國向社會力量購買公共服務(wù)上升為國家行為。同時,我國政府購買公共服務(wù)從局部試點階段轉(zhuǎn)向全面推廣階段、從地方政府的實際工作轉(zhuǎn)向中央政府的宏觀職能,政府購買公共服務(wù)改革進入全面推廣階段(王浦劬和郝秋笛,2016[1])。
在實踐探索過程中,我國政府向社會力量購買公共服務(wù)也遇到了不少結(jié)構(gòu)性、專項性的難題。其中,評估作為政府購買公共服務(wù)的控制環(huán)節(jié)和重要要素,其指標體系構(gòu)建的科學性、合理性和有效性是保障政策實施的關(guān)鍵,具有重要的行為引導(dǎo)功能,也是建立科學評估的基本工作。近年來,受西方績效評估指標體系科學方法以及國內(nèi)政府改革現(xiàn)實發(fā)展需要的影響,學界越來越重視對評估指標體系構(gòu)建的探索,并取得了一定的成果。但總的來看,目前關(guān)于政府向社會力量購買公共服務(wù)評估指標體系的建構(gòu)與實踐成果嚴重不足。首要的困難體現(xiàn)在我國政府購買公共服務(wù)在法規(guī)制度、服務(wù)標準、工作機制、社會組織、督查評估等方面還存在不足(李一寧等,2015[2])。胡穗(2015)[3]認為政府購買社會組織服務(wù)績效評估工作存在評估主體獨立性欠缺、評估對象多元化欠缺、評估過程完整性欠缺、評估體系平衡性欠缺等局限。季璐等(2016)[4]基于長三角地區(qū)的調(diào)查指出,在政府向社會力量購買公共服務(wù)評估中存在去行政化、合法化、協(xié)同化等問題。王清(2017)[5]指出,隨著政府購買服務(wù)的深入,作為服務(wù)承接的社會組織卻面臨著服務(wù)供給能力不足的困境。張汝立等(2020)[6]基于個案研究指出,社會組織在服務(wù)供給中存在的服務(wù)目標、服務(wù)過程和服務(wù)能力等困境已經(jīng)對政府購買公共服務(wù)制度實踐產(chǎn)生了明顯的消極影響。在前期調(diào)研中,政府工作人員還指出評估存在諸多客觀挑戰(zhàn),如購買服務(wù)標準化、第三方評估成本高,第三方評估力量薄弱,數(shù)據(jù)不全或獲取難,主客觀指標平衡等問題,亟需加強對此方面研究成果的補充。
本文首先確立政府購買公共服務(wù)的評估維度,為政府向社會力量購買公共服務(wù)的評估指標體系的構(gòu)建奠定理論基礎(chǔ),接著運用德爾菲法(Delphi Method)對評估指標體系做進一步擬定和篩選,再通過層次分析法(AHP)確定指標的權(quán)重。最終為政府向社會力量購買公共服務(wù)構(gòu)建一套行之有效的評估指標體系,以此來提升公共服務(wù)供給效率和質(zhì)量,滿足人們?nèi)找嬖鲩L的多樣化服務(wù)需求。
當前,政府購買公共服務(wù)績效評估研究主要是基于新公共管理理論和新公共服務(wù)理論這兩種理論框架。新公共管理理論認為政府應(yīng)打破公共服務(wù)內(nèi)部生產(chǎn)的桎梏,倡導(dǎo)公共服務(wù)供給的市場化和社會化,其檢驗購買績效的標尺是服務(wù)成本的降低、服務(wù)效率的提升與服務(wù)質(zhì)量的改善(E.S.薩瓦斯,2002[7])。新公共服務(wù)理論對新公共管理范式進行批判與反思,尤其是對管理主義和工具主義進行了理論與實踐的回應(yīng),新公共服務(wù)理論更強調(diào)政府在公共服務(wù)市場化過程中要回歸公民權(quán)利、增進公共利益、強調(diào)政府責任(羅伯特·B.登哈特和珍妮特·V.登哈特,2010[8])。在此基礎(chǔ)上,西方學者借鑒并遵循政府績效評估與公共服務(wù)績效評估的多元價值取向,在“3E”(經(jīng)濟、效率、效果)和“4E”(經(jīng)濟、效率、效果、公平)的理論背景下,將政府購買公共服務(wù)評估指標體系的價值維度逐漸擴展。Kearney和Berman(1999)[9]認為公共績效可以從公正、效率和效益等多個方面評估。David(2001)[10]指出評估公共服務(wù)績效應(yīng)該從產(chǎn)出、質(zhì)量、效率等方面入手。庫珀(2000)[11]指出,政府購買公共服務(wù)絕對不是一項單純的交易行為,競爭、效率并不是對其衡量的唯一標準,回應(yīng)性、效率、經(jīng)濟性、有效性、平等、責任等都是管制政府購買公共合同的重要標準。
對此,國內(nèi)學者們也展開了一系列評估維度或影響因素的研究。周志忍(2008)[12]提出政府績效評估公民參與理想模式和重點努力方向。包國憲和劉紅芹(2012)[13]認為,對于公共服務(wù)績效來說,效率、效益和公平是三個相互聯(lián)系而不可或缺的評判標準。孫怡帆等(2016)[14]建立投入、均衡、便捷、滿意度為一級指標的指標體系框架。姜曉萍和郭金云(2013)[15]基于價值理性的維度,構(gòu)建由科學發(fā)展的績效目標體系、公平正義的內(nèi)容體系、民主治理的績效實施體系、公民滿意的績效控制體系和責任反饋體系等系統(tǒng)構(gòu)成的公共服務(wù)績效評估體系。徐家良和許源(2015)[16]運用合法性理論下的“合法性—有效性”分析框架,建立由公共性、制度化、社會化、經(jīng)濟、效率和效果6個評估維度和16個評估指標構(gòu)成的評價體系。崔英楠和王柏榮(2017)[17]從績效考核內(nèi)容、考核主體、考核指標三個方面著手,分別建立了由公共服務(wù)和公眾滿意度構(gòu)成的一級指標,由執(zhí)行化、標準化、可持續(xù)發(fā)展、合作性和公眾滿意度構(gòu)成的二級指標,并細化為19個三級指標的政府購買社會組織服務(wù)績效考核系統(tǒng)。敬乂嘉和胡業(yè)飛(2018)[18]基于比較效率的決策框架要求政府對購買服務(wù)的生產(chǎn)效率、交易效率和制度效率進行全面評估。方俊和李子森(2018)[19]認為,增強項目評估體系的消費者至上導(dǎo)向和打造內(nèi)外聯(lián)動的過程監(jiān)督評估體系兩個維度上來完善監(jiān)督評估體系建設(shè)。吳瑞君等(2019)[20]認為,政府購買社會服務(wù)綜合績效評量模型包含受托社會服務(wù)單位的基本管理制度建設(shè)達標績效、社會服務(wù)單位組織管理績效、政府相關(guān)工作人員滿意度和被服務(wù)對象滿意度。姜愛華和楊瓊(2020)[21]將PDCA循環(huán)引入政府購買公共服務(wù)績效評價,強調(diào)提高公共服務(wù)供給效率和質(zhì)量的同時提升公眾滿意度。
這些成果在拓寬政府購買公共服務(wù)評估領(lǐng)域以外,也在深化評估維度研究,并呈現(xiàn)一定的規(guī)律或趨勢。首先,建構(gòu)標準多樣化,前期主要以經(jīng)濟效率為主,注重政府的投入和產(chǎn)出,后期更加注重公平和公民意見,二者建構(gòu)標準趨于融合。其次,評價對象多元化,前期主要以政府單一的績效考核為主,后期開始重視社會力量的發(fā)揮和公眾責任的履行。最后,評價指標定量化,前期在設(shè)計具體指標中,以描述性評價為主,后期注重數(shù)理統(tǒng)計方法的運用,重視指標的量化。正是在此規(guī)律的總結(jié)以及調(diào)研基礎(chǔ)上,本研究將政府向社會力量購買公共服務(wù)的評估維度確立為經(jīng)濟性維度和政治性維度兩個層面,兩者都涉及政府購買公共服務(wù)的基本價值層。
政府購買公共服務(wù)是一種新型的政府治理工具,即公共部門充分調(diào)動社會和市場活力,基于公眾的廣泛需求,創(chuàng)造共有形式的利益最大化,有效配置社會資源,促進社會健康穩(wěn)定發(fā)展(周定財和楊浩,2017[22])。在公共治理領(lǐng)域運用市場手段來提供公共服務(wù),就要遵循市場經(jīng)濟的法則,所以在評估政府購買公共服務(wù)時,必然強調(diào)其經(jīng)濟性指標,例如成本控制、資金使用效率等。在市場交易中,政府的資金在公共服務(wù)領(lǐng)域的投入、產(chǎn)出情況是評估環(huán)節(jié)的關(guān)鍵指標。但由于引入市場機制,很容易引起公共服務(wù)領(lǐng)域“公共性”價值的消解,因為經(jīng)濟發(fā)展領(lǐng)域的壓力消解了“項目制”在公共服務(wù)領(lǐng)域的實踐(張向東,2018[23])。
此外,由于政府采用購買的形式提供公共服務(wù),公共資金使用后所呈現(xiàn)的效果如何,所提供的公共服務(wù)內(nèi)容是否能夠與公眾需求相契合,都成為社會廣泛關(guān)注的焦點。目前,在新公共管理運動的實踐中普遍公認的“3E”評估要素,是公共服務(wù)績效評估的主要思路。借鑒此標準,本文將“3E”模型列入政府購買公共服務(wù)評估的經(jīng)濟性維度,重點考察購買公共服務(wù)的數(shù)量、投入產(chǎn)出比、服務(wù)質(zhì)量、承接能力以及公眾滿意度等。
在研究政府向社會力量購買公共服務(wù)評估指標時,不少學者對公共服務(wù)的績效評估較為偏重,即更多地考慮上述有效性維度的相關(guān)指標,往往將對政府購買社會服務(wù)的績效評估等同于對社會服務(wù)的績效評估,故而只采納了經(jīng)濟類指標,而忽視了政治類指標(Hodge,2000[24])。句華(2017)[25]在對“政府購買服務(wù)”與“政府購買公共服務(wù)”概念進行區(qū)別時,特別強調(diào)“公共服務(wù)”有其特定意義,具有公益性、公共性特征。與一般的采購活動不同,政府向社會力量購買公共服務(wù)是一項現(xiàn)代政府治理方式的重要創(chuàng)新,它的政治性不容忽視。麻寶斌和馬永強(2019)[26]認為,社會公平是公眾的現(xiàn)實訴求,維護社會公平是政府義不容辭的責任。因此,政府購買公共服務(wù)必然要秉持現(xiàn)代性的政治核心價值,如公平公正、公共價值、公民參與等。
不過,在政府向社會力量購買公共服務(wù)的實踐過程中,要落實體現(xiàn)這些政治性維度的核心價值即顯得更加重要,也變得更加困難(葉托和胡稅根,2015[27])。政府通過購買的方式將公共服務(wù)的生產(chǎn)職能讓渡或委托給社會力量,而社會力量也分享一部分公共權(quán)力,對公共財產(chǎn)資源擁有一定的使用權(quán)。這種方式很容易造成責任界限的不明晰,帶來雙方的利益分歧,由此產(chǎn)生一系列公共管理和政府責任問題,這些問題會直接影響社會公眾的公共利益。立足于此,政府購買公共服務(wù)的目的,不僅在于通過市場順利完成一筆成本收益令人滿意、性價比高的交易,而且在兼顧經(jīng)濟效率的同時,重點考慮政治的合法性和正當性,制度規(guī)范、公正性和影響力等要素主要是對政治性維度的回應(yīng)。
因此,根據(jù)兩個評估維度和三個相關(guān)利益主體,首先確認了以下七個評估維度(見表1)。
表1 政府向社會力量購買公共服務(wù)評估維度表
以政府向社會力量購買公共服務(wù)評估的建構(gòu)原則和相關(guān)價值為導(dǎo)向,結(jié)合對政府相關(guān)部門工作調(diào)研情況,再根據(jù)相關(guān)文獻中的指標進行歸納分析,運用聚類分析方法,本文初步擬定出政府向社會力量購買公共服務(wù)評估指標,即7個評估維度和49個具體評估指標(見表3)。
要形成科學的指標體系,還需要進行必要的預(yù)調(diào)研。在進行調(diào)研之前,通過詳細的文獻閱讀和集中討論,分別形成政府和社會力量相關(guān)工作人員的訪談提綱,并在調(diào)研過程中,根據(jù)實際情況對訪談內(nèi)容進行調(diào)整或修正。及時對訪談內(nèi)容進行整理,確保預(yù)調(diào)研的完整性和有效性。
在7個評估維度下,具體指標的形成主要通過以下步驟完成的。首先,通過學者對政府績效評估指標體系、公共服務(wù)績效評估指標體系以及政府購買服務(wù)績效評估指標體系進行匯總整理。其次,將14篇文獻中涉及到的313個三級(終極)指標作為訓(xùn)練集,在Python中進行文本聚類分析,通過逆向思維方式,對聚類結(jié)果進行歸納總結(jié),以形成全面而科學的指標體系。
指標測量方法不同。從具體評估指標數(shù)據(jù)收集的便利性和可操作性出發(fā),本指標體系力求客觀、量化,但具體測量方式多樣化。有些指標是可以直接用客觀數(shù)據(jù)來衡量,比如地方政府購買服務(wù)支出、政府網(wǎng)站購買信息條數(shù)等;有些指標是通過“二分法”量化方法,即是與否的衡量方式,如政府是否出臺購買政策法規(guī)、社會力量財務(wù)制度是否健全等;另一些需要主觀態(tài)度來衡量,如滿意度、知情度等。
根據(jù)初步擬定的指標體系,研究設(shè)計了《“政府向社會力量購買公共服務(wù)評估指標體系”專家咨詢問卷》,來收集專家對每一個具體評估指標的態(tài)度,進而篩選出重要性比較高的指標。
在專家來源方面,本研究選取了15位從事政府購買服務(wù)的工作人員、15位承接公共服務(wù)的社會力量工作人員和15位從事相關(guān)研究的高校學者(見表2),在政府工作人員基本資料上,2人的職級信息缺失,但不影響對專家意見的分析。從以上三個領(lǐng)域來收集專家意見,主要是考慮理論認識和實踐經(jīng)驗都對指標設(shè)計具有不可替代的作用。政府作為公共服務(wù)購買方和社會力量作為承接方,能結(jié)合工作經(jīng)驗對評估指標的指向性、貼合度等提供很好的意見;學者對相關(guān)問題的長期學理探究,更能在理論框架、指標邏輯等方面提供專業(yè)見解。根據(jù)這一設(shè)計,本研究通過直接提供紙質(zhì)和發(fā)送電子版咨詢問卷的方式,共發(fā)出45份問卷?;厥?1份,有效回收率達到91.11%。
表2 修正版德爾菲法咨詢專家基本情況一覽表
在問卷設(shè)計方面,主要請專家對具體指標的重要性進行評價,在重要性程度上,分別有“很不重要”“不重要”“一般”“重要”“很重要”五個等級。后期采用李克特五點計分的方法,分別用1分、2分、3分、4分和5分來表示上面的五個等級。在第一輪篩選的過程中,指標篩選的標準主要考慮均值和標準差,均值從總體上反應(yīng)指標的重要程度,標準差是反應(yīng)專家意見的一致性和穩(wěn)定性。鑒于此,研究決定把臨界值定于“一般”與“重要”之間的3.75分(從四分位數(shù)考慮,選取均值從小到大排列后第75%的數(shù)字是比較合理的)以及標準差大于1的指標作為指標篩選的標準,即在第一輪指標篩選的過程中,只要滿足其中的一個條件就考慮剔除。
通過對回收問卷的數(shù)據(jù)進行統(tǒng)計分析(見表3),在49個初始指標中,有9個指標平均得分沒有達到3.75分或標準差大于1,包括“地方政府財政總支出”(4.0769,1.0101)“地方政府負責購買的工作人員數(shù)”(3.6250,1.1252)、“持有社會工作者國家職業(yè)資格證書或社會工作者職業(yè)水平證書的工作人員數(shù)”(3.6341,1.2992)、“三年及以上工作經(jīng)驗的人員數(shù)”(3.7073,1.1010)、“政府是否設(shè)置購買服務(wù)組織機構(gòu)”(3.6923,1.1275)、“政府網(wǎng)站購買信息條數(shù)”(3.7073,1.1010)、“行政就業(yè)人員占總?cè)丝诘谋戎亍保?.1667,1.1588)、“社會組織數(shù)量占全社會法人組織比例”(3.5854,0.8653)、“事業(yè)單位作為承接主體承接的服務(wù)數(shù)量”(3.6829,0.8197)。這9個指標把3.75作為臨界值,把標準差大于1的所有指標都囊括了,進一步表明,這樣的篩選標準是合理的。因此,通過首輪的篩選,保留了40個指標,作為首輪篩選的待定結(jié)果。
表3 首輪指標篩選結(jié)果表
續(xù)表
為確保問卷結(jié)果的可靠性或穩(wěn)定性,研究首先對問卷結(jié)果進行了信度檢驗。李昕和張明明(2015)[28]認為,如果問卷信度系數(shù)達到0.9以上,該測量或量表的信度很好;信度系數(shù)在0.8以上,是可以接受的;如果在0.7以上,則應(yīng)該對此測量工具進行修訂,但不失其價值;如果低于0.7,則此問卷結(jié)果很不可信,需要重新設(shè)計。本文運用SPSS21.0軟件分別檢驗了本次問卷的內(nèi)在信度克隆巴赫系數(shù)(Cronbach’s Alpha)和分半信度。統(tǒng)計分析結(jié)果表明,總體的克隆巴赫系數(shù)為0.955,七個維度的克隆巴赫系數(shù)也均超過了0.7(見表4);問卷的分半信度系數(shù)為0.865,將該系數(shù)代入斯皮爾曼—布朗(Spearman—Brown)公式:rkk =2rxx/1+rxx (公式中rxx為分半信度系數(shù);rkk為整個問卷的信度估計值),可以計算出總問卷的信度系數(shù)為0.93。由此可見,通過兩種方法得到問卷的信度系數(shù)均大于0.9,表明此次問卷的內(nèi)部一致性很好,滿足問卷穩(wěn)定性和可靠性的要求。
表4 Cronbach’s Alpha內(nèi)部一致性信度表
本研究還對問卷結(jié)果進行了效度檢驗。該問卷是建立在深入的文獻梳理和專業(yè)調(diào)研基礎(chǔ)上的,并得到相關(guān)學者和從事政府購買公共服務(wù)工作人員的認可,內(nèi)容效度可以得到保障。
針對首輪指標的篩選結(jié)果,本研究又多次咨詢專家意見和進行小組討論,對保留下來的40個指標進行了仔細的斟酌。首先,對指標的評估維度進行重新調(diào)整。按照制度先行,遵循政府向社會力量購買公共服務(wù)過程的思路,最終確定了從制度規(guī)范到購買投入到承接能力、公正性到服務(wù)質(zhì)量、滿意度和影響力的整個評估維度的設(shè)計。其中承接能力、公正性主要從過程來考核;服務(wù)質(zhì)量和滿意度是對產(chǎn)出的思考;影響力是從購買所產(chǎn)生的長期效益出發(fā)。
其次,對具體評估指標進行調(diào)整。主要表現(xiàn)在四個方面:一是對可以合并的指標進行合并,如“地方政府購買服務(wù)支出”與“地方政府公共服務(wù)總支出”合并成“政府購買公共服務(wù)支出占同類公共服務(wù)總支出之比”,“舉報投訴數(shù)量”與“處理舉報投訴數(shù)量”合并為“年均服務(wù)投訴數(shù)”,“服務(wù)模式是否有示范價值”與“服務(wù)模式是否有推廣價值”合并為“政府購買公共服務(wù)是否有推廣價值”等。合并的目的不僅為了精簡指標,而且出于指標可比性的考量。二是對有些指標的歸屬評估維度進行了調(diào)整,如原制度規(guī)范下的“政府網(wǎng)站購買信息條數(shù)”調(diào)整到公正性下的“政府購買公共服務(wù)信息是否公開”等。三是對一些指標的具體表述進行了詳細的修改,如“地方政府購買預(yù)算金額數(shù)”改為“政府購買公共服務(wù)預(yù)算資金占實際購買資金比例”等。最后,增加了一些評估指標。如增加了承接能力下的“社會力量資金來源是否多元”和“社會力量能否把握政策精神”等。增加的指標是對前期文獻閱讀和思考的查漏補缺,對指標的全面性進行完善。
以上對指標的調(diào)整是在聽取專業(yè)學者和實際工作部門人員意見以及多次小組討論的基礎(chǔ)上不斷進行完善的結(jié)果,再把確定的指標體系送至學者審閱,得到一致認可。最終確定由7個評估維度和33個具體評估指標構(gòu)成的政府向社會力量購買公共服務(wù)評估指標體系(見表5)。
表5 政府向社會力量購買公共服務(wù)評估指標體系表
續(xù)表
本指標權(quán)重的分配主要是通過層次分析法(AHP),AHP是美國運籌學家、匹斯堡大學教授馬斯·塞蒂提出的一種處理復(fù)雜的評價(決策)問題中,進行方案比較排序的方法。彭國甫等(2004)[29]認為,層次分析法為準確確定政府績效評估指標間權(quán)重提供了可行的途徑。范柏乃和段忠賢(2012)[30]認為,層級分析法是一種典型的定性和定量相結(jié)合的評價分析方法,是系統(tǒng)化、層次化的分析方法。它通過每層指標再進行兩兩比較的方法獲得每個指標的相對重要性,現(xiàn)有yaahp軟件可實現(xiàn)對指標進行建模,生成判斷矩陣,導(dǎo)入專家數(shù)據(jù),進行結(jié)果計算,yaahp軟件為本指標的權(quán)重確定帶來極大的方便。
進行層次分析法之前,必須構(gòu)建一個層次結(jié)構(gòu)模型。在本模型中,第一層為目標層,即確定政府向社會力量購買公共服務(wù)指標的權(quán)重;第二層是準則層,主要包括制度規(guī)范、購買投入、承接能力、公正性、服務(wù)質(zhì)量、滿意度和影響力7個維度;第三層是要素層,即各維度下的具體評估指標,共包括政府是否出臺購買公共服務(wù)政策法規(guī)等33個指標(如圖1)。
圖1 政府向社會力量購買公共服務(wù)評估指標體系層次結(jié)構(gòu)模型
調(diào)查問卷根據(jù)層次分析法(AHP)的形式設(shè)計。這種方法是在同一個層次對各個指標的重要性進行兩兩比較,衡量尺度劃分為9個等級(見表6)。綜合各位專家打分的結(jié)果得出兩兩比較判斷矩陣,分別組建T-A、A1-B、A2-B、A3-B、A4-B、A5-B、A6-B、A7-B的矩陣(見表7至表14)。
在發(fā)放判斷矩陣問卷方面,本研究將咨詢問卷分別發(fā)放給相關(guān)政府工作人員,社會力量工作人員以及此方面的學者。共發(fā)放170份問卷,回收165份,成功回收率為97.06%。yaahp(version 12.0)是一款著名的層次分析法(AHP)軟件,可以提供方便的層次模型構(gòu)造、判斷矩陣數(shù)據(jù)錄入、排序權(quán)重計算以及計算數(shù)據(jù)導(dǎo)出等功能。利用該款軟件,并根據(jù)165專家的問卷結(jié)果建立了1320個兩兩對比的判斷矩陣,每個專家對應(yīng)8個判斷矩陣,在對所有的專家判斷數(shù)據(jù)進入軟件分析的時候,有17位專家的問卷數(shù)據(jù)沒有通過一致性檢驗。因此,最終的分析結(jié)果是由148位專家的判斷結(jié)果得出的,其中學者40人,政府工作人員64人,社會力量工作人員44人。
表6 1-9標度的含義表
(1)判斷矩陣T-Ai(相對于政府向社會力量購買公共服務(wù)評估總目標而言,7個評估維度之間相對重要性比較)
表7 T-Ai的判斷矩陣(i=1,2,3,4,5,6,7)
表8 A1-Bi的判斷矩陣(i=1,2,3,4,5)
表9 A2-Bi的判斷矩陣(i=6,7,8,9)
表10 A3-Bi的判斷矩陣(i=10,11,12,13,14,15,16)
表11 A4-Bi的判斷矩陣(i=17,18,19,20,21,22)
表12 A5-BI的判斷矩陣(i=23,24,25)
表13 A6-Bi的判斷矩陣(i=26,27,28,29)
表14 A7-Bi的判斷矩陣(i=30,31,32,33)
(2)計算權(quán)重
首先將矩陣向量歸一化,式(1):
下面以T-Ai的判斷矩陣為例,求出權(quán)重向量。
①建立比較矩陣T
②將矩陣T按列歸一化,得到矩陣T1
③再將矩陣T1按行求和再歸一化得矩陣T2
得到矩陣T-Ai的權(quán)重向量為(0.0917 0.0293 0.0275 0.0805 0.1978 0.3193 0.2539)
(3)判斷矩陣一致性
考慮到專家們在調(diào)查問卷題項認識上有不可避免的多樣性和片面性,不能保證每個判斷矩陣具有較好的協(xié)調(diào)一致性。因此必須通過一致性檢驗,檢查各因素的權(quán)重之間是否存在矛盾,因此需要計算它的一致性指標CI,式(2)為:
其中,λmax為式(3):
當CI=0時,則判斷矩陣具有完全一致性,并且隨著階數(shù)的增加,需要依據(jù)矩陣的階數(shù)對一致性指標CI進行修正,即需要將CI與平均隨機一致性指標 RI進行比較。RI的取值見表15。
表15 平均一致性隨機指標RI的取值
如果判斷矩陣CR=CI/RI<0.1時,則此判斷矩陣具有滿意的一致性。以上判斷8個判斷矩陣一致性系數(shù)均小于0.1,表示均通過一致性檢驗。
同時,為了評價層次總排序計算結(jié)果的一致性,也需要進行一致性檢驗。
其中,CIi為 Bi單序列的一致性指標,RIi為相應(yīng)的平均隨機一致性指標。
根據(jù)式(4),CR=0.0917×0.1064+0.0293×0.0863+0.0275×0.1159+0.0805×0.1208+0.1978×0.0429+0.3193×0.0882+0.2539×0.0718/0.0917×1.12+0.0293×0.90+0.0275×1.32+0.0805×1.24+0.1978×0.58+0.3193×0.90+0.2539×0.90=0.089<0.1,通過一致性檢驗。
(4)政府向社會力量購買公共服務(wù)評估指標權(quán)重分配結(jié)果
表16 指標權(quán)重的分配結(jié)果表
續(xù)表
從上述層次分析法得到的政府向社會力量購買公共服務(wù)評價指標權(quán)重可以看出,在七個評估維度中,服務(wù)質(zhì)量、滿意度和影響力對政府向社會力量購買公共服務(wù)的評估起到了關(guān)鍵性的作用,這三個維度的權(quán)重共占77.1%。在滿意度(32%)維度中,服務(wù)對象對服務(wù)質(zhì)量的滿意度和服務(wù)對象對政府購買公共服務(wù)的滿意度對總目標的影響最大。這說明政府向社會力量購買公共服務(wù)的評估與服務(wù)對象的滿意度有很大的關(guān)系,也驗證了不管是評估政府績效、公共服務(wù)績效,還是政府向社會力量購買公共服務(wù)效果,建立以公眾需求為導(dǎo)向、以人民滿意為目標的評估體系是非常重要的。蔡禮強(2018)[31]指出,購買服務(wù)項目是否能滿足居民需求,恰恰是購買服務(wù)能否成功的前提和基礎(chǔ)。尚虎平和韓清穎(2019)[32]基于我國172個政府獨特績效案例,指出民眾訴求在最大程度上影響著政府介入社會事務(wù),是形成獨特績效的首要主體性原因。
在影響力(25%)維度下,政府購買公共服務(wù)是否有推廣價值對于總目標的影響是相對影響力下的其他三個指標要重要的多。這也說明政府向社會力量購買公共服務(wù)不僅僅要求實際購買效益和質(zhì)量的保障,更注重通過購買實踐,摸索一些值得推廣和效仿的購買模式,形成高質(zhì)量的長效機制。服務(wù)質(zhì)量(20%)評估維度在整個評估模式中也占有一定的地位,它是滿意度和影響力的基礎(chǔ),只有好的服務(wù)質(zhì)量才能令服務(wù)對象和公眾滿意,才值得被推廣。在服務(wù)質(zhì)量維度下,合同是否按期完成在整個指標體系中權(quán)重是排在第一位的,說明它對總目標的影響是最大的。在前期調(diào)研階段,負責政府向社會力量購買公共服務(wù)的工作人員也多次表示,“在實際與社會力量合作的過程中,我們首先看中或?qū)ι鐣α孔罨镜囊笫悄懿荒馨雌谕瓿珊贤挠媱??!币虼?,一方面目前社會力量發(fā)育還不夠成熟;另一方面在社會力量還不夠成熟的現(xiàn)實面前,按期完成承接服務(wù)是主要目的。同時也表明通過政府向社會力量購買的形式培育社會力量是非常重要的。范煒烽等(2010)[33]在對南京市鼓樓區(qū)政府購買居家養(yǎng)老服務(wù)研究中建議要培育非政府組織。孫世強和陶秋燕(2019)[34]研究表明,加強與外部機構(gòu)建立社會關(guān)系網(wǎng)絡(luò)可以提高小微企業(yè)的創(chuàng)新績效。社會力量通過與政府的合作,是建立社會強關(guān)系的重要途徑。
除以上評估維度和具體評估指標的重大影響以外,相對靠前的指標還有年均服務(wù)的投訴數(shù)(5.78%)、購買程序是否公平公正(4.75%)和政府是否出臺購買公共服務(wù)政策法規(guī)(3.63%)。投訴數(shù)不僅代表服務(wù)質(zhì)量的高低,也在一定程度上反映政府或社會力量對民眾需求的重視。吳建南等(2015)[35]指出,公眾確實能對政府行為產(chǎn)生一定的壓力作用。通過政府向社會力量購買公共服務(wù),最終目的是更好地為公眾提供公共服務(wù),但購買過程的公平公正也是眾人所重視的,尤其是對承接方而言。顏紅艷等(2019)[36]認為,城市軌道交通PPP項目主體的公平偏好和社會偏好因素應(yīng)納入影響因素范圍。同時,制度保障,尤其是各個地區(qū)出臺明確的購買公共服務(wù)政策法規(guī)對政府向社會力量購買公共服務(wù)制度的貫徹執(zhí)行無比重要。一方面是因為相關(guān)的政策法規(guī)鼓勵政府通過購買的方式為公眾提供更好的服務(wù);另一方面是因為政策法規(guī)對政府招投標、社會力量資質(zhì)要求、績效考核等過程有明確的規(guī)定,更好地依章辦事,依法執(zhí)行。
最后,承接能力維度在整個評估維度中占比是最低的,只有2.75%,但是社會力量組織規(guī)范程度,在其中的權(quán)重達到了32.7%,而且相對于總目標的影響程度達到了2.35%,說明政府向社會力量購買公共服務(wù)的評估要求社會力量必須具備一定的資質(zhì)。在實踐層面上,政府每年都會請第三方對社會力量的資質(zhì)進行評估,并對獲得3A以上評估等級的社會力量,可優(yōu)先獲得政府購買服務(wù)資格。
政府向社會力量購買公共服務(wù)業(yè)已成為政府提供公共服務(wù)的一種政策安排。對此,學者們普遍認為引入市場機制的利是遠遠大于不足的,并極力提倡這種形式。王浦劬和萊斯特·M·薩拉蒙(2010)[37]通過實際調(diào)查和研究指出,中國政府向社會組織購買公共服務(wù)取得了一定的成效。然而,前期調(diào)研的信息給出了一些警示,如果政府不能很好地監(jiān)督或問責整個購買行為,不明確有所購買、有所不購買的服務(wù)目錄,那么公眾不必然享受更優(yōu)質(zhì)更高效的公共服務(wù)。在整個購買行為中,評估既是一項管理工具,也是一項問責機制,可以通過具體的評估指標直接明示好與不好,保障和改善該項政策落實。
本研究嚴格地運用文獻法、修正德爾菲法和層次分析法等技術(shù),歷經(jīng)概念化模型建立、指標篩選和權(quán)重賦值等三個主要步驟,最終構(gòu)建出一套包含7個評估維度和33個具體指標的政府向社會力量購買公共服務(wù)評估指標體系。這套指標體系具有兩個重要的特征:其一,評估內(nèi)容的全面性和重點性,全面性體現(xiàn)在評估指標原則注重過程與結(jié)果并重、效益和影響力并重;重點性表現(xiàn)在“滿意度”“影響力”和“服務(wù)質(zhì)量”維度的權(quán)重要遠遠高于其他維度,“制度規(guī)范”維度和“公正性”的權(quán)重居中,“購買投入”維度和“承接能力”維度的權(quán)重略低。其二,評估過程的客觀化,具體評估指標的設(shè)置盡量考慮可比性和可測量性,方便后續(xù)的實際運用。
同時,本研究還存在一定的不足。第一,在指標篩選階段,由于時間、精力等主客觀因素的限制,本研究最終確定用修正版德爾菲法來對指標進行評價。一般而言,德爾菲法需要多次對指標進行評價,在一輪輪的修正過程中,最終形成一致意見。第二,在指標賦權(quán)方面,由于群體所處的環(huán)境不同,價值判斷的偏差天然存在,雖然通過盡量采納政府工作人員、社會力量工作人員和相關(guān)學者多元主體意見來減少主觀偏見,但人員分布不能完全一致以及時空情境的轉(zhuǎn)移等限制都會影響最終的結(jié)果。