政府績效評估出現(xiàn)了一些虛假信息,很大程度上是使用績效評估的價值導(dǎo)向上出現(xiàn)了問題,不是技術(shù)本身的問題。所以,我們不單是要怎么樣去開發(fā)一套好的評估技術(shù),更重要的是對政府績效評估理念要有重新認識。
日前,一份在網(wǎng)絡(luò)上流傳的北京某交警支隊《績效考核辦法》,詳細地曝光該支隊交警的績效考核標準。這份長達12頁的文件被網(wǎng)友以掃描圖片的方式貼到了網(wǎng)上,其中部分涉嫌“鼓勵罰款”的條款招來一片罵聲,一些網(wǎng)民把矛頭指向了“績效考核”的政策制定。
這份考評內(nèi)容中規(guī)定:處罰交通違法每1筆,加0.1分,少一起減0.2分;處罰每筆平均金額超過100元,每多10元,加1分;處罰闖紅燈、涉牌嚴重違法行為,每1筆,加0.3分,少1筆,扣0.5分……民警處罰筆數(shù)日均不能低于8筆,新警不低于2筆。未完成的,一次性扣30分,并按照未完成的筆數(shù)累加扣分。每月對排名靠前的民警進行通報表揚,對排名靠后的進行告誡談話,當月未完成執(zhí)法糾違常量的,要評為當月末位民警,季度獎金降為三等……
交通警察的職責是維護交通安全,而這份以罰款為指標的考核辦法多少帶有一些“放縱違章”的味道?,F(xiàn)實中,這種目標與使命錯位的例子并不少見,許多地方的環(huán)保監(jiān)察、計劃生育、GDP增長考評都異化為罰款或排名的工具。
政府績效評估旨在提高政府行政效能,我國已有三分之一以上的省區(qū)市探索并施行了政府績效評估制度,但某些地方和部門的績效評估為何惹來“與民爭利”的罵名?
國家行政學(xué)院政府績效評估中心副秘書長劉旭濤認為,這是政府績效評估理念導(dǎo)入出現(xiàn)了偏差,并不是績效評估本身的問題?!翱冃гu估是一副好藥,但用錯了方向反而會起反作用。”
評估是為了“診斷”而不是“排名”
事實上,一些地方和政府部門對政府績效評估是“干什么,解決什么”的問題并不是很清楚。“僅僅是為了評估而評估,或是為了排名而評估?!?/p>
劉旭濤告訴《小康》,政府績效評估本質(zhì)上是一個發(fā)現(xiàn)問題、診斷問題的工具,它能解決一些問題,但工具畢竟是工具,并不能解決行政管理中的所有問題。“績效評估是一種在技術(shù)上存在缺陷的工具,‘測不準’在績效評估中是一個原理?!?/p>
評估指標和績效永遠存在差異。比如,評估一個地區(qū)的經(jīng)濟發(fā)展,實際上我們測的是GDP、招商引資、財政收入等可以量化的指標,但它并不能完全真實地代表這個地區(qū)的經(jīng)濟發(fā)展水平。如果我們用一個本身就不夠精確的評估結(jié)果去打分排名、評比評優(yōu),顯然不夠客觀,而且會引發(fā)欺騙行為、弄虛作假的問題,或是有意識地回避整體性工作——“考核什么就干什么,不考核的就不去干”。然而,從技術(shù)的角度看,我們的指標不可能覆蓋所有的工作。
西方發(fā)達國家的績效評估也存在同樣的問題,但他們更多地把績效評估作為發(fā)現(xiàn)問題、診斷問題,不斷提高政府管理手段的工具,而不是像我們這樣強調(diào)打分排名、評比評優(yōu)。
北京大學(xué)政府績效評估中心主任周志忍指出:“我們目前在評估結(jié)果的使用上存在兩個極端,一個極端是績效評估結(jié)果與官員考核毫不相關(guān),有些地方的績效評估結(jié)果很差,但官員照樣升遷的很快;另一個極端是過于急功近利,不顧實際情況,“一票否決”、“末位淘汰”的處罰相當嚴厲。高壓之下,一些部門和官員只能靠杜撰數(shù)據(jù)、弄虛作假來應(yīng)付考評。甘肅省曾經(jīng)有幾個緝毒警察為擺脫末位排名,竟然設(shè)套陷害百姓,致使3名普通百姓被扣上了“毒梟”的罪名……
周志忍痛心地說,政府績效考核的目的是提高公共服務(wù)質(zhì)量和老百姓滿意度,如果績效評估導(dǎo)致與民爭利,甚至坑害百姓的行為,會讓每一個推動這項工作的人感到無地自容,還不如不搞。
經(jīng)濟統(tǒng)計數(shù)據(jù)、民意測評數(shù)據(jù)等量化指標的真實與否,直接決定績效評估結(jié)果是否公正。倘若考核的信息有虛假成分,那么診斷的結(jié)果自然就不會準確?!熬拖筢t(yī)生對一個人做體檢一樣,先用一套科學(xué)的指標體系對政府組織進行診斷,再提出怎么改進?!眲⑿駶f。
然而,恰恰是在這方面,“政績不夠、數(shù)字來湊,官出數(shù)字、數(shù)字出官”這個流傳很廣的順口溜表明統(tǒng)計數(shù)字注水問題非常普遍。僅2007年,全國查處的統(tǒng)計違法案件就高達19096起,其中虛報、瞞報的將近50%。劉旭濤教授稱這種現(xiàn)象為“數(shù)字化陷阱”。
他認為,政府績效評估出現(xiàn)了虛假信息,很大程度上是對績效評估的價值導(dǎo)向上出現(xiàn)了問題,而不是技術(shù)本身的問題,是績效評估參與人的動機和行為出了問題。“所以,我們不單是要怎么樣去開發(fā)一套好的評估技術(shù),更重要的是對政府績效評估理念要有重新認識。”
政府績效評估中的一個重要理念是“結(jié)果導(dǎo)向”?,F(xiàn)實中,很多人對“結(jié)果”的理解并不相同,在周志忍教授看來,公安機關(guān)每天出動多少警力、巡邏多少次、抓獲多少犯罪分子、查處多少違規(guī)車輛,這不是“結(jié)果”而是“產(chǎn)出”,老百姓不會關(guān)心這些數(shù)字。他們關(guān)心的是晚上睡覺要不要關(guān)窗,要不要裝防盜護欄,晚上女兒放學(xué)要不要去接,交通事故是不是降低了,安全感是不是提高了,這些才是老百姓可以感受到的“結(jié)果”。
強調(diào)“結(jié)果導(dǎo)向”并非不重視過程,但在完成結(jié)果的過程中,更希望得到一個公正、真實的結(jié)果。在某些領(lǐng)域“結(jié)果”有很多不可控的因素,比如,各地的經(jīng)濟基礎(chǔ)不一樣,當?shù)毓賳T付出的努力越多,GDP的增長未必會越高。此外還有一個大環(huán)境的因素,中國GDP增長連續(xù)多年超過10%,但金融危機的時候,當?shù)毓賳T付出的努力再多,也很難超過10%的增長率。所以,僅僅看“結(jié)果”并不能反映政府的真實效能。
“績效打分你也是十分,他也是十分,從總分來說是一樣的,但實際上可能是不一樣的”。劉旭濤說,算總分只是解決排名的問題,但真正哪些是優(yōu)點,哪些是缺點,哪些是需要改進的,從總分上并沒有看出來。反而掩蓋了很多缺點,或者說把績效評估的信息給過濾掉了?!捌鋵嵨覀兏M滥愕膬?yōu)點是什么,你的缺點是什么,下一步怎么去改進?!?/p>
“公民參與”需要技術(shù)理性
20世紀90年代末,隨著公民政治參與觀念的加強,“公民評議政府”作為一種新的績效評估形式被許多地方政府引入:1998年沈陽市推行“市民評議政府”,1999年珠海市舉行“萬人評政府”,2000年邯鄲市開展“市民評議政府及政府部門問卷調(diào)查活動”,2001年杭州市開展“滿意不滿意評選活動”,2002年邵陽市推行“優(yōu)化經(jīng)濟環(huán)境綜合測評”,2003年北京市開展“市民評議政府”等等,都是公民參與政府績效評估的地方探索。
“公民參與評議政府,無疑是一種進步,但技術(shù)上還需要改進和完善。”劉旭濤教授把績效評估的“公民導(dǎo)向”分為政治理性和技術(shù)理性。公民導(dǎo)向在政治理性上必須堅持,但在技術(shù)上需要解決信息對稱和需求對稱的問題,信息對稱是指公民對評估的內(nèi)容了解不了解,需求對稱是指公民對評估的內(nèi)容關(guān)心不關(guān)心。如果這兩個都不對稱,公民怎么能打出合理的分數(shù)呢?
雖然有很多城市開展萬人評政府、千人評政府,但有時候評價的結(jié)果令人尷尬。有些涉及老百姓的切身利益,而對其期望值又很高的部門,往往會打很低的分;有些和老百姓沒有直接利益關(guān)系,甚至老百姓都不知道它是做什么的部門,往往會打很高的分。如果把全市所有部門都打分排名,有的部門再怎么努力也是排在后面……所以,現(xiàn)在很多地方并不把公民參與的評估結(jié)果作為嚴謹?shù)臎Q策依據(jù)。
在信息對稱方面,劉旭濤教授比較推崇山東煙臺市建委率先實施的社會服務(wù)承諾制,這是借鑒英國公民憲章運動經(jīng)驗的一次成功嘗試,可惜這些好的做法并沒有與后來開展的社會評議很好地結(jié)合起來。
在需求對稱方面,他認為北京市海淀區(qū)這幾年的做法比效成熟:把“公民”分成不同的類別,面向企業(yè)的政府部門,就由企業(yè)來打分;面向社區(qū)的部門,就由社區(qū)居委會來打分;直接為老百姓服務(wù)的窗口部門,就由群眾來打分……
劉旭濤說,公民參與政府績效評估要對政府的服務(wù)對象類群細分,根據(jù)部門的特點選擇其具體的服務(wù)對象作為評議主體,在考慮引入某一類評議主體的時候,我們應(yīng)該問一下:他對評議的內(nèi)容是否了解?是否關(guān)心?了解到什么程度?比如宗教局之類的部門,面向的是宗教人士,那就不能在大街上隨便找些老百姓來評價。
不宜出臺全國統(tǒng)一管理法規(guī)
4月25日,《中國政府績效評估報告》正式出版發(fā)行,該報告推出了“山東青島的整體推進型、江蘇邳州的戰(zhàn)略導(dǎo)向型、貴州省直機關(guān)的目標責任制型、江蘇南通的三位一體型、上海楊浦的問績于民型、河南洛陽的干部實績型”六種績效評估模式。
六種典型模式雖然各有特色,但都有一個不足,就是政府績效管理的法律制度基本處于空白狀態(tài),因此很多人希望中央能設(shè)計出一套“普適”性的指標體系。
在《小康》采訪中,專家們普遍認為中央不宜出臺過細的、整齊劃一的政府績效管理文件或法律制度?,F(xiàn)在全國各地的模式不太一樣,有的模式是重點解決本地區(qū)的某一項問題,搬到其他地方不一定就是好模式。中央可出臺一個指導(dǎo)思想,突出績效評估的價值導(dǎo)向,并給予一定的技術(shù)支持就可以了,要給地方政府和部門一定的自主性,要允許有地方特色。
中國行政學(xué)會政府績效管理研究會秘書長張定安向《小康》透露,國務(wù)院曾指定原國家人事部起草有關(guān)政府績效評估的指導(dǎo)意見,目前這項工作已經(jīng)交由監(jiān)察部牽頭去做。而在去年的政府工作報告中,“政府績效評估”的提法已經(jīng)改成了“政府績效管理”,這是一種理念上的進步。
政府績效評估被國際上認為是行政管理的一場“靜悄悄的革命”?!翱冃гu估對行政改革很重要,但是在落實方面的作用更大一些,如果把績效管理看作一個過程的話,績效評估只是一個環(huán)節(jié)。”周志忍教授認為,管理層面的改革是當代發(fā)達國家政府改革的側(cè)重點,而績效管理是管理改革最有效的工具之一。
外國政府績效評估發(fā)展趨勢
府績效評估的實踐最早可追溯到第二次世界大戰(zhàn)以前,其發(fā)展過程大致經(jīng)歷了三個階段,一是起步階段,20世紀40年代至70年代。第二個時期是大規(guī)模發(fā)展階段,20世紀70年代到90年代。第三個時期是規(guī)范深化階段,20世紀90年代至今。進入20世紀90年代,政府績效評估的發(fā)展出現(xiàn)了新的趨勢:
一是績效評估逐步走向制度化、法制化。1993年7月,美國政府頒布了《政府績效與結(jié)果法》,規(guī)定“每個機構(gòu)應(yīng)提交年度績效規(guī)劃和報告”,財政預(yù)算與政府部門績效掛鉤。英國1997年頒布的《地方政府法》規(guī)定,地方政府必須實行最佳績效評價制度,各部門每年都要進行績效評估工作,要有專門的機構(gòu)和人員及固定的程序。日本也于2002年出臺了《政府政策評價法》。
二是績效評估的主體多元化。在評估過程中有公民和服務(wù)對象的廣泛參與,由單純的政府機關(guān)內(nèi)部的評估發(fā)展到由社會機構(gòu)進行評估。美國民間機構(gòu)錫拉丘茲大學(xué)坎貝爾研究所自1998年以來就與美國《政府管理》雜志合作,每年對各州或市的政府績效進行評估,并發(fā)布評估報告,引起了政府和民眾的廣泛關(guān)注,一些州政府在對其部門年終業(yè)績進行評估時,也往往請專門的社會評估機構(gòu)參與。
三是評估主題的公民導(dǎo)向。20世紀90年代以來,有關(guān)質(zhì)量和顧客滿意度指標在評估指標體系中大幅度增長,加拿大等國家還進行大范圍的政府顧客滿意度調(diào)查,將提升顧客的滿意度作為政府績效的目標。
四是評估技術(shù)不斷成熟,科學(xué)化程度提高。包括信息技術(shù)、量化技術(shù)、針對不同部門不同的評估方式和方法技術(shù)。
五是績效管理評估的理念、方法和技術(shù)向世界各主要發(fā)達國家擴展,已經(jīng)形成一種世界性的潮流。西方各主要國家都在政府管理和市政管理中實行了績效評估的技術(shù)和方法。日本在總務(wù)省也專設(shè)行政評價局,在自治的道、府、縣也廣泛開展了“行政評價”、“政策評價”和“事業(yè)評價”。