任全娥
摘要評價指標體系是評價目標的細化與操作化,人文社會科學研究成果評價指標體系的設計原則是科學性、操作性與關聯(lián)性,評價指標構成要素包括創(chuàng)新程度、完備程度、價值含量(包括學術價值含量與社會價值含量)與研究投入四個方面,其中前三項是成果質(zhì)量評價指標,只有結合研究投入進行綜合分值合成,才是對研究成果的最終價值評價。
關鍵詞人文社會科學科研成果評價指標體系
1評價指標體系概述
1,1評價指標的概念與特點
任何一種評價工作都需要確定科學的評價目標,這是進行評價的基礎。只有確定科學的評價目標,才有可能對評價對象進行全面評價。成果評價目標,是指成果評價本身要達到的境地,是衡量科學研究成果質(zhì)量的尺度與價值標準。指標是將具有原則性、概括性和抽象性特征的評價目標,逐級分解,使之最終成為具體的、行為化和可測的諸分目標,這些經(jīng)分解后可測的分目標,我們稱之為指標?;蛘呤?,指標就是具體化了的目標。目標和指標是一個相對的概念,一個目標可能是比它大的管理系統(tǒng)目標的一個指標;一個指標也可能是它所包含的子系統(tǒng)的一個目標。
從目標到指標,必須經(jīng)過逐層分解,先由總目標到不同層次的分級指標,再由最后一層分級指標到末級可測指標。這種由總目標向末級可測指標轉(zhuǎn)化的過程,就是建立指標體系的過程。指標體系的建立過程,實際上也是人們價值認識取得一致的過程。人們提出一些指標并給予相應的權重,本質(zhì)上就是把人們的價值認識客觀化,使人們的價值認識凝集在指標和相應的權重之中。有了一致的價值認識才有可能獲得一致的評價結論。
1,2評價指標體系的形式
在構建評價指標體系時,評價者一般假定指標體系具有層次結構。我們分解這些層次結構時,將指標系統(tǒng)分解成串聯(lián)形式或并聯(lián)形式。串聯(lián)是一個指標作為另一個指標產(chǎn)生意義的必要條件的兩個指標間的聯(lián)系方式。在串聯(lián)形式中,指標是按照嚴格的序關系排列的,任何不按照既定指標排列順序排列指標的結果,相對于既定的評價標準來說,都是無意義的。串聯(lián)形式重在將單指標變?yōu)榭蓽y形式,例如把論文的被引數(shù)作為論文類成果的學術價值評價指標。并聯(lián)是互相作為對方補充的兩個指標間的聯(lián)系方式。在并聯(lián)形式中,指標間不存在按序關系排列,但強調(diào)各指標的地位對等及指標體系自身的完備性。一般來說,對評價標準作橫向要素分解,所得到的指標之間的關系就是并聯(lián)關系,相應的指標系統(tǒng)形式也表現(xiàn)為并聯(lián)形式。
建構科學研究成果評價指標體系就是將串聯(lián)形式和并聯(lián)形式的聯(lián)系放在一起,建立以指標為結構的網(wǎng)絡,并對網(wǎng)絡進行優(yōu)化。
2人文社科研究成果評價指標體系的設計原則
目前,我國人文社會科學研究成果的評價之所以存在方方面面的問題,并非由于評價方法本身存在問題,而是評價指標的信息獲取途徑即評價觀測點的選取問題,也可以說是評價指標設計體系與評價方法的具體操作問題。評價指標能在多大程度上真實刻畫與凝聚研究成果的本質(zhì)屬性,評價數(shù)據(jù)能在多大程度上逼近評價指標所內(nèi)含的價值要素,這將對評價的最終結果起到?jīng)Q定性作用。
研究成果評價指標體系設計是整個科研評價體系設計的核心與關鍵。依據(jù)社會度量學的相關原理,評價指標體系設計的基本原則主要有科學性原則、操作性原則與關聯(lián)性原則。
●科學性原則
評價指標是對待評價對象的實物抽象轉(zhuǎn)換,愈是接近實物,這種轉(zhuǎn)換就愈是成功,指標體系也就愈加科學。所以,本指標體系設計的首要原則是:多主體多視角多層面客觀準確地描述人文社會科學成果的產(chǎn)生特點與評價規(guī)律。
●操作性原則
人文社會科學成果評價既要求量度的精確性,又要求具備可操作性,否則整個設計就沒有實際意義。實際上,成果評價就是一種社會度量活動,反映的是一種共軛映射現(xiàn)象,是以操作性為基本要求的近似度量。所以,在成果評價指標體系設計中,每一個評價目標與評價標準都要通過層層分解而具體化為幾個可操作性評價指標,使其可度量、可操作。
●關聯(lián)性原則
每個評價指標的背后都隱含著一個潛在的評價主體及與其相對應的評價標準和價值取向,而指標之間的關系,其實就是不同評價主體之問的評價與被評價關系。所以,評價主體的關聯(lián)性決定了指標之間具有關聯(lián)性。科學研究過程是一個整體,科學研究成果是研究過程的結晶。研究成果的規(guī)范性、創(chuàng)新性與價值性,本身就體現(xiàn)了科學研究生產(chǎn)、傳播與應用的各個環(huán)節(jié)。所以,這些評價標準與指標之間具有天然的關聯(lián)性,只是為了評價的方便才被人為分割,我們在評價體系設計時需要通過權重設置與整個評價體系的有機組合來彌合裂痕,體現(xiàn)出關聯(lián)性。
3人文杜科研究成果評價指標構成分析
從不同的分類角度,可以將評價指標劃分為不同的類型。按照指標數(shù)值信息的獲取渠道,可以分為:直接指標與間接指標;按照指標的評價方法,可以分為:定性指標與定量指標;按照指標體系的構成形式,可以分為:一級指標與二、三、四級指標;按照指標的性質(zhì),可以分為:客觀指標與主觀指標。
科學研究及其成果質(zhì)量評判實質(zhì)上主要涉及到創(chuàng)新性、價值性與科學性這三個方面。目前,我國的成果評價研究與評價實踐中也大都主要是以這幾個方面作為基本評價要素,只是在不同的評價環(huán)境與評價目標中,又會產(chǎn)生不同類型的指標分解及權重分配。
人文社會科學研究成果評價體系的指標構成主要包括創(chuàng)新程度、完備程度、價值含量(分解為:學術價值含量與社會價值含量)、研究投入,而且每一個評價指標背后都有與其相對應的評價主體。具體到不同的成果類型,再根據(jù)具體評價需要有所取舍或分合。
3,1價值含量指標
從社會價值來看,“格物致知”、“經(jīng)世致用”一直是知識者和學問家永恒的議題與學術追求。如果一門知識或一門學問不能對社會發(fā)展和時代進步有所貢獻,如果知識的意義不能為多數(shù)人認知和理解,學者所孜孜以求的知識將失去了存在的價值。作為知識的生產(chǎn)者和傳播者,知識分子有責任、有義務、有能力讓知識更科學、讓人類更理智、讓社會更文明。在當下中國所面臨前所未有的轉(zhuǎn)型時刻,社會有太多的問題需求解答,前進中的問題和發(fā)展中的問題不同程度地出現(xiàn),比如國資流失、官場尋租、盲目決策、生態(tài)失衡、貧富傾斜、社會不公等諸多問題。這些問題的解決一方面需要普通公眾的參與和熱情,另一方面需要知識精英的聲音和在場。但是,由于各方面原因,我國知識分子在私人領域與公共領域之間存在著一定程度的邏輯斷裂。所以,當代的社會是一個需要表達的社會,當今的時代是一個尋求邏輯建構的時代。在一個公共文化欠缺和公民社會不成熟的國度里,更需要知識人的話語與在場。在一個缺少英雄的時代里,知識人的學術魅力以及飽含專業(yè)精神與人文關懷的公共責任感顯得尤為重要。
與此同時,任何科學的研究除了它的社會價值之外,其研究本身也就是一種價值之所在,這種價值
就是學術價值??茖W的有用性有時候并不體現(xiàn)在科學能夠解決什么實際問題,能夠創(chuàng)設科學體系本身或許能夠?qū)δ骋谎芯繉ο筮M行科學的闡釋與解讀,也可以是科學研究之價值所在。從這個角度來看,在評價社會科學的成果時,既要評價其社會價值,也不能忽視其學術價值,社會價值與學術價值可以得到有機統(tǒng)一。一般可以認為,具有社會價值的一般也具有一定的學術價值,但是兩者也不完全一致,特別是不能認為沒有社會價值的就一定沒有學術價值。
成果價值含量中的學術價值與社會價值,正對應著該指標的兩類評價主體,即學術同行與社會受眾。學術價值主要通過學術同行對已公開成果的引用或下載體現(xiàn)出來,因為被引用或下載就意味著被認為有用,可以滿足其研究需求。社會價值主要通過公眾社會反響、成果采納部門的采納程度及其所產(chǎn)生的經(jīng)濟社會效益來反映。研究成果的學術價值與社會價值都要在成果公開發(fā)表(出版)或被采納實施之后才“浮出水面”,成為研究成果的客觀評價指標;之前,都只能是評審專家的主觀判斷或科研項目資助者的投入預期。所以,學術價值含量指標在間接指標評價體系中被分解為“被引用”和“被下載”兩個可測指標,社會價值含量被分解為“社會反響”指標和“采納部門”指標,在直接定性評價體系中則主要通過成果評審或鑒定專家的定性評語體現(xiàn)出來。但此時專家評價的意義會在一定程度上小于間接指標的評價意義,因為價值含量指標本身就是在成果價值關系形成之后才表現(xiàn)出來的,而價值關系的形成過程也就是間接指標的形成過程。
從另一個角度,依據(jù)經(jīng)濟學中的價值論與價值評估理論,科學研究成果的評價不僅需要把成果看成一種靜態(tài)的科研勞動成品,還要從動態(tài)的視角窺到成果的價值源頭及其背后的投入成本。同時,不僅要看到成果所帶給學人和社會的學術價值與社會價值,還要追溯它的研究基礎、資金投入與人力資源投入,以及其價值含量與投入成本之間的匹配或比例關系。當一項研究成果與其他研究成果相比價值含量相等時,其研究經(jīng)費投入越少則價值含量越大。這是經(jīng)濟學中的“價值最大化”原理,也符合人類行為的“最省力法則”。所以,從這個意義上說,研究成果的價值含量指標是一個綜合性很強的評價指標,它不僅包括成果的學術價值指標、社會價值指標,還涉及到成果的研究投入指標,同時學術價值與社會價值又是以成果的創(chuàng)新程度與完備程度為基礎與保障的。
3,2創(chuàng)新程度指標
研究成果的創(chuàng)新指標也是一個綜合性指標,創(chuàng)新性不但能引起價值性,也能反映出研究成果的科學性。因為只有立足現(xiàn)實需要與學科發(fā)展前沿的科學研究才可能找到創(chuàng)新點,而且真正的創(chuàng)新是尊重傳統(tǒng)基礎上的繼承性創(chuàng)新。創(chuàng)新特別是原始性創(chuàng)新是一個需要加強權重的評價指標,因為目前我國科學研究的創(chuàng)新性不足已引起社會各界的關注,成果的創(chuàng)新性已然成為成果質(zhì)量的代名詞。
創(chuàng)新性是科學研究的生命,是成果學術價值的核心。社科研究成果的創(chuàng)新包括幾個方面:①選題方面有創(chuàng)新;②開拓材料范圍或開辟新的研究領域、擴大認識對象的范圍;③修正前人錯誤的或不完全正確、不全面的認識;④提出與科學發(fā)展階段同步的新見解;⑤研究思路、研究方法有創(chuàng)新;⑥革新著述方式。應當說,只要能滿足上述條件的其中之一的科學研究,都可以稱得上是創(chuàng)新。
創(chuàng)新性標準既是一個綜合性指標,又是一個普適性指標,研究論文、學術著作與研究報告等各類型研究成果都將其作為一個必不可少的首選指標。對于學術論著而言,有一定創(chuàng)見與新意是其得以發(fā)表或出版的必要條件,而研究報告的研究是從問題開始的,創(chuàng)新也必然是從問題開始。現(xiàn)在很難把一個重大問題簡單地歸屬于某一個單一學科,問題存在于生活實際中,而不是存在于學科體系中,學科體系是為研究問題服務的,而不能反過來。據(jù)統(tǒng)計,№一ture和science這兩份典型的自然科學雜志,2000年以來發(fā)表了近百篇研究人類社會和人文問題的文章。如果僅從學科體系出發(fā)做研究,而不是為了解決實際問題,就不能真正做到創(chuàng)新。這樣看來,創(chuàng)新指標既與學術價值指標具有直接的關聯(lián)性,又與社會價值指標具有關聯(lián)性。
當前,最通行的科學研究成果的創(chuàng)新性評價主體是學科領域?qū)<?,即“小同行”。無論對于研究成果發(fā)表、課題成果鑒定還是獲獎,成果的創(chuàng)新性都是一個重要評價標準(如:國家社會科學基金項目成果評估指標體系中,論文與著作類成果都把創(chuàng)新程度指標賦予最高權重),而對其創(chuàng)新程度的判斷,基本上是憑借學科專家積累的知識基礎及專家對成果的整體印象而對研究成果進行定性評價。筆者認為,應將專家主觀評價與信息管理方法結合起來,構建基于信息檢索與成果查新的專家評價體系。具體到該指標的分解末梢,根據(jù)指標數(shù)據(jù)方便獲取的原則,可以將創(chuàng)新程度與完備程度評價指標合并之后,再分解為幾個二級間接評價指標。
3,3規(guī)范完備性指標
研究成果的規(guī)范完備性,主要是指科學研究過程的規(guī)范性、研究方法的科學性、研究邏輯的自洽性、成果結構的嚴謹性、論述的充分性等。為了發(fā)表或出版論著,科研工作者必須基于一定的研究起點提出自己的創(chuàng)見,而創(chuàng)見的提出必須通過一定的研究方法才能得到很好的闡釋與論證,那么此時,通過這種科學方法形成的研究成果就具備了研究方法的規(guī)范性、研究邏輯的自洽性、論證的充分性、結構的嚴謹性、表述的精煉性等特征,同時也就具備了研究規(guī)范的完備性特點。不管這一研究成果最終的結論是否完全正確,我們都應該稱之為科學成果,因為他遵循了科學的研究方法與學術規(guī)范。完備的研究規(guī)范是研究成果科學性的基本要求與基礎保障。
科研成果的完備性把關,首先是從編輯這一評價主體開始的。不遵守基本科研規(guī)范、不具有可讀性的研究成品,是不可能在學術期刊發(fā)表或在正式出版社出版的??蒲谐晒耐陚湫灾笜?,是為促進有效學術對話而設置的指標??梢哉f,研究論著的研究方法、論證邏輯及結構布局,是一個科研工作者在學術共同體中進行學術交流與共享的一種結構性語言,是學術思想得以傳播與繼承的基本形式。所以,這就要求真正的科研成果要具備科學用語的通用性、發(fā)表載體的權威性以及公布渠道的暢通性,從而更好地實現(xiàn)大范圍的知識共享,促進科學不斷進步。
研究成果的完備性指標評價主體除了書刊編輯還有領域?qū)<?,研究成果的初始發(fā)表,之后的被摘錄與獲獎,都要經(jīng)過嚴格把關與權威審核。而這些評價主體對研究成果的審核與評價標準主要在于兩個方面,一是內(nèi)容新穎性,二是方法科學性。專家審稿的重點是審查成果在研究領域的創(chuàng)新意義,編輯則主要在研究規(guī)范性等方面綜合把關。
那么,這就使成果的發(fā)表刊物級別、文獻摘錄方式、學術獲獎等級作為評價成果創(chuàng)新程度與完備程度的間接指標具備了假設前提。如上文所述,就可以在間接指標評價體系中,將創(chuàng)新程度與完備程度合并為一個“創(chuàng)新完備性”指標,意指較少考慮成果的同行反映與社會影響,而是由期刊選稿責編、領域
評審專家根據(jù)研究成果自身的創(chuàng)新程度與完備程度進行的規(guī)范審核。需要說明的是,研究成果的發(fā)表或出版級別與學術獲獎,更多是看重其創(chuàng)新程度,而被文獻摘錄特別是全文轉(zhuǎn)載則不然,它事實上更為重視論文的可讀性、綜述性與信息覆蓋面。
3,4研究投入指標
科研成果評價的研究投入指標是個爭議最大、問題最多的評價指標,因為它涉及到科研項目的審批與研究資源的分配等復雜的社會因素??茖W研究越來越面向問題,越來越需要綜合化與跨學科研究??茖W家獲得科研經(jīng)費資助是產(chǎn)業(yè)科學(或后學院科學)時代的必然產(chǎn)物與明顯特征,也是國家對社會科學研究的社會功能的一種強大預期與調(diào)控??茖W學研究表明,在科研經(jīng)費的資助下進行科學探索是符合科學研究活動規(guī)律的。所以,資助科學研究已經(jīng)成為各國促進科學發(fā)展進步的普遍現(xiàn)象與國際趨勢。
但是,由于科研經(jīng)費分配制度與科研項目成果評價機制的問題,導致了我國科研項目經(jīng)費使用的非理性,也使科研成果質(zhì)量與科研經(jīng)費資助力度之間存在著錯位與偏差。以北京大學第十屆人文社會科學優(yōu)秀成果獎為例,統(tǒng)計結果顯示:在全部獲獎成果中,無經(jīng)費資助的自選課題最多,有30項,占36.1%;其次是國家社科基金課題(包括國家社會科學基金重大、重點、一般、青年項目以及全國教育科學規(guī)劃項目、全國藝術科學規(guī)劃項目)、教育部課題(包括教育部人文社會科學研究規(guī)劃基金、博士點基金、青年基金項目以及教育部哲學社會科學研究重大課題攻關項目、教育部人文社會科學重點研究基地重大項目、教育部霍英東基金項目、全國高校古籍整理項目等)、校級課題(211工程、985工程項目等),均占16,9%;隨后是校外橫向課題,占8,4%。這種自選課題最多,國家社科基金、教育部課題、校級課題其次,其他來源課題再次的構成特點,在分成人文、社科兩大領域后,表現(xiàn)也大致相同。從這組數(shù)字可以看出,產(chǎn)出優(yōu)秀成果與科研資助力度之間不是必然的關系,更不是正相關關系,而這是不符合上文所述的一般科學研究活動規(guī)律的。如果說沒有經(jīng)費資助的自選課題由于出自科研人員的興趣,容易發(fā)揮其專長,更可能出優(yōu)秀成果的話,那么,如何才能通過國家科研基金這一政策性杠桿刺激出更多的優(yōu)秀成果呢?
有人提出改革的思路應該是整合現(xiàn)有國家資源,設立統(tǒng)一的國家人文社會科學基金,包括研究基金與獎勵基金。如果這樣,就需要研究受獎勵成果與受資助資金之間的關系,即:受獎勵成果的評價與遴選必須是基于成果質(zhì)量得分與受資助金額的比值。沒有受到資助或資助力度較小的優(yōu)秀成果,可以通過獎勵基金得到補償;質(zhì)量得分相等的成果,受資助金額越大得到的獎勵越小。
4人文社科研究成果評價指標權重與分值合成
針對指標構成,進一步分析指標之間的權重分配與換算關系,是構建一個完整評價指標體系中的重要環(huán)節(jié),需要結合不同的學科特點與文獻類型,采用適當?shù)墓ぞ吲c分析方法才能實現(xiàn)。
合理的評價指標權重分配方法是在綜合分析專家咨詢問卷的反饋結果的基礎上,選擇了定量定性有效結合的群組決策特征根法(GEM)和層次分析法(AHP法),運用MatLab 7.0軟件計算工具測算出評價指標的權重系數(shù),力圖能真實地反映各個指標的重要程度。至于對各指標數(shù)據(jù)得分的分值合成,是先將標志成果質(zhì)量的價值指標、創(chuàng)新指標與完備性指標三大指標的得分加權求和,得出該成果的質(zhì)量評價分值,然后將所得該成果的質(zhì)量評價得分除以研究投入指標的得分,才是該研究成果的最后價值得分。
一般情況下,應該鼓勵科研工作者爭取科研課題的資助與研究經(jīng)費的投入,受資助研究成果應該加分鼓勵而不是扣分,在國際上也是科研人員能拿到大課題資助是其科研水平和能力的標志。但研究經(jīng)費畢竟是一種稀缺資源,不是所有具有研究價值與應用前景的研究課題都能拿到經(jīng)費資助,那么,這就存在著受到資助的研究成果與沒有經(jīng)費資助的研究成果以及資助力度不同的研究成果之間的可比性問題。特別是對于我國目前學界共知的普遍存在的“科研致富”等非正常現(xiàn)象,如果成果評價時適當?shù)貙⑦@一因素考慮進去,應該會促使現(xiàn)狀的略微改觀,等資助體制趨于正常時再適當調(diào)整。同時,在具體的評價操作過程中,切忌誤解、誤導與誤操作,要考慮在什么情況下才可以考慮這一因素,以及如何逐步實施。所以,如果將課題來源作為評價科研成果價值的負影響,一定要控制該指標使用的范圍和條件。具體地說,當同類被評價研究成果的創(chuàng)新性、科學性與價值含量等指標表現(xiàn)類似或排序等級不易區(qū)分的時候,研究投入指標就可作為考核內(nèi)容之一,至少也要作為一個中性的參考指標列出,以供專家評價時參考。