潘持春 盛宇華
摘要:面試是一種重要人事測評工具,被廣泛應用于各類人員招聘及選拔中,因此測評的有效性有著重要的理論與實踐意義。文章從面試的信度與效度及提高面試測評有效性的方法與途徑的角度,闡述了已往研究的發(fā)現(xiàn)。
關鍵詞:面試:面試的信度;面試的效度
作為一種重要的人員選拔方法,面試測評已被廣泛使用于各類企事業(yè)單位人員招聘及國家公務員選拔中。由于面試評價具有主觀性的特點,其有效性一直受到重點關注。早期的觀點認為面試的有效性較低(Sohmitt,1976;Ulrich & Tmmbo,1965),但隨后的一系列面試綜述和元分析表明,面試具有中等程度的效度,且面試方式的改變可以提高面試的信度和效度(Arvey & Campion,1982;MoDa-nlel et al,1994;Campion,Pursell,&Brown;,1988)。考慮到選拔手段與工具的有效性常常以信度與效度進行評價,本文擬從面試測評的信度與效度及提高面試測評有效性的方法與途徑方面,闡述以往的研究發(fā)現(xiàn)。
一、面試測評的信度研究
面試信度指不同評委面試同一個被試得出結論的一致性程度。面試信度低,意味著評委評價的一致性低,這樣的面試就沒有可靠性,所以。面試信度是有效面試的必要條件(劉遠我,2007)。面試信度主要包括兩個方面,一是面試要素內部信度,指面試測評要素之間的一致性。二是評委間信度。既評委之間評價的一致性。
早期有關面試綜述一致認為面試的信度較低(May,field,1964)。然而,近年來研究表明,面試是具有一定信度的,只是不同面試研究的測量信度差異很大,信度從O.15-0.80不等(劉遠我,2007)。尤其是Conway等(1995)對111個評委間信度系數(shù)和49個面試要素內部信度系數(shù)進行元分析,發(fā)現(xiàn)評委間信度為0.70。結構化面試要素內部信度為0.59,無結構面試要素內部信度為0.37。他們的研究還表明,研究設計(單獨面試和小組面試)、評委培訓和面試結構化程度(問題的標準化、評分的標準化等)是影響評委間信度的緩沖變量,而面試要索內部一致性系數(shù)受到問題標準化和評定項目數(shù)等緩沖變量影響。研究一致地發(fā)現(xiàn)面試結構化水平是面試信度的緩沖變量,一般隨著結構化程度提高,信度也提高,尤其是評委間信度??偟膩碚f,如果不考慮面試形式的差異,面試只有中等信度水平;如果考慮結構化的影響,結構化面試比無結構面試具有更高的信度。
二、面試測評的效度研究
面試的效度是指面試測量的準確性,即面試所測評到的結果與所要考察的內容相符合的程度。與傳統(tǒng)普遍認為面試缺乏效度的觀點不同,眾多的研究證據表明面試至少有中等水平的效度,Anderson和shackleton(1993)、Clark(1992)以預測結果與實際工作績效的相關系數(shù)作為效度指標,比較了各種測評技術的效度(劉遠我,2007)。數(shù)據表明,與其它測評工具相比,面試特別是結構化面試具有一定的效度。
Wiesner和Cronshaw(1988)分析了150個效度系數(shù)。發(fā)現(xiàn)平均的效度系數(shù)為0.26:對信度和區(qū)間限制進行矯正后,效度系數(shù)達到0.47。面試的結構化程度、職務分析類型及小組面試與單獨面試是影響面試效度的緩沖變量,非結構化和結構化面試的矯正效度系數(shù)分別為0.31和0.62:運用正式職務分析的面試比運用非正式職務分析的面試有更高的效度;在無結構面試的情況下,小組面試比單獨面試有更高的效度。McDaniel等(1994)分析了245個面試效度系數(shù),發(fā)現(xiàn)面試效度與面試內容(情景的、工作相關的或心理的)、面試方法(結構化與非結構化、小組與單獨面試)、以及效標性質(工作績效、培訓績效、工作年限、研究目的與行政管理目的)有關。研究表明。情景面試比工作相關面試具有更高的效度,分別為0.50和0.39;結構化面試比非結構面試有更高的效度,分別為0.44與0.33;面試對工作績效和培訓績效有類似的效度,各為0.37和0.36??梢?,面式具有較好的效度,即使無結構面試,效度也達到0.33。Schmidt和Hunter(1998)綜合分析了1985年以來人事選拔中經常運用的19種測評工具。如一般能力測驗、工作樣本、誠信測驗、責任意識測驗、面試和工作知識考試等。結果發(fā)現(xiàn)結構化面試效度系數(shù)與認知能力測驗和工作樣本的效度基本相同,都在0.50的水平。非結構面試的效度系數(shù)為0.38。
在20世紀70年代以前,人們認為效度強調的是預測指標的效用屬性(Guion,1980),它是選拔工具的特征。是既定不變的,這樣面試測評的效度差異應歸因于隨機誤差。事實上,效度是根據測量到的信息而作出的測評有效性的推理,推理所依照的外部標準被稱為效標(謝小云。2005)。這樣,面試測評效度不穩(wěn)定不僅是測量誤差的原因,還涉及到效標的選擇問題。由于效標的選擇較為困難。以往的很多面試效度研究選用不同的效標,這往往會導致同一測驗在不同應用情景下的效度差異,如以上級評定的工作績效為效標與以培訓績效為效標會有很大的差異(McDaniel et a1.,1994)。因此,面試測評中除了面試得分信息影響其效度以外,選拔中所使用的效標特征,也對其有效性有較大的影響。20世紀70年代-20世紀80年代各種效標下5個面試效度方面的元分析研究結果(Mc,Daniel et a1.,1994)。
三、提高面試有效性的方法與途徑
作為一種廣泛使用的測評工具,面試測評的有效性得到了眾多研究的肯定。包括職務分析類型、面試的結構化程度、面試評委的結構與組成及面試評委的培訓及效標的類型等在內的眾多因素,都會對面試測評有效性產生影響(洪自強,2002)。
目前,對面試測評有效性的研究已不再僅僅關注信度和效度的大小,而是越來越關注提高信度和效度的方法與途徑。通常,通過對工作進行全面地分析,對面試評委進行充分培訓,以及采用結構化面試的方法,可有效地提高面試的有效性。Campion等(1988)認為,通過以下措施:(1)面試問題在工作分析基礎上形成;(2)對每個被試問同樣的問題;(3)使用例子和說明;(4)有一個小組記錄和評定被試的回答;(5)對所有的被試實施這一過程:(6)強調與工作的關聯(lián)性、公平性和記錄,可以提高面試的評委間信度和預測效度。
國內學者盛宇華、方志軍及王平(2003)的研究認為。面試要素特征、面試的模式及評委的測評能力三者之間的有效匹配,可以提高面試測評的有效性。非結構化面試適宜測評高層次崗位的要素特征且用純經驗型的主試:結構化面試適宜測評低層次崗位的要素特征且用純技術型的主試。