鄭瓊,胡麗君
(1.溫州醫(yī)科大學(xué) 婦兒教研室,浙江 溫州325035;2.重慶醫(yī)科大學(xué)附屬兒童醫(yī)院 兒外科,重慶400014)
??谱o(hù)士[1]的培養(yǎng)給臨床護(hù)理人員在專業(yè)發(fā)展上提供了一個(gè)全新的平臺(tái)。系統(tǒng)規(guī)范的專科護(hù)士培養(yǎng)體系的建立需要依賴多種手段,其中最重要的就是對(duì)??谱o(hù)士進(jìn)行專業(yè)的培訓(xùn)與考核[2]。培訓(xùn)是促進(jìn)受訓(xùn)對(duì)象達(dá)到所要求的規(guī)范標(biāo)準(zhǔn)的途徑,考核則是檢驗(yàn)培訓(xùn)效果和篩選培訓(xùn)合格的??谱o(hù)士的主要手段。專科護(hù)士培養(yǎng)體系的建立對(duì)??谱o(hù)士能力的提升和價(jià)值的實(shí)現(xiàn)具有重要意義。??谱o(hù)士考核一般分為實(shí)驗(yàn)考核與理論考核,目前,我國(guó)對(duì)于??谱o(hù)士培訓(xùn)的相關(guān)研究較多,但是對(duì)于??谱o(hù)士考核的研究相對(duì)較少。為此,本研究以教育學(xué)理論為指導(dǎo)設(shè)計(jì)了兒科??谱o(hù)士理論考核試卷,現(xiàn)報(bào)道如下。
1.1 研究對(duì)象 選擇2010-2011年參加兒科??谱o(hù)士培訓(xùn)的護(hù)士共32名,均為女性,年齡23~48歲,平均(30.8±3.2)歲;兒科工作年限:3~5年12名,5~7年5名,8~10年8名,>10年7名;學(xué)歷:中專3名,大專22名,本科7名;職稱:護(hù)師21名,主管護(hù)師8名,副主任護(hù)師3名。
1.2 方法
1.2.1 組建考核試卷設(shè)計(jì)小組 遵從教考分離原則,考核試卷設(shè)計(jì)小組成員不與培訓(xùn)教師重復(fù)??己嗽嚲碓O(shè)計(jì)小組共包括11名成員,其中主任醫(yī)生1名、副主任醫(yī)師2名、副主任護(hù)師2名、主管護(hù)師2名、兒科教研室教學(xué)人員5名和護(hù)理研究生1名。
1.2.2 考核試卷的設(shè)計(jì)
1.2.2.1 設(shè)計(jì)依據(jù) (1)考核的類型 為了能更科學(xué)有效地設(shè)計(jì)考核試卷,設(shè)計(jì)前應(yīng)先確定考核的目的與類型,并依據(jù)不同考核目的采用不同的考核設(shè)計(jì)標(biāo)準(zhǔn)和考核方案。①確定考核的測(cè)試性質(zhì):考核分為總結(jié)性測(cè)試和診斷性測(cè)試2種類型[3]??偨Y(jié)性測(cè)試的目的是為了了解培訓(xùn)對(duì)象所掌握知識(shí)、技能的程度,確定培訓(xùn)對(duì)象在后續(xù)教學(xué)過(guò)程中的學(xué)習(xí)起點(diǎn)及預(yù)知其在后續(xù)教程中成功的可能性,并為重新制訂新的教學(xué)目標(biāo)而提供依據(jù)。診斷性測(cè)試的目的是為了在教學(xué)啟動(dòng)前,了解培訓(xùn)對(duì)象已經(jīng)掌握的知識(shí)和技能水平,在此基礎(chǔ)上合理調(diào)整教學(xué)內(nèi)容,從而更有效地適應(yīng)培訓(xùn)對(duì)象的學(xué)習(xí)需要。本研究中,理論考核的目是為了了解并判斷參訓(xùn)人員知識(shí)與技能的掌握程度是否達(dá)到要求,因此本研究中的理論考核就應(yīng)兼具總結(jié)性和診斷性測(cè)試的性能。②確定考核類型:在教育學(xué)中,考核類型包括標(biāo)準(zhǔn)參照考核和常模參照考核2種。標(biāo)準(zhǔn)參照考核[4]又被稱為目標(biāo)參照考核,用于評(píng)定受試人員對(duì)所要求內(nèi)容的掌握水平是否已經(jīng)達(dá)到某一標(biāo)準(zhǔn),是一種參照一組明確設(shè)定的目標(biāo)或能力而編制的考題,反映的是考生對(duì)知識(shí)掌握的弱點(diǎn)和欠缺,例如自學(xué)考試和高中畢業(yè)會(huì)考等。常模參照考核[3]又被稱為選拔性考核,是依照常模來(lái)解釋考生的成績(jī)、比較考生成績(jī)高低的考核。其方式為預(yù)先確定考核所需要選拔的人數(shù),在考核后確定標(biāo)準(zhǔn)標(biāo)準(zhǔn)分?jǐn)?shù)線,符合此標(biāo)準(zhǔn)線的受試人員則被選拔,如高考和研究生入學(xué)考試等。本研究中的理論考核是為了了解參加培訓(xùn)的兒科護(hù)理人員是否達(dá)到兒科專科護(hù)士的基本要求,并通過(guò)考核發(fā)現(xiàn)其存在的不足,以便為后續(xù)的培訓(xùn)提供參照,故屬于標(biāo)準(zhǔn)參照考核。③依據(jù)考核類型實(shí)施命題設(shè)計(jì):標(biāo)準(zhǔn)參照考核和常模參照考核在命題設(shè)計(jì)上有很大區(qū)別[5]。標(biāo)準(zhǔn)參照考核只要求把達(dá)標(biāo)與未達(dá)標(biāo)的考生嚴(yán)格區(qū)分開(kāi),難度分布應(yīng)較廣,能反映不同內(nèi)容,不過(guò)分追求每道試題的區(qū)分度。常模參照考核要求把不同水平的考生盡可能地區(qū)分開(kāi),一般試題難度中等,但區(qū)分度要大。本研究中的理論考核是為了區(qū)分參考人員中達(dá)標(biāo)者與不達(dá)標(biāo)者,如在考核中有一部分考點(diǎn)應(yīng)該是參考人員需掌握的基本內(nèi)容,可能大部分甚至全部參考人員都能回答,無(wú)需過(guò)分追求該類試題的區(qū)分度,因此在命題設(shè)計(jì)時(shí)應(yīng)重點(diǎn)考慮標(biāo)準(zhǔn)參照考核的需要和特點(diǎn)。(2)認(rèn)知的不同層次 Blom等[6]將教育的目標(biāo)分為3個(gè)領(lǐng)域,即認(rèn)知、情感和運(yùn)動(dòng)技能目標(biāo)領(lǐng)域。理論考核主要考查的是認(rèn)知目標(biāo)領(lǐng)域,該領(lǐng)域是由識(shí)記、領(lǐng)會(huì)、應(yīng)用、分析、綜合和評(píng)價(jià)共6個(gè)層次構(gòu)成的一個(gè)完整體系。在該體系中,低層次是高層次的基礎(chǔ),高層次是在低層次要求上的提高和發(fā)展,由簡(jiǎn)單到復(fù)雜。本研究依據(jù)兒科的??铺攸c(diǎn),在試題設(shè)計(jì)時(shí)歸納出了4個(gè)認(rèn)知層次,其所占的比重分別為:①20%識(shí)記層次,指能夠正確表述和認(rèn)識(shí)科學(xué)事實(shí)、原理、規(guī)律和術(shù)語(yǔ),知道課程的基礎(chǔ)知識(shí),并能正確地進(jìn)行判斷和選擇;②30%理解層次,指能將所學(xué)知識(shí)加以歸納和解釋,能領(lǐng)悟某一原理或概念與其他原理或概念之間的聯(lián)系與區(qū)別,并能做出正確的解釋和表述;③35%簡(jiǎn)單應(yīng)用層次,指能用所學(xué)的概念、方法和原理正確地分析和解決較為簡(jiǎn)單的問(wèn)題;④15%綜合應(yīng)用層次,指能夠運(yùn)用所學(xué)知識(shí),靈活分析和解決較為復(fù)雜的問(wèn)題。(3)培訓(xùn)內(nèi)容 依照理論知識(shí)培訓(xùn)的內(nèi)容和要求設(shè)計(jì)考核試卷:65%的護(hù)理理論知識(shí),其中5%為相關(guān)護(hù)理學(xué)基礎(chǔ)理論、10%為護(hù)理專業(yè)基本操作理論、20%為兒科??萍膊∽o(hù)理理論、20%為兒科專科特殊護(hù)理技術(shù)理論、10%為兒科??谱o(hù)理進(jìn)展;35%的兒科疾病理論知識(shí),其中10%為相關(guān)兒科專業(yè)基礎(chǔ)知識(shí)、20%為兒科??萍膊≈R(shí)、5%為兒科??萍膊≈R(shí)進(jìn)展。
1.2.2.2 試題難度的預(yù)設(shè) 在教育學(xué)的經(jīng)典測(cè)量理論(classical measurement theory,CTT)[7]中,難度為考生答題時(shí)所感受出的困難程度,反映在數(shù)值上就是考生在該試題上的得分率或通過(guò)率,通常又被稱為統(tǒng)計(jì)難度,統(tǒng)計(jì)難度不是試題本身的屬性,而是試題對(duì)于一組特定考生的適應(yīng)性,其數(shù)值會(huì)隨著受測(cè)群體的變化而發(fā)生改變,常常被用于測(cè)試后的評(píng)價(jià)。而在項(xiàng)目反應(yīng)理論(item response theory,IRT)中[8],難度則被定義為試題本身固有的一種特性,試題的難易程度取決于剛好能夠答對(duì)的那一部分人自身水平的高低,水平高的剛好能夠答對(duì)該測(cè)試題,而水平低的可能不能答對(duì),該題則難;水平低的剛好也能答對(duì)該測(cè)試題,該題則易。這種難度與考生的能力建立在同一水平上,其設(shè)定往往來(lái)源于試卷設(shè)計(jì)人員對(duì)考核對(duì)象水平的主觀估計(jì),但又不因設(shè)計(jì)人員主觀估計(jì)的變化而改變。依據(jù)兒科??铺攸c(diǎn)及專家函詢結(jié)果的綜合分析,設(shè)計(jì)小組選擇采用IRT理論來(lái)預(yù)設(shè)試題難度,很難、較難、一般和較易難度試題的比例分別為5∶30∶45∶20;考核后采用CTT理論對(duì)試題進(jìn)行分析。
1.2.2.3 試卷題型、題量、分值分布和完卷時(shí)間的預(yù)設(shè) 試卷總分100分,共有單項(xiàng)選擇題(包括A1、A2、A3和A4型4種)、填空題、名詞解釋、簡(jiǎn)答題和論述題5種題型。其中選擇題共40題,每題1分;填空題5題共14空,每空0.5分;名詞解釋共9題,每題2分;簡(jiǎn)答題共6題,可選做5題,每題4分;論述題1個(gè),包括3小問(wèn)題,每個(gè)小問(wèn)題的分值分別為3、3、9分。客觀性與主觀性試題的分值比例接近1∶1,完卷時(shí)間為2h。
1.2.3 試卷的修改和生成 (1)試卷的修改 通過(guò)專家函詢法,試卷設(shè)計(jì)小組對(duì)試卷的版面、試題表述的準(zhǔn)確性和簡(jiǎn)潔性、試題與教學(xué)大綱內(nèi)容的相符性、命題方案與認(rèn)知層次的一致性、考點(diǎn)內(nèi)容的必要性和重要性、標(biāo)準(zhǔn)答案的準(zhǔn)確性、評(píng)分標(biāo)準(zhǔn)的合理性等都進(jìn)一步加以修正。設(shè)計(jì)小組對(duì)試卷共進(jìn)行了5次修改,對(duì)論述題的設(shè)計(jì)和修改進(jìn)行了3次專題討論。(2)試卷的生成 使用《試卷管理和試卷自動(dòng)生成系統(tǒng)V 1.0.0版》軟件,將試題逐題輸入軟件內(nèi),自動(dòng)生成A、B、C共3套理論考核試卷。隨機(jī)抽取其中2套試卷作為考核試卷,其中被抽取的A卷為培訓(xùn)前考核試卷,C卷為培訓(xùn)后考核試卷,B卷則作為備用試卷(故以下僅分析A、C卷)。試卷統(tǒng)一由專人印刷、封存、保管,遵循教考分離的原則。
1.3 考核試卷的評(píng)價(jià)指標(biāo) (1)信度:反應(yīng)試卷成績(jī)的可靠程度,用Cronbachα系數(shù)反映,要求>0.7。(2)效度:由12位相關(guān)專家根據(jù)試題表述的準(zhǔn)確性與簡(jiǎn)潔性、試題設(shè)置與教學(xué)大綱內(nèi)容的相符性、命題方案與認(rèn)知層次的一致性、考試內(nèi)容的必要性和重要性、標(biāo)準(zhǔn)答案的準(zhǔn)確性及評(píng)分標(biāo)準(zhǔn)的合理性等評(píng)價(jià)每道試題的內(nèi)容效度CVI值,要求>0.8。采用Likert 5級(jí)計(jì)分法,“非常同意”為5分、“比較同意”為4分、“一般”為3分、“比較不同意”為2分、“不同意”為1分。(3)難度的評(píng)價(jià):用“統(tǒng)計(jì)難度”即以答對(duì)試題的考生人數(shù)與總考生人數(shù)的比(用P表示)來(lái)反映試題的難易程度。衛(wèi)生部國(guó)家考試中心規(guī)定,難度值<0.4為“難”、0.4~0.8為“中”、>0.8為“易”。(4)區(qū)分度:反映了考核試題對(duì)不同水平考生的區(qū)分程度和辨別能力。區(qū)分度≥0.4,試題很好;0.30~0.39,試題良好;0.20~0.29,試題尚可,仍需改進(jìn);≤0.19,試題應(yīng)考慮修改或放棄。
1.4 統(tǒng)計(jì)學(xué)處理 采用SPSS 14.0統(tǒng)計(jì)軟件及重慶醫(yī)科大學(xué)統(tǒng)計(jì)學(xué)教研室提供的試卷定量分析系統(tǒng)2.0版本作試卷及數(shù)據(jù)分析,難度評(píng)價(jià)采用正態(tài)性檢驗(yàn)(W檢驗(yàn)),以P<0.05或P<0.01表示差異有統(tǒng)計(jì)學(xué)意義。
結(jié)果顯示,本研究設(shè)計(jì)的兒科專科護(hù)士考核試卷內(nèi)容效度均>0.8,說(shuō)明試卷版面形式設(shè)計(jì)較合適,表述也比較準(zhǔn)確、清晰、簡(jiǎn)潔,對(duì)知識(shí)體系的代表性較好,能體現(xiàn)考核的目的和要求;試卷的信度、效度、難度及區(qū)分度的情況見(jiàn)表2、3、4。
表1 試卷的總體分析
表2 試卷及各類題型的難度系數(shù)
表3 試卷及各類題型的區(qū)分度
表4 試卷難度與區(qū)分度的綜合分析
3.1 考核試卷題型分配和形式符合兒科??谱o(hù)士的考核需要
3.1.1 考核試卷題型分配合理 考核試卷中的客觀性試題為單選題和填空題,主觀性題為名詞解釋、簡(jiǎn)答和問(wèn)答題,客觀題和主觀題的分值分別設(shè)定為47、53分,比例接近1∶1。對(duì)于以衡量被測(cè)者是否達(dá)到要求標(biāo)準(zhǔn)為目的的標(biāo)準(zhǔn)參照考試類型,題型分配比較合理。
3.1.2 考核試卷形式符合要求 理論考核中,應(yīng)保證試卷的組織形式或試題的呈現(xiàn)形式不影響考生的答題質(zhì)量。因此,試題在表述上應(yīng)保證意思表達(dá)清晰且準(zhǔn)確,試卷在組織形式上應(yīng)簡(jiǎn)潔有條理。如果考生需花費(fèi)大量時(shí)間才能讀懂試題題干或?qū)υ囶}在表述上就產(chǎn)生了主觀理解偏差,這都可能影響考生答題的速度和效果。此外,試題內(nèi)容能否很好地代表所考核的知識(shí)體系也可能影響考生的答題質(zhì)量。表1中,試卷的內(nèi)容效度均高于0.8,說(shuō)明了試卷版面形式上設(shè)計(jì)較合理,表述也比較準(zhǔn)確、清晰和簡(jiǎn)潔,試卷對(duì)知識(shí)體系的代表性較好,能體現(xiàn)考核的目的和要求。
3.2 進(jìn)一步提高試卷信度、難度系數(shù)
3.2.1 控制隨機(jī)誤差,提高試卷信度 試卷的信度Cronbachα系數(shù)均高于0.7,說(shuō)明試卷在對(duì)考生成績(jī)的檢測(cè)上比較可靠,此試卷可以考慮采用??梢酝ㄟ^(guò)提高試卷設(shè)計(jì)的信度來(lái)提高試卷的可靠度,而Cronbachα系數(shù)的大小主要受隨機(jī)誤差的影響,而影響隨機(jī)誤差的因素又比較復(fù)雜,如試題的難度、命題質(zhì)量、試題的題量、考試的時(shí)間設(shè)置、評(píng)分中的主觀性,甚至考場(chǎng)的紀(jì)律都可能是影響Cronbachα系數(shù)的因素。為了減少這些隨機(jī)誤差,本研究遵循“五嚴(yán)”原則,具體為:(1)嚴(yán)格的教考分離制度:試卷設(shè)計(jì)人員與實(shí)施培訓(xùn)的教師為2套,禁止互相交流試卷內(nèi)容,以免授課內(nèi)容可能存在的傾向性。(2)嚴(yán)格的命題制度:由具有豐富教學(xué)和命題經(jīng)驗(yàn)的教師進(jìn)行命題,出題范圍嚴(yán)格依照教學(xué)大綱的要求,多次討論、審核并修改試題的形式與內(nèi)容,以保證命題質(zhì)量。(3)嚴(yán)格的試卷管理和保密制度:試卷從命題、印刷、分裝和保管都必須由專員管理,貼上封條并僅能在考試當(dāng)場(chǎng)開(kāi)封,考試完畢后即由監(jiān)考人員將答卷密封上交。(4)嚴(yán)格的監(jiān)考制度:嚴(yán)肅考場(chǎng)紀(jì)律,使考試的結(jié)果能真實(shí)客觀地反映出每一位考生的能力和水平。(5)嚴(yán)格的試卷批閱制度:制訂標(biāo)準(zhǔn)答案并給出明確的得分點(diǎn),在閱卷前對(duì)改卷人員實(shí)施統(tǒng)一培訓(xùn)以保證評(píng)分標(biāo)準(zhǔn)的一致性。實(shí)施封閉閱卷,進(jìn)行2次評(píng)分,取2次分?jǐn)?shù)的平均值,以減少試卷評(píng)分過(guò)程中產(chǎn)生的主觀誤差。
3.2.2 篩選合適的試題區(qū)分度和難度系數(shù) 試卷質(zhì)量的整體評(píng)價(jià)由區(qū)分度和難度系數(shù),構(gòu)成。表2顯示,兩套試卷的整體難度系數(shù)均在0.4~0.8,說(shuō)明本研究設(shè)計(jì)的試卷難度較適中。在試卷的5類題型中,A卷名詞解釋的難度比較大,A、C卷中其他題型的難度較適中,符合試卷設(shè)計(jì)的預(yù)設(shè)要求。本研究依照Seyer理論,綜合分析了試題的難度和區(qū)分度,將不同質(zhì)量的試題人為地劃分為7大類,所占比例如表4所示,一類、二類理想試題為35.48%,六類不可接受試題為9.68%,七類試題為19.35%(這類試題為視情況保留或刪除試題)。因此如果需要進(jìn)一步完善試卷,則應(yīng)適當(dāng)修改第六類試題,使其更能符合考核的要求,而對(duì)于一類及二類等較為理想的試題則加以保留。
3.3 需要注意的問(wèn)題
3.3.1 區(qū)分度 區(qū)分度作為篩選和完善試題的主要依據(jù),受到多種因素的影響,如試題太難或太易等。太難的試題所有人都可能答錯(cuò),太容易的試題所有人都可能答對(duì),這都會(huì)使試題區(qū)分度為零。此外,由于理論知識(shí)中某些非常重要且必須掌握的內(nèi)容,可能大多數(shù)人通過(guò)培訓(xùn)后也都能掌握,因此在標(biāo)準(zhǔn)參照考核類型的考核中,這類試題的區(qū)分度也可能會(huì)為零。這都是需要在刪除無(wú)區(qū)分度或區(qū)分度小的試題時(shí)綜合考慮的因素,這類試題需要依據(jù)考核的實(shí)際情況而作適當(dāng)刪除或保留。
3.3.2 難度系數(shù) 考生自身水平可能造成難度系數(shù)對(duì)區(qū)分度的影響。難度系數(shù)高的試題對(duì)水平高來(lái)說(shuō),區(qū)分度有可能會(huì)相對(duì)較高;而對(duì)水平低的考生來(lái)說(shuō),如果大家都答不對(duì),那區(qū)分度就可能比較低甚至為零。難度系數(shù)低的試題對(duì)水平低的考生來(lái)說(shuō),區(qū)分度可能會(huì)相對(duì)較高;而對(duì)水平高的考生來(lái)說(shuō),由于可能出現(xiàn)都答對(duì)的情況,這時(shí)區(qū)分度就會(huì)比較低甚至為零。所以,在設(shè)計(jì)考核試題時(shí)應(yīng)依據(jù)考核的目的綜合地考慮統(tǒng)計(jì)難度和區(qū)分度。本研究以測(cè)試護(hù)理人員是否達(dá)到相關(guān)標(biāo)準(zhǔn)為目的,因此對(duì)試題統(tǒng)計(jì)難度要求應(yīng)當(dāng)適中,且對(duì)區(qū)分度的要求并不高。
[1]梁玉華.澳門(mén)護(hù)理發(fā)展:回顧與前瞻[J].中國(guó)護(hù)理管理.2004,4(6):60-62.
[2]Lyon B L,Minarik P A.Statutory and regulatory issues for clinical nurse specialist practice:Ensuring the public’s access to CNS service[J].Clin Nurse Specialist,2001,15(3):108-114.
[3]佟慶偉.常模參照考試與目標(biāo)參照考試[J].教育理論與實(shí)踐,1990,10(1):28-30.
[4]許華琳.常模參照性測(cè)試與尺度參照性測(cè)試比較[J].寧波大學(xué)學(xué)報(bào):教育科學(xué)版.2004,26(3):79-81.
[5]劉景軒,趙世明.標(biāo)準(zhǔn)參照考試的概念與理論問(wèn)題[M].中國(guó)高等醫(yī)學(xué)教育,1998,(2):39-41.
[6]李建新.布魯姆的“目標(biāo)教學(xué)”理論及在教學(xué)實(shí)踐中的應(yīng)用[J].楚雄師專學(xué)報(bào),2000,15(4):92-94.
[7]沐守寬.CTT與IRT測(cè)量原理之比較[J].上海師范大學(xué)學(xué)報(bào):基礎(chǔ)教育版,2010,35(4):6-9.
[8]趙守盈,石艷梅,朱丹.項(xiàng)目反應(yīng)理論在大規(guī)模選拔性考試試題質(zhì)量評(píng)價(jià)中的應(yīng)用[J].教育學(xué)報(bào),2013(1):71-77.