袁 野
關(guān)于負(fù)強(qiáng)化的深入探析
袁 野
斯金納認(rèn)為:人或動(dòng)物為了達(dá)到某種目的,會(huì)采取一定的行為作用于環(huán)境,當(dāng)這種行為的后果對(duì)他有利時(shí),這種行為就會(huì)在以后重復(fù)出現(xiàn);不利時(shí),這種行為就減弱或消失。這種“有利的后果”就是強(qiáng)化。
根據(jù)強(qiáng)化的性質(zhì)和目的,可分為正強(qiáng)化和負(fù)強(qiáng)化。人們可以用正強(qiáng)化或負(fù)強(qiáng)化的辦法來影響行為的后果,從而修正其行為。在管理上,正強(qiáng)化就是獎(jiǎng)勵(lì)那些組織上需要的行為,從而加強(qiáng)這種行為;負(fù)強(qiáng)化是積極行為預(yù)期增加或者已經(jīng)增加,為了鞏固那些已經(jīng)增加的積極行為,撤銷原來的那些懲罰及與組織不相容的行為帶來的痛苦。正強(qiáng)化的方法包括獎(jiǎng)金、對(duì)成績(jī)的認(rèn)可、表揚(yáng)、改善工作條件和人際關(guān)系、提升、安排擔(dān)任挑戰(zhàn)性的工作、給予學(xué)習(xí)和成長(zhǎng)的機(jī)會(huì)等。負(fù)強(qiáng)化的方法包括撤銷批評(píng)、處分、降級(jí)等,有時(shí)恢復(fù)減少的獎(jiǎng)金也是一種負(fù)強(qiáng)化。
負(fù)強(qiáng)化,就是對(duì)于符合目標(biāo)的行為,撤消或減弱原來存在的消極刺激或者條件,以使這些行為發(fā)生的頻率提高。
筆者注意到了容易將負(fù)強(qiáng)化混同于懲罰的現(xiàn)象,例如Thyer Laura和L Myers指出:“正強(qiáng)化概念雖然是已經(jīng)進(jìn)入我們?nèi)粘I畹脑~匯,但即使受過良好訓(xùn)練的臨床工作者有時(shí)也被正強(qiáng)化與負(fù)強(qiáng)化、正懲罰與負(fù)懲罰和消退之間的區(qū)別所困惑?!笔聦?shí)確實(shí)如此。
《警犬訓(xùn)練學(xué)》一書認(rèn)為,“在警犬訓(xùn)練中,根據(jù)強(qiáng)化的性質(zhì)和目的可把強(qiáng)化分為正強(qiáng)化和負(fù)強(qiáng)化。凡屬糾正和改變?nèi)环嫌?xùn)練要求的條件反射活動(dòng),或制止犬某種不良聯(lián)系的行為而采取的手段及其效應(yīng),稱為負(fù)強(qiáng)化。”“禁止是訓(xùn)犬員或助訓(xùn)員通過使用威脅音調(diào)發(fā)出‘非’的口令,同時(shí)伴以強(qiáng)有力的機(jī)械刺激制止犬的不良行為所采用的負(fù)強(qiáng)化手段?!埂瘜?duì)犬來說,實(shí)質(zhì)上是一種抑制性的懲罰?!薄霸诰?xùn)練中,訓(xùn)犬員不僅要通過正強(qiáng)化加速犬所訓(xùn)作業(yè)能力條件反射的形成,而且還要對(duì)犬已形成的某些不良聯(lián)系,采取負(fù)強(qiáng)化進(jìn)行消退。”也就是說,負(fù)強(qiáng)化是一種懲罰,可以糾正和制止犬的不良行為或不良聯(lián)系。
《犬的行為原理》一書認(rèn)為,“強(qiáng)化是一種進(jìn)一步增大行為完成的可能性的刺激或活動(dòng)”“凡是其結(jié)果可使行為增加的就稱‘強(qiáng)化’,凡是其結(jié)果可使其行為減少的稱為‘懲罰’”。也就是說,無論正強(qiáng)化和負(fù)強(qiáng)化都可以使行為增加,但舉例為“通過對(duì)行為的正強(qiáng)化或負(fù)強(qiáng)化,可以使這種條件反射發(fā)生改變,如幼犬向家具上跳而遭到主人反復(fù)責(zé)備后,可使犬跳的頻率減少”,可見前后矛盾。
一、“正、負(fù)”的含義
首先要明白概念中“正、負(fù)”的含義。在實(shí)施強(qiáng)化與懲罰的過程中,如果呈現(xiàn)某事物,就叫做“正”,如果某事物消失,就叫做“負(fù)”。因此呈現(xiàn)某事物、導(dǎo)致犬愉快并使犬的特定行為表現(xiàn)頻率增加,就叫正強(qiáng)化;如果移去某事物、導(dǎo)致犬愉快并使行動(dòng)者特定行為增加,就叫負(fù)強(qiáng)化;呈現(xiàn)某事物、導(dǎo)致犬痛苦并使犬特定行為表現(xiàn)消失,就叫正懲罰:移去某事物、導(dǎo)致犬痛苦并使犬特定行為表現(xiàn)消失,就叫負(fù)懲罰。
Thyer Laura和L Myers認(rèn)為:“口語上,正強(qiáng)化可以貼上獎(jiǎng)勵(lì)的標(biāo)簽,當(dāng)一個(gè)結(jié)果呈現(xiàn),而自此以后該受到獎(jiǎng)勵(lì)的行為增加了,那么就發(fā)生了正強(qiáng)化。負(fù)強(qiáng)化可以被解釋為解脫,如果一個(gè)行為的結(jié)果由移走不愉快的事物構(gòu)成,該行為以后就被增強(qiáng)了,那么這就牽涉到負(fù)強(qiáng)化。當(dāng)一個(gè)行為的結(jié)果由呈現(xiàn)令人厭惡的東西構(gòu)成,那么就發(fā)生了正懲罰,它以該行為發(fā)生的可能性降低為結(jié)果。負(fù)懲罰包含移走令人愉快的事物,它以未來該行為發(fā)生的可能性降低為結(jié)果,口語上將負(fù)懲罰看做類似于罰款的操作”。負(fù)強(qiáng)化是好的,人們向往的,而懲罰是不好的,人們力求回避的。因此不能將負(fù)強(qiáng)化等同于懲罰。
二、從行為與結(jié)果關(guān)系考察
Barry Schwartz將效果律作為操作條件作用的基本問題進(jìn)行分析,他指出:“效果律研究的焦點(diǎn)是行為和它的結(jié)果、反應(yīng)和結(jié)果之間的關(guān)系。我們可以確認(rèn)四類行為——結(jié)果關(guān)系類型。一是行為能產(chǎn)生積極的結(jié)果,這種關(guān)系叫正強(qiáng)化;二是行為導(dǎo)致已經(jīng)呈現(xiàn)的刺激結(jié)束或移去,這種關(guān)系叫負(fù)強(qiáng)化;三是行為產(chǎn)生消極的結(jié)果,這種關(guān)系叫懲罰;最后一種是行為可能防止消極事件發(fā)生,這種關(guān)系叫回避?!睆男袨榕c結(jié)果關(guān)系看,正強(qiáng)化、負(fù)強(qiáng)化、回避等都將導(dǎo)致行為反應(yīng)的增加,而懲罰導(dǎo)致行為反應(yīng)頻率降低。
三、依據(jù)操作式條件反射原理,強(qiáng)化可以分為四種類型
(一)正強(qiáng)化:給予一種好刺激。為了建立一種適應(yīng)性的行為模式,運(yùn)用獎(jiǎng)勵(lì)的方式,使這種行為模式重復(fù)出現(xiàn),并保持下來。例如實(shí)驗(yàn)中猴子按下某按鈕即可以得到食物,將會(huì)培養(yǎng)其主動(dòng)按下按鈕。
(二)負(fù)強(qiáng)化:去掉一個(gè)壞刺激。為引發(fā)所希望的行為的出現(xiàn)而設(shè)立。例如實(shí)驗(yàn)中猴子按下某按鈕即可以停止對(duì)其噴水,將會(huì)培養(yǎng)其主動(dòng)按下按鈕。
(三)正懲罰:施加一個(gè)壞刺激。這是當(dāng)不適當(dāng)?shù)男袨槌霈F(xiàn)時(shí),給予處罰的一種方法。例如實(shí)驗(yàn)中猴子不小心碰到某個(gè)按鈕會(huì)遭到輕微電擊,將會(huì)使其避免碰到此按鈕。
(四)負(fù)懲罰:去掉一個(gè)好刺激。這種懲罰比之正懲罰更為常用。當(dāng)不適當(dāng)?shù)男袨槌霈F(xiàn)時(shí),不再給予原有的獎(jiǎng)勵(lì)。例如實(shí)驗(yàn)中猴子不小心碰到某個(gè)按鈕食物會(huì)從洞中漏出,將會(huì)使其避免碰到此按鈕。
一、在警犬訓(xùn)練中的應(yīng)用
其實(shí)在日常訓(xùn)練中,我們一直在有意或無意地使用負(fù)強(qiáng)化方法。例如,在培養(yǎng)犬立科目時(shí),如果“立”的口令下達(dá)后犬不立,可用右手向斜上方拉牽引帶,同時(shí)左手手指向上刺激犬腹部,這時(shí)犬會(huì)感受到來自脖子和腹部的非條件刺激,對(duì)于犬來說這是不舒服的,為了避免這個(gè)“壞刺激”再次施加到身上,犬會(huì)逐漸主動(dòng)做出立的動(dòng)作,訓(xùn)犬員則在犬主動(dòng)做出動(dòng)作后立即停止施加刺激。又如撲咬科目中令犬放口,當(dāng)“放”的口令下達(dá)后,犬依然會(huì)死死咬住護(hù)袖,我們常用向上提拉牽引帶、朝耳朵吹氣、用木棍按壓舌根等方法,這都是在對(duì)犬施加一個(gè)“壞刺激”,犬為了避免受到刺激會(huì)主動(dòng)形成聽到口令后放口的行為,訓(xùn)犬員則立即停止施加刺激。也就是說,訓(xùn)犬員在犬做出正確動(dòng)作時(shí)給予食物等獎(jiǎng)勵(lì),則屬于正強(qiáng)化;而為了防止犬隨意撲咬人或隨地揀食對(duì)其施加的強(qiáng)有力的機(jī)械刺激,則屬于正懲罰。
二、在訓(xùn)練教學(xué)中的應(yīng)用
在警犬訓(xùn)練教學(xué)過程中,也可以參照企業(yè)管理方法,對(duì)學(xué)員實(shí)施強(qiáng)化與懲罰,有利于培養(yǎng)學(xué)員的訓(xùn)練積極性。讓那些訓(xùn)練成績(jī)差的人在隊(duì)伍前檢查自己的不足——這實(shí)際是一種正懲罰,那些沒有上臺(tái)的人得到了負(fù)強(qiáng)化;讓成績(jī)好的人在隊(duì)伍前帶犬示范、談?dòng)?xùn)練的心得、給予表揚(yáng)——這是正強(qiáng)化,而那些沒有上臺(tái)的人就受到了負(fù)懲罰。這里的負(fù)懲罰給學(xué)員們提供了努力的方向,且自尊心不會(huì)受到影響,因而與正懲罰相比,人們更樂于接受負(fù)懲罰。另外,負(fù)強(qiáng)化能否發(fā)揮激勵(lì)作用取決于負(fù)強(qiáng)化物的性質(zhì),如果負(fù)強(qiáng)化物具有激勵(lì)作用,那么負(fù)強(qiáng)化就具有激勵(lì)作用。
一、必須與刺激結(jié)合起來使用。沒有相應(yīng)的刺激措施,犬逃避刺激的行為就不會(huì)出現(xiàn),行為出現(xiàn)頻次更不會(huì)逐漸變高,也就不可能形成負(fù)強(qiáng)化。
二、必須應(yīng)用于科目的建立。很顯然,負(fù)強(qiáng)化和懲罰同樣具有積極的教育意義,但要清楚負(fù)強(qiáng)化是為了建立某種行為。因此,負(fù)強(qiáng)化主要針對(duì)犬科目的形成和鞏固。
三、負(fù)強(qiáng)化如果想收到預(yù)期效果,必須建立在客觀、一致的情況下。就是無論任何時(shí)候,如果犬沒做出某行為,對(duì)其施加的刺激都是一致的;如果犬做出某行為,則立即撤銷對(duì)其施加的刺激,這樣才能在犬的觀念中建立起逃避刺激的反應(yīng)意識(shí),可以快速幫助犬建立起“行為”與“刺激”之間的因果關(guān)系。
(作者單位:公安部警犬技術(shù)學(xué)校,110034)
(編輯:顏 勤)