趙勤濤 熊玉強(qiáng) 蘆 帥 葛 崢 張建華
(作者單位:趙勤濤、熊玉強(qiáng)、蘆帥、張建華,公安部南昌警犬基地,330100;葛崢,江西省上饒市公安局特警支隊,334000)
在工作犬的訓(xùn)練過程中,獎勵是最重要的手段之一,通過對犬表現(xiàn)出的期望行為的獎勵,增強(qiáng)期望行為出現(xiàn)的概率,加速對犬行為的培養(yǎng)和塑造。在實際訓(xùn)練過程中獎勵的方式和種類是多樣的,既有儀式化的獎勵,比如“好”的口令、撫摸或撫拍等,也有物質(zhì)的獎勵,最常用的是食物獎勵和物品獎勵。雖然已有文章闡述了獎勵的方法,但是尚未有研究對獎勵的原理進(jìn)行詳細(xì)解析。研究普遍認(rèn)為犬大約是15000年前從狼逐步馴化而來,在行為上遺傳了很多狼的行為習(xí)性,但近二百年來隨著人類生活環(huán)境的變化,犬的行為特點也發(fā)生了很大的變化,比如隨著食物越來越富足,犬的季節(jié)性發(fā)情變得愈發(fā)不明顯,集體狩獵和貯藏食物的本能在不斷退化,釋放獵取行為的刺激閾值在不斷提高等,深刻理解這些行為上的變化對于犬的訓(xùn)練具有重要意義。本文從行為學(xué)和行為進(jìn)化的角度,根據(jù)食物和物品的屬性論述食物獎勵和物品獎勵在工作犬訓(xùn)練中的使用原則和方法,以期為犬的訓(xùn)練提供參考。
對人來說,犬的訓(xùn)練是訓(xùn)導(dǎo)員對犬行為的人工選擇過程。對犬來說,訓(xùn)練的過程是犬不斷理解訓(xùn)導(dǎo)員的行為,通過不斷調(diào)整自己的行為進(jìn)而獲得最適生活環(huán)境的過程。最適生活環(huán)境既包括趨利避害的選擇平衡,也包括以最小的代價使得欲求得到滿足或?qū)崿F(xiàn)。犬的作業(yè)行為通??梢苑譃橛笮袨殡A段和完成行為階段,在欲求行為階段犬按照訓(xùn)導(dǎo)員的指令積極尋找和搜索目標(biāo),一旦找到目標(biāo),欲求行為結(jié)束,并開始完成行為階段,獲得獎勵后,完成行為結(jié)束。完成行為將會導(dǎo)致犬的欲求下降,使該行為系統(tǒng)在此后的一段時間內(nèi)不再發(fā)生或者誘發(fā)欲求行為的刺激閾值大大提高。因此工作犬的訓(xùn)練既要求訓(xùn)導(dǎo)員的行為有規(guī)律可循,讓犬充分理解訓(xùn)導(dǎo)員的目的和意圖,更重要的是訓(xùn)導(dǎo)員能充分認(rèn)識犬的基本行為原理,不斷調(diào)整犬的欲求,通過不同的獎勵方法使犬的欲求得到逐步或集中釋放,從而達(dá)到對犬行為選擇的目的和訓(xùn)練的預(yù)期效果。由此可見,獎勵在犬訓(xùn)練過程中的重要性,獎勵物的選擇、獎勵的程度、獎勵的層次和作業(yè)的難度都會影響犬的訓(xùn)練效果。
在工作犬訓(xùn)練過程中選擇食物還是物品進(jìn)行獎勵,需要理解兩種獎勵物的區(qū)別。首先,選擇食物獎勵或物品獎勵分別對應(yīng)的是選擇利用犬的食物欲求或獵取欲求進(jìn)行訓(xùn)練。其次,食物和物品對犬的需求層次不一樣,食物是犬滿足生存和發(fā)展的基礎(chǔ)需要,具有一定的周期性,犬吃飽了以后,饑餓感消失,犬的食物欲求下降,停止進(jìn)食一段時間后,饑餓感上升,食物欲求會再次上升。犬對物品的欲求是在食物欲求的基礎(chǔ)上,獵取欲求和游戲欲求的集中反映,是更高層次的需求。再次,食物欲求的釋放是漸進(jìn)的,因此食物獎勵可以重復(fù)多次,而獵取欲求的釋放是集中的,一次物品獎勵后會使犬的欲望下降,再次誘發(fā)犬欲求行為的刺激閾值會大大提高或暫時失效,因此物品獎勵不宜多次重復(fù)。最后,食物獎勵和物品獎勵的程度是不一樣的,犬作業(yè)的難度應(yīng)與獎勵的程度相結(jié)合,難度高獎勵大,難度低獎勵小,食物獎勵的量可以明顯區(qū)分出獎勵的大小,而物品獎勵的區(qū)分是不明顯的,但是物品獎勵有利于犬的欲求得到集中釋放,增強(qiáng)犬的獲得感。
犬的行為動機(jī)是犬為實現(xiàn)一定的目標(biāo)所表現(xiàn)出來的主觀愿望和意圖,是犬機(jī)體內(nèi)部刺激和外部刺激共同作用的結(jié)果,動機(jī)引起的行為變化具有可逆性。獲取食物的動機(jī)與犬的饑餓程度有關(guān),食物欲求通常隨著饑餓程度的增加而增加。比如犬不吃東西會變得越來越饑餓,此時吃食物的動機(jī)更為強(qiáng)烈,但當(dāng)喂給它食物后,機(jī)體恢復(fù)到非饑餓狀態(tài),食物欲求下降,那么犬游戲的動機(jī)可能變得更為強(qiáng)烈。研究認(rèn)為,犬在同一時刻只能做一件事,也就是說兩種行為不能同時發(fā)生。準(zhǔn)確把握犬的行為動機(jī)對獎勵物品的選擇至關(guān)重要,當(dāng)食物和物品同時存在時,如果犬選擇物品,說明此時食物欲求小于物品欲求,此時用物品獎勵更能激發(fā)犬的積極性。由于欲求行為本身并不能減少犬的動機(jī)欲望,也就是說犬的搜索過程并不能減少犬對物品的欲望,直到獲得物品獎勵,欲求得到釋放為止。根據(jù)這一原理,訓(xùn)導(dǎo)員可以在計劃的3次訓(xùn)練中,前面兩次給予食物獎勵,最后一次給予物品獎勵。如此不僅可以增加訓(xùn)練的次數(shù),還可以增強(qiáng)訓(xùn)練的效果。
行為反應(yīng)的疲勞現(xiàn)象是指同一刺激多次重復(fù),那么對應(yīng)該刺激的行為會逐步減弱,直到完全消失,疲勞現(xiàn)象是復(fù)雜行為的一個普遍特征,當(dāng)該現(xiàn)象發(fā)生后,導(dǎo)致釋放行為的刺激閾值升高,同樣的刺激不能使犬釋放行為,但刺激的轉(zhuǎn)換能重新誘發(fā)一個已經(jīng)疲勞的行為反應(yīng)。使用食物雖然可以多次重復(fù)給予獎勵,但是隨著獎勵次數(shù)的增加,犬的饑餓感不斷下降,食物欲求隨之下降。除此之外,食物的重復(fù)刺激會造成行為反應(yīng)的疲勞,犬不愿意為獲得食物再繼續(xù)作業(yè)甚至停止作業(yè),那么獎勵的效果將會大打折扣。此時如果希望訓(xùn)練繼續(xù)進(jìn)行,可以更換成犬更愛吃的食物或者將食物換成物品給予獎勵,即轉(zhuǎn)換外部刺激重新喚起已經(jīng)疲勞的行為,以便時刻保持犬對訓(xùn)導(dǎo)員的高度注意和欲求。
最適覓食理論指的是動物應(yīng)在投資最小和收益最大的情況下進(jìn)行覓食或改變覓食行為。以烏鴉捕食海螺為例,為了能吃到海螺肉,烏鴉需要先從海邊啄起海螺,然后飛到內(nèi)陸,再把它從高空扔到巖石上,待海螺殼摔破后再吃海螺肉,海螺越大,殼被摔破的概率也越大,烏鴉總是選擇較大的海螺捕食,雖然與小海螺相比,搬運大海螺的過程中需要消耗更多的能量,但小海螺殼難以摔破,烏鴉需要飛得更高或更多地扔螺次數(shù),這會造成不能達(dá)到收益的最大化。對工作犬的訓(xùn)練來說,最適覓食理論實際上涉及兩種選擇,即做什么工作和獲取什么獎勵。犬所獲取獎勵的類型受到最適原則的支配,比如在可以得到的食物中犬會選擇最有利或最可口的食物,當(dāng)有利性較大的食物數(shù)量增加時,有利性較小的食物就不能再次激發(fā)犬的工作欲望。當(dāng)犬的工作強(qiáng)度和難度增加時,意味著犬的精力投入也會隨之增加,如果犬完成一次“坐”的動作和完成200m2的草地搜索任務(wù)都給予同樣的食物或物品獎勵,那么就會造成付出和收益的比例失衡,引起犬搜索作業(yè)的積極性下降,此時訓(xùn)導(dǎo)員應(yīng)給予比一般訓(xùn)練更大量的或者更可口的食物獎勵,如果使用物品獎勵,應(yīng)該給予犬更喜歡的、更難獲得的物品進(jìn)行獎勵。
獎勵的刺激過濾是指犬在面對的各種獎勵刺激中,只有一部分獎勵刺激能使犬做出反應(yīng),也就是說只有能夠被犬感知的獎勵對訓(xùn)練才具有生物學(xué)意義,因此足夠的獎勵刺激才可以影響犬的行為。比如在訓(xùn)練犬“坐”的時候,只有訓(xùn)導(dǎo)員的獎勵刺激足以使犬的注意力在訓(xùn)導(dǎo)員身上時,獎勵才有意義,如果犬此時的注意力正盯著周圍車輛或行人,即使給予獎勵,對于“坐”的訓(xùn)練本身毫無意義。行為釋放是指在內(nèi)外部刺激下犬的某種行為得以發(fā)生,行為釋放和獎勵刺激的閾值、犬的行為動機(jī)、刺激過濾密切相關(guān)。比如在多次重復(fù)的搜索作業(yè)訓(xùn)練中,隨著訓(xùn)練的進(jìn)行,刺激行為釋放的閾值也不斷提高,那么對犬獎勵的量需要逐步增加,同時根據(jù)犬行為動機(jī)的變化,訓(xùn)導(dǎo)員需要不斷變換獎勵物,保持訓(xùn)導(dǎo)員獎勵刺激的有效性。
食物和物品獎勵作為犬訓(xùn)練過程中最主要的兩種獎勵物,本身沒有好壞之分,但是要根據(jù)犬的行為動機(jī)、作業(yè)的難易程度、訓(xùn)練的強(qiáng)度等方面選擇不同的獎勵物、獎勵物的種類和數(shù)量,以達(dá)到最好的訓(xùn)練效果。根據(jù)食物和物品的屬性差異和動物的需求層次理論,通常情況下選擇食物作為優(yōu)先獎勵物,當(dāng)犬的饑餓感下降食物欲求降低時,可以更換成更可口的食物或者選擇物品進(jìn)行獎勵,單一物品重復(fù)獎勵會造成犬的行為疲勞,因此訓(xùn)練過程中要準(zhǔn)備盡可能多的物品,根據(jù)犬對不同物品的欲求,依次進(jìn)行獎勵,爭取在有限的訓(xùn)練時間內(nèi),保持獎勵刺激對犬行為的影響,以便獲得更好的訓(xùn)練效果。