羅 宇 郭 亮 成興盛 高文斌 張彥鵬
獎勵是警犬訓(xùn)練及警犬現(xiàn)場使用的驅(qū)動力,警犬的訓(xùn)練及使用都需要使用獎勵。獎勵能否得到良好的實施直接關(guān)乎最后警犬訓(xùn)練及使用的成敗,關(guān)乎警犬及訓(xùn)導(dǎo)員的下一步訓(xùn)練、使用計劃的部署。實踐證明,梯度化獎勵的應(yīng)用是高效提高警犬獎勵效能的有效措施。筆者結(jié)合自身實踐就警犬訓(xùn)練、使用中梯度化獎勵的應(yīng)用展開討論。
梯度化獎勵就是在警犬的訓(xùn)練、使用中,對警犬進行獎勵時將對警犬應(yīng)用的所有獎勵進行梯度化地給予,以最大限度地提高警犬的興奮性,最大限度地調(diào)動犬的積極性,最大限度地讓犬感受到獎勵,從而實現(xiàn)高效提高警犬的訓(xùn)練及使用效能的目的。要深刻認(rèn)識到在警犬的日常訓(xùn)練及各類案件現(xiàn)場的使用中,梯度化獎勵的應(yīng)用是快速幫助訓(xùn)導(dǎo)員指揮警犬達到相關(guān)的訓(xùn)練及使用目的的高效手段。
首先訓(xùn)導(dǎo)員要將對警犬日常訓(xùn)練、使用中應(yīng)用的各種獎勵進行總結(jié)歸納,涵蓋實際訓(xùn)練及使用中應(yīng)用的各類常見獎勵如:食物獎勵、言語口令性的夸贊、認(rèn)同獎勵、撫拍、按摩類鼓勵性的獎勵、球類玩具的獎勵以及散放等給予犬自由活動獎勵等。其次是訓(xùn)導(dǎo)員根據(jù)自己總結(jié)應(yīng)用的所有獎勵措施進行歸納分類、整合排序,對各種獎勵措施的歸納分類、整合排序原則主要是依據(jù)如下幾類:一是按照警犬對不同類獎勵措施敏感反應(yīng)程度的大小進行,如訓(xùn)導(dǎo)員發(fā)現(xiàn)所帶警犬對各類獎勵及撫拍性的獎勵的敏感程度依次為食物獎勵>撫拍獎勵>言語獎勵,則在實際的訓(xùn)練及使用中訓(xùn)導(dǎo)員就要依據(jù)已得到歸納排序的結(jié)果在訓(xùn)練及使用中展開梯度化獎勵的應(yīng)用;二是按照警犬對同類獎勵措施中不同獎勵量敏感反應(yīng)程度的大小進行,如在言語獎勵中口令聲音的大小,在食物獎勵中食物的形狀大小等;三是按照警犬對同一獎勵措施在不同時間、空間條件下敏感反應(yīng)程度的大小進行,如:在相對清靜的環(huán)境條件下警犬對言語獎勵較之復(fù)雜嘈亂環(huán)境條件下更為有效等。獎勵措施的歸納整合是警犬訓(xùn)練及使用梯度化展開的前提與基礎(chǔ),訓(xùn)導(dǎo)員要對自己掌握應(yīng)用的各類獎勵措施進行全方位的歸納整合,保證后續(xù)梯度化獎勵應(yīng)用的順利展開。
在完成對警犬各種獎勵措施的歸納整合后,根據(jù)警犬的實際訓(xùn)練及使用現(xiàn)狀,依據(jù)既定的訓(xùn)練及使用目標(biāo)即可應(yīng)用梯度化獎勵展開警犬的訓(xùn)練及使用。如在訓(xùn)練基礎(chǔ)科目時,警犬對各類獎勵的敏感程度為食物獎勵>撫拍獎勵>言語獎勵,據(jù)此當(dāng)警犬的訓(xùn)練及使用結(jié)果達到一般預(yù)期時使用言語獎勵即可;當(dāng)警犬的訓(xùn)練及使用結(jié)果超出預(yù)期時應(yīng)給予撫拍獎勵;當(dāng)警犬的訓(xùn)練及使用結(jié)果遠(yuǎn)超出預(yù)期時應(yīng)給予食物獎勵。梯度化獎勵的建立與應(yīng)用就是根據(jù)警犬的訓(xùn)練及使用表現(xiàn)進行梯度差異化的獎勵,通過在反復(fù)多次的訓(xùn)練及使用中應(yīng)用梯度化獎勵,在警犬的大腦意識中建立獎勵獲得的梯度化意識,充分調(diào)動犬的積極性,實現(xiàn)警犬訓(xùn)練與使用的高效能。
梯度化獎勵在警犬訓(xùn)練及使用中的應(yīng)用要遵循持之以恒、循序漸進、系統(tǒng)整合、穩(wěn)步提升的原則。要認(rèn)識到梯度化獎勵在警犬的訓(xùn)練及使用中的建立與應(yīng)用是一個長期堅持的過程,是在相對的時間跨度內(nèi)讓警犬感受到獎勵的內(nèi)容具有梯度性,從而表現(xiàn)出旺盛的獲取欲。要按照警犬在訓(xùn)練及使用中的現(xiàn)實表現(xiàn)以及在建立和應(yīng)用梯度化獎勵后警犬的敏感程度循序漸進地提升梯度化獎勵的應(yīng)用水平,經(jīng)過不斷地系統(tǒng)整合,達到穩(wěn)步提升警犬訓(xùn)練及使用效能的目的,通過梯度化獎勵的建立與應(yīng)用形成一套良性高效的警犬訓(xùn)練及使用的獎勵模式。
梯度化獎勵的建立及應(yīng)用是在訓(xùn)導(dǎo)員對自己所帶警犬的實際訓(xùn)練及使用情況有充分掌握的情況下展開的。訓(xùn)導(dǎo)員只有在充分地掌握了自己所帶警犬對自己已給予的獎勵反應(yīng)敏感程度后才能更好地進行梯度化獎勵的建立與應(yīng)用,在警犬日常訓(xùn)練及使用中要注意觀察收集記錄犬對各類獎勵的敏感表現(xiàn)反應(yīng),要根據(jù)每頭犬的特性制訂不同的梯度化獎勵方式,通過總結(jié)比較犬對不同梯度化獎勵的方式,摸索提煉出一套適合自己所帶警犬的梯度化獎勵模式。
梯度化獎勵的建立及應(yīng)用在警犬訓(xùn)練及使用的不同階段要采取不同的應(yīng)用。如在訓(xùn)練初期著重建立警犬對梯度化獎勵的理解,通過控制警犬得到獎勵食物的形狀大小、散放時間的長短、言語口令聲音的大小以及各種獎勵的穿插應(yīng)用,建立梯度化獎勵模式,培養(yǎng)提高警犬對獲得獎勵的積極性與興奮性。在警犬使用時,梯度化獎勵要注意滯后獎勵的充分,警犬在實際的使用中往往只能在使用結(jié)束后才能進行獎勵,獎勵存在滯后性,此時的梯度化獎勵就顯得尤為重要,具有承上啟下的作用,即對本次使用具有獎勵的意義同時又讓犬對下次使用后的獎勵滿懷期待。
梯度化獎勵的建立及應(yīng)用不可操之過急,要逐步植入各類獎勵方式,通過警犬對梯度化獎勵的理解與契合,綜合應(yīng)用各類獎勵方式,不斷細(xì)化掌握警犬對各類獎勵方式的敏感程度,再根據(jù)實際的訓(xùn)練及使用目標(biāo)調(diào)整優(yōu)化梯度化獎勵的內(nèi)容,達到梯度化獎勵高效促進警犬訓(xùn)練及使用的目的。
要盡可能地豐富警犬訓(xùn)練及使用的獎勵內(nèi)容,獎勵的手段越多,樣式越豐富,梯度化獎勵的應(yīng)用的操作空間就越大,梯度化獎勵的應(yīng)用就越容易實施,這就要求訓(xùn)導(dǎo)員在平時的訓(xùn)練及使用中培養(yǎng)發(fā)現(xiàn)各式各樣的獎勵內(nèi)容,盡可能地豐富獎勵手段,可以與警犬訓(xùn)練及使用中物品的多樣化工作結(jié)合起來進行。
綜上,在警犬訓(xùn)練及使用中,梯度化獎勵的建立與應(yīng)用是快速高效提高警犬訓(xùn)練及使用效能的方式,訓(xùn)導(dǎo)員要深刻認(rèn)識到梯度化獎勵的開展對迅速提高警犬的訓(xùn)練及使用效能具有重要的現(xiàn)實意義。在警犬日常的訓(xùn)練及使用中,訓(xùn)導(dǎo)員要有意識地培養(yǎng)梯度化獎勵的思維,通過不斷植入新的獎勵情境,讓警犬理解獎勵變化的梯度與其行為表現(xiàn)的正相關(guān),最終達到梯度化獎勵的高效應(yīng)用,實現(xiàn)警犬訓(xùn)練及使用的高效能。