Professional Documents
Culture Documents
OPERANTE (I):
TRMINOS, PARADIGMAS Y PROGRAMAS
DOMJAM cap. 5 - 6 - 7
1.4.El moldeamiento
El castigo
La omisin
3. PROGRAMAS DE REFUERZO
1
Antecedentes. El condicionamiento instrumental Thorndike (Ley del
Efecto):
A partir de esta clase de estudios, Thorndike formula en 1911 la Ley del Efecto: Los
animales aprendern a emitir una respuesta con mayor frecuencia que otras si a esa
respuesta le sigue el efecto deseado. Si una respuesta en una situacin estimular dada es
seguida por un suceso satisfactorio o placentero, la relacin entre la situacin y la
respuesta se fortalece, de forma que el organismo tendr ms a dar esa respuesta en esa
situacin. Si por el contrario va seguida de un suceso nocivo o desagradable, la respuesta
tender a no darse.
Es decir, de varias respuestas dadas a una misma situacin, aquellas que van
acompaadas o estrechamente seguidas de algo, sern las que quedarn ms
firmemente conectadas con esa situacin, y las que emitir con ms frecuencia cada vez
que se repita la misma
2
del conductismo con el C.OPERANTE O INSTRUMENTAL que se refiere al
comportamiento voluntario.
3
reforzador. Un mismo acontecimiento puede ser reforzante para una persona y no para
otra, por tanto debemos ignorar ideas preconcebidas sobre lo que podra ser un
reforzador eficaz y seleccionar aquel reforzador que funcione realmente con la persona a
la que se lo vamos a aplicar.
4
oportunidad limitada de obtener la recompensa. Si el
investigador no repite el experimento la rata no tiene
oportunidad de obtener la recompensa, luego no tiene control
alguno sobre la frecuencia de la recompensa: slo se da una
respuesta instrumental en cada ensayo (este es un ejemplo
de Ensayo discreto). Otro ejemplo: Un nio es recompensado
cada noche despus de terminar sus deberes. El nio puede
obtener la recompensa haciendo los deberes, pero tiene una nica oportunidad de
conseguirla cada noche (instrumental). El ambiente limita las posibilidades de
recompensa. Y el animal o persona estudiados tienen una oportunidad limitada de
comportarse.
5
Primera teora: la asociacin estmulo-respuesta (E-R)
6
Desde esta teora, los hbitos surgen cuando
la gente utiliza de manera repetida una
conducta en un contexto particular, para
conseguir una meta.
La visin anterior, est siendo utilizada para explicar comportamientos como el uso de
drogas: Consumir una droga se considera una
conducta instrumental que en principio es
reforzada por los aspectos positivos de la
experiencia. Sin embargo, con el uso repetido,
el consumo se vuelve un hbito en el sentido
de que llega a ser una reaccin automtica a
las seales del contexto que provocan la
conducta de bsqueda de droga sin considerar
sus consecuencias (Tambin se ha usado para
explicar conductas como la infidelidad, la alimentacin y las apuestas compulsivas).
La intuicin sugiere que la conducta instrumental implica asociaciones R-C: nos peinamos
esperando que eso mejore nuestra apariencia, vamos al cine porque esperamos que la
pelcula resulte entretenida; abrimos la nevera anticipando que eso nos permite obtener
algo de comer..
7
En la primera se reforz a las ratas por empujar una
varita vertical a la derecha o a la izquierda
Las respuestas en una direccin eran reforzadas con
bolitas de comida y las respuestas en la direccin
contraria eran reforzadas con un sorbo de una
solucin dulce.
Skiner pensaba que la conducta operante no es producida por ningn estmulo concreto.
Crea que el animal la emite voluntariamente para recibir el refuerzo. Sin embargo, los
estmulos ambientales s que afectan a la conducta operante, sealan la ocasin para la
respuesta, es decir, nos informan sobre cundo estar disponible el refuerzo y por tanto
actan motivando la conducta operante, tienen una funcin sealizadora.
8
Tipos de reforzadores
9
Un apunte sobre el Refuerzo Secundario: el proceso a travs del cual se aprende la asociacin
entre el secundario y el primario es el Condicionamiento clsico. Por ello, los mismos factores que
afectan a la fuerza de la asociacin entre el EC y el EI afectan a la intensidad del refuerzo
secundario. P.Ej. Dinero
Para los nios Las recompensas tangibles como los juguetes, tebeos, libros, pinturas cromos,
puntos, estrellas, etc
Las actividades como ver la tv, or cuentos, acostarse ms tarde
Las diversas formas de atencin: elogio, inters, afecto, aprobacin ayuda, enhorabuena, son
importantsimas y muy eficaces.
Hay que tener en cuenta dos consideraciones a la hora de recompensar la conducta de un nio:
a) Una determinada recompensa puede no satisfacer a todos los nios y puede incluso no
satisfacer al mismo nio todas las veces
b) la mera atencin de los adultos por ser una recompensa muy fuerte, influir siempre en la
conducta y por consiguiente se le debiera dar preferencia respecto a otras recompensas o
en combinacin con ellas.
LAS VARIABLES QUE DETERMINAN LA INTENSIDAD DE UN REFORZADOR SECUNDARIO
(aquel que adquiere las propiedades reforzantes a travs de su asociacin con los
reforzadores primarios).
El proceso a travs del cual se aprende la asociacin entre el secundario y el primario es el
Condicionamiento clsico. Por ello, los mismos factores que afectan a la fuerza de la asociacin
entre el EC y el EI afectan a la intensidad del refuerzo secundario.
Magnitud del refuerzo primario: cuanto ms intenso es el refuerzo primario con el que se
asocia el secundario mas reforzante ser el secundario.
Nmero de emparejamientos, de veces que se emparejan. Cuantas ms veces se
emparejen ms poder reforzante tendr el secundario.
El intervalo entre estmulos (demora temporal). Cuanto ms tiempo transcurra entre la
presentacin del secundario y el primario ms dbil es el poder reforzante del secundario.
Cuanto menos tiempo, ms fuerte o intenso es el reforzador secundario.
Tipos de refuerzos
Reforzadores inmediatos:
REFORZADORES estmulo reforzador presentado a
continuacin de la conducta.
Intrnseco. Un reforzador se Reforzadores retardados:
considera intrnseco cuando la estmulo reforzador presentado
conducta a fortalecer es reforzante tras un perodo de tiempo
por s misma despus de una conducta.
10
El Moldeamiento
Procedimiento de reforzamiento por aproximaciones sucesivas para incrementar la
tasa de respuesta de una conducta
11
RATA SE ACERCA AL DISPENSADOR DE
COMIDA
OBJETIVO:
12
REFORZAMIENTO POSITIVO
Contingencia positiva entre la R instrumental y un E apetitivo: si el sujeto ejecuta la R,
recibe el E reforzador. la R da lugar al E agradable o apetitivo
REFORZAMIENTO NEGATIVO
Contingencia negativa entre la R instrumental y un E aversivo: si el sujeto ejecuta la
R, se interrumpe o impide la presentacin de un E Estmulo aversivo (la R elimina el E
aversivo)
13
CASTIGO (CASTIGO POSITIVO)
Contingencia positiva entre la R y un E aversivo: si el sujeto realiza la R, recibe el E
aversivo la R da lugar a una consecuencia desagradable)
Es la presentacin de un evento aversivo lo que disminuye la frecuencia de esa R
14
3. PROGRAMAS DE
REFORZAMIENTO
Ya hemos dicho antes que no podemos saber a priori qu refuerzos son los ms efectivos
para todos los organismos, ya que cada persona por ejemplo puede tener unas
preferencias determinadas, unos gustos o cosas deseadas diferentes a los dems. Por
ello, para que un programa basado en los principios del CO sea realmente efectivo
debemos saber qu refuerzos o castigos van a ser efectivos para el grupo de personas o
la persona a la que vayamos a aplicar el programa. Y siempre deberemos administrar
esos refuerzos positivos y negativos de forma CONTINGENTE a la R que queremos
aumentar o disminuir, es decir, los refuerzos deben ser administrados inmediatamente
despus de que la R ocurra.
Esto es sumamente importante a la hora de elaborar cualquier programa, por ejemplo
para eliminar conductas violentas o agresivas, para conseguir comportamientos
adecuados, fomentar la atencin escolar
Tan importante como la aplicacin de un determinado tipo de refuerzo y de una
determinada cantidad de refuerzo es el modo concreto de aplicacin.
Skinner especific que el reforzamiento puede programarse siguiendo dos criterios
bsicos: (1) en base al nmero de Rs emitidas (al que llam programa de reforzamiento
de razn) y (2) en base al tiempo (al que llam programa de reforzamiento de intervalo).
Lo cierto es que en la vida real, no siempre que damos una respuesta aparecer el
reforzador.
El programa de reforzamiento determina cundo la ocurrencia de la respuesta va a ir
seguida de un reforzador.
Los programas de reforzamiento se refieren, pues, a la forma de administrar el refuerzo
o pautas a seguir en su aplicacin. Segn Skinner, estos programas son las
Contingencias que especifican con qu frecuencia y cundo debemos actuar para recibir
el reforzamiento.
15
3.1. SEGN CRITERIOS DE FRECUENCIA DE RESPUESTA
16
El refuerzo siempre depende de que el sujeto realice la conducta un nmero fijo de
veces. La tasa de R aumenta con los programas de RF ms altos. Ejemplos, recibimos
un cheque por cada cinco encuestas realizadas, recibimos un regalo por cada cinco
cupones, trabajo por nmero de piezas montadas, etc.
RF-10 RF-20
Respuestas Paus as
emitidas
acumuladas
Tiempo -->
Registro acumulativo tpico de una rata sometida a entrenamiento de recompensa mediante un
programa RF-10 (izda.) y un programa RF-20 (dcha). Los trazos gruesos y cortos indican los puntos en
que se administr recompensa
17
postreforzamiento hace que la tasa de respuesta sea ms elevada en los
programas de RV que en los de RF
Las conductas que se aprenden con este programa son ms resistentes a la
extincin (Esto puede explicar la persistencia caracterstica de la conducta de juego. Por
ejemplo las mquinas tragaperras que estn programadas para dar premio tras un
nmero variable de jugadas)
R V -10 R V -20
Respuestas
emitidas
acumuladas
T iem po -->
Registro acumulativo tpico de una rata sometida a entrenamiento de recompensa mediante un
programa RV-10 (izda.) y un programa RV-20 (dcha). Los trazos gruesos y cortos indican los puntos en
que se administr recompensa
18
Suele ocurrir lo siguiente: Se deja de responder despus de recibir el reforzamiento
-La respuesta desciende inmediatamente despus del refuerzo, ya que se ha
aprendido que el refuerzo no volver a estar disponible hasta el final del intervalo
-Luego aumenta lentamente la respuesta conforme se aproxima el momento en el que
est disponible nuevamente el reforzamiento.
Por tanto, se deja de responder despus de recibir el reforzamiento, ya que las Rs
que se realizan despus de la entrega del reforzamiento no son reforzadas. De este
modo los animales aprenden a esperar a dar la respuesta hasta el momento en que
se aproxima el final del intervalo fijo, cuando se acerca el momento de estar
disponible de nuevo el reforzador.
Skiner llam a este patrn de respuestas caracterstico Efecto de festoneado (pausa
ms larga cuanto mayor es el intervalo)
IF -3 0 s g .
Respuestas
emitidas Pocas Rs en el
acumuladas principio del
intervalo
Muchas Rs al
final del
intervalo
Tiempo
19
No existen muchas situaciones de la vida real en que las conductas se refuercen en base
a este tipo de programas. Ejemplo exmenes: no se estudia nada al comienzo del
cuatrimestre y la tasa de estudio aumenta rpidamente conforme se acerca el da del
examen. Se producira una tasa ms alta de estudio si los exmenes se realizaran con
frecuencia y por sorpresa.
Programas de Intervalo Variable (IV)
El tiempo que ha de transcurrir para poder administrar el refuerzo vara alrededor de
una media. Intervalos entre refuerzos variables
P.ej: IV-5 (el intervalo medio para administrar el refuerzo son 5 minutos, pero unas
veces podr transcurrir 8 minutos para ser reforzado desde la ltima vez que emiti la
conducta, y otras slo 2 minutos)
No se produce el efecto de festoneado , la respuesta es constante y lenta. Por ejemplo
la pesca: a veces pican enseguida y otras hay que esperar un buen rato.
IV-30sg.
R espuestas
emitidas
acumuladas
T iem po
Programas compuestos
Se combinan dos o ms programas simples
Por ejemplo una rata tiene que presionar una palanca 10 veces (RF10) y esperar un
minuto (IF1) despus de la ltima R para que la presin de la palanca de lugar al
refuerzo.
REPASO :
20
21
22
Adems de las respuestas independientes, tambin podemos reforzar la tasa de
respuesta (la velocidad a la que se dan las respuestas). A esto se le llama Reforzamiento
de los TER (tiempo entre respuestas)
Ejemplo: quiero que un animal d, como mnimo, 12 respuestas por minuto. Entonces, le
doy reforzador slo si produce una respuesta en los 5 segundos siguientes a la anterior
respuesta. Si responde cada 5 segundos o menos, tiene una tasa de 12 respuestas por
minuto, lo que yo quera. Si tarda ms de 5 segundos en responder, no es reforzado
aunque responda. Eso har que se vuelva ms rpido en el futuro
Por otra parte, los experimentos en los que solo se mide una respuesta, ignoran la
riqueza y complejidad de la conducta.
Constantemente la gente debe elegir entre dos o ms programas simples de
reforzamiento que estn disponibles al mismo tiempo. Por ejemplo, en la vida cotidiana,
una persona podra tener que elegir entre salir o quedarse en casa. Si decide salir,
23
puede optar por comer, ir al cine, ir a un parque, visitar a un amigo, etc. Si se queda en
casa, puede optar por baarse, ver TV, cocinar, dormir, etc.
Y finalmente, relacionado tambin con las elecciones que hacemos e puede hablar del
AUTOCONTROL
En la vida, las elecciones importantes
implican un beneficio pequeo a corto
plazo contra un beneficio mayor pero
ms demorado.
Se dice que la gente carece de
autocontrol si elige recompensas
pequeas a corto plazo en lugar de
esperar por un beneficio mayor
24
TEMA 3.2. CONDICIONAM. OPERANTE (II):
CONDICIONAMIENTO DE RECOMPENSA
CAP. 5, 7 y 9
1. FACTORES QUE INFLUYEN EN LA ADQUISICION DE LA CONDUCTA
Si dejamos de presentar un reforzador tras una respuesta, sta puede extinguirse. Los
factores que contribuyen a que una respuesta sea resistente a la extincin son los siguientes:
25
1. FACTORES QUE INFLUYEN EN LA ADQUISICION DE LA
CONDUCTA
Cunto tiempo tarda en aprenderse una respuesta instrumental?
Fundamentalmente hay dos factores que juegan un papel muy importante en la magnitud
del condicionamiento, en la fuerza de la respuesta resultante o en la frecuencia o tasa de
la respuesta:
26
intervalo de demora (los puntos) aumenta la fuerza de la conexin entre la
conducta y el refuerzo primario, por la asociacin del refuerzo secundario con el
primario (CC)
(de un valor alto pasa a un valor bajo) (de un valor bajo pasa a uno alto)
Por ejemplo quiero instaurar la actividad de lectura que es de baja frecuencia y s que
la actividad de pintar es de alta frecuencia. Pues bien, puedo incrementar la
actividad de lectura si hago que esta actividad sea necesaria para poder pintar
28
3. LA EXTINCION DE LA CONDUCTA Y
LOS FACTORES QUE CONTRIBUYEN A LA
RESISTENCIA A LA EXTINCION
Si dejamos de presentar un reforzador tras una respuesta
previamente reforzada, sta puede extinguirse
Dejamos de dar refuerzo
29
El fallo continuado de la Respuesta para producir el reforzamiento hace que la fuerza
de esa respuesta disminuya hasta que finalmente deje de ejecutarse. (ej rata/palanca-
nio/rabietas)
Al principio cuando se interrumpe el refuerzo la tasa de respuesta es alta pero el fracaso
posterior de la respuesta para producir el reforzamiento, hace que la tasa de respuesta
disminuya hasta que la conducta deja de ejecutarse.
Recordad que en la extincin hay una declinacin en la frecuencia, intensidad o tasa de
respuesta como consecuencia de que se retira el refuerzo, pero no supone el olvido de
la respuesta
C. CLASICO C. INSTRUMENTAL
30
Tres factores influyen en la rapidez de la extincin de la R:
31
3.2.La demora de la recompensa durante la adquisicin
Depende de las veces que se haya demorado la recompensa durante la adquisicin:
32
Si se ha demorado algunas veces (variable) durante la
adquisicin (es decir, si el tiempo entre la emisin de la
respuesta hasta la obtencin del refuerzo ha sido variable a lo
largo de distintos ensayos), la resistencia a la extincin es
MAYOR (se extingue ms lentamente)
Si siempre se ha demorado el mismo tiempo durante la adquisicin
(ha sido una demora constante), NO hay efecto en la resistencia a la
extincin
33
El reforzamiento parcial parece ensear a los sujetos a no rendirse ante la ausencia de
reforzador.
Otras explicaciones:
. Teora de la Frustracin (Amsel). El reforzamiento intermitente incluye ensayos
reforzados y no reforzados. Los ensayos reforzados animan al sujeto a responder,
mientras que los No recompensados, desalientan la respuesta. Por lo que existen
tendencias de respuesta opuesta. Sin embargo, a medida que el entrenamiento
contina, el conflicto se resuelve a favor de responder.
. Teora Secuencial (Capaldi). Es similar a la anterior, pero no basada en la reaccin
emocional, sino en la memoria. Los sujetos pueden recordar si fueron reforzados o no
por realizar la conducta instrumental en el pasado reciente. Se asocia la memoria de No
haber sido recompensado con la expectativa de recibir la recompensa, por eso responde
en un programa de reforzamiento intermitente.
Tanto de la presentacin de
una recompensa
Reestructuracin de contingencias o MANEJO de
CONTINGENCIAS (recompensas para INSTAURAR
patrones de conducta
Nuestro modo demsactuar
eficaces y ausencia de
reforzamiento para ELIMINAR pautas de conducta
depende:
inapropiadas).
34
Estos sistemas utilizan contingencias de reforzamiento y no reforzamiento para
incrementar las conductas apropiadas y eliminar o reducir las inadecuadas
Fases:
Evaluacin de las conductas
Contrato de contingencias
Ejecucin y evaluacin de los cambios
Identificar los potenciales reforzadores para las conductas apropiadas. Hay que
instruir a los padres, profesdores, para elaborar el registro en el que debera
aparecer el da, el nmero de la conducta-problema, la duracin de las misma, las
reacciones ante las misma de los padres o dems personas, etc. Ya que nos pueden
decir qu refuerzos estn actuando manteniendo la conducta problema.
35
3. Fase de aplicacin de la tcnica
Se aplica el tratamiento: presentacin del reforzamiento/castigo contingente a la R
apropiada/inapropiada o sobre la ausencia de la conducta apropiada/inapropiada (o
ambas cosas). Presentacin de castigos contingentes a las conductas inadecuadas.
Contratos conductuales
2. Fase de establecimiento del programa: aplicacin contingente de las fichas por las
conductas deseadas. Esto requiere:
- definir claramente cules son las conductas deseadas
- la entrega de fichas cada vez que se dan estas conductas
36
- especificar los objetos o actividades por los que se pueden canjear las fichas,
cuntas fichas necesitan para lograrlos y qu conductas han de realizar
Subfases:
Descripcin de la conducta en trminos claros y comprensibles
Cantidad de fichas que se obtendrn por realizar la conducta
Bsqueda de reforzadores adecuados y definicin
Establecimiento del sistema de fichas (momentos, frecuencia de entrega,
quin se encarga y dnde se lleva a cabo)
Establecimiento de un sistema de cambio de las fichas por los reforzadores
Establecimiento de un sistema de registro (conocer la tasa de emisin de las
conductas deseadas, la cantidad de fichas ganadas)
3. Fase de desvanecimiento o finalizacin del control de las conductas por fichas:
una vez consolidada la conducta, se retiran las fichas por reforzadores sociales del
ambiente (aprobacin, acercamiento)
Pero poco a poco hay que ir elevando el nivel de exigencia para conseguir las fichas
(que la conducta se realice ms veces o en un periodo de tiempo mayor), y ms fichas
para lograr el mismo refuerzo
Contratos Conductuales
OBJETIVO: Controlar las consecuencias de las conductas a fin de que no se
produzcan refuerzos inadecuados para conductas incorrectas o falta de refuerzo para
las deseadas
Es un documento escrito y firmado que especifica las acciones que el sujeto est de
acuerdo en realizar y establece las consecuencias del cumplimiento y del no
cumplimiento de tal acuerdo
Debe especificarse:
37
La conducta o conductas que se espera que emita cada una de las
personas implicadas
As, las expectativas estn claras y las partes implicadas conocen los costes y
beneficios de hacer algo
Consta de:
38
PASOS A TENER EN CUENTA PARA PROMOVER EL CAMBIO EN LA
CONDUCTA
ALGUNAS RECOMENDACIONES
39
LOS CASTIGOS QUE NUNCA DEBEMOS UTILIZAR:
ALGUNAS ORIENTACIONES
40
TEMA 3.2. CONDICIONAM. OPERANTE (III):
CONDICIONAMIENTO AVERSIVO: ESCAPE Y
EVITACION
CAP. 10
41
CONDICIONAMIENTO AVERSIVO
CONDICIONAMIENTO DE EVITACION
Procesos
responsables:
ESCAPE EVITACIN
42
Refuerzo negativo: AUSENCIA de
un Estmulo aversivo que
INCREMENTA la frecuencia de
una conducta
TIPOS
ESCAPE (O HUDA): el E
aversivo est presente, pero se
puede interrumpir con la En ambos casos lo
presentacin de la R reforzante es que con mi
conducta (sea de escape o
de evitacin) desaparece el
EVITACION: el E aversivo se estmulo aversivo
programa para ser presentado en
algn momento en el
futuro. La R impide la
presentacin del E aversivo
43
1.1. FACTORES QUE INFLUYEN EN EL APRENDIZAJE Y EFICACIA DE
LA CONDUCTA DE ESCAPE
44
1.2. Extincin de la respuesta de escape
Debe haber alguna seal del ambiente o estmulo que seale o informe de la
INMINENTE aparicin del estmulo aversivo si no hacemos algo para evitarlo
45
Ante la aparicin de esa seal o Est DISCRIMINATIVO el sujeto realiza la conducta
de evitacin. Y si con esa conducta logra EVITAR el E aversivo (previene su aparicin), la
conducta se ver REFORZADA
(El sujeto no reacciona ante la posible presencia de la estimulacin aversiva en s, sino ante unas
seales del entorno (estmulos discriminativos) que sealizan la posterior presencia de la
estimulacin aversiva. Esas seales en s mismas son aversivas (por un aprendizaje previo de CC)-
Por tanto, la evitacin es una conducta motivada por el miedo
Entonces veo la
cara de mi padre
Cuando llegue
que parece saber
a casa voy a
mis intenciones
portarme mal
porque estoy
enfadado
Voy a
Ese gesto me resulta portarme
muy familiar y me bien, porque
recuerda otras si no.
ocasiones en las que
Eso me me anunci (avis)
provoca un claro castigo
temor y
recapacito.
Bien!!! Me he
anticipado y ya
no habr castigo
EC EI RI
EC DISCRIMINATIVO
(aviso) RC
R evitacin
RC
reforzador
46
El establecimiento de la conducta de evitacin necesita dos fases:
47
descarga pasando al compartimento B. En ensayos posteriores se coloca al animal
en el compartimento B y se le presenta el E discriminativo (luz) que avisa de la
administracin de la descarga. El animal evita la descarga pasando al
compartimento A. En este caso, el animal debe ignorar las claves situacionales (el
tipo de compartimento en el que se encuentra) y atender exclusivamente a la clave o
E discriminativo (Luz). En esta situacin, cuanto ms intensa es la descarga, ms
lenta es la respuesta de evitacin.
Por qu? Porque el animal experimenta un conflicto entre alejarse del lugar que le
provoca miedo y dirigirse al lugar donde la ltima vez le administraron una descarga.
Cuanto mayor es la intensidad del E aversivo, menos querr ir de nuevo a ese lugar.
Si lo evitamos
no podremos
EC asociar que el
RC R de evitacin EC no va
ante el EC que seguido de nada
provoca el miedo peligroso
48
. Se aprende a evitar los estmulos que producen miedo. En base a esto podramos
suponer que la simple presentacin del estmulo que produce miedo sin que ocurra
nada aversivo despus (El EC sin el EI) terminara por extinguir la respuesta
condicionada de miedo. Pero cuando uno tiene miedo resulta difcil que se exponga
al EC el tiempo suficiente para que se produzca la extincin.
Para superar este problema se han empleado distintos procedimientos que aceleran la
extincin de la conducta de evitacin. Uno ya lo vimos, la desensibilizacin sistemtica
(condicionamiento de una respuesta de relajacin incompatible con la respuesta de
miedo), otro es la TCNICA DE INUNDACIN .
49
2. Reforzamiento instrumental de la R de evitacin a travs de la reduccin del miedo
(La R se refuerza con un hecho tangible -la reduccin del miedo- y NO por la mera
ausencia de algo -la estimulacin aversiva-)
Dos procesos:
1) Proceso de condicionamiento 2) Reforzamiento instrumental
clsico de miedo a un EC de la R de evitacin a travs de
(emparejado previamente con un EI la reduccin del miedo
aversivo)
RI
La RC de miedo se ha producido por un
a) Son interdependientes
EC CC donde un EN se ha asociado a un EI
(interaccin constante
DISCRIMINATIVO aversivo que produca una R de miedo
entre los procesos de (as el EC tambin producir miedo)
condicionamiento clsico e
instrumental)
El escapar del E que provoca miedo
b) Explicacin de la (condicionado) es lo que proporciona el
conducta de evitacin reforzamiento a la conducta de evitacin
en trminos de escape RC
del miedo condicionado
La R se refuerza, se aprende, porque
interrumpe o reduce el EC que provoca miedo.
Como el miedo es un estado emocional intenso,
cualquier reduccin del mismo, ser reforzante
Ha sido una teora muy estudiada y con gran soporte y evidencia experimental. Incluso ha
sido mejorada con los aos. Por ejemplo, hoy da se considera que el comportamiento de
evitacin es reforzado no slo por la reduccin del miedo al cesar ED, sino tambin por la
50
aparicin, tras la respuesta, de seales de seguridad, que son estmulos presentes
tras la respuesta de evitacin, por ejemplo en animales en la caja de saltos, el feedback
cinestsico o propioceptivo tras el salto, la llegada al otro lado, etc. Son reforzadores
secundarios pues aparecen siempre conjuntamente con el refuerzo negativo (cese de la
seal condicionada aversiva).
Esta teora ha sido aplicada en el contexto clnico a la explicacin de ciertas fobias. As,
no hay ms que entender la respuesta instrumental de evitacin como la conducta que se
mantiene porque con ella cesa el miedo o la ansiedad que se ha condicionado
fuertemente al ED.
51
TEMA 3.2. CONDICIONAM. OPERANTE (IV):
CONDICIONAMIENTO AVERSIVO: CASTIGO
CAP. 10
1. EL CASTIGO Y SUS TIPOS
Presentacin de un E aversivo contingentemente a la ejecucin de una conducta
inapropiada
Tipos de castigo
Castigo positivo. Presentacin de un E aversivo tras la conducta inapropiada
Castigo negativo u omisin. Retirada de un E placentero tras la conducta
inapropiada
Categoras del castigo negativo:
-Coste de respuesta (la respuesta inapropiada hace que se retire el reforzamiento)
-Tiempo fuera (periodo durante el cual no est disponible el reforzamiento)
2.FACTORES QUE AFECTAN LA EFICACIA DEL CASTIGO
a. Intensidad del castigo. Cuanto ms intenso es el castigo, mayor es la
supresin de la conducta inapropiada
b. Consistencia en la administracin del castigo. Cuanto mayor es la
consistencia, mayor es la supresin de la conducta inapropiada
c. Demora del castigo. Cuanto mayor es la demora, menor es la supresin
de la conducta inapropiada
d. Otros factores: la eficacia de reforzar una respuesta alternativa y el
ajuste persona-castigo
e. La utilizacin del castigo como medio eficaz para reducir conductas
inadecuadas
El coste de Respuesta
El tiempo fuera
3.CONSECUENCIAS NEGATIVAS DEL CASTIGO
Agresin inducida por el dolor
Modelado de la agresin
Propiedades aversivas del que administra el castigo
Otros efectos: indefensin aprendida, sustitucin de la respuesta y
supresin generalizada
52
EL CASTIGO Y SUS TIPOS
Castigo: presentacin de un E aversivo contingentemente a la ejecucin de una
conducta inapropiada
Objetivo: suprimir una conducta no deseada, inadecuada (para el sujeto y su
entorno) => si el castigo es eficaz disminuir tanto la frecuencia como la intensidad de la
conducta castigada.
Tipos de castigo:
-Castigo Positivo: presentacin de un evento desagradable (fsico o psicolgico)
ante la realizacin de una conducta inapropiada
-Castigo Negativo: el reforzamiento se pierde o no est disponible como
consecuencia de la realizacin de una conducta inapropiada
COSTE DE RESPUESTA
Tcnica eficaz para suprimir la conducta inadecuada
Principal Ventaja: produce una supresin de la R rpida y eficaz, y a menudo
permanente (MUY TIL EN SISTEMA ECONOMIA DE FICHAS Y CONTRATOS
CONDUCTUALES)
Cmo seleccionar el coste apropiado?
1. Que el coste implique una importante retirada de reforzamiento desde
el primer momento (nunca hacerlo de modo gradual)
53
2. Comunicar las reglas: qu conductas supondrn ciertas prdidas y qu
logros conducirn a ganancias
3. Combinar con el reforzamiento positivo de conductas alternativas
deseables
4. Comprobar que los E que se van a retirar son eficaces como
reforzadores
5. Que el sujeto no pierda todos los reforzadores de golpe
(disminuye la MOTIVACION y no tendra nada que perder por
hacer de nuevo una conducta inadecuada)
Ejemplos: retirada o imposibilidad de conseguir reforzadores materiales (dinero) o
reforzadores sociales (aprobacin); perder privilegios, etc.
TIEMPO FUERA
Tcnica eficaz para suprimir la conducta inadecuada
Importante: asegurarse que la zona de TF no sea reforzante. O bien el sujeto sale del
ambiente reforzante o bien se le quita el propio refuerzo temporalmente. Pero durante
el TF no puede obtener ningn refuerzo
Uso efectivo:
1.Eliminar los reforzadores que mantienen la conducta
2. Evitar el TF como modo de escapar de una situacin aversiva (como no
quiere estar en clase se porta mal para que lo expulsen)
3.Uso inicial del TF con toda la consistencia posible
4.Mantener la duracin del TF relativamente breve
5.Comunicacin clara de las condiciones del TF
6.Proporcionar conductas alternativas deseables
Principal desventaja: se impide la oportunidad de aprender y practicar conductas
adecuadas
Diferencia con la EXTINCION:
-En la EXTINCION los E reforzantes no se suministran ms
-En el TF, los E reforzantes no se suministran durante un tiempo (se demoran)
54
Intensidad del castigo
Consistencia en la administracin del castigo
Demora del castigo
La eficacia de reforzar una R alternativa
El ajuste persona-castigo
Cuanto mayor duracin tenga el castigo (sin ser excesivamente largo y duro), ms
efectivo ser para suprimir la conducta inadecuada
55
2.3. DEMORA DEL CASTIGO
Cuanto mayor es la demora entre la conducta y el castigo, menor es la supresin
de la conducta inapropiada:
-El castigo inmediato es ms eficaz que el demorado
-NO usar el demorado.El tiempo a menudo funciona en contra de la
efectividad del castigo
El ajuste persona-castigo
El castigo de una conducta debe elegirse en funcin de la persona a la que se le va
a aplicar
Debemos asegurarnos que es un castigo y no un refuerzo (en este caso
aumentara la conducta en lugar de disminuir)
56
Castigo administrado inmediatamente despus de la R no deseada
Programa de castigo continuo (nunca intermitente)
Intensidad del castigo proporcional y suficiente para evitar la R no deseada
Evitar todo reforzador positivo de la R no deseada
Reforzar positivamente respuestas alternativas a la no-deseada
Combinar el castigo con la extincin (al mismo tiempo que presentamos el E aversivo,
RETIRAMOS los reforzadores que mantienen la conducta inadecuada)
Que el sujeto conozca el propsito del castigo, explicndole con claridad las
condiciones bajo las cuales se suministrar el castigo.
Convertir ciertos estmulos (advertencias, tonos) en E Discriminativos que anuncien
el castigo si no se modifica el comportamiento
57
-si el sujeto no sabe por qu se le est castigando (no asocia la conducta
con el castigo, por lo que se vive dicho acontecimiento como independiente
de su conducta)
El nivel de ira producido por el dolor depende del individuo
Adems de la ira, el castigo puede producir otros estados emocionales perturbadores:
frustracin que pueden producir reacciones de agresividad
miedo y desesperacin
Modelado de la agresin
El sujeto, a travs del modelado, puede aprender que el
castigo es una manera aceptable y viable de resolver los
problemas y conflictos
El abuso del castigo por parte de los padres
incrementa la probabilidad de que sus hijos
muestren conductas agresivas
Otros efectos
Indefensin aprendida:
Si un sujeto se siente absolutamente incapaz de controlar los acontecimientos
aversivos que le rodean (ni puede escapar ni evitarlos), se sentir absolutamente
indefenso
58
Sustitucin de la respuesta:
Cuando la conducta castigada es sustituida por otra conducta igualmente no
deseada (p.e. de pegar a un hermano despreciarlo)
59
De ah la necesidad de ofrecer alternativas de conductas deseables que
sustituyan a las inadecuadas
Supresin generalizada:
La supresin de una conducta se GENERALIZA a la supresin de otras
conductas PARECIDAS a la castigada pero que son conductas DESEABLES
(por ej.: reir por contestar a un mayor---no contesta cuando se le pregunta/
reir por jugar bruscamente---no jugar)
Lo podemos evitar: castigando la conducta en las situaciones requeridas y
reforzndola en las situaciones donde la conducta es adecuada
Otros:
El sujeto castigado aprende a OCULTAR la conducta y no DEJAR DE EMITIRLA.
El sujeto puede asociar el castigo con FACTORES PERSONALES.
El castigado progresivamente AUMENTA LA TOLERANCIA AL CASTIGO y eso
aumenta la intensidad de ste
El castigado se convierte en CASTIGADOR (nio maltratador-padre maltratador)
60
4. LA NATURALEZA DEL CASTIGO
Para que sea efectivo, el castigo debe provocar una R incompatible con la R
castigada.
61
Teora motivacional del castigo de Estes:
62