Control Aversivo

- 235 -
Asignatura: Aprendizaje (6 crditos). Obl. de 2 curso Grado Psicologa, Curso 2010/2011

Profesores: Dr. Agustn Romero Medina (agustinr@um.es) y Ldo. Pedro Jara Vera (pjara@um.es). Dept Ps. Bsica y Metodologa. Univ. de Murcia. Fac.
Psicologa; En Aula Virtual Fac. Psicologa en http://avpsi.inf.um.es/moodle/ (usuario: dni sin letra; contrasea: dni sin letra); y en SUMA campus virtual

Tema 5

Condicionamiento instrumental:
Control de estmulos y
condicionamiento con estimulacin aversiva

Bloque 2: Aprendizaje asociativo mediante condicionamiento
Tema 3: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO CLSICO
Tema 4: APRENDIZAJE ASOCIATIVO MEDIANTE CONDICIONAMIENTO INSTRUMENTAL DE RECOMPENSA
Tema 5: CONDICIONAMIENTO INSTRUMENTAL: CONTROL DE ESTMULO Y CONDICIONAMIENTO CON ESTIMULACIN AVERSIVA

Indice del Captulo

1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE CLAVES CONTEXTUALES ANTECEDENTES237
1.1. Introduccin ...................................................................................................................................................................... 237
1.1.1. El aprendizaje de seal en el condicionamiento instrumental .................................................................................. 237
1.1.2. El aprendizaje de seal como control de estmulos .................................................................................................. 238
1.1.3. Variaciones en las condiciones antecedentes y resultados de generalizacin y discriminacin .............................. 238
1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado ............................................................................. 238
1.2. Tcnicas experimentales .................................................................................................................................................. 240
1.2.1. Tcnicas simples: el refuerzo diferencial .................................................................................................................. 240
1.2.2. El gradiente de generalizacin / discriminacin ........................................................................................................ 240
2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS GENERALIZADOS ................................................ 241
2.1. Procedimientos de estudio de la generalizacin .............................................................................................................. 241
2.2. Tipos de generalizacin .................................................................................................................................................... 242
2.2.1. Generalizacin de estmulo ....................................................................................................................................... 242
2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas .............................................................. 242
2.3. Por qu la generalizacin (teoras explicativas) ............................................................................................................... 243
3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS .................................................................. 244
3.1. Tcnicas simples: Refuerzo diferencial discriminativo ..................................................................................................... 244
3.2. Tcnicas complejas de adquisicin de discriminacin ..................................................................................................... 245
3.2.1. Atenuacin o desvanecimiento del estmulo ............................................................................................................. 245
3.2.2. Comparacin con la muestra .................................................................................................................................... 246
3.2.3. Combinacin de E
D
y refuerzo secundario: el encadenamiento .............................................................................. 246
3.3. Por qu ocurre la discriminacin (teoras explicativas) .................................................................................................... 247
4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS ....................................................................... 248
4.1. Condiciones durante la adquisicin .................................................................................................................................. 248
4.2. Condiciones de entrenamiento previo en discriminacin ................................................................................................. 249
5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CONTROL DE ESTIMULO .................................. 251
5.1. Aplicacin de instigadores y desvanecimiento ................................................................................................................. 251
5.1.1. Dificultades con el refuerzo diferencial ..................................................................................................................... 251
5.1.2. Los instigadores como facilitadores de la discriminacin ......................................................................................... 252
5.1.3. Desvanecimiento de los instigadores ....................................................................................................................... 253
5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje .................................................................. 253
5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente ...................................................................... 254
6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO ........................................................................................................... 254
6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin aversiva ........................................................... 254
6.1.1. Tipos de aversividad ................................................................................................................................................. 254
6.1.2. Tipos de condicionamiento con estimulacin aversiva ............................................................................................. 255
6.2. Condicionamiento de escape ........................................................................................................................................... 256
6.2.1. Definicin .................................................................................................................................................................. 256
6.2.2. Condiciones o factores en la adquisicin de la conducta de escape ........................................................................ 257
6.3. Aprendizaje de evitacin ................................................................................................................................................... 258
6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos ...................................................................................... 258
6.3.2. Condiciones para la adquisicin de la respuesta de evitacin ................................................................................. 261
6.3.3. Por qu ocurre la evitacin (teoras explicativas) ..................................................................................................... 262
6.3.4. Extincin de la respuesta de evitacin ...................................................................................................................... 264
6.4. Castigo ............................................................................................................................................................................. 267
6.4.1. Definicin, caractersticas y lneas de investigacin ................................................................................................. 267
6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin ......................................................................................... 268
6.4.3. Condiciones para la efectividad del castigo .............................................................................................................. 269
6.5. La prdida del control de la accin: Indefensin aprendida ............................................................................................. 273
6.5.1. Concepto y tcnicas experimentales ........................................................................................................................ 273
6.5.2. Efectos o resultados de la indefensin aprendida .................................................................................................... 274
6.5.3. Condiciones para la adquisicin de la indefensin aprendida .................................................................................. 275
236 Universidad de Murcia. Grado Psicologa. Asignatura: Aprendizaje, 6 cr. 2 curso, 1. cuatr., curso 2010/11
6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas) ................................................................................ 276
6.5.5. Repercusiones aplicadas de la indefensin aprendida ............................................................................................ 278
7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5 ............................................................................................................. 279

Resumen del tema

En cuanto al control de estmulo en el condicionamiento instrumental, en mayor o menor medida, hay variedades de aprendizaje me-
diante condicionamiento que combinan aspectos del condicionamiento clsico y del instrumental. As, en este captulo se analizan las po-
sibilidades de los EC que se asocian no a EIs sino a respuestas reforzadas, o sea, los estmulos antecedentes de la respuesta instrumen-
tal.
En lo referente al condicionamiento instrumental aversivo, trataremos en este captulo aquellas tareas y procedimientos de aprendiza-
je en donde se utilice estimulacin aversiva, sobre todo condicionamiento instrumental. En captulos anteriores estudiamos procesos y ta-
reas de aprendizaje en los cuales los eventos significativos eran positivos (gratificantes o reforzantes). Sin embargo, una gran parte de la
conducta que se aprende va dirigida no ya a obtener consecuencias positivas sino a eliminar, reducir o evitar situaciones desagradables.
Analizaremos el condicionamiento instrumental con refuerzo negativo (escape y evitacin), tanto en sus aspectos de adquisicin como de
extincin. Tambin estudiaremos procedimientos aversivos inhibitorios o que reducen la tasa de respuesta (castigo) y por ltimo, el efecto
de la estimulacin aversiva no contingente en lo que se denomina indefensin aprendida.

Lecturas complementarias

Referente al control de estmulo, vanse los manuales de Hilgard y Bower (1966; trad. 1976, pp. 562-585), Hulse et al. (1980; trad.
1982, cap. 7), Kimble (1961; trad. 1969; 377-452), Marx (1969; trad. 1976; pp. 297-424), Rachlin (1976; trad. 1979, pp. 456-483), Tarpy
(1981; trad. 1986, cap. 9), Wittig (1982, pp 119-136), y el captulo de Arias Holgado, Benjumea y Fernndez Serra (1997). Sobre control
de estmulos desde un punto aplicado es til Sulzer-Azaroff y Mayer (1977; trad. 1983) y tambin el captulo de Navarro Guzmn (1994).
Para cuestiones de escape, evitacin y castigo hay buenos captulos en Hulse et al. (1980; trad. 1982, pp. 167-207), Mackintosh
(1983; trad. 1988, caps. 5 y 6), Pelechano (1980), Rachlin (1976; trad. 1979, caps. 5 y 9), Tarpy (1975; trad. 1977), pp. 125-186), Fernn-
dez Castro (1989), de Vicente (1997) y Maldonado (1998, pp. 257-298) sobre indefensin es imprescindible la lectura del libro de Se-
ligman (1975; trad. 1980) y las revisiones de Vazquez-Valverde y Polaino (1982), de Ferrndiz (1989), de Vicente (1997) y Maldonado
(1998, pp. 257-298) . Tambin es muy ilustrativo el texto de Gray (1988; trad. cast. 1993) y el manual de Klein (1991; trad. cast. 1994, pp.
201-250)

Tema 5: Condicionamiento instrumental. Control de estmulo y condicionamiento con estimulacin aversiva 237

1. ADQUISICIN DEL CONTROL Y PREDICCION DE LA ACCION MEDIANTE
CLAVES CONTEXTUALES ANTECEDENTES
1.1. Introduccin
1.1.1. El aprendizaje de seal en el condicionamiento instrumental

En los temas precedentes de aprendizaje mediante condicionamiento hemos analizado situaciones
en las que los resultados externos del aprendizaje (cambios conductuales) se hacan depender de las
consecuencias estimulares (condicionamiento clsico) o de la accin (condicionamiento instrumental)
pero en fenmenos separados y diferentes de aprendizaje. Sin embargo, es un hecho que la conducta
no se da "en el vaco" (Mackintosh, 1977; p. 643, trad. esp., 1983) sino en un determinado contexto
que est presente en el momento de emitir la respuesta y que puede influir en ella. Estos componentes
del contexto que influyen en la respuesta se denomina, en la terminologa conductista, condiciones an-
tecedentes. Estas condiciones pueden ser de dos tipos: motivacionales y estimulares:
- Las primeras tienen, como sabemos (ver Tema 1), un valor activador (por ejemplo, es necesaria una
cierta privacin de comida para que la rata inicie el condicionamiento) y no se van a tratar aqu.
- Las condiciones antecedentes estimulares forman parte del contexto, ambiente o estimulacin previa
o concomitante a la respuesta. As, la correlacin accin-consecuencia, necesaria para el aprendizaje
de respuestas (condicionamiento instrumental) se convierte en un aprendizaje ms completo si consi-
deramos la correlacin ANTECEDENTES - ACCION - CONSECUENCIA o, lo que es lo mismo, E-R-C (estmulo
- respuesta - consecuencia). Es ms completo pues combina condicionamiento clsico y condiciona-
miento instrumental, o sea,

(ESTMULO CONSECUENCIA) + (RESPUESTA CONSECUENCIA) = ESTMULO RESPUESTA CONSECUENCIA

En el condicionamiento clsico se produca un aprendizaje de seal, es decir, el EC activaba expec-
tativas de consecuencia estimular favorable o desfavorable y con ello desencadenaba ms o menos au-
tomticamente la respuesta. Tambin en el condicionamiento instrumental con estmulos discriminati-
vos -es decir, en el aprendizaje de respuestas sealizadas o tambin aprendizaje instrumental seali-
zado-, se hace un aprendizaje de seal (donde el EC se denomina ahora estmulo discriminativo o E
D
),
pero la seal activa en la memoria no la representacin aislada de la consecuencia sino la representa-
cin conjunta de accin - consecuencia (R-C). El esquema de esta comparacin es el siguiente:

Tipo de condicionamiento Seal observable Representacin activada
Condicionamiento clsico: EC EI
Condicionamiento instrumental: E
D

(R-C)

El aprendizaje instrumental sealizado tiene pues dos niveles de complejidad:
- Que la respuesta se desencadene tras la aparicin del estmulo antecedente, es decir, que un estmulo
ambiental cualquiera se convierta en seal predictiva para R-C. Esto es lo que podramos llamar ad-
quisicin inicial del control de estmulo.
- Que, una vez sealizada la conducta, sta se pueda realizar ante otras seales ms o menos parecidas.
Se trata de adquirir la sealizacin especfica (discriminacin) o la sealizacin amplia (generaliza-
cin). En cualquier caso, se adquiere control de estmulos: en un caso control de estmulos discri-
minativos y en otro, control de estmulos generalizados o extensin del control a otros estmulos si-
milares.

1.1.2. El aprendizaje de seal como control de estmulos

En los manuales de psicologa del aprendizaje, este aprendizaje instrumental sealizado aparece en
temas con epgrafes del tipo "generalizacin y discriminacin" y tambin "control de estmulos". Esta
ltima denominacin, si bien procede del enfoque operante skinneriano -Terrace (1966) fue el primero
en utilizarla- , aqu, siguiendo entre otros a Rilling (1977) y Mackintosh (1977), va a tener un sentido
ms amplio, neutro e integrador de los anteriores. Procederemos en este apartado a una delimitacin
conceptual de estos trminos.
Desde un punto de vista estrictamente skinneriano, se dice que una respuesta est bajo el control de
un estmulo (generalmente denominado estmulo discriminativo, E
D
) cuando la probabilidad de que
ocurra dicha respuesta es mayor en presencia de dicho estmulo que en su ausencia. Naturalmente, esta
mayor probabilidad de respuesta ante el estmulo ocurre siempre que se establezca una experiencia
previa de correlacin entre estmulo antecedente - accin - consecuencia positiva. Por tanto "control"
aqu se entiende como mayor posibilidad de prediccin de que se emitir la respuesta en presencia de
ese estmulo (y no como obligatoriedad o necesidad de emitir la respuesta ante ese estmulo). La forma
de comprobar que se ha producido la adquisicin de control de estmulo es si existe diferente tasa o
probabilidad de respuesta en presencia de distintos estmulos (mayor ante E
D
que ante otros estmu-
los).

1.1.3. Variaciones en las condiciones antecedentes y resultados de gene-
ralizacin y discriminacin

Una vez establecida la correlacin estmulo-accin-consecuencia (si estamos en el con-
dicionamiento instrumental) o la correlacin estmulo-consecuencia (si se trata del condicionamiento
clsico), el control de estmulo puede darse ante ms o menos estmulos en funcin del tipo, cualidad o
magnitud de los estmulos antecedentes y de las consecuencias que tenga la conducta ante cada uno de
ellos. As es como se puede lograr la especificidad (discriminacin) o la extensin de la capacidad se-
alizadora a otros estmulos (generalizacin). Estas dos posibilidades deben entenderse como resulta-
dos conductuales de dichas manipulaciones.
Ambos conceptos se configuran como dos extremos de un continuo. En un extremo, el incremento
de respuesta ante diversos estmulos parecidos (generalizacin) y, en otro, ante estmulos muy espe-
cficos (discriminacin). En cualquier punto del continuo siempre se tenemos estmulos antecedentes
que controlan (predicen) respuestas, es decir, que son capaces de predecir una alta probabilidad de
ocurrencia de las mismas en su presencia. En cierto sentido, la adquisicin del control de estmulo sue-
le requerir una discriminacin de estmulos. Ahora bien, lo que se trata de aprender es el grado en que
varios (generalizacin) o un solo estmulo (discriminacin) son capaces de sealizar la respuesta (y
por tanto responsables del control de estmulo). Obviamente, entendemos que a medida que aumenta la
generalizacin, disminuye la discriminacin, y viceversa. Discriminacin y generalizacin son fen-
menos opuestos porque mantienen una relacin inversa.

El control de estmulos, y sus aspectos de discriminacin y generalizacin, es un proceso con un
gran valor adaptativo para el hombre (y otras especies). Se trata de aprender a responder selectivamen-
te ante determinados estmulos (por sus consecuencias gratificantes) y a no responder ante otros (por
sus repercusiones aversivas o simplemente por su falta de repercusiones).

1.1.4. Implicaciones prcticas del aprendizaje instrumental sealizado

La palabra "antecedentes" aqu tiene una dimensin temporal amplia en cuanto al momento del es-
tablecimiento de la correlacin con la accin y/o con la consecuencia. En cualquier caso, una vez re-

presentada en la memoria esta expectativa de relacin triple (estmulo antecedente, accin, consecuen-
cia), la mera aparicin del antecedente servir para desencadenar la accin, convirtindose as en seal
o indicio de que la accin tendr una consecuencia positiva y permitiendo una proximidad temporal
entre el antecedente y la accin.
Como dicen Domjan y Burkhard (1986), es tan habitual el control de estmulos que no pensamos
en la cantidad de veces que lo aplicamos y lo raro que resultara -por no decir anormal o patolgico- el
mostrar conductas que no estn bajo el control de estmulos. Citan cuatro ejemplos y contraejemplos
interesantes:
- La conducta de desnudarse para cambiarse de ropa se hace en la intimidad del dormitorio y no en
medio de la calle,
- se mira la TV si est encendido el aparato y no si est apagado,
- se tiene una interaccin cariosa (caricias, besos) con familiares prximos y no con desconocidos,
- se grita en un partido de ftbol y no en clase o en la biblioteca.
En todos estos casos, la conducta se hace cuando se est en el contexto adecuado y no en otros
momentos. Eso es control de estmulos o aprendizaje instrumental sealizado.

Pero hay ms ejemplos: Al circular en coche por la carretera, una seal de STOP es E
D
, antecedente
o indicio inmediato de que si se realiza la respuesta (parar) se obtendr una consecuencia (no peligro);
en este caso (que aunque es ms bien de evitacin sirve igualmente en este momento), la conexin en-
tre ese estmulo, la respuesta y la consecuencia pudo aprenderse hace tiempo (al estudiar para la ob-
tencin del carnet de conducir, por ejemplo) pero es obvio que la aparicin del estmulo genera inme-
diatamente una mayor probabilidad de respuesta.

El tema es pues de gran importancia terica y sobre todo prctica. La conducta adaptativa se carac-
teriza, entre otras cosas, por producirse "en el momento oportuno" (Hulse, Egeth y Deese, 1982; p.
206) y el momento oportuno para responder slo lo puede anticipar el sujeto si aparecen las corres-
pondientes seales de ello. Ser ms probable que una accin tenga consecuencias adaptativas cuando
se sabe cundo y en qu lugar y en presencia de qu eventos se debe realizar. Por citar ms ejemplos,
en clase el alumno no habla (respuesta de "estar atento y en silencio") cuando-el-profesor-expone-el-
tema (E
D
), cruzamos la calle (respuesta) cuando el-semforo-est-en-verde (E
D
), escribimos (respues-
ta) cuando observamos salir la tinta (E
D
) del bolgrafo al rozar su punta sobre el papel. Ahora bien, co-
gemos el telfono (respuesta) cuando omos el timbre (E
D
) pero no si omos el timbre de la puerta (dis-
criminacin) y decimos "mesa" (respuesta) cuando dicho conjunto de letras lo vemos escrito con
maysculas o con minsculas o en cursiva (generalizacin).

El situar la accin bajo el control del o de los estmulos es un aprendizaje bsico. En la mayora de
situaciones cotidianas es una conducta o hbito sobreaprendido (o aprendido hace mucho tiempo), pe-
ro en otras tenemos que activar continuamente estrategias que logren un control del estmulo. Por
ejemplo, ante un aparato no muy conocido (video, ordenador, equipo de msica, etc. ), su manejo ini-
cial (respuesta) es dificultoso y debe ponerse bajo el control de estmulo para aprenderlo, y para ello
ponemos en marcha distintas estrategias (leer las instrucciones, buscar a un experto y que nos explique
el manejo, mtodo de ensayo y error, etc.). Pero hay conductas muy complejas para cuya realizacin
se requiere un sofisticado y laborioso control de estmulo que tarda tiempo en establecerse. As, la
conducta lectora exige situarse ante un texto escrito, fijar los ojos en los smbolos grficos adecuados
y emitir los sonidos correspondientes. El lector maduro tiene un adecuado control de estmulo pero el
nio que aprende a leer necesita ayuda (profesores, mtodos especiales de presentacin de estmulos
en cartillas, dosificacin de dificultad, etc. ). Hay una serie de mtodos generales desarrollados para
instigar inicialmente el hecho de que la conducta se site bajo el control del estmulo.

As pues dedicaremos este captulo al aprendizaje instrumental sealizado o control de estmulos,
para lo cual estudiaremos los procedimientos de adquisicin, las condiciones, teoras y procesos y
tcnicas aplicadas.

1.2. Tcnicas experimentales
1.2.1. Tcnicas simples: el refuerzo diferencial

As como el caso de un estmulo reforzante su efectividad es casi automtica para aumentar la pro-
babilidad de emisin de la respuesta, no ocurre as con los E
D
. Estos inicialmente no sealizan nada y
por tanto se necesita un perodo de adquisicin de dicha funcin. Para conseguir que un estmulo ad-
quiera la funcin de E
D
, el procedimiento ms usado es el refuerzo diferencial discriminativo. Se lleva
a cabo mediante dos operaciones bsicas:
- reforzar una respuesta emitida en presencia del estmulo o estmulos particulares, que queremos que
se conviertan en E
D
.
- no reforzar dicha respuesta si ocurre en ausencia de dichos estmulos o ante otros diferentes (E ).

Un ejemplo es el experimento original de Guttman y Kalish (1956) en palomas. El procedimiento
inclua dos fases:
I) Fase de entrenamiento: Al picotear un disco iluminado las palomas reciban refuerzo continuo. Se
vari la intensidad de luz del disco y as se hicieron cuatro grupos de palomas, uno para cada inten-
sidad -530, 550, 580 y 600 nanmetros (nm, medida de longitud de onda)-.
II) Fase de prueba: Para cada grupo, el disco se iluminaba con 11 diferentes longitudes de onda (de
470 a 640 nm.), con una duracin en cada caso de 30 segs. La respuesta era reforzada slo tras uno
de los 11 estmulos presentados (convirtindose as en E
D
). Hubo 12 ensayos para cada estmulo. El
resultado fue una mayor probabilidad de respuesta ante el E
D
que ante los otros estmulos y una
fuerza de respuesta en forma de U invertida (el pico de respuesta mxima ante E
D
), formando as lo
que denominaron un gradiente de generalizacin.

1.2.2. El gradiente de generalizacin / discriminacin

La mejor tcnica para evaluar el grado de generalizacin o discriminacin que se produce en la ad-
quisicin del aprendizaje instrumental sealizado es la del gradiente de generalizacin / discrimina-
cin. Es un procedimiento iniciado por Guttman y Kalish (1956) que presenta los resultados en trmi-
nos de representacin grfica de la fuerza (intensidad o frecuencia) de la respuesta dada al estmulo
original y a otros estmulos semejantes. El grado de generalizacin de estmulo se aprecia en la magni-
tud o frecuencia de respuesta. Cuanto menos similar sea el nuevo estmulo al estmulo original menor
ser la fuerza de la respuesta, y esto ocurre de forma graduada siguiendo un patrn determinado que se
presenta grficamente en forma de U invertida.
Adems, como ya dijimos que generalizacin y discriminacin son extremos opuestos de un conti-
nuo, ambos fenmenos pueden evaluarse en un mismo gradiente. En la Figura 1 tenemos un ejemplo
de gradiente de generalizacin en dos de sus manifestaciones extremas: cuando se da mucha generali-
zacin (a) y cuando es escasa, y por tanto hay una gran discriminacin (b).

Figura 1: Representacin grfica de dos tipos de gradientes de generalizacin.

En el grfico (a) de la figura anterior, se produce una amplia dispersin de la generalizacin de
estmulo como forma de responder a diversos estmulos. En el caso del grfico (b) se produce una res-
puesta diferenciada y por tanto una escasa generalizacin de estmulo. La representacin grfica (c) es
otra forma de exponer grficamente el gradiente de generalizacin.

Adems de estos gradientes excitatorios, tambin es posible lograr gradientes inhibitorios o gra-
diente de extincin. Un ejemplo es el experimento de Honig (1961) con palomas. Tena tres fases:
I) Fase preliminar, en la que se estableca una lnea base de adquisicin mediante refuerzo de una res-
puesta de picoteo de un disco iluminado con 13 longitudes de onda diferentes (de 490 a 630 nm). El
animal responda pues ante los 13 estmulos.
II) Fase de extincin: ante uno (E ) de los 13 estmulos (570 nm) la respuesta nunca era reforzada.
III) Prueba de generalizacin: Se volvan a presentar los 13 estmulos. Los resultados, presentados
grficamente en el correspondiente gradiente muestran una funcin en U, siendo el pico inferior la
respuesta ante E .

2. GENERALIZACIN: ADQUISICIN DEL CONTROL DE ESTMULOS
GENERALIZADOS
2.1. Procedimientos de estudio de la generalizacin

El procedimiento bsico es tambin de refuerzo diferencial, midiendo las tasas de respuesta que se
dan tras cada estmulo, antes y despus de ser reforzada la respuesta. Se trata pues de comparar tasas
de respuesta en presencia de diferentes estmulos.
Hay dos grupos de tcnicas diferentes: las que suponen presentar estmulos diferentes a los mismos
sujetos y las que hacen presentar el mismo estmulo a distintos grupos de sujetos:
- El primer tipo de tcnica es la del estmulo repetido, segn la cual se presentan estmulos distintos
(pero similares al condicionado) en orden aleatorio. Tiene el inconveniente de que la respuesta ante
uno de los estmulos puede verse muy influida por las consecuencias de las respuestas ante los otros.
- El segundo tipo de tcnica se llama tcnica del estmulo nico: se divide al grupo experimental en
subgrupos y cada uno de ellos recibe slo un estmulo (diferente para cada grupo); se comparan las
tasas de respuestas de los distintos grupos entre s.
Fuerza de la
respuesta
E original
(a)
E original
(b)
Intensidad o
frecuencia
E
1

E
2
E
3
E
4

(c)

2.2. Tipos de generalizacin

La generalizacin puede ser, en general, de dos tipos: generalizacin de estmulo y de respuesta. En
la primera es la misma respuesta la que surge ante otros estmulos distintos del inicialmente condicio-
nado; en la segunda es una primera respuesta reforzada la que provoca que aparezcan respuestas pare-
cidas.

2.2.1. Generalizacin de estmulo

Mediante procedimientos de la generalizacin de estmulo, una misma respuesta podr realizarse
ante situaciones o contextos no idnticos pero similares a aquellos en que tuvo lugar el entrenamiento.
Es decir, el reforzamiento de una respuesta ocurrida siempre en presencia de un mismo estmulo, pro-
voca que dicha respuesta se pueda producir ante parecidos estmulos. Por ejemplo, un nio puede mos-
trar temor como respuesta a un mdico, debido a una asociacin del mdico con el dolor producido por
una inyeccin y luego tendr miedo ante cualquiera que lleve bata blanca.

El grado de generalizacin del estmulo principalmente depende del grado de similaridad del nuevo
estmulo bajo el cual tambin se emiti la respuesta.

Algn autor (Wittig, 1982, p. 119) distingue dos tipos de generalizacin del estmulo:
- Generalizacin primaria, en la que el organismo responde no slo al estmulo original sino a otros
con propiedades fsicas similares. Por ejemplo, una rata entrenada a responder al tic-tac del metr-
nomo puede responder tambin al golpeteo de una varilla en un bloque de madera.
- Generalizacin secundaria, segn la cual un organismo responde a un estmulo debido a alguna
equivalencia aprendida entre los dos. Por ejemplo, un sujeto entrenado a responder a la palabra "alto"
puede tambin responder a la palabra "pare". Es algo similar al condicionamiento de segundo orden
en el condicionamiento clsico.

La generalizacin de estmulos es un fenmeno conductual omnipresente. Gracias a l no tenemos
que aprender constantemente una respuesta ante cada estmulo nuevo sino que ante estmulos similares
damos una respuesta semejante. De este modo, un maestro puede pretender que el alumno aprenda a
leer, por ejemplo la letra A, no slo con la grafa propia de la cartilla escolar sino en cualquier otra
grafa.

La generalizacin tiene pues ventajas para el aprendizaje pero tambin algn inconveniente. En
trminos positivos, proporciona estabilidad al comportamiento y tiene por tanto gran valor adaptativo.
En trminos negativos y segn las condiciones especficas, puede entenderse como una mala discrimi-
nacin o una discriminacin todava mal lograda.

2.2.2. Generalizacin de respuesta: Moldeamiento o aproximaciones sucesivas

La generalizacin de respuesta consiste en un aumento de probabilidad de ocurrencia de otras res-
puestas parecidas a la reforzada. El reforzamiento de una respuesta aumenta la probabilidad de otras
respuestas similares. En esto se basa el mtodo de moldeamiento (shaping), muy utilizado en modifi-
cacin de conducta -y tambin como procedimiento experimental para la adquisicin rpida del condi-
cionamiento de recompensa; vase aptdo. 1.4.2.a del Tema 4)-.

Se basa en el refuerzo de cada respuesta que se parezca o aproxime a una "respuesta terminal" o
conducta objetivo seleccionada de antemano. Se emplea el moldeamiento o mtodo de aproximacio-
nes sucesivas cuando la respuesta terminal no se da habitualmente en el repertorio comportamental del
sujeto. As, si uno es reforzado por sonrer, aumenta la frecuencia de la risa y quizs de otras res-
puestas tales como la conversacin. O sea, la alteracin en la frecuencia de una respuesta puede influir
de forma inadvertida en otras. En resumen el esquema que corresponde a ambos tipos de generaliza-
cin sera el que se muestra en la Figura 2.

GENERALIZACION DE GENERALIZACION DE
ESTIMULO RESPUESTA

E
1
R
1
Eref E
1
R
1
Eref

E
1
R
1

E
2
R
1
E
1
R
2

E
3
R
3

Figura 2: Esquema sobre los tipos de generalizacin.
2.3. Por qu la generalizacin (teoras explicativas)

Las tres teoras explicativas ms clsicas son las siguientes:

a) Teora de Hull: Segn Hull (1943), la generalizacin es un proceso primario inherente al condicio-
namiento. Las respuestas durante la adquisicin son condicionadas no a un simple estmulo sino a
lo que l llama una "zona" de estmulos. Todos los estmulos en la zona son similares, esto es, se
relacionan a travs de un continuum sensorial particular de diversas intensidades pero dentro de una
misma modalidad sensorial y todos se vinculan a la respuesta. El hecho de que ms de un estmulo
sea capaz de elicitar una respuesta se hace evidente en una prueba de generalizacin donde se pre-
sente una variedad de estmulos a travs de un continuum sensorial.

b) Teora de Lashley y Wade: Para Lashley y Wade (1946), la generalizacin ocurre porque el sujeto
no consigue discriminar entre estmulos; la generalizacin resulta pues de una discriminacin im-
perfecta. Las respuestas se daban meramente porque los sujetos no discriminaban adecuadamente
entre el estmulo original y los estmulos generalizados. Si el sujeto puede distinguir entre estmu-
los, no los confunde y consecuentemente no puede generalizar.

c) Teora de la generalizacin mediada de Osgood: Segn Osgood (1953), pueden hacerse equiva-
lentes ciertos estmulos diferentes (es decir, evocar la misma respuesta) si suscitan la misma res-
puesta mediadora. Esta respuesta es un eslabn intermedio e interno de la cadena general de even-
tos que comienza con el estmulo y acaba con la respuesta. El aprendizaje perceptivo temprano
produce estas respuestas mediadoras implcitas. Es claro que los estmulos fsicamente similares
suscitan la misma respuesta mediadora en mayor medida que los estmulos diferentes. La hiptesis
de la mediacin viene representada en la Figura 3.
Ambos estmulos evocan la misma respuesta mediadora (r
m
), acompaada a su vez de un est-
mulo mediador interno (e
m
). Durante la adquisicin, e
m
es el ltimo eslabn antes de R, al igual que
ante el estmulo generalizado.


1. Desarrollo de la EC
1
r
m
e
m

respuesta mediadora EC
2
r
m
e
m

2. Adquisicin EC
1
r
m
e
m
R
1

3. Prueba de generalizacin EC
2
r
m
e
m

Figura 3: Hiptesis de la generalizacin mediada de Osgood.

3. DISCRIMINACIN: ADQUISICIN DE LA DISCRIMINACIN DE ESTMULOS
3.1. Tcnicas simples: Refuerzo diferencial discriminativo

Segn Millenson y Leslie (1979, pp. 247-248), el paradigma bsico de discriminacin consta de
una respuesta (R) y dos condiciones de estmulo (E
D
y E ). La R es reforzada en presencia de uno de
los estmulos, el E
D
, y no es reforzada en presencia de la otra condicin estimular, el E (con lo cual se
extinguir dicha R). El resultado es que la probabilidad de responder ante E
D
se hace mayor que ante
E . Dichas condiciones podran representarse del siguiente modo:

E
D
- R E
ref

E - R / no E
ref

donde = "es seguida por"; / = "no hay consecuencias programadas". E

se usa tam-
bin para denotar condiciones no slo de ausencia de refuerzo (extincin) sino de menor refuerzo que
para E
D
.

El refuerzo diferencial tiene en el contexto experimental dos variantes: La tcnica de discrimina-
cin simultnea y la de discriminacin sucesiva:

TCNICA DE DISCRIMINACIN SIMULTNEA

Se presentan los dos estmulos (E
D
y E ) al mismo tiempo y se refuerza la eleccin correcta. Es la
tcnica usada por Lashley (1930) en su trampoln de saltos con ratas: La rata salta a una u otra de las
puertas, si la eleccin es correcta se abre la puerta y el animal llega a la comida, si no lo es, al saltar no
se abrir la puerta. En la Figura 4 podemos apreciar dicho dispositivo.

DISCRIMINACIN SUCESIVA

Se presentan sucesiva y alternativamente ambos estmulos y se refuerza la respuesta slo ante E
D
y
no ante E . Tanto en el caso de la discriminacin simultnea como de la sucesiva, se consigue un au-
mento de la tasa de respuesta en presencia de E
D
y un cese progresivo y desaparicin de la respuesta
ante E . As es como el sujeto ha aprendido a dar respuesta selectiva ante un estmulo, o lo que es lo
mismo, ha aprendido a "discriminar" dicho estmulo, lo distingue de otros, da ante l una respuesta
distinta que ante otros estmulos.


Figura 4: Dibujo esquemtico del dispositivo de discriminacin de Lashley.

3.2. Tcnicas complejas de adquisicin de discriminacin

En el estudio de la discriminacin se han utilizado otros procedimientos ms complejos, algunos de
los cuales tienen aplicaciones prcticas importantes. Citaremos slo tres de ellos:

3.2.1. Atenuacin o desvanecimiento del estmulo

El desvanecimiento (fading) implica que se deben hacer desaparecer progresivamente a lo largo del
entrenamiento determinadas caractersticas de un E
D
(forma, color, situacin, tamao) que el sujeto
discriminaba desde el principio con facilidad. stas van desapareciendo, "atenundose" poco a poco, a
la vez que se produce un aumento de intensidad de otras caractersticas del mismo estmulo, las cuales
hacen de nuevo E
D
. Este procedimiento permite obtener aprendizajes discriminativos muy complica-
dos. Se parte de caractersticas estimulares que un sujeto ya conoce y se llega a otras que antes no dis-
criminaba. As, por ejemplo, cuando el nio empieza a escribir traza las letras por encima de los pun-
teados y dentro de los renglones marcados en su libreta de aprendizaje. Poco a poco, se irn eliminan-
do los punteados de las letras y tambin los renglones que delimitan el tamao y ordenamiento de la
escritura, hasta que la simple instruccin del profesor para escribir una letra o palabra sobre un folio en
blanco sea un E
D
suficiente.

Una variante compleja de desvanecimiento es la tcnica de discriminacin sin error.

Se trata de un fenmeno descubierto por Terrace (1964). Para lograr esa discriminacin sin error, a
los sujetos se les presenta E
D
y E , generalmente el E
D
con la mayor fuerza posible y el E con una in-
tensidad muy dbil. Las respuestas al E
D
se refuerzan y se incrementan pero se logra que el sujeto no
d ninguna respuesta no reforzada al otro estmulo, puesto que, al principio, E no tiene igual fuerza
que E
D
sino mucho menor, de modo que el E empieza por ser irrelevante en el medio ambiente del su-
jeto, y aunque despus vaya aumentando en intensidad, ya ser muy difcil responder ante E si a la
vez se ha reforzado la respuesta ante E
D
.
Es pues un procedimiento gradual mediante el cual se vigoriza la fuerza de la respuesta a un E
D
, a
la vez que no se permiten respuestas no reforzadas al E . Terrace lo consigui en palomas "desvane-
ciendo" el E al principio y hacindolo cada vez ms fuerte a lo largo del entrenamiento. Hay pues una
presentacin progresiva del E : al principio muy distinto del E
D
y conforme avanza el proceso de
aprendizaje se parece ms al E
D
(por ejemplo, de presentarse durante dcimas de segundo pasa a durar
lo mismo que E
D
). Siendo todas las respuestas correctas y reforzadas ante E
D
se consigue que no apa-
rezca ninguna respuesta ante E (no hay frustracin al no haber errores, al no darse respuestas que no
vayan seguidas de recompensa) y se puede llegar a un grado de discriminacin muy elevado.

En el mbito aplicado la utilizacin de desvanecimiento es fundamental cuando se aplican instiga-
dores (vase apartado 5).

3.2.2. Comparacin con la muestra

Es una tcnica de discriminacin que tiene dos variantes: igualacin y diferenciacin de la muestra.

- Igualacin a la muestra: Consiste en utilizar, en primer lugar, el estmulo objetivo que se tiene que
discriminar (denominado estmulo de muestra) y despus presentarlo junto a otros estmulos pareci-
dos. La recompensa se dar cuando el sujeto elija precisamente el idntico al de muestra.

- Diferenciacin de la muestra: Se presenta un estmulo muestra y una serie de alternativas que son to-
das iguales a la muestra excepto una que es la que se refuerza cuando es elegida.

Son procedimientos que suele emplearse en la reeducacin de "dficits perceptivos" y trastornos
asociados con la percepcin. La Figura 5 nos muestra un ejemplo de aplicacin de estas tcnicas en
el aprendizaje de la lectura.

Figura 5: Ejemplos de aplicacin de tcnicas de igualacin y diferenciacin a la muestra

3.2.3. Combinacin de E
D
y refuerzo secundario: el encadenamiento

Otro caso en el que interviene la discriminacin es en el procedimiento de encadenamiento. Esta es
una tcnica experimental y tambin aplicada (en modificacin de conducta), utilizada en la adquisicin
b
b
d
b
p
d
q
b
b
b
h
b
Estmulo de
muestra
Estmulo de
muestra
Igualacin con
la muestra
Diferenciacin
de la muestra
1 se presenta:
1 se presenta:
2 se presentan:
2 se presentan:
Si seala este E,
se da refuerzo
muestra
Si seala este E,
se da refuerzo
muestra

de conductas nuevas. Es un procedimiento basado en el concepto de refuerzo condicionado o secunda-
rio, ya explicado en el Tema 4.
El encadenamiento es un procedimiento que consiste en ordenar secuencias o cadenas continuas de
estmulos y respuestas mantenidos en unin por estmulos que tienen una doble funcin: como refuer-
zo secundario y como E
D
.
Una cadena de este tipo est compuesta de eslabones, cada uno de los cuales consta de una secuen-
cia de E
D
- RESPUESTA - REFUERZO CONDICIONADO. Se exige tambin que el primer elemento de la ca-
dena sea un E
D
, que el resto de estmulos discriminativos sean a su vez refuerzos condicionados y que
el ltimo refuerzo de la cadena sea primario.

Un ejemplo sera el siguiente: Un chimpanc opera una mquina mediante la cual recibe una ficha
que cambia a continuacin por alimento. La cadena sera la que encontramos en la Figura 6.

E
1
D
R
1
E
D

(mquina) (operar
mquina) Ref. cond. 1 R
2
E
ref

(ficha) (cambiar (uva)
ficha por uva)

Figura 6: Ejemplo de encadenamiento

Otro ejemplo sera la secuencia de respuestas para ir a un restaurante:
1) E
D
(llamada telefnica de un amigo, hora del da, hambre).
2) Varias respuestas secuenciadas (levantarnos, abrir la puerta, salir de casa, entrar al coche, conducir,
aparcarlo, entrar al restaurante, sentarnos, leer el men, pedir la comida, comerla). El estmulo am-
biental que sigue a cada respuesta da ocasin a la siguiente respuesta de la cadena.
3) La cadena total est mantenida por la comida que finalmente comemos.

As pues en resumen, el encadenamiento sigue los siguientes pasos:
1) Presentacin de un E
D

2) Respuesta en presencia de E
D

3) Aparicin consiguiente de otro E que es refuerzo condicionado respecto al paso anterior y E
D
para...
4) ... una nueva respuesta
5) Estmulo nuevo que es refuerzo condicionado y E
D
... etc.
...
n) El ltimo estmulo que forma la cadena es un reforzador primario o innato.
Para un uso aplicado de este procedimiento vase el libro de Sulzer-Azaroff y Mayer (1977).

3.3. Por qu ocurre la discriminacin (teoras explicativas)

Hay dos teoras clsicas fundamentales:

a) Teora de la continuidad de Hull-Spence. Elaborada por Hull (1943) y Spence (1936), puede con-
siderarse la ms antigua y tradicional teora en torno a la discriminacin. Tiene tres principios bsi-
cos:
1, el refuerzo conduce a un incremento de la fuerza excitatoria del E
D
;
2, el refuerzo aumenta la fuerza inhibitoria del E
D
;
3, ambas tendencias (excitatorias e inhibitorias) se generalizan a otros estmulos similares y los
gradientes se suman para producir la respuesta diferencial.

Esta teora ha sido criticada recientemente dando paso a otra ms actual: la teora atencional.

b) Teora atencional. Es original de Sutherland y Mackintosh (1971). Segn dicha teora, el aprendi-
zaje discriminativo implica dos procesos discretos: el refuerzo de la atencin a una o ms dimen-
siones relevantes del estmulo y la concesin de una respuesta particular al estmulo relevante.
El sujeto aprende dos cosas durante los experimentos de discriminacin:
1, aprende a atender a las dimensiones particulares del ambiente sobre la base de que las conse-
cuencias de dicha atencin predicen correctamente importantes eventos (posible refuerzo ulte-
rior a la respuesta); y
2, aprende a responder en funcin del refuerzo.

4. CONDICIONES PARA LA ADQUISICION DEL CONTROL DE ESTIMULOS

Varios autores (Tarpy y Mayer, 1978; Wittig, 1982) sealan diversas condiciones importantes para
la adquisicin del control de estmulos. Dado que generalizacin y discriminacin son extremos de un
continuo, lo normal es que la condicin que favorece a una dificulte a la otra. Por eso, aunque los ma-
nuales separan las condiciones para un tipo u otro de control de estmulos, creemos preferible unirlas
agrupndolas en: condiciones durante la adquisicin y condiciones de entrenamiento previo en discri-
minacin.

4.1. Condiciones durante la adquisicin

a) Grado de adquisicin o nmero de ensayos de aprendizaje

Cuanto menor sea el grado de adquisicin, es decir, el nmero de presentaciones del estmulo, ms
fcil es la generalizacin. Si prosiguen los ensayos el gradiente se hace ms puntiagudo y por tanto
hay mayor discriminacin.

b) Intervalo entrenamiento-prueba

Cuanto mayor es el perodo de tiempo entre la adquisicin de la respuesta ante un estmulo y la
prueba ante otros estmulos, mayor es la generalizacin, es decir, los estmulos generalizados se elici-
tan relativamente ms siempre que se responda inmediatamente despus de un descanso tras el entre-
namiento. De alguna manera, la recencia del entrenamiento aumenta el aprendizaje discriminativo, fa-
vorece el recuerdo especfico de los estmulos discriminativos.

c) Topografa de los estmulos

Cuanto mayor semejanza exista entre el estmulo original y los estmulos con los que queremos que
haya generalizacin mayor intensidad y frecuencia de la respuesta ante stos, lo cual resulta bastante
lgico si tenemos en cuenta que la generalizacin consiste precisamente en esa extensin de la res-
puesta ante estmulos semejantes al E
D
original.

d) Dificultad del problema

El aprendizaje discriminativo ocurre rpidamente cuando se usan estmulos que se distinguen
fcilmente, pero es ms lento cuando son muy parecidos. As, un nio encontrar ms fcil distinguir
entre "O" e "I" que entre "F" y "E" o entre b y d (vase Figura 7).

La habilidad para responder diferencialmente a dos estmulos est limitada por las capacidades per-
ceptivas del sujeto para distinguir entre ambos. De este modo, si los estmulos son demasiado pareci-
dos como para que los pueda distinguir un determinado organismo, puede llegarse a lo que desde Pav-
lov se viene llamando "neurosis experimental" (al exigir discriminaciones entre estmulos con propie-
dades cada vez ms similares) con sntomas en perros debidos a la incapacidad de discriminacin, tales
como angustia, confusin, etc. El experimento tpico de la escuela de Pavlov -Shenger-Krestovnika
(1921; cit. por Gray, 1988; 1993, trad. cast., p. 152)- consista en mostrarle al perro un crculo (EC) y
luego darle comida, obteniendo as una RC de salivacin; se le muestra tambin una elipse pero no se
le da comida y no se obtiene RC; cuando el cociente de los ejes de la elipse se redujo a 9:8, el perro no
diferenciaba entre el crculo y la elipse; durante tres semanas su ejecucin fue correcta en otros casos
pero luego cambi, cometiendo errores en discriminaciones ms simples e incluso mostrando signos
de angustia (ladridos, agitacin, etc.).

e) Informacin estimular

Nos referimos con ello a las propiedades informativas del estmulo, es decir, si el estmulo produce
informacin sobre la recompensa o la no recompensa. Cuanto mayor valor informativo tenga el est-
mulo mejor se producir la discriminacin.

f) Aprendizaje observacional

O sea, la oportunidad para el aprendiz de observar a otro sujeto (el modelo) cmo ejecuta la res-
puesta ante el estmulo. Si se da esta oportunidad, mejor se producir el aprendizaje discriminativo.

4.2. Condiciones de entrenamiento previo en discriminacin
a) Experiencia sensorial temprana

Diversos estudios (como sealan Tarpy y Mayer, 1978; p. 149) han demostrado que los estmulos
generalizados elicitan respuestas incluso en sujetos que tuvieron experiencia previa del estmulo muy
limitada, desde un ao despus de su nacimiento. Este hallazgo es importante pues sugiere que la ex-
posicin previa a los estmulos generalizados no es condicin necesaria para la respuesta a aquellos
estmulos. No obstante, si la experiencia previa de dichos estmulos es muy reciente la generalizacin
es menor.

b) Dificultad de la generalizacin por entrenamiento previo en discriminacin

El efecto del entrenamiento previo en discriminacin sobre la generalizacin ha sido estudiado ex-
tensamente. Una razn para el inters en dicha rea fue el hallazgo de que los gradientes de generali-
zacin pueden predecirse a partir de las capacidades discriminativas del sujeto; un mayor gradiente de
discriminacin representa mayor habilidad para distinguir entre estmulos, y a la inversa, lo cual sugie-
re que el entrenamiento explcito en discriminacin, previo a la prueba de generalizacin, debe agudi-
zar el gradiente, esto es, produce menor generalizacin de respuesta.

c) Transferencia del entrenamiento en discriminacin

Se trata de situaciones en las cuales el aprendizaje de una tarea influye en la adquisicin posterior
de alguna otra. Se ha demostrado que si se aprende una discriminacin relativamente fcil antes de
aprender otra relacionada ms difcil, la discriminacin facilitar la adquisicin de la segunda tarea.

d) Entrenamiento previo E
D
- E : El fenmeno de desviacin del vrtice

Tambin denominado "cambio de pico" (peak shift), fue descubierto inicialmente por Hanson
(1959) y se refiere al hecho de que tras un entrenamiento en discriminacin seguido por un entrena-
miento inhibitorio con E , la fuerza de una respuesta puede desplazarse lejos de la direccin de un E
y ms all de un E
D
original, aun cuando el E
D
contine manteniendo sus propiedades. En la Figura 8
podemos apreciar que las respuestas reforzadas ante el E
D
y de extincin al E generan un gradiente de
generalizacin del estmulo que no es simtrico, teniendo la mayor parte de la fuerza de respuesta des-
plazada a lo largo de la dimensin del estmulo en el sentido de E
D
y alejndose de E . O sea, al ir
hacia la izquierda de la dimensin de estmulo, en la Figura 8 se observa que se eleva la curva para la
fuerza neta de respuesta, alcanzando un pico no en el E
D
original sino en un punto situado a la iz-
quierda de l. Dicho desplazamiento se obtiene despus del adiestramiento de discriminacin que in-
cluye un reforzador diferencial a los estmulos E
D
y E . Implica:
1 entrenamiento con E
D
(E
D
- R- Ref),
2 entrenamiento con E (E - R- no Ref) y
3 vuelta a E
D
mayor R ante E
D+n

Citemos un ejemplo (Wittig, 1982, p. 125) sacado de la poltica: supongamos que un hombre apoya
a una candidata que es ligeramente ms conservadora que el candidato que normalmente ha apoyado
en otras ocasiones. Al salir elegida dicha candidata, los proyectos de ley por los cuales trabaja y vota a
favor, son en extremo conservadores -hecho que sirve como una fuerte condicin para el votante-. En
las siguientes elecciones, el hombre puede cambiar y no volver a su posicin original sino ir mucho
ms all apoyando a un candidato a quien inicialmente hubiera juzgado muy liberal.
Otro ejemplo de tipo deportivo: Un habitual seguidor del Real Madrid traslada sus simpatas al
Atltico de Madrid. Tras el fracaso futbolstico de ste ltimo vuelve a simpatizar ms que nunca
con el equipo blanco.

Figura 8: Representacin grfica del fenmeno de desviacin del vrtice.

Debe notarse que el fenmeno de la desviacin del vrtice no se refiere a una intensificacin en la
magnitud de la respuesta debido a la experiencia previa, lo cual nos remitira al fenmeno de contraste
ya estudiado en el captulo anterior. En este caso, lo que se produce es una traslacin de la respuesta
E
D
E
Gradiente en la prueba poste-
rior al establecimiento de las
propiedades del estmulo
Gradiente
original
Dimensin del estmulo

en el espectro de los potenciales estmulos discriminativos, una radicalizacin de la respuesta original
del sujeto en una direccin debido a una experiencia frustrante (no reforzada) cuando coyunturalmente
el sujeto da respuesta ante otros estmulos situados en la direccin contraria del espectro.

e) Discriminacin de relaciones: La transposicin

La transposicin es la capacidad que tienen los organismos para llevar a cabo discriminacin de re-
laciones. El E de una prueba pasa a ser E
D
de la segunda. El experimento clsico consiste en presentar
dos crculos, el mayor hace de E
D
y el menor de E . Khler (1925) utiliz pollos para que discrimina-
ran entre dos superficies grises circulares (una ms grande que la otra), de tal modo que se aprenda a
discriminar entre ellos (reforzando cuando se responda ante el crculo mayor). A continuacin, se pre-
sentaba el crculo menor junto con otro ms pequeo, haciendo reforzar al sujeto ante el mayor de am-
bos (que en la primera prueba era el E ), como vemos en la Figura 9.

Figura 9: Ejemplo de transposicin.

De este modo se aprende a responder a la relacin (en este caso "ser menor que") entre estmulos,
prescindiendo de los valores absolutos de los mismos.
En situaciones de la vida real, el fenmeno de transposicin se produce, por ejemplo, cuando el en-
trenador de un equipo de baloncesto coloca como pivot titular al jugador "ms alto" de la plantilla. El
criterio de seleccin es por tanto comparativo y el jugador ms alto en un momento dado puede no ser-
lo en la temporada siguiente.

5. PROCEDIMIENTOS APLICADOS PARA EL ESTABLECIMIENTO DEL CON-
TROL DE ESTIMULO
5.1. Aplicacin de instigadores y desvanecimiento
5.1.1. Dificultades con el refuerzo diferencial

Sabemos pues que existe control de estmulo cuando en presencia de un estmulo antecedente parti-
cular hay mayor probabilidad de que ocurra una respuesta particular. Est claro que lo que se aprende
en este caso no es una respuesta nueva sino a producirla en las condiciones apropiadas, en cuyo caso
estas condiciones (estos estmulos antecedentes) provocan esa respuesta. Es decir, el estmulo antece-
dente es significativo para el sujeto y, a la manera del EC, activa en el aprendiz la expectativa de que
determinada respuesta ser reforzada en su presencia. No son pues los estmulos los que controlan al
sujeto (a los estmulos no se le pueden atribuir funciones humanas) sino el sujeto quien controla
pues la situacin en funcin del significado atribuido al estmulo antecedente.
El control de estmulo generalmente se adquiere con procedimientos de refuerzo diferencial. Para
que ste sea eficaz en el control de estmulos, deben darse una serie de condiciones ptimas:
E
D

E
D
E
E
1 Prueba
2 Prueba
- debe ocurrir la respuesta deseada,
- los estmulos esenciales deben controlar alguna conducta de atencin del sujeto,
- los dos sucesos (estmulo y atencin focalizada) deben ocurrir simultneamente para que se suminis-
tre el refuerzo.

No obstante, hay veces en que no resulta efectivo. No es fcil que el estmulo controle (adquiera
el significado pertinente para provocar...) la respuesta y ello puede ser debido, segn Sulzer-Azaroff y
Mayer (1977), a varios factores:
- porque la respuesta no se hallaba en el repertorio de respuestas del sujeto (por ejemplo, en el nio
que no sabe leer, al ver la letra p (E
D
) no sabr pronunciarla),
- porque la respuesta est bajo el control de otros estmulos o el estmulo controle otras respuestas (en
nios pequeos se dan muchos ejemplos: responde pap al ver personas con gafas, al ver un peridi-
co a mano le induce la respuesta de despedazarlo, al ver a su madre coger el bolso de paseo le motiva
a levantarse e irse a la puerta para salir, etc.),
- porque el estmulo sea difcil de percibir por problemas sensoriales o motores,
- porque la respuesta haya tenido en el pasado un control de estmulo diferente (por ejemplo, con un
nuevo procesador de textos, centrar un ttulo se hace combinando las teclas Ctrl y T, pero con el an-
terior procesador se haca con Alt + C).

Por todo ello, es preciso utilizar mtodos adicionales, sobre todo instigadores y desvanecimiento
posterior.

5.1.2. Los instigadores como facilitadores de la discriminacin

Cuando el refuerzo diferencial es insuficiente para conseguir el control de estmulo se utilizan ins-
tigadores o incitadores. Los instigadores son estmulos adicionales que se presentan conjuntamente
con los estmulos que queremos que sean discriminativos. Se trata de estmulos inicialmente ms sig-
nificativos (ya poseen un significado, una funcionalidad conductual) y que es til usarlos temporal-
mente para facilitar la emisin de respuesta cuando el control de estmulo no es completo.
Las funciones del instigador en relacin con el estmulo que queremos que se convierta en discri-
minativo, se entienden bien al comparar esta situacin con lo que ocurra en el condicionamiento
clsico: El instigador tendra una funcin similar al EI y el EC es el estmulo que queremos que ad-
quiera fuerza sealizadora (que sea E
D
). Por eso, el procedimiento consiste en emparejar el estmulo
nuevo con el instigador (igual que EC-EI). Obviamente, un instigador no necesariamente elicita res-
puestas reflejas; basta con que sea un EC excitatorio previamente condicionado a un EI o un estmulo
discriminativo ya consolidado (por anterior entrenamiento E
D
-R-E
ref
).

Se distinguen varios tipos de instigadores:

a) Instigadores verbales. Se trata de las tpicas instrucciones verbales, o sea, decirle al sujeto lo que
debe hacer. Por ejemplo, el maestro que quiere ensear a sus alumnos a escribir la letra "a" les dice
nios, escribid la letra a

b) Demostracin. Es el conocido aprendizaje observacional utilizando modelos (modelado): Alguien
realiza ante el sujeto la conducta que ste debe aprender. Se trata por tanto de un procedimiento de
imitacin. En el ejemplo anterior, el maestro escribe la letra a. Si combinase instrucciones verba-
les y demostracin, el maestro dira escribir la letra a, tal y como lo hago yo. Cuando fallan las
instrucciones verbales se utiliza este mtodo.


c) Gua fsica. Consiste en guiar el movimiento correcto de la respuesta y se utiliza cuando fallan los
anteriores. En el ejemplo citado, el maestro cogera la mano del nio y se la movera para escribir
la letra "a".

Estos tres instigadores se pueden ordenar en una escala de mayor a menor intrusividad, es decir, en
cuanto al menor o mayor grado de importancia del instigador o probabilidad de que sea seguido por el
aprendiz. El ms intrusivo es la gua fsica, le sigue la demostracin y por ltimo las instrucciones ver-
bales.

d) Otros tipos de instigadores. Otros instigadores muy usados en la prctica son los perceptivos, por
ejemplo, para lectura o escritura, magnificacin de los rasgos crticos de estmulo, el punteado de
las letras en los cuadernos de caligrafa, etc.

En la enseanza o en procedimientos de adiestramiento, se suele comenzar por los instigadores me-
nos intrusivos. Por ejemplo, en una tabla de gimnasia, el monitor da las explicaciones pertinentes so-
bre los movimientos que han de hacer los alumnos. Si estos instigadores no son vlidos para que se lo-
gre el control de estmulos, entonces habr que recurrir al siguiente: la demostracin (el monitor reali-
za el movimiento o el ejercicio tal y como lo deben hacer sus alumnos). Si tampoco funciona entonces
habr que recurrir a la gua fsica (el monitor coge el brazo o la pierna del sujeto y se la mueve en la
direccin correcta).
Normalmente se suelen combinar los instigadores (instruccin verbal con demostracin, etc.). En
cualquier caso, es importante que los instigadores se vayan retirando mediante desvanecimiento, tal y
como se explica en el siguiente apartado.

5.1.3. Desvanecimiento de los instigadores

Si no se retirasen los instigadores nunca se establecera un adecuado control de estmulo, es decir,
difcilmente el sujeto sabra emitir la respuesta en presencia slo del E
D
y siempre requerir el instiga-
dor. Por ejemplo, si siempre que el nio escriba le vamos a guiar la mano cmo aprender a realizar
los movimientos precisos que corresponden a la escritura?. De igual manera, no sera correcto que el
sujeto slo hiciera las cosas cuando se le dan las instrucciones verbales para ello (escribir cuando se le
diga que escriba, etc.); si as fuera, tendramos sujetos pasivos, con muy escasa autonoma e iniciativa
propia.
As pues, hay que desvanecer progresivamente los instigadores de modo que si se utiliza un insti-
gador muy intrusivo, ste debe ir sustituyndose por otro menos intrusivo y as sucesivamente hasta
que desaparezcan totalmente los instigadores. Adems, hay que usarlos el mnimo tiempo posible.

5.1.4. Mtodos aplicados a la reeducacin de las dificultades de aprendizaje

La aportacin del enfoque de condicionamiento para la adquisicin del control de estmulos puede
ser til para el enseante o reeducador. Un sector al que se aplican con gran xito es al de los nios
discapacitados en algn rea concreta del aprendizaje: retrasos o deficiencia intelectual, lenguaje, lec-
to-escritura y aritmtica (Hallahan y Kauffman, 1976; Worell y Nelson, 1982, Valls, 1986). Los
mtodos ms usuales son los basados en el control de estmulo mediante el uso de instigadores y des-
vanecimiento, aunque por supuesto tambin se utilizan procedimientos de refuerzo. La estrategia prin-
cipal es la de las intervenciones multimodales, donde los procedimientos operantes sean una parte o
componente ms de los mismos.

5.2. Cambio de un control de estmulo por otro: El cambio fsico de ambiente

En ocasiones un aprendizaje instrumental sealizado puede ser problemtico, es decir, la exposi-
cin a determinados estmulos discriminativos puede provocar respuestas no deseadas. La televisin
provoca la respuesta de entretenerse con ella e impedir que hagamos otras cosas ms necesarias (por
ejemplo, estudiar un examen); el contexto habitual en el que comemos mucho puede ser perjudicial si
queremos adelgazar puesto que esos estmulos "controlan" esa conducta.
Una tcnica aplicada en modificacin de conducta para lograr cambiar un control de estmulo no
deseado es el cambio estimular: si queremos cambiar algn tipo de conducta o hacer que una conduc-
ta deseable (pero difcil de conseguir) sea ms frecuente, conviene rodearse de otro contexto estimular
y disponer otros estmulos discriminativos para la nueva conducta objetivo. As, para la deseable con-
ducta de estudiar, Domjan y Burkhard (1986; p. 319 trad. cast.) proponen los siguientes nuevos est-
mulos discriminativos:
"1. Seleccionar un lugar adecuado para estudiar, con iluminacin adecuada y libre de distracciones.
2. Estudiar en ese lugar y slo en ese lugar (no estudiar en la cama pues esto lleva probablemente a dormir antes que a
estudiar).
3. Permanecer en el rea de estudio slo durante el tiempo que estamos estudiando. Si nos empezamos a distraer, nos te-
nemos que disponer a abandonar el rea de estudio.
4. Antes de abandonar de hecho el rea, completar una pequea unidad de trabajo. Terminar de leer la pgina o comple-
tar un problema".
Se trata pues de convertir el rea de estudio en el nuevo estmulo discriminativo de la conducta de
estudiar.

En esta misma lnea, puede interesar que la respuesta no est controlada por muchos estmulos sino
por uno en particular. El obeso que come mientras ve la televisin o escucha la radio, o habla con
otros, etc. debera comer exclusivamente en la mesa del comedor, a ciertas horas, sin televisin ni ra-
dio, etc.

En definitiva, estos planteamientos permitiran al sujeto un mayor autocontrol y no tanta dependen-
cia de los estmulos y de personas o servicios que proporcionen instigadores.

6. CONDICIONAMIENTO INSTRUMENTAL AVERSIVO

6.1. Introduccin: Tipos de condicionamiento en funcin de la estimulacin
aversiva
6.1.1. Tipos de aversividad

El condicionamiento, sea clsico o instrumental, se realiza muchas veces con estmulos aversivos.
Un estmulo aversivo es lo que en lenguaje cotidiano llamamos estmulo "molesto", "incmodo", "do-
loroso", "desagradable", "nocivo", etc., es decir, su aplicacin al sujeto tiene para l consecuencias ne-
gativas. La aversividad es pues cualquier evento que produzca una percepcin de malestar o desagra-
do.
Proponemos cinco criterios para clasificar o caracterizar los eventos aversivos:

1) Criterio estimulacin aversiva primaria secundaria: Una cosa es la estimulacin que produce do-
lor o malestar fsicos directos y otra las seales o EC o E
D
previamente asociados a estimulacin
aversiva primaria (enchufes, fuego en la cocina, dedos puestos en el quicio de la puerta, nube oscu-
ra que amenaza lluvia, etc.).

2) Criterio estimulacin aversiva directa indirecta: Una cosa es la aplicacin directa de estimulacin
aversiva primaria que produzca dolor o malestar fsico (descarga elctrica en el animal, agresin,
tortura, malos tratos fsicos, hambre, sed, enfermedad, problema irresoluble, etc.) y otra es la au-
sencia del refuerzo esperado.

3) Criterio contingencia o dependencia estimulacin aversiva respuesta: Se trata de la contigidad o
proximidad espacio temporal de una con respecto a la otra, en contraposicin a una relacin con-
tingente o no necesaria, es decir, sin aparente relacin entre un evento y otro. En este caso de la no
dependencia, tenemos la situacin de indefensin aprendida

4) Criterio orden temporal de ocurrencia entre estimulacin aversiva respuesta. Esto ocurre sobre
todo cuando dependencia entre estimulacin aversiva y respuesta, y tenemos dos claras opciones:

- E
av
R (primero estimulacin aversiva y despus la respuesta): Si primero se aplica estimula-
cin aversiva y su cese es contingente con (dependiente de) la aparicin de una respuesta, en-
tonces aumentar la probabilidad de ocurrencia de dicha respuesta. Segn sto, y siguiendo la tra-
dicin skinneriana, esta situacin conlleva refuerzo negativo (refuerza el cese -contingente a la
respuesta- de la estimulacin aversiva, lo cual fortalece y mantiene la respuesta) y es tpico para-
digma de escape. Estas condiciones de refuerzo negativo las podramos simbolizar del siguiente
modo:
E
av
- R No E
av
(Ref. neg.)

- R E
av
(primero respuesta y despus estimulacin aversiva): Si primeramente aparece la res-
puesta y tras ella se aplica contingentemente estimulacin aversiva, entonces disminuir la proba-
bilidad de ocurrencia o incluso se eliminar la respuesta. Esta acepcin sigue la tradicin de
Thorndike y ms tarde se denomin, para distinguirlo del anterior, estimulacin punitiva y se in-
serta en el paradigma de castigo. Se simbolizara:
R E
av

5) Criterio efectos en la respuesta: En psicologa del aprendizaje, un estmulo aversivo se define en
funcin del efecto que produce en la conducta. En general, hay tres efectos en la conducta relacio-
nada con dicha estimulacin:
- Incremento de la tasa de respuesta por refuerzo negativo. Suele ocurrir en situaciones E
av
- R y
por tanto en casos de escape y evitacin
- Disminucin de la tasa de respuesta por estimulacin punitiva contingente. Se trata de situaciones
R - E
av
y es el caso del castigo.
- Aparicin de alteraciones conductuales, emocionales o conductuales, ligadas a la aplicacin de es-
timulacin punitiva contingente y sobre todo no contingente. El efecto de esta modalidad se co-
noce desde Seligman (a mediados de los 60) como indefensin o impotencia aprendida (difcil
traduccin del ingls learned helplessness), en la cual el sujeto recibe estimulacin aversiva ines-
capable. Sera una situacin del tipo:

R - E
av
no conting.

6.1.2. Tipos de condicionamiento con estimulacin aversiva

Como ya se dijo en el Tema 4, los paradigmas o tareas experimentales en los que se ha usado esti-
mulacin aversiva, al menos en el condicionamiento instrumental, son esencialmente cuatro: escape,
evitacin, castigo e indefensin aprendida. En los dos primeros se ha utilizado estimulacin aversiva
en su acepcin de refuerzo negativo; en el tercero se trata ms bien de estimulacin punitiva; en el
cuarto la estimulacin punitiva no es contingente a la respuesta. Los tres primeros pueden incluir di-
versas variantes, sobre todo si se utilizan estmulos discriminativos. En cuanto a la indefensin apren-
dida, algunos manuales de aprendizaje lo citaban como una variedad del castigo (Pelechano, 1980),
aunque desde hace tiempo (Wittig, 1982; Hulse et al., 1982) lo consideran como otro paradigma ms
de aprendizaje con estimulacin aversiva. Algunos han tratado tambin la aversividad resultante de
suprimir o disminuir un reforzador. En estos casos se habla del castigo por supresin, extincin sim-
ple y entrenamiento de omisin. Aunque estos dos ltimos tipos no los trataremos aqu, los esquemas
de las Tablas 1 (adaptada de la expuesta en el Tema 4) y 2 nos resumen todo esto.

Tabla 1: Tipos de condicionamiento con estimulacin aversiva en funcin de los tipos de consecuencias
sobre la conducta y del tipo de relacin R-C.

C O N S E C U E N C I A S / r e s u l t a d o s
P O S I T I V A S
a d q u I s I c I n
N E G A T I V A S (aversivas)
e x t I n c I n
Por cese de
estimulacin aversiva
(ref. negativo)
Por aplicacin Por omisin del
Reforzador

Relacin de
contingencia R - C
SI - Escape
- Evitacin
- Castigo por
aplicacin
(cast. positivo)
- Castigo por
supresin
(cast. negativo)
NO - - Indefensin
aprendida
-

Tabla 2: Presencia de los criterios de clasificacin de los eventos aversivos en los tipos de condiciona-
miento con estimulacin aversiva (Eav).

Criterios
Escape Evitacin Castigo por
aplicacin
Castigo por
supresin
Extincin Indefensin
aprendida
Eav. Primaria
Eav. Secundaria
Si

Si
Si
Si
Si
Eav. directa
Eav. indirecta
Si Si Si
Si

Si
Si

Eav. contingente
Eav. no contingente
Si Si Si Si Si
Si
Orden temp. Eav.-R
Orden temp. R-Eav.
Si Si
Si

Si

Incremento de R
Disminucin de R
Alteraciones de R
Si Si
Si
Si

Si

Si

Si
Si

6.2. Condicionamiento de escape
6.2.1. Definicin

En el procedimiento de escape, ante la aparicin de estimulacin aversiva, el organismo emite una
respuesta que logra el cese de dicha estimulacin. O sea, la respuesta del organismo hace que cese el
estmulo aversivo. Por tanto, dicho cese es contingente o dependiente de la realizacin de la respuesta
y con ello, tras repetidas presentaciones de estimulacin aversiva, se logra usualmente un aumento de
frecuencia de la respuesta. El cese del estmulo aversivo (gracias a la respuesta) es el evento crucial
que se convierte en un reforzador negativo. La representacin simblica del procedimiento de escape
es la siguiente:

E
av
- R No E
av

Ms en detalle, supondra una secuencia con dos fases seguidas:
1) Una R1 provoca la Eav y la consecuencia 1 de dao o dolor
2) Una R2 de escape provoca una consecuencia 2 de cese de Eav y alivio


En el futuro, el sujeto aprende a no hacer R1. Es un tipo de aprendizaje que se logra con rapidez y
es muy adaptativo. Todos escapamos de circunstancias aversivas y procuramos que esa experiencia
desagradable no nos vuelva a ocurrir: un nio aprende a no tocar una estufa encendida si alguna vez se
quem con ella, o sea R1 (tocar estufa encendida) Eav (calor fuerte) Consecuencia 1 (de dao o
dolor) R2 escape (retirar mano) Consecuencia 2 de cese Eav (alivio). Ms ejemplos: una perso-
na que se encuentra en un ambiente donde hay excesivos ruidos presenta comportamiento de escape
simplemente alejndose del lugar donde se emite el ruido; si empieza a llover y te mojas rpidamente
abres el paraguas (y si no lo tienes te resguardas en un portal), con lo cual cesa la estimulacin aversi-
va, la respuesta tiene una consecuencia positiva y se refuerza para el futuro.
Los procedimientos y tcnicas experimentales ms utilizados en la investigacin de la conducta de
escape aparecen resumidos en el Cuadro 1.

6.2.2. Condiciones o factores en la adquisicin de la conducta de escape

Citaremos slo dos de los ms importantes:

1) Intensidad del estmulo aversivo: Cuanto ms fuerte sea la estimulacin aversiva mejor se aprende
la conducta de escape. Esto se relaciona directamente con la magnitud del reforzador: como aqu es
un refuerzo negativo, lo importante es la disminucin relativa de intensidad del estmulo aversivo
tras la respuesta.
2) Retraso en la eliminacin del estmulo aversivo: Cuando se elimina el estmulo aversivo poco des-
pus de que el sujeto emita la respuesta, esta demora en la aparicin del refuerzo negativo produce
una disminucin en el rendimiento de los sujetos en la conducta de escape.

Cuadro 1: Procedimientos experimentales de adquisicin de la conducta de escape.
En animales

Aparatos

Un primer procedimiento con animales fue el utilizado por Muenzinger y Fletcher en 1936. Se trata de un laberinto en
forma de T con el suelo electrificable. Se coloca al animal (normalmente ratas) en la base de la T y se le dan shocks hasta
que gire por el brazo deseado (izquierdo o derecho). En cada ensayo se mide o bien el tiempo que tarda o el nmero de
elecciones incorrectas de brazo. Despus de 100 ensayos se consigue un ptimo entrenamiento de escape con este pro-
cedimiento.

Posteriores estudios llevaron a otros procedimientos usando aparatos en los que pueden presentarse series largas de
ensayos (presentaciones de E
av
) en intervalos apropiados sin que se tenga que sustituir al sujeto. Dos han sido los ms
usuales:
- La caja de Skinner con suelo electrificado, de forma que la presin de la barra (R) haga que cesen los shocks elctricos.
- El aparato ms usado para el estudio del condicionamiento de escape es la caja de saltos o lanzadera (shuttle box), que
ya se encuentra en los experimentos clsicos de Mowrer (1938, 1939). Dicha caja (como se puede apreciar en la Figura
10a, o en una versin actual en la Figura 10b) es una cmara con dos compartimentos donde la respuesta operante que
se mide es el movimiento desde un compartimiento a otro (usualmente el movimiento en cualquiera de las dos direccio-
nes cuenta como una respuesta). Una variante ms actual es una sola cmara con la rejilla basculante: cuando el animal
est en un lado, la rejilla toca el suelo y cierra el circuito elctrico para administrar la descarga, que cesar cuando salte
al otro lado. Este aparato tambin se utiliza en el aprendizaje de evitacin.

Estmulos

El estmulo aversivo es usualmente shock elctrico aplicado a travs de la parrilla de alambre del suelo. La conducta de
escape se adquiere rpidamente en dicho aparato, posiblemente porque la respuesta operante requerida (saltar) est rela-
cionada directamente con la conducta incondicionada elicitada por el shock.

Tipos de medida

La medida del escape suele ser, segn Fernndez Castro (1989), o bien latencia (tiempo desde el inicio del estmulo
aversivo al inicio de la respuesta) o magnitud de respuesta (velocidad de carrera o presin de palanca en caja de Skinner).

En humanos

Con humanos la respuesta elegida suele ser de tipo manipulativo (a menudo enmascarada la tarea con problemas de
discriminacin) y como estimulacin aversiva, adems de la descarga elctrica de baja intensidad, se utilizan ruidos fuertes
y molestos o incluso alguna tcnica similar a las del castigo por supresin de reforzador (vase el apartado correspondien-
te de este captulo).

Figura 10: Lanzadera o caja de saltos, en versin antigua (a) o actual (b)

6.3. Aprendizaje de evitacin
6.3.1. Definicin, fases en la adquisicin, tipos y procedimientos

La evitacin es uno de los fenmenos ms estudiados en el condicionamiento con estimulacin
aversiva. Una conducta se llama de evitacin cuando impide la confrontacin del sujeto con un acon-
tecimiento que tiene caractersticas aversivas. Es decir, el efectuar una respuesta pospone o elimina la
estimulacin aversiva. De otro modo podemos decir que ocurrir un E
av
a no ser que aparezca la res-
puesta. Se producir el aprendizaje de evitacin si dicha contingencia lleva a un aumento de la fre-
cuencia de respuesta, con lo cual el cese del estmulo tiene propiedades de reforzador negativo para la
respuesta.

Los primeros estudios sobre evitacin provienen, segn Domjan y Burkhard (1986), de Bechterev
(1913) dentro del condicionamiento pavloviano. Su experimento se realiz con humanos y consista en
pedirles que introdujeran un dedo (R instrumental) en un recipiente de metal. Al hacerlo se haca sonar

un zumbido de aviso (EC) y al estar el agua electrificada sufran una descarga elctrica (EI). Lgica-
mente la retirada del dedo (R de evitacin) era inmediata y en sucesivos ensayos el inicio del EC per-
mita no sufrir EI. Parece condicionamiento clsico pero no lo es puesto que en aqul el EI ocurre in-
dependientemente de la respuesta mientras que aqu la respuesta instrumental impide su aparicin.

La diferencia entre escape y evitacin estara en que en sta ltima la respuesta pospone o elimina
una estimulacin aversiva que todava no ha ocurrido. En la conducta de escape siempre se aplica es-
timulacin aversiva al sujeto mientras que en la evitacin basta con la presentacin de un E
D
(EC en
trminos de condicionamiento clsico) que de alguna manera evoque (por asociacin previa EC-EI
aversivo) la estimulacin aversiva. Adems, en la situacin de escape, la supresin de estimulacin
aversiva ocurre tan pronto como se emite la respuesta, mientras que en la evitacin se previene la apli-
cacin de estimulacin aversiva mediante la respuesta.

As, por ejemplo:
- un baista se aplicar bronceador (R) para evitar quemaduras en la piel (E
av
) por el sol al llegar a la
playa (E
D
);
- los conductores obedecen las seales de trfico para evitar accidentes o multas;
- E
D
(da nuboso): R (llevar sombrilla) No E
av
(evitacin de la lluvia). O sea, no es necesario que nos mo-
jemos por la lluvia al salir de casa (E
av
) para que cojamos la sombrilla (R); basta con que veamos el
da muy nuboso (E
D
).

As pues, en la evitacin tenemos seales del entorno que por aprendizaje previo son aversivas; se
podra decir, por tanto, que la evitacin es una conducta motivada por el miedo (Gray, 1988; trad. cast.
1993, p. 132). El sujeto aprende a darle un significado atemorizante a determinadas seales del entor-
no. Podemos decir que en el paradigma de evitacin, el sujeto "escapa" o reacciona no ante la presen-
cia de la estimulacin aversiva en s, sino ante los estmulos discriminativos (EC) que sealizan la pos-
terior presencia de estimulacin aversiva (EI), y por tanto el miedo (RC) provocado por esos estmulos
sealizadores es la emocin que motiva la conducta de evitacin. Al emitir esa conducta, el miedo se
reducir, lo cual supone un refuerzo negativo para esa conducta de evitacin. Hay que notar que el
miedo tiene un doble valor aqu: es una respuesta del sujeto condicionada a una determinada situacin
estimular, pero tambin es en s un estmulo aversivo del que el sujeto hace por escapar (con lo cual
evita el estmulo posterior que el miedo anticipa).

Aunque se explica ms adelante en la teora bifactorial de Mowrer, parece evidente que el estable-
cimiento de la conducta de evitacin necesita dos fases:
- Una fase previa, en la que un determinado estmulo adquiere un significado aversivo de algo que an-
tes no tena. Puede ser un escape sealizado, esto es, tener la experiencia del par E
D
- E
av
, o, si se
quiere en la terminologa del condicionamiento clsico, la experiencia EC-EI
av
; o puede ser una res-
puesta castigada (R- E
av
). Si es el primer caso, tendremos la evitacin activa (hago algo tras la seal
para evitar E
av
) y si es el segundo, la evitacin pasiva (no vuelvo a hacer R para evitar E
av
), como
analizaremos enseguida. En cualquier caso, es caracterstico de la evitacin que se adquiere con muy
pocos ensayos de este tipo, incluso basta con un aprendizaje vicario u observacional.

- La fase propiamente de evitacin, en la que el evento (estmulo o respuesta) con significado aversi-
vo, por s solo y sin necesidad de que aparezca la estimulacin aversiva, produce la respuesta de evi-
tacin.

Se han descrito (Gray, 1988; Klein, 1991) dos tipos de aprendizaje de evitacin: la evitacin activa
y la pasiva.

a) Evitacin activa

Se trata de realizar una conducta que, ante la correspondiente seal atemorizante, impida o preven-
ga la estimulacin aversiva. Abrir el paraguas ante seales de lluvia, el nio que hace los deberes para
no suspender el examen, pagar el alquiler para evitar que nos echen del piso, caminar por la acera para
que no me atropellen los coches, etc. El sujeto aprende pues un comportamiento nuevo: realizar una
determinada accin para no tener una experiencia desagradable.
Una descripcin muy interesante es la de Gray (1988; trad. cast 1993, p. 134) poniendo ejemplos
de animales: El animal quiere que se le deje en paz (...) pero alguien (el domador de circo, el psiclo-
go experimental) desea que adquiera alguna nueva forma de conducta. El domador somete al animal al
estmulo temido y retira ese estmulo slo si el animal realiza la conducta deseada. En otras palabras,
es castigado por hacer cualquier otra cosa que no sea la respuesta deseada. Es como si le advirtiera al
animal: Haz esto, o si no.... En trminos coloquiales, la evitacin activa sera saber lo que hay que
hacer para no sufrir algo malo.

b) Evitacin pasiva

Aqu la conducta impide exponerse a un acontecimiento aversivo. Un ejemplo de Klein (1991; trad.
cast. 1994, p. 211) es muy ilustrativo: Imagnate que recibes una carta del dentista recordndote que
debes realizar un chequeo semestral (...); no respondiendo a la carta, evitas al dentista. Es decir, se
abandona un tipo determinado de actividad porque tenemos experiencia de que va seguida de una con-
secuencia desagradable.
Siguiendo con ejemplos de animales, Gray (op. cit.) dice que, en la evitacin pasiva, el animal
quiere hacer algo y esta accin le conduce a ponerse en contacto con el estmulo atemorizante. La ni-
ca forma de evitar el estmulo temido es abandonar la conducta deseada. Por ejemplo, un animal
hambriento busca comida, pero si toca la comida puede que se le aplique una descarga elctrica. Hay
pues dos fases:
- Fase previa: Tras E
D
se produce la respuesta y entonces recibe estimulacin aversiva (es pues una
experiencia previa de castigo)
- Fase actual: Al aparecer E
D
entonces el sujeto no produce la respuesta

Como dice Gray, es como si se advirtiera al animal: No hagas eso, o si no.... Tambin en trmi-
nos coloquiales, la evitacin pasiva consistira en saber lo que hay que dejar de hacer para no sufrir
algo malo (aunque me guste).
La evitacin pasiva es pues la consecuencia posterior de una conducta previamente castigada. Una
respuesta que es castigada, en el futuro ser evitada aprovechando las seales externas (E
D
) o internas
(recuerdo de la experiencia) que conducen a ella. Sera una secuencia que esquemticamente se podra
expresar:

(E
D
) Expectativa de R-E
av
No realizacin de R

El mismo autor sugiere que la evitacin pasiva en realidad es un conflicto de aproximacin - evita-
cin. En efecto, el sujeto est solicitado, mediante seales procedentes del medio, por dos formas de
conducta incompatibles entre s:
- aproximarse a un objeto o estmulo deseado, interesante o apetecible
- mantenerse alejado de l (pues hay experiencia previa de que produce algo aversivo)
Volviendo al ejemplo del dentista: Quiero ir al dentista para solucionar los problemas que tengo
con mi dentadura (aproximacin) pero no voy a ir pues me da miedo, hace dao, etc. (evitacin).

Dos tipos de procedimientos experimentales muy utilizados, al menos en la evitacin activa han
sido: la evitacin discriminativa de ensayos discretos y la tcnica de evitacin de Sidman o de operan-
te libre. El Cuadro 2 describe detalladamente estas tcnicas


6.3.2. Condiciones para la adquisicin de la respuesta de evitacin

1) Intensidad de estimulacin aversiva: Generalmente a mayor intensidad corresponde un mayor ren-
dimiento en la respuesta de evitacin.

2) Intensidad y duracin de E
D
: Cuanto ms intensa sea la seal que precede a la estimulacin aversiva
mayor rendimiento se dar en la respuesta de evitacin.

3) Intervalo E
D
-Eav (en trminos pavlovianos, EC-EI, intervalo entre estmulos, IEES): Perodos de
tiempo ms largos, por lo general producen mejores niveles de ejecucin, y si adems se vara el in-
tervalo E
D
-Eav alrededor de algn valor promedio (en vez de mantenerlo fijo a lo largo de los ensa-
yos), entonces produce an mejor rendimiento (tal vez porque las variaciones en la ejecucin pro-
ducen mayor atencin por parte del sujeto).

4) Intervalo entre ensayos (IEEN): La ejecucin vara segn una curva en forma de U invertida con
mejores respuestas a medida que se incrementa el intervalo hasta cierto punto, disminuyendo des-
pus al incrementarse ms an el valor del IEEN.

Cuadro 2: Procedimientos experimentales para la adquisicin de la conducta de evitacin

1) Evitacin discriminativa de ensayos discretos

En este tipo hay un E
D
por el cual la ejecucin de la respuesta pospone o evita la estimulacin aversiva. En el laboratorio
se us por primera vez en un experimento de Brogden, Lipman y Culler en 1938, en el cual una seal discriminativa (E
D
)
precede a cada shock. Despus, la respuesta durante el aviso E
D
impide la aplicacin de la descarga. Las respuestas du-
rante el intervalo entre ensayos no tienen efecto. Cada shock ser evitado si una respuesta ocurre durante cada E
D
(el
cual desaparece tambin al emitirse la respuesta). La Figura 11 nos muestra un diagrama de dicho procedimiento.

R

E
D

Shock

Figura 11: Diagrama del procedimiento de evitacin discriminativa.

En general, con la evitacin discriminativa se ha seguido el procedimiento experimental de ensayos discretos o sepa-
rados: un ensayo comienza siempre con la aparicin de E
D
y termina con la emisin de la respuesta. Normalmente con
animales (perros, ratas) se usa la caja de saltos. El experimentador puede exigir al animal que salte alternativamente de un
compartimiento a otro para evitar el shock (procedimiento llamado "evitacin de doble direccin" o de vaivn) o bien puede
exigir simplemente un salto en una direccin y, una vez ejecutado el salto, sacar al animal del segundo compartimiento pa-
ra volver a colocarlo en el primero al comienzo del ensayo siguiente ("evitacin en una direccin").

2) Evitacin tipo Sidman o de "operante libre".

Este tipo de evitacin la inici experimentalmente Sidman en 1953 con el procedimiento que lleva su nombre. En este
caso, la estimulacin aversiva se aplica a intervalos regulares (segn un programa IF) a no ser que ocurra la respuesta,
con lo cual se pospone dicha estimulacin aversiva durante cierto intervalo de tiempo (tambin fijo). Si la siguiente res-
puesta ocurre antes de que finalice dicho intervalo R-E
av
, se vuelve a posponer el E
av
, y as sucesivamente es como evi-
tar la estimulacin aversiva. En este procedimiento, la seal discriminativa es el intervalo fijo, la pauta regular de aparicin
de la estimulacin aversiva.

E
D

E
D

E
D
E
D
E
D

5) Respuestas de defensa especficas de especie: Se hicieron experimentos donde se variaba el tipo de
respuestas que deba dar el animal para evitar la estimulacin nociva, y se encontr que las respues-
tas de evitacin exigidas deban ser compatibles con el tipo de estimulacin y acordes con las res-
puestas naturales en la especie animal que aprende, pues de otra manera no eran aprendidas.
Bolles y otros (Bolles, 1969; D'Amato y Schiff, 1964; Meyer, Cho y Weseman, 1960) fueron
los autores de este tipo de experimentos y llegaron a esta misma conclusin: no todas las respuestas
son igualmente condicionables. Las ratas, en una situacin aversiva aprendan bien una respuesta
de salto o de carrera, pero no una conducta esttica (por ejemplo, permanecer sentadas sobre las pa-
tas traseras).
Para explicar este fenmeno contrario a las leyes tradicionales del aprendizaje (vase la ley de
equipotencialidad, en el Captulo 1), Bolles acu el trmino de reaccin de defensa especfica de
especie (RDEE), segn la cual, un animal aprende una respuesta de evitacin slo si dicha respues-
ta es parte de las reacciones defensivas naturales innatas de dicho animal.
El concepto de preparacin (preparedness), acuado por Seligman (1970), viene a incidir en el
mismo tema. Con ello se quiere indicar que un animal puede estar preparado, no preparado o con-
trapreparado para aprender determinadas respuestas. La contrapreparacin se manifiesta cuando el
organismo muestra una resistencia extrema a aprender algo (la conducta esttica de las ratas, antes
mencionada). Se trata de un concepto operativo que se puede medir a travs del nmero de ensayos
que se necesitan para lograr que esa respuesta sea aprendida.

6) Adquisicin de respuestas de evitacin mediante acoplamiento con otras y/o con refuerzos: Sobre
todo en el mbito de la interaccin social humana, es muy frecuente encontrar situaciones en las
cuales determinadas conductas de evitacin de unos sujetos se potencian por las conductas de evi-
tacin de otros. Por ejemplo pensemos en una interaccin entre dos sujetos, A y B, que sigue el si-
guiente esquema:

Sujeto A: E av. R E ref. neg. Con la prctica, R ser R ev.

Sujeto B: Eav. R ev.

Un ejemplo tpico se da en la interaccin entre nios y padres: Lo que para un sujeto A (beb) no es
ms que emitir una conducta de llanto por un estmulo aversivo interno suyo (tiene molestias digesti-
vas, etc.), para un sujeto B (padre o madre) esa respuesta a su vez es un estmulo aversivo que provoca
en l: (1) una actividad mental encubierta de formacin de hiptesis, atribuciones, etc. (por qu llo-
ra?: porque no ha dormido, porque tiene hambre, etc.), y (2) una conducta manifiesta de evitacin
(alejarse del nio, llamar a la madre, mecer la cuna, etc.) que hace de refuerzo negativo para el sujeto
B si cesa de llorar y as consolidarse su recuerdo procedimental y/o declarativo (para que no llore ya
s que tengo que mecerlo). A su vez, para el nio, su conducta de llanto por estimulacin aversiva in-
terna cesa cuando otros le solucionan el problema, con lo cual se refuerza el llanto como futura con-
ducta de evitacin ante esa molestia. Ms ejemplos se pueden encontrar en Steiner (1988).

6.3.3. Por qu ocurre la evitacin (teoras explicativas)

Hay varios problemas difciles de resolver a la hora de explicar la evitacin: Cmo es posible que
la no ocurrencia de un estmulo pueda ejercer un efecto fortalecedor para la conducta? qu aconteci-
miento en la situacin de evitacin podra responsabilizarse de la adquisicin de la conducta?.
Son varias las teoras que se han propuesto para explicar la evitacin (Fernndez Castro, 1979). Pe-
lechano (1980) cita hasta cuatro de ellas y en general se caracterizan porque:
- postulan o hacen referencia a procesos mediacionales (tales como el miedo),
- admiten la intervencin de dos procesos de aprendizaje: condicionamiento clsico e instrumental. De
ah que muchas de ellas se llamen teoras bifactoriales o biproceso.

Tudela (1981), coincidiendo en cierto modo con Tarpy (1975) y a Tarpy y Mayer (1978), agrupa
estas teoras en dos tendencias:
- la de los tericos del reforzamiento (que acentuaron la importancia de la motivacin interna del or-
ganismo),
- la de los skinnerianos (que se fijaron ms en el papel de la estimulacin externa).

La primera se referir a la teora bifactorial clsica de Mowrer, reformulada despus por Miller,
Kamin, Solomon, Wynne, etc. La segunda se centra en la revisin de Schoenfeld, con su modelo de re-
fuerzo sin motivacin. La misma teora bifactorial ha experimentado reformulaciones recientes de tipo
cognitivo. Veamos pues, estos dos tipos de teoras en tres apartados: la teora bifactorial en su formu-
lacin clsica, la teora del refuerzo sin motivacin y la actual reformulacin cognitiva de la teora bi-
factorial.

a) Teora bifactorial de Mowrer

Segn Mowrer (1947) -con reelaboraciones posteriores de Miller (1951, 1959) y del propio Mow-
rer (1960)- el hecho cuya ocurrencia activa la respuesta de evitacin es el miedo, el cual acta como
un impulso (drive) que proporciona energa a la respuesta de evitacin y refuerzo negativo al cesar con
ella mediante su reduccin. Pero el miedo al E
D
en este caso no es un impulso primario sino adquirido
por condicionamiento clsico. El miedo es por tanto una RC al E
D
(que acta como EC) que se adquie-
re por el apareamiento previo de E
D
con el EI aversivo. Hay pues dos fases:

I) E
D
(= EC) E
av
(=EI) RI (miedo)

II) E
D
RC (miedo) R instr. cese E
D
(ref. neg.)

Durante los primeros ensayos en que la respuesta de evitacin todava no ha sido aprendida, el apa-
reamiento E
D
-E
av
produce el condicionamiento de miedo al E
D
. De este modo el condicionamiento
clsico del E
D
proporciona un significado de motivacin y emotividad aversiva a estmulos inicialmen-
te neutros (Gray, 1988; trad. cast. 1993, p. 196). Despus, en la segunda fase, la sola presencia del E
D

provoca el miedo, lo cual activa la respuesta instrumental. La ejecucin de la respuesta hace cesar el
E
D
(ste cese contingente sera un factor crtico), con lo cual desaparece o disminuye el miedo y se re-
fuerza la respuesta. La respuesta instrumental se aprende no por evitar la estimulacin aversiva sino
por escapar al miedo al cesar el E
D
con dicha respuesta
Ha sido una teora muy estudiada y con gran soporte y evidencia experimental. Incluso ha sido me-
jorada con los aos. Por ejemplo, hoy da se considera (Gray, 1988; trad. cast. 1993, p. 208) que el
comportamiento de evitacin es reforzado no slo por la reduccin del miedo al cesar E
D
, sino tambin
por la aparicin, tras la respuesta, de seales de seguridad, que son estmulos presentes tras la respues-
ta de evitacin, por ejemplo en animales en la caja de saltos, el feedback cinestsico o propioceptivo
tras el salto, la llegada al otro lado, etc. Son reforzadores secundarios pues aparecen siempre conjun-
tamente con el refuerzo negativo (cese de la seal condicionada aversiva).

Esta teora ha sido aplicada en el contexto clnico a la explicacin de ciertas neurosis, particular-
mente fobias. As, no hay ms que entender la respuesta instrumental de evitacin como la conducta
neurtica, la cual es mantenida porque con ella cesa el miedo o la ansiedad que se ha condicionado
fuertemente al E
D
.

b) Teora de refuerzo sin motivacin de Schoenfeld

Segn Schoenfeld (1950), el miedo es un proceso mediacional inobservable (y por tanto inestudia-
ble desde una ptica conductista). El cese del estmulo aversivo con la respuesta acta como refuerzo
negativo aumentando la probabilidad de la respuesta que lo suprime. En virtud de su frecuente asocia-
cin con el estmulo aversivo, el E
D
se convierte en estmulo aversivo condicionado, adquiriendo as
las caractersticas aversivas del shock. El sujeto escapa del E
D
(sin embargo, en la teora de Mowrer el
sujeto escapa del miedo suscitado por el E
D
).
Tambin se trata de una teora bifactorial pues el E
D
es refuerzo condicionado por condicionamien-
to clsico y la respuesta de evitacin es instrumentalmente reforzada por la terminacin del E
D
.
En realidad, ambas teoras reducen la situacin de evitacin a un problema de escape. Segn Mow-
rer, el sujeto escapa del miedo, o del E
D
segn Schoenfeld. En ambos casos, el acontecimiento refor-
zador observable es el cese del E
D
.

c) Reformulacin cognitivo-social de la teora bifactorial

Desde la teora de las expectativas de auto-eficacia de Bandura (1977, 1986), se ha replanteado re-
cientemente la teora bifactorial, al menos en su aplicacin a humanos (Villamarn, 1990). Segn esta
teora, tanto la activacin de RC autonmica de miedo como la emisin de respuestas de evitacin de-
penden no slo de la activacin de expectativas adversas (el EC seala un prximo acontecimiento
aversivo) sino sobre todo de la "competencia percibida" de tener capacidad para hacer frente a esa po-
sible adversidad. Si el individuo percibe que dispone de conductas de afrontamiento y genera as ex-
pectativas de auto-eficacia, entonces habr menor miedo o ansiedad. Por tanto, lo que produce el mie-
do y la ansiedad no es el proceso de condicionamiento clsico previo sino las cogniciones o expectati-
vas de resultados y las expectativas acerca de la propia eficacia para afrontarlos.

6.3.4. Extincin de la respuesta de evitacin

En este apartado analizaremos slo la extincin de conductas adquiridas por procedimientos de re-
fuerzo negativo (estimulacin aversiva, previa a la conducta, que cesa al producirse sta), o sea, la ex-
tincin de conductas de escape y de evitacin. El castigo tambin podra considerarse una tcnica de
extincin pues permite la disminucin o eliminacin de conductas, pero por conveniencia metodolgi-
ca slo se incluye como tcnica de extincin a cualquiera que no utilice estimulacin aversiva directa
para lograrlo.
Respecto a la conducta de escape, al necesitar la aplicacin de estimulacin aversiva previa a la
respuesta, su extincin no reviste problemas si se elimina la posibilidad de que aparezca estimulacin
aversiva o si la respuesta no permite que cese la estimulacin aversiva. Sin embargo, la extincin de la
conducta de evitacin es ms compleja y por eso la trataremos ms ampliamente a continuacin.

a) Evidencia y teoras sobre la persistencia de la conducta de evitacin

Diversos autores coinciden al afirmar que la conducta de evitacin, como conducta defensiva
(Bandura, 1969) ante situaciones ambientales aversivas, debe explicarse no slo mediante un anlisis
conductual sino tambin mediacional cognitivo. Segn un mero anlisis conductual, para lograr la ex-
tincin bastara con eliminar la contingencia entre el E
D
y el Eav, es decir, presentar el E
D
sin Eav poste-
rior. Sin embargo, esto no es eficaz para la extincin. En realidad, lo que se observa es una extraordi-
naria persistencia de la conducta de evitacin o, si se quiere, una gran resistencia a la extincin. Los
primeros en demostrarlo experimentalmente fueron Solomon, Kamin y Wynne (1953). Estos autores
entrenaron a unos perros en la conducta de evitacin en una caja de saltos bidireccional. En esta situa-
cin, tras slo 10 ensayos de adquisicin EC-EI (EC= reduccin en la intensidad de la luz; EI= des-
carga elctrica; intervalo EC-EI= 10 segundos; se daba una descarga elctrica si no saltaban antes de

10 segundos en cada ensayo) no se produjo extincin durante 20 das a razn de 200 ensayos de extin-
cin diarios.

La extincin de la conducta de evitacin es pues sumamente difcil y si pensamos en las fobias co-
mo conductas de este tipo ante ECs anormalmente aversivos y la dificultad para eliminarlas, podremos
comprender la importancia de este tema. Hay ms ejemplos cotidianos que tendran su explicacin de-
ntro de estas cuestiones de la conducta de evitacin. As, Gray (1988; trad. cast. 1993, p. 211) sostiene
que el aprendizaje de evitacin est implicado en el establecimiento de formas de comportamiento
(tanto grupales como individuales) muy persistentes en el hombre. Ejemplos sociales o grupales tene-
mos: la disciplina militar, formas de comportamiento ritual propias de algunas religiones o sectas; un
ejemplo de comportamiento ritual individual es el comportamiento obsesivo-compulsivo. En estos ca-
sos tenemos dos elementos:
- Una serie de acciones o conductas que deben realizarse (sean razonables o absurdas, necesarias o in-
tiles, sencillas o dificilsimas).
- La omisin de estas conductas se castiga desde el primer momento (desde la infancia en el caso del
obsesivo-compulsivo), conduciendo a una gran ansiedad posterior, de modo que aunque ya sea im-
probable el castigo (el grupo opresor, la institucin en la que se aplicaba el castigo, etc.), cualquier
seal del entorno condicionada a ello seguir activando al menos el miedo o la ansiedad, y con ello la
necesidad de llevar a cabo las conductas de evitacin correspondientes (rituales, etc.).

La evitacin incluye pues otros componentes mediacionales decisivos para explicar su anormal
persistencia o resistencia a la extincin, entre ellos la aparicin en su formacin de un estado emocio-
nal de temor, miedo y ansiedad que desde la teora bifactorial de Mowrer se sabe que surge como RC
interna al EC aversivo y de manifestacin previa a la respuesta de evitacin.
Para explicar esta resistencia a la extincin de la respuesta de evitacin, Solomon y Wynne (1954),
en consonancia con la teora bifactorial de Mowrer, formularon el Principio de conservacin de la
ansiedad. Este principio nos dice que el EC aversivo suele durar muy poco por la rpida aparicin de
la respuesta de evitacin, con lo cual casi nunca se emite plenamente la RC de temor o ansiedad, y as
es como sta se preserva y no se logra extinguir; parece pues que si se lograse extinguir la RC de mie-
do o ansiedad, tambin se extinguira la respuesta de evitacin.

b) Procedimientos para acelerar la extincin de la conducta de evitacin

Se han ensayado experimentalmente diversos procedimientos, algunos de los cuales pasaron a la
aplicacin clnica. Describiremos aqu los ms importantes.

SATURACIN DE EC Y BLOQUEO DE RESPUESTA: LA TCNICA DE INUNDACIN

Esta tcnica, ya empleada por Solomon et al. (1953), es denominada tambin "exposicin forzada
mediante prevencin de respuesta" segn Bandura (1969), y su derivacin clnica se conoce con el
nombre de inundacin (flooding). Consiste en impedir la respuesta de evitacin al presentar repetidas
veces el EC temido en ausencia del EI. De esta forma, la RC de temor se emite varias veces con toda
su fuerza y se extingue. Segn Shipley (1974), lo importante es el tiempo total de exposicin al EC y
tambin el aprendizaje de una nueva respuesta (la de inmovilidad) que interfiere con la respuesta de
evitacin. Aunque ninguna de estas teoras ha sido del todo convincente, lo cierto es que este procedi-
miento produce una rpida extincin, aunque no est exento de efectos secundarios (alteraciones
somticas por la intensidad de la emocin vivida, etc.).
Se han investigado las distintas condiciones que afectan a la extincin mediante inundacin, y
segn Tarpy (1981; trad. 1986, p. 363) seran las siguientes:
- Grado de control ejercido por el sujeto durante la inundacin: Si el sujeto puede controlar la termi-
nacin del EC mediante la respuesta de evitacin, la extincin ser ms lenta que si no existe tal con-
trol (Katzev y Berman, 1974).
- Tiempo de exposicin al EC: Cuanto mayor sea la duracin total de exposicin al EC o el nmero de
ensayos de EC, mejor ser la extincin (Shipley, 1974; Bersh y Keltz, 1971).
- Intensidad del EI: Cuanto mayor sea la intensidad peor extincin (Baum, 1969).

TERMINACIN DEL EC DESPUS DE LA RESPUESTA DE EVITACIN

Segn Adams (1980; trad. 1983, p. 120), si el EC durante la fase de extincin se retrasa ms all de
la terminacin de la respuesta de evitacin, entonces el sujeto podr distinguir (discriminar) esta fase
de la de adquisicin (en que el EC terminaba al comenzar la respuesta de evitacin). Katzev (1967)
realiz un experimento para comprobar la eficacia de este mtodo utilizando ratas en una caja de saltos
(donde EC = zumbador + luz, y EI = descarga elctrica). En los 200 ensayos de adquisicin los anima-
les evitaban la descarga saltando (respuesta de evitacin) en los 5 segundos iniciales del EC (tras el
salto cesaba el EC). Durante la fase de extincin hizo dos grupos: en el grupo I el EC terminaba con el
inicio de respuesta de evitacin o a los 5 segundos si no ocurra la respuesta de evitacin. En el grupo
II el EC continuaba 20 segundos despus de la respuesta de evitacin. Los resultados mostraron una
menor resistencia a la extincin en el grupo II. De todas formas el experimento no est exento de crti-
cas pues el grupo II tuvo una mayor exposicin al EC y, como vimos en la tcnica de inundacin, eso
es un factor decisivo.

CASTIGO DE LA RESPUESTA DE EVITACIN: CONDUCTA AUTOPUNITIVA

Tambin Solomon et al. (1953) aplicaron este mtodo consistente en aplicar estimulacin aversiva
al emitir la respuesta de evitacin durante la extincin. Pero paradjicamente el efecto de esta tcnica
fue justo el contrario: aumenta la emisin de respuesta de evitacin, a pesar de que cuanto ms res-
ponda el sujeto ms castigo recibir. Este fenmeno se ha denominado conducta de "crculo vicioso",
"autopunitiva" o "masoquista", y se ha estudiado ampliamente en aprendizaje animal.

Varias teoras han intentado explicar este fenmeno:
- La explicacin basada en la teora bifactorial dice que el castigo durante la extincin mantiene y au-
menta el nivel de temor o miedo, lo cual hace que persista la conducta de evitacin y al castigar sta
aumenta el miedo y la conducta de evitacin, y as sucesivamente.
- Otra explicacin, llamada "teora de la confusin", segn Tarpy (1981; trad. 1986, p. 371), se basa
en una falta de discriminacin entre adquisicin y extincin. Normalmente durante la extincin no
debe aparecer el EI -como ocurra durante la adquisicin-, pero al hacerlo se confunde esta fase con
la de adquisicin y por tanto no se puede discriminar ambas fases.

Ambas hiptesis son compatibles, segn Dreyer y Renner (1971) y desde luego permiten concluir
que no estamos ante un buen mtodo de extincin de la respuesta de evitacin.

EXPOSICIN GRADUADA AL EC

Se trata de introducir el EC progresivamente (en presentaciones de menor a mayor aversividad) de
forma que no provoquen respuesta de evitacin. Es un procedimiento citado por Bandura (1969) y que
combinado con procedimientos de contracondicionamiento es la base de tcnicas tales como la desen-
sibilizacin sistemtica.


6.4. Castigo
6.4.1. Definicin, caractersticas y lneas de investigacin
a) Definicin y caractersticas

El castigo es un procedimiento en el cual una conducta establecida (previamente adquirida por
condicionamiento de recompensa) es seguida por la presentacin de un estmulo o suceso aversivo (o
la supresin de un suceso positivo), de forma que se logra reducir su frecuencia o se suprime. Aqu la
estimulacin aversiva no funciona como reforzador negativo sino como estmulo punitivo. No ocurre
antes de la respuesta sino que le sobreviene al sujeto tras ella.
Su representacin simblica, siguiendo a Millenson y Leslie (1979) es bien sencilla:

R E
av

Conviene, sin embargo, distinguir la definicin tcnica del castigo de su uso cotidiano. En el pri-
mer caso, se incluyen las condiciones adecuadas para el resultado de disminucin o supresin de la ta-
sa de respuesta. En el segundo caso, a veces se dan las condiciones necesarias de efectividad y otras
veces no e incluso de efectividad pero cuya aplicabilidad es tica y jurdicamente inviable (maltrato
fsico, etc.). As, debe puntualizarse que el castigo no implica necesariamente dolor o coaccin fsicos,
no es slo una pena impuesta por la ejecucin de un acto determinado. Por otra parte, muchas veces se
aplica el castigo sin una relacin contingente con la respuesta; sirvan como ilustracin los siguientes
ejemplo:
- A los nios a veces se les "da una leccin" por su mala conducta sometindoles a algn sacrificio o
escarmiento, aunque sea bastante despus de realizada;
- los criminales reciben penas que no necesariamente disminuyen la frecuencia de sus actos criminales;
- muchas veces el castigo fsico que un padre inflige a su hijo no es porque el nio haya hecho nada
especialmente malo, sino por disgustos personales o matrimoniales que encuentran su desahogo en la
violencia ejercida sobre el ms dbil (vase sobre este asunto el magnfico monogrfico que sobre
maltrato infantil ha publicado la revista Infancia y Aprendizaje, 1995, n 71).
En estos ejemplos, usualmente denominados de "castigo", efectivamente lo son pues hay estimula-
cin punitiva ulterior a la conducta, pero puede faltar lo decisivo en una definicin tcnica de castigo
que es su efecto sobre la conducta (reduciendo su frecuencia o suprimindola) y una contingencia res-
puesta - castigo.

b) Lneas de investigacin

Respecto a las lneas de investigacin que se han seguido sobre el castigo, Pelechano (1980, p.
232) seala dos fundamentales: la que proviene del conductismo y el aprendizaje animal y la llevada a
cabo en psicologa evolutiva:

APRENDIZAJE ANIMAL

La historia habra que iniciarla en Thorndike, quien en 1911 formul la ley del Efecto no slo en su
aspecto positivo sino tambin negativo (la estimulacin aversiva debilita o elimina las asociaciones
E-R establecidas), aunque en reformulaciones posteriores renunci a este principio pues obtuvo evi-
dencia en humanos de que el castigo sobre respuestas errneas no mejoraba el rendimiento en las res-
puestas alternativas.
Posteriormente, Skinner (1938) y Estes (1944) comprobaron que el castigo no debilita la relacin
entre estmulo y respuesta ni elimina la conducta sino que slo la suprime temporalmente.
Estos resultados llevaron a la conclusin prctica de procurar la no utilizacin del castigo como
medida disciplinaria y al abandono de la investigacin sobre este campo, hasta su relanzamiento en la
dcada de los 60 con autores tales como Mowrer, Azrin, Church, Solomon, etc.

PSICOLOGA EVOLUTIVA

Nos referimos en este apartado a teoras influyentes sobre el desarrollo infantil, en las cuales se in-
troducen explicaciones sobre el castigo. Inicialmente habra que citar las teoras de Freud y Watson.
Freud, al hablar del proceso de "internalizacin" (por el cual el nio incorpora o asimila fundamental-
mente las normas sociales) indica que se trata de pasar de un sistema de castigos y premios externos a
otro interno (mediante sentimientos de culpa y/o ansiedad). El castigo aparecera pues como un proce-
dimiento con efectos altamente desagradables y muy peligroso en los nios. Watson, por otra parte de-
fendi en un principio, al menos tcitamente, sistemas de castigo para la crianza de los nios, aunque
ms tarde corrigi dicha postura.
Estas teoras llevaron a que de algn modo se paralizase la investigacin sobre el tema hasta recien-
temente en que ms bien (y puesto que en trminos sociales es un fenmeno y una prctica que no
disminuye) se trata de analizar los aspectos positivos que pueda tener la aplicacin del castigo (efecti-
vidad y control de efectos nocivos secundarios).

6.4.2. Tipos de castigo: Castigo por aplicacin y por supresin

Craighead, Kazdin y Mahoney (1976; trad. cast. de 1981) distinguen dos tipos de castigo: Castigo
por aplicacin y castigo por supresin.

CASTIGO POR APLICACIN

El castigo por aplicacin (de estmulos punitivos), tambin llamado castigo positivo, consiste en
aplicar un estmulo aversivo despus de una respuesta. Por ejemplo, ser reprendido o "zurrado" des-
pus de realizar cierta conducta, etc. Su esquema sera: R - E
av
.
Podran incluirse aqu procedimientos en los que la estimulacin punitiva es condicionada. Por
ejemplo, las reprimendas verbales: Cuando se pretende que sean eficaces para suprimir conductas
problemticas, se sabe que las suaves sern ms eficaces que las fuertes (stas ltimas conducen fre-
cuentemente a un aumento posterior paralelo de las conductas perturbadoras). Drabman (1977) consi-
dera que las reprimendas verbales son un tipo de castigo por supresin, lo cual es bastante discutible
pues no se pierde ningn reforzador; ms bien lo que aparece tras la respuesta es estimulacin punitiva
condicionada, esto es, adquiere valor aversivo por asociacin previa con otros estmulos directamente
aversivos.
Otro ejemplo de castigo por aplicacin muy interesante en humanos (y un buen exponente de un
castigo generalmente eficaz) es la restitucin o reestablecimiento del dao causado. En este caso, el
castigo por algn tipo de conducta lesiva o daina (por ejemplo, romper deliberadamente un juguete al
hermano) consiste en algn tipo de reestablecimiento o reposicin, incluso con creces, del dao causa-
do (ahorrar hasta comprar al hermano otro juguete igual). Otro ejemplo se da cuando al nio que es
sorprendido tirando un papel al suelo en el aula, se le hace recoger todos los papeles que haya en el
suelo.

CASTIGO POR SUPRESIN

El castigo por supresin (de reforzadores), tambin llamado "castigo negativo" consiste en suprimir
un reforzador positivo despus de una respuesta, por tanto no se aplica estimulacin punitiva dire-
cta. Su esquema es R - No E
ref
. Por ejemplo:
- Perder privilegios por volver tarde a casa,
- perder dinero por mal comportamiento,
- retirada del carnet de conducir tras cometer una infraccin grave, etc.

CRTICAS A ESTA CLASIFICACIN

En realidad, es una clasificacin criticable desde un punto de vista tcnico de definicin del casti-
go. En particular, el castigo por supresin es perfectamente equiparable a la extincin del condiciona-
miento de recompensa. En aquel momento (vase Captulo 6), se insista en el aspecto operante de
disminucin de tasa de respuesta, pero no se mencionaba el factor emocional de dolor o frustracin por
la prdida del refuerzo.
Esta confusin conceptual ha llevado a una divisin de opiniones entre los autores: los mismos
procedimientos prcticos de reduccin o eliminacin de conductas se incluyen dentro de temas o cap-
tulos de castigo (por ejemplo, Drabman, 1977) o de tcnicas de extincin de condicionamiento de re-
compensa (por ejemplo, Milby, 1982). En cualquier caso, una descripcin de estos procedimientos se
puede encontrar en el apartado 4.1.1. del Tema 4.

6.4.3. Condiciones para la efectividad del castigo

Cuando se mencionan las condiciones de efectividad del castigo, surge una clara confrontacin en-
tre las condiciones de laboratorio y las de la vida real. Empezamos describiendo las primeras para des-
pus comprobar en las segundas lo problemtico que puede resultar la utilizacin del castigo.

a) Condiciones experimentales para la disminucin de la respuesta mediante castigo

1) Intensidad: A mayor intensidad, mayor supresin (ms completa y duradera) de la respuesta. Si la
intensidad es baja se observa una recuperacin de la respuesta castigada. Una intensidad mediana
produce una supresin parcial de la respuesta. Es ms eficaz variar la intensidad del castigo a lo
largo del entrenamiento que mantenerlo constante.

2) Proporcionar respuestas alternativas: Una vez lograda la supresin de la respuesta, si no se ha lle-
vado a cabo un entrenamiento en respuestas alternativas, el sujeto vuelve a recuperar la conducta
castigada. La respuesta alternativa debe satisfacer el impulso (hambre, sed, etc.) en que se basa la
tendencia de aproximacin o atraccin que ejerce la respuesta inicial. Adems, si se proporciona
respuesta alternativa, el castigo puede ser de baja intensidad. Gray (1988; trad. cast. 1993, p. 143)
menciona un impresionante experimento de Solomon al respecto: Unos cachorros de perro prefer-
an comer carne normal en vez de carne granulada; para lograr que comieran carne granulada, los
castigaba con un golpe en el hocico (dado con un peridico enrollado) al comer carne normal; sin
embargo, les dejaba comer carne granulada. Fue un mtodo de adiestramiento eficaz pues cuando
les daba slo carne normal algunos perros llegaron a morir de hambre (a los que segua dndoles
carne granulada se la coman sin problemas). La eficacia fue mayor porque se castig una conducta
consumatoria (comer) en vez de una conducta instrumental.

3) Duracin del estmulo punitivo: A mayor duracin mejor es la supresin de la conducta, aunque es
muy probable que con una perturbacin emocional mucho mayor.

4) Presentacin repentina o gradual: El estmulo punitivo es ms eficaz si se presenta de modo repen-
tino que si se hace de forma gradual, dado que en este ltimo caso se va produciendo una habitua-
cin al estmulo aversivo.

5) Programas de castigo: Se trata de aplicar los mismos programas que se utilizaron con el refuerzo
(vase Tema 4). El programa de castigo ms eficaz es el continuo (respuesta-castigo) tanto en ani-
males como en humanos. En los de razn fija la eficacia es mayor cuanto mayor sea el volumen de
estimulacin punitiva, y al aplicarlo se observa una disminucin progresiva de la tasa de respuesta.
Con programas de intervalo se desarrolla una supresin anticipatoria, sobre todo con intervalos
fijos (disminuye la frecuencia de respuesta antes de que se emita estimulacin punitiva).

6) Demora del castigo: Normalmente a menor contigidad espacio-temporal entre castigo y conducta
menor eficacia del mismo. Sin embargo, en sujetos humanos este factor es menos importante.

7) Orden temporal en las secuencias premio - castigo: En una secuencia R instrumental - E reforzante
- R consumatoria, segn el momento en que se aplique castigo (estimulacin aversiva), el resultado
conductual ser diferente. Citemos dos posibilidades:
- Secuencia castigo - premio: Con la secuencia R instr. - E av. - E ref., es decir, castigando la res-
puesta instrumental pero permitiendo la aparicin posterior del premio, paradjicamente, no se
suprime la respuesta instrumental y adems la estimulacin aversiva hace de EC o seal de un
estmulo reforzante posterior. Con todo ello se logra, mediante este contracondicionamiento (1
castigo, 2 recompensa), una mayor resistencia al castigo, es decir, una mayor resistencia a la ex-
tincin de la respuesta castigada. Es otra manifestacin de la conducta masoquista antes mencio-
nada -recurdese que se produca conducta masoquista al castigar la respuesta de evitacin, con lo
cual, tenamos una secuencia R instr. - E ref negativo (cese de EC) - E av.-. En humanos, esta
bsqueda de estmulos dolorosos, tan extraa en la mayor parte de congneres, tendra explica-
cin en funcin de esta secuencia premio - castigo, tal y como comenta Gray (1988; trad cast.
1993, p. 148): supuestos una serie de experiencias condicionantes en la infancia en las que el do-
lor se ha seguido de una buena recompensa (y es fcil de imaginar que esto sucede normalmen-
te).
- Secuencia premio - castigo: Se trata de la secuencia

R consumatoria
R instr. E ref.
E aversivo

En una secuencia como la del experimento de los cachorros de Solomon antes mencionado,
produce el efecto contrario: una rpida extincin de la R instrumental y de la R consumatoria, pe-
ro tambin la aparicin de una intensa RC de miedo. En trminos coloquiales, algunos autores
(por ejemplo Eysenck) sugieren que estos fenmenos estn involucrados de algn modo con el
desarrollo de la conciencia moral. En efecto, al no emitir la respuesta, se produce una resistencia
anticipada a la tentacin. Pero si alguna vez comete la respuesta prohibida, entonces el sujeto ex-
perimentar sentimientos de culpa.

b) Condiciones ptimas de efectividad del castigo en contexto aplicados

Craighead et al. (1976) sealan las siguientes:


1) Aplicacin inmediata del estmulo aversivo punitivo o supresin del refuerzo despus de la respues-
ta no deseada. De la misma forma que en el entrenamiento de recompensa, tambin en el caso del
castigo interesa que haya la menor demora posible entre la conducta y su consecuencia.

2) Castigo de todas y cada una de las incidencias de la respuesta, es decir, para que el castigo sea efi-
caz debe aplicarse segn un programa continuo. Hay que notar que en caso de que el castigo no se
produzca segn un programa continuo, ello implicar que todas las conductas no castigadas se
estn dando porque tienen algn tipo de reforzamiento; por consiguiente, y de acuerdo con el efec-
to del refuerzo parcial ya estudiado, la conducta tender a mantenerse resistente a la extincin. En
el caso del castigo suele ser an ms importante que en el caso de la recompensa una aplicacin
consistente desde el principio del entrenamiento para optimizar su efecto.

3) Introduccin del estmulo contingente de castigo en su mxima intensidad (ms que con aumento
gradual de severidad) pero, en el caso de humanos, con proporcionalidad entre la intensidad del
estmulo punitivo y la fuerza de la conducta que se quiere extinguir (Marcos, 1994b, p. 86). Si la
intensidad del castigo es desproporcionadamente elevada, se facilitar la induccin de efectos se-
cundarios perjudiciales, segn ser comentado a continuacin; por el contrario, si el castigo es de-
masiado leve y las consecuencias extrnseca o intrnsecamente reforzantes de la conducta son ms
importantes para el sujeto, lgicamente tal conducta tender a persistir.

4) Supresin de la motivacin para la respuesta no deseada.

5) Preparacin de una respuesta alternativa aceptable (en especial cuando no puede eliminarse la mo-
tivacin para la respuesta no deseada). Resulta crucial este factor de refuerzo de conductas alterna-
tivas, como una manera de reencauzar las motivaciones del sujeto en direcciones de respuesta dife-
rentes. Si bien el castigo tiende a "dejar sin salida" las motivaciones de la persona, no tendr porqu
haber demasiada persistencia en la conducta problemtica cuando el individuo encuentra fcilmente
conductas diferentes y asequibles a sus capacidades que empiezan a resultar instrumentales para la
satisfaccin de sus necesidades.

6) Refuerzo de las respuestas incompatibles con la respuesta castigada. En algunos casos particulares,
la respuesta alternativa reforzada puede ser de hecho incompatible e incluso opuesta a la conducta
que se desea extinguir. As, por ejemplo, un chico que tiene el hbito de morderse las uas, puede
ser reforzado (mediante alabanzas o refuerzos intercambiables, por ejemplo) cada vez que, al perca-
tarse de que va a iniciar el mordisqueo, cierra el puo o mete durante un minuto su mano en el bol-
sillo.

7) En seres humanos, una descripcin de la contingencia del castigo que permita que el sujeto sea
consciente de por qu se le castiga. La aplicacin consistente del castigo sin explicaciones, tal co-
mo obviamente se hace con los animales en el laboratorio, da lugar a asociaciones representaciona-
les sobre la contingencia del castigo, pero tales representaciones se ven facilitadas si la experiencia
directa de castigo va acompaada por una explicacin verbal congruente.

8) An sealizaramos nosotros un ltimo factor o condicin para la ptima efectividad del castigo en
humanos, y se refiere a que tal castigo est lo ms directamente posible relacionado con la conducta
problema y sus consecuencias naturales. Un buen ejemplo de ello es la restitucin del dao que
comentamos en un apartado anterior.

Como vemos, se trata de un resumen o enumeracin con fines evidentemente prcticos de algunos
de los factores sealados en el apartado anterior.

c) Efectos secundarios (perjudiciales) del castigo

Aunque parece que siguiendo las normas antes citadas se podran obtener resultados positivos con
el castigo, sin embargo no dejan de aparecer efectos perjudiciales, tanto por no lograr la supresin de
la conducta castigada, como por la aparicin de efectos secundarios perjudiciales. Dichos efectos se
pueden concentrar en cinco apartados:

- Aparicin de respuestas emocionales negativas y/o problemticas.- La aplicacin de tcnicas de cas-
tigo sin alternativa de respuesta segn Walter y Grusec (1977) y con estimulacin punitiva intensa
provoca ciertas alteraciones comportamentales y un incremento de la ansiedad y de la inhibicin
comportamental.

- Aparicin de conductas de evitacin del agente punitivo y del contexto de la situacin de castigo.-
Se llega a una evitacin del agente punitivo y del contexto ambiental o estimular con l asociado.
Los efectos son fciles de imaginar en caso de aplicacin del castigo en nio, por ejemplo, en el
mbito familiar (falta de comunicacin padres-hijos, etc.); o en el escolar (aversin al profesor, al co-
legio, al estudio, etc.).

- Efecto rebote o incremento de la respuesta castigada en ausencia de la situacin (agente punitivo y
contexto) de castigo.- Si se castiga una conducta problemtica que vena mantenindose previamente
por condicionamiento de recompensa, se reducir dicha conducta, pero cuando deje de aplicarse el
castigo no slo no se reducir la tasa de respuesta sino que se incrementar por encima del nivel que
tena cuando sta era reforzada antes del castigo. Marcos (1994b, p. 87) pone un ejemplo muy ilus-
trativo:
Imaginemos que un nio comienza a fumar porque as obtiene cierto refuerzo social; sus padres le castigan cuando le
ven fumando. Cuando el muchacho sea mayor y sus padres no puedan castigarle, entonces fumar ms que si no le
hubieran castigado nunca.
Adems, al administrar repetidamente el castigo, los estmulos asociados al agente o situacin puni-
tiva se condicionan, con lo cual, en ausencia de ese contexto la respuesta castigada se recupera con
facilidad. Todo ello surge, evidentemente, al no conseguirse una verdadera supresin de la motiva-
cin para la conducta.

- Imitacin futura de la conducta castigadora.- El agente punitivo segn Pelechano (1980, p. 351)
"se convierte en un modelo poderoso que castiga y promueve, en nios y adultos, conductas de casti-
go por modelado comportamental" (aprendizaje observacional). El sujeto castigado tiende a aprender
que ese es el patrn de conducta pertinente para dirigir el comportamiento de los dems.

- Persistencia de la motivacin para realizar la conducta problema.- Si no se proporcionan conductas
alternativas a la castigada, el sujeto aprende a no hacer algo, es pues un aprendizaje asociativo de
carcter negativo que puede que suprima una conducta observable, pero no la motivacin para hacer-
la, de modo que cuando pueda (est ausente el agente punitivo, etc.) volver a hacerla; se establece,
en todo caso un conflicto aproximacin - evitacin que no se resolver hasta que se ofrezca la posibi-
lidad de obtener el mismo refuerzo pero con otras conductas socialmente ms correctas.

Dicho todo esto, es obvio que el uso aplicado del castigo debera restringirse a casos puntuales,
nunca el castigo fsico, y siempre que no haya ningn procedimiento alternativo y aplicndolo con
arreglo a las normas antes mencionadas.


6.5. La prdida del control de la accin: Indefensin aprendida
6.5.1. Concepto y tcnicas experimentales

En el apartado anterior estudiamos la aplicacin de estimulacin punitiva contingente a la respues-
ta. Eran situaciones en las cuales el sujeto aprenda una relacin o asociacin entre su respuesta y una
consecuencia negativa; en cierto modo, adquira un cierto control sobre su entorno pues aprende a no
hacer algo por sus malas consecuencias o, en el caso de la evitacin, aprende a hacer algo para no su-
frir malas consecuencias. En definitiva, con su conducta controla la situacin.
Ahora bien, es posible que se aplique la estimulacin punitiva de forma no contingente a la res-
puesta. En estos casos, el sujeto con su conducta no tiene control sobre los acontecimientos y ello ser
bastante negativo. De hecho, en la vida cotidiana no es algo infrecuente. Por ejemplo, en una situacin
de desempleo, la persona comienza intentando diversas estrategias para conseguir un trabajo (presen-
tarse a oposiciones, buscar enchufes, consultar bolsas de trabajo, apuntarse en una oficina de em-
pleo, etc.); si transcurrido un tiempo no lo consigue, esa estimulacin aversiva (desempleo) persiste y
no es contingente a las respuestas de evitacin (las estrategias de bsqueda antes mencionadas). Hay
otras situaciones problemticas en las que hagamos lo que hagamos no las resolvemos pero su reper-
cusin es ms o menos negativa segn su duracin, intensidad o posibilidades de escape.

La investigacin experimental lleva desde 1967 estudiando sistemticamente dicho fenmeno. En
esa fecha, Seligman y colaboradores (Overmier y Seligman, 1967; Seligman y Maier, 1967) expusie-
ron a unos perros (en cajas de saltos) a una serie de shocks inescapables y despus observaron que es-
tos animales eran incapaces de aprender una nueva conducta consistente en evitar o escapar de los
shocks, esta vez s contingentes a dicha conducta. A dicho fenmeno se le llam learned helplessness,
traducido por trminos diversos tales como desamparo, impotencia, desesperanza o indefensin apren-
dida, y cuya formulacin sera la siguiente: "Los organismos expuestos a una situacin incontrolable,
con frecuencia muestran dficits posteriores en el aprendizaje de nuevas respuestas de xito" (Maier y
Seligman, 1976).
Experimentalmente no slo se ha demostrado en perros sino tambin en otros animales y tambin
en humanos (vase Garber y Seligman, 1980, para revisin), sea con ruidos desagradables (Hiroto,
1974) o con anagramas irresolubles (Romero, Lpez y Diez, 1988).

Segn Seligman (que es el principal investigador en este terreno), el concepto de indefensin des-
cribe al menos tres cosas diferentes:
- Un procedimiento experimental: exposicin a consecuencias incontrolables, o sea, estimulacin
aversiva que no se puede evitar, ni escapar ni es contingente a la respuesta.
- Un efecto conductual: inactividad como resultado de tal operacin.
- Un proceso, un fenmeno de aprendizaje consistente en la adquisicin de cogniciones especficas a
tal procedimiento y responsables del efecto conductual.

Las teoras elaboradas en torno a dicho fenmeno, adems de romper con las teoras tradicionales
E-R al incluir variables mediacionales cognitivas (atribucin, expectativas), estn teniendo en la actua-
lidad gran aplicacin en clnica, sobre todo en el campo de la depresin.

Las tcnicas o procedimientos experimentales por los cuales se ha evidenciado la indefensin
aprendida se describen en el Cuadro 3.

Cuadro 3: Tcnicas experimentales de adquisicin de la indefensin aprendida.

El paradigma experimental clsico de indefensin aprendida, tal y como se llev a cabo en los primeros experimentos de
Seligman, se denomina diseo tridico. Aunque ha experimentado numerosas variaciones y crticas, lo cierto es que ha si-
do la tcnica ms utilizada. Supone dos fases: una de pre-tratamiento o de induccin y otra de prueba.

- En la fase de pre-tratamiento se hacen tres grupos de sujetos:
1) Grupo escapable, que se somete a descargas escapables mediante procedimiento de escape o evitacin: E
av
- R
No E
av
(Ref. neg.)
2) Grupo inescapable, idntico en todo al anterior ("acoplado al anterior") excepto en que la respuesta no impide ni afecta
a la estimulacin aversiva previa: E
av
- R E
av

3) Grupo control o inexperto pues no tiene experiencia de estimulacin aversiva.

- En la fase de prueba todos los grupos son sometidos a un condicionamiento de escape o evitacin de modo que se mide
y se compara la rapidez de adquisicin. Los grupos 1 y 3 suelen mostrar una mayor rapidez en la adquisicin que el gru-
po 2 que es ms lento por la interferencia de la fase aversiva inescapable no contingente.

As pues, todos los procedimientos experimentales, tanto en humanos como en animales tienen el objetivo de conseguir
que el sujeto perciba el no control sobre las consecuencias o sobre los acontecimientos.

Con este mismo diseo tridico se han empleado diversos procedimientos en ambas fases (Ferrndiz, 1989):

- En la fase de pre-tratamiento, en animales sobre todo se han utilizado descargas elctricas (por ejemplo, 60 descargas
inescapables de 6 mA (miliamperios) y 5 segs. de duracin espaciados durante 3 horas). Con humanos hay ms varie-
dad:
. estimulacin aversiva o ruidos intensos molestos,
. feedback negativo o positivo incontrolable,
. fracaso inducido por el experimentador,
. problemas discriminativos irresolubles,
. puzzles irresolubles,
. anagramas irresolubles, etc.

- En la fase de prueba, con animales se emplea condicionamiento de escape y evitacin o laberintos. Con humanos:
. resolucin de anagramas,
. terminacin de ruidos intensos y
. tareas de decisin lxica.

Las medidas ms utilizadas han sido:
- para aspectos motivacionales: latencia de respuesta,
- para aspectos emocionales: cuestionarios y observacin conductual, y
- para aspectos cognitivos: autoinformes, numero de ensayos para resolver problemas, nmero de errores, etc.

6.5.2. Efectos o resultados de la indefensin aprendida
a) Dficits

En cuanto a los efectos de la indefensin aprendida, Seligman (1975) seala tres tipos de dficits:
- Dficit motivacional: "Los acontecimientos incontrolables disminuyen la motivacin para iniciar res-
puestas voluntarias que controlan otros acontecimientos" (p. 62).
- Dficit cognitivo: Una vez que se ha experimentado la incontrolabilidad resulta difcil aprender o
percibir la eficacia de la respuesta (la incontrolabilidad distorsiona la percepcin del control).
- Dficit emocional: Dicho dficit se define operacionalmente por la mayor incidencia de lceras y otra
serie de trastornos psicofisiolgicos.

b) Generalizacin o transferencia

Una vez inducida indefensin, se podr transferir a otras situaciones incluso dndose las siguientes
caractersticas (Ferrndiz, 1989):
- Siempre que en la fase de transferencia se empleen tambin estmulos punitivos.
- Puede haber transferencia de una situacin traumtica (descarga elctrica) a otra no traumtica (prue-
ba de laberintos).
- Puede darse de tareas instrumentales (ruido inescapable) a tareas cognitivas (prueba irresoluble de
anagramas).

6.5.3. Condiciones para la adquisicin de la indefensin aprendida
a) No contingencia R - C

Es fundamental la experiencia de no relacin entre estimulacin aversiva y respuesta, hasta el ex-
tremo que determina la variable clave de la indefensin aprendida que es la incontrolabilidad. En este
contexto, la controlabilidad es el estado psicolgico segn el cual el sujeto percibe hasta qu punto su
accin controla o predice los acontecimientos. Si determinados acontecimientos se perciben como in-
dependientes de la respuesta entonces son "incontrolables", es decir, que ocurrirn haga lo que haga el
sujeto. Si el acontecimiento afecta aversivamente al sujeto y lo percibe como no controlable entonces
se inducir indefensin.

b) Locus de control

En lneas generales, sujetos con locus de control externo (o aquellos que creen que los refuerzos o
castigos ocurren por azar o por circunstancias ajenas a su voluntad y que no son controlables),
muestran mayor indefensin que los sujetos con locus de control interno (que creen que pueden "con-
trolar" el refuerzo y que los premios o los castigos dependen de sus esfuerzos y/o capacidades). Estos
ltimos tardan ms en inducir indefensin por prdida de autoestima.

c) Autocontrol

Determinadas conductas de autocontrol como el autorrefuerzo durante la fase de prueba dificultan
la induccin de indefensin.

d) Estimulacin aversiva inescapable repetida y previa

En determinadas circunstancias el procedimiento de indefensin aprendida -y los dficits a l aso-
ciados- pueden evitarse si el entrenamiento previo en estimulacin aversiva es ms prolongado de lo
habitual entonces no se produce indefensin. A este fenmeno lo denomin N. E. Miller endureci-
miento (toughening up). Es un fenmeno descubierto en el laboratorio de Miller y descrito por Gray
(1988; trad. cast. 1993, p. 150) en estos trminos:
Si el adiestramiento en la caja lanzadora era precedido, no de una nica sesin de choque inescapable, sino de 15 sesio-
nes, una diaria durante 15 das, el efecto disruptivo de la ltima sesin de choque en la respuesta de la caja lanzadora
quedaba completamente eliminado (...). Hay que hacer notar que durante las repetidas sesiones de choque inescapable
que permiten el endurecimiento, no hay recompensas con las que el choque pueda ser asociado. As, el endurecimiento
parece ser un proceso no asociativo: el choque pierde su capacidad de desorganizar la conducta simplemente por el hecho
de ser administrado de manera repetida.
El mismo autor sugiere que el endurecimiento es una posible explicacin a la tolerancia al estrs.

6.5.4. Por qu ocurre la indefensin aprendida (teoras explicativas)
a) Teoras iniciales
TEORA DE LA INDEFENSIN APRENDIDA DE SELIGMAN

Un organismo en una situacin de incontrolabilidad forma unas expectativas especficas negativas
(haga lo que haga no conseguir evitar la estimulacin aversiva) y tiene unas consecuencias conduc-
tuales (triple dficit antes citado). Por tanto hay tres elementos fundamentales (Ferrndiz, 1989):
- informacin sobre la no contingencia,
- representacin cognitiva de la situacin (aprendizaje, expectativa, percepcin o creencia), y
- dficits.

TEORA DE LA INACTIVIDAD APRENDIDA

Esta teora, formulada por varios autores, surge como reaccin a la anterior objetndole su recurso
a constructos inobservables (expectativas) y por tanto se trata en este caso de una interpretacin ms
acorde con las teoras tradicionales del aprendizaje. Segn esta teora, el sujeto ejecuta peor un apren-
dizaje posterior de escape (recordemos que en la situacin experimental de la caja de saltos, tras la ex-
posicin a shocks no contingentes se permita situaciones de escape) por haber aprendido a ser inacti-
vo durante la fase anterior de shocks inescapables. Dicha inactividad aprendida es incompatible con
respuestas tales como "saltar", "apretar palancas", etc. y por tanto interfiere en el aprendizaje posterior.

TEORA DE LA INACTIVIDAD INDUCIDA POR ESTRS

Se refiere al hallazgo de Weiss (1968) de una reduccin del nivel de norepinefrina (metabolito de la
noradrenalina que es una catecolamina y neurotransmisor que interviene en las sinapsis; es excitatorio
y pertenece al sistema simptico) al someter al sujeto a shocks inescapables. Por tanto explica el
fenmeno de la indefensin mediante un mecanismo neuroqumico, sobre todo con estimulacin aver-
siva de alta intensidad (si es de baja intensidad intervendra la teora anterior).

b) Reformulaciones recientes de la indefensin aprendida en humanos

Segn Vazquez y Polaino (1982), puede decirse que desde 1978 se ha producido un giro diferente
en las teoras de la indefensin aprendida. En concreto, se ha reforzado el papel de variables cognitivas
tales como el locus o lugar de control y las atribuciones (vase Captulo 2). Ya Seligman, en su obra
de 1975 propona un mediador cognitivo que eran las expectativas de no control o de incontrolabili-
dad. Las reformulaciones aparecidas entre 1978 y 1980 (Abramson, Seligman y Teasdale, 1978;
Abramson, Garber y Seligman, 1980), ofrecen una explicacin ms detallada y plausible de los meca-
nismos de formacin de dichas expectativas de incontrolabilidad. En concreto, se introduce la variable
"atribucin" (una atribucin es la causa percibida de un evento) entre la percepcin de no contingencia
y la expectativa de no contingencia futura. Es decir, la situacin actual de fracaso o problemas no es-
capables sirve de atribucin causal para igual situacin futura. Segn Vazquez y Polaino, la ad-
quisicin de indefensin aprendida seguira los siguientes pasos o etapas:
1, situacin de no contingencia objetiva entre respuesta y consecuencia aversiva (la respuesta no hace
cesar la estimulacin aversiva)

2, percepcin de no contingencia presente y pasada (el sujeto podra pensar: hasta ahora todo lo que
hago no me sirve para resolver el problema)
3, atribucin de no contingencia pasada y futura (mis acciones no resuelven ni resolvern el proble-
ma)
4, expectativa de no contingencia futura (haga lo que haga no resolver el problema)
5, sntomas de indefensin.

En este nuevo esquema, el mecanismo por el cual se establece la expectativa de no contingencia
(consistente en el convencimiento de sujeto de que en el futuro la respuesta no causar el cese de la es-
timulacin aversiva por tanto no se responde) es la atribucin de no causalidad entre la respuesta y la
estimulacin nociva (la respuesta no causa el cese de la estimulacin aversiva).

El nuevo modelo no puede explicar la indefensin en especies infrahumanas pero s es til y apli-
cable a la indefensin en humanos, en donde las teoras anteriores no podan explicar dos fenmenos
especficos como son:
- la generalidad y la cronicidad de los dficits y
- la prdida de autoestima.
Esta prdida de autoestima resulta en principio algo paradjico pues si el sujeto perciba que nin-
guna respuesta era eficaz no tena por qu sentirse daado. Pero, como apuntan Vzquez y Polaino
(1982), es posible que el individuo indefenso piense no ya que toda respuesta posible tenga conse-
cuencia alguna en el medio, "sino que puede que crea que slo l mismo carece de ella" (p. 74) por
falta de inteligencia, capacidad, etc.
Habran pues dos tipos de atribuciones:
- Atribuciones de no causalidad respuesta - consecuencia (la respuesta no produce consecuencias favo-
rables de cese del problema o estimulacin aversiva).
- Atribuciones de carencia de respuesta apropiada (no dispongo de respuestas para resolver el proble-
ma.
Segn esto, la atribucin de no causalidad sera ms probable en individuos con locus de control
externo (atribuyen la causa del problema a algo externo a ellos) mientras que la atribucin de caren-
cia de respuesta apropiada sera ms propio de sujetos con predominio de locus de control interno.

La reformulacin de Seligman no slo admite el papel de la atribucin causal sino la existencia de
estilos atributivos en cada sujeto. Hay estilos atribucionales que infligen al sujeto una mayor vulnera-
bilidad a la indefensin que otros. Ya vimos en el Captulo 2 la propuesta de Seligman y colaboradores
relativa a las tres dimensiones del estilo atribucional:
- Interna / externa
- Estable / inestable
- Global / especfica
Tal y como se explicaba en aquel captulo, un perfil atribucional interno - estable - global ser el
de peor pronstico para inducir una actitud de indefensin o incluso estados depresivos. El perfil ex-
terno- inestable - especfico ser el ms favorable tras una situacin de incontrolabilidad o de
fracaso -vase el Captulo 11 de Steiner (1988; trad. cast. de 1990) o Klein (1991; trad. cast. de 1994,
pp. 322-331) para una ilustracin con ejemplos al respecto y en el apartado 7.2.2.a, en el Anexo 2 del
Captulo 1-.
Hay otros matices observados en cada estilo atribucional. As:
- Si la atribucin es estable los dficits sern ms crnicos que si es inestable.
- Los externos no tienen prdida de autoestima (no son los responsables de sus fracasos) y s los inter-
nos.

6.5.5. Repercusiones aplicadas de la indefensin aprendida
a) Tericas

Habra que resaltar dos: Por un lado demuestra que la no contingencia produce un tipo de aprendi-
zaje pasivo (se aprende a no hacer nada), hasta ahora no demostrado en condicionamiento clsico ni en
condicionamiento instrumental (Maldonado, 1982) y, por otra parte, se propone una teora general del
condicionamiento instrumental desde una perspectiva cognitiva, abriendo nuevos cauces a la investi-
gacin.

b) Prcticas

La principal aplicacin prctica se ha centrado en la explicacin de la adquisicin de la conducta
depresiva. El mismo Seligman (1975), propuso una explicacin de la depresin basada en la indefen-
sin aprendida dada la similitud entre los sntomas de la depresin y los efectos conductuales de la in-
defensin aprendida, tal y como se ve de forma patente en la siguiente Tabla 3 (Maldonado, 1982). Es-
te autor viene a decirnos que la depresin en humanos se produce por la expectativa de una incapaci-
dad para controlar los eventos, al igual que en la indefensin.
Pero no slo tiene una aplicabilidad clnica. Tambin se ha propuesto como etiologa de algunos
fracasos escolares. En efecto, el nio que suspende asignaturas a pesar de su esfuerzo en estudiar pue-
de adquirir un estado de indefensin aprendida que le provoque una dificultad aadida importante para
lograr superar esta problemtica.
Las soluciones a esta problemtica no son simples, aunque algunos autores se aventuran por esa
lnea. Por un lado, habra que incidir en fortalecer la autoeficacia o competencia percibida que, segn
Bandura (1986) permite a las personas continuar a pesar de un fracaso; por otro lado, Klein (1991)
menciona las ventajas de tener un enfoque optimista de los problemas y sus soluciones, en contraposi-
cin a un enfoque pesimista inductor de indefensin.

Tabla 3: Similitud de sntomas de la depresin y la indefensin aprendida (adaptado de Maldonado, 1982).

DEPRESION INDEFENSION APRENDIDA

1. Pasividad ................................................................. 1. Pasividad
2. Conjunto de pensamientos negativos ..................... 2. Dficits cognitivos (dificultades en
(pesimismo) aprendizajes de respuestas de xito)
3. Curso de tiempo ...................................................... 3. Curso de tiempo
4. Hostilidad introyectada ............................................ 4. Prdida de agresin
5. Prdida de peso, apetito, dficits ............................ 5. Prdida de peso, apetito, dficits
sociales y sexuales sociales y sexuales
6. Decremento de norepinefrina .................................. 6. Decremento de norepinefrina


7. PRCTICAS DE AUTOEVALUACIN DEL TEMA 5

5-1: Cuando se responde a la relacin entre dos o ms estmulos, ms que a sus propiedades absolutas, hablamos de:
a) Contraste.
b) Desviacin del vrtice.
c) Encadenamiento.
d) Transposicin.

5-2: Un nio ha aprendido a llamar pap a todos los hombres, pero cuando hace esto ve que nicamente un hombre le responde y los
otros no. Este refuerzo diferencial le permitir al nio establecer adecuadamente:
a) La discriminacin.
b) El control de estmulos.
c) El desvanecimiento.
d) a y b son ciertas.

5-3: Generalizacin y discriminacin son:
a) Procesos independientes entre s.
b) Procesos directa y positivamente relacionados.
c) Extremos de un continuo.
d) Dos parmetros de medida de la fuerza de una respuesta.

5-4: Una mujer es maltratada por su marido cada vez que ste llega borracho a casa. Esta mujer est sometida a un modelo de:
a) Castigo por aplicacin.
b) Condicionamiento de escape.
c) Entrenamiento de omisin.
d) Indefensin aprendida.

5-5: Cuando existe relacin de causalidad entre una respuesta y la consecuencia de eliminar un estmulo agradable, hablamos de:
a) Condicionamiento de recompensa.
b) Escape o evitacin.
c) Castigo por supresin.
d) Entrenamiento de omisin.

5-6: Cul de las siguientes NO es una condicin adecuada para la aplicacin del castigo en humanos?:
a) Hacer una descripcin verbal de la contingencia del castigo.
b) Aplicarlo inmediatamente tras la conducta.
c) Introducirlo gradualmente para evitar un excesivo trauma emocional.
d) Castigar todas y cada una de las respuestas problema.

Anotaciones y observaciones

Control Aversivo

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Control Aversivo

Uploaded by

Copyright:

Available Formats

- 235 -

Asignatura: Aprendizaje (6 crditos). Obl. de 2 curso Grado Psicologa, Curso 2010/2011

You might also like