You are on page 1of 10

El condicionamiento operante tal y como lo conocemos fue formulado y

sistematizado por Burrhus Frederic Skinner en base a las ideas planteadas


previamente por otros autores.
Ivan Pavlov y John B. Watson habían descrito el condicionamiento clásico,
también conocido como condicionamiento simple o pavloviano.
Por su parte, Edward Thorndike introdujo la ley del efecto, el antecedente más
claro del condicionamiento operante. La ley del efecto plantea que si una
conducta tiene consecuencias positivas para quien la realiza será más probable
que se repita, mientras que si tiene consecuencias negativas esta probabilidad
disminuirá. En el contexto de la obra de Thorndike el condicionamiento operante
es denominado “instrumental”.

¿En qué consiste el condicionamiento operante?


El condicionamiento instrumental u operante es un procedimiento de aprendizaje
que se basa en que la probabilidad de que se dé una respuesta determinada
depende de las consecuenciasesperadas. En el condicionamiento operante la
conducta es controlada por estímulos discriminativos presentes en la situación de
aprendizaje que transmiten información sobre las consecuencias probables de la
respuesta.
Por ejemplo, un cartel de “Abierto” en una puerta nos indica que si intentamos
girar el pomo lo más probable es que se abra. En este caso el cartel sería el
estímulo discriminativo y la apertura de la puerta funcionaría como reforzador
positivo de la respuesta instrumental de girar el pomo.
Fue desarrollado por el psicólogo americano Burrhus F. Skinner. Entendemos como
condicionamiento operante aquel en el que la frecuencia de una conducta es
modificada a través de la aplicación de reforzadores positivos o negativos
contingentes con ellas.
EL PARADIGMA DEL CONDICIONAMIENTO OPERANTE
•Es conocido como: paradigma E-R, aprendizaje por relación de un estímulo con una respuesta.
•En el paradigma del condicionamiento operante se pueden realizar sólo dos acciones:
-Reforzar: aumentar la probabilidad de una respuesta.
-Castigar: disminuir la probabilidad de una respuesta.
•El condicionamiento operante es aprendizaje, porque es un cambio de la conducta como fruto de la experiencia.
•Tanto el refuerzo como el castigo pueden ser positivos o negativos.
•Positivo significa que está el estímulo que refuerza o que castiga una conducta (contingencia positiva)
•Negativo significa que no está el estímulo que refuerza o que castiga una conducta (contingencia negativa)
•Para determinar los modelos o subparadigmas del condic operante, hay que conjugar dos variables:
-la contingencia respuesta-reforzador: positiva o negativa
-la naturaleza del reforzador: agradable (premio) o aversivo (nocivo).
•Es el tipo de reforzador (premio o estímulo aversivo) y la presencia o ausencia de él lo que determina los cuatro
modelos del condic operante. Se establecen cuatro modelos o subparadigmas del condic operante:
-Condicionamiento de recompensa (refuerzo positivo): es el modelo más tradicional y típico del condic operante. Su
función es aumentar el vigor de una respuesta por ser ésta contingente con un premio.
-Castigo (castigo positivo): es el condic con estímulo aversivo presente. Su función es la desaparición de una
respuesta por ser ésta contingente con el estímulo aversivo.
-Condicionamiento de evitación (refurezo negativo): se refuerza la aparición o vigor de una conducta
negativamente. La evitación es reforzante, porque es la consecución del “no castigo”, y la omisión es castigante
porque es la consecución del “no premio”. Presenta dos modalidades:
Evitación: la emisión de la respuesta hace que no aparezca el estímulo aversivo
Escape: la emisión de la respuesta hace que desaparezca el estímulo aversivo

El reforzador positivo hace que aumente la probabilidad de ocurrencia


de una respuesta. Se presenta al sujeto un estímulo positivo después de
que se haya emitido la respuesta previamente definida.
El reforzador negativo hace que aumente la probabilidad de la
respuesta porque reduce o elimina un estímulo desagradable para el
individuo

Para Skinner el paradigma del condicionamiento operante tendría esta

representación:

R – E+ en la cual R es la respuesta o conducta y E+ es el refuerzo u operación de

reforzamiento.

Paradigma para la situación del niño:


Estímulo: Ver que otro niño le dieron un dulce.
Respuesta: Llanto, berrinche, pataleo.
Consecuencia: Obtención del dulce (R+) para el niño.
Paradigma para la situación de la madre:
Estímulo: molestia por llanto del niño.
Respuesta: darle al niño lo que pide.
Consecuencia: el niño deja de llorar, cesa la molestia de la madre
(reforzador negativo para ella).
Cada vez que el niño quiera un dulce, llorará para que la madre se lo
compre. Y la madre para evitar el llanto del niño terminará comprándole
el dulce al niño para que no llore.

Características

Las principales características del condicionamiento operante son:


 Es un método muy importante en el área de la psicología como sistema de

aprendizaje.

 Enseña al individuo a que cada respuesta conlleva a una acción o reacción.

 Cada refuerzo es positivo o negativo según sea cada meta a completar.

 Indispensable para el conductismo.

Historia

La primera vez que fue aplicado fue por Skinner en una caja, donde el sujeto de estudio fue

una rata colocada en una caja en donde había un parlante, unsuelo electrificado, una

bombilla verde, otra bombilla pero de color rojo, un botón o pulsador y un dispensador de

comida.

El sistema era simple, si la rata le daba al botón cuando la bombilla estaba en rojo recibía una

descarga eléctrica, mientras que si presionaba el verde se le dispensaba alimento, todo eso

mientras Skinner le hablaba por el altavoz.

Elementos del condicionamiento operante

Refuerzo positivo

Como su nombre lo indica es un refuerzo positivo que busca aumentar la frecuencia de una

respuesta a mayor escala. Este es el método más efectivo para que los seres vivos aprendan

determinadas conductas que se desean.

Refuerzo negativo

Así como los refuerzos negativos también son un método de aprendizaje, el cual busca

reducir una respuesta o acción del sujeto. Se le denomina refuerzos debido a que aumentan

o disminuye la cantidad de respuestas o acciones específicas.

El reforzamiento: tipos y programas


El reforzador es todo estímulo que sigue inmediatamente a una
respuesta y que incrementa la probabilidad de que ésta se repita.

Tipos de Reforzadores

A) Positivos y Negativos

Los estímulos que actúan como reforzadores pueden ser de dos tipos.
Los positivos (normalmente placenteros) son los que se añaden a una
situación. Ej: la comida tras realizar una conducta. Son negativos
(normalmente aversivos o desagradables) los que se suprimen de una
situación. Ej: eliminar un ruido fuerte.

Ambos tienen el mismo efecto: aumentar la probabilidad de la respuesta.


La diferencia entre el reforzamiento negativo y el castigo es que el
primero tiene como finalidad incrementar la probabilidad de que la
repuesta se repita, mientras que el castigo persigue suprimir la
respuesta. Otra diferencia es que el reforzamiento negativo termina o
desaparece cuando se produce la respuesta, mientras que el castigo
sobreviene tras la emisión de la respuesta.

b) Primarios y secundarios

Son primarios los reforzadores que tienen un valor reforzante de un


modo natural para el sujeto, sin que éste tenga que ser adiestrado para
ser reforzado por ellos. Ej: comida.

Los secundarios no poseen ese valor reforzante de un modo natural, sino


que lo adquieren por asociación con un reforzador primario. Ej: dinero.
Son aprendidos. Dentro de éstos son importantes los reforzadores
sociales, que son los que provienen de otras personas, como la
aprobación, reconocimiento, afecto, pero no obran por igual en todas las
personas y en todas las situaciones.
Condicionamiento
Operante: Definición,
Tipos, Programas y
Autores
6 ABRIL, 2018 ESCRITO POR PSICOCODE5 COMENTARIOS

Antecedentes del Condicionamiento Operante:


Thorndike
Thorndike estableció las bases del condicionamiento operante, aunque
Skinner fue su figura principal. Thorndike realizó experimentos con gatos
en su “caja problema”. A partir de sus observaciones, formuló algunas
leyes del aprendizaje:
1. Ley del efecto: cuando se establece una conexión E-R, esta conexión
se fortalece si va seguida de una consecuencia satisfactoria y se debilita
si va seguida de una consecuencia desagradable. La idea de que las
respuestas que producen consecuencias satisfactorias tenderán a
repetirse es la piedra básica del condicionamiento operante. Más
adelante, modificó esta ley, pues comprobó que las consecuencias
desagradables no siempre debilitan la conexión, y la redujo a su aspecto
positivo.

2. Ley del ejercicio: o ley del uso y del desuso, nos dice que las
conexiones E-R se fortalecen con el uso y se debilitan con el desuso.
Cuando habla de práctica o de ejercicio, entiende una práctica seguida
de recompensa.

3. Ley de la disposición: el aprendizaje, en una determinada situación,


sólo es eficaz cuando las estructuras nerviosas que intervienen en el
establecimiento de las conexiones E-R están dispuestas para establecer
dichas conexiones. La ejecución forzada de una respuesta ante un
estímulo es perjudicial.

Skinner y el Condicionamiento Operante


Skinner sostiene que los procesos mentales no son necesarios para
comprender y explicar la conducta de los sujetos, y que la conducta se
adquiere o se aprende mediante conexiones ente estímulos y
respuestas.

Distingue dos clases de conducta:

La conducta respondiente es provocada por estímulos conocidos,


como la contracción de la pupila ante la luz. Para el CC toda conducta es
respondiente.

Por otra parte está la conducta operante, que es emitida por el


organismo, sin necesidad de recurrir a ningún estímulo conocido.

Skinner cree que la mayor parte de la conducta es operante: andar


escribir… donde no es fácil identificar el estímulo que la produce. Un
operante es una parte identificable de la conducta de la que hay que
decir no que carezca de estímulo que la elicite, sino que cuando se
observa es imposible hallarlo. Lo característico de las respuestas
operantes es que son espontáneas y no reactivas.

Sus experimentos básicos consistían en una situación en la que un


animal emitía la respuesta deseada y a continuación recibía la
recompensa o reforzamiento. Sus trabajos los realizaba en la “caja de
Skinner”, un aparato en el que al accionar un dispositivo, caía la comida
en un recipiente.

Una vez que se producía la respuesta, recibía una bolita de comida, con
lo que se consolidaba la respuesta. Existen semejanzas entre el
condicionamiento simple y operante: las leyes de adquisición, extinción,
recuperación espontánea, generalización y discriminación obedecen a
los mismos principios.

Además, la mayoría de las variables del condicionamiento afectan de una


manera semejante a ambos tipos de condicionamiento. Pero también
existen diferencias. Kimble señala que la distinción básica entre ambos
condicionamientos está en las consecuencias de la RC. En el CC, la
consecuencia de los fenómenos es independiente de lo que haga el
sujeto.

Pero en el CO, la recompensa es consecuencia de la respuesta. En el


reforzamiento, en el CC, el EC se presenta a la vez que el EI y después
se produce la respuesta. El reforzamiento, pues, se halla asociado con el
estímulo. En el CO, el reforzador sobreviene después, esto es, es
contingente con la respuesta.

El reforzamiento: tipos y programas


El reforzador es todo estímulo que sigue inmediatamente a una
respuesta y que incrementa la probabilidad de que ésta se repita.

Tipos de Reforzadores

A) Positivos y Negativos
Los estímulos que actúan como reforzadores pueden ser de dos tipos.
Los positivos (normalmente placenteros) son los que se añaden a una
situación. Ej: la comida tras realizar una conducta. Son negativos
(normalmente aversivos o desagradables) los que se suprimen de una
situación. Ej: eliminar un ruido fuerte.

Ambos tienen el mismo efecto: aumentar la probabilidad de la respuesta.


La diferencia entre el reforzamiento negativo y el castigo es que el
primero tiene como finalidad incrementar la probabilidad de que la
repuesta se repita, mientras que el castigo persigue suprimir la
respuesta. Otra diferencia es que el reforzamiento negativo termina o
desaparece cuando se produce la respuesta, mientras que el castigo
sobreviene tras la emisión de la respuesta.

b) Primarios y secundarios

Son primarios los reforzadores que tienen un valor reforzante de un


modo natural para el sujeto, sin que éste tenga que ser adiestrado para
ser reforzado por ellos. Ej: comida.

Los secundarios no poseen ese valor reforzante de un modo natural, sino


que lo adquieren por asociación con un reforzador primario. Ej: dinero.
Son aprendidos. Dentro de éstos son importantes los reforzadores
sociales, que son los que provienen de otras personas, como la
aprobación, reconocimiento, afecto, pero no obran por igual en todas las
personas y en todas las situaciones.

Programas de Reforzamiento

La efectividad del condicionamiento depende sobre todo del modo de


efectuar el reforzamiento. El programa más sencillo de reforzamiento es
el reforzamiento continuo, que consiste en aplicar el reforzador cada vez
que se produce la respuesta deseada.

Las respuestas operantes se consolidan mejor cuando el reforzador se


aplica de manera inmediata cada vez que el sujeto emite la respuesta
deseada. Pero una vez que una respuesta operante ha sido
condicionada, las respuestas aprendidas se mantienen mejor cuando el
reforzador no se aplica de forma continuada, sino de manera
intermitente.
Ferster y Skinner describen cuatro programas básicos de
reforzamiento intermitente:

a. Programas de razón fija (RF): la recompensa o reforzador se


administra tras la realización de un determinado número de respuestas
operantes. El más sencillo es aquél en el que la recompensa se presenta
alternativamente, esto es, cada dos respuestas. La idoneidad de
establecer una tasa u otra depende de la rapidez con que se sucedan
respuestas. Los programas RF producen una frecuencia alta de
respuestas siempre que la razón no sea muy alta.

b. Programas de razón variable (RV): son semejantes a los anteriores,


pero se diferencian en que el número de respuestas entre una
recompensa y otra varía aleatoriamente, oscilando en torno a un valor
medio, de manera que el sujeto nunca sabe si su respuesta será
reforzada.

c. Programas de intervalo fijo (IF): consisten en administrar el


reforzador tras un periodo o intervalo fijo de tiempo, independientemente
de las respuestas que emita el sujeto.

d. Programas de intervalo variable (IV): coinciden con los anteriores,


excepto en que los intervalos de tiempo de un reforzador a otro varían
aleatoriamente, oscilando en torno a un valor medio.

Estímulos discriminativos
En el CC el animal aprende a responder en virtud del principio de
generalización ante otros estímulos. En ese caso se podía hacer uso de
la discriminación: el mejor procedimiento es el método de contraste, que
consiste en presentar por un lado, el EC que se quiere consolidar
seguido del EI, y por otro, en presentar los estímulos que se quieren
neutralizar sin el EI.

En el CO las respuestas son espontáneas, no elicitadas por un estímulo


identificable del ambiente. Sin embargo, es posible utilizar estímulos
discriminativos, es posible presentar el reforzador sólo en el caso de que
un determinado estímulo (estímulo discriminativo) preceda a la
respuesta. Las conductas operantes pueden ser puestas bajo el control
de estímulos antecedentes, esto se conoce como control del estímulo o
control de los antecedentes.

Los estímulos discriminativos se distinguen de los elicitantes en que


éstos últimos preceden a la respuesta y la suscitan. Los estímulos
discriminativos invitan a la respuesta, pero no la provocan. Sólo indican
que la recompensa o reforzamiento está disponible

El término “análisis conductual aplicado” o “análisis de conducta aplicado” hace


referencia a un tipo de procedimiento que utiliza los principios y técnicas de la
psicología del aprendizaje para modificar el comportamiento de personas que
necesitan ayuda. De modo más concreto, el análisis conductual aplicado se basa
en el paradigma operante skinneriano.
En general consiste en sustituir conductas inadecuadas por otras funcionalmente
equivalentes pero más deseables. Para ello es necesario llevar a cabo en primer
lugar el análisis funcional de la conducta, es decir, determinar las
contingencias entre la respuesta, la motivación para ejecutarla, los estímulos que
la anteceden y las consecuencias que la mantienen.
El concepto es muy cercano al de modificación de conducta; en la actualidad
ambos se utilizan con frecuencia de forma intercambiable, si bien se considera
que “análisis conductual aplicado” resulta más correcto por tener un significado
más amplio y por destacar la relevancia del análisis funcional de la conducta.
Esta disciplina se ha aplicado de forma muy particular para favorecer la
educación de niños con trastornos del espectro autista (especialmente la
relativa al lenguaje), si bien se utiliza también en personas con diversidad
funcional intelectual o física, con trastornos mentales severos o con
dependencia a sustancias, así como en contextos no clínicos ni educativos.

You might also like