Los análisis teóricos y de laboratorio sobre condicionamiento
instrumental tuvieron sus comienzos con el trabajo de E. L Thorndike. El intento original de Thorndike fue estudiar la inteligencia animal. La publicación de la teoría de la evolución de Darwin llevó a que muchas personas se preguntaran hasta qué punto las capacidades intelectuales humanas, como el razonamiento, están presentes en los animales.
Thorndike investigó la inteligencia animal ideando una serie de
cajas problema. Metía un gato hambriento (podía ser también un perro o un pollo) en la caja problema y les colocaba comida fuera, a la vista. La tarea del gato consistía en aprender a escapar de la caja para obtener la comida.
Las diferentes cajas-problema requerían del gato diferentes
respuestas para salir. Algunas eran más fáciles que otras. En las cajas más simples, los movimientos aleatorios del gato le llevaban a escapar y a acceder a la comida, Conforme se repetían los ensayos, el gato escapaba cada vez más de prisa.
Enfoques modernos en el estudio del condicionamiento
instrumental u operante.
Thorndike utilizo 15 cajas problema diferente en sus
investigaciones. Cada caja requería diferentes manipulaciones para que el gato saliese. Con el tiempo estas llegaron a ser estándar.
Por el contrario, en otros experimentos se emplea el método
de operante libre, en el cual la respuesta puede efectuarse repetidamente (libremente) una vez que se ha colocado al sujeto en la cámara experimental.
Procedimientos del Condicionamiento instrumental.
Procedimientos de ensayo discreto:
Estos procedimientos son similares al método que Thorndike
utilizó. Cada ensayo de entrenamiento acaba con la retirada del animal del aparato y la respuesta instrumental se realiza solo una vez durante cada ensayo. A menudo se han llevado a cabo algún tipo de laberinto.
Dos laberintos frecuentemente utilizados en la investigación
contemporáneas son: el corredor o laberinto de pasadizo recto contiene una caja de salida en un extremo y una caja de meta en el otro. Otro laberinto muy utilizado es el laberinto en “T”. El laberinto en T, consiste en una caja de salida y dos pasadizos colocados en forma de T. El laberinto en “T” esta bien diseñado para estudiar la conducta de elección.
Procedimientos de operante libre:
Permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones. Ideado por Skinner (1938). Para estudiar la conducta de una manera más continuada de lo que es posible en los laberintos. Propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado.
Una respuesta operante, se define a partir del efecto que
produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta operante. El elemento fundamental es la forma en que la conducta opera en el ambiente.
Entrenamiento del comedero y moldeamiento:
La mayoría de las ratas situadas en una caja Skinner no
presionan la palanca con frecuencia. Hay algunos pasos preliminares. En primer lugar, los animales tienen que aprender cuando esta disponible la comida en el comedero: el sonido del dispensador de comida es repetidamente emparejado con la entrega de una bolita de comida en el cuenco. El dispensador de comida de denomina “comedero”. Tras suficientes emparejamientos del sonido del dispensador, el sonido llega a elicitar una respuesta de seguimiento del signo: el animal se dirige al comedero y recoge una bolita de comida. Esta fase preliminar se llama entrenamiento al comedero.
Cuando se ha establecido una respuesta operante como la
presión de palanca, la forma en que el organismo cumple la operación requerida en el ambiente no importa. Los pasos utilizados en el moldeamiento de la conducta continúan afectando a la forma de realizar la respuesta. Con entrenamiento prolongado, la respuesta llega a ser mas eficiente e involucra menos gasto de energía.
Moldeamiento y conducta nueva:
El condicionamiento instrumental incluye la construcción o
síntesis de una nueva unidad conductual a partir de componentes de respuestas preexistentes que ya se encuentran en el repertorio del sujeto.
El condicionamiento instrumental puede utilizarse para
producir respuestas que no se parecen en nada a lo que el individuo es probable que haga sin entrenamiento. Estas nuevas respuestas se crean por moldeamiento.
La tasa de respuesta como medida en la conducta
operante
Frente a las técnicas de ensayo discreto para la conducta
instrumental, los métodos de operante libre permiten una observación continua durante largos períodos. Es el organismo quien determina la frecuencia de su respuesta instrumental. Las técnicas de operante libre proporcionan una ocasión especial para observar cambios en la probabilidad de la conducta a lo largo del tiempo.
La medida de velocidad y de latencia que se emplean en los
ensayos discretos no permite que se repita la respuesta. Skinner propuso una tasa de ocurrencia de una conducta operante (frecuencia de la respuesta por minuto por ejemplo), que se utilizase como una medida de la probabilidad de respuesta.
Las respuestas más probables ocurren con frecuencia y
muestran una tasa alta. Por el contrario las respuestas improbables ocurren esporádicamente y muestran una tasa baja.
Elementos fundamentales del Condicionamiento
instrumental.
En todas las situaciones del condicionamiento instrumental, el
sujeto realiza una respuesta y por tanto produce una consecuencia.
Los procedimiento difieren en qué tipo de estímulo (apetitivo o
aversivo) es controlado por la respuesta instrumental y si la respuesta produce o elimina el estímulo. Reforzamiento positivo:
Es un procedimiento en que la respuesta instrumental
aproxima o produce un estímulo apetitivo. Si se da la respuesta, es estímulo apetitivo se presenta, si no se da la respuesta el estímulo apetitivo no se presenta. Por tanto, existe una contingencia positiva entre la respuesta instrumental y el estímulo positivo. El reforzamiento positivo produce un incremento en la tasa de respuesta.
Castigo:
En un procedimiento de castigo la respuesta instrumental
produce o aproxima un estímulo molesto o aversivo. Hay una contingencia positiva entre la respuesta instrumental y el estímulo consecuente, pero el resultado es un estímulo aversivo. Los procedimientos de castigo producen una disminución en la respuesta instrumental.
Tanto el reforzamiento positivo como el castigo incluyen una
contingencia positiva entre la respuesta instrumental o el estímulo resultante.
Reforzamiento Negativo:
Tanto el reforzamiento positivo como el castigo incluyen una
contingencia positiva entre la respuesta instrumental y el estimulo resultante.
Escape:
El estímulo aversivo se presenta pero puede ser eliminado por
la respuesta instrumental. La presencia de un estímulo aversivo establece la ocasión para la ocurrencia de la respuesta instrumental. La respuesta instrumental entonces es reforzada por la terminación del estímulo aversivo.
Evitación:
Implica la programación de un estímulo aversivo para ser
presentado en algún momento de futuro. En este caso la respuesta instrumental previene la entrega del estímulo aversivo.
Entrenamiento por omisión:
La respuesta instrumental previene la presentación de un
estímulo apetitivo o placentero. Es el método ideal para disuadir la conducta humana debido a que, al contrario que el castigo, no implica la presentación de un estímulo aversivo, pero, se retiran fuentes de reforzamiento positivo.
Los procedimientos de entrenamiento de omisión se
denominan en ocasiones reforzamiento diferencial de otras conductas (RDO). Refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta especificada por el procedimiento.
La realización de la conducta crítica deviene en la omisión de
la recompensa que podría haber sido obtenida si el individuo hubiese llevado a cabo alguna "otra" conducta. Por tanto, el entrenamiento de omisión implica el reforzamiento de "otras" conductas.
La estructura asociativa del Condicionamiento
instrumental.
El condicionamiento instrumental implica el aprendizaje de una
asociación tripartita entre el estímulo E, la respuesta R, y la consecuencia C; Esto remite al principio básico estructural del condicionamiento instrumental La Ley del Efecto formulada por Thorndike, lo cual no es más que E-R, es decir, el resultado de un emparejamiento de la respuesta instrumental (R) y un estímulo contextual (E) los cuales están presentes cuando la respuesta es reforzada. Thorndike supone que el único papel del reforzador es fortalecer la asociación E-R. El reforzador en si no forma parte de esta asociación. Regulación conductual
La economía Conductual es el estudio de la manera en el que
los organismos deciden la distribución de su tiempo y energía entre varias conductas. Una regla que rige las elecciones es el llamado principio de Premack, el cual establece lo siguiente, que la oportunidad para desempeñar una conducta muy frecuente puede reforzar el desempeño de una conducta menos frecuente. Una extensión del principio de Premack, la hipótesis de privación de respuestas, afirma que cualquier conducta puede ser reforzada si se restringe la oportunidad de desempeñarla.
Análisis personal del tema.
La conducta humana, esta guiada y dirigida por refuerzos, los
cuales son de carácter motivador para dirigir una conducta. Son fundamentales en el aprendizaje sabiendo utilizarlos, para lograr una respuesta esperada hacia los alumnos. Así, se comprueba que el comportamiento es de carácter manipulable, de acuerdo a diferentes autores.
La teoría de los refuerzos es una conducta aprendida, ya que
para que exista el aprendizaje según esta teoría, se debe reforzar la conducta ya sea por un estímulo positivo o también un estímulo negativo. Así se logra aumentar la probabilidad que se repita un comportamiento de aprendizaje en su entorno.
La teoría de Skinner acerca de los refuerzos, explica que
cuando una respuesta otorga satisfacción o placer al ejecutante, esta tiene más posibilidades de ser repetida, como lo demuestra el ratón encerrado en la caja.
Skinner como buen conductista manifiesta su interés por el
estudio de los procesos de aprendizaje, aunque sus ideas han provocado muchas polémicas, sobre todo cuando atacan sus obras que se refieren a los estímulos y los refuerzos. El saber controlar bien una conducta a través de los refuerzos ayudara a las personas a vivir en un mundo más placentero, ya que se podrán por ejemplo eliminar o reducir todas esas conductas aceptadas socialmente como inadecuadas.