5 Condicionamiento Instrumenta

Instituto Politcnico Nacional CICS UST
Carrera Psicologa
Teoras del aprendizaje Ensayo Parte 2
Profesor: Estrada Salas Jess

Integrantes: Cruz Ramrez Xochitl Itzel Trinidad Mulato Miriam Miguel Ortiz
Fecha de entrega Lunes 15 de abril del 2013
5 Condicionamiento Instrumental; fundamentos

Primeras investigaciones del condicionamiento instrumental
El principio formal de los anlisis tericos y de laboratorio del condicionamiento instrumental fue el trabajo del psiclogo estadounidense El L. Thorndike. Cuyo propsito original era estudiar la inteligencia animal (Thorndike, 1898). Como se menciono, la publicacin de la teora evolutiva de Darwin estimulo las especulaciones sobre el grado en que las capacidades intelectuales humanas estaban presentes en los animales. Thorndike estudio esta cuestin a partir de la investigacin emprica, para lo cual construyo una serie de cajas problemas para sus experimentos. Su procedimiento de entrenamiento consista en colocar a un animal hambriento (un gato, un perro o un pollo) en la caja problema y algo de comida en el exterior de modo que el animal pudiera verla. La tarea del animal era aprender a salir de la caja y obtener la comida. Diferentes cajas problema requeran distintas respuestas para salir. Algunas ms sencillas que otras. El cuidadoso mtodo emprico de Thorndike represento un avance importante en el estudio de la inteligencia animal. Otra contribucin importante fue su estricta evitacin de las interpretaciones antropomrficas de la conducta que observaba. Aunque Thorndike llamo inteligencia animal a su tratado, muchos aspectos de la conducta le pareca mas bien poco inteligentes. No crea que el escape cada vez ms rpido de la caja problema se debiese a que los gatos hubiesen comprendido la tarea o descubierto el diseo del mecanismo de salida. Ms bien, su interpretacin fue que los resultados de sus estudios reflejaban un aprendizaje de una asociacin E-R. cuando un gato era colocado en una caja al principio desplegaba una variedad de respuestas tpicas de un animal. A la larga, alguna de esas respuestas lograba abrir la puerta. Thorndike crea que esos escapes exitosos conducan al aprendizaje de una asociacin entre lo estmulos presentes en la caja problema y la respuesta de escape. A medida que se fortaleca la asociacin, o conexin, entre las seales de la caja y la respuesta exitosa, el animal realizaba la respuesta con mayor rapidez. La consecuencia de la respuesta exitosa fortaleca la asociacin entre los estmulos de la caja y dicha respuesta.
5 Condicionamiento Instrumental; fundamentos |
Con base en su investigacin Thorndike formulo la ley del efecto, la cual plantea que si una respuesta dada en presencia de un estimulo es seguida de un evento satisfactorio, la asociacin entre el estimulo (E) y la respuesta (R) es fortalecida. Si la respuesta es seguida de un evento molesto, la asociacin E-R se debilita. En este punto es importante enfatizar que, de acuerdo con la ley de efecto, lo que se aprende es una asociacin entre la respuesta y los estmulos presentes en el momento en que esta se realiza. Advierta que la consecuencia de la respuesta no es uno de los elementos de la asociacin. La consecuencia satisfactoria o molesta simplemente sirve para fortalecer o debilitarla asociacin entre el estimulo precedente y la respuesta. La ley del efecto de Thorndike implica aprendizaje E-R. El inters por esta forma de aprendizaje se ha mantenido en los 100 aos posteriores a la propuesta de Thorndike, y en la actualidad los seudocientficos la consideran la base de la naturaleza compulsiva de la dependencia a las drogas (Everitt y Robbins, 2005)
Enfoques modernos en el estudio del condicionamiento instrumental

Thorndike utilizo 15 diferentes cajas problema en sus investigaciones. Cada caja requera distintas operaciones para que el gato lograra salir. Conforme mas cientficos se involucraron en el estudio del aprendizaje instrumental, la variedad de tareas que emplearon se hizo mas pequea. Algunas de ellas se volvieron estndar y se han empleado de manera repetida para facilitar la comparacin de resultados obtenidos en diferentes laboratorios.
Procedimientos de ensayo directo

Los procedimientos de ensayo directo comparten, con el mtodo utilizado por Thorndike, el hecho de que cada ensayo de entrenamiento termina con la salida del animal del aparato y en que cada ensayo de entrenamiento termina con la salida del animal del aparato y en que la respuesta instrumental solo se realiza una vez en cada ensayo. Es comn que las investigaciones de la conducta instrumental, con una preparacin de ensayo discreto, se lleven a cabo con algn tipo de laberinto. El uso de laberintos en el estudio del aprendizaje fueron iniciados por el psiclogo estadounidense W: S. Small (1899, 1900) a comienzos del siglo xx. Small estaba interesado en el estudio de las ratas y fue alentado a usar un laberinto por una articulo que ley en Scientific American el cual describa los complejos sistemas de madrigueras subterrneas que construyen las ratas canguro en su habitad natural. Small concluyo que un laberinto sacara provecho de la propensin de las ratas por los pasadizos pequeos y sinuosos. La conducta en el laberinto puede cuantificarse midiendo con la velocidad con la que el animal lega de la caja de inicio a la caja de meta, lo que se denomina velocidad de la carrera. Por lo general, la velocidad de la carrera se incrementa conforme se repiten los ensayos de entrenamiento. Otra medida comn de la conducta en los laberintos es la latencia, que en el caso de respuesta de correr es el tiempo que le lleva al animal salir de la caja de inicio y empezar a desplazarse por el corredor. Regularmente, las latencias disminuyen a medida que se avanza en el entrenamiento. En un laberinto en T tambin puede medirse el porcentaje de elecciones correctas para obtener al final la comida.
Procedimientos de operante libre

Es un corredor o un laberinto en T, despus de que llega la caja meta se saca al animal de aparato por un rato antes de regresarlo a la caja de inicio para el siguiente ensayo. Pro consiguiente, las oportunidades del animal para responder son limitadas y estn programadas por el experimentador. En contraste, los procedimientos de operante libre permiten ala animal repetir, sin restricciones, una y otra vez, la respuesta instrumental. El mtodo de operante libre fue inventado por B:F. Skinner (1938) para estudiar la conducta de manera mas continua de lo que permiten los laberintos.
Teoras del aprendizaje | 15/04/2013
A Skinner le interesaba analizar, en el laboratorio una forma de conducta que fuese representativa de toda la actividad en curso que ocurre de manera natural, pero reconoca que antes de poder analizar experimentalmente la conducta es necesario definir una unidad conductual mensurable. La observacin casual sugiere que la conducta en curso es continua, ya que una actividad lleva a la otra y no se divide en unidades perfectas, como las molculas de una solucin qumica. Skinner propuso el concepto de operante como una forma de dividir toda la conducta en unidades mensurables significativas. Una respuesta operante, como la presin de palanca, se define en trminos del efecto que tiene sobre el ambiente. Las actividades que tienen el mismo efecto ambiental se consideran ejemplos de a misma respuesta operante. El aspecto crucial no son los msculos involucrados en la realizacin de la conducta, sino la forma en que esta opera en el ambiente. Por ejemplo, la operante de presin de palanca por lo general se define como la presin suficiente dela palanca para activar el sensor del registro. La rata
puede presionar la palanca con la pata derecha, con la pata izquierda o con la cola. Estas diferentes respuestas musculares constituyen la misma operante si todas hacen descender la palanca en la cantidad requerida
Entrenamiento del comedero y moldeamiento

Cuando los nios intentan meter una pelota en la canasta, al principio no tienen mucho xito. Muchos intentos terminan con la pelota rebotando contra el tablero o ni siquiera se acercan a la casta. De igual modo, una rata colocada en una caja de Skinner no presionara de inmediato la palanca que le proporciona una pella. E entrenamiento exitosos de una respuesta operante instrumental suele requerir mucha practica y una serie cuidadosamente diseada de pasos de entrenamiento que llevan al estudiante de la categora de novato a la de experto. Tambin existen pasoso preliminares en el establecimiento de la respuesta de presionar la palca por una rata de laboratorio. La rata tiene que aprender primero cuando podr encontrarla comida en el comedero. Esto involucra el condicionamiento clsico: el sonido del dispensador de comida se empareja de manera reiterada con la entrega de un pella en la bandeja. El dispensador de comida se conoce como comedero. Despus de suficientes emparejamientos del sonido del comedero y la entrega de comida, el sonido llega a provocar una respuesta de seguimiento de seales: el animal se acerca a la bandeja y recoge la pella. Esta fase preliminar del condicionamiento se denomina entrenamiento del comedero.
Moldeamiento y conducta nueva

Los procedimientos de moldeamiento se usan frecuentemente para generar nuevas conductas, pero, Qu tan novedosas son exactamente estas conductas? Por ejemplo, considere la respuesta de la rata al presionar la palanca. Para presionara la palanca, el animal tienen que acercarse a la palanca, pararse frente a ella, levantar sus patas delanteras colocarlas sobre la palanca son la fuerza suficiente para desplazarla. Todas esas respuestas componentes son cosas que la rata puede haber hecho en una u otra ocasin en otra situaciones (mientras exploraba su jaula, el interactuar con otra rata manipular la comida). Al entrenar a la rata para presionar la palanca no le estamos enseando nuevas respuestas componentes. Ms bien, le estamos enseando a combinar respuesta familiares en una nueva actividad. El condicionamiento instrumental implica a menudo la construccin o sntesis, de una nueva unidad conductual a partir de componentes prexistentes que ya ocurran en el repertorio del sujeto.
El condicionamiento instrumental tambin emplea se emplea para producir respuestas diferentes a cualquier cosa que el sujeto haya hecho antes. Por ejemplo, considere el lanzamiento de un baln de futbol a una distancia de 54.5 metros. Para conseguir semejante hazaa se necesita algo ms que engazar los componentes conductuales familiares. La fuerza, velocidad y coordinacin involucradas en el lanzamiento del baln a 54.5 metros es diferente de cualquier cosa que pudiera hacer un sujeto no entrenado. La creacin de nuevas respuestas por moldeamiento depende de la variabilidad inherente de la conducta.
La tasa de respuestas como medida de la conducta operante.

En contraste con las tcnicas de ensayo discreto para el estudio de la conducta instrumental, los mtodos libre permiten la observacin continua de la conducta durante periodos prolongados. Con la oportunidad contraste de responder, es el organismo, mas que el experimentador, quien determina la
frecuencia de su respuesta instrumental. Pro lo tanto, las tcnicas de operante libre proporcionan una oportunidad especial de observar cambios en la probabilidad de la conducta a lo largo del tiempo. Cmo podra sacarse ventaja de esta oportunidad y medir la probabilidad de una conducta operante? Las medidas de la latencia y velocidad de la respuesta, que son de uso comn en los procedimientos de ensayo discreto, no describen la probabilidad de una respuesta se repita. Skinner propuso el uso de la tasa de ocurrencia de la conducta operante (es decir, la frecuencia de la respuesta por minuto) como medida de la de la probabilidad de respuesta. Las respuestas altamente probables ocurren con mucha frecuencia y tienen una tasa elevada. En contraste con las respuestas poco probables ocurren de vez en cuando y su tasa es baja. La tasa de respuestas se ha convertido en la medida principal en los estudios que emplean procedimientos de operante libre.
Procedimientos del condicionamiento instrumental

En todas las situaciones de condicionamiento instrumental, el participante emite una respuesta y por consecuencia produce un resultado. Pagarle al vecino por cortar el csped, guiarle al gato por subirse a la barra de la cocina, cerrar una ventana para impedir que entre la lluvia quitarle aun adolecente el privilegio de usar el carro por llegar demasiado tarde son formas de condicionamiento instrumental. Dos de estos ejemplos involucran eventos placenteros (recibir un pago, conducir un auto), mientras que los otros dos estmulos desagradables (el sonido del grito y la entrada de la lluvia por la ventana). El nombre tcnico de un resultado agradable es estimulo apetitivo, mientras que el de un resultado desagradable es estimulo aversivo. La respuesta instrumental puede producir el estimulo, como cuando podar el csped resulta en la obtencin de un pago. Pro otro lado, la respuesta instrumental puede terminar o eliminar un estimulo, como cuando se cierra la ventana para impedir la entrada de la lluvia. Que el resultado de un procedimiento de condicionamiento sea un aumento o disminucin de la tasa de respuestas depende tanto de la naturaleza del resultado como del hecho en que la respuesta produzca o elimine el estimulo En la siguiente tabla se describen los principales procedimientos de condicionamiento instrumental. Nombre del procedimiento. Reforzamiento positivo. Castigo (castigo positivo). Reforzamiento negativo (escape o evitacin). Entrenamiento por omisin (RDO). Contingencia entre respuestas y resultado. Resultado del procedimiento. Reforzamiento o incremento en la tasa de respuestas. Castigo o disminucin en la tasa de respuesta.
Positiva: La respuesta produce

un estimulo apetitivo.
Positiva: La tasa produce un

estimulo aversivo.
Negativa: La respuesta elimina o

impide la presentacin de un estimulo aversivo.
Reforzamiento o incremento en
la tasa de respuestas.
Negativa: La respuesta elimina o

impide la presentacin de un estimulo apetitivo.
Castigo o disminucin en la tasa

de respuestas.
Reforzamiento positivo
Un padre le da galletas a su hija cuando guarda sus juguetes; un profesor elogia a un estudiante cuando este entrega un buen informe; un empleado recibe un bono en su cheque cuando se desempea bien en el trabajo. Todos esos son ejemplo de reforzamiento positivo. El reforzamiento positivo es un procedimiento en e que la respuesta instrumental produce un estimulo apetitivo. Si la respuesta ocurre,
se presenta el estimulo apetitivo; e caso contrario no se presenta. Proe consiguiente, existe una contingencia positiva entre la respuesta instrumental y el estimulo apetitivo. Los procedimientos de reforzamiento positivo producen un incremento en la tasa de respuesta. Requerir que una rata hambrienta presione una palanca para obtener una pella es un ejemplo de reformazmiento positivo que es comn en e laboratorio.
Castigo
Una madre regaa a su hijo por correr en la calle; su jefe lo critica por llegar tarde a una reunin; un maestro le asigna una calificacin reprobatoria por dar una respuesta incorrecta a muchas preguntas del examen. Es un procedimiento de castigo, la respuesta instrumental conduce un evento desagradable o aversivo. Existe una contingencia positiva entre la respuesta instrumental y el estimulo resultante (la respuesta produce el resultado), pero el resultado es un estimulo aversivo. Los procedimientos eficaces de castigo producen una disminucin en la respuesta instrumental.
Reforzamiento negativo
Abrir un paraguas para impedir que la lluvia lo moje, subir las ventanas del automvil para reducir el viento que entra y ponerse los lentes de sol para protegerse del brillo del sol de verano son ejemplos de reforzamiento negativo. En todos esos casos, la respuesta instrumental terina un estimulo aversivo. Por lo tanto existe una contingencia negativa entre la respuesta instrumental y el estimulo aversivo. Los procedimientos de reforzamiento negativo incrementan la respuesta instrumental. Es mas probable que se abra el paraguas si eso impide que una no se moje cuando llueve. La gente suele confundir el reforzamiento negativa con el castigo. En ambos procedimientos se emplea un estimulo aversivo. Sin embargo, la relacin de la respuesta instrumental con el estimulo aversivo diferente es del todo diferente. En los procedimientos de castigo, la respuesta instrumental produce el estimulo aversivo y la contingencia entre la respuesta instrumental y e estimulo aversivo es positiva. En contraste, en el reforzamiento negativo la respuesta termina el estimulo aversivo y existe una contingencia negativa entre respuestas y resultado. Esta diferencia en la contingencia produce resultados muy diferentes. El castigo, disminuye la respuesta instrumental mientras que el reforzamiento negativo lo incrementa.
Entrenamiento por omisin

El entrenamiento por omisin es utilizado cuando a una nia se le ordena ir a su habitacin despus de cometer una travesura. La nia no recibe un estimulo aversivo cuando se le dice que vaya a su cuarto, no hay nada aversivo en la habitacin de la nia. Mas bien, al enviarla a su cuarto el padre esta retirando fuentes de reforzamiento positivo, como jugar con las amigas o ver la televisin. Suspenderle a alguien la licencia de conducir por hacerlo abri tambin constituye un entrenamiento por omisin (retirar el placer y el privilegio de conducir). En este tipo de entrenamiento, la respuesta instrumental impide la entrega de un estimulo placentero apetitivo. Por consiguiente, este procedimiento tambin implica una contingencia negativa entre la respuesta y un evento ambiental. Frecuentemente se prefiere al entrenamiento por omisin para desalentar la conducta humana, pues a diferencia del castigo, no supone la respuesta de un estimulo aversivo. Los procedimientos del entrenamiento por omisin tambin se denomina reforzamiento diferencial de otra conducta (RDO). Dicho termino destaca el hecho de que en el entrenamiento por omisin el individuo recibe de manera peridica une estimulo apetitivo siempre y cuando realice una conducta distinta a la respuesta especifica por el procedimiento. Emitir la respuesta objetiva tiene como resultado
la supresin de la recompensa que se habra entregado si e individuo hubiese realizado otra conducta. Pro consiguiente, el entrenamiento por omisin implica el reforzamiento de otra conducta.
Elementos fundamentales del condicionamiento instrumental

Como veremos en lo0s siguientes captulos, el anlisis del condicionamiento instrumental implica numerosos factores y variables. Sin embargo, ala esencia de la conducta instrumental consiste en que es controlada por sus consecuencias. Por lo tanto, el condicionamiento instrumental involucra fundamentalmente tres elementos: la respuesta instrumental, el resultado de la respuesta (el reforzador) y la relacin de contingencia entre la respuesta y el resultado.
QU ES EL APRENDIZAJE?
Desde el punto de vista evolutivo: es la capacidad de adaptacin al medio ambiente, gracias al aprendizaje podemos conocer las relaciones entre distintos eventos ambientales permitindonos una adaptacin ptima al medio. Dickison (1980) esta capacidad nos da informacin sobre la textura causal del ambiente. Debera entenderse como la capacidad potencial que adquiere un organismo para emitir una conducta, en la literatura se conoce como aprendizaje silencioso y engloba toda aquella informacin aprendida que solo se manifiesta bajo las condiciones ambientales y de motivacin apropiado. Parte de la conducta del individuo no es aprendida si no viene determinada biolgicamente. Un experimento tpico de aprendizaje debe contar con dos condiciones: Condicin experimental: que recibe el tratamiento o entrenamiento en el aprendizaje que se pretende implantar en el individuo. Condicin de control: que no recibe el tratamiento o entrenamiento para el aprendizaje pero si un tratamiento idntico en todo los dems aspectos que ataen la situacin. Reflejo: actos reflejos, son movimientos involuntarios no aprendidos que pueden ser modulados. Es la unidad ms bsica de conducta incondicionada Arco reflejo: forma ms bsica de procesar informacin, implica cuatro elementos; estimul elicitador que desencadena la accin- una neurona sensorial que recibe la informacin externa y la enva a la medula espinal- una interneurona que enva la informacin desde la medula hacia una neurona motora que se encarga de activar el musculo implicado en la respuesta. La exposicin repetida al estimulo elicitador del reflejo lleva a que el sujeto disminuya o aumente su respuesta ante el estimulo, estos dos fenmenos bsicos de aprendizaje se denominan: Habituacin: es la exposicin repetida a dichos estmulos que hacen que se disminuya la respuesta ante estos, ignorndolos. Se adapta a los estmulos hasta ignorarlo. Se atena con el paso del tiempo A mayor frecuencia del estimulo mayor habituacin. A menor intensidad del estimulo mayor habituacin.
Sensibilizacin: a medida que transcurre el estimulo es probable que aumente la respuesta hasta tornarse insoportable.
Sus efectos se observan en otros estmulos diferentes al presentado. A mayor intensidad del estimulo mayor sensibilizacin. A mayor frecuencia del estimulo mayor sensibilizacin.
Habituacin y sensibilizacin son dos procesos opuestos que nos ayudan a regular nuestra respuesta ante el medio permitindonos organizarlo. Los efectos de estos son el resultado de la suma de los procesos subyacentes dependiendo de cul de los dos tengan ms fuerza en el momento determinado. La teora del proceso dual de Groves y Thompson sugiere que estos procesos actan en diferentes partes del cerebro: Habituacin; en el sistema estimulo- respuesta; arco reflejo. Sensibilizacin; sistema de estado; todo lo que no implica el acto reflejo pero influye en su reactividad.
APRENDIZAJE ASOCIATIVO:
Se expresa cuando la reaccin de un organismo ante un estimulo cambia como consecuencia de la relacin que mantenga a este estimulo, se ha estudiado mediante: o El condicionamiento clsico (Pavlov): se caracteriza por el establecimiento de una relacin entre dos estmulos independientemente de la respuesta emitida por el sujeto, nos permite aprender acerca de eventos que estn ms all de nuestro control conductual, sus elementos principales: (EI) (RI) (EC) (RC). o El condicionamiento operante (Thorndike): es una situacin que te permite conseguir o evitar una consecuencia, que se encuentra bajo tu control. Esta situacin se denomina aprendizaje por ensayo y error. Skinner investigo lo rpido y la frecuencia con que el sujeto completa la respuesta instrumental. Sus elementos principales: adquisicin, tcnica de moldeamiento por aproximaciones sucesivas a la conducta. Se instaura en el refuerzo inmediato, es un proceso de seleccin de respuesta. Programas de razn: Son las reglas que determinan el reforzamiento despus del nmero de respuestas emitidas por el individuo. Reforzamiento de razn fija: el nmero de respuestas que tiene que emitir el sujeto entre reforzadores es fijo.
Reforzamiento de razn variable: cuando el nmero de respuestas necesarias para obtener el reforzador vara entre reforzadores. Programas de intervalo: la regla es el tiempo transcurrido desde la ltima vez que se obtuvo el reforzador. Extincin: es cuando una respuesta instrumental deja de ir seguida por el reforzador termina desapareciendo. Tipos de condicionamiento instrumental segn el tipo de consecuencia: Consecuencia APETITIVA (aquellas que el sujeto quiere tener) o AVERSIVA (aquellas que el sujeto prefiere no recibir) y la relacin entre la respuesta y las consecuencias pueden ser positivas (la respuesta produce la consecuencia)o negativa (la respuesta hace que la consecuencia no aparezca) reforzamiento positivo: el sujeto aumenta la realizacin de la respuesta para conseguir el mximo nmero de reforzadores apetitivos posibles.
Castigo: el estimulo que se utiliza como consecuencia es aversivo, algo que el sujeto prefiere no recibir y que tiene una relacin positiva con la respuesta. Castigo negativo u omisin: se establece una relacin negativa entre la respuesta y una consecuencia apetitiva, el sujeto emite una respuesta instrumental deja de conseguir algo que le apetece y que de otro modo hubiese conseguido. Reforzamiento negativo: escape y evitacin, la relacin entre la respuesta y la consecuencia es tambin negativa pero la consecuencia es aversiva.
Aprendizaje social
Las primeras teoras del aprendizaje social parten de la imitacin como proceso fundamental del aprendizaje. Bandura (1986). Puede considerarse una importante fuente de economa cognitiva a la hora de aprender las relaciones entre eventos tan definidas por las teoras tradicionales. Juega un papel esencial en el desarrollo de la conducta de individuos sociales como el ser humano. Las relaciones entre estmulos y entre respuestas y consecuencias pueden aprenderse por experiencias vicarias.
Los elementos bsicos del aprendizaje social:

Caractersticas de modelo: se tiende a imitar aquellos modelos ms afectuosos o reforzantes, esto estar reforzado por el nivel de credibilidad o veracidad que le adscriba el observador. Caractersticas del observador: refleja la presencia de diferencias individuales en la tendencia del observador a imitar un modelo, diferencias referidas fundamentalmente a variables de personalidad. Caractersticas de la situacin: diferentes situaciones pueden demandar diferentes conductas al individuo ms relevante resulta que determinadas situaciones inciten al desarrollo de conductas imitativa.
5 CONDICIONAMIENTO INSTRUMENTAL;
FUNDAMENTOS
En este captulo se aborda una de las maneras que hay para controlar la conducta por medio de la estimulacin aversiva, la cual se concentra en dos tipos de condicionamiento instrumental, la evitacin y el castigo. La evitacin se basa en el incremento del desempeo de una conducta objetivo mientras que el castigo se centra en disminuirla pero el objetivo de ambas es que el individuo aprenda a minimizar su exposicin a la estimulacin aversiva consolidando la conducta deseable o eliminando la conducta indeseable. Las investigaciones experimentales de la evitacin se originaron con los estudios del condicionamiento csico. Los primeros experimentos de evitacin se realizaron por el psiclogo ruso Vladimir Bechterev
quien, como extensin de los trabajos de Pavlov, se interesaba en estudiar el aprendizaje asociativo en seres humanos. En sus experimentos se les indicaba a los participantes que colocaran un dedo sobre una bandeja metlica en la que, despus de una seal de alarma, se dejaba correr una leve corriente elctrica, al recibir la descarga los participantes retiraban el dedo y despus de algunos ensayos aprendieron a retirarlo al presentarse el estmulo de advertencia. Si bien la conducta de evitacin no es un caso de condicionamiento clsico, este ah tenido una gran influencia en los anlisis experimentales y tericos del estudio de la conducta de evitacin. Lo primero que hay que notar en los procedimientos de evitacin discriminada es el hecho de que se utilizan ensayos discretos, los cuales son iniciados por un estmulo de advertencia y que los eventos que ocurran posteriormente dependen enteramente del desarrollo del participante, ya que si el sujeto emite la respuesta objetivo antes de que se aplique el estmulo aversivo el estmulo de advertencia se detiene y se omite el aversivo, considerndose ese ensayo un ensayo de evitacin exitoso, mientras que si el sujeto no emite la respuesta se presentar el estmulo aversivo y se considera un ensayo de escape. Los procedimientos de evitacin implican una contingencia negativa entre una respuesta y un estimulo aversivo ya que si el sujeto emite las respuestas adecuadas no tendr el estmulo aversivo aunque no hay ningn placer que resulte de la respuesta mas que la ausencia del estmulo aversivo. La teora de los dos procesos de la evitacin, propuesta por Mower en 1947 y perfeccionada por Miller en 1951, supone que en el aprendizaje de evitacin participan dos mecanismos. El primero un proceso de condicionamiento clsico activad por un emparejamiento del estimulo de advertencia con el evento aversivo que se presenta si no se realiza la respuesta de evitacin siendo el primer componente de la teora es el condicionamiento clsico del miedo.
El segundo proceso en la teora se basa en el reforzamiento negativo que se le da a la conducta instrumental suponiendo que el aprendizaje de la respuesta de evitacin ocurre cuando la respuesta termina con el estimulo condicionado y por lo tanto reduce el miedo condicionado que provoca el estmulo condicionado, por lo que el segundo componente de la teora podra decirse que es el reforzamiento instrumental de la respuesta de evitacin por medio de la reduccin del miedo.
Gran parte de la investigacin ah sido estimulada por los esfuerzos para demostrar o refutar la teora de los dos procesos y a continuacin consideraremos varios hallazgos importantes que deben ser tomados en cuenta para entender los mecanismos de la conducta de evitacin. La meta de los experimentos de pulsin adquirida es demostrar la operacin de ambos procedimientos separados en una situacin en la que no se entremezclen ambos tipos de condicionamiento. Primero se debe condicionar un miedo a un estimulo condicionado con condicionamiento clsico puro, en la siguiente fase los sujetos son expuestos al estimulo que provoca el miedo y despus les permite realizar una respuesta instrumental para eliminar el estimulo condicionado y reducir el miedo. En la medicin independiente del miedo durante la adquisicin de la conducta de evitacin se basa en la suposicin de que si el miedo motiva y refuerza la respuesta de evitacin el condicionamiento de este y el de la conducta instrumental deben ir de la mano.
En la teora de los dos procesos se supone que la disminucin del miedo es lo que refuerza la respuesta de evitacin por lo cual podemos decir que se trata de un caso de reforzamiento negativo debido a la eliminacin de un estimulo aversivo. El desempeo de una respuesta de evitacin siempre tiene como resultado estmulos de retroalimentacin distintivos. Dado que la respuesta produce un periodo de seguridad los estmulos de retroalimentacin pueden adquirir propiedades inhibitorias y convertirse en seales de la ausencia del estimulo aversivo. La reduccin de la frecuencia de descarga se presento como otro mecanismo de reforzamiento como alternativa a la teora de los dos procesos. Contrariamente a las respuestas de evitacin, de las cuales no nos preocupan lo que est involucrado en la conducta de evitacin, el castigo siempre ah estado presente en el escrutinio pblico ya que es el castigo lo que las sociedades usan como una forma de retribucin por actos que se consideran inapropiados y tambin es utilizado para promover la adhesin a cdigos de conducta. A pesar de las preocupaciones sociales que existen por el castigo los psiclogos experimentales no dedicaron mucha atencin al tema y fue hasta que Thorndike y Skinner efectuaron sus experimentos que se lleg a la conclusin de que este no era eficaz para controlar la conducta ya que sus efectos no son duraderos. Pero esta afirmacin fue cuestionada en 1960 cuando se inicio una investigacin sobre el castigo por Azrin y Holz y otros psiclogos de la poca, gracias a esto sabemos que el castigo puede ser una tcnica muy eficaz para la modificacin de la conducta teniendo parmetros adecuados de procedimiento ya que si no se tienen, la supresin puede ser incompleta y es posible que se reincida en la conducta. El procedimiento del castigo es sencillo, ya que nicamente se trata de presentar un estimulo aversivo despus de una respuesta instrumental objetivo y si se aplica de manera eficaz la respuesta es suprimida. Debido a que el castigo implica la supresin de una respuesta este solo puede observarse en respuestas que tengan probabilidad de ocurrir, por ejemplo en situaciones en las que el objetivo es una actividad daina que sucede con mayor frecuencia de lo deseable. El tiempo fuera no se trata directamente de un castigo sino que se refiere a la eliminacin de la oportunidad de obtener un reforzamiento positivo y su utilizacin es comn al tratar con nios de modo que el tiempo fuera suprime la conducta por un medio no agresivo que simplemente impide que se hagan otras cosas que se disfrutan ms que la actividad de tiempo fuera. La sobre correccin es un mtodo utilizado nicamente en seres humanos ya que este implica pedir que la persona no solo corrija lo que hizo mal sino que sobrecorrija el error. Un factor de gran importancia en el castigo es la forma y frecuencia con la cual se introduce el estimulo aversivo ya que si desde el inicio se aplica un castigo claro y lo ms inmediatamente posible despus de que el sujeto haya realizado la respuesta objetivo la correccin de la conducta ser mucho ms eficiente.
5 Condicionamiento Instrumental; fundamentos | 15/04/2013
TRMINOS CLAVE
Arrastre instintivo Desviacin gradual de la conducta instrumental de las respuestas requeridas para el reforzamiento hacia respuestas tpicas de la especie, o instintivas relacionadas con el reforzador y con otros estmulos de la situacin experimental. Castigo Procedimiento de condicionamiento instrumental en el que existe una contingencia positiva entre la respuesta instrumental y un estimulo aversivo. Si el participante realiza la respuesta instrumental, recibe en estimulo aversivo; si no la lleva a cabo hace, no recibe el estimulo aversivo. Conducta instrumental Actividad que ocurre debido a que produce una consecuencia particular o reforzadora. Conducta supersticiosa Conducta cuya frecuencia se incrementa debido al emparejamiento accidental de la entrega del reforzador con la presentacin de la conducta. Contigidad Presentacin muy cercana en el tiempo de dos eventos, como una respuesta y un reforzador. Se denomina tambin contigidad temporal. Contigidad temporal Lo mismo que contigidad. Contingencia entre respuesta y reforzador Relacin de una respuesta con un reforzador definida en trminos de la probabilidad de ser reforzado para realizar la respuesta en comparacin con la probabilidad de ser reforzador en ausencia de la respuesta. Contraste negativo Disminucin de la respuesta por un reforzador menos deseado o mas pequeo despus de la experiencia previa con un reforzador mas deseado o mas grande que en ausencia con dicha experiencia previa. Contraste positivo Mayor respuesta por un reforzador favorable o grande luego de la experiencia con un reforzador menos deseado o mas pequeo, que en ausencia de dicha experiencia previa. Efecto de desamparo aprendido interferencia con el aprendizaje de nuevas respuesta instrumental como resultado de la exposicin a estimulacin aversiva inescapable e inevitable. Entrenamiento del comedor Etapa preliminar del condicionamiento instrumental en que un estimulo se empareja repentinamente con un reforzador para permitir que el participante aprenda a acercarse y obtener el reforzador cuando se presente. El sonido
del dispensador de comida, por ejemplo, puede emparejarse de manera reitera con el alimento de modo que el animal aprenda a acercarse al comedero cuando se entregue la comida. Entrenamiento por omisin Procedimiento de condicionamiento instrumental en que la respuesta instrumental impide la entrega de un estimulo reforzante. Escape Procedimiento de condicionamiento instrumental en que la respuesta instrumental termina un estimulo aversivo. Estimulo apetitivo Estimulo placentero o satisfactorio que puede usarse para reforzar positivamente una respuesta instrumental Estimulo aversivo Estimulo desagradable o molesto que puede usarse para castigar una respuesta instrumental. Evitacin Procedimiento de condicionamiento instrumental en que la respuesta instrumental impide la entrega de un estimulo aversivo. Hiptesis del desamparo aprendido Idea terica que supone que durante la exposicin a estimulacin aversiva inescapable e inevitable los participantes aprenden que su conducta no controla los eventos ambientales. Esto reduce la motivacin para responder y dificulta el condicionamiento instrumental posterior. Latencia Tiempo entre el inicio de un ensayo (o el inicio de un estimulo) y la respuesta instrumental. Ley del efecto Regla para la conducta instrumental, propuesta por Thorndike, que plantea que si una respuesta emitida en presencia de un estmulo es seguida por un evento satisfactorio, la asociacin entre el estimulo y la respuesta ser fortalecida; si la respuesta es seguida por un evento molesto, la asociacin se debilitara.
Moldeamiento Reforzamiento de las aproximaciones sucesivas a una respuesta instrumental deseada. Pertenencia Idea terica, propuesta originalmente por Thorndike, de que la historia evolutiva de los organismos hace que ciertas repuestas correspondan o sean relevantes para ciertos reforzadores. La pertinencia facilita el aprendizaje.
Procedimiento de ensayo discreto. Mtodo de condicionamiento instrumental en que el participante solo puede realizar la respuesta instrumental durante paridos especificados, que, por lo general, son determinados por la colocacin del participante en la cmara experimental o por la presentacin de un estimulo. Reforzador condicionado Estimulo que se convierte en un reforzador eficaz por su asociacin con un reforzador primario o incondicionado. Se denomina tambin
reforzador secundario.
Velocidad de la carrera La rapidez (por ejemplo, en centmetros por segundo) con que un animal se desplaza por un corredor.

5 Condicionamiento Instrumenta

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

5 Condicionamiento Instrumenta

Uploaded by

Copyright:

Available Formats

Instituto Politcnico Nacional CICS UST

Teoras del aprendizaje Ensayo Parte 2

Profesor: Estrada Salas Jess

Fecha de entrega Lunes 15 de abril del 2013

5 Condicionamiento Instrumental; fundamentos

Enfoques modernos en el estudio del condicionamiento instrumental

Procedimientos de ensayo directo

Procedimientos de operante libre

Entrenamiento del comedero y moldeamiento

Moldeamiento y conducta nueva

La tasa de respuestas como medida de la conducta operante.

Procedimientos del condicionamiento instrumental

Positiva: La respuesta produce

Positiva: La tasa produce un

Negativa: La respuesta elimina o

Negativa: La respuesta elimina o

Castigo o disminucin en la tasa

Teoras del aprendizaje | 15/04/2013

Entrenamiento por omisin

Elementos fundamentales del condicionamiento instrumental

Teoras del aprendizaje | 15/04/2013

Los elementos bsicos del aprendizaje social:

5 Condicionamiento Instrumental; fundamentos |

You might also like