You are on page 1of 94

Asesoría Examen Final

ACA II 2019-1
Karina Ruiz
José Manuel Niño
Asignación de crédito
Distribución
Información óptima del
comportamiento
Propiedades estadísticas del entorno.
• Tiempo
• Lugar
• Covarianza con el comportamiento
1° orden • Covarianza entre SBI

• Tasas de ocurrencia
2° orden

• Incertidumbre
3° orden
Relaciones causales
• Fijas
• Probabilísticas
• Probabilísticas con tasa de cambio probabilística.
Sesgos
• Mecanismo a través del cual reduzco el espacio de posibilidades.

X
X
X
X
X
X
X
X
X
X
X
X
Sesgos Contigüidad (Skinner, Staddon)

Congruencia biológica
(Aversión a sabores)

Novedad
Restricciones Internas
• Mecanismos perceptuales
• Capacidad cognitiva
• Atención

• Delimitación del espacio de elección


Ascenso de colina
1. Detección de un SBI
2. Memoria del SBI
3. Comparación
4. Al menos 2 comportamientos
5. Regla de cambio de comportamiento
6. Adaptación al nuevo valor del SBI
Integrador con Fuga

𝑉𝑘+1 = 𝑎𝑉𝑘 + (1 − 𝑎)𝑅𝑘


Aprendizaje
Ley del efecto. Programas de
Thorndike Reforzamiento. Skinner

Cajas problema Cajas de Skinner

Relación E-R Relación respuesta-


refuerzo
Énfasis en contingencia
Énfasis en tasas relativas
de reforzamiento
Programas de reforzamiento
Número de respuestas Tiempo que va a transcurrir

Razón Intervalo
Fija Variable Fijo Variable

Es el mismo en promedio
Siempre es el mismo
Razón Intervalo
Fija 5 Variable 5 Fijo 20’’ Variable
20’’
5 3 20’’ 15’’
5 4 20’’ 30’’
5 7 20’’ 10’’
5 6 20’’ 20’’
5 5 20’’ 25’’

25 respuestas 25 respuestas 100 segundos 100 segundos


5 reforzadores 5 reforzadores 5 reforzadores 5 reforzadores

1 refuerzo 1 refuerzo
cada 5 cada 20
respuestas segundos
Patrones de respuesta.
Regularidades
• Tasas más altas en programas de razón.

• Tasas constantes en programas variables y pausas en programas fijos.


Cajas acopladas
• Tasas de respuesta dadas por tasas de reforzamiento.

Reforzador
Explicación
• Otras variables interviniendo.

 Contexto
 Disposición de la ocasión
 Estímulos discriminativos
 Reforzadores condicionados.
 Tiempos entre respuestas
 Correlación
TER
• Propiedad de las respuestas que puede ser reforzada.

R1 R2 R3 R4 R5

A mayor TER menor tasa de respuesta


Correlación
• Relación entre lo que hago y lo que obtengo.

• Esta correlación es más clara en los programas de razón que en los


programas de intervalo.
Igualación
Programas Concurrentes
𝑅1
𝑅1 + 𝑅2
𝑅1 𝑟1
=
𝑅1 + 𝑅2 𝑟1 + 𝑟2

𝑟1
𝑟1 + 𝑟2
𝑅𝑖 = 𝑓(𝑟𝑖 )

Igualación
Contraste Conductual
1 sola respuesta
Desviaciones
Skinner. Relación Lineal
𝑅1 𝑘𝑟1
=
𝑅1 + 𝑅2 𝑘𝑟1 + 𝑘𝑟2

 Igualación
Contraste Conductual
Máxima tasa de respuesta constante
𝑟1
𝑅1 = 𝑘
𝑟1 + 𝑟2

 Igualación
 Contraste Conductual
1 sola Respuesta
Ley del efecto relativa
𝑟1
𝑅1 = 𝑘
𝑟1 + 𝑟𝑜
 Igualación
 Contraste Conductual
 1 sola Respuesta
Desviaciones
Ley Generalizada de Igualación

𝑅1 𝑟1 𝛽
= 𝛼( )
𝑅2 𝑟2
Sesgo Sensibilidad

𝛼=1 𝛽=1

𝛼>1 𝛽>1

𝛼<1 𝛽<1
Igualación Maximización

Tasas locales Tasas globales


Modelos de optimización
1. Competencia temporal
2. Restricciones del entorno
3. Los comportamientos tienen valor y es de ganancias
marginales decrecientes
4. El equilibrio es la distribución del comportamiento con
más valor dadas las restricciones.
1

4
B

A
David Premack.
1. Todo es comportamiento.
2. Comportamiento se puede ordenar en una escala de valor.
(Transitividad)
3. El valor está dado por el tiempo asignado a ese comportamiento.
Punto preferido.

. 𝐵0

A
Elección Intertemporal.
• Consecuencias pueden variar en más de una
dimensión.

 Cantidad
 Demora

1. ¿Cómo adquieren valor estas dimensiones?


2. ¿Cómo se integran estas dimensiones?
¿Cómo afecta el valor la demora?
• Chung y Hernstein (1967)

0’’ 2’’
8’’ 4’’
16’’ 8’’
16’’
24’’
28’’
estándar

experimental
Conclusiones

• Conforme aumenta la demora, los organismos responden menos


• Siempre se contesta en la tecla con menos demora.
¿Cómo se integra?
• Economistas proponen la función exponencial, ya que de esta forma
las preferencias se mantienen iguales.

𝑉=𝐶∗ 𝑒 −𝐷∗𝑘
• Mazur propone la función hiperbólica

𝐶
𝑉=
1 + 𝑘𝐷
• Fase 1:

• Fase 2


Conducta de Compromiso
D

I
Exponencial

Hiperbólica
Exponencial Hiperbólica
Decremento Mayor
proporcional, decremento en
constante demoras
pequeñas.
Elección bajo riesgo
• Las consecuencias no son deterministas, son probabilísticas.

• Bajo riesgo: conozco la distribución de probabilidad.


• Bajo Incertidumbre: No conozco la distribución de probabilidad.
Modelo de la cantidad (valor) esperado

𝐸 𝐶 = 𝑃1 𝑍1 + (1 − 𝑃1 )𝑍2
Modelo de la Utilidad Esperada

1/2
𝑈 𝑍 =𝑍
𝐸 𝑈 = 𝑃1 𝑈(𝑍1 ) + 𝑃2 𝑈(𝑍2 )
Opción segura Opción
Riesgosa
E(C) E(U) E(C) E(U)

E(U)

E(Z)
• Aversión al riesgo: Preferencia por opción segura cuando la Cantidad
Esperada es igual.

• Propensión al riesgo: Preferencia por la lotería cuando la Cantidad


Esperada es igual
Axiomatización Teoría de la Utilidad Esperada.
• Von Neumann y Morgensten (1947)

1. Comparabilidad

Si A≥B & B≥A entonces A~B

2. Transitividad

Si A≥B & B≥C entonces A≥C


3. Cierre

Si A y B*pertenecen S entonces ApB*pertenencen a S

4. Asociativa

[(ApB)qB]~ApqB

5. Cancelación/independencia

Si A≥B entonces (ApC)>(BpC)


6. Solucionabilidad

Si A≥B≥C existe una p que hace que B~ApC

Comprobándolo

ApC=pU(A)+(1-p)U(B)

Si U(A)=1 y U(B)=0

ApC=p(1)+(1-p)(0)=p

Entonces, si U(B)=p ApC~B


Teoría de Prospecto
• Kahneman y Tversky (1979)

Edición Función de valor Pesos de decisión


Proceso de edición.

𝑈𝑖 = 𝑓(𝐶1 − 𝐶0 )

Comparo lo que obtengo contra lo que esperaba obtener (expectativa)


o lo que tenía (memoria).
Función de valor.

𝑥∝ si x≥0
V(x)=

−λ(−𝑥)β si <0
Función de pesos de decisión
Aplanada=menor Efecto de
sensibilidad certidumbre

Mayor
pendiente=
mayor
sensibilidad
Elección binaria
• Pares de opciones.

Seguro pequeño vs Riesgoso grande

Inmediato pequeño vs Demorado grande


Ajuste psicofísico.
• Fijo uno de las opciones mientras varío la otra
hasta encontrar indiferencia entre las opciones.
Evitación.
• Maximización de reforzadores.
• Minimización de consecuencias negativas.
Bechterev
• Escape de 1 sola vía:
Shuttle box Descarga Salto-termina

• Evitación de 1 sola vía:


Tono-descarga Salto-termina

• Evitación de 2 vías:
Alternando lado de la
descarga.
• Ensayos iniciales

¿Cómo es que la no
ocurrencia de algo
• Ensayos posteriores
puede ser reforzante?
Teoría de los Dos Procesos.
1. Asociación Sonido-Estímulo Nocivo (EC-EI)

Estímulo Nocivo Condicionado.

2. Asociación Respuesta-Término de Estímulo Nocivo (R-r)


• Explicación a través de Ansiedad.

• Se hacen registros fisiológicos en los que no encuentran marcadores


de Ansiedad, pero siguen teniendo conducta de evitación.

• Se argumenta automatización.
Sidman

10’’ 20’’
Descarga-descarga Respuesta-Descarga
Extinción
Grupo 1 A+ B- A? Recuperación
Grupo 2 A+ B- B? Inhibición

Organismos aprenden un proceso inhibitorio en un contexto específico.


Inhibitoria

Excitatoria

EC EI

contexto
Grupo 1 Reforzado siempre Extinción más rápida
Grupo 2 Reforzado la mitad Extinción menos
de las veces rápida

Organismos detectan cambios a través de inferencia estadística (bayesiana)


Categorización.
Los organismos pueden diferenciar fotografías de diversidad
entidades, incluso cuando no han tenido experiencia con estas.

• Árboles
• Peces
• Personas

1. Modelo de Atributos/Rasgos
2. Modelo de Prototipo
3. Modelo de Ejemplares
Modelo de Atributos
Los organismos descomponen los ejemplares en atributos y
evalúan la similitud de cada atributo.
Modelo de Prototipo
Los organismos promedian los ejemplares a los que han sido
expuestos y evalúan similitud con ese promedio.
Modelo de Ejemplares.
Los organismos guardan en memoria todas las instancias a las
que han sido expuestos, cuando se exponen a un nuevo
elemento ponderar la similitud de ese nuevo elemento con
todas las instancias guardadas en memoria.
Guttman y Kalish

 
• Los organismos responden a otros estímulos que no es el
original.
• Conforme me alejo físicamente del estímulo original, respondo
menos.
 
 

   

 
• Los espacios de consecuencias se forman por la
disminución en el error de predicción.
Krechevsky. Transposición.


Teoría Relacional: Los organismos no responden a valores absolutos,
responden a relaciones.
Spence propone que los organismos si aprenden valores
absolutos pero la ponderación de los gradientes de
generalización excitatorios e inhibitorios hacen que se
conteste al nuevo estímulo.

Esto fue probado varios años después.


Cambio de pico

 
Roger Sheppard
• ¿Cómo transformo los estímulos físicos para que la forma de
los gradientes de generalización sea igual?

1. Escala 1-7 ¿qué tanto se parecen? Todas las combinaciones


posibles.
2. Lista que va de los más parecidos a los menos parecidos
3. Análisis multidimensional, algoritmo que transforma
similitud en distancia.
Gradientes de
Similitud
Tasa de respuesta generalización

Distancia en espacio multidimensional

You might also like