Professional Documents
Culture Documents
Un AR no es un análisis de correlación
Análisis de regresión para la
estatura de los hijos
Recta de
regresión
El promedio de la
estatura de los hijos
aumenta conforme lo
hace la estatura de los
padres
Datos en econometría
Series de tiempo. Conjunto de observaciones sobre
los valores que toma una variable en diferentes
momentos del tiempo (diaria, semanal, mensual
trimestral semestral, anual)
Series de corte transversal. Son datos de una o más
variables recogidos en el mismo momento del tiempo,
tales como el censo de población que realiza el
Instituto Nacional de Estadísticas o una encuesta.
Información combinada. Estos datos tienen
elementos de series de tiempo y de corte transversal.
Un tipo especial de datos agrupados son los datos de
panel, en la cual una unidad (familia o empresa) es
seguida a través del tiempo
Datos en econometría
Aunque existe cuantiosa información disponible
para la investigación económica, la calidad de esta
no siempre es buena.
Causas de mala calidad de la información:
La mayor cantidad de información es de tipo no
experimental
Hay errores de medición en las variables
Se producen sesgos de selectividad cuando no todos
completan la información consultada en una encuesta
La calidad del estudio econométrico dependerá de
cuan buena sea la calidad de la información
disponible.
Función de regresión poblacional
(FRP)
Función de regresión poblacional
(FRP)
¿Qué forma toma la función f ?
Si la relación es lineal, entonces la FRP toma la forma
𝐸 𝑌Τ𝑋 = 𝛽0 + 𝛽1 𝑋
Si la relación es cuadrática, entonces la FRP toma la
forma 𝐸 𝑌Τ𝑋 = 𝛽0 + 𝛽1 𝑋 + 𝛽2 𝑋 2
Los β son los parámetros poblacionales del modelo
La FRP asume que se dispone de toda la información
de la población
La FRP establece una relación determinística entre el
valor promedio de Y (condicional a los valores de las
X) y las X.
FRP lineal
Linealidad en parámetros y
variables
Una FRP es lineal en parámetros si los parámetros
están multiplicados, divididos y elevados a 1.
Una FRP es lineal en variables si las variables
explicativas están multiplicadas, divididas y
elevadas a 1.
Por ejemplo, la FRP cuadrática es lineal en
parámetros pero no es lineal en variables
Error poblacional, μ
Si se plantea la especificación estocástica de la
FRP se debe agregar un término de error
poblacional estocástico, μ, que toma valores
positivos y negativos desconocidos
𝐸 𝑌ൗ𝑋 = 𝑓 𝑋 + 𝜇
1 y 𝛽
Al despejar 𝛽 0 , tenemos
σ 𝑋 − 𝑋ത 𝑌 − 𝑌ത
1 =
𝛽
σ 𝑋 − 𝑋ത 2
σ𝑥 ∗ 𝑦
1 =
𝛽
σ 𝑥2
Mínimos cuadrados ordinarios
(MCO) en una regresión simple
σ 𝑋2 σ 𝑌 − σ 𝑋 σ 𝑋 ∗ 𝑌
0 =
𝛽
𝑛 σ 𝑋2 − σ 𝑋 2
0 = 𝑌ത − 𝛽
𝛽 1 𝑋ത
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝛽2 𝑋 2
σ 𝑋2
0 =
𝑒𝑒 𝛽 ∗ 𝜎ො
𝑛 σ 𝑋 − 𝑋ത 2
Propiedades estadísticas de los
estimadores de MCO
Un estimador es Mejor Estimador Lineal Insesgado,
MELI, si cumple con las siguientes características
Lineal, es decir, función lineal de una variable
aleatoria, tal como la variable dependiente Y en el
modelo de regresión.
𝑦 2 = 𝑦ො 2 + 𝜇Ƹ 2
1 2 𝑥 2 + 𝜇Ƹ 2
𝑦2 = 𝛽
Bondad del ajuste de una
regresión: R2
1 2 𝑥 2 + 𝜇Ƹ 2
𝑦2 = 𝛽
𝑆𝐸𝐶 𝑆𝑅𝐶
1= +
𝑆𝑇𝐶 𝑆𝑇𝐶
2
σ 𝑌 − 𝑌ത σ 𝜇ො 2
1= +
σ 𝑌 − 𝑌ത 2 σ 𝑌 − 𝑌ത 2
Bondad del ajuste de una
regresión: R2
Se define
2
σ 𝑌 − 𝑌ത 𝑆𝐸𝐶
2
𝑅 = =
σ 𝑌 − 𝑌ത 2 𝑆𝑇𝐶
Alternativamente
σ 𝜇
ො 2
𝑅2 = 1 −
σ 𝑌 − 𝑌ത 2
𝑆𝑅𝐶
𝑅2 = 1−
𝑆𝑇𝐶
El valor del coeficiente de determinación esta entre 0
y 1.
Bondad del ajuste de una
regresión: R2
El coeficiente de determinación, R2, mide la
proporción o el porcentaje de la variación total en Y
explicada por el modelo de regresión
1 = 𝑘 ∗ 𝑦
𝛽
𝑥
Donde 𝑘 = σ 𝑥2
1 = 𝑘 ∗ (𝛽0 + 𝛽1 𝑋 + 𝜇)
𝛽
Normalidad de los errores
poblacionales
De la expresión anterior se puede advertir que todos
los componentes son fijos a excepción de μ, de lo cual
se desprende que
El estimador es una variable aleatoria
La distribución de probabilidad que se asuma de μ
determinará la distribución que asuma el estimador.
Un supuesto utilizado usualmente es normalidad,
basado en una justificación estadística (Teorema
del límite central)
𝜇 ∼ 𝑁𝐼𝐷 0, 𝜎 2
Normalidad de los errores
poblacionales
Teorema del límite central
Este teorema plantea que se puede demostrar que
si existe un gran número de variables aleatorias
independientes e idénticamente distribuidas
entonces, con pocas excepciones, la distribución
de su suma tiende a ser normal a medida que el
número de tales variables se incremente
indefinidamente.
Una variante del Teorema establece que aunque el
número de variables no sea muy grande o si estas
variables no son estrictamente independientes, su
suma puede aun estar normalmente distribuidas.
Propiedades estadísticas de los
estimadores MCO bajo normalidad
Son insesgados
Tienen varianza mínima
Son consistentes, esto es, a medida que el tamaño
de la muestra aumenta indefinidamente, los
estimadores convergen a sus verdaderos valores
poblacionales
2 2 σ𝑛
𝑖=1 𝑋
2
0 ~𝑁(𝛽0 , 𝜎
𝛽 ); 0 = 𝛽0 ;
𝐸 𝛽 𝜎𝛽 = σ𝑛 ∗ 𝜎2
𝛽0 0 𝑛 𝑖=1 𝑋−𝑋ത 2
Entonces,
0 − 𝛽0
𝛽
𝑧= ~𝑁(0, 1)
𝜎𝛽0
Propiedades estadísticas de los
estimadores MCO bajo normalidad
2
ෝ
𝜎
2
1 ~𝑁(𝛽0 , 𝜎 1 = 𝛽1 ; 2
𝛽 𝛽1
); 𝐸 𝛽 𝜎𝛽 = σ𝑛 ത 2
1 𝑖=1 𝑋−𝑋
Entonces,
1 −𝛽1
𝛽
𝑧= ~𝑁(0, 1)
𝜎𝛽
1
ෝ2
𝜎
(𝑛 − 2) 2 ~𝑋 2 (𝑛 − 2) antecedente que es útil para
𝜎
realizar inferencia de la varianza de los errores
poblacionales
0 , 𝛽
(𝛽 1 ) se distribuyen de manera independiente
respecto a 𝜎ො 2
Propiedades estadísticas de los
estimadores MCO bajo normalidad
0 𝑦 𝛽
𝛽 1 tienen varianza mínima entre todas las clases
de estimadores insesgados, lineales y no lineales. De
esta forma, los estimadores MCO son los mejores
estimadores insesgados (MEI), es decir tienen
varianza mínima en toda la clase de estimadores
insesgados.
𝛽መ − 𝛽
𝑡= ~𝑡𝛼 (𝑛 − 2)
𝜎ො𝛽 2
𝛽መ − 𝛽
𝑡= ~𝑡𝛼 (𝑛 − 2)
መ
𝑒𝑒(𝛽) 2
Coeficiente
de confianza
Prueba de significancia
Es un procedimiento mediante el cual se utilizan los
resultados muestrales para verificar la verdad o
falsedad de una hipótesis nula
Se debe construir un estadístico de prueba y
contrastarlo con un estadístico de tabla
Inferencia estadística en un AR
simple
Testeo de los parámetros beta poblacionales
𝛽መ − 𝛽
𝑡= ~𝑡𝛼 (𝑛 − 2)
መ
𝑒𝑒(𝛽) 2
Criterio de decisión
Si 𝑡 ≥ 𝑡𝛼 (𝑛 − 2), entonces se rechaza la H0
2
Tabla de distribución t
Inferencia estadística en un AR
simple
Inferencia estadística en un AR
simple
P-value.
Es la probabilidad exacta de cometer un error
tipo I.
Más técnicamente, el valor P esta definido
como el nivel de significancia más bajo al cual
puede rechazarse una hipótesis nula.
Criterio de decisión
Si el P-value ≤ α, se rechaza la hipótesis nula
Inferencia estadística en un AR
simple
¿Los errores son normales?. ¿Cómo lo podemos
determinar?
De no ser normales, se invalida la inferencia
estadística realizada, ya que la construcción de I de
C y las pruebas de significancia se hizo sobre la base
de normalidad de los errores poblacionales
Pruebas
Prueba gráfica. Construir un histograma con los
errores estimados y ver si se parece a una distribución
normal.
Prueba estadística. Test de Jarque-Bera (JB).
Inferencia estadística en un AR
simple
El test de JB se construye utilizando los errores
estimados y es un test asintótico, vale decir, esta
construido para muestras grandes (n>100)
La H0 de la prueba de JB es que hay normalidad en
los errores poblacionales
𝑆2 𝐾−3 2
𝐽𝐵 = 𝑛 + ~𝑋𝛼2 (2)
6 24
Criterio
Si JB > 𝑋𝛼2 (2), entonces se rechaza H0, vale decir, no
habría evidencia para plantear normalidad de los
errores
Distribución X2
Ejercicio
Testeo de hipótesis con I de C y prueba de
significancia
Uso e interpretación de P-value para testear
hipótesis
Evaluar la validez del testeo de hipótesis
Estimación puntual en un AR
múltiple
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝜇
2
Min σ 𝜇ො 2 = σ 𝑌 − 𝛽መ0 − 𝛽መ1 𝑋1 − 𝛽መ2 𝑋2 = 𝑓 𝛽መ0 , 𝛽መ1 , 𝛽መ2
O equivalentemente
𝜎2
𝑉 𝛽መ1 =
σ 𝑥12 (1 − 𝑟1,2
2
)
Donde:
2
𝑟1,2 = Coeficiente de determinación de X1 con respecto a X2
O equivalentemente
𝜎2
𝑉 𝛽መ2 =
σ 𝑥22 (1 − 𝑟2,1
2
)
σ 𝜇
ො 2Τ 𝑛 − 𝑘
𝑅ത 2 = 1 −
σ 𝑦2Τ 𝑛 − 1
H0: 𝛽1 = 𝛽2 = 0
H1: 𝛽1 ≠ 𝛽2 ≠ 0
Regla de decisión
Si 𝐹 > 𝐹𝛼 𝑘 − 1, 𝑛 − 𝑘 , entonces se rechaza la H0.
Luego, el modelo es significativo
Distribución F
k = parámetros estimados = 3
n=15 observaciones
α=5%
Inferencia estadística en un AR
múltiple
La prueba F puede construirse a partir del
coeficiente de determinación.
𝑅2 Τ 𝑘 − 1
𝐹= 2 ~𝐹𝛼 𝑘 − 1, 𝑛 − 𝑘
1−𝑅 Τ 𝑛−𝑘
Regla de decisión
H0: 𝛽1 = 𝛽2
H1: 𝛽1 ≠ 𝛽2
El modelo restringido sería el siguiente
𝑌 = 𝛽0 + 𝛽2 (𝑋1 + 𝑋2 ) + 𝜇
𝑌 = 𝛽0 + 𝛽2 𝑍 + 𝜇
El cual genera una SRCR y un R2R
Inferencia estadística en un AR
múltiple
Construir F, donde m = 1
Regla de decisión
Si 𝐹 > 𝐹𝛼 𝑚, 𝑛 − 𝑘 , se rechaza H0, de lo contrario
no se rechaza
Inferencia estadística en un AR
múltiple
Restricciones lineales de parámetros
Sea el siguiente modelo 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝜇
Dicho modelo no esta restringido, y genera una
SRCNR y un R2NR
Se desea testear la siguiente hipótesis
H0: 𝛽1 + 𝛽2 = 1
H1: 𝛽1 + 𝛽2 ≠ 1
𝑌 = 𝛽0 + 𝑋1 −𝛽2 𝑋1 + 𝛽2 𝑋2 +𝜇
𝑌 − 𝑋1 = 𝛽0 + 𝛽2 (𝑋2 −𝑋1 ) + 𝜇
h* = 𝛽0 + 𝛽2 𝑧 + 𝜇
H0: 𝛽2 = 0
H1: 𝛽2 ≠ 0
El modelo restringido sería el siguiente
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝜇
Inferencia estadística en un AR
múltiple
El cual genera una SRCR y un R2R
Construir F, donde m = 1
Regla de decisión
Si 𝐹 > 𝐹𝛼 𝑚, 𝑛 − 𝑘 , se rechaza H0, de lo contrario
no se rechaza
Modelos log-log
Sea la siguiente relación no lineal
𝛽 𝛽
𝑌 = 𝛽0 𝑋1 1 𝑋2 2 ℮𝜇
𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝛽2 𝐷1 + 𝛽3 𝐷1 𝑋 + 𝛽4 𝐷2 + 𝛽5 𝐷1 𝐷2 + 𝜇
Donde:
Y = consumo
X = ingreso
D1= 0 para observaciones entre 1990 y 1998
1 para observaciones después de 1999
Variables cualitativas en un
modelo de regresión
Tiempo Y X D1 Con esta información se desea
1990 10 2 0 testear si hay evidencia de cambio
1991 20 3 0
estructural en 1999 en la función
1992 30 4 0
1993 45 5 0 de consumo poblacional.
1994 65 8 0
1995 70 9 0
De esta forma permite evaluar si
1996 85 10 0 hay cambio estructural y poder
1997 90 12 0
1998 100 14 0
identificar si se da a nivel de la
1999 120 15 1 pendiente, del intercepto o de
2000 122 26 1 ambos.
2001 138 30 1
2002 147 45 1 Esto se realiza analizando los t-
2003 155 60 1
2004 160 65 1
student. (o los p-value).
2005 180 75 1
2006 200 80 1
Variables cualitativas en un
modelo de regresión
𝑌 = 𝛽መ0 + 𝛽መ1 𝑋 + 𝛽መ2 𝐷1 + 𝛽መ3 𝐷1 𝑋
Donde
𝑌 = Comisión de ventas
𝑋 = Volumen de ventas generado por de la persona que
vende
𝑋 ∗ = Valor del umbral de las ventas
𝐷1 = 1 si 𝑋 > 𝑋 ∗ , 0 si 𝑋 < 𝑋 ∗
𝐿𝑛𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝛽2 𝐷1 + 𝜇
Donde
Y = Salario
X = Años de estudios
D1= 1 si es hombre, 0 si es mejer
Insesgamiento: 𝐸 𝛽መ = 𝛽
Causas
Modelos de aprendizajes sobre errores
Errores de especificación del modelo econométrico
Manejo de información de corte transversal
Heteroscedasticidad
Efectos en la estimación
Si el modelo 𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜇 tiene una 𝑉 𝑢𝑖 = 𝜎𝑖2
Entonces, su varianza será diferente a si la varianza
fuera constante
Modelo homoscedastico Modelo heteroscedástico
(1) (2)
𝜎ො 2 σ 𝑥𝑖2 𝜎𝑖2
1 =
𝑉 𝛽 𝑉𝑎𝑟 𝛽መ1 =
σ 𝑥2 σ 𝑥𝑖 2 2
Prueba de Breusch-Pagan-Godfrey
Prueba general de heteroscedasticidad de White
Heteroscedasticidad
Prueba de Breusch-Pagan-Godfrey
Considere el modelo de regresión con k variables
𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝜇 (1)
Si la varianza del error poblacional se describe
como
𝜎𝑖2 = 𝑓 𝛼0 + 𝛼1 𝑍1 + 𝛼2 𝑍2 + ⋯ + 𝛼𝑚 𝑍𝑚
Ojo.
La prueba de White puede ser usada además como
mecanismo para detectar sesgo de especificación
Es un test asintótico
Heteroscedasticidad
Corrección
Si se conoce el patrón de heterocedasticidad usar
MCG (que es MICO en variables originales
transformadas)
Si no se conoce el patrón de heterocedasticidad,
Asumir algún patrón y ajustar la regresión para aplicar
MCG
Ajustar la matriz de Var-Cov con las estimadores
robustos de White (con muestras grandes). Ojo que los
errores estándar pueden ser mayores o menores que
los sin corregir.
Linealizar las variables del modelo, aplicando log a las
variables
Autocorrelación
Significado
Correlación entre términos de error poblacional en
una regresión
Causas
Inercia en series de tiempo
Sesgo de especificación (variable relevantes no
incluidas y/o forma funcional incorrecta)
Variables explicativas rezagadas
Manipulación de datos (construcción de primeras
diferencias)
Autocorrelación
Efectos en la estimación
Los estimadores dejan de ser MELI ya que ya no
son de varianza mínima
La varianza de los errores poblacionales estimada
es sesgada
Es probable que se sobrestime el R2
Las pruebas de t y F dejan de ser válidas
Autocorrelación
Sea el siguiente modelo econométrico
𝑌𝑡 = 𝛽0 + 𝛽1 𝑋𝑡 + 𝜇𝑡
𝜎ො 2 𝜎2 σ 𝑥𝑡 𝑥𝑡−1 σ 𝑥𝑡 𝑥𝑡−2 𝑥 𝑥
𝑛−1 1 𝑛
1 =
𝑉 𝛽 𝑉𝑎𝑟 𝛽መ1 = 1 + 2𝜌 + 2𝜌 2
+ ⋯ … + 2𝜌
σ 𝑥2 𝐴𝑅(1) σ 𝑥2 σ 𝑥𝑡2 σ 𝑥𝑡2 σ 𝑥𝑡2