You are on page 1of 36

Clase 1

Rodrigo Cárdenas Mutis


rodrigo.cardenas.mutis@gmail.com
Nicolás Hardy Hernández
nicolas.hardy.hernandez@gmail.com
Agenda
• Regresión bi-variada

• Método de Mínimos cuadrados ordinarios MCO

• Modelo Clásico de regresión lineal: Fundamentos estadísticos


y propiedades de interés
Modelo de regresión lineal con
dos variables
• 𝑦 = 𝛽0 + 𝛽1 ∗ 𝑥

𝛽0 = término intercepto
𝛽1 =término pendiente
𝑦 = variable explicada o dependiente
𝑥= variable explicativa o independiente

B0 y B1 son parámetros desconocidos y fijos llamados “coeficientes de


regresión”. Intercepto y pendiente respectivamente.
Ideas básicas

• Valores esperados condicionales


¿Qué significa que un modelo
sea lineal?
• Linealidad en parámetros

• 𝑦 = 𝛽0 + 𝛽1 ∗ 𝑥 2

• Linealidad en variables

• 𝑦 = 𝛽02 + 𝛽1 ∗ 𝑥
Función de regresión
poblacional : caso de la recta
𝑦 = 𝑓 𝑥 = 𝐸 𝑦 𝑥𝑖 = 𝐹𝑅𝑃
Función de regresión
poblacional : caso de la recta
𝐸 𝑦 𝑥𝑖 = 𝐵0 + 𝐵1 ∗ 𝑥𝑖
Perturbación estocástica
• Diferencia entre el valor esperado y la observación puntual

𝜇𝑖

𝜇𝑖

Representa a su vez todos los factores distintos a la variable 𝒙 que explican 𝒚


pero que no están explícitamente considerados en el modelo
No se trabaja con la población,
sino solo una muestra
Función de regresión muestral
• La FRM es una estimación o aproximación de la FRP teórica

෢0 + 𝛽
𝑦=𝛽 ෢1 ∗ 𝑥

෢0 y 𝛽
Con 𝛽 ෢1 estimadores puntuales de los parámetros desconocidos.

• Recordando que para cada observación puntual existe un


error asociado.

෢0 + 𝛽
𝑦𝑖 = 𝛽 ෢1 ∗ 𝑥𝑖 + 𝜇ෝ𝑖
¿Qué debemos buscar?

෢0 + 𝛽
𝑦=𝛽 ෢1 ∗ 𝑥

• Estos parámetros se deber encontrar de tal forma de que el


modelo se aproxime lo mas posible a la realidad
¿Cómo encontrar estos
parámetros?
෢0 + 𝛽
• 𝑦𝑖 = 𝛽 ෢1 ∗ 𝑥𝑖 + 𝜇ෝ𝑖

Por tanto

෢0 + 𝛽
𝜇ෝ𝑖 = 𝑦𝑖 − (𝛽 ෢1 ∗ 𝑥𝑖 )

Resulta razonable buscar estos parámetros de tal forma que


minimicen este error de manera global ( considerando todas las
observaciones).

Existen diversas metodologías para estimar estos parámetros, no


necesariamente ligadas a esta perturbación estocástica
Mínimos cuadrados ordinarios

2
min (𝜇ෝ𝑖 )2 = (𝑦𝑖 − 𝑦ෝ𝑖 )2 = (𝑦𝑖 − 𝑦ෝ𝑖 )2 = ෢ +𝛽
𝑦𝑖 − (𝛽 ෢ ∗ 𝑥𝑖 )
𝛽 0 ,𝛽 1 0 1
Al observar las regresiones, puede notarse que la primera es mejor que la
segunda, sin embargo ¿Cómo elegir la mejor regresión sin pasar por métodos
heurísticos o reiterativos en base a comparaciones?
Mínimos cuadrados ordinarios

• ¿Por qué se está minimizando el cuadrado de los errores?

- Problema de signo.

- Diferenciabilidad.
MCO :
• En clases (revisar Handout 1)
• Se realiza la minimización del error cuadrático y obtenemos:
Ejemplo 1

Años de
Salario promedio escolaridad

4.4567 6

5.9787 8

7.8182 12

10.8361 16

13.531 18
¿Para qué me sirve esto?

• Tomando en cuenta este modelo : Si yo estudie X años,


¿cuanto debería ganar?
Supuestos implícitos en los
estimadores MCO
Supuesto 1: Modelo de
regresión lineal

• El modelo debe ser lineal en los parámetros


Supuesto 2: Valor esperado de
la perturbación es igual a cero

Esto supuesto implica


la no existencia de
sesgo de estimación,
el modelo está
correctamente
especificado.
Supuesto 3: Términos de error
independientes de regresora X
• Cov(Xi,ui)=0

• Valores fijos de X para cada muestra de Y: Sencillez, validez y


relajación del supuesto.
Supuesto 4:
Homoscedasticidad en el
termino de error
Supuesto 5: Ausencia de
autocorrelación entre
perturbaciones
Supuesto 6: Número de
observaciones
• N debe ser mayor al número de parámetros a estimar
Supuesto 7: Naturaleza de X
• No pueden existir valores atípicos

• Es deber del analista “limpiar” los datos previamente.


Tarea 1
En base al set de datos, calcule el modelo de
regresión, refiérase a la dispersión de los
estimadores, al nivel de ajuste que muestra
el modelo y al coeficiente de correlación.
Feedback
• ¿Qué aprendí hoy?

• ¿Qué me gustó?

• ¿Qué cambiaría?
Clase 1
Rodrigo Cárdenas Mutis
rodrigo.cardenas.mutis@gmail.com
Nicolás Hardy Hernández
nicolas.hardy.hernandez@gmail.com

You might also like