You are on page 1of 14

MODELO DE

UNIVERSIDAD INCA GARCILAZO DE LA VEGA


REGRESION
LINEAL
ESCUELA DE POSTGRADO
MAESTRIA ENMULTIPLE
POLITICA FISCAL Y TRIBUTACION

APELLIDOS
NOMBRE:
LECAROS FLORES
KEVIN Y
SCOTT
AO DE YLA
DIVERSIFICACION
PRODUCTIVA
DE

FORTALECIMIENTO
DE CUANTITATIVOS
LA EDUCACION
ASIGNATURA:
METODOS

PROFESOR: PH.D. ROBERTO CUMPEN VIDAURRE


PRIMER CICLO
AO 2015

Dedico este trabajo a mis


seores padres que
trabajan arduamente todos
los da para darme una

INDIC
E

CARATULA

. 1
DEDICATORIA
.. 2
NDICE
3
INTRODUCCION.
4
OBJETIVOS .
.. 4
MARCO TEORICO.
4
CASO PRACTICO .
. 7
BIBLIOGRAFIA

INTR
ODUC

En el captulo anterior se ha estudiado el modelo de regresin lineal simple, donde


se analizaba la influencia de una variable explicativa X en los valores que toma
otra variable denominada dependiente (Y). En la regresin lineal mltiple vamos a
utilizar ms de una variable explicativa; esto nos va a ofrecer la ventaja de utilizar
ms informacin en la construccin del modelo y, consecuentemente, realizar
estimaciones ms precisas. Al tener ms de una variable explicativa (no se debe
de emplear el trmino independiente) surgirn algunas diferencias con el modelo
de regresin lineal simple. Una cuestin de gran inters ser responder a la
siguiente pregunta: de un vasto conjunto de variables explicativas: x1, x2, , xk,
cules son las que ms influyen en la variable dependiente Y. En definitiva, y al
igual que en regresin lineal simple, vamos a considerar que los valores de la
variable dependiente Y han sido generados por una combinacin lineal de los
valores de una o ms variables explicativas y un trmino aleatorio: y b b x b x b x u
= 0 + 1 1 + 2 2 + ... + k k + Los coeficientes son elegidos de forma que la suma
de cuadrados entre los valores observados y los pronosticados sea mnima, es
decir, que se va a minimizar la varianza residual. Esta ecuacin recibe el nombre
de hiperplano, pues cuando tenemos dos variables explicativas, en vez de recta
de regresin tenemos un plano:

Con
tres
explicativas
espacio de tres
as

variables
tendramos
un
dimensiones,
y
sucesivamente.

Vamos
a
ir
elementos
de
travs de un sencillo ejemplo.

introduciendo los
este anlisis a

Consideramos una muestra de personas como la que sigue a continuacin:

En base a estos datos, vamos a construir un modelo para predecir el peso de una
persona (Y). Esto equivale a estudiar la relacin existente entre este conjunto de
variables y la variable peso (Y).
En primer lugar tenemos que la variable dependiente es el peso; y las variables
que vamos a utilizar para predecir el peso reciben el nombre de variables
independientes o explicativas.
En la prctica deberemos de elegir cuidadosamente qu variables vamos a
considerar como explicativas. Algunos criterios que deben de cumplir sern los
siguientes:
Tener sentido numrico.
No deber de haber variables repetidas o redundantes

Las variables introducidas en el modelo debern de tener una cierta justificacin

terica.
La relacin entre variables explicativas en el modelo y casos debe de ser como

mnimo de 1 a 10.
La relacin de las variables explicativas con la variable dependiente debe de ser

lineal, es decir, proporcional.

OBJE
TIVO

Conocer la estructura del MRLM.

Familiarizarse con las hiptesis bsicas del MRLM y entender su importancia.


Conocer los mtodos de estimacin del MRLM, el mtodo de mnimos cuadrados
ordinarios (MCO) y el de mxima verosimilitud (MV).
Introducirse en el uso de Minitab para estimar el MRLM mediante el MCO.
Saber cuantificar e interpretar bondad del ajuste del modelo.
Evaluar la contribucin de cada variable exgena en explicar el comportamiento
de la variable endgena; contrastar la significacin individual de un parmetro y la
global del modelo.
En base de la estimacin de MRLM, realizar predicciones puntuales y por
intervalo de la variable endgena.

MAR
CO

Aparte de estar iniciado en el uso del paquete estadstico Minitab, resulta muy
conveniente haber ledo con profundidad los siguientes math-blocks relacionados
con Estadstica:
Intervalos de confianza y contraste de hiptesis para 1 y 2 poblaciones
Anlisis de regresin y correlacin lineal
Correlacin y regresin lineal mltiple
7

Hiptesis del modelo de regresin lineal mltiple (MRLM) Mediante un modelo de


regresin lineal mltiple (MRLM) tratamos de explicar el comportamiento de una
determinada variable que denominaremos variable a explicar, variable endgena o
variable dependiente, (y representaremos con la letra Y) en funcin de un conjunto
de k variables explicativas X1, X2, ..., Xk mediante una relacin de dependencia
lineal (suponiendo X1 = 1): Y = 1 + 2 X 2 +... + k X k +U siendo U el
trmino de perturbacin o error Para determinar el modelo anterior, es necesario
hallar (estimar) el valor de los coeficientes 1, 2, ..., k. La linealidad en
parmetros posibilita la interpretacin correcta de los parmetros del modelo. Los
parmetros miden la intensidad media de los efectos de las variables explicativas
sobre la variable a explicar y se obtienen al tomar las derivadas parciales de la
variable a explicar respecto a cada una de as variables explicativas: j k X Y j j ; =
1,..., = . Nuestro objetivo es asignar valores numricos a los parmetros 1,
2, ..., k. Es decir, trataremos de estimar el modelo de manera que, los valores
ajustados de la variable endgena resulten tan prximos a los valores realmente
observados como sea posible. A fin de poder determinar las propiedades de los
estimadores obtenidos al aplicar distintos mtodos de estimacin y realizar
diferentes contrastes, hemos de especificar un conjunto de hiptesis sobre el
MRLM que hemos formulado. Existen tres grupos de hiptesis siguientes: las
hiptesis sobre el trmino de perturbacin, las hiptesis sobre las variables
explicativas, y las hiptesis sobre los parmetros del modelo.
Hiptesis sobre el trmino de perturbacin: Para una muestra de n observaciones
(cada observacin estar formada por una tupla con los valores de X2, X3, ..., Xk y
el valor de Y asociado), tendremos el siguiente sistema de n ecuaciones lineales:

O, en forma matricial: Y = XB + U, donde:

En estas condiciones, las hiptesis del MRLM se resumen en la esfericidad del


trmino de perturbacin, i.e.:
8

a) El valor esperado de la perturbacin es cero:


b) Homoscedasticidad: todos los trminos de perturbacin tienen la misma

varianza (varianza constante):


c) Por tanto, todos los trminos de la diagonal principal de la matriz de
varianzas y covarianzas sern iguales:
a) No Auto correlacin: los errores son independientes unos de otros, i.e.: la

matriz de varianzas y covarianzas es una matriz diagonal (fuera de la


diagonal principal todo son ceros):

Observar que, bajo las hiptesis de Homoscedasticidad y no auto


correlacin, la matriz de varianzas y covarianzas tendr la forma siguiente:

b) El error o perturbacin sigue una distribucin normal, i.e.:

Hiptesis sobre las variables explicativas:


a) Las variables explicativas son fijas o deterministas.
b) Las variables explicativas estn no correlacionadas con la perturbacin
aleatoria.
c) Las variables explicativas no presentan relacin lineal exacta entre si.
d) Adems, supondremos que las variables explicativas son medidas sin error.
e) En el modelo no se excluyen las variables relevantes y que tampoco no se
incluyen las variables irrelevantes, a la hora de explicar el comportamiento de la
variable endgena.

Hiptesis sobre los parmetros del modelo: a) La nica hiptesis que haremos
acerca de los parmetros del modelo es la hiptesis de permanencia estructural, lo
cual quiere decir que los parmetros poblacionales, j , se mantienen constantes a
lo largo de toda la muestra.
Estimacin del MRLM Estimar el modelo equivale asignar valores numricos a los
parmetros desconocidos 1, 2, ..., k, a partir de la informacin muestral
disponible de las variables observables del modelo. nicamente consideraremos
dos mtodos de estimacin: El mtodo de mnimos cuadrados ordinarios (MCO)
El mtodo de mxima verosimilitud (MV) Estimacin por mnimos cuadrados
ordinarios: Sea un modelo en forma matricial Y = X B + U. Supongamos que el
modelo ha sido estimado, obtenindose , vector de valores de la variable
dependiente implicado por el modelo. La diferencia entre los valores observados y
los valores estimados, e = Y Y = Y X B , la denominaremos vector de
residuos. Ahora bien, nuestro problema consiste en minimizar la suma de los
cuadrados de residuos, ee con respecto del vector de parmetros estimados, B.
De este problema de optimizacin se deduce la siguiente expresin de mnimos
cuadrados ordinarios del MRLM [7]:
Cuya varianza viene dada por:
Adems, el estimador MCO de la varianza del trmino de perturbacin es:

Donde n es el nmero de observaciones y k es el nmero de elementos del vector


B. Bajo la hiptesis de perturbaciones esfricas, el estimador MCO del vector B
cumple una serie de propiedades que le convierten en un insesgado (el valor
esperado del estimador coincide con el valor real del parmetro), eficiente (de
varianza mnima), y consistente.
Adems, bajo la hiptesis de esfericidad, el estimador MCO de la varianza del
trmino de error, 2 u , es tambin insesgado. Estimacin por mxima
verosimilitud: El mtodo de estimacin por MCO consiste en asignar valores
numricos a los parmetros desconocidos de manera que la suma cuadrtica de
errores sea mnima y slo requiere que la matriz XX sea invertible. A continuacin
veremos un mtodo de estimacin alternativo, el mtodo de mxima verosimilitud.
El mtodo de mxima verosimilitud (MV), en cambio, propone como un estimador
el valor que maximiza la probabilidad de obtener la muestra ya disponible. El
mtodo MV se basa, prcticamente, en la distribucin que sigue el trmino de
10

error. A tales efectos, se suele suponer que las perturbaciones aleatorias se


distribuyen con una distribucin Normal que, adems de cumplir las propiedades
de una muestra grande, es una aproximacin cmoda y fcil de tratar. El modelo
que utilizaremos es Y = X B + U, y supondremos que el trmino aleatorio sigue la
distribucin Normal con la siguiente funcin de densidad:

Maximizar la probabilidad de obtener la muestra ya disponible equivale maximizar


la funcin de densidad conjunta del vector aleatorio, u. Para ello, hemos de
suponer Homoscedasticidad y ausencia de auto correlacin. Por tanto, la
expresin de la funcin de densidad conjunta es la siguiente:

Como U sigue una distribucin Normal Multivariante de orden k, la variable Y, al


ser una combinacin lineal de las perturbaciones aleatorias, tambin se distribuir
con una distribucin Normal Multivariante. As pues, para que la funcin de
densidad conjunta sea una funcin de verosimilitud, el vector aleatorio U ha de
expresarse en funcin del vector Y, es decir:

Se trata, por tanto, de maximizar la funcin de verosimilitud. Como la expresin


anterior resulta complicada, aplicaremos una transformacin montona; en
concreto, una funcin logartmica:

Derivando la funcin de verosimilitud con respecto de B y 2 , e igualando las


derivadas a cero, obtenemos los resultados:

Cuya varianza es la siguiente:


Adems, el estimador MCO de la varianza del trmino de perturbacin es:
11

Donde n es el nmero de observaciones y k es el nmero de elementos del vector


B. Observamos que el estimador de MV de B coincide con el MCO, con lo que
tendr las mismas propiedades: ser lineal, insesgado, ptimo y consistente. Es
fcil ver que el estimador de MV de 2, en cambio, resulta diferente del MCO y no
es insesgado aunque s es asintticamente insesgado. Medidas de la bondad
del ajuste Las estimaciones por MCO y MV que hemos realizado todava no nos
permiten evaluar la calidad de ajuste del modelo. Para ello, de aqu a delante
iremos viendo las medidas de bondad de ajuste. Comenzaremos por la suma de
los cuadrados de errores, SCE, que puede expresarse de varias formas:

12

ANOVA
Modelo

Suma de

gl

Media

cuadrados
1

Regresin

Sig.

cuadrtica

51619908720

25809954360

230,611

APLICACIN EN POLITICA
FISCAL
007,260

003,630

000

bp

Residuo

16787971831

15

11191981220

03,689

Total

6,913

53298705903

17

110,945
a. Variable dependiente: TAMAO
b. Predictores: (Constante), GASTOSNOFINANCIEROS, INGRESOSCORRIENTES

Uno desea estimar los gastos de la Poblacin Peruana, en base a la informacin


que proporcionan las variables regresoras X 1 = Ingresos Corrientes X2 = Gastos
Corrientes
de
la
Variables entradas/eliminadas
poblacin
Peruana.
Modelo
Variables
Variables
Mtodo
Para ello
se recoge
introducidas
eliminadas
una
muestra
1
GASTOSNOFINA
.
Intro
que
comienza
NCIEROS,
con el ao
2001 hasta
INGRESOSCORR
el
ao
2015
en
IENTESb
datos
a. Variable dependiente: TAMAO

b. Todas las variables solicitadas introducidas.

estadsticos reales, y para los siguientes aos se tomara datos estadsticos


proyectados en el ao de 2016 hasta 2018 y cuyos resultados se aprecian en la
tablas siguiente: (Datos estadsticos sacados de INEI PERU 2001 2018)

Resumen del modelo


Model

R cuadrado

o
1

R cuadrado

Error

ajustado

estndar de

Coeficientes
,984

,969

,964

a. Predictores: (Constante), GASTOSNOFINANCIEROS,


INGRESOSCORRIENTES

la estimacin
334544,186

13

Modelo

Coeficientes no estandarizados

Coeficientes

Sig.

estandarizado
s
B

Error

Beta

estndar
1

(Constante)

25777448,41

185548,624

138,926

,000

5
INGRESOSCORRIENTES

34,162

12,058

,852

2,833

,013

GASTOSNOFINANCIERO

5,276

11,897

,133

,444

,664

S
a. Variable dependiente: TAMAO

CONC
LUSIO

http://www.udc.es/dep/mate/estadistica2/secprac_5_2.html
http://portal.uned.es/pls/portal/docs/PAGE/UNED_MAIN/LAUNIVERSIDAD/VICER
RECTORADOS/INVESTIGACION/O.T.R.I/OFERTAS
%20TECNOLOGICAS/DMAC/DOCUMENTOS%20Y
%20TUTORIALES/REGRESION_LINEAL_MULTIPLE_3.PDF
http://www.uoc.edu/in3/emath/docs/T01_Reg_Lineal_Multiple.pdf
http://www.uv.es/=uriel/3%20Regresion%20lineal%20multiple%20estimacion%20y
%20propiedades.pdf

14

You might also like