Professional Documents
Culture Documents
INTRODUCCIN
Como la Estadstica Inferencial nos permite trabajar con una variable a nivel de
intervalo o razn, as tambin se puede comprender la relacin de dos o ms
variables y nos permitir relacionar mediante ecuaciones, una variable en relacin
de la otra variable llamndose Regresin Lineal y una variable en relacin a otras
variables llamndose Regresin mltiple.
Casi constantemente en la prctica de la investigacin estadstica, se encuentran
variables que de alguna manera estn relacionados entre si, por lo que es posible
que una de las variables puedan relacionarse matemticamente en funcin de otra
u otras variables.
PROCEDIMIENTO
o Seleccionar una muestra a partir de una poblacin.
o Listar pares de datos para cada observacin.
o Dibujar un diagrama de puntos para dar una imagen visual de la relacin.
o Determinar la ecuacin de regresin.
CONCEPTOS BSICOS
Anlisis de Regresin
Es un procedimiento estadstico que estudia la relacin funcional entre
variables. Con el objeto de predecir una en funcin de la(s) otra(s).
Regresin Mltiple
Intervienen dos o ms variables independientes.
Variable Dependiente
(Respuesta, predicha, endgena) es la variable que se desea predecir o
estimar.
Variable Independiente
(Predictoras, explicativas, exgenas), son las variables que proveen las
bases para estimar.
Ejemplos:
VARIABLE DEPENDIENTE (Y)
VARIABLES INDEPENDIENTES
(X1,X2,......)
Precio unitario
Gasto de Propaganda
Estatura
Edad
Ingreso disponible
Importacin de bienes de consumo
Precio unitario del bien
Ingreso
Nmero de integrantes por familia
N de habitaciones
N de pisos
rea construida
rea techada , etc.
Y ' a b1 X1 b2 X 2
a es la intercepcin en Y.
El clculo de estos valores es por dems laborioso a mano, por ejemplo para el caso
de las dos variables independientes, para poder resolver y obtener y en una
Y ' a b1 X 1 b2 X 2 ...bk X k
El criterio de mnimos cuadrados se usa para el desarrollo de esta ecuacin.
Como estimar b1, b2, etc. es muy tedioso, existen muchos programas de cmputo
que pueden utilizarse para estimarlos.
SY 12k
(Y Y ' )
n (k 1)
SSE
n (k 1)
Donde:
Y es la observacin.
o ENFOQUE MATRICIAL
Donde:
y1
y
2
y3
y .
.
.
y
n n 1
x
1x11x12 x13.......x1k
1x x x .......x
2k
21 22 23
1x31x32 x33.......x3k
X ........................
........................
..........
..........
....
1x x x .......x
nk n
i1 i 2 i 3
xp
b0
b
1
b2
.
.
.
b
kp 1
x
ANLISIS DE VARIANZA
PRUEBA GLOBAL
Ayuda a determinar si es posible que todas las Variables Independientes tengan
coeficientes de regresin neta iguales a 0. En otras palabras podra la cantidad
de variacin explicada R2, ocurrir al azar?
La prueba global se usa para investigar si todas las variables independientes
tienen coeficientes significativos. Las hiptesis son:
H 0 : 1 2 3 ... k 0
TABLA ANOVA
La tabla ANOVA proporciona la variacin de la variable dependiente (tanto de la que
est explicada por la ecuacin de regresin como de la que no lo est).
EJERCICIOS DESARROLLADOS
1. El propietario de La cadena de cines CINE PLANET desea estimar el ingreso
semanal neto en funcin de los gastos de publicidad. Los datos histricos de
una muestra de 8 semanas son los siguientes:
de dlares)
miles de dlares)
96
5.0
1.5
90
2.0
2.0
95
4.0
1.5
92
2.5
2.5
95
3.0
3.3
94
3.5
2.3
94
2.5
4.2
94
3.0
2.5
96
90
95
92
y
95
94
94
948 x1
5.0
1.5
2.0
2.0
b
b
b
0
4.0
1.5
2.5
2.5
3.0
3.3
3.5
2.3
2.5
4.2
3 x1
8x3
10
y b0 b1 x1 b2 x2
Entonces primero resolvemos las matrices para encontrar los parmetros:
( X X )1 X y
5,9989
-1,0389
-1,0353
-1,0389
0,2239
0,1313
-1,0353
0,1313
0,2491
( X X )
750 83.2301 b0
2401 2.2902 b
1
1856 1.3010 b2
X y
Coeficientes no
estandarizados
Modelo
1
(Constante)
Anuncios en TV (en
miles de dlares)
Anuncios en peridicos
(en miles de dlares)
B
83.230
Error tp.
1.574
2.290
.304
1.301
.321
Beta
t
52.882
Sig.
.000
1.153
7.532
.001
1.509
3.072
.621
4.057
.010
.477
2.125
11
Para b1: Cuando los gastos de anunciar en televisin varan una unidad y los
gastos de anunciar en peridicos se mantienen constantes, los ingresos
brutos semanales se incrementarn en 2.2902 miles de dlares.
S y. X1 X 2
b0 y b1 X 1 y b2 X 2 y
n 3
S y. X1 X 2 0.64
o Interpretacin: La distancia promedio de los valores observados alrededor
de la ecuacin de regresin es de 0.64. Es decir la dispersin de los valores
observados es 0.64.
Hallando el Coeficiente de Determinacin
Re sumen de l modelo
Modelo
1
R
R cuadrado
a
.959
.919
R cuadrado
corregida
.887
Error tp. de la
estimacin
.64259
r 0.959
r 2 0.919
12
2. Una desea estimar los gastos en alimentacin de una familia (Y) en base a
la informacin que proporcionan las variables regresoras X1 =ingresos
mensuales y X2 =nmero de miembros de la familia. Para ello se recoge
una muestra aleatoria simple de 15 familias cuyos resultados son los de la
tabla adjunta (El gasto e ingreso est dado en cientos de miles de pesetas)
GASTO
INGRESO
TAMAO
043
21
031
11
032
09
046
16
125
62
044
23
052
18
029
10
129
89
035
24
035
12
078
47
043
35
047
29
038
14
13
Solucin
1 = 42
14
= 0 160 + 0 . + 0 . +
041
033
031
057
077
036
037
051
039
139
050
107
035
036
Por tanto
15
= = (42
55
4200
18808
14080
5500
15080)
21900
8070
= (32063)
28960
De donde
=
1 360
= (0 092
0 282
0 092
0 016
0 013
0 282
8 070
0 160
2 = 3;
= 0 43) se obtiene
15
1 = 0 160 +
0 . 2 1 + 0 077.3 = 0 3839
1 = 1
1 = 0 43 0 3839 = 0 0461
Razonando as en todos los puntos muestrales se obtiene
RESIDUOS
PREDICCIONES
038
041
033
-0046
-0028
-0024
031
057
077
0001
0048
-0011
036
037
051
0038
0083
0084
039
139
050
-0075
0104
0032
107
035
036
-0180
0000
-0025
Clculo de SCR
= 2 = 0 0721
2 = 0 0060 = 0 0775
Se calculan los intervalos de confianza de los parmetros del modelo al 90%
Para la varianza, 2
12.00060
2
~12
2
0072
52253 <
210298
2
00034 2 00138
)
( = ( ) 0 . (0092
0282
0092
0016
0013
0282
0013 )
0067
16
0149
= 15050~12
00099
1 = 0 000 0
Intervalo de confianza para 2 ()
12(0 05) 00201 0077 2 12(0 95) 00201
00412 2 01128
Contrate 0 2 = 0, la variable tamao no influye (contraste individual de
la t)
2 =
0 077
= 3 831~12
0 0201
2 = 0 0012 0
Tabla anova
= ( )2 = 1 4316
= = 13595
17
18
19
SOLUCIN
PREGUNTA A
La recta de regresin es:
Estrs= 126,505+ 0,176Tamao1,563Aos+1,575Salario+1,629Edad
Interpretacin de los coeficientes de regresin:
Intercepto= -126,505 Si el tamao de la empresa, el nmero de aos, el
salario y la edad fueran cero, es decir, si todas las variables explicativas
fueran cero, el puntaje de estrs del ejecutivo sera menos 126,505.
20
Pendiente de Salario: Por cada mil dlares que aumenta el salario, el estrs
del ejecutivo aumenta en 1,575 puntos.
PREGUNTA B
El coeficiente de determinacin que se usa en regresin lineal mltiple es el R2
ajustado, que en este caso es de 0,779.
Este coeficiente nos indica que las variables usadas en el modelo explican en
un 77,9% la variabilidad total del estrs.
PREGUNTA C
Los test t de los coeficientes de regresin sirven para docimar la hiptesis:
Ho: j = 0
H1: j 0 En este problema tenemos 4 tests de esta forma (j=1,2,3,4)
Por lo tanto este no sera un modelo adecuado para describir el estrs de los
ejecutivos, deberamos ajustar otro modelo sin la variable "Aos en posicin
actual".
Al examinar los valores p correspondientes a cada uno de los tests nos
damos cuenta que casi todas las pendientes son significativas (distintas de
21
PREGUNTA E
Este es un estimador de
la variabilidad
las
22
23
24
PREGUNTA b
Si expresamos las rectas de regresin como y*= a+bx y x*=c+dy los coeficientes
de los calculados son como:
Y*=3.604+0.363x ; X*=-7.356+2.637y
PREGUNTA c
Si el gasto es de 200 millones de pesetas no podemos utilizar la recta de
regresin puesto que el valor 200 esta fuera del recorrido del gasto en publicidad.
Si sustituimos nos da un valor de 76204 millones de pesetas, pues las rectas
slo son vlidas dentro del rango o para valores prximos a los extremos del
recorrido.
obtendremos un volumen de ventas de x*=3.604+0.363*60=25.384 millones de
pesetas.
Para realizar la prediccin del volumen de ventas utilizamos la recta de regresin
que tienen las ventas en funcin de los gastos en publicidad. Para un gasto en
publicidad de 60000 pesetas
25
PREGUNTA d
26
Ejercio 2
27
28
29
30
31
r=0,928
32
33
34
a)
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%
Intercepcin
99.5515247 138.098504 0.72087331 0.49810014 -238.36334 437.466389
Mercados atendidos
20.761025 6.92886558 2.99630938 0.02412284 3.80670169 37.7153482
Precio de Venta-0.11162173 0.13914726 -0.80218418 0.45303883 -0.4521028 0.22885934
Presupuesto de5.28452385
publicidad
2.13181872
2.4788805 0.04787791 0.06815138 10.5008963
Y= 99.55+20.76X1+-0.11X2+5.28X3
b) Bi=0
Bi0
Valor T+- 1.943 Estado Significativo.
Mercados de atencin: Texp 1.943 Rechazo Ho.
Precio de Venta: Texp 1.943 No rechazo Ho.
Presupuesto de publicidad: Texp 1.943 Rechazo Ho.
c)
Intercepcin
Mercados atendidos
Presupuesto de publicidad
Estadstico t Probabilidad
-0.41385305 0.69136744
2.97496943 0.02066165
3.08951389 0.01757898
Y= -9.57 + 18.82X1+5.93X3
35
d)
Anlisis de Regresin.
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0.98980071
Coeficiente de determinacin R^2
0.97970544
R^2 ajustado
0.973907
Error tpico
29.7074579
Observaciones
10
RESIDUOS:
Observacin
1
2
3
4
5
6
7
8
9
10
Pronstico Ventas
124.0578931
131.4761929
275.3489463
469.760373
203.25716
232.6788861
684.6581762
403.6573576
337.0269384
524.5170765
Residuos
4.92010689
25.4208071
0.54505367
-44.115373
-1.69015995
-11.1938861
5.05582379
-15.6703576
-16.8999384
53.6279235
Y= 99.55+20.76X1+-0.11X2+5.28X3
Y= 99.55+20.76 (5)+0.11 (978)+5.28 (23.000)
Y= 99.55+103.8+107.58+121.44
Y= 432.37
36
GRAFICO:
Ventas
Ventas
Pronstico Ventas
10
15
20
Mercados atendidos
Ventas
600
500
Ventas
400
Pronstico Ventas
300
200
100
0
-
20.000
40.000
60.000
80.000
Presupuesto de publicidad
37
a)
Intercepcin
x1
x2
x3
x4
x5
Superior 95%
51.1378341
0.70470881
12.7825811
13.2681029
12.3105919
3.31513717
Y= 0.22+(-0.65X1)+6.04X2+8.82X3+(-3.34X4)+1.58X5
b)
i=0
i0
Valor T +-: 1.83
X1: Texp1.83 No rechazo Ho.
X2: Texp1.83 Rechazo Ho.
X3: Texp1.83 Rechazo Ho.
X4: Texp1.83 No Rechazo Ho
X5: Texp1.83 Rechazo Ho.
38
c)
Intercepcin
X2
X3
X5
Coeficientes
-17.7665162
6.71249014
8.08198161
1.91747858
Error tpico
17.7394755
2.89725151
1.81817859
0.71883566
Estadstico t
-1.00152432
2.31684758
4.44509779
2.66747839
Probabilidad
0.33809585
0.04080375
0.00098666
0.02189238
Y= -17.76+6.71X2+8.08X3+1.92X5
d) Anlisis de regresin.
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.8964573
0.80363569
0.75008179
11.6857902
15
RESIDUOS:
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Pronstico y
94.9674815
32.5026244
63.4610594
92.9114529
63.4610594
64.9691009
104.966942
90.7178268
86.3348825
57.2991866
54.0095863
55.3790778
100.30522
73.0484523
58.6660478
Residuos
-7.96748149
-16.5026244
-9.46105939
5.08854713
-8.46105939
-4.96910091
-7.96694169
9.28217319
-8.33488254
15.7008134
3.99041369
1.62092222
-2.30521971
16.9515477
13.3339522
Y= 0.22+(-0.65X1)+6.04X2+8.82X3+(-3.34X4)+1.58X5
39
GRAFICO:
80
60
40
20
Pronstico Y
0
0
X2
60
Y
40
Pronstico Y
20
0
10
X3
40
80
60
Y
40
Pronstico Y
20
0
0
10
15
20
25
30
35
X5
11. La Casa Bonita, agencia inmobiliaria del barrio de la Rosilla, est intentando
estimar un modelo que pueda predecir el precio de venta de una casa. Para
ello cuenta con el cuadro que se muestra al final:
Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%
Intercepcin 8.42973317 12.6821023 0.66469525 0.52493868 -20.8152472 37.6747135
Metros cuadrados
0.30038693 0.12951636 2.31929712 0.04897313 0.00172166 0.59905219
Habitaciones 7.40185503 1.36898468 5.40682095 0.00064078 4.24497071 10.5587394
Ao del edificio0.36782657 0.24488765 1.50202173 0.17149138 -0.19688536 0.93253851
a)
Y= 8.42+0.30X1+7.40X2+0.36X3
b)
i=0
i0
Valor T +-: 1.860
Metro cuadrados: Texp1.860Rechazo Ho.
Habitaciones: Texp1.860 Rechazo Ho.
Aos del edificio: Texp1-860 No rechazo Ho.
41
c)
Intercepcin
Metros cuadrados
Habitaciones
Coeficientes
21.6877396
0.30970443
6.78126514
Error tpico
9.72095113
0.13810047
1.39324917
Estadstico t Probabilidad
2.23103062 0.05260819
2.24260237 0.05162337
4.86723071 0.00088691
Y= 21.69+0.31X1+6.78X2
d) Anlisis de regresin.
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.98804393
0.97623081
0.97094877
8.42457471
12
RESIDUOS:
Observacin
1
2
3
4
5
6
7
8
9
10
11
12
42
Y= 8.42+0.30X1+7.40X2+0.36X3
Y= 8.42+0.30 (100)+7.40 (6)+0.36 (30)
Y= 8.42+30+44.4+10.8
Y= 165.62
El precio de venta de la cada seria $165.62.
GRAFICO:
250
200
150
Precio de Venta (1.000$)
100
Pronstico Precio de Venta
(1.000$)
50
0
0
50
100
150
200
250
300
Metros cuadrados
200
150
Precio de Venta (1.000$)
100
Pronstico Precio de Venta
(1.000$)
50
0
0
10
15
20
Habitaciones
43
Coeficientes
121.5495081
0.099057493
0.119758613
-0.140345136
-0.319834756
-0.163972824
Error tpico
52.0870892
0.03191752
0.15953102
0.04993264
0.14956471
0.06924088
Estadstico t Probabilidad
2.33358227 0.07993785
3.10354576 0.03609683
0.7506917 0.49458619
-2.81068931 0.04828306
-2.13843728 0.09926194
-2.36815061 0.07697587
a)
Y= 121+0.10X1+0.12X2+(-0.14X3)+(-0.32X4)+(-0.16X4)
b)
i=0
i0
Valor T +-: 2.132
o Ventas: Texp 2.132 Rechazo Ho.
o Nmero de vendedores: Texp2.132 No Rechazo Ho.
o Presupuesto de publicidad: Texp2.132 Rechazo Ho.
o Nmero de anuncios mensuales en Televisin: Texp 2.132
Rechazo Ho.
o Minutos de radio de publicidad de la competencia: Texp 2.132
Rechazo Ho.
c)
Intercepcin
Ventas
Presupuesto de publicidad
Nmero de anuncios mensuales en Televisin
Minutos de radio de publicidad de la competencia
Coeficientes
99.3255928
0.09219363
-0.11620067
-0.25374332
-0.13553151
Error tpico
40.9427569
0.02921468
0.03648931
0.11550912
0.05536861
Estadstico t Probabilidad
2.4259625 0.05967694
3.15572998 0.02521589
-3.18451299 0.02441448
-2.19673844 0.07941948
-2.4478041 0.0580931
44
0.91580885
0.83870584
0.70967051
1.63136557
10
RESIDUOS:
Observacin
1
2
3
4
5
6
7
8
9
10
Pronstico Region
1.01684559
3.046877641
3.357973188
5.238554624
4.75955471
6.430888453
5.391744294
6.690318719
10.76579894
8.301443841
Residuos
-0.01684559
-1.04687764
-0.35797319
-1.23855462
0.24044529
-0.43088845
1.60825571
1.30968128
-1.76579894
1.69855616
GRAFICOS
Region
10
8
6
4
Region
Pronstico Region
200
400
600
800
Ventas
45
Region
Region
Pronstico Region
0
200
400
600
800
Presupuesto de publicidad
Region
Region
Pronstico Region
0
50
100
150
46
Region
8
6
Region
4
Pronstico Region
2
0
200
400
600
800
Intercepcin
Ventas ( en miles de unidades)
b)
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.99227152
0.98460276
0.98203656
0.32829966
8
47
PRUEBA DE HIPOTESIS:
1) i=0
i0
2) =0.05
3) Valor t +- 1.943 Estado significativo
Rechazo H0: Texp -1.943 o Texp1.943
No Rechazo H0:-1.943 Texp 1.943
4) Texp=19.58
5) Como Texp 1.943 entonces Rechazo H0.
6) Existe evidencia estadstica del cociente de la variable x es diferente de 0
con un nivel de significacin del 95%.
48
49
50
51
BIBLIOGRAFA
Google.com
http://dm.udc.es/asignaturas/estadistica2/secprac_5_3.html
http://es.slideshare.net/juancasa2791/regresion-multiple2
52