You are on page 1of 14

Regresin lineal simple

Estudio de caso

La empresa DITESSUR, se dedica a la comercializacin de mltiples productos para la


industria qumica, entre ellos se tiene la informacin de las ventas histricas de un
solvente para pinturas de las primeras 10 semanas del ao 2009.

Semana Ventas Precio

1 10 1.3
2 6 2
3 5 1.7
4 12 1.5
5 10 1.6
6 15 1.2
7 5 1.6
8 12 1.4
9 17 1
10 20 1.1

Las ventas estn expresadas en miles de litros y el precio en $ por cada litro.

Diagrama de dispersin

Teniendo estos datos lo primero que se tiene que realizar es la elaboracin de un


diagrama de dispersin o nube de puntos,

25

20

15

10

0
0 0.5 1 1.5 2 2.5

Al analizar el diagrama de dispersin, este nos indica que la relacin entre las ventas y
el precio es negativa, es decir que a medida que aumenta el precio las ventas
disminuyen y en la proporcin que los precios disminuyen las ventas se incrementan,
por lo tanto podemos concluir que existe un relacin inversamente proporcional entre
las ventas y el precio del solvente para pinturas en las primeras 10 semanas del ao
2009 de la empresa DITESSUR

Docente: Ing. Ferly Urday Luna


Calculo del coeficiente de correlacin

Luego de haber analizado el diagrama de dispersin, se procede a calcular el


coeficiente de correlacin, el cual se le define como:

Una medida que nos indica que tanto se relacionan linealmente dos variables entre
s.
La formula de clculo del coeficiente de correlacin es:

nXY XY
r
nX 2

(X ) 2 nY 2 (Y ) 2
Se procede a calcular el coeficiente de correlacin.

i Y X XY X2 Y2
1 10 1.3 13.0 1.69 100
2 6 2.0 12.0 4.00 36
3 5 1.7 8.5 2.89 25
4 12 1.5 18.0 2.25 144
5 10 1.6 16.0 2.56 100
6 15 1.2 18.0 1.44 225
7 5 1.6 8.0 2.56 25
8 12 1.4 16.8 1.96 144
9 17 1.0 17.0 1.00 289
10 20 1.1 22.0 1.21 400
112 14.4 149.3 21.56 1488

10 149 .3 14.4 112


r
10 21.56 (14.4) 10 1488 (112)
2 2

r 0.86345
El valor de r nos dice que existe una fuerte correlacin lineal negativa entre las ventas
del solvente para pinturas con su precio.

Docente: Ing. Ferly Urday Luna


Se proceder a calcular el coeficiente de correlacin en Excel

Las formulas de trabajo son:

En C52 =(C48*F49-D49*E49)/RAIZ((C48*G49-E49^2)*(C48*H49-D49^2))
En C53 =COEF.DE.CORREL(D39:D48,E39:E48)
En C54 =PEARSON(D39:D48,E39:E48)

Calculo del coeficiente de determinacin


El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de
correlacin y representa el porcentaje de la variacin explicada por la recta de
regresin. El coeficiente de determinacin r2, es una medida de la proximidad del
ajuste de la recta de regresin; cuanto mayor sea el valor de r2, mejor ser el ajuste y
mas til la recta de regresin como instrumento de prediccin.

R2 = 0.74561319
R2 = 74.56%

Esto nos muestra que el 74.56% de las ventas dependen o estn explicadas por el
precio de venta, existiendo un 25.44% de variacin no explicada.

Docente: Ing. Ferly Urday Luna


En Excel se trabaja de la siguiente manera

En G52 =C52^2
En G53 =COEFICIENTE.R2(D39:D48,E39:E48)

Calculo de la ecuacin de regresin

Como ya se ha determinado que existe una elevada correlacin lineal negativa entre
las variables ventas y precio, ahora se debe determinar una ecuacin de regresin que
represente dicha relacin; para ello se requiere conocer lo siguiente:

Ecuacin de regresin: Y Y * Yest b0 b1 X

En donde:

b0 = Punto de interseccin de la recta de regresin con el eje Y.


b1 = Pendiente de la recta de regresin.

El objetivo entonces es encontrar los valores de b0 y b1, para ello se procede as:

Cada valor de la serie histrica se le multiplica por X0 y X1 y se encuentran las


sumatorias, con lo que se obtiene lo siguiente

Docente: Ing. Ferly Urday Luna



Y b0 b1 X Multiplicar por X 0 X 1
Y nb0 b1X ... ( Ec. i )
Ecuaciones Normales
XY b0 X b1X 2 ... ( Ec. ii )

De la ecuacin i despejamos b0
Y b1X
b0
n

Luego reemplazamos b0 en Ec ii ,
Y b1X
XY X b1X
2

n
XY b1 X
2
XY b1X 2
n
nXY XY b1 X nb1X 2
2

nb1X 2 b1 X nXY XY
2


b1 nX 2 X nXY XY
2

nXY XY
b1
nX 2 X
2

Por lo tanto los valores de b0 y b1 son:

nXY XY ( X X )(Y Y )
b1
nX 2 (X ) 2 ( X X ) 2

Y b1X
b0 Y b1 X
n

Se procede a calcular los valores de b0 y b1


10 149.3 14.4 112 b1 14.538835
b1
10 21.56 (14.4) 2

112 (14.538835 ) 14.4 b0 32.1359


b0
10

Docente: Ing. Ferly Urday Luna


La forma de trabajar en Excel es:

Las formulas de trabajo son:


En C69 =(C48*F49-E49*D49)/(C48*G49-E49^2)
En C70 =(D49-C69*E49)/C48
En D69 =PENDIENTE(D39:D48,E39:E48)
En D70 =INTERSECCION.EJE(D39:D48,E39:E48)

Calculo del error estndar de estimacin

El error estndar de estimacin se define como

(Y Y ) 2 Y 2 b0 Y b1XY
s y. x
n2 n2
1488 32.1359 112 (14.5388 ) 149 .3
s y. x
10 2
s y. x 2.725
La forma de trabajar en Excel es:

Las formulas de trabajo son:


En C80 =RAIZ((H49-C70*D49-C69*F49)/(C48-2))
En D80 =ERROR.TIPICO.XY(D39:D48,E39:E48)

Docente: Ing. Ferly Urday Luna


Pronstico de Y
Para realizar un pronstico, hay que hacer uso de la ecuacin de regresin. Por
ejemplo realizar un pronstico para la cantidad a venderse si se quisiera abrir una
sucursal en la ciudad de Tacna a un precio del solvente para pinturas de $ 1.63 el litro
Y 32.1359 14.5388 1.63
Y * 8.43762

Las formulas de trabajo son:


En C86 =RAIZ((H49-C70*D49-C69*F49)/(C48-2))
En C87 =ERROR.TIPICO.XY(D39:D48,E39:E48)

Calculo del intervalo de confianza

El intervalo de confianza se calcula utilizando la formula:

1 ( X 0 X )2
IC Y t0 s y. x
n ( X i X ) 2

Entonces, se har uso de la tabla:

Y X ( X i X )2

10 1.3 0.0196
6 2 0.3136
5 1.7 0.0676
12 1.5 0.0036
10 1.6 0.0256
15 1.2 0.0576
5 1.6 0.0256
12 1.4 0.0016
17 1 0.1936
20 1.1 0.1156
0.824

1 0.0361
IC 8.4376 2.306 2.725
10 0.824

IC 6.05,10.82

Docente: Ing. Ferly Urday Luna


La forma de trabajar en Excel es:

Las formulas de trabajo son:


En E107 =SUMA(E97:E106)
En C109 =(C85-PROMEDIO(D97:D106))^2
En C112 =DISTR.T.INV(C111,8)
En C115 =C86
En E115 =C112*C80*RAIZ(1/10+C109/E107)
En C117 =C115-E115
En E117 =C115+E115

Intervalo de prediccin

1 ( X 0 X )2
IP Y t0 s y. x 1
n ( X i X ) 2

1 0.0361
IP 8.4376 2.306 2.725 1
10 0.824

IP = 8.44 6.72164961

IP = 1.72 - 15.16

Docente: Ing. Ferly Urday Luna


ANOVA para la Regresin

DESCOMPOSICION DE LA VARIABILIDAD
SST SSR SSE
donde :
SST = SSR + SSE
SCT SCR SCE SST (Y Y ) 2
SSR (Y Y ) 2
Variabilidad Variabilidad Residual o
total de Y explicada por variabilidad no SSE (Y Y ) 2
la relacin explicada
lineal

Otras frmulas para encontrar el ANOVA


SCT=y2 -n(y)2 SCR=b xy-n(x)(y) SCE=SCT-SCR
Tabla ANOVA para regresin lineal

Suma de los Grados de Cuadrado


Fuente Fcal
cuadrados libertad medio
Regresin SSR 1 MSR = SSR/1 MSR/MSE
Error SSE n-2 MSE = SSE/(n-2)
Total SST n-1

Procedemos a calcular los valores de la tabla del ANOVA

Residual SSE SST SSR


i Y X Y* (Y Y ) (Y Y ) 2 (Y Y ) 2 (Y Y ) 2
1 10 1.3 13.24 -3.24 10.47 1.44 4.14
2 6 2 3.06 2.94 8.65 27.04 66.29
3 5 1.7 7.42 -2.42 5.86 38.44 14.29
4 12 1.5 10.33 1.67 2.80 0.64 0.76
5 10 1.6 8.87 1.13 1.27 1.44 5.41
6 15 1.2 14.69 0.31 0.10 14.44 12.18
7 5 1.6 8.87 -3.87 15.01 38.44 5.41
8 12 1.4 11.78 0.22 0.05 0.64 0.34
9 17 1 17.60 -0.60 0.36 33.64 40.92
10 20 1.1 16.14 3.86 14.87 77.44 24.44

0.00 59.42 233.60 174.18


Calculo con otras formulas
Y2 = 1488
YProm = 11.2
n= 10
b = -14.53883
XY= 149.3
XProm = 1.44

Docente: Ing. Ferly Urday Luna


SCT 1488 10 (11.2) 2 SCR 14.53883 149.3 10 1.44 11.2

SCT = 233.60 SCR = 174.18

SCE = 233.60 - 174.18

SCE = 59.42

Entonces la tabla del ANOVA queda de esta manera:


Tabla del ANOVA

Fuente de
SC GL CM FCal p - Value
Variacion
Regresion 174.18 1 174.175
23.448 0.001284
Error 59.42 8 7.428
Total 233.60 9 25.956

La forma de trabajar en Excel es:

Las formulas de trabajo son:

En G165 =D165-F165 y rellenar hasta G174


En H165 =G165^2 y rellenar hasta H174
En I165 =(D165-PROMEDIO($D$165:$D$174))^2 y rellenar hasta I174
En J165 =(F165-PROMEDIO($D$165:$D$174))^2 y rellenar hasta J174
En D180 =SUMA.CUADRADOS(D165:D174)
En D181 =PROMEDIO(D165:D174)
En D183 =PENDIENTE(D165:D174,E165:E174)
En D184 =SUMAPRODUCTO(D165:D174,E165:E174)

Docente: Ing. Ferly Urday Luna


En D185 =PROMEDIO(E165:E174)
En G183 =D180-D182*D181^2
En J183 =D183*(D184-D182*D181*D185)
En H187 =G183-J183

En D192 =J175
En D193 =H175
En D194 =D192+D193
En F192 =D192/E192
En F193 =D193/E193
En F194 =D194/E194
En G192 =F192/F193
En H192 =DISTR.F(G192,E192,E193)

Con el ANOVA lo que se busca es validar la pendiente de la recta de regresin, para


ello se plantea la siguiente hiptesis:

H0: =0
H1: =0

Consideramos = 5%

Como p = 0.128%, entonces aceptamos H1, con lo que validamos la ecuacin de la


recta de regresin muestral, por lo tanto s podemos utilizar dicha ecuacin para
realizar pronsticos.

Repaso del coeficiente de determinacin


Mide la proporcin de la variacin en Y que se explica por la variacin independiente X
en el modelo de regresin.
El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de
correlacin y representa el porcentaje de la variacin explicada por la recta de
regresin. El coeficiente de determinacin r2, es una medida de la proximidad del
ajuste de la recta de regresin; cuanto mayor sea el valor de r2, mejor ser el ajuste y
mas til la recta de regresin como instrumento de prediccin. (r2 = 0.92 indica que de
100 pares de puntos 92 estn en la recta de regresin y 8 fueran de la recta de
regresin)

Suma de cuadrados de la regresin SSR SCR


R2
Suma de cuadrados totales SST SCT
Cuando el n es pequeo (n < 30), se debe calcular el coeficiente de determinacin
corregido.

CME
R2=R2=1-
CMT

Docente: Ing. Ferly Urday Luna


Las formulas de trabajo son:

En C200 =C52^2
En C201 =D192/D194
En C202 =COEFICIENTE.R2(D165:D174,E165:E174)

Del coeficiente de determinacin podemos deducir que el 74.56% de los valores de las
ventas quedan explicados por el precio, existiendo un 25.44% de variacin no
explicada.

Anlisis de regresin con la herramienta anlisis de datos de Ms Excel.

Ms Excel posee una herramienta que contiene los principales anlisis estadsticos
bsicos existentes, para poder activar dicha herramienta se debe proceder as:

1 Presionar opciones de Excel del botn de oficce.

Botn de
Office
Presionar
aqu

2 En la opcin complementos de opciones de Excel presionar el botn ir y activa


herramientas para anlisis.

Al presionar
Presionar
aqu
este botn nos
aparece

Docente: Ing. Ferly Urday Luna


3 Ahora se debe ejecutar el complemento Anlisis de datos, para ello nos ubicamos
en la ficha datos y al final hay un botn anlisis de datos,

4 Luego de presionar aceptar aparece el siguiente cuadro de dialogo:

Configurar el
cuadro de dialogo
con las opciones
que se muestran y
presionar aceptar.

Docente: Ing. Ferly Urday Luna


5 Los resultados que nos muestra Excel son:

Docente: Ing. Ferly Urday Luna

You might also like