You are on page 1of 28

PROBABILIDADES Y ESTADISTICA

Anlisis de Regresin y
Correlacin

Postulante: Juan Carlos Chura

Qu Regresion ?
Anlisis de Regresin: Es un procedimiento
estadstico que estudia la relacin funcional entre
variables.Con el objeto de predecir una en funcin
de la/s otra/s.
Qu es el anlisis de
correlacin lineal ?
Es una herramienta estadstica que podemos
usar para describir el grado de relacin
lineal entre las variables.

Regresin lineal simple


Es un modelo matemtico para predecir el efecto

de una variable sobre otra, ambas cuantitativas.


Una variable es la dependiente y otra la
independiente
Se grafica con el diagrama de dispersin.
Muestra cmo es la relacin entre las dos
variables.
El anlisis consiste en encontrar la mejor lnea
recta de esos puntos.

El modelo de regresin lineal


La relacin se puede representar grficamente

mediante una lnea recta.


El modelo de regresin completo es

y A Bx
La variable X o independiente o predictora (est
bajo el control del investigador),
la variable Y es la variable dependiente o predicha

Tipos de regresion y Diagrama de


dispersin

Ecuaciones de curvas de Tendencia


lineal :

Y A0 A1 X

lineal multiple :

Y A0 A1 X 1 A1 X 2

Curva Cuadrtica : Y A0 A1 X A2 X 2
Curva Cbica :

Y A0 A1 X A2 X 2 A3 X 3

Curva Grado n :

Y A0 A1 X A2 X 2

Hiperbola :

1
Y
A0 A1 X

Curva Exponencial : Y ae bx
Curva Potencial :

Y aX b

An X n

Minimos Cuadrados
La recta de regresin hace mnimos los cuadrados de las distancias verticales
desde cada punto de una observacin a la recta.
Yi es un valor observado real de la variable Y
es un valor de la recta predicho por la ecuacin

2
(Yi Yi ) min

min es el nmero ms pequeo que se puede


obtener si se suman estas desviaciones
verticales elevadas al cuadrado entre los
puntos y la recta.

Yi Yi

Regresion lineal

a0

2
Y
X
- X XY

N X ( X )
2

; a1

N XY - X Y
N X 2 ( X ) 2

Calculo del error estandar de


estimacion
Clculo del error estndar de la estimacin
Mide la magnitud del error cometido al calcular el error de Y

Se y sobre x

YY

n-2

Si se trabaja con una recta, se puede calcular el error mediante

Se y sobre x

2
y
a 0 y a 1 xy

n2

Correlacin
El anlisis de correlacin trata de establecer el grado de relacion entre
dos variables, es decir trata de medir cuan dependiente es una variable
de la otra

2
(Yest
Y
)

Y Y

n xy x y

n x x n y y
2

Coeficiente de correlacin
Interpretacin:
1. El valor absoluto de r indica la relacin entre Y y X.
2. El signo la direccin de la relacin
r=1
r = -1
r=0

correlacin positiva perfecta.


correlacin negativa perfecta.
no hay relacin lineal entre Y y X.

Coeficiente de Determinacin
Es coeficiente de determinacin es el cuadrado del coeficiente
de correlacin multiplicado por 100
El valor de r2 ha de estar entre 0 y 1, si r2 = 0,70 significa que el
70% de la variacin de Y est explicada por las variaciones de X.
Es evidente que cuanto mayor sea r2, mayor poder explicativo
tendr nuestro modelo.

Determinacin
baja
0

Determinacin
Alta
50

100

Asociacin entre X y Y

Ejemplo Inversin Pblica en Telecomunicaciones


Periodo

Comunicaciones
miles de Bs

PIB a Precios de
miles de Bs

Participacin
%

1990

177.146

15.443.136

1,15

1991

188.122

16.256.453

1,16

1992

222.241

16.524.115

1,34

1993

251.575

17.229.578

1,46

1994

276.489

18.033.729

1,53

1995

293.213

18.877.396

1,55

1996

326.689

19.700.704

1,66

1997

425.447

20.676.718

2,06

1998

503.074

21.716.623

2,32

1999

539.774

21.809.329

2,47

2000

562.383

22.356.265

2,52

2001

603.596

22.732.700

2,66

2004

640.549

24.791.763

2,58

Diagrama de Dispersin

Comunicaciones
periodo

miles de Bs

PIB a Precios
de mercado

Participacin

x2

x*y

1990

177.146

15.443.136

1,15

3960100

352520540

1991

188.122

16.256.453

1,16

3964081

374550902

1992

222.241

16.524.115

1,34

3968064

442704072

1993

251.575

17.229.578

1,46

3972049

501388975

1994

276.489

18.033.729

1,53

3976036

551319066

1995

293.213

18.877.396

1,55

3980025

584959935

1996

326.689

19.700.704

1,66

3984016

652071244

1997

425.447

20.676.718

2,06

3988009

849617659

1998

503.074

21.716.623

2,32

3992004

1005141852

1999

539.774

21.809.329

2,47

3996001

1079008226

2000

562.383

22.356.265

2,52

4000000

1124766000

2001

603.596

22.732.700

2,66

4004001

1207795596

2002

618.415

23.285.983

2,66

4008004

1238066830

2003

632.846

23.934.229

2,64

4012009

1267590538

2004

640.549

24.791.763

2,58

4016016

1283660196

29955

6.261.559

59820415

12515161631

Y estimado y proyeccin

y a0 a1 x

a0

2
Y
X
- X XY

N X ( X )
2

; a1

Periodo

Prediccin

2005

726.817

2006

765.490

2007

804.163

2008

842.835

2009

881.508

2010

920.180

N XY - X Y
N X 2 ( X ) 2

Correlacin
r

n x

n xy x y
2

x 2 n y 2 y 2

Coefieciente de
correlacin

Coeficiente
de determinacin
98,2203065
0,98220306

Empleo
En general el sector de telecomunicaciones se

caracteriza por el uso intensivo de tecnologa que


implica mayor empleo de capital que de recursos
humanos. Sin embargo,
la expansin que ha tenido el sector en los
ltimos aos, especialmente en telefona
mvil, ha permitido la generacin de puestos de
trabajo.

Contribucin de las
Telecomunicaciones al empleo

Ejemplo Anlisis numero de lneas


en servicio

Telefona Fija

Telefona Celular

Regresion exponencial
y ae

bx

LnY Ln(ae )
bx

LnY ln a ln(e )
LnY Lna bX
V a bX
bX

Regresin Exponencial
v=ln(Y)

X2

X*V

yestimado

10,4498444

3984016

20857,8894

0,00

#NUM!

11,694063

3988009

23353,0438

0,00

12,3853604

3992004

24745,9502

0,00

12,9488287

3996001

25884,7086

0,00

13,2752905

4000000

26550,5809

0,00

13,5669428

4004001

27147,4525

0,00

13,8406431

4008004

27708,9674

0,00

#VALOR!

14,0614671

4012009

28165,1186

0,00

#NUM!

Regresin Parablica
X

X*Y

X2

X3

X4

X2Y

Yest

1,0

1996

34539

68939844,0

3984016,0

7952095936,0

15872383488256,0

137603928624,0

603356,6

2,0

1997

119858

239356426,0

3988009,0

7964053973,0

15904215784081,0

477994782722,0

597293,5

3,0

1998

239273

478067454,0

3992004,0

7976023992,0

15936095936016,0

955178773092,0

588548,4

4,0

1999

420344

840267656,0

3996001,0

7988005999,0

15968023992001,0

1679695044344,0

577121,3

5,0

2000

582620

1165240000,0

4000000,0

8000000000,0

16000000000000,0

2330480000000,0

563012,2

6,0

2001

779917

1560613917,0

4004001,0

8012006001,0

16032024008001,0

3122788447917,0

546221,2

7,0

2002

1025451

2052952902,0

4008004,0

8024024008,0

16064096064016,0

4110011709804,0

526748,1

8,0

2003

1278844

2561524532,0

4012009,0

8036054027,0

16096216216081,0

5130733637596,0

-10712591204,5

Diagrama de Dispersion Yestimado


modelo parabolico

You might also like