You are on page 1of 11

03) Hernandez, E. (2006). Regresin y correlacin. En Manual de estadstica. (pp.75-85).

Colombia: EDUEC-Universidad
Corporativa de Colombia.

LECCIN
8

Regresin y correlacin
~fapa conceptual
Regresin y correlacin

I Diagra.ma de dispersin

R9fsi6n y
correlacin

lineal

Regresin y

oonetacln

de

potencia

Ecuacin de
estimacin

Ecuacin de

Coeficiente de
correlacin

Coeficiente de
correlacin

estimacin

Objetivos de aprendizaje
Calcular la ecuacin de regresin )1 el coeficicnte de correlacin de l1J11 si tuacin
prctica de los datos correspondientes a dos variables.

Analizar correctamente el grado de relacin entre dos variables e interpretarlos

adec uadam en te.

Desarrollar dcscriptivamcntc los modelos de regresin lfncal )' de potencia


simple y' (le potencia, COIllQ medio ele utilizar una variable para predecir otra
~'medir In intensidad <le la asociacin entre (los variables,

7S
~

-4

Material compilado con fines acadmicos, se prohbe su reproduccin total o parcial sin la autorizacin de cada autor.

Copyrigl1ted material

Handbook 01' Stausrics

76

r-----------------~-------------------------------------------------------.
Actividades indicadoras de logros
Dado un conjunto de puntos (X, Y), dcrermine la ecuacin de estimacin lineal
)' (le.potencia y por medio del coeficiente de correlacin decida la ecuacin de
mejor ajuste.

EIl1a prctica encontramos con frecuencia una relacin entre dos o 111<1S variables,
pOI' ejemplo: el peso de los adultos depende en algn grado de su estatura; la circunfercncia depende de su radio; yla presin de una masa (I;(L,de gas depende de

su temperatura ): VO)UlllCI1. Con frecuencia deseamos expresar estas relaciones en


forma matemtica, determinando una ecuacin (ILJCconecte I,L$variables.

8.1

Dagr ama de dispersin


Para ayudar a determinnr una ecuacin que conecte las variables, un primer paso es
la recoleccin de datos. que muestren los valores correspondientes de las variables
bajo consideracin.

El siguiente pas es dibujar 10$"lInIO~(X" \',), (X" Y,), ...(X", y j, en unsisrcma


coordenado rccrangular. El grupo (le puntos resultante es lluruado un diagrnma de

dispersin .
.,!.\

parti r de

ID) diagrama

de dispcrsi on es posible visual izar una curva de aproxi ma-

cin suave de J()$ daros. 1";11curva es llamuda una curva de aproximacin.

El problema general de encontrar una ecuacin de curva (le aproximacin, la cual


se adapta al grupo de puntos dados, llamado regresin.

8.2

Regresin
Frecuentemente,

COI) I)<IS(~el' los

datos de la muestra, dCSC<lItlOSestimar los datos

de la variable y, corrcspondicmc a un valor dado de una variable X. Esto puede ser


realizado estimando los valores de Y, a partir de una curva de m Inimos cuadrados,
la cual se adapta a I(lSdatos de la muestra. La curva resultante es llamada una curva
de regresin de. y en X. puesto que y es estimado a partir de X.

Copyrigl1ted material

l..cccin 8: Regresin)' correlacin

77

~----------------+-----------------------------------------~--~-------'.
"

/"

IJJI%I hlVersa

lne'))cfue't~

_!......

---

~"
.~

C~I~~;)d!lecta

.-

Ctlrvine"invel'$~
y

SInfclc"

Figura S.!

Aplicaciones a series de tiempo


Si la variable independiente X, es tiempo. los datos muestran los valores de Y, en
varios tiCIllPOS. Los datos ordenados de.acuerdo con el tiempo. son llamados series
de tiempo. La lnea deregresin o curva (le Y el) X. en este caso, es frecuentemente
11,1IUldauna l1Cl<le tendencia o curva de tendencia ~' es usada para propsitos
(le estimacin, prediccin o pronstico. T,..as ecuaciones ms comnmente usadas
son:

Lmeal. Y = a + bX ;
Potencia: Y

= aX"

o log y

= log <l + b log X

Donde a )' b son constantes.

8.3

Correlacin
Consideramos el problema relacionado de correlacin o el grndo de.relacin entre
las variables, el cual busca determinar

una ecuacin lineal, '1 otra, describe o


explica I\relacin entre las variables. Si todos los valores <lela variable satisfacen
CW()

Copyrigl1ted material

Handbook 01' Stausrics

78

r-----------------~-------------------------------------------------------.
una ecuacin exactamente, decimos que las variables estn perfectamente correlacionadas o que hay perfecta correlacin entre ellas.
Cuando s610 dos variables

CSI,n

involucradas. hablamos de corre/acin simple )'

rcgresion stmptc.,
Cuando ms de dos variables estn involucradas, hablamos de corretacin mlple
)f

regresuni 1/1"i/tiple._

En este capulo

$()10

considerarnos la correlacin

::;iI11IJle.

Si "~iJJlO$a tratar con el problema de dispersin de <'1a1<).') muestrales (le lneas o


curvas en una forma cuantitauva, ser necesario 1J~lr(1110SQlrO$ idear una mcdidr

de correlacin.
Para describir el grado de relacin entre las variables,
correlacin, el cual es denotado por 1',
si 0,9

5,

r<1

6 -[ < J'

5,

ll~"'JI1OSel

coeficiente de.

-0,9 ... correlacin excelente.

si 0,8 s r < 0,9

-0,9 < r '" -0,8 ... corre lucin buena.

0,6 s r < 0,8

-0,$ < r s: -0,6 _.. correlacin regular.

si 0,3 '" r <.1),6

-0,6 < r s-O"' ... correlacin mala.

si

si -0,3 < r < 0,3 ,..no existe correlacin.

8,4

Anlisis

de regl-esin

y correlacin

lj

n eal

Ecuacin de cstimacin:

IY = lJo+')L, X
LX!' =" LX +hLX'

Ecuaciones normales:

Coeficiente de correlacin:

8,5

Anlisis

de r-eg r es i n y correlacin

de potencia

=aX" lo"~ Y= lo"o- a + b los,_ X

Ecuacin <le estimacin:

Ecuaciones normales:

.L1og y

= Illoga+b

LlogX

L,logX logY =Ioga L,logX +bL(Jog X)'

Copyrigl1ted material

l..cccin 8: Regresin )' correlacin

79

~----------------+-----------------------------------------~--~-------'.
Ejemplo 1: Para el siguiente grupo de puntos (labia 8.1), encuentre:
8.

Diagrama de dispersin.

b, Ecuacin de estimacin lineal y r,


c. Ecuacin de estimacin de potencia )1 r,

Tabla 8.1

13
16
14
11
17

1.0
2.0
1.4
0.8

0,5

13
17
18
12

1,1
2,8

3.0
1.2

Solucin:
u.

y
3

1-1

10

"

-t-+

15

l -t-t -t-I-

20

Figura 8.2
_.

b. Ecuacin de estimacin lineal. Y = (J+bX


De las ecuaciones nonnalesy la tabla R.I

CJ)lC)IlCC$: 1:>

= 0,277

Y a

= -2,278

Copyrigl1ted material

Handbook 01' Stausrics

80

r-----------------~-------------------------------------------------------.
Ecuacin de estimacin lineal.
A

Y =-2.27S+ O.277X

Coeficiente de correlacin.

Usando la tabla 8.1, entonces: r = 0,95

c. Ecuacin de estimacin de potencia.


A

Y =aXI,; de las ecuaciones normales.

= loga Llogx + b L(logX)'


= 0,0018 Y ,,= 2,538

L(logX logY)

entonces:

el

Y =0 ,OOI8X"~"

Coeficiente de correlacin.
r = 0,9781

De acuerdo c-onlos resultados es mejor la ecuacin de potencia, debido al valor de ,'.


Ejemplo 2: La produccin de acero en Estados Unidos, en millones de toneladas.
durante los aos 1989.1999, eSI, dada en 111tabla 8.2
a, Grca de 1os datos.

1). Encuerure la ecuacinlineal de

(1.\

Jj IDOS

cuadrados que mejor se adapta

Ios

datos.
c. Estime la produccin de acero en el ao 2.000.

Copyrigl1ted material

8J

l..cccin 8: Regresin )' correlacin

~----------------+-----------------------------------------~--~-------'.
Tabla 8.2
ProduccIn d acero en Estados UnidOG

Ao

(millones d toneladas)

1989
1990
1991
1992
1993

66,6

1994

84,9
88,6
78.0
96.8
105,2

1995

93,2

1996

111,6
88.3
117.0
115,2

1997
1998
1999

Solucin:

a, Diagrama de.dispersin
Produccin

,....

120
tlO
100

90
80

'0

./ .i.
. ,.,
,/
"

60
--t
89

1-1-1

"

,':.,

..

,'

v
... "
""

1-1-'

9S

--

99

ao

b. Diaarama (le estimacin lineal.


Tabla 8.3

Ao

1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999

66.6
84,9

88.6

3
4
5
6
7

78,0

111,6

88.3

9
10

117,0

96,8
105.2
93.2

115,2

Copyrigl1ted material

Handbook 01' Stausrics

82

r-----------------~-------------------------------------------------------.
Donde el origen X = Oes el ao 1989 y las unidades de X, son J ao.
De las ecuaciones normales tenernos:
a = 75.2
b = 3,95

entonces: Y =75.2+3.95X

Ecuacin de estimacin lineal.

c. I)ara In produccin de. acero en el ao 2()(X),

cntC)IICCS

X = '11.

Y = 75,2+3.95 < 11= 118.6 ~rillonesde toneladas.

Pro b lem as
Leccin 8
1. Los <hIlOSde la labia 8.-1, muestran la edad yel peso de seis (6) nios.
Tabla 8,4
Edad

(ao)

,.

24

16

23

'2

26

Peso
(k)

a. Realiza el diagrama de.dispersin.


b. Encuentre la eC1IHC,i().n liueal (le mniuios cuadrados que uiejor se .1(1.ip13 ;,

los datos .

Resp, y = 170.13X'"
c.

el coeficiente de correlacin.
Resp. r = 0,973
E,)ClICI)1J'C

d. Estime el peso de un nio de 5 aos de edad


Resp. 19.8 k.
2, El ndice de contaminacin atmosfrica en los ltimos cuatro aos fue (rabia

8.5):
Tabla 8.6
Ao

index [PPM]

1999
2000
2001

220
350
800

2002

2.450

a. Realice el diagrama de dispersin.


b. Encuentre la ecuacin de estimacin de potencia,

Resp, J"=8.78.2.2JX
c. 611cucolrc el coeficiente d correlacin.

Copyrigl1ted material

l..cccin 8: Regresin )' correlacin

83

~----------------+-----------------------------------------~--~-------'.
Resp, r = 0,929
d. Estime el ndice de contaminacin aunosrica para el ao 2003.

Resp. 2.344,7 ppm


3. La demanda (Q), de un producto depende del precio (P). Una compaa est intentando estimar tal funcin parroel producto y tiene los datos d la rabia 8.6.

Tabla 8.6

p
('10'$1

(Unidades)

10
4.7
8.5

100
150
128
120
162
170
180
200

8.0
4.5
4.0

3.0
2.0
8. Realice el

diagrama de dispersin.

b. 611Clle_lllre la ecuacin de estimacin lineal.


A

Resp, Y =8S,92+9.G-IX
c. Encuentre el coeficiente de

C()ITC)HCill.

Resp, r = .0,98

4.

I..()S
IUI

datos de la tabla 8.7 corresponden a cargamentos de e,ar recolectados por

agricultor,

Tabla 8.7
Ao

Carga de caf
(k)

1996
1997
1998
1999
2000
2001
2002

90
98
110
117
124
136
150

a. Realice el diagrama de dispersin.


b, Encuentre la ecuacin (le estimacin lineal.

,
Resp. y = 88.92+9.G-IX
c. Encuentre el coeficiente de correlacin.

Resp, r = 0.994

Copyrigl1ted material

Handbook 01' Stausrics

84

r-----------------~-------------------------------------------------------.
5. Los valores deja tabla 8.8 corresponden a los pesos en (k) y los niveles de glucosa
en la sangre en (mgllOO mi), de 20 hombres adultos. aparentemente saludables.
Tabla 8.8
Glucosa
ImgllOOmJj
106

Peso
Ik]
64,0

15,3

109

13,0
82,1

10'
102

76.2

105

95,7

121

59,4

79

93,4

82.1

107
101

78.9

85

76,7

9.

82,1

100

83.9

lOa

73.0

104

64,4

102

17,6

87

85.0

102

89.0

115

90.0

120
89

59,0

a. Realice el diagrama de dispersin.


b. 81'1('uclltre la ecuacin de estimacin lineal.
A

Resp. Y ~ 52. 71~O.636X


c. Encuentre la ecuacin de estimacin (le pctencia.

Rcsp, y

= ]~.04XH;'

d. Cul es la mejor ecuacin y por qu'!

6. Adapte una liea y = a+b.f, por el mtodo de


guicntes observaciones:

x,

7.2

5.9

4.9

9
4,3

12

2.8

111iJUnlOS

cuadrados para las si-

15
1.9

18
1.1

Resp, y = 7.05-0.338X

a. Encuentre l coeficiente de correlacin.


Resp. r = - 0.996

Copyrigl1ted material

l..cccin 8: Regresin )' correlacin

85

~----------------+-----------------------------------------~--~-------'.
7, Suponga que usted est estudiando el efecto de cierta friccin constante y
uniforme sobre lminas metalicas del mismo espesor y la misma aleacin: se
llevan a cabo ocho observaciones Cll)IOS resultados son:

XI = Tiempo de fricciu en horas


Y, = Espesor de la hoja eu mm
X,

10

12

15

9,5

9,0

6,8

8,5

8,2

8,0

7,6

7,0

Con la ecuacin y

a.

ES!>CS(.)f

= a +b.\', determine:

original de las laminas.

Resp. 10.07 mm

b. Curultas horas durar la friccin en destruir la lmina?


Resp, 49,1 horas.
t. {nene algn sentido pronosticar el espesor de

una lmina despus de 70

horas de friccin?

Resumen
Lecctn 8
La grfk'l de los puntos (X,. Y,), (X~ Y,),,,,, (X,. Y,) en un sistema coordenado
rectangular,
se denomina diaerama
de dispersin,
~
~
A la curva que mejor se adapta a los datos del diagrama de dispersin, se le
llama curva de regresin o curva de tendencia y se utiliza para propsitos de
estimacin,

prediccin o pronstico.

Las ecuaciones (le regresin ms


Lineal: Y=a+

C(1IJJl'nUnI11c

usadas son:

bX

El coeficiente de correlacin ( r ), mide la intensidad de la asociacin entre dos


variables.

Trm inos clave

Regresin
Correlacin

Diagramo de dispersin
Regresin )1 correlacin lineal
Regresin )r correlacin de potencia
Sen es de tiempo

Copyrigl1led m alerial

You might also like