You are on page 1of 27

Correlao e Regresso

Objetivo
Estudar a relao entre duas variveis quantitativas.

Exemplos:
Idade e altura das crianas Tempo de prtica de esportes e ritmo cardaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo

Investigaremos a presena ou ausncia de relao linear sob dois pontos de vista: a) Quantificando a fora dessa relao: correlao. b) Explicitando a forma dessa relao: regresso. Representao grfica de duas variveis quantitativas: Diagrama de disperso

Exemplo 1: nota da prova e tempo de estudo


X : tempo de estudo (em horas) Y : nota da prova

Pares de observaes (Xi , Yi) para cada estudante


Tempo(X) 3,0 7,0 2,0 1,5 12,0 Nota(Y) 4,5 6,5 3,7 4,0 9,3
Diagrama de Disperso
9,5 8,5 7,5

Nota

6,5 5,5 4,5 3,5 0 5 10

Tempo

uma medida que avalia o quanto a nuvem de pontos no diagrama de disperso aproxima-se de uma reta.

Coeficiente de correlao linear

O coeficiente de correlao linear de Pearson dado por:

sendo que,

X e Y so as mdias amostrais de X e Y, respectivamente

S X e S Y so os desvios padro de X e Y, respectivamente.

Frmula alternativa:

No exemplo:
Tempo (X) 3,0 7,0 2,0 Nota (Y) 4,5 6,5 3,7

(X - X)
-2,1 1,9 -3,1 -3,6 6,9 0

(Y - Y)
-1,1 0,9 -1,9 -1,6 3,7 0

(X - X) (Y - Y)
2,31 1,71 5,89 5,76 25,53 41,2

1,5
12,0 25,5

4,0
9,3 28,0

X 5,1

Y 5,6

2 2 2 (-2,1) ... (6,9) 78,2 19,55 S 4,42 Sx x

2 2 2 (-1,1) ... (3,7) 21,9 5,47 S 2,34 Sy y

Ento, r 41,2 0,9959 4 . 4,42 . 2,34

Propriedade: -1 r 1
Casos particulares: r = 1 correlao linear positiva e perfeita r = -1 correlao linear negativa e perfeita r = 0 inexistncia de correlao linear

r = 1, correlao linear positiva e perfeita

r = -1, correlao linear negativa e perfeita

r
40

30

Y
20 10 10 20 30 40 50

-1

Exemplo 2: criminalidade e analfabetismo


Considere as duas variveis observadas em 50 estados norte-americanos. Y: taxa de criminalidade X: taxa de analfabetismo

Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a taxa de criminalidade (Y) tende a aumentar. Nota-se tambm uma tendncia linear.

Clculo da correlao

_ Y= 7,38 (mdia de Y) e SY = 3,692 (desvio padro de Y) _ X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X) XiYi = 509,12

Correlao entre X e Y:

Exemplo 3: expectativa de vida e analfabetismo


Considere as duas variveis observadas em 50 estados norte-americanos.
Y: expectativa de vida X: taxa de analfabetismo

Diagrama de disperso

Podemos notar que, conforme aumenta a taxa de analfabetismo (X), a expectativa de vida (Y) tende a diminuir. Nota-se tambm uma tendncia linear.

Clculo da correlao
_ Y= 70,88 (mdia de Y) e SY = 1,342 (desvio padro de Y) _ X= 1,17 (mdia de X) e Sx = 0,609 (desvio padro de X) XiYi = 4122,8 Correlao entre X e Y:

Reta ajustada:

O que so a e b?

a: intercepto b: inclinao
Interpretao de b:

Para cada aumento de uma unidade em X, temos um aumento mdio de b unidades em Y.

Reta ajustada (mtodo de mnimos quadrados)


Os coeficientes a e b so calculados da seguinte maneira:

No exemplo 2,
a reta ajustada :

^ Y : valor predito para a taxa de criminalid ade X : taxa de analfabetismo


Interpretao de b: Para um aumento de uma unidade na taxa do analfabetismo (X), a taxa de criminalidade (Y) aumenta, em mdia, 4,257 unidades.

Graficamente, temos

Como desenhar a reta no grfico?

No exemplo 3,
a reta ajustada :

^ Y : valor predito para a expectativa de vida X : taxa de analfabetismo


Interpretao de b: Para um aumento de uma unidade na taxa do analfabetismo (X), a expectativa de vida (Y) diminui, em mdia, 1,296 anos.

Graficamente, temos

Exemplo 4: consumo de cerveja e temperatura


Y: consumo de cerveja dirio por mil habitantes, em litros. X: temperatura mxima (em C). As variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas.

Dados:
Localidade Temperatura (X) Consumo (Y)

1 2 3 4 5 6 7 8 9

16 31 38 39 37 36 36 22 10

290 374 393 425 406 370 365 320 269

Diagrama de disperso

400

Consumo

350

300

10

20

30

40

Temperatura

A correlao entre X e Y r = 0,962.

A reta ajustada :
Qual a interpretao de b? Aumentando-se um grau de temperatura (X), o consumo de cerveja (Y) aumenta, em mdia, 4,74 litros por mil habitantes.

Qual o consumo previsto para uma temperatura de 25C?

Y 217,37 4,74.25 335,87 litros

You might also like