Professional Documents
Culture Documents
3.2
DIAGRAMA DE DISPERSO
Uma
maneira
de
visualizarmos
se
duas
variveis
apresentam-se
Grfico de disperso
Y (peso)
Grfico de Disperso
Y (peso)
X (altura)
X (altura)
Grfico de disperso
Y (peso)
Grfico de Disperso
Y (peso)
X (altura)
X (altura)
Grfico de disperso
Y (peso)
Y (Peso)
Grfico de disperso
X (altura)
X (altura)
3.3
rXY = r =
n X i .Yi X i Yi
n. X 2 ( X )2 . n. Y 2 ( Y )2
i i i
i
mais forte (mais regular) torna-se a relao. Reciprocamente, quanto mais prximo o
valor de r fica em relao a 0 (zero), mais fraca (menos regular) torna-se a relao.
Por exemplo, um r igual a -0,90 indica uma relao mais forte do que um r igual a 0,70, e um r correspondente -0,70 indicam uma relao mais forte do que um r igual
a 0,5, lembre-se de que, se nenhum sinal aparece, est subtendido ser positivo.
Se no existir correlao linear ou ainda se a correlao linear for fraca, r
estar prximo de zero.
Assim:
a) Se a correlao entre duas variveis perfeita e positiva, ento
r = 1 (ver Figura 1);
Gasto com
Empresas
empresa
Propaganda
(U$
(U$ 1000,00)
X.Y
X2
Y2
1000,00)
(X)
(Y)
540,00
5,80
3132,00
291600,00
33,64
294,00
2,60
764,40
86436,00
6,76
440,00
4,00
1760,00
193600,00
16,00
624,00
6,80
4243,20
389376,00
46,24
252,00
2,00
504,00
63504,00
4,00
295,00
2,70
796,50
87025,00
7,29
372,00
4,00
1488,00
138384,00
16,00
473,00
4,90
2317,70
223729,00
24,01
i =3290,00
Y =32,80 X .Y =15005,80 X
i
2
i =1473654,00
Grafico de disperso
8
6
Vendas da Empresa (em US$1,000.00)
Total
0
200
250
300
350
400
450
500
550
600
650
=153,94
rXY = r =
rXY = r =
rXY
n X i Yi X i Yi
n X 2 ( X )2 n Y 2 ( Y )2
i i i
i
8 15.005,80-3290,00 32,80
120046,4-107912,00
=r=
=
[11789232,00-10824100,00] [1231,52-1075,84]
rXY = r =
12134,40
12134, 40
12134, 40
=
=
=
965132,00 155,68
150251749,76 12257,722
rXY = r = 0,9899
Existe uma forte correlao positiva entre as variveis gastos com
propaganda e vendas. Ou seja, empresas que investem em propaganda tendem a
aumentar suas vendas.
3.4 CORRELAO E CAUSALIDADE
Se considerar uma correlao entre a prevalncia da pobreza e crime em
cidades do Brasil, voc pode especular que a pobreza causa o crime; ou seja, que a
pobreza gera crime com o mesmo grau de inevitabilidade que o apertar de um
interruptor ilumina um aposento. De acordo com essa viso, qualquer reduo
substancial na pobreza deveria causar um correspondente decrscimo no crime.
Voc pode especular que uma causa comum como educao inadequada,
superpopulao, discriminao racial e assim por diante, ou alguma combinao
desses fatores gera tanto pobreza quanto o crime. Logo, de acordo com essa
viso, uma reduo substancial na pobreza no deveria causar qualquer efeito no
crime. Qual das especulaes correta? Infelizmente, essa pergunta no pode ser
resolvida meramente com correlao observada.
O fato de duas variveis estarem fortemente relacionadas por si s, no
implica em uma relao de causa e efeito entre as variveis.
Por exemplo: possvel que a relao das variveis tenha sido causada por
uma terceira varivel, ou, ainda, por uma combinao de muitas outras variveis.
Existem muitos outros tipos de coeficiente de correlao, mas iremos discutir
somente o coeficiente de correlao de Pearson.
Ento, caracterizada a relao, procuramos descrev-la por intermdio de
uma funo matemtica. A regresso o instrumento adequado para a
determinao dos parmetros dessa funo.
3.5 REGRESSO LINEAR SIMPLES
O termo regresso surgiu com os trabalhos de Galton (18221911), ao final
do sculo passado. Estes trabalhos procuravam explicar certas caractersticas de
um indivduo, a partir das caractersticas de seus pais. Galton acreditava que os
filhos de pais excepcionais com respeito determinada caracterstica, tambm
possuam esta caracterstica, porm, numa intensidade, em mdia, menor do que a
mdia de seus pais.
Os estudos de Galton baseavam-se em observaes derivadas de
experimentos ou de observaes da realidade. Em um destes trabalhos, ele
relacionou centenas de alturas de indivduos, com as respectivas alturas mdias de
seus pais.
Vamos considerar uma parte do problema que gerou o primeiro estudo de
regresso, realizado por Galton, por volta 1885. A tabela a seguir apresenta algumas
das observaes coletadas por Galton, onde X representa as alturas mdias de seus
pais e Y, alturas dos indivduos, medidas em centmetros.
Tabela 2 - Alturas mdias de seus pais e Y, alturas dos indivduos,
medidas em centmetros.
X
164
166
164
168
166
166
166
168
166
171
166
173
169
166
169
168
169
171
169
173
171
166
171
168
171
171
171
173
171
176
173
168
173
171
173
176
173
178
176
171
176
173
176
176
178
176
178
178
178
176
174
172
170
168
166
164
162
164
166
168
170
172
174
176
178
180
10
y = 2x + 1
1; 3
2,5
1,5
0; 1
0,5
0
0
0,2
0,4
0,6
0,8
1,2
11
, seja a
b=
n X i .Yi X i Yi
n. X i ( X i )
2
a=
Y b X
i
Onde:
n
X .Y
i
2
i
12
CLCULOS INTERMEDIRIOS
2
164
166
26.896
27.224
166
166
27.556
27.556
169
171
28.561
28.899
169
166
28.561
28.054
171
171
29.241
29.241
173
171
29.929
29.583
173
178
29.929
30.794
176
173
30.976
30.448
178
178
31.684
31.684
Y =1.540 X
i =1.539
X.Y
2
i =263.333
X .Y =263.483
i
b=
n X i .Yi X i Yi
a=
Y b X
n. X i 2 ( X i )
i
1287
= 0,872
1476
178
Y = a + bX
176
174
172
170
168
166
164
160
165
170
175
180
185
13
Interpretao:
Com respeito aos nove indivduos observados, podemos predizer a altura de
um filho ( Y ), a partir de uma dada altura mdia de seus pais, X, por meio da
equao Y = 22 + 0,872 X . Por exemplo: para uma altura mdia dos pais de x=175
cm,
temos
uma
estimativa
para
altura
do
filho
de
Propaganda
(em U$ 1000,00)
(X)
Vendas da
empresa
(em U$
X.Y
1000,00)
(Y)
540,00
5,80
3132,00
291600,00
294,00
2,60
764,40
86436,00
440,00
4,00
1760,00
193600,00
624,00
6,80
4243,20
389376,00
252,00
2,00
504,00
63504,00
295,00
2,70
796,50
87025,00
372,00
4,00
1488,00
138384,00
473,00
4,90
2317,70
223729,00
Total
i =3290,00
Y =32,80 X .Y =15005,80 X
i
2
i =1473654,00
14
Y = 1, 246 + 0, 013 X
0
200
250
300
350
400
450
500
550
600
650
b=
n X i .Yi X i Yi
a=
Y b X
n. X i ( X i )
2
12134,4
= 0, 013
965132
Interpretao:
Com respeito s oito empresas observadas, podemos predizer as vendas de
uma empresa ( Y ), a partir de um dado gasto com propaganda, X, por meio da
equao Y = 1, 246 + 0, 013 X .
15