You are on page 1of 10

Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.

1-1

Captulo 1: Experimentos com um fator





No captulo 1 trataremos dos experimentos com um fator e dois nveis. Na seo 1.1
apresentamos um exemplo de experimento em que a estratgia de emparelhamento dos dados se faz
necessria, j na seo 1.2, temos um exemplo de experimento em que os dados so independentes.

1.1 Experimentos para escolha do solado de sapato dados emparelhados

Trata-se de um experimento para comparar a durabilidade de dois tipos de solados de sapato: de
couro e de borracha. Dispondo-se de 10 garotos para realizar o experimento, a estratgia mais simples
consiste em se escolher aleatoriamente 5 deles para utilizar sapatos de solado de couro, e os demais
solados de borracha. No eixo vertical do grfico da Figura 1.6 l-se o desgaste dos sapatos (aps um
perodo de uso pr-determinado) e no eixo horizontal o nmero atribudo a cada um dos garotos. Na
Figura 1.1, quatro dos cinco solados de borracha (identificados pela letra B) tiveram um desgaste
inferior aos de couro. Nota-se, contudo, que o sapato com sola de borracha do garoto de nmero 4 foi o
que mais se desgastou, embora fosse de borracha. Temos aqui um experimento que no foi bem
planejado, podendo levar o pesquisador a tirar concluses errneas. Concluir, por exemplo, que o solado
de borracha mais resistente ao desgaste que o solado de couro. Neste experimento, em particular,
existe um RUDO enorme que interfere na anlise do mesmo. Trata-se do perfil dos garotos: alguns
deles passam a maior parte do tempo estudando, outros porem, passam a maior parte do tempo correndo,
jogando bola ou at mesmo andando de carinho de rolim, e fazendo do sapato o seu freio. claro que
o desgaste do sapato est diretamente associado ao perfil do garoto, que aqui chamamos de RUDO
indesejvel, pois por conta dele, a anlise dos dados pode nos levar a concluses absurdas. Como
eliminar o RUIDO indesejvel? Basta que os garotos utilizem solados diferentes em cada p. A
Figura 1.7 nos mostra que os solados de borracha so na verdade os que sofrem maior desgaste.


Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-2


B
B
B
B
B
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 11
Garotos
D
e
s
g
a
s
t
e

Figura 1.6: Desgaste da sola de sapato - cinco garotos com o solado B

6
7
8
9
10
11
12
13
14
15
0 1 2 3 4 5 6 7 8 9 10 11
Garotos
D
e
s
g
a
s
t
e
sola de
couro
sola de
borracha

Figura 1.7: Desgaste da sola de sapato cada p com um tipo de solado





Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-3




1.2 Experimentos para escolha do tipo de concreto - dados independentes


Suponha que um pesquisador esteja interessado em descobrir se a resistncia de duas marcas de
concreto (A e B) difere significativamente. Seja
A
a resistncia mdia do concreto A,
B
a resistncia
mdia do concreto do concreto B e as hipteses
0
H e
1
H :

B A 1
B A 0
: H
: H


=
=
(1.1)



O pesquisador mede a resistncia de cinco blocos do concreto A e de cinco do concreto B (n
A
=n
B
=n=5).
Os dados esto na Tabela 1.1.

Tabela 1.1: Resistncia dos blocos
A B
54 50
55 54
58 56
51 52
57 53
X
A
=550 , X
B
=530 ,
5 , 7
2
A
= S 0 , 5
2
B
= S

A estatstica t uma relao entre a diferena das mdias amostrais ( X
A
=550 , e X
B
=530 , ) e a
variabilidade das observaes, medida por S. Se
2
A
S e
2
B
S so, respectivamente, as varincias amostrais
das cinco medidas do concreto A e das cinco medidas do concreto B, segue que:

5 , 2 5 / ) 0 , 5 5 , 7 ( / ) (S S
2
B
2
A
2
= + = + = n S (1.2)
e


Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-4


26 , 1
S
X X
= =
B A
t (1.3)


Para um nvel de significncia
1
de 5% ( o=5), o valor crtico do teste :


306 , 2
2 5 5 2
= =
+ +
t t
B A
n n
(1.4)


Aceitamos a hiptese H
0
, isto a relao entre a diferena das mdias amostrais, A X e B X , e a
variabilidade das observaes no foi suficiente grande para se rejeitar a hiptese H
0
, o valor t=1,26
no ultrapassou o valor crtico 2,306. De forma alternativa, podemos tambm dizer que a variabilidade
das observaes foi por demais grande, se comparada com diferena das mdias amostrais A X e B X ,
para rejeitarmos a hiptese H
0
. A questo que fica no ar a seguinte: Ser que no se descobriu que
um concreto mais resistente que o outro porque o nmero de observaes foi insuficiente?

1.3 Tamanho da amostra

Para responder esta pergunta fazemos uso das curvas do Apndice A, que alm do o, requer
valores de trs parmetros de entrada: u, v
1
, v
2
, que depende do tamanho (n) das amostra e do nmero
(a) de comparaes (no exemplo, n=5 e a=2).

2
2
2
2a
nD
=
o
u (1.5)

v
1
a-1 = (1.6)
v
2
a(n-1) = (1.7)

onde D a menor diferena entre
A
e
B
. O pesquisador deve ter noo deste valor que, em termos
prticos, j suficiente para dizermos que um concreto mais resistente que o outro. Como no

1
Na prxima seo discutiremos o significado do termo nvel de significncia


Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-5

conhecemos a varincia
2
o , utilizamos o estimador 25 , 6 2 / ) 0 , 5 5 , 7 ( 2 / ) (S S
2
B
2
A
2
= + = + = S . Se um
concreto mais resistente que o outro quando sua resistente mdia excede a do concorrente, em pelo
menos 5 Kg/cm
2
(D=5), ento:

24 , 2
25 , 6 * 4
) 5 ( 5
2a
nD
=
2
2
2
= = u
o
(1.8)

O risco | (de aceitar H
0
, sendo H
0
falso) est, segundo as curvas do apndice A, em torno de
20%. Para se reduzir o risco | preciso aumentar o tamanho das amostras. Na avaliao de trs novos
blocos dos concretos (A) e (B) obtivemos as resistncias cujos valores esto em negrito na Tabela 1.2.

Tabela 1.2: Comparao de duas mdias (n=8)
A B
54 50
55 54
58 56
51 52
57 53
54 54
55 53
56 52



Repetido os clculos, agora com as oito observaes de cada concreto que esto na Tabela 1.2, obtemos:

04 , 2
S
X X
= t =
B A
(1.9)

145 , 2
2 8 8 2
= =
+ +
t t
B A
n n
(1.10)

Continuamos aceitando a hiptese H
0
, isto , a diferena das mdias amostrais A X e B X no foi
suficiente grande para podermos rejeitar H
0
. Para os novos valores de u=3,6, v
1
=1 e v
2
=14 o risco |
se reduz a zero.



Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-6

1.4. Nvel de significncia
Em um teste de hiptese sabemos que podem ocorrer dois tipos de erros:
Erro tipo I rejeitar H
0
, sendo H
0
verdadeira;
Erro tipo II aceitar H
0
, sendo H
0
falsa.
No teste de hipteses definido em (1.1), estabelecemos a priori- antes de realizar o teste, um
risco o de 5% ou, o que d na mesma, realizamos o teste com a sapincia de que, se rejeitarmos a
hiptese H
0
, a esta deciso estar atrelada um erro tipo I de no mximo 5%. De (1.3) e (1.4),
conclumos que no h evidencia amostral
2
significativa no sentido de permitir a rejeio da hiptese
H
0
. Da a razo de chamarmos a probabilidade o do erro tipo I de nvel de significncia do teste. A
forma tradicional de apresentar o resultado de um teste de hipteses declarar que a hiptese nula foi
rejeitada a um nvel de significncia o . Esta forma de apresentar as concluses por vezes inadequada,
pois ela no d ao analista qualquer pista se o valor calculado do teste estatstico apenas caiu na regio
de rejeio do teste, ou se ele caiu na regio de rejeio do teste, e, alm disso, distante da fronteira que
separa as regies de aceitao e de rejeio. Em se rejeitando a hiptese H
0
, muito mais til atrelar a
esta deciso o valor P. Evidencias contrrias hiptese nula so tanto maiores quanto menor for o valor
P. Se os dados da Tabela 1.1 tivessem nos levado a um valor de S / ) X (X B
A
=2,306, o valo P seria de
5%. J se S / ) X (X B
A
=3,355 o valo P seria de 1%, segundo a distribuio de t de Student para 8 graus
de liberdade. As evidncias contrrias hiptese nula so muito maiores quanto t =3, 355, se comparado
com o caso em que t =2,306.

1.5 Olhando as observaes
No passado o ferramental estatstico ficou meio que latente por conta da falta de recursos
computacionais para os clculos que estas ferramentas demandam. Hoje a situao bem diferente, o
que mais temos so softwares para estes clculos. O perigo agora est justamente no exagero, estes
softwares so to amigveis que acabamos aceitando tudo o que eles nos falam sem qualquer
questionamento. Vamos aproveitar o exemplo dos concretos para elucidar esta questo. Considere os

2
Expressa pela razo entre a diferena das mdias amostrais e a variabilidade das observaes, S / ) X (X B
A



Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-7

dados da Tabela 1.3. Para estes dados S=1,714, t=3,060 e 145 , 2
2 8 8 2
= =
+ +
t t
B A
n n
. Como 3,060 > 2,
145, o software trar como resposta que o concreto A mais resistente que o concreto B.


Tabela 1.3: Resistncias dos concretos
A B
49 51
53 48
51 47
52 48
59 45
50 47
49 49
53 49
0 , 52 X = A 0 , 48 X = B

Analisando a Figura 1.4, observamos uma medida de resistncia do concreto A igual a 59,
distante dos demais valores. Ser que no houve um erro de leitura? Caso a leitura tenha sido correta,
cabe ento investigar as condies com que o quinto bloco de concreto do tipo A foi produzido. Se
descobrirmos a causa do quinto bloco ser to resistente, timo, pois podemos aplicar este novo
conhecimento em benefcio de se produzir blocos de concretos mais resistentes. Se no descobrirmos o
porqu, s nos resta descartar esta observao. Sem ela, a concluso outra: com os dados disponveis
no podemos afirmar que o concreto A melhor que o concreto B.


Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-8

45
47
49
51
53
55
57
59
1 2 3 4 5 6 7 8
Observao
R
e
s
i
s
t
e
n
c
i
a

d
o

c
o
n
c
r
e
t
o
.
Concreto A Concreto B

Figura 1.4: Dados da Tabela 1.3


Outro ponto importante o estabelecimento das hipteses, em (1.1) assumimos
B A 1
: H = . Se j
utilizamos um dos concretos, por exemplo, concreto B, ento a hiptese
1
H muda para
B A 1
: H > ,
isto , s nos interessaremos pelo concreto A se ele for mais resistente que o concreto B. Nesta
mudana, o valor crtico ( o=5), de
2 5 5 2 + +
= t t
B A
n n
diminui para 1,86.
1.6 Valor P

No teste-t, para rejeitarmos a hiptese
0
H , 306 , 2 / ) X (X B
A
> S . Utilizamos o valor
% 5 , 8
t =2,306 para realizar o teste, e por isso falamos que o risco alfa de 5%. O valor P sai da igualdade
S X X t
p
/ ) ( B A
, 8
= . Por exemplos, se 306 , 2 / ) X (X B
A
= S , ento valor P = 5%. A ttulo de
ilustrao, vide Tabela 1.4, geramos 20 amostras de tamanho cinco de valores de
A i
X ~ N(50; 6) e
B i
X ~
N(50; 6), respectivamente as resistncias dos concretos A e B. Com
B A
= a hiptese nula
verdadeira. Na Tabela 1.5 esto os valores de A X , B X , S / | X X | B A e do valor P. Na Figura 1.5
esto os valores do valor P dos 20 testes. Apenas no terceiro teste o valor P foi menor que 1%. No
terceiro teste, erroneamente rejeitaramos a hiptese nula.


Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-9

Tabela 1.4: Simulao das resistncias de 20 amostras de tamanho 5- concretos A e B

A i
X


B i
X

Teste 1 2 3 4 5 1 2 3 4 5
1 49,26 46,87 50,60 53,13 52,94 51,91 50,04 48,75 48,16 48,87
2 54,25 44,65 49,43 52,68 47,34 50,32 50,29 48,65 44,75 46,04
3 48,31 45,86 45,48 47,61 48,11 50,37 53,19 50,81 50,78 48,57
4 44,81 48,61 49,01 50,33 49,10 49,49 47,21 52,25 47,99 49,05
5 49,20 49,09 53,29 49,79 49,54 49,52 44,22 49,44 49,84 51,42
6 48,74 54,83 52,12 55,82 48,40 49,85 52,38 46 49,81 51,13
7 54,07 46,05 51,32 52,21 54,70 47,66 48,91 49,88 45,76 46,52
8 49,79 48,72 51,65 49,07 51,86 55,29 48,03 48,1 46,13 51,11
9 46,46 47,92 46,27 49,11 49,92 51,74 47,96 51,4 48,83 50,85
10 50,07 49,21 55,38 45,73 48,20 48 51,66 48,7 51,67 51,5
11 43,69 53,55 46,87 48,40 51,86 49,35 48,25 51,9 51,18 50,87
12 51,14 52,14 51,46 46,64 47,27 49,83 48,77 45,39 54,82 53,47
13 51,70 50,79 47,70 49,41 50,32 52,73 51,89 55,22 49,87 49,3
14 51,37 50,34 47,77 54,62 51,19 52,27 50,02 50,65 45,93 49,64
15 50,18 52,03 52,11 48,44 47,74 51,32 48,35 47,14 53,84 52,17
16 52,72 47,06 46,18 51,74 51,56 52,01 51,97 48,75 51,98 47,32
17 55,40 53,54 53,19 50,28 50,00 50,01 48,42 51,59 50,62 52,82
18 51,11 49,94 47,42 45,65 52,03 51,15 48,93 52,14 51,27 51,56
19 51,09 51,51 50,52 47,48 53,03 55,39 47,87 45,54 51,05 47,77
20 49,24 47,94 47,99 48,95 48,89 48,51 57,63 50,65 50,42 49,27
Tabela 1.5: Valores de A X , B X , S, S / | X X | B A e Valor P

Teste A X B X S
S / | X X | B A
Valor P
1 50,56 49,55 1,349 0,750 0,475
2 49,67 48,01 2,076 0,800 0,447
3 47,07 50,74 0,942 3,899 0,005
4 48,37 49,20 1,272 0,649 0,535
5 50,18 48,89 1,451 0,893 0,398
6 51,98 49,83 1,859 1,156 0,281
7 51,67 47,75 1,708 2,298 0,051
8 50,22 49,73 1,729 0,280 0,786
9 47,94 50,16 1,033 2,146 0,064
10 49,72 50,31 1,783 0,330 0,750
11 48,87 50,31 1,880 0,766 0,466
12 49,73 50,45 2,043 0,354 0,733
13 49,98 51,80 1,261 1,441 0,187
14 51,06 49,70 1,515 0,895 0,397
15 50,10 50,56 1,528 0,303 0,770
16 49,85 50,41 1,670 0,331 0,749
17 52,48 50,69 1,268 1,413 0,195
18 49,23 51,01 1,303 1,366 0,209
19 50,73 49,52 1,937 0,622 0,551
20 48,60 51,30 1,653 1,629 0,142



Apostila de Estatstica Aplicada elaborada por Antonio Fernando B. Costa UNESP, Campus de Guaratinguet.
1-10

0,001
0,010
0,100
1,000
0 2 4 6 8 10 12 14 16 18 20
Nmero do teste t
V
a
l
o
r

P

Figura 1.5 Valor P



1.6 Exerccios

Exerccio 1.1: Dois laboratrios determinam a quantidade de cloro de amostras de gua tomadas ao
mesmo tempo em cada dia, vide Tabela 1.6. H evidncia suficiente para se afirmar (o = 5%) que a
quantidade de cloro na gua registrada por cada laboratrio difere significativamente?


Tabela 1.6: Dados do exerccio 1.3
Laboratrio 1 2 3 4 5 6 7
A 1,15 1,86 0,75 1,82 1,14 1,55 1,7
B 1 1,9 0,95 1,88 1,33 1,71 1,95

You might also like