You are on page 1of 23

Prof. Lor Viali, Dr.

http://www.mat.ufrgs.br/viali/
viali@mat.ufrgs.br
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Os testes
O teste Qui-Quadrado
O teste exato de Fisher
O teste de Kolmogorov-Smirnov
O teste de U de Mann-Whitney
O teste de Wilcoxon

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

O teste qui-quadrado Hipteses e Clculo


O teste de duas ou mais amostras H0 : As variveis so independentes
independentes pode ser utilizado para
verificar a dependncia ou independncia H1 : As variveis so dependentes
entre as variveis sendo consideradas. A varivel teste : k l 2
As variveis devem estar tabuladas em O ij E ij
- ( )
tabelas de contingncia. Para o caso de duas j = 1
variveis tem-se uma tabela de dupla entrada. 2 = i = 1
E ij
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

1
Expresso alternativa Onde:
k l 2
A varivel
(O ij -E ij ) r = nmero de linhas da tabela;

teste : 2 = i= 1 j= 1 L = nmero de colunas da tabela;


=
E ij Oij = freqncia observada na interseo
k l da linha i com a coluna j.
O 2ij
i= 1 j = 1 Eij = nmero de casos esperados na
= -n interseo da linha i com a coluna j.
E ij
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Onde:
pij a probabilidade de ocorrer uma
2 a estatstica teste;
observao na clula ij. Se as variveis so
k l supostamente independentes (H0
n = O ij = tamanho da amostra; Verdadeira), ento pij = pi. p.j, onde pi. a
i= 1 j= 1 probabilidade marginal correspondente
E ij = n p ij so as freqncias esperadas linha i e p.j a probabilidade marginal
de cada clula ij da tabela. correspondente a coluna j.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Como no se conhecem as probabilidades


marginais, elas devem ser estimadas atravs
das correspondentes freqncias relativas.
l k
Ento:
f i.= f e f = f
E ij = n p ij = n p i . . p . j = j=1
ij .j ij
i= 1
f f .j f i. f .j
i.
n. . =
n n n

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

2
A tabela mostra os resultados de uma
avaliao de satisfao com a compra de um
novo modelo de automvel de luxo. Teste a
hiptese de que o novo modelo est agradando
mais aos consumidores homens do que os
consumidores mulheres.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Hipteses

Avaliao H0: Homens e mulheres esto igualmente


Consumidores Muito Pouco No Satisfeito
satisfeitos.
Homens 30 20 15
Mulheres 25 5 5 H1: Homens e mulheres no esto
igualmente satisfeitos.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Totais marginais Freqncias Esperadas

Consumidores M P NS Total Consumidores M P NS Total


Homens 30 20 15 65 Homens 35,75 16,25 13 65
Mulheres 25 5 5 35 Mulheres 19,25 8,75 7 35
Total 55 25 20 100 Total 55 25 20 100

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

3
Clculo do Qui-Quadrado A estat
estatstica amostral
O grau de liberdade :
Consumidores M P NS Total = ( k - 1 )( l - 1 ) = ( 2 - 1 ).(3 - 1 ) = 2
Homens 0,925 0,865 0,310 2,100
Ento: 3 2
Mulheres 1,712 1,607 0,570 3,900

2
(O ij -E ij )
Total 2,642 2,473 0,880 5,990 i=1 j=1
22 = = 5 ,990
E ij
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Qual a significncia deste resultado? Tipos de Qui-Quadrado


O SPSS fornece ainda os seguintes valores do 2:
Qui-Quadrado de Pearson;
Corrigido de Yates ou Correo de Continuidade;
Razo de verossimilhana;
Teste exato de Fisher;
Qui-Quadrado de Mantel-Haenszel ou teste de
Estes resultado 4,99% < 5% = associao linear ou ainda associao linear por
significncia do teste. Rejeito H0. linear.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Correo de Continuidade Yates Razo de verossimilhana


Obs.: S para tabelas 2x2 k l O
G 2 = 2 O ij ln ij
k l 2 E ij
0 , O ij - E ij 0 ,50 )] i =1 j =1
[max(
i =1 j =1
Q C = Quando as variveis das linhas e colunas
E ij
so independentes a estatstica G2 tem uma
Sob a hiptese nula de independncia a distribuio assinttica Qui-Quadrado com
estatstica QC tem uma distribuio assinttica (k -1).(l -1) G.L.
Qui-Quadrado com (k -1).(l -1) G.L.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

4
Qui-Quadrado de Mantel-Haenszel Tabelas 2x2
+ - Total
Q =( n 1 )r 2
MH
+ a b a+b
- c d c+d
O Qui-Quadrado de Mantel-Haenszel Total a+c b+d n
testa a hiptese de que existe um
relacionamento linear entre as duas variveis. Nesse caso o c2 pode ser calculado por:
R2 a correlao de Pearson (r) entre as duas n ( ad bc ) 2
2 =
variveis. ( a + b )( c + d )( a + c )( b + d )
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

O teste exato de Fisher


O teste de Fisher til para analisar
dados discretos (nominais ou ordinais),
quando os tamanhos das duas amostras so
pequenos.
A cada indivduo nos grupos atribudo
um dentre dois escores possveis. Os escores
so freqncias em uma tabela 2x2.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Disposio dos dados na prova de Fisher.


As amostras podem ser quaisquer dois
grupos independentes tais como: homens e - + Total
mulheres, empregados e desempregados, Grupo I A B A+B
catlicos e no-catlicos, pais e mes, etc. Grupo II C D C+D
Total A+C B+D n

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

5
Os cabealhos so arbitrariamente A prova determina se os dois grupos
indicados com sinais de "mais" e "menos", diferem na proporo em que se enquadram,
podem indicar duas classificaes quaisquer: nas duas classificaes, ou seja, a prova
acima e abaixo da mediana, aprovado e determina se o Grupo I e o Grupo II diferem
reprovado, graduados em cincias e graduados significativamente na proporo de sinais
em artes, a favor ou contra, etc. "mais" e "menos" atribudos a cada um.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

A estatstica teste
A + C B + D

A probabilidade de se observar A B =
P( X =x ) =
determinado conjunto de freqncias em n

uma tabela 2x2, quando se consideram A+B

fixos os totais marginais, dada pela ( A + B )! ( C + D )! ( A + C )! ( C + D )!


=
distribuio hipergeomtrica, isto : n! A! B ! C ! D !

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Suponha que os seguintes valores tenham


sido observados:
A = 10, B = 0, C = 4 e D = 5. Ento a tabela
anterior seria:
- + Total
Grupo I 10 0 10
Grupo II 4 5 9
Total 14 5 19

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

6
O valor da estatstica, nesse caso, Esse exemplo foi simples em virtude da
seria: existncia de uma clula com valor zero. Se
nenhuma das freqncias for zero, sob Ho,
P = (10!9!14!5!)/(19!10!0!4!5!) = 1,08%
podem ocorrer desvios "mais extremos" que
Ento sob Ho, a probabilidade de devem ser levados em conta, pois o teste
dessa configurao ou uma mais extrema envolve a probabilidade daquela ocorrncia ou
de p = 1,08%.
de uma ocorrncia ainda mais extrema?
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Suponha, por exemplo, que os resultados Com os mesmos totais marginais, uma
de um teste fossem os da tabela: situao mais extrema seria:

- + Total - + Total
Grupo I 1 6 7 Grupo I 0 7 7
Grupo II 4 1 5 Grupo II 5 0 5
Total 5 7 12 Total 5 7 12

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Se quisermos aplicar o teste a esses


Logo:
devemos somar as probabilidades das duas
p = p1 + p2 = 4,40% + 0,13% = 4,53%.
ocorrncias.
Isto 4,53% o valor-p que se deve
Tem-se, ento:
utilizar para decidir se esses dados nos
p1 = (7!5!5!7!)/(12!1!6!4!1!) = 4,40%.
permitem rejeitar Ho.
p2 = (7!5!5!7!)/(12!0!7!5!0!) = 0,13%.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

7
Pelo exemplo, pode-se verificar, que mesmo
quando o menor valor no muito grande, os
clculos do teste de Fisher se tornam longos.
Por exemplo, se o menor valor for 2, deve-
se determinar 3 probabilidades e som-las. Se o
menor valor de uma na clula trs, tem-se que
determinar quatro probabilidades e som-las e
assim por diante.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Objetivos
A prova de Kolmogorov-Smirnov de duas A prova unilateral utilizada para
amostras verifica se elas foram extradas da determinar se os valores da populao da qual
mesma populao (ou de populaes com a
se extraiu uma das amostras so, ou no,
mesma distribuio). A prova bilateral
sensvel a qualquer diferen
diferena nas distribuies estocasticamente maiores do que os valores da
das quais se extraram as amostras (posio populao que originou a outra amostra.
central, disperso ou assimetria).
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Metodologia
Se as duas amostras foram extradas da
O teste utiliza as distribuies
mesma populao, ento se espera que as
acumuladas. A prova de uma amostra verifica
distribuies acumuladas das amostras estejam
a concordncia entre a distribuio de um
prximas. Se as distribuies esto distantes
conjunto de valores amostrais e uma
isto sugere que as amostras provenham de
distribuio terica. A prova de duas amostras
populaes distintas e um desvio grande pode
visa a concordncia entre dois conjuntos de
levar a rejeio da hiptese de nulidade.
valores amostrais.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

8
Aplicao
O teste paramtrico equivalente o t. Para aplicar a prova constri-se a
Embora menos eficiente o K-S mais verstil distribuio das freqncias acumuladas
pois trabalha apenas com as ordens das duas relativas de cada uma das amostras, utilizando
variveis, sem se preocupar com o valor das os mesmos intervalos (amplitude de classes)
mesmas. Ele envolve menos clculos e apresenta para cada uma delas. Em cada intervalo
subtra-se uma funo da outra. A prova
menos restries que o teste t.
utiliza como estatstica o maior destas
diferenas.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Hipteses
Onde k1 = nmero de valores Xi x;
H0 : As amostras so da mesma pop.
k 2 = nmero de valores Yj x;
H1 : As amostras no so da mesma pop.
Define-se:
Inicialmente ordenam-se as t = m + n D = max|S1(x) S2(x)|
observaes de forma crescente. Considera-se
os estimadores S1 e S2 de F1 e F2, isto :
S1(x) = k 1/m e S2(x) = k2/n
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Exemplo:
Os resultados de duas amostras A e B
Rejeitamos H0, ao nvel de so:
significncia se: A B
7,49 7,37 7,28 7,48
D = max|S1(x) S2(x)| D,
7,35 7,51 7,35 7,31
onde
7,54 7,50 7,52 7,22
P(D D) = 7,48 7,52 7,50 7,41
7,48 7,46 7,52 7,45

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

9
A tabela
Verifique se existe uma diferena
Se o n > 40 e o teste bilateral, ento o
significativa entre as duas amostras.
valor crtico dado por: n1 + n 2
Tem-se: d = 1 ,36
n1n 2
H0: F1(x) = F2(x)
Se o teste unilateral, ento o valor
H1: F1(x) F2(x) crtico dado por:
n1 n2
Fazer no Excel e depois no SPSS! 22 = 4 D 2
n1 + n2
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Amostras de n1 = n2 = 50 valores das


opinies de diretores financeiros de
grandes e pequenas empresas mostraram os
resultados da tabela seguinte, medidos em
uma escala Likert de 5 pontos:

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Amostras de n1 = n2 = 50 valores das opinies


de diretores de empresas Grande e Pequenas
Escala Grandes Pequenas Teste a hiptese de que opinies
1 5 15
2 8 13
dos diretores dos dois tipos de
3 10 10 empresa so divergentes.
4 15 8
5 12 4
Total 50 50
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

10
Determinao das Diferenas
Escala Grandes Pequenas Fr1(x) Fr2(x) |D| Como as amostras so grandes n > 40, o
1 5 15 0,10 0,30 0,20
qui-quadrado deve ser utilizado. Assim:
2 8 13 0,26 0,56 0,30
3 10 10 0,46 0,76 0,30
4 15 8 0,76 0,92 0,16 d = 1,36 nn 1 2
= 0, 27
n +n1 2
5 12 4 1,00 1,00 0,00
Total 50 50 0,30
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Concluso
A menos de um erro de 5%

(significncia), posso afirmar que as opinies


dos diretores financeiros de empresas grandes
e pequenas so divergentes.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Objetivos
Comprovar se dois grupos independentes H0: A e B apresentam a mesma distribuio.
foram ou no extrados da mesma populao.
H1: A maior do que B (teste unilateral).
Requisitos
Grau de mensurao seja pelo menos ordinal.
Substitui
O teste t para amostras independentes.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

11
Metodologia
Sejam n1 = nmero de casos no menor dos
Nessa ordenao ascendente, consideram-
dois grupos independentes e n2 = nmero de
se os valores algbricos do grupo n = n1 + n2,
casos no maior grupo. Primeiramente
combinam-se as observaes ou escores de isto , os postos mais baixos so atribudos aos
ambos os grupos, relacionando-os por ordem maiores valores (negativos se houver).
ascendente.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Focaliza-se agora um dos grupos, por


exemplo, o grupo que apresenta n 1 casos. O
valor de U (a estatstica teste) o nmero de
vezes que um escore no grupo com n2 casos
precede um escore no grupo com n1 casos no
grupo ordenado formado por n = n1 + n 2 casos.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Suponha um grupo experimental com Para determinar U, ordenam-se


n1 = 3 casos e um grupo de controle n2 com 4 primeiro os escores de forma crescente,
casos. Admita-se que os escores sejam os tendo o cuidado de identificar a qual
seguintes:
grupo cada um pertence (E ou C):
Experimental 9 11 15
6 8 9 10 11 13 15
Controle 6 8 10 13
C C E C E C E
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

12
Nenhum escore E precede o escore C
Considera-se agora o grupo de controle e
igual a 6. Isto tambm verdade para o escore
conta-se o nmero de escores E que precedem
C = 8. O prximo escore C 10 e precedido
cada escore do grupo de controle.
por um escore E. O ltimo escore C, o 13,
antecedido por dois escores E.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Assim, U = 0 + 0 + 1 + 2 = 3. O nmero A distribuio amostral de U, sob H0,


de vezes que um escore E vem antes de um conhecida e pode-se ento determinar-se a
escore C igual a 3, isto , U = 3. probabilidade associada ocorrncia, sob H0,
de qualquer valor de U to extremo quanto o
valor observado.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Amostras bem pequenas


O conjunto J formado por seis tabelas
Quando nem n 1 e nem n2 so superiores
separadas, uma para cada valor de n2, com
a 8, pode-se utilizar o conjunto J (Siegel)
3 n2 8. Para determinar a probabilidade,
para determinar a probabilidade exata
sob H 0, associada aos dados necessrio
associada ocorrncia, sob H0, de qualquer
entrar com os valores de n1, n2 e U.
U to extremo quanto o valor observado.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

13
Observao 1:
No exemplo dado, tem-se: n 1 = 3, n 2 = 4
e U = 3. A tabela de n2 = 4 do conjunto J As probabilidades fornecidas so
unilaterais. Para um teste bilateral, deve-se
mostra que U 3 tem probabilidade de
duplicar o valor da probabilidade
ocorrncia, sob H0, de p = 0,20 = 20%.
apresentado em cada tabela.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Observao 2: Amostras mdias


Caso o valor observado de U seja
Se n2 representar o tamanho da maior
grande e no conste da tabela, existe a
das duas amostras e for maior do que 8, o
possibilidade de ter-se tomado o grupo
errado no clculo de U. Neste caso, pode-se conjunto de tabelas J no poder mais ser
utilizar a transformao: utilizado. Quando 9 n2 20, pode-se
U = n1.n2 - U, onde U o valor que no foi utilizar tabela K (Siegel).
encontrado na tabela.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Este conjunto de tabelas fornece valores


Essa tabela fornece valores crticos de
crticos de U e no probabilidades exatas
U para os nveis de significncia de 0,001,
0,01, 0,025 e 0,05 para um teste unilateral. (como as J). Isto , se um valor observado de
Para um teste bilateral, os nveis de U, para n 1 20 e 9 n2 20, no superar
significncia so dados por: 0,002, 0,02, o valor da tabela, pode-se rejeitar H0, a um
0,05 e 0,10. dos nveis de significncia indicados.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

14
Amostras mdias Determinao de U Ento: n ( n +1 )
U = n1 n 2 + 1 1 R 1
Para valores grandes de n1 e n 2, o 2
ou
mtodo para determinar U trabalhoso. n ( n +1 )
U = n1 n2 + 2 2 R 2
Um processo alternativo com resultados 2

idnticos, consiste em atribuir posto 1 ao


onde R 1 = soma dos postos atribudos ao
valor mais baixo do grupo combinado grupo n 1 e R 2 = soma dos postos atribudos
(n1 + n2) valores, o posto 2 ao valor seguinte
ao grupo n 2.
e assim por diante.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Por exemplo, se n1 = 6 e n2 = 13, um


valor de U = 12 permite rejeitar H0 ao nvel

= 0,01 em uma prova unilateral e rejeitar


H0 ao nvel = 0,02 em uma prova
bilateral.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Para ilustrar o processo vamos


utilizar amostras pequenas. Assim: Aplicando a frmula anterior segue:
Escore E Posto Escore C Posto
U = 4.5 + 5.(5 + 1) / 2 - 26 = 9
78 7 110 9
64 4 70 5 O menor dos dois valores de U aquele
75 6 53 3
cuja distribuio amostral constitu a base
46 1 51 2
82 8 da tabela K (Siegel).
Soma R2 = 26 Soma R1 = 19

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

15
Amostras grandes Mdia
n n
Nem a tabela J e nem a K podem ser U = E( U ) = 1 2
2
utilizadas quando n 2 > 20. e
n1n 2 ( n1 + n2 + 1 )
Mann e Whitney mostraram (1947), U =
12
que medida que n 1 e n2 aumentam, a Ento: U 1 2
n n
U U 2
z= =
distribuio amostral de U tende U n 1 n 2 ( n1 + n 2 + 1 )
rapidamente para a distribuio normal, 12

com: assintticamente N(0; 1)


Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Empates
Admite-se que as observaes que
A prova de Mann-Whitney supe que
estejam empatadas, tenham, na realidade,
os escores representem uma distribuio
basicamente contnua. Numa distribuio escores diferentes, e que esta diferena
contnua a probabilidade de um empate muita pequena para ser detectada pelo
zero. Todavia, como a mensurao tem uma instrumento de medida.
preciso limitada, os empates podem ocorrer.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Assim quando ocorrem empatem Se os empates ocorrem entre dois ou


atribu-se a cada um dos valores empatados a mais valores do mesmo grupo, o valor de U
mdia dos postos que lhes seriam atribudas no afetado. Mas se os empates ocorrem
se no houvesse empate. entre duas ou mais observaes envolvendo
os dois grupos, ento o valor de U afetado.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

16
Embora, os efeitos prticos dos empates O efeito dos postos empatados modifica

sejam desprezveis existe uma correo para a variabilidade do conjunto de postos. Assim,
a correo deve ser aplicada ao desvio padro
empates que deve ser utilizada com a
da distribuio amostral de U. Com esta
aproximao normal para grandes amostras.
correo o desvio padro dado por:

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

n n n 3 n
U = 1 2 T
n ( n 1 ) 12

Onde n = n1 + n2
T = (t 3 - t) / 12
t = nmero de escores empatados para
um determinado posto.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Clique conforme figura Isso abrir a seguinte caixa de dilogos:

Coloque Rating ... Como Test Variable


List e Sex of subject como Grouping Variable
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

17
Clique em Define Groups Test Statistics
RATING Rating of the importance of
body as characteristic in a partner
Mann-Whitney U 147,500
Wilcoxon W 357,500
Z -1,441
Asymp. Sig. (2-tailed) ,150
Entre os cdigos, conforme planilha. Exact Sig. [2*(1-tailed ,0157
Sig.)]
a Not corrected for ties.
b Grouping Variable: SEX Sex of subject

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Concluso:
No possvel afirmar que existe
diferena entre homens e mulheres quanto a
importncia que eles atribuem a forma do
corpo do companheiro.
U = 147,50, n 1 = 20, n2 = 20, p = 15,70%
bilateral.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Objetivos Requisitos
O teste de Wilcoxon investiga se
As duas amostras so aleatrias e
existe diferena na posio de duas
independentes.
populaes. Introduzido em 1945 com o
nome de Teste da Soma dos Postos (Rank Substitui
Sum Test) destacou-se na rea no
O teste t para amostras independentes.
paramtrica pelo seu poder.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

18
Metodologia
Sejam X 1, X2, ..., Xm e Y1, Y 2, ..., Yn
H0: Os grupos A e B so da mesma populao.
(m n). Forma-se um nico grupo de
H1: Os grupos A e B no so da mesma k = m + n observaes ordenadas de forma
crescente. n
populao.
Define-se: W = O j
j =1
Onde Oj representa a ordem de Yj na
classificao conjunta dos k = m + n valores.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

As hipteses so:
H0: = 0
H1: > 0 A hiptese unilateral mais
<0 recomendvel pois a idia de que uma
0 populao em mdia maior do que a
Rejeitamos H 0 se W W onde outra.
P(W W) = nas hipteses unilaterais e
metade desse valor na bilateral.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Observaes:
(i) Os valores mximo e mnimo de W ocorrem Wmx X X ... X Y Y ... Y

quando Yj ocupa respectivamente as n ltimas Wmn Y Y ... Y X X ... X


E assim, tem-se:
ou as n primeiras observaes na classificao
conjunta k = m + n. Tais valores correspondem n n( n +1 ) k n( 2m + n +1 )
Wmn = j = e Wmx = j =
as seguintes situaes: j =1 2 j =m+1 2

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

19
(ii) A mdia (mediana) dos possveis valores (iv) W uma varivel discreta.
de W, sob H 0 : n(m+ n +1) (v) n o tamanho da menor amostra.
Wmed =
2 (vi) A distribuio de W, sob H0, simtrica
(iii) A amplitude do intervalo de variao em relao a sua mdia. Como
conseqncia: W = n(m + n +1) - W1-
de W :
Ou seja:
AW = Wmx Wmn = mn
P( W W) = P[W n(m+n+1) - W1- ]

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Suponha que se tenha dois grupos, um


denominado de experimental e outro de
controle, conforme valores da tabela.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Experimental Controle
Valores
Escore Posto Escore Posto
1 25 18 12 10 Como as duas amostras so iguais e no
2 5 3 16 15
3 14 13 6 4 apresentam empates entre os grupos o valor
4 19 17 13 12
da estatstica de Wilcoxon a menor das
5 0 1 13 11
6 17 16 3 2 duas somas de postos obtida. Nesse caso,
7 15 14 10 7
8 8 6 10 8 W = 78
9 8 5 11 9
Total 93 W = 78
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

20
Considere os seguintes valores de duas
Empates
amostras X e Y:
Quando ocorrem empates entre valores X Y
1 2,3 1,8
dos dois grupos, ou seja, entre X e Y, a mdia 2 3,2 2,3
das ordens dos valores empatados utilizada 3 3,8 2,3
4 4,5 3,2
no clculo de W e o clculo realizado da
Esses valores em um nica amostra
mesma forma que anteriormente.
ordenada seriam:
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Valores 1,8 2,3 2,3 2,3 3,2 3,2 3,8 4,5


Observao:
Grupo Y X Y Y X Y X X
Postos 1 2 3 4 5 6 7 8 Empates entre os valores de X e entre os
Empates 1 3 3 3 5,5 5,5 7 8 valores de Y apenas no afetam o valor da
Ento: estatstica W, mas afetam a sua distribuio
W = 1 + 3 + 3 + 5,5 = 12,5
sob H 0.
W = 3 + 5,5 + 7 + 8 = 23,5

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Aproximao pela normal Correo de continuidade


Quando n e m crescem os valores de W Em geral recomendvel aplicar-se uma
podem ser aproximados por uma distribuio correo de continuidade na aproximao
normal de mdia: n( m + n +1 ) pela normal. Essa correo consiste em somar
W = E( W ) =
2
ou subtrair o valor 0,5 ao valor de W
e desvio padro: mn( m + n +1 )
W = conforme se esteja calculando valores na
12
parte inferior ou superior da curva.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

21
Por exemplo: Distribuio sob H0
Se m = 8, n = 4 e W = 35. O limite
Para ilustrar a distribuio sob H0 de
superior exato 7,7%.
W. Considere-se m = 4 e n = 2. Com essa
Aproximando pela normal, sem
correo, temos valor-p = 6,32% configurao o nmero de combinaes
6 6
Utilizando a correo o valor passa (agrupamentos) possveis : = = 15
4 2
para valor-p = 7,44%.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

De onde obtm-se a distribuio:


Agrupamento W0 Agrupamento W0
YYXXXX 3 XYXXXY 8 W0 P(W = W0) P(W W0) P(W W0)
3 0,0667 0,0667 1,0000
YXYXXX 4 XXYYXX 7
4 0,0667 0,1333 0,9333
YXXYXX 5 XXYXYX 8
5 0,1333 0,2667 0,8667
YXXXYX 6 XXYXXY 9 6 0,1333 0,4000 0,7333
YXXXXY 7 XXXYYX 9 7 0,2000 0,6000 0,6000
XYYXXX 5 XXXYXY 10 8 0,1333 0,7333 0,4000
XYXYXX 6 XXXXYY 11 9 0,1333 0,8667 0,2667
XYXXYX 7 10 0,0667 0,9333 0,1333
11 0,0667 1,0000 0,0667
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Observaes: Empates:
Considerando os resultados anteriores, tem-se: No caso de observaes empatadas a
(i) P(W = W0) = P[W = n(m + n + 1) W0] distribuio de W se altera e como
(ii) P(W W0) = P[W n(m + n + 1) W0] conseqncia os nveis de significncia das
(iii) A distribuio simtrica em torno da tabelas que so feitas sem empates se tornam
mdia E(W) = n(m + n + 1)/2 apenas aproximaes.

Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

22
Exemplo: Agrupamento W0 Agrupamento W0
YYXXX 3 XYXY X 5,5
Para ilustrar considere-se duas amostras
YXYXX 4,5 X Y XXY 7
de tamanhos m = 3 e n =2, onde os valores dos YXXYX 4,5 XXYYX 7
YXX YX 6 XXYXY 8,5
postos 3 e 4 so iguais. Os possveis arranjos XYYXX 5,5 XXXYY 8,5
bem como a distribuio da estatstica W, para
A distribuio de W0, para essa situao,
essa situao, so as seguintes: ser:
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Distribuio de W sob H0
W0 P(W = W0) P(W W0)
3 0,10 1,00
4,5 0,20 0,90
5,5 0,20 0,70
6 0,10 0,50
7 0,20 0,40
8,5 0,20 0,20

Assim, por exemplo, se W = 8,5, P(W 8,5)


= 0,20, mas pela tabela tem-se: 10%
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

Cinco mulheres e dez homens foram


submetidos a um teste de aptido para exercer
determinada funo. Eles foram avaliados por
meio de uma escala de 0 a 10. Os resultados
esto na tabela. Se voc fosse o diretor com
qual grupo trabalharia? Resolva utilizando o
Excel e o SPSS.
Prof. Lor Viali, Dr. UFRGS Instituto de Matemtica - Departamento de Estatstica Curso de Estatstica

23

You might also like