Professional Documents
Culture Documents
Variveis Qualitativas
Como o objetivo deste manual a anlise meramente qualitativa (QL-QL), temos que perceber
alguns fatores:
1. Tipos de Varivel Qualitativa:
a. Nominal: a ordem no importa (ex: Masculino e feminino, no h um mais
importante que o outro, ento tanto faz. O fato de beber ou no beber
tambm no interfere, nem mesmo time que se torce, ou gnero do filme)
b. Ordinal: a ordem importa, h uma hierarquia implcita ou explcita (ex: o
conceito num mestrado, Excelente maior que Muito Bom, que maior que
Mediano, etc A escolaridade tambm interfere, pois alguns tem MAIOR
escolaridade do que outros.)
2. Dependncia da Varivel:
Quando h duas variveis, temos que inferir qual que depende da outra.
Como assim? Por exemplo se queres saber se o fato do gnero influencia no
gosto de um filme, a varivel INDEPENDENTE (a que regula) o GNERO), j a
DEPENDENTE ( o filme). Ou seja, queres analisar se o fato de algum gostar
Guilherme Augusto de Matheucci e Silva gui_fla@yahoo.com.br Engenharia Sanitria e
Ambiental 13/11/2013
Quantidade (X%)
1400 (28%)
1300 (26%)
1200 (24%)
100 (2%)
1000 (20%)
5000 (0%)
Homem
4
(10%)
16 (40%)
2
(5%)
22
(55%)
Mulher
8
(20%)
4
(10%)
6
(15%)
18 (45%)
Total
12 (30%)
20 (50%)
8 (20%)
40 (100%)
Olhando esse caso, j pode-se observar alguma discrepncia. Por exemplo, h uma grande
quantidade de homens que gostam de futebol e poucos que gostam de tnis. J nas mulheres
parece haver um equilbrio. Isto pode ser analisado mais numericamente utilizando o mtodo
do X
Frequncia esperada
Como falei, representa um mundo onde no h relao entre as variveis. Mostra o que se
ESPERA!
Vejamos o exemplo do manual anterior:
OBSERVADO
Maior de Idade
Menor de Idade
Total
Homens
400
200
600
Mulheres
300
100
400
Total
700
300
1000
Como vamos obter a tabela ESPERADA??? Bem, podemos fazer CLULA A CLULA. Lembrem
como calculamos cada clula???
A primeira clula indica os HOMENS que so ADULTOS (maiores de idade). Em probabilidade,
qual a chance de uma pessoa aleatria ser um homem E um adulto???
Ou seja, qual P(AH)? Pela ltima frmula que verificamos, temos que:
Assim, 0,42 a chance ESPERADA, num mundo IDEAL, de uma pessoa ser HOMEM e ADULTO.
Como temos 1000 pessoas, 42% de 1000 420.
Vamos seguir esse mesmo raciocnio para as outras clulas:
Guilherme Augusto de Matheucci e Silva gui_fla@yahoo.com.br Engenharia Sanitria e
Ambiental 13/11/2013
Homens
420
180
600
Mulheres
280
120
400
Total
700
300
1000
Note que as extremidades continuam as mesmas. Isso porque a chance de cada varivel,
independentemente, foi MANTIDA! Naturalmente, pois a chance de ser homem continua a
mesma, independente de qualquer outra coisa. Isso ajudar a entender o conceito de GRAU
DE LIBERDADE
Grau de Liberdade
Significa o nmero de variveis livres na tabela, isto , considerando que as extremidades so
sempre as mesmas, quantos nmeros eu posso botar ALEATORIAMENTE????
Ex, se eu fizer uma nova observao e descobrir que h 500 homens. Como as extremidades
esto FIXAS, as outras clulas dependero DESTA inicial. Ou seja, esta inicial completamente
LIVRE, enquanto as outras so DEPENDENTES dessa.
Maior de Idade
Menor de Idade
Total
Homens
500
600-500 = 100
600
Mulheres
700-500 = 200
300-100=400-200=200
400
Total
700
300
1000
Observe que s UM valor controla a tabela, ento o grau de liberdade UM, isto , s tem um
valor livre.
Agora olhe essa outra tabela aqui:
Esporte favorito
Volei
Futebol
Tenis
Total
Homem
4
16
2
22
Mulher
8
4
6
18
Total
12
20
8
40
Veja que agora temos duas categorias para uma varivel, enquanto temos duas categorias
para a outra. Como saberemos ento? Lembrando que as extremidades ficam fixas, se
Guilherme Augusto de Matheucci e Silva gui_fla@yahoo.com.br Engenharia Sanitria e
Ambiental 13/11/2013
Homem
9
Mulher
3
22
18
Total
12
20
8
40
As pessoas que gostam de Futebol e Tenis podem variar. Eu posso escolher 9 homens que
gostam de futebol, restando assim somente quatro que gostam de tnis. Ou ento 11 homens
que gostam de futebol, restando apenas dois que gostam de tnis. Note que ainda h outra
clula livre para eu escolher. Veremos se com ela j completamos.
Esporte favorito
Homem
Mulher
Volei
9
12-9 = 3
Futebol
11
20-11 = 9
Tenis
22-11-9 = 2
8-2=18-9-3 = 6
Total
22
18
FECHOU! Ento temos duas variveis livres nesse caso.
Total
12
20
8
40
Agora vamos raciocinar um pouco A primeira tabela tinha duas linhas e duas colunas (ignore
os totais, pelo amor de deus) e o grau de liberdade era UM. A segunda tabela tinha duas trs
linhas e duas colunas e o grau de liberdade era dois. Se resolveres brincar (eu sei que no vais),
vers que numa 3x3 temos quatro variveis livres:
Amarelo
Vermelho
Azul
Total
Girassol
19
1
20-19-1 = 0
20
Violeta
0
10
40-10-0= 30
40
Rosa
20-19-0 = 1
50-10-1 = 39
30-30-0=40-39-1=0
40
Total
20
50
30
100
Qui Quadrado
Como eu falei o somatrio das diferenas sobre o valor esperado. Se encontra na frmula:
Homens
400
200
600
Mulheres
300
100
400
Total
700
300
1000
Esperado
Maior de Idade
Menor de Idade
Total
Homens
420
180
600
Mulheres
280
120
400
Total
700
300
1000
Esto vendo aqueles somatrios. Vejam que tem i e j. Ou seja, faremos o somatrio dos
valores LINHA A LINHA e COLUNA A COLUNA. Mais precisamente, CLULA A CLULA!
p-valor
O p-valor a chance de erro ao se inferir na hiptese H1 (ali em baixo explicarei melhor),
primeiro vamos ao conceito matemtico:
O p-valor a rea debaixo de um intervalo de uma funo que usa o Qui Quadrado e o grau de
liberdade para avaliar as hipteses estatsticas.
Guilherme Augusto de Matheucci e Silva gui_fla@yahoo.com.br Engenharia Sanitria e
Ambiental 13/11/2013
Se utilizarmos o teste X, 0 p-valor nada mais do que uma integral da funo do X ou melhor
dizendo, a rea sobre o grfico. Para descobrir o p-valor, basta olhar na tabela:
Quanto deu o nosso gL na conta de cima (tem duas linhas e duas colunas), ento o gl :
gL = (2-1)*(2-1) = 1*1 = 1 [primeira linha dessa tabela grandona]
Quanto deu o nosso x? 7,93.
Ento procuramos nessa linha (no caso a primeira) um valor prximo de 7,93. No caso
o 7,88. Assim, olhamos o valor do pvalor na coluna (no caso 0,005)
Anlise: H0 e H1
Mas afinal, para que vale isso??? Simples precisamos comparar o pvalor com a nossa
significncia para verificar o nosso teste de hipteses. Por qu? Por que a significncia a
chance mxima de dar errado. Quanto menor for essa chance MAIS EXIGENTE devemos ser, ou
seja, precisamos de um pvalor MENOR ainda para inferir que h associao.
Assim ser esquematizado:
No caso, o pvalor deu 0,005. Considerando a significncia 5% (0,05), podemos observar que h
sim relao, j que 0,005 < 0,05. Logo, H1.