You are on page 1of 94

Bioestatstica

Maurcio Cagy
Depto. de Epidemiologia e Bioestatstica
Instituto de Sade da Comunidade
Bibliografia Recomendada
Daz, F. R., Lpez, F. J. B., Bioestatstica, So Paulo:
Thomson Learning, 2007.
Morettin, P. A., Bussab, W. O., Estatstica Bsica, 5a.
Ed., So Paulo: Editora Saraiva, 2006.
Medronho R.A. et al. (eds.), Epidemiologia, So Paulo:
Editora Atheneu, 2002.
Soares J.F., Siqueira A.L., Introduo Estatstica
Mdica,
1a. Ed., Belo Horizonte: Departamento de Estatstica
UFMG, 1999;
2a. Ed., Belo Horizonte: Coppemed, 2002.
Epidemiologia
o que os epidemiologistas estudam so os
determinantes e as condies de ocorrncia de
doenas e agravos sade em populaes
humanas. E o fazem empregando os mais
diversos mtodos e tcnicas, de acordo com suas
prprias vises de mundo, posicionamentos
tericos, e propsitos, imediatos ou no, de seus
estudos. (Carvalho, D.M., Epidemiologia - Histria e Fundamentos in: [2], p.6)
Bioestatstica
o conjunto de mtodos estatsticos usados no
tratamento da variabilidade nas cincias mdicas
e biolgicas. A Bioestatstica fornece mtodos
para se tomarem decises timas na presena de
incerteza, estabelecendo faixas de confiana para
a eficcia dos tratamentos e verificando a
influncia de fatores de risco no aparecimento de
doenas. ([3], p.11)
Varivel
a quantificao ou a categorizao da
caracterstica de interesse do estudo. ([3], p.33)
Tipos:
Categricas:
Ordinal (Ex.: nvel de gravidade de uma doena;
grau de satisfao com atendimento);
Nominal (Ex.: gnero, etnia);
Quantitativas:
Contnua (Ex.: grandezas fsicas, e.g. altura,
massa, presso, temperatura);
Discreta (Ex.: contagens, propores).
Codificao

Decodificao
Discretizao
(Quantizao)
Varivel Categrica
Codificao:
Representao dos valores desta variveis por meio
de smbolos em vez de palavras por extenso, visando
simplificao do preenchimento dos dados.
Deve permitir a decodificao, ou corre-se o risco de
se perder completamente esta informao.
Exemplo: gnero
M e F ou e , no lugar de masculino e feminino;
0 e 1 nesse caso, uma tabela deve informar a que
valor cada smbolo se refere para permitir a
decodificao.
Varivel Quantitativa
Discretizao Quantizao:
Arredondamento: busca-se o valor quantizado mais
prximo, seja abaixo ou acima:
Erro mximo: metade da resoluo da escala
Truncamento: busca-se o valor quantizado mais
prximo em direo ao zero:
Erro mximo: resoluo da escala

Valor verdadeiro: 36,98764953...
Valor arredondado: 37,0;
Valor truncado: 36,9.
Tabelas, Grficos e Medidas
Descritivas - Var. Categrica
Medidas Freqncias:
Absoluta (contagem);
Relativa (proporo).
Exemplo: em um grupo de 20 pacientes
cardiopatas, 6 so diabticos.
Freqncia absoluta de diabticos: 6;
Freqncia relativa de diabticos: 6/20 = 0,3 = 30%;

Tabelas, Grficos e Medidas
Descritivas - Var. Categrica
Tabelas de Contingncia:
Simples


Tabela 22
Diabetes Fr. Abs. Fr. Rel.
Sim 6 0,3
No 14 0,7
Cardiopata

Diabtico
Sim No Total
Sim 6 2 8
No 14 17 31
Total 20 19 39
Tabelas, Grficos e Medidas
Descritivas - Var. Categrica
Grficos:
Grficos de Setores (ou de pizza ou de torta - pie
chart):



Histogramas:

Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Medidas de Tendncia Central ou Centralidade:
Em torno de que valor se encontram nossas
observaes?
Medidas de Disperso ou Variabilidade:
Estes valores so parecidos uns com os outros ou
apresentam grande variabilidade?
Medidas de Simetria...
Medidas de Curtose...
...
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Medidas de Tendncia Central:
Mdia: somam-se os N valores e divide-se por N;
Mediana: valor abaixo do qual se encontra metade das
observaes;
Moda: valor (ou intervalo de valores) mais freqente.
Exemplo: altura de indivduos do gnero masculino (cm)
173 163 177 178 167 186 186 176 179 177 175 182 171 193 175 177 185 176 175 169

Mdia: cm

Mediana: 163 167 169 171 173 175 175 175 176 176 177 177 177 178 179 182 185 186 186 193
x
m
= (176+177)/2 = 176,5 cm

Modas: 175 e 177 cm
177 20 / 3540
1
1
= = =

=
N
i
i
N
x x
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
O que a mdia equilibra?
A soma de todos os desvios (diferena) em relao
mdia ( ) sempre nula!
Demonstrao:


Ou seja, a mdia equilibra os desvios...
Exemplo:
173 163 177 178 167 186 186 176 179 177 175 182 171 193 175 177 185 176 175 169
-4 -14 0 1 -10 9 9 -1 2 0 -2 5 -6 16 -2 0 8 -1 -2 -8
Somatrio acumulado:
-4 -18 -18 -17 -27 -18 -9 -10 -8 -8 -10 -5 -11 5 3 3 11 10 8 0

=

N
i
i
x x
1
0
) (
1 1 1
1
1
1 1
1
1 1 1
1
1
= = =
= |
.
|

\
|
=


= = = =
= = = = = =
N
i
i
N
i
i
N
i
i N
N
i
i
N
i
N
i
i N
N
i
i
N
i
N
i
i N i
N
i
i
x x x N x
x x x x x x
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Alm de a soma dos desvios em relao mdia
ser sempre nula, a mdia a referncia que
minimiza a soma dos desvios quadrticos (S.D.Q.).
Demonstrao - busca do parmetro a que minimiza o S.D.Q.:




Exemplo:
173 163 177 178 167 186 186 176 179 177 175 182 171 193 175 177 185 176 175 169
Soma dos desvios quadrticos com relao mdia (177): 938
Soma dos desvios quadrticos com relao a 176: 958
Soma dos desvios quadrticos com relao a 178: 958
x x a x Na
x a a x a x
da
a ax x d
da
a x d
da
a x d
N
i N
N
i
N
i
N N
i
N
i
i i i i
= = =
= = + = +
=
+
=

1
2 2 2 2
0 ) ( 0 ) 2 2 (
0
) 2 ( ) (
0
) (
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Medidas de Disperso ou Variabilidade:
Desvio Absoluto Mdio: valor mdio da distncia dos
indivduos com relao mdia;
Varincia e desvio padro;

173 163 177 178 167 186 186 176 179 177 175 182 171 193 175 177 185 176 175 169
-4 -14 0 1 -10 9 9 -1 2 0 -2 5 -6 16 -2 0 8 -1 -2 -8

Desvio Absoluto Mdio

Varincia

Desvio-Padro
cm 5 20 / 100
1
1
= = =

=
N
i
i
N
x x DAM
( )
cm 026 , 7
cm 368 , 49 19 / 938
2
2 2
1
2
1
1
1
2
1
1
2
= =
= = |
.
|

\
|
= =

=

x x
N
i
i N
N
i
i N x
s s
x N x x x s
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Estimador no-tendencioso da Varincia:
Por que N-1???

Resposta: para que a esperana matemtica deste
estimador seja a varincia real o
2
.



Como minimiza o S.D.Q., se dividssemos por N, o
estimador tenderia a subestimar a varincia.
( ) |
.
|

\
|
= =

=

2
1
2
1
1
1
2
1
1
2
x N x x x s
N
i
i
N
N
i
i
N
x
( ) ( )
( )
2 2
1
2 2
1
2 2
2 2 2 2
2 2 2 2 2
1
2
) 1 (
) ( ) ( Var ) ( ) ( Var ) ( ) (
) ( ) ( ) ( ) (
o o o o = = +
= E E + = E E
= E E = E E = |
.
|

\
|
E

=

N N N
x x x x N x x N
x N x N x N x x N x
N
N
N
i
i i
N
i
i
x
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Medidas de Disperso ou Variabilidade (cont.):
Percentis: o percentil de P% o valor abaixo do qual
se encontram P% dos indivduos:
10% - 90%
25% - 75% Primeiro e Terceiro Quartis (Q
1
e Q
3
)
Distncia Interquartil = Q
3
-Q
1

163 167 169 171 173 175 175 175 176 176 177 177 177 178 179 182 185 186 186 193

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
4,75 9,5 14,25
Q
1
=174,5 cm x
m
=176,5 cm Q
3
=179,75 cm

DI = 179,75-174,5 = 5,25 cm
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Tabelas e Grficos:
163 167 169 171 173 175 175 175 176 176 177 177 177 178 179 182 185 186 186 193
Ogiva



Histograma
Intervalo (cm) Freq. Abs.
163,0 | 170,5 3
170,5 | 178,0 10
178,0 | 185,5 4
185,5 || 193,0 3
Tabelas, Grficos e Medidas
Descritivas - Var. Quantitativa
Mais Grficos:
163 167 169 171 173 175 175 175 176 176 177 177 177 178 179 182 185 186 186 193 (cm)
(Q
1
= 174,5; x
m
= 176,5; Q
3
= 179,75 cm) ( = 177,0; s
x
= 7,026 cm)
Box-plot Mdia e DP
1,5.DI = 7,875 cm
3,0.DI = 15,75 cm
Q
3
+1,5.DI
Q
1
-1,5.DI
166,625 cm
187,625 cm
Q
3
+3,0.DI
Q
1
-3,0.DI
158,75 cm
195,5 cm
x
Box-Plot com Variveis
Gaussianas
Introduo Probabilidade
Conceitos Fundamentais:
Espao Amostral (E): o conjunto de todos valores
possveis que uma varivel aleatria pode assumir.
Ex.:
Lanamento de um dado E = {1;2;3;4;5;6}
Presso sistlica E = [60;320] mmHg
Evento Probabilstico ou Aleatrio: qualquer sub-
conjunto de E, e que traga um significado conceitual
dentro do fenmeno estudado.
Ex.:
Lanamento de um dado A = {1;2} (nmeros em que eu apostei...)
Presso sistlica A = [110;130] mmHg (presso normal...)
Introduo Probabilidade
Conceitos Fundamentais:
Relao entre Probabilidade e Proporo:
Qual a probabilidade de sair o nmero 3 no lanamento de um
dado de 6 faces?
Dado honesto: p(3) = 1/6;
Nada se sabe sobre a estrutura do dado:
Lanamos um nmero muito grande de vezes e estimamos a
probabilidade pela proporo de vezes que saiu o nmero 3


onde N
3
o nmero de vezes que resultou o nmero 3 e N
T
o
nmero total de lanamentos.

Definio:
T
N
N
p
3
) 3 (

=
T
N
N
N
p
T
3
lim ) 3 (

=
Introduo Probabilidade
Propriedades:
Seja A um evento probabilstico:
1. 0 s p(A) s 1
p(A) = 0 A impossvel
0 < p(A) < 1
p(A) = 1 A certo de acontecer
Ex.: p(A) = 2/6 = 1/3
2.

Conjunto complemento Lgica No
3. p(E) = 1 p({ }) = 0,
onde {} = C (conjunto vazio)
E
1 2
A
3 4
5 6
) ( 1 ) ( A A p p =
3 / 1 1 3 / 2 6 / 4 ) ( = = = A p
E
1 2
A 3
4
B
5 6
Sejam A e B dois eventos...
Excludncia Probabilstica: dois eventos so excludentes entre si (ou
mutuamente excludentes) se a ocorrncia de um EXCLUI a
possibilidade de o outro ocorrer.
4. p(A B) = p(A) + p(B)
se A e B so excludentes;
p(A B) = p(A) + p(B) p(A B)
caso contrrio (caso geral);




Conjunto Unio Lgica Ou
Conjunto Interseo Lgica &
E
1 2
A
3 4
B
5 6
Introduo Probabilidade
Introduo Probabilidade
Independncia Probabilstica: dois eventos so independentes
entre si se o conhecimento sobre a ocorrncia de um
deles no traz qualquer informao sobre a probabilidade
de o outro ocorrer, ou seja, a ocorrncia de um no
depende da ocorrncia do outro.
5. p(A B) = p(A) p(B)
se A e B so independentes;
p(A B) = p(A) p(B | A)
caso contrrio (caso geral);
p(B | A) a probabilidade condicional: l-se probabilidade de B
dado A.

Introduo Probabilidade
Se A e B so independentes: p(A B) = p(A) p(B), uma vez que
p(B) = p(B | A)
Exemplo: Lanamento de dois dados; qual a probabilidade de
resultar 3 no 1o. dado (A) e 5 no 2o. dado (B)?

1-1 2-1 3-1 4-1 5-1 6-1
1-2 2-2 3-2 4-2 5-2 6-2
1-3 2-3 3-3 4-3 5-3 6-3
1-4 2-4 3-4 4-4 5-4 6-4
1-5 2-5 3-5 4-5 5-5 6-5
1-6 2-6 3-6 4-6 5-6 6-6

p(A) =
6
/
36
=
1
/
6
p(B | A) =
1
/
6
p(B) =
6
/
36
=
1
/
6
p(A B) =
1
/
36
E


A
B
Introduo Probabilidade
Se A e B so dependentes: p(A B) = p(A) p(B | A),
Exemplo: Sorteio de duas bolas de um globo com 6 bolas sem
reposio; qual a probabilidade de resultar 3 na 1a. bola (A) e 5 na
2a. bola (B)?
2-1 3-1 4-1 5-1 6-1
1-2 3-2 4-2 5-2 6-2
1-3 2-3 4-3 5-3 6-3
1-4 2-4 3-4 5-4 6-4
1-5 2-5 3-5 4-5 6-5
1-6 2-6 3-6 4-6 5-6 .

p(A) =
5
/
30
=
1
/
6
p(B | A) =
1
/
5
p(B) =
5
/
30
=
1
/
6
p(A B) =
1
/
30
E


A
B
Introduo Probabilidade
Exemplo: O = ser obeso; C = ter cardiopatia.
p(O) = 0,1; p(C) = 0,2.






Teorema de Bayes
p(O C) = p(O) p(C | O) = p(C) p(O | C) = p(C O)
p(A B) = p(A) p(B | A) = p(B) p(A | B) = p(B A)
p(B | A) = p(B) p(A | B)
p(A)
NC e NO
730.000
Populao
1.000.000
Obesos
100.000
No Obesos
900.000
O e C
30.000
O e NC
70.000
NO e C
170.000
NO e NC
730.000
Cardio.
200.000
No Cardio.
800.000
C e O
30.000
C e NO
170.000
NC e O
70.000
Distribuies de Probabilidade
So modelos probabilsticos que descrevem alguns
comportamentos padres de fenmenos aleatrios.
Costuma-se eleger o modelo que seja mais adequado
ao fenmeno analisado.

A. Variveis Discretas:
1. Distribuio Uniforme (Valores equiprovveis)
Ex.: Lanamento de um dado de 6 faces
p(1) = 1/6;
p(2) = 1/6;
p(3) = 1/6;
p(4) = 1/6;
p(5) = 1/6;
p(6) = 1/6.
Distribuies de Probabilidade
2. Distribuio Triangular
Ex.: Lanamento de dois dado de 6 faces Resultado = soma das faces
E Resultados p _
2 1+1 1/36
3 1+2, 2+1 2/36
4 1+3, 2+2, 3+1 3/36
5 1+4, 2+3, 3+2, 4+1 4/36
6 1+5, 2+4, 3+3, 4+2, 5+1 5/36
7 1+6, 2+5, 3+4, 4+3, 5+2, 6+1 6/36 = 1/6
8 2+6, 3+5, 4+4, 5+3, 6+2 5/36
9 3+6, 4+5, 5+4, 6+3 4/36
10 4+6, 5+5, 6+4 3/36
11 5+6, 6+5 2/36
12 6+6 1/36
Distribuies de Probabilidade
3. Distribuio Binomial
Seja uma populao de tamanho infinitamente grande, na qual a
proporo de indivduos com uma dada caracterstica vale P. Qual a
probabilidade de, em uma amostra de N indivduos selecionados
aleatoriamente desta populao, k terem a tal caracterstica?
Ex.: P(C) = 0,1 ; N = 3 (C = canhotos; D = no canhotos ) P(D) = 0,9
E Indivduos X, Y e Z p _
0 DDD 0,9
3
= 0,729
1 CDD, DCD, DDC 3 0,1 0,9
2
= 0,243
2 DCC, CDC, CCD 3 0,1
2
0,9 = 0,027
3 CCC 0,1
3
= 0,001
( )
k N k N
k
P P k p

= ) 1 ( ) (
Distribuies de Probabilidade
4. Distribuio de Poisson
Seja um evento que se repete a uma taxa mdia de vezes por unidade
de tempo (UT). Qual a probabilidade de, em um determinado perodo de
1 UT, este evento ocorrer k vezes?
Ex.: = 1 e = 4
!
) (
k
e
k p
k

=

Distribuies de Probabilidade
B. Variveis Contnuas:
1. Distribuio Uniforme
Ex.: ngulo de parada de um disco: E = [0, 360)
Qual a probabilidade do ngulo 200? a altura do grfico? NO.
Qual a probabilidade de o ngulo estar entre 0 e 360? 100%.
A rea abaixo do grfico vale 100% por definio.
S tem sentido falar de probabilidade para intervalos!
Logo, o eixo vertical refere-se Funo Densidade de Probabilidade (pdf).





~ 95,45%
Distribuies de Probabilidade
2. Distribuio Gaussiana
Teorema do Limite Central (TLC) [quem central o limite, e no o teorema!]
Ex.: Altura da populao masculina adulta ( = 175,7 cm e o = 7,3 cm)



~ 68,27%
( )
2
2
2
2
1
) (
o

o t

=
x
e x pdf
Distribuies de Probabilidade
3. Distribuio Qui-Quadrada
Resultante da soma de K variveis gaussianas e independentes elevadas
ao quadrado: K o nmero de graus de liberdade;
Ex.: Grandezas quadrticas por natureza, p.ex. Potncia.
Ilustrao do TLC
1. Soma de dados de 6 faces:





2. Binomial aumentando-se o N:
Ilustrao do TLC
3. Poisson aumentando-se :





4. Qui-quadrada aumentando-se o nmero de graus de liberdade:
Inferncia Estatstica
A partir de informaes imprecisas, procura-se ter o melhor
conhecimento possvel sobre a medida exata; ou...
A partir de uma amostra, procura-se atingir concluses sobre a
populao.

1. Como a populao de onde
a amostra analisada se origina?

2. A amostra analisada origina-se
de uma determinada populao
conhecida?

3. Duas ou mais amostras podem ser
consideradas originrias de uma
mesma populao?
Estimadores Estatsticos
Testes de Hiptese
Estimadores Estatsticos
Muitas vezes, desejamos estimar uma dada caracterstica de
uma populao de interesse com base em uma amostra da
mesma, composta por N indivduos.
Seja uma caracterstica populacional (verdadeira) denotada por um
parmetro Q.
Esta mesma caracterstica, se extrada com base na amostra, representa
to somente uma estimativa de Q, denotada por .
Qual a confiabilidade / utilidade deste valor isolado?
Como se estabelecer uma forma de inferncia (i.e. entendimento sobre a
populao) a partir deste valor?
Em torno deste valor estimado, estabelece-se um intervalo que possua
elevada probabilidade de englobar o verdadeiro Q Intervalo de
Confiana.
Intervalo de confiana de 95% (IC
95%
): intervalo que possui 95% de
probabilidade de incluir o verdadeiro valor do parmetro estudado.
Q

( ) 95 , 0

= A + < < A
Pos Neg
Q Q Q p
Exemplo: Estimador da Mdia
Mdia populacional (valor verdadeiro):
Mdia amostral (estimativa de ):
Para se obter o IC
95%
, primeiro, precisamos entender qual seria
a distribuio de todas possveis estimativas de mdia caso
conhecssemos a populao:
desta populao, poder-se-iam selecionar muitas amostras de N
indivduos cada;
cada amostra ter a sua mdia, sendo que cada uma destas mdias uma
estimativa de ;
qual a mdia de todas estas estimativas de (qual o valor esperado das
estimativas de mdia)?
mas algumas amostras tero sua mdia amostral abaixo de , enquanto
outras tero acima de . as estimativas possuem variabilidade;
medida de variabilidade desvio padro...
desvio padro da estimativa de mdia Erro-Padro da mdia:
x
) (x EP
populao da padro desvio o onde , ) (
x
x
N
x EP o
o
=
Exemplo: Estimador da Mdia
Com base nesse conhecimento, se considerarmos que a varivel
analisada gaussiana, as estimativas de mdia tambm sero
gaussianas;
mesmo se a varivel no for gaussiana, caso N seja suficientemente
grande (N > 30), a distribuio das estimativas de mdia se aproxima de
uma gaussiana (TLC).
Assim sendo, pode-se dizer que 95% de todas as amostras
possveis desta populao tero mdia dentro do intervalo
seguinte: , ou seja um
intervalo para com base em .
Mas queremos justamente o contrrio: um intervalo para o
valor de com base em !
Caso conhecssemos o verdadeiro Erro-Padro da mdia, o
caminho inverso seria anlogo:
) ( 96 , 1 ) ( 96 , 1 x EP x x EP + < <
x
x
) ( 96 , 1 ) ( 96 , 1 x EP x x EP x + < <
Exemplo: Estimador da Mdia
Contudo, no conhecemos o verdadeiro Erro-Padro, uma vez
que ele depende do desvio-padro da varivel analisada na
populao (o
x
)! Mas podemos estimar tambm este desvio
padro com base na amostra:
Amostra : estimativa da mdia populacional ;
s
x
: estimativa do desvio padro populacional o
x
.

Usando-se s
x
, podemos estimar o Erro-Padro:

mas isto acarreta um aumento na incerteza sobre o .
Aumento de incerteza alargamento do intervalo de confiana.
Distribuio t de Student: incorpora a incerteza sobre o desvio-
padro (parece com a gaussiana, mas mais larga)

onde t
*
o valor crtico e gl o nmero de graus de liberdade (N-1).
x
) ( ) (
^
*
% 95 ;
^
*
% 95 ;
x EP t x x EP t x
gl gl
+ < <
N
s
x EP
x
= ) (
^
Exemplo: Estimador da Mdia
Altura de mulheres adultas (cm).






N = 38 gl = 37
= 161,84 cm
s
x
= 7,25 cm

= 1,177 cm
Intervalo de Confiana de 95%:
177 , 1 0262 , 2 84 , 161 177 , 1 0262 , 2 84 , 161 + < <
158

162

158

164

154

160

153

155

173

162

163

157

154

165

162

168

165

164

173

168

169

156

154

175

160

156

179

162

167

155

165

172

154

151

172

151

158

156



x
) (
^
x EP
cm 23 , 164 cm 46 , 159 < <
Distribuio t de Student
p(t
gl
T)

gl

0,600

0,750

0,900

0,950

0,975

0,990

0,995

0,9995

1

0,325

1,000

3,078

6,314

12,706

31,821

63,657

636,619

2

0,289

0,816

1,886

2,920

4,303

6,965

9,925

31,598

3

0,277

0,765

1,638

2,353

3,182

4,541

5,841

12,924

4

0,271

0,741

1,533

2,132

2,776

3,747

4,604

8,610

5

0,267

0,727

1,476

2,015

2,571

3,365

4,032

6,869

6

0,265

0,718

1,440

1,943

2,447

3,143

3,707

5,959

7

0,263

0,711

1,415

1,895

2,365

2,998

3,499

5,408

8

0,262

0,706

1,397

1,860

2,306

2,896

3,355

5,041

9

0,261

0,703

1,383

1,833

2,262

2,821

3,250

4,781

10

0,260

0,700

1,372

1,812

2,228

2,764

3,169

4,587

11

0,260

0,697

1,363

1,796

2,201

2,718

3,106

4,437

12

0,259

0,695

1,356

1,782

2,179

2,681

3,055

4,318

13

0,259

0,694

1,350

1,771

2,160

2,650

3,012

4,221

14

0,258

0,692

1,345

1,761

2,145

2,624

2,977

4,140

15

0,258

0,691

1,341

1,753

2,131

2,602

2,947

4,073

16

0,258

0,690

1,337

1,746

2,120

2,583

2,921

4,015

17

0,257

0,689

1,333

1,740

2,110

2,567

2,898

3,965

18

0,257

0,688

1,330

1,734

2,101

2,552

2,878

3,922

19

0,257

0,688

1,328

1,729

2,093

2,539

2,861

3,883

20

0,257

0,687

1,325

1,725

2,086

2,528

2,845

3,850

21

0,257

0,686

1,323

1,721

2,080

2,518

2,831

3,819

22

0,256

0,686

1,321

1,717

2,074

2,508

2,819

3,792

23

0,256

0,685

1,319

1,714

2,069

2,500

2,807

3,768

24

0,256

0,685

1,318

1,711

2,064

2,492

2,797

3,745

25

0,256

0,684

1,316

1,708

2,060

2,485

2,787

3,725

26

0,256

0,684

1,315

1,706

2,056

2,479

2,779

3,707

27

0,256

0,684

1,314

1,703

2,052

2,473

2,771

3,689

28

0,256

0,683

1,313

1,701

2,048

2,467

2,763

3,674

29

0,256

0,683

1,311

1,699

2,045

2,462

2,756

3,660

30

0,256

0,683

1,310

1,697

2,042

2,457

2,750

3,646

40

0,255

0,681

1,303

1,684

2,021

2,423

2,704

3,551

60

0,254

0,679

1,296

1,671

2,000

2,390

2,660

3,460

120

0,254

0,677

1,289

1,658

1,980

2,358

2,617

3,373



0,253

0,674

1,282

1,645

1,960

2,326

2,576

3,291

Testes de Hiptese
Comparao entre uma amostra e uma populao conhecida ou
entre duas ou mais amostras.
Hiptese Nula (H
0
): a hiptese estatisticamente mais simples,
envolvendo igualdade estatstica, sendo presumida como
verdadeira pelo tratamento matemtico.
Igualdade estatstica:
1. A amostra analisada pode ser considerada originria de uma populao
conhecida (
A
=
0
);
2. As amostras analisadas podem ser consideradas originrias de uma
mesma populao (
A
=
B
= ).
No confundir H
0
com a hiptese terica do estudo!!!
Ex.: comparao entre mdias de 2 amostras H
0
implica que a diferena
esperada entre as mdias 0, portanto fcil de ser modelado.

Hiptese Alternativa (H
A
): a hiptese contrria a H
0
, ou seja,
desigualdade estatstica.
Ex.: comparao entre mdias de 2 amostras
( ) 0 = E
B A
x x
( ) ??? = E
B A
x x
Testes de Hiptese
Nvel de significncia: maior probabilidade que se permite de
cometer o Erro Tipo 1 (arbitrrio valores comuns: 5%, 1%).
: maior probabilidade que se permite de cometer o Erro Tipo 2
(arbitrrio valores comuns: 20%, 30%).
Verdade

Indicao
do Teste
H
0
H
A
H
0

Acerto Erro Tipo 2

H
A

Erro Tipo 1
Nvel de
significncia ()
Acerto
Poder de Teste
(1- )
Testes de Hiptese
Meta: conseguir que tanto quanto sejam suficientemente pequenos
Valores comuns:
: 5%, 1% (quanto menor, mais estringente o teste);
: 20%, 30% (quanto menor, mais poderoso o teste).
Maior permissividade com : mais difcil lidar com o Erro Tipo 2 que com o
Erro Tipo 1
A distribuio de H
A
estipulada pelo que teoricamente seria o pior caso possvel
explicvel (menor diferena entre duas populaes distintas que faria sentido pela
teoria).
Exemplo: diferena entre mdias:



Aceita-se H
0
/2
o/2 o/2
Testes de Hiptese
Compromisso entre e :
Sem se alterarem as curvas de H
0
e H
A
(mesmos dados):
Reduo de : aumenta-se k (alarga-se o intervalo de aceitao de H
0
);
Neste caso, facilita-se a aceitao de H
0
(mesmo se ela for falsa);
Isto equivale a aumentar a rea verde ().
Vice-versa, caso se reduza ...
Para se ter e arbitrariamente pequenos:
Deve-se estreitar as curvas N deve ser suficientemente grande!



Aceita-se H
0
/2
o/2 o/2
Testes de Hiptese
Lateralidade do Teste:
Alguns testes permitem a escolha entre vrias opes de H
A
;
Por exemplo: comparao entre mdias
Teste Bilateral ou Bicaudal;
;
.
Utiliza-se um teste unilateral quando, pela teoria, no se espera ou no
justificvel que haja diferena verdadeira em um dos lados da
desigualdade.
/2 /2
( ) ( ) 0 ou 0 < E > E =
B A B A B A
x x x x
( ) 0 > E >
B A B A
x x
( ) 0 < E <
B A B A
x x
Teste Unilateral ou Unicaudal
Testes de Hiptese
Comparaes com base em variveis categricas:
Usualmente, usam-se testes que comparam propores, tais
como o Teste Qui-Quadrado e o Exato de Fisher.

Comparaes com base em variveis quantitativas:
Mais comuns: testes que comparam mdias, tais como o
teste-t e ANOVA (Anlise de Varincia);
Em alguns casos, mais adequado o uso de testes que
comparam medianas, tais como Testes de Mann-Witney,
Wilcoxon e Kruskal-Wallis (testes no-paramtricos);
Outros parmetros descritivos podem ser tambm
comparados, tais como a varincia (Testes de Fisher e de
Bartlett).
Teste t de Student para Amostras
Independentes
Comparao entre mdias de 2 grupos.
H
0
: igualdade entre mdias (ambos grupos so amostras de uma
mesma populao gaussiana).
Condies para poder ser usado:
Os indivduos que compem cada grupo devem ser independentes entre si
(independncia intragrupo);
Os indivduos de um grupo devem ser independentes dos indivduos do
outro grupo (independncia intergrupo);
Os dados dos dois grupos devem ter distribuio gaussiana testes de
aderncia;
Os dados dos dois grupos devem ter mesma variabilidade (desvios-padres /
varincias estatisticamente iguais) testes de homocedasticidade.

Grupo A: Grupo B: , onde s
A
~ s
B
A
A
A
s
x
N
B
B
B
s
x
N
Teste t de Student para Amostras Independentes
Parmetro T: reflete o quo diferentes so as duas mdias



onde


Sob a hiptese nula, o parmetro T segue uma distribuio t de
Student com N
A
+N
B
-2 graus de liberdade:
Rejeita-se H
0
se a diferena for significativamente grande, i.e.
Teste bilateral:
Teste unilateral positivo:
Teste unilateral negativo:
( )
|
|
.
|

\
|
+

=
B A
P
B A
B A
B A
N N
s
x x
x x EP
x x
T
1 1
2
^
2
) 1 ( ) 1 (
2 2
2
+
+
=
B A
B B A A
P
N N
s N s N
s
2
~
+
B A
N N
t T
*
2 ; 2 / 1
*
2 ; 2 /
ou
+ +
> <
B A B A
N N N N
t T t T
o o
*
2 ; 1 +
>
B A
N N
t T
o
*
2 ; +
<
B A
N N
t T
o
Teste t de Student para Amostras Independentes
Exemplo: Comparao de alturas entre homens e mulheres
Homens (cm):
174 170 175 177 172 182 166 178 189 185 174 185 190
173 164 185 174 173 170 182 170 179 170 184 175
Mulheres (cm):
169 157 161 168 159 179 178 168 152 162 170 170 163 169
160 163 163 155 165 159 162 167 161 160 180 168 175 163







ou
92 , 5
28
1
25
1
15 , 49
21 , 165 54 , 176
=
|
.
|

\
|
+

= T
2 2
cm 49,15 =
P
s
cm 7,02
cm 176,54
25
=
=
=
H
H
H
s
x
N
cm 7,00
cm 165,21
28
=
=
=
M
M
M
s
x
N
t
*
0,95; 51
= 1,6753
T > t
*
Rejeita-se H
0
valor-p = 0,000000135
valor-p << o Rejeita-se H
0
Teste t de Student para Amostras Independentes
Por exemplo, para teste bilateral...
Caso 1: T fora do intervalo de H
0
(rejeita-se H
0
)


valor-p < o


Caso 2: T dentro do intervalo de H
0
(aceita-se H
0
)


valor-p > o


Valor-p: probabilidade de ocorrer uma diferena entre mdias to grande
quanto ou maior que T mesmo H
0
sendo verdadeiro probabilidade de
se errar caso se rejeite H
0
probabilidade de se cometer o Erro Tipo 1.
Teste t de Student para
Amostras Pareadas
Comparao entre mdias de 2 grupos em que h vinculao
biunvoca entre indivduos dos dois grupos.
H
0
: igualdade entre mdias (ambos grupos so amostras de uma
mesma populao gaussiana).
Condies para poder ser usado:
Os indivduos que compem cada grupo devem ser independentes entre
si (independncia intragrupo);
Cada indivduo de um grupo deve ser vinculado a um indivduo do outro
grupo, formando um par (pareamento): N
A
= N
B
= N;
Os grupos devem apresentar distribuio gaussiana (matematicamente,
basta que as diferenas por pares tenham distribuio gaussiana);
Os dados dos dois grupos devem ter mesma variabilidade (desvios-
padres estatisticamente iguais).

Teste t de Student para Amostras Pareadas
Como resolver a questo do pareamento, que torna os grupos
interdependentes?
P. ex., efeitos aditivos com autopareamento:
x
A1
= K
1
+ e
A1
x
B1
= K
1
+ e
B1

x
A1
x
B1
= e
A1
e
B1
, e a parcela comum desaparece
Grupo A Grupo B Diferena
x
A1
x
B1
D
1
= x
A1
x
B1
x
A2
x
B2
D
2
= x
A2
x
B2
. . .
x
AN
x
BN
D
N
= x
AN
x
BN
D
s
D
N
Teste t de Student para Amostras Pareadas
Parmetro T: reflete, em mdia, o quo diferentes so os pares




Sob a hiptese nula, o parmetro T segue uma distribuio t de
Student com N - 1 graus de liberdade:

Rejeita-se H
0
se a diferena for significativamente grande, i.e.
Teste bilateral:
Teste unilateral positivo:
Teste unilateral negativo:
ou se valor-p < o
( ) ( ) ( )
N
s
D
D EP
D
x x EP
x x
x x EP
x x
T
D
B A
B A
B A
B A
2
^ ^ ^
= =

=
1
~
N
t T
*
1 ; 2 / 1
*
1 ; 2 /
ou

> <
N N
t T t T
o o
*
1 ; 1
>
N
t T
o
*
1 ;
<
N
t T
o
ANOVA: Anlise de Varincia
Comparao entre mdias de mais de 2 grupos.
H
0
: igualdade entre mdias (todos grupos so amostras
de uma mesma populao gaussiana).
Condies para poder ser usado:
Os indivduos que compem cada grupo devem ser
independentes entre si (independncia intragrupo);
Os indivduos de cada grupo devem ser independentes dos
indivduos dos outros grupo (independncia intergrupo);
Os dados de todos grupos devem ter distribuio gaussiana;
Os dados de todos grupos devem ter mesma variabilidade
homocedasticidade.
ANOVA
Baseia-se na comparao (razo) entre varincias entre
grupos e intragrupos:
Ng = nmero de grupos; Ni = nmero de indivduos no i-simo grupo;
N = nmero total de indivduos.
gl
E
= Ng 1; gl
I
= N Ng;
H
0
: a razo entre estas varincias (f) 1 (varincias so iguais, uma vez
que as mdias so iguais e todos grupos so amostra de uma mesma
populao) f ~ F
glE, glI
; rejeita-se H
0
se f > F
crit
.
Parmetros calculados:
Grande mdia:

Variao total:

Variao entre grupos:

Variao intragrupos:
N
x
X
GM

=
( )

=
2
GM T
X x SS
( )

=
i
GM i i E
X x N SS
2

=
i
i i I
s N SS
2
) 1 (
ANOVA










Caso haja diferena significativa (f > F
crit
), faz-se uso de testes
post hoc (p.ex. Tukey e Scheff) para identificar entre quais
grupos h diferena.
SS gl MS f
Entre SS
E
Ng-1 SS
E
Ng-1
MS
E
MS
I
Intra SS
I
N-Ng SS
I
N-Ng
Total SS
E+
SS
I
N-1
Testes No-Paramtricos
Os testes vistos at agora baseavam-se em
pressuposies acerca da distribuio de probabilidade
dos dados Testes Paramtricos.
Quando tais pressuposies no so atendidas, pode-se
lanar mo de Testes No-Paramtricos, que no
requerem uma distribuio especfica.
Grande parte dos Testes No-Paramtricos baseiam-se
na ordenao (ranqueamento) dos dados (estatstica
ordinal), podendo tambm ser usados em dados
categricos ordinais.
Desvantagem: em casos onde um teste paramtrico fosse
adequado, o uso de um teste no-paramtrico traria um
menos poder de teste.
Testes No-Paramtricos
Exemplos de testes no paramtricos anlogos aos vistos at
agora:








Paramtricos: mdias
No-Paramtricos: medianas
Embora no requeiram uma distribuio especfica, estes testes
no-paramtricos, sob a hiptese nula, pressupem que as
amostras possuam mesma distribuio.
Paramtrico No-Paramtrico
Teste t para amostras
independentes
Mann-Witney
Teste t para amostras
pareadas
Wilcoxon
ANOVA Kruskal-Wallis
Teste Qui-Quadrado
Comparao entre propores de indivduos classificados de
acordo uma varivel categrica em dois ou mais grupos.
H
0
: igualdade entre propores (todos grupos so amostras de
uma mesma populao).
Exemplo: comparao entre dois grupos considerando-se uma
varivel categrica dicotmica Tabela de Contingncia 22
Varivel
Grupo
Sim No Total
1 a b N
1
= a + b
2 c d N
2
= c + d
Total N
S
= a + c N
N
= b + d N = a + b + c + d
Teste Qui-Quadrado






Sob H
0
, as propores seria iguais entre os grupos; logo, seriam iguais
proporo no total. Portanto, os valores esperados seriam:



e uma medida de o quanto os valores observados diferem dos esperados seria:
2 2 1 1
~
,
~
,
~
,
~
N
N
N
d N
N
N
c N
N
N
b N
N
N
a
N S N S
= = = =
Varivel
Grupo
Sim No Total
1 a b N
1

2 c d N
2

Total N
S
N
N
N
( ) ( ) ( ) ( )
d
d d
c
c c
b
b b
a
a a
X
~
~
~
~
~
~
~
~
2
2
2
2
2

+

=
Teste Qui-Quadrado
Simplificando, temos:



Sob H
0
, X
2
segue aproximadamente uma distribuio qui-quadrada com 1
grau de liberdade: X
2
~ _
2
1
. Assim, rejeita-se H
0
caso X
2
> _
2
crit
.

Yates props uma modificao para que o parmetro X
2
se aproxime mais de
uma distribuio qui-quadrada (correo de continuidade):



Caso o N seja menor que 20 ou se alguma das clulas da tabela de
contingncia tiver valor menor que 5, o Teste Qui-quadrado no deve ser
utilizado, devendo-se optar pelo Teste Exato de Fisher.
( )
N S
N N N N
bc ad N
X


=
2 1
2
2
( )
N S
N
N N N N
bc ad N
X


=
2 1
2
2
2
Teste Qui-Quadrado
Exemplo: comparao da proporo de bitos em dois grupos que
receberam dois tratamentos diferentes:







Sem correo de Yates: X
2
= 7,979
Com correo de Yates: X
2
= 7,371
Valor crtico para distribuio qui-quadrada com 1 grau de liberdade e o =
5%: 3,8415 rejeita-se H
0
e infere-se que o tratamento 1 mais eficiente
que o 2.
bito
Tratamento
Sim No Total
1 41 216 257
2 64 180 244
Total 105 396 501
Teste Qui-Quadrado de McNemar
Comparao entre propores de indivduos classificados de
acordo uma varivel categrica em dois grupos pareados.
H
0
: igualdade entre propores (os grupos so amostras de uma
mesma populao).
Exemplo: comparao entre dois tratamentos aplicados a mesmos
indivduos (cada indivduo responde por um par de resultados)






k e l representam os pares em que houve concordncia de resultados com
os dois tratamentos; r e s, os pares em que houve discordncia.
Tratamento B
Tratamento A
Sucesso Fracasso
Sucesso k r
Fracasso s l
Teste Qui-Quadrado de McNemar
Sob H
0
: r e s so fruto do acaso, esperando-se que sejam semelhantes
(metade de todas discordncias em cada). Assim, usando-se a correo de
continuidade, temos:




sendo que X
2
McN
segue aproximadamente uma distribuio qui-quadrada
com 1 grau de liberdade: X
2
McN
~ _
2
1
. Assim, rejeita-se H
0
caso X
2
> _
2
crit
.


( ) ( ) ( )
s r
s r s r
X
s r
s r
s r
s r
McN
+

=

+

=
+
+
+
+
2
2
2
2
1
2
2
2
2
1
2
2
1
Tratamento B
Tratamento A
Sucesso Fracasso
Sucesso k r
Fracasso s l
Regresso Linear e Correlao
Em vrios fenmenos, parte da variao de uma das variveis (dependente)
pode ser explicada pela variao de outra(s) varivel(is) (independentes).
Deste modo, busca-se obter uma funo matemtica que melhor associe a
variao entre estas variveis: a mais comum a funo linear.
Sejam duas variveis, uma tida como independente (x) e outra como
dependente (y), tal como ilustrado no exemplo abaixo:





Podemos enxergar que, alm de uma componente aleatria, uma parte da
variao de y pode ser explicada linearmente pela variao em x:

Procuram-se os valores de a e b que melhor explicam y a partir de x, ou seja,
que minimizam o desvio quadrtico entre y e : mtodo dos mnimos
quadrados.
b x a e y e y
i i i i i
+ + = + =
~
y
~
Regresso Linear e Correlao
Aplicando-se o mtodo dos mnimos quadrados, obtm-se:





b o coeficiente linear (ponto em que a reta cruza o eixo vertical);
a o coeficiente angular: se a > 0, a reta tende a subir (quanto maior x,
maior y); se a < 0, a reta tende a descer (quanto maior x, menor y); se a
prximo de 0, indica que y e x no so relacionados entre si.
Contudo, o valor de a s apenas indica a angulao da reta, mas no
especifica o quanto da variao total de y depende da variao de x
Coeficiente de Correlao (Linear) de Pearson (entre -1 e 1):
( )( ) { }
( )
2
1
2
1
1
2
1
x N x
y x N y x
x x
y y x x
a
N
i
i
N
i
i i
N
i
i
N
i
i i


=

=
=
=
=
x a y b =
( )( ) { }
( ) ( )
|
.
|

\
|
|
.
|

\
|


=


=


= =
=
= =
=
2
1
2 2
1
2
1
1
2
1
2
1
y N y x N x
y x N y x
y y x x
y y x x
r
N
i
i
N
i
i
N
i
i i
N
i
i
N
i
i
N
i
i i
Regresso Linear e Correlao
Exemplo: relao entre idade e nvel de colesterol...










a = 4,75 mg/dl/ano (coeficiente angular)
b = 132,5 mg/dl (coeficiente linear)
r = 0,7914 (coeficiente de correlao de Pearson)
r
2
= 0,6263 (coeficiente de determinao percentual da varincia de y
explicada pela regresso)
Regresso Linear e Correlao
Consideraes:
Em geral, estima-se o intervalo de confiana para os
verdadeiros coeficientes angular, linear e de correlao com
base nos valores estimados a, b e r.
Alternativamente, pode-se obter o valor-p para a hiptese
nula de que = 0 (a verdadeira correlao populacional seja
nula), ou seja, de que no h correlao linear entre x e y.
Se x e y so independentes entre si, necessariamente no h
correlao entre eles. Contudo, se no h correlao entre x
e y, no necessariamente eles so independentes.
Ou seja, o fato de no haver correlao linear no implica que no
haja outro tipo de correlao (no-linear), a no ser se x e y forem
gaussianos!!!
Isto significa que, se x e y apresentam distribuio gaussiana, caso
haja correlao entre eles, esta correlao s pode ser linear.
Regresso Linear e Correlao
Consideraes (cont.):
Caso a relao entre x e y seja melhor descrita por uma funo
matemtica no-linear, nem sempre o coeficiente de correlao de
Pearson ser capaz de indicar esta relao.








a = -0,125 mg/dl/ano
b = 304,5 mg/dl
r = -0,04
r
2
= 0,0016
Conceitos Bsicos de Testes
Diagnsticos
A qualidade de um teste diagnstico refere-se sua capacidade de refletir o
verdadeiro status da doena em um indivduo (doente [D] ou no-doente
[ND]).
Portanto, para se avaliar um teste diagnstico, deve-se conhecer o verdadeiro
status de um nmero suficientemente grande de indivduos (tanto doentes
quanto no doentes) por meio de outro mtodo diagnstico altamente
confivel (padro-ouro) e aplicar o teste nestes indivduos:






VP = Nmero de Verdadeiros Positivos; VN = Nmero de Verdadeiros Negativos;
FP = Nmero de Falsos Positivos; FN = Nmero de Falsos Negativos;
T
D
= Nmero Total de Doentes; T
ND
= Nmero Total de No Doentes;
T
+
= Nmero Total de Diagnsticos Positivos; T
-
= Nmero Total de Diagnsticos Negativos.
Padro-Ouro
Teste
D ND Total
+ VP FP T
+
- FN VN T
-
Total T
D
T
ND
N
Testes Diagnsticos
Um bom teste diagnstico deve apresentar pequeno nmero de FP e FN!
Sensibilidade e Especificidade:
Sensibilidade: a probabilidade de um teste dar positivo quando o indivduo
realmente doente...
s = p(+ | D)


Especificidade: a probabilidade de um teste dar negativo quando o indivduo
realmente no doente...
e = p(- | ND)

Ou seja, ambos so medidas de probabilidade de o teste realmente acusar um
determinado status conhecido.
Padro-Ouro
Teste
D ND Total
+ VP FP T
+
- FN VN T
-
Total T
D
T
ND
N
FN VP
VP
T
VP
s
D
+
= =
FP VN
VN
T
VN
e
ND
+
= =
Testes Diagnsticos
Mais interessante seria se conhecssemos a probabilidade de o teste estar
certo ao acusar algum diagnstico Valor Preditivo:
Valor Preditivo Positivo: a probabilidade de um teste estar correto ao dar
positivo VPP = p(D | +);
Valor Preditivo Negativo: a probabilidade de um teste estar correto ao dar
negativo VPN = p(ND | -);
Caso a prevalncia da doena possa ser estimada por , ento os valores
preditivos podem ser estimados diretamente da tabela:


Caso contrrio, estes valores saem a partir dos valores de sensibilidade,
especificidade e prevalncia da doena.
Acurcia probabilidade de o teste acertar em geral:
Padro-Ouro
Teste
D ND Total
+ VP FP T
+
- FN VN T
-
Total T
D
T
ND
N
FP VP
VP
T
VP
P P V
+
= =
+

FN VN
VN
T
VN
N P V
+
= =

N
T
P
D
=

N
VN VP
A
+
=

Testes Diagnsticos
Frmulas para se obter VPP e VPN a partir dos valores de sensibilidade,
especificidade e prevalncia (i.e., quando a proporo T
D
/ N no reflete a
verdadeira prevalncia da doena):
) 1 )( 1 (

P e P s
P s
P P V
+

=
) 1 ( ) 1 (
) 1 (

P e P s
P e
N P V
+

=
Medidas de Associao
Um determinado desfecho (p.ex.: uma doena)
associado exposio a um determinado fator (de
risco ou de proteo)?
Exemplos de medidas de associao:
Risco Relativo: o risco (probabilidade) de apresentar o
desfecho maior (ou menor) entre os indivduos expostos
que entre os no expostos?
Razo de Chances (Odds Ratio - OR) de Desfecho: a
chance de apresentar o desfecho entre os expostos
diferente da chance entre os no expostos?
Razo de Chances de Exposio: a chance de ter sido
exposto entre os indivduos que apresentam o desfecho
diferente da chance entre os que no apresentam o
desfecho?
Probabilidade vs. Chance
Probabilidade de algum apresentar o desfecho entre os
indivduos expostos e no expostos:


A chance a razo entre as probabilidades de um evento
acontecer e no acontecer. Logo, as chances de algum
apresentar o desfecho entre os indivduos expostos e no
expostos dado por:
Desfecho
Exposio
Sim No Total
Sim a b T
E
No c d T
NE
Total T
D
T
ND
N
b a
a
E D p
+
= ) | (

d c
c
E D p
+
= ) | (

b
a
E D ds d o
b a
b
b a
a
= =
+
+
) | (

d
c
E D ds d o
d c
d
d c
c
= =
+
+
) | (

Risco Relativo
Razo entre o risco (probabilidade) de apresentar o desfecho
entre os indivduos expostos e o risco entre os no expostos:







Valores de risco relativo em torno de 1 sugerem no haver
associao entre exposio e desfecho (H
0
):
Como estimador: aceita-se H
0
se IC
95%
engloba a unidade;
Como teste de hiptese: aceita-se H
0
se valor-p > 5% (o=0,05)
Desfecho
Exposio
Sim No Total
Sim a b T
E
No c d T
NE
Total T
D
T
ND
N
) (
) (
) | (
) | (
^
b a c
d c a
RR
E D p
E D p
RR
d c
c
b a
a
+
+
= = =
+
+
Razo de Chances (OR)
OR de desfecho: razo entre a chance de apresentar o desfecho entre os
indivduos expostos e a chance entre os no expostos:


OR de exposio: razo entre a chance de ter sido exposto entre os
indivduos que apresentam o desfecho e a chance entre os sem desfecho:


Valores de OR em torno de 1 sugerem no haver associao entre exposio
e desfecho (H
0
):
Como estimador: aceita-se H
0
se IC
95%
engloba a unidade;
Como teste de hiptese: aceita-se H
0
se valor-p > 5% (o=0,05)
Desfecho
Exposio
Sim No Total
Sim a b T
E
No c d T
NE
Total T
D
T
ND
N
c b
d a
OR
E D odds
E D odds
OR
d
c
b
a
D D

= = =
^
) | (
) | (
c b
d a
OR
D E odds
D E odds
OR
d
b
c
a
E E

= = =
^
) | (
) | (
Relao entre OR e RR
Risco Relativo:


Razo de Chances:


No caso de uma doena ter uma prevalncia (P) muito baixa:

a << b a + b ~ b
c << d c + d ~ d

ou seja, a Razo de Chances pode ser vista como uma estimativa do Risco Relativo.
Desfecho
Exposio
Sim No Total
Sim a b T
E
No c d T
NE
Total T
D
T
ND
N
c b
d a
OR

=
OR
c b
d a
RR =

~
c b a
d c a
RR
+
+
=
) (
) (
Viso Geral sobre Desenhos
de Estudos Epidemiolgicos
Tipos de Estudos Mais Comuns
Seccionais ou Transversais

Observacionais: Coorte

Caso-Controle



Interveno: Ensaios Clnicos Aleatorizados
Estudos Seccionais
Durao do estudo consideravelmente mais
curta que a dinmica das caractersticas
estudadas (consiste em um retrato da
populao).
Amostragem suficientemente grande e
representativa da populao-alvo:
Tipos comuns de amostragem:
Amostragem aleatria simples;
Amostragem por conglomerados;
Visa, usualmente, anlises descritivas (p.ex.:
prevalncias e incidncias).
Estudos Seccionais
Instrumentos de avaliao:
Questionrios:
Perguntas abertas;
Perguntas fechadas;
Mistos.
Perdas.
Exames Clnicos:
Sensibilidade vs. especificidade.
Medidas fisiolgicas:
Preciso;
Calibrao.
Treinamento dos avaliadores:
uniformizao da coleta de informaes
Estudos Seccionais
Medidas de associao comuns:
Razo de Prevalncias (RP - anloga ao Risco
Relativo) e Razo de Chances Prevalentes (tipo de
razo de chances).
Por ser um estudo eminentemente descritivo, com
base em amostras representativas da populao, as
propores de desfecho so estimativas de
prevalncias na populao, viabilizando-se o clculo
do RR, particularmente da RP.
Limitao: mesmo detectando-se associao entre
exposio e desfecho, nem sempre possvel
estabelecer relaes de causalidade, pois as
informaes de temporalidade podem no ser
disponveis.
Estudos de Coorte
Coorte: grupo de indivduos que apresentam
uma caracterstica em comum.
No estudo de coorte, os indivduos so
selecionados quanto ao status de exposio.
No incio do estudo, nenhum indivduo analisado
apresenta o desfecho estudado.
Ao longo de um perodo suficientemente longo
(dependendo da dinmica do desfecho estudado),
os indivduos so acompanhados e contabilizam-
se as ocorrncias de desfecho nas duas coortes.
A associao entre a exposio e o desfecho ,
normalmente, analisada pelo Risco Relativo.
Estudos de Coorte
Outros nomes:
Longitudinal;
Prospectivo;
Seguimento (follow-up).
A pertinncia dos indivduos em cada coorte se d por
motivos alheios ao estudo (no h interferncia sobre o status
dos indivduos).
Potenciais:
Investigar a relao exposio-desfecho sob a ptica da causalidade;
Abordar hipteses etiolgicas;
Calcular medidas de Incidncia;
Examinar associaes entre variveis, usando medidas diretas de risco:
Risco Relativo;
Comparar a incidncia da doena em uma ou mais coortes.
Estudos de Coorte
Vantagens:
Produz medidas diretas de riscos
Fornece evidncias mais fortes de que uma associao
possa ser causal;
Resultados mais facilmente generalizveis a populaes
maiores;
Muitos desfechos podem ser investigados
simultaneamente.
Desvantagens:
Demorado e de alto custo relativo;
Perdas de acompanhamento;
Inadequado para doenas raras.
Estudos Caso-Controle
No estudo de coorte, os indivduos so
selecionados quanto ao status de desfecho.
Comparam-se um grupo de pessoas indivduos
(casos) com outro de indivduos no-doentes
(controles) com caractersticas parecidas com os
casos, usualmente vizinhos:
Pode ser interessante realizar pareamento (por gnero,
idade, etnia, etc.).
O estudo retrospectivo, avaliando-se se os
indivduos haviam sido ou no expostos ao fator
estudado.
A associao entre a exposio e o desfecho ,
normalmente, analisada pela Razo de Chances.
Estudos Caso-Controle
Vantagens:
Eficiente para doenas raras;
til para gerar hipteses sobre novas doenas ou surtos no
usuais (pois til para examinar um grande nmero de
variveis preditoras);
Usualmente de baixo custo.
Desvantagens:
No permite obter medidas de riscos ou incidncia;
Permite a investigao de apenas um desfecho;
Grande susceptibilidade a vieses:
Vis de seleo: amostragem diferencial entre casos e controles;
Vis de informao (memria) ou medida retrospectiva das
variveis preditoras.
Ensaios Clnicos Aleatorizados
Os indivduos so alocados aleatoriamente em
dois grupos diferentes quanto ao status de
exposio.
No incio do estudo, nenhum indivduo analisado
apresenta o desfecho estudado, como no estudo de
coortes;
A diferena est na alocao dos grupos, que feita
pelo pesquisador.
Ao longo do estudo, os indivduos so
acompanhados e contabilizam-se as ocorrncias
de desfecho nos dois grupos.
A associao entre a exposio e o desfecho ,
normalmente, analisada pelo Risco Relativo.
Ensaios Clnicos Aleatorizados
Critrios de Incluso:
Minimizar a heterogeneidade dos indivduos.
Critrios de Excluso comuns:
Existncia de outras doenas;
Mal prognstico;
Indivduos no-colaborativos.
Questes ticas:
Termo de Consentimento Livre e Esclarecido;
Comits Locais;
Conselho Nacional de tica em Pesquisa (CONEPE).
Mascaramento (ou Cegamento):
Tenta minimizar qualquer comportamento tendencioso devido ao
conhecimento de qual tratamento est sendo usado;
Cego vs. Duplo Cego.

You might also like