You are on page 1of 40

MESTRADO EM ESTATÍSTICA APLICADA À SAÚDE

Janeiro 2017

Inferência Estatística

ANA CRISTINA COSTA | ccosta@novaims.unl.pt


ROSÁRIO O. MARTINS | mrfom@ihmt.unl.pt
2

UA5: ANOVA

Ana Cristina Costa


Tópicos
3

 ANOVA a um fator
 Testes de comparação múltipla
 Testes aos pressupostos da ANOVA

Ana Cristina Costa


Objetivos
4

 No final desta UA deverá ser capaz de:


 Descrever os pressupostos da ANOVA
 Aplicar a ANOVA a um fator e interpretar os seus resultados
 Discutir as características gerais e aplicar testes de comparação múltipla
 Testar a igualdade de k variâncias de populações independentes

Ana Cristina Costa


Materiais
5

 E-book da UA5

 Ecrãs de aprendizagem

 Vídeos dos exemplos em SPSS dos ecrãs de aprendizagem

 Exercícios propostos

 Livro: Afonso, A., Nunes, C. (2011). Estatística e Probabilidades. Aplicações e Soluções em


SPSS, Escolar Editora, pp. 331-354.

Ana Cristina Costa


ANOVA a um fator
6

 ANOVA – Análise de variância

 Os modelos de análise de variância (ANOVA) permitem identificar e analisar


os efeitos causados na variável resposta por um certo número de fatores
(variáveis independentes), que podem, ou não, operar em simultâneo

 O modelo ANOVA a aplicar depende do planeamento da experiência e do


número de fatores

Ana Cristina Costa


ANOVA a um fator
7

 Definições
 Unidades experimentais: objetos/indivíduos sobre os quais são efetuadas observações

 Fator: variável independente (característica) completamente controlada numa


experiência, com k níveis
 As diferentes categorias, ou graus de intensidade, do fator são os níveis
 Se os níveis do fator correspondem a diferentes intensidades medidas numa escala, o fator
diz-se quantitativo
 Se os níveis de um fator diferem apenas em algumas características, o fator diz-se qualitativo

 Grupo ou Tratamento: combinação específica de níveis de fatores


 No caso de 1 único fator, cada grupo/tratamento corresponde a um nível do fator

Ana Cristina Costa


ANOVA a um fator
8

 Exemplo
 Para curar uma certa doença existem quatro medicamentos possíveis: A, B, C e D.
Pretende-se saber se existem diferenças significativas nos medicamentos no que diz
respeito ao tempo necessário para eliminar a doença.

 As unidades experimentais são os doentes aos quais serão administrados os medicamentos

 Temos apenas um fator (administração de medicamentos), que se apresenta em quatro


níveis: A, B, C e D

 Cada grupo/tratamento corresponde a um nível do fator

 Através da aplicação da análise de variância com um fator, ou "One-way ANOVA",


podemos indagar se os medicamentos produzem os mesmos resultados no que diz respeito
ao tempo necessário para eliminar a doença

Ana Cristina Costa


ANOVA a um fator
9

 Exemplo
 Suponhamos agora que existe a suspeita de que uma estação quente é um fator
determinante para uma cura rápida

 O estudo deve ser conduzido tendo em conta este segundo fator (estação do ano), que
tem dois níveis: estação quente (primavera e verão) e estação fria (outono e inverno)

 Os oito grupos/tratamentos correspondem à combinação dos níveis dos dois fatores

 A técnica apropriada será a análise de variância com dois fatores, ou “Two-way ANOVA“
que, além de testar se existem diferenças entre os medicamentos, permite verificar se
existem diferenças entre as estações do ano e também entre os oito grupos, no que diz
respeito ao tempo necessário para eliminar a doença

Ana Cristina Costa


ANOVA a um fator
10

 ANOVA com um fator e efeitos fixos

 Nesta unidade curricular iremos estudar apenas o caso da análise de


variância com um fator e efeitos fixos

 Modelo de efeitos fixos: caso em que os níveis do fator são fixos, ou seja os
grupos/tratamentos são determinados à partida

 Considera-se que o fator tem k níveis


 Cada grupo/tratamento corresponde a um nível do fator

 A ANOVA permite comparar a igualdade de k valores médios populacionais, com


base nas amostras obtidas para cada um dos k grupos

Ana Cristina Costa


ANOVA a um fator
11

 Delineamento completamente aleatorizado


 Num delineamento completamente aleatorizado para comparar k
grupos/tratamentos, um conjunto de n unidades experimentais relativamente
homogéneas são aleatoriamente divididas em k grupos de dimensões n1, n2, …, nk,
em que n1 + n2 + … + nk = n

 Todas as unidades experimentais em cada grupo recebem o mesmo tratamento, de


modo que cada tratamento é aplicado a exatamente um grupo

 A cada um dos k grupos/tratamentos está associada uma população que consiste


em todas as observações que se obteriam se o tratamento fosse repetidamente
aplicado a todas as unidades experimentais possíveis

Ana Cristina Costa


ANOVA a um fator
12

 Observações
 Num delineamento completamente aleatorizado, obtêm-se amostras
aleatórias independentes das populações correspondentes aos
grupos/tratamentos

 Exemplo: para se comparar o valor médio da quantidade de uma substância


ativa em cinco marcas comerciais (A, B, C, D, E) de um medicamento, pode-se
selecionar aleatoriamente 100 comprimidos da produção de cada fabricante, e
analisar os resultados obtidos considerando as marcas comerciais (A, B, C, D, E)
como sendo os grupos/tratamentos

Ana Cristina Costa


ANOVA a um fator
13

 ANOVA a um fator
 Considerem-se k populações X1~N(1,12), X2~N(2,22), …, Xk~N(k,k2) para as quais se
verifica homocedasticidade (ou seja, 12= 22=…=k2=2)

 Considere-se um delineamento experimental completamente aleatorizado, em que são


obtidas k amostras aleatórias independentes das populações em estudo, com dimensões
n1, n2, …, nk, em que n1+n2+…+nk=n

 Objetivo: testar a igualdade de três ou mais valores médios populacionais


H0: 1= 2 =…= k
H1: i,j (ij): i  j

Ana Cristina Costa


ANOVA a um fator
14

 Tabela ANOVA

Graus de Soma de Médias


Origem da variação F
liberdade quadrados quadráticas

Tratamentos SQTr MQTr


k1 SQTr MQTr  Fobs 
(between; entre os grupos) k 1 MQE

Erro SQE
nk SQE MQE 
(within; dentro dos grupos) nk

Total n1 SQT

Ana Cristina Costa


ANOVA a um fator
15

 Hipóteses a testar  Regra de decisão (teste unilateral direito)

H0 : 1   2  ...  k Rejeitar H0 se Fobs ≥ F(k-1; n-k; 1-)


H0 : i, j (i j) : i   j

 Estatística do teste  p-value

MQTr p  value  P(F  Fobs )


Fobs  ~ F(k 1;nk )
MQE

Ana Cristina Costa


ANOVA a um fator
16

 Pressupostos de aplicação do teste-F da ANOVA


 A violação da condição de independência das observações tem consequências, em
geral, sérias sobre a validade da ANOVA

 Populações normais
 Este pressuposto já se verificava no teste t para comparação de duas médias

 A ANOVA apresenta robustez relativamente a pequenos desvios da condição de


normalidade

 A condição de normalidade deve ser testada


 Teste de Kolmogorov-Smirnov
 Teste de Shapiro-Wilk

Ana Cristina Costa


ANOVA a um fator
17

 Pressupostos de aplicação do teste-F da ANOVA


 Populações com a mesma variância
 Este pressuposto já se verificava no teste t para comparação de duas médias

 A ANOVA apresenta, em geral, reduzida robustez relativamente a pequenos desvios da


condição de homocedasticidade. Maior robustez é conseguida quando o delineamento é
equilibrado (n1 = n2 = … = nk = b)

 A hipótese de homocedasticidade deve ser testada


 Teste de Bartlett
 Teste de Levene

 Se as populações forem normais, mas a homocedasticidade não possa ser assumida, deve-
se usar a estatística de Brown-Forsythe ou a estatística de Welch em vez da ANOVA

Ana Cristina Costa


ANOVA a um fator
18

 Exemplo
 Um departamento governamental está A B C D
preocupado com os aumentos dos custos
verificados no âmbito de projetos de I&D que 1.0 1.7 1.0 3.8
são encomendados aos hospitais A, B, C e D. 0.8 2.5 1.3 2.8
Decidiu-se então analisar os custos associados a 1.9 3.0 3.2 1.9
diferentes projetos, calculando para cada um
1.1 2.2 1.4 3.0
deles a razão entre o custo final incorrido e o
2.7 3.7 1.3 2.5
custo inicialmente previsto na adjudicação. Para
cada projeto, os dois custos foram expressos 1.9 2.0
numa base constante (cf. tabela). Será que os
Adaptado de: Guimarães, R. C. e Sarsfield Cabral, J.
quatro hospitais têm um comportamento global A. (2007). Estatística. Segunda edição, McGraw-Hill
distinto em relação ao agravamento dos custos?

Ana Cristina Costa


ANOVA a um fator
19

 Exemplo
 Sejam XA~N(A,2), XB~N(B,2), XC~N(C,2) e XD~N(D,2) as variáveis aleatórias que
reportam o custo dos projetos dos hospitais A, B, C e D, respetivamente

 Hipóteses a testar: H0: A= B = C = D


H1: A  B ou A  C ou A  D ou B  C ou B  D ou C  D

 Informação das amostras:


Hospital Nº de
Média Variância
(grupo) observações
A 5 1.5 0.625
B 6 2.5 0.556
C 6 1.7 0.648
D 5 2.8 0.485

Ana Cristina Costa


ANOVA a um fator
20

 Exemplo
 Abrir e guardar a tabela de dados do Excel no SPSS
 Menu Arquivo + Abrir + Dados…
• Alterar opção “Arquivos do tipo” para Excel (*.xls, *.xlsx, *.xlsm)
• Abrir o ficheiro de Excel ExemploUA5_ANOVA_dados.xlsx
• Manter selecionada a opção Ler nomes de variável a partir da primeira linha de dados
• Manter selecionada a Planilha: Dados_custos_SPSS [A1:B23]
• Fazer OK

 Guardar a tabela de dados num ficheiro do tipo SPSS, para posterior utilização
• Menu Arquivo + Salvar como…
• Por exemplo, atribuir ao ficheiro o nome ExemploUA5_ANOVA.sav

Ana Cristina Costa


ANOVA a um fator
21

 Exemplo
 Gráfico com box-plots paralelos
no SPSS
 Menu Analisar + Estatísticas
descritivas + Explorar…
• Selecionar variável “Custo” e
clicar na seta para enviar para
“Lista dependente”

• Selecionar variável “Hospital” e


clicar na seta para enviar para
“Lista de fatores”

• Clicar em OK

Ana Cristina Costa


ANOVA a um fator
22

 Exemplo
 Gráfico com box-plots
paralelos no SPSS

 A localização relativa dos


quatro grupos (hospitais)
não parece ser idêntica

Ana Cristina Costa


ANOVA a um fator
23

 Exemplo
 ANOVA a um fator no SPSS
 Menu Analisar + Comparar médias +
ANOVA unidirecional
• Selecionar variável “Custo” e clicar na
seta para enviar para “Lista
dependente”

• Selecionar variável “Hospital” e clicar


na seta para enviar para “Lista de
fatores”

• Carregar no botão Opções…

Ana Cristina Costa


ANOVA a um fator
24

 Exemplo
 ANOVA a um fator no SPSS
 Selecionar opção Descritivo (para
pedir estatísticas descritivas por grupo)

• Clicar em Continuar

• Clicar em OK na janela anterior

Ana Cristina Costa


ANOVA a um fator
25

 Exemplo
 ANOVA a um fator no SPSS
 p-value = P(F  3.533) = 0.036
 Rejeita-se H0 para níveis de significância  ≥ 0.036

 Há evidência de que os quatro hospitais não têm um comportamento global igual, em valor
médio, em relação ao agravamento dos custos

Ana Cristina Costa


ANOVA a um fator
26

 Exemplo
 Ativar o Analysis Toolpak no Excel 2007

• Clique no botão do Microsoft Office

• Clique em Opções do Excel

• Clique em Suplementos no painel esquerdo e em


seguida, na caixa Gerir, selecione Analysis ToolPak.
Clique em Ir.

• Na janela Suplementos disponíveis, marque a caixa de


verificação Analysis ToolPak e clique em Ok.

• O comando Análise de Dados ficará disponível no


grupo Análise do separador Dados.

Ana Cristina Costa


ANOVA a um fator
27

 Exemplo
 Ativar o Analysis Toolpak no Excel 2013
• Clique no separador Ficheiro e, em seguida,  Sugestão
clique em Opções.
 Se o Analysis ToolPak não aparecer
• Clique em Suplementos no painel esquerdo e na lista Suplementos disponíveis,
em seguida, na caixa Gerir, selecione Analysis
ToolPak. Clique em IR. clique em Procurar para o localizar

• Na janela Suplementos disponíveis, marque a  Se aparecer uma mensagem com a


caixa de verificação Analysis ToolPak e clique indicação de que o Analysis ToolPak
em Ok.
não está instalado no computador,
• O comando Análise de Dados ficará clique em Sim para o instalar.
disponível no grupo Análise do separador
Dados.

Ana Cristina Costa


ANOVA a um fator
28

 Exemplo Selecionar todas as células com os dados

 ANOVA a um fator no Excel


 Abrir o ficheiro de Excel
ExemploUA5_ANOVA_dados.xlsx
 Separador Dados (Data) + Análise de Dados
(Data Analysis) + Anova: Single Factor

Marcar se os nomes
das variáveis tiverem
sido selecionados
(recomendável)

Ana Cristina Costa


ANOVA a um fator
29

 Exemplo
 ANOVA a um fator no Excel
 p-value = P(F  3.533) = 0.036
 Rejeita-se H0 para níveis de significância  ≥ 0.036

 Há evidência de que os quatro hospitais não têm um comportamento global igual, em valor
médio, em relação ao agravamento dos custos

ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 6.159 3 2.053 3.533 0.036 3.16
Within Groups 10.46 18 0.581

Total 16.62 21

Ana Cristina Costa


Testes de comparação múltipla
30

 Testes de comparação múltipla

 A rejeição de H0 do teste F da ANOVA apenas permite concluir a não igualdade


entre os valores médios dos k grupos

 Os testes de comparação múltipla (Post Hoc = a posteriori) têm os mesmos


pressupostos que a ANOVA, e permitem comparar cada par de valores médios:
H0: i = j (ij)

Ana Cristina Costa


Testes de comparação múltipla
31

 Testes de comparação múltipla


 Teste HSD de Tukey (Honestly Significant Difference)

• Apenas aplicável em delineamentos equilibrados: n1 = n2 = … = nk

 Teste de Tukey-Kramer

• Extensão do teste HSD de Tuckey para delineamentos não equilibrados

 Teste de Scheffé: usado em comparações complexas

 Teste MRT de Duncan (Multiple Range Test): pouco utilizado atualmente; produz, geralmente,
resultados idênticos a testes-t independentes

 Teste LSD de Fisher (Least Significant Difference): apenas adequado para se obter comparações
prévias antes da ANOVA, porque não permite controlar o nível de significância global:
P[decisão conjunta correta] = (1)k < 1

Ana Cristina Costa


Testes de comparação múltipla
32

 Exemplo (continuação)
 Teste de Tukey no SPSS

 Abrir o ficheiro de dados do custo dos


projetos dos hospitais A, B, C e D

 Menu Analisar + Comparar médias +


ANOVA unidirecional + botão Post Hoc…
• Selecionar a opção Tukey
• Clicar em Continuar
• Clicar em OK na janela anterior

Ana Cristina Costa


Testes de comparação múltipla
33

 Exemplo (continuação)
 Teste de Tukey no SPSS
 p-value (Sig.) de todos os testes é
superior a 0.05

• Não se rejeita H0: i = j para o


nível de significância de 5%

 Não há evidência de diferenças


entre os comportamentos médios
dos hospitais no que se refere ao
agravamento dos custos

Ana Cristina Costa


Testes aos pressupostos da ANOVA
34

 Pressupostos da ANOVA
 Antes de se aplicar a técnica ANOVA, deve-se 1º testar os seus pressupostos
1. Temos k grupos (amostras) de observações independentes, sendo os grupos
independentes entre si

2. Cada grupo (amostra) de observações deve provir de uma população com


distribuição Normal
 Utilizar, por exemplo, o Teste de Shapiro-Wilk

3. A variância das k populações deve ser a mesma (homogeneidade das


variâncias)
 Utilizar, por exemplo, o Teste de Bartlett ou Teste de Levene

Ana Cristina Costa


Testes aos pressupostos da ANOVA
35

 Testes à igualdade de k variâncias (amostras independentes)

 k  2 amostras aleatórias mutuamente independentes provenientes de populações


com distribuição Normal

H0: 12 = 22 = … = k2 = 2

H1: i,j (ij) i2  j2

 Teste de Levene: menos sensível do que o Teste de Bartlett a desvios à condição de


normalidade

Ana Cristina Costa


Testes aos pressupostos da ANOVA
36

 Exemplo (continuação)
 Teste de Levene no SPSS

 Abrir o ficheiro de dados do custo dos


projetos dos hospitais A, B, C e D

 Menu Analisar + Comparar médias +


ANOVA unidirecional + botão Opções…
• Selecionar a opção “Homogeneidade
do teste de variância”
• Clicar em Continuar
• Clicar em OK na janela anterior

Ana Cristina Costa


Testes aos pressupostos da ANOVA
37

 Exemplo (continuação)
 Teste de Levene no SPSS
 p-value (Sig.) do teste é superior a 0.05

• Não se rejeita H0: A2 = B2 = C2 = D2 = 2 para o nível de significância de 5%

 Não há evidência de que as variâncias das populações subjacentes aos grupos (hospitais)
sejam diferentes

Ana Cristina Costa


Autoavaliação
38

 Verifique se é capaz de responder às seguintes questões


 Qual é a diferença entre análise de variância com efeitos fixos e efeitos aleatórios?
 Quais são os pressupostos da ANOVA?
 Como poderá verificar cada um dos pressupostos da ANOVA?
 Indique pelo menos uma alternativa ao teste F da ANOVA, para situações em que as
variâncias das populações não são iguais.
 Quais são as hipóteses estatísticas da ANOVA?
 Como é que se implementa a ANOVA a um fator no SPSS?
 Como se interpretam os resultados da tabela ANOVA?
 Em que circunstâncias se devem utilizar os testes de comparação múltipla?

Ana Cristina Costa


Autoavaliação
39

 Verifique se é capaz de responder às seguintes questões


 Quais são as hipóteses estatísticas dos testes de comparação múltipla?
 Enumere quatro testes de comparação múltipla e discuta a sua aplicação.
 Qual é a diferença entre o teste HSD de Tukey e o teste de Tukey-Kramer?
 Como é que se implementa o teste de Tukey no SPSS? Como se interpretam os
resultados deste teste?
 Para testar a igualdade de k variâncias de populações independentes, que testes
estatísticos poderia utilizar? Qual o teste mais adequado se houver dúvidas quanto à
normalidade das populações?
 Como é que se implementa o teste de Levene no SPSS? Como se interpretam os
resultados deste teste?

Ana Cristina Costa


40

Questões?
 Contacte os docentes preferencialmente por email. Obrigado.

Ana Cristina Costa

You might also like