Professional Documents
Culture Documents
INFERNCIA ESTATSTICA
3. TESTES DE HIPTESES
3.1 INTRODUO
Os testes de hiptese so uma metodologia de inferncia estatstica diferente da que foi abordada na estimao de parmetros (estimao pontual e por intervalos). Trata-se de um processo estatstico que, a partir de dados amostrais, permite obter uma de duas respostas (afirmativa ou negativa), sobre uma determinada conjectura previamente realizada sobre a populao (nos testes de hipteses paramtricos essa conjectura sobre os parmetros da populao).1
Assim, pretende avaliar a necessidade de investir num novo balco, recorrendo a uma amostra que permita estimar a verdadeira mdia do tempo de espera por cliente. A hiptese que se pretende testar designada por hiptese nula (a designao de nula, indica que se trata de uma hiptese que no difere da situao real). Neste exemplo, a hiptese nula, H0 , revela a informao detida pelo director at ao momento (o tempo mdio de espera inferior ou no mximo igual a 5 minutos). A hiptese alternativa, Ha , coloca-se em contraposio hiptese nula: caso o tempo mdio de espera no verifique a condio definida em H0 , ento a alternativa que este seja superior a 5 minutos. A observao de uma amostra vai fornecer informao que torna possvel a deciso por uma das duas hipteses. Se a amostra for favorvel hiptese nula, decide-se no rejeitar H0 , o que, neste caso, corresponde a decidir no abrir um novo balco de atendimento. Caso a amostra contenha evidncia factual no favorvel a H0 , rejeitamos esta hiptese, o que quer dizer que estamos a optar pela hiptese alternativa - vamos decidir abrir um novo balco para fazer face ao aumento indesejado do tempo mdio de espera por cliente. Mas no esqueamos que a inferncia probabilstica, o que nos obriga a considerar o risco de tomar decises erradas. De facto, dependendo da situao realmente verdadeira,
Ao realizar um teste de hipteses o objectivo validar ou no determinadas hipteses sobre a populao, com base na informao amostral. No caso particular dos testes de hipteses paramtricos, a validao diz respeito aos parmetros da populao.
Em diversas reas da cincia, colocam-se questes inerentes s quais esto opes alternativas. A deciso, qualquer que ela seja, comporta um risco, o risco de errar. A metodologia de realizao dum teste de hipteses permite controlar e at minimizar o risco de errar. Vejamos o seguinte exemplo: Exemplo 3.1: O director de uma loja dos CTT dimensionou o nmero de balces de atendimento de modo a garantir que o tempo mdio de espera por cliente no ultrapassa-se cinco minutos. No entanto, a zona urbana em que a loja est inserida tem crescido e o director tem dvidas se na realidade os clientes continuam em mdia a esperar no mximo cinco minutos. Caso verifique que esperam mais tempo, o director ir proceder abertura de um novo balco.
Existem os testes de hiptese no paramtricos que se utilizam quando os pressupostos de utilizao dos testes paramtricos no se verificam. Por exemplo, no caso de populaes no normais e amostras de pequena dimenso os testes no paramtricos so uma opo possvel. Tambm no caso dos dados estarem na escala de intervalos ou rcios e no terem distribuio especificada, ou sendo esta conhecida a menos de um nmero infinito de parmetros desconhecidos e tambm quando os dados esto na escala nominal ou ordinal.
___________________________________________________________________ 1
ISEL DEETC
___________________________________________________________________ 2
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
A hiptese nula geralmente aquela que revela a informao que detemos no momento em que se decide realizar o teste estatstico. O teste servir para se concluir se a conjectura dada pela hiptese nula ou no correcta. A hiptese nula considerada verdadeira ao longo do procedimento do teste, at ao momento em que haja evidncia estatstica clara apontando em sentido contrrio. A hiptese nula: reflecte a situao em que no h mudana (pode ser resultado de uma experincia passada); o que se aceita por defeito; contm sempre uma igualdade e deve ser formulada por forma a ser possvel conhecer a distribuio da estatstica amostral a utilizar (designada por estatstica de teste), no pressuposto de que H0 verdadeira.
unilateral direito quando Ha tiver a desigualdade>; unilateral esquerdo quando Ha tiver a desigualdade <; bilateral quando Ha tiver a desigualdade . Para o exemplo 3.1, tem-se um teste unilateral direito, onde as hipteses a testar so: H0 : 5 Ha : > 5 A Deciso Num teste de hipteses o objectivo o de tomar uma deciso, em consequncia da existncia de razes para rejeitar ou no a hiptese nula. Esta deciso baseada na informao disponvel, obtida a partir da amostra recolhida da populao. No caso de se rejeitar H0 , aceita-se como vlida a hiptese alternativa.
Voltando ao exemplo dos CTT, s ser aberto um novo balco se a amostra evidenciar essa necessidade, at l damos crdito hiptese nula. A hiptese alternativa a hiptese que contm a informao relativa dvida que suscitou a realizao do teste. Vai reflectir o conjunto de valores que o parmetro poder assumir, caso a hiptese nula seja rejeitada. Contm sempre uma desigualdade (>, <ou ). As hipteses podem ser simples ou compostas: A Hiptese simples quando identifica um valor exacto para o parmetro em causa. Por exemplo, H0 : = 5 , uma hiptese simples. A Hiptese composta quando identifica um conjunto de possibilidades para o domnio do parmetro em causa. Por exemplo, H0 : 5 , uma hiptese composta. Um teste de hipteses pode classificar-se em: ___________________________________________________________________ 3
ISEL DEETC
___________________________________________________________________ 4
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Tipos de erros associados deciso tomada Deciso Rejeitar H0 Situao Real H0 verdadeira
P (rejeitar H0 | H0 verdadeira)
Erro de Tipo I: Decide-se abrir um novo balco, no entanto a realidade no o justifica. H0 falsa Deciso correcta Erro de Tipo II: No se abre um novo balco, mantm-se tudo como est e no entanto as pessoas esperam em mdia mais do que cinco minutos. Deveria terse decidido abrir um novo balco.
Deciso incorrecta
No rejeitar H0
P (Rejeitar H0 | H0 falsa) = 1-
Deciso incorrecta
P (No rejeitar H0 | H0 falsa) =
importante notar que, em geral, se atribui mais importncia ao erro de Tipo I, uma vez que em H0 que acreditamos, at que exista evidncia estatstica em contrrio. Rejeitar a hiptese nula como abandonar um hbito, e consequentemente a possibilidade de cometer um erro do Tipo I (rejeitar H0 incorrectamente) encarada com preocupao. Consideramos mais grave abrir um novo balco de forma injustificada (fazer um investimento desnecessrio), do que no realizar o investimento quando o deveramos ter feito. Potncia do Teste A potncia do teste, = 1 , com 0 < < 1 , a probabilidade ou risco de rejeitar a hiptese nula H0 , quando esta falsa, decidindo de forma acertada.
Erro Tipo II
Erro do Tipo I ou erro de 1 espcie O erro de Tipo I ocorre quando se decide rejeitar H0 , sendo H0 verdadeira, ou seja, rejeita-se indevidamente a hiptese nula. A probabilidade de ocorrncia do erro de Tipo I chama-se nvel de significncia do teste e representa-se por .
P [Erro de Tipo I] = P [rejeitar Ho | Ho verdadeira ]
Ao fixarmos o valor mximo de , estamos a limitar os custos incorridos ao poder tomar a deciso errada associada a este tipo de erro. Erro do Tipo II ou erro de 2 espcie O erro de Tipo II ocorre quando se decide no rejeitar H0 , sendo H0 falsa. A probabilidade de ocorrncia do erro de Tipo II representa-se por . Se H0 falsa, o verdadeiro valor do parmetro ser compatvel com a hiptese alternativa e como tal o valor de calculado em funo dos valores ( a ) que o parmetro toma, segundo a hiptese alternativa.
___________________________________________________________________ 6
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Regra de Deciso Estatstica uma regra que nos indica a deciso a tomar (rejeitar ou no H0 ), a partir da comparao do valor da estatstica de teste com um ou mais valores crticos (ser um valor critico para os testes unilaterais e dois para os testes bilaterais). 2) Fixar o nvel de significncia do teste ; 3) Escolher a estatstica de teste e identificar a respectiva distribuio amostral, no pressuposto de que a hiptese nula verdadeira; 4) Determinar a regio de rejeio (R. R.), de acordo com o valor fixado para , e com o tipo de teste. Definir a regra de deciso; Regio crtica ou de rejeio (R.C. ou R.R.) constituda por um conjunto de valores tomados pela estatstica de teste, que conduzem rejeio da hiptese nula. 5) Calcular o valor observado para a estatstica de teste. Por comparao deste valor com as regies de aceitao e de rejeio, proceder tomada de deciso rejeitar ou no H0 .
Regio de aceitao (R.A.) constituda por um conjunto de valores tomados pela estatstica de teste, que conduzem no rejeio da hiptese nula. Valor de prova - p ou p-value O valor de prova, p, define-se como o menor nvel de significncia, , a partir do qual se rejeita a hiptese nula. Calcular o valor de prova p, calcular a probabilidade do erro de 1 espcie, correspondente a rejeitar a hiptese nula para a amostra observada, ou seja, para o valor da estatstica de teste que foi observado. Fixado o nvel de significncia , a deciso de rejeitar a hiptese nula verifica-se se e s se p .
3.5 METODOLOGIA
A metodologia a utilizar na realizao de um teste de hipteses, envolve as seguintes etapas:
___________________________________________________________________ 7
ISEL DEETC
___________________________________________________________________ 8
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Para que seja mais acessvel entender como se realiza um teste de hipteses, vamos comear por dar um exemplo que retrata o caso mais simples A populao tem distribuio normal de parmetros e . A partir da populao que se caracteriza por X N ( , ) , obteve-se uma amostra aleatria de dimenso n, composta por variveis i.i.d. X1,..., X n , da qual se obtm uma realizao concreta, ( x1,..., xn ) .
2) Fixar o nvel de significncia do teste; Nvel de significncia do teste: = 0,05 (valor fixado partida) Na ausncia de informao sobre o valor de , os valores geralmente utilizados so 5%, 2,5% e 1%. 3) Escolha da estatstica de teste e identificao da respectiva distribuio
Exemplo
3.2:
Uma
empresa de
apresentou bolachas e
uma
nova
mquina que
para o
amostral; Neste caso estamos a realizar inferncia sobre a mdia populacional , numa populao com distribuio normal, com desvio padro conhecido. Recordando as distribuies amostrais abordadas, sabemos que a estatstica amostral a utilizar para inferir sobre o parmetro populacional a mdia amostral, X . Na condio da hiptese nula ser verdadeira, sabemos tambm que a distribuio amostral da estatstica :
empacotamento
automtico
divulgou
garantia
empacotamento de uma mdia de 60 pacotes por minuto, com um desvio padro de 3 pacotes. O nmero de pacotes embalados por minuto segue uma distribuio aproximadamente normal. Uma fbrica de bolachas ps a mquina experincia nas suas instalaes e, registando o nmero de pacotes embalados em 25 perodos de um minuto, constatou uma mdia de 58 pacotes embalados. O comprador potencial diz que a mquina no garante atingir a mdia de 60 pacotes por minuto. Por seu lado, o vendedor garante que a diferena encontrada se deve apenas ao acaso e que de modo nenhum pe em causa a mdia publicitada. 1) Formulao das hipteses;
Ho : = 60 vs Ha : < 60
Pretende-se verificar se a diferena encontrada mesmo devido ao acaso, isto , se no h evidncia estatstica para rejeitar a hiptese de que a mdia seja igual a 60. A hiptese nula reflecte a posio do vendedor. At prova em contrrio, o comprador deposita confiana na informao dada pelo vendedor. A metodologia do teste procurar validar Ho . Se a evidncia da amostra fornecer informao (mdia amostral) significativamente inferior a 60, ento rejeita-se
pacotes por minuto compatvel com a veracidade da hiptese nula. Como a hiptese alternativa, Ha : < 60 , aponta para valores que se encontram esquerda do valor dado pela hiptese nula, tendo fixado a probabilidade de rejeitar indevidamente H0 em 0,05 (nvel de significncia de 5%), a regio crtica vai situar-se na aba esquerda. 4) Determinar a regio de rejeio de acordo com o valor fixado para , e definir a regra de deciso; ___________________________________________________________________ 10
ISEL DEETC
Ho .
A hiptese alternativa consistir naquilo que se considera razovel aceitar, no ___________________________________________________________________ 9
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
A regra de deciso consiste em definir a aco a tomar (rejeio ou no da hiptese nula) face ao resultado da amostra. Vamos determinar duas regies complementares: regio crtica ou de rejeio e regio de no rejeio ou de aceitao.
Com os dados deste exemplo obtemos o valor observado da estatstica de teste: 58 60 Zobs = = 3,333 < 1 ,645 , pelo que se decide rejeitar H0 , dado que o 3/5 valor observado pertence regio critica. Na tomada de deciso, em alternativa ao processo anterior, podemos definir a
Com Z =
X 0
regra de deciso em funo de X , determinando o valor crtico xc , que por comparao com o valor observado de X , permite tomar a deciso de rejeitar ou no a hiptese nula. Regra de deciso em funo da mdia amostral X :
n
Normal reduzida, obtemos o valor de z para o qual a probabilidade acumulada igual a 0,05, ou seja, por inverso:
Na figura 3.2 apresenta-se esquerda a regio crtica (a tracejado) e direita a regio de aceitao, agora em funo do valor crtico xc .
Figura 3.2
Figura 3.1
Vamos ver como proceder para calcular xc : Fixar o nvel de significncia em 5% ( = 0,05 ), quer dizer que a probabilidade de rejeitar a hiptese nula quando ela verdadeira de 0,05.
P [rejeitar H0 | H0 verdadeira ] = 0,05 P X xc | = 0 = 60 = 0,05 X 0 xc 60 x 60 x 60 P = 0,05 P Z c = 0,05 c = 1(0,05) 0,6 0,6 0,6 n xc 60 = 1,645 xc = 59,01. 0,6
A deciso tem origem na comparao do valor da estatstica de teste (o valor da abcissa dado por
x 0
n
reduzida. Vamos rejeitar a hiptese nula se o valor observado da estatstica de teste pertencer regio crtica. O facto de utilizarmos o valor da abcissa estandardizada facilita, dado assim ser possvel consultar os valores crticos da tabela da distribuio normal. Regra de deciso em funo da varivel Z: Se z -1.645, rejeitar H0 ___________________________________________________________________ 11
ISEL DEETC
Com x o valor observado de X , temos as seguintes possibilidades: - se x 59.01, deve rejeitar-se H0 ; ___________________________________________________________________ 12
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
alterao pode conduzir a outras decises, quando se utiliza a mesma evidncia da realidade, isto , a mesma amostra.
O valor fornecido pela amostra, x = 58 <59,01, pertence regio crtica, o que nos leva a decidir rejeitar a hiptese nula, como j se sabia pela primeira alternativa de resoluo apresentada. A diferena entre o valor da mdia amostral (58), e o valor proposto para o valor mdio da populao (60), suficientemente grande, para, face ao nvel de significncia pr-estabelecido, concluirmos que a populao de onde proveio a amostra no a mesma que o vendedor caracterizou.
Interpretao do Erro de Tipo II e da potncia do teste para este exemplo tambm importante conhecer a probabilidade de no rejeitar H0 , quando esta falsa, ou seja, conhecer a probabilidade de cometer um erro do Tipo II, tambm designado por erro de 2 espcie. Ao nvel de 5%, no rejeitamos H0 , se o valor observado para X for superior a 59,01. Uma vez que a hiptese alternativa composta, para calcular a probabilidade do erro de 2 espcie, , fazemo-lo para trs valores alternativos da verdadeira mdia do nmero de pacotes embalados, Se a = 59 temos:
Regra de deciso em funo do valor de prova p: Quando se opta por utilizar o valor de prova p para tomar a deciso, o que vamos fazer comparar o nvel de significncia pr-fixado com a probabilidade de cometer um erro de tipo I, associado ao valor observado para a estatstica de teste.
Quando se utiliza um software especfico para estatstica ou a folha de clculo Excel para realizar o ensaio de hipteses, decide-se em funo de valor de prova-p, j que este aparece sempre no output. Interpretao do Erro de Tipo I para este exemplo Associada a esta deciso temos uma probabilidade de 0,05 de cometer um erro do Tipo I, ou seja, estamos dispostos a decidir rejeitar a hiptese nula (no adquirir a mquina), mesmo que esta na realidade empacote uma mdia de 60 pacotes por minuto, com uma probabilidade de 0,05. Podemos ser um pouco mais exigentes e procurar reduzir a probabilidade de cometer um erro do Tipo I, o que se consegue fixando o nvel de significncia num valor inferior. Esta
___________________________________________________________________ 13
ISEL DEETC
___________________________________________________________________ 14
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
de dimenso n, composta por variveis i.i.d. X1,..., X n , da qual resultou uma realizao concreta ( x1,..., xn ) . Pretende-se realizar um teste de hipteses para a mdia da populao .
Se a varincia for conhecida (caso do exemplo tratado), e a distribuio da populao normal, a estatstica de teste a utilizar :
Z=
X 0
N ( 0,1)
Concluses para o teste unilateral esquerdo: Verifica-se que o valor de diminuiu medida que o verdadeiro valor de se afasta de 0 . Realmente torna-se mais difcil errar medida que o valor verdadeiro do parmetro se afasta do valor proposto pela hiptese nula. Ao contrrio do que foi observado para , quanto mais prximo do valor de
amostral.)
n
(Note-se que neste caso a estatstica de teste e a sua distribuio independente da dimenso
Se a distribuio da populao no for conhecida, com a varincia conhecida e a amostra grande, n > 30 , a estatstica de teste a utilizar :
0 estiver o valor de a , menos potente o teste, o que quer dizer que tem
menos capacidade para decidir de modo acertado. Nota: Se realizarmos este tipo de estudo para um teste unilateral direito ou para um teste bilateral constatamos que o tipo de hiptese alternativa condiciona a forma da funo potncia.
Z=
X 0
n
Limite Central)
Apresentam-se esquematicamente na figura 3.3 as regies crticas, definidas em termos da varivel Z, para o teste de hipteses para a mdia, H0 : = 0 , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo. Tipo de Teste
Ha : 0
Bilateral
H a : > 0
Unilateral direito
H a : < 0
Unilateral esquerdo
Figura 3.3
3.7.1 Teste de Hiptese para a mdia Vamos supor uma populao a partir da qual se obteve uma amostra aleatria ___________________________________________________________________ 15
ISEL DEETC
Se a varincia for desconhecida, que o caso que mais prximo est da ___________________________________________________________________ 16
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
realidade, teremos de estimar o desvio padro da populao pois necessitamos dele para calcular o valor do desvio padro do estimador X . Um processo bastante intuitivo ser utilizar como estimador de , no caso de amostras
2
Ha : 0
Tipo de Teste
Bilateral
H a : > 0
Unilateral direito
H a : < 0
Unilateral esquerdo
( X
i =1
X )2 S 2' =
X
i =1
2 i
nX 2
Teste T
Quando a estatstica de teste tem distribuio T-Student.
n 1
n 1
' 2'
e respectivo desvio padro amostral corrigido S = S . No caso de amostras grandes utilizamos a varincia amostral
Figura 3.4
S2 =
( X
i =1
X )2 S2 =
X
i =1
2 i
nX 2
Exemplo 3.3: Teste de Hipteses para a mdia de uma populao normal com varincia desconhecida ( n 30 ) Foram medidos em quilogramas os aumentos de peso (da nascena aos seis meses) de 7 crianas do sexo feminino escolhidas ao acaso entre um grupo de
Neste caso a estatstica de teste que se utiliza, j no tem a mesma distribuio amostral, sob a veracidade da hiptese nula, ver Pestana, D. (2006). Temos agora uma outra varivel aleatria cuja distribuio amostral a T-Student, (Student 1908). Assim, para pequenas amostras ( n 30 ), utiliza-se a estatstica de teste
crianas com seis meses de idade. 3,6 2,8 3,6 4,1 4,1 4,5 3,2 (a) Ao nvel de significncia de 5%, poder dizer-se que o aumento mdio de peso superior a 3,1Kg? (b) A partir de que nvel de significncia a hiptese testada na alnea anterior rejeitada? (c) Calcula a potncia do teste para a = 3,4 .
X 0 T = t n 1, S n
e para amostras grandes, n > 30 , utiliza-se a distribuio amostral limite da TStudent que aproximadamente normal,
Resoluo:
T =
X 0 N (0,1) . S n
Seja a varivel X : aumento de peso, em Kg, numa criana do sexo feminino com seis meses de idade.
A figura 3.4 apresenta esquematicamente as regies crticas definidas em termos da varivel T, para o teste de hipteses mdia H0 : = 0 , considerando os trs tipos de teste: bilateral e unilateral direito e esquerdo.
X N ( , ) = 0,05
Sobre a amostra: n = 7 x = 3,7 s 2 = 0,34 s = 0,34 = 0,5831 (a) Vamos testar H0 : 3,1 vs Ha : > 3,1 Trata-se de um teste unilateral direito
___________________________________________________________________ 17
ISEL DEETC
___________________________________________________________________ 18
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Estatstica de teste: T =
X 0 t n 1 S n
3.7.2 Teste de Hiptese para a varincia Considerando uma populao normal podemos estar interessados em realizar um teste de hipteses varincia da populao. Sendo S 2 um estimador no enviesado de 2 , e conhecida a distribuio amostral da estatstica
Regio de aceitao (R.A.): ] , t 6;0,95 [ =] ,1,943[ Regio de rejeio ou crtica (R.R.): [t 6;0,95 , +[ = [1 ,943, +[ Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: Tobs =
Q=
(n 1).S 2
2 0
Deve rejeitar-se a hiptese nula, ao nvel de significncia de 5%, o que quer dizer que a amostra contm evidncia estatstica de que o aumento mdio de peso nas crianas do sexo feminino com seis meses de idade de facto superior a 3,1Kg.
Tipo de Teste
2 Ha : 2 0
2 Ha : 2 > 0
2 Ha : 2 < 0
Bilateral
Unilateral direito
Unilateral esquerdo
Teste 2
Quando a estatstica de teste tem distribuio do Qui-quadrado.
Para valores do nvel de significncia superiores a 1,73% a hiptese nula rejeitada, o que quer dizer que valor-p 0,0173. (c) (3,4) = 1 (3,4) = P (rejeitar H0 | H0 ser falsa) . Como o teste unilateral direito, rejeita-se a hiptese nula quando
Figura 3.5
Exemplo 3.4: Teste de Hipteses para a varincia Para verificar se um determinado aparelho de medio de alta preciso ainda funciona com as caractersticas exigidas foram observadas 20 medies e calculado o desvio padro amostral corrigido, s = 0,013 mm . Admitindo que as referidas medies se podem considerar gaussianas, ao nvel de significncia de 5%, poder-se- concluir que o verdadeiro desvio padro populacional de 0,01mm? Resoluo: Seja a varivel X : medies efectuadas pelo aparelho em mm.
logo
) = 1 P (T 0,580786) = 1 0,291 =
A potncia do teste de aproximadamente 71%, ou seja, de 71% a probabilidade de tomar uma deciso acertada, rejeitar a hiptese nula quando esta falsa. ___________________________________________________________________ 19
ISEL DEETC
X N ( , ) = 0,05
___________________________________________________________________ 20
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Sobre a amostra: n = 20
s = 0,013
(a) Vamos testar H0 : = 0,01 vs Ha : 0,01 Trata-se de um teste bilateral Estatstica de teste: Q =
Z0 =
p0 (1 p0 ) n
p0 p
N ( 0;1) .
(n 1).S 2
2 0
2 n 1
Como a estatstica de teste tem distribuio aproximadamente normal, temos um teste Z tal como se verificou no teste de hipteses para a mdia com varincia conhecida. A figura 3.6 apresenta esquematicamente as regies crticas definidas em termos da varivel Z, para o teste de hipteses proporo populacional,
Regio de aceitao (R.A.): ]8,907,32,85[ Regio crtica (R.R.): [0,8.907] [32.85, +[ , onde
2 2 8,907 = 19;0,025 e 32,85 = 19;0,975 .
Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: Qobs =
(n 1).S 2
2 0
= 19
Como 32,11 se encontra na regio de aceitao, conclui-se ao nvel de significncia de 5%, que o verdadeiro desvio padro de 0,01 mm.
Tipo de Teste
Ha : p p0
Bilateral
Ha : p > p0
Unilateral direito
Ha : p < p0
Unilateral esquerdo
Para calcular o valor de prova p, como temos um teste bilateral, procede-se da seguinte forma:
= 2 min {P (Q < 32,11), P (Q > 32,11)} = 2 min{0,9696;0,0304} = 0,0607. p value = P (rejeitar H0 | H0 verdadeira) = P (Qobs R.C. | = 0 ) =
Teste Z
Quando a estatstica de teste tem distribuio exacta ou aproximadamente normal reduzida.
Para este teste a hiptese nula rejeitada para nveis de significncia superiores a 6,07%.
Figura 3.6
3.7.3 Teste de Hiptese para a proporo Considerando agora uma populao de Bernoulli, a partir da qual se obteve uma amostra aleatria de dimenso grande (n> 30), composta por variveis i.i.d. X1,..., X n , da qual resultou uma realizao concreta ( x1,..., xn ) . Pretende-se realizar um teste de hipteses para a mdia da populao, que neste caso a proporo populacional p, o parmetro da distribuio de Bernoulli que representa a probabilidade de sucesso numa prova de Bernoulli. Assim, para amostras grandes, a distribuio amostral do estimador de p,
3.8.1 Teste de Hiptese para a diferena de duas mdias Vamos considerar duas populaes X1 e X 2 , cujas mdias so respectivamente
, X=p
___________________________________________________________________ 21
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Pretende-se realizar um teste de hipteses para comparar as duas mdias populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
H0 : 1 2 = 0 vs Ha : 1 2 0 teste bilateral
amostras tenham dimenso superior a 30, utiliza-se a mesma estatstica de teste, no entanto a sua distribuio amostral, obtida pelo Teorema do Limite central, aproximadamente normal.) (Nota 2: Se as duas populaes tiverem distribuio normal ou outra, caso as varincias sejam desconhecidas, para amostras grandes ( n1> 30 e n2 > 30 ), usam-se as varincias amostrais, e a estatstica
Z0 =
2 conhecidas a Se as populaes forem normais com varincias 12 e 2
(X
X 2 ( 1 2 )0
2 S12 S2 + n1 n2
N ( 0;1) ).
Z0 =
(X
X 2 ( 1 2 )0
12
n1
2 2
N ( 0;1)
conhecidas. Nesse caso, temos de ter um teste que nos permita testar a igualdade das mdias populacionais sem conhecer os verdadeiros valores
2 12 e 2 . bastante mais simples desenvolver este teste, quando, embora
n2
desconhecidas, as varincias se podem admitir iguais (caso em que se diz existir O que se passa neste caso, de facto simples pois sabemos do estudo das distribuies amostrais que:
2 ). homocedasticidade 2 = 12 = 2
X1 N 1, 1 e X 2 N 2 , 2 n n2 1
No caso em que as varincias so desconhecidas, parece mais lgico primeiramente testar a igualdade das varincias e num segundo passo optar com racionalidade pela estatstica de teste mais favorvel para testar a hiptese nula de igualdade das mdias. 3.8.2 Teste de Hiptese para a igualdade de duas varincias em Populaes Normais Vamos considerar duas populaes normais X1 e X 2 , cujas mdias so respectivamente 1 e 2 . Destas populaes so retiradas de forma aleatria duas amostras independentes de dimenso n1 e n2 , respectivamente. Vamos realizar um teste que permita comparar as duas varincias. Dado que conhecemos os estimadores amostrais das varincias populacionais
2 12 e 2 :
por outro lado, estas ltimas so mdias de amostras aleatrias independentes, o que nos permite escrever a distribuio amostral da diferena,
2 2 X1 X 2 N 1 2 , 1 + 2 , n1 n2
Mais uma vez temos um teste Z, cujas regies de rejeio e aceitao j foram estudadas anteriormente.
(Nota 1: este resultado vlido para amostras grandes ou pequenas. No caso em que as duas populaes no tenham distribuio normal, mas as duas ___________________________________________________________________ 23
ISEL DEETC
___________________________________________________________________ 24
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
= S1
2
( X
i =1
n1
1i
X1 )2
n1 1
S =
2 1
X
i =1 n2
n1
2 1i
nX12
n1 1
2,7 3,2 3,6 4,1 2,7 3,2 4,5 3,6 2,7 4,1 4,5 3,6 2,7 3,6 3,2 4,1
S =
2 2
( X
i =1
n2
2i
X 2 )2
n2 1
= S2
2
X
i =1
2 2i
nX 22
n2 1
Supondo que as referidas crianas tinham nascena pesos idnticos e que os seus pesos se podem considerar normais, pretende-se: (a) Ao nvel de significncia de 5%, concluir se a variabilidade populacional dos dois grupos igual; (b) Determinar o valor de prova - p e a sua interpretao;
X1 : ganho em peso medido em Kg das crianas sujeitas ao suplemento A X 2 : ganho em peso medido em Kg das crianas sujeitas ao suplemento B
Tipo de Teste
2 Ha : 12 2
Bilateral
Ha :
2 1
>
2 2
Ha : <
2 1
2 2
X1 N ( 1, 1 ) e X 2 N ( 2 , 2 )
Sobre as amostras temos:
2 = 0,4150 n1 = 9 x1 = 3,3667 s1 2 = 0,3714 n2 = 7 x2 = 3,6857 s2
Unilateral direito
Unilateral esquerdo
Teste F
Quando a estatstica de teste tem distribuio F-Snedcor.
Estatstica de teste:
F=
Figura 3.7
2 2 2 S1 F ( n1 1; n2 1) , com n1 1 = 15 e n2 1 = 20 2 12 0 S2
Exemplo 3.5: Teste de Hipteses para o quociente de duas varincias No primeiro ano de vida dois grupos aleatrios de crianas foram sujeitos a diferentes suplementos vitamnicos designados por suplemento A e suplemento B. Os dados que se seguem representam duas amostras dos ganhos de peso, em
Regio de aceitao (R.A.): ]F8;6;0,025 ; F8;6;0,975 [ = ]0,215;5,6[ Regio de rejeio (R.R.): [0; F8;6;0,025 ] [F8;6;0,975 , +[ = [0;0,215] [5,6; +[ Valor observado para a estatstica de teste no pressuposto da veracidade da hiptese nula: F0 bs =
___________________________________________________________________ 25
ISEL DEETC
___________________________________________________________________ 26
ISEL DEETC
INFERNCIA ESTATSTICA
INFERNCIA ESTATSTICA
Como 1,1173 se encontra na regio de aceitao, conclui-se ao nvel de significncia de 5%, que a verdadeira variabilidade nos pesos no diferente quando se utiliza o suplemento A ou B. (b) valor de prova p:
p value = P (rejeitar H0 | H0 verdadeira) = P (Fobs R.C. |
vo fornecer informao para estimar 2 . As dimenses amostrais so utilizadas como factores de ponderao, pois a amostra de maior dimenso contribui com mais informao para estimar 2 . A estatstica de teste a utilizar :
12 = 1) = 2 2
T =
(X
X 2 ( 1 2 )0
2 1
( n1 1) s
A hiptese nula s rejeitada para nveis de significncia superiores a 91,81%. 3.8.3 Teste de Hiptese para a igualdade de mdias em Populaes normais com varincias desconhecidas 3.8.3.1 Varincias desconhecidas mas iguais = =
2 1 2 2 2
2 + ( n2 1) s2 n1 + n2 2
1 1 + n1 n2
t n1 + n2 2
(Exerccio proposto) Para estudar dois tipos de combustvel, foram recolhidas duas amostras aleatrias de 15 carros do mesmo modelo. Todos os carros da amostra 1 foram abastecidos com o combustvel A e todos os carros da amostra 2 foram abastecidos com o combustvel B. Obtiveram-se os seguintes resultados
Vamos considerar duas populaes normais X1 e X 2 , cujas mdias so respectivamente 1 e 2 . Destas populaes so retiradas de forma aleatria duas amostras independentes cujas mdias so X1 e X 2 e as dimenses
n1 30 e n2 30 , respectivamente.
Pretende-se realizar um teste de hipteses para comparar as duas mdias populacionais, portanto vamos realizar um teste relativo diferena 1 2 . As nossas hipteses, tendo em conta os trs tipos de teste so:
H0 : 1 2 = 0 vs Ha : 1 2 0 teste bilateral
Consideramos agora que temos duas populaes normais X1 e X 2 , cujas mdias so 1 e 2 e desvio-padro 1 e 2 , desconhecidos e diferentes (concluso obtida para um determinado nvel de significncia, atravs de um teste igualdade das varincias). Destas populaes so retiradas de forma aleatria duas amostras independentes de pequena dimenso
( n1 30 e n2 30 ), com as mdias amostrais X1 e X 2 respectivamente. Utilizando a aproximao de Welch-Satterthwaite, vamos utilizar a estatstica de teste:
___________________________________________________________________ 27
ISEL DEETC
___________________________________________________________________ 28
ISEL DEETC
INFERNCIA ESTATSTICA
___________________________________________________________________ 29
ISEL DEETC