Professional Documents
Culture Documents
=
|
.
|
\
|
|
.
|
\
|
|
|
.
|
\
|
= = >
= = =
20
9
20
0 0
0409 . 0
4
3
4
1
20
) 4 / 1 | 8 (
) cierta es H | H Rechazar ( ) I tipo de error (
x
x x
x
p X P
P P o
15
La probabilidad de cometer un error de tipo II
se representa por |. Slo podemos calcularla
si tenemos una hiptesis alternativa concreta.
Por ejemplo en nuestro caso podamos haber
tomado como hiptesis alternativa: p = 0.5.
En nuestro ejemplo:
2517 . 0
4
3
4
1
20
) 2 / 1 | 8 (
) falsa es H | H Aceptar ( ) II tipo de error (
8
0
20
0 0
=
|
.
|
\
|
|
.
|
\
|
|
|
.
|
\
|
= = s
= = =
x
x x
x
p X P
P P |
16
Contraste de hiptesis:
Los tres pasos bsicos para contrastar una
hiptesis sern:
1- Formular dos hiptesis H
0
y H
1
.
2- Derivar un estadstico de contraste a partir
de la muestra de observaciones e identificar su
distribucin muestral bajo la hiptesis nula.
3- Derivar una regla de decisin y elegir una de
las dos hiptesis en base a la evidencia de una
muestra. Una regla de decisin que selecciona
una de las dos sentencias siguientes:
rechace H
0
o no rechace H
0
.
17
Contrastes para la media de una poblacin
(Poblacin normal o
n> 30 y o conocida)
Hiptesis bilateral
H
o
: =
0
H
1
: =
0
Estadstico:
n
x
z
o
=
- z
o/2
+ z
o/2
1 - o
o
o
o o
= |
.
|
\
|
<
< 1
/
2 /
0
2 /
z
n
x
z P
Si la media muestral est
fuera de este intervalo
rechazamos H
0
y no
rechazamos H
0
en caso
contrario.
|
.
|
\
|
+
2 / 0 2 / 0
,
o o
o
o
z
n
z
n
Regin de aceptacin.
Regin de aceptacin
18
Hiptesis:
Estadstico y distribucin:
0 3 : H y 30 : H
1 o
= =
Ejemplo: Sea una poblacin normal con o
2
= 20
0
= 30, n = 10 , y o = 0.05.
) 1 , 0 ( N
n
x
z
=
o
27 = x
95 . 0
/
2 / 2 /
= |
.
|
\
|
<
<
o o
o
z
n
x
z P
- z
o/2
+ z
o/2
1 - o = 0.95
o/2 = 0.025 o/2 = 0.025
95 . 0
2 / 2 /
= |
.
|
\
|
+ < <
o o
o
o
z
n
x z
n
x P
Para calcular intervalo de confianza:
Conociendo el tamao
de la muestra, la
desviacin poblacional
y la media muestral,
podemos determinar un
intervalo de confianza al
95%.
19
Valor crtico del estadstico de prueba: Se
busca en la tabla z, y nos preguntamos que
valor de z tiene una probabilidad igual a 0.025 y
el valor es -1.96.
- 1.96
+ 1.96
1 - o = 0.95
o/2 = 0.025 o/2 = 0.025
20
Pero ahora estamos haciendo
una hiptesis: que la media
poblacional es
0
= 30, e
intentando contrastarla a
partir de la media muestral
que es 27.
12 . 2
4142 . 1
3
10 / 20
30 27
=
= z
- 2.12
- 1.96
+ 1.96
1 - o = 0.95
Regin de aceptacin
Regla de decisin:
H
o
se rechaza si z cae en la
zona de rechazo (fuera de la
zona de aceptacin),
utilizando o = 0.05 (error de
tipo I) que est dividida en
dos partes iguales (o/2 =
0.025).
Decisin estadstica: Se puede rechazar H
o
porque -2.12
est en la regin de rechazo con un nivel de significacin de o
= 0.05.
Conclusin: Se concluye que no igual a 30.
21
Contrastes para la media de una poblacin
(Poblacin normal o
n> 30 y o conocida)
Hiptesis unilateral
por la izquierda.
H
o
: =
0
H
1
: <
0
Estadstico
n
x
z
c
o
=
o
o
o
= |
.
|
\
|
>
1
/
0
z
n
x
P
Si la media muestral est fuera de
este intervalo rechazamos H
0
y
aceptamos en caso contrario.
|
.
|
\
|
+ ,
0 o
o
z
n
Regin de aceptacin.
- z
o
1 - o
22
Datos y suposiciones las mismas anteriores.
Hiptesis:
Clculo del estadstico de prueba:
Regla de decisin: Si el z
calc
cae en la zona de rechazo
se rechaza H
o
. Como es una prueba de una cola o
unilateral se busca en la tabla que valor de z tiene una
probabilidad de 0.05 y es -1.645.
Decisin estadstica y Conclusin: Como -2.12 es
menor que -1.645 se rechaza H
o
y se concluye que la
media de la poblacin es menor de 30.
0 3 : H y 30 : H
a o
< >
12 . 2
10 / 20
30 27
/
0
=
=
n
x
z
o
23
La variable aleatoria poblacional X de nuestro inters es la duracin
de un componente. Esta variable se distribuye en la poblacin como
una exponencial: X = Exp().
(a) Nos piden como contraste de hiptesis:
H
0
: =300
H
1
: <300
Disponemos de una muestra de n = 100 elementos. Para cada componente
se ha medido su duracin: {x
1
, x
2
, ... , x
100
}. Y sabemos que la media
muestral, que la vida media de los 100 componentes es:
=
= =
100
1
260
100
1
i
i
x x
24
Usaremos como estimador a la media muestral:
=
=
n
i
i
x
n
x
1
1
Recuerda que es una variable aleatoria, de la que nosotros disponemos
de un valor particular: el que nos da nuestra muestra.
Qu distribucin tiene nuestro estimador?
El de la suma de 100 variables aleatorias distribuidas exponencialmente.
En principio sera una Erlang, pero puesto que el nmero de variables
es mayor que 30, podemos utilizar una normal:
( ) n N x / ,o
Observa que para el caso particular de la exponencial, la media coincide
con la desviacin tpica y podemos escribir:
( ) n N x / ,
Tipifiquemos el estimador para que se distribuya como una N(0,1):
) 1 , 0 ( N
n
x
z
25
a = 250.65
1 - o
) 1 , 0 ( N
n
x
z
Regin de
aceptacin
Regin
crtica
o
05 . 0
100 / 300
300
) 300 | (
cierta) H | H Rechazar ( 05 . 0
0 0
= |
.
|
\
|
s = = s =
= = =
a
z P a x P
P
o
65 . 250 645 . 1
100 / 300
300
= =
= a
a
z
crit
0
H rechazamos No
aceptacin de Regin 65 . 250 260
e > = x x
26
Si en realidad =250 y la hiptesis nula es que
=300, "detectarlo" supondra rechazar la
hiptesis:
( ) 512 . 0 03 . 0
100 / 250
250 65 . 250
) 250 | ( ) 250 | H Rechazar (
0
= s = |
.
|
\
|
s =
= = s = =
z P z P
a x P P
27
Si queremos elevar esta ltima probabilidad
hasta el 70%:
|
.
|
\
|
s = = s = = =
|
.
|
\
|
s = = s = = =
n
b
z P b x P P
n
b
z P b x P P
/ 300
300
) 300 | ( ) 300 | H Rechazar ( 05 . 0
/ 250
250
) 250 | ( ) 250 | H Rechazar ( 70 . 0
0
0
157 125 . 156
645 . 1
/ 300
300
525 . 0
/ 250
250
~ =
n
n
b
n
b
28
La variable aleatoria poblacional X de nuestro inters es el nmero de
accidentes de trfico en una semana. Esta variable se distribuye en la
poblacin como una poisson: X = P(=2.5).
(a) Nos piden como contraste de hiptesis:
H
0
: =10 (reducir el lmite de velocidad no influye)
H
1
: <10 (reducir el lmite de velocidad disminuye el nmero de accidentes)
Pero observa que contrastaremos las hiptesis con la variable aleatoria
Y = nmero de accidentes en cuatro semanas
29
=
=
= = s =
= >
a
x
x
I tipo Error
x
e a Y P
P
0
10
0 0
!
) 10 | (
) cierta H | H Rechazar ( 1 . 0
Mirando en las tablas encontramos que a=5.
Si el nmero de accidentes observado en las
cuatro semanas es menor o igual que 5,
entonces rechazamos H
0
.
30
=
=
= = =
= = s = = > =
= =
5
0
8
1
81 . 0 19 . 0 1
!
1
) 8 | 5 ( 1 ) 8 | 5 (
) 8 | H Rechazar (
x
x
II tipo Error
x
e
Y P Y P
P
Si el nmero de accidentes disminuy a 2 por
semana, entonces disminuy a 8 accidentes por
cada cuatro semanas
31
Contrastes para la media de una poblacin
(Poblacin normal y o
DESCONOCIDA)
Hiptesis bilateral
H
o
: =
0
H
1
: =
0
Estadstico
1
=
n c
t
n s
x
t
o
o o
= |
.
|
\
|
<
< 1
/
2 /
0
2 /
t
n s
x
t P
Si la media muestral est fuera de
este intervalo rechazamos H
0
y
aceptamos en caso contrario.
|
|
.
|
\
|
> =
n s
x
t P
n
0
1
p Valor
|
.
|
\
|
+
2 / 0 2 / 0
,
o o
z
n
s
z
n
s
Regin de aceptacin.
32
Hiptesis:
Estadstica de prueba: dado que se desconoce la
varianza de la poblacin se utiliza s
2
.
Distribucin de la estadstica de prueba: distribuye t
de Student con n-1 grados de libertad.
Regla de decisin: A un nivel de significancia de
o=0.05, si el valor de t
calc
es mayor que t
crtico
(2.1604)
entonces se rechaza H
0
.
Clculo de la estadstica de prueba:
Decisin estadstica: -1.58 cae en la zona de no
rechazo por lo tanto no se rechaza H
0
.
35 : H y 35 : H
a o
= =
58 . 1
14 / 64 . 10
35 5 . 30
=
= t
33
Regin crtica y nivel de significacin
Regin crtica
Valores improbables si...
Es conocida antes de realizar el
experimento: resultados
experimentales que refutaran H
0
Nivel de significacin: o
Nmero pequeo: 1% , 5%
Fijado de antemano por el
investigador
Es la probabilidad de rechazar H
0
cuando es cierta
No rechazo H
0
Reg. Crit. Reg. Crit.
o=5%
H
0
: = 40
34
Contrastes: unilateral y bilateral
La posicin de la regin crtica depende de la hiptesis alternativa
Unilateral
Unilateral
Bilateral
H
1
: < 40 H
1
: > 40
H
1
: = 40
35
Mirar en los apuntes tambin:
Comparacin de medias
Pruebas sobre proporciones
Pruebas sobre varianzas
36
Ejemplo 1: Se juzga a un individuo por la presunta comisin de un delito
H
0
: Hiptesis nula
Es inocente
H
1
: Hiptesis alternativa
Es culpable
Los datos pueden refutarla.
La que se acepta si las
pruebas no indican lo
contrario.
Rechazarla por error tiene
graves consecuencias.
Riesgos al tomar decisiones
No debera ser aceptada sin una
gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior.
37
Tipos de error al tomar una decisin
(Ejemplo 1)
Realidad
Inocente Culpable
Veredicto
Inocente
OK Error
Menos grave
Culpable
Error
Muy grave
OK
38
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad ms alta de lo normal
H
0
: Hiptesis nula
(Ej.1) Es inocente
(Ej.2) El nuevo tratamiento no tiene efecto
(Ej.3) No hay nada que destacar
H
1
: Hiptesis alternativa
(Ej.1) Es culpable
(Ej.2) El nuevo tratamiento es til
(Ej. 3) Hay una situacin anormal
Riesgos al contrastar hiptesis
No especulativa
Especulativa
39
Tipos de error al contrastar hiptesis
Realidad
H
0
cierta H
0
falsa
No rechazo H
0
Correcto
El tratamiento no
tiene efecto y as se
determina.
Error de tipo II
El tratamiento s tiene efecto
pero no lo percibimos.
Probabilidad
Rechazo H
0
Acepto H
1
Error de tipo I
El tratamiento no
tiene efecto pero se
decide que s.
Probabilidad
Correcto
El tratamiento tiene efecto y
el experimento lo confirma.
40
Para cualquier tipo de test de contraste hay 3
resultados posibles:
(1) - Se toma una decisin correcta.
Es decir se rechaza una hiptesis falsa o no se rechaza una
hiptesis verdadera.
(2) - Se rechaza una hiptesis verdadera.
El error de rechazar H
0
cuando es verdadera se
denomina ERROR DE TIPO I (con probabilidad o).
(3) - No se rechaza una hiptesis falsa.
El error de no rechazar H
0
cuando es falsa se denomina
ERROR DE TIPO II (con probabilidad |).
Prueba de Hiptesis
Contenidos
Establecimiento de una hiptesis nula y
alterna
Errores tipo I y II
Pruebas uni y bilaterales sobre la media
Prueba de hiptesis y toma de decisiones
Tipos de hiptesis
En la prueba de hiptesis se comienza
proponiendo una hiptesis tentativa
acerca de un parmetro poblacional
A la hiptesis tentativa se le denomina
hiptesis nula (H
0
)
La hiptesis alternativa es la opuesta de lo
que se afirma en H
0
y se representa por
H
a
El procedimiento de prueba de hiptesis
comprende el uso de datos de una
muestra para probar las 2 aseveraciones
propuestas
Es necesario practicar para poder
formular hiptesis en forma correcta
Las formas de H
0
y H
a
van a depender
de la aplicacin en la cual deseamos
realizar la prueba
La prueba de hiptesis es una
demostracin de contradiccin
Se presentan generalmente 3 tipos de
situaciones en los cuales debemos
establecer hiptesis:
Prueba de hiptesis en Investigacin
Prueba de validez de una afirmacin
Prueba en casos de toma de decisiones
Resumen de formas para hiptesis
nula y alterna ( valor de inters)
La igualdad siempre aparece vinculada al la
hiptesis nula
Una forma de facilitar la seleccin de la forma
adecuada de las hiptesis es asignando lo que se
quiere demostrar a la H
a
0 0
: H >
0
:
a
H <
0 0
: H s
0
:
a
H >
0 0
: H =
0
:
a
H =
Una operacin en una lnea de produccin
debe llenar cajas con detergente hasta un peso
promedio de 300 gr. Peridicamente se
selecciona una muestra de cajas llenas. Si los
datos de la muestra llevan a la conclusin de
que les falta o sobra detergente, se debe parar
la lnea de produccin, y hacer los ajustes
necesarios
1.Formule la hiptesis nula y alterna
2.Comente la conclusin y la decisin cuando
no se puede rechazar H
0
Error tipo I y II
Las hiptesis nula y alterna son
aseveraciones sobre la poblacin que
compiten entre s
No siempre es posible que las
conclusiones sean verdaderas o correctas
H
0
verdadera H
a
verdadera
Aceptar H
0
Conclusin
Correcta
Error tipo II
Rechazar H
0
Error tipo I
Conclusin
Correcta
No se puede eliminar la posibilidad de
errores en la prueba de hiptesis, pero si es
posible considerar su probabilidad
Se define como:
o=probabilidad de cometer un error tipo I
|=probabilidad de cometer error tipo II
La mxima probabilidad permisible se le
llama nivel de significancia para la prueba.
Los valores acostumbrados son de 0.05 y
0.01
En la mayora de las aplicaciones se controla
la probabilidad de cometer error tipo I, luego
existe la incertidumbre con respecto al error
tipo II
Si los datos muestrales son consistentes
con H
0
se adopta en la prctica la
conclusin de no rechazar H
0
, ya que de
esta forma evitamos el riesgo de cometer
error tipo II
La conclusin de aceptar H
0
se toma
slo cuando se haya determinado el error
tipo II
Suponga que se va a implantar un nuevo
mtodo de produccin si una prueba de
hiptesis respalda la conclusin de que
con ese mtodo se reduce la media del
costo de operacin por hora
1.Enuncie las hiptesis nula y alterna si la
media del costo para el mtodo actual de
produccin es de $220 por hora
2.Cul es el error de tipo I en este caso y sus
consecuencias?
3.Cul es el error tipo II en este caso y sus
consecuencias?
Pruebas unilaterales para la
media
Muestra Grande
En este caso (n>30) se asume distribucin
normal
Para pruebas de hiptesis acerca de la
media de una poblacin se emplea el
estadgrafo z
Se determina si la desviacin del valor
numrico en estudio es lo suficiente para
justificar el rechazo de la hiptesis nula
( )
/
X
z
n
o
=
La probabilidades 0.05 y 0.01 de cometer
error tipo I estn relacionadas con un valor
de z de 1.645 y 2.33 respectivamente
Luego se debe rechazar H
0
si el valor de z
es menor a 1.645 o 2.33 dependiendo
del nivel de significancia
El valor z establece el lmite de la regin
de rechazo denominada valor crtico
0 -1.645 2.33
o=0.05 o=0.01
X
n
o
o =
z
Rechazar H
0
Rechazar H
0
Resumen de pruebas unilaterales sobre
media de una poblacin. Si n>30
( ) ( )
0 0
0
0 0
0
:
:
;
/ /
Rechazar H si
a
H
H
X X
z z
n s n
z z
o
o
>
<
= =
<
( ) ( )
0 0
0
0 0
0
:
:
;
/ /
Rechazar H si
a
H
H
X X
z z
n s n
z z
o
o
s
>
= =
>
Valor p
Es el valor de probabilidad de obtener un
resultado de la muestra que sea al menos
tan improbable como lo que se observa
Este valor corresponde al valor de la
probabilidad asignada al z calculado a
partir del valor numrico sometido a la
prueba de hiptesis
Si p es menor al nivel de significancia
predefinido se debe rechazar H
0
Muestra Pequea
En este caso (n < 30) se asume que la
poblacin tiene una distribucin normal
Con distribucin t se pueden hacer
inferencias acerca de la media de la
poblacin
Para este estadgrafo se debe considerar los
grados de libertad asociados al tamao de la
muestra (n-1) para definir el valor crtico que
llevar al rechazo de H
0
. Por las
caractersticas de la tabla resulta complicado
calcular el valor de p por lo que se expresa
en intervalos
0
/
X
t
s n
=
Pruebas bilaterales para la media
Muestra grande
La diferencia de esta prueba con respecto a las
unilaterales est en que la regin de rechazo
est ubicada simultneamente en ambas colas
En las pruebas bilaterales de hiptesis siempre
se determina la regin de rechazo colocando un
rea de probabilidad igual a o/2 en cada cola de
distribucin
Para este caso el valor de z para un nivel de
significancia de 0.05 corresponder a 1.96
z -z
o/2=0.025
0 -1.96 1.96
o/2=0.025
Resumen de pruebas bilaterales sobre
media de una poblacin. Si n>30
( ) ( )
0 0
0
0 0
0 / 2 / 2
:
:
;
/ /
Rechazar H si
a
H
H
X X
z z
n s n
z z z z
o o
o
=
=
= =
< >
Valor p
En una prueba bilateral se determina el p
duplicando el rea en la cola
Esta multiplicacin busca comparar el
valor de p directamente con o y poder
mantener la misma regla de rechazo
Muestra pequea
Con una prueba bilateral y un nivel de
significancia o definido se debe
considerar al estadgrafo t
o/2
para
determinar el rea de probabilidad
asociado a los grados de libertad de la
muestra
Relacin entre estimacin por intervalo
y prueba de hiptesis
En la determinacin del intervalo de confianza
para medias se empleo un coeficiente definido
por 1-o , como una forma de definir si nuestros
promedios muestrales contenan al parmetro
poblacional
Ahora para una prueba bilateral de hiptesis se
puede rechazar H
0
si el intervalo de confianza
para la media de la poblacin no abarca el
promedio poblacional
/ 2
X z
n
o
o
o
=
0
H
0
falsa
P
r
o
b
a
b
i
l
i
d
a
d
d
e
r
e
c
h
a
z
a
r
c
o
r
r
e
c
t
a
m
e
n
t
e
H
0
Curva de Potencia
Tamao de la muestra
Controlando el tamao de la muestra es
posible manejar la probabilidad de cometer
error tipo I y II
o
|
Rechazar H
0
a
C
H
0
:>
0
H
a
:<
0
H
0
verdadero =
0
H
0
falsa
a
<
0
( )
( )
0
0
2
2
2
0
a
a
a
c z c z
n n
z z
n n
z z
n
o |
o |
o |
o o
o o
o
= = +
= +
+
=