Professional Documents
Culture Documents
1. DEFINICIÓN
Es el procedimiento por el que se llega a
inferencias respecto a una población, con base
en los resultados que se obtienen en una
BIOESTADISTICA 2004 muestra extraída de esa población.
Puesto que las poblaciones son descritas por
INFERENCIA ESTADISTICA medidas numéricas descriptivas, llamados
parámetros de la población, se puede hacer
inferencias acerca de la población haciendo
Ing. Wilfredo Mormontoy Laurel MPH inferencias respecto a sus parámetros.
Hablaremos en general de un parámetro Por lo tanto, un buen estimador deberá tener las
poblacional W. Un estimador ŵ para el siguientes propiedades:
parámetro W, generará estimaciones en a.- Ser insesgado
repetidas muestras de la población y producirá b.- Varianza mínima
una distribución de los estimadores este Así por ejemplo:
estimador será considerado bueno si las
estimaciones se agrupan estrechamente al •X es un estimador insesgado y de varianza
rededor de W. Si la media de los estimadores mínima de µ.
es W, entonces ŵ se dice que es un estimador
• p también es un estimador insesgado y de
insesgado de W y E (ŵ) = W.
varianza mínima de π; etc.
Si la dispersión (varianza) de ŵ es más pequeña
que la de cualquier otro estimador, entonces ŵ En la siguiente tabla veremos algunos
se dice que tiene varianza mínima parámetros, estimadores y los errores estándar
del estimador:
1
Parámetro Estimador Error estándar
s 2p = (n 1-1)s 12 + (n 2-1)s 22
n 1 +n 2 - 2 (n1 y n2 > 30)
________
EEp = √(π(1-π)/n) ó
π p =a/n
_________
EEp = √(p(1-p) /n) n >30
LI = ŵ - c EE ŵ
LS = ŵ + c EE ŵ B.- PRUEBA DE HIPOTESIS:
Es un área importante de la Inferencia
Estadística se denomina también docimacia de
hipótesis o contraste de hipótesis.
p(ŵ - c EE ŵ < W < ŵ + c EE ŵ ) = (1 - α)
Una hipótesis estadística es un supuesto
acerca de algún parámetro poblacional o sobre
alguna situación existente en la población.
2
Existen dos tipos de hipótesis estadística: b.-Hipótesis alterna, H1.-
Supuesto alternativo a la H0; es decir, si la H0 es
a.-Hipótesis nula, H0.- rechazada, entonces los datos apoyan al
Es un supuesto de no diferencia , de cumplimiento de la H1.
conformidad, de no cambio, de acuerdo, de Al tomar una decisión respecto a la H0, se
independencia, etc. Es una hipótesis puede correr el riesgo de cometer dos distintos
conservadora y como habitualmente se tipos de error.
investiga para observar diferencias, cambios,
asociaciones etc., la H0 generalmente se
plantea con la finalidad de rechazarla y es la En la tabla siguiente se muestra la terminología
que se somete a contrastación. propia de la prueba de hipótesis
(1-α) (1- β)
A falta de una buena razón para tomar cualquier
_ otro valor hipotético como una hipótesis
ββ α especifica, lo mejor que podemos hacer es
_ xi
µ0 µ1 seleccionar arbitrariamente varias alternativas
xc
razonables, cada una en la vecindad del valor
Zona de no rechazo de H0 Zona de rechazo de H0
de H0, es decir, calcular una probabilidad β para
varias hipótesis especificas alternas.
3
Pero, una disminución de α (en el gráfico anterior al
La representación gráfica de la relación entre mover la media crítica hacia la derecha) producirá al
valores de β , para diferentes valores de H1 , se
mismo tiempo un aumento de β o viceversa.
denomina curva característica de operación
Veamos este punto con mayor amplitud utilizando
(CCO) y la relación entre potencia (1- β) y
para ello, el siguiente ejemplo del campo legal.
valores de H1 se llama función de potencia y la
Sea:
gráfica, curva de potencia.
H0: el acusado es inocente
Siendo α y β medidas de la probabilidad de
H1: el acusado es culpable
cometer errores, sería ideal que estos valores
Si se condena a un hombre inocente (rechazar Ho) se
fueran mínimos; es decir, tener pequeñas
comete un error tipo I, mientras que si se pone en
probabilidades de tomar decisiones
libertad a un hombre culpable se incurre en el error
equivocadas. tipo II
4
Ejemplo 2
Interpretación: Se desea estimar el tiempo promedio de estancia
Con 95% de confianza la media de la población se hospitalaria para cierto tipo de pacientes. Se toma
una muestra de 25 historias clínicas y se calcula
encuentra entre 20,45 y 26,15 años.
x =5,7 y s = 4,5 días.
Es decir, la edad promedio de las mujeres que
Estimar µ con 95% de confianza.
habitualmente consultan en ginecología, con una
seguridad del 95% fluctuará entre dichos valores.
Estos resultados se pueden presentar también Solución: En este caso no se conoce σ, luego el
como: modelo de estimación, será:
L.S
I.C. 95% ( 20,45 ; 26,15 años) µ = x ± t n-1 s
√n
L.I.
5
t 19 = 10,9-11,5 = -2,236
Nota:
1,2/√20
Si se conociera σ el contraste estadístico se
c) Valor de p:
realizaría con:
Con 19 grados de libertad, el valor de p, para
un contraste unilateral está entre 0,01 y 0,025.
Se expresa: Z = x - µ
0,01 < p < 0,025
σ/√n
d) Decisión y Conclusión.
D: Siendo p < 0,05; se rechaza Ho
C: Hubo una disminución estadísticamente
significativa de la media poblacional.
Solución:
c) Valor de p: utilizando la tabla de áreas:
a) Hipótesis Ho: µ1 = µ2 p= 2(0,0024) = 0,0048
H1: µ1 ≠ µ2 d) Decisión y conclusión:
b)Contraste estadístico: Se rechaza Ho con un error de 0,0048. La
Como se conocen las varianzas poblacionales; conclusión es que difieren estadísticamente las
se usará dos poblaciones en cuanto al ácido úrico.
6
Grupo 1 Grupo2
n1 = 12 n2 = 12 9 Las muestras provienen de poblaciones
distribuidas normalmente (supuesto de
x1 = 27,2 g x2 = 21,2 g normalidad).
s1 = 6 g s2 = 3,8 g 9 Las muestras constituyen muestras aleatorias
(supuesto de aleatoriedad).
¿Puede concluirse que con la dieta A, los 9 Las varianzas poblacionales son iguales
animales, ganaron mayor peso que con la B ? (supuesto de homogeneidad de varianzas)
Solución: Si estas suposiciones pueden asociarse a este
En vista de que no se conocen las varianzas caso, entonces se usará el contraste “t”:
poblacionales se hará uso del contraste “t”. Pero,
es necesario recordar antes que para un uso a) Hipótesis: H0 : µ1 ≤ µ2
adecuado, los datos deben satisfacer los
siguientes supuestos: H1: µ1 > µ2
b)Contraste estadístico:
t22= (27,2 - 21,2) - 0 = 2,927
√(25,22/12 + 25,22/12)
t (n1 + n2-2) = ( x1 -x2 ) - (µ1 - µ2 )
√(S2p/ n1 + S2p/ n2)
c) Valor de p:
0,0025 < p < 0,005
Donde: S2p = varianza ponderada
d) Decisión y conclusión:
S2p = (n1-1)S21 + (n2-1)S22 Rechazar Ho; es decir, la dieta A produjo una
n1 +n2 - 2 ganancia mayor de peso que la dieta B.
7
b) Contraste estadístico
c) Valor de p
t n-1 = d - µd 0,010 < p < 0,025
Sd /√n
Donde: d = media aritmética de diferencias en la muestra. d) Decisión y conclusión
Sd = desviación estándar de diferencias en la Se rechaza Ho. Se concluye que después del
muestra. programa los niveles de colesterol son
µd = media aritmética de diferencias en la población significativamente menores que los valores
obtenidos antes.
t7 = 15,375 - 0 = 2,678
16,2387/√8
Solución:
INFERENCIA ESTADISTICA SOBRE
Para estimar el parámetro se utiliza el siguiente
PROPORCIONES modelo:
LS
1.-ESTIMACION DE UNA PROPORCION pq
POBLACIONAL π=p ± Z
Ejemplo: n LI
Se desea estimar la proporción de niños
menores de cinco años que llegaron al hospital p = (16/80)100 = 20% q=80% n= 80
con signos de deshidratación entre Enero y Reemplazando en la fórmula anterior,los
Marzo del 2001. Se toma una muestra de 80 resultados se expresarán : IC 95% (11,2; 28,8% )
historias clínicas de esa población y se
Lo que indica que, con 95% de confianza, la
encuentra que 16 habían llegado con signos de
proporción en la población está entre 11,2 y
deshidratación.
28,8%
:
8
Solución: d) Decisión y conclusión:
a) Ho: π≤12% No se rechaza Ho. Es decir, no hubo un
H1: π>12% incremento estadísticamente significativo.
b) Contraste estadístico.
c) Cálculo de p:
p = 0,0655
c) Valor de p
p = 2x 0,1038 = 0,2076
d) Decisión y conclusión
No se rechaza Ho. Las dos razas no difieren
respecto a la proporción de hipertensos