You are on page 1of 22

INFERENCIA ESTADISTICA

Población Objetivo

Inferencia
estadística Muestreo

Muestra Investigador
INFERENCIA ESTADISTICA

Definición de Inferencia de Estadística:

Es un proceso por medio del cuál se


elaboran conclusiones probabilísticas
en relación a una población, valiéndose
de la información proporcionada por
una muestra de esa población.
Problemas a resolver mediante la Inferencia Estadística:

1. Conocer la proporción de estudiantes que fuman cigarrillos de la


Facultad de Odontología de la USMP
2. Un investigador está interesado en comparar la efectividad de dos
tratamientos en la cura de una ETS

Areas de la Inferencia estadística

Estimación de parámetros (resuelve problema 1)


Prueba de hipótesis (resuelve problema 2)

Tipos de estimación de parámetros:

La estimación de parámetros es de dos tipos:

- Estimación por punto y


- Estimación por intervalo.
La estimación por punto de parámetros

Lo proporciona sus respectivos estadísticos que se calculan en base a


los datos de la muestra, es decir:

Parámetros Estadísticos
_ n
µ x = Σ xi
i=1 n
n _
σ2 s2 = Σ (xi - x)2
i=1 n - 1
_ _
µ1 - µ2 x1 - x2

P p = a/n, donde a es el número de unidades que


poseen el atributo de interés en la muestra
P1 - P2 p1 - p2 .
Ejemplo 1 Estimación de una media aritmética µ

Se tiene interés en estimar la estatura media de los alumnos de la


Facultad de Odontología de la USMP. Para tal efecto se recurre a una
muestra aleatoria de 36 alumnos y se obtienen los siguientes resultados:
_
x = 170 cm y s = 20cm.

La estatura media de los alumnos está representado por µ (que es el


parámetro de la población) y la estimación por punto de este parámetro
está dado por :
_
x = 170 cm.
Ejemplo 2 Estimación de una proporción P

Interés: Estimar la proporción de niños desnutridos menores de 5


años de una determinada comunidad.

Seleccionamos una muestra de 100 niños menores de 5 años y se


determina que 45 están desnutridos.

Se quiere estimar una proporción de población P = A/N, donde, A: nº


de niños menores de 5 años desnutridos en la población y N: nº de
niños menores de 5 años en la población.

El estimador es: p = a/n donde a es el número de niños desnutridos


en la muestra y n es el tamaño de muestra. Por consiguiente, p =
45/100 = 0.45. proporción estimada de niños desnutridos menores de
5 años en la comunidad es de 0.45.
Estimación por intervalo
Consiste en determinar dos valores numéricos L1 y
L2 y que con un cierto grado de confianza se espera
que el valor del parámetro esté comprendida entre
dichos valores.

Intervalo de confianza para la media µ

En este caso los valores L1 y L2 serían:


_ _
L1 = x - Z ES (x)
_ _
L2 = x + Z ES (x)

Donde:
Z : Es un coeficiente de confianza y cuyo valor depende
del grado de confianza (G.C.) que se establece, es decir:
G.C. : 90% 95% 99%
Z : 1.64 1.96 2.57
_ _
ES(x) : es el error estándar de x y se define como:
_ _
ES(x) = s/√n , donde s es la desviación estándar de la

muestra

Nota El coeficiente Z se utiliza cuando tamaño de


muestra n > 30.
En relación al ejemplo 1, construiremos un intervalo de
confianza del 95% para la estatura promedio ( µ) de los
estudiantes de la facultad de odontología.

Grado de confianza del 95% le corresponde un Z=1.96


_ __
Error estándar ES(x) = 20/√36 = 3.33

Por consiguiente:
L1= 170 – 1.96*3.33 = 163.5
L2= 170 + 1.96*3.33 = 176.5
µ∈[163.5 , 176.5]
La estatura promedio de los estudiantes de la
Facultad de odontología de la USMP está oscilando
entre 163.5 y 176.5 cm con grado de confianza 95%
Ejemplo 2
Se desea estimar el tiempo promedio de estancia
hospitalaria para cierto tipo de pacientes. Se toma una
muestra de 25 historias clínicas y se calcula x =5,7 y s
= 4,5 días.
Estimar µ con 95% de confianza.

Solución: En este caso no se conoce σ, luego el modelo


de estimación, será:

L.S

µ = x ± t n-1 s

√n
L.I.
Donde t n-1 es el coeficiente de confiabilidad, cuyo
valor se obtiene de la tabla de distribución “t” de
Student con n-1 grados de libertad para el nivel de
confianza deseado.
Algunas características de la distribución “t” de
Student son:
 La distribución tiene forma acampanada.
 Es simétrica respecto al punto t=0
 Forma cola rápidamente a la derecha e izquierda;
por lo tanto “t” es más variable que Z
 La “forma” de la distribución cambia conforme el
valor de n. Es decir, para cada grado de libertad
(n-1) existe una curva simétrica.
 A medida que n aumenta, “t” se aproxima a la
normal Z.
Luego de la tabla “t” se obtiene para un nivel de
significación de 0,05 bilateral: t24 = 2,064

µ = 5,7 ± 2,064 4,8 7,68 días


√25 3,72 días
Interpretación:
La probabilidad de que el tiempo promedio de estancia
hospitalaria, en la población de pacientes, se encuentre
entre 3,72 y 7,68, es de 0,95.
Intervalo de confianza para la proporción P
______
• L1 = p - z √pq/n
____
• L2 = p + z√pq/n

• donde q = 1 - p.
____
• √pq/n = ES(p), nos indica el estimador del error estándar de la
proporción de la muestra p
Según la información que se dispone, se construye un intervalo del 95% para P:

• Para una confianza del 95%, Z = 1.96


• Reemplazando valores se tiene:
____________
• L1 = 0.45 - 1.96 *√ 0.45(0.55)/100 = 0.352
____________
• L2 = 0.45 + 1.96 *√0.45(0.55)/100 = 0.548.

• La proporción de niños menores de 5 años desnutridos en dicha comunidad


está entre 0.352 y 0.548 con una confianza del 95%.

Nota Se utiliza el coeficiente de confianza Z∝/2 si np y n(1-p) >5.


Resolver los siguientes ejercicios
20.- La probabilidad de que una
estimación de intervalo incluya el
párametro se denomina:
a) Nivel de significación.
b) Nivel de confianza.
c) Potencia.
d) Coeficiente de confianza.
e) N.A.

21.- Se seleccionó una muestra de


12 adolescentes gestantes se
obtuvieron la media y desviación
estándar de los niveles de
hemoglobina como: 11,6 y 1,3
respectivamente. Los límites del
intervalo de confianza del 95%, son:
a) (10,9;12,3)
b) (10,5;12,4)
c) (10,8;12,4)
d) (10,3;12,9)
e) N.
Prueba de hipótesis
Es una técnica estadística que se sigue para decidir si rechazamos o
no una hipótesis estadística en base a la información de una muestra.

Hipótesis estadística:
Es una afirmación de lo que creemos sobre una población. Por lo
general, está hipótesis se refiere a los parámetros de la población
acerca de los cuales se quiere hacer la afirmación. (En la practica, se
tiene idea de la distribución de la variable que se está estudiando)

Ejemplo 1
Un investigador pretende estudiar en forma comparativa la eficacia de
dos tratamientos (o procedimientos experimentales) para determinar
cuál es el mejor
Tipos de hipótesis estadística

Hipótesis nula (Ho) también se le denomina hipótesis de


la no diferencia y se establece para ser rechazada o
desacreditada..
• Considerando el ejemplo establecido en la hipótesis
estadística , las hipótesis nula que les corresponde es:

Ho: µA - µB = 0 (Tratamiento A no difiere de B)

Hipótesis alterna (H1) son todas las demás suposiciones


o alternativas al problema para contrastar Ho.
• La hipótesis alterna H1 puede ser uni o bilateral.
• Con respecto al ejemplo, se tiene:
• H1: µA - µB > 0, (indica que tratamiento A es mejor
que el tratamiento B. Ha unilateral a la derecha)
Nivel de significación: α
EN LA REALIDAD

Ho verdadero Ho Falso
Decisión
Decisión Rechazar Ho Error tipo I (α) correcta
estadística (1-ß)
Decisión correcta
No rechazar Ho Error tipo II (ß)
(1-α)
Cuando se toma una decisión estadística, podemos
cometer el error tipo I o tipo II.
α= P(error tipo I) = P( Rechazar Ho / Ho es verdadero)
α puede ser manejada por el investigador, por
consiguiente puede establecer su valor, es decir, α=0.001,
0.01 , 0.05
α nos indica el nivel de significación de la prueba,
porque permite diferenciar la región de rechazo y no
rechazo de la prueba.
1- α indica el grado de confianza de la prueba.
ß= P(error tipo II) = P(No rechazar Ho / Ho falso)
ß no se maneja directamente por el investigador.
αy ß están relacionados y ambos disminuyen su valor si
incrementamos el tamaño de muestra o si mejoremos el
diseño del estudio.
1-ß= P(rechazar Ho/Ho es falso), también se denomina
potencia de prueba. Valor mínimo que puede tomar es
del 80%.
PRUEBA DE HIPOTESIS: LA LOGICA DEL
PROCEDIMIENTO
Hipótesis Científicas

Hipótesis Estadísticas

Determinación del valor p


Según valor de estadística de
prueba y distribución respectiva

Decisión
Mostraremos estas cuatro probabilidades
utilizando la distribución de medias y una prueba
unilateral.
H0 H1

(1-α (1- β)
)
_
ββ α
_ xi
µ0 µ1
xc

Zona de no rechazo de H0 Zona de rechazo de H0


Ejercicio a resolver:
Un investigador está interesado en estudiar si el medicamento A es mejor que el
medicamento B. El investigador realiza el estudio y no rechaza la hipótesis nula, por
consiguiente: (responder preguntas 10 y 11)
10. Que tipo de error ha cometido:
a. α
b. ß
c. Error tipo I
d. Error tipo II
e. 1-ß
11. De acuerdo a las hipótesis establecidas, identifique la definición apropiada de la
potencia de prueba.
a. El medicamento A es mejor que el medicamento B, dado A es mejor que B.
b. El medicamento A no es mejor que el medicamento B, dado que A es mejor que B.
c. La probabilidad de que el medicamento A es mejor que el medicamento B, dado A es
mejor que B.
d. La probabilidad de que el medicamento A no es mejor que el medicamento B, dado
que A es mejor que B.
e. La probabilidad de que el medicamento A es mejor que el medicamento B, dado que
A no es mejor que B.

You might also like