You are on page 1of 37

Inferencia Estadística

ESTIMACIÓN Y CONTRASTE
DE HIPÓTESIS
¿Qué es la Inferencia Estadística?

 La inferencia estadística es el
procedimiento por medio del cual se
llega a conclusiones acerca de una
población con base en la información
que se obtiene a partir de una
muestra seleccionada de esa
población.
INFERENCIA
POBLACIÓN

Muestra
Problemas fundamentales
 Losdos problemas fundamentales
que estudia la inferencia
estadística son el "Problema de la
estimación" y el "Problema del
contraste de hipótesis"
Paramétrica y No paramétrica
 Cuando se conoce la forma funcional de la
función de distribución que sigue la
variable aleatoria objeto de estudio y sólo
tenemos que estimar los parámetros que
la determinan, estamos en un problema
de inferencia estadística paramétrica ;
por el contrario cuando no se conoce la
forma funcional de la distribución que
sigue la variable aleatoria objeto de
estudio, estamos ante un problema de
inferencia estadística no paramétrica.
Teorías en las que se basa
 En todos estos problemas que
estudia la inferencia estadística
juega un papel fundamental la
"Teoría de la Probabilidad"
(distintas formas funcionales de las
distribuciones de probabilidad) y la
"Teoría de Muestras"
(procedimientos para tomar
muestras de manera apropiada).
ESTIMACIÓN DE PARÁMETROS

 El proceso de estimación implica calcular, a partir de los


datos de una muestra, alguna estadística que se ofrece
como una aproximación del parámetro correspondiente de
la población de la cual fue extraída la muestra.
 Se pueden hacer estimaciones para los parámetros de una
muestra o la diferencia de parámetros entre dos muestras.
Los parámetros que se han analizado son: media,
proporción, varianza y desviación estándar; así también, la
diferencia entre las medias de una población, la diferencia
entre las proporciones y el cociente o razón entre
varianzas de muestras de una misma población o distintas
poblaciones.
Tipos de Estimación
 Paracada uno de los parámetros a
estudiar, se pueden se pueden
calcular dos tipos de estimación:
puntual y por intervalos.

 Una estimación puntual es un solo


valor numérico utilizado para estimar
el parámetro correspondiente de la
población.
Estimadores de los parámetros
 A las formulas que nos permiten
determinar el valor de la estimación de un
parámetro, se les conoce como
ESTIMADORES. En muchos de los casos
un mismo parámetro es evaluado por
medio de más de un estimador, por
ejemplo, la Mediana.
 En general, los estimadores deben ser:
insesgados, consistentes, eficientes y
suficientes.

Una sola muestra
Para dos muestras

σ12 /σ22 = S12/ s22


Ejemplos
 1. La célula típica de una planta tiene una gran
cantidad de citoplasma limitado por una
 membrana celular llamada membrana
plasmática. El espesor medio de esta membrana
varía de una especie a otra. Una muestra
aleatoria de 20 especies proporcionó las
siguientes observaciones sobre X, espesor medio
de la membrana celular angstrom:
 80 90 85 82 75 58 70 84 87 81
 85 70 78 95 77 52 84 73 61 87
 Establecer una estimación puntual de µ, de σ2 y
de σ.
2. Está generalmente aceptado que existen diferencias
ligadas al sexo relacionadas con la
respuesta al estrés producido por el calor. Se sometió a un
grupo de 10 varones y 8 mujeres a un programa de
ejercicios enérgicos que implicaba el empleo de una “cinta
sin Fin”. El medio era caluroso, y se disponía de una
cantidad mínima de agua para los individuos. La variable de
interés fue el porcentaje de peso corporal perdido. Se
obtuvieron los datos siguientes:

Varones: 2.9, 3.5, 3.9, 3.8, 3.6, 3.7, 3.8, 4.0, 3.6, 3.7
Mujeres: 3.0, 2.5, 3.7, 3.3, 3.8, 4.1, 3.6, 4.0

Establecer una estimación puntual para la diferencia en


porcentajes de pérdida de peso
corporal entre varones y mujeres que hacen ejercicio en estas
condiciones.
 3. Se está probando un antibiótico llamado
doxiciclina para prevenir la “diarrea del viajero”.
El fármaco fue probado en 38 voluntarios del
Cuerpo de Paz que fueron a Kenya. A la mitad se
les dio doxiciclina y a la otra mitad una dosis
ficticia. De los que recibieron doxiciclina, 17 se
libraron del trastorno, mientras que solamente 11
de los del otro grupo se libraron. Encontrar una
estimación puntual para la diferencia de las tasas
de protección entre los que utilizan doxiciclina y
los que no la utilizan.
Estimación por intervalos de
confianza
Una manera de precisar la estimación de un parámetro
poblacional, es por medio de un intervalo o rango de
valores con un grado de confiabilidad que permita tener no
solo un valor, sino un conjunto de valores (“colchón) que
garantice que el verdadero valor del parámetro ha sido
determinado.
 Un intervalo estimador es lo que su propio nombre indica,
un intervalo aleatorio, cuyos puntos extremos L1 y L2 son
estadísticos. Esto se utiliza para determinar un intervalo
numérico a partir de una muestra. Se espera que este
contenga el parámetro de la población que está siendo
estimado. Al ampliar la estimación de un punto a un
intervalo, ganamos un pequeño margen de error, lo cual
nos permite, con base en la teoría de la probabilidad,
dictaminar sobre la confianza que tenemos en el estimador.
Intervalo de confianza para µ
 Para construir un intervalo de confianza de μ primero
hallaremos una variable aleatoria cuya expresión contenga
a μ y cuya distribución se conozca, al menos
aproximadamente.
 Sea X1, X2,..., Xn una muestra aleatoria de tamaño n de
una distribución que es normal con media μ y varianza σ2.
Entonces “X barra” es normal con media μ y varianza σ2/n.
Además, la variable aleatoria

es normal tipificada.
¿Cómo se construye un intervalo de confianza para μ?
Ejemplo: un intervalo de confianza de μ del 95%,
P(-1.96 ≤ Z ≤ 1.96) = 0.95
De acuerdo a la figura

Sustituyendo el valor de Z en la ecuación:

Tenemos que
Despejando μ, se obtiene
Así los límites del intervalo son:

en este caso, σ es conocida.

Y en general para cualquier nivel de confianza:

Se utiliza para cualquier valor de “n”, siempre que se conozca σ


Nivel de confianza
El nivel de confianza (1-α) es la
probabilidad que existe (antes de tomar la
muestra) de que el intervalo a construir a
partir de la muestra incluya el verdadero
valor del parámetro a estimar. Refleja la
“confianza” en la “construcción” del
intervalo y que éste después de definir la
muestra contendrá el valor a estimar. De
ahí que en términos numéricos dicho nivel
o probabilidad haya de tomar un valor alto
(0.9, 0.95 y 0.99).
Nivel de significancia
 Es el complementario al nivel de
confianza; es decir “α” o nivel de
significación. Supondrá las probabilidades
de cometer el error de no dar por incluido
el verdadero valor del parámetro a
estimar en un intervalo en el que
realmente si está. De ahí y dado que se
trata de un error posible a cometer, su
cuantificación en términos de probabilidad
sea muy pequeña (0.1, 0.05 y 0.01).
 En relación a lo anterior, obviamente en cuanto
mayor sea el nivel de confianza prefijado la
amplitud del intervalo de estimación será
también mayor y por tanto la estimación será
menos precisa.
Es importante señalar dos aspectos importantes en la formula
anterior: lo primero es que cada intervalo de confianza está
centrado en μ y lo segundo es que la amplitud del intervalo
depende de tres factores: 1) la confianza deseada, 2) la
desviación típica, 3) y el tamaño muestral.

Si σ es desconocida, debe ser estimada. La estimación de σ se hace a


través de S, desviación estándar de una muestra. Esto hace que S
remplace a σ generando una nueva variable:

Variable “T” con gamma grados de libertad, cuya distribución se


conoce como Distribucion “T” de Student.
Dado que esta nueva variable, tiene una estructura semejante a la
variable “Z”, el intervalo estimador cuando σ es estimada a través
de S, sería:

Se utiliza cuando σ es desconocida y n‹ 30

Intervalo de confianza de μ cuando se ha estimado


Sea X1, X2, X3,...., Xn una muestra aleatoria simple de tamaño
n, de una distribución normal de media μ y varianza
 Al remplazarse S por σ la variable generada llamada “T” con
gamma grados de libertad debe especificarse su distribución de
probabilidad. Su distribución es normal tipificada, ya que la
variable base X es Normal, así la variable “T” sigue lo que se
llama una distribución de T con n - 1 grados de libertad.
 Propiedades de las variables aleatorias T
1. Hay un numero infinito de variables aleatorias T, cada una
identificada por un parámetro , llamados grados de libertad. El
parámetro es siempre un entero positivo. La notación
designa una variable aleatoria T con grados de libertad.
2. Cada variable aleatoria T es continua.
3. La grafica de la densidad de cada variable aleatoria T es una curva
simétrica con forma de campana centrada en cero.
4. Decimos que es un parámetro de forma en el sentido de que
cuando crece, la varianza de la variable aleatoria T decrece. De
este modo, cuanto mas grande es el numero de grados de
libertad, mas apuntada se vuelve la curva en forma de campana
 asociada con la variable.
5. Cuando el numero de grados de libertad crece, la curva T se
aproxima a la curva normal tipica
(a) Típica relación entre dos curvas T con (b) Típica relación
entre una curva T y la curva normal tipificada.
Si σ es desconocida y n ≥ 30, se recomienda calcular los limites del
intervalo con la expresión:
Estimación por intervalos de confianza para
varianza y desviación estándar
 Además de la media μ, otro
parámetro de interés es la varianza
de la población σ2, así como también
la desviación estándar σ. Por lo que
no sólo es necesario la estimación
puntual de σ2 a través de S2 como un
estimador puntual y lógico, sino
también construir un intervalo de
confianza para éste parámetro.
Ejemplos:
 1. El cobre, mineral requerido en algún grado por la
mayoría de las plantas, se considera un micronutriente. Su
concentración en una planta se mide en partes por millón, y
se determina quemando totalmente la planta y analizando
las cenizas. La concentración de cobre varia de una especie
a otra. Se diseña un experimento para estimar esta
variabilidad.
 2. Al manufacturar un fármaco, su potencia no permanece
constante. Esta variabilidad no debe ser demasiado grande.
Una varianza muy grande puede dar como resultado que
algunos lotes contengan fármaco demasiado débil para que
sea efectivo, mientras que otros contengan fármaco
demasiado fuerte y potencialmente peligroso. Se realizan
pruebas periódicas para controlar la varianza del fármaco
que esta siendo producido.
 Para construir un intervalo de confianza de σ2 es necesario introducir otra
familia de variables aleatorias continuas, llamadas variables ji-cuadrada
(X2), cuyas características en general son:
 1. Hay un numero infinito de variables aleatorias ji-cuadrado, identificada
cada una por un parámetro llamado grados de libertad. El parámetro es
siempre un entero positivo. La notación designa una variable ji-cuadrado
con grados de libertad.
 2. Cada variable ji-cuadrado es continua.
 3. La grafica de la densidad de cada variable ji-cuadrado con es una curva
asimétrica que presenta generalmente la forma que aparece en la figura.

 .
 Cuando γ=1, la grafica adopta la forma:

4. Las variables ji-cuadrado no pueden tomar valores negativos.


5. El parámetro γ y es, al mismo tiempo, un parámetro de forma
y un parámetro de localización, en el que:
 Es decir, el valor medio de una variable aleatoria
ji-cuadrado es el mismo que sus grados de
libertad y su varianza es el doble de sus grados
de libertad.
 INTERVALO DE CONFIANZA PARA σ2
Para construir un intervalo de confianza de σ2
necesitamos una variable aleatoria que contenga
en su expresión a este parámetro y cuya
distribución se conozca.
 Sea X1, X2, X3,...,Xn una muestra aleatoria de
tamaño n de una distribución que es normal, con
media μ y varianza La variable aleatoria se
distribuye como una variable aleatoria ji-
cuadrado con n - 1 grados de libertad.
En este caso, la variable aleatoria ji-
cuadrada es:

X2 =
P(x1-α⁄2 ≤ X2γ ≤ xα⁄2) = 1-α

En ésta ecuación se sustituye la


variable X2 y se despeja el parámetro
σ2, obteniéndose:
 Ejemplos….

You might also like