You are on page 1of 8

ESCUELA SUPERIOR POLITECNICA DE

CHIMBORAZO
FACULTAD DE MECANICA
ESCUELA DE INGENIERIA INDUSTRIAL

DISEO EXPERIMENTAL

NOMBRE: Jorge Luis Llerena

SEMESTRE: Noveno P2

FECHA: 24 -04 -2017

ESTIMACIN PUNTUAL Y POR INTERVALOS

ESTIMACIN PUNTUAL

La estimacin de parmetros tiene por finalidad asignar valores a los parmetros poblacionales a
partir de los estadsticos obtenidos en las muestras. Dicho de otra manera, la finalidad de la
estimacin de parmetros es caracterizar las poblaciones a partir de la informacin de las
muestras (por ejemplo, inferir el valor de la Media de la poblacin a partir de los datos de la
muestra).

La estimacin puntual consiste en atribuir un valor (la estimacin) al parmetro poblacional. Si


la muestra es representativa de la poblacin, podemos esperar que los estadsticos calculados en
las muestras tengan valores semejantes a los parmetros poblacionales, y la estimacin consiste
en asignar los valores de los estadsticos muestrales a los parmetros poblacionales. Los
estadsticos con que obtenemos las estimaciones se denominan estimadores.

Ejemplo

Se desea estimar la Media de las puntuaciones del curso 2003/4, pero solo se dispone de 50
puntuaciones seleccionadas aleatoriamente. La Media de la muestra (el estimador), es igual a
5.6 y atribuimos este valor (la estimacin) a la Media del curso completo.

Resumiendo:

Podemos utilizar como estimadores de la Media de la poblacin otros estadsticos de tendencia


central como la Moda o la Mediana, pero NO todos los estimadores son apropiados. Los
estimadores deben satisfacer ciertos requisitos, y por esta razn, interesa conocer sus
propiedades a fin de utilizar los que sean adecuados segn las circunstancias de la estimacin.
(Hanke, 1997)
Caractersticas estimadoras

1) Sesgo. Se dice que un estimador es insesgado si la Media de la distribucin del estimador es


igual al parmetro.

Estimadores insesgados son la Media muestral (estimador de la Media de la poblacin) y la


Varianza (estimador de la Varianza de la poblacin):

Ejemplo

En una poblacin de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo
aleatorio (nmero de muestras= 10000, tamao de las muestras= 100) y hallan que la Media de
las Medias muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales
coinciden). En cambio, la Mediana de la poblacin es igual a 5 y la Media de las Medianas es
igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la


Varianza

en un muestreo de 1000 muestras (n=25) en que la Varianza de la poblacin es igual a 9.56 ha


resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasivarianza

la Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de la
poblacin ya que la Cuasivarianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parmetro cuanto mayor


es n (tamao de la muestra). Algunos estimadores consistentes son:

Ejemplo:

En una poblacin de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos
aleatorios (nmero de muestras= 100) con los siguientes resultados:
vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor
que la Media de la poblacin.

3) Eficiencia. Diremos que un estimador es ms eficiente que otro si la Varianza de la


distribucin muestral del estimador es menor a la del otro estimador. Cuanto menor es la
eficiencia, menor es la confianza de que el estadstico obtenido en la muestra aproxime al
parmetro poblacional.

Ejemplo

La Varianza de la distribucin muestral de la Media en un muestreo aleatorio (nmero de


muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribucin de Medianas ha
resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un
estimador ms eficiente que la Mediana).

ESTIMACIN POR INTERVALOS

La estimacin por intervalos consiste en establecer el intervalo de valores donde es ms


probable se encuentre el parmetro. La obtencin del intervalo se basa en las siguientes
consideraciones:

a) Si conocemos la distribucin muestral del estimador podemos obtener las probabilidades de


ocurrencia de los estadsticos muestrales.

b) Si conociramos el valor del parmetro poblacional, podramos establecer la probabilidad de


que el estimador se halle dentro de los intervalos de la distribucin muestral.

c) El problema es que el parmetro poblacional es desconocido, y por ello el intervalo se


establece alrededor del estimador. Si repetimos el muestreo un gran nmero de veces y
definimos un intervalo alrededor de cada valor del estadstico muestral, el parmetro se sita
dentro de cada intervalo en un porcentaje conocido de ocasiones. Este intervalo es denominado
"intervalo de confianza". (P. Armitage, 1992)

Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una poblacin que sigue la distribucin
Normal, y resulta:

La distribucin de las Medias muestrales aproxima al modelo Normal:


En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales es:

(Nota: Los valores +-1.96 que multiplican la Desviacin Tpica de la distribucin muestral son
los valores cuya funcin de distribucin es igual a 0.975 y 0.025 respectivamente y se pueden
obtener en las tablas de la distribucin Normal estandarizada o de funciones en aplicaciones
informticas como Excel). Seguidamente generamos una muestra de la poblacin y obtenemos
su Media, que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parmetro poblacional (5.1) est incluido dentro de sus lmites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa razn, la
distancia desde m a la Media muestral es la misma que va de la Media muestral a m. En
consecuencia, si hacemos un muestreo con un nmero grande de muestras observamos que el
95% de las veces (aproximadamente) el valor de la Media de la poblacin (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media muestral. El
porcentaje de veces que el valor de m se halla dentro de alguno de los intervalos de confianza es
del 95%, y es denominado nivel de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m se halle dentro del
intervalo sea igual al 99%, la expresin anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviacin Tpica de la distribucin muestral en


las tablas de la distribucin Normal estandarizada o de funciones en aplicaciones informticas
como Excel), y son los valores cuya funcin de probabilidad es igual a 0.995 y 0.005
respectivamente). (Murray R., 1976)

Ejemplo
La siguiente imagen muestra la distribucin de las Medias muestrales obtenidas de 100000
muestras aleatorias y los intervalos alrededor de cada una de las Medias obtenidas de diez de las
muestras:

donde ls y le simbolizan los lmites superior e inferior del intervalo de confianza al 95%.

Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a 3.7)
incluyen el valor del parmetro dentro sus lmites. (Levin I., 1996)

PRUEBAS PARAMTRICAS

Se llaman as porque su clculo implica una estimacin de los parmetros de la poblacin con
base en muestras estadsticas. Mientras ms grande sea la muestra ms exacta ser la
estimacin, mientras ms pequea, ms distorsionada ser la media de las muestras por los
valores raros extremos.

San valores numricos dados.

Los anlisis paramtricos partes de los siguientes supuestos:

1. La distribucin poblacional de la variable dependiente es normal: el universo tiene


distribucin normal.
2. El nivel de medicin de las variables es por intervalos de razn.
3. Cuando dos o ms poblaciones son estudiadas, tienen una varianza homognea: las
poblaciones en cuestin poseen una dispersin similar en sus distribuciones.

Como estos criterios son muy rigurosos, algunos investigadores slo basan sus anlisis en el
tipo de Hi y los niveles de medicin de las variables.

Las pruebas paramtricas ms utilizadas son (HFB2):


Coeficiente de correlacin de Pearson y regresin lineal.
Prueba t.
Prueba de contraste de las diferencias de proporciones.
Anlisis de varianza unidireccional (ANOVA en un solo sentido o oneway)
Anlisis de Varianza factorial (ANOVA)
Anlisis de covarianza (ANCOVA)

Descripcin. (Otra lista de pruebas paramtricas):

Prueba del valor Z de la distribucin normal


Prueba T de Student para datos relacionados (muestras dependientes)
Prueba T de Student para datos no relacionados (muestras independientes)
Prueba T de Student-Welch para dos muestras independientes con varianzas no
homogneas
Prueba de ji cuadrada de Bartlett para demostrar la homogeneidad de varianzas
Prueba F (anlisis de varianza o ANOVA)

EL COEFICIENTE DE CORRELACIN DE PEARSON (R)

Es una prueba estadstica para analizar la relacin entre dos variables medidas en un nivel por
intervalos o de razn.

Prueba Hi del tipo de A mayor X, mayor Y; A mayor X, menor Y; etc.

La prueba en si no considera a una como independiente y la otra como dependiente, porque no


evala la causalidad, solo la relacin mutua (correlacin).

El coeficiente se calcula a partir de las puntuaciones obtenidas en una muestra de dos variables.
Se relacionan las puntuaciones obtenidas de una variable con las puntuaciones obtenidas de otra
variable, en los mismos sujetos.

Mide niveles de variables de intervalo o de razn.

Puede variar de -1,00 a +1,00

(HFB2: 377)

Ejemplo de la Correlacin entre la variable estatura y peso de alumnos .

Correlacin positiva considerable


COEFICIENTE RHO DE SPEARMAN

Es un coeficiente para medir el grado de asociacin entre dos variables ordinales cuyos valores
indican rangos en cada una de ellas. Rho toma el valor +1 cuando existe igualdad de rangos de
los casos en las dos variables y -1 cuando tienen rangos exactamente opuestos. Los valores
intermedios pueden ser interpretados segn sus magnitudes relativas. Su frmula de clculo es:

En la cual:

D = diferencia de rangos en las dos variables, o, diferencia entre los correspondientes


estadsticos de orden de x - y.

N = nmero de parejas.

Se tiene que considerar la existencia de datos idnticos a la hora de ordenarlos, aunque si stos
son pocos, se puede ignorar tal circunstancia

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximacin a la


distribucin t de Student.

La interpretacin de coeficiente de Spearman es igual que la del coeficiente de correlacin de


Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o positivas respectivamente,
0 cero, significa no correlacin pero no independencia. La tau de Kendall es un coeficiente de
correlacin por rangos, inversiones entre dos ordenaciones de una distribucin normal
bivariante.

Ejercicio: A un grupo de 10 vendedores se les asigna rangos segn la cantidad de ventas y el


rango de tiempo en hacerlo. Se desea saber si existe asociacin entre las dos variables.

Colocados los valores en la frmula se tiene:


Respuesta al problema: existe asociacin positiva medianamente alta entre el rango de ventas y
tiempo empleado. (Mason, 1990)

Referencias

Hanke, J. E. (1997). Estadstica para negocios. USA: Editorial Mc Graw Hill.


2. Edicin.

Levin I., R. &. (1996). Estadstica para administradores. Barcelona, Espaa:


Prentice-Hall Hispanoamericana.

Mason, R. y. (1990). Estadstica para administracin y economa. Mxico:


Editorial Alfaomega.

Murray R., S. (1976). Teora y Problemas de Probabilidad y Estadstica.


Bogot, Colombia: McGrawHill.

P. Armitage, G. B. (1992). Estadstica para la Investigacin Biomdica.


Barcelona, Espaa: Doyma.

You might also like