You are on page 1of 13

Republica bolivariana de Venezuela

Ministerio del poder popular para la defensa


Universidad nacional experimental politcnica de la fuerza armada
Unefa ncleo Zulia

Teora de dimensin
Estadstica

Realizado por:
Emileanny marin.
Diego pineda

Desarrollo

1. Distribucin normal.
Al graficarse los diferentes valores obtenidos de una variable X se obtiene
una distribucin normal simtrica (el eje se sita en la media) y que adems
es unimodal porque tiene forma similar a una campana.
En la distribucin normal coinciden en un mismo punto la media (),
mediana y moda. La amplitud de la misma lo determina la desviacin
estndar ().

Es asinttica al eje de las abscisas, es decir, sus colas nunca llegan a tocar
el eje.
Toma valores entre - y +.
Si se quiere encontrar la probabilidad de que una variable tome valores
entre 2 nmeros cualquiera, llmese por ejemplo a y b, lo que se tiene que
hacer es calcular el rea bajo la curva entre a y b.

El valor de la variable aleatoria Z indica la proporcin de la totalidad de la


poblacin que tiene esa propiedad, as por ejemplo:
Si el 40% tiene Z -0.253 el 60% tiene Z > -0.253

Para calcular una probabilidad se utiliza la tabla para la distribucin normal;


proporciona el rea total bajo la curva desde - hasta el valor de la variable
aleatoria Z:

P (Z z)
Dnde:
Z = Variable aleatoria
Z = probabilidad acumulada hasta este valor

Cuando en la distribucin normal se tienen los valores: =0 y =1, estamos


en lo que se conoce como: distribucin normal tipificada o estndar

Para que una distribucin tienda a ser normal deben cumplirse los siguientes
requisitos:
1. Hay un valor que es el ms frecuente, que tiende a estar en la parte central.

2. Los datos que ms se alejan del valor central, hacia la derecha o hacia la
izquierda, tienden a ser menos frecuentes.
3. El promedio y la desviacin estndar no dependen uno del otro y la desviacin
estndar es menor que el promedio.
Propiedades:
1. Simetra: P ( Z < -a) = 1 P (Z < a)
2. P ( - < x < +) = 0.6827 (68.27%)
3. P ( -2 < x < +2) = 0.9545 (95.45%)
4. P ( -3 < x < +3) = 0.9973 (99.73%)
5. P (x=a) = 0, para cualquier nmero a.
1.1

Teorema del limite central.

Sea X1, X2,Xn, una muestra aleatoria de cualquier poblacin; y sea la media
muestral, entonces, independientemente de cmo sea la distribucin de la
poblacin de donde se extrajo la muestra, la distribucin de (promedios
mustrales) se aproximar (tender) a la normal conforme n crece.

A medida que aumenta el tamao de la muestra, la tendencia mejorar.

Si la distribucin no es radicalmente distinta a la normal, entonces la


aproximacin empieza a ser buena para tamaos de muestras mayores o
iguales a n 4.
Para describir la distribucin de los promedios mustrales, se puede usar la
distribucin normal estndar tipificada con la siguiente modificacin:

El teorema del Lmite Central es una de las razones por las que funciona la
grfica de Control X , porque no es necesario ocuparse de si la distribucin
de las X no es normal (si no es radicalmente distinta), por supuesto,
siempre que el tamao de la muestra sea mayor o igual a 4.

1.2

Prueba de normalidad.

La grfica de probabilidad es un procedimiento que permite determinar en forma


visual si los datos mustrales se ajustan a una distribucin especfica.

Para construir una grfica de probabilidad se procede de la siguiente forma:


1. Se ordenan los datos de menor a mayor (Xj)
2. Se calcula la frecuencia acumulada con la siguiente frmula (distribucin
emprica):

J = nmero individual de cada muestra ordenada segn el paso 1.


3. Se grafican los datos en una hoja de probabilidad. Si la distribucin
propuesta describe de manera adecuada los datos, los puntos en la grfica
tendern a ubicarse a lo largo de una lnea recta; pero si los puntos se desvan
de manera significativa de una lnea recta, eso ser evidencia de que los datos
no siguen tal distribucin.
4. Si no se cuenta con papel de probabilidades ser necesario determinar los
puntajes normales estandarizados:

NOTA: Se hayan ubicando para cada valor obtenido de la frecuencia acumulada


(paso 2), el valor Z correspondiente en la tabla para la distribucin normal. Luego
graficamos los datos colocando en el eje X los valores mustrales (Xj) y en el eje
Y, los valores Zj.
5. Trazamos una lnea recta que pase lo ms cerca posible de los puntos;
fijamos la atencin en los puntos que estn en la parte media de la grfica en
relacin a los que se encuentran en los extremos, si los mismos siguen la
lnea recta, es una evidencia de que los datos mustrales siguen una
distribucin normal.

EJEMPLO:
El peso que deben contener ciertas bolsas de detergente es de 750 gr. Con una
tolerancia de 5 . Se desea verificar si es razonable suponer que la distribucin
del peso sigue una distribucin normal. Para ello, se toma una muestra aleatoria
de 25 productos, se pesan y se obtienen los siguientes datos:

2. Estimacin puntual y por intervalos


Qu es una estimacin?
Cuando queremos realizar un estudio de una poblacin cualquiera de la que
desconocemos sus
parmetros, por ejemplo su media poblacional o la
probabilidad de xito si la poblacin sigue una distribucin binomial, debemos
tomar una muestra aleatoria de dicha poblacin a travs de la cual calcular una
aproximacin a dichos parmetros que desconocemos y queremos estimar. Bien,
pues esa aproximacin se llama estimacin.
Adems, junto a esa estimacin, y dado que muy probablemente no coincida con
el valor real del parmetro, acompaaremos el error aproximado que se comete al
realizarla.
Estimacin puntual: Cuando no se conoce alguna caracterstica de la poblacin,
el estadstico correspondiente de la muestra puede ser utilizado como estimador
del parmetro poblacional. Es lo que se conoce como estimacin puntual, que se
aplica cuando un estadstico de la muestra es usado para estimar un parmetro
poblacional.
Al ser un estimador puntual una variable aleatoria cuya distribucin en el muestreo
depende del parmetro desconocido, se utilizan dos criterios para evaluar la
bondad del estimador, que son que sea ingresado respecto al parmetro a estimar
y que tenga varianza mnima.

Los estimadores puntuales ms usuales son la distribucin binomial, la distribucin


de Poisson de parmetro y la distribucin normal, con sus tipificaciones
asociadas.
Estimacin por intervalos: El intervalo dentro del cual se espera que se encuentre
un parmetro poblacional usualmente es conocido como intervalo de confianza.
Se trata por lo tanto de una variable aleatoria bidimensional, donde, por ejemplo,
el intervalo de confianza para la media poblacional es el intervalo de valores que
tiene una alta probabilidad de contener a la media de la poblacin. Por lo tanto, en
una estimacin por intervalo se establece el rango de valores dentro del cual se
espera que se encuentre un parmetro poblacional.
Al ser el estimador por intervalo una variable aleatoria, resulta adecuado hablar
en trminos de probabilidad de que el estimador cubra el verdadero valor del
parmetro.
Propiedades deseables de los estimadores puntuales
A) Estimador insesgado
Si tenemos un gran nmero de muestras de tamao n y obtenemos el valor del
estimador en cada una de ellas, sera deseable que la media de todas estas
estimaciones coincidiera con el valor de . Se dice que un estimador es insesgado
si su esperanza matemtica coincide con el valor del parmetro a estimar.
B) Estimador eficiente
Se dice que los estimadores son eficientes cuando generan una distribucin
muestral con el mnimo error estndar, es decir, entre dos estimadores insesgados
de un parmetro dado es ms eficiente el de menor varianza.
C) Estimador consistente
Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor
del parmetro a medida que aumenta el tamao de la muestra. Es decir, la
probabilidad de que la estimacin sea el verdadero valor del parmetro tiende a 1.
D) Estimador suficiente
Se dice de un estimador que es suficiente cuando es capaz de extraer de los
datos toda la informacin importante sobre el parmetro.

2.1 intervalos de confianza


2.1.1

Intervalo de confianza para

conocida.

Un vendedor mayorista de partes automotrices necesita una estimacin de la vida


media que puede esperar de los limpiaparabrisas en condiciones normales de
manejo. La administracin de la empresa ya ha determinado que la desviacin
estndar de la vida til de la poblacin es de seis meses. Supongamos que se
selecciona una sola muestra aleatoria de 100 limpiaparabrisas, y obtenemos que
la vida media de estos 100 limpiaparabrisas es de 21 meses. Se pide calcular un
intervalo de confianza del 95% para la vida media de la poblacin de los
limpiaparabrisas.
Tenemos X como la distribucin de la vida til en meses de la poblacin de
limpiaparabrisas, no sabemos qu distribucin tiene, al igual que desconocemos
su media.
En este caso s conocemos la desviacin estndar poblacional.
X (, = 6)
La media muestral
distribucin normal:

X por el teorema central del lmite se va a aproximar la

Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de
toda la poblacin de limpiaparabrisas, es decir para

El error mximo de estimacin es la mitad de la longitud del intervalo

Con una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que
vende este mayorista est entre 19,824 meses y 22,176 meses.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de
confianza para cada muestra, el 95% de todos los intervalos van a incluir a la vida
media poblacional en meses de todos los parabrisas que vende este mayorista.
2.1.2 Intervalo de confianza para

con desconocida.

El administrador de una planta industrial generadora de energa desea estimar, por


intervalo, la cantidad de carbn que se consumi por termino medio
semanalmente durante ao pasado. Para ello toma una muestra de 10 semanas.
El consumo medio fue de 11.400 toneladas, la desviacin estndar muestral 700
toneladas. Cul ser el intervalo de confianza del 95% para el consumo medio
semanal durante el ao pasado?. (supongamos normalidad).
Tenemos X como la distribucin de toneladas de carbn consumidas cada semana
del ao pasado por la planta de energa y su media y su desviacin estndar
desconocidas
X (,)
Aunque n < 30, suponemos que la media muestral, X , sigue una distribucin
normal

Para estimar la desviacin estndar poblacional vamos a utilizar la desviacin


estndar muestral S que es 700 toneladas. Por lo tanto, el intervalo de confianza
del 95% para el consumo promedio de toneladas de carbn en cada semana del
ao pasado, es decir para , ser:

Utilizamos la t-Student porque la desviacin estndar poblacional


desconocida. En las tablas,

es

Una t-Student con 10 1 = 9 grados de libertad que deja su derecha un rea de


0,025. = 0,05 porque el nivel de confianza es de 1 = 0,95

Con una confianza de 1 = 0,95.


Con una confianza del 95%, el consumo promedio semanal de carbn durante el
ao pasado por esta planta de energa estar entre 10.899 toneladas y 11.901
toneladas. Si extraemos varias muestras del mismo tamao y calculamos un
intervalo de confianza para cada muestra, el 95% de todos los intervalos van a
incluir al consumo promedio poblacional de toneladas de carbn por semana
durante el ao pasado por la planta de energa.
2.2 Tamao muestral
Sabemos que si tomamos una muestra aleatoria simple de tamao n procedente
de una poblacin N(,), siendo conocida, el intervalo de confianza al nivel del
100(1-)% para la media poblacional vena dado por:

I x z / 2
, x z / 2
n
n

Siendo la amplitud del intervalo


L ( x z / 2

) ( x z / 2
) 2 z / 2
n
n
n

(*)

Si, previamente, se fija la longitud del intervalo L y deseamos conocer el tamao


de la muestra para obtener ese intervalo al nivel de confianza del 100(1-)%,
bastar despejar n de la expresin (*), pues L, z / 2 y son conocidos, y
tendremos que el tamao de la muestra ser:

n 4 z2 / 2

2
L2

El cual nos permitir construir un intervalo al nivel de confianza del 100(1-)% y


de amplitud L para la media de una poblacin normal con conocida.

Tambin podramos hacer el siguiente razonamiento cuando sea conocido, si la


media fuera el valor central del intervalo, entonces x estimara puntualmente a
sin error alguno,

|---------------------------|----------------|---------------------------|
error
x z / 2
x z / 2

Pero generalmente x no ser exactamente igual a y entonces se comete un


error, E=| x -|, que como mximo ser:
E= z / 2

Entonces si queremos determinar el tamao de muestra necesario para obtener


un intervalo de confianza para la media poblacional , admitiendo un error E,
tendremos que despejando de la expresin anterior:

n z2 / 2

2
E2

z2 / 2 p q z2 / 2 p q
Igualmente se tendra para una proporcin: n=4
=
L2
E2

You might also like