Professional Documents
Culture Documents
La distribución continua de probabilidad más importante, por la frecuencia con que se encuentra y por sus
aplicaciones teóricas, es la distribución normal, gaussiana o de Laplace-Gauss. Fue descubierta y publicada
por primera vez en 1733 por De Moivre. A la misma llegaron, de forma independiente, Laplace (1812) y Gauss
(1809), en relación con la teoría de los errores de observación astronómica y física
En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables
asociadas a fenómenos naturales que siguen el modelo de la normal.
Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie: Tallas, pesos,
envergaduras, diámetros, perímetros…
Caracteres fisiológicos: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.
Caracteres sociológicos: consumo de cierto producto por un mismo grupo de individuos, puntuaciones
de examen.
Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio……
Otras distribuciones como la binomial o la de Poisson son aproximaciones normales…
Se dice que una variable aleatoria X sigue una distribución normal de parámetros μ y σ, lo que representamos
del modo X → N(μ ,σ) si su función de densidad es:
1 𝑥−𝜇 2
1 − ( )
𝑓(𝑥 ) = 𝑒 2 𝜎 , ∀𝑥 ∈ ℝ …………………(1)
𝜎√2𝜋
La forma de la función de densidad es la llamada campana de Gauss.
La distribución normal estándar tiene una media de cero y desviación estándar de uno, Se obtiene a partir
de la ecuación (1), haciendo =0, =1 y (x - )/ = z, donde z es una variable aleatoria con distribución
normal. Luego:
𝑧2
−
1 𝑒 2
𝑦= , - z
√2𝜋
EJERCICIOS DE APLICACIÓN
Solución:
Interpretación:
Ejemplo 2: Si de la población de posibles valores de z, se elige uno al azar, ¿cuál es la probabilidad de que se
encuentre entre 0,73 y 1,42?
Solución:
Interpretación:
Solución:
Interpretación:
Solución:
Interpretación:
Solución:
Interpretación:
Solución:
Interpretación:
Ejemplo 1: en la construcción de un condominio se está evaluando las instalaciones eléctricas y para esto se
verifica el voltaje necesario. Supóngase que el voltaje medido en un circuito eléctrico tiene Distribución
Normal con media de 110 voltios y desviación estándar 1,5 voltios.
Solución:
Interpretación:
Interpretación:
Ejemplo 2: El tiempo que se tardan los encuestados en diligenciar un formulario es de 20 minutos con una
varianza de 16 minutos cuadrados; se asume que el tiempo sigue una distribución Normal; se pide:
Solución:
Interpretación:
Solución:
Interpretación:
Ejemplo 3: Una máquina que expende bebidas en vasos esta calibrada de modo que descarga el producto
con un promedio de 250 mililitros por vaso. Si la cantidad de líquido está distribuida normalmente con una
desviación estándar de 14 mililitros.
c) ¿Bajo qué valor estará el 30% de los vasos con menos contenido?
Solución:
EJERCICIOS PROPUESTOS
1. Calcular el área de
a) P(1,32<z<2,95) d) P(-1,75<z<1,13) g) P(-0,31<z) j) P(1,15<z<2,82)
b) P(-0,97<z<-0,13) e) P(z>2,06) h) P(-2,17<z<-1,48)
c) P(-2,34<z) f) P(z>-1,25) i) P(z>0,85)
2. Una lata se debe llenar con un litro de producto. Un estudio en 36 latas proporciona una media de 0.98
litros con una desviación estándar de 0.1 litros.
a) La probabilidad de que una lata se llene con menos de 1.1 litros es:
b) La probabilidad de que la lata se llene con menos de 0.96 litros es:
c) La probabilidad de que se llene con más 1.1 litros es:
3. En una ciudad se estima que la temperatura máxima en el mes de junio sigue una distribución normal,
con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar
máximas entre 21° y 27°.
4. Una compañía de suministro de electricidad ha determinado que el consumo medio en kw/h, de una
vivienda familiar durante un mes, sigue una distribución normal de media 300 y desviación típica de 50.
a) Calcula la probabilidad de que una familia consuma más de 245kw/h en un mes
b) Calcula la probabilidad de que una familia consuma entre 200 y 300 kw/h en un mes
c) Qué porcentaje de viviendas consumirá más de 300kw/h
d) Qué porcentaje de viviendas consumirá menos de 250kw/h
5. La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3 kg. Suponiendo
que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan:
a) Entre 65 kg y 75 kg.
b) Más de 79 kg.
6. Entre los diabéticos, el nivel de glucosa en sangre X, en ayunas, puede suponerse de distribución
aproximadamente normal, con media 106 mg/100 ml y desviación típica 8 mg/100 ml.
a) Hallar p[X ≤120]
b) ¿Qué porcentaje de diabéticos tienen niveles comprendidos entre 90 y 120?
c) Hallar p[106 ≤ X ≤110].
d) Hallar p[X ≤121].
7. Los montos de dinero que se piden en las solicitudes de préstamos en una agencia bancaria tiene una
distribución normal, una media de $70,000 y una desviación estándar de $20,000. Esta mañana se
recibió una solicitud de préstamo. ¿Cuál es la probabilidad de que: El monto solicitado sea de $80,000 o
superior?
Población.- Conjunto de todas las personas u objetos de los que se desea conocer un determinado
fenómeno o aspecto de una realidad
Muestra.- parte de la población con la que se realiza la investigación o el estudio.
Individuo.- cada uno de los elementos que componen la muestra y de los que se obtiene la información.
Estos elementos pueden ser objetos, acontecimientos o personas.
Generalización.- la posibilidad de aplicar los resultados o conclusiones de los elementos de la muestra a
toda la población de donde se ha obtenido también conocido como inferencia.
Marco muestral.- es la lista de las unidades de muestreo.
Error aleatorio o de muestreo.- es la diferencia que existe entre los resultados obtenidos en la muestra
y los resultados que deberían haber sido obtenidos si toda la población hubiese sido estudiada.
Intervalo de confianza.- cuando se obtiene la información de una muestra, para poder conocer la de una
población, hay implícita una pérdida de precisión. Por este motivo cualquier característica de una
población, a partir de una muestra, lleva asociada una determinada precisión definida por el intervalo de
confianza, el hecho de trabajar con muestras no es el ideal, sino más bien un condicionante. Por lo
general, no se trabaja con las poblaciones por el costo de tiempo, de dinero y por la dificultad de acceso
a cada uno de los individuos.
EL MUESTREO
El objetivo del muestreo es seleccionar una muestra que sea “representativa” de la población. Se debe decidir
el método de selección adecuado, el tamaño correcto de la muestra y las técnicas de estimación de las
características de la población.
TIPOS DE MUESTREO
los tipos de muestreo son un conjunto de técnicas para seleccionar los individuos de una población que
formarán parte de la muestra. Estas técnicas se dividen en dos grandes grupos
3. La muestra estará formada por las 120 clientes a las que correspondan los números obtenidos.
Muestreo aleatorio sistemático.- En el universo (N) se elige el primer elemento al azar. Luego los demás
se escogen cada cierto intervalo (k), hasta completar el tamaño muestral (n). El tamaño del intervalo (k)
se calcula así: k = N/n
EJEMPLO: Una constructora tiene una cartera de 3 000 clientes. Se quiere extraer una muestra de 120.
Explica cómo se obtiene la muestra mediante un muestreo sistemático.
1. Coeficiente de elevación: k = N/n , K =3000/120 = 25
2. Se sortea un número del 1 al 25 para ser considerado como el arranque o comienzo
3. Los clientes seleccionadas para la muestra serían las que correspondieran a los números :
el encontrada en la tabla de números aleatorios más el coeficiente de elevación
Muestreo aleatorio estratificado.- Considera que al interior del universo existen estratos (subgrupos
internamente homogéneos pero cualitativa y cuantitativamente diferentes entre sí), y que no se cumple
la condición de selección aleatoria pues los miembros del grupo mayoritario tienen una mayor
probabilidad de ser seleccionados en la muestra.
EJEMPLO: Una tienda de accesorios electricos tiene 2 000 clientes. Son de distintos estratos sociales: 853
de A, 512 de B, 321 de C, 204 de D y 110 de E. Queremos extraer una muestra de 120:
a) ¿Cuántas hay que elegir de cada Estrato social para que el muestreo sea estratificado con reparto
proporcional?
Muestreo aleatorio por conglomerados.- Los conglomerados deben estar muy bien definidos de modo
que cada elemento pertenezca a uno y solo a un conglomerado. El tamaño de cada conglomerado debe
ser bien conocido (por lo menos bien estimado). El número de conglomerados debe ser pequeño.
EJEMPLO: Suponga que una empresa desea conocer el consumo promedio anual por familia en una
ciudad. Si se dispone de una lista de las familias en la ciudad es posible seleccionar al azar las muestras
de familias. Sin embargo, aún cuando exista la lista de familias, es más barato hacer la selección de
cuadras en la ciudad y en esa muestra de cuadras (conglomerados) se entrevistarán todas las familias
pertenecientes a cada conglomerado.
Muestreo aleatorio Multi Etápico.- Selecciona los individuos por etapas, configurando sucesivamente
grupos (estratos o conglomerados) y subgrupos denominados Unidades de Muestreo primarias,
secundarias, terciarias...etc..
MUESTRAS NO ALEATORIAS
Consiste en elegir aquellos elementos que mejor se adaptan a las conveniencias del investigador, como las
personas que de modo voluntario están dispuestas a contestar o que están más al alcance del investigador
Son útiles en situaciones en las que se exige un bajo control o cuando no es posible realizar una selección
aleatoria.
No permiten hacer inferencias estadísticas para la población de la cual fueron seleccionadas.
Muestreo Sin norma, circunstancial o errático.- es probablemente la técnica de muestreo más común.
Las muestras son seleccionadas porque son accesibles para el investigador. Los sujetos son elegidos
simplemente porque son fáciles de reclutar. Esta técnica es considerada la más fácil, la más barata y la
que menos tiempo lleva.
Muestreo de voluntarios.- De voluntarios (“muestreo realmente terrible”). Donde el informante,
voluntariamente, suministra información sin ser seleccionado.
Muestreo por Selección experta o de juicio (intencional u opinático).- La muestra se elige sobre la base
de conocimientos que el investigador tenga de la población, sus elementos y la naturaleza de los
objetivos de la investigación. Aplica bien para estudios de pre-prueba o prueba piloto para un
instrumento.
Muestreo por cuotas.- En este caso el investigador asegura una representación equitativa y
proporcionada de los sujetos, en función de qué rasgo es considerado base de la cuota.
Muestreo por bola de nieve.- Se lleva a cabo generalmente cuando hay una población muy pequeña. En
este tipo de muestreo, el investigador le pide al primer sujeto que identifique a otro sujeto potencial que
también cumpla con los criterios de la investigación. La desventaja de usar una muestra de bola de nieve
es que difícilmente sea representativa de la población.
TAREA :
1. Para estimar la media de una cierta variable se ha dividido los datos de la variable en 4 estratos. Cada
uno de estos estratos contiene el número de elementos que se indica:
Estrato 1 Estrato 2 Estrato 3 Estrato 4
Tamaño del estrato 110 512 653 221
a) Si se desea extraer una muestra que globalmente contenga 150 elementos, Cuantos elementos han
de seleccionarse de cada estrato.
2. Indica si los siguientes métodos de obtención de una muestra son adecuados o no razona tu respuesta:
a) Para hacer un estudio sobre las actividades de ocio preferidas por los habitantes de una
determinada localidad, encuestamos a 200 estudiantes elegidos al azar a la salida del instituto.
b) Para ver el nivel de estudios de los vecinos de una localidad, se escogen al azar 300 números de
teléfono de la guía, se hacen las llamadas y se obtienen así una muestra de aproximadamente 300
datos.
3. Estamos interesados en realizar un estudio sobre los deportes practicados por los alumnos de un
determinado Instituto. ¿Es adecuado la elección de la muestra en cada caso? ¿Por qué?
a) En el instituto hay matriculados 495 alumnos de 3 semestre, 465 de 4 semestre, 285 de 1 semestre
y 255 de 2 semestre. Queremos seleccionar una muestra en la que estén representados los cuatro
semestres. Por ello, elegimos al azar a 50 alumnos de cada uno de los cuatro niveles
b) De los 1500 alumnos del instituto elegimos al azar a cinco de ellos.
4. En un club de tenis, los 500 socios se reparten por edades en cuatro categorías: la 1a con 200 socios, la
2a con 175, la 3a con 75 y la 4a con 50. Se quiere seleccionar una muestra de 40 socios.
a) ¿Qué tipo de muestreo deberíamos realizar si queremos que estén representadas todas las edades?
b) ¿Cuántos individuos elegiríamos de cada categoría, si atendiéramos a razones de proporcionalidad?
5. En un barrio hay 400 habitantes, distribuidos en cuatro urbanizaciones: el 12% viven en A, el 20% en B,
el 36% en C y el 32% en D. Para confeccionar una muestra de 50 habitantes mediante muestreo aleatorio
estratificado proporcional ¿cuántas personas hay que seleccionar de cada una de las cuatro
urbanizaciones?
6. En una localidad de 4 000 habitantes se quiere construir un centro de esparcimiento. Los habitantes se
distribuyen por edades como sigue: 900 niños, 1 050 jóvenes, 1 200 adultos y 850 ancianos. Para
averiguar qué tipo de actividades les gustaría que hubiera en dicho centro, se selecciona una muestra de
160 personas para ser encuestadas.
a) Explica cómo se obtendría la muestra mediante un muestreo sistemático (sin tener en cuenta los
grupos por edades).