Professional Documents
Culture Documents
ANTOLOGÍA
ESTADÍSTICA Y PROBABILIDAD II
AUTOR:
Definiciones:
Variable aleatoria: Una variable aleatoria es una descripción numérica del resultado de un
experimento. Su valor numérico depende del resultado del experimento. Se puede
clasificar como discreta o continua, dependiendo de los valores numéricos que asume.
Variable aleatoria discreta: Es una variable aleatoria que puede asumir una cantidad finita
de valores o una sucesión infinita de valores como 0,1,2,3....n.
Ejemplo: Un experimento que consta de contar la cantidad de vehículos que pasan por
una caseta de cobro de una autopista. La variable aleatoria discreta de interés se
determina como x = cantidad de vehículos que pasan por la caseta de cobro en un día y
sus valores serían: x = {0,1,2,3,4,5....n}.
Variable aleatoria continua: Es una variable aleatoria que puede asumir cualquier valor en
un intervalo o conjunto de intervalos. Los resultados experimentales que se basan en
escalas de medición como el tiempo, el peso, la distancia y la temperatura se pueden
describir mediante variables aleatorias continuas
Representación Gráfica:
f(x)
0123456 x
2
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
1. f(x) ≥ 0
2.- Σf(x) = 1
Donde:
n = Cantidad de valores que puede asumir la variable aleatoria
Ejercicios:
1.- La tabla siguiente es una distribución de probabilidad de la variable aleatoria x.
X f(x)
2 0.20
4 0.30
7 0.40
8 0.10
Total 1.00
a) Calcule µ
b) Calcule σ2, σ y dibuje la forma de la distribución de proabilidad.
2.- Una encuesta muestra que la cantidad promedio de TV’s por familia en E.U. es de 2.3.
Suponga que la distribución de probabilidad de la cantidad de TV’s por familia es la que
se muestra en la tabla siguiente.
X f(x)
0 0.01
1 0.23
2 0.41
3 0.20
4 0.10
5 0.05
a) Calcule el valor esperado de la cantidad de TV’s por familia y compárelo con el
dato que proporciona la encuesta realizada.
b) ¿Cuál es la varianza y la desviación estándar de la cantidad de TV’s por familia?
c) Grafique la distribución de probabilidad
3
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
DISTRIBUCIÓN BINOMIAL.
n!
f(x) = px (1 – p)(n– x)
x! (n x)!
Ejercicios:
1.- Se tiene un experimento binomial con n = 10 y p = 0.10.
a) Determine f(0)
b) Determine f(2)
c) Determine f(5)
d) Determine E(x)
e) Determine Var (x) y σ.
4
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
3.- Cuando una máquina nueva funciona bien solo 3% de los artículos que produce tienen
defectos. Suponga que se seleccionan al azar dos partes producidas en la máquina y que
interesa la cantidad de partes defectuosas encontradas.
a). Describa las condiciones bajo las cuales este caso sería un experimento binomial.
b). Trace un diagrama de árbol, que muestre el experimento binomial.
c). ¿Cuántos de los resultados experimentales consisten en encontrar exactamente un
defecto?
d). Calcule las probabilidades asociadas con encontrar defectos, encontrar exactamente
un defecto y dos defectos.
DISTRIBUCIÓN DE POISSON.
Definición:
La probabilidad de que el suceso ocurra x veces, durante un intervalo está dada por:
P(x) = µx . e-µ
x!
Donde:
e = 2.71828
5
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
3.- El promedio anual de las veces que los suscriptores de la revista Barron’s toman
vuelos locales por motivos personales es 4.
a) ¿Cuál es la probabilidad de que un suscriptor tome 2 vuelos locales en un año por
motivos personales?
b) ¿Cuál es la cantidad promedio de vuelos locales por motivos personales en un
trimestre?
c) ¿Cuál es la probabilidad de que un suscriptor tome uno a más vuelos locales, por
motivos personales durante un semestre?
6
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
a b
Una distribución de probabilidad de x en una función f(x) tal que para que cualesquiera
dos números a y b siendo a ≤ b:
b
P(a ≤ x ≤ b) =
a
f ( x ) dx
Esto es la probabilidad de que x tome un valor en el intervalo [a, b], es el área bajo la
gráfica de la función de densidad.
7
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
1/120
1
f(x) = cuando a ≤ x ≤ b
ba
0 en cualquier otro lugar
ab
E(x) =
2
8
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
(b 2) 2
Var(x) =
12
Desviación estándar: Raíz cuadrada de la varianza (σ)
Ejercicios:
1.- Se sabe que la variable aleatoria x está uniformemente distribuida entre 1.0 y 1.5.
a). Trace la gráfica de la función de densidad de probabilidad
b). Determine P(x = 1.25)
c). Determine P(1.0 ≤ x ≤ 1.25)
d). Determine P(1.20 ≤ x ≤ 1.5)
e) Determine E(x)
f) Determine Var(x)
2.- Se sabe que la variable aleatoria x está uniformemente distribuida entre 10 y 20.
a) Trace la gráfica de la función de densidad de probabilidad.
b) Determine P(x < 15)
c) Determine P(12 ≤ x ≤ 18)
d) Determine E(x)
e) Determine Var(x)
3. La mayoría de los lenguajes de cómputo tienen una función para generar números
aleatorios. En Excel de Microsoft, se usa la función ALEATORIO para generar números
aleatorios entre 0 y 1. si x representa el número aleatorio generado, debe ser una variable
continua con la siguiente función de densidad de probabilidad:
1 cuando 0 ≤ x ≤ 1
f(x) = 0 en cualquier otro lugar
9
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
DISTRIBUCIÓN NORMAL.
µ
Características:
1.- La curva tiene un solo pico, por lo consiguiente es unimodal y presenta forma de
campana
2.- La media de una población distribuida normalmente se encuentra en el centro de su
curva normal
3.- A causa de su simetría la mediana, la media y la moda se hallan en el centro y poseen
el mismo valor
4.- Las dos colas (extremos) de la curva se extienden de manera indefinida y nunca tocan
el eje horizontal
5.- Para definir una distribución normal de probabilidad se necesitan dos parámetros: la
media poblacional y la desviación estándar poblacional
6.- La desviación estándar poblacional determina el ancho de la curva
7.- El área total bajo la curva es igual a 1
8.- Las probabilidades de la variable aleatoria normal se determinan con las áreas bajo la
curva, el área bajo la curva entre dos ordenadas x = a y x = b donde a < b representa la
probabilidad de que x se encuentre entre a y b y se denota por:
P(a < x < b) ó P(a ≤ x ≤ b)
9.- Utiliza el estadístico z
Se dice que una variable aleatoria que tiene distribución normal con µ = 0 y σ = 1 tiene
una distribución normal estándar de probabilidad. Se usa la letra z para indicar esta
variable aleatoria normal.
σ=1
µ=0 z
10
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
La fórmula que se usa para pasar de cualquier variable aleatoria normal x con µ y σ a la
distribución normal estándar es la siguiente:
z=x- µ
σ
Donde:
z = Número de desviaciones estándar a partir de la media
x = Algunos valores de interés
µ = Media de la población
σ = Desviación estándar de la población
Ejemplos:
I.- Determinar la probabilidad en cada caso:
1).- P(z < -0.25)
2.- P(z < -2.75)
3.- P(z < 0.25)
4.- P(z < 2.75)
5.- P(z > 2.33)
6.- P(z > 1.96)
7.- P(z > -2.33)
8.- P(0.5 < z < 1.50)
9.- P(1.5 < z < 2.50)
10.- Entre -2 y -1
11.- Entre 2 y 2.34
12.- Entre -1 y 2
11
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
1.-
49.77%
0 z
2.-
36.65%
-z 0
3.- 0.9882
-z 0 z
12
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
4.-
0.9920
-z 0 z
-z 0 z
Problemas:
1.- El tiempo promedio que emplea un suscriptor del periódico la Jornada en leer esa
publicación es de 49 minutos. Suponga que la σ = 16 minutos y que los tiempos de lectura
tienen distribución normal.
a) ¿Cuál es la probabilidad de que un suscriptor tarde cuando menos 1 hora en leer el
periódico?
b) ¿Cuál es la probabilidad de que un suscriptor no tarde más de 30 minutos en leerlo?
2.- Durante los últimos años ha crecido el volumen de acciones negociadas en la Bolsa de
Nueva York. Durante las 2 primeras semanas de enero de 2005, el volumen diario
promedio fue de 646 millones de acciones. La distribución de probabilidad del volumen
diario es aproximadamente normal con σ = 100 millones de acciones.
a) ¿Cuál es la probabilidad de que el volumen negociado sea menor de 400 millones de
acciones?
b) ¿Qué porcentaje de las veces el volumen negociado es mayor de 800 millones de
acciones?
13
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
3.- Los choferes miembros del sindicato de traileros ganan un salario promedio de $17.15
dólares por hora. Suponga que los datos disponibles indican que los sueldos se
distribuyen normalmente con σ = $2.25 dólares,
a) ¿Cuál es la probabilidad de que los salarios estén entre $15.00 y $20.00 dólares por
hora?
b) ¿Cuál es la probabilidad de que los sueldos sean menores de $12.00 dólares por hora?
c) Si el Sindicato está integrado por 500 choferes, ¿cuántos ganan más de $18 dólares
por hora?
4.- La edad promedio que tiene una persona al casarse por primera vez es de 26 años.
Suponga que las edades en el primer casamiento tienen una distribución normal y una
σ = 4 años.
a) ¿Cuál es la probabilidad de que una persona que se casa por primera vez tenga menos
de 23 años de edad?
b) ¿Cuál es la probabilidad de que una persona que se casa por primera vez tenga entre
20 y 30 años de edad?
c) El 80% de las personas que se casan por primera vez, ¿a qué edad lo hacen?
DISTRIBUCIÓN EXPONENCIAL.
La distribución de probabilidad exponencial es una distribución de probabilidad continua
que se utiliza para describir el tiempo necesario para terminar una tarea.
La variable aleatoria exponencial puede utilizarse para describir el tiempo entre llegadas a
un lavado de automóviles, el tiempo requerido para cargar un camión, la distancia entre
defectos de importancia que aparecen en una autopista.
El área bajo la curva que corresponde a cierto intervalo equivale a la probabilidad de que
la variable aleatoria asuma un valor en ese intervalo.
Para calcular probabilidades exponenciales, la siguiente fórmula da la probabilidad de
obtener un valor para la variable aleatoria exponencial que sea menor o igual a cierto
valor específico de x, identificado como x0:
P (x ≤ x0) = 1 - e-x0 /µ
14
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejemplos:
1.- Suponga que el tiempo en que se tarda en cargar un camión en el muelle de Veracruz
sigue una distribución exponencial. Si la media del tiempo o tiempo promedio para
cargarlo es de 15 minutos.
a) Determine la probabilidad de que la carga de un camión dure 6 minutos o menos.
b) Determine la probabilidad de que la carga de un camión dure 18 minutos o menos.
c) Determine la probabilidad de que la carga de un camión dure 6 a 18 minutos.
3.- El tiempo entre llegadas de vehículos a determinado crucero sigue una distribución
exponencial de probabilidad con una media de 12 segundos.
a) ¿Cuál es la probabilidad de que el tiempo entre las llegadas de 2 vehículos sea de 12
segundos o menos?
b) ¿Cuál es la probabilidad de que ese tiempo sea de 6 segundos o menos?
c) ¿Cuál es la probabilidad de que haya 30 segundos o más entre las llegadas de
vehículos?
5.- La vida promedio de un a TV es de 12 años, la vida útil de estos productos sigue una
distribución exponencial de probabilidad.
a) ¿Cuál es la probabilidad de que la vida útil sea de 6 años o menos?
b) ¿Cuál es la probabilidad de que la vida útil sea de 15 años o más?
c) ¿Cuál es la probabilidad de que la vida útil sea entre 5 y 10 años?
15
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
DISTRIBUCIÓN t.
t1 0 t2
Ejercicios:
16
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
¿?
¿?
95%
0
- t = ¿? t = ¿?
b).- n = 31
¿?
¿?
98%
0
- t = ¿? t = ¿?
c).- n = ¿?
¿?
¿?
¿?%
0
- t = -1.3250 t = 1.3250
17
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
para 0 ≤ x ≤ r
Donde:
f(x) = Probabilidad de x éxitos en n intentos
n = Número de intentos
N = Número de elementos de la población
r = Número de elementos identificados como éxitos en la población.
Ejercicios:
1. Se deben seleccionar dos miembros de comité, entre cinco, que asistan a una
convención en Las Vegas. Suponga que el comité de cinco miembros está formado por
tres mujeres y dos hombres. Determine la probabilidad de seleccionar que sean dos
mujeres.
18
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
2. Del problema anterior, suponga que después nos enteramos de que los que harán el
viaje serán tres personas del comité, determine la probabilidad de que exactamente dos
de los tres miembros sean mujeres.
3. Una población consiste en 10 artículos, cuatro de los cuales son defectuosos y los seis
restantes son no defectuosos, ¿cuál es la probabilidad de que una muestra aleatoria de
tamaño tres contenga dos artículos defectuosos?
Definiciones:
19
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Muestra Aleatoria: Los miembros de una población se seleccionan de manera que cada
miembro individual tiene la misma posibilidad de ser elegido.
Se pueden usar varios métodos para seleccionar una muestra a partir de una población,
uno de los más comunes es el muestreo aleatorio simple. La definición de este método y
el proceso de seleccionar una muestra aleatoria simple depende de si la población es
finita o infinita.
Muestra Aleatoria Simple (población finita): Una muestra aleatoria simple de tamaño n, de
una población finita de tamaño N, es una muestra seleccionada de tal manera que cada
muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada.
Un procedimiento para identificar una muestra aleatoria simple a partir de una población
finita es seleccionar uno por uno los elementos que constituyen a la muestra, de tal modo
que cada uno de los elementos que aún queden en la población tengan la misma
probabilidad de ser seleccionados. Al muestrear n elementos en esa forma, se satisfará la
definición de una muestra aleatoria simple de una población finita.
Muestreo sin reemplazo: Una vez incluido en la muestra un elemento de la población sale
de ésta y ya no se puede seleccionar por segunda vez.
20
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- Suponga que una población tiene 350 elementos. Con los tres últimos dígitos de los
siguientes números aleatorios de cinco dígitos, determine las cuatro primeras unidades
que se seleccionarán para la muestra aleatoria simple.
98601 73022 83448 02147 34229 27553 84147 93289 14209
Suponga que se debe seleccionar una muestra aleatoria de 5 de ellas, para un estudio de
detalle de factores, por ejemplo: la cantidad de aviones en servicio, el total anual de
pasajeros-milla volados, etc. Comenzando con el primer dígito aleatorio de la Tabla de
Números Aleatorios y avanzando hacia abajo de la columna, use los números aleatorios
de un dígito para seleccionar una muestra aleatoria simple de 5 aerolíneas que entrarán
en el estudio.
3.- El libro County and City Data Book, publicado por la Oficina del Censo en E.U., publica
información acerca de 3139 condados en ese país. Suponga que un estudio nacional
debe reunir datos de 30 condados seleccionados al azar. Use números aleatorios de la
última columna de la tabla (de los números aleatorios) para identificar los números que
corresponden a los cinco primeros condados seleccionados para la muestra. No tome en
cuenta los primeros dígitos.
5.- Una empresa multinacional tiene 2520 empleados, por requerimientos del sistema de
calidad necesita aplicar una encuesta a 25 de sus empleados. Utilice los primeros cuatro
dígitos de cada número aleatorio, empezando por la séptima columna y desplácese a la
izquierda para obtener la muestra solicitada.
21
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
1.- Duke 6.- Stanford 11.- Princeton 16.- Michigan 21.- West
Virginia
2.- North 7.- Kentucky 12.- Iowa 17.- South 22.- Rhode
Carolina Carolina Island
3.- Kansas 8.- 13.- New 18.- Xavier 23.- Clemson
Connecticut México
4.- UTA 9.- Purdue 14.- Mississippi 19.- Arkansas 24.- Hawai
5.- Arizona 10.- UCLA 15.- Syracuse 20.- Florida State 25.- Cincinnati
Población
22
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- La población de estudiantes de la carrera de Ingeniería Civil de una Universidad
pública (en todos los semestres) es de 400. Suponga que se requiere obtener una
muestra de 50 estudiantes para aplicarles una encuesta sobre desempeño de docentes.
Utilizar para obtener la muestra, el muestreo estratificado. A continuación se muestran los
datos.
Estrato Número de
alumnos
1er. Semestre 40
2º. Semestre 40
3er. Semestre 40
4º. Semestre 45
5º. Semestre 75
6º. Semestre 35
7º. Semestre 40
8º. Semestre 30
9º. Semestre 30
Semiescolarizado 25
Total de Alumnos 400
2.- En una empresa se requiere aplicar una encuesta sobre el clima organizacional que
forma parte de la búsqueda de la calidad en la empresa, por lo que se requiere encuestar
a 60 empleados, utilice el muestreo estratificado e indique cuantos empleados de cada
departamento de la empresa deben ser encuestados.
Departamento Empleados
Finanzas 25
Administración 45
Contabilidad 10
Mercadotecnia 15
Producción 68
Almacén 6
Distribución 11
Compras 8
Ventas 20
Servicios al cliente 7
Total de empleados 215
23
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
3.- Una empresa multinivel tiene 12 grupos de personas distribuidas en una determinada
área geográfica, el Comité Directivo lo ha contratado a usted como experto en muestreo
estadístico para que determine una muestra de 125 empleados a los cuales se les
aplicará una encuesta de satisfacción en el trabajo,
a). Utilice muestreo aleatorio estratificado para determinar a cuantos empleados por grupo
se tienen que encuestar.
b). Utilice el muestreo aleatorio simple para determinar específicamente a qué empleados
se deberá encuestar
Grupo Integrantes
1 80
2 50
3 35
4 60
5 25
6 40
7 65
8 32
9 35
10 42
11 55
12 51
24
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
DISTRIBUCIONES MUESTRALES.
_
Los diversos valores posibles de x son el resultado de distintas muestras aleatorias
_ _
simples, a la distribución de x se le llama distribución muestral de x, el conocimiento de
esta distribución muestral y de sus propiedades permitirá hacer afirmaciones
probabilísticas acerca de lo cercano que se encuentre la media de la muestra de la media
de la población.
_ _
Como en el caso de x, tanto s como p son variables aleatorias que proporcionan
descripciones numéricas del resultado de una muestra aleatoria simple. Si se
seleccionara toda muestra posible de cierto tamaño de una población y se calcula el valor
de s y el de la proporción muestral de cada muestra, las distribuciones resultantes de
probabilidad se llamarían distribución muestral de s y distribución muestral de la
proporción muestral respectivamente.
_
DISTRIBUCIÓN MUESTRAL DE x.
Uno de los procedimientos estadísticos más comunes es usar la media de la muestra para
hacer inferencias acerca de una media de la población. En cada repetición del proceso se
puede anticipar la obtención de un valor distinto de la media de la muestra. La distribución
de probabilidades de todos los valores posibles de la media de la muestra se llama
distribución muestral de la media de la muestra.
_
El conocimiento de la distribución muestral de x permitirá hacer afirmaciones
probabilísticas acerca del error incurrido cuando se usa la media muestral para estima la
media poblacional.
_
VALOR ESPERADO DE x.
_
E(x)=µ
Donde:
_ _
E ( x ) = Valor esperado de la variable aleatoria x
µ = Media de la población
_
DESVIACIÓN ESTÁNDAR DE x.
Notación:
__ _
σx = Desviación estándar de la distribución muestral de x
σ = Desviación estándar de la población
n = Tamaño de la muestra
N = Tamaño de la población
_
25
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Fórmulas:
Población finita:
N n
σx = Ecuación 1
N 1 n
N n
El factor se llama factor de corrección para la población finita.
N 1
Población infinita:
σx = Ecuación 2
n
El valor de σx es útil para determinar lo alejado que pueda estar la media de la muestra
de la media de la población, a σx se le conoce como Error Estándar de la Media.
Ejemplos:
1.- Una población tiene µ = 200 y σ = 50, se tomará una muestra aleatoria simple de
tamaño 100 y se usará la media muestral para estimar la media poblacional.
a) ¿Cuál es el valor esperado de la media muestral?
b) ¿Cuál es la desviación estándar de la media poblacional (σx)?
2.- Una muestra aleatoria simple de tamaño 50 se selecciona de una población con
σ = 10. Calcule el valor del error estándar de la media en cada uno de los casos
siguientes:
a) El tamaño de la población es infinito
b) El tamaño de la población es N = 50,000
c) El tamaño de la población es N = 5,000
d) El tamaño de la población es N = 500
26
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
ESTADÍSTICO z.
_
z=x-µ
σx
Donde:
z = Estadístico z
_
x = Media de la muestra
µ = Media de la población
_
σx = Desviación estándar de la distribución muestral de x
27
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- El precio de la media por galón de gasolina regular vendida en E.U. es de $1.20
dólares. Suponga que el precio de la media de la población es µ = $1.20 dólares por galón
y que la σ = 0.10 de dólar. También suponga que se selecciona una muestra aleatoria de
50 gasolineras y que se calcula un precio de la media de la muestra con los datos
reunidos en esas gasolineras. _
a) Muestre la distribución de muestreo de la x para las 50 gasolineras
b) ¿Cuál es la probabilidad de que la muestra aleatoria simple produzca una media
de la muestra a ± $0.02 dólares de la µ? _
c) ¿Cuál es la probabilidad de que la muestra aleatoria simple produzca una x
a ± $0.01 dólares de la µ?
Una población tiene 100 de media con 16 de desviación estándar, ¿cuál es la probabilidad
de que una media de muestra quede a ± 2 de la media poblacional en cada uno de los
siguientes tamaños muestrales?
a) n = 50
b) n = 100
c) n = 200
d) n = 400
e) ¿Cuál es la ventaja de un tamaño grande de muestra?
_
DISTRIBUCIÓN MUESTRAL DE p.
_
Se utiliza la proporción muestral p para hacer inferencias estadísticas sobre la proporción
poblacional p.
En cada proceso se obtendrá un valor distinto de la proporción de una muestra. La
distribución de probabilidades de todos los valores posibles de esa proporción se llama
distribución de la proporción muestral.
Para determinar lo cercano que está la proporción muestral de proporción poblacional es
necesario comprender las propiedades de las distribuciones muestral de la proporción
muestral.
Valor esperado
_
E(p)=p
Donde:
_ _
E ( p ) = Valor esperado de la variable aleatoria p
p = Proporción poblacional
_
28
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Desviación estándar de p.
_
La desviación estándar de p, se llama error estándar de la proporción.
_
La desviación estándar de p depende de si la población es finita o infinita.
Fórmulas:
Población Finita:
N n p(1 p)
σp = .
N 1 n
Población Infinita:
p(1 p)
σp =
n
Se utiliza si n ≤ 0.05
N
_
Forma de distribución Muestral de p.
_
Al aplicar el Teorema del Límite Central a p se obtiene:
_
a).- La distribución muestral de p se puede aproximar con una distribución normal de
probabilidades, siempre que el tamaño de la muestra sea grande.
_
b).- Para p se considera que el tamaño de muestra es grande cuando se cumplen las dos
condiciones siguientes:
1.- n . p ≥ 5
2.- n ( 1 – p) ≥ 5
_
Estadístico de p.
_
z =p-p
σP
Error de muestreo.
_
Error de muestreo = / p – p /
29
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- La proporción de una población es de 0.40, se tomará una muestra aleatoria simple de
tamaño 200 y se usará la proporción muestral de la muestra para estimar la de la
población.
a).- ¿Cuál es la probabilidad de que la proporción muestral esté a ± 0.03 de la proporción
poblacional?
b) ¿Cuál es la probabilidad de que la proporción muestral esté a ± 0.05 de la proporción
poblacional?
30
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
ESTIMACIÓN PUNTUAL
Definiciones:
Estimador: Valor numérico único que se usa como estimado de un parámetro poblacional.
Estimador: Estadístico de muestra como x, s y p, que produce un estimado puntual del
parámetro poblacional.
Estimación: Hacer inferencia del comportamiento de una muestra, respecto a una
población.
x µ
s σ
p p
s2 σ2
INTERVALOS DE CONFIANZA
Definición.
Un intervalo de confianza es una gama (o un intervalo) de valores que se usan para
estimar el valor real de un parámetro de población.
Un intervalo de confianza se asocia con un nivel de confianza, como 0.95 (o 95%). El nivel
de confianza nos da la tasa de sucesos del procedimiento que se utiliza para construir el
intervalo de confianza. El nivel de confianza suele expresarse como la probabilidad o área
1 - α (alfa griega minúscula). El valor de α es el complemento del nivel de confianza. Para
un nivel de confianza de 0.95 (o 95%) , α = 0.05. Para un nivel de confianza de 0.99 (o
99%), α = 0.01.
Definición.
El nivel de confianza es la probabilidad 1 – α (a veces se expresa como el valor de
porcentaje equivalente), que es la proporción de veces que el intervalo de confianza
realmente contiene el parámetro de población, suponiendo que el proceso de estimación
se repite un gran número de veces. El nivel de confianza también se conoce como grado
de confianza o coeficiente de confianza.
31
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- Calcular el valor de zα /2 para los siguientes niveles de confianza:
1. 91% 2. 92.5% 3. 90.5% 4. 93% 5. 94%
6. 98% 7. 99.5% 8. 97% 9. 95.6% 10. 96.3%
2.- Una muestra aleatoria simple de 50 artículos originó una media de la muestra de 32 y
una desviación estándar de 6.
a) Determine un intervalo de confianza de 90% para la media de la población.
b) Determine un intervalo de confianza de 95% para la media de la población.
c) Determine un intervalo de confianza de 99% para la media de la población.
d) Determine un intervalo de confianza de 90.8% para la media de la población.
e) Determine un intervalo de confianza de 94.5% para la media de la población.
32
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- Se pidió al personal de ventas de la distribuidora González que presentará informes
semanales con los clientes llamados durante la semana. En una muestra de 61 informes
semanales se determinó un promedio de 22.4 llamadas a clientes por semana y que la
desviación estándar era de 5 llamadas.
a) Suponga el caso de muestra grande para determinar un intervalo de confianza del
95% para la cantidad promedio de llamadas semanales a clientes para la población
del personal de ventas.
b) Suponga que esa población tiene distribución normal, aplique la distribución t, con 60
grados de libertad, para determinar un intervalo de confianza del 95% para la cantidad
promedio de llamadas semanales a clientes.
c) Determinar el intervalo de confianza del 90% si la muestra cambia a 25 informes
semanales con una media de 21.8 y una desviación estándar de 4.5.
d) Si la muestra baja a 12 informes por semana determinar el intervalo de confianza del
99%, con una media de 20.5 y una desviación estándar de 4.1.
2.- La cantidad de horas que duermen los estadounidenses cada noche varía mucho,
desde el 12% de la población que duerme menos de 6 horas hasta el 3% que duerme
más de 8 horas. A continuación se indica una muestra de las horas que duermen cada
noche 25 personas.
6.9 7.6 6.5 6.2 5.3
7.8 7 5.5 7.6 6.7
7.3 6.6 7.1 6.9 6
6.8 6.5 7.2 5.8 8.6
7.6 7.1 6 7.2 7.7
a) ¿Cuál es el estimado puntual de la media de la población de la cantidad de horas
que se duerme cada noche?
b) Suponiendo que la población tiene una distribución normal, determine un intervalo
de confianza del 95% para la cantidad de la media de la población de horas de
sueño cada noche.
33
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
E = zα /2 σ
√n
TAMAÑO DE LA MUESTRA PARA UN ESTIMADO DE INTERVALO DE UNA MEDIA DE
POBLACIÓN.
n = (zα /2)2. σ2
E2
Con este tamaño de muestra se obtiene el margen deseado de error con el nivel de
confianza elegido.
Donde:
E = Margen de error
zα /2 = valor dependiendo del nivel de confianza
σ = Desviación estándar de la población, generalmente desconocida, para conocerlo se
necesita un valor preliminar o de planeación, en la práctica se sugiere tomar el rango
dividido entre 4 como una aproximación de la desviación estándar.
Ejercicios:
1.- La desviación estándar de la muestra de las relaciones P/G para acciones de la Bolsa
de Valores de Nueva York es s = 7.8 . Suponga que nos interesa estimar la media de la
relación P/G de las acciones de la Bolsa de Valores de Nueva York.
a)¿Cuántas acciones deben incluirse en la muestra si deseamos que el margen de error
sea de 2? Suponga una confianza del 95%.
b) Si E = 3 y el intervalo de confianza es del 92%, ¿cuántas acciones deben incluirse en la
muestra?
34
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
2.- Los datos sobre el perfil de audiencia del sitio de la red ESPN SPORT indicaron que el
26% de los usuarios eran mujeres. Suponga que este porcentaje se basó en una muestra
de 400 usuarios.
a) Con un 95% de nivel de confianza , ¿cuál es el margen de error con la proporción
estimada de mujeres?
b) ¿Cuál es el intervalo de confianza de 95% de la proporción poblacional de usuarios
mujeres?
c) ¿Qué tamaño debe tener la muestra para un margen deseado de error de 3%?
35
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
PRUEBAS DE HIPÓTESIS
Dos actividades importantes de la estadística inferencial son la estimación de los
parámetros de población y la prueba de hipótesis.
Una prueba de hipótesis es un procedimiento estándar para probar alguna aseveración.
Definiciones:
El procedimiento para probar una hipótesis comprende el uso de datos de una muestra
para probar las dos aseveraciones representadas por H0 y Ha.
Ejemplo:
En un juicio.
H0 : El acusado es inocente.
Ha : El acusado es culpable.
H0 : µ ≤ µ0
Ha : µ > µ0
H0 : µ = µ0
Ha : µ ≠ µ0
36
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
1.- El Gerente de una agencia automotriz desea implantar un nuevo plan de bonos con
objetivo de aumentar el volumen de ventas. En la actualidad, la media del volumen de
ventas es de 14 automóviles vendidos por mes. El Gerente desea llevar a cabo una
investigación para ver si el nuevo plan de bonos aumenta el volumen de ventas. Para
reunir datos acerca del plan, se permitirá que un grupo de vendedores trabajen con él
durante un periodo de un mes.
a) Formule las hipótesis nula y alternativa que sean adecuadas para este caso.
b) Comente la conclusión a que se llegaría cuando no se pueda rechazar H0.
c) Comente la conclusión a que se llegaría cuando si se pueda rechazar H0.
2.- La etiqueta de un envase de 3/4 de galón de jugo de naranja, dice que el jugo
contiene un promedio de un gramo de grasa o menos. Conteste las siguientes
preguntas para una prueba de hipótesis que pudiera usarse para probar la afirmación
de la etiqueta.
a) Enuncie las hipótesis nula y alternativa adecuadas.
b) ¿Cuál es el error tipo I en este caso?, ¿cuáles son las consecuencias de
cometerlo?
c) ¿Cuál es el error tipo II en este caso?, ¿cuáles son las consecuencias de
cometerlo?
37
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Las colas en una distribución son las regiones extremas limitadas por los valores críticos.
Algunas pruebas de hipótesis incluyen dos colas, cola derecha o cola izquierda.
Prueba de dos colas: La región de rechazo se encuentra en dos regiones
extremas (colas) bajo la curva.
En esta prueba el nivel de significancia α está dividido equitativamente entre las
dos colas que constituyen la región de rechazo. Si α = 0.05, el área de cada cola
será de 0.025.
Prueba de cola derecha: La región de rechazo se encuentra en la región extrema
derecha (cola) bajo la curva. En esta prueba el área de rechazo será igual a α.
Prueba de cola izquierda: La región de rechazo se encuentra en la región extrema
izquierda (cola) bajo la curva. En esta prueba el área de rechazo será igual a α.
α/2
α/2
Prueba Bilateral
o de dos colas
38
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Prueba Unilateral
o de una cola
(cola derecha)
Prueba de hipótesis con muestra grande (n ≥ 30), acerca de una media de la población
para una prueba unilateral de la forma:
H0 : µ ≥ µ0 COLA IZQUIERDA
Ha : µ < µ0
Rechazar H0 si z < - zα
Prueba de hipótesis con muestra grande (n ≥ 30), acerca de una media de la población
para una prueba unilateral de la forma:
H0 : µ ≤ µ0 COLA DERECHA
Ha : µ > µ0
39
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Rechazar H0 si z > zα
Prueba de hipótesis con muestra grande ( n ≥ 30) respecto a una media de población para
una prueba bilateral de la forma:
H0 : µ = µ0 DOS COLAS
Ha : µ ≠ µ0
2.- VALORES DE P.
Valor P = 0.0038
z
-2.67 0
40
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
P = 0.5 – Probabilidad de z
Rechazar H0 si P < α
H0 : µ = µ0
Ha : µ ≠ µ0
2.- Si el intervalo de confianza contiene el valor supuesto de µ0, no rechazar H0. En caso
contrario, rechazar H0.
41
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
H0 : µ = 15
Ha : µ ≠ 15
Con una muestra de 50 elementos se obtiene una media de 14.2 y una desviación
estándar de 5.
a) ¿Cuál es la regla de rechazo con α = 0.02?
b) Determine el valor del estadístico de prueba.
c) ¿Cuál es el valor de P?
d) ¿Cuál es su conclusión?
e) Resolver con el método de intervalo de confianza.
4.- Los neumáticos nuevos fabricados por una empresa deben durar, en promedio,
cuando menos 28,000 millas. Las pruebas con 30 neumáticos dan como resultados de la
muestra una media de 27,500 millas de duración, con una desviación estándar de 1000
millas. Si se usa un nivel de significancia de 0.05, pruebe si hay evidencia suficiente para
rechazar la aseveración de la media mínima de 28,000 millas.
a) Establezca la hipótesis nula y alternativa.
b) Determine el valor del estadístico z.
c) Establezca la regla de rechazo.
d) Calcule el valor de P.
42
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Prueba sobre la media de la población: caso de muestra pequeña ( n < 30). Prueba
unilateral.
H0 : µ ≥ µ0
Ha : µ < µ0
H0 : µ ≤ µ0
Ha : µ > µ0
v = n -1
H0 : µ = µ0
Ha : µ ≠ µ0
v = n -1
43
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
Ejercicios:
2.- La familia estadounidense promedio gasta $90 dólares diarios. Suponer que una
muestra de 25 familias en Nueva York, tiene un promedio diario de $84.5 dólares de
gastos con desviación estándar de $14.5 dólares.
a) Pruebe H0 : µ = 90 y Ha : ≠ 90 para ver si esa población difiere del promedio en E.U.,
use el nivel de significancia de 0.05, ¿cuál es su conclusión?
b) ¿Cuál es el valor de P?
Un proceso de producción debe llenar recipientes con una media de peso µ = 16 onzas.
El personal de aseguramiento de calidad selecciona periódicamente una muestra
aleatoria simple de ocho recipientes y prueba las siguientes hipótesis: H0 : µ = 16 y
Ha : µ ≠ 16. Si la muestra produce valores de 16.02, 16.22, 15.82, 15.92, 16.22, 16.32,
16.12 y 15.92 onzas y el nivel de significancia es de 0.05. Calcular:
a) Media y desviación estándar de la muestra.
b) Regla de rechazo de H0.
c) El valor del estadístico de prueba t.
d) Valor de P y conclusión.
44
Estadística y Probabilidad II Dr. Noé Toledo Castillejos
H0 : p ≤ p0 Prueba Unilateral
Ha : p > p0
H0 : p = p0 Prueba Bilateral
Ha : p ≠ p0
Ejercicios.
1.- Se tiene la siguiente prueba de hipótesis: H0 : p = 0.20 y Ha : p≠ 0.20. Una muestra de
400 elementos dio como resultado una proporción de p = 0.175.
a) Con α = 0.05, ¿cuál es la regla de rechazo?
b) Calcule el valor del estadístico z.
c) ¿Cuál es el valor de P?
d) ¿Cuál es su conclusión?
2.- Una serie de TV debe demostrar las siguientes hipótesis: H0 : p ≤ 0.25 y Ha : p > 0.25
Suponga que en una muestra de 400 familias, 112 estaban viendo la serie.
a) Con α = 0.10, ¿puede decirse que la serie tuvo éxito, con base en la información
de la muestra?
b) ¿Cuál es el valor P para los resultados de la muestra?, ¿cuál es su conclusión de
prueba de hipótesis?
En el campo de golf Río en los últimos meses, el 20% de los jugadores han sido mujeres,
para tratar de aumentar la proporción de mujeres jugadoras, Río hizo una promoción
especial para atraerlas. Después de una semana, una muestra aleatoria de 400 jugadores
dio como resultado 300 hombres y 100 mujeres. Los gerentes del club desean determinar
si estos datos respaldan la conclusión de que ha aumentado la proporción de mujeres
jugadoras en Río. La hipótesis nula y alternativa son las siguientes, utilice: α = 0.005.
H0 : p ≤ 0.20
Ha : p > 0.20
45