You are on page 1of 125

1

TEMA 4

ESTIMACIN
2
Objetivos del tema
Despus de completar el tema debe ser capaz de:

Distinguir entre estimacin puntual e intervalo de confianza
Aprender cmo hacer estimaciones de ciertas caractersticas o
parmetros de una poblacin a partir de muestras
Saber el significado de la precisin, el margen de error, el error
estndar y la confianza
Construir e interpretar correctamente un intervalo de confianza para
la media de una poblacin, para la proporcin y para la varianza
Determinar el tamao de la muestra necesario para no exceder de un
margen de error
Aprender a utilizar las distribuciones, normal, t de Student y ji-
cuadrado, para hacer estimaciones por intervalo.


3
Contenido
Introduccin

Estimacin puntual y propiedades

Estimacin por intervalo

Intervalos de confianza para la Media de una Poblacin,
Cuando la varianza de la poblacin
2
es conocida

Cuando la varianza de la poblacin
2
es desconocida

Intervalos de confianza para la Proporcin de una
Poblacin, P (muestras grandes)

Intervalos de confianza para la Varianza
2
(poblacin
normal)
4
Definiciones
Estimar un parmetro es buscar un valor
apropiado para el mismo, basado en los
resultados obtenidos de una muestra.

Un estimador de un parmetro de la poblacin
es una variable aleatoria que depende de la
informacin de la muestra
sus valores proporcionan una aproximacin al
parmetro desconocido

La estimacin es el valor numrico que toma el
estimador en una determinada muestra.
5
Estimacin puntual y por intervalo
Una estimacin puntual es un valor
Un intervalo de confianza suministra
informacin adicional sobre la variabilidad
Estimacin puntual
Lmite de
confianza
inferior
Lmite de
confianza
superior
Amplitud del
Intervalo de confianza
6
Podemos estimar el
parmetro de una poblacin


Con una muestra
estadstica
(estimacin puntual)
Media
Varianza

Proporcin
P
2

Estimaciones puntuales

=
i
i
n
x
x

=
i
2
i 2
1 n
) x (x
s
n
x
p =

7



Se desea conocer la media de gastos diarios de los
jvenes estudiantes. Se toma una muestra de 10
estudiantes y se registraron sus gastos durante un da con
los resultados siguientes:
12 5 8 2 5 4 6 5 3 10
Cul es la media de gasto diario de los estudiantes?







6
10
60
n
n x
x
i
i i

= = = =

media de la muestra 6
9.78
1 n
n ) x (x
s
i
i
2
i
2
=

varianza de la muestra 9.78


Ejemplo
8
media de la muestra 6
varianza de la muestra 9.78
desviacin tpica de la muestra
La media es desconocida,
se estima en 6
La varianza
2
es desconocida,
se estima en 9.78 (insesgado)
9.78 s =
9.78 s
2 2
= =

9
La finalidad de un estimador es aproximarse al
verdadero valor del parmetro

Las propiedades nos servirn para elegir el
mejor para una determinada caracterstica de
una poblacin

Propiedades deseables:
Insesgadez
Consistencia
Eficiencia
Propiedades deseables de los
estimadores puntuales
10
Similitud con un tirador

11
Similitud con un tirador
El buen tirador es insesgado y concentra
sus tiros entorno al centro
Insesgado y de varianza mnima
12
Estimadores Insesgados
Definicin: Se dice que un estimador es un
estimador insesgado o centrado del parmetro
si la media de la distribucin de es


Ejemplos:
La media muestral es un estimador insesgado :

La varianza muestral es un estimador insesgado de
2
:


La proporcin muestral es un estimador insesgado de P:

E( =
P ) P E( =

) X E( =
2 2
) E(S =

=
i
i
2
1 n
X (X
S
i
2
n )
13
Estimadores Insesgados. Sesgo
Sea un estimador de u

Se denomina sesgo del estimador a la
diferencia entre su media y el parmetro .


El sesgo de un estimador insesgado es 0

E( )

Sesgo( =
14
El estimador consistente es mejor cuanto
mayor es la muestra
El estimador es un estimador consistente
del parmetro si la diferencia entre el valor
esperado del estimador y el parmetro, ,
disminuye a medida que aumenta la muestra.

Condiciones suficientes pero no necesarias
para la consistencia:


Se desea un estimador consistente, cuando no
se encuentra uno insesgado

0 ) Var(
lim
y ) E(
lim
n n
= =


Estimadores Consistentes
15
Si X~N(,
2
), entonces es un
estimador de la media insesgado y
consistente

Insesgado:

Consistente:

X
) X E( =
0
n

lim
) X Var(
lim
2
n n
=
|
|
.
|

\
|
=

Ejemplo
16
Se desea que un estimador sea insesgado y
sus valores se concentren en torno a la media

Sean y dos estimadores insesgados
basados en el mismo tamao muestral,

Si se dice que es ms
eficiente que

1

) Var( ) Var(
2 1

<
1

Estimadores eficientes
17
La media muestral es un estimador de la media
poblacional:
insesgado
consistente
eficiente
La proporcin muestral es un estimador de la
proporcin poblacional:
insesgado
consistente
eficiente
Los mejores estimadores
18
Eleccin de un estimador
Existen casos en los que no se encuentra un estimador
insesgado satisfactorio

Una medida de la proximidad del estimador al parmetro
se obtiene con el error cuadrtico medio


Se demuestra que


Generalmente se busca el estimador insesgado que
minimice la varianza


2
) E( ECM =

2
(sesgo) ) Var( ECM + =

19
Ejemplo
Se toma una muestra de 8 empleados de una gran
planta productora, el nmero de horas extras que estos
empleados hicieron durante el ltimo mes fueron:
22, 16, 28, 18, 36, 23, 41, 31.
Obtenga una estimacin insesgada de:
a) La media poblacional.


a) La varianza poblacional y la desviacin tpica.

horas 8.75 76.696 s = = =

horas 26.875
n
n x
x
i i
= = =

76.696
1 n
n ) x (x
s
i
2
i 2 2
=

= =

20
Ejemplo
Muestra 22, 16, 28, 18, 36, 23, 41, 31.
Obtenga una estimacin insesgada de:
c) La proporcin de empleados que trabajaron ms de 30
horas extra el ltimo mes


d) La varianza de la proporcin muestral de empleados que
trabajaron ms de 30 horas extra el ltimo mes.

= =
n
Q P

2
P


8
3
n
x
P = =

0.029
8
8
5
x
8
3
=
21
Intervalos de Confianza
Cuanta incertidumbre se asocia con una
estimacin puntual de un parmetro de la
poblacin?

Un intervalo de confianza suministra ms
informacin sobre una caracterstica de la
poblacin que una estimacin puntual

El intervalo estimado se denomina intervalo
de confianza
22
Estimacin de un Intervalo de
Confianza
Un intervalo da un rango de valores:
Basado en la observacin de una muestra
Tiene en cuenta la variacin del estadstico muestral
de una muestra a otra
Da informacin sobre la prximidad a los
parmetros desconocidos de la poblacin
Se expresa en trminos de nivel de confianza
Nunca puede ser 100% confianza
23
Proceso de Estimacin
(media, , es
desconocida)
Poblacin
Muestra aleatoria
Media
x = 50
Muestra
Tengo una
confianza del
95% de que
est entre
40 y 60.
24
Nivel de Confianza (1-o)
La cantidad (1 - o) se denomina Nivel de Confianza del intervalo
(o entre 0 y 1)

Si se repiten las muestras de la poblacin, creemos que el
verdadero valor de un parmetro u se encontrar en el
100(1-o)% de los intervalos calculados de esta forma
Se dice que a < u < b con una confianza del 100(1 - o)%

Interpretacin como frecuencia relativa:
Con muestras repetidas de igual tamao, el 95% de todos los
intervalos de confianza que pueden construirse, contienen al
verdadero valor de parmetro.

Un intervalo de confianza puede contener o no al verdadero valor
del parmetro
No hay probabilidad en un intervalo especfico
25

x
=
Intervalos y Nivel de Confianza
Intervalos de Confianza



100(1-o)%
de los
intervalos
construidos
contienen
Distribucin Muestral de la Media
x
x
1
x
2
/2 o /2 o
o 1
Se parte de un
intervalo de
probabilidad
1- o
Se sustituye el
estadstico por
el resultado
muestral y se
obtiene un
intervalo de
confianza 1- o
26
Intervalos de Confianza
Media de la
Poblacin

2
desconocida
Intervalos
de confianza
Proporcin
de la poblacin

2
conocida
Varianza de la
Poblacin
27

Intervalos de confianza para la media
(
2
conocida)
Supuestos
Varianza de la poblacin
2
conocida
Distribucin de la poblacin normal
Si la poblacin no es normal, utilice una muestra
grande, n25
La estimacin del intervalo de confianza es:
IC
1-o
()

(donde z
o/2
es el valor de la distribucin normal que deja una
probabilidad o/2 en la cola superior), e.d.
n

z x
n

z x
/2 /2
+ < <
| | /2 z Z P
/2
= >
28

Intervalos de confianza para la media
(
2
conocida). Justificacin

Se parte de un intervalo de probabilidad 1-
1) N(0, ~
n

X
Z

=
/2 proba-
bilidad

por arriba
Simtrico
de z
/2

|
|
.
|

\
|
=
n

, N ~ X
2
2
X
29

Intervalos de confianza para la media
(
2
conocida). Justificacin

Se parte de un intervalo de probabilidad 1-
X
1 ) z Z z P(
2 2
= s s
1 z
n

X
z P
/2 /2
=
(
(
(
(

<

<
1
n

z X
n

z X P
/2 /2
=
(

+ < <
sustituyendo por se obtiene el intervalo de
confianza 1-o para el parmetro de la poblacin
x
30
Ejemplo
Una muestra de 11 bolsas de azcar de una
poblacin normal tiene un peso medio 2.20 Kg.
Se sabe que la desviacin tpica de la poblacin
es de 0.35 Kg.

a) Determine el intervalo de confianza del 95%
para el peso medio de las bolsas de azcar
producidas en el proceso.
n=11, X peso de
una poblacin normal, =0.35
confianza 1-=0.95 =0.05

Kg 2.20 x =
31
Ejemplo
n=11, =0.35,
una poblacin normal, =0.05

Solucin
n

z x
/2

) 11 (0.35/ 1.96 2.20 =


2.4068 1.9932 < <
R-Commander
distribucin N(0,1)

2.20 x =
/2=0.025
z
/2
=z
0.025
=1.96

kg. 0.2068 2.20 =
IC
1-o
()
32
Margen de Error
El intervalo de confianza 1-



Tambin se puede escribir
donde ME se denomina margen de error





El valor del factor de fiabilidad depende del nivel de confianza
deseado
La amplitud del intervalo es el doble del margen de error
n

z x
n

z x
/2 /2
+ < <
ME x
n

z ME
/2
=
Estimacin Puntual margen de error
Estimacin Puntual (Factor de fiabilidad)(Error Estndar)
33
Interpretacin del ejemplo
Tenemos una confianza del 95% en que el
peso medio de los paquetes de azcar est
entre 1.9932 y 2.4068 kg.

Aunque la verdadera media puede estar o no
en ese intervalo, el 95% de los intervalos
construidos de esta forma contienen al
verdadero valor de la media de peso de los
paquetes de este proceso
34
Depende de:
La heterogeneidad de la poblacin. Si ME


El tamao muestral n. Si n ME

El nivel de confianza. Si (1 o) ME

n

z ME
/2
=
Reduciendo el margen de error
estandar error el es
n

35
Niveles de confianza
Los niveles de confianza utilizados
habitualmente son: 90%, 95% y 99%
Nivel de
confianza
Coeficiente
de confianza
1-

Valor zo/2
1.28
1.645
1.96
2.33
2.58
3.08
3.27
0.80
0.90
0.95
0.98
0.99
0.998
0.999
80%
90%
95%
98%
99%
99.8%
99.9%
36

x
=
Intervalos y Nivel de Confianza
Intervalos de Confianza
Los intervalos
se extienden
desde


hasta


100(1-o)%
de los
intervalos
construidos
contienen
Distribucin Muestral de la Media
n

z x
n

z x +
x
x
1
x
2
/2 /2
1
37

Una compaa area necesita estimar el nmero medio de
pasajeros en un vuelo de reciente apertura.

Para ello considera una muestra de 40 das hbiles, obteniendo
una media muestral de 112.

Suponiendo que la desviacin tpica es semejante a la de
otros vuelos, 25, obtenga el intervalo de confianza del 90% para
el nmero medio de pasajeros del vuelo

Ejercicio
38

39

40
Se pretende estimar la duracin media de las bajas
laborales de una regin en un determinado periodo. Una
muestra de 36 bajas ha dado una media de 9.4 das de
baja.
Si la varianza de la poblacin es de 100 das
2
, obtenga un
intervalo de confianza del 95.5%.
Ejercicio

41
Factor corrector de poblaciones finitas
- Si la muestra se obtiene sin reposicin y
- La poblacin es pequea de tamao N,

La varianza est afectada por un factor corrector de
poblaciones finitas

- El margen de error es



Si el factor corrector es despreciable
0.05
N
n
>
N
n
1
1 N
n N
~

N
n
1 z ME
/2
~
0.05
N
n
s
42
Se pretende estimar la duracin media de las bajas laborales en
una empresa en un determinado periodo en el que se han
contabilizado 100 bajas.
Una muestra de 35 bajas ha dado una media de 9.4 das de
baja.
Si la varianza de la poblacin es de 100 das
2
, obtenga un
intervalo de confianza del 95.5%.
Ejercicio
43
Intervalos de Confianza
Media de la
Poblacin

2
desconocida
Intervalos
de confianza
Proporcin
de la poblacin

2
conocida
Varianza de la
Poblacin
44
Si la poblacin tiene deviacin
desconocida, la podemos sustituir por la
desviacin tpica muestral, s

Esto introduce una incertidumbre extra, ya
que s vara de una muestra a otra

Por eso se utiliza la distribucin t en lugar de
la distribucin normal
Intervalos de confianza para la media
(
2
desconocida)
45
La Distribucin t de Student
Consideremos una m. a. s. de n observaciones
Con media y desviacin tpica S
Procedente de una distribucin normal de media y
desviacin

La variable



sigue una distribucin t de Student con (n - 1) grados
de libertad
X
1 n
t ~
n
S
X

=
i
2
i
2
1 n
) X (X
S
Recuerda
46
Distribucin t de Student
t es una familia de distribuciones

El valor de t depende de los grados de
libertad (g. l.) o (d.f.)
Nmero de observaciones que pueden variar
libremente despus de calcular la media de una
m.a.s.
g.l. = n - 1
47
t
0
t (gl = 5)
t (gl = 13)
La distribucin t tiene
forma de campana y es
simtrica, pero tiene colas
ms gordas que la
Normal
Normal
Estandar
(t con gl = )
Nota: t Z cuando aumenta n
Distribucin t de Student
48
Idea: Nmero de observaciones que son
independientes cuando se ha calculado la media
muestral
Ejemplo: Supongamos que la media de 3 nmeros
es 8.0

Sea X
1
= 7
Sea X
2
= 8
Cul es X
3
?

If the mean of these three
values is 8.0,
then X
3
must be 9
(i.e., X
3
is not free to vary)
Grados de libertad (g.l.) o (df)
Aqu, n = 3, de ah los grados de libertad = n 1 = 3 1 = 2
(2 valores pueden ser cualquier nmero pero el tercero no es
libre cuando la media viene dada)
Si la media de los 3 valores
es 8.0,
Entonces X
3
debe ser 9
(e.d., X
3
no es libre)
49
Usando tablas de la t de Student
| | 0.05 2.920 t P
2
= >
rea cola superior
gl

0.10 .025
.05
1 12.706
2
3 3.182
El tabla contiene
valores t, no
probabilidades
Sea: n = 3
gl = n - 1 = 2
o =0 .10
o/2 =0.05
t
0
2.920
o/2 = 0.05
3.078
1.886
1.638
6.314
2.920
2.353
4.303
Generalmente se necesita t
/2
| | /2 t t P
/2 n
= >
50
Usando R-Commander
Seleccionar: Distribuciones distribuciones continuas distribucin t
cuantiles t
sealar
probabilidad


indicar g.l.




sealar cola de la derecha

Resultado 2.131847 luego
2.131847 t
4;0.05
=
51
Supuestos
Varianza de la poblacin
2
desconocida
Distribucin de la poblacin normal

La estimacin del intervalo de confianza 1- o es:



donde t
o/2
es el valor de la distribucin t que deja una
probabilidad o/2 en la cola superior


:
Intervalos de confianza para la media
(
2
desconocida)
/2 ) t P(t
/2 1, n 1 n
= >

n
s
t x
n
s
t x
/2 1, n /2 1, n
+ < <
52

Intervalos de confianza para
en Poblaciones Normales

Varianza conocida usa la distribucin normal



Varianza desconocida usa la distribucin t
n

z x
n

z x
/2 /2
+ < <
n
s
t x
n
s
t x
/2 1, n /2 1, n
+ < <
t en una tabla de
una distribucin t
de Student

en lugar de
su estimacin
s

53
Valores de la distribucin t
Comparacin con los valores de Z
Nivel de t t t Z
Confianza (10 g.l.) (20 g.l.) (30 g.l.) ____

0.80 1.372 1.325 1.310 1.282
0.90 1.812 1.725 1.697 1.645
0.95 2.228 2.086 2.042 1.960
0.99 3.169 2.845 2.750 2.576
Observa: t se aproxima a Z cuando n aumenta
54

Una muestra aleatoria de tamao n = 25 de una
poblacin con distribucin normal tiene media 50 y
desviacin tpica s= 8.
Obtenga un intervalo de confianza del 95% para .


Ejercicio


55

La auditoria interna de una empresa de informtica ha
efectuado una verificacin por muestreo aleatorio de 28
transacciones y ha obtenido un error medio de facturacin
de 225 con una desviacin tpica de 20. En el supuesto
de que la cantidad asociada a los errores de facturacin
se distribuya normalmente. Se pide:

a) Obtenga un intervalo de confianza al 95% para el error
medio de facturacin real

Ejercicio
56
57

b) Cul es el margen de error estadstico en la
estimacin del error medio de facturacin, para el nivel de
confianza precisado en el apartado a?

c) Si la estimacin del error medio se hace con una
confianza del 90%
cul es el margen de error?
58
Intervalos de confianza para la media
Muestras grandes n> 100
Con varianza conocida o desconocida

El intervalo de confianza aproximado para , al
nivel 1-o, es




Para n grande la distribucin t coincide con la N(0, 1)
Con muestras grandes se puede sustituir por s
n
s
z x
n
s
z x
/2 /2
+ < <
59
Una compaa area necesita estimar el nmero medio de
pasajeros en un vuelo de reciente apertura. Para ello
considera una muestra de 120 das hbiles, obteniendo
una media de 112 pasajeros y una desviacin tpica de 25.
Obtenga el intervalo de confianza del 90% para el nmero
medio de pasajeros del vuelo.
Ejercicio

60




Obtenga el intervalo de confianza del 90% para el nmero
medio de pasajeros del vuelo.
aproximadamente normal, , s=25, 1-=0,90,



112 = x

61
Resumen Estimacin de la media
- Varianza conocida

- Varianza desconocida t



Poblacin cualquiera
- Varianza conocida n25

- Varianza desconocida n100
|
.
|

\
|
+
n
s
z x ;
n
s
z x
/2 /2
|
.
|

\
|
+
n

z x ;
n

z x
/2 /2
|
.
|

\
|
+

n
s
t x ;
n
s
t x
/2 1, n /2 1, n
Poblacin normal
|
.
|

\
|
+
n

z x ;
n

z x
/2 /2


Con n grande
siempre se tiene Z


|
.
|

\
|
+
n

z x ;
n

z x
/2 /2

62
En una revisin de inventarios, un auditor interno toma una
muestra de 136 artculos y determina la merma (prdida
debida a robos realizados por clientes y empleados) para
cada artculo, en trminos de porcentajes. La media de la
muestra es 5.8% y la desviacin tpica es 4.2%. Obtenga
un intervalo de confianza al 95% para la media de la
merma.
Ejercicio

63

64
Supongamos una poblacin normal de la que se extrae una
muestra de tamao 10 con los siguientes resultados:
10, 11, 12, 13, 14, 15, 11, 12, 13, 14
Determine un intervalo de confianza al 95% para la media
poblacional.
Ejercicio realizado con R-commander
1 Introduccin de datos
Datos Nuevo conjunto de datos


Para guardar: Cerrar y

Datos Conjunto de datos activo Guardar el conjunto de
datos activo

65
Objetivo Estimacin de la media
poblacin normal y varianza desconocida
Condiciones de aplicacin

|
.
|

\
|
+

n
s
t x ;
n
s
t x
/2 1, n /2 1, n
Intervalo de confianza 1- para la media

Nivel de
confianza
Bilateral

Estadsticos Medias Test t para una muestra

66
Intervalo de confianza del
95%




Interpretacin
Tengo una confianza del 95% de que est entre 11.36892 y
13.63108. Es decir, con muestras repetidas de igual tamao, el
95% de todos los intervalos de confianza que pueden construirse
contienen el verdadero valor de media.

Estimacin
puntual de la
media

Salida de ordenador

data: Ejemplo$var1
t = 25, df = 9, p-value = 1.259e-09
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
11.36892 13.63108
sample estimates:


mean of x
12.5
67
Intervalos de Confianza
Media de la
Poblacin

2
desconocida
Intervalos
de confianza
Proporcin
de la Poblacin

2
conocida
Varianza de
la
Poblacin
68
Intervalos de Confianza para la
Proporcin, P. Muestras grandes
Cuando se estudia una variable cualitativa el parmetro de
inters es la proporcin en la que se encuentra una
caracterstica en la poblacin, p o P.

Una estimacin por intervalo para la Proporcin de la
Poblacin ( P ) puede obtenerse aadiendo una tolerancia
por incertidumbre a la proporcin muestral ( )


p

Estimacin Puntual (Factor de fiabilidad)(Error estndar)


69
Intervalos de Confianza para la
Proporcin, P. Muestras grandes
Cuando tenemos una variable cualitativa el parmetro de
inters es la proporcin
Dos posibles resultados
xito (una caracterstica est presente)
Fracaso (la caracterstica no est presente)
La proporcin de la categora de xito en la poblacin se
representa por p o P

Una estimacin por intervalo para la Proporcin de la
Poblacin ( P ) puede obtenerse aadiendo una tolerancia
por incertidumbre a la proporcin muestral ( )


p

Estimacin Puntual (Factor de fiabilidad)(Error estndar)


70
Recuerda: Proporcin
La proporcin de xitos en la muestra se representa por




Cuando nP(1 P) > 9, se puede aproximar a una
distribucin normal con media y desviacin tpica




La estimacin
muestral tamao
muestra la en xitos de nmero
n
x
p = =

n
P) P(1

p

=

P
p
=

n
) p (1 p



=
71
Lmites del Intervalo de Confianza
El intervalo de confianza se calcula



donde
z
o/2
es el valor de la distribucin normal para un
nivel de confianza deseado
es la proporcin en la muestra
n es el tamao de la muestra
n
) p (1 p
z p P
n
) p (1 p
z p
/2 /2


+ < <

72
Ejemplo
Una muestra aleatoria de 100
personas muestra que 25 son
zurdas.
Obtenga el intervalo de confianza del
95% para la verdadera proporcin de
zurdos
73
Ejemplo
n=100 25 son zurdas 1-=0.95.
100
0.25(0.75)
1.96
100
25
P
100
0.25(0.75)
1.96
100
25
+ < <
n
) p (1 p
z p P
n
) p (1 p
z p
/2 /2


+ < <

0.3349 P 0.1651 < <


IC
95%
(p)
9 ) p

- (1 p

n >
74
Interpretacin
Tenemos una confianza del 95% de que el
verdadero porcentaje de zurdos de la
poblacin est entre
16.51% y 33.49%.

Aunque este intervalo puede o no contener
a la verdadera proporcin, el 95% de los
intervalos as construidos, con muestras de
tamao 100, contendrn a la verdadera
proporcin
75
a) Cul es la estimacin de la proporcin de
empresas que consideran que la situacin
econmica continuar sin mejorar?

Un sondeo realizado a 300 empresas obtuvo que
ms de un tercio (34.5%) de las PYMEs opinan
que la situacin econmica continuar sin mejorar
en el ao 2012. Se pide
Ejercicio
76
b) Sabiendo que en la regin existen 6230
PYMEs, determine la tasa de sondeo
c) Es necesario utilizar el factor de correccin
para calcular la varianza de la proporcin
muestral?
77
d) Se desea obtener el intervalo de confianza.
Verifique si se cumplen las condiciones de
aplicacin para obtener este intervalo.
78
e) Estime por intervalo de confianza la proporcin de las
PYMEs que consideran que la situacin econmica
continuar sin mejorar en el ao 2012. Considere un nivel
de confianza del 95%.
79
f) Cul es el margen de error asociado a la
estimacin de p con un nivel de confianza
del 95%?

80
Una muestra aleatoria de 1000 personas obtiene que 250
son usuarias de un servicio.
1, 0, 1, 0, 0, 0, , 1
a) Obtenga el intervalo de confianza del 95% para la
verdadera proporcin de usuarios.

Ejercicio realizado con R-commander
Objetivo estimacin de la proporcin
tamao muestral grande,
Condiciones de aplicacin

|
|
.
|

\
|

n
q p
z p
/2

IC
1- o
(p)
= ) p

- (1 p

n
9 0.25) 0.25(1- 100 >
81
2 Clculo con R-Commander

i) En el paquete Rcmdr necesitaremos un plugin.

Instalacin del plugin IPSUR en R:

Paquetes Instalar paquete(s)

Seleccionar Spain(Madrid) y buscar RcmdrPlugin.IPSUR.

Una vez instalados en R, habr que cargarlos en cada sesin.

Herramientas Cargar plugin(s) de Rcmdr

82
n de
fracasos
n de
xitos
Nivel de
confianza
Estadsticos Proporciones IPSUR-Enter table for single sample

=p0
83
Estimacin
puntual
data: rbind(.Table), null probability 0.5

X-squared = 250, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
0.2241531 0.2777603
sample estimates:
p
0.25
Intervalo de confianza
del 95%

Salida de ordenador
Interpretacin
Tengo una confianza del 95% de que la verdadera proporcin de
usuarios del servicio est entre 0.224 y 0.278. Es decir, con
muestras repetidas de igual tamao, el 95% de todos los
intervalos de confianza que pueden construirse contienen la
verdadera proporcin.
84
Determinacin del tamao de la muestra
Para la
Media
Determinacin del
tamao de la muestra
Para la
Proporcin
85
Objetivo: determinar el tamao adecuado de una
muestra para estimar un parmetro:
con un determinado margen de error y
con el nivel de confianza deseado

Muestras pequeas errores grandes
Muestras grandes ms costosas

Una muestra mayor suele ser ms cara, pero no
siempre mejora la calidad de la informacin.
Las muestras tienen que tener un tamao
suficiente para comprender la realidad

Determinacin del tamao de la muestra
86
Esta es la realidad
una poblacin
Un cachorro hembra
de pastor alemn
Se llama LUR
Determinacin del tamao de la muestra
87
Imagen muestreada con
10 puntos por
pulgada.
La muestra de puntos es
pequea y no se
reconoce la realidad
Esta imagen slo sirve
para desarrollar la
imaginacin y especular
sobre ella
Determinacin del tamao de la muestra
88
Imagen muestreada 50
puntos por pulgada.
La muestra de puntos es
todava pequea, aunque
se empieza a reconocer la
realidad.
Una imagen borrosa de
un animal que parece un
perro

Determinacin del tamao de la muestra
89
Imagen muestreada
con 150 puntos por
pulgada.
La muestra de
puntos permite
reconocer la realidad:
Un cachorro posando
Determinacin del tamao de la muestra
90
Imagen muestreada con 400
puntos por pulgada. Esta
imagen no es mejor que la
anterior.
Una muestra de puntos mayor
no mejora la percepcin de la
realidad
Una muestra mayor es ms
cara, pero no mejora la calidad
de una investigacin
Las muestras tienen que tener
un tamao suficiente para
comprender una realidad
Determinacin del tamao de la muestra
91
Margen de Error
Obtener el tamao muestral necesario para estimar un
parmetro con
un determinado margen de error (ME) y
a un nivel de confianza especificado (1 - o)

Margen de Error o error de muestreo:
La cantidad a aadir o restar a la estimacin por
punto para obtener el intervalo de confianza
El tamao de la imprecisin en la estimacin del
parmetro de la poblacin
Las mismas unidades que el parmetro a estimar


92
Para la
Media
Determinacin del
tamao de la muestra
n

z x
/2

z ME
/2
=
2
2 2
/2
ME
z
n =
Determinacin del tamao de la
muestra
93
Calcular el tamao muestral para obtener un
intervalo de confianza para la media requiere
conocer (o establecer):

El nivel de confianza deseado (1 - o), que
determina el valor z
o/2

El margen de error ME (error de muestreo),
La desviacin tpica,
Determinacin del tamao de la muestra
94
Ejemplo
Si = 45, Qu tamao muestral se necesita para
estimar la media con un margen de error de 5 y
confianza del 90%?
(Siempre redondeado)
= =
2
2 2
/2
ME
z
n
Se requiere un tamao muestral n = 220
n

z ME
/2
=
219.19
5
(45) (1.645)
2
2 2
=
95

Se quiere efectuar un sondeo a los responsables de
compra de productos de oficina en empresas de servicios
para obtener una estimacin del gasto medio anual en
productos de oficina. Se sabe por estudios anteriores que
la desviacin tpica del gasto anual en este concepto es de
900. Se pide:

a) Determinar el nmero de empresas de servicio
necesarias para estimar el gasto medio anual en productos
de oficina con un margen de error que no supere los 300
y una confianza del 95%. Suponga que el gasto anual se
distribuye normalmente.

Ejercicio
96
97
b) Para el mismo nivel de confianza, cul debe ser el
nmero de empresas de servicio a contactar para
asegurar que el margen de error en la estimacin del
gasto medio anual en artculos de oficina no sea superior
a 150?
98
Determinacin del tamao de la muestra en
poblacin finita
Si la muestra se obtiene sin reposicin en poblacin
pequea de tamao N,


Se debe aadir el factor corrector de poblaciones y
el margen de error es


0.05
N
n
>
n

1 - N
n - N
z ME
/2
=
99
n
) p (1 p
z p
/2

n
) p (1 p
z ME
/2


=
Determinacin del
Tamao Muestral
Para la
Proporcin
Determinacin del tamao
de la muestra
2
2
/2
ME
z 0.25
n =
Caso ms conservador:
P=0.5 y se obtiene n
100
La proporcin en la muestra y en la poblacin
generalmente son desconocidas antes de tomar la
muestra)



P(1 P) tiene un mximo cuando P=0.5 P(1-P)= 0.25
(esto garantiza que el tamao muestral resultante ser
suficiente para este nivel de confianza)

n
) p (1 p
z ME
/2


=
Determinacin del tamao
de la muestra
101
Calcular el tamao muestral para obtener un intervalo de
confianza para la proporcin requiere conocer (o
establecer):
El nivel de confianza deseado (1 - o) z
o/2

El margen de error ME (error de muestreo)
Estimacin de P(1 P)
un valor aproximado (por sondeos previos, zonas
semejantes,)
el caso ms desfavorable, el de mayor varianza en la poblacin
P=0.5

Determinacin del tamao
de la muestra
102
Ejemplo
Cul es el tamao muestral necesario
para estimar la verdadera proporcin de
defectuosos de una poblacin con un
margen de error del 3% y una confianza
del 95%?
103
Ejemplo
Para confianza del 95% , usa z
0.025
= 1.96
ME = 0.03
Considera P(1 P) = 0.5x0.5=0.25 (mximo n)
n = 1068
1067.11
(0.03)
6) (0.25)(1.9
ME
z 0.25
n
2
2
2
2
/2
= = =
104
Determinacin del tamao de la muestra en
poblacin finita
Si la muestra se obtiene sin reposicin en
poblacin pequea de tamao N,


se debe aadir el factor corrector de poblaciones
finitas





0.05
N
n
>
N
n
1
1 N
n N
~

105
106
El director comercial de cierta empresa que realiza ventas por
correo debe precisar con mucho cuidado sus polticas de crdito.
Suponga que la empresa sospecha que los anuncios en cierta
revista han conducido a una tasa muy elevada de cancelaciones
(cuentas consideradas incobrables). La empresa desea
determinar un intervalo de confianza al 90% para la proporcin
de cancelaciones de esa revista con precisin del 2%.
a)Cuntas cuentas deben formar parte de la muestra para
alcanzar este objetivo?
Ejercicio

107
b) Si se toma una muestra con este tamao muestral y se
obtiene que el 10% son cancelaciones, cul es intervalo
de confianza al 90%?
108
Un organismo especializado en el estudio de nuevas
tecnologas de informacin utilizadas por las empresas quiere
efectuar un sondeo para estudiar el grado de informatizacin de
las pequeas empresas (de menos de diez empleados).
Se quiere determinar el tamao de la muestra necesario para
estimar el porcentaje de pequeas empresas que estn
informatizadas con un margen de error que no exceda del 4% y
un nivel de confianza del 95%.
Un sondeo realizado hace dos aos determin que el 30% de
las pequeas empresas estaban informatizadas. Se considera
que el nmero de pequeas empresas es suficientemente
importante para no utilizar el factor de correccin de poblaciones
finitas.
Ejercicio
109

110
Intervalos de Confianza
Media de la
Poblacin

2
desconocida
Intervalos
de confianza
Proporcin
de la poblacin

2
conocida
Varianza
de la
Poblacin
111
Sea X
1
, X
2
, . . . X
n
muestra aleatoria de una poblacin.
La varianza muestral es


Si la distribucin de la poblacin es normal



tiene distribucin ji-cuadrado con n 1 grados de
libertad





Intervalos de confianza para la
varianza
2
1 n
) X (X
S
2
i 2

2
1 - n
~

1)S (n
2
2

112
Distribucin Ji-cuadrado
La distribucin Ji-cuadrado es una familia
de distribuciones, dependiendo de sus
grados de libertad:
g.l. = n 1







0 4 8 12 16 20 24 28 0 4 8 12 16 20 24 28 0 4 8 12 16 20 24 28
g.l. = 1 g.l. = 5 g.l. = 15
_
2
_
2
_
2
113
Valores de Ji-cuadrado
El valor de la ji-cuadrado que deja un rea
/2 en la cola derecha es _
2
n-1;/2
:
Probabilidad /2

_
2
n-1;/2
_
2
_
2
n-1;1-/2
No hay
simetra
114
Ejemplo: Valores de Ji-cuadrado
El valor de la ji-cuadrado que deja un rea 0.05 en
la cola superior es :
Probabilidad
= 0.05

_
2
13
_
2
_
2
13;0.05

= 22.36
= 22.36 ( =0.05 y 14 1 = 13 g.l.)
2
1 n
2
2
~

1)S (n

Se
obtiene
en R o
tablas
115
Uso de las tablas de la ji-cuadrado







Ejemplo si n=4
| | P
2
n;
2
= >
| | 0.05 9.48773 P
2
4
= >
9.48773
2
4;0.05
=
La tabla contiene
valores de ,
no probabilidades
2
_
rea de la cola superior
g.l.
Extracto de la distribucin ji-cuadrado
Si n=4 y =0.05
116
Usando R-Commander
Seleccionar: Distribuciones Distribuciones continuas
Distribucin Chi-cuadrado Cuantiles Chi-cuadrado
sealar
probabilidad


indicar g.l.




sealar cola de la derecha

Resultado 9.487729
9.48773
2
4;0.05
=
117


117
Aislando
2
y sustituyendo S por s (resultado muestral)
se obtiene el intervalo de confianza 1- para
2

2
/2 - 1 , 1 n
2
2
2
/2 , 1 n
2

1)s (n

1)s (n

< <

Intervalos de confianza para


2
1

1)S (n
P
2
/2
2
2
/2 1
2
=
|
|
.
|

\
|
<

<

1-
118
Ejemplo
Ests analizando la velocidad de un procesador.
Recoges los siguientes datos (en Mhz):

CPU
x

Tamao muestral 17
Media muestral 3004
Desv. Tp. Muestral 74
Suponemos que la poblacin es normal.
Determina el intervalo de confianza del para
x
2
119
Buscando los valores ji-cuadrado
probabilidad
/2 = 0.025

_
2
16
_
2
16
= 28.85
6.91
28.85
2
0.975 , 16
2
/2 - 1 , 1 n
2
0.025 , 16
2
/2 , 1 n
= =
= =

_
2
16
= 6.91
probabilidad
/2 =0.025

n = 17 ji-cuadrado con 16 g.l.

o = 0.05 /2 = 0.025
120
Calculando el intervalo de confianza
El intervalo de confianza del 95% es
2
/2 - 1 , 1 n
2
2
2
/2 , 1 n
2

1)s (n

1)s (n

< <

120
Calculando la raz cuadrada, tenemos una confianza
del 95% de que la desviacin tpica de la velocidad
del procesador est entre 55.1 y 112.6 Mhz
6.91
74 1) (17

28.85
74 1) (17
2
2
2

< <

12683 3037
2
< <
121
Una cadena de hoteles tiene un nmero de telfono para
reservas. Un ndice de la calidad de un servicio es el tiempo
de espera, el tiempo que transcurre desde que el telfono
suena por vez primera hasta que un empleado responde,
preparado para hacer las reservas. El estndar de la cadena
es que el tiempo promedio de espera no debera ser mayor
de 30 segundos.
La cadena tiene inspectores que viajan a los distintos hoteles y
verifican todos los aspectos del servicio. Estas personas
realizan cada semana 41 llamadas para hacer reservas y
registran, entre otros indicadores, el tiempo de espera en
cada una de ellas. En una semana los tiempos en segundos
han dado una media de 28.37 segundos y una desviacin
tpica de 17.67.
Obtenga la estimacin de la desviacin tpica, de la varianza y
de la media, con una confianza del 95%. Suponga que la
distribucin del tiempo de espera es normal.
Ejercicio
122


123
Se desea estimar el gasto medio semanal de los jvenes
de una gran ciudad al 95% de confianza y con un margen
de error no superior a 4 euros. Suponga que la desviacin
tpica es de 5 euros.
a) Cul es el tamao muestral necesario?

Resuelva el problema suponiendo y sin suponer
normalidad.
Ejercicio
124

b) Si se toma una muestra con este tamao muestral y se
obtiene un gasto medio de 32 euros cul es el
intervalo de confianza al 95%?

Resuelva el problema suponiendo y sin suponer
normalidad.
Ejercicio
125

You might also like