You are on page 1of 39

1

ESTADSTICA
RUBN DAZ
E-mail: vekio@yahoo.es
Objetivos:
1. Preparar al grupo/alumno en el estudio de los elementos de probabilidad,
sus distribuciones y la inferencia estadstica.

2. Enfatizar las distribuciones muestrales relacionadas con la distribucin
normal, la estimacin de parmetros y las pruebas de hiptesis.

3. Estimular la investigacin de contenidos a travs de la presentacin de
trabajos escritos por el grupo de alumnos cursantes de la asignatura
2
ESTADSTICA
Resumen de contenido:
UNIDAD I:
Probabilidad. Variables Aleatorias Discretas y su Distribucin de Probabilidad.
Variables Aleatorias Continuas y su Distribucin de Probabilidad. Densidades
de Probabilidad conjuntas. Funciones de distribucin conjuntas.

UNIDAD II:
Distribuciones Mustrales y Teorema del Lmite Central. Estimacin.

UNIDAD III:
Prueba de Hiptesis. Mtodos Lineales y Estimacin por Mnimos Cuadrados
3
BIBLIOGRAFA
ESTADSTICA INDUSTRIAL MODERNA: Diseo y
control de la calidad y confiabilidad, Kenett, Ron S. y
Shelemyahu Zacks, 2000, Thomson.

ESTADSTICA MATEMTICA CON APLICACIONES,
Wackerly, Dennis D., Mendenhall III, William,
Scheaffer Richard, 2002, 6. Edicin, Thomson.

PROBABILIDAD Y ESTADSTICA PARA INGENIERA
Y CIENCIAS, Walpole, Myers, Myers, Yen, 8 edicin,
2007, Pearson.

4
EVALUACIN
1. Dos exmenes presenciales con un valor de
30% cada uno
2. Dos trabajos para la casa con un valor de
20% cada uno
Se utilizarn programas estadsticos (MINITAB y/o
Excel).
5
ESTADSTICA DESCRIPTIVA (1)
Definiciones:
Poblacin estadstica es un conjunto de unidades con cierto atributo comn.
Muestra es un subconjunto de los elementos de determinada poblacin.
Variable aleatoria (v. a.) es una funcin cuyo valor numrico est determinado
por el resultado de un experimento. La variable aleatoria se representa por
letras maysculas (X, Y, Z, etc.) y el valor que toma la v. a. se representa por
letras minsculas (x, y, z, etc.)
Toma de una muestra aleatoria de una poblacin finita:
Sea una poblacin finita formada por N elementos. Supongamos que se desea
tomar una muestra aleatoria de tamao n.
a) Muestreo aleatorio con reemplazo o reposicin (N
n
muestras posibles)
b) Muestreo aleatorio sin reemplazo [N (N-1)(N-2) (N-n + 1) muestras posibles]
EJEMPLO:
Supongamos que una empresa de reparacin de impresoras tiene 250 clientes y quiere
tomar 25 de ellos para hacerles una entrevista acerca de la percepcin que tienen del
servicio. Para ello se numeran los clientes del 1 al 250 y se toma una muestra aleatoria
sin reemplazo. Una manera de hacerlo con MINITAB es la siguiente:

MTB > RANDOM 25 C1;
SUBC> INTEGER 1 250.
84 89 60 161 125
73 244 218 75 198
243 164 228 195 40
88 15 219 193 246
248 23 44 115 172
OTRA MANERA DE HACER EL EJERCICIO ANTERIOR
MTB > SET C2
DATA> 1(1:250/1)1
DATA> END.
MTB > Sample 25 C2 C3.
58 118 234 100 97
232 92 225 52 15
246 248 63 188 205
114 230 163 204 145
220 227 76 149 178
8
ESTADSTICA DESCRIPTIVA (2)
La siguiente secuencia de nmeros han sido generados por el comando Random
de MINITAB.
MTB> Random 10 C1;
SUBC> Integer 0 99.
56, 87, 73, 22, 89, 24, 12, 7, 94, 12
Una manera de describir una distribucin de los valores de las muestras (valores
muestrales) es a travs de una distribucin de frecuencias, la cual puede ser (1) de
variables aleatorias discretas o (2) de variables aleatorias continuas.
Variables discretas
Valor Frecuencia
x1 f1
x2 f2
.
.
x
k


f
k
Total n
9
ESTADSTICA DESCRIPTIVA (3)
A veces es til presentar una distribucin de frecuencias en trminos
porcentuales, que se definen p
i
= (100) (f
i
/ n) ; i = 1, 2,, k
La distribucin de frecuencias acumulada (P) para un valor x
i
se define como la
suma de las frecuencias menores o iguales a x
i
Ejemplo:
Un fabricante de componentes microelectrnicos compra placas de cermica a
un proveedor. Las placas se inspeccionan visualmente antes de su impresin
con pantalla. Los nmeros siguientes indican las cantidades de imperfecciones
encontradas en cada placa de una muestra de tamao n = 30
0,2,0,0,1,3,0,3,1,1,0,0,1,2,0
0,0,1,1,3,0,1,0,0,0,5,1,0,2,0
En este caso, la variable aleatoria X: Nmero de imperfecciones en las
placas de cermica, asume los valores 0, 1, 2, 3 y 5.
10
ESTADSTICA DESCRIPTIVA (4)
Distribucin de frecuencias de imperfecciones en placas
x f p P
0 15 0.50 0.50
1 8 0.27 0.77
2 3 0.10 0.87
3 3 0.10 0.97
4 0 0.00 0.97
5 1 0.03 1.00
Total 30 1.00
11
ESTADSTICA DESCRIPTIVA (5)
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5
Imperfecciones en placas de
cermica
12
ESTADSTICA DESCRIPTIVA (6)
1 2 3 4 5 0
0.50
1.00
0.97
0.87
0.77
Distribucin acumulada
13
ESTADSTICA DESCRIPTIVA (7)
Variables aleatorias continuas
Se divide el intervalo posible en k sub intervalos (llamados intervalos de clase o
simplemente clases).
1. Cuntos intervalos de clase?
2. Ancho de los intervalos?
3. Todos deben ser iguales?
Para responder estas preguntas leer el anexo Notas acerca del nmero de
intervalos de clase
Ejemplo:
Los datos que se muestran a continuacin representan 100 valores del logaritmo
de la resistencia de fibras de hilo de lana. Haga una distribucin de frecuencias y
el grfico correspondiente (Histograma).
Descriptive Statistics: C11

Variable N N* Mean SE Mean StDev Variance CoefVar Minimum Q1
C11 100 0 2,9238 0,0938 0,9378 0,8794 32,07 1,1514 2,2790

Variable Median Q3 Maximum Range IQR
C11 2,8331 3,5733 5,7978 4,6464 1,2943

2,4016 2,9908 1,1514 2,3018 4,0017 3,4002 2,1381 1,6787 2,5364 2,1771
2,5813 3,1166 3,6152 1,457 2,58 4,0022 2,7243 1,5059 2,4064 3,9821
2,1232 3,7782 2,5654 3,377 1,3436 2,6266 4,3215 3,6398 2,5264 2,2762
3,0164 1,8952 3,7043 2,9394 2,2671 2,8243 1,1535 2,9382 2,3483 5,7978
4,4382 2,5238 1,4328 1,7261 3,4603 1,6438 3,6162 2,2872 2,4822 4,6426
3,3077 3,4866 2,0968 3,4743 2,5724 3,5272 3,4217 2,7317 4,4563 3,6561
3,0693 4,6315 2,6537 2,5453 2,5 2,2364 3,186 3,6394 3,5017 3,5886
1,5219 1,8926 2,6745 3,186 2,3459 3,2217 4,3389 2,8418 4,5234 4,1251
5,0904 3,8849 2,5326 2,1306 2,424 2,2163 4,8444 3,2108 1,7837 3,2177
3,0027 2,0813 3,7071 3,0722 3,1412 4,0126 1,7902 2,8732 1,5305 2,419
VALORES DE RESISTENCIA DE HILOS DE LANA (8)
15
ESTADSTICA DESCRIPTIVA (10)
0
5
10
15
20
25
1,2 1,7 2,2 2,7 3,2 3,7 4,2 4,7 5,2 5,7
HISTOGRAMA RESISTENCIA DE HILOS
16
0
20
40
60
80
100
120
1,2 1,7 2,2 2,7 3,2 3,7 4,2 4,7 5,2 5,7
ESTADSTICA DESCRIPTIVA (11)
Frecuencia acumulada
Q2 Q1 Q3
17
ANLISIS EXPLORATORIO DE DATOS
PARMETROS OBTENIDOS CON MINITAB
PARMETRO DESCRIPCIN
MEAN MEDIA, E [X]= VALOR ESPERADO
SE MEAN ERROR ESTNDAR DE LA MEDIA = S / (N)
1/2
= S/ N

ST DEV = S DESVIACIN ESTNDAR DE LA MUESTRA
VARIANCE = S
2
VARIANZA DE LA MUESTRA
COEF VAR = S / MEAN COEFICIENTE DE VARIACIN EN PORCENTAJE
Q1 PRIMER CUARTIL (25 %)
MEDIAN = Q2 MEDIANA (50%)
Q3 TERCER CUARTIL (75%)
IQR RANGO INTERCUARTIL = Q3 Q1
Descriptive Statistics: C11

Variable N N* Mean SE Mean StDev Variance CoefVar Minimum Q1
C11 100 0 2,9238 0,0938 0,9378 0,8794 32,07 1,1514 2,2790

Variable Median Q3 Maximum Range IQR
C11 2,8331 3,5733 5,7978 4,6464 1,2943

18
6 5 4 3 2 1
20
10
0
F
r
e
q
u
e
n
c
y
ESTADSTICA DESCRIPTIVA (12)
HISTOGRAMA OBTENIDO CON MINITAB
(INTERVALOS POR DEFAULT)
19
HISTOGRAMA CON SEIS (6) INTERVALOS
20
ESTADSTICA DESCRIPTIVA (13)
El programa MINITAB permite sealar los valores ms importantes de una
muestra estadstica.
Descriptive Statistics: C12


Variable N Mean Median TrMean StDev SE Mean
C12 100 2,9238 2,8331 2,8982 0,9378 0,0938

Variable Minimum Maximum Q1 Q3
C12 1,1514 5,7978 2,2790 3,5733

+ =
=
] 1 ( [
1 ] [
1
o
o
o
n
n j
j
x
N
TrMean
n s Mean SE / =
[ ] = Parte entera
TrMean: De los extremos superior e
inferior se eliminan sendas porciones
o de los datos (Default: 5%).
21
ESTADSTICA DESCRIPTIVA (14)
6
5
4
3
2
1
DIAGRAMA DE CAJA
VALOR ATPICO
Q1
Q2
Q3
mx. {x
1
, Q1-1,5(Q3-Q1)}
min. {x
n
, Q3+1,5(Q3-Q1)}
Q2: Mediana
22
ESTADSTICA DESCRIPTIVA (15)
Diagramas de tallos y hojas:
Ejemplo:
Los siguientes valores son las lecturas de humedad redondeadas al entero ms
cercano
29 44 12 53 21 34 39 25 48 23 17 24 27 32 34 15 42 21 28 37
Stem-and-leaf of C1 N = 20
Leaf Unit = 1,0
3 1 257
(8) 2 11345789
9 3 24479
4 4 248
1 5 3
Posicin de la mediana indicada por ( )
23
ESTADSTICA DESCRIPTIVA (16)
Stem-and-leaf of C12 N = 100
Leaf Unit = 0,10


5 1 11344
15 1 5556677788
34 2 0011112222233344444
(21) 2 555555555566677888999
45 3 000011112223344444
27 3 5556666677789
14 4 00013344
6 4 5668
2 5 0
1 5 7
DIAGRAMA DE TALLOS Y HOJAS PARA LA RESISTENCIA DE HILOS
24
ESTADSTICA DESCRIPTIVA (17)
Ejercicios:
1) Genere 50 enteros al azar entre los nmeros 1 al 6 (ambos inclusive). Use los comandos MINITAB
siguientes:
MTB>RANDOM 50 C1;
SUBC>INTEGER 1 6.
Use este mtodo de generacin y cuente la cantidad de veces que se repiten los diversos enteros. Para
ello use el comando MINITAB : MTB>TABLE C1
2) Forme un conjunto de 50 nmeros que tenga un componente de tendencia lineal, con desviaciones
aleatorias en relacin con esa tendencia. Use los siguientes comandos MINITAB:
MTB>Set C1
DATA>1(1:50/1)1
DATA> END.
MTB>LET C2 = 5 + 2,5*C1
MTB>RANDOM 50 C3;
SUBC>UNIFORM 10 -10.
MTB>LET C4 = C2+C3
MTB>PLOT C4*C1
25
ESTADSTICA DESCRIPTIVA (18) (Continuacin de ejercicios)
3) Genere un conjunto de 50 nmeros binarios aleatorios (0,1) cuando la probabilidad de 1
es p, con los comandos:
MTB>RANDOM 50 C1;
SUBC> BERNOULLI p.
Hgalo con valores de p = 0,1; 0,3; 0,7 y 0,9.
Cuente la cantidad de unos en estas sucesiones aleatorias con el comando MTB>SUM(C1)
4) Los datos del archivo Excel problema 4 representan el tiempo, en segundos, para pasar
de 0 a 100 Km./h en una muestra de 15 automviles hechos en Alemania y 20 hechos en
Japn. Compare y describa las diferencias en tiempos de aceleracin de los autos
alemanes y japoneses, utilizando 5 estadsticas de resumen.
5) Los datos que se encuentran en el archivo Excel Ejercicio 5 TEMA 1 son los registros
llevados por el INE relativo a los nacimientos vivos, femeninos y masculinos, durante
los aos 2003 y 2004 para cada uno de los estados.
a) Haga un diagrama de barras para cada uno de los aos (Utilice MINITAB)
b) Compare y describa las diferencias entre los dos aos utilizando cinco estadsticas de
resumen, incluidos los diagramas de caja. Utilice MINITAB.
26
ESTADSTICA DESCRIPTIVA (19) (Continuacin de ejercicios)
6) El sesgo y la curtosis de una muestra se definen como:
( )
( ) (Curtosis) /
1
(Sesgo) /
1
4
4
1
4
3
3
1
3
s x x
n
s x x
n
n
i
i
n
i
i

=
=
=
=
|
|
Estos ndices se pueden calcular con MINITAB usando los siguientes comandos:
(Supongamos que los datos estn en la columna C1 de MINITAB)
MTB>LET K1 = STD(C1)
MTB>LET K2 = MEAN((C1-MEAN(C1)**3)
MTB>LET K3 = K2/(K1**3)
MTB>LET K4 = MEAN((C1-MEAN(C1))**4)
MTB>LET K5 = K4/(K1**4)
MTB>PRINT K3 K5
Calcule el sesgo y la curtosis de los datos de la resistencia de hilos de lana (use los datos que
estn en Excel Ejercicio 4, Tema 1 y cpielos en la C1 de MINITAB)
(En Excel: Coeficiente
de asimetra.)
27
SESGO Y CURTOSIS
Sesgo: grado de asimetra de una distribucin.

Si la curva de frecuencias suavizada tiene a la derecha una cola ms larga
que a la izquierda, se dice sesgada a la derecha o de sesgo positivo. En
caso contrario, sesgada a la izquierda o de sesgo negativo.

Sesgo = (media moda) / desviacin estndar

La curtosis mide cuan puntiaguda es una distribucin, en general con
referencia a la normal. Cuarto momento. Basada en el tamao de las colas.
Las siguientes distribuciones tienen la misma varianza, aproximadamente el
mismo sesgo, pero difieren marcadamente en la curtosis.
28
VARIABLES ALEATORIAS
1. Una variable aleatoria X (w) es una funcin que asigna a w
un nmero real finito.
Las variables aleatorias se representarn por letras
maysculas, mientras que el valor que toma esa variable se
representar por letras minsculas.
2. Por ejemplo, la cantidad de elementos defectuosos en un
determinado lote de un producto es una variable aleatoria
(digamos W). Esta variable aleatoria se denomina discreta,
ya que los valores w son nmeros enteros.
3. La resistencia a la compresin de un cilindro de concreto es
una variable aleatoria continua.
29
DISTRIBUCIONES DISCRETAS Y CONTINUAS
Variables aleatorias (v.a.) discretas:
Supongamos una v.a. X que puede asumir los valores x0, x1, , xk. La funcin
p (x) = Pr {X = x} , - < x <
se llama funcin de distribucin de probabilidades de X. Se cumple que:

=
=
= >
k
0 j
1 ) ( . 2
,..., 1 , 0 ; 0 ) ( . 1
j
j
x p
k j x p
Una v. a. discreta puede representarse por medio de una tabla de valores, por
medio de un grfico o por medio de una expresin matemtica. Por ejemplo,
supongamos que el experimento es lanzar un dado. La v.a. X es el nmero que
representa la cara y los posible valores que aparecen en la cara del dado son 1,
2, ,6. Es decir, x = 1, 2, , 6. El modelo puede expresarse de las tres maneras
que se muestran a continuacin.
30
DISTRIBUCIONES DISCRETAS
1/6 6
1/6 5
1/6 4
1/6 3
1/6 2
1/6 1
p(x) x
1 2 3 4 5 6
1/6
x
p (x)

p (x) = 1/6 si x = 1, 2, , 6
= 0 en otro caso
Otro ejemplo:
Supongamos que queremos sacar una muestra de n = 5 piezas de un proceso de
produccin y contar la cantidad de piezas defectuosas. El modelo se expresa:
x x
p p
x
x p ) 1 (
5
) (
) 5 (

|
|
.
|

\
|
=

31
DISTRIBUCIN ACUMULADA DISCRETA [ P (x) ]
La distribucin acumulada discreta de X se representa:
s
= s =
x xj
j
x p x X x P ) ( Pr ) (

Ejemplo: Sea

=
(
(
(
(

|
|
.
|

\
|
=
x
j
j
x P
0
5
2
5
) (
Los valores son:
j p(x) P(x)
0 0,03125 0,03125
1 0,15625 0,1875
2 0,31250 0,5
3 0,31250 0,8125
4 0,15625 0,96875
5 0,03125 1
32
VARIABLES ALEATORIAS CONTINUAS (1)
La distribucin acumulada F (x) es una distribucin de probabilidades continua si se
cumple:
1. Es no decreciente, es decir, si x
1
< x
2
, entonces F (x
1
) < F (x
2
)
2. Lm. F (x) = 0 cuando x tiende a - y lm. F (x) = 1 cuando x tiende a
La funcin de densidad f (x) = d/dx [F (x)]
Ejemplo:
F (x) = 1 e
-x
es una funcin de distribucin acumulada, ya que cumple con las
condiciones 1 y 2 sealadas arriba.
La funcin de densidad es f (x) = e
-x

}

=
x
dy y f x F ) ( ) (
La funcin de distribucin se puede representar de la forma:
33
VARIABLES ALEATORIAS CONTINUAS (2)
As como en el caso discreto, F (x) = Pr {X x}, en el caso continuo se expresa:
{ }
{ }
}
}

= = >
= = s s
b
b
a
b F dt t f b X
a F b F dt t f b X a
) ( ) ( Pr
bien o ); ( ) ( ) ( Pr
1
Ejemplo 1:
Supongamos que una variable aleatoria X tiene una funcin de densidad
uniforme entre 2 y 6 (U(2,6)). Calcular:
a) La probabilidad que la variable aleatoria tome el valor 3,5
b) Pr{3<X<4,8}
Observe que la probabilidad que la variable aleatoria est entre los valores a y
b, es precisamente el rea bajo la curva f (t), con lo cual la probabilidad que la
v. a. est entre sus lmites de definicin es 1.
Adicionalmente, si f (t) es continua, entonces la probabilidad que la variable
aleatoria tome un valor x* es cero, es decir, Pr [X=x*] = 0.
34
VARIABLES ALEATORIAS CONTINUAS (3)
f (x)
x
x 6 2
1/4
3 4,8
a) Cero
b) (4,8 3) = 0,45
Solucin al ejemplo 1:
Ejemplo 2:
Si la funcin f (x) = k (1 x
2
), 0 < x < 1, a) calcule el valor de k para que f (x) sea
una funcin de densidad y la probabilidad que una v. a. con esa funcin de
densidad asuma un valor: b) entre 0,1 y 0,2 y c) mayor que 0,5
Solucin al ejemplo 2:
2 3 1 1
1
0
2
/ ) ( = =
}
k dx x k
a)
b) 0,147 c) 0,313
35
VALORES ESPERADOS Y MOMENTOS DE LAS DISTRIBUCIONES (1)
El valor esperado de una funcin g (X) es:
| |
}


= =
r
r r
dx x f x X E ) (
| |

}
=


=
=
k
0 j
j j
discreta es X si ) )p(x g(x
continua es X si ) ( ) ( ) ( dx x f x g X g E
En particular:
se le llama el r-simo momento de la distribucin F (x)
Si r = 1, entonces
}


= = = n distribuci la de media ) ( ] [ dx x xf X E
Si la variable aleatoria X es discreta:

= x x xp todo para ) (
36
VALORES ESPERADOS Y MOMENTOS DE LAS DISTRIBUCIONES (2)
La varianza de X se define:
2
2
2
2 2 2
o
o
=
= = =
}


Tambin
) ( ) ( ] [ ] [ dx x f x X E X Var
La raz cuadrada positiva de o
2
se llama desviacin estndar (o) o desviacin
tpica
Ejercicios para resolver en la clase:
1. Supongamos una variable aleatoria continua y uniforme en el intervalo (a, b),
designada por U (a, b). Determinar la media y la varianza de la funcin.
2. Supongamos que el nmero de llamadas telefnicas a una central pequea
(durante un da) sigue la siguiente distribucin de probabilidades:
0,2 350
0,4 250
0,3 100
0,1 0
p(x) x
Determinar la media, la varianza y el tercer momento.
37
EJERCICIOS PARA RESOLVER EN CLASE (CONTINUACIN)
3. Suponga que una poblacin consta de los nmeros 1, 2, 3, 4, 5, 6 y 7 con igual
probabilidad. De esta poblacin se toma una muestra de tamao n = 4 (Seleccinela).
A) Calcular la media y la desviacin estndar de la poblacin. B) Calcular la media
y la desviacin estndar de la muestra.

= =
= =
7
1
7
1
2
i i
i i i i
p x p x ) ( ;
2
o Poblacin
1
1
2
2
1

= =

= =
n
x x
n
x
x
n
i
i
n
i
i
) (
s ;
Muestra
38
FUNCIONES GENERADORAS DE MOMENTOS (1)
La funcin generadora de momentos se define como una funcin de la variable real
t.
M (t) = E [e
tx
]; M(0) = 1
Una propiedad til de M (t) es que se pueden determinar los momentos de F (x)
diferenciando a M (t). En efecto:
}
}
} }
= =
=
=
|
.
|

\
|
= =
= r
r
tx r
tx
r
tx
r
r
dx x f x
dx x f e x
dx x f e
dt
dr
dx x f e
dt
d
t M
) ( (t) M
0 t Para
) (
) ( ) ( ) (
0 t
(r)
) (
39
FUNCIONES GENERADORAS DE MOMENTOS (2)
Ejemplo:
Sea la funcin de densidad f (x) = e
x
, x 0
1) Calcular M (t)
2) A partir de M (t), calcular la media de la funcin
Solucin:
t
t
dx e dx e e t M
t x x tx
>

= = =
} }



; ) (
) (
0 0
1)

1
2
= =

=
(

= 0, t si ;
) ( t t dt
d
2)

You might also like