Professional Documents
Culture Documents
ESTADSTICA
Introduccin:
Distribuciones de Frecuencias
Ejemplo 1
El gobierno desea averiguar si el nmero medio de hijos por familia ha descendido respecto a la
dcada anterior. Para ello ha encuestado a 50 familias respecto al nmero de hijos y ha obtenido
los siguientes datos:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Observando los datos del ejemplo es fcil adivinar cual ser el primer paso en la
organizacin de los datos; consistir en agrupar aquellos datos que se repiten varias veces.
Tenemos las siguientes definiciones:
FRECUENCIA ABSOLUTA (fi): es el nmero de veces que se repite un determinado valor (xi) de
la variable. Ej1: para el dato x1=0 n1=2, para el dato x4=3 n4=15.
FRECUENCIA RELATIVA (ri): es igual a la frecuencia absoluta dividida por el nmero total de
datos, es decir por el tamao muestral ri=fi/n. Ei1.: r1=2/50=0.04, r4=15/50=0.3
FRECUENCIA ACUMULADA (Fi): Nos dice el nmero de datos que hay igual o inferiores a uno
i
determinado. Se calcula: Fi n j Fi 1 f i
j 1
Ej1: N1=2, N4=42.
1
TABLA DE FRECUENCIAS:
Llamamos as a una tabla que presenta todas las clases o categoras de la variable y sus
respectivas frecuencias, que puede estar ordenada o no.
Ejemplo 1:
xi fi ri Fi Ri
0 2 0,04 2 0,04
1 4 0,08 6 0,12
2 21 0,42 27 0,54
3 15 0,3 42 0,84
4 6 0,12 48 0,96
5 1 0,02 49 0,98
6 1 0,02 50 1
50 1
Hemos visto en el caso anterior que los valores distintos que tomaba la variable eran muchos,
es decir k era grande y eso haca que la tabla obtenida fuera muy poco manejable y por tanto poco
clarificadora. Esto nos va a ocurrir frecuentemente en el caso en que la variable a estudiar sea
continua. La solucin es agrupar los diferentes valores de la variable en intervalos o
intervalos de clase. Teniendo en cuenta que lo que ganamos en manejabilidad lo perdemos en
informacin, con lo que los resultados sern aproximados.
Agrupar en intervalos de clase consiste en agrupar los datos en un nmero relativamente pequeo
de intervalos que cumplan:
Llamaremos:
A las fronteras del intervalo, lmites inferior y superior de la clase y los denotaremos por
Li, Ls.
Marca de clase (xi) al punto medio del intervalo, es decir, al promedio aritmtico entre el
L L
lmite inferior y superior: x i i s .Es el valor que tomamos como representativo.
2
Amplitud (ai) a la diferencia entre el extremo superior e inferior: a i= Ls - Li .
2
1. Empezamos determinando el recorrido de la variable o rango de valores que tenemos en
la muestra. Se define como la diferencia entre el mayor y el menor valor de la variable.
Re=xmax-xmin
2. Nmero de clases: depende del tamao de la muestra. Para muestras de tamao
moderado, n <50, se suele elegir un nmero de clases igual a n , o bien se usa la formula
de Sturtges, (se toma el resultado de calcular el logaritmo de n, dividir por el logaritmo de 2
fi - fi - 1
Mo Li .ai
(fi - fi - 1) (fi - fi 1)
Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:
Intervalos fi
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100
3
(42 - 18)
Mo 66 .3 67,846 68
(42 - 18) (42 - 27)
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
K .N
, K 1,2,...99
100
En segundo lugar utilizo la frmula para saber su valor ms aproximado
K.n
- Fj - 1
PK Lj 100 .aj
fj
Ejemplo
Calcular el percentil 35 y 60 de la distribucin de la tabla:
35. 65
Intervalos fi Fi fi% Fi%
Posicin Percentil 35, 22,75
[50, 60) 8 8 12,31% 12,31% 100
[60, 70) 10 18 15,38% 27,69%
22,75 18
[70, 80) 16 34 24,62% 52,31% P35 70 . 10 72, 97 73
[80, 90) 14 48 21,54% 73,85% 16
[90, 100) 10 58 15,38% 89,23%
[100, 110) 5 63 7,69% 96,92%
60. 65
[110, 120) 2 65 3,08% 100,00% Posicin Percentil 60, 39
100
65 100,0%
39 34
P60 80 . 10 83,57 84
14
4
Contenidos:
Ejercicios Propuestos:
1. Los resultados electorales para Gobernador en la Provincia de Jujuy en el ao 2011 se
registraron los siguientes resultados: Frente para la Victoria: 160.402 votos, Unin para el
Desarrollo Social: 73.276 votos, Frente Primero Jujuy: 29.039 votos, Frente Amplio
Progresista: 8.951 votos, Frente de Izquierda y de los Trabajadores: 5.583 votos y otros:
3483 votos.
0 2 5 0 3 1 8 0 3 1 1
9 2 4 0 2 9 3 0 1 9 8
a. Construir la distribucin de frecuencias relativas y la de frecuencias relativas
acumuladas.
b. Representar ambas distribuciones
c. Qu proporcin de personas no compraron nunca dicha marca?
d. Qu porcentaje de consumidores adquirieron dicha marca menos de cinco veces?
e. Se puede obtener alguna conclusin del estudio?
f. Cul es el P60 y el valor del Q3?
3.9 4.7 3.7 5.6 4.3 4.9 5.0 6.1 5.1 4.5
5.3 3.9 4.3 5.0 6.0 4.7 5.1 4.2 4.4 5.8
3.3 4.3 4.1 5.8 4.4 3.8 6.1 4.3 5.3 4.5
4.0 5.4 3.9 4.7 3.3 4.5 4.7 4.2 4.5 4.8
a. Haga una distribucin de frecuencias para los datos agrupados, elija el nmero de
intervalos adecuados.
b. Segn la poltica de la Universidad el estudiante debe tener un promedio de
calificaciones de 5.0 o mayor como requisito para aprobar la asignatura, en virtud de
ello Qu porcentaje de los estudiantes necesita mejorar sus calificaciones?
c. Qu porcentaje de los estudiantes necesita mejorar sus calificaciones partiendo de
los datos sin agrupar?
d. Qu diferencia encuentra en las respuestas a los dos tems anteriores?, puede
justificar la diferencia?
e. Cul es el valor del P80?
5. Los siguientes datos corresponden a las edades de 40 personas que sufrieron lesiones
viales en un municipio de la Provincia de Jujuy Nov y Dic/2010:
7 11 20 27 31 18 20 30
22 28 45 25 7 13 15 5
1 27 8 25 17 17 19 17
19 25 4 33 22 43 25 18
32 22 40 56 62 23 27 24
a. Realice una distribucin de frecuencias para los datos agrupados, elija el nmero de
intervalos adecuados.
b. El 80% de los lesionados entre que edades se encuentran?
c. Cul es el intervalo de edad ms afectado? Y el menos?
d. Determine el 65% de edades ms involucradas en las lesiones viales.
e. Determine el valor de Q1, Q2, y Q3.
Bibliografa:
Cap. 2 - "Estadstica Para Las Ciencias Sociales", Ferris J. Ritchey, 2008, Ed. Mc. Graw
Hill. Mxico.
Cap. 3 - "Estadstica para las Ciencias del Comportamiento". Robert R. Pagano, 2006, Ed.
Internacional Thomson Editores
Cap. 2 y 3 Introduccin a la Estadstica para las Ciencias Sociales. Pea et al., 2000,
Ed. Mc Graw Hill. Espaa.
Apuntes de la Ctedra