Professional Documents
Culture Documents
Estadística Descriptiva
1.3.1 Distribuciones numéricas.
Es aquella distribución en la que la disposición tabular de los datos estadísticos se
encuentra ordenados en clases y con la frecuencia de cada clase; es decir los datos
originales de varios valores adyacentes del conjunto se combinan para formar un intervalo
de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar
datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número
total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos
es mayor de 20, entonces, se utiliza la distribución de frecuencias para los datos agrupados,
también se utilizara este tipo de distribución cuando se requiera elaborar gráficos lineales
como el histograma, el polígono de frecuencia o la ojiva.
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a
partir de estas determinar las características de la muestra y por consiguiente las de la población
de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media,
mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario
que sepamos como se agrupan los datos.
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el
número de clases en las que se van a agrupar los datos, existen otros para hacerlo.
Rango
C
k
Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado
en la muestra; luego,
16 13 16
14
FRECUENCIA
5.965 - 6.185
FRECUENCIA
11 12
7 7 6 6.185 - 6.405 10
5 8
6 6.405 - 6.625
2 6
6.625 - 6.845 4
1
6.845 - 7.065 2
0
-4 7.065 - 7.285 5.635 5.855 6.075 6.295 6.515 6.735 6.955 7.175 7.395 7.615
1 1
0.4
0.325
PROBABILIDAD
FRECUENCIA RELATIVA
0.8
0. 85
5.965 - 6.185
0.3
ACUMULADA
0. 675
6.185 - 6.405
0.6 0.175 0.175
0.2 0.15 6.405 - 6.625
0.125
0.4
0. 35
_
a) Media ( x ).
x * f i i
( 6.075 )( 2 ) ( 6.295 )( 5 ) ... ( 7.175 )( 6 ) 12.15 31.475 ... 43.05
x i 1
n 40 40
268.52
= 6.713 pu lg adas
40
f i 1
i
n= número de datos en la muestra
b) Mediana (Xmed).
n / 2 Fme 1
Xmed Li A
fme
40 / 2 14
6.625 ( 0.22 ) 6.7265
13
Donde:
Li = límite real inferior de la clase que contiene a la mediana
Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra
la mediana
fme = frecuencia de la clase en donde se encuentra la mediana
A = amplitud real de la clase en donde se encuentra la mediana
A = LRS-LRI
LRS = límite real superior de la clase que contiene a la mediana
LRI = límite real inferior de la clase que contiene a la mediana
N = número de datos en la muestra
c) Moda (Xmod).
d1
X mod Li A
d1 d 2
6
6.625 ( 0.22 ) 6.735 pu lg adas
6 6
Donde:
Li = límite real inferior de la clase que contiene a la moda
fmo fmo 1 13 7 6
d1 = =
fmo fmo 1 13 7 6
d2 = =
fmo = frecuencia de la clase que contiene a la moda
fmo-1= frecuencia de la clase anterior a la que contiene a la moda
fmo+1= frecuencia de la clase posterior a la que contiene a la moda
A = amplitud real de la clase que contiene a la moda
A = LRS – LRI
LRS = límite real superior de la clase que contiene a la moda
LRI = límite real inferior de la clase que contiene a la moda
k _ 2 k _ 2
( xi x ) fi ( xi x ) fi
s i 1
i 1
k
n 1
fi 1
i 1
Donde:
xi = marca de clase i
_
x = media aritmética
fi = frecuencia de la clase i
k