You are on page 1of 3

1.2.

Funcin de Distribucin Emprica Disponemos de la distribucin de frecuencias de la variable edad (en aos) de 26 alumnos, donde las columnas 2, 3 y 4 corresponden a frecuencias absolutas, relativas y porcentajes, mientras que las tres ltimas son las equivalentes acumuladas:
Variable X 17 18 19 20 21 22 ni 6 10 2 3 2 3 26 fi 0.231 0.385 0.077 0.115 0.077 0.115 1 pi 23.1 28.5 7.7 11.5 7.7 11.5 100 Ni 6 16 18 21 23 26 Fi 0.231 0.615 0.692 0.808 0.885 1 Pi 23.1 61.5 69.2 80.8 88.5 100

Si utilizsemos las frecuencias acumuladas (absolutas o relativas) o los porcentajes acumulados para hacer una representacin grfica de la distribucin, obtendremos el Diagrama Acumulativo de Frecuencias. Utilizando la frecuencia relativa acumulada tenemos la grfica representada a continuacin.
1,00

,80 Frecuencia Relativa Acumulada

,60

,40

,20

0,00 15 16 17 18 19 20 21 22 23 24 25

Edad

Dicha grfica corresponde a una funcin a la que llamamos Funcin de Distribucin Emprica. A nuestros datos tendremos asociada esta primera funcin, que ser de tipo escalonada. En concreto, para el ejemplo que estamos siguiendo esta funcin sera:
0 0.231 0.615 Fn ( x ) = 0.692 0.808 0.885 1 si x < 17 si 17 x < 18 si 18 x < 19 si 19 x < 20 si 20 x < 21 si 21 x < 22 si x 22

Podemos calcular, por ejemplo, Fn(183) = 0615. Concluimos que un 615% de los alumnos del grupo tienen una edad menor o igual a 183 aos. En este caso, dada una edad, la funcin de distribucin emprica nos indica la proporcin de individuos cuya edad es menor o igual a la dada. En general:

Dado un valor de la variable, la Funcin de Distribucin Emprica nos da la proporcin de elementos muestrales con valores de la variable menores o iguales que el dado. Analizamos a continuacin otra variable: uros que los alumnos llevan en el bolsillo en el momento de la encuesta. Los datos, ordenados de menor a mayor, son los que aparecen en la tabla:
Variable 0,00 0,25 1,00 3,00 3,35 3,50 6,10 6,50 6,95 Frecuencia (ni) 1 1 1 1 1 1 1 1 1 Variable 7,00 8,50 10,00 10,65 11,00 11,25 15,45 20,00 22,85 Frecuencia (ni) 2 1 2 1 1 2 1 1 1 Variable 25,35 35,50 51,20 57,25 58,50 96,00 Frecuencia (ni) 1 1 1 1 1 1 27

Observando los datos de esta variable vemos que, sin duda, presenta mayor variabilidad que la anterior. Decidimos agrupar estos datos en los cinco intervalos siguientes:
Li-1- Li 0-5 5-12 12-30 30-60 60-100 ni 6 12 4 4 1 27

La idea de frecuencia relativa y las acumuladas son aplicadas a esta distribucin, obteniendo la siguiente tabla:
Li-1- Li 0-5 5-12 12-30 30-60 60-100 ni 6 12 4 4 1 27 Ni 6 18 22 26 27 fi 0222 0444 0148 0148 0037 1 Fi 0222 0666 0814 0962 1 pi 2222 4444 1481 1481 370 100 Pi 2222 6666 8148 9629 100 ai 5 7 18 30 40 hi 0044 0063 0008 0005 0001

Donde ai representa la amplitud del intervalo i-simo (intervalo genrico que representa a todos los intervalos), de manera que ai=Li-Li-1. La ltima columna representa la densidad de frecuencia de cada intervalo, o sea, cantidad de frecuencia (absoluta o relativa) por unidad de medida del intervalo. En este caso se ha construido como cociente entre la frecuencia relativa y la amplitud de cada intervalo. De nuevo construiremos la funcin de distribucin emprica asociada a esta distribucin. En el caso de datos agrupados en intervalos construiremos puntos en el plano donde la primera coordenada es el extremo superior de cada intervalo y la segunda es la correspondiente frecuencia relativa acumulada. Uniendo esos puntos mediante segmentos tenemos la grfica que se muestra a continuacin. Los segmentos rectilneos que unen esos puntos indican que los datos se van acumulando de manera uniforme conforme avanzamos de izquierda a derecha dentro de cada intervalo, lo cual equivale a suponer la distribucin uniforme de los datos dentro de los intervalos.

Cuanto ms incierto sea ese supuesto ms inexactas sern las conclusiones que extraigamos de la funcin de distribucin emprica. Recordando la expresin que nos proporcionaba la ecuacin de la recta que pasa por dos puntos podremos construir la ecuacin correspondiente a cada tramo y, as, escribir la funcin de distribucin emprica asociada a esta distribucin. Para nuestro ejemplo resulta:

Funcin de Distribucin Emprica


1,2

Frecuencia Relativa Acumulada

1 0,8 0,6 0,4 0,2 0 -50 0 50 100 150

Intervalos

x<0 0 0 '044 x 0 x<5 0 '063x 0 '095 5 x < 12 Fn ( x) = 0 '008 x + 0 '567 12 x < 30 0 '005 x + 0 '666 30 x < 60 0 '001x + 0 '907 60 x < 100 x 100 1

Observemos que las pendientes o coeficientes angulares de los distintos segmentos coinciden con las densidades de frecuencias de los correspondientes intervalos. La curva que resulta en este caso es creciente y continua, lo que resulta dos caractersticas fundamentales de las curvas de distribucin empricas para datos agrupados en intervalos. Usando esta funcin calculamos: Fn(3) = 00443 = 0133. O sea, un 133% de los alumnos llevan en el bolsillo 3 o menos. Fn(20) = 000820+0567 = 0732, que nos lleva a que un 732 de los alumnos llevan 20 o menos. Por ltimo, si calculamos: Fn(30) - Fn(10) = (000530+0666) - (006310-0095) = 0275, por lo que podremos afirmar que hay 275% de alumnos que llevan en el bolsillo entre 10 y 30 euros.

You might also like