You are on page 1of 3

ESCUELA SUPERIOR POLITECNICA DE CHIMBORAZO

FACULTAD DE INFORMATICA Y ELECTRONICA


INGENOERIA EN ELECTRONICA TELECOMUNICACIONES Y REDES

Nombre: Herick Paca


Cdigo: 655
Semestre. Cuarto B
Diagrama de Cajas

El diagrama de caja es una presentacin visual que describe al mismo tiempo varias
caractersticas importantes de un conjunto de datos, tales como el centro, la
dispersin, la simetra o asimetra y la identificacin de observaciones atpicas.
El diagrama de caja representa los tres cuartiles, y los valores mnimo y mximo de los
datos sobre un rectngulo (caja), alineado horizontal o verticalmente.
Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos
muestran el recorrido intercuartlico. Este rectngulo est dividido por un segmento
vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los
cuartiles primero y tercero (recordemos que el segundo cuartil coincide con la
mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mnimo y mximo de la variable. Las lneas que sobresalen de la caja se llaman
bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que cualquier dato o
caso que no se encuentre dentro de este rango es marcado e identificado
individualmente.

Mediana
Primer cuartil Tercer cuartil
Valor mnimo de la variable Valor mximo de la variable
Los bigotes tienen un lmite de prolongacin, de modo que aquellos valores atpicos
que se separan del cuerpo principal de datos se indican individualmente. A diferencia
de otros mtodos de presentacin de datos, los grficos de caja muestran los valores
atpicos de la variable. Llamaremos valores atpicos de la variable a aquellos que
estn tan apartados del cuerpo principal de los datos que bien pueden representar los
efectos de causas extraas, como algn error de medicin o registro. Su eliminacin

no se justifica, ya que el propsito del grfico de caja consiste en brindarnos un mayor


conocimiento de la forma en que se distribuyen los datos.
Tukey ( citado por Hildebrand, 1997) introduce un criterio para fijar los extremos de los
bigotes. Para esto calcula 4 barreras, dos interiores y dos exteriores:
Barrera interior inferior=Primer cuartil 1,5 . RIC
Barrera interior superior=Tercer cuartil + 1,5 . RIC
Barrera exterior inferior=Primer cuartil 3 . RIC
Barrera exterior superior=Tercer cuartil + 3 . RIC
Recordemos que RIC (Recorrido Intercuartlico) es igual a la diferencia entre el Tercer
cuartil y el Primero.
Si se consideran los valores de la variable comprendidos entre las dos barreras
interiores, el valor mnimo de la variable y el valor mximo son los extremos de los
bigotes.
Si existen valores de la variable comprendidos entre las barreras interiores y exteriores
se consideran valores atpicos y se indican con *. Si existieren valores fuera de las
barreras exteriores se consideran valores todava ms atpicos y se indican con .
Por otra parte, este tipo de grfico nos proporciona informacin con respecto a la
simetra o asimetra de la distribucin. Se utilizan los siguientes criterios: si la mediana
est en el centro de la caja o cerca de l, constituye un indicio de simetra de los
datos, si la mediana est considerablemente ms cerca del primer cuartil indica que
los datos son positivamente asimtricos y si est ms cerca del tercer cuartil, seala
que los datos son negativamente asimtricos. Asimismo, la longitud relativa de los
bigotes se puede emplear como un indicio de su asimetra.
EJEMPLO DISTRIBUCIN DE EDADES
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan
la edad de un colectivo de 20 personas.
36

25

37

24

39

20

36

45

31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS


Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

31

CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin.
Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmtica de dicho valor
y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de
la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2
=10 ; la mediana es la media aritmtica de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribucin. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmx).
INFORMACIN DEL DIAGRAMA
Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que
entre el 50% y el 75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25%
de los ms jvenes estn ms concentrados que el 25% de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est
comprendido en 14,5 aos.

You might also like