You are on page 1of 11

TALLER DE ANLISIS

EXPLORATORIO DE DATOS
Diagrama de caja y bigotes

Erika Alejandra Escamilla Maldonado


Gina Lorena Maldonado Ihuitz
Los diagramas de Caja y Bigotes son una representacin visual de un conjunto de datos
que describe varias caractersticas importantes, al mismo tiempo, tales como la
dispersin y simetra.
Est diseada para representar variables cuantitativas en escala de Intervalo o de razn.
Es una grfica de un conjunto de datos, basada en los valores conocidos como:
el resumen de los cinco nmeros

Para su construccin necesitamos conocer estos cinco nmeros.


Resumen de los cinco nmeros
Se le conoce as al conjunto de los siguientes cinco valores:

El valor ms pequeo
El primer Cuartil (Q1)
La Mediana (Q2)
El tercer Cuartil (Q3)
El valor ms grande
Cmo se construye
Se dibuja una caja rectangular (horizontal o verticalmente) cuyos extremos se localicen
en el primer y el tercer cuartil. Esta caja contiene al 50% de los datos centrales.
A la altura donde se localiza la mediana se traza una lnea vertical a travs de la caja.

Usando el rango intercuartlico (RIC), se localizan los lmites. En el diagrama de caja los
lmites se encuentran a (1.5*RIC) debajo de Q1 y a (1.5*RIC) arriba de Q3. Los datos
que quedan fuera de estos lmites se conocen como observaciones atpicas.
Se trazan unas lneas punteadas a los lados de la caja que se le conocen como bigotes.
Los bigotes van desde los extremos de la caja hasta los valores menor y mayor de los
lmites calculados anteriormente
Por ltimo mediante un asterisco se indica la localizacin de las observaciones atpicas.
Ejemplo 1
A continuacin se presentan los salarios iniciales de 12 recin egresados de la
carrera de Administracin, ordenados de menor a mayor

3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925

Q1=3465 Q2=3505 Q3=3600

(Mediana)
RIC=Q3-Q1=3600-3465= 135
Lmite inferior=Q1-1.5*RIC = 3262.5
Lmite superior= Q3 + 1.5*RIC= 3802.5
Diagrama de Caja y Bigotes
Mediana
Lmite. Lmite.
Inferior Superior
Q1 Q3 Observacin
atpica

RIC

3000 3100 3200 3300 3400 3500 3600 3700 3800 3900 4000
Ejemplo 2
Los siguientes datos representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
Lo primero es ordenar la distribucin para ubicar los cinco nmeros:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

Donde Valor min. = 20


Q1 = 24.5
Q2=Mediana = 33.5
Q3 = 39
Valor mx.= 45
Diagrama de Caja y Bigotes

En este ejemplo los bigotes se trazaron hasta los valores mnimo y mximo

La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre
el 50% y el 75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25%
de los ms jvenes estn ms concentrados que el 25% de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est
comprendido en 14,5 aos.
Ventajas y Desventajas
Ventajas
Nos permite apreciar visualmente el comportamiento de parte de los datos (p.e.
cmo se dispersa el 25% de los valores mas grandes o ms pequeos, o el 50% de
los datos centrales)
Nos permite apreciar la simetra de los datos

Desventaja
No es fcil su construccin. Requiere de algunos clculos y medidas adicionales
Diagramas de caja y bigotes
segn el sesgo
Sesgo negativo Simtrica Sesgo positivo
Referencias
http://www.estadisticaparatodos.es/taller/graficas/cajas.html
http://www.ehowenespanol.com/grafico-cajas-bigotes-como_198327/
Anderson, D.R., Sweeney, D.J. & Williams, T.A. (2012). Estadstica para negocios y
economa. (11 ed.). Mxico: Editorial Cengage Learning. pp. 110-111.
Berenson, M.L. & Levine, D.M. (1992). Estadstica bsica en administracin,
conceptos y aplicaciones. (4 ed.).Mxico: Prentice Hall Hispanoamericana.

You might also like