Professional Documents
Culture Documents
EXPLORATORIO DE DATOS
Diagrama de caja y bigotes
El valor ms pequeo
El primer Cuartil (Q1)
La Mediana (Q2)
El tercer Cuartil (Q3)
El valor ms grande
Cmo se construye
Se dibuja una caja rectangular (horizontal o verticalmente) cuyos extremos se localicen
en el primer y el tercer cuartil. Esta caja contiene al 50% de los datos centrales.
A la altura donde se localiza la mediana se traza una lnea vertical a travs de la caja.
Usando el rango intercuartlico (RIC), se localizan los lmites. En el diagrama de caja los
lmites se encuentran a (1.5*RIC) debajo de Q1 y a (1.5*RIC) arriba de Q3. Los datos
que quedan fuera de estos lmites se conocen como observaciones atpicas.
Se trazan unas lneas punteadas a los lados de la caja que se le conocen como bigotes.
Los bigotes van desde los extremos de la caja hasta los valores menor y mayor de los
lmites calculados anteriormente
Por ltimo mediante un asterisco se indica la localizacin de las observaciones atpicas.
Ejemplo 1
A continuacin se presentan los salarios iniciales de 12 recin egresados de la
carrera de Administracin, ordenados de menor a mayor
3310 3355 3450 3480 3480 3490 3520 3540 3550 3650 3730 3925
(Mediana)
RIC=Q3-Q1=3600-3465= 135
Lmite inferior=Q1-1.5*RIC = 3262.5
Lmite superior= Q3 + 1.5*RIC= 3802.5
Diagrama de Caja y Bigotes
Mediana
Lmite. Lmite.
Inferior Superior
Q1 Q3 Observacin
atpica
RIC
3000 3100 3200 3300 3400 3500 3600 3700 3800 3900 4000
Ejemplo 2
Los siguientes datos representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
Lo primero es ordenar la distribucin para ubicar los cinco nmeros:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
En este ejemplo los bigotes se trazaron hasta los valores mnimo y mximo
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las
edades comprendidas entre el 25% y el 50% de la poblacin est ms dispersa que entre
el 50% y el 75%.
El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25%
de los ms jvenes estn ms concentrados que el 25% de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est
comprendido en 14,5 aos.
Ventajas y Desventajas
Ventajas
Nos permite apreciar visualmente el comportamiento de parte de los datos (p.e.
cmo se dispersa el 25% de los valores mas grandes o ms pequeos, o el 50% de
los datos centrales)
Nos permite apreciar la simetra de los datos
Desventaja
No es fcil su construccin. Requiere de algunos clculos y medidas adicionales
Diagramas de caja y bigotes
segn el sesgo
Sesgo negativo Simtrica Sesgo positivo
Referencias
http://www.estadisticaparatodos.es/taller/graficas/cajas.html
http://www.ehowenespanol.com/grafico-cajas-bigotes-como_198327/
Anderson, D.R., Sweeney, D.J. & Williams, T.A. (2012). Estadstica para negocios y
economa. (11 ed.). Mxico: Editorial Cengage Learning. pp. 110-111.
Berenson, M.L. & Levine, D.M. (1992). Estadstica bsica en administracin,
conceptos y aplicaciones. (4 ed.).Mxico: Prentice Hall Hispanoamericana.