Professional Documents
Culture Documents
Mediana
Primer cuartil Tercer cuartil
Valor mnimo de la variable Valor mximo de la variable
Los bigotes tienen un lmite de prolongacin, de modo que aquellos valores atpicos que se
separan del cuerpo principal de datos se indican individualmente. A diferencia de otros
mtodos de presentacin de datos, los grficos de caja muestran los valores atpicos de la
variable. Llamaremos valores atpicos de la variable a aquellos que estn tan apartados del
cuerpo principal de los datos que bien pueden representar los efectos de causas extraas,
como algn error de medicin o registro. Su eliminacin no se justifica, ya que el propsito
del grfico de caja consiste en brindarnos un mayor conocimiento de la forma en que se
distribuyen los datos.
Tukey ( citado por Hildebrand, 1997) introduce un criterio para fijar los extremos de los
El Diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15 y 22
minutos. La distancia entre los extremos de la caja, 7 minutos, es el rango intercuartil. Este
rango es la distancia entre el primer y tercer cuartel; muestra la propagacin o dispersin de
la mayora de las entregas.
Cul es la importancia entonces del uso de los grficos de caja?
En particular, los grficos de caja vinculan los conceptos de mediana, cuartiles, valor mnimo
y mximo que los alumnos manejan individualmente pero no en forma global.
representadas mediante
y donde cada
tiene
por lo menos dos dgitos. Una forma rpida de obtener una representacin
visual del conjunto de datos es construir un diagrama de tallos y hojas. Este
diagrama es usado cuando hay un nmero no muy pequeo de datos. Los
siguientes son los pasos para construir un diagrama de tallos y hojas:
1. Seleccionar uno o ms dgitos iniciales para los valores de tallo. El
dgito(s) final(es) se convierte (n) en hojas. Para facilitar la
determinacin de la forma de la distribucin de los datos se necesitan al
menos 5 tallos.
2. Hacer una lista de valores de tallo en una columna vertical.
3. Registrar las hojas por cada observacin junto al valor correspondiente
del tallo.
4. Indicar las unidades para tallos y hojas en algn lugar del diagrama.
Muchos de los procedimientos estadsticos que se desarrollarn en la siguientes
unidades suponen que la variable aleatoria estudiada tiene al menos una
distribucin aproximadamente normal, para la cual el diagrama de tallos y
hojas tiene forma de campana.
Los diagramas de tallos y hojas nos dan una idea de la localizacin de los datos
y de la forma de la distribucin. Esta tcnica funciona bien para los conjuntos
de datos que no tienen una dispersin muy grande.
Ejemplo
La siguiente tabla representa el porcentaje de algodn en un material utilizado
para la fabricacin de camisas para caballeros.
32
156789
18
33
114566666688
(21) 34
011122355666667777779
25
35
00111234456789
11
36
234888
37
13689
Algunas veces, la utilizacin del primero o de los dos primeros dgitos de los
datos puntuales como tallos no proporcionan suficientes tallos como para
permitirnos detectar la forma de su distribucin. Una manera de solucionar esto
es utilizar tallos dobles. Es decir, utilizar cada tallos dos veces: una vez para
trazar las hojas inferiores 0, 1, 2, 3, 4, y a continuacin nuevamente para
trazar las hojas superiores 5, 6, 7, 8, 9. El siguiente grfico ilustra lo anterior