esTADISTICA DESCRIPTIVA 195
. Diagrama de talio y hoja
: fn este punto, se eonsideran algunos métodes grificos de estudio de la distribucién de una variable
En ae su El primero enraa cons o ques lama un diagram de tallo y ofa, mét080
guya deseripcion orginal, de Job Tukey, se semonta a 977 {50
‘Et diagrama de allo y hoja consiste en una sucesion de filas hhorizontales de némeros. Cada una
tiene ome sotto un nimero llamado 0 allo, mientras que Tos denis ‘mimeros de las filas se aman
hojas, No existenreglas esrictas sobre la manera de elaborar este Po de diagrama. En lo fundamen-
tal, se siguen los pasos siguientes:
Construccién de un diagrama de tallo y hojas
: 1. Se seleccionan algunos nimeros convenientes como tllos. Es usual que se trate del primer
dligito 0 los primeros dos digitos del conjunto de dates .
2. Se rotulan las filas con los tallos seleccionados.
3. Se reproduce grificamente el conjunto de datos,
tailo como una hoje.
4, Se acuesta la grifica sobre uno d
mediante el registro del digito que sigue at
Ja distribucién
fe sus lados para darse una idea de la forma de
Estas ideas se ilustran en cl ejemplo 6.2.1
horas de baterias de litio pera un
jemplo 62.1, Enel estudio dela arabe aletoria Xt vida il
roa de 50 bateris y se determi
‘co de calculadora de bolsillo, se obtiene una muestre ales!
riodelo especifi
vrata vida iil de cada una. Los datos rsultantes son Tos siguientes:
25 S64 205 3920
2066 608 om
2584 4 3779
1009 76
3B. 37 3894
i 139882 2 662
oe S60 47
iBT
a iw 8
‘A fin de consir un diagrams de alloy hoa de estos dos, primera se sesoeet fos niimeros qe
tngen como “alos. Es fccuente que converge ware prime ake a6 S170 Te ‘como su alle. Sin
___anmer e oes dgios como 318, se expresa como némero de cuatro st (0318) mediante lain-tusibn
ae apuerda, estos dats entrain uso de fos cinco tallos 0, ® 28 4, Luego, se usa el
‘labora al entimerar 10s tallos @ maners de
< Indo Aigio del nfimiero como su “hoja” E diagrams <=
: gue i al como se lusts en la Gigura 6.2, La primers observacin, #22. So tallo 4 y hoja 2
2b. El conjunto de datos completo. registado
a representa enol diagrama como se nuestra en la figura
ae rerrerjen cn el que aparecen ls observaciones, sel dela figura 6°
Ses msonable suponer que X tiene distibucin normal? La resp 8
costa el diagrama de tlloy oj sobre su lado y buscar l forma de campans
sta pregunta eonsisie 2
racteristica de le dens196 PRORABALIDAD Y ESTADISTICA
0) 0 0) 394se07853234720267400553034
ne 1 osais72ax3
ale ea 2 0567
ales 3| o7s93
al ala ala
2 °
FIGURAG2
2) Los sees 6. {2.34 sn los alos de un digrama de alloy oja; bel nimero 4285 iene tallo4y hoja2s
6) diagram alo yoja completo dela muestra de vida iil de plas del ejemplo 6.2.1
allo y hojas de horas = 50
Unidad de hojas = 1-0
an
o00c0222332334084
55556677785 '
oaza3eced
57
FIGURA «3
Diagrams de dabie tall y hoje, con las hos en orden.
(ds soccssl Esta ausente dicha forma, lo cual hace suponer que X'no es miembro de ta familia de varia~
os sleatovss normales
‘Netz, 20 el ejemplo precedente, que el pritner tallo tiene numerosas hojas. Ello es frecuente
‘ccajuntos de datos son grandes 0 no existe mucha variabilidad en los datos. En tales casos,
suele sec constructivo generar lo que se llama un diagrama de doble allo y hoja. Eilo se logra al usar
dos yezes cad tllo. Se grafican las hojes bajas 0, 1. 2, 3.y 4 en el primer tallo,y las hojes altas 5, 6.
7, 8 ea zi segucay. El diagrama de doble tallo y hoje de los datos del ejemplo 6.2.1 se muestra en Ia
figure 6 3. Se generé con el programs MINITAB. Este diagrama muesira, inclusive con mayor clari~
dad 2 2 dribucién a panir de la cual se extrajo la muestra probablemente no es normal, De
2 ~.. ana distribucién exponencia!. Ahora, se sabe que wna dens sable >
£19) = (1/B) exp (VB) x>0 B>0
En este punso. tg tarea del investigador consiste en estimar el valor numérico de 8, de modo que
puedan calcsiazse probabilidades en el futuro mediante la densidad exponencial.
Histogramas y ojiv:
El diagrams allo y hoja permite echar un vistazo répido a un conjunto de datos. Es una manera itil
de darse un idea de la forma de una distribucién cuando et tamafio del conjunto de datos es modera-ESTADISTICA DESCRIPTVA 197
TABLA GL
Niimero recomendado de clases para uso Eee)
en las subdivisiones de datos numéricos en a
funcién del tamafio de la muestra
‘Tama de In muestra [Numero de clases
“Menos de 16| Datos insufcients
16-31 5
2-6 a
4127 7
n2e-255, 8
256-511 °
512-1023 10
1 24-2087 "
2088-4 085, 2
4096-8 190, B
do. Se acompaiia de la ventaja de preservar, hasta cierto punto, la legiblidad de los valores de datos
reales en el diagrama, Sin embargo, es una técnica que no funciona satisfactoriamente con grandes
conjuntos de datos. En tal caso, se recurre a una técnica que se ha usado durante muchos afos y que
suele observarse en el despliegue de datos en revistas, periédicos, informes corporativos y presenta-
cicnes. Esta grfica, lamada histograma, es una gréfica de barras verticales u horizontaies, Las ba-
ras o clases se definen de manera tal que cads observacion ses parte de uns y slo ura categoria, La
anchura de cada barra es igual, de modo que el rea de la barra sea proporcisnal al niimero de obser-
vaciones de la ciase respectiva. Ello faclita las comparaciones visuales de las frecuencias y porcen-
tajes de las categorias. Asimismo, permite darse ura idea dela familia de vanables aleatorias a la cual
pertenece la variable de estudio, con s6lo observar la forma del histograma.
Son muchas las formas de scleccionar los limites de las clases. Cada paquete estadistico usa
para ello swppropio algoritmo, el cual difiere de un paquete a otro. Si se usan varios paquetes para
_taficar un conjunto de datos dado con su (éenica por omisién, los histogramas pueden variar leve-
mente en ei niimero de clases scleccionadas y los valores limite de las clases. La forma general del
histograma seria la misma con todes ellos.
Aqui, se presenta un algoritmo para ta selecci6n del miro: > clases v lor Ties ¢
Pielo al Wa NOURISH He SIN
clases tengan !a misma anchura y que dingin punto de date: jue. tener e: valor ¢..~ mite. 4g
nos paquetes de computadora permiten al usuario seleccionsr el aiimero de clases o especificar los
valores limite, En tal caso, el algoritmo puede usarse para controlar la construcci6n del histograina, i
asi se prefiere,
gue e2se punto de dav
Reglas para dividir los datos en clases
1. Decidir el niimero de clases que interesa. El nimero seleccionado depende del niimero de ab-
servaciones disponibies. En la tabla 6.1. se presentan lincamientos sugeridos del nimero de
clases que se usa, en fuicidn del tamatio de la muestra, Se basa en la regla de Sturges, formula
‘que desarrollé H. A. Sturges en 1926.198. PROBABILIDAD Y ESIADISTICA
‘TABLA 62
TAMhades y medias unidades de datos presentados segan el grado de exactitud especificado
Datos preventados a 1a unidad mas cercana siguiente Unidad 2 unidad
Entero 1 05
Décima (un lugar decimal) 1 0s
‘Centésina (dos lugares decimales) dot 0.003
Milgsima (es Iugares decimals) 001 0.000 5
0.000 1 0.00005
Dicezmnilésima (cuatro lugares decimales)
2
4
LLocatizar las observaciones de valores mximo y minimo.
raeaeea a iferencia entre [2s observaciones de valores miximo y minimo. Se rests l valor
minime del rinimo. Esta diferencia se llama rango de los datos.
aes elongitud minima necesaria para cubrr este rango, al diviitlo entre el ninety de
Sinses que se pretende. Esta longitud es la minima necesaria para cubrt el ang * el limite
sicioe de la primera clase se toma com el punto de datos miaimo, Sin embargo, pare BAY
tivar que ningin punto de datos correspond aun limite, se definen [os limites de mane tal que
jneluyen un decimal mis que los datos. Asi pues e nica la primera class wn Powe Pov debajo
delpaimer punto de datos. Athacerlo. a fongitud de clase minima requeride Pam cubriretrango
se ents para inclir el punto de datos méximo de la itima clase, Por at razén, la
ioogitud realmente usada debe ser un poco mayor que el minimo
So eaoula la Tongitud de clase real que se usaré al redondear la longitad minima 6 sentido
Superior al mismo nimero de lugares decimales que [os datos mismos, St {a longitud mi
Ju ene por azar el mismo nimero de decimales que los datos, x redondes 8 la nidad supe-
yr més cercana, Por ejemplo, si se tienen datos con exactitud de un decimal ¥ ft longitud
tes de 1.7, sc usa 1.8 para obtener ie longitud de clase
reel que se utilizar
er date inferior dela primera clase se ubiea 1/2 unidad por debajo dela observacton mini
aan o tabla 62, e presentan las unidades medias unidades 4e diversos tines de cor"
tos az daws,
Los limites de clases restantes se Culouis +t suit. “Ta long! aly
Elemplo 62.2. Considere ls dios de ejemplo 62.1. El conjunto de datos 50 abservaciones,
coer eee iabla 6, el nimero sugerido de clases qu debe sare es ses, Abo bien, oe los
puntos de datos mixioo (4285) y minimo (14). Se wsan para calcula of RED. la variable aleatoria X depends