You are on page 1of 8
esTADISTICA DESCRIPTIVA 195 . Diagrama de talio y hoja : fn este punto, se eonsideran algunos métodes grificos de estudio de la distribucién de una variable En ae su El primero enraa cons o ques lama un diagram de tallo y ofa, mét080 guya deseripcion orginal, de Job Tukey, se semonta a 977 {50 ‘Et diagrama de allo y hoja consiste en una sucesion de filas hhorizontales de némeros. Cada una tiene ome sotto un nimero llamado 0 allo, mientras que Tos denis ‘mimeros de las filas se aman hojas, No existenreglas esrictas sobre la manera de elaborar este Po de diagrama. En lo fundamen- tal, se siguen los pasos siguientes: Construccién de un diagrama de tallo y hojas : 1. Se seleccionan algunos nimeros convenientes como tllos. Es usual que se trate del primer dligito 0 los primeros dos digitos del conjunto de dates . 2. Se rotulan las filas con los tallos seleccionados. 3. Se reproduce grificamente el conjunto de datos, tailo como una hoje. 4, Se acuesta la grifica sobre uno d mediante el registro del digito que sigue at Ja distribucién fe sus lados para darse una idea de la forma de Estas ideas se ilustran en cl ejemplo 6.2.1 horas de baterias de litio pera un jemplo 62.1, Enel estudio dela arabe aletoria Xt vida il roa de 50 bateris y se determi ‘co de calculadora de bolsillo, se obtiene una muestre ales! riodelo especifi vrata vida iil de cada una. Los datos rsultantes son Tos siguientes: 25 S64 205 3920 2066 608 om 2584 4 3779 1009 76 3B. 37 3894 i 139882 2 662 oe S60 47 iBT a iw 8 ‘A fin de consir un diagrams de alloy hoa de estos dos, primera se sesoeet fos niimeros qe tngen como “alos. Es fccuente que converge ware prime ake a6 S170 Te ‘como su alle. Sin ___anmer e oes dgios como 318, se expresa como némero de cuatro st (0318) mediante lain-tusibn ae apuerda, estos dats entrain uso de fos cinco tallos 0, ® 28 4, Luego, se usa el ‘labora al entimerar 10s tallos @ maners de < Indo Aigio del nfimiero como su “hoja” E diagrams <= : gue i al como se lusts en la Gigura 6.2, La primers observacin, #22. So tallo 4 y hoja 2 2b. El conjunto de datos completo. registado a representa enol diagrama como se nuestra en la figura ae rerrerjen cn el que aparecen ls observaciones, sel dela figura 6° Ses msonable suponer que X tiene distibucin normal? La resp 8 costa el diagrama de tlloy oj sobre su lado y buscar l forma de campans sta pregunta eonsisie 2 racteristica de le dens 196 PRORABALIDAD Y ESTADISTICA 0) 0 0) 394se07853234720267400553034 ne 1 osais72ax3 ale ea 2 0567 ales 3| o7s93 al ala ala 2 ° FIGURAG2 2) Los sees 6. {2.34 sn los alos de un digrama de alloy oja; bel nimero 4285 iene tallo4y hoja2s 6) diagram alo yoja completo dela muestra de vida iil de plas del ejemplo 6.2.1 allo y hojas de horas = 50 Unidad de hojas = 1-0 an o00c0222332334084 55556677785 ' oaza3eced 57 FIGURA «3 Diagrams de dabie tall y hoje, con las hos en orden. (ds soccssl Esta ausente dicha forma, lo cual hace suponer que X'no es miembro de ta familia de varia~ os sleatovss normales ‘Netz, 20 el ejemplo precedente, que el pritner tallo tiene numerosas hojas. Ello es frecuente ‘ccajuntos de datos son grandes 0 no existe mucha variabilidad en los datos. En tales casos, suele sec constructivo generar lo que se llama un diagrama de doble allo y hoja. Eilo se logra al usar dos yezes cad tllo. Se grafican las hojes bajas 0, 1. 2, 3.y 4 en el primer tallo,y las hojes altas 5, 6. 7, 8 ea zi segucay. El diagrama de doble tallo y hoje de los datos del ejemplo 6.2.1 se muestra en Ia figure 6 3. Se generé con el programs MINITAB. Este diagrama muesira, inclusive con mayor clari~ dad 2 2 dribucién a panir de la cual se extrajo la muestra probablemente no es normal, De 2 ~.. ana distribucién exponencia!. Ahora, se sabe que wna dens sable > £19) = (1/B) exp (VB) x>0 B>0 En este punso. tg tarea del investigador consiste en estimar el valor numérico de 8, de modo que puedan calcsiazse probabilidades en el futuro mediante la densidad exponencial. Histogramas y ojiv: El diagrams allo y hoja permite echar un vistazo répido a un conjunto de datos. Es una manera itil de darse un idea de la forma de una distribucién cuando et tamafio del conjunto de datos es modera- ESTADISTICA DESCRIPTVA 197 TABLA GL Niimero recomendado de clases para uso Eee) en las subdivisiones de datos numéricos en a funcién del tamafio de la muestra ‘Tama de In muestra [Numero de clases “Menos de 16| Datos insufcients 16-31 5 2-6 a 4127 7 n2e-255, 8 256-511 ° 512-1023 10 1 24-2087 " 2088-4 085, 2 4096-8 190, B do. Se acompaiia de la ventaja de preservar, hasta cierto punto, la legiblidad de los valores de datos reales en el diagrama, Sin embargo, es una técnica que no funciona satisfactoriamente con grandes conjuntos de datos. En tal caso, se recurre a una técnica que se ha usado durante muchos afos y que suele observarse en el despliegue de datos en revistas, periédicos, informes corporativos y presenta- cicnes. Esta grfica, lamada histograma, es una gréfica de barras verticales u horizontaies, Las ba- ras o clases se definen de manera tal que cads observacion ses parte de uns y slo ura categoria, La anchura de cada barra es igual, de modo que el rea de la barra sea proporcisnal al niimero de obser- vaciones de la ciase respectiva. Ello faclita las comparaciones visuales de las frecuencias y porcen- tajes de las categorias. Asimismo, permite darse ura idea dela familia de vanables aleatorias a la cual pertenece la variable de estudio, con s6lo observar la forma del histograma. Son muchas las formas de scleccionar los limites de las clases. Cada paquete estadistico usa para ello swppropio algoritmo, el cual difiere de un paquete a otro. Si se usan varios paquetes para _taficar un conjunto de datos dado con su (éenica por omisién, los histogramas pueden variar leve- mente en ei niimero de clases scleccionadas y los valores limite de las clases. La forma general del histograma seria la misma con todes ellos. Aqui, se presenta un algoritmo para ta selecci6n del miro: > clases v lor Ties ¢ Pielo al Wa NOURISH He SIN clases tengan !a misma anchura y que dingin punto de date: jue. tener e: valor ¢..~ mite. 4g nos paquetes de computadora permiten al usuario seleccionsr el aiimero de clases o especificar los valores limite, En tal caso, el algoritmo puede usarse para controlar la construcci6n del histograina, i asi se prefiere, gue e2se punto de dav Reglas para dividir los datos en clases 1. Decidir el niimero de clases que interesa. El nimero seleccionado depende del niimero de ab- servaciones disponibies. En la tabla 6.1. se presentan lincamientos sugeridos del nimero de clases que se usa, en fuicidn del tamatio de la muestra, Se basa en la regla de Sturges, formula ‘que desarrollé H. A. Sturges en 1926. 198. PROBABILIDAD Y ESIADISTICA ‘TABLA 62 TAMhades y medias unidades de datos presentados segan el grado de exactitud especificado Datos preventados a 1a unidad mas cercana siguiente Unidad 2 unidad Entero 1 05 Décima (un lugar decimal) 1 0s ‘Centésina (dos lugares decimales) dot 0.003 Milgsima (es Iugares decimals) 001 0.000 5 0.000 1 0.00005 Dicezmnilésima (cuatro lugares decimales) 2 4 LLocatizar las observaciones de valores mximo y minimo. raeaeea a iferencia entre [2s observaciones de valores miximo y minimo. Se rests l valor minime del rinimo. Esta diferencia se llama rango de los datos. aes elongitud minima necesaria para cubrr este rango, al diviitlo entre el ninety de Sinses que se pretende. Esta longitud es la minima necesaria para cubrt el ang * el limite sicioe de la primera clase se toma com el punto de datos miaimo, Sin embargo, pare BAY tivar que ningin punto de datos correspond aun limite, se definen [os limites de mane tal que jneluyen un decimal mis que los datos. Asi pues e nica la primera class wn Powe Pov debajo delpaimer punto de datos. Athacerlo. a fongitud de clase minima requeride Pam cubriretrango se ents para inclir el punto de datos méximo de la itima clase, Por at razén, la ioogitud realmente usada debe ser un poco mayor que el minimo So eaoula la Tongitud de clase real que se usaré al redondear la longitad minima 6 sentido Superior al mismo nimero de lugares decimales que [os datos mismos, St {a longitud mi Ju ene por azar el mismo nimero de decimales que los datos, x redondes 8 la nidad supe- yr més cercana, Por ejemplo, si se tienen datos con exactitud de un decimal ¥ ft longitud tes de 1.7, sc usa 1.8 para obtener ie longitud de clase reel que se utilizar er date inferior dela primera clase se ubiea 1/2 unidad por debajo dela observacton mini aan o tabla 62, e presentan las unidades medias unidades 4e diversos tines de cor" tos az daws, Los limites de clases restantes se Culouis +t suit. “Ta long! aly Elemplo 62.2. Considere ls dios de ejemplo 62.1. El conjunto de datos 50 abservaciones, coer eee iabla 6, el nimero sugerido de clases qu debe sare es ses, Abo bien, oe los puntos de datos mixioo (4285) y minimo (14). Se wsan para calcula of RED. la variable aleatoria X depends

You might also like