You are on page 1of 9

Probabilidades y Estadstica

Representacin Grfica Introduccin


Un mtodo grfico proporciona visualmente un resumen de la informacin que se desea destacar. Un grfico bien construido permite observar con facilidad situaciones tales como tendencias, variaciones, anomalas, estructura general de los datos representados, y las relaciones que puedan existir entre dos o ms variables, de tal manera que, adems de ser de gran utilidad en la estadstica descriptiva, lo es tambin en la inferencia estadstica por cuanto, a menudo, sugiere la metodologa ms eficiente para el anlisis de la informacin. A partir de lo anterior, queda claro que al momento de efectuar un anlisis estadstico, una de las primeras cosas que se debe hacer es precisamente un anlisis exploratorio de los datos a objeto de detectar en primer trmino tendencias, variaciones y observaciones anmalas entre otras. La creciente disponibilidad de herramientas computacionales, hace cada vez ms fcil encontrar mltiples representaciones grficas para describir datos. El problema se centra principalmente en seleccionar las ms apropiadas para cada ocasin.

Consideraciones Generales
Para que un grfico cumpla eficientemente su cometido, que es el entregar una visin global del problema, con elementos que guardan las proporciones correctas, se deben seguir las siguientes normas generales, las cuales deben tener cierta flexibilidad, a objeto de atraer mejor la atencin del lector: Debe ser lo ms simple y claro que sea posible, conteniendo slo los elementos necesarios para la adecuada representacin de la informacin. Cuando el grfico tiene ejes, es necesario utilizar las escalas adecuadas, debido a que una mala eleccin de ellas puede provocar la exageracin o reduccin de la importancia de un fenmeno. Adems, para que visualmente se aprecie la relacin entre los distintos valores, es conveniente que aparezca la lnea correspondiente al 0 (cero), cuando por la magnitud de los valores, ello no sea posible, se debe quebrar el eje de las abscisas y/o ordenadas, segn corresponda. Siempre que sea posible, se deben presentar las cantidades por magnitudes lineales, pues las reas y volmenes si no son bien tratadas, en ocasiones se prestan a confusiones. En los grficos en que se utilicen ejes cartesianos, deben trazarse slo las coordenadas necesarias para una fcil lectura del grfico. Si una curva representa una serie de observaciones, se debe sealar claramente cada uno de los puntos correspondientes a estas observaciones. En ocasiones es conveniente incluir en el grfico, los datos o las frmulas representadas. Si no se incluyen los datos, re recomienda presentar estos en una tabla cercana al grfico. El ttulo debe ser breve y claro, conteniendo solamente la informacin necesaria para la adecuada comprensin del mismo. Si en un documento se presenta ms de un grfico, se debe anteponer al comienzo del ttulo del grfico un nmero, de tal forma de facilitar su llamado en el texto.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Errores comunes
En la confeccin de un grfico se pueden cometer dos tipos de errores: errores de forma y errores de contenido, siendo los que se observan con mayor frecuencia: De forma: Carencia de ttulo, o ste es extremadamente extenso. Ttulos que no corresponden al contenido del grfico. Grficos muy cargados y/o sumamente complejos de interpretar. Desproporcin notable entre las longitudes de los ejes. Omisin de los rtulos de los ejes y/o las unidades de medida.

De contenido: Uso de grficos inadecuados dada la naturaleza de lo que se representa. Omisin de la leyenda donde se han usado claves o smbolos. No respetar alguna de las reglas establecidas para la construccin del grfico en particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.

Grficos de Barras
Los grficos de barras son utilizados para representar tanto variables cualitativas como variables cuantitativas de tipo discreto. Permiten representar la frecuencia en cada uno de los niveles de las variables de inters. Particularmente, la altura de cada barra es proporcional a la frecuencia o cantidad de elementos que pertenecen a la categora en particular. Esta frecuencia puede ser absoluta, relativa, absoluta acumulada o relativa acumulada. La construccin de este tipo de grfico consiste bsicamente de los siguientes pasos: Trazar los ejes coordenados. Marcar en el eje de las absisas (X) y a igual distancia los distintos valores de la variable. Graduar el eje de las ordenadas (Y) con el tipo de frecuencia a representar. Sobre el eje de las absisas dibujar las barras, teniendo presente: Todas las barras deben tener una base de igual tamao. Entre una barra y otra debe existir la misma separacin. La altura de cada barra debe ser proporcional a la respectiva frecuencia.

A continuacin y a modo de ejemplo se presentan grficos de barras confeccionados a partir de una tabla de frecuencias donde se indica el nmero de errores tipogrficos por pgina en el informe de un alumno de la asignatura Estadstica I, mostrada a continuacin.
Nmero de errores Tipogrficos por Pgina
7 6 Frecuencia absoluta 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 N de errores
Frecuencia 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0 1 2 3 4 5 6 7 8 9 N de errores

Proporcin de errores Tipogrficos por Pgina

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

3
Proporcin de errores Tipogrficos por Pgina
1,20 1,00 Frecuencia 0,80 0,60 0,40 0,20 0,00

Frecuencia Acumulada de errores Tipogrficos por Pgina


30 25 Frecuencia absoluta acumulada 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 N de errores

N de errores

N de errores abs 0 1 2 3 4 5 6 7 8 9 2 2 1 2 2 2 2 6 2 3 24

Frec. rel 0,08 0,08 0,04 0,08 0,08 0,08 0,08 0,25 0,08 0,13

Frec. Acum. abs 2 4 5 7 9 11 13 19 21 24 rel 0,08 0,17 0,21 0,29 0,38 0,46 0,54 0,79 0,88 1,00

En algunos casos, el total est compuesto de varias partes y junto con representar el total, resulta conveniente tambin mostrar en el grfico sus componentes, en estos casos se utiliza un grfico de barras componentes, debiendo idealmente ordenar los componentes de tal manera que su magnitud decrezca hacia arriba. Para destacar la importancia relativa de los componentes, se puede presentar un grfico de barras relativas componentes en el que todas las barras tienen igual longitud y equivalen al 100%. Tambin es posible representar en el mismo grfico y utilizando las mismas escalas horizontales y verticales, varios conjuntos de datos correspondientes a las mismas variables. Esto produce un grfico con varias series, correspondiendo cada una de ellas a un conjunto de observaciones. Es conveniente que cada serie de datos (u observaciones) sea representada de igual manera entre s, pero distinta de las dems. El ejemplo que sigue representa el comportamiento de las calificaciones parciales de cuatro alumnos de enseanza media. Las series (cada una de las calificaciones parciales) estn representadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los dems. Es interesante observar que los valores del eje de las absisas corresponden a una variable en escala nominal.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica
Resultados de Evaluaciones Parciales
7 6 Calificacin 5 4 3 2 1 0 Pedro Juan Alumnos Diego Esteban Prueba 1 Prueba 2 Prueba 3

Gracias a las herramientas computacionales existentes en la actualidad, es posible representar grficos tridimensionales, sin embargo se debe tener precaucin en su uso por cuanto distintos ngulo de inclinacin en sus ejes pueden inducir a errores de interpretacin, segn se puede observar en las figuras siguientes:
Resultados de Evaluaciones Parciales
Resultados de Evaluaciones Parciales

7 6 Calificacin 5 4 3 2
Prueba 1 Prueba 2 Prueba 3

6 4 2 0
Prueba 1 Prueba 2 Prueba 3

1 0

Esteban Diego Juan Pedro

Histograma
El histograma es utilizado para representar la distribucin de frecuencias de variables cuantitativas continuas. Su estructura es muy similar al grfico de barras pero, difiere de l en lo siguiente: Las barras van unidas. Las frecuencias son proporcionales al rea y no a la altura de las barras. Las barras son identificadas en el eje de las absisas con las respectivas marcas de clase.

La construccin de este tipo de grfico consiste bsicamente de los siguientes pasos: Trazar los ejes coordenados. Marcar en el eje de las absisas (X) y a una distancia proporcional las distintas marcas de clase Graduar el eje de las ordenadas (Y) con el tipo de frecuencia a representar. Sobre el eje de las absisas dibujar las barras, teniendo presente: La base de cada barra debe ser proporcional a la amplitud de cada intervalo. Las barras van unidas. La altura de cada barra se obtiene al calcular:

Pedro

altura = frecuencia / amplitud

Esteban

Juan

Diego

Edmundo Pea Rozas, Juan Garcs Seguel

Calificacin

Probabilidades y Estadstica

La determinacin del rea de cada barra, sealada anteriormente, corresponde al caso general, cuando los intervalos son todos de la misma amplitud, el procedimiento se simplifica por cuanto la altura de cada barra ser proporcional a la respectiva frecuencia. Igual que en el caso de los grficos de barras, los histogramas se pueden utilizar para representar frecuencias absolutas o relativas, simples o acumuladas. Ejemplo: A modo de ejemplo, se presentan grficos basados en la tabla de frecuencias para variables continuas, desarrollada en el apunte anterior.

Polgonos de Frecuencia
Los polgonos de frecuencia, al igual que los histogramas, se utilizan para representar grficamente variables cuantitativas continuas. La construccin del polgono de frecuencias consiste en los siguientes pasos: Trazar los ejes coordenados. Marcar en el eje de las absisas (X) a una distancia proporcional las distintas marcas de clase. Graduar el eje de las ordenadas (Y) con el tipo de frecuencia a representar. Para cada marca de clase, marcar un punto a una altura proporcional a la respectiva frecuencia. Unir los puntos con una lnea recta.
Cantidad de Insumo X por Dosis
45 40

Cantidad de Insumo X por Dosis


250 200 150 100 50 0

Frecuencia

30 25 20 15 10 5 0 2.65 3.15 3.65 4.15 4.65 5.15 5.65 6.15 6.65 7.15 Grm s. Insum o

Frec. Acumulada

35

2.65

3.15

3.65

4.15

4.65

5.15

5.65

6.15

6.65

7.15

Grm s. Insum o

Observacin: Cuando el polgono de frecuencias se construye utilizando la frecuencia acumulada, recibe el nombre de Ojiva.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Grficos de dispersin
El grfico o diagrama de dispersin (scatterplot) se utiliza para representar grficamente pares de variables cuantitativas continuas, generando una nube de puntos, en la cual es posible detectar la existencia y tipo de asociacin entre las dos variables representadas, permitiendo adems detectar la presencia de observaciones atpicas (influyentes o no). Cuando entre dos variables se supone que existe una relacin de causa y efecto, se acostumbra utilizar este grfico para observar grficamente cmo se da esta relacin de causalidad, graficando en el eje de las ordenadas (Y) la variable que se supone es dependiente y en el eje de las absisas (X) la variable independiente. La construccin de grfico de dispersin consiste bsicamente en los siguientes pasos: Trazar los ejes coordenados. Graduar ambos ejes (X e Y) Para cada una de las observaciones, marcar las coordenadas de los valores x e y
Rendimiento v/s Insumo 2
3100.00 2900.00 2700.00 Rendimiento 2500.00 2300.00 2100.00 1900.00 1700.00 1500.00 500.00

550.00

600.00

650.00

700.00

750.00

800.00

850.00

Insum o 2

Grficos de Sectores
Cuando se desea representar una variable de atributos o propiedades componentes de un total, es conveniente utilizar un grfico de sectores. El cual no es ms que un crculo, cuya rea se divide en sectores proporcionales a las partes integrantes del total. Para la construccin de este grfico se debe: Establecer para cada caracterstica la proporcin respecto del total (frecuencia relativa) Repartir los 360 del crculo, de acuerdo a la proporcin antes calculada. Dibujar los sectores cuyos radios lmites forman los ngulos calculados en 2.

Debido al amplio desarrollo de programas computacionales, hoy en da se dispone de una gran capacidad de representar datos con mejores caractersticas estticas. Lo anterior en s, constituye una cualidad muy ventajosa, sin embargo, en peligroso dejarse llevar slo por consideraciones estticas al momento de graficar informacin. Es as que muchas veces se tiende a usar grficos circulares en perspectiva, con un dibujo que representa a un disco inclinado en tres dimensiones, de modo que su cara superior se ve como una elipse. Si bien tiene un aspecto visual agradable, no es recomendable usarlo, pues desde el punto de vista de la representacin de la informacin contenida en la muestra, se produce una distorsin.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Las variaciones de la representacin causadas por una rotacin del grfico, no estn presente en el caso del crculo en posicin normal y, por lo tanto, este ltimo es ms fidedigno como resumen informativo visual. A modo de ejemplo, se presenta el grfico de sectores para la distribucin de frecuencias del nmero de viviendas particulares en Chile, por tipo, de acuerdo al Censo del ao 2002.
xi Permanentes Semipermanentes Mviles y otras ni 3.743.817 141.495 14.136 hi 0,9601 0,0363 0,0036

Viviendas Particulares En Chile


Semipermanent es 4% Permanentes 96%
Permanentes 96%

Viviendas Particulares En Chile

Semipermanent es 4% Mviles y otras 0%

Mviles y otras 0%

Grficos Lineales
Los grficos lineales se emplean para representar un sinnmero de fenmenos, especialmente en el caso de variables continuas. Este grfico consiste en un par de ejes cartesianos, en cuya absisa (eje X) se ubican los valores los valores de la variable (aos, meses, sueldos, etc.), mientras que en el eje de las ordenadas se registran los cambios de la misma mediante una escala de tipo aritmtico. Cada par de datos (por ejemplo ao y tasa de natalidad) se representa mediante un punto, obteniendo entonces tantos puntos como pares de datos, los cuales se unen mediante segmentos rectilneos.
Presin Diastlica Mxima
120.0 110.0 Presin 100.0 90.0 80.0 70.0 60.0 1 2 3 4 5 6 7 8 Sujeto 9 10 11 12 13 14 15

Observacin Importante: Respecto del grfico anterior, es necesario destacar el error que en l se presenta. Si son 15 sujetos distintos a los cuales se les registr la presin diastlica mxima en un determinado perodo, tiene algn sentido lgico unir estas mediciones con una lnea? La respuesta es indudablemente que no; distinta sera la situacin si se tratase por ejemplo de la presin diastlica mxima observada en un individuo durante un perodo de 15 das.

Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Grficos de Mximos y Mnimos


Este grfico se utiliza de preferencia para presentar las fluctuaciones mximas y mnimas de fenmenos tales como variaciones de precio, temperatura, presin, etc., pudiendo incluir en el mismo grfico las variaciones medias. La construccin de este tipo de grficos es muy similar al grfico lineal, debiendo dibujar los puntos mximos de cada perodo para despus unirlos mediante una poligonal, y procediendo de igual manera para los puntos medios y mnimos. Otra forma de representar el mismo fenmeno consiste en unir mediante segmentos verticales los puntos mximos y mnimos, destacando los valores medios.

Presin Diastlica Mxima y Mnima


120.0 110.0 Presin
Presin 120.0 110.0 100.0 90.0 80.0 70.0 60.0

Presin Diastlica Mxima y Mnima

100.0 90.0 80.0 70.0 60.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Sujeto da

10 11 12 13 14 15

Sujeto da

Diagrama de Pareto
El diagrama de Pareto se utiliza para separar grficamente los aspectos significativos de un problema respecto de los triviales, de tal manera que con este diagrama se obtiene una orientacin respecto de dnde dirigir los esfuerzos para mejorar una determinada situacin. Reducir los problemas ms significativos (las barras ms largas en un Grfico de Pareto) es ms til para lograr una mejora general que reducir los ms pequeos. La grfica es muy til al permitir identificar visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante prestar atencin y de esta manera utilizar todos los recursos necesarios para llevar a cabo una accin correctiva sin malgastar esfuerzos. En casos tpicos, los pocos (pasos, servicios, tems, problemas, causas) son responsables por la mayor parte del impacto negativo sobre la calidad. Si enfocamos nuestra atencin en estos pocos vitales, podemos obtener la mayor ganancia potencial de nuestros esfuerzos por mejorar la calidad. Dentro de las dificultades que se pueden presentar al tratar de interpretar el Diagrama de Pareto, es que algunas veces los datos no indican una clara distincin entre las categoras. Esto puede verse en el grfico cuando todas las barras son ms o menos de la misma altura. La interpretacin de un Diagrama de Pareto se puede definir completando las siguientes oraciones de ejemplo: Existen (nmero de categoras) contribuyentes relacionados con (efecto). Pero estos (nmero de pocos vitales) corresponden al (nmero) % del total (efecto). Debemos procurar estas (nmero) categoras pocos vitales, ya que representan la mayor ganancia potencial para nuestros esfuerzos. Este grfico se puede utilizar para: Identificar un producto o servicio para el mejoramiento de calidad. Cuando existe la necesidad de llamar la atencin a los problemas o causas de una forma sistemtica. Analizar las diferentes agrupaciones de datos (Ej.: por producto, por segmento, por mercado, rea geogrfica, etc.) Buscar las causas principales de los problemas y establecer la prioridad de las soluciones
Edmundo Pea Rozas, Juan Garcs Seguel

Probabilidades y Estadstica

Evaluar los resultados de los cambios efectuados a un proceso (antes y despus)

Este grfico se construye siguiendo los siguientes pasos: Seleccionar categoras lgicas para el tpico de anlisis identificado (incluir el periodo de tiempo). Reunir datos. La utilizacin de un check list puede ser de mucha ayuda en este paso. Ordenar los datos de la mayor a la menor frecuencia relativa. Trazar los ejes coordenados. Graduar el eje de las ordenadas (y) con las frecuencias relativas acumuladas. Dibujar de izquierda a derecha las barras para cada categora en orden descendente. Si existe una categora otros, debe ser colocada al final, sin importar su valor. Es decir, que no debe tenerse en cuenta al momento de ordenar de mayor a menor la frecuencia de las categoras. Dibujar el grfico lineal para el porcentaje acumulado (frecuencia relativa acumulada), comenzando en la parte superior de la barra de la primera categora.

Ejemplo:
A continuacin se presenta un diagrama de Pareto que representa las causas de interrupciones en la produccin, en una pequea maestranza, en un ao determinado.

Interrupciones Produccin en un ao
120% 100% 80% 60% 40% 20% 0%
Falla Mquina Falla Herramientas Operario Ausente Suministro Agua No hay material Suministro Elctrico Otros

Edmundo Pea Rozas, Juan Garcs Seguel

You might also like