You are on page 1of 56

Slides Prepared by JOHN S. LOUCKS St.

Edwards University

2002 South-Western/Thomson Learning

Slide 1

Captulo 2 Estadstica Descriptiva: Mtodos tabulares y grficos


Resumen de datos cualitativos Resumen de datos cuantitativos Anlisis exploratorio de datos Tabulaciones cruzadas y diagramas de dispersin

Slide 2

2.1. Resumen de datos cualitativos


Distribucin de frecuencias Distribuciones de frecuencias relativas y Distribuciones de frecuencias porcentuales Grficas de barras Diagrama de pastel

Slide 3

Distribucin de frecuencias (Pg. 25)

Una distribucin de frecuencias es un resumen tabular de datos que muestran la frecuencia (o la cantidad) de artculos en cada una de varias clases que no se traslapan. El objetivos es proporcionar una perspectiva de los datos que no se puede obtener rpidamente con solo examinarlos.

Slide 4

Ejemplo: Marada Inn


A los clientes que se hospedaron en el Marada Inn se les pidi que calificaran la calidad el cuarto como excelente, arriba del promedio, abajo del promedio y pobres. Las calificaciones de 20 clientes se muestran abajo.

Abajo promedio Arriba promedio Arriba promedio Promedio Arriba promedio Promedio Arriba promedio

Promedio Arriba promedio Abajo promedio Pobre Excelente Arriba promedio Promedio

Arriba promedio Arriba promedio Abajo promedio Pobre Arriba promedio Promedio

Slide 5

Ejemplo: Marada Inn

Distribucin de frecuencias
Clasificacin Pobre Abajo del promedio Promedio Arriba del promedio Excelente Total Frecuencia 2 3 5 9 1 20

Slide 6

Distribucin de frecuencias relativas (Pg. 26)

La frecuencia relativa de una clase es la proporcin de la cantidad de total de datos que pertenecen a esa clase. La distribucin de frecuencias relativas es un resumen tabular de un conjunto de datos que muestra la frecuencia relativa de cada clase.

Slide 7

Distribucin de frecuencias porcentuales (Pg. 26)

La frecuencia porcentual de una clase es su frecuencia relativa multiplicada por 100 Una distribucin de frecuencias porcentual es un resumen tabular de un conjunto de datos donde se muestran la frecuencia porcentual de cada clase.

Slide 8

Ejemplo: Marada Inn

Distribuciones de frecuencias relativas y frecuencias porcentuales Clasificacin

Frecuencia Relativa .10 .15 .25 .45 .05 1.00

Frecuencia Porcentual 10 15 25 45 5 100


Slide 9

Pobre Abajo del promedio Promedio Arriba del promedio Excelente Total

Grfica de Barras (Pg. 26)

Una grafica de barras es una forma grfica de representar datos cualitativos que se han resumido en una distribucin de frecuencias relativas o porcentuales. En el eje horizontal de la grafica se especifican los indicadores o nombres que se usan para cada una de las clases. En el eje vertical puede representarse una escala de frecuencias, una de frecuencias relativas o una de frecuencias porcentuales. Utilizando una barra de un ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponda. Las barras se separan para enfatizar que cada clase es Slide 10 una categora independiente.

Ejemplo: Marada Inn

Grfica de barras
9 8 7 6 5 4 3

Frecuencia

2 1
Pobre Abajo del promedio Promedio Arriba del Excelente promedio

Clasificacin
Slide 11

Grfica de pastel (Pg. 26/27)

La grafica de pastel es un mtodo grfico que se utiliza mucho para presentar distribuciones de frecuencias relativas de datos cualitativos. Se dibuja primero un circulo, luego, utilizando las frecuencias relativas se subdivide el circulo en sectores que correspondan a la frecuencia relativa de cada clase. Ya que hay 360 grados en un circulo, una clase con frecuencia relativa de .25 deber tener .25(360) = 90 grados del circulo.
Slide 12

Ejemplo: Marada Inn

Grafica de pastel
Exc. Pobre 5% 10%
Arriba del promedio 45% Abajo del Promedio 15%

Promedio 25%

Clasificacin de la calidad
Slide 13

Ejemplo: Marada Inn

Profundidad obtenida de la grafica de pastel

La mitad de los huspedes encuestados

dan al Marada Inn una clasificacin de calidad de arriba del promedio o de excelente. Esto le carea bien al Gerente. Por cada cliente que dio un clasificacin de excelente hay dos clientes que dieron una clasificacin de pobre (viendo la parte alta de la pastel). Esto no le caer bien al Gerente.

Slide 14

2.2. Resumen de datos cuantitativos (Pg. 31)

Distribucin de frecuencias Distribucin de frecuencias relativas y de frecuencias porcentuales Grfica de puntos Histograma Distribuciones acumuladas Ojiva

Slide 15

Ejemplo: Hudson Auto Reparacin


Al Gerente de Hudson Auto Reparacin le gustara tener una mejor idea de la distribucin de los costos de las refacciones de afinacin de los motores. Una muestra de las facturas de 50 clientes a sido tomada y los costos de las partes redondeados al dlar mas cercano se enlistan abajo

91 71 104 85 62

78 69 74 97 82

93 72 62 88 98

57 89 68 68 101

75 66 97 83 79

52 75 105 68 105

99 79 77 71 79

80 75 65 69 69

97 72 80 67 62

62 76 109 74 73

Slide 16

Distribucin de frecuencias (Pg. 31)

Gua para seleccionar el numero de clases Utilice entre 5 y 20 clases. Los conjuntos de datos con grana cantidad d e elementos requieren mayor numero de clases Los conjuntos de datos pequeos requieren pocas clases

Slide 17

Distribucin de frecuencias (Pg. 31)


Gua para seleccionar el ancho de la clase Utilice clases de igual ancho Ancho aproximado de clase =
Dato con mayor valor - Dato con menor valor Nmero de clases

Slide 18

Distribucin de frecuencias (Pg. 32)

Gua para seleccionar los limites de las clases Se deben escoger los limites de las clases de tal manera que cada valor de dato pertenezca a una clase y solo una. El limite inferior de clase es el valor mnimo posible de los datos que se asignan a la clase. El limite superior de clase es el valor mximo posible de los datos que se asignan a la clase.

Slide 19

Distribucin de frecuencias (Pg. 32)

Punto medio de clase Punto medio de una clase es el valor promedio entre los limites inferior y superior de una clase
Limite inferior + Limite inferior 2

Slide 20

Ejemplo: Hudson Auto Reparacin

Distribucin de frecuencias
Si seleccionamos seis clases: Ancho aproximado de clase = (109 - 52)/6 = 9.5 10

Costo ($) 50-59 60-69 70-79 80-89 90-99 100-109

Frecuencia 2 13 16 7 7 5 Total 50
Slide 21

Ejemplo: Hudson Auto Reparacin

Distribucin de frecuencias relativas y de frecuencias porcentuales


Costo ($) 50-59 60-69 70-79 80-89 90-99 100-109 Total Frecuencia Relativa .04 .26 .32 .14 .14 .10 1.00 Frecuencia Porcentual 4 26 32 14 14 10 100
Slide 22

Ejemplo: Hudson Auto Reparacin

Profundidad obtenida de la distribucin de frecuencias porcentuales Solo 4% de las costos de las refacciones estn en la clase de $50-59 30% de las refacciones estn por debajo de $70 El mayor porcentaje (32% o casi un tercio) del costo del las refacciones esta en la clase de $70-79 10% del costo de las refacciones est en $100 o ms
Slide 23

Grafica de puntos (Pg. 33)

Uno de los resmenes grficos mas sencillos para los datos es la grafica de puntos. Un eje horizontal muestra el intervalo de los valores de los datos. Luego el valor de cada dato se representa con un punto colocado sobre ele eje.

Slide 24

Ejemplo: Hudson Auto Reparacin

Grfica de puntos

. .. . . . .. .. .. .. . . ..... .......... .. . .. . . ... . .. . . . . . .


50 60 70 80 90 100 110

Cost ($)

Slide 25

Histograma (Pg. 33)


Otra presentacin grfica comn de datos cuantitativos es el histograma. La variable de inters es colocada en el eje horizontal y la frecuencia, frecuencia relativa, o frecuencia porcentual es colocada en el eje vertical. Un rectngulo es dibujado arriba de cada intervalo de clase con la altura correspondiente a los intervalos de frecuencia, frecuencia relativa, o frecuencia porcentual. A diferencia de una grafica de barras, un histograma no tiene separaciones naturales entre los rectngulos de clases adyacentes.
Slide 26

Ejemplo: Hudson Auto Reparacin

Histograma
18 16 14

Frecuencia

12
10 8 6 4 2 50 60 70 80 90 100 110 Costo de Refacciones

($)
Slide 27

Distribuciones acumuladas (Pg. 34)

La distribucin de frecuencias acumuladas muestra la cantidad de elementos menores que o iguales al limite superior de clase Una distribucin de frecuencias relativas acumuladas muestra la proporcin de elementos con valores menores que o iguales al limite superior de cada clase. Una distribucin de frecuencias porcentuales acumuladas muestra la proporcin de elementos con valores menores que o iguales al limite superior de cada clase.
Slide 28

Ejemplo: Hudson Auto Reparacin

Distribuciones acumuladas
Frecuencia Frecuencia Costo ($) acumulada Relativa acumulada < 59 2 .04 < 69 15 .30 < 79 31 .62 < 89 38 .76 < 99 45 .90 < 109 50 1.00 Frecuencia Porcentual acumulada 4 30 62 76 90 100

Slide 29

Ojiva (Pg. 35)

Una ojiva es una grfica de la distribucin acumulada. Los valores de los datos se muestran en el eje horizontal. En el eje vertical se muestran: Frecuencias acumuladas, o Frecuencias relativas acumuladas, o Frecuencias porcentuales acumuladas La frecuencia (una de las de arriba) de cada clase es dibujada como un punto. Los puntos marcados son conectados por lneas rectas.

Slide 30

Ejemplo: Hudson Auto Reparacin

Ojiva Ya que los limites de clase de los costos de las refacciones son 50-59, 60-69, y as sucesivamente, parece que hay un intervalo de una unidad de 59 60 60, 69 a 70, y as sucesivamente. Estos intervalos son eliminados dibujando los puntos a la mitad entre los limites de clase. As, 59.5 es utilizado para la clase 50-59, 69.5 es utilizado para la clase 60-69, y as sucesivamente.

Slide 31

Ejemplo: Hudson Auto Reparacin

Ojiva con frecuencias porcentuales


100 80 60

Frecuencia Porcentual Acumulada

40
20 50 60 70 80 90 100

Costo de refacciones 110 ($)


Slide 32

2.3. Anlisis exploratorio de datos (Pg.40)

La tcnica de anlisis exploratorio de datos consiste den operaciones aritmticas sencillas y representaciones fciles de trazar que pueden emplearse para resumir con rapidez los datos Una de tales tcnicas es el diagrama de tallo y hojas

Slide 33

Diagrama de Tallo y Hojas (Pg.40)


Un diagrama de talo y hojas muestra tanto el orden de rangos como la forma de un conjunto de datos. Es similar a un histograma de lado, pero tiene la ventaja de mostrar los valores actuales de los datos. Los primeros dgitos de cada elemento de los datos son acomodados a la izquierda de una lnea vertical A la derecha de la lnea vertical se registra el ultimo digito por cada elemento (ordenadas en un segundo paso) Cada lnea en el diagrama es referida como un tallo Cada digito en un tallo es una hoja

Slide 34

Ejemplo: Hudson Auto Reparacin

Diagrama de tallo y hojas


5 6 7 8 9 10 2 2 1 0 1 1 7 2 1 0 3 4

2 2 2 7 5

2 2 3 7 5

5 3 5 7 9

6 4 8 8

7 8 8 8 9 9 9 4 5 5 5 6 7 8 9 9 9 9 9

Slide 35

Ejemplo: Hudson Auto Reparacin

Si consideramos que el diagrama original de tallo y hojas ha condensado mucho los datos, podemos amplia el diagrama utilizando dos o mas renglones por cada uno o mas dgitos Cuando un valor de tallo se indica dos veces, el primer valor corresponde a las hojas de o-4 y el segundo valor corresponde a los valores de 5-9.

Slide 36

Ejemplo: Hudson Auto Reparacin

Diagrama de tallo y hojas extendido


5 5 6 6 7 7 8 8 9 9 10 10 2 7 2 5 1 5 0 5 1 7 1 5

2 6 1 5 0 8 3 7 4 5

2 7 2 5 2 9

2 8 8 8 9 9 9 2 3 4 4 6 7 8 9 9 9 3

7 8 9

9
Slide 37

Diagrama de tallo y hojas

Unidades hojas Un digito simple es usado para definir cada hoja. En el ejemplo precedente la unida de hoja fue 1. Las unidades de las hojas pueden ser 100, 10, 1, 0.1, y as sucesivamente. Cuando la hoja no se muestra, se asume que es igual a 1.

Slide 38

Ejemplo: unidad de hoja = 0.1


Si tenemos datos con valores como los siguientes:
8.6 11.7 9.4 9.1 10.2 11.0 8.8

Un diagrama de tallo y hojas de estos datos ser: Unidad de hoja = 0.1 8 6 8 9 1 4 10 2 11 0 7

Slide 39

Ejemplo: unidad de hoja = 10


Si tenemos datos con valores como los siguientes:
1806 1717 1974 1791 1682 1910 1838

Un diagrama de tallo y hojas de estos datos ser: Unidad de hoja = 1 16 8 17 1 9 18 0 3 19 1 7

Slide 40

Tabulaciones cruzadas y Diagramas de dispersin (Pg. 44)

Hasta qui nos hemos enfocado en metodos que son usados para resumir los datos para una variable a la vez. A menudo un administrador esta interesado en tabular los mtodos grficos que ayudaran a entender la relacin entre dos variables. Las tabulaciones cruzadas y los diagramas de dispersin son dos de los mtodos para resumir,, datos para dos (o mas) variables simultaneamente

Slide 41

Tabulaciones cruzadas (Pg. 44)

Tabulaciones cruzadas es un mtodo tabular para resumir los datos para dos variables simultneamente Las tabulaciones cruzadas pueden ser usadas cuando: Una variable es cualitativa y la otra es cuantitativa Ambas variables son cuantitativas Ambas variables son cualitativas Las etiquetas izquierda y superior definen las clases para las dos variables

Slide 42

Ejemplo: Casas Lakes


Tabulaciones

cruzadas El numero de casas Lakes vendidas por cada estilo y precio en los ltimos dos aos se muestra bajo
Rango de precio < $99,000 > $99,000 Total Estilo de casa Ranch Sta fe Gto 6 14 20 19 16 35 12 3 15

Colonial 18 12 30

Total 55 45 100

Slide 43

Ejemplo: Casas Lakes

Profundidad ganada por la tabulacin cruzada El numero mayor de casas en la muestra (19) se encuentra en el estilo Santa fe y precio menor o igual a $99,000. Solo tres casa en la muestra estn en el estilo Guanajuato y tienen un precio mayor a $99,000

Slide 44

Tabulacin cruzada: porcentajes por filas y columnas

Convertir las entradas en una tabla en porcentajes por filas o por columnas puede proveer informacin adicional acerca de la relacin entre dos variables.

Slide 45

Ejemplo: Casas Lakes

Porcentajes por filas


Estilo de casa Colonial Ranch Sta fe Gto Total 32.73 26.67 10.91 31.11 34.55 35.56 21.82 6.67 100 100

Rango de precio < $99,000 > $99,000

Nota: los totales son realmente 100.01 debido al redondeo. Probabilidad de que sea modelo Guanajuato dado que su precio es menor o igual a $99,000= .2182

Slide 46

Ejemplo: Casas Lakes

Porcentajes por columnas


Estilo de casa Colonial Ranch Sta fe 60.00 30.00 54.29 40.00 70.00 45.71 100 100 100

Rango de precio < $99,000 > $99,000 Total

Gto 80.00 20.00 100

Probabilidad que cueste menos o igual de $99,00 dado que es modelo Guanajuato = .80

Slide 47

Diagrama de dispersin (Pg. 46)

Un diagrama de dispersin es una representacin grafica de la relacin entre de dos variables cuantitativas. Una variable se muestra sobre el eje horizontal y la otra variable se muestra sobre le eje vertical. El patrn general de los puntos dibujados sugiere la relacin general entre las dos variables.

Slide 48

Diagrama de dispersin (Pg. 47)

Una relacin positiva

Slide 49

Diagrama de dispersin (Pg. 46)

Una relacin negativa

Slide 50

Diagrama de dispersin (Pg. 46)

Sin relacin aparente

Slide 51

Ejemplo: Equipo de ftbol las Panteras

Diagrama de dispersin El equipo de ftbol de las Panteras esta interesado en investigar la relacin, si hay alguna, entre intercepciones hechas y puntos anotados. x = Numero de Intercepciones 1 3 2 1 3 y = Numero de Puntos anotados 14 24 18 17 27
Slide 52

Ejemplo: Equipo de ftbol las Panteras

Diagrama de dispersin Numero de puntos anotados

y
30

25 20 15
10 5 0

1 2 3 Numero de intercepciones
Slide 53

Ejemplo: Equipo de ftbol las Panteras

El diagrama de dispersin precedente indica una relacin positiva entre los nmeros de intercepciones y los nmeros de puntos anotados. Mayor numero de puntos anotados estn asociados con un mayor numero de intercepciones La relacin no es perfecta; todos los puntos marcados en el diagrama de dispersin no estn en una lnea recta.

Slide 54

Procedimientos Tabulares y grficos


Data
Datos cualitativos Mtodos Tabulares
Distribucin de frecuencias Dist. Freq. Rel. Dist. Freq. % Tabulacin cruzada

Datos cuantitativos Mtodos Tabulares Distribucin de frecuencias Dist. Freq. Rel. Mtodos grficos

Mtodos Grficos
Grafica de barras Grafica de pastel

Grfica de puntos Histograma Dist. Freq. Acum. Ojiva Diagrama Distribucin de dispersin Freq. Rel. Acum. Diagrama de Tallos y Hojas Tabulacin cruzada
Slide 55

Fin del captulo 2

Slide 56

You might also like