Professional Documents
Culture Documents
Edwards University
Slide 1
Resumen de datos cualitativos Resumen de datos cuantitativos Anlisis exploratorio de datos Tabulaciones cruzadas y diagramas de dispersin
Slide 2
Distribucin de frecuencias Distribuciones de frecuencias relativas y Distribuciones de frecuencias porcentuales Grficas de barras Diagrama de pastel
Slide 3
Una distribucin de frecuencias es un resumen tabular de datos que muestran la frecuencia (o la cantidad) de artculos en cada una de varias clases que no se traslapan. El objetivos es proporcionar una perspectiva de los datos que no se puede obtener rpidamente con solo examinarlos.
Slide 4
Abajo promedio Arriba promedio Arriba promedio Promedio Arriba promedio Promedio Arriba promedio
Promedio Arriba promedio Abajo promedio Pobre Excelente Arriba promedio Promedio
Arriba promedio Arriba promedio Abajo promedio Pobre Arriba promedio Promedio
Slide 5
Distribucin de frecuencias
Clasificacin Pobre Abajo del promedio Promedio Arriba del promedio Excelente Total Frecuencia 2 3 5 9 1 20
Slide 6
La frecuencia relativa de una clase es la proporcin de la cantidad de total de datos que pertenecen a esa clase. La distribucin de frecuencias relativas es un resumen tabular de un conjunto de datos que muestra la frecuencia relativa de cada clase.
Slide 7
La frecuencia porcentual de una clase es su frecuencia relativa multiplicada por 100 Una distribucin de frecuencias porcentual es un resumen tabular de un conjunto de datos donde se muestran la frecuencia porcentual de cada clase.
Slide 8
Pobre Abajo del promedio Promedio Arriba del promedio Excelente Total
Una grafica de barras es una forma grfica de representar datos cualitativos que se han resumido en una distribucin de frecuencias relativas o porcentuales. En el eje horizontal de la grafica se especifican los indicadores o nombres que se usan para cada una de las clases. En el eje vertical puede representarse una escala de frecuencias, una de frecuencias relativas o una de frecuencias porcentuales. Utilizando una barra de un ancho fijo trazada sobre cada indicador de clase llegamos a la altura que corresponda. Las barras se separan para enfatizar que cada clase es Slide 10 una categora independiente.
Grfica de barras
9 8 7 6 5 4 3
Frecuencia
2 1
Pobre Abajo del promedio Promedio Arriba del Excelente promedio
Clasificacin
Slide 11
La grafica de pastel es un mtodo grfico que se utiliza mucho para presentar distribuciones de frecuencias relativas de datos cualitativos. Se dibuja primero un circulo, luego, utilizando las frecuencias relativas se subdivide el circulo en sectores que correspondan a la frecuencia relativa de cada clase. Ya que hay 360 grados en un circulo, una clase con frecuencia relativa de .25 deber tener .25(360) = 90 grados del circulo.
Slide 12
Grafica de pastel
Exc. Pobre 5% 10%
Arriba del promedio 45% Abajo del Promedio 15%
Promedio 25%
Clasificacin de la calidad
Slide 13
dan al Marada Inn una clasificacin de calidad de arriba del promedio o de excelente. Esto le carea bien al Gerente. Por cada cliente que dio un clasificacin de excelente hay dos clientes que dieron una clasificacin de pobre (viendo la parte alta de la pastel). Esto no le caer bien al Gerente.
Slide 14
Distribucin de frecuencias Distribucin de frecuencias relativas y de frecuencias porcentuales Grfica de puntos Histograma Distribuciones acumuladas Ojiva
Slide 15
91 71 104 85 62
78 69 74 97 82
93 72 62 88 98
57 89 68 68 101
75 66 97 83 79
52 75 105 68 105
99 79 77 71 79
80 75 65 69 69
97 72 80 67 62
62 76 109 74 73
Slide 16
Gua para seleccionar el numero de clases Utilice entre 5 y 20 clases. Los conjuntos de datos con grana cantidad d e elementos requieren mayor numero de clases Los conjuntos de datos pequeos requieren pocas clases
Slide 17
Slide 18
Gua para seleccionar los limites de las clases Se deben escoger los limites de las clases de tal manera que cada valor de dato pertenezca a una clase y solo una. El limite inferior de clase es el valor mnimo posible de los datos que se asignan a la clase. El limite superior de clase es el valor mximo posible de los datos que se asignan a la clase.
Slide 19
Punto medio de clase Punto medio de una clase es el valor promedio entre los limites inferior y superior de una clase
Limite inferior + Limite inferior 2
Slide 20
Distribucin de frecuencias
Si seleccionamos seis clases: Ancho aproximado de clase = (109 - 52)/6 = 9.5 10
Frecuencia 2 13 16 7 7 5 Total 50
Slide 21
Profundidad obtenida de la distribucin de frecuencias porcentuales Solo 4% de las costos de las refacciones estn en la clase de $50-59 30% de las refacciones estn por debajo de $70 El mayor porcentaje (32% o casi un tercio) del costo del las refacciones esta en la clase de $70-79 10% del costo de las refacciones est en $100 o ms
Slide 23
Uno de los resmenes grficos mas sencillos para los datos es la grafica de puntos. Un eje horizontal muestra el intervalo de los valores de los datos. Luego el valor de cada dato se representa con un punto colocado sobre ele eje.
Slide 24
Grfica de puntos
Cost ($)
Slide 25
Histograma
18 16 14
Frecuencia
12
10 8 6 4 2 50 60 70 80 90 100 110 Costo de Refacciones
($)
Slide 27
La distribucin de frecuencias acumuladas muestra la cantidad de elementos menores que o iguales al limite superior de clase Una distribucin de frecuencias relativas acumuladas muestra la proporcin de elementos con valores menores que o iguales al limite superior de cada clase. Una distribucin de frecuencias porcentuales acumuladas muestra la proporcin de elementos con valores menores que o iguales al limite superior de cada clase.
Slide 28
Distribuciones acumuladas
Frecuencia Frecuencia Costo ($) acumulada Relativa acumulada < 59 2 .04 < 69 15 .30 < 79 31 .62 < 89 38 .76 < 99 45 .90 < 109 50 1.00 Frecuencia Porcentual acumulada 4 30 62 76 90 100
Slide 29
Una ojiva es una grfica de la distribucin acumulada. Los valores de los datos se muestran en el eje horizontal. En el eje vertical se muestran: Frecuencias acumuladas, o Frecuencias relativas acumuladas, o Frecuencias porcentuales acumuladas La frecuencia (una de las de arriba) de cada clase es dibujada como un punto. Los puntos marcados son conectados por lneas rectas.
Slide 30
Ojiva Ya que los limites de clase de los costos de las refacciones son 50-59, 60-69, y as sucesivamente, parece que hay un intervalo de una unidad de 59 60 60, 69 a 70, y as sucesivamente. Estos intervalos son eliminados dibujando los puntos a la mitad entre los limites de clase. As, 59.5 es utilizado para la clase 50-59, 69.5 es utilizado para la clase 60-69, y as sucesivamente.
Slide 31
40
20 50 60 70 80 90 100
La tcnica de anlisis exploratorio de datos consiste den operaciones aritmticas sencillas y representaciones fciles de trazar que pueden emplearse para resumir con rapidez los datos Una de tales tcnicas es el diagrama de tallo y hojas
Slide 33
Un diagrama de talo y hojas muestra tanto el orden de rangos como la forma de un conjunto de datos. Es similar a un histograma de lado, pero tiene la ventaja de mostrar los valores actuales de los datos. Los primeros dgitos de cada elemento de los datos son acomodados a la izquierda de una lnea vertical A la derecha de la lnea vertical se registra el ultimo digito por cada elemento (ordenadas en un segundo paso) Cada lnea en el diagrama es referida como un tallo Cada digito en un tallo es una hoja
Slide 34
2 2 2 7 5
2 2 3 7 5
5 3 5 7 9
6 4 8 8
7 8 8 8 9 9 9 4 5 5 5 6 7 8 9 9 9 9 9
Slide 35
Si consideramos que el diagrama original de tallo y hojas ha condensado mucho los datos, podemos amplia el diagrama utilizando dos o mas renglones por cada uno o mas dgitos Cuando un valor de tallo se indica dos veces, el primer valor corresponde a las hojas de o-4 y el segundo valor corresponde a los valores de 5-9.
Slide 36
2 6 1 5 0 8 3 7 4 5
2 7 2 5 2 9
2 8 8 8 9 9 9 2 3 4 4 6 7 8 9 9 9 3
7 8 9
9
Slide 37
Unidades hojas Un digito simple es usado para definir cada hoja. En el ejemplo precedente la unida de hoja fue 1. Las unidades de las hojas pueden ser 100, 10, 1, 0.1, y as sucesivamente. Cuando la hoja no se muestra, se asume que es igual a 1.
Slide 38
Slide 39
Slide 40
Hasta qui nos hemos enfocado en metodos que son usados para resumir los datos para una variable a la vez. A menudo un administrador esta interesado en tabular los mtodos grficos que ayudaran a entender la relacin entre dos variables. Las tabulaciones cruzadas y los diagramas de dispersin son dos de los mtodos para resumir,, datos para dos (o mas) variables simultaneamente
Slide 41
Tabulaciones cruzadas es un mtodo tabular para resumir los datos para dos variables simultneamente Las tabulaciones cruzadas pueden ser usadas cuando: Una variable es cualitativa y la otra es cuantitativa Ambas variables son cuantitativas Ambas variables son cualitativas Las etiquetas izquierda y superior definen las clases para las dos variables
Slide 42
cruzadas El numero de casas Lakes vendidas por cada estilo y precio en los ltimos dos aos se muestra bajo
Rango de precio < $99,000 > $99,000 Total Estilo de casa Ranch Sta fe Gto 6 14 20 19 16 35 12 3 15
Colonial 18 12 30
Total 55 45 100
Slide 43
Profundidad ganada por la tabulacin cruzada El numero mayor de casas en la muestra (19) se encuentra en el estilo Santa fe y precio menor o igual a $99,000. Solo tres casa en la muestra estn en el estilo Guanajuato y tienen un precio mayor a $99,000
Slide 44
Convertir las entradas en una tabla en porcentajes por filas o por columnas puede proveer informacin adicional acerca de la relacin entre dos variables.
Slide 45
Nota: los totales son realmente 100.01 debido al redondeo. Probabilidad de que sea modelo Guanajuato dado que su precio es menor o igual a $99,000= .2182
Slide 46
Probabilidad que cueste menos o igual de $99,00 dado que es modelo Guanajuato = .80
Slide 47
Un diagrama de dispersin es una representacin grafica de la relacin entre de dos variables cuantitativas. Una variable se muestra sobre el eje horizontal y la otra variable se muestra sobre le eje vertical. El patrn general de los puntos dibujados sugiere la relacin general entre las dos variables.
Slide 48
Slide 49
Slide 50
Slide 51
Diagrama de dispersin El equipo de ftbol de las Panteras esta interesado en investigar la relacin, si hay alguna, entre intercepciones hechas y puntos anotados. x = Numero de Intercepciones 1 3 2 1 3 y = Numero de Puntos anotados 14 24 18 17 27
Slide 52
y
30
25 20 15
10 5 0
1 2 3 Numero de intercepciones
Slide 53
El diagrama de dispersin precedente indica una relacin positiva entre los nmeros de intercepciones y los nmeros de puntos anotados. Mayor numero de puntos anotados estn asociados con un mayor numero de intercepciones La relacin no es perfecta; todos los puntos marcados en el diagrama de dispersin no estn en una lnea recta.
Slide 54
Datos cuantitativos Mtodos Tabulares Distribucin de frecuencias Dist. Freq. Rel. Mtodos grficos
Mtodos Grficos
Grafica de barras Grafica de pastel
Grfica de puntos Histograma Dist. Freq. Acum. Ojiva Diagrama Distribucin de dispersin Freq. Rel. Acum. Diagrama de Tallos y Hojas Tabulacin cruzada
Slide 55
Slide 56