You are on page 1of 23

Prof. V.

Contreras T

ESTADISTICA

FIME

ESTADSTICA DESCRIPTIVA
En esta parte aprenderemos a trabajar con los datos y a resumirlos, de manera grfica y numrica, para convertirlos en informacin til para el problema en estudio. La estadstica descriptiva trata dos aspectos: el obtener informacin de los datos tambin conocido como anlisis exploratorio de datos y por otro lado se preocupa de la "presentacin de resultados". En este parte hablaremos sobre: Tipos de Variables Mtodos grficos y numricos para describir variables cualitativas - Tablas de distribucin de frecuencias. - Grficos para variables cualitativas: Sectorial y de Barras. Mtodos grficos para describir variables cuantitativas - Grfico de Puntos. - Diagrama de Tallo y Hojas. - Histograma. Mtodos numricos para describir variables cuantitativas - Medidas de Tendencia Central: Promedio, Mediana, Moda. - Medidas de Dispersin: Rango, Desviacin Estndar, Rango entre Cuarteles. - Medidas de Posicin Relativa. Transformaciones lineales y estandarizacin Definiciones: Unidad es el objeto que observamos. Cuando el objeto es una persona, lo referimos como sujeto. Observacin es la informacin o caracterstica que registramos de cada unidad. Una caracterstica que puede variar de unidad en unidad es llamada variable. Una coleccin de observaciones con una o ms variables se llama base de datos.

Variables cualitativas son aquellas que clasifican las unidades en categoras. Las categoras pueden tener un orden natural (ordinales) o no (nominales). Las variables cualitativas tambin se llaman variables categricas. Con estas variables podemos contar
1

Prof. V. Contreras T

ESTADISTICA

FIME

nmero de casos, comparar entre categoras, pero no podemos realizar operaciones numricas. Variables cuantitativas tienen valores numricos que representan medidas (largo, peso, etc.) o
frecuencias (nmero de). Tiene sentido realizar operaciones numricas con estas variables. Adems distinguimos dentro de las variables cuantitativas las discretas y las continuas. Una variable discreta es aquella en la cul se puede contar el nmero posible de valores. Una variable continua puede tomar cualquier valor en un intervalo dado. Ejemplo Nominal: est asociada a nombres. Ejemplo: Marca de auto, Sexo, Religin. Ordinal: tiene asociado un orden. Ejemplo: Nivel educacional, Estado nutricional, Nivel Socioeconmico. Discreta: slo puede tomar un nmero finito (o contable) de posible valores. Ejemplo: El nmero de respuestas correctas en una prueba de 5 preguntas de V o F. Continua: puede tomar cualquier valor en un intervalo(s). Ejemplo: Cantidad de agua en un vaso de 50 ml.

TABLAS DE FRECUENCIAS Y GRAFICOS USADOS EN LA ORGANIZACIN DE DATOS


Ejemplo: Como parte de un estudio para conocer la aceptacin de la nueva mega tienda Vendo ubicada en la ciudad de Mayaguez, se eligi una muestra de 35 clientes para conocer sus impresiones. Los resultados son los siguientes:

Prof. V. Contreras T

ESTADISTICA

FIME

DISTRIBUCION DE FRECUENCIAS
Lo primero que hacemos al querer describir variables cualitativas es contar cuntas unidades caen en cada categora de la variable. Esto lo presentamos en una tabla de distribucin de frecuencias, por ejemplo de la variable cualitativa: Razn de visita:

Grficos para variables cualitativas. Una vez que conocemos la distribucin de la variable, nos interesa presentarla de alguna manera grfica, uno de los grficos o diagramas ms usados en variables cualitativas son los diagramas sectoriales o de torta y los grficos de barra. Un grfico sectorial (o de torta) muestra la distribucin de una variable cualitativa dividiendo un crculo en partes que corresponden a las categoras de la variable, tal que el tamao (ngulo) de cada pedazo es proporcional al porcentaje de tems en cada categora. Un grfico de barras muestra la distribucin de una variable cualitativa listando las categoras o valores de la variable en el eje X y dibujando una barra sobre cada categora. La altura de la barra es igual al porcentaje de tems en esa categora. Las barras deben tener el mismo ancho.
3

Prof. V. Contreras T

ESTADISTICA

FIME

DISTRIBUCION DE FRECUENCIAS, de la variable cuantitativa discreta Nmero de


hijos

Prof. V. Contreras T

ESTADISTICA

FIME

Prof. V. Contreras T

ESTADISTICA

FIME

Mtodos grficos para describir variables cuantitativas

Prof. V. Contreras T

ESTADISTICA

FIME

Formas de distribuciones
Los trminos usados para describir la forma de una distribucin son: Simtrica: La distribucin puede ser dividida en dos partes alrededor de un valor central y cada parte es el reflejo de la otra. Sesgada: Un lado de la distribucin se alarga ms que el otro. La direccin del sesgo es la direccin del lado ms largo. Unimodal: La distribucin tiene un nico mximo que muestra el o los valores ms comunes en los datos. Bimodal: La distribucin tiene dos mximos. Esto resulta a menudo cuando la muestra proviene de dos poblaciones. Uniforme: Los valores posibles tienen la misma frecuencia

Prof. V. Contreras T

ESTADISTICA

FIME

Diagrama de Tallo y Hojas (Stem and Leaf).


Los grficos o diagramas de tallo y hoja son una manera muy fcil de ordenar y mirar la distribucin de los datos. Proporciona informacin respecto al rango del conjunto de datos, muestra la ubicacin de la mayor concentracin de mediciones y revela la presencia o ausencia de distribucin de los datos. Pasos para hacer un Tallo y Hoja: 1. Separar cada medida en un tallo y una hoja. Generalmente la hoja consiste en exactamente un dgito (el ltimo) y el tallo consiste en uno o ms dgitos. Ejemplo: 734 => tallo=73, hoja=4 2,345 => tallo=2,34, hoja=5. A veces se deja fuera el decimal pero se agrega una nota de cmo leer el valor. Para 2,345 por ejemplo podremos decir que 234 | 5 se debe leer como 2,345. 2. Escribir los tallos en orden creciente de arriba abajo y dibujar una lnea a la derecha de los tallos. Ejemplo. Separamos los nmeros en un tallo y una hoja: 45 41 51 46 47 42 43 50 39 32 41 44 47 49 45 42 41 40 45 37 Solucin
3|2 3|79 4|01112234 4|5556779 5|01

As podemos visualizar mejor que la distribucin.


8

Prof. V. Contreras T

ESTADISTICA

FIME

Usando el SPSS se tiene el diagrama de Tallos y Hojas para los datos de gastos semanales de la tienda VENDO

Diagrama de dispersin
Tambin llamado Scatterplot, muestra la dispersin de datos bivariados, los cuales consisten de observaciones pareadas obtenidas desde dos variables numricas. Es usado para detectar la posible relacin entre las dos variables.

Tablas de contingencia: Muestra en forma simultnea la frecuencia de dos variables categricas.

Prof. V. Contreras T

ESTADISTICA

FIME

Diagrama de Cajas: Tambin llamado Boxplot, muestra la dispersin de la variable en estudio. Es usando para comparar la variabilidad de dos o ms conjuntos de datos.

MEDIDAS DE TENDENCIA CENTRAL

1. LA MEDIA ARITMETICA Para Datos No Agrupados. El promedio aritmtico de un conjunto de valores

es:

Para Datos Agrupados.

10

Prof. V. Contreras T

ESTADISTICA

FIME

2. LA MEDIANA Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores. Para Datos No agrupados.

Para Datos agrupados.

= El menor intervalo

tal que se cumpla


11

Prof. V. Contreras T

ESTADISTICA

FIME

3. LA MODA Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son: - Puede no existir o existir ms de una moda - Su valor no se ve afectado por los valores extremos en los datos - Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa - Es una medida inestable cuando en nmero de datos es reducido. Para Datos No Agrupados. Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue: { 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Moda = Mo = 7.1; Es el valor ms frecuente, ocurre 3 veces. Para Datos Agrupados.

12

Prof. V. Contreras T

ESTADISTICA

FIME

4. MEDIA GEOMTRICA Corresponde al valor representativo central de observaciones estrechamente relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento, disminucin. El promedio geomtrico de los valores: es:

secuenciales y

13

Prof. V. Contreras T

ESTADISTICA

FIME

5. PROMEDIO PONDERADO Cuando se desea encontrar el promedio de valores (X1 X2 ... Xk ) que ocurren con frecuencias (f1,f2 ... fk ) diferentes se debern ponderar los valores observados con pesos diferentes:

6. PROMEDIO TOTAL Corresponde al valor promedio representativo de grupos de observaciones separadas o diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por tanto:

14

Prof. V. Contreras T

ESTADISTICA

FIME

7. MEDIA ARMNICA El promedio armnico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor cero es:

Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.

15

Prof. V. Contreras T

ESTADISTICA

FIME

PERCENTILES, CUARTILES Y DECILES Para Datos Agrupados Percentiles: Son 99 valores que dividen a un conjunto de datos en 100 partes iguales.

Cuartiles: Son 3 valores Q1; Q2 y Q3 que dividen a los datos en 4 partes iguales El Cuartil 3 (Percentil 75%) se ubicar en el cuarto intervalo

Deciles: Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de datos en 10 partes iguales.

16

Prof. V. Contreras T

ESTADISTICA

FIME

Para Datos No Agrupados El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es:

17

Prof. V. Contreras T

ESTADISTICA

FIME

B. MEDIDAS DE VARIABILIDAD 1. AMPLITUD O RANGO Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin) 2. VARIANCIA Para Datos No Agrupados

Para Datos Agrupados La variancia de los valores: (x1 x2 ... xk ) que ocurren con las frecuencias (f1 f2 ... fk ) es:

18

Prof. V. Contreras T

ESTADISTICA

FIME

3. DESVIACIN ESTNDAR Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este indicador tiene la misma unidad de medida en la que se expresa el promedio.

4. COEFICIENTE DE VARIABILIDAD Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo valor del promedio de los datos:

C. MEDIDA DE FORMA: ASIMETRIA O SESGO Evala el grado de distorsin o inclinacin que adopta la distribucin de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de asimetra de Pearson es:

19

Prof. V. Contreras T

ESTADISTICA

FIME

D. MEDIDA DE FORMA: CURTOSIS Evala el grado de apuntamiento de la distribucin, el coeficiente es:

GRAFICA DE CAJAS

El diagrama de caja se construye de la siguiente manera: Dibujar la caja que empieza en el primer cuartil y termina en el tercer cuartil. Dibujar la mediana con una lnea dentro de la caja Localizar los dos valores adyacentes por medio de la escala a lo largo del eje horizontal, y unamos a la caja con lneas horizontales llamados Bigotes. Cualquier valor atpico sospechoso se marca en el grfico con un (*) y est entre los bordes internos y externos los valores atpicos extremos se marcan con un crculo () y est.an fuera del borde externo NOTAS Los valores adyacentes son las ltimas observaciones en el conjunto ordenado antes del borde interno. Los bordes internos tambin son llamados limite inferior y limite superior y estn dadas por . los bordes externos estn dadas por .

20

Prof. V. Contreras T

ESTADISTICA

FIME

Si la distancia entre la mediana y los cuartiles es aproximadamente la misma podemos deducir que la distribucin de los datos es ms o menos simtrica como como se ve en el histograma y en el diagrama de tallo y hoja.

Del ejemplo, valores de compras en peridicos en los ltimos 32 dias del Hotel AAA { 5.2, 10.2, 7.0, 7.1, 10.6, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Se tiene la grafica de cajas:

21

Prof. V. Contreras T

ESTADISTICA

FIME

22

Prof. V. Contreras T

ESTADISTICA

FIME

23

You might also like