You are on page 1of 19

Introduccin MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION En el caso de las variables con valores que pueden definirse en trminos de alguna

escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersin o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersin en los datos inters, entonces no habra necesidad de la gran mayora de las medidas de la estadstica descriptiva. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras. MEDIDAS DE TENDENCIA CENTRAL MEDIA: Media aritmtica, es la que se obtiene sumando los datos y dividindolos por el nmero de ellos. Se aplica por ejemplo para resumir el nmero de pacientes promedio que se atiende en un turno. Otro ejemplo, es el nmero promedio de controles prenatales que tiene una gestante. MEDIANA: Corresponde al percentil 50%. Es decir, la mediana divide a la poblacin exactamente en dos. Por ejemplo el nmero mediana de hijos en el centro de salud X es dos hijos. Otro ejemplo es el nmero mediana de atenciones por paciente en un consultorio. MODA: Valor o (valores) que aparece(n) con mayor frecuencia. Una distribucin unimodal tiene una sola moda y una distribucin bimodal tiene dos. til como medida resumen para las variables nominales. Por ejemplo, el color del uniforme quirrgico en sala de operaciones es el verde; por lo tanto es la moda en colores del uniforme quirrgico.

MEDIDAS DE DISPERSIN DESVIACIN ESTNDAR: Llamada tambin desviacin tpica; es una medida que informa sobre la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. LA VARIANZA: Es el valor de la desviacin estndar al cuadrado; su utilidad radica en que su valor es requerido para todos los procedimientos estadstico. ERROR TPICO: Llamado tambin error estndar de la media. Se refiere a una medida d variabilidad de la media; sirve para calcular cuan dispersa estara la media de realizar un nuevo calculo.

7. Medidas de Tendencia Central 7.1 Media

13

7.1.1 Media para un conjunto de datos no agrupados Este parmetro lo usamos con tanta cotidianidad que nos ser muy familiar, aunque tambin aprenderemos algunas propiedades y mostraremos un teorema sumamente importante. Si tenemos el siguiente conjunto de datos y deseamos encontrar un valor que represente a todo el conjunto, seguramente lo primero que vendr a nuestra mente es 13 sumar todos los valores y dividirlos entre el nmero total de datos. Ejemplo: Nmero de alumnados en la clase de Educacin Fsica. 10, 9, 8, 10, 9, 9, 10, 9, 10, 9 Este valor, promedio aritmtico, es conocido como la media y es una de las medidas de tendencia central ya que representa un valor con respeto a toda la informacin. Ejemplo para el clculo de la media. Sean los siguientes valores las calificaciones de la asignatura de Educacin Fsica de estudiantes de primer ao:

10 8 6

8 6 6

6 7.5 7 7.5 8 9.5 10 10 9 10 7.5 6 9.5 10 6.5 8 9 10 7 8 9.5 5 8 7.5

Sumando los valores de las 30 calificaciones y dividindolas entre los 30 datos obtendremos: Por lo que la media de las calificaciones obtenidas por el grupo considerado es igual a 8. Para datos agrupados la expresin de la media cambia ligeramente, como se muestra a continuacin. 7.1.2 Media para un conjunto de datos agrupados. La media para datos agrupados es la siguiente: Donde es el total de datos, m es el nmero total de clase y es la frecuencia de datos. La definicin es claramente entendida como una extensin de la definicin que dimos para datos no agrupados, ya que es lgico suponer que datos que se repiten con una frecuencia pueden simplificar la suma por supuesto que los ndices de la segunda suma con respecto a la primera corren con respecto a menor nmero, es decir, con respecto al nmero de agrupamientos m. Ejemplo: Goles anotados por el Quertaro durante la temporada. Sean los siguientes datos 1, 1, 2, 2, 4, 4, 5, 2, 3, 2, 3, 4, 1, 2, 1. La media para dichos datos es aproximadamente igual a 2.4666 Para la obtencin de la media cuando las frecuencias estn sujetas a la eleccin de clase bajo los mtodos mostrados, se realiza de igual manera, la nica diferencia existe en determinar el valor como el punto medio de cada estatura, veamos el siguiente ejemplo: Tabla de frecuencias reportadas por un equipo de baloncesto con respecto a la estatura de los jugadores.

7.2 Moda

13

7.2.1 Moda para datos agrupados La moda es la medida que se relaciona con la frecuencia con la que se representa el dato o los datos con mayor incidencia, por lo que se considera la posibilidad de que exista ms de un moda para un conjunto de datos. La notacin ms frecuente es la siguiente: Moda y esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene mas de un dato repetido se dice que es multimodal y un ltimo caso es cuando ningn dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal. Ejemplos: 1.- Determinar la moda del siguiente conjunto de datos: a) 1,2,3,3,4,5,6,7,7,3,1,9,3 2.- La moda de este conjunto de datos es igual a 3 y se considera unimodal: b) 1,2,3,4,4,5,2,1,3,4,2,-3,4,6,3,3 3.- Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la mas alta frecuencia, por lo que la muestra es binomial. c) 1,2,3,4,5,6,7,8,9 4.- La muestra no contiene ningn dato repetido por lo que se considera que la muestra es a modal. Grficamente eso se puede reflejar mediante el anlisis de un histograma de frecuencias.

7.2.2 Moda para datos agrupados Para determinar la moda para datos agrupados en clases de igual tamao su clculo se puede realizar de la siguiente forma: Donde: Aunque la expresin se ve un poco diferente en realidad se trata de una

misma ecuacin. Ejemplo: Tabla de frecuencias reportadas por un equipo de baloncesto con respecto a la estatura de los jugadores.

7.3 Mediana

13

7.3.1 Mediana para datos no agrupados La mediana de un conjunto finito es aquel valor que divide al conjunto en dos partes iguales, de forma que el nmero de valores mayor o igual a la mediana es igual al nmero de valores menores o igual a estos. Su aplicacin se ve limitada ya que solo considrale orden jerrquico de los datos y no alguna propiedad propia de los datos, como es en el caso de la media. A continuacin se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios: Lo primero que se requiere es ordenar los datos en de forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado. Sean ordenados los datos en orden ascendente. Si el nmero de valores es impar, la mediana es el valor medio, el cual corresponde al dato. Cuando el nmero de valores en el conjunto es par, no existe un solo valor Medio, si no que existen dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la mediana es numricamente igual. Podemos describir algunas propiedades para la mediana: 1.- Es nica. 2.- Es simple. 3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si 13 ocurre con la media. Ejemplo: Dados los siguiente datos: 1,2,3,4,0,1,4,3,1,1,1,1,2,1,3 para la obtencin de la mediana se debern de ordenar. Tomemos el criterio de orden ascendente con lo que tendremos: 0,1,1,1,1,1,1,1,2,2,3,3,3,4,4 Por otro lado el nmero de datos es igual a 15 datos, siendo el nmero de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1. 7.3.2 La mediana para datos agrupados. La extensin para el clculo de la mediana en el caso de datos agrupados es realizada a continuacin: Donde:

Md = Mediana. Li = Limite inferior o frontera o inferior de donde se encuentra la mediana, la forma de calcularlo es a travs de encontrar la posicin. En ocasiones en el intervalo donde se encuentra la mediana de conoce como intervalo mediano. n= Nmero de observaciones o frecuencia total. F acum. = frecuencia acumulada anterior al intervalo mediano F mediana = Frecuencia del intervalo mediano. A= Amplitud del intervalo en el que se encuentra la mediana. Geomtricamente la mediana se encuentra en el valor X que divide al histograma en 13 dos partes de reas iguales.

FORMULARIO Medidas de tendencia central

Para datos no Agrupados

Para datos Agrupados Donde: es la medida muestral. x es cada uno de los datos (no agrupados) o la marca de clase (agrupados) f es la frecuencia absoluta de cada Clase n es el nmero de datos (tamao de la muestra)

Para datos agrupados. Donde: es la mediana de la muestra. n es el nmero total de los elementos de la distribucin F es la suma de todas las frecuencias de clase anteriores a la clase mediana fm es la frecuencia de la clase mediana (que contiene el dato intermedio) w es el ancho de intervalo de clase. Lm es el limite inferior del intervalo de clase mediano.

Donde:

Para datos agrupados es la moda de la muestra

Lmo es el limite inferior de la clase modal. d1 es la frecuencia de la clase modal menos la frecuencia de la anterior d2 es la frecuencia de la clase modal menos la frecuencia de la clase siguiente 2 w es el ancho del intervalo de la clase modal MEDIDAS DE DISPERSIN
17

Existe otro tipo de medidas que indican la tendencia de los datos a dispersarse respecto al valor central. La dispersin es importante porque: Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes.

Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente de variacin.

Algunas de las medidas de dispersin ms usuales son: a) b) c) d) e) Rango, amplitud o recorrido (R) Desviacin estndar (S , muestral; Varianza (S , s ) Desviacin media (DM). Coeficiente de Variacin (C. V.)

s , poblacional ).

7.4 Rango Es la diferencia entre el dato mayor y el dato menor. R= X mx. - Xmn. 7.5 Desviacin estndar. La desviacin estndar o desviacin tipo se define como la raz cuadrada de los cuadrados de las desviaciones de los valores de la variable respecto a su media.
17

7.6 Varianza. Es el cuadrado de la desviacin estndar. EJEMPLO:

Hallar la desviacin estndar y la varianza de la siguiente serie de datos. 10, 18, 15, 12, 3,6,5,7 SOLUCION:

EJEMPLO: Hallar la desviacin estndar y la varianza para la siguiente distribucin de frecuencias.

S = 43.4 7.7 Desviacin media. Se conoce tambin como promedio de desviacin. Para una serie de N valores se Puede calcular a travs de la siguiente expresin:

= Valor absoluto de las desviaciones de los x valores, respecto de la media. Y para datos agrupados se tiene:

EJEMPLO: Hallar la desviacin media de: 4,6,12,16,22.

EJEMPLO: Hallar la desviacin media en la siguiente distribucin de frecuencias. SOLUCION:


17

7.8 Coeficiente de Variacin. Es la relacin que existe entre la S y la X, expresada en trminos de porcentaje y se expresa:

EJEMPLO: Hallar el coeficiente de variacin de una serie de datos cuya S= 2 y X = 16. SOLUCION:

FORMULARIO Medidas de dispersin Rango = valor de la observacin ms alta valor de la observacin ms pequea Rango = valor del lmite inferior de la 1er clase valor del lmite superior de la ltima clase.

Para datos no agrupados.

Para datos agrupados.

Donde: (agrupados)

s2 es la varianza de la muestra x es cada uno de los datos (no agrupados) o la marca de clase es la media muestral f es la frecuencia absoluta de cada clase n es el nmero total de datos (tamao de la muestra)

Para datos no agrupados.

Para datos agrupados.

Donde: (agrupados)

s es la desviacin estndar de la muestra x es cada uno de los datos (no agrupados) o la marca de clase es la media muestral f es la frecuencia absoluta de cada clase n es el nmero total de datos (tamao de la muestra)

Donde:

c.v. es el coeficiente de variacin de la muestra s es la desviacin estndar de la muestra

es la media muestral

EJEMPLO 1

El nmero de dis necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media, mediana, moda, varianza y desviacin tpica.

SOLUCIN:

La media: suma de todos los valores de una variable dividida entre el nmero total de datos de los que se dispone:

La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.

Sx2=

La desviacin tpica S: es la raz cuadrada de la varianza.

S = 427,61 = 20.67

El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 das

El coeficiente de variacin: cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

CV = 20,67/52,3 = 0,39

EJEMPLO 2

El precio de un interruptor magentotrmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadstica, ms abajo) diagrama de barras y el diagrama de caja.

SOLUCIN:

(Utilizar la calculadora de debajo)

Proceso

Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

u MEDIA : (media aritmtica o simplemente media). es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi.

u MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

u MODA (M0): es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser nica.

Medidas de Dispersin

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que

no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.

MEDIDAS DE DISPERSIN ABSOLUTAS

u VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones.

Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de Xi.

u DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza

Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin tpica):

u RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax - xmin

MEDIDAS DE DISPERSIN RELATIVAS

u COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se define como el cociente entre la desviacin tpica y el valor absoluto de la media aritmtica

CV representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.

Medidas de Forma

Comparan la forma que tiene la representacin grfica, bien sea el histograma o el diagrama de barras de la distribucin, con la distribucin normal.

MEDIDA DE ASIMETRA

Diremos que una distribucin es simtrica cuando su mediana, su moda y su media aritmtica coinciden.

Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o relativas) descienden ms lentamente por la derecha que por la izquierda.

Si las frecuencias descienden ms lentamente por la izquierda que por la derecha diremos que la distribucin es asimtrica a la izquierda.

Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el Coeficiente de Asimetra de Pearson:

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe asimetra a la izquierda.

Recursos

Evaluacin

TAREAS:

Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos, encontrar la varianza de las edades de estos estudiantes:

Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:

Xi

( Xi - ?)

( Xi - ?)2

18

(18 25.5)=-7.4

(-7.4)2=54.76

23

(23 25.5)=-2.4

(-2.4)2= 5.76

25

(25 25.5)=-0.4

(-0.4)2= 0.16

27

(27 25.5)= 1.6

( 1.64)2= 2.16

34

(34 25.5)= 8.6

( 8.6)2 =73.96

Total

xxxx

137.20

TAREA 2:

Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabreras y Asociados dispuestos en una tabla de distribucin de frecuencias, a partir de los cuales se deber calcular la varianza, para lo cual se construye la siguiente tabla estadstica de trabajo, si se calcul anteriormente la media aritmtica y se fij en 43.458 (ver ejemplo del calculo en "media aritmtica para datos agrupados) de la siguiente manera

Punto medios clases Xi fi Xi2 Xifi X2fi

7.420 21.835

14.628

10

213.978

146.280

2,139.780

21.835 36.250

29.043

843,496

116.172

3,373.984

36.250 50.665

43.458

1,888.598

217.270

9,442.990

50.665 65.080

57.873

3,349.284

173.619

10,047.852

65.080 79.495

72.288

5,225.555

216.864

15,676.665

79.495 93.910

86.703

7,533.025

433.965

37,665.125

Total

XXX

30

19,053.936

1,304.190

78,346.396

Conclusin

You might also like