You are on page 1of 14

MEDIDAS ESTADISTICAS

Medidas de Posicin o de
Tendencia Central.
Medidas de Dispersin o
Variacin.
Medidas
(Asimetra

de

Forma
y

INTRODUCCION
El
conocimiento
de
las
medidas
de
centralizacin ( de Posicin o de Tendencia
central ) no es suficiente para caracterizar
completamente a una distribucin.
Para hacer una descripcin ms precisa de los
conjuntos de datos y para hacer comparaciones
Las medidas
de variabilidad
o de
dispersin
vlidas,
sin llegar
a conclusiones
engaosas,
es
cuantifican el
grado
concentracin
o de
de
importante
tomar
en de
cuenta
la variacin
dispersin
de los de
datos
alrededor
de un
los
datos alrededor
un valor
central.
promedio, permiten comparar conjuntos de datos
y ayudan a verificar si determinadas medidas de
tendencia central son o no significativas.
Por ejemplo, cuando la dispersin es muy grande
(heterogeneidad), la media aritmtica no tiene

La dispersin o variabilidad
0.3

60

50

0.2

40
30

0.1

20
10

0.0
0

10

20

30

40

Dos distribuciones de
datos con diferentes
medidas
de
variabilidad pero con
la misma medida de
posicin.

12

16

20

Tres distribuciones de
datos con diferentes
medidas de variabilidad
y de posicin.

II. MEDIDAS ESTADISTICAS de

DISPERSION o de VARIABILIDAD
Una de las caractersticas importantes en
el anlisis de los datos, adems de los
promedios,
es
la
DISPERSIN

VARIABILIDAD.
La dispersin es la cantidad de variacin,
desperdigamiento o diseminacin en los
datos en torno al promedio.
Las medidas de Dispersin ms
2 usadas son:

i. Rango
R

ii. Rango intercuartil


RIQ

iii. Varianza
V(x),
S2 ,
iv. Desviacin estndar
S,

1.) Rango
Es la diferencia entre el valor mximo y
el valor mnimo de las observaciones.

R= XMAX XMIN
Nos da una idea muy rpida de la
dispersin de los datos, pero no
proporciona informacin acerca de los
Ejemplo:
datos que no son extremos.
El rango de 1, 2, 3, 4, 5, 21 es: 21 1 =
20.
El rango de 47 54 57 60 63 65 67 es:
67 47 = 20, igual que el del caso anterior.
Estos dos ejemplos muestran que el rango
NO informa acerca de la manera como se

2.) RANGO INTERCUARTIL


Es la diferencia entre el cuartil superior y el
cuartil inferior:

RIQ = Q3 Q1 = P75 P25


Como se puede observar, este indicador
informa acerca de la dispersin que hay en
el 50% central de la distribucin; es decir,
excluye el 25 % ms alto y el 25 % ms
bajo de un conjunto de datos.
A diferencia del rango, esta medida no se

3.) VARIANZA
POBLACIONAL:

Xi

VARIANZA DLA
2 ms estable que
EsMUESTRA:
una medida absoluta
de variabilidad,
V(X)
,
S
,
el rango, aunque sus unidades se expresan en unidades de
la variable, pero al cuadrado; lo que hace difcil su
interpretacin.
Es un promedio de las desviaciones cuadrticas de un
conjunto de observaciones de una variable respecto a su
media aritmtica.

El valor de la varianza puede sufrir


un cambio muy desproporcionado ,
aun ms que la media, por la
existencia
de
algunos
valores

Clculo de la Varianza en una muestra:


Datos no Clasificados originales
n

S2

i 1

( xi x ) 2
S2

n 1

i 1

xi 2 n x

n 1

Datos en tablas de frecuencias


k

S
2

( Xi )
i 1

n 1

fi

S2

i 1

2
i

fi n X

n 1

transformaciones en las variables originales,


estas tambin se reflejan en las medidas de
centralizacin y en las de variacin.
Estas propiedades son muy tiles
cuando se tiene que calcular el nuevo
promedio y la nueva varianza y no se tienen
los datos originales o estos son demasiado
numerosos.
VEn
( x este
) 0 caso tendremos las siguientes
propiedades
para la varianza de una
V ( k ) = 0, si k es constante
variable:
V ( k x ) =k2 V(x)
V ( x k) = V (x)
V ( x y ) = V (x) + V(y) si son variables
independientes.
No permite interpretacin lineal por tener las
unidades en estudio con exponente cuadrtico.

Ejemplo:
Calcular la varianza de los siguientes
valores numricos:
5, 9, 11, 7
Calcular la varianza para los siguientes
gastos en publicidad de diferentes
empresas de servicios:
[ Gastos >
xi
fi
50 - 80

65

30

80 - 110

95

50

110 - 140

125

85

140 - 170

155

15

S,
. ) Desviacin estndar:
Como la varianza se expresa en unidades (de los datos)
al cuadrado, se establece una medida de variabilidad o
dispersin que es mas fcil de interpretar, esta medida
es la DESVIACIN ESTANDAR,
cuya interpretacin
es mas sencilla, porque tiene las mismas
unidades de las observaciones. Si se calcula a
partir de la muestra es la raz cuadrada de la
varianza:

S Varianza

Mide la dispersin absoluta de los datos y


acompaada de la media aritmtica proporciona
una buena descripcin de ellos.

Caractersticas de la Desviacin Estndar:


Uso muy ventajoso en el anlisis de los datos.
Puede usarse como medida entorno a la media y
decidir para aquellos valores que estn fuera de este
intervalo como no normales.
Est basada en cada uno de los valores. Por eso
permite una mejor descripcin de la dispersin.
Mide la dispersin alrededor de la media y no entre
valores.
Cuando cada valor de la variable aumenta o
disminuye en una constante, la S no es afectada.
Cuando cada valor de la variable se multiplica o
divide por una constante, la S queda multiplicada o
dividida por la misma constante.

.) Coeficiente de Variacin: c.v.,


Es una medida de la dispersin relativa ( % ) de los datos
respecto a la media aritmtica, que significa en promedio la
dispersin de la unidad de la variable.
Se expresa en porcentajes de nmeros abstractos por eso es muy til
cuando se quiere comparar el grado de dispersin (homogeneidad o
variabilidad) en dos o ms conjuntos de datos que tienen un promedio
diferente y/o tienen diferentes unidades de medida.
Mientras menor es el Coeficiente de Variacin, menor es la dispersin
de los datos (Mayor homogeneidad).
Se calcula de la siguiente manera:

s
(100 )
x
Si CV < 25%

Baja dispersin
Si CV > 50%
Alta dispersin
En otro caso Dispersin moderada

III. MEDIDAS ESTADISTICAS de FORMA


1.) Medidas de Asimetra
No todas las distribuciones son simtricas. Algunas de las
distribuciones son sesgadas a la izquierda o a la derecha.
En el caso de existencia de valores extremos, la medida que se ve
ms afectada es la media aritmtica. No tanto as la Mediana ni la
Moda.
Como sabemos, la moda es el dato que ms se repite y por lo tanto
est en el pico de la distribucin. Hacia la cola se encuentran la
mediana y la media.

Los siguientes grficos muestran tres distribuciones


de datos, dos asimtricas y una simtrica

D is t r ib u c i n A s im t r ic a P o s it iv a o a la D e r e c h a

D is t r ib u c i n S im t r ic a

X me mo

mo me X

0 .0

0 .2

0 .4

D is t r ib u c i n A s im t r ic a N e g a t iv a o a la Iz q u ie r d a

mo me X

0 .6

0 .8

1 .0

0 .0

0 .2

0 .4

0 .6

0 .8

1 .0

0 .0

0 .2

0 .4

0 .6

0 .8

1 .0

You might also like