You are on page 1of 107

Medidas de Tendencia Central y

Dispersin
En la Unidad anterior vimos que:

La enumeracin de los datos representa un avance
importante en el anlisis de la informacin.

La distribucin de frecuencias organiza los datos en
un formato que facilita su anlisis e interpretacin.

La conversin a frecuencias relativas permite hacer
comparaciones valiosas y significativas.

Adicionalmente, vimos que la utilizacin de
distribuciones de frecuencias en intervalos de clases:

Resume y condensa la informacin presente en los
datos
Genera datos agrupados que facilitan el anlisis
Se pierde informacin individual pero se gana en
capacidad de anlisis de caractersticas globales
La conversin a frecuencias relativas permite hacer
comparaciones valiosas y significativas.
El uso de grficos permite una rpida visualizacin
de estas caractersticas globales.




Otra tcnica estadstica es poder resumir aspectos
presentes en los datos con un nico valor (o algunos
valores).

Podemos usar una serie de nmeros conocidos como
estadstica sumaria para describir las caractersticas
del conjunto de datos. Dos de estas caractersticas son
de particular importancia para los responsables de
tomar decisiones:

la tendencia central

la dispersin


Medidas de Tendencia Central
En estadstica, cuando se analizan los datos que
constituyen la muestra bajo estudio, es importante
determinar la manera en la cual se agrupa la
informacin, como varan los datos, y como estn
distribuidos. Para ello, existen diferentes medidas que
nos permiten determinar estas caractersticas, y nos
ayudan a comprender el significado o implicaciones de
la informacin.

Medidas de Tendencia Central
La caracterstica ms importante que describe o resume un
grupo de datos es su posicin.
Los conjuntos de datos generalmente muestran una
tendencia definida a agruparse o resumirse en torno a cierto
punto, por lo que para cualquier conjunto particular de
datos, es posible seleccionar un valor tpico para describir,
representar o resumir todo el conjunto de datos.
De acuerdo a la organizacin de los datos hay dos formas de
estimar este tipo de medidas ya sea para datos no
agrupados o agrupados
Medidas de Tendencia Central
Son medidas estadsticas que se usan para describir
como se puede resumir la localizacin de los datos.
Ubican e identifican el punto alrededor del cual se
centran los datos. Las medidas de tendencia central
nos indican hacia donde se inclinan o se agrupan
ms los datos. Las ms utilizadas son:
o La Media,
o La Mediana
o La Moda
o Los Percentiles
o Los Cuartiles.

Medidas de Tendencia Central
Medidas de Tendencia Central
MEDIA
MEDIANA
MODA
PERCENTILES
CUARTILES
La Media
La media o media aritmtica, usualmente
se le llama promedio. Se obtiene sumando
todos los valores de los datos y dividiendo
el resultado entre la cantidad de datos. Si
los datos proceden de una muestra, el
promedio se representa con . Si los datos
proceden de la poblacin, se utiliza la letra
griega ().






XX
X
La frmula matemtica para calcular la media o
promedio es la siguiente:



donde;

= promedio arimtico

= signo de sumatoria. Representa la suma
de todos los datos x

N = numero de datos. Es la muestra o poblacin

Veamos como se emplea la media o promedio con
el siguiente ejemplo:
x
X
N
=

X

La Media
Cuando los datos no se encuentran sumarizados en una
tabla de frecuencias, se les llama no agrupados. A
continuacin se presenta una muestra de las puntuaciones
en un examen de un curso de estadstica:

70 90 95 74
58 70 98 72
75 85 95 74
80 85 90 65
90 75 90 69

Podemos calcular el promedio de las puntuaciones para
conocer cuntos estudiantes obtuvieron puntuaciones por
encima y por debajo del promedio . Veamos
La Media Ejemplo 1

Primero, sumamos todos los valores de los datos y el
resultado lo divide entre el total de datos o tamao de
la muestra. Al sumar todas las puntuaciones en el
ejemplo anterior obtendrs un total de 1600, que
dividido por 20(total de datos), es igual a 80. Si
empleamos la frmula obtenemos:



x
X
N
=
1600
80
20
X = =
La Media Ejemplo 1
La Media Ejemplo 2
Otro ejemplo con datos no agrupados.
Cul es la media de 10, 12, 7, 3, 5, 8?


5 . 7
6
45
6
8 5 3 7 12 10
= =
+ + + + +
= =

n
x
X
La Media Ejemplo 3
Mara, una estudiante universitaria, tiene las
siguientes calificaciones en las 10 asignaturas
que recibe en su carrera:
8, 7, 10, 9, 8, 7, 8, 10, 9 y 10.

Jos, un compaero de Mara, tiene las
siguientes calificaciones:
8, 9, 8, 7, 8, 9, 10, 7, 8 y 10.

Cul es la media de las calificaciones de cada
estudiante?
La Media Ejemplo 3
Solucin:

Tal como mencionamos antes, para calcular la
media arimtica, se suman todas las
calificaciones y se dividen por el numero de
asignaturas. En el caso de Mara, si trabajamos
con los datos no agrupados:





8 9 8 7 8 9 10 7 8 10
10
X
+ + + + + + + + +
=
86
8.6
10
X = =
La Media Ejemplo 3
Observe que en este ejemplo, los datos son pocos.
En caso de muchos elementos, esto puede resultar
en largas listas de nmeros, por lo que resulta
preferible construir una tabla de frecuencias con la
informacin. Esto simplifica la sumarizacin y reduce
la posibilidad de errores. Cuando se trabaja con
tablas de frecuencia, se les llama datos agrupados

Entonces, con la informacin de los estudiantes,
procedemos a construir las tablas de frecuencia.
Recuerde que la variable es la calificacin obtenida
en cada asignatura. Adicionalmente, recuerde que la
variable es numrica, y que deseamos calcular su
media arimtica.
Para Mara:






La primera columna contiene la variable bajo estudio, la segunda
contiene la cantidad de observaciones para esa calificacin, y la
tercera columna es el producto de las 2 primeras columnas (para
calcular la media arimtica). Entonces:


La Media Ejemplo 3
Calificaciones (xi) f fxi
7 2 14
8 3 24
9 2 18
10 3 30
Total 10 86
86
8.6
10
i
fx
X
N
= = =

Para Jos:








La Media Ejemplo 3
Calificaciones (xi) f fxi
7 2 14
8 4 32
9 2 18
10 2 20
Total 10 84
84
8.4
10
i
fx
X
N
= = =

Es la medida de tendencia central ms usada.


Emplea en su clculo toda la informacin disponible.
Se expresa en las mismas unidades que la variable en
estudio.
Se trata de un concepto familiar para la mayora de las
personas y es intuitivamente claro.
Cada conjunto de datos tiene una media, es una medida que
puede calcularse y es nica debido a que cada conjunto de
datos posee una y slo una media.
Es til para llevar a cabo procedimientos estadsticos como la
comparacin de medias de varios conjuntos de dato
Es sensible a cualquier cambio en los datos (puede ser usado
como un detector de variaciones en los datos).
La Media - Ventajas
Puede verse afectada por valores extremos que no son
representativos del resto de los datos
No es recomendable emplearla en distribuciones muy
asimtricas.
Si el conjunto de datos es muy grande puede ser tedioso su
clculo manual.
No se puede calcular para datos cualitativos.


La Media - Desventajas
La Mediana
La segunda medida de tendencia central que
analizaremos es la mediana, en ocasiones se le
llama media posicional, porque queda
exactamente en la mitad de un grupo de datos,
luego de que los datos se han colocado de forma
ordenada. En este caso la mitad (50%) de los
datos estar por encima de la mediana y la otra
mitad (50%) estar por debajo de ella. La
mediana es el valor intermedio cuando los valores
de los datos se han ordenado.
La Mediana

La mediana, a diferencia de la media no busca el valor
central del recorrido de la variable segn la cantidad de
observaciones, sino que busca determinar el valor que
tiene aquella observacin que divide la cantidad de
observaciones en dos mitades iguales. Por lo tanto es
necesario atender a la ordenacin de los datos, y debido
a ello, este clculo depende de la posicin relativa de los
valores obtenidos. Es necesario, antes que nada,
ordenar los datos de menor a mayor (o viceversa).


en caso que N sea impar
La Mediana
Existen dos formas para obtener
la mediana. Primero, si la
cantidad de los datos es impar, la
mediana es el valor que se
encuentra en la posicin (n+1)2
donde, n es el nmero de datos.
Por ejemplo, se tiene una muestra
de tamao 5 con los siguientes
valores: 46, 54, 42, 48 y 32.
Veamos como se determina la
mediana.


Pasos para Calcular la Mediana
Primer paso, ordenar los datos:
32 42 46 48 54
Como la cantidad de datos es impar
(5 datos), la mediana es el valor del dato que
se encuentra ubicado en la posicin

(5+1)2=3

En este caso, la mediana es 46.
Pasos para Calcular la Mediana
Segundo, si la cantidad de datos es par, la
mediana es el valor promedio de los datos
que se encuentran en las posiciones (n2) y
(n2) + 1.

Veamos el siguiente ejemplo:
Pasos para Calcular la Mediana
Se ha obtenido una muestra con los valores de datos: 27,
25, 27, 30, 20 y 26. cmo se determina la mediana en este
caso?

Primer paso, ordenar los datos de forma ascendente:
20 25 26 27 27 30

Como el nmero de datos es par (6), la mediana es el
promedio de los datos que se encuentran en las posiciones
(62) = 3 y (62) +1 = 4. por lo tanto la mediana es:


=
2
27 26+
26.5
Ventajas de la Mediana
Fcil de calcular si el nmero de observaciones no es
muy grande.
No se ve influenciada por valores extremos, ya que solo
influyen los valores centrales.
Fcil de entender.
Se puede calcular para cualquier tipos de datos
cuantitativos, incluso los datos con clase de extremo
abierto.
Es la medida de tendencia central ms representativa en
el caso de variables que solo admiten la escala ordinal.
Desventajas de la Mediana
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de veces que
se ha repetido.
Hay que ordenar los datos antes de determinarla.
Insensible a la magnitud de los valores.
Sensible al tamao del conjunto de datos.


La Moda
La moda es el valor que tiene mayor frecuencia
absoluta. Se puede hallar la moda para variables
cualitativas y cuantitativas, en todas las escalas de
medicion: nominal, ordinal, intervalar y absoluta.
La moda es el dato que ms se repite o el dato que
ocurre con mayor frecuencia. Se representa por Mo
Por ejemplo, usando los valores del ejemplo anterior:
20 25 26 27 27 30
Observamos que la moda es el 27
La Moda
Si en un grupo hay dos o varias puntuaciones
con la misma frecuencia y esa frecuencia es la
mxima, la distribucin es bimodal (2 modas),
por ejemplo, en el siguiente grupo:
20, 23, 20, 24, 25, 25, 26 y 30. El 20 y 25
son la moda.
Si un grupo de datos tiene varias modas, se
dice que es multimodal, es decir, tiene varias
modas. Por ejemplo:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9


La Moda
Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda. Por ejemplo:
2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la
frecuencia mxima, la moda es el promedio de las
dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8
Mo = (3+5)/2=4
La Moda
No es necesariamente nica (puede haber varias
modas)
Se puede calcular con datos en escala nominal
En su clculo no intervienen todos los elementos
Ventajas de la Moda
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Desventajas de la Moda
Para conjuntos pequeos de datos su valor no tiene casi
utilidad, si es que de hecho existe. Solo tiene significado
en el caso de una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se repiten.
En ocasiones, el azar hace que una sola observacin no
represente el valor ms frecuente del conjunto de
datos.
Difcil de interpretar si los datos tiene 3 o ms modas.
Relacin entre Media, Mediana y Moda
En distribuciones totalmente simtricas, la
media, la mediana y la moda coinciden,
localizndose en un mismo valor.

En cambio, en distribuciones
moderadamente asimtricas, la siguiente
relacin se mantiene aproximadamente:

Media Moda = 3(Media Mediana)

Relacin entre Media, Mediana y Moda
Aqu estn las posiciones relativas de la media, la
mediana y la moda para curvas de frecuencias
asimtricas a derecha e izquierda respectivamente.
Como se mencion antes, para curvas simtricas los tres
valores coinciden.
Un percentil nos provee informacin de como se
distribuyen los valores de los datos desde el
menor hasta el mayor. El percentil, representado
por la letra (P), divide los datos en dos partes,
ms o menos el (P)% por ciento de los datos
tienen valores menores que el percentil y
aproximadamente (100-P)% por ciento de los
datos tienen valores mayores que el percentil.
Percentiles
Pasos para Calcular el Percentil

Para calcular el percentil debe seguir los
siguientes pasos:

Paso 1. Ordene los datos de manera
ascendente.
Paso 2. Calcule un ndice (i)





en donde (P) es el percentil de inters y
(n) es el nmero de datos u observaciones.

n
P
i
|
.
|

\
|
~
100
Paso 3.
a) Si (i) no es entero, utilizando las reglas de
redondeo, se lleva al prximo numero entero.
Este valor entero indica la posicin donde se
encuentra el percentil. Esto significa que si
(i)=3.5, el percentil se encuentra en la posicin 4
de los datos.

b) Si (i) es entero, el percentil es el promedio de
los valores de los datos ubicados en los lugares
(i) y (i + 1).

Veamos como se aplica
Pasos para Calcular el Percentil Cont.
Determine el percentil 75 de los datos sobre las
edades del siguiente un grupo de ciudadanos:
25, 20, 26, 21, 19, 23, 22, 30, 28, 27.

Paso 1. Ordene los datos en orden
ascendente:
19 20 21 22 23 25 26 27 28 30

Clculo del Percentil Ejemplo

Paso 2. Calcule el ndice (i):





Paso 3. Como (i) no es entero, redondeamos al prximo entero mayor
que 7.5, o sea, el lugar 8. Al referirnos a los datos del
ejemplo, vemos que el percentil 75 es el valor del dato ubicado
en la posicin nmero 8, que en este caso es 27.

19 20 21 22 23 25 26 27 28 30

Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra
el percentil que estamos buscando.

n
P
i
|
.
|

\
|
~
100
5 . 7 10
100
75
~
|
.
|

\
|
~ i
Clculo del Percentil Ejemplo
Significa que el 75% de las edades son
menores de 27 aos y el 25% restante (100-P)
son mayores de 27 aos.



CMO SE INTERPRETA EL PERCENTIL EN ESTE
EJEMPLO?
Los cuartiles dividen los datos en cuatro
partes. Cada una de las partes representa una
cuarta parte, o el 25% de las observaciones.
Los cuartiles son percentiles especficos; por
consiguiente, los pasos para calcular los
percentiles los podemos emplear para calcular
los cuartiles.
Cuartiles


Los cuartiles se definen de la siguiente manera
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
Q3 = tercer cuartil, o percentil 75
Cuartiles

A continuacin se presenta un conjunto de datos con los siguientes valores:

10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.

Cmo identificamos los cuartiles en este ejemplo?

Respuesta:
Se utilizan los mismos pasos que se usan para identificar los percentiles:

Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30

Segundo, determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
Q3 = tercer cuartil, o percentil 75

Clculo de Cuartiles - Ejemplo
Cuartiles:
Q1 = primer cuartil, o percentil 25

= 2.5

Como(i) no es un nmero entero, se redondea al prximo entero
mayor que 2.5, o sea 3. Al referirnos a los datos vemos que el
primer cuartil est ubicado en la posicin 3 de los datos que este
caso es 11. El primer cuartil en los datos se divide de la siguiente
forma:

5 8 11 12 14 15 18 20 25 30
Q1=1

10
100
25
|
.
|

\
|
~ i
Clculo de Cuartiles - Ejemplo
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)

= 5

Como (i) es un nmero entero, el segundo cuartil es el promedio
de los valores de los datos que estn en las posiciones i e (i+1),
que en este caso es, (14+15)2=14.5, entonces, el segundo
cuartil en los datos se divide as:

5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
10
100
50
|
.
|

\
|
~ i
Clculo de Cuartiles - Ejemplo
Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

= 7.5

Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 7.5, o sea 8. Al referirnos a los datos ,
vemos que el tercer cuartil est ubicado en posicin 8 de los
datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:

5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20
10
100
75
|
.
|

\
|
~ i
Clculo de Cuartiles - Ejemplo
Medidas de Dispersin
En la seccin anterior dijimos que las medidas de tendencia
central se utilizaban para describir como se puede resumir la
localizacin de los datos. Es decir, que ubican e identifican el
punto alrededor del cual se centran los datos. Las medidas
de tendencia central nos indican hacia donde se inclinan o se
agrupan ms los datos.

Al igual que sucede con cualquier conjunto de datos, la
media, la mediana y la moda slo nos revelan una parte de la
informacin que necesitamos acerca de las caractersticas de
los datos. Para aumentar nuestro entendimiento del patrn
de los datos, debemos medir tambin su dispersin,
extensin o variabilidad.
Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el
sintetizar los datos en un valor representativo, las medidas
de dispersin nos dicen hasta que punto estas medidas de
tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la
distribucin respecto al valor central.
Conviene destacar que a mayor dispersin, existe menor
confiabilidad de la medida de tendencia central, por lo que
resulta importante medirla.

Medidas de Dispersin
Las medidas de dispersin, tambin llamadas medidas
de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las
diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor
ser la variabilidad, cuanto menor sea, ms homognea
ser a la media. As se sabe si todos los casos son
parecidos o varan mucho entre ellos.
Distinguimos entre medidas de dispersin absolutas,
que no son comparables entre diferentes muestras y las
medidas de dispersin relativas que nos permitirn
comparar varias muestras.


Medidas de Dispersin
ABSOLUTAS:
Son las que estn expresadas en la misma unidad de medida de la
variable. Las ms comunes son:
Rango o Recorrido de Variacin
Desviacin Media
Varianza
Desviacin Estndar

RELATIVAS:
Son las que estn expresadas en porcentajes. Se estudiar
nicamente:
El Coeficiente de Variacin.

Tipos de Medidas de Dispersin
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la
confiabilidad de la medida de tendencia central. Si los datos se
encuentran ampliamente dispersos, la posicin central es menos
representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente
dispersos, debemos ser capaces de distinguir que presentan esa
dispersin antes de abordar esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si
no se desea tener una amplia dispersin de valores con respecto al
centro de distribucin, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones ms
grandes.
Medidas de Dispersin
La primera medida de dispersin que estudiaremos es el Rango,
que se representa por la letra ( R ), por ser un concepto muy
sencillo y fcil de calcular. En un grupo de datos numricos, el
Rango es simplemente la diferencia entre el valor mximo y el
valor mnimo de los datos. Es decir:
R = Valor mximo Valor Mnimo.
Para calcular el Rango, se debe:
1. Ordenar los nmeros de menor a mayor
2. Tomar el valor mayor y restarle el valor menor
El rango es importante porque Permite obtener una idea de la
dispersin de los datos, cuanto mayor es el rango, ms dispersos
estn los datos de un conjunto.


El Rango o Recorrido
Dado los siguientes datos no agrupados:
4,5,8,6,10,11,8,6,4,3,2,5,4
Para calcular el Rango (R), se ordenan primero de menor a mayor
2,3,4,4,4,5,5,6,6,8,8,10,11
Se toma el mayor, y se le resta el menor
R = 11 2 = 9



El Rango o Recorrido - Ejemplo
8 cms.
Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos
tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9
=
72
9
= 8
Como pueden observar, la media de este grupo de datos es 8.
No hay variacin en los datos
Ahora, para explicar las otras medidas de dispersin
absolutas, comencemos con el siguiente ejemplo:
Ahora, El quinto rectngulo y el octavo rectngulo en un acto de rebelda
cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10
centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
9
= 8
... el mismo promedio! Pero... ha habido variacin?
8 cms.
10 cms
6 cms
El rectngulo rojo tiene +2 centmetros sobre el promedio, y el
rectngulo azul tiene 2 centmetros bajo el promedio. Los otros
rectngulos tienen cero diferencia respecto del promedio.
8 cms.
10 cms
6 cms
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 2 + 0 = 0
Este valor nos parece indicar que no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variacin.
8 cms.
10 cms
6 cms
Una forma de eliminar los signos menos de aquellas diferencias que
sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
= 8

Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
=

9 9
8
= 0,89
8 cms.
10 cms
6 cms
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
Aqu introducimos el primer concepto de dispersin: la Varianza. La
Varianza se representa mediante el smbolo S
2
para datos muestrales, y la
letra griega sigma ()
2
para datos poblacionales
La Varianza es entonces la media de las diferencias con la media elevadas al
cuadrado
Es decir, la frmula de la Varianza ( ) para datos no agrupados
es:

Donde
= Valor de cada elemento de dato

= Media Arimtica de todos los datos

= Tamao de la muestra o poblacin
= Sumatoria de las diferencias con la Media
elevadas al cuadrado
2
S
2
2
( )
i
x X
S
N

=

i
x
X
N
La Varianza
2
( )
i
x X

Para datos agrupados, la frmula de la Varianza ( ) es:




Donde
= Valor de cada elemento de dato

= Media Arimtica de todos los datos

= Tamao de la muestra o poblacin
= Cantidad de veces que aparece un dato en
la tabla de frecuencia (vea Ej. 3 de clculo
de Media)
2
S
2
2
( )
i
f x X
S
N

=

i
x
X
N
La Varianza
f

Entonces, basndonos en el ejemplo de los rectngulos, los
pasos para obtener la varianza son:
Se calcula la media (el promedio de los nmeros)
Por cada nmero resta la media y eleva el resultado al
cuadrado (la diferencia elevada al cuadrado).
Ahora calcula la media de todas esas diferencias al cuadrado.

Pero, Por qu al cuadrado?
Porque, como se mencion en el ejemplo, elevar cada diferencia
al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza) y tambin
hacen que las diferencias grandes se destaquen. Por ejemplo
100
2
=10,000 es mucho ms grande que 50
2
=2,500.

La Varianza
Dependiendo de los nmeros, puede ocurrir que el valor de
la varianza sea muy grande. Por otra parte, la varianza es un
trmino al cuadrado, mientras que los datos son nmeros
normales. Es decir que si la muestra est expresada en
centimetros, entonces la varianza est expresada en
centimetros al cuadrado. Lo deseable es expresar la
dispersin en los mismos trminos que el resto de la
informacin, tal como ocurre con las medidas de tendencia
central.
La solucin para esto es utilizar la raz cuadrada de la
Varianza. Esto se conoce como la Desviacin Estndar o
Desviacin Tpica, y se tiende a representar con la letra (S) o
por la letra griega sigma () en el caso de poblaciones.
La Desviacin Estndar
Entonces podemos afirmar que la desviacin estndar es una
medida del grado de dispersin de los datos con respecto al
valor promedio. Dicho de otra manera, la desviacin
estndar es simplemente el "promedio" o variacin esperada
con respecto a la media aritmtica; dice cunto tienden a
alejarse los valores concretos del promedio en una
distribucin .
Tal como se mencion antes, la Desviacin Estndar se
calcula aplicando la raz cuadrada a la Varianza:


La Desviacin Estndar
Vamos a utilizar el ejemplo de los estudiantes Mara y Jos
que vimos con anterioridad, para calcular la Desviacin
Estndar de sus calificaciones. Recuerde que los pasos son:

Se calcula la media arimtica (el promedio de los
nmeros)
Por cada nmero se resta la media y eleva el
resultado al cuadrado (la diferencia elevada al
cuadrado).
Se calcula la media de todas esas diferencias al
cuadrado
Como en el Ejemplo 3 ya se calcul la media para las
calificaciones de ambos estudiantes, entonces tenemos:
Para Mara:






Observe que la cuarta columna se obtiene restando el valor de la
Media Arimtica que se calcul en el Ejemplo 3 (que reult en 8.6
para Mara) al valor de la Calificacin (xi), y elevando este resultado
al cuadrado. Para xi=7 (primera lnea), esto es:


La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2 2
(7 8.6) ( 1.6) 2.56 = =
Para Mara (cont):







La quinta columna es el producto del nmero de ocurrencias de cada
calificacin (f) por el valor calculado en la columna 4. Por ejemplo,
para la calificacin de 7, esto resulta en:


La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
( ) (2) *(2.56) 5.12 f xi X = =
Para Mara (cont):







Esto se repite para cada una de las Calificaciones (xi). Luego se
suman todos los valores f

2
resultantes. Como podrn
observar arriba, esta sumatoria da como resultado 12.4

La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
Para Mara (cont):






Con la sumatoria obtenida (12.4) se puede ahora calcula la
Varianza. Recuerde que la Varianza ( ) viene dado por:



La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
i
f x X
S
N

=

2
S
Para Mara (cont):






Donde:


Es decir, el numerador es el resultado de la suma de de las
diferencias con la media elevadas al cuadrado, y el
denominador es el tamao de la muestra o poblacin.

La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
i
f x X
S
N

=

Para Mara (cont):






Dicho lo anterior, entonces tenemos que la Varianza resulta:



Nuevamente, observen que de la tabla, tomamos la sumatoria
y la dividimos entre el tamao de la muestra, que fueron 10
calificaciones.
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2
f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
12.4
1.24
10
S = =
Para Mara (cont):






Finalmente, recuerden que la Desviacin Estndar o Tpica (S)
es simplemente la Raz Cuadrada de la Varianza:





La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2

f

2

7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
12.4
1.24
1
1.1136
0
i
x X
S S
N

= = = = =

Repitiendo los cclulos para Jos resulta:










La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi

2

f

2

7 2 14 1.96 3.92
8 4 32 0.16 0.64
9 2 18 0.36 0.72
10 2 20 2.56 5.12
Total 10 84 10.4
2
2
( )
10.4
1.04
1
1.0198
0
i
x X
S S
N

= = = = =

Entonces, la Desviacin Estndar de cada alumno es:



Mara = 1.1136

Jos = 1.0198

Que nos dice este resultado? Pues simplemente que las
calificaciones de Mara se desvan ms de la media
arimtica que las de Jos, por lo que podemos afirmar
que las notas de Jos son ms homogeneas. Es decir
que las notas de Mara poseen mayor Variabilidad
La Desviacin Estndar Ejemplo 1
La ltima medida de dispersin que analizaremos es la
Desviacin Media. La desviacin media es la media aritmtica
de los valores absolutos de las desviaciones respecto a la
media. Es decir se obtiene calculando la media de los valores
absolutos de las diferencias entre estos nmeros y su media.

Es una medida totalmente complementaria al promedio y nos
dice cuan lejos/cerca estan los datos del promedio.
La desviacin media se representa por (Dm)

La frmula de la desviacin media (DM) para datos agrupados
es:


La Desviacin Media
( )
i
f x X
Dm
N

=

Para datos no agrupados, la frmula de la desviacin media
(DM) es:







Donde:
= Media
N = Tamao de la muestra o poblacin
X1,x2,xn = datos individuales
= Valor absoluto de la resta del dato y la Media
La Desviacin Media
1
( )
N
i
i
x X
Dm
N
=

=

1 3
( ) ( 2 ) ( ) ( )
...
N
x X x X x X x X
Dm
N N N N

= + + + +
X
( )
i
x X
Desviacin Media Ejemplo
Volvamos al caso de las calificaciones de los
estudiantes Mara y Jos. Sabemos que sus
calificaciones son:

Mara
8, 7, 10, 9, 8, 7, 8, 10, 9 y 10.

Jos
8, 9, 8, 7, 8, 9, 10, 7, 8 y 10.

Cul es la desviacin media de las calificaciones
de cada estudiante?
Desviacin Media Ejemplo
Por los ejercicios anteriores sabemos que la
Media de sus calificaciones son:

Mara Jos
= 8.6 = 8.4
Aplicando la frmula para datos no agrupados con
las calificaciones de Mara, obtenemos:





X X
8 8.6 7 8.6 10 8.6 9 8.6 8 8.6 7 8.6 8 8.6 10 8.6 9 8.6 10 8.6
10
Dm
+ + + + + + + + +
=
0.6 1.6 1.4 0.4 0.6 1.6 0.6 1.4 0.4 1.4
10
Dm
+ + + + + + + + +
=
0.6 1.6 1.4 04 0.6 1.6 0.6 1.4 0.4 1.4
10
Dm
+ + + + + + + + +
=
10
1
10
Dm = =
Desviacin Media Ejemplo
Para Jos ( = 8.4), aplicaremos la frmula para datos agrupados.
Para ello, primero necesitamos agrupar la informacin de una manera
similar a como se hizo para el clculo de la Media Arimtica:


Calificaciones (xi) f fxi |

| f|

|
7 2 14 1.4 2.8
8 4 32 0.4 1.6
9 2 18 0.6 1.2
10 2 20 1.6 3.2
Total 10 84 8.8
X
1
( )
8.8
0.88
10
N
i
i
x X
Dm
N
=

= = =

Desviacin Media Ejemplo


Entonces, la Desviacin Media (Dm) para cada uno de los
estudiantes es:

Mara
Dm = 1.00

Jos
Dm = 0.88

Observen que esta medida de dispersin nos indica que
las calificaciones de Jos se desvan menos de su Media
que las calificaciones de Mara

Coeficiente de Variacin
Cuando se desea hacer referencia a la relacin entre el
tamao de la media y la variabilidad de la variable, se
utiliza el Coeficiente de Variacin. A diferencia de las otras
medidas de dispersin, que son absolutas, el Coeficiente de
Variacin es una medida de dispersin relativa.

Su frmula expresa la desviacin estndar ( S ) como
porcentaje de la media aritmtica ( ), mostrando una
mejor interpretacin porcentual del grado de variabilidad
que la desviacin tpica o estndar.

A mayor valor del coeficiente de variacin, mayor
heterogeneidad de los valores de la variable; y a menor
C.V., mayor homogeneidad en los valores de la variable.
Suele representarse por medio de las siglas C.V.

X
Coeficiente de Variacin
El Coeficiente de Variacin (CV) se calcula mediante la
siguiente frmula:



Donde:
S = Desviacin Estndar

= Media

Veamos un ejemplo de su aplicacin, utilizando el ejercicio
de las calificaciones de Mara y Jos:


X
*100
S
CV
X
=
En los ejemplos de las calificaciones de 2 alumnos, vimos
que los resultados para cada uno de ellos fueron:

Mara Jos
S = 1.1136 S = 1.0198
= 8.6 = 8.4
Si calculamos el CV para cada alumno, resulta:

Mara


Jos


Esto significa que las calificaciones de Jos tienen menos
variabilidad que las de Mara
Coeficiente de Variacin Ejemplo
X X
1.1136
*100% *100%
8.
%
6
12.9
S
CV
X
= = =
1.0198
*100% *100%
8.
%
4
12.1
S
CV
X
= = =
Coeficiente de Variacin
Tambien vale la pena destacar las siguientes propiedades
del coeficiente de Variacin:

Es tpicamente menor que uno.
Para su mejor interpretacin se expresa como un
porcentaje.
Depende de la Desviacin Estndar y en mayor medida
de la Media Aritmtica, por estar esta en el
denominador. Cuando la Media Arimtica es cero, o
muy prxima a cero, el C.V. pierde significado, ya que
puede dar valores muy grandes, que no necesariamente
implican dispersin de datos.

Coeficiente de Variacin
Los valores que toma el Coeficiente de Variacin nos
indican el grado de dispersin de los datos. En general:

Coeficiente de Variacin Dispersin
Menor al 10% Poca dispersin
10% - 33% Aceptable
34% - 50% Alta dispersin
Mayor al 50% Muy alta
Una tercera caracterstica de un conjunto de datos es la
forma, es decir, la manera en que estn distribuidas las
observaciones.
La distribucin de los datos puede ser o no simtrica. Si
la distribucin de los datos no es simtrica, se llama
asimtrica o sesgada.
Puede observarse a travs del coeficiente de asimetra
Mide el grado de Simetra / Asimetra de la distribucin
La Forma de la Distribucin
Si bien es fcil tener una idea de si la distribucin es simtrica o no
tras ver la representacin grfica (p.e., un histograma), es importante
cuantificar la posible asimetra de una distribucin.

Recordemos que cuando la distribucin de los datos es simtrica, la
media, la mediana y la moda coinciden. (Y la distribucin tiene la
misma forma a la izquierda y la derecha del centro)

Si bien muchas distribuciones psicolgicas se asume que tienden a
ser simtricas y unimodales, en muchos casos la distribucin que
encontramos es asimtrica (v.g., las distribuciones de los Tiempos de
Reaccin en casi cualquier tarea es asimtrica positivo).
Asimetra
Asimetra positiva
Moda
Mediana
Media
Asimetra negativa
Media
Mediana
Moda
1. ndice de asimetra de Pearson
s
X Mo
A
s

=
Muy sencillo de calcular. Est basado en la relacin entre la media y la
moda en distribuciones simtricas y asimtricas (ver transparencia
anterior):
Si la distribucin es simtrica A
s
ser 0
Si la distribucin es asimtrica positiva, A
s
ser mayor que 0
Si la distribucin es asimtrica negativa, A
s
ser menor que 0
ndices de Asimetra
2. ndice de asimetra de Fisher
Est basado en la diferencia de los datos sobre la media, como la
varianza, si bien esta vez se elevan los coeficientes al cubo
Si la distribucin es simtrica A
s
ser 0
Si la distribucin es asimtrica positiva, A
s
ser mayor que 0
Si la distribucin es asimtrica negativa, A
s
ser menor que 0
3
1
3
( )
N
i
i
s
X X N
A
s
=

=


Desventaja: Muy influida por puntuaciones atpicas
ndices de Asimetra
Mdn
Media
Si es positiva, indicar muchos casos en los valores ms bajos y
pocos en los ms altos positivamente asimtrica .
Media > Mediana: Positivos o con sesgamiento a la derecha
.
Para describir la forma, tambin se puede comparar la media
y la mediana.
Formas de Distribucin La Asimetra
Mdn
Media
Si es negativa, indicar muchos casos en los valores ms altos
y pocos en los ms bajos negativamente asimtrica.
Media < Mediana: Negativos o con sesgamiento a la izquierda.

Formas de Distribucin La Asimetra
Mdn = Media
En la distribucin Normal es 0 Simtrica
Media = Mediana: Simtricos o con sesgamiento cero.


Formas de Distribucin La Asimetra
.


El coeficiente de curtosis mide el grado de apuntamiento de la curva. Es
una medida de la forma de la curva
mesocrtica leptocrtica
(menor dispersin)
Platicrtica
(mayor dispersin)
Otra manera de apreciar la forma de una distribucin es observar el nivel
de apilamiento o llanura de la curva
La Forma de la Distribucin
Hace referencia al apuntamiento de la distribucin en relacin a un
estndar, que es la distribucin normal.

Este estndar es la distribucin normal: distribucin mesocrtica.
Si la distribucin es ms apuntada que la distribucin normal tenemos
una distribucin leptocrtica.
Si la distribucin es ms achatada que la distribucin normal tenemos
una distribucin platicrtica.

Curtosis o apuntamiento
IMPORTANTE: Curtosis es independiente de la variabilidad (en el
sentido de varianza).

Es decir, no es que una distribucin leptocrtica tenga menos varianza
y por eso es ms apuntada.

Una distribucin leptocrtica es muy apuntada en el centro (ms que la
normal), decae muy rpidamente en un primer momento, pero en los
extremos es algo ms alta que la distribucin normal.

Eso quiere decir que una distribucin leptocrtica es ms probable que
ofrezca ms valores extremos que la distribucin normal.
Curtosis o apuntamiento
Si es + indicar un grado de apilamiento mayor que en la normal leptocrtica
(menor dispersin)
Mide el grado de apuntamiento de la curva
En la distribucin Normal es 0 mesocrtica
Si es indicar que es ms aplanada que la normal platicrtica (mayor
dispersin)

Coeficiente de Curtosis
ndice de curtosis (veremos un solo ndice)
Para una distribucin normal (mesocrtica) sabemos que


4
1
4
( )
3
n
i
i
x
X X n
s
=

=

Y esta va a ser la referencia para el ndice de curtosis que vamos a


emplear
4
1
4
( )
3
n
i
i
r
x
X X n
C
s
=

=

Si la distribucin es normal (mesocrtica), el ndice vale 0


Si la distribucin es leptocrtica, el ndice es superior a 0
Si la distribucin es platicrtica, el ndice es inferior a 0
Ejemplo de curtosis (dist. Mesocrtica)
NORMAL
4
.
2
5
3
.
7
5
3
.
2
5
2
.
7
5
2
.
2
5
1
.
7
5
1
.
2
5
.
7
5
.
2
5
-
.
2
5
-
.
7
5
-
1
.
2
5
-
1
.
7
5
-
2
.
2
5
-
2
.
7
5
-
3
.
2
5
-
3
.
7
5
1200
1000
800
600
400
200
0
Desv. tp. = 1.01
Media = -.00
N = 10000.00

Es un tipo particular de distribucin de frecuencias.

En los casos en que los valores que asume una variable depende de mltiples
factores sin que ninguno de ellos sesgue la distribucin, es de esperar que los
valores se distribuyan homogneamente alrededor de la media la mediana y la
moda.

Estas variables aleatorias presentan una distribucin que es aproximadamente
simtrica y cuya grfica tiene forma de campana (mesocrtica).

Esta distribucin es utilizada en aplicaciones estadsticas como modelo o
parmetro de comparacin dada la frecuencia o normalidad con la que ciertos
fenmenos tienden a parecerse a esta distribucin.



La Distribucin Normal
La distribucin normal queda definida por dos parmetros:

LA MEDIA Y EL DESVIACIN ESTNDAR
La Distribucin Normal
El rea total bajo la curva es igual a 100 % o 1.

El rea bajo la curva comprendido entre los valores situados a una desviaciones
estndar de la media es aproximadamente igual al 68%.

El rea bajo la curva comprendido entre los valores situados a dos desviaciones
estndar de la media es aproximadamente igual al 95%.
=1 = -1
= -3
=-2
2,14 2,14
=2
=3
La Distribucin Normal
=1 = -1
= -3
=-2
2,14
=2
=3
Se puede determinar el rea
entre dos ordenadas cuales
quiera a travs del calculo de las
unidades de desviacin en que se
encuentra una porcin de la
poblacin y su correspondencia
en la tabla de reas bajo la curva
normal
Z = X X
S
Refiere al nmero de unidades de desviacin
tpica que un individuo o caso queda por
encima o por debajo de la media de su grupo
Puntuaciones Z
La Distribucin Normal
X= 143
2,14
2,14
Z = X X
S
168
S= 12
Se requiere conocer la porcin
de poblacin que gana hasta
$143
a) Clculo de Z
Z= (143 168) / 12
Z= -2,08


c) 0,5 0,4812 = 0,0188 aprox 1,9%
b) Correspondencia en la tabla
De reas bajo la curva normal
0,4812 48%
La Distribucin Normal

You might also like