Professional Documents
Culture Documents
Dispersin
En la Unidad anterior vimos que:
La enumeracin de los datos representa un avance
importante en el anlisis de la informacin.
La distribucin de frecuencias organiza los datos en
un formato que facilita su anlisis e interpretacin.
La conversin a frecuencias relativas permite hacer
comparaciones valiosas y significativas.
Adicionalmente, vimos que la utilizacin de
distribuciones de frecuencias en intervalos de clases:
Resume y condensa la informacin presente en los
datos
Genera datos agrupados que facilitan el anlisis
Se pierde informacin individual pero se gana en
capacidad de anlisis de caractersticas globales
La conversin a frecuencias relativas permite hacer
comparaciones valiosas y significativas.
El uso de grficos permite una rpida visualizacin
de estas caractersticas globales.
Otra tcnica estadstica es poder resumir aspectos
presentes en los datos con un nico valor (o algunos
valores).
Podemos usar una serie de nmeros conocidos como
estadstica sumaria para describir las caractersticas
del conjunto de datos. Dos de estas caractersticas son
de particular importancia para los responsables de
tomar decisiones:
la tendencia central
la dispersin
Medidas de Tendencia Central
En estadstica, cuando se analizan los datos que
constituyen la muestra bajo estudio, es importante
determinar la manera en la cual se agrupa la
informacin, como varan los datos, y como estn
distribuidos. Para ello, existen diferentes medidas que
nos permiten determinar estas caractersticas, y nos
ayudan a comprender el significado o implicaciones de
la informacin.
Medidas de Tendencia Central
La caracterstica ms importante que describe o resume un
grupo de datos es su posicin.
Los conjuntos de datos generalmente muestran una
tendencia definida a agruparse o resumirse en torno a cierto
punto, por lo que para cualquier conjunto particular de
datos, es posible seleccionar un valor tpico para describir,
representar o resumir todo el conjunto de datos.
De acuerdo a la organizacin de los datos hay dos formas de
estimar este tipo de medidas ya sea para datos no
agrupados o agrupados
Medidas de Tendencia Central
Son medidas estadsticas que se usan para describir
como se puede resumir la localizacin de los datos.
Ubican e identifican el punto alrededor del cual se
centran los datos. Las medidas de tendencia central
nos indican hacia donde se inclinan o se agrupan
ms los datos. Las ms utilizadas son:
o La Media,
o La Mediana
o La Moda
o Los Percentiles
o Los Cuartiles.
Medidas de Tendencia Central
Medidas de Tendencia Central
MEDIA
MEDIANA
MODA
PERCENTILES
CUARTILES
La Media
La media o media aritmtica, usualmente
se le llama promedio. Se obtiene sumando
todos los valores de los datos y dividiendo
el resultado entre la cantidad de datos. Si
los datos proceden de una muestra, el
promedio se representa con . Si los datos
proceden de la poblacin, se utiliza la letra
griega ().
XX
X
La frmula matemtica para calcular la media o
promedio es la siguiente:
donde;
= promedio arimtico
= signo de sumatoria. Representa la suma
de todos los datos x
N = numero de datos. Es la muestra o poblacin
Veamos como se emplea la media o promedio con
el siguiente ejemplo:
x
X
N
=
X
La Media
Cuando los datos no se encuentran sumarizados en una
tabla de frecuencias, se les llama no agrupados. A
continuacin se presenta una muestra de las puntuaciones
en un examen de un curso de estadstica:
70 90 95 74
58 70 98 72
75 85 95 74
80 85 90 65
90 75 90 69
Podemos calcular el promedio de las puntuaciones para
conocer cuntos estudiantes obtuvieron puntuaciones por
encima y por debajo del promedio . Veamos
La Media Ejemplo 1
Primero, sumamos todos los valores de los datos y el
resultado lo divide entre el total de datos o tamao de
la muestra. Al sumar todas las puntuaciones en el
ejemplo anterior obtendrs un total de 1600, que
dividido por 20(total de datos), es igual a 80. Si
empleamos la frmula obtenemos:
x
X
N
=
1600
80
20
X = =
La Media Ejemplo 1
La Media Ejemplo 2
Otro ejemplo con datos no agrupados.
Cul es la media de 10, 12, 7, 3, 5, 8?
5 . 7
6
45
6
8 5 3 7 12 10
= =
+ + + + +
= =
n
x
X
La Media Ejemplo 3
Mara, una estudiante universitaria, tiene las
siguientes calificaciones en las 10 asignaturas
que recibe en su carrera:
8, 7, 10, 9, 8, 7, 8, 10, 9 y 10.
Jos, un compaero de Mara, tiene las
siguientes calificaciones:
8, 9, 8, 7, 8, 9, 10, 7, 8 y 10.
Cul es la media de las calificaciones de cada
estudiante?
La Media Ejemplo 3
Solucin:
Tal como mencionamos antes, para calcular la
media arimtica, se suman todas las
calificaciones y se dividen por el numero de
asignaturas. En el caso de Mara, si trabajamos
con los datos no agrupados:
8 9 8 7 8 9 10 7 8 10
10
X
+ + + + + + + + +
=
86
8.6
10
X = =
La Media Ejemplo 3
Observe que en este ejemplo, los datos son pocos.
En caso de muchos elementos, esto puede resultar
en largas listas de nmeros, por lo que resulta
preferible construir una tabla de frecuencias con la
informacin. Esto simplifica la sumarizacin y reduce
la posibilidad de errores. Cuando se trabaja con
tablas de frecuencia, se les llama datos agrupados
Entonces, con la informacin de los estudiantes,
procedemos a construir las tablas de frecuencia.
Recuerde que la variable es la calificacin obtenida
en cada asignatura. Adicionalmente, recuerde que la
variable es numrica, y que deseamos calcular su
media arimtica.
Para Mara:
La primera columna contiene la variable bajo estudio, la segunda
contiene la cantidad de observaciones para esa calificacin, y la
tercera columna es el producto de las 2 primeras columnas (para
calcular la media arimtica). Entonces:
La Media Ejemplo 3
Calificaciones (xi) f fxi
7 2 14
8 3 24
9 2 18
10 3 30
Total 10 86
86
8.6
10
i
fx
X
N
= = =
Para Jos:
La Media Ejemplo 3
Calificaciones (xi) f fxi
7 2 14
8 4 32
9 2 18
10 2 20
Total 10 84
84
8.4
10
i
fx
X
N
= = =
\
|
~
100
Paso 3.
a) Si (i) no es entero, utilizando las reglas de
redondeo, se lleva al prximo numero entero.
Este valor entero indica la posicin donde se
encuentra el percentil. Esto significa que si
(i)=3.5, el percentil se encuentra en la posicin 4
de los datos.
b) Si (i) es entero, el percentil es el promedio de
los valores de los datos ubicados en los lugares
(i) y (i + 1).
Veamos como se aplica
Pasos para Calcular el Percentil Cont.
Determine el percentil 75 de los datos sobre las
edades del siguiente un grupo de ciudadanos:
25, 20, 26, 21, 19, 23, 22, 30, 28, 27.
Paso 1. Ordene los datos en orden
ascendente:
19 20 21 22 23 25 26 27 28 30
Clculo del Percentil Ejemplo
Paso 2. Calcule el ndice (i):
Paso 3. Como (i) no es entero, redondeamos al prximo entero mayor
que 7.5, o sea, el lugar 8. Al referirnos a los datos del
ejemplo, vemos que el percentil 75 es el valor del dato ubicado
en la posicin nmero 8, que en este caso es 27.
19 20 21 22 23 25 26 27 28 30
Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra
el percentil que estamos buscando.
n
P
i
|
.
|
\
|
~
100
5 . 7 10
100
75
~
|
.
|
\
|
~ i
Clculo del Percentil Ejemplo
Significa que el 75% de las edades son
menores de 27 aos y el 25% restante (100-P)
son mayores de 27 aos.
CMO SE INTERPRETA EL PERCENTIL EN ESTE
EJEMPLO?
Los cuartiles dividen los datos en cuatro
partes. Cada una de las partes representa una
cuarta parte, o el 25% de las observaciones.
Los cuartiles son percentiles especficos; por
consiguiente, los pasos para calcular los
percentiles los podemos emplear para calcular
los cuartiles.
Cuartiles
Los cuartiles se definen de la siguiente manera
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
Q3 = tercer cuartil, o percentil 75
Cuartiles
A continuacin se presenta un conjunto de datos con los siguientes valores:
10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
Cmo identificamos los cuartiles en este ejemplo?
Respuesta:
Se utilizan los mismos pasos que se usan para identificar los percentiles:
Primero, ordenamos los datos
5 8 11 12 14 15 18 20 25 30
Segundo, determinamos (i) para cada cuartil:
Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
Q3 = tercer cuartil, o percentil 75
Clculo de Cuartiles - Ejemplo
Cuartiles:
Q1 = primer cuartil, o percentil 25
= 2.5
Como(i) no es un nmero entero, se redondea al prximo entero
mayor que 2.5, o sea 3. Al referirnos a los datos vemos que el
primer cuartil est ubicado en la posicin 3 de los datos que este
caso es 11. El primer cuartil en los datos se divide de la siguiente
forma:
5 8 11 12 14 15 18 20 25 30
Q1=1
10
100
25
|
.
|
\
|
~ i
Clculo de Cuartiles - Ejemplo
Segundo cuartil:
Q2 = segundo cuartil, o percentil 50
(tambin la mediana)
= 5
Como (i) es un nmero entero, el segundo cuartil es el promedio
de los valores de los datos que estn en las posiciones i e (i+1),
que en este caso es, (14+15)2=14.5, entonces, el segundo
cuartil en los datos se divide as:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
10
100
50
|
.
|
\
|
~ i
Clculo de Cuartiles - Ejemplo
Tercer cuartil:
Q3 = tercer cuartil, o percentil 75
= 7.5
Como (i) no es un nmero entero, se redondea al prximo
entero mayor que 7.5, o sea 8. Al referirnos a los datos ,
vemos que el tercer cuartil est ubicado en posicin 8 de los
datos que en este caso es el 20. Finalmente, los cuartiles en
este caso se presentan de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20
10
100
75
|
.
|
\
|
~ i
Clculo de Cuartiles - Ejemplo
Medidas de Dispersin
En la seccin anterior dijimos que las medidas de tendencia
central se utilizaban para describir como se puede resumir la
localizacin de los datos. Es decir, que ubican e identifican el
punto alrededor del cual se centran los datos. Las medidas
de tendencia central nos indican hacia donde se inclinan o se
agrupan ms los datos.
Al igual que sucede con cualquier conjunto de datos, la
media, la mediana y la moda slo nos revelan una parte de la
informacin que necesitamos acerca de las caractersticas de
los datos. Para aumentar nuestro entendimiento del patrn
de los datos, debemos medir tambin su dispersin,
extensin o variabilidad.
Medidas de Dispersin
Las medidas de tendencia central tienen como objetivo el
sintetizar los datos en un valor representativo, las medidas
de dispersin nos dicen hasta que punto estas medidas de
tendencia central son representativas como sntesis de la
informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la
distribucin respecto al valor central.
Conviene destacar que a mayor dispersin, existe menor
confiabilidad de la medida de tendencia central, por lo que
resulta importante medirla.
Medidas de Dispersin
Las medidas de dispersin, tambin llamadas medidas
de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las
diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor
ser la variabilidad, cuanto menor sea, ms homognea
ser a la media. As se sabe si todos los casos son
parecidos o varan mucho entre ellos.
Distinguimos entre medidas de dispersin absolutas,
que no son comparables entre diferentes muestras y las
medidas de dispersin relativas que nos permitirn
comparar varias muestras.
Medidas de Dispersin
ABSOLUTAS:
Son las que estn expresadas en la misma unidad de medida de la
variable. Las ms comunes son:
Rango o Recorrido de Variacin
Desviacin Media
Varianza
Desviacin Estndar
RELATIVAS:
Son las que estn expresadas en porcentajes. Se estudiar
nicamente:
El Coeficiente de Variacin.
Tipos de Medidas de Dispersin
La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la
confiabilidad de la medida de tendencia central. Si los datos se
encuentran ampliamente dispersos, la posicin central es menos
representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente
dispersos, debemos ser capaces de distinguir que presentan esa
dispersin antes de abordar esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si
no se desea tener una amplia dispersin de valores con respecto al
centro de distribucin, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones ms
grandes.
Medidas de Dispersin
La primera medida de dispersin que estudiaremos es el Rango,
que se representa por la letra ( R ), por ser un concepto muy
sencillo y fcil de calcular. En un grupo de datos numricos, el
Rango es simplemente la diferencia entre el valor mximo y el
valor mnimo de los datos. Es decir:
R = Valor mximo Valor Mnimo.
Para calcular el Rango, se debe:
1. Ordenar los nmeros de menor a mayor
2. Tomar el valor mayor y restarle el valor menor
El rango es importante porque Permite obtener una idea de la
dispersin de los datos, cuanto mayor es el rango, ms dispersos
estn los datos de un conjunto.
El Rango o Recorrido
Dado los siguientes datos no agrupados:
4,5,8,6,10,11,8,6,4,3,2,5,4
Para calcular el Rango (R), se ordenan primero de menor a mayor
2,3,4,4,4,5,5,6,6,8,8,10,11
Se toma el mayor, y se le resta el menor
R = 11 2 = 9
El Rango o Recorrido - Ejemplo
8 cms.
Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos
tienen la misma base).
Existe alguna variacin respecto de su altura entre estos rectngulos?
Cul es el promedio de la altura de estos rectngulos?
8 + 8 + 8 + 8 + 8 + 8 + 8 + 8 + 8
9
=
72
9
= 8
Como pueden observar, la media de este grupo de datos es 8.
No hay variacin en los datos
Ahora, para explicar las otras medidas de dispersin
absolutas, comencemos con el siguiente ejemplo:
Ahora, El quinto rectngulo y el octavo rectngulo en un acto de rebelda
cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10
centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros?
Cul es el nuevo promedio de estos 9 rectngulos?
8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8
9
=
72
9
= 8
... el mismo promedio! Pero... ha habido variacin?
8 cms.
10 cms
6 cms
El rectngulo rojo tiene +2 centmetros sobre el promedio, y el
rectngulo azul tiene 2 centmetros bajo el promedio. Los otros
rectngulos tienen cero diferencia respecto del promedio.
8 cms.
10 cms
6 cms
Si sumamos estas diferencias de la altura respecto del promedio,
tenemos
0 + 0 + 0 + 0 + 2 + 0 + 0 2 + 0 = 0
Este valor nos parece indicar que no ha habido variabilidad! Y sin
embargo, ante nuestros ojos, sabemos que hay variacin.
8 cms.
10 cms
6 cms
Una forma de eliminar los signos menos de aquellas diferencias que
sean negativas, esto es de aquellos mediciones que estn bajo el
promedio, es elevar al cuadrado todas las diferencias, y luego sumar...
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
= 8
Y este resultado repartirlo entre todos los rectngulos, es decir lo
dividimos por el nmero de rectngulos que es 9
0
2
+ 0
2
+ 0
2
+ 0
2
+ 2
2
+ 0
2
+ 0
2
+ ( 2)
2
+ 0
2
=
9 9
8
= 0,89
8 cms.
10 cms
6 cms
Se dice entonces que la varianza fue de 0,89
Observemos que las unidades involucradas en el clculo de la varianza
estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados.
Aqu introducimos el primer concepto de dispersin: la Varianza. La
Varianza se representa mediante el smbolo S
2
para datos muestrales, y la
letra griega sigma ()
2
para datos poblacionales
La Varianza es entonces la media de las diferencias con la media elevadas al
cuadrado
Es decir, la frmula de la Varianza ( ) para datos no agrupados
es:
Donde
= Valor de cada elemento de dato
= Media Arimtica de todos los datos
= Tamao de la muestra o poblacin
= Sumatoria de las diferencias con la Media
elevadas al cuadrado
2
S
2
2
( )
i
x X
S
N
=
i
x
X
N
La Varianza
2
( )
i
x X
=
i
x
X
N
La Varianza
f
Entonces, basndonos en el ejemplo de los rectngulos, los
pasos para obtener la varianza son:
Se calcula la media (el promedio de los nmeros)
Por cada nmero resta la media y eleva el resultado al
cuadrado (la diferencia elevada al cuadrado).
Ahora calcula la media de todas esas diferencias al cuadrado.
Pero, Por qu al cuadrado?
Porque, como se mencion en el ejemplo, elevar cada diferencia
al cuadrado hace que todos los nmeros sean positivos (para
evitar que los nmeros negativos reduzcan la varianza) y tambin
hacen que las diferencias grandes se destaquen. Por ejemplo
100
2
=10,000 es mucho ms grande que 50
2
=2,500.
La Varianza
Dependiendo de los nmeros, puede ocurrir que el valor de
la varianza sea muy grande. Por otra parte, la varianza es un
trmino al cuadrado, mientras que los datos son nmeros
normales. Es decir que si la muestra est expresada en
centimetros, entonces la varianza est expresada en
centimetros al cuadrado. Lo deseable es expresar la
dispersin en los mismos trminos que el resto de la
informacin, tal como ocurre con las medidas de tendencia
central.
La solucin para esto es utilizar la raz cuadrada de la
Varianza. Esto se conoce como la Desviacin Estndar o
Desviacin Tpica, y se tiende a representar con la letra (S) o
por la letra griega sigma () en el caso de poblaciones.
La Desviacin Estndar
Entonces podemos afirmar que la desviacin estndar es una
medida del grado de dispersin de los datos con respecto al
valor promedio. Dicho de otra manera, la desviacin
estndar es simplemente el "promedio" o variacin esperada
con respecto a la media aritmtica; dice cunto tienden a
alejarse los valores concretos del promedio en una
distribucin .
Tal como se mencion antes, la Desviacin Estndar se
calcula aplicando la raz cuadrada a la Varianza:
La Desviacin Estndar
Vamos a utilizar el ejemplo de los estudiantes Mara y Jos
que vimos con anterioridad, para calcular la Desviacin
Estndar de sus calificaciones. Recuerde que los pasos son:
Se calcula la media arimtica (el promedio de los
nmeros)
Por cada nmero se resta la media y eleva el
resultado al cuadrado (la diferencia elevada al
cuadrado).
Se calcula la media de todas esas diferencias al
cuadrado
Como en el Ejemplo 3 ya se calcul la media para las
calificaciones de ambos estudiantes, entonces tenemos:
Para Mara:
Observe que la cuarta columna se obtiene restando el valor de la
Media Arimtica que se calcul en el Ejemplo 3 (que reult en 8.6
para Mara) al valor de la Calificacin (xi), y elevando este resultado
al cuadrado. Para xi=7 (primera lnea), esto es:
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2 2
(7 8.6) ( 1.6) 2.56 = =
Para Mara (cont):
La quinta columna es el producto del nmero de ocurrencias de cada
calificacin (f) por el valor calculado en la columna 4. Por ejemplo,
para la calificacin de 7, esto resulta en:
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
( ) (2) *(2.56) 5.12 f xi X = =
Para Mara (cont):
Esto se repite para cada una de las Calificaciones (xi). Luego se
suman todos los valores f
2
resultantes. Como podrn
observar arriba, esta sumatoria da como resultado 12.4
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
Para Mara (cont):
Con la sumatoria obtenida (12.4) se puede ahora calcula la
Varianza. Recuerde que la Varianza ( ) viene dado por:
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
i
f x X
S
N
=
2
S
Para Mara (cont):
Donde:
Es decir, el numerador es el resultado de la suma de de las
diferencias con la media elevadas al cuadrado, y el
denominador es el tamao de la muestra o poblacin.
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
i
f x X
S
N
=
Para Mara (cont):
Dicho lo anterior, entonces tenemos que la Varianza resulta:
Nuevamente, observen que de la tabla, tomamos la sumatoria
y la dividimos entre el tamao de la muestra, que fueron 10
calificaciones.
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
12.4
1.24
10
S = =
Para Mara (cont):
Finalmente, recuerden que la Desviacin Estndar o Tpica (S)
es simplemente la Raz Cuadrada de la Varianza:
La Desviacin Estndar Ejemplo 1
Calificaciones (xi) f fxi
2
f
2
7 2 14 2.56 5.12
8 3 24 0.36 1.08
9 2 18 0.16 0.32
10 3 30 1.96 5.88
Total 10 86 12.4
2
2
( )
12.4
1.24
1
1.1136
0
i
x X
S S
N
= = = = =
2
f
2
7 2 14 1.96 3.92
8 4 32 0.16 0.64
9 2 18 0.36 0.72
10 2 20 2.56 5.12
Total 10 84 10.4
2
2
( )
10.4
1.04
1
1.0198
0
i
x X
S S
N
= = = = =
=
Para datos no agrupados, la frmula de la desviacin media
(DM) es:
Donde:
= Media
N = Tamao de la muestra o poblacin
X1,x2,xn = datos individuales
= Valor absoluto de la resta del dato y la Media
La Desviacin Media
1
( )
N
i
i
x X
Dm
N
=
=
1 3
( ) ( 2 ) ( ) ( )
...
N
x X x X x X x X
Dm
N N N N
= + + + +
X
( )
i
x X
Desviacin Media Ejemplo
Volvamos al caso de las calificaciones de los
estudiantes Mara y Jos. Sabemos que sus
calificaciones son:
Mara
8, 7, 10, 9, 8, 7, 8, 10, 9 y 10.
Jos
8, 9, 8, 7, 8, 9, 10, 7, 8 y 10.
Cul es la desviacin media de las calificaciones
de cada estudiante?
Desviacin Media Ejemplo
Por los ejercicios anteriores sabemos que la
Media de sus calificaciones son:
Mara Jos
= 8.6 = 8.4
Aplicando la frmula para datos no agrupados con
las calificaciones de Mara, obtenemos:
X X
8 8.6 7 8.6 10 8.6 9 8.6 8 8.6 7 8.6 8 8.6 10 8.6 9 8.6 10 8.6
10
Dm
+ + + + + + + + +
=
0.6 1.6 1.4 0.4 0.6 1.6 0.6 1.4 0.4 1.4
10
Dm
+ + + + + + + + +
=
0.6 1.6 1.4 04 0.6 1.6 0.6 1.4 0.4 1.4
10
Dm
+ + + + + + + + +
=
10
1
10
Dm = =
Desviacin Media Ejemplo
Para Jos ( = 8.4), aplicaremos la frmula para datos agrupados.
Para ello, primero necesitamos agrupar la informacin de una manera
similar a como se hizo para el clculo de la Media Arimtica:
Calificaciones (xi) f fxi |
| f|
|
7 2 14 1.4 2.8
8 4 32 0.4 1.6
9 2 18 0.6 1.2
10 2 20 1.6 3.2
Total 10 84 8.8
X
1
( )
8.8
0.88
10
N
i
i
x X
Dm
N
=
= = =
=
Muy sencillo de calcular. Est basado en la relacin entre la media y la
moda en distribuciones simtricas y asimtricas (ver transparencia
anterior):
Si la distribucin es simtrica A
s
ser 0
Si la distribucin es asimtrica positiva, A
s
ser mayor que 0
Si la distribucin es asimtrica negativa, A
s
ser menor que 0
ndices de Asimetra
2. ndice de asimetra de Fisher
Est basado en la diferencia de los datos sobre la media, como la
varianza, si bien esta vez se elevan los coeficientes al cubo
Si la distribucin es simtrica A
s
ser 0
Si la distribucin es asimtrica positiva, A
s
ser mayor que 0
Si la distribucin es asimtrica negativa, A
s
ser menor que 0
3
1
3
( )
N
i
i
s
X X N
A
s
=
=
Desventaja: Muy influida por puntuaciones atpicas
ndices de Asimetra
Mdn
Media
Si es positiva, indicar muchos casos en los valores ms bajos y
pocos en los ms altos positivamente asimtrica .
Media > Mediana: Positivos o con sesgamiento a la derecha
.
Para describir la forma, tambin se puede comparar la media
y la mediana.
Formas de Distribucin La Asimetra
Mdn
Media
Si es negativa, indicar muchos casos en los valores ms altos
y pocos en los ms bajos negativamente asimtrica.
Media < Mediana: Negativos o con sesgamiento a la izquierda.
Formas de Distribucin La Asimetra
Mdn = Media
En la distribucin Normal es 0 Simtrica
Media = Mediana: Simtricos o con sesgamiento cero.
Formas de Distribucin La Asimetra
.
El coeficiente de curtosis mide el grado de apuntamiento de la curva. Es
una medida de la forma de la curva
mesocrtica leptocrtica
(menor dispersin)
Platicrtica
(mayor dispersin)
Otra manera de apreciar la forma de una distribucin es observar el nivel
de apilamiento o llanura de la curva
La Forma de la Distribucin
Hace referencia al apuntamiento de la distribucin en relacin a un
estndar, que es la distribucin normal.
Este estndar es la distribucin normal: distribucin mesocrtica.
Si la distribucin es ms apuntada que la distribucin normal tenemos
una distribucin leptocrtica.
Si la distribucin es ms achatada que la distribucin normal tenemos
una distribucin platicrtica.
Curtosis o apuntamiento
IMPORTANTE: Curtosis es independiente de la variabilidad (en el
sentido de varianza).
Es decir, no es que una distribucin leptocrtica tenga menos varianza
y por eso es ms apuntada.
Una distribucin leptocrtica es muy apuntada en el centro (ms que la
normal), decae muy rpidamente en un primer momento, pero en los
extremos es algo ms alta que la distribucin normal.
Eso quiere decir que una distribucin leptocrtica es ms probable que
ofrezca ms valores extremos que la distribucin normal.
Curtosis o apuntamiento
Si es + indicar un grado de apilamiento mayor que en la normal leptocrtica
(menor dispersin)
Mide el grado de apuntamiento de la curva
En la distribucin Normal es 0 mesocrtica
Si es indicar que es ms aplanada que la normal platicrtica (mayor
dispersin)
Coeficiente de Curtosis
ndice de curtosis (veremos un solo ndice)
Para una distribucin normal (mesocrtica) sabemos que
4
1
4
( )
3
n
i
i
x
X X n
s
=
=