You are on page 1of 29

Estadstica descriptiva

(continuacin)

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R

Estadgrafos de posicin y dispersin

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE POSICIN
Los estadgrafos de posicin o de tendencia central son valores que se ubican al centro de
un conjunto de datos segn su magnitud.
Las principales medidas de posicin central son:
Media Aritmtica
Mediana
Moda
Media Geomtrica

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE POSICIN CENTRAL
1. Media aritmtica o promedio: cociente que se obtiene al dividir la suma de los
valores de la variable por el nmero de observaciones
n

i 1

X
i 1

fi

Propiedades:
i. La media de una constante es igual a la constante
ii. La media de los valores que son multiplicados por una contante es igual a la constante
por la media de los datos
iii. La suma de las desviaciones de cada dato respecto a la media siempre es cero.
n

(X
i 1

X) 0

En Excel: funcin PROMEDIO


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


Ventajas y desventajas de la media aritmtica:
i.

Viene expresada en las mismas unidades que la variable.

ii. En su clculo intervienen todos los valores de la distribucin


iii. Es el centro de gravedad de todos los valores de la distribucin
iv. Es nica
v.

Su principal inconveniente es que se ve afectada por los valores extremadamente


grandes o pequeos de la distribucin.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


2. Mediana (Me): Valor de la variable que supera la mitad de las observaciones y a su
vez es superado por la otra mitad de ellas. Divide los datos en dos grupos. (los datos
deben de estar ordenados de menor a mayor o viceversa)

x (( n1) 2)

Me x n 2 x ( n 2)1

si n es impar
si n es par

Ventajas y desventajas de la mediana:


i.

En su determinacin no intervienen todos los valores de la variable

ii. Es fcil de calcular


iii. Solo influyen los valores centrales en su clculo y es insensible a los valores extremos

u outlayers
En Excel: funcin MEDIANA
Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


3. Moda (Mo): es el valor de la variable que ms veces se repite, y en consecuencia en una
distribucin de frecuencias, es el valor de la variable que viene afectada por la mxima
frecuencia de la distribucin.
La moda puede no existir y cuando existe pueden aparecer distribuciones de variables con
ms de una moda (bimodal, trimodal, etc), e incluso una distribucin de frecuencias que
presente una moda absoluta y una relativa. Ejem: pocas de lluvias en una ciudad, niveles de
un ro.
Ventajas y desventajas de la moda:
i.

Es la nica medida de posicin central que puede obtenerse en las variables de tipo

cualitativo
ii. Su calculo es sencillo y de fcil interpretacin
iii. En su determinacin no intervienen todos los valores de la distribucin.
En Excel: funcin MODA
Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


4. Media geomtrica: la raz n-sima del producto de todos los valores numricos, es decir:
n

X G x1.x2 ....xn n ( xi )
n

i 1

Ventajas y desventajas de la moda:


i. considera todos los valores de la distribucin y es menos sensible que la media aritmtica a
los valores extremos.
ii. es de significado estadstico menos intuitivo que la media aritmtica,
iii. su clculo es ms difcil y en ocasiones no queda determinada; por ejemplo, si un valor xi=0
entonces la media geomtrica se anula.
iv. Solo es relevante la media geomtrica si todos los nmeros son positivos. Si hubiera un
nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica sera o bien
negativa, o bien inexistente en los nmeros reales.
v. En muchas ocasiones se utiliza su trasformacin en el manejo estadstico de variables con
distribucin no normal.

En Excel: funcin MEDIA.GEOM


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE POSICIN NO CENTRAL
1. CUANTILES: Los cuantiles son aquellos valores de la variable, que ordenados de menor
a mayor, dividen a la distribucin en partes, de tal manera que cada una de ellas contiene el
mismo nmero de frecuencias.
Los cuantiles ms conocidos son:

Cuartiles (Qi): Son los 3 datos de la variable que dividen la distribucin en 4 partes.
25%, 50% y 75% de los datos acumulados.
(Q2=Me)
Deciles (Di): Dividen la distribucin en 10 partes. 10%, 20%, ... , 90% de los datos
acumulados.
(D5=Q2=Me)
Percentiles (Pi): Dividen la distribucin en 100 partes. 1%, 2%, ... , 99% de los datos
acumulados. (P50= D5=Q2=Me)
En Excel: funcin PERCENTIL
Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE POSICIN NO CENTRAL
1. CUANTILES:
Datos pares

Datos impares

(orden del cuantil ) n


cuantil

(orden del cuantil ) (n +1)


cuantil

Ejemplo:
Para el tercer cuartil

Cuando n es par:

Cuando n es impar:

En Excel: funcin PERCENTIL


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


Ejemplo: calcular las medidas de tendencia de las notas de los estudiantes de un curso.
3,80
4,10
4,10
3,70
3,90
3,90
4,00
3,60
4,30
3,90
4,20
4,60
4,10
4,00

3,70
4,80
4,10
3,80
3,30
3,90
3,60
4,10
3,70
3,70
3,50
3,70
2,90
4,00

3,60
1,20
3,50
3,40
3,30
3,20
3,60
3,00
3,40
3,60
3,10
4,00
3,70
3,70

n
PROMEDIO
MEDIANA
MAXIMO
MINIMO
MODA
MEDIA GEOM
Cuartil (Q1 y Q3)

1,80
3,20
3,50
1,60
3,30
3,20
3,00
4,10
4,40
4,60
3,30
4,00
4,40
3,50

3,30
3,00
4,60
3,70
4,60
4,10
4,40
4,00
3,70
4,20
4,30
1,90
3,00
3,00

3,60
4,20
4,20
3,00
3,30
3,90
4,20
4,50
3,60
3,60
4,60
4,50
4,90
4,10

4,40
4,20
3,90
3,00
3,00
4,50
3,90
2,80
4,20
3,00
4,10
2,80
2,80
4,60

113,00
3,75
3,90
4,90
1,20
4,10
3,67
3,30 y 4,20

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

4,70
3,60
4,70
4,60
4,50
4,50
4,10
4,50
3,90
4,30
3,00
4,30
1,80
4,50

4,50

Estadgrafos de posicin y dispersin


Ejemplo: calcular las medidas de tendencia de las notas de los estudiantes de un curso (cont.)
Tabla de frecuencia
Clase
1
2
3
4
5
6
7
8
9
10

Limite inf. Limite sup.


( 0,00
( 0,50
( 1,00
( 1,50
( 2,00
( 2,50
( 3,00
( 3,50
( 4,00
( 4,50

0,50 ]
1,00 ]
1,50 ]
2,00 ]
2,50 ]
3,00 ]
3,50 ]
4,00 ]
4,50 ]
5,00 ]

Marca de
clase
0,25
0,75
1,25
1,75
2,25
2,75
3,25
3,75
4,25
4,75

Frec.
Frec.
Frec. AcumAbosoluta - f Relativa - fr
F
0,00
0,00
0,00
0,00
0,00
0,00
1,00
0,01
1,00
4,00
0,04
5,00
0,00
0,00
5,00
14,00
0,12
19,00
16,00
0,14
35,00
34,00
0,30
69,00
33,00
0,29
102,00
11,00
0,10
113,00
113,00

1,00

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Frec. Rel.
Acum- Fr
0,00
0,00
0,01
0,04
0,04
0,17
0,31
0,61
0,90
1,00

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
Las principales medidas de DISPERSION son:
Rango
varianza
Desviacin estndar
Coeficiente de variacin

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
1. Rango: es la medida de variabilidad ms sencilla entre todas las mencionadas; y se
define como la diferencia entre la observacin ms grande y la ms pequea

R xmx xmn
Ventajas y desventajas de la moda:
i. su clculo es fcil
ii. ignora toda la informacin de la muestra entre las observaciones ms grande y ms
pequea

En Excel: funciones: MAX , MIN


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
2. Varianza: Es el promedio de los cuadrados de las desviaciones con respecto a la
2
2
media aritmtica. Se denota por: ; s ; VAR( x) (poblacional; muestral)
n

s2

(X
i 1

X )2

n 1

Propiedades:
i. La varianza es siempre un valor positivo. S2 0
ii. Si a las variables o datos se les suma o resta una constante, la varianza no cambia
(cambio de origen)
iii. Si las variables o datos se multiplican por una constante, la varianza cambia
multiplicndose por la constante al cuadrado (cambio de pendiente)

En Excel: funciones: VAR


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
2. Desviacin estndar o tpica: es la raz cuadrada positiva de la varianza. Es mas
usada que la varianza. ; s
n
s s2

(X
i 1

X )2

n 1

La desviacin estndar es una medida del grado de dispersin de los datos con respecto al
valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el
"promedio" o variacin esperada con respecto a la media aritmtica.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una
media de 7. Sus desviaciones estndar son 7, 5 y 1, respectivamente. La tercera muestra
tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de
7.
La desviacin estndar puede ser interpretada como una medida de incertidumbre. La
desviacin estndar de un grupo repetido de medidas nos da la precisin de stas.
En Excel: funciones: DESVEST
Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
2. Coeficiente de variacin: es la relacin entre la desviacin estndar de una muestra y
su media. CV
s
s

cv

cv

100

El cv es una medida de dispersin adimensional por lo que permite la comparacin entre


diferentes tipos de datos (escalas) pero que estn correlacionadas estadsticamente y
sustantivamente con un factor en comn. Es decir, ambas variables tienen una relacin
causal con ese factor
Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica,
mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin
tpica o estndar
A mayor valor de CV. mayor heterogeneidad de los valores de la variable; y a menor CV.,
mayor homogeneidad en los valores de la variable.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


ESTADGRAFOS DE DISPERSIN
2. Coeficiente de variacin (cont.)
Propiedades:
i. El coeficiente de variacin es tpicamente menor que uno.
ii. Para su mejor interpretacin comnmente se le expresa como porcentaje.
iii. Depende de la desviacin tpica y en mayor medida de la media aritmtica, dado que
cuando sta es 0 o muy prxima a este valor CV pierde significado, ya que puede dar
valores muy grandes, que no necesariamente implican dispersin de datos.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

Estadgrafos de posicin y dispersin


Ejemplo: (Cont. )
calcular las principales medidas de dispersin

n
PROMEDIO
MEDIANA
MAXIMO
MINIMO
MODA
MEDIA GEOM
Cuartil (Q1 y Q3)

113,00
3,75
3,90
4,90
1,20
4,10
3,67
3,30 y 4,20

Rango intercuantil (Q3-Q1)

0,90

Varianza (S2)

0,49

Desviacin estndar (S)

0,70

CV(%)

(0.70/3,75)*100 = 18,64%

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA
MEDIDAS DE ASIMETRA Y CURTOSIS
Las principales medidas de FORMA son:
Coeficientes de asimetra
Curtosis

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA
MEDIDAS DE ASIMETRA Y CURTOSIS
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o
asimetra) que presenta una distribucin de una variable sin tener que hacer su
representacin grfica..
Definicin: Una distribucin es simtrica cuando, dado su valor central, existen el mismo
nmero de valores a ambos lados de dicho valor y a cada par de valores equidistantes les
corresponde la misma frecuencia absoluta.
La asimetra se puede definir como la ausencia de simetra en la distribucin.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA
MEDIDAS DE ASIMETRA Y CURTOSIS

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIA MODA
MEDIA > MODA
ASIMTRICA POR LA
DERECHA O POSITIVA

MEDIA< MODA
ASIMTRICA POR LA
IZQUIERDA O NEGATIVA

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA
Coeficiente de asimetra
n

ni
m3 ( xi x )
N
i 1
3

o negativa

si m3 0 distribuci n simtrica
si m3 0 asimtrica positiva
si m3 0 asimtrica negativa

o positiva

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA

Coeficiente de asimetra de Fisher


n

g1

( xi x ) 3

ni
N

m3
i 1

3/ 2
S3 n
n

2 i
(
x

x
)

N
i 1

si g1 0 distribuci n simtrica
si g1 0 asimtrica positiva
si g1 0 asimtrica negativa

El coeficiente de asimetra de Fisher es la expresin anterior dividida por


el cubo de la desviacin estndar. La desviacin estndar, es positiva, as
el signo viene de m3

Coeficiente de asimetra de Pearson?


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

MEDIDA DE CURTOSIS
Medida de curtosis o apuntamiento
Hace referencia a la forma de la curva de la distribucin de los datos.

En cuanto mas aguda mayor, apuntamiento o mayor curtosis (leptocrtica)


En cuanto mas aplanada, menor apuntamiento o menor curtosis (planicrtica)
Las medidas de curtosis se aplican para distribuciones campaniformas, unimodales y
simtricas o moderadamente asimtricas.
Las medidas de curtosis estudian la distribucin de frecuencias en la zona central de la
distribucin. Una concentracin de frecuencias alta en esta zona da una distribucin ms
apuntada.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDA DE CURTOSIS
Medida de curtosis o apuntamiento

Para estos estudios hay que definir un tipo de distribucin como referencia.
Distribucin normal:

f ( x)

1 ( x )2

2 2

Donde es la desviacin tpica, y la media.

Una distribucin ms apuntada


que la normal es leptocrtica.
Una distribucin menos apuntada
que la normal es platicrtica.

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

MEDIDAS DE ASIMETRA
Coeficiente de curtosis o apuntamiento
n

g2

m4
3
4
S

( xi x )4
i 1

ni
N

2 ni
(
x

x
)
i
N
i 1
n

4/2

si g 2 0 mesocrtica (normal) (m4 3S 4 )


si g 2 0 leptocrti ca
si g 2 0 platicrti ca

Cuando la distribucin de los datos cuenta con un coeficiente de asimetra g1 0.5


y curtosis de g 2 0.5, se le denomina Curva normal

Google Books: Estadstica descriptiva e inferencial (1995). Antonio Vargas Sabadas


Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental
Profesor: Diego Alejandro Chalarca R.

Ejemplo: (Cont. )
calcular las principales medidas de asimetra y curtosis
113,00
3,75
3,90
4,90
1,20
4,10
3,67
3,30 y 4,20
0,90
0,49
0,70
18,64%

Conclusiones?

Asimetra

-1,12

Curtosis

1,81

Histograma
40
35

Frecuencia

n
PROMEDIO
MEDIANA
MAXIMO
MINIMO
MODA
MEDIA GEOM
Cuartil (Q1 y Q3)
Rango intercuantil (Q3-Q1)
Varianza (S2)
Desviacin estndar (S)
CV(%)

30
25
20
15
10
5
0
0

0,5

1,5

2,5
Notas

Curso: Estadstica. Facultad de Ingeniera. Escuela Ambiental


Profesor: Diego Alejandro Chalarca R.

3,5

4,5

You might also like