You are on page 1of 91

MEDIDAS

ESTADSTICAS
Las medidas descriptivas son valores numricos que nos
resumen toda la informacin de los datos en unos pocos, de
manera que se conserve la mayor informacin posible del
conjunto de ellos.

CLASIFICACIN

MEDIDAS DE POSICION
CENTRAL
Estas medidas tienden a ubicarse en el centro del
conjunto.
Proporcionan
un
valor
simple
y
representativo, que resume un gran volumen de
informacin.

MEDIANA

MEDIA ARITMTICA

MODA

MEDIA ARITMTICA
Medida descriptiva de tendencia central, llamada tambin
promedio. Resulta de sumar los valores de todas las
observaciones y dividir la sumatoria entre el total de ellas.

Se puede ver como un punto de equilibrio de la distribucin, o como


un centro de gravedad de la misma.
Aplicada a datos cuantitativos (medidos en escala de razn o de
intervalo)

DATOS SIN AGRUPAR

Ejemplo

Se extrajo 29 muestras de material en la zona minera de la


sierra de Cartagena y se obtuvo el porcentaje % de Almina
en cada una de ellas. Alrededor de que valor se
encuentra el % de Almina en la muestra de material extrada?

Interpretacin

El porcentaje de Almina de la muestra varia alrededor de


16,18

DATOS SIN AGRUPAR

Ejemplo

En una muestra de presupuestos familiares, se ha


obtenido la siguiente informacin respecto al numero
de hijos de 21 familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2

Interpretacin

Redondeando por se variable discreta, se tiene


que el numero de hijos promedio por familia es 2.

DATOS AGRUPADOS

Ejemplo 1
En una muestra de presupuestos familiares, se ha obtenido la siguiente
informacin respecto al numero de hijos de 21 familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2

Interpretacin

Redondeando por se variable discreta, se tiene que el


numero de hijos promedio por familia es 2.

Ejemplo 2
La siguiente tabla muestra el nmero de horas de sueo de 45
pacientes de un hospital como consecuencia de la administracin
de un cierto tipo de anestsico:
Nmero de
horas (X)

Nmero de
pacientes

Total de horas por


pacientes

1
2
3
4
5
7
8
10
11
12
13
17

4
1
5
5
6
7
6
3
2
2
2
2

4
2
15
20
30
49
48
30
22
24
26
34

TOTAL

45

304

Interpretacin

El nmero de horas de sueo de los 45 pacientes vara


alrededor de 6,76 horas

DATOS AGRUPADOS (INTERVALOS)

Ejemplo
En un programa para la deteccin de hipertensin en una muestra de
30 hombres en edades entre 30 y 40 aos, la distribucin de la
presin diastlica (mnima) (mnima presin de la sangre contra las
arterias en mm Hg (milmetros de mercurio)) fue la siguiente:

Elaborar una tabla de frecuencias con 6 clases(intervalos) de amplitud 10


Calcular e interpretar la media aritmtica, usando la tabla de frecuencias .

Solucin:
Elaborar una tabla de frecuencias con 6 clases(intervalos) de amplitud 10
Calcular e interpretar la media aritmtica, usando la tabla de frecuencias .

Intervalo de
clase

Marca de
clase

65
75
85
95
105
115
TOTAL

Interpretacin

Cantidad de
Nmero de
presin diastlica
Hombres
en los hombres

3
6
7
9
2
3

195
450
595
855
210
345

30

2650

La presin diastlica de los 30 hombres se encuentra


alrededor de 80,33 mm Hg (milmetros de mercurio).

Ejemplo

Interpretacin

PROPIEDADES
Si se multiplica a la media por el nmero total de
observaciones, se obtiene la suma de las observaciones,
es decir:

Si a cada una de las observaciones se les resta la


media, y luego se suman esas diferencias, la suma
resultante es igual a cero, es decir:

Si se suma (o se resta) una constante b a cada


una de las observaciones, el promedio aritmtico
se ver aumentado (o disminuido) en esa
constante b, es decir:
Si se multiplica (o se divide) cada una de las
observaciones por una constante b, el promedio
aritmtico se ver multiplicado (o dividido) por
esa constante b, es decir:

PROPIEDAD 5

MEDIANA

Me

Medida descriptiva de tendencia central, que divide


al conjunto de datos ordenados en forma
ascendente, en dos grupos de igual numero de
observaciones.

50%
X mn

50%

Me

X mx

DATOS SIN AGRUPAR

Ejemplo
Los pesos, en kilogramos, de 7 jugadores de un equipo
de ftbol son:

72, 65, 71, 56, 59, 63, 72

1. Ordenamos los datos:

56, 59, 63, 65, 71, 72, 72


La mediana vale 65.

Ejemplo
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la
mediana es:
63 65
64
2
La mediana vale 64.

DATOS AGRUPADOS
n impar

Ejemplo

n par

Ejemplo

En una epidemia de escarlatina, se ha recogido el nmero


de muertos en 40 ciudades de un pas, obtenindose la
siguiente tabla:

Ejemplo

Nmero de
Muertos (X)
0
1
2
3
4
5
6
7

Nmero de
ciudades
7
11
10
7
1
2
1
1

TOTAL

40

Nmero de ciudades
Acumuladas
7
18
28
35
36
38
39
40

n=40 (par)

Cmo
50%

X mn=0

Interpretacin

50
%

Me

X mx=7

El 50% de las ciudades del pas, no supera los 2


muertos en una epidemia de escarlatina.

Ejemplo
Nmero de Hijos
(X)
0
1
2
3
4

Nmero de
Familias
1
5
7
7
1

TOTAL

21

50%
X mn=0

Interpretacin

Nmero de Familias
Acumuladas
1
6
13
20
21

50
%

Me

n=21 (impar)

Cmo

Entonces,
X mx=4

El 50% de las familias, no supera los 2 hijos.

DATOS AGRUPADOS
(INTERVALOS)

n par

Intervalo mediano

DATOS AGRUPADOS
(INTERVALOS)

n impar

Intervalo mediano

En un programa para la deteccin de hipertensin en una


muestra de 30 hombres en edades entre 30 y 40 aos, la
distribucin de la presin diastlica (mnima) (mnima presin
de la sangre contra las arterias en mm Hg (milmetros de
mercurio))fue la siguiente:

Ejemplo

n par
Intervalo
de clase

TOTAL

Nmero de
Personas

Nmero de
personas
acumuladas

3
6
7
9
2
3

3
9
16
25
27
30

Cmo

30

Interpretacin

El 50% de las personas (hombres) tienen una


presin diastlica que no supera 88,57 mm Hg.

Ejemplo

n par
Tenemos que:

50%
X mn=2

Interpretacin

50
%

Me

X mx=22

El 50% de los datos (observaciones) no superan


14

Ejemplo

n par

Reemplazando:

Interpretacin

El 50% de los las personas no superan los gastos


de 33,4.

Interpretacin
El 50% de las empresas invierten menos de 27 000 dlares

Ejemplo: La tabla siguiente muestra la experiencia laboral (aos)

del personal de seguridad que labora en un gran hospital. Calcule


e interprete la mediana.
EXPERIENCIA
LABORAL (AOS)

NMERO DE
TRABAJADORES DE
SEGURIDAD

03

47

12

8 11

24

12 15

16

16 19

10

20 23

69

Interpretacin

Mediana = 10,5 aos

La mitad del personal de seguridad que labora


en este hospital tienen una experiencia laboral
igual o menor a 10 aos 6 meses. La otra mitad
de este personal tiene una experiencia laboral
igual o mayor a 10 aos y 6 meses.

Ventajas de la mediana
Las principales ventajas son las siguientes:

Es aplicable cuando trabajamos con una


variable medida en escala por lo menos
ordinal (ordinal, razn o intervalo)
Es nica.

Es fcil de calcular.
No se afecta
extremos.

mucho

por

los

valores

PROPIEDADES
Sea X la variable y c una constante

MODA Mo
Se refiere al valor de la variable
que ms se repite en una
distribucin de frecuencia, o el
valor que est representado por el
mayor nmero de observaciones.

DATOS SIN AGRUPAR

Ejemplo

297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629

Mo = 455
DATOS

AGRUPADOS

Ejemplo

Interpretacin

La mayora
hijos.

de las familias tienen entre 2 y 3

Ejemplo

Una zapatera ha vendido en una semana los


zapatos que se reflejan en la tabla:

Lo compran 35 personas

La moda es 41.

Interpretacin

El nmero de zapato ms vendido, el dato con


mayor frecuencia absoluta, es el 41.

DATOS AGRUPADOS (INTERVALOS)

La moda

Intervalo modal

(Intervalo con
mayor frecuencia)

Intervalo modal

Ejemplo
Intervalo
de clase

Nmero de
Personas

Intervalo modal
(Intervalo con mayor frecuencia)

3
6
7
9
2
3
TOTAL

Interpretacin

30
La mayora de las personas (hombres) tienen
una presin diastlica de 92,22 mg Hg.

Ejemplo

Clase modal

Interpretacin

La mayora de las mediciones son de 444,44

Ventajas de la moda
Las principales ventajas son las siguientes:
Es el dato o datos que se repite
ms.
No es muy usada como medida de
tendencia central

No es nica
Se aplica a datos medidos en todas
las escalas vistas.

Las
distribuciones
pueden
ser
unimodales, bimodales, multimodales

PROPIEDADES
Sea X la variable y c una constante

PARTICIPANDO
Supongamos que tenemos una
distribucin de frecuencias del
saldo promedio mensual de la
cuenta de cheques de 600
clientes de una sucursal bancaria

Calcular la media, mediana y moda

Calculo de la media, mediana y moda


Calculo de la media (aritmtica)
Calculamos, el punto medio de cada clase.
Multiplicamos cada punto medio por la frecuencia de observaciones
de dicha clase y sumamos todos los resultados y dividimos entre el
numero total de datos.

Calculo de la mediana
Determinamos la Intervalo (clase) que contiene la mediana.
Para determinar la moda, utilizaremos la formula correspondiente
teniendo cuidado de identificar sus elementos.

Calculo de la moda
Determinamos la clase modal (clase que tiene el mayor numero de
observaciones).
Para determinar la moda, utilizaremos la formula correspondiente
teniendo cuidado de identificar sus elementos.

RELACION ENTRE LA MEDIA,


MEDIANA Y MODA
Si una distribucin es simtrica, la media,
mediana y modo coinciden
Si una distribucin no es simtrica, las tres
medidas difieren.
Asimetra hacia la derecha
(asimetra positiva)

Moda

Media
Mediana

Asimetra hacia la izquierda


(asimetra negativa)

Media Moda
Mediana

42

ELECCION DE UNA MEDIDA


DE TENDENCIA CENTRAL
El clculo de la moda, mediana o media
aritmtica es puramente mecnico y
actualmente esto se hace con mayor
rapidez en las computadoras e incluso
en las calculadoras.

Sin embargo, la eleccin


entre estas tres medidas y
su interpretacin puede
algunas
veces
requerir
detenidas reflexiones.

MEDIA , MEDIANA Y MODA


1. Los valores extremos no afectan a la mediana
tan intensamente como a la media.
2. La mediana se puede calcular con clases de extremos
abiertos.
3. En las distribuciones simtricas, la media, la mediana
y la moda tienen el mismo valor.

4. Cuando la poblacin esta sesgada negativa o


positivamente (asimtricas), la mediana resulta ser la
mejor medida de posicin, debido a que esta en la parte
intermedia.

Pero en muchas situaciones, la seleccin


depende de la practica comn de una industria
en particular.

Con frecuencia se habla del salario


de
fabrica
promedio
(media
aritmtica) y este puede ser de
utilidad para tomar muchas de las
decisiones en la planeacin de
negocios.
El precio mediano de una casa nueva
es una estadstica mas til para
personas que se mudan a un nuevo
vecindario.
Tiene
mas
sentido
para
los
diseadores de automviles pensar
en la familia modal ( 2 nios)
cuando planean el diseo de
automviles nuevos.

PORQUE ESTUDIAR LAS


MEDIDAS DE POSICIN?

MEDIDAS DE POSICION (CUANTILES)


Son medidas estadsticas que dividen en partes a
los
datos
de
la
poblacin
o
muestra,
determinando as la posicin de cada uno de ellos.

CUARTILES

DECILES

PERCENTILES

CUARTILES
Los CUARTILES son 3 valores que
dividen a la distribucin en 4 partes
iguales, cada una de las cuales
contienen el 25% de las observaciones

DECILES
Los DECILES son 9
valores que
dividen a la distribucin en 10 partes
iguales, cada una de las cuales
contiene el 10% de las observaciones

PERCENTILES
Los PERCENTILES son 99
que dividen a la distribucin
partes iguales, cada una
cuales contiene el 1%
observaciones

valores
en 100
de las
de las

DATOS SIN AGRUPAR


PROCEDIMIENTO
PASO 1 : ORDENE LOS DATOS DE MANERA ASCENDENTE.
PASO 2 : CALCULE UN INDICE i

PASO 3 :
(a) SI i NO ES ENTERO SE REDONDEA. EL VALOR ENTERO INMEDIATO
PROMEDIO MAYOR QUE i INDICA LA POSICIN DEL k-ESIMO PERCENTIL.
(b) SI i ES ENTERO, EL k-ESIMO PERCENTIL ES EL PROMEDIO DE LOS
VALORES DE LOS DATOS UBICADOS EN LOS LUGARES i E i+1.

ejemplo

Consideremos el siguiente conjunto de datos :


19,13,44,58,98,54,20,34,46,44,50

Calcular el percentil 40

Interpretacin
Hay un 40% de datos que son
menores o iguales que 44.

40%
13

60%
44

98

ejemplo

Consideremos el siguiente conjunto de datos :

36,25,37,38,40,47,29,28,31,32,,41,45,30,47,42,39,33,34,37,30
Calcular el percentil 80

80%

Interpretacin
Hay un 80% de datos que son
menores o iguales que 41,5

25

20%
41,5

47

ejemplo

Consideremos el siguiente
conjunto de datos :
107

73

68

97

76

79

94

59

98

57

54

65

71

70

84

88

62

61

79

98

66

62

79

86

68

74

61

82

65

98

62

116

65

88

64

79

78

79

77

86

Calcular el percentil 25

Calcular el percentil 78

Calcular el percentil 75

DATOS AGRUPADOS
(DISCRETO)

Calcular el percentil 18
DATOS AGRUPADOS
(INTERVALOS)

PARTICIPANDO
VARIABLE DISCRETA

VARIABLE CONTINUA

MEDIDAS DE POSICIN:
EQUIVALENCIAS

D1=P10
Q1=P25

Q2=Md=P50
Medidas Rango intercuartlico:
derivadas:
Q3-Q1.

PARTICIPANDO
Calcular la mediana (Me); el primer y
tercer cuartil (Q1, Q3); el 4 decil (D4) y el
90 percentil (P90).
Mediana (Me)
Lugar que ocupa la mediana lugar 20/2 = 10.
Como es igual a un valor de la frecuencia absoluta
acumulada, realizaremos el clculo:

Lugar que ocupa en la distribucin (). 20 = 20/4 = 5


Como Ni-1 < (25%).n < Ni, es decir 3 < 5 < 10 esto implicara que Q1 = Xi =10

Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor
de la frecuencia absoluta acumulada, por tanto realizaremos el clculo:

PARTICIPANDO

Hallar el primer cuartil,


(Q1), el cuarto decil (D4)
y el 90 percentil(P90) de
la siguiente distribucin:

Lugar ocupa el intervalo del primer


cuartil: (1/4). 500 = 500/4 = 125.
Por tanto C4 estar situado en el
intervalo [100 200).
Aplicando la expresin directamente,
tendremos:

Lugar que ocupa: (4/10).500 = 200. Por tanto D4 estar situado en el intervalo [100 200).

Aplicando la expresin tendremos:

Lugar que ocupa: (90/100).500 = 450. Por tanto P90 estar situado en el intervalo [300 800).
Aplicando la expresin tendremos

PORQUE ESTUDIAR LA
DISPERSION?
Ejemplo:

Si una gua geogrfica informa que un rio


tiene un promedio de 1,50 metros de
profundidad
lo cruzara sin informacin adicional?
Antes de decidir respecto a cruzar o no el rio, se
requiere informacin acerca de la profundidad y la
variacin en la profundidad del mismo.

Cuan dispersas estn dos


o mas distribuciones?
Ejemplo:
Supngase que la nueva computadora PDM/3 se ensambla
en Baton Rouge y tambin en Tucson. La media aritmtica
de la produccin diaria es 50 en las dos plantas.

48 49 50 51 52

40

47

50

53

60

MEDIDAS DE DISPERSIN
Indican como los datos se dispersan al rededor de
su punto central (la media). Nos dan elementos
para evaluar la adecuacin de la medida de
tendencia central usada.

ABSOLUTAS

RELATIVAS

RANGO O
AMPLITUD

RANGO
INTERCUARTLICO

DESVIACIN MEDIA

VARIANZA
DESVIACIN
ESTNDAR

COEFICIENTE
DE VARIACIN

RANGO O AMPLITUD ( R )
Se utiliza para variables
cuantitativas
medidas
en
escala de intervalo o razn
Inestable (muy afectada
por los valores extremos)
No aprovecha los datos,
insuficiente
Fcil de calcular

Ejemplo

Ante la pregunta sobre nmero


de hijos por familia, una muestra
de 12 hogares, marc las
siguientes respuestas:
2; 1; 2; 4; 1; 3; 2; 3; 2; 0; 5; 1
Calcule el rango de la variable

Solucin
El Rango es R =5 0 = 5

RANGO INTERCUARTLICO (RI)


El rango intercuartlico de
un conjunto de datos es la
diferencia entre el tercer
cuartil y el primer cuartil.
Es el rango donde se
encuentra el 50% central de
los datos.
Elimina la sensibilidad de
los
valores
de
datos
extremos.

Ejemplo

Rango Intercuartil Q3 Q1
Para calcular el rango intercuartil
del tiempo necesario para
arreglarse antes de salir al trabajo
se siguen los siguientes pasos:
(1) Ordenar de menor a mayor la
muestra
(2) Calcular el cuartil 1 y el 3

Se define en minutos el tiempo que le


lleva arreglarse, desde que se levanta
hasta que sale de casa. A lo largo de
10 das hbiles consecutivos,

El rango intercuartil
consta de 9 numerales

DESVIACIN MEDIA
Mide el valor en promedio en que varan los

valores de una poblacin, o muestra


respecto a su media.

Ejemplo

con

El nmero de pacientes atendidos en la sala de urgencias en


un hospital para una muestra de 5 das el ao pasado fue:
103; 97; 101; 106 ; 103
Determinar e interpretar

la desviacin media.

103

97

101

106

103

Interpretacin
La desviacin media es 2,4 pacientes por da. El
nmero de estos, vara en promedio, en 2,4
pacientes por da con respecto de la media de 102
enfermos por da.

VARIANZA Y
DESVIACIN ESTNDAR
Nos informan sobre la magnitud de la variacin en los datos, la
magnitud con la cual las observaciones se agrupan en torno a la media
Slo se aplica a variables cuantitativas (medidas en escala de razn o
intervalo)
DATOS SIN AGRUPAR
DESVIACIN
ESTANDAR

VARIANZA
N

(x
i 1

x )

Se

(x
i 1

(x
i 1

los
de

15, 12, 18, 20 y 25.

x )2

tienen
datos
una muestra:

Ejemplo: siguientes

x )2
n

n 1
s2

(x
i 1

x )2

n 1

DATOS AGRUPADOS
DISCRETOS

VARIANZA

Ejemplo:
Se han registrado
durante 20 das, el
nmero de viajeros
que
hacen
reservaciones a una
agencia de viajes
pero que no las
hacen efectivas:
Calcule las medidas de dispersin de la variable en
estudio. Interprete
xi

ni

12

13

14

xi

ni xini xi2

12

36

144

432

13

39

169

507

15

14

84

196

1176

16

15

45

225

675

70

20

16

80

256

1280

70

0 284

990

xi2ni

4070

284 2
4070
2
20 1,9579 s 1,3992
s
19

VARIANZA

DATOS AGRUPADOS
INTERVALOS

Ejemplo:
Una muestra de las cantidades
que
los
empleados
de
una
compaa invierten quincenalmente
en el plan de
participacin de
utilidades, se organizo en una
distribucin de frecuencias para
su estudio.

Cual

es la varianza muestral de
los datos? Cual es la desviacin
estndar muestral de los datos?

La varianza muestral es $ 56.40


(dlares al cuadrado)
La desviacin estndar muestral
es $ 7.51

Ejemplo:

En un grifo se form la siguiente distribucin de


frecuencias de galones de gasolina vendidos por
automvil, en una muestra de 300 vehculos:

Galones de gasolina

frecuencia

0 6

50

6 - 12

95

12 - 18

65

18 - 24

50

24 -30

25

30 - 36

15

total

300

PROPIEDADES

Calcule
e
interprete
medidas de Dispersin

las

Si tenemos varias distribuciones con la misma


media y conocemos sus respectivas varianzas
se puede calcular la varianza total.
Si todas las muestras tienen el mismo
tamao

V
Si las muestras tienen distinto tamao

COEFICIENTE DE VARIACIN
Compara la variabilidad de series de

datos que tengan unidades diferentes.


No tiene unidades de medida.
Se calcula para variables medidas en
escala de razn
Ejemplo:

Ante la pregunta sobre nmero de hijos


por familia, una muestra de 12 hogares,
marc las siguientes respuestas:
2 ; 1; 2; 4; 1; 3; 2; 3; 2; 0; 5; 1
Calcule
el
variabilidad:

coeficiente

de

CV

S
100%
x

CV

100%

Solucin

s 2 1,9697

s 1,4035

1,4035
cv
x100 64,7759%
2
,
1667

Ejemplo:

Solucin:

Ejemplo:
Un inversor debe decidirse por la
Accin A o por la B de dos compaas
de electrnica. Cul debe elegir si
desea optar
por
la que
tiene
comportamiento ms homogneo?

Accin Precio Promedio ($) Desvo Estndar ($)


15.000
500
A
5.000
300
B

CV A

500
100 3,3 %
15.000

CV B

300
100 6,0 %
5.000

Debe elegir la Accin A.

CONSIDERACIONES

PROPIEDADES

Medidas de localizacin relativa


y deteccin de valores atpicos
Cuando se desea realizar comparaciones entre valores
particulares de distintas variables conviene tener una
referencia comn para que la comparacin resulte
efectiva.

Esto se puede conseguir mediante la tipificacin.


TIPIFICACION

Dada
una
variable
estadstica
X,
la
tipificacin de esta variable es otra nueva
variable, Z, que se define como

Denota el numero de desviaciones estndar que el valor de un


dato xi est de la media
Un dato menor que la media tendr signo negativo, lo
contrario suceder con un dato mayor que la media.

Ejemplo:
Un licenciado en psicologa y otro en econmicas reciben sendas
ofertas de trabajo, con sueldos anuales de 18.000 y 24.000 .
La media de los sueldos de los recin licenciados en psicologa es
de 16.000, con una desviacin tpica de 850. La media de los
sueldos de los recin licenciados en econmicas es de 22.000,
con una desviacin tpica de 1.200. Cul de los dos ha tenido
una mejor oferta laboral, en relacin a los sueldos de su
profesin?

Solucin:
Calculamos la variacin relativa, en cada caso, con
respecto a la media (es decir, tipificamos):

X x
Z
S

Psicologa: (18000-16000)/850=235
Econmicas: (24000-22000)/1200=166

Interpretacin
Por tanto, el sueldo ofrecido al psiclogo posee mayor variacin
relativa; puesto que la variacin es positiva, ello implica que el
sueldo es comparativamente mejor

Ejemplo:
Se considera que la media para arreglarse en la maana
es de 39.6 minutos y la desviacin estndar de 6.77
minutos. S el da lunes se toma 39.0 minutos para
arreglarse. Calcular la puntuacin Z para este da.

39.0 39.6
6.77
Z 0.09
Z

DETECCIN DE VALORES ATPICOS


Un valor atpico es un valor inusualmente muy pequeo o muy
grande para el conjunto de datos.
CRITERIOS
Un dato con valor de z menor que -3 o mas grande
que +3 puede ser considerado como un valor atpico.

|z| > 3
INTERPRETACIN
Puede ser un valor de dato registrado incorrectamente.
Puede ser un dato
Puede ser un valor de dato que fue incorrectamente
incluido en el conjunto de datos.
Puede ser un valor de dato correctamente registrado y
que pertenece al conjunto de datos!!!

MEDIDAS DE FORMA
Adems de identificar la ubicacin y dispersin que
tienen los datos, es importante determinar su forma,
como un complemento de su descripcin. Estas medidas
permiten caracterizar de una manera mas adecuada la
forma de distribucin de los datos.

ASIMETRA

CURTOSIS

Asimetra o
Sesgo

Una distribucin es simtrica si la mitad


izquierda de su distribucin es la
imagen especular de su mitad derecha.

En las distribuciones simtricas media y


mediana coinciden. Si slo hay una
moda tambin coincide

La asimetra es positiva o negativa en


funcin de a qu lado se encuentra la
cola de la distribucin.

La media tiende a desplazarse hacia las


valores extremos (colas).

Las discrepancias entre las medidas de


centralizacin son indicacin de
asimetra.

MEDIDAS DE ASIMETRA
Cuantifican el grado de asimetra de la distribucin en torno a
una medida de tendencia central. Es decir mide si la muestra
se distribuye de igual manera a ambos lados de la media.

COEFICIENTE DE
ASIMETRIA DE
FISHER

A=0

Ejemplo:

Como parte del National Health Examination se mide el ndice


de masa corporal en una muestra aleatoria de mujeres, calcule
e interprete el coeficiente de asimetra de fisher.

Interpretacin

Ejemplo:

Calculo del coeficiente de


asimetra de Fisher

Tal como se esperaba es positivo, es


decir la distribucin tiene una asimetra
o sesgo positiva.

Ejemplo:

En una epidemia de escarlatina, se ha recogido el nmero de


muertos en 26 ciudades de un pas, obtenindose la siguiente
tabla:
N de muertos
0
1
2
3
4
Ciudades

11

10

Calcule e interprete el coeficiente de asimetra de Fisher.

N de
muertos

Ciudades

12

20

Total

40

-16,875

12

12

12

-1,5

20

40

80

2,5

36

6,75

16

15,625

Total

40

60

144

6,5

Interpretacin

Ejemplo:

Como parte del National Health Examination se mide el ndice


de masa corporal en una muestra aleatoria de mujeres, calcule
e interprete el coeficiente de asimetra de fisher.

Ejemplo:

A continuacin se presenta una distribucin de frecuencias, del


nivel de colesterol en varones. Calcule e interprete el
coeficiente de asimetra de fisher.
Colesterol

Varones

0-200

13

200-400

11

400-600

600-800

800-1000

Total

38

MEDIDAS DE
CURTOSIS
La curtosis de una distribucin es la medida del grado
de apuntamiento de ella. Es decir, mide la
concentracin de la muestra alrededor de la media.

COEFICIENTE DE
CURTOSIS DE
FISHER

Ejemplo:

Las siguientes puntuaciones corresponden a un grupo


de estudiantes, Calcule el coeficiente de curtosis.
2;4;8;2

Interpretacin

Ejemplo:

Las siguientes puntuaciones corresponden a un grupo de


estudiantes, en una prueba de educacin fsica donde la
mxima calificacin es 10: 4,4,4,5,5,5,5,5,6,6,7,7,9,9,9.
Obtengamos la medida de curtosis.
Calculo del coeficiente de Curtosis de Fisher

Interpretacin
El coeficiente de Fisher es negativo ( 1.1608) entonces, la serie de datos tiene
una distribucin de forma platicurtica, es
decir existe una mayor dispersin de los
datos
que lo normal de los datos con
respecto a la media

Ejemplo:

En una epidemia de escarlatina, se ha recogido el nmero de


muertos en 26 ciudades de un pas, obtenindose la siguiente
tabla:
N de muertos
0
1
2
3
4
Ciudades

11

10

Calcule e interprete el coeficiente de curtosis de Fisher.

N de
muertos

Ciudades

11

10

Total

26

Interpretacin

Ejemplo:

En una epidemia de escarlatina, se ha recogido el nmero de


muertos en 26 ciudades de un pas, obtenindose la siguiente
tabla:
N de muertos
0
1
2
3
4
Ciudades

11

10

Calcule e interprete el coeficiente de curtosis de Fisher.

N de
muertos

Ciudades

11

10

Total

26

Interpretacin

12,46

Ejemplo:

A continuacin se presenta una distribucin de frecuencias, del


nivel de colesterol en varones. Calcule e interprete el
coeficiente de asimetra de fisher.
Colesterol

Varones

0-200

13

200-400

11

400-600

600-800

800-1000

Total

38

Interpretacin

GRFICO DE CAJA Y
BIGOTES
Es una representacin grfica de una distribucin estadstica
que refleja
directamente 5 parmetros ( Lmite Inferior,
Primer Cuartil, Mediana, Tercer Cuartil y Limite Superior) e
indirectamente el Rango y el Rango Intercuartlico.
Primer Cuartil
Lmite Inferior
Q1
L I = Q1-1,5 RI
Valores
Atpicos

(Mediana)
Q2

1,5 RI

Tercer Cuartil
Lmite Superior
Q3
LS = Q3-1,5 RI

Valores
Atpicos
Q1 (Rango Intercuartlico)
1,5 RI

RI= Q3

Tambin dan idea de la simetra ,


El sesgo y de la dispersin de la distribucin
de los datos.

Ejemplo: Distribucin de edades de un colectivo de 20 personas.


Ordenamos la distribucin de los datos:

Calculo de Cuartiles:
Q1=(24 + 25) / 2 = 24,5
Me= Q2 = (33 + 34)/ 2 =33,5
Q3=(39 + 39) / 2 = 39

Caractersticas:

El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1)

La primera parte de la caja(Q1,Q2),la segunda parte de la caja (Q2,Q3)


El bigote de la derecha viene dado por (Q3, Xmx).

Interpretacin:

La parte izquierda de la caja es mayor que la de la derecha; ello

quiere decir que las edades comprendidas entre el 25% y el 50% de la


poblacin est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmn, Q1) es ms corto que el de la derecha;
por ello el 25% de los ms jvenes estn ms concentrados que el 25%
de los mayores.
El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la
poblacin est comprendido en 14,5 aos.

Ejemplo:

Comparar distribuciones
de
edades
de
dos
grupos de colectivo de
20 personas.

GRUPO 1

GRUPO 2

DA 1
DA 2
DA 3

DA 4
DA 5

Ejemplo:
Un corredor entrena para una
determinada carrera y se toman los
tiempos que necesita para recorrer
los
100m,
durante
10
das
consecutivos (cada da se toman
varios tiempos y se calculan mediana,
cuartiles, valores mnimo y mximo)

Observamos que el desplazamiento de las


grficas de caja hacia la izquierda
indica que el entrenamiento ha dado
resultado, ya que se tardan menos
segundos en recorrer la misma distancia,
siendo la diferencia entre el mximo y el
mnimo menor, como as tambin la
diferencia intercuartlica

You might also like