You are on page 1of 15

UNIVERSIDAD NACIONAL HERMILIO VALDIZAN

FACULTAD DE MEDICINA

MEDIDAS DE FORMA DE LA DISTRIBUCION


LOS DATOS

Mg. Joel Tucto Berros

Curva simtrica
Lnea vertical pasa por el punto ms alto de
la curva, divide el rea en dos partes iguales.

Media=mediana=moda

Curva sesgada
Valores concentrados en el extremo inferiorsuperior escala de medicin eje horizontal.
La cola indica el tipo de sesgo.

Moda Mediana Media

NDICE DE ASIMETRA
Existen varias medidas

de asimetra,
una de ellos es el ndice de Pearson.
Asimetra de Pearson
Se define como el cociente de la media
menos la moda sobre desviacin
estndar.
As =
o
As=
Asimetra positiva
Asimetra negativa
Curva sesgada a la derecha
a la izquierda

Curva sesgada

NDICE DE CURTOSIS

La curtosis es una medida de altura de la

curva y por tanto esta representado por


el cuarto momento de la media.
-3

El ndice de curtosis
se define como:
K = -3
donde:
cuarto momento centrado con respecto a la
media
= desviacin estndar.
Si k = 0 la distribucin normal es
mesocurtica
Si k > 0 la curva es leptocurtica o
apuntada
Si k < 0 la curva es platicurtica o achatada

La curtosis se mide en relacin a la


altura de la curva normal.
A la curva normal se llama
MESOCRTICA, si es ms puntiaguda
se le llama LEPTOCRTICA y se es
mas achatada se le conoce
PLATICRTICA.
Los indicadores de curtosis, miden el
nivel de concentracin de datos en
la regin central.

Curtosis basado en percentiles

K=
Interpretacin

Si k normal

Si K tiende a 0.5 leptocurtica


Si K tiende a -0.5

ANALISIS EXPLORATORIO DE DATOS


Consiste en un conjunto de datos de
tcnicas estadsticas y sus grficos, que
permiten visualizar la informacin bajo
estudio con la finalidad de:
Evaluar la calidad y consistencia de
datos
Investigar la distribucin de las
variables
Resumir la informacin mediante el
uso de diferentes estadgrafos y sus
grficos.

Diagrama de tallo y hojas


Permite organizar grficamente a los
nmeros de manera que dirige la
atencin a varios aspectos de los datos,
en forma simultnea tales como:
La simetra del conjunto de datos
Cun dispersos estn los nmeros.
Si existe una concentracin de datos.
Si existen brechas en el conjunto de
datos
Si existen valores alejados del

Ejemplo:
Los siguientes datos representan
pesos de una muestra de 15 varones
adultos:
165, 178, 185, 169, 152, 180, 175,
189, 195, 200, 183, 191, 197, 208,
179.
Elaborar el diagrama de tallo y hojas.
Solucin:
En este caso los tallos forman los
primeros dos dgitos de los datos, y las
hojas constituyen los ltimos dgitos.

f
tallos
hojas
1
12
2
2
16
59
3
17
598
4
18
0935
3
19
517
2
20
08
Interpretacin: El diagrama nos
muestra una distribucin asimtrica a
la izquierda, no tiene mucha
variabilidad ni outliers.

Diagrama de caja (Boxplot)


El boxplot es una grafica importante del
anlisis exploratorio de datos. Al igual
que el histograma y el diagrama de
tallo y hojas, permite tener una idea
visual de la distribucin de datos, que
nos permite conocer:
La localizacin del centro de datos.
La dispersin.
La simetra
La extensin de los extremos
La existencia de valores aberrantes

La caja se construye graficando un


rectngulo cuyos lmites son los
cuartiles inferior ( P25 ) y superior
( P75), marcando la mediana con una
lnea horizontal.
Desde la caja se dibujan los bigotes
cuyos extremos son los lmites inferior y
superior. Por fuera de los lmites se
dibujan los puntos que representan a los
valores aberrantes fuera de contexto o
outliers.

You might also like