Professional Documents
Culture Documents
datos
La estadística ofrece la posibilidad de obtener
información acerca del comportamiento de una
población, sin necesidad de estudiar el
comportamiento individual de cada uno de los
casos que la componen. (Landero y Gonzales, 2009 p
167)
La estadística descriptiva se ocupa de resumir
la información disponible y reproducirla bajo la
forma de unos pocos valores.
Una variable Numérica
Resúmenes numéricos
Distribuciones de frecuencias absolutas, relativas y acumuladas con intervalos
convencionales
Media
Medidas de localización Mediana
Moda Tendencia central
Percentiles
Deciles
Cuartiles
… –2 –1 0 1 2 3 4 5... 10 . . . 40 . . . 50 . . . 60 . . . . . . 90 . . .100 . . .
15 16 18 19 15 16 17 18 19 20 21 22 23
17
15 16 17 17 18 19 15 16 17 18 19 23
X X
6 6
102 108
X 17 X 18
6 6
Mediana
20 21 22 22 22 23 24
50% 50%
14 20 22 22 22 23 24
50% 50%
El número veintidós es la
moda de este grupo de
datos
MODA
La moda es el valor que tiene mayor frecuencia
absoluta (Mo)
Se puede hallar la moda para variables
cualitativas y cuantitativas.
Por ejemplo hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con
la misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir,
tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
CALCULO PARA DATOS AGRUPADOS
𝑓𝑖 −𝑓𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑓𝑖 −𝑓𝑖−1 + 𝑓𝑖 −𝑓𝑖+1
fi hi
ℎ𝑖 −ℎ𝑖−1
(00, 10) 10 1 𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
ℎ−ℎ𝑖−1 + ℎ𝑖 −ℎ𝑖+1
(10, 12) 24 12
(12−1)
(12, 16) 12 3 𝑀𝑜 = 10 + ∗2
(12−1)+(12−3)
(16, 20) 4 1 11
total 50 𝑀𝑜 = 10 + ∗ 2 = 11.1
11+9
Primero calculamos las alturas hi
𝑓𝑖 10 24 12 4
ℎ𝑖 = ℎ𝑖1 = =1 ℎ𝑖2 = = 12 ℎ𝑖3 = =3 ℎ𝑖4 = = 1
𝑎𝑖 10 2 4 4
En este caso la clase modal, la de mayor altura, es “regular por que la altura es 12
Una variable Numérica
Percentiles y deciles
Valores de la variable que dividen el grupo de datos en subgrupos iguales
Percentil 20
Percentiles: 100 grupos iguales Decil 2
Pk donde k es el porcentaje de
datos inferiores al valor.
P8 = 15 para edad significa que
1 2 3 4 5 6 7 8 9 10 .....
el 8% de los individuos tienen 15
años o menos.
Percentil 10 Percentil 70
Decil 1 Decil 7
Deciles: 10 grupos iguales
D4=22 para edad significa que
el 40% de los individuos tienen Son descriptores más precisos
22 años o menos. de la localización de los datos
PERCENTILES
Son las calificaciones o puntos específicos dentro de
una distribución. Esta no corresponde a una
transformación lineal.
Los percentiles dividen la frecuencia total de un
conjunto de observaciones en cientos, es decir que
expresan el porcentaje de personas en el grupo
normativo que queda por debajo de un puntaje original
determinado
Los percentiles son los 99 valores que dividen la serie
de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%,
al 2%... y al 99% de los datos.
P50 coincide con la mediana.
CALCULO DE PERCENTILES
Dada la serie estadística: 3, 5, 2, 7, 6, 4, 9.
Calcular: Los percentiles 32 y 85.
2, 3, 4, 5, 6, 7, 9.
7*(32/100) = 2,2 P32 = 3
7*(85/100) = 5.9 P85 = 7
Dada la serie estadística: 3, 5, 2, 7, 6, 4, 9, 1.
1, 2, 3, 4, 5, 6, 7, 9
8*(2/10) = 1.6 D2 = 2
8*(7/10) = 5.6 D7 = 6
En Excel se calcula así: por ejemplo el percentil 50
=PERCENTIL(D2:D21,0.5)
CALCULO DE PERCENTILES
𝐾∗𝑁
−𝐹𝑖−1
𝑃𝑘 = 𝐿𝑖 + 100
∗ 𝑎𝑖 k= 1, 2, .. 99
𝑓𝑖
Cuartil 3
𝑥1 −𝑥 2 + 𝑥2 −𝑥 2 + 𝑥2 −𝑥 2 + …+ 𝑥𝑛 −𝑥 2
𝑠=
𝑁
𝑛
𝑖=1 𝑥1 −𝑥 2
𝑠=
𝑁
EJEMPLO
La desviación es de 3.18
CALCULO PARA DATOS AGRUPADOS
𝑥1 −𝑥 2 𝑓1 + 𝑥2 −𝑥 2 𝑓2 + …+ 𝑥𝑛 −𝑥 2 𝑓𝑛
𝑠=
𝑁
𝑛 𝑥1 −𝑥 2 𝑓𝑖
𝑖=1
𝑠=
𝑁
La desviación típica será siempre un valor positivo o
cero,
La desviación típica, al igual que la media y la varianza,
es un índice muy sensible a las puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco
será posible hallar la desviación típica.
Cuanta más pequeña sea la desviación típica mayor
será la concentración de datos alrededor de la media.
EJEMPLO
En un test realizado a un
xi fi xi.fi Xi2.fi
grupo de 42 personas se
(10, 20) 15 1 15 225
han obtenido las
(20, 30) 25 8 200 5000
(30, 40) 35 10 350 12250
puntuaciones que muestra
(40, 50) 45 9 405 18225 la tabla. Calcula la
(50, 60) 55 8 440 24200 puntuación media
(60, 70) 65 4 260 16900 1820
𝑥= = 43.33
(70, 80) 75 2 150 11250 42
total 42 1820 88050
88050
𝑠= − 43.332 =
42
14.797
Una variable Numérica
Coeficiente de variación
Es una medida de dispersión
s
de los datos ponderada por Cv = 100
la media de los mismos. X
Suele expresarse en
términos de porcentaje de
variación
Muy útil para comparar distribuciones
sx = sy = 8 X = 40;Y = 80
8 8
Cvx = 100 = 20 Cvy = 100 = 10
40 80
Cuanto más elevado sea el CV más dispersión o variabilidad tienen los datos. Por ejemplo
el CV=10% y el otro CV 20%, se puede concluir que el primero tienen mucha menos
variabilidad que el segundo
Una variable Numérica
El sesgo o Asimetría
Media=Mediana=Moda