You are on page 1of 54

Exploración de

datos
 La estadística ofrece la posibilidad de obtener
información acerca del comportamiento de una
población, sin necesidad de estudiar el
comportamiento individual de cada uno de los
casos que la componen. (Landero y Gonzales, 2009 p
167)
 La estadística descriptiva se ocupa de resumir
la información disponible y reproducirla bajo la
forma de unos pocos valores.
Una variable Numérica
Resúmenes numéricos
Distribuciones de frecuencias absolutas, relativas y acumuladas con intervalos
convencionales

Media
Medidas de localización Mediana
Moda Tendencia central
Percentiles
Deciles
Cuartiles

Medidas de dispersión Rango


Rango intercuartil y semi intercuartil
Varianza
Desviación estándar
MEDIDAS DE
TENDENCIA
CENTRAL
Una variable Numérica
Medidas de localización
Son resúmenes numéricos que dan información sobre la posición
(localización) del grupo de datos, sobre la recta numérica.
Siempre son valores de la variable de interés que informan sobre un grupo
de datos o subgrupos de ellos.
Se clasifican en: Medidas de tendencia central y otras medidas de
localización.

… –2 –1 0 1 2 3 4 5... 10 . . . 40 . . . 50 . . . 60 . . . . . . 90 . . .100 . . .

Son muy útiles como primer resumen pero tienen limitaciones


como descriptores únicos del comportamiento de los datos.
Una variable Numérica
La media

15 16 18 19 15 16 17 18 19 20 21 22 23
17

15  16  17  17  18  19 15  16  17  18  19  23
X X
6 6
102 108
X  17 X  18
6 6

Es una medida sensible a la presencia de datos extremos


MEDIA ARITMETICA
 La media aritmética es el valor obtenido al sumar todos
los datos y dividir el resultado entre el número total
de datos; es el promedio aritmético del conjunto de valores
que adopta la variable
 𝑥 es el símbolo de la media aritmética.
 La media se puede hallar sólo para variables cuantitativas.
 La media es independiente de las amplitudes de
los intervalos.
 La media es muy sensible a las puntuaciones extremas.
𝑥1 +𝑥2 +𝑥3 + … +𝑥𝑛
 𝑥=
𝑁
𝑛
𝑖−1 𝑥𝑖
 𝑥=
𝑁
 Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y
78 kg. Hallar el peso medio. = 80 kg
PROPIEDADES DE LA MEDIA

 Si a cada sujeto le calculamos su diferencia


con respecto a la media, la suma de estas
diferencias es igual a cero; la suma de las
diferencias positivas es igual a la suma de las
diferencias negativas.
8 -2 4
12 2 4
12 2 4
8 -2 4
10 0 16
CALCULO PARA DATOS AGRUPADOS

 Si los datos vienen agrupados en una tabla de


frecuencias, la expresión de la media es:
𝑥1 𝑓1 +𝑥2 𝑓2 +𝑥3 𝑓3 + … +𝑥𝑛 𝑓𝑛
 𝑥=
𝑁
𝑛
𝑖−1 𝑥𝑖 𝑓𝑖
 𝑥=
𝑁
EJEMPLO
 En un test realizado a un grupo
xi fi xi.fi
de 42 personas se han obtenido
(10, 20) 15 1 15
las puntuaciones que muestra la
(20, 30) 25 8 200
(30, 40) 35 10 350
tabla.Calcula la puntuación
(40, 50) 45 9 405 media
1820
(50, 60) 55 8 440
 𝑥= = 43.33
(60, 70) 65 4 260 42
(70, 80) 75 2 150
total 42 1820
Una variable Numérica
La media recortada al 5%

Media aritmética calculada sin


el 5% de valores más
pequeños y el 5% de valores
más grandes.
Corrige el efecto de valores
extremos
Útil con distribuciones con 60 70 80 90 180 190 200 215
datos muy alejados
Media tota = 130.4
Sólo tiene en cuenta la
información del 90% de los Media recortada al 5%
casos (con el 90% de los casos) = 128.4

Se gana estabilidad en la estimación pero se pierde información


Una variable Numérica
La mediana
Divide el grupo de valores de la variable de interés ordenados, en dos
mitades iguales.
Valor por encima y por debajo del cual hay igual cantidad de datos

Mediana

20 21 22 22 22 23 24

50% 50%

14 20 22 22 22 23 24

50% 50%

Es una medida robusta a la presencia de datos extremos


MEDIANA
 Es el valor de la variable que deja, por encima y por debajo el
mismo número de casos; es el valor que ocupa el lugar
central de todos los datos cuando éstos están ordenados de
menor a mayor. Se representa por Me.
 La mediana se puede hallar sólo para variables cuantitativas.
 Para calcular la mediana:
 Ordenamos los datos de menor a mayor.
 Cuando n es impar (n+1)/2 y si n es par ((n/2)+(n/2)+1)/2
 Si la serie tiene un número impar de medidas la mediana es
la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= (9+1)/2=5=5 (quinto lugar)
 Si la serie tiene un número par de puntuaciones
la mediana es la media entre las dos puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me=((6/2)+(6/2)+1)/2 = 3.5 = 9.5
CALCULO PARA DATOS AGRUPADOS
 La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las
frecuencias absolutas.
 Es decir tenemos que buscar el intervalo en el que se
encuentre .
𝑁
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗ 𝑎𝑖
𝑓𝑖
 Li es el límite inferior de la clase donde se encuentra la
mediana.
 es la semisuma de las frecuencias absolutas.
 Fi-1 es la frecuencia acumulada anterior a la clase mediana.
 ai es la amplitud de la clase.
 La mediana es independiente de las amplitudes de
los intervalos
EJEMPLO 𝑁
2
−𝐹𝑖−1
fi Fi  𝑀𝑒 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑓𝑖
(60, 63) 5 5
(63, 66) 18 23  100/2= 50
 Clase de mediana (66,69)
(66, 69) 42 65
(69, 72) 27 92
50−23
(72, 75) 8 100  𝑀𝑒 = 66 ∗ 3 = 67.93
42
total 100
Una variable Numérica
La moda

Es el valor que más veces se


repite en el grupo total.
19 22 26 27 28 30
No siempre es única para un
19 22 27 30
grupo de datos
22 27
22
22
22

El número veintidós es la
moda de este grupo de
datos
MODA
 La moda es el valor que tiene mayor frecuencia
absoluta (Mo)
 Se puede hallar la moda para variables
cualitativas y cuantitativas.
Por ejemplo hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
 Si en un grupo hay dos o varias puntuaciones con
la misma frecuencia y esa frecuencia es la máxima,
la distribución es bimodal o multimodal, es decir,
tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
 Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
CALCULO PARA DATOS AGRUPADOS
𝑓𝑖 −𝑓𝑖−1
 𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑓𝑖 −𝑓𝑖−1 + 𝑓𝑖 −𝑓𝑖+1

 Li es el límite inferior de la clase modal.


 fi es la frecuencia absoluta de la clase modal.
 fi--1 es la frecuencia absoluta inmediatamente inferior a la
clase modal.
 fi+1 es la frecuencia absoluta inmediatamente posterior a la
clase modal.
 ai es la amplitud de la clase.
 También se utiliza otra fórmula de la moda:
𝑓𝑖+1
 𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
𝑓𝑖−1 +𝑓𝑖+1
EJEMPLO
fi 𝑓𝑖 −𝑓𝑖−1
 𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
(60, 63) 5 𝑓𝑖 −𝑓𝑖−1 + 𝑓𝑖 −𝑓𝑖+1
(63, 66) 18 (42−18)
(66, 69) 42  𝑀𝑜 = 66 + ∗ 3
(42−18)+(42−27)
(69, 72) 27
(72, 75) 8
total 100 27
 𝑀𝑜 = 66 + ∗ 3 = 67.85
18+27
CALCULO PARA TABLAS CON DISTINTA
AMPLITUD
 En primer lugar tenemos que hallar las alturas.
𝑓𝑖
ℎ𝑖 =
𝑎𝑖
 La clase modal es la que tiene mayor altura.
ℎ𝑖 − ℎ𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
ℎ − ℎ𝑖−1 + ℎ𝑖 − ℎ𝑖+1
EJEMPLO
En la siguiente tabla se muestra las calificaciones (desaprobado,
regular, bueno y sobresaliente) obtenidas por un grupo de 50
alumnos. Calcular la moda del grupo.

fi hi
ℎ𝑖 −ℎ𝑖−1
(00, 10) 10 1  𝑀𝑜 = 𝐿𝑖 + ∗ 𝑎𝑖
ℎ−ℎ𝑖−1 + ℎ𝑖 −ℎ𝑖+1
(10, 12) 24 12
(12−1)
(12, 16) 12 3  𝑀𝑜 = 10 + ∗2
(12−1)+(12−3)
(16, 20) 4 1 11
total 50  𝑀𝑜 = 10 + ∗ 2 = 11.1
11+9
Primero calculamos las alturas hi
𝑓𝑖 10 24 12 4
ℎ𝑖 = ℎ𝑖1 = =1 ℎ𝑖2 = = 12 ℎ𝑖3 = =3 ℎ𝑖4 = = 1
𝑎𝑖 10 2 4 4

En este caso la clase modal, la de mayor altura, es “regular por que la altura es 12
Una variable Numérica
Percentiles y deciles
Valores de la variable que dividen el grupo de datos en subgrupos iguales

Percentil 20
Percentiles: 100 grupos iguales Decil 2
Pk donde k es el porcentaje de
datos inferiores al valor.
P8 = 15 para edad significa que
1 2 3 4 5 6 7 8 9 10 .....
el 8% de los individuos tienen 15
años o menos.
Percentil 10 Percentil 70
Decil 1 Decil 7
Deciles: 10 grupos iguales
D4=22 para edad significa que
el 40% de los individuos tienen Son descriptores más precisos
22 años o menos. de la localización de los datos
PERCENTILES
 Son las calificaciones o puntos específicos dentro de
una distribución. Esta no corresponde a una
transformación lineal.
 Los percentiles dividen la frecuencia total de un
conjunto de observaciones en cientos, es decir que
expresan el porcentaje de personas en el grupo
normativo que queda por debajo de un puntaje original
determinado
 Los percentiles son los 99 valores que dividen la serie
de datos en 100 partes iguales.
 Los percentiles dan los valores correspondientes al 1%,
al 2%... y al 99% de los datos.
 P50 coincide con la mediana.
CALCULO DE PERCENTILES
Dada la serie estadística: 3, 5, 2, 7, 6, 4, 9.
 Calcular: Los percentiles 32 y 85.
 2, 3, 4, 5, 6, 7, 9.
 7*(32/100) = 2,2 P32 = 3
 7*(85/100) = 5.9 P85 = 7
Dada la serie estadística: 3, 5, 2, 7, 6, 4, 9, 1.
 1, 2, 3, 4, 5, 6, 7, 9
 8*(2/10) = 1.6 D2 = 2
 8*(7/10) = 5.6 D7 = 6
 En Excel se calcula así: por ejemplo el percentil 50
=PERCENTIL(D2:D21,0.5)
CALCULO DE PERCENTILES
𝐾∗𝑁
−𝐹𝑖−1
 𝑃𝑘 = 𝐿𝑖 + 100
∗ 𝑎𝑖 k= 1, 2, .. 99
𝑓𝑖

 En primer lugar buscamos la clase donde se encuentra,


𝐾∗𝑁
en la tabla de las frecuencias acumuladas.
100
 Li es el límite inferior de la clase donde se encuentra el
percentil.
 N es la suma de las frecuencias absolutas.
 Fi-1 es la frecuencia acumulada anterior a la clase del
percentil.
 ai es la amplitud de la clase.
EJEMPLO 𝐾∗𝑁
100
−𝐹𝑖−1
 𝑃𝑘 = 𝐿𝑖 + ∗ 𝑎𝑖
fi Fi 𝑓𝑖
(50, 60) 8 8 35∗65
 𝑃35 = = 22.75
(60, 70) 10 18 100
22.75−18
(70, 80) 16 34  𝑃35 =70+ *10= 72.97
16
(80, 90) 14 48
(90, 100) 10 58
65∗65
(100,110) 5 63  𝑃65 = = 42.25
100
(110,120) 2 65 42.25−34
 𝑃65 =80+ *10= 80.89
total 65 14
 El percentil 65 supera al 65%de
los datos con un puntaje de
menor o igual a 80.89 y es
superado a su vez por el 35%
restante
 Por ejemplo, si el grupo normativo es de 300
alumnos y el 30% de los sujetos resuelven bien
menos de 20 ítems en un test; entonces 20
puntos corresponden al percentil 30 (P30). El
percentil indica la posición relativa de un individuo
en el grupo normativo. Siempre el percentil 50
corresponde a la mediana y los percentiles 25 y
75 corresponden al cuartil 1o y 3o
respectivamente (C1 y C3). El puntaje menor del
grupo corresponde al percentil 0 y el puntaje mas
elevado del grupo corresponde al percentil 100
DECILES

 Los deciles son los nueve valores que dividen


la serie de datos en diez partes iguales.
 Los deciles dan los valores correspondientes al
10%, al 20%... y al 90% de los datos.
 D5 coincide con la mediana.
CALCULO DE LO DECILES
𝐾∗𝑁
−𝐹𝑖−1
 𝐷𝑘 = 𝐿𝑖 + 10
∗ 𝑎𝑖 k= 1, 2, .. 9
𝑓𝑖

 En primer lugar buscamos la clase donde se encuentra ,


𝐾∗𝑁
10
; K= 1, 2, ..9 en la tabla de las frecuencias
acumuladas.
 Li es el límite inferior de la clase donde se encuentra el
percentil.
 N es la suma de las frecuencias absolutas.
 Fi-1 es la frecuencia acumulada anterior a la clase del
percentil.
 ai es la amplitud de la clase.
EJEMPLO 𝐾∗𝑁
10
−𝐹𝑖−1
 𝐷𝑘 = 𝐿𝑖 + ∗ 𝑎𝑖
fi Fi 𝑓𝑖
(50, 60) 8 8 1∗65
 𝐷1 = = 6.5
(60, 70) 10 18 10
6.5−0
(70, 80) 16 34  𝐷1 =50+ *10= 58.12
8
(80, 90) 14 48
(90, 100) 10 58
9∗65
(100,110) 5 63  𝐷9 = = 58.5
10
(110,120) 2 65 58.5−58
 𝐷9 =100+ *10= 101
total 65 5
 Esto quiere decir que el decil 9
(90%) de los datos o alumnos
obtienen un puntaje menor o
igual a 101 y es superado a su vez
por el 10% restante
Una variable Numérica
Cuartiles

Valores de la variable que


dividen el grupo de datos Cuartil 2 = Mediana
en 4 subgrupos iguales.
Cada uno de ellos
contiene el 25% del grupo
total.
Se notan con Qk
10 15 17 19 20 22 21 25
Q2 es la misma mediana
Q1 = 18 para edad Cuartil 1
significa que el 25% de los Cuartil 3
individuos tiene 18 años o
menos.
CUARTILES

 Los cuartiles son los tres valores de la variable


que dividen a un conjunto de datos ordenados
en cuatro partes iguales.
 Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de
los datos.
 Q2 coincide con la mediana.
CALCULO DE LO CUARTILES
𝐾∗𝑁
−𝐹𝑖−1
 𝑄𝑘 = 𝐿𝑖 + 4
∗ 𝑎𝑖 k= 1, 2, 3
𝑓𝑖

 En primer lugar buscamos la clase donde se encuentra ,


𝐾∗𝑁
4
; K= 1, 2, 3 en la tabla de las frecuencias
acumuladas.
 Li es el límite inferior de la clase donde se encuentra el
percentil.
 N es la suma de las frecuencias absolutas.
 Fi-1 es la frecuencia acumulada anterior a la clase del
percentil.
 ai es la amplitud de la clase.
VALIDACIÓN DE INSTRUMENTOS DE MEDICIÓN - Yuri Félix Chávez Luque
EJEMPLO 𝐾∗𝑁
4
−𝐹𝑖−1
 𝑄𝑘 = 𝐿𝑖 + ∗ 𝑎𝑖
fi Fi 𝑓𝑖
(50, 60) 8 8 1∗65
 𝑄1 = = 16.25
(60, 70) 10 18 4
16.25−8
(70, 80) 16 34  𝑄1 =60+ *10= 68.25
10
(80, 90) 14 48
(90, 100) 10 58
2∗65
(100,110) 5 63  𝑄2 = = 32.5
4
(110,120) 2 65 32.5−18
 𝑄2 =70+ *10= 79.06
total 65 16
 Esto quiere decir que el cuartil 2
(50%) de los datos o alumnos
obtienen un puntaje menor o
igual a 79.06 y es superado a su
vez por el 50% restante
CALCULO PARA DATOS NO AGRUPADOS
𝑘
 L= 𝑛 ∗
100
 Por ejemplo tenemos los datos
 2, 3, 4, 5, 6, 7, 9
25
 𝑄1 = 25 L= 7 ∗ = 1.75 =2 entonces el dato 2
100
50
 𝑄2 = 50 L= 7 ∗ = 3.5 = 4
100
75
 𝑄3 = 75 L= 7 ∗ = 5.25 = 6 entonces el dato
100
6, ósea 7 es el Cuartil 3
 Ahora si L fuera entero en datos pares entonces
calcularíamos la mitad entre ese numero y el siguiente
por ejemplo 3 y 4 el valor tendría que se 3.5
COMPARACION ENTRE LAS MEDIDAS DE
TENDENCIA CENTRAL
Caso 1 Caso 2
6IIIIIIIIII (10) La mediana es 5.5; 6IIIIIIIIII (10) La mediana sigue
5IIIII (5) es la puntuación 5IIIII (5) siendo 5.5; (10
4IIIII (5) que divide a la 4 sujetos por encima y
muestra en dos 10 por debajo),
3 3
mitades iguales (10 aunque la media
2 sujetos por encima y 2 baja a 4.5
1 10 por debajo), la 1IIIII (5)
media es 5.25

1.La mediana no se ve afectada por las


Estadísticos
puntuaciones extremas de la distribución;
VAR00001
2. Cuando la distribución no es normal (no es
N Válidos 20
simétrica) y hay mas sujetos por encima o por
Perdidos 0
debajo de la media, la mediana es arrastrada
Media 5,2500
hacia la zona de la distribución donde hay un
Mediana 5,5000
mayor numero de sujetos
MEDIDAS DE
DISPERSIÓN O DE
VARIABILIDAD
Una variable Numérica
Medidas de dispersión

Son resúmenes numéricos que dan información sobre la variabilidad o


dispersión del grupo de datos.
Pueden calcularse con respecto a un punto de tendencia central. Por
ejemplo, para la desviación estándar se toma la media.

Complementan muy bien a las medidas de localización para


lograr una descripción general del grupo de datos
UTILIDAD DE LAS MEDIDAS DE DISPERSION
 Ahora imaginemos que a dos clases (de cuatro alumnos
cada una) les ponemos un examen de 20 preguntas
objetivas. Cada pregunta puede estar bien (vale 1) o mal
(vale 0). GRUPO A GRUPO B
Sujeto 1 20 10
Sujeto 2 20 10
Sujeto 3 0 10
Sujeto 4 0 10
Media = 10 Media = 10

 ¿podemos decir que se trata de dos grupos muy parecidos


porque tiene la misma media?
 Las medidas de dispersión complementan la información
que nos da tanto la media, mediana y moda, estas medidas
expresan en que grado son homogéneos o parecidos los
unos a los otros
Una variable Numérica
Rango o rango total

Espacio numérico que cubre el


Rango total
grupo de datos, también se le
denomina intervalo, amplitud o
recorrido de la variable
Es la diferencia entre el valor
máximo y el mínimo de la
variable. 10 15 17 19 20 22 21 25
Se nota generalmente como R
R = (Max – Min)
Se complementa muy bien con la moda
Una variable Numérica
Rango intercuartil

Espacio numérico que cubre el Rango intercuartil


50% central de los datos.
Es la diferencia entre el cuartil 3
y el cuartil 1
Se nota generalmente como Ri
Ri = Q3 – Q1 10 15 17 19 20 22 22 25
Cuartil 1

Cuartil 3

Se complementa muy bien con la mediana


Una variable Numérica
Varianza

Dispersión del conjunto de


valores de la variable, con n
respecto a la media  ( xi - m ) 2
Promedio de las distancias s2  i 1
cuadráticas de todos los valores n
con respecto a la media
Tiene propiedades matemáticas No es fácilmente interpretable en
muy interesantes pero las términos de unidades de medidas de
unidades de la variable quedan los datos
elevadas al cuadrado.
Una variable Numérica
Desviación estándar

Es un valor de dispersión del


conjunto de valores de la
variable, con respecto a la
media n
Se puede ver como la  ( xi - m ) 2
distancia promedio de todos s  i 1
los valores con respecto a la n
media

Se complementa muy bien con la media


DESVIACIÓN TÍPICA O ESTÁNDAR
 La desviación típica es la raíz cuadrada de la
varianza.
 Es decir, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación.
 La desviación típica se representa por s.

𝑥1 −𝑥 2 + 𝑥2 −𝑥 2 + 𝑥2 −𝑥 2 + …+ 𝑥𝑛 −𝑥 2
 𝑠=
𝑁

𝑛
𝑖=1 𝑥1 −𝑥 2
 𝑠=
𝑁
EJEMPLO

 Calcular la desviación típica de la distribución:


 9, 3, 8, 8, 9, 8, 9, 18
9+3+8+8+9+8+9+18
𝑥 = =9
8
 𝑠=
(9−9)2 +(3−9)2 +(8−9)2 +(8−9)2 +(9−9)2 +(8−9)2 +(9−9)2 +(18−9)2
= 3.18
8

 La desviación es de 3.18
CALCULO PARA DATOS AGRUPADOS

𝑥1 −𝑥 2 𝑓1 + 𝑥2 −𝑥 2 𝑓2 + …+ 𝑥𝑛 −𝑥 2 𝑓𝑛
 𝑠=
𝑁

𝑛 𝑥1 −𝑥 2 𝑓𝑖
𝑖=1
 𝑠=
𝑁
 La desviación típica será siempre un valor positivo o
cero,
 La desviación típica, al igual que la media y la varianza,
es un índice muy sensible a las puntuaciones extremas.
 En los casos que no se pueda hallar la media tampoco
será posible hallar la desviación típica.
 Cuanta más pequeña sea la desviación típica mayor
será la concentración de datos alrededor de la media.
EJEMPLO
 En un test realizado a un
xi fi xi.fi Xi2.fi
grupo de 42 personas se
(10, 20) 15 1 15 225
han obtenido las
(20, 30) 25 8 200 5000
(30, 40) 35 10 350 12250
puntuaciones que muestra
(40, 50) 45 9 405 18225 la tabla. Calcula la
(50, 60) 55 8 440 24200 puntuación media
(60, 70) 65 4 260 16900 1820
 𝑥= = 43.33
(70, 80) 75 2 150 11250 42
total 42 1820 88050
88050
 𝑠= − 43.332 =
42
14.797
Una variable Numérica
Coeficiente de variación
Es una medida de dispersión
s
de los datos ponderada por Cv = 100
la media de los mismos. X
Suele expresarse en
términos de porcentaje de
variación
Muy útil para comparar distribuciones
sx = sy = 8 X = 40;Y = 80
8 8
Cvx = 100 = 20 Cvy = 100 = 10
40 80
Cuanto más elevado sea el CV más dispersión o variabilidad tienen los datos. Por ejemplo
el CV=10% y el otro CV 20%, se puede concluir que el primero tienen mucha menos
variabilidad que el segundo
Una variable Numérica
El sesgo o Asimetría
Media=Mediana=Moda

Medida de asimetría de la distribución.


La distribución normal es simétrica con
respecto a la media y su sesgo es igual a 0

El sesgo negativo indica que la


cola izquierda es más larga El sesgo positivo indica que
la cola derecha es más larga
El sesgo mayor de 1 o menor de –1, corresponden generalmente
a distribuciones no normales
ASIMETRIA
Una variable Numérica
Kurtosis
Es una medida del grado de agrupamiento de los datos alrededor de un
valor central.
La distribución normal tiene kurtosis igual a 0

La Kurtosis positiva indica La Kurtosis negativa indica que


que los datos se agrupan los datos se agrupan menos que
en la normal.
más que en la normal.
CURTOSIS

 La curtosis hace referencia al grado de


apuntamiento de una distribución

You might also like