Professional Documents
Culture Documents
Hallar el 68- esimo percentil y el tercer cuartil Para una muestra de los siguientes datos correspondiente a
las notas de 20 estudiantes las cuales se expresan a continuacin
5.0 4.5 4.2 4.3 3.8 2.7 4.6 2.8 4.0 4.2 4.7 5.0 3.5 1.5 2.4 2.2 2.3 2.2 3.2
3.3 0.0 (por copin)
2. determinar
edades Frecuencia
11.5 - 14.5 2
14.5 - 17.5 8
17.5 - 20.5 11
20.5 - 33.5 10
32.5 - 26.5 8
26.5 - 29.5 1
3) explicar que son medidas de posicin relativas. Descrbalas y explique qu significa cada una de ellas
4) Explique que son medidas de dispersin que indican y describa cada una de ellas
DESARROLLO
R1.
5.0 4.5 4.2 4.3 3.8 2.7 4.6 2.8 4.0 4.2 4.7 5.0 3.5 1.5 2.4 2.2 2.3 2.2
3.2 3.3
Se ordenan los datos:
1.5 2.2 2.2 2.3 2.4 2.7 2.8 3.2 3.3 3.5 3.8 4.0 4.2 4.2 4.3 4.5 4.6 4.7
5.0 5.0
Tercer cuartil:
= . + (. . ). = .
Posicin:
= 68 = 20
( + 1)
68 =
100
68 (20 + 1)
68 =
100
68 = 14.28
11.5 - 14.5 13 2 2
14.5 - 17.5 16 8 10
17.5 - 20.5 19 11 21
20.5 - 23.5 22 10 31
23.5 - 26.5 25 8 39
26.5 - 29.5 28 1 40
40
Posicin:
4
1 40
1 = 10
4
= = .
Posicin:
100
38 40
38 = 15.2
100
= 21
1 = 10
= 17.5
=3
15.2 10
55 = 17.5 + 3 ( )
21 10
= .
R3.
Medidas de posicin
Las medidas de posicin relativa se llaman en general cuantiles y se pueden clasificar en tres grandes
grupos: Cuartiles, quintiles, deciles, percentiles. Las medidas de posicin como los cuartiles, quintiles,
deciles y percentiles dividen a una distribucin ordenada en partes iguales. Para calcular las medidas de
posicin es necesario que los datos estn ordenados de menor a mayor.
son los tres valores de la variable de una distribucin que la dividen en cuatro partes iguales, es
decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro Cuartiles, se utiliza la formula:
Qk = k (n/4)
En donde:
Qk = Cuartil nmero 1, 2, 3 4
n = total de datos de la distribucin.
Se advierte que la posicin del segundo cuartil corresponde a la ubicacin de la mediana, es decir que el
segundo cuartil ser siempre igual a la mediana.
Para calcular los cuartiles (datos no agrupados) debes seguir los siguientes pasos:
El primer cuartil (Q1) es el valor de la variable que supera a lo ms el 25 % de los datos y es superado por
a lo ms el 75 % de ellos en la distibucin ordenada de menor a mayor.
El segundo cuartil (Q2) es un valor que supera a lo ms el 50 % de los datos y es superado por a lo ms el
50 % de ellos, es decir, Q2 coincide con la mediana.
El tercer cuartil (Q3) es un valor que supera a lo ms al 75 % de los datos y es superado por a lo ms el 25
% de ellos.
Ejemplos:
a) Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7. Cul es el valor del tercer cuartil?
2; 3; 5; 6; 7; 9; 10; 11; 13
n= 9
Q3 = 3 (9 /4)
Q3 = 6,75; En caso de ser un nmero decimal se aproxima al entero ms cercano superior, que sera 7. Este
valor indica la posicin del cuartil 3.
2; 3; 5; 6; 7; 9; 10; 11; 13
Respuesta:
Q1 = 5, ya que si nos fijamos en la tabla el nmero 17,5 se encuentra contenido en el nmero 32 de la tabla.
Q2 = 7, ya que si nos fijamos en la tabla el nmero 35 se encuentra contenido en el nmero 52 de la tabla.
Q3 = 10, ya que si nos fijamos en la tabla el nmero 52,5 se encuentra contenido en el nmero 66 de la tabla.
Q1 1(n/4) = 1( 64/4 ) = 16
Q2 2 (n/4) = 2 (64/4) = 32
Q3 3 (n/4) =3 (64/4) = 48
Y se desprende directamente de la tabla de frecuencias absolutas que:
Q1 = 5
Q2 = (5+7) / 2 = 6
Q3 = 7
b - Los Deciles: Corresponden a los 9 valores que dividen a estos en 10 partes iguales es decir, al 10%, al
20%... y al 90%. Los Deciles se designan por D1, D2,..., D9
c- Los percentiles (Pn): son los noventa y nueve valores de la variable de una distribucin que la dividen
en cien partes iguales es decir, al 1%, al 2%... y al 99% de los datos. Los percentiles se designan por P1,
P2,... P99
P50 coincide con la mediana.
El percentil p (Pp) es un valor de la variable tal que el p% de la muestra est por debajo y el (100p) % est
sobre.
Al tener una tabla de frecuencias, el percentil de orden K (Pk) se calcula siguiendo los siguientes pasos:
En donde:
K = {1, 2, , 99}
n es el nmero de datos. Si es decimal se aproxima al entero ms cercano superior.
Buscamos este valor en la columna de la frecuencia acumulada. El cul es el primer valor de x cuya
frecuencia acumulada sobrepasa el resultado de este clculo.
2 Luego, Para calcular el percentil Pk correspondiente al k% de los datos se puede utilizar la siguiente
frmula:
Donde:
Propiedades:
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es relativamente sencilla
de calcular, pero esta simplicidad tiene un inconveniente: Desde el punto de vista geomtrico, la distancia que
induce la desviacin media en el espacio de observaciones no es la natural (no permite definir ngulos entre
dos conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer
inferencia a la poblacin.
Cuando mayor sea el valor de la desviacin media, mayor es la dispersin de los datos. Sin embargo, no
proporciona una relacin matemtica precisa entre su magnitud y la posicin de un dato dentro de una
distribucin. La desviacin media al tomar los valores absolutos mide una observacin sin mostrar si la misma
est por encima o por debajo de la media aritmtica.
Mtodos de clculo
Se emplea la ecuacin:
Ejemplo ilustrativo:
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18
Solucin:
Se calcula la media aritmtica.
Se emplea la ecuacin:
Ejemplo ilustrativo: Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones de un
estudiante en 12 asignaturas evaluadas sobre 10.
Solucin:
Se calcula la media aritmtica.
Se emplea la ecuacin:
Solucin:
Para calcular la media aritmtica se llena la siguiente tabla:
La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica, es
decir, es el promedio de las desviaciones de la media elevadas al cuadrado. La desviacin estndar o
desviacin tpica es la raz de la varianza.
La varianza y la desviacin estndar proporcionan una medida sobre el punto hasta el cual se dispersan las
observaciones alrededor de su media aritmtica.
Propiedades:
- La varianza y desviacin estndar (o cualquier otra medida de dispersin) indican el grado en que estn
dispersos los datos en una distribucin. A mayor medida, mayor dispersin.
- La varianza es un nmero muy grande con respecto a las observaciones, por lo que con frecuencia se vuelve
difcil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza siempre se expresa en trminos de los
datos originales elevados al cuadrado, se obtiene unidades de medida de los datos que no tiene sentido
o interpretacin lgica. Por ejemplo, si se calcula la varianza de una distribucin de datos medidos en metros,
segundos, dlares, etc, se obtendr una varianza mediada en metros cuadrados, segundos cuadrados, dlares
cuadrados, respectivamente, unidades de medida que no tienen significado lgico respecto a los datos
originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la raz cuadrada de la misma, es
decir, se calcula la desviacin estndar, la cual es un nmero pequeo expresado en unidades de los datos
originales y que tiene un significado lgico respeto a los mismos.
A pesar de lo anterior, es difcil describir exactamente qu es lo que mide la desviacin estndar. Sin embargo,
hay un resultado til, que lleva el nombre del matemtico ruso Pafnuty Lvovich Chebyshev, y se aplica a todos
los conjuntos de datos. Este teorema de Chebyshev establece que para todo conjunto de datos, por lo menos
1- 1/k2 de las observaciones estn dentro de k desviaciones estndar de la media, en donde k es cualquier
nmero mayor que 1. Este teorema se expresa de la siguiente manera:
As por ejemplo, si se forma una distribucin de datos con k =3 desviaciones estndar por debajo de la
media hasta 3 desviaciones estndar por encima de la media, entonces por lo menos
Notas:
1) Para el clculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a que se tiene n-1
grados de libertad en la muestra. Otra razn por la que se divide por n-1 es debido a que una muestra
generalmente est un poco menos dispersa que la poblacin de la cual se tom. Al dividir para n-1 en lugar de
N se cumple con la tendencia y sentido lgico de que la varianza y desviacin estndar de la muestra deben
tener un valor ms pequeo que la varianza y desviacin estndar de la poblacin.
Ejemplo ilustrativo N 1
Considere que los siguientes datos corresponden al sueldo de una poblacin: $350, $400, $500, $700 y $1000