You are on page 1of 12

ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 1 ESTADÍSTICA DESCRIPTIVA E.S.A.E.

GESTIÓN 2017 2

ANALISIS DESCRIPTIVO DE DATOS CUANTITATIVOS marca de clase xi y frecuencias absolutas fa1 + fa2 + ... + fak se define:
k

ESTADÍGRAFO.- Medida resumen que describe una característica de una muestra. x i f ak


x1 f a1 x2 f a 2 x3 f a3 ... x k f ak i 1
X = M(x) =
n n
En este capítulo veremos dos tipos de Estadígrafos: Los estadígrafos de posición y los de dispersión.
Estos últimos se tratarán en el siguiente tema
EJEMPLO La estatura de 50 niños de segundo básico de varios paralelos se midió en centímetros y fue
clasificada de la siguiente manera:
ESTADÍGRAFOS DE POSICION Son estadígrafos que describen la posición que ocupan en la
distribución de frecuencias respecto a un valor de la variable. Entre estos se puede distinguir:
Estatura (cm.) fai xi
91 - 93 4 92
a) ESTADÍGRAFOS DE TENDENCIA CENTRAL Son estadígrafos cuyos valores
tienden a ocupar posiciones centrales o intervalos intermedios entre el menor y mayor valor del 93 - 95 11 94
conjunto de datos. Estos estadígrafos brindan alguna información sobre el centro de la distribución. 95 97 20 96
Entre estos se tiene a la Media aritmética, la Mediana, la Media geométrica, la Media armónica, y la 97 - 99 9 98
Media cuadrática. En este curso sólo se verá los dos primeros. 99 - 101 6 100
50
b) ESTADÍGRAFOS DE LOCALIZACIÓN Son estadígrafos que señalan la localización
de los valores más frecuentes o de los valores extremos, entre estos se tienen a la Moda y a los ¿Cuál es la estatura promedio de un niño de segundo básico?
Cuantiles o Fractilas.
SOLUCIÓN Se pide la media aritmética de las estaturas de los niños de segundo básico, entonces, la
a) ESTADÍGRAFOS DE TENDENCIA CENTRAL variable es:
X = Estatura de niños de segundo básico
a.1 LA MEDIA ARITMETICA (X)
M(x) = xifi
Recibe este nombre por que es el valor central de una progresión aritmética con un número impar de n
términos. Se denota por X o por M(x), en el caso de una muestra. M(x) = 92*4 + 94*11 + 96*20 + 98*9 + 100*6 = 4804 = 96.08 cm
50 50
PARA DATOS NO AGRUPADOS Se define como la suma de todos los valores observados, entre el
número de observaciones; es decir: Entonces la estatura promedio de los 50 niños es de 96 cm. Podría decirse también, que un niño
representativo de esa muestra mediría 96 cm.
n
xi MEDIA POBLACIONAL La media poblacional no se diferencia mucho de la definición de la media
X1 X2 X 3 ... X N i 1 muestral, salvo en su notación y en que el número de valores (N) corresponde
X = M(x) =
n n a toda la población, y se define por:

EJEMPLO: 5 niños son consultados sobre el número de dulces que chupan al día, la respuesta es la k
siguiente: 5, 3, 6, 7, 2. Cuál es el promedio de dulces que cada niño chupa? xi f k
x1 f1 x2 f 2 x3 f 3 ... x k f k i 1
=
SOLUCIÓN. Se está pidiendo hallar la media aritmética de los dulces, luego la variable es: X= Número N N
de dulces chupados al día
PROPIEDADES DE LA MEDIA ARITMETICA
X = M(x) =
1ª Propiedad La media de una constante es la misma constante:
Esto quiere decir, que se espera que cada niño chupe 5 dulces por día; o también que si todos los
dulces se repartieran equitativamente, cada niño tendría 5 dulces para chupar por día. M(b) = b

PARA DATOS AGRUPADOS La media aritmética, para datos agrupados en k intervalos, con Esto quiere decir, que si todos los valores observados de la muestra son iguales (no varían), la media
es el valor común.

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 3 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 4

SOLUCION El nuevo recreo (yi), es el anterior multiplicado por 2.


EJEMPLO Si los 20 niños de un prekinder tienen 6 años, ¿Cuál es la edad promedio?. y1 =2*x1 o sea y1 = 2*2 = 4
y2 =2*x2 " " y2 = 2*3 = 6
SOLUCION Como todos los niños tienen la misma edad, el promedio de las edades será también y3 =2*x3 " " y3 = 2*1,5 = 3
6 años. Es decir: x1 = 6; x2 = 6; ... x20 = 6. y4 =2*x4 " " y4 = 2*2,5 = 5
Luego M(xi) = M(6) = 6 y5 =2*x5 " " y5 = 2* 5 = 10

2ª Propiedad La media de una variable sumada o restada en un valor constante, es igual a la media de la Podemos hallar el nuevo recreo promedio a través de los nuevos recreos, pero es más sencillo
variable sumada o restada por dicho valor constante: aplicando la propiedad:

M(x + b) = M(x) + b M(yi) =M(2*xi) = 2*M(xi) = 2*2,8 = 5,6

Esto significa que si a cada valor de las observaciones (xi) se le suma o resta un mismo valor (b), la Es decir, cuando se duplica a cada niño el recreo, también se duplica el promedio (Bs.5,6).
media aritmética de la nueva variable yi = xi + b, es igual a la media aritmética del conjunto original
sumada o restada por el valor constante.
4ª Propiedad Una combinación de las dos propiedades anteriores es:
EJEMPLO Si el recreo, en Bs., recibido por 5 niños es el siguiente: x1 = 2; x2 = 3; x3 = 1,5; x4 =
2,5; x5 = 5 entonces el promedio de recreo recibido es Bs.2,8 Cuál sería el nuevo M(cx + b) = cM(x) + b
recreo promedio que recibirían los niños, si sus papás les aumentan a todos Bs.1?
EJEMPLO Con los datos del ejemplo de la segunda propiedad podemos calcular el nuevo recreo
SOLUCION El nuevo recreo (yi), es el anterior más Bs.1: promedio si a cada niño sus padres les duplican el recreo, y además les aumentan
y1 = x1 + 1 o sea y1 = 2 + 1 = 3 Bs.0,5.
y2 = x2 + 1 " " y2 = 3 + 1 = 4
y3 = x3 + 1 " " y3 = 1,5 + 1 = 2,5 SOLUCION El nuevo recreo (yi), es el anterior multiplicado por 2 más 0,5:
y4 = x4 + 1 " " y4 = 2,5 + 1 = 3,5 y1 =2*x1 + 0,5 o sea y1 = 2*2 + 0,5 = 4,5
y5 = x5 + 1 " " y5 = 5 + 1 = 6 y2 =2*x2 + 0,5 " " y2 = 2*3 + 0,5 = 6,5
y3 =2*x3 + 0,5 " " y3 = 2*1,5 + 0,5 = 3,5
El nuevo recreo promedio podría hallarse calculando la media aritmética de la nueva variable y i , y4 =2*x4 + 0,5 " " y4 = 2*2,5 + 0,5 = 5,5
pero es muy moroso cuando el número de datos es grande. Entonces, haciendo uso de la propiedad y5 =2*x5 + 0,5 " " y5 = 2* 5 + 0,5 = 10,5
tenemos:
Aunque puede hallarse el nuevo recreo promedio a través de los nuevos recreos, es más sencillo
M(yi) = M(xi + 1) = M(xi) + 1 = 2,8 + 1 = 3,8 aplicando la propiedad:

Entonces el nuevo recreo promedio es el anterior aumentado en Bs.1 (Bs.3,8). M(yi) =M(2*xi + 0,5) = 2*M(xi) + 0,5 = 2*2,8 + 0,5 = 6,1

3ª Propiedad La media aritmética de una variable multiplicada por una constante distinta de cero, es igual Es decir, cuando se duplica a cada niño el recreo y además se aumenta un monto fijo (Bs.0,5),
a la media de la variable multiplicada por la constante: también se duplica el promedio y se incrementa en el monto fijo (Bs.6,1).
5º La suma algebraica de las desviaciones (di) de cada valor observado xi, con respecto a su media es
M(cx) = cM(x) donde c 0 cero:
di= (xi x) = 0
En otras palabras, si cada valor de un conjunto de datos (xi) es multiplicado por un mismo número
distinto a cero (c 0), la media aritmética del nuevo conjunto de datos yi =c*xi es igual a la media Es decir, las diferencias de valor que presentan cada una de las observaciones respecto al promedio,
aritmética del conjunto original multiplicada por el valor constante. el forma conjunta deben anularse.

EJEMPLO Tomando en cuenta los datos del ejemplo anterior, si a todos los niños sus padres les EJEMPLO Tomando en cuenta los datos del ejemplo de la segunda propiedad, podemos hallar
duplican el recreo, cuál es el nuevo recreo promedio? las desviaciones de cada uno de los recreos respecto al recreo promedio y comprobar
cuanto da la suma de éstas.

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 5 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 6

b) Si el siguiente mes se contratarán 50 nuevos empleados con un salario promedio de


SOLUCION M(xi) = 2,8 $220, cuál será el salario promedio mensual de un trabajador de la fábrica?
d1 =x1 - 2,8 o sea d1 = 2 - 2,8 = - 0,8
d2 =x2 - 2,8 " " d2 = 3 - 2,8 = + 0,2 SOLUCION a) Se pide hallar el salario promedio global de los empleados de la fábrica, en base a
d3 =x3 - 2,8 " " d3 = 1,5 - 2,8 = - 1,3 dos submuestras:
d4 =x4 - 2,8 " " d4 = 2,5 - 2,8 = - 0,3
d5 =x5 - 2,8 " " d5 = 5 - 2,8 = + 2,2 La de varones de tamaño fa1 = 100 con x1 = 250 y la de mujeres de tamaño fa2 = 200 con x2
= 240. Entonces la media global se halla de la sgte. manera:
Luego la suma de las desviaciones es:
di = (xi x) = (xi - 2,8) = - 0,8 + 0,2 - 1,3 - 0,3 + 2,2 = 0 x = M(x) = xifi = x1f1 + x2f2 = 250*100 + 240*200
fi f1 + f2 100 + 200

6ª Propiedad La media de la suma o resta de dos variables realizadas a un mismo número de x = 73000 = 243,33 Es decir, el salario promedio mensual de un empleado cualquiera
observaciones, medidas ambas en la misma unidad, es igual a la suma o resta de las medias de las 300 es de $243,33.
variables originales:
b) Se está pidiendo hallar el nuevo salario promedio global del siguiente mes cuando
M(x + y) = M(x) + M(y) ingresen a trabajar nuevos empleados con un menor salario promedio global,
entonces también se tiene dos submuestras:
EJEMPLO Una muestra 6 parejas de recién casados nos proporciona el promedio de años
estudiados por las señoras M(x) = 13 como por los caballeros M(y) = 17 Cuál será el La de empleados antiguos de tamaño f1 = 300 con x1=243,33 y la se empleados nuevos de
promedio de años estudiados por matrimonio? tamaño f2 = 50 con x2 = 240:

SOLUCION Se está pidiendo hallar el promedio de los años estudiados por pareja, es decir, x = M(x) = 243,33*300 + 240*50 = 84999 = 242,85
cuantos años en total ha estudiado cada pareja. Si se tuvieran los datos originales, se 300 + 50 300
puede hallar este promedio, sumando los años de estudio de la esposa con la del
esposo, y luego hallar el promedio de la nueva variable "años estudiados por pareja"; En consecuencia, el siguiente mes, el salario promedio será de $242,85.
pero como no se cuenta con los datos originales, se debe aplicar la propiedad
mencionada: VENTAJAS DE LA MEDIA ARITMETICA

M(x + y) = M(x) + M(y) = 13 + 17 = 30. 1. Es un concepto familiar a la mayoría de las personas.


2. Es una medida que puede ser calculada y es única.
Es decir, el promedio de años estudiado por cada pareja es de 30 años. 3. En su calculo intervienen todas las observaciones.

DESVENTAJAS DE LA MEDIA ARITMETICA


MEDIA GLOBAL Considérese muestras de tamaños fa1; fa2; ... ; fak de una población (o de K poblaciones
diferentes) a las que les corresponde medias aritméticas x1, x2,...,xk respectivamente, 1. Se ve afectada por valores extremos. O sea da información distorsiona cuando existen valores muy
entonces la media de toda la población, o la MEDIA GLOBAL, de tamaño pequeños o muy grandes respecto al resto de las observaciones.
fa1+fa2+...+fak es: 2. No puede calcularse en datos agrupados que incluyan intervalos abiertos, debido a que es imposible
k
hallar la marca de clase.
xi f ak
x1 f a1 x2 f a 2 x3 f a 3 ... x k f ak i 1
X = M(x) =
n n

EJEMPLO El salario promedio mensual de 100 empleados varones, de una fábrica, es de $250, y el
salario promedio mensual de 200 empleadas, de la misma fábrica, es de $240.

a) Cuál es el salario promedio mensual de un trabajador cualquiera de la fábrica?

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 7 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 8

A.2 LA MEDIANA (Me).


EJEMPLO Hallar el número mediano de visitas que 50 personas realizan al médico por año,
Dado un conjunto de n observaciones ORDENADOS: x1, x2, ... ,xn la mediana es el valor que no cuya distribución de frecuencias está en la tabla siguiente.
supera a más de la mitad de las observaciones, ni es superado por más de la mitad.
SOLUCION DATOS
PARA DATOS NO AGRUPADOS Nº de visitas fi Fi n/2 = 50/2 = 25
20 40 6 6 Fj = 45
- Si el número de observaciones es impar: La mediana es el valor de la observación que ocupa el valor 40 70 18 24 Fj-1 = 24
central. 70 90 21 45 Clase donde esta Me cj = 20
Me = x(n+1)/2 90 100 5 50 Fj = 21
50 Li = 70
EJEMPLO Hallar el valor de la mediana de las siguientes observaciones: 7, 3, 5, 9, 1
Me = 70 + 20 (25 - 24) = 70 + 0,95 = 70,95 71
SOLUCION Primero se ordenan los valores observados (en orden ascendente o descendente) y 21
se elige el valor central: El número mediano de visitas al médico es 71 visitas. Es decir, no más de 25 personas realizan menos
de 71 visitas, ni más de 25 personas realizan más de 71 visitas.
1, 3, 5, 9, 1 luego Me = 5
VENTAJAS DE LA MEDIANA
- Si el número de observaciones es par: La mediana es el promedio de los valores de la dos
observaciones centrales. 1. Es más fácil de entender y puede ser calculada a partir de cualquier clase de datos.
Me = xn/2 + x(n/2)+1 2. Está afectada por el número de observaciones y no por la magnitud de cualquier valor.
2 3. No es afectada por valores extremos como la media, pues en su cálculo no intervienen todos los
valores
EJEMPLO Hallar el valor de la mediana de las siguientes observaciones: 17, 3, 8, 15, 6, 10
DESVENTAJAS DE LA MEDIANA
SOLUCION
1º ordenar los valores observados: 3, 6, 8, 10, 15, 17 1. Antes de realizar su cálculo, primero deben organizarse los datos.
2º se elige los dos valores centrales y se los promedia: 2. En algunos casos solo puede ser calculada aproximadamente, por ejemplo cuando el número de
observaciones es par, la mediana es el punto medio de las dos observaciones centrales (punto que no
Me = 8 + 10 = 18 = 9 Nótese que este valor mediano es aproximado pues en las existe en las observaciones)
2 2 observaciones, no hay ningún valor igual a 9. 3. No está definida algebraicamente como la media, por lo que no se presta al manejo algebraico.

MEDIANA PARA DATOS AGRUPADOS O DISTRIBUCIÓN DE FRECUENCIAS B) ESTADIGRAFOS DE LOCALIZACION


La mediana para valores agrupados se calcula mediante la siguiente expresión: B.1 MODA (Mo). La Moda, muchas veces, es considerada también, un estadígrafo de tendencia central,
en especial en distribuciones simétricas o poco asimétricas.
Me = Li + cj (n/2 Fa j-1)
fa i La Moda Es el valor de la variable que se presenta con mayor frecuencia, es decir, es el valor que
Donde: más se repite.
Li = límite inferior de la clase mediana
cj = ancho de clase donde se halla la mediana Solo se observa cuál de los valores se repite más. Entonces puede no existir moda, o si existe 1 moda
n = número de observaciones la distribución es unimodal; si existen 2 modas, la distribución es bimodal
Fa j-1= Frecuencia absoluta acumulada anterior a la clase mediana
fa i = frecuencia absoluta de la clase mediana EJEMPLOS Hallar la moda(s) si es que existe(n) de las siguientes observaciones del número de
Fa j = Frecuencia acumulada donde se encuentra la mediana. La frecuencia acumulada que hermanos que se hizo a tres alumnos:
supera por primera vez (o es igual) a n/2, es la clase mediana

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 9 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 10

a) 1,5,8,3,6,9 No existe moda 2. No está afectada por valores extremos porque en su cálculo no intervienen todas las observaciones
b) 4, 5, 3, 2, 1, 5, 6, 5 Mo = 5 3. Puede calcularse aunque la distribución de frecuencias incluya intervalos abiertos.
c) 6, 3, 4, 3, 1, 6, 2, 3, 6, 7 Mo1=3 ; Mo2=6
DESVENTAJAS DE LA MODA

PARA DATOS AGRUPADOS 1. Estrictamente hablando, la verdadera moda de un conjunto de datos continuos no existe, debido a
que los valores de las observaciones, antes del redondeo, muy rara vez son iguales.
Cuando las observaciones ya están agrupadas y distribuidas en tabla de frecuencias, la moda puede 2. Cuando existe más de una moda, estas son difíciles de interpretar y comparar.
determinarse de la siguiente manera:

Para anchos de clase iguales: RELACIONES ENTRE MEDIA, MEDIANA Y MODA.

Mo = Li + c fa max - fa ant = Li + c 1
La utilización ya sea de la media, mediana y moda, no debe realizarse sin considerar a las demás,
(fa max fa ant) + (fa max fa sgt) 1 + 2
pues aunque son medidas que indican distintos aspectos, están relacionadas entre sí.

Donde: - Cuando la distribución es simétrica, la representación gráfica es acampanada y unimodal; en este


Li = Límite inferior de la clase modal (clase de mayor altura) caso, los valores de la media, mediana y moda coinciden: M(x) = Me = Mo
c = ancho de clase de la distribución
fa max = Frecuencia absoluta de la clase modal (frec máxima)
fa ant = Frecuencia absoluta de la clase anterior a la frec máxima
fa sgt = Frecuencia absoluta de la clase siguiente a la frec máxima
1 = fa max - fa ant
2 = fa max fa sgt

EJEMPLO La siguiente distribución de frecuencias, muestra la clasificación de 500 libros de


una biblioteca, por antigüedad:
Mo < Me < M(x) M(x) > Me > Mo
Antigüedad(años) 20-25 25-30 30-35 35-40 40-45 45-50 Si la distribución es asimétrica a derecha Si la distribución es asimétrica a izquierda.
Nº de libros 40 80 95 100 75 60
- Cuando la distribución es asimétrica, pero tiene forma acampanada y es unimodal, las tres medidas
Cuál es la antigüedad modal de esos libros? tienen valores distintos, siendo la Mediana el valor entre la media y la moda.

SOLUCION Como todos los anchos de clase son iguales, la clase modal, es aquella que tiene la - Si la distribución es moderamente asimétrica y unimodal,se cumple:
mayor frecuencia absoluta, o sea la tercera. Una vez determinada la clase modal, se
procede a su calculo. M(x) - Mo 3 (M(x) -Me)

Mo = 35 + 5 (100-95) = 35 + 5 5 = 35 + 0,83 =35,83 Esta relación permite encontrar el valor de la media aritmética por aproximación cuando las distribuciones
(100-95)+(100-75) 5+25 de frecuencias incluyen intervalos abiertos.

Es decir, la antigüedad más común es 35,83 años.


B.2 CUANTILES

VENTAJAS DE LA MODA Los cuantiles llamados también fractiles o fractilas, son estadígrafos que describen el
comportamiento de una población; sus valores dividen a un conjunto de datos ORDENADOS en partes
1. Puede utilizarse como una medida de localización tanto para datos cualitativos como para iguales y se dan frecuentemente en tanto por ciento. Los cuantiles pueden ser:
cuantitativos

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 11 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 12

b.2.1 CUARTILES novena posición de los datos.


Son valores que dividen a un conjunto de datos ordenados (en forma ascendente o descendente) en
cuatro partes iguales y se denotan por: Qi i=1,2,3 Este valor quiere decir, que no más de la tres cuartas partes de los datos son menores a 18
días, y no más de un cuarto de los datos son mayores a 18 días.
Primer Cuartil: Q1 Es el valor que supera a no más de un cuarto de las observaciones y es superado
por no más de 3/4 de ellas. Dicho de otro modo, es el valor que deja 25% de las observaciones EJEMPLO En la misma empresa anterior, se registran el siguiente mes 13 días con llamadas de
menores o iguales a él y el 75% superiores a él. larga distancia por pagar. Hallar Q1 y Q3 para las 12 observaciones.

Segundo Cuartil: Q2 Es el valor que supera a no más de la mitad de las observaciones y es superado SOLUCION
por no más de la mitad de ellas. Este valor por definición, coincide con la mediana: Q2 = Me
1º Ordenamos las observaciones:
Tercer Cuartil: Q3 Es el valor que supera a no más de 3/4 de las observaciones y es superado por
no más de 1/4 de ellas. Dicho de otro modo, es el valor que deja 75% de las observaciones menores 5, 6, 7, 10, 11, 12, 13, 15, 17, 18, 20, 21
o iguales a él y el 25% superiores a él.
2º Se localiza el punto de posición del valor correspondiente a los cuartiles 1 y 3. Debe tenerse
PARA DATOS NO AGRUPADOS en cuenta que ahora existe una observación más (n=12)

Qi = X i(n+1) Si i(n+1)/4 es entero, entonces Qi es el valor de la observación que Qi = X i(n+1)


4 corresponde a esa posición. 4
Si i(n+1)/4 no es entero, se hace una interpolación lineal entre los dos valores correspondientes entre
las cuales se encuentra la fracción (o decimal). a) Para Q1 = x 1(12+1)/4 = x 13/4 = x3,25 Este valor no es entero, entonces se debe hacer
una interpolación entre la observación tercera y la cuarta.
EJEMPLO En una empresa se registran llamadas de larga distancia por pagar y en once meses
se contabilizó los días que se realizaron estas llamadas: 6, 18, 11, 7, 17, 10, 21, 5, 20, Es decir, la posición 3,25 indica que el valor de Q1 es el tercer dato más 0,25 de la diferencia
15 y 12. Hallar Q1 y Q3. entre el tercero y el cuarto:

SOLUCION Para hallar cualesquiera de los cuantiles se debe realizar los siguientes pasos: Q1 = 7 + (10-7)(0,25) = 7 + 0,75 =7,75

1º Se ordenan las observaciones. En este ejemplo: Este valor quiere decir, que no más del 25% de los datos son menores a 7,75 días y no más
del 75% de los datos son mayores a 7,75 días
5, 6, 7, 10, 11, 12, 15, 17, 18, 20, 21
a) Para Q3 = x 3(12+1)/4 = x 3(13/4) = x9,75 Este valor no es entero, entonces se debe hacer
2º Se localiza el punto de posición del valor correspondiente al cuantil. En este caso a los una interpolación entre la observación novena y décima.
cuartiles
Es decir, la posición 9,75 indica que el valor de Q3 es el noveno dato más 0,75 de la diferencia
Qi = X i(n+1) entre el noveno y el décimo:
4
Q1 = 7 + (10-7)(0,25) = 7 + 0,75 =7,75
a) Para Q1 = x 1(11+1)/4 = x 12/4 = x3 Como este valor es entero, el cuartil uno es el valor
que corresponde a la tercera posición, es decir: Q1 = 7, pues 7 ocupa la tercera Este valor quiere decir, que no más del 25% de los datos son menores a 7,75 días y no más
posición de los datos. del 75% de los datos son mayores a 7,75 días

Este valor quiere decir, que no más de la cuarta parte de los datos son menores a 7 días, y no PARA DATOS AGRUPADOS
más de las tres cuartas partes de los datos son mayores a 7 días.
Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los cuartiles se
b) Para Q3 = x 3(11+1)/4 = x 3(12/4) = x3(3) = x9 Como este valor es entero, el cuartil uno es determina mediante la siguiente expresión:
el valor que corresponde a la novena posición, es decir: Q3 = 18, pues 18 ocupa la

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 13 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 14

Qi = Linf + cj (in/4 Fa j-1) desde i=1,2,3 Q3= 100 + 10 (37,5 - 24) = 100 + 10(13,5) = 100+6,43 = 106,43
fa i 21 21
Donde:
Linf= límite inferior de la clase cuartil El valor de Q3= 106,43 indica que no más del 75% de los estudiantes tiene un C.I. menor a
cj = ancho de clase donde se halla el cuartil 106,43 y no más del 75% de los estudiantes tienen un C.I. mayor a 106,43.
n = número de observaciones
Fa j-1= Frecuencia absoluta acumulada anterior a la clase cuartil
fa j = frecuencia absoluta de la clase cuartil B.2.2 DECILES
Fj= Frecuencia acumulada donde se encuentra el cuartil. La frecuencia acumulada que
supera por primera vez (o es igual) a i(n/4), es la clase cuartil Son valores que dividen a un conjunto de datos ordenados (en forma ascendente o descendente) en
10 partes iguales, se representa por: Di i= 1, 2, 3, 4, 5, 6, 7, 8, 9

EJEMPLO Hallar Q1 y Q3 de 50 estudiantes cuyo coeficiente intelectual está distribuido en la Primer Decil D1 es el valor que supera a no más de un décimo de las observaciones y es superado
tabla siguiente. por no más de nueve décimos de ellas.

SOLUCION Segundo Decil D2 es el valor que supera a no más de dos décimos de las observaciones y es superado
por no más de ocho décimos de ellas.
C.I. fa i Fi
80 90 6 6 ...
90 100 18 24
100 110 21 45 Noveno Decil D9 es el valor que supera a no más de nueve décimos de las observaciones y es
110 120 5 50 superado por no más de un décimo de ellas.
50
PARA DATOS NO AGRUPADOS
Para Q1 se determina:
Di = X i(n+1) Si i(n+1)/10 es entero, entonces Di es el valor de la observación que corresponde
1º i(n/4) = 1(50/4) = 12,5 10 que corresponde a esa posición.
2º Se determina Fa j que supera por primera vez a la mitad de los datos (12,5), luego Fa j =24
entonces Fa j-1= 6 Si i(n+1)/10 no es entero, se hace una interpolación lineal entre los dos valores correspondientes
3º Luego la clase cuartil buscada es la segunda; luego el límite inferior de esta clase es L inf = entre las cuales se encuentra la fracción (o decimal).
90; el ancho de clase es cj=10, y la frecuencia absoluta de la clase cuartil es fa i=18.
4º Se calcula el cuartil pedido: PARA DATOS AGRUPADOS

Q1 = 90 + 10 (12,5 - 6) =90 + 10 (6,5) =90 + 3,61 = 93,61 Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los deciles se
18 18 determina mediante la siguiente expresión:

El valor de Q1= 93,61 indica que no más del 25% de los estudiantes tiene un C.I. menor a Di = Linf + cj (in/10 Fa j-1) desde i=1,2,..., 9
93,61 y no más del 75% de los estudiantes tienen un C.I. mayor a 93,61. fa j
Donde:
Para Q3 se determina: Linf= límite inferior de la clase decil
cj = ancho de clase donde se halla el decil
1º i(n/4) = 3(50/4) = 37,5 n = número de observaciones
2º Se determina Fj que supera por primera vez a 37,5: Fa j = 45 entonces Fa j-1= 24 Fa j-1= Frecuencia absoluta acumulada anterior a la clase decil
3º Luego la clase cuartil buscada es el tercero; luego el límite inferior de esta clase es Linf=100; fa j = frecuencia absoluta de la clase decil
el ancho de clase es cj=10, y la frecuencia absoluta de la clase cuartil es fa j=21. Fa j= Frecuencia acumulada donde se encuentra el decil. La frecuencia acumulada que
4º Se calcula el cuartil pedido: supera por primera vez (o es igual) a i(n/10), es la clase decil.

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 15 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 16

B.2.3 PERCENTILES ESTADIGRAFOS DE DISPERSION

Son valores que dividen a un conjunto de datos ordenados (en forma ascendente o descendente) en Los estadígrafos de dispersión miden la variabilidad de los datos respecto a los estadígrafos de
100 partes iguales, se representa por: Pi i= 1, 2, ... , 99 posición central, es decir, miden cuán dispersos están respecto a la M(x), Me ó Mo.

Primer Percentil P1 es el valor que supera a no más de un céntimo de las observaciones y es Un estadígrafo de dispersión puede ser usado como complemento de un promedio para describir un
superado por no más de 99/100 de ellas. conjunto de datos o para comparar dos o más conjuntos de datos. Cuando la dispersión es alta, el promedio
tiene poco o ningún significado, mientras cuando la dispersión es baja, el valor del promedio se vuelve
Segundo Percentil P2 es el valor que supera a no más de 2/100 de las observaciones y es superado altamente significativo.
por no más de 8/100 de ellas.
Los estadígrafos de dispersión pueden ser absolutos o relativos.
...
A) ESTADIGRAFOS DE DISPERSION ABSOLUTA
Nonagésimo Noveno Percentil P99 es el valor que supera a no más de 99/100 de las observaciones
y es superado por no más de 1/100 de ellas. a.1) RECORRIDO o RANGO

El término percentil se emplea para indicar el valor por debajo del cual está situado un cierto El recorrido es la diferencia entre el valor mayor de las observaciones menos el menor valor de las
porcentaje de la distribución de valores observados. mismas:

Por ejemplo, si el percentil 35 de los sueldos de un grupo de trabajadores es Bs.270,5 (P30=270,5) R = xmax - xmin
significa que el 30 % de los trabajadores tiene un sueldo inferior a Bs.270,5
Esta medida da idea respecto a los valores entre los que se encuentran las observaciones. Si el rango
PARA DATOS NO AGRUPADOS de una distribución es mayor que otra, debe esperarse que la dispersión de los datos sea mayor que la otra.
Sin embargo, muchas veces el Rango no es una medida adecuada de dispersión, porque sólo considera los
Pi = X i(n+1) Si i(n+1)/100 es entero, entonces Pi es el valor de la observación que corresponde valores extremos, sin considerar el número de observaciones que puede existir entre esos valores, ni los
100 a esa posición. valores intermedios.

Si i(n+1)/100 no es entero, se hace una interpolación lineal entre los dos valores correspondientes EJEMPLO Sean los valores de dos conjuntos de observaciones:
entre las cuales se encuentra la fracción (o decimal).
A) 5, 5, 6, 6, 6, 7, 7, 7, 7, 15, 15
PARA DATOS AGRUPADOS B) 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15

Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los percentiles se Mediante el recorrido, indique cuál distribución tiene mayor dispersión.
determina mediante la siguiente expresión:
SOLUCION En este ejemplo, el rango nos proporciona el mismo valor, R = 15-5 = 10; pero a
Pi = Linf + cj (in/100 Fa j-1) desde i=1,2,...,99 simple vista se nota que la segunda distribución tiene mayor dispersión.
fa j
Donde: Aunque esta medida de dispersión no es muy utilizada, por las inconveniencias señaladas, se usa
Linf= límite inferior de la clase percentil mucho en Meteorología, para indicar temperaturas máximas y mínimas.
cj = ancho de clase donde se halla el percentil
n = número de observaciones Dada la limitación del Rango, se recurre a otra medida de dispersión absoluta: El Recorrido
Fa j-1= Frecuencia absoluta acumulada anterior a la clase percentil Intercuartílico.
fa j = frecuencia absoluta de la clase percentil
Fa j= Frecuencia acumulada donde se encuentra el percentil. La frecuencia acumulada que
supera por primera vez (o es igual) a i(n/100), es la clase percentil a.2) EL RECORRIDO INTERCUARTILICO

Esta medida de dispersión, trata de corregir, las deficiencias del Rango, y para evitar tomar sólo los

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 17 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 18

valores extremos, esta medida considera al 50% de los valores centrales de las observaciones: El recorrido M(x) = (5+7+8+4)/4 = 24/4 = 6
intercuartílicos se define como:
2º Se hallan las desviaciones de cada una de las observaciones respecto a la media, en valor
RI = Q3 - Q1 absoluto

EJEMPLO Hallar el Recorrido intercuartílico de las observaciones del ejemplo anterior. 3º Se suman estas desviaciones y se divide entre el número de datos.

SOLUCION Ambas distribuciones, tienen 11 observaciones DM = |5-6| + |7-6| + |8-4| + |4-6| = 1 + 1 + 2 + 2 = 6 = 1,5
4 4 4
Q1 = x 1(11+1)/4 = x 12/4 = x3
Q3 = x 3(11+1)/4 = x 36/4 = x9 Este valor indica que la distancia promedio a la que están los datos, de la media, es 1,5. Si se tuviera
otros valores de otra observación, se podría indicar cuál tiene mayor dispersión entre sus datos, observando
Entonces en A) Q1 = 6 y Q3 = 7 Luego: RI = 7-6 = 1 el mayor valor de la DM.
en B) Q1 = 7 y Q3 = 13 Luego: RI =13-7 = 6
k
En consecuencia, la segunda distribución tiene mayor dispersión. xi X fi
PARA DATOS AGRUPADOS DM = i 1
Otra medida de dispersión que es más utilizada que la desviación cuartílica, es: n

EJEMPLO Hallar la DM de 50 estudiantes cuyo peso, en kilos, está distribuido en la tabla


a.3) DESVIACION CUARTILICA siguiente.

Este estadígrafo, considera no solo los valores de los cuartiles, sino el promedio de su diferencia. Es Pesos (Kg) 50-60 60-70 70-80 80-90
decir: Nº Estud. 6 18 21 5

Q3 Q1 SOLUCION
DC =
2 Pesos (kg) fa i xi xifa i xi - 70 xi - 70 fai
50 - 60 6 55 330 15 90
En este caso, también se considera una distribución más dispersa, cuanto mayor sea el valor de la 60 - 70 18 65 1170 5 90
desviación cuartílica. 70 - 80 21 75 1575 5 105
80 - 90 5 85 425 15 75
Sin embargo, estos dos últimos estadígrafos no consideran a todas las observaciones, entonces para 50 360
corregir esta deficiencia se recurre a:
M(x) = 3500/50 = 70
DM = 360/50 = 7,2
a.4) LA DESVIACION MEDIA
a.5) LA DESVIACION MEDIANA
La desviación media (DM) es la media aritmética de los valores absolutos de las observaciones o
marcas de clase con respecto a la media. La desviación mediana (DMe) es la media aritmética de los valores absolutos de las observaciones
n o marcas de clase con respecto a la mediana.
xi X n
PARA DATOS NO AGRUPADOS DM = i 1 xi Me
n
PARA DATOS NO AGRUPADOS DM = i 1
n
EJEMPLO Hallar la DM de las siguientes observaciones: 5, 7, 8, 4. k
xi Me f ai
i 1
SOLUCION 1º Se debe calcular la media aritmética: PARA DATOS AGRUPADOS DM =
n

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 19 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 20

a.6) LA VARIANZA 3ª Propiedad La varianza de una variable multiplicada por una constante distinta de cero, es igual a la
varianza de la variable multiplicada por el cuadrado de la constante:
Es la media aritmética de los cuadrados de las desviaciones de las observaciones con respecto a la
media aritmética. V(cx) = c2V(x) donde c = 0
V(x) = Sx2 = M [(x-X)2]
En otras palabras, si cada valor de un conjunto de datos (xi) es multiplicado por un mismo número
n
2
distinto a cero (c = 0), la variación del nuevo conjunto de datos yi =c*xi es igual a la varianza del
xi X conjunto original multiplicada por el cuadrado de la constante. O sea la dispersión se hace mucho
PARA DATOS NO AGRUPADOS: V(x) = i 1 más grande.
n

k
2 4ª Propiedad Una combinación de las dos propiedades anteriores es:
xi X f ai
i 1
PARA DATOS AGRUPADOS: V(x) = V(cx ± b) = c2V(x)
n

La varianza es una de dispersión utilizada más en Teoría Estadística (y no así en Estadística


5º Propiedad La varianza puede calcularse, también, mediante:
Descriptiva), debido a que tiene las unidades de la variable al cuadrado (muy difícil de interpretar). Sin
embargo permite definir otra medida de dispersión muy utilizada que es la Desviación Estándar, por esa
V(x) = M(x2) - [M(x)2]
razón, es importante conocer sus propiedades.
2
PROPIEDADES DE LA VARIANZA n n
xi 2 xi 2
1ª Propiedad La varianza de una constante es cero. V(b) = 0 Datos No Agrupados: V(x) = i 1 i 1
n n
Esto quiere decir, que si todos los valores observados de la muestra son iguales, no existe variación;
es decir los datos son completamente homogéneos.
n
EJEMPLO Si los 20 niños de un prekinder tienen 6 años, Cuál es la variación de las edades?. xi 2
i 1 2
O mucho mejor V(x) = X
SOLUCION Como todos los niños tienen la misma edad, el promedio de las edades será también n
6 años. Es decir: x1 = 6; x2 = 6; ... x20 = 6; o sea xi = 6
2
Luego M(xi) = M(6) = 6, entonces: k
2
k
2
xi f a i xi f a i
i 1 i 1
V(x) = (xi - 6)2 = (6-6)2 = 0 = 0 Datos Agrupados: V(x) =
n n
20 20 20

k
2ª Propiedad La varianza de una variable sumada o restada en un valor constante, es igual a la varianza de xi 2 f i
i 1 2
la variable: O mucho mejor: V(x) = X
n
V(x ± b) = V(x)

Esto significa que si a cada valor de las observaciones (xi) se le suma o resta un mismo valor (b), la VARIANZA GLOBAL
varianza de la nueva variable yi = xi ± b, es la misma; es decir, añadir o quitar una misma suma al
valor de cada observación, no modifica la dispersión del conjunto original. Considérese muestras de tamaños f1; f2; ... ; fk de una población (o de K poblaciones diferentes) a las
que les corresponde medias aritméticas x1, x2,...,xk respectivamente, siendo x la media global; y

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 21 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 22

varianzas V1, V2,...,Vk respectivamente entonces la Varianza de toda la población, o la VARIANZA igual a la desviación estándar de la variable multiplicada por la constante:
GLOBAL, de tamaño f1+f2+...+fk= n está dado por:
S(cx) = |c| S(x) donde c = 0
Varianza = Intervarianza + Intravarianza
4ª Una combinación de las dos propiedades anteriores es:
V(x) = V[M(xi)] + M[V(xi)]
k
2
k S(cx ± b) = |c| S(x)
xi X fa i Vi f a i
i 1 i 1
V(x) =
n n
INTERPRETACION DE LA DESVIACIÓN ESTÁNDAR
La varianza de un conjunto de submuestras puede deberse tanto a la variabilidad dentro de cada
Tanto la Varianza como la Desviación Estándar son las medidas más utilizadas, pero ninguna tiene
estrato como a la variabilidad entre los distintos estratos, es decir puede deberse a la intervarianza o a la
una interpretación intuitiva obvia, por sí sola. Sin embargo existe una regla empírica que describe la
intravarianza.
dispersión de una distribución casi simétrica:
INTERVARIANZA. Es el estadígrafo que representa la variabilidad entre las submuestras, se define como
Dada una distribución de tamaño suficientemente grande, casi simétrica y de forma
la Varianza entre las Medias de las submuestras.
aproximadamente a una campana, entonces se verifica:
INTRAVARIANZA. Es el estadígrafo que representa la variabilidad dentro de las submuestras, se define
Entre x-S y x+S se encuentra, aproximadamente, el 68% de las observaciones.
como la Media aritmética de las Varianzas de las submuestras
Entre x-2S y x+2S se encuentra, aproximadamente, el 95% de las observaciones.
Entre x-3S y x+3S se encuentra, aproximadamente, el 99% de las observaciones.
a.7) DESVIACION ESTANDAR Llamada también DESVIACION TIPICA, y se define como la raíz
cuadrada de la varianza. su símbolo es: x ó Sx
B) MEDIDAS DE DISPERSION RELATIVA.

x = Sx = Cuando se desea comparar la dispersión existente entre dos o más muestras de diferente tamaño, con
promedios distintos, surge la necesidad de contar con estadígrafos que no dependan de la magnitud de las
VENTAJAS DE LA DESVIACION ESTANDAR observaciones ni posean dimensión, para ello se recurre a estadígrafos de dispersión relativa que sólo
expresan la razón o la proporción entre dos estadígrafos.
1. Esta medida de dispersión es la más utilizada en Estadística Descriptiva debido a que sus unidades
de medidas son las mismas de las variables. Si una de las medidas de dispersión relativa es usada para describir un conjunto de datos, la misma
2. Está basada en cada uno de los valores de los datos; por tanto permite una mejor descripción de la medida debe ser usada en otro conjunto de datos para poder compararlos. Entre estos se tiene:
dispersión que sus similares: Rango, Recorrido intercuartílico; Desviación cuartílica y Desviación
media. b.1) COEFICIENTE DEL RECORRIDO C.R.
3. Es matemáticamente lógica porque su cálculo no desprecia los signos positivos (+) o negativos (-)
de las desviaciones individuales. C.R. = Rango
(xmax + x min) 2
PROPIEDADES DE LA DESVIACION ESTANDAR Son similares a las de la varianza.
b.2) COEFICIENTE DE LA DESVIACION MEDIA C.D.M.
1ª Propiedad La desviación estándar de una constante es cero. S(b) = 0
C.D.M.= DM
2ª Propiedad La desviación estándar de una variable sumada o restada en un valor constante, es igual a la M(x)
desviación estándar de la variable:
b.3) COEFICIENTE DE LA DESVIACION MEDIANA C.D.Me.
S(x ± b) = S(x)
C.D.Me.= DMe
3ª Propiedad La desviación estándar de una variable multiplicada por una constante distinta de cero, es Me

Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 23

b.4) COEFICIENTE DE VARIACION C.V.

C.V. =

Esta medida expresa el tanto por uno que representa la desviación estándar respecto a la media
aritmética. Esta medida es la más utilizada en Estadística Descriptiva, y también puede ser expresada en
porcentajes.

Para realizar comparaciones entre dos o más conjuntos de observaciones, la medida de dispersión
más pequeña indica menor dispersión entre los valores de sus observaciones, y cuanto más grande sea
respecto a otra, mayor dispersión entre los valores de las observaciones.

Lic. María de los Ángeles Ramos Boutier

You might also like