Professional Documents
Culture Documents
GESTIÓN 2017 2
ANALISIS DESCRIPTIVO DE DATOS CUANTITATIVOS marca de clase xi y frecuencias absolutas fa1 + fa2 + ... + fak se define:
k
EJEMPLO: 5 niños son consultados sobre el número de dulces que chupan al día, la respuesta es la k
siguiente: 5, 3, 6, 7, 2. Cuál es el promedio de dulces que cada niño chupa? xi f k
x1 f1 x2 f 2 x3 f 3 ... x k f k i 1
=
SOLUCIÓN. Se está pidiendo hallar la media aritmética de los dulces, luego la variable es: X= Número N N
de dulces chupados al día
PROPIEDADES DE LA MEDIA ARITMETICA
X = M(x) =
1ª Propiedad La media de una constante es la misma constante:
Esto quiere decir, que se espera que cada niño chupe 5 dulces por día; o también que si todos los
dulces se repartieran equitativamente, cada niño tendría 5 dulces para chupar por día. M(b) = b
PARA DATOS AGRUPADOS La media aritmética, para datos agrupados en k intervalos, con Esto quiere decir, que si todos los valores observados de la muestra son iguales (no varían), la media
es el valor común.
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 3 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 4
2ª Propiedad La media de una variable sumada o restada en un valor constante, es igual a la media de la Podemos hallar el nuevo recreo promedio a través de los nuevos recreos, pero es más sencillo
variable sumada o restada por dicho valor constante: aplicando la propiedad:
Esto significa que si a cada valor de las observaciones (xi) se le suma o resta un mismo valor (b), la Es decir, cuando se duplica a cada niño el recreo, también se duplica el promedio (Bs.5,6).
media aritmética de la nueva variable yi = xi + b, es igual a la media aritmética del conjunto original
sumada o restada por el valor constante.
4ª Propiedad Una combinación de las dos propiedades anteriores es:
EJEMPLO Si el recreo, en Bs., recibido por 5 niños es el siguiente: x1 = 2; x2 = 3; x3 = 1,5; x4 =
2,5; x5 = 5 entonces el promedio de recreo recibido es Bs.2,8 Cuál sería el nuevo M(cx + b) = cM(x) + b
recreo promedio que recibirían los niños, si sus papás les aumentan a todos Bs.1?
EJEMPLO Con los datos del ejemplo de la segunda propiedad podemos calcular el nuevo recreo
SOLUCION El nuevo recreo (yi), es el anterior más Bs.1: promedio si a cada niño sus padres les duplican el recreo, y además les aumentan
y1 = x1 + 1 o sea y1 = 2 + 1 = 3 Bs.0,5.
y2 = x2 + 1 " " y2 = 3 + 1 = 4
y3 = x3 + 1 " " y3 = 1,5 + 1 = 2,5 SOLUCION El nuevo recreo (yi), es el anterior multiplicado por 2 más 0,5:
y4 = x4 + 1 " " y4 = 2,5 + 1 = 3,5 y1 =2*x1 + 0,5 o sea y1 = 2*2 + 0,5 = 4,5
y5 = x5 + 1 " " y5 = 5 + 1 = 6 y2 =2*x2 + 0,5 " " y2 = 2*3 + 0,5 = 6,5
y3 =2*x3 + 0,5 " " y3 = 2*1,5 + 0,5 = 3,5
El nuevo recreo promedio podría hallarse calculando la media aritmética de la nueva variable y i , y4 =2*x4 + 0,5 " " y4 = 2*2,5 + 0,5 = 5,5
pero es muy moroso cuando el número de datos es grande. Entonces, haciendo uso de la propiedad y5 =2*x5 + 0,5 " " y5 = 2* 5 + 0,5 = 10,5
tenemos:
Aunque puede hallarse el nuevo recreo promedio a través de los nuevos recreos, es más sencillo
M(yi) = M(xi + 1) = M(xi) + 1 = 2,8 + 1 = 3,8 aplicando la propiedad:
Entonces el nuevo recreo promedio es el anterior aumentado en Bs.1 (Bs.3,8). M(yi) =M(2*xi + 0,5) = 2*M(xi) + 0,5 = 2*2,8 + 0,5 = 6,1
3ª Propiedad La media aritmética de una variable multiplicada por una constante distinta de cero, es igual Es decir, cuando se duplica a cada niño el recreo y además se aumenta un monto fijo (Bs.0,5),
a la media de la variable multiplicada por la constante: también se duplica el promedio y se incrementa en el monto fijo (Bs.6,1).
5º La suma algebraica de las desviaciones (di) de cada valor observado xi, con respecto a su media es
M(cx) = cM(x) donde c 0 cero:
di= (xi x) = 0
En otras palabras, si cada valor de un conjunto de datos (xi) es multiplicado por un mismo número
distinto a cero (c 0), la media aritmética del nuevo conjunto de datos yi =c*xi es igual a la media Es decir, las diferencias de valor que presentan cada una de las observaciones respecto al promedio,
aritmética del conjunto original multiplicada por el valor constante. el forma conjunta deben anularse.
EJEMPLO Tomando en cuenta los datos del ejemplo anterior, si a todos los niños sus padres les EJEMPLO Tomando en cuenta los datos del ejemplo de la segunda propiedad, podemos hallar
duplican el recreo, cuál es el nuevo recreo promedio? las desviaciones de cada uno de los recreos respecto al recreo promedio y comprobar
cuanto da la suma de éstas.
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 5 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 6
6ª Propiedad La media de la suma o resta de dos variables realizadas a un mismo número de x = 73000 = 243,33 Es decir, el salario promedio mensual de un empleado cualquiera
observaciones, medidas ambas en la misma unidad, es igual a la suma o resta de las medias de las 300 es de $243,33.
variables originales:
b) Se está pidiendo hallar el nuevo salario promedio global del siguiente mes cuando
M(x + y) = M(x) + M(y) ingresen a trabajar nuevos empleados con un menor salario promedio global,
entonces también se tiene dos submuestras:
EJEMPLO Una muestra 6 parejas de recién casados nos proporciona el promedio de años
estudiados por las señoras M(x) = 13 como por los caballeros M(y) = 17 Cuál será el La de empleados antiguos de tamaño f1 = 300 con x1=243,33 y la se empleados nuevos de
promedio de años estudiados por matrimonio? tamaño f2 = 50 con x2 = 240:
SOLUCION Se está pidiendo hallar el promedio de los años estudiados por pareja, es decir, x = M(x) = 243,33*300 + 240*50 = 84999 = 242,85
cuantos años en total ha estudiado cada pareja. Si se tuvieran los datos originales, se 300 + 50 300
puede hallar este promedio, sumando los años de estudio de la esposa con la del
esposo, y luego hallar el promedio de la nueva variable "años estudiados por pareja"; En consecuencia, el siguiente mes, el salario promedio será de $242,85.
pero como no se cuenta con los datos originales, se debe aplicar la propiedad
mencionada: VENTAJAS DE LA MEDIA ARITMETICA
EJEMPLO El salario promedio mensual de 100 empleados varones, de una fábrica, es de $250, y el
salario promedio mensual de 200 empleadas, de la misma fábrica, es de $240.
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 7 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 8
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 9 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 10
a) 1,5,8,3,6,9 No existe moda 2. No está afectada por valores extremos porque en su cálculo no intervienen todas las observaciones
b) 4, 5, 3, 2, 1, 5, 6, 5 Mo = 5 3. Puede calcularse aunque la distribución de frecuencias incluya intervalos abiertos.
c) 6, 3, 4, 3, 1, 6, 2, 3, 6, 7 Mo1=3 ; Mo2=6
DESVENTAJAS DE LA MODA
PARA DATOS AGRUPADOS 1. Estrictamente hablando, la verdadera moda de un conjunto de datos continuos no existe, debido a
que los valores de las observaciones, antes del redondeo, muy rara vez son iguales.
Cuando las observaciones ya están agrupadas y distribuidas en tabla de frecuencias, la moda puede 2. Cuando existe más de una moda, estas son difíciles de interpretar y comparar.
determinarse de la siguiente manera:
Mo = Li + c fa max - fa ant = Li + c 1
La utilización ya sea de la media, mediana y moda, no debe realizarse sin considerar a las demás,
(fa max fa ant) + (fa max fa sgt) 1 + 2
pues aunque son medidas que indican distintos aspectos, están relacionadas entre sí.
SOLUCION Como todos los anchos de clase son iguales, la clase modal, es aquella que tiene la - Si la distribución es moderamente asimétrica y unimodal,se cumple:
mayor frecuencia absoluta, o sea la tercera. Una vez determinada la clase modal, se
procede a su calculo. M(x) - Mo 3 (M(x) -Me)
Mo = 35 + 5 (100-95) = 35 + 5 5 = 35 + 0,83 =35,83 Esta relación permite encontrar el valor de la media aritmética por aproximación cuando las distribuciones
(100-95)+(100-75) 5+25 de frecuencias incluyen intervalos abiertos.
VENTAJAS DE LA MODA Los cuantiles llamados también fractiles o fractilas, son estadígrafos que describen el
comportamiento de una población; sus valores dividen a un conjunto de datos ORDENADOS en partes
1. Puede utilizarse como una medida de localización tanto para datos cualitativos como para iguales y se dan frecuentemente en tanto por ciento. Los cuantiles pueden ser:
cuantitativos
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 11 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 12
Segundo Cuartil: Q2 Es el valor que supera a no más de la mitad de las observaciones y es superado SOLUCION
por no más de la mitad de ellas. Este valor por definición, coincide con la mediana: Q2 = Me
1º Ordenamos las observaciones:
Tercer Cuartil: Q3 Es el valor que supera a no más de 3/4 de las observaciones y es superado por
no más de 1/4 de ellas. Dicho de otro modo, es el valor que deja 75% de las observaciones menores 5, 6, 7, 10, 11, 12, 13, 15, 17, 18, 20, 21
o iguales a él y el 25% superiores a él.
2º Se localiza el punto de posición del valor correspondiente a los cuartiles 1 y 3. Debe tenerse
PARA DATOS NO AGRUPADOS en cuenta que ahora existe una observación más (n=12)
SOLUCION Para hallar cualesquiera de los cuantiles se debe realizar los siguientes pasos: Q1 = 7 + (10-7)(0,25) = 7 + 0,75 =7,75
1º Se ordenan las observaciones. En este ejemplo: Este valor quiere decir, que no más del 25% de los datos son menores a 7,75 días y no más
del 75% de los datos son mayores a 7,75 días
5, 6, 7, 10, 11, 12, 15, 17, 18, 20, 21
a) Para Q3 = x 3(12+1)/4 = x 3(13/4) = x9,75 Este valor no es entero, entonces se debe hacer
2º Se localiza el punto de posición del valor correspondiente al cuantil. En este caso a los una interpolación entre la observación novena y décima.
cuartiles
Es decir, la posición 9,75 indica que el valor de Q3 es el noveno dato más 0,75 de la diferencia
Qi = X i(n+1) entre el noveno y el décimo:
4
Q1 = 7 + (10-7)(0,25) = 7 + 0,75 =7,75
a) Para Q1 = x 1(11+1)/4 = x 12/4 = x3 Como este valor es entero, el cuartil uno es el valor
que corresponde a la tercera posición, es decir: Q1 = 7, pues 7 ocupa la tercera Este valor quiere decir, que no más del 25% de los datos son menores a 7,75 días y no más
posición de los datos. del 75% de los datos son mayores a 7,75 días
Este valor quiere decir, que no más de la cuarta parte de los datos son menores a 7 días, y no PARA DATOS AGRUPADOS
más de las tres cuartas partes de los datos son mayores a 7 días.
Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los cuartiles se
b) Para Q3 = x 3(11+1)/4 = x 3(12/4) = x3(3) = x9 Como este valor es entero, el cuartil uno es determina mediante la siguiente expresión:
el valor que corresponde a la novena posición, es decir: Q3 = 18, pues 18 ocupa la
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 13 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 14
Qi = Linf + cj (in/4 Fa j-1) desde i=1,2,3 Q3= 100 + 10 (37,5 - 24) = 100 + 10(13,5) = 100+6,43 = 106,43
fa i 21 21
Donde:
Linf= límite inferior de la clase cuartil El valor de Q3= 106,43 indica que no más del 75% de los estudiantes tiene un C.I. menor a
cj = ancho de clase donde se halla el cuartil 106,43 y no más del 75% de los estudiantes tienen un C.I. mayor a 106,43.
n = número de observaciones
Fa j-1= Frecuencia absoluta acumulada anterior a la clase cuartil
fa j = frecuencia absoluta de la clase cuartil B.2.2 DECILES
Fj= Frecuencia acumulada donde se encuentra el cuartil. La frecuencia acumulada que
supera por primera vez (o es igual) a i(n/4), es la clase cuartil Son valores que dividen a un conjunto de datos ordenados (en forma ascendente o descendente) en
10 partes iguales, se representa por: Di i= 1, 2, 3, 4, 5, 6, 7, 8, 9
EJEMPLO Hallar Q1 y Q3 de 50 estudiantes cuyo coeficiente intelectual está distribuido en la Primer Decil D1 es el valor que supera a no más de un décimo de las observaciones y es superado
tabla siguiente. por no más de nueve décimos de ellas.
SOLUCION Segundo Decil D2 es el valor que supera a no más de dos décimos de las observaciones y es superado
por no más de ocho décimos de ellas.
C.I. fa i Fi
80 90 6 6 ...
90 100 18 24
100 110 21 45 Noveno Decil D9 es el valor que supera a no más de nueve décimos de las observaciones y es
110 120 5 50 superado por no más de un décimo de ellas.
50
PARA DATOS NO AGRUPADOS
Para Q1 se determina:
Di = X i(n+1) Si i(n+1)/10 es entero, entonces Di es el valor de la observación que corresponde
1º i(n/4) = 1(50/4) = 12,5 10 que corresponde a esa posición.
2º Se determina Fa j que supera por primera vez a la mitad de los datos (12,5), luego Fa j =24
entonces Fa j-1= 6 Si i(n+1)/10 no es entero, se hace una interpolación lineal entre los dos valores correspondientes
3º Luego la clase cuartil buscada es la segunda; luego el límite inferior de esta clase es L inf = entre las cuales se encuentra la fracción (o decimal).
90; el ancho de clase es cj=10, y la frecuencia absoluta de la clase cuartil es fa i=18.
4º Se calcula el cuartil pedido: PARA DATOS AGRUPADOS
Q1 = 90 + 10 (12,5 - 6) =90 + 10 (6,5) =90 + 3,61 = 93,61 Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los deciles se
18 18 determina mediante la siguiente expresión:
El valor de Q1= 93,61 indica que no más del 25% de los estudiantes tiene un C.I. menor a Di = Linf + cj (in/10 Fa j-1) desde i=1,2,..., 9
93,61 y no más del 75% de los estudiantes tienen un C.I. mayor a 93,61. fa j
Donde:
Para Q3 se determina: Linf= límite inferior de la clase decil
cj = ancho de clase donde se halla el decil
1º i(n/4) = 3(50/4) = 37,5 n = número de observaciones
2º Se determina Fj que supera por primera vez a 37,5: Fa j = 45 entonces Fa j-1= 24 Fa j-1= Frecuencia absoluta acumulada anterior a la clase decil
3º Luego la clase cuartil buscada es el tercero; luego el límite inferior de esta clase es Linf=100; fa j = frecuencia absoluta de la clase decil
el ancho de clase es cj=10, y la frecuencia absoluta de la clase cuartil es fa j=21. Fa j= Frecuencia acumulada donde se encuentra el decil. La frecuencia acumulada que
4º Se calcula el cuartil pedido: supera por primera vez (o es igual) a i(n/10), es la clase decil.
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 15 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 16
Son valores que dividen a un conjunto de datos ordenados (en forma ascendente o descendente) en Los estadígrafos de dispersión miden la variabilidad de los datos respecto a los estadígrafos de
100 partes iguales, se representa por: Pi i= 1, 2, ... , 99 posición central, es decir, miden cuán dispersos están respecto a la M(x), Me ó Mo.
Primer Percentil P1 es el valor que supera a no más de un céntimo de las observaciones y es Un estadígrafo de dispersión puede ser usado como complemento de un promedio para describir un
superado por no más de 99/100 de ellas. conjunto de datos o para comparar dos o más conjuntos de datos. Cuando la dispersión es alta, el promedio
tiene poco o ningún significado, mientras cuando la dispersión es baja, el valor del promedio se vuelve
Segundo Percentil P2 es el valor que supera a no más de 2/100 de las observaciones y es superado altamente significativo.
por no más de 8/100 de ellas.
Los estadígrafos de dispersión pueden ser absolutos o relativos.
...
A) ESTADIGRAFOS DE DISPERSION ABSOLUTA
Nonagésimo Noveno Percentil P99 es el valor que supera a no más de 99/100 de las observaciones
y es superado por no más de 1/100 de ellas. a.1) RECORRIDO o RANGO
El término percentil se emplea para indicar el valor por debajo del cual está situado un cierto El recorrido es la diferencia entre el valor mayor de las observaciones menos el menor valor de las
porcentaje de la distribución de valores observados. mismas:
Por ejemplo, si el percentil 35 de los sueldos de un grupo de trabajadores es Bs.270,5 (P30=270,5) R = xmax - xmin
significa que el 30 % de los trabajadores tiene un sueldo inferior a Bs.270,5
Esta medida da idea respecto a los valores entre los que se encuentran las observaciones. Si el rango
PARA DATOS NO AGRUPADOS de una distribución es mayor que otra, debe esperarse que la dispersión de los datos sea mayor que la otra.
Sin embargo, muchas veces el Rango no es una medida adecuada de dispersión, porque sólo considera los
Pi = X i(n+1) Si i(n+1)/100 es entero, entonces Pi es el valor de la observación que corresponde valores extremos, sin considerar el número de observaciones que puede existir entre esos valores, ni los
100 a esa posición. valores intermedios.
Si i(n+1)/100 no es entero, se hace una interpolación lineal entre los dos valores correspondientes EJEMPLO Sean los valores de dos conjuntos de observaciones:
entre las cuales se encuentra la fracción (o decimal).
A) 5, 5, 6, 6, 6, 7, 7, 7, 7, 15, 15
PARA DATOS AGRUPADOS B) 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15
Cuando los datos ya están agrupados en una tabla de distribución de frecuencias los percentiles se Mediante el recorrido, indique cuál distribución tiene mayor dispersión.
determina mediante la siguiente expresión:
SOLUCION En este ejemplo, el rango nos proporciona el mismo valor, R = 15-5 = 10; pero a
Pi = Linf + cj (in/100 Fa j-1) desde i=1,2,...,99 simple vista se nota que la segunda distribución tiene mayor dispersión.
fa j
Donde: Aunque esta medida de dispersión no es muy utilizada, por las inconveniencias señaladas, se usa
Linf= límite inferior de la clase percentil mucho en Meteorología, para indicar temperaturas máximas y mínimas.
cj = ancho de clase donde se halla el percentil
n = número de observaciones Dada la limitación del Rango, se recurre a otra medida de dispersión absoluta: El Recorrido
Fa j-1= Frecuencia absoluta acumulada anterior a la clase percentil Intercuartílico.
fa j = frecuencia absoluta de la clase percentil
Fa j= Frecuencia acumulada donde se encuentra el percentil. La frecuencia acumulada que
supera por primera vez (o es igual) a i(n/100), es la clase percentil a.2) EL RECORRIDO INTERCUARTILICO
Esta medida de dispersión, trata de corregir, las deficiencias del Rango, y para evitar tomar sólo los
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 17 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 18
valores extremos, esta medida considera al 50% de los valores centrales de las observaciones: El recorrido M(x) = (5+7+8+4)/4 = 24/4 = 6
intercuartílicos se define como:
2º Se hallan las desviaciones de cada una de las observaciones respecto a la media, en valor
RI = Q3 - Q1 absoluto
EJEMPLO Hallar el Recorrido intercuartílico de las observaciones del ejemplo anterior. 3º Se suman estas desviaciones y se divide entre el número de datos.
SOLUCION Ambas distribuciones, tienen 11 observaciones DM = |5-6| + |7-6| + |8-4| + |4-6| = 1 + 1 + 2 + 2 = 6 = 1,5
4 4 4
Q1 = x 1(11+1)/4 = x 12/4 = x3
Q3 = x 3(11+1)/4 = x 36/4 = x9 Este valor indica que la distancia promedio a la que están los datos, de la media, es 1,5. Si se tuviera
otros valores de otra observación, se podría indicar cuál tiene mayor dispersión entre sus datos, observando
Entonces en A) Q1 = 6 y Q3 = 7 Luego: RI = 7-6 = 1 el mayor valor de la DM.
en B) Q1 = 7 y Q3 = 13 Luego: RI =13-7 = 6
k
En consecuencia, la segunda distribución tiene mayor dispersión. xi X fi
PARA DATOS AGRUPADOS DM = i 1
Otra medida de dispersión que es más utilizada que la desviación cuartílica, es: n
Este estadígrafo, considera no solo los valores de los cuartiles, sino el promedio de su diferencia. Es Pesos (Kg) 50-60 60-70 70-80 80-90
decir: Nº Estud. 6 18 21 5
Q3 Q1 SOLUCION
DC =
2 Pesos (kg) fa i xi xifa i xi - 70 xi - 70 fai
50 - 60 6 55 330 15 90
En este caso, también se considera una distribución más dispersa, cuanto mayor sea el valor de la 60 - 70 18 65 1170 5 90
desviación cuartílica. 70 - 80 21 75 1575 5 105
80 - 90 5 85 425 15 75
Sin embargo, estos dos últimos estadígrafos no consideran a todas las observaciones, entonces para 50 360
corregir esta deficiencia se recurre a:
M(x) = 3500/50 = 70
DM = 360/50 = 7,2
a.4) LA DESVIACION MEDIA
a.5) LA DESVIACION MEDIANA
La desviación media (DM) es la media aritmética de los valores absolutos de las observaciones o
marcas de clase con respecto a la media. La desviación mediana (DMe) es la media aritmética de los valores absolutos de las observaciones
n o marcas de clase con respecto a la mediana.
xi X n
PARA DATOS NO AGRUPADOS DM = i 1 xi Me
n
PARA DATOS NO AGRUPADOS DM = i 1
n
EJEMPLO Hallar la DM de las siguientes observaciones: 5, 7, 8, 4. k
xi Me f ai
i 1
SOLUCION 1º Se debe calcular la media aritmética: PARA DATOS AGRUPADOS DM =
n
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 19 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 20
a.6) LA VARIANZA 3ª Propiedad La varianza de una variable multiplicada por una constante distinta de cero, es igual a la
varianza de la variable multiplicada por el cuadrado de la constante:
Es la media aritmética de los cuadrados de las desviaciones de las observaciones con respecto a la
media aritmética. V(cx) = c2V(x) donde c = 0
V(x) = Sx2 = M [(x-X)2]
En otras palabras, si cada valor de un conjunto de datos (xi) es multiplicado por un mismo número
n
2
distinto a cero (c = 0), la variación del nuevo conjunto de datos yi =c*xi es igual a la varianza del
xi X conjunto original multiplicada por el cuadrado de la constante. O sea la dispersión se hace mucho
PARA DATOS NO AGRUPADOS: V(x) = i 1 más grande.
n
k
2 4ª Propiedad Una combinación de las dos propiedades anteriores es:
xi X f ai
i 1
PARA DATOS AGRUPADOS: V(x) = V(cx ± b) = c2V(x)
n
k
2ª Propiedad La varianza de una variable sumada o restada en un valor constante, es igual a la varianza de xi 2 f i
i 1 2
la variable: O mucho mejor: V(x) = X
n
V(x ± b) = V(x)
Esto significa que si a cada valor de las observaciones (xi) se le suma o resta un mismo valor (b), la VARIANZA GLOBAL
varianza de la nueva variable yi = xi ± b, es la misma; es decir, añadir o quitar una misma suma al
valor de cada observación, no modifica la dispersión del conjunto original. Considérese muestras de tamaños f1; f2; ... ; fk de una población (o de K poblaciones diferentes) a las
que les corresponde medias aritméticas x1, x2,...,xk respectivamente, siendo x la media global; y
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 21 ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 22
varianzas V1, V2,...,Vk respectivamente entonces la Varianza de toda la población, o la VARIANZA igual a la desviación estándar de la variable multiplicada por la constante:
GLOBAL, de tamaño f1+f2+...+fk= n está dado por:
S(cx) = |c| S(x) donde c = 0
Varianza = Intervarianza + Intravarianza
4ª Una combinación de las dos propiedades anteriores es:
V(x) = V[M(xi)] + M[V(xi)]
k
2
k S(cx ± b) = |c| S(x)
xi X fa i Vi f a i
i 1 i 1
V(x) =
n n
INTERPRETACION DE LA DESVIACIÓN ESTÁNDAR
La varianza de un conjunto de submuestras puede deberse tanto a la variabilidad dentro de cada
Tanto la Varianza como la Desviación Estándar son las medidas más utilizadas, pero ninguna tiene
estrato como a la variabilidad entre los distintos estratos, es decir puede deberse a la intervarianza o a la
una interpretación intuitiva obvia, por sí sola. Sin embargo existe una regla empírica que describe la
intravarianza.
dispersión de una distribución casi simétrica:
INTERVARIANZA. Es el estadígrafo que representa la variabilidad entre las submuestras, se define como
Dada una distribución de tamaño suficientemente grande, casi simétrica y de forma
la Varianza entre las Medias de las submuestras.
aproximadamente a una campana, entonces se verifica:
INTRAVARIANZA. Es el estadígrafo que representa la variabilidad dentro de las submuestras, se define
Entre x-S y x+S se encuentra, aproximadamente, el 68% de las observaciones.
como la Media aritmética de las Varianzas de las submuestras
Entre x-2S y x+2S se encuentra, aproximadamente, el 95% de las observaciones.
Entre x-3S y x+3S se encuentra, aproximadamente, el 99% de las observaciones.
a.7) DESVIACION ESTANDAR Llamada también DESVIACION TIPICA, y se define como la raíz
cuadrada de la varianza. su símbolo es: x ó Sx
B) MEDIDAS DE DISPERSION RELATIVA.
x = Sx = Cuando se desea comparar la dispersión existente entre dos o más muestras de diferente tamaño, con
promedios distintos, surge la necesidad de contar con estadígrafos que no dependan de la magnitud de las
VENTAJAS DE LA DESVIACION ESTANDAR observaciones ni posean dimensión, para ello se recurre a estadígrafos de dispersión relativa que sólo
expresan la razón o la proporción entre dos estadígrafos.
1. Esta medida de dispersión es la más utilizada en Estadística Descriptiva debido a que sus unidades
de medidas son las mismas de las variables. Si una de las medidas de dispersión relativa es usada para describir un conjunto de datos, la misma
2. Está basada en cada uno de los valores de los datos; por tanto permite una mejor descripción de la medida debe ser usada en otro conjunto de datos para poder compararlos. Entre estos se tiene:
dispersión que sus similares: Rango, Recorrido intercuartílico; Desviación cuartílica y Desviación
media. b.1) COEFICIENTE DEL RECORRIDO C.R.
3. Es matemáticamente lógica porque su cálculo no desprecia los signos positivos (+) o negativos (-)
de las desviaciones individuales. C.R. = Rango
(xmax + x min) 2
PROPIEDADES DE LA DESVIACION ESTANDAR Son similares a las de la varianza.
b.2) COEFICIENTE DE LA DESVIACION MEDIA C.D.M.
1ª Propiedad La desviación estándar de una constante es cero. S(b) = 0
C.D.M.= DM
2ª Propiedad La desviación estándar de una variable sumada o restada en un valor constante, es igual a la M(x)
desviación estándar de la variable:
b.3) COEFICIENTE DE LA DESVIACION MEDIANA C.D.Me.
S(x ± b) = S(x)
C.D.Me.= DMe
3ª Propiedad La desviación estándar de una variable multiplicada por una constante distinta de cero, es Me
Lic. María de los Ángeles Ramos Boutier Lic. María de los Ángeles Ramos Boutier
ESTADÍSTICA DESCRIPTIVA E.S.A.E. GESTIÓN 2017 23
C.V. =
Esta medida expresa el tanto por uno que representa la desviación estándar respecto a la media
aritmética. Esta medida es la más utilizada en Estadística Descriptiva, y también puede ser expresada en
porcentajes.
Para realizar comparaciones entre dos o más conjuntos de observaciones, la medida de dispersión
más pequeña indica menor dispersión entre los valores de sus observaciones, y cuanto más grande sea
respecto a otra, mayor dispersión entre los valores de las observaciones.