Professional Documents
Culture Documents
ESTADSTICAS
Las medidas descriptivas son valores numricos que nos
resumen toda la informacin de los datos en unos pocos, de
manera que se conserve la mayor informacin posible del
conjunto de ellos.
CLASIFICACIN
MEDIDAS DE POSICION
CENTRAL
Estas medidas tienden a ubicarse en el centro del
conjunto.
Proporcionan
un
valor
simple
y
representativo, que resume un gran volumen de
informacin.
MEDIANA
MEDIA ARITMTICA
MODA
MEDIA ARITMTICA
Medida descriptiva de tendencia central, llamada tambin
promedio. Resulta de sumar los valores de todas las
observaciones y dividir la sumatoria entre el total de ellas.
Ejemplo
Interpretacin
Ejemplo
Interpretacin
DATOS AGRUPADOS
Ejemplo 1
En una muestra de presupuestos familiares, se ha obtenido la siguiente
informacin respecto al numero de hijos de 21 familias
3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2
Interpretacin
Ejemplo 2
La siguiente tabla muestra el nmero de horas de sueo de 45
pacientes de un hospital como consecuencia de la administracin
de un cierto tipo de anestsico:
Nmero de
horas (X)
Nmero de
pacientes
1
2
3
4
5
7
8
10
11
12
13
17
4
1
5
5
6
7
6
3
2
2
2
2
4
2
15
20
30
49
48
30
22
24
26
34
TOTAL
45
304
Interpretacin
Ejemplo
En un programa para la deteccin de hipertensin en una muestra de
30 hombres en edades entre 30 y 40 aos, la distribucin de la
presin diastlica (mnima) (mnima presin de la sangre contra las
arterias en mm Hg (milmetros de mercurio)) fue la siguiente:
Solucin:
Elaborar una tabla de frecuencias con 6 clases(intervalos) de amplitud 10
Calcular e interpretar la media aritmtica, usando la tabla de frecuencias .
Intervalo de
clase
Marca de
clase
65
75
85
95
105
115
TOTAL
Interpretacin
Cantidad de
Nmero de
presin diastlica
Hombres
en los hombres
3
6
7
9
2
3
195
450
595
855
210
345
30
2650
Ejemplo
Interpretacin
PROPIEDADES
Si se multiplica a la media por el nmero total de
observaciones, se obtiene la suma de las observaciones,
es decir:
PROPIEDAD 5
MEDIANA
Me
50%
X mn
50%
Me
X mx
Ejemplo
Los pesos, en kilogramos, de 7 jugadores de un equipo
de ftbol son:
Ejemplo
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la
mediana es:
63 65
64
2
La mediana vale 64.
DATOS AGRUPADOS
n impar
Ejemplo
n par
Ejemplo
Ejemplo
Nmero de
Muertos (X)
0
1
2
3
4
5
6
7
Nmero de
ciudades
7
11
10
7
1
2
1
1
TOTAL
40
Nmero de ciudades
Acumuladas
7
18
28
35
36
38
39
40
n=40 (par)
Cmo
50%
X mn=0
Interpretacin
50
%
Me
X mx=7
Ejemplo
Nmero de Hijos
(X)
0
1
2
3
4
Nmero de
Familias
1
5
7
7
1
TOTAL
21
50%
X mn=0
Interpretacin
Nmero de Familias
Acumuladas
1
6
13
20
21
50
%
Me
n=21 (impar)
Cmo
Entonces,
X mx=4
DATOS AGRUPADOS
(INTERVALOS)
n par
Intervalo mediano
DATOS AGRUPADOS
(INTERVALOS)
n impar
Intervalo mediano
Ejemplo
n par
Intervalo
de clase
TOTAL
Nmero de
Personas
Nmero de
personas
acumuladas
3
6
7
9
2
3
3
9
16
25
27
30
Cmo
30
Interpretacin
Ejemplo
n par
Tenemos que:
50%
X mn=2
Interpretacin
50
%
Me
X mx=22
Ejemplo
n par
Reemplazando:
Interpretacin
Interpretacin
El 50% de las empresas invierten menos de 27 000 dlares
NMERO DE
TRABAJADORES DE
SEGURIDAD
03
47
12
8 11
24
12 15
16
16 19
10
20 23
69
Interpretacin
Ventajas de la mediana
Las principales ventajas son las siguientes:
Es fcil de calcular.
No se afecta
extremos.
mucho
por
los
valores
PROPIEDADES
Sea X la variable y c una constante
MODA Mo
Se refiere al valor de la variable
que ms se repite en una
distribucin de frecuencia, o el
valor que est representado por el
mayor nmero de observaciones.
Ejemplo
297 314 333 350 388 412 421 455 455 455
466 466 502 502 542 587 601 621 629
Mo = 455
DATOS
AGRUPADOS
Ejemplo
Interpretacin
La mayora
hijos.
Ejemplo
Lo compran 35 personas
La moda es 41.
Interpretacin
La moda
Intervalo modal
(Intervalo con
mayor frecuencia)
Intervalo modal
Ejemplo
Intervalo
de clase
Nmero de
Personas
Intervalo modal
(Intervalo con mayor frecuencia)
3
6
7
9
2
3
TOTAL
Interpretacin
30
La mayora de las personas (hombres) tienen
una presin diastlica de 92,22 mg Hg.
Ejemplo
Clase modal
Interpretacin
Ventajas de la moda
Las principales ventajas son las siguientes:
Es el dato o datos que se repite
ms.
No es muy usada como medida de
tendencia central
No es nica
Se aplica a datos medidos en todas
las escalas vistas.
Las
distribuciones
pueden
ser
unimodales, bimodales, multimodales
PROPIEDADES
Sea X la variable y c una constante
PARTICIPANDO
Supongamos que tenemos una
distribucin de frecuencias del
saldo promedio mensual de la
cuenta de cheques de 600
clientes de una sucursal bancaria
Calculo de la mediana
Determinamos la Intervalo (clase) que contiene la mediana.
Para determinar la moda, utilizaremos la formula correspondiente
teniendo cuidado de identificar sus elementos.
Calculo de la moda
Determinamos la clase modal (clase que tiene el mayor numero de
observaciones).
Para determinar la moda, utilizaremos la formula correspondiente
teniendo cuidado de identificar sus elementos.
Moda
Media
Mediana
Media Moda
Mediana
42
CUARTILES
DECILES
PERCENTILES
CUARTILES
Los CUARTILES son 3 valores que
dividen a la distribucin en 4 partes
iguales, cada una de las cuales
contienen el 25% de las observaciones
DECILES
Los DECILES son 9
valores que
dividen a la distribucin en 10 partes
iguales, cada una de las cuales
contiene el 10% de las observaciones
PERCENTILES
Los PERCENTILES son 99
que dividen a la distribucin
partes iguales, cada una
cuales contiene el 1%
observaciones
valores
en 100
de las
de las
PASO 3 :
(a) SI i NO ES ENTERO SE REDONDEA. EL VALOR ENTERO INMEDIATO
PROMEDIO MAYOR QUE i INDICA LA POSICIN DEL k-ESIMO PERCENTIL.
(b) SI i ES ENTERO, EL k-ESIMO PERCENTIL ES EL PROMEDIO DE LOS
VALORES DE LOS DATOS UBICADOS EN LOS LUGARES i E i+1.
ejemplo
Calcular el percentil 40
Interpretacin
Hay un 40% de datos que son
menores o iguales que 44.
40%
13
60%
44
98
ejemplo
36,25,37,38,40,47,29,28,31,32,,41,45,30,47,42,39,33,34,37,30
Calcular el percentil 80
80%
Interpretacin
Hay un 80% de datos que son
menores o iguales que 41,5
25
20%
41,5
47
ejemplo
Consideremos el siguiente
conjunto de datos :
107
73
68
97
76
79
94
59
98
57
54
65
71
70
84
88
62
61
79
98
66
62
79
86
68
74
61
82
65
98
62
116
65
88
64
79
78
79
77
86
Calcular el percentil 25
Calcular el percentil 78
Calcular el percentil 75
DATOS AGRUPADOS
(DISCRETO)
Calcular el percentil 18
DATOS AGRUPADOS
(INTERVALOS)
PARTICIPANDO
VARIABLE DISCRETA
VARIABLE CONTINUA
MEDIDAS DE POSICIN:
EQUIVALENCIAS
D1=P10
Q1=P25
Q2=Md=P50
Medidas Rango intercuartlico:
derivadas:
Q3-Q1.
PARTICIPANDO
Calcular la mediana (Me); el primer y
tercer cuartil (Q1, Q3); el 4 decil (D4) y el
90 percentil (P90).
Mediana (Me)
Lugar que ocupa la mediana lugar 20/2 = 10.
Como es igual a un valor de la frecuencia absoluta
acumulada, realizaremos el clculo:
Lugar que ocupa en la distribucin (3/4).20 = 60/4 = 15, que coincide con un valor
de la frecuencia absoluta acumulada, por tanto realizaremos el clculo:
PARTICIPANDO
Lugar que ocupa: (4/10).500 = 200. Por tanto D4 estar situado en el intervalo [100 200).
Lugar que ocupa: (90/100).500 = 450. Por tanto P90 estar situado en el intervalo [300 800).
Aplicando la expresin tendremos
PORQUE ESTUDIAR LA
DISPERSION?
Ejemplo:
48 49 50 51 52
40
47
50
53
60
MEDIDAS DE DISPERSIN
Indican como los datos se dispersan al rededor de
su punto central (la media). Nos dan elementos
para evaluar la adecuacin de la medida de
tendencia central usada.
ABSOLUTAS
RELATIVAS
RANGO O
AMPLITUD
RANGO
INTERCUARTLICO
DESVIACIN MEDIA
VARIANZA
DESVIACIN
ESTNDAR
COEFICIENTE
DE VARIACIN
RANGO O AMPLITUD ( R )
Se utiliza para variables
cuantitativas
medidas
en
escala de intervalo o razn
Inestable (muy afectada
por los valores extremos)
No aprovecha los datos,
insuficiente
Fcil de calcular
Ejemplo
Solucin
El Rango es R =5 0 = 5
Ejemplo
Rango Intercuartil Q3 Q1
Para calcular el rango intercuartil
del tiempo necesario para
arreglarse antes de salir al trabajo
se siguen los siguientes pasos:
(1) Ordenar de menor a mayor la
muestra
(2) Calcular el cuartil 1 y el 3
El rango intercuartil
consta de 9 numerales
DESVIACIN MEDIA
Mide el valor en promedio en que varan los
Ejemplo
con
la desviacin media.
103
97
101
106
103
Interpretacin
La desviacin media es 2,4 pacientes por da. El
nmero de estos, vara en promedio, en 2,4
pacientes por da con respecto de la media de 102
enfermos por da.
VARIANZA Y
DESVIACIN ESTNDAR
Nos informan sobre la magnitud de la variacin en los datos, la
magnitud con la cual las observaciones se agrupan en torno a la media
Slo se aplica a variables cuantitativas (medidas en escala de razn o
intervalo)
DATOS SIN AGRUPAR
DESVIACIN
ESTANDAR
VARIANZA
N
(x
i 1
x )
Se
(x
i 1
(x
i 1
los
de
x )2
tienen
datos
una muestra:
Ejemplo: siguientes
x )2
n
n 1
s2
(x
i 1
x )2
n 1
DATOS AGRUPADOS
DISCRETOS
VARIANZA
Ejemplo:
Se han registrado
durante 20 das, el
nmero de viajeros
que
hacen
reservaciones a una
agencia de viajes
pero que no las
hacen efectivas:
Calcule las medidas de dispersin de la variable en
estudio. Interprete
xi
ni
12
13
14
xi
ni xini xi2
12
36
144
432
13
39
169
507
15
14
84
196
1176
16
15
45
225
675
70
20
16
80
256
1280
70
0 284
990
xi2ni
4070
284 2
4070
2
20 1,9579 s 1,3992
s
19
VARIANZA
DATOS AGRUPADOS
INTERVALOS
Ejemplo:
Una muestra de las cantidades
que
los
empleados
de
una
compaa invierten quincenalmente
en el plan de
participacin de
utilidades, se organizo en una
distribucin de frecuencias para
su estudio.
Cual
es la varianza muestral de
los datos? Cual es la desviacin
estndar muestral de los datos?
Ejemplo:
Galones de gasolina
frecuencia
0 6
50
6 - 12
95
12 - 18
65
18 - 24
50
24 -30
25
30 - 36
15
total
300
PROPIEDADES
Calcule
e
interprete
medidas de Dispersin
las
V
Si las muestras tienen distinto tamao
COEFICIENTE DE VARIACIN
Compara la variabilidad de series de
coeficiente
de
CV
S
100%
x
CV
100%
Solucin
s 2 1,9697
s 1,4035
1,4035
cv
x100 64,7759%
2
,
1667
Ejemplo:
Solucin:
Ejemplo:
Un inversor debe decidirse por la
Accin A o por la B de dos compaas
de electrnica. Cul debe elegir si
desea optar
por
la que
tiene
comportamiento ms homogneo?
CV A
500
100 3,3 %
15.000
CV B
300
100 6,0 %
5.000
CONSIDERACIONES
PROPIEDADES
Dada
una
variable
estadstica
X,
la
tipificacin de esta variable es otra nueva
variable, Z, que se define como
Ejemplo:
Un licenciado en psicologa y otro en econmicas reciben sendas
ofertas de trabajo, con sueldos anuales de 18.000 y 24.000 .
La media de los sueldos de los recin licenciados en psicologa es
de 16.000, con una desviacin tpica de 850. La media de los
sueldos de los recin licenciados en econmicas es de 22.000,
con una desviacin tpica de 1.200. Cul de los dos ha tenido
una mejor oferta laboral, en relacin a los sueldos de su
profesin?
Solucin:
Calculamos la variacin relativa, en cada caso, con
respecto a la media (es decir, tipificamos):
X x
Z
S
Psicologa: (18000-16000)/850=235
Econmicas: (24000-22000)/1200=166
Interpretacin
Por tanto, el sueldo ofrecido al psiclogo posee mayor variacin
relativa; puesto que la variacin es positiva, ello implica que el
sueldo es comparativamente mejor
Ejemplo:
Se considera que la media para arreglarse en la maana
es de 39.6 minutos y la desviacin estndar de 6.77
minutos. S el da lunes se toma 39.0 minutos para
arreglarse. Calcular la puntuacin Z para este da.
39.0 39.6
6.77
Z 0.09
Z
|z| > 3
INTERPRETACIN
Puede ser un valor de dato registrado incorrectamente.
Puede ser un dato
Puede ser un valor de dato que fue incorrectamente
incluido en el conjunto de datos.
Puede ser un valor de dato correctamente registrado y
que pertenece al conjunto de datos!!!
MEDIDAS DE FORMA
Adems de identificar la ubicacin y dispersin que
tienen los datos, es importante determinar su forma,
como un complemento de su descripcin. Estas medidas
permiten caracterizar de una manera mas adecuada la
forma de distribucin de los datos.
ASIMETRA
CURTOSIS
Asimetra o
Sesgo
MEDIDAS DE ASIMETRA
Cuantifican el grado de asimetra de la distribucin en torno a
una medida de tendencia central. Es decir mide si la muestra
se distribuye de igual manera a ambos lados de la media.
COEFICIENTE DE
ASIMETRIA DE
FISHER
A=0
Ejemplo:
Interpretacin
Ejemplo:
Ejemplo:
11
10
N de
muertos
Ciudades
12
20
Total
40
-16,875
12
12
12
-1,5
20
40
80
2,5
36
6,75
16
15,625
Total
40
60
144
6,5
Interpretacin
Ejemplo:
Ejemplo:
Varones
0-200
13
200-400
11
400-600
600-800
800-1000
Total
38
MEDIDAS DE
CURTOSIS
La curtosis de una distribucin es la medida del grado
de apuntamiento de ella. Es decir, mide la
concentracin de la muestra alrededor de la media.
COEFICIENTE DE
CURTOSIS DE
FISHER
Ejemplo:
Interpretacin
Ejemplo:
Interpretacin
El coeficiente de Fisher es negativo ( 1.1608) entonces, la serie de datos tiene
una distribucin de forma platicurtica, es
decir existe una mayor dispersin de los
datos
que lo normal de los datos con
respecto a la media
Ejemplo:
11
10
N de
muertos
Ciudades
11
10
Total
26
Interpretacin
Ejemplo:
11
10
N de
muertos
Ciudades
11
10
Total
26
Interpretacin
12,46
Ejemplo:
Varones
0-200
13
200-400
11
400-600
600-800
800-1000
Total
38
Interpretacin
GRFICO DE CAJA Y
BIGOTES
Es una representacin grfica de una distribucin estadstica
que refleja
directamente 5 parmetros ( Lmite Inferior,
Primer Cuartil, Mediana, Tercer Cuartil y Limite Superior) e
indirectamente el Rango y el Rango Intercuartlico.
Primer Cuartil
Lmite Inferior
Q1
L I = Q1-1,5 RI
Valores
Atpicos
(Mediana)
Q2
1,5 RI
Tercer Cuartil
Lmite Superior
Q3
LS = Q3-1,5 RI
Valores
Atpicos
Q1 (Rango Intercuartlico)
1,5 RI
RI= Q3
Calculo de Cuartiles:
Q1=(24 + 25) / 2 = 24,5
Me= Q2 = (33 + 34)/ 2 =33,5
Q3=(39 + 39) / 2 = 39
Caractersticas:
Interpretacin:
Ejemplo:
Comparar distribuciones
de
edades
de
dos
grupos de colectivo de
20 personas.
GRUPO 1
GRUPO 2
DA 1
DA 2
DA 3
DA 4
DA 5
Ejemplo:
Un corredor entrena para una
determinada carrera y se toman los
tiempos que necesita para recorrer
los
100m,
durante
10
das
consecutivos (cada da se toman
varios tiempos y se calculan mediana,
cuartiles, valores mnimo y mximo)