You are on page 1of 72

Estadística para Auditoria,

Administración y Economía

Describiendo los Datos


Numéricamente
Frente a la Incertidumbre.

Las decisiones que se toman día a día se


basan en información incompleta o
incorrecta.

Considere:

 El precio de las acciones de BI será mas alto en


seis meses de lo que es ahora.
 Si el déficit del presupuesto del país es tan alto como
se dice, las tasas de interés permanecerán altas por
el resto del año.
Frente a la Incertidumbre.
A causa de la incertidumbre las
declaraciones deberían modificarse
 El precio de las acciones de BI muy probablemente
será mas alto dentro de seis meses que ahora.

 Si el presupuesto del país es tan alto como se predijo


es probable que la tasa de interés permanezca alta
por el resto del año.
Definiciones

 Una población es la colección de todos los ítems de


interés o bajo investigación.
 N representa el tamaño de la población
 Una muestra es un subsegmento de la población que
esta siendo observada.
 n representa el tamaño de la muestra
 Un parámetro es una característica especifica de una
población.
 Un estadístico es una característica especifica de
una muestra.
Población vs. Muestra

Población Muestra

a b cd b c
ef gh i jk l m n gi n
o p q rs t u v w o r u
x y z y

Los valores calculados Los valores calculados a


usando datos poblacionales partir de datos muestrales
son llamados parámetros. son llamados estadísticos.
Ejemplos de Poblaciones
 Los nombres de los votantes registrados en
Guatemala.
 Los ingresos de todas las familias viviendo en
Quetzaltenango.
 Los rendimientos anuales de todas las
acciones que se negocian en la bolsa de
valores de New York
 Los promedios de las notas de los estudiantes
del CUNOC.
Muestreo Aleatorio

El muestreo aleatorio simple es un procedimiento


en el cual:
 Cada miembro de la poblacion es escogido
estrictamente al azar.
 Cada miembro de la poblacion tiene la misma
probabilidad de ser elegido., y
 Cada posible muestra de n objetos tiene la misma
probabilidad de ser elegida.

La muestra resultante se conoce como Muestra


Aleatoria
Estadística Descriptiva e Inferencial

Las dos ramas de la estadística son:


 Estadística Descriptiva

 Recolectar, agrupar y procesar los datos para


transformarlos en información.

 Estadística Inferencial
 Proporciona las bases para las predicciones,
pronósticos y estimados que se usan para
transformar la información en conocimiento.
Estadistica Descriptiva

 Recolectar Datos
 ej., Encuesta

 Presentar datos
 ej., Tablas y graficas

 Resumir los datos


 ej., Media Muestral =
X
n
i
Estadística Inferencial
 Estimación
 ej, Estimar la media del peso de

la población usando la media


del peso de la muestra.
 Prueba de Hipótesis
 ej., Probar la afirmación de que

la media del peso de la


población es de 120 libras.

Inferir es el proceso de sacar conclusiones o tomar


decisiones acerca de una población basado en los
resultados de la muestra.
El Proceso de Toma de
Decisiones
Decisión

Conocimiento Experiencia, Teoría,


Literatura,
Estadística Inferencial

Información
Estadística Descriptiva,
Inicia aqui: Probabilidad, Cálculos

Datos
Identificar el
Problema
Comprobación de lectura
Al completar este capitulo, usted debería ser
capaz de:
 Explicar como las decisiones a menudo se toman
basadas en información incompleta
 Explicar las diferencias entre:
 Población y Muestra
 Parámetro y Estadístico
 Estadística Descriptiva e Inferencial

 Describir el muestreo aleatorio

Ing. César Ricardo Barrera M.F..


Describiendo Datos
Numéricamente

Tendencia Central Variación


Var

Media Aritmética Rango

Mediana Rango Intercuartil

Moda Varianza

Desviación Estándar

Coeficiente de Variación
TENDENCIA CENTRAL

En resumen, el problema a resolver por la


tendencia central, es encontrar un
cierto valor del centro de la
distribución que los represente
a todos
Medidas de Tendencia Central
Resumen
Tendencia Central

Media Mediana Moda

x i
x i1
n
Promedio Punto medio de Valor mas
Aritmético valores frecuente
clasificados
MEDIA ARITMETICA
• x = MEDIA ARITMETICA. (Se lee equis mayúscula
suprarrayada)
• m = MEDIA ARITMETICA POBLACIONAL. (Se trata
de la letra minúscula griega mu
•  = Suma de ( Es la letra griega sigma (S)
mayúscula. Cada vez que usemos este símbolo
deberá leerse como (suma de))
• Xi = Denota los valores o conjunto de valores de
la serie. Se lee equis mayúscula sub-i
• N = Número de términos, casos o frecuencias.
Media Aritmética
• La media aritmética (media) es la medida
mas común de tendencia central
– Para una población de N valores:
N

x x1 x 2  xN
i Valores de
μ i1
 Población
N N
Tamaño de
Población
– Para una muestra
n
de tamaño n:
x i
x1 x 2  xn Valores
x i1
 Observados
n n
Tamaño de la Muestra
Media Aritmética
(continua)

• La medida mas común de tendencia central


• Media = suma de los valores dividido entre el numero de
valores
• Afectada por valores extremos

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Media = 3 Media = 4

12 3 4 5 15 12 3 4  10 20
 3  4
5 5 5
Ejemplo
• Tabla de frecuencias de los pesos en kg de 25 alumnos
(POBLACION).
N

x x1 x 2 XN
N

x
i
μ i1
i
1311
N N μ i1
N 25
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 56 56 57 58 μ  52.44
59 62 63 63 66
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA
DATOS

Datos sin agrupar Datos agrupados


xi f 52 2
Intervalo de Punto medio f
40 1 55 2 clase “xi”
42 1 56 2 38 – 42 40 2
43 1 57 1 43 – 47 45 4
44 2 58 1 48 – 52 50 8
45 1 59 1 53 – 57 55 5
48 1 62 1 58 – 62 60 3
49 1 63 2 63 - 67 65 3
50 2 66 1 Total 25
51 2 Total 25
Ejemplo: MEDIA ARITMETICA CON
DATOS SIN AGRUPAR
Xi f f.Xi
40 1 40
42 1 42
43 1 43
88

f. xi
44 2
45 1 45
1311
x x 48 1 48
49
N 49 1
25 50 2 100
51 2 102
52 2 104
55 2 110
56 2 112
57 1 57
x  52.44 58 1 58
59 1 59
62 1 62
63 2 126
66 1 66
Total 25 1311
MEDIA ARITMETICA CON DATOS
AGRUPADOS
f. xi 1310
x x
N x 52.4
25

Punto 52.4
Intervalo
medio f f.Xi
de clase
“xi”
38 – 42 40 2 80
43 – 47 45 4 180
48 – 52 50 8 400
53 – 57 55 5 275
58 – 62 60 3 180
63- 68 65 3 195
Total 25 1310
EJERCICIO MEDIA ARITMETICA
ZONAS DE ESTUDIANTES DEL 7º SEMESTRE EN
EJERCICIO MEDIA EL CURSO DE LEGISLACION TRIBUTARIA CUNOC
ARITMETICA
Se pide: 2014
• Ordenar los datos 50 58 29 17 56 54
• Establecer la 48 52 51 34 51 44
media aritmética 54 55 52 34 50 50
de la serie simple
de datos
25 60 47 54 57 39
• Formar una 7 47 15 34 47 53
distribución 31 37 49 42 48 45
ordinaria de 36 43 66 28 46 43
frecuencias de
47 40 47 56 52 38
valores sin
agrupar y calcular 34 41 49 50 43 63
la media 33 43 59 37 25 11
aritmética de los 49 51 56 35 45 40
mismos 5 50 41 47 54 36
MEDIANA

• Se entiende por mediana a un cierto valor de


la serie que deja bajo sí el 50% de los casos, y
por encima al otro 50% de los casos.
Mediana
• En una lista ordenada, la mediana es el numero que
esta justo en la mitad de los datos (50% arriba, 50%
abajo)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mediana = 3 Mediana = 3

• No es afectada por valores extremos


MEDIANA
• CASOS:
• Los datos forman una serie simple, que puede
ser: a) número impar de datos. b) número par
de datos.
• Los datos forman una distribución ordinaria
de frecuencias de valores sin agrupar.
• Los datos forman una distribución de
frecuencias de valores agrupados en
intervalos de amplitud variable o constante.
MEDIANA
• SERIE SIMPLE, que puede ser: a) número
impar de datos. b) número par de datos.

N+1
• P= -----
2

• P= Puesto o lugar de orden donde se halla la


mediana.
• N= Número de casos
MEDIANA
• SERIE SIMPLE, a) número impar de datos.
Peso de 25 estudiantes (en kg)
• N= 25
40 42 43 44 44
25+1 45 48 49 50 50
N+1
• P= -----
2 P= ---------- 51 51 52 52 55
2
• P= 13 55 56 56 57 58
59 62 63 63 66

• P nos indica el puesto que ocupa la mediana estando


ordenados los datos, contando en cualquiera de ambos
sentidos el puesto 13 lo ocupa el 52
MEDIANA
• SERIE SIMPLE, a) número par de datos.

• N= 24 Peso de 25 estudiantes (en kg)


40 42 43 44 44
24+1
45 48 49 50 50
• P= -----
N+1
2 P= ----------
2 51 51 52 52 55
• P= 12.5 55 56 56 57 58
59 62 63 63

P nos indica el puesto que ocupa la mediana estando ordenados los


datos, contando en cualquiera de ambos sentidos el puesto 12.5 lo
ocupa un lugar entre 51 y 52
Encontrando la Mediana
• La localización de la Mediana:

n 1
Posicion Mediana  posición en datos ordenados
2
– Si el numero de valores es impar, la mediana es el numero de en
medio de la serie
– Si el numero de valores es par, la mediana es el promedio de los dos
números del medio de la serie.

• Note que n 1 no es el valor de la mediana, solo la posición


2
de la mediana en los datos ordenados.
Xi f Fa

MEDIANA 40
42
1
1
1
2
3
• Los datos forman una
43 1
44 2 5

distribución ordinaria de 45 1 6
7
48 1
frecuencias de valores 49 1 8

sin agrupar. 50
51
2
2
10
12

52 2 14

55 2 16

56 2 18

57 1 19

58 1 20

59 1 21

62 1 22

63 2 24

66 1 25

Total 25
MEDIANA
• CALCULO:
• Se usa la columna de frecuencias Xi
40
f
1
Fa
1
acumuladas. 42
43
1
1
2
3

• Hallar la mitad de los casos , o sea N/2. 44


45
2
1
5
6

• Se busca en la columna de frecuencias


48 1 7
49 1 8
50 2
acumuladas (fa), la primera que sea igual a 51 2
10
12
N/2, o la primera, que sea superior a N/2. 52
55
2
2
14
16

• Si hay alguna frecuencia acumulada igual a 56


57
2
1
18
19
(fa=N/2) la mediana será la semisuma de el 58
59
1
1
20
21
valor que tiene (fa=N/2) y del siguiente. 62
63
1
2
22
24
• Si ninguna frecuencia acumulada es igual a 66 1
Total 25
25

N/2 la mediana será el valor de la


distribución que corresponde a la primera
frecuencia acumulada que supera a N/2
Xi f Fa
MEDIANA 40 1 1
42 1 2
• CALCULO: 43 1 3
44 2 5
• N=24 N/2= 24/2 N/2= 45 1 6
48 1 7
12 49 1 8
• Vemos que en la columna de fa 50 2 10
51 2 12
hay una fa=N/2 = 12 que 52 2 14
55 2 16
corresponde al Xi= 51 entonces la 56 2 18
mediana será: La semisuma de Xi 57 1 19
58 1 20
que tiene frecuencia acumulada 59 1 21
= N/2 y del siguiente. 62 1 22
63 2 24
• Md= (51+52)/2 = 51.5 Total 24
Xi f Fa

40 1 1
MEDIANA 42 1 2
43 1 3
• CALCULO: 44 2 5
45 1 6
• N=25 N/2= 25/2 N/2= 48 1 7
49 1 8
12.5 50 2 10
• Vemos que en la columna de fa 51
52
2
2
12
14
no hay ninguna igual a fa=N/2 55 2 16
56 2 18
entonces la mediana será el valor 57 1 19
que corresponde a la primera 58 1 20
59 1 21
frecuencia acumulada que supera 62 1 22
a N/2. Esta frecuencia es 14 y 63 2 24
66 1 25
corresponde al valor Xi= 52 Total 25
MEDIANA
• Los datos forman una distribución de
frecuencias de valores agrupados en
intervalos de amplitud variable o constante.
Interval Punto
o de medio f fa fa`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63 - 67 65 3 25 3
Total 25
MEDIANA
• Se forman dos columnas de frecuencias
acumuladas una ascendente y la otra
descendente.
Interval Punto
o de medio f fa fa`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63 - 67 65 3 25 3
Total 25
MEDIANA
• Hallamos N/2. En este ejemplo 25/2=12.5
• Buscamos el punto o lugar que deja bajo sí o
sobre sí 12.5 casos, o sea el 50% de los
mismos. Interval Punto
o de medio f fa fa`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63 - 67 65 3 25 3
Total 25
MEDIANA
• Observando la columna 4, de frecuencias
acumuladas fa, notamos que hasta el intervalo
43-47 hay 6 casos, y que en el intervalo
siguiente (48-52) hay 14 casos; o sea que N/2=
12.5 casos que están comprendidos entre los
14 casos del intervalo (48-52) y que en este se
halla la mediana.
MEDIANA
• Hacemos la diferencia 12.5-6=6.5
• Esto quiere decir que hasta el límite superior del intervalo 43-
47 que es 47.5 hay 6 casos,
• y necesitamos 6.5 casos más para llegar al valor de la
mediana. Como 47.5 es también el límite inferior del intervalo
48-52, se trata de ver cuántas unidades de medida hay que
agregar al valor 47.5 para estos 6.5 casos que faltan a N/2
• Supongamos que los 8 casos frecuencia absoluta del intervalo
48-52 se distribuyen homogéneamente
MEDIANA
• Es decir que 6.5 casos corresponden a 4.0625
unidades que sumadas al límite inferior 47.5
nos da como resultado 51.5625, que es el
valor de la mediana
Punto
Intervalo fa fa`
medio f
de clase ASCENDENTE DESCENDENTE
“xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63- 68 65 3 25 3
Total 25
MEDIANA
• Li-1= Límite inferior del intervalo donde esta
la mediana
• N/2= Mitad de los casos o 50%
• fa-1= frecuencia acumulada inmediata
anterior al intervalo donde esta la mediana.
• f= Frecuencia absoluta del intervalo donde
esta la mediana
• i= Amplitud del intervalo
MEDIANA
N/2- fa-1
• MD= Li-1+ --------------- .i
f
Interval Punto
o de medio f fa fa`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63- 68 65 3 25 3
Total 25
MEDIANA
𝑁
− 𝑓𝑎 − 1
𝑀𝐷 = 𝐿𝑖 − 1 + 2 .𝑖 Punto fa
𝑓 Intervalo
medio f ASCEND fa` DESCENDENTE
de clase
“xi” ENTE
25
−6
𝑀𝐷 = 47.5 + 2 .5 38 – 42 40 2 2 25
8
43 – 47 45 4 6 23
12.5 − 6
𝑀𝐷 = 47.5 + .5 48 – 52 50 8 14 19
8
53 – 57 55 5 19 11
6.5
𝑀𝐷 = 47.5 + .5 58 – 62 60 3 22 6
8
63- 68 65 3 25 3

𝑀𝐷 = 47.5 + 0.8125 𝑋 5 Total 25

𝑀𝐷 = 47.5 + 4.0625

𝑀𝐷 = 51.5625
Moda
• Una medida de tendencia central
• Valor que aparece mayor numero de veces
• No es afectado por valores extremos
• Usado para datos cualitativos o cuantitativos
• Puede que no exista la moda
• Puede que hayan varias modas a la vez

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Sin Moda
Moda = 9
Chap 3-8
MODA

• Se entiende por MODA a aquel valor de la


variable que mas se repite, el que tiene mayor
frecuencia.
MODA
• CASOS:
• Los datos forman una serie simple.
• Los datos forman una distribución ordinaria
de frecuencias de valores sin agrupar.
• Los datos forman una distribución de
frecuencias de valores agrupados en
intervalos de amplitud variable o constante.
MODA

• SERIE SIMPLE, que puede ser por simple


inspección.
MODA
• SERIE SIMPLE, Simple inspección
Peso de 25 estudiantes (en kg)
40 42 43 44 44
45 48 49 50 50
51 51 52 52 55
55 56 56 57 58
59 62 63 63 66
• Las modas son: 44, 50, 51, 52, 55,56, 63.
Xi f fi

MODA 40
42
1
1
1
2
3
• Los datos forman una 43
44
1
2 5

distribución ordinaria de 45 1 6

48 1 7
frecuencias de valores sin 49 1 8

agrupar. 50 2 10

51 2 12
• Se ubica por simple 52 2 14

inspección identificando la 55 2 16
18
56 2
columna de frecuencias 57 1 19

absolutas y se busca la fila 58 1 20

59 1 21
que tenga el mayor valor. 62 1 22

Y el valor Xi que 63 2 24

66 1 25
corresponda. Total 25
MODA
• Los datos forman una distribución de
frecuencias de valores agrupados en
intervalos de amplitud variable o constante.
Interval Punto
o de medio f fi fi`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63- 68 65 3 25 3
Total 25
MODA
• Puede tomarse como moda el punto medio o
marca de clase que tiene mayor frecuencia
absoluta. A esta se le denomina moda cruda.
Interval Punto
o de medio f fi fi`
ASCENDENTE DESCENDENTE
clase “xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63- 68 65 3 25 3
Total 25
MODA INTERPOLADA
• Ver cual es el intervalo de mayor frecuencia
absoluta y se aplica la formula.
Punto
Intervalo fi fi`
medio f
de clase ASCENDENTE DESCENDENTE
“xi”
38 – 42 40 2 2 25
43 – 47 45 4 6 23
48 – 52 50 8 14 19
53 – 57 55 5 19 11
58 – 62 60 3 22 6
63- 68 65 3 25 3
Total 25
MODA INTERPOLADA
fi+1
• Mo= Li-1+ --------------- .i Intervalo
Punto
medio f
fi-1+fi+1 de clase
“xi”
5
• Mo=47.5+ -------------------.5 38 – 42 40 2
43 – 47 45 4
4+5 48 – 52 50 8
• Mo=47.5+(0.5555*5) 53 – 57 55 5
58 – 62 60 3
• Mo= 47.5+2.7775 63- 68 65 3
Total 25
• Mo= 50.2775
MODA
• Mo= moda
• Li-1= Límite real inferior del intervalo donde
esta la moda
• fi+1= frecuencia absoluta inmediata siguiente
al intervalo donde esta la moda.
• fi-1= Frecuencia absoluta inmediata anterior
al intervalo donde esta la moda
• i= Amplitud del intervalo donde ésta la
moda.
Ejercicio de Revision

• Precios de 5 casas en una colina frente a la playa


$2,000 K
Precios de Casa:

$2,000,000
500,000 $500 K
300,000 $300 K
100,000
100,000

$100 K

$100 K

Chap 3-9
Ejercicio de Revisión:
Resumen Estadístico

Precios de casa:
• Media: ($3,000,000/5)
$2,000,000
500,000
= $600,000
300,000
100,000
100,000 • Mediana: Valor medio de datos ordenados
Suma 3,000,000
= $300,000

• Moda: Valor más frecuente


= $100,000
¿Que medida de ubicación es la
“mejor”?

• Media es generalmente usada, a


menos que existan valores extremos
• La mediana es usada con frecuencia,
dado que no es sensible a valores
extremos.
– Ejemplo: La mediana de los precios de
las casas puede ser una mejor medida
debido a su poca sensibilidad por
valores extremos.
Forma de una Distribución
• Describe como los datos están distribuidos
• Medidas de formas
– Simétrica o sesgada

Sesgada a la izquierda Simétrica Sesgada a la derecha

Media < Mediana Media = Mediana Mediana < Media


CUARTILES
• Son puntos de la escala de valores de la
distribución que dividen el total de medidas o
áreas de la curva de frecuencias en cuatro
partes iguales.
• Es decir que el numero total de casos es igual
a N/4.
• La distribución queda en cuatro partes que se
llaman cuartos, y a los puntos o valores que
separan un cuarto de otro se les llama
cuartiles.
Cuartiles
 Los Cuartiles separan los datos ordenados en 4
segmentos con un igual numero de datos en cada
segmento
25% 25% 25% 25%

Q1 Q2 Q3

 El primer cuartil, Q1, es el valor para el cual el 25% de las


observaiones son menores y el 75% mayores
 Q2 es igual a la mediana (50% por abajo, 50% por arriba)
 Solo 25% de los datos son mayores al valor del tercer
cuartil, Q3.
Formulas de Cuartiles

Encontrar un cuartil determinando su valor de


acuerdo a su posición en los datos ordenados,
donde:

Posición del Primer Cuartil: Q1 = 0.25(n+1)

Posición del Segundo Cuartil: Q2 = 0.50(n+1)


(La posición de la Mediana)

Posición del Tercer Cuartil: Q3 = 0.75(n+1)

donde n es el número de valores observados


Cuartiles

 Ejemplo: Encontrar el Primer Cuartil


Muestra de Datos Ordenados: 11 12 13 16 16 17 18 21 22

(n = 9)
Q1 = esta en la 0.25(9+1) = 2.5 posición de los datos ordenados
Asi que se usa el promedio entre el 2ndo y 3er valores,

asi que Q1 = 12.5


CUARTILES
• Qi= Cuartil que se busca
• Li-1= Límite real inferior del intervalo donde esta
el cuartil buscado
• i= sub índice numérico del cuartil buscado
• N= Número de casos o suma de frecuencias
• Fi-1= frecuencia acumulada inmediata anterior
al intervalo donde esta el cuartil buscado.
• ai= Amplitud del intervalo donde esta el cuartil
buscado
• fi= Frecuencia absoluta del intervalo donde esta
el cuartil que se busca
CALCULO DE CUARTILES EN DATOS
AGRUPADOS Interval Punto fa
i x N -F -1 o de medio
clase “xi”
f ASCEND
ENTE

4 i
• Qi= Li-1+ --------------- .ai 38 – 42 40 2 2

fi
43 – 47 45 4 6

48 – 52 50 8 14

53 – 57 55 5 19

58 – 62 60 3 22

63- 68 65 3 25

Total 25
CALCULO DE CUARTILES EN DATOS
AGRUPADOS Interval Punto fa
i x N -F -1 o de medio
clase “xi”
f ASCEND
ENTE

4 i
• Qi= Li-1+ --------------- .ai 38 – 42 40 2 2

fi
43 – 47 45 4 6

6.25 -6
• Q1=47.5+ -------------------.5
48 – 52 50 8 14

8 53 – 57 55 5 19

• Q1=47.5+(.03125x5) 58 – 62 60 3 22

• Q1=47.5+0.15625 63- 68 65 3 25

• Q1=47.65625 Total 25
DECILES
• Son puntos de la escala de valores de la
distribución que dividen el total de medidas o
áreas de la curva de frecuencias en diez partes
iguales.
• Es decir que el numero total de casos es igual
a N/10.
• La distribución queda dividida en diez partes
que se llaman decimos, y a los puntos o
valores que separan un decimo de otro se les
llama deciles.
DECILES
 Los deciles separan los datos ordenados en 10
segmentos con un igual numero de datos en cada
segmento
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9 D10

 El primer decil, D1, es el valor para el cual el 10% de las


observaiones son menores y el 90% mayores
 D5 es igual a la mediana (50% por abajo, 50% por arriba)

 D9 es igual a 90% menores y 10% mayores

Chap 3-6
Formulas de Deciles

Encontrar un decil determinando su valor de


acuerdo a su posición en los datos ordenados,
donde:

Posición del Primer decil: D1 = 0.10(n+1)

Posición del quinto decill: D5 = 0.50(n+1)


(La posición de la Mediana)

Posición del Tercer Cuartil: D9 = 0.90(n+1)

donde n es el número de valores observados


Deciles

 Ejemplo: Encontrar el Primer Decil


Muestra de Datos Ordenados: 11 12 13 16 16 17 18 21 22

(n = 9)
D1 = esta en la 0.10(9+1) = 1 posición de los datos ordenados

Asi que el primer decil se ubica en el dato 1 o sea 11

asi que D1 = 11
DECILES
• Di= Decil que se busca
• Li-1= Límite real inferior del intervalo donde esta
el decil buscado
• i= sub índice numérico del decil buscado
• N= Número de casos o suma de frecuencias
• Fi-1= frecuencia acumulada inmediata anterior
al intervalo donde esta el decil buscado.
• ai= Amplitud del intervalo donde esta el decil
buscado
• fi= Frecuencia absoluta del intervalo donde esta
el decil que se busca
CALCULO DE DECILES EN DATOS
AGRUPADOS Interval Punto fa
i x N -F -1 o de medio
clase “xi”
f ASCEND
ENTE

10 i
• Di= Li-1+ --------------- .ai 38 – 42 40 2 2

fi
43 – 47 45 4 6

48 – 52 50 8 14

53 – 57 55 5 19

58 – 62 60 3 22

63- 68 65 3 25

Total 25
CALCULO DE DECILES EN DATOS
AGRUPADOS Interval Punto fa
i x N -F -1 o de medio
clase “xi”
f ASCEND
ENTE

10 i
• Di= Li-1+ --------------- .ai 38 – 42 40 2 2

fi
43 – 47 45 4 6

2.5 -2
• D1=43.5+ -------------------.5
48 – 52 50 8 14

2 53 – 57 55 5 19

• D1=43.5+(0.25x5) 58 – 62 60 3 22

• D1=43.5+0.25 63- 68 65 3 25

• D1=43.75 Total 25

You might also like