You are on page 1of 38

REDUCCION DE DATOS

REDUCCION DE DATOS

La Estadstica plantea mtodos para reducir datos y
sustituir toda la tabla de frecuencia por unos pocos
valores representativos del conjunto, es decir
remplazar la distribucin de frecuencias por unas
pocas caractersticas descriptivas, que constituyen
los llamados estadgrafos. Los estadgrafos son
medidas de resmenes estadsticas. Se definen
cuatro tipos de estadgrafos:
De Posicin o Tendencia Central
De Dispersin o Variabilidad
De Deformacin o Asimetra
De Apuntamiento o Kurtosis

ESTADIGRAFO DE POSICION
A.- ESTADIGRAFOS DE TENDENCIA CENTRAL
PARA DATOS NO AGRUPADOS
a.1.- MEDIA: Es el promedio, en la cual se
define como el cociente de la suma de los
valores de una variable entre el numero de
observaciones.
n
n
i
i
x
X

=
=
1
___
a.2.- MEDIANA: Es el valor de la variable que divide
en dos partes iguales al conjunto de valores
ordenado de una distribucin de frecuencias.
Cuando se quiere encontrar la mediana para datos
desagrupados, como primer paso se ordena en
forma ascendente o descendente.
b.1) n = impar

b.2) n = par
Central o Ter M X
e
min = =
~
centrales valores dos los de omedio M
X
e
Pr = =
~
c.- MODA: Es el valor que se presenta con ms
frecuencia o el que ms se repite.




datos de conjunto un de frecuente mas valor el Es M X = =
0
0
Ejemplo: Los precios promedios en el mercado
mayorista N
o
1 desde enero a noviembre en el
2012 del camote amarillo son:
1.11 1.13 1.16 1.22 1.31 1.26 1.22 1.00 1.29
1.06 1.03 (Nuevos soles por kilogramos)
a.1.- MEDIA:


Interpretacin: El promedio del camote amarillo
por mes es 1.16 nuevos soles por kilogramo

1627 . 1
11
1.03 1.06 1.29 1.00 1.22 1.26 1.31 1.22 1.16 1.13 1.11
1
___
=
+ + + + + + + + + +
= =

=
n
n
i
i x
X
a.2.- MEDIANA:
n = 11 es impar entonces se ordena en forma
ascendente o descendente:
1.00 1.03 1.06 1.11 1.13 1.16 1.22 1.22 1.26
1.29 1.31


Interpretacin: Del total de meses, el 50%
tienen precios inferiores o iguales a 1.6 Kg, en
tanto que los restantes tienen precios superiores
a 1.16 nuevos soles por Kilogramos.


16 . 1 =
~
X
a.3.- MODA:


Interpretacin: El precio promedio de camote
amarillo ms frecuentes es 1.22 nuevos soles
por kilogramo



22 . 1
0
0
= = M X
B.- ESTADIGRAFOS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
B.1.- TABLAS SIN INTERVALOS:
b.1.- MEDIA PONDERADA: Es el promedio
cuando los datos estn agrupados en tablas
de frecuencia sin intervalos.
n
i
m
i
i
f y
Y

=
=
1
___
b.2.- MEDIANA:
F
i
: Frecuencia Absoluta Acumulada
n : Nmero total de observaciones
Y
j
: Valores distintos categorizados

Y X F F F
j j j i
n n
I Caso = < < =
~

2 2
:
1
2 2 2
:
1
1
Y
Y
X F F F
j
j
j j i
n n
II Caso
+
= < = =

~

b.3.- MODA: f
j
es el valor ms frecuente
elegido de las f
i
quienes son las frecuencias
absolutas.
Y
M f
j
O
O
j
X frecuente mas = =
Ejemplo: La oficina general de Estadsticas y
Tecnologas de la Informacin y Comunicaciones del
Ministerio de Trabajo y Promocin del Empleo, di la
ultima informacin respecto al nmero de huelgas
ocurridos en el Per desde el mes enero del 2012 al
mes de febrero de 2013:


Hallar la media, mediana y moda
Solucin:
Muestra: 14 meses
Variable X
i
:

Nmero de huelgas
Enero Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Noviembre Diciembre Enero Febrero
5 5 12 16 16 7 2 2 7 2 7 7 2 2
Datos: X
1
,

X
2
, .., X
13
, X
14

Los valores distintos de la variable X
i
numero de
huelgas, vamos a denotarlo por y
i
resultando:
y
1
= 2, y
2
= 5, y
3
= 7, y
4
= 12, y
5
= 16
Nmero de
huelgas (Y
i
)
Nmero de
meses (f
i
) F
i
Y
i
f
i

2 5 5 10
5 2 7 10
7 4 11 28
12 1 12 12
16 2 14 32
n=14 92
F
j-1

F
j

Y
j-1

Y
j

MEDIA PONDERADA:



Interpretacin: El promedio de huelgas por
mes es 6.57
mes por as hue
n
f y
Y
i
i i
lg 57 . 6
14
92
14
2 * 16 1 * 12 4 * 7 2 * 5 5 * 2
5
1
= =
+ + + +
= =

=

MEDIANA:




Interpretacin: Del total de meses, el 50%
tienen huelgas inferiores o iguales a 6, en tanto
que los restantes tienen huelgas superiores a
6.

6
2
7 5
11 7 7
2
14
1
=
+
= < = =
~
X Fj
2 2 2
:
1
1
Y
Y
X F F F
j
j
j j i
n n
II Caso
+
= < = =

~

MODA:



Interpretacin: El nmero de huelga ms
frecuente es 2

2 5
1 0
0
= = = = Y M X frecuente ms f
j
Ejemplo: En una muestra de 20 pequeas
empresas considerar el nmero de trabajadores
por empresa. Con estos datos, determinar la
distribucin de las empresas segn el nmero
de trabajadores. Cul es el nmero promedio
de trabajadores por empresa?
X
1
= 6 X
2
= 5 X
3
= 4 X
4
= 4 X
5
= 3
X
6
= 3 X
7
= 4 X
8
= 4 X
9
= 5 X
10
= 5
X
11
= 4 X
12
= 5 X
13
= 6 X
14
= 2 X
15
= 4
X
16
= 3 X
17
= 4 X
18
= 6 X
19
= 5 X
20
= 3

Solucin:
Muestra: 20 empresas
Variable: X = Nmero de trabajadores por
empresa
Datos: X
1
,

X
2
, .., X
19
, X
20

Los valores de la variable van de 2 a 6,
entonces a los distintos valores de la variable
X
i
, la vamos a denotar por y
i
, resultando:
y
1
= 2, y
2
= 3, y
3
= 4, y
4
= 5, y
5
= 6


Entonces hacemos la construccin de la tabla de
frecuencia:

Nmero de
Trabajadores
Nmero de
Empresas
Frecuencia Absoluta
Acumulada
Y
i
f
i
F
i
Y
i
f
i

y
1
= 2
y
2
= 3
Y
j
y
3
= 4
y
4
= 5
y
5
= 6
f
1
= 1
f
2
= 4
f
3
= 7 f
j

f
4
= 5
f
5
= 3
1
5 F
j-1

12 F
j

17
20
Y
1
f
1
= 2
Y
2
f
2
= 12
Y
3
f
3
= 28
Y
4
f
4
= 25
Y
5
f
5
= 18
m = 5 n = 20 85
5
1
=

= i
i i
f y
a) MEDIA:


b) MEDIANA:



c) MODA:


empresa por es trabajador
n
f y
Y
i
i i
25 . 4
20
85
5
1
= = =

=

j j j i
Y X F
n
F F
n
I Caso = < < =
~

2 2
:
1
4 7
3 0
= = = = Y M X frecuente mas f
O
j
4 12 10 5 10 :
3
= = < < =
~
Y X F I Caso
i
B.2.- TABLAS CON INTERVALOS:
b.1.- MEDIA PONDERADA:

n
i
m
i
i
f y
Y

=
=
1
___
b.2.- MEDIANA:
F
i
: Frecuencia Absoluta Acumulada
c: Amplitud del Intervalo
L
j
= L
i
: Limite Inferior

(
(
(

+ = = < < =

F F
F
L M X F F F
j j
j
j e j j i
n
c
n n
I Caso
1
1
1
2
2 2
:
i
j j j i
L Inf erior Limite
n n
II Caso
L X F F F
= = = < = =
~

2 2
:
1
b.3.- MODA:
f
i
: Frecuencia Absoluta
c: Amplitud del Intervalo
L
j
= L
i
: Limite Inferior


(
(

+
+ =
+
+
1 1
1
0
j j
j
j
f f
f
c L M
i j
f la de frecuente ms f
Ejemplo: Una empresa que se dedica a preparar dietas,
proyecta lanzar al mercado una dieta rigurosa. Los
empleados de una compaa se presentaron como
voluntarios para dicha promocin. Se realiz un
muestreo con 48 empleados elegidos aleatoriamente.
Los resultados del chequeo de los pesos (en kg) fueron:
















80.6 65.8 49.6 79.1 84.4 79.3
53.2 60.2 91.2 74.8 78.6 58.6
76.9 77.4 67.9 63.7 49.9 68.8
88.3 94.6 57.3 87.3 74.3 90.4
75.6 41.4 73.6 71.4 83.2 96.4
65.2 62.1 44.8 82.9 81.7 74.6
54.2 75.3 50.1 61.1 42.3 56.2
80.2 60.2 71.6 77.1 94.9 82.1
Hallar las medidas de tendencia central
Solucin:
Muestra: 48 empleados
Variable: Pesos
Tipo de Variable: Variable Cuantitativa
Continua
Unidad de Anlisis: El Empleado

a) Organice los datos en una Tabla de frecuencias:
Paso 1: Determinar el valor mximo y mnimo de X
i

X
min
= 41.4 y X
max
= 96.4
Paso 2: Hallar el recorrido:
R = X
max
- X
min
= 96.4 41.4= 55
Paso 3: Nmero de intervalos (m); n = 48:
m = 1 + 3.322logn
m = 1 + 3.322log48
m = 6.58096 7
Paso 4: Determinar la amplitud de los intervalos c.
Dado m = 7

8 86 . 7
7
55
~ = = =
m
R
c
i
Paso 5: Construir la tabla de frecuencia:

Intervalos Y
i

n
i
= f
i
h
i
F
i
= N
i
H
i

Y
i
f
i

[41.4 _ 49.4> 45.4 3 0.06 3 0.06 136.2 6183,48
[49.4 _ 57.4> 53.4 7 0.15 10 0.21 373.8 19960,92
[57.4 _ 65.4> 61.4 7 0.15 17 0.36 429.8 26389,72
[65.4 _ 73.4> 69.4 5 = f
j-1
0.10 22 = F
j-1
0.46 347 24081,8
L
j
[73.4 _ 81.4> 77.4 14 = f
j
0.29 36 = F
j
0.75 1083.6 83870,64
[81.4 _ 89.4> 85.4 7 = f
j+1
0.15 43 0.9 597.8 51052,12
[89.4 _ 97.4> 93.4 5 0.10 48 1 467 43617,8
n=48 1.00 3435.2 255156.48
f y
i i
2
f
i
i
y

=
7
1
2
f
Y
i
i
i

=
7
1
b) Usando la Tabla de Distribucin frecuencias,
hallar la media aritmtica e interpretar






Interpretacin: 71.57 Kg. es el peso promedio
de los empleados

n n
f y
f y f y f y f y
Y
m m
m
i
i i
+ + + +
= =

=

3 3 2 2 1 1 1
Kg
n
f y
Y
i
i i
57 . 71
48
3435
7
1
= = =

=

c) Usando la Tabla Distribucin frecuencias,


hallar la Mediana e interpretar.




Interpretacin: Del total de empleados, el 50%
tienen pesos inferiores o iguales a 74.54 Kg, en
tanto que los restantes tienen pesos superiores
a 74.54 Kg.

54 . 74
22 36
22
2
48
8 4 . 73
2
36 24 22
2
24
2
48
2
1
1
1
=
(
(
(
(

+ =
(
(
(
(

+ =
< < < < = = =

F F
F
L M
F F F
j j
j
j e
j j i
n
c
n n
d) Usando la Tabla Distribucin frecuencias,
hallar la Moda e interpretar.
Hallar en la tabla de frecuencia:

y observar detenidamente y obtener la Moda:



Interpretacin: Indica que el peso ms
frecuente de los 48 empleados es 78.06
06 . 78
7 5
7
8 4 . 73
1 1
1
=
(

+
+ =
(
(

+
+ =
+
+
f f
f
L M
j j
j
i o
c
14 = frecuente mas
f
j


PROPIEDADES DE LA MEDIA


La media aritmtica de una constante es igual
a la misma constante


La media del producto de una constante por
una variable, es igual al producto de la
constante por la media de la variable

K
n
K
n
i
=

=1
X K
n
Kx
n
i
i
=

=1
La media de la suma de dos o ms variables,
es igual a la suma de las medias de cada una
de dichas variables.



La media de una variable mas una constante,
es igual a la media de la variable ms la
constante.


Y X
n
y x
n
i
i
n
i
i
+ =
+

= = 1 1
K X
n
K x
n
i
i
+ =
+

=1
Si una muestra se divide en r-submuestras,
entonces la media total de la muestra, es igual a
la suma de las medias de las submuestras
ponderadas por sus respectivos tamaos,
dividido entre el tamao de la muestra total


n
1
= Tamao de la primera submuestra
n
2
= Tamao de la primera submuestra
.
n
r
= Tamao de la primera submuestra
n
1
+ n
2
+ .+ n
r
= n =Tamao de la muestra total

r
r
r
n n n
n n n
Y
Y Y Y
+ + +
+ + +
=
......
....
2 1
2
2
1
1
Ejemplo: En una empresa la edad promedio de
las 17 trabajadoras mujeres es de 31.2 y la
edad promedio de los 23 trabajadores
hombres es de 38. Cul es la edad promedio
del total de trabajadores?

1 . 35
23 17
) 23 ( 38 ) 17 ( 2 . 31
2 1
2
2
1
1
=
+
+
=
+
+
=
n n
n n
Y
Y Y
RELACION ENTRE LA MEDIA MEDIANA Y
MODA
Si la distribucin es simtrica, entonces:




0
M M X
e
= =
0
M M X
e
= =
Si la distribucin es asimtrica de cola a la
derecha, entonces:

X M M
e
< <
0
X M M
e
< <
0
Si la distribucin es asimtrica de cola a la
izquierda, entonces:

0
M M X
e
< <
0
M M X
e
< <
La media se usa con mas frecuencia por su
mejor tratamiento algebraico, pero no
siempre es un buen promedio.
La distribucin de frecuencia es simtrica o
casi simtrica entonces la media, mediana o
moda es el promedio ms representativo.
Si la distribucin tiene marcada asimetra,
entonces, la mediana es la medida promedio
mas representativa.

You might also like