You are on page 1of 6

ESTADSTICA DESCRIPTIVA

INTRODUCCION
La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los
estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el
comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales).
Las variables tambin se pueden clasificar en:
Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una
clase).
Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los
alumnos de una clase).
Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los
alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3...., etc,
pero, por ejemplo, nunca podr ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3
km/h, 94,57 km/h...etc.

DEFINICIONES ELEMENTALES
1.1. Poblacin: Se llama al conjunto de datos del cual se extrae la informacin que interesa analizar (edades, distancias,
valor de IPC, kilogramos, antigedad laboral, estaturas, etc). Se denota como una sucesin x1,x 2,x3 ,... .
1.2. Muestra: Es el subconjunto de la poblacin que se considera para el estudio

x1,x2,x3,...,xn

1.3. Tamao de la muestra (n): Es la cantidad de elementos que hay en la muestra.

TABLA DE DISTRIBUCIN DE FRECUENCIAS


El uso de tablas provee una organizacin prctica de la informacin, permitiendo inferir conclusiones cuantitativas.
Ella puede de manera no agrupada y agrupada (dependiendo de factores como la cantidad de datos o la diferencia entre
ellos).
FRECUENCIAS ABSOLUTAS.a) Frecuencia Absoluta

ni : Cantidad de veces que se repite un dato

b) Frecuencia Relativa

fi : Representacin proporcional del dato xi

c) Frecuencia Porcentual

pi : Representacin porcentual del dato

FRECUENCIAS ACUMULADAS.a) Frecuencia Absoluta Acumulada


Es decir,

Ni = n1 +n2 +...+ni

b) Frecuencia Relativa Acumulada


Es decir,

respecto del tamao de la muestra,

fi =

ni
.
n

xi , pi = fi 100% .

Ni : Suma de las frecuencias absolutas hasta ni .


Fi : Suma de las frecuencias relativas hasta

Fi = f1 + f2 +...+ fi

c) Frecuencia Porcentual Acumulada


Es decir,

xi .

fi .

Pi : Suma de las frecuencias porcentuales hasta pi .

Pi = p1 +p2 +...+pi

ENFERMERIA INACAP

Pgina 1

En resumen, una tabla de distribucin de frecuencias puede estructurarse como sigue:


Datos o
variables
( xi )

Frecuencia
Absoluta
( ni )

Frecuencia
Relativa
( fi )

Frecuencia
Porcentual
( pi )

Frecuencia
Absoluta
Acumulada
( Ni )

Frecuencia
Relativa
Acumulada
( Fi )

Frecuencia
Porcentual
Acumulada
( Pi )

x1

n1

f1

p1

N1

F1

P1

x2

n2

f2

p2

N2

F2

P2

x3

n3

f3

p3

N3

F3

P3

xn

nn

fn

pn

100%

ni n

fi 1 pi 100%

TIPOS DE DISTRIBUCIONES DE FRECUENCIAS


DISTRIBUCIN DE FRECUENCIA NO AGRUPADA
EJEMPLO 1: Los siguientes datos corresponden a las edades de un grupo de 35 jvenes encuestados

18
21
21
20
19

19
17
20
21
18

19
19
20
21
20

19
21
20
19
19

20
18
19
19
20

18
19
20
19
18

20
18
20
20
20

El Rango (R) es la diferencia entre el dato mayor y el menor. Esto es, R = xmx xmin .
Rango = R = 21 17 = 4 aos
Dicha informacin puede presentarse en una tabla de distribucin de frecuencias como sigue:
Edad
(en aos )

xi
17
18
19
20
21

Cantidad
de
Jvenes
( ni )
1
6
11
12
5
n = 35

Fraccin
de jvenes
( fi )

Porcentaje
de jvenes
( pi )

0,029
0,171
0,314
0,343
0,143
= 1

2,9%
17,1%
31,4%
34,3%
14,3%
=100%

Algunas lecturas e interpretaciones:


N3 =18
n3 = 11
- x3 =19
-

F4 = 0,857

Ni
1
7
18
30
35

Fi

Pi

0,029 2,9%
0,2
20%
0,514 51,4%
0,857 85,7%
1
100%

P2 = 20%

Cantidad de jvenes encuestados con 18 aos de edad 6 jvenes


Porcentaje de jvenes encuestados que tienen 20 aos de edad 34,3%
Porcentaje de jvenes encuestados que a lo ms tienen 20 aos de edad 85,7%
Nmeros de jvenes que tienen ms de 18 aos pero menos de 21 23 jvenes

ENFERMERIA INACAP

Pgina 2

DISTRIBUCIN DE FRECUENCIA AGRUPADA


Cuando la muestra es muy grande o los datos muy heterogneos, se suele agrupar la informacin por intervalos de la
forma

xi 1, xi (tambin se escribe como

xi 1 xi ).

Se define en estos casos:

Rango

Amplitud del Intervalo: A =

Nmero de intervalos

Marca de Clase del Intervalo

xi 1, xi :

mi =

xi-1 + xi
2

EJEMPLO 2: Se registraron los sueldos (en miles de pesos) que una empresa del sector financiero paga a sus empleados
no profesionales. Se pide presentar dicha informacin en una tabla de frecuencias de 4 intervalos.

182
206
218
192
187

215
190
220
210
260

200
212
182
187
206

218
222
235
250
198

205
205
210
255
210

198
238
198
260
180

248
230
196
220
228

221
185
235
214
205

Como Rango = R = 260 180 = 80 aos


Entonces, la amplitud del intervalo es: A =

Rango
Nmero de intervalos

260 - 180
4

= 20

Los intervalos se forman comenzando del dato menor y sumando la amplitud (ancho del intervalo) igual a 20:
Sueldos
(en miles
de pesos )

xi 1 xi
180 - 200
200 - 220
220 - 240
240 - 260

Marca de
Clase
( mi )

Nmero de
empleados
( ni )

Fraccin de
empleados
( fi )

Porcentaje de
empleados
( pi )

190
210
230
250

12
14
9
5
n = 40

0,3
0,35
0,225
0,125
= 1

30%
35%
22,5%
12,5%
=100%

Algunas lecturas e interpretaciones:


- m3 = 230
n3 = 9
-

N3 = 35

p2 = 35%

Ni
12
26
35
40

Fi

Pi

0,3
30%
0,65
65%
0,875 87,5%
1
100%

P2 = 65%

Cantidad de trabajadores con sueldos entre $220.000 y $240.000 9 trabajadores


Porcentaje de trabajadores con sueldos entre $240.000 y $260.000 12,5%
Porcentaje de trabajadores con sueldos menores que $240.000 87,5%
Porcentaje de trabajadores con sueldos de al menos $200.000 70% trabajadores

ENFERMERIA INACAP

Pgina 3

MEDIDAS DE POSICION (TENDENCIA).


Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. Estas medidas permiten
conocer diversas caractersticas de esta serie de datos.
Las medidas de posicin son de dos tipos: Central (informan sobre los valores medios de la serie de datos) y No Central
(informan de como se distribuye el resto de los valores de la serie)
MEDIDAS DE POSICION (TENDENCIA) CENTRAL.
Nmeros que representan al conjunto de datos y que por lo general se presentan al centro de la distribucin.
Media Aritmtica o Promedio
a) Pequea cantidad de datos
n

xi
x=

i=1

x : corresponde al promedio de los datos en estudio.

x1,x2...xn

Ejemplo:
Si

x1 =3 ; x2 = 5 ; x3 = 8 entonces

x=

3 + 5 + 8 16
=
3
3

n
n

xi ni
x=

b) Datos en Tabla de Frecuencias (no agrupada):

i=1

Una vez obtenida la Tabla de Frecuencia:


Edad
(en aos )

xi
17
18
19
20
21

Cantidad
de
Jvenes
( ni )
1
6
11
12
5
n = 35

Fraccin
de jvenes
( fi )

Porcentaje
de jvenes
( pi )

0,029
0,171
0,314
0,343
0,143
= 1

2,9%
17,1%
31,4%
34,3%
14,3%
=100%

Luego la edad promedio de los jvenes es:

x=

Ni
1
7
18
30
35

xi ni

Pi

Fi

0,029 2,9%
0,2
20%
0,514 51,4%
0,857 85,7%
1
100%

17
108
209
240
105
xi ni = 679

679
= 19,4 aos
35
n

mi ni
c) Datos en Tabla de Frecuencias (agrupada):

x=

i=1

mi =

xi-1 + xi
2

Una vez obtenida la Tabla de Frecuencia:


Sueldos
Marca
(en miles
de pesos ) de Clase
( mi )

xi 1 xi

180 - 200
200 - 220
220 - 240
240 - 260

190
210
230
250

Nmero
de
empleados
( ni )

Fraccin
de
empleados
( fi )

Porcentaje
de
empleados
( pi )

12
14
9
5
n = 40

0,3
0,35
0,225
0,125
= 1

30%
35%
22,5%
12,5%
=100%

Luego el sueldo promedio de los trabajadores es: x =

ENFERMERIA INACAP

Ni
12
26
35
40

Fi

Pi

0,3
30%
0,65 65%
0,875 87,5%
1
100%

mi ni
2280
2940
2070
1250
mi ni = 8540

8540
= 213,5 . Es decir, el sueldo promedio es de $213.500 pesos.
40

Pgina 4

Mediana (Me): valor que divide a la muestra en dos partes iguales (el 50% de los datos es menor que ese valor y el 50%
restante es mayor)
a) Pequea cantidad de datos

x1,x2...xn

Cantidad de datos par

2,4,4,1,2,3,9,8,7,6 1,2,2,3,4,4,6,7,8,9 Me =

4+4
=4
2

4+5
= 4,5
2
4,4,8,5,2,3,5 2,3,4,4,5,5,8 Me = 4

2,4,5,7,3,6 2,3,4,5,6,7 Me =
Cantidad de datos impar

b) Datos en Tabla de Frecuencias (no agrupado)


Edad
(en aos )

xi
17
18
19
20
21

Como

Cantidad
de
Jvenes
( ni )
1
6
11
12
5
n = 35

Fraccin
de jvenes
( fi )

Porcentaje
de jvenes
( pi )

0,029
0,171
0,314
0,343
0,143
= 1

2,9%
17,1%
31,4%
34,3%
14,3%
=100%

Ni
1
7
18
30
35

Fi

xi ni

Pi

0,029 2,9%
0,2
20%
0,514 51,4%
0,857 85,7%
1
100%

17
108
209
240
105
xi ni = 679

n 35
=
= 17,5 luego Nj = 18 Me = 19 aos
2 2

Donde j es la clase donde la frecuencia absoluta acumulada N j supera inmediatamente al valor n

c) Datos en Tabla de Frecuencias (agrupado):


Sueldos
Marca
(en miles
de
Clase
de pesos )
( mi )

xi 1 xi

180 - 200
200 - 220
220 - 240
240 - 260

190
210
230
250

Nmero
de
empleados
( ni )

Fraccin
de
empleados
( fi )

Porcentaje
de
empleados
( pi )

Ni

12
14
9
5

0,3
0,35
0,225
0,125

30%
35%
22,5%
12,5%

12
26
35
40

n = 40

= 1

=100%

Fi

mi ni

Pi

0,3
30%
0,65 65%
0,875 87,5%
1
100%

2280
2940
2070
1250
mi ni = 8540

A - Nj-1
2

Para su clculo usaremos la siguiente frmula: Me = x j-1 +


nj
Donde j es la clase donde la frecuencia absoluta acumulada

N j supera inmediatamente al valor n 2

40

20 -12
n 40
2
= 211,429
= 20 Nj = 26, as Me = 200 +
Como =
2 2
14

ENFERMERIA INACAP

Respuesta: $211.429

Pgina 5

Moda (Mo): valor que ms se repite (de mayor frecuencia) en un conjunto de datos.
a) Pequea cantidad de datos

x1,x2...xn
1,3,3,4,5,3,4,4,2,2,1 Mo = 3 y 4
2,3,7,8 no existe moda
3,4,4,2,3,4 Mo = 4

b) Datos en Tabla de Frecuencias (no agrupado)


Edad
(en aos )

xi
17
18
19
20
21

Cantidad
de
Jvenes
( ni )
1
6
11
12
5
n = 35

Fraccin
de jvenes
( fi )

Porcentaje
de jvenes
( pi )

0,029
0,171
0,314
0,343
0,143
= 1

2,9%
17,1%
31,4%
34,3%
14,3%
=100%

Ni
1
7
18
30
35

Fi

xi ni

Pi

0,029 2,9%
0,2
20%
0,514 51,4%
0,857 85,7%
1
100%

17
108
209
240
105
x

i ni = 679

Como nj mayor es n4 =12 Mo = 20 aos

Donde j es la clase donde se encuentra la mayor frecuencia absoluta n j


c) Datos en Tabla de Frecuencias (agrupado)
Sueldos
Marca
(en miles
de pesos ) de Clase
( mi )

xi 1 xi

180 - 200
200 - 220
220 - 240
240 - 260

190
210
230
250

Nmero
de
empleados
( ni )

Fraccin
de
empleados
( fi )

Porcentaje
de
empleados
( pi )

Ni

12
14
9
5

0,3
0,35
0,225
0,125

30%
35%
22,5%
12,5%

12
26
35
40

n = 40

= 1

=100%

Para su clculo usaremos la siguiente frmula:

Pi

Fi

0,3
30%
0,65 65%
0,875 87,5%
1
100%

mi ni
2280
2940
2070
1250
mi ni = 8540

d1

d
1 + d2

Mo = x j-1 + A

Donde j : clase donde se encuentra la mayor frecuencia absoluta

n j . Adems d = n - n
1

j-1

y d2 = n j - n j+1

2
Como n j = 14 Mo = 200 + 20
= 205,714
2+5
Respuesta: $205.741

ENFERMERIA INACAP

Pgina 6

You might also like