You are on page 1of 10

TEMA 2: MEDIDAS ESTADSTICAS

1. INTRODUCCIN
En numerosas ocasiones, en vez de trabajar con todos los datos, es
preferible disponer de una o ms medidas descriptivas que resumen los
datos de forma cuantitativa. Estas medidas se llaman parmetros (a
veces se utiliza el trmino estadstico cuando nos referimos a una
muestra). La Estadstica descriptiva es la rama de la Estadstica que se
encarga del recuento, ordenacin y clasificacin de los datos y es la que
define y calcula los parmetros estadsticos que caracterizan la
distribucin. Se trata, pues, de resumir en unos cuantos valores la
informacin ms importante y til contenida en un conjunto de datos,
haciendo ms fcil la comprensin y la comparacin de las diversas
caractersticas de las poblaciones o muestras.
2. MEDIDAS DE POSICIN
A continuacin estudiaremos diferentes parmetros estadsticos que nos
permitirn conocer la tendencia posicional de los datos. Veremos en
primer lugar medidas de tendencia central y posteriormente otras
medidas alusivas igualmente a la posicin.
a) Medidas de centralizacin
* Media.
A veces se llama tambin media aritmtica, valor medio, promedio o
promedio aritmtico.
Consideramos una variable estadstica discreta cuya distribucin de
frecuencias es xi , f i
Se define la media aritmtica como:
k

x xi f i
i 1

Si consideramos una variable estadstica continua cuya distribucin de


frecuencias es I i , fi
la media se calcula suponiendo que todos los datos de cada intervalo son
idnticos al centro o marca de la clase.
k

La media ser:

x ci f i
i 1

El sentido de la media es el derepartir equitativamente la suma total


de los datos entre los individuos de la muestra.

* Moda.
Se define como el valor de la variable estadstica que tiene mayor
frecuencia, es decir:
M o xi

si

ni max n j

Cuando la variable sea continua hablaremos del intervalo modal como


aquel que presenta mayor frecuencia absoluta.
Calculo de la moda:
En variables discretas basta con identificar el valor con la mayor
frecuencia absoluta.
En variables continuas, una vez identificado el intervalo modal, algunos
autores toman la marca de la clase de dicho intervalo como moda, si
bien, es habitual calcular la moda mediante la siguiente frmula:
n
M o Li 1 c i 1
ni 1 ni 1
donde Li 1 , Li es el intervalo modal y c la amplitud
Observaciones:
La moda no tiene por qu ser nica, Puede haber ms de un valor de la
variable con la mayor frecuencia. En este caso se dir que la distribucin
es bimodal, trimodal,...
*Mediana.
Dado un conjunto de observaciones, ordenadas de menor a mayor, la
mediana Me es una observacin que divide esta ordenacin en dos
partes, con el mismo n de datos en cada una.
Es decir, el n de observaciones menores que la mediana es igual al n de
observaciones mayores que ella.
Clculo de la mediana

Distribuciones unitarias: - Si n es impar, ser el valor central de la


distribucin ordenada.
- Si n es par, ser la suma de los valores
centrales entre 2.
Distribuciones no unitarias: - Si N i supera a N / 2 , ser el xi
correspondiente a ese N i .
- Si N i = N / 2 , ser la media aritmtica entre
xi y xi 1 .
Distribuciones agrupadas: - Si N i supera a N / 2
N / 2 N i 1
M e Li 1
ci
ni
- Si N i = N / 2 M e es el lmite superior del
intervalo.

b) Otras medidas de posicin


Anlogamente a la mediana, que divide los datos en dos partes iguales,
se definen otras medidas que dividirn los datos en cuatro, diez o cien
partes.

Se denominan cuartiles a tres valores Q 1 , Q 2 , Q 3 que dividen la


serie ordenada de datos en cuatro partes iguales.
Se denomina deciles a nueve valores D 1 ,....D 9 que dividen la serie
ordenada de datos en diez partes iguales.
Se denominan percentiles a los 99 valores P 1 ,.....P 99 que dividen
la serie ordenada de datos en 100 partes iguales.

Se definen genricamente como cuantiles a los cuartiles, deciles,


percentiles,.....Los cuantiles de denominan tambin parmetros de
estructuras y son muy utilizados en las CC.Sociales.
3. MEDIDAS DE DISPERSIN
Las medidas de posicin central no proporcionan, en general,
suficiente informacin para una adecuada descripcin de los datos,
porque no toman en cuanta la dispersin o concentracin de los
mismos, por lo tanto es claro que se requieren otras medidas que
indiquen el grado de variabilidad de los datos.
Estas medidas son necesarias para efectuar comparaciones
significativas entre grupos de observaciones. Cuando se mide la
dispersin de los valores de una variable respecto de unas de sus
3

medidas de posicin, se est midiendo el grado de representatividad


que dicha medida de posicin tiene en el conjunto de los datos a los
cuales pretende resumir.
a) Recorrido
Es una medida, aunque imperfecta, de la dispersin de los datos. Se
define como la diferencia entre el mayor y el menor valor de la
variable. A veces se llama tambin rango.
Si x 1 , x 2 ,....., x k son los valores de la variable ordenados, el recorrido
es: R = xk - x 1
b) Varianza
Dada una variable estadstica discreta x, cuya distribucin de
frecuencias relativas
es: xi , f i y media x , se define la varianza de la v. estadstica
X , y la denotaremos por v(x) o x2 , como el promedio de los
cuadrados de las desviaciones de los valores de la variable a su
media, es decir:
x2

1 k
2
2
ni x i x
N i 1

Para variables estadsticas continuas o discretas donde los valores


estn agrupados en intervalos, se define de manera anloga sin
ms que cambiar los valores x i por las marcas de clase
correspondientes a cada intervalo de clase.
c) Desviacin tpica
Dada una variable estadstica x con media x y varianza x2 , se
define la desviacin tpica como la raz cuadrada positiva de la
varianza.
x x2 .

d) Coeficiente de variacin de Pearson


El coeficiente de variacin de Pearson se define como el cociente
x
entre la desviacin tpica y la media CV (x )
x

Aquella poblacin que tenga el coeficiente de variacin ms


pequeo, estar ms concentrada alrededor de su media y por
tanto sta ser ms representativa.

4. MEDIDAS DE FORMA
En otras ocasiones podemos estar interesados sobre cuestiones de
forma como la simetra de los datos o su aplastamiento. La
mayora de las medidas de forma sern invariantes por cambio de
localizacin y de escala.
a) Coeficientes de asimetra.
Una distribucin de frecuencias es simtrica respecto de a , si
el diagrama es simtrico respecto del eje paralelo a OY que pasa
por a.
Si la distribucin de frecuencias es unimodal y tiene forma de
campana, se definen los coeficientes de asimetra de Pearson:
CA1

x Mo
x

y CA2

3(x Me )

Estos coeficientes son adimensionales. Valen 0 si la distribucin


es simtrica.
b) Coeficiente de concentracin. ndice de Gini.
El Coeficiente de Gini es una medida de la desigualdad ideada por
el estadstico italiano Corrado Gini. Normalmente se utiliza para
medir la desigualdad en los ingresos, pero puede utilizarse para
medir cualquier forma de distribucin desigual. El coeficiente de Gini
es un nmero entre 0 y 1, en donde 0 se corresponde con la perfecta
igualdad (todos tienen los mismos ingresos) y 1 se corresponde con
la perfecta desigualdad (una persona tiene todos los ingresos y los
dems ninguno). El ndice de Gini es el coeficiente de Gini
expresado en porcentaje, y es igual al coeficiente de Gini
multiplicado por 100.
Aunque el coeficiente de Gini se utiliza sobre todo para medir la
desigualdad en los ingresos, tambin puede utilizarse para medir la
desigualdad en la riqueza. Este uso requiere que nadie disponga de
una riqueza neta negativa.

Este diagrama muestra el rea a comprendida entre la curva de


Lorentz y la bisectriz del cuadrado, dicha rea es proporcional al
coeficiente de Gini.
El coeficiente de Gini se calcula como una razn de las reas en el
diagrama de la curva de Lorentz. Si el rea entre la lnea de perfecta
igualdad y la curva de Lorentz es A, y el rea por debajo de la curva
de Lorentz es B, entonces el coeficiente de Gini es A/(A+B). Esta
ratio se expresa como porcentaje o como equivalente numrico de
ese porcentaje, que es siempre un nmero entre 0 y 1.
El coeficiente de Gini se puede calcular mediante la siguiente
n 1

frmula: CG

p q
i 1

n 1

p
i 1

donde:

CG : Coeficiente de Gini
N
pi i 100 y N i es la frecuencia acumulada de la poblacin.
N
ui
qi 100 y ui es el producto de los ingresos por la poblacin
un
acumulada.

Para ello realizaremos previamente una tabla donde aparezcan los


siguientes datos:
N i , pi , ui y qi

De forma resumida, la Curva de Lorentz es una grfica de


concentracin acumulada de la distribucin de la riqueza
superpuesta a la curva de la distribucin de frecuencias de los
individuos que la poseen, y su expresin en porcentajes es el ndice
de Gini.

Ejemplo: Sea la siguiente distribucin de frecuencias:


ni niveles de ingresos
en
600
1000
2500
3000

N de personas
20
15
3
2

Vamos a construir las columnas que se necesitan:

Ni

pi

Ni
100
N

ui

qi

ui
100
un

20

50

12000

2963

35

875

27000

6667

38

95

34500

8518

40

100

40500

100

El coeficiente de Gini ser:


CG

50 29 '63 87 '5 66 '67 95 85'18


50 87 '5 95

0 ' 22 I G 22%

que al tomar un valor ms o menos prximo a cero se puede concluir


que existe una buena equidistribucin en los ingresos.

EJERCICIOS TEMA 2
1. Para asistir a un partido de ftbol hay dos tipos de entradas: adultos a 4.000 y
nios a 500ptas. Sabiendo que el precio medio result de 1.200ptas. Cul fue la
proporcin de asistentes adultos?
2. En cierta comunidad se han censado los establecimientos hoteleros segn el
nmero de empleados, y los datos se han presentado en la siguiente tabla:
N de
empleados
0a5
5 a 15
15 a 50
50 a 200

N de
hoteles
125
60
13
2

Calcular la mediana del nmero de empleados.


3. Una empresa distribuidora de bienes de consumo conoce el nmero de clientes
que demandan estos bienes, segn su cantidad distribuida.
Distribucin
0-1000
1000-2000
2000-4000
4000-6000
6000-8000

Clientes
8
15
45
30
2

Calcular el nmero de bienes ms demandado, la media y la mediana.


4.

Dada la siguiente distribucin que refleja la variable estadstica


= productividad ? en cierto sector econmico:
Intervalos
0-10
10-30
30-50

Frecuencias
32
8
10

Calcular la media, mediana y moda.


5. Los pesos en gramos de cierto producto agrcola, han sido anotados, as como la
frecuencia de presentacin en un cierto lote del producto.
Pesos
70
Frecuencia 4

74
9

78
16

82
30

86
44

90
36

94
20

98
12

102
6

Calcular la media y la desviacin tpica de los pesos.


6. Aplicada una prueba a 5 individuos, las puntuaciones obtenidas fueron: 7, -2, a,
3 y 4.La media correspondiente a estas puntuaciones es 4. A partir de estos datos
obtener:
a) La puntuacin que falta.
b) La mediana de las cinco puntuaciones.
c) Su varianza y desviacin tpica.
7. La tabla adjunta muestra el salario mensual de los 720 trabajadores de una
empresa:
Salarios
(en miles)
N
trabajadores

2,2

2,8

3,6

4,5

300

200

100

60

40

20

A la hora de renovar el convenio colectivo, la direccin de la empresa presenta


dos alternativas.
- Un aumento proporcional del 20% del salario de cada trabajador.
- Un aumento lineal de 300 a cada trabajador
Desde el punto de vista de dispersin, cul de las dos alternativas es mejor?
8. Los jvenes, a los 17 aos, tienen un peso medio de 60,8 Kg. y una desviacin
tpica de 6,69kg. Los nios a los 10 aos tienen un peso medio de 30,5 Kg. y una
desviacin tpica de 5,37 Kg. Se puede afirmar que el peso es ms variable a
los 10 aos que a los 17? Por qu?
9. En una empresa existen cuatro categoras profesionales y cada una tiene unos
niveles de ingresos mensuales diferentes. La distribucin de frecuencias que
expresa los niveles de ingresos y el nmero de personas en cada categora es la
siguiente:
xi (niveles
de ingresos)
100.000
200.000
300.000
400.000

ni (N de
personas)
25
10
4
1

Obtener el coeficiente de Gini, el ndice y la curva de Lorentz.


10. Obtener el ndice de Gini y la curva de Lorentz para la distribucin siguiente:
9

xi (niveles
de ingresos)
500
900
1500
3000

ni (N de
personas)
35
10
4
1

10

You might also like