Professional Documents
Culture Documents
APLICADAS A LA BIBLIOTECONOMA
Y DOCUMENTACIN
FLIX DE M O Y A A N E G N
JAVIER L P E Z GIJN
CONCEPCIN GARCA CARO
DESCRIPCIN D E DATOS.
ESTADSTICA D E S C R I P T I V A
esperado. Ello nos indica la posicin en la que se encuentra el centro de los datos y
por eso se denominan medidas de tendencia central. Las medidas de centralizacin
ms utilizadas son la media, la mediana y la moda.
1.1.1.1. Media
donde:
x representa cada una de las magnitudes individuales de las observaciones.
Xx es la suma de todas las observaciones.
n es el nmero total de observaciones realizadas.
Cuando la media es de una muestra la representaremos como:
x= ^
n
donde:
n es el nmero total de observaciones realizadas (el tamao de la muestra).
Si la media es de una poblacin la representaremos como:
N
donde:
H es la media de la poblacin.
N el tamao de la poblacin.
Cuando los valores de la variable x estn asociados a frecuencias la media se
calcula con la frmula siguiente:
donde:
/ es la frecuencia de cada valor de x.
n es el total de frecuencias de x.
Captulo 1: Descripcin de datos. Estadstica descriptiva 15
EJEMPLO
Una biblioteca quiere conocer el tiempo medio que tardan los proveedores en
suministrar las peticiones que la biblioteca les hace, con la idea de conocer tanto el
tiempo medio en que se sirven los pedidos, como los proveedores que superan am-
pliamente esta media. Para ello cuenta con el tiempo en das que los proveedores
han tardado en suministrar distintos pedidos, que son los que aparecen en el grfico
adjunto. Los das que cada proveedor (P1..P15) ha tardado en suministrar un pedi-
do son los valores que adquiere la variable x. Y el nmero de proveedores analiza-
do (15) es n.
Por tanto si aplicamos la frmula
- X*
P13 - \ 1 l : i ^
' " '
P11
1 L '..L^....
x
P9 . . . J . I U . . . J. . . . . J. MJUUUUUJJUUUJUJUU
P7
"jr 1
| H Tiempo j
P5
"zzzzLTtSI|' i MI! ^ :
| 1 -- -L
P3
P1 : Z J . : . H 1
p- y.-.-- 1
(1 2 4 6 1 10 12 14
1.1.1.2. Mediana
EJEMPLO
Una biblioteca que hace adquisiciones de libros antiguos quiere saber el tiempo
que tardan los proveedores (P1..P15) en suministrarles los pedidos, para hacerlo
constar en su informe anual sobre la biblioteca y para ello quiere calcular la media-
na. Los das que tardan los proveedores son:
Pl P2 P3 P4 P5 P6 P7 P8
24 65 25 62 26 "~ -58 27 44
1.1.1.3. Moda
P11 P13
Tiempo
EJEMPLO
Una biblioteca especializada tiene recogido el tiempo en das que tardan los
usuarios (U1..U15) en devolver los prstamos. Y para ajustar la poltica de prsta-
mos al tiempo real que tardan los usuarios quiere calcular la moda de los tiempos de
demora. Los tiempos en das que han tardado los distintos usuarios en devolver los
prstamos son:
Ul U2 U3 U4 U5 U6 U7 U8
1 2 4 3 6 5 8 7
U15 H5B
U13
U11
U9
US
U3
U1
2 ^ Moda 4
10
EJEMPLO
Una biblioteca pblica tiene recogido el nmero de personas que han asistido a
los 24 actos de extensin cultural que ha organizado durante el ltimo ao, con vis-
tas a realizar un estudio sobre las actividades de animacin que realiza el centro.
Los datos de asistencia a los actos son:
60 32 58 30 50 38 62 59 29 28 45 54
25 31 51 32 27 61 58 33 48 52 35 ' 34
, ;^-
r :
| g Asistentes |
i--::;.r-.^^s.
Captulo 1: Descripcin de datos. Estadstica descriptiva 19
- I / M
x=
n
donde:
/ es la frecuencia asociada a cada intervalo.
M es el punto medio del intervalo.
n es la frecuencia total (nmero total de observaciones).
EJEMPLO
W
20 Tcnicas cuantitativas aplicadas a la biblioteconoma y documentacin
HUI
El clculo es:
mm- . ij
96
Por tanto, 17.68 minutos es el tiempo medio que tarda la biblioteca en catalogar.
Md = 1 +
f
donde:
l es el lmite inferior del intervalo que contiene la mediana,
n es la frecuencia total.
F es la frecuencia acumulativa correspondiente al limite inferior que contiene
la mediana.
es el nmero de casos del intervalo que contiene la mediana,
es la amplitud del intervalo que contiene la mediana.
EJEMPLO
Una biblioteca tiene recogidos los precios del material que adquiere: 3 documen-
tos han costado entre 1 y 500 pesetas, el precio de 13 ha oscilado entre 501 y 1.000,
entre 1.001 y 1.500 pesetas se han adquirido 25 documentos, 20 han tenido un precio
entre 1.501 y 2.000, el precio de 18 documentos se encuentra comprendido entre
2.001 y 2.500 pesetas, entre 2.501 y 3.000 se han adquirido 20 documentos y por lti-
mo 11 han tenido un precio que oscilaba entre 3.001 y 3.500. A partir de estos datos
la biblioteca quiere conocer el precio mediano de los materiales que adquiere.
Para realizar este clculo podemos construir una tabla como la siguiente:
Precio Frecuencia (f) Frec. acumulada (F) Amplitud intervalo (i)
1-500 3 3 500
501-1.000 13 16
1.001-1.500 25 n
41
1.501-2.000 20 61 "
2.001-2.500 18 79 "
2.501-3.000 20 99
3.001-3.500 11 110 "
Wsm
- -
jtF
Captulo 1: Descripcin de datos. Estadstica descriptiva 21
Para conocer el lmite inferior del intervalo que contiene la mediana (/), dividi-
remos el nmero total de observaciones por dos, 110/2=55, la mediana se encontra-
r en el intervalo que tenga la frecuencia acumulada ms cerca de 55, que es el in-
tervalo 1.501-2.000 (tiene una frecuencia de 61), el lmite inferior es por tanto 1501.
n es la frecuencia total, que como vemos en la tabla es 110. F es la frecuencia acu-
mulativa que corresponde al lmite inferior que contiene la mediana, que es 41. E l
nmero de casos del intervalo que contiene la mediana (f) es 20 y la amplitud del
intervalo que contiene la mediana (i) es 500. *
Por tanto si sustituimos estos valores en la frmula
f / \
Md = 1 + y -F
2
tenemos:
Luego el precio mediano del material que adquiere esta biblioteca es de 1.851 pe-
setas.
Tanto la media como la mediana son, como hemos visto, medidas de centraliza-
cin, pero sin embargo, y segn los casos, una puede ser ms til que otra a la hora
de dar informacin sobre los conjuntos de datos. Para saber cuando puede ser ms
til aplicar una u otra, vamos a ver algunas diferencias entre estas medidas.
Para calcular la media utilizamos todos los datos, sin embargo para la mediana
esto no sucede. A l utilizar todos los datos para el clculo de la media ocurre que si
hay valores extremos la media se ver bastante afectada, por el contrario la existen-
cia de valores extremos afecta muy poco a la mediana.
En el ejemplo que hemos visto para la media el resultado era 10, si calculamos
la mediana de ese ejemplo tambin nos da 10. Sin embargo en el ejemplo de la me-
diana vemos que su valor es 30, pero si calculamos la media nos da 37.53
Con estos ejemplos se puede ver que cuando hay ms casos extremos en una di-
reccin que en otra (distribucin con gran asimetra) la mediana ser ms apropia-
da que la media. Y por eso, en el caso de la biblioteca que quiere conocer el tiempo
que tardan en suministrarle los libros antiguos para incluirlo en su informe anual
-debido a que se dan valores extremos- es ms apropiado el clculo de la mediana
que de la media.
Tambin hay que tener presente, aunque no es objeto de estudio en este libro,
que para utilizar la media necesitamos una escala de intervalo. Sin embargo, la me-
diana se puede utilizar tanto en las escalas de intervalo como en las ordinales.