You are on page 1of 10

TCNICAS CUANTITATIVAS

APLICADAS A LA BIBLIOTECONOMA
Y DOCUMENTACIN
FLIX DE M O Y A A N E G N
JAVIER L P E Z GIJN
CONCEPCIN GARCA CARO
DESCRIPCIN D E DATOS.
ESTADSTICA D E S C R I P T I V A

Con la estadstica descriptiva lo que pretendemos hacer es un resumen de los


datos, es decir extraer de ellos la informacin que consideramos ms relevante.
Este resumen de las observaciones ser el primer paso para despus poder realizar
inferencias, que es el objeto de la estadstica inductiva o inferencial. La estadstica
descriptiva, por tanto, solo se ocupa de resumir (describir) la muestra estudiada
-las observaciones realizadas- y no establece relacin alguna con la poblacin a la
que pertenece la muestra.
Como veremos ms ampliamente en el apartado de muestreo (3.1) las observa-
ciones se pueden hacer sobre el total de los posibles valores de la variable, en este
caso estaramos trabajando con la poblacin, o, por el contrario, si lo que tenemos
es un conjunto representativo de elementos de una poblacin, estaramos trabajan-
do con una muestra.

1.1. Medidas caractersticas de una distribucin

1.1.1. Medidas de tendencia central

Si disponemos de un conjunto de datos homogneos de una variable cuantitati-


va les podemos aplicar ciertas medidas de resumen, pues, como acabamos de ver, la
estadstica descriptiva nos permite representar o resumir las caractersticas funda-
mentales de un conjunto de datos no analizados.
A estas medidas se les llama de centralizacin porque nos sirven para represen-
tar el valor medio de los datos, es decir, el valor que refleja el tamao del dato ms
14 Tcnicas cuantitativas aplicadas a la biblioteconoma y documentacin

esperado. Ello nos indica la posicin en la que se encuentra el centro de los datos y
por eso se denominan medidas de tendencia central. Las medidas de centralizacin
ms utilizadas son la media, la mediana y la moda.

1.1.1.1. Media

La media la podemos definir como la suma de un conjunto de observaciones di-


vidido por el nmero total de observaciones realizadas.
Frmula:

donde:
x representa cada una de las magnitudes individuales de las observaciones.
Xx es la suma de todas las observaciones.
n es el nmero total de observaciones realizadas.
Cuando la media es de una muestra la representaremos como:

x= ^
n

donde:
n es el nmero total de observaciones realizadas (el tamao de la muestra).
Si la media es de una poblacin la representaremos como:

N
donde:
H es la media de la poblacin.
N el tamao de la poblacin.
Cuando los valores de la variable x estn asociados a frecuencias la media se
calcula con la frmula siguiente:

donde:
/ es la frecuencia de cada valor de x.
n es el total de frecuencias de x.
Captulo 1: Descripcin de datos. Estadstica descriptiva 15

EJEMPLO

Una biblioteca quiere conocer el tiempo medio que tardan los proveedores en
suministrar las peticiones que la biblioteca les hace, con la idea de conocer tanto el
tiempo medio en que se sirven los pedidos, como los proveedores que superan am-
pliamente esta media. Para ello cuenta con el tiempo en das que los proveedores
han tardado en suministrar distintos pedidos, que son los que aparecen en el grfico
adjunto. Los das que cada proveedor (P1..P15) ha tardado en suministrar un pedi-
do son los valores que adquiere la variable x. Y el nmero de proveedores analiza-
do (15) es n.
Por tanto si aplicamos la frmula
- X*

tenemos que el sumatorio de x ( Y,x) es 150 y el nmero de proveedores es 15, lue-


go la media es:
x =150/15-10
Por tanto, diez das es el tiempo medio que tardan en suministrar los pedidos. Si
representamos grficamente estos resultados (vase grfico adjunto) vemos que en
los diez das, que es la media, hemos trazado una lnea y se ve claramente qu pro-
veedores tardan ms o menos tiempo en funcin de la media. Con lo que la biblio-
teca estara en condiciones de tomar las decisiones que considere oportunas con
respecto a los suministradores ms lentos.

Tiempo de respuesta de los i >rovee(lores


^ Media
P15 i

P13 - \ 1 l : i ^
' " '

P11
1 L '..L^....

x
P9 . . . J . I U . . . J. . . . . J. MJUUUUUJJUUUJUJUU

P7
"jr 1
| H Tiempo j

P5
"zzzzLTtSI|' i MI! ^ :
| 1 -- -L
P3

P1 : Z J . : . H 1
p- y.-.-- 1
(1 2 4 6 1 10 12 14

1.1.1.2. Mediana

La mediana es un nmero tal que, si ordenamos los datos de forma creciente o


decreciente, cumple la condicin de ser mayor que una mitad y menor que la otra.
Es decir, es el valor que divide la distribucin en dos partes iguales.
16 Tcnicas cuantitativas aplicadas a la biblioteconoma y documentacin

Si el nmero de los casos es impar la mediana es el valor central, si el nme-


ro de casos es par la mediana sera la media de los dos valores centrales. Por tan-
to si n es impar la mediana ser el dato (n+l)/2. Si el n m e r o de datos es par la
mediana se encontrar en el centro entre el dato n/2 y (n+2)/2 y como ya hemos
dicho entonces la mediana se obtiene al calcular la media de estos dos valores
centrales.

EJEMPLO

Una biblioteca que hace adquisiciones de libros antiguos quiere saber el tiempo
que tardan los proveedores (P1..P15) en suministrarles los pedidos, para hacerlo
constar en su informe anual sobre la biblioteca y para ello quiere calcular la media-
na. Los das que tardan los proveedores son:

Pl P2 P3 P4 P5 P6 P7 P8
24 65 25 62 26 "~ -58 27 44

P9 PIO Pll P12 P13 P14 P15


27 45 29 28 30 35 38

Si ponemos en orden creciente estos datos resulta:

Pl P2 P4 P7 P9 P12 Pll P13


24 25 26 27 27 28 29 30

P14 P15 P8 PIO P6 P4 P2


35 38 44 45 58 62 65
-i

Como el nmero de proveedores es impar (15) la mediana se encontrar en el


lugar (15+l)/2=8, y vemos que el valor del lugar octavo es 30, que es el valor de la
mediana (vase grfico y tabla adjuntos). Treinta das es el valor mediano que tar-
dan los proveedores n suministrar los pedidos.

1.1.1.3. Moda

La moda de una distribucin es el valor ms frecuente. Si los datos de la distri-


bucin estn agrupados, la moda es el punto medio del intervalo que contiene el
mayor nmero de frecuencias.
Captulo 1: Descripcin de datos. Estadstica descriptiva 17

Una distribucin de observaciones puede no tener moda, es decir ningn valor


de la distribucin aparece con ms frecuencia.

Tiempo de respuesta de los proveedores

P11 P13

Tiempo

EJEMPLO

Una biblioteca especializada tiene recogido el tiempo en das que tardan los
usuarios (U1..U15) en devolver los prstamos. Y para ajustar la poltica de prsta-
mos al tiempo real que tardan los usuarios quiere calcular la moda de los tiempos de
demora. Los tiempos en das que han tardado los distintos usuarios en devolver los
prstamos son:

Ul U2 U3 U4 U5 U6 U7 U8
1 2 4 3 6 5 8 7

U9 U10 Ull U12 U13 U14 U15


2 2 1 9 6 3 7

Como hemos visto la moda es el valor ms frecuente, y podemos observar que


este valor es 2, dos das, por tanto, podra ser el plazo idneo de prstamo para esta
biblioteca (vase grfico adjunto).
Tambin puede darse el caso de que dos valores tengan la misma frecuencia,
entonces podemos encontrarnos con una moda que no es nica, es decir una distri-
bucin con dos modas, a la que llamamos bimodal. Cuando nos encontramos con
una distribucin bimodal podemos interpretar que no existe suficiente homogenei-
dad en la poblacin, y de cara a su estudio podra ser conveniente subdividirla.
18 Tcnicas cuantitativas aplicadas a la biblioteconoma y documentacin

Tiempos de demora en la devolucin de los prstamos

U15 H5B
U13

U11

U9

U7 88855558558888 88B55555558 H Das

US

U3

U1

2 ^ Moda 4
10

EJEMPLO

Una biblioteca pblica tiene recogido el nmero de personas que han asistido a
los 24 actos de extensin cultural que ha organizado durante el ltimo ao, con vis-
tas a realizar un estudio sobre las actividades de animacin que realiza el centro.
Los datos de asistencia a los actos son:

60 32 58 30 50 38 62 59 29 28 45 54

25 31 51 32 27 61 58 33 48 52 35 ' 34

Asistentes a actividades culturales


Modas

, ;^-
r :

A1 A3 A5 A7 A9 A11 A13 A15 A17 A19 A21 A23

| g Asistentes |

i--::;.r-.^^s.
Captulo 1: Descripcin de datos. Estadstica descriptiva 19

Si se observa esta distribucin se ve que es bimodal (en 58 y 32 con una frecuen-


cia de 2), luego pueden existir dos grupos distintos de asistentes. Revisados los datos,
se constata que estn agrupados todos los actos que organiza la biblioteca, pero sin
embargo hay actividades para adultos y para jvenes y, si se desagregan, la moda de
los actos para jvenes es de 58 y para adultos es de 32, por lo que se debe considerar
que es preferible estudiar por separado los actos para adultos de los organizados pa-
ra jvenes, pues parece observarse comportamientos distintos en ambos grupos.

1.1.1.4. Clculo de la media de datos agrupados

A veces necesitamos calcular la media de una distribucin de frecuencias en la


que los datos estn agrupados en intervalos. En este caso la frmula que debe apli-
carse es:

- I / M
x=
n
donde:
/ es la frecuencia asociada a cada intervalo.
M es el punto medio del intervalo.
n es la frecuencia total (nmero total de observaciones).
EJEMPLO

Una biblioteca tiene un registro del nmero de documentos que cataloga y


del tiempo que tarda: en el intervalo de 5 a 9 minutos se han catalogado 10 docu-
mentos, 25 documentos han tardado en ser catalogados de 10 a 14 minutos, 15-19
minutos es el tiempo que se ha tardado para 31 documentos, 12 documentos se
han catalogado entre 20 y 24 minutos, de 25 a 29 minutos se ha necesitado para
catalogar 8 documentos, y por ltimo para catalogar 10 documentos se ha nesesi-
tado de 30 a 34 minutos. A partir de estos datos, la biblioteca quiere conocer el
tiempo medio que tarda en catalogar. Para ello podemos construir una tabla, co-
mo la siguiente, que nos facilite el clculo:
Tiempo M / : . fM
5-9 7 10 70
10-14 12 25 300
15-19 17 31 527
20-24 22 12 264
25-29 27 8 216
30-34 32 10 320

n = X/=96 ZfM = 1697


llilillflsp
VfflSS

W
20 Tcnicas cuantitativas aplicadas a la biblioteconoma y documentacin

HUI
El clculo es:
mm- . ij

96

Por tanto, 17.68 minutos es el tiempo medio que tarda la biblioteca en catalogar.

1.1.1.5. Clculo de la mediana de valores agrupados

Para calcular la mediana de datos agrupados aplicaremos la siguiente frmula:


( / \

Md = 1 +
f

donde:
l es el lmite inferior del intervalo que contiene la mediana,
n es la frecuencia total.
F es la frecuencia acumulativa correspondiente al limite inferior que contiene
la mediana.
es el nmero de casos del intervalo que contiene la mediana,
es la amplitud del intervalo que contiene la mediana.

EJEMPLO

Una biblioteca tiene recogidos los precios del material que adquiere: 3 documen-
tos han costado entre 1 y 500 pesetas, el precio de 13 ha oscilado entre 501 y 1.000,
entre 1.001 y 1.500 pesetas se han adquirido 25 documentos, 20 han tenido un precio
entre 1.501 y 2.000, el precio de 18 documentos se encuentra comprendido entre
2.001 y 2.500 pesetas, entre 2.501 y 3.000 se han adquirido 20 documentos y por lti-
mo 11 han tenido un precio que oscilaba entre 3.001 y 3.500. A partir de estos datos
la biblioteca quiere conocer el precio mediano de los materiales que adquiere.
Para realizar este clculo podemos construir una tabla como la siguiente:
Precio Frecuencia (f) Frec. acumulada (F) Amplitud intervalo (i)
1-500 3 3 500
501-1.000 13 16
1.001-1.500 25 n
41
1.501-2.000 20 61 "

2.001-2.500 18 79 "

2.501-3.000 20 99
3.001-3.500 11 110 "

Wsm
- -

jtF
Captulo 1: Descripcin de datos. Estadstica descriptiva 21

Para conocer el lmite inferior del intervalo que contiene la mediana (/), dividi-
remos el nmero total de observaciones por dos, 110/2=55, la mediana se encontra-
r en el intervalo que tenga la frecuencia acumulada ms cerca de 55, que es el in-
tervalo 1.501-2.000 (tiene una frecuencia de 61), el lmite inferior es por tanto 1501.
n es la frecuencia total, que como vemos en la tabla es 110. F es la frecuencia acu-
mulativa que corresponde al lmite inferior que contiene la mediana, que es 41. E l
nmero de casos del intervalo que contiene la mediana (f) es 20 y la amplitud del
intervalo que contiene la mediana (i) es 500. *
Por tanto si sustituimos estos valores en la frmula
f / \
Md = 1 + y -F
2

tenemos:

Md = 1501 + 500 = 1851


20

Luego el precio mediano del material que adquiere esta biblioteca es de 1.851 pe-
setas.

1.1.1.6. Comparacin de la media y la mediana

Tanto la media como la mediana son, como hemos visto, medidas de centraliza-
cin, pero sin embargo, y segn los casos, una puede ser ms til que otra a la hora
de dar informacin sobre los conjuntos de datos. Para saber cuando puede ser ms
til aplicar una u otra, vamos a ver algunas diferencias entre estas medidas.
Para calcular la media utilizamos todos los datos, sin embargo para la mediana
esto no sucede. A l utilizar todos los datos para el clculo de la media ocurre que si
hay valores extremos la media se ver bastante afectada, por el contrario la existen-
cia de valores extremos afecta muy poco a la mediana.
En el ejemplo que hemos visto para la media el resultado era 10, si calculamos
la mediana de ese ejemplo tambin nos da 10. Sin embargo en el ejemplo de la me-
diana vemos que su valor es 30, pero si calculamos la media nos da 37.53
Con estos ejemplos se puede ver que cuando hay ms casos extremos en una di-
reccin que en otra (distribucin con gran asimetra) la mediana ser ms apropia-
da que la media. Y por eso, en el caso de la biblioteca que quiere conocer el tiempo
que tardan en suministrarle los libros antiguos para incluirlo en su informe anual
-debido a que se dan valores extremos- es ms apropiado el clculo de la mediana
que de la media.
Tambin hay que tener presente, aunque no es objeto de estudio en este libro,
que para utilizar la media necesitamos una escala de intervalo. Sin embargo, la me-
diana se puede utilizar tanto en las escalas de intervalo como en las ordinales.

You might also like