You are on page 1of 18

CONCEPTO DE VARIABLE

Por variable se entiende alguna caracterstica condicin o atributo susceptible


de ser medido, usando alguna escala de medicin conocida y que puede
adoptar diversos valores a los ojos del observador. Para nuestros efectos, es
de tambin de inters medir estas caractersticas 1.
La medicin de una variable depender de la capacidad del observador para
poder percibir la ocurrencia de ella y de la disponibilidad de un sistema de
registro y medicin capaz de identificar el valor real que adopta.
Para la epidemiologa, el concepto de variable es de especial importancia
puesto que del registro de su ocurrencia y las relaciones que puedan
observarse entre ellas derivan hiptesis de explicacin de sucesos (asociacin
principalmente).
CLASIFICACION DE LAS VARIABLES
SEGN SU NATURALEZA:
Cuantitativa y cualitativa
Cuantitativas: Son aquellas que se pueden medir. Determinan variables
estadsticas que pueden ser:

Discretas: Slo pueden tomar un nmero finito de valores enteros, los valores
posibles de estas variables son aislados.
Ejemplos de variables estadsticas cuantitativas discretas
Nmero de hermanos: pueden ser 1, 2, 3 , pero nunca podr ser 3,45.
Nmero de hijos
Nmero de empleados de una fbrica.
Nmero de goles marcados por un equipo de futbol en la liga.

Continuas: Pueden tomar cualquier valor real (infinitos) dentro de un intervalo.


Ejemplos de variables estadsticas cuantitativas continuas

Velocidad de un vehculo: puede ser 20; 54,2; 100 ; km/h


Temperaturas registradas en un observatorio cada hora.
Peso en kg de los recin nacidos en un da en Espaa.

Cualitativas: No se pueden medir numricamente.


Ejemplos de variables estadsticas cualitativas

Color de los ojos.


Bondad de una persona.
Profesin de una persona.

Determinan modalidades. Las modalidades del carcter profesin pueden ser:


arquitecto, albail, mdico, etc.

SEGN SU NIVEL DE MEDICIN:


Existen tres categoras primarias de variables: nominales, ordinales e
intervalos. Las variables nominales son categricas, como el gnero. Las
variables ordinales son tambin categricas pero tienen un orden claro, como
nivel socio econmico alto, medio y bajo. Finalmente, las variables de
intervalos son similares a las ordinales pero han definido el espacio entre las
medidas. Por ejemplo, una medida de intervalo podra categorizar a la gente
en categoras de ingresos anuales idnticamente espaciadas, como $10.000,
$20.000, $30.000 y $40.000.
SEGN SUS RELACIONES:
Variable dependiente: es aquella caracterstica, propiedad o cualidad de
una realidad o evento que estamos investigando. Es el objeto de estudio,
sobre la cual se centra la investigacin en general. Tambin la variable
independiente es manipulada por el investigador, porque el investigador l
puede variar los factores para determinar el comportamiento de la variable.
Por ejemplo: Los nios que hacen tres aos de educacin preescolar,
aprenden a leer ms rpido en primer grado. En este caso la variable
dependiente sera aprenden a leer ms rpido, pero aprenden a leer ms
rpido como consecuencia de que hacen tres ao de educacin preescolar.
Por esta razn se recomienda que en el ttulo de un trabajo siempre debe
aparecer la variable dependiente, pues est es el objeto de estudio. Tambin
existen variables independientes en algunos estudios que hasta cierto punto
dependern de algo, como en el ejemplo
siguiente: Los ingresos
econmicos de un hospital pblico puede depender de la asignacin en el
presupuesto nacional del pas. Como podemos observar el objeto de estudio
no est influyendo en la variable independiente. De este modo, la variable
independiente en un estudio se cree que est influyendo en la variable
dependiente, el estudio correlaciona y se centra precisamente en esa
relacin.
Variable independiente: es aquella propiedad, cualidad o caracterstica de
una realidad, evento o fenmeno, que tiene la capacidad para influir, incidir o
afectar a otras variables. Se llama independiente, porque esta variable no
depende de otros factores para estar presente en esa realidad en estudio.
Algunos ejemplos de variables independientes son; el sexo, la raza, la edad,
entre otros. Veamos un ejemplo de hiptesis donde est presente la variable
independiente: Los nios que hacen tres aos de educacin preescolar,
aprenden a leer ms rpido en primer grado. En este caso la variable
independiente es hacen tres aos de educacin preescolar. Porque para que
los nios de primer grado aprendan a leer ms rpido, depende de que hagan
tres aos de educacin preescolar.

Variables reversibles e irreversibles:


Una variable es reversible cuando cada una de las variables consideradas (A) o
(B), pueden ser tenidas a su vez como variables independientes o
dependientes.
Ejemplo: Al relacionar peso corporal con talla dentro de un rango de edad, el
investigador establece indistintamente el uno o el otro como variable
independiente. Se analizar la variacin del peso con respecto a la talla o a la
inversa.

Una variable es irreversible cuando A es la causa de B, una variacin en A


puede producir un variacin en B, pero no implica lo contrario, que B sea causa
de A, ni que una variacin en B implique una variacin en A.
Ejemplo: La contaminacin del aire puede ser causa de la enfermedad
respiratoria, lo cual no implica que el desarrollo de la enfermedad respiratoria
provoque aumento de la contaminacin del aire.

Variables precedentes y subsiguientes:


Cuando se estudian enfermedades que se cree han podido tener un periodo de
exposicin largo, se habla de relacin entre variables precedentes y
subsiguientes.
Ejemplo:
Si se busca determinar una relacin entre la silicosis y el haber trabajado con
exposicin al silicio en una mina, se puede decir que la variable precedente a la
aparicin de la enfermedad, es la exposicin al silicio y por tanto la
independiente (la causa), y la silicosis ser la variable subsiguiente, la
dependiente (el efecto).

Este tipo de relacin secuencial es muy importante en enfermedades crnicas,


donde la causa o factor de riesgo puede comenzar a actuar en periodos
prolongados, mucho tiempo antes de que aparezca el efecto negativo o
enfermedad.
Variables probabilsticas y determinantes:
Existe una relacin probabilstica entre las variables cuando ocurre A la causa
o factor de riesgo, aparecer probablemente B es decir el efecto, la
enfermedad.
Ejemplo:
En la exposicin al bacilo de Koch y la tuberculosis, no todas las personas que
estn expuestas al bacilo desarrollan la enfermedad esto depende tambin de
la no vacunacin, la nutricin, el hacinamiento, etc. En este caso se puede
decir que la exposicin al bacilo de Koch es una variable probabilstica del
desarrollo de la enfermedad.

DISTRIBUCION DE FRECUENCIAS
Una distribucin de frecuencias o tabla de frecuencias es
una ordenacin en forma de tabla de los datos estadsticos,
asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia
Frecuencia absoluta
La frecuencia

absoluta es

el nmero

de

veces que

aparece un determinado valor en un estudio estadstico.


Se representa por f i .
La suma de las frecuencias absolutas es igual al nmero
total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra


griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa
por n i .

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias
absolutas de

todos

los valores

inferiores

iguales al

valor considerado.
Se representa por F i .
Frecuencia relativa acumulada
La frecuencia

relativa

acumulada es

el cociente entre

la frecuencia acumulada de un determinado valor y el nmero


total de datos. Se puede expresar en tantos por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las
siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31,
31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la primera columna de la tabla colocamos la variable


ordenada de menor a mayor, en la segunda hacemos el recuento
y en la tercera anotamos la frecuencia absoluta.
xi

Recuento

fi

Fi

ni

Ni

27

0.032 0.032

28

II

0.065 0.097

29

0.194 0.290

30

16 0.226 0.516

31

24 0.258 0.774

32

III

27 0.097 0.871

33

III

30 0.097 0.968

34

31 0.032

31

Este tipo de tablas de frecuencias se utiliza con variables


discretas.
Distribucin de frecuencias agrupadas
La distribucin de frecuencias agrupadas o tabla con
datos agrupados se emplea si las variables toman un nmero
grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases.
su frecuencia correspondiente.

cada clase se

le

asigna

Lmites de la clase
Cada clase est delimitada por

el lmite

inferior

de

la

clase y el lmite superior de la clase.


Amplitud de la clase
La amplitud de la clase es la diferencia entre el lmite
superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y
es el valor que representa a todo el intervalo para elclculo de
algunos parmetros.
Construccin de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7,
34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
1 se localizan los valores menor y mayor de la distribucin.
En este caso son 3 y 48.
2 Se restan y se busca un nmero entero un poco mayor
que la diferencia y que sea divisible por el nmero de intervalos
de queramos poner.
Es conveniente que el nmero de intervalos oscile entre 6 y
15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta
50 : 5 = 10 intervalos.

Se forman los intervalos teniendo presente que el lmite


inferior de una clase pertenece al intervalo, pero el lmite
superior no pertenece intervalo, se cuenta en el siguiente
intervalo.
ci

fi

Fi

ni

Ni

[0, 5)

2.5

0.025

0.025

[5, 10)

7.5

0.025

0.050

[10, 15)

12.5

0.075

0.125

[15, 20)

17.5

0.075

0.200

[20, 25)

22.5

11

0.075

0.2775

[25, 30)

27.5

17

0.150

0.425

[30, 35)

32.5

24

0.175

0.600

[35, 40)

37.5

10

34

0.250

0.850

[40, 45)

42.5

38

0.100

0.950

[45, 50)

47.5

40

0.050

40

ARREGLOS ORDENADOS
Cuando se obtienen los datos que componen la muestra, los valores
resultantes llegan al analista en la forma en que fueron obtenidos y sin ningn
tipo de ordenacin, constituyendo lo que se denomina "Datos sin Procesar".
Esta forma de presentacin no facilita el anlisis de la informacin, de all que
sea necesario efectuar algn tipo de organizacin de datos. El arreglo
ordenado constituye una de las formas ms sencillas de representarlos, y
consiste simplemente en disponer los valores de las observaciones en un
orden decreciente o creciente. Este tipo de grficas te permite saber el mximo
o el mnimo.

HISTOGRAMAS
En estadstica,
un histograma es
una
representacin grfica de
una variable en forma de barras, donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados, ya sea en forma
diferencial o acumulada. Sirven para obtener una "primera vista" general, o
panorama, de la distribucin de la poblacin, o la muestra, respecto a una
caracterstica, cuantitativa y continua, de la misma y que es de inters para el
observador (como la longitud o la masa). De esta manera ofrece una visin en
grupo permitiendo observar una preferencia, o tendencia, por parte de la
muestra o poblacin por ubicarse hacia una determinada regin de valores
dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir
la caracterstica. As pues, podemos evidenciar comportamientos, observar el
grado de homogeneidad, acuerdo o concisin entre los valores de todas las
partes que componen la poblacin o la muestra, o, en contraposicin, poder
observar el grado de variabilidad, y por ende, la dispersin de todos los valores
que toman las partes, tambin es posible no evidenciar ninguna tendencia y
obtener que cada miembro de la poblacin toma por su lado y adquiere un
valor de la caracterstica aleatoria-mente sin mostrar ninguna preferencia o
tendencia, entre otras cosas.
En general se utilizan para relacionar variables cuantitativas continuas, pero
tambin se lo suele usar para variables cuantitativas discretas, en cuyo caso es
comn llamarlo diagrama de frecuencias y sus barras estn separadas, esto es
porque en el "x" ya no se representa un espectro continuo de valores, sino
valores cuantitativos especficos como ocurre en un diagrama de barras
cuando la caracterstica que se representa es cualitativa o categrica. Su
utilidad se hace ms evidente cuando se cuenta con un gran nmero de datos
cuantitativos y que se han agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores

continuos. En los casos en los que los datos son cualitativos (no-numricos),
como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de
sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y
econmicas que en ciencias naturales y exactas. Y permite la comparacin de
los resultados de un proceso.
TIPOS DE HISTOGRAMAS

Diagramas de barras simples

Representa la frecuencia simple (absoluta o relativa) mediante la altura de la


barra la cual es proporcional a la frecuencia simple de la categora que
representa.

Diagramas de barras compuesta

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, las cuales se representan as; la altura de la barra
representa la frecuencia simple de las modalidades o categoras de la variable
y esta altura es proporcional a la frecuencia simple de cada modalidad.

Diagramas de barras agrupadas

Se usa para representar la informacin de una tabla de doble entrada o sea a


partir de dos variables, el cual es representado mediante un conjunto de barras
como se clasifican respecto a las diferentes modalidades.

Polgono de frecuencias

Es un grfico de lneas que de las frecuencias absolutas de los valores de una


distribucin en el cual la altura del punto asociado a un valor de las variables es
proporcional a la frecuencia de dicho valor.

Ojiva porcentual

Es un grfico acumulativo, el cual es muy til cuando se quiere representar el


rango porcentual de cada valor en una distribucin de frecuencias.
En los grficos las barras se encuentran juntas y en la tabla los nmeros
poseen en el primer miembro un corchete y en el segundo un parntesis.

CONSTRUCCION DE UN HISTOGRAMA

Paso 1

Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.

Paso 2

Obtener todos los nmeros de clases, existen varios criterios para determinar el nmero de
clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo
estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de
clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo, la
raz cuadrada de 30 ( nmero de artculos) es mayor que cinco, por lo que se seleccionan
seis clases.

Paso 3

Establecer la longitud de clase: es igual al rango dividido por el nmero de clases.

Paso 4

Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relacin al resultado del PASO 2 en intervalos iguales.

Paso 5

Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un grfico de barras, las bases de las barras son los intervalos de clases y altura son
la frecuencia de las clases. Si se unen los puntos medios de la base superior de los
rectngulos se obtiene el polgono de frecuencias.

MEDIDAS DE TENDENCIA CENTRAL


La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos,
una vez que stos estn ordenados de menor a mayor.7 Por ejemplo, la mediana del
nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2,
1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2,
2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de


la variable, por lo que se conviene en tomar como mediana el valor intermedio entre
los dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana


Existen mtodos de clculo ms rpidos para datos ms numerosos (vase el artculo
principal dedicado a este parmetro). Del mismo modo, para valores agrupados en
intervalos, se halla el "intervalo mediano" y, dentro de ste, se obtiene un valor concreto
por interpolacin.

Clculo de la mediana para datos agrupados


Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
As, aplicando la frmula asociada a la mediana para n impar, obtenemos X(39+1)/2 = X20
y basndonos en la frmula que hace referencia a las frecuencias absolutas:
Ni-1< n/2 < i = N19 < 19.5 < N20
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro
ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo queMe = 5 puntos
(es aconsejable no olvidar las unidades; en este caso como estamos hablando de
calificaciones, sern puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.
Ejemplo (N par)
Las calificaciones en la asignatura de Matemticas de 38 alumnos de una
clase viene dada por la siguiente tabla (debajo):
Calificaciones

1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 6 9 4 4 2
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla

x i fi

Fi

1 2

2 2

3 4

4 5

13

5 6 19 = 19
6 9

28

7 4

32

obtenemos X (38/2) = X19 y basndonos en la frmula que hace referencia 8 4

36

a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19

38

margen derecho).
Si volvemos a utilizar la frmula asociada a la mediana para n par,

9 2

Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el
decimonoveno y el vigsimo lugar.

En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el


vigsimo hasta el vigsimo octavo) con lo que Me = (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de
transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero,
deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso
cuando alguno de ellos no est acotado.
No se ve afectada por la dispersin. De hecho, es ms representativa que la media
aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia
cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos
pocos salarios muy altos que elevan la media aritmtica haciendo que pierda
representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario
"mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su
valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos
algebraicos tan bien como la media aritmtica.

La moda es el dato ms repetido de la encuesta, el valor de la variable con


mayor frecuencia absoluta.5 En cierto sentido la definicin matemtica corresponde con la
locucin "estar de moda", esto es, ser lo que ms se lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su
defecto, si es necesario obtener un valor concreto de la variable, se recurre a
la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-61-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es
decir, dos datos que tengan la misma frecuencia absoluta mxima. Cuando en una
distribucin de datos se encuentran tres o ms modas, entonces es multimodal. Por ltimo,
si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de
definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.

La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en
dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo

la frecuencia absoluta del intervalo modal y

las frecuencias

absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.


Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase viene
dada por la siguiente tabla (debajo):
Calificaciones

1 2 3 4 5 6 7 8 9

Nmero de alumnos 2 2 4 5 8 9 3 4 2

Propiedades
Sus principales propiedades son:

Clculo sencillo.

Interpretacin muy clara.

Al depender slo de las frecuencias, puede calcularse para variables cualitativas.


Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es
posible realizar otros clculos, por ejemplo, cuando se enumeran en medios
periodsticos las caractersticas ms frecuentes de determinado sector social. Esto
se conoce informalmente como "retrato robot".6

Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible
a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su
valor depende excesivamente del nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin.

Puede haber ms de una moda en el caso en que dos o ms valores de la variable


presenten la misma frecuencia (distribuciones bimodales o multimodales).

La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el
nmero de sumadores.

Por ejemplo, las notas de 5 alumnos en una prueba:


nio
1
2
3
alumnos:
4
5

nota
6,0
5,4
3,1

Primero, se suman las notas:


6,0+5,4+3,1+7,0+6,1 = 27,6
Luego el total se divide entre la cantidad de

7,0
6,1

27,6/5=5,52

La media aritmtica en este ejemplo es 5,52


La media aritmtica es, probablemente, uno de los parmetros estadsticos ms
extendidos.2 Se le llama tambin promedio o, simplemente, media.

Definicin formal
Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas,


esto es, tambin puede calcularse para variables agrupadas e intervalos.

Propiedades
Las principales propiedades de la media aritmtica son:3
Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla
de una medida de dispersin.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que
tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado,

esto es, el valor de

es mnimo cuando

. Este resultado se

conoce como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros
de dispersin ms importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si


Entonces

, donde

es la media aritmtica de los

para i = 1,..., n y a y b nmeros reales.


Es poco sensible a fluctuaciones muestrales, por lo que es un parmetro muy til
en inferencia estadstica.

Inconvenientes de su uso
Este parmetro, aun teniendo mltiples propiedades que aconsejan su uso en situaciones
muy diversas, tiene tambin algunos inconvenientes, como son:
Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la
cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto
menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo,
poblaciones muy distintas en su composicin pueden tener la misma media. 4 Por ejemplo,
un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin
homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20
m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede
comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de
sus componentes.
En el clculo de la media no todos los valores contribuyen de la misma manera. Los
valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo
del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000
de tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras
palabras, se ve muy afectada por valores extremos.
No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.

You might also like