You are on page 1of 26

Medidas de tendencia central

Dentro de las Medidas de Tendencia Central mas usuales se tiene a


la Media Aritmetica (Promedio), la Mediana y la Moda. Algunas
de estas medidas aparecen en las charlas de la vida diaria o las
leemos en los peri odicos.
MEDIA La medida de tendencia central de uso mas amplio es la
llamada media aritmetica o simplemente promedio. Para datos no
agrupados en una tabla de frecuencias, la media se dene como la
suma de todos los valores de la muestra dividida entre el numero
total de valores. En vez de escribir con palabras la denicion de
media, resulta mas conveniente usar notacion algebraica.
As pues, si contamos con una muestra de tamano n cuyos valores
los denotamos por X
1
, X
2
, ..., X
n
, la media que se denotara por X,
que se lee equis barra, se dene como:
1
X =
X
1
+X
2
+ +X
n
n
=

n
i=1
X
i
n
donde

denota al operador de sumatora.
Ejemplo: Los pesos netos en gramos del contenido de cinco fras-
cos de un perfume, seleccionados al azar de la lnea de produccion
son: 85.4, 85.3, 84.9, 85.4, 85.0. Cual es el contenido promedio
de las observaciones muestrales?
Observaciones:
La interpretacion que le podemos dar a la media es la siguiente:
si colocaramos los valores de la muestra sobre una regla grad-
uada y el valor de la media debajo, entonces la regla quedara
en equilibrio.
La evaluacion de la media involucra a todos los valores.
2
Para un conjunto de datos la media es unica.
La media es muy util para comparar dos o mas poblaciones.
La media satisface la siguiente condicion

n
i=1
(X
i
X) = 0.
Es decir, la suma de las desviaciones de cualquier valor con
respecto a la media siempre sera cero.
Sin embargo, la media tiene varias desventajas, por ejemplo si
uno o dos valores son muy grandes o muy pequenos, la media
podra no ser una medida representativa de los datos.
Ejemplo: Calcule el promedio de los siguientes conjuntos de datos
1. Los salarios por hora (en dolares) pagados a carpinteros fueron
15.40, 20.10, 18.75, 22.76, 30.67, 18.00. Calcule el salario
promedio por hora de dichos carpinteros.
3
2. Se tienen 10 vendedores de automoviles empleados por una
empresa. Las cantidades de autos nuevos vendidos el mes
anterior por cada vendedor fueron 15, 23, 4, 19, 18, 10, 10,
8, 28, 19. Calcule el numero medio de autos vendidos.
3. Una empresa de servicio electrico de energa selecciono 20
clientes residenciales. Los siguientes datos son el importe
que se cobro a los clientes por el servicio electrico el ultimo
bimestre.
54 48 58 50 25 75 46 60 70 47
67 68 39 35 56 33 62 65 67 66
Calcular el importe bimensual medio.
4
MEDIA PONDERADA La media ponderada de un conjunto
de datos X
1
, X
2
, ..., X
n
con ponderaciones w
1
, w
2
, ..., w
n
se dene
como:
X
w
=
w
1
X
1
+ +w
n
X
n
w
1
+ +w
n
=

n
i=1
w
i
X
i

n
i=1
w
i
.
Un ejemplo clasico es la forma en que evaluamos un curso, digamos
que en cierto curso el profesor acuerda que:
Instrumentos Peso(%)
Parcial 1 20
Parcial 2 25
Final 30
Tareas 10
Asistencia 5
Trabajo Final 10
Total 100
En dicho caso, la calicacion nal del curso esta dada por:
5
CF =
20 P1 +25 P2 +30 F +10 T +5 A+10 TF
100
MEDIANA Se senalo que para datos que contienen uno o dos
valores sumamente grandes o pequenos, la media puede no ser
representativa. El punto central de tales datos puede describirse
mejor utilizando una medida de tendencia central denominada me-
diana.
Para ilustrar la necesidad de tal medida, supongase que desea
adquirir un auto nuevo. El agente de ventas le indica que el precio
promedio de las unidades disponibles en este momento es de $
110,000.00. Si tuviera un presupuesto maximo para un precio
entre $ 60,000.00 y $ 75,000.00, podra pensar que esta fuera de
sus posibilidades. Sin embargo, al vericar los precios individuales
de los autos podra cambiar de idea.
6
Los precios son $ 60,000.00, $ 65,000.00, $ 70,000.00, $ 80,000.00
y un auto de lujo que cuesta $ 275,000.00. La media de dichos
precios, en efecto, es de $ 110,000.00, pero un precio esta ha-
ciendo que la media se incline hacia arriba, por lo que el promedio
no es muy representativo. Parece que un precio entre $ 65,000.00
y $ 75,000.00 es mas representativo. En casos como estos la
mediana proporciona una medida mas robusta.
Denicion: La mediana es el valor en la posicion central de los
valores despues de ordenarlos de menor a mayor o viceversa, tal
que hay tantos valores por encima de la mediana como por debajo
de ella.
La mediana de los precios de las unidades disponibles es de $
70,000.00, ya que hay dos valores por debajo y dos por arriba de
el. Notese que la mediana no se ve afectada por observaciones
muy bajas o muy altas.
7
En la notacion algebraica, dadas las n observaciones X
1
, ..., X
n
estas se ordenan de menor a mayor X
(1)
, X
(2)
, ..., X
(n)
, la mediana
denotada por

X se dene como:

X =

X
((n+1)/2)
si n es impar

X
(n/2)
+X
(n/2+1)

/2 si n es par
(I) Una muestra de los honorarios medicos cobrados por unas
clnicas en Mexico, D.F. dio estas cantidades $ 350.00, $ 290.00,
$ 300.00, $ 250.00, $ 320.00, $ 350.00. Cual es la mediana?
(II) Los tiempos que necesitaron varias empresas de seguros para
revisar solicitudes para servicios de coberturas similares fueron (en
minutos) 50, 230, 52, 57. Cual es la mediana del tiempo nece-
sario para revisar una solicitud?
8
Observaciones:
La mediana es unica.
No es difcil determinarla en datos no agrupados.
No se ve afectada por valores muy grandes o muy pequenos.
Puede tambien aplicarse a datos categoricos del tipo ordinal.
9
MODA. La moda o valor modal es la observacion que aparece
con mas frecuencia.
Ejemplo: Los sueldos anuales de funcionarios de gobierno en difer-
entes dependencias son:
35000 49100 50000 50000 40000
58000 50000 60000 40000 65000
50000 50000 71400 50000 55000
Cual es el valor modal?
10
Observaciones:
Puede determinarse para todos los tipos de variables, numericas
y categoricas.
No se afecta por valores altos o bajos.
Cuando todos los valores aparecen con frecuencia uno, se dice
que la moda NO existe.
No necesariamente es unica, puede aparecer mas de una vez.
11
Ejemplo: Los empleados de una compana tomaron varios cursos
cortos con diferentes metodos de ensenanza. Al concluir el curso,
cada empleado indico su preferencia, los resultados fueron:
Metodo de ensenanza Preferencias
Television 86
Conferencia 142
Discusion de grupo 17
Aprendizaje programado 49
Cual es la preferencia modal?
Calcule la mediana y la media.
12
Medidas de variacion o dispersion
Dos razones para analizar la dispersion en un conjunto de datos:
1) Al aplicar una medida de dispersion es posible evaluar la con-
abilidad del promedio que se esta usando. Una dispersion pequena
indica que los datos se encuentran acumulados cerca, por ejemplo,
de la media. Entonces se considera que la media es una medida
bastante representativa de los datos. Por el contrario, una dis-
persi on grande indica que la media no es muy conable, es decir,
que no es muy representativa de los datos. Como se observa en
la siguiente graca.
13
2) Una medida de dispersion permite apreciar cuan dispersas estan
dos o mas distribuciones. Una medida de dispersion puede uti-
lizarse para evaluar la conabilidad de dos o mas promedios, como
lo muestra la graca siguiente:
14
RANGO. El rango o amplitud es la medida de dispersion mas
sencilla, se trata de la diferencia entre los valores maximo y mnimo
de un conjunto de datos:
R = X
max
X
min
.
DESVIACION MEDIA. Un defecto importante del rango es que
se basa solo en dos valores y no toma en consideracion todos los
datos. La desviacion media, mide el promedio de las desviaciones
absolutas de los datos con respecto a su media, dada por la sigu-
iente formula:
D.M. =

n
i=1

X
i
X

n
La desviacion media tiene dos ventajas: utiliza en su calculo todos
los valores de la muestra y es facil de comprender. Sin embargo,
trabajar con valores absolutos analitcamente es difcil.
15
VARIANZA Y DESVIACION ESTANDAR. Dos medidas que
se denen a partir de las desviaciones con respecto a la media son
la varianza y su raz cuadrada que se llama la desviacion estandar.
La varianza, S
2
, se dene como
S
2
=

n
i=1

X
i
X

2
n 1
,
mientras que la desviacion estandar, S, esta dada por
S =

n
i=1

X
i
X

2
n 1
.
16
INTERPRETACION DE LA DESVIACION ESTANDAR. Por
lo comun la desviacion estandar se emplea como una medida para
comparar la dispersion en dos o mas conjuntos de observaciones.
Por ejemplo, una compana cuenta con dos plantas donde se pro-
duce el mismo artculo, en la Planta 1 se encontro que la desviacion
estandar de la produccion diaria fue de 7.51, mientras que en la
Planta 2 se obtuvo el valor de 10.47 y las medias son aproxi-
madamente iguales. Que conclusion se puede dar de dicha infor-
maci on?
Una desviacion estandar pequena de un conjunto de valores indica
que estos se encuentran localizados cerca de la media. Por el
contrario, una desviacion estandar grande revela que las observa-
ciones estan muy dispersas con respecto a la media. El siguiente
resultado involucra a la desviacion estandar y nos muestra una
importante aplicacion:
17
Teorema de Chebyshev o Tchebishe Para un conjunto cualquiera
de datos, la proporcion mnima de los valores que se encuentran
dentro de k desviaciones estandar desde la media es al menos
1 1/k
2
, donde k es una constante mayor que 1.
Regla Emprica. Para una distribucion de frecuencias simetrica,
aproximadamente 68% de la observaciones se encuentran a una
desviacion estandar de la media; aproximadamente 95% de las
observaciones se encuentran a dos desviaciones desde la media; y
practicamente todas las observaciones (99.7%) se encontraran a
tres desviaciones desde la media.
18
RANGO INTERCUARTIL. La mediana separa el 50% superior
de un conjunto de observaciones, del 50% inferior. El primer cuar-
til, Q
1
, es el valor que corresponde al punto por debajo del cual se
encuentra el 25% de las observaciones. El tercer cuartil, Q
3
, es el
valor que corresponde al punto por encima del cual se encuentra
el 25% de las observaciones. Por tanto, el 50% central de las
observaciones se localiza entre Q
1
y Q
3
. A la mediana tambien se
le llama el segundo cuartil y se denota por Q
2
. El primer y ter-
cer cuartil pueden aproximarse a partir del polgono de frecuencias
acumuladas.
El rango intercuartil se dene como
RI = Q
3
Q
1
.
Con los cuartiles es posible contruir una nueva graca para mostrar
la dispersion de los datos, que se denomina Diagrama de Caja, del
cual existen dos variantes:
19
I Diagrama de Caja con Rango Intercuartil
II Diagrama de Caja con Maximo y Mnimo
20
COEFICIENTE DE VARIACION. Una comparacion directa de
dos o mas medidas de dispersion no tiene sentido. Por ejemplo,
comparar la desviacion estandar del ingreso mensual y la desviacion
estandar de las inasistencias de un mismo grupo de empleados
suena irrazonable. Es obvio que no podemos comparar pesos y
das, pero si pudieramos convertir cada una de estas medidas a
una expresion relativa (adimensional), por ejemplo un porcentaje,
quiza la comparacion tendra sentido. Una medida relativa muy
usual es el Coeciente de Variacion y que es util cuando:
1. Los datos estan en unidades diferentes
2. Los datos estan en las mismas unidades, pero las medias muy
distantes.
21
El coeciente de variacion, CV , se dene como la razon de la
desviacion estandar a la media, expresada como un porcentaje,
esto es
CV =
S
X
100.
La interpretacion la tenemos en los siguientes
Ejemplo: Un estudio de las calicaciones obtenidas en un curso y
los a nos de servicio de los empleados inscritos, dio como resultado
que la calicacion media fue 200 y su desviacion estandar 40. La
media del numero de anos de servicio fue de 20 y su desviacion
de 2 anos. Calcular el coeciente de variacion y comparar ambos
resultados.
Solucion: Para las calicaciones se tiene que
CV =
S
X
100 =
40
200
(100) = 20%,
la desviacion estandar es 20% de la media.
22
Para los anos de servicio se tiene que
CV =
S
X
100 =
2
20
(100) = 10%,
la desviacion estandar es 10% de la media.
Al interpretar se puede ver que existe mayor dispersion relativa con
respecto a la media en la distribucion de las calicaciones que en
la distribucion de los anos de servicio.
23
Ejemplo: Se va a comparar la variacion en los ingresos anuales
de ejecutivos con la variacion de los ingresos de trabajadores no
calicados. Para una muestra de ejecutivos, X = 500, 000 y
S = 50, 000. Para una muestra de trabajadores no calicados,
X = 12, 000 y S = 1, 200. Uno se ve tentado a armar que hay
mayor dispersion en los ingresos anuales de los ejecutivos. Sin
embargo, las medias estan tan distantes que se necesita convertir
a resultados comparables.
Solucion: Para los ejecutivos se obtuvo que el
CV =
S
X
100 =
50000
500000
(100) = 10%.
Para trabajadores no calicados
CV =
S
X
100 =
1200
12000
(100) = 10%.
No existe diferencia en la dispersion relativa de los dos grupos.
24
Medidas de Forma
SESGO O ASIMETRIA. Una distribucion de frecuencias es simetrica,
en cuyo caso se dice que tiene sesgo cero, cuando el compor-
tamiento de los datos con respecto a las medidas de tendencia
central es el mismo a ambos lados. Si una o mas observaciones
son muy grandes, la media de la distribucion se vuelve mayor que
la mediana o la moda. En tales casos, se dice que la distribucion
tiene sesgo positivo. Por el contrario, si una o mas observaciones
muy pequenas se encuentran presentes, la media es la menor de
las tres medidas de tendencia central y se dice que la distribucion
tiene sesgo negativo. Las siguientes guras muestran los tres casos
mencionados.
Karl Pearson desarrollo una medida para evaluar el sesgo de una
distribucion, denominada coeciente de asimetra (CA), dado por:
CA =
3(media mediana)
desviaci on estandar
.
25
CURTOSIS (KURTOSIS). La curtosis mide el grado de agudeza
(picuda o chata) de una distribucion. No mostraremos como se
calcula, pero si los diferentes grados de curtosis a traves de las
siguientes guras.
26

You might also like