You are on page 1of 26

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR DE LA EDUCACIÓN SUPERIOR.

UNIVERSIDAD PEDAGÓGICA EXPERIMENTAL LIBERTADOR.

INSTITUTO DE MEJORAMIENTO PROFESIONAL DEL MAGISTERIO.


EXTENSIÓN CARÚPANO.

MEDIDAS DE DISPERSIÓN

FACILITADOR: PARTICIPANTE:
PROF. Jose Cabera Carmen Andarcia.
Mirelvis Cova.
Yorgelis Morán

Sección 01
Educación Ambiental

Carúpano; julio 2017


INTRODUCCION

A lo largo de nuestro desenvolvimiento profesional será necesario el uso


del algún indicador que permite apreciar el grado de dispersión o variabilidad
existente en un grupo de variantes en estudio, y gracias a las medidas de
dispersión podemos conocer este valor.
El conocer el valor de las medidas de dispersión, nos puede servir para
tener una idea bastante clara de la conformación de cada uno de los valores
de las muestras que tenemos, con respecto a la medida de tendencia central
aplicada; y también nos ayudan a sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la
información.
En el caso de las variables con valores que pueden definirse en
términos de alguna escala de medida de igual intervalo, puede usarse un tipo
de indicador que permite apreciar el grado de dispersión o variabilidad
existente en el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto
que están referidos a la variabilidad que exhiben los valores de las
observaciones, ya que, si no hubiere variabilidad o dispersión en los datos
interés, entonces no habría necesidad de la gran mayoría de las medidas de
la estadística descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los
datos en un valor representativo, las medidas de dispersión nos dicen hasta
que punto estas medidas de tendencia central son representativas como
síntesis de la información. Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los valores de la distribución
respecto al valor central
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la
mediana y la moda sólo nos revelan una parte de la información que
necesitamos acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su dispersión,
extensión o variabilidad.
La dispersión es importante porque:
 Proporciona información adicional que permite juzgar la
confiabilidad de la medida de tendencia central. Si los datos
se encuentran ampliamente dispersos, la posición central es
menos representativa de los datos.
 Ya que existen problemas característicos para datos
ampliamente dispersos, debemos ser capaces de distinguir
que presentan esa dispersión antes de abordar esos
problemas.
 Quizá se desee comparar las dispersiones de diferentes
muestras. Si no se desea tener una amplia dispersión de
valores con respecto al centro de distribución o esto presenta
riesgos inaceptables, necesitamos tener habilidad de
reconocerlo y evitar escoger distribuciones que tengan las
dispersiones más grandes.
Pero si hay dispersión en la mayoría de los datos, y debemos estar en
capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su
grado de variabilidad es importante, ¿cómo medimos la variabilidad de una
distribución empírica? Vamos a considerar sólo algunas medidas de
dispersión absolutas: el rango, la desviación media la varianza, la desviación
estándar y el coeficiente de variación.
EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad más fácil de calcular. Para datos finitos o
sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó
Xmax.) y el más bajo (X1 ó Xmin) en un conjunto de datos. Es decir, a mayor
longitud mayor dispersión de los datos.

Rango para datos no agrupados;

R = Xmáx.-Xmín = Xn-X1

Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber:
18,23, 27,34 y 25., para calcular la media aritmética promedio de las edades,
se tiene que:
R = Xn-X1 ) = 34-18 = 16 años

Con datos agrupados no se saben los valores máximos y mínimos. Si


no hay intervalos de clases abiertos podemos aproximar el rango mediante el
uso de los límites de clases. Se aproxima el rango tomando el límite superior
de la última clase menos el límite inferior de la primera clase.

Rango para datos agrupados;

R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)


Ejemplo
Si se toman los datos del ejemplo resuelto al construir la tabla de distribución
de frecuencia de las cuentas por cobrar de AMIGOS y Asociados que fueron
los siguientes:

Clases P.M. fi fr fa↓ fa↑ fra↓ fra↑


Xi
7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00
21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67
36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54
50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37
65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27
79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17
Total 30 1.00

El rango de la distribución de frecuencias se calcula así:


R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
= (93.910 – 7.420) = 86.49
Propiedades del Rango o Recorrido:
 El recorrido es la medida de dispersión más sencilla de calcular
e interpretar puesto que simplemente es la distancia entre los
valores extremos (máximo y mínimo) en una distribución
 Puesto que el recorrido se basa en los valores extremos éste
tiende ser errático. No es extraño que en una distribución de
datos económicos o comerciales incluya a unos pocos valores
en extremo pequeños o grandes. Cuando tal cosa sucede,
entonces el recorrido solamente mide la dispersión con respecto
a esos valores anormales, ignorando a los demás valores de la
variable.
 La principal desventaja del recorrido es que sólo está
influenciado por los valores extremos, puesto que no cuenta con
los demás valores de la variable. Por tal razón, siempre existe el
peligro de que el recorrido ofrezca una descripción distorsionada
de la dispersión.
 En el control de la calidad se hace un uso extenso del recorrido
cuando la distribución a utilizarse no la distorsionan y cuando el
ahorro del tiempo al hacer los cálculos es un factor de
importancia.
OBSERVACIÓN:
Como se puede apreciar. A medida que el conjunto de datos presenta más
variación y heterogeneidad, el rango incrementa su valor de forma significativa.

DESVIACIÓN MEDIA
Se define esta medida como el valor promedio de las desviaciones,
tornadas en valor absoluto, de los datos con respecto a un término central.
Este término central en la práctica es la media aritmética, pero también puede
usarse la mediana o el modo. Su fórmula es:

DM=∑ (X_-X)
N
Datos no agrupados:
a. Se calcula la media aritmética de los valores de la serie
b. Se calcula las desviaciones de los valores de la serie con respecto a su
media aritmética. Se suman estos desvíos y se obtiene =∑ (X-X)
Ejemplo:
Se obtiene la serie 2,4,6,8,10, su media es 6

X (X-X)
2 4
4 2
6 0
8 2
10 4
TOTAL 12

DM= 12/5 = 2.4


Datos Agrupados:
El procedimiento a seguir es el siguiente:
a. Se agrupan los datos en una distribución de frecuencia, determinando
los puntos medios de cada clase.
b. Se calcula la media de esa distribución
c. Se determina los desvíos de cada uno de los puntos medios con
respecto a la media, estos desvíos son tomados en valores absolutos
d. Se multiplica cada desvío por su respectiva frecuencia, se llevan a
columna estos productos, se suman y se obtienen ∑f (X-X).
e. Finalmente, se calcula la desviación media a través dela formula:

DM= ∑f(X-X)
N
Donde N= ∑f
Ejemplo:
Distribución de los instrumentos eléctricos indicados por su
eficiencia
Por coeficientes X N° d (X-X) F(X-X)
de eficiencia
instrumentos
5,5-6,49 6 6 4,2 25,2
6,5-7,49 7 18 3,2 57,6
7,5-8,49 8 164 2,2 360,8
8,5-9,49 9 1904 1,2 2284,8
9,5-10,49 10 2904 0,2 580,8
10,5-11,49 11 1916 0,8 1532,8
11,5-12,49 12 662 1,8 1191,6
12,5-13,49 13 101 2,8 282,8
13,5-14,50 14 11 3,8 41,8
7686 6358,2

X= 10,2
DM= 6358,2 = 0,83
7686
LA VARIANZA (S2 ó δ2 ):
La varianza es una medida de dispersión relativa a algún punto de
referencia. Ese punto de referencia es la media aritmética de la distribución.
Más específicamente, la varianza es una medida de que tan cerca, o que tan
lejos están los diferentes valores de su propia media aritmética. Cuando más
lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando
más cerca estén las Xi a su media menos es la varianza. Y se define y expresa
matemáticamente de la siguiente manera:

La varianza para datos no agrupados


Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la
varianza denotada usualmente por la letra minúscula griega δ (sigma)
elevada al cuadrado (δ2)y en otros casos S2 según otros analistas, se define
como: el cuadrado medio de las desviaciones con respecto a su media
aritmética”
Matemáticamente, se expresa como:

S2=∑( Xi -X)2
---------------

Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a
saber: 18,23, 25, 27, y 34. Al calcular la media aritmética (promedio de las
edades, se obtuvo 25.4 años), encontrar la varianza de las edades de estos
estudiantes:
Para calcular se utiliza una tabla estadística de trabajo de la siguiente manera:

Xi ( Xi – X ) ( Xi - Ẋ )2

18 (18 – 25.4)=-7.4 (-7.4)2=54.76

23 (23 – 25.4)=-2.4 (-2.4)2= 5.76

25 (25 – 25.4)=-0.4 (-0.4)2= 0.16

27 (27 – 25.4)= 1.6 ( 1.64)2= 2.16


34 (34 – 25.4)= 8.6 ( 8.6)2 =73.96

Total 137.20

Σ(XI- Ẋ)2 137.20


s2= ------------ = ----------- = 27.4 años
n 5
Respuesta: la varianza de las edades es de 27.4 años
La varianza para datos agrupados
Si en una tabla de distribución de frecuencias. Los puntos medios de
las clases son X1, X2, … , Xn; y las frecuencias de las clases f1, f2,.. , fn; la
varianza se calcula así:
Σ(Xi- Ẋ)2f1
δ2 = ----------------
Σfi
Sin embargo, la formula anterior tiene algún inconveniente para su uso
en la práctica, sobre todo cuando se trabaja con números decimales o cuando
la media aritmética es un número entero. Asimismo, cuando se trabaja con
máquinas calculadoras, la tarea de computar la varianza se simplifica
utilizando la fórmula de computación que se da a continuación:

ΣXi2fi - [(ΣXifi)2/N]
δ2 = ----------------------------
N donde N=Σfi

Ejemplo:
Se tienen los datos de una muestra de 30 cuentas por cobrar de la
tienda AMIGOS y Asociados dispuestos en una tabla de distribución de
frecuencias, a partir de los cuales se deberá calcular la varianza, para lo cual
se construye la siguiente tabla estadística de trabajo, la media aritmética y se
fijó en 43.458 de la siguiente manera:
Punto
Clases medios fi Xi2 Xifi X2fi
Xi
7.420 – 21.835 14.628 10 213.978 146.280 2,139.780
21.835 – 36.250 29.043 4 843,496 116.172 3,373.984

36.250 – 50.665 43.458 5 1,888.598 217.270 9,442.990

50.665 – 65.080 57.873 3 3,349.284 173.619 10,047.852

65.080 – 79.495 72.288 3 5,225.555 216.864 15,676.665

79.495 – 93.910 86.703 5 7,533.025 433.965 37,665.125

Total 30 19,053.936 1,304.190 78,346.396

ΣXi2fi - [(ΣXifi)2/N] 78,346.398 – [(1,304.190)2/30]


δ2 = -------------------------- = ------------------------------------------- =
N 30

78,346.398 – [1,700,911.556/30] 78,346.398-56,697,052


= ---------------------------------------------- = ------------------------------
30 30

= 21,649.346 / 30 = 721.645

Respuesta: la varianza de las cuentas por cobrar es igual


B/.721.645
Propiedades de la varianza :
 s siempre un valor no negativo, que puede ser igual o distinta de 0.
Será 0 solamente cuando Xi=
 La varianza es la medida de dispersión cuadrática optima por ser la
menor de todas.
 Si a todos los valores de la variable se le suma una constante la
varianza no se modifica. Veámoslo:

S2 
 ( x i  X ) 2 ni
n

Si a xi le sumamos una constante xi’ = xi + k tendremos

(sabiendo que x '  x  k )

S2 
 ( x ' i  X ' ) 2 n i   [( x i  k )  ( X 'k )]2 n i   ( x i  X ) 2 n i
 S2
n n n

 Si todos los valores de la variable se multiplican por una constante


la varianza queda multiplicada por el cuadrado de dicha constante.
Veámoslo:

Si a xi’ = xi · k tendremos (sabiendo que X '  X·k )

 ( x ' i  X ' ) 2 n i  [( x i· k )  ( X '· k )]2 n i  [ k ( x i  X )] n


2
2
S    i

N N N


 k 2 ( x i  X ) 2 ni 
k 2  (x i  X )2
 k 2·S 2
n n

 Si en una distribución obtenemos una serie de subconjuntos


disjuntos, la varianza de la distribución inicial se relaciona con la
varianza de cada uno de los subconjuntos mediante la expresión
S x2 
 N i Si2
n

Siendo
Ni  el nº de elementos del subconjunto (i)

S2i  la varianza del subconjunto (i)


OBSERVACIONES:
1. La varianza, al igual que la media, es un índice muy sensible a las
puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será posible
hallar la varianza
3. La varianza no viene expresada en las mismas unidades que los datos,
ya que las desviaciones están elevadas al cuadrado.

LA DESVIACIÓN ESTÁNDAR
Es una medida de la cantidad típica en la que los valores del
conjunto de datos difieren de la media. Es la medida de dispersión más
utilizada, se le llama también desviación típica. La desviación estándar
siempre se calcula con respecto a la media y es un mínimo cuando se estima
con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es
la raíz cuadrada positiva de esta. A la desviación se le representa por la letra
minúscula griega “sigma” ( δ ) ó por la letra S mayúscula, según otros analistas.

Cálculo de la Desviación Estándar

δ = √δ2 ó s = √s2
Ejemplo:
Del cálculo de la varianza de las edades de cinco estudiantes
universitarios de primer año se obtuvo δ2=27.44, como la desviación
estándar es la raíz cuadrada positiva, entonces δ = √27.44 = 5.29 años.
Igual procedimiento se aplica para encontrar le desviación
estándar de las cuentas por cobrar de la Tienda AMIGOS y Asociados,
recordemos que la varianza obtenida fue de 721.645, luego entonces la
desviación estándar es igual a δ =√721.645 = 26.86 balboas

La desviación estándar es un tipo de desviación promedio de los valores


con respecto a la media siendo su fórmula:

S= √∑(X-X)2 Desviación estándar de una muestra


n-1

PROCEDIMIENTO PARA CALCULAR LA DESVIACION ESTANDAR:


1. Calcule la media X
2. Reste la media de cada valor individual para obtener u a lista de
desviación de la forma (X-X)2
3. Eleve al cuadrado cada una de las diferencias obtenidas en el paso 2.
Esto produce números de la forma (X-X)2
4. Sume todos los cuadrados obtenidos en el paso 3 este es el valor
∑(X-X)2
5. Divida el total del paso 4 entre el numero n-1; es decir, 1 menos que el
total de valores presentes.
6. Calcule la raíz cuadrada del paso 5.
Ejemplo:
Calcule la desviación estándar de los tiempos en espera de las múltiples
filas. Estos tiempos en minutos son 1,3 y 14
x x-x (x-x)2
1 -5 25
3 -3 9
14 8 64
Totales 18 98

X= 18/3 = 6.0 min s√98 = √49= 7.0 min


3-1

ᵟ= √ ∑(x-μ)2 Desviación estándar de la población


N

PROPIEDADES DE LA DESVIACION ESTÁNDAR:


A su vez la desviación estándar, también tiene una serie de
propiedades que se deducen fácilmente de las de la varianza (ya que la
desviación típica es la raíz cuadrada positiva de la varianza):
 La desviación estándar es siempre un valor no negativo S será
siempre 0 por definición. Cuando S = 0  X = xi (para todo i).
 Es la medida de dispersión óptima por ser la más pequeña.
 La desviación estándar toma en cuenta las desviaciones de todos
los valores de la variable
 Si a todos los valores de la variable se le suma una misma constante
la desviación estándar no varía.
 Si a todos los valores de la variable se multiplican por una misma
constante, la desviación estándar queda multiplicada por el valor
absoluto de dicha constante.

EL COEFICIENTE DE VARIACIÓN DE PEARSON (C.V.)


Las medidas de tendencia central tienen como objetivo el
sintetizar los datos en un valor representativo, las medidas de dispersión nos
dicen hasta que punto estas medidas de tendencia central son representativas
como síntesis de la información. Las medidas de dispersión cuantifican la
separación, la dispersión, la variabilidad de los valores de la distribución
respecto al valor central. Distinguimos entre medidas de dispersión absolutas,
que no son comparables entre diferentes muestras y las relativas que nos
permitirán comparar varias muestras.
El problema de las medidas de dispersión absolutas es que
normalmente son un indicador que nos da problemas a la hora de comparar.
Comparar muestras de variables que entre sí no tienen cantidades en las
mismas unidades, de ahí que en ocasiones se recurra a medidas de dispersión
relativas.
Un problema que se plantea, tanto la varianza como la desviación
estándar, especialmente a efectos de comparaciones entre distribuciones, es
el de la dependencia respecto a las unidades de medida de la variable.
Cuando se quiere comparar el grado de dispersión de dos distribuciones que
no vienen dadas en las mismas unidades o que las medias no son iguales se
utiliza el llamado “Coeficiente de Variación de Pearson”, del que se
demuestra que nos da un número independiente de las unidades de medidas
empleadas, por lo que entre dos distribuciones dadas diremos que posee
menor dispersión aquella cuyo coeficiente de variación sea menor, y que se
define como la relación por cociente entre la desviación estándar y la
media aritmética; o en otras palabras es la desviación estándar
expresada como porcentaje de la media aritmética.

Definición del Coeficiente de Variación

V= S
X

Donde: C.V. representa el número de veces que la desviación típica contiene


a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión
y menor la representatividad de la media.
Propiedades del Coeficiente de Variación:
 Si a todos los valores de la variable se le suma una misma constante
el coeficiente de variación queda alterado
Ejemplo:
Suponga que Usted trabaja en una compañía de ventas, que ofrece
como premio de incentivo al mejor vendedor del trimestre anterior las entradas
al palco empresarial en la serie final de béisbol de las grandes ligas en los
Estados Unidos
De los registros de ventas se tienen los siguientes datos de ventas,
expresados en porcentajes de cumplimiento de las metas fijadas
mensualmente:

Vendedor A 95 105 100


Vendedor B 100 90 110
El promedio trimestral de cumplimiento de las metas de ventas de
ambos vendedores es igual y equivale al 100%, pero Ud. Sólo le puede dar el
premio de incentivo a uno de ellos. ¿Cuál usted escogería. ¿En base a que
criterio’? Explique.
Este problema se resuelve utilizando el coeficiente de variación, para
estos efectos es necesario encontrar la desviación estándar trimestral de las
ventas de cada uno de la siguiente manera:
Vendedor A
Xi ( Xi - Ẋ ) ( Xi - Ẋ )2
95 95 – 100 = -5 (-5)2 = 25

105 105 – 100 = 5 ( 5)2 = 25


100 100 – 100 = 0 ( 0)2 = 0
Total 50

La desviación estándar es δ=√(50/3) = √16.667 = 4.08, luego entonces


el coeficiente de variación es igual a:

δ 4.08
C.VA= --------- = ----------- = 0.0408
Ẋ 100

Vendedor B
Xi ( Xi - X ) ( Xi - X)2
100 100 – 100 = 0 ( 0 )2 = 0
90 90 – 100 = -10 (-10)2 = 100
110 110 – 100 = 10 ( 10)2 = 100
Total 200
La desviación estándar es δ=√(200/3) = √66.667 = 8.16, luego entonces
el coeficiente de variación es igual a:

δ 8.16
C.V.B= --------- = ----------- = 0.0816
X 100

Respuesta: Dado que el vendedor A tiene menor coeficiente de


variación, A él le corresponde recibir el premio de incentivo.

PROBLEMAS

Problemas1: Un monitoreo de la calidad de agua en una fuente superficial, en


la variable turbiedad, presenta los siguientes resultados:

Datos primer muestreo: 5; 4; 5; 4; 8; 10, 9 (UNT) R = Xmáx - Xmin = 6,4 (UNT)

Con una muestra adicional: 12 (UNT) R = Xmáx - Xmin = 8 (UNT)

Con otra muestra adicional: 150 (UNT) R = Xmáx - Xmin = 146 (UNT)

Con otra muestra adicional: 320 (UNT) R = Xmáx - Xmin = 316 (UNT)

(UNT Unidades Nefelométricas de Turbiedad)

Para el primer muestreo el rango es 6 UNT, es decir, la diferencia entre el valor


mínimo y el valor máximo es 6 UNT A medida que se incorporan datos
extremos el rango aumenta considerablemente, evidenciando el grado de
dispersión de los datos. Como se puede apreciar, a medida que el conjunto de
datos presenta más variación o heterogeneidad, el rango incrementa su valor
de forma significativa. El rango es una buena medida del grado de dispersión
de un conjunto de datos.
2. Considerando la situación se calcula la DESVIACIÓN MEDIA:
5; 4; 5; 4; 8; 10; 9 (UNT)
dm= ∑(xi-x)=2,2 UNT
7

Con un dato adicional:12UNT


dm= ∑(xi-x)=2,6 UNT
8

Con otro dato adicional:150 UNT


dm= ∑(xi-x)=28,2 UNT
9

Con otro dato adicional:320 UNT


dm= ∑(xi-x)=72,9 UNT
10
La desviación media para el primer conjunto de datos toma el valor de 2,2
UNT, que indica el nivel de dispersión de los datos con relación al valor medio,
que es 6,4 UNT Cuando se introducen datos extremos al muestreo, la
desviación media aumenta evidenciando el grado de dispersión del conjunto
de datos. A medida que el conjunto de datos presenta mayor variabilidad la
desviación media aumenta su valor y permite medir el grado de variabilidad
del conjunto de datos.
Considerando la situación se puede calcular el valor de la VARIANZA:
Datos del muestreo:
5; 4; 5; 4; 8; 10; 9 (UNT) S2=∑(X-X)2= 6.3UNT2
7-1
Con un dato adicional:
12UNT S2=∑(X-X)2= 9.3UNT2
8-1
Con un dato adicional:
150UNT S2=∑(X-X)2= 2276.3UNT2
9-1
Con un dato adicional:
320UNT S2=∑(X-X)2= 10844.3UNT2
10-1

Como se puede apreciar la varianza genera una idea significativa del grado de
variabilidad de un conjunto de datos, pues a medida que aumenta el grado de
heterogeneidad esta medida aumenta sustancialmente, aunque sus unidades
elevadas al cuadrado limitan fuertemente su interpretación

Considerando la situación se calcula el valor de la DESVIACIÓN ESTÁNDAR:


Datos del muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT) S=√s2 S=√∑(X-X)2= 2.5UNT


7-1
Con un dato adicional:
12UNT S =√∑(X-X)2= 3UNT
8-1
Con un dato adicional:
150UNT S=√∑(X-X)2= 47.7UNT
9-1
Con un dato adicional:
320UNT S=√∑(X-X)2= 104.1UNT
10-1
Para los datos del primer muestreo la desviación estándar es 2,5 UNT, que
indica poca variación entre los datos, es decir, los datos se alejan de la media
(6,4 UNT) en una desviación estándar en 2,5 UNT hacia adelante y en 2,5 UNT
hacia atrás de la media. A medida que el conjunto de datos se vuelve
heterogéneo, la desviación estándar toma valores bastante grandes. Por
ejemplo, con todo el conjunto de datos analizados, el valor de la desviación
estándar es 104,1 UNT, lo que significa que los datos se alejan en promedio
104,1 UNT del valor medio (6,4 UNT). Ésta es una buena medida del grado de
dispersión del conjunto de datos; a medida que aumenta el grado de variación
de los datos esta medida aumenta, en las mismas unidades de la variable de
origen.

Considerando la situación, se calcula el COEFICIENTE DE VARIACIÓN:


Datos del muestreo:

5; 4; 5; 4; 8; 10; 9 (UNT) CV= 2.5 .100 CV=39.1%UNT


6.4
Con un dato adicional:
12UNT CV= 3 .100 CV=42.3%UNT
7.1

Con un dato adicional:


150UNT CV= 47.7 .100 CV=207.4%UNT
23

Con un dato adicional:


320UNT CV= 104.1 .100 CV=197.6%UNT
52.7
Para el primer conjunto de datos el CV = 39%, indica que los datos presentan
variación con relación a la media. A medida que se consideran datos extremos
en el muestreo, el CV toma valores de 207% y 197%, que indica una gran
variación de los mismos con relación a la media. El coeficiente de variación
aumenta considerablemente a medida que la distancia entre la media y la
desviación estándar crecen.

Problema 2. Se evalúa el efluente de dos reactores en paralelo para


tratamiento de agua potable, en la variable color real medida en Unidades de
Platino Cobalto (UPC), generando las siguientes medias:
Reactor 1: X =10 UPC

Reactor 2: X =10UPC

Considerando los datos presentados: Se evalúan dos reactores en paralelo


para tratamiento de agua potable, en la variable color real en Unidades de
Platino Cobalto (UPC), generando las siguientes series de datos:
Reactor 1: 10; 12; 10; 12; 8; 1O; 8 UPC
Reactor 2: 58; 2; 2; 2; 2; 2; 2 UPC
Tabla 1 Medidas descriptivas para la comparación de dos reactores para
potabilización de agua, en color real.

Medidas I descriptivas Símbolo Reactor 1 Reactor 2


MEDIA X 10 UPC 10UPC
RANGO R 4 UPC 56UPC
VARIANZA S2 2.7 UPC2 448 UPC2
DESVIACION ESTANDAR S 1.6 UPC 21,2 UPC
COEFICIENTE DE VARIACION CV 16.3% 211,7%

A pesar de tener los mismos promedios en color real, los dos reactores
presentan eficiencias bastante diferentes, tal como se puede evidenciar en las
medidas de dispersión. El rango para el primer reactor es 4 UPC y para el
segundo es 56 UPC, 10 cual evidencia que en los datos del segundo reactor
la distancia entre el valor mínimo y el valor máximo es mucho mayor que la del
reactor 1. La desviación estándar, esto es, el promedio de la distancia de los
datos con respecto a la media, es 1,6 UPC para el primer reactor y 21,2 UPC
para el segundo reactor. Es decir, los datos se alejan de la media en 1,6 UPC
para el primer reactor y se alejan 21,2 UPC para el segundo reactor, lo cual
permite concluir que existe una mayor variación en el reactor 2. El coeficiente
de variación es también un buen indicador del grado de variación de los datos
en relación con la media; para el reactor 1 es 16,3% y para el reactor 2 es
211,7%. Un CV=16,3% significa que el conjunto de datos es homogéneo para
el caso del reactor 1; sin embargo, un CV= 211,7% significa gran variación o
heterogeneidad en el conjunto de datos, para el caso del reactor 2. También,
las medidas de centralidad, como la mediana, la media geométrica y la moda,
indican el grado de variación de un conjunto de datos, pues en el reactor 1
estas medidas toman valores similares, contrario a lo que sucede en el reactor
2.
CONCLUSIÓN

Las medidas de dispersión, tienen como propósito estudiar lo


concentrada o dispersa que está la distribución de los datos con respecto a la
media aritmética. Para medir el grado de dispersión de una variable, se utilizan
principalmente los siguientes indicadores: rango o recorrido, desviación media,
varianza y desviación típica o estándar, y coeficiente de variación. Las
medidas de dispersión indican las diferencias entre cada valor y la media
aritmética de la distribución. Son parámetros que muestran cómo están de
dispersos o disgregados los datos de un estudio estadística
La distancia de los valores de una variable respecto a su media
aritmética ofrece, de forma intuitiva, el fundamento para la propuesta de un
índice de dispersión. Cuanto mayor sean esas distancias más disperso serán
los datos, cuanto menor más homogéneo será. La varianza o la desviación
típica nos permiten comparar la dispersión de diferentes distribuciones de
frecuencias obtenidas para una misma variable en diferentes grupos de
sujetos.
Estas medidas de dispersión indicaran por un lado el grado de
variabilidad que hay en la muestra y, por otro, la representatividad de dicho
punto central, ya que, si se obtiene un valor pequeño, eso significara que los
valores se concentran entorno a ese centro (por lo que habrá poca variabilidad
y el centro representara bien a todos). En cambio, si se obtiene un valor
grande, significará que los valores no están concentrados, sino dispersos (por
lo que habrá mucha variabilidad y el centro no ser ́a muy representativo).
BIBLIOGRAFÍA
Rivas, E.2014. Estadística. General. Caracas. Venezuela. Editorial Biblioteca
de la Universidad Central de Venezuela.

Medidas de dispersión (2017) disponible en:


http://www.monografias.com/trabajos43/medidas-dispersion/medidas-
dispersion.shtml (consultado el 4 de julio de 2017).

Triola, M. 2009. Estadísticas. Atlacomulco. México. Editorial Pearson


Educación.

Franco, V. 2007. Estadística descriptiva para ingeniería ambiental con spss.


Cali. Colombia. Feriva.

You might also like