You are on page 1of 12

DIAGRAMA DE DISPERSIN

La representacin grfica ms til para describir el comportamiento conjunto de dos variables es el

diagrama de dispersin o nube de puntos, donde cada caso aparece representado como un punto en el

plano definido por las variables y Para obtener un diagrama de dispersin la secuencia es:

Grficos

Dispersin

El cuadro de dilogo siguiente:

recoge diferentes tipos de diagramas de dispersin. stos pueden ser:

1. Simple: si el diagrama slo recoge el comportamiento simultneo de dos variables, una definida en el eje X
(abscisas) y la otra en el eje Y (ordenadas). Con el botn Definir se abre el siguiente cuadro:

En Eje X se selecciona la variable que se considera independiente y en Eje Y la dependiente.

En Establecer marcas por puede indicarse alguna variable de control cuyas categoras o valores

se representan con un smbolo o color distintivo. Esto permite identificar los puntos

pertenecientes a cada categora y poner de manifiesto si existen comportamientos

diferenciados.

En Etiquetar los casos mediante se puede indicar alguna variable cuyos valores se tomarn

como etiquetas de los casos. Para visualizar las etiquetas es preciso activar la opcin Mostrar el

grfico con las etiquetas de caso del cuadro de dilogo Opciones.

El botn Ttulos ofrece la posibilidad de definir dos lneas de ttulo y un subttulo, y dos lneas de

nota al pie del grfico.


2. Superpuestos: presenta dos o ms parejas de variables en un mismo grfico.

En Pares Y-X se indican las parejas de variables a representar seleccionndolas de dos en dos

en la lista de variables. Si se quiere intercambiar X por Y se utiliza el botn Intercambiar par.

Etiquetar los casos mediante tiene la misma funcin que en el diagrama simple.

Los botones Titulos y Opciones ofrecen las mismas posibilidades ya vistas para el diagrama de

dispersin simple.
3. Matricial: ofrece una matriz de diagramas de dispersin simples de todos los pares y todas las

ordenaciones posibles que se pueden formar con las variables seleccionadas. En el cuadro de dilogo que

aparece con el botn Definir se deben seleccionar las variables cuyos diagramas de dispersin simples

aparecern en la matriz.

4. 3-D: proporciona en tres dimensiones el diagrama de dispersin de tres variables.

Si el diagrama de dispersin es Simple o Superpuesto se puede visualizar con la recta que mejor se

ajusta a la nube de puntos. Para ello se edita el grfico en el visor de resultados haciendo doble clic

sobre el mismo.

En la barra de men del editor de grficos se activa Diseo > Opciones y se abre el cuadro de dilogo:

Se selecciona Ajustar lnea > Total. En Opciones de ajuste se puede elegir el mtodo de ajuste deseado

entre: Regresin lineal (activado por defecto), Regresin cuadrtica, Regresin cbica y Minsce. Tambin

es posible incluir en el diagrama de dispersin una lnea paralela al eje de abscisas que pasa por la

media de la variable Y con la opcin Lnea de referencia para la media en Y > Total.

Cuando el diagrama recoge un gran nmero de observaciones algunos puntos representan a ms de un

caso ya que estos se superponen . Con la opcin Girasoles > Mostrar girasoles cada punto aparece con
tantas rayas o 'ptalos' como casos representa. sta es una forma grfica de indicar cuantos casos estn

representados por un punto.

EJEMPLOS

Con referencia a las variables Peso y Est (estatura) del archivo Encinf.sav comprobar grfica y

analticamente la existencia de una relacin lineal entre ellas.

1. La representacin grfica que permite comprobar la existencia de relacin lineal entre dos variables es el
diagrama de dispersin y la medida analtica adecuada es el coeficiente de correlacin lineal.

Con la secuencia Grficos > Dispersin > Simple > Definir se abre el cuadro de dilogo Diagrama de

dispersion simple. Se seleccionan en el Eje Y la variable Peso y en el Eje X la variable Est, y se obtiene el

siguiente grfico:

Como se observa en el grfico ambas variables presentan una relacin lineal positiva; es decir, a medida

que aumenta el valor de la variable Est aumenta tambin el valor de la variable Peso.

Si se desea ver la nube de puntos con la lnea de mejor ajuste superpuesta, y que los casos iguales o

muy prximos entre si queden representados por un slo punto, se edita el grfico haciendo doble clic

sobre el mismo. En el editor de grficos se selecciona Diseo > Opciones y en el cuadro Opciones del

diagrama de dispersin se activa Mostrar girasoles y Ajustar lnea > Total.


Para cuantificar el grado de asociacin lineal entre las variables la medida adecuada es el coeficiente de

correlacin lineal de Pearson. Con la secuencia Analizar > Correlaciones > Bivariadas se abre un cuadro

de dilogo donde se seleccionan las variables Peso y Est, y con las opciones Coeficiente de correlacin >

Pearson se obtiene la siguiente matriz de correlaciones.

El valor de r=0,883 es positivo y elevado, as como significativo para cualquier nivel, con lo cual se

confirma la impresin

proporcionada por el grfico acerca de la existencia de asociacin lineal entre las variables.
Qu es un diagrama de dispersin
Dispersin se define como el grado de distanciamiento de un
conjunto de valores respecto a su valor medio.

A partir de esta definicin, se derivan las medidas de dispersin


que aprendimos en la clase de estadstica del colegio: Rango,
varianza, desviacin, covarianza, coeficiente de correlacin, etc.

Ahora bien, el diagrama de dispersin, tambin conocido


como grfico de dispersin o grfico de correlacin consiste en
la representacin grfica de dos variables para un conjunto de
datos. En otras palabras, analizamos la relacin entre dos variables,
conociendo qu tanto se afectan entre s o qu tan independientes
son una de la otra.

En este sentido, ambas variables se representan como un punto en


el plano cartesiano y de acuerdo a la relacin que exista entre ellas,
definimos su tipo de correlacin.

Tipos de correlacin en un grfico de


dispersin
Con base en el comportamiento que toman las variables de
estudio, podemos encontrar 3 tipos de correlacin: Positiva,
negativa y nula.

Correlacin positiva

Se presenta cuando una variable aumenta o disminuye y la otra


tambin, respectivamente. Hay una relacin proporcional. Por
ejemplo para un vendedor de carros, si l vende ms carros
(variable 1), va a ganar ms dinero (variable 2).

Correlacin negativa
Se presenta cuando una variable se comporta de forma contraria o
a la otra, es decir que si una variable aumenta, la otra disminuye.
Hay una relacin inversa proporcional. Por ejemplo para la
construccin de un edificio, entre ms trabajadores estn
construyendo un edificio (variable 1), menos tiempo se necesitar
para tenerlo listo (variable 2)

Correlacin nula

Si no encuentras un comportamiento entre las variables, existe una


correlacin nula.

Otros tipos de clasificacin de correlacin

Otros tipos de clasificacin estn basados en qu tan fuerte o dbil


es el tipo de correlacin, tal como lo muestra Aiteco en los tipos de
relacin de un diagrama de dispersin:

Sin correlacin: La misma correlacin nula


Fuerte correlacin positiva: Cuando el valor de una variable
se incrementa o disminuye con una relacin muy similar a la
otra variable.
Dbil correlacin positiva: Cuando el valor de una variable se
incrementa o disminuye en menor relacin a la otra variable,
por ejemplo, que el valor de x se incremente ligeramente al
incrementar el valor de y.
Fuerte correlacin negativa: Cuando el valor de una
variable aumenta claramente en relacin a una disminucin
de la otra variable.
Dbil correlacin negativa: Cuando el valor de una variable
aumenta levemente en relacin a la disminucin de la otra
variable.
Relacin compleja: Parece haber algn tipo de relacin entre
ambas variables, pero no es muy evidente tornando la
deteccin de la relacin compleja.
El coeficiente de correlacin en un
diagrama de dispersin
El coeficiente de correlacin nos describe cmo es la relacin
existente entre dos variables, en otras palabras, al conocer este
nmero sabemos si la correlacin es positiva o negativa y qu tan
fuerte o dbil es. Se usa la letra r para expresarla, veamos cmo:

r=1
La correlacin es positiva perfecta. Si una variable crece, la otra
tambin lo hace en una proporcin constante. Es una relacin
directa, por eso si trazamos una linea de ajuste esta va pasar por
todos y cada uno de los puntos.
0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlacin
positiva. El grado de cercana de 1 define qu tan directa y
proporcional es la relacin entre ambas variables, por ende entre
ms cerca est de 0, ms dbil ser su correlacin negativa.

r=0
La correlacin es nula, es decir que no existe una relacin lineal
entre ambas variables. Qu tal si pruebas buscando otro tipo de
relacin.

-1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser 1 y 0. Es una
correlacin negativa. El grado de cercana a -1 define que
tan inversa y proporcional es la relacin entre ambas variables, por
ende entre ms cerca est de 0, ms debl ser su correlacin
negativa.

r=-1
La correlacin es negativa perfecta. Si una variable crece, la otra va
a disminuir en proporcin constante. Es una relacin directa e
inversa, por lo tanto una lnea de ajuste va a tocar todos los puntos
graficados.
Un ejemplo ms claro de todo lo mencionado lo muestra wikipedia
en una imagen: Tipos de coeficiente de correlacin
Cmo hacer un diagrama de dispersin
paso a paso
Paso 1: Determina cul es la situacin. Si no entendemos qu
es lo que esta ocurriendo, no podremos establecer las
variables a estudiar.
Paso 2: Determina las variables a estudiar. Si ya determinaste
las variables a estudiar, es porque crees que puede existir
una relacin entre ellas que te permita caracterizar la
situacin.
Paso 3: Recolecta los datos de las variables: Si ya los tienes,
perfecto. Si no, definimos un perodo de tiempo para
conseguir los datos de las variables antes definidas. Recuerda
que los datos de las dos variables deben estar dados en el
mismo perodo de tiempo.
Paso 4: Ubica los valores en el eje respectivo. Por lo
general, la variable independiente es aquella que no est
influenciada por la otra y se ubica en el eje x. La variable
dependiente que es la que se ve afectada por la otra variable
se ubica en el eje y. As pues, procedemos a ubicar los valores
en el plano cartesiano de acuerdo a su variable (x, y)
Paso 5: Determina el coeficiente de correlacin: El coeficiente
de correlacin debe verse reflejado en la forma que toma el
grfico de dispersin. Es el cociente de la covarianza y la
multiplicacin de la desviacin tpica de las dos variables. Con
excel logramos calcularlo de manera muy simple.
Paso 6: Analizamos: Con base en el coeficiente y en el grfico,
definimos cul es la relacin de las dos variables y tomamos
las decisiones pertinentes.
Ejemplo de diagrama de dispersin
Vamos a ver desde una problemtica empresarial, un ejemplo
resuelto de diagrama de dispersin para el rea de calidad.

Imagina que una litogrfica est abriendo una nueva rea de


produccin para la impresin de posters, y en este momento se
encuentra haciendo todos los ensayos y pruebas para determinar
la cantidad de tinta de cada color que deberan tener las maquinas.

Como prueba inicial, han decidido establecer la relacin de errores


de impresin segn el grado de llenado de los recipientes de tinta
de la mquina.

Bien, definida la situacin, iniciamos desde el paso 2:


Las variables a estudiar para este ejemplo de grafico de dispersin
en calidad son:

Cantidad de tinta en litros


Nmero de errores de impresin
Para el paso 3, comenzamos a recolectar las variables. En nuestro
caso, el departamento de control de calidad hace 50 corridas o
pruebas durante 5 das continuos.
Los resultados, a continuacin:
Cantidad de errores segn el grado de tinta
Ejemplo
resuelto de diagrama de dispersin
Para el paso 4 ubicamos los ejes segn las variables que tenemos.
Al estar el nmero de errores influenciado por la cantidad de tinta,
lo ubicamos como el eje y. Por consiguiente, el eje x es la cantidad
de tinta. Ahora s, hacemos el grfico de dispersin.
Paso 5: Determinamos el coeficiente de correlacin. En excel lo
calculamos con la formula COEF.DE.CORREL. Para nuestro ejemplo
resuelto, obtenemos 0,94, se ve esto reflejado en el grfico? Por
supuesto que si, fjate que los puntos estn muy cerca unos de los
otros, lo que indica que los valores se correlacionan fuertemente,
es decir que la relacin entre un aumento en los litros de tinta,
impacta directamente en el nmero de errores en la impresin de
posters. De hecho se hace evidente si miramos la tabla, no hay
grandes saltos entre datos si miramos el nmero de errores.
Paso 6: Analizamos. Evidentemente hay una relacin positiva
fuerte entre la cantidad de tinta con la que se carga el tubo de la
mquina y el nmero de errores generados en la impresin de los
posters. Un paso siguiente para un problema de este tipo, sera
buscar la forma de aprovechar la capacidad restante de la
mquina, por ejemplo usar ms tubos y ms pequeos.

You might also like