You are on page 1of 3

Anlisis discriminante

El anlisis discriminante es una tcnica que se utiliza cuando la variable dependiente es cualitativa
y las variables independientes son cuantitativas. La variable dependiente puede tener dos, tres o
ms categoras (por ejemplo, compradores y no compradores).

Los objetivos del anlisis discriminante son determinar si existen diferencias significativas entre dos
o ms grupos, identificar la importancia relativa de cada variable independiente, desarrollar
procedimientos para clasificar elementos en grupos, para luego examinar la precisin de la
prediccin de la funcin discriminante.

Como recomendacin para el tamao muestral es deseable tener 20 casos por variable
independiente, con al menos 5 observaciones por variable. Los supuestos que se deben verificar es
que existe una distribucin normal multivariada de las variables independientes, y que exista la
misma varianza entre los grupos. Tambin se recomienda revisar que no exista multicolinealidad
entre variables independientes, que el tamao de los grupos sea relativamente igual, y que no
existan valores atpicos.

Prctica
El archivo Base 10 Municipios contiene la informacin de indicadores de salud, educacin e
ingreso de las capitales de los estados. Adicionalmente, existe una variable cualitativa que los agrupa
en 3 conjuntos de acuerdo a las caractersticas de las variables anteriores.

Seleccione Analizar -> Clasificar -> Discriminante. Las variables discriminantes (IS, IE, II) se agregan
como variables independientes. La variable dependiente es la variable de agrupacin (Grupo) y se
establece el rango de valores.

En la ventana de Estadsticos se recomienda marcar Medias, M de Box, Coeficientes de la


funcin, y la Matriz de covarianza de grupos separados. En la ventana de Clasificacin se puede
dejar los valores predeterminados, agregando Tabla de resumen y Clasificacin dejando uno
fuera. Continuar y aceptar.
Resultados
Los datos de media y desviacin estndar por cada grupo y cada variable se muestran en la tabla
Estadsticas de grupo. Las matrices de covarianza entre grupos se muestran en la tabla Matrices
de covarianza. Los resultados de la prueba de Box indican que las covarianzas no son
significativamente diferentes (F(12,335)=0.997, p = 451), por tanto se cumple el supuesto de
igualdad de matrices de covarianzas.

En la tabla de Autovalores se muestra la Correlacin cannica que es el coeficiente de


correlacin de Pearson entre los puntajes de la funcin discriminante y la pertenencia a un grupo
codificado como 0 y 1.

Autovalores
Correlacin
Funcin Autovalor % de varianza % acumulado cannica
1 2.985a 84.6 84.6 .865
2 .541a 15.4 100.0 .593
a. Se utilizaron las primeras 2 funciones discriminantes cannicas en el
anlisis.

La lambda de Wilks permite evaluar la hiptesis nula de que el vector de medias de las tres variables
es la misma en los tres grupos. La lambda de Wilks es la proporcin de la varianza total en los
puntajes discriminantes que no es explicada por las diferencias entre grupos. El estadstico de
prueba y su p-valor (p = 0.00) muestran evidencia de que las medias de las tres variables son
significativamente diferentes entre grupos.

Lambda de Wilks
Lambda de
Prueba de funciones Wilks Chi-cuadrado gl Sig.
1a2 .163 50.829 6 .000
2 .649 12.115 2 .002
Los coeficientes de funcin discriminante se pueden utilizar para determinar la funcin
discriminante lineal de Fisher y calcular los puntajes. Los puntajes pueden ser comparados con los
valores de la tabla Funciones en centroides de grupo para clasificar los casos en grupos.

Una forma de evaluar el desempeo de la funcin discriminante es revisar cuntos casos fueron
clasificados correctamente. Esto se puede observar en la tabla Resultados de clasificacin, en la
seccin Original. Conforme a estos resultados, el 100% de los casos fueron clasificados
correctamente. Una alternativa es utilizar el mtodo de clasificacin dejando uno fuera. Consiste
en calcular la funcin discriminante dejando un valor de la muestra fuera y utilizarla para clasificar
este valor restante. Luego, el procedimiento es repetido n veces, omitiendo en cada ocasin un valor
diferente. Los resultados se muestran en la seccin validacin cruzada. En este caso, la
clasificacin correcta fue realizada el 93.8% de las veces.

Resultados de clasificacina,c
Pertenencia a grupos pronosticada
Grupo 1 2 3 Total
Original Recuento 1 23 0 0 23
2 0 4 0 4
3 0 0 5 5
% 1 100.0 .0 .0 100.0
2 .0 100.0 .0 100.0
3 .0 .0 100.0 100.0
Validacin cruzadab Recuento 1 21 1 1 23
2 0 4 0 4
3 0 0 5 5
% 1 91.3 4.3 4.3 100.0
2 .0 100.0 .0 100.0
3 .0 .0 100.0 100.0
a. 100.0% de casos agrupados originales clasificados correctamente.
b. La validacin cruzada se ha realizado slo para aquellos casos del anlisis. En la validacin
cruzada, cada caso se clasifica mediante las funciones derivadas de todos los casos distintos a
dicho caso.
c. 93.8% de casos agrupados validados de forma cruzada clasificados correctamente.

You might also like