You are on page 1of 27

ANLISIS FACTORIAL

1. Introduccin
2. Examen de la matriz de correlacin
3. Extraccin de los factores
4. Rotacin de los factores
5. Puntuaciones factoriales
6. Caso prctico

Introduccin

Objetivo. Resumir la informacin contenida en una base de


datos con p variables en un reducido nmero de
factores F, siendo el nmero de factores menor que el
nmero de variables.
Principios bsicos.
-

Parsimonia. Los fenmenos deben explicarse con el


menor nmero de F posibles.

Interpretabilidad. Los F deben ser susceptibles de


interpretacin positiva.

Introduccin

Ideas bsicas.
-

El conjunto de variables a resumir deben tener


interrelaciones importantes (matriz de correlacin).

Se acepta la hiptesis de que las relaciones existen


porque las variables son manifestaciones comunes de
factores no "observables

El objetivo del AF es llegar a un clculo de esos


factores: resumiendo la informacin, clarificando las
relaciones entre las variables y sin prdida excesiva de
informacin

Introduccin

Utilidad.
-

Proporcionar la estructura interna, las dimensiones


subyacentes, de un conjunto amplio de variables,
elaborando una estructura ms simple que proporcione
la misma informacin y permita entender los
fenmenos.

Simplificar
la
modelizacin convirtiendo,
por
eliminacin de redundancias expresadas en altas
correlaciones, un amplio conjunto de variables en
factores estructurales.

Introduccin

Cada variable se expresa como una combinacin lineal de


factores no directamente observables.
Xij = F1i ai1 + F2i ai2+....+Fki aik + Vi
Siendo:
Xij la puntuacin del individuo i en la variable j
Fij son los coeficientes factoriales (factores comunes)
aij son las puntuaciones factoriales (factores comunes)
Vi es el factor nico de cada variable
Los factores nicos no estn correlacionados entre s ni con los
factores comunes.

Introduccin

AF vs CP
-

CP podra definirse como una etapa de AF.

AF diferencia la varianza comn (variacin de la variable que es


compartida con las otras variables) y varianza nica (la variacin
de la variable que es propia de esa variable).

CP determina factores que sucesivamente expliquen la mayor


parte de la varianza total, mientras que AF busca factores que
expliquen la mayor parte de la varianza comn.

CP busca combinaciones lineales de las variables originales que


expliquen la mayor parte de la variacin total, mientras que AF
pretende hallar un nuevo conjunto de variables, menor en
nmero que las variables originales, que exprese lo que es comn
a esas variables.

AF supone que existen factores comunes subyacentes a todas las


variables, CP no.

Introduccin

Pasos del AF.


1. Calcular y examinar la matriz de correlaciones entre
todas las variables.
2. Extraccin de los factores necesarios para representar
los datos.
3. Rotacin de los factores con objeto de facilitar su
interpretacin.
4. Calcular las
individuo.

puntuaciones

factoriales

de

cada

Examen de la matriz

Examen de la matriz.
Correlations
NHT
NVAC
UTHT
RN
-------------------------------------------------------------------------------------------------------------------NHT
0,4957
0,2334
0,3642
(
12)
(
12)
(
12)
0,1013
0,4654
0,2444
NVAC

0,4957
(
12)
0,1013

UTHT

0,2334
(
12)
0,4654

RN

0,4368
(
12)
0,1556
0,4368
(
12)
0,1556

-0,4641
(
12)
0,1285
-0,1814
(
12)
0,5725

0,3642
-0,4641
-0,1814
(
12)
(
12)
(
12)
0,2444
0,1285
0,5725
-------------------------------------------------------------------------------RN

Examen de la matriz

Determinante de la matriz de correlaciones (es un escalar o


polinomio, que resulta de obtener todos los productos posibles de
una matriz):
- muy bajo: altas intercorrelaciones
- cero: algunas de las variables son linealmente dependientes
- alto: altas correlaciones

Test de Esfericidad de Bartlett. Comprueba que la matriz de


correlaciones se ajuste a la matriz identidad (I), es decir ausencia
de correlacin significativa entre las variables, es decir, que el
determinante de la matriz de correlaciones es 1.

Examen de la matriz

n =tamao muestral
v =nmero de variables
R =matriz de correlaciones
Si se acepta la hiptesis nula (p>0.05) significa que las variables no
estn intercorrelacionadas. Es muy til cuando el tamao
muestral es pequeo.

Examen de la matriz

ndice KMO de Kaiser-Meyer-Olkin. Valores bajos del ndice KMO


desaconsejan la utilizacin de Anlisis Factorial

rij= correlacin simple

segn Kaiser:
1 >= KMO >= 0.9 muy bueno
0.9 >= KMO >= 0.8 meritorio
0.8 >= KMO >= 0.7 mediano
0.7 >= KMO >= 0.6 mediocre
0.6 >= KMO > 0.5 bajo
KMO <= 0.5 inaceptable

aij= correlacin parcial

Examen de la matriz

Correlacin Anti-imagen: El negativo del coeficiente de


correlacin parcial. Deber haber pocos coeficientes altos para
que AF sea razonable.

Correlacin Mltiple: Deber ser alto.

Medida de Adecuacin de la Muestra (MSA): Valores bajos


desaconsejan AF.

rij= correlacin simple

aij= correlacin parcial

Extraccin de los factores.

Extraccin de los factores

A partir de una matriz de correlaciones, el AF extrae otra matriz


que reproduce la primera de forma ms sencilla.

Esta nueva matriz se denomina matriz factorial:


1

P11

P21

P12

P22

P13

P23

P14

P24

P15

P25

P16

P26

Pij pueden interpretarse como ndices de correlacin entre el


factor i y la variable j, aunque estrictamente slo son correlaciones
cuando los factores no estn correlacionados entre s, es decir, son
ortogonales.

Estos coeficientes reciben el nombre de pesos, cargas,


ponderaciones o saturaciones factoriales, y lo ideal es que cada
variable cargue alto en un factor y bajo en los dems.

Extraccin de los factores

Con Statgrafics:

Factor Loading Matrix Before Rotation

NHT
NHT_NHP
NVAC
TREP
TMORT

Factor
1
-----------0,494032
-0,0866254
0,825778
0,739585
-0,718349

Factor
2
-----------0,515909
0,843973
0,342145
-0,0828711
0,561025

Estimated
Variable
Communality
------------------------NHT
0,51023
NHT_NHP
0,719794
NVAC
0,798972
TREP
0,553853
TMORT
0,830774
-------------------------

Extraccin de los factores

Mtodos de extraccin.
-

CP. El anlisis explora toda la varianza de cada variable: la comn,


la especfica y la debida a errores de observacin.
-

Recomendable para reduccin de datos

Recomendable
elevada

en

conjuntos

con

varianza

comn

Otros (clsicos). El anlisis explora slo la varianza comn de cada


variable.
-

Recomendable en AF confirmatorio

Recomendable cuando las puntuaciones factoriales no


son importantes (no van a usarse)

Extraccin de los factores

Comunalidad.
-

Proporcin de la varianza explicada por los factores comunes


en una variable.

h2: suma de los pesos factoriales al cuadrado en cada una de las


filas.
Factor Loading Matrix Before Rotation

NHT
NHT_NHP
NVAC
TREP
TMORT

Factor
1
-----------0,494032
-0,0866254
0,825778
0,739585
-0,718349

Factor
2
-----------0,515909
0,843973
0,342145
-0,0828711
0,561025

Estimated
Variable
Communality
------------------------NHT
0,51023
NHT_NHP
0,719794
NVAC
0,798972
TREP
0,553853
TMORT
0,830774
-------------------------

Extraccin de los factores

El AF comienza sus clculos a partir de lo que se conoce como


matriz reducida compuesta por los coeficientes de correlacin
entre las variables y con las comunalidades en la diagonal.

Como la comunalidad no se puede saber hasta que se conocen los


factores, este resulta ser uno de los problemas del AF.

Si se usa CP, como no suponemos la existencia de ningn factor


comn la comunalidad toma como valor inicial 1.

En el mtodo clsico:
-

Estimando la comunalidad por la mayor correlacin en la fila


i-sima de la matriz de correlaciones.

Estimando la comunalidad por el cuadrado del coeficiente


de correlacin mltiple entre x y las dems variables (es el
que da el ordenador por defecto).

El promedio de los coeficientes de correlacin de una


variable con todas las dems.

Calculando a partir de los dos coeficientes de correlacin


mayores de esa variable

Extraccin de los factores

Autovalores.
-

El cuadrado de una carga factorial indica la proporcin de la


varianza explicada por un factor en una variable particular.

La suma de los cuadrados de los pesos de las columnas se


denominan autovalores e indica la cantidad total de varianza que
explica ese factor para las variables consideradas como grupo.

Las cargas factoriales pueden tener como valor mximo 1, por tanto
el valor mximo que puede alcanzar el autovalor es igual al nmero
de variables.
Factor Analysis
----------------------------------------------Factor
Percent of Cumulative
Number
Eigenvalue Variance
Percentage
1
1,99649
39,930
39,930
2
1,41713
28,343
68,272
3
0,948198
18,964
87,236
4
0,368793
7,376
94,612
5
0,269385
5,388
100,000
-----------------------------------------------

Extraccin de los factores

Factores a extraer.
-

Autovalores superiores a la unidad.

Grfico de sedimentacin.

Contraste de Barlett (similar al de races no retenidas de CP).

Mtodo MAP (Minimum Average Partial). Los factores retenidos


deben tener al menos dos variables con pesos altos en ellos.
-

Calcular el promedio de las correlaciones parciales al cuadrado


despus de que cada uno de los factores ha sido parcializado.

Cuando el promedio alcanza un mnimo no se extraen ms


componentes.

Extraccin de los factores

Factores a extraer.
-

Anlisis Paralelo:
-

A nivel poblacional los autovalores de una matriz de


correlaciones para variables no correlacionadas tomaran valor
1.

Cuando se generan matrices muestrales basadas en esa matriz


poblacional por fluctuaciones debidas al azar los autovalores
excedern levemente de 1 y los ltimos estarn ligeramente por
debajo de 1.

Se comparan los autovalores con los obtenidos a partir de una


matriz de variables no correlacionadas basada en el mismo
nmero de variables que los datos empricos y en el mismo
tamao de muestra. Los componentes empricos con
autovalores superiores a los de la matriz son retenidos.

rotacin de los factores

La matriz factorial indica la relacin entre los factores y las variables.


Sin embargo, muchas veces resulta difcil la interpretacin de los
factores:

Factor Loading Matrix Before Rotation

NHT
NHT_NHP
NVAC
TREP
TMORT

Factor
1
-----------0,494032
-0,0866254
0,825778
0,739585
-0,718349

Factor
2
-----------0,515909
0,843973
0,342145
-0,0828711
0,561025

Estimated
Variable
Communality
------------------------NHT
0,51023
NHT_NHP
0,719794
NVAC
0,798972
TREP
0,553853
TMORT
0,830774
-------------------------

rotacin de los factores

Para facilitar la interpretacin se realizan lo que se denominan


rotaciones factoriales.

La rotacin factorial pretende seleccionar la solucin ms sencilla e


interpretable.

Consiste en hacer girar los ejes de coordenadas, que


representan a los factores, hasta conseguir que se aproxime al
mximo a las variables en que estn saturados.

La saturacin de factores transforma la matriz factorial inicial en otra


denominada matriz factorial rotada, de ms fcil interpretacin.

La matriz factorial rotada es una combinacin lineal de la primera


y explica la misma varianza.

Las comunalidades no se alteran, sin embargo, cambia la varianza


explicada por cada factor.

rotacin de los factores

La rotacin intenta aproximarla al principio de estructura simple


(Thurstone, 1935), con las siguientes caractersticas:
-

Cada factor debe tener pocos pesos altos y los otros


prximos a 0.

Cada variable no debe estar saturada ms que en un


factor.

No deben existir factores con la misma distribucin, es


decir, los factores distintos deben presentar distribuciones
de cargas altas y bajas distintas.

rotacin de los factores

Rotacin ortogonal (Varimax, Equamax, Cuartimax).


-

Rotaciones perpendiculares de los ejes (factores).

Maximiza la varianza explicada.

Rotacin oblicua (Oblimin).


-

Es ms realista.

Suele ofrecer resultados ms claros (segn algunos autores).

La matriz factorial no rotada se convierte en dos matrices


diferentes: la matriz de ponderaciones (que es la que se utiliza
en la interpretacin) y la matriz de correlaciones entre factores y
variables. Tambin obtendremos otra matriz de correlaciones
entre factores.

rotacin de los factores


Factor Loading Matrix Before Rotation

NHT
NHT_NHP
NVAC
TREP
TMORT

Factor
1
-----------0,494032
-0,0866254
0,825778
0,739585
-0,718349

Factor
2
-----------0,515909
0,843973
0,342145
-0,0828711
0,561025

Factor Loading Matrix After Varimax Rotation

NHT
NHT_NHP
NVAC
TREP
TMORT

Factor
1
-----------0,689469
0,361608
0,883843
0,59057
-0,325485

Factor
2
-----------0,186714
0,767485
-0,133393
-0,452859
0,851371

interpretacin de los factores

Juega un papel preponderante el conocimiento del investigador.

Proceso de interpretacin:

Ordenar la matriz rotada de forma que las variables con


saturaciones altas en un factor aparezcan juntas.

Estudiar la composicin de las saturaciones factoriales


significativas de cada factor.

Intentar dar nombre a los factores.

Deberemos ser tanto ms exigentes si:


-

Menor sea el tamao muestral

Menos variables se incluyan en el factorial

El factor analizado sea de los ltimos extrados

Puntuaciones factoriales

Si el mtodo de extraccin ha sido el clsico, slo se podrn hacer


estimaciones.

Si ha sido CP, el clculo de las puntuaciones factoriales se realiza


a partir de la matriz factorial rotada y se basa en el modelo de la
regresin mltiple (idem CP) :

Fij= en la puntuacin factorial del individuo j en el factor i


Pil es la ponderacin factorial de la variable l en el factor i
Zl son las puntuaciones del sujeto con cada variable.

You might also like